idf实验室--简单编程字符统计

idf实验室--简单编程字符统计,有需要的朋友可以参考下。




第一眼看这道题很简单,不就是字符统计么,可是题目要求2s内回答,而且每次打开的页面需要统计的字符串内容都会变,这就蛋疼了,于是乎上网学习下如何提交post表单,然后用python写个程序自动提交就ok了 题目地址 ) 

代码如下:



# -*- coding: utf-8 -*- import urllib2
import urllib
import cookielib
import string
import re#需要提交post的url 
TARGET_URL = "http://ctf.idf.cn/game/pro/37/"# 设置一个cookie处理器
req = urllib2.Request(TARGET_URL)
cj = cookielib.CookieJar() 
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) 
res = opener.open(req)# 通过正则匹配抓到需要统计的字符串
content = res.read()
check_text = re.findall(r'<hr />(.*)<hr />',content,re.S)[0]# 简单的统计
char_count = [0,0,0,0,0]
for txt in check_text:if txt == 'w':char_count[0] += 1elif txt == 'o':char_count[1] += 1elif txt == 'l':char_count[2] += 1elif txt == 'd':char_count[3] += 1elif txt == 'y':char_count[4] += 1#将数字转换成字符串 
result = ""
for nIndex in char_count:result += str(nIndex)
print "Result = ", result# 接下来就是提交了
value = {'anwser': result}
data = urllib.urlencode(value)
request = urllib2.Request(TARGET_URL,data)
response = opener.open(request)
html = response.read()
print html


需要注意的地方:你需要保存下来第一次正则匹配时打开页面cookie,构造一个opener,在第二次提交时使用之前的cookie即可。。。否则会提示超时



下面是一个大牛给我的代码,用到了第三方库mechanize:



# coding=utf-8import re
import urllib2
import mechanizeTARGET_URL = "http://ctf.idf.cn/game/pro/37/"
USER_AGENT = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.115 Safari/537.36 QQBrowser/3.5.3420.400"# Get target text use regular expression.
def get_text(content):return re.findall(r'<hr />(.*)<hr />', content,re.S)[0]def submit():char_count = [0, 0, 0, 0, 0]br_controller = mechanize.Browser()br_controller.set_handle_equiv(True)br_controller.set_handle_redirect(True)br_controller.set_handle_referer(True)br_controller.set_handle_robots(False)br_controller.addheaders = [("User-Agent", USER_AGENT)]br_controller.open(TARGET_URL)# Get web page cotentpage_content = br_controller.response().read()# Get target textcheck_text = get_text(page_content)# Calculatefor txt in check_text:if txt == 'w':char_count[0] += 1elif txt == 'o':char_count[1] += 1elif txt == 'l':char_count[2] += 1elif txt == 'd':char_count[3] += 1elif txt == 'y':char_count[4] += 1# Change value in char_count to string.result = ""for nIndex in char_count:result += str(nIndex)print "Result = ", result# Post form.br_controller.select_form(nr=0)br_controller.form['anwser'] = resultbr_controller.submit()print br_controller.response().read()if __name__ == '__main__':submit()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/351188.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微服务(一) --- 架构与选型

微服务架构的概述 应用架构的发展 应用是可以独立运行的程序代码,提供相对完善的业务功能. 目前的软件架构有三种架构类型: 业务架构应用架构技术架构他们之间的甚是: 业务架构决定应用架构,技术架构支撑着应用架构. 应用架构的发展历程: 单体架构: 最古老的单体应用,没有任何应…

linux常见致命错误(fatal error),解决办法:

常见错误一&#xff1a;fatal error: zlib.h: No such file or directory 解决办法&#xff1a; sudo apt-get install zlib1g-dev 常见错误二&#xff1a;fatal error: curses.h: No such file or directory #include <curses.h> 解决办法&#xff1a;sudo apt-get i…

brainfu*k语言执行

输入&#xff1a; brainfu*k 代码&#xff1a; [>>>><<<<-]>.>....>.<<.>..------.--------.>.>. 程序&#xff1a; #include <stdio.h> #include <stdlib.h> #include <string.h> #define MAXL 1000 /*…

Linux连接Windows服务器以及文件传输方法

最近&#xff0c;由于自身需要将操作系统换为Linux&#xff08;Ubuntu&#xff09;系统&#xff0c;但是由于实验室服务器为Windows系统&#xff0c;需要在Linux上连接Windows服务器&#xff0c;方法如下&#xff1a; 首先安装rdesktop 安装方法&#xff1a; sudo apt-get ins…

Filter过滤要登录的页面(重要)

一、为什么要写过滤器&#xff0c;过滤页面&#xff1f; 本人做了一个网站&#xff0c;目前还在开发。做过滤器的目的就是为了要过滤一些页面必需要用户登录之后才能看&#xff0c;主页什么的可以随便看&#xff0c;一旦涉及到要发布或评论什么信息&#xff0c;就必须要过滤用户…

mybatis crud_MyBatis教程– CRUD操作和映射关系–第1部分

mybatis crudCRUD操作 MyBatis是一个SQL Mapper工具&#xff0c;与直接使用JDBC相比&#xff0c;它极大地简化了数据库编程。 步骤1&#xff1a;创建一个Maven项目并配置MyBatis依赖项。 <project xmlnshttp://maven.apache.org/POM/4.0.0 xmlns:xsihttp://www.w3.org/20…

C语言实现字符串匹配KMP算法

相信很多人&#xff08;包括自己&#xff09;初识KMP算法的时候始终是丈二和尚摸不着头脑&#xff0c;要么完全不知所云&#xff0c;要么看不懂书上的解释&#xff0c;要么自己觉得好像心里了解KMP算法的意思&#xff0c;却说不出个究竟&#xff0c;所谓知其然不知其所以然是也…

Linux问题分析或解决_samba无法连接

1. windows设置方面问题 问题&#xff1a;window能连接部分服务器的samba共享&#xff0c;一部分无法连接。报错如截图。 解决&#xff1a;前提---其他人连接都没有问题&#xff0c;发现有问题的连接服务器的电脑是win10&#xff0c;而win10可以连接到的服务器系统比较新&#…

Drools 7支持DMN(决策模型和表示法)

决策模型和表示法&#xff08;DMN&#xff09;规范是OMG&#xff08;对象管理小组&#xff09;提出的相对较新的标准&#xff0c;旨在为业务规则和业务决策做些什么。 BPMN&#xff08;它的兄弟规范&#xff09;用于业务流程&#xff1a;标准化表示法和执行语义&#xff0c;以…

Ubuntu系统下Python虚拟环境构建详解

在编程开发中&#xff0c;我们经常会利用不同版本的协助软件包&#xff0c;这样就导致一些软件不能兼容&#xff0c;为了解决这个问题呢&#xff0c;我们在儿引进Python虚拟环境&#xff0c;我们安装好虚拟环境之后&#xff0c;进一步激活它&#xff0c;然后在虚拟环境中运行不…

字符串匹配算法

1. 朴素算法 朴素算法是最简单的字符串匹配算法&#xff0c;也是人们接触得最多的字符串匹配算法。 2. Rabin-Karp算法 一个时间复杂度为O(&#xff08;N-M1)*M)的字符串匹配算法&#xff0c;即Rabin-Karp算法。Rabin-Karp算法的预处理时间是O(m)&#xff0c; 匹配时间OO(&…

SolrCloud集群配置

前提&#xff1a; 1&#xff0c;已经做好zookeeper集群或伪集群配置. 2&#xff0c;已将solr部署到tomcat中 接下来&#xff0c;我们将zookeeper与tomcat进行关联 1 vim tomcat/bin/catalina.sh tomcat1的bin目录下catalina.sh文件在第二行加入 1 JAVA_OPTS"-Dbootstrap_c…

Ubuntu18.04 台式电脑插入耳机没有声音解决办法

最近换位ubnutu18.04后发现电脑戴耳机没有声音网上查了一下解决办法如下&#xff1a; 1、打开命令行&#xff0c;输入&#xff1a;sudo apt-get install pavucontrol 2、接着再命令行中输入: pavucontrol 在上面点击向右按钮&#xff0c;然后会出现configuration&#xff0…

第2章 网页基础知识

HTTP 基础术语HTTP 请求过程HTTP Headers 信息网页的组成网页的结构HTML节点树CSS 选择器爬虫的基本原理HTTP CookiesHTTP 代理转载于:https://www.cnblogs.com/pzk7788/p/10512338.html

适用于无服务器Java开发人员的AWS Lambda:它为您带来了什么?

无服务器计算如何帮助您的生产基础架构&#xff1f; 在过去的几年中&#xff0c;无服务器计算架构一直受到关注&#xff0c;因为它专注于应用程序的主要组件之一&#xff1a;服务器。 这种体系结构采用了不同的方法。 在下面的文章中&#xff0c;我们将解释无服务器的含义&am…

Python的sys.stdout、sys.stdin重定向

Python的sys.stdout、sys.stdin重定向 转自&#xff1a;http://www.cnblogs.com/turtle-fly/p/3280519.html 本文环境&#xff1a;Python 2.7 使用 print obj 而非 print(obj) 一些背景 sys.stdout 与 print 当我们在 Python 中打印对象调用 print obj 时候&#xff0c;事实上…

Win10+Ubuntu16.04/Ubuntu18.04双系统安装教程

最近因为开发需要安装Linux系统&#xff0c;因为安装好几次Ubuntu18.04失败&#xff0c;退而安装Ubuntu16.04 安装也失败好几次&#xff0c;在不断尝试下终于解决&#xff0c;后来思考一下觉得Ubuntu 16.04/18.04安装失败原因一致,先进行分享。 先把我遇到的问题给大家看看如下…

获取XML的文件信息

1 /**2 * 获取XML文件的信息3 */4 import java.io.IOException;5 import javax.xml.parsers.DocumentBuilder;6 import javax.xml.parsers.DocumentBuilderFactory;7 import javax.xml.parsers.ParserConfigurationException;8 import org.w3c.dom.Document;9 import org.w3c…

python 中的三元表达式(三目运算符)

python中的三目运算符不像其他语言 其他的一般都是 判定条件?为真时的结果:为假时的结果 如 result5>3?1:0 这个输出1&#xff0c;但没有什么意义&#xff0c;仅仅是一个例子。 而在python中的格式为 为真时的结果 if 判定条件 else 为假时的结果 还是上面的例子 1 if 5…

Linux 命令简单介绍第一课笔记

第一&#xff1a; 相对路径和绝对路径 相对路径:从当前路径开始进入blog文件夹 cd blog绝对路径&#xff1a;从跟目录开始进入blog文件夹 cd /home/yq/Desktop/blog 全称&#xff1a;根目录下home文件下的yq文件下的Desktop文件下的blog文件夹cd ./blog&#xff1a;进入当前…