urllib2.URLError: urlopen error [Errno 111] Connection refused

记录个还没解决的问题。下面爬虫代码是可以执行的,但是在我的Ubuntu的虚拟中刚开始是可以运行的,但是,后来不知道改了什么东西,用urllib2写的爬虫和用scrapy 的爬虫代码都不能运行了!!。

import urllib2
import reclass Spider:def __init__(self):self.page = 1self.switch = Truedef loadPage(self):print 'loadPage'url = "http://www.neihan8.com/article/list_5_" + str(self.page) + ".html"headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}request = urllib2.Request(url, headers=headers)response = urllib2.urlopen(request)html = response.read()gbk_html = html.decode('gbk').encode('utf-8')pattern = re.compile('<div\sclass="f18 mb20">(.*?)</div>', re.S)content_list = pattern.findall(gbk_html)self.dealPage(content_list)def dealPage(self, content_list):for item in content_list:item = item.replace('<br />', '').replace('<p>', '').replace('</p>', '')self.writePage(item)def writePage(self, item):with open('duanzi.txt', 'a') as f:f.write(item)def startWork(self):while self.switch:self.loadPage()command = raw_input('please enter continue, q back')if command == 'q':self.switch = Falseself.page += 1print '3q use'if __name__ == '__main__':s = Spider()s.startWork()

 爬虫结果

在终端下的错误信息。

Traceback (most recent call last):File "01-neihan.py", line 44, in <module>s.startWork()File "01-neihan.py", line 34, in startWorkself.loadPage()File "01-neihan.py", line 15, in loadPageresponse = urllib2.urlopen(request)File "/usr/lib/python2.7/urllib2.py", line 154, in urlopenreturn opener.open(url, data, timeout)File "/usr/lib/python2.7/urllib2.py", line 429, in openresponse = self._open(req, data)File "/usr/lib/python2.7/urllib2.py", line 447, in _open'_open', req)File "/usr/lib/python2.7/urllib2.py", line 407, in _call_chainresult = func(*args)File "/usr/lib/python2.7/urllib2.py", line 1228, in http_openreturn self.do_open(httplib.HTTPConnection, req)File "/usr/lib/python2.7/urllib2.py", line 1198, in do_openraise URLError(err)
urllib2.URLError: <urlopen error [Errno 111] Connection refused>

出现这个问题之前是我想fangqiang, 所以设置了代理,后来把代理关了也不行。这问题目前还没解决,不知道是Ubuntu的环境问题,还是python的问题。

问题:定位出问题,确实是代理的问题了。

解决办法:

1、首先查看下 /etc/apt/apt.conf,发现里面里面有:

http_proxy="http://192.168.16.109:13128/"
https_proxy="https://192.168.16.109:13128/"

也许内容和我的不一样。然后删除这个文件,然后重启电脑,发现里面还没有解决。

2、查看一下:cat /etc/enviroment,发现有配置

http_proxy="http://192.168.16.109:13128/"
https_proxy="https://192.168.16.109:13128/"

把里面的配置文件删除了,(切记PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games"这一行不要删除,不然Ubuntu开机就不能进入到桌面了)

3、然后重启电脑,执行代码,问题解决。

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/553564.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯视频如何设置主设备

1、进入腾讯视频&#xff0c;点击右下角【个人中心】。 腾讯视频下载安卓版_腾讯视频如何设置主设备 2、在个人中心页面&#xff0c;点击【设置】。 腾讯视频下载安卓版_腾讯视频如何设置主设备 3、进入设置&#xff0c;点击【共享设备管理】。 腾讯视频下载安卓版_腾讯视…

Linux命令-关机,重启

转自https://www.linuxidc.com/Linux/2009-05/20134.htm 重启 1、reboot2、showdown -r now 立刻重启(root 用户使用) 关机 1、halt 立刻关机2、poweroff 立刻关机

win7系统如何共享硬盘分区

很多小伙伴不知道win7如何共享硬盘分区&#xff0c;共享硬盘分区可以让我们很好操作。其实win7共享硬盘分区的方法很简单&#xff0c;今天小编就来跟大家分享win7共享硬盘分区怎么操作&#xff0c;话不多说&#xff0c;感兴趣的小伙伴就跟小编一起往下看吧! win7系统如何共享硬…

springMVC,aop管理log4j,把当前session信息和错误信息打印到日志

((((其实还是不太理解aop的正真意义但是这样可以实现想要的了,我的感觉是执行一个方法时首先通过filter( 这个fiter可以不配置,之所以要他是因为在aop切入的方法session消失了,我们要保存是谁在操作就需要他) > aop管理的log4j类,>log4j 来搞定日志的处理)))) 记录一下…

Ubuntu/环境变量:修改/etc/environment 导致开机不能进入桌面

解决思路是&#xff1a;将环境变量的参数修改正确。 1、卡在界面的地方&#xff1a; CTRLALTF1&#xff0c;进入命令界面 2、临时修改环境变量 export PATH"/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games" 3、这样就…

搜狗浏览器收藏夹在什么位置?搜狗浏览器收藏夹路径在哪?

搜狗浏览器是一款比较受大家欢迎的浏览器软件&#xff0c;很多都在问搜狗浏览器的收藏路径在哪。下面小编就为大家分享一下搜狗浏览器收藏夹在什么位置&#xff0c;接下来我们一起往下看看。 方法步骤 1、打开你的搜狗浏览器&#xff0c;你点击 “收藏”; 搜狗浏览器收藏夹在…

xp/win 7 系统搭建 Java环境

win 7 系统搭建 Java环境 xp系统大同小异 下面是具体的值

vim 强制保存只读文件

转自 http://kuanghy.github.io/2015/12/30/sudo-vim :w !sudo tee %

世界之窗浏览器怎么隐藏收藏栏?

想必大家都知道&#xff0c;无论是什么浏览器&#xff0c;默认都是会显示收藏栏的&#xff0c;这样用户就可以快速打开收藏栏中收藏的网页&#xff0c;但很多时候有些用户会收藏一些不想被人看到的网页&#xff0c;这时候最好的方法就是将收藏栏隐藏起来了。那么&#xff0c;世…

原始servlet+hibernate+struts2,从前台到后台的整个过程

现在三大框架的兴起ssh spring springmvc 基于注解式的编程简单方便了开发,但是让我感觉摸不着头绪,框架固然是好,提高了开发效率, 对企业有很大的帮助,框架封装的一些底层的东西让我不知道为什么要这么做,只知道该这么做,编程的路线肯定是简单快捷,趋势就是随便点点拖拖,就是…

Ubuntu中MySQL的启动/关闭/重启

一、启动 1. mysqld脚本启动: /etc/init.d/ mysql start 二、关闭 1. mysqld脚本关闭: /etc/init.d/ mysql stop 三、重启 1. mysqld脚本重启: /etc/init.d/ mysql restart 打开 mysql-client 客户端&#xff0c; mysql -u root -p

Win10怎么样修复edge浏览器?如何重置edge浏览器

在Windows10系统桌面右键点击左下角的开始按钮&#xff0c;在弹出的菜单中点击设置菜单项。 Win10怎么样修复edge浏览器&#xff1f;如何重置edge浏览器[多图] 在打开的Windows设置窗口中&#xff0c;点击应用图标。 Win10怎么样修复edge浏览器&#xff1f;如何重置edge浏览…

Hibernate实体映射配置1(java@注解方式)

实体和数据库之间存在某种映射关系&#xff0c;hibernate根据这种映射关系完成数据的存取。在程序中这种映射关系由映射文件&#xff08;*.hbm.xml&#xff09;或者java注解()定义。 本文以java注解的形式总结映射关系配置。 实体类组件以及注解标签映射关系 实体类--------…

火狐浏览器工具栏/折叠菜单怎么设置?火狐浏览器工具栏/折叠菜单定制教程

为了方便用户将一些常用的功能及应用添加到工具栏/折叠菜单中&#xff0c;火狐浏览器推出了一项特别的功能“定制”。也就是说&#xff0c;借助该功能&#xff0c;用户就可以自由添加或替换工具栏/折叠菜单中的各类功能了!那么&#xff0c;该怎么操作呢?让我们来了解一下。 方…

Python 文件操作 'w+' 和 'wb'的区别

在文件上传的时候遇到个问题&#xff0c;就是 w 和 wb 在文件上传的时候是否回车。 根据项目的实景情况模拟一下区别。 首先说一下 w 和 wb 的区别 。w 是文本写入&#xff0c;wb是字节写入。 看代码。首先在window 操作系统下。 1.字节 # utf-8# 模拟上传的文件内容 read…

MySQL左关联、右关联、内关联查询

要说MySQL的关联查询&#xff0c;首先先说一下笛卡尔积&#xff0c; 有两个集合 A {1, 2},B {1, 3},这两个集合的笛卡尔积 A * B就有四种情况, A * B {(1,1), (1,3), (2,1),(2,3)} 笛卡尔积12132123 假设现在有两张表&#xff0c;table_A和 table_B table_Aa_user_ida_nam…

java获取net地址 本机

InetAddress netAddress;try {netAddress InetAddress.getLocalHost();String name netAddress.getHostName();System.out.println(name);} catch (UnknownHostException e) {// TODO Auto-generated catch blocke.printStackTrace();}

手机优酷APP怎么上传视频

手机优酷怎样视频上传&#xff0c;自身在日常生活拍到好玩的视频&#xff0c;我们可以上传优酷&#xff0c;那如何上传到优酷呢&#xff1f; 01、 在优酷首页&#xff0c;点一下提交按键。 手机优酷APP怎么上传视频 02、 随后登录自身的优酷视频帐户。 手机优酷APP怎么上传…

warnings (imported as 'THREE') was not found in 'three'

这个问题还没解决&#xff01; 用Vue.js 重构项目的时候&#xff0c;引入three.js和其他相关的东西的时候会出现上面的警告。今天就说一下这个解决办法&#xff0c;但是我觉得这个方法不一定适用所有的项目。 一、引入THREE 首先用 npm 安装了 three, 然后再项目里面引入了。…