python人人语音爬虫(登陆尚未完成,需要使用先登录在查cookie中的t)

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

import urllib, urllib2, cookielib,re,jsondef LoginRenren(url,t_cookie):cookie = {"t": t_cookie}#cookie中的t需要到浏览器中去查cookie = "".join(x + "=" + cookie[x] + ";" for x in cookie)opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookielib.CookieJar()))urllib2.install_opener(opener)req = urllib2.Request(url)   req.add_header('Cookie', cookie)content = urllib2.urlopen(req).read()return contentdef searchMp3(content):    reMp3 = r'http://fmn.rrimg.com/fmn\d{3}/audio/\d{8}/\d{4}/\w+.mp3'mp3Url = re.findall(reMp3,content)return mp3Urldef downloadMp3(mp3Url,num):localPath = r"C:\Users\john\Desktop\renrenMp3\%d.mp3"%numurllib.urlretrieve(mp3Url,localPath)def main(albumUrl,t_cookie):#firstpagenum = 0pageNum = 0mp3Url= []while True:pageUrl = albumUrl+'/bypage/ajax?curPage=%d&pagenum=40'%pageNumjsonContent = LoginRenren(pageUrl,t_cookie)content = json.loads(jsonContent)if content["photoList"]:tempList = searchMp3(jsonContent)mp3Url = mp3Url+tempListelse:breakpageNum +=1print mp3Urlfor eachMp3 in mp3Url:num+=1downloadMp3(eachMp3,num)if __name__=='__main__':#albumUrl = raw_input("albumUrl=")#http://photo.renren.com/photo/465457202/album-868663788#t_cookie = raw_input("t_cookie=")#134cc936f2785fa03902fe3185e517f64albumUrl = 'http://photo.renren.com/photo/465457202/album-868663788't_cookie = '134cc936f2785fa03902fe3185e517f64'main(albumUrl,t_cookie)


转载于:https://my.oschina.net/u/1159199/blog/226584

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/461395.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IDEA将项目打包为指定class文件的jar

转自:https://blog.csdn.net/makang456/article/details/86699375 【背景】 公司最近要和某大公司合作,将本公司的产品提供给其它公司单独部署售卖,为了让产品中重要的服务具备防君子不防小人的作用,于是就写了一个单独的服务…

鼠标点击实现花瓣雨_每周实验 | 黄金雨

点击BNU化学学社快来关注我们吧!倩西风染就丹砂。不比黄金雨,灿余霞。送幽梦,到仙家。背景介绍BACKGROUND在开始实验之前,我们先来看一种植物,阿勃勒。它是苏木科决明属的落叶大乔木,花朵是最重要的观赏特征…

Windows系统进程介绍

http://mtoou.info/smss-exe/转载于:https://www.cnblogs.com/Clingingboy/archive/2013/01/29/2882017.html

大规模天线阵列(massive-mimo)的介绍

本文转载于http://www.sohu.com/a/106043955_114877,如有侵权,请告知删除。有删改。 前言 这是最好的时代,也是最坏的时代。 生活在科技大爆发的时代里,你是否感觉到一丝庆幸? 虚拟现实、自动驾驶,无数令人血脉偾张…

联发科mtk和骁龙730哪个好_联发科G90T和骁龙710哪个好?

8月23日消息,小米集团副总裁、Redmi品牌总经理卢伟冰宣布,红米Note 8 Pro搭载全球首款游戏平台联发科G90T,我们称之为“游戏芯”。卢伟冰表示,年轻人每天很多时间花在游戏上,对于游戏手机来说,先抛开其他电…

天文学中常用的坐标系

四种常用的坐标系 1、地平坐标系 简而言之,在地球圈上,观测者所在的点的切面和天球相交,得到的交线圈为地平圈。地心和观测者所在点的连线和天球的交点为天顶,反向延长线与天球的交点为天底。 通过北天极和天顶的经圈和地平圈有两…

lightswitch 添加 TreeView 控件

代码片段 <UserControl xmlns:sdk"http://schemas.microsoft.com/winfx/2006/xaml/presentation/sdk" x:Class"LightSwitchApplication.TreeViewControl.DepartmentTreeViewControl"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presenta…

执行jar包,输出信息到文件

有时如果临时需要上项目执行一些脚本或者临时文件&#xff0c;可以将项目达成jar包&#xff0c;去执行执行jar包&#xff1a; java -jar test.jar输出日志到文件&#xff1a;nohup java -jar test.jar > test.txt &也可以执行 .sh脚本项目达成jar包运行&#xff1a;http…

web服务器的简单实现——HTTP权威指南读书心得(七)

我又回来做笔记了~最近懒死了&#xff0c;书虽然看完了&#xff0c;但是一直懒得动笔&#xff0c;这样不行啊&#xff08;﹃&#xff09;口水。还有在这里吐槽下&#xff0c;在围观这本书的时候&#xff0c;一直有一种奇怪的感觉&#xff1a;里面说的有些东西与时代脱节啊.....…

四季星空

内容整理于 http://www.astron.ac.cn/bencandy-50-814-1.htm http://www.360doc.com/content/13/0817/18/1003261_307868525.shtml 注&#xff1a;指的是8点到凌晨时间段的星空&#xff0c;本人习惯面向北方看图。 春季星空&#xff08;3~5月&#xff09; 特征&#xff1…

data怎么给echart传值_通用技术 VUE 子父组件传值

为啥这点东西需要一周时间&#xff1a;1、首先是水平一般&#xff0c;能力有限&#xff0c;前后端都是半吊子&#xff0c;再加上最近有点松劲了&#xff1b;2、由于前期规划问题&#xff0c;在做质量统计的时候&#xff0c;需要做大量的数据整理、统计工作。3、将前端的Echart做…

查看端口是否被占用,以及端口的应用名称

根据进程号查看占用的端口 netstat -anp |grep 进程号查看进程号 ps -ef | grep 应用名称根据端口号查看占用端口的应用 lsof -i :8080转载于:https://www.cnblogs.com/duende99/p/11519643.html

Bad Request (Invalid Hostname)解决方法

当在Windows Server 2003IIS6做Web服务器&#xff0c;出现打开如http://paullevi.oicp.net,出现,Bad Request (Invalid Hostname) 的提示时&#xff0c;更改IIS6的Internet 信息服务管理器的默认网站里的属性->网站->IP地址栏&#xff0c;设置为(全部未分配) &#xff0c…

天文摄影的后期处理

见文&#xff1a;http://space.lamost.org/watch/photography/houqi.htm 主要包含以下三个步骤&#xff1a; 1、调整亮度、对比度&#xff1b; 2、锐化处理&#xff1b; 3、叠加&#xff1b;

android关于socket编程,以聊天为例【转】http://hi.baidu.com/yaoyuanhuajx/item/9b93d7565f315ba9acc857d7...

一步一步android(15)&#xff1a;关于socket编程【以聊天为例】 Android手机的应用&#xff0c;除了它的手机功能之外&#xff0c;另外一个吸引人的地方在于它的开放性&#xff0c;这一点iphone无法比拟&#xff0c;至少iphone太多商业化气息。 如同当年windows95一样&#xff…

交流电的有效值rms值_【电工基础知识:三、正弦交流电的产生】2正弦交流电的三要素...

正弦交流电正弦交流电是随时间按照正弦函数规律变化的电压和电流。由于交流电的大小和方向都是随时间不断变化的&#xff0c;也就是说&#xff0c;每一瞬间电压(电动势)和电流的数值都不相同&#xff0c;所以在分析和计算交流电路时&#xff0c;必须标明它的正方向。一、周期、…

PHP+Ajax点击加载更多列表数据实例

PHPAjax点击加载更多列表数据实例 一款简单实用的PHPAjax点击加载更多列表数据实例&#xff0c;实现原理&#xff1a;通过“更多”按钮向服务端发送Ajax请求&#xff0c;PHP根据分页参数查询将最新的几条记录&#xff0c;数据以JSON形式返回&#xff0c;前台Query解析JSON数据&…

单反使用知识

内容整理于网络 http://academy.fengniao.com/393/3935386_all.html http://dcdv.zol.com.cn/243/2430148_all.html 单反品牌和型号 大部分是佳能、尼康&#xff0c;几乎中低端市场全是这两品牌&#xff0c;另外还有索尼、奥林巴斯、宾得等。对于佳能&#xff0c;一位数D为专…

elementui的css文件没有引入_Python中引入模块详细介绍,使用模块的过程中注意事项教程...

​为此 Python 提供了一个办法&#xff0c;把这些定义存放在文件中&#xff0c;这个文件被称为模块。模块是一个包含所有你定义的函数和变量的文件&#xff0c;其后缀名是.py。模块可以被别的程序引入&#xff0c;以使用该模块中的函数等功能。你也许还想到&#xff0c;如果不同…

【原】git命令行查看全部分支与远程分支不同步问题

git branch -a 查看全部分支 git fetch 重新拉一下分支 转载于:https://www.cnblogs.com/luckyXcc/p/11528000.html