通化县建设局网站定制网络监控软件

news/2025/10/3 13:13:28/文章来源:
通化县建设局网站,定制网络监控软件,在网站做的pdf有水印如何删除,北仑建网站价格目标#xff1a;对B站视频详情页url进行视频的爬取。 注#xff1a;由于B站的音频和视频的链接是分开的#xff0c;所以在提取是需要分别提取#xff0c;然后进行合成。 这里只管提取#xff0c;合成的工作以后再说。 具体步骤 发送请求 对于视频详情页url地址发送请求 …目标对B站视频详情页url进行视频的爬取。 注由于B站的音频和视频的链接是分开的所以在提取是需要分别提取然后进行合成。 这里只管提取合成的工作以后再说。 具体步骤 发送请求 对于视频详情页url地址发送请求 https://www.bilibili.com/video/BV11b4y1S7Jg获取数据 获取响应体的文本数据 response.text 网页源代码解析数据 提取我们想要的 视频标题/音频url/视频画面url,保存数据 对于音频url 视频url发送请求 获取响应体二进制数据 response.content合成数据把音频内容以及视频画面内容合成为一个完整的mp4文件 1. 发送请求 说明 Referer:是防盗链。表示当前这个链接我是从哪个链接跳转过来的。 Cookie由于B站不登陆只能下载 url https://www.bilibili.com/video/BV1Bo4y1v7Yq/ response requests.get(url) cookie buvid35C5D0069-031F-2213-8E11-3B17C971719F69389infoc; b_nut1688698369; _uuid7F76CBFD-ADE2-44103-424C-D73D5E9ACC2869255infoc; header_theme_versionCLOSE; CURRENT_FNVAL4048; buvid4780B8373-C6A6-6800-F372-7CF18F799AE570981-023070710-7YWVed7pFp%2FuoShCfdfYnQ%3D%3D; DedeUserID175444232; DedeUserID__ckMd5b4a676bf5d8afe1c; rpdid|(k|)mum~~uJ0JuY))~|uklm; LIVE_BUVIDAUTO5916888971292528; SESSDATA6b25c9b2%2C1705192174%2Cba23f%2A71bQR5hFBMOt8AXYHjziKE4HOwWw6Ei8wrCIByshPnLAkTd2jwLJy4WYgVkViOyIUPNssSUQAAIAA; bili_jcte29211bb7e88730fc2bc6691218d247e; sid858nix09; FEED_LIVE_VERSIONV8; buvid_fp_plainundefined; hit-new-style-dyn1; hit-dyn-v21; i-wanna-go-back-1; b_ut5; fingerprintb2371c9349b15d5ad60e75cd01f7dc55; buvid_fp5b9a1047d9ef9ba48290adcd4ba39e58; share_source_origincopy_web; bsourceshare_source_copylink_web; bili_ticketeyJhbGciOiJIUzI1NiIsImtpZCI6InMwMyIsInR5cCI6IkpXVCJ9.eyJleHAiOjE2OTY0NzMzNjcsImlhdCI6MTY5NjIxNDEwNywicGx0IjotMX0.D2ixQib5vaXOyxTBLWhIR8KzpbGQloGjxzXDgnOum3E; bili_ticket_expires1696473307; CURRENT_QUALITY80; b_lsid4F245FCD_18AFACA514A; home_feed_column5; browser_resolution1552-827; bp_video_offset_175444232848638555060174904; PVID1head {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36,# Referer: 防盗链。用于告诉服务器我是从哪个链接跳转来的。Referer: https://www.bilibili.com/,Cookie: cookie } sleep(2) page_text response.text2. 获取数据 # 获取标题和播放信息 tree etree.HTML(page_text) title tree.xpath(//*[idviewbox_report]/h1/text())[0] play_info tree.xpath(/html/head/script[4])[0].text # 通过tree.xpath得到script对象然后通过text属性得到其内容 play_info play_info[20:] # 去掉前面的window.__playinfo__这几个字符 print(play_info)3. 解析数据 # 将数据转为json格式方便获取其中的部分数据 play_info_json json.loads(play_info) # print(play_info_json) pprint.pprint(play_info_json) # 格式化输出# 获取音频、视频url # B站的音频和视频链接是分开的所以要分别获取然后通过一定的方法进行合并。 video_url play_info_json[data][dash][video][0][baseUrl] # 得到视频链接 audio_url play_info_json[data][dash][audio][0][baseUrl] # 得到音频链接4. 保存数据 video_content requests.get(urlvideo_url, headershead).content # content表示二进制数据 audio_content requests.get(urlaudio_url, headershead).content # # content表示二进制数据if not os.path.exists(./B站视频):os.mkdir(./B站视频)with open(./B站视频/title.mp4, wb) as fp:fp.write(video_content)with open(./B站视频/title.mp3, wb) as fp:fp.write(audio_content) 完整代码 import json import os.pathimport requests from time import sleep from lxml import etree import pprint# 已成功 1.发送请求 对于视频详情页url地址发送请求 https://www.bilibili.com/video/BV11b4y1S7Jg 2.获取数据 获取响应体的文本数据 response.text 网页源代码 3.解析数据 提取我们想要的 视频标题/音频url/视频画面url, 4保存数据 对于音频url 视频url发送请求 获取响应体二进制数据 response.content 5.合成数据把音频内容以及视频画面内容合成为一个完整的mp4文件url https://www.bilibili.com/video/BV1Bo4y1v7Yq/ response requests.get(url) cookie buvid35C5D0069-031F-2213-8E11-3B17C971719F69389infoc; b_nut1688698369; _uuid7F76CBFD-ADE2-44103-424C-D73D5E9ACC2869255infoc; header_theme_versionCLOSE; CURRENT_FNVAL4048; buvid4780B8373-C6A6-6800-F372-7CF18F799AE570981-023070710-7YWVed7pFp%2FuoShCfdfYnQ%3D%3D; DedeUserID175444232; DedeUserID__ckMd5b4a676bf5d8afe1c; rpdid|(k|)mum~~uJ0JuY))~|uklm; LIVE_BUVIDAUTO5916888971292528; SESSDATA6b25c9b2%2C1705192174%2Cba23f%2A71bQR5hFBMOt8AXYHjziKE4HOwWw6Ei8wrCIByshPnLAkTd2jwLJy4WYgVkViOyIUPNssSUQAAIAA; bili_jcte29211bb7e88730fc2bc6691218d247e; sid858nix09; FEED_LIVE_VERSIONV8; buvid_fp_plainundefined; hit-new-style-dyn1; hit-dyn-v21; i-wanna-go-back-1; b_ut5; fingerprintb2371c9349b15d5ad60e75cd01f7dc55; buvid_fp5b9a1047d9ef9ba48290adcd4ba39e58; share_source_origincopy_web; bsourceshare_source_copylink_web; bili_ticketeyJhbGciOiJIUzI1NiIsImtpZCI6InMwMyIsInR5cCI6IkpXVCJ9.eyJleHAiOjE2OTY0NzMzNjcsImlhdCI6MTY5NjIxNDEwNywicGx0IjotMX0.D2ixQib5vaXOyxTBLWhIR8KzpbGQloGjxzXDgnOum3E; bili_ticket_expires1696473307; CURRENT_QUALITY80; b_lsid4F245FCD_18AFACA514A; home_feed_column5; browser_resolution1552-827; bp_video_offset_175444232848638555060174904; PVID1head {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36,# Referer: 防盗链。用于告诉服务器我是从哪个链接跳转来的。Referer: https://www.bilibili.com/,Cookie: cookie } sleep(2) page_text response.textwith open(./bilibili.html, w, encodingutf-8) as fp:fp.write(page_text)# print(page_text) # 获取标题和播放信息 tree etree.HTML(page_text) title tree.xpath(//*[idviewbox_report]/h1/text())[0] play_info tree.xpath(/html/head/script[4])[0].text # 通过tree.xpath得到script对象然后通过text属性得到其内容 play_info play_info[20:] # 去掉前面的window.__playinfo__这几个字符 print(play_info)# 将数据转为json格式方便获取其中的部分数据 play_info_json json.loads(play_info) # print(play_info_json) pprint.pprint(play_info_json) # 格式化输出# 获取音频、视频url # B站的音频和视频链接是分开的所以要分别获取然后通过一定的方法进行合并。 video_url play_info_json[data][dash][video][0][baseUrl] # 得到视频链接 audio_url play_info_json[data][dash][audio][0][baseUrl] # 得到音频链接# 获取音频、视频数据 video_content requests.get(urlvideo_url, headershead).content # content表示二进制数据 audio_content requests.get(urlaudio_url, headershead).contentif not os.path.exists(./B站视频):os.mkdir(./B站视频)with open(./B站视频/title.mp4, wb) as fp:fp.write(video_content)with open(./B站视频/title.mp3, wb) as fp:fp.write(audio_content)print(提取到的title, title)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/925930.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实用指南:Guava Cache

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

计算机类毕业设计开题报告注意事项 - 教程

计算机类毕业设计开题报告注意事项 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

2025山东设备回收公司 TOP 交易服务推荐排行榜,济宁,梁山设备回收,二手,饮料,食品,制药,实验室,生产线,化工厂,废旧,大型,专业设备回收公司推荐

工业消防设备在长期使用后,面临更新迭代与淘汰处理的问题,而设备回收环节却存在诸多行业痛点。部分回收企业缺乏专业技术支撑,对缆式线型感温火灾探测器、分布式光纤感温火灾探测器等专用设备的性能判断不准确,导致…

2025饮料设备回收公司 TOP 交易服务推荐排行榜,济宁,梁山饮料设备回收果汁饮料整厂,饮料生产线,碳酸饮料,乳制品,杀菌机,果汁饮料,二手灌装机,果汁设备回收公司推荐

当前饮料行业发展迅速,设备更新换代频率不断加快,企业在设备交易过程中面临诸多难题。一方面,不少企业在处理闲置饮料设备时,难以找到专业、可靠的交易渠道,自行寻找买家不仅耗费大量时间和人力,还可能因对设备价…

股票数据api接口编写从入门到精通:选型策略、服务商评测与代码示例

股票数据api接口编写从入门到精通:选型策略、服务商评测与代码示例2025-10-03 13:09 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !…

压力位和支撑位概念

在某一个价位买入并获利的人越多(换言之成交量越大),后续上涨下跌后,这个价位的支撑越强;反之,在某一个价位买入并亏损的人越多(换言之成交量越大),后续下跌上涨后,这个价位的阻力越强;

还有哪些免费的网站可以做H5安徽网站推广优化

本篇文章主要是阐述Pytest在断言方面的应用。让大家能够了解和掌握Pytest针对断言设计了多种功能以适应在不同测试场景上使用。 了解断言的基础 在Pytest中,断言是通过 assert 语句来实现的。简单的断言通常用于验证预期值和实际值是否相等,例如&#xf…

2025 年浙江义乌匹克球拍厂家 TOP 企业品牌推荐排行榜,碳纤维,高级,轻质,定制,高定,比赛专用,玻璃纤维,木制,儿童,匹克球拍套装公司推荐

引言近年来,匹克球运动在全球范围内快速兴起,带动匹克球拍市场需求持续攀升,但行业发展中的问题也逐渐显现。源头厂家资质参差不齐,部分小型加工厂缺乏标准化生产流程,导致产品质量稳定性不足,强度与耐用性难以保…

实用指南:k8s中的schedule

实用指南:k8s中的schedulepre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", …

企业公司网站开发国外的云服务器租用

1)替换处理 CTRLH打开replace功能,勾选上左侧的regular expression,并填写 find what栏: \s$ (正则表达式) replace with栏: (这行留空) 接着点replace all即可

简述网站建设优劣的评价标准网页升级访问未成年自觉离开

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 -------------------------------------------- 我是分隔线 --------------------------------------------------- Qualifier&#xf…

什么网站可以做pptapp制作平台下载

extern "C" 的作用是让 C 编译器将 extern "C" 声明的代码当作 C 语言代码处理,可以避免 C 因符号修饰导致代码不能和C语言库中的符号进行链接的问题。 extern "C" 使用 #ifdef __cplusplus extern "C" { #endifvoid *me…

竞猜网站建设物流公司创建

qt-C++笔记之创建和初始化 QGraphicsScene 和 QGraphicsView 并关联视图和场景的方法 code review! 参考笔记 1.qt-C++笔记之创建和初始化 QGraphicsScene 和 QGraphicsView 并关联视图和场景的方法 2.qt-C++笔记之QGraphicsScene和 QGraphicsView中setScene、通过scene得到vie…

tomcat做网站并发公司三站合一的网站

对于Python爬虫和Fiddler抓包,可能遇到的问题及解决: 代理设置错误:如果你在使用Python爬虫时遇到抓不到包的问题,首先应该检查你的浏览器代理设置是否正确。以Chrome为例,代理设置为:右上角菜单按钮>设…

惠州论坛网站建设网站建设人才招聘

![在这里插入图片描述](https://img-blog.csdnimg.cn/dde7fc866d214985baaa87300a472578.png)这些是存储在分区(分区才是实际的存储)文件中的. seg是逻辑概念 而实际由log存储的. index是偏移量索引而timeindex是时间戳索引 log就是seg 找数据就是先找log 再从log去找

如何免费注册淘宝店铺汕头seo排名

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 多开: 第一种:win10的开始菜单,在vscode图标右键选择“新开窗口”,这样就多了一个vscode…

wordpress 发布站司法政务网站群建设

协商缓存和强缓存是 HTTP 缓存机制中的两种不同的策略,用于减少网络请求并提高网页加载速度。它们之间的主要区别在于缓存的验证方式和服务器返回的响应头。 强缓存: 强缓存是基于过期时间(Expires)和缓存标识(Cache…

【光照】[PBR][环境光]实现方法解析

Unity URP环境光实现方案结合反射探针与球谐光照,提供平衡性能与质量的PBR渲染方案。核心流程包括:环境贴图采样、漫反射/镜面反射计算、环境遮蔽处理。主要采用三种技术:1)球谐光照-低内存占用,适合动态场景;2…

基于SpringBoot3+Vue3的校园跑腿架构、校园跑腿服务平台、校园接单系统、智能校园跑腿平台、协同过滤推荐算法,毕业设计,课程设计

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

建设网站企业网上银行登录入口东莞网络关键词排名

这篇文章是我最近十天口语系列文章的合辑,文章比较长,一万五千余字。但是系统化地归纳了自己十多年的英语尤其是口语方面的学习经历与总结思考。我不是个纯粹的英语专业学生,我甚至不是任何英语相关专业的学生,但是我和英语却有着…