python爬取酷狗音乐top500_Python爬取酷狗Top500的歌曲！够你吹个小牛皮了吧！

python爬取酷狗音乐top500_Python爬取酷狗Top500的歌曲！够你吹个小牛皮了吧！

news/2025/10/28 13:09:12/文章来源:https://blog.csdn.net/weixin_39976166/article/details/111453205

soup.select('.pc_temp_songlist > ul > li >a')

同样对歌曲时长的分析方法也如上，对 select 的具体用法可参考如下🔗：

Python中BeautifulSoup库的find_all、select用法

三、爬取酷狗Top500的歌曲

import requests

from bs4 import BeautifulSoup

import json

# 获取网页的HTML源码

def getText(url):

try:

r = requests.get(url, timeout=30) # get()函数的参数url必须链接采用HTTP或HTTPS方式访问，每次请求超时时间为30秒

r.raise_for_status() # 返回的请求状态status_code不是200，这个方法会产生一个异常

r.encoding = 'utf-8' # 对encoding属性赋值更改编码方式

return r.text

except:

return ""

# 解析HTML页面格式，提取有用信息

def getInfo(url):

soup = BeautifulSoup(getText(url), 'html.parser') # 创建一个BeautifulSoup对象

songs = soup.select('.pc_temp_songlist > ul > li >a') # 获取包含“歌手-歌名”信息的标签

times = soup.select('.pc_temp_songlist > ul > li > span .pc_temp_time') # 获取包含“歌曲时长”信息的标签

for song, time in zip(songs, times):

data = {

"singer": song.get_text().split('-')[0],

"song title": song.get_text().split('-')[1],

"time": time.get_text().strip()

}

print(data)

SONGS.append(data)

SONGS = []

if __name__ == '__main__':

urls = ['https://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i)) for i in range(1, 24)]

for url in urls:

getInfo(url)

print("歌曲数量：", len(SONGS))

# 爬取的数据以JSON文件格式保存

with open('songs.json', 'w', encoding='utf-8') as json_file:

json_str = json.dumps(SONGS, ensure_ascii=False, indent=4)

json_file.write(json_str)

最终生成的json文件格式如下：非常简单

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/409448.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

C#汉字转换拼音技术详解（高性能）

C#汉字转换拼音技术详解（高性能）

通过网上汉字转换成拼音的代码，经过本人优化，性能将更加优异。下面将源代码贴出。 [csharp] view plaincopy public static class ChineseToPinYin { private static readonly Dictionary<int, string> CodeCollections n…

阅读更多...

oracle出错如何备份数据,备份oracle数据库出错

oracle出错如何备份数据,备份oracle数据库出错

备份oracle数据库出错input datafile fno00027 name/index/neas_standard01.dbfinput datafile fno00035 name/oradata1/tancke/neas_standard09.dbfinput datafile fno00001 name/oradata/new/tancke/system01.dbfchannel ch01: starting piece 1 at 06-SEP-10RMAN-03009: fai…

阅读更多...

python整数因子_Python：通过非整数因子下采样2D numpy数组

python整数因子_Python：通过非整数因子下采样2D numpy数组

我最后写了一个小函数,使用scipy.ndimage.zoom升级图像,但是为了缩小它,它首先将它升级为原始形状的倍数,然后通过块平均缩小.它接受scipy.zoom的任何其他关键字参数(order和prefilter)我仍在寻找使用可用软件包的更清洁的解决方案.def zoomArray(inArray, finalShape, sameSum…

阅读更多...

[html] 当html中使用map标签时,area中coords值如何精确定位呢？

[html] 当html中使用map标签时,area中coords值如何精确定位呢？

[html] 当html中使用map标签时,area中coords值如何精确定位呢？ 在 area 标签上支持的属性有 shape、coords、href、alt、target、type、download、hreflang、media、rel； coords 值如何精确定位圆形，在绘制一个圆形时，其 shapeci…

阅读更多...

[html] 当img标签中的src图片加载失败时，怎么让它变得更美观呢？

[html] 当img标签中的src图片加载失败时，怎么让它变得更美观呢？

[html] 当img标签中的src图片加载失败时，怎么让它变得更美观呢？ 当默认图也失效，就会陷入死循环，需加变量计数，如果是 vue 的话用 error.once 更妙。在 onerror 给元素加个类名也阔以，这个就挺 nice 的。使…

阅读更多...

python输入n×n的矩阵0和1_关于Python数组和矩阵的用法X[:,0]、X[:,1]、X[:,:,0]、X[:,:,1]、X[:,m:n]和X[:,:,m:n]...

python输入n×n的矩阵0和1_关于Python数组和矩阵的用法X[:,0]、X[:,1]、X[:,:,0]、X[:,:,1]、X[:,m:n]和X[:,:,m:n]...

1、关于数组、矩阵的说明。X[:,0] 取二维数组中第一维的所有数据。X[:,1] 取二维数组中第二维的所有数据。X[:,m:n] 取二维数组中第m维到第n-1维的所有数据。X[:,:,0] 取三维矩阵中第一维的所有数据。X[:,:,1] 取三维矩阵中第二维的所有数据。X[:,:,m:n] 取三维矩阵中第m维到第…

阅读更多...

将时间格式的字符串转换成日期类型浏览器兼容解决方案

将时间格式的字符串转换成日期类型浏览器兼容解决方案

var currentTime "20120612"; var y currentTime.substring(0, 4); var m currentTime.substring(4, 6); var d currentTime.substring(6, 8); currentTime y "-" m "-" d;//此种写法在火狐跟谷歌下都可以currentTimey"/"m&qu…

阅读更多...

对比linux终端模式和图形模式,Linux知识-2. Linux初学(CnetOS Linux7)之切换命令模式和图形模式...

对比linux终端模式和图形模式,Linux知识-2. Linux初学(CnetOS Linux7)之切换命令模式和图形模式...

2. Linux初学(CnetOS Linux7)之切换命令模式和图形模式通常我们也称命令模式为终端机接口,terminal 或console 。Linux 预设的情况下会提供六个Terminal 来让使用者登入，切换的方式为使用：[Ctrl] [Alt] [F1]~[F6]的组合按钮。那这六个终端接口如何命名…

阅读更多...

[html] 你有用过图片热区吗？它有什么运用场景？

[html] 你有用过图片热区吗？它有什么运用场景？

[html] 你有用过图片热区吗？它有什么运用场景？ 点击logo回到主页点击地图区块跳到具体的地方网站个人简介我是歌谣，欢迎和大家一起交流前后端知识。放弃很容易， 但坚持一定很酷。欢迎大家一起讨论主目录与歌谣一起通关前端面…

阅读更多...

mysql 写入慢_MySQL主从，你遇到过哪些问题？

mysql 写入慢_MySQL主从，你遇到过哪些问题？

上篇文章介绍了单机环境下的MySQL主从异步复制和主从半同步复制的搭建过程。搭建过程很简单，但是在实际使用过程中，更多的是解决问题，本篇文章将介绍一下MySQL主从复制中常见的问题以及如何定位问题和如何解决问题。1、可能的原因如下(1)主从…

阅读更多...

Girl Love Value

Girl Love Value

【原题链接】【题意说明】有一组共有N个正整数，每次只能取其中的一个数，每次没有被取到的数会减少相应的值，把每次取到数的值累加，问共要取K个数，在所有取法中，和最大是多少？ 【问题分析】快…

阅读更多...

linux查找时间文件,Linux基础教程 linux下使用find命令根据系统时间查找文件用法(示例代码)...

linux查找时间文件,Linux基础教程 linux下使用find命令根据系统时间查找文件用法(示例代码)...

LinuxFind兄弟连Linux培训总结这些时间戳包括复制代码代码如下:mtime 文件内容上次修改时间atime 文件被读取或访问的时间ctime 文件状态变化时间mtime 和 atime 的含义都是很容易理解的，而 ctime 则需要更多的解释。由于 inode 维护着每个文件上的元数据&#xff0…

阅读更多...

如何清理 Weblogic Server 缓存

如何清理 Weblogic Server 缓存

Weblogic中的项目重新编译、部署之后并不起作用，仍然运行原来的程序。这可能是 Weblogic缓存在作怪，需要手动删除。 Weblogic 8 SP6 的缓存位置： %BEA HOME%\user_projects\domains\<Your Domain>\<Your Server>\.wlnotdelete\ex…

阅读更多...

python安装django模块_python中安装django模块的方法

python安装django模块_python中安装django模块的方法

网上搜一下对应的版本号，版本号相对应。安装django有两种方式：1.pip安装pip install django这个方法我用的时候已经报错。貌似访问被阻挡。我一般都用第二种2.下载压缩包手动安装在django官网下载tar.gz包，放在python对应目录中解压缩命令窗口…

阅读更多...

linux对目录进行操作,Linux 基础：对文件和目录进行操作的 Linux 和 Unix 命令笔记...

linux对目录进行操作,Linux 基础：对文件和目录进行操作的 Linux 和 Unix 命令笔记...

参考文章《Linux Basic – Linux and Unix Commands for File and Directory Manipulation》https://www.jianshu.com/writer#/notebooks/37377394/notes/66158656/preview◈ ls 列出目录的内容◈ cp 将文件和目录从一个位置复制到另一位置。◈ mv 将文件和目录从一个位置移动到…

阅读更多...

[html] 举例说明当我们在写布局时，都有哪些边界的情况需要关注的？

[html] 举例说明当我们在写布局时，都有哪些边界的情况需要关注的？

[html] 举例说明当我们在写布局时，都有哪些边界的情况需要关注的？ margin 重叠在竖直方向，当两个元素的外边距连在一块时，两者的距离并不是两者的 margin 之和，而是取最大的 margin 值。个人简介我是歌谣&#xff0…

阅读更多...

（转）GDB 使用方法

（转）GDB 使用方法

感谢原创作者的辛勤劳动； 简述一列文件清单二：执行程序三：显示数据四：断点(breakpoint) 五．断点的管理六．变量的检查和赋值七. 单步执行八．函数的调用九．机器语言工具十&a…

阅读更多...

[html] 如何去除标签＜i＞默认斜体？

[html] 如何去除标签＜i＞默认斜体？

[html] 如何去除标签默认斜体？ font-style: normal;个人简介我是歌谣，欢迎和大家一起交流前后端知识。放弃很容易， 但坚持一定很酷。欢迎大家一起讨论主目录与歌谣一起通关前端面试题

阅读更多...

vue根据不同权限显示图片_vue多级权限组件的实现

vue根据不同权限显示图片_vue多级权限组件的实现

首先实现递归checkbox的组件假定，我们要实现的权限组件效果是这样的：要实现点击系统，下面的都全选，点击基础功能，用户管理半选，系统半选。点击新增组织，如果基础功能没有选中，则基础…

阅读更多...

linux自带磁盘加密工具下载,TrueCrypt(磁盘加密工具)

linux自带磁盘加密工具下载,TrueCrypt(磁盘加密工具)

TrueCrypt是一款功能强大的虚拟磁盘加密工具，它能够在硬盘上创建一个或多个虚拟磁盘，并且自动加密磁盘文件，提供AES-256、Blowfish、Serpent等多种加密算法，用户可以同时采取两个或多个来提高加密效果，软件体积小巧&am…

阅读更多...

最新文章