102302143郑泽雄第一次作业

news/2025/10/24 17:38:07/文章来源:https://www.cnblogs.com/zzzzzx/p/19163914

1.用requests和BeautifulSoup库方法爬取大学排名信息。

核心代码及结果

image
image
2d1b24d78f8c2d7395e841bd146d95de
由图可知,所需信息在table的tbody下的 标签,然后逐一排查寻找需要的5个标签即可。

心得

从这道题我掌握了如何使用正则化表达式匹配中文序列,当我想要爬取所有页面的信息时,这个网页的翻页无法用简单的for循环,用requests和BeautifulSoup库不能实现翻页。

2.爬取商城的书包价格

核心代码及结果

image
image
2e980b049d53e6780d56f897ec8fff46
爬取网站选择了反爬机制较差的当当网。在浏览页面的时候,我发现了标签和价格都在

  • 块,用最简单的正则表达式抓取,如果有 title 或 price 就加入结果列表。

    心得

    除了网站比较不好找,标签的爬取还是比较简单的。

    3.爬取一个给定网页(https://news.fzu.edu.cn/yxfd.htm)所有JPEG、JPG或PNG格式图片文件。

    核心代码及结果

    image
    image
    image
    爬取的时候发现图片基本以 jpg/jpeg/png 结尾,匹配 src 属性中直接以 jpg/jpeg/png 结尾的 URL。

    心得

    这个网页还是比较容易爬取的,基本上没遇到什么困难。

  • 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/945537.shtml

    如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

    相关文章

    2025 年兰州凯文中学推荐:兰州凯文中学,二十载深耕民办教育 双师赋能全维育人 以低进高出成效书写成长答卷

    行业背景 当前,我国普通高中教育进入高质量发展新阶段,教育部《普通高中学校办学质量评价指南》明确提出 “坚持以评促建、强化增值评价” 的导向,推动民办教育朝着特色化、优质化方向转型。兰州市积极推进民办中学…

    详细介绍:Uvicorn - Python ASGI Web 服务器

    pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

    OpenEuler 22.03 手动升级 OpenSSH 至 10.2p1 完整方案

    本文档提供在 OpenEuler 22.03 LTS 系统上,将 OpenSSH 手动升级至 10.2p1 版本的完整、安全的操作方案。方案包含准备、升级、验证、回滚四个核心环节,并重点集成了对 SELinux 策略的自动化处理。 1、方案概述项目说…

    配置GOPRIVATE引用私有仓库

    目录核心配置步骤1. 设置GOPRIVATE环境变量2. 配置Git认证验证与依赖管理解决常见问题团队协作与CI/CD配置高级场景与总结配置 GOPRIVATE 环境变量是解决Go语言引用私有仓库依赖问题的关键核心配置步骤1. 设置GOPRIVAT…

    2025年3d全息投影生产厂家权威推荐榜单:全息投影展厅/全息投影沙盘/全息投影源头厂家精选

    随着数字视觉技术的快速发展,3D全息投影已从科幻概念走向成熟应用,成为展览展示、商业广告、教育医疗等领域的重要工具。据行业数据显示,2024年全球全息投影市场规模突破85亿元,预计2025年将增长至100亿元,年复合…

    github克隆别人的项目并创建环境安装子模块 - 教程

    github克隆别人的项目并创建环境安装子模块 - 教程2025-10-24 17:28 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displ…

    JMeter Plugin Manager Linux 插件安装命令行

    wget -q -O "$JMETER_HOME/lib/ext/jmeter-plugins-manager-1.7.jar" \ https://repo1.maven.org/maven2/kg/apc/jmeter-plugins-manager/1.7/jmeter-plugins-manager-1.7.jar wget -q -O &qu…

    用AI“抄底”双十一

    “李佳琦一声‘美眉们’,我付定金的手在颤抖;双十一一堆‘隐藏券’,我算价格的脑在燃烧。”这大概是很多网购者的真实写照。 但今年,你的“赛博搭子”或许能让你从这场“数学竞赛”中解放出来。荣耀Magic8系列搭载…

    整体理解pai0-具身智能-PyTorch einsum 完全教程-11 - jack

    目录1. 基础概念2. 基础语法Level 1: 向量点积Level 2: 矩阵乘法Level 3: 批次矩阵乘法(Transformer中常用)4. PI0 代码中的实际例子例子1: QKV 投影 (gemma.py:183)例子2: 注意力计算 (gemma.py:217)例子3: 注意力输…

    2025年北京奢侈品品牌首饰回收公司权威推荐榜单:钻石回收/黄金回收/钻戒回收源头公司精选

    随着奢侈品消费市场持续升温,首饰回收行业呈现出蓬勃发展的态势。根据最新行业数据显示,2024年北京地区奢侈品首饰回收业务量同比增长23.5%,其中钻石、黄金类产品占据回收总量的68%。面对众多的回收企业,消费者如何…

    查询每门成绩都大于80分的同学学号

    查询每门成绩都大于80分的同学学号,假设成绩表中存了学生学号sno、课程编号cno、成绩degree。 关于这个题目的四种解题思路,如下: 1、按学号分组,然后找最低分大于80分的SELECT snoFROM scoreGROUP BY snoHAVING m…

    【C++】函数参数传递

    目录资料阅读参数类型拷贝问题代码实验 资料阅读 指针参数和引用参数的区别如果一个参数可能在函数中指向不同的对象,或者这个参数可能不指向任何对象,则必须使用指针参数。但是基本很少有这种使用,使用引用更安全,…

    C++ lambd表达式

    目录资料 资料 C++的lambda表达式CSDN

    NVIDIA与Adobe漏洞深度解析

    本文详细披露了思科Talos团队在NVIDIA CUDA工具包中发现的5个安全漏洞及Adobe Acrobat阅读器中的1个释放后使用漏洞。这些漏洞涉及任意代码执行、越界写入和堆缓冲区溢出等严重安全问题,均已由相应厂商修复。NVIDIA与…

    监督学习、无监督学习、半监督学习、强化学习、自监督学习

    From AI and some articles. 监督学习是机器学习的一种基本类型,它使用已标记(labeled)的数据集来训练算法,以识别模式并预测新数据的结果。在已标记的数据集中,每个输入数据都对应一个正确的输出标签,就好比一个…

    2025 年退磁器生产厂家最新推荐榜:技术创新、行业适配与服务保障全景对比及权威测评结果强力退磁器/手提退磁器/小型退磁器公司推荐

    引言 随着机械制造、钢铁冶金等领域对加工精度与生产效率要求的不断提升,退磁器作为关键辅助设备,其市场需求持续增长,但产品质量与服务水平参差不齐的问题仍较为突出。为帮助企业精准筛选优质品牌,中国重型机械工…

    计算机组成原理:磁盘存储设备 - 实践

    计算机组成原理:磁盘存储设备 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mona…

    2025 年最新推荐辊涂机源头厂家推荐榜单:UV 漆 / 玻璃 / 铝板 / 木门 / PVC 地板辊涂机优质企业全解析

    引言 在工业制造智能化升级浪潮下,辊涂机作为涂装核心设备,其品质与性能直接决定生产效率与产品竞争力。为解决企业采购难题,本次榜单由中国涂装设备行业协会联合第三方检测机构共同测评,历时 3 个月,覆盖全国 87…

    【哲学思考】:规则

    【哲学思考】:规则【哲学思考】:规则一、规则的意义1.  玩游戏,首要的是学习“规则”。所谓的规则,玩游戏时,必须遵守的原则。2.  规则,设定了利益分配的“取向”以及损失的承担对象。即,规则代表利益分配倾…

    2025.10.24第一节课内容

    计算机五大组成部分(掌握): 一、CPU中央处理器: 1.帮我们控制四肢 2.运算+判断 控制器(虚拟):控制构成计算机的一大堆废铜烂铁 运算器(虚拟):逻辑运算+算术运算 二、存储器 内存: 人类:睡一觉就忘了;缺点…