服务器和网站维护太原注册公司网站

news/2025/10/3 10:15:52/文章来源:
服务器和网站维护,太原注册公司网站,纷享销客crm管理系统,lnmp wordpress 登陆目录 一、安装XPath 二、XPath的基础语法 1.选取节点 三、使用XPath匹配数据 1.浏览器审查元素 2.具体实例 四、总结 一、安装XPath 控制台输入指令#xff1a;pip install lxml 二、XPath的基础语法 XPath是一种在XML文档中查找信息的语言#xff0c;可以使用它在HTM…目录 一、安装XPath 二、XPath的基础语法  1.选取节点 三、使用XPath匹配数据 1.浏览器审查元素 2.具体实例 四、总结 一、安装XPath 控制台输入指令pip install lxml 二、XPath的基础语法  XPath是一种在XML文档中查找信息的语言可以使用它在HTML源代码文档中通过元素、属性等方式进行查找和提取数据。 1.选取节点 表达式描述nodename 选取此元素的所有子元素。 例div选取div下所有子元素。 / 从根节点选取子节点。 例/div选取根元素div //从匹配选择的当前元素下选择文档中的元素而不考虑它们在文档中的位置。.选取当前元素。..选取父元素。选取属性。 例XPath的常用语法格式 ul//li #选取ul下所有li子元素而不管它们在文档的位置。 //class # 选取所有具有class属性的元素 ul//li[1] # 选取ul元素下第一个li子元素 //div[idt2] # 选取id属性为t2的所有div元素 //li[classit] #选取class属性为it的li子元素 /div/ul/li[classit] # 选取根元素div下ul元素下的class属性等于it的li子元素 三、使用XPath匹配数据 1.浏览器审查元素 上文初步了解了XPath的语法这里介绍一个技巧无需我们自己写XPath使用浏览器自带工具即可自动生成XPath。 第一步打开要爬取的网页 以机场三字代码查询系统_机场代码 (6qt.net)为例 按下F12显示以下界面。 第二步 点击审查元素按钮 第三步在左侧选取要爬取的内容 2.具体实例 实例一根据class属性进行匹配 获取标签文本使用text() 。 from lxml import html import requests urlhttp://www.6qt.net resrequests.get(url) res.encodinggb2312 data_htmlhtml.fromstring(res.text) # 将网络请求返回的文本res.text转换为一个HTML文档对象 name_listdata_html.xpath(//tr[classtdbg]//td[1]/a/text()) for x in name_list:print(x) 运行结果 实例二根据id属性进行匹配 获取标签属性值使用属性名以下案例获取了属性title值title 。 from lxml import html import requests urlhttp://www.6qt.net resrequests.get(url) res.encodinggb2312 data_htmlhtml.fromstring(res.text) # 将网络请求返回的文本res.text转换为一个HTML文档对象 name_listdata_html.xpath(//div[idlogo]/a/title) for x in name_list:print(x) 运行结果 实例三根据name属性进行匹配 获取了meta标签的content属性 from lxml import html import requests urlhttp://www.6qt.net resrequests.get(url) res.encodinggb2312 data_htmlhtml.fromstring(res.text) # 将网络请求返回的文本res.text转换为一个HTML文档对象 name_listdata_html.xpath(/html/head/meta[nameKeywords]/content) for x in name_list:print(x) 运行结果 四、总结 爬虫是一个自动化获取网页数据的工具其使用关键在于会分析HTML文档结构使用正确的Xpath匹配数据才能获取到想要的内容所见即所得。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/925766.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站域名到期登不上是怎么回事想建书画网站怎么做的

第三章:处理机调度与死锁 处理机调度算法的目标 处理机调度算法的共同目标 资源利用率:CPU的利用率CPU有效工作时间/(CPU有效工作时间CPU空闲等待时间)公平性平衡性策略强制执行 批处理系统的目标 平均周转时间短系统吞吐量高处理机利用率高 分时系统的目标 响应时间快均…

旗讯OCR表格识别精准还原复杂表格,识别还原准确率95%+,还能结构化 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

二手车网站制作软件工程师面试常见问题

一、 MySQL建表,字段需设置为非空,需设置字段默认值。二、 MySQL建表,字段需NULL时,需设置字段默认值,默认值不为NULL。三、 MySQL建表,如果字段等价于外键,应在该字段加索引。四、 MySQL建表&a…

银河麒麟V10服务器桌面SP1、SP2、SP3国防版集采版国防集采版教育版

银河麒麟V10服务器桌面SP1、SP2、SP3国防版集采版国防集采版教育版 下载地址: kylin_gfb.zip 👍

戴尔网站建设规划旅游门户网站有哪些

2023年7月25日至26日,由中国信息通信研究院(简称“中国信通院”)、中国通信标准化协会主办的以“云领创新,算启新篇”为主题的“2023可信云大会”在北京成功举办。会上公布了多项前瞻领域的评估结果和2023年度最佳实践案例&#x…

上海备案证查询网站查询网站查询系统网站建设公司专业网站费用报价

1、 文档目标 解决分布式部署下其他机器如何连接RLMLicense管理器。 2、 问题场景 分布式部署下QAC要在其他机器上单独运行扫描,必须先连接RLMLicense管理器,如何连接? 3、软硬件环境 1、软件版本:HelixQAC23.04 2、机器环境…

凭祥网站建设php怎么做搭建网站

主题是拥抱开源 拥抱开源:开放是互联终端不断增长的主旨和核心——使技术世界变得越来越复杂,联系越来越紧密。在微软,我们专注于向客户提供任何信息支持,即使在任何设备或者在多个平台上。 未来是开放的,未来的云是开…

display ip routing-table故障判断及题目 - 详解

display ip routing-table故障判断及题目 - 详解2025-10-03 10:02 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display…

完整教程:华为eNSP环境安装和命令使用教程

完整教程:华为eNSP环境安装和命令使用教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

分布式架构初识:为什么需要分布式 - 教程

分布式架构初识:为什么需要分布式 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

[IOI 1998 / USACO2.2] 派对灯 Party Lamps 题解 + bitset浅谈

现在有这些按钮:按钮 \(1\):当按下此按钮,将改变所有的灯:本来亮着的灯就熄灭,本来是关着的灯被点亮; 按钮 \(2\):当按下此按钮,将改变所有奇数号的灯; 按钮 \(3\):当按下此按钮,将改变所有偶数号的灯; 按…

解题报告-小 A 的树

小 A 的树 题目描述 小 A 有一棵 \(N\) 个点的树,每个点都有一个小于 \(2^{20}\) 的非负整数权值。现在小 A 从树中随机选择一个点 \(x\),再随机选择一个点 \(y\)(\(x\)、\(y\)可以是同一个点),并对从 \(x\) 到 \…

【React 状态管理深度解析:Object.is()、Hook 机制与 Vue 对比实践指南】 - 教程

【React 状态管理深度解析:Object.is()、Hook 机制与 Vue 对比实践指南】 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font…

2025 --【J+S 二十连测】-- 第一套 总结

总结 T1 考场上很快写出了正解,没有问题 T2 考场上很快写出了正解,但提交时交了两边,故0分 T3 考场上很快写出了正解,没有问题 T4 考场上很快写出了部分分,拿满了,没有问题 题解 T1 照题意模拟即可 代码 #includ…

详细介绍:分布式缓存的正确姿势:Cache-Aside、更新策略与分布式锁在 Java 微服务中的实战

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

企业网站建设的文章太原市做网站

AI的归纳和演绎法分别是什么? AI的归纳和演绎法是两种常见的推理方法。 归纳法(inductive reasoning)是一种从特殊到一般的过程,在有限的实例观察中得出一般规律或原则。用简单的说法,就是从一些具体的事物或情况中总…

做网站大彩票网站开发搭建

《绝地求生》PCL秋季赛的战斗已经全部落下帷幕了,Team Razer 雷蛇战队成员,国内最具人气的4AM战队凭借着在季后赛的出色发挥,以316分的高分碾压全场,成功斩获本次PCL秋季赛的冠军,成为PCL联赛首个双冠队伍。随着金色的…

个人网站建设服务器aaa云主机怎么做网站

1、基本操作 1.1、进入HBase客户端命令行 前提是先启动hadoop集群和zookeeper集群。 bin/hbase shell 1.2、查看帮助命令 helphelp 查看指定命令的语法规则 查看 list_namespace 的用法(‘记得加单引号’) help list_namespace 2、namespace 我们…

信阳市网站建设自己做服装搭配的网站

Docker Compose是一种流行的技术,可以用来定义和管理你的应用程序所需的多个服务容器。通常在你的应用程序旁边创建一个 compose.yml 文件,它定义和配置服务容器。 使用 Docker Compose 的典型工作流程是运行 docker compose up,用它连接启动…

网站建设优化服务方案模板西安商城网站建设

前言 spring作为主流的 Java Web 开发的开源框架,是Java 世界最为成功的框架,持续不断深入认识spring框架是Java程序员不变的追求。 本篇博客介绍SpringBootApplicant注解的自动加载相关内容 其他相关的Spring博客文章列表如下: Spring基…