xpath
- 使用
使用
from lxml import etree
或者
from lxml import html
et = etree.XML(xml)
et = etree.HTML(html)
res = et.xpath("/book") # 返回列表
| 项目 | Value |
|---|---|
| et.xpath(“/book”) | /表示根节点 |
| /div/a | 子节点用/依次表示 |
| /name/text() | text()取文本 |
| /book//nick | //表示标签book子孙后代中的nick标签 |
| /book/*/father | *通配符,表示同一层级标签中的任意标签。寻找book的孙辈father标签 |
| /book[@class=‘meth’/text() | []用属性筛选 |
| /book/@id | 取标签book中的id属性值 |
| /tr[position()>1 | 从第二行开始选择,tr的第一行是0 |
| /html/body/ul/li[1]/a/text() | [1]表示选择第一个li标签 |
| //li | 寻找任务位置下的li标签 |
| ./a/@href | ./表示从当前节点开始查找 |