XPath解析页面和提取数据
一、简介
关注公众号“轻松学编程”了解更多。
XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,有不同类型的节点,包括元素节点,属性节点和文本节点,提供在数据结构树中找寻节点的能力。
二、什么是 XPath?
XPath 使用路径表达式在 XML 文档中进行导航
XPath 包含一个标准函数库
XPath 是 XSLT 中的主要元素
XPath 是一个 W3C 标准
三、使用xpath
1导入模块
import lxml
from lxml
import etree
2、XPath Helper插件
chrome插件网:http://www.cnplugins.com/
GitHub下载:https://github.com/liangdongchang/tools
在谷歌浏览器添中加插件