python爬虫使用xpath解析页面和提取数据

xiaoxiao2021-02-28  47

XPath解析页面和提取数据

一、简介

关注公众号“轻松学编程”了解更多。

XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,有不同类型的节点,包括元素节点,属性节点和文本节点,提供在数据结构树中找寻节点的能力。

二、什么是 XPath?

XPath 使用路径表达式在 XML 文档中进行导航 XPath 包含一个标准函数库 XPath 是 XSLT 中的主要元素 XPath 是一个 W3C 标准

三、使用xpath

1导入模块
#首先安装库 pip install lxml import lxml from lxml import etree
2、XPath Helper插件

chrome插件网:http://www.cnplugins.com/

GitHub下载:https://github.com/liangdongchang/tools

在谷歌浏览器添中加插件

转载请注明原文地址: https://www.6miu.com/read-2619446.html

最新回复(0)