重庆分公司,新征程启航

为企业提供网站建设、域名注册、服务器等服务

Python网络爬虫--scrapy的选择器Xpath-创新互联

Xpath简介

10年积累的成都做网站、成都网站建设经验,可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你,你也不认识我。但先网站设计后付款的网站建设流程,更有博罗免费网站建设让你可以放心的选择与我们合作。

一般来说,使用id、name、class等属性就能对节点进行定位就能解决绝大部分解析需求,但有时候遇到以下情况,使用Xpath就更方便:

没有id、name、class等

标签的属性或者文本特征不显著

标签嵌套层次太复杂

Xpath是XMLPath的简介,基于XML树状结构,可以在整个树中寻找锁定目标节点。由于HTML文档本身就是一个标准的XML页面,因此我们可以使用XPath的语法来定位页面元素。

Xpath定位方法

一、Xpath路径

Python网络爬虫 -- scrapy的选择器Xpath

Xpath路径案例

定位节点

Python网络爬虫 -- scrapy的选择器Xpath

通配符*选择未知的节点

Python网络爬虫 -- scrapy的选择器Xpath

二、使用索引

如果筛选时元素时出现多个节点,但我们想确定唯一节点。可以使用类似于列表索引的方式精确定位。

案例

Python网络爬虫 -- scrapy的选择器Xpath

三、使用属性

为了让定位更精准,跟使用索引类似,我们要增加信息量,那么还可以使用属性。@符号是属性符

Python网络爬虫 -- scrapy的选择器Xpath

四、常用函数

除了索引、属性外,Xpath还可以使用便捷的函数来增强定位的准确性。下面试常用的几个函数:

Python网络爬虫 -- scrapy的选择器Xpath

应用推广

Python网络爬虫 -- scrapy的选择器Xpath

五、Xpath轴

这部分类似BeautifulSoup中的sibling、parents、children方法。

Python网络爬虫 -- scrapy的选择器Xpath

另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


名称栏目:Python网络爬虫--scrapy的选择器Xpath-创新互联
转载来源:http://cqcxhl.com/article/dgdiji.html

其他资讯

在线咨询
服务热线
服务热线:028-86922220
TOP