91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python網絡爬蟲 -- scrapy的選擇器Xpath

發布時間:2020-07-06 09:11:02 來源:網絡 閱讀:329 作者:Python熱愛者 欄目:編程語言

Xpath簡介

一般來說,使用id、name、class等屬性就能對節點進行定位就能解決絕大部分解析需求,但有時候遇到以下情況,使用Xpath就更方便:

沒有id、name、class等

標簽的屬性或者文本特征不顯著

標簽嵌套層次太復雜

Xpath是XMLPath的簡介,基于XML樹狀結構,可以在整個樹中尋找鎖定目標節點。由于HTML文檔本身就是一個標準的XML頁面,因此我們可以使用XPath的語法來定位頁面元素。

Xpath定位方法

一、Xpath路徑

Python網絡爬蟲 -- scrapy的選擇器Xpath

Xpath路徑案例

定位節點


Python網絡爬蟲 -- scrapy的選擇器Xpath

通配符*選擇未知的節點


Python網絡爬蟲 -- scrapy的選擇器Xpath

二、使用索引

如果篩選時元素時出現多個節點,但我們想確定唯一節點。可以使用類似于列表索引的方式精確定位。

案例


Python網絡爬蟲 -- scrapy的選擇器Xpath

三、使用屬性

為了讓定位更精準,跟使用索引類似,我們要增加信息量,那么還可以使用屬性。@符號是屬性符


Python網絡爬蟲 -- scrapy的選擇器Xpath

四、常用函數

除了索引、屬性外,Xpath還可以使用便捷的函數來增強定位的準確性。下面試常用的幾個函數:

Python網絡爬蟲 -- scrapy的選擇器Xpath

<a class="menu_hot" href="/ads/auth/promote.html">應用推廣</a>


Python網絡爬蟲 -- scrapy的選擇器Xpath

五、Xpath軸

這部分類似BeautifulSoup中的sibling、parents、children方法。

Python網絡爬蟲 -- scrapy的選擇器Xpath


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

青河县| 甘泉县| 水富县| 依安县| 靖安县| 文山县| 蒙阴县| 图木舒克市| 格尔木市| 黄浦区| 夏邑县| 宁阳县| 泰兴市| 北京市| 长宁县| 廊坊市| 四会市| 丰台区| 诸暨市| 阳山县| 黑龙江省| 琼结县| 伽师县| 顺昌县| 柳江县| 牟定县| 道孚县| 巴林右旗| 新密市| 陆川县| 洛隆县| 临夏市| 蒲江县| 郴州市| 萍乡市| 阿勒泰市| 荔波县| 乌兰县| 郸城县| 绩溪县| 司法|