您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關python使用xpath中遇到:<Element a at 0x39a9a80>怎么辦的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
Element是什么
回歸正題,大家暈頭轉腦的看完繁雜的語法之后,已經迫不及待寫點什么東西了,然后部分同學可能遇到了這個
<Element a at 0x39a9a80>
或者類似 Element a at 0x???????,這樣的一個值,然后大家帶著問題去搜,然后全是英文啊,什么一大堆亂七八糟的啊,英文不好的同學就崩潰了,在這里,我會重點解析一下
某種意義上來說,當你打印變量的時候得到的這個值,其實它是一個列表,然后列表中的每一個值都是一個字典
如何使用理解請看半成品開車實例,證明了本人非常擅長把學習和樂趣結合起來并且切身解決日常需求,滑稽臉.jpg
from bs4 import BeautifulSoup from lxml import etree import requests gjc='SHKD-700' #定義URL html = "http://www.btanv.com/search/"+gjc+"-hot-desc-1" #解碼URL html = requests.get(html).content.decode('utf-8') #解析成xml dom_tree = etree.HTML(html) #在xml中定位節點,返回的是一個列表 links = dom_tree.xpath("//a[@class='download']") for index in range(len(links)): # links[index]返回的是一個字典 if (index % 2) == 0: print(links[index].tag) print(links[index].attrib) print(links[index].text)
實例解析
下面重點看看這個代碼,
print(links[index]) print(type(links[index])) print(links[index].tag)#獲取<a>標簽名a print(links[index].attrib)#獲取<a>標簽的屬性href和class print(links[index].text)#獲取<a>標簽的文字部分
打印出來的是
<Element a at 0x3866a58> <class 'lxml.etree._Element'> a {'href': 'magnet:?xt=urn:btih:7502edea0dfe9c2774f95118db3208a108fe10ca', 'class': 'download'} 磁力鏈接
該節點的html代碼為
<a href="magnet:xt=urn:btih:7502edea0dfe9c2774f95118db3208a108fe10ca" rel="external nofollow" class="download">磁力鏈接</a>
看到這里大家應該就非常獸血沸騰的了解了三個屬性的用法了。
總結
Element類型是'lxml.etree._Element',某種意義來說同時是一個列表
列表的需要使用tag\attrib\text三個不同的屬性來獲取我們需要的東西
變量.tag獲取到的是標簽名是---字符串
變量.attrib獲取到的是節點標簽a的屬性---字典
變量.text獲取到的是標簽文本--字符串
感謝各位的閱讀!關于“python使用xpath中遇到:<Element a at 0x39a9a80>怎么辦”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。