您好,登錄后才能下訂單哦!
在python的Beautiful Soup 4 擴展庫的使用過程中出現了
TypeError: list indices must be integers or slices, not str
這個錯誤,這里就分析一下為什么會報錯以及如何解決。
這個錯誤的意思是'類型錯誤:list的索引必須是'integers'或者'slices'不能是'str'
我出現錯誤的代碼:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標簽 img_tag = div.select("img") #獲取標簽屬性(這里報錯) src = img_tag['src'] #輸出 print(src)
經過檢查對比后我發現錯誤原因
就是獲取標簽時獲取的是list數據而不是tag
主要原因如下:
主要就是獲取的內容和自己認為的有偏差。
也就是find()和find_all(),select()和select_one()的區別。
當使用
find() select_one()
時,獲得的是一個標簽
類型為
<class 'bs4.element.Tag'>
所以可以使用tag['class']取值
當使用
find_all() select()
時,獲得的是組標簽(就算只有一個標簽也是一組)
類型為
#find_all()的返回值類型 <class 'bs4.element.ResultSet'> #select()的返回值類型 <class 'list'>
這時,我們要取值就需要先定位是list(ResultSet)中的那個標簽在取值
例如tag[0]['class']
解決方法
方法一:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標簽 img_tag = div.select("img") #獲取標簽屬性(這里有改動) src = img_tag[0]['src'] #輸出 print(src)
因為我知道頁面中的結構可以確保獲得的第一個bag為我需要的標簽。
所以使用src = img_tag[0]['src']來獲取屬性信息。
方法二:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標簽 img_tag = div.select_one("img") #獲取標簽屬性(這里有改動) src = img_tag['src'] #輸出 print(src)
同上理,這樣修改也是可以成功的。
出現這種問題還是因為自己不用心,還是要時刻提醒自己。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。