您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“python中如何處理“&#”開頭加數字的html字符”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“python中如何處理“&#”開頭加數字的html字符”這篇文章吧。
python如何處理“&#”開頭加數字的html字符,比如:风水這類數據。
用python抓取數據時,有時會遇到想要數據是以“&#”開頭加數字的字符,比如圖中所示的這些:
风水大术士
這些字符需要再次轉換才能變回中文內容。這些字符需要再次轉換才能變回中文內容。
Python2.7版本
在python2.7版本中,使用import HTMLParser
定義變量,再定義轉換代碼。
代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。
測試運行,這串字符串正常輸出了中文。
Python3.7+版本
在最新python版本中,不能用上面的導入方法。可以用"import html"或者“from html import unescape”。這里使用"import html"做測試。
導入html后,直接用".unescape()"來處理字符串。
運行后,正常轉換成了中文字符。
以上是“python中如何處理“&#”開頭加數字的html字符”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。