您好,登錄后才能下訂單哦!
本篇內容介紹了“Python語言的面向對象舉例分析”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
首先,我們需要定義一個新的HTMLParser類,以覆蓋handle_starttag()方法,我們將使用這個方法來顯示所有標簽的HRef屬性值。定義好新的HTMLParser類之后,需要創建一個實例來返回Python語言。然后,就可以使用urllib.urlopen(url)打開HTML文檔并讀取該HTML文件的內容了。
為了解析HTML文件的內容并顯示包含其中的鏈接,可以使用read()函數將數據傳遞給HTMLParser對象。HTMLParser對象的feed函數將接收數據,并通過定義的HTMLParser對象對數據進行相應的解析。
需要注意,如果傳給HTMLParser的feed()函數的數據不完整的話,那么不完整的標簽會保存下來,并在下一次調用feed()函數時進行解析。當HTML文件很大,需要分段發送給解析器的時候,這個功能就會有用武之地了。下面是一個具體的例子。
import HTMLParser import urllib import sys #定義HTML解析器 class parseLinks(HTMLParser.HTMLParser): def handle_starttag(self, tag, attrs): if tag == 'a': for name,value in attrs: if name == 'href': print value print self.get_starttag_text() #創建HTML解析器的實例 lParser = parseLinks() #打開HTML文件 lParser.feed(urllib.urlopen( \ "http://www.python.org/index.html").read()) lParser.close()
“Python語言的面向對象舉例分析”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。