BeautifulSoup在解析HTML文檔時會自動處理重復的屬性值,只會保留第一個出現的屬性值,而忽略后續重復的屬性值。
例如,如果HTML文檔中存在以下代碼:
<a href="https://example.com" class="link" class="link2">Link</a>
BeautifulSoup會將其解析為:
<a href="https://example.com" class="link">Link</a>
可以看到class屬性值"link2"被忽略了。這樣做是為了避免解析出現混亂,并保持解析結果的一致性。如果需要獲取所有的屬性值,可以使用attrs屬性來獲取元素的所有屬性。