要使用Python爬取網頁圖片,可以使用requests庫來發送HTTP請求,然后使用beautifulsoup庫或者正則表達式來解析網頁內容,最后使用urllib庫來下載圖片。
下面是一個簡單的示例代碼,可以爬取指定網頁的所有圖片并保存到本地:
import requests
from bs4 import BeautifulSoup
import urllib
# 發送HTTP請求
response = requests.get('http://example.com')
# 使用BeautifulSoup解析網頁內容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的圖片標簽
img_tags = soup.find_all('img')
# 下載圖片
for img_tag in img_tags:
# 獲取圖片URL
img_url = img_tag['src']
# 下載圖片并保存到本地
urllib.request.urlretrieve(img_url, 'image.jpg')
需要注意的是,上述代碼只能下載網頁中第一個圖片,并且沒有對錯誤進行處理。在實際應用中,可能需要處理多張圖片和異常情況,例如使用循環來下載所有圖片,添加異常處理等。
此外,還可以使用第三方庫如Scrapy來更方便地實現圖片爬取功能。