在Python中,可以使用第三方庫如requests和BeautifulSoup來進行批量爬取并保存圖片。
首先,需要安裝相應的第三方庫。可以使用以下命令安裝:
pip install requests
pip install beautifulsoup4
下面是一個簡單的示例代碼,用于批量爬取并保存圖片:
import requests
from bs4 import BeautifulSoup
import os
# 定義要爬取的網頁鏈接
url = "http://example.com"
# 發送GET請求,獲取網頁內容
response = requests.get(url)
# 使用BeautifulSoup解析網頁內容
soup = BeautifulSoup(response.text, "html.parser")
# 查找所有的圖片標簽
img_tags = soup.find_all("img")
# 創建保存圖片的文件夾
if not os.path.exists("images"):
os.makedirs("images")
# 遍歷找到的圖片標簽
for img in img_tags:
# 獲取圖片鏈接
img_url = img["src"]
# 發送GET請求,獲取圖片內容
img_response = requests.get(img_url)
# 提取圖片名稱
img_name = img_url.split("/")[-1]
# 保存圖片到本地文件夾
with open("images/" + img_name, "wb") as f:
f.write(img_response.content)
print("已保存圖片:" + img_name)
上述代碼會在當前目錄下創建一個名為images
的文件夾,并將爬取到的圖片保存在該文件夾中。
請注意,該代碼僅適用于簡單的靜態網頁。對于需要登錄或通過其他方式才能訪問的網頁,還需要進行額外的處理。