python爬蟲如何爬取圖片

發布時間：2021-04-27 14:17:45 來源：億速云閱讀：178 作者：小新欄目：編程語言

這篇文章主要介紹了python爬蟲如何爬取圖片，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

python可以做什么

Python是一種編程語言，內置了許多有效的工具，Python幾乎無所不能，該語言通俗易懂、容易入門、功能強大，在許多領域中都有廣泛的應用，例如最熱門的大數據分析，人工智能，Web開發等。

Python是很好的爬蟲工具不用再說了，它可以滿足我們爬取網絡內容的需求，那最簡單的爬取網絡上的圖片，可以通過很簡單的方法實現。只需導入正則表達式模塊，并利用spider原理通過使用定義函數的方法可以輕松的實現爬取圖片的需求。

1、spider原理

spider就是定義爬取的動作及分析網站的地方。
以初始的URL**初始化Request**，并設置回調函數。當該request**下載完畢并返回時，將生成**response ，并作為參數傳給該回調函數。

2、實現python爬蟲爬取圖片

第一步：導入正則表達式模塊

import re # 導入正則表達式模塊
import requests # python HTTP客戶端 編寫爬蟲和測試服務器經常用到的模塊
 import random # 隨機生成一個數，范圍[0,1]

第二步：使用定義函數的方法爬取圖片

def spiderPic(html, keyword):
    print('正在查找 ' + keyword + ' 對應的圖片,下載中，請稍后......')
    for addr in re.findall('"objURL":"(.*?)"', html, re.S):  # 查找URL
        print('正在爬取URL地址：' + str(addr)[0:30] + '...')  
        # 爬取的地址長度超過30時，用'...'代替后面的內容

        try:
            pics = requests.get(addr, timeout=100)  # 請求URL時間（最大10秒）
        except requests.exceptions.ConnectionError:
            print('您當前請求的URL地址出現錯誤')
            continue

        fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
         # 下載圖片，并保存和命名
        fq.write(pics.content)
        fq.close()

感謝你能夠認真閱讀完這篇文章，希望小編分享的“python爬蟲如何爬取圖片”這篇文章對大家有幫助，同時也希望大家多多支持億速云，關注億速云行業資訊頻道，更多相關知識等著你來學習!

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python爬蟲如何爬取圖片

python可以做什么

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python爬蟲如何爬取圖片

python可以做什么

猜你喜歡

最新資訊

相關推薦

相關標簽