91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python爬蟲如何爬取圖片

發布時間:2021-04-27 14:17:45 來源:億速云 閱讀:178 作者:小新 欄目:編程語言

這篇文章主要介紹了python爬蟲如何爬取圖片,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

python可以做什么

Python是一種編程語言,內置了許多有效的工具,Python幾乎無所不能,該語言通俗易懂、容易入門、功能強大,在許多領域中都有廣泛的應用,例如最熱門的大數據分析,人工智能,Web開發等。

Python是很好的爬蟲工具不用再說了,它可以滿足我們爬取網絡內容的需求,那最簡單的爬取網絡上的圖片,可以通過很簡單的方法實現。只需導入正則表達式模塊,并利用spider原理通過使用定義函數的方法可以輕松的實現爬取圖片的需求。

1、spider原理

spider就是定義爬取的動作及分析網站的地方。
以初始的URL**初始化Request**,并設置回調函數。 當該request**下載完畢并返回時,將生成**response ,并作為參數傳給該回調函數。

2、實現python爬蟲爬取圖片

第一步:導入正則表達式模塊

import re # 導入正則表達式模塊
import requests # python HTTP客戶端 編寫爬蟲和測試服務器經常用到的模塊
 import random # 隨機生成一個數,范圍[0,1]

第二步:使用定義函數的方法爬取圖片

def spiderPic(html, keyword):
    print('正在查找 ' + keyword + ' 對應的圖片,下載中,請稍后......')
    for addr in re.findall('"objURL":"(.*?)"', html, re.S):  # 查找URL
        print('正在爬取URL地址:' + str(addr)[0:30] + '...')  
        # 爬取的地址長度超過30時,用'...'代替后面的內容

        try:
            pics = requests.get(addr, timeout=100)  # 請求URL時間(最大10秒)
        except requests.exceptions.ConnectionError:
            print('您當前請求的URL地址出現錯誤')
            continue

        fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
         # 下載圖片,并保存和命名
        fq.write(pics.content)
        fq.close()

感謝你能夠認真閱讀完這篇文章,希望小編分享的“python爬蟲如何爬取圖片”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

鄂州市| 维西| 六枝特区| 曲阜市| 白沙| 新和县| 红原县| 隆子县| 永宁县| 罗定市| 吉安市| 佛坪县| 新昌县| 邯郸县| 宜春市| 巴青县| 大厂| 泰顺县| 西平县| 湟中县| 侯马市| 乾安县| 宜都市| 固始县| 洪湖市| 信丰县| 东台市| 旌德县| 连城县| 嘉善县| 邢台市| 布尔津县| 德钦县| 清新县| 凌海市| 图木舒克市| 商南县| 临清市| 镇沅| 富顺县| 顺平县|