您好,登錄后才能下訂單哦!
這篇文章主要介紹了python爬蟲如何爬取圖片,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
Python是一種編程語言,內置了許多有效的工具,Python幾乎無所不能,該語言通俗易懂、容易入門、功能強大,在許多領域中都有廣泛的應用,例如最熱門的大數據分析,人工智能,Web開發等。
Python是很好的爬蟲工具不用再說了,它可以滿足我們爬取網絡內容的需求,那最簡單的爬取網絡上的圖片,可以通過很簡單的方法實現。只需導入正則表達式模塊,并利用spider原理通過使用定義函數的方法可以輕松的實現爬取圖片的需求。
1、spider原理
spider就是定義爬取的動作及分析網站的地方。
以初始的URL**初始化Request**,并設置回調函數。 當該request**下載完畢并返回時,將生成**response ,并作為參數傳給該回調函數。
2、實現python爬蟲爬取圖片
第一步:導入正則表達式模塊
import re # 導入正則表達式模塊 import requests # python HTTP客戶端 編寫爬蟲和測試服務器經常用到的模塊 import random # 隨機生成一個數,范圍[0,1]
第二步:使用定義函數的方法爬取圖片
def spiderPic(html, keyword): print('正在查找 ' + keyword + ' 對應的圖片,下載中,請稍后......') for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL print('正在爬取URL地址:' + str(addr)[0:30] + '...') # 爬取的地址長度超過30時,用'...'代替后面的內容 try: pics = requests.get(addr, timeout=100) # 請求URL時間(最大10秒) except requests.exceptions.ConnectionError: print('您當前請求的URL地址出現錯誤') continue fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') # 下載圖片,并保存和命名 fq.write(pics.content) fq.close()
感謝你能夠認真閱讀完這篇文章,希望小編分享的“python爬蟲如何爬取圖片”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。