使用python爬蟲怎么對圖片進行爬取

發布時間：2021-01-18 16:21:24 來源：億速云閱讀：330 作者：Leah 欄目：開發技術

使用python爬蟲怎么對圖片進行爬取？很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學習下，希望你能有所收獲。

1、spider原理

spider就是定義爬取的動作及分析網站的地方。
以初始的URL**初始化Request**，并設置回調函數。當該request**下載完畢并返回時，將生成**response ，并作為參數傳給該回調函數。

2、實現python爬蟲爬取圖片

第一步：導入正則表達式模塊

import re # 導入正則表達式模塊
import requests # python HTTP客戶端 編寫爬蟲和測試服務器經常用到的模塊
import random # 隨機生成一個數，范圍[0,1]

第二步：使用定義函數的方法爬取圖片

def spiderPic(html, keyword):
  print('正在查找 ' + keyword + ' 對應的圖片,下載中，請稍后......')
  for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL
    print('正在爬取URL地址：' + str(addr)[0:30] + '...') 
    # 爬取的地址長度超過30時，用'...'代替后面的內容
    try:
      pics = requests.get(addr, timeout=100) # 請求URL時間（最大10秒）
    except requests.exceptions.ConnectionError:
      print('您當前請求的URL地址出現錯誤')
      continue
    fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
     # 下載圖片，并保存和命名
    fq.write(pics.content)
    fq.close()

看完上述內容是否對您有幫助呢？如果還想對相關知識有進一步的了解或閱讀更多相關文章，請關注億速云行業資訊頻道，感謝您對億速云的支持。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

使用python爬蟲怎么對圖片進行爬取

2、實現python爬蟲爬取圖片

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

使用python爬蟲怎么對圖片進行爬取

2、實現python爬蟲爬取圖片

猜你喜歡

最新資訊

相關推薦

相關標簽