HTML下載模塊是怎樣的

發布時間：2021-10-12 16:06:09 來源：億速云閱讀：169 作者：柒染欄目：大數據

這篇文章給大家介紹HTML下載模塊是怎樣的，內容非常詳細，感興趣的小伙伴們可以參考借鑒，希望對大家能有所幫助。

HTML下載模塊

該模塊主要是根據提供的url進行下載對應url的網頁內容。使用模塊requets-HTML，加入重試邏輯以及設定最大重試次數，同時限制訪問時間，防止長時間未響應造成程序假死現象。

根據返回的狀態碼進行判斷如果訪問成功則返回源碼，否則開始重試，如果出現異常也是進行重試操作。

from requests_html import HTMLSession
from fake_useragent import UserAgent
import requests
import time
import random
class Gethtml():
    def __init__(self,url="http://wwww.baidu.com"):
        self.ua = UserAgent()
        self.url=url
        self.session=HTMLSession(mock_browser=True)
        #關于headers有個默認的方法 self.headers = default_headers()
        #mock_browser 表示使用useragent
    def get_source(self,url,retry=1):
           if retry>3:
               print("重試三次以上，跳出循環")
               return None
           while retry<3:
               try:
                  req=self.session.get(url,timeout=10)
                  if req.status_code==requests.codes.ok:
                      return req.text
                  else:
                      time.sleep(random.randint(0,6))
               except:
                   print('An Error Happened, Please wait 0-6 seconds')
                   time.sleep(random.randint(0, 6))
                   retry += 1
                   self.get_source(url,retry)

關于HTML下載模塊是怎樣的就分享到這里了，希望以上內容可以對大家有一定的幫助，可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

HTML下載模塊是怎樣的

HTML下載模塊

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

HTML下載模塊是怎樣的

HTML下載模塊

猜你喜歡

最新資訊

相關推薦

相關標簽