91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何通過python獲取甲流分布數據

發布時間:2023-03-09 14:29:11 來源:億速云 閱讀:93 作者:iii 欄目:開發技術

這篇文章主要講解了“如何通過python獲取甲流分布數據”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“如何通過python獲取甲流分布數據”吧!

1、分析網頁的網絡數據,取得請求頭,并用python的requests包進行解析和讀取。
2、分析解析出的包,進行提取和操作
3、將數據提出并存到數據庫
思路差不多就是這些,因為有反爬,所以在爬取過程中錯了反爬措施,基本的就是解決方案就是User-Agent 用戶代理的添加和代理的使用,加上User-Agent,表明你是瀏覽器訪問即可。有時還會檢查是否帶Referer信息還會檢查你的Referer是否合法,一般再加上Referer。
User-Agent最好使用真實庫,代理最好也是高效的,Referer的來源可以偽裝成百度搜索來的。

Mozilla/4.0 (compatible; MSIE 4.0; Windows Me; Trident/4.0; SV1; .NET CLR 1.0.3705; .NET CLR 3.0.04320; msn OptimizedIE8;ZHCN)
Mozilla/4.0 (compatible; MSIE 4.0; Windows NT 5.1; Trident/4.0; Maxthon; .NET CLR 3.0.04320; msn OptimizedIE8;ZHCN)
Mozilla/4.0 (compatible; MSIE 6.0; Windows CE; PPC; 240x320) Opera 8.65 [zh-cn]
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QIHU 360EE) ; InfoPath.2; .NET CLR 2.0.50727)
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Foxy/2; .NET CLR 2.0.50727; SE 2.x)
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET CLR 2.0.50727; 360SE)
需要其他版本的UA庫,可以找億牛云。
爬蟲如何添加UA:
        class ProxyMiddleware(object):                
            def process_request(self, request, spider):
                # 代理服務器(產品官網 www.16yun.cn)
                proxyHost = "t.16yun.cn"
                proxyPort = "31111"
                # 代理驗證信息
                proxyUser = "username"
                proxyPass = "password"
                request.meta['proxy'] = "http://{0}:{1}".format(proxyHost,proxyPort)
                # 添加驗證頭
                encoded_user_pass = base64ify(proxyUser + ":" + proxyPass)
                request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass                    
                # 設置IP切換頭(根據需求)
                tunnel = random.randint(1,10000)
                request.headers['Proxy-Tunnel'] = str(tunnel)
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.1276.73 Safari/537.36', 'Referer':'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=nike'}
response = requests.get(url=url, headers=headers)

cookie的獲取

import requests    
class Crawler():
    def getCookie(self):
        response = requests.get(self.url)
        cookie_value = ''
        for key,value in response.cookies.items():  
            cookie_value += key + '=' + value + ';'  
        self.headers['Cookie'] = cookie_value

感謝各位的閱讀,以上就是“如何通過python獲取甲流分布數據”的內容了,經過本文的學習后,相信大家對如何通過python獲取甲流分布數據這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

大悟县| 黔东| 杂多县| 禹州市| 莱州市| 巫山县| 应城市| 浦东新区| 西贡区| 柳州市| 呼玛县| 龙门县| 宝丰县| 同仁县| 神农架林区| 富蕴县| 汨罗市| 喜德县| 寿阳县| 进贤县| 万载县| 南雄市| 乐至县| 永济市| 霍城县| 芷江| 青田县| 临猗县| 扎兰屯市| 菏泽市| 德清县| 黑龙江省| 公主岭市| 乐东| 晋江市| 平陆县| 宾阳县| 吉水县| 沙河市| 荔浦县| 鸡泽县|