91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python 爬蟲 批量獲取代理ip的實例代碼

發布時間:2020-10-03 20:54:16 來源:腳本之家 閱讀:189 作者:mzbqhbc12 欄目:開發技術

實例如下所示:

import urllib.request
import os, re,sys,time
try:
 from StringIO import StringIO
except ImportError:
 from io import StringIO
loca = re.compile(r"""ion":"\D+", "ti""")
#偽裝成瀏覽器
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
class Getip():
 def __init__(self,diqu):
  self.ur ={"xicidaili國內普通代理 --1線":"http://www.xicidaili.com/nt/",
        
    "ip84國內普通代理 --2線":'http://www.ip84.com/dlpn-http/',
        
    'xicidaili國內高匿名代理 --1線':'http://www.xicidaili.com/nn/',
       
    'ip84國內高匿名代理 --2線':'http://www.ip84.com/dlgn-http/',
    
    'xicidaili國外高匿名代理 --1線':'http://www.xicidaili.com/wn/',
    
    'ip84國外高匿名代理 --2線':'http://www.ip84.com/gwgn-http/',
    'xicidaili國外普通代理 --1線':'http://www.xicidaili.com/wt/',
    'haodailiip國內混合代理 --3線':'http://www.haodailiip.com/guonei/',
    'haodailiip國外混合代理 --3線':'http://www.haodailiip.com/guoji/',
        }
  self.diqu = diqu
 
 def urlopen(self,url):
  global header
  try:
   req = urllib.request.Request(url, None, header)
   res=urllib.request.urlopen(req)
  
   return res
  except:
   pass
 def getip(self,ren):
  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP頁面
  ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''
  
  url = self.ur[self.diqu]+str(ren)
  
  ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*<[^\u4E00-\u9FA5]+>([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<')
  #################################通用正則匹配的  格式 是  (IP,端口,地區) 地區有可能包含換行和空格
  try:
   data = self.urlopen(url).read().decode('utf-8')
  except:
   return None
  
  self.rel = []
  
  ip = ip_proxy_re.findall(data)
  ##########返回的IP 就是 正則匹配的結果(IP,端口,地區) 地區有可能包含換行和空格
  
  return ip
  
if __name__ == '__main__':
 g=Getip("xicidaili國內普通代理 --1線")
 import pprint
 for x in range(4):
  ips = g.getip(1)
  print('獲取到ip地址一共:',len(ips))
  pprint.pprint(ips)

以上這篇python 爬蟲 批量獲取代理ip的實例代碼就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

桓仁| 景洪市| 岳普湖县| 浏阳市| 怀仁县| 屏东县| 南开区| 富锦市| 宝兴县| 视频| 湖南省| 逊克县| 江北区| 含山县| 中江县| 家居| 盘锦市| 奉新县| 正安县| 玉屏| 同江市| 赣榆县| 嘉荫县| 利辛县| 东明县| 杂多县| 吴旗县| 镇康县| 六枝特区| 荔浦县| 上高县| 乌海市| 梨树县| 班戈县| 恩施市| 桑植县| 阿尔山市| 哈巴河县| 泾源县| 阳新县| 广宗县|