91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python如何獲取整個網頁源碼

發布時間:2020-08-03 09:40:40 來源:億速云 閱讀:273 作者:小豬 欄目:開發技術

小編這次要給大家分享的是python如何獲取整個網頁源碼,文章內容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

1、Python中獲取整個頁面的代碼:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、運行結果

python如何獲取整個網頁源碼

實例擴展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

看完這篇關于python如何獲取整個網頁源碼的文章,如果覺得文章內容寫得不錯的話,可以把它分享出去給更多人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

繁峙县| 滕州市| 明星| 铜川市| 尉氏县| 岑溪市| 府谷县| 叙永县| 浦东新区| 勃利县| 内丘县| 沐川县| 阿拉善盟| 阿瓦提县| 新余市| 罗甸县| 葵青区| 东山县| 秭归县| 忻城县| 剑川县| 林周县| 香格里拉县| 中方县| 赤水市| 崇左市| 瑞金市| 辉南县| 黔西| 色达县| 巴东县| 丰镇市| 古交市| 镇原县| 枣庄市| 佛坪县| 东台市| 韩城市| 杨浦区| 郯城县| 新晃|