怎么利用Python爬取網頁內容

發布時間：2021-09-10 09:20:02 來源：億速云閱讀：200 作者：chen 欄目：編程語言

這篇文章主要講解了“怎么利用Python爬取網頁內容”，文中的講解內容簡單清晰，易于學習與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學習“怎么利用Python爬取網頁內容”吧！

編寫執行代碼

首先,你要安裝requests和BeautifulSoup4,然后執行如下代碼.
 
import requests
 
from bs4 import BeautifulSoup
 
iurl = 'http://news.sina.com.cn/c/nd/2017-08-03/doc-ifyitapp0128744.shtml'
 
res = requests.get(iurl)
 
res.encoding = 'utf-8'
 
#print(len(res.text))
 
soup = BeautifulSoup(res.text,'html.parser')
 
#標題
 
H1 = soup.select('#artibodyTitle')[0].text
 
#來源
 
time_source = soup.select('.time-source')[0].text
 
#來源
 
origin = soup.select('#artibody p')[0].text.strip()
 
#原標題
 
oriTitle = soup.select('#artibody p')[1].text.strip()
 
#內容
 
raw_content = soup.select('#artibody p')[2:19]
 
content = []
 
for paragraph in raw_content:
 
content.append(paragraph.text.strip())
 
'@'.join(content)
 
#責任編輯
ae = soup.select('.article-editor')[0].text

感謝各位的閱讀，以上就是“怎么利用Python爬取網頁內容”的內容了，經過本文的學習后，相信大家對怎么利用Python爬取網頁內容這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關知識點的文章，歡迎關注！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

怎么利用Python爬取網頁內容

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

怎么利用Python爬取網頁內容

猜你喜歡

最新資訊

相關推薦

相關標簽