91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python怎么抓取糗事百科的內容

發布時間:2021-07-09 16:59:50 來源:億速云 閱讀:116 作者:chen 欄目:大數據

這篇文章主要講解了“python怎么抓取糗事百科的內容”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“python怎么抓取糗事百科的內容”吧!

# 抓取糗事百科的內容
import requests
from lxml import etree
class Qiushi() :
	def __init__(self) : 
		self.url = 'http://www.qiushibaike.com/8hr/page/{}';
		self.headers = {
			"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1 Trident/5.0;"
		};

	def parse_url(self , url) : 
		response = requests.get(url , timeout = 10 , headers = self.headers)
		assert response.status_code == 200
		print(url)
		return etree.HTML(response.text)

	def parse_content(self , html) : 
		item = html.xpath('//div[@class="recommend-article"]/ul/li')
		print(item)
		for i in item : 
			# 內容 
			print(i.xpath('./div/a[@class="recmd-content"]/text()'));
			# 好笑數
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[1]/text()'))
			# 評論數
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[4]/text()'))
			# 用戶名
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/span/text()'))
			# 頭像地址
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/img/@src'))


	def run(self) : 
		url = self.url.format(1);
		html = self.parse_url(url);
		self.parse_content(html);

if __name__ == '__main__': 
	qiu = Qiushi();
	qiu.run();

感謝各位的閱讀,以上就是“python怎么抓取糗事百科的內容”的內容了,經過本文的學習后,相信大家對python怎么抓取糗事百科的內容這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

景德镇市| 鸡东县| 华阴市| 和林格尔县| 杭锦旗| 武威市| 姚安县| 贵港市| 瑞安市| 常州市| 东港市| 武宣县| 读书| 西平县| 沙田区| 许昌县| 涞源县| 安阳县| 吴桥县| 棋牌| 波密县| 砚山县| 马山县| 德清县| 宁武县| 琼结县| 平原县| 阿拉尔市| 崇信县| 安吉县| 嘉义县| 恩平市| 张家口市| 瓮安县| 乌海市| 渝中区| 禹州市| 贡嘎县| 家居| 唐山市| 图们市|