91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url

發布時間:2020-07-24 23:29:09 來源:網絡 閱讀:396 作者:老肖的博客 欄目:編程語言


#!/usr/bin/python3
#coding=UTF-8
import?requests
from?bs4?import?BeautifulSoup

'''
需求:【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url!?例如收費文章http://c.biancheng.net/view/vip_6005.html對應非收費地址是http://c.biancheng.net/view/5315.html這個網站總是有一些vip文章??但是vip文章通過百度標題是可以搜索到的,我想爬取所有這樣的文章標題和網頁的地址!后期看到一個vip文章,你可以通過檢索標題得到非vip的觀看鏈接地址
編寫日期:2019-10-18
作者:xiaoxiaohui
說明:python3程序?而且最好在linux運行?windows下有gbk那個編碼問題
'''

def?get_biaoti(url):
	response?=?requests.get(url)
	response.encoding='utf-8'?#如果不設置成utf8則中文亂碼或者報錯?參考https://www.cnblogs.com/supery007/p/8303472.html
	soup?=?BeautifulSoup(response.text,'html.parser')
	links_div?=?soup.find_all('h2')
	return?links_div[0].text

f?=?open("a1.txt",?'a')
for?yema?in?range(1,500):
	url?=?'http://c.biancheng.net/view/'+str(yema)+'.html'
	biaoti?=?get_biaoti(url)
	print(url,biaoti)?
	f.write(url+'\t'+biaoti+'\n')
f.close()


運行結果、收集到的文章和url對應關系截圖:

【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url

自己學到的:

  1. 這次學到的? 原來我的爬蟲都是爬某個div的,都是links_div = soup.find_all('div',class_="listpic"), 原來也可以直接links_div = soup.find_all('h2'),也就是帶一個參數這樣的




向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

邵阳市| 禹城市| 鹿泉市| 永川市| 惠东县| 黄浦区| 缙云县| 舒城县| 霍州市| 连南| 长宁县| 临漳县| 澎湖县| 平南县| 樟树市| 民和| 闸北区| 玉溪市| 平潭县| 瓮安县| 杂多县| 诸暨市| 隆安县| 麦盖提县| 利津县| 巴南区| 正安县| 旅游| 同心县| 剑河县| 沙坪坝区| 遂平县| 平阳县| 建湖县| 崇文区| 连南| 南召县| 宿松县| 尖扎县| 咸宁市| 白水县|