91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python如何爬取二手房的數據

發布時間:2022-02-24 14:15:45 來源:億速云 閱讀:170 作者:小新 欄目:開發技術

這篇文章給大家分享的是有關python如何爬取二手房的數據的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

一、查找數據所在位置:

打開鏈家官網,進入二手房頁面,選取某個城市,可以看到該城市房源總數以及房源列表數據。

python如何爬取二手房的數據

二、確定數據存放位置:

某些網站的數據是存放在html中,而有些卻api接口,甚至有些加密在js中,還好鏈家的房源數據是存放到html中:

python如何爬取二手房的數據

三、獲取html數據:

通過requests請求頁面,獲取每頁的html數據

# 爬取的url,默認爬取的南京的鏈家房產信息
url = 'https://nj.***.com/ershoufang/pg{}/'.format(page)
# 請求url
resp = requests.get(url, headers=headers, timeout=10)

 代碼中的網站非真真實網址,不可直接運行!

四、解析html,提取有用數據:

通過BeautifulSoup解析html,并提取相應有用的數據

soup = BeautifulSoup(resp.content, 'lxml')
# 篩選全部的li標簽
sellListContent = soup.select('.sellListContent li.LOGCLICKDATA')
# 循環遍歷
for sell in sellListContent:
    # 標題
    title = sell.select('div.title a')[0].string
    # 先抓取全部的div信息,再針對每一條進行提取
    houseInfo = list(sell.select('div.houseInfo')[0].stripped_strings)
    # 樓盤名字
    loupan = houseInfo[0]
    # 對樓盤的信息進行分割
    info = houseInfo[0].split('|')
    # 房子類型
    house_type = info[1].strip()
    # 面積大小
    area = info[2].strip()
    # 房間朝向
    toward = info[3].strip()
    # 裝修類型
    renovation = info[4].strip()
    # 房屋地址
    positionInfo = ''.join(list(sell.select('div.positionInfo')[0].stripped_strings))
    # 房屋總價
    totalPrice = ''.join(list(sell.select('div.totalPrice')[0].stripped_strings))
    # 房屋單價
    unitPrice = list(sell.select('div.unitPrice')[0].stripped_strings)[0]

感謝各位的閱讀!關于“python如何爬取二手房的數據”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

从化市| 江陵县| 洪雅县| 东丰县| 泰安市| 沛县| 漳浦县| 吕梁市| 敖汉旗| 买车| 延寿县| 井陉县| 安宁市| 大悟县| 乐平市| 个旧市| 紫云| 清新县| 紫阳县| 繁峙县| 青阳县| 通城县| 古丈县| 郓城县| 丰顺县| 佛冈县| 新龙县| 乃东县| 汉寿县| 文登市| 南汇区| 临西县| 榆中县| 巴中市| 桐城市| 合作市| 桂阳县| 金秀| 普兰县| 乌拉特前旗| 高邮市|