91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python如何爬取Q房網數據

發布時間:2022-01-14 15:23:15 來源:億速云 閱讀:329 作者:小新 欄目:大數據

這篇文章主要介紹了python如何爬取Q房網數據,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

前言

本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理

本次目標

爬取Q房網數據

https://shenzhen.qfang.com/newhouse

爬取目標數據:

  • 小區名字

  • 售房狀態

  • 房屋面積

  • 戶型

  • 開盤時間

  • 交房時間

  • 樓盤地址

  • 售價

  • 預計總價

python如何爬取Q房網數據

emmmm,我看看就行了,買不起買不起

開發工具

  • python 3.6.5

  • pycharm

爬蟲代碼

導入工具

import requests
import parsel
import csv

解析網頁,爬取數據

for page in range(1, 84):
    print('===============================正在爬取第{}頁的數據================================================='.format(page))
    url = 'https://shenzhen.qfang.com/newhouse/list/n{}'.format(page)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    selector = parsel.Selector(response.text)
    lis = selector.css('.list-result li')
    dit = {}
    for li in lis:
        title = li.css('.list-main-header a em::text').get()  # 名字
        dit['標題'] = title
        status = li.css('.list-main-header i::text').get()     # 是否在售
        dit['房產狀態'] = status
        space = li.css('.list-main div:nth-child(1) .space span::text').get()     # 售房面積
        dit['售房面積'] = space
        type_list = li.css('.list-main.fl p:nth-child(3) span a::text').getall()     # 戶型
        type_str = '|'.join(type_list).strip().replace('\r\n', '').replace(' ', '')  # 戶型
        dit['戶型'] = type_str
        kp_time = li.css('.new-house-info > div:nth-child(2) > p.space.fl.clearfix > span::text').get()  # 開盤時間
        dit['開盤時間'] = kp_time
        cs_time = li.css('.new-house-info > div:nth-child(2) > p:nth-child(3)> span::text').get()  # 出售時間
        dit['出售時間'] = cs_time
        address = li.css('.list-main a:nth-child(3)::text').get()  # 地址

        if not address == None:
            address = address.strip()
        else:
            address = None
        dit['地址'] = address
        Price = li.css('.list-price .bigger .amount::text').get()  # 售價
        dit['售價'] = Price
        hj_Price = li.css('.list-price .smaller::text').get()   # 預計總價
        dit['預計總價'] = hj_Price

保存數據

f = open('房產數據.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['標題', '房產狀態', '售房面積', '戶型', '開盤時間', '出售時間', '地址', '售價', '預計總價'])
csv_writer.writeheader()
print(dit)

運行代碼,效果如下圖

python如何爬取Q房網數據

感謝你能夠認真閱讀完這篇文章,希望小編分享的“python如何爬取Q房網數據”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

中方县| 乌拉特中旗| 双江| 宁城县| 永城市| 綦江县| 江油市| 东阿县| 神池县| 巧家县| 永嘉县| 邻水| 嵊泗县| 微博| 海宁市| 邵阳市| 买车| 修水县| 永昌县| 通江县| 疏附县| 海城市| 射阳县| 铅山县| 镇赉县| 北宁市| 凤城市| 明水县| 永康市| 鸡泽县| 新竹县| 西宁市| 新津县| 长丰县| 绿春县| 安乡县| 游戏| 铜鼓县| 大化| 湘潭市| 尚义县|