91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么運用Python進行數據分析房地產市場

發布時間:2021-11-23 16:35:52 來源:億速云 閱讀:444 作者:iii 欄目:大數據

這篇文章主要講解了“怎么運用Python進行數據分析房地產市場”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么運用Python進行數據分析房地產市場”吧!

獲取土地數據

土地市場數據一般會公示在當地的公共資源交易中心,但經常會出現只公示當周或當月數據的情況,因此,我們可以去找專業的土地網站獲取交易數據。

本文以土流網為例,這個網站結構簡單,簡單的url翻頁構造,然后用xpath解析數據即可。限于篇幅,爬蟲代碼不做贅述,僅提供核心代碼。

def main():
    for page in range(1,46):   #這里設置頁數
        url = 'https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page)
        print(url)
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',
        }
        response = requests.request("GET", url, headers = headers)
        #print(response.status_code)
        if response.status_code == 200:
            re = response.content.decode('utf-8')
            print("正在提取第" + str(page) + "頁")
            time.sleep(random.uniform(1,2))
            print("-" * 80)
            # print(re)
            parse = etree.HTML(re)  #解析網頁
            items = parse.xpath('.//div[@class="land-l-cont"]/dl')
            parse_page(items)
            if len(items) < 10:  
                print('獲取完成')
                break


if __name__ == '__main__':
    time.sleep(random.uniform(1,2))
    main()

運行爬蟲代碼,提取到廣州1238塊土地數據。以下為簡單清洗后部分數據:

怎么運用Python進行數據分析房地產市場

分析土地數據

土地成交狀態

近10年廣州土地招拍掛成交情況

怎么運用Python進行數據分析房地產市場

2011年至2016年廣州市土地招拍掛成交土地較少,2016年成交規劃建筑面積僅為77.30萬㎡。2017年以后成交規模開始步入高潮,2018年成交規劃建筑面積達到1635.50萬㎡。

2019年以來廣州土地招拍掛成交面積(萬㎡)

怎么運用Python進行數據分析房地產市場

近10年來廣州成交土地主要以工業用地、其他用地和住宅用地為主,工業用地占比高達41.19%,這也是廣州工業企業發達的重要動因。

土地成交區域

近10年廣州各區土地招拍掛成交面積(萬㎡)

從成交區域來看,南沙區和番禺區各年都有一定土地成交,越秀區和天河區成交土地較少。2020年以來,南沙區土地市場火熱,成交面積遠高于廣州其他地區。

廣州房產市場分析

房產市場分析主要包括新房和二手房交易市場,由于一般的房產信息發布平臺二手房數量遠大于新房,為盡可能獲取更大樣本數據,提高分析的準確性,本文以廣州二手房成交數據進行房產市場分析。

獲取二手房數據

本文通過Python獲取房天下公布的廣州二手房成交數據。房天下的爬蟲也較為簡單,爬蟲邏輯類似貝殼找房,唯一需要注意的是當遍歷完一個子地區后跳轉下一個子地區的處理。以下給出核心代碼:

def main():
    #增城a080;番禺a078;南沙a084;花都a0639;白云a076;海珠a074;越秀a072;荔灣a071;天河a073;從化a079;黃埔a075
    district_list = ['a084', 'a078','a080', 'a0639','a076', 'a074','a072', 'a071','a073', 'a079','a075']  #地區
    for district in district_list:
        for page in range(1,101):   #這里設置頁數
            url = 'https://gz.esf.fang.com/chengjiao-{0}/i3{1}/'.format(district, page)
            print(url)
            headers = {
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',
            }
            response = requests.request("GET", url, headers = headers)
            if response.status_code == 200:
                re = response.content.decode('utf-8')
                print("正在提取" + district +'第' + str(page) + "頁")
                time.sleep(random.uniform(1,2))
                print("-" * 80)
                # print(re)
                parse = etree.HTML(re)  # 解析網頁
                items = parse.xpath('.//div[@name="div_houselist"]/dl')
                parse_page(items)
                if len(items) < 30:  #遍歷完子地區后跳轉
                    print('獲取完成')
                    break

if __name__ == '__main__':
    time.sleep(random.uniform(1,2))
    main()

代碼運行幾分鐘就提取下22170套廣州二手房數據,簡單清洗后部分數據展示如下:

怎么運用Python進行數據分析房地產市場

分析二手房數據

量價走勢

近5年廣州二手房量價走勢

怎么運用Python進行數據分析房地產市場

2020年1月至6月,廣州二手房均價與2019年基本持平。從成交量來看,2月份受疫情影響僅成交70套二手房,3月份以來,疫情逐漸得到控制,房產市場向好,6月份成交二手房1337套。

房價分布

2020年上半年廣州各區二手房均價(元/㎡)

怎么運用Python進行數據分析房地產市場

從樓盤成交來看,2020年1月至6月廣州二手房成交數量最多的樓盤為位于增城區的錦繡天倫花園,共計成交78套,成交均價為18565.40元/㎡。

相關性分析

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
%matplotlib inline
sns.set_style('white')   #設置圖形背景樣式為白色
df = pd.read_excel("D:\data\地產數據分析\廣州二手房.xlsx")
df = df[['室','廳','面積(㎡)','層數','成交單價(元/㎡)']] #選擇需要的列
df.rename(columns={'室': 'room', '廳': 'hall', '面積(㎡)': 'area', '層數': 'floor', '成交單價(元/㎡)': 'price'}, inplace=True)
fig,axes=plt.subplots(1,2,figsize=(12,5))
sns.regplot(x= 'room',y='price',data=df,color='r',marker='+',ax=axes[0])
sns.regplot(x='hall',y='price',data=df,color='g',marker='*',ax=axes[1])

感謝各位的閱讀,以上就是“怎么運用Python進行數據分析房地產市場”的內容了,經過本文的學習后,相信大家對怎么運用Python進行數據分析房地產市場這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

兰考县| 河北省| 浙江省| 西乡县| 柳江县| 珠海市| 黎城县| 白朗县| 怀来县| 天峨县| 灵寿县| 竹山县| 丰镇市| 利川市| 墨竹工卡县| 永康市| 施秉县| 资讯| 南平市| 雷州市| 夹江县| 山阳县| 棋牌| 论坛| 巴里| 达日县| 景洪市| 沙河市| 怀安县| 西青区| 旺苍县| 卫辉市| 望江县| 孟村| 资源县| 杭州市| 天水市| 灵寿县| 鹤峰县| 太保市| 孝昌县|