您好,登錄后才能下訂單哦!
這篇文章主要講解了“怎么運用Python進行數據分析房地產市場”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么運用Python進行數據分析房地產市場”吧!
土地市場數據一般會公示在當地的公共資源交易中心,但經常會出現只公示當周或當月數據的情況,因此,我們可以去找專業的土地網站獲取交易數據。
本文以土流網為例,這個網站結構簡單,簡單的url翻頁構造,然后用xpath解析數據即可。限于篇幅,爬蟲代碼不做贅述,僅提供核心代碼。
def main(): for page in range(1,46): #這里設置頁數 url = 'https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page) print(url) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36', } response = requests.request("GET", url, headers = headers) #print(response.status_code) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取第" + str(page) + "頁") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) #解析網頁 items = parse.xpath('.//div[@class="land-l-cont"]/dl') parse_page(items) if len(items) < 10: print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()
運行爬蟲代碼,提取到廣州1238塊土地數據。以下為簡單清洗后部分數據:
土地成交狀態
近10年廣州土地招拍掛成交情況
2011年至2016年廣州市土地招拍掛成交土地較少,2016年成交規劃建筑面積僅為77.30萬㎡。2017年以后成交規模開始步入高潮,2018年成交規劃建筑面積達到1635.50萬㎡。
2019年以來廣州土地招拍掛成交面積(萬㎡)
近10年來廣州成交土地主要以工業用地、其他用地和住宅用地為主,工業用地占比高達41.19%,這也是廣州工業企業發達的重要動因。
土地成交區域
近10年廣州各區土地招拍掛成交面積(萬㎡)
從成交區域來看,南沙區和番禺區各年都有一定土地成交,越秀區和天河區成交土地較少。2020年以來,南沙區土地市場火熱,成交面積遠高于廣州其他地區。
房產市場分析主要包括新房和二手房交易市場,由于一般的房產信息發布平臺二手房數量遠大于新房,為盡可能獲取更大樣本數據,提高分析的準確性,本文以廣州二手房成交數據進行房產市場分析。
本文通過Python獲取房天下公布的廣州二手房成交數據。房天下的爬蟲也較為簡單,爬蟲邏輯類似貝殼找房,唯一需要注意的是當遍歷完一個子地區后跳轉下一個子地區的處理。以下給出核心代碼:
def main(): #增城a080;番禺a078;南沙a084;花都a0639;白云a076;海珠a074;越秀a072;荔灣a071;天河a073;從化a079;黃埔a075 district_list = ['a084', 'a078','a080', 'a0639','a076', 'a074','a072', 'a071','a073', 'a079','a075'] #地區 for district in district_list: for page in range(1,101): #這里設置頁數 url = 'https://gz.esf.fang.com/chengjiao-{0}/i3{1}/'.format(district, page) print(url) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36', } response = requests.request("GET", url, headers = headers) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取" + district +'第' + str(page) + "頁") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) # 解析網頁 items = parse.xpath('.//div[@name="div_houselist"]/dl') parse_page(items) if len(items) < 30: #遍歷完子地區后跳轉 print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()
代碼運行幾分鐘就提取下22170套廣州二手房數據,簡單清洗后部分數據展示如下:
量價走勢
近5年廣州二手房量價走勢
2020年1月至6月,廣州二手房均價與2019年基本持平。從成交量來看,2月份受疫情影響僅成交70套二手房,3月份以來,疫情逐漸得到控制,房產市場向好,6月份成交二手房1337套。
房價分布
2020年上半年廣州各區二手房均價(元/㎡)
從樓盤成交來看,2020年1月至6月廣州二手房成交數量最多的樓盤為位于增城區的錦繡天倫花園,共計成交78套,成交均價為18565.40元/㎡。
相關性分析
import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sns %matplotlib inline sns.set_style('white') #設置圖形背景樣式為白色 df = pd.read_excel("D:\data\地產數據分析\廣州二手房.xlsx") df = df[['室','廳','面積(㎡)','層數','成交單價(元/㎡)']] #選擇需要的列 df.rename(columns={'室': 'room', '廳': 'hall', '面積(㎡)': 'area', '層數': 'floor', '成交單價(元/㎡)': 'price'}, inplace=True) fig,axes=plt.subplots(1,2,figsize=(12,5)) sns.regplot(x= 'room',y='price',data=df,color='r',marker='+',ax=axes[0]) sns.regplot(x='hall',y='price',data=df,color='g',marker='*',ax=axes[1])
感謝各位的閱讀,以上就是“怎么運用Python進行數據分析房地產市場”的內容了,經過本文的學習后,相信大家對怎么運用Python進行數據分析房地產市場這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。