91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python AI中如何使用機器學習回歸模型預測房價

發布時間:2021-10-11 17:35:59 來源:億速云 閱讀:199 作者:柒染 欄目:大數據

本篇文章給大家分享的是有關Python AI中如何使用機器學習回歸模型預測房價,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

一、回歸預測

今天我們來具體了解一下使用機器學習算法進行回歸預測。

回歸預測主要用于預測與對象關聯的連續值屬性,得到數值型的預測數據。回歸預測的應用場景有各類的價格預測、相關性的反應預測等。

下面,我們就使用sklearn模塊,以一個sklearn中集成的波士頓房價數據集來演示如何進行回歸預測。

二、波士頓房價預測

1、引入數據集

在sklearn中內置的數據集都位于datasets子模塊下,我們可以直接進行導入:

Python AI中如何使用機器學習回歸模型預測房價

導入之后,看看數據集中的內容:

Python AI中如何使用機器學習回歸模型預測房價

其中有五個鍵,從字面意思上理解,可以發現data是數據集中所有的數據特征,DESCR是數據集的描述信息,target是數據集特征對應的目標值,feature_name則是數據特征的名稱。

我們先來看看數據特征的名稱:

Python AI中如何使用機器學習回歸模型預測房價

可以發現數據集中有13個特征,每個特征具體是什么意思,倒不清楚,我們可以在DESCR描述中找到具體意思:

Python AI中如何使用機器學習回歸模型預測房價

最后可以知道每個數據特征的含義如下:

  • CRIM:人均犯罪率 ;

  • ZN:住宅用地超過兩萬五千平方英尺的比例 ;

  • INDUS:城鎮的非零售營業比例;

  • CHAS:河流分界;

  • NOX:一氧化氮濃度 ;

  • RM:住宅平均房間數;

  • AGE:1940年之前建造的房屋業主比例;

  • DIS:距離波士頓五個就業中心的加權距離;

  • RAD:徑向公路的可達指數;

  • TAX :每一萬美元財產的全額財產稅率

  • PTRATIO :城鄉教師比例;

  • B :黑人比例

  • LSTAT :低層人群比例

  • MEDV :房屋價格中值

再來看看具體的數據特征和目標數據值:


數據特征形狀:

Python AI中如何使用機器學習回歸模型預測房價

數據特征概覽:

Python AI中如何使用機器學習回歸模型預測房價

數據特征一共有506行,13列,正好對應13個數據特征。而目標數據值的也正好是506個:

Python AI中如何使用機器學習回歸模型預測房價

相當于是已經處理好的數據了。

但是對于初學者來說,這樣處理好的數據看起來不是太直觀,我們使用Pandas將其還原為DataFrame的形式,可以直觀地看出這個數據集到底是什么樣的:

Python AI中如何使用機器學習回歸模型預測房價

對于熟悉使用pandas的同學來說,這樣看這個數據集是不是親切多了。

好了,我們可以直接進行下一步。

2、分割訓練數據和測試數據

為了檢驗我們創建和訓練好的機器學習模型的效果,將數據集分割為訓練集和測試集是必須的。

而在sklearn中,也有一個專門的接口方法用于分割數據集的訓練集和測試集——train_test_split,我們首先導入它:

Python AI中如何使用機器學習回歸模型預測房價

然后將我們的數據集data傳入,并設置測試集的比例為15%:

Python AI中如何使用機器學習回歸模型預測房價

3、選擇一個回歸算法估計器

在sklearn中,所有的機器學習算法都以“估計器”的形式來呈現,每一個估計器都是一個類,機器學習模型通過實例化一個估計器的類來進行創建。比如線性回歸的算法估計器:

Python AI中如何使用機器學習回歸模型預測房價

每一個算法估計器,無論是監督學習算法還是非監督學習算法,都擁有一個fit()方法,用于接收訓練數據集來訓練數據,比如這樣:

Python AI中如何使用機器學習回歸模型預測房價

同時每一個算法估計器都有用一個predict()方法,用于接收數據來進行預測,比如這樣:

Python AI中如何使用機器學習回歸模型預測房價

在sklearn中,各類機器學習算法的API設計根據不同的用途的算法進行劃分,我們可以方便地調用自己想要的算法,每一個監督學習算法,都由一個單獨的子模塊構成,其下包含算法的具體類,比如廣義的線性回歸算法:

Python AI中如何使用機器學習回歸模型預測房價

其中根據用途,有的算法 可細分為用于回歸的估計器和用于分類的估計器。

在此,我們選擇隨機森林算法的用于回歸的估計器:

Python AI中如何使用機器學習回歸模型預測房價

首先,導入算法估計器:

Python AI中如何使用機器學習回歸模型預測房價

接著,實例化隨機森林回歸估計器,設置算法的參數并將訓練集傳入進行訓練:

Python AI中如何使用機器學習回歸模型預測房價

訓練好模型之后,再使用predict()方法對訓練集進行預測:

Python AI中如何使用機器學習回歸模型預測房價

這樣,我們就獲得了使用隨機森林回歸模型對測試集進行預測的數據了,其為一個一維數組,我們可以直接打印出來看到:

Python AI中如何使用機器學習回歸模型預測房價

還記得我們分割訓練測試集的時候,有過一個y_test的數組吧?它是測試集x_test數據特征對應正確的房價結果,我們也來看看其數據:

Python AI中如何使用機器學習回歸模型預測房價

如何比較正確數組和預測出來的數組的值的正確度呢?一個比較蠢的方法是通過遍歷這兩個數組進行對比,查看其差值:

Python AI中如何使用機器學習回歸模型預測房價

如果測試數據集少的話,這樣來比較似乎工作量還不大,要是測試集很大那就沒辦法了。幸而,sklearn中也提供了對模型的評估方法,所有的評估方法都集成在sklearn.metrics子模塊中。針對回歸模型,我們可以使用平均絕對誤差MAE和均方差MSE以及R2分數來對回歸模型評估:

Python AI中如何使用機器學習回歸模型預測房價

然后在評估方法中傳入預測數組和正確數組:

Python AI中如何使用機器學習回歸模型預測房價

最終得到了我們的平均絕對誤差值、均方差值和R2分數。其中,R2分數理論最佳值為1,平均絕對誤差理論最佳值為0.0,均方差理論最佳值也為0.0.

嗯,這個機器學習隨機森林回歸模型的效果如何?大家自己評估,也可以自己調用其他的回歸模型來測試,看看哪個算法對這個數據集的預測效果較好。

以上就是Python AI中如何使用機器學習回歸模型預測房價,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

鄂托克前旗| 永德县| 苍梧县| 手游| 盘山县| 巨野县| 鄄城县| 钦州市| 塔城市| 新兴县| 通城县| 肥乡县| 晴隆县| 漯河市| 灵台县| 沾化县| 加查县| 肇东市| 新丰县| 富宁县| 西宁市| 维西| 东宁县| 天全县| 扶风县| 成安县| 阜城县| 抚远县| 中阳县| 古交市| 大厂| 翼城县| 车致| 贡觉县| 岱山县| 尚志市| 麦盖提县| 马公市| 龙山县| 剑阁县| 新民市|