91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

CART算法的原理是什么

發布時間:2021-12-27 15:01:47 來源:億速云 閱讀:262 作者:iii 欄目:大數據

本篇內容介紹了“CART算法的原理是什么”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

1. CART算法的認識

   Classification And Regression Tree,即分類回歸樹算法,簡稱CART算法,它是決策樹的一種實現,通常決策樹主要有三種實現,分別是ID3算法,CART算法和C4.5算法。

   CART算法是一種二分遞歸分割技術,把當前樣本劃分為兩個子樣本,使得生成的每個非葉子結點都有兩個分支,因此CART算法生成的決策樹是結構簡潔的二叉樹。由于CART算法構成的是一個二叉樹,它在每一步的決策時只能是“是”或者“否”,即使一個feature有多個取值,也是把數據分為兩部分。在CART算法中主要分為兩個步驟

   (1)將樣本遞歸劃分進行建樹過程

   (2)用驗證數據進行剪枝

2. CART算法的原理

   上面說到了CART算法分為兩個過程,其中第一個過程進行遞歸建立二叉樹,那么它是如何進行劃分的 ?

   設CART算法的原理是什么代表單個樣本的CART算法的原理是什么個屬性,CART算法的原理是什么表示所屬類別。CART算法通過遞歸的方式將CART算法的原理是什么維的空間劃分為不重疊的矩形。

   劃分步驟大致如下:

   (1)選一個自變量CART算法的原理是什么,再選取CART算法的原理是什么的一個值CART算法的原理是什么CART算法的原理是什么CART算法的原理是什么維空間劃分為兩部分,一部分的所有點都滿足CART算法的原理是什么,另一部分的所有點都滿足CART算法的原理是什么,對非連續變量來說屬性值的取值只有兩個,即等于該值或不等于該值。

   (2)遞歸處理,將上面得到的兩部分按步驟(1)重新選取一個屬性繼續劃分,直到把整個CART算法的原理是什么維空間都劃分完。

   在劃分時候有一個問題,它是按照什么標準來劃分的 ? 對于一個變量屬性來說,它的劃分點是一對連續變量屬性值的中點。假設CART算法的原理是什么個樣本的集合一個屬性有CART算法的原理是什么個連續的值,那么則會有CART算法的原理是什么個分裂點,每個分裂點為相鄰兩個連續值的均值。每個屬性的劃分按照能減少的雜質的量來進行排序,而雜質的減少量定義為劃分前的雜質減去劃分后的每個節點的雜質量劃分所占比率之和。而雜質度量方法常用Gini指標,假設一個樣本共有CART算法的原理是什么類,那么一個節點CART算法的原理是什么的Gini不純度可定義為

 CART算法的原理是什么

   其中CART算法的原理是什么表示屬于CART算法的原理是什么類的概率,當Gini(A)=0時,所有樣本屬于同類,所有類在節點中以等概率出現時,Gini(A)最大化,此時CART算法的原理是什么

   有了上述理論基礎,實際的遞歸劃分過程是這樣的:如果當前節點的所有樣本都不屬于同一類或者只剩下一個樣本,那么此節點為非葉子節點,所以會嘗試樣本的每個屬性以及每個屬性對應的分裂點,嘗試找到雜質變量最大的一個劃分,該屬性劃分的子樹即為最優分支。

   下面舉個簡單的例子,如下圖

  CART算法的原理是什么

   在上述圖中,屬性有3個,分別是有房情況,婚姻狀況和年收入,其中有房情況和婚姻狀況是離散的取值,而年收入是連續的取值。拖欠貸款者屬于分類的結果。

   假設現在來看有房情況這個屬性,那么按照它劃分后的Gini指數計算如下

 CART算法的原理是什么

   而對于婚姻狀況屬性來說,它的取值有3種,按照每種屬性值分裂后Gini指標計算如下

 CART算法的原理是什么

   最后還有一個取值連續的屬性,年收入,它的取值是連續的,那么連續的取值采用分裂點進行分裂。如下

 CART算法的原理是什么

   根據這樣的分裂規則CART算法就能完成建樹過程。

   建樹完成后就進行第二步了,即根據驗證數據進行剪枝。在CART樹的建樹過程中,可能存在Overfitting,許多分支中反映的是數據中的異常,這樣的決策樹對分類的準確性不高,那么需要檢測并減去這些不可靠的分支。決策樹常用的剪枝有事前剪枝和事后剪枝,CART算法采用事后剪枝,具體方法為代價復雜性剪枝法。

“CART算法的原理是什么”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

昭平县| 邛崃市| 郯城县| 伊宁市| 舞阳县| 镇宁| 田东县| 宁德市| 永清县| 永丰县| 大理市| 余庆县| 葵青区| 巴马| 绥滨县| 榆树市| 永新县| 惠安县| 保康县| 中方县| 汶上县| 安远县| 阿拉善盟| 卢氏县| SHOW| 治多县| 长岛县| 蛟河市| 华坪县| 仪征市| 泽普县| 南安市| 石河子市| 胶南市| 平邑县| 麦盖提县| 兴文县| 东兰县| 瓦房店市| 本溪| 宁海县|