91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

R語言分類算法的集成學習指的是什么

發布時間:2021-11-22 10:50:52 來源:億速云 閱讀:120 作者:柒染 欄目:云計算

R語言分類算法的集成學習指的是什么,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

1.集成學習(Bootstrap Aggregating)原理分析:
Bagging是Bootstrap Aggregating的縮寫,簡單來說,就是通過使用boostrap抽樣得到若干不同的訓練集,以這些訓練集分別建立模型,即得到一系列的基分類器,這些分類器由于來自不同的訓練樣本,他們對同一測試集的預測效果不一樣.因此,Bagging算法隨后對基分類器的一系列預測結果進行投票(分類問題)和平均(回歸問題),從而得到每一個測試集樣本的最終預測結果,這一集成后的結果往往是準確而穩定的.
比如現在基分類器1至10,他們對某樣本的預測結果分別為類別1/2/1/1/1/1/2/1/1/2,則Bagging給出的最終結果為”該樣本屬于類別1”,因為大多數基分類器將票投給了1.
AdaBoost(Adaptive Boosting)相對于Bagging算法更為巧妙,且一般來說是效果更優的集成分類算法,尤其在數據集分布不均衡的情況下,其優勢更為顯著.該算法的提出先于Bagging,但在復雜度和效果上高于Bagging.
AdaBoost同樣是在若干基分類器基礎上的一種集成算法,但不同于Bagging對一系列預測結果的簡單綜合,該算法在依次構建基分類器的過程中,會根據上一個基分類器對各訓練集樣本的預測結果,自行調整在本次基分類器構造時,個樣本被抽中的概率.具體來說,如果在上一基分類器的預測中,樣本i被錯誤分類了,那么,在這一次基分類器的訓練樣本抽取過程中,樣本i就會被賦予較高的權重,以使其能夠以較大的可能被抽中,從而提高其被正確分類的概率.
這樣一個實時調節權重的過程正是AdaBoost算法的優勢所在,它通過將若干具有互補性質的基分類器集合于一體,顯著提高了集成分類器的穩定性和準確性.另外,Bagging和AdaBoost的基分類器選取都是任意的,但絕大多數我們使用決策樹,因為決策樹可以同時處理數值/類別/次序等各類型變量,且變量的選擇也較容易.
R語言分類算法的集成學習指的是什么
2.在R語言中的應用
集成學習算法主要運用到了adabag包中的bossting函數。
bossting(formula,data,boos=TRUE,mfinal=100,coeflearn=’Breiman’,control)
3.以iris數據集為例進行分析
1)應用模型并查看模型的相應參數
fit_bag=bagging(Species~.,data_train,mfinal=5,control=rpart.control(maxdepth=3))
fit_bag[1:length(bag)]
R語言分類算法的集成學習指的是什么
R語言分類算法的集成學習指的是什么
2)預測分析
pre_bag=predict(fit_bag,data_test)
R語言分類算法的集成學習指的是什么

看完上述內容,你們掌握 R語言分類算法的集成學習指的是什么的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

邵阳市| 寿光市| 鹿邑县| 平昌县| 山西省| 乐安县| 柘城县| 寿光市| 二连浩特市| 东乌珠穆沁旗| 灌云县| 延川县| 松滋市| 姚安县| 梨树县| 宜城市| 革吉县| 北川| 平湖市| 蓝山县| 瓦房店市| 襄城县| 三台县| 临沧市| 大渡口区| 临潭县| 湄潭县| 波密县| 西峡县| 五原县| 黎城县| 丰原市| 叙永县| 荣成市| 阜康市| 南漳县| 永济市| 阳东县| 洪洞县| 德阳市| 玉门市|