91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

R語言中的k折交叉驗證是怎樣的

發布時間:2021-11-22 09:30:23 來源:億速云 閱讀:389 作者:柒染 欄目:大數據

這篇文章給大家介紹R語言中的k折交叉驗證是怎樣的,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

 機器學習中需要把數據分為訓練集和測試集,因此如何劃分訓練集和測試集就成為影響模型效果的重要因素。本文介紹一種常用的劃分最優訓練集和測試集的方法——k折交叉驗證。

  • k折交叉驗證

K折交叉驗證(k-fold cross-validation)首先將所有數據分割成K個子樣本,不重復的選取其中一個子樣本作為測試集,其他K-1個樣本用來訓練。共重復K次,平均K次的結果或者使用其它指標,最終得到一個單一估測。

這個方法的優勢在于,保證每個子樣本都參與訓練且都被測試,降低泛化誤差。其中,10折交叉驗證是最常用的。

  • 實例代碼

在線性分類器與性能評價(R語言)中,我們將數據集隨機抽取70%作為訓練集,剩下30%作為測試集,通過線性回歸的方法進行預測,通過ROC和AUC評價模型效果。現在,我們使用k折交叉驗證的方法,選取最優的訓練集和測試集,建立線性分類器并評價模型效果。

1、數據導入并分組。導入數據,并使用caret包中的createFolds()函數,根據標簽列將數據分成10份 。

target.url <- 'https://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/sonar.all-data'

data <- read.csv(target.url,header = F) 

set.seed(17)  

require(caret)  

folds <- createFolds(y=data[,61],k=10)

2、選取最優訓練集與測試集。構建for循環,得到十次交叉驗證預測的AUC值。并紀錄取值最大的一組,作為最優的訓練集與測試集劃分。

library(pROC)

max=0  

num=0 

auc_value<-as.numeric()

for(i in 1:10){  

  fold_test <- data[folds[[i]],]   #取folds[[i]]作為測試集  

  fold_train <- data[-folds[[i]],]   # 剩下的數據作為訓練集    

  fold_pre <- lm(as.numeric(V61)~.,data=fold_train)  

  fold_predict <- predict(fold_pre,type='response',newdata=fold_test)  

  auc_value<- append(auc_value,as.numeric(auc(as.numeric(fold_test[,61]),fold_predict)))

}  

num<-which.max(auc_value)

print(auc_value)

10次auc取值結果如下:

 [1] 0.7636364 0.7474747 0.8484848 0.9363636 0.7272727 0.8454545 0.9181818 0.7454545 0.7979798

[10] 0.7916667

3、構建分類器并判斷模型效果。根據前一步的結果,使用最優劃分構建線性分類器并預測。繪制出測試集的ROC曲線。

fold_test <- data[folds[[num]],]   

fold_train <- data[-folds[[num]],]

fold_pre <- lm(as.numeric(V61)~.,data=fold_train)  

fold_predict <- predict(fold_pre,type='response',newdata=fold_test)

roc_curve <- roc(as.numeric(fold_test[,61]),fold_predict)

plot(roc_curve, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),

     grid.col=c("green", "red"), max.auc.polygon=TRUE,

     auc.polygon.col="skyblue", print.thres=TRUE,main="ROC curve for the set with the largest AUC value")


R語言中的k折交叉驗證是怎樣的


線性分類器與性能評價(R語言)中隨機選取訓練集和測試集,最終測試集的AUC值僅為0.755,而本次我們通過k折交叉驗證選取訓練集和測試集,測試集AUC值達到0.936,可以看出模型效果提升顯著。

關于R語言中的k折交叉驗證是怎樣的就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

佛冈县| 云龙县| 姚安县| 常宁市| 汾西县| 泗水县| 汉源县| 独山县| 彝良县| 敦煌市| 金秀| 同心县| 县级市| 佛教| 丹棱县| 柘城县| 鸡东县| 湟源县| 丰县| 旬邑县| 公主岭市| 丁青县| 正蓝旗| 安泽县| 宜章县| 南江县| 图木舒克市| 济宁市| 大名县| 辽中县| 沈阳市| 尤溪县| 滨州市| 三亚市| 应城市| 上高县| 石狮市| 洮南市| 宜春市| 静乐县| 天祝|