R語言如何實現分層抽樣Stratified

發布時間：2021-11-15 18:17:57 來源：億速云閱讀：1067 作者：柒染欄目：云計算

R語言如何實現分層抽樣Stratified ，針對這個問題，這篇文章詳細介紹了相對應的分析和解答，希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

1.觀察數據集

head(iris)

R語言如何實現分層抽樣Stratified
選取數據集中前6個數據，我們可以看出iris數據集一共有5個字段。

dim(iris)

R語言如何實現分層抽樣Stratified
iris數據集一共有150條數據，5個字段

summary(iris)

R語言如何實現分層抽樣Stratified
觀察各個變量的內容，可以看出前四個變量（Sepal.Length Sepal.Width Petal.Length Petal.Width）都是定量變量，而最后一個（Species）是定性變量，我們將依據最后一個變量作為分層抽樣的依據。

library(sampling)

載入分層抽樣的包sampling

n=round(3/5*nrow(iris)/3)

計算每一個種類的抽樣數目。這里我們按照每種“Species”抽取3/5個樣本進行抽樣。

sub_train=strata(iris,stratanames=("Species"),size=rep(n,3),method="srswor")head(sub_train)

stratanames參數是抽樣依據的變量，size參數是每個種類抽樣的數目，這里我們用上一步計算出來的n作為抽樣數目，method是抽樣方法，我們選擇srswor。

data_train=iris[sub_train$ID_unit,] data_test=iris[-sub_train$ID_unit,]

將抽樣結果分別定義為訓練集（data_train）和測試集（data_test)。

dim(data_train); dim(data_test)

R語言如何實現分層抽樣Stratified
觀察訓練集和測試集的字段和數據數目。符合我們的抽樣預期。

head(data_train);head(data_test)

R語言如何實現分層抽樣Stratified
觀察訓練集和測試集的前幾條數據。

data_train；data_test

查看總的抽樣結果，這里數據量太大不再給出。

write.csv(data_train,"C:/Users/cnrozh/Desktop/iris_data_train.csv")write.csv(data_test,"C:/Users/cnrozh/Desktop/iris_data_test.csv")

保存數據集

關于 R語言如何實現分層抽樣Stratified 問題的解答就分享到這里了，希望以上內容可以對大家有一定的幫助，如果你還有很多疑惑沒有解開，可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本