您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關R語言匯總統計中怎么批量計算不同因素不同水平的平均值,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
實際工作中,我們需要對數據進行平均值計算,這里我比較了aggregate
和data.table
的方法,測試主要包括:
1,對數據yield計算平均值
2,計算N不同水平的平均值
3, 計算N和P不同水平的平均值
1. 常規方法aggregate
代碼:
data(npk)
head(npk)
aggregate(yield~N,data=npk,FUN = mean)
aggregate(yield~N+P,data=npk,FUN = mean)
結果
> aggregate(yield~N,data=npk,FUN = mean)
N yield
1 0 52.06667
2 1 57.68333
> aggregate(yield~N+P,data=npk,FUN = mean)
N P yield
1 0 0 51.71667
2 1 0 59.21667
3 0 1 52.41667
4 1 1 56.15000
2. 使用data.table方法
代碼:
data(npk)
head(npk)
library(data.table)
setDT(npk)
# 單個變量
npk[,mean(yield),by=N]
# 兩個變量
npk[,mean(yield),by=c("N","P")]
# 兩個變量的另一種寫法
npk[,mean(yield),by=list(N,P)]
npk[,mean(yield),by=.(N,P)]
結果:
> # 單個變量
> npk[,mean(yield),by=N]
N V1
1: 0 52.06667
2: 1 57.68333
>
> # 兩個變量
> npk[,mean(yield),by=c("N","P")]
N P V1
1: 0 1 52.41667
2: 1 1 56.15000
3: 0 0 51.71667
4: 1 0 59.21667
>
>
> # 兩個變量的另一種寫法
> npk[,mean(yield),by=list(N,P)]
N P V1
1: 0 1 52.41667
2: 1 1 56.15000
3: 0 0 51.71667
4: 1 0 59.21667
> npk[,mean(yield),by=.(N,P)]
N P V1
1: 0 1 52.41667
2: 1 1 56.15000
3: 0 0 51.71667
4: 1 0 59.21667
關于“R語言匯總統計中怎么批量計算不同因素不同水平的平均值”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。