您好,登錄后才能下訂單哦!
其中包括Hmisc、pastecs和psych。由于這些包并未包括在基礎安裝中。
> library(Hmisc)
> describe(mtcars[vars])
mtcars[vars]
3 Variables 32 Observations
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
mpg
n missing unique Info Mean .05 .10 .25 .50 .75 .90 .95
32 0 25 1 20.09 12.00 14.34 15.43 19.20 22.80 30.09 31.30
lowest : 10.4 13.3 14.3 14.7 15.0, highest: 26.0 27.3 30.4 32.4 33.9
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
hp
n missing unique Info Mean .05 .10 .25 .50 .75 .90 .95
32 0 22 1 146.7 63.65 66.00 96.50 123.00 180.00 243.50 253.55
lowest : 52 62 65 66 91, highest: 215 230 245 264 335
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
wt
n missing unique Info Mean .05 .10 .25 .50 .75 .90 .95
32 0 29 1 3.217 1.736 1.956 2.581 3.325 3.610 4.048 5.293
lowest : 1.513 1.615 1.835 1.935 2.140, highest: 3.845 4.070 5.250 5.345 5.424
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
>
--------------------------------------------------------------------
包中有一個名為stat.desc()的函數,它可以計算種類繁多的描述性統計量。使用
格式為:
> stat.desc(mtcars[vars],basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)
其中的x是一個數據框或時間序列。若basic=TRUE(默認值),則計算其中所有值、空值、缺失
值的數量,以及最小值、最大值、值域,還有總和。若desc=TRUE(同樣也是默認值),則計算
中位數、平均數、平均數的標準誤、平均數置信度為95%的置信區間、方差、標準差以及變異系
數。最后,若norm=TRUE(不是默認的),則返回正態分布統計量,包括偏度和峰度(以及它們
的統計顯著程度)和Shapiro–Wilk正態檢驗結果。這里使用了p值來計算平均數的置信區間(默
認置信度為0.95)
> library(pastecs)
> stat.desc(mtcars[vars])
mpg hp wt
nbr.val 32.0000000 32.0000000 32.0000000
nbr.null 0.0000000 0.0000000 0.0000000
nbr.na 0.0000000 0.0000000 0.0000000
min 10.4000000 52.0000000 1.5130000
max 33.9000000 335.0000000 5.4240000
range 23.5000000 283.0000000 3.9110000
sum 642.9000000 4694.0000000 102.9520000
median 19.2000000 123.0000000 3.3250000
mean 20.0906250 146.6875000 3.2172500
SE.mean 1.0654240 12.1203173 0.1729685
CI.mean.0.95 2.1729465 24.7195501 0.3527715
var 36.3241028 4700.8669355 0.9573790
std.dev 6.0269481 68.5628685 0.9784574
coef.var 0.2999881 0.4674077 0.3041285
------------------------------------------------
library(psych)
describe(mtcars[vars])
vars n mean sd median trimmed mad min max range skew kurtosis se
mpg 1 32 20.09 6.03 19.20 19.70 5.41 10.40 33.90 23.50 0.61 -0.37 1.07
hp 2 32 146.69 68.56 123.00 141.19 77.10 52.00 335.00 283.00 0.73 -0.14 12.12
wt 3 32 3.22 0.98 3.33 3.15 0.77 1.51 5.42 3.91 0.42 -0.02 0.17
在前面的示例中,psych包和Hmisc包均提供了名為describe()的函數。R如何知道該
使用哪個呢?簡言之,如代碼清單7-5所示,最后載入的程序包優先。在這里,psych在
Hmisc之后被載入,然后顯示了一條信息,提示Hmisc包中的describe()函數被psych
包中的同名函數所屏蔽(masked)。鍵入describe()后,R在搜索這個函數時將首先找
到psych包中的函數并執行它。如果你想改而使用Hmisc包中的版本,可以鍵入
Hmisc::describe(mt)。這個函數仍然在那里。你只是需要給予R更多信息以找到它
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。