您好,登錄后才能下訂單哦!
本篇文章為大家展示了R語言中編輯器的相關性分析是怎樣的,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
R語言中cor函數,只能計算相關系數,如果想要計算顯著性,需要兩兩用cor.test
進行,如果是多列數據,操作比較麻煩。這里介紹兩個包,非常方便的進行多列數據的相關系數及其顯著性的檢驗,并且給出可視化。
這里模擬出10列數據,轉化為數據庫,是100行10列的數據,目的是為了計算這10列的相關系數及其顯著性,雖然隨機數沒有顯著性可言,但是作為一個演示,還是很可以說明問題的。
> set.seed(123)
> dd = as.data.frame(matrix(rnorm(1000),100,10))
> head(dd)
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1 -0.56047565 -0.71040656 2.1988103 -0.7152422 -0.07355602 -0.60189285 1.07401226 -0.7282191 0.3562833 -1.0141142
2 -0.23017749 0.25688371 1.3124130 -0.7526890 -1.16865142 -0.99369859 -0.02734697 -1.5404424 -0.6580102 -0.7913139
3 1.55870831 -0.24669188 -0.2651451 -0.9385387 -0.63474826 1.02678506 -0.03333034 -0.6930946 0.8552022 0.2995937
4 0.07050839 -0.34754260 0.5431941 -1.0525133 -0.02884155 0.75106130 -1.51606762 0.1188494 1.1529362 1.6390519
5 0.12928774 -0.95161857 -0.4143399 -0.4371595 0.67069597 -1.50916654 0.79038534 -1.3647095 0.2762746 1.0846170
6 1.71506499 -0.04502772 -0.4762469 0.3311792 -1.65054654 -0.09514745 -0.21073418 0.5899827 0.1441047 -0.6245675
首先要載入Hmisc
這個包,因為我們要用這個包里面的rcorr
函數,如果沒有這個包,那就運行命令install.packages("Hmisc")
安裝即可。
?題外話,這種藍色的代碼高亮,真是太好看了,我進而想到王者榮耀的皮膚那么多人購買真的是有很多人在乎顏值的,進而推測出我鉆石五星段位的持久性與我沒有氪金有很強的關聯性,因為充錢的快樂只能N連勝的喜悅才可以體會。順便說一句,當你N連跪之后就把游戲卸了洗洗睡吧,我今天都把騰訊的企業微信給投訴了,是截圖投訴的,然后領導告訴我“知道為什么騰訊把你公眾號封一個月吧?打游戲不氪金還瞎比比。。。”
?
> # 計算相關系數及顯著性
> library(Hmisc)#加載包
> res2 <- rcorr(as.matrix(dd))
> res2
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
V1 1.00 -0.05 -0.13 -0.04 -0.19 -0.06 -0.03 0.18 -0.02 0.01
V2 -0.05 1.00 0.03 0.04 -0.13 0.11 0.08 -0.03 -0.05 -0.09
V3 -0.13 0.03 1.00 -0.04 -0.02 0.02 0.01 -0.12 -0.05 -0.01
V4 -0.04 0.04 -0.04 1.00 -0.02 -0.09 -0.06 0.17 -0.17 0.25
V5 -0.19 -0.13 -0.02 -0.02 1.00 0.21 -0.01 -0.14 -0.04 -0.02
V6 -0.06 0.11 0.02 -0.09 0.21 1.00 -0.06 0.09 0.07 -0.03
V7 -0.03 0.08 0.01 -0.06 -0.01 -0.06 1.00 0.00 -0.13 -0.02
V8 0.18 -0.03 -0.12 0.17 -0.14 0.09 0.00 1.00 0.00 0.02
V9 -0.02 -0.05 -0.05 -0.17 -0.04 0.07 -0.13 0.00 1.00 -0.02
V10 0.01 -0.09 -0.01 0.25 -0.02 -0.03 -0.02 0.02 -0.02 1.00
n= 100
P
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
V1 0.6246 0.2002 0.6632 0.0547 0.5767 0.7343 0.0706 0.8234 0.9135
V2 0.6246 0.7626 0.6650 0.1952 0.2567 0.4398 0.7435 0.6543 0.3653
V3 0.2002 0.7626 0.6576 0.8061 0.8573 0.9317 0.2544 0.5985 0.8866
V4 0.6632 0.6650 0.6576 0.8492 0.3737 0.5284 0.0950 0.1008 0.0139
V5 0.0547 0.1952 0.8061 0.8492 0.0392 0.9488 0.1628 0.6958 0.8741
V6 0.5767 0.2567 0.8573 0.3737 0.0392 0.5225 0.3515 0.4622 0.8046
V7 0.7343 0.4398 0.9317 0.5284 0.9488 0.5225 0.9979 0.2012 0.8398
V8 0.0706 0.7435 0.2544 0.0950 0.1628 0.3515 0.9979 0.9936 0.8107
V9 0.8234 0.6543 0.5985 0.1008 0.6958 0.4622 0.2012 0.9936 0.8225
V10 0.9135 0.3653 0.8866 0.0139 0.8741 0.8046 0.8398 0.8107 0.8225
上面有相關系數,有對應的顯著性,但是R語言做完統計如果沒有可視化,就像吃完飯沒有喝湯,總感覺少了什么,那就可視化吧!
> library(PerformanceAnalytics)#加載包
> chart.Correlation(dd, histogram=TRUE, pch=19)
set.seed(123)
dd = as.data.frame(matrix(rnorm(1000),100,10))
head(dd)
# 計算相關系數及顯著性
library(Hmisc)#加載包
res2 <- rcorr(as.matrix(dd))
res2
# 可視化
library(PerformanceAnalytics)#加載包
chart.Correlation(dd, histogram=TRUE, pch=19)
上述內容就是R語言中編輯器的相關性分析是怎樣的,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。