您好,登錄后才能下訂單哦!
這篇文章主要介紹“R語言多元線性回歸是什么及如何實現”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“R語言多元線性回歸是什么及如何實現”文章能幫助大家解決問題。
一元線性回歸是一個主要影響因素作為自變量來解釋因變量的變化,在現實問題研究中,因變量的變化往往受幾個重要因素的影響,此時就需要用兩個或兩個以上的影響因素作為自變量來解釋因變量的變化,這就是多元回歸亦稱多重回歸。當多個自變量與因變量之間是線性關系時,所進行的回歸分析就是多元線性回歸。
這里我使用的數據是包里面自帶的數據,我們導入并進行查看:
可以看到第一列是我們的數據標簽(無數學含義),后面五列分別為對應的五個特征即相應的數值。我的任務是使用后四個變量來擬合第一個變量"Murder"
在進行多元線性回歸之前,通常需要對變量進行相關性分析,例如:我們想用x, y 兩個變量來擬合變量 z, 如果x, y相關性過強,則我們只需要其中一個變量就可以擬合z,這就是我們學的多重共線性。因此,我使用 cor 函數查看相關性,如下圖所示:
由于相關性矩陣并不直觀,因此我使用散點矩陣圖來可視化此關系,R語言代碼及可視化結果如下(其中我使用了smoother平滑方法):
下面使用 lm 函數進行多元線性回歸,代碼及運行截圖如下:
可以發現運行結果中有兩個變量被打了 “”, 分別為"Population" 和 “Illiteracy”,其中""越多表示越顯著,即 p 值越小,R-squared為0.567,效果不是特別理想,說明可能存在多重共線性或者變量間存在交互作用,接下來我使用mtcars數據集來進行實現(在R語言中使用冒號表示將兩個因變量交互):
然后我是用plot函數對多個參數進行可視化,代碼及運行截圖如下:
可見,wt越大,mpg和hp的線性關系越來越小(在上例中),因此我們可以認為設定多個值,尋找最佳的擬合方程。
關于“R語言多元線性回歸是什么及如何實現”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識,可以關注億速云行業資訊頻道,小編每天都會為大家更新不同的知識點。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。