91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

R語言怎樣做Logistic回歸

發布時間:2021-11-22 15:26:38 來源:億速云 閱讀:404 作者:柒染 欄目:大數據

R語言怎樣做Logistic回歸,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

 Logistic回歸的應用場景

當因變量為二值型結果變量,自變量包括連續型和類別型的數據時,Logistic回歸是一個非常常用的工具。比如今天的例子中用到的婚外情數據 “Fair's Affairs”。因變量是是否有過婚外情,自變量有8個,分別是

  • 性別
  • 年齡
  • 婚齡
  • 是否有小孩
  • 宗教信仰程度 (5分制,1表示反對,5表示非常信仰)
  • 學歷
  • 職業 (逆向編號的戈登7種分類)這個是啥意思?)
  • 對婚姻的自我評分

因變量y是出軌次數,我們將其轉換成二值型,出軌次數大于等于1賦值為1,相反賦值為0

 

下面開始實際操作

這個數據集來自R語言包AER,如果要用這個數據集需要先安裝這個包

install.packages("AER")
 

然后使用data()函數獲取這個數據集

data(Affairs,package = "AER")
 

然后就可以在環境的窗口里看到如下R語言怎樣做Logistic回歸

這個數據集總共有601個觀察值,總共9個變量

 接下來是將變量y出軌次數,轉換成二值型
df<-Affairs
df$ynaffairs<-ifelse(df$affairs>0,1,0)
table(df$ynaffairs)
df$ynaffairs<-factor(df$ynaffairs,
                     levels = c(0,1),
                     labels = c("No","Yes"))table
table(df$ynaffairs)
   接下來是擬合模型

擬合模型用到的是glm()函數

fit.full<-glm(ynaffairs~gender+age+yearsmarried+
                children+religiousness+education+occupation+rating,
              data=df,family = binomial())
 

通過summary()函數查看擬合結果

summary(fit.full)
 
R語言怎樣做Logistic回歸  
image.png

根據回歸系數的P值可以看到 性別、是否有孩子、學歷、職業對方程的貢獻都不顯著。去除這些變量重新擬合模型

fit.reduced<-glm(ynaffairs~age+yearsmarried+
                religiousness+rating,
              data=df,family = binomial())
   接下來是使用anova()函數對它們進行比較,對于廣義線性回歸,可用卡方檢驗
anova(fit.full,fit.reduced,test = "Chisq")
 
R語言怎樣做Logistic回歸  
image.png

可以看到結果中p值等于0.2108大于0.05,表明四個變量和9個變量的模型你和程度沒有差別

 接下來是評價變量對結果概率的影響

構造一個測試集

testdata<-data.frame(rating=c(1,2,3,4,5),
                     age=mean(df$age),
                     yearsmarried=mean(df$yearsmarried),
                     religiousness=mean(df$religiousness)
 

預測概率

testdata$prob<-predict(fit.reduced,newdata = testdata,
                       type = "response")
   簡單的柱形圖對結果進行展示
library(ggplot2)
ggplot(testdata,aes(x=rating,y=prob))+
  geom_col(aes(fill=factor(rating)),show.legend = F)+
  geom_label(aes(label=round(prob,2)))+
  theme_bw()
 
R語言怎樣做Logistic回歸  
image.png

從這些結果可以看到,當婚姻評分從1(很不幸福)變為5(非常幸福)時,婚外情概率從0.53降低到了0.15。模型的預測結果和我們的經驗還挺符合的

關于R語言怎樣做Logistic回歸問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

琼海市| 微山县| 方城县| 镇远县| 灵宝市| 贵定县| 沙雅县| 昌黎县| 广昌县| 合山市| 陆川县| 康马县| 信宜市| 无棣县| 郎溪县| 定西市| 德阳市| 吉安市| 东丰县| 砚山县| 临湘市| 石景山区| 富阳市| 唐山市| 安顺市| 新民市| 高平市| 长丰县| 翁牛特旗| 东兰县| 泗洪县| 彭阳县| 湘乡市| 三穗县| 石阡县| 古蔺县| 大余县| 星子县| 纳雍县| 绥宁县| 通城县|