您好,登錄后才能下訂單哦!
logistic回歸應用的常見問題有哪些,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
二元logistic回歸分析
注意,OR的應用及解釋存在以下誤區
1)認為OR> 1代表為危險因素,OR<1代表為保護因素。事實上,OR代表應變量與自變量之間聯系的強度,需要根據研究結局進行專業意義的解釋。
如果研究結局是正性事件,如疾病治愈、生存,則OR>1代表為促進疾病治愈、促進生存的保護因素,而OR<1代表為不利于正性事件的危險因素;
當研究結局為負性事件,如疾病發生、進展、死亡等,則OR> 1代表為危險因素,OR<1代表為保護因素。
2)將OR與相對危險度(relative.risk,RR)含義混淆。RR是暴露組與未暴露組的研究結局發生率之比,它是一個比值,代表暴露于某個因素的研究結局發生率是未暴露組的多少倍。而OR是優勢比,可以理解為工;每改變一個單位時,研究結局的發生風險改變量。只有發生率很低的研究結局,即P很小時,OR才近似等于RR。
【在Logistic回歸中 設置啞變量】
Logistic回歸中最常見的自變量類型為多分類變量,如分娩方式分為順產、難產、剖腹產,嬰兒喂養方式分為母乳喂養、混合喂養、人工喂養。有些研究者將多分類自變量誤作為連續型變量引人Logistic模型進行分析,這意味著該變量各:相鄰分類水平間是等距的,顯然不符合實際邏輯。例如,有研究對合肥市城區低出生體重兒影響因素的Logistic回歸分析中,原作者將“父親職業”這個分類變量分為“體力勞動”、“體力兼腦力勞動”、“腦力勞動三個分類水平,進行Logistic回歸分析時卻將該變量作為有序分類(等級)變量賦值為各分類水平的得分,按連續變量進行處理欠妥。
此外,如果研究者想觀察分類變量的各暴露水平對研究結局的影響,也可以將有m個分類水平的變量轉變為m個啞變量(取值0或1),每個啞變量分別代表有無該水平的暴露(取值1代表有,取值0代表無)。例如,有研究對兒童慢性胃炎、消化性潰瘍致病危險因素的Logistic回歸分析中,對于膳食模式這個3分類變量(喜愛蔬菜/水果/肉食),可轉變為3個啞變量(分別表示“是否喜愛蔬菜”、“是否喜愛水果”、“是否喜愛肉食”)。
Logistic回歸模型建立時,如自變量較多,可采用逐步回歸法進行變量篩選。不同的篩選方法有時會產生不同的模型。判斷某個變量是否顯著以及作用大小,與模型中所包含的變量有關。實際工作中衡量某些變量是.否選人模型,需要考慮專業背景、研究目的、用以調整的某些重要混雜因素以及模型的可解釋性、節約性等。
【回歸分析最強總結】
變量的參照水平設置
實際工作中,有些論文作者在Logistic回歸模型的結果展示中只標注自變量中文名稱和回歸系數,未說明各變量的參照水平設置。在回歸系數的解釋上,也只說明自變量對研究結局是危險或保護因素,未考慮實際專業意義。
下圖能更清楚說明問題。父親肥胖的兒童更容易發生超重和肥胖,其風險是父親體重正常者的1. 976倍;而相較于出生體重≥4000g的兒童,出生體重在2500~4000g是兒童超重肥胖的保護因素。
關于logistic回歸應用的常見問題有哪些問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。