蔡俊娟
(廈門海洋職業(yè)技術(shù)學(xué)院基礎(chǔ)部,福建廈門 361000)
廣義線性模型描述一個響應(yīng)變量的均值與一個自變量的關(guān)系,這個關(guān)系可以比線性模型中EYi=α+βx復(fù)雜得多。很多不同的模型可以表示為GLM,有一種非常有用的GLM就是Logistic回歸模型。Logistic回歸分析是一種非常有效的處理數(shù)據(jù)的方法,特別是在醫(yī)學(xué)、社會調(diào)查等領(lǐng)域被廣泛應(yīng)用。但是在現(xiàn)有的統(tǒng)計教科書中,一般都只有對Logistic回歸模型的簡單介紹,并作為中心內(nèi)容,缺乏有關(guān)該模型的詳盡分析及深入的討論。其中文獻[3]只對理論部分進行分析,未結(jié)合實際應(yīng)用案例進行解釋說明。
假設(shè)響應(yīng)變量Y1,Y2,…,Yn是獨立的,并且Yi·Bernoulli(πi)。我們知道Bernoulli是指數(shù)分布族,再假設(shè)πi滿足
從而我們建立了πi與x之間的關(guān)系。在(1)式中,左邊是Yi成功勝率的對數(shù)。這個模型假定對數(shù)勝率是預(yù)測變量x的線性函數(shù)。那么Bernoulli概率密度函數(shù)可以寫成如下的指數(shù)形式:
對于方程(1)式,我們可以重新寫為:
或者是更一般的形式:
由于
所以,從式(5)中我們可以發(fā)現(xiàn),當β是正數(shù)時,π(x)嚴格遞增函數(shù);當β是負數(shù)時,π(x)嚴格遞減函數(shù);特別地,β是0時,,則為簡單的線性回歸模型。
我們可以計算一下在x和x+1處可以得到:對于任何x,
則β表示是當x增加一個單位時,成功的對數(shù)勝率的相應(yīng)變化。在簡單線性回歸模型中,β是當x增加一個單位時,Y的均值的相能變化。接下來,將式(5)兩邊取指數(shù)可以得到:,也就是說,eβ是指x+1處成功的勝率相對于x處成功的勝率的優(yōu)比,也可以理解為相應(yīng)于x的單位增量的成功勝率的變化倍數(shù)。
在研究醫(yī)院搶救急性心肌梗死(AMI)病人能否成功的危險因素調(diào)查中,某醫(yī)院收集了5年里該院所有AMI病人的搶救病史,共190例。其中Y=0表示搶救成功,Y=1表示搶救未能成功而死亡;x1=1表示搶救前已發(fā)生休克,x1=0表示搶救前未發(fā)生過休克;x2=1表示搶救前發(fā)生心力衰竭,x2=0表示搶救前未發(fā)生心力衰竭;x3=1表示病人從開始AMI癥狀到搶救時已超過12小時(即未能及時把病人送往醫(yī)院),x3=0表示病人從有AMI癥狀到搶救時未超過12小時。
表1 搶救急性心肌梗死病人能否成功數(shù)據(jù)表
利用SPSS軟件,對于上述數(shù)據(jù)進行分析。
3.2.1 模型系數(shù)的綜合檢驗
表2 模型系數(shù)的綜合檢驗
從表2中,可以發(fā)現(xiàn):模型χ2=21,354,p=0.000<0.1,按α=0.05水準,認為自變量x1(搶救前是否發(fā)生休克),x2(搶救前是否心力衰竭),與因變量P(是否搶救成功)的Logistic回歸方程有統(tǒng)計學(xué)意義。
2.2.2 分類表從表3可以得到,結(jié)局為“0”,即搶救成功的患者正確率為90.7%,結(jié)局為“1”,即搶救不成功的患者判斷正確率為25%。對建模數(shù)據(jù)總的回判正確率真為69.8%,這說明模型的預(yù)測效果是相當不錯的,說明該模型較為穩(wěn)定,尤其是對搶救成功的患者的預(yù)測。
表3 分類表a
2.2.3 方程中的變量
表4 方程中的變量
從表4可以發(fā)現(xiàn):x1、x2、x3的Wald值分別為13.356、2.764、5.180,但是再觀察這3個變量的P值,x1的P值為0.000(P<0.01),從而可以得到,按水準α=0.05水準,x1與Y有顯著性關(guān)系;x2的P值為0.096(P>0.05),從而可以得到,按α=0.05水準,x2與Y有無顯著性關(guān)系;x3的P值為0.023(P<0.05),從而可以得到,按α=0.05水準,x3與Y有顯著性關(guān)系。3個因素所建立的Logistic回歸方程如下:
通過二項Logistic回歸分析可以得到結(jié)論,醫(yī)院搶救急性心肌梗死(AMI)患者能否成功與該患者搶救前是否發(fā)生休克以及該患者在搶救時是否已超過12小時是顯著相關(guān)的。從而,在今后的AMI搶救中,要及時將患者送往醫(yī)院,這是影響搶救效果的重要因素。
[1]George,Casella.統(tǒng)計推斷[M].2版.北京:機械工業(yè)出版社,2010:548-553.
[2]李志輝,羅平等.統(tǒng)計分析教程[M].北京:電子工業(yè)出版社,2010:380-381.
[3]施朝健,張明銘.Logtistic回歸模型分析[J].計算機輔助工程,2005,14(3):74-78.