【摘要】近年來,我國肺癌發(fā)病率一直居高不下,研究肺癌病人的生存時間,幫助醫(yī)學(xué)工作者制定相應(yīng)的醫(yī)療方案就顯的尤為重要。我們隨機的調(diào)查了40名肺癌患者的生存資料,分別通過了逐步回歸模型和Logistic回歸模型,通過對兩種模型計算結(jié)果的比較,來說明逐步回歸也是很適合做患者的生存時間預(yù)測。通過對患者的生存時間進行了客觀地預(yù)測和控制,從定量的角度分析患者的生存時間,這對醫(yī)學(xué)工作者具有一定的借鑒作用。
【關(guān)鍵詞】Logistic回歸;肺癌;生存時間;逐步回歸
1.引言
在實際問題中,人們總是希望從對因變量y有影響的諸多變量中選擇一些變量作為自變量,應(yīng)用多元回歸分析的方法建立“最優(yōu)”回歸方程以便對因變量進行預(yù)報或控制。Logistic回歸的因變量可以是二分類[1],也可以是多分類,但是二分類的更為常用,也更加容易解釋,所以實際中最常用的就是二分類Logistic回歸。Logistic回歸模型主要在流行病學(xué)中較多[2],比較常用的情形是探索某疾病的危險因素,根據(jù)危險因素預(yù)測某疾病發(fā)生的概率,為醫(yī)學(xué)工作這提供一定的借鑒。本文中我們應(yīng)用了兩種回歸模型來進行生存時間預(yù)報,通過比較兩種模型的結(jié)果,來說明逐步回歸模型也是很適合做肺癌病人的生存時間預(yù)測的,從而做回歸預(yù)測時就不局限于Logistic回歸模型,從而為醫(yī)學(xué)上診斷病情提供了更加廣泛的預(yù)測方法。
2.兩種回歸模型
2.1 逐步回歸法
逐步回歸的基本思想是:對全部因子按其對y影響程度大小,從大到小地依次逐個地引入回歸方程,并隨時對全部變量進行檢驗,看其是否仍然顯著,如不顯著就將其剔除,直到回歸方程中所含的所有變量對y的作用都顯著是,才考慮引入新的變量。再在剩下的未選因子中,選出對y作用最大者,檢驗其顯著性,顯著著,引入方程,不顯著,則不引入。直到最后再沒有顯著因子可以引入,也沒有不顯著的變量需要剔除為止。
逐步回歸分析時在考慮的全部自變量中按其對y的貢獻程度大小,由大到小地逐個引入回歸方程,而對那些對y作用不顯著的變量可能是中不被引入回歸方程。另外,已被引入回歸方程的變量在引入新變量進行F檢驗后失去重要性時[3],需要從回歸方程中剔除出去。
4.結(jié)論
通過比較,兩種回歸模型所得到的結(jié)果幾乎是相同的。即:若患者的生活行動能力評分相同,當(dāng)時,鱗癌患者的生存時間大于等于200天的概率最大,為66.68006%;大型細(xì)胞癌患者生存時間大于等于200天的概率最小,為6.404569%;小型細(xì)胞癌患者、腺癌患者生存時間生存時間大于等于200天的概率分別是39.37706%和17.41164%,且鱗癌患者的生存概率是大型細(xì)胞癌患者生存概率的11倍。所以我們可以得到,逐步回歸也是很適合做流行病的預(yù)測和診斷。
參考文獻
[1]薛毅,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學(xué)出版社,2006:279-335.
[2]魏宗舒.概率與數(shù)理統(tǒng)計教程[M].高等教育出版社,1983.
[3]余錦華,楊維權(quán).多元統(tǒng)計分析與應(yīng)用[M].廣州:中山大學(xué)出版社,2005.
[4]Trevor Hastie,Robert Tibshirni,Jerhome Friedman.The Element of Statistical Learning Data Mining,Inference,and Prediction.Print5 edtion,2011.
[5]王斌會.多元統(tǒng)計分析及R語言建模[M].廣東:暨南大學(xué)出版社,2010:130-138.
[6]陳鋒.醫(yī)用多元統(tǒng)計分析方法[M].北京:中國衛(wèi)生統(tǒng)計出版社,2001:109-124.
作者簡介:孟凡秀(1986—),女,山東棗莊人,碩士研究生,主要從事運籌學(xué)、供應(yīng)鏈庫存管理方面的研究。