徐州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(221004) 劉 兵 李 蘋(píng) 朱玫燁 黃水平
胃癌是危害人類(lèi)健康的消化道惡性腫瘤之一,世界胃癌的高發(fā)地區(qū)為亞洲,我國(guó)胃癌的年新發(fā)病率占世界總發(fā)病率的42%[1],且胃癌患者的生存率較低[2]。由于胃癌的發(fā)生發(fā)展受多方面因素的影響[3],故影響胃癌預(yù)后的因素逐漸成為研究的重點(diǎn)。傳統(tǒng)的影響因素分析多是采用了logistic回歸分析,該分析方法作為分析影響因素有效的統(tǒng)計(jì)學(xué)方法,有效的展現(xiàn)了因變量和自變量之間的數(shù)量依存關(guān)系,同時(shí)考慮自變量是否對(duì)因變量構(gòu)成交互作用,但當(dāng)自變量較多時(shí),回歸模型中要考慮交互作用很難真正實(shí)現(xiàn)。決策樹(shù)模型已經(jīng)廣泛應(yīng)用于經(jīng)濟(jì)領(lǐng)域[4-5]。針對(duì)傳統(tǒng)的回歸模型的局限性,決策樹(shù)模型能有效的解決,本文將決策樹(shù)模型應(yīng)用于流行病學(xué)資料,比較并結(jié)合logistic回歸分析的結(jié)果,以期望更好的對(duì)胃癌高危人群實(shí)施干預(yù),提高胃癌高危人群的生存率。
1.研究對(duì)象
干預(yù)對(duì)象為2012年6月至2015年6月課題組前期人工神經(jīng)網(wǎng)絡(luò)模型篩查出的胃癌高危人群,共111名病例[6]。納入標(biāo)準(zhǔn)為:①35~75歲的當(dāng)?shù)爻W【用?,②自愿參加胃鏡復(fù)檢者;排除標(biāo)準(zhǔn)為:①確診的胃癌患者,②妊娠期婦女,③嚴(yán)重智障或語(yǔ)言交流障礙者,④患有胃鏡禁忌癥者,嚴(yán)重感冒、心臟疾病等。
2.研究方法
(1)資料收集
胃鏡初次檢查及檢查結(jié)束6個(gè)月后分別進(jìn)行干預(yù)前和干預(yù)后的問(wèn)卷調(diào)查。對(duì)于未參與復(fù)查者采用電話(huà)訪問(wèn)的方式進(jìn)行評(píng)估。調(diào)查問(wèn)卷采用本課題前期臨床病例對(duì)照研究所制定的調(diào)查表,調(diào)查內(nèi)容主要包括基本情況,飲食習(xí)慣,生活狀況及健康檢查等,以胃鏡檢查結(jié)果情況改變?yōu)橐蜃兞?1好轉(zhuǎn),2無(wú)效)。
(2)建立決策樹(shù)模型
將影響胃癌高危人群干預(yù)效果的影響因素進(jìn)行CHAID算法分析,分類(lèi)規(guī)則:分割顯著性水準(zhǔn)αmerge=αsplit=0.05;決策樹(shù)生長(zhǎng)層數(shù)為3層,停止規(guī)則為α=0.05,母節(jié)點(diǎn)最小樣本量為50,子節(jié)點(diǎn)為10。
(3)建立logistic回歸模型
將影響胃癌高危人群干預(yù)效果的影響因素采用Forward Stepwise(Wald)方法建立非條件logistic回歸模型。
3.統(tǒng)計(jì)學(xué)處理
采用EpiData 3.1進(jìn)行調(diào)查表資料的雙份錄入,建立數(shù)據(jù)庫(kù)。用構(gòu)成比、率描述數(shù)據(jù)。采用卡方分析、秩和檢驗(yàn)進(jìn)行單因素分析,對(duì)于有統(tǒng)計(jì)學(xué)意義的自變量分別建立CHAID決策樹(shù)模型和logistic回歸模型,分析并比較兩種方法的分析結(jié)果,檢驗(yàn)水準(zhǔn)α=0.05。
1.基本情況
本次評(píng)價(jià)共調(diào)查111例胃癌高危病例,男性50例(45.05%),女性61例(54.95%),平均年齡為(54.96±9.88)歲。
2.影響胃癌高危人群干預(yù)效果的單因素分析
以胃鏡檢查結(jié)果改變情況為因變量(好轉(zhuǎn),無(wú)效)進(jìn)行單因素分析,結(jié)果表明:年齡、健康教育頻率、三餐情況、燒烤類(lèi)食物攝入頻率、是否喜歡食用蘿卜、是否經(jīng)常生氣、幽門(mén)螺旋桿菌(HP)感染轉(zhuǎn)歸情況等因素有統(tǒng)計(jì)學(xué)意義,見(jiàn)表1。
表1 單因素分析結(jié)果
續(xù)表1 單因素分析結(jié)果
3.影響胃癌高危人群干預(yù)效果的多因素logistic回歸分析
將單因素分析有統(tǒng)計(jì)學(xué)意義的變量進(jìn)行二分類(lèi)非條件logistic回歸分析,變量賦值見(jiàn)表2。結(jié)果顯示:健康教育頻率、三餐情況、是否喜歡食用蘿卜、HP感染轉(zhuǎn)歸情況等變量有統(tǒng)計(jì)學(xué)意義,經(jīng)常參加健康教育、喜歡食用蘿卜是干預(yù)效果的保護(hù)因素,三餐情況不規(guī)律、HP感染轉(zhuǎn)歸情況加重為危險(xiǎn)因素,見(jiàn)表3。Hosmer & Lemeshow檢驗(yàn)χ2=5.629,P=0.689, 說(shuō)明模型能夠較好地?cái)M合數(shù)據(jù)。
表2 變量賦值表
表3 多因素logistic回歸分析結(jié)果
4.CHAID決策樹(shù)模型分析影響胃癌高危人群干預(yù)效果的因素
按照上述設(shè)置的參數(shù),產(chǎn)生的終末結(jié)點(diǎn)規(guī)則見(jiàn)表4。模型的判斷準(zhǔn)確率80.2%,說(shuō)明所建立模型的預(yù)測(cè)準(zhǔn)確率較高。在入選的7個(gè)變量中,HP感染轉(zhuǎn)歸情況、是否喜歡食用蘿卜、三餐情況是決策樹(shù)中影響胃癌高危人群干預(yù)效果的變量。劃分第一層為HP感染轉(zhuǎn)歸情況,表明HP感染轉(zhuǎn)歸情況與干預(yù)效果的相關(guān)性最高,在HP感染轉(zhuǎn)歸好轉(zhuǎn)的高危人群的干預(yù)效果好轉(zhuǎn)占70%,干預(yù)無(wú)效的占30%。在HP感染轉(zhuǎn)歸無(wú)效和加重的高危人群中,喜歡食用胡蘿卜的高危人群的干預(yù)好轉(zhuǎn)占64.3%,干預(yù)無(wú)效占35.7%,三餐規(guī)律的不喜歡食用蘿卜的高危人群干預(yù)好轉(zhuǎn)占19.6%,干預(yù)無(wú)效占80.4%,而三餐不規(guī)律和偶爾的高危人群的干預(yù)效果好轉(zhuǎn)為0.0%,干預(yù)無(wú)效達(dá)到100.0%,見(jiàn)圖1。該模型估計(jì)風(fēng)險(xiǎn)為0.198,標(biāo)準(zhǔn)誤為0.038。
5.兩種模型分析結(jié)果的比較
兩種模型的分析結(jié)果顯示,年齡、燒烤類(lèi)食物、是否經(jīng)常生氣在兩方法中均被排除,均顯示此三種因素均不是胃癌高危人群干預(yù)效果的影響因素。logistic回歸模型中的影響因素包括健康教育頻率,然而在決策樹(shù)模型中被剔除。展現(xiàn)了兩模型的不同之處,從兩方法的不同結(jié)果可知,logistic回歸模型表達(dá)了變量的依存關(guān)系,而決策樹(shù)考慮到了變量間的交互及關(guān)系,詳細(xì)的顯示出變量在各亞類(lèi)中的作用形式,提供了豐富的信息。
表4 干預(yù)效果影響因素的分類(lèi)規(guī)則(%)
圖1
CHAID決策樹(shù)模型與logistic回歸模型對(duì)干預(yù)效果的評(píng)價(jià)效能比較,CHAID模型評(píng)價(jià)預(yù)后好轉(zhuǎn)的AUC為0.814(95%CI0.730~0.898),靈敏度為85.7%,特異度為67.6%,logistic回歸模型評(píng)價(jià)預(yù)后好轉(zhuǎn)的AUC為0.849(95%CI0.771~0.927),靈敏度為76.%,特異度為76.5%,兩模型曲線(xiàn)下面積接近,說(shuō)明兩者的評(píng)價(jià)效能相近,且決策樹(shù)模型靈敏度較高,logistic回歸模型的特異度較高,二者結(jié)合,將更加有助于找出影響干預(yù)效果的因素。
綜合兩模型的分析結(jié)果顯示,健康教育頻率、三餐情況、是否喜歡食用蘿卜、HP感染轉(zhuǎn)歸情況是胃癌高危人群胃病干預(yù)效果的影響因素,其中經(jīng)常參加健康教育以及喜歡食用蘿卜是胃癌干預(yù)效果的保護(hù)因素,三餐情況不規(guī)律以及HP感染轉(zhuǎn)歸情況加重是胃癌干預(yù)效果的危險(xiǎn)因素。
1.保護(hù)因素
經(jīng)常參加健康教育是胃癌高危人群胃癌干預(yù)效果的保護(hù)因素[7],參加健康教育人群可以對(duì)自身的疾病有更清醒的認(rèn)識(shí),對(duì)于某些危害自身健康的不良生活方式、飲食習(xí)慣等,通過(guò)不斷的認(rèn)知學(xué)習(xí),可以有效的控制生活中這種不良行為的發(fā)生。本研究還注意到,喜歡食用蘿卜是胃癌高危人群胃癌干預(yù)效果的保護(hù)因素[8],是因?yàn)樘}卜中的β-胡蘿卜素,在體內(nèi)經(jīng)過(guò)代謝轉(zhuǎn)化,產(chǎn)生了增強(qiáng)機(jī)體免疫功能的維生素A,在預(yù)防上皮細(xì)胞癌變的過(guò)程中具有重要作用。
2.危險(xiǎn)因素
三餐情況不規(guī)律為胃癌干預(yù)效果的危險(xiǎn)因素[9],主要由于不規(guī)律、暴飲暴食等會(huì)加重胃的負(fù)擔(dān),引起胃酸的分泌紊亂,從而會(huì)影響胃黏膜,進(jìn)而加重胃部疾病。Correa等[10]在哥倫比亞的胃癌高發(fā)區(qū)進(jìn)行的一項(xiàng)852例HP感染的隨機(jī)對(duì)照干預(yù)研究在隨訪6年后發(fā)現(xiàn),根除HP后萎縮性胃炎和腸化生好轉(zhuǎn)的比例明顯增加,與對(duì)照組形成鮮明的對(duì)比;呂賓[11]對(duì)胃竇部萎縮患者隨訪三年后,發(fā)現(xiàn)HP根除者胃竇部萎縮評(píng)分明顯下降,而未進(jìn)行HP根除的對(duì)照組其評(píng)分并無(wú)明顯變化。我們的研究也表明,治療HP可以有效防止胃病的發(fā)生和發(fā)展。
3.決策樹(shù)模型和logistic回歸模型
研究顯示,CHAID決策樹(shù)模型清晰的指出了各因素間的相互作用關(guān)系,具體的分析說(shuō)明了某因素在各亞群中是否有意義。比如不喜歡食用蘿卜在HP感染轉(zhuǎn)歸情況無(wú)效或加重中是干預(yù)效果的影響因素,而在HP感染轉(zhuǎn)歸情況好轉(zhuǎn)中沒(méi)有意義。還可以清晰的說(shuō)明HP感染轉(zhuǎn)歸情況好轉(zhuǎn)的人干預(yù)好轉(zhuǎn)的發(fā)生率最高,提示HP感染轉(zhuǎn)歸情況是影響干預(yù)效果的最重要的因素。同時(shí),logistic回歸分析結(jié)果充分的展現(xiàn)了自變量與因變量的數(shù)量依存關(guān)系,在自變量對(duì)因變量變化關(guān)系方面的信息都比決策樹(shù)模型要充分,但是在交互作用方面的效果不如決策樹(shù)模型。因此,本研究認(rèn)為,在影響因素分析中,應(yīng)該注重將二者結(jié)合,充分發(fā)揮兩種模型的優(yōu)越性。
[1] 鄒文斌,李兆申.中國(guó)胃癌發(fā)病率及死亡率研究進(jìn)展.中國(guó)實(shí)用內(nèi)科雜志,2014,34(4):408-415.
[2] 于穎彥.胃癌的病理分型與預(yù)后.外科理論與實(shí)踐,2011,16(3):240-243.
[3] 樊海軍.我院1996-2010年胃癌手術(shù)預(yù)后分析.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(2):289.
[4] 馬瑾,孫穎,劉尚輝.決策樹(shù)模型在住院2型糖尿病患者死因預(yù)測(cè)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(3):422-423.
[5] 伍剛,許國(guó)宇,劉廣韜,等.決策樹(shù)模型與logistic回歸模型在腦出血預(yù)后分析中的應(yīng)用.解放軍醫(yī)學(xué)雜志,2015,40(12):1003-1006.
[6] 王慧,黃水平,李海朋.蘇北農(nóng)民胃癌主要影響因素及防治知識(shí)現(xiàn)狀.現(xiàn)代預(yù)防醫(yī)學(xué),2013,40(23):4362-4365.
[7] 楊宇紅,趙宜良,張濤,等.胃癌根治術(shù)后心理及飲食干預(yù)對(duì)患者生活質(zhì)量和復(fù)發(fā)等預(yù)后因素的影響.中國(guó)腫瘤臨床與康復(fù),2007,14(1):82-84.
[8] 朱舜時(shí),Joel Mason,施堯.葉酸對(duì)胃癌和其他胃腸道癌發(fā)生的干預(yù)作用-臨床試驗(yàn)七年隨訪.胃腸病學(xué),2002,7(2):73-78.
[9] 應(yīng)敏剛,周衍,肖景榕,等.福建省胃癌高低發(fā)地區(qū)居民飲食習(xí)慣與營(yíng)養(yǎng)狀況的調(diào)查分析.中華腫瘤防治雜志,2008,15(23):1776-1779.
[10]Correa P,Fontham E,Bravo J,et al.Chemoprevention of gastric dysplasia:randomized trial of antioxidant supplements and anti-helicobacter pylori therapy.Jnci Journal of the National Cancer Institute,2001,92(23):1881-1888.
[11]呂賓,王慧萍,陳明濤,等.根除幽門(mén)螺桿菌對(duì)胃黏膜萎縮和腸化影響的隨訪研究.中華內(nèi)科雜志,2004,43(4):62-64.