許 人 石張鎮(zhèn) 張文龍 黃元平 朱曉雪 金 香 劉 蕊 孫延霞
(吉林大學(xué)第一醫(yī)院二部,吉林 長春 130031)
?
Logistic多元回歸和人工神經(jīng)網(wǎng)絡(luò)在判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移中的應(yīng)用
許人石張鎮(zhèn)張文龍黃元平朱曉雪金香劉蕊孫延霞
(吉林大學(xué)第一醫(yī)院二部,吉林長春130031)
目的應(yīng)用人工神經(jīng)網(wǎng)絡(luò)及Logistic多元回歸分析方法建立術(shù)前判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移的診斷模型。方法分析行手術(shù)切除的700例胃癌患者術(shù)前資料,對(duì)性別、發(fā)生部位、浸潤深度、病理類型等10項(xiàng)術(shù)前資料進(jìn)行相關(guān)性分析,應(yīng)用Logistic多元回歸和人工神經(jīng)網(wǎng)絡(luò)建立術(shù)前判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移的診斷模型。結(jié)果胃鏡下Borrmann分型、腫瘤發(fā)生部位、病理類型及浸潤深度4項(xiàng)因素對(duì)淋巴結(jié)轉(zhuǎn)移情況有統(tǒng)計(jì)學(xué)意義(P<0.01),稱為“危險(xiǎn)變量”,而病史時(shí)間、首發(fā)癥狀、性別、年齡、吸煙史、飲酒史6項(xiàng)因素對(duì)淋巴結(jié)轉(zhuǎn)移情況無統(tǒng)計(jì)學(xué)意義(P>0.05)。Logistic回歸模型判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移的準(zhǔn)確率為69.3%,受試者工作特征(ROC)曲線下面積為0.771。根據(jù)4項(xiàng)“危險(xiǎn)變量”建立的人工神經(jīng)網(wǎng)絡(luò)模型ANN1判斷淋巴結(jié)轉(zhuǎn)移情況準(zhǔn)確率為70.4%,ROC曲線下面積為0.796。全部術(shù)前資料建立的ANN2判斷淋巴結(jié)轉(zhuǎn)移情況準(zhǔn)確率為75%,ROC曲線下面積為0.831。結(jié)論在術(shù)前資料判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移情況的研究中,ANN診斷的準(zhǔn)確率高于Logistic多元回歸分析模型,且術(shù)前資料越多,準(zhǔn)確率越高,有望應(yīng)用于臨床,幫助相關(guān)科室提高判斷淋巴結(jié)轉(zhuǎn)移的準(zhǔn)確率。
進(jìn)展期胃癌;淋巴結(jié)轉(zhuǎn)移;術(shù)前預(yù)測(cè);人工神經(jīng)網(wǎng)絡(luò)模型;Logistic多元回歸
進(jìn)展期胃癌在我國所有胃癌中占92%~95%〔1〕。確定合理的術(shù)式及淋巴結(jié)清掃范圍、制定個(gè)體化治療方案是胃癌診治的焦點(diǎn)〔2,3〕。但患者術(shù)前資料多而復(fù)雜,單一因素很難確定胃癌分期,且資料相關(guān)性小,難以綜合評(píng)估并推測(cè)患者是否發(fā)生淋巴結(jié)轉(zhuǎn)移。本文采用人工神經(jīng)網(wǎng)絡(luò)和Logistic多元回歸方法對(duì)進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移情況進(jìn)行計(jì)量研究,探討術(shù)前資料與淋巴結(jié)轉(zhuǎn)移的相關(guān)性,提高診斷的準(zhǔn)確率。
1.1一般資料2003年1月至2011年12月吉林大學(xué)第三臨床醫(yī)院行胃癌手術(shù)切除的700例進(jìn)展期胃癌患者術(shù)前資料。其中男526例,女164例,年齡30~83歲,均行胃癌根治術(shù)+D1或D2淋巴結(jié)清掃術(shù),術(shù)前未行任何抗腫瘤治療,術(shù)后病理均為進(jìn)展期胃癌,并證實(shí)是否有淋巴結(jié)轉(zhuǎn)移。
1.2量化樣本數(shù)據(jù)集總結(jié)既往文獻(xiàn)報(bào)道的可能對(duì)進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移有影響的因素,選擇其中具有特征性的客觀指標(biāo),包括性別、吸煙史、飲酒史、首發(fā)癥狀、病史時(shí)間(<1年,1~2年,>2年)、發(fā)病年齡(30~50歲,51~70歲,>70歲)、腫瘤發(fā)生部位、浸潤深度、胃鏡下Borrmann分型、病理類型共10項(xiàng)。
1.3統(tǒng)計(jì)學(xué)方法應(yīng)用SPSS17.0統(tǒng)計(jì)軟件進(jìn)行χ2檢驗(yàn),Logistic多元回歸分析。
2.1單因素分析胃鏡下Borrmann分型、病理類型、腫瘤發(fā)生部位、浸潤深度4項(xiàng)因素在判斷淋巴結(jié)轉(zhuǎn)移方面,各組差異有統(tǒng)計(jì)學(xué)意義,是進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移的獨(dú)立影響因素,為“危險(xiǎn)變量”。而性別、年齡、病史時(shí)間、吸煙史、飲酒史、首發(fā)癥狀,各組發(fā)生率差異無統(tǒng)計(jì)學(xué)意義。見表1。
2.2構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型ANN1自變量選擇4項(xiàng)“危險(xiǎn)變量”,將所有樣本隨機(jī)按7∶2∶1的比例輸入訓(xùn)練組、測(cè)試組及驗(yàn)證組。訓(xùn)練組用于訓(xùn)練神經(jīng)網(wǎng)絡(luò);測(cè)試組為用于跟蹤訓(xùn)練過程中的錯(cuò)誤以防止超額訓(xùn)練,對(duì)訓(xùn)練好的網(wǎng)絡(luò)的泛化能力做出測(cè)試,以確定或肯定這個(gè)網(wǎng)絡(luò);驗(yàn)證組評(píng)估最終神經(jīng)網(wǎng)絡(luò)。輸入層節(jié)點(diǎn)為17個(gè),包括胃鏡下Borrmann分型、腫瘤發(fā)生部位、病理類型及浸潤深度;隱含層神經(jīng)節(jié)點(diǎn)為5個(gè)(由經(jīng)驗(yàn)而定),采用雙曲正切傳遞函數(shù);輸出層神經(jīng)節(jié)點(diǎn)2個(gè),為淋巴結(jié)轉(zhuǎn)移或無轉(zhuǎn)移,采用Softmax傳遞函數(shù)。建立的ANN1見圖1。應(yīng)用ANN1對(duì)預(yù)測(cè)集樣本預(yù)測(cè),正確判斷淋巴結(jié)有轉(zhuǎn)移的準(zhǔn)確率為92.5%,正確判斷淋巴結(jié)無轉(zhuǎn)移的準(zhǔn)確率為28.6%,總準(zhǔn)確率為70.4%,受試者工作特征(ROC)曲線下面積為0.796。
輸入層節(jié)點(diǎn)為29個(gè),包括性別、發(fā)病年齡、吸煙、鏡下Borrmann 分型等10項(xiàng)術(shù)前資料;隱含層神經(jīng)節(jié)點(diǎn)為8個(gè)(由經(jīng)驗(yàn)而定),采用雙曲正切傳遞函數(shù);輸出層神經(jīng)節(jié)點(diǎn)2個(gè),為淋巴結(jié)轉(zhuǎn)移或無轉(zhuǎn)移,采用Softmax傳遞函數(shù),建立ANN2模型。應(yīng)用ANN2對(duì)預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè),正確判斷淋巴結(jié)有轉(zhuǎn)移的準(zhǔn)確率為74.0%,正確判斷淋巴結(jié)無轉(zhuǎn)移的準(zhǔn)確率為76.9%,總準(zhǔn)確率為75.0%。預(yù)測(cè)淋巴結(jié)轉(zhuǎn)移的ROC曲線下面積為0.831。見圖1。
表1 胃癌淋巴結(jié)轉(zhuǎn)移影響因素的單因素分析(n)
圖1 ANN
2.3構(gòu)建Logistic回歸模型Logistic多元回歸結(jié)果顯示:自變量“飲酒、病理類型、胃鏡下Borrmann 分型、浸潤深度”具有統(tǒng)計(jì)學(xué)差異(P<0.05);而性別、發(fā)病年齡、吸煙史、病史時(shí)間、首發(fā)癥狀、腫瘤發(fā)生部位差異無統(tǒng)計(jì)學(xué)意義(P>0.05),見表2。將10個(gè)自變量納入Logistic回歸分析,與進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移具有顯著相關(guān)性的變量按相關(guān)性由大至小順序依次為胃癌的浸潤深度、胃鏡下分型、病理類型、飲酒史。系統(tǒng)自動(dòng)將篩選出的上述有統(tǒng)計(jì)學(xué)意義的4個(gè)變量帶入方程,隨機(jī)抽取部分病例驗(yàn)證Logistic回歸模型預(yù)測(cè)進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移的情況,其準(zhǔn)確率為69.3%,ROC曲線下面積為0.771。
表2 Logistic回歸分析結(jié)果
胃癌發(fā)病率和死亡率分別高達(dá)300.9/10萬和29.3/10萬。進(jìn)展期胃癌具有發(fā)病率高、早期診斷率低、5年存活率低等特點(diǎn)〔4〕。術(shù)前判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移情況十分重要。
Logistic回歸具有判別和預(yù)測(cè)功能,適用于定性及半定量的指標(biāo),具有限制條件少,資料要求相對(duì)低等優(yōu)點(diǎn)〔5〕。而人工神經(jīng)網(wǎng)絡(luò)則模仿生物神經(jīng)網(wǎng)絡(luò)的功能和結(jié)構(gòu)建立數(shù)學(xué)模型〔6〕,具有很強(qiáng)的自適應(yīng)、非線性特征,根據(jù)輸出和輸入因素間復(fù)雜的關(guān)系構(gòu)建模型,能有效解決醫(yī)學(xué)復(fù)雜問題,并在醫(yī)學(xué)領(lǐng)域獲得了廣泛的應(yīng)用〔7〕,可實(shí)現(xiàn)對(duì)疾病客觀的檢測(cè)和分類,提高疾病監(jiān)測(cè)和鑒別診斷有效率〔8,9〕,適用于大樣本、復(fù)雜樣本的統(tǒng)計(jì)。本文提示ANN1、ANN2判斷進(jìn)展期胃癌淋巴結(jié)轉(zhuǎn)移的準(zhǔn)確率優(yōu)于Logistic回歸模型,其訓(xùn)練組、測(cè)試組及驗(yàn)證組間數(shù)據(jù)動(dòng)態(tài)轉(zhuǎn)換,相互校正,使準(zhǔn)確率明顯提高;Logistic回歸模型可自動(dòng)篩選出相關(guān)性大的指標(biāo)作為“自變量”帶入方程構(gòu)建模型,方便可行,易于推廣。上述兩個(gè)模型各有優(yōu)勢(shì),可輔助相關(guān)專業(yè)醫(yī)生提高判斷淋巴結(jié)轉(zhuǎn)移的準(zhǔn)確率。以后的研究將進(jìn)一步擴(kuò)大樣本數(shù)量、聯(lián)合影像學(xué)、腫瘤標(biāo)志物等資料,完善該模型。上述模型能否對(duì)預(yù)后、療效等進(jìn)一步判斷,還有待長期隨訪研究證實(shí)。
1郭丹陽,程文,周洋,等.胃窗超聲造影、多層螺旋CT及兩者聯(lián)合診斷胃癌的價(jià)值比較〔J〕.中國臨床醫(yī)學(xué)影像雜志,2012;23(11):789.
2呂瀟童,張軍.進(jìn)展期胃癌的治療進(jìn)展〔J〕.醫(yī)學(xué)綜述,2013;19(19):3513-4.
3Pasini F,F(xiàn)raccon AP,de Manzoni G.The role of chemotherapy in metastatic gastric cancer〔J〕.Anticancer Res,2011;13(10):3543-54.
4趙敬柱,張汝鵬,王剛,等.進(jìn)展期胃癌根治術(shù)后復(fù)發(fā)的預(yù)后分析〔J〕.中華胃腸外科雜志,2011;14(2):107-10.
5李建新,石張鎮(zhèn),郭賀,等.Logistic多元回歸和人工神經(jīng)網(wǎng)絡(luò)在肺CT判斷肺癌病理分型中的應(yīng)用〔J〕.中國實(shí)驗(yàn)診斷學(xué),2013;17(10):1800-3.
6張德豐,周靈,孫亞民,等.基于修剪技術(shù)分級(jí)學(xué)習(xí)的動(dòng)態(tài)模糊神經(jīng)網(wǎng)絡(luò)算法研究〔J〕.計(jì)算機(jī)應(yīng)用研究,2011;28(1):124-30.
7王剛,林森森,姜新國,等.用于小細(xì)胞肺癌診斷的人工神經(jīng)網(wǎng)絡(luò)模型〔J〕.中國衛(wèi)生統(tǒng)計(jì),2013;30(2):257-8.
8Vallejo M,Isaza CV,Lopez JD.Artificial neural networks as an alternative to traditional fall detection methods〔J〕.Conf Proc IEEE Eng Med Biol Soc,2013;20(13):1648-9.
9白雪峰,王平瑜,吳擁軍.基于兩種判別模式的腫瘤標(biāo)志物聯(lián)合檢測(cè)對(duì)肝癌輔助診斷的價(jià)值〔J〕.解放軍醫(yī)學(xué)雜志,2012;37(11):1019-20.
〔2014-11-16修回〕
(編輯苑云杰)
吉林省科技廳自然科學(xué)基金資助項(xiàng)目(No.201215069)
孫延霞(1965-),女,博士,碩士生導(dǎo)師,主要從事血液病、惡性腫瘤研究。
許人(1986-),女,碩士,醫(yī)師,主要從事腫瘤學(xué)研究。
R735.2
A
1005-9202(2016)16-3980-03;doi:10.3969/j.issn.1005-9202.2016.16.051