解庭波
(長江大學(xué)醫(yī)學(xué)院,湖北 荊州 434023)
張 蕾
(武漢工程大學(xué)計算機學(xué)院,湖北 武漢 430074)
人工神經(jīng)網(wǎng)絡(luò)在消化道腫瘤檢測和診斷中的應(yīng)用進(jìn)展
解庭波
(長江大學(xué)醫(yī)學(xué)院,湖北 荊州 434023)
張 蕾
(武漢工程大學(xué)計算機學(xué)院,湖北 武漢 430074)
作為一種人工智能形式,人工神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)性、并行處理能力和非線性處理優(yōu)點,廣泛用于腫瘤早期檢測和診斷。介紹了人工神經(jīng)網(wǎng)絡(luò)的工作原理和特點,綜述了人工神經(jīng)網(wǎng)絡(luò)在消化道腫瘤檢測和診斷中的應(yīng)用研究進(jìn)展,并就其發(fā)展作出評述。
人工神經(jīng)網(wǎng)絡(luò);消化道腫瘤;腫瘤檢測與診斷;進(jìn)展
人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)是理論化的人腦神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型,是基于模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的一種信息處理系統(tǒng)。隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,其用途日益廣泛,應(yīng)用領(lǐng)域也不斷拓展。而腫瘤標(biāo)志物已被公認(rèn)為一種有效的腫瘤診斷方法,并廣泛應(yīng)用于臨床腫瘤的診斷[1,2]。本文主要介紹ANN原理、發(fā)展歷程及其在消化道腫瘤早期檢測和診斷中應(yīng)用進(jìn)展,對應(yīng)用ANN進(jìn)行腫瘤診斷具有一定的借鑒意義。
ANN是一種模仿人神經(jīng)結(jié)構(gòu)所發(fā)展起來的計算機網(wǎng)絡(luò)系統(tǒng),由許多相對獨立的人工神經(jīng)元彼此連結(jié)成網(wǎng)絡(luò),模仿生物神經(jīng)處理信息的方式解決問題。最早的ANN是由McCulloch和Pitts于1943年所提出,這個網(wǎng)絡(luò)被用來從事邏輯運算。1949年,Hebb提出了一套模仿人神經(jīng)系統(tǒng)學(xué)習(xí)方式的法則。1957年, Resenblatt發(fā)明了第一套被認(rèn)為有用的神經(jīng)計算器,名為馬克一號辨認(rèn)器。但是,在1980年之前,由于專家系統(tǒng)是當(dāng)時最流行的人工智能系統(tǒng),加上ANN的理論不成熟,計算機運算速度有限,因此ANN 并沒有受到很大的重視。直到20世紀(jì)80年代后,Hopfield神經(jīng)網(wǎng)絡(luò)被提出,而此時專家系統(tǒng)開始遇到了瓶頸,ANN理論才逐漸受到重視[3]。目前,ANN不斷有新的架構(gòu)及理論被提出,配合計算機運算速度的加快,使得ANN的功能更為強大,運用層面也更為廣泛,結(jié)合了生理、心理、計算機等科技而成為新的研究領(lǐng)域,并被應(yīng)用于醫(yī)學(xué)科學(xué)。
1.1人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及原理ANN是一種由多個神經(jīng)元以某種規(guī)則連接而成的層次型網(wǎng)絡(luò)結(jié)構(gòu),一般分為輸入層、隱含層和輸出層結(jié)構(gòu)[4](圖1)。前向型網(wǎng)絡(luò)模型中信號是逐層前傳的,不相鄰間無聯(lián)系,其主要思想是把整個學(xué)習(xí)過程分為3部分:①輸入模式從輸入層經(jīng)隱含層傳向輸出層的模式“順傳播”過程;②網(wǎng)絡(luò)的希望輸出與實際輸出之間的差異信號由輸出層經(jīng)隱含層向輸入層逐層修正連接權(quán)值的“誤差逆?zhèn)鞑ァ边^程;③由模式“順傳播”和“誤差逆?zhèn)鞑ァ钡姆磸?fù)交替進(jìn)行的網(wǎng)絡(luò)記憶訓(xùn)練,最終網(wǎng)絡(luò)趨向收斂,即網(wǎng)絡(luò)的全局誤差趨向極小值的“學(xué)習(xí)收斂”過程。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
要使得ANN 能正確運作,則必須透過“訓(xùn)練”的方式,讓ANN反復(fù)的學(xué)習(xí),直到對于每個輸入都能正確對應(yīng)到所需要的輸出。事實上,ANN中最重要的部分就是它的“學(xué)習(xí)法則”,即借著訓(xùn)練過程來調(diào)整網(wǎng)絡(luò)中運算單元間“連結(jié)”的強弱(權(quán)重) 。當(dāng)訓(xùn)練完成后,所有的知識即儲存于這些連結(jié)上。完成訓(xùn)練后的網(wǎng)絡(luò),即可借著隱含其中的知識去判斷爾后輸入數(shù)據(jù)的屬性。ANN的工作性能與訓(xùn)練樣本有直接的關(guān)系,若訓(xùn)練樣本不正確、太少或是太相似,ANN的工作區(qū)間與能力將大打折扣。換句話說,訓(xùn)練樣本就是ANN的老師,因此,訓(xùn)練樣本越多、越正確、差異性越大,ANN的能力就越強。ANN訓(xùn)練的目的,就是讓ANN的輸出越接近目標(biāo)值。亦即,相同的輸入進(jìn)入到系統(tǒng)與ANN得到的輸出值亦要相同。ANN未訓(xùn)練前其輸出是凌亂的,隨著訓(xùn)練次數(shù)的增加,ANN的鍵結(jié)值會逐漸的被調(diào)整,使得目標(biāo)值與ANN的輸出兩者誤差越來越小。當(dāng)兩者的誤差幾乎不再變化時,則稱此ANN 已收斂,此時ANN便訓(xùn)練完成。通常會定義一個價值函數(shù)作ANN收斂的指針,價值函數(shù)將會隨著網(wǎng)絡(luò)的訓(xùn)練次數(shù)越變越小最后幾乎不再變化[5]。
1.2人工神經(jīng)網(wǎng)絡(luò)的特點ANN是互連的神經(jīng)元構(gòu)成的網(wǎng)絡(luò),是通過對人腦的研究而得到的一門交叉學(xué)科,它的研究使諸如生物學(xué)、認(rèn)識科學(xué)、非線性科學(xué)等基礎(chǔ)學(xué)科與計算機、人工智能、信息處理、模式識別等工程學(xué)科有機地結(jié)合起來,并具有非常廣泛的應(yīng)用前景,它具有以下特點:①自組織和自學(xué)習(xí)能力:它能借著與環(huán)境交互作用時,改變及調(diào)整自身的結(jié)構(gòu);②具有很強的推廣能力;③能以任何精度逼近任何非線性函數(shù);④高度并行,即大量的相似或獨立的運算都可以同時進(jìn)行;⑤很強的信息綜合能力,能同時處理定量和定性的信息,能很好的協(xié)調(diào)多種輸入信息融合和多媒體技術(shù)[6,7]。
ANN是屬于人工智能的領(lǐng)域,有別于其它人工智能的方法,ANN具有自我學(xué)習(xí)的能力,使用者無需設(shè)計復(fù)雜的程序去解決問題,只須提供數(shù)據(jù)。目前, 醫(yī)學(xué)對絕大多數(shù)疾病的病因尚不明確,而各種疾病的表現(xiàn)也千變?nèi)f化,在醫(yī)學(xué)實踐中, 對疾病的判斷和相應(yīng)的治療往往只是以經(jīng)驗為基礎(chǔ)。因此,ANN所具有的學(xué)習(xí)、記憶和歸納功能決定了它將在醫(yī)學(xué)領(lǐng)域良好的應(yīng)用前景。
2.1在胃癌檢測和診斷中的應(yīng)用胃癌占我國惡性腫瘤死亡的23%,居首位。胃癌的預(yù)后很大程度上取決于早發(fā)現(xiàn)、早診斷、早治療及對治療后的隨訪監(jiān)測[8,9],而常規(guī)內(nèi)鏡的檢查不適合于普查及隨訪,且會給病人帶來一定的痛苦。血清腫瘤標(biāo)志物的檢測較為便捷,對診斷胃癌具有重要的臨床意義[10]。近年來,胃癌標(biāo)志物的研究發(fā)展很快,但是,這些標(biāo)志物都缺乏高度特異性和敏感性,尤其是對于胃癌的早期診斷和篩選不夠理想。王雪萍等[11]利用ANN建立的胃癌多種血清腫瘤標(biāo)志物ANN模型,在提高診斷敏感性的同時,還保證了較高的特異性,證明ANN模型對胃癌的早期診斷具有較高的價值。
2.2在胰腺癌檢測和診斷中的應(yīng)用胰腺癌是消化系統(tǒng)的惡性腫瘤,占消化道惡性腫瘤的10%。其發(fā)生原因至今仍未清楚,惡性程度高,發(fā)展較快,預(yù)后較差,早期診斷十分困難,且近年來其發(fā)生率不停上升[12]。多數(shù)患者被發(fā)現(xiàn)時已是晚期,僅15%~20%的患者有根治手術(shù)切除的機會。而在平時臨床診斷工作中,由于單一指標(biāo)的靈敏度和特異性具有局限性[13],不能早期對胰腺癌作出判斷,從而不能使患者得到更早期的治療而提高其存活率[14]。腫瘤標(biāo)志物的檢測在早期診斷中具有非常重要的參考價值[15],但單一標(biāo)志物的檢測其靈敏度及特異性均難以滿足臨床對早期診斷的要求。因此在臨床上,多主張將具有敏感性互補的標(biāo)志物聯(lián)合檢測[16]。Kazufumi Honda等[17]應(yīng)用ANN模型分析聯(lián)合檢測的腫瘤標(biāo)志物指標(biāo)以診斷胰腺癌,結(jié)果發(fā)現(xiàn)ANN模型可以顯著提高胰腺癌診斷功效。另外ANN模型結(jié)合計算機斷層成像(computed tomography, CT)、內(nèi)窺鏡超聲波檢查法(endoscopic ultrasonographyEUS)以及免疫組化的方法都可以提高其對胰腺癌診斷的準(zhǔn)確度[18]。
2.3在肝癌檢測和診斷中的應(yīng)用長期以來,我國肝癌的死亡率在惡性腫瘤中占居第三位,僅次于胃癌和食管癌[19]。AFP一直是肝癌早期診斷的最佳指標(biāo),但從病理類型看,高分化和分化很差的肝癌細(xì)胞往往不產(chǎn)生AFP,因此AFP對肝癌診斷的陽性率一般為60%~70%。肝硬化患者中AFP也有一定的陽性率[20],AFP在原發(fā)性肝癌診斷中存在假陽性。因此,探索和建立一種簡單、快速、敏感性高和特異性強的早期診斷技術(shù)已經(jīng)成了臨床醫(yī)學(xué)上的迫切需要。王家祥等[21]利用人工神經(jīng)網(wǎng)絡(luò)的血清蛋白質(zhì)指紋圖譜模型檢測肝癌的敏感性和特異性均高于AFP。同時,利用AFP檢測為假陰性者, 利用人工神經(jīng)網(wǎng)絡(luò)模型也可以被正確檢驗出來。Luk等[22]也利用人工神經(jīng)網(wǎng)絡(luò)模型對肝癌、肝硬化患者和健康人血清標(biāo)本的蛋白質(zhì)指紋圖譜的數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)該方法對肝癌診斷的敏感性和特異性分別為96.97%和87.88%。
計算機斷層成像(computed tomography, CT)以其卓越的低對比度分辨率和豐富的影像后處理功能,近幾年內(nèi)已得到迅速的普及和發(fā)展,成為診斷肝癌的主要手段之一[23]。然而CT影像質(zhì)量又受多種因素控制和干擾,特別是在肝癌的早期,其空間形態(tài)變化比較小,給放射醫(yī)生的診斷造成極大困難,很容易發(fā)生誤診和漏診[24]。因此,有必要采用適當(dāng)?shù)募夹g(shù)和方法對肝癌CT影像進(jìn)行處理和分析,以提高CT影像對病變的識別、診斷能力。張波等[25]在對肝癌和其它肝占位疾病CT影像預(yù)處理的基礎(chǔ)上,提取CT影像特征并以此作為訓(xùn)練參數(shù),建立了肝癌CT影像BP人工神經(jīng)網(wǎng)絡(luò)輔助診斷模型,并對網(wǎng)絡(luò)進(jìn)行仿真測試,經(jīng)過計算神經(jīng)網(wǎng)絡(luò)用于肝癌CT影像診斷的靈敏度和特異度分別為98%和96%,準(zhǔn)確度達(dá)到97%,遠(yuǎn)遠(yuǎn)高于目前國內(nèi)增強CT對肝癌診斷的準(zhǔn)確度。
2.4在大腸癌檢測和診斷中的應(yīng)用大腸癌是常見的惡性腫瘤,在世界范圍內(nèi)其死亡率居各種腫瘤的第三位[26],在西方居第二位[27]。目前,大腸癌診斷常用的方法仍為結(jié)腸氣鋇雙重造影和電子腸鏡等,但它們均為入侵性診斷方法,存在價格和風(fēng)險問題;血液腫瘤標(biāo)志物檢測較簡便[28],但單個血清標(biāo)志物診斷率太低,如癌胚抗原(CEA)診斷大腸癌的敏感性只有55.2%[ 29]。大腸癌是一種復(fù)雜疾病,它的發(fā)生和發(fā)展關(guān)系到多種基因的改變,所以聯(lián)合多個標(biāo)志物檢測和診斷大腸癌非常有必要。余捷凱等[30]通過生物信息學(xué)的方法篩選出了檢測大腸癌的最優(yōu)化標(biāo)志物組合:CEA、CA199、CA242、CA211、CA724。對CEAlt;5ng/ml的86例樣本進(jìn)行了人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測,其準(zhǔn)確率為96.5%,證實了人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測大腸癌的敏感性比單個血清標(biāo)志物CEA高的多。同時,他們用了多種生物信息學(xué)方法分析了大腸癌腫瘤標(biāo)志物數(shù)據(jù),對篩選的結(jié)果和建立的模型用決策樹和支持向量機驗證了其可靠性。在模型的評價中他們應(yīng)用了5倍交叉驗證的方法,并在測試集上估計模型的預(yù)測效果,這樣既做到了盲法測試又避免了結(jié)果的隨機性,使對模型的評價更加可靠。
人工神經(jīng)網(wǎng)絡(luò)有著許多人腦不可比擬的優(yōu)勢,同時由于其可以對線性或非線性多變量在不設(shè)前提條件的情況下進(jìn)行統(tǒng)計分析,同傳統(tǒng)的統(tǒng)計方法需要被分析的變量符合一定的條件相比有其自身的優(yōu)點。一個良好的ANN甚至可以在資料不太完整或有偏差的情況下也可以作出正確的預(yù)測。盡管ANN有諸多的優(yōu)點,但它目前仍不象傳統(tǒng)的統(tǒng)計方法為人們所熟知和應(yīng)用,在ANN被人們廣泛接納之前,還有許多工作要做。畢竟網(wǎng)絡(luò)實體與要處理的問題相去甚遠(yuǎn),領(lǐng)域?qū)<液茈y理解用數(shù)據(jù)化的節(jié)點、權(quán)值和連接來描述他們要解決的問題。此外,網(wǎng)絡(luò)是“黑箱推理”,全部知識存儲于網(wǎng)絡(luò)內(nèi)部,難以提供可信的解釋。最后,在訓(xùn)練階段存在訓(xùn)練時間長,過度擬合或訓(xùn)練不足,網(wǎng)絡(luò)麻痹及局部最小值等問題[6,7]。但是可以認(rèn)為,隨著對ANN研究的深入,ANN必將得到臨床工作者的認(rèn)同,成為醫(yī)學(xué)中疾病(尤其是腫瘤)診斷預(yù)測研究的有效工具。
[1]Jin L, Jung C. Diagnostic utility of serum and pleural fluid carcino-embryonic antigen, neuron-specific enolase, and cytokeratin 19 fragments in patients with effusions from primary lung cancer[J]. Chest,2005, 128 (4) ;2298-2303.
[2]David S, Boris Z, Ariella S,etal.Diagnostic value of CYFRA 21-1,CEA, CA19-9, CA15-3 and CA125 assays in pleural effusions: analysis of 116 cases and review of the literature [J]. Oncologist,2005,10 (4):501-507.
[3]暴春, 謝邦昌. 淺談人工神經(jīng)網(wǎng)絡(luò)[J]. 山西科技, 2006, (1):132.
[4]Ramesh AN, Kambhampati C, Monson JRT,etal.Artificial intelligence in medicine[J]. Ann R Coll Surg Engl,2004,86(5):334-338.
[5]段芳,徐亮,黃新. 人工神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)中的應(yīng)用[J].九江醫(yī)學(xué),2008,23 (2):90-92.
[6]宋燁,楊本. 人工神經(jīng)網(wǎng)絡(luò)及其在疾病診斷中的應(yīng)用[J]. 中華醫(yī)學(xué)實踐志,2006,5(3):275-277.
[7]Farid EA. Artificial neural networks for diagnosis and survival prediction in colon cancer[J]. Molecular Cancer,2005,4:29-33.
[8]Wu CH, Lin SR, Hsieh JS,etal.Molecular detection of disseminated tumor cells in the peripheral blood of patients with gastric cancer: evaluation of their prognostic significance[J]. Dis Markers,2006,22(3):103-109.
[9]Ebert MP,R?cken C. Molecular screening of gastric cancer by proteome analysis[J]. Eur J Gastroenterol Hepatol,2006,18(8):847-853.
[10]李建華,吳昌平. 胃癌診斷標(biāo)志物研究新進(jìn)展[J]. 醫(yī)學(xué)綜述,2008,14(10):1554-1555.
[11]王雪萍,佟素香. 血清腫瘤標(biāo)志物人工神經(jīng)網(wǎng)絡(luò)模型在胃癌診斷中的臨床應(yīng)用[J]. 實用醫(yī)學(xué)雜志,2007,23(12):1821-1822.
[12]Chen JH, Ni RZ, Xiao MB,etal.Comparative proteomic analysis of differentially expressed proteins in human pancreatic cancer tissue[J]. Hepatobiliary Pancreat Dis Int,2009,8(2):193-200.
[13]Ru C, Sheng P, Teresa A,etal.Proteomic Profiling of Pancreatic Cancer for Biomarker Discovery[J]. Mol Cell Proteomics,2005,4(4):523-533.
[14]Sezgin C, Karabulut B, Uslu R,etal.Gemcitabine treatment in patients with inoperable locally advanced/metastatic pancreatic cancer and prognostic factors[J]. Scand J Gastroenterol,2005,40(12):1486-1492.
[15] Ni X,Bai X,Mao Y,etal.The clinical value of serum CEA, CA19-9, and CA242 in the diagnosis and prognosis of pancreatic cancer[J]. Eur J Surg Oncol,2005, 31(2):164-169.
[16]孫文恒,王煒,周文策. 人工神經(jīng)網(wǎng)絡(luò)技術(shù)在胰腺癌診斷中的應(yīng)用[J]. 蘭州大學(xué)學(xué)報(自然科學(xué)版),2008,44(3):224-227.
[17]Honda K, Hayashida Y, Umaki T,etal.Possible detection of pancreatic cancer by plasma protein profiling[J]. Cancer Res,2005,65(22):10613-10622.
[18]Bartosch-H?rlid A,Andersson B,Aho U,etal.Artificial neural networks in pancreatic disease[J]. Br J Surg, 2008,95(7):817-826.
[19]Hu LY,Hu GX,Li FQ,etal.Application of protein chip system to the detection of primary liver cancer[J]. Bengbu Med Col,2004,2(3):74-76.
[20]Witzigmann H,Geissler F,Benedix F,etal.Prospective evaluation of circulating hepatocytes by alpha-fetoprotein messenger RNA in patients with hepatocellular carcinoma[J]. J Surgery,2002,131(1):34-43.
[21]王家祥,張波,余捷凱,等. 基于人工神經(jīng)網(wǎng)絡(luò)的血清蛋白質(zhì)指紋圖譜模型在肝癌診斷中的應(yīng)用[J]. 中華醫(yī)學(xué)雜志,2005,55(3):189-192.
[22]Luk JM,Lam BY,Lee NP,etal.Artificial neural networks and decision tree model analysis of liver cancer proteomes[J]. Biochem Biophys Res Commun,2007,361(1):68-73.
[23]Ippolito D,Sironi S,Pozzi M,etal.Perfusion computed tomographic assessment of early hepatocellular carcinoma in cirrhotic liver disease: initial observations[J]. J Comput Assist Tomogr,2008,32(6):855-858.
[24]Takayasu K,Muramatsu Y,Mizuguchi Y,etal.CT Imaging of early hepatocellular carcinoma and the natural outcome of hypoattenuating nodular lesions in chronic liver disease[J]. Oncology, 2007,72 (1):83-91.
[25]張波,張治英,徐德忠,等. 人工神經(jīng)網(wǎng)絡(luò)肝癌CT影像輔助診斷模型的建立[J]. 實用發(fā)射學(xué)雜志,2006,22(9):1079-1082.
[26]Ries LA,Wingo PA,Miller D,etal.The annual report to the nation on the status of cancer,1973-1997,with a special section on colorectal cancer [J]. Cancer,2000,88(10):2398-2424.
[27]Jemal A,Murray T,Samuels A,etal.Cancer statistics 2003 [J]. CA Cancer J Clin, 2003,53(1):5-26.
[28]Mladen DM,Dragoslav MP,Sanja Z,etal.Problems in screening colorectal cancer in the elderly[J]. World J Gastroenterol,2003,9(10):2335-2337.
[29]Griesenberg D,Nurnberg R,Bahlo M,etal.CA 19-9 and CA 72-4 and the fecal occult blood test in the preoperative diagnosis and follow-up after resective surgery of colorectal cancer [J]. Anticancer Res,1999,19(4A):2443-2450.
[30]余捷凱,楊美琴,姜鐵軍. 血清腫瘤標(biāo)志物優(yōu)化組合人工神經(jīng)網(wǎng)絡(luò)模型在大腸癌診斷中的應(yīng)用[J]. 浙江大學(xué)學(xué)報(醫(yī)學(xué)版),2004,33(5):407-410.
[編輯] 一 凡
2009-04-15
解庭波(1981-),男,湖北襄樊人,助教,碩士,從事醫(yī)學(xué)微生物學(xué)與免疫學(xué)的教學(xué)與研究工作。
10.3969/j.issn.1673-1409(R).2009.03.031
R735
A
1673-1409(2009)03-R069-04