摘 要:應(yīng)用BP人工神經(jīng)網(wǎng)絡(luò)原理,設(shè)計(jì)一種系統(tǒng)性紅斑狼瘡疾病診斷的方法。選用對系統(tǒng)性紅斑狼瘡敏感的四個指標(biāo)(ANA,dsDAN-ab,C3,C4),作為BP人工神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)。通過對121例樣本的分析,其中訓(xùn)練集的71例,訓(xùn)練正確率為95.7%;預(yù)測集的50例,預(yù)測正確率為88.0%。由此可以得出,BP人工神經(jīng)網(wǎng)絡(luò)能為系統(tǒng)性紅斑狼瘡作出較準(zhǔn)確的診斷,能提高診斷的客觀性。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò) 系統(tǒng)性紅斑狼瘡 預(yù)測
中圖分類號:R593.241文獻(xiàn)標(biāo)識碼:A文章編號:1674-098X(2012)07(b)-0246-02
系統(tǒng)性紅斑狼瘡(Systemic Lupus Erythematosus)是一種多器官、多系統(tǒng)受累的自身免疫性疾病?;颊唧w液免疫失調(diào),細(xì)胞免疫功能紊亂,而使患者體內(nèi)產(chǎn)生一些特異性自身抗體[1]。由于系統(tǒng)性紅斑狼瘡早期診斷困難,致殘率與死亡率均高,給患者及家屬帶來許多的痛苦和遺憾,而本研究應(yīng)用的人工神經(jīng)網(wǎng)絡(luò)對系統(tǒng)性紅斑狼瘡的診斷,不僅能排除各種人為因素的干擾,而且也能得到較準(zhǔn)確和客觀的結(jié)果。人工神經(jīng)網(wǎng)絡(luò)是種理論化的數(shù)學(xué)模型,是模仿人腦神經(jīng)的網(wǎng)絡(luò)結(jié)構(gòu)及其功能而建立起來的一種信息處理系統(tǒng),具有自適應(yīng)性、自組織性、容錯性、聯(lián)想性等特點(diǎn)[2,3]。本文通過系統(tǒng)性紅斑狼瘡疾病的4個敏感的診斷指標(biāo)(ANA,dsDAN-ab,C3,C4),應(yīng)用人工神經(jīng)網(wǎng)絡(luò)對疾病進(jìn)行預(yù)測診斷,結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)可用于系統(tǒng)性紅斑狼瘡的疾病診斷。
1 人工神經(jīng)網(wǎng)絡(luò)原理
1.1 人工神經(jīng)元
人工神經(jīng)網(wǎng)絡(luò)由多個層次組成,每一個層次包含若干個神元。如圖1顯示了一個具有n個輸入分量的人工神經(jīng)元模型。
在神經(jīng)網(wǎng)絡(luò)中,除了第一層次的其它神經(jīng)元,都是由來自上層神經(jīng)元的輸入變量(,,…,)和相對的連接權(quán)重(,,…,)的點(diǎn)乘積的和構(gòu)成其總輸入。神經(jīng)元總輸入值在函數(shù)f的作用下并同時(shí)給與適當(dāng)?shù)拈撝郸却碳?,就能夠產(chǎn)生信號輸出。圖中的連接權(quán)重表示的意義是上級神經(jīng)元對下級神經(jīng)元的影響程度,f是神經(jīng)元的激活函數(shù),一般采用S型函數(shù)。
1.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是一個以有向性拓?fù)浣Y(jié)構(gòu)的動態(tài)系統(tǒng),通過連續(xù)或斷續(xù)方式的輸入狀態(tài)而進(jìn)行處理[4]。目前根據(jù)各個層次神經(jīng)元的連接方法不同,其中使用最多、具代表性的是誤差反向傳播的多層前饋式網(wǎng)絡(luò),即BP(Back—Propagation)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是由大量“神經(jīng)元”互連而成的網(wǎng)絡(luò),通常由輸入層、隱含層和輸出層3個層次組成。神經(jīng)網(wǎng)絡(luò)輸入層的神經(jīng)元首先接受外界的信息,然后通過一個連接權(quán)重傳遞給下一隱含的神經(jīng)元,其次隱含層神經(jīng)元對數(shù)據(jù)進(jìn)行分析處理,把得到的結(jié)果傳遞給輸出層神經(jīng)元,最后輸出層神經(jīng)元經(jīng)過轉(zhuǎn)換把信號傳給外界。
1.3 人工神經(jīng)網(wǎng)絡(luò)工作原理
人工神經(jīng)網(wǎng)絡(luò)通過特定的學(xué)習(xí)算法得到了神經(jīng)元之間的連接權(quán),同時(shí)也獲得了病例樣本的各種信息,這一過程稱作訓(xùn)練,人工神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練就能得到疾病診斷的各種規(guī)則。人工神經(jīng)網(wǎng)絡(luò)應(yīng)用以上學(xué)到的診斷規(guī)則,就能在新的樣本病例中進(jìn)行疾病預(yù)測?;谝陨线@點(diǎn),本文首設(shè)定一個人工神經(jīng)網(wǎng)絡(luò)的期望值,當(dāng)這些期望值,提供給人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)后,神經(jīng)元就能夠獲得網(wǎng)絡(luò)的輸入響應(yīng)并產(chǎn)生相對應(yīng)的連接權(quán)值。然后人工神經(jīng)網(wǎng)絡(luò)按減小期望輸出與實(shí)際輸出誤差的方向,從輸出層經(jīng)各中間層逐層修正各連接權(quán)值,最后回到輸入層。如果計(jì)算結(jié)果給出了錯誤的判斷,此時(shí)人工神經(jīng)網(wǎng)絡(luò)通過下一步的學(xué)習(xí),就可以減少犯同樣錯誤的可能性,這種過程將反復(fù)交替的進(jìn)行,直至整個人工神經(jīng)網(wǎng)絡(luò)的全局誤差趨向預(yù)期目標(biāo),此時(shí)人工神經(jīng)網(wǎng)絡(luò)完成學(xué)習(xí)的過程。人工神經(jīng)網(wǎng)絡(luò)通過這種訓(xùn)練,提高了疾病判斷的準(zhǔn)確率,這就表明人工神經(jīng)網(wǎng)絡(luò)對疾病規(guī)則的學(xué)習(xí)已經(jīng)獲得了成功,同時(shí)也能夠?qū)膊∽鞒鲅杆佟?zhǔn)確的判斷。
2 神經(jīng)網(wǎng)絡(luò)診斷SLE實(shí)例
2.1 BP神經(jīng)網(wǎng)絡(luò)的算法
首先將訓(xùn)練和預(yù)測用的病例數(shù)據(jù)整理成易于MATLAB讀取的文本,其次設(shè)定人工神經(jīng)網(wǎng)絡(luò)的期望值,將訓(xùn)練病例數(shù)據(jù)導(dǎo)入其中進(jìn)行訓(xùn)練,訓(xùn)練完成后,將預(yù)測數(shù)據(jù)導(dǎo)入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)里面進(jìn)行仿真,最后輸出仿真結(jié)果。
2.2 病例選取
試驗(yàn)病例樣本來源為1996年至2008年期間哈爾濱醫(yī)科大學(xué)附屬醫(yī)院收治的門診或住院的系統(tǒng)性紅斑狼瘡患者。共計(jì)350例,其中女320例,占91.4%;男30例,占8.6%;男女之比為1:10.67,年齡1~79歲,平均年齡為40.53歲。所有患者均符合1982年美國風(fēng)濕病協(xié)會(ARA)制定的SLE診斷標(biāo)準(zhǔn)[5]。SLE患者均進(jìn)行各項(xiàng)免疫學(xué)指標(biāo)檢查及結(jié)果記錄。病歷詢問及體檢均由有臨床經(jīng)驗(yàn)的醫(yī)生進(jìn)行,所有患者均進(jìn)行詳細(xì)的病史詢問和體格檢查。每例病歷包括了100多個計(jì)量、分級指標(biāo),包括該病人入院時(shí)的基本資料、體格檢查結(jié)果、實(shí)驗(yàn)室化驗(yàn)結(jié)果。其中,體格檢查99項(xiàng),實(shí)驗(yàn)室檢查34項(xiàng),病人資料12項(xiàng)。本文將以上的指標(biāo)進(jìn)行因子分析取得目標(biāo)數(shù)據(jù)。所謂的因子分析,是在為數(shù)眾多的因素中,不損失或很少損失原有信息的基礎(chǔ)上,把原來多個彼此相關(guān)的因素轉(zhuǎn)化為少數(shù)幾個彼此獨(dú)立的、能綜合反映原有信息的綜合指標(biāo)的一種多元統(tǒng)計(jì)方法。通過求出每個公因子的方差貢獻(xiàn),取累計(jì)方差貢獻(xiàn)率大于80%(可根據(jù)相關(guān)的專業(yè)知識,對此值進(jìn)行調(diào)整)的前m個公因子,根據(jù)各影響因素在公因子中所起的作用,確定其是否為主要影響因素。其基本思想是根據(jù)相關(guān)性大小把原始變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,而不同組的變量間相關(guān)性則較低。按照前面所述的思想對數(shù)據(jù)進(jìn)行篩選,最后得到權(quán)重比較大的4個指標(biāo),即ANA,dsDAN-ab,C3,C4,進(jìn)行神經(jīng)網(wǎng)絡(luò)的模擬分析。
隨機(jī)抽取臨床樣本26例,取19例作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本(7例正常,12例不正常),取剩余的7例數(shù)據(jù)進(jìn)行預(yù)測(預(yù)測數(shù)據(jù)如表1所示),使用MATLAB作為算法的實(shí)現(xiàn)工具。
2.3 建立神經(jīng)網(wǎng)絡(luò)
使用newff語句建立BP網(wǎng)絡(luò),設(shè)置隱藏神經(jīng)元數(shù)目為4,并且選擇各神經(jīng)元的傳遞函數(shù)分別為tansig和purelin,設(shè)置反傳遞函數(shù)為:
2.4 設(shè)定網(wǎng)絡(luò)參數(shù)
使用函數(shù)train對人工神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練之前,先要設(shè)置網(wǎng)絡(luò)訓(xùn)練參數(shù)。本文設(shè)輸人工神經(jīng)元個數(shù)為4,輸出神經(jīng)元個數(shù)為1,期望目標(biāo)輸出值用0表示正常,用1表示系統(tǒng)性紅斑狼瘡,隱含層用tansig函數(shù),訓(xùn)練時(shí)間為5000個單位時(shí)間,訓(xùn)練目標(biāo)為誤差小于0.01,顯示速度為50ms,學(xué)習(xí)速率為0.05,網(wǎng)絡(luò)連接權(quán)重初始值設(shè)為【-1,1】之間的隨機(jī)數(shù),MATLAB程序編寫如下:
2.5 訓(xùn)練及預(yù)測結(jié)果
將訓(xùn)練病例的四個指標(biāo)輸入到人工神經(jīng)網(wǎng)絡(luò)的算法程序中,神經(jīng)網(wǎng)絡(luò)訓(xùn)練次數(shù)達(dá)到5000后,期望誤差值縮小到了0.0923,訓(xùn)練完畢后,將訓(xùn)練結(jié)果與實(shí)際值進(jìn)行比較,見圖2。
將預(yù)測用的病例數(shù)據(jù)導(dǎo)入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中進(jìn)行疾病預(yù)測,預(yù)測輸出以0.5為閾值,>0.5者為系統(tǒng)性紅斑狼瘡患者,<0.5為正常對照樣本,預(yù)測結(jié)果如下圖3所示。
將訓(xùn)練與預(yù)測兩項(xiàng)結(jié)果作如下統(tǒng)計(jì),結(jié)果見表1。
3 討論
本課題所采用的基于人工神經(jīng)網(wǎng)絡(luò)的系統(tǒng)性紅斑狼瘡的診斷結(jié)果能較好地與病例數(shù)據(jù)相符合,具有較高的準(zhǔn)確性,同時(shí)有利于疾病的早期發(fā)現(xiàn)和治療。然而在神經(jīng)網(wǎng)絡(luò)的預(yù)測過程當(dāng)中,神經(jīng)網(wǎng)絡(luò)的建立是至關(guān)重要的。如果選取了不恰當(dāng)?shù)膮?shù),或者輸入的訓(xùn)練數(shù)據(jù)不夠典型(不具關(guān)聯(lián)性),這樣建立的網(wǎng)絡(luò)往往達(dá)到不到預(yù)期要求,其預(yù)測結(jié)果也就往往和實(shí)際有所偏差,而本文設(shè)定的網(wǎng)絡(luò)參數(shù)能較好的滿足實(shí)際情況的要求。
臨床上由于各種原因,試驗(yàn)中有些病例數(shù)據(jù)不夠完整,這些缺失的數(shù)據(jù)會給臨床疾病的診斷造成一定的影響,但由于神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的容錯性,所以輸入數(shù)據(jù)在某些項(xiàng)上的缺失或是錯誤對神經(jīng)網(wǎng)絡(luò)最終運(yùn)算的結(jié)果影響不大,同時(shí)由于神經(jīng)網(wǎng)絡(luò)所具有的優(yōu)點(diǎn)和特性使得它成為醫(yī)學(xué)診斷研究的有效工具。在神經(jīng)網(wǎng)絡(luò)應(yīng)用中,只要我們建立適當(dāng)?shù)木W(wǎng)絡(luò)模型,確定完整的數(shù)據(jù)樣本,經(jīng)過網(wǎng)絡(luò)模型訓(xùn)練醫(yī)學(xué)專家的知識和經(jīng)驗(yàn),就可以使操作智能化、自動化,并具有較高的可信度,將極大減輕醫(yī)務(wù)人員的工作負(fù)擔(dān),所以神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)診斷領(lǐng)域具有很大的發(fā)展?jié)摿Α?/p>
參考文獻(xiàn)
[1]王國麗,胡鷺芳.671例系統(tǒng)性紅斑狼瘡臨床及自身抗體檢測結(jié)果分析[J].中國麻風(fēng)皮膚病雜志,May2006,Vol.22No.5:430-430.
[2]毛政利,閆繼濤,賴健清.金屬礦山[J].2009,(07):66-68.
[3]卜憲敏,鄭智勇,玉英豪.神經(jīng)網(wǎng)絡(luò)在病理學(xué)自動識別中的應(yīng)用[J].中國體視學(xué)與圖像分析,2005,10(2):122-126.
[4]巫影,陳定方,唐小兵等.神經(jīng)網(wǎng)絡(luò)綜述[J].科技進(jìn)步與對策,2002,(6):133-134.