• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)大腸癌證型分類

      2018-03-21 01:31:30
      關(guān)鍵詞:大腸癌證型權(quán)值

      ,

      大腸癌是常見的消化道惡性腫瘤,包括結(jié)腸癌和直腸癌。近年來,隨著人們生活方式和生活環(huán)境的改變,大腸癌在我國的發(fā)病率和死亡率呈現(xiàn)快速上升的趨勢(shì)[1]。大腸癌屬本虛標(biāo)實(shí)之證,既有臟腑氣血虧虛,又有氣滯、血瘀、痰凝、濕毒等標(biāo)實(shí)的情況[2]。目前中醫(yī)證候診斷標(biāo)準(zhǔn)存在證名不統(tǒng)一、證型的診斷標(biāo)準(zhǔn)沒有考慮到疾病的影響,構(gòu)成證的基本元素模糊不清,標(biāo)準(zhǔn)制定主要依據(jù)中醫(yī)理論、文獻(xiàn)及專家咨詢帶有很大主觀成分等諸多問題,而臨床上病例往往諸證夾雜,臨床醫(yī)師治療經(jīng)驗(yàn)不同,很難統(tǒng)一“標(biāo)準(zhǔn)”,“標(biāo)準(zhǔn)”在臨床實(shí)踐上也難以應(yīng)用實(shí)施[3]。因此,利用計(jì)算機(jī)技術(shù)對(duì)中醫(yī)藥信息進(jìn)行規(guī)范化的研究十分必要。

      隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)技術(shù)也不斷成熟。由于其分類能力強(qiáng)且具有智能性,人工神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)診斷、預(yù)后、生存分析、臨床決策支持、模式識(shí)別等領(lǐng)域得到廣泛應(yīng)用[4]。而BP(Back Propagation)算法是基于梯度下降的,自身的缺陷也不可避免。如網(wǎng)絡(luò)權(quán)值和閾值隨機(jī)設(shè)定,當(dāng)解空間多個(gè)局部極小時(shí)容易陷入局部極小而無法跳出[5]。此外,網(wǎng)絡(luò)輸出自變量之間多數(shù)情況下并非獨(dú)立而存在冗余信息,會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練陷入過擬合狀態(tài)且延長建模時(shí)間。本文針對(duì)傳統(tǒng)BP算法用于分類建模時(shí)的缺陷,擬采用遺傳算法(Genetic Algorithm,GA)優(yōu)化后的GABP(Genetic Algorithm Back Propagation)模型構(gòu)建大腸癌的虛實(shí)證型分類器,以期促進(jìn)對(duì)大腸癌虛實(shí)證型分類的統(tǒng)一標(biāo)準(zhǔn)研究。通過對(duì)優(yōu)化后的神經(jīng)網(wǎng)絡(luò)進(jìn)行前后對(duì)比分析,提升大腸癌分類器的有效識(shí)別能力,對(duì)制定大腸癌中醫(yī)臨床診斷標(biāo)準(zhǔn)具有指導(dǎo)意義。

      1 資料與方法

      1.1 數(shù)據(jù)來源

      本文所用數(shù)據(jù)共338例,其中150例來源于廣東省中醫(yī)院臨床病案,其余188例來源于中國知網(wǎng)全文數(shù)據(jù)庫、萬方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)及維普全文數(shù)據(jù)庫文獻(xiàn)數(shù)據(jù)。納入標(biāo)準(zhǔn)為經(jīng)細(xì)胞學(xué)或病理學(xué)檢查診斷為結(jié)直腸癌或者已通過腸鏡報(bào)告檢查診斷為大腸癌及經(jīng)手術(shù)切除原發(fā)病灶的大腸癌患者,排除病理診斷不明確且具有多原發(fā)性腫瘤或既往有惡性腫瘤的患者。綜合上述納入、排除標(biāo)準(zhǔn),最終篩選出符合條件的218例大腸癌患者數(shù)據(jù),其年齡分布于25~80歲,男性患者108例,女性患者110例。

      1.2 數(shù)據(jù)量化

      1.2.1 癥狀量化

      在專家指導(dǎo)下,綜合臨床與文獻(xiàn)兩部分?jǐn)?shù)據(jù),選出與大腸癌患者密切相關(guān)的28項(xiàng)體征,包括大便膿血、脈沉、舌苔白、納呆等癥狀。為突出中醫(yī)術(shù)語的嚴(yán)謹(jǐn)規(guī)范性,按照《中醫(yī)癥狀鑒別診斷學(xué)》(第二版)[6]標(biāo)準(zhǔn)依據(jù),對(duì)癥狀的分類進(jìn)行初步劃分,并將已經(jīng)規(guī)范好的大腸癌常見癥狀進(jìn)行賦值量化,有該癥狀為1,無該癥狀為0。為防止量化過程中人工錄入產(chǎn)生錯(cuò)亂,數(shù)據(jù)錄入采用雙邊獨(dú)立錄入并進(jìn)行一致性檢驗(yàn)。

      1.2.2 證型量化

      參照2008年中華中醫(yī)藥學(xué)會(huì)發(fā)布的《中醫(yī)診療指南》中提出的診斷、辨證標(biāo)準(zhǔn),同時(shí)參照1992年全國大腸中醫(yī)科研協(xié)作會(huì)議制定的證型劃分標(biāo)準(zhǔn)和2004年楊金坤主編的《現(xiàn)代中醫(yī)腫瘤學(xué)》[7],結(jié)合本文所收集的實(shí)際病例情況,在多位專家進(jìn)行判定之后,決定將本文篩選出的218例大腸癌患者歸為脾失健運(yùn)、脾虛夾瘀、濕熱內(nèi)蘊(yùn)、氣滯血瘀、瘀毒內(nèi)阻、氣血虧虛、脾腎陽虛、肝脾不調(diào)8種證型??紤]到分屬于這8種證型的樣本數(shù)據(jù)量較小,可能會(huì)對(duì)后續(xù)建模的分類效果有一定影響,因而將這8種證型進(jìn)一步分為虛證與實(shí)證兩種類型,且將虛證賦為1,實(shí)證賦為2,同樣在賦值后對(duì)錄入的數(shù)據(jù)進(jìn)行一致性檢驗(yàn)。

      1.3 研究方法

      人工神經(jīng)網(wǎng)絡(luò)是由大量的功能和形式比較簡單的神經(jīng)元互相連接而構(gòu)成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),網(wǎng)絡(luò)可以看作是從輸入到輸出的一個(gè)非線性映射[8]。BP神經(jīng)網(wǎng)絡(luò)具有的非線性映射能力能夠保證其成功實(shí)現(xiàn)各種簡單或復(fù)雜分類,它將信息分布式存儲(chǔ)于連結(jié)權(quán)系數(shù)中,使網(wǎng)絡(luò)具有較高的容錯(cuò)性和魯棒性[9]。遺傳算法是模擬自然界優(yōu)勝劣汰生物進(jìn)化過程的全局優(yōu)化搜索算法,采用群體進(jìn)化的方式對(duì)目標(biāo)函數(shù)空間進(jìn)行并行式搜索,根據(jù)個(gè)體適應(yīng)度大小選擇個(gè)體,保留競爭力強(qiáng)的基因,是一種搜索效率高、魯棒性強(qiáng)的優(yōu)化方法[10]。遺傳算法廣泛應(yīng)用在機(jī)器學(xué)習(xí)、自適應(yīng)控制、組合優(yōu)化等領(lǐng)域,并取得了很好的效果[11]。本文結(jié)合遺傳算法與BP神經(jīng)網(wǎng)絡(luò)的特點(diǎn),首先利用遺傳算法對(duì)自變量進(jìn)行優(yōu)化篩選,利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值提高篩選效率,最終通過優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和系數(shù)構(gòu)建大腸癌虛實(shí)證型分類器,探討大腸癌證型分類的有效方法。

      2 基于遺傳算法優(yōu)化的過程

      利用遺傳算法選擇特征維必須經(jīng)過輸入變量編碼、初始種群產(chǎn)生、適應(yīng)度計(jì)算、交叉變異選擇、優(yōu)化輸出等過程[12]。由于BP算法本質(zhì)上為梯度下降法,所要優(yōu)化的目標(biāo)函數(shù)非常復(fù)雜,容易出現(xiàn)局部最優(yōu)、收斂速度慢等問題,而遺傳算法是多點(diǎn)搜索,能夠避免局部最優(yōu)。此外,利用遺傳算法取代一些其他的優(yōu)化算法,是因?yàn)檫z傳算法的尋優(yōu)能力可以獲取最佳權(quán)重。利用遺傳算法進(jìn)行自變量降維與網(wǎng)絡(luò)初始權(quán)值與閾值的優(yōu)化步驟如下。

      2.1 輸入變量編碼和種群初始化

      本文在利用遺傳算法進(jìn)行自變量篩選的過程中,染色體編碼采用二進(jìn)制法,即將個(gè)體編碼為一個(gè)二進(jìn)制串。根據(jù)研究中的28項(xiàng)體征,此處染色體編碼長度為28,染色體的每一位對(duì)應(yīng)一個(gè)輸入特征維,若染色體某一位值為1,說明該位置上相對(duì)應(yīng)的輸入自變量參與建模,若為0則不參與。而在利用遺傳算法進(jìn)行BP網(wǎng)絡(luò)權(quán)值和閾值的優(yōu)化過程中,我們對(duì)初始種群采取實(shí)數(shù)編碼,每個(gè)個(gè)體由一組實(shí)數(shù)串組成。當(dāng)BP網(wǎng)絡(luò)結(jié)構(gòu)確定時(shí),個(gè)體編碼長度也隨權(quán)值和閾值個(gè)數(shù)確定。本文將種群大小初始化為20,最大進(jìn)化代數(shù)設(shè)置為100,遺傳算法以這20個(gè)個(gè)體作為初始點(diǎn)進(jìn)行迭代。

      2.2 適應(yīng)度函數(shù)計(jì)算

      BP神經(jīng)網(wǎng)絡(luò)的誤差絕對(duì)值越小越好,而在遺傳算法中,適應(yīng)度值越大越好[13],因此采用以BP神經(jīng)網(wǎng)絡(luò)目標(biāo)函數(shù)的倒數(shù)作為適應(yīng)度函數(shù)。本文選取測(cè)試集數(shù)據(jù)誤差平方和的倒數(shù)作為適應(yīng)度函數(shù),以便使遺傳算法朝向適應(yīng)度函數(shù)增大的方向進(jìn)化。

      2.3 選擇交叉變異

      選擇交叉變異是遺傳算法的核心。本文選擇操作采用輪盤賭法,首先產(chǎn)生0與1之間的隨機(jī)數(shù)確定種群中個(gè)體被選中次數(shù),然后根據(jù)上述適應(yīng)度函數(shù)計(jì)算,選擇適應(yīng)度大的進(jìn)入下一代種群。對(duì)于交叉操作,降維過程選擇單點(diǎn)交叉算子,變異點(diǎn)位置是隨機(jī)產(chǎn)生的,且該位置上的基因值由0變成1或1變?yōu)?。在權(quán)值和閾值優(yōu)化過程中,交叉操作采用交叉算子,利用一對(duì)個(gè)體根據(jù)給定的概率重組產(chǎn)生新的種群后代。

      2.4 優(yōu)化結(jié)果輸出

      按照遺傳算法進(jìn)行層層迭代之后,當(dāng)?shù)螖?shù)達(dá)到最大進(jìn)化代數(shù)時(shí),進(jìn)化終止,最終輸出的此種群中適應(yīng)度最好的個(gè)體對(duì)應(yīng)輸入變量的基因編號(hào)為1、4、5、9、13、14、18、20、22、27,分別對(duì)應(yīng)于大腸癌的腹瀉、里急后重、大便秘結(jié)、脈沉、脈細(xì)、脈滑、舌紫、舌胖、舌苔白、納差等10項(xiàng)體征,篩選出來參與建模的自變量不到原來總輸入的一半,即收集統(tǒng)計(jì)的28項(xiàng)體征輸入自變量之間并非獨(dú)立,存在冗余信息,經(jīng)遺傳算法降維是非常必要的。遺傳算法優(yōu)化降維的過程如圖1所示。由圖1可知,最優(yōu)個(gè)體是在種群進(jìn)化到第35代后得到的。由于遺傳算法存在一些隨機(jī)因素,故種群的平均適應(yīng)度函數(shù)均值在穩(wěn)定中出現(xiàn)微小波動(dòng)。

      圖1 種群適應(yīng)度函數(shù)進(jìn)化曲線

      3 建立基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)

      3.1 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程

      BP神經(jīng)網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)初始權(quán)值和閾值的依賴性比較強(qiáng),以往大多隨機(jī)選取易陷入局部最優(yōu)。遺傳算法是一種全局優(yōu)化的自適應(yīng)概率搜索算法,可以得到全局最優(yōu)[14]。本文利用遺傳算法對(duì)神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化尋優(yōu),基本流程如圖2所示。

      3.2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及隱層設(shè)置

      BP神經(jīng)網(wǎng)絡(luò)是信號(hào)沿著前項(xiàng)傳播,誤差沿著反方向傳播,不斷調(diào)整權(quán)值與閾值使網(wǎng)絡(luò)趨于收斂構(gòu)建的過程。由于由輸入層、隱藏層、輸出層構(gòu)成的3層BP神經(jīng)網(wǎng)絡(luò)可以逼近任意函數(shù),故本文選取BP的3層拓?fù)浣Y(jié)構(gòu)進(jìn)行大腸癌虛實(shí)分類器的構(gòu)建。輸入層由經(jīng)遺傳算法降維優(yōu)化的10項(xiàng)體征設(shè)定,輸出層由虛實(shí)兩種證型作為輸出。由于BP神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)通常由經(jīng)驗(yàn)公式及誤差對(duì)比調(diào)整得出,本文考慮到樣本量偏少,為充分利用數(shù)據(jù)集,利用MATLAB(matrix&laboratory)中的crossvalind函數(shù)采用五折交叉驗(yàn)證確定GABP神經(jīng)網(wǎng)絡(luò)建模過程中的最佳隱含層神經(jīng)元個(gè)數(shù),程序根據(jù)數(shù)據(jù)集實(shí)際情況設(shè)定最佳神經(jīng)元個(gè)數(shù)在10-28之間循環(huán)尋找。結(jié)果顯示當(dāng)隱含層神經(jīng)元個(gè)數(shù)為15時(shí),網(wǎng)絡(luò)的分類效果最好,故GABP神經(jīng)網(wǎng)絡(luò)模型的隱層個(gè)數(shù)確定為15個(gè)。因此本文中BP神經(jīng)網(wǎng)絡(luò)的基本模型確定為10-15-2,且隱含層和輸出層的傳遞函數(shù)都取s函數(shù)。

      圖2遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)流程

      3.3 BP神經(jīng)網(wǎng)絡(luò)輸出方式

      在進(jìn)行網(wǎng)絡(luò)訓(xùn)練之前,將虛實(shí)證型分別標(biāo)記為“1”“2”。由于經(jīng)BP神經(jīng)網(wǎng)絡(luò)輸出的為非二值結(jié)果,即網(wǎng)絡(luò)的期望輸出只能取1或2作為已標(biāo)記的大腸癌虛實(shí)證型分類,故在程序中進(jìn)行四舍五入的設(shè)定,即當(dāng)網(wǎng)絡(luò)預(yù)測(cè)輸出值介于0.5~1.5之間時(shí)視為虛證,若該值介于1.5~2.5之間時(shí)則視為實(shí)證,統(tǒng)計(jì)預(yù)測(cè)結(jié)果并輸出正判率。

      3.4 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練及測(cè)試

      將經(jīng)遺傳算法優(yōu)化計(jì)算后篩選的輸入自變量對(duì)應(yīng)的數(shù)據(jù)提取出來建立新的BP神經(jīng)網(wǎng)絡(luò)。為了使訓(xùn)練的網(wǎng)絡(luò)不失一般性,隨機(jī)選取165例數(shù)據(jù)作為訓(xùn)練集,剩余的53例作為測(cè)試集,設(shè)定最大迭代次數(shù)為1000,允許誤差界值設(shè)為0.001。當(dāng)2次迭代結(jié)果的誤差小于該值時(shí),系統(tǒng)結(jié)束迭代計(jì)算,輸出結(jié)果,并統(tǒng)計(jì)正判率。三次仿真結(jié)果的虛實(shí)兩證型的正判率及建模時(shí)間如表1所示。

      表1 傳統(tǒng)BP與GABP的3次仿真分類結(jié)果

      4 基于傳統(tǒng)BP與經(jīng)遺傳算法優(yōu)化的GABP神經(jīng)網(wǎng)絡(luò)分類模型的結(jié)果對(duì)比

      經(jīng)傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型和遺傳算法優(yōu)化改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型(GABP)實(shí)現(xiàn)的的大腸癌虛實(shí)證型分類器結(jié)果平均值見表2。兩種模型樣本總量均為218例,其中訓(xùn)練樣本選取總樣本的75%(本文中選取165例),測(cè)試樣本占總樣本的25%(本研究中選取53例)。從表2可以看出,經(jīng)遺傳算法優(yōu)化改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò)分類效果明顯優(yōu)于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò),這是因?yàn)榻?jīng)遺傳算法優(yōu)化改進(jìn)后,不僅克服了傳統(tǒng)BP網(wǎng)絡(luò)存在的缺陷,而且利用遺傳降維有效提取了輸入維度的信息,從而實(shí)現(xiàn)了高效的分類。此外,在利用兩種模型構(gòu)建分類器時(shí),實(shí)證正判率明顯低于虛證正判率,這是因?yàn)樵?18例總樣本中,虛證有143例,而實(shí)證僅有75例,且在測(cè)試構(gòu)建好的網(wǎng)絡(luò)模型時(shí),隨機(jī)選取的測(cè)試集虛實(shí)證型的不均勻分布也會(huì)影響分類的最終效果。如果可以克服樣本證型數(shù)量分布不平衡,實(shí)驗(yàn)分類效果可能更佳。

      表2 分類模型結(jié)果對(duì)比

      5 結(jié)語

      實(shí)驗(yàn)結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)分類器可在一定程度上克服中醫(yī)癥狀與證型之間的不確定性與模糊性,能獲得較高的分類正判率。引入遺傳算法后對(duì)證型分類的效果有進(jìn)一步的提高,說明人工神經(jīng)網(wǎng)絡(luò)與遺傳算法相結(jié)合能有效將大腸癌表面體征與內(nèi)在證候特征有機(jī)結(jié)合起來對(duì)大腸癌證型進(jìn)行預(yù)測(cè)分類,具有較強(qiáng)的研究價(jià)值與應(yīng)用意義,對(duì)大腸癌中醫(yī)的臨床診斷有一定的借鑒意義。不足之處在于,本文是通過遺傳算法將自變量降維和優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值來提高網(wǎng)絡(luò)性能的,也可利用遺傳算法過程中不同編碼方式達(dá)到優(yōu)化效果。此外,為驗(yàn)證經(jīng)遺傳算法優(yōu)化改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò)的分類效果,我們也構(gòu)建了LVQ(Learning Vector Quantization)神經(jīng)網(wǎng)絡(luò)用來進(jìn)行對(duì)比。利用LVQ神經(jīng)網(wǎng)絡(luò)無需對(duì)數(shù)據(jù)進(jìn)行歸一化,而只需通過計(jì)算輸入向量與隱含層神經(jīng)元間的距離,便可完成模式識(shí)別構(gòu)建大腸癌分類器。實(shí)驗(yàn)結(jié)果顯示,LVQ神經(jīng)網(wǎng)絡(luò)得到的虛證正判率達(dá)到81.5118%,實(shí)證正判率達(dá)到67.4537%,略優(yōu)于傳統(tǒng)BP的分類效果,但依舊低于經(jīng)遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)分類效果。對(duì)比實(shí)驗(yàn)很好地表明了雖然LVQ神經(jīng)網(wǎng)絡(luò)也是一種很好的分類算法,但GABP模型用于大腸癌虛實(shí)證型的分類擁有更高的分析速度與準(zhǔn)確度。

      猜你喜歡
      大腸癌證型權(quán)值
      一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
      基于因子分析及聚類分析的241例感染后咳嗽中醫(yī)證素證型研究
      治咽炎要分清證型
      不同證型糖尿病的調(diào)理
      基于自適應(yīng)矩估計(jì)的BP神經(jīng)網(wǎng)絡(luò)對(duì)中醫(yī)痛經(jīng)證型分類的研究
      CONTENTS
      基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
      大腸癌組織中EGFR蛋白的表達(dá)及臨床意義
      FAP與E-cadherinN-cadherin在大腸癌中的表達(dá)及相關(guān)性研究
      裴正學(xué)教授治療大腸癌經(jīng)驗(yàn)
      峨山| 广南县| 莎车县| 中山市| 保靖县| 城步| 厦门市| 沈阳市| 兴隆县| 岳阳市| 静海县| 铁岭县| 罗平县| 革吉县| 泰来县| 清丰县| 白河县| 米林县| 咸丰县| 大理市| 巴东县| 阿巴嘎旗| 六枝特区| 樟树市| 益阳市| 清水河县| 东乌珠穆沁旗| 甘谷县| 康定县| 饶平县| 将乐县| 额尔古纳市| 方山县| 军事| 舞阳县| 乐东| 仁化县| 专栏| 黄陵县| 华亭县| 彰化市|