馬艷梅
神經(jīng)網(wǎng)絡(luò)由于無(wú)需建立研究對(duì)象的數(shù)學(xué)模型,能學(xué)習(xí)和存貯大量的輸入與輸出關(guān)系,而被廣泛應(yīng)用于數(shù)據(jù)回歸擬合、模式識(shí)別、趨勢(shì)預(yù)測(cè)等方面。其中,徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)因具有較強(qiáng)容錯(cuò)性、魯棒性、記憶能力、非線(xiàn)性映射能力和自學(xué)習(xí)能力,而在模式識(shí)別診斷領(lǐng)域的應(yīng)用中有更突出的表現(xiàn)[1-2]。RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置對(duì)診斷效果至關(guān)重要,因此,需根據(jù)實(shí)際應(yīng)用對(duì)象自適應(yīng)優(yōu)化確定神經(jīng)網(wǎng)絡(luò)參數(shù),以實(shí)現(xiàn)最準(zhǔn)確有效的診斷。貓群算法[3-6]是近幾年提出的一種基于貓行為的群體智能計(jì)算方法,該算法能夠解決復(fù)雜優(yōu)化問(wèn)題。筆者利用貓群算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)參數(shù),構(gòu)建最優(yōu)的RBF網(wǎng)絡(luò)結(jié)構(gòu),并在肺癌診斷中與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)[7]診斷方法做比較。
RBF神經(jīng)網(wǎng)絡(luò)是基于人體大腦皮層中局部調(diào)節(jié)及交疊的感覺(jué)域(receptive field)提出的一種新型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[2]。基本的RBF神經(jīng)網(wǎng)絡(luò)具有一個(gè)只含一個(gè)隱含層的三層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)的第一層為輸入層,由一些信號(hào)源節(jié)點(diǎn)組成,用來(lái)連接網(wǎng)絡(luò)和外界。第二層為隱含層,隱含層提供了一個(gè)函數(shù)集,該函數(shù)集中的函數(shù)均為徑向基函數(shù),為隱節(jié)點(diǎn)的激活函數(shù)。從輸入層到第二層隱含層之間的變換是非線(xiàn)性的,從隱含層到第三層輸出層的變換是線(xiàn)性變換。基本的多輸入單輸出RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 多輸入單輸出RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
徑向基函數(shù)有高斯函數(shù)、反演S型函數(shù)、擬多二次函數(shù)等。因高斯基函數(shù)具有表示形式簡(jiǎn)單、徑向?qū)ΨQ(chēng)、存在任意階導(dǎo)數(shù)和良好的光滑性等優(yōu)點(diǎn),這里選用高斯基函數(shù)
其中:||x-H||為空間任一點(diǎn)x到高斯函數(shù)中心點(diǎn)H之間的歐式距離(x>0);σ 為徑向基函數(shù)寬度,σ>0,控制函數(shù)的徑向作用范圍,通常令 σ=1[8]。
貓群算法是一種基于貓行為的仿生優(yōu)化算法,分為搜尋和跟蹤兩種行為模式。算法總體過(guò)程是根據(jù)結(jié)合率(mixture ratio,MR)隨機(jī)將貓群分為搜尋模式的貓和跟蹤模式的貓,在搜尋模式下的貓復(fù)制自身位置并將自身位置的副本放入記憶池中,應(yīng)用變異算子產(chǎn)生新的位置,計(jì)算記憶池中所有新的位置的適應(yīng)度值,選擇適應(yīng)度值最高的候選點(diǎn)更新當(dāng)前位置;在跟蹤模式下的貓則利用全局最優(yōu)的位置來(lái)更新當(dāng)前位置[4-6]。貓群算法流程圖如圖2所示。
圖2 貓群算法總體流程圖
搜尋模式的過(guò)程是:1)設(shè)定記憶池大小為j,將當(dāng)前位置復(fù)制j份副本并放入記憶池中;2)將記憶池中所有的副本根據(jù)變化域(SRD)和變化數(shù)(CDC)的大小隨機(jī)加減S%(變化域的百分率表示)后代替原位置;3)利用適應(yīng)度函數(shù)計(jì)算記憶池中所有候選點(diǎn)(即復(fù)制的位置副本)的適應(yīng)度;4)以其中適應(yīng)度最高的候選點(diǎn)更新當(dāng)前貓的位置。
跟蹤模式過(guò)程是:1)速度更新。設(shè)整個(gè)貓群目前搜尋到的最優(yōu)解為Xbest,每只貓的速度為vi={vi1,vi2,…,vid},每只貓的速度可更新為
式(2)中:d=1,2,…,M;vi,d(t+1)表示更新后第 i只貓?jiān)诘?d 維的速度值;M 為維數(shù)大??;Xbest,d(t)為當(dāng)前貓群中具有最好適應(yīng)度值的貓的位置;xi,d(t)指當(dāng)前第 i只貓?jiān)诘?d 維的位置;c*是常量;r*是[0,1]上的隨機(jī)值。給定每維變化的限制范圍,如果每維改變后的值超出了變化域的限制范圍,則將其設(shè)定為給定的邊界值。2)位置更新。利用更新后的速度來(lái)更新貓的位置xi,d(t+1)=xi,d(t)+vi,d(t+1),其中 xi(t+1)表示第 i只貓更新后的位置。
構(gòu)造如圖1所示的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的過(guò)程是:利用貓群算法進(jìn)行訓(xùn)練優(yōu)化,設(shè)定適應(yīng)度誤差和迭代次數(shù)以完成訓(xùn)練,得到最佳的權(quán)值,從而獲取最優(yōu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。利用貓群算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)中的權(quán)值wi,適應(yīng)度函數(shù)為
式(3)中,ym(t)為 RBF 網(wǎng)絡(luò)的輸出,wi為網(wǎng)絡(luò)的權(quán)值,hi為隱含層第 i個(gè)神經(jīng)元的輸出,i=1,2,…,m。
肺癌的早期發(fā)現(xiàn)和診斷對(duì)降低患者的死亡率、提高患者生存質(zhì)量至關(guān)重要[10]。但由于肺癌種類(lèi)多、影響診斷因素多、病人數(shù)據(jù)不完整等原因,現(xiàn)有的方法不能取得很好的診斷效果。下面,筆者將所研究的貓群RBF診斷方法用于肺癌診斷中。
RBF神經(jīng)網(wǎng)絡(luò)初始權(quán)值設(shè)置在[-2,2]上,貓群算法中分組率為50%,變化域?yàn)?.2,記憶池容量j為40,貓群數(shù)量為80個(gè),終止迭代次數(shù)為1 000,適應(yīng)度誤差為0.001。在網(wǎng)絡(luò)訓(xùn)練和檢驗(yàn)前,須對(duì)數(shù)據(jù)樣本歸一化,邏輯型數(shù)據(jù)以0或1表示,數(shù)據(jù)型數(shù)據(jù)由式歸一化處理,其中ximax為所有數(shù)據(jù)樣本中第 i項(xiàng)的最大值[9]。
選用2010—2015年在某醫(yī)院住院的500個(gè)病人的病例,提取年齡、性別、家族史、既往史、吸煙史以及體重減輕情況6個(gè)臨床參數(shù),肺部細(xì)胞的6個(gè)形態(tài)特征值、6個(gè)色度特征值、整幅切片圖的紅色分量平均值和細(xì)胞區(qū)域的灰度平均值,并以此20個(gè)特征量作為RBF神經(jīng)網(wǎng)絡(luò)的輸入。RBF神經(jīng)網(wǎng)絡(luò)輸出只有1個(gè),輸出數(shù)據(jù)區(qū)間分為[0,0.2]、(0.2,0.45]、(0.45,0.75]和(0.75,1)4 個(gè),分別對(duì)應(yīng)正常、早期肺癌、中期肺癌和晚期肺癌。將500個(gè)病例中的300例作為RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,利用貓群算法進(jìn)行迭代訓(xùn)練,當(dāng)滿(mǎn)足迭代次數(shù)和適應(yīng)度誤差時(shí),停止訓(xùn)練,得到最優(yōu)的RBF神經(jīng)網(wǎng)絡(luò)診斷模型。將剩余的200個(gè)病例作為測(cè)試樣本,測(cè)試模型的準(zhǔn)確性。實(shí)驗(yàn)結(jié)果如表1所示。利用BP神經(jīng)網(wǎng)絡(luò)對(duì)上述樣本進(jìn)行訓(xùn)練測(cè)試,診斷結(jié)果如表2所示。
表1 貓群RBF神經(jīng)網(wǎng)絡(luò)肺癌診斷結(jié)果
表2 BP神經(jīng)網(wǎng)絡(luò)診斷結(jié)果
由表1和表2可知:健康狀況為“正?!钡臉颖驹\斷結(jié)果中,貓群RBF神經(jīng)網(wǎng)絡(luò)診斷模型和BP神經(jīng)網(wǎng)絡(luò)均有1個(gè)錯(cuò)判;早期肺癌病例中,貓群RBF神經(jīng)網(wǎng)絡(luò)診斷模型有2個(gè)錯(cuò)判,BP神經(jīng)網(wǎng)絡(luò)有3個(gè)錯(cuò)判;中期肺癌病例中,貓群RBF神經(jīng)網(wǎng)絡(luò)診斷模型有4個(gè)錯(cuò)判,BP神經(jīng)網(wǎng)絡(luò)有6個(gè)錯(cuò)判;晚期肺癌病例中,貓群RBF神經(jīng)網(wǎng)絡(luò)診斷模型有3個(gè)錯(cuò)判,BP神經(jīng)網(wǎng)絡(luò)有3個(gè)錯(cuò)判。利用貓群算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)模型診斷正確率為95%,比傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的診斷正確率高。
本文研究了貓群RBF神經(jīng)網(wǎng)絡(luò)診斷方法,通過(guò)貓群算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)參數(shù),克服了RBF神經(jīng)網(wǎng)絡(luò)參數(shù)確定的盲目性,提高了模型識(shí)別的精度,為肺癌診斷等模式分類(lèi)問(wèn)題提供了簡(jiǎn)單有效的方法。
參考文獻(xiàn):
[1] HOU M,HAN X.The multidimensional function approximation based on constructive wavelet RBF neural network[J].Applied soft computing,2011,11(2):2173-2177.
[2] HOU M,HAN X.Constructive approximation to multivariate function by decay RBF neural network[J].IEEE transactions on neural networks,2010,21(9):1517-1523.
[3] PRADHAN PM,PANDA G.Solving multiobjective problems using cat swarm optimization[J].Expert systems with applications,2012,39(3):2956-2964.
[4] LIU D,HU Y,FU Q,et al.Optimizing channel crosssection based on cat swarm optimization[J].Water science and technology water supply,2016,16(1):219-228.
[5] 匡珍春,謝仕義.基于貓群優(yōu)化算法的云計(jì)算虛擬機(jī)資源負(fù)載均衡調(diào)度[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2016,54(5):1117-1122.
[6] 付華,任仁,王雨虹,等.基于CSO-RVM的瓦斯涌出量預(yù)測(cè)模型研究[J].傳感技術(shù)學(xué)報(bào),2015,28(10):1508-1512.
[7] WU X,CHEN H,WANG Y,et al.BP neural network based continuous objects distribution detection in WSNs[J].Wireless networks,2016,22(6):1917-1929.
[8] 汪嘉楊,李祚泳,張雪喬,等.基于粒子群徑向基神經(jīng)網(wǎng)絡(luò)的礦井突水水源判別[J].安全與環(huán)境工程,2013,20(5):118-121.
[9] 馮利軍,郭曉山.人工神經(jīng)網(wǎng)絡(luò)在礦井突水預(yù)報(bào)中的應(yīng)用[J].西安科技大學(xué)學(xué)報(bào),2003,23(4):369-371.
[10] MATHEW J,KRATZKE R A.Lung cancer and lung transplantation:a review[J].Journal of thoracic oncology,2009,4(6):753-760.