俞凱君
(日本山口大學(xué) 創(chuàng)成科學(xué)研究科,日本 山口 755-8611)
臍血流信號分析應(yīng)用于產(chǎn)前胎兒監(jiān)護及胎兒健康狀態(tài)檢測中,可大大降低遺傳性和先天性疾病胎兒的出生率[1]。傳統(tǒng)的臍動脈血流多普勒信號分析方法有聲譜參數(shù)法和波形分析法[2-3],以獲取臍動脈血流特征檢測參數(shù),如S/D值、PI、RI及頻譜圖等,但均容易丟失原有臍動脈血流信號的特征數(shù)據(jù),容易造成人為經(jīng)驗導(dǎo)致的臍血流病理診斷準(zhǔn)確率不高問題。
人工智能技術(shù)已應(yīng)用于臨床診斷領(lǐng)域,其通過診斷數(shù)據(jù)的提取、預(yù)處理,形成診斷數(shù)據(jù)集,利用機器學(xué)習(xí)算法和特征選擇構(gòu)建疾病分類與預(yù)測模型,為醫(yī)生的臨床輔助診斷和制定合理的治療方案提供決策支持[4-7]。在醫(yī)學(xué)診斷領(lǐng)域,可運用不同的機器學(xué)習(xí)方法,基于數(shù)據(jù)特征,分類處理數(shù)據(jù)集,對病癥進行實時預(yù)測,實現(xiàn)輔助診斷功能[8],如線性判別分析(Linear Discriminant Analysis,LDA)、分類回歸樹(Classification And Regression Tree,CART)、支持向量機(Support Vector Machine,SVM)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Basis Function Neural Networks,BFNN)、多層感知器神經(jīng)網(wǎng)絡(luò)(Multilayer Perceptrons Neural Networks,MLPNN)和隨機森林(Random Forest,RF)算法等,已取得了很多創(chuàng)新性的應(yīng)用成果[8-22]。
盡管機器學(xué)習(xí)在醫(yī)學(xué)診斷領(lǐng)域的應(yīng)用已十分廣泛,且取得了良好的進展,但鮮見于臍動脈血流的檢測與診斷中。神經(jīng)網(wǎng)絡(luò)因其結(jié)構(gòu)特殊,具有學(xué)習(xí)能力強、泛化能力高等優(yōu)點,因此非線性的神經(jīng)元排布在處理非線性信號中具有一定的優(yōu)勢。采用臍動脈血流多普勒時間序列為數(shù)據(jù)樣本,分別采用單層、多層神經(jīng)網(wǎng)絡(luò)對其進行狀態(tài)分類,提出人工智能算法與混沌理論相結(jié)合的智能診斷模型。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)采用誤差反向傳播學(xué)習(xí)算法,是由Rumelhart和McCelland的科學(xué)家小組于1986年提出的[23]。 BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)如圖1所示,包括輸入層(Input Layer)、隱含層(Hidden Layer)和輸出層(Output Layer)。每層內(nèi)有若干個神經(jīng)元,神經(jīng)元模型如圖2所示。
圖1 BP 神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)Fig.1 Topology of BP neural network model
圖2 BP神經(jīng)元模型Fig.2 BP neuron model
若f1(·)為隱含層傳遞函數(shù),f2(·)為輸出層傳遞函數(shù),則隱含層節(jié)點(即神經(jīng)元)的輸出為:
(1)
輸出層節(jié)點的輸出為:
(2)
式中:n、q、m分別為輸入層、隱含層和輸出層的節(jié)點數(shù),v為輸入層和隱含層之間的權(quán)值,w為輸出層和隱含層之間的權(quán)值。
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)流程主要包括信號的正向傳播和誤差負(fù)向反饋兩個步驟。正向傳播對網(wǎng)絡(luò)輸入求出它的輸出,反向傳播將計算得到的實際輸出與期望輸出的誤差負(fù)向傳遞給網(wǎng)絡(luò),對連接權(quán)值與閾值進行更新,層層反向調(diào)整,直至誤差達(dá)到預(yù)設(shè)值,確定模型參數(shù)并完成模型的學(xué)習(xí)。
一個完整的BP神經(jīng)網(wǎng)絡(luò)主要包括以下幾個方面:其一,網(wǎng)絡(luò)層數(shù)。根據(jù)臍動脈血流信號特征參數(shù)的向量矩陣和處理問題的復(fù)雜度,擬設(shè)隱含層的內(nèi)部結(jié)構(gòu)包含3~8層子隱含層。其二,輸入節(jié)點。輸入層神經(jīng)元的數(shù)目由臍動脈血流信號特征參數(shù)的個數(shù)決定。其三,輸出節(jié)點。樣本的種類決定輸出層的節(jié)點數(shù),期望輸出包括正常臍血流信號和3種異常臍血流信號。其四,模型參數(shù)的選取。BP網(wǎng)絡(luò)參數(shù)設(shè)定如下:最大訓(xùn)練次數(shù)100次,訓(xùn)練精度0.01,學(xué)習(xí)率0.1,隱含層與神經(jīng)元參數(shù)基于WOA進行優(yōu)化。
2016年,Mirjalili等[24]基于鯨魚隨機獵捕、包圍收縮、“旋氣泡網(wǎng)”策略及位置螺旋式更新的方式,完成了逼近獵物及捕獵的過程,構(gòu)建了數(shù)學(xué)模型,形成了具有調(diào)節(jié)參數(shù)少、全局搜索能力強和收斂迅速等特點的全局優(yōu)化算法,即WOA算法(Whale Optimization Algorithm,WOA)。此模型包括環(huán)繞捕獲、泡泡攻擊及隨機搜索獵捕3個過程:
其一,環(huán)繞捕獲。座頭鯨在搜尋獵物時,通過識別目標(biāo)獵物位置并將其包圍,該數(shù)學(xué)模型如下:
(3)
(4)
(5)
(6)
其二,隨機搜尋。座頭鯨隨機尋找獵物位置的過程如以下模型所示:
(7)
(8)
其三,泡泡網(wǎng)攻擊獵物。座頭鯨以泡泡攻擊獵物的數(shù)學(xué)模型如式(9)所示。
(9)
座頭鯨以對數(shù)螺旋狀(Spiral Updating Position,SUP)接近獵物或以收縮的形式包圍目標(biāo)群(Shrinking Encircling Mechanism,SEM),為模擬2種形式同時進行時的行為過程,采用2種模式被選概率為50%的方式來更新鯨魚位置:
(10)
使用MFM-OBM臍血流檢測系統(tǒng),在江蘇省無錫市錫山區(qū)某醫(yī)院獲取臍動脈血流多普勒信號,建立臍動脈血流多普勒信號數(shù)據(jù)集,每個數(shù)據(jù)包括原始多普勒血流時間序列信號、臨床檢測數(shù)據(jù)。用飛利浦IU-22彩色多普勒超聲儀對采得的數(shù)據(jù)進行對比,得出胎兒健康狀況(臍帶繞頸和羊水偏少等)。按臍動脈血流多普勒信號正常與否,將信號分為正常與異常2種情況。經(jīng)過預(yù)處理后,獲得的臍動脈血流時間序列信號如圖3所示。
以正常狀態(tài)與異常狀態(tài)的臍動脈血流多普勒時間序列為研究對象,健康樣本標(biāo)記標(biāo)簽為0,而羊水偏少、臍帶繞頸及胎位不正則分別標(biāo)為1、2和3。訓(xùn)練集X組,測試集Y組。診斷分類部分結(jié)果如圖4所示。
圖4 單層神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果Fig.4 Results of single-layer neural network training
樣本均采用隨機選取,運行20次神經(jīng)網(wǎng)絡(luò)所獲平均準(zhǔn)確率約為82.5%?;趩螌痈兄獧C的診斷結(jié)果表明,在區(qū)分正常胎兒、羊水偏少、臍帶繞頸及胎位不正情況時具有較高的誤報率,特別是羊水偏少與胎位不正的誤報率較高。雖然該方法在區(qū)分正常與異常胎兒時具有100%的準(zhǔn)確度,但無法準(zhǔn)確區(qū)分異常胎兒屬何種異況。
該結(jié)果表明,神經(jīng)網(wǎng)絡(luò)雖更加適合此樣本模式下非線性數(shù)據(jù)的擬合,但單層感知機對于非線性信號的擬合能力較弱,故而,采用多感知機進行狀態(tài)分類。
BP神經(jīng)網(wǎng)絡(luò)的不足之處在于過多的網(wǎng)絡(luò)節(jié)點會導(dǎo)致收斂慢、訓(xùn)練時間長及獲得非全局最小解的缺陷。采用WOA(鯨魚算法),以式(11)作為優(yōu)化目標(biāo)進行優(yōu)化,優(yōu)化網(wǎng)絡(luò)中全部權(quán)值與閾值,使網(wǎng)絡(luò)獲得最佳的表現(xiàn)力,提升泛化能力。
J(ω,b,x,y)=0.5‖hω,b(x)-y‖2
(11)
采用WOA-BP對時間序列進行預(yù)測與分類,部分結(jié)果如圖5所示。
圖5 WOA-BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果Fig.5 Results of WOA-BP neural network training
結(jié)果表明,優(yōu)化后的神經(jīng)網(wǎng)絡(luò)比未優(yōu)化的具有更好的分類(預(yù)測)準(zhǔn)確度,平均20次準(zhǔn)確率達(dá)90%,說明優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對臍血流非線性問題擬合程度更優(yōu)。此外,優(yōu)化后的神經(jīng)網(wǎng)絡(luò)比未優(yōu)化的神經(jīng)網(wǎng)絡(luò)隨迭代收斂速度更快,最優(yōu)結(jié)果所需迭代次數(shù)更少。相比于優(yōu)化的單層感知機結(jié)果,羊水不足與胎位不正2種異常狀況的誤報率降低了10%,該結(jié)果表明,采用WOA優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的權(quán)偏參數(shù)之后,模型具有稍好的外推性,但20%左右的誤報率仍不能滿足臨床要求。
BP神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度不僅依賴權(quán)值與閾值,對于訓(xùn)練樣本也有較高的要求,樣本具有不同的特征代表性?;煦缧蛄锌蓪⒃瓡r間序列映射至不同時間尺度上,展現(xiàn)出不同的非線性特征,具備不同的特征性。因此,將多普勒時間序列轉(zhuǎn)換為二維混沌時間序列(Phase Space,PS)(混沌相圖的橫縱坐標(biāo)),樣本由原有的一維序列變?yōu)槎S序列,通過PS-WOA-BP神經(jīng)網(wǎng)絡(luò)進行臍血流狀態(tài)分類。樣本劃分方式和類別標(biāo)簽與上述方法相同,時間序列點數(shù)取400。結(jié)果如圖6所示。
圖6 PS-WOA-BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果Fig.6 Results of PS-WOA-BP neural network training
如圖6所示,PS-WOA-BP具有極高的準(zhǔn)確度,說明混沌序列包含臍血流狀態(tài)更多的代表性特征,20次平均準(zhǔn)確率高達(dá)95%,該結(jié)果不僅表明了所提出的智能診斷模型具有可靠性,也說明混沌序列比傳統(tǒng)的時間序列具備更多的代表性特征。由于采用了空間時間序列作為輸入信息,且采用優(yōu)化的神經(jīng)網(wǎng)絡(luò)執(zhí)行智能診斷。僅羊水偏少出現(xiàn)誤判、漏盤,且誤報率相比于WOA-BP方法顯著降低,基本達(dá)到了臨床診斷要求。
表1為不同方法準(zhǔn)確率變化的比較。
表1 不同方法準(zhǔn)確率Tab.1 Accuracy rates of different methods
由表可知,BP神經(jīng)網(wǎng)絡(luò)可對臍動脈血流時間序列作出良好分類,優(yōu)化后的BP可提升狀態(tài)分類時的表現(xiàn)性能,提升智能診斷模型的準(zhǔn)確度。由于混沌序列包含更多的非線性問題的代表特征,以此構(gòu)建的PS-WOA-BP及NC-PSO-SVM均具較高的準(zhǔn)確度,但PS-WOA-BP具備良好的泛化能力。
介紹了BP神經(jīng)網(wǎng)絡(luò)的基本理論和鯨魚算法,為解決人為經(jīng)驗導(dǎo)致的早期臍血流病理診斷準(zhǔn)確率不高的問題提出了人工智能算法與混沌理論相結(jié)合的智能診斷模型,構(gòu)建了傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)診斷模型、WOA-BP 神經(jīng)網(wǎng)絡(luò)斷模型,在此基礎(chǔ)上根據(jù)臍血流時間信號具有混沌特性,采用WOA算法,提出PS-WOA-BP智能診斷模型。研究表明,針對臍血流信號的混沌特性,PS-WOA-BP模型,在進行臍血流健康情況識別時具有良好的效果及較高的準(zhǔn)確度和良好的泛化能力。