安興偉 周宇濤 狄 洋 劉 爽 明 東
1(天津大學(xué)醫(yī)學(xué)工程與轉(zhuǎn)化醫(yī)學(xué)研究院,天津 300072)
2(天津市腦科學(xué)中心,天津 300072)
3(天津大學(xué)精密儀器與光電子工程學(xué)院,天津 300072)
阿爾茨海默病(Alzheimer′s disease,AD)是一種不可逆的進(jìn)行性神經(jīng)退行性疾病[1],主要影響老年人[2],并且是癡呆癥最常見(jiàn)的形式。有研究認(rèn)為,AD 患者的大腦中積累大量異常蛋白質(zhì)淀粉樣斑塊和神經(jīng)纖維纏結(jié),最終導(dǎo)致神經(jīng)元失活、細(xì)胞死亡[3]。Jie 等[4]指出,在AD 癥狀出現(xiàn)之前,大腦的功能和結(jié)構(gòu)已經(jīng)發(fā)生了改變?;颊叱跗谂R床表現(xiàn)為記憶力日漸衰退,語(yǔ)言表達(dá)出現(xiàn)困難,理解認(rèn)知能力下降和情緒不穩(wěn)定等現(xiàn)象[5],嚴(yán)重影響和限制了患者的日常生活,隨著病情的不斷加劇,甚至?xí)<盎颊叩纳踩rookmeyer 等[6]在2007年指出,預(yù)計(jì)在2050年,隨著全球人口老齡化的不斷加劇,將會(huì)有1/85 的人受到AD 的影響,并且亞洲有大約6 285 萬(wàn)人受到AD 的困擾。然而,基于當(dāng)前的醫(yī)學(xué)技術(shù)水平,AD 的病因和發(fā)病機(jī)制尚未完全明確,缺乏有效的治療方法,所以早期的及時(shí)診斷對(duì)臨床減緩或阻止疾病的發(fā)展具有重要的意義[5,7]。
輕度認(rèn)知障礙(mild cognitive impairment,MCI)是正常老化和阿爾茨海默病的過(guò)渡階段[8-10],因此及時(shí)診斷MCI 對(duì)于AD 的預(yù)防顯得十分重要。
近年來(lái),功能磁共振成像(functional magnetic resonance imaging,fMRI)憑借其具有非侵入性、無(wú)輻射、高空間分辨率,以及對(duì)于神經(jīng)退行性疾病檢測(cè)的較高有效性等[11],為科研人員研究人類(lèi)腦疾病的基本機(jī)制和認(rèn)知過(guò)程開(kāi)辟了有效的途徑。許多研究將血氧依賴(lài)信號(hào)(blood-oxygen-level-dependent,BOLD)作為靜息狀態(tài)功能磁共振成像(resting-state functional MRI,rs-fMRI)技術(shù)的神經(jīng)生理指標(biāo),應(yīng)用于神經(jīng)退行性疾病尤其是MCI 和AD 的診斷。在MCI 的早期階段,大腦結(jié)構(gòu)發(fā)生的變化并不顯著,只伴隨著一定程度的認(rèn)知能力下降。fMRI 與結(jié)構(gòu)磁共振成像技術(shù)(structural MRI,sMRI)相比,可以觀察到大腦特定區(qū)域的功能變化;與任務(wù)態(tài)的功能磁共振成像技術(shù)(task related fMRI)相比,不需要設(shè)計(jì)復(fù)雜的實(shí)驗(yàn)[12],減少了實(shí)驗(yàn)時(shí)間,更容易獲得理想的數(shù)據(jù)。因此,很多學(xué)者采用rs-fMRI 來(lái)研究MCI患者大腦功能的變化[11]。
傳統(tǒng)的診斷方法是:通過(guò)醫(yī)生多年的行醫(yī)經(jīng)驗(yàn)對(duì)患者的病情進(jìn)行判斷,即通過(guò)先驗(yàn)知識(shí)選擇評(píng)價(jià)區(qū)域,進(jìn)而進(jìn)行診斷。該方式容易忽略研究區(qū)域之外的大腦變化,且由于強(qiáng)烈依賴(lài)醫(yī)生的臨床經(jīng)驗(yàn)及主觀判斷,容易產(chǎn)生一定幾率的誤診,這對(duì)于個(gè)體來(lái)說(shuō)可能就是致命性的打擊。近幾年,隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法逐漸被應(yīng)用于疾病的智能診斷。計(jì)算機(jī)輔助診斷疾病所存在的必要性有4 點(diǎn):一是醫(yī)學(xué)診斷過(guò)程的本身極具復(fù)雜性;二是存在大量與疾病相關(guān)的臨床數(shù)據(jù)[13];三是豐富的診斷規(guī)律作為先驗(yàn)知識(shí);四是計(jì)算機(jī)存儲(chǔ)能力與計(jì)算能力快速提高。計(jì)算機(jī)輔助診斷借助功能像或結(jié)構(gòu)像,可輔助醫(yī)生做出更精確的診斷結(jié)果,在一定程度上避免誤診。對(duì)MCI 做出精確的診斷,并為患者提供及時(shí)的人為干預(yù)和輔助治療,有助于緩解甚至避免患者發(fā)展為AD 的風(fēng)險(xiǎn)。
目前,很多研究將機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法應(yīng)用于分析AD 和MCI 復(fù)雜的神經(jīng)影像數(shù)據(jù),以完成對(duì)AD/MCI 的分類(lèi)檢測(cè),其中涉及4 個(gè)部分[13],分別是特征提取、特征選擇、數(shù)據(jù)降維和分類(lèi)識(shí)別。本節(jié)將分別從這幾部分出發(fā),介紹應(yīng)用于AD/MCI檢測(cè)的研究現(xiàn)狀。
選擇合適類(lèi)型的神經(jīng)影像數(shù)據(jù)和提取合適的特征,是有效提高模型分類(lèi)識(shí)別能力的關(guān)鍵。由于MRI的廣泛應(yīng)用,學(xué)者們提出一系列計(jì)算指標(biāo),用于研究大腦自發(fā)振蕩活動(dòng)的BOLD 信號(hào),如低頻振幅( amplitudeoflow-frequencyfluctuation,ALFF)[12,14-16]、局部一致性(regional homogeneity,ReHo)[17]和功能連接(functional connectivity,F(xiàn)C)[18]等。
1.1.1 ALFF
ALFF 將體素的時(shí)間序列使用快速傅里葉變換轉(zhuǎn)化為頻域并計(jì)算得到功率譜,并將0.01 ~0.1 Hz功率譜的平方根的平均值作為每個(gè)體素的低頻振幅值。靜息狀態(tài)下的ALFF 來(lái)自大腦神經(jīng)元的自發(fā)性活動(dòng),能夠代表大腦的不同生理狀態(tài),具有較高的可靠性[19]和可重復(fù)性[20],同時(shí)具有顯著的生理意義。對(duì)于選擇顯著的腦區(qū)和合適的頻帶進(jìn)行分析,有助于深入研究大腦發(fā)病的機(jī)制,減少在掃描過(guò)程中生理噪聲和機(jī)器噪聲的影響。Wang 等[16]對(duì)MCI 的研究表明,整個(gè)大腦中的ALFF 值在默認(rèn)模式網(wǎng)絡(luò)中下降,而在顳葉、額上區(qū)、枕葉和頂葉區(qū)域上升。Long 等[15]認(rèn)為,MCI 患者在雙側(cè)海馬體、雙側(cè)梭狀回、雙側(cè)海馬旁回以及左側(cè)舌回提取出的ALFF 值明顯高于健康受試者的ALEF。Tian 等[12]將0.01~0.08 Hz 的頻帶進(jìn)一步細(xì)分成多個(gè)不同的子頻帶,有助于特征選擇。Zuo 等[14]指出,頻帶范圍在0.027~0.073 Hz 獲得的重測(cè)可信度明顯高于其他頻帶的值,通過(guò)該頻帶提取出的ALFF 與其他頻帶獲得的ALFF 相比具有顯著性差異。
1.1.2 ReHo
ReHo 借助肯德?tīng)柡椭C系數(shù),反映指定體素與周?chē)w素的時(shí)間序列變化的相似程度。Zang 等[21]在2004年提出,大腦的活動(dòng)是在一個(gè)團(tuán)塊中而不是單個(gè)體素,驗(yàn)證了ReHo 在測(cè)量腦活動(dòng)方面有很高的可靠性,為研究相關(guān)的病理變化提供了可靠的理論依據(jù)。Marchitelli 等[17]指出,ReHo 在AD/MCI 與正常對(duì)照組(normal controls,NC)之間的一些腦區(qū)存在顯著性差異。ReHo 值的變化表明大腦活動(dòng)以及功能的異常[22-23],但是不同的變化具有不同的意義。基于MCI 患者的相關(guān)研究證實(shí),ReHo 值的降低意味著大腦某一區(qū)域的血流量隨著區(qū)域代謝率的改變而降低,ReHo 值的增加表明患者可以利用額外的認(rèn)知神經(jīng)資源彌補(bǔ)疾病早期認(rèn)知功能的損失。在0.01 ~0.04 Hz 的低頻ReHo 值對(duì)于大腦皮層的活動(dòng)更加敏感,但是在不同頻帶獲得的ReHo確切生物學(xué)意義還有待進(jìn)一步探索[20]。
1.1.3 FC
功能連接是描述兩個(gè)不同腦區(qū)BOLD fMRI 信號(hào)之間的相關(guān)程度。目前,針對(duì)FC 的研究一般通過(guò)3 種方法構(gòu)建:一是基于皮爾森相關(guān)系數(shù)(Pearson correlation coefficient)的時(shí)間序列構(gòu)建方法[24];二是基于典型相關(guān)分析(canonical correlation analysis,CCA)的構(gòu)建方法;三是基于距離相關(guān)分析(distance correlation analysis,DCA)的構(gòu)建方法。
將FC 矩陣使用Fisher Z 變換得到標(biāo)準(zhǔn)化后的FC 矩陣[18,25],以便于研究靜息態(tài)大腦功能的整體特性,測(cè)量大腦不同區(qū)域之間BOLD 信號(hào)的時(shí)間同步性[26],進(jìn)一步生成基于全腦的功能連接矩陣或者功能連接腦網(wǎng)絡(luò)圖。學(xué)者們對(duì)FC 的研究主要集中在兩個(gè)方面:基于靜態(tài)的功能連接(stationary FC,sFC)和基于動(dòng)態(tài)的功能連接(dynamic FC,dFC)。靜態(tài)的功能連接往往只關(guān)注整個(gè)時(shí)間序列內(nèi)腦區(qū)之間的信息,忽略在整個(gè)時(shí)間序列中不同腦網(wǎng)絡(luò)之間是如何變化的;而動(dòng)態(tài)的功能連接通過(guò)使用滑動(dòng)窗口策略,將整個(gè)時(shí)間序列劃分為若干個(gè)重疊、等長(zhǎng)的時(shí)間片段,從而構(gòu)建每個(gè)時(shí)間片段內(nèi)感興趣區(qū)域(region of interest,ROI)之間的FC,進(jìn)一步分析在多個(gè)時(shí)間片段內(nèi)大腦區(qū)域之間的ROI 是如何動(dòng)態(tài)變化的[27]。圖1展示了單個(gè)早期輕度認(rèn)知障礙(early MCI,eMCI)受試者在靜息態(tài)下靜態(tài)和動(dòng)態(tài)的功能連接網(wǎng)絡(luò),dFC 通過(guò)ROI 對(duì)之間的聯(lián)系可以發(fā)現(xiàn)大腦局部空間的依賴(lài)屬性,還可以從縱向分析特定腦區(qū)的局部動(dòng)態(tài)時(shí)間屬性[28]。使用dFC 進(jìn)行分類(lèi)時(shí),模型對(duì)滑動(dòng)窗口的類(lèi)型、大小以及調(diào)節(jié)步長(zhǎng)等多個(gè)參數(shù)是敏感的[5,29-31]。
圖1 單個(gè)eMCI 受試者在靜息態(tài)下靜態(tài)和動(dòng)態(tài)的功能連接網(wǎng)絡(luò)[28]。(a)靜態(tài)網(wǎng)絡(luò);(b)~(g)表示使用滑動(dòng)窗口方法構(gòu)建的動(dòng)態(tài)網(wǎng)絡(luò)Fig. 1 The static and dynamic functional connectivity networks of single individual eMCI subject in the resting state fMRI. ( a)Static network; (b)~(g)Dynamic networks generated by sliding window approach
此外,近幾年的研究表明,dFC 中包含更豐富的、復(fù)雜的、高階的認(rèn)知功能的信息[32-33],這些信息可以彌補(bǔ)傳統(tǒng)sFC 的缺陷[34],解釋腦網(wǎng)絡(luò)之間的動(dòng)態(tài)變化。dFC 中所存在的最大缺點(diǎn)就是含有較多的特征信息,增加了特征提取的難度,基于dFC 的loworder 特征對(duì)于MCI 的診斷精度不夠高[28]。為了解決這一局限性,Chen 等[28]提出了采用一種基于dFC的high-order 方法,使用聚類(lèi)算法將不同的ROI pairs 按照一定閾值的相似性劃入不同的cluster 中,降低了特征維度,便于提取出具有區(qū)分性的特征,且對(duì)于MCI 和AD 具有較高的區(qū)分性。通過(guò)在FC的基礎(chǔ)上進(jìn)行轉(zhuǎn)化,將復(fù)雜的大腦網(wǎng)絡(luò)進(jìn)行抽象化,轉(zhuǎn)變?yōu)楹?jiǎn)單的網(wǎng)絡(luò)。研究表明,腦認(rèn)知功能障礙是由一系列異常腦網(wǎng)絡(luò)所引起,與腦功能節(jié)點(diǎn)的異常連接有關(guān)[35]。由于大腦網(wǎng)絡(luò)本身是一個(gè)復(fù)雜的系統(tǒng),且具有Hub(Hub 是指中心節(jié)點(diǎn),即某些大腦區(qū)域具有較高的聚類(lèi)系數(shù)、介數(shù)中心性以及較短的路徑)的分布與連接、層次性、中心性和模塊性等多種網(wǎng)絡(luò)屬性。從宏觀上描述不同大腦區(qū)域之間組織排列的聯(lián)系情況,可以提取的特征包括最短路徑、介數(shù)中心性,局部聚類(lèi)系數(shù)等。Wang 等[10]通過(guò)dFC 對(duì)應(yīng)到大腦信息流動(dòng)過(guò)程中最重要的Hub 節(jié)點(diǎn),這些節(jié)點(diǎn)可以有效地反映不同腦區(qū)之間信息交流的整合過(guò)程。同時(shí),Jie 等[4]在將MCI 與NC 的腦網(wǎng)絡(luò)轉(zhuǎn)換為拓?fù)浣Y(jié)構(gòu)之后,設(shè)置連接強(qiáng)度的閾值分別為0.3 與0.5,并進(jìn)行閾值化處理,最后比較發(fā)現(xiàn),MCI 患者的大腦中總是有一對(duì)腦區(qū)之間的功能連接是損壞的。
特征優(yōu)化過(guò)程是對(duì)特征選擇與數(shù)據(jù)降維的概括,特征選擇的質(zhì)量和數(shù)據(jù)降維的程度能夠影響分類(lèi)結(jié)果的精度[36],并對(duì)最終的識(shí)別效果起到明顯的作用。
在特征優(yōu)化中,通過(guò)去除小樣本高維數(shù)據(jù)中噪聲、冗余和不相關(guān)的特征來(lái)優(yōu)選特征子集,避免模型產(chǎn)生過(guò)擬合,從而進(jìn)行高效的分類(lèi)[37]。之前的研究主要是通過(guò)3 個(gè)方面進(jìn)行特征選擇:基于ROI 的特征選擇[18]、基于腦圖譜(atlas)的特征選擇[38]和基于機(jī)器學(xué)習(xí)的特征選擇[18]。其中,基于ROI 和Atlas 的特征選擇在一定程度上可以近似地認(rèn)為是實(shí)現(xiàn)了數(shù)據(jù)降維,因?yàn)檫@兩種方法都是從眾多的大腦區(qū)域中選擇特定的腦區(qū)進(jìn)行分析。
1.2.1 ROI
基于ROI 的方法是將臨床診斷經(jīng)驗(yàn)和現(xiàn)存文獻(xiàn)研究作為特征選擇的依據(jù)。Wang 等[18]在研究自閉癥譜系障礙(autism spectrum disorder,ASD)時(shí),結(jié)合文獻(xiàn)提供的MNI 空間坐標(biāo),分別將每個(gè)MNI 空間坐標(biāo)作為球心,指定球體的半徑生成ROI 區(qū)域。這種方法較為便捷且具有生理學(xué)意義,可以充分解釋ROI 所對(duì)應(yīng)的生理學(xué)與行為學(xué)意義。因?yàn)镽OI是基于先驗(yàn)假設(shè)、根據(jù)現(xiàn)存的研究進(jìn)行特征選擇的,但往往忽略了ROI 之外的信息,所以特征選擇時(shí)不能夠進(jìn)行更全面的評(píng)估。由于AD/MCI 患者有喪失記憶、認(rèn)知與視覺(jué)等表現(xiàn),并且這些功能與默認(rèn)模式網(wǎng)絡(luò)(default mode network,DMN)和視覺(jué)網(wǎng)絡(luò)(visual network,VN)[39]等多種網(wǎng)絡(luò)相關(guān)。研究證明,通過(guò)選取顳極、眶額皮層、顳回、海馬、后扣帶回和舌回等[39-40]多種與認(rèn)知相關(guān)的腦區(qū)特征進(jìn)行訓(xùn)練,所得到的模型性能更穩(wěn)定,從而驗(yàn)證了這些大腦區(qū)域與AD/MCI 存在著聯(lián)系。
1.2.2 Atlas
基于atlas 的方法是將根據(jù)預(yù)先定義的解剖標(biāo)記,如自動(dòng)解剖標(biāo)記(automated anatomical labeling,AAL)atlas 和神經(jīng)成像實(shí)驗(yàn)室(laboratory of neuroimaging,LONI)atlas 以及Brodmann 分區(qū),將大腦圖像分割成幾個(gè)解剖區(qū)域,然后從這些特定區(qū)域選擇特征?;赼tlas 分析的研究表明[38],特征選擇中采用不同的atlas 模板,對(duì)于分類(lèi)性能的提升有著重要的意義;通過(guò)比較3 種atlas 得出結(jié)論:經(jīng)過(guò)LONI 模板獲得的特征在分類(lèi)器模型上有更好的表現(xiàn)。
1.2.3 機(jī)器學(xué)習(xí)
基于機(jī)器學(xué)習(xí)算法的特征選擇主要可以分為3類(lèi)[26]:過(guò)濾式(filter)、包裹式(wrapper)和嵌入式(embedding)。使用統(tǒng)計(jì)學(xué)檢驗(yàn)選擇特征屬于過(guò)濾式,通過(guò)選擇低于指定閾值的體素塊作為特征。例如,選擇具有統(tǒng)計(jì)顯著性(P<0.05)的特征,Salas-Gonzalez 等[41]通過(guò)使用雙樣本t檢驗(yàn)的方法選擇感興趣區(qū)域的體素作為輸入數(shù)據(jù),使用分類(lèi)模型進(jìn)行預(yù)測(cè)。
Wang 等[18]使用的是支持向量機(jī)遞歸特征冗余消除 ( support vector machine-recursive feature elimination,SVM-RFE),該方法基于包裹式的后向消除的特征選擇算法,通過(guò)將分類(lèi)器的性能作為選擇特征子集的評(píng)價(jià)標(biāo)準(zhǔn),反復(fù)構(gòu)建模型,去除最不相關(guān)的特征。最后,按照特征重要性排名,最重要的特征往往是最后去除的。由SVM-RFE 篩選出的特征子集包含有豐富的信息,可以將選擇的特征推廣至其他非同源數(shù)據(jù)集中,分類(lèi)精確率可以達(dá)到90.86%,因此該特征選擇方法具有很好的魯棒性和泛化性。Jie 等[4]采用嵌入式特征選擇算法LASSO(least absolute shrinkage and selection operator)最小化懲罰目標(biāo)函數(shù),即使用L1范數(shù)正則化稀疏化特征空間,將目標(biāo)函數(shù)中大多數(shù)不相關(guān)和冗余的特征權(quán)重分配為零,通過(guò)選擇非零權(quán)重的特征來(lái)實(shí)現(xiàn)特征選擇,并不斷調(diào)整LASSO 的正則化參數(shù)λ來(lái)平衡模型的復(fù)雜度和擬合優(yōu)度。研究表明,LASSO 適用于存在大量無(wú)關(guān)特征的小樣本數(shù)據(jù)集。
Bi 等[24]使用集成學(xué)習(xí)將隨機(jī)森林與聚類(lèi)進(jìn)行結(jié)合,得到改進(jìn)的聚類(lèi)隨機(jī)森林(clustering evolutionary random forest,CERF),通過(guò)對(duì)隨機(jī)森林的決策樹(shù)按照層次聚類(lèi),將決策樹(shù)之間的相似性作為聚類(lèi)準(zhǔn)則實(shí)現(xiàn)優(yōu)化,動(dòng)態(tài)減少無(wú)關(guān)和冗余的決策樹(shù),逐步從高維特征中篩選出AD 與NC 之間最容易識(shí)別的特征。相比于使用未改進(jìn)的隨機(jī)森林、支持向量機(jī)分類(lèi)和統(tǒng)計(jì)學(xué)檢驗(yàn)等方法,該方法能成功推廣至帕金森綜合癥(Parkinson′s disease,PD)的分類(lèi)檢測(cè)中,表明其對(duì)特征選擇具有很強(qiáng)的一致性與魯棒性。Chen 等[28]使用聚類(lèi)的方法,將FC 中的ROI pairs 按照相似性劃入不同的cluster,然后使用稀疏學(xué)習(xí),從新構(gòu)建的FC 中選擇具有代表性的特征子集輸入分類(lèi)器進(jìn)行決策。除了上述提到的方法外,Liang 等[42]使用梯度提升決策樹(shù)(gradient boosting decision tree,GBDT)進(jìn)行特征選擇,GBDT通過(guò)集成一組基學(xué)習(xí)器(決策樹(shù))構(gòu)建預(yù)測(cè)模型,利用已有的樹(shù)的殘差依次建立每棵樹(shù)。GBDT 對(duì)基本梯度增強(qiáng)算法進(jìn)行了細(xì)微的改進(jìn):將回歸樹(shù)擬合為負(fù)梯度后,對(duì)樹(shù)葉的參數(shù)進(jìn)行重新估計(jì),使損失最小化。
目前,在對(duì)神經(jīng)影像數(shù)據(jù)進(jìn)行分析的研究中,主要使用支持向量機(jī)(support vector machine,SVM)、線性判別分析(linear discriminant analysis,LDA)、隨機(jī)森林(random forest,RF)、極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)以及集成學(xué)習(xí)(ensemble learning)等多種機(jī)器學(xué)習(xí)算法,其中SVM被認(rèn)為是目前在處理AD/MCI 的神經(jīng)影像數(shù)據(jù)時(shí)具有良好學(xué)習(xí)能力的機(jī)器學(xué)習(xí)算法[18,38,43-44]。
SVM 適用于處理小樣本量數(shù)據(jù),且算法實(shí)現(xiàn)簡(jiǎn)單。Ahmad 等[40]把海馬體、顳中回、內(nèi)嗅皮層和后扣帶皮層的激活體素作為特征,將SVM 與常用的算法進(jìn)行比較,得出SVM 在分類(lèi)AD/MCI 時(shí)是最適合的。同時(shí),選擇不同的核函數(shù)導(dǎo)致SVM 的分類(lèi)性能具有顯著性差異,但也會(huì)導(dǎo)致分類(lèi)結(jié)果具有顯著性的差異。一般來(lái)說(shuō),相比于多項(xiàng)式核函數(shù),線性核和高斯核的分類(lèi)效果好且精準(zhǔn)度高。研究人員通過(guò)使用多核學(xué)習(xí)(multikernel learning,MKL)[4],分別為局部連接和全局拓?fù)浣Y(jié)構(gòu)屬性構(gòu)建向量核函數(shù)和圖核函數(shù),使用網(wǎng)格搜索(grid search)決定最優(yōu)加權(quán)參數(shù)β 的取值。研究表明,相比傳統(tǒng)的SVM,基于MKL 的SVM 不僅可以提高精確率,而且在特征可解釋性方面更強(qiáng),通過(guò)核函數(shù)的權(quán)重可以直接反映所對(duì)應(yīng)的特征重要性[45-46]。集成式學(xué)習(xí)通過(guò)訓(xùn)練多個(gè)弱分類(lèi)器的方法,最終形成一個(gè)具有較強(qiáng)分類(lèi)能力的分類(lèi)器,使得模型具有穩(wěn)定的精度和強(qiáng)大的泛化能力。Pei 等[25]提出,使用fMRI 與基因數(shù)據(jù)進(jìn)行聯(lián)合判斷:第一階段基于fMRI 數(shù)據(jù)和大腦的先驗(yàn)知識(shí)劃分出14 個(gè)ROI,并為每個(gè)ROI 分別構(gòu)建線性核SVM 的基分類(lèi)器,輸出第一階段的決策值;第二階段將從基因數(shù)據(jù)中獲得的特征和第一階段的決策值作為輸入特征,再次構(gòu)建集成學(xué)習(xí)模型。最終結(jié)果顯示,相比于一階的集成學(xué)習(xí)性能,二階的集成學(xué)習(xí)性能提高了大約25%。
20 世紀(jì)末,F(xiàn)rench 等[47]通過(guò)使用相同的數(shù)據(jù)集分別比較了使用人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)和LDA 的分類(lèi)性能,兩個(gè)模型都能夠有效區(qū)分正常人和患者,但是ANN 對(duì)于實(shí)際數(shù)據(jù)擬合得更好。從最近幾年開(kāi)始,深度神經(jīng)網(wǎng)絡(luò)在多個(gè)領(lǐng)域有著出色的表現(xiàn)。越來(lái)越多的研究者[5,10,27,48-49]使用深度學(xué)習(xí)算法進(jìn)行AD/MCI 分類(lèi)識(shí)別,可以大幅度提升分類(lèi)性能。有研究證明[50],通過(guò)構(gòu)建兩個(gè)學(xué)習(xí)階段,能夠有效提高模型對(duì)于AD 的識(shí)別能力;第一階段構(gòu)建卷積層和循環(huán)層,提取區(qū)域連通性和鄰近位置的特征;第二階段建立ELM,提高模型的學(xué)習(xí)能力。Li 等[5]采用基于自適應(yīng)dFC 的時(shí)空深度神經(jīng)網(wǎng)絡(luò)模型,通過(guò)自適應(yīng)窗口實(shí)現(xiàn)對(duì)dFC 變化的及時(shí)追蹤,提取fMRI 與DTI 的時(shí)空特征,在分類(lèi)MCI 得到的準(zhǔn)確率高達(dá)87.7%,同時(shí)敏感性、特異性和ROC 曲線也有不錯(cuò)的結(jié)果,分別為88.9%、86.5%和0.889。Wang 等[10]構(gòu)建時(shí)空聯(lián)合的深度神經(jīng)網(wǎng)絡(luò)模型,通過(guò)使用卷積層與循環(huán)層,分別實(shí)現(xiàn)了動(dòng)態(tài)分割fMRI 時(shí)間序列與提取時(shí)空特性。該模型不僅二分類(lèi)正確率高,而且在多分類(lèi)數(shù)據(jù)上也有出色的表現(xiàn),其中值得關(guān)注的是還指出有一些顯著的特征存在于小腦。有研究證實(shí),小腦會(huì)參與認(rèn)知處理等過(guò)程,且與阿爾茨海默病等常見(jiàn)神經(jīng)系統(tǒng)疾病存在著一定的聯(lián)系[51],進(jìn)一步闡釋小腦某些區(qū)域的特征可以作為檢測(cè)AD/MCI 的生物標(biāo)志物。
有關(guān)AD/MCI 的深度學(xué)習(xí)研究結(jié)果也在一定程度上表明,利用時(shí)空信息的方法,比傳統(tǒng)的機(jī)器學(xué)習(xí)更高效和充分。特征選擇和分類(lèi)識(shí)別不局限于這些算法,但是復(fù)雜的算法并不一定是性能最好的,同時(shí)模型的復(fù)雜程度會(huì)降低在其他數(shù)據(jù)集上特征選擇和分類(lèi)識(shí)別的泛化能力和實(shí)用性[24]。
在評(píng)估分類(lèi)模型的性能時(shí),通常采用K折交叉驗(yàn)證(K=5 或者K=10)。該方法不僅可以評(píng)估分類(lèi)算法的性能,還可以在一定程度上減少過(guò)擬合的風(fēng)險(xiǎn)。一個(gè)模型的好壞并不限于評(píng)估分類(lèi)準(zhǔn)確率(accuracy),而是應(yīng)該將精確率(precision)和召回率(recall)或者靈敏度( sensitive)和特異性(specificity)、F1-score 和ROC 曲線等多個(gè)指標(biāo)納入考慮。當(dāng)數(shù)據(jù)集分布不平衡時(shí)[4],通過(guò)計(jì)算精確率與召回率的算術(shù)平均數(shù)進(jìn)行評(píng)估,實(shí)現(xiàn)對(duì)分類(lèi)模型性能的客觀全面評(píng)估。
隨著智能醫(yī)學(xué)診斷的發(fā)展,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)與神經(jīng)影像技術(shù)的不斷融合,能夠越來(lái)越多地為臨床醫(yī)生提供一些有針對(duì)性的輔助診斷意見(jiàn),進(jìn)而給予患者有效的治療。但是,目前有關(guān)AD/MCI 與NC 的二分類(lèi)智能診斷仍然面臨著以下挑戰(zhàn)。
1)難以獲得大量數(shù)據(jù)樣本。相比于其他醫(yī)學(xué)檢測(cè),fMRI 的成本較高,能夠獲得相關(guān)疾病的數(shù)據(jù)樣本很少,導(dǎo)致大多數(shù)文獻(xiàn)中的樣本量小、數(shù)據(jù)分布不平衡。一般認(rèn)為,小樣本數(shù)據(jù)集中提取的特征不能清晰地反映不同類(lèi)別之間的差異,容易產(chǎn)生過(guò)擬合現(xiàn)象,同時(shí)對(duì)于未知數(shù)據(jù)泛化能力較差;而對(duì)于樣本量較大的數(shù)據(jù)集,情況與之相反。在提取特征的時(shí)候,缺乏互補(bǔ)的時(shí)空特征信息可能會(huì)影響腦疾病分類(lèi)模型的性能[5]。
2)模型復(fù)雜度與成本開(kāi)銷(xiāo)之間的平衡。相較其他傳統(tǒng)模型來(lái)說(shuō),深度學(xué)習(xí)模型識(shí)別率有顯著的提高,約有10%;但計(jì)算機(jī)本身開(kāi)銷(xiāo)過(guò)大,訓(xùn)練模型時(shí)間過(guò)長(zhǎng),過(guò)于復(fù)雜的模型,對(duì)于分類(lèi)結(jié)果的可解釋性也增加了一定的難度。同時(shí),很少有研究會(huì)將所提出的方法應(yīng)用在其他非同源數(shù)據(jù)集或者其他退行性神經(jīng)疾病數(shù)據(jù)集中,測(cè)試驗(yàn)證模型的穩(wěn)定性以及泛化能力。所以,如何使模型在特征提取與選擇的階段選擇關(guān)鍵性的特征是實(shí)現(xiàn)精確診斷的突破口。
3)研究中的數(shù)據(jù)模態(tài)過(guò)于單一。多模態(tài)數(shù)據(jù)融合分析是目前腦研究的一個(gè)新興領(lǐng)域,現(xiàn)在大多數(shù)有關(guān)AD/MCI 的研究主要使用的是fMRI 數(shù)據(jù)或者簡(jiǎn)單地與人口學(xué)信息進(jìn)行融合,少量的研究會(huì)結(jié)合其他的神經(jīng)影像數(shù)據(jù),極少的研究會(huì)采用與基因信息進(jìn)行融合分析,進(jìn)一步探討NC 轉(zhuǎn)化為AD/MCI有關(guān)大腦內(nèi)源性和本質(zhì)性的問(wèn)題。由于不同模態(tài)之間異質(zhì)性的數(shù)據(jù)可以進(jìn)行信息相互補(bǔ)充,所以多模態(tài)融合分析能夠大幅度提升分類(lèi)結(jié)果,因此充分融合多種模態(tài)的數(shù)據(jù)是一個(gè)關(guān)鍵性的問(wèn)題。
為了降低及預(yù)防未來(lái)老齡化人口轉(zhuǎn)化為AD/MCI 的風(fēng)險(xiǎn),除了借鑒數(shù)學(xué)和計(jì)算機(jī)領(lǐng)域中的知識(shí)構(gòu)建新模型來(lái)提高AD 及其早期階段(即MCI)的識(shí)別之外,未來(lái)可以考慮從以下兩個(gè)方面著手進(jìn)行研究。一方面,將fMRI 與其他神經(jīng)影像數(shù)據(jù)融合。不同的影像數(shù)據(jù)反映了大腦的不同變化指標(biāo),例如:結(jié)構(gòu)磁共振成像(structural MRI,sMRI)表征皮層厚度、體積、表面積以及區(qū)域組織密度,彌散張量成像(diffusion tensor imaging,DTI)表征白質(zhì)纖維束的走向和分布氟脫氧葡萄糖- 正電子體層掃描( fluorodeoxyglucose positron-emission tomography,F(xiàn)DG-PET)則表征大腦區(qū)域葡萄糖的代謝能力等。另一方面,將MCI 的檢查關(guān)口繼續(xù)前移,加強(qiáng)對(duì)MCI 的前期臨床診斷(preclinical stage of cognitive impairment,PCI)。對(duì)PCI 的臨床研究是一個(gè)發(fā)展趨勢(shì),以尋求在輕度認(rèn)知障礙前期階段的預(yù)診和干預(yù)。例如,有研究表明,小血管病轉(zhuǎn)化為輕度認(rèn)知障礙的風(fēng)險(xiǎn)較高。已有研究[52]嘗試,從磁共振影像來(lái)探索小血管病相對(duì)于正常對(duì)照以及輕度認(rèn)知障礙的異常。例如,NC、PCI 和MCI 之間存在相關(guān)以及顯著性差異的指標(biāo),因此對(duì)PCI 等的判斷有可能是重要的研究趨勢(shì)。另外,生物學(xué)意義上的特征選擇和AD/MCI 異質(zhì)性的表征也可能是未來(lái)研究的重要方向,可為實(shí)現(xiàn)對(duì)AD/MCI 的早診斷、早干預(yù)提供行之有效的辦法。