高 原,王 鑫,牛 焱,曹 銳,相 潔
(太原理工大學(xué) a.信息與計算機學(xué)院,b.軟件學(xué)院,太原 030024)
輕度認知障礙(mild cognitive impairment,MCI)是從正常衰老(normal control,NC)發(fā)展至阿爾茨海默病(alzheimer’s disease,AD)的中間狀態(tài),特點為有輕微的記憶和認知受損卻未達到癡呆狀態(tài)[1]。已有研究表明,每年大約有接近15%的MCI患者轉(zhuǎn)化成AD,而NC的轉(zhuǎn)化率不到2%[2]。因此,盡早診斷MCI尤其重要。事實上,當(dāng)下對MCI的診斷仍舊依賴于醫(yī)生臨床診斷經(jīng)驗和心理測量學(xué)評估,并且由于部分醫(yī)生的主觀性經(jīng)驗判斷很容易造成MCI的誤漏診,導(dǎo)致病情耽誤甚至惡化。因此輔助醫(yī)療診斷工具的研究與開發(fā)是十分必要的。
近幾年,隨著神經(jīng)科學(xué)中腦連接組研究的不斷深入,圖論分析(graph theory analysis)的發(fā)展為腦神經(jīng)疾病早期診斷的研究提供了重要的技術(shù)保證。研究者們發(fā)現(xiàn)依據(jù)功能磁共振影像(functional magnetic resonance imaging,fMRI)數(shù)據(jù)構(gòu)建得到的腦網(wǎng)絡(luò)不僅具有重要研究意義的拓撲特性,而且存在不同的功能模塊組織,例如運動、默認網(wǎng)絡(luò)、邊緣系統(tǒng)、視覺、注意力處理等[3]。SPORNS et al[4]發(fā)現(xiàn)模塊組織似乎在嬰兒期就開始存在,并隨著年齡的增長而退化,這表明它與認知能力有關(guān)。這為從模塊化的角度解析拓撲特性提供了必要的理論基礎(chǔ)。在之前模塊化拓撲屬性研究中發(fā)現(xiàn),其連接不僅起著橋梁通信的作用,還能夠更精確地反映各功能模塊的信息交流規(guī)律和組織模式的變化。例如,AVENA et al[5]發(fā)現(xiàn)模塊間和模塊內(nèi)連接的數(shù)量會隨著年齡的變化而變化,并且連接的異常中斷有可能會擾亂大腦結(jié)構(gòu)本身。MEUNIER et al[6]研究發(fā)現(xiàn)模塊間邊連接模式的廣泛改變反映了人類大腦結(jié)構(gòu)變化。因此,基于模塊化的連接特征較容易識別大腦結(jié)構(gòu)的異常變化。
此外機器學(xué)習(xí)方法,如支持向量機(support vector machine,SVM)算法結(jié)合磁共振影像(magnetic resonance imaging,MRI)已廣泛應(yīng)用在MCI診斷中。例如,ERIC et al[7]使用偏最小二乘法分析原始MRI數(shù)據(jù),利用SVM算法實現(xiàn)對NC和MCI分類。梁紅等[8]選取功能腦網(wǎng)絡(luò)中的異常屬性作為特征進行了基于SVM的分類研究。崔會芳等[9]利用靜息態(tài)fMRI數(shù)據(jù)構(gòu)建有向功能連接矩陣,隨后對提取到的腦網(wǎng)絡(luò)拓撲屬性進行方差分析,利用SVM學(xué)習(xí)模型對NC組和MCI組被試進行分類識別。然而在前期的研究中,傳統(tǒng)的特征分析集中于腦區(qū)節(jié)點的拓撲屬性,從連接數(shù)的角度分析腦連接損失的研究較少,且對節(jié)點屬性進行研究時,許多研究只對提取到的多腦區(qū)節(jié)點特征進行了簡單地合并,也未充分發(fā)揮功能模塊對腦網(wǎng)絡(luò)分析的優(yōu)勢??傮w來說,未能實現(xiàn)更深層次對各腦區(qū)間交互信息和功能連接關(guān)聯(lián)研究的目的。
本文首先基于模塊化拓撲連接的新角度,首次提取橋梁連接數(shù)作為特征,與傳統(tǒng)提取的腦網(wǎng)絡(luò)特征相比,精確直觀地反映出各功能腦區(qū)連接的異常損失,實現(xiàn)更深層次對功能模塊交互作用與腦結(jié)構(gòu)異常改變相關(guān)研究的目的。其次本文提取特征時,通過計算邊的介數(shù)中心性選取橋梁連接,簡化網(wǎng)絡(luò)中冗余的功能連接,在保留網(wǎng)絡(luò)的生理學(xué)意義的同時,可以更全面可靠地分析和理解腦部疾病的病理生理機制。最后,分類結(jié)果顯示,基于模塊化的橋梁連接數(shù)特征極大提高了MCI檢測的正確率。
本實驗fMRI數(shù)據(jù)取自ADNI(alzheimer’s dis-ease neuroimaging initiative)數(shù)據(jù)集,此公開數(shù)據(jù)集利用AD的醫(yī)學(xué)成像數(shù)據(jù)對其病理機制進行分析研究,得到研究者的廣泛使用。實驗包括79例NC被試以及56例MCI被試。被試的年齡、性別信息如表1所示。對兩組被試施以單因素方差分析,結(jié)果發(fā)現(xiàn)在NC組與MCI組患者性別上沒有顯著差異,而在年齡上存在顯著的差異。
表1 被試性別及年齡信息Table 1 Information of gender and age of subjects
所有受試者閉上眼睛在3.0 T掃描儀(飛利浦醫(yī)療系統(tǒng))上處于休息狀態(tài)下完成的fMRI掃描。使用以下參數(shù):重復(fù)時間(TR)為3 000 ms;回波時間(TE)為30 ms;皮層厚度為3.3 mm;皮層數(shù)為48;140個時間點。
本實驗預(yù)處理基于Data Processing Assistant for Resting-state fMRI(DPARSFv2.3)工具[10]。針對每例數(shù)據(jù)的預(yù)處理流程:1) 首先將前10 s的功能圖像丟棄;2) 對圖像施以時間片校正和轉(zhuǎn)動頭動校正,只保留水平頭動距離小于1 mm或者轉(zhuǎn)動幅度小于1°的被試;3) 選擇平面回波成像(echo planar imaging,EPI)中體素為3 mm的MNI標(biāo)準(zhǔn)空間模板對圖像進行配準(zhǔn);4) 在進行過高斯平滑之后,選擇0.01~0.1 Hz的低頻濾波對圖像數(shù)據(jù)中的低頻漂移過濾及高頻的生物噪音降低。
在本研究中,通過計算得到時間序列之間的同步性,表達出功能關(guān)系在大腦區(qū)域間的異同。首先,利用解剖自動化的標(biāo)記模板(automated anatomical labeling,AAL)[11],對預(yù)處理完成后的功能圖像劃分成90個大腦區(qū)域,其中左右半球各45個腦區(qū)。功能腦網(wǎng)絡(luò)中由單個節(jié)點代表對應(yīng)的單個腦區(qū)。平均所有腦區(qū)內(nèi)所包含體素的時間序列。然后通過使用多元線性回歸分析的方法去除由頭動帶來的可避免腦信號誤差影響。最后基于每對腦區(qū)間得到的平均時間序列計算皮爾遜相關(guān),由此構(gòu)建相關(guān)矩陣(90×90)。為了對腦網(wǎng)絡(luò)實現(xiàn)后續(xù)的模塊化及應(yīng)用研究,基于NC組被試功能矩陣中各腦區(qū)的相關(guān)系數(shù)計算其算術(shù)平均值,得到NC組均值相關(guān)矩陣(90×90)如圖1(a)所示。研究中,采用稀疏度S來進行閾值設(shè)置,目的是生成一個二值連接矩陣A,并根據(jù)圖論分析腦功能連接網(wǎng)絡(luò)的屬性。本研究設(shè)定閾值S為15%構(gòu)建出被試的腦功能網(wǎng)絡(luò),這不僅能夠保證腦網(wǎng)絡(luò)基本特性存在,也能最大程度地去除偽連接。NC組稀疏后的腦網(wǎng)絡(luò)如圖1(b)所示。
圖1 79例NC組所構(gòu)建的平均腦網(wǎng)絡(luò)Fig.1 Mean correlation matrix constructed of 79 NC groups
自模塊度(modularity)定義由Newman和Girvan提出后,越來越多的研究將其選作模塊化算法的衡量依據(jù)[12]。模塊度指標(biāo)Q量化了實際網(wǎng)絡(luò)中模塊內(nèi)連接數(shù)與隨機網(wǎng)絡(luò)中連接數(shù)之間的差異,簡而言之,模塊內(nèi)和模塊間連接的關(guān)系決定了每個模塊的強度[13]。在本次研究中,應(yīng)用“堆結(jié)構(gòu)”的貪婪算法,實現(xiàn)尋找全局最優(yōu)模塊度M及劃分模塊,在腦網(wǎng)絡(luò)中的每個節(jié)點都代表一個獨立的社區(qū)。之后,社區(qū)被反復(fù)合并成越來越大的成對,在每個步驟中選擇合并,以使Q最大增加或最小減少(如果不再可能增加)。模塊度定義為:
(1)
式中:NM代表模塊化后的所有模塊總數(shù),L代表當(dāng)前網(wǎng)絡(luò)中所有邊的條數(shù),LS表示模塊S內(nèi)包含的節(jié)點間連接的條數(shù),dS表示在模塊S內(nèi)所有節(jié)點度的總和。如圖2所示,在模塊及邊連接示意圖中,由紅色、黃色、藍色節(jié)點分別組成3個獨立的模塊,同一模塊內(nèi)包含的邊與節(jié)點顏色一致,模塊間連接的顏色為灰色。
圖2 模塊及連接示意圖Fig.2 Schematic diagram of modules and connections
為了確定每條連接在功能腦網(wǎng)絡(luò)中信息交流的重要性,我們計算了每條連接的介數(shù)中心性[14],連接介數(shù)中心性定義為:
(2)
式中:σst表示從節(jié)點s到節(jié)點t距離最短的路徑條數(shù),σst({i,j})表示從節(jié)點s到節(jié)點t且之間經(jīng)過特定連接(節(jié)點i與節(jié)點j之間的連接)的距離最短的路徑條數(shù)。
提取特征第一步:使用基于“堆結(jié)構(gòu)”的貪婪算法對NC組(90×90)平均相關(guān)矩陣進行模塊劃分(為忽略MCI組和NC組的個體模塊差異,MCI組使用NC組的模塊劃分結(jié)果);第二步:通過圖論計算NC組與MCI組功能連接矩陣中每條連接的介數(shù)中心性,篩選全局橋梁連接,關(guān)于橋梁連接提取的方法,已在2.4節(jié)中詳細闡述;第三步:計算各模塊間與模塊內(nèi)全局橋梁連接數(shù)。
本研究使用SPSS19,單因素方差分析判斷NC、MCI的模塊內(nèi)及模塊間橋梁連接數(shù)是否存在顯著組間差異,并去除性別、年齡協(xié)變量對檢驗結(jié)果的影響。
SVM分類器由SUYKENS et al[15]基于結(jié)構(gòu)風(fēng)險最小化原理提出的一種機器學(xué)習(xí)算法,其特點是具有較強的泛化能力且涉及的參數(shù)較少,因此比較適合對小樣本數(shù)據(jù)進行分類。使用SVM分類器時,有多個核函數(shù)可供選擇,因研究基于不穩(wěn)定的腦影像信號進行分類,選擇SVM徑向基核函數(shù)(radial basis function,RBF)映射特征空間。其中,涉及到C和g兩個參數(shù)。C是懲罰因子,g是核參數(shù)。為了獲得更好的分類效果,設(shè)置C和g的范圍為[2~8,28],步長1,隨后通過網(wǎng)格搜索的方法,可取得最優(yōu)的(C,g).
為實現(xiàn)對疾病數(shù)據(jù)建模及自動識別,利用機器學(xué)習(xí)方法,選擇SVM(RBF核函數(shù))算法,使用交叉驗證隨機選擇所有樣本中的70%為訓(xùn)練集,剩余30%為測試集,重復(fù)100次。生成并評測模型來計算平均正確率、特異率、敏感率。
利用“堆結(jié)構(gòu)”貪婪算法實現(xiàn)對正常組的腦網(wǎng)絡(luò)的模塊劃分,得到如圖3所示的5個模塊并由5種顏色分別表示。表2為各模塊(標(biāo)記為M1至M5)中所包含節(jié)點信息。
圖3 模塊劃分結(jié)果圖Fig.3 Graph of modular division result
表2 模塊劃分結(jié)果Table 2 Result of modular division
綜合模塊劃分結(jié)果來看,M1的腦區(qū)主要來自(前)運動皮層、頂葉和顳葉皮層的區(qū)域,這些區(qū)域主要與軀體感覺、運動有關(guān)[5]。M2的腦區(qū)主要分布于枕葉,其主要功能包括:動作、語言、抽象概念及視覺處理等[16]。M3的腦區(qū)主要參與注意力處理,其主要功能包括:自我意識、記憶、意識與知覺[17]。M4的這些區(qū)域是額葉內(nèi)側(cè)和顳中回的關(guān)鍵組成部分,屬于RALCHLE et al[18]描述的“默認”網(wǎng)絡(luò)。M5的腦區(qū)屬于邊緣系統(tǒng),其主要功能包括:產(chǎn)生情緒、學(xué)習(xí)記憶等[19]。這與先前研究劃分模塊的結(jié)果較為一致。
在統(tǒng)計分析中,圖4是Bonferroni校正后兩兩比較模塊內(nèi)及模塊間橋梁數(shù)的具體信息(圖中橫坐標(biāo)表示各模塊內(nèi)、模塊間)。
由圖4可知,在MCI患者的功能腦網(wǎng)絡(luò)中,并非只出現(xiàn)少數(shù)功能模塊間及模塊內(nèi)的橋梁連接缺失,而是在多個功能模塊間及模塊內(nèi)均發(fā)現(xiàn)存在著不同程度的橋梁連接損傷及補償。在前人的研究當(dāng)中,JI et al[20]基于正常老年人的功能和結(jié)構(gòu)磁共振成像數(shù)據(jù),通過空間獨立分量分析(ICA)發(fā)現(xiàn),當(dāng)核心腦區(qū)中灰質(zhì)(GM)結(jié)構(gòu)體積逐漸變小,需要激活網(wǎng)絡(luò)連接數(shù)量增多(r=0.408,p=0.035),視覺、注意力會出現(xiàn)補償機制,即會增加網(wǎng)絡(luò)之間的連接。SHENG et al[21]發(fā)現(xiàn)MCI在內(nèi)側(cè)顳葉的記憶腦區(qū)結(jié)構(gòu)會明顯萎縮同時發(fā)生連接補償,更指明內(nèi)側(cè)顳葉功能連接的增強有助于鑒別AD傾向受試者,這與本研究發(fā)現(xiàn)基本一致。
圖4 模塊內(nèi)、模塊間邊連接數(shù)的差異Fig.4 Difference in the number of global edges in within-module and between-module
本研究將橋梁連接數(shù)作為輸入特征,利用7折交叉驗證方法對NC與MCI進行分類,平均分類正確率達到92.89%,平均特異率為94.29%(健康人中得出陰性檢測的樣本占健康人總數(shù)的百分比),平均敏感率為97.14%(病人中得出陽性檢測的樣本占病人總數(shù)的百分比)。因此,從分類正確率來看,本研究發(fā)揮出了模塊化橋梁連接數(shù)對腦網(wǎng)絡(luò)分析的優(yōu)勢,證明了本特征選擇方法的有效性。
對比先前基于fMRI提取腦網(wǎng)絡(luò)特征方法的研究,本文應(yīng)用于特征提取的方法明顯提高了分類正確率。梁紅等[8]將功能腦網(wǎng)絡(luò)中的異常屬性輸入SVM訓(xùn)練學(xué)習(xí)模型中作為特征對NC、MCI分類,得到正確率為75.33%。接標(biāo)等[22]利用fMRI數(shù)據(jù),構(gòu)建網(wǎng)絡(luò)得到局部節(jié)點多層次拓撲特征對MCI和NC分類,正確率為82.6%。郭浩等[23]基于fMRI數(shù)據(jù)構(gòu)建腦網(wǎng)絡(luò),利用得到的模塊內(nèi)網(wǎng)絡(luò)屬性度與參與系數(shù)對NC與抑郁癥病人進行分類,最高正確率達90.5%。這些都說明在當(dāng)前的研究中利用節(jié)點拓撲屬性作為特征進行疾病診斷及分類必然會使得信息分析不夠全面充分,進而對研究的分類性能造成影響。因此現(xiàn)將腦網(wǎng)絡(luò)拓撲連接邊應(yīng)用在分類研究的方法已經(jīng)被越來越多的研究認可。另外,從模塊的角度對腦網(wǎng)絡(luò)橋梁連接進行研究,更能有效直觀地發(fā)現(xiàn)腦部疾病患者與正常人在大腦功能模塊上的差異,提高分類正確率。
圖論作為研究復(fù)雜系統(tǒng)的基礎(chǔ)與工具,成為腦精神疾病分類研究的熱點。但是,已有的基于圖論提取功能特征的方法較為繁瑣且單一,無法直觀有效地衡量腦結(jié)構(gòu)的改變帶給功能模塊間信息交流組織模式的影響。為了解決這些問題,本研究首先基于腦網(wǎng)絡(luò)模塊化的角度,選取橋梁連接數(shù)作為樣本特征對MCI和NC進行分類,精確直觀地反映出模塊連接組織模式變換與腦結(jié)構(gòu)改變的相關(guān)程度。其次,本研究在不影響腦網(wǎng)絡(luò)生理學(xué)意義的前提下,篩選橋梁連接去除了冗余的功能連接,與之前腦網(wǎng)絡(luò)特征選取方法等相比,該方法概念簡單,運算量小,因而計算復(fù)雜度大大降低,運算速度提高,實現(xiàn)利用最少的特征數(shù)達到最高的分類正確率的目的。最后,分類結(jié)果顯示,基于模塊化提取橋梁連接數(shù)特征的方法大大提高了MCI檢測的正確率,從而更好地輔助MCI的診斷,以便及早發(fā)現(xiàn)病情。