摘 ?要:已有很多成果利用結(jié)構(gòu)功能磁共振成像、靜息態(tài)功能磁共振成像等成像數(shù)據(jù)研究機(jī)器學(xué)習(xí)判別分析在阿爾茨海默病患者診斷中的應(yīng)用,經(jīng)進(jìn)一步分析發(fā)現(xiàn),如果能夠綜合利用多種模態(tài)成像特征數(shù)據(jù)將為分類器提供更豐富、全面的信息,有利于最終的判別分析。在這項研究中,提出一種將結(jié)構(gòu)功能磁共振成像、靜息態(tài)功能磁共振成像兩種成像模態(tài)提取的特征結(jié)合的機(jī)器學(xué)習(xí)分類算法應(yīng)用于阿爾茨海默病患者鑒別的方法,相比利用單一模態(tài)數(shù)據(jù)的鑒別模型具有顯著優(yōu)勢。
關(guān)鍵詞:AD疾病輔助診斷;多模態(tài);多分類器;MLDA;SVM;MRI;R-fMRI
中圖分類號:TP391.41 ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)13-0001-04
Abstract:There are many achievements on the application of machine learning discriminant analysis in the diagnosis of AD patients using MRI、R-fMRI and other imaging data. Through further analysis,it is found that if the multi-modal imaging feature data can be used comprehensively,it will provide more abundant and comprehensive information for the classifier,which is conducive to the final discriminant analysis. In this study,the machine learning classification algorithm is proposed to identify the AD patients by combining the feature extraction methods of the two imaging modalities of MRI and R-fMRI. Compared with the identification model using single modal data,it has a significant advantage.
Keywords:aided diagnosis of AD patients;multi-modal imaging;multi-classifier;MLDA;SVM;MRI;R-fMRI
0 ?引 ?言
阿爾茨海默病(Alzheimers disease,AD)是一種常見的進(jìn)行性神經(jīng)衰退性疾病,臨床主要表現(xiàn)為記憶力和其他認(rèn)知功能的下降,它會逐漸破壞患者的記憶和推理、判斷、交流以及處理日?;顒拥哪芰1]。據(jù)報道,自20世紀(jì)80年代中期以來,西方國家65歲以上老年癡呆癥的患病率為3.6%~10.3%,東亞地區(qū)為1.8%~10.8%,另據(jù)估計,大約50%~60%的癡呆患者患有AD[2]。而且患者往往在晚期才被明確診斷為患有AD,因此,在這樣的進(jìn)行性神經(jīng)衰退性疾病晚期,開始任何可能的神經(jīng)保護(hù)治療對疾病的治療都鮮有實質(zhì)性的影響。為了提高對AD患者的基礎(chǔ)研究水平和臨床干預(yù)水平,尋找一種有效的、客觀的診斷方法來區(qū)分早期輕度AD患者和健康對照者是至關(guān)重要的。在過去的二十年里,人們已經(jīng)采取了各種客觀的措施來鑒別、診斷阿爾茨海默病,包括一系列的嗅覺、電生理和神經(jīng)心理學(xué)測試[3]。在提供客觀評估方面,技術(shù)最發(fā)達(dá)的領(lǐng)域是神經(jīng)影像學(xué)[4]。
近年來,神經(jīng)影像學(xué)領(lǐng)域中診斷AD的客觀方法越來越多。以前的大多數(shù)研究都是基于有創(chuàng)傷性的成像方式或單一的成像方式,而這并不是理想的診斷工具。近年來,靜息態(tài)功能磁共振成像(R-fMRI)作為一種高時空分辨率的無創(chuàng)技術(shù),已被用于多種神經(jīng)精神疾病的腦功能異常研究[5,6]。此外,最近一些研究成果利用結(jié)構(gòu)功能磁共振成像(MRI)數(shù)據(jù),根據(jù)提取的特征研究AD的自動分類方法[7,8],比如基于頂點(diǎn)的皮質(zhì)厚度和體素方向的體積特征。綜上所述,這些研究表明AD患者的結(jié)構(gòu)MRI和R-fMRI變化與疾病的嚴(yán)重程度顯著相關(guān),如果能有效地整合結(jié)構(gòu)和功能腦成像信息,就可以更好地將阿爾茨海默病患者與健康人群區(qū)分開來。在這項研究中,我們提出了一種基于多模態(tài)成像特征和多分析器的AD患者分析框架,該分析方法可以綜合各種模態(tài)腦成像信息的優(yōu)點(diǎn)來診斷早期AD患者。通過實驗證明該分析框架相比原有的基于單一模態(tài)數(shù)據(jù)或者基于一種分類器的AD患者鑒別框架在準(zhǔn)確率上具有明顯的優(yōu)勢。下邊依次介紹該框架所用到的四種特征數(shù)據(jù)提取,分析框架的建立、實驗數(shù)據(jù)、分析結(jié)果。
1 ?結(jié)構(gòu)MRI和R-fMRI特征提取
根據(jù)已有的相關(guān)研究成果可知,結(jié)構(gòu)MRI數(shù)據(jù)包含了豐富的腦組織形態(tài)學(xué)信息,包括灰質(zhì)密度(GMD)、白質(zhì)密度(WMD)和腦脊液(CSF)密度,其中灰質(zhì)密度已被廣泛應(yīng)用于研究AD患者的灰質(zhì)萎縮。R-fMRI對于正常和病理狀態(tài)下大腦的內(nèi)在功能結(jié)構(gòu)的分析研究至關(guān)重要。一些研究已經(jīng)利用R-fMRI證明AD疾病與R-fMRI多個層次的特征改變有關(guān),包括低頻振幅(ALFF)、局部一致性(ReHo)、區(qū)域功能連接度(RFCS)。近年來的一些基于機(jī)器學(xué)習(xí)算法的AD患者診斷研究表明,綜合利用多模態(tài)成像信息可以顯著提高AD診斷的識別精度[9,10]。因此在本文研究中,我們提出利用多模態(tài)成像(結(jié)構(gòu)MRI和R-fMRI)的多水平特征(ALFF、ReHo、RFCS、GMD)來區(qū)分AD患者和健康對照組。通過有效地整合豐富而全面的信息,可以提高整個系統(tǒng)的分類能力。
1.1 ?局部一致性
局部一致性(ReHo)最初是用來測量功能磁共振成像時間過程中區(qū)域之間的同步程度,并可用于評估靜息狀態(tài)下的大腦活動。ReHo被定義為給定體素與其最近鄰體素時間序列的Kendall一致性系數(shù)(KCC),相鄰體素的數(shù)目是26。計算公式如下:
其中,n表示時間點(diǎn)數(shù),k為給定體素和其最近鄰體素的點(diǎn)數(shù)和,由于本例中選擇相鄰體素的數(shù)目是26,所以本例中二者之和為27,它們共同構(gòu)成一個成像簇(cluster),Ri為該cluster中每個體素點(diǎn)的體素值, 代表它們的平均值。
為了減少所有受試者變異性的整體影響,用每個體素的ReHo除以每個受試者的整體平均ReHo值。因此,每個受試者都獲得了一張ReHo圖。然后使用自動解剖標(biāo)記(AAL)圖譜將單個ReHo圖劃分為116個感興趣區(qū)域(ROI),并計算每個區(qū)域的平均ReHo值。一個受試者的ReHo特征由每個區(qū)域的平均ReHo組成。
1.2 ?低頻振幅
低頻振幅(ALFF)是衡量人腦固有或自發(fā)神經(jīng)活動能量水平的有效指標(biāo)。簡單來說,首先利用快速傅立葉變換將每個體素的時間序列轉(zhuǎn)換到頻域得到功率譜,然后再在功率譜的每個頻率處計算平方根,最后將0.01~0.10 Hz頻譜范圍內(nèi)的平方根取平均值,即為該體素的ALFF值。為了減少所有受試者變異性的整體影響,將每個體素的ALFF除以全局平均值。因此,每個受試者都獲得了ALFF圖。然后,根據(jù)AAL圖譜,將ALFF圖分為116個感興趣區(qū)域,并通過平均該區(qū)域內(nèi)的ALFF值計算每個區(qū)域的平均ALFF值。一個被試的ALFF特征由每個區(qū)域的平均ALFF組成。
1.3 ?區(qū)域功能連接度
區(qū)域功能連接度(RFCS)是用來測量給定區(qū)域與所有其他區(qū)域之間的平均相關(guān)強(qiáng)度。為了計算靜息狀態(tài)下的功能連通性,首先回歸出頭部運(yùn)動的影響和整個大腦的平均信號,去除這幾個影響協(xié)變量的偽效應(yīng)。然后使用AAL圖譜將單個R-fMRI劃分為116個ROI,然后計算每個區(qū)域內(nèi)所有體素時間序列的平均值。為了度量區(qū)域間的功能連通性,需計算所有潛在區(qū)域?qū)Φ臅r間序列之間的Pearson相關(guān)系數(shù),每個受試者將得到一個116×116的相關(guān)矩陣,然后去掉對角線上的值,即為該被試的RFCS,區(qū)域i的區(qū)域RFCS定義為:
其中,Rij是區(qū)域i和區(qū)域j之間的Pearson相關(guān)系數(shù),N是區(qū)域的數(shù)量。
1.4 ?灰質(zhì)密度
通過線性變換進(jìn)行運(yùn)動校正預(yù)處理后,將每個被試的結(jié)構(gòu)MRI分為三幅圖像:灰質(zhì)密度、白質(zhì)密度和腦脊液密度,在空間上使用統(tǒng)一的配準(zhǔn)算法標(biāo)準(zhǔn)化這三幅圖像,再選擇10 mm窗口大小的高斯核平滑方法對單個GMD圖像處理。最后使用AAL圖譜將單個GMD圖像分割成116個ROI,然后通過平均該區(qū)域內(nèi)所有體素提取每個區(qū)域的平均值,從每個受試者的GMD圖中提取了116個特征。
2 ?基于多模態(tài)腦成像特征和多分類器的AD患者判別模型構(gòu)建
2.1 ?MLDA和SVM分類器特性
本文所提出的多分類器模型主要是基于最大不確定度LDA(線性判別分析)算法MLDA和支持向量機(jī)(SVM)兩類基本機(jī)器學(xué)習(xí)算法,因此下邊就這兩類算法做簡單分析。
由前邊特征選擇描述可知,在本文所提出的框架中,即使進(jìn)行了特征選擇,特征空間的維數(shù)仍然極可能高于樣本數(shù),這就使得在本文中應(yīng)用Fisher線性判別方法做出分類決擇時,由于有限樣本量和特征高維問題,面臨著類內(nèi)離散矩陣Sw是非奇異矩陣或估計不好的風(fēng)險[11]。為了避免類內(nèi)離散矩陣Sw在有限樣本和高維問題中的奇異性和不穩(wěn)定性問題,作為一種基于LDA的優(yōu)化算法,MLDA提出用修正后的類內(nèi)離散矩陣 ?代替根據(jù)原有數(shù)據(jù)計算所得的離散矩陣Sw,該方法基于最大熵協(xié)方差選擇思想,改進(jìn)了有限樣本問題的二次分類性能[12],MLDA僅擴(kuò)展離散矩陣Sw較小且可靠性較低的特征值,并保持其大部分的較大特征值不變,方法如下:
(1)計算矩陣Sp=Sw/N-g(g為樣本類別數(shù))的特征向量矩陣Ф、特征值對角矩陣Λ;
(2)計算平均值 =trace(Sp)/d,將Λ中小于 ?的特征值替換為 ?,大于 ?的特征值保持不變,得到修正之后的對角矩陣Λ*,其中,d為特征維度;
(3)計算修正之后類內(nèi)離散矩陣=(N-g)=Ф Λ*ФT(N-g)。
MLDA是通過將傳統(tǒng)LDA算法所述的基本準(zhǔn)則公式中的Sw替換為 ?而構(gòu)成的,當(dāng)LDA應(yīng)用于有限樣本和高維問題時,該方法克服了類內(nèi)離散矩陣Sw的奇異性和不穩(wěn)定性,還避免了傳統(tǒng)LDA收縮過程中固有的計算成本。
SVM是機(jī)器學(xué)習(xí)領(lǐng)域一類經(jīng)典的分類器,SVM可以在有限樣本上獲得和樣本相適應(yīng)的最好的推廣能力,其突出的優(yōu)勢就是能夠有效避免小樣本問題。
2.2 ?分析模型構(gòu)建
由以上描述可知,由R-fMRI提取的ReHo、ALFF兩類特征和由結(jié)構(gòu)MRI提取的GMD特征可以選用MLDA分類器;對于由R-fMRI提取的RFCS,由于其維度達(dá)到6 670,選用在小樣本分類問題上具有優(yōu)勢的SVM分類器。因此本文所構(gòu)建的AD患者鑒別模型首先將ReHo、ALFF、GMD、RFCS分別輸入四個基本分類器,產(chǎn)生各自的判別結(jié)果,最終的分類結(jié)果是對上述四個特征輸入產(chǎn)生的四個結(jié)果賦予權(quán)值并相加得到,其中四個權(quán)值是對應(yīng)的分類器在訓(xùn)練集上的準(zhǔn)確率。當(dāng)輸入一個未知樣本時,首先提取四個特征矢量,并將其輸入對應(yīng)的四個基本分類模型中,最后用產(chǎn)生的四個結(jié)果乘以訓(xùn)練所得的四個權(quán)值并求和,即可得到該未知樣本的判別結(jié)果,這種方法能更有效地避免歧義訓(xùn)練數(shù)據(jù)對分類器性能的破壞。總結(jié)基于多分類器和多模態(tài)腦成像的AD患者輔助診斷過程如圖1所示。
其中,x1、x2、x3、x4分別對應(yīng)根據(jù)樣本x結(jié)構(gòu)MRI和R-fMRI提取的四個特征:ReHo、ALFF、GMD、RFCS; 表示對應(yīng)特征的分類器,R-fMRI提取的三個特征對應(yīng)MLDA、GMD對應(yīng)SVM;ωk表示每個基本分類模型的投票權(quán)值,該權(quán)值就是 在訓(xùn)練集上的準(zhǔn)確率。
3 ?實驗分析
3.1 ?實驗條件描述
實驗所用數(shù)據(jù)來自西安唐都醫(yī)院,數(shù)據(jù)經(jīng)過醫(yī)學(xué)專家臨床診斷建議認(rèn)定,真實可靠。本次實驗的自愿參與者共57位,其中包括輕度AD患者組27人、正常對照組30人,參與者全部為中國籍、漢語為母語、右利手。
所有輕度AD患者都接受了全面的身體和神經(jīng)檢查以及一系列的神經(jīng)心理學(xué)評估和標(biāo)準(zhǔn)的實驗室測試;所有健康對照組均無神經(jīng)或精神疾病史、感覺運(yùn)動障礙或認(rèn)知障礙,腦部MRI檢查也未見異常。所有自愿參與者在進(jìn)入測試前均獲得書面知情同意書,并經(jīng)醫(yī)院倫理委員會同意,57位參與者的人口統(tǒng)計信息和MMSE值分布情況如表1所示。
3.2 ?特征提取
使用SPM5和DPARSF工具包對所有的功能磁共振成像數(shù)據(jù)(包括結(jié)構(gòu)RMI和R-fMRI)進(jìn)行預(yù)處理,R-fMRI數(shù)據(jù)的預(yù)處理如下,考慮到影響初始磁共振信號不穩(wěn)定性和受試者適應(yīng)環(huán)境的因素,前10幅功能圖像被丟棄;余下的R-fMRI圖像需首先校正切片間的采集時間差,然后通過對齊到第一個體積以校正掃描間頭部運(yùn)動的影響。在這項研究中,頭部在任何方向上最大位移大于2 mm或頭部旋轉(zhuǎn)大于2°的個體被丟棄,以盡量減少運(yùn)動偽影。然后將運(yùn)動校正的功能體積空間歸一化為MNI模板,之后再次采樣為3 mm各向同性體素[13]。接下來使用REST工具包計算ALFF、ReHo和RFCS。
用SPM8對結(jié)構(gòu)RMI圖像進(jìn)行預(yù)處理,首先使用線性變換對所有圖像進(jìn)行偏差校正。然后將校正后的結(jié)構(gòu)圖像分割為GMD圖像、WMD圖像和CSF密度圖像,并使用統(tǒng)一的分割算法在空間上使其標(biāo)準(zhǔn)化。在標(biāo)準(zhǔn)化和分割過程結(jié)束時,使用10 mm FWHM高斯核對GMD圖像進(jìn)行空間平滑處理,所有的GMD圖像被重新采樣為3 mm各向異性體素,以保持所有受試者的恒定分辨率;接下來與功能圖一樣,使用AAL圖譜將單個GMD圖劃分為116個ROI,然后通過平均該區(qū)域內(nèi)所有體素的GMD值來提取每個區(qū)域的平均GMD值。
3.3 ?留一交叉校驗法
為了驗證本文所提出的AD患者輔助診斷方法的有效性和優(yōu)勢,需要將實驗數(shù)據(jù)劃分為測試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集,但是鑒于實驗樣本容量只有57,樣本量太小,所以采用留一交叉校驗法(LOOCV)來評估所提出判別方法的性能,即每實驗一次,將其中一個樣本作為測試集,其余樣本則被用來訓(xùn)練多分類器,直到所有樣本都被測試完畢。在LOOCV預(yù)測結(jié)果的基礎(chǔ)上,可以定義準(zhǔn)確率(Accuracy)、靈敏度(Sensitivity)、特異度(Specificity)以量化LOOCV過程中分類器的性能。
三個指標(biāo)定義如下:
其中,TP、FN、TN和FP分別表示正確預(yù)測的患者數(shù)量、被劃分為正常對照者的患者數(shù)量、正確預(yù)測的正常對照者數(shù)量和被劃分為患者的正常對照者數(shù)量。
4 ?實驗結(jié)果分析
為了去掉一些冗余的特征以改善多分類器的AD患者鑒別性能,在輸入分類器之前我們使用特征選擇算法來選擇具有最大鑒別能力的特征,以提高最終的判別性能。在這項研究中,我們使用雙T檢驗特征選擇方法來比較兩組受試者之間不同腦區(qū)的特征值,ALFF、ReHo、RFCS和GMD四類特征矢量在提取之后都進(jìn)行雙T檢驗,選擇兩組間有顯著性差異(P<0.05,未修正)的特征,我們還使用非參數(shù)秩和檢驗進(jìn)行特征選擇,得到了相似的結(jié)果,當(dāng)然這里的雙T檢驗只在每次LOOCV折疊訓(xùn)練數(shù)據(jù)集上執(zhí)行,以避免分類器的過度擬合。
我們用LOOCV來估計分類器的泛化能力,表2詳細(xì)列出了基于各種組合和簡單類型特征的分類性能。從表中可以看出,本文提出的基于四種特征組合的多分類器AD鑒別方法在三個性能評估指標(biāo)方面都表現(xiàn)優(yōu)異,其準(zhǔn)確率達(dá)到92.98%,靈敏度為88.19%,特異度為94.39%,這些結(jié)果準(zhǔn)確率、靈敏度、特異度三個方面都優(yōu)于任何單一類型的特征或其他類型的多類型特征組合得到的值;而且從表中結(jié)果可以看到,綜合多種模態(tài)數(shù)據(jù)特征的分類模型對AD患者腦部圖像的分類能力整體優(yōu)于利用單一模態(tài)數(shù)據(jù)特征的分類模型。
5 ?結(jié) ?論
本文系太原工業(yè)學(xué)院青年基金項目“基于張量模式的多模態(tài)多特征AD患者輔助診斷方法研究”的研究成果。與單一模態(tài)成像相比,使用多種模態(tài)數(shù)據(jù)特征的分類模型的優(yōu)勢在于能提取更多的特征(有效特征)。從理論上講,多模態(tài)方法采用不同的特征作為輸入,這些輸入可以綜合反映樣本的多個方面特性,這種分類的特征選擇策略能更多更全面地反映不同類別的特性,并針對不同特征的特點(diǎn)采用適宜的機(jī)器學(xué)習(xí)方法來構(gòu)造分類器,能獲得更精確的解。事實上,實驗結(jié)果表明基于單模態(tài)的分類器性能低于多模態(tài)方法分類器。
這項研究還有幾個方面需要改進(jìn)。首先,我們使用線性回歸方法來減少低頻漂移和高頻生理噪聲的影響,但這并不是最有效的方法;在未來的研究中,這些生理效應(yīng)應(yīng)該通過在數(shù)據(jù)采集過程中同時記錄呼吸和心臟周期來估計和消除。第二,雖然我們使用了結(jié)構(gòu)功能磁共振成像和靜息態(tài)功能磁共振成像數(shù)據(jù),但也有其他方法(如EEG、PET)可用于進(jìn)一步提高分類性能。第三,我們使用AAL圖譜將大腦圖像分成116個ROI,也可以使用其他結(jié)構(gòu)和功能腦部圖譜,因為不同的分割方法可能產(chǎn)生不同的結(jié)果。事實上,最近的幾項研究表明,不同的分組地圖集可以影響大腦網(wǎng)絡(luò)的連接模式。在未來的研究中我們會把該方法應(yīng)用到其他的腦圖譜中。
參考文獻(xiàn):
[1] JEONG J S. EEG dynamics in patients with Alzheimers disease [J]. Clinical Neurophysiology,2004,115(7):1490-1505.
[2] LEE D Y,LEE J H,JU Y S,et al. The Prevalence of Dementia in Older People in an Urban Population of Korea:The Seoul Study [J]. Journal of the American Geriatrics Society,2002,50(7):1233-1239.
[3] JODI K,RICHARD C,WAYNE M. Parkinsonian syndromes and differential diagnosis [J]. Current opinion in neurology,2002,15(4):461-466.
[4] PICCINI P,WHONE A. Functional brain imaging in the differential diagnosis of Parkinsons disease [J]. Lancet Neurology,2004,3(5):284-290.
[5] GREICIUS M D,SRIVASTAVA G, REISS A L,et al. Default-Mode Network Activity Distinguishes Alzheimers Disease from Healthy Aging:Evidence from Functional MRI [J]. Proceedings of the National Academy of Sciences of the United States of America,2004,101(13):4637-4642.
[6] CHEN G,WARD B D,XIE C M,et al. Classification of Alzheimer disease,mild cognitive impairment,and normal cognitive status with large-scale network analysis based on resting-state functional MR imaging [J]. Radiology,2011,259(1):213-221.
[7] HIRATA Y,MATSUDA H,NEMOTO K,et al. Voxel-based morphometry to discriminate early Alzheimers disease from controls [J]. Neuroscience letters,2005,382(3):269-274.
[8] KARAS G B,BURTON E J,ROMBOUTS S A R B,et al. A comprehensive study of gray matter loss in patients with Alzheimers disease using optimized voxel-based morphometry [J]. Neuroimage,2003,18(4):895-907.
[9] ZHANG D Q,WANG Y P,ZHOU L P,et al. Multimodal classification of Alzheimers disease and mild cognitive impairment [J]. NeuroImage,2011,55(3):856-867.
[10] WALHOVD K B,F(xiàn)JELL A M,BREWER J,et al. Combining MR imaging,positron-emission tomography,and CSF biomarkers in the diagnosis and prognosis of Alzheimer disease [J]. AJNR. American journal of neuroradiology,2010,31(2):347-354.
[11] 張宇萍.基于Fisher準(zhǔn)則的二次線性特征提取 [J].西安工業(yè)大學(xué)學(xué)報,2007(5):460-463.
[12] ZANG Y F,HE Y,ZHU C Z,et al. Altered baseline brain activity in children with ADHD revealed by resting-state functional MRI [J]. Brain & development,2007,29(2):83-91.
[13] ASHBURNER J,F(xiàn)RISTON K J. Unified segmentation [J]. Neuroimage,2005,26(3):839-851.
作者簡介:徐鑫秀(1984—),男,漢族,山西朔州人,助教,碩士研究生,研究方向:機(jī)器學(xué)習(xí)、模式識別。