張國棟,董愛美,齊志云,劉思迪
齊魯工業(yè)大學(xué)(山東省科學(xué)院) 計算機科學(xué)與技術(shù)學(xué)部,山東 濟南 250353
阿爾茨海默病(AD)是一種起病隱匿、進行性發(fā)展的神經(jīng)退行性疾病,多見于65歲以上人群,主要影響患者腦功能,臨床表現(xiàn)主要包括記憶力減退、語言障礙、空間定向能力下降、行為和情緒變化以及認知障礙等[1]。目前對AD并無有效的治療手段,只能寄希望于能夠盡早識別出AD患者并及時干預(yù)治療。輕度認知障礙(MCI)是AD的早期階段,對MCI患者進行有效治療可以延緩病情進展甚至促進康復(fù),因此,若能盡早識別出MCI患者,將有助于患者接受治療,防止病情惡化。
隨著人工智能的蓬勃發(fā)展,各種改進的機器學(xué)習(xí)方法開始廣泛應(yīng)用于AD的分類研究中,為使用神經(jīng)影像數(shù)據(jù)輔助醫(yī)生進行AD診斷做出了巨大貢獻。在進行AD分類的研究中,有些學(xué)者關(guān)注于單一模態(tài)圖像的應(yīng)用,如核磁共振成像(MRI)[2]、正電子發(fā)射斷層掃描成像(PET)[3]和彌散張量成像(DTI)圖像[4]等,這些圖像技術(shù)在研究中可以提供豐富的信息,如腦結(jié)構(gòu)、腦代謝和腦連接等方面的特征。Uysal等[5]根據(jù)年齡、性別和左右海馬體積值創(chuàng)建了一個數(shù)據(jù)集,然后通過使用機器學(xué)習(xí)技術(shù)對海馬體積信息進行分類,實驗證明 MRI圖像可用于區(qū)分AD、MCI 和正常對照組(NC)。Fan等[6]提出了一個U-net模型,用于使用MRI圖像進行AD分類。Ji等[7]將MRI圖像的灰質(zhì)和白質(zhì)圖像切片作為輸入數(shù)據(jù),使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進行AD分類,在AD與NC的分類實驗中取得了88.37%的準(zhǔn)確率。Chen等[8]結(jié)合MRI圖像和臨床特征構(gòu)建 Stacking 框架,在AD多分類任務(wù)中平均準(zhǔn)確率達到了86.96%。Al Shehri[9]提出使用DenseNet-169和ResNet-50 CNN架構(gòu)對AD進行診斷和分類,實驗結(jié)果表明,DenseNet-169 架構(gòu)表現(xiàn)出色,準(zhǔn)確率達到了83.83%,而ResNet-50 的準(zhǔn)確率為81.92%。
但是,只使用一種模態(tài)數(shù)據(jù)進行分析勢必會造成信息的不充分,從而影響整體的AD分類準(zhǔn)確率。因此,一些研究學(xué)者開始整合來自多種模態(tài)的神經(jīng)影像數(shù)據(jù),以提高AD分類的分類性能。Huang等[10]使用CNN融合MRI和PET數(shù)據(jù)以提高AD分類準(zhǔn)確率。Lin等[11]構(gòu)建了用于AD分類的3D可逆生成對抗網(wǎng)絡(luò)(GANs)。Cosmo等[12]提出了一種新的端到端的可訓(xùn)練圖學(xué)習(xí)框架,用于動態(tài)和局部圖修剪。該方法可以在提高AD分類精度的同時降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度,提高模型運行速度。Huang等[13]提出了一個可以自動整合多種神經(jīng)影像數(shù)據(jù)和非影像數(shù)據(jù)的通用框架,不僅在AD分類中取得了很好的分類效果,還可以用于自閉癥譜系障礙和眼病預(yù)測。Jiang等[14]在全卷積網(wǎng)絡(luò)模型中添加外部注意力模塊,同時引入Softmax和L1范數(shù)的雙重歸一化方法,以獲得更好的分類的性能和更豐富的特征信息疾病概率圖,在AD分類任務(wù)中,該方法取得了92.36%的分類準(zhǔn)確率。
雖然現(xiàn)有的方法在AD分類中取得了令人滿意的結(jié)果,但仍存在著一定缺陷:首先,多模態(tài)神經(jīng)影像數(shù)據(jù)在預(yù)處理后仍然存在樣本量小、維數(shù)高的問題,限制了模型的分類性能;其次,部分研究只使用了單模態(tài)數(shù)據(jù),沒有充分利用多模態(tài)數(shù)據(jù)的潛在信息,限制了分類效果。為解決以上兩個問題,本文提出了一種基于mRMR和CCA的AD分類方法(mRMR-CCA)。相較于其他方法,該方法具有兩個優(yōu)點:(1)對多模態(tài)神經(jīng)影像數(shù)據(jù)進行特征選擇,去除了冗余信息;(2)挖掘多模態(tài)數(shù)據(jù)間的內(nèi)在聯(lián)系,充分利用多模態(tài)互補信息進行AD分類。
特征選擇可以分為兩個過程:(1)怎樣度量特征相關(guān)性。(2)怎樣解決特征之間的冗余。互信息是一種能夠度量兩個變量之間相關(guān)性的指標(biāo),不僅可以考慮線性關(guān)系,還能考慮非線性關(guān)系,定義兩個變量X和Y之間的互信息如下:
其中,p(x,y)是聯(lián)合分布,p(x)和p(y)是邊際分布,互信息I(X;Y)則為聯(lián)合分布和邊際分布的相對熵。
為了解決特征選擇中的相關(guān)性和冗余問題,研究學(xué)者提出了一種基于互信息理論的特征選擇方法,即最大相關(guān)-最小冗余算法(mRMR),該算法的實現(xiàn)基于兩個關(guān)鍵條件:最大相關(guān)性條件和最小冗余條件。
最大相關(guān)性條件旨在尋找與樣本類別信息相關(guān)性最大的特征子集,通過最大化特征與類別之間的互信息來選出與類別預(yù)測最相關(guān)的特征,目標(biāo)函數(shù)如式(2)所示:
最小冗余條件旨在尋找最小化特征之間重疊信息的特征子集,通過最小化特征之間的互信息,可以確保所選的特征不會包含任何冗余信息,目標(biāo)函數(shù)如公式(3)所示:
其中,S代表特征子集,c為類別標(biāo)簽。
結(jié)合最大相關(guān)和最小冗余這兩個條件,可以得到mRMR的目標(biāo)函數(shù)如下所示:
典型相關(guān)性分析算法(CCA)通過尋找?guī)捉M合適的映射方向來研究少數(shù)幾組變量的相關(guān)性,從而揭示兩種模態(tài)數(shù)據(jù)間的內(nèi)在相關(guān)性。具體而言,假設(shè)有n個樣本,每個樣本有兩種模態(tài)數(shù)據(jù),每種模態(tài)數(shù)據(jù)都包含d個特征,則第一種模態(tài)數(shù)據(jù)可以表示為矩陣X={x1,x2,…,xn}∈d×n,第二種模態(tài)數(shù)據(jù)可以表示為矩陣Y={y1,y2,…,yn}∈d×n。CCA采用搜索出的兩組典型變量wx∈d和wy∈d,使線性組合和之間的相關(guān)系數(shù)最大,即求解相關(guān)系數(shù)的最大值,如式(5)所示:
其中,Cxy=XYT為X和Y之間的互協(xié)方差,并且Cxy=CTyx,Cxx=XXT和Cyy=YYT分別為特征矩陣X和Y的方差。為保證解的唯一性,對該問題采取固定分母,將分子的優(yōu)化作為目標(biāo)的方式,從而將該問題轉(zhuǎn)化成一個凸優(yōu)化的問題,故該目標(biāo)函數(shù)可以轉(zhuǎn)化為:
對于上述優(yōu)化問題,通常采用特征值分解的方法進行求解。
首先,利用拉格朗日乘子法,將式(6)轉(zhuǎn)化為以下目標(biāo)函數(shù):
其中,λ和θ代表拉格朗日乘子。分別對wx、wy求偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)為0可得:
Cxywy-λCxxwx=0, (8)
Cyxwx-θCyywy=0, (9)
分別將式(10)和式(11)互相代入,可得:
在得到新的特征矩陣后,將兩組不同模態(tài)的特征融合成一組新的特征矩陣,這組特征矩陣包含了兩組數(shù)據(jù)的相關(guān)性信息,可以更好地反映數(shù)據(jù)之間的關(guān)聯(lián)。通常采用以下兩種方式進行多模態(tài)特征融合,若采用相加融合的方式,得到的融合特征表示為:
若采用連接融合的方式,得到的融合特征表示為:
為去除多模態(tài)數(shù)據(jù)的冗余信息并充分利用不同模態(tài)間的互補信息,提出基于mRMR和CCA的AD分類方法(mRMR-CCA),該方法主要分為3個步驟:(1)特征選擇;(2)特征融合;(3)AD分類。具體來說,首先使用mRMR算法從每個模態(tài)中選擇出更有助于分類的判別性特征,之后采用CCA算法對多模態(tài)數(shù)據(jù)進行特征融合,在融合過程中采取連接的融合方式,形成一個包含更多互補信息的新的特征集合,以提高分類性能,最后,采用SVM分類器進行分類。詳細過程如圖1所示。
圖1 mRMR-CCA方法流程圖
阿爾茨海默病神經(jīng)成像研究計劃(ADNI)[15]旨在尋找與AD相關(guān)的疾病標(biāo)志物,并為早期AD的診斷和追蹤提供支持的神經(jīng)影像研究計劃。目前,ADNI研究計劃已經(jīng)進行了4個階段的研究(ADNI-1、ADNI-GO、ADNI-2、ADNI-3),其中每個階段都招募了大量的參與者,采集了大量的臨床和影像數(shù)據(jù)。
實驗使用了來自ADNI數(shù)據(jù)庫的156名受試者的MRI和PET神經(jīng)成像數(shù)據(jù)來研究AD分類問題,其中包括3組人群,即AD患者組、MCI患者組和NC受試者組,每組均包括52名受試者。表1提供了這些受試者的詳細信息,包括每個類別的人數(shù)、年齡、MMSE評分[16]和CDR評分[17]。根據(jù)阿爾茨海默癥和相關(guān)疾病協(xié)會的標(biāo)準(zhǔn),NC組受試者的MMSE評分為24~30分,CDR評分為0;MCI組受試者的MMSE評分為24~30分,CDR評分為0.5;AD組受試者的MMSE評分為20~26分,CDR評分為0.5或1。
表1 受試者的統(tǒng)計信息
從ADNI數(shù)據(jù)庫下載了MRI圖像和PET圖像。對于MRI圖像,ADNI執(zhí)行了梯度不均勻性校正以控制圖像質(zhì)量,之后,進一步對數(shù)據(jù)進行預(yù)處理。預(yù)處理操作可以分為兩部分:一是圖像處理,二是特征提取。圖2展示了使用SPM工具[16]對MRI和PET兩種圖像的預(yù)處理過程。
圖2 MRI和PET的預(yù)處理工作流程
對MRI圖像的預(yù)處理主要包括圖像校準(zhǔn)、圖像分割、空間標(biāo)準(zhǔn)化和平滑等操作。具體來說,首先進行前連合-后連合(AC-PC)校正,使得不同個體的數(shù)據(jù)可以進行比較和分析。其次,利用組織概率模板(TPM)可以將MRI圖像分割成灰質(zhì)、白質(zhì)和其他區(qū)域,同時可以將灰質(zhì)和白質(zhì)圖像映射到MNI空間,保證所有的樣本都處于到同一坐標(biāo)系統(tǒng)中。然后,在空間標(biāo)準(zhǔn)化時,使用李代數(shù)微分同胚配準(zhǔn)算法(DARTLE)方法,該方法通過創(chuàng)建群組平均的灰質(zhì)和白質(zhì)圖像,制作平均模板圖像,之后利用該圖像實現(xiàn)原始灰質(zhì)圖像的空間標(biāo)準(zhǔn)化處理。最后,使用8 mm平滑內(nèi)核進行平滑以去除噪聲。對于PET圖像,首先將96張DICOM格式的圖片合并成一張3D PET圖像,其次利用配準(zhǔn)技術(shù)使每個受試者的PET圖像與其對應(yīng)的T1 MRI原始圖像對齊,然后進行頭部運動校正和空間標(biāo)準(zhǔn)化,最后完成平滑操作。
在特征提取中,使用RESTPlus[18]工具。首先將MRI和PET圖像重新采樣到與解剖自動標(biāo)記(AAL)模板[19]相同的大小,即61×73×61。之后,對于MRI圖像,提取對應(yīng)于90個感興趣區(qū)域的平均體積值,提取PET圖像的90個感興趣區(qū)域的平均強度值。
本文進行了3個二元分類任務(wù)來驗證mRMR-CCA的有效性,包括(1) AD vs.NC;(2) MCI vs.NC;(3) AD vs.MCI。此外,使用準(zhǔn)確率(ACCU)、ROC曲線下面積(AUC)、靈敏度(SENS)和特異性(SPEC)4個指標(biāo)來評估分類器的性能。其中,ACCU表示所有樣本被正確分類的概率,SENS表示正確分類的正例樣本占所有正例樣本的準(zhǔn)確率,SPEC衡量模型在預(yù)測反例時的準(zhǔn)確率。在AD vs.NC和MCI vs.NC分類任務(wù)中,將NC視為正樣本,將AD和MCI視為負樣本。在AD vs.MCI的分類任務(wù)中,將MCI視為正樣本,將AD視為負樣本。在每個實驗中,使用LIBSVM工具箱[20]中的SVM分類器作為實驗的分類器。值得注意的是,在SVM分類器中使用了RBF核函數(shù),主要原因是該函數(shù)對數(shù)據(jù)中的噪聲有很好的抗干擾能力。其次,使用非線性核函數(shù)可以獲得更好的結(jié)果。
在本實驗中,比較了mRMR-CCA方法和單獨使用mRMR算法或CCA算法這兩種獨立算法的方法,以評估它們對AD分類性能的影響,并且通過表2展示了它們之間的差異。在表2中,用“粗體”對最佳分類結(jié)果進行了標(biāo)注,對使用到的算法使用“√”進行了標(biāo)記。其中,CCA使用連接融合的方式將多模態(tài)數(shù)據(jù)進行特征融合,mRMR在對兩個模態(tài)數(shù)據(jù)分別進行特征選擇后,同樣使用直接連接的方式將兩個特征集合進行融合。CCA和mRMR算法均有標(biāo)記的為本文提出的方法,即mRMR-CCA。
從表2可以看出,本文提出的mRMR-CCA方法在3個二分類任務(wù)中取得了最好的分類性能,而只使用CCA進行兩種模態(tài)數(shù)據(jù)的特征融合所取得的分類性能最差。這是因為CCA雖然考慮了多模態(tài)數(shù)據(jù)間的內(nèi)在聯(lián)系,可以發(fā)揮出互補信息的作用,但是仍然存在冗余特征,這些冗余特征所含有的干擾信息降低了分類性能。而mRMR雖然能夠從多模態(tài)數(shù)據(jù)中各自選出與標(biāo)簽最相關(guān)的特征,但是從本質(zhì)上講是分別對各模態(tài)數(shù)據(jù)進行的特征選擇,后續(xù)再直接將多模態(tài)數(shù)據(jù)特征進行連接融合,存在丟失多模態(tài)數(shù)據(jù)互補信息的問題,從而導(dǎo)致分類效果不理想。
表2 消融實驗 單位:%
提出的方法充分克服了這兩個問題,首先使用mRMR算法去除了各個模態(tài)數(shù)據(jù)中的冗余信息,選擇出了與分類標(biāo)簽存在最大相關(guān)性的特征,然后再通過CCA來充分挖掘多模態(tài)間存在的互補信息,形成一個新的特征集合,從而使分類性能得到了提升。
為了驗證基于CCA的多模態(tài)融合方式在算法框架中的有效性,選擇將mRMR算法選擇出的兩種模態(tài)的特征采取串行、并行的融合方式作為比較方法。此外,基于CCA的模態(tài)融合方法也有兩種,即連接融合和相加融合的方式,同樣比較了這兩種融合方式的在AD分類問題上的性能差異,來驗證在使用CCA算法基礎(chǔ)上進行連接融合的方法的有效性,實驗結(jié)果如表3所示。
從表3可以看出,本文提出的方法在3個分類任務(wù)中均取得了最好的結(jié)果。同時,直接對多模態(tài)數(shù)據(jù)進行串行或并行的特征融合方式所取得的分類效果并不理想,尤其是在MCI vs.NC的分類任務(wù)中,分類準(zhǔn)確率低于63%。這主要是因為直接將兩個模態(tài)的特征集合進行并行或串行融合,并不能很好地挖掘數(shù)據(jù)中的互補信息和共性特征,反而會導(dǎo)致出現(xiàn)信息相互干擾的問題,從而導(dǎo)致分類性能下降。而本文提出使用CCA算法進行特征融合,更多的考慮了多模態(tài)數(shù)據(jù)間的內(nèi)在聯(lián)系,使得兩種模態(tài)數(shù)據(jù)集的相關(guān)性得到了提升,形成了包含更多互補信息的特征集合,從而提高了分類準(zhǔn)確率。
此外,在使用CCA算法進行特征融合時,可以發(fā)現(xiàn)連接融合要比相加融合所取得的分類性能要好。這主要是因為相加融合更適合兩個數(shù)據(jù)特征具有相同分布的情況,而多模態(tài)數(shù)據(jù)所具有的特征并不具有相同分布,所以相加融合會出現(xiàn)信息損失的問題,從而導(dǎo)致模型分類性能降低,甚至失效。相反,連接融合選擇將兩個數(shù)據(jù)特征進行拼接,雖然這種融合方式會出現(xiàn)維度增加和運行時間稍長等問題,但能夠保證信息完整,使新的特征集合具有多模態(tài)數(shù)據(jù)中的全部互補信息,從而取得更好的分類結(jié)果。
表3 不同特征融合方式的對比 單位:%
為檢驗本文提出的算法在AD分類問題上的有效性,將mRMR-CCA與其他方法進行了對比,分類對比結(jié)果如表4所示。
其中,局部保持投影(LPP)、主成分分析(PCA)以及低秩表示(LRR)[21]3種算法屬于特征選擇方法,首先使用這3種算法分別對各模態(tài)數(shù)據(jù)進行特征選擇,然后將選擇后的特征進行連接融合。Xu等[22]提出了一種多視圖混合嵌入方法(MvHE ),該方法采用分治法的策略來解決多視圖數(shù)據(jù)中存在的差異性和非線性問題。You等[23]提出了多視圖公共分量鑒別分析(MvCCDA ),以聯(lián)合方式處理視圖差異、可分辨性和非線性等問題。低秩公共子空間(LRCS)[24]尋求一個公共的低秩線性投影來緩解不同視圖之間的語義鴻溝,LRCS能夠跨不同視圖捕獲兼容的內(nèi)在信息,并且還能夠很好地對齊來自不同視圖的類內(nèi)樣本。這3種多視圖方法在多視圖公共數(shù)據(jù)集上都取得了很好的分類效果,所以將這些多視圖的理論方法應(yīng)用于AD分類問題。針對AD分類問題,Prajapati等[25]設(shè)計了一個具有全連接層的深度神經(jīng)網(wǎng)絡(luò)(DNN)來執(zhí)行二分類任務(wù),隱藏層使用三種不同類型的激活函數(shù),通過組合不同的激活函數(shù)來獲得性能最佳的模型。
從表4中可看出,提出的方法在3個分類任務(wù)中均取得了不錯的分類性能。與3種特征選擇方法相比,提出的方法有顯著提升,特別是在AD vs.NC分類任務(wù)中,提出的方法使得ACCU提高了40%,SENS提高了23%,SPEC提高了24%,AUC提高了27%,這表明本文方法在區(qū)分AD患者和正常人方面表現(xiàn)得更加出色。與3種多視圖理論學(xué)習(xí)方法相比,提出的方法在AD vs.NC分類任務(wù)中性能略低于MvHE算法,但在其他兩個分類任務(wù)中表現(xiàn)更出色,特別是在MCI vs.NC分類任務(wù)中,ACCU達到了70.27%,SENS達到了73.22%,SPEC達到了68.57%,AUC達到了76.63%。這說明提出的方法能夠有效地識別MCI患者,有助于早期治療,防止病情進一步惡化。與DNN算法相比,mRMR-CCA在MCI vs.NC分類任務(wù)中,準(zhǔn)確率要稍差。但在其他3個指標(biāo)上,提出的方法性能要更好,另外,DNN算法要求的樣本數(shù)量較多,運行速度較慢。所以,綜合來看,mRMR-CCA在AD分類問題上具有更好的性能,具有一定的有效性。
表4 不同方法的對比 單位:%
在mRMR-CCA方法中,首先使用mRMR算法進行特征選擇操作,因此特征數(shù)目的多少對分類性能會有不同程度的影響。為了探究應(yīng)該從各個模態(tài)中選擇多少維特征進行AD分類,使用不同數(shù)量的特征進行分類,并觀察準(zhǔn)確率的變化趨勢。圖3呈現(xiàn)了準(zhǔn)確率的變化趨勢,其中mRMR維數(shù)以5的間隔從5變化到40。
圖3 不同特征選擇數(shù)目的對比
從圖3可看出,在AD vs.NC和AD vs.MCI兩個分類任務(wù)中,隨著mRMR維數(shù)的增加,準(zhǔn)確率呈現(xiàn)出先上升后下降的趨勢。在AD vs.NC分類任務(wù)中,當(dāng)特征維數(shù)為10時,取得的分類準(zhǔn)確率最高;在MCI vs.NC分類任務(wù)中,當(dāng)特征維數(shù)為5時,取得的分類準(zhǔn)確率最高;在AD vs.MCI分類任務(wù)中,最高準(zhǔn)確率出現(xiàn)在mRMR維數(shù)為10的時候。這表明選擇不同數(shù)量的特征對不同的分類任務(wù)影響不同,需要根據(jù)具體的任務(wù)來選擇合適的特征數(shù)量。此外,可以看到在所有分類任務(wù)中,mRMR維數(shù)達到一定程度后,準(zhǔn)確率都會開始下降,這可能是由于過多的特征會引入噪聲和冗余信息,從而降低分類性能。
實驗結(jié)果表明,在mRMR-CCA方法中,特征數(shù)目的選擇對于AD分類具有重要影響。在不同的分類任務(wù)中,需要根據(jù)具體情況選擇合適的特征數(shù)量,以獲得最佳的分類性能。
本文提出了一種基于mRMR和CCA的AD分類方法,旨在利用多模態(tài)數(shù)據(jù)之間的互補信息并消除冗余信息,提高AD的分類準(zhǔn)確性。該方法首先使用mRMR算法從各個模態(tài)數(shù)據(jù)中選擇出最有助于分類的特征,然后使用CCA算法將各個模態(tài)的判別性特征進行連接融合,形成一個新的融合特征矩陣,最后,將該矩陣輸入到SVM分類器中進行AD分類,最終分類結(jié)果通過ACCU、SENS、SPEC、AUC 4個指標(biāo)進行評價。實驗證明,提出的方法在AD分類問題上具有一定的有效性。在未來的工作中,我們期望開發(fā)一種方法,將不完整模態(tài)數(shù)據(jù)用于 AD 分類問題,降低AD數(shù)據(jù)量不足的影響。