周震 王洪 景斌
隨著醫(yī)療水平的進(jìn)步,人類壽命得到了顯著的提高,但隨之而來(lái)的老齡化問(wèn)題也日益嚴(yán)重。阿爾茲海默病(Alzheimer disease,AD)是一種常見(jiàn)的老年疾病,對(duì)個(gè)人、家庭、社會(huì)造成了嚴(yán)重影響,但目前尚無(wú)對(duì)其進(jìn)行有效治療的方法,臨床關(guān)注的重點(diǎn)是對(duì)其進(jìn)行早期干預(yù)和早期治療。篩選阿爾茲海默病高危人群的關(guān)鍵在于判斷大腦的老化情況,也就是大腦的“腦齡”,健康老年人有著正常的老化速度,而阿爾茲海默病的高危人群則顯示出加速的老化速度,因而目前急需一種能夠?qū)Υ竽X年齡進(jìn)行客觀估計(jì)的方法。
磁共振成像(magnetic resonance imaging,MRI)作為一種能夠?qū)Υ竽X功能和結(jié)構(gòu)信息進(jìn)行無(wú)損檢測(cè)的工具,已在臨床上有了廣泛的應(yīng)用。靜息態(tài)功能磁共振成像 (resting-state functional MRI,rs-fMRI)能夠記錄大腦在靜息狀態(tài)下的功能信息,具有操作簡(jiǎn)單、易被接受的特點(diǎn),是目前老化研究中的主要工具,并已在腦齡的估計(jì)上取得了很多成果[1-2]。目前對(duì)腦齡的研究還主要集中在結(jié)構(gòu)態(tài)MRI[3-6]上,只有少數(shù)研究探索利用rs-fMRI[7-9]對(duì)大腦年齡進(jìn)行評(píng)估。這一方面在于結(jié)構(gòu)項(xiàng)有著更好的空間分辨率,另一方面也在于fMRI作為一種四維的數(shù)據(jù),具有很高維的數(shù)據(jù)量,如何從海量特征里篩選出有效的功能特征進(jìn)行預(yù)測(cè)是一個(gè)很有挑戰(zhàn)的問(wèn)題。此外,目前在年齡估計(jì)的研究中,很多研究都集中在青中年的年齡段,因?yàn)檫@個(gè)年齡段有著非常豐富的開(kāi)源影像數(shù)據(jù),但在實(shí)際篩選AD的高危人群上,還沒(méi)有模型能夠?qū)χ欣夏杲】等说哪X齡進(jìn)行針對(duì)性的預(yù)測(cè)評(píng)估。
在已有利用靜息態(tài)功能連接特征進(jìn)行年齡預(yù)測(cè)的文章[7]中,特征篩選僅僅是在訓(xùn)練組中篩選出與年齡相關(guān)的功能連接作為特征,但這些特征實(shí)際上泛化性很差,在不同的數(shù)據(jù)集上很難重復(fù),并且篩選后的特征依舊冗余,易導(dǎo)致在后續(xù)機(jī)器學(xué)習(xí)建模過(guò)程中出現(xiàn)過(guò)擬合。因此本研究旨在利用最新提出的一種基于Bootstrap的方法[10]進(jìn)行特征篩選,使用篩選出的在不同訓(xùn)練子集上可泛化的且更簡(jiǎn)約有效的特征進(jìn)行構(gòu)建模型,從而實(shí)現(xiàn)一種面向中老年年齡段的健康受試者的年齡估計(jì)模型,并探索大腦模板、全腦信號(hào)回歸及性別因素等對(duì)預(yù)測(cè)模型性能的影響,進(jìn)而確定出一種最佳的年齡預(yù)測(cè)模型。
本文研究對(duì)象來(lái)自阿爾茨海默病神經(jīng)影像學(xué)計(jì)劃(Alzheimer disease neuroimaging initiative,ADNI)數(shù)據(jù)庫(kù),共選取42例正常人的rs-fMRI數(shù)據(jù)。其中男性16人,女性26人。所有數(shù)據(jù)皆是在Philips 3.0T MRI下掃描,所有受試者皆滿足各項(xiàng)認(rèn)知評(píng)分[蒙特利爾認(rèn)知評(píng)估量表 (Montreal cognitive assessment ,MoCA),簡(jiǎn)易精神狀態(tài)量表 (mini-mental state examination,MMSE)]對(duì)健康受試者的要求。在數(shù)據(jù)質(zhì)量初篩后,刪去1例失真嚴(yán)重的功能影像數(shù)據(jù),最后剩余41例,其中15例為男性,年齡為66~90(78.7±6.2)歲;26例為女性,年齡為65~95(74.8±6.8)歲。rs-fMRI參數(shù)如下:140個(gè)時(shí)間點(diǎn), 脈沖重復(fù)時(shí)間3 000 ms,回波時(shí)間30 ms,翻轉(zhuǎn)角80°,掃描層數(shù)48,層厚=3.3 mm,掃描矩陣64×64。結(jié)構(gòu)態(tài)MRI描參數(shù)如下:脈沖重復(fù)時(shí)間2 300 ms,回波時(shí)間2.98 ms,掃描層數(shù)170,掃描矩陣256×256,層厚 1.2 mm,翻轉(zhuǎn)角 9°。
所有功能數(shù)據(jù)都利用軟件DPABI(http://www.rfmri.org/dpabi)進(jìn)行預(yù)處理,其處理過(guò)程主要包括層間時(shí)間較正、頭動(dòng)校正、協(xié)變量回歸、空間標(biāo)準(zhǔn)化、濾波、平滑等。其中,層間矯正前去掉最開(kāi)始的10個(gè)時(shí)間點(diǎn)的數(shù)據(jù),以去除開(kāi)始掃描時(shí)機(jī)器不穩(wěn)定造成的影響。頭動(dòng)矯正時(shí)所有受試需滿足2 mm或者2°的篩選條件,且對(duì)逐幀位移(framewise displacement,FD)>0.5的時(shí)間點(diǎn)數(shù)據(jù)進(jìn)行刪除,最終所有受試剩余時(shí)間點(diǎn)需大于100。空間標(biāo)準(zhǔn)化是通過(guò)將個(gè)體功能項(xiàng)先配準(zhǔn)到個(gè)體結(jié)構(gòu)項(xiàng),再配準(zhǔn)蒙特利爾神經(jīng)學(xué)研究所(Montreal Neurological Institute,MNI)標(biāo)準(zhǔn)空間的方式實(shí)現(xiàn)。協(xié)變量回歸變量包括線性漂移、白質(zhì)、腦脊液、24頭動(dòng)參數(shù)。另外,考慮到全腦信號(hào)回歸仍是一個(gè)有爭(zhēng)議的步驟,本研究將分別采用全腦信號(hào)回歸及未回歸兩種形式。濾波將采用0.01~0.1 Hz帶通濾波,平滑核為4 mm×4 mm×4 mm半峰全寬(full width at half maxima ,F(xiàn)WHM)的高斯平滑。本研究將采用4種常用的腦分區(qū)模板進(jìn)行功能連接的計(jì)算,包括AAL-90、AAL-1024、Shen-268、Fan-246,先提取出相應(yīng)腦區(qū)的時(shí)間序列信號(hào),然后利用Pearson相關(guān)計(jì)算腦區(qū)之間的功能連接,隨后將得到的功能連接矩陣?yán)肍isher變換轉(zhuǎn)換成Z值矩陣。
提取功能連接矩陣后,由于特征非常高維且冗余,采用一種新提出的基于Bootstrap的特征篩選方法,該方法能有效解決常用的相關(guān)分析篩選特征的不足,極大提高篩選特征的可靠性并可進(jìn)一步特征降維。Bootstrap中有3個(gè)常用的參數(shù):
(1) 抽樣子集占數(shù)據(jù)集的比例,即有多少樣本用來(lái)構(gòu)建抽樣的樣本集;
(2) 抽樣的次數(shù)及方式,即執(zhí)行多少次有放回或無(wú)放回的抽樣;
(3) 抽樣子集提取的特征出現(xiàn)的頻率。
設(shè)采樣次數(shù)為10次,無(wú)放回抽樣,每次抽樣比例為80%,特征出現(xiàn)的頻率為大于等于7,即在10次抽樣中至少被篩選出7次的特征。
利用支持向量回歸的方法構(gòu)建預(yù)測(cè)模型。在建立模型時(shí),首先構(gòu)建無(wú)全腦信號(hào)回歸,無(wú)性別分組的4個(gè)大腦模板下的年齡預(yù)測(cè)模型[圖1(a)]。采用留一法(leave-one out)進(jìn)行交叉檢驗(yàn),即每次使用數(shù)據(jù)集中的一個(gè)樣本當(dāng)作測(cè)試數(shù)據(jù),而數(shù)據(jù)集剩下的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),重復(fù)訓(xùn)練直到所有的樣本都被測(cè)試檢驗(yàn)過(guò)。僅在訓(xùn)練集中進(jìn)行特征篩選,將功能連接和年齡做Pearson相關(guān)分析后具有顯著相關(guān)(P<0.05)的功能連接作為候選特征,隨后利用Bootstrap方法對(duì)候選特征進(jìn)行二次特征篩選。將篩選后的功能連接特征輸入到支持向量回歸模型中,模型內(nèi)的參數(shù)lambda將通過(guò)內(nèi)部的5折交叉檢驗(yàn)在[2-10,2-9,…,210]范圍內(nèi)尋優(yōu),從而確定4個(gè)模板下的最終模型。最后,對(duì)4個(gè)模板下具有最優(yōu)性能的模型分別進(jìn)行全腦信號(hào)回歸,對(duì)性別分組后的模型[圖1(b)]性能進(jìn)行比較。模型將采用預(yù)測(cè)年齡與真實(shí)年齡的r值進(jìn)行評(píng)價(jià),r值越接近1,模型預(yù)測(cè)性能越好。
圖1 年齡預(yù)測(cè)模型Figure 1 Age prediction model
在4種大腦模板AAL-90、AAL-1024、Shen-268、Fan-246下,所建立的大腦年齡預(yù)測(cè)模型的相關(guān)系數(shù)r分別為0.23、0.29、0.17、0.38(圖2),其中利用Fan-246腦圖譜所建立的大腦年齡預(yù)測(cè)模型的相關(guān)系數(shù)r最高。
圖2 四種大腦圖譜下的年齡預(yù)測(cè)模型結(jié)果Figure 2 Age prediction results with four brain atlases
此外,大腦信號(hào)回歸后的數(shù)據(jù)利用Fan-246大腦模板再次進(jìn)行模型構(gòu)建,結(jié)果得到顯著提高,r值達(dá)到0.66。如果再利用性別信息分別構(gòu)建年齡預(yù)測(cè)模型,不論全腦信號(hào)回歸(global signal regression,GSR)與否,年齡預(yù)測(cè)模型的r都是0.46,較最原始模型的性能稍有提高,但仍低于只做全腦信號(hào)回歸后的結(jié)果,這3種模型的散點(diǎn)圖見(jiàn)圖3。
圖3 不同影響因素對(duì)預(yù)測(cè)模型性能的影響Figure 3 Influences of different factors on prediction performances
本研究利用rs-fMRI的功能連接特征進(jìn)行大腦年齡的預(yù)測(cè),結(jié)果表明在Fan-246大腦圖譜下,經(jīng)過(guò)全腦信號(hào)回歸且性別未分組的年齡預(yù)測(cè)模型取得了最佳的識(shí)別性能,相關(guān)的r值達(dá)到0.66,從而表明rs-fMRI可以作為大腦年齡估計(jì)的一種有效的工具。
預(yù)處理時(shí)回歸全局信號(hào),在Fan-246腦圖譜下的年齡預(yù)測(cè)模型的預(yù)測(cè)相關(guān)系數(shù)r提升為0.66,而未回歸全局信號(hào)時(shí)其相關(guān)系數(shù)r僅為0.38,預(yù)測(cè)效果提升明顯。據(jù)報(bào)道全局信號(hào)與頭部的運(yùn)動(dòng)、呼吸和心律相關(guān)[11-13],因此,全局信號(hào)回歸在去除由運(yùn)動(dòng)和其他生理噪聲引起的全局偽影方面非常有效,從而提升模型的預(yù)測(cè)性能。本文在全腦信號(hào)回歸上的發(fā)現(xiàn)也與前文報(bào)道的結(jié)果類似,這也提示在今后的預(yù)測(cè)研究中,全腦信號(hào)回歸是一個(gè)必要的步驟。
不同大腦圖譜對(duì)大腦年齡預(yù)測(cè)效果是不同的,原因在于不同腦圖譜模板對(duì)全腦劃分的依據(jù)是不同的。比如AAL-90腦圖譜[14],是在一個(gè)人的全腦圖像上進(jìn)行劃分,因而很難具有人群的代表性。AAL-1024腦圖譜是將AAL腦圖譜隨機(jī)生成等大小的區(qū)域,雖然消除了腦區(qū)大小的影響,但也失去了分區(qū)的特異性信息,因此這兩種模型的預(yù)測(cè)效果都比較差。Shen-268腦圖譜[15]是對(duì)功能連接進(jìn)行聚類產(chǎn)生的模板,但由于fMRI信號(hào)較差的可重復(fù)性,因而小樣本下的聚類模板很難推廣到其他人群。Fan-246腦圖譜[16]既考慮分區(qū)間的結(jié)構(gòu)相似性又結(jié)合了分區(qū)間的功能相似性,因而在本研究中被證明具有最佳的識(shí)別性能。
性別因素對(duì)年齡估計(jì)的影響不是很明顯,相對(duì)于未性別分組的模型,性別分組后預(yù)測(cè)性能r從0.38提升到0.46,但相較使用全腦信號(hào)回歸但未性別分組的模型性能(r=0.66)還有較大差距。另外,在全腦信號(hào)回歸基礎(chǔ)上再進(jìn)行性別分組的性能(r=0.46)也沒(méi)有提升,這表明性別分組對(duì)經(jīng)過(guò)全腦信號(hào)回歸的預(yù)測(cè)模型并無(wú)益處,一個(gè)可能的原因是不同性別的受試人數(shù)有所差異,導(dǎo)致在性別特異的模型下性能不夠理想。但整體來(lái)說(shuō),性別依舊在大腦發(fā)育及老化過(guò)程中發(fā)揮獨(dú)特的作用,在未來(lái)有足夠樣本量的情況下,性別分組應(yīng)該會(huì)對(duì)大腦相關(guān)功能的預(yù)測(cè)有很大的幫助[17-18]。
本研究中的大部分預(yù)測(cè)模型的準(zhǔn)確度還不夠高,可能由很多方面的原因?qū)е拢?1) 功能連接特征僅僅是體現(xiàn)大腦功能的一個(gè)維度,更多的功能特征可以被結(jié)合起來(lái)進(jìn)行年齡預(yù)測(cè)。(2) 個(gè)體差異性非常大,即同齡人在功能連接上有不同的特征模式,在現(xiàn)有的特征篩選方法中,個(gè)體差異的影響還沒(méi)有得到體現(xiàn),更有效的特征篩選方法可以得到更高的準(zhǔn)確度。(3) 不同年齡段的樣本量不均衡,導(dǎo)致樣本量較小的年齡段不能得到足夠訓(xùn)練,從而誤差相對(duì)較大。(4) fMRI信號(hào)本身信噪比不高,有效的預(yù)處理可以挖掘出更可靠的神經(jīng)活動(dòng)信息。
本研究證明了rs-fMRI可用于健康中老年人的年齡預(yù)測(cè),能夠獲得較好的預(yù)測(cè)性能,并且大腦圖譜的選擇、全腦信號(hào)回歸及性別分組對(duì)年齡預(yù)測(cè)的準(zhǔn)確性都有影響。未來(lái)的研究可在特征挖掘方法及識(shí)別模型上進(jìn)行深入開(kāi)發(fā),從而繼續(xù)提高年齡預(yù)測(cè)的準(zhǔn)確度。