林 嵐,金 悅,吳水才
(北京工業(yè)大學(xué)環(huán)境與生命學(xué)部生物醫(yī)學(xué)工程系智能化生理測(cè)量與臨床轉(zhuǎn)化北京市國際科研合作基地,北京100124)
老化是一個(gè)漸進(jìn)的、多因素的、有時(shí)間依賴性的過程,其表現(xiàn)為隨年齡增長(zhǎng)而導(dǎo)致的功能喪失及生理和心理損傷。在老化過程中,人的大腦結(jié)構(gòu)會(huì)發(fā)生改變,包括腦萎縮、皮質(zhì)變薄、白質(zhì)連接減少[1]。增齡性的大腦結(jié)構(gòu)和功能的變化會(huì)導(dǎo)致記憶和處理速度等認(rèn)知能力下降[2-3],以及患阿爾茨海默病(Alzheimer’s disease,AD)等神經(jīng)退行性疾病的風(fēng)險(xiǎn)增加[4]。老化可能受到環(huán)境、機(jī)械、生物化學(xué)和進(jìn)化等復(fù)雜因素相互作用的影響。眾所周知,老化會(huì)導(dǎo)致腦損傷的發(fā)生,但老年人的神經(jīng)生物學(xué)老化軌跡差異較大,在空間和時(shí)間上具有異質(zhì)性。許多神經(jīng)影像學(xué)研究集中在開發(fā)潛在的腦老化標(biāo)記物[5-7],例如利用MRI獲得的大腦結(jié)構(gòu)和功能特征,采用機(jī)器學(xué)習(xí)算法預(yù)測(cè)個(gè)體大腦的腦年齡(如圖1所示)[8-9]。通過將腦年齡的預(yù)測(cè)值與生理年齡相減,可獲得腦年齡估值差(brain age gap estimation,BrainAGE)。例如,一位75歲的老年人表現(xiàn)出BrainAGE+5歲,則他的大腦衰老程度與一位80歲的老年人相似。BrainAGE的個(gè)體差異與一系列認(rèn)知、生物測(cè)量、健康狀況和生活習(xí)慣等因素有關(guān),包括心血管健康[10-11]、身體素質(zhì)[12]、運(yùn)動(dòng)[13]等。與此同時(shí),BrainAGE的數(shù)值也可反映患有AD[14]、艾滋病[15]、唐氏綜合征[16]、癲癇[17]、外傷性腦損傷[18]、精神疾病[19]等疾病的患者與健康對(duì)照者之間的差異。
精準(zhǔn)預(yù)測(cè)腦年齡能夠優(yōu)化BrainAGE,使其可以作為一種生物標(biāo)志物。研究人員在研究中使用不同類型的機(jī)器學(xué)習(xí)模型來預(yù)測(cè)腦年齡,例如支持向量回歸[20]、人工神經(jīng)網(wǎng)絡(luò)[6]、相關(guān)向量回歸[8]以及高斯過程回歸[18]等。前期課題組也從多模態(tài)角度對(duì)腦年齡預(yù)測(cè)模型的構(gòu)建進(jìn)行了詳細(xì)的綜述[21]。但是傳統(tǒng)的機(jī)器學(xué)習(xí)方法是依靠人工進(jìn)行特征提取,需要一定的先驗(yàn)知識(shí),具有主觀性。面對(duì)日益增長(zhǎng)的神經(jīng)影像數(shù)據(jù),使用傳統(tǒng)機(jī)器學(xué)習(xí)方法提取特征需要花費(fèi)大量的時(shí)間和人力。作為機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新興研究方向,深度學(xué)習(xí)[22]受到人腦工作方式的啟發(fā),是一種利用深度神經(jīng)網(wǎng)絡(luò)求解特征表達(dá)的學(xué)習(xí)過程。傳統(tǒng)機(jī)器學(xué)習(xí)模型在全年齡段進(jìn)行腦年齡預(yù)測(cè)的誤差一般為4~5 a。但是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)模型和海量神經(jīng)影像數(shù)據(jù)的結(jié)合,可以大大提高模型預(yù)測(cè)的準(zhǔn)確性,為其潛在的臨床應(yīng)用奠定基礎(chǔ)。因此,本文根據(jù)CNN模型輸入圖像的不同,從二維切片、三維圖像塊與三維全腦圖像3個(gè)方面概括基于CNN的腦年齡預(yù)測(cè)模型的一些典型研究成果,并從數(shù)據(jù)集、模型兩方面探討研究中存在的問題及今后的發(fā)展方向。
圖1 腦年齡預(yù)測(cè)模型
CNN是一種基于生物感知機(jī)制的深度學(xué)習(xí)網(wǎng)絡(luò)。該網(wǎng)絡(luò)包括輸入層、卷積層、池化層、全連接層和輸出層,在圖像處理領(lǐng)域取得了較好的效果。在神經(jīng)影像領(lǐng)域中,輸入圖像基本可劃分為二維切片、三維圖像塊與三維全腦圖像。本文重點(diǎn)關(guān)注大腦老化方面,但也包括部分嬰幼兒時(shí)期的腦年齡預(yù)測(cè)模型,因?yàn)樵诶碚撛O(shè)計(jì)上,這些模型可以直接推廣到更大的年齡范圍之后再使用。在沒有特別說明的情況下,輸入圖像中的MRI特指T1加權(quán)MRI,MRI圖像一般都會(huì)采用線性配準(zhǔn)與去頭皮操作進(jìn)行簡(jiǎn)單處理。
典型的CNN模型是一種二維圖像處理模型,其在圖像的分類、分割和識(shí)別方面已取得不少成果[23-24]。但是二維CNN模型一般無法直接應(yīng)用于三維神經(jīng)影像,因此,研究者們一般先從三維圖像中提取一張或多張二維切片,隨后使用二維CNN模型來預(yù)測(cè)腦年齡。
Lin等[25]以4個(gè)開放數(shù)據(jù)庫的594名中老年受試者[年齡范圍為50~90歲,平均年齡(67.80±9.19歲)]為研究對(duì)象。首先利用AlexNet對(duì)二維灰質(zhì)密度圖進(jìn)行特征提取,然后采用三維特征融合、主成分分析降維和相關(guān)向量回歸對(duì)腦年齡進(jìn)行預(yù)測(cè),五折交叉檢驗(yàn)結(jié)果表明該模型預(yù)測(cè)腦年齡的平均絕對(duì)誤差(mean absolute error,MAE)為4.51 a。該研究?jī)H從橫斷面運(yùn)用CNN進(jìn)行了特征提取,后續(xù)的研究中研究者開始考慮從多方向進(jìn)行特征提取。Rossi等[26]基于圖像信息提?。╥nformation extraction of images,IXI)數(shù)據(jù)庫中的561名[年齡范圍為20~86歲,平均年齡(48.65±16.45)歲,訓(xùn)練集、驗(yàn)證集和測(cè)試集分別為447、56和58名]受試者,從橫斷面、矢狀面和冠狀面分別提取二維切片,并將3張連續(xù)切片轉(zhuǎn)換成1張三通道圖像。不同方向的三通道圖像會(huì)根據(jù)其空間位置順序被輸入至3個(gè)已經(jīng)預(yù)訓(xùn)練的經(jīng)典CNN模型,進(jìn)行相應(yīng)的特征編碼提取。再通過雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)對(duì)特征進(jìn)行融合,并進(jìn)一步通過全連接層來進(jìn)行腦年齡預(yù)測(cè)。該研究中經(jīng)典CNN模型分別采用了VGG16、ResNet101和DenseNet121 3種結(jié)構(gòu),其中VGG16的結(jié)果最優(yōu),MAE為5.94 a。腦年齡預(yù)測(cè)的概念也被應(yīng)用于描述大腦的發(fā)育過程。Shi等[27]將659名胎兒(胎齡22~39周)的T2加權(quán)MRI圖像分為訓(xùn)練集(占70%)、驗(yàn)證集(占10%)和測(cè)試集(占20%)3組?;谧⒁饬C(jī)制,建立了深度殘差模型,模型包含3個(gè)不同的注意力模塊,每個(gè)模塊都包含一個(gè)主干分支和一個(gè)掩碼分支。其中主干分支由多個(gè)殘差瓶頸塊組成,掩碼分支實(shí)現(xiàn)特征增強(qiáng)。在胎兒的腦年齡預(yù)測(cè)中,以中央切片為輸入圖像的基于注意力機(jī)制的深度殘差集成模型預(yù)測(cè)的MAE為0.767周。
二維切片的CNN模型處理過程中存在一定的空間信息損失,但是基于完整全腦三維影像的CNN模型對(duì)計(jì)算機(jī)顯存與計(jì)算能力提出了更高的要求。所以基于三維圖像塊的處理技術(shù)成為一種折中選擇?;谌S圖像塊的方法是指根據(jù)一定的準(zhǔn)則從三維神經(jīng)影像中提取一個(gè)或多個(gè)尺寸相同或不同的三維圖像塊作為網(wǎng)絡(luò)輸入。
Hong等[28]構(gòu)建了一個(gè)基于三維圖像塊的CNN模型用于嬰幼兒的腦年齡預(yù)測(cè)。試驗(yàn)對(duì)象為220名0~5歲的嬰幼兒,其中訓(xùn)練集包含176名嬰幼兒,其余為測(cè)試集。該研究基于12張二維MRI切片提取1個(gè)像素為128×116×12的圖像塊,構(gòu)建的三維CNN模型與VGG的體系結(jié)構(gòu)相似,包含7個(gè)3×3×3的卷積層。該模型預(yù)測(cè)腦年齡的MAE為67.6 d。當(dāng)把數(shù)據(jù)轉(zhuǎn)換為1張十二通道圖像,輸入層次結(jié)構(gòu)一致的二維切片模型,發(fā)現(xiàn)模型腦年齡預(yù)測(cè)誤差增加了約10%。在輸入信息相同的情況下,三維圖像塊模型相對(duì)二維切片模型具有更好的性能。Dinsdale等[29]使用英國生物銀行(UK biobank,UKB)的MRI數(shù)據(jù)集進(jìn)行腦年齡預(yù)測(cè),其中訓(xùn)練集包含12 802名受試者,測(cè)試集包含6 885名受試者,受試者年齡范圍為44.6~80.6歲。為了減少計(jì)算量,從橫斷面等間隔降采樣抽取了20張切片組成三維圖像塊。在VGG結(jié)構(gòu)的設(shè)計(jì)框架下,三維CNN模型包含5個(gè)卷積塊、12個(gè)3×3×3的卷積層。為了創(chuàng)建最終的網(wǎng)絡(luò),將3個(gè)CNN合并為一個(gè)集成網(wǎng)絡(luò)。在線性配準(zhǔn)時(shí),集成網(wǎng)絡(luò)模型對(duì)男性和女性腦年齡預(yù)測(cè)的MAE分別為3.09和2.87 a。在非線性配準(zhǔn)時(shí),集成網(wǎng)絡(luò)模型對(duì)男性和女性腦年齡預(yù)測(cè)的MAE分別為2.91和2.71 a。隨后對(duì)試驗(yàn)對(duì)象的BrainAGE和非圖像衍生變量之間的關(guān)系進(jìn)行了分析,結(jié)果表明,雖然非線性變換后得到的腦年齡預(yù)測(cè)模型誤差較小,但是線性變換后得到的模型BrainAGE具有更好的可解釋性。從某種意義上,非線性變換由于受到算法的驅(qū)動(dòng),會(huì)丟失一些與老化相關(guān)的細(xì)節(jié),限制了其臨床應(yīng)用。
在傳統(tǒng)的CNN體系結(jié)構(gòu)中,模型由多個(gè)重復(fù)的卷積層、池化層組成,其代表分別為AlexNet和VGGNet。把傳統(tǒng)的二維CNN模型設(shè)計(jì)模式推廣到三維,是一種常用的設(shè)計(jì)方法。
Wang等[30]采用來自鹿特丹研究的數(shù)據(jù)用于腦年齡預(yù)測(cè),數(shù)據(jù)被劃分為訓(xùn)練集[3 688名受試者,平均年齡(66.09±10.76歲)]、驗(yàn)證集[1 099名受試者,平均年齡(64.84±9.69)歲]和測(cè)試集[550名受試者,平均年齡(64.85±10.82)歲]。該研究中使用的三維模型設(shè)計(jì)與AlexNet相似,包含8個(gè)三維卷積層、4個(gè)卷積塊。其模型輸入為三維灰質(zhì)密度圖,并將性別作為特征引入全連接層,使得模型能夠較好地預(yù)測(cè)不同性別對(duì)象的年齡,預(yù)測(cè)的MAE為4.45 a。Cole等[31]使用14個(gè)開放數(shù)據(jù)庫的2 001名對(duì)象來構(gòu)建全年齡段數(shù)據(jù)集[年齡范圍為18~90歲,平均年齡(36.95±18.12)歲]。該研究中使用基于深度學(xué)習(xí)的預(yù)測(cè)建模方法,其中三維模型的結(jié)構(gòu)類型與VGG網(wǎng)絡(luò)一致,包含5個(gè)3×3×3的卷積塊。其根據(jù)灰質(zhì)密度圖、白質(zhì)密度圖、灰質(zhì)和白質(zhì)密度圖與T1加權(quán)MRI圖像分別構(gòu)建4個(gè)CNN模型。對(duì)200名附加對(duì)象的測(cè)試結(jié)果顯示,基于灰質(zhì)密度圖的CNN模型對(duì)腦年齡的預(yù)測(cè)結(jié)果最精確,MAE為4.16 a。Feng等[32]整理多個(gè)開放數(shù)據(jù)庫(10 158張MRI圖像來自6 142名受試者,年齡范圍為18~97歲),通過年齡平衡技術(shù)構(gòu)建數(shù)據(jù)集(2 852張MRI圖像來自2 794名受試者,訓(xùn)練集占80%,驗(yàn)證集與測(cè)試集各占10%)。隨后,訓(xùn)練了一個(gè)VGG結(jié)構(gòu)的腦年齡預(yù)測(cè)模型,其預(yù)測(cè)的MAE為4.06 a。與此同時(shí),發(fā)現(xiàn)三維模型與基于單一切片的二維模型相比,腦年齡預(yù)測(cè)誤差減少了2 a左右。此外,灰質(zhì)形態(tài)學(xué)的結(jié)構(gòu)協(xié)方差研究表明,不同的結(jié)構(gòu)網(wǎng)絡(luò)呈現(xiàn)出與年齡有關(guān)的變化,但還不清楚這些變化對(duì)腦年齡預(yù)測(cè)的影響。Jiang等[33]基于5個(gè)開放數(shù)據(jù)庫的1 454名年齡在18~90歲的健康受試者構(gòu)建數(shù)據(jù)集,其中訓(xùn)練集包含1 303名、測(cè)試集包含151名。該研究把VGG-13模型從二維直接擴(kuò)展到三維,并將試驗(yàn)對(duì)象的結(jié)構(gòu)網(wǎng)絡(luò)劃分為額頂葉網(wǎng)絡(luò)、背側(cè)注意網(wǎng)絡(luò)、默認(rèn)模式網(wǎng)絡(luò)等7個(gè)網(wǎng)絡(luò),輸入對(duì)應(yīng)的結(jié)構(gòu)網(wǎng)絡(luò),構(gòu)建了7個(gè)模型。其中,額頂葉網(wǎng)絡(luò)、背側(cè)注意網(wǎng)絡(luò)、默認(rèn)模式網(wǎng)絡(luò)構(gòu)建的模型腦年齡預(yù)測(cè)的MAE為5~6 a,其余網(wǎng)絡(luò)構(gòu)建的模型腦年齡預(yù)測(cè)的MAE大于8 a。該研究結(jié)果也體現(xiàn)了不同結(jié)構(gòu)網(wǎng)絡(luò)模型與年齡之間的相關(guān)性。
深度學(xué)習(xí)在利用神經(jīng)影像學(xué)數(shù)據(jù)準(zhǔn)確預(yù)測(cè)疾病方面具有很大潛力,但預(yù)測(cè)性能常常受到訓(xùn)練數(shù)據(jù)集的限制。最近1~2 a,研究人員進(jìn)一步將神經(jīng)影像大數(shù)據(jù)集建設(shè)與深度學(xué)習(xí)結(jié)合起來。Levakov等[34]綜合15個(gè)開放數(shù)據(jù)集的10 176名受試者(4~94歲)的MRI圖像,使用10個(gè)CNN模型通過集成訓(xùn)練對(duì)腦年齡進(jìn)行預(yù)測(cè)。該研究中采用的模型為包含2個(gè)卷積塊、4個(gè)3×3×3的卷積層的VGG結(jié)構(gòu),在測(cè)試集上該模型腦年齡預(yù)測(cè)的MAE為3.07 a。Peng等[35]設(shè)計(jì)的三維網(wǎng)絡(luò)結(jié)構(gòu)類似于VGG,使用MRI數(shù)據(jù)預(yù)測(cè)腦年齡。在建模過程中采用了數(shù)據(jù)擴(kuò)充、預(yù)訓(xùn)練、模型正則化、模型集成和預(yù)測(cè)偏差校正等多種方法。該網(wǎng)絡(luò)結(jié)構(gòu)在UKB數(shù)據(jù)集上[共有14 503名受試者,年齡范圍為44~80歲,平均年齡(52.7±7.5)歲,訓(xùn)練集包含12 949名]表現(xiàn)優(yōu)異,腦年齡預(yù)測(cè)的MAE為2.14 a。
與傳統(tǒng)架構(gòu)相比,GoogLeNet、ResNet、DenseNet等通過對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化獲得性能提升。Pardakhti等[36]利用IXI數(shù)據(jù)集(試驗(yàn)對(duì)象為562名健康受試者,訓(xùn)練集包含400名、測(cè)試集包含162名),建立了基于ResNet的模型,包含5個(gè)卷積層,腦年齡預(yù)測(cè)的MAE為5.81 a。最近的一項(xiàng)研究[37]將21 382名UKB數(shù)據(jù)集中的受試者分為4組:訓(xùn)練組(n=3 067)、驗(yàn)證組(n=3 962)、健康測(cè)試組(n=2 057)和未選擇測(cè)試人群(n=12 296),使用ResNet結(jié)構(gòu)的三維CNN模型進(jìn)行腦年齡預(yù)測(cè),MAE為1.71 a。應(yīng)用該模型對(duì)未選擇測(cè)試人群進(jìn)行研究,發(fā)現(xiàn)BrainAGE與心血管和代謝疾病及其危險(xiǎn)因素、認(rèn)知功能和身體活動(dòng)之間存在顯著的相關(guān)性?;诜謱芋w系結(jié)構(gòu)的模型可獲得更好的預(yù)測(cè)性能。Liu等[38]設(shè)計(jì)了一個(gè)兩級(jí)級(jí)聯(lián)體系的網(wǎng)絡(luò)結(jié)構(gòu),其中第一個(gè)網(wǎng)絡(luò)預(yù)測(cè)離散化年齡范圍,第二個(gè)網(wǎng)絡(luò)則對(duì)腦年齡作進(jìn)一步的預(yù)測(cè)。傳統(tǒng)DenseNet連接前一層尺度相同的特征地圖,該研究借鑒DenseNet的網(wǎng)絡(luò)結(jié)構(gòu),采用比例密集塊的結(jié)構(gòu),通過密集連接路徑進(jìn)行控制,利用池化方法將前幾層不同尺度的特征圖進(jìn)行連接。另外,除了使用傳統(tǒng)的均方誤差外,該網(wǎng)絡(luò)結(jié)構(gòu)還采用了配對(duì)樣本和批量樣本2種新的等級(jí)損失來規(guī)范訓(xùn)練過程。與此同時(shí),性別也被作為一種網(wǎng)絡(luò)的輸入特征,從而獲得更準(zhǔn)確的預(yù)測(cè)。最終的試驗(yàn)結(jié)果表明,多網(wǎng)絡(luò)集成學(xué)習(xí)模型在多個(gè)開放數(shù)據(jù)庫所組成的大型異構(gòu)數(shù)據(jù)集中[6 586名試驗(yàn)對(duì)象,年齡范圍為17~98歲,平均年齡(54.7±24.44)歲]腦年齡預(yù)測(cè)的MAE為2.43 a。
CNN和神經(jīng)影像數(shù)據(jù)的結(jié)合為腦年齡預(yù)測(cè)領(lǐng)域帶來了質(zhì)的變化,腦年齡預(yù)測(cè)模型的MAE從2017年的4~5 a下降到2 a左右,使其進(jìn)一步的臨床應(yīng)用成為可能[31,38]。但腦年齡預(yù)測(cè)研究中依舊存在一些需要注意的問題,以下將從數(shù)據(jù)集和模型2個(gè)方面對(duì)此進(jìn)行探討。
數(shù)據(jù)集是腦年齡預(yù)測(cè)模型的一個(gè)關(guān)鍵要素,這里數(shù)據(jù)集指模型中使用的訓(xùn)練集。首先,為了使基于CNN的腦年齡預(yù)測(cè)模型得到廣泛應(yīng)用,訓(xùn)練使用的數(shù)據(jù)集必須能夠反映老化模式的多樣性。神經(jīng)影像數(shù)據(jù)集的樣本數(shù)量往往相對(duì)較少,這會(huì)限制模型有效學(xué)習(xí)影像特征的能力,導(dǎo)致過度擬合的問題。為發(fā)揮深度學(xué)習(xí)算法的優(yōu)勢(shì),研究者通常會(huì)采用2種方式來構(gòu)造大數(shù)據(jù)集。一種是建立在多個(gè)開放數(shù)據(jù)源上的數(shù)據(jù)集[32,34,38],另一種是建立在像UKB這樣的大數(shù)據(jù)集上[29,35,37]。2種方式各有優(yōu)缺點(diǎn),前者圖像采集序列、設(shè)備、場(chǎng)強(qiáng)均存在不同,數(shù)據(jù)中含有的混雜變量較多,對(duì)模型精度和相關(guān)BrainAGE研究的有效性有一定影響。但是由于模型是在大量不同數(shù)據(jù)源的數(shù)據(jù)基礎(chǔ)上訓(xùn)練而成,具有良好的泛化性能。后者采集方法統(tǒng)一,圖像同質(zhì)性高,減少了不必要的干擾,具有較高的模型精度。但該類模型在不同數(shù)據(jù)集間需要使用遷移學(xué)習(xí)重新訓(xùn)練。如Ren等[39]發(fā)現(xiàn)基于UKB大數(shù)據(jù)集訓(xùn)練的模型如果不進(jìn)行遷移學(xué)習(xí)重新訓(xùn)練,就會(huì)表現(xiàn)得較差。
其次,需要考慮訓(xùn)練集中不同年齡段間對(duì)象分布的均勻性。算法模型一定程度會(huì)學(xué)習(xí)到訓(xùn)練集中對(duì)象的年齡分布,給預(yù)測(cè)結(jié)果帶來偏差。Feng等[32]使用過采樣和降采樣技術(shù)平衡訓(xùn)練集的年齡分布,在同一年齡段的參與對(duì)象過少時(shí),加入同一年齡段的隨訪跟蹤圖像;在同一年齡段的參與對(duì)象過多時(shí),隨機(jī)降采樣數(shù)據(jù)。雖然平衡數(shù)據(jù)與不平衡數(shù)據(jù)在模型總體精度上沒有顯著差異,但是不平衡年齡訓(xùn)練模型的精度因年齡而異,樣本數(shù)較多的年輕人誤差更小,而樣本數(shù)較少的老年人誤差更大。對(duì)于年齡跨度較大、樣本不均衡性較嚴(yán)重的研究,可能會(huì)產(chǎn)生潛在的偏差。
最后,根據(jù)科學(xué)問題的不同,腦年齡預(yù)測(cè)模型會(huì)使用完全健康的個(gè)體(無慢性疾?。┗蛘咴撃挲g段的典型個(gè)體(無神經(jīng)退行性疾?。﹣順?gòu)建模型。但這些個(gè)體中有可能包含無癥狀的神經(jīng)退行性疾病早期患者,對(duì)模型預(yù)測(cè)造成影響。病理對(duì)象的排除需要受試者一段時(shí)間的跟蹤隨訪數(shù)據(jù),這種情況對(duì)數(shù)據(jù)集的質(zhì)量,特別是多數(shù)據(jù)集合的質(zhì)量提出了更高的要求。數(shù)據(jù)集的構(gòu)建過程、樣本均衡以及入組條件等都會(huì)對(duì)模型預(yù)測(cè)結(jié)果帶來一定影響,構(gòu)建模型時(shí)必須結(jié)合所要研究的科學(xué)問題來進(jìn)行綜合考慮和設(shè)計(jì)。
在過去的3 a中,研究者們提出了大量基于CNN的模型用來預(yù)測(cè)腦年齡。就模型的種類而言,絕大多數(shù)模型的設(shè)計(jì)都是基于VGG體系結(jié)構(gòu),可能是由多種因素造成的:(1)VGG結(jié)構(gòu)非常簡(jiǎn)潔,整個(gè)網(wǎng)絡(luò)由3×3×3的卷積層和2×2×2的池化層級(jí)聯(lián)而成,通過多個(gè)3×3×3的級(jí)聯(lián)可以有效地?cái)U(kuò)展感受野;(2)多數(shù)研究所使用數(shù)據(jù)集的數(shù)據(jù)量較小,難以對(duì)更復(fù)雜的模型進(jìn)行有效訓(xùn)練;(3)與VGG相比,結(jié)構(gòu)優(yōu)化后的三維CNN模型具有更高的工程實(shí)現(xiàn)難度。所以優(yōu)化的三維CNN模型設(shè)計(jì)和組合將成為今后一段時(shí)期內(nèi)腦年齡預(yù)測(cè)模型的發(fā)展方向。正如集成學(xué)習(xí)在腦年齡預(yù)測(cè)中已被大量采用,未來研究人員可以嘗試對(duì)多種不同網(wǎng)絡(luò)結(jié)構(gòu)或多種影像模態(tài)的網(wǎng)絡(luò)進(jìn)行集成學(xué)習(xí)。
模型精度是模型設(shè)計(jì)中直接考量的指標(biāo),對(duì)后續(xù)的臨床分析起著關(guān)鍵作用。在早期的研究中,模型的MAE一般為4~5 a。但是神經(jīng)影像數(shù)據(jù)與CNN的結(jié)合,已使模型腦年齡預(yù)測(cè)的MAE下降到了2 a左右,個(gè)性化診斷逐漸成為可能。在腦年齡預(yù)測(cè)模型誤差較大的情況下,BrainAGE中包含大量的噪聲信息,僅適用于群體分析。但是當(dāng)腦年齡預(yù)測(cè)模型的誤差為零時(shí),對(duì)于同一年齡的個(gè)體,預(yù)測(cè)年齡相同,不能反映任何個(gè)性化的信息。所以當(dāng)腦年齡預(yù)測(cè)模型誤差較大時(shí),減少模型誤差是研究人員的首要任務(wù)。而當(dāng)腦年齡預(yù)測(cè)模型的誤差為1~2 a時(shí),MAE已經(jīng)不再是模型設(shè)計(jì)中需要考慮的唯一目標(biāo)。MAE較小并不一定代表模型性能更優(yōu),更要考慮的是如何在減少誤差的同時(shí)提高BrainAGE的生理可解釋性。今后模型損失函數(shù)需要與BrainAGE相結(jié)合進(jìn)行設(shè)計(jì)。
近年來,基于CNN的腦年齡預(yù)測(cè)模型有了質(zhì)的進(jìn)展,但不可否認(rèn)的是,目前的研究在數(shù)據(jù)集和模型方面還存在一些有待解決的問題。隨著基于CNN的腦年齡預(yù)測(cè)研究的不斷深入,該類模型有望應(yīng)用于神經(jīng)退行性疾病的個(gè)性化診斷和治療,具有很大的臨床應(yīng)用價(jià)值。