齊國慶 ,吳東,胡博,王文*
隨著社會的不斷發(fā)展,阿爾茲海默病(Alzheimer's disease,AD)、精神分裂癥、抑郁癥等認(rèn)知功能或情感障礙疾病的發(fā)病率逐年提高[1,2],給家庭和社會帶來了巨大的壓力。因此,早期識別大腦功能障礙相關(guān)疾病對于疾病的早期診斷和預(yù)防至關(guān)重要。
結(jié)構(gòu)磁共振成像和功能磁共振成像(functional MRI,fMRI)是磁共振腦影像學(xué)的兩大分支。前者包括T1加權(quán)成像(T1 weighted imaging,T1WI),T2 加 權(quán)成像(T2 weighted imaging,T2WI),擴(kuò)散張量成像等掃描序列,可以反映大腦的解剖結(jié)構(gòu),后者則包括血氧水平依賴成像(blood oxygen level dependent,BOLD)成像,動脈自旋標(biāo)記成像等,主要可以反映大腦的功能活動、血流灌注等[3]。簡而言之,磁共振成像在顯示腦部的解剖結(jié)構(gòu)以及功能狀態(tài)方面展現(xiàn)出了優(yōu)良的性能,有助于研究者尋找大腦功能障礙相關(guān)疾病的客觀影像學(xué)生物標(biāo)志物[4,5]。然而,之前的研究大多是基于組水平的研究,并不能做基于個(gè)體的診斷或預(yù)測,對于臨床指導(dǎo)意義有限。
機(jī)器學(xué)習(xí)(machine learning,ML)是人工智能的重要研究領(lǐng)域之一,其基本原理是根據(jù)訓(xùn)練集提供的有限信息構(gòu)建模型,進(jìn)而對新輸入的樣本信息進(jìn)行預(yù)測,預(yù)測所得結(jié)果越逼近真實(shí)結(jié)果,說明此模型的效能越高。在醫(yī)療領(lǐng)域,ML能夠利用多種復(fù)雜算法在龐大的臨床數(shù)據(jù)中提取有用的信息進(jìn)行模型訓(xùn)練,然后將其運(yùn)用于相關(guān)疾病的早期診斷和精準(zhǔn)診斷,有助于醫(yī)生減少臨床實(shí)踐中的誤診率和誤治率[6]。其中,由于神經(jīng)精神疾病磁共振影像數(shù)據(jù)量龐大,且缺少依靠肉眼直接評估的異常影像特征,亟需借助ML的方法對其進(jìn)行數(shù)據(jù)驅(qū)動分析。
因此,目前越來越多的研究將ML與神經(jīng)精神疾病腦影像結(jié)合起來,希望可以借助ML的手段,挖掘相關(guān)影像的潛在信息,從而將其運(yùn)用于個(gè)體診斷和預(yù)后評估,以便于更好地指導(dǎo)臨床。但多模態(tài)腦影像磁共振數(shù)據(jù)特征的多樣化以及ML模型選擇的多樣化也為研究的開展帶來了巨大的挑戰(zhàn)。本文通過歸納近期ML在磁共振腦影像學(xué)診斷中應(yīng)用的相關(guān)文獻(xiàn),探尋其優(yōu)勢和局限性,為今后神經(jīng)影像學(xué)科研與診斷方法的選擇提供新的思路。
常用的線性回歸模型主要包含適用于研究連續(xù)變量的一般線性模型,以及研究二分類或多分類變量的Logistic回歸模型。通過設(shè)置待預(yù)測指標(biāo)為因變量,感興趣的影像指標(biāo)為自變量,即可建立通過影像指標(biāo)預(yù)測量表評分的線性模型。線性模型在腦磁共振影像方面的應(yīng)用非常廣泛,如利用磁共振影像中腦體積[7]、腦功能指標(biāo)(如低頻振幅、功能連接等)預(yù)測疾病狀態(tài)、認(rèn)知水平,以及輕度認(rèn)知功能障礙(mild cognitive impairment,MCI)向 AD的轉(zhuǎn)化時(shí)間等[8]。同時(shí)患者的臨床特征如血糖、血壓等亦可作為自變量輸入模型,達(dá)到影像特征與臨床指標(biāo)的融合。目前,Shen等[9]結(jié)合基于靜息態(tài)BOLD信號的功能連接矩陣(functional connectivity matrix,F(xiàn)CM)與線性回歸模型,提出了一種新的基于連接組的預(yù)測模型(connectome-based prediction model,CPM)。此模型的輸入變量(自變量)為FCM中與目標(biāo)量表評分最相關(guān)的功能連接的總和,輸出變量(因變量)為目標(biāo)量表評分。目前,CPM方法已經(jīng)成為fMRI影像與機(jī)器學(xué)習(xí)結(jié)合的熱點(diǎn),在精神分裂癥[10]、抑郁癥[11]、焦慮癥[12]等疾病的診斷和預(yù)測,注意力[13]、智力[14]等認(rèn)知能力的預(yù)測均有深入而細(xì)致的研究。
總的來說,線性模型較簡單,適用于研究影響因素與疾病發(fā)生的相關(guān)性。但其缺點(diǎn)在于,線性模型要求自變量與因變量之間必須呈線性關(guān)系,因此不適用于處理一些非線性關(guān)系的數(shù)據(jù)。而廣義線性模型可以加入非線性核來處理非線性數(shù)據(jù),從而可以較好地解決這一問題。
K-最近鄰(K-nearest neighbor,KNN)算法是由Cover和Hart于1967年發(fā)表的一種分類學(xué)習(xí)算法[15]。它的基本原理是首先提取所有樣本的某個(gè)影像特征,對于給定樣本,如果與其最相鄰的K個(gè)樣本大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別[16]。KNN算法既往多出現(xiàn)于腫瘤的良惡性鑒別研究中,此類研究往往橫向?qū)Ρ榷鄠€(gè)機(jī)器學(xué)習(xí)算法對診斷效能的影響。但是在現(xiàn)有的腦功能障礙磁共振影像診斷的研究中應(yīng)用并不多,且所研究疾病的類型也較為常見。例如利用T2WI來區(qū)分AD與健康受試者[17]、利用糖尿病患者的縱向隨訪數(shù)據(jù)以檢測其腦容量變化等[18]。在功能影像方面,Geng等[19]將KNN算法與fMRI中的功能連接、有效連接特征相結(jié)合,在抑郁癥患者的診斷方面取得了不錯(cuò)的效果。同時(shí),由于KNN算法主要依賴于輸入數(shù)據(jù)的相似性來進(jìn)行分類,故在腦影像組織分割方面也展現(xiàn)出較好的效果[20]。
KNN主要適用于需選取復(fù)雜類別特征進(jìn)行多分類的影像組學(xué)數(shù)據(jù),但其缺點(diǎn)在于,KNN需要計(jì)算整個(gè)訓(xùn)練空間的相似度,導(dǎo)致效率隨樣本數(shù)量的增加而降低。另外其分類效能很大程度上依賴于根據(jù)歐氏距離和曼哈頓距離計(jì)算所選取的K值,導(dǎo)致對K值的選擇要求高,即當(dāng)樣本分布密度不平衡時(shí),新樣本會自動歸類于樣本量大的類別而導(dǎo)致分類誤差增大。
支持向量機(jī)(support vector machine,SVM)是一種基于訓(xùn)練數(shù)據(jù)集對同類數(shù)據(jù)進(jìn)行分類的算法。1995年,SVM的概念由Cortes和Vapnik[21]兩位科學(xué)家率先提出,并證明該分類器擁有超強(qiáng)的非線性分類能力,也就是說它可以利用核函數(shù)將目標(biāo)特征投射至高維空間,從而在此空間內(nèi)將原本線性不可分的樣本數(shù)據(jù)轉(zhuǎn)變?yōu)榫€性可分。常用的核函數(shù)有多項(xiàng)式核函數(shù)、高斯核函數(shù)、Sigmoid核函數(shù)、線性組合核函數(shù)等,不同的核函數(shù)和參數(shù)選擇決定了分類器最終的泛化能力[22]。SVM目前已被成功地應(yīng)用于神經(jīng)精神疾病的診斷預(yù)測,并且關(guān)于SVM的優(yōu)化應(yīng)用研究也已得到廣泛開展。由于SVM易于實(shí)現(xiàn),分類效果優(yōu)越,且在小樣本數(shù)據(jù)中表現(xiàn)較好,故SVM是目前應(yīng)用最為廣泛的機(jī)器學(xué)習(xí)算法,相關(guān)研究已涉及目前常見神經(jīng)精神疾病,如青少年精神分裂癥[23]、抑郁癥[24]、帕金森病(Parkinson's disease,PD)[25]、亨廷頓病[26]等疾病的診斷。
總而言之,SVM主要適用于非線性、多變量的分類影像數(shù)據(jù),且在小樣本數(shù)據(jù)上表現(xiàn)良好。但是SVM分類效能與核函數(shù)參數(shù)密切相關(guān),導(dǎo)致核函數(shù)選擇的困難。
隨機(jī)森林(random forest,RF)是由Breiman等[27]于2001年提出的一種以決策樹為基礎(chǔ)的集成學(xué)習(xí)算法。決策樹的基本原理是所有樣本特征均可視為樹根,之后形成一套分類規(guī)則,并將所有可能發(fā)生的結(jié)局的概率分布用樹形圖來表達(dá),因此這類模型被稱為決策樹[28]。RF通過集成一組隨機(jī)的決策樹進(jìn)行建模,其核心思想是在原始樣本中進(jìn)行隨機(jī)有放回地抽取,得到k組容量一致的樣本集,從而分別構(gòu)建k個(gè)決策樹,最后通過投票法得到分類結(jié)果[29]。RF最大的優(yōu)點(diǎn)是能夠處理高維度非線性的特征,泛化效能強(qiáng),特別適用于解決腦影像多模態(tài)融合、高維度特征降維的問題。例如,Alessia等[30]綜述了2007—2017年12篇關(guān)于AD神經(jīng)影像數(shù)據(jù)分類的ML算法,基于多模態(tài)影像數(shù)據(jù),應(yīng)用RF算法從MCI中預(yù)測AD具有最高的準(zhǔn)確性。另外,RF算法不僅可以被運(yùn)用于特征融合與降維,也可以被運(yùn)用于大腦結(jié)構(gòu)影像的組織分割。而RF算法診斷研究所涉及的疾病也較為廣泛,包括AD[30]、注意缺陷與多動障礙[31]等。
綜上所述,RF主要適用于高維非線性、多模態(tài)、特征缺失以及不平衡的影像數(shù)據(jù)。同時(shí),RF內(nèi)部參數(shù)設(shè)置簡單,易于調(diào)整,即使使用默認(rèn)的參數(shù),也可以達(dá)到良好的結(jié)果。但RF在解決回歸問題時(shí)不能夠做出超越訓(xùn)練集數(shù)據(jù)范圍的預(yù)測,可能導(dǎo)致具有某些特定噪聲的數(shù)據(jù)在進(jìn)行模型訓(xùn)練時(shí)出現(xiàn)過擬合。
深度學(xué)習(xí)(deep learning,DL)最大的優(yōu)勢在于其可以基于自身多層次的網(wǎng)絡(luò)結(jié)構(gòu),從海量圖像數(shù)據(jù)中自動提取特征用于分類,并且展現(xiàn)出極佳的圖像分類性能[32]。早在20世紀(jì)80年代,Geoffrey Hinton就提出了深度學(xué)習(xí)算法的雛形——反向傳播算法,但是由于計(jì)算機(jī)算力的限制,當(dāng)時(shí)并沒有得到廣泛應(yīng)用。近10年來,由于計(jì)算機(jī)硬件(尤其是顯卡)與軟件相關(guān)技術(shù)的飛速發(fā)展,DL在各個(gè)行業(yè)都掀起了一股人工智能的熱潮。在醫(yī)學(xué)影像方面,深度學(xué)習(xí)在腦膠質(zhì)瘤分型[33]、前列腺腫瘤良惡性鑒別[34]等方面均有不俗的表現(xiàn),有的已經(jīng)轉(zhuǎn)化為較為成熟的商業(yè)產(chǎn)品。但是,DL平臺搭建過程較為復(fù)雜,且模型選擇以及內(nèi)部參數(shù)調(diào)整較為復(fù)雜。同時(shí),由于腦功能障礙疾病涉及的影像數(shù)量多、模態(tài)多、特征復(fù)雜,往往需要研究人員根據(jù)現(xiàn)有數(shù)據(jù)集量身定制數(shù)據(jù)分析與模型訓(xùn)練方案,使得研究難度進(jìn)一步增加。因此,近5年來才有相關(guān)的研究陸續(xù)被報(bào)道出來,如精神分裂癥[35]、PD[36]、AD[37]的診斷,以及正常腦組織的分割、腫瘤組織自動檢測與分割等。雖然這些研究取得了較好的結(jié)果,但其缺點(diǎn)在于,DL更加依賴于大數(shù)據(jù)支撐,這對于一些樣本量較小的數(shù)據(jù)來說并不適用。同時(shí),DL可解釋性較差,研究者難以控制模型內(nèi)部的運(yùn)行,也難以對得出的結(jié)果進(jìn)行解釋,限制了模型的改進(jìn)以及推廣應(yīng)用。
足夠的樣本量是保證機(jī)器學(xué)習(xí)模型效能的重要因素,當(dāng)研究者自身數(shù)據(jù)過少時(shí),可以借助一些公共的數(shù)據(jù)庫,如阿爾茨海默病神經(jīng)成像數(shù)據(jù)庫(Alzheimer's Disease Neuroimaging Initiative,ADNI),人類連接組計(jì)劃(Human Connectome Project,HCP)等。可以通過公共數(shù)據(jù)庫的大量數(shù)據(jù)進(jìn)行模型訓(xùn)練,然后用自身數(shù)據(jù)集作為驗(yàn)證(反之亦然),此種方法已成為較為常見的研究手段。另外,還可以借助一些數(shù)據(jù)擴(kuò)增[38]的方法,如旋轉(zhuǎn)、隨機(jī)裁剪、直方圖均衡化等,將訓(xùn)練集擴(kuò)充數(shù)倍,然后觀察模型的訓(xùn)練效果。此外,在模型訓(xùn)練時(shí),采取交叉驗(yàn)證的方法也可以從一定程度上克服樣本量小的問題。該方法較為簡單,即將數(shù)據(jù)分為N份,每次用N-1份作為訓(xùn)練集訓(xùn)練模型,用剩下的1份作為測試集檢驗(yàn)?zāi)P托?。同時(shí),在深度學(xué)習(xí)的應(yīng)用過程中,還可以借助近年來較為新潮的遷移學(xué)習(xí)技術(shù)來克服樣本量較小的問題。該技術(shù)借助較為簡單的微調(diào)方法可以將樣本量較大的數(shù)據(jù)集上訓(xùn)練得到的模型權(quán)重,作為樣本量較小的數(shù)據(jù)集模型訓(xùn)練的初始權(quán)重。例如,已有研究表明,運(yùn)用海量自然圖像(ImageNet)來預(yù)訓(xùn)練深度學(xué)習(xí)模型,相比于直接訓(xùn)練,在腦膠質(zhì)瘤診斷和分型上效果更佳[33]。
樣本量不均衡時(shí),會導(dǎo)致模型在預(yù)測時(shí)更傾向于將結(jié)果預(yù)測為數(shù)據(jù)量較多的那一組,從而造成偏倚。當(dāng)整體樣本數(shù)量較多時(shí)(如A組>B組),可以從A組隨機(jī)抽取與B組數(shù)量相當(dāng)?shù)臉颖具M(jìn)行模型訓(xùn)練,重復(fù)N次以后,再觀察模型的穩(wěn)定性。另外,還可以使用插值法增加B組樣本的數(shù)量,其代表方法即為 SMOTE算法[39]。
當(dāng)樣本來自不同的中心,或者同一中心的不同機(jī)型時(shí),會不可避免地引入誤差,造成偏倚。首先,研究者在數(shù)據(jù)預(yù)處理階段應(yīng)當(dāng)采取一致的預(yù)處理方法,尤其是依托于各個(gè)中心進(jìn)行預(yù)處理時(shí),應(yīng)當(dāng)預(yù)先進(jìn)行培訓(xùn)。同時(shí),還可以對所有數(shù)據(jù)統(tǒng)一進(jìn)行歸一化,包括對參考圖像的全局或局部均值和標(biāo)準(zhǔn)偏差進(jìn)行重采樣,或通過調(diào)整直方圖對像素大小進(jìn)行重采樣。另外,可以通過一些影像質(zhì)量檢測軟件(如MRQy等)剔除質(zhì)量差的圖像,從而降低誤差與偏倚。
近些年來,機(jī)器學(xué)習(xí)的方法在各種疾病中區(qū)分正常對照組和患者時(shí),具有較好的表現(xiàn),表明存在相關(guān)疾病可識別的MRI影像模式。同時(shí),MRI影像學(xué)新序列的提出,為我們提供了研究腦功能障礙相關(guān)疾病的新途徑和新思路。本文總結(jié)了近年來最為常用的5種機(jī)器學(xué)習(xí)方法及其在腦功能障礙磁共振影像診斷中的應(yīng)用,希望可以為初步涉及這一領(lǐng)域的研究者提供一些指導(dǎo)。
總的來說,機(jī)器學(xué)習(xí)領(lǐng)域沒有最好的方法,只有最適合的方法。而從具體的研究來看,目前線性回歸模型由于模型簡單,無法擬合較為復(fù)雜的數(shù)據(jù)分布,故已不被用作研究的主體,而是在橫向?qū)Ρ炔煌P蜁r(shí)用作驗(yàn)證,或者是在探索影像—臨床、影像—行為的相關(guān)關(guān)系時(shí)用到。SVM由于分類效能強(qiáng),比較適用于小樣本數(shù)據(jù),故目前已被廣泛運(yùn)用于各個(gè)方面的研究。因此,研究者在使用SVM為主體研究方法時(shí),要特別注意研究的創(chuàng)新性。DL和基于線性模型的CPM方法,目前是腦功能障礙磁共振影像應(yīng)用的熱點(diǎn),預(yù)計(jì)無論是在疾病種類上的創(chuàng)新,還是在模型優(yōu)化上的創(chuàng)新,都會有相關(guān)的研究持續(xù)報(bào)道。以KNN與RF為主體的研究與前兩者相比較少,這可能是由于KNN和RF模型的知名度沒有上述幾個(gè)模型高,在既往研究也多作為探索不同模型效能的一個(gè)研究分支。我們將本文中涉及的模型,及其優(yōu)缺點(diǎn)、參數(shù)選擇整理成表,方便讀者學(xué)習(xí)與使用(表1)。
表1 常見機(jī)器學(xué)習(xí)方法的可調(diào)參數(shù)及優(yōu)缺點(diǎn)Tab.1 Adjustable parameters,advantages and disadvantages of common machine learning methods
目前,隨著標(biāo)準(zhǔn)化影像學(xué)數(shù)據(jù)庫的建立以及ML算法聯(lián)合多模態(tài)影像數(shù)據(jù)研究的逐步深入,對于腦功能障礙相關(guān)疾病客觀影像指標(biāo)的探索正在如火如荼地開展,相關(guān)的研究也有助于使這類疾病的早期診斷率得到飛躍式的提升。
作者利益沖突聲明:全部作者均聲明無利益沖突。