吳筱菁
(北京交通大學計算機與信息技術學院,北京 100044)
功能磁共振成像(fMRI)是近年來發(fā)展日益成熟的一種腦功能成像方式,其數(shù)據(jù)分析目標包括定位腦激活區(qū)域、確定腦功能網(wǎng)絡等,能為評估大腦如何處理認知信息提供有用的線索[1]。由于fMRI數(shù)據(jù)維度高,一般樣本量較小,特征常具有高度共線性[2],普通分析方法難以得到解釋性好的模型。正則化回歸能進行稀疏的特征選擇,可以較好地適用于fMRI數(shù)據(jù),其中彈性網(wǎng)回歸[3]是性能比較穩(wěn)定的一種,Carroll等人[4]的研究表明彈性網(wǎng)回歸方法分析fMRI數(shù)據(jù)能得到優(yōu)良的預測模型,證明了其可靠性和穩(wěn)定性。
本文將介紹彈性網(wǎng)回歸方法的基本原理,分析其應用在功能磁共振數(shù)據(jù)分析中的優(yōu)勢,并整理近年其應用情況,最后提出總結(jié)和展望。
對于樣本量為N,特征維度為ρ的線性回歸模型
其中ε~N(0,σ2)為誤差項,βj為模型的回歸系數(shù),i=1,2,…,N, j=1,2,…,р。使用帶有彈性網(wǎng)懲罰項的最小二乘法估計模型參數(shù)即估計回歸系數(shù)βj,βo,以使損失函數(shù)最小化:
其中,懲罰項為
彈性網(wǎng)回歸方法的懲罰項由lasso懲罰項(‖β‖1)和嶺回歸懲罰項(1/2‖β‖2)組成,式(2)中正則化參數(shù) λ 能夠調(diào)節(jié)模型的稀疏程度,λ 值越大,模型稀疏度越大;式(3)中的正則化參數(shù)α調(diào)節(jié)嶺回歸懲罰項和lasso懲罰項之間的比例,取值范圍分別是,λ>0,α∈[0,1]。
彈性網(wǎng)回歸懲罰項中Lasso用于使許多參數(shù)收縮到零值,進而獲得稀疏預測模型,并選擇一些相互關聯(lián)的變量包含在模型中,并可應用于預測變量的數(shù)目遠大于被試數(shù)目的情形[5]。嶺回歸是專用于共線性數(shù)據(jù)分析的有偏估計回歸方法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價獲得回歸系數(shù)的穩(wěn)定的數(shù)值解,將相關預測因子的系數(shù)相互收縮,使相關變量的參數(shù)具有大致相同的值[6];
lasso回歸未考慮特征之間的關聯(lián)性,不適用于多重共線性變量;嶺回歸沒有實際系數(shù)為零的預測因子,不能進行模型選擇[7];彈性網(wǎng)回歸方法將二者結(jié)合,通過交叉驗證進行特征選擇時,可以得到理想的稀疏模型,并補償觀測變量之間的相關性帶來的影響。
疾病相關的fMRI研究涉及阿爾茲海默癥等多種神經(jīng)系統(tǒng)病變性疾病。彈性網(wǎng)回歸用于選擇可靠的特征以區(qū)分健康人與疾病患者,有助于疾病的輔助診斷。針對阿爾茲海默癥,Schoutena等人[7]使用多模式結(jié)合方法,利用彈性網(wǎng)分類結(jié)合多種磁共振成像,得到阿爾茲海默癥患者與健康人的良好分類器。Bowman等人[8]進行了尋找帕金森病早期診斷的相關生物標記的研究,提出一種統(tǒng)計框架以確定可靠的特征區(qū)分帕金森患者與健康人。將彈性網(wǎng)懲罰法應用到邏輯斯蒂回歸,并引入附加標準,獲得了較高的分類準確率。
基于正常人的研究普遍驗證了彈性網(wǎng)方法的有效性,為了解人的大腦發(fā)育過程及大腦各區(qū)域相互作用模式提供了有價值的信息。Mohr等人[9]研究大腦功能定位的整合過程,選取健康成年人進行視覺刺激和響應的任務,基于任務態(tài)fMRI數(shù)據(jù)分別使用彈性網(wǎng)回歸、 GraphNet等方法進行稀疏分類任務,為大腦功能定位整合過程的解讀提供了新的視角。Tian等人[10]使用健康成年人的靜息態(tài)fMRI數(shù)據(jù),通過彈性網(wǎng)回歸方法進行回歸預測及分類任務。研究發(fā)現(xiàn)人在成年早期至中期,大腦各區(qū)域功能相互作用發(fā)生了可見的改變,成年中期時大腦的功能已經(jīng)開始退化。
彈性網(wǎng)回歸在不同情況下的應用效果一直也是研究者們關心的問題。Wehbe等人[11]通過閱讀任務相關的fMRI數(shù)據(jù),結(jié)合空間平滑方法,比較了彈性網(wǎng)回歸等一系列正則化回歸方法的預測效果,發(fā)現(xiàn)正則化的密度對于識別與任務相關的大腦激活體素的重要作用,且不同正則化方法的使用效果相當,尋求更優(yōu)分析方法還與建模的謹慎性有所關聯(lián)。Belilovsky等人[12]利用健康被試和可卡因成癮被試的任務態(tài)fMRI數(shù)據(jù),比較了lasso、彈性網(wǎng)及k支持項三種方法的回歸預測效果、穩(wěn)定性及結(jié)果可解釋性,發(fā)現(xiàn)k支持項的回歸方法較另兩種有更好的預測效果,同時具有優(yōu)良的計算特性。此外與可卡因成癮相關的結(jié)果和前人的研究相吻合,進而證明了k支持項回歸方法的有效性。
除常規(guī)應用之外,研究者們近年來對彈性網(wǎng)回歸進行了各種方式的延伸和擴展,取得了不同程度的效果。Lorbert等人[13]基于任務態(tài)fMRI使用彈性網(wǎng)正則化的支持向量機進行自動特征選擇,證實了該方法在真實的fMRI數(shù)據(jù)中應用的有效性。Gkirtzou等人[14]針對常規(guī)fMRI分析中體素之間關系的編碼信息被忽略的問題進行了探究,考慮大腦內(nèi)在的空間結(jié)構,嘗試提高功能磁共振圖像分析的預測效果。經(jīng)真實數(shù)據(jù)的檢驗,該方法的性能優(yōu)于嶺回歸及彈性網(wǎng)回歸,同時驗證了大腦體素之間的連接包含腦結(jié)構的補充信息這一假設。
作為一種收縮和選擇的方法,彈性網(wǎng)能夠產(chǎn)生稀疏的模型,并保證良好的預測準確率,同時鼓勵分組效應。已有的實際結(jié)果和模擬已廣泛的證明,彈性網(wǎng)優(yōu)于lasso的優(yōu)越性能,以及在神經(jīng)影像科學研究中的有效性。分類算法中,彈性網(wǎng)的優(yōu)良特性能夠得到更好地提現(xiàn)。未來彈性網(wǎng)作為一個重要的基礎,能得到更多廣泛的應用。
[1]Belilovsky E,Gkirtzou K,Misyrlis M,et al.Predictive sparse modeling of fMRI data for improved classi fi cation,regression,and visualization using the k-support norm[J].Computerized Medical Imaging & Graphics,2015,46 Pt 1(1):40.
[2]Bunea F,She Y,Ombao H,et al.Penalized least squares regression methods and applications to neuroimaging[J].Neuroimage,2011,55(4):1519-27.
[3]Zou H, Hastie T. Regularization and variable selection via the elastic net[J].Journal of the Royal Statistical Society:Series B (Statistical Methodolo gy),2005,67(2):301-320.
[4]Carroll M K,Cecchi G A,Rish I, et al. Prediction and interpretation of distributed neural activity with sparse models[J]. Neuroimage,2009,44(1):112.
[5]Bunea F, She Y, Ombao H, et al. Penalized least squares regression methods and applications to neuroimaging[J].NeuroImage,2011,55(4):1519-1527.
[6]Khundrakpam B S,Tohka J,Evans A C. Prediction of brain maturity based on cortical thickness at different spatial resolutions[J].Neuroimage,2015,111:350.
[7]Schouten T M,Koini M,De V F,et al.Combining anatomical,diffusion, and resting state functional magnetic resonance imaging for individual classi fi cation of mild and moderate Alzheimer's disease[J]. Neuroimage Clinical,2016,11:46.
[8]Bowman D B,Drake D F,Huddleston D E.Multimodal Imaging Signatures of Parkinson's Disease[J].Frontiers in Neuroscience,2016,10.
[9]Mohr H,Wolfensteller U,Frimmel S,et al.Sparse regularization techniques provide novel insights into outcome integration processes[J].Neuroimage,2015,104:163-176.
[10]Tian L, Ma L, Wang L. Alterations of functional connectivities from early to middle adulthood:Clues from multivariate pattern analysis of resting state fMRI data[J].Neuroimage,2016,129:389.
[11]Wehbe L, Ramdas A, Steorts R C,et al.Regularized brain reading with shrinkage and smoothing[J].2014,9(4).
[12]Kumawat G, Singh G, Gireesh C,et al.Predictive sparse modeling of fMRI data for improved classification,regression, and visualization using the k -support norm[J].Computerized Medical Imaging & Graphics the Official Journal of the Computerized Medical Imaging Society,2015,46 Pt 1(1):40.
[13]Lorbert A, RamadgePJ. The Pairwise Elastic Net support vector machine for automatic fMRI feature selection[C]//IEEE International Conference on Acoustics, Speech and Signal Processing. IEEE, 2013:1036-1040.
[14]Gkirtzou K,Honorio J,Samaras D,et al.fMRI Analysis with Sparse Weisfeiler-Lehman Graph Statistics[M]//Machine Learning in Medical Imaging.Springer International Publishing,2013:90-97.