李 瑤,趙云芃,李欣蕓,劉志芬,陳俊杰,郭 浩
(1.太原理工大學 信息與計算機學院,山西 晉中030600; 2.太原理工大學 藝術(shù)學院,山西 晉中 030600;3.山西醫(yī)科大學第一醫(yī)院 精神衛(wèi)生科,太原 030000)
近年來,神經(jīng)影像學技術(shù)用于探索腦區(qū)間的交互作用已經(jīng)得到了越來越多的關(guān)注。低頻血氧水平依賴(Blood Oxygenation Level Dependent,BOLD)信號存在顯著的低頻相關(guān),可作為神經(jīng)生理學指標用于靜息狀態(tài)功能磁共振成像(Resting-State functional Magnetic Resonance Imaging, RS-fMRI)來檢測靜息狀態(tài)下的腦自發(fā)活動[1]。該自發(fā)活動可通過BOLD信號的時間相關(guān)性來量化,進而將其表征為腦網(wǎng)絡(luò)。復雜的腦網(wǎng)絡(luò)研究有助于闡明神經(jīng)精神疾病的機制,并有可能提供相關(guān)的成像標記,為臨床腦疾病的診斷和評估提供新的視角[2],因此,腦功能網(wǎng)絡(luò)已成功地用于研究腦疾病的研究,包括癲癇、抑郁癥、阿爾茨海默癥、精神分裂癥等。
傳統(tǒng)的網(wǎng)絡(luò)模型大多都是捕捉兩個腦區(qū)間的信息。然而,已有研究表明在人腦交互活動中,不僅兩個腦區(qū)間存在聯(lián)系,多個腦區(qū)間也同樣存在直接交互信息[3]。為了彌補傳統(tǒng)網(wǎng)絡(luò)的不足,超網(wǎng)絡(luò)被提出[4]。超網(wǎng)絡(luò)基于超圖理論,區(qū)別于傳統(tǒng)網(wǎng)絡(luò),其節(jié)點表示腦區(qū),超邊表示多個腦區(qū)間的直接交互,是對傳統(tǒng)的延伸。近年來,超圖已成功地應(yīng)用于各種各樣的醫(yī)療影像領(lǐng)域包括圖像分割以及分類[5-6]。Liu等[5]使用視圖對齊超圖學習方法對阿爾茲海默癥中得到的不完整的多模態(tài)數(shù)據(jù)進行分類診斷。彭瑤等[6]提出一種基于超圖的多模態(tài)特征選擇算法來改善原有方法對腦疾病的診斷。一些最近的研究給出了神經(jīng)科學和超圖之間的聯(lián)系[4,7-9]。Jie等[4]通過超圖技術(shù)創(chuàng)建腦功能超網(wǎng)絡(luò),來進行腦疾病診斷。靳研藝等[7]考慮到腦區(qū)間的組效應(yīng),進一步對Jie等[4]創(chuàng)建的超網(wǎng)絡(luò)進行改進。張帆等[8]考慮到全局的拓撲信息,提出了基于腦功能超網(wǎng)絡(luò)的多特征融合分類方法。Gu等[9]提出了基于BOLD磁共振影像數(shù)據(jù)的超圖表示方法,且將超邊分成具體的三類:橋、星型以及聚類,來分別代表二分:焦點和空間分布式架構(gòu)。進一步地,一個新的基于學習的超網(wǎng)絡(luò)最近也被提出來表示多個腦區(qū)間的復雜連接模式[10]。Zu等[10]采用基于超圖學習的方法來識別自閉癥譜系障礙和注意力缺陷多動障礙疾病中子網(wǎng)絡(luò)中的生物標記物。除此之外,其余感興趣的超圖應(yīng)用也被發(fā)現(xiàn)在蛋白質(zhì)功能預測和模式識別中[11],Gallagher等[11]將聚類系數(shù)擴展到超網(wǎng)絡(luò)中,并從蛋白質(zhì)相互作用的角度來看待這些指標的物理意義。
在最近的研究中,Jie等[4]利用Lasso(Least absolute shrinkage and selection operator)的方法求解稀疏回歸模型進行超網(wǎng)絡(luò)的構(gòu)建,但Lasso方法由于本身的局限性,導致構(gòu)建的超網(wǎng)絡(luò)缺乏解釋分組效應(yīng)的能力[12]。然而,多個研究表明腦區(qū)間經(jīng)常存在組結(jié)構(gòu),腦區(qū)結(jié)構(gòu)傾向于共同參與以實現(xiàn)某種功能[13],因此,考慮到組結(jié)構(gòu)的問題,之前的研究中,提出使用基于group Lasso(gLasso)方法來改善超網(wǎng)絡(luò)的創(chuàng)建[14],但group Lasso方法是在組級別上進行變量選擇,這樣構(gòu)建的超網(wǎng)絡(luò)過于寬松,可能包含一些錯誤的連接。
為了解決上述問題,考慮到腦區(qū)間存在著潛能的組結(jié)構(gòu),本文對Guo等文章[14]進行了延伸,進一步提出sparse group Lasso(sgLasso)[15-17]方法來求解稀疏回歸模型進行超網(wǎng)絡(luò)的創(chuàng)建從而解決組結(jié)構(gòu)問題。sparse group Lasso方法是混合了Lasso與group Lasso方法,既選擇組間變量也選擇組內(nèi)的變量,是一個雙級選擇方法。該方法能夠有效地去除不重要的組以及重要組內(nèi)的不重要的單個變量[15-16]。
除此之外,多個研究證明真實網(wǎng)絡(luò)鄰域之間存在顯著的重疊,不僅單個頂點間的鄰居節(jié)點更容易重疊,而且單一的邊也有更大的鄰居凝聚力[11,18-19],因此為了更加準確闡明神經(jīng)精神疾病的機制以及全面地評估疾病的性能,本研究又引入超網(wǎng)絡(luò)中廣泛使用的幾個成對節(jié)點間的相互聚類系數(shù)作為另一種特征提取方法。
本文主要工作包括:1)使用sparse group Lasso方法來創(chuàng)建腦功能超網(wǎng)絡(luò);2)通過使用兩組超網(wǎng)絡(luò)聚類系數(shù)計算方式提取特征使其更全面地表達腦功能網(wǎng)絡(luò)拓撲且使用非參數(shù)檢驗來選擇具有差異的特征;3)使用多核支持向量機(Support Vector Machine,SVM)對選擇的特征進行分類。
對于基于sparse group Lasso方法來創(chuàng)建超網(wǎng)絡(luò)來進行腦網(wǎng)絡(luò)分析的流程框架主要包括數(shù)據(jù)收集及預處理,基于sparse group Lasso方法的功能超網(wǎng)絡(luò)創(chuàng)建,特征提取,特征選擇及分類。具體來說,這個框架由下列幾個步驟組成。
1)數(shù)據(jù)收集及預處理。
2)超網(wǎng)絡(luò)的創(chuàng)建:對于每個被試,使用稀疏線性回歸模型來創(chuàng)建超網(wǎng)絡(luò),即通過sparse group Lasso方法優(yōu)化目標函數(shù),將選定區(qū)域由其他區(qū)域的時間序列的線性組合來表示。
3)特征提取與選擇。
a)使用超網(wǎng)絡(luò)中獨有的局部聚類系數(shù)的定義,計算成對節(jié)點間的聚類系數(shù)。也就是一對節(jié)點共享了多少條邊。
b)使用聚類系數(shù)在傳統(tǒng)圖中的定義,即一個頂點的鄰居也互相是鄰居的比例。將其概念應(yīng)用至超網(wǎng)絡(luò)中來定義聚類系數(shù),進而求得每個節(jié)點的局部聚類系數(shù)。
4)使用非參數(shù)檢驗來分別對兩種不同類型的局部聚類系數(shù)選取腦區(qū)特征。
5)分類模型構(gòu)建:
a)將兩種不同類型的局部聚類系數(shù)選取出的具有顯著差異的特征作為分類特征融合至一起來構(gòu)建對應(yīng)的分類器。
b)使用交叉驗證方法來測試創(chuàng)建的分類器以及獲得最后分類結(jié)果。
按照山西醫(yī)學倫理委員會(reference number: 2012013)的建議征得所有參與者的同意,并參照Helsinki宣言與所有被試達成書面協(xié)議。本次實驗中,一共招募66名被試,分別包括38名首發(fā),無用藥抑郁癥(Major Depressive Disorder, MDD)患者(15名男性;平均年齡:28.4±9.68歲,區(qū)間:17~49歲)和28名健康被試(13名男性;平均年齡:26.6±9.4歲,區(qū)間:17~51歲),所有被試者均為右利手。他們的影像數(shù)據(jù)通過3T磁共振掃描儀(Siemens Trio 3-Tesla scanner, Siemens, Erlangen, Germany)進行收集來獲得。詳細被試信息參考表1。本文所用數(shù)據(jù)集已存至網(wǎng)盤,其鏈接為https://pan.baidu.com/s/11Ae-Qm9WX4MqwwobYjPP7g,提取碼為964a。
表1 被試基本特征 Tab. 1 Basic characteristics of subjects
參與者的影像數(shù)據(jù)由山西醫(yī)科大學第一附屬醫(yī)院中熟悉磁共振的放射科醫(yī)師來完成采集以及掃描工作。掃描過程中,所有參與者要求閉眼保持靜止,不去想其他事情。每次掃描得到248個連續(xù)的EPI功能圖像(volumes),且設(shè)置具體的掃描參數(shù)如下:33 axial slices, repetition time (TR)=2 000 ms,echo time (TE)=30 ms,thickness/skip=4/0 mm,field of view (FOV)=192 mm×192 mm,matrix=64 mm×64 mm,flip angle=90°。由于初始數(shù)據(jù)信號的不穩(wěn)定性,將功能圖像的前十個時間序列丟棄。
應(yīng)用SPM8(http://www.fil.ion.ucl.ac.uk/spm)進行磁共振圖像數(shù)據(jù)預處理,主要通過時間層校正、頭動校正、MNI空間標準化、帶通濾波器(0.01~0.10 Hz)和去線性漂移。首先對圖像進行時間層校正和頭動校正。將頭動大于3 mm或轉(zhuǎn)動超過3°的被試丟棄,使其不包括在最后的66例被試中;圖像校正后,接著進行12維度放射變換,將校正后的圖像標準化到蒙特利爾神經(jīng)學研究所(Montreal Neurological Institute,MNI)標準空間中;最后進行去線性漂移和帶通濾波來避免低頻漂移及高頻生物噪聲所造成的影響。
1.3.1 超圖論
圖論已經(jīng)被廣泛用于計算和腦研究成像,因為它可用于量化大腦連接,通過圖來表示感興趣對象之間的關(guān)系,且圖中的節(jié)點表示的是對象,邊即節(jié)點之間的連接來可以描繪對象之間的關(guān)系[20]。之前的許多研究都采用簡單圖來創(chuàng)建網(wǎng)絡(luò)模型,節(jié)點作為腦區(qū),兩個節(jié)點間的連接作為一條邊,但這個只能僅僅表達成對腦區(qū)間的成對關(guān)系,但在腦區(qū)間的功能互動中,越來越多的研究證明腦區(qū)間互動存在高階關(guān)系,因此為了克服這個局限性,引入超網(wǎng)絡(luò)。
1.3.2 稀疏線性回歸模型
預處理完成后,按照自動解剖標記 (Anatomical Automatic Labeling, AAL)[22]模板將大腦劃分為90個感興趣區(qū)域(Region Of Interest,ROI),包括左右半腦各45個ROI,每個ROI作為功能腦網(wǎng)絡(luò)中的一個節(jié)點。需要注意的是90個ROI指的是大腦區(qū)域,小腦除外。每個腦區(qū)的平均時間序列通過執(zhí)行回歸來排除大腦中平均腦脊液(Cerebro-Spinal Fluid,CSF)、白質(zhì)信號以及頭動校正的影響。這里需要注意的是,全腦平均信號是否回歸在該領(lǐng)域內(nèi)意見還不一致,因此為了避免爭議,本研究在數(shù)據(jù)預處理的過程中并未作全腦信號。利用rs-fMRI時間序列基于線性回歸方法構(gòu)建功能連接超網(wǎng)絡(luò)[4],具體來說,就是通過該方法將選定的腦區(qū)通過其他腦區(qū)的線性組合來表示,以此獲得該腦區(qū)與其他腦區(qū)的交互作用,同時迫使與無意義腦區(qū)的交互作用為零。
稀疏線性回歸模型具體表示如下:
xm=Amαm+τm
(1)
其中:xm表示第m個ROI的平均時間序列;Am=[x1,x2,…,xm+1,xm+2,…,xM]表示第m個ROI的數(shù)據(jù)矩陣(除了第m個腦區(qū)的所有平均時間序列,且對應(yīng)第m個ROI的平均時間序列設(shè)置為0);αm表示系數(shù)向量,其量化了從其他ROI到第i個ROI的影響程度;τm表示噪聲項。αm中非零元素表示的是與特定ROI有著交互作用的ROIs,零元素表示與特定ROI的交互作用是無意義的ROIs。
1.3.3 基于sparse group Lasso的超網(wǎng)絡(luò)創(chuàng)建
在之前的研究中,通過Lasso方法來求解稀疏回歸模型來創(chuàng)建腦網(wǎng)絡(luò)[4],但Lasso方法缺少解釋分組效應(yīng)的能力[12]。也就是說,如果一個特定的變量與一組變量的成對相關(guān)性都很高時,那么Lasso方法通常只選擇一組變量中的一個,且不關(guān)乎哪一個,因此選取的方法過于嚴格,會丟失一些有用的連接。為了解決這一問題,考慮到腦區(qū)之間的組結(jié)構(gòu),已有的研究通過引入group Lasso(后面用gLasso表示)方法來進行超網(wǎng)絡(luò)的創(chuàng)建,主要是在事先定義的組級上進行有效的變量選擇[23]。也就是說,gLasso將整個組視為一個整體,并確定它是否對問題重要。雖然組套索給出了一組稀疏組,但如果在該模型中包含一個組,那么該組中的所有系數(shù)都將是非零的。有時希望同時包括組稀疏性和組內(nèi)稀疏性,例如,如果預測因子是腦區(qū),希望在多個腦區(qū)相互作用中識別特別“重要”的腦區(qū);然而,這種方法不能在一個組內(nèi)產(chǎn)生稀疏度。也就是在功能腦網(wǎng)絡(luò)中具有組結(jié)構(gòu)的多個腦區(qū)中有幾個腦區(qū)與選定腦區(qū)具有高度相關(guān)作用,gLasso則認為該組中的所有腦區(qū)非零,也就是所有腦區(qū)均與選定腦區(qū)均具有高度相關(guān)作用。這樣構(gòu)建的網(wǎng)絡(luò)過于寬松,或者存在許多虛假的連接,或者丟失一些有用的連接。
因此引入sparse group Lasso(后面用sgLasso表示)[15]方法來改善超網(wǎng)絡(luò)的創(chuàng)建,這個方法仍然是基于線性回歸模型,但是既可以在組級上進行變量選擇,又可以在單個變量級上進行變量選擇,也就是說,可以在自由地選擇組間或組中的單個變量。在功能腦網(wǎng)絡(luò)中,如果存在組效應(yīng)的多個腦區(qū)中有一個或幾個腦區(qū)均與選定腦區(qū)相關(guān),則該方法不會只選擇該組,而是選擇該組中與它相關(guān)的一個或多個腦區(qū),當然如果該組均高度相關(guān),則會選擇整組,這樣便能過濾掉一些虛假且保留一些有用的連接。因為sgLasso方法是選擇出重要的組,在重要的組里再選擇重要的變量,因此在利用sgLasso方法進行超網(wǎng)絡(luò)創(chuàng)建之前,需要通過聚類算法先依據(jù)90個腦區(qū)的平均時間序列進行聚類得到分組,再基于該方法進行超網(wǎng)絡(luò)構(gòu)建。本研究中采用k中心點聚類法[24]來進行聚類從而對腦區(qū)進行分組,通過設(shè)置不同的k值,則會獲得不同的超網(wǎng)絡(luò)拓撲及分類性能。在本研究中,當聚類數(shù)目k設(shè)置為30時,該方法實現(xiàn)最高的分類準確率(詳細分析在3.1節(jié)涉及)。接著使用sgLasso方法來創(chuàng)建超網(wǎng)絡(luò),式(2)是優(yōu)化目標函數(shù):
min(‖xm-Amαm‖2+λ1‖αm‖1+
(2)
其中:αm通過聚類被分成了k個非重疊的樹組(αmG1,αmG2,…,αmGk),而G1有樹結(jié)構(gòu)的節(jié)點;λ1,λ2均是回歸參數(shù),λ1被用來調(diào)整模型組內(nèi)稀疏性,即控制非零組中非零系數(shù)的數(shù)量,λ2被用來調(diào)整組級稀疏性[25-26],即控制具有至少一個非零系數(shù)的組的數(shù)量。該模型是Lasso與gLasso的結(jié)合:λ1=0得到gLasso估計,λ2=0即得到Lasso估計。需要注意的是,該模型看起來與elastic net模型有點相似,但卻是不同的,因為l2范式在0處不可微分,因此一些組完全歸零;然而,在每個非零組中,它給出了彈性網(wǎng)絡(luò)擬合[27]?;谠摲椒▉順?gòu)建每個被試的超網(wǎng)絡(luò),ROI作為節(jié)點,第m個ROI以及在αm中非零元素對應(yīng)的ROIs作為超邊。對于每一個ROI,固定λ2值,通過變化λ1值從0.1~0.9,增量為0.1,則會產(chǎn)生一組超邊。在該實驗中,將λ2設(shè)置為0.4,得到了該模型中最高的準確率,為87.88%。本實驗中,通過SLEP包[28]來優(yōu)化求解(詳細的分析描述見3.2節(jié))。
功能連接超網(wǎng)絡(luò)創(chuàng)建之后,需要選取具有代表性、能夠識別目標的特征集合,這就需要特征定義。在腦功能超網(wǎng)絡(luò)分析中,有多項指標可以反映節(jié)點及整個網(wǎng)絡(luò)的特性,但在醫(yī)學影像領(lǐng)域中,大多數(shù)研究都是將聚類系數(shù)作為網(wǎng)絡(luò)局部特性指標來改善疾病診斷性能。在之前的研究中,只涉及到單個節(jié)點的聚類系數(shù)作為特征提取方法;然而依據(jù)多個研究證明真實網(wǎng)絡(luò)鄰域之間存在顯著的重疊,不僅單個頂點間的鄰居節(jié)點更容易重疊,而且單一的邊也有更大的鄰居凝聚力(neighborhood cohesiveness around individual edges)[11,18-19],因此為了盡可能更加準確且全面地評估疾病的性能,本研究又引入超網(wǎng)絡(luò)中廣泛使用的幾個成對節(jié)點間的相互聚類系數(shù)作為另一種特征提取方法。
1.4.1 單一節(jié)點的聚類系數(shù)的特征提取
超網(wǎng)絡(luò)構(gòu)建完成后,需對其執(zhí)行特征提取計算。本研究中,從不同角度引入了超圖中三種不同定義的單一節(jié)點的聚類系數(shù)(HCC1、HCC2、HCC3)來描述超網(wǎng)絡(luò)的局部聚合[11]。單一節(jié)點的聚類系數(shù)與傳統(tǒng)圖中聚類系數(shù)定義相同,即一個節(jié)點其鄰居的緊密程度。從連接超網(wǎng)絡(luò)中依據(jù)這三個基于單一節(jié)點的聚類系數(shù)提取特征。表2表示了定義及這些屬性的計算。
表2 基于單個節(jié)點的聚類系數(shù)的定義與公式 Tab. 2 Definitions and calculation formulas of clustering coefficients based on single node
表2中:u,t,v指的是某一節(jié)點;N(v)={u∈V:?e∈E,u,v∈e}指的是節(jié)點集,E指的是超邊集,e指的是某條超邊,N(v)表示包含節(jié)點的所在超邊含有的其他節(jié)點的集合;若?ei∈E,且u,t∈e,但v?ei,則I(u,t,v)=1,否則I(u,t,v)=0;S(v)={ei∈E:v∈ei},v表示節(jié)點,ei表示超邊,S(v)表示包含節(jié)點的超邊的集合。
1.4.2 成對節(jié)點間的相互聚類系數(shù)的特征提取
多個研究證明真實網(wǎng)絡(luò)可以被小世界網(wǎng)絡(luò)表示,其鄰域之間存在顯著的重疊,不僅單個頂點間的鄰居節(jié)點更容易重疊,而且單一的邊也有更大的鄰居凝聚力(neighborhood cohesiveness around individual edges)[11,18-19],因此對傳統(tǒng)的聚類系數(shù)進行擴展,產(chǎn)生節(jié)點對間的聚類系數(shù),而且該計算聚類系數(shù)的方式已被廣泛用于超網(wǎng)絡(luò)中[11]。在這種定義形式下,聚類系數(shù)則指的是一對節(jié)點共享了多少條邊。在整個超圖研究中,已經(jīng)有多種方法計算了節(jié)點對的聚類系數(shù)[11,18-19]。在本文研究中,則引入了5種廣泛使用的節(jié)點對的聚類系數(shù)從不同的角度反映通過單一的邊的鄰居凝聚力,從而更全面地表達超網(wǎng)絡(luò)中的拓撲屬性。從連接超網(wǎng)絡(luò)中依據(jù)單一的邊的聚類系數(shù)定義分別提取特征。表3表示了定義及這些屬性的公式。
表3 基于一對節(jié)點的聚類系數(shù)的定義與公式 Tab. 3 Definitions and calculation formulas of clustering coefficients based on a pair of nodes
表3中:u,v指的是腦區(qū)節(jié)點,S(v)={ei∈E:v∈ei},v表示節(jié)點,ei表示超邊,S(v)表示包含節(jié)點v的超邊的集合,Total指的是超邊的總數(shù)量。
通過計算成對節(jié)點的聚類系數(shù)之后,單一節(jié)點的聚類系數(shù)則是通過平均該節(jié)點與其所有鄰居節(jié)點的聚類系數(shù)來得到[19]:
(3)
COMHCC(u,v)指的是通過任何方法計算求得的超圖中成對節(jié)點間的聚類系數(shù)。N(v)={u∈V:?e∈E,u,v∈e},V指的是節(jié)點集,E指的是超邊集,e表示某一條超邊,N(v)表示包含節(jié)點v的所在超邊含有的其他節(jié)點的集合。
這5組指標是從不同的角度反映通過單一的邊的鄰居凝聚力,來進一步地計算每個節(jié)點的聚類系數(shù),從而更全面得表達超網(wǎng)絡(luò)的局部聚類屬性。從連接超網(wǎng)絡(luò)中依據(jù)單一的邊的聚類系數(shù)定義分別提取特征。
1.4.3 特征選擇
特征提取完后的特征有著一些冗余或無關(guān)的特征,需要對其進行特征選擇,去掉無關(guān)或冗余的數(shù)據(jù),這樣便于建立更準確的預測模型,因此對于MDD患者和正常人,分別對使用兩種不同方式提取的聚類系數(shù)產(chǎn)生的270個以及450個節(jié)點屬性進行組間ks非參數(shù)檢驗[29],已通過錯誤發(fā)現(xiàn)率(False-Discovery Rate,F(xiàn)DR)(q=0.05)校正[30]。將選取出的具有顯著組間差異的兩組特征作為分類特征通過多核學習融合至一起進行預測模型構(gòu)建。
通過本文選取的超網(wǎng)絡(luò)中兩組具有顯著差異的腦區(qū)特征作為輸入特征來構(gòu)建分類模型。通過兩種不同類型的聚類系數(shù)彼此提供互補信息來進行MDD分類,采用多核學習來分別通過兩種不同類型的聚類系數(shù)估計的內(nèi)核的最佳線性組合來有效地融合特征。核的整合是通過多個核的線性結(jié)合[31]:
(4)
其中:ki(x,y)是第i組的聚類系數(shù)中被試x和y間的內(nèi)核矩陣;M是需融合的核矩陣的數(shù)量;αi是權(quán)重參數(shù)。接著,利用基于LIBSVM分類包(http://www.csie.ntu.edu.tw/~cjlin/libsvm/)的高斯內(nèi)核的SVM分類器對復雜核進行分類。
留一交叉驗證(Leave One Out Cross Validation, LOOCV)被用來評估分類性能,即若樣本數(shù)量為N時,則每次實驗取1個樣本當作測試集,其余樣本作為訓練集。此外,為了得到更好的分類模型,本實驗加入?yún)?shù)尋優(yōu)過程,主要是對訓練集進行k折交叉驗證,將訓練驗證分類準確率最高的(c,g)作為最優(yōu)參數(shù),參與模型的構(gòu)建,從而得到最好的分類模型。本次過程重復N次,得到N個分類模型進行分類測試,最后選取N次實驗的分類準確率的平均值作為最后分類結(jié)果。本研究中,(c,g)參數(shù)取值的變化范圍設(shè)置為[2-5,25],步進大小為1。另外,需要對分類特征進行標準化再進行分類模型構(gòu)建。需要注意的是,在基于sgLasso方法中由于聚類時初始種子點隨機選取會影響最終的分類結(jié)果,在實驗中,通過執(zhí)行50次實驗來計算其分類結(jié)果平均值作為最后分類結(jié)果。
利用sgLasso方法進行超網(wǎng)絡(luò)構(gòu)建并提取特征。對提取的每一個特征,均進行非參數(shù)置換檢驗且對所有被試評估MDD和CON之間的差異,特征已通過FDR校正。
表4和表5列出了通過兩種不同類型的聚類系數(shù)得到的顯著差異的大腦區(qū)域。通過兩組聚類系數(shù)得到的重疊區(qū)域較少,主要集中于右側(cè)中央溝蓋、部分邊緣系統(tǒng)區(qū)域(右側(cè)后扣帶回)以及雙側(cè)丘腦。如圖1所示,因此可說明能從兩組聚類系數(shù)中得到全面評估疾病診斷性能以及識別與疾病病理學相關(guān)的生物標記物。
表4 基于單一節(jié)點的聚類系數(shù)得到的顯著差異腦區(qū) Tab. 4 Significantly different brain regions obtained by clustering coefficients based on single node
表5 基于一對節(jié)點的聚類系數(shù)得到的顯著差異腦區(qū) Tab. 5 Significantly different brain regions obtained by clustering coefficients based on pairs of nodes
圖1 使用BrainNet軟件將所有異常腦區(qū)域映射到皮質(zhì)表面Fig. 1 All abnormal brain regions mapped onto cortical surfaces using BrainNet software
基于sgLasso方法構(gòu)建超網(wǎng)絡(luò),對兩組不同類型的聚類系數(shù)利用統(tǒng)計分析計算方法分別得到13個異常腦區(qū)以及11個異常腦區(qū)(包括重疊區(qū)域),包括右側(cè)額蓋區(qū)、右側(cè)補充運動區(qū)、雙側(cè)丘腦、額葉區(qū)域(左側(cè)內(nèi)側(cè)額上回、雙側(cè)額中回、左側(cè)眶部額下回)、邊緣系統(tǒng)(左側(cè)內(nèi)側(cè)和旁扣帶腦回、右側(cè)內(nèi)側(cè)和旁扣帶腦回、右側(cè)海馬旁回、右側(cè)后扣帶回、右側(cè)嗅皮質(zhì)、右側(cè)距狀裂周圍皮層)、枕葉區(qū)域(左側(cè)楔葉、左側(cè)舌回、左側(cè)枕上回、左側(cè)中央旁小葉)、顳葉區(qū)域(左側(cè)顳極:顳上回、左側(cè)顳極:顳中回)。這些腦區(qū)已經(jīng)在之前的文獻中被證明與抑郁癥的病理研究存在著顯著的關(guān)聯(lián),并將該方法取得的差異腦區(qū)與其他文獻所得到的結(jié)果一致。Zhu等[32]證明右側(cè)額蓋區(qū)的模塊度與抑郁嚴重程度呈負相關(guān)。Liu等[33]證明在右側(cè)補充運動區(qū),抑郁癥患者與正常人存在差異。Jin等[34]使用圖論來評估抑郁癥青少年腦功能網(wǎng)絡(luò)的拓撲特征時,發(fā)現(xiàn)抑郁癥青少年中的左側(cè)內(nèi)側(cè)額上回等腦區(qū)受到嚴重破壞。Guo等[35]使用機器學習對抑郁癥分類,其中異常腦區(qū)包括內(nèi)側(cè)和旁扣帶腦回,右側(cè)后扣帶回和雙側(cè)額中回等。Qiu等[36]使用結(jié)構(gòu)磁共振成像證明抑郁癥異常腦區(qū)包括右側(cè)海馬旁回以及左側(cè)顳級:顳中回等。Lord等[37]研究單極性抑郁癥靜息態(tài)功能連接社區(qū)結(jié)構(gòu)的變化時,發(fā)現(xiàn)左側(cè)舌回等腦區(qū)發(fā)生變化。Liu等[38]通過使用回波平面成像序列獲得靜息態(tài)fMRI,從而計算低頻振幅以研究靜息狀態(tài)下的低頻(0.01~0.08 Hz)振蕩的振幅時,發(fā)現(xiàn)與正常人相比,抑郁癥患者在左側(cè)枕上回等腦區(qū)的低頻振幅明顯降低。Rolls等[39]發(fā)現(xiàn)左側(cè)中央旁小葉等腦區(qū)在研究抑郁癥的有效連接時與正常被試存在差異。Lui等[40]發(fā)現(xiàn)頑固性抑郁組患者主要在雙側(cè)丘腦區(qū)等的功能連接受損。Guo等[41]基于最小生成樹的多特征融合方法進行分類時,表明右側(cè)嗅皮質(zhì)在兩組被試間存在差異。Zhang等[42]發(fā)現(xiàn)在右側(cè)距壯裂周圍皮層抑郁癥的節(jié)點中心性指標明顯下降。使用不同成像方法識別的大腦區(qū)域之間的覆蓋腦區(qū)有限,最一致的區(qū)域包括左側(cè)顳級:顳上回等[43]。
評估了基于sgLasso方法創(chuàng)建的超網(wǎng)絡(luò)模型的分類性能,并且與傳統(tǒng)的超網(wǎng)絡(luò)創(chuàng)建方法(Lasso方法與gLasso方法)進行比較。分別使用兩種不同類型的聚類系數(shù)作為特征提取,非參數(shù)置換檢驗用來特征選擇,SVM用來分類,LOOCV用來評估分類性能,得到其準確率、敏感性(可準確識別病人的比例)、特異度(可準確識別正常被試的比例)和平衡準確率(Balanced ACcuracy,BAC)(敏感性和特異度的均值,為了保證數(shù)據(jù)之間的平衡)。這里需要注意的是,這三種方法提取出來的用于分類的特征所對應(yīng)的腦區(qū)是不同的腦區(qū),假若使用相同的腦區(qū),則會導致存在非差異性特征參與分類模型的構(gòu)建,從而并不能創(chuàng)建最優(yōu)的分類模型,以致不能得到最好的分類準確率;同時,利用這三種方法創(chuàng)建超網(wǎng)絡(luò)所使涉及的參數(shù)也是不一致的,均是根據(jù)分類結(jié)果,從而選出每種方法中最優(yōu)的參數(shù)。分類結(jié)果在表6中表示。結(jié)果表明,sgLasso得到了最高的準確率,為87.88%,優(yōu)于基于Lasso創(chuàng)建的超網(wǎng)絡(luò)及基于gLasso創(chuàng)建的超網(wǎng)絡(luò)?;贚asso創(chuàng)建的超網(wǎng)絡(luò)低于sgLasso方法,其潛在的原因主要是Lasso只能選擇存在組結(jié)構(gòu)中的一個腦區(qū),且無論哪一個,這將導致Lasso構(gòu)建的網(wǎng)絡(luò)過于嚴格或者失去一些重要的連接。這一結(jié)果暗示著不考慮組結(jié)構(gòu)的存在則不能創(chuàng)建更合適的超網(wǎng)絡(luò)?;趃Lasso的超網(wǎng)絡(luò)構(gòu)建方法進行分類最后得到的分類結(jié)果不如sgLasso方法所得的結(jié)果,其潛在的原因主要是它不具有組內(nèi)變量選擇的靈活性,僅選擇相關(guān)組,以使每組內(nèi)的估計系數(shù)全部為零或全部為非零,這將導致gLasso構(gòu)建的網(wǎng)絡(luò)過于寬松或者加入一些錯誤的連接。這結(jié)果暗示著若為了改善超網(wǎng)絡(luò)的創(chuàng)建,需要考慮到組信息,但不能逼迫使用整組信息,可以適當?shù)貙M結(jié)構(gòu)進行擴展。
表6 不同方法的分類性能 單位:%Tab. 6 Classification performance of different methods unit:%
除此之外,本研究也與關(guān)于抑郁癥研究的其他文獻在分類結(jié)果上進行比較,從分類結(jié)果上看,本研究結(jié)果令人滿意。使用皮爾遜相關(guān)或者稀疏逆協(xié)方差[44-45]來創(chuàng)建腦網(wǎng)絡(luò),這樣僅能捕捉到兩個腦區(qū)間的交互作用,忽略了腦區(qū)間的高階交互。靳研藝等[7]利用Lasso方法和elastic net方法分別創(chuàng)建腦功能超網(wǎng)絡(luò),但是Lasso方法缺乏解釋組效應(yīng)的能力,從而導致丟失一些有用的連接,致使不能構(gòu)建更加精確的超網(wǎng)絡(luò);因此提出elastic net方法來改善超網(wǎng)絡(luò)的創(chuàng)建,雖然該方法能解決組效應(yīng)問題。但需要注意的是該方法并不能使高度相關(guān)的變量均屬于組中的活躍集中,而且本研究僅將單一節(jié)點的聚類系數(shù)作為腦區(qū)特征,僅考慮到單個頂點的鄰居節(jié)點的重疊性,并未考慮腦區(qū)間鄰域之間顯著的重疊。本文的新方法使用sgLasso方法結(jié)合多特征融合來進行腦疾病的分類,既考慮到了多腦區(qū)間的交互,又考慮到超網(wǎng)絡(luò)的組結(jié)構(gòu)問題,同時將兩組聚類系數(shù)結(jié)合,較好地彌補以上研究的不足之處。
為了判斷兩種方法中所選特征對分類的貢獻程度,本文采用Relief算法計算每種方法中對應(yīng)特征值的分類權(quán)重,Relief作為一種特征權(quán)重算法,可以判斷特征對于分類的重要性,若權(quán)重越大,則表明分類能力越強,反之亦然。在本次實驗中,將sgLasso方法中的單節(jié)點聚類系數(shù)特征、雙節(jié)點聚類系數(shù)特征、多特征分別計算的差異特征利用Relief算法計算對應(yīng)特征值的分類權(quán)重并進行比較,結(jié)果顯示在圖2中,結(jié)果表明,多特征得到的分類權(quán)重均高于單個特征的分類權(quán)重。通過Relief算法來評估特征的重要性。潛在的原因是基于多特征的方法有效地融合了兩個不同的信息,單個節(jié)點的聚類系數(shù)特征以及雙節(jié)點聚類系數(shù)特征,可以更加全面地表達腦區(qū)域間的交互信息。這一結(jié)果暗示著,表明多特征方法更適合評估特征的重要性,更適合分類抑郁癥患者與正常人。
圖2 腦區(qū)特征對應(yīng)的分類權(quán)重Fig. 2 Classification weight corresponding to brain region feature
功能超網(wǎng)絡(luò)的不同構(gòu)建,會對分類性能產(chǎn)生影響。在現(xiàn)有研究中使用Lasso進行超網(wǎng)絡(luò)創(chuàng)建[4],該方法中,通過使用l1范數(shù)來控制網(wǎng)絡(luò)的稀疏度,僅僅是對單個變量的選擇,未考慮到腦區(qū)間的組效應(yīng),導致一些相關(guān)的腦區(qū)無法選擇出來,使得超網(wǎng)絡(luò)過于嚴格,從而缺失重要的連接??紤]到組結(jié)構(gòu)問題,Guo等[14]引入group Lasso方法進行超網(wǎng)絡(luò)的創(chuàng)建,但group Lasso僅僅是在組級上進行變量選擇,將整組作為整體,使得超網(wǎng)絡(luò)又過于寬松,從而導致包含一些錯誤的連接。本文提出sgLasso方法來進行超網(wǎng)絡(luò)創(chuàng)建,基于sgLasso方法是引入l1、l2范數(shù)懲罰項,即該方法范式是混入Lasso與gLasso懲罰項,可以進行組間選擇以及組內(nèi)變量選擇,即雙級選擇,區(qū)別于簡單組選擇,變量可以在組級上以及單個變量間進行選擇,不僅可以選出重要的組,而且可以選出這些重要組中重要的變量。
除此之外,本文所提出的方法中的一些參數(shù)同樣也會影響分類性能,例如聚類數(shù)k,超網(wǎng)絡(luò)構(gòu)建模型正則化參數(shù)λ1和λ2,優(yōu)化權(quán)重參數(shù)αi。為了探討這個問題,本文對基于sgLasso方法的多特征融合方法進行了實驗。
k指的是sgLasso方法中的聚類數(shù)目,設(shè)置不同的k值會獲得不同的超網(wǎng)絡(luò)拓撲和分類性能,本研究中,為了分析不同k值對于超網(wǎng)絡(luò)拓撲及分類結(jié)果的影響,設(shè)置k值取值范圍為[6,90],其中步長為6。對每一個k值基于sgLasso方法進行超網(wǎng)絡(luò)構(gòu)建,特征提取,特征選擇,分類及評估驗證。由于第一個初始種子點的隨機選擇的影響,對于每個k值則分別進行50次實驗,最后取50次實驗的平均值作為最后的結(jié)果。圖3展示了sgLasso方法的實驗結(jié)果,結(jié)果表明當k=30時,sgLasso方法表現(xiàn)出最高準確率87.88%。
圖3 基于sgLasso方法中不同k值的分類準確率Fig. 3 Classification accuracy based on sgLasso method under different k values
以前的研究已經(jīng)表明參數(shù)λ影響超網(wǎng)絡(luò)的拓撲。正則化參數(shù)λ決定了網(wǎng)絡(luò)的稀疏以及規(guī)模。本研究中,參數(shù)λ1是l1范數(shù)項的正則化參數(shù),偏向于控制模型組間稀疏,步長設(shè)置為0.1。參數(shù)λ2是l2范數(shù)項的正則化參數(shù),偏向于控制模型組級稀疏,同λ1,步長設(shè)置為0.1。不同的λ1和λ2的設(shè)置會得到不同的網(wǎng)絡(luò)拓撲,會使模型選擇不同的組變量,從而導致產(chǎn)生不同的組結(jié)構(gòu),同時也會影響分類性能。在基于sgLasso方法的超網(wǎng)絡(luò)的創(chuàng)建中,本文固定λ2值,通過變化特定范圍內(nèi)的λ1值產(chǎn)生一組超邊;同時,為了探討λ1,λ2對分類性能的影響,λ2分別設(shè)置為0.1,0.2,…,0.9,λ1使用了一系列升序組合,{0.1},{0.1,0.2},{0.1,0.2,0.3},…,{0.1,0.2,…,0.9},以此來進行不同的超網(wǎng)絡(luò)創(chuàng)建。進而提取特征來進行分類,判斷分類性能。分類結(jié)果展示在圖4中。結(jié)果顯示在sgLasso方法中,當λ2=0.4,λ1使用{0.1,0.2,…,0.9}時,表現(xiàn)出最高正確率達到87.88%。當λ1使用{0.1}時,準確率低于60%,主要是因為一個腦區(qū)節(jié)點可能只包含在一條超邊中,導致HCC3計算無意義。
圖4 基于sgLasso方法中參數(shù)(λ1,λ2)的分類準確率Fig. 4 Classification accuracy based on sgLasso method under different parameters (λ1,λ2)
在多核學習中,重要的一步是選擇權(quán)重參數(shù)αi,這直接影響數(shù)據(jù)融合的方式,對分類性能有很大影響。在獲取權(quán)重參數(shù)αi之后,多個內(nèi)核集成混合內(nèi)核,然后可以通過傳統(tǒng)的SVM分類器來解決該模型。本文采用了shogun工具箱(http://www.shogun-toolbox.org),來獲得優(yōu)化權(quán)重。當α1=0.121 9和α2=0.878 1時,sgLasso方法的精度達到最大值87.88%。
本文研究考慮到現(xiàn)有研究中存在的組結(jié)構(gòu)的問題,引入sparse group Lasso方法來進行超網(wǎng)絡(luò)創(chuàng)建;同時,考慮到真實網(wǎng)絡(luò)不僅單個頂點的鄰居節(jié)點更容易重疊,鄰域之間也存在顯著地重疊,引入一組雙節(jié)點的聚類系數(shù)也作為特征提取。最后特征經(jīng)過多核學習融合成一個混合核進行分類診斷。通過分類結(jié)果分析,顯示基于sgLasso方法的多特征分類表現(xiàn)(87.88%)優(yōu)于現(xiàn)有的關(guān)于超網(wǎng)絡(luò)創(chuàng)建方法。由此暗示著不存在組結(jié)構(gòu)或僅存在組結(jié)構(gòu),均不能得到令人滿意的效果,若對組結(jié)構(gòu)進行適當?shù)臄U展,則可獲得更為有效的分類特征;同時,通過兩組聚類系數(shù)選取的差異特征評估,多特征的分類權(quán)重均優(yōu)于單組特征的分類權(quán)重。這表明基于多特征的方法有效地融合了兩個不同的信息,可以更有效地分類抑郁癥患者和正常對照組。
在目前的研究中,有兩個主要的問題。首先,基于sgLasso方法中由于k中心點聚類法本身的影響,即初始種子點的隨機選取以及k值的不同設(shè)置從而導致網(wǎng)絡(luò)拓撲及分類結(jié)果不唯一,因此在未來的研究中可以采取不同的聚類方法來進行分組,以此建立更加穩(wěn)定的超邊來進一步改善超網(wǎng)絡(luò)。其次,可以采用不同分配腦區(qū)的模板,探究不同模板創(chuàng)建的超網(wǎng)絡(luò)對于分類性能的影響。