李舒婷,李 瑤,王昕璨,趙云芃,陳俊杰
(太原理工大學(xué) a.信息與計(jì)算機(jī)學(xué)院,b.藝術(shù)學(xué)院,太原 030024)
復(fù)雜腦網(wǎng)絡(luò)的分析與研究是近幾年來神經(jīng)精神疾病領(lǐng)域的研究熱點(diǎn)。作為復(fù)雜網(wǎng)絡(luò)理論在神經(jīng)認(rèn)知科學(xué)的具體應(yīng)用,復(fù)雜腦網(wǎng)絡(luò)在了解有關(guān)神經(jīng)精神疾病的發(fā)病機(jī)理方面起到了很重要的作用,也為相關(guān)影像學(xué)標(biāo)志物以及腦疾病臨床的診斷和評價(jià)貢獻(xiàn)了潛在價(jià)值和新的方法。
盡管目前復(fù)雜腦網(wǎng)絡(luò)領(lǐng)域的研究受到眾多學(xué)者廣泛關(guān)注,但是由于網(wǎng)絡(luò)分析技術(shù)的不成熟、特征選擇及分類模型構(gòu)建方法的多樣性等,這一領(lǐng)域仍然存在著諸多亟待解決的問題。比如,傳統(tǒng)復(fù)雜網(wǎng)絡(luò)分析方法在不同組間進(jìn)行對比的標(biāo)準(zhǔn)化問題[1]。標(biāo)準(zhǔn)化指的是網(wǎng)絡(luò)的規(guī)模,包括網(wǎng)絡(luò)大小(即節(jié)點(diǎn)的數(shù)目)、網(wǎng)絡(luò)稀疏度(即存在連接的占比)以及平均度(即每個(gè)節(jié)點(diǎn)的連接數(shù))等。需要注意的是,目前該領(lǐng)域內(nèi)對復(fù)雜腦網(wǎng)絡(luò)的稀疏度尚未形成統(tǒng)一的結(jié)論。基于此,有研究人員提出利用最小生成樹(minimum spanning tree,MST)方法來進(jìn)行全腦范圍的復(fù)雜腦網(wǎng)絡(luò)的構(gòu)建[2-3]。這一無偏方法可以在保證所有節(jié)點(diǎn)均連入網(wǎng)絡(luò)的前提下,網(wǎng)絡(luò)中的邊被最大化的精簡,網(wǎng)絡(luò)結(jié)構(gòu)得到極大的簡化,而網(wǎng)絡(luò)核心框架仍可以被保留。因此,最小生成樹網(wǎng)絡(luò)在保證網(wǎng)絡(luò)連接的同時(shí),盡可能地保持較高的連接強(qiáng)度。通過這一方法,在一定程度上解決了網(wǎng)絡(luò)稀疏度等因素配置對網(wǎng)絡(luò)結(jié)構(gòu)的影響,已被廣泛應(yīng)用于腦疾病的研究中。
然而,在全腦構(gòu)建MST的方法仍存在一些局限。在這一方法中,不考慮所有的連接以防止聚類,從而獲得固定的網(wǎng)絡(luò)大小和密度,以使網(wǎng)絡(luò)可以比較。因此,MST可能低估了其他有趣信息的重要性,如低權(quán)重連接、腦網(wǎng)絡(luò)中的聚類信息處理和組間差異表示等[4]。由于最小生成樹對全腦網(wǎng)絡(luò)的過度簡化,使用局部可量化指標(biāo)表達(dá)信息較少,進(jìn)而導(dǎo)致組間差異表達(dá)能力降低。研究表明,僅采用最小生成樹網(wǎng)絡(luò)特征來進(jìn)行分類研究,較其他網(wǎng)絡(luò)特征而言,其分類準(zhǔn)確率明顯偏低[5]。
本文提出了一種在局部差異網(wǎng)絡(luò)的基礎(chǔ)上構(gòu)建最小生成樹功能腦網(wǎng)絡(luò)進(jìn)行特征提取的新方法,可最大程度實(shí)現(xiàn)組間差異表征,且能提供更有效的分類特征,以服務(wù)分類研究。該方法通過對抑郁組和正常組的腦網(wǎng)絡(luò)進(jìn)行組間基于網(wǎng)絡(luò)的統(tǒng)計(jì)(network-based statistic,NBS),尋找組間功能連接強(qiáng)度有明顯區(qū)別的連接以連接涉及的大腦區(qū)域;再分別構(gòu)建以每個(gè)腦區(qū)及其差異連接涉及的腦區(qū)為節(jié)點(diǎn)的功能連接子網(wǎng);在此基礎(chǔ)上,對每個(gè)子網(wǎng)進(jìn)行最小生成樹功能連接網(wǎng)絡(luò)的構(gòu)建,進(jìn)行進(jìn)一步的分析研究。
本文研究框架如圖1所示。首先采集數(shù)據(jù)并進(jìn)行預(yù)處理,其次利用Pearson相關(guān)構(gòu)建低序功能連接網(wǎng)絡(luò),在此基礎(chǔ)上利用NBS找到差異連接,并分別構(gòu)建局部差異網(wǎng)絡(luò),接下來采用Kruskal算法構(gòu)建局部差異最小生成樹腦網(wǎng)絡(luò),進(jìn)行局部指標(biāo)的計(jì)算并提取特征,最后構(gòu)建分類器驗(yàn)證分類結(jié)果。
圖1 本文的研究框架Fig.1 Research framework of this paper
本研究的受試者由山西醫(yī)科大學(xué)第一醫(yī)院招募,共70名。在后續(xù)的實(shí)驗(yàn)數(shù)據(jù)處理過程中發(fā)現(xiàn),有4例受試者的數(shù)據(jù)不符合要求,因此,本文只對其余66名受試者的數(shù)據(jù)進(jìn)行研究。其中,38名是首次發(fā)病且未服用任何藥物的重性抑郁癥患者;另外28名是健康志愿者,作為本實(shí)驗(yàn)的對照組。在進(jìn)行掃描前,研究人員與所有被掃描者通過書面方式達(dá)成一致意見(抑郁癥患者與其家屬簽訂協(xié)議,對照組志愿者與本人簽訂協(xié)議)。患病嚴(yán)重程度由24項(xiàng)Hamilton Rating Scale for Depression(HAMD)以及Clinical Global Impression of Severity(CGI-S)來表征。具體如表1所示,其中,數(shù)據(jù)范圍是最小值-最大值(平均值±標(biāo)準(zhǔn)差)。其中,a表示雙樣本雙尾T檢驗(yàn),b為雙尾皮爾遜卡方檢驗(yàn)。
表1 被試人員基本信息Table 1 Demographics and clinical characteristics of the subjects
本實(shí)驗(yàn)使用的數(shù)據(jù)均是由山西醫(yī)科大學(xué)第一醫(yī)院的放射科專業(yè)磁共振醫(yī)師采集。使用的是德國西門子磁共振設(shè)備(siemens trio 3-tesla scanner,siemens,erlangen,germany)。受試者在掃描期間,研究人員用海綿固定其頭部,以防止來回晃動(dòng)。受試者需保持身心的放松,閉目,處于一種不去想特定的事情但又不能進(jìn)入睡眠的狀態(tài)。掃描參數(shù)設(shè)置為:回波時(shí)間(Echo Time)30 ms,射頻重復(fù)時(shí)間(Repetition Time)2 000 ms,層厚(Slice Thickness)4 mm, 層間間隔0,視野范圍(Field of View)192 mm×192 mm,翻轉(zhuǎn)角90°,存儲矩陣64×64.實(shí)驗(yàn)共采集了248個(gè)時(shí)間點(diǎn)。此外,由于磁化的穩(wěn)定性,磁共振掃描數(shù)據(jù)的時(shí)間序列的前十項(xiàng)被拋棄。
本次研究的受試者磁共振成像數(shù)據(jù)利用SPM8(statistical parametric mapping)軟件做預(yù)處理。在對數(shù)據(jù)整體做頭動(dòng)校正和時(shí)間片校正時(shí),抑郁組(major depressive disorder,MDD)有2例受試者的數(shù)據(jù)、正常組(normal control,NC)有2例受試者的數(shù)據(jù)因?yàn)槠漕^部運(yùn)動(dòng)大于3 mm或者其頭部轉(zhuǎn)動(dòng)幅度大于3°,在校正過程中被舍棄。本文的66例實(shí)驗(yàn)數(shù)據(jù)不包含此4例數(shù)據(jù)。通過12維仿射變換,使校正后的圖像得到進(jìn)一步優(yōu)化,然后將其標(biāo)準(zhǔn)化到3 mm體素的MNI(montreal neurological institute)標(biāo)準(zhǔn)模板上。最后,用線性下降和0.01~0.10 Hz帶通濾波縮小高頻生物干擾以及低頻漂移對實(shí)驗(yàn)的影響。
本文利用MNI機(jī)構(gòu)的標(biāo)準(zhǔn)腦解剖圖AAL(anatomical automatic labeling)模板將大腦劃分成90個(gè)腦部區(qū)域(左右半球?qū)ΨQ,各包含45個(gè)區(qū)域)。腦網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)用所劃分的大腦區(qū)域來表示[6],節(jié)點(diǎn)值是每個(gè)腦區(qū)中全部體素的算術(shù)平均值。
在本研究中,Pearson相關(guān)系數(shù)代表腦網(wǎng)絡(luò)的邊。掃描過程中會產(chǎn)生一定的頭部移動(dòng)的偽差異,腦脊液還有白質(zhì)信號的噪聲,通過用多元線性回歸的方法減小其對實(shí)驗(yàn)的影響。通過Pearson相關(guān),對殘差進(jìn)行計(jì)算,就得到了任兩節(jié)點(diǎn)間平均時(shí)間序列的相關(guān)系數(shù)γij,生成一個(gè)90×90的相關(guān)矩陣。數(shù)學(xué)定義為:
(1)
本文使用NBS方法識別MDD和NC之間功能連接強(qiáng)度存在顯著組間差異的連接及涉及到的腦區(qū)[7]。主要的步驟如下:
1) 對Pearson相關(guān)矩陣應(yīng)用Fisher r-z轉(zhuǎn)換,求Z-score矩陣,提升相關(guān)性系數(shù)的正態(tài)性;
2) 采用多元線性回歸方法對Z-score進(jìn)行年齡和性別混雜因子的校正;
3) 在MDD和NC的Z-score矩陣之間進(jìn)行NBS.
本文將模板中的90個(gè)腦區(qū)分別作為90個(gè)ROI(Region of Interest),以每個(gè)ROI及其與之相關(guān)的差異連接涉及到的腦區(qū)為節(jié)點(diǎn),構(gòu)建功能連接子網(wǎng),局部差異網(wǎng)絡(luò)構(gòu)建完成。
神經(jīng)精神腦疾病研究中,Kruskal算法常用于腦網(wǎng)絡(luò)最小生成樹的構(gòu)建[8-9]。本文使用Kruskal算法[10]進(jìn)行局部差異最小生成樹腦網(wǎng)絡(luò)LDN-MST(minimum spanning tree based on local difference network)的構(gòu)建。詳細(xì)過程:第一步,將皮爾遜相關(guān)矩陣?yán)锼械倪叞凑諜?quán)重值大小從大到小依次排列;第二步,連續(xù)向網(wǎng)絡(luò)加入權(quán)重最大的邊。其中,如果加入邊后有環(huán)出現(xiàn),那么就把加入的這個(gè)邊丟棄;當(dāng)所有的邊都被放入到網(wǎng)絡(luò)中時(shí), Kruskal算法構(gòu)建過程就結(jié)束了。最后,MDD組和NC組的LDN-MST構(gòu)建完成。
構(gòu)建完成局部差異最小生成樹腦網(wǎng)絡(luò)后,要進(jìn)行網(wǎng)絡(luò)屬性值計(jì)算和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的對比。經(jīng)過相關(guān)文獻(xiàn)的查閱和大量的試驗(yàn)分析,介數(shù)中心度、度、離心率,以及樹層次、葉子分?jǐn)?shù)、直徑和平均離心率分別是本文最后選用的3個(gè)局部屬性和4個(gè)全局屬性。
此外,為了判斷混雜因子(年齡、教育程度、性別)對最小生成樹4個(gè)全局屬性的影響,本文通過多元線性回歸方法進(jìn)行分析。分析表明,混雜因子與局部差異最小生成樹腦網(wǎng)絡(luò)的平均離心率、樹層次、葉子分?jǐn)?shù)、直徑等4個(gè)屬性之間沒有顯著相關(guān)性。
為了對MDD組和NC組局部差異最小生成樹網(wǎng)絡(luò)的3個(gè)局部指標(biāo)進(jìn)行統(tǒng)計(jì)分析,本次研究采用Kolmogorov-Smirnov非參數(shù)置換檢驗(yàn)檢測組間存在顯著差異的大腦區(qū)域。同時(shí),利用該檢驗(yàn)對網(wǎng)絡(luò)的直徑、葉子分?jǐn)?shù)、樹層次和平均離心率4個(gè)全局屬性進(jìn)行分析,并對NC組和MDD組的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行比較。
本文使用Benjamini-Hochberg假陽性率法(q=0.05)對結(jié)果進(jìn)行校正。FDR(False Discovery Rate)方法適用于樣本量相對小的比較結(jié)果的校正,因?yàn)榭偄裥统鲥e(cuò)率可以較好地在多重比較中被控制。
本文利用機(jī)器學(xué)習(xí)構(gòu)造分類器。被人們廣為使用的分類器多種多樣,如決策樹、支持向量機(jī)等,根據(jù)不同的情境選擇合適的分類算法。支持向量機(jī)(support vector machine,SVM)這一分類算法比較適合且經(jīng)常被用于對數(shù)據(jù)量小的樣本的處理[11]。根據(jù)功能磁共振數(shù)據(jù)的自有特征,本文選用SVM進(jìn)行分類研究,通過徑向基核函數(shù)進(jìn)行分類模型的構(gòu)建,使用留一交叉驗(yàn)證來度量分類器的泛化能力。具體而言,假設(shè)總樣本數(shù)為N,每一次都從總樣本中拿出其中的一個(gè)樣本作為測試集,那么除此之外的N-1個(gè)樣本就成為訓(xùn)練集。按這樣的規(guī)則,確保每個(gè)樣本都可以做一次測試樣本,這樣將會產(chǎn)生N個(gè)分類器并通過計(jì)算得出N個(gè)測試結(jié)果,最后N個(gè)結(jié)果取平均值來衡量分類器模型的性能。
本文用正確率、靈敏度、特異度和AUC值這4個(gè)最常被使用的度量指標(biāo)作為標(biāo)準(zhǔn)。其中,正確率是樣本中被正確分類的樣本數(shù)除以樣本總數(shù)所得的商;敏感度體現(xiàn)的是正例被正確分為正例的樣本數(shù)與全部正例數(shù)之比,可以衡量出分類器對正例的辨別能力;特異度體現(xiàn)的是負(fù)例被正確分類為負(fù)例的樣本數(shù)與全部負(fù)例數(shù)之比,能夠衡量出分類器對負(fù)例的辨別能力。
如圖2所示,通過基于網(wǎng)絡(luò)的統(tǒng)計(jì)我們發(fā)現(xiàn)了MDD與NC存在有明顯組間差異的連接(P<0.05,F(xiàn)DR校正)。具體的,有28個(gè)ROI與其余腦區(qū)間的連接無顯著組差異;有26個(gè)ROI與其余腦區(qū)間存在顯著組間差異的連接數(shù)為1條;有11個(gè)ROI存在顯著組間差異的連接數(shù)為2條;其余25個(gè)ROI存在顯著組間差異的連接數(shù)大于等于3條。表2列舉了差異連接條數(shù)大于等于3的腦區(qū)及其具體差異連接條數(shù)。
圖2 差異連接及腦區(qū)Fig.2 Differential connection and brain area
本文將差異連接條數(shù)大于等于3的ROI和其差異連接涉及腦區(qū)共同作為局部差異網(wǎng)絡(luò)的節(jié)點(diǎn)來構(gòu)建局部差異網(wǎng)絡(luò),并且在其基礎(chǔ)上構(gòu)建了最小生成樹功能連接子網(wǎng)絡(luò),最后一共構(gòu)建了25個(gè)功能連接子網(wǎng)。
本文通過Kolmogorov-Smirnov非參數(shù)置換檢驗(yàn),對平均離心率、樹層次、葉子分?jǐn)?shù)、直徑4個(gè)指標(biāo)進(jìn)行了分析,辨別NC組與MDD局部差異最小生成腦網(wǎng)絡(luò)的拓?fù)洳町?P<0.05,F(xiàn)DR校正)。其中,25個(gè)子網(wǎng)中只有6個(gè)ROI形成的子網(wǎng)其指標(biāo)有顯著性差異,且差異只出現(xiàn)在平均離心率和直徑這兩個(gè)指標(biāo)上。抑郁組的平均離心率和直徑均比對照組低。
表2 腦區(qū)及其差異連接數(shù)量Table 2 Brain regions and the number of different connections
全局屬性檢驗(yàn)結(jié)果如圖3所示。圖中為,以(a)左側(cè)中央前回、(b)左側(cè)中央溝蓋、(c)右側(cè)楔葉、(d)左側(cè)豆?fàn)顨ず恕?e)左側(cè)顳上回以及(f)左側(cè)內(nèi)側(cè)和旁扣帶腦回為ROI網(wǎng)絡(luò)的直徑與平均離心率的結(jié)果。其中,每幅圖中左側(cè)為直徑的結(jié)果,右側(cè)為平均離心率的結(jié)果;圖(f)中,左側(cè)內(nèi)側(cè)和旁扣帶腦回為ROI的局部差異最小生成樹網(wǎng)絡(luò)中,只有在平均離心率這一指標(biāo)上存在明顯組差異。
對每個(gè)受試者,計(jì)算了局部差異最小生成樹腦網(wǎng)絡(luò)的離心率、介數(shù)、度,并且使用Kolmogorov-Smirnov檢驗(yàn)來分析計(jì)算的指標(biāo)。選擇MDD組與NC組之間有特別明顯差異的腦區(qū)作為分類特征進(jìn)行之后的實(shí)驗(yàn)。
如圖4所示,這些大腦區(qū)域的局部屬性都有明顯的組差異(P<0.05,F(xiàn)DR校正)。
本文使用留一交叉驗(yàn)證法(leave-one-out cross validation,LOOCV)度量分類器模型的泛化能力。評價(jià)分類器性能的指標(biāo)很多,本文用準(zhǔn)確性(Accu-racy)、靈敏度(Sensitivity)、特異性(Specificity)以及AUC(area under curve)這幾個(gè)最常被使用的指標(biāo)作為度量標(biāo)準(zhǔn)。
圖3 全局屬性結(jié)果Fig.3 Results of global properties
圖4 局部屬性結(jié)果Fig.4 Results of local properties
其中,選取作為分類的腦區(qū)特征是MDD和NC每組子網(wǎng)中的離心率、度、介數(shù)中心度3個(gè)局部屬性中組間差異非常明顯的總共24個(gè)特征,用來進(jìn)行之后的分類,具體見表3所示。
在表4中,SACCHET et al[12]和ERGUZEL et al[13]通過全局指標(biāo)進(jìn)行分類;GUO et al[14]采用的分類特征是3個(gè)局部指標(biāo):節(jié)點(diǎn)效率、度、介數(shù);WEE et al[15]的分類特征是局部聚類系數(shù);GUO et al[5]在全腦構(gòu)建最小生成樹網(wǎng)絡(luò)時(shí),利用局部指標(biāo)進(jìn)行分類。前面所提到的分類是按腦區(qū)的相關(guān)信息進(jìn)行的,多個(gè)腦區(qū)之間的拓?fù)湫畔⑹艿綋p失。本文所提方法能保證一定的組間差異表征能力,能獲得更多的組間信息,彌補(bǔ)在全腦上用最小生成樹構(gòu)建網(wǎng)絡(luò)的不足,特征的有效性和分類的準(zhǔn)確率得到進(jìn)一步的提升,最高分類準(zhǔn)確率可達(dá)83.3%.
本文提出的局部差異最小生成樹腦網(wǎng)絡(luò)分類方法在真實(shí)的抑郁癥患者數(shù)據(jù)集上得到驗(yàn)證,且實(shí)驗(yàn)結(jié)果與實(shí)際情況相符,證明了其可行性。與傳統(tǒng)分類方法相比,在進(jìn)行抑郁癥分類時(shí)采用局部差異最小生成樹腦網(wǎng)絡(luò)分類方法可顯著提升準(zhǔn)確率,證明該方法可以應(yīng)用到抑郁癥的輔助診斷中。
表3 局部指標(biāo)異常腦區(qū)及其顯著性Table 3 Abnormal brain area of local properties and its significance
表4 不同研究的分類結(jié)果對比Table 4 Comparison of classification results of different studies