張豪 王昕璨 李瑤 郭冬喜 郭浩
摘 ?要: 已有研究經(jīng)常忽略現(xiàn)實(shí)情況中年齡和性別對(duì)于大腦結(jié)構(gòu)影像數(shù)據(jù)的影響,導(dǎo)致特征選取的有效性降低,最終造成分類準(zhǔn)確率的降低。為此,提出基于線性混合效應(yīng)模型的方法進(jìn)行特征選擇,考慮到年齡和性別對(duì)影像指標(biāo)的影響,通過(guò)相關(guān)顯著性的大小選取腦影像指標(biāo)作為特征構(gòu)建分類器,應(yīng)用于不同人格特質(zhì)的組內(nèi)分類及識(shí)別中。分類結(jié)果顯示,基于線性混合效應(yīng)模型的方法使得不同人格分類準(zhǔn)確率有較明顯的提高。
關(guān)鍵詞: 腦結(jié)構(gòu)影像; 線性混合效應(yīng)模型; 特征選取; 大腦白質(zhì)計(jì)算; 人格分類; 結(jié)果分析
中圖分類號(hào): TN911.73?34; TP181 ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)02?0145?04
Research on brain structure image based on linear mixed effect model
ZHANG Hao1, WANG Xincan2, LI Yao1, GUO Dongxi1, GUO Hao1
Abstract: The previous studies have often overlooked the influence of age and gender on brain structure image data in the real situation, which leads to the reduction in the effectiveness of feature selection and ultimately in the classification accuracy. On this basis, a method based on the linear mixed effect model is proposed for the feature selection. In consideration of the influences of age and gender on image indexes, the brain image indexes are selected based on the size of correlation significance as features to construct the classifier, which is applied to the intra?group classification and recognition for different personality traits. The classification results show that the method based on the linear mixed effect model can obvious improve the accuracy of different personality classification.
Keywords: brain structure image; linear mixed effect model; feature selection; white matter calculation; personality classification; result analysis
0 ?引 ?言
近年來(lái)隨著腦科學(xué)技術(shù)的發(fā)展,人類大腦的結(jié)構(gòu)影像特征越來(lái)越受到關(guān)注。個(gè)體腦影像特征分析有助于促進(jìn)對(duì)人類神經(jīng)生物學(xué)基礎(chǔ)的認(rèn)識(shí)并具有提供相關(guān)影像學(xué)標(biāo)記的潛在價(jià)值[1]。彌散張量成像技術(shù)(Diffusion Tensor Imaging,DTI),是一種描述大腦結(jié)構(gòu)的新方法,是目前唯一能無(wú)創(chuàng)繪制大腦白質(zhì)神經(jīng)纖維通路的方法。多數(shù)學(xué)者認(rèn)為DTI技術(shù)能非常準(zhǔn)確地顯示大腦中主要的白質(zhì)纖維束,并且能夠通過(guò)若干特征性參數(shù)反應(yīng)大腦神經(jīng)系統(tǒng)。
已有研究表明年齡和性別是腦結(jié)構(gòu)影像數(shù)據(jù)的重要影響因素,并且已被證明與人格相互作用。而在以往的關(guān)于腦影像學(xué)的研究中,多忽略年齡和性別可能會(huì)對(duì)實(shí)驗(yàn)結(jié)果所產(chǎn)生的影響,如利用皮爾遜相關(guān)系數(shù)法、斯皮爾曼相關(guān)系數(shù)法[2]等。而為了便于考慮到年齡和性別因素,文獻(xiàn)[3?4]采用了基于一般線性模型的多元回歸分析方法。該方法可以同時(shí)將多個(gè)對(duì)觀察變量產(chǎn)生影響的因素進(jìn)行分析,但傳統(tǒng)的線性模型對(duì)于反應(yīng)變量還有三個(gè)假定要求:正態(tài)性、獨(dú)立性以及方差齊性。而人類腦影像數(shù)據(jù)由于性別和年齡段的不同可能存在一些群體特性,這就導(dǎo)致獨(dú)立性條件的不滿足,最終造成結(jié)果的偏差。為了兼顧年齡和性別這兩個(gè)影響因素,同時(shí)克服一般線性模型對(duì)于觀察變量必須具有的獨(dú)立性的要求,本文從個(gè)體的腦影像學(xué)特征出發(fā),提出建立線性混合效應(yīng)模型的方法。
線性混合效應(yīng)模型[5]的方法對(duì)于神經(jīng)影像學(xué)數(shù)據(jù)基于群體的推斷已經(jīng)被證明是有效的,這在分析功能磁共振成像數(shù)據(jù)和結(jié)構(gòu)磁共振成像數(shù)據(jù)的研究中已經(jīng)得到了證明[6]。該方法將年齡和性別作為無(wú)興趣的協(xié)變量納入模型,而人格特質(zhì)得分作為興趣變量納入模型,探索各個(gè)腦區(qū)腦影像指標(biāo)與人格特質(zhì)得分間的關(guān)系,研究不同腦區(qū)對(duì)正常被試不同人格特質(zhì)的影響,并以此為依據(jù)實(shí)現(xiàn)不同人格被試的分類。
本文中主要工作包括:
1) 計(jì)算所有正常被試的腦影像指標(biāo);
2) 建立混合效應(yīng)模型對(duì)不同腦區(qū)影像指標(biāo)與人格特質(zhì)得分間的相關(guān)性進(jìn)行研究,根據(jù)相關(guān)顯著性大小進(jìn)行特征選擇;
3) 以挑選出的腦區(qū)影像指標(biāo)作為特征構(gòu)建分類器,從而分別實(shí)現(xiàn)對(duì)外傾性人格特質(zhì)與神經(jīng)質(zhì)人格特質(zhì)的組內(nèi)分類。
1 ?數(shù)據(jù)采集與預(yù)處理
1.1 ?被試者
本研究根據(jù)山西省醫(yī)學(xué)倫理委員會(huì)(參考編號(hào):2012.13)的建議,在所有被試者書面知情同意的情況下進(jìn)行。所有被試者均按照赫爾辛基宣言簽署書面知情同意書,由工作人員統(tǒng)一安排,記錄性別、年齡等人口學(xué)信息并進(jìn)行編碼,采用艾森克人格問(wèn)卷(EPQ)調(diào)查被試的人格特質(zhì),所有被試均在安靜舒適的心理評(píng)估室完成自評(píng)量表的填寫,問(wèn)卷統(tǒng)一收回進(jìn)行數(shù)據(jù)錄入。對(duì)于被試的分組,根據(jù)EPQ龔耀先教授修訂本的評(píng)分細(xì)則進(jìn)行分組,由于艾森克量表的第三維度——精神質(zhì)的定義及神經(jīng)生理機(jī)智的不明確性,本文不對(duì)這一維度進(jìn)行分組及研究。被試者基本信息如表1所示。
1.2 ?數(shù)據(jù)采集與預(yù)處理
本文研究使用西門子3T超導(dǎo)MRI掃描儀(Siemens Trio 3?Tesla Scanner,Siemens,Erlangen,Germany)對(duì)200名正常右利手被試進(jìn)行彌散張量磁共振掃描。被試基本信息見(jiàn)表1。在掃描過(guò)程中,要求被試放松,閉眼,保持清醒狀態(tài),盡量不做任何思考。掃描參數(shù)設(shè)置如下:45 axial slices,repetition time(TR)=6 000 ms,echo time(ET)=90 ms,thickness/skip=3/0 mm,field of view (FOV)=240 mm[×]240 mm,matrix=128 mm[×]128 mm,flip angle=90°。擴(kuò)散敏感梯度方向?yàn)?2,擴(kuò)散敏感系數(shù)b=1 000 s/mm2。
彌散張量成像數(shù)據(jù)預(yù)處理使用Panda軟件進(jìn)行。首先對(duì)數(shù)據(jù)集進(jìn)行格式轉(zhuǎn)換(DICOM轉(zhuǎn)換為NifTI),然后提取b0值,進(jìn)行腦提取去除非腦組織、渦流校正和頭動(dòng)校正、空間標(biāo)準(zhǔn)化以及高斯平滑等。
2 ?方 ?法
基于線性混合效應(yīng)模型的腦結(jié)構(gòu)影像的分析及分類研究方法包括以下步驟:數(shù)據(jù)預(yù)處理;計(jì)算基于白質(zhì)分區(qū)圖譜的大腦白質(zhì)指標(biāo);建立線性混合效應(yīng)模型對(duì)白質(zhì)指標(biāo)與人格特質(zhì)得分的相關(guān)性進(jìn)行分析,根據(jù)相關(guān)性分析的結(jié)果進(jìn)行特征選擇,最后使用支持向量機(jī)的方法進(jìn)行分類。
2.1 ?大腦白質(zhì)指標(biāo)的計(jì)算
本文采用現(xiàn)有的約翰霍普金斯大學(xué)的ICBM?DTI?81白質(zhì)分區(qū)圖譜[7]進(jìn)行大腦區(qū)域的劃分,共將大腦分為50個(gè)白質(zhì)纖維束區(qū)域。本文共選擇四種DTI圖像特征參數(shù),包括各向異性分?jǐn)?shù)(Fractional Anisotropy,F(xiàn)A)、平均彌散率(Mean Diffusivity,MD)、徑向彌散系數(shù)(Radial Diffusivity,RD)以及軸向彌散系數(shù)(Axial Diffusivity, AD),用于描述體素特性。
各向異性分?jǐn)?shù)(Fractional Anisotropy,F(xiàn)A)是分析各向異性最常用的參數(shù),指彌散的各向異性部分占彌散張量總值的比例。計(jì)算公式如下:
[FA=32·(λ1-λ)2+(λ2-λ)2+(λ3-λ)2λ21+λ22+λ23] ?(1)
式中,[λ1,λ2,λ3]是彌散張量矩陣的三個(gè)特征值,分別表示沿三個(gè)正交方向上的彌散率;[λ=λ1+λ2+λ33]。
平均擴(kuò)散率(Mean Diffusivity,MD)反映水分子整體的彌散水平,只表示水分子彌散的大小和程度,而與彌散方向無(wú)關(guān)。計(jì)算公式如下:
[MD=λ1+λ2+λ33] ? ? ? ? ? ?(2)
徑向彌散系數(shù)(Radial Diffusivity,RD)反映與軸突長(zhǎng)軸成對(duì)角平面的水分子彌散水平。計(jì)算公式如下:
[RD=λ2+λ32] ? ? ? ? ? ? (3)
軸向彌散系數(shù)(Axial Diffusivity,AD)反映與軸突方向平行的水分子的彌散水平。計(jì)算公式如下:
[AD=λ1] ? ? ? ? ? ? ?(4)
2.2 ?線性混合效應(yīng)模型
線性混合效應(yīng)模型的一般形式結(jié)構(gòu)為:
[y=Xβ+Uγ+ε] ? ? ? ? ?(5)
式中:[y]表示反應(yīng)變量的測(cè)量值向量;[X]為固定效應(yīng)自變量的設(shè)計(jì)矩陣;[β]是與[X]對(duì)應(yīng)的固定效應(yīng)參數(shù)向量;[U]為隨機(jī)效應(yīng)變量構(gòu)造的設(shè)計(jì)矩陣,其構(gòu)成方式與[X]相同,[γ]為隨機(jī)效應(yīng)參數(shù)向量;[ε]為隨機(jī)誤差向量[8]。
本文中通過(guò)計(jì)算大腦白質(zhì)指標(biāo)FA,MD,RD及AD等來(lái)描述體素特性。在建立模型之前,首先針對(duì)各指標(biāo)特征,對(duì)其進(jìn)行相應(yīng)的對(duì)數(shù)轉(zhuǎn)化,使其呈近似正態(tài)分布,滿足模型建立的條件。然后建立混合效應(yīng)模型,分別將所有被試者的不同腦白質(zhì)指標(biāo)作為反應(yīng)變量的觀察值向量,以被試者的不同人格特質(zhì)得分構(gòu)造固定效應(yīng)的設(shè)計(jì)矩陣,又將各個(gè)被試的年齡、性別作為隨機(jī)效應(yīng)構(gòu)造隨機(jī)效應(yīng)的設(shè)計(jì)矩陣。
模型公式如下:
[y=β0+β1E+β2N+γ0+γ1AGE+γ2SEX] ?(6)
式中:y對(duì)應(yīng)于所有被試的同一白質(zhì)纖維束的同一白質(zhì)指標(biāo)值構(gòu)成的向量;E和N分別是各個(gè)被試的外傾性人格特質(zhì)得分和神經(jīng)質(zhì)人格特質(zhì)得分;AGE和SEX分別是各個(gè)被試者的年齡和性別。
分析線性混合效應(yīng)模型最終結(jié)果,以相關(guān)顯著性p<0.05為依據(jù)挑選與人格特質(zhì)相關(guān)的白質(zhì)纖維束。
2.3 ?分 ?類
本文在線性混合效應(yīng)模型最終結(jié)果的基礎(chǔ)上,分別得到與外傾性和神經(jīng)質(zhì)人格特質(zhì)相關(guān)的大腦白質(zhì)纖維束,將相關(guān)的大腦白質(zhì)纖維束指標(biāo)作為分類特征。為了消除所選特征中可能存在的冗余情況,又對(duì)各特征間進(jìn)行了兩兩冗余分析,得到最終與人格特質(zhì)相關(guān)的關(guān)鍵特征集合。
為了自動(dòng)鑒別不同人格特質(zhì)數(shù)據(jù),本文使用機(jī)器學(xué)習(xí)的方法來(lái)構(gòu)建分類器。被廣泛使用的分類器有多種,其中包括決策樹、神經(jīng)網(wǎng)絡(luò)、線性判別分析等。
每種分類算法都有其適用的場(chǎng)合和其特有的優(yōu)缺點(diǎn),而支持向量機(jī)(Support Vector Machine,SVM)分類算法比較適合對(duì)小樣本數(shù)據(jù)的處理。結(jié)合磁共振影像數(shù)據(jù)的特點(diǎn),本文選取支持向量機(jī)分類算法進(jìn)行分類。它是基于Matlab的LIBSVM工具包[9]進(jìn)行分類,并采用10折交叉驗(yàn)證(10?fold cross?validation)的方法來(lái)評(píng)估分類器的泛化性能。具體的過(guò)程是將所有的被試隨機(jī)分成10等分,逐一將其中的1等分作為測(cè)試集,剩余的9等分是訓(xùn)練集,取10次結(jié)果的均值作為對(duì)分類器性能的評(píng)估。同時(shí),為了得到更精確的結(jié)果,本實(shí)驗(yàn)進(jìn)行100次10折交叉驗(yàn)證,最后對(duì)100次的結(jié)果求均值得到最終的結(jié)果。以最常用的分類器性能的量化指標(biāo)正確率(Accuracy),敏感度(Sensitivity),特異度(Specificity)和AUC值作為評(píng)價(jià)標(biāo)準(zhǔn)。
3 ?結(jié) ?果
3.1 ?特征選擇
在本文中,將相關(guān)顯著性閾值p設(shè)為0.05,發(fā)現(xiàn)與艾森克人格的外傾性維度E相關(guān)的纖維束主要出現(xiàn)在內(nèi)側(cè)丘系,小腦上腳以及鉤束;而與艾森克人格的神經(jīng)質(zhì)維度相關(guān)的纖維束主要出現(xiàn)在矢狀層(包括下縱束以及額枕下束)、小腦中腳、內(nèi)側(cè)丘系、膜狀層以及后丘腦輻射(包括視神經(jīng)輻射),具體如表2所示。
本研究中得到的纖維束所涉及到的腦區(qū)可能對(duì)外傾性和神經(jīng)質(zhì)人格特質(zhì)有一定的影響,與已有研究中得到的結(jié)論也大體一致。
例如,Wright 等人報(bào)道了大腦中內(nèi)側(cè)前額葉區(qū)域與內(nèi)外向存在關(guān)聯(lián)性;Wei 等人報(bào)道了與內(nèi)外向相關(guān)的腦區(qū)發(fā)生在內(nèi)側(cè)前額葉部分、小腦、扣帶回及腦島等部位,而與神經(jīng)質(zhì)相關(guān)的腦區(qū)位于左側(cè)額中回[10];Hahn 等人通過(guò)研究發(fā)現(xiàn)紋狀體及眶額葉部位與人格特質(zhì)存在關(guān)聯(lián)性[11];Fischer等人報(bào)道了內(nèi)外向與殼核,尾狀核等皮層下的結(jié)構(gòu)相關(guān)聯(lián);O′Gorman等人報(bào)道了內(nèi)外向得分與丘腦及額下回等腦區(qū)相關(guān)聯(lián);文獻(xiàn)[12]通過(guò)研究找到內(nèi)外向與紋狀體、楔前葉及額上回等腦區(qū)相關(guān),而神經(jīng)質(zhì)與額中回及楔前葉相關(guān)。
3.2 ?分類結(jié)果
本文將通過(guò)線性混合效應(yīng)模型分析挑選出的大腦白質(zhì)纖維束指標(biāo)作為分類特征,分別進(jìn)行外傾性和神經(jīng)質(zhì)人格特質(zhì)的組內(nèi)分類。同時(shí),本文利用同樣的通過(guò)相關(guān)性分析方法進(jìn)行特征選擇的思想,進(jìn)行了皮爾遜相關(guān)系數(shù)和多元線性回歸的統(tǒng)計(jì)分析方法選取特征并進(jìn)行分類的實(shí)驗(yàn)。
分類結(jié)果如表3 所示。
由兩種人格特質(zhì)組內(nèi)分類結(jié)果可知,本文所提出的利用線性混合效應(yīng)模型做相關(guān)的分析方法,不僅能夠綜合考慮年齡和性別影響因素,而且彌補(bǔ)了已有方法中的缺陷,從而提高了分類的準(zhǔn)確率。
4 ?結(jié) ?語(yǔ)
本文基于線性混合效應(yīng)模型的腦結(jié)構(gòu)影像的分析及分類研究在真實(shí)的人格數(shù)據(jù)集上得到了有效的驗(yàn)證,所得相關(guān)性研究成果與現(xiàn)有研究結(jié)果大致相吻合,表明此方法可以用于對(duì)腦結(jié)構(gòu)影像與人格特質(zhì)的有關(guān)中,并且能夠?qū)崿F(xiàn)對(duì)不同人格進(jìn)行分類。本文所提方法能夠兼顧年齡和性別因素對(duì)于腦影像數(shù)據(jù)所產(chǎn)生的影響,并克服了傳統(tǒng)的一般線性模型的三個(gè)假定要求所帶來(lái)的問(wèn)題。分類的結(jié)果顯示,基于線性混合效應(yīng)模型的腦結(jié)構(gòu)影像的分析及分類方法對(duì)不同人格特質(zhì)的分類準(zhǔn)確率均有所提高。
參考文獻(xiàn)
[1] NIXON N L, LIDDLE P F, NIXON E, et al. Biological vulnerability to depression: linked structural and functional brain network findings [J]. British journal of psychiatry the journal of mental science, 2013(4): 283?289.
[2] MALEKMOHAMMADI M, AUYONG N, RICKS?ODDIE J, et al. Pallidal deep brain stimulation modulates excessive cortical high ?? phase amplitude coupling in Parkinson disease [J]. Brain stimulation, 2018(6): 57?61.
[3] BENEDICT R H, SCHWARTZ C E, DUBERSTEIN P, et al. Influence of personality on the relationship between gray matter volume and neuropsychiatric symptoms in multiple sclerosis [J]. Psychosomatic medicine, 2013, 75: 253?261.
[4] GENTILI C, CRISTEA I A, RICCIARDI E, et al. Not in one metric: neuroticism modulates different resting state metrics within distinctive brain regions [J]. Behavioural brain research, 2017, 327: 34.
[5] FITZMAURICE G M, LAIRD N M, WARE J H, et al. Applied longitudinal analysis [M]. Hoboken: John Wiley & Sons, 2012.
[6] BOWMAN D B. Brain imaging analysis [J]. Annual review of stattistics and its application, 2014, 1: 61?85.
[7] MORI S, OISHI K, JIANG H, et al. Stereotaxic white matter atlas based on diffusion tensor imaging in an ICBM template [J]. Neuroimage, 2008, 40: 570?582.
[8] KRUGGEL F, MASAKI F, SOLODKIN A. Analysis of longitudinal diffusion?weighted images in healthy and pathological aging: an ADNI study [J]. Journal of neuroscience methods, 2017, 278: 101?115.
[9] CHANG C C, LIN C J. LIBSVM: A library for support vector machines [J]. ACM transactions on intelligent systems and technology, 2011, 2(27): 27.
[10] WEI L, DUAN X, YANG Y, et al. The synchronization of spontaneous BOLD activity predicts extraversion and neuroticism [J]. Brain research, 2011, 1419: 68?75.
[11] HAHN T, DRESLER T, EHLIS A C, et al. Randomness of resting?state brain oscillations encodes Gray\"s personality trait [J]. Neuroimage, 2012, 59(2): 1842?1845.
[12] ADELSTEIN J S, ZARRAR S, MAARTEN M, et al. Personality is reflected in the brain′s intrinsic functional architecture [J]. Plos one, 2011, 6: 27633.
作者簡(jiǎn)介:張 ?豪(1994—),女,山西運(yùn)城人,碩士研究生,主要研究方向?yàn)槿斯ぶ悄?、智能信息處理、腦信息學(xué)。
郭 ?浩(1981—),男,山西太原人,博士,副教授,CCF會(huì)員,研究領(lǐng)域?yàn)槿斯ぶ悄?、智能信息處理與腦影像學(xué)。