曹迎新 葛曼玲 陳盛華 宋子博 謝 沖 楊澤坤 王 磊 張其銳
1(河北工業(yè)大學(xué)省部共建電工裝備可靠性與智能化國家重點實驗室,天津 300130)
2(河北工業(yè)大學(xué)河北省電磁場與電器可靠性重點實驗室,天津 300130)
3(廊坊職業(yè)技術(shù)學(xué)院電氣工程系,河北廊坊 065001)
4(中國人民解放軍東部戰(zhàn)區(qū)總醫(yī)院醫(yī)學(xué)影像科,南京 210002)
癲癇是腦內(nèi)自發(fā)異常神經(jīng)放電而導(dǎo)致中樞神經(jīng)功能失調(diào)的慢性疾病(世界常見、我國最多),發(fā)病率僅次于偏頭痛、腦卒中、老年癡呆[1]。全球約7 000萬例癲癇患者,而我國是病例最多的國家,約占13%,其中超30%的病患不能藥物控制,成難治性癲癇。常見的顳葉癲癇多導(dǎo)致海馬和大腦皮質(zhì)區(qū)萎縮,結(jié)構(gòu)MRI 提示,海馬陽性是內(nèi)側(cè)顳葉癲癇(mesial temporal lobe epilepsy,mTLE)最重要的病理標(biāo)記[2]。癲癇發(fā)作來自于異常興奮的腦局部區(qū)域,稱為致癇區(qū)(epileptogenic zone),所在腦半球為致癇側(cè)(epileptogenic hemisphere)[3],放電源癇性神經(jīng)放電能快速隨機遠傳擴散,損害腦組織,形成繼發(fā)灶,并動態(tài)波及頂葉和枕葉與腦外周結(jié)構(gòu)甚至全腦,篡改和降低腦內(nèi)區(qū)間功能連接(functional connectivity,F(xiàn)C),降低語言、記憶與認(rèn)知等功能,導(dǎo)致功能重組和偏側(cè)化改變,易出現(xiàn)術(shù)后語言、記憶和認(rèn)知功能障礙。總之,癲癇的發(fā)生發(fā)展不僅與激活灶的FC性能異常有關(guān),還可波及全腦,引起腦區(qū)之間FC 衰變、退化。切除腦內(nèi)致癇區(qū)是治療癲癇患者的最佳方案,因此致癇區(qū)的準(zhǔn)確識別是癲癇手術(shù)成功的關(guān)鍵[3-4],而癲癇病灶定側(cè)為首要[5]。
目前,臨床上對于癲癇疾病的診斷以及致癇灶定位,主要采用腦電圖/腦磁圖、腦部結(jié)構(gòu)磁共振、臨床癥狀相結(jié)合的綜合性診斷方式。但癲癇患者常規(guī)腦電陽性率僅為40%~60%[6],而在結(jié)構(gòu)MRI上表現(xiàn)為陰性的約30%[7]。通過常規(guī)檢查,尚無法對大部分癲癇患者的致癇灶進行明確定位,而在患者腦結(jié)構(gòu)變化之前,已證實其功能發(fā)生異變。因此,從功能像尋求致癇灶定位的研究開始興起。當(dāng)前,靜息態(tài)功能磁共振成像(rfMRI)在癲癇臨床研究方面的優(yōu)勢越來越突出[8],并以其無創(chuàng)、快捷、高空間分辨率以及良好的患者適應(yīng)性和體驗等,成為了腦功能影像研究領(lǐng)域的先進手段,有效地彌補了現(xiàn)有臨床疾病診斷途徑的不足?,F(xiàn)階段,其功能連接(fMRI-FC)為評估腦功能提供了科學(xué)的檢測指標(biāo),但有一些問題影響了fMRI-FC 評估的精準(zhǔn)性。例如,fMRI-FC 計算多采用皮爾森相關(guān)性算法,處于低階運算水準(zhǔn)。
近些年來,腦網(wǎng)絡(luò)概念被越來越多的科學(xué)家所重視。為此,一些科學(xué)家提出了開放式腦科學(xué)計劃[9]。國際抗癲癇聯(lián)盟(International League Against Epilepsy,ILAE)在制定癲癇分類標(biāo)準(zhǔn)時,也特別強調(diào)了癲癇腦網(wǎng)絡(luò)概念[10-11]。研究證實,癲癇患者在發(fā)作狀態(tài)下,其腦網(wǎng)絡(luò)均存在不同程度的拓?fù)鋵傩援惓12-13]。而局灶性癲癇發(fā)作,不僅會導(dǎo)致大腦功能及結(jié)構(gòu)網(wǎng)絡(luò)出現(xiàn)異常[14-15],還會引起病灶區(qū)域以外的腦區(qū)受損。通過大腦功能網(wǎng)絡(luò)的拓?fù)鋵傩宰兓瘉硌芯磕X區(qū)間信息傳遞異常,能夠高效地定位病灶區(qū)域,挖掘發(fā)生腦功能特異性改變的腦區(qū),從網(wǎng)絡(luò)這一高級層面來輔助檢測癲癇。但現(xiàn)階段,癲癇腦網(wǎng)絡(luò)研究主要集中于腦電/腦磁圖信號分析,尤其是對mTLE 的結(jié)構(gòu)像以陽性標(biāo)示的單側(cè)海馬硬化的研究。例如,左、右mTLE 的白質(zhì)連通性出現(xiàn)差異[16],TLE 患者在發(fā)作期具有偏側(cè)性[17],往往偏向于結(jié)構(gòu)像和腦電或腦磁。功能像研究起步不久,尚少有參照健康人fMRI 數(shù)據(jù),在構(gòu)建腦功能網(wǎng)絡(luò)水平上進行癲癇致癇側(cè)功能異常的特異性研究。
近年來,分類模型在癲癇研究上多有應(yīng)用,如利用遷移學(xué)習(xí)識別癲癇發(fā)作狀態(tài)[18]、癲癇間歇期與癲癇發(fā)作期的分類[19]、基于傳遞熵分解特征張量[20]、非癲癇性患者發(fā)作分類[21]等。通過構(gòu)建腦網(wǎng)絡(luò),分析癲癇區(qū)別癲癇患者區(qū)別于健康人的特異性研究。但它們大多采用單一節(jié)點指標(biāo)構(gòu)建腦網(wǎng)絡(luò),進行特征提取以實現(xiàn)分類,缺乏對全腦多維度信息的有效利用,其分類效果難以得到提高。
隨著多指標(biāo)融合技術(shù)的發(fā)展[22],筆者試圖將其應(yīng)用于rfMRI 數(shù)據(jù)的致癇側(cè)腦功能網(wǎng)絡(luò)特異性研究,以詳細描述致癇側(cè)腦功能網(wǎng)絡(luò)的拓?fù)鋵傩蕴卣鳎D在網(wǎng)絡(luò)層面上融合多指標(biāo)評估,將fMRI-FC計算水準(zhǔn)提到高階。為此,參照健康人組學(xué)數(shù)據(jù),建立了癲癇全腦功能網(wǎng)絡(luò)多節(jié)點指標(biāo)融合的特異性模型,并借助機器學(xué)習(xí)方法驗證其在定位致癇側(cè)中的優(yōu)勢。
1.1.1 實驗數(shù)據(jù)
1)顳葉癲癇患者組。本組實驗數(shù)據(jù)來自中國人民解放軍東部戰(zhàn)區(qū)總醫(yī)院醫(yī)學(xué)影像科[23]。共選取20 名單側(cè)發(fā)作顳葉癲癇患者(9 名男性,11 名女性),其中左側(cè)致癇和右側(cè)致癇各10 名,年齡在19~33 歲之間,平均每月發(fā)作7.4 次。所有實驗對象均為致癇側(cè)結(jié)構(gòu)MRI 檢出海馬陽性,在術(shù)前接受常規(guī)的檢查,以定位癲癇放電區(qū)域。所有fMRI 圖像數(shù)據(jù)由3.0 T Siemens Trio MRI 掃描儀在中國人民解放軍東部戰(zhàn)區(qū)總醫(yī)院掃描所得:射頻重復(fù)時間(TR)=2 000 ms,(回波時間)TE=30 ms,翻轉(zhuǎn)角度(FA)=90°,矩陣大小為64×64,掃描視野(FOV)= 240 mm×240 mm,層厚4.00 mm,層間距0.40 mm。本研究獲得南京軍區(qū)總醫(yī)院醫(yī)學(xué)倫理委員會批準(zhǔn),患者知情并且簽署知情同意書。
2)健康人組。本實驗健康青年人樣本來自西南大學(xué)成人壽命數(shù)據(jù)集(https:/ /www.nature.com /articles/sdata2018134),從中挑選了139 名年齡在19~37 歲之間的健康人。實驗對象數(shù)據(jù)符合下述5個質(zhì)量控制標(biāo)準(zhǔn):符合MRI 相關(guān)排除標(biāo)準(zhǔn),包括幽閉恐怖、金屬植入物、梅尼埃氏綜合征、近6 個月內(nèi)有暈倒史;目前無精神疾病或神經(jīng)系統(tǒng)疾病;在掃描前3 個月內(nèi)沒有使用精神類藥物;沒有懷孕;沒有頭部外傷史。此外,要求參與者在掃描前一天和掃描當(dāng)天不要飲酒。
所有健康人的fMRI 圖像數(shù)據(jù)由3.0 T Siemens Trio MRI 掃描儀在重慶西南大學(xué)腦成像中心進行掃描所得:TR=2 000 ms,TE=30 ms,F(xiàn)A=90°,F(xiàn)OV=220 mm×220 mm,層厚3.00 mm,層間距1.00 mm。數(shù)據(jù)集選取的每位實驗對象都簽署了知情同意書。
1.1.2 數(shù)據(jù)預(yù)處理
首先,為了使信號更穩(wěn)定,將每位實驗對象采集的數(shù)據(jù),去除對掃描噪聲適應(yīng)性較差的前4 個時間點;其次,使用SPM2 進行時間層校正處理;接下來,利用FSL 軟件對頭部運動進行剛體平移和旋轉(zhuǎn);然后,全腦平均信號歸一化,將每個實驗對象的數(shù)據(jù)空間標(biāo)準(zhǔn)化為體素大小為2 mm,配準(zhǔn)到MNI(Montreal Neurological Institute)標(biāo)準(zhǔn)空間;最后,濾除0.01~0.08 Hz 以外頻率的樣本,減小高頻干擾。
所有患者和健康人的rfMRI 數(shù)據(jù)預(yù)處理工作是在CPU 為Intel Xeon Sliver4112×16、64 核、操作系統(tǒng)Centos7.6 的處理平臺上,并基于FMRIB 軟件庫[24-25]中的工具包實現(xiàn)的。處理流程、專利算法和質(zhì)量檢測(其中頭動控制量為0.2 mm)在美國哈佛醫(yī)學(xué)院Martinos 醫(yī)學(xué)影像中心完成,每位實驗對象的數(shù)據(jù)預(yù)處理時間約為15 h。
1.2.1 腦功能網(wǎng)絡(luò)構(gòu)建
如果將人腦定義為一個網(wǎng)絡(luò)系統(tǒng),那么它將是現(xiàn)實世界中最為復(fù)雜的網(wǎng)絡(luò)系統(tǒng)之一,其構(gòu)建基于圖論理論,包含節(jié)點和邊。本研究對每個被試構(gòu)建腦功能網(wǎng)絡(luò),比較顳葉癲癇患者致癇側(cè)與健康人腦功能網(wǎng)絡(luò)的拓?fù)鋵傩圆町?,以研究癲癇腦功能異常的特異性。
1)節(jié)點。根據(jù)某一特定的先驗?zāi)X模板,將全腦進行腦區(qū)劃分,隨后將每個腦區(qū)定義為一個節(jié)點,再將每個腦區(qū)中全部體素的算術(shù)平均值作為該節(jié)點時間序列中的值。使用最廣泛的是自動解剖標(biāo)記模板(automated anatomical labeling,AAL)[26],本實驗用AAL 模板(第1 版)來評估BOLD 時間序列(每個腦區(qū)時間長度為246),將全腦分為116 個腦區(qū),因而節(jié)點數(shù)為116。
2)邊。即節(jié)點間連接,通過不同節(jié)點間功能性信號時間序列的相關(guān)性來獲得功能連接。本研究基于功能連接基礎(chǔ)算法(即傳統(tǒng)FC,屬于低階FC)的皮爾遜相關(guān)系數(shù)來定義該相關(guān)性,其計算公式如下:
式中,X、Y分別為兩個節(jié)點的時間序列向量,E表示期望,其值介于-1 ~1 之間,正數(shù)表示正相關(guān),負(fù)數(shù)表示負(fù)相關(guān),絕對值越大表示相關(guān)性越強。
由此可得到每個實驗對象的關(guān)聯(lián)矩陣,包含116 個節(jié)點之間的相關(guān)性將形成116×116 相關(guān)系數(shù)矩陣,矩陣中的數(shù)值即為對應(yīng)116 個腦區(qū)的皮爾遜相關(guān)系數(shù)。
3)閾值選取。將關(guān)聯(lián)矩陣轉(zhuǎn)化為網(wǎng)絡(luò),即利用閾值對關(guān)聯(lián)矩陣進行劃分,生成二值鄰接矩陣。假如關(guān)聯(lián)矩陣元素大于閾值,則鄰接矩陣中的對應(yīng)元素將設(shè)置成1,反之則為0。所以,閾值設(shè)定直接決定了網(wǎng)絡(luò)中邊的生成,從而對網(wǎng)絡(luò)規(guī)模及拓?fù)浣Y(jié)構(gòu)產(chǎn)生重要影響。隨著閾值不斷增加,邊數(shù)量也隨之單調(diào)增加,但不一定是線性增加。
相比較關(guān)聯(lián)度,由于稀疏度可以屏蔽不同連接定義所形成的差別,所以一般采用稀疏度來進行閾值設(shè)置,即網(wǎng)絡(luò)中實際存在的邊數(shù)與網(wǎng)絡(luò)中可能存在的最大邊數(shù)之比。研究發(fā)現(xiàn):腦功能網(wǎng)絡(luò)的小世界屬性在稀疏度大于0.5 時,趨于隨機化[27]。因此,一般默認(rèn)稀疏度小于0.5。
1.2.2 腦功能網(wǎng)絡(luò)參數(shù)計算
選擇AAL116 模板作為節(jié)點定義,皮爾遜相關(guān)系數(shù)為邊的定義,使用開放軟件GRETNA (http:/ /www.nitrc.org/projects/gretna/)工具包在Matlab 平臺進行分析,保障每一位被試的腦功能網(wǎng)絡(luò)包含相同的邊數(shù),以便于在相同網(wǎng)絡(luò)條件下在患者組和健康人之間進行比較分析。一般地,采用一組稀疏度方式對關(guān)聯(lián)矩陣進行閾值化處理,每次構(gòu)建網(wǎng)絡(luò)稀疏度(Sparsity)選擇0.05~0.50,步長選為0.05。但0.05、0.10、0.15 這前3 個稀疏度下的網(wǎng)絡(luò)參數(shù)存在無效值,因此在0.2~0.5 共7 個稀疏度空間分別計算網(wǎng)絡(luò)參數(shù),并完成了20 例癲癇患者組及139 例健康人組的靜息態(tài)腦功能網(wǎng)絡(luò)構(gòu)建,流程如圖1所示。
圖1 不同稀疏度下腦功能網(wǎng)絡(luò)的構(gòu)建Fig. 1 Construction of brain functional networks with different sparsity values
1.2.3 腦功能網(wǎng)絡(luò)拓?fù)溆嬎?/p>
目前,腦功能網(wǎng)絡(luò)[28]拓?fù)鋵傩苑N類繁多,分為局部和全局兩種網(wǎng)絡(luò)特征,腦功能網(wǎng)絡(luò)節(jié)點特征由局部屬性體現(xiàn)。目前,對神經(jīng)和精神疾病的腦網(wǎng)絡(luò)節(jié)點屬性研究多以度中心性、中介中心性、節(jié)點聚合系數(shù)和節(jié)點效率為主[29-30],因此選用上述4 個局部屬性對單節(jié)點特異性指標(biāo)做分類研究,如表1所示。通過GRETNA 軟件構(gòu)建每個實驗對象的腦功能網(wǎng)絡(luò),計算稀疏度空間為0.2 ~0.5 下(即步長為0.05,共7 個稀疏度)的度中心性、中介中心性、節(jié)點聚合系數(shù)、節(jié)點效率4 個局部節(jié)點指標(biāo)的參數(shù)。每個實驗對象的1 個節(jié)點指標(biāo)為7×116 的參數(shù)矩陣,其中行代表稀疏度,列代表腦區(qū)。
表1 腦功能網(wǎng)絡(luò)分析指標(biāo)Tab.1 Brief descriptions of brain functional network metrics in this study
1.2.4 腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)模型
1)腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)的非特異性模型。以往,癲癇腦網(wǎng)絡(luò)常采用直接相對比的非特異性方法。選取4 個局部屬性,采用了腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)的非特異性方法,即直接采用多節(jié)點指標(biāo)融合形成特征向量,以提取對致癇側(cè)敏感的腦功能網(wǎng)絡(luò)標(biāo)記。最后,與構(gòu)建的特異性模型分類性能進行比較,試圖說明后者優(yōu)勢。將20 例癲癇患者的4 個節(jié)點指標(biāo)參數(shù)矩陣分別在稀疏度序列上取平均,得到4 組20×116 的腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)的非特異性計算矩陣,將其作為特征向量進行分類。
2)腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)的特異性模型。與非特異性模型不同,特異性模型的構(gòu)建是以健康人連接組為參照的,試圖參照健康人群為患者腦功能網(wǎng)絡(luò)打分。首先,分別選取4 個局部屬性,建立腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)的特異性模型,以用于提取單一節(jié)點指標(biāo)下對致癇側(cè)敏感腦區(qū),再構(gòu)建4 個節(jié)點指標(biāo)融合的特異性模型,用于提取對致癇側(cè)敏感腦區(qū),以便進行分類,試圖與前者比較,說明節(jié)點指標(biāo)融合的分類優(yōu)勢。本研究的具體流程如圖2所示。
圖2 方法的計算流程Fig.2 Methodology flowchart for this study
分別對20 名顳葉癲癇患者和139 名健康人的每個節(jié)點指標(biāo)參數(shù)在稀疏度序列上取平均,進行節(jié)點相關(guān)性(皮爾遜相關(guān)性)計算,每個實驗對象得到4 組116×116 的腦功能網(wǎng)絡(luò)節(jié)點關(guān)聯(lián)矩陣r。
對于腦功能網(wǎng)絡(luò)多節(jié)點指標(biāo)融合的特異性模型,基于節(jié)點關(guān)聯(lián)矩陣r進行計算,其值記作特異性指數(shù)(specificity index,SI),有
式中,rsi是第s個癲癇患者的第i個腦區(qū)的某節(jié)點指標(biāo)的關(guān)聯(lián)系數(shù),rpi是第p個健康人的第i個腦區(qū)的某節(jié)點指標(biāo)的關(guān)聯(lián)系數(shù),N是健康人的數(shù)量,SIsi為第s個癲癇患者與所有健康人的第i個腦區(qū)之間腦功能網(wǎng)絡(luò)節(jié)點的特異性指數(shù)。對于健康人組的SI 計算,rsi是第s個健康人的第i個腦區(qū)的某節(jié)點指標(biāo)的關(guān)聯(lián)系數(shù),rpi是第p個健康人的第i個腦區(qū)的某節(jié)點指標(biāo)的關(guān)聯(lián)系數(shù),N是健康人的數(shù)量,SIsi為第s個健康人與其他健康人第i個腦區(qū)之間腦功能網(wǎng)絡(luò)節(jié)點的特異性指數(shù)。每個SI 為1×116 矩陣。
針對4 個節(jié)點指標(biāo),計算了20 名癲癇患者相對于健康人組的節(jié)點特異性指數(shù)SI,得到4 組20×116矩陣,以及139 名健康人之間的SI,得到了4 組139×116 矩陣。
為了比較癲癇患者與健康人組的SI 差異,需保證數(shù)據(jù)的量級統(tǒng)一。因此,基于健康人組SI 的分布,對癲癇患者SI 模型進行Z-Score 標(biāo)準(zhǔn)化計算[31],即每位癲癇患者的SI 減去健康人組SI 的均值再除以健康人組SI 的標(biāo)準(zhǔn)差,就可以衡量患者的某個節(jié)點特異性指數(shù)在健康人組分布中的相對位置。將SI 模型評分標(biāo)準(zhǔn)化計算得到的每個指標(biāo)值,作為特異性標(biāo)準(zhǔn)化分?jǐn)?shù) (specificityZ-score,SZS),有
式中,mean_SIi表示139 個健康人在第Zs,i個腦區(qū)SI 的平均值,std_SIi表示139 個健康人在第Zs,i個腦區(qū)SI 的標(biāo)準(zhǔn)差。
在每個節(jié)點指標(biāo)處進行特異性分?jǐn)?shù)標(biāo)準(zhǔn)化計算。最后,20 名癲癇患者將得到20×116 的SZS 特征矩陣,則4 個節(jié)點指標(biāo)將得到4 組20×116 的SZS特征矩陣。
1.2.5 對特征腦區(qū)的選擇方法
首先使用ROC (receiver operaing characteristic)曲線分析方法,選取對致癇側(cè)敏感腦區(qū)。使用SPSS(IBM SPSS Statistics 22; USA),對每個節(jié)點指標(biāo)下癲癇患者左側(cè)致癇(標(biāo)1)、右側(cè)致癇(標(biāo)2)的特征矩陣做ROC 敏感性曲線分析,曲線下面積(area under curve,AUC)越大,其分類敏感性越強;采用AUC 降序排列選取特征腦區(qū),即4 個單節(jié)點指標(biāo)和其指標(biāo)融合后篩選的敏感腦區(qū)皆采用了此方法。
在多節(jié)點指標(biāo)融合的篩選中,還采用了差值統(tǒng)計分析法,即在左側(cè)、右側(cè)致癇的兩組中,將同一腦區(qū)下的節(jié)點指標(biāo)特征矩陣取平均;然后,在組間做兩組差值,組間獨立樣本t檢驗(P<0.05)顯著性差異,以此選取致癇側(cè)敏感的腦區(qū)。也就是說,在多節(jié)點指標(biāo)融合下,只有同時滿足雙重篩選條件的腦區(qū)才能作為對致癇側(cè)敏感的特征腦區(qū),這可最大程度地減少特征冗余,并由可視化軟件BrainNetViewer(https:/ /www.nitrc.org/projects/bnv/)進行標(biāo)記。
最后,由于多重線共性將影響機器學(xué)習(xí)分類的穩(wěn)定性[32],在選擇特征腦區(qū)時,剔除了那些皮爾森相關(guān)系數(shù)大于0.5 的腦區(qū),以保證特征向量的獨立性。
1.2.6 特征向量和特征融合
采用串聯(lián)融合策略[22],將經(jīng)過特征篩選后的腦功能網(wǎng)絡(luò)的4 個節(jié)點指標(biāo)的SZS 構(gòu)成特征向量,首尾相連構(gòu)成指標(biāo)融合的特征向量,從而獲得1 組指標(biāo)融合的特征向量SZSfusion,即
式中,SZSfusion是指標(biāo)融合后的特征向量,SZS1、SZS2、SZS3、SZS4是4 個單節(jié)點指標(biāo)下的特征向量。
這樣,4 組單一節(jié)點指標(biāo)篩選對致癇側(cè)敏感的腦區(qū),其指標(biāo)值構(gòu)成特征向量,即可形成4 組分類器;這4 組特征向量再進行篩選融合,得到1 組融合特征向量,即可形成1 組分類器(在指標(biāo)融合下,特異性模型將與非特異性方法的分類效果進行比較)。最終獲得5 組具有顯著性差異的特征向量,也就是構(gòu)成5 個分類器。
將20 名癲癇患者,按左側(cè)、右側(cè)致癇的腦功能網(wǎng)絡(luò)節(jié)點指標(biāo)下的特征向量,組成特征向量矩陣。其中,10 名癲癇節(jié)點左側(cè)致癇患者標(biāo)為1,10 名癲癇右側(cè)致癇患者標(biāo)為2,作為支持向量機的輸入數(shù)據(jù)。
1.2.7 分類器與驗證
1)支持向量機模型。支持向量機(support vector machines,SVM)[33]是一種二分類模型,對樣本量依存度小,在深度學(xué)習(xí)出現(xiàn)之前,SVM 被認(rèn)為是機器學(xué)習(xí)中近十幾年來最成功且表現(xiàn)最好的算法,在fMRI 數(shù)據(jù)分析領(lǐng)域應(yīng)用廣泛。由于SVM 適合中小型數(shù)據(jù)樣本、非線性、高維的分類問題,因此選擇SVM 分類模型并在Matlab 下操作。
SVM 選用非線性映射能力優(yōu)良且?guī)в袕较虻幕撕瘮?shù)(radial basis function,RBF),用比例參數(shù)g =(1/2σ2)代替核參數(shù)σ,組成(C,g)。用網(wǎng)格搜索法,尋找最優(yōu)的C、g的組合值(C取值103~105,g取值10-4~10-1)。
SVM 隨機抽取12 名患者作為訓(xùn)練集,余下8名患者作為測試集,以驗證準(zhǔn)確率。
2)交叉驗證。在機器學(xué)習(xí)模型中,為避免分類結(jié)果的偶然性,一般常用的交叉驗證方法為K折交叉驗證。由于樣本量較少,為了充分利用數(shù)據(jù)集對算法的效果,采用了留一法交叉驗證和10 次隨機交叉驗證。
留一法將數(shù)據(jù)集分成20 份,輪流將其中19 份作為訓(xùn)練數(shù)據(jù),1 份作為測試數(shù)據(jù),進行20 次試驗。相較于其他交叉驗證法,留一法在實驗過程中沒有隨機因素的影響,實驗結(jié)果穩(wěn)定且可以復(fù)制,數(shù)據(jù)集中的所有數(shù)據(jù)都作為訓(xùn)練集和測試集,接近真實樣本。
隨機交叉驗證具有一定的隨機性,對于小于30的樣本量,10 次驗證既可以直觀地檢測到分類的精確范圍,驗證分類器的穩(wěn)定性,也能減少分類樣本訓(xùn)練的重復(fù)率,因此,選取n=10。
通過ROC 曲線分析,由4 個腦功能網(wǎng)絡(luò)單節(jié)點指標(biāo)的特異性模型確定的對致癇側(cè)敏感的特征腦區(qū)如圖3所示。在腦功能網(wǎng)絡(luò)的中介中心性、度中心性和聚合系數(shù)等特異性指標(biāo)下,發(fā)現(xiàn)在左、右側(cè)致癇患者組間有8 個腦區(qū)存在顯著性差異。在節(jié)點效率的特異性指標(biāo)下,發(fā)現(xiàn)有7 個腦區(qū)存在顯著性差異??梢钥闯?,4 個腦功能網(wǎng)絡(luò)節(jié)點特異性指標(biāo)所確定的特征腦區(qū)主要集中在額葉、顳葉和梭狀回等區(qū)域;其中背外側(cè)額上回、眶部額中回、島蓋部額下回和梭狀回在多個節(jié)點特異性指標(biāo)上表現(xiàn)出顯著性差異。
圖3 由ROC 曲線顯示的單一節(jié)點指標(biāo)特異性模型確定的對致癇側(cè)敏感的特征腦區(qū)。(a)中介中心性;(b)度中心性;(c)聚合系數(shù);(d)節(jié)點效率Fig.3 Functional bio-marker areas estimated by specificity index model at a single network node under ROC curves. (a)Betweenness centrality; (b)Degree centrality; (c)Clustering coefficient; (d)Node efficiency
而后扣帶回、腦島、海馬、緣上回、頂下緣角回、枕中回、枕上葉等大部分的特征腦區(qū)都分散在單個節(jié)點特異性指標(biāo)的特征腦區(qū)中,沒有交集。這表明,對致癇側(cè)敏感的特征腦區(qū)對功能網(wǎng)絡(luò)單節(jié)點指標(biāo)的特異性模型具有依存性。
用雙重篩選法進行特征降維,從多節(jié)點指標(biāo)融合的特異性模型中發(fā)現(xiàn),有9 個腦區(qū)在左、右側(cè)致癇患者組間存在顯著性差異(見圖4),這些區(qū)域集中在顳中回、緣上回、顳下回、枕上葉和扣帶回等上。
圖4 多節(jié)點指標(biāo)融合的特異性模型確定的對致癇側(cè)敏感的特征腦區(qū)。(a)ROC 曲線;(b)特征腦區(qū)標(biāo)記Fig. 4 Functional bio-marker areas estimated by specificity model of multiple nodes indexes fusion. (a)ROC curves; (b)Highlighted bio-marker areas
表2給出了9 個特征腦區(qū)的腦功能網(wǎng)絡(luò)多節(jié)點指標(biāo)的特異性標(biāo)準(zhǔn)化分?jǐn)?shù)值在左、右致癇側(cè)組間的統(tǒng)計分析結(jié)果(按AUC 值降序排列)。很顯然,特征腦區(qū)對多節(jié)點指標(biāo)融合的特異性模型仍然具有依存性,但對比單個節(jié)點的特異性指標(biāo),特征腦區(qū)數(shù)量增加了1 個。
表2 多節(jié)點指標(biāo)融合的特異性標(biāo)準(zhǔn)化分?jǐn)?shù)在9 個特征腦區(qū)中的組間統(tǒng)計Tab.2 Between-group statistics of SZS under multiple nodes indexes fusion in 9 bio-marker areas
通過多節(jié)點指標(biāo)融合的非特異性分析,發(fā)現(xiàn)在左、右側(cè)致癇患者組間有9 個腦區(qū)存在顯著性差異(見圖5),這些區(qū)域集中在扣帶回、海馬、緣上回和顳橫回等??梢钥闯觯诙喙?jié)點指標(biāo)融合下,非特異性模型分析所確定的特征腦區(qū)僅在緣上回區(qū)域與特異性模型有重合,除此之外確定的8 個特征腦區(qū)均不相同,即特征腦區(qū)對多節(jié)點指標(biāo)融合的非特異性分析法具有依存性。
圖5 多節(jié)點指標(biāo)融合下非特異性分析確定的對致癇側(cè)敏感的特征腦區(qū)Fig.5 Functional bio-marker areas estimated by nonspecificanalysisundermultiplenodes indexes fusion
由以上分析可知,特征腦區(qū)對節(jié)點指標(biāo)分析模型具有很強的依存性,為評估方法的有效性,進一步聯(lián)合機器學(xué)習(xí)方法(SVM)來驗證這5 個分類器性能。
2.4.1 基于單一節(jié)點指標(biāo)的分類
用4 個腦功能網(wǎng)絡(luò)的單一節(jié)點指標(biāo)特異性分類器對致癇側(cè)定位研究,留一法交叉驗證的結(jié)果如表3所示。
表3 留一法驗證單一節(jié)點指標(biāo)的特異性模型的分類準(zhǔn)確率Tab.3 Classification rate estimated by specificity model at a single node index and validation by leave-one-out method
再進行10 次隨機交叉驗證,驗證4 個單一節(jié)點指標(biāo)的特異性分類器穩(wěn)定性,如表4所示??梢钥闯?,由腦功能網(wǎng)絡(luò)單一節(jié)點指標(biāo)構(gòu)建的4 個分類器,平均分類準(zhǔn)確率均大于80%(留一法和隨機交叉驗證),具有較好的分類效果;從分類穩(wěn)定性分析,其分類精度范圍均在62.5%~100%,標(biāo)準(zhǔn)差均大于10%,分類穩(wěn)定性相對較差。
表4 10 次隨機交叉驗證在單一節(jié)點指標(biāo)特異性下的分類精度Tab.4 Classification rate under specific score at a single node index and validation by 10 times random validation method
2.4.2 基于多節(jié)點指標(biāo)融合的分類
基于腦功能網(wǎng)絡(luò)的多節(jié)點指標(biāo)融合,對癲癇致癇側(cè)進行定位研究,留一法交叉驗證結(jié)果如表5所示;再進行10 次隨機交叉驗證,驗證多節(jié)點融合指標(biāo)分類器的穩(wěn)定性,如表6所示??梢钥闯?,在多節(jié)點指標(biāo)融合上,特異性模型的平均準(zhǔn)確率較非特異性模型,留一法提高了10%,隨機交叉驗證,提高了6.25%。同樣,從分類穩(wěn)定性來看,相較于非特異型模型,特異性模型的分類精度范圍提升至75%~100%,標(biāo)準(zhǔn)差值降至8.7%。這表明,在相同實驗下,特異性模型結(jié)合機器學(xué)習(xí)在融合特征方面,優(yōu)于直接進行致癇側(cè)組間比較的非特異性模型。
表5 留一法驗證在多節(jié)點指標(biāo)融合下的分類準(zhǔn)確率Tab.5 Classification rate estimated by specificity model of multiple nodes indexes fusion and validation by leave-oneout method
表6 10 次隨機交叉驗證得到的在多節(jié)點融合指標(biāo)下的SVM 分類精度Tab.6 Classification rate estimated by specificity model of multiple nodes Indexes fusion and validation by 10 times random validation method
綜上所述,腦功能網(wǎng)絡(luò)多節(jié)點指標(biāo)融合的特異性模型表現(xiàn)出更好的分類性能。
本研究的主要貢獻包括:第一,利用癲癇患者和健康人組的rfMRI 數(shù)據(jù),構(gòu)建多稀疏度下的腦功能網(wǎng)絡(luò);第二,分別提取每個稀疏度下腦功能網(wǎng)絡(luò)分析常用的4 個局部節(jié)點指標(biāo),構(gòu)建腦功能網(wǎng)絡(luò)多節(jié)點指標(biāo)融合的特異性模型,用來提取對致癇側(cè)敏感的功能影像標(biāo)記,以此構(gòu)建特征向量,輸入機器學(xué)習(xí)實現(xiàn)定側(cè),并證明其優(yōu)于腦功能網(wǎng)絡(luò)單節(jié)點指標(biāo);第三,在多節(jié)點指標(biāo)融合上,將特異性模型與非特異性模型進行比較,力圖強調(diào)前者的成像優(yōu)勢。
參照健康人連接組學(xué),提出了腦功能網(wǎng)絡(luò)多節(jié)點指標(biāo)融合的特異性模型,在聯(lián)合機器學(xué)習(xí)進行癲癇定側(cè)方面表現(xiàn)出較好的性能,優(yōu)化了單節(jié)點指標(biāo)的特異性模型和多節(jié)點指標(biāo)融合的非特異性模型,說明了特異性模型比傳統(tǒng)的組間統(tǒng)計分析的非特異性分析表現(xiàn)出更好的分類效果。
此外,利用雙重特征篩選,對多節(jié)點指標(biāo)融合進行了特征降維,能有效去除單一節(jié)點指標(biāo)下的冗余特征。由表2可見,在融合特征AUC>0.8 基礎(chǔ)上,又使其具有較大的組間評分差異,不僅保證了特征向量在個體間的敏感性,同時也保留了組水平間的特異性,這可能是癲癇定側(cè)在多節(jié)點指標(biāo)融合上分類效果得到大幅升高的內(nèi)在原因。
在以往的顳葉癲癇左右腦致癇側(cè)定位研究中,Yang 等[34]通過構(gòu)建全腦功能網(wǎng)絡(luò),對左右發(fā)作側(cè)12 名TLE 患者進行分類驗證,得到的留一法準(zhǔn)確率為83.3%;Barron 等[35]基于靜息態(tài)功能連接作判別分析,左右定側(cè)達到了83%的平均分類精度。相較于現(xiàn)有方法,本研究采用特異性模型與特征融合的方法,隨機分類的精確度可達95%,留一法分類的準(zhǔn)確率高達100%,能夠有效實現(xiàn)算法性能的提升。
額葉和顳葉區(qū)域在4 個單節(jié)點指標(biāo)下均出現(xiàn)顯著性差異,這與Ives-Deliperi 發(fā)現(xiàn)的內(nèi)側(cè)額葉-顳葉區(qū)域fMRI-FC 異常與工作記憶功能障礙有關(guān)[36]。除此之外,海馬、扣帶回和枕葉的異常變化,可能是癲癇患者病灶區(qū)域的異常放電引起的。其中,Struck 等[37]和McDonald 等[38]研究顳葉癲癇患者的區(qū)域和全局連通性,證實了扣帶回和海馬的特異性;而Wills 等[39]通過分析FC 表明,丘腦-枕葉的連接變化可能與視覺空間注意力和學(xué)習(xí)障礙有關(guān)。
多節(jié)點指標(biāo)融合的特異性模型所選取的特征腦區(qū)主要集中在顳中回、緣上回、顳下回、枕上葉和扣帶回,與現(xiàn)有研究所證實的顳葉癲癇的生物標(biāo)記物大量重合,如癲癇發(fā)作時白質(zhì)功能紊亂延伸至顳葉和緣上回等[40];再如扣帶回[41]和枕上葉[39]的功能連通異常,也比單一指標(biāo)能確定更多對致癇側(cè)敏感的腦區(qū)。
在基于復(fù)雜圖論的腦網(wǎng)絡(luò)研究中,利用fMRI 構(gòu)建腦網(wǎng)絡(luò),并融合多節(jié)點指標(biāo)選取特征腦區(qū),在抑郁癥[30]和阿爾茲海默癥[42]方面已有大量研究,然而在顳葉癲癇方面卻少有提及。隨著開放式腦計劃[9]的推進,期望可以搜集更多的樣本進行深入研究。
以傳統(tǒng)的AAL116 模板構(gòu)建腦功能網(wǎng)絡(luò)節(jié)點,腦區(qū)劃分較為粗糙,可能會忽略較為重要的皮層和邊界信息,因此有待進一步精細劃分化腦區(qū),研究大尺度腦網(wǎng)絡(luò)下的癲癇拓?fù)鋵傩缘淖兓A硗?,選取的SVM 和兩種檢驗方法,主要考慮的是小樣本,而在大量樣本上,可能有更先進的機器學(xué)習(xí)方法還可以使用。若此,選擇留一法需謹(jǐn)慎,在大樣本下易出現(xiàn)過擬合。
最后,對健康人組盡管采用了相同種族,且大多數(shù)掃描參數(shù)相同,但仍有部分參數(shù)存在差異。例如,在掃描過程中,使用了相同掃描儀來獲取患者組、健康人組的fMRI 數(shù)據(jù),其中TR、TE 和FA 參數(shù)設(shè)置相同,而FOV、層厚和層間距參數(shù)設(shè)置不同。因不同的掃描參數(shù)對構(gòu)建的特異性模型輸出的分?jǐn)?shù)值有一定影響,因此患者和健康人的預(yù)處理數(shù)據(jù)和質(zhì)量檢測皆在美國哈佛醫(yī)學(xué)院Martinos 醫(yī)學(xué)影像中心完成,而且采用的頭動控制量為0.2 mm。另外,后處理是在患者的左、右側(cè)組間進行對比,在一定程度上削減了這種影響。可預(yù)見的是,與患者掃描參數(shù)完全相同的健康人對照組是最為理想的。
以健康人組為參照,提出了多節(jié)點指標(biāo)融合的特異性模型,力圖從拓?fù)鋵傩陨辖沂咎禺愑诮】等说陌d癇致癇側(cè)的功能影像學(xué)標(biāo)記;通過機器學(xué)習(xí)方法驗證,所建立的模型具有很好的定側(cè)精度和穩(wěn)定性,隨機驗證的平均分類精確度達95%±8.7%,留一法的分類準(zhǔn)確率高達100%,均好于單一節(jié)點指標(biāo)的特異性模型和多節(jié)點指標(biāo)融合的非特異性分析所形成的特征分類器。