田 程,胡 廷,曹 銳,相 潔
太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,太原030024
精神分裂癥是一種病因未明的重性精神疾病,主要包括陽(yáng)性癥狀,如妄想、幻覺(jué);以及陰性癥狀,如認(rèn)知障礙、思維紊亂等[1],給社會(huì)和家庭帶來(lái)嚴(yán)重的負(fù)擔(dān)??茖W(xué)研究表明:如果在患病早期能夠準(zhǔn)確診斷,有效治療之后,大多數(shù)患者的病情可以得到控制,甚至康復(fù)。所以近年來(lái)該疾病受到社會(huì)和家庭越來(lái)越多的重視。
腦電圖(EEG)是一種非侵入式和非放射性的工具,可長(zhǎng)期測(cè)量大腦功能,因此廣泛應(yīng)用于臨床疾病診斷。腦電反映大腦的活動(dòng)狀態(tài),多用于輔助診斷大腦疾病,包括癲癇、阿爾茲海默癥、精神分裂癥等。同時(shí),大腦是一個(gè)混沌系統(tǒng),腦電信號(hào)具有非線性的復(fù)雜度特征,所以腦電信號(hào)的復(fù)雜性估計(jì)已經(jīng)被廣泛應(yīng)用于疾病研究中。之前的研究采用Lyapunov指數(shù)(L1),香濃熵(ShEn),近似熵(ApEn)和Lempel-Ziv復(fù)雜度(LZC)等非線性指標(biāo)發(fā)現(xiàn)精神分裂癥患者與健康被試之間存在顯著的復(fù)雜性差異[2]。在復(fù)雜性分析方法中,基于熵的算法是用于評(píng)估EEG規(guī)律性或可預(yù)測(cè)性的有效且穩(wěn)健的評(píng)估器。2007年,Chen等人[3]改進(jìn)了樣本熵算法,引入模糊集后定義了一種新的測(cè)量時(shí)間序列復(fù)雜度的方法——模糊熵(FuzzyEn)。研究結(jié)果表明:腦電信號(hào)中的熵值測(cè)量可能更適合捕獲人腦中不可察覺(jué)的變化。
最近,深度神經(jīng)網(wǎng)絡(luò)在圖像、視頻、語(yǔ)音和文本在內(nèi)廣泛的識(shí)別任務(wù)中取得了巨大的成就[4-5]。而卷積神經(jīng)網(wǎng)絡(luò)作為一種成熟的網(wǎng)絡(luò)結(jié)構(gòu),近年來(lái)廣泛應(yīng)用于語(yǔ)音和圖像識(shí)別領(lǐng)域?;诰植扛惺芤昂蜋?quán)值共享等優(yōu)點(diǎn),使得網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性大大降低,并且在腦電信號(hào)的檢測(cè)中也得到了深入的研究應(yīng)用[6-7]。
本文采用基于模糊熵和卷積神經(jīng)網(wǎng)絡(luò)的精神分裂癥腦電信號(hào)分析方法,首先使用模糊熵對(duì)δ(0~3 Hz)、θ(4~7 Hz)和α(8~13 Hz)三種頻段的腦電信號(hào)進(jìn)行特征提取,統(tǒng)計(jì)檢驗(yàn)后,選擇存在顯著性差異的電極作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,并優(yōu)化網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),進(jìn)一步從腦電數(shù)據(jù)中學(xué)習(xí)到更多的特征以提高分類精度??傮w而言,所提出的方法旨在以熵和卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)來(lái)揭示健康被試和患者EEG信號(hào)復(fù)雜性的差異,為精神分裂癥的臨床診斷提供科學(xué)有效的思路和途徑。
本實(shí)驗(yàn)所用的數(shù)據(jù)為來(lái)自北京回龍觀醫(yī)院的61名精神分裂癥患者和與之年齡相匹配的55名健康被試,兩組被試在年齡與性別以及受教育程度上均沒(méi)有統(tǒng)計(jì)學(xué)差異。所有患者均符合美國(guó)精神障礙診斷統(tǒng)計(jì)手冊(cè)第4版(DSM-IV)中關(guān)于精神分裂癥的診斷標(biāo)準(zhǔn)[8],并且取得患者和家屬的同意。電極帽安放完畢后,被試靜坐于隔音實(shí)驗(yàn)室中,頭部和身體各部位保持靜止,并盡量避免眼球運(yùn)動(dòng)。被試信息如表1所示。
表1 被試信息表
本研究按照國(guó)際心理生理學(xué)會(huì)提出的腦電信號(hào)記錄原則與標(biāo)準(zhǔn)要求進(jìn)行,實(shí)驗(yàn)室內(nèi)隔音、安靜。使用BrainProducts公司的腦電記錄與分析系統(tǒng),根據(jù)國(guó)際10/20系統(tǒng)記錄64導(dǎo)EEG信號(hào)。電極的安放位置如圖1所示。信號(hào)的采樣頻率為500 Hz,在安靜閉眼狀態(tài)下采集受試者的EEG信號(hào)。
圖1 國(guó)際10-20系統(tǒng)的電極位置
數(shù)據(jù)預(yù)處理通過(guò)Brain Vision Analyzer軟件執(zhí)行,首先對(duì)記錄的原始EEG信號(hào)進(jìn)行電極重參考,在事件相關(guān)電位(ERP)研究中不同的參考電極會(huì)產(chǎn)生不同的影響,因此選擇常用于ERP數(shù)據(jù)預(yù)處理的所有電極的平均值作為參考;其次采用大小為0.5~50 Hz的濾波器對(duì)腦電信號(hào)進(jìn)行濾波;眼電(EOG)對(duì)EEG信號(hào)影響很大,因此需要對(duì)由眼球運(yùn)動(dòng)或眨眼造成的肌肉影響進(jìn)行矯正,從EEG信號(hào)中減去受EOG影響的部分。首先尋找EOG的最大絕對(duì)值,將最大值的百分比(10%)定義為EOG偽跡,其次將超過(guò)EOG偽跡的電位識(shí)別為EOG脈沖,取平均后得到平均偽跡,并計(jì)算與其他電極之間的EEG傳遞系數(shù),最后根據(jù)系數(shù)對(duì)造成影響的波段進(jìn)行校正;之后使用獨(dú)立成分分析(ICA)方法進(jìn)行偽跡去除,EEG信號(hào)包含由分離矩陣W混合而成的不同源信號(hào),這些源信號(hào)包括自身活動(dòng)、噪聲等眾多干擾源。首先為了簡(jiǎn)化算法,將EEG信號(hào)進(jìn)行去均值操作,其次通過(guò)重復(fù)的迭代計(jì)算尋找適當(dāng)?shù)姆蛛x矩陣wi,使得函數(shù)N(si)獲取極大值,便可得到一個(gè)獨(dú)立分量si,分離過(guò)程中,不斷調(diào)整分離矩陣,直到相鄰兩次的wi無(wú)變化或者變化較小時(shí),結(jié)束對(duì)該獨(dú)立分量的提取。重復(fù)上述分離過(guò)程,從EEG信號(hào)中減去每一個(gè)提取的獨(dú)立分量,最終將所有獨(dú)立分量分離出去;并將每個(gè)被試的時(shí)域數(shù)據(jù)截取60個(gè)長(zhǎng)度為1.4 s的時(shí)間片段;最后將數(shù)據(jù)以.eeg的形式導(dǎo)出。整個(gè)實(shí)驗(yàn)流程圖如圖2所示。
在樣本熵和近似熵算法中,由二值函數(shù)確定向量之間的相似性:
圖2 實(shí)驗(yàn)流程圖
給定一個(gè)輸入樣本,當(dāng)符合一定條件時(shí),根據(jù)二值函數(shù)將被判斷屬于其中一類,反之屬于另一類。通常情況下,對(duì)于給定的一個(gè)樣本,是很難判斷其屬于哪一類的,便引入了模糊集。模糊熵使用模糊隸屬函數(shù)來(lái)測(cè)量向量之間的相似度,而不是基于樣本熵算法的二值函數(shù)[3]。該函數(shù)為指數(shù)函數(shù),由于指數(shù)函數(shù)是連續(xù)函數(shù),保證函數(shù)值不會(huì)像二值函數(shù)一樣產(chǎn)生突變,計(jì)算結(jié)果是平滑且連續(xù)的;并且與其他熵相比,模糊熵對(duì)相空間維數(shù)m和相似容限r(nóng)等參數(shù)具有較低的敏感度,所測(cè)值的魯棒性更高。該算法描述如下:
根據(jù)序列順序?qū)()i進(jìn)行相空間重構(gòu),得到一組m維(m≤N-2)矢量,如下:
模糊隸屬函數(shù)如下:
n和r分別表示指數(shù)函數(shù)的梯度和寬度。定義函數(shù)φ(n,r):
并以相同的方式重復(fù)上述步驟,可以根據(jù)序列的順序重建一組(m+1)維向量,將其定義為最后,序列長(zhǎng)度為N的時(shí)間序列的模糊熵可表示如下:
通常情況下,過(guò)大的相似性容限會(huì)導(dǎo)致時(shí)間序列中有用信息的丟失,過(guò)低的相似性容限又會(huì)增加噪聲的敏感度。在本研究中,通過(guò)進(jìn)行參數(shù)調(diào)優(yōu),設(shè)置m=2,r=0.25×SD,其中SD為時(shí)間序列的標(biāo)準(zhǔn)偏差。
將預(yù)處理后的腦電數(shù)據(jù)分為δ(0~3 Hz)、θ(4~7 Hz)和α(8~13 Hz)三個(gè)頻段;將三個(gè)頻段的時(shí)間片段按照時(shí)間窗大小為400 ms,步長(zhǎng)(窗移)為50%,截取6小段。選取400 ms是由于模糊熵適合于短數(shù)據(jù)集的處理,時(shí)間序列不適合選取太長(zhǎng),當(dāng)使用300 ms、400 ms、500 ms的時(shí)間窗分別進(jìn)行特征提取時(shí),發(fā)現(xiàn)不同的長(zhǎng)度對(duì)實(shí)驗(yàn)是有影響的,在400 ms下健康被試和精神分裂癥患者的復(fù)雜度差異最大,所以最終選取400 ms作為時(shí)間窗大小。并嘗試了五種不同的步長(zhǎng),分別是重復(fù)30%、40%、50%、60%、70%,結(jié)果顯示,步長(zhǎng)對(duì)實(shí)驗(yàn)結(jié)果的影響比較小,總體來(lái)說(shuō)在50%步長(zhǎng)下的結(jié)果是略好于其他情況的,所以選擇了50%的步長(zhǎng);之后分別用模糊熵對(duì)每段400 ms的數(shù)據(jù)進(jìn)行復(fù)雜度特征提取,分別計(jì)算出健康被試和精神分裂癥患者在三種頻段下連續(xù)的六個(gè)時(shí)間窗的熵值。用雙樣本T檢驗(yàn)進(jìn)行統(tǒng)計(jì)分析,從所有電極中選擇出差異性最顯著的32個(gè)電極(p<0.05)??紤]到電極位置的空間分布特征,位于同一腦區(qū)的電極共同反映同一腦部活動(dòng),所以將位于同一腦區(qū)的電極相鄰放置,進(jìn)行排序;將每個(gè)電極三個(gè)頻段的熵值按照時(shí)間窗的前后順序進(jìn)行排序,這樣每個(gè)樣本可以表示為32×18的矩陣。每個(gè)樣本對(duì)應(yīng)一個(gè)標(biāo)簽,患病為1,不患病為0。將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。如圖3所示為卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)影像圖。
卷積神經(jīng)網(wǎng)絡(luò)是一種用于生成特征層次結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),有兩大顯著特點(diǎn):稀疏連接和權(quán)值共享[9]。稀疏連接用于提取圖像中不同區(qū)域的特征;權(quán)值共享則極大減少了網(wǎng)絡(luò)中訓(xùn)練參數(shù)的個(gè)數(shù)和訓(xùn)練時(shí)間,簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖4所示。
圖3 輸入數(shù)據(jù)影像圖
圖4 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
卷積層是網(wǎng)絡(luò)結(jié)構(gòu)的第一層,也是核心層。使用卷積核進(jìn)行掃描,將輸入神經(jīng)元與網(wǎng)絡(luò)權(quán)重相連,得到特定權(quán)值向量的特征圖。卷積操作可以極大地減少網(wǎng)絡(luò)參數(shù),從而降低運(yùn)算量。利用激活函數(shù)進(jìn)行特征映射。激活函數(shù)加入了非線性因素來(lái)最大可能地保留數(shù)據(jù)的特征,本文中使用更優(yōu)的Relu函數(shù)作為激活函數(shù),研究表明Relu函數(shù)使得運(yùn)算速度和運(yùn)算效果得到明顯提升。Relu函數(shù)表達(dá)式如下:
池化層的作用是將卷積運(yùn)算得到的某一位置的輸出由鄰近值來(lái)取代,從而減少運(yùn)算量。池化層中每個(gè)特征映射的平面上的神經(jīng)元具有相等的權(quán)重,所以池化運(yùn)算與卷積運(yùn)算是類似的,通過(guò)激活函數(shù)得到采樣層的輸出。目前常見(jiàn)的池化方法包括最大池化(max pooling)和平均池化(mean pooling)。本實(shí)驗(yàn)中由于特征之間的差異比較大,所以采用了最大池化方法。
全連接層的作用是整合卷積池化操作后得到的特征向量,也就是將輸入的二維特征向量轉(zhuǎn)化成一維向量。歸一化處理后,輸出到下一層作為分類器的輸入。本實(shí)驗(yàn)將全連接層設(shè)置為兩層,用于提升網(wǎng)絡(luò)的學(xué)習(xí)效率,每層神經(jīng)元數(shù)量設(shè)置為256個(gè)。
Softmax分類器是一種有監(jiān)督的多分類器,是對(duì)邏輯回歸模型的改進(jìn),得到的結(jié)果是一個(gè)概率值,即若存在樣本數(shù)據(jù)x,通過(guò)Softmax便可計(jì)算其屬于某一類的概率p,最終得到歸一化的分類概率值。
卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程是一個(gè)不斷優(yōu)化網(wǎng)絡(luò)中眾多參數(shù)的過(guò)程,包括前向傳播與后向傳播。前向傳播過(guò)程中首先對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行批處理(Batch_size),通過(guò)卷積層、池化層以及激活函數(shù)的前向傳播后,得到輸入信號(hào)的實(shí)際輸出,此時(shí)完成了卷積神經(jīng)網(wǎng)絡(luò)的第一階段的學(xué)習(xí);在前向?qū)W習(xí)過(guò)程中,卷積核與偏置的值均為初始化值,所以實(shí)際輸出結(jié)果與真實(shí)結(jié)果之間存在一定的誤差,為了降低誤差,需要計(jì)算平均誤差代價(jià)函數(shù)來(lái)不斷地更新權(quán)重與偏置,該過(guò)程為卷積神經(jīng)網(wǎng)絡(luò)第二階段的學(xué)習(xí)。最終得到最優(yōu)的網(wǎng)絡(luò)學(xué)習(xí)模型。
本研究基于Theano框架評(píng)估了不同深度VGG風(fēng)格的卷積神經(jīng)網(wǎng)絡(luò)配置。如圖5所示,表中卷積層參數(shù)表示為Conv<接收域大?。荆純?nèi)核數(shù)>,A模型只涉及到兩個(gè)疊加在一起的卷積層(Conv3-32);B模型在A模型基礎(chǔ)上添加了兩個(gè)卷積層(Conv3-64);C模型在B模型的基礎(chǔ)上,再添加一個(gè)卷積層(Conv3-128);模型D和模型C的不同之處在于第一個(gè)池化層前提供了四層卷積。最后在所有模型中添加兩層含有256個(gè)節(jié)點(diǎn)的完全連接層,并使用Softmax函數(shù)作為分類器。
圖5 不同CNN模型的配置信息
為了防止神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過(guò)程中出現(xiàn)過(guò)擬合,本研究將Dropout技術(shù)引入到全連接層中。該技術(shù)可提高參數(shù)的泛化能力,從而防止訓(xùn)練參數(shù)對(duì)訓(xùn)練數(shù)據(jù)集的重度依賴[10]。經(jīng)過(guò)參數(shù)調(diào)優(yōu),將學(xué)習(xí)率設(shè)置為0.01,Dropout的值設(shè)置為0.5,卷積核的大小為3×3,設(shè)置的迭代次數(shù)為20次。本實(shí)驗(yàn)采用了k-折交叉驗(yàn)證,k選取為10。訓(xùn)練集和驗(yàn)證集比例為9∶1。訓(xùn)練集用于訓(xùn)練擬合模型;驗(yàn)證集用于選擇訓(xùn)練中得到的分類效果最優(yōu)模型的參數(shù),并進(jìn)行參數(shù)調(diào)整;另外使用未參加過(guò)訓(xùn)練和驗(yàn)證過(guò)程的測(cè)試集來(lái)評(píng)價(jià)通過(guò)訓(xùn)練集和驗(yàn)證集得到的最優(yōu)模型的性能與分類能力。最后將交叉驗(yàn)證的分類結(jié)果進(jìn)行平均。
如圖6所示為第一個(gè)時(shí)間窗(400 ms)的三種頻段中模糊熵特征的腦地形圖,從圖中可以看到,在三個(gè)頻段下,精神分裂癥患者的熵值普遍高于健康被試。并且全腦的差異性很大。模糊熵是一種測(cè)量腦電信號(hào)中出現(xiàn)新模式概率的非線性方法,生成新模式的概率與腦電信號(hào)的復(fù)雜度呈正相關(guān)。相比于健康被試,精神分裂癥患者由于自身大腦中的神經(jīng)元處于興奮和活躍狀態(tài),神經(jīng)元做無(wú)序運(yùn)動(dòng),所以患者大腦中產(chǎn)生新模式的概率較大,腦電信號(hào)的復(fù)雜性更高。統(tǒng)計(jì)檢驗(yàn)的結(jié)果表明,兩組之間在很多腦區(qū)中存在顯著差異(t<-15.159,p<0.05)。而模糊熵具有更好的魯棒性以及連續(xù)性,因此認(rèn)為模糊熵作為輸入特征進(jìn)行分類能有效地區(qū)分健康被試和精神分裂癥患者。
圖6 模糊熵腦地形圖
本實(shí)驗(yàn)中首先使用了三種該領(lǐng)域常用的機(jī)器學(xué)習(xí)分類算法,包括支持向量機(jī)(SVM)、樸素貝葉斯(NB)以及隨機(jī)森林(RF)。并且對(duì)分類器中的參數(shù)進(jìn)行調(diào)優(yōu)。SVM分類器的參數(shù)比較多,其中最重要的是懲罰參數(shù)c和核函數(shù)參數(shù)g兩個(gè)參數(shù)。首先使用RBF核函數(shù),研究表明該核函數(shù)相對(duì)穩(wěn)定,其次對(duì)于一組取定的c和g,利用十折交叉驗(yàn)證的方法,選取準(zhǔn)確率最高的那組c和g作為最佳參數(shù),SVM分類器的參數(shù)為:c=1.0,g=0.125;NB分類器中主要選擇參數(shù)估計(jì)方法,有極大似然估計(jì)和貝葉斯估計(jì)。由于極大似然估計(jì)可能導(dǎo)致估計(jì)出的概率為0,會(huì)影響后驗(yàn)概率的結(jié)果,所以NB分類器使用貝葉斯估計(jì);RF分類器中有三個(gè)比較重要的參數(shù),分別是最大特征數(shù)max_features、子樹(shù)數(shù)量n_estimators和最小樣本葉min_sample_leaf,使用交叉驗(yàn)證的方法得到不同參數(shù)組合下的分類準(zhǔn)確率,并選擇準(zhǔn)確率最高的參數(shù)組合作為最佳參數(shù),RF的參數(shù)為max_features=auto、n_estimators=60、min_sample_leaf=30。三種分類器的分類結(jié)果如表2所示。從表2中可以看到,三種分類器中分類效果最好的是SVM分類器,準(zhǔn)確率達(dá)到了91.3%,而另外兩種分類器的分類準(zhǔn)確率分別為89.7%和87.6%。但是這三種分類器無(wú)法獲取輸入數(shù)據(jù)更深層次的隱含信息,分類準(zhǔn)確率無(wú)法達(dá)到理想的效果。
表2 傳統(tǒng)分類器的分類結(jié)果比較
通過(guò)多次實(shí)驗(yàn)選擇了四種不同深度的卷積神經(jīng)網(wǎng)絡(luò)框架。遵循VGG風(fēng)格體系結(jié)構(gòu)[11],在每一層中選擇合適的過(guò)濾器的數(shù)量,并且用較小接受域進(jìn)行卷積操作。這四種模型的最終分類結(jié)果如表3所示,從表3中可以看到,不同深度的卷積神經(jīng)網(wǎng)絡(luò)的分類結(jié)果之間存在一定的差異。首先C<2,2,1>模型的分類準(zhǔn)確率最高,并且準(zhǔn)確率遠(yuǎn)高于傳統(tǒng)分類器,驗(yàn)證集的準(zhǔn)確率為99.23%,測(cè)試集的準(zhǔn)確率為99.16%;D<4,2,1>與B<2,2,0>模型的準(zhǔn)確率都低于上述模型;而A<2,0,0>模型的分類準(zhǔn)確率最低,驗(yàn)證集準(zhǔn)確率只有89.09%。4種模型的準(zhǔn)確率箱圖如圖7所示,從圖7中可以觀察到不管是驗(yàn)證集還是測(cè)試集,C<2,2,1>模型的準(zhǔn)確率分布情況均優(yōu)于其他三種模型。以上結(jié)果表明神經(jīng)網(wǎng)絡(luò)的深度太深或者太淺都不能使分類效果達(dá)到最優(yōu)狀態(tài),需要不斷調(diào)試。
表3 不同深度CNN的分類結(jié)果比較
如圖8所示為網(wǎng)絡(luò)結(jié)構(gòu)為C<2,2,1>模型的準(zhǔn)確率曲線圖和損失曲線圖。從圖中的分類準(zhǔn)確率曲線可以看到,迭代次數(shù)不斷增加,驗(yàn)證和測(cè)試準(zhǔn)確率均呈現(xiàn)上升趨勢(shì),并且當(dāng)?shù)螖?shù)達(dá)到15次時(shí),準(zhǔn)確率趨于穩(wěn)定,達(dá)到了99%以上;與準(zhǔn)確率曲線相反,訓(xùn)練損失、驗(yàn)證損失以及測(cè)試損失在逐步減小,并且當(dāng)?shù)螖?shù)達(dá)到15次的時(shí)候,損失都達(dá)到平穩(wěn)狀態(tài)。訓(xùn)練得到的模型性能在驗(yàn)證集和測(cè)試集上效果都顯著是實(shí)現(xiàn)良好擬合的基礎(chǔ),可以通過(guò)訓(xùn)練損失和驗(yàn)證損失同時(shí)下降并最終達(dá)到穩(wěn)定狀態(tài)進(jìn)行判斷,所以本實(shí)驗(yàn)訓(xùn)練得到的模型實(shí)現(xiàn)了良好擬合。
圖7 驗(yàn)證集和測(cè)試集的箱圖
圖8 準(zhǔn)確率和迭代損失曲線圖
本實(shí)驗(yàn)中,卷積神經(jīng)網(wǎng)絡(luò)融合了腦電信號(hào)的非線性特征、時(shí)域、空域以及頻域信息,經(jīng)過(guò)模型優(yōu)化,實(shí)驗(yàn)結(jié)果證明了本文模型在訓(xùn)練學(xué)習(xí)過(guò)程中的有效性。雖然該方法不是直接對(duì)原始EEG時(shí)間序列進(jìn)行操作,但是通過(guò)從EEG中提取模糊熵作為非線性特征,能夠發(fā)現(xiàn)EEG中更加隱含的信息。
將本文的方法與其他關(guān)于精神分裂癥的分類研究進(jìn)行比較。比較結(jié)果如表4所示。文獻(xiàn)[12]中通過(guò)記錄多通道腦磁圖(MEG)信號(hào),并提取了最具識(shí)別性的δ、θ和α波段的功率譜值作為特征,使用SVM分類器進(jìn)行分類,分類準(zhǔn)確率為91.8%;文獻(xiàn)[13]中采用互信息技術(shù)進(jìn)行通道選擇,該技術(shù)用于確定信息量更大的通道,從而獲取更好的識(shí)別能力,自相關(guān)(AR)系數(shù)、頻帶功率以及分形維數(shù)作為信號(hào)的特征,最后使用Adaboost分類器進(jìn)行分類,結(jié)果為91.94%;文獻(xiàn)[14]中使用一種棧式自動(dòng)編碼器對(duì)患者和健康被試的功能性磁共振成像(fMRI)數(shù)據(jù)進(jìn)行分類,分類準(zhǔn)確率為92.00%;文獻(xiàn)[15]中將離散小波變換(DWT)應(yīng)用于EEG信號(hào),提取的相對(duì)小波能量特征被傳遞到分類器用于分類,最后通過(guò)SVM、多層感知器以及K-最近鄰分類器實(shí)現(xiàn)98%的分類準(zhǔn)確率。但是本研究相較于以上研究,分類準(zhǔn)確率得到了明顯的提升。
表4 與其他分類結(jié)果的比較
模糊熵是一種基于復(fù)雜性的時(shí)間序列分析方法,模糊隸屬函數(shù)使得測(cè)量的結(jié)果連續(xù)且平穩(wěn),能夠使用較短的時(shí)間序列獲得穩(wěn)健的測(cè)量值,并且魯棒性得到了很大提升。由于腦電信號(hào)的非線性特征,使用模糊熵可以提取出時(shí)間序列中更加隱含的信息。
本文提出了一種結(jié)合模糊熵和卷積神經(jīng)網(wǎng)絡(luò)的腦電信號(hào)分類方法,將腦電信號(hào)進(jìn)行分頻處理,之后將各個(gè)頻段的每段時(shí)間序列分別用模糊熵提取信號(hào)的復(fù)雜度特性,選擇存在顯著差異的電極,并將熵值按照先后順序排列構(gòu)成影像圖,作為神經(jīng)網(wǎng)絡(luò)的輸入,可以學(xué)習(xí)到信號(hào)中更深層次的信息。最后使用Softmax分類器進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,復(fù)雜度可以更好地提取健康被試和精神分裂癥患者中腦電信號(hào)的非線性特征,并能夠檢測(cè)到兩類被試間存在的顯著差異,通過(guò)對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)調(diào)優(yōu)和性能優(yōu)化,訓(xùn)練出更優(yōu)的模型,最后分類結(jié)果顯示,與傳統(tǒng)的分類算法相比,該方法下分類準(zhǔn)確率得到明顯提升。該方法能夠更好地輔助精神分裂癥的臨床診斷,并可以應(yīng)用到其他疾病診斷中,為臨床疾病診斷提供更加科學(xué)高效的措施。