帥國(guó)彬 胡偉波
(南開(kāi)大學(xué)電子信息與光學(xué)工程學(xué)院微電子工程系 天津 300350)
癲癇(Epilepsy)是一種常見(jiàn)的慢性精神性腦部疾病,是由于大腦神經(jīng)元突發(fā)異常放電所引起的大腦短暫性異常障礙,具有反復(fù)性和突發(fā)性[1]。腦電圖(Electroencephalogram,EEG)是通過(guò)非侵入性電極從頭皮采集,綜合反映大腦的放電活動(dòng),是診斷癲癇的有效工具。在傳統(tǒng)的癲癇檢測(cè)中,醫(yī)學(xué)專家通過(guò)觀察腦電圖,找出包含癲癇特征的腦電波形。這種方法不僅耗時(shí)耗力,具有強(qiáng)的主觀性,而且腦電圖中存在的大量噪聲也會(huì)對(duì)醫(yī)學(xué)專家的判斷產(chǎn)生干擾。近年來(lái),癲癇自動(dòng)檢測(cè)和識(shí)別技術(shù)的發(fā)展幫助醫(yī)學(xué)專家簡(jiǎn)化診斷過(guò)程和提高診斷準(zhǔn)確性。
隨著對(duì)腦科學(xué)的探索,研究表明人類的大腦相當(dāng)于一個(gè)復(fù)雜的非線性動(dòng)力系統(tǒng)[2],因此,各種建立在非線性方法基礎(chǔ)上的癲癇性發(fā)作自動(dòng)檢測(cè)被相繼提出。Hasan[3]發(fā)現(xiàn)正常EEG的近似熵大于癲癇發(fā)作期EEG的近似熵,可用近似熵對(duì)腦電信號(hào)進(jìn)行特征提取并分類。文獻(xiàn)[4]對(duì)近似熵算法進(jìn)行優(yōu)化,提出了樣本熵,將其用于癲癇檢測(cè)。傳統(tǒng)的近似熵、樣本熵和模糊熵等非線性特征分類性能較差,所得到的分類結(jié)果精度較低。文獻(xiàn)[5]利用多變量經(jīng)驗(yàn)?zāi)B(tài)分解(MEMD)提取腦電信號(hào)特征,并使用CNN進(jìn)行分類,得到了87.2%的分類準(zhǔn)確度。文獻(xiàn)[6]使用關(guān)聯(lián)性特征選擇(CFS)的提取方法,使用隨機(jī)森林(RF)作為分類器,得到98%的檢測(cè)準(zhǔn)確率。Zhou等[7]提出基于快速傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)模型得到97.5%的癲癇檢出率。雖然已有很多的特征提取和分類方法運(yùn)用于癲癇檢測(cè)中,但如何提取含有豐富鑒別信息的有效特征用于后續(xù)的癲癇檢測(cè)依然是個(gè)重要的挑戰(zhàn)。
本文提出了一種新的腦電信號(hào)特征提取算法,并進(jìn)一步探討了在癲癇性發(fā)作自動(dòng)檢測(cè)中的應(yīng)用。癲癇檢測(cè)算法的流程如圖1所示。首先,利用小波變換多分辨率分析對(duì)腦電信號(hào)進(jìn)行一定尺度的分解,由于癲癇特征波頻段的頻率范圍為8 Hz~42 Hz,所以舍去其他頻段的信號(hào),保留此頻段的信號(hào)。其次,進(jìn)行新型Teager能量算子計(jì)算,作用是能夠消除零均值噪聲的影響,而且可以有效地提取信號(hào)能量,具有增強(qiáng)信號(hào)的能力,從而利于信號(hào)的特征提取。進(jìn)而,使用多尺度熵提取腦電信號(hào)的特征信息,它將腦電信號(hào)擴(kuò)展到多個(gè)時(shí)間尺度,以便在時(shí)間尺度不確定時(shí)提供額外的觀察視角。在腦電圖中,潛在的腦電模式是未知的,因此相關(guān)的時(shí)間尺度也是未知的。所以,本文提出多尺度熵是在未知情況下分析腦電信號(hào)的有效方法。最后通過(guò)極限學(xué)習(xí)機(jī)對(duì)不同尺度的熵值進(jìn)行訓(xùn)練和分類。
圖1 癲癇檢測(cè)算法流程圖
小波變換是空間(時(shí)間)和頻率的局部變換。信號(hào)的連續(xù)小波變換的定義為:
式中:a為變換尺度參數(shù),b為時(shí)移參數(shù)。
多分辨率分析(Multiresolution analysis,MRA)是研究和構(gòu)建小波正交基的自然框架。它的空間分解是在不同尺度下,信號(hào)經(jīng)降采樣和濾波處理分解,從而得到一系列正交子空間Vj。多分辨率分析只對(duì)低頻空間進(jìn)一步分解,對(duì)高頻部分不予考慮,使頻率的分辨率變得越來(lái)越高。
Teager能量算子(Teager Energy Operator,TEO)是一個(gè)非線性算子,可以實(shí)時(shí)跟蹤和反映信號(hào)的瞬時(shí)能量。若有連續(xù)時(shí)間信號(hào)x(t),TEO的定義:
如果x(t)=Acos(ωt+θ),則有:
ψ[x(t)]=ψ(Acos(ωt-θ))=(Aω)2
(3)
若對(duì)x(t)進(jìn)行采樣,其采樣頻率為fs,基頻為f,ω=2πf/fs,則連續(xù)信號(hào)x(t)的離散形式應(yīng)為x(n)=Acos(ωn+θ)。TEO的離散表達(dá)式為:
ψ(x(n))=x2(n)-x(n-1)x(n+1)=(Asinω)2
(4)
若ω足夠小,則sinω≈ω。因此將ω限制在ω<π/4,即f/fs<1/8時(shí),式(4)變?yōu)?
ψ(x(n))=x2(n)-x(n-1)x(n+1)≈(Aω)2
(5)
由式(5)可知,Teager能量算子可以對(duì)被測(cè)信號(hào)相鄰的3個(gè)采樣點(diǎn)進(jìn)行計(jì)算,從而能夠跟蹤和反映被測(cè)信號(hào)的瞬時(shí)能量。但在實(shí)際情況中,信號(hào)中往往摻雜著大量噪聲,在背景噪聲頻率較大或者信噪比較低的情況下使用TEO計(jì)算信號(hào)的瞬時(shí)能量,產(chǎn)生的噪聲能量會(huì)使結(jié)果出現(xiàn)偏差。
由于TEO算法較差的抗噪性會(huì)直接影響檢測(cè)結(jié)果的準(zhǔn)確性,因此本文提出了一種新型Teager能量算子(NTEO)。NTEO是將分辨率參數(shù)i引入TEO中,對(duì)信號(hào)前后相隔i個(gè)采樣點(diǎn)進(jìn)行采樣,即x(n-i)、x(n)、x(n+i),增強(qiáng)了對(duì)信號(hào)頻率的敏感性,從而提高了NTEO算法的抗噪性,如式(6)所示。
ψ(x(n))=x2(n)-x(n-i)x(n+i)=A2sin2(iω)
(6)
由TEO可知,當(dāng)iω<π/4,即f/fs<1/8i時(shí),式(6)變?yōu)?
ψ(x(n))=x2(n)-x(n-i)x(n+i)≈(Aiω)2
(7)
由式(7)可知,NTEO也是利用信號(hào)的三個(gè)采樣點(diǎn)跟蹤和反映信號(hào)的瞬時(shí)能量,具有TEO算法的優(yōu)點(diǎn)。同時(shí),NTEO通過(guò)引入分辨率參數(shù)i,增強(qiáng)了信號(hào)的頻域特性,以應(yīng)對(duì)復(fù)雜環(huán)境下噪聲帶來(lái)的誤差。
多尺度熵(MSE)是度量不同尺度因子下時(shí)間序列的復(fù)雜性。算法分為兩部分:一是對(duì)時(shí)間序列進(jìn)行粗?;玫蕉嘟M新序列;二是對(duì)新序列進(jìn)行熵計(jì)算。步驟如下:
② 將兩個(gè)向量y(i)和y(j)之間的最大模定義為兩者之間的距離dm(y(i),y(j)),距離計(jì)算公式如下:
dm(y(i),y(j))=max(|y(i+k)-y(j+k)|)
(9)
式中:0≤k≤m-1。
③ 統(tǒng)計(jì)y(i)與y(j)之間距離d≤r的j的數(shù)目,記為Bi。對(duì)于1≤i≤n-m,定義:
④ 定義平均相似率Bm(r),公式如下:
⑤ 將維數(shù)改變?yōu)閙+1,重復(fù)步驟①-步驟④,計(jì)算平均相似率Bm+1(r)。
⑥ 熵定義:
極限學(xué)習(xí)機(jī)(ELM)是一種針對(duì)前饋神經(jīng)網(wǎng)絡(luò)(SLFN)的新型快速學(xué)習(xí)訓(xùn)練算法,該算法隨機(jī)對(duì)輸入權(quán)重和偏置進(jìn)行賦值,并且在訓(xùn)練過(guò)程中無(wú)須做出調(diào)整,只需要通過(guò)矩陣計(jì)算出輸出權(quán)重即可。相比于傳統(tǒng)的學(xué)習(xí)算法,ELM的優(yōu)點(diǎn)在于學(xué)習(xí)速度快、泛化性能好,且不會(huì)陷入局部極小點(diǎn)。具體步驟如下:
給定任意N個(gè)樣本(Xi,ti),設(shè)SLFN有K個(gè)隱藏節(jié)點(diǎn),則SLFN可表示為:
式中:g(x)為激活函數(shù);Wi為輸入權(quán)重;βi為輸出權(quán)重;bi為偏置。
由于SLFN的最終目的是使輸出誤差最小,即:
所以,存在Wi、xj、bi使得:
設(shè)H為單隱層輸出矩陣,β為輸出權(quán)重,T為期望輸出,則用矩陣可以表示為:
Hβ=T
(16)
由式(16),利用最小二乘法,即可求出輸出權(quán)重β。
本文采用的癲癇數(shù)據(jù)集來(lái)源于波恩大學(xué)腦電信號(hào)數(shù)據(jù)庫(kù)。此數(shù)據(jù)集包含5類子集,標(biāo)號(hào)為A-E,每類子集又分為100個(gè)腦電信號(hào)數(shù)據(jù)段,采樣頻率為173.61 Hz。
首先選擇db4作為小波基函數(shù)對(duì)已準(zhǔn)備好的數(shù)據(jù)集進(jìn)行4層小波分解。由于版面限制,在本文中僅對(duì)A組(正常EEG)和E組(癲癇發(fā)作期EEG)數(shù)據(jù)集的第一份數(shù)據(jù)(z001和s001)進(jìn)行分析和顯示。結(jié)果如圖2-圖3所示。
圖2 正常EEG信號(hào)4層小波分解重構(gòu)細(xì)節(jié)圖
圖3 發(fā)作期EEG信號(hào)4層小波分解重構(gòu)細(xì)節(jié)圖
在正常和癲癇發(fā)作兩種不同的情況下,腦電活動(dòng)信號(hào)的節(jié)律、幅值和頻率有非常大的差別。與正常EEG相比,癲癇EEG中包含棘波、尖波、棘-慢復(fù)合波、尖-慢復(fù)合波等類型的特征波。在臨床癲癇檢測(cè)中,主要目標(biāo)就是識(shí)別EEG中是否包含棘波和尖波,這些特征波的頻率范圍大致為8 Hz~42 Hz。因此在研究癲癇腦電信號(hào)時(shí),可以選擇分析這一頻率范圍附近的信號(hào),這樣在一定程度上減少運(yùn)算量,并且能夠提高癲癇腦電信號(hào)的識(shí)別效果。經(jīng)分析,這些特征信息主要分布在分解重構(gòu)的頻帶D1上,因此之后對(duì)D1進(jìn)行NTEO計(jì)算。
由圖4和圖5可以看出,正常腦電信號(hào)的Teager能量較為平緩,在-20 μA~120 μA范圍內(nèi)波動(dòng)。癲癇患者發(fā)作期腦電信號(hào)的Teager能量在棘波處波動(dòng)非常劇烈,可達(dá)1.6×104μA。由此可以讓正常EEG信號(hào)的特征和癲癇患者的EEG特征更加明顯,方便后續(xù)的特征提取。
圖4 正常EEG信號(hào)D1頻帶的能量算子
圖5 發(fā)作期EEG信號(hào)D1頻帶的能量算子
多尺度熵計(jì)算結(jié)果如圖6所示,在任一尺度上,正常EEG的熵值都要大于發(fā)作期EEG的熵值。
圖6 不同EEG的多尺度熵
由圖4、圖5和圖6可以看出,新型Teager能量算子和多尺度熵可以更好地提取EEG的非線性特征,并在多個(gè)尺度范圍上顯示,從而提高容錯(cuò)率。
將數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集和分類數(shù)據(jù)集,采用上述算法求出數(shù)據(jù)集在不同尺度下的熵值作為ELM的輸入,并設(shè)置隱含層神經(jīng)元數(shù)目為20,選擇Sigmoidal函數(shù)為激活函數(shù)。經(jīng)過(guò)ELM訓(xùn)練和分類,輸出腦電信號(hào)的分類準(zhǔn)確率及ELM的運(yùn)行時(shí)間,分別為98.89%和0.05 s。
進(jìn)一步,為了驗(yàn)證本文方法相比于傳統(tǒng)的熵提取非線性特征算法的優(yōu)越性能,在相同的實(shí)驗(yàn)條件下,分別采用近似熵、樣本熵、模糊熵算法提取EEG信號(hào)的非線性特征,而后采用ELM進(jìn)行訓(xùn)練和分類。從表1的對(duì)比結(jié)果可以看出,本文所使用的算法在敏感性、特異性及準(zhǔn)確率方面都要優(yōu)于其他熵算法。
表1 與傳統(tǒng)熵算法的結(jié)果對(duì)比(%)
本文采用ELM算法進(jìn)行訓(xùn)練和分類。ELM與BP算法不同,BP算法的輸入層到隱含層權(quán)值和隱含層到輸出層權(quán)值全部需要迭代求解(梯度下降法),而ELM算法中,輸入層到隱含層的連接權(quán)值、隱含層的閾值可以隨機(jī)確定,且設(shè)定完后不用再次調(diào)整;隱含層和輸出層之間的連接權(quán)值也不需要迭代調(diào)整,而是通過(guò)解方程組一次性確定,因此比BP算法的計(jì)算速度要快。不僅如此,BP算法在學(xué)習(xí)過(guò)程中更易陷入局部極小點(diǎn),導(dǎo)致訓(xùn)練和分類錯(cuò)誤。如表2所示,在相同的實(shí)驗(yàn)條件下,使用BP算法迭代20 000次求出各層之間的權(quán)值,其運(yùn)行時(shí)間為288.68 s,準(zhǔn)確率為96.11%,而使用ELM不需要迭代求解,其運(yùn)行時(shí)間僅為0.05 s,約為BP算法運(yùn)行時(shí)間的1/5 773。
表2 與BP算法的結(jié)果對(duì)比
表3列出了本文算法與現(xiàn)有其他算法的結(jié)果對(duì)比。如表3所示,時(shí)頻熵、完全集成經(jīng)驗(yàn)?zāi)B(tài)分解、加權(quán)可視圖算法采用的信號(hào)特征個(gè)數(shù)較少,魯棒性較高;希爾伯特變換和深度神經(jīng)網(wǎng)絡(luò)算法采用的信號(hào)特征個(gè)數(shù)較多,復(fù)雜性較大。本文提出新的癲癇檢測(cè)算法中,多尺度熵反映腦電信號(hào)在不同時(shí)間尺度下信號(hào)的復(fù)雜性特征,輸入ELM中訓(xùn)練和分類的特征只需要復(fù)雜性這一種特征。由此可知,本文算法所使用的信號(hào)特征個(gè)數(shù)更少,且分類準(zhǔn)確率更高。實(shí)驗(yàn)結(jié)果表明,本文所提出的基于新型Teager能量算子和多尺度熵算法的腦電特征提取及ELM分類,在采用單特征信號(hào)的條件下得到98.89%的分類準(zhǔn)確率。通過(guò)與傳統(tǒng)熵特征提取算法和其他復(fù)雜網(wǎng)絡(luò)提取特征算法相比較可知,本文算法運(yùn)行速度更快,而且分類準(zhǔn)確率也有了較大的提升。
表3 與其他現(xiàn)有算法的結(jié)果對(duì)比
本文提出了一種基于新型Teager能量算子和多尺度熵提取腦電信號(hào)特征并使用ELM訓(xùn)練分類的癲癇檢測(cè)新算法。新型Teager能量算子可以實(shí)時(shí)跟蹤腦電信號(hào)的能量,多尺度熵將腦電信號(hào)擴(kuò)展到多個(gè)時(shí)間尺度,以便在時(shí)間尺度不確定時(shí)提供額外的觀察視角,從而提升癲癇檢測(cè)的準(zhǔn)確度。與其他算法相比,本研究提出一種新的腦電信號(hào)特征提取和單特征訓(xùn)練分類方法,具有高分類準(zhǔn)確度,更加簡(jiǎn)捷有效。實(shí)驗(yàn)結(jié)果表明,本文提出的癲癇自動(dòng)檢測(cè)算法的分類準(zhǔn)確度達(dá)98.89%,實(shí)現(xiàn)了對(duì)正常腦電信號(hào)和癲癇腦電信號(hào)的高質(zhì)量分類,對(duì)臨床診斷具有現(xiàn)實(shí)性意義。