彭仁旺
(廣東科學技術(shù)職業(yè)學院, 廣東 珠海 519000)
近年來,在計算機科學、生物醫(yī)學以及人工智能等技術(shù)發(fā)展的推動下,作為交叉學科的腦-機接口(brain computer interface, BCI)技術(shù)也取得了長足的進步。BCI技術(shù)不依賴于腦外周肌肉系統(tǒng)等傳統(tǒng)的大腦輸出通路,而是直接通過計算機或其他外圍設(shè)備對特定任務(wù)下的腦電信號(electro encephalogram gram, EEG)進行分析,將不同思維活動產(chǎn)生的EEG與不同指令(如鼠標的移動等)聯(lián)系起來,達到向外界傳達大腦中的信息或控制命令的目的。BCI技術(shù)理論上具備代替語言和肢體活動的潛能,使人的意念控制變?yōu)楝F(xiàn)實,在自動駕駛、通信娛樂以及幫助殘障人士重新恢復信息通信功能等方面具有廣闊的應(yīng)用前景[1-2]。
BCI研究中的關(guān)鍵是對腦電信號的特征提取和分類識別:特征提取是從腦電信號中提取反映不同思維活動的差異信息,并通過剔除冗余信息達到降低運算量的目的。分類識別是通過構(gòu)建合適的分類器對特征提取階段獲得的特征向量進行有效區(qū)分,需要在保證分類性能和計算效率的提前下具備較強的泛化能力。
目前對腦電信號特征提取的研究主要分為3個方向:一是從信號的時域、頻域以及時頻域等變換域提取特征,典型的有快速傅里葉變換法(fast fourier transformation, FFT),短時傅里葉變換法(short time fourier transformation, STFT),功率譜分析法以及小波變換法等[3-8],其中FFT方法,功率譜分析方法將時域信號轉(zhuǎn)換到頻域,雖然能夠得到信號的頻域信息,但是損失了時間信息,在分析非線性、非平穩(wěn)信號時存在明顯的局限性;STFT方法雖然能夠分析信號的局部特征,但是根據(jù)信號測不準原理,STFT方法時間分辨率和頻率分辨率存在不可以調(diào)和的矛盾,即時間分辨率越高則頻率分辨率越低,反之亦然;小波變換方法具備的多分辨率特性,在分析非線性、非平穩(wěn)信號時具備明顯優(yōu)勢,通過將信號投影到一系列“基函數(shù)”上實現(xiàn)信號分解,然而“基函數(shù)”的選擇對小波方法的分類性能影響較大。二是從空間域提取特征,主要分為共空間模式法(CSP)和獨立分量分析法(ICA)等[9-10],CSP方法需要對腦電信號進行多通道分析,雖然能夠獲得較好的結(jié)果但是以增加系統(tǒng)復雜度和運算量為代價的,限制了在實際中的應(yīng)用,ICA方法能夠有效的增強EEG信號中的重要節(jié)律分量,但是由于EEG信號的非線性、非平穩(wěn)特性,ICA提取的主分量很難有合理的物理解釋。三是參數(shù)模型分析方法,典型方法包括參數(shù)模型功率譜估計,自回歸滑動平均模型(ARMA)等,該類方法運算量小,適合在線分析,但受噪聲影響較大,常用于分析平穩(wěn)隨機信號。
得到特征向量后,需要設(shè)計合適的分類算法才能得到的期望的分類性能。當前應(yīng)用比較廣泛的分類方法主要有:線性分類器,神經(jīng)網(wǎng)絡(luò)分類器、支撐向量機(support vector machine, SVM)和貝葉斯分類器等[11], 其中SVM作為一種統(tǒng)計分類方法,在面對小樣本、非線性以及高維模式分類問題時表現(xiàn)出了出眾的性能,受到廣泛關(guān)注與應(yīng)用。
在上述研究工作的基礎(chǔ)上,針對EEG信號的非平穩(wěn)、非線性特征,本文提出一種基于EMD和SVM的方法對EEG信號進行特征提取和分類識別,不同于傳統(tǒng)的FFT和小波變換將信號投影到一組預(yù)先設(shè)定的“基函數(shù)”上實現(xiàn)對信號的分解,EMD算法根據(jù)信號的局部特征,從信號中自適應(yīng)的提取一系列本征模函數(shù)(intrinsic mode function,IMF),然后從IMF中提取特征向量,最后采用SVM分類器對所提特征向量進行分類識別,基于實測數(shù)據(jù)的實驗結(jié)果表明,所提方法可以獲得理想的分類結(jié)果。
本文采用奧地利Graz科技大學腦-機接口實驗中心提供的運動想象腦電數(shù)據(jù),該數(shù)據(jù)為2003年國際BCI競賽中的標準數(shù)據(jù)。實驗過程中要求受試者按提示方向進行左右手運動想象。實驗過程中的時序如圖1所示,每次試驗時間持續(xù)9 s。其中,0~2 s為準備時間,受試者處于放松靜止狀態(tài),第2 s時,屏幕上出現(xiàn)一個交叉的“+”符號提示受試者實驗即將開始。從第3 s開始,“+”符號被向右或向左的箭頭替代,同時要求受試者按照箭頭提示的方向想象左手或右手的運動。實驗采用AgCI電極,數(shù)據(jù)從國際標準的10~20導聯(lián)系統(tǒng)的C3,CZ,C4三個通道獲取,實驗總共開展280次,包含訓練數(shù)據(jù)140組和測試數(shù)據(jù)140組,訓練數(shù)據(jù)和測試數(shù)據(jù)中一半(70次)為想象左手運動,一半(70次)為想象右手運動。根據(jù)運動想象腦電生理學原理,人體大腦的C3,C4通道包含了想象對側(cè)部運動時最為豐富的信息,而CZ作為參考通道,與運動想象沒有太大的相關(guān)性,因此實際分析中只采用C3和C4兩個通道的數(shù)據(jù)。實驗數(shù)據(jù)的采樣頻率為128 Hz,每次實驗時長9 s包含1 152個采樣數(shù)據(jù),由于每次試驗是從第3 s開始,為了降低運算時間,本文對每次實驗取3~9 s共768個采樣數(shù)據(jù)。
圖1 實驗過程中的時序
EMD最早由美籍華人Huang. 于1998年提出,是一種用來對非線性、非平穩(wěn)信號進行自適應(yīng)分解的算法[12]。不同于FFT和小波變換,EMD不需要預(yù)先設(shè)定一組基函數(shù)來度量信號,而是根據(jù)信號的局部特征,自適應(yīng)的將信號分解為一系列被稱為本征模函數(shù)(intrinsic mode function, IMF)的信號分量,這些IMF是直接從信號中提取出來的,能夠完整的反映原始信號的內(nèi)在特征。IMF需要滿足如下兩個條件:
1)從待分析信號中提取的極大值點和極小值點的樣本個數(shù)和與過零點的樣本個數(shù)相差不超過1個;
2)在待分析信號的任意位置處,由局部極大值構(gòu)成的上包絡(luò)線和局部極小值構(gòu)成的下包絡(luò)線相對于時間軸對稱,即均值為0。
對于任意給定的時間信號x(t),計算第一個IMF的 “篩選”算法步驟如表1所示。
表1 計算IMF的“篩選”算法步驟
在得到第一個本征模函數(shù)后,我們計算得到剩余項q(t)=x(t)-imf1,并將其作為新的輸入信號,采用上述“篩選”步驟得到下一個IMF。經(jīng)過多次“篩選”,我們可以得到原信號的EMD分解結(jié)果為:
(1)
其中:imfi為第i個IMF,rL為經(jīng)過L次分解后的剩余項。
文獻[13]分析指出,在對信號進行分解時,EMD所起的作用類似于利用一組相互重疊的濾波器組對信號進行濾波,EMD分解的第一個IMF可以認為是通帶為上半信號帶寬的高通濾波器,之后的IMF可以認為是通帶以二分之一縮減的帶通濾波器組,即每個濾波器能夠?qū)崿F(xiàn)對剩余信號上半頻帶的濾除,由于EMD的通帶范圍是與信號帶寬相關(guān)的,因而可以認為EMD對信號的分解是自適應(yīng)的,即不需要提前設(shè)定基函數(shù)就能夠自適應(yīng)的從信號中提取不同頻率對應(yīng)的IMF分量。
圖2 EEG信號EMD分解結(jié)果(C3通道)
圖3 EEG信號EMD分解結(jié)果(C4通道)
利用EMD算法對C3通道和C4通道的EEG信號進行分解,得到的結(jié)果如圖2和圖3所示,其中圖2(a)和圖3(a)為想象左手運動得到的EEG信號分解結(jié)果,圖2(b)和圖3(b)為想象右手運動得到的EEG信號分解結(jié)果,經(jīng)過EMD分解后原始EEG信號被分解為4個IMF和一個余項。從圖2和圖3可以看出,在對想象左手運動和想象右手運動EEG信號進行EMD分解后,IMF2和IMF3兩個分量存在明顯的區(qū)別,表2給出了分解得到的每個IMF信號分量的頻段范圍。根據(jù)奧地利Graz研究中心研究,當大腦進行運動想象時,位于頭皮層左右兩側(cè)EEG信號的α節(jié)律(8~12 Hz)和β節(jié)律(18~26 Hz)的能量會發(fā)生相應(yīng)的變化,這種電生理現(xiàn)象稱為時間相關(guān)去同步(event-related desynchronization, ERD)或時間相關(guān)同步(event-related synchronization, ERS),ERD和ERS是最能反映認知特性和最具生理意義的特征指標之一。而從表2可以看出,EEG信號的α節(jié)律(8~12 Hz)和β節(jié)律(18~26 Hz)的頻率范圍剛好處于IMF2和IMF3,也就是說,經(jīng)過EMD分解后最能反映運動想象節(jié)律特征的信息被自適應(yīng)的分解到IMF2和IMF3兩個本征模函數(shù)中。因此,本文選擇IMF2和IMF3進行進一步分析并提取特征對兩種運動想象腦電信號進行分類。
表2 EMD分解后各分量頻段范圍
在得到IMF2和IMF3后,一種最直接的方法是利用IMF2和IMF3作為特征向量進行分類,但是由于IMF2和IMF3的維度較高,直接使用原始信號進行分類存在計算量大的問題。因此,本文通過提取以下特征對IMF2和IMF3的分布特性進行描述,降低特征向量維度的同時不影響分類性能。
圖4和圖5分別給出了對前述腦電信號數(shù)據(jù)提取上述三維特征得到的二維歸一化特征值圖,其中圓圈表示想象左手運動EEG信號特征值,加號表示想象右手運動EEG信號的特征值,從圖4和圖5可以看出,在特征域,想象兩種運動產(chǎn)生的EEG信號具有較好的可分性。
聯(lián)合C3和C4兩個通道可以得到如下包含六維特征的特征向量進行分類:
Feature=[FC31,FC32,FC33,FC41,FC42,FC43]
(2)
SVM是由Vapnik和Cortes于1995年在統(tǒng)計學習理論中的VC維和結(jié)構(gòu)風險最小化原理的基礎(chǔ)上建立起來的一種基于數(shù)據(jù)的模式分類方法,在解決小樣本,非線性及高維模式分類問題中表現(xiàn)出許多特有的優(yōu)勢。
SVM的核心思想是將輸入低維空間中的線性不可分問題通過一種非線性變換轉(zhuǎn)換為其他高維空間中的線性可分問題,然后在該高維空間中尋找最優(yōu)分類面,其中低維空間到高維空間的非線性變換是通過核函數(shù)R(uk,ui)實現(xiàn)的。引入核函數(shù)后,非線性分類問題的分類函數(shù)轉(zhuǎn)化為:
(3)
圖4 特征值分布圖(C3通道)
圖5 特征值分布圖(C4通道)
R(u,ui)=[(u·ui)+1]σ
徑向基(高斯)核函數(shù):
Sigmoid核函數(shù):
R(u,ui)=tanh(σ(u·ui)+C)
其中:σ,C均為參數(shù)。
在進行分類實驗過程中,SVM選用徑向基核函數(shù),核參數(shù)采用交叉驗證的方式,將訓練樣本平均分成5組,每次采用其中的4組作為訓練集對核函數(shù)進行訓練,剩余1組作為測試樣本驗證模型及參數(shù),最終選擇分類性能最好的參數(shù)作為最終參數(shù)進行分類實驗。
表3給出了采用不同特征情況下的分類性能,其中IMF2、IMF3、IMF2+IMF3表示直接采用IMF2、IMF3和IMF2與IMF3原始信號作為特征向量進行分類的方法,F(xiàn)eature表示按上述特征提取方法提取6維特征作為特征向量進行分類的方法。從表3可以看出,對原始信號進行特征提取后再進行分類并沒有降低分類性能,相對于直接采用原始信號反而分類性能有所提升,這是由于原始信號中除了對不同運動想象EEG信號區(qū)分性能較好的信息外還存在大量的冗余信息,這些冗余信息會對分類產(chǎn)生不利的影響。
表3 不同特征的分類結(jié)果
表4給出了本文所提方法與近年來其它文獻中的方法進行對比的結(jié)果。其中,文獻[14]和文獻[6]都是采用小波包能量進行特征提取,區(qū)別在于文獻[14]是利用的基于馬氏距離的線性分類器而文獻[6]采用的SVM分類器,文獻[15]在文獻[14]的基礎(chǔ)上對 C3、C4兩個通道的腦電信號利用Burg算法提取腦電信號的5階AR模型系數(shù)作為特征并采用線性分類器(LDA)獲得了91.43%的識別結(jié)果。從表4可以看出,相對于其它方法,本文所提方法可以獲得更好的分類結(jié)果。
表4 不同方法的分類結(jié)果
腦電信號除了上述非平穩(wěn)、非線性外,還存在微弱性的特點,信號幅值通常為uV級,很容易受到噪聲的污染。
在上述分析的基礎(chǔ)上對本文所提方法在不同信噪比情況下的分類性能進行進一步分析。實驗過程中利用MATLAB自帶的AWGN()函數(shù)向EEG信號中增加不同信噪比的高斯白噪聲,信噪比定義如下:
(4)
圖6給出了不同信噪比情況下本文所提方法的分類性能,可以看出當信噪比高于25 dB時,所提方法可以獲得90%以上的正確分類結(jié)果,當信噪比低于20 dB時,分類性能急劇下降。圖7給出了當信噪比為15 dB時EEG信號的EMD分解,可以看出此時IMF已完全被噪聲污染,無法提取其中的有用信息。因此,在對低信噪比EEG信號進行特征提取之前,需要通過噪聲抑制方法將噪聲分量進行抑制。
圖6 不同信噪比下的分類性能
圖7 想象左手運動腦電信號EMD分解結(jié)果(SNR=15 dB)
腦電信號作為一種復雜的非線性、非平穩(wěn)信號,如何有效的從腦電信號中提取有用的信息并完成分類識別是當前研究的熱點。本文針對運動想象腦電信號的分類問題,提出一種基于EMD的特征提取方法, EMD能夠自適應(yīng)的將腦電信號中包含的節(jié)律信息(α節(jié)律和β節(jié)律)分解到不同的IMF中,在此基礎(chǔ)上提取6維特征構(gòu)成特征向量,在保留對分類有益信息的同時實現(xiàn)對冗余信息的剔除,最后利用SVM對特征向量進行分類可以得到94.6%的分類結(jié)果,明顯優(yōu)于其它傳統(tǒng)方法。
微弱性作為腦電信號的另一特征,文末對所提方法在不同信噪比情況下的分類性能進行分析,指出在低信噪比情況下,腦電信號受噪聲污染嚴重,所提方法的分類能力會有明顯下降。在接下來的研究工作中,將進一步對低信噪比條件下的分類方法進行研究,拓展腦-機接口系統(tǒng)的應(yīng)用場景。