陸苗,鄒俊忠,張見,肖姝源,衛(wèi)作臣
(華東理工大學(xué),上海 200237)
情感識別的關(guān)鍵是從腦電信號中提取有效的情感特征,提高分類準(zhǔn)確率。腦電信號是一種非平穩(wěn)非線性隨機信號,分析這類信號的基本方法有時域、頻域和時頻分析,由于信號的時域和頻域之間相互關(guān)聯(lián),因此,時頻分析方法會更準(zhǔn)確。經(jīng)驗?zāi)B(tài)(EMD)分解是一種自適應(yīng)信號時頻分析方法,在處理腦電信號這一類非平穩(wěn)非線性隨機信號上具有明顯的優(yōu)勢。
目前,EMD算法在國內(nèi)外腦電信號處理研究中的應(yīng)用非常廣泛。季忠利將EMD算法應(yīng)用到腦電信號病理研究中,得到腦信號各個頻帶的強度值,準(zhǔn)確判定了腦電信號節(jié)律特征[1]。沈?qū)W麗將HHT和小波包變換結(jié)合起來,應(yīng)用到睡眠腦電信號分期研究中[2],細(xì)化了睡眠分期的過程。李淑芳等人從癲癇腦電中提取IMF分量的能量值、幅值和波動指作為特征[3],提高了癲癇腦電的識別正確率。李陽等人用希爾伯特-黃變換提取了不同節(jié)律的能量作為特征,在運動想象腦電信號的識別中取得了良好的效果[4]。Ranjit等學(xué)者將EMD分解應(yīng)用到眼電信號的變化研究中,計算眼電信號的各個IMF分量的希爾伯特加權(quán)頻率,作為脊柱損傷者眼電信號的特征,并同健康者的眼電變化進行了對比研究[5]。
另外,分析國內(nèi)外學(xué)者的研究成果發(fā)現(xiàn),EMD方法在運動想象腦電、病理腦電信號以及眼電信號的特征提取研究中應(yīng)用的比較多,但是在情感腦電中的應(yīng)用還顯得不足,因此,將EMD用于情感識別的研究很有必要。
研究對象為年齡在23到25歲的華東理工大學(xué)研究生,要求每個被試者均身心健康、無心臟病、腦損傷和精神類疾病病史,被試者可自愿選擇是否參與試驗。
采集信號之前需要注意:準(zhǔn)備環(huán)境安靜的實驗場所,防止腦電信號中混入過多外界干擾;被試者要保證良好的精神狀態(tài),不能劇烈運動或飲用含有咖啡因的飲料;提前告知被試者實驗方法和目的;實驗前要將頭皮洗凈,避免過多的頭皮阻抗給采集帶來干擾。首先讓被試者處于安靜閉眼的狀態(tài)下采集一組信號,作為對照組,然后通過音樂播放器對20個音樂片段進行播放,前10個片段誘發(fā)被試者的愉悅情緒,后10個片段誘發(fā)被試者的悲傷情緒,每段音樂播放完畢后,有120 s的過渡時間使之平靜,并讓被試者填寫情感狀態(tài)自我評估表,120 s后播放器自動播放下一段音樂。信號的采樣頻率為128 Hz,數(shù)據(jù)長度為50 min,將采集的腦電信號數(shù)據(jù)存儲為matlab能夠識別的格式。
EMD分解的基礎(chǔ)是采集到的數(shù)據(jù)自身的局部特性,具有很強的自適應(yīng)性。
對信號進行EMD分解后將獲得若干個頻率范圍不同的由高頻到低頻排列的IMF函數(shù)序列,這些IMF函數(shù)必須滿足下面兩個條件:
a. 在采樣信號的整個過程內(nèi),信號的局部極值點的數(shù)目和過零點數(shù)目相等或最多相差1;
b. 任意時刻,由局部極大值構(gòu)成的上包絡(luò)線和由局部極小值構(gòu)成的下包絡(luò)線關(guān)于時間軸局部對稱。
EMD分解的過程描述如下:
(1) 找到原始信號x(t)的全部局部最大值和局部最小值,用插值算法獲得上下包絡(luò)線,然后求得上下包絡(luò)線的均值m,定義h=x(t)-m。
(2) 判定h(t) 是否滿足IMF分解終止條件,若不滿足,則令x(t)=h,執(zhí)行第一步;若滿足,執(zhí)行下一步。
(3) 令ci(t)=h,表示分解得到的第i個IMF分量,并令ri(t)=ri-ci。
(4) 判斷是否滿足IMF分解終止條件,如果滿足就進行下一步;如不滿足,則令x(t)=ri,回到第一步,i=i+1 。
(5) 分解終止,最終原始信號被分解成n個固有模態(tài)分量c1,c2,…,cn和一個殘差rn,即:
(1)
由EMD分解原理和步驟可知,上下包絡(luò)線是通過對信號的局部極大值和局部極小值進行三次樣條插值擬合曲線得到的,然后根據(jù)上下包絡(luò)線求平均。那么在端點處就會出現(xiàn)一個問題,我們不能保證數(shù)據(jù)在端點處恰好是極大值點或極小值點,那么在進行三次樣條插值的時候很有可能產(chǎn)生擬合誤差,這種缺陷叫做“端點效應(yīng)”。以周期諧波函數(shù)X為例,假設(shè):
X=sin(2πt)+cos(4πt)+0.8cos(10πt)
(2)
X為三個正余弦函數(shù)疊加而成,頻率分別為1、2和5 Hz,周期為1 s。圖1為此信號EMD分解求取的上下包絡(luò)線和均值,從圖中可以看出信號在左端點處并沒有被確定為極值點,因此,當(dāng)用三次樣條插值進行數(shù)據(jù)擬合時,信號的上包絡(luò)線和實際的曲線產(chǎn)生了明顯的誤差,由于每一次的迭代會用到上一步獲得的均值,那么每次均值的誤差被積累到下一次,這樣的逐次誤差積累給信號的分解會造成極大影響,嚴(yán)重的可能使信號分解失去意義。
因此,需要消除這一缺陷或者減少端點效應(yīng)對信號分解的影響。在傳統(tǒng)的EMD分解算法中,通常使用三次樣條插值算法對信號的極大值點和極小值點進行擬合,但是在端點處,三次樣條插值算法的平滑性不足,會造成過沖現(xiàn)象,那么可以考慮使用平滑度更高的冪函數(shù)插值,使用分段冪函數(shù)插值算法能夠?qū)Χ它c處進行平滑處理,從而抑制端點效應(yīng)的影響。圖2為傳統(tǒng)EMD方法的分解結(jié)果,圖3為改進的EMD方法的分解結(jié)果,對比圖2和圖3可以看出,改進后的EMD方法的分解結(jié)果更加精細(xì)。
圖1 端點效應(yīng)實例圖
圖2 傳統(tǒng)EMD分解效果
圖3 改進EMD分解效果
為驗證改進后的EMD算法具有更高的精度,這里引入相關(guān)系數(shù)來描述實際分解結(jié)果與理想分解結(jié)果的相似程度,定義信號x(n)和y(n)的相關(guān)系數(shù)為:
(3)
當(dāng)x(n)=y(n),即兩個信號完全相等時,ρxy=l;當(dāng)x(n)和y(n)完全不相關(guān)時,ρxy=0;當(dāng)x(n)和y(n)之間有某種關(guān)系時,|ρxy|的數(shù)值在0和1之間表示兩者的相關(guān)程度。表1為原始的EMD算法和改進算法求得的IMF分量與理想IMF分量的相關(guān)系數(shù)。
從表1中可以看出,對傳統(tǒng)EMD算法改進之后,相關(guān)系數(shù)的數(shù)值得到明顯的提高,說明通過改進的EMD算法的分解結(jié)果更加精確。
表1 原始算法與改進算法的相關(guān)系數(shù)
根據(jù)EMD分解流程,對實驗采集到的三類情感腦電信號進行n階分解,獲得n個IMF分量和殘余項。這里對腦電信號樣本數(shù)據(jù)進行8階EMD分解,圖4所示從左到右分別為平靜、悲傷、愉悅?cè)N情感狀態(tài)腦電信號的前4階IMF分量。
從圖4中可以看出,不同類別的腦電信號含有的頻率成分不同,且所含頻率的高低和階數(shù)成正比,從幅度上看,同階的IMF分量的幅度的差異很大,平靜時第三階IMF分量幅值較大,悲傷時第二階和第三階IMF分量的幅值較大,愉悅時各個分量幅值基本相同,可以考慮將IMF能量或與IMF能量相關(guān)的量作為腦電信號的情感特征。
圖4 三種情感腦電信號EMD分解
“熵”的概念最早出現(xiàn)在熱力學(xué)研究中,也叫做“熱熵”,用來表示一個系統(tǒng)中分子狀態(tài)的均勻狀況,分子狀態(tài)越均勻,熵值越高,當(dāng)系統(tǒng)中分子分布最均勻時,熵值達到最大。“信息熵”是香農(nóng)于1948年提出的一個抽象概念,用來描述信源的不確定度,這些概念成功解決了對信息的量化度量的問題。信息熵表征的是某一信息出現(xiàn)的概率,它與熱熵互為負(fù)量,當(dāng)信息廣為傳播時,說明信息出現(xiàn)的概率高,反映的是信息的價值。
(4)
腦電信號處理過程為:首先對原始腦電信號進行預(yù)處理,去除眼電心電等偽跡,然后對信號進行經(jīng)驗?zāi)B(tài)分解,得到IMF分量,根據(jù)能量熵的概念計算 IMF能量熵,從中選取特征向量,通過分類器對三種情感狀態(tài)的信號樣本進行分類實驗,最后得到分類結(jié)果。
對平靜、悲傷、愉悅?cè)惽楦行盘栠M行分類實驗,從每一類信號中選出數(shù)據(jù)長度為500的共120個樣本,再隨機選出30個作為標(biāo)準(zhǔn)樣本,最后從剩下的樣本中選出45個測試樣本。
實驗中,分別使用傳統(tǒng)EMD算法和改進EMD算法對樣本數(shù)據(jù)進行8階EMD分解,結(jié)合能量熵獲得腦電信號的情感特征,表2為利用傳統(tǒng)EMD算法進行實驗的平均分類準(zhǔn)確率,表3為利用改進EMD算法進行實驗的平均分類準(zhǔn)確率。
分析表2和表3的結(jié)果,發(fā)現(xiàn)改進EMD算法后,不管是對標(biāo)準(zhǔn)樣本還是測試樣本,平局分類準(zhǔn)確率提高了15%左右,結(jié)果表明改進的EMD算法應(yīng)用到特征提取中能有效地提高分類準(zhǔn)確率。
表2 傳統(tǒng)EMD算法平均分類準(zhǔn)確率
表3 改進EMD算法平均分類準(zhǔn)確率
表4所示為樣本分類結(jié)果。
表4 基于IMF能量熵得到的分類結(jié)果
從表中可以看出,基于IMF能量熵的情感識別中,對愉悅情感的識別效果最好,對平靜的識別效果稍顯不足,總體平均識別率達到80%以上,說明IMF能量熵用于腦電信號情感識別是有效的。
本研究對腦電信號情感識別的特征提取進行了研究,針對傳統(tǒng)EMD分解中存在的端點效應(yīng),選擇了分段冪函數(shù)插值代替三次樣條插值,提升了EMD算法的分解精度,將其應(yīng)用到腦電信號特征提取中取得了較好的效果。
除了IMF能量熵,從信號的IMF分量中還可以提取IMF能量矩、IMF近似熵、IMF幅值等作為特征,結(jié)合改進的EMD分解能否取得更好的識別效果仍有待研究。