劉 斌,羅 聰,魏夢然,何良華
(同濟(jì)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,上海 201804)
自1929年德國精神病學(xué)專家Hans Berger發(fā)現(xiàn)并記錄人的腦電信號以來,國內(nèi)外的專家學(xué)者對腦電信號進(jìn)行了大量的研究,取得了顯著的效果。近年來隨著科學(xué)技術(shù)的發(fā)展,尤其是隨著腦機(jī)接口(Brain Computer Interface,BCI)技術(shù)的出現(xiàn),使得對運(yùn)動想象腦電信號的研究成為一個(gè)新的研究熱點(diǎn)。
針對腦電信號的處理分析尤其是對運(yùn)動想象腦電信號的處理分析,眾多學(xué)者提出了很多判別計(jì)算方法,主要有基于不同腦電波段進(jìn)行分析[1]、基于自回歸模型算法[2]、基于小波變換[3]、線性判別方法[4]、神經(jīng)網(wǎng)絡(luò)等[5]。上述研究將運(yùn)動想象的腦電分析問題看成是模式分類,對不同運(yùn)動想象模式提取特征,如頻率和回歸系數(shù)等,然后構(gòu)建判別分析模型進(jìn)行判別分析。在一定的條件下這些方法取得了很好的結(jié)果,不足之處在于很少考慮到腦電信號的特點(diǎn),即時(shí)間空間分布特征顯著,因此,本文提出了基于貝葉斯網(wǎng)絡(luò)的判別分析思想,通過圖模型的空間邏輯結(jié)構(gòu)模擬導(dǎo)聯(lián)的空間位置,各節(jié)點(diǎn)的分布建模模擬導(dǎo)聯(lián)的時(shí)間特征。
貝葉斯網(wǎng)絡(luò)是一種表示變量間概率分布的圖形模型,它充分綜合了先驗(yàn)知識以及數(shù)據(jù)分布特征,并以圖論方法準(zhǔn)確地描述出變量之間的因果關(guān)系[6-7]。目前貝葉斯網(wǎng)絡(luò)在腦電方面的應(yīng)用主要是做特征提取,文獻(xiàn)[8]利用貝葉斯網(wǎng)絡(luò)方法分析處理不同情感下的腦電數(shù)據(jù)來進(jìn)行情感識別,文獻(xiàn)[9-10]則用貝葉斯網(wǎng)絡(luò)進(jìn)行汽車駕駛員的疲勞狀態(tài)的識別。
在已往研究中針對的貝葉斯網(wǎng)絡(luò)算法中,其變量主要是針對離散變量,而在實(shí)際應(yīng)用中,對如腦電信號這種連續(xù)變量也往往是采用連續(xù)數(shù)據(jù)離散化的方法進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)。離散過程中會丟失很多數(shù)據(jù)包含的信息,甚至可能出現(xiàn)假依賴的現(xiàn)象[11]。除了離散化之外,對于連續(xù)變量,還有一種方法是基于條件獨(dú)立性測試,文獻(xiàn)[12]將信息論與統(tǒng)計(jì)測試結(jié)合起來,通過計(jì)算互信息來確定節(jié)點(diǎn)之間的條件獨(dú)立性,從而構(gòu)造多連接有向圖模型。雖然這種方法在一定程度上能夠反映連續(xù)變量之間的相互關(guān)系,但是文獻(xiàn)[13]已經(jīng)指出,這種算法的缺點(diǎn)在于,在有限的樣本空間內(nèi),高階的條件獨(dú)立性檢驗(yàn)的結(jié)果極有可能是不可靠的。
本文針對左右運(yùn)動想象的連續(xù)腦電信號,提出一種基于高斯分布的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)運(yùn)動想象腦電信號分類方法,主要有以下創(chuàng)新:(1)分別構(gòu)建左右運(yùn)動想象的貝葉斯網(wǎng)絡(luò),再通過網(wǎng)絡(luò)結(jié)構(gòu)的差異性來進(jìn)行相關(guān)統(tǒng)計(jì)分析;(2)在結(jié)構(gòu)學(xué)習(xí)搜索過程中添加根據(jù)腦電導(dǎo)聯(lián)物理位置關(guān)系約束;(3)在評分過程中采用高斯分布來描述每個(gè)導(dǎo)聯(lián)的腦電數(shù)據(jù),進(jìn)而獲得連續(xù)變量的相關(guān)參數(shù)和概率密度函數(shù)。
貝葉斯網(wǎng)絡(luò)是一個(gè)有向無圈圖,由網(wǎng)絡(luò)結(jié)構(gòu)和條件概率分布組成[14]。設(shè)節(jié)點(diǎn)代表各個(gè)導(dǎo)聯(lián),節(jié)點(diǎn)間的邊代表導(dǎo)聯(lián)之間的相互關(guān)系。本文的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)步驟如下:
(1)根據(jù)Fisher判別準(zhǔn)則確定任意兩節(jié)點(diǎn)是否獨(dú)立,從而得到每個(gè)節(jié)點(diǎn)的父子節(jié)點(diǎn)集Π1;考慮到越相近的導(dǎo)聯(lián)獲取腦電信號所包含的神經(jīng)活動越相近,本文再根據(jù)導(dǎo)聯(lián)的物理位置分布選取出每個(gè)導(dǎo)聯(lián)的四鄰域?qū)?lián)作為其父子節(jié)點(diǎn)集Π2,于是取 Π=Π1∩Π2作為最終的父子節(jié)點(diǎn)集。
(2)對樣本集進(jìn)行結(jié)構(gòu)學(xué)習(xí)。對每個(gè)節(jié)點(diǎn)進(jìn)行高斯分布建模,在此基礎(chǔ)上采用經(jīng)典的貝葉斯信息準(zhǔn)則(Bayesian Information Criterion,BIC)[15]對整個(gè)貝葉斯網(wǎng)絡(luò)進(jìn)行評分。
對于連續(xù)腦電信號的概率密度函數(shù),本文通過高斯分布來表示,下面介紹具體的算法推導(dǎo)及過程。
現(xiàn)已知某導(dǎo)聯(lián)Xi及其連續(xù)父節(jié)點(diǎn)Y,則其條件概率密度可表示為:
其中,Bi是權(quán)值矩陣;μi表示均值;∑i表示協(xié)方差矩陣。
若存在m個(gè)獨(dú)立同分布樣本集D,則上式的最大似然估計(jì)可表示為:
將式(1)帶入式(2),則式(2)可轉(zhuǎn)變?yōu)橐韵滦问剑?/p>
通過上式進(jìn)行最大似然估計(jì)即可得到相應(yīng)的均值、協(xié)方差和權(quán)值,結(jié)果分別為:
其中,E[XY′]表示子節(jié)點(diǎn)X的樣本與父節(jié)點(diǎn)Y樣本的轉(zhuǎn)置的條件二階矩,其余表達(dá)式類似。
BIC評分是一種常用的評分方法,計(jì)算公式如下:
其中,LL表示極大似然估計(jì)的對數(shù);d表示參數(shù)的個(gè)數(shù);n表示變量的個(gè)數(shù)。
對于連續(xù)變量,通過計(jì)算變量概率密度或者條件概率密度的極大似然估計(jì)來進(jìn)行評分,如式(6)所示:
其中,Θ表示連續(xù)分布的相關(guān)參數(shù);m表示樣本個(gè)數(shù)。
給定樣本數(shù)據(jù)即可通過上式分別計(jì)算出均值、協(xié)方差和權(quán)值,再代入式(1)即可得到概率密度函數(shù),繼而得到整個(gè)網(wǎng)絡(luò)的得分情況,該評分方法的流程如圖1所示。
圖1 基于單高斯分布的評分流程
本文提出的基于貝葉斯網(wǎng)絡(luò)的運(yùn)動想象腦電信號分析方法流程如圖2所示。
圖2 基于貝葉斯網(wǎng)絡(luò)的運(yùn)動想象腦電信號分析流程
本文實(shí)驗(yàn)數(shù)據(jù)來源分為2組:第1組來源于Graz大學(xué)的國際BCI競賽數(shù)據(jù)(BCI IIIa),該數(shù)據(jù)集中包含3個(gè)被試驗(yàn)對象(下文中簡稱被試),每個(gè)被試進(jìn)行4種運(yùn)動想象,本文分別取每個(gè)被試的30個(gè)左、右手運(yùn)動想象數(shù)據(jù)來進(jìn)行分析。另外,為了驗(yàn)證本文方法的通用性,本文按照第3屆國際BCI競賽實(shí)驗(yàn)設(shè)計(jì)運(yùn)動想象實(shí)驗(yàn),并采集測試數(shù)據(jù),這同時(shí)也是本文的第2組數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)采用64導(dǎo)的G.tech腦電放大器采集獲得,采樣頻率為250 Hz。被試對象為5名在校學(xué)生,男性,健康狀況良好,年齡在23歲~27歲之間。實(shí)驗(yàn)過程中被試頭戴腦電帽,放松地坐在椅子上,按照電腦屏幕上隨機(jī)提示想象左手或右手運(yùn)動。單次運(yùn)動想象時(shí)間持續(xù)7 s,其中,前2 s被試處于安靜狀態(tài),2 s時(shí)計(jì)算機(jī)發(fā)出提示音并在屏幕中央顯示“+”,3 s時(shí)計(jì)算機(jī)屏幕上出現(xiàn)向左或者向右的箭頭,被試開始進(jìn)行運(yùn)動想象,該過程一直持續(xù)到第7 s。每個(gè)被試分別進(jìn)行30個(gè)左、右手運(yùn)動想象。
對2組數(shù)據(jù)隨機(jī)取其中20個(gè)作為訓(xùn)練樣本,剩余10個(gè)作為測試樣本。綜合貝葉斯網(wǎng)絡(luò)構(gòu)建的復(fù)雜度及前人的研究成果,本文選取11導(dǎo)(FC3,FC4,C5,C3,C1,CZ,C2,C4,C6,CP3,CP4)數(shù)據(jù)進(jìn)行分析。在分析之前,本文對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了預(yù)處理。預(yù)處理主要是進(jìn)行去除眼電和進(jìn)行濾波工作。眼電的去除借助Neuroscan軟件完成。對于濾波工作,本文分析的頻帶為8 Hz~30 Hz,正好是α波和β波的頻帶[16]。因此,本文設(shè)計(jì)橢圓濾波器,其通帶頻段為8 Hz~30 Hz。
3.3.1 BCI IIIa實(shí)驗(yàn)結(jié)果
在分析過程中,BCI IIIa數(shù)據(jù)集中的3組(k3b、k6b、l1b)被試的每種類型的運(yùn)動想象樣本可以得到一個(gè)相應(yīng)的貝葉斯網(wǎng)絡(luò),將每種類型的20個(gè)貝葉斯網(wǎng)絡(luò)的共同邊屬性進(jìn)行統(tǒng)計(jì),得出可用于區(qū)分的邊和方向。
實(shí)驗(yàn)結(jié)果如圖3所示(本文取被試k3b的統(tǒng)計(jì)圖進(jìn)行說明),圖中橫坐標(biāo)對應(yīng)導(dǎo)聯(lián)的編號,縱坐標(biāo)表示20個(gè)訓(xùn)練樣本中以某導(dǎo)聯(lián)為父節(jié)點(diǎn)的相應(yīng)邊出現(xiàn)的次數(shù)。圖3(a)表示左運(yùn)動想象貝葉斯網(wǎng)絡(luò)相加統(tǒng)計(jì)結(jié)果;圖3(b)表示右運(yùn)動想象貝葉斯網(wǎng)絡(luò)相加統(tǒng)計(jì)圖;圖3(c)則表示兩者相減之后的結(jié)果。
在所有3個(gè)被試的2類運(yùn)動想象中,左右運(yùn)動想象的貝葉斯網(wǎng)絡(luò)差值都有顯著性差異邊存在,但不相同。例如,對被試k3b,顯著性差異的邊為導(dǎo)聯(lián)1到導(dǎo)聯(lián)4所構(gòu)成的邊。表1展示的是3個(gè)被試顯著性差異的邊及差異程度,括號內(nèi)的數(shù)字表示差異程度(即對應(yīng)邊顯著性差異的運(yùn)動想象樣本個(gè)數(shù)),其中,正數(shù)表示左右顯著性差異程度,負(fù)號則表示右左顯著性差異程度。在判別分析過程中,根據(jù)網(wǎng)絡(luò)中這些顯著性差異邊就能就能識別運(yùn)動想象的類型。
圖3 k3b左右統(tǒng)計(jì)結(jié)果
表1 BCI IIIa貝葉斯網(wǎng)絡(luò)公共邊統(tǒng)計(jì)結(jié)果
對于上述3個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,為了體現(xiàn)出本文方法的有效性,采用文獻(xiàn)[17]的實(shí)驗(yàn)結(jié)果作為對比,同時(shí)采用文獻(xiàn)[18]的PCA+fisherscore方法進(jìn)行判別分析,3種方法的識別率如表2所示??梢钥闯觯疚姆椒ǖ钠骄R別率為76.67%,而文獻(xiàn)[18]的PCA+Fisherscore方法識別效果較差,平均識別率僅為45.55%;文獻(xiàn)[17]提出的基于時(shí)頻域分析的運(yùn)動想象腦電信號分類方法是近來取得較好識別效果的一種方法之一,雖然對特定的數(shù)據(jù)集可能存在較好的效果,但該方法的平均識別率為76.47%,依然略差于本文方法的平均識別率。
表2 BCI IIIa數(shù)據(jù)左右運(yùn)動想象識別率 %
3.3.2 自測數(shù)據(jù)實(shí)驗(yàn)結(jié)果
對本文所用的5個(gè)被試實(shí)驗(yàn)數(shù)據(jù),同樣按照上組實(shí)驗(yàn)方法進(jìn)行統(tǒng)計(jì),得到如圖4所示的統(tǒng)計(jì)結(jié)果。
圖4 被試1的左右統(tǒng)計(jì)結(jié)果
表3展示了測試組所有5個(gè)被試顯著性差異的邊及相應(yīng)的差異程度。
表3 貝葉斯網(wǎng)絡(luò)公共邊統(tǒng)計(jì)結(jié)果
為直觀地顯示出網(wǎng)絡(luò)結(jié)構(gòu)的差異,圖5給出了被試實(shí)驗(yàn)數(shù)據(jù)1的左、右運(yùn)動想象貝葉斯網(wǎng)絡(luò)圖及最大差異邊的示意圖。其中,圓圈表示左右顯著性差異最大的邊,即用來進(jìn)行左右判別的邊。
圖5 被試實(shí)驗(yàn)數(shù)據(jù)1左右運(yùn)動想象貝葉斯網(wǎng)絡(luò)
針對測試組5個(gè)被試,同樣采用PCA+fisherscore方法進(jìn)行判別分析。2種方法的得到的識別率如表4所示。
表4 5組左右運(yùn)動想象識別率 %
由表4中的測試結(jié)果可以看出,與PCA方法相比,本文方法對自測數(shù)據(jù)的5個(gè)被試的運(yùn)動想象同樣具有較高的識別率和穩(wěn)定性。
本文介紹了一種基于貝葉斯網(wǎng)絡(luò)建模的運(yùn)動想象腦電信號判別分析方法,并說明該方法的原理及流程。通過使用高斯分布來充分描述出腦電數(shù)據(jù)的分布特征,進(jìn)而得到各個(gè)導(dǎo)聯(lián)之間相互關(guān)系,同時(shí),將電極之間的物理關(guān)系作為限制條件構(gòu)建貝葉斯網(wǎng)絡(luò)。
通過對比本文方法與PCA+fisherscore方法對2組實(shí)驗(yàn)數(shù)據(jù)的識別效果,表明本文方法具有較好的識別效果。然而對于分布非平穩(wěn)且不規(guī)則的腦電數(shù)據(jù)而言,用單高斯模型去描述腦電數(shù)據(jù)的分布特征仍然可能會丟失很多重要信息。因此,下一步的工作主要集中在如何更全面、完整地描述腦電數(shù)據(jù)的分布特征,進(jìn)而構(gòu)建相應(yīng)的貝葉斯網(wǎng)絡(luò)。
[1]萬 柏,綦宏志,趙 麗.基于腦電Alpha波的腦-機(jī)接口控制實(shí)驗(yàn)[J].天津大學(xué)學(xué)報(bào),2006,39(8):977-983.
[2]Krusienski D J,McFarland D J,Wolpaw J R.An Evaluation of Autoregressive Spectral Estimation Model Order for Braincomputer Interface Applications[C]//Proceedings of IEEE EMBS Annual International Conference.New York,USA:IEEE Press,2006:1323-1326.
[3]廖 樣,尹 愚,堯德中.基于連續(xù)小波變換和支持向量機(jī)的手動想象腦電分類[J].中國醫(yī)學(xué)物理學(xué)雜志,2006,23(2):129-132.
[4]Adeli H,Zhou Ziqin,Dadmehr N.Analysis of EEG Records in an Epileptic Patient Using Wavelet Transform[J].Journal of Neuroscience Methods,2003,123(1):69-87.
[5]Pfurtscheller G,Kalcher J,Neuper C.On-line EEG Classification During Externally-paced Hand Movements Using a Neural Network-based Classifier[J].Electroencephalography and Clinical Neurophysiology,1996,99(5):416-425.
[6]Cooper G F,Herskovits E.A Bayesian Method for the Induction of Probabilistic Networks from Data[J].Machine Learning,1992,9(4):309-347.
[7]劉志強(qiáng).因果關(guān)系,貝葉斯網(wǎng)絡(luò)與認(rèn)知圖[J].自動化學(xué)報(bào),2001,27(4):552-566.
[8]Yang Guosheng,Lin Yingzi,Bhattacharya P.A Driver Fatigue Recognition Model Based on Information Fusion and Dynamic Bayesian Network[J].Information Sciences,2010,180(10):1942-1954.
[9]Ko K E,Yang H C,Sim K B.Emotion Recognition Using EEG Signals with Relative Power Values and Bayesian Network[J].International Journal of Control,Automation and Systems,2009,7(5):865-870.
[10]Li Xiangyang,Ji Qiang.Active Affective State Detection and User Assistance with Dynamic Bayesian Networks[J].IEEE Transactions on Systems,Man and Cybernetics,2005,35(1):93-105.
[11]張劍飛,王 輝,周顏軍,等.基于局部優(yōu)化具有連續(xù)變量的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J].東北師大學(xué)報(bào):自然科學(xué)版,2006,38(1):27-30.
[12]Jie Cheng,Bell D,Liu Weiru.Learning Bayesian Networks from Data:An Efficient Approach Based on Information Theory[J].Artificial Intelligence,2002,137(1/2):43-90.
[13]Wong M L,Leung K S.An Efficient Data Mining Method for Learning Bayesian Networks Using an Evolutionary Algorithm based Hybrid Approach[J].IEEE Transactions on Evolutionary Computation,2004,8(4):378-404.
[14]Neapolitan R E.Learning Bayesian Networks[M].New York,USA:Prentice Hall,2003.
[15]王書海,劉 剛.BIC評分貝葉斯網(wǎng)絡(luò)模型及其應(yīng)用[J].計(jì)算機(jī)工程,2008,34(15):229-230,233.
[16]葉 坤.左右手運(yùn)動想象腦電采集和特征提取方法初探[D].武漢:華中科技大學(xué),2008.
[17]穆振東,胡劍鋒,肖 丹.基于時(shí)頻域分析的運(yùn)動想象腦電信號分類[J].中國組織工程研究與臨床康復(fù),2009,13(26):5079-5082.
[18]Cao Lei,Li Jie,Sun Yaoru,et al.EEG-based Vigilance Analysis by Using Fisher Score and PCA Algorithm[C]//Proceedings of IEEE International Conference on Progress in Informaticsand Computing.[S.l.]:IEEE Press,2010:175-179.