官金安,荊漢娜,李 梅
(中南民族大學(xué) 生物醫(yī)學(xué)工程學(xué)院,認(rèn)知科學(xué)國家民委重點(diǎn)實(shí)驗(yàn)室,武漢 430074)
腦-機(jī)接口(BCI)是指在人腦和計(jì)算機(jī)或其它電子設(shè)備之間建立直接交流和控制通道的人-機(jī)通信與控制系統(tǒng)[1].人們可以采用該技術(shù)直接通過大腦來表達(dá)想法或操縱外界設(shè)備,而不需要語言或肢體動(dòng)作.它涉及神經(jīng)科學(xué)、信號(hào)檢測、信號(hào)處理、模式識(shí)別等多個(gè)學(xué)科.該技術(shù)的核心是通過高精度的計(jì)算機(jī)算法,將采集到的腦電信號(hào)轉(zhuǎn)換成特定的控制命令,實(shí)現(xiàn)對(duì)外界設(shè)備的控制.因此如何對(duì)提取到的信號(hào)特征進(jìn)行分類,轉(zhuǎn)換成可以被計(jì)算機(jī)識(shí)別的命令或操作信號(hào)成為腦-機(jī)接口系統(tǒng)的關(guān)鍵問題.
設(shè)計(jì)分類器的關(guān)鍵是尋找一組判別函數(shù),貝葉斯決策理論、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等都是腦電信號(hào)分類中常用的方法,然而在“模擬閱讀”腦-機(jī)接口模式下,核Fisher方法還沒有具體應(yīng)用.實(shí)際問題中,為了避免樣本數(shù)量過大的問題,人們往往利用樣本集直接設(shè)計(jì)分類器.具體做法:首先給定某個(gè)判別函數(shù)類,然后利用樣本集確定出判別函數(shù)中的未知參數(shù),其中最簡單的函數(shù)形式是線性函數(shù).由于腦電信號(hào)大部分是線性可分的,可以利用線性函數(shù)設(shè)計(jì)分類器,如感知準(zhǔn)則分類器[2],F(xiàn)isher分類器[3,4]等,但并不是所有的腦電信號(hào)都線性可分,實(shí)驗(yàn)表明,約有10%左右的信號(hào)是線性不可分但非線性可分的,單獨(dú)使用線性分類器不能達(dá)到最佳效果,本文引入核Fisher分類器[5-7]對(duì)腦-機(jī)接口信號(hào)進(jìn)行分類,并與傳統(tǒng)的線性分類器進(jìn)行了比較.
已知來自ω1和ω2兩類樣本集{x1,x2,…,xN},兩類樣本的線性判決函數(shù)如下式:
g(x)=wTx,
其中,w為權(quán)向量,如果w不同,映射結(jié)果的可分離程度也不同.尋找最佳的投影方向,就是尋找最佳w的過程.
感知準(zhǔn)則函數(shù)通過迭代優(yōu)化確定最佳分界面,最佳界面取決于所使用的最佳準(zhǔn)則,其基本思想是尋找一個(gè)權(quán)向量,使規(guī)范化增廣樣本向量集的錯(cuò)分樣本數(shù)最少,利用錯(cuò)分類信息對(duì)當(dāng)前的界面進(jìn)行修正.
樣本集通過變換,得到一組規(guī)范化增廣樣本向量{z1,z2,…,zN}.變換后,不需考慮樣本原來的類別標(biāo)志,只要找到一個(gè)對(duì)全部樣本zi都滿足wTzi(i=1,2,…,N)的權(quán)向量即可.
構(gòu)造一個(gè)準(zhǔn)則函數(shù)[2],如下式:
其中,zk是被權(quán)向量w錯(cuò)分的樣本集合,當(dāng)z∈zk時(shí),有-wTz≥0,顯然Jp(w)≥0.當(dāng)且僅當(dāng)錯(cuò)分樣本集zk為空時(shí),Jp(w)=0,即Jp(w*)=minJp(w)=0,這時(shí)將不存在錯(cuò)分樣本,而w*就是我們要尋找的解向量.采樣梯度下降法求解最優(yōu)解向量使被錯(cuò)分的樣本數(shù)盡量地少.
Fisher準(zhǔn)則基本原理:找到一個(gè)最合適的投影軸,使兩類樣本在該軸上投影之間的距離盡可能遠(yuǎn),而每一類樣本的投影盡可能緊湊,從而使分類效果為最佳.
Fisher準(zhǔn)則函數(shù)[3],如下式:
從總體上來講,JF(w)的值越大越好,在這種可分性評(píng)價(jià)標(biāo)準(zhǔn)下,使JF(w)達(dá)到最大值的即為最佳投影方向.用Lagrange乘數(shù)法解得最佳投影方向:
利用w*,將樣本x往該方向上投影,可得:
y(w*)Tx,
利用先驗(yàn)知識(shí)選定分界閾值點(diǎn)y0,若y>y0,則x∈w1,否則,x∈w2.
核Fisher方法首先通過非線性變換將數(shù)據(jù)x映射到某個(gè)高維線性特征空間F,然后在這個(gè)特征空間進(jìn)行Fisher線性判別,這樣就隱含地實(shí)現(xiàn)了原輸入空間的非線性判別.設(shè)Φ是輸入空間到高維特征空間F的非線性映射:Φ:x→F.
F空間最大化目標(biāo)函數(shù)[7],如下式:
由于F空間的維數(shù)通常很高甚至無窮維,所以引入內(nèi)積核函數(shù),如下式:
k(xi,xj)=ΦT(xi)Φ(xj),
常用的核函數(shù)分別如下:
(1)徑向基核函數(shù):k(x,xi)=exp(-λ‖x-xi‖2),λ為參數(shù).
(2)多項(xiàng)式核函數(shù):k(x,xi)=(s
(3)線性核函數(shù):k(x,xi)=
本文采用的徑向基核函數(shù)k(x,xi)=exp(-λ‖x-xi‖2).由再生核理論可知,F(xiàn)空間中的任何解向量w都可由F空間中的訓(xùn)練樣本({Φ(x1),Φ(x2),…,Φ(xN)})線性表示,ai為F空間的權(quán)向量,N為訓(xùn)練集樣本數(shù),即:
在F空間中,求解Fisher線性判別函數(shù),如下式:
求解最佳投影方向a,特征空間中Φ(x)在w上的投影變換為k(xj,x)在a上的投影,如下式:
設(shè)定閾值y0,將待測樣品進(jìn)行投影得到y(tǒng),如果y>y0則樣本x屬于ω1,反之x屬于ω2.
本實(shí)驗(yàn)首先記錄在“模擬閱讀”腦-機(jī)接口模式下靶標(biāo)刺激和非靶標(biāo)刺激所引發(fā)的腦電信號(hào)[8],分別采用上述3種分類方法對(duì)兩類腦電信號(hào)進(jìn)行模式分類,比較分類正確率.本實(shí)驗(yàn)的實(shí)驗(yàn)?zāi)J剑哼x取4名男性、1名女性視力正常(或矯正視力正常)受試者,依10-20電極安放國際標(biāo)準(zhǔn)正確佩戴電極帽(安裝32個(gè)Ag/AgCl電極),以舒適坐姿坐在監(jiān)視器前面約40cm處.監(jiān)視器屏幕背景顏色為黑色,中央放置一個(gè)像素為20×20的小視窗,若干個(gè)非靶標(biāo)刺激符號(hào)(圖1(b))與一個(gè)隨機(jī)出現(xiàn)的靶標(biāo)刺激符號(hào)(圖1(a))組成的符號(hào)串(圖1(c))勻速從右向左滑過屏幕中央的小視窗,要求受試者從小視窗中搜索靶標(biāo)刺激符號(hào)(圖1(a)),從而得到視覺誘發(fā)事件相關(guān)腦電位.
圖1 本實(shí)驗(yàn)所用的誘發(fā)符號(hào)串的舉例
圖1 (a),(b),(c)中符號(hào)具有完全相同的結(jié)構(gòu),像素為20 ×20,(a)為靶標(biāo)符號(hào),中間的豎線被染成紅色;(b)為非靶標(biāo)符號(hào),中間的豎線沒有被染成紅色;(c)為由若干個(gè)非靶標(biāo)和一個(gè)隨機(jī)出現(xiàn)的靶標(biāo)符號(hào)構(gòu)成的誘發(fā)符號(hào)串.
每次記錄人工音提示開始,受試者集中注意力于小視窗中平滑移動(dòng)的誘發(fā)符號(hào)串,搜尋靶標(biāo)符號(hào).靶標(biāo)符號(hào)將在人工提示音出現(xiàn)后第2個(gè)1s內(nèi)的某個(gè)時(shí)刻隨機(jī)出現(xiàn)(將1s分成10個(gè)刻度),每次實(shí)驗(yàn)記錄的時(shí)程為2s(靶刺激出現(xiàn)前后各1s),采樣頻率為2kHz,采集4096個(gè)樣本.采樣數(shù)據(jù)記錄為一個(gè)Matlab數(shù)據(jù)文件,格式為:通道號(hào)×樣本×重復(fù)作業(yè)次數(shù)(5名受試者的數(shù)據(jù)大小依次為32×4096×(104、102、105、110、116)).實(shí)驗(yàn)中,我們使用的腦電信號(hào)采集設(shè)備為Biosemi公司的ACTIVE2 32道生理信號(hào)采集儀[9].
由于腦電信號(hào)具有非平穩(wěn)性的特點(diǎn),并且極易受到各種噪聲干擾,特別是工頻干擾.采集到腦電信號(hào)后,有必要進(jìn)行預(yù)處理,減少噪聲對(duì)有用信號(hào)的干擾,提高信噪比[10,11].本次實(shí)驗(yàn)對(duì)數(shù)據(jù)進(jìn)行幾個(gè)步驟的預(yù)處理操作:去除均值,20Hz的低通濾波,下8采樣,幅值歸一化.將那些不需要的信號(hào)盡可能地去除,便于后面的特征提取和分類處理.
特征選擇的任務(wù)是從一組數(shù)量為N的特征中選擇出數(shù)量為n(n (a)1000ms的非靶刺激的信號(hào); (b)1000ms的靶刺激信號(hào) 圖2所示在模擬閱讀模式下,某受試者在多次重復(fù)實(shí)驗(yàn)中采集在電極PO3處記錄到的EEG信號(hào),從150~375ms,靶與非靶信號(hào)差異非常明顯,本次試驗(yàn)把每1s中的150~375ms之間預(yù)處理后的數(shù)據(jù)點(diǎn)(53個(gè)樣本點(diǎn))作為兩類信號(hào)分類的特征向量. 經(jīng)過預(yù)處理和特征提取處理的數(shù)據(jù),采用核Fisher準(zhǔn)則,按下述步驟進(jìn)行分類. (1)采集到的數(shù)據(jù)隨機(jī)分為兩部分a、b,數(shù)據(jù)a大約占總數(shù)據(jù)的60%,用于訓(xùn)練模型.數(shù)據(jù)b占總數(shù)據(jù)的40%,用于測試. (2)參數(shù)選優(yōu),步驟如下. (ⅰ)把數(shù)據(jù)a隨機(jī)平均分成兩部分c、d,數(shù)據(jù)c用于訓(xùn)練模型,數(shù)據(jù)d用于測試該模型分類的正確率. (ⅱ)對(duì)數(shù)據(jù)c采用核Fisher準(zhǔn)則方法訓(xùn)練模型,本實(shí)驗(yàn)選用的核函數(shù)為高斯徑向基核函數(shù),其中高斯函數(shù)中的σ選取過程中,設(shè)置一個(gè)參數(shù)選優(yōu)循環(huán),選取數(shù)據(jù)d測試分類正確率最高的參數(shù). (ⅲ)重復(fù)步驟(2)10次,并求出10次正確率的平均值. (ⅳ)選取正確率最高的1次,作為高斯函數(shù)的最優(yōu)參數(shù)σ. (3)對(duì)數(shù)據(jù)b測試最優(yōu)參數(shù)分類的正確率. (4)重復(fù)步驟(1)、(2)、(3)10次,得出最終平均正確率. 為了對(duì)比3種方法的正確率,對(duì)感知準(zhǔn)則和Fisher準(zhǔn)則也做了交叉驗(yàn)證處理. 按照上述的預(yù)處理和提取特征的方法,對(duì)采集到的5個(gè)受試者s1,s2,s3,s4,s5的數(shù)據(jù)進(jìn)行處理,使用上述3種分類方法分類,圖3為受試者s1的測試集分類決策圖. 圖3中,(a)為感知準(zhǔn)則函數(shù)函數(shù)測試得到的決策圖;(b)為Fisher函數(shù)測試得到的決策圖;(c)為核Fisher函數(shù)測試得到的決策圖,其中*為非靶標(biāo),○為靶標(biāo).可以看出核Fisher的分類效果比單獨(dú)使用感知準(zhǔn)則和Fisher準(zhǔn)則優(yōu)越. (a)感知準(zhǔn)則測試集決策圖 (b)Fisher準(zhǔn)則測試集決策圖 (c)核Fisher準(zhǔn)則測試集決策圖 用上述分類方法對(duì)預(yù)處理的數(shù)據(jù)進(jìn)行10次交叉驗(yàn)證,分別得出5名受試者3種方法的10組數(shù)據(jù)平均正確率,圖4為受試者s1采用3種分類方法的10組平均正確率. 圖4 受試者s1 3種分類方法的10組平均正確率 對(duì)交叉驗(yàn)證得到的10組正確率分別求取平均值,得到結(jié)果,如表1所示. 表1 5名受試者3種分類方法的平均正確率 如圖3、圖4及表1所示,通過比較,可以看出核Fisher準(zhǔn)則分類正確率最高,分別高出單獨(dú)使用Fisher和感知準(zhǔn)則約為20%和10%,感知準(zhǔn)則分類正確率高于單獨(dú)使用Fisher準(zhǔn)則的正確率,約為10%.Fisher準(zhǔn)則將線性方程中的法向量與樣本的乘積看作樣本向量在單位法向量上的投影,可以做到不同類的樣本在法向量上的投影呈現(xiàn)類內(nèi)聚集,類間分散的效果.感知準(zhǔn)則函數(shù),利用錯(cuò)分類信息對(duì)當(dāng)前界面不斷進(jìn)行迭代修正,所以正確率相對(duì)Fisher分類器較高.核Fisher判別分析采用非線性映射將原始數(shù)據(jù)由數(shù)據(jù)空間映射到高維特征空間,進(jìn)而在高維特征空間進(jìn)行Fisher操作.由于采用了非線性映射,而且這種非線性映射往往是十分復(fù)雜的,從而大大的增強(qiáng)了非線性數(shù)據(jù)的處理能力.由于腦電信號(hào)一部分線性不可分,所以核Fisher分類正確率相對(duì)單獨(dú)使用感知準(zhǔn)則和Fisher準(zhǔn)則分類的正確率較高.此外,從圖4中可知5名受試者分類正確率不盡相同,主要是由受試者實(shí)驗(yàn)過程中注意力集中程度或心理因素不同所造成的. 由于腦電信號(hào)大部分線性可分,因此感知準(zhǔn)則及Fisher準(zhǔn)則線性分類方法可以得到較好的結(jié)果.但由于約10%左右的腦電信號(hào)線性不可分但非線性可分,采用核Fisher分類方法首先將信號(hào)非線性投影到線性高維特征空間,在高維特征空間再進(jìn)行Fisher分類判別.相對(duì)于原始Fisher分類和感知準(zhǔn)則分類來說,可有效的增加腦電信號(hào)的可分性,提高正確率,增強(qiáng)數(shù)據(jù)的可用性.核Fisher準(zhǔn)則基本能滿足“模擬閱讀”腦-機(jī)接口信號(hào)分類的需求. [1]Wolpaw J R,Birbaumer N,Heetderks W J,et al.Brain-computer interface technology: a review of the first international meeting[J].IEEE Trans on Rehabilitation Engineering,2000,8(2):164-173. [2]廖彩萍,李遠(yuǎn)清,趙 慧.基于運(yùn)動(dòng)想象的腦電信號(hào)的分類研究[J].自動(dòng)化與儀表,2008,4: 1-4. [3]Fisher R A.The use of multiple measurements in taxonomic problems[J].Annals of Eugenics,1936,7: 179-188. [4]Mou Huaying.Classification of EEG based on PCA and Fisher discriminant criteria[J].Science Technology and Engineering,2009,22(9): 6853-6855. [5]Gao Xiangping,Xu Dan,Wu Xiaopei.A new mental task recongnition method based on kernel Fisher discriminant analysis [J].Computer Technology and Development,2006,16(9): 82-84. [6]Mika S,Ratsch G,Weston J,et al.Fisher discriminant analysis with kernels[C]// IEEE.Neural Networks for Signal Processing IX,Madison,WI: IEEE ,1999: 41-48. [7]Zhou Xin,Wu Ying.Application of kernel Fisher discriminant analysis to digital signal classification[J].Journal of Beijing University of Posts and Telecommunications,2011,34(01): 35-38. [8]官金安.腦—機(jī)接口及其信號(hào)的單次提取[D].武漢: 華中科技大學(xué),2005. [9]Guan Jin′an,Chen Yaguang.Single-trial EEG classification using in-phase average for brain-computer interface[J].Frontiers of Electrical and Electronic Engineering in China,2008,3(2): 194-197. [10]楊幫華,顏國正,丁國清,等.腦機(jī)接口關(guān)鍵技術(shù)研究[J].北京生物醫(yī)學(xué)工程,2005,24(4): 308-310. [11]Shen M,Sun L,Chan F H Y.Method for extracting time-varying rhythms of electroencephalogy via wavelet packet analysis[J].IEEE Proceedings,Science,Measurement and Technology,2001,148(1). [12]Millán J,Mourio J.Asynchronous BCI and local neural classifiers: an overview of the adaptive brain interface project [J].IEEE Trans Neural Syst Rehab Eng,2003,11(6): 159-161. [13]Chen Min,Guan Jinan,Liu Haihua.Enabling fast brain-computer interaction by single-trial extraction of visual evoked potentials[J].Journal of Medical Systems,2011,35(5):1323-1331.2.3 核Fisher分類的步驟
3 結(jié)果與討論
4 結(jié)論