賈花萍
(渭南師范學(xué)院 計(jì)算機(jī)科學(xué)系,陜西 渭南 714000)
隨著科學(xué)技術(shù)的不斷進(jìn)步、人們對(duì)大腦功能認(rèn)識(shí)的不斷深入以及高性能PC的問世,近20年以來一個(gè)新的研究領(lǐng)域——“腦—計(jì)算機(jī)接口(BCI)”(簡稱腦機(jī)接口)正在蓬勃發(fā)展。腦機(jī)接口是基于腦電信號(hào)而不依賴于腦的正常輸出通路(即外周神經(jīng)和肌肉)的,通過對(duì)大腦思維過程EEG信號(hào)的監(jiān)控與分析,理解人的意圖,直接將大腦信息傳達(dá)到外部世界,可以實(shí)現(xiàn)多種形式的應(yīng)用。其適用人群比較廣泛,理論上只要大腦能夠正常思維的人,都可通過腦機(jī)接口技術(shù)與外界交流,所以對(duì)那些高位截癱或腦干損傷的完全閉鎖患者,具有非常廣闊的實(shí)用前景[1-3]。
EEG數(shù)據(jù)是Purdue大學(xué)的Keim和Aunon[5]所采集的實(shí)驗(yàn)數(shù)據(jù)。受試者坐在隔音房間內(nèi),房間內(nèi)光線暗淡,用無聲電扇保持通風(fēng)。受試者頭戴電極帽,根據(jù)標(biāo)準(zhǔn)10/20電極系統(tǒng),由 C3,C4,P3,P4,O1和O2等6個(gè)部位記錄 6個(gè)通道的EEG信號(hào),經(jīng)過Grass 7P511型放大器放大、通頻帶為0.1~100 Hz的濾波器濾波,采樣頻率為250 Hz的12位A/D轉(zhuǎn)換器將數(shù)據(jù)存儲(chǔ)于計(jì)算機(jī)中。電極安放位置模型如圖1所示。
圖1 電極安放位置模型
由置于被試者左眼上方和下方的2個(gè)電極記錄眼動(dòng)信號(hào)作為第7通道信號(hào)。共提供7個(gè)受試者的數(shù)據(jù)。每個(gè)受試者進(jìn)行多次不同的思維作業(yè)實(shí)驗(yàn),每次思維作業(yè)采集的數(shù)據(jù)長度為10 s。5種思維活動(dòng)為:1)放松狀態(tài),受試者盡可能放松,不進(jìn)行任何思維活動(dòng);2)打信件腹稿,受試者想象給某位親人或朋友寫一封信;3)心算乘法,受試者想象進(jìn)行比較復(fù)雜的乘法運(yùn)算;4)想象在黑板上寫數(shù)字,受試者想象將數(shù)字寫在黑板上;5)想象幾何圖形旋轉(zhuǎn),受試者想象將一個(gè)三維圖形繞某個(gè)軸旋轉(zhuǎn)。每種思維任務(wù)前半秒的波形如圖2所示。
這里采用一種時(shí)域回歸方法去除原始EEG信號(hào)中包含的眨眼偽差噪聲。針對(duì)不同的導(dǎo)聯(lián),眼電信號(hào)乘以一個(gè)相應(yīng)的加權(quán)系數(shù)進(jìn)行幅值調(diào)整,然后從EEG信號(hào)中減去調(diào)整后的眼電幅度部分,從而去除較大眼電。這里采用0.1、0.05和0.025等3種加權(quán)系數(shù)分別處理C3C4、P3P4和O1O2中包含的眼電噪聲。
圖2 每種思維任務(wù)前半秒的波形
將AR模型應(yīng)用到EEG分析中的基本思想是,假設(shè)可以用AR過程近似真實(shí)EEG信號(hào)?;谶@一假設(shè),根據(jù)實(shí)際EEG信號(hào),選取合適的階次、參數(shù),使得AR模型所對(duì)應(yīng)的AR過程盡可能逼近EEG信號(hào)。這里采用AR參數(shù)模型法是考慮到EEG信號(hào)是典型非平穩(wěn)隨機(jī)信號(hào),假設(shè)x(t)的采樣序列為x[n],則序列x[n]的AR模型為:
式中,p為模型階次;ak為AR模型參數(shù);u[n]為激勵(lì)白噪聲。
本文的研究對(duì)象是被試者2,其每種思維作業(yè)重復(fù)5次,每次持續(xù)10 s,每個(gè)通道每次試驗(yàn)記錄2 500個(gè)采樣數(shù)據(jù)。在MATLAB 7.0中編程繪制出被試者2的5種思維任務(wù)重復(fù)一次的波形,包含和不包含眼電2種情況,如圖3所示。
圖3 被試者2的5種思維任務(wù)重復(fù)一次的波形
對(duì)EEG數(shù)據(jù)預(yù)處理后采取分段和不分段2種情況比較分類結(jié)果。首先對(duì)于預(yù)處理后的EEG數(shù)據(jù)用矩形窗進(jìn)行分段,窗口長度為1 s(250個(gè)采樣點(diǎn)),下一段與上一段重疊0.5 s,數(shù)據(jù)長度為10 s,可分為19段。對(duì)每一段數(shù)據(jù)建立一個(gè)AR模型。模型如下:
式中,aic是通道為 C 的第 i個(gè) AR 系數(shù),C={C3,C4,P3,P4,O1,O2},P 為 AR 模型的階數(shù)。
大量試驗(yàn)表明,對(duì)于本文的數(shù)據(jù),取6階模型階數(shù)較好,每一個(gè)EEG段由36個(gè)特征量(6通道×6階)表示,運(yùn)用Burg算法對(duì)每段的數(shù)據(jù)進(jìn)行AR參數(shù)估計(jì),得到長度為6×6=36的系數(shù)序列,這 36 個(gè)系數(shù)(6 導(dǎo)×6 階)構(gòu)成一個(gè)特征向量(a1,C3,a1,C4,a1,P3,a1,P4,a1,O1,a1,O2,a2,C3,a2,C4,…,a6,O1,a6,O2)作為一個(gè)樣本。網(wǎng)絡(luò)輸入層神經(jīng)元數(shù)目取決于樣本的長度,為36。被試者2完成了一組實(shí)驗(yàn),在每一組實(shí)驗(yàn)中,進(jìn)行5種思維活動(dòng),每種思維活動(dòng)重復(fù)5次,每次持續(xù)10 s。特征樣本集的構(gòu)成也和思維作業(yè)的分類種類有關(guān),若要?jiǎng)澐譃?類,則樣本集有5×19×5=475個(gè)樣本,每個(gè)樣本對(duì)應(yīng)一列,因此每個(gè)樣本集為36(行)×475(列)的矩陣。為測(cè)試分類的準(zhǔn)確度,把樣本集分為2部分,前一部分為訓(xùn)練樣本,后一部分為測(cè)試樣本。將被試者2的5種思維活動(dòng)重復(fù)的前4次作為訓(xùn)練樣本,最后一次作為測(cè)試樣本,所以訓(xùn)練樣本共有19×5×4=380個(gè),測(cè)試樣本共有 19×5×1=95 個(gè)。
EEG數(shù)據(jù)未分段的情況下,用6階AR模型,Burg算法對(duì)每個(gè)通道的EEG數(shù)據(jù)進(jìn)行AR參數(shù)估計(jì),得到長度為36的系數(shù)序列, 構(gòu)成一個(gè)特征向量(a1,C3,a1,C4,a1,P3,a1,P4,a1,O1,a1,O2,a2,C3,a2,C4,…,a6,O1,a6,O2)作為一個(gè)樣本。 網(wǎng)絡(luò)輸入層神經(jīng)元數(shù)目取決于樣本的長度為36。因此每個(gè)樣本集為36(行)×25(列)的矩陣。
BP(Error Back Propagation Network)神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)之一,是一種多層網(wǎng)絡(luò)的逆推學(xué)習(xí)算法?;舅枷隱7]是:學(xué)習(xí)過程由信號(hào)的正向傳輸與誤差的反向傳播2個(gè)過程組成。正向傳播時(shí),輸入樣本從輸入層傳入,經(jīng)中間層(隱層)逐層處理后傳向輸出層。若輸出層的實(shí)際輸出與期望輸出不符,則轉(zhuǎn)向誤差的反向傳播階段。誤差的反向傳播是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),將此誤差信號(hào)作為修正各單元權(quán)值的依據(jù)。
圖4 BP網(wǎng)絡(luò)結(jié)構(gòu)
由輸入層,輸出層和中間層(隱層)組成,其結(jié)構(gòu)如圖4所示。
對(duì)EEG數(shù)據(jù)分段或不分段,只是數(shù)據(jù)樣本的數(shù)目不一樣,故在這兩種情況下,網(wǎng)絡(luò)輸入層神經(jīng)元數(shù)目為36。輸出層神經(jīng)元的個(gè)數(shù)取log2m。m為類別模式。1989年Robert Hecht-Nielsen證明對(duì)于任何閉區(qū)間內(nèi)的一個(gè)連續(xù)函數(shù)都可用隱層的BP網(wǎng)絡(luò)逼近。這里采取3層BP網(wǎng)絡(luò),開始先放入較少的神經(jīng)元,學(xué)習(xí)一定次數(shù),若不成功則再增加隱層單元的數(shù)目,直到達(dá)到比較合理的隱層單元數(shù)目為止。結(jié)合經(jīng)驗(yàn)公式,隱層神經(jīng)元的個(gè)數(shù)應(yīng)為7~16。編寫Matlab程序選取隱含層神經(jīng)元的最佳數(shù)為s。網(wǎng)絡(luò)隱含層的神經(jīng)元傳遞函數(shù)采用S型正切函數(shù)tansig,輸出層神經(jīng)元傳遞函數(shù)采用S型對(duì)數(shù)函數(shù)logsig,這是因?yàn)楹瘮?shù)的輸出位于區(qū)間[0,1]中,正好滿足網(wǎng)絡(luò)輸出要求。
網(wǎng)絡(luò)經(jīng)訓(xùn)練后才能實(shí)際應(yīng)用。用init.m函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行初始化,以消除前面訓(xùn)練的影響。訓(xùn)練結(jié)束后,用仿真函數(shù)a=sim(net,p)對(duì)網(wǎng)絡(luò)進(jìn)行仿真。分別對(duì)未分段和分段后兩種情況的分類結(jié)果進(jìn)行比較,對(duì)5種思維狀態(tài)的前2種、前3種、前4種、5種分別用BP算法進(jìn)行分類,在MATLAB7.0中進(jìn)行程序測(cè)試,分類結(jié)果如圖5所示。
圖5 BP算法分類正確率比較
本文主要采用AR模型提取信號(hào)分段前后特征作為神經(jīng)網(wǎng)絡(luò)輸入,用BP算法對(duì)2~5種思維狀態(tài)的EEG信號(hào)進(jìn)行分類,從實(shí)驗(yàn)結(jié)果可以看出:1)未對(duì) EEG進(jìn)行分段提取特征的分類正確率明顯高于進(jìn)行分段后提取特征的分類正確率。2)隨思維作業(yè)增加分類準(zhǔn)確度降低,2種思維作業(yè)情況下,分類準(zhǔn)確度較高;而在3種以上思維作業(yè)情況下,其分類準(zhǔn)確度要相對(duì)低些,說明隨著思維任務(wù)的增加,其分類的準(zhǔn)確度會(huì)有所下降。3)考慮多導(dǎo)電極的信息存在相關(guān)性。后續(xù)研究中,在數(shù)據(jù)預(yù)處理方面,應(yīng)考慮多導(dǎo)電極存在的相關(guān)性并予以去除或減小。由于其他一些因素,如受試者之間的個(gè)體差異等影響,會(huì)在一定程度上影響分類精度。因此,后續(xù)研究工作中應(yīng)考慮到用神經(jīng)網(wǎng)絡(luò)集成方法進(jìn)行EEG信號(hào)分類,進(jìn)一步提高分類精度。
[1]Moore Melody M.Real-world applications for brain-computer interface technology[J].IEEE Transactions On Neural Systems Rehabilitation Engineering,2003,11(2):162-165.
[2]Gerwin Schalk,McFarland Dennis J,Thilo Hinterberger.BCI2000:a general-purpose brain-computer interface(BCI)system[J].IEEE Transactions On Biomedical Engineering,2004,51(6):1034-1043.
[3]Robert Leeb,Gert Pfurtscheller.Walking through a virtual city by thought[C]//Proceedings of the 26th Annual International Conference of the IEEE EMBS.San Francisco,CA,USA,2004:1-5.
[4]Keirn Zachary A.Software and data[DB/OL].2008.http://www.cs.colostate.edu/eeg/eegSoftware.html#keirndata.
[5]Keim Z A,Aunon J I.A new mode of communication between man and hissurroundings[J].IEEE Transactions on Biomedical Engineering,1990(37):1209-1212.
[6]劉海龍,王玨,鄭崇勛.基于非線性參數(shù)的思維任務(wù)分類[J].西安交通大學(xué)學(xué)報(bào),2005,39(8):900-903.
[7]朱大奇,史慧.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].北京:科學(xué)出版社,2006:33-34.