康莎莎,周蚌艷,2,吳小培,2*
(1.安徽大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,安徽 合肥 230601;2.安徽大學(xué) 計算智能與信號處理教育部重點實驗室,安徽 合肥 230039)
腦-機接口(brain-computer interface,簡稱BCI)是一種新穎的人-機方式.它以腦電信號(electroencephalogram,簡稱EEG)為信息載體,實現(xiàn)人腦與外部設(shè)備的直接通信和控制[1-3].BCI系統(tǒng)的關(guān)鍵在于從EEG中提取出能反映操作者主觀意識的特征參數(shù),并將其轉(zhuǎn)換成系統(tǒng)需要的指令.筆者主要研究運動想象BCI(motor imagery BCI,簡稱MI-BCI)系統(tǒng)及其參數(shù)優(yōu)化新方法[4-7].
在MI-BCI系統(tǒng)實現(xiàn)中,用戶個體差異性和隨機背景噪聲干擾始終是無法回避且難以有效解決的問題.因此,針對現(xiàn)場環(huán)境和受試個體情況的BCI系統(tǒng)參數(shù)優(yōu)化,是保證系統(tǒng)能正常和有效運行的前提.在離線MI-BCI研究中,涉及時-頻-空域3域參數(shù)的優(yōu)化(時/頻窗口位置和空域濾波器系數(shù)等).對于在線MI-BCI系統(tǒng),由于沒有任務(wù)提示時間參考,并且每次運動想象過程也具有很大的隨機性,因此,在線MI-BCI系統(tǒng)時間窗參數(shù)的優(yōu)化不具有明顯的實際意義.相比而言,運動神經(jīng)皮層活動的大致頻域范圍相對明確,但不同個體之間的最優(yōu)頻帶往往存在較明顯的差異.遺傳算法[8-9](genetic algorithm,簡稱GA)是一種模擬大自然遺傳進(jìn)化過程的尋優(yōu)算法.對于各種特殊問題的最值獲取具有很大的靈活性和廣泛適用性[10-11].但是針對基于實測EEG數(shù)據(jù)的特征空間尋優(yōu)問題,GA算法對噪聲引起的野值(outlier)非常敏感,因此穩(wěn)定性欠佳.為了能夠有效發(fā)揮GA算法的尋優(yōu)性能,需要合理設(shè)計預(yù)處理算法,以便盡可能消除原始EEG數(shù)據(jù)中的噪聲干擾,并有效增強運動相關(guān)的EEG節(jié)律成分.獨立分量分析(independent component analysis,簡稱ICA)[12]是一種常用的多道EEG預(yù)處理方法,它綜合考慮了多道EEG所包含的時-頻-空3域信息[13-16],因此具有較好的信噪比改善能力.相比而言,ICA以源的獲取為最終目標(biāo).大量研究表明,ICA方法不僅能有效去除噪聲偽跡干擾,而且所獲得的EEG源往往具有很明確的神經(jīng)電生理意義.另外,ICA屬于無監(jiān)督學(xué)習(xí)方法,濾波器參數(shù)與受試者的思維狀態(tài)無關(guān),因此在實際應(yīng)用中具有很好的可操作性[17-18].綜上考慮,筆者對結(jié)合ICA和GA算法的最優(yōu)節(jié)律增強頻帶(rhythm enhanced band,簡稱REB)定位方法開展研究.實驗結(jié)果表明,基于ICA的GA特征優(yōu)化方法具有較好的可靠性和實用性,不僅能精確定位受試個體的運動節(jié)律頻率范圍,而且可用于在線MI-BCI的設(shè)計與實現(xiàn).
筆者的數(shù)據(jù)集是實驗室自主采集的3類MI-EEG數(shù)據(jù),數(shù)據(jù)通過40導(dǎo)的Neuroscan腦電放大器采集獲得,電極安放采用國際腦電圖學(xué)會標(biāo)定的10-20系統(tǒng)電極導(dǎo)聯(lián)定位標(biāo)準(zhǔn),采集了不同受試者在不同時間段的16導(dǎo)聯(lián)運動想象EEG數(shù)據(jù),采集實驗范式如圖1所示.
圖1 自主實驗運動想象實驗范式
運動想象實驗范式具體采集過程:采樣頻率為250 Hz,同時MI-EEG數(shù)據(jù)進(jìn)行了50 Hz陷波濾波和0.5~100 Hz帶通濾波處理.受試者是4位右手健康的研究生,分別是S1(女,25歲)、S2(男,29歲)、S3(女,23歲)和S4(女,22歲).運動想象類型為左手、右手和腳,每類運動想象各25次,因此一組數(shù)據(jù)集由75個單次MI-EEG數(shù)據(jù)構(gòu)成.每位受試者提供不同時間段采集的8組腦電數(shù)據(jù)集,文中的命名方式為:S1_n,S2_n,S3_n,S4_n(n=1,2,…,8,n為整數(shù)),數(shù)據(jù)集共有32組.單次采集實驗為10 s,0~1 s的提示時間段,1 s后受試者在屏幕上可以看到一個紅色方向箭頭提示(分別為:向左的左手想象、向右的右手想象和向下的腳想象),運動想象持續(xù)5 s,在這一過程中受試者盡量不要眨眼,最后是6~10 s的休息時間段,在休息期間受試者不要進(jìn)行較大幅度的動作,避免采集到質(zhì)量不高的MI-EEG數(shù)據(jù).
遺傳算法是一種模擬大自然遺傳進(jìn)化過程的尋優(yōu)算法,通俗地說是模擬達(dá)爾文生物進(jìn)化論的自然選擇(適者生存、優(yōu)勝劣汰)和遺傳學(xué)機理的生物進(jìn)化過程的一種計算模型[19].
GA算法首先以編碼開始,即按生物學(xué)的方法將問題的求解表示種群中的個體,從而構(gòu)造出一群包括N個可行解的初始種群,將它們置于問題的環(huán)境中;然后根據(jù)自然選擇原則,對該種群按照GA算法的隨機選擇、交叉和變異操作,不斷優(yōu)化生成的新種群,這樣一代代地不斷進(jìn)化繁衍;適應(yīng)度值高的個體被選中的概率較高,這樣經(jīng)過若干代后,算法收斂于最好的個體,它很可能就是問題的最優(yōu)解或次優(yōu)解.其中筆者使用的GA算法的編碼長度L由MI-EEG和在線MI-BCI系統(tǒng)的需要進(jìn)行設(shè)定,雖然L越長,可期望的最優(yōu)解的精度越高,但是L取值過大會增大尋求MI最優(yōu)REB的復(fù)雜度,不利于在線MI-BCI系統(tǒng)的分析.初始種群規(guī)模N表示每一代種群中所含個體數(shù)目.當(dāng)N取值較小時,GA算法的運算速度較快,但容易引起GA算法出現(xiàn)假收斂(過早收斂)想象;當(dāng)N取值較大時,又會使得GA算法效率降低.筆者建議用于MI-BCI的N取值范圍在20~40之間.GA算法沒有明確的搜索終止準(zhǔn)則,通常是指定一個遺傳終止進(jìn)化代數(shù)T來終止算法,為了獲得較高精度解,可依據(jù)MI-EEG適應(yīng)度的穩(wěn)定情況或算法的時間復(fù)雜度來實時調(diào)整T的大小.GA算法的適應(yīng)性函數(shù)是筆者尋求最優(yōu)REB的關(guān)鍵,其表明MI-EEG分類識別率的高低.對于不同的問題,適應(yīng)性函數(shù)的定義方式也不同.筆者的適應(yīng)度函數(shù)的編寫依據(jù)筆者要實現(xiàn)的目的,即精確定位受試的運動節(jié)律頻率范圍,從而提高在線MI-BCI系統(tǒng)的識別率.
多導(dǎo)聯(lián)混合腦電信號x(t)=[x1(t),x2(t),…,xn(t)]T和獨立腦電源信號s(t)=[s1(t),s2(t),…,sn(t)]T關(guān)系為
x(t)=As(t),
(1)
其中:n和T分別代表導(dǎo)聯(lián)數(shù)和轉(zhuǎn)置;混合矩陣A和源信號s(t)未知.ICA算法的關(guān)鍵是如何建立一種有效的最優(yōu)分離矩陣W搜尋算法,分離模型為
u(t)=Wx(t),W=A-1.
(2)
分離出的獨立分量u(t)=[u1(t),u2(t),…,un(t)]T是對真實源信號s(t)的近似估計,ui(t)是其中一個獨立分量.獨立分量的提取過程包括目標(biāo)函數(shù)的建立和優(yōu)化兩部分.ICA算法得到的混合矩陣A表示獨立分量的空域特征.分離矩陣W的列向量即為提取獨立分量的空域濾波器,其包含了用于檢測運動相關(guān)EEG信號成分的空域濾波器.使用單次MI-EEG數(shù)據(jù)獲取ICA分離矩陣W,從中自動選取出左手、右手和腳的空域濾波器[wlwrwf].理論上單次MI-EEG數(shù)據(jù)的樣本數(shù)量相對較少,可能不利于ICA算法的學(xué)習(xí),但對最優(yōu)運動節(jié)律頻帶的確定影響有限,而且能有效提高算法的運算效率.
246名職前數(shù)學(xué)教師參與了問卷測試,測試分兩個階段:第一階段,完成第一類測試題,時間為20分鐘;第二階段,完成第二類問題即教學(xué)設(shè)計任務(wù),時間為50分鐘.隨后,在每所學(xué)校隨機選取15名職前教師,要求他們一周以內(nèi)錄制微格教學(xué)視頻.研究者收集這些教學(xué)視頻作為研究樣本,同時利用收集微格視頻的時間進(jìn)行集體訪談.訪談均被自動錄音,以便轉(zhuǎn)錄文字后進(jìn)行分析.
圖2是一例典型設(shè)計,其中w-left、w-right以及w-foot代表左手、右手和腳的空域濾波器.文中采用的是之前提出的ICA空域濾波器優(yōu)化設(shè)計算法,其流程如圖3所示,詳細(xì)過程見文獻(xiàn)[20].
圖2 左右手和腳的空域濾波器
對MI-EEG數(shù)據(jù)進(jìn)一步節(jié)律增強使用的最優(yōu)REB,大部分通過手動經(jīng)驗獲得或直接使用運動相關(guān)mu節(jié)律(8~13 Hz),這樣的操作具有一定的盲目性,且手動尋找最優(yōu)REB會耗費大量的時間,如果使用相同頻帶8~13 Hz也不一定能得到理想的識別率.因為不同個體之間的生理反應(yīng)有所差異,對應(yīng)的mu節(jié)律頻帶是不一樣的,統(tǒng)一使用相同mu節(jié)律進(jìn)行REB不會得到理想的MI-EEG分類結(jié)果,所以筆者提出一種特征優(yōu)化方法來獲取運動想象的最優(yōu)REB.
筆者的目的是通過GA算法精確定位受試的運動想象最優(yōu)REB,來改善MI-BCI系統(tǒng)的識別率,所以GA算法適應(yīng)度函數(shù)定義頻帶為輸入變量.GA算法的適應(yīng)度函數(shù)設(shè)計過程是:首先定義濾波頻帶的起始頻點f,根據(jù)mu節(jié)律的變化范圍和手動最優(yōu)REB范圍等,規(guī)定了GA算法的變量頻帶的增量為d;然后形成的REB范圍為f~(f+d) Hz;接下來結(jié)合ICA算法完善GA算法的適應(yīng)度函數(shù),完成下文的特征優(yōu)化方法.為了使系統(tǒng)能達(dá)到最佳運行狀態(tài)和得到理想的結(jié)果,GA算法的適應(yīng)度函數(shù)運行之前,其涉及相關(guān)參數(shù)設(shè)置和一些函數(shù)的選擇,包括初始種群大小、算法結(jié)束條件的進(jìn)化代數(shù)以及是否輸入最優(yōu)值等[21],需要根據(jù)GA算法的時間復(fù)雜度、GA算法的運行收斂情況、受試的運動想象mu節(jié)律以及預(yù)處理算法的穩(wěn)定性進(jìn)行實時調(diào)整和改進(jìn).
筆者設(shè)定了基于方差的運動想象類別簡單判定準(zhǔn)則,其根據(jù)BCI系統(tǒng)特征分類的一個非常重要的生理特征依據(jù),即運動想象的事件相關(guān)去同步(event-related desynchronization,簡稱ERD)和事件相關(guān)同步(event-related synchronization,簡稱ERS)現(xiàn)象[22-23].為了能夠有效發(fā)揮GA算法的尋優(yōu)性能,設(shè)計了合理的ICA空域濾波預(yù)處理方法,以便盡可能消除原始MI-EEG數(shù)據(jù)中的噪聲干擾,因此提出了基于ICA的GA特征優(yōu)化方法.所提方法的具體實現(xiàn)流程如圖4所示.
圖3 ICA空域濾波器設(shè)計流程圖
圖4 基于ICA的GA特征優(yōu)化方法
筆者所提特征優(yōu)化方法的3類MI-EEG識別步驟如下:
(1) 對訓(xùn)練集進(jìn)行預(yù)處理;
(2) 根據(jù)2.2節(jié)ICA空域濾波器的設(shè)計方法,得到左手、右手和腳空域濾波器[wlwrwf];
(4) 最后根據(jù)方差判定準(zhǔn)則進(jìn)行3類運動想象的分類識別.
一般GA算法的時間復(fù)雜度比較高,所以用于設(shè)計ICA濾波器的訓(xùn)練集仍采用單次 MI-EEG數(shù)據(jù),測試集截取單次MI時間段0.5~5 s,且設(shè)定了特征優(yōu)化方法的結(jié)束條件,即進(jìn)化代數(shù)50,在不影響找尋最優(yōu)REB和識別率的基礎(chǔ)上,有效減少了算法的運算時間.分類結(jié)果如圖5所示.
圖5 迭代輸出的平均值和最優(yōu)值
從圖5中兩組MI-EEG數(shù)據(jù)的運行結(jié)果可以清晰地看到,每隔一代輸出最優(yōu)值和對應(yīng)的平均識別率,共有50組結(jié)果(代表50代).GA算法環(huán)境配置中設(shè)定了下一代的優(yōu)化選取是根據(jù)上一代保留的2個最優(yōu)結(jié)果進(jìn)行的,這樣一代代進(jìn)行下去,直到迭代到50后終止算法,其中最高識別率對應(yīng)的頻帶就是要尋找的最優(yōu)REB.圖5顯示的結(jié)果為負(fù)數(shù)是因為Matlab中GA算法默認(rèn)最終輸出結(jié)果是最小值,但是筆者是要得到不同受試者的最高識別率同時對應(yīng)的REB則是最優(yōu)的,所以變正為負(fù).
分析在不同增量d下運行筆者方法得到的最優(yōu)頻點和最優(yōu)值,用以幫助選擇最優(yōu)的頻帶增量.如表1所示.
表1 不同增量d的最優(yōu)頻點和最優(yōu)值
表1是在相同8~13 Hz的頻帶約束范圍下,S3和S4的8組MI-EEG數(shù)據(jù)在不同頻帶增量下得到的最優(yōu)值和對應(yīng)的頻點.從表中可以看出,在相同的頻帶約束條件下,不同增量下MI-EEG分類得到的最優(yōu)值是不同的.當(dāng)增量為3時,平均值為83.39%;當(dāng)增量為4時,平均值為83.41%;當(dāng)增量為5時,平均值為83.15%.鑒于此,在以后的分析中,可以選擇最優(yōu)的頻帶增量來獲取更理想的結(jié)果,從而為在線MI-BCI系統(tǒng)的深入研究提供良好的基礎(chǔ).為了保證比較的合理性,根據(jù)表1的結(jié)果、手動經(jīng)驗的REB增量、運動相關(guān)mu節(jié)律以及GA算法的尋優(yōu)性能,則下面實驗分析的頻帶約束范圍是8~13 Hz的mu節(jié)律,GA算法的頻帶增量是4.
通過筆者特征優(yōu)化方法,對受試者S1~S4所有的數(shù)據(jù)(每位受試者8組數(shù)據(jù),共有32組)進(jìn)行3 類MI-EEG數(shù)據(jù)自測試的平均識別率,其在手動方法和遺傳算法下進(jìn)行.如表2所示.
表2自測試的平均識別率%
受試者方法自測試平均值S1手動81.5867.9172.2582.8179.5493.7990.1989.56遺傳82.5868.4876.0083.6180.7793.0290.8990.00S2手動80.9175.6883.2978.2089.1083.9882.9269.30遺傳83.7476.0983.9378.4984.1184.1185.0773.9S3手動74.5477.8377.1784.9472.6885.2680.4390.24遺傳72.7277.8778.9985.6479.4385.8880.4890.40S4手動83.7585.9681.2189.2876.9890.9082.5271.30遺傳85.9288.2382.5492.7880.3792.3985.2674.10
從表2中可以看到GA算法對應(yīng)的識別率都比手動方法下的識別率更高,最高可以提升6.75%,因為GA算法更精準(zhǔn)地定位到受試的最優(yōu)節(jié)律增強頻帶.雖然手動方法也可能找到最優(yōu)REB,但往往不夠精準(zhǔn)且會耗費大量的尋找時間,導(dǎo)致分類識別率沒有GA算法的高.對比各個受試者的測試結(jié)果存在不同程度的差異,原因可能與受試者自身采集腦電時的狀態(tài)、采集的次數(shù)(相當(dāng)于訓(xùn)練次數(shù))或當(dāng)天的實驗環(huán)境相關(guān),這些都會影響對3類MI-EEG數(shù)據(jù)的有效分析,但是并不影響筆者特征優(yōu)化方法的有效性.而GA算法并不保證全局最優(yōu)收斂,而只能在一定的約束條件下,實現(xiàn)局部全局最優(yōu)收斂.表3給出了簡要的實驗結(jié)果.
表3不同頻帶約束下的平均識別率%
方法頻帶/HzS1_1S1_2S1_3S1_4S1_5S1_6S1_7S1_8平均值遺傳算法8~1382.5868.4876.0083.6180.7793.9290.8990.0083.288~1282.6468.3974.1483.3680.0493.8890.5389.6682.83手動方法10~1481.5867.9172.2582.8179.5493.7990.1989.5682.20
從表3受試者S1的3類MI-EEG數(shù)據(jù)最高平均識別率看出,雖然不同頻帶約束范圍下的最高平均識別率不同,但是GA算法得到的識別率整體上仍比手動方法得到的識別率高.如S1_1,手動方法的最高平均識別率是81.58%;在GA算法不同頻帶約束范圍下,當(dāng)頻帶約束范圍設(shè)置在8~13 Hz時,對應(yīng)的最高平均識別率為82.58%;當(dāng)頻帶約束范圍為8~10 Hz時,可以得到82.64%的最高平均識別率.可以選擇最高識別率對應(yīng)的頻帶作為后續(xù)處理S1_1數(shù)據(jù)的最優(yōu)REB,同樣S2、S3和S4中也會有此現(xiàn)象.因此,針對不同的受試者,可以設(shè)定合適的頻帶約束范圍來尋求最優(yōu)REB.在相同終止迭代次數(shù)下,雖然頻帶約束范圍越小,頻帶被劃分的更精細(xì),更有可能找到最優(yōu)REB,但是卻縮小了搜索最優(yōu)頻帶范圍,因此得出表3中不同頻帶下的不同大小的識別率,而在頻帶8~13 Hz下的識別率比在頻帶8~12 Hz下的識別率大部分都高,也進(jìn)一步證明了筆者選擇頻帶增量4的合理性.
在手動方法和GA算法下,表4是S2和S4共3類MI-EEG數(shù)據(jù)的組間交叉測試結(jié)果.其中頻點來自3.1節(jié)GA算法下自測試得到的最優(yōu)REB起始頻點.接著確定處理3類MI-EEG數(shù)據(jù)的最優(yōu)REB范圍是該起始頻點到該起始頻點加上增量4,如S2_1對應(yīng)的頻點11.43,則后續(xù)處理MI-EEG數(shù)據(jù)的最優(yōu)節(jié)律增強頻帶為11.43~15.43 Hz.
從交叉測試的結(jié)果也可以得出,不同方法得到的最優(yōu)REB下,筆者特征優(yōu)化方法的分類識別率比手動方法的分類識別率高.其中同一受試者的交叉測試的結(jié)果大部分提高范圍在0.3%~2%之間,而不同受試者的交叉測試結(jié)果大部分提高范圍在2%~4.8%之間.在不同受試者之間的測試結(jié)果更能說明筆者基于ICA的GA的特征優(yōu)化方法尋求最優(yōu)頻帶的可行性.
由表3、4可以總結(jié)出,同一受試者的最優(yōu)頻帶(mu節(jié)律)大致范圍一樣,而不同受試者最優(yōu)頻帶范圍是不一樣的,因此可以定義受試者S2和S4的運動想象mu節(jié)律大致范圍是10~15 Hz和11~16 Hz,同理也可以得到S1和S3的運動想象mu節(jié)律大致范圍.筆者特征優(yōu)化方法得到的mu節(jié)律范圍會比手動更精確,而且識別率也會更高.
表4S2和S4組間交叉測試的平均識別率%
測試集頻點訓(xùn)練集S2_1平均值最高值S2_2平均值最高值S2_3平均值最高值S2_4平均值最高值S2_1手動80.9191.1176.1590.0077.2090.0080.7988.8911.4383.7493.3378.1193.3375.0590.0079.5091.11S2_2手動79.2388.7674.1587.6473.9687.6477.3685.3910.4279.3186.5275.4186.5273.6886.5277.0087.64S2_3手動81.2686.6783.2988.0079.3188.0080.5986.6710.8081.8488.0083.9389.3379.4589.3381.2188.00S2_4手動78.6593.3373.6794.6788.5594.6789.1096.0010.7578.9194.6774.2293.3388.5696.0089.6096.00S4_1手動74.8388.0075.4789.3380.2896.0077.5692.0011.8478.9693.3377.9492.0084.7197.3382.3694.67S4_2手動77.8492.0075.4794.6779.9592.0080.2194.6711.7480.8693.3375.9892.0082.5196.0083.9896.00S4_3手動72.0792.0070.7985.3385.0394.6783.2496.0012.3275.3594.6774.6893.3388.9897.3387.1196.00S4_4手動85.4196.0089.1497.3388.6497.3386.9297.3311.9387.6396.0091.2797.3390.7997.3389.4698.67
GA算法作為一種借鑒生物進(jìn)化規(guī)律的隨機化搜索優(yōu)化方法,為復(fù)雜系統(tǒng)的優(yōu)化提供了一種新方法.它基本不用搜索其他信息,而僅使用適應(yīng)度函數(shù)值來評估個體.筆者的適應(yīng)度函數(shù)的設(shè)計是重點,其定義域可以根據(jù)算法的需要設(shè)定.為了精準(zhǔn)定位每位受試者M(jìn)I-EEG數(shù)據(jù)的最優(yōu)REB,筆者提出了GA與ICA結(jié)合的新方法,不僅證明了ICA設(shè)計的空域濾波器有效性,且其作為預(yù)處理算法有效地發(fā)揮了GA算法的尋優(yōu)性能,增強了運動相關(guān)的EEG節(jié)律,從而提高了3類運動想象的分類識別率.
筆者沒有對ICA空域濾波器設(shè)計的訓(xùn)練樣本進(jìn)行優(yōu)化,而是使用所有單次實驗數(shù)據(jù)設(shè)計濾波器.為了優(yōu)化濾波器的性能,如可以使用連續(xù)10個單次MI-EEG數(shù)據(jù)或識別率排名前10個單次MI-EEG數(shù)據(jù)的拼接作為設(shè)計ICA空域濾波器的樣本,然后再結(jié)合GA算法尋找不同受試者的最優(yōu)REB,考慮其結(jié)果是否與單次設(shè)計的ICA空域濾波器得到的一樣或大致范圍一樣.不同導(dǎo)聯(lián)模式下,最優(yōu)頻帶是否也是一致,將是筆者下一步的工作.