李 松, 伏云發(fā), 陳 健, 張建平
(昆明理工大學 信息工程與自動化學院,云南 昆明 650500)
五種SVM參數(shù)尋優(yōu)識別運動想象腦電比較研究*
李 松, 伏云發(fā), 陳 健, 張建平
(昆明理工大學 信息工程與自動化學院,云南 昆明 650500)
支持向量機(SVM)在腦電(EEG)分類中效果較好,其參數(shù)尋優(yōu)方法直接關系著分類的準確率和所需時間。為了探索參數(shù)尋優(yōu)對分類效果的影響,本文采用了固定參數(shù)尋優(yōu)、直接尋優(yōu)、網(wǎng)格尋優(yōu)、遺傳算法(GA)尋優(yōu)和粒子群優(yōu)化算法(PSO)尋優(yōu)五種參數(shù)尋優(yōu)方法,以BCI Competition IV data 2b數(shù)據(jù)集進行實驗測試,對帶通濾波后的數(shù)據(jù)進行瞬時能量特征的提取,利用五種尋優(yōu)的參數(shù)分類器,得到了9名被試者4~7 s時間內(nèi)數(shù)據(jù)的分類準確率和分類所需時間。在用網(wǎng)格尋優(yōu)和粒子群尋優(yōu)的分類下,被試S4和被試S8的準確率分別高達96.875 %和88.125 %,用時最短為3.059 s。直接尋優(yōu)和固定參數(shù)方法的準確率雖低,但分類用時僅為0.002 s和1.305 s,實時性上,更加適合于應用到在線系統(tǒng)中。
腦電; 腦機交互; 運動想象; 支持向量機; 參數(shù)尋優(yōu)
腦—機接口( brain-computer interface,BCI)技術是一種新型的人機交互技術,這種技術可以讓大腦在不依賴于肌肉的參與,利用中樞神經(jīng)系統(tǒng)的思維活動,通過采集系統(tǒng)將腦活動信號轉(zhuǎn)化為電信號,實現(xiàn)大腦直接與外部設備進行通信與控制[1~3]。
迄今為止,研究者已將多種分類方法運用到左右手運動想象的腦電模式分類中,目前運用最多的是(linear discriminant analysis,LDA)線性判別分析和支持向量機(support vector machine,SVM)進行分類。而尋優(yōu)參數(shù)的SVM能較好地適應運動想象腦電的單次實驗分類[4]。但是目前基于參數(shù)尋優(yōu)的SVM的方法較多,但哪種方法分類效果好,適用于什么樣的環(huán)境,研究較少。本文選取了典型的尋優(yōu)SVM,有固定參數(shù)的SVM、直接尋優(yōu)的SVM、網(wǎng)格尋優(yōu)[5,6]的SVM、遺傳算法(genetic algorithm,GA)尋優(yōu)[7,8]的SVM和粒子群優(yōu)化(particle swarm optimization,PSO)算法尋優(yōu)[9]的SVM作比較分析。固定參數(shù)尋優(yōu),即固定懲罰因子C和核函數(shù)g,例如C為16,g為2的SVM,此種尋優(yōu)方式是直接根據(jù)經(jīng)驗來固定SVM的兩個參數(shù)。直接尋優(yōu)的SVM是讓懲罰因子C和核函數(shù)g都在一個指數(shù)范圍內(nèi)尋找,然后根據(jù)尋優(yōu)準則來求取最高分類率。網(wǎng)格尋優(yōu)的SVM參數(shù)是指將待尋找的參數(shù)在一定空間范圍中劃成網(wǎng)格,需要通過遍歷網(wǎng)格中所有點來尋找最優(yōu)參數(shù),經(jīng)研究分析分類準確率較高。GA屬于啟發(fā)式算法,不需要像網(wǎng)格那樣要遍歷所有的點就可以尋找到最優(yōu)解。而PSO算法,沒有GA操作,粒子具有“記憶”特性,信息共享機制[10]不同等特點,使得它的收斂速度快于GA。
通過以上比較,本文針對BCI Competition IV data 2b的數(shù)據(jù)集,預處理后進行頻帶能量特征提取,然后采用以上幾種尋優(yōu)的SVM參數(shù)的方法對腦電特征進行分類,并做了比較。為后續(xù)的腦電在線分類研究做出進一步的貢獻。
1.1 被試、實驗范式和數(shù)據(jù)采集
本文的實驗數(shù)據(jù)采用由奧地利工業(yè)大學提供的第四屆腦機—接口國際競賽中的2b數(shù)據(jù)集[11]。實驗被試為9名,每名被試進行了5組實驗,包含前2組不帶識別結(jié)果的神經(jīng)反饋和后3組帶識別結(jié)果的神經(jīng)反饋,此次選取了結(jié)果較好的第3組數(shù)據(jù)作為訓練集,第4組數(shù)據(jù)作為測試集。
除了第二名被試的第三組數(shù)據(jù)只有120個trials,其余每組包含160個trials。每個trial持續(xù)時間為9 s左右,前2 s被試保持放松狀態(tài),2 s結(jié)束時,有蜂鳴聲提示被試準備,1 s后,屏幕出現(xiàn)向左或向右的箭頭提示任務,在4~7s內(nèi),被試執(zhí)行想象左手或右手運動任務。而帶識別結(jié)果的神經(jīng)反饋則是在實驗開始的前2 s顯示器呈現(xiàn)一個灰色人形臉提示被試準備實驗,2 s結(jié)束后同樣蜂鳴聲提示,3 s時刻給出任務提示,被試按提示執(zhí)行想象任務,系統(tǒng)會根據(jù)識別結(jié)果給出一個向正確方向移動的綠色笑臉,反之為向錯誤方向移動的紅色苦臉。
試驗范式如圖1所示。所有的實驗數(shù)據(jù)來自C3,Cz和C4三個通道的數(shù)據(jù),三個通道的電極均是雙極導聯(lián),采樣頻率為250 Hz,且數(shù)據(jù)已經(jīng)過0.5~100 Hz模擬帶通濾波和50 Hz的工頻陷波。
圖1 運動想象腦電采集范式
1.2 數(shù)據(jù)預處理和特征提取
研究表明,運動想象誘發(fā)的腦電節(jié)律主要表現(xiàn)在Mu(8~13 Hz)[12],本文首先采用橢圓濾波器進行帶通濾波得到Mu節(jié)律,然后提取采樣點瞬時幅值,按式(1)、式(2)求平均瞬時能量作為特征。提取公式如下
(1)
(2)
1.3 特征分類
1.3.1SVM
SVM[13]基于統(tǒng)計學VC維理論和結(jié)構(gòu)風險最小原理,能較好地解決小樣本、非線性、高維數(shù)等問題。通過非線性變換把樣本空間映射到某個高維空間中的線性可分問題,在高維空間中求線性分類最優(yōu)超平面。在分類時,常遇到線性不可分的問題,可以在約束條件中引入松弛變量,在目標函數(shù)中引入懲罰因子來解決,則分類優(yōu)化問題為
(3)
yi((Xi·W*)+b*)≥1-ξi,i=1,…,N
(4)
松弛變量ξi(ξi>0),ξi用于衡量實際指示值yi與SVM輸出之間的距。其中C為懲罰因子,控制錯分類程度。k(Xi,Xj)=(Φ(Xi),Φ(Xj))為映射函數(shù),把數(shù)據(jù)從原空間映射到高維空間。其核函數(shù)k(xi,xj)滿足Mercer條件且采用徑向基核函數(shù)[14]
K(xi,xj)=exp(-g‖xi-xj‖2),g>0
(5)
式中 參數(shù)g直接影響著SVM分類算法的復雜程度。綜上所述,懲罰因子C和核函數(shù)參數(shù)g是影響SVM分類效果的關鍵因素,因此,可以將C和g作為尋優(yōu)變量[15,16]。
1.3.2 固定參數(shù)尋優(yōu)和直接尋優(yōu)SVM參數(shù)
固定參數(shù)尋優(yōu),即根據(jù)經(jīng)驗固定懲罰因子C和核函數(shù)g,例如C為16,g為2的SVM,此種尋優(yōu)方式是直接根據(jù)經(jīng)驗來固定SVM的兩個參數(shù),也可以是通過其他方法找到最優(yōu)參數(shù)后,針對某個被試直接固定該參數(shù),以縮短分類時間。直接尋優(yōu)的SVM是讓懲罰參數(shù)C和核函數(shù)g都在一個指數(shù)范圍內(nèi)尋找,然后根據(jù)尋優(yōu)準則來求取最高分類率。
1.3.3PSO算法
PSO算法的主要思想為[17]:設粒子群在一個n維空間中搜索,由m個粒子組成種群Z={Z1,Z2,…,Zm},其中每個粒子所處的位置Zi={zi1,zi2,…,zin}都表示問題的一個解。粒子通過不斷調(diào)整自己的位置Zi來搜索新解,每個粒子都能記住自己搜索到的最好解,記做Pid和整個粒子群經(jīng)歷過的最好位置,即目前搜索到的最優(yōu)解,記做vi={vi1,vi2,…,vin}。找到兩個最優(yōu)解后,每個粒子根據(jù)式(6)更新自己的速度
vid(t+1)=wvid(t)+η1rand()(pid-zid(t))+η2rand()
(pgd-zid(t))
(6)
zid(t+1)=zid(t)+vid(t+1)
(7)
式中 vid(t+1)為第i個粒子在t+1次迭代中第d維上的速度,w為慣性權重,η1,η2為加速常數(shù),rand()為0~1之間的隨機數(shù)。對于粒子速度,也可以對其設置界限如下
(8)
研究表明,PSO算法SVM的實質(zhì)是最小化泛化誤差的過程[18]。根據(jù)經(jīng)驗,本實驗中的粒子群尋優(yōu)設定SVM的懲罰參數(shù)C和核函數(shù)參數(shù)g的取值范圍0.1 1.3.4 網(wǎng)格算法 交叉驗證[19](cross validation,CV)常用于網(wǎng)格搜索法中,是一種用于驗證分類器性能的統(tǒng)計方法。在應用中,通常把數(shù)據(jù)均分成K組,把每個子集作一次驗證集,其余K-1個子集作為訓練集,這樣會得到K個分類模型,根據(jù)K個模型得到的分類準確率來評估分類器性能。 網(wǎng)格尋優(yōu)算法的基本原理[20]是把SVM的參數(shù)C和g在給定范圍內(nèi)劃分為網(wǎng)格,遍歷所有點取值,用k倍交叉驗證分類準確率,當遍歷完所有網(wǎng)格點后,得到最高的分類準確率。根據(jù)經(jīng)驗,本文設定SVM的懲罰參數(shù)C和核函數(shù)參數(shù)g的取值范圍均為[2-8,28]。 1.3.5 GA GA[22]模擬了自然選擇和遺傳進化中發(fā)生的繁殖、交配、和突變現(xiàn)象,從任意一個初始種群出發(fā),通過隨機選擇,交叉和變異操作,產(chǎn)生一群新的更適應環(huán)境的個體,使群體進化到搜索空間中越來越好的區(qū)域。不斷繁殖進化,最后收斂到最適應環(huán)境的個體,求得問題最優(yōu)解。 根據(jù)經(jīng)驗,本實驗中GA尋優(yōu)設定SVM的懲罰參數(shù)C和核函數(shù)參數(shù)g的取值范圍分別為0 本實驗研究把上述五種SVM參數(shù)尋優(yōu)方法用于分類左右手運動想象。表1表明,對于被試S4網(wǎng)格參數(shù)尋優(yōu)和粒子群參數(shù)尋優(yōu)最高分類率達96.875 %,從分類所需的時間上看,網(wǎng)格尋優(yōu)耗時短,且遠低于PSO參數(shù)尋優(yōu)。而固定參數(shù)尋優(yōu)分類準確率高達95 %,對于固定參數(shù)尋優(yōu)分類時間,所有被試的分類所需時間遠低于其他尋優(yōu)參數(shù)時間。 表1 分類精度和時間 圖2給出了被試S1~S9的最高準確率和平均準確率。被試S1,S2,S5,S6,S7的所有參數(shù)尋優(yōu)的準確度維持在60 %左右。S8的所有參數(shù)尋優(yōu)分類準確率維持在80 %左右。S3的所有參數(shù)尋優(yōu)分類效果最差,僅在50%左右。 圖2 平均、最高分類準確率 表2呈現(xiàn)了9名被試最高分類準確率時所用的尋優(yōu)方法和最優(yōu)參數(shù)C,g。被試S1和S3采用了GA尋優(yōu),C和g的范圍在[0~100]之間,尋優(yōu)時間很長,高達101.444 s,不適宜在線控制。相比GA,PSO算法尋優(yōu)時間大大縮短。被試S4,S8,S9均采用網(wǎng)格算法尋優(yōu),分類準確率高,耗時短。 表2 分類準確率時的參數(shù) 圖3是典型被試S8的數(shù)據(jù),利用網(wǎng)格尋優(yōu)得到的分類精度與參數(shù)C和g之間的關系結(jié)果顯示??v軸表示交叉驗證下最佳分類準確度,橫軸分別表示對C和g取對數(shù)后的值。最佳的懲罰因子C和核函數(shù)參數(shù)g分別為27.857 6,0.035 897,同時看到最佳的訓練效果是84.375 %。從3D圖中看出分類正確率最高的是淺色線條。 圖3 被試S8的網(wǎng)格尋優(yōu)參數(shù)圖 如圖4(a)所示為采用GA尋優(yōu)SVM的參數(shù)C和g,帶星號曲線表最佳適應度。通過30次迭代,最佳分類精度達到83.75 %,此時的最佳懲罰因子C是66.278 9,核函數(shù)g為5.601 1,持續(xù)到100次迭代。帶圈曲線表示平均適應度逐漸升高,并在80~83持續(xù)波動。 圖4 被試S8的GA尋優(yōu)和PSO算法尋優(yōu)曲線圖 如圖4(b)所示為采用PSO算法尋找SVM的參數(shù)C和g,標星號曲線為最佳適應度。通過接近10次迭代,最佳訓練效果是82.5 %,此時的最佳懲罰參數(shù)C是9.006,核函數(shù)g為0.1,持續(xù)到100次迭代。標圈曲線為平均適應度迅速升高,并持續(xù)在78~80之間波動。 圖5呈現(xiàn)了典型被試S8不同時段四種尋優(yōu)方法的分類準確度。在4~5 s期間分類準確度很低,其原因可能是想象運動從第4 s開始,被試還未完全進入狀態(tài);5~7 s的分類效果好,由此,設計在線系統(tǒng)時可以提取想象開始后延遲1 s的數(shù)據(jù)作為實際處理數(shù)據(jù),也可以考慮采用滑動窗技術提取分類數(shù)據(jù)段,然后投票決策分類結(jié)果。 圖5 被試S8不同時段4種尋優(yōu)方法的分類準確率 本文實驗研究了SVM參數(shù)尋優(yōu)方法識別運動想象腦電分類,比較了5種尋優(yōu)SVM參數(shù)的方法的優(yōu)缺點。固定參數(shù)分類雖然用時最短,從時間上看,最適合用到在線系統(tǒng)中,但參數(shù)難以確定,沒有一定自適應性。其他四種尋優(yōu)方法首先都是給出SVM參數(shù)范圍,然后根據(jù)不同參數(shù)搜索方法尋找最優(yōu)參數(shù),其中,網(wǎng)格尋優(yōu)和直接尋優(yōu)效果較好,用時較短,可以通過縮小尋優(yōu)參數(shù)范圍來縮小搜索時間。PSO算法和GA,雖分類準確率較好,但耗時長,適用于離線分析找出最優(yōu)參數(shù)。本研究可望為優(yōu)化SVM參數(shù)用于運動想象腦電分類及其在線應用提供一些思路。 [1] 高上凱.淺談腦—機接口的發(fā)展現(xiàn)狀與挑戰(zhàn)[J].中國生物醫(yī)學工程學報,2007,26(6):801-809. [2] 陳永華,朱林劍,包海濤,等.一種新型腦電信號的采集方法和應用[J].傳感器與微系統(tǒng),2006,25(3):81-83. [3] 王宇丁,陳民鈾,張 莉.基于傳感器技術的實時腦一機接口設計[J].傳感器與微系統(tǒng),2012,31(12):101-106. [4] Sun Huiwen,Fu Yunfa,Xiong Xin,et al.Identification of EEG induced by motor imagery based on Hilbert-Huang transform[J].Acta Automatica Sinica,2015,41(9):1686-1692. [5] 王健峰,張 磊,陳國興,等.基于改進的網(wǎng)格搜索法的SVM 參數(shù)優(yōu)化[J].應用科技,2012,39(3):28-31. [6] 王興玲,李占斌.基于網(wǎng)格搜索的支持向量機核函數(shù)參數(shù)的確定[J].中國海洋大學學報,2005,35(5):859-862. [7] 連 可,黃建國,王厚軍,等.一種基于遺傳算法的SVM決策樹多分類策略研究[J].電子學報,2008,36(8):1502-1507. [8] 蔣華榮,郁 雪.應用遺傳算法優(yōu)化子空間SVM的分類算法[J].計算機科學,2013,40(11):255-275. [9] 王琳虹,李世武,高振海,等.基于粒子群優(yōu)化與支持向量機的駕駛員疲勞等級判別[J].哈爾濱工業(yè)大學學報,2014,46(12):102-107. [10] 沈 艷,郭 兵,古天祥.粒子群優(yōu)化算法及其與遺傳算法的比較[J].電子科技大學學報, 2005,34(5):696-699. [11] Pfurtscheller G,Neuper C.Event-related synchronization of mu rhythm in the EEG over the cortical hand area in man[J].Neuroscience Letters,1994,174(1)93-96. [12] 楊淑瑩.模式識別與智能計算-Matlab技術實現(xiàn)[M].北京:電子工業(yè)出版社,2011. [13] Keerthi S S,Lin C J.Asymptotic behaviors of support vectormachines with Gaussian kernel[J].Neural Computation,2003,15(7):1667-1689. [14] 李 鋼,王 蔚,張 勝.支持向量機在腦電信號分類中的應用[J].計算機應用,2012,39(3):1431-1436. [15] 李曉宇,張新峰,沈蘭蓀.一種確定徑向基核函數(shù)參數(shù)的方法[J].電子學報,2005,12A(12):2459-2463. [16] 谷文成,柴寶仁,滕艷平.基于粒子群優(yōu)化算法的支持向量機研究[J].北京理工大學學報,2014,34(7):705-709. [17] 邵信光,楊慧中,陳 剛.基于粒子群優(yōu)化算法的支持向量機參數(shù)選擇及其應用[J].控制理論與應用,2006,23(5):740-748. [18] 劉 沖,趙海濱,李春勝,等.腦電信號頻帶能量特征的提取方法及分類研究[J].系統(tǒng)仿真學報, 2012,24(12):2496-2499. [19] 李清毅,周 昊,林阿平,等.基于網(wǎng)格搜索和支持向量機的灰熔點預測[J].浙江大學學報:工學版,2011,45(12):2181-2187. [20] 陳 果.基于遺傳算法的支持向量機分類器模型參數(shù)優(yōu)化[J].機械科學與技術,2007,26(3):347-350. 伏云發(fā),男,通訊作者,博士,副教授,主要從事模式識別與智能控制,腦信息處理與腦控機器人接口方向研究工作,E—mail:840785473@qq.com。 Comparative research of identification of EEG induced by Motor imagery based on five kinds of parameters optimizing SVM* LI Song, FU Yun-fa, CHEN Jian, ZHANG Jian-ping (School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China) Support vector machine(SVM)is preferably applied to the classification of EEG,and the accuracy rate and time of the classification is determined directly by the parameters of SVM.Applied five kinds of methods of parameters optimization,which are fixed parameters,direct optimization,grid optimization,genetic algorithm optimization,particle swarm optimization.This experiment is tested by BCI competition IV data 2b data sets,the first job is to extract the instantaneous energy features of the data which is processed by Band-Pass filter,secondly which are sent to five kinds of classifiers to optimize parameter,accuracy rate of nine subjects and time of classification during 4~7 s are obtained.Both of accuracy rates of the classification are highly achieved to 96.875 % through the grid and particle swarm parameters optimization,and the shortest spending time is 3.059 s.Although the accuracy rate of the classification processed by the direct optimization and fixed parameters is lower,the classification time only needed 0.002 and 1.305 s,in terms of real-time,this method is more suitably applied to online system. EEG; brain-computer interaction; motion imagery; support vector machine(SVM); parameter optimizing 10.13873/J.1000—9787(2017)04—0042—04 2016—06—21 國家自然科學基金資助項目(81470084, 61463024);云南省應用基礎研究計劃資助項目(2013FB026);云南省級人培項目(KKSY201303048);云南省教育廳重點項目(2013Z130);昆明理工大學腦信息處理與腦機交互融合控制資助項目(學科方向團隊建設經(jīng)費) TP 30 A 1000—9787(2017)04—0042—04 李 松(1989-),男,碩士研究生,主要研究方向為腦信息處理和腦機交互控制。2 結(jié) 果
3 結(jié)束語