吳 昊 張建海
1(杭州電子科技大學(xué)卓越學(xué)院 浙江 杭州 310018) 2(杭州電子科技大學(xué)計算機學(xué)院 浙江 杭州 310018)
疲勞駕駛、睡眠不足是引發(fā)交通事故的重要誘因之一。在汽車擁有量日漸增多的今天,對駕駛員疲勞狀態(tài)下進行檢測并及時警告對交通安全具有重大的意義與價值[1]。目前,疲勞駕駛監(jiān)測方法主要分為三類:一是直接根據(jù)車輛行駛行為信息進行判斷,具有較強的實用性[2],但準確度不高,并且有較長的滯后性;二是基于視頻分析的駕駛員面部狀態(tài)變化,如睜閉眼狀態(tài)、打哈欠以及頭部姿態(tài)等[3],這類方法準確度高,可操作性強,但易于受駕駛員姿態(tài)、光線等因素影響;三是基于駕駛員生理信號的疲勞監(jiān)測,如通過腦電、心電、眼電等[4],這類方法理論上具有較高的檢測精度,但由于往往需要佩戴復(fù)雜的儀器設(shè)備,信號容易受到干擾且個體之間差異性較大,相關(guān)技術(shù)面臨很大挑戰(zhàn)。近年來,也有研究嘗試通過面部眼肌電信號識別面部狀態(tài)從而對疲勞狀態(tài)進行檢測,比如利用前額肌電對眨眼頻率、打哈欠等狀態(tài)可以實現(xiàn)很高的識別率[5]。肌電信號與腦電相比要明顯得多且個體差異不高,設(shè)備佩戴也方便,因此這種方法引起了廣泛關(guān)注。人在疲勞時眨眼動作會變得緩慢,閉眼狀態(tài)持續(xù)時間明顯增加,因此眼睛狀態(tài)可以作為疲勞檢測的有效指標。雖然基于前額肌電可以對快速眨眼頻率準確檢測,但由于慢眨眼所引起的肌電信號變化很小,目前利用前額肌電仍然無法有效識別。已有研究發(fā)現(xiàn),在睜眼和閉眼狀態(tài)下人的腦電信號存在很大不同,特別是α(8~14 Hz)波段變化尤為明顯[6],因此有學(xué)者利用腦電信號來對閉眼和睜眼狀態(tài)進行識別。Narejo等[7]基于14通道的腦電數(shù)據(jù)使用深度學(xué)習(xí)算法實現(xiàn)了98.9%準確度的眼部狀態(tài)分類。Sahu等[8]基于16通道的腦電數(shù)據(jù)使用增量特征重排序算法實現(xiàn)了最高95.01%準確度的眼部狀態(tài)分類。Li等[9]基于14通道的腦電數(shù)據(jù)發(fā)現(xiàn)α波段功率與眼睛閉合程度呈正線性關(guān)系,但這些工作由于通道數(shù)要求較多,設(shè)備佩戴復(fù)雜導(dǎo)致實用性不高。李凌等[10]通過研究發(fā)現(xiàn),腦電α波段信號雖然在枕葉區(qū)最為活躍,但睜眼和閉眼狀態(tài)下α波在枕葉和額葉的變化都非常顯著。本文嘗試利用前額單通道腦電信號,主要基于α波變化特征來對睜眼和閉眼狀態(tài)進行檢測識別。本文方法的優(yōu)勢是:一方面,前額沒有頭發(fā)覆蓋,信號檢測更為準確,設(shè)備佩戴也更為方便;另一方面,基于單通道數(shù)據(jù)也可以大幅度降低信號采集復(fù)雜度和分析處理計算的強度;本文方法實現(xiàn)的慢眨眼檢測,與前面所述的基于前額肌電的面部狀態(tài)檢測方法結(jié)合可以實現(xiàn)更為精確的疲勞狀態(tài)檢測,有較強的實用性和應(yīng)用價值。
實驗采用g.MOBIlab無線腦電采集系統(tǒng),采樣頻率為256 Hz,通過藍牙傳送數(shù)據(jù),除接地與參考電極外最高可同時支持8通道的數(shù)據(jù)采集,本實驗中只使用其中一個通道。本實驗選擇右前額作為采集部位,皮膚與電極片直接接觸,避免了頭發(fā)的影響,采集數(shù)據(jù)更加準確。如圖1所示,采集電極位于右前額,耳后電極為參考電極與接地電極。
圖1 電極位置示意
被試者為6名在校大學(xué)生,其中女性2人,年齡為21歲-22歲,身體健康,且都為右利手。為確保電極采集數(shù)據(jù)的準確性,被試者均禁止化妝,且于實驗前進行面部清潔,同時在實驗中除要求的慢眨眼動作外盡量避免其他的面部活動及肢體運動。
(1) 閉眼狀態(tài)數(shù)據(jù)采集:由于實際疲勞狀態(tài)下人眨眼動作明顯放緩,睜眼狀態(tài)和閉眼狀態(tài)數(shù)據(jù)相似度較高,為觀察在連續(xù)時間段內(nèi)腦電信號從睜眼過渡到閉眼再返回睜眼的特征變化,實驗采用人為模擬慢眨眼過程來采集閉眼狀態(tài)數(shù)據(jù)。為確保慢眨眼過程中閉眼階段腦電數(shù)據(jù)采集的準確性,采用人為添加標簽的方式,使后續(xù)數(shù)據(jù)截取時保證截取到的為閉眼狀態(tài)下的腦電數(shù)據(jù)。如圖2所示,被試者在打下標簽1后進行約3秒的緩慢閉眼動作,之后保持約3秒的閉眼狀態(tài),在打下標簽2后睜眼,每隔約15秒進行一次慢眨眼模擬,重復(fù)采集30分鐘。最終截取標簽2閉眼結(jié)束之前③區(qū)域的腦電數(shù)據(jù)為閉眼狀態(tài)的腦電數(shù)據(jù)。
圖2 慢眨眼過程波形與標簽示例
(2) 睜眼狀態(tài)數(shù)據(jù)采集:被試者保持睜眼、自然、放松的狀態(tài)坐在椅子上采集數(shù)據(jù),盡量避免肢體運動和面部活動,減少自然眨眼的次數(shù),保持較長的睜眼時間,持續(xù)采集30分鐘。
在手工去除噪聲干擾較大的數(shù)據(jù)后,實驗共采集到閉眼狀態(tài)和睜眼狀態(tài)數(shù)據(jù)各600組,用以后續(xù)的處理分析。
數(shù)據(jù)采集完成后進行50 Hz工頻濾波和5 Hz~100 Hz的帶通濾波[11]。對完成濾波的腦電信號截取合適的數(shù)據(jù)長度以進行后續(xù)的分析。較長的數(shù)據(jù)段有利于提高腦電信號檢測的準確率[12],但也要考慮到疲勞狀態(tài)檢測應(yīng)用中的實時性要求,本文中我們分別截取了1秒、1.3秒和2秒數(shù)據(jù)進行分析。自然眨眼作為腦電信號中最常見的偽跡,睜閉眼過程在腦電信號中會產(chǎn)生較大的波動,對數(shù)據(jù)的影響在10%以上[13-14],對于閉眼狀態(tài)的檢測具有一定的干擾,因此截取的數(shù)據(jù)應(yīng)避開眼肌的運動,故從睜眼前的標簽處往前截取數(shù)據(jù),即圖2所示③區(qū)域中的數(shù)據(jù)作為后續(xù)處理分析的腦電信號數(shù)據(jù)。對照組睜眼狀態(tài)腦電數(shù)據(jù)的截取同樣應(yīng)避免自然眨眼對波形的干擾,在采集的原始腦電數(shù)據(jù)中刪去眨眼偽跡,如圖3所示,保留平穩(wěn)的靜息睜眼狀態(tài)下的腦電數(shù)據(jù)。
(a) 靜息睜眼狀態(tài)的原始腦電波形
由于腦電原始信號在時域幅值的變化極其微弱,因此腦電頻域分析非常重要。選取本文所測腦電數(shù)據(jù)中的一段慢眨眼過程進行頻譜分析,比較睜眼狀態(tài)與閉眼狀態(tài)下腦電信號在頻域的分布情況,如圖4所示,發(fā)現(xiàn)閉眼狀態(tài)下α波段(8~14 Hz)能量有明顯增加,而其他波段能量反而有所下降,所以后續(xù)特征分析及提取以α波段的變化特征為主。
(a) 睜眼狀態(tài)
為驗證α波變化規(guī)律,將該段慢眨眼數(shù)據(jù)通過帶通濾波操作,只保留α波段(8~14 Hz),觀察該波段腦電數(shù)據(jù)幅值在時域的變化。如圖5所示,在開始閉眼前的靜息睜眼狀態(tài)和緩慢閉眼過程中(即標簽1前后),α波的強度較小;待完全閉上眼,處于閉眼狀態(tài)時α波強度有明顯上升且在整個閉眼狀態(tài)時間內(nèi)均保持較高水平;在開始睜眼后(即標簽2后),α波能量逐漸下降并最終回到靜息睜眼狀態(tài)強度。由于睜閉眼狀態(tài)在α波段產(chǎn)生的明顯變化,因此α波信號強度可作為睜閉眼狀態(tài)判別的主要特征。
圖5 慢眨眼過程中α波段能量在時域的變化
實驗所測連續(xù)多段慢眨眼過程在α波段的能量呈現(xiàn)出明顯且規(guī)律的變化。如圖6所示為所測腦電數(shù)據(jù)在連續(xù)時間段內(nèi)α波變化的情況,閉眼動作剛開始階段α波變化較小,在中間階段眼睛完全閉合后α波迅速上升,在閉眼狀態(tài)結(jié)束恢復(fù)為睜眼狀態(tài)后α波又快速下降到正常水平,符合α波從睜眼狀態(tài)過渡到閉眼狀態(tài)的特征。α波段的變化趨勢在連續(xù)多次慢眨眼過程中均有明確體現(xiàn)且辨識度較高,體現(xiàn)了α波特征具備的良好連續(xù)性與適應(yīng)性。
圖6 連續(xù)慢眨眼過程中α波變化趨勢
將實驗采集到的600個閉眼與600個睜眼狀態(tài)數(shù)據(jù)分類組合成訓(xùn)練集和測試集,訓(xùn)練集由400個閉眼數(shù)據(jù)和400個睜眼數(shù)據(jù)組成,測試集由200個閉眼數(shù)據(jù)和200個睜眼數(shù)據(jù)組成。影響本次實驗睜眼狀態(tài)與閉眼狀態(tài)檢測結(jié)果的因素主要有三:數(shù)據(jù)段截取長度,分類算法的選擇和提取的特征。考慮到截取數(shù)據(jù)段較長時腦電信號特征較為明顯,同時本次模擬實驗以及實際疲勞狀態(tài)下慢眨眼過程中閉眼狀態(tài)持續(xù)時間有限,采用256數(shù)據(jù)點(1秒)、350數(shù)據(jù)點(約1.3秒)和512數(shù)據(jù)點(2秒)這三種截取長度分別對數(shù)據(jù)進行測試。由于睜眼與閉眼為二元對立狀態(tài),因此分類算法選擇支持向量機SVM和決策樹Tree這兩種對于線性問題具有較好分類效果的算法進行分類。由于兩種狀態(tài)下腦電信號的時域變化不顯著,頻域能量分層明顯,故特征提取以頻域為主兼顧時域;并且由于睜眼與閉眼狀態(tài)不同造成的腦電信號α波段的變化明顯,故特征提取以α波段為主兼顧其他波段。β波段(14~30 Hz)作為與人體興奮與警覺度相關(guān)的腦電波段,常與α波段一起進行腦電信號的對比分析[15]。同時我們對各種情況進行了分析對比。
1) 基于α波段特征。α波能量在閉眼狀態(tài)有明顯提升,因此該波段能量峰值、峰值頻率等均為有效特征;同時由于α波變化在閉眼過程中具有連續(xù)性,因此時域特征也具有一定價值。具體提取的特征為:α波段能量和、峰值能量、峰值頻率、峰值能量與頻率乘積、中值頻率、平均頻率、時域絕對值總和、峰值、谷值、峰谷差值、整體能量和、平均能量和、方差,共13個?;谠撎卣髟诓煌厝¢L度與分類算法下的實驗準確率結(jié)果如表1所示。兩種分類算法SVM與Tree均取得了較高的準確率,其中SVM算法效果更好。并且隨著截取長度的增加,在相同條件下準確率略有上升,與預(yù)期相符,腦電信號作為較微弱的生物電信號,在較長時間間隔內(nèi)的變化更加明顯與突出。
表1 α波段特征準確率
2) 基于β波段特征。β波段作為腦電信號分析的重要波段,由睜眼狀態(tài)轉(zhuǎn)化為閉眼狀態(tài)時能量略微有所下降,如圖7所示。為與α波段特征分類效果對比,采用與α波段相同特征,具體為:β波段能量和、峰值能量、峰值頻率、峰值能量與頻率乘積、中值頻率、平均頻率、時域絕對值總和、峰值、谷值、峰谷差值、整體能量和、平均能量和、方差,共13個。該特征在不同截取長度與分類算法下的實驗準確率結(jié)果如表2所示。對比α波段與β波段相同類別特征下的準確率結(jié)果,發(fā)現(xiàn)α波段效果明顯優(yōu)于β波段,與頻譜圖中α波上升顯著而β波段變化不明顯對應(yīng),體現(xiàn)了α波段變化特征在判別睜閉眼狀態(tài)時的準確性與實用性。
表2 β波段特征準確率
(a) 睜眼狀態(tài) (b) 閉眼狀態(tài)圖7 睜眼與閉眼狀態(tài)下腦電β波段頻譜對比
3) 加入α波段與β波段比值特征。從圖4和圖7中可以看出與α波段相反,β波段在閉眼后會有所下降,因此考慮將β波段與α波段的能量比值作為特征。使用準確率較高的512點截取長度與SVM算法,測試加入α、β波段能量和比值與峰值比值后各波段特征的準確度以及相比于原來單一波段特征的提升程度,所得結(jié)果如表3所示。由于在睜眼狀態(tài)轉(zhuǎn)變?yōu)殚]眼狀態(tài)后,α波明顯上升,β波略微下降,兩波段相關(guān)特征的比值放大了原本單一波段的特征效果,與原本準確度較低的β波段特征相結(jié)合后分類效果得到了明顯優(yōu)化,同時比值自身作為特征也可達到較高的準確率。在檢測睜閉眼狀態(tài)這一問題上,使用不同波段的比值特征能夠在使用較少特征數(shù)的情況下達成較好的分類結(jié)果。本實驗采用SVM分類算法和512點截取長度,在使用α波段特征以及兩波段比值特征的情況下,達到了87.9%的準確率,實現(xiàn)了較好的睜閉眼狀態(tài)分類效果。
表3 α波段與β波段特征結(jié)合(%)
本文提出了一種基于前額單通道腦電信號檢測睜閉眼狀態(tài)的方法。通過腦電信號的頻域分析發(fā)現(xiàn)前額腦電波在睜閉眼不同狀態(tài)下會有所變化,α波會顯著升高,其他多個波段有所下降。通過提取α波段時頻域特征,并加入α波段與β波段比值特征,采用SVM分類器,睜閉眼狀態(tài)檢測準確率達到了87.9%。相較于以前的研究,本文所提方法只需要1個腦電通道,且位于前額位置,沒有頭發(fā)覆蓋,易于操作,極大提高了方便性和實用性;同時該方法具有較高的檢測準確率,能夠根據(jù)腦電信號快速準確地判別睜閉眼狀態(tài)。本文與已成熟的基于前額肌電的面部狀態(tài)識別(眨眼頻率、打哈欠等)相結(jié)合,可以顯著提高疲勞狀態(tài)檢測的有效性和可靠性。