關(guān)鍵詞:個體差異;個體敏感度;眼動特征;疲勞駕駛
目前,疲勞駕駛引發(fā)的交通事故占總交通事故比例已達到15%~20% [1]。為了降低因疲勞引發(fā)的交通事故,研究者們采用了多種方法來檢測駕駛員的疲勞狀態(tài)。由于疲勞發(fā)生時,駕駛員會出現(xiàn)持續(xù)睜眼時間縮短、眨眼頻率變快等現(xiàn)象 [2],因此,研究者們常采用眼部特征來進行疲勞檢測。例如,牛清寧等人利用眨眼頻率、Perclos、注視方向和注視時間來建立疲勞檢測模型,其檢測率達到83.84% [3];劉志強等人采用Per?clos 和眼睛焦點位置構(gòu)建疲勞檢測模型,檢測率為83.92% [4]。這些研究結(jié)果表明,利用眼部特征可以有效進行疲勞檢測。
查閱基于眼動特征的疲勞檢測相關(guān)文獻發(fā)現(xiàn),單位時間內(nèi)眼睛閉合的百分比Perclos(Percentage of Eye?lid Closure over the Pupil over Time) 、眨眼時間均值、眨眼頻率、瞳孔直徑是研究者常用的眼動特征指標。在疲勞檢測研究中,研究者發(fā)現(xiàn),個體差異對疲勞特征指標的選取和疲勞檢測精度存在顯著影響。胥川等人發(fā)現(xiàn),考慮個體差異可以提高疲勞模型的檢測精度[5];吳超仲等人發(fā)現(xiàn),疲勞指標的有效性會受到個體差異的影響[6]。
為了降低個體差異對疲勞檢測率的影響,研究者們從優(yōu)化檢測模型和選取有效疲勞特征兩方面進行嘗試。方法包括:建立小樣本個性化駕駛疲勞檢測模型[7];利用個性參數(shù)構(gòu)建自適應(yīng)檢測模型[8];對聚類后的駕駛?cè)巳航⒏髯云谧R別模型,再將各模型加權(quán)得到最終疲勞識別模型[9];以及構(gòu)建與注視分布變異系數(shù)有線性關(guān)系的駕駛疲勞度作為疲勞檢測指標[10]。這些研究在一定程度上解決了個體差異對疲勞檢測模型的影響,但有些研究由于實驗人數(shù)的增多變得過于復(fù)雜,有的則遺漏了常用的眼動疲勞特征。
本文借鑒了研究者在駕駛行為和腦電信號中關(guān)于個體差異性的研究成果,參考吳超仲等人提出的基于汽車轉(zhuǎn)向特征指標的個體差異敏感度,首先選取常用的眼動疲勞特征,然后計算這些眼動疲勞特征的個體差異敏感度,篩選出個體差異敏感度最小的眼動特征以建立疲勞檢測模型;然后通過模型的檢測率和穩(wěn)定性來分析模型性能與眼動特征的個體差異敏感度之間的關(guān)系。
1 疲勞駕駛實驗
1.1 實驗平臺和實驗過程
實驗的目的是采集受試者在模擬駕駛時,處于清醒和疲勞兩種狀態(tài)下的眼動數(shù)據(jù)。按照實驗要求,實驗選擇了23名年齡在21~23歲且具有合法駕照的大學生作為受試者。受試者頭戴眼球追蹤儀在模擬駕駛器上進行模擬駕駛。圖1(a) 顯示了受試者頭戴眼球追蹤儀正在駕駛汽車模擬器,該模擬器由北京中商聯(lián)合教學設(shè)備有限公司研制。圖1(b) 顯示了Er?goneers公司的Dikablis頭戴式眼球追蹤儀。其中,B 攝像頭負責獲取受試者左眼的眼動數(shù)據(jù),A攝像頭負責獲取受試者正前方顯示屏上的視頻數(shù)據(jù),C點放置在駕駛員的鼻梁上。獲取的眼動數(shù)據(jù)及視頻數(shù)據(jù)傳輸?shù)紻-lab軟件,由D-lab軟件計算Perclos、掃視長度等眼動指標數(shù)據(jù)。為了讓受試者快速進入疲勞狀態(tài),實驗的模擬駕駛環(huán)境選擇了高速公路。實驗時間設(shè)置在下午2:00。實驗開始前,受試者試駕5分鐘。5分鐘后,實驗員開始采集眼動數(shù)據(jù),采集時間為60分鐘。實驗結(jié)束后,將前10分鐘的眼動數(shù)據(jù)定為清醒狀態(tài)數(shù)據(jù),最后10分鐘定為疲勞狀態(tài)數(shù)據(jù)。
1.2 眼動特征指標的選取
本文參考了其他研究者及作者以往的研究[11-12],選取了Perclos、瞳孔直徑以及眨眼時間均值(zy_time) 這三個常用的眼動特征指標??紤]到每個人的瞳孔大小差異較大,本文選用瞳孔直徑變異系數(shù)(CVPLD,Coeffi?cient of Variation of Pupil Diameter) 作為眼動特征指標。瞳孔直徑變異系數(shù)CVPLD的計算公式如下:
其中,PLD_std為瞳孔直徑的標準差,PLD_mean 為瞳孔直徑的平均值。由于實驗中個別駕駛員的數(shù)據(jù)存在缺失和偏差的問題,本文選取了19個受試者的駕駛實驗數(shù)據(jù)。為了判斷這19個受試者的數(shù)據(jù)在統(tǒng)計分析結(jié)果上是否具有可靠性和代表性,本文采用了Python的statsmodels庫來計算實驗所需的樣本量。分別設(shè)置效應(yīng)量為0.8,顯著性水平為0.05,統(tǒng)計功效參數(shù)為0.8,計算結(jié)果表明所需樣本量為14人。因此,本實驗的樣本人數(shù)在統(tǒng)計上可以保證結(jié)果的可靠性和代表性。本文設(shè)置各眼動特征指標的分段周期為1分鐘,因此,獲取的各眼動特征樣本數(shù)為380個。其中,清醒狀態(tài)樣本190個,疲勞狀態(tài)樣本190個。
2 方法
2.1 Kruskal-Wallis 檢驗
Kruskal-Wallis (KW) 檢驗是一種用于比較三個或更多獨立樣本的非參數(shù)檢驗方法。該檢驗基于對所有樣本的秩次進行比較,而不是直接對原始數(shù)據(jù)進行比較。它不需要假定數(shù)據(jù)來自正態(tài)分布,因此適用于非正態(tài)分布的數(shù)據(jù)。KW檢驗采用H 統(tǒng)計量,其定義如下:
式中,k 是組數(shù),N 是總樣本數(shù),Rj是第j 個樣本的秩和,nj是第j 個樣本的樣本值。假設(shè)有k 個相互獨立的簡單隨機樣本(X1,...,Xni) (i=1,...,k),對k 組樣本進行KW檢驗的步驟如下:
1) 確定假設(shè)。零假設(shè)H0:k做獨立樣本的分布是相同的。備擇假設(shè)H1:至少有一個獨立樣本的分布與其他樣本不同。
2) 將k 組樣本的所有觀測值合并為一個組合樣本,然后按遞增順序排列。
3) 排序后的值用秩次替代。將最小值的秩次設(shè)置為1,第二小的值的秩次設(shè)置為2,依此類推。
4) 計算各組的秩和,繼而計算H值。
5) 根據(jù)樣本量和顯著性水平(一般α= 0.05)確定臨界值。如果H>臨界值,則拒絕零假設(shè)H0,即各組的分布不完全相同;如果H≤臨界值,則不能拒絕零假設(shè)H0。
2.2 個體差異敏感度計算
本文通過個體敏感度來量化眼動特征的個體差異性大小。為了區(qū)分單個受試者和雙受試組合的H統(tǒng)計量,將單個受試者進行Kruskal-Wallis(KW) 檢驗的H統(tǒng)計量標記為Hd,雙受試組合進行KW檢驗的H 統(tǒng)計量標記為Hs。眼動特征的個體敏感度計算過程如下:
1) 逐一對每個受試者在清醒和疲勞駕駛狀態(tài)下的眼動數(shù)據(jù)進行KW檢驗,得到每個受試者的P 值和H 統(tǒng)計量Hd。在所有P<0.05的受試者中,選擇Hd最大的受試者(Hdmax) 作為指標最優(yōu)受試者。
2) 將最優(yōu)受試者逐一與其他受試者組成雙受試組合,計算兩受試指標個體差異度Cy。Cy的公式為:
式中:Stm和 Stf分別為清醒和疲勞時兩受試間秩的總方差;Sam和 Saf分別為清醒和疲勞時兩受試間秩的組間方差;Mz和Mq分別為最優(yōu)受試者和某一其他受試者在兩種駕駛狀態(tài)下指標中位數(shù)的差值;Hdz和 Hdq分別為最優(yōu)受試和某一其他受試的H 統(tǒng)計量。
3) 對雙受試組合兩種駕駛狀態(tài)下的眼動數(shù)據(jù)進行KW檢驗,計算雙受試組合H 統(tǒng)計量(Hs)。
4) 為了分析雙受試指標計算出來的多組H 統(tǒng)計量Hs和相對應(yīng)的Cy,值的關(guān)系,這里采用加權(quán)最小二乘法擬合直線進行線性擬合,擬合方程為Hs=kCy+b。其中,k 的絕對值表示指標個體差異敏感度。
3 結(jié)果與分析
3.1 不同狀態(tài)下的眼動指標的個體差異性
首先,對受試者在清醒狀態(tài)和疲勞狀態(tài)下的眼動特征數(shù)據(jù)的均值進行比較,比較結(jié)果如圖2所示。
從圖2中可以看出,大部分受試者在疲勞狀態(tài)下的眼動特征均值都大于在清醒狀態(tài)下的眼動特征均值。然而,每個受試者的眼動指標均值變化幅度是有差異的。例如,在兩種狀態(tài)下,Perclos均值變化幅度最大的是編號為9的受試者,而zy_time均值變化幅度最大的是編號為7的受試者。這說明受試者的眼動指標均值變化存在個體差異性。
為了進一步分析眼動指標在不同駕駛狀態(tài)下的具體差異程度,本文對每個受試者在清醒和疲勞狀態(tài)下的三個眼動特征數(shù)據(jù)進行了KW檢驗,檢驗結(jié)果如表1所示。
表1顯示,不同狀態(tài)下同一眼動特征的差異性因人而異,存在個體差異。例如,對于Perclos指標,只有9個受試者在不同狀態(tài)下的數(shù)據(jù)存在明顯差異,并且H統(tǒng)計值也是不同的。其中編號為9的受試者的H值最大。在計算個體敏感度時,該受試者被指定為Per?clos指標的最優(yōu)受試者。同理,表1中zy_time指標的最優(yōu)受試者為編號16的受試者,CVPLD指標的最優(yōu)受試者為編號12的受試者。
由于指標在不同受試者之間的一致性是評估指標有效性的一個因素,因此本文對清醒(疲勞)狀態(tài)下所有受試者的同一眼動特征數(shù)據(jù)進行了KW 檢驗。如果p<0.05,則表示不同受試者的特征數(shù)據(jù)存在較明顯差異,總體分布不同;反之,則表示不同受試者的特征數(shù)據(jù)不存在明顯差異,總體分布相同。表2顯示了所有受試者在清醒(疲勞)狀態(tài)下眼動特征數(shù)據(jù)的KW 檢驗結(jié)果。
表2中,兩種狀態(tài)下每個眼動特征的p 值都小于0.05。因此,不同受試者各眼動特征的總體分布均不同,存在明顯的差異,并且統(tǒng)計量H 越大,說明指標的差異越大;H 越小,指標的差異越小,指標的一致性就越好,指標的有效性受個體差異影響就越小。表2結(jié)果顯示,在清醒(疲勞)狀態(tài)下的眼動指標Perclos的H值都是最小的,因此Perclos指標的差異也是最小的。這與胥川等人的研究結(jié)果[5]一致。
3.2 各指標的個體差異敏感度分析
分別計算Perclos、zy_time以及CVPLD三個眼動特征的個體差異敏感度。此處采用加權(quán)最小二乘法進行線性擬合。為了優(yōu)化直線的擬合效果,本文通過最小二乘回歸獲取權(quán)重矩陣。首先,通過最小二乘估計得到隨機誤差項的近似估計量,將隨機誤差項平方的倒數(shù)作為權(quán)重,這樣可以降低誤差較大樣本對估計的影響。三個眼動特征的個體差異敏感度直線擬合效果如圖3所示。
圖3中每個子圖的橫坐標都為Cy,縱坐標都為Hs??梢钥闯觯瑘D中每個子圖中的Cy和Hs都是負相關(guān)的,Hs值隨Cy值的增大(減小)而減?。ㄔ龃螅?。但每個子圖中的Hs隨Cy變化的速度不同。這一點與吳超仲等人的研究結(jié)果[6]吻合。表3顯示了各眼動特征的擬合直線方程及直線的線性擬合度,其中擬合直線斜率的絕對值即為眼動特征的個體敏感度。
直線斜率絕對值越小,個體差異敏感度越小,Hs隨個體差異Cy增加下降的速度越慢,Hs受個體差異Cy變化的影響就越小。即指標的有效性受到個體差異的影響越小。表3中顯示,直線斜率絕對值從小到大的順序依次為:Perclos、CVPLD、zy_time。因此,Per?clos的個體差異敏感度最小,其識別有效性受個體差異的影響最小。
3.3 疲勞檢測模型的性能分析
為了檢驗基于眼動特征的疲勞檢測模型性能是否與眼動特征個體差異敏感度有關(guān),本文采用了SVM 分類算法建立了7個檢測模型。這些模型的疲勞特征依次為單特征Perclos,zy_time,CVPLD;雙特征(兩個特征的組合)per_zy,per_CVPLD,zy_CVPLD;三特征(三個特征的組合)per_zy_CVPLD。為了檢測各模型的檢測穩(wěn)定性,受試者人數(shù)依次從1逐步增加到19 個。圖4顯示了各檢測模型的識別率均值及模型檢測率的方差分析情況。
其中,模型檢測率的方差代表模型檢測率的變化幅度,方差越小則模型的檢測穩(wěn)定性越好。從圖4中可以看出,為了分析雙受試指標計算出來的多組H統(tǒng)計量Hs和相對應(yīng)的Cy值的關(guān)系,這里采用加權(quán)最小二乘法擬合直線進行線性擬合,因此,眼動特征的個體差異敏感度可以作為選擇疲勞特征的參考。本文的研究結(jié)果為Perclos指標的有效性提供了一定的理論依據(jù)。
4 結(jié)論
在研究眼動疲勞特征的選取問題時,研究者發(fā)現(xiàn)個體差異對疲勞檢測具有一定的影響。為了減少個體差異對疲勞檢測模型的影響,本文采用個體差異敏感度來量化眼動特征受個體差異影響的大小,并從檢測模型的檢測率和穩(wěn)定性來評估參考個體差異敏感度選擇眼動特征建立的檢測模型性能。首先,本文研究發(fā)現(xiàn)眼動指標的數(shù)據(jù)不僅在同一駕駛狀態(tài)下存在個體差異性,而且從清醒到疲勞狀態(tài)的變化過程中也存在個體差異性。其次,通過個體敏感度量化眼動特征受個體差異的影響大小,并比較不同個體敏感度的眼動指標建立的檢測模型的檢測率均值和檢測穩(wěn)定性,發(fā)現(xiàn)選擇個體敏感度較小的眼動指標有可能建立一個較穩(wěn)定且檢測率較高的疲勞檢測模型。
當然,本文僅考慮了常用的三個眼動指標,未來還將對更多眼動指標進行類似的研究,以便量化更多眼動指標受個體差異的影響大小,從而進一步為眼動指標的有效性提供理論依據(jù)。