金松國
(江蘇大學(xué)京江學(xué)院,江蘇 鎮(zhèn)江 212013)
非接觸式界面技術(shù)已被廣泛的應(yīng)用在于殘疾人的通信和交互工具手段。但是,在當(dāng)前的大流行情況下,作為非接觸,非面對面界面的功能似乎也開始發(fā)揮了重要作用。此外,由于近幾年在不斷地研究諸如殘疾人的導(dǎo)航之類的技術(shù)的開發(fā),因此期望通研究過視線追蹤提高非接觸界面技術(shù)。
過去開發(fā)的一些系統(tǒng)是將電極放在臉上以監(jiān)視眼睛的運動的階段[1]。隨著計算機硬件和AI技術(shù)的最新進展,視覺的人機界面(HCI)解決方案變得越來越流行,通過基于面部或面部特征跟蹤的非接觸式HCI[2]開始支持殘疾人。這些解決方案可以提供高精度和低成本,從而減少了用戶與硬件的直接接觸。眼位技術(shù)還應(yīng)用于殘障用戶的應(yīng)用程序,例如眼部鼠標和鍵盤,移動用戶界面(UI)[3,4]和日常生活輔助系統(tǒng)[5]。預(yù)計它將在最近的社會現(xiàn)象中作為控制系統(tǒng)發(fā)揮重要作用。
本文所提出的情境感知多分類器檢測并跟蹤眼睛特征,跟蹤眼睛運動來預(yù)測圖像幀的視線。為穩(wěn)定跟蹤,應(yīng)用了高斯濾波器并對其進行了后處理,采用ASSL來測試各種情況下的眼睛鼠標功能,并在眼睛特征跟蹤中提供了有效的界面功能以進行屏幕上的光標控制。
在本文中,我們提出了一種基于眼睛跟蹤方法的眼睛鼠標系統(tǒng),該方法使用空間情境感知的多區(qū)域識別算法。為了進一步提高準確性,本論文當(dāng)中采用了ASSL方法。本文主要包括以下三部分:眼睛區(qū)域檢測,注視跟蹤和鼠標控制。此外,為提高眼睛區(qū)域檢測的準確性,將所提出的方法應(yīng)用于眼睛區(qū)域檢測單元。本文提出了一種基于情境識別的AdaBoost多域分類器算法,將其作為眼動光標控制的精確定位和檢測方法。輸入圖像時,將執(zhí)行圖像預(yù)處理,并通過應(yīng)用高斯濾波器來消除噪點。并且,通過逐步比較圖像的各個區(qū)域,找到用于凝視跟蹤的眼睛區(qū)域的位置。進而,對于實時凝視跟蹤和光標控制,通過卡爾曼濾波器預(yù)測下一個位置并生成每個特征點的運動矢量,來執(zhí)行眼睛區(qū)域的特征點跟蹤。
對于非接觸式界面的實時凝視跟蹤和光標控制,在檢測到眼睛區(qū)域后,將應(yīng)用卡爾曼濾波器來減少下一幀中眼睛特征元素的搜索時間。眼睛鼠標的性能受跟蹤區(qū)域的大小,匹配模板的大小和復(fù)雜性,預(yù)測的目標特征點的準確性,特征點的速度以及目標特征點的影響。跟蹤區(qū)域的大小是根據(jù)目標跟蹤點的速度來確定的。當(dāng)目標特征點快速移動時,應(yīng)使用較大的跟蹤區(qū)域,相反目標特征點緩慢移動時,應(yīng)使用較小的跟蹤區(qū)域進行估計。在前幾幀中,將目標眼睛特征組件的位置平均,設(shè)置為中性區(qū)域的中心,并獲得該組件的大小和移動速度。當(dāng)在連續(xù)幀中成功識別出眼睛區(qū)域的位置時,系統(tǒng)進入跟蹤階段。當(dāng)估計下一幀中目標眼睛分量的近似位置時,根據(jù)當(dāng)前狀態(tài)向量執(zhí)行該操作,并根據(jù)預(yù)期點的坐標,可將跟蹤區(qū)域縮小為目標對象檢測的關(guān)注區(qū)域。在該系統(tǒng)中,可以提高眼睛區(qū)域的跟蹤速度。
為了實時執(zhí)行有效的實時注視跟蹤功能,首先要檢測眼睛的位置。收集眼睛區(qū)域樣本的數(shù)據(jù)庫,并從眼睛區(qū)域樣本生成特征向量文件。第二是收集樣本數(shù)據(jù)庫,而不是眼睛區(qū)域,以設(shè)置參數(shù)并學(xué)習(xí),通過預(yù)測用于光標指向的眼睛運動的位置來收集訓(xùn)練數(shù)據(jù)。為了學(xué)習(xí)情境感知的多重識別器,創(chuàng)建了1022個正樣本圖像和2000個負樣本(沒有眼睛),其中包括眼睛區(qū)域。圖像包括112個具有擺角的圖像。應(yīng)用ASSL方法通過從訓(xùn)練數(shù)據(jù)集中刪除噪聲樣本來提高準確性。
本文采用菲茨定律分析用戶界面結(jié)果。菲茨定律用于點擊和拖放圖形用戶界面的設(shè)計建模中,以模擬與屏幕指向相關(guān)的速度精度,其中起始對象0與目標對象0相同。用10個測試人員進行了實驗,隨機生成了5個目標對象圖案。目標物體的寬度定義為10、20和30像素。為了簡化測試,目標位置以圓圈形式表示。測試結(jié)果可以看出,目標物體越大,到達時間越短。我們可以計算到達目標物體時的難度。該值顯示了到物體的距離(D)和物體的寬度(W)之間的相關(guān)性。該值可以使用Fitts的ID(Index of Difficulty)難度指數(shù)計算得出。目標對象的圓圈大小越大,難度指數(shù)(ID)越小,圓圈大小越小,ID越大。根據(jù)菲茨定律,距離越短,圓越大,界面越快。表1和表2比較了鼠標指針和眼睛鼠標指針之間的接口速度。
表1 眼睛鼠標的速度
表2 鼠標指針速度
從實驗結(jié)果可以看出,當(dāng)接近對象時,由眼睛鼠標產(chǎn)生的軌跡比常規(guī)計算機鼠標的軌跡相對快,并且有希望用作非接觸界面。
在本文中,提出了一種多眼檢測功能,用于估計視線并基于屏幕光標調(diào)整主動和半監(jiān)督學(xué)習(xí)。本文使用一個多域分類器來估計眼睛區(qū)域,該分類器使用網(wǎng)絡(luò)攝像頭和ASSL算法進行眼睛跟蹤的眼睛情境感知,并應(yīng)用卡爾曼濾波器和高斯模型來提高實時跟蹤性能。實驗結(jié)果證實,它在眼指向方面表現(xiàn)出優(yōu)異的性能,并且難度與目標尺寸成反比。當(dāng)對象的大小較大時,界面響應(yīng)速度會更快,并且可以看到,所提出系統(tǒng)的UI中的指向速度比鼠標跟蹤要快。預(yù)期它不僅可以用作殘疾人的導(dǎo)航系統(tǒng),而且可以用作防御流行病中的重要技術(shù)。