林紹輝,陳水利,吳云東
(集美大學理學院,福建廈門361021)
虹膜作為眼睛的重要組成部分之一,它的準確定位關系到人眼定位和駕駛員疲勞檢測[1-2].當前,虹膜定位已成為當今國內外學者研究的熱點.Daugman[3]提出的圓形檢測算子和Wildes[4]提出的基于邊緣檢測和Hough變換的虹膜定位算法是常用的兩種經典的虹膜定位算法,由于這兩種算法均需在三維空間內進行大范圍的搜索,故定位速度較慢.為了克服此缺點,馮薪樺等人[5]提出了一種新的虹膜粗定位方法,該方法能有效提高定位精度,但需要用到特殊的虹膜采集儀器,不便于推廣使用.近年來,劉念等人[6]提出了基于Hough變換圓檢測的人眼定位改進方法,先通過灰度積分投影的方法粗定位人眼,然后采用“最小外接矩形法”估算待檢測圓的圓心和半徑,最后運用Hough變換檢測圓的方法精確檢測出虹膜,該算法定位精度較高,但定位速度較慢.
1981年Fischler和Bolles[7]從魯棒性幾何模型擬合技術出發(fā)提出了RANSAC算法,該算法首先采用隨機選擇輸入數據的最小集的方法構造模型,然后根據事先設定好的內點標準 (比例)驗證生成模型.由于RANSAC利用隨機方法生成模型,并且在模型生成過程中沒有利用歷史模型的信息,因此存在大量的重復計算.1987年Rousseeuw和Leroy[8]提出了Least Median Squares(LMS)算法,該算法致力于對所有數據進行擬合,目的是使殘差平方總和最小,因此對噪聲數據非常敏感.2005年,Chum等人[9]提出了PROSAC算法,Tordoff等人[10]提出了Guided-MLESAC算法,這些算法能加快模型的生成速度,但是,取樣的方式僅僅是依靠先驗的內點概率,并沒有進行條件取樣,因此沒有進一步提高算法的有效性.2011年,Chin等人[11]提出了多結構模型快速生成算法,該算法通過數據對模型的殘差信息評價數據之間屬于同一結構的相似度,進而利用條件概率方法指導采樣向最優(yōu)的模型方向迭代.該算法的采樣速度、采樣精度、潰點以及魯棒性比PROSAC算法和Guided-MLESAC算法有較大的提高.但是,該算法還尚未應用到虹膜定位領域.因此,本文擬提出基于多結構魯棒估計的虹膜外邊緣定位方法,并且提出了模型局內點的判斷標準和有效模型滿足的條件,以期縮短有效模型生成時間,并且達到較高的準確率.
多結構模型快速生成算法是一種魯棒性估計方法,該算法首先通過計算數據點對模型的殘差,得到殘差排序信息;然后構造數據點的相似函數,評價數據之間屬于同一結構的相似度;最后利用條件概率選擇采樣點,構造新模型,當產生一定數量的新模型后,將其融入原模型集,再利用條件概率指導采樣向最優(yōu)的模型方向迭代.
利用殘差排序和相似函數,可以用來指導模型取樣,主要采用條件概率的方法選取特征點,從而構造優(yōu)化的模型.
已知隨機M個模型{θ1,…,θM},根據公式 (1)計算各個數據之間相似度,隨機選擇第一個數據點s1.在此基礎上,通過條件概率P1(i)取第二個數據點s2,則
其中,f是相似函數,α1是歸一化因子,保證P1(i)是一個有效的離散條件概率分布,則第二個數據點的選擇概率依賴于P1,即s2~P1.
同理,假設選擇每個點都是獨立的,根據貝葉斯原則,后續(xù)點的選取有賴于與被選中點之間的概率乘積.即
本文采用P.Viola和M.Jones[12]提出的AdaBoost算法檢測人臉.考慮到人的頭部傾斜,應適當擴大人眼區(qū)域.假設人臉高度為1,則將人眼大致區(qū)域設定為0.5~0.8之間.
為了得到眼睛區(qū)域的邊緣信息,本文采用Canny邊緣檢測方法[13],該方法基本原理是根據對信噪比與定位乘積進行測度,得到最優(yōu)化逼近算子,該方法屬于先平滑后求導數的方法.本文將其中的雙閾值設置為T1=0.2,T2=0.5,使得到的完整虹膜外邊緣較為明顯.
通過Canny邊緣檢測得到二值圖像后,將該二值圖像邊緣點作為實驗數據集,首先在數據集上隨機選取b個最小p-子集,由于需要估計的虹膜外邊緣的模型是圓,故只需選取不共線的三點作為最小子集,因此p取值為3.在得到b個原始模型后,利用多結構模型快速生成算法的基本原理,不斷地更新模型,找到其中局內點數最多的兩個模型.判斷是否是模型的局內點的標準如下:
其中,(x,y)為二值化圖像數據點,(a,b)為模型的圓心坐標,r為模型的半徑.由于人眼區(qū)域兩個虹膜外邊緣之間有一定的距離.要得到這兩個準確模型需要滿足的條件是
其中,(a1,b1),(a2,b2)分別是兩個模型的圓心坐標,r1是擊中局內點數最多的模型的半徑.所得到的結果如圖1所示.
圖1 虹膜外邊緣定位結果Fig.1 Location of outer edge of iris
具體步驟如下:1)輸入已經用Adaboost算法提取到的人臉圖像;2)提取眼睛區(qū)域并利用Canny算法提取邊緣信息;3)結合Multi-GS算法,其中,數據集X是眼睛區(qū)域邊緣,生成模型Θ;4)根據公式 (4),在生成的模型中選出擊中局內點數最多的模型θ1;5)根據公式 (4),選出擊中局內點數僅次于θ1的模型θ2;6)判斷兩個模型是否滿足公式 (5),若滿足條件則算法停止,否則,舍去擊中內點數較小的模型θ2,返回5).
多結構模型快速生成算法 (Multi-GS)如下:
1:輸入數據集X、需要的總模型個數T、最小子集p的大小和改變窗口大小的模型個數b.
2:輸出模型Θ.
3:for M=1,2,…,T do.
4: if M≤b then.
5: 隨機取樣p個數據點并且存儲在S中.
6: else.
7: 隨機選擇第一個點s1并賦初值S={xs1}.
8: for k=1,2,…,(p-1)do.
9: 利用a(i),h和S中的數據,創(chuàng)建公式sk+1~Pk.
10: 根據Pk,取樣sk+1.
11: 取樣點加入到S.
12: end for.
13: end if.
14: Θ =Θ∪{從S中得到的模型}.
15: 加入到絕對殘差r(i)中,計算新模型的殘差.
16: if M≥N&&mod(M,b)=0 then.
17: 排序所有的殘差r(i),得到排序a(i).
18: 改變h,h= [αM],0.05≤α≤0.4.
19: end if.
20:end for.
21:return Θ.
本文采用Matlab 2009b作為仿真平臺,對本文提出的基于多結構魯棒估計的虹膜外邊緣定位方法進行了編程實現.本文限制模型生成時間t=1 s,模型個數上限T=25 000個,窗口大小與模型總數的比例系數α=0.1,改變窗口大小的模型個數b=10.實驗中選取200幅有單人臉的網絡圖像作為測試圖像,這些圖像包括150幅虹膜輪廓完整圖像和50幅虹膜輪廓殘缺圖像,為了能夠獲取虹膜輪廓,這些圖像都是近距離拍攝的.通過對這些圖像進行虹膜外邊緣定位測試,與傳統(tǒng)的RANSAC模型生成算法和Hough變換方法相比,本文提出的方法不僅能有效且準確地定位虹膜外邊緣,而且有效模型生成的時間都有明顯縮短.部分圖像定位結果如圖2所示.
從圖2 a(2)圖像的虹膜外邊緣定位結果可以分析出,采用Multi-GS方法和Hough變換方法都能準確定位出虹膜外邊緣,而采用RANSAC模型生成算法,有一只眼睛的虹膜外邊緣定位出現偏差.另外,從圖2 a(3)圖像的虹膜外邊緣定位結果可以得出,不論使用本文提出的基于多結構魯棒估計 (Multi-GS)的虹膜外邊緣定位方法,還是使用RANSAC模型生成算法、Hough變換方法,定位結果均不準確,其主要原因是眼睛區(qū)域邊緣較為復雜,局內點數的所占比例太小,導致生成的模型不準確.具體的虹膜外邊緣定位方法定位精度對比,如表1所示.
表1 不同虹膜外邊緣定位方法的精度對比Tab.1 Accurate comparison of different Iris location method for outer edge
圖2 不同虹膜外邊緣定位方法的結果Fig.2 the results of different iris location method for outer edge
從表1中可以得出,本文基于多結構魯棒估計 (Multi-GS)的虹膜外邊緣定位方法,無論從定位精度還是時間消耗上都比傳統(tǒng)的RANSAC模型生成算法和Hough變換方法要優(yōu)越.Multi-GS方法利用條件概率方法指導采樣,能夠有效地利用歷史模型的信息,不斷地向最優(yōu)模型方向迭代,加快了有效模型生成速度,縮短了有效模型的耗時.而RANSAC方法每次迭代都利用隨機取樣,沒有利用歷史模型信息,相應地增加了產生有效模型的迭代次數,因此該算法降低了定位精度和延長了產生有效模型的時間.Hough變換方法中,通過尋找累加器的峰值點坐標確定虹膜外邊緣,然而累加器是一個三維向量,導致產生有效模型的耗時大大增加.另外,實驗結果也表明,就算只見虹膜輪廓一部分,本文提出的算法也能準確定位虹膜外邊緣.
本文在Adaboost檢測人臉區(qū)域的基礎上,提出基于多結構魯棒估計的虹膜外邊緣定位方法.通過與經典RANSAC模型生成算法和Hough變換方法相比較,本文的方法不僅縮短有效模型的生成時間,而且提高了定位準確率,在200幅單人臉的圖像數據集上,定位精度達到94%.虹膜外邊緣的準確定位可為人眼定位和駕駛員的疲勞檢測系統(tǒng)的實現提供一定的理論基礎.
本文提出的算法尚未在人眼區(qū)域邊緣較復雜和只包含少數局內點數的人臉圖像中準確定位虹膜外邊緣,未來的工作方向將致力于尋找能更好地解決此問題的虹膜外邊緣定位方法.
[1]江水郎.基于視覺的駕駛員疲勞狀態(tài)檢測方法研究[D].上海:上海交通大學電子信息與電氣工程學院,2008.
[2]倪小鵬.基于視覺的駕駛員疲勞狀態(tài)檢測方法研究[D].上海:華東理工大學機械與動力工程學院,2012.
[3] DAUGMAN J G.High confidence visual recognition of persons by a test of statistic independence [J].IEEE Transactions on Pattern Analysis and Machine intelligence,1993,15(11):1148-1161.
[4] WILDES R P.Iris recognition:An emerging biometric technology[J].Proceedings of the IEEE,1997,85(9):1348-1363.
[5]馮薪樺,丁曉青,方馳,等.虹膜內外邊界的粗定位方法[J].清華大學學報:自然科學版,2007,47(1):80-83.
[6]劉念,蘇杭,郭純宏,等.基于Hough變換圓檢測的人眼定位方法改進 [J].計算機工程與設計,2011,32(4):1359-1362.
[7] FISCHLER M A,BOLLES R C.RANSAC:A paradigm for model fitting with applications to image analysis and automated cartography[J].Comm of the ACM,1981,24:381-395.
[8] ROUSSEEUW P J,LEROY A M.Robust regression and outlier detection [M].New York:John Wrley & Sons Inc,Wiley,1987.
[9] CHUM O,MATAS J.Matching with PROSAC-progressive sample consensus[C] //IEEE Conference on Computer Vision and Pattern Recognition.San Diego,CA,USA:IEEE,2005:220-226.
[10] TORDOFF B J,MURRAY D W.Guided-MLESAC:Faster image transform estimation by using matching priors[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(10):1523-1535.
[11] CHIN T,YU J,SUTER D.Accelerated hypothesis generation for multi-structure data via preference analysis [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,34(4):625-638.
[12] VIOLA P,JONES M.Rapid object detection using a boosted cascade of simple features[C] //IEEE Conference on Computer Vision and Pattern Recognition.Kauai,HI,USA:IEEE,2001:511-518.
[13]GONZALEZ R C,WOODS R E,EDDINS S L.數字圖像處理 (Matlab版)[M].阮秋琦,譯.北京:電子工業(yè)出版社,2005.