楊晉吉 李亞文
(華南師范大學計算機學院 廣東 廣州 510631)
人臉識別技術作為最友好的生物特征識別技術,在國防軍事、公共安全、工業(yè)和日常生活等方面有著非常廣泛的應用,已經得到了廣大科學工作者的普遍關注。人臉識別也是模式識別、圖像處理、神經網絡以及認知科學領域的研究熱點和難點[1]。人臉識別主要是將待測的人臉圖像與當前人臉庫中的圖像進行對比,從中找到與之匹配的人臉以達到身份鑒定的目的。目前許多國內外學者對人臉識別進行了深度的研究,總體來說,人臉識別技術目前主要分為以下幾類:
1) 基于幾何特征的方法。該方法主要是檢測出人臉各個關鍵部位的形狀和位置,同時還有這些面部特征之間的關系(比如距離),這些參數就構成了可以表示人臉圖像的特征向量。基于幾何特征本質上是特征向量之間的匹配,其分量通常包括人臉指定兩點間的歐式距離、曲率、角度等。但是該方法從圖像中抽取穩(wěn)定的特征較困難,在表情變化和姿態(tài)變化上識別的魯棒性較差。
2) 基于模板的方法。該方法的關鍵是利用人臉圖像的全局信息或者局部信息,然后選擇合適的尺度(如歐幾里德距離)與代表人臉信息的標準模板的相關值進行判定?;谀0宓姆椒ㄖ饕幸韵聨最悾夯谙嚓P的方法、特征臉方法(Eigenface[2])、線性判別分析方法(LDA[3])、神經網絡方法等。
3) 基于模型的方法。該方法主要是以一種數學模型的變換方法去較好地合并不同姿態(tài)、不同角度的人臉信息。其典型方法是Nefian等提出的基于隱馬爾可夫模型(HMM[4])的方法,但該方法將同一個人的人臉圖像的各種變化看成是同一種狀態(tài)產生的一系列實現,計算復雜度較高。
近年來,使用變換域去提取人臉特征的方式受到研究人員的廣泛關注,而小波變換因其較強的時、頻局部化分析能力和多分辨率的特點,被廣泛應用于人臉識別當中[5]。然而小波變換的基是各向同性的,僅僅能反映一維信號中奇異點的性質,而無法表達二維圖像的“沿”邊緣特征,無法最優(yōu)表示二維圖像的奇異曲線,而第二代曲波變換具有對奇異曲線的敏感性而活躍于圖像處理領域。李艷萍等[6]提出基于曲波變換和余弦測度人臉識別,周立儉等[7]提出基于Curvelet和LBP的可變光照人臉識別,該方法能夠在低分辨率條件下獲得較好的識別效果。為了克服小波變換無法準確表示奇異曲線的弱點,本文用Curvelet變換去提取人臉的特征值,利用Curvelet變換后的最優(yōu)稀疏性去結合稀疏表示分類算法,通過實驗本文算法對光照、表情、姿態(tài)和遮擋等變化有較好的魯棒性,同時克服了小波變換無法表達二維奇異曲線的弱點,提高了人臉識別率。
Curvelet變換是Candes等于1999年提出的,此時的Curvelet 變換是基于傳統(tǒng)結構[8-10], 這種算法結構比較復雜同時具有較高的冗余度。圖2表示Curvelet對二維奇異曲線的逼近過程,基的支撐區(qū)間為矩形且滿足width≈length2,而且這種基還具有很強的方向性,這種關系稱之為各向異性尺度關系。對比圖1與圖2可看出,通過細分后的長條基可以覆蓋整個曲線,因此可以看出曲波變換比小波變換對奇異曲線有更優(yōu)異的表達方式。
曲波變換經過多年的發(fā)展目前處于第二代[11],在人臉圖像中進行曲波變換則需要使用它的離散形式。本文選取運算速度比較快,算法效率較高的基于Wrapping的快速離散Curvelet變換算法[12],此算法中引入相同間隔的斜率tanθl=l×2-?j/2」,l=-2?j/2」,…,2?j/2」-1,并且定義:
(1)
式中:剪切矩陣Sθl為:
(2)
則離散Curvelet 變換為:
(3)
式中:b∈(k1×2-j,k2×2-j/2)。
基于Wrapping 離散Curvelet 變換算法工作步驟為:
(1) 對人臉圖像進行傅立葉變換,可以得到:
(4)
(2) 對于不同角度l和尺度j,產生乘積:
(5)
(3) 對曲波系數的乘積結果進行打包后可以得到:
(6)
式中:0≤n1 在第二代曲波變換的實現方法上,基本的Wrapping的離散曲波變換主要有如下缺點:人臉的重要圖像信息主要位于邊緣區(qū)域,由于曲波變換時具有平移不變性而導致對分解后的曲波系數的“過扼殺”使邊緣區(qū)域產生“振鈴”效應;曲波變換的基具有“楔形”特性,導致其中的變換因子具有相關性,當曲波變換系數變化時將影響空域中在一條直線上的所有值,導致圖像受損。 為了克服該弱點,本實驗采用基于第二代曲波的圖像加權算法,算法流程如下所示: (1) 使用離散的曲波變換對圖像x(i,j)進行分解。 (2) 對分解后的低頻和中頻曲波系數進行如下非線性變換: (7) 而對于高頻曲波系數利用軟閾值函數做降噪處理,軟閾值函數可以表示如下: (8) (3) 通過曲波反變換獲得人臉圖像x′(i,j)。 稀疏表示最初常用于信號處理方面,目的主要是用比香農采樣定理更低的采樣率來表示和壓縮信號[13]。當壓縮感知理論被Candès[14]首次提出后,稀疏表示理論得到了廣泛的應用。近年來Zhou等[15]將稀疏表示和馬爾科夫隨機場結合起來用來識別部分偽裝的人臉;Yang等[16]將Gabor特征加入稀疏表示,不僅提高了人臉的區(qū)分能力并且降低了過完備字典的維數。 基于稀疏表示的分類算法(SRC)[17]被成功運用于人臉識別,其核心思想是將測試樣本圖像表示為訓練樣本的線性組合,SRC是最經典的針對人臉識別的稀疏表示方法,其基本步驟如下所示: (1) 輸入:包含有k個類、n個樣本的訓練樣本集A=[A1,…,Ai,…,Ak]∈Rm×n,測試樣本y∈Rm和容錯值ε,ε>0。 (2) 歸一化列矩陣A使之具有單位l2范數。 (3) 求解最小l1范數: (9) (4) 計算類別i=1,2,…,k的重建誤差: (10) (5) 輸出重建誤差最小的類作為測試樣本y的類: identity(y)=argminiri(y) (11) 本文采用Curvelet 變換獲取人臉特征,在實現方法上采用改進的Wrappinp快速離散Curvelet 變換加權算法,結合PCA降維后用稀疏表示分類算法SRC進行識別(如圖3所示),其主要步驟如下: (1) 圖像預處理,主要通過對圖像的灰度化和歸一化處理來保證提取有效的人臉特征。 (2) 離散Curvelet變換,采用本文改進的曲波變換加權算法對訓練集圖像和測試集圖像進行分解和重構,取得對應的低頻子帶部分和不同方向和尺度的高頻子帶部分,對低頻系數重構圖像(即曲波臉)作為人臉的特征矩陣。 (3) PCA降維,為了降低運算復雜度得到維數低的稀疏特征,則采用PCA方法對訓練集和測試集的特征矩陣進行降維。 (4) SRC分類識別,對經過降維后的訓練集和測試集特征用稀疏表示分類算法(SRC)進行人臉識別。 圖3 本文算法流程圖 為了驗證本文算法的有效性,分別在ORL、Yale和AR三個人臉數據庫進行實驗,并與基于Wavelet變換的PCA算法、基于Curvelet變換的PCA 算法、LDA、PCA+SRC進行比較。實驗軟件平臺為MATLAB 2014a,硬件為i5-5200U 處理器,主頻為2.20 GHz,4 GB內存,Windows7(64)位操作系統(tǒng)。實驗過程中需要用到三個工具箱,分別為Libsvm、CurveLab、PhDtool。 本實驗選取了ORL、Yale和AR人臉數據庫進行實驗。ORL人臉庫由劍橋大學AT&T實驗室創(chuàng)立,共有40個人一共400幅灰度圖像組成,其中包括表情變化,微小姿態(tài)變化,20%以內的尺度變化,如圖4所示。Yale人臉庫由耶魯大學計算視覺與扼制中心創(chuàng)立,包括15位志愿者的165張圖片,包括光照,表情和姿勢的改變,如圖5所示。AR人臉數據庫由西班牙巴塞羅那計算機視覺中心建立,包含116人的3 288幅圖像,包括遮擋,表情和姿勢的改變,如圖6所示。 圖4 ORL人臉庫樣本圖像(姿態(tài)、表情、尺度變化) 圖5 Yale人臉庫樣本圖像(光照、表情變化) 圖6 AR人臉庫樣本圖像(遮擋、光照、表情變化) 根據三個人臉數據庫各自的特點,本仿真實驗在人臉姿態(tài)、表情、尺度變化上選擇ORL人臉庫進行實驗,在光照、人臉表情變化上用Yale人臉庫進行實驗,在人物遮擋、光照、表情變化上用AR人臉庫進行實驗。第一個實驗選用ORL人臉庫中的每個人作為一個類別,然后每類訓練樣本數為x(2~8),表1是各種識別算法在ORL人臉庫的識別率。 表1 ORL人臉庫在不同算法的識別率比較 從表1實驗數據表明,在表情變化,姿態(tài)變化,尺度變化的人臉識別中,本文采用的人臉識別算法有比較好的人臉識別效果。 本文算法與傳統(tǒng)的基于Wavelet變換的PCA算法、LDA相比較有明顯識別性能提高,在訓練集的個數依次遞增的過程中本文算法識別效果顯著。本實驗設置了曲波變換和小波變換的對比實驗,如圖7所示,基于曲波變換的PCA識別算法要比基于小波變換的PCA算法的識別效率高一些。這也驗證了小波變換無法準確表示人臉圖像奇異曲線的弱點,對含有較多面部輪廓和五官曲線信息的人臉圖像無法實現最優(yōu)的稀疏表示。而本文算法將人臉圖像在經過Curvelet變換后與稀疏表示類識別算法結合具有較高識別率,這是因為人臉圖像經過Curvelet變換后具有優(yōu)秀的稀疏性。為了充分證明本文識別算法在姿態(tài)變化、光照變換、表情變化上的良好識別率,也在Yale人臉庫中進行了相關實驗,表2是各種識別算法在Yale人臉庫的識別率。 圖7 ORL人臉庫不同算法識別率(姿態(tài)、表情、尺度變化) 識別方法AR人臉庫每類訓練樣本數2345678Wavelet+PCA68.3373.5776.5282.6285.3388.3891.17Curvelet+PCA71.4274.6778.3383.6487.2389.3392.56LDA70.5374.4280.6778.7883.6690.3292.78PCA+SRC74.3481.8584.6686.3391.2792.0294.43Curvelet+PCA+SRC76.1784.3387.5288.7692.6494.6396.33 由表2實驗數據表明,在光照變化,表情變化,姿態(tài)變化的人臉識別中,本文算法識別效果也普遍高于其他對比算法。從圖8可知,經過Curvelet變換后的PCA識別算法識別率略高于基于小波變換的PCA識別算法,可見在某些人臉庫中基于小波變換類的識別算法和基于曲波變換類的識別算法的基本識別率相差不是太大。這也從側面反映了人臉圖像經過曲波變換后進行非稀疏表示類識別算法識別人臉效果甚微。而PCA+SRC算法的識別效率低于經過曲波變換的PCA+SRC算法,這是因為包含眾多曲線信息的人臉圖像經過Curvele變換后擁有最優(yōu)的稀疏表示,此時結合稀疏表示分類算法識別效果顯著。 圖8 Yale人臉庫不同算法識別率(光照、表情變化) 為了驗證本文算法在遮擋、表情變化和光照變化下的有效性,本文采用AR人臉數據庫進行測試。AR人臉數據庫包括人臉遮擋,人臉表情和姿勢的改變。原AR人臉庫每個人有26幅不同的人臉圖像,為了實驗公平性,我們選取每個人的偶數編號圖片進行實驗并且重新編號,表3是各種識別算法在AR人臉庫的識別率。 表3 AR人臉庫在不同算法的識別率比較庫不同算法識 由表3實驗數據表明,在人臉遮擋,光照變化,表情變化的人臉識別中,本文算法識別效果也普遍高于其他對比算法。從圖9可知,在遇到人臉遮擋和表情變化的情況下,基于小波變換的PCA和LDA人臉識別算法的效率不及本文算法的識別效率。基于小波變換的PCA識別算法和經過Curvelet變換的PCA識別算法的識別率非常接近。這也驗證了之前的結論:經過Curvelet變換與其他非稀疏表示方法結合效果甚微,而經過Curvelet變換對稀疏表示類的人臉識別算法有提升識別率的作用。 圖9 AR人臉別率(遮擋、光照、表情變化) 本文提出的基于Curvelet變換特征的人臉識別算法對于人臉識別有較好的識別效果。本文算法既克服了在人臉識別中小波變換無法準確表示奇異曲線的弱點,也增強了在外界干擾因素下的人臉識別效率。算法采用本文改進的Wrappinp快速離散Curvelet 變換加權算法獲得人臉的稀疏特征,具備稀疏性的人臉特征通過降維后采用稀疏表示分類算法進行人臉識別。通過在ORL人臉數據庫、Yale人臉數據庫和AR人臉數據庫上的相關對比實驗,證明了本文算法在人臉遮擋、姿態(tài)變換、表情變換和光照變換等干擾因素的作用下具有較高的人臉識別率和較好的魯棒性。但是本文算法也在人臉識別階段經過了多次人臉特征變換,為保證在大數據的情況下有較高的識別率及快速的識別能力也是將來要研究的方向之一。而基于稀疏表示的人臉識別改進算法都要求人臉特征必須在識別分類前嚴格對齊,這一點限制了稀疏表示識別算法的實際應用場景。 [1] 李昆侖,耿雪菲,曹靜媛.鑒別稀疏保持投影的人臉識別算法[J].小型微型計算機系統(tǒng),2017(2):376-380. [2] Lades M,Vorbruggen J C,Buhmann J,et al.Distortion Invariant Object Recognition in the Dynamic Link Architecture[J].IEEE Transactions on Computers,1993,42(3):300-311. [3] Huang R,Liu Q,Lu H,et al.Solving the small sample size problem of LDA[C]//16 Th International Conference on Pattern Recognition.IEEE Computer Society,2002:30029. [4] Baum L E,Eagon J A.An inequality with applications to statistical estimation for probabilistic functions of Markov processes and to a model for ecology[J].Bulletin of the American Mathematical Society,1967,73(3):360-363. [5] Amira A,Farrell P.An automatic face recognition system based on wavelet transforms[C]//IEEE International Symposium on Circuits and Systems.IEEE,2005:6252-6255 Vol.6. [6] 李艷萍,姜穎,胡金明,等.基于曲波變換和余弦測度的人臉識別方法[J].計算機科學,2016,43(5):294-297. [7] 周立儉,劉萬泉,孫潔.基于Curvelet和LBP的可變光照人臉識別[J].計算機工程,2012,38(22):176-178. [8] Mandal T,Majumdar A,Wu Q M J.Face Recognition by Curvelet Based Feature Extraction[M]//Image Analysis and Recognition.Springer Berlin Heidelberg,2007:806-817. [9] Candès E J,Donoho D L.New tight frames of curvele ts and optimal representations of objects with smooth singularities[J].Communications on Pure & Applied Mathematics,2004,57(2):219-266. [10] Lee C S,Pan C Y.An intelligent fuzzy agent for meeting scheduling decision support system[J].Fuzzy Sets and Systems,2004,142(3):467-488. [11] 宋書林,張彥,王憲,等.基于曲波變換和Retinex人臉光照處理算法[J].計算機工程與應用,2013,49(3):171-173. [12] Candes E,Donoho D,Demanet L.Methods for performing fast discrete curvelet transforms of data:US,US 7840625 B2[P].2010. [13] Donoho D.Compressed sensing[J].IEEE Transactions On Information Theory,2006,52(4):289-1306. [14] Candès E J.Compressive sampling[C]//Proceedings of the International Congress of Mathematicians.Madrid,Spain,2006:1433-1452. [15] Zhou Z,Wagner A,Mobahi H,et al.Face recognition with contiguous occlusion using Markov random fields[C]//2009 IEEE 12th International Conference on Computer Vision,2009:1050-1057. [16] Yang M,Zhang L,Shiu S C K,et al.Gabor feature based robust representation and classification for face recognition with Gabor occlusion dictionary[J].Pattern Recognition,2013,46(7):1865-1878. [17] Wright J,Yang A,Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI),2009,31(2):210-227.1.2 改進的曲波變換加權算法
2 基于稀疏表示分類的人臉識別
2.1 稀疏表示分類識別
2.2 本文算法
3 實驗結果及分析
4 結 語