羅聰 劉斌 魏夢然
摘要:人臉識別是計算機(jī)模式識別領(lǐng)域中一個研究熱點和難點。針對人臉識別中數(shù)據(jù)量大、高維度、非線性等問題,提出基于局部特征約束的壓縮感知人臉識別方法.首先對人臉圖像進(jìn)行選擇性約束處理,利用SIFT算法提取人臉圖像中的局部特征,以此構(gòu)成壓縮感知算法中的測量矩陣,再利用壓縮感知的重構(gòu)算法計算特征的稀疏表示,在此基礎(chǔ)上進(jìn)行人臉識別。算法在AR人臉庫上進(jìn)行了抗干擾比對測試,實驗結(jié)果驗證了算法對光照、表情以及遮擋等干擾具有強(qiáng)的魯棒性,局部特征的約束大大降低了特征點的數(shù)量,有效提高了人臉識別的正確率。
關(guān)鍵詞: 壓縮感知; 人臉識別; 特征提??; 局部特征; SIFT算法
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)07-1500-05
1 概述
人臉識別憑借著直觀突出、安全可靠和智能交互等優(yōu)勢長期備受研究者的關(guān)注。在過去的幾十年,人臉識別技術(shù)取得了較大的進(jìn)步,涌現(xiàn)出許多人臉識別方法。傳統(tǒng)的人臉識別方法有流行的主成分分析(Principal Component Analysis,PCA)【1】,線性判別分析(Linear Discriminant Analysis,LDA)【2】,幾何特征方法等。但是人臉識別仍然面臨著諸多亟待解決的問題,比如數(shù)據(jù)量大、維數(shù)高、非線性等,尤其是在光照的復(fù)雜性、表情的隨機(jī)性以及遮擋等干擾因素存在下。
近年來,壓縮感知(Compressive Sensing, CS)理論的興起,引起國內(nèi)外許多學(xué)者的研究。壓縮感知理論中最經(jīng)典的內(nèi)容就是稀疏表示理論。稀疏表示最早出現(xiàn)在信號領(lǐng)域,最初目的是為了用比香農(nóng)采樣定理更低的采樣率來表示和壓縮信號,通過對重構(gòu)矩陣的設(shè)計,構(gòu)建重構(gòu)空間,進(jìn)而再計算重構(gòu)空間上的最佳稀疏重構(gòu)系數(shù)【3-4】。Cand`es和Donoho在相關(guān)研究基礎(chǔ)上于2006年正式提出了壓縮傳感的概念【5】。
壓縮感知理論能夠很好的解決數(shù)據(jù)從高維到低維的轉(zhuǎn)換,給人臉識別領(lǐng)域開辟一條新的途徑,引起眾多學(xué)者的研究和關(guān)注。比如,YiMa等人將壓縮感知理論和稀疏表示理論引入人臉識別領(lǐng)域,并驗證其對光照、表情以及遮擋等情況下,人臉識別具有很好的魯棒性【6】,TanayaGuha等人通過學(xué)習(xí)過完備字典集,利用稀疏表示成功的識別了視頻中人物的物理動作和人物的面部表情【7】,Ran He等人提出了二級非負(fù)稀疏表示算法完成了大規(guī)模的人臉識別【8】,Koji Inoue等人利用稀疏表示實現(xiàn)了在光照情況下的人臉識別,并且很好的證明了該算法的魯棒性【9】,Chih-HsuehDuan等人提出了局部稀疏表示的方法來進(jìn)行人臉識別并通過實驗驗證方法的有效性【10】。
2 基于局部特征約束的壓縮感知人臉識別算法構(gòu)建
2.1 壓縮感知理論介紹
2.2 特征提取
在人臉識別技術(shù)的中,特征提取是一個基本而又至關(guān)重要的環(huán)節(jié),如何提取出穩(wěn)定、有效、魯棒性的特征是人臉識別成敗的關(guān)鍵。一般來說,目前人臉的特征描述大致可以分為兩類:局部特征和全局特征。
全局特征是指其特征向量的每一維都包了人臉圖像上絕大部分的有效信息,因此反映的是人臉的整體輪廓屬性。在人臉識別中可以進(jìn)行粗匹配,但是效果不是非常顯著。而局部特征在刻畫人臉圖像方面比全局特征更加優(yōu)越,尤其是在刻畫細(xì)節(jié)方面。被認(rèn)為對光照、表情和遮擋等變化不敏感,因此近些年被廣泛的作為特征提取方法應(yīng)用在人臉識別技術(shù)中。
2.2.1 局部特征提取
局部特征反映的是人臉的細(xì)節(jié)變化,比如面部的一些器官的特點,面部表情,邊緣輪廓,面部的奇異特征(比如傷疤,酒窩,痣等),可以進(jìn)行精細(xì)的篩選。
比較常用的局部特征包括局部二值模式(Local Binary Mode,LBP)、Gabor小波、局部非負(fù)矩陣分解(Local non-Negative Matrix Factorization,LNMF)等。就目前各人臉大數(shù)據(jù)庫測試的效果而言,Gabor小波變換被認(rèn)為是目前最有效的人臉表示方法之一。但值得一提的是在局部特征提取方法中,尺度不變特征變換(Scale Invariant Feature Transform,SIFT)特征提取算法成為了國內(nèi)外學(xué)者研究的熱點和難點。其提取的局部特征對能對旋轉(zhuǎn)、尺度縮放、光照變化等圖像變化因素保持一定的不變性,而對遮擋、噪聲等因素也保持較好的可匹配性,從而可以實現(xiàn)差異較大的兩幅圖像之間特征的匹配。在1999年David Lowe教授總結(jié)了現(xiàn)有的基于不變量技術(shù)的特征檢測方法,并正式提出了一種局域尺度空間的、對圖像縮放、旋轉(zhuǎn)甚至仿射變換保持不變性的圖像局部特征描述算子SIFT,并在2004年完善總結(jié)【14】。基于SIFT算子的優(yōu)勢,該文也采用SIFT算法進(jìn)行局部特征提取。
SIFT算法步驟如下【14】:
1)尺度空間極值點檢測:為有效檢測尺度空間中穩(wěn)定的關(guān)鍵點,Lowe提出一種計算差分高斯函數(shù)與圖像卷積得到圖像中極值點的方法。通過計算不同尺度下圖像各像素位置的相應(yīng)高斯差分函數(shù)值,并將其與相鄰像素相應(yīng)值進(jìn)行對比,若其為極值點(極大值或極小值),則這些像素所在位置即為有效的特征點。
2)精確定位穩(wěn)定的關(guān)鍵點:通過擬和三維二次函數(shù)以精確確定關(guān)鍵點的位置和尺度,同時去除低對比度的關(guān)鍵點和不穩(wěn)定的邊緣響應(yīng)點,以增強(qiáng)匹配穩(wěn)定性、提高抗噪聲能力。
3)關(guān)鍵點的方向匹配:利用關(guān)鍵點鄰域像素的梯度方向分布特性為每個關(guān)鍵點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。
4)生成特征點的描述子:為了有效地表征這些特征點,Lowe提出先將原圖像轉(zhuǎn)化為梯度圖像,計算每個元素的梯度幅值和方向量;再將所檢測特征點的相應(yīng)位置映射于梯度圖像中,并設(shè)定一個有效的鄰域范圍,以區(qū)域內(nèi)元素的梯度變化幅值為權(quán)重,計算方向量的直方圖,以此作為相應(yīng)特征點的表征向量。
實際計算過程中,為了增強(qiáng)匹配的穩(wěn)健性,Lowe建議對每個關(guān)鍵點使用4×4共16個種子點來描述,再計算8個方向梯度,這樣即最終形成128維的SIFT特征向量。
2.2.2 局部特征約束
SIFT算法在提取人臉特征時需要搜索整個人臉圖像中的所有像素點,并且每個搜索點都要計算與其對應(yīng)的高斯差分和梯度值,然后和周圍像素點進(jìn)行依次比較,最后用128維向量來對SIFT特征子進(jìn)行描述。這樣的計算復(fù)雜度是相當(dāng)可觀的,而且并不是所有最后計算出來的特征子對最后的人臉識別是有貢獻(xiàn)的或者說有效的。因此為了更夠有效的減少特征提取的數(shù)量,降低計算復(fù)雜度,提取更加穩(wěn)定、更具判別性的局部特征,該文對人臉圖像的特征提取做了進(jìn)一步的約束。
1)人臉子區(qū)域分割
一般來說,一張人臉圖像中具有良好區(qū)分性的特征主要分布在人的五官,比如眼睛、鼻子、嘴巴和耳朵等,而臉頰、額頭等部位不具有明顯的區(qū)分度。因此,為了降低計算復(fù)雜度,以及特征子的數(shù)量。人臉左眼、右眼、嘴巴三個區(qū)域在人臉識別中起著重要的作用,可以說這三個區(qū)域是人臉重要的“特征區(qū)”,因此算法中約束性的選擇人臉圖像上這三個比較具有區(qū)分度的區(qū)域進(jìn)行SIFT特征提取。該文在對人臉圖像進(jìn)行歸一化預(yù)處理之后,在每張圖像上手動圈定了3個矩形區(qū)域,這3個區(qū)域分別包含了左眼、右眼和嘴巴。
2)人臉邊緣檢測
邊緣檢測在圖像處理和計算機(jī)視覺中是被經(jīng)常使用的一種手段,其目的就是尋找出圖像中亮度變化比較明顯的點,在特征提取領(lǐng)域應(yīng)用尤其廣泛。圖像邊緣保留了原始圖像中相當(dāng)重要的部分信息,而又使得總的數(shù)據(jù)量減小了很多。并且剔除了可以認(rèn)為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性?;谝陨线@點,該文試圖將邊緣檢測作為一種約束,在SIFT特征提取之前先對人臉圖像做邊緣檢測,將邊緣檢測出來的點再做SIFT特征提取。這種約束可以有效的降低特征數(shù)據(jù)量和計算復(fù)雜度,可以大大提高人臉識別的效率。
本改進(jìn)中采用了Canny邊緣檢測算法,Canny算法是1986年提出的一個優(yōu)良的多級邊緣檢測算法,在圖像處理領(lǐng)域被廣泛的使用[15-16]。下圖是人臉圖像在采用Canny邊緣檢測前后的效果對比。
4 結(jié)論
本文在壓縮傳感理論研究的基礎(chǔ)上,深入研究了人臉局部特征提取,提出了基于局部特征約束的壓縮感知人臉識別算法。算法對局部特征進(jìn)行了針對性的約束選擇,有效的降低了特征提取的數(shù)量,提高了計算的效率。最后通過實驗對比分析驗證了本文算法的有效性、魯棒性。雖然本文算法比傳統(tǒng)的人臉識別算法具有較大的優(yōu)勢,但離人臉識別在實際中的應(yīng)用要求還比較遠(yuǎn)。在接下來的工作中,將主要通過對特征提取的優(yōu)化選擇及改進(jìn)來進(jìn)一步的提高識別率。
參考文獻(xiàn):
[1] TURK M,PENTLAND A. Face recognition using eigenfaces[C].Proceeding of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington D C:IEEEComputer Society Press,1991:586-591.
[2] Belhumeur P,Hespanha J,KriegmanD. Eigenfaces VS. Fisherfaces: Recognition using class specific linear projection[C].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711-720.
[3] CandeE. Compressive Sampling[C] Proc. Intl Congress of Mathematicians.2006
[4] Donoho D L. For most large underdetermined systems of linear equations, the minimal l1-norm solution is also the sparsest solution. Communications on Pure and Applied Mathematics, 2006, 59(6): 797?829
[5] Donoho.Compressed sensing[J]. IEEE Trans Inform Theory,2006,52(4):1289-1306.
[6] John Wright,Allen Y. Yang,ArvindGanesh,S. Shankar Sastry, YiMa. Robust Face Recognition via Sparse Representation [J].IEEE Transactions on pattern analysis and machine intelligence, 2009,31(2):210-227
[7] TanayaGuha, Rabab Kreidieh Ward. Learning Sparse Representations for Human Action Recognition[J].IEEE Transactions on pattern analysis and machine intelligence, 2012, 34 (8): 1576-1588
[8] Ran He,Wei-Shi Zheng,Bao-Gang Hu, Xiang-Wei Kong. Two-Stage on negative Sparse Representation for Large-Scale Face Recognition[J].IEEE Transactions on neural networks and learning systems, 2013, 24(1) :35-46
[9] Koji Inoue, Yoshimitsu Kuroki. Illumination-Robust Face Recognition via Sparse Representation[C].IEEE conference of Visual Communications and Image Processing, 2011, 1-4
[10]Chih-Hsueh Duan, Chen-Kuo Chiang, Shang-Hong Lai. Face Verification With Local Sparse Representation[J].IEEE signal processing letters,2013,20(2):177-180
[11]Cand`es E, Romberg J, Tao T. Robust uncertainty principles: exact signal reconstruction from highly incomplete frequency information. IEEE Transactions on Information Theory, 2006, 52(2): 489-509
[12] Tropp J, AGilbert. Signal recovery from random measurement s via orthogonal matching pursuit[J].IEEE Trans. Inform. Theory,2007,53(12):4655-4666.
[13] Carlin,M.; Rocca,P.:Oliveri,G.;Massa,A. Multi-task Bayesian compressive sensing for direction-of-arrival estimation[C]. IEEE International Conference on,2012:1-4
[14] Lowe D G. Distinctive image features from scale-invariant key points. International Journal of Computer Vision, 2004,60(2):91-110.
[15] 周曉明,馬秋禾,肖蓉,等.一種改進(jìn)的Canny算子邊緣檢測算法[J].測繪工程, 2008,17(2):28-31
[16] 王娜,李霞.一種新的改進(jìn)Canny邊緣檢測算法[J].深圳大學(xué)學(xué)報,2005,4(2):149-152.