張文清,李龍雨,李芬蘭,歐海燕
(汕頭大學(xué)工學(xué)院電子系,廣東汕頭515063)
基于ROMP算法的人臉識(shí)別
張文清,李龍雨,李芬蘭,歐海燕
(汕頭大學(xué)工學(xué)院電子系,廣東汕頭515063)
針對(duì)用傳統(tǒng)方法進(jìn)行人臉識(shí)別的識(shí)別率不夠高的問(wèn)題,本文在人臉識(shí)別中采用正則化正交匹配追蹤算法(ROMP),并把其與基于NN,匹配追蹤(MP),正交匹配追蹤(OMP)的人臉識(shí)別算法進(jìn)行了對(duì)比.該算法能一次從冗余字典中選取多個(gè)原子,并能夠通過(guò)正則化準(zhǔn)則對(duì)選取的原子進(jìn)行再次篩選,獲得最優(yōu)的原子.實(shí)驗(yàn)結(jié)果表明,在不同特征提取方法和訓(xùn)練樣本數(shù)改變的情況下,基于ROMP的人臉識(shí)別算法的識(shí)別率優(yōu)于其他算法.
正則化正交匹配追蹤;匹配追蹤;正交匹配追蹤;人臉識(shí)別
人臉識(shí)別是生物特征識(shí)別[1-4]技術(shù)中的一個(gè)重要研究領(lǐng)域,在身份認(rèn)證方面有著重大的應(yīng)用.近年來(lái),由于壓縮感知理論的啟發(fā),基于稀疏表示的人臉識(shí)別越來(lái)越成為研究熱點(diǎn).基于稀疏表示的人臉識(shí)別是用訓(xùn)練樣本圖像構(gòu)造一個(gè)冗余字典,然后將測(cè)試樣本表示為訓(xùn)練樣本的線性組合,通過(guò)求解一個(gè)最優(yōu)化問(wèn)題獲得稀疏系數(shù)向量,然后再利用最小殘差進(jìn)行分類(lèi),而最重要的一步便是稀疏求解.目前常用的稀疏求解方法包括凸松弛算法[5]、貪婪算法[6]等.文獻(xiàn)[7-10]利用了MP,OMP用于稀疏求解,取得了良好的效果,但是效果都普遍不夠好.本文將正則化正交匹配追蹤算法(Regularized Orthogonal Matching Pursuit,ROMP)算法應(yīng)用到人臉識(shí)別中,并和基于MP,OMP算法的人臉識(shí)別進(jìn)行了對(duì)比,仿真結(jié)果發(fā)現(xiàn)基于ROMP算法的人臉識(shí)別在總體識(shí)別率上優(yōu)于其他算法.
ROMP[11-12]算法是一種結(jié)合了貪婪算法和凸松弛算法的優(yōu)點(diǎn)的算法,該算法能夠在降低計(jì)算復(fù)雜度的情況下達(dá)到收斂.該算法的基本思想是首先計(jì)算冗余字典D中各個(gè)原子與信號(hào)或者信號(hào)殘差的內(nèi)積u,根據(jù)相關(guān)程度的大小從中選取內(nèi)積中絕對(duì)值較大的K個(gè)原子,并將這些原子的索引值放入索引集J.接著依據(jù)正則化準(zhǔn)則對(duì)索引集J中的各索引值對(duì)應(yīng)的原子進(jìn)行再次篩選,只保留部分能量較大的原子并將其索引值集合J0并入索引集I.最后利用最小二乘法逼近原始信號(hào),并更新殘差.算法的具體步驟流程如下:
輸入:冗余字典[13]D,信號(hào)稀疏度K,測(cè)量向量y.
(1)初始化:令索引集合I=?,殘差r=y,迭代次數(shù)t=1,重復(fù)下面的步驟K次或者直到.
(2)識(shí)別:求取觀測(cè)向量u=UTr,并選出K個(gè)最大的非零元素對(duì)應(yīng)的索引構(gòu)成集合J;
當(dāng)非零元素個(gè)數(shù)比K小時(shí),所有的非零元素的索引構(gòu)成集合J.
(4)更新:將集合J0添加到索引集:I←I∪J0,更新殘差:
其中,DI表示索引集I中各索引所對(duì)應(yīng)的字典D中各原子的構(gòu)成的子集.
與OMP相比,ROMP算法的優(yōu)點(diǎn)在于每次迭代過(guò)程中能夠一次選擇K個(gè)原子,并且能夠通過(guò)正則化原則對(duì)每次選擇的原子進(jìn)行再次篩選,去除能量較小的原子,保證在每次迭代過(guò)程中挑選出的原子的能量一定大于未被選擇的原子的能量,并保證留下的每個(gè)原子都具有相同的信息量.同時(shí)在滿(mǎn)足RIP的條件下,OMP算法只能高概率的重構(gòu)原始信號(hào),無(wú)法做到精確重構(gòu),而定理1表明ROMP算法能夠精確地重構(gòu)原始信號(hào).
定理1:假設(shè)冗余字典D滿(mǎn)足RIP條件,且滿(mǎn)足參數(shù)(2K,ε),其中, x∈RN是一個(gè)K稀疏信號(hào),測(cè)量向量y=Dx,那么經(jīng)過(guò)K次迭代可得到一個(gè)索引集I,該索引集滿(mǎn)足
設(shè)共有k類(lèi)n副人臉圖像,其中第i類(lèi)有ni個(gè)訓(xùn)練樣本.將其中的每一幅w×h的灰度人臉圖像作為列向量v∈Rm(m=wh),如果將第i類(lèi)的所有訓(xùn)練樣本構(gòu)成子矩陣記為Di=[vi,1,vi,2,…,vi,ni]∈Rm×ni,k類(lèi)的所有訓(xùn)練樣本構(gòu)成矩陣記為Di=[D1,D2,…,Dk]= [vi,1,vi,2,…,vk,nk]∈Rm×n.那么測(cè)試樣本y可以表示為所有訓(xùn)練樣本的線性組合:
由于樣本的維數(shù)m非常大,對(duì)(3)式的求解在計(jì)算機(jī)上無(wú)法實(shí)現(xiàn).所以先對(duì)樣本圖像進(jìn)行降維,然后再處理.對(duì)于式(3)采用ROMP算法進(jìn)行稀疏求解.根據(jù)求出的稀疏系數(shù)x采用如下方法進(jìn)行分類(lèi).
對(duì)于每一類(lèi)i,令δi:Rn→Rn是選擇與第i類(lèi)相關(guān)的系數(shù)的特征函數(shù),對(duì)于x∈Rn,向量δi(x)∈Rn中的非零元素為x中與第i類(lèi)相關(guān)的元素.只用與第i類(lèi)相關(guān)的元素,我們可以將測(cè)試樣本y的估計(jì)值寫(xiě)為y?i=Dδi(x?1),計(jì)算所有y?i與y之間的差,并將y歸于使殘差最小的類(lèi):
本文使用ORL人臉庫(kù)中具有不同光照、不同表情、不同姿態(tài)(傾斜程度不超過(guò)20度)以及有稍許遮擋(如佩戴眼睛)400副準(zhǔn)正面人臉圖像作為測(cè)試圖像,其中每類(lèi)10副,共40類(lèi).為了更有效的驗(yàn)證ROMP算法的性能,本文在PCA、2D2DPCA、PCA+LDA、Downsample和隨機(jī)高斯矩陣(Gaussian)多種不同的特征提取方法下將ROMP算法與NN、MP和OMP作對(duì)比分析,同時(shí)也在不同訓(xùn)練樣本數(shù)的情況下對(duì)ROMP算法和其他三種算法的識(shí)別率做了比較.
本文采用的特征維數(shù)分別是:30,35,48,63,80,99,120,154,每個(gè)維數(shù)對(duì)應(yīng)的下采樣率分別是1/18,1/16,1/14,1/12,1/11,1/10,1/9,1/8.因?yàn)镻CA+LDA的維度要比樣本類(lèi)別40小,所以實(shí)驗(yàn)中只選擇30維和35維.此外,本文給出的都是最優(yōu)識(shí)別率,即將算法中的所有參數(shù)都調(diào)至最佳狀態(tài)時(shí)得到的識(shí)別率.其中涉及用隨機(jī)高斯矩陣進(jìn)行降維時(shí),取的識(shí)別率是50次實(shí)驗(yàn)下的最優(yōu)識(shí)別率的平均值.
3.1 不同特征提取方法下識(shí)別率的比較
圖1給出了PCA、2D2DPCA、PCA_LDA、Downsample和Gaussian多種特征提取下,ROMP算法與NN、MP和OMP對(duì)比圖.
圖1 ROMP與NN,MP,OMP在識(shí)別率方面的對(duì)比
由圖1中的五張圖中清晰地顯示無(wú)論是采用PCA、2D2DPCA、PCA+LDA還是采用Downsample和Gaussian進(jìn)行降維,在相同維度下,利用ROMP算法獲得的識(shí)別率明顯比NN、MP和OMP算法得到的識(shí)別率要高.該結(jié)果表明ROMP對(duì)具有一定程度的光照、姿態(tài)和表情變化條件的魯棒性比其它幾種算法較好.
3.2 不同訓(xùn)練樣本數(shù)下識(shí)別率的比較
因?yàn)椴捎肞CA+LDA進(jìn)行特征提取時(shí),特征維數(shù)受類(lèi)別數(shù)的影響,采用隨機(jī)高斯矩陣進(jìn)行特征提取具有不穩(wěn)定性,所以圖2僅給出采用PCA、2D2DPCA和Downsample進(jìn)行特征提取,特征維數(shù)固定為63時(shí),每種分類(lèi)算法下的識(shí)別率隨訓(xùn)練樣本的變化情況.
由圖2所知,隨著每類(lèi)中訓(xùn)練樣本數(shù)的變化,無(wú)論采用PCA、2D2DPCA和Downsample哪種特征提取方法,采用ROMP算法所獲得的識(shí)別率比采用NN、MP和OMP算法要好.
本文把ROMP算法應(yīng)用到人臉識(shí)別中,通過(guò)在不同特征提取方法和每類(lèi)訓(xùn)練樣本數(shù)改變的情況下,與基于NN,MP,OMP的人臉識(shí)別算法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明ROMP算法進(jìn)行稀疏分解并利用最小殘差進(jìn)行分類(lèi)獲得的識(shí)別率明顯好于NN、MP和OMP算法.本文中采用的是標(biāo)準(zhǔn)庫(kù)圖片,與實(shí)際情況不太一致,在潛在的魯棒應(yīng)用上還需進(jìn)一步研究.
圖2 訓(xùn)練樣本數(shù)對(duì)識(shí)別率的影響
[1]Jain A K,Ross A,Prabhakar S.An introduction to biometric recognition[J].Circuits and Systems for Video Technology,IEEE Transactions on,2004,14(1):4-20.
[2]盧世軍.生物特征識(shí)別技術(shù)發(fā)展與應(yīng)用綜述[J].計(jì)算機(jī)安全,2013(1):63-67.
[3]盧官明,李海波,劉莉.生物特征識(shí)別綜述[J].南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2007,27(1):81-88.
[4]孫冬梅,裘正定.生物特征識(shí)別技術(shù)綜述[J].電子學(xué)報(bào),2001,29(12):1744-1748..
[5]Mohimani H,Babaie-Zadeh M,Jutten C.A fast approach for overcomplete sparse decomposition based on smoothed norm[J].Signal Processing,IEEE Transactions on,2009,57(1):289-301.
[6]Tropp J A,Gilbert A C.Signal recovery from random measurements via orthogonal matching pursuit [J].Information Theory,IEEE Transactions on,2007,53(12):4655-4666.
[7]Mallat S G,Zhang Z.Matching pursuits with time-frequency dictionaries[J].Signal Processing,IEEE Transactions on,1993,41(12):3397-3415.
[8]Tropp J A,Gilbert A C.Signal recovery from random measurements via orthogonal matching pursuit [J].Information Theory,IEEE Transactions on,2007,53(12):4655-4666.
[9]Phillips P J.Matching pursuit filters applied to face identification[J].Image Processing,IEEE Transactions on,1998,7(8):1150-1164.
[10]Shi Q,Eriksson A,van den Hengel A,et al.Is face recognition really a compressive sensing problem?[C]//Computer Vision and Pattern Recognition(CVPR),2011 IEEE Conference on. IEEE,2011:553-560.
[11]Needell D,Vershynin R.Signal recovery from incomplete and inaccurate measurements via regularized orthogonal matching pursuit[J].IEEE Journal of Selected Topics in Signal Processing,2010,4(2):310-316.
[12]Needell D,Vershynin R.Uniform uncertainty principle and signal recovery via regularized orthogonal matching pursuit[J].Foundations of Computational Mathematics,2009,9(3):317-334.
[13]張春梅,尹忠科,肖明霞.基于冗余字典的信號(hào)超完備表示與稀疏分解[J].科學(xué)通報(bào),2006,51(6):628-633.
Face Recognition w ith ROMP Algorithm
ZHANG Wenqing,LI Longyu,LI Fenlan,OU Haiyan
(Department of Electronic Engineering,Shantou University,Shantou 515063,Guangdong,China)
The rate of face recognition with traditional method is not high enough,so the work uses regularization orthogonal matching pursuit algorithm(ROMP)for face recognition,and compares it with nearest neighbor(NN),matching pursuit(MP)and orthogonal matching Pursuit(OMP)algorithm.The advantage of the ROMP is that it can select multiple atoms from a redundant dictionary at each iteration and filter it again from selected atoms to get optimal atoms by regularization criterion.Experimental results show that the recognition rate based on ROMP is better than other algorithms in the case of different feature extraction methods and different number of training samples.
ROMP;MP;OMP;face recognition
TP 391.4
A
1001-4217(2015)01-0048-05
2014-05-05
張文清(1989-),男,碩士研究生,主要研究方向:圖像處理、模式識(shí)別等. E-mail:12wqzhang2@stu.edu.cn