覃陽 肖化
摘要:在單樣本或者小樣本的人臉識別系統(tǒng)中,常常會面臨樣本數(shù)量不足的問題,為解決少樣本情況下的分類精度,以及利用原始特征或者目標(biāo)特點重構(gòu)的虛擬樣本過于單一等問題,提出一種自適應(yīng)非負(fù)矩陣分解(NMF)的人臉識別方法。該方法首先在矩陣分解過程中構(gòu)造不同矩陣維度和迭代次數(shù)參數(shù)下的重構(gòu)樣本;然后利用QR分解稀疏表示方法進(jìn)行人臉分類;最后,通過選取最優(yōu)參數(shù)組合,調(diào)整重構(gòu)樣本,直至達(dá)到最佳分類效果。在ORL、Yale和AR3個數(shù)據(jù)庫上的實驗結(jié)果表明,該算法在最佳參數(shù)下,尤其是單樣本情況下對比基于原樣本方法的準(zhǔn)確率平均提高了約5%,最高提高了約10%~15%。
關(guān)鍵詞:非負(fù)矩陣分解;稀疏表示;重構(gòu)樣本;人臉識別
DOI:10.11907/rjd k.191257
中圖分類號:TP301 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2019)012-0073-05
0引言
在數(shù)據(jù)時代背景下,人臉識別已經(jīng)在機(jī)場、安防、電子身份、旅游、自助服務(wù)等領(lǐng)域逐漸取代其它生物特征。現(xiàn)階段,基于大數(shù)據(jù)技術(shù)的人臉識別方法均受限于樣本標(biāo)記量大、模型參數(shù)合理化及模型訓(xùn)練時間過長等問題,使得其在實際應(yīng)用過程中無法獲得應(yīng)有的效果。
自1999年,非負(fù)矩陣分解(Non-negative Matrix Factor-ization,NMF)算法及其求解模型第一次出現(xiàn)在《Nature》中,就作為一種有效的無監(jiān)督特征提取方法廣泛應(yīng)用于人臉識別。通過NMF中“數(shù)據(jù)非負(fù)”的約束,尋找高維空間下的低維人臉特征。對人臉圖像進(jìn)行特征提取的過程中,將樣本圖像按一維列向量排列得到高維特征,采用NMF方法進(jìn)行降維,復(fù)雜度有所降低,但NMF分解時無法表達(dá)圖像的潛在結(jié)構(gòu)信息。陳子健等提出了Gabor變換和二維NMF融合方法,首先對圖像進(jìn)行Gabor變換,提取人臉特征,然后利用二維NMF進(jìn)行特征降維,其中二維NMF技術(shù)保持圖像原始矩陣構(gòu)成高維數(shù)據(jù),但NMF方法在學(xué)習(xí)原始高維數(shù)據(jù)時容易忽略高維數(shù)據(jù)的本征幾何結(jié)構(gòu);王曉華等改進(jìn)了Gabor變換和二維NMF融合的方法,定性分析了二維NMF矩陣分解過程中空間維數(shù)對識別效果的影響,過高的維度設(shè)置會導(dǎo)致計算復(fù)雜度增加,識別率反而有所下降;劉文培等提出利用NMF重構(gòu)的人臉圖像表示人臉局部之間的內(nèi)在聯(lián)系,利用重構(gòu)圖像與原始圖像之間的誤差摒除冗余信息干擾,豐富了訓(xùn)練樣本的多樣性,并定性探究了迭代次數(shù)對收斂結(jié)果的影響;孫靜靜等將多種改進(jìn)的NMF算法應(yīng)用于空間目標(biāo)識別,定性探究了不同維度值下各算法的識別率和時間復(fù)雜度,但未能繼續(xù)探究選擇合適的樣本數(shù)和維度值使得識別效果更好。與上述方法相比,本文提出了一種自適應(yīng)NMF參數(shù)方法,能夠自尋最優(yōu)NMF的迭代次數(shù)T和維度值R構(gòu)造最優(yōu)訓(xùn)練集,并利用QR分解稀疏表示進(jìn)行分類,根據(jù)分類結(jié)果實時調(diào)整參數(shù)。實驗結(jié)果表明,在兼顧保留圖像結(jié)構(gòu)信息的同時,可以獲得較好的識別率,其識別效果優(yōu)于傳統(tǒng)基于原樣本識別方法。
1非負(fù)矩陣分解(NMF)
選擇適當(dāng)?shù)牡螖?shù),既滿足誤差要求,又不會增加運算次數(shù)。設(shè)定初始迭代次數(shù)為300。根據(jù)重構(gòu)誤差e,圖2給出了在3個數(shù)據(jù)庫矩陣維度的重構(gòu)誤差收斂曲線,不同的矩陣維度對應(yīng)的重構(gòu)誤差不同,隨著矩陣維度的增大,誤差越來越小,當(dāng)矩陣維度r≤mn(m+n)時,基本可達(dá)到較好的收斂效果。
迭代次數(shù)t和矩陣維度r不同,得到的樣本也不同,隨著r和t的增大,重構(gòu)樣本的誤差會越來越小,但參數(shù)過大會導(dǎo)致計算時間過長,且識別效果已經(jīng)達(dá)到基本穩(wěn)定,并不會隨著參數(shù)的增大而無限增大,反而會增加運行時間。本文定量對參數(shù)r和t進(jìn)行自適應(yīng)分析,選擇最優(yōu)參數(shù)豐富樣本特征且不增加運算成本。
2QR分解稀疏表示
稀疏表示(sRC)的基本思路是將待測試樣本表示為所有訓(xùn)練樣本的線性組合,利用e1范數(shù)最小化求出稀疏表示系數(shù),最后根據(jù)測試樣本在每一類訓(xùn)練樣本的重建誤差作出分類決策。
4實驗結(jié)果及分析
為了驗證本文方法在人臉識別上的有效性,在標(biāo)準(zhǔn)ORL、Yale和AR人臉數(shù)據(jù)庫上進(jìn)行實驗驗證。
4.1數(shù)據(jù)庫
ORL人臉數(shù)據(jù)庫包含了400張不同的人臉圖像,分別由40名志愿者,每人10張照片組成,所有照片背景均為黑色,每幅樣本圖像為112×96像素大小,人臉部分存在面部表情、光照強(qiáng)度和面部朝向方面的差異。
Yale人臉數(shù)據(jù)庫由耶魯大學(xué)計算機(jī)視覺與控制中心創(chuàng)建,包含了15位志愿者每人11幅圖像,總共165幅灰度圖像,同一個體包含了不同光照、表情、姿態(tài)(睜眼與閉眼)及遮擋(戴眼鏡與不戴眼鏡)方面的變化。
AR人臉數(shù)據(jù)庫由西班牙巴塞羅拉計算機(jī)視覺中心創(chuàng)建,包含了126位志愿者(76男性和60女性)對應(yīng)的每人26張人臉圖像,每類人臉包含了不同光照、表情變化(微笑、憤怒、冷漠、驚訝和悲傷等)、遮擋(墨鏡和圍巾);實驗中隨機(jī)選取包含50位男性和50位女性每人26張共2600張人臉圖片進(jìn)行實驗。
在實驗中,為了保證稀疏表示過程具有足夠多的訓(xùn)練樣本充分表示測試樣本,保證訓(xùn)練字典的樣本數(shù)量大于樣本維數(shù),同時兼顧圖像結(jié)構(gòu)細(xì)節(jié)信息,在算法測試階段將原始樣本向下取樣至28×24像素大小。
4.2樣本重構(gòu)
R值和T值不同,NMF重構(gòu)圖像質(zhì)量會相差較大。以O(shè)RL數(shù)據(jù)庫中一個樣本進(jìn)行重構(gòu)分析,如圖3所示,固定維度R不變,迭代次數(shù)太低,重構(gòu)圖像會引入條紋干擾,迭代次數(shù)太高,重構(gòu)圖像會近似于原圖,但會增加運行時間。如圖4所示,固定迭代次數(shù)T不變,維度太低,對原圖的特征繼承不夠,會引入額外的干擾信息,維度太高,會使計算復(fù)雜度變高。對比迭代次數(shù),和矩陣維度R,參數(shù)T對圖像質(zhì)量的影響更大,選擇合適的參數(shù)T和R,才能充分表達(dá)原圖特征且減少計算復(fù)雜度。
為了探究NMF參數(shù)R和T對識別率的影響,以每組參數(shù)重構(gòu)NMF圖像,隨機(jī)每類訓(xùn)練樣本數(shù)量取值為1~5,在ORL數(shù)據(jù)庫下固定矩陣維度R,識別率隨迭代次數(shù)T的變化如圖5所示。在Yale數(shù)據(jù)庫下固定迭代次數(shù)T,識別率隨矩陣維度R的變化如圖6所示。針對不同數(shù)量訓(xùn)練樣本下,識別率的變化呈現(xiàn)近似相關(guān)性,融合合適的參數(shù)R和T,能夠獲得最佳識別率。
4.3實驗結(jié)果
為了研究本文方法的有效性,在ORL、Yale和AR人臉庫上進(jìn)行識別率的對比實驗與分析。以數(shù)據(jù)庫中每類原樣本和NMF重構(gòu)樣本進(jìn)行對比實驗,分別隨機(jī)選擇1~5張樣本進(jìn)行訓(xùn)練,對剩下的樣本進(jìn)行測試,均采用QR分解稀疏表示分類,自適應(yīng)尋找參數(shù)R和T,直到找到最佳識別率。實驗環(huán)境是Intel Core i7-6800CPU 2.4GHz,8GB運行內(nèi)存和MATLAB 2016a實驗平臺條件下進(jìn)行50次隨機(jī)取樣實驗且都是在最佳參數(shù)R和T下的平均識別率以及對應(yīng)的最高識別率,實驗結(jié)果如表1-表3所示,在樣本存在光照、姿態(tài)、表情、遮擋等干擾情況下,該方法均具有較好效果。
為了研究本文算法運算時間復(fù)雜度,在ORL人臉數(shù)據(jù)庫上進(jìn)行了實驗分析。選取每類樣本1~5張樣本作為訓(xùn)練集,其余樣本作為測試集,同時分析了本文算法在已知最優(yōu)參數(shù)下的時間復(fù)雜度。實驗結(jié)果如表4所示,分別對原圖和本文算法在測試階段的識別時間以及本文算法的參數(shù)訓(xùn)練時間進(jìn)行了實驗。結(jié)果表明,本文算法在識別測試階段的時間效率與原圖識別時間效率近乎一致;實際應(yīng)用中,在單次單張、背景單一的測試情況下,可以滿足實時性要求;但該方法在自適應(yīng)參數(shù)訓(xùn)練過程中,存在參數(shù)訓(xùn)練時間過長的問題。
5結(jié)語
本文將NMF應(yīng)用于人臉識別中,提出了一種自適應(yīng)非負(fù)矩陣分解的人臉識別方法,利用原始圖像樣本構(gòu)造NMF重構(gòu)圖像,采用QR分解稀疏表示算法進(jìn)行分類,算法自適應(yīng)調(diào)整NMF參數(shù)找到最佳R和T,使得識別效果最佳。實驗結(jié)果表明,該方法在人臉表情、光照、角度和遮擋情況下均有一定的魯棒性,尤其在單樣本人臉識別下,效果尤為明顯。本文方法對NMF算法及改進(jìn)具有一定的參考意義,但自適應(yīng)找尋最優(yōu)參數(shù)訓(xùn)練過程中存在一定計算復(fù)雜度,有待進(jìn)一步研究。