兩種人臉識別技術(shù)對比研究
丘華敏
(國網(wǎng)福建省電力有限公司泉州電力技能研究院,福建 泉州? 362000)
摘? 要:人臉識別技術(shù)作為一種生物識別技術(shù)得到了廣泛的應(yīng)用,實現(xiàn)人臉識別的方法多種多樣,其中特征提取是人臉識別最重要的步驟之一。本文重點介紹了兩種主流的人臉識別技術(shù),即主成分分析和線性判別分析,具體介紹了這兩種方法的工作原理和實現(xiàn)步驟,并通過分析其工作原理說明了它們的優(yōu)點和缺點。針對這兩種方法從識別速率、識別準(zhǔn)確率和對各種噪聲的魯棒性等方面進行比較,說明兩種方法的最佳使用條件。最后提出當(dāng)前人臉識別面臨的巨大挑戰(zhàn)和未來前進方向。
關(guān)鍵詞:人臉識別;特征提取;主成分分析;線性判別分析
中圖分類號:TP391.41? ? ? 文獻標(biāo)識碼:A 文章編號:2096-4706(2019)24-0100-02
Abstract:Face recognition technology is widely used as a biometric technology. There are many ways to achieve face recognition. Among them,feature extraction is one of the most important steps in face recognition. This article focuses on two mainstream face recognition technologies—principal component analysis and linear discriminant analysis. The working principles and implementation steps of the two methods are introduced in detail,and their advantages and disadvantages are explained by analyzing the working principles of the two methods. The two methods are compared from the recognition rate,recognition accuracy and robustness to various noises,and the best conditions for using the two methods are explained. Finally,the huge challenges faced by current face recognition and the way forward are proposed.
Keywords:face recognition;feature extraction;principal component analysis;linear discriminant analysis
0? 引? 言
隨著計算機網(wǎng)絡(luò)技術(shù)的高速發(fā)展和信息化進程的日益加快,信息安全和公共安全越來越顯示出其前所未有的重要性。準(zhǔn)確的身份識別或認(rèn)證是保證信息安全和公共安全的重要前提,人們對于既方便快捷又安全可靠的身份認(rèn)證手段的需求日益迫切,而基于人體生物特征的身份識別技術(shù)為實現(xiàn)這種需求提供了可能。在這種需求的推動下,人們已經(jīng)相繼開發(fā)出了基于聲紋、指紋、眼虹膜的生物特征識別系統(tǒng),并且也得到了成功的應(yīng)用。與上述識別技術(shù)相比較,利用人體面部特征的身份認(rèn)證則具有簡便、準(zhǔn)確、友好、使用者無心理障礙及可擴展性強等諸多優(yōu)勢,目前已在多個領(lǐng)域中得到應(yīng)用。主成分分析(PCA)和線性判別分析(LDA)是人臉識別中使用最廣泛的分析方法,并且處理步驟簡單,以下將對這兩種方法做詳細(xì)介紹。
1? 人臉識別介紹
人臉識別作為圖像分析與理解最成功的應(yīng)用之一,近年來受到了廣泛的關(guān)注。人臉識別過程包括拍攝取圖、特征提取、比較和匹配等步驟。特征提取是模式識別和數(shù)據(jù)挖掘技術(shù)中的一種重要方法。它通過一定的規(guī)則從原始數(shù)據(jù)中提取有意義的特征子集,以減少機器訓(xùn)練的時間和空間復(fù)雜度,達到降維的目的。特征提取將輸入數(shù)據(jù)轉(zhuǎn)換為特征集,而新的約簡表示包含了原始數(shù)據(jù)的大部分相關(guān)信息。人臉特征提取是人臉識別系統(tǒng)的關(guān)鍵步驟。
2? 兩種主流人臉識別技術(shù)
2.1? 主成分分析(PCA)
主成分分析(PCA)是一種降維技術(shù),可用于解決壓縮和識別問題。PCA也被稱為特征空間投影或KL變換。
PCA將原始的數(shù)據(jù)空間或圖像轉(zhuǎn)換成一個子空間的主成分,使得該子空間的第一個正交維能夠獲得圖像之間的最大方差。根據(jù)目標(biāo)的統(tǒng)計特性,該子空間的最后一個維度捕獲圖像之間的最小方差。這個變換的輸出分量是正交的或不相關(guān)的,當(dāng)用這些輸出分量描述原始向量時,均方誤差最小。
PCA是一種流行的變換技術(shù),其結(jié)果與原始樣本的單一特征分量沒有直接關(guān)系。PCA具有處理特征提取的能力,能夠捕獲樣本中最可變的數(shù)據(jù)成分,并從所有特征中選擇許多重要的特征。PCA已成功地應(yīng)用于人臉識別、圖像去噪、數(shù)據(jù)壓縮、數(shù)據(jù)挖掘和機器學(xué)習(xí)等領(lǐng)域。主成分分析主要應(yīng)用于利用主成分分析將樣本轉(zhuǎn)換為新的空間,并利用新空間的低維表示來表示樣本。將PCA方法應(yīng)用于人臉識別中,稱為特征臉技術(shù)。
科學(xué)家們在1991年提出了人臉識別的特征面方法。人臉圖像被投射到一個由特征臉定義的人臉空間中,而這組人臉的特征向量不一定對應(yīng)于孤立的特征,如眼睛、耳朵和鼻子。特征面算法利用主成分分析法進行降維,以求得人臉圖像在整個圖像空間內(nèi)分布的最佳向量。
PCA已得到了廣泛研究。它已經(jīng)成為人臉識別中最成功的方法之一,也是最具特征的方法。但是,PCA也存在一些缺點,比如:
(1)對光照和表情敏感;
(2)很難準(zhǔn)確地評價協(xié)方差矩陣;
(3)除非在訓(xùn)練數(shù)據(jù)中注明,否則無法捕獲其不變性;
(4)該方法不考慮類的可分性;
(5)本質(zhì)上依賴于圖像的灰度相關(guān)性,因此對圖像亮度和人臉姿態(tài)變化的適應(yīng)性較差;
(6)隨著數(shù)據(jù)集的增加,計算變得復(fù)雜而且計算成本高昂。
主成分分析方法試圖找到一個投影矩陣,使投影樣本的總散射矩陣的行列式最大,主成分分析的步驟包括訓(xùn)練步驟和識別步驟兩個階段:
(1)訓(xùn)練階段。這一步是從訓(xùn)練圖像中提取特征空間的過程。利用系統(tǒng)需要識別的數(shù)據(jù)樣本,建立特征矩陣,將圖像空間中的樣本轉(zhuǎn)化為特征空間中的點:1)圖像樣本采用灰度圖像;2)從二維矩陣變換到一維列向量;3)利用n張圖像的列向量形成N2*n維的數(shù)據(jù)矩陣(圖像集)X;4)計算矩陣X中數(shù)據(jù)向量的均值向量;5)用均值向量減去數(shù)據(jù)矩陣X的向量使其歸一化;6)計算該列的協(xié)方差矩陣;7)計算特征值和對應(yīng)的特征向量:找到協(xié)方差矩陣的特征向量,從而得到降維,根據(jù)對應(yīng)的特征值,將特征向量的順序由高到低排列,這個特征向量矩陣就是特征空間;8)通過將數(shù)據(jù)矩陣X投影到特征空間得到P。
(2)識別階段。這一步是從測試圖像中提取特征空間的過程。然后將這些結(jié)果與訓(xùn)練階段的結(jié)果進行比較,以獲得最小的差異:1)將被識別的圖像轉(zhuǎn)換為一維向量,然后用均值相減;2)將上一步得到的向量投影到相同的特征空間上;3)計算P中被識別圖像與所有投影樣本之間的歐氏距離,最小的歐氏距離值表示最等價的圖像。
2.2? 線性判別分析(LDA)
線性判別分析(LDA)方法也叫做Fisher線性判別(FLD),它是一種廣泛應(yīng)用于人臉圖像特征提取的方法。LDA也是一種降維技術(shù),用于分類問題。該方法試圖找出最大限度地分離不同類別圖像的投影方向。從數(shù)學(xué)角度上看,它試圖找到投影矩陣(權(quán)值),使投影圖像的類間散射矩陣與類內(nèi)散射矩陣之比最大化。類內(nèi)分散矩陣,也稱為個體內(nèi)分散矩陣,表示同一個體由于不同的光照和面部表情而產(chǎn)生的外觀變化。類間分散矩陣,也稱為個體外分散矩陣,表示由于個體不同而導(dǎo)致的外觀變化。
與基于PCA的算法相比,LDA考慮了類的降維。LDA的關(guān)鍵思想是將高維的樣本投影到最佳鑒別矢量空間,以達到抽取分類信息和壓縮特征空間維數(shù)的效果。與主成分分析相似,LDA的衍生特征也是原始數(shù)據(jù)的線性組合。由于LDA可以有效地將數(shù)據(jù)減少到低維空間中,所以它適合于數(shù)據(jù)集的圖形表示。
線性判別分析的步驟如下:
(1)計算類內(nèi)分散矩陣;
(2)計算類間散射矩陣;
(3)計算投影矩陣的特征向量;
(4)通過相似度度量將測試圖像的投影矩陣與各訓(xùn)練圖像的投影矩陣進行比較,與測試圖像最接近的訓(xùn)練圖像即為所要結(jié)果。
2.3? 兩種方式對比
研究員們通過對兩種方法的比較發(fā)現(xiàn),LDA在識別率(準(zhǔn)確率)方面優(yōu)于PCA,特別是在人臉表情干擾識別方面,PCA算法只能達到93%左右的精度水平,而LDA算法卻幾乎可以達到100%的精度水平。LDA的識別率優(yōu)于PCA是因為LDA直接處理類間的差別,而PCA不注意底層的類結(jié)構(gòu)。LDA既考慮類內(nèi)的分散矩陣,又考慮類間的分散矩陣。LDA進一步降低了PCA的維數(shù)。
在時間方面,PCA比LDA有更大的優(yōu)勢,特別是在有背景干擾的圖像識別方面。LDA算法為了獲得特征值,需要計算類內(nèi)和類間的散射矩陣。而在PCA算法中,只需要計算一個離散矩陣就可以得到特征值。因此,LDA算法比PCA算法需要更多的時間來提取特征。PCA的投影在低維的重建中是最優(yōu)的,但從識別的角度來看可能不是最優(yōu)的。在有亮度干擾的圖像中,同一人臉圖像之間的亮度變化(類內(nèi))幾乎大于人臉識別(類間)的變化。在處理亮度、背景和表情等干擾方面存在不足。
干擾和圖像數(shù)量是影響拍攝時間和識別率的因素。無干擾的圖像識別的最佳算法是PCA,因為在相同的識別率下,PCA比LDA花費更短的時間。另一方面,對于有干擾的圖像,由于LDA具有較高的識別率,因此使用LDA更佳。
3? 結(jié)? 論
人臉識別具有很好的應(yīng)用前景,但同時也面臨巨大挑戰(zhàn)。還有很多技術(shù)難題需要解決,例如,如何識別有遮擋的人臉?如何實現(xiàn)識別精度和識別速度的提高?機器學(xué)習(xí)中的支持向量機方法和深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)也同樣經(jīng)常被用于處理人臉識別,研究人員正試圖在原有的方法上進行改進或?qū)⒍喾N方法結(jié)合起來以提高人臉識別的性能。
參考文獻:
[1] 蔣小軍.人臉識別技術(shù)應(yīng)用探究 [J].現(xiàn)代信息科技,2019,3(14):91-92.
[2] 孟德順.PCA應(yīng)用中的幾個問題 [J].西北林學(xué)院學(xué)報,1995(1):89-94+42.
[3] 崔自峰,吉小華.基于線性判別分析的特征選擇 [J].計算機應(yīng)用,2009,29(10):2781-2785.
作者簡介:丘華敏(1987.05-),男,漢族,福建上杭人,本科,工程師,研究方向:信息安全、計算機系統(tǒng)應(yīng)用。