崔 建,游春芝
(山西醫(yī)科大學汾陽學院基礎醫(yī)學部,山西 呂梁 032200)
隨著人工智能的飛速發(fā)展,人臉識別被廣泛的應用于各個領域當中,如刷臉支付、身份認證、目標定位等。近些年來,稀疏表示[1-2]在人臉識別、深度學習等領域深受研究者的青睞,而基于稀疏表示的人臉識別往往在面臨著表情、光照、遮擋等復雜的變化環(huán)境時識別效果不大理想。如何在這種復雜變化環(huán)境中取得更好的效果,成為現階段人臉識別研究的熱點。稀疏表示理論最早是由Wright[3]等人提出并用于人臉識別領域,在理想環(huán)境下取得了較好的效果。稀疏表示的核心在于:將測試人臉圖像在L1范數約束下通過訓練樣本進行線性表出,理想狀態(tài)下同一類人臉樣本線性表示后對應的組合系數非零,而其他系數全為零。稀疏表示中系數求解需要構建一個過完備的訓練字典,而且在L1 范數約束下計算量比較大。Zhang[4]等人提出基于L2范數約束的正則化協同表示算法,討論并說明樣本整體之間的協同作用在線性表示過程中起到至關重要的作用,而且對應系數的解是封閉的,相比稀疏表示計算要快的多。文獻[5-6]中一些基于加權的稀疏表示算法相繼被提出,作者將測試樣本與訓練樣本之間的局部距離作為系數權重約束,增強稀疏表示或協同表示的線性可分性,進而增強算法的識別效果。但是如果待測人臉存在遮擋或者表情發(fā)生巨大變化時這些算法就很難取得理想的識別效果。為了增強鑒別性特征的稀疏表示性能,基于構建通用訓練樣本的算法相繼被提出。如Deng等人[7]提出一種擴展的稀疏表示算法ESRC 方法,通過訓練樣本構建人臉類內變化字典,克服樣本信息的缺失,增強稀疏表示性能;Yang 等人[8]提出一種基于局部通用表示的協同表示人臉識別算法,首先將每個人臉圖像進行分塊化處理,然后構建類內變化字典,從而提高算法的性能。
受構建通用訓練集加權約束思想的啟發(fā),本文提出了一種基于局部通用的加權協同表示人臉識別算法。為了增強協同表示的性能,我們一方面根據訓練樣本構建通用的類內變化字典,增強因光照、表情遮擋等變化訓練樣本對測試樣本的線性表示性能;另一方面為了提高協同表示中樣本之間的競爭性,以及同一類樣本的線性表示性能,我們引入加權判別項別,以便從正確的類別中獲得優(yōu)勢的線性表出,從而更高效地對人臉進行協同表示,提高表情、遮擋等環(huán)境變化下人臉識別的準確率和魯棒性。
稀疏表示的核心在于將測試樣本通過訓練樣本線性表示,并且對系數增加稀疏性條件約束。對于給定的訓練樣本A=[A1,A2…AR],測試樣本y ∈Rm×1,其中訓練樣本A 是由R 個用戶組成,Ar=[v1,v2…vm]表示第r個用戶的m張人臉數據組成的矩陣。存在線性表示使得y=Aα,如果對系數α 添加稀疏性約束后,理想狀態(tài)下稀疏系數就可以表示為x=只有同類樣本對應的系數非零,而其他系數為零。對應的目標函數就可以表示為:
其中‖ ‖0表示L0 范數,即對應系數中非零元素的個數,式⑴是一個NP 問題,不能直接進行求解。為此Wright 等人提出將目標函數進行縮放,轉化成可求解的基于L1范數約束的可求解優(yōu)化問題。即:
最后根據誤差對樣本進行分類。
為了克服基于L1 范數約束導致的計算復雜度,Zhang 等人提了一種基于L2 范數約束的正則化協同表示算法(CRC),與L1 范數約束不同,L2 范數約束強調的是樣本整體的協同作用,而非稀疏性。對應的目標函數為:
而且,式⑶的解是封閉的,根據最小二乘法,對應的系數α可表示為:
為了增強樣本的表示性能在[3-5]中研究者們提出構建局部通用變化訓練集的方法(Local Generic Weighted Collaborative Representation,LGWCR),即測試樣本y可以表示為:
與式⑴不同,式⑸增加了一項Bβ,其中B表示新構建的通用訓練樣本,B=[-Gr,…,-Gr,…,-Gr],Gr一般表示標準化人臉,Gv表示包括光照、表情、遮擋變化的一組訓練人臉。假設訓練集Gv由M 種表情變化人臉組成Gv=[,…,,…,],那么基于通用表情變化字典就可以通過Gv、Gr構造,即B=[-Gr,…,-Gr,…,-Gr],與稀疏表示不同,協同表示著重強調樣本整體之間的協作表示,而不是系數的稀疏性,基于L2范數約束的目標函數⑸就可以表示為:
記X=[A,B],S=[α β]T,根據最小二乘法系數S 就可表示為:
為了增強協同表示中樣本之間的競爭性,提高同一類樣本的線性表示性能。我們引入加權判別項別,以便從正確的類別中獲得優(yōu)勢表示。其中Ui表示第i 類訓練樣本的均值,wi表示對應類別的權重,一般來說訓練樣本的均值能夠很好地反應樣本數據的結構特征,同類樣本與其均值樣本更相似。增加該約束項可以確保來自同一類別的線性表示能夠更接近樣本的均值。基于局部通用加權稀疏表示模型的定義為:
其中γ1,γ2表示正則化參數,Ui表示第i 類樣本均值,定義為:
最后根據樣本誤差最小來判斷所屬類別:
為了驗證改進算法在人臉識別當中的有效性,我們取公開的Extended Yale B、AR 人臉數據庫進行仿真實驗,實驗對照組算法為:CRC、SRC、RPCA、LGCRC、ESRC。將所有圖像調整為大小30×30 像素的灰度圖像,并對其標準化。在SRC,CRC 中我們選擇最優(yōu)正則化參數l分別為0.0005、0.001。選用的機器是Accer筆記本電腦,Windows 10 系統,Matlab2014a,作為仿真平臺。
實驗一:Extended Yale B 人臉庫是由38 個人的2414 張人臉數據組成,按照光照角度變化又分成5 個子集。選取子集1 和2 的每個人前4 張圖像作為訓練樣本,取子集1每個對象第一張正面人臉作為標準臉,子集2、3、4、5上選取每個人臉的前兩幅圖像用于構建通用訓練集的變化人臉,其余作為測試樣本,部分實驗樣本如圖1所示。
圖1 Extended Yale B人臉數據部分樣本
在Extended Yale B 人臉庫的5 個子集上進行仿真實驗,我們將改進算法與CRC、SRC、RPCA、LGCRC、ESRC 算法進行對比,對比結果如表1 所示。整體來看,從子集1 到子集5 識別率隨著光照變化逐步識別率逐漸降低,尤其是在子集5 上識別率最高才72.7%,但是在這幾種對照試驗中我們的改進算法相比較取得很好的效果。在子集1 上改進的算法和ESRC 達到最高,改進的算法比LGCRC 略高,LGCRC 與本文算法的不同之處就在于改進的算法增加了加權條件約束項‖,用于增強協同表示中同類樣本的競爭表示。在這幾組數據集上基于通用表示算法如:ESRC、LGCRC、LGWCR 要比傳統的CRC、SRC 算法平均要高出將近10 個百分點,而且即便在子集5 上識別率基本上都能達到68.3%。隨著光照強度的變化這些傳統的基于表示的算法要比ESR、LGCRC以及本文的算法識別率要下降的快,尤其是CRC 識別率下降了40個百分點,失去了協同表示的優(yōu)勢。改進的局部通用加權協同表示算法在Extended Yale B 數據集上都比LGCRC 識別率普遍要高,平均要高出2 個百分點,說明增加加權條件約束項在通用協同表示算法中起到了一定作用,這有助于提高光照變化下協同表示的識別率,增強算法的魯棒性。
表1 Extended Yale B上的正確識別率(%)
實驗二:AR 人臉數據庫是由126 個人4000 多張彩色圖像組成,該人臉主要包括光照變化、表情變化、偽裝(眼鏡和圍脖遮擋),AR 人臉數據部分樣本如圖2所示。實驗中我們選取男女各50 個樣本作為實驗對象其余作為構建通用集。選取每個人前8張圖像作為訓練樣本,其余作為測試樣本。構建通用訓練樣本時選取每個對象第一張正面無表情變化人臉作為標準臉,其余作為變化人臉。在AR 人臉數據中基于圍脖、和眼鏡遮擋比例大約為整幅圖像的20%-40%,部分圖像帶有光照、表情的變化。
圖2 AR人臉數據部分樣本圖像
在AR 人臉數據上我們分別對基于表情、墨鏡、圍脖遮擋的復雜環(huán)境下進行實驗,實驗結果如表2所示。不難發(fā)現LGWCR性能明顯比其他算法在各種環(huán)境變化下效果要更理想。在這些復雜環(huán)境變化下LGWCR比傳統的CRC 平均高出11 個百分比,比基于通用表示的LGCRC 平均高出3 個百分比,比RPCA 平均高出4 個百分點,比ESRC 高出2 個百分點?;谕ㄓ眉乃惴‥SRC比傳統的SRC平均高出7個百分點。
表2 AR人臉數據庫識別率
為了驗證構建的通用訓練集和加權約束項在復雜環(huán)境變化下協同表示效果,取傳統的實驗方法CRC、SRC、RPCA、ESRC 等作為對照,在Extended Yale B 和AR 人臉數據庫上構建局部通用訓練樣本,結果表明,不管是ESRC、LGCRC 以及本文的新算法都比傳統的稀疏表示和協同表示識別效果有很大的提高,這說明構建通用的訓練樣本有助于加強人臉的線性表示性能,提高識別效果。
通過LGCRC 和本文算法對比,增加加權約束后,改進算法識別率也都有不同程度的提高,表明加權約束增強同類樣本的協同表示性能。而且改進的算法也是基于協同表示,其解是封閉的,要比基于稀疏表示、RPCA算法運算要快的多。
針對人臉臉識別存在的表情、遮擋等問題,提出了一種局部通用的加權協同表示算法。算法汲取了通用訓練集在遮擋等復雜環(huán)境下優(yōu)勢,而且為了增強協同表示中樣本之間的競爭性,提高同一類樣本的線性表示性能,我們在協同表示中構建加權約束項,從而更高效地對人臉進行協同表示,提高表情、遮擋等環(huán)境變化下人臉識別的準確率和魯棒性。在公開的Extended Yale B、AR 人臉數據庫進行仿真實驗,實驗結果表明算法的有效性。但是對于構建通用訓練集的算法其對訓練樣本要求比較高,容易導致協同表示信息的沉于,因此如何高效的篩選通用訓練集還有待進一步的研究。