胡俊
(四川大學軟件工程學院,成都 610065)
生物認證技術是依靠人類自身固有的生理或行為特征進行身份驗證的一種手段。而生物認證中的人臉特征又是人與人之間互相辨識的最重要和最直觀的生物特征。由于人臉識別的無侵害性和對用戶最自然、最直觀的方式,使人臉識別成為最容易被接受的生物特征識別方式。而在人臉識別中,人臉圖片會隨著年齡變換而發(fā)生變化,這就導致判斷不同年齡段的人臉圖片是否是同一個人面臨更大的困難。在實際的應用中,跨年齡人臉識別可以幫助尋找被拐賣兒童、判斷系統(tǒng)中兩張不同年齡段的圖片是否為同一個人以防止多次注冊。上述難點和應用場景使得跨年齡人臉識別成為富有挑戰(zhàn)性和研究意義的研究課題之一。
針對跨年齡人臉識別,許多學者做了各種有意義的研究,其中大致可以分為兩個策略。一個是生成策略[1-3]:是通過生成不同年齡人臉圖片來提升人臉識別的性能,但其方法需要很強的參數(shù)假設,并且具有相當高的復雜度,基本上不適合現(xiàn)實場景的應用。另一個是判別策略[4,5,6]:通過分離人臉的身份信息和年齡信息,得到一個年齡無關的特征以提升跨年齡人臉識別性能。在前深度學習時代,生成策略一般是通過模擬年齡變化來生成不同年齡的照片,判別策略一般是通過手工定義的特征來獲取身份特征和年齡特征。而隨著深度學習時代的到來,研究人員開始通過使用深度學習來提升跨年齡人臉識別的性能。其中針對生成策略,有學者利用生成對抗網絡(GAN)來生成不同年齡的人臉圖片[7]。針對判別策略,利用卷積神經網絡(CNN)來提取更有效的網絡和更好地分離人臉圖片的身份特征和年齡來提升性能[8,9]。
本文提出使用人臉劃區(qū)域策略來幫助跨年齡人臉識別,基本研究思路是利用人臉不同區(qū)域隨著年齡變化的程度不一致,劃分區(qū)域后,能使部分區(qū)域提取的特征更具有判別性。
本文使用MORPH Album 2和CACD數(shù)據(jù)庫做為訓練和測試數(shù)據(jù)。
MORPH Album 2數(shù)據(jù)庫是跨年齡人臉識別中最大的公開數(shù)據(jù)庫,包含20000個人,總共78000張圖片。對于每張圖片,都標注了其年齡和身份信息。
CACD數(shù)據(jù)庫包含2000個明星,總共163446張圖片。該數(shù)據(jù)庫除了包含年齡和身份信息,其中的圖片包含各種各樣的光照變化、姿態(tài)變化、化妝等。
圖1
圖2
由于不同的人臉區(qū)域對年齡的變化不同,如圖1所示。在眼睛區(qū)域,隨著年齡的變化,其變化也越來越大。因此筆者猜測,分離這部分人臉區(qū)域,或者能提升跨年齡人臉識別的性能。因此筆者嘗試分離人臉的眼睛區(qū)域來幫助跨年齡人臉識別。算法流程如圖2所示。
算法流程細節(jié):
(1)截取出人臉圖片中的眼睛區(qū)域的圖片,然后使其經過ResNet10層的網絡來得到512維的特征。
(2)對于原始圖片,我們把眼睛區(qū)域的值置為0,使其不包含眼睛區(qū)域的信息,然后再經過ResNet20層來得到特征。
(3)歸一化1和2的特征。
(4)連接3中歸一化后的特征來做為一個整體的特征。
(5)使用SoftmaxLoss開始訓練。
使用隨機梯度下降法并且batchsize大小為64、動力為0.9、權重衰減為0.0005的超參數(shù)來訓練網絡;其中少量的權重衰減對于模型學習是重要的;這里的權重衰減不僅僅是一個正則化矩陣,它減少了訓練誤差;對于權重w的更新規(guī)則為:
實驗中使用均值為0、標準差為0.01的高斯分布初始化了每一層的權重;對于所有層都使用了相等的學習率,學習率在訓練過程中可以調整,當訓練誤差不在下降時就將學習率除以10;學習率初始化為0.01。
我們取MORPH Album 2中的10000個人作為訓練數(shù)據(jù),另10000人作為測試數(shù)據(jù)。訓練數(shù)據(jù)和測試數(shù)據(jù)沒重復。對于測試數(shù)據(jù),我們選取最年輕的圖片組成gallery,年長的圖片做為probe。
對于CACD,我們使用通用的官方提供的CACDVS作為測試集,其中包含2000個正樣本對和2000個負樣本對。
筆者針對MORPH和CACD-VS測試集做了基準實驗和使用分區(qū)域跨年齡人臉識別的實驗。實驗結果如表1所示:
表1
由表1可以看出,在深度學習中使用分區(qū)域的策略能使得跨年齡人臉識別有一定的提升。
隨著深度學習的發(fā)展,現(xiàn)實的需要,跨年齡人臉識別越來越受研究者關注。因此本文提出了一個分區(qū)域跨年齡人臉識別的算法來提示跨年齡人臉識別的性能。本文也證明了該方法在MORPH和CACD年齡數(shù)據(jù)庫上的有效性。