劉奇聰
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
隨著科學(xué)技術(shù)的進(jìn)步,人們急需在日常生活中使用安全高效的個(gè)人認(rèn)證方法。隨著深度學(xué)習(xí)技術(shù)的出現(xiàn)和計(jì)算能力的快速發(fā)展,自動(dòng)人臉識(shí)別系統(tǒng)(AFRS)的精度和效率在過去十年里得到了很大的提高,促進(jìn)了AFRS在許多應(yīng)用中的部署。但是,AFRS的安全問題仍然是一個(gè)大問題。例如,人們可以通過使用面部照片、視頻或3D人臉面具輕易地欺騙AFRS。這嚴(yán)重阻礙了AFRS的普及。
許多研究人員提出了許多解決方案來解決人臉防偽問題。一些研究人員提出使用LBP[3],DoG[4],HOG[5]和LBP-TOP[6]等手動(dòng)提取的紋理(或外觀)特征來區(qū)分真實(shí)的人臉與虛假的人臉。有人提出了眨眼和嘴唇運(yùn)動(dòng)等臉部運(yùn)動(dòng)特征來區(qū)分真實(shí)臉部和假面部。其他方法也被用于人臉防偽,包括三維臉部結(jié)構(gòu)分析、傅立葉光譜分析、光流分析。深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域取得了重大突破,如圖像分類、目標(biāo)檢測(cè)和人臉識(shí)別。這激勵(lì)研究人員使用深度學(xué)習(xí)技術(shù)來解決人臉防偽的問題。
與現(xiàn)有的從原始人臉圖像提取特征的方法不同,本文提出將人臉圖像轉(zhuǎn)換為邊緣圖,并在面部邊緣圖上使用卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)人臉防偽征。在圖1中,列舉出了真是的人臉與虛假的人臉以及他們的邊緣圖??梢钥闯觯吘壍貓D可以放大真人臉和假人臉之間的差異,同時(shí)抑制人臉圖像中的噪點(diǎn)。我們?cè)趦蓚€(gè)公共數(shù)據(jù)庫上進(jìn)行的評(píng)估實(shí)驗(yàn)證明,面部邊緣圖的這種特征有助于人臉防偽,特別是對(duì)于跨數(shù)據(jù)庫的欺騙攻擊。
在本節(jié)中,我們將介紹我們提出的方法的兩個(gè)關(guān)鍵組件:面部邊緣圖提取和人臉防偽特征學(xué)習(xí)。
在我們提出的方法中,首先應(yīng)用了人臉檢測(cè)以及特征點(diǎn)定位。臉部對(duì)齊基于五個(gè)特征點(diǎn),瞳孔、鼻尖以及嘴角。請(qǐng)注意,在此步驟之后,我們將圖像轉(zhuǎn)換為灰度圖像。然后將這些人臉圖像歸一化為100×100的大小,并裁剪為64×64的大小,以鼻尖所在的位置做為圖像的中心點(diǎn),瞳孔的位置與圖像邊緣的距離為24個(gè)像素。這樣圖像的大部分背景被消除。然后我們使用OpenCV 3.0中提供的Sobel算子來對(duì)圖像進(jìn)行X軸和Y軸的邊緣檢測(cè)。所得到的邊緣圖按照一定比例疊加。圖2是我們方法圖像預(yù)處理的過程。
圖1 左側(cè)為真實(shí)的人臉圖像,右側(cè)為虛假的人臉圖像,以及各自的邊緣圖
在這一部分我們將詳細(xì)介紹人臉防偽特征學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)。在我們提出的方法中,我們使用三個(gè)卷積層,三個(gè)池化層和兩個(gè)全連接層。在卷積層中,使用歸一化層。在每個(gè)卷積層之后使用共享層。ReLU非線性也被用于每個(gè)卷積層的輸出。第一個(gè)全連接層位于第三個(gè)池化層之后。另一個(gè)是Softmax層。圖3是網(wǎng)絡(luò)結(jié)構(gòu)的結(jié)構(gòu)圖。
在本節(jié)中,我們首先介紹實(shí)驗(yàn)中使用的數(shù)據(jù)庫以及實(shí)驗(yàn)結(jié)果。
在本文中,我們使用了兩個(gè)公共數(shù)據(jù)庫:CASIA Face Anti-Spoofing Database[1]和MSU Mobile Face Spoofing Database(MFSD)[2]。 CASIA人臉防偽數(shù)據(jù)庫人臉數(shù)據(jù)變化,虛假的臉孔來源于真實(shí)人臉的高質(zhì)量臉部圖像。有三種類型的圖像質(zhì)量:低質(zhì)量,正常質(zhì)量和高質(zhì)量。有三種人臉欺騙攻擊,即切割照片攻擊,視頻攻擊和歪曲照片攻擊。在這個(gè)數(shù)據(jù)庫中包含600個(gè)視頻剪輯。每個(gè)人包含12個(gè)視頻片段(3個(gè)真正的視頻和9個(gè)假的)。我們將視頻剪輯解碼成圖像并保存為JPEG圖像用于數(shù)據(jù)預(yù)處理。MSU人臉防偽數(shù)據(jù)庫包含來自35個(gè)人的280個(gè)視頻片段,根據(jù)真實(shí)數(shù)據(jù)與虛假數(shù)據(jù)的采集設(shè)備的不同,該數(shù)據(jù)庫可以分為6個(gè)部分:1)高分辨率iPad(安卓平板攝像頭)拍攝,2)移動(dòng)設(shè)備iPhone(或Android手機(jī))攝像頭3)照片Android攝像頭 4)高分辨率 iPad(電腦)攝像頭,5)iPhone/筆記本電腦攝像頭6采集自電腦攝像頭的打印照片。MSU數(shù)據(jù)庫自帶使用MATLAB代碼將視頻解碼成圖像格式的數(shù)據(jù)。在圖表1中包含了兩個(gè)數(shù)據(jù)的視頻數(shù)據(jù)與圖像數(shù)據(jù)的數(shù)量。
圖2 圖像預(yù)處理過程
圖3 網(wǎng)絡(luò)結(jié)構(gòu)示意圖
表1 數(shù)據(jù)庫中數(shù)據(jù)數(shù)量
為了得到可靠的實(shí)驗(yàn)結(jié)果,我們做了兩個(gè)實(shí)驗(yàn):1)使用CASIA數(shù)據(jù)庫的訓(xùn)練分類器并在CASIA和MFSD數(shù)據(jù)庫上進(jìn)行測(cè)試2)使用CASIA和MFSD作為訓(xùn)練數(shù)據(jù)集選取MFSD部分?jǐn)?shù)據(jù)做為測(cè)試集進(jìn)行測(cè)試。我們所做的實(shí)驗(yàn)是在具有Intel i7 CPU,NVIDIA Ge-Force GTX 980Ti顯卡和32 GB內(nèi)存的電腦上進(jìn)行的。我們用一個(gè)開源框架“Caffe”來實(shí)現(xiàn)我們提出的方法。“Caffe”是一個(gè)有效的框架,已被廣泛用于深度學(xué)習(xí),尤其是深度卷積神經(jīng)網(wǎng)絡(luò)。在第一個(gè)實(shí)驗(yàn)中,我們使用CASIA數(shù)據(jù)庫作為訓(xùn)練集,其中5000張假面圖像和2000張真實(shí)面孔作為內(nèi)部測(cè)試集。我們從MFSD中選擇4000張假面和2000張真實(shí)圖像作為外部測(cè)試集。第二個(gè)實(shí)驗(yàn)我們使用所有的CASIA數(shù)據(jù)庫和MFSD的一部分作為訓(xùn)練集,我們選擇MFSD作為訓(xùn)練集留下3000個(gè)圖像(2000個(gè)假和1000個(gè)真實(shí))的測(cè)試集。在表2中展示了兩次實(shí)驗(yàn)的實(shí)驗(yàn)精度。
我們?cè)O(shè)計(jì)了一個(gè)實(shí)驗(yàn)來證明我們提出的方法與文獻(xiàn)[2]中提到的方法相比將會(huì)表現(xiàn)得很好。這兩種方法都在CASIA[1]中進(jìn)行了訓(xùn)練,并在MFSD[2]中進(jìn)行了測(cè)試。在文獻(xiàn)[2]中,作者使用IDA(Image Distortion Analysis)和SVM來進(jìn)行臉部活性檢測(cè)。我們使用CNN和提出的網(wǎng)絡(luò)結(jié)構(gòu)和灰度圖像訓(xùn)練了一個(gè)分類器。在表3顯示了我們的方法和作者在文獻(xiàn)[2]中的結(jié)果。
表2
在本文中,我們提出了一種基于DCNN的人臉檢測(cè)方法。在MFSD上測(cè)試的實(shí)驗(yàn)表明,我們?nèi)〉昧肆己玫谋憩F(xiàn)效果。由于用于訓(xùn)練分類模型的圖像都是偏轉(zhuǎn)角度較小的正面圖像,當(dāng)測(cè)試頭像偏轉(zhuǎn)角度較大的圖像時(shí),該模型地表現(xiàn)不夠好。在接下來的工作中,我們將提高泛化能力,以適應(yīng)不同的角度。
[1]Z.Zhang,J.Yan,S.Liu,Z.Lei,D.Yi,S.Z Li.A Face Anti-Spoofing Database with Diverse Attacks.In Biometrics(ICB),2012 5th IAPR International Conference on.IEEE,pp.2631(2012)
[2]D.Wen,H.Han,A.K.Jain.Face Spoof Detection with Image Distortion Analysis.In IEEE Transactions on Information Forensics and Security,pp.746-761(2015)
[3]J.Yang,Z.Lei,S.Liao,S.Z.Li.Face Liveness Detection with Component Dependent Descriptor.In Biometrics(ICB),International Conference(2013)
[4]X Tan,Y Li,J Liu,L Jiang.Face Liveness Detection from A Single Image with Sparse Low Rank Bilinear Discriminative Model.In Computer Vision ECCV,pp 504-517(2010)
[5]J.Komulainen,A.Hadid,M.Pietikainen.Context based Face Anti-Spoofing.In Biometrics:Theory,Applications and Systems(BTAS)(2013)
[6]T.de Freitas Pereira,A.Anjos,J.M.De Martino,S.Marcel.:LBP-TOP Based Counterm easure Against Face Spoofing Attacks.In Computer Vision ACCV Workshops,pp121-132(2012)