游清清,諶海云
( 西南石油大學(xué),四川 成都 610500 )
職業(yè)教育培訓(xùn)和學(xué)業(yè)能力考試是企業(yè)和社會(huì)選拔人才的重要手段和主要途徑,培訓(xùn)和考試的種類復(fù)雜多樣,難度也越來越大。隨著社會(huì)競爭愈加激烈,學(xué)生或考生為了取得好成績,在相關(guān)考試中使用各種各樣的作弊手段,極大影響考試的公平性。如何保證考試的公平公正,是亟待解決的主要問題??荚囎鞅资侄沃谐R姷膴A帶、抄襲、利用電子高科技等作弊方式目前已有較好的解決方法,但是考生替考現(xiàn)象目前僅能通過傳統(tǒng)的監(jiān)考人員人工驗(yàn)證來防范。人工驗(yàn)證由于存在驗(yàn)證時(shí)間短、驗(yàn)證人數(shù)多、證件易修改、人為影響等諸多不利因素,無法完全達(dá)到防作弊效果。隨著計(jì)算機(jī)視覺的逐步發(fā)展,生物識(shí)別技術(shù)(指紋識(shí)別、虹膜識(shí)別、人臉識(shí)別等)被廣泛應(yīng)用到各個(gè)領(lǐng)域當(dāng)中,其中就包括了身份驗(yàn)證領(lǐng)域?;诖?,本文提出基于人臉識(shí)別的身份驗(yàn)證工具,以加強(qiáng)考試身份驗(yàn)證管理,杜絕替考現(xiàn)象發(fā)生。
目前對于人臉識(shí)別研究大多是在多訓(xùn)練樣本數(shù)據(jù)集的基礎(chǔ)上進(jìn)行識(shí)別,對于一些場景,例如信用卡、駕照、個(gè)人身份驗(yàn)證(包括本文涉及到的身份驗(yàn)證情況)等場所,人在注冊時(shí)只能獲得一幅圖像,在人臉驗(yàn)證時(shí)只有一張訓(xùn)練樣本,從而產(chǎn)生了小樣本問題。由于小樣本問題僅有單一的訓(xùn)練樣本,無法從中獲取樣本的類內(nèi)信息,傳統(tǒng)的人臉識(shí)別算法識(shí)別效果大大下降,甚至不能使用。
研究表明,不同的人臉具有相似形狀和輪廓,并且由于姿態(tài)、光照、表情等因素導(dǎo)致每個(gè)人人臉圖像的變化也具有較強(qiáng)的相似性,所以區(qū)分每個(gè)類的鑒別特征可以從其他類學(xué)習(xí)得到。基于此,文獻(xiàn)[2]中提出通用學(xué)習(xí)框架法來解決小樣本問題,該方法利用通用框架庫學(xué)習(xí)特征空間,將訓(xùn)練庫與待測試樣本投影至該特征空間中,采用距離度量,投影在該特征空間的訓(xùn)練庫中與待測試庫中距離最近的樣本類別即待測試樣本的類別。文獻(xiàn)[3]中提出了擴(kuò)展稀疏表示算法(ESRC),利用類內(nèi)圖像相減,即用訓(xùn)練庫中的圖像減去對應(yīng)的均值圖像,得到擴(kuò)展的訓(xùn)練樣本庫稱作誤差圖像,將誤差圖像與訓(xùn)練樣本組成字典,得到測試庫中圖像的稀疏表示,從而對待檢測圖像進(jìn)行識(shí)別。該方法雖然提高了識(shí)別率,但是研究發(fā)現(xiàn),ESRC 中使用的字典為固定字典,并不能夠?qū)θ四樳M(jìn)行準(zhǔn)確的描述。因此本文提出使用稀疏變化字典學(xué)習(xí)(SVDL)算法重構(gòu)人臉圖像,通過多次更新系數(shù)學(xué)習(xí)最稀疏的字典,得到人臉圖像的最優(yōu)表示,從而完成對待檢測樣本的識(shí)別,該方法在人臉表情、姿態(tài)光照等發(fā)生變化時(shí)仍具有較好的識(shí)別效果。
稀疏表示(Sparse Represent)最初是為了壓縮重建高維信號(hào)。稀疏表示高維信號(hào)主要是利用一組矩陣(字典)對原始信息用進(jìn)行線性表示,用較少的數(shù)據(jù)對原始信息進(jìn)行傳輸、處理存儲(chǔ)等。稀疏表示利用了信號(hào)的稀疏性對其進(jìn)行數(shù)學(xué)建模,通過含有少量非零元素的稀疏矩陣反映信號(hào)的性質(zhì)與結(jié)構(gòu),該方法簡潔高效地表示了信號(hào),較大程度降低了信號(hào)處理過程中的復(fù)雜度。
給定一個(gè)字典其中M << N,該字典的原子可以張成N維歐式空間,稱該字典為過完備字典。設(shè)向量x為人臉圖像X的向量表示形式,長度為M。該人臉圖像可由上述過完備字典線性展開,即:
其中為系數(shù)向量。
由于過完備字典Ψ列數(shù)大于行數(shù),因此在上述方程求解過程中,未知數(shù)大于方程數(shù),即式(1)為欠定的,存在無窮解。圖像的稀疏表示求解是為了使得系數(shù)向量α盡可能稀疏,即系數(shù)向量中非零元素盡可能少。向量的0-范數(shù)是指向量中非零元素的個(gè)數(shù),由此將圖像的稀疏表示求解問題轉(zhuǎn)換為求解下式優(yōu)化問題:
假設(shè)系數(shù)向量α為k稀疏的,即向量中非零元素有k個(gè)。這里的x和α為人臉圖像x在時(shí)域空間與Ψ域空間的不同表示,此時(shí)的k≤N,表明該圖像x是可以被壓縮表示的。
在實(shí)際應(yīng)用中,式(2)還可以表示為:
上式指在小于k個(gè)原子的條件下,使得表示誤差盡可能小。
在式(2)求解過程中,當(dāng)字典Ψ為正交基矩陣時(shí),其解較易得到,但是對于一個(gè)過完備字典來說,稀疏表示求解問題變成了一個(gè)NP難題,且很難對其進(jìn)行稀疏逼近。一些學(xué)者們通過數(shù)學(xué)推導(dǎo)發(fā)現(xiàn),在約束等距性條件下,0-范數(shù)與1-范數(shù)求解值相同。因此在滿足約束等距性條件下,一般選擇l1范數(shù)逼近l0范數(shù)。約束等距性是指投影前信息中各元素的距離在投影后各元素之間的保持不變,數(shù)學(xué)描述為對于一個(gè)整數(shù)s=1,2,…,定義矩陣A的等距常數(shù)δs為滿足下式的值:
在滿足約束等距性條件下,式(4)可轉(zhuǎn)換為式(5)所示。
求解模型(5)得到的系數(shù)向量,可較好反映出圖像信息。在求得系數(shù)向量之后,可根據(jù)過完備字典Ψ,重構(gòu)出原始圖像,最后通過比較原始圖像與重構(gòu)圖像之間的表示殘差對圖像完成最終分類,殘差r如式(6)所示。
針對小樣本識(shí)別問題,在稀疏表示的基礎(chǔ)上進(jìn)行擴(kuò)展延伸,提出通用框架庫法,該方法從其他類別的數(shù)據(jù)庫中學(xué)習(xí)到可區(qū)分待檢測類的類內(nèi)特征,根據(jù)訓(xùn)練樣本重構(gòu)出測試圖像,對其進(jìn)行識(shí)別驗(yàn)證。通用框架庫法有很多,本文主要采用Yang Meng等人于2013年提出的稀疏變化字典學(xué)習(xí)算法完成小樣本人臉識(shí)別。
稀疏變化字典學(xué)習(xí)的基本原理是將訓(xùn)練庫中的人臉圖像自適應(yīng)投影在參考子集中,從變化子集中學(xué)習(xí)稀疏變化字典,重構(gòu)出待檢測人臉可能出現(xiàn)的變化,最后根據(jù)得到的自適應(yīng)投影項(xiàng)與變化字典學(xué)習(xí)項(xiàng)得到人臉圖像的最終表示,并完成人臉的識(shí)別驗(yàn)證。
稀疏變化字典學(xué)習(xí)算法模型如式(7)所示,包含自適應(yīng)投影項(xiàng)和變化字典學(xué)習(xí)項(xiàng)。
其中,D為待學(xué)習(xí)的字典,γi為gi的稀疏表示,為自適應(yīng)投影項(xiàng),為變化字典學(xué)習(xí)項(xiàng)。在變化字典學(xué)習(xí)項(xiàng)中,通過稀疏向量γi將變化矩陣Xi投影到字典D上得到訓(xùn)練庫的變化矩陣。
自適應(yīng)投影項(xiàng)主要是將訓(xùn)練庫中的圖像自適應(yīng)在投影參考子集中,訓(xùn)練圖庫中的第i個(gè)人臉可由參考子集近似得到,即因此自適應(yīng)投影項(xiàng)可定義為:
訓(xùn)練庫對應(yīng)的具有其他變化的圖像定義為Yi(即為待測試圖像),可近似表示為:
由于待測試人臉圖像的變化較多且未知,使得變化矩陣維數(shù)過大且冗余,因此使用一個(gè)較為簡潔緊湊的字典D來表示待測試圖像。字典其中dj為字典D的原子。變化字典學(xué)習(xí)項(xiàng)為:
其中為的稀疏表示,為常數(shù)。分別表示系數(shù)矩陣項(xiàng)和字典原子基礎(chǔ)項(xiàng)。
由此可得SVDL算法的整體模型如式(11)所示。
為了求得SVDL模型的最小值,可對式(11)分成兩部分求解:自適應(yīng)投影項(xiàng)與變化字典學(xué)習(xí)項(xiàng)。
在進(jìn)行替代優(yōu)化前,初始化γi值。
將初始化后的γi值帶入式(10)中,為了描述方便,使得得 :
采用變量交替優(yōu)化的策略求上式解。固定字典D,使用BP算法求解為每個(gè)樣本得到相應(yīng)的Bi,以Bi為初值更新字典D,可將式(13)寫為:
使用基于逐列更新策略的KSVD算法更新字典D,更新第i列元素時(shí),其他列元素保持不變,令di表示字典D的第i列元素,Bi表達(dá)稀疏矩陣B的第i行元素,則式(14)可重寫為:
式中是固定的,使用K_SVD算法對上式最小化。根據(jù)以上反復(fù)迭代求得字典D和樣本集Y的稀疏表示矩陣B。
確定字典D和稀疏表示矩陣B之后,式(11)變?yōu)椋?/p>
對該式求導(dǎo)得最小值,即:
為驗(yàn)證算法的有效性,在不同的數(shù)據(jù)庫上進(jìn)行對比,同時(shí)也與目前流行的算法(PCA、SVM、SRC、CRC、ESRC等)進(jìn)行了比較,結(jié)果如下所述。
1)AR數(shù)據(jù)庫測試
進(jìn)行實(shí)驗(yàn)時(shí),將AR數(shù)據(jù)庫分為s1和s2,兩個(gè)庫包含了光照、表情、遮擋等變化,分別進(jìn)行實(shí)驗(yàn)后結(jié)果如表1和表2所示。
2)CMU-PIE數(shù)據(jù)庫測試
將CMU-PIE數(shù)據(jù)庫分為四個(gè)部分(s1、s2、s3),其中s1為不同光照下的人臉,s2為不同表情的人臉、s3為不同姿態(tài)的人臉,結(jié)果如表3所示。
3)Extended YaleB數(shù)據(jù)庫測試
Extended YaleB數(shù)據(jù)庫包含了38個(gè)志愿者在9種姿態(tài)、64種光照下采集的人臉圖像,每人64張,實(shí)驗(yàn)結(jié)果如表4所示。
表1 AR數(shù)據(jù)庫對比實(shí)驗(yàn)(s1)
表2 AR數(shù)據(jù)庫對比實(shí)驗(yàn)(s2)
表3 CMU-PIE-database
表4 Extended YaleB
(4)自建庫測試
為選擇合適的通用數(shù)據(jù)庫應(yīng)用在實(shí)踐中,在自建庫中進(jìn)行實(shí)驗(yàn)。分別選擇AR數(shù)據(jù)庫、CMU-PIE數(shù)據(jù)庫、ORL數(shù)據(jù)、FERET數(shù)據(jù)庫、Extended YaleB數(shù)據(jù)庫作為通用數(shù)據(jù)庫,自建庫中每類人臉的第二張圖像為訓(xùn)練圖像,其余為測試圖像,實(shí)驗(yàn)結(jié)果如表5所示。
表5 FERET-database
從稀疏變化字典學(xué)習(xí)算法在不同的人臉數(shù)據(jù)庫上進(jìn)行的實(shí)驗(yàn)可以看出,該算法通過使用通用框架庫,提取了樣本的類內(nèi)信息,解決了小樣本問題,并增強(qiáng)了算法對光照表情變化的魯棒性,與傳統(tǒng)的識(shí)別算法相比,一定程度上提高了識(shí)別效果。
根據(jù)系統(tǒng)功能,設(shè)計(jì)了驗(yàn)證系統(tǒng),其整體框架見圖1。系統(tǒng)主要包括三大功能模塊,分別是信息管理模塊、身份驗(yàn)證模塊和數(shù)據(jù)通訊模塊。信息管理模塊主要負(fù)責(zé)存儲(chǔ)管理從終端下載到的信息,實(shí)時(shí)人臉圖像采集和學(xué)員考生信息讀取。身份驗(yàn)證模塊主要功能是負(fù)責(zé)身份驗(yàn)證,數(shù)據(jù)通訊模塊主要用于數(shù)據(jù)傳輸、與后臺(tái)數(shù)據(jù)庫信息交互。
圖1 系統(tǒng)框架
針對上述系統(tǒng)總體框架及流程,對系統(tǒng)進(jìn)行仿真實(shí)現(xiàn)??荚囬_始時(shí),考生手持相應(yīng)證件經(jīng)過身份驗(yàn)證系統(tǒng),讀寫器讀取相關(guān)信息,檢索該考生所處考場,通過對比信息判斷是否為本考場考生,如不是,給出相應(yīng)提示,見圖2。
圖2 不屬于本考場界面
考場確認(rèn)無誤后進(jìn)行人臉驗(yàn)證,系統(tǒng)獲取人臉圖像之后,對圖像進(jìn)行處理,與庫中模擬人臉進(jìn)行比較,選擇誤差最小的作為擬身份,將考生信息與擬身份進(jìn)行比較,相一致則匹配成功并顯示考生基本信息,若無法匹配則提醒監(jiān)考人員采取人工復(fù)核,避免系統(tǒng)誤檢,見圖3和圖4。
圖3 識(shí)別成功
圖4 誤檢提示
本文采用稀疏變化字典學(xué)習(xí)算法,利用通用框架庫的思想,解決了小樣本問題中難以獲取樣本類內(nèi)信息的問題,同時(shí)對光照、表情、姿態(tài)等變化有好的魯棒性,得到更高的人臉識(shí)別精度,在此基礎(chǔ)上建立了身份驗(yàn)證系統(tǒng),具有實(shí)時(shí)有效特性。
[1]王科俊,段勝利,馮偉興.單訓(xùn)練樣本人臉識(shí)別技術(shù)綜述[J].模式識(shí)別與人工智能,2008,21(5).
[2]Wang J,Plataniotis K N,LuJ,etal.On solving the face recognition problem with one training sample per subject[J].Pattern recognition, 2006,39(9):1746-1762.
[3]Deng W,HuJ,GuoJ.ExtendedSRC:undersampledface recognition via intraclass variant dictionary[J].IEEE transactions on pattern analysis &machine intelligen ce,2012,34(9):1864-1870.