張志強(qiáng)
(順德職業(yè)技術(shù)學(xué)院,廣東 順德 528333)
人臉識別是一種基于人的臉部特征信息進(jìn)行身份認(rèn)證的生物特征識別技術(shù),廣泛應(yīng)用于公安監(jiān)控、司法認(rèn)證、民航安檢、身份驗(yàn)證、銀行密押、社會保險(xiǎn)等領(lǐng)域中,近年來成為圖像學(xué)研究的熱點(diǎn)。目前,主流的人臉識別方法包括基于自適應(yīng)算法的特征人臉匹配方法、基于遺傳算法的特征人臉匹配方法和基于圖像閾值化算法的特征人臉匹配方法[1]。其中,最常用的是基于圖像閾值化算法的特征人臉匹配方法。傳統(tǒng)的人臉識別過程一般是先輸入需要匹配的人臉圖像,獲取其特征信息,然后和存儲在庫中的人臉數(shù)據(jù)逐一對比,最后按相似度排序,排在最上面數(shù)據(jù)即為匹配的人臉圖像,當(dāng)數(shù)據(jù)庫規(guī)模增大時(shí),匹配時(shí)間將成正比例增加,嚴(yán)重影響匹配效率[2]。
國內(nèi)外相關(guān)文獻(xiàn)對解決海量人臉匹配時(shí)間過長的問題作了相關(guān)研究。文獻(xiàn)[3]利用降維法把數(shù)據(jù)庫中的人臉特征數(shù)據(jù)和待匹配的人臉圖像信息運(yùn)用主成分分析(Principal Component Analysis,PCA)降維法歸結(jié)到一個低維數(shù)的空間,以減少特征匹配時(shí)間,加快匹配速度。但該方法需要計(jì)算出數(shù)據(jù)庫中的所有特征矩陣,海量數(shù)據(jù)庫在轉(zhuǎn)化成大矩陣時(shí)會出現(xiàn)“維數(shù)災(zāi)難”(Curse of Dimensionality)的問題,難以應(yīng)用到大規(guī)模人臉識別系統(tǒng)中。文獻(xiàn)[4]中提出的CLARANS法,要求待聚類的信息必須事先放進(jìn)計(jì)算機(jī)內(nèi)存中,這對海量數(shù)據(jù)庫顯然不合適;文獻(xiàn)[5]中提出的BIRCH法,通過一個聚類特征的三元數(shù)組來表示一簇對象的數(shù)據(jù)信息,但計(jì)算閾值相對困難;文獻(xiàn)[6]中提出的CLIQUE法,利用自頂向下的思想計(jì)算每個子空間的聚類單元來實(shí)現(xiàn)降維,但在計(jì)算k維空間的聚類時(shí),需要組合出所有k-1維子空間的聚類、運(yùn)算的時(shí)間和空間效率較低。
本文提出一種基于云的海量人臉特征匹配算法,通過云計(jì)算的強(qiáng)大運(yùn)算能力來克服傳統(tǒng)算法的弊端。首先通過廣域云網(wǎng)絡(luò)模型來提取人臉特征權(quán)值參數(shù),然后對特征參數(shù)矩陣轉(zhuǎn)換處理,最后應(yīng)用轉(zhuǎn)化后的矩陣匹配人臉特征,應(yīng)用該方法構(gòu)建的云平臺,結(jié)合改進(jìn)的ASM算法預(yù)判模型特征,可以更有效提高匹配程度。在對海量人臉圖像匹配的實(shí)驗(yàn)中,采用超過100 000張人臉圖像庫來匹配特定的1張?zhí)卣魅四?,分別采用傳統(tǒng)的車輪式匹配算法和本文算法來實(shí)現(xiàn),實(shí)驗(yàn)數(shù)據(jù)表明,本文算法較傳統(tǒng)算法匹配精度相當(dāng)?shù)那闆r下,耗時(shí)減少一半,從而驗(yàn)證了本文算法的優(yōu)勢。
云計(jì)算是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源,可以應(yīng)用到人臉匹配系統(tǒng)中進(jìn)行海量運(yùn)算。其基本思想是利用各個地區(qū)的數(shù)據(jù)庫對相關(guān)人臉信息參數(shù)進(jìn)行運(yùn)算,從而構(gòu)建海量人臉圖像運(yùn)算平臺。該平臺通常包含基礎(chǔ)云、平臺云和應(yīng)用云3大部分[7]。相應(yīng)的匹配云模型也包括基礎(chǔ)結(jié)構(gòu)層、平臺結(jié)構(gòu)層和應(yīng)用結(jié)構(gòu)層3個層次。在海量人臉特征匹配平臺的架構(gòu)中,人臉信息參數(shù)的匹配步驟是核心,總體來說按下述5個步驟進(jìn)行:
1)初始化特征人臉數(shù)據(jù)。
2)計(jì)算人臉圖像特征權(quán)值參數(shù)。
3)比較特征權(quán)值參數(shù)。
4)對比較結(jié)果進(jìn)行矩陣轉(zhuǎn)換。
5)重復(fù)步驟2),直到完成全部人臉圖像匹配。其流程圖如圖1所示。
圖1 云平臺中人臉信息參數(shù)匹配流程圖
在上述的人臉信息參數(shù)的匹配步驟中,步驟2)、3)、4)是關(guān)鍵步驟,本文重點(diǎn)研究其算法的實(shí)現(xiàn)過程。
首先要獲取待匹配人臉圖像的坐標(biāo),其公式如下:
公式(1)中,z為人臉特征的空間參數(shù),Xm為人臉圖像的特征參數(shù),U為人臉圖像像素?cái)?shù),σk為人臉圖像第k個像素點(diǎn)的灰度值,h為人臉圖像的序號。于是,按公式(2)計(jì)算出人臉圖像特征參數(shù)的逆向變換量:
公式(2)中,F(xiàn)G(m,p,n)為逆向變換值,G 為人臉圖像特征的提取系數(shù),i為人臉圖像特征的分類系數(shù),n為人臉圖像的數(shù)值分量。令Q(r2)作為人臉圖像特征點(diǎn)的坐標(biāo)關(guān)系系數(shù),Q(r2log r)作為算法的耗時(shí)系數(shù)。則應(yīng)用逆向變換算法對人臉圖像的特征向量進(jìn)行逆向變換的過程如下:
對人臉圖像空間參數(shù)進(jìn)行FR變換,設(shè)人臉圖像輪廓區(qū)域中點(diǎn)坐標(biāo)為(s1,s2),其中則根據(jù)下述公式計(jì)算人臉圖像中的特征點(diǎn),從而得出人臉圖像的特征分類參數(shù):
同理,根據(jù)下述公式計(jì)算出人臉圖像的特征數(shù)值分量方差值:
通過上述方式得到的人臉圖像特征數(shù)值分量方差,構(gòu)建人臉圖像特征數(shù)據(jù)集合 Z -[z1,z2,…,zs]。根據(jù)下述公式計(jì)算人臉圖像的特征權(quán)值參數(shù):
設(shè)人臉圖像特征維數(shù)為p,人臉圖像中所有特征構(gòu)成向量為y,y=(y1,y2,…,yp)T,且=F[y],人臉圖像中特征點(diǎn)的參數(shù)矩陣為Sy,Sy=F[yyT],均值矩陣為利用下述公式對人臉圖像的特征參數(shù)進(jìn)行矩陣轉(zhuǎn)換:
對人臉圖像的特征數(shù)值分量y的子集進(jìn)行矩陣轉(zhuǎn)換,其公式表示為:
計(jì)算人臉圖像匹配過程中的誤差,公式表示為:
根據(jù)上述算法,可以實(shí)現(xiàn)人臉圖像特征參數(shù)矩陣的轉(zhuǎn)換處理,得到與待匹配特征人臉的特征點(diǎn)在空間位置上一致的圖像,從而完成人臉圖像的對比分析。下面論述如何應(yīng)用以上算法搭建的云模型平臺來實(shí)現(xiàn)特征人臉圖像的匹配。
在應(yīng)用本文算法設(shè)計(jì)海量人臉圖像匹配云平臺前,需要先通過建立特征點(diǎn)對待匹配的人臉圖像特征數(shù)據(jù)進(jìn)行初始化處理,以保證被匹配特征具有全能型,方便后面對其進(jìn)行統(tǒng)計(jì)分析。由于在應(yīng)用平臺進(jìn)行人臉圖像特征匹配時(shí)需要對人臉特征點(diǎn)位置作初次對準(zhǔn),該操作較為耗時(shí),解決的方法是對待匹配的人臉圖像的初始唯一特征進(jìn)行預(yù)判,以保證準(zhǔn)確定位。其算法如下:
設(shè)2個相似的形狀分別為x1和x2,為把x2轉(zhuǎn)化為M(x2)+t時(shí),E取值最小,則需要計(jì)算旋轉(zhuǎn)角度θ、縮放因子s,以及平移矢量的值。E取最小值,即:
其中:
公式(10)中,W為某個人臉特征圖像數(shù)據(jù)的相似對角矩陣,該矩陣中元素wk分別為對應(yīng)各個點(diǎn)的權(quán)值,且:
設(shè)Distance(k,l)為2個特征點(diǎn)之間的有效距離,Variance(k,l)為人臉匹配過程中計(jì)算得到的方差結(jié)果,可以進(jìn)行假設(shè),得到:
設(shè)N為已對準(zhǔn)的形狀數(shù)量,n為每個形狀的手工標(biāo)定點(diǎn)個數(shù),則對準(zhǔn)的中值形狀量為:
由于在人臉特征預(yù)判時(shí)可能包含少量誤差,因此需要進(jìn)行誤差消除操作,算法如下:
其中Explained-rate是一個定值。
根據(jù)對準(zhǔn)集合中特征點(diǎn)位置互相關(guān)聯(lián)的特性,可以只用特定的幾個變量來表示對準(zhǔn)集中的大部分形狀,算法如下:
根據(jù)以上的云平臺的設(shè)計(jì)思路,結(jié)合本文的人臉匹配算法,可以構(gòu)建海量人臉圖像匹配云平臺框架。云計(jì)算的本質(zhì)是通過網(wǎng)絡(luò)進(jìn)行運(yùn)算,因此其體系結(jié)構(gòu)應(yīng)以服務(wù)為核心[8]?;谶@個本質(zhì),海量人臉圖像匹配云平臺的體系結(jié)構(gòu)應(yīng)由5部分組成:應(yīng)用層、平臺層、資源層、訪問層以及管理層,其結(jié)構(gòu)圖如圖2所示。
圖2 海量人臉圖像匹配云平臺的框架圖
從圖2可以看出,本文算法主要應(yīng)用在應(yīng)用層、平臺層和訪問層中。其中應(yīng)用層是整個云計(jì)算系統(tǒng)中最重要的組成部分,負(fù)責(zé)提供軟件服務(wù),也是系統(tǒng)完成復(fù)雜人臉特征匹配的基礎(chǔ),在該層中,結(jié)合優(yōu)化的算法可以實(shí)現(xiàn)較好的匹配功能[9];平臺層提供了對資源和服務(wù)的封裝,該層包括中間件服務(wù)和數(shù)據(jù)庫服務(wù)2部分,中間件服務(wù)為系統(tǒng)提供可擴(kuò)展的消息中間件、事務(wù)處理中間件等服務(wù),由于人臉信息量巨大,系統(tǒng)匹配時(shí)需要具備較高的處理能力,因此需要數(shù)據(jù)庫服務(wù)模塊來支持[10];訪問層作為人臉圖像匹配系統(tǒng)與外界的訪問接口,其功能是完成海量人臉數(shù)據(jù)的有效識別,以方便用戶使用云計(jì)算所需的各種支撐服務(wù),該層應(yīng)具備有效的身份驗(yàn)證功能[11]。
為驗(yàn)證本文算法的有效性,設(shè)定實(shí)驗(yàn)環(huán)境為:戴爾PowerEdge R710,48 GB DDR3內(nèi)存,2個4核CPU的服務(wù)器型計(jì)算機(jī),Windows Server 2008 64位操作系統(tǒng)以及相關(guān)的實(shí)驗(yàn)運(yùn)行軟件。實(shí)驗(yàn)過程中采用云計(jì)算仿真器,實(shí)驗(yàn)的對象為某個較小規(guī)模的人臉圖像數(shù)據(jù)庫,在該數(shù)據(jù)庫中,約存儲了100 000幅人臉圖像,圖像的大小附合本次實(shí)驗(yàn)的要求。首先應(yīng)用云計(jì)算仿真器構(gòu)建整個云計(jì)算模型,然后結(jié)合本文提出的人臉特征圖像匹配算法,搭建人臉特征匹配云平臺的整體架構(gòu),最后與傳統(tǒng)的車輪式匹配算法作比較,通過結(jié)果數(shù)據(jù)的分析比較,驗(yàn)證本文算法的優(yōu)越性。
實(shí)驗(yàn)中采用100 000幅人臉圖像建立數(shù)據(jù)集合,對某張指定的特征人臉進(jìn)行匹配(如圖3所示),分別運(yùn)用本文算法生成的云計(jì)算仿真器和傳統(tǒng)的車輪式匹配進(jìn)行仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖4所示。
圖3 表明人臉特征匹配實(shí)驗(yàn)圖
圖4 不同方法匹配時(shí)間對比圖
通過圖4的數(shù)據(jù)比較可以看出,在匹配相同數(shù)量人臉圖像的情況下,本文算法的匹配曲線斜率明顯比傳統(tǒng)算法的小,這證明了利用本文算法進(jìn)行人臉特征圖像的匹配的耗時(shí)遠(yuǎn)遠(yuǎn)少于傳統(tǒng)算法,并且隨著匹配的人臉圖像數(shù)目越多,本文算法的優(yōu)勢越明顯。如果把待匹配的特征人臉圖像增加到10幅,與數(shù)據(jù)庫中的10 000幅人臉圖像作匹配(如圖5所示),分別運(yùn)用云計(jì)算仿真器和傳統(tǒng)的車輪式匹配進(jìn)行對比,則其對比結(jié)果如表1所示。
圖5 10幅人臉圖像特征匹配
表1 戶籍圖像對比數(shù)據(jù)表
從表1的對比數(shù)據(jù)可以看出,同樣比較10 000幅人臉圖像,當(dāng)待匹配的人臉特征圖像增加到10幅時(shí),傳統(tǒng)算法耗時(shí)41 s,本文算法只耗時(shí)23 s,約為傳統(tǒng)算法的一半時(shí)間,因此,本文算法在人臉圖像數(shù)目較多的情況下進(jìn)行匹配具有較明顯的優(yōu)越性。由于軟硬件環(huán)境的限制,本次實(shí)驗(yàn)采用的人臉圖像數(shù)據(jù)庫雖然還沒有達(dá)到真正的海量規(guī)模,但也能說明本文算法在人臉圖像匹配中的優(yōu)勢。
為解決大規(guī)模數(shù)據(jù)庫人臉特征匹配時(shí)間過長、效率較低的問題,本文提出了基于云計(jì)算的大規(guī)模人臉特征圖像匹配方法,通過云計(jì)算的強(qiáng)大運(yùn)算能力來克服傳統(tǒng)算法的弊端。首先通過廣域云網(wǎng)絡(luò)模型來提取人臉特征權(quán)值參數(shù),然后對特征參數(shù)矩陣轉(zhuǎn)換處理,最后應(yīng)用轉(zhuǎn)化后的矩陣匹配人臉特征,應(yīng)用該方法構(gòu)建的云平臺,結(jié)合改進(jìn)的ASM算法預(yù)判模型特征,可以更有效提高匹配程度。在上述的實(shí)驗(yàn)與傳統(tǒng)的匹配算法作比較,取得較為滿意的效果。本文算法還未對硬磁盤空間的占用率作詳細(xì)研究,今后的工作將對本文算法與傳統(tǒng)方法在硬磁盤空間利用率上作進(jìn)一步分析,以進(jìn)一步驗(yàn)證本文算法的實(shí)用意義。
[1] 李朝友,孫濟(jì)洲.基于區(qū)域收縮的大規(guī)模數(shù)據(jù)庫人臉識別[J].計(jì)算機(jī)應(yīng)用,2012,32(7):2049-2052.
[2] 張智斌,賴劍煌,謝曉華,等.基于高低頻分量融合的人臉識別方法[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,52(4):1-6.
[3] 郝靜靜,李莉.一種基于KPCA與LDA的人臉識別改進(jìn)算法[J].電子技術(shù)應(yīng)用,2013,39(12):132-134.
[4] 徐國慶.在線模板的人臉特征點(diǎn)對齊[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34(11):4021-4026.
[5] 趙成芳,李兆延.基于縮放因子的人臉直方圖特征距離度量方法[J].西華大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,32(5):8-10.
[6] 王金云,周暉杰,紀(jì)政.復(fù)雜背景中的人臉識別技術(shù)研究[J].計(jì)算機(jī)工程,2013,39(8):196-199.
[7] 趙建勛,王兆東.軟硬件協(xié)同設(shè)計(jì)算法的嵌入式人臉識別系統(tǒng)[J].計(jì)算機(jī)仿真,2013,30(7):371-374.
[8] 許新.人臉識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].遼寧師專學(xué)報(bào)(自然科學(xué)版),2013,15(2):29-34.
[9] 朱洲,王飛,付中濤.基于人臉檢測的云臺智能控制系統(tǒng)設(shè)計(jì)[J].安防科技,2011(1):10-13.
[10] 夏振杰.基于人臉識別技術(shù)的身份認(rèn)證系統(tǒng)實(shí)現(xiàn)簡介[J].科技信息,2010(5):44.
[11] 劉彥伯,韓家新.iOS平臺下人臉識別系統(tǒng)實(shí)現(xiàn)研究[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(22):204-207.