王 迪,陳岳林,蔡曉東,呂 璐
(桂林電子科技大學(xué) 機(jī)械工程學(xué)院,廣西 桂林 541004)
基于環(huán)形核的旋轉(zhuǎn)不變性特征提取方法
王迪,陳岳林,蔡曉東,呂璐
(桂林電子科技大學(xué) 機(jī)械工程學(xué)院,廣西桂林541004)
摘要:針對(duì)人臉在XOZ平面內(nèi)旋轉(zhuǎn),即在圖像所在平面內(nèi)人臉產(chǎn)生的旋轉(zhuǎn),因特征值變化大導(dǎo)致人臉識(shí)別率降低的問(wèn)題,提出了一種新穎的基于環(huán)形核的旋轉(zhuǎn)不變性特征(Circular Kernel Feature,CKF)提取方法。所提算法有兩個(gè)創(chuàng)新點(diǎn),第一點(diǎn)是給出了環(huán)形核的建立方式,定位人臉上明顯的特征部分。第二點(diǎn)是提供了特征的旋轉(zhuǎn)不變計(jì)算方式。首先建立環(huán)形核,定位人臉上明顯特征的坐標(biāo)區(qū)域;然后,用旋轉(zhuǎn)不變的計(jì)算方式獲取定位區(qū)域的特征值。在Georgia Tech人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)證明:人臉旋轉(zhuǎn)前后CKF的值相較Gabor,LBP等特征值的變化小了98%。
關(guān)鍵詞:CKF;旋轉(zhuǎn)不變;環(huán)形核
1人臉識(shí)別
人臉識(shí)別常以比較人臉特征向量的方式衡量相似度,特征向量由特征值計(jì)算方式以及特征點(diǎn)定位兩部分構(gòu)成。人臉識(shí)別的難點(diǎn)在于人臉發(fā)生旋轉(zhuǎn)的前后,人臉上相同位置的特征值發(fā)生了改變,導(dǎo)致同一個(gè)人臉旋轉(zhuǎn)前后特征向量不同,相似度降低,識(shí)別不出是同一個(gè)人。基于解決這個(gè)問(wèn)題,有提出放射變換和透視原理的人臉多紫臺(tái)矯正方法,利用改變圖像比例,旋轉(zhuǎn)角度來(lái)矯正旋轉(zhuǎn)后的人臉,但是這種方法只針對(duì)旋轉(zhuǎn)小于±45°的人臉有效[1]。還有的人臉檢測(cè)中將檢測(cè)到的區(qū)域顏色信息特征向量作為人臉特征,這種算法過(guò)分依賴人臉檢測(cè)準(zhǔn)確率而且耗費(fèi)時(shí)間較長(zhǎng)[2]。也有一些算法采用廣義旋轉(zhuǎn)不變性核函數(shù),可以大幅提高抗噪能力,但是搭建過(guò)程復(fù)雜,識(shí)別率受參數(shù)影響較大,容易過(guò)擬合[3]。
本文提出了一種旋轉(zhuǎn)不變特征,首先由ASM[4]定位到人臉的鼻尖點(diǎn),以此為旋轉(zhuǎn)中心;其次,標(biāo)定所需的人臉特征極坐標(biāo),每個(gè)特征點(diǎn)坐標(biāo)由半徑和角度兩個(gè)參數(shù)決定;最后求該坐標(biāo)附近3×3區(qū)域的像素均值作為該坐標(biāo)點(diǎn)的特征值。由此得到的特征向量依然會(huì)隨人臉旋轉(zhuǎn)發(fā)生改變,因此半徑相同的坐標(biāo)點(diǎn)的特征值要按從小到大的順序存放入特征向量。這樣即使人臉在XOZ平面內(nèi)旋轉(zhuǎn),特征向量也不會(huì)發(fā)生變化。
2CKF特征提取
提取CKF需要構(gòu)建一個(gè)環(huán)形核保存特征點(diǎn)的特征值,特征點(diǎn)由半徑和角度兩個(gè)參數(shù)決定,半徑相同的特征點(diǎn)作為一環(huán)存入一個(gè)特征向量。人臉上所有點(diǎn)之間的距離不會(huì)隨人臉旋轉(zhuǎn)發(fā)生變化,因此當(dāng)確定一個(gè)旋轉(zhuǎn)中心后,任一定位到的特征點(diǎn)在人臉旋轉(zhuǎn)前后都處在同一個(gè)環(huán)上。
2.1構(gòu)建環(huán)形核
本文提出了一種CKF特征,它提取了人臉旋轉(zhuǎn)不變性特征。
首先,為了構(gòu)建環(huán)形核本文采用了ASM模型[5]定位出圖像的鼻尖點(diǎn),如圖1所示第52號(hào)點(diǎn)作為旋轉(zhuǎn)中心點(diǎn)。半徑是由人臉上幾處關(guān)鍵點(diǎn)位置[6]決定的,本文給出5個(gè)位置,均由ASM定位獲取,它們分別到旋轉(zhuǎn)中心的連線作為5個(gè)環(huán)的半徑。如圖1所示,5條連線即5個(gè)環(huán)的半徑,這5個(gè)關(guān)鍵點(diǎn)由近及遠(yuǎn)依次為:人中頂部點(diǎn)(第56號(hào)點(diǎn))、左鼻翼最左點(diǎn)(第58號(hào)點(diǎn))、上嘴唇下沿中點(diǎn)(第67號(hào)點(diǎn))、嘴巴左邊角點(diǎn)(第59號(hào)點(diǎn))、左眼瞳孔中心點(diǎn)(第38號(hào)點(diǎn))。這些都是梯度較大點(diǎn),特征信息較多,因此選這些點(diǎn)所在環(huán)的特征值作為人臉特征信息。
圖1 ASM定位點(diǎn)圖
其中,5條連線的交點(diǎn)即第52號(hào)點(diǎn)是旋轉(zhuǎn)中心點(diǎn);鮮紅色連線的末端即人中頂部點(diǎn)(第56號(hào)點(diǎn));黃色連線的末端即左鼻翼最左點(diǎn)(第58號(hào)點(diǎn));綠色連線的末端即上嘴唇下沿中點(diǎn)(第67號(hào)點(diǎn));深紅色連線的末端即嘴巴左邊角點(diǎn)(第59號(hào)點(diǎn));黑色連線的末端即左眼瞳孔中心點(diǎn)(第38號(hào)點(diǎn))。
任意特征點(diǎn)的角度是由該點(diǎn)的半徑?jīng)Q定的,L(周長(zhǎng))=2×π×R,向下取整得到該特征點(diǎn)所在環(huán)的像素點(diǎn)個(gè)數(shù),被360°整除,得到該環(huán)上每個(gè)特征點(diǎn)的角度間隔,即人臉上每環(huán)像素點(diǎn)極坐標(biāo)確定了,如圖2所示。
圖2 每一環(huán)的角度分布圖
L=2×PI×R,N=[360/L]
(1)
式中:L表示一環(huán)有L個(gè)像素點(diǎn);“[ ]”表示向下取整;N表示一環(huán)有N個(gè)特征點(diǎn)。
2.2計(jì)算旋轉(zhuǎn)不變性特征值
算法流程如下:
1)for i=0,…,num_ring
2)for j=0,…,num_pixes
計(jì)算每個(gè)像素點(diǎn)的局部均值作為該點(diǎn)的像素值;
存入pixes[num_pixes]數(shù)組;
3)endfor;
4)for m=0,…num_pixes-1
5)for n=m+1,…,num_pixes
6)if pixes[n] temp=pixes[n]; pixes[n]=pixes[m]; pixes[m]=temp; 7)end if; 8)end for; 9)end for; 10)end; 其中:num_ring表示總環(huán)數(shù);num_pixes表示每環(huán)的特征點(diǎn)個(gè)數(shù);pixes[num_pixes]表示每環(huán)存放特征點(diǎn)的數(shù)組。具體計(jì)算過(guò)程如下。 搭建好環(huán)形核,在這些極坐標(biāo)處計(jì)算特征值并按序存放。首先,將每個(gè)極坐標(biāo)轉(zhuǎn)換為人臉圖像上的直角坐標(biāo),在每個(gè)特征點(diǎn)3×3鄰域計(jì)算像素均值,作為該特征點(diǎn)的特征值,目的是降低定位帶來(lái)的誤差,取定位到的特征點(diǎn)的特征模糊值,如圖3所示。 X=(a1+a2+a3+a4+a5+a6+a7+a8)/8 (2) 圖3 特征模糊值計(jì)算圖 式中:S={a1,a2,a3,a4,a5,a6,a7,a8}表示某像素點(diǎn)X的周?chē)?個(gè)像素點(diǎn)的集合;ai(i≤8)表示第i個(gè)像素點(diǎn)的像素值。 每環(huán)的全部特征值要按從小到大的順序依次存入一個(gè)特征向量,因?yàn)槿四槹l(fā)生旋轉(zhuǎn)前后,任一特征點(diǎn)都在同一個(gè)環(huán)上,但是在環(huán)上的位置會(huì)發(fā)生變化。因此CKF在保存特征值的時(shí)候是按序存放,即使人臉發(fā)生旋轉(zhuǎn),特征向量中的特征值順序不發(fā)生變化。旋轉(zhuǎn)前后的人臉圖像對(duì)比每環(huán)特征向量都大致相同,如圖4所示,即CKF是旋轉(zhuǎn)不變的特征。 圖4 旋轉(zhuǎn)不變性計(jì)算圖 算法流程如下: 1)for m=0,…num_pixes-1 2)for n=m+1,…,num_pixes 3)if pixes[n] temp=pixes[n]; pixes[n]=pixes[m]; pixes[m]=temp; 4)end if; 5)end for; 6)end for; 其中,num_pixes 表示每環(huán)有num_pixes個(gè)特征點(diǎn),pixes[num_pixes]表示每環(huán)的特征點(diǎn)都存放這個(gè)數(shù)組,將每環(huán)的特征點(diǎn)按特征從小到大的順序存放。因此旋轉(zhuǎn)前后同一環(huán)上的pixes[num_pixes]的值是相同的。由圖4可以看出,旋轉(zhuǎn)前后人臉的CKF相同,即CKF的旋轉(zhuǎn)不變性。 3實(shí)驗(yàn)及結(jié)果分析 3.1實(shí)驗(yàn)?zāi)繕?biāo)及過(guò)程 實(shí)驗(yàn)采用Georgia Tech人臉數(shù)據(jù)庫(kù)50人,每人15張不同姿態(tài)的人臉圖像,共計(jì)750張。使用該人臉數(shù)據(jù)庫(kù)原因如下:1)每個(gè)人都有多張XOZ平面內(nèi)的旋轉(zhuǎn)圖像;2)背景干擾小;3)像素足夠清晰。 實(shí)驗(yàn)階段將每個(gè)人的正臉和在XOZ平面內(nèi)發(fā)生旋轉(zhuǎn)的圖像取出。以單個(gè)人為例,提取正臉的CKF和一個(gè)旋轉(zhuǎn)后人臉的CKF,如圖5部分樣本所示。旋轉(zhuǎn)前后的人臉都用一個(gè)CKF構(gòu)成的特征向量表示,圖5a是旋轉(zhuǎn)前的正臉,圖5b是旋轉(zhuǎn)后的臉。計(jì)算一個(gè)人的旋轉(zhuǎn)前后圖像的特征向量的歐氏距離。同理提取人臉的Gabor[7]和LBP[8]特征,結(jié)論見(jiàn)圖6所示。 圖5 人臉數(shù)據(jù)庫(kù) 圖6 不同算法提取的特征向量歐氏距離對(duì)比圖 3.2實(shí)驗(yàn)結(jié)果與分析 實(shí)驗(yàn)結(jié)果如圖6所示,其中提取的是Georgia Tech人臉數(shù)據(jù)庫(kù)中750張圖像的CFK作為特征向量,比較旋轉(zhuǎn)前后兩圖像特征向量的的歐氏距離,平均歐氏距離為400,而提取Gabor和LBP特征作為特征向量,旋轉(zhuǎn)前后圖像的平均歐氏距離達(dá)到了20 000以上。因此實(shí)驗(yàn)證明:CFK特征較Gabor,LBP這類傳統(tǒng)特征具有較強(qiáng)的旋轉(zhuǎn)不變性。 4結(jié)束語(yǔ) 本文提取人臉的CKF特征,該特征:1)建立的環(huán)形核,核內(nèi)特征值不會(huì)隨人臉旋轉(zhuǎn)而發(fā)生改變;2)在ASM定位準(zhǔn)確時(shí),由實(shí)驗(yàn)數(shù)據(jù)可知CKF相比Gabor和LBP兩種特征,對(duì)于人臉旋轉(zhuǎn)更具有魯棒性,可推廣到人臉識(shí)別應(yīng)用領(lǐng)域。未來(lái)進(jìn)一步的研究方向是在其他平面內(nèi)改進(jìn)CKF,最終實(shí)現(xiàn)CKF適用于人臉的各種姿態(tài)變化。 參考文獻(xiàn): [1]GUO B F,LAM K M,LIN K H,et al.Human face recognition based on spatially weighted Hausdorff distance[J].Pattern recognition letters,2003,24(3):499-507. [2]祝磊,朱善安.人臉識(shí)別的一種新的特征提取方法[J].光電工程,2007,34(6):122-125. [3]HAMSICIONUR C. Rotation invariant kernels and their application to shape analysis[J].IEEE transactions on pattern analysis and machine intelligence,2009,31(11):1985-1999. [4]LI D,KONG F. Facial feature point extraction using a new improve active shape model[J].International congress on image & signal processing,2010(2):944-948. [5]MILBORROW S,MORKEL J,NICOLLS F. The MUCT landmarked face database[EB/OL].[2015-08-24]. https://www.researchgate.net/publication/264885609_The_MUCT_Landmarked_Face_Database. [6]MILBORROW S,NICOLLS F. Active shape models with SIFT descriptors and MARS[EB/OL].[2015-08-24].http://xueshu.baidu.com/s?wd=paperuri%3A%285a8b47ec4e9b9f94367f00bfa93f45c0%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Fdx.doi.org%2F10.5220%2F0004680003800387&ie=utf-8. [7]王慶軍,張汝波.基于Log-Gabor和正交等度規(guī)映射的人臉識(shí)別[J].計(jì)算機(jī)科學(xué),2011,38(2):274-276. [8]王映輝. 人臉識(shí)別—原理、方法與技術(shù)[M].北京:科學(xué)出版社,2010. 王迪(1988— ),碩士生,主研智能視頻分析與人臉識(shí)別; 陳岳林(1968— ),碩士生導(dǎo)師,主研機(jī)制、機(jī)電等; 蔡曉東(1971— ),碩士生導(dǎo)師,主研并行化圖像和視頻處理、模式識(shí)別與智能系統(tǒng)、基于云構(gòu)架的智能傳感器網(wǎng)絡(luò),為本文通訊作者; 呂璐(1992— ),碩士生,主研智能視頻分析與人臉識(shí)別。 責(zé)任編輯:時(shí)雯 Feature extraction method based on CKF for face recognition WANG Di,CHEN Yuelin,CAI Xiaodong,Lü Lu (SchoolofInformationandCommunication,GuilinUniversityofElectronicTechnology,GuangxiGuilin541004,China) Abstract:A novel mechanism named CKF(Circular Kernel Feature) for solving the problem that face recognition rate reduced by rotation is proposed in this paper. Firstly, characteristics of rotation in-variants are defined. Then, to establish the annular nuclear,striking features are located. Secondly, eigenvalues by rotation invariant method are calculated . Experimental results show that, compared with traditional Gabor and LBP, the Euclidean distance of CKF achieved 98 percent reduction using Georgia Tech database. Key words:CKF;rotation invariant;circular nucleus 中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)志碼:A DOI:10.16280/j.videoe.2016.03.001 基金項(xiàng)目:國(guó)家科技支撐計(jì)劃課題項(xiàng)目(2014BAK11B02);廣西科學(xué)研究與技術(shù)開(kāi)發(fā)計(jì)劃項(xiàng)目(桂科攻14122007-5);廣西自然科學(xué)基金項(xiàng)目(2013GXNSFAA019326) 作者簡(jiǎn)介: 收稿日期:2015-08-24 文獻(xiàn)引用格式:王迪,陳岳林,蔡曉東,等.基于環(huán)形核的旋轉(zhuǎn)不變性特征提取方法[J].電視技術(shù),2016,40(3):1-4. WANG D,CHEN Y L,CAI X D,et al.Feature extraction method based on CKF for face recognition [J].Video engineering,2016,40(3):1-4.