陸振宇 傅佑 邱雨楠 陸冰鑒
關(guān)鍵詞: 二維主成分分析; 人臉識(shí)別; 改進(jìn)的感知哈希技術(shù); 多角度旋轉(zhuǎn); 圖像特征提取; 角度自矯正
中圖分類號(hào): TN911.73?34 ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)06?0055?05
Abstract: The traditional two?dimensional principal component analysis (2DPCA) only extracts the in?line features of human face image data during the transformation, and the feature extraction is relatively single direction?oriented, without considering feature extractions in other directions. Therefore, a human face recognition algorithm based on the improved 2DPCA is proposed, so as to extract image features from multiple angles and provide more abundant information for recognition. In the algorithm, the tilt angle self?correction is conducted for human face images, and meanwhile, the low frequency information of images is extracted. The improved perceptual hash technology is used to obtain the "fingerprints" of images. The multi?angle rotation is conducted for human face images after self?correction. Features are respectively extracted to obtain the image feature information after multi?angle rotation. The new algorithm was tested with the ORL human face library. The results show that the improved algorithm is superior to the traditional 2DPCA.
Keywords: 2DPCA; human face recognition; improved perceptual hash technology; multi?angle rotation; image feature extraction; angle self?correction
人臉識(shí)別技術(shù)由于采集的特征不易被他人偽造與竊取,同時(shí)屬于非接觸性的生物特征采集技術(shù),具有隱蔽、方便和隨意采集的優(yōu)勢(shì),是當(dāng)前身份驗(yàn)證的主要方法之一[1?2]。
目前,人臉識(shí)別方法較多。主流的人臉識(shí)別技術(shù)可分為三類。第一類,基于幾何特征的方法;第二類,基于模版的方法,這一類包括了特征臉方法、線性判別分析方法、奇異值分解方法、神經(jīng)網(wǎng)絡(luò)方法和動(dòng)態(tài)連接匹配方法等;第三類,基于模型的方法,其中包括隱馬爾可夫模型,主動(dòng)形狀模型和主動(dòng)外觀模型的方法等[3?4]。本文采用基于模版的方法:特征臉的方法,基于2DPCA(二維主成分分析)算法的改進(jìn)。2DPCA算法是基于PCA(主成分分析)方法的改進(jìn),其直接利用二維投影的方法,特征提取時(shí)基于二維矩陣而不是一維向量。使用2DPCA計(jì)算出來的協(xié)方差矩陣與PCA計(jì)算出來的協(xié)方差矩陣相比,要相對(duì)直觀與便捷,計(jì)算量也大大減少,耗時(shí)減少,提取特征更加高效[2]。
將自校準(zhǔn)角度后的樣本圖像先進(jìn)行縮小尺寸,壓縮成32×32大小,然后計(jì)算圖像DCT變換,得到32×32的DCT系數(shù)矩陣,再提取左上角8×8的矩陣,它是圖片的最低頻率部分,傳統(tǒng)算法是直接計(jì)算這64個(gè)值的平均值,將每個(gè)位置的值與均值進(jìn)行比較[16]。
為了突出頻率分布的特點(diǎn),本文將8×8的矩陣進(jìn)行統(tǒng)一分塊劃分為4個(gè)4×4的矩陣,如圖3所示;然后分別計(jì)算每個(gè)4×4矩陣的16個(gè)值的平均值,矩陣的每個(gè)位置的值分別與對(duì)應(yīng)的均值進(jìn)行比較,大于或等于均值的位置賦值為1,其他位置賦值為0,將共64位的比較結(jié)果,按順序組合在一起,構(gòu)成一個(gè)64位的整數(shù),便得到這張圖像的“指紋”;最后計(jì)算不同圖像的指紋之間的漢明距離,即兩個(gè)字符串對(duì)應(yīng)位置的不同字符的個(gè)數(shù)[16]。漢明距離距離越小,認(rèn)為兩幅圖像之間低頻部分更相似。最后綜合主成分分析結(jié)果,得出識(shí)別結(jié)果。