張雨婷 陳軍華 楊新凱 張麗艷
摘要:人臉識(shí)別技術(shù)是一種生物特征識(shí)別技術(shù),人臉識(shí)別系統(tǒng)把人的臉作為基礎(chǔ),依靠計(jì)算機(jī)視覺和圖像處理的相關(guān)技術(shù),研究識(shí)別人臉的方法,在圖像處理與模式識(shí)別中起到重要作用,被廣泛應(yīng)用于軍事、經(jīng)濟(jì)、刑偵、醫(yī)療、安保、考勤等方面。本文采用主成分分析(PCA)、線性判別分析(LDA)聯(lián)合算法,分析提取出的表達(dá)數(shù)據(jù)的特征,進(jìn)行人臉識(shí)別,并提高算法的準(zhǔn)確率。
關(guān)鍵詞:人臉檢測;人臉識(shí)別;PCA;LDA
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)03-0221-02
1 概述
目前,人臉識(shí)別在國內(nèi)的應(yīng)用已經(jīng)涉及公安、金融、網(wǎng)絡(luò)身份驗(yàn)證、門禁以及考勤打卡等領(lǐng)域[1-2]。以下幾方面原因使人臉識(shí)別發(fā)展得如此迅速:1)人臉識(shí)別具有非接觸性和隱蔽性。只需要人完成攝像的影像采集,具有快速、準(zhǔn)確、直觀等優(yōu)點(diǎn),還具有比較智能的監(jiān)控功能,可以自動(dòng)跟蹤、實(shí)時(shí)監(jiān)控和報(bào)警。2)人臉識(shí)別是計(jì)算機(jī)視覺研究中的代表性技術(shù)。通過分析圖片、視頻幀中是否有人臉,讓計(jì)算機(jī)用算法模擬生物系統(tǒng)的方式有效的理解圖片。3)人臉識(shí)別在比信息安全、訪問控制、人機(jī)交互、視覺監(jiān)控、出入口控制、犯罪嫌疑人的辨識(shí)和搜索方面都被用到。因此研究人臉識(shí)別算法有一定的應(yīng)用價(jià)值。
2 人臉識(shí)別算法的預(yù)處理
2.1 圖像灰度均衡化與中值濾波
灰度直方圖是圖像各像素灰度值的一種統(tǒng)計(jì)度量,其橫坐標(biāo)表示像素的灰度級別,縱坐標(biāo)表示該灰度出現(xiàn)的頻率[3],灰度直方圖能得到亮度、對比度等特征。圖像灰度均衡化可以使原始圖像整體更加清晰,這樣的效果對人臉識(shí)別十分有利。中值濾波以圖像中的某個(gè)像素作為中心,找到一個(gè)中心鄰域,取排序后的灰度值間值作為該像素點(diǎn)的新灰度值,在保護(hù)圖像尖銳邊緣的同時(shí)去除噪聲,但圖像細(xì)節(jié)不會(huì)變模糊。中值濾波既沒有對圖像造成損傷,又明顯提升了圖像的質(zhì)量,如圖1。
2.2 二值化與圖像膨脹和腐蝕
經(jīng)過灰度變換的圖像是量化的多級灰度圖像,為了進(jìn)一步突出圖像特征,需要對灰度圖像進(jìn)行二值化處理。經(jīng)過二值化后的圖像不再與灰度級相關(guān),使得圖像數(shù)據(jù)量變小,給后續(xù)操作帶來方便。膨脹和腐蝕是數(shù)字形態(tài)學(xué)的兩種運(yùn)算,是對二值圖像的連接成分進(jìn)行變換的操作,如圖2。
2.3 人臉檢測
人臉檢測[1]是判斷出人臉,再給出關(guān)鍵面部器官位置的過程。基于膚色特征的方法不依賴人臉細(xì)節(jié)特征,對姿態(tài)不敏感,具有相對穩(wěn)定性,可以快速構(gòu)造人臉檢測算法,得到一個(gè)膚色的連通區(qū)域,要對這個(gè)區(qū)域進(jìn)行膨脹和腐蝕操作,有效地解決輸出圖像靠近邊界處的區(qū)域與圖像其他區(qū)域不連續(xù)的問題。經(jīng)過膨脹和腐蝕操作后,需要去掉圖像中的非人臉區(qū)域,這些區(qū)域表現(xiàn)為一些離散的白色區(qū)域,可以再次使用膨脹和腐蝕操作,得到可能性最大的人臉區(qū)域。若得到的區(qū)域高寬比在5:4-16:9之間,則認(rèn)為是人臉區(qū)域。
3 基于PCA的人臉識(shí)別算法
3.1 算法理論基礎(chǔ)
1) K-L變換(Karhunen - Loeve Transform)是一種正交變換,其實(shí)質(zhì)是把圖像信號(hào)投影到信號(hào)子空間中,得到的協(xié)方差矩陣是對角矩陣,最大限度地除去信號(hào)分量之間的相關(guān)性,是均方誤差(Mean Square Error,MSE)意義下的最佳變換,在數(shù)據(jù)壓縮方面起到重要作用。
K-L變換后出現(xiàn)大量無用值,直接計(jì)算量太大,在保留關(guān)鍵值的基礎(chǔ)上進(jìn)行降維以保證準(zhǔn)確性。本文按信息量的百分比保留特征向量:將特征值按照降序排列。統(tǒng)計(jì)其特征值總和SUM,從上往下累加特征值,直到加上第k個(gè),其和大于e*SUM。通常取e= 90%-99%。計(jì)算公式如公式(1)所示,入為協(xié)方差矩陣的非零特征值。
3)最近鄰分類器(Nearest Neighbor Classifier, NNC)的方法是計(jì)算出測試樣本到各訓(xùn)練樣本的距離,取最小距離的訓(xùn)練樣本作為測試樣本的類別。本文選取歐氏距離,則最近鄰分類器的決策邊界就是兩個(gè)樣本連線的中垂線。
3.2 人臉識(shí)別算法原理
PCA(Principal Component Analysis)即主成分分析,PCA算法[2-3]是通過線性變換將高維空間向量投影到低維空間中,這里的線性變換一般采用K-L變換,把樣本矩陣變成一維的向量,然后從很多樣本向量構(gòu)成的矩陣中提取特征。
2DPCA(Two-dimensional Prinipal Component Analysis)即二維主成分分析,2DPCA算法[8-10]直接由數(shù)據(jù)矩陣構(gòu)造散布矩陣,能高效降低表情對人臉識(shí)別的干擾,2DPCA提取的特征比PCA更準(zhǔn)確且計(jì)算時(shí)間短,但它的計(jì)算系數(shù)較多。
LDA(Linear Discriminant Analysis)即線性判別分析,LDA算法從高維特征空間里提取出類間離散度相對較大、類內(nèi)離散度相對較小矩陣的特征,相對于PCA只有良好的圖像重構(gòu)能力,LDA能更好地區(qū)分類別,聚類效果更好。當(dāng)圖像維度很高而樣本數(shù)量很少時(shí),LDA算法取得的類內(nèi)離散矩陣并不是最優(yōu)的。
本文采用改進(jìn)的PCA+LDA算法進(jìn)行人臉識(shí)別,算法的思想是在保留特征向量最優(yōu)百分比的基礎(chǔ)上降維,再在低維空間進(jìn)行分類。
3.3 算法仿真及結(jié)果分析
仿真采用Matlab軟件,人臉數(shù)據(jù)庫采用標(biāo)準(zhǔn)人臉庫ORL(Olivetti research laboratory),該人臉庫所有的原始圖像都是256個(gè)灰度級,像素為112x92。
仿真結(jié)果如圖3所示,同樣的訓(xùn)練樣本數(shù)下,圖(a)顯示出改進(jìn)的PCA+LDA算法的識(shí)別率比PCAID、PCA2D要高,圖(b)顯示出改進(jìn)的PCA+LDA算法的識(shí)別率比基本的PCA+LDA算法要高。總體來看,改進(jìn)的PCA+LDA算法在提高人臉識(shí)別率上效果明顯。
4 總結(jié)
從人臉識(shí)別的仿真結(jié)果可以看出,相對于單獨(dú)使用PCAID、PCA2D或基本的PCA+LDA的人臉識(shí)別方法,改進(jìn)的基于PCA+LDA的人臉識(shí)別方法能更準(zhǔn)確穩(wěn)定的識(shí)別人臉圖像,效果更好。本文算法是對人臉識(shí)別算法的簡單改進(jìn),但是本文算法由于提高了算法的復(fù)雜度,而且需要大量的訓(xùn)練樣本來支撐,訓(xùn)練時(shí)間也比較長,隨著類別增加識(shí)別率也會(huì)下降,因此,如何優(yōu)化算法來提升穩(wěn)定性和準(zhǔn)確性尤為重要。
參考文獻(xiàn):
[1]柯飄.人臉檢測算法在地鐵安檢中的研究[D].大連交通大學(xué),2017.
[2]齊興敏.基于PCA的人臉識(shí)別技術(shù)的研究[D].武漢理工大學(xué),2007.
[3]吳曉天.地鐵安檢中的人臉識(shí)別算法研究[D].大連交通大學(xué),2017.