高艷霞
(懷化學院計算機工程系,湖南 懷化 418000)
基于人耳特殊的生理位置和結(jié)構(gòu)特點,使其具備作為生物特征身份鑒證的唯一性、穩(wěn)定性、易采集性等特點,使得人耳識別是近來生物識別領(lǐng)域的一個研究熱點[1]。Chang等[2]人利用PCA算法對無遮擋人耳圖像進行識別,可達到90.9%的識別率。Burger[3]提出了一種使用Voronoi圖表的鄰接圖圖標匹配方法進行人耳識別。Victor等[4]人使用標準PCA應(yīng)用于人耳識別。Moreno等[5]人使用神經(jīng)網(wǎng)絡(luò)分類器對人耳進行識別。Hurley等[6]人利用力場轉(zhuǎn)換方法對人耳進行識別。Yuizono等[7]人利用遺傳算法進行全局搜索進行人耳識別。
目前為止,靜態(tài)人耳圖片的識別研究中關(guān)鍵問題是特征提取和特征分類器的設(shè)計兩方面,其中特征的提取是人耳識別的重要環(huán)節(jié)。當前,特征提取的方法可以分為兩大類:① 基于知識的特征提取方法。用對人耳的先驗知識作為規(guī)則,將描述人耳結(jié)構(gòu)特征、形狀特征、紋理特征作為識別特征向量參數(shù)來檢測人耳等。② 基于統(tǒng)計的特征提取方法。把人耳圖像看作是由圖像像素組成的高維向量,將人耳檢測問題轉(zhuǎn)化為高維空間信號分布的匹配問題等,考慮的是人耳的整體屬性。由于使用不同的人耳圖像庫進行檢測,且大多數(shù)檢測方法是在圖像的質(zhì)量較高,噪聲較少,人耳完整的較理想條件下進行實驗,而作為一個能夠?qū)嵱玫娜硕R別系統(tǒng), 人耳識別中遮擋問題是不可避免的。由于人耳或多或少總是會被頭發(fā)、帽子或者其他飾物遮擋,這就造成部分特征的消失,導(dǎo)致人耳圖像特征不完整,造成識別率下降。因此,很有必要對人耳受到部分遮擋的識別問題進行研究。
小波變換是近年來發(fā)展起來的一種有效的多分辨率分析工具,近年來廣泛應(yīng)用于圖像識別中。其中Gabor小波變換與哺乳動物視覺系統(tǒng)的相關(guān)特性非常一致,具有良好的魯棒性,因而可以捕獲目標在空間域和頻域的局部顯著特征。因此,研究者將其廣泛用于生物識別中,以提取出魯棒的圖像特征參數(shù)。然而,傳統(tǒng)的Gabor濾波器提取的目標特征信息過于龐大,過高的維數(shù)需要大的存儲空間造成冗余且使得識別過程非常耗時。為了降低Gabor特征的維數(shù),本文采用Gabor小波與PCA相結(jié)合,提出了一種人耳圖像的特征提取方法。首先采用Gabor濾波器把每一個輸出圖像分解成多個人耳樣本,對其進行特征提取然后利用PCA進行降維,最后挑選出分類能力優(yōu)秀的特征輸入到神經(jīng)網(wǎng)絡(luò)分類器進行分類識別。
二維Gabor小波是在一維Gabor小波的基礎(chǔ)上發(fā)展起來的,是經(jīng)正弦函數(shù)調(diào)制后的二維高斯函數(shù)。其定義為:
其中,和決定了高斯函數(shù)的標準差;u是決定濾波器徑向中心頻率的分量,x·y為空間位置坐標;θ確定了Gabor內(nèi)核的方向。
人耳圖像的Gabor 特征提取就是將該圖像與Gabor小波卷積的結(jié)果。假設(shè)原始人耳圖像為I(x)表示,則其Gabor 特征表示為:原始人耳圖像的灰度分布與Gabor核函數(shù)的卷積結(jié)果,公式的卷積輸出為復(fù)數(shù)形式,該復(fù)數(shù)的模,即為提取的Gabor 小波特征,如圖1所示。
圖1 由Gabor小波變換的人耳
通常來說,根據(jù)人耳圖像的紋理特點和生物學的研究,在提取人耳圖像的Gabor特征時,選擇5個不同尺度參數(shù)和8個方向參數(shù)上的Gabor濾波器組成濾波器組,能夠保證Gabor變換保持原有圖像絕大部分特征信息。如圖2所示,為5個不同尺度參數(shù)和8個方向參數(shù)上的Gabor濾波器組成的濾波器組在頻域中的表示:
圖2 5個不同尺度和8個方向的Gabor濾波器組
但是假設(shè)原始圖像的大小為90×60,通過40個Gabor濾波器得到幅值特征和相位特征的維數(shù)高達216000,有的特征對于人耳識別是沒有必要的,反而對后期的數(shù)據(jù)處理會造成非常大的困難,不利于分類識別。實驗發(fā)現(xiàn)由于利用Gabor提取的特征值在相鄰像素間是存在大量的冗余信息,只有對特征值進行降維和消除冗余數(shù)據(jù)處理才能解決這些問題。
人耳圖像利用Gabor濾波器所提取的特征維數(shù)集非常大,導(dǎo)致后期計算研究工作的順利進行,從而影響身份驗證效率,因此在分類之前必須進行特征數(shù)據(jù)降維處理。本文中采用主成分分析(Principal Component Analysis,PCA)降維處理。傳統(tǒng)的降維技術(shù)可分為線性和非線性兩類。其中線性降維算法主要有PCA和多維分析。
PCA是最小均方誤差意義上的最優(yōu)維數(shù)據(jù)壓縮技術(shù),通過PCA方法能夠提取原始數(shù)據(jù)中的主要特征,且所提取特征的各分量之間是互不相關(guān)的,其中包含信息成分最多的向量方向視為主要組成成分方向,摒棄其他方向及其系數(shù),由此顯著降低原圖像的維數(shù)且充分保留分類信息[8]。
PCA的具體實現(xiàn)是根據(jù)PCA原理,基于PCA的降維特征提取算法如下:
設(shè)人耳圖像為M×M維,將其排列成一維列向量,表示為下式:
用于訓(xùn)練的人耳圖像樣本總數(shù)為N,每個樣本均為M維,將其按行抽取成對應(yīng)的列向量為
其中,X=(X1-m,X2-m,…,XN-m)故構(gòu)造低維矩陣R=XTX,即根據(jù)SVD分解很容易求出R的特征值λi及相應(yīng)的正交歸一化特征向量νi,由此推論可知Cx的特征向量ui:
ui稱為特征耳,記:
實驗結(jié)果表明,將特征值按照降序排列時,從前向后取K(1 人工神經(jīng)網(wǎng)絡(luò)是在對人腦組織結(jié)構(gòu)和運行機制的認識理解基礎(chǔ)之上模擬其結(jié)構(gòu)和智能行為的模擬大腦分析過程的簡單數(shù)學模型,而粒子群優(yōu)化算法(Particle Swarm Optimization, PSO)是一類基于群智能的隨機優(yōu)化算法。利用PSO結(jié)合BP算法來訓(xùn)練前向神經(jīng)網(wǎng)絡(luò)對人耳圖像進行身份識別用以替代人工識別。有效地利用PSO具有較好的全局收斂能力和強大的魯棒性,以彌補BP神經(jīng)網(wǎng)絡(luò)易陷入局部極小、收斂速度慢和引起振蕩效應(yīng)等缺點,極大地提高神經(jīng)網(wǎng)絡(luò)的收斂速度與學習能力。 粒子群優(yōu)化算法是一種全局優(yōu)化進化算法,算法基本概念最初來自社會行為的模擬例如飛鳥和魚類集群活動,通過種群間個體協(xié)作來實現(xiàn)對問題最優(yōu)解的搜索。 PSO-BP算法訓(xùn)練網(wǎng)絡(luò)過程為: (1)首先根據(jù)神經(jīng)網(wǎng)絡(luò)的輸入、輸出樣本集確定BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)。初始化粒子群,對粒子群參數(shù)進行設(shè)置,并確定粒子的初始位置和速度。 (2)將BP神經(jīng)網(wǎng)絡(luò)的各連接權(quán)值和各閾值編碼成實數(shù)向量來作為粒子的位置向量,可用一個D維參數(shù)表示,其中則PSO優(yōu)化算法中微粒的搜尋空間維數(shù)為:D= (q·n+q) + (m·q+m)。換句話說,先按行優(yōu)先,掃描BP神經(jīng)網(wǎng)絡(luò)的權(quán)重矩陣,然后掃描所有的閾值,并編碼成實數(shù)向量,從而得到D維X向量,用來表示對應(yīng)的一個PSO中一個粒子。 (3)確定適應(yīng)值函數(shù)作為神經(jīng)網(wǎng)絡(luò)的均方誤差指標,公式如下: 式中,P是訓(xùn)練集的樣本數(shù),示第d次疊代第i個樣本的第j個輸入的網(wǎng)絡(luò)理想輸出,D為最大疊代次數(shù),yj.i表示第d次疊代第i個樣本的第j個輸出的網(wǎng)絡(luò)實際輸出。計算所有樣本通過神經(jīng)網(wǎng)絡(luò)產(chǎn)生的均方誤差,直至找到一組使均方誤差最小的最佳連接權(quán)值和閾值。 (4)由上述方法得到一組接近最優(yōu)的網(wǎng)絡(luò)權(quán)值與閾值后,然后對PSO輸出的權(quán)值和閾值作為初始值訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上,結(jié)合BP算法思想,計算出實際輸出和誤差測量值,從而對各隱層的權(quán)值和閾值進一步精確優(yōu)化,重復(fù)直至得到網(wǎng)絡(luò)權(quán)值和閾值的最優(yōu)值。 由于粒子群算法的搜索優(yōu)化模型操作簡單,計算復(fù)雜度低,并利用粒子群算法訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)下的連接權(quán)值和閾值,保證最優(yōu)解,從而有效提高神經(jīng)網(wǎng)絡(luò)尋優(yōu)速度和精度。 根據(jù)前面部分的闡述,本文提出的基于Gabor小波變換提取特征,PCA降維處理,由PSO訓(xùn)練神經(jīng)網(wǎng)絡(luò)的系統(tǒng)框圖如圖3所示。 圖3 人耳識別系統(tǒng) 整個設(shè)計的基本思路是:首先判斷人耳是否被遮擋,利用Gabor小波變換和PCA相結(jié)合,來提取局部未遮擋人耳圖像的特征參數(shù)。將提取出的特征參數(shù)送入神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,從而得到身份驗證結(jié)果,同時嘗試對不同遮擋程度人耳的人耳數(shù)字圖像進行識別研究。 實驗測試主要使用北京科技大學人耳識別實驗室提供的人耳圖像庫[9],如圖4所示。該人耳庫由60名志愿者,每人拍攝3幅右耳圖像,分別是正面一幅,輕微變化角度一幅,光照變化一幅,256灰度級。共180張圖像。每個人取3幅未遮擋圖像作為訓(xùn)練集。 在此基礎(chǔ)上人為添加遮擋物,按其遮擋部分位置的不同分別為上部、中部、下部、左部、右部,如圖5所示。在遮擋人耳和完整無遮擋人耳圖像一一對應(yīng)的方式下,選取遮擋圖像用于測試樣本集。 圖4 未遮擋的人耳圖像庫 圖5 人造遮擋人耳 圖6 由Gabor對人耳濾波結(jié)果 整個設(shè)計采用Matlab模擬實現(xiàn)人耳遮擋圖像數(shù)字識別這一過程。首先經(jīng)過圖像預(yù)處理,平滑去噪,并歸一化將圖像統(tǒng)一為90×60像素。然后利用Gabor濾波器對處理后訓(xùn)練的樣本集提取所有的人耳圖像特征參數(shù),且人耳圖像的局部細節(jié)信息主要分布在0°, 45°, 90°, 135° 4個方向,如圖6所示。所以通常只需要稀疏的提取部分節(jié)點上的Gabor特征并用PCA進行降維處理。用這些特征矢量作為網(wǎng)絡(luò)的輸入,其網(wǎng)絡(luò)的輸入是特征向量元素歸一化后的值,本研究BP神經(jīng)網(wǎng)絡(luò)采用3層結(jié)構(gòu),隱層取了24個神經(jīng)元,網(wǎng)絡(luò)的輸出采用二進制編碼代表不同人身份。 本研究以60類人作為研究,則相應(yīng)的樣本二進制編碼的位數(shù)有6位就足夠,所以輸出層的神經(jīng)元個數(shù)取為6。隱含層神經(jīng)元激勵函數(shù)選取logsig函數(shù),輸出層神經(jīng)元激勵函數(shù)選取purelin函數(shù)。 將上述PSO算法優(yōu)化后得到的網(wǎng)絡(luò)連接權(quán)值及閾值代入上述BP神經(jīng)網(wǎng)絡(luò),對人耳圖像的訓(xùn)練樣本(部分數(shù)據(jù))進行訓(xùn)練。在網(wǎng)絡(luò)滿足訓(xùn)練目標,保存各網(wǎng)絡(luò)。 此外,為了進一步說明文章所提出的算法優(yōu)劣,對采用相同的人耳圖像樣本集的前提下,還選取BPNN方法和BPNN+Gabor算法與本文方法作為對比,進行了人耳身份識別實驗,識別結(jié)果見表1。 表1 人耳圖像識別結(jié)果 實驗結(jié)果說明了人耳圖像中部和右部區(qū)域?qū)τ谧R別起到的重要作用, 此兩部分多含有豐富的人耳曲線結(jié)構(gòu)和人耳溝回分布,所以在實際應(yīng)用中,此部分遮擋情況是要盡量避免。同樣可以看到利用PSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的節(jié)點之間的權(quán)重值與閾值,具有很好地逼近效果和訓(xùn)練速度。 針對當前人耳識別中特征識別存在的難題,文章提出了基于Gabor濾波器與PCA相結(jié)合,然后利用PSO訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)來進行局部遮擋人耳識別的方法。文章首先對人耳圖像采用Gabor濾波器提取遮擋人耳特征集,然后用PCA方法對特征向量降維,大大提高識別效率,最后采用PSO和BP結(jié)合的算法訓(xùn)練人工神經(jīng)網(wǎng)絡(luò),對部分遮擋人耳識別進行檢測區(qū)分。通過人耳圖像識別的仿真實驗,結(jié)果表明,表明該方法可以有效解決人耳遮擋的典型問題,有效得到較多的人耳圖像特征信息,與傳統(tǒng)的方法相比較,識別率和準確率有明顯提升。 [1]田 瑩, 苑瑋琦.人耳識別技術(shù)研究綜述[J].計算機應(yīng)用研究, 2007, 24(4): 21-25. [2]Chang K, Bowyer K, Sarkar S, Victor B.Comparison and combination of ear and face images in appearance-based biometrics [J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003,25(9): 1160-1165. [3]Burger M, Burger W.Ear biometrics in computer vision[C]//Proceedings of 15th International Conference on Pattern Recogni- tion, 2000: 822-826. [4]Victor B, Bowyer K, Sarkar S.An evaluation of face and ear biometrics[C]// Proc.ICPR, 2002: 429-432. [5]Moreno B, Sanchez A, Velez J F.On the use of outer ear images for personal identification in Security Applications[C]//IEEE 33rdAnnual 1999 International Carnahan Conference on Security Technology, 1999:469-476. [6]Hurley D J, Nixon M S, Carter J N.A new force field transform for ear and face recognition[C]//Proceedings IEEE International Conference on Image Processing ICIP 2000, 2000: 25-28. [7]Yuizono T, Wang Y, Satoh K, Nakayama S.Study on individual recognition for ear images by using genetic local search[C]//Proceedings of the 2002 Congress on Evolutionary Computation, 2002: 237-242. [8]Nhat V D M, Lee S Y.Two-dimensional Weighted PCA algorithm for Face Recognition [C]//Proceedings 2005 IEEE International Symposium on Computational Intelligence in Robotics and Automation June 27-30, 2005, Espoo, Finland, 2005:219-223. [9]穆志純.北京科技大學人耳識別實驗室-開放式人耳圖像庫[EB/OL].http://www1.ustb.edu.cn/resb/subject/subject.htm, 2013.3 基于PSO訓(xùn)練的BP人工神經(jīng)網(wǎng)絡(luò)
4 實驗及結(jié)果分析
5 結(jié)束語