摘要:針對(duì)目前數(shù)字圖像目標(biāo)識(shí)別方法中存在識(shí)別精度和實(shí)時(shí)性的問(wèn)題,該文提出一種結(jié)合Gabor小波和神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)識(shí)別方法。該方法首先對(duì)圖像進(jìn)行預(yù)處理、用Canny算子進(jìn)行邊緣提取,然后通過(guò)神經(jīng)網(wǎng)絡(luò)獲取最優(yōu)的雙Gabor小波復(fù)合濾波器參數(shù),再采用參數(shù)優(yōu)化過(guò)的濾波器組提取目標(biāo)的特征向量,最后進(jìn)行目標(biāo)的分類(lèi)和識(shí)別。實(shí)驗(yàn)表明這種方法魯棒性好、識(shí)別率高,具有較廣泛的實(shí)際應(yīng)用價(jià)值。
關(guān)鍵詞:Gabor小波濾波器;神經(jīng)網(wǎng)絡(luò);目標(biāo)識(shí)別
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)36-10328-02
Image Target Recognition Based on Gabor Wavelet and Neural Network
YE Miao1, ZHOU Ai-jun1, YUAN Feng2
(1.Nanjing Normal University, Taizhou College, Taizhou 225300, China; 2.Yangzhou Branch of China Telecom, Yangzhou 225009, China)
Abstract: At present, many algorithms for object recognition have a narrow applicability and a low effectiveness. To address this issue, this paper presents an image recognition method which based on Gabor wavelet and neural network. First of all, the images are pre-processed and the edges of objects are extracted with Canny operator. And then, the combination of Gabor wavelet and neural network is used to obtain the best parameters of dual-compound Gabor wavelet filters. At last, the filter of which parameters had been optimized is applied to extract the eigenvector of the target for object classification and identification. Experiments show that this approach is robust, with high recognition rate, and thereafter with a wide range of practical application.
Key words: gabor wavelet filter; neural networks; target recognition
數(shù)字圖像目標(biāo)的自動(dòng)識(shí)別是目前國(guó)內(nèi)外研究的熱點(diǎn)。它在智能交通系統(tǒng),工業(yè)生產(chǎn)自動(dòng)化和機(jī)器人視覺(jué)等諸多領(lǐng)域有極高的應(yīng)用價(jià)值[1], 由于Gabor小波變換在分析數(shù)字圖像的局部區(qū)域頻率和方向信息方面具有優(yōu)異的性能,故在計(jì)算機(jī)視覺(jué)及紋理分析中已經(jīng)得到廣泛應(yīng)用。而神經(jīng)網(wǎng)絡(luò)又具有自學(xué)習(xí)性、自適應(yīng)性、強(qiáng)魯棒性和推廣能力。因此在本文提出一種基于雙Gabor小波復(fù)合濾波器提取圖像目標(biāo)特征向量。并結(jié)合神經(jīng)網(wǎng)絡(luò)得到最優(yōu)化濾波器參數(shù)值的方法,以此對(duì)圖像目標(biāo)進(jìn)行識(shí)別。
1 圖像預(yù)處理
本研究以車(chē)型圖像為例進(jìn)行目標(biāo)識(shí)別。采用低誤判率和高定位精度的Canny算子[2]進(jìn)行邊緣檢測(cè),檢測(cè)結(jié)果如圖1所示。
a) 3個(gè)典型樣本 b) 邊緣檢測(cè)后的樣本
圖1 3個(gè)典型樣本和預(yù)處理結(jié)果
2 Gabor小波濾波器
二維的Gabor小波濾波器因可以同時(shí)獲取空間和頻率域的最小不確定性而常用于信號(hào)處理,并且它和人眼視網(wǎng)膜神經(jīng)細(xì)胞的感受非常相似,從而應(yīng)用于圖像處理、理解、識(shí)別等領(lǐng)域,在人臉和特征識(shí)別領(lǐng)域[3]也已成功地應(yīng)用。
二維Gabor小波濾波器定義為,其極坐標(biāo)形式定義為
(1)
其中,δ為高斯函數(shù)的標(biāo)準(zhǔn)差,ω0為復(fù)平面波的空間頻率,φ=arctan(ν/μ)是方向角, r=,θ=arctan(y/x)。
本文用兩組實(shí)Gabor小波濾波器線(xiàn)性組合成復(fù)合濾波器ΣnwnGn(n=1,2)??梢愿鶕?jù)圖像目標(biāo)的特點(diǎn)初始化w1G1+w2G2的參數(shù)值,其中w為列向量,其包含復(fù)合濾波器的線(xiàn)性組合系數(shù)wn,G為矩陣,每一列包含復(fù)合濾波器的一個(gè)Gn。為了獲取目標(biāo)的局部特征,可以假定目標(biāo)的尺寸在一定的范圍之內(nèi),因此參數(shù)α,b應(yīng)小于目標(biāo)的尺寸,一般取這個(gè)范圍的下限。復(fù)合濾波器參數(shù)的選擇要使濾波器窗口中心位于目標(biāo)頭部時(shí)的相關(guān)輸出區(qū)別于濾波器窗口中心位于目標(biāo)尾部時(shí)的相關(guān)輸出,其中J是標(biāo)準(zhǔn)函數(shù)。
標(biāo)準(zhǔn)函數(shù)的選擇:假設(shè)兩類(lèi)待識(shí)別目標(biāo)的特征矢量分別為f1,f2,在一般情況下,為了準(zhǔn)確地區(qū)分兩類(lèi)目標(biāo),特征矢量f1、f2應(yīng)當(dāng)分屬于特征空間中的兩個(gè)不同的區(qū)域。最常用的衡量?jī)深?lèi)目標(biāo)特征矢量分離和聚合程度的標(biāo)準(zhǔn)函數(shù)是:
(2)
式中,式中s表示輸入圖像的平移,zi表示所有屬于類(lèi)別i的s的平均值。E,F(xiàn)只與輸入圖像有關(guān),對(duì)識(shí)別問(wèn)題而言是固定的;由(2)式可知J與G,w有關(guān),可以用神經(jīng)網(wǎng)絡(luò)選擇G,w的參數(shù)以活得最大的J值。
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。它由3層神經(jīng)元(輸入,輸出和隱含層)和兩個(gè)連接權(quán)重集合(G,w)組成。輸入層神經(jīng)元的數(shù)據(jù)是不同的供訓(xùn)練神經(jīng)網(wǎng)絡(luò)用的圖像像素?cái)?shù)據(jù)。輸入層和隱含層之間的連接權(quán)重集合是矩陣G。在隱含層神經(jīng)網(wǎng)絡(luò)計(jì)算輸入訓(xùn)練圖像和矩陣G中的Gn的矢量?jī)?nèi)積。隱含層和輸出層之間的連接權(quán)重集合是ω。輸出層的結(jié)果用來(lái)計(jì)算J,再根據(jù)J值修改G,w以期得到最大的J值。
設(shè)A=GTEG, B=GTFG,由(2)式可知,J=(wTAw)/(wTBw)。為了找到使J最大的ω,可以采用以下的梯度迭代公式:
(3)
式中λw為收斂速度的步長(zhǎng)。本文中,每一步迭代使ω改變大約1%。同理也可以得到使 最大的G。G包含α,b,ω,φ四個(gè)參數(shù),于是有下列迭代公式:
(4)
式中,等同。
式中,λa,λb,λω,λφ是迭代步長(zhǎng)。每一步迭代使α,b,ω,φ分別改變大約1%。G包含兩個(gè)實(shí)Gabor小波濾波器,a,b,ω,φ都是矢量;diag是取對(duì)角線(xiàn)上的元素。
4 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)中輸入圖像是3類(lèi)典型的汽車(chē)圖像(小汽車(chē)、卡車(chē)和客車(chē)),參見(jiàn)圖1。特征矢量由20個(gè)分量組成,即在輸入圖像與復(fù)合濾波器相關(guān)運(yùn)算結(jié)果中沿其過(guò)中心的水平線(xiàn)上均勻取20點(diǎn)組成。結(jié)果選取80×60的小汽車(chē)圖像為例。
首先用(3)式迭代100次,再用(4)式迭代1次,最后重復(fù)上述過(guò)程300次。標(biāo)準(zhǔn)函數(shù)J隨迭代次數(shù)的變化情況參見(jiàn)圖3,從中可以看出,標(biāo)準(zhǔn)函數(shù)J隨迭代次數(shù)增加到峰值后,再下降到一個(gè)穩(wěn)定值3.80,而且穩(wěn)定值約為J初始值的4倍。這反應(yīng)了本文算法的有效性和高效性。圖4是濾波器G的連接權(quán)重w復(fù)合濾波器參數(shù)隨迭代次數(shù)的變化情況,圖中上線(xiàn)對(duì)應(yīng)于濾波器G1的連接權(quán)重w1,下線(xiàn)對(duì)應(yīng)于濾波器G2的連接權(quán)重w2。
圖3 J隨迭代次數(shù)的變化曲線(xiàn) 圖4 隨迭代次數(shù)的變化曲線(xiàn)
圖5給出a,b,ω,φ隨迭代次數(shù)變化的曲線(xiàn)圖。a)中,最下面與橫坐標(biāo)重疊的線(xiàn)是ω;水平線(xiàn)是φ,大小為π/2;最上面曲線(xiàn)是b,最后穩(wěn)定于3.45;第二條曲線(xiàn)是a,穩(wěn)定于2.00。b)中,最下面一條曲線(xiàn)ω與橫坐標(biāo)重疊;b線(xiàn)急劇下降,最后穩(wěn)定在0.25;a線(xiàn)穩(wěn)定在1.95。
a) 濾波器G1b) 濾波器G2
圖5 a,b,ω,φ迭代次數(shù)的變化曲線(xiàn)
測(cè)試樣本是訓(xùn)練樣本時(shí),當(dāng)使用表1的復(fù)合濾波器來(lái)提取特征時(shí)識(shí)別率為81%,當(dāng)使用表2時(shí)識(shí)別率為99.5%;當(dāng)測(cè)試樣本不是訓(xùn)練樣本時(shí),識(shí)別率分別為70.3%和93.4%??梢?jiàn)本文算法對(duì)復(fù)合濾波器參數(shù)的選擇是有效的。
以上的仿真實(shí)驗(yàn)是針對(duì)同三種目標(biāo)的同一方位的圖像進(jìn)行的,該算法具有較強(qiáng)的魯棒性,取得了較好的識(shí)別結(jié)果。
參考文獻(xiàn):
[1] 杜宇人,高浩軍.基于車(chē)輛輪廓定位匹配的車(chē)型識(shí)別方法[J].揚(yáng)州大學(xué)學(xué)報(bào):自然科學(xué)版,2007,10(2):62-65.
[2] WANG Li-wei, ZHANG Yan, FENG Ju-fu, et al. On the Euclidean distance of images [J].IEEE Trans. on Pattern Analysis and Machine Intelligence(S0162-8828),2005,27(8):1334-1339.
[3] 趙英男,楊靜宇.一種改進(jìn)的Gabor濾波器特征抽取算法及其應(yīng)用[J].系統(tǒng)仿真學(xué)報(bào),2005,17(9):2236-2238.