摘要:該文提出了一種飛機(jī)識(shí)別的方法,采用輪廓追蹤法去除大部分干擾項(xiàng);用矩不變量的方法描述飛機(jī)的特征;對(duì)標(biāo)準(zhǔn)Bp網(wǎng)絡(luò)算法進(jìn)行改進(jìn),使網(wǎng)絡(luò)訓(xùn)練快速,誤差小,從而使整個(gè)系統(tǒng)具有識(shí)別過程迅速、穩(wěn)定、準(zhǔn)確率高的特點(diǎn)。
關(guān)鍵詞:輪廓追蹤;矩不變量;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP183文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)14-3771-02
Plane Recognition Based on Moment Invariants and Neural Networks
ZHANG Ya-nan, YAO Guo-qing
(China University of Geosciences, Beijing 100083, China)
Abstract: This paper provides a kind of method to recognize plane. This method use contour tracking to eliminate much noise. And then, it use moment invariants to describe the feature of the plane. At last, this paper adopts Bp neural networks as its classifier. It has changed the standard Bp neural networks, making it training faster and decreasing residual, to make the whole recognition system recognize faster, more stable and more accurate.
Key words: contour tracking; moment invariants; BP neural networks
1 引言
目前,飛機(jī)的模式識(shí)別中,主要集中在特征提取和分類器的設(shè)計(jì)上。對(duì)預(yù)處理介紹較少。圖像預(yù)處理在飛機(jī)模式識(shí)別中占有重要地位,預(yù)處理結(jié)果的好壞直接影響著后期處理的效果。結(jié)合圖像中飛機(jī)的灰度和尺寸兩個(gè)條件,對(duì)已經(jīng)進(jìn)行灰度分割的二值圖像要再次進(jìn)行尺寸上的分割,可以減少后期處理的干擾項(xiàng),提高處理速度,減少?gòu)?fù)雜度。Hu最早提出矩概念[1],并證明了有關(guān)矩的平移不變性,比例不變性和旋轉(zhuǎn)不變性。本文中,采用輪廓追蹤方法對(duì)二值圖像進(jìn)行分割,采用Hu提出的矩方法提取飛機(jī)的矩特征,將改進(jìn)的Bp網(wǎng)絡(luò)作為分類器[2],進(jìn)行飛機(jī)的自動(dòng)識(shí)別。
2 圖像預(yù)處理
經(jīng)過數(shù)據(jù)處理后,獲得了一個(gè)二值圖像,它僅在灰度值上區(qū)分了飛機(jī)與背景,并沒有利用在尺度上飛機(jī)與背景不同這一因素,所以有必要對(duì)二值圖像中的目標(biāo)區(qū)域進(jìn)行尺寸上的分析,去掉那些與飛機(jī)尺寸差別比較大的并且灰度與飛機(jī)相近的區(qū)域,進(jìn)一步縮小要識(shí)別范圍,減少后繼處理的復(fù)雜度,提高識(shí)別精度。
根據(jù)目標(biāo)區(qū)域的連通性,采用輪廓追蹤法[3],獲得目標(biāo)區(qū)域所占矩形區(qū)域的大小,然后將其與事先設(shè)置的“過濾窗口”對(duì)比,將不符合要求的區(qū)域歸為背景,在尺寸上區(qū)分飛機(jī)與背景區(qū)域,對(duì)二值圖像進(jìn)行分割?!斑^濾窗口”是這樣設(shè)定的,它有一個(gè)最大窗口和一個(gè)最小窗口,如果尺寸在兩者之間的就被認(rèn)為符合要求,否則不符合要求。
使用輪廓追蹤法的最終目的是獲取連通區(qū)域所在矩形的大小,從而將不符合要求的前景區(qū)域劃為背景,縮小識(shí)別范圍。
具體步驟如下:
1)從左到右,從上到下掃描圖像;
2)如果遇到目標(biāo)點(diǎn),則用輪廓追蹤法追蹤輪廓,得到連通區(qū)域的大小。
3)判斷得到區(qū)域的大小是否符合條件,把不符合條件的區(qū)域歸為背景。
4)如果沒有掃描到圖像最后,則回到步驟(1)。
輪廓追蹤從圖像的左上角開始逐個(gè)像點(diǎn)掃描,當(dāng)遇到邊緣點(diǎn)時(shí)則開始順序追蹤,直至追蹤的后續(xù)點(diǎn)回到起始點(diǎn)。這種邊界追蹤在處理圖像的時(shí)候,執(zhí)行先后是有次序的,每一個(gè)像素的處理都是順序執(zhí)行的,也就是后面的處理要用到前面的處理結(jié)果,前面的沒有處理完,后面的處理就不能進(jìn)行。此算法對(duì)于邊界點(diǎn)的判斷要求精確,而且整個(gè)邊界連續(xù)無中斷,追蹤后產(chǎn)生的輪廓邊緣線寬度只有一個(gè)像素。
在完成連通區(qū)域的追蹤后,就可以知道該連通區(qū)域的大小,并進(jìn)行相應(yīng)處理了。
不斷執(zhí)行上面的步驟,直到對(duì)整個(gè)二值圖像的都進(jìn)行了處理。
經(jīng)過上面的操作后,縮小了識(shí)別范圍,為后續(xù)處理做好了準(zhǔn)備。
3 特征提取
經(jīng)過上述圖像處理后,獲得了一個(gè)經(jīng)過尺寸處理過的二值圖像。然后對(duì)目標(biāo)區(qū)域提取矩不變量,作為識(shí)別飛機(jī)的特征向量。
矩方法[4]是一種經(jīng)典的特征提取方法,這種方法適合于無遮擋目標(biāo)的識(shí)別,采用矩方法提取的特征具有平移,旋轉(zhuǎn),比例不變性,是目標(biāo)識(shí)別的常用特征之一。平面幾何體的二維矩不變量理論最早是有Ming-KueiHu于1962年提出的。Hu證明了這一組變量對(duì)于圖像的平移、旋轉(zhuǎn)和大小比例變化均保持不變,這對(duì)于進(jìn)行飛機(jī)識(shí)別無疑是很有效的。
設(shè)一個(gè)二值圖像,區(qū)域?yàn)镽,假定它分段連續(xù)且有邊界,其密度分布函數(shù)為ρ(x,y)
(1)
則其中(p+q)階矩mpq定義為:
(2)
定義其(p+q)階中心矩μpq為:
(3)
其中,x=m10/m00,y= m01/m00。(x,y)又稱為物體的質(zhì)量中心,或者直接表示的是一區(qū)域灰度中心的坐標(biāo)。對(duì)于數(shù)字化二值圖像,設(shè)為M×N圖像,可用求和代替積分:
(4)
(5)
其中,i=m10/m00,j= m01/m00。
定義(p+q)階歸一化中心矩:
(6)
其中,r=(p+q)/2, p+q=2,3,…。
利用二階和三階中心矩與歸一化中心矩可導(dǎo)出7個(gè)矩:
M1=μ20+μ02(7)
(8)
(9)
(10)
(11)
(12)
(13)
上式中,未歸一化矩中1~6變量是矩不變量,它對(duì)平移、旋轉(zhuǎn)、比例變換均保持不變,而第七個(gè)變量是變化的,但歸一化矩組中7個(gè)變量對(duì)平移、旋轉(zhuǎn)、比例變換均保持不變。
經(jīng)過分析,對(duì)反映圖像形狀特征的矩不變量中,矩M4~M7對(duì)分類貢獻(xiàn)很小,所以本文中選取M1~M3作為特征向量。因?yàn)槲礆w一化的矩不變量M1~M3的數(shù)值比較大,所以選取歸一化的矩不變量M1,M2,M3這三個(gè)特征。這三個(gè)特征對(duì)平移、旋轉(zhuǎn)、比例變換具有不變性。
4 分類器的設(shè)計(jì)
Bp神經(jīng)網(wǎng)絡(luò)是一種分布式存儲(chǔ)模型,具有自學(xué)習(xí),自組織和并行分布處理等特點(diǎn),適用于飛機(jī)的模式識(shí)別。為了能夠識(shí)別飛機(jī),BP網(wǎng)絡(luò)參數(shù)設(shè)置如下:①設(shè)置為3層,其中輸入層有3個(gè)節(jié)點(diǎn),中間層有16個(gè)節(jié)點(diǎn),輸出層有1個(gè)節(jié)點(diǎn);②輸入層與中間層,中間層與輸出層之間的權(quán)值初始值設(shè)定為-1到1之間的隨機(jī)數(shù);③中間層,輸出層的閾值初始值設(shè)定為0到1之間的隨機(jī)數(shù);④神經(jīng)元模型采用S型函數(shù):f(x)=1/(1-e-x) ;⑤步長(zhǎng)值的初始值設(shè)置為3。
對(duì)Bp網(wǎng)絡(luò)學(xué)習(xí)的一些改進(jìn):
1) 訓(xùn)練樣本特征向量集合的歸一化。因?yàn)槿齻€(gè)矩不變量代表的意義各不相同,各個(gè)量的大小量度也會(huì)不同,為了防止小數(shù)被大數(shù)淹沒,需要將樣本的特征向量歸一化??紤]到S型函數(shù)在[0,0.1]間和[0.9,1]間變化平坦,將訓(xùn)練樣本的特征向量歸一到[0.1,0.9]間。
2) 權(quán)值修正。權(quán)值修正采用下面的公式:
(14)
式中Δω(l)ji(n)表示第 層第j個(gè)神經(jīng)元與上一層第i個(gè)神經(jīng)元之間的連接權(quán)的當(dāng)前修改值。Δω(l)ji(n-1)表示上一個(gè)學(xué)習(xí)周期對(duì)同一個(gè)學(xué)習(xí)樣本的權(quán)值修改值。α是慣性系數(shù),η是步長(zhǎng)值,兩者有關(guān)。δ(l)pj(n)表示對(duì)p樣本l層第j個(gè)神經(jīng)元的校正誤差。O(l-1)pi(n)表示對(duì)p樣本l-1層第i個(gè)神經(jīng)元的輸出值。
3) 步長(zhǎng)修正。將Bp網(wǎng)絡(luò)誤差定義為:
(15)
若Enet下降的很快,則說明步長(zhǎng)值合適;若Enet出現(xiàn)震蕩,則說明步長(zhǎng)值過大。通過判斷Enet的變化趨勢(shì)來相應(yīng)的修正步長(zhǎng)值:若Enet保持下降趨勢(shì),則保持當(dāng)前的步長(zhǎng);若Enet出現(xiàn)震蕩,則使步長(zhǎng)值變?yōu)樵瓉淼?0%,即:
η(n)=0.9×η(n-1) (當(dāng)Enet(n)>Enet(n-1)時(shí))(16)
4) 慣性系數(shù)修正。慣性系數(shù)α(n)=kη(n),其中k為預(yù)設(shè)值,在(0,1)內(nèi),設(shè)為0.3。
5) 防止陷入最小局部點(diǎn)設(shè)置。每次訓(xùn)練后,都要判斷網(wǎng)絡(luò)的輸出值是否不再變化,如果不變化,再判斷輸出誤差是否符合要求,不符合的就重新訓(xùn)練訓(xùn)練網(wǎng)絡(luò)。當(dāng)出現(xiàn)局部最有的情況時(shí),表現(xiàn)出來的特征是:各權(quán)值收斂到某一穩(wěn)定值,而誤差值卻不是最小。
(17)
網(wǎng)絡(luò)陷入局部最小值點(diǎn)的解決方法就是:從頭做起,重新開始訓(xùn)練。
6) 理想輸出分量的設(shè)置。理想輸出值要在(0,1)內(nèi)。
5 結(jié)束語
該文通過對(duì)二值圖像特殊處理,以圖像不變矩的平移不變性、旋轉(zhuǎn)不變性和比例不變性為依據(jù),將不變矩作為識(shí)別特征,運(yùn)用BP網(wǎng)絡(luò)進(jìn)行識(shí)別,提出了一種基于矩不變量和神經(jīng)網(wǎng)絡(luò)的飛機(jī)識(shí)別模型。本文的識(shí)別模型具有實(shí)現(xiàn)簡(jiǎn)單、識(shí)別率搞、訓(xùn)練速度與識(shí)別速度快、便于實(shí)時(shí)實(shí)現(xiàn)的特點(diǎn),為飛機(jī)識(shí)別模型提供了一種新途徑。
參考文獻(xiàn):
[1] 廖聞劍,成瑜.三維飛機(jī)自動(dòng)識(shí)別的一種有效方法[J].航空學(xué)報(bào),1998,19(6):730-735.
[2] 肖健華.智能模式識(shí)別方法[M].廣州:華南理工大學(xué)出版社,2006:38-45.
[3] 楊淑瑩.圖像模式識(shí)別-VC++技術(shù)實(shí)現(xiàn)[M].北京:清華大學(xué)出版社,2005:115-134,151-158.
[4] 李迎春,陳賀新,楊建波,等.基于矩不變的飛機(jī)識(shí)別算法[J].吉林大學(xué)學(xué)報(bào),2002,20(3):16-19.