苗錫奎,朱 楓,許以軍,吳清瀟,郝穎明,任申真
(1.中國科學院沈陽自動化研究所,遼寧沈陽 110016;2.中國科學院研究生院,北京 100049;3.中國科學院光電信息處理重點實驗室,遼寧沈陽 110016;4.遼寧省圖像理解與視覺計算重點實驗室,遼寧沈陽110016)
基于視覺的水雷目標識別方法研究
苗錫奎1,2,3,4,朱 楓1,3,4,許以軍1,吳清瀟1,3,4,郝穎明1,3,4,任申真1
(1.中國科學院沈陽自動化研究所,遼寧沈陽 110016;2.中國科學院研究生院,北京 100049;3.中國科學院光電信息處理重點實驗室,遼寧沈陽 110016;4.遼寧省圖像理解與視覺計算重點實驗室,遼寧沈陽110016)
水下目標識別一直是目標識別領域的研究熱點,為此,以水雷目標識別為需求背景提出了一種基于視覺的水雷目標識別方法。該方法從水雷目標形狀的本質(zhì)特征出發(fā),根據(jù)幾何矩的物理意義,結(jié)合區(qū)域特征和邊界特征構(gòu)造了三個適合于水雷目標形狀描述子,采用閾值判決的方法,實現(xiàn)水雷目標的識別。實驗結(jié)果表明,該方法比基于不變矩的方法識別率更高,具有較好的穩(wěn)定性,尤其適用于水下特定形狀的目標識別和目標受到部分遮擋的情況。其中水下圖像處理和特征的定義方法對水下目標識別具有指導和借鑒意義。
水下機器人;水下圖像;目標形狀;不變矩;水雷識別;視覺
水雷按其在水下的狀態(tài)大致分為:錨雷、沉底雷和掩埋雷,對于不同類型的水雷,應選擇不同的識別方案。利用計算機視覺的方法可以對錨雷和沉底雷進行識別,而且具有其它方法所不能比擬的優(yōu)點:直觀、信息量大、處理方法多樣等[1]。其一般過程是利用攝像機并配合遠距離光源(水下輔助照明設備)對目標進行成像,通過圖像處理,提取出目標特征,采用模式識別的方法完成識別任務。
基于視覺的水下目標識別方法關鍵是選擇具有穩(wěn)定性的目標圖像特征。機器人在水下運動的過程中,因為水下環(huán)境惡劣及其在運動過程中姿態(tài)的變化,攝像機拍攝到的圖像質(zhì)量往往比較差,與理想圖像之間存在一定的差異。然而,水雷目標的形狀卻有較好的穩(wěn)定性。另外,機器人本體離目標距離的遠近以及在不同方位對目標進行成像都會造成目標區(qū)域形狀的平移、旋轉(zhuǎn)、比例縮放等變化。因此需要尋找一種具有平移、旋轉(zhuǎn)和比例不變性的圖像特征提取方法,以滿足實際應用的需要。
在本應用中,通過采集的大量水雷目標圖像發(fā)現(xiàn)目標形狀特征具有較好的穩(wěn)定性。而基于形狀的目標識別方法有利用目標的不變矩特征完成識別,如文獻[2]利用幾何矩的方法構(gòu)造了Hu矩,該矩具有平移、旋轉(zhuǎn)、縮放不變性。文獻[3]提出了邊界矩,加快了矩的計算速度;文獻[4]提出了基于歸一化Zernike矩和偽Zernike矩的二值化商標圖像的識別方法,利用0-5階共21個低階矩完成商標圖像的識別,識別率為0.91;文獻[5]利用小波矩結(jié)合神經(jīng)網(wǎng)絡的方法完成高壓輸電線路除冰機器人三種障礙物的識別,平均識別率達到0.92;文獻[6]利用局部小波矩來表征三維目標的形狀特征,有效地應用于易混淆三維目標識別中。然而這些識別方法中的圖像樣本一般都是來自圖像質(zhì)量較好的樣本圖像庫,噪聲較少。而這樣高質(zhì)量的目標圖像,在實際中是很難獲得的。尤其是水下目標圖像,經(jīng)常會伴有各種噪聲。文獻[7]利用Hu矩構(gòu)造了新的不變量,完成了水下4類目標的識別。但該4類目標成像后十分清晰,而且沒有考慮遮擋問題,最高識別率為0.94。這些不變矩特征雖然在其各自的應用背景下具有很好的效果,但對水下目標識別來說,由于水下成像質(zhì)量差,對比度低,噪聲復雜和受遮擋等問題,以上不變矩特征并不適用于本應用,所提取的水下目標不變矩值變化較大。因此有必要針對水下目標圖像特點開展深入研究。
以水雷目標為應用對象開展水下目標識別方法研究,建立了水下目標識別實驗平臺,采集了水雷目標模型的實際水下圖像,提出了新的目標形狀描述子。通過對特征描述子的特征值做閾值判決來完成水雷目標識別,用以克服水下不確定性因素給目標識別帶來的困難。實驗結(jié)果表明該特征能很好地表征水雷目標的形狀特征,針對水雷這樣的目標具有較好的穩(wěn)定性,識別率高達0.94以上。該方法不需要結(jié)構(gòu)約束,比較簡單。而且在目標提取的同時就可以完成特征值的計算,避免了花費大量時間來計算目標的不變矩值,因而實時性較高。該方法可有效地應用于水下目標識別。
首先介紹建立的水下目標識別實驗系統(tǒng)平臺;在此基礎上詳細描述了水下目標圖像處理與目標識別方法,重點闡述了水雷目標形狀描述子;最后給出了實驗結(jié)果與分析;研究工作的重點是水雷目標特征提取及識別。
文中的水雷目標識別系統(tǒng)搭載在水下機器人(AUV)上。作為一個水下目標識別系統(tǒng)[8],該系統(tǒng)主要包括遠距離光源(水下輔助照明設備),攝像機,嵌入式系統(tǒng),其它輔助硬件設備等如傳感器等,如圖1所示。其中光源和攝像機位于水下機器人(AUV)艙外,嵌入式系統(tǒng)和輔助硬件設備均位于艙體內(nèi)部。其工作原理:水下機器人在運動過程中,安裝在其上的CCD攝像機借助于水下輔助照明設備,實時采集視野范圍內(nèi)的圖像信息。通過嵌入式系統(tǒng)和輔助硬件將其轉(zhuǎn)化成數(shù)字圖像保存到大容量的磁盤中,同時利用圖像處理、分析等方法獲取當前圖像中目標特征,借助模式識別的方法對圖像中目標所屬類別進行判決。
水雷目標識別基本流程:1)水下圖像信息采集;2)對采集到的圖像做預處理;3)利用Otsu算法對預處理后的圖像二值化,得到目標形狀;4)利用文中提出的水雷目標形狀描述子表征目標,并利用閾值判決的方法完成目標識別。
水下成像與大氣中成像有很大的區(qū)別[9],水體對光具有選擇吸收作用,同時不同波長的光在水中衰減的速度也是不同的。而且水體對光的散射作用[10]導致圖像對比度下降、噪聲增強、圖像質(zhì)量退化嚴重。而且還會導致背景中出現(xiàn)強亮度點,這些亮點往往與目標區(qū)域摻雜在一起,增加了圖像處理和目標識別的難度。為了準確地從采集到的水下圖像中將目標分割出來,在圖像分割前,必須對圖像進行預處理。圖2是三幅水下機器人采集到的水下目標模型圖像,從中可以看到水下圖像的對比度都較低,圖像中目標邊緣模糊,噪聲嚴重。此外受到光照條件的影響,圖像的清晰度差別較大,存在明顯的灰白效應。
圖1 水下目標識別實驗平臺Fig.1 Underwater object recognition system
圖2 水下圖像噪聲Fig.2 Noise of the underwater images
在圖像分割前,對水下圖像做了預處理。首先對彩色圖像做灰度化處理;其次對灰度圖像做高斯濾波;最后對濾波后的圖像做形態(tài)學處理。
彩色圖像灰度化主要是為了消除顏色信息,在實驗過程中發(fā)現(xiàn)將彩色圖像轉(zhuǎn)換成灰度圖像的效果并沒有直接從三個通道中僅取出R通道的效果好。而且通過后面的實驗也證實了這一點,單獨提取R通道作為灰度圖像;高斯濾波主要是為了消除水粒子散射的影響,模糊掉圖像中的水紋噪聲;形態(tài)學處理(腐蝕、膨脹)主要是為了消除背景區(qū)域中散布的一些小噪聲物體和強亮度點。預處理之后,去除了很多干擾噪聲。雖然圖像變得模糊了一些,但是圖像中目標形狀區(qū)域內(nèi)部像素值的差異大大減少,這樣將有利于圖像的二值化。同時在實驗過程中還發(fā)現(xiàn),識別前期的圖像預處理在整個識別過程中起到了十分重要的作用。如膨脹和腐蝕的結(jié)構(gòu)元參數(shù)選取的不好,將會造成后面步驟的分割中出現(xiàn)一些雜亂的小目標。通過對機器人水池實驗采集到的水下目標圖像進行以上步驟的預處理,得到的圖像質(zhì)量滿足后續(xù)的目標識別任務要求,表明所采用的圖像預處理方法是有效的。由于篇幅的關系,在這里不作詳細介紹。
如何將水雷目標從圖像中準確地分割出來,對于目標特征提取與識別起決定作用。如果用邊緣檢測的方法提取目標的邊緣輪廓,則得到的目標輪廓形狀隨著采集圖像的環(huán)境和目標狀態(tài)的變化會發(fā)生顯著的變化,而且最關鍵的是邊緣提取的閾值不能做到自適應。分析其原因,主要是因為水下環(huán)境變化劇烈,即便目標距離變化很小,得到的圖像相差也很大。另外由于水中固有的后向散射噪聲、亮點及水雷目標上的一些雜物都會使邊緣檢測結(jié)果相差很大。這樣會使目標特征變得不穩(wěn)定,不能很好地反映水雷目標的形狀,圖3(a)所示為水雷目標模型邊緣檢測效果圖。相反閾值分割在這種情況下提取的目標表現(xiàn)出良好的穩(wěn)定性,見圖3(b)所示為水雷目標模型閾值分割效果圖。
使用Otsu自適應閾值算法[11](最大類間方差法)選取最佳的閾值來二值化圖像。通過對不同環(huán)境和目標狀態(tài)下采集的圖像做Otsu自適應閾值分割,分割出的目標輪廓比較統(tǒng)一,具有很好的穩(wěn)定性,而且基本不受外界環(huán)境的影響(包括目標狀態(tài))。分析其原因,主要是因為閾值分割不會像邊緣檢測那樣對灰度變化那樣敏感。結(jié)合圖像預處理中的濾波技術(shù)和形態(tài)學處理,可以很容易地去除噪聲得到比較滿意的目標圖像。更重要的是,可以根據(jù)環(huán)境的不同自適應地確定分割的閾值。限于篇幅,此處僅列舉一例。但實驗證明,利用該方法不僅能夠得到較為穩(wěn)定的目標輪廓,而且抗噪性能強,計算代價小,實時性能高。本方法也為研究者關于水下目標提取提供了一定指導和借鑒意義。
圖3 邊緣檢測和閾值分割Fig.3 Edge detection and threshold segmentation
在水雷目標識別過程中,最重要的步驟就是特征表示與提取。迄今為止,已經(jīng)有很多文獻對這個問題進行了分析研究[12],但是還沒有統(tǒng)一的解決方法。特征選取的好壞將直接影響到識別方法的識別率。為此,使用形狀描述子,根據(jù)幾何矩的物理意義,并結(jié)合本應用中水雷目標自身特征和成像后特征,利用區(qū)域特征描述和邊界特征描述相結(jié)合的方法構(gòu)造了三個新的水雷目標特征來表征水雷形狀。
紋理、顏色和形狀是圖像基本的視覺特征。由于水下成像環(huán)境比較特殊,從采集到的水下目標圖像來看,水雷目標紋理比較弱,尤其是水下的背景環(huán)境紋理更弱,基本成黑灰色。而且顏色信息在水中的衰減速度很快,兩次拍攝水雷目標前后距離僅相差10 cm這樣的數(shù)量級時,目標顏色和背景在兩幅圖像中的變化很大。因此關于水雷目標識別所選用的特征應該首先排除紋理和顏色,故而選擇了形狀特征。實際上選擇形狀特征也有很多優(yōu)點:1)水雷目標的形狀特征能夠很好地描述水雷目標固有的特征;2)水雷目標在成像時其形狀特征具有一定的穩(wěn)定性;3)非水雷目標與水雷目標的形狀相差很大。
對于一幅給定的數(shù)字圖像,其亮度函數(shù)為f(x,y),定義它的p+q階幾何矩為如下積分形式:
p+q階中心矩定義為:
矩特征有著明確的物理和數(shù)學意義,根據(jù)其定義形式,零階矩反映了目標的面積,一階矩反映了目標的質(zhì)心位置,因此利用這兩個矩量就可以避免因目標大小和位移變化對目標特征的影響。二階矩又稱為慣性矩,與一階矩和零階矩共同構(gòu)成了目標的低階矩。低階矩所反映的目標特征可以用圖像橢圓來表示,如圖4所示。對于二值圖像而言,圖像橢圓的面積和二階矩均與目標的面積和二階矩相等,該橢圓的主軸方向角φ與橢圓的長軸長a、短軸長b能反映目標形狀特征,具體計算如下:
圖4 目標圖像橢圓Fig.4 Image ellipse of the object
Hu矩、Zernike矩、偽Zernike矩和小波矩等不變矩都是在幾何矩和中心矩的基礎上發(fā)展起來的,而且具有平移、旋轉(zhuǎn)、縮放不變性。下面定義的目標特征描述子正是基于目標形狀的本質(zhì)特征,結(jié)合幾何矩的物理意義而定義的。
通過采集大量的水雷目標模型圖像,總結(jié)了水雷模型形狀所具有的典型特征:
1)水雷目標固有形狀為一圓柱體,柱體母線長度比兩條母線之間的距離大的多,且兩條母線平行,在成像之后將利用該特征構(gòu)造水雷目標模型所獨有的特征。
2)水雷目標成像后,無論是錨雷還是沉底雷,經(jīng)過目標提取,目標區(qū)域呈狹長狀,可近視為長方形,即近視為一柱體成像,長和寬的比例一般大于1.5。這主要是由水雷目標固有的形狀特征決定。
3)成像后水雷目標輪廓上有一對接近平行的對邊,而且這對對邊比另外一對對邊長的多,在這對對邊上相應點處曲率大體上相等而且較小。曲率在一個范圍內(nèi)波動變化,接近直線的曲率0。由于水下環(huán)境的惡劣和成像過程的攝影變換,另外一對對邊不具有這樣的性質(zhì)。一般另一對邊由于受到環(huán)境和遮擋等原因不能完整地提取出來。
Hu矩中有7個不變矩,但這7個矩都是由低階(二階和三階)歸一化中心矩的乘法、加法、減法的非線性組合構(gòu)成,不能很好地描述水雷目標的形狀特征。為了更好地描述水雷目標形狀特征,根據(jù)幾何矩的物理意義(見3.2小節(jié)),并結(jié)合本應用中水雷目標本身和成像后特征,利用區(qū)域特征描述和邊界特征描述相結(jié)合的方法構(gòu)造了三個新的水雷目標特征。這三個特征能夠很好地表征水雷的形狀,而且這三個特征矩也具有平移、縮放、旋轉(zhuǎn)不變的特性。
目標長寬比E:圖像低階矩具有穩(wěn)定性,反應目標整體特征。利用圖像目標橢圓長軸與短軸之比定義長寬比特征E,定義如下:
該特征可以很容易地將長條形目標與非長條形目標區(qū)分開;能將緊湊型與非緊湊型目標區(qū)分開。該特征描述子也正是基于矩的物理意義定義的。在本應用中,當E大于1.5時,表明目標形狀是狹長形的。
目標矩形度R:利用相應的算法求出目標輪廓的最小外接矩形,用目標的面積與其最小外接矩形的面積之比來定義矩形度特征。它反映目標對其最小外接矩形的充滿程度,即R=Sobj/Srec。Sobj為目標的面積,即目標的零階矩m00,Srec為目標最小外接矩形面積。R的值在0~1之間,當目標為矩形時,R取得最大值1.0;當目標為圓形時,R取值為π/4;細長且彎曲的目標,R的取值變小。該特征能夠?qū)⒑苋菀椎貙⒕匦?包括正方形)目標與其它形狀目標區(qū)分開。
較長對邊夾角C:根據(jù)3.3小節(jié)中的3)所描述,較長對邊上相應點處曲率大體上相等而且較小,接近直線的曲率0。那么就可以用較長對邊上輪廓點擬合兩條直線段,兩條直線段的斜率在一個范圍內(nèi)波動變化,即兩條對邊接近平行。為此,定義了較長對邊夾角特征。沿長軸方向上且過圖像橢圓中心的直線L將水雷目標輪廓的邊緣點分成兩部分,上部和下部,用S1、S2分別表示這兩部分邊緣輪廓上的點集。將直線L漸近平行向上移動,當S1集合中在該直線以上的點的數(shù)目占S1集合總數(shù)目的80%(可調(diào))時,停止移動,用T1表示S1中在該直線上方的點集合;同樣將直線L漸近平行向下移動,當S2集合中在該直線以下的點的數(shù)目占S2集合總數(shù)目的80%(可調(diào))時,停止移動,用T2表示S2中在該直線下方的點集合。用最小二乘方法或隨機抽樣一致性方法對T1和T2集合中的點擬合兩條直線段L1和L2。判斷L1和L2是否接近平行,同時擬合的兩條直線段也要足夠的長,比如L1和L2兩條線段的長度都要大于一定的閾值(長度至少要大于橢圓短軸長的1.5倍)。利用該特征可以很容易地判斷出在目標橢圓長軸方向上目標是否具有一對較長且接近平行的對邊。
長寬比特征是一種無量綱,對尺度變化不敏感,其計算顯然與平移、旋轉(zhuǎn)、縮放無關;在計算矩形度特征時,使用的是兩個面積相除的方法,沒有量綱,顯然具有平移、縮放、旋轉(zhuǎn)不變性;對于較長對邊夾角特征,經(jīng)過二值化后得到的目標邊緣并不是很光滑,帶有鋸齒狀。這里使用了適當大小的模板對其進行中值濾波以便使邊緣變得光滑,但并不影響目標的整體形狀特征。輪廓邊緣變得光滑后,擬合的直線將更加準確。當目標發(fā)生旋轉(zhuǎn)和平移時,邊夾角的計算沒有改變。因此該特征與旋轉(zhuǎn)、平移無關。當目標發(fā)生尺度縮放時,由于計算邊夾角,擬合直線選用的是兩對邊上的點,與目標尺寸大小并無關系。因此對縮放也具有不變性。
目標長寬比和矩形度兩個特征還不能完全表征水雷目標所具有的特點,例如有些彎狀長寬比和矩形度都較大,但是其較長對邊夾角超過一定的閾值,對邊不平行,故不能判決為水雷目標。這里又選擇了較長對邊夾角這一特征來提高識別率。
由于本方法重點關注的是目標特征的表示與提取,對于分類器的設計,這里僅僅使用了閾值判決的方法完成目標分類。即統(tǒng)計上文定義的三個目標特征的閾值,以此作為依據(jù)來判斷目標是否是水雷目標模型。
為了驗證所提出方法的有效性,設計開發(fā)了實驗托體(水下目標識別實驗平臺)。在實驗水池中放入水雷目標模型實體,在不同光照、不同水深以及不同位姿等條件下進行了多次水下目標圖像采集和目標識別實驗,識別率高于94%,驗證了本方法的可行性和有效性。
實驗中,光源和視覺攝像機垂直安裝在機器人艙外,所獲取的圖像大小為640×480。針對水雷目標模型,采集了大量的水下圖像。具體如下:機器人本體離目標距離范圍設置為1~3 m,每0.1 m作為一個距離段,共計30處位置;在每一處水平方向分別以大約45°為步長旋轉(zhuǎn)8次,在垂直方向分別以小于30°正向和逆向旋轉(zhuǎn)2次,共16次;然后再變化水雷的狀態(tài),目標完整成像,部分成像和受到部分遮擋3種狀態(tài),共拍攝圖像1 440幅。
通過上文的方法已經(jīng)能夠完成水下目標特征的表示與提取,結(jié)合采集的大量水雷模型樣本圖像,利用實驗統(tǒng)計的方法確定水雷目標模型三個特征量的閾值。即同時滿足以下三個條件的目標視為水雷目標模型:1)目標的長寬比E大于1.5;2)目標上較長對邊夾角C小于10°(即有一對接近平行的較長對邊);3)目標矩形度R大于0.75。將所提取到的水下目標三個特征值與相應的閾值作比較即可判斷出該目標是否為水雷目標模型。
針對4.1節(jié)所采集的圖像,按照上面小節(jié)所介紹的方法首先進行圖像預處理;然后自適應閾值分割,對分割出的目標計算三個新特征值;最后做閾值判決進行目標識別,識別率為94.85%。由于篇幅的限制,本節(jié)選取了典型的目標圖像,如圖5所示。表1列出了圖5所示目標圖像的三個特征值,同時在實驗中也考慮了在圖像中存在多個虛假干擾目標的情況,如圖6所示。表2列出了虛假干擾目標的三個特征值的大小,已與各特征值的閾值做了比較,其中圓狀目標和彎狀目標沒有特征C,具體見表中的各特征值。
圖5 目標兩端受遮擋、噪聲、缺失等影響Fig.5 The two ends block,noise or missed
表1 水雷目標各特征值Tab.1 Mines object feature values
圖6 水雷目標和虛假目標Fig.6 Mine objects and false objects
另外為了對比本方法在水雷識別上的優(yōu)勢,針對應用中的目標圖像,將本方法的識別率與基于不變矩(Zernike矩、偽Zernike矩、小波矩)方法的識別率進行了比較,如表3所示,實驗中所用圖像采集條件同上。從表中可以看出基于不變矩的方法識別率之所以低主要是因為目標受到噪聲的干擾和部分的遮擋,所提取的目標細節(jié)發(fā)生了較大變化,而且存在的一些虛假目標,使全局矩值變化較大。
表2 虛假目標各特征值Tab.2 Feature values of false objects
表3 水雷模型各方法的識別結(jié)果Tab.3 Mine models recognition results of four methods
水下圖像質(zhì)量差,目標狀態(tài)的改變和部分遮擋的存在都給水下目標識別增加了難度?;谒啄繕诵螤畹谋举|(zhì)特征,根據(jù)幾何矩的物理意義,利用區(qū)域特征描述和邊界特征描述相結(jié)合的方法構(gòu)造了三個適合于水雷目標形狀描述子,提出了一種新的水下目標識別方法。方法首先采用Otsu方法對預處理圖像做閾值分割,然后提取目標的三個特征值,采用閾值判決的方法,完成識別任務,其識別率高于基于不變矩的方法。該方法為水下目標識別問題提供了一種新的解決思路,對水下目標識別具有一定的指導和借鑒意義。由于水雷目標形狀各異,而本方法僅考慮了一種形狀的水雷目標。因此下一步的研究工作是對多種形狀的水雷目標識別方法開展研究,而且要設計更好的分類器,進一步提高識別率。
[1]Balasuriya A,Ura T.Vision-based underwater cable detection and following using AUVs[C]∥Proceedings of the Oceans 2002 Conference and Exhibition.2002:1582-1587.
[2]Hu M K.Visual-pattern recognition by moment invariants[J].IEEE Transactions on Information Theory,1962,8(2):179-187.
[3]Chen C C.Improved moment invariants for shape discrimination[J].Pattern Recognition,1993,26(5):683-686.
[4]Ye Bin,Peng Jia-Xiong.Invariance analysis of improved Zernike moments[J].Journal of Optics.A:Pure and Applied optics,2002(4):606-614.
[5]繆思怡,孫 煒,張海霞.基于小波矩的高壓輸電線路除冰機器人障礙智能視覺識別方法[J].機器人,2010,32(3):425-431.
[6]王松偉,李言俊,張 科.基于局部小波矩的易混淆三維目標識別[J].紅外與激光工程,2008,37(6):1106-1110.
[7]唐旭東,朱 煒,龐永杰,等.水下機器人光視覺目標識別系統(tǒng)[J].機器人,2009,3l(2):171-178.
[8]Jain R,Kasnlri R,Schunck B G.Machine Vision[M].Beijing:China Machine Press,2003.
[9]張 赫,徐玉如,萬 磊,等.水下退化圖像處理方法[J].天津大學學報,2010,43(9):827-833.
[10]藍國寧,李 建,籍 芳.基于小波的水下圖像后向散射噪聲去除[J].海洋技術(shù),2010,29(2):43-47.
[11]Otsu N.A threshold selection method from gray-level histogram[J].IEEE Transactions on Systems,Man,and Cybernetics,1979,9(1):62-66.
[12]邊肇祺,張學工.模式識別[M].北京:清華大學出版社,2000:253-257.
Mine object recognition method research of AUV based on vision
MIAO Xi-kui1,2,3,4,ZHU Feng1,3,4,XU Yi-jun1,WU Qing-xiao1,3,4,HAO Ying-ming1,3,4,REN Shen-zhen1
(1.Shenyang Institute of Automation,Chinese Academy of Sciences,Shenyang 110016,China;2.Graduate School of Chinese Academy of Sciences,Beijing 100049,China;3.Key Laboratory of Optical-Electronics Information Processing,Chinese Academy of Sciences,Shenyang 110016,China;4.Key Laboratory of Image Understanding and Computer Vision,Liaoning Province,Shenyang 110016,China)
Underwater object recognition has long been the research focus in the field of object recognition.For mine object recognition,we propose a novel method based on vision.Based on the essential features of the mines'shape,the method proposes three shape feature descriptors of the mines.According to the physical significance of the geometric moments,it combines the regional characteristics and boundary characteristics,and employs threshold decision to complete mine object recognition.The experimental results show that the recognition rate of the method is much higher than that of the methods based on invariant moments.The method has good stability,especially suitable for the specific shape of the underwater object recognition and partial occlusion of the object.In the method,underwater image processing and feature definition approaches provide guidance and reference for underwater object recognition.
autonomous underwater vehicle;underwater image;object shape;invariant moments;mine recognition;vision
TP242
A
1005-9865(2012)04-0154-07
2011-12-16
中國科學院知識創(chuàng)新工程重大資助項目(YYYJ-0917)
苗錫奎(1984-),男,山東濰坊人,博士生,主要從事計算機視覺,模式識別和圖像處理方面的研究。E-mail:miaoxikui@163.com