于坤林
(長沙航空職業(yè)技術(shù)學(xué)院,湖南 長沙 410124)
目標(biāo)識(shí)別技術(shù)是指利用雷達(dá)和計(jì)算機(jī)對遙遠(yuǎn)目標(biāo)進(jìn)行辨認(rèn)的技術(shù)[1]。無人機(jī)目標(biāo)識(shí)別技術(shù)是無人機(jī)自動(dòng)避障技術(shù)的基礎(chǔ),目前無人機(jī)的目標(biāo)識(shí)別技術(shù)已在航拍航測、抗災(zāi)救援、電力巡檢、目標(biāo)搜尋等無人機(jī)應(yīng)用領(lǐng)域發(fā)揮著非常重要的作用。因此開展無人機(jī)目標(biāo)識(shí)別技術(shù)的研究有非常重要的應(yīng)用價(jià)值。
無人機(jī)的目標(biāo)圖像識(shí)別算法流程如圖1所示。
圖1 無人機(jī)的目標(biāo)圖像識(shí)別算法流程
圖像傳感器獲得無人機(jī)的目標(biāo)圖像后,先要對采集到的目標(biāo)圖像進(jìn)行噪聲濾波和圖像增強(qiáng)等預(yù)處理,為了使待識(shí)別的無人機(jī)的目標(biāo)圖像從采集到的目標(biāo)圖像中分出來,需要對濾波及圖像增強(qiáng)后的圖像進(jìn)行無人機(jī)的目標(biāo)圖像分割,無人機(jī)的目標(biāo)圖像分割后就要進(jìn)行特征提取,從而可以從圖像信息提取反映無人機(jī)的目標(biāo)本質(zhì)特征,特征提取之后對分類的特征進(jìn)行分類并對無人機(jī)的目標(biāo)進(jìn)行判決,也就是分類判決,最后對無人機(jī)的目標(biāo)進(jìn)行識(shí)別和跟蹤處理。
2.1.1 圖像濾波
圖像濾波是為了去掉原始圖像里面的噪聲,圖像濾波的方法有很多種,如均值濾波、中值濾波等等,采用均值濾波對雖然能降低噪聲,但濾波后的圖像邊緣變得模糊,而采用中值濾波則既能降低噪聲,又能使圖像邊緣比較清晰,特別是對于椒鹽噪聲,濾波效果較好。
2.1.2 圖像增強(qiáng)
圖像增強(qiáng)分為基于空間域的圖像增強(qiáng)以及基于頻率域的圖像增強(qiáng)兩大類:基于頻域的算法是在圖像的某種變換域內(nèi)對圖像的變換系數(shù)值進(jìn)行某種修正;基于空間域的圖像增強(qiáng)算法是直接對圖像灰度級做運(yùn)算,如直方圖修正、灰度變換等算法[2]。直方圖均衡化可以使圖像更加清晰,能夠增強(qiáng)目標(biāo)與背景的灰度對比度,擴(kuò)大目標(biāo)與背景之間的灰度差值,以便圖像的邊緣細(xì)節(jié)能夠更加容易地被檢測出來。
圖像分割是指根據(jù)需要將圖像劃分為有意義的若干區(qū)域或部分的圖像處理技術(shù),分割質(zhì)量的好壞直接影響著后續(xù)圖像處理的效果[3]。圖像量化后就要對其進(jìn)行圖像分割,圖像分割的算法主要分以下3大類:1)基于閾值的分割方法;2)基于邊緣的分割方法;3)基于區(qū)域的分割方法。區(qū)域分割方法有區(qū)域分裂合并法和區(qū)域增長法等。
2.2.1 閾值分割法
閾值圖像分割法是一種有效且簡單的方法,它用設(shè)定的一個(gè)或多個(gè)閾值將圖像的灰度級分為2個(gè)或多個(gè)部分,屬于同一部分的像素可以認(rèn)為是同一個(gè)物體。閾值法的特點(diǎn)是運(yùn)算比較簡單且效率高,應(yīng)用比較廣泛。為了增加圖像分割的魯棒性,圖像分割需要具有自動(dòng)閾值選擇功能。
2.2.2 邊緣分割法
邊緣是圖像的最基本特征,它能夠反映圖像灰度的不連續(xù)性。圖像邊緣檢測是圖像分割、圖像特征提取以及圖像紋理分析等的重要基礎(chǔ),此類算法簡單,對簡單場景中的圖像分割效果較好,但在復(fù)雜場景中,易出現(xiàn)目標(biāo)邊界不完整或偽邊緣較多等問題,很難將目標(biāo)分割出來且對噪聲敏感。常用的圖像邊緣檢測算法是采用roberts、sobel 、prewitt以及canny等算子來進(jìn)行邊緣檢測的。
(1) Roberts 算子邊緣檢測算法
Roberts 算子是利用掩模結(jié)構(gòu)的模板算子來進(jìn)行空間卷積運(yùn)算的一階微分算子。Roberts算子模板如下:
Roberts 算子的特點(diǎn)是沒有平滑和濾波的環(huán)節(jié),它直接通過差分計(jì)算來尋找邊緣的,因此對細(xì)微的噪聲比較敏感;
(2) Sobel算子邊緣檢測算法
Sobel算子模板如下:
Sobel算子是利用掩模結(jié)構(gòu)的模板算子進(jìn)行空間卷積運(yùn)算的一階微分算子。Sobel算子由于增加了中心像點(diǎn)的權(quán)值比重,所以比 Roberts 算子具有更好的噪音抑制能力。
(3) Prewitt算子邊緣檢測算法
Prewitt邊緣檢測算子是在圖像空間上利用水平邊緣以及垂直邊緣兩個(gè)方向的模板與圖像進(jìn)行鄰域卷積運(yùn)算來完成[4]。該算子通常由下列公式表示:
Prewitt算子模板如下:
Prewitt算子把灰度值大于或等于閾值的像素點(diǎn)都認(rèn)為是邊緣點(diǎn),由于許多噪聲點(diǎn)的灰度值很大,因此容易造成把噪聲點(diǎn)誤判定為邊緣點(diǎn),而且容易丟失幅值較小的邊緣點(diǎn)。
(4) Canny算子邊緣檢測算法
Canny算子采用不同方向上的模板對給定圖像進(jìn)行卷積并且獲取最優(yōu)邊緣,Canny算子優(yōu)點(diǎn)是檢測精度高,信噪比大,缺點(diǎn)是實(shí)時(shí)性較差。
Canny算子邊緣檢測步驟為[5]:
I.高斯濾波
采用高斯函數(shù)對要邊緣檢測的源圖像進(jìn)行去噪濾波,高斯函數(shù)為
II.計(jì)算濾波后圖像的梯度幅值和方向
采用2X2鄰域內(nèi)的一階偏導(dǎo)求圖像的梯度和方向:
III.對梯度幅值進(jìn)行非極大值抑制,把梯度中非極大值點(diǎn)置零得到細(xì)化的邊緣
IV.用雙閾值法檢測和連接邊緣
采用高、低閾值對經(jīng)非極大值抑制后的結(jié)果進(jìn)行檢測,得到兩個(gè)閾值邊緣圖像Th和Tl,將梯度幅值大于Th的點(diǎn)認(rèn)為是邊緣點(diǎn),將梯度幅值小于Tl的點(diǎn)認(rèn)為不是邊緣點(diǎn),用Tl來連接邊緣。
2.2.3 區(qū)域分割法
區(qū)域生長的基本思想是:檢查它的近鄰,判斷它們是否具有相似性,把相似的近鄰歸入到一個(gè)區(qū)域中。這個(gè)相似性準(zhǔn)則可以是顏色、灰度、紋理或其他特性。該類算法的分割效果雖然好,但運(yùn)算復(fù)雜,實(shí)時(shí)性差。
常用的圖像特征有:顏色特征、紋理特征、空間關(guān)系特征和形狀特征這4種特征。
基于顏色特征的提取方法的優(yōu)點(diǎn)是具有一定的魯棒性,其顏色分量特征不受視角的變化和物體的尺寸的影響,缺點(diǎn)是對光照變化比較敏感,不能反映目標(biāo)的局部特征并且計(jì)算比較復(fù)雜。
基于紋理特征的提取方法的優(yōu)點(diǎn)是對噪聲有一定的魯棒性,缺點(diǎn)是可能會(huì)受圖像分辨率的影響,而產(chǎn)生較大的偏差。
基于空間特征的提取方法的優(yōu)點(diǎn)是可加強(qiáng)區(qū)分圖像的內(nèi)容和描述能力,缺點(diǎn)是對圖像的旋轉(zhuǎn)以及縮放等變化都比較敏感。
基于形狀特征的提取方法的優(yōu)點(diǎn)是比較有效的運(yùn)用于感興趣目標(biāo)的識(shí)別,缺點(diǎn)是識(shí)別結(jié)果受到目標(biāo)的形狀影響較大,當(dāng)產(chǎn)生變形或者變形不太明顯時(shí)候偏差較大。
目前國內(nèi)外目標(biāo)識(shí)別的方法主要有:基于經(jīng)典的統(tǒng)計(jì)識(shí)別方法、基于知識(shí)的目標(biāo)識(shí)別方法、基于模型的統(tǒng)計(jì)識(shí)別方法、 基于信息融合的目標(biāo)識(shí)別方法、基于統(tǒng)計(jì)學(xué)習(xí)的目標(biāo)識(shí)別方法等5種目標(biāo)識(shí)別方法[6]。
2.4.1 基于經(jīng)典的統(tǒng)計(jì)識(shí)別方法
該方法對大量樣本進(jìn)行訓(xùn)練,統(tǒng)計(jì)觀察目標(biāo)特性的分布情況,在模式空間距離中,利用特征匹配分類技術(shù)對場景定義域內(nèi)目標(biāo)進(jìn)行識(shí)別。這種方法在復(fù)雜背景下或目標(biāo)發(fā)生變化時(shí),無法正確識(shí)別目標(biāo)。
2.4.2 基于知識(shí)的目標(biāo)識(shí)別方法
該方法主要對可供利用的知識(shí)源辨別、適用新場景時(shí)知識(shí)的有效組織和驗(yàn)證、規(guī)則的理解和明確表達(dá)。領(lǐng)域知識(shí)的組合和處理能力決定著識(shí)別算法的性能。
2.4.3 基于模型的統(tǒng)計(jì)識(shí)別方法
該方法利用目標(biāo)、環(huán)境、背景和傳感器等模型來對目標(biāo)進(jìn)行識(shí)別,依據(jù)模型特征來匹配實(shí)際及預(yù)測后的特征。
2.4.4 基于信息融合的目標(biāo)識(shí)別方法
該方法就是融合各種不同功能的傳感器來提高系統(tǒng)對復(fù)雜場景中的目標(biāo)識(shí)別能力。該目標(biāo)識(shí)別方法目前主要集中在對算法的研究和模型的開發(fā)上。
2.4.5 基于統(tǒng)計(jì)學(xué)習(xí)的目標(biāo)識(shí)別方法
該方法通過對大量目標(biāo)和非目標(biāo)樣本進(jìn)行學(xué)習(xí)而得到一些統(tǒng)計(jì)特征,依據(jù)這些特征建立模型,來識(shí)別目標(biāo)。該方法能夠較好地區(qū)別樣本,魯棒性較好。
圖2 目標(biāo)圖像仿真實(shí)驗(yàn)
圖2是采用加有椒鹽噪聲的lena圖像進(jìn)行了目標(biāo)識(shí)別實(shí)驗(yàn),圖2(a)是疊加了椒鹽噪聲的lena圖像,圖2(b)是對加有椒鹽噪聲的lena圖像進(jìn)行了中值濾波,濾波后不但濾掉了大量的椒鹽噪聲,而且保留了圖像的許多重要細(xì)節(jié),圖像比較清晰。圖2(c)是對中值濾波后的圖像進(jìn)行直方圖均衡化,目的是為了增強(qiáng)目標(biāo)和背景的灰度對比度以及擴(kuò)大目標(biāo)與背景之間的灰度差值,以便更容易地檢測出圖像的邊緣細(xì)節(jié),圖像進(jìn)行直方圖均衡化后,圖像明顯增強(qiáng),而且圖像的細(xì)節(jié)更加突出清晰。圖2(d)是對加強(qiáng)后的圖像采用了基于邊緣的圖像分割方法獲得的圖像,獲得了比較滿意的邊緣檢測和分割效果。
本文詳細(xì)地研究了現(xiàn)有的無人機(jī)目標(biāo)識(shí)別技術(shù),對圖像分割技術(shù)、特征提取技術(shù)、目標(biāo)識(shí)別技術(shù)的各算法進(jìn)行了系統(tǒng)地研究和對比分析,并對無人機(jī)目標(biāo)圖像識(shí)別算法進(jìn)行了仿真實(shí)驗(yàn),為無人機(jī)自動(dòng)避障技術(shù)提供了技術(shù)基礎(chǔ),該技術(shù)將會(huì)在軍事、民用領(lǐng)域都有著廣泛的應(yīng)用價(jià)值。