董慧穎,徐 鵬
(沈陽理工大學(xué) 自動化與電氣工程學(xué)院,沈陽110159)
?
水面無人艇運動目標檢測技術(shù)研究
董慧穎,徐 鵬
(沈陽理工大學(xué) 自動化與電氣工程學(xué)院,沈陽110159)
水面無人艇作業(yè)過程中,運動目標是其重要的信息參考來源。為了提高水面運動目標檢測效率,研究了多種運動目標檢測方法。在此基礎(chǔ)上,研究了一種有效的水面無人艇動態(tài)目標檢測方法。首先,以改進的高斯差分對圖像進行處理。其次,結(jié)合三幀差分法的原理對圖像進行運動目標檢測。最后,利用數(shù)學(xué)形態(tài)學(xué)原理對運動目標進行更好的提取。實驗結(jié)果表明,該算法可以較好地進行運動目標檢測,且算法復(fù)雜度低,易實現(xiàn)。
三幀差分;高斯差分;形態(tài)學(xué)
水面無人艇[1]是一種新型的無人操作的水面艦艇,近些年國內(nèi)外研究的熱點。它是一種一配備先進的控制系統(tǒng)、傳感器系統(tǒng)、通信系統(tǒng),主要用于軍事任務(wù)以及港口監(jiān)視等民用任務(wù),執(zhí)行危險以及不適于有人船只執(zhí)行的任務(wù)。對于水面無人艇執(zhí)行任務(wù)過程中,運動目標是其重要的輸入信息,研究水面運動目標檢測方法,對發(fā)揮USV完成各種任務(wù)具有重要的意義。運動目標檢測方法主要有幀間差分法[2]、光流法[3-4]、混合高斯模型[5]背景減差法[6]等。ZHOU等人提出了一種基于二重的光流場運動檢測算法,利用光流場結(jié)合差分法檢測運動目標[7]。本文研究了一種基于改進三幀差分的運動目標檢測方法。首先,以改進的高斯差分對圖像進行處理。其次,結(jié)合三幀差分法的原理對圖像進行運動目標檢測。最后,利用數(shù)學(xué)形態(tài)學(xué)原理對運動目標進行更好的提取。
1.1 圖像濾波
圖像濾波,最大程度上保留圖像細節(jié)特征并對目標圖像的噪聲進行抑制,其處理效果的好壞將直接影響到后續(xù)圖像處理和分析的有效性和可靠性。圖像濾波的目的有兩個:一是抽出對象的特征作為圖像識別的特征模式;另一個是為適應(yīng)圖像處理的要求,消除圖像數(shù)字化時所混入的噪聲。
中值濾波[8],主要思想是利用像素點鄰域灰度值的中值來代替該像素點的值,此方法能夠在去除噪聲的同時,也能夠保留圖像邊緣細節(jié),計算過程就是按數(shù)學(xué)中位數(shù)的方法應(yīng)用在像素集中,中間值作為中心點x的新值。圖1描述了一個3×3模板及結(jié)果。
圖1 中值濾波模板及結(jié)果
中值濾波的結(jié)果值是其源圖像鄰域中的某個點,模板在跨過邊界時,其中值濾波并不會創(chuàng)造實際中沒有的點。正是這個原因,中值濾波對于突變的邊緣點保存時會比均值濾波好。
1.2 高斯差分
1.2.1 DoG
DoG[9](Difference of Gaussian)可以理解為是對LoG[10]的近似,其也就是對σ2Δ2G[10-11]的近似,如圖2所示。SIFT[12]算法描述中,同一尺度上的特征檢測,可以通過對兩個相鄰高斯尺度空間的圖像相減,圖像D(x,y,σ)為DoG響應(yīng)值。類比于LoG方法,可以通過對D(x,y,σ)進行局部最大值搜索處理,在尺度空間和空間位置定位局部特征點。其中:
(1)
k為相鄰兩個尺度空間倍數(shù)的常數(shù)。
圖2 DoG的三維圖以及DoG與LoG的對比
高斯金字塔,在分辨率金字塔圖像上做簡單降采樣,然后加入高斯濾波,這樣可以使得每層金字塔有多張高斯模糊圖像,如圖3所示。
圖3 圖像高斯金字塔
高斯金字塔的組數(shù)為
θ=[log2(min(m,n))]-3
(2)
式中m、n分別為圖像的寬度和高度。其中σ為高斯模糊系數(shù),具體關(guān)系如下
(3)
式中:c為每組中層坐標;S為每組層數(shù)(一般為3~5);σ0為初始尺度;σ為尺度空間坐標。由此公式,就可以得到金字塔組內(nèi)各層尺度以及組間各圖像尺度關(guān)系。
組內(nèi)相鄰圖像尺度關(guān)系:
(4)
相鄰組間尺度關(guān)系:
(5)
所以,相鄰兩組的同一層尺度為2倍的關(guān)系。
最終尺度序列總結(jié)為
(6)
式中,s為每組金字塔層數(shù);θ為金字塔組數(shù)。實驗仿真圖如圖4所示。
圖4 DoG效果圖
圖4a是原圖,圖4b、圖4c分別是由高斯模糊得到,圖4d為二者作差后,并對其結(jié)果進行灰度均衡化的結(jié)果。
1.2.2 構(gòu)建高斯金字塔
構(gòu)建高斯金字塔之后,利用金字塔相鄰圖像相減從而構(gòu)造出DoG金字塔,如圖5所示。
圖5 高斯差分圖
1.2.3 三幀差分法
三幀差分,對于高斯模糊后的圖像,按公式(7)處理,可以得出第k幀圖像、第k-1幀圖像之間的差分后的圖像Dk,再利用公式(7)得出k+1幀圖像與第k幀圖像之間的差分圖像Dk+1,對Dk、Dk+1使用圖像閾值分割算法,即按公式(8)進行二值化處理,當差分圖像中某一像素的差大于設(shè)定的閾值時,則認為該像素是前景像素,否則認為其是背景像素。再對Dk、Dk+1進行與操作,獲取相同部分,從而得到新的圖像Dk+2。
Dk(x,y)=|fk(x,y)-fk-1(x,y)|
(7)
式中,fk(x,y)、fk-1(x,y)為連續(xù)兩幀圖像;Dk(x,y)為幀差圖像。高斯模糊結(jié)合三幀差分試驗效果如圖6所示。
圖6 三幀差分效果圖
圖中,圖6a、圖6b、圖6c是連續(xù)三幀圖像,圖6d是對其進行三幀差分的結(jié)果圖。
(8)
將前述算法中得到的圖6d進行閾值化后的結(jié)果圖為Rk(x,y),即幀差結(jié)果圖。T的選取由Dk(x,y)應(yīng)用OTSU方法得到。相關(guān)試驗結(jié)果說明如圖7所示。
圖7 閾值分割圖
圖中,圖7a是圖6閾值處理結(jié)果,圖7b是在上述算法過程圖像序列中隨機抽取一張作閾值處理的結(jié)果。
1.2.4 數(shù)學(xué)形態(tài)學(xué)方法[13]
數(shù)學(xué)形態(tài)學(xué)方法是以形態(tài)為基礎(chǔ),對圖像進行分析的數(shù)學(xué)方法。其主要思想是利用具有一定形態(tài)的結(jié)構(gòu)元素來度量并且提取圖像中的對應(yīng)形狀,從而以達到對圖像分析和識別的目的。
膨脹[14-16]是用來填補物體中小的空洞現(xiàn)象以及狹窄的間隙。它能夠使目標的尺寸增大。腐蝕[14-16]是對集合元素采用向量減法,利用兩個圖像集合合并的結(jié)果,腐蝕是膨脹的對偶運算且腐蝕和膨脹都是不可逆運算。
在數(shù)字圖像處理中,對一幅圖像先進行腐蝕,然后再膨脹操作,將得不到原始圖像。其結(jié)果圖像將會比原始圖像更加簡單,一些細節(jié)將會被抹掉。先腐蝕再膨脹在數(shù)字圖像處理領(lǐng)域里,是一個重要的形態(tài)學(xué)變換,稱為開運算(Opening)[11]。相反,先膨脹再腐蝕稱為閉運算(Closing)[11]。試驗效果如圖8所示。
圖8 形態(tài)學(xué)處理對比圖
圖8a是原圖,圖8b是經(jīng)過閉運算后得到的實驗結(jié)果圖。從圖8可以明顯地看出,圖像邊緣信息更加豐富、清晰,為目標輪廓特征提取提供了較好的基礎(chǔ)。
2.1 改進算法與效果圖
圖9a、9b是相同水域、距離不同、光照角度不同兩張原圖像;圖9c是三幀差分結(jié)果的圖;圖9d是三幀差分結(jié)合高斯差分結(jié)果的圖像;圖9e是混合高斯模型結(jié)果的圖像;圖9f是幀差法結(jié)合高斯差分處理后結(jié)合數(shù)學(xué)形態(tài)學(xué)處理的結(jié)果;圖9g是相比于圖9d距離較近運用三幀差分結(jié)合高斯差分的結(jié)果圖;圖9h是相比于圖9e距離較近運用混合高斯模型的結(jié)果圖;圖9i是相比于圖9f距離較近運用幀差法、高斯差分結(jié)合數(shù)學(xué)形態(tài)學(xué)處理的結(jié)果圖。
2.2 幾何特征[17]提取
輪廓特征是幾何特征提取的前提,也是正確識別目標的要素。幾何特征定義為目標圖像區(qū)域外圍輪廓及其包含的像素點的數(shù)量。幾何特征是根據(jù)目標最小外接矩得到。包括輪廓面積特征、緊密度特征、凸包性特征、凸起度量等。
圖9 實驗結(jié)果圖
本文,提取目標輪廓,多邊形逼近,外接矩形特征的提取,為了便于從直觀上感受幾何特征,在此,將原圖像作透視變換和仿射變換,既旋轉(zhuǎn)一定的角度和平移一定距離,并將內(nèi)部填充。實驗結(jié)果如圖10所示。
圖10 目標幾何特征提取圖
根據(jù)圖10,可以得到目標輪廓的緊密度特征,其輪廓周長為1299.6,面積為12451,緊密度特征為0.10438。利用此特征,可以為目標識別提供良好的特征信息。
實驗中處理的視頻圖像具有背景復(fù)雜、光照角度不同,距離不同等特點。按照算法流程在VS2013+OpenCV平臺上運行得到實驗結(jié)果,仿真界面如圖11所示。
圖11 實驗仿真界面
從圖9可以看出,圖9c中,出現(xiàn)連通域較少,斷線嚴重,邊緣信息損失較多,不利于運動目標輪廓的提??;圖9d較之圖9c,斷續(xù)現(xiàn)象得到一定的改善,整體輪廓較為清楚,但是邊緣存在缺失現(xiàn)象;圖9e中,出現(xiàn)很多“鬼影”,較難分、辨出運動目標;圖9f中,由于DoG對于灰度增強有明顯的效果,可以看出運動目標輪廓清晰,邊緣信息保存完整,斷層現(xiàn)象沒有,這里給出DoG具體公式如下:
(9)
DoG是一種將一個原始灰度圖像的模糊圖像從另一幅灰度圖像進行增強的算法,通過DoG以降低模糊圖像的模糊度。這個模糊圖像是通過將原始灰度圖像經(jīng)過帶有不同標準差的高斯核進行卷積得到的。用高斯核進行高斯模糊只能壓制高頻信息。從一幅圖像中減去另一幅可以保持在兩幅圖像中所保持的頻帶中含有的空間信息。DoG相當于一個能夠去除了那些在原始圖像中被保留下來的頻率之外的所有其他頻率信息的帶通濾波器??梢杂脕碓黾舆吘壓推渌毠?jié)的可見性。將上述結(jié)果進行灰度值均衡化處理既得出結(jié)果圖像。
對比與不同光照、不同距離、不同拍攝角度情況下得到的實驗組圖,本文可以得到較好的實驗效果,能夠提取水面目標運動信息。文中對目標視頻序列進行檢測。實驗過程中,由于水面起伏變化不定,造成運動背景復(fù)雜,會出現(xiàn)漏檢、誤檢現(xiàn)象,檢測結(jié)果見表1。
表1 檢測結(jié)果
由表1看出,誤檢量遠遠低于正確檢測量,虛警率也在接受的范圍內(nèi),實驗結(jié)果表明,本文方法能夠滿足水面無人艇動態(tài)運動目標檢測的要求。
研究了一種基于“三幀差法+DOG+形態(tài)學(xué)處理”運動目標檢測方法。首先,將得到的三幀圖像進行中值濾波,然后對其進行構(gòu)建圖像金字塔,對同一層相鄰經(jīng)過高斯核卷積的圖像進行差分。其次,結(jié)合三幀差法原理將得到的差分圖像進行閾值處理,利用數(shù)學(xué)形態(tài)學(xué)方法對其處理。實驗結(jié)果表明,此方法可以較好地進行運動目標檢測、算法復(fù)雜度低,易實現(xiàn)。
[1]Larson J,Brucha M,Halterman R,et al.Advances in autonomous obstacle avoidance for unmanned surface vehicles[C]//Proceedings of AUVSI Unmanned Systems North America 2007.Washington,USA,2007:1-15.
[2]朱明旱,羅大庸.基于幀間差分背景模型的運動物體檢測與跟蹤[J].計算機測量與控制,2006,14(8):1004-1006.
[3]程遠航.基于光流法的視頻人臉特征點跟蹤方法[J].計算機與現(xiàn)代化,2010(7):120-122.
[4]徐俊紅.基于光流場的視頻運動檢測[C]//哈爾濱:哈爾濱工程大學(xué),2005.
[5]王東方,王玉德,王景武.基于改進的混合高斯模型的運動目標檢測方法[J].激光技術(shù),2014,38(6):776-779.
[6]趙佳.視頻圖像序列中運動目標監(jiān)測與跟蹤方法研究[D].北京:北京交通大學(xué),2010.
[7]ZHOU L,ZHU H.Optical flow calculation based on dual subtraction for motion detection[J].Computer Simulation,2009,26(12):168-171.
[8]董穎.基于光流場的視頻運動檢測[D].濟南:山東大學(xué),2008.
[9]Stricker D A,Alba G P,Anderson C C,et al.Characteristics of high-transmission-probability tunnel junctions for use as particle detectors[J].Magnetics,IEEE Transactions on,1989,25(2):1343-1346.
[10]Burt P J,Adelson E H.The Laplacian Pyramid as a Compact Image Code[J].Communications,IEEE Transactions on,1983,31(4):532-540.
[11]李志強,霍宏,方濤,等.Technique Based on Image Pyramid and Bayes Rule for Noise Reduction in Unsupervised Change Detection[J].Journal of Shanghai Jiaotong University(Science),2009,14(6):659-663.[12]Peker K A.Binary SIFT:Fast image retrieval using binary quantized SIFT features[C]//Content-Based Multimedia Indexing(CBMI),2011 9th International Workshop on.Madrid,Spain,2011:217-222.
[13]徐俊紅.基于光流場的視頻運動檢測[D].哈爾濱:哈爾濱工程大學(xué),2005.
[14]董士崇.視頻圖像的運動分析[D].武漢:武漢理工大學(xué),2005.
[15]張克偉.基于數(shù)學(xué)形態(tài)學(xué)的車流量檢測技術(shù)研究[D].西安:長安大學(xué),2011.
[16]趙世喆.基于序列圖像的運動目標檢測和跟蹤算法研究[D].北京:北方工業(yè)大學(xué),2006.
[17]馬忠麗,文杰,梁秀梅,等.無人艇視覺系統(tǒng)多類水面目標特征提取與識別[J].西安交通大學(xué)學(xué)報,2014,48(8):60-66
(責任編輯:馬金發(fā))
The Motion Target Detection Technology Based on USV
DONG Huiying,XU Peng
(Shenyang Ligong University,Shenyang 110159,China)
During the unmanned surface vehicle homework process,moving object is the important source of information reference.In order to improve the efficiency of the water moving target detection,a variety of moving target detection method is studied.On this basis,a kind of effective method to detect dynamic target,unmanned craft on the surface of water is studied.First of all,the improved Gaussian difference of image processing is carried out.Secondly,moving object is detected by combining with the principle of three frame difference method.Finally,the motion target is well extracted by using mathematical morphology theory.Results show that the algorithm can be better for moving target detection,with low algorithm complexity and easy implementation.
three frame difference;gaussian difference;morphology
2015-09-14
董慧穎(1962—),女,教授,博士,研究方向:機器視覺與模式識別,人工智能。
1003-1251(2016)05-0033-06
TP391
A