范肖肖,許文波,楊 淼,樊香所
(電子科技大學(xué),四川 成都 611731)
?
基于視覺(jué)注意機(jī)制的遙感圖像船只檢測(cè)
范肖肖,許文波,楊淼,樊香所
(電子科技大學(xué),四川 成都 611731)
摘要針對(duì)視覺(jué)注意機(jī)制中Itti模型在顯著性區(qū)域提取中提取顏色、方向和亮度3種特征,應(yīng)用到遙感圖像中容易造成錯(cuò)檢的問(wèn)題,在Itti模型基礎(chǔ)上提出了改進(jìn)的顯著性模型,用紋理特征代替Itti模型中的顏色特征和亮度特征,同時(shí)考慮了圖像在頻域中的顯著性。對(duì)改進(jìn)后的算法進(jìn)行仿真,仿真結(jié)果表明,改進(jìn)算法檢測(cè)精度高、實(shí)時(shí)性好,顯著區(qū)域與目標(biāo)基本一致, 能夠有效地檢測(cè)遙感圖像中船只目標(biāo)。
關(guān)鍵詞Itti模型;顯著性;目標(biāo)檢測(cè);特征提取
0引言
遙感圖像目標(biāo)檢測(cè)是隨著遙感技術(shù)不斷發(fā)展應(yīng)運(yùn)而生的技術(shù),船只作為利用海洋、開(kāi)發(fā)海洋的重要工具,船只檢測(cè)[1,2]成為檢測(cè)重點(diǎn)。目標(biāo)檢測(cè)方法主要有基于特征的目標(biāo)檢測(cè)、基于模型的目標(biāo)檢測(cè)和基于統(tǒng)計(jì)學(xué)的目標(biāo)檢測(cè)方法?;诨叶忍卣鞯呐灤瑱z測(cè)主要是利用艦船與水體灰度差異特征進(jìn)行分割,從而獲得艦船目標(biāo)候選區(qū)。有雙參數(shù)CFAR、K分布的CFAR[3]算法;基于紋理特征提取有:基于分形模型[4]、基于CDTM矩陣和基于Gabor濾波器組的紋理特征。近年來(lái),機(jī)器學(xué)習(xí)應(yīng)用到了目標(biāo)檢測(cè)[5]中,主要有基于支持向量機(jī)[6]的目標(biāo)檢測(cè)。
本文采用選擇注意機(jī)制中的Itti[7]模型,并在該模型基礎(chǔ)上進(jìn)行改進(jìn)進(jìn)行船只目標(biāo)檢測(cè)研究。分別提取圖像的方向特征、紋理特征和頻域上的顯著性,將圖像中多種特征融合形成特征顯著圖,然后通過(guò)視覺(jué)注意轉(zhuǎn)移機(jī)制獲得顯著目標(biāo)。該模型適用于遙感圖像中船只目標(biāo)檢測(cè)[8]。
1船只目標(biāo)檢測(cè)模型
視覺(jué)注意機(jī)制分為2種模型:自底向上模型主要從圖像本身特征出發(fā),以物體為中心,將容易引起人們注意的物體作為人類感興趣區(qū)域進(jìn)行研究;自頂向下模型[9,10]是從人類視覺(jué)感興趣區(qū)域出發(fā),加入了先驗(yàn)知識(shí),已知感興趣目標(biāo)的相關(guān)信息來(lái)對(duì)圖像進(jìn)行目標(biāo)發(fā)現(xiàn)。Itti模型主要基于自底向上的模型,主要分為3步:① 對(duì)圖像進(jìn)行線性濾波,分別計(jì)算圖像亮度、顏色和方向特征,生成3種特征的顯著圖;② 利用贏者為王機(jī)制,提取圖像的視覺(jué)顯著性區(qū)域;③ 返回抑制機(jī)制抑制提取出的顯著性區(qū)域,通過(guò)贏著為王機(jī)制,視覺(jué)注意轉(zhuǎn)移到下一個(gè)顯著性區(qū)域,實(shí)現(xiàn)視覺(jué)在全圖中的轉(zhuǎn)移。
1.1Itti模型
Itti模型依據(jù)目標(biāo)與背景之間特征,對(duì)比度之間的差異,模擬人類感知能力,提取感興趣區(qū)域。Itti模型示意圖如圖1所示。
圖1 Itti模型
1.1.1顯著性特征圖生成
r,g,b為圖像的紅、綠、藍(lán)3個(gè)通道,亮度特征I=(r+g+b)/3。提取圖像的紅、黃、綠、藍(lán)4個(gè)顏色通道的特征分量。
(1)
Gabor濾波器分別提取圖像{0°,45°,90°,135°}4個(gè)方向特征,Gabor濾波器表示如下:
(2)
x0=xcosθ+ysinθ。
(3)
式中,θ表示方向,分別為0°,45°,90°,135°;f表示頻率;δx0,δy0分別表示水平方向和垂直方向上的方差。
對(duì)提取的亮度特征、顏色特征和方向特征進(jìn)行高斯濾波建立金字塔模型,分別是I(δ),R(δ),G(δ),B(δ),O(σ,θ),σ表示尺度。對(duì)得到多尺度的特征圖進(jìn)行中央—周邊差分操作,特征圖在不同尺度下進(jìn)行相減操作。c表示金字塔的中央層,取值為{2,3,4},c+s表示金字塔結(jié)構(gòu)周邊層,s為{3,4},中央層與周邊層做減法操作。
強(qiáng)度特征中心周邊差為:
(4)
顏色特征中心周邊差為:
(5)
方向特征中心周邊差為:
(6)
C和S之間的關(guān)系為:
S=C+δ。
(7)
計(jì)算中心周邊差異進(jìn)行合并得到3幅圖像的醒目圖計(jì)算公式為:
(8)
特征圖進(jìn)行歸一化,并通過(guò)線性組合得到最終的顯著圖S,
(9)
1.1.2視覺(jué)轉(zhuǎn)移機(jī)制[11]
顯著圖中各目標(biāo)通過(guò)競(jìng)爭(zhēng)吸引注意焦點(diǎn),焦點(diǎn)在每個(gè)待測(cè)目標(biāo)中進(jìn)行轉(zhuǎn)移,采用勝者全贏機(jī)制選擇顯著圖中最值。如果沒(méi)有一定的機(jī)制,注意焦點(diǎn)指向顯著值最大的點(diǎn)及領(lǐng)域 ,采用勝者取全的方法得到顯著圖。
1.2改進(jìn)Itti模型
傳統(tǒng)的Itti模型只考慮到了顏色、方向和亮度3種特征,針對(duì)于海面背景目標(biāo)檢測(cè)[12],傳統(tǒng)的模型具有一定的局限性。遙感圖像中,顏色所占比重比較小,遙感圖像中存在云、海浪等干擾,只考慮圖像顏色、方向和亮度3種特征會(huì)增大誤檢率。遙感圖像中目標(biāo)與背景紋理上具有一定差異,提取特征顯著圖時(shí)加入紋理特征顯著圖,同時(shí)結(jié)合頻域思想和全局對(duì)比等思想。
1.2.1紋理特征
紋理在圖像上表現(xiàn)為灰度或者是顏色分布的某種規(guī)律性。圖像可以看成是不同紋理區(qū)域的組合,紋理是對(duì)局部區(qū)域像素之間關(guān)系的一種度量。紋理特征可用于定量描述圖像中的空間信息。
梯度結(jié)構(gòu)張量對(duì)圖像進(jìn)行紋理分析,I(x,y)設(shè)為圖像的灰度值,水平和垂直方向上的梯度用Ix和Iy表示。圖像的梯度結(jié)構(gòu)張量T為:
(10)
(11)
λ1,λ2表示矩陣的特征值,特征值為:
(12)
結(jié)構(gòu)張量矩陣的特征值表示圖像局部特征信息,圖像的一致性用結(jié)構(gòu)張量矩陣的特征表示為:
(13)
1.2.2頻域上顯著性
圖像在頻率域[13]上分為低頻和高頻2個(gè)部分,高頻部分反映圖像紋理信息,低頻部分反映圖像輪廓。Wtc表示顯著性低頻率,Whc表示最高頻率。設(shè)計(jì)一組DOG濾波器來(lái)獲得Wtc~Whc的信息。DOG帶通濾波器表達(dá)式為:
G(x,y,σ1)-G(x,y,σ2)。
(14)
σ1σ2適合的比率為ρ=1∶1.6,設(shè)計(jì)多個(gè)DOG組成一個(gè)組合DOG濾波器:
G(x,y,ρNσ)-G(x,y,σ)。
(15)
基于頻域的方法使用窗口5*5的高斯平滑舍去高頻信息,N=∞,G(x,y,ρNσ)是對(duì)整個(gè)圖像的平均,像素P的顯著性公式為:
S(P)=||Iμ-Iwhc(p)||。
(16)
式中,Iμ為圖像平均特征;Iwhc(p)為p在高斯平滑后的圖像中顏色特征。
1.3顯著目標(biāo)檢測(cè)
結(jié)合Itti模型和頻域模型,分別得到2種模型下的顯著圖,對(duì)得到的顯著圖進(jìn)行規(guī)范化,規(guī)范化函數(shù)為:
N(A)=(A-minA)/(maxA-minA)。
(17)
利用兩者相乘得到總的顯著圖:
SP=NSG×NSR。
(18)
利用區(qū)域生長(zhǎng)方法對(duì)顯著圖進(jìn)行分割,以一組種子開(kāi)始處理生長(zhǎng)區(qū)域,將那些預(yù)定義屬性類似于種子的領(lǐng)域像素附加到作為種子的次簇的質(zhì)心。記顯著圖上最大像素值為Imax,從顯著圖中最亮的一個(gè)點(diǎn)向周圍八領(lǐng)域方向生長(zhǎng),在某一個(gè)方向上某個(gè)像素值小于最亮點(diǎn)像素值的a倍,則停止生長(zhǎng),a的取值為0~1,直到所有方向上的生長(zhǎng)都停止結(jié)束。計(jì)算上一個(gè)目標(biāo)清零后的顯著圖中最亮點(diǎn)像素值,小于Imax*a,則檢測(cè)結(jié)束。
2實(shí)驗(yàn)結(jié)果
為了驗(yàn)證改進(jìn)算法的有效性,在Matlab2010(b)下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)中采用圖像尺寸為400*400的TM圖像和400*400的IKONOS圖像 。Itti算法檢測(cè)結(jié)果如圖2和圖3所示。
圖2 Itti模型下的TM影像檢測(cè)結(jié)果
圖3 Itti模型下的IKONOS影像檢測(cè)結(jié)果
圖2和圖3中分別是2種數(shù)據(jù)在Itti模型下的檢測(cè)過(guò)程結(jié)果,原始圖像(a)中一共有2個(gè)船只目標(biāo),而Itti模型得到的顯著圖出現(xiàn)了錯(cuò)誤目標(biāo)。Itti算法對(duì)IKONOS影像進(jìn)行檢測(cè),檢測(cè)率較低。在Itti模型上進(jìn)行改進(jìn)后的算法實(shí)驗(yàn)結(jié)果圖如圖4所示。從圖4中可以看到改進(jìn)后的算法具有較高的檢測(cè)率。
圖4 改進(jìn)后算法結(jié)果
用recall、precision 對(duì)算法進(jìn)行評(píng)價(jià),recall-precision曲線圖如圖5所示,評(píng)價(jià)指標(biāo)如圖6所示。
圖5中,右極限表示當(dāng)閾值取0時(shí)召回率最大,左極限表示當(dāng)召回率最低時(shí)精確度最高。圖6為迭代法取閾值情況下,每個(gè)算法的recall、precision和F的值。橫坐標(biāo)表示6種算法,每種算法分別有3個(gè)指標(biāo)精度:precision、召回率recall和綜合指標(biāo)F??v坐標(biāo)代表3個(gè)指標(biāo)的數(shù)值。改進(jìn)的算法相對(duì)于其他算法值要高。
圖5 recall-precision曲線
圖6 評(píng)價(jià)指標(biāo)
3結(jié)束語(yǔ)
本文采用基于選擇注意機(jī)制方法中的Itti模型來(lái)檢測(cè)海洋衛(wèi)星圖像中的船只目標(biāo)。分別提取圖像中各種特征,將圖像中多種特征在不同尺度下融合形成特征顯著圖,然后通過(guò)視覺(jué)注意轉(zhuǎn)移機(jī)制獲得顯著目標(biāo),但是Itti模型只提取顏色、方向和亮度,沒(méi)有考慮船只的紋理和尾跡等特征,容易造成錯(cuò)檢。針對(duì)此問(wèn)題,對(duì)Itti模型進(jìn)行改進(jìn),考慮了紋理特征,針對(duì)小目標(biāo)考慮了頻域中的顯著性。
參考文獻(xiàn)
[1]ELDHUSET K.An Automatic Ship and Ship Wake Detection System for Spacebome SAR Image in Costal Regions[J].IEEE Trans on Geosciences and Remote Sensing,1996,34(4):1 010-1 019.
[2]侯四國(guó),張紅,王超,等.一種新的SAR圖像船只檢測(cè)方法[J].遙感學(xué)報(bào),2005,9(1):50-56.
[3]JIANG Q,AITNOURI E,WANG S,et al,Automatic Detection for Ship Target in SAR Imagery Using PNN-model[J].Canadian Journal of Remote Sensing,2000,26(4):297-305.
[4]何四華,楊紹清,石愛(ài)國(guó),等.紋理高階分形特征在海面艦船目標(biāo)檢測(cè)中的應(yīng)用[J].光學(xué)與光電技術(shù),2008(4):79-82.
[5]張瑞.粒子濾波和均值漂移相結(jié)合目標(biāo)跟蹤算法[J].無(wú)線電通信技術(shù),2011,37(2):29-31.
[6]段松傳,韓彥芳,徐伯慶.基于協(xié)方差矩陣的復(fù)雜背景中目標(biāo)檢測(cè)[J].無(wú)線電通信技術(shù),2012,38(4):51-53.
[7]ITTI L,KOEH C,NIEBUR E.A Model of Saliency-based Visual Attention for Rapid Scene Analysis[J].IEEE Trans.Patt.AnaL.Mach,Intell.,1998,20:1 254-1 259.
[8]LI Hongliang,XU Linfeng,LIU Guanghui.Two-layer Average-to-peak Ratio Based Saliency Detection[J].Signal Processing:Image Communication,2013,28:55-68.
[9]LUOA Wang,LIA Hongliang,LIUA Guanghui,et al.Global Salient Information Maximization for Saliency Detection[J].Signal Processing:Image Communication,2012,27:238-243.
[10]VAPNIK V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[11]KOCH C,ULLMAN S.Shifts in Selective Visual:Towards the Underlying Neural Circuitry[J].Human Neurobiology.1985,4(4):219-227.
[12]GUO C,MA Q,ZHANG L.Spatio-temporal Saliency Detection Using Phase Spectrum of Quaternion Fourier Transform[C]//CVPR,2008:1-8.
[13]YANG Jimei,YANG Ming-Hsuan.Top-Down Visual Saliency via Joint CRF and Dictionary Learning[C]//CVPR,2012:718-731.
范肖肖女,(1989—), 碩士研究生,控制工程專業(yè)。主要研究方向:遙感圖像處理目標(biāo)檢測(cè)。
許文波男,(1973—),教授。主要研究方向:測(cè)繪科學(xué)與技術(shù)、遙感圖像處理。
聲明
《無(wú)線電工程》期刊社未開(kāi)展成立理事會(huì)相關(guān)事宜,如有任何單位或個(gè)人以《無(wú)線電工程》期刊社的名義組織理事會(huì)事項(xiàng),均與期刊社無(wú)關(guān)。
特此聲明!
引用格式:范肖肖,許文波,楊淼,等.基于視覺(jué)注意機(jī)制的遙感圖像船只檢測(cè)[J].無(wú)線電工程,2016,46(1):57-60.
Target Detection in Remote Sensing Image Based on
Visual Attention Mechanism
FAN Xiao-xiao,XU Wen-bo,YANG Miao,FAN Xiang-suo
(UniversityofElectronicScienceandTechnologyofChina,ChengduSichuan611731,China)
AbstractThe Itti model only extracts color,orientation,and intensity features in saliency area in visual attention mechanism,which has high false detection ratio in remote sensing.We proposed an improved Itti model,which puts texture feature into model and considers the saliency in frequency domain.Results show that this improved algorithm provides high detection ratio,pretty good realtime capability.The saliency area is basically identical to the object,which can effectively detect ship object in remote sensing.
Key wordsItti model;saliency;object detection;feature extraction
作者簡(jiǎn)介
收稿日期:2015-09-07
中圖分類號(hào)TP391
文獻(xiàn)標(biāo)識(shí)碼A
文章編號(hào)1003-3106(2016)01-0057-04
doi:10.3969/j.issn.1003-3106.2016.01.14