趙 園,潘 斌,邰建豪
(武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430079)
SAR圖像的分割是實現(xiàn)SAR圖像目標(biāo)識別的關(guān)鍵步驟,所以,快速、準(zhǔn)確地分割圖像,是SAR圖像解譯的關(guān)鍵技術(shù)之一。但是,由于SAR圖像特有的斑點噪聲的影響,使SAR圖像目標(biāo)的分割問題較為復(fù)雜,是SAR圖像分割研究中的難點之一[1]。
基于圖論的圖像分割方法的核心是對圖像建模,生成描述圖的能量函數(shù)并使其最小化,再通過能量最小化,求取圖像的最大流進行圖像分割。常見的算法有歸一化分割(Normalized cuts)、隨機游走(Random work)、圖割(Graph cuts)、迭代圖割(Grab Cut)等。GREID等提出了Graph Cuts算法,該算法指定背景區(qū)域,通過直方圖建模生成能量函數(shù),完成對圖像的分割[2-3],交互簡潔,處理速度快,但僅限于對灰度圖像的分割;Boykov提出了GrabCut算法,該算法利用高斯混合模型(GMM)代替灰度直方圖,對前景和背景區(qū)域建立GMM模型,構(gòu)造能量函數(shù),并使用迭代的Graph Cuts算法完成圖像的分割[4]。迭代求解使得分割結(jié)果更為準(zhǔn)確,但同時也會減緩處理速度。
針對Grab Cut算法,目前已有不少改進。在提升算法效率和準(zhǔn)確度上,Tomoyuki Nagahashi 等在 Grab cut 方法上引入多尺度高斯平滑;翟玲提出一種基于超像素與特征改進的 Grab cut 算法[5];有學(xué)者提出一種結(jié)合分水嶺和Grab cut基于前景形態(tài)的多尺度圖像分割方法,以少量的像素點迭代估計GMM參數(shù),提高算法穩(wěn)定性與普適性[6]。在減少人工交互操作上,D.Khattab以聚類算法為基礎(chǔ),提出了Automatic Grab cut算法的目標(biāo)分割[7];張林對整幅圖像進行建模,利用全局最大流鄰域生長算法進行SAR目標(biāo)的分割等[8]。
本文結(jié)合SAR圖像的乘性噪聲干擾、目標(biāo)較小等特點,從提高算法準(zhǔn)確度和減少人工交互操作出發(fā),通過預(yù)分割的方式,利用FCM算法提供兩組準(zhǔn)確度較高的GMM參數(shù)初始值,迭代求得能量函數(shù)的最小值,得到含目標(biāo)、陰影、噪聲點的分割圖;對分割圖做濾波處理后,再結(jié)合二維熵濾去孤立的噪聲點和陰影,最終分割出目標(biāo)區(qū)域。
Grab cut是在Graph cuts的基礎(chǔ)上改進得來的,該算法利用高斯混合模型(GMM)取代原有的直方圖,并通過多次迭代求得能量函數(shù)的最小值,精簡了交互過程,使圖像分割準(zhǔn)確度更高[10]。其核心算法:
1)矩形框標(biāo)定。對于待分割圖像Z=(z1,z2,…,zn),如圖1所示,人工畫出一個包含目標(biāo)的矩形框。框內(nèi)表示未知區(qū)域,即“可能為目標(biāo)的像素”,初始化時,該區(qū)域一般包含了目標(biāo)和一部分背景區(qū)域,標(biāo)記為TU;框外表示背景區(qū)域,標(biāo)記為TB;前景區(qū)域標(biāo)記為TF,即“確定為目標(biāo)的像素”,初始化時TF=?。圖像像素點集合α=(α1,α2,…,αn),α∈(0,1),0表示TB區(qū)域,1表示TU區(qū)域。
圖1 圖像區(qū)域示意圖
2)建立GMM模型及能量函數(shù)。由式1可以看出,Grab cut分割過程即為能量最小化的過程:
α=argminEα.
(1)
該算法的能量函數(shù)E表示:
E(α,θ,k,Z)=U(α,θ,k,Z)+V(α,Z),
(2)
(3)
其中,U表示能量函數(shù)的數(shù)據(jù)項,即某個像素屬于目標(biāo)或者背景的概率的負對數(shù);V表示能量函數(shù)的邊界項;D為表示GMM的函數(shù),θ為選用的GMM模型參數(shù),α為像素的標(biāo)記,k表示GMM個數(shù)。用來表示高斯混合模型的函數(shù)D包含多個高斯分量,每一個高斯分量又都是相互獨立的,因此,引入一組新的向量K={k1,k2,k3,…,kN},k=1,2,3,…,N,用來標(biāo)記像素Zn屬于第Kn個高斯分量。高斯混合模型的函數(shù)定義為
D(αn,kn,θ,Zn)=-logP(Zn|αn,kn,θ,Zn)-
logω(αn,kn).
(4)
化簡后得到
D(αn,kn,θ,Zn)=-logω(αn,kn)+
μ(αn,kn)]T∑(αn,kn)-1[Zn-μ(αn,kn)].
(5)
其中,GMM的參數(shù)θ有三個:ω(αn,kn)為GMM的權(quán)重,μ(αn,kn)為GMM的均值向量,∑(αn,kn)為GMM的協(xié)方差矩陣。一旦確定了這三個參數(shù),帶入目標(biāo)的GMM和背景的GMM,確定能量函數(shù)的數(shù)據(jù)項。故GMM的參數(shù)可表示為
θ={ω(α,k),μ(α,k),∑(α,k)}.
(6)
同時,對于邊界項V:
V(α,Z)=γ∑(m,n)∈cexp(-β‖Zm-
Zn‖2)×δ(Zm,Zn).
(7)
邊界項主要體現(xiàn)鄰域像素之間不連續(xù)的懲罰,像素之間的相似性用歐式距離來表達,兩鄰域像素差別越大,能量越小。γ,β是常數(shù),Rother[10]等人在實驗中取得γ=50,β根據(jù)圖像對比度來確定。
3)迭代能量函數(shù)最小化。首先利用人工標(biāo)記的TU和TB兩個像素集合初始化GMM模型,建立能量函數(shù),并通過最大流-最小割算法進行初始分割;根據(jù)初始分割結(jié)果更新前景區(qū)域TF和背景區(qū)域TB集合,更改前景和背景區(qū)域?qū)?yīng)的GMM參數(shù)θ,并通過最大流算法[11-12],使得能量函數(shù)E(α,k,θ,Z)越來越小,重復(fù)此過程,直到迭代終止。
Grab cut算法主要缺點有兩個:一是需要進行人工交互操作,不夠方便;二是算法穩(wěn)定性不夠高,GMM初始化參數(shù)的好壞會直接影響到分割結(jié)果[8]。Grab cut進行圖像分割時,利用背景集合和前景集合初始化了兩個GMM,相當(dāng)于將圖像分為了兩類,因此利用無監(jiān)督的聚類方法對圖像自動預(yù)分割,并利用統(tǒng)計結(jié)果代替原有的GMM初始化參數(shù),既可以將算法改為自動化,又可以得到更為準(zhǔn)確的GMM初始化參數(shù)。
GMM的參數(shù)估計由EM算法得到,GMM的初始化依賴于EM算法的初始化[13-14],則該問題轉(zhuǎn)化為EM算法的初始值選擇。針對SAR圖像含噪的特點,考慮用FCM算法代替原有的隨機參數(shù)的方法來選取EM算法的初始值,即利用FCM算法將SAR圖像粗略的劃分為兩類TU和TB,根據(jù)統(tǒng)計結(jié)果得到兩組參數(shù)作為EM算法的初始值。
SAR圖像中的乘性噪聲模糊了相鄰區(qū)域的對比度,使得相鄰區(qū)域的躍變趨于平緩,不同地物邊緣處出現(xiàn)過渡帶,難以確定邊緣的準(zhǔn)確位置,因此SAR圖像的地物邊緣具有模糊性。FCM 算法屬于模糊聚類的一種,該算法利用隸屬度來表示數(shù)據(jù)的真實分布,尤其適用于處理各類間有重疊的情況。它的目標(biāo)函數(shù):
(8)
(9)
其中,U為uki組成的矩陣集合,uki表示某個像素的隸屬度,其和為1;V為的集合,vk表示第k個聚類中心;m=2,表示模糊指數(shù),c表示聚類數(shù),‖·‖表示歐氏距離。
由式(6)可知GMM的參數(shù)θ是由μ,∑,w組成的。在改進的算法中,采用FCM算法將特征向量歸為k類中,并將各類的方差和均值作為∑和μ,w是各個類中所含的特征向量百分比。
由于SAR目標(biāo)圖像中目標(biāo)較小,目標(biāo)的陰影較大且含噪,因此在使用本文改進的Grab cut算法進行分割后,圖像中不僅包含了目標(biāo),還有目標(biāo)的陰影及斑點噪聲,如圖2(b)所示。
圖2 原圖、含陰影的分割圖及灰度直方圖對比
為了將SAR目標(biāo)圖像中的目標(biāo)分割出來,把陰影和噪聲濾去,根據(jù)圖2中顯示的灰度信息,閾值方法是比較簡單實用的方法。二維熵法同時考慮了像素灰度分布信息和其鄰域空間相關(guān)信息,具有較強的抗干擾能力[15],且二維熵法可以產(chǎn)生多個閾值,有利于后續(xù)進行SAR圖像多目標(biāo)分割的研究。故通過建立目標(biāo)及背景區(qū)域的概率密度函數(shù)迭代求出各自的二維熵,選擇合適的閾值,分割出SAR圖像中的目標(biāo)。
1)改進的Grab cut分割。通過FCM聚類將原圖像分為兩組數(shù)據(jù),初始化兩個更準(zhǔn)確的GMM參數(shù);建立能量函數(shù),迭代更新至收斂閾值,得到目標(biāo)、陰影、噪聲分割圖。
2)采用中值濾波,消除圖像中孤立的噪聲點,減少分割干擾,考慮到實驗所用SAR圖像尺寸,窗口大小選擇3×3;
3)利用二維熵算法確定分割閾值,濾除陰影及噪聲,提取出目標(biāo)區(qū)域;
4)對分割后的圖像進行二值化處理,完成SAR目標(biāo)的分割。
本文實驗數(shù)據(jù)采用Sandia 實驗室 MSTAR 數(shù)據(jù)庫的 SAR 圖像,MSTAR成像參數(shù)為 X波段、單極化(HH),分辨率為 0.3 m×0.3 m,大小為128×128,包含BMP-2、BTR-70、T-72 3類目標(biāo)。
根據(jù)本文算法,分別對數(shù)據(jù)庫中的3類目標(biāo)進行實驗,結(jié)果如圖3、圖4、圖5所示。
由圖3(b)、圖4(b)、圖5(b)可以看出,利用本文改進的自動Grab cut算法進行SAR圖像分割后,可以比較明顯的分割出目標(biāo)及陰影區(qū)域,且目標(biāo)及陰影的外部輪廓都比較完整,證明該改進算法的可行性;但是還存在兩個問題:一是有殘余的SAR目標(biāo)圖像的斑點噪聲,尤其是當(dāng)待分割的原圖中噪聲較為嚴重時,結(jié)果會更明顯,這點可以從圖4(a)、圖4(b)看出;二是目標(biāo)與陰影相接區(qū)域的灰度值變化不明顯,輪廓顯得較模糊。
圖3 BMP-2數(shù)據(jù)分割算法結(jié)果
圖4 T-72數(shù)據(jù)分割算法結(jié)果
圖5 BTR-70數(shù)據(jù)分割算法結(jié)果
對分割圖進行濾波可進一步抑制噪聲及雜波,若是直接對原圖進行濾波,可能會丟失一部分邊緣信息,導(dǎo)致分割結(jié)果不準(zhǔn)確。由圖3(c)、圖4(c)、圖5(c)可以看出,中值濾波對于脈沖噪聲具有較好的抑制作用,圖中的孤立噪聲明顯減少,且圖像的輪廓邊緣變形較小。
由圖3(d)、圖4(d)、圖5(d)可以看出,經(jīng)過二維熵算法分割后,SAR目標(biāo)圖像中的噪聲點進一步減少,這是因為該算法利用迭代技術(shù),抗干擾能力也有所提高;另外,通過設(shè)定合適的閾值,將陰影部分濾去,只保留了目標(biāo)區(qū)域,實現(xiàn)了SAR目標(biāo)圖像的分割。通過觀察可以看出,分割后的目標(biāo)輪廓較為完整,但是目標(biāo)內(nèi)部有部分缺失,這是由于目標(biāo)內(nèi)部灰度分布不均勻,導(dǎo)致部分區(qū)域隨著陰影被一起濾除掉。
為了更加客觀地評價本文算法,此處選用錯誤概率(probability of error)和無監(jiān)督的兩種評價指標(biāo),分別將改進后的Grab cut算法與改進前的Grab cut算法進行比較;同時將本文所提出的經(jīng)過后處理的改進算法與傳統(tǒng)的ICM_MRF分割方法、雙參數(shù)CFAR分割方法進行對比。
錯誤概率[16](probability of error)屬于有監(jiān)督評價指標(biāo)的一種。其定義:
P(error)=P(O)P(B|O)+P(B)P(O|B).
(10)
其中,P(R)表示由人工分割圖計算得到的區(qū)域R的先驗分割概率,P(R1|R2)表示把區(qū)域R2的像素劃分到區(qū)域R1的概率。錯誤概率常用于二類分割算法的評價,而本文所用圖像都為單目標(biāo)圖像,因此該評價方法具有適用性。
區(qū)域內(nèi)部均勻性度量[17]屬于無監(jiān)督評價的一種,不需要先驗知識和標(biāo)準(zhǔn)參考分割圖,其定義:
(11)
該方法利用同類內(nèi)部均勻性的程度來表示圖像的分割質(zhì)量,即PP值越接近1說明圖像分割質(zhì)量越高。
從MSTAR數(shù)據(jù)庫中隨機挑選50張圖像,評價指標(biāo)取結(jié)果均值,結(jié)果如表1所示。
表1 改進前后Grabcut算法的性能指標(biāo)比較
由表1可以看出,使用改進后Grab cut分割出的圖像質(zhì)量更好,但是準(zhǔn)確率卻低于改進前的Grab cut 分割方法。主要原因是人工交互可以準(zhǔn)確的識別簡單目標(biāo),而利用函數(shù)模型表達分割問題則會有一定的出錯率。
由表2可以看出,使用本文方法得到的分割結(jié)果在區(qū)域內(nèi)部均勻性度量和錯誤概率兩項指標(biāo)上均優(yōu)于傳統(tǒng)的ICM-MRF和雙參數(shù)CFAR分割方法,具有更高的精度和一定的適用性。
表2 不同分割算法的性能指標(biāo)比較
本文通過FCM聚類進行初始化分割,得到兩組質(zhì)量較好的GMM參數(shù),把傳統(tǒng)需要交互的Grab cut算法自動化,得到了初步的分割圖。同時為了濾去SAR目標(biāo)圖像中的陰影及噪聲,引入二維熵算法,通過選定合適的閾值,最終分割出SAR圖像中的目標(biāo),改善了SAR圖像目標(biāo)分割方法對于噪聲敏感且需要人工交互的問題。根據(jù)實驗結(jié)果,本文方法取得的效果良好,有一定的適用性。
本文使用的實驗圖像都為單一目標(biāo)SAR圖像,除了特有的噪聲外,SAR圖像背景也較簡單,沒有其他地物等的干擾,因此在利用聚類算法初始化時能取得較好的預(yù)分割效果,后續(xù)進行閾值分割時也比較容易;但是在多目標(biāo)圖像或者背景分布比較復(fù)雜的SAR圖像上時,算法是否適用以及該怎樣改進,是后續(xù)研究重點之一。另外, Grab cut算法中進行能量函數(shù)最小化的過程以及二維熵算法都使用了迭代技術(shù),增加了計算量,因此,在進行大場景數(shù)據(jù)分割時,還需要做出下一步的改進提高算法的效率。
[1] 焦李成, 張向榮, 侯彪, 等. 智能SAR圖像處理與解譯[M]. 北京:科學(xué)出版社,2008:21-27.
[2] GREIG D,PORTEOUS B,SEHEULT A. Exact maximum a posteriori estimation for binary images[J]. Journal of the Royal Society, Series B,1989,51(2):271-279.
[3] SZELISKI R, ZABIN R, SCHARSTEIN D, et al. A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness Based Priors [J]. IEEE Transaction on Pattern Analysis and Machin Intelligence(S0162-8828),2008,30(6): 1068-1080.
[4] BOYKOV Y,KOLOMOGOROY V. An experimental comparison of min-cut/maxflow algorithms for energy Minimization in Computer Vision and Pattern Recognition[M]. Springer Verlag, 2001:359-374.
[5] 翟玲, 朱敏, 戴李君. 基于超像素與特征改進的Grab cut前景分割[J].微型電腦應(yīng)用,2015,31(11):48-50.
[6] 伊聰聰, 吳斌, 張紅英. 一種改進的Grab cut 圖像分割方法[J].小型微型計算機系統(tǒng),2014(35):1164-1168.
[7] KHATTAB D, EBIED H M, HUSSIEN A S,et al. Automatic Grab Cut based on unsupervised clustering for image segmentation[J]. Intelligent Systems and Computing, 2015( 323):579-592.
[8] 張林, 朱兆達. 基于全局Maxflow領(lǐng)域生長算法的SAR圖像目標(biāo)分割[J]. 南京航空航天大學(xué)學(xué)報, 2010(12):15-16.
[9] BLAKE A, ROTHER C, BROWN M, et al.Interactive Image Segmentation using an adaptive GMMRF model[C]. In Proc. European Conf. Computer Vision,2004, 30(21):428-441.
[10] ROTHER C, KOLMOGOROV V, BLAKE A. Grabcut: Interactive foreground extraction using iterated graph cuts[C]. Transactions on Graphics (TOG). ACM, 2004.23(3): 309-314.
[11] 陳國良, 孫廣中, 徐云, 等. 并行算法研究方法學(xué)[J]. 計算機學(xué)報,2008, 31(9):1493-1502.
[12] YUAN J,BAE E,TAI X C. A study on continuous max-flow and min-cut approaches[C].Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on. IEEE, 2010: 2217-2224.
[13] 王鑫.基于高斯混合模型的聚類算法及其在圖像分割中的應(yīng)用[D]. 太原:中北大學(xué),2013.
[14] WU W Y, WANG M J. Elliptical object detection by using geometric properties[J]. Pattern Recognition. 1993. 26(10):1499-1509.
[15] YIMIT A. A New Two-Dimensional Direction Histogram Based Entropic Thresholding[C].International Conference on Image & Graphics, 2011:106-110.
[16] 張曉敏. 一類馬氏樣本下假設(shè)檢驗問題錯誤概率的估計[J]. 應(yīng)用數(shù)學(xué), 2008,21(1):179-184.
[17] ZELNIO E G, GARBER F D. Algorithms for Synthetic Aperture Radar Imagery X[J]. Society of Photo-optical Instrumentation Engineers Conference Series, 2012:8394.