黃麗轉(zhuǎn),劉國軍,魏立力
(寧夏大學(xué)數(shù)學(xué)統(tǒng)計學(xué)院,銀川 750021)
圖像分割在圖像分析和計算機(jī)視覺中起著重要的作用,其目的是將特定圖像劃分為若干部分,通常每個部分在某一特征方面是均勻的,例如強(qiáng)度、顏色和紋理等。近年來,學(xué)者們提出了大量的圖像分割算法來提高圖像分割的精度和效率[1]。其中,活動輪廓模型(Active contour model,ACM)已成為圖像分割領(lǐng)域的一個有效框架,通常可分為基于邊緣的活動輪廓模型[2?3]和基于區(qū)域的活動輪廓模型[4?6]?;谶吘壍幕顒虞喞P褪褂锰荻刃畔硪龑?dǎo)不斷變化的輪廓向目標(biāo)邊界移動,此類模型對初始輪廓比較敏感,不能提取弱邊緣或模糊的目標(biāo)?;趨^(qū)域的活動輪廓模型根據(jù)圖像區(qū)域信息處理,當(dāng)演化曲線到達(dá)真實(shí)目標(biāo)邊界時能量達(dá)到極小值。作為Mumford?Shah(M?S)模型[6]的一個特殊實(shí)例,Chan?Vese(C?V)模型[4]是最具代表性的基于區(qū)域的ACM之一,該模型利用內(nèi)外平均灰度值的差異而不是圖像梯度來驅(qū)動演化曲線向邊界運(yùn)動。近幾年,不少文獻(xiàn)從不同方向?qū)?V模型進(jìn)行改進(jìn)[7?8]:Zhang等[9]提出一個基于圖像全局信息的活動輪廓(Selective local or global segmentation,SLGS)模型,提高了分割速度,然而由于依賴圖像的全局信息,對灰度不均勻圖像的分割效果不理想;Li等[10]提出基于圖像局部區(qū)域的可變灰度擬合(Region?scalable fitting,RSF)模型,克服了基于全局模型在灰度不均圖像分割中的不足,但從分割結(jié)果中可以看出,過度依賴圖像的局部信息使得該模型對初始化輪廓和噪聲較為敏感。
為了解決基于區(qū)域的活動輪廓模型中能量泛函的最小化問題,通過將模糊集納入活動輪廓模型,文獻(xiàn)[11]首次提出了一種基于模糊能量的活動輪廓(Fuzzy energy?based active contour,F(xiàn)EAC)模型。之后,文獻(xiàn)[12?14]提出了基于FEAC改進(jìn)的模型,將局部圖像信息納入基于區(qū)域的ACM。全局和局部FEAC(Global and local FEAC,GL?FEAC)[12?14]模型中的局部能量泛函將局部空間信息和強(qiáng)度信息結(jié)合到ACM中,降低了圖像中灰度不均勻性的影響。文獻(xiàn)[15?16]將圖像的核度量和形狀先驗等特征融合到FEAC模型中,提高了分割性能。但是,這些模型沒有正則化項,導(dǎo)致演化曲線不光滑,無法保持偽水平集的距離特征。此外,通過逐像素計算曲線演化過程中能量函數(shù)的變化值來更新隸屬度,大大增加了計算復(fù)雜度。更重要的是,分割的圖像中若包含弱邊緣和低對比度,可能會出現(xiàn)邊界缺失問題。Fang等[1]提出了一種新的基于混合和局部模糊區(qū)域邊緣的主動輪廓模型(Hybrid and local fuzzy region?edge based active contour model,HLFRA),可以成功地從高噪聲和強(qiáng)度不均勻的合成圖像和真實(shí)圖像中提取目標(biāo)邊界。Ahmad等[17]首次提出將變異系數(shù)(Coef?ficient of variation,CoV)與模糊隸屬函數(shù)相結(jié)合,可以分割具有較高噪聲、強(qiáng)度不均勻的圖像和弱紋理圖像。
受文獻(xiàn)[1,17]的啟發(fā),本文構(gòu)建的新能量泛函包括區(qū)域能量和邊緣能量。區(qū)域能量由基于變異系數(shù)的混合模糊區(qū)域項和局部模糊區(qū)域項組成,可以平衡目標(biāo)和背景的重要性,驅(qū)使初始輪廓向目標(biāo)邊界移動,而結(jié)合了局部空間信息的局部模糊區(qū)域項可以降低圖像強(qiáng)度不均勻性的影響。另外,邊緣能量對偽水平集函數(shù)進(jìn)行正則化,保持曲線演化過程中的平滑性。本文模型在分割有較高噪聲以及混合噪聲和弱紋理的圖像時,不僅速度快,而且分割性能較其他模型好。
為了獲得凸能量泛函,Krinidis等[11]將模糊思想引入ACM中,提出了FEAC模型。與流行的ACM不同,F(xiàn)EAC模型用0.5水平集作為演化曲線。偽水平集定義為
式中:I(x)為輸入圖像;in(C)和out(C)分別表示曲線C的內(nèi)部和外部。式(1)定義的偽水平集將圖像分割成兩部分,其能量泛函定義為
式中:常數(shù)η≥0,λ1>0,λ2>0為3個固定的參數(shù);m為指數(shù);Length(C)代表C的長度;c1和c2分別代表曲線內(nèi)外部的圖像的平均灰度值,保持u(x)不變,最小化式(2)可得
但是,F(xiàn)EAC模型中沒有正則化項,導(dǎo)致演化曲線不光滑,無法保持偽水平集的距離特征。此外,通過逐像素計算曲線演化過程中能量函數(shù)的變化值來更新隸屬度,大大增加了計算復(fù)雜度。更重要的是,當(dāng)分割的圖像邊緣較弱、對比度較低時,可能會出現(xiàn)遺漏邊界的問題。
HLFRA模型[1]與FEAC模型類似,演化曲線c由偽水平集表示,將圖像分為兩部分,能量泛函定義為
雖然HLFRA模型結(jié)合了圖像的區(qū)域和邊緣信息,但在分割具有弱邊緣的圖像時仍存在丟失邊緣信息的情況,且對混合噪聲的分割性能并不好。
變異系數(shù)可稱為信號的相對標(biāo)準(zhǔn)差,定義為SD mean,它可以被認(rèn)為是對給定觀測數(shù)據(jù)的離散度(變異)的規(guī)范化測量。Ahmad等[17]提出了一種基于變異系數(shù)的數(shù)據(jù)擬合項模型(Ali Ahmad模型)來處理真實(shí)圖像的空間異質(zhì)性。此外,模型采用模糊隸屬度函數(shù)表示圖像中每個像素對于前景或背景中的隸屬度。為了降低模型的計算量,用高斯濾波代替長度項,它能更好地擬合非均勻圖像中的數(shù)據(jù)。對于給定的圖像I0,定義圖像域Ω,Ali Ahmad模型[17]的能量泛函為
式中:λ1、λ2、μ均為正常數(shù);m為權(quán)重指數(shù),文中取m=2;0≤v(z)≤1為度量一個像素屬于曲線C內(nèi)的隸屬度,1-v(z)度量一個像素屬于曲線C外的隸屬度,v1(z)和v2(z)分別表示曲線C內(nèi)部和外部的平均灰度值,表達(dá)式為
該模型雖然可以分割具有弱紋理的灰度不均勻圖像,但對于復(fù)雜背景的圖像分割性能并不好,只能分割目標(biāo)明顯的圖像。
基于上述分析,本文提出了一種可用于分割具有較大噪聲以及混合噪聲和弱紋理的圖像分割模型。理論研究表明,變異系數(shù)對于探測不同的噪聲區(qū)域也更有意義。模型用模糊隸屬度函數(shù)測量前景和背景圖像的隸屬度。首先用HLFRA提取圖像的局部和空間信息,然后用變異系數(shù)法對數(shù)據(jù)項進(jìn)行擬合。利用結(jié)合了像素空間信息的局部區(qū)域信息來近似給定圖像中的灰度值。圖像域中的像素是以像素x為中心的方形或圓形鄰域內(nèi)的像素。局部區(qū)域的平均灰度值定義為式(15),具體含義如圖1所示。
圖1 fs和fb示意圖Fig.1 Schematic diagram of fs and fb
式中u(y)為局部圖像區(qū)域Ωx的模糊隸屬度函數(shù)。
式中局部權(quán)重函數(shù)ω(x,y)用來提取圖像的局部信息,定義為
對偽水平集進(jìn)行正則化,并在進(jìn)化過程中保持形狀平滑的外觀,邊緣能量是由正則項和懲罰項組成,與式(12,13)一致。
此模型利用變異系數(shù)作為局部區(qū)域統(tǒng)計量,在很大程度上避免了異常值和噪聲對分割的干擾。區(qū)域能量可以平衡目標(biāo)和背景的重要性,驅(qū)使初始輪廓向目標(biāo)邊界移動。邊緣能量對偽水平集函數(shù)進(jìn)行正則化,保持曲線演化過程中的平滑性。
為了解決式(18)中區(qū)域能量的計算問題,目前流行的基于區(qū)域的ACM能量函數(shù)最小化是利用梯度下降法求解,但收斂速度較慢。受FEAC模型[11]的啟發(fā),直接計算新能量與舊能量的差ΔFCR=F?CR-FCR,以此來進(jìn)行偽水平集的迭代。首先將式(18)中的能量泛函從連續(xù)空間轉(zhuǎn)換到離散空間。然后為了提高計算效率,直接計算新能量和舊能量的差值。如果ΔFCR為負(fù)值,則用新值替換舊值;否則,舊值保持不變。值得注意的是,當(dāng)式(8)中定義的能量泛函為凸時,全局最小能量泛函很容易通過迭代的方式得到。在文獻(xiàn)[1]中已經(jīng)證明了它的凸性。
令P∈I為圖像域Ω中的一個給定的點(diǎn),其強(qiáng)度值和隸屬度分別為I0和u0,舊的全局能量泛函為FCR,對于點(diǎn)P,新的隸屬度函數(shù)為un,用替代更新后的c1、c2、fb、fs的值,且當(dāng)隸屬度函數(shù)變?yōu)閡n時,全局能量泛函用表示。能量泛函的變化形式為
式中ω(x,y)為空間加權(quán)系數(shù)。
從以上計算過程可以看出,本文可以通過計算新舊能量函數(shù)的差值來判斷偽水平集是否需要更新。在計算過程中,F(xiàn)EAC模型[11]中的偽水平集根據(jù)曲線演化過程中逐像素能量函數(shù)的變化進(jìn)行更新。與FEAC模型不同的是,本文直接計算2個能量函數(shù)的變化:更新前的舊能量泛函和更新后的新能量泛函。
在計算邊緣能量的過程中,計算了式(12,13)中能量泛函的導(dǎo)數(shù),得到
本文算法的流程如下:
本文共做6個實(shí)驗來檢驗提出模型的分割性能。本文模型中有8個參數(shù)需要設(shè)置,即:λ1、λ2、α1、α2、β1、β2、最大迭代次數(shù)IterNum以及被大小為(2k+1)×(2k+1)的窗截斷的局部加權(quán)系數(shù)ω(x,y)。在本文實(shí)驗中將偽水平集內(nèi)外的區(qū)域分別設(shè)置為0.7和0.3,默認(rèn)參數(shù)設(shè)置為m=2,局部加權(quán)窗口k=3,最大迭代次數(shù)IterNum=100,β1=β2=1。目標(biāo)越大,λ1越大,若要保留圖像邊緣和細(xì)節(jié)信息,λ2也要越大。α1、α2與λ1、λ2的作用相同,但都不宜取過大,一般不超過5。自然圖像來自Segmentation Evaluation數(shù) 據(jù) 庫[18]和Berkely Segmentation Dataset BSDS500[19]。實(shí) 驗 環(huán) 境 采 用Matlab(R2018b),Intel(R)Core(TM)2 Quad CPU Q9500@2.83 GHz,4 GB內(nèi)存,Windows 7操作系統(tǒng)。
實(shí)驗1驗證了本文模型對多目標(biāo)圖像分割的有效性。實(shí)驗中選取5幅圖像進(jìn)行分割,結(jié)果如圖2所示。圖2中第1列為原始圖像加初始輪廓,第2列為分割結(jié)果,第3列為分割結(jié)果的二值圖像顯示,第4列為對應(yīng)的水平集函數(shù)圖像。從實(shí)驗結(jié)果可以很明顯地看出,本文模型可以對多目標(biāo)圖像進(jìn)行準(zhǔn)確分割。
實(shí)驗2驗證了本文模型對自然圖像分割的有效性,并與FRAGL[20]和HLFRA模型進(jìn)行對比,結(jié)果如圖3所示。圖3中第1列為初始輪廓,第2列為FRAGL模型分割結(jié)果,第3列為HLFRA模型分割結(jié)果,第4列為本文模型分割結(jié)果。圖3結(jié)果表明,雖然在對具有明顯輪廓的圖像進(jìn)行分割時,HLFRA模型和本文模型的分割結(jié)果沒有太大差距,但在對紋理稍微復(fù)雜一點(diǎn)的圖像(如仙人柱)進(jìn)行分割時,本文模型有明顯優(yōu)勢,可以準(zhǔn)確提取其輪廓。除此之外,本文也對比了3個模型的CPU運(yùn)行時間,結(jié)果如表1所示。從表1可以看出,雖然3個模型用時都比較少(用時較短的用黑體已標(biāo)出),但相對于FRAGL和HLFRA模型,本文模型更快、更具有優(yōu)勢。
圖3 不同模型對自然圖像以及合成圖像分割的結(jié)果Fig.3 Segmentation results for natural and synthetic images using different models
實(shí)驗3對初始輪廓的魯棒性進(jìn)行驗證。設(shè)置不同初始輪廓的位置和大小,在合成圖像和灰度不均勻圖像上對其進(jìn)行驗證,結(jié)果如圖4所示,圖(a~f)中左圖為初始輪廓,右圖為分割結(jié)果。圖4結(jié)果表明,無論初始輪廓是否包含了目標(biāo),都可以對其進(jìn)行準(zhǔn)確分割。
圖4 本文模型對初始輪廓的魯棒性Fig.4 Robustness of initial contour by the proposed model
為了更直觀地觀察曲線演化過程,實(shí)驗4對仙人柱的分割過程進(jìn)行呈現(xiàn),每經(jīng)過10次迭代展示一次,結(jié)果如圖5所示。當(dāng)?shù)?0次時,就可精確分割出仙人柱的輪廓。
圖5 對仙人柱進(jìn)行分割時的曲線演化過程Fig.5 Curve evolution process of partitioning Cactus image
實(shí)驗5使用HLFRA模型和本文模型對增加不同噪聲的自然圖像進(jìn)行分割,結(jié)果如圖6所示。為了驗證本文模型的魯棒性,在圖6中加入了均值全為0和方差分別為0.05的高斯噪聲(第1列),0.05的斑點(diǎn)噪聲(第2列),0.02的椒鹽噪聲(第3列),方差為0.02的高斯噪聲+方差為0.02的椒鹽噪聲(第4列),方差為0.02的高斯噪聲+方差為0.02的椒鹽噪聲+方差為0.05斑點(diǎn)噪聲(第5列)。圖6中的分割結(jié)果表明,只有本文模型能準(zhǔn)確地提取出5幅高噪聲圖像中的目標(biāo)。
圖6 噪聲圖像的分割結(jié)果Fig.6 Segmentation results of noisy images
本文采用Dice相似系數(shù)DSC和Jaccard指數(shù)JSC對分割結(jié)果進(jìn)行評價。Dice系數(shù)是一種集合相似性度量指標(biāo),通常用于計算2個樣本的相似度,取值范圍為[0,1],分割結(jié)果越好,值越大。Jaccard指數(shù)是比較樣本集的相似性和多樣性的統(tǒng)計量,值越大說明相似度越高。2個指標(biāo)定義為
式中:S1表示真實(shí)輪廓;S2表示模型分割結(jié)果。在Berkely Segmentation Dataset BSDS500數(shù)據(jù)集選取3張圖像(圖7),并與HLFRA模型的分割結(jié)果進(jìn)行比較,其指標(biāo)對比如表2所示。表2結(jié)果驗證了本文模型的優(yōu)越性。
圖7 用于客觀評價的圖像Fig.7 Images for objective evaluation
表2 客觀評價指標(biāo)的比較Table 2 Comparison of objective evaluation indexes
本文基于變異系數(shù)和模糊集,提出一個針對活動輪廓圖像的分割模型。該模型首先利用變異系數(shù)對結(jié)合了圖像空間信息的局部灰度值進(jìn)行擬合,得到區(qū)域能量泛函,驅(qū)使曲線向目標(biāo)移動。然后結(jié)合邊緣能量,保持演化曲線的光滑性,使其能精確地停在目標(biāo)邊界。最后,通過直接計算新舊能量函數(shù)之間的差異對偽水平集進(jìn)行更新。實(shí)驗結(jié)果表明,本文模型能夠成功地從高噪聲、混合噪聲以及高強(qiáng)度不均勻性的合成圖像和真實(shí)圖像中提取目標(biāo),并且結(jié)果不受初始輪廓(位置和大?。┑挠绊?。