羅雷,王士同
江南大學 數(shù)字媒體學院,江蘇 無錫 214122
基于鄰域場拉普拉斯混合模型圖像分割的研究
羅雷,王士同
江南大學 數(shù)字媒體學院,江蘇 無錫 214122
在影像識別和圖像處理中圖像分割技術已經(jīng)得到廣泛應用,好的分割結果能夠為信息判斷提供有力的依據(jù)。然而圖像很容易受到噪聲的影響,這就給圖像分割帶來一定的難度。為了解決這個問題,一些方法相繼得到應用,如模糊聚類[1-2]、直方圖[3]、人工神經(jīng)網(wǎng)絡[4]以及有限混合模型[5]。其中有限混合模型由于其復雜度僅與待求解的問題有關,與樣本大小無關,并且兼具有參估計和無參估計的特點得到了廣泛應用[6-7],另外它還是一種半?yún)?shù)估計方法,并不局限于某一特定方法。高斯混合模型是一種常見的有限混合模型,它憑借其形式簡單、計算方便等特點,已成為應用比較普遍的有限混合模型。相比較標準高斯混合模型(GMM)中像素點有共同的先驗概率πj,新型高斯混合模型(GMM)[8]先驗概率πij取決于像素點鄰域的相互作用,每個像素點有自己獨立先驗概率πij。然而實際中得到的數(shù)據(jù)大多具有非線性、非高斯特性,而高斯分布擬合能力有限,導致其不能完全、準確、有效地描述這些復雜數(shù)據(jù)。研究發(fā)現(xiàn),在工程應用中,噪聲模型概率密度分布往往具有比較厚的尾部統(tǒng)計特性[9]。如合成孔徑雷達圖像中,海雜波的尖峰幅度分布情況,都呈現(xiàn)出很多幅度較大的噪聲,此時的噪聲就是重尾噪聲,而不再是高斯噪聲。對于重尾噪聲的研究和應用并不局限于上述領域中,也有必要將其引入到圖像分割研究中。相較于高斯分布,拉普拉斯分布是一種重尾分布[10],它具有尖峰后尾的統(tǒng)計特性,因而拉普拉斯模型比高斯模型更強大,并且在圖像分割方面更有效。然而其現(xiàn)有的模型中,先驗概率πj并不取決于獨立的像素點,它對于所有的像素點都是同一個值,沒有考慮到像素的空間鄰域性。另外,現(xiàn)有的拉普拉斯模型在估計參數(shù)時,一般都效仿傳統(tǒng)的高斯模型采用EM算法[11],而這種方法增加了算法的復雜性。
基于上述考慮,本文提出了一種新的拉普拉斯混合模型。該方法將新型高斯混合模型考慮到的像素點空間鄰域關系引入到標準拉普拉斯混合模型。本文方法與上述方法不同之處主要體現(xiàn)在幾個方面:第一,相較于高斯分布本文采用的拉普拉斯分布具有尖峰后尾的統(tǒng)計特性,在處理噪聲尤其是重尾噪聲時更加平滑;第二,相比較標準拉普拉斯模型,本模型的不同之處在于每個像素點的先驗概率是不同的,它取決于這個像素點及它的相鄰像素點;第三,由于考慮了相鄰像素點間的聯(lián)系,本模型提取這些信息后處理噪聲效果更好。另外,在估計參數(shù)時,本方法并沒有采用EM算法,而是使用梯度下降法求解負似然對數(shù)最小值。實驗研究了本文方法與目前存在的拉普拉斯混合模型與高斯混合模型在圖像分割方面的應用,探討了基于鄰域場拉普拉斯混合模型在處理圖像分割方面的優(yōu)勢。
有限混合模型在圖像分割中的應用已經(jīng)相當廣泛,許多方法都取得了不錯的效果,尤其是高斯混合模型。圖像分割中習慣性加入的噪聲往往是高斯噪聲,這樣促進了高斯混合模型的發(fā)展。然而現(xiàn)實中,遇到的往往是非高斯、非線性噪聲。下面將介紹常見的重尾噪聲、具有重尾特性的拉普拉斯混合模型以及處理高斯噪聲效果較好的新型高斯混合模型。
2.1 重尾噪聲
在研究含重尾噪聲的圖像分割前,首先了解常見的重尾噪聲[12-13]?,F(xiàn)實中常見的噪聲主要有高斯噪聲、椒鹽噪聲、乘性噪聲、重尾噪聲等,其中重尾噪聲主要有混合高斯噪聲、拉普拉斯噪聲、柯西噪聲、Erland噪聲、負指數(shù)噪聲等。它們的概率密度函數(shù)詳細表述如下:
(1)混合高斯分布
其中,f1(x)是x~N(μ1,σ1)的概率密度函數(shù),f2(x)是x~N(μ2,σ2)的概率密度函數(shù),則稱f(x)為混合高斯分布。一般μ1=μ2,σ1≤σ2,0≤alpha≤1。
(2)拉普拉斯(Laplace)分布
其中,均值為μ,協(xié)方差為2σ2。
(3)柯西(Cauchy)分布
其中,x0是位置參數(shù),γ>0是尺度參數(shù),均值不存在。
(4)Erlang分布
上述密度函數(shù)相較高斯分布來說更加復雜,導致高斯分布在擬合它們的時候不甚理想。下面介紹標準拉普拉斯混合模型以及新型高斯混合模型在圖像分割方面的應用。
2.2 標準拉普拉斯混合模型(LMM)
設xi,i=1,2,…,N,表示一幅圖像的第i個像素點,xi滿足獨立分布特性,另設圖像分可為K個標簽,Ωj表示第j個標簽,j=1,2,…,K。為了將圖像的N個像素點劃分為K個標簽,拉譜拉斯混合模型[14]假定每個像素點xi分別服從每個拉普拉斯分布,且獨立于各個標簽Ωj。像素點xi在第j個標簽出現(xiàn)的概率密度函數(shù)表示為:
每個拉普拉斯分布p(xi|Ωj)為混合模型的一個部件,概率密度函數(shù)為:
其中,拉普拉斯分布均值為μj,協(xié)方差為2b2j。根據(jù)式(1)可以得到似然對數(shù)估計[15]:
為了得到式(3)中的最大似然函數(shù),定義參數(shù)集θ=(μj,bj,πj),j=1,2,…,K,許多方法都可以通過調(diào)整這些參數(shù)達到目的。根據(jù)優(yōu)化參數(shù)后的拉普拉斯模型,以及式(4)對像素點進行標簽標記。
其中,后驗概率p(Ωj|xi)由貝葉斯(Bayes’)公式得到:
2.3 新型高斯混合模型(GMM)
新型高斯混合模型在標準高斯模型(GMM)的基礎上考慮了像素點的空間鄰距離。
觀測值xi的密度函數(shù)設為:
同理將πij代入式(3)中,可以得到新的似然對數(shù)函數(shù):
考慮到對數(shù)函數(shù)是非負遞增函數(shù),根據(jù)經(jīng)驗求解負似然對數(shù)函數(shù)相對較為方便。
求解負似然對數(shù)的最小值,相當于求解下面函數(shù)式的最小值[8,16]:
式中的ε可以看做是一個誤差函數(shù),因此求解式(8)中L的最大值相當于求解ε的最小值。求解ε的最小值也就相當于對參數(shù)集進行優(yōu)化,在下面的內(nèi)容中將會介紹。將優(yōu)化后的參數(shù)代入到式(7)得到后驗概率,再利用式(4)得到最終的標記結果。
上文提到現(xiàn)實中的噪聲往往是非高斯非線性的,高斯分布由于其本身擬合能力有限在處理這方面問題時效果往往不理想,尤其是在處理重尾噪聲過程中。如圖1所示,拉普拉斯分布與高斯分布在選取相同參數(shù)情況下,前者較后者呈現(xiàn)尖峰重尾特性,因而擬合能力更好。標準拉普拉斯混合模型中,雖然拉普拉斯分布具有重尾特性但是模型并沒有考慮到像素點的空間關系,這樣的模型處理重尾噪聲時效果也不理想。
圖1 拉普拉斯分布與高斯分布密度函數(shù)
基于上述考慮,設想如果能將高斯混合模型中考慮到的像素空間關系引進到重尾分布模型中,那么這種新方法在處理重尾噪聲圖像分割時效果將會提高。
根據(jù)上面的分析給出了一種新型拉普拉斯混合模型,該模型比GMM有更好的擬合能力,與標準拉普拉斯模型最大的不同在于后驗概率πij具有獨特性,它不僅依據(jù)每個像素點的個性還充分考慮了像素點的空間關系。
3.1 基于空間關系的先驗概率πij
設一幅灰度圖像由U×V個像素點構成,為了敘述方便,設x(u,v)表示圖像的第i個像素點,這里i=U() u-1+v,u=1,2,…,U且v=1,2,…,V。如前文所述,本文方法的最大不同在于考慮了像素點的獨立性,以及空間領域性,主要體現(xiàn)在:像素點的空間聯(lián)系采用3×3窗口形式如圖2所示,這樣像素點之間的相似性以及相互的影響就得到了充分的考慮。
圖2 相鄰像素點3×3窗口
定義1第i個窗口領域點的像素集表示為:
其中cj和dj,j=1,2,…,K,是優(yōu)化后的參數(shù),在后面將會介紹優(yōu)化方法。將式(12)代入式(11),可以得到考慮鄰距離之后第i個窗口隸屬于Ωj的平均隸屬度:
下面將這種考慮到空間關系的方法應用到先驗概率πij,這樣就可以得到圖像中每個像素點隸屬于Ωj的先驗概率:
3.2 參數(shù)優(yōu)化
上文主要討論了像素點xi屬于Ωj的概率估計問題。而要得到泛化后的結果就需要對參數(shù)集θ=(μj,bj,cj,dj),j=1,2,…,K進行優(yōu)化,也就是最小化式(10)中的ε,這部分將討論這個問題。相對一般的優(yōu)化算法采用EM算法,本文采用梯度下降法。
誤差函數(shù)式(10)可以改寫為:
具體算法描述:
(1)使用K-mean方法初始化μj、bj,令cj=μj,dj=bj,完成θold的初始化。
其中,pold(xi|Ωj)和根據(jù)式(2)與式(14)得到。
(3)運用梯度下降法[16]更新參數(shù)集θ=(μj,bj,cj,dj),新的參數(shù)集θnew為:
(4)檢查E(θ)和參數(shù)是否收斂,如果都沒有,令θold=θnew,返回第(2)步。
(5)將優(yōu)化后的結果代入式(4),得到最終標記結果。
實驗給出了本文算法與K-mean、FCM(Fuzzy C-Means)、標準LMM和GMM等算法圖像分割效果的比較。實驗都是基于Window平臺Matlab軟件完成的,實驗結果均是各算法收斂后得到的數(shù)值??疾鞂嶒灲Y果的優(yōu)良,采用的是錯誤率MCR,它等于分割錯誤的像素點比上總的像素點。限于篇幅限制,本文主要比較加入混合高斯噪聲和拉普拉斯噪聲的圖像分割效果。
4.1 人工合成圖像
在第一組實驗中加入的噪聲是混合高斯噪聲,實驗使用的是一張合成圖像,由128×128個像素點構成,共有四種灰度值[0.25,0.50,0.75,1.00]。圖3(a)為原始圖像,圖3(b)為加混合高斯噪聲圖像,參數(shù)值為alpha=0.02,均值μ1=μ2,協(xié)方差σ1=0.05,σ2=0.07;圖3(c)和(d)分別為K-mean和FCM分割結果,從圖中很容易看出,分割結果非常糟糕,其錯誤率分別達到7.61%和8.51%(如表1);圖3(e)和(f)是標準LMM和GMM算法分割的結果;本文算法的分割結果如圖3(g),其分割效果相對于前面的算法要好得多,錯誤率已經(jīng)降低到了1.63%。
圖3 圖像加混合高斯噪聲分割結果
表1 圖像加混合高斯噪聲分割結果比較(MCR)(%)
第二組實驗比較的是各算法對于加入拉普拉斯噪聲后圖像的分割效果。圖像同樣是人工合成,共128×128個像素點構成,灰度等級則達到了五類,分別是0.2,0.4,0.6,0.8,1.0。圖4(a)是原圖像,圖4(b)為加入拉普拉斯噪聲后的圖像,其中參數(shù)為a=0,σ=0.04。表2是拉普拉斯噪聲下,a=0,σ不同值時,幾種算法的MCR。容易看出,本文算法準確性要比其他算法好,另外本文算法與GMM比較,由于拉普拉斯對尖峰拖尾的情況有更好的適應性,故本文算法比GMM有更好的魯棒性。
圖4 圖像加拉普拉斯噪聲分割結果
表2 圖像加拉普拉斯噪聲分割結果比較(MCR)(%)
4.2 模擬人腦圖像
第三組實驗使用的圖像來自Brainweb網(wǎng)站,每組圖像由128像素×128像素構成,T1加權,層厚1 mm。圖5(a)是真實分割效果圖,設分割為四類,分別是白質(zhì)、灰質(zhì)、腦髓液和背景。圖5(b)加入的是混合高斯噪聲,其中均值均為0,σ1=0.01,σ2=0.02,alpha=0.02,可以看到加入噪聲后圖像已經(jīng)相當模糊。通過圖像間的對比,可以直觀地看到本文方法相較其他方法效果更好;另外根據(jù)表3(均值均為0,σ1=0,01,alpha=0.02,σ2變化)提供的數(shù)據(jù),進一步證明了直觀的判斷。
圖5 圖像加混合高斯噪聲分割結果
表3 圖像加混合高斯噪聲分割結果比較(MCR)(%)
第四組實驗使用的原始圖像與第三組是一致的(如圖6),為了證明本文方法不僅僅適用于混合高斯噪聲,在同樣的圖像中加入了拉普拉斯噪聲。圖6(b)加入的拉普拉斯噪聲均值為0,σ=0.06。圖6和表4證實了本文方法在處理拉普拉斯噪聲時,比K-mean、FCM和LMM算法要好得多。同樣,相比高斯分布,拉普拉斯分布的重尾特性在有限混合模型處理拉普拉斯噪聲時,體現(xiàn)出了優(yōu)勢。
圖6 圖像加拉普拉斯噪聲分割結果
表4 圖像加拉普拉斯噪聲分割結果比較(MCR)(%)
本文提出了一種新的模型用于灰度圖像分割,它在標準拉普拉斯混合模型基礎上融合了相鄰像素點的空間關系。前文提到過,每個像素點的先驗分布πij都是不同的,它取決于像素點和它的周圍像素點以及相關的參數(shù),這也正是本文方法和標準拉普拉斯模型的不同之處。與GMM算法相比,由于拉普拉斯分布具有尖峰后尾的統(tǒng)計特性,在處理重尾噪聲時,基于鄰域場的拉普拉斯混合模型無論是魯棒性還是精確度都相對要好。
[1]Kim S,Kang M.Multiple-region seg-mentation without supervision by adaptive global maximum clustering[J].IEEE Transactions on Image Processing,2012,21(4):1600-1612.
[2]張揚,王士同,韓斌.基于改進模糊聚類算法魯棒的圖像分割[J].中國圖象圖形學報,2008,13(5):911-917.
[3]Goncalves H,Goncalves J A,Corte Real L.HAIRS:a method forautomaticimageregistrationthroughhisto-gram-based image segmentation[J].Transactions on Image Processing,2011,20(3):776-789.
[4]Bors A,Pitas G I.Optical flow estimation and moving object segmentation based on median radial basis function network[J]. IEEE Transactions on Image Processing,1998,7(5):693-702.
[5]Mclachlan G J,Peel D.Finite mixture models[M].New York:Wiley,2000.
[6]Ji Z,Xia Y,Sun Q,et al.Fuzzy local Gaussian mixture model for brain MR image segmentation[J].IEEE Transactions on Information Technology in Biomedicine,2012,16(3):339-347.
[7]Singh R,Pal B C,Jabr R A.Statistical representation of distributionsystemloadsusinggaussionmixturemodel[J]. IEEE Trans on Power Systems,2010,25(1):29-37.
[8]Nguyen T M,Wu Q M.Gaussian-mixture-model-based spatial neighborhoodrelation-shipsforpixellabelingproblem[J]. IEEE Transactions on Systems Man and Cybernetics:Part B Cybernetics,2012,42(1):193-202.
[9]Mukherjee A,Sengupta A.Estimating the probability density function of a non-stationary non-Gaussian noise[J].IEEE Transactions on Industrial Electronics,2010,57(4):1429-1435.
[10]Wang X,Zhang X.A new Laplacian mixture conditional random field for image labeling[C]//Proceedings of the IEEE International conference on Acoustics Speech and Signal Processing(ICASSP),2010:2118-2121.
[11]Tian G,Xia Y,Zhang Y,et al.Hybrid genetic and variational expectation-maximization algorithm for Gaussian-mixture-modelbased brain MR image segmentation[J].IEEE Transactions on Information Technology in Biomedicine,2011,15(3):373-380.
[12]王橋.數(shù)字圖像處理[M].北京:科學出版社,2009:21-30.
[13]張如艷,王士同.基于重尾噪聲分布特性的多分類人臉識別方法[J].電子與信息學報,2012,34(12):523-528.
[14]Amin T,Guan L.Application of laplacian mixture model to image and video retrieval[J].IEEE Transactions on Multimedia,2007,9(7):1416-1429.
[15]Bishop C M.Pattern recognition and machine learning[M].New York:Springer-Verlag,2006.
[16]Lange K,F(xiàn)essler J A.Globally convergent algorithms for maximum a posteriori transmission tomography[J].IEEE Transactions on Image Processing,1995,4(10):1430-1438.
LUO Lei,WANG Shitong
School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China
Finite mixture model under Laplacian distribution is proposed in order to solve the problem that image segmentation based on Gaussian Mixture Model(GMM)failing to settle tailing situation with heavy-tailed noise,besides,unlike the standard Laplacian Mixture model(LMM)where pixels themselves are considered independent of each other,the proposed method incorporates the spatial neighborhood relationship of pixels into the standard LMM.In order to estimate model parameters from observations and instead of utilizing an expectation-maximization algorithm,the gradient method is adopted.The experimental results demonstrate the robustness,accuracy,and effectiveness of the method in comparison with the standard LMM and GMM.
Laplacian Mixture Model(LMM);image segmentation;heavy-tailed noise;spatial neighborhood relationship
針對高斯混合模型(GMM)不能有效處理重尾噪聲下圖像拖尾情況,提出了基于拉普拉斯(Laplacian)分布的有限混合模型圖像分割方法。與標準拉普拉斯混合模型(LMM)將像素點作為孤立個體不同的是,該方法充分考慮了相鄰像素點間的空間關系。相較傳統(tǒng)混合模型參數(shù)估計采用的EM算法,該方法采用梯度下降法優(yōu)化參數(shù)。實驗結果表明在處理重尾噪聲時,該方法與標準LMM算法和GMM算法相比,魯棒性更好,分割更精確有效。
拉普拉斯混合模型(LMM);圖像分割;重尾噪聲;空間鄰域關系
A
TP391.41
10.3778/j.issn.1002-8331.1301-0256
LUO Lei,WANG Shitong.Laplacian mixture model with neighborhood field for image segmentation.Computer Engineering and Applications,2013,49(13):133-137.
國家自然科學基金(No.61272210)。
羅雷(1989—),男,碩士,研究領域為人工智能與模式識別;王士同(1964—),男,教授,博士生導師,研究領域為人工智能,模式識別,生物信息學等。E-mail:jnsqyp@126.com
2013-01-23
2013-03-14
1002-8331(2013)13-0133-05