牛藝蓉,王士同
(江南大學(xué)數(shù)字媒體學(xué)院,江蘇 無(wú)錫 214122)
基于Student-t分布的混合模型圖像分割方法
牛藝蓉,王士同
(江南大學(xué)數(shù)字媒體學(xué)院,江蘇 無(wú)錫 214122)
傳統(tǒng)圖像分割方法在分割被重尾噪聲污染的圖像時(shí)的分割效果不理想。針對(duì)該問(wèn)題,提出一種基于Student-t分布的圖像分割方法。該方法根據(jù)像素間的空間關(guān)系,計(jì)算出其先驗(yàn)概率,使用梯度下降法優(yōu)化參數(shù),從而最小化誤差函數(shù),在參數(shù)優(yōu)化后得到像素點(diǎn)的后驗(yàn)概率值,對(duì)像素進(jìn)行標(biāo)記以實(shí)現(xiàn)圖像分割。實(shí)驗(yàn)結(jié)果表明,在處理被重尾噪聲腐蝕的圖像時(shí),與傳統(tǒng)的K-均值、模糊C-均值等圖像分割方法相比,該方法的誤分率較低,分割效果較好。
Student-t分布;重尾噪聲;圖像分割;空間鄰域關(guān)系;高斯混合模型
DO I:10.3969/j.issn.1000-3428.2015.10.038
圖像分割作為計(jì)算機(jī)視覺(jué)和圖像處理中的一個(gè)基本并且重要的研究技術(shù),是圖像分析前經(jīng)常使用的一個(gè)重要步驟,為圖像理解、識(shí)別等高層圖像操作打下堅(jiān)實(shí)基礎(chǔ)。圖像分割根據(jù)圖像的某些特性把圖像中有意義的事物從背景中分割出來(lái)。正確的分割結(jié)果能夠?yàn)樾畔⑴袛嗵峁┯辛Φ囊罁?jù)。然而圖像很容易受到噪聲的影響,這就給圖像分割帶來(lái)一定的難度。
近年來(lái),聚類方法已經(jīng)成為圖像分割研究中的一個(gè)熱點(diǎn)。有限混合模型(Finite Mixture Model,F(xiàn)MM)[1-3]作為一種聚類模型,它提供了一種靈活的方式對(duì)各種隨機(jī)現(xiàn)象進(jìn)行建模。當(dāng)它的成員函數(shù)是高斯分布時(shí),該模型稱為高斯混合模型(Gaussian Mixture Model,GMM)[4-5]。當(dāng)用于圖像分割時(shí),有限混合模型的一個(gè)缺點(diǎn)是該模型認(rèn)為像素之間的關(guān)系是獨(dú)立的,并沒(méi)有考慮像素的空間關(guān)系。為克服有限混合模型的缺點(diǎn),文獻(xiàn)[6-7]隨后提出了一些基于馬爾科夫隨機(jī)場(chǎng)的模型,雖然考慮了像素的空間鄰域關(guān)系,但是標(biāo)簽概率比例(像素屬于某些類的概率)不能在期望最大化(Expectation Maximization,EM)方法的M步驟中得到封閉解。
基于空間鄰域關(guān)系的高斯混合模型(Gaussian
Mixture Model Based on Spatial Relationships,GMMS)[8]不僅考慮了像素間的關(guān)系,而且采用梯度下降法進(jìn)行參數(shù)優(yōu)化,減小了方法的復(fù)雜度。但是該方法只對(duì)高斯噪聲有明顯效果,然而,在工程應(yīng)用中,噪聲模型往往表現(xiàn)出非高斯性,即概率密度函數(shù)分布往往表現(xiàn)出較厚的尾部統(tǒng)計(jì)特性[9],此時(shí)的噪聲已不是高斯噪聲,而是重尾噪聲。而Student-t分布具有尖峰后尾的統(tǒng)計(jì)特性[10],因此,本文將采用基于Student-t分布的混合模型驗(yàn)證其對(duì)含重尾噪聲圖像的處理效果。
2.1 有限混合模型
由于單個(gè)概率分布只有一個(gè)峰值,然而許多實(shí)際現(xiàn)象的分布都是由多個(gè)峰值組成。因此單個(gè)概率分布不能對(duì)現(xiàn)實(shí)中具有多個(gè)峰值的現(xiàn)象進(jìn)行有效地模擬。有限混合模型供了一種用簡(jiǎn)單密度模擬復(fù)雜密度的有效方法。FMM是同一類型但不同參數(shù)的分布函數(shù)的線性疊加[11]。FMM的定義公式如下:
θ)可以是任意的概率分布函數(shù)。若 P(χθ)是高斯分布,則該FMM被稱為高斯混合模型。注意πk需要滿足0≤πk≤1和
2.2 基于空間鄰域關(guān)系的高斯混合模型
基于空間鄰域關(guān)系的高斯混合模型是在標(biāo)準(zhǔn)高斯混合模型的基礎(chǔ)上考慮像素的空間鄰域關(guān)系。
設(shè)χi表示圖像的第i個(gè)像素點(diǎn),i=1,2,…,N,圖像分為K類,Ωj表示第j(j=1,2,…,K)類。第i個(gè)像素點(diǎn)χi的密度函數(shù)為:
在GMMS中,πij考慮像素的空間鄰域關(guān)系,每個(gè)像素點(diǎn)即使在同一類中也有不同的先驗(yàn)概率,其中,πij需要滿足0≤πij≤1和每個(gè)高斯分布都是混合模型的一個(gè)部件,高斯分布為:其中,μj和σj分別為高斯分布的均值和協(xié)方差。根據(jù)式(2)得到對(duì)數(shù)似然函數(shù):
第i個(gè)像素點(diǎn)的后驗(yàn)概率為:
由于對(duì)數(shù)似然函數(shù)是非負(fù)遞增函數(shù),根據(jù)經(jīng)驗(yàn)求解負(fù)對(duì)數(shù)似然函數(shù)較為方便:
最大化對(duì)數(shù)似然函數(shù)相當(dāng)于最小化式(7),也就相當(dāng)于最小化下式:
其中,ε是誤差函數(shù),因此,最大化似然函數(shù) L相當(dāng)于最小化 ε。將優(yōu)化結(jié)果帶入式(5),再利用式(6)進(jìn)行像素標(biāo)記。
2.3 Student-t分布
在概率論和統(tǒng)計(jì)學(xué)中,Student-t分布經(jīng)常應(yīng)用在對(duì)呈正態(tài)分布的總體的均值進(jìn)行估計(jì)。它是對(duì)2個(gè)樣本均值差異進(jìn)行顯著性測(cè)試的學(xué)生t測(cè)定的基礎(chǔ)。t檢定改進(jìn)了Z檢定,不論樣本數(shù)量大或小皆可應(yīng)用。在樣本數(shù)量大(超過(guò)120等)時(shí),可以應(yīng)用Z檢定,但Z檢定用在小的樣本會(huì)產(chǎn)生很大的誤差,因此,樣本很小的情況下得改用學(xué)生t檢定。在數(shù)據(jù)有3組以上時(shí),因?yàn)檎`差無(wú)法壓低,此時(shí)可以用變異數(shù)分析代替學(xué)生t檢定。
一元Student-t分布定義如下[12]:
其中,μ和λ分別表示Student-t分布的均值和精度,λ的值等于方差的逆;Γ(·)表示伽馬函數(shù);ν為Student-t分布的自由度,用于調(diào)整Student-t分布的尾部長(zhǎng)度,它對(duì)Student-t分布的影響如圖1所示。
圖1 不同ν的Student-t分布
當(dāng)ν=1時(shí),Student-t分布就成了柯西分布,當(dāng)ν>1時(shí),μ就成為Student-t分布的均值,當(dāng)ν趨于無(wú)窮大時(shí),Student-t分布就以相同的均值μ和精度λ趨近于高斯分布。
2.4 重尾噪聲模型
高斯噪聲、椒鹽噪聲、乘性噪聲、重尾噪聲[13]等是常見(jiàn)的噪聲模型,而本文研究含重尾噪聲的圖像分割,重尾噪聲分布模型主要有Erlang噪聲、Lap lace噪聲、Cauchy噪聲、負(fù)指數(shù)噪聲以及混合高斯噪聲等。其概率密度函數(shù)如下:
(1)Erlang分布:
其中,a>0,b是正整數(shù),均值為b/a,協(xié)方差為b/a2。
(2)Laplace分布:
其中,均值為 μ;協(xié)方差為2σ2。
(3)Cauchy分布:
其中,χ0是位置參數(shù);γ>0是尺度參數(shù);均值不存在。
(4)負(fù)指數(shù)分布:
其中,均值為 μ;方差為 μ2。
(5)混合高斯噪聲由高斯噪聲獲得,即:
其中:2
α為閃光頻率,一般情況下,α很小,μ1=μ2且
以一個(gè)基于標(biāo)準(zhǔn)高斯混合的新模型用于圖像分割,其優(yōu)點(diǎn)在于其先驗(yàn)概率 πij考慮像素的領(lǐng)域關(guān)系,和基于馬氏隨機(jī)域的模型相比,該方法需要更少的參數(shù)而且更容易實(shí)現(xiàn)。
3.1 基于空間鄰域關(guān)系的先驗(yàn)概率
首先,給定一幅由U×V個(gè)像素點(diǎn)構(gòu)成的灰度圖。用 χ(u,ν)表示圖像的第 i個(gè)像素點(diǎn) χi,其中,i= U(u-1)+ν;u=1,2,…,U;ν=1,2,…,V。充分考慮像素間的關(guān)系,如圖2所示。
圖2 相鄰像素點(diǎn)3×3像素窗口
第i個(gè)窗口χ(u,ν)鄰域點(diǎn)的像素集定義為:
其中,cj和bj(j=1,2,…,k)是優(yōu)化后的參數(shù),優(yōu)化方法將在后續(xù)內(nèi)容中詳細(xì)介紹。
該方法將像素的空間鄰域關(guān)系和其先驗(yàn)概率πij結(jié)合起來(lái)。因此:
先驗(yàn)概率之所以考慮空間約束是因?yàn)閳D像中相鄰像素在某種意義上是相似的?;谶@種關(guān)系,在圖像中用像素領(lǐng)域的均值替換每個(gè)像素值。注意πij需要滿足0≤πij≤1和它在圖像分割中起到了過(guò)濾器的作用,可以將被噪聲污染的圖像變得平滑。將式(13)得到的先驗(yàn)分布結(jié)合式(4)得到對(duì)數(shù)似然函數(shù):
其誤差函數(shù)為:
前文主要討論像素χi屬于Ωj的概率估計(jì)問(wèn)題。為了計(jì)算后驗(yàn)概率需調(diào)整參數(shù) Θ=(μj,λj,cj,bj),j=1,2,…,K,最小化誤差函數(shù)。采用梯度下降法優(yōu)化參數(shù)從而最小化誤差函數(shù)。
3.2 參數(shù)優(yōu)化方法
(1)用K-均值(K-means)初始化參數(shù)μj和σj,且得到Θold。
(2)根據(jù)式(5)得到其后驗(yàn)概率:
(3)更新參數(shù)Θ=(μj,λj,cj,bj),得到新的參數(shù)Θnew,通過(guò)梯度下降法[14]計(jì)算參數(shù):
其中,▽?duì)?(?ε/?μj,?ε/?λj,?ε/?cj,?ε/?bj);η是參數(shù)率,取η=10-7。下面給出ε對(duì)μj的偏導(dǎo)數(shù)為:
同理,ε對(duì)λj的偏導(dǎo)數(shù)為:
同理,ε對(duì)cj的偏導(dǎo)數(shù)為:
其中:
同理,ε對(duì)bj的偏導(dǎo)數(shù)為:
其中:
(4)如果負(fù)對(duì)數(shù)似然函數(shù)的值變化較大,或參數(shù)Θ變化較大,則令Θold=Θnew,同時(shí)返回步驟(2)。
其中,MMCR取值范圍為[0,1],其值越小圖像分割結(jié)果越好。當(dāng)MMCR的值為0時(shí),表示錯(cuò)誤分類的像素?cái)?shù)目為0,即分割完全正確。當(dāng)MMCR的值為1時(shí),表示錯(cuò)誤分類的像素?cái)?shù)目與整個(gè)圖像的像素?cái)?shù)目相等,即分割完全錯(cuò)誤。
4.2 圖像合成實(shí)驗(yàn)對(duì)比
第1組實(shí)驗(yàn)使用的是由128×128像素構(gòu)成的合成圖像,它有4種灰度值[0.25,0.5,0.75,1],圖片分為4類。圖3(a)為原始圖像,圖3(b)為被混合高斯噪聲腐蝕的圖像,其中,參數(shù)值alPhal=0.1,均值μ1= μ2=0.1,方差σ1=0.002,σ2=0.2,圖3(c)~圖3(e)分別為K-means,模糊C-均值(Fuzzy C-means,F(xiàn)CM)和GMMS的分割結(jié)果,其誤分率分別達(dá)到9.95%,10.28%,22.81%,本文方法的分割結(jié)果如圖3(f)所示,其誤分率降到3.31%,低于其他方法。從表1可以看出,K-means,F(xiàn)CM,GMMS 3種方法在處理被重尾噪聲腐蝕的圖像時(shí)誤分率很高,而本文方法的誤分率相對(duì)較低。由于重尾噪聲下圖像有嚴(yán)重的拖尾情況,K-means,F(xiàn)CM,GMMS不能有效處理重尾噪聲下圖像的拖尾情況。然而,Student-t分布可以有效處理圖像拖尾情況。因此,本文方法取得較好的分割效果。
4.1 評(píng)價(jià)指標(biāo)
目前對(duì)圖像分割的評(píng)價(jià)還沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn),圖像分割結(jié)果的評(píng)價(jià)帶有很大的主觀性。為了客觀、量化的評(píng)價(jià)圖像分割結(jié)果,本文采用誤分率(Misclassification Ratio,MCR)[15]進(jìn)行分割結(jié)果評(píng)價(jià)。
MCR主要用于合成圖像分割結(jié)果的量化評(píng)價(jià)。定義如下:
圖3 第1組實(shí)驗(yàn)圖像分割結(jié)果
表1 第1組實(shí)驗(yàn)圖像的混合高斯噪聲誤分率對(duì)比 %
第2組實(shí)驗(yàn)是對(duì)添加Laplace噪聲的圖像進(jìn)行處理,使用的圖像由128×128像素構(gòu)成,圖像分為3類,其灰度值為[0,0.5,1]。圖4(a)為原始圖像,圖4(b)為被Laplace腐蝕的圖像,其中,均值μ=0.001,方差σ=0.06。圖4(c)~圖4(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到0.81%,0.69%,0.37%,本文方法的分割結(jié)果如圖4(f)所示,其誤分率降到0.12%,低于其他方法。因?yàn)镾tudent-t分布相對(duì)而言處理重尾噪聲效果較好。第2組實(shí)驗(yàn)圖像分割結(jié)果MCR對(duì)比如表2所示。
圖4 第2組實(shí)驗(yàn)圖像分割結(jié)果
表2 第2組實(shí)驗(yàn)圖像的Lap lace噪聲誤分率對(duì)比 %
第3組實(shí)驗(yàn)比較的是各方法對(duì)添加高斯混合噪聲圖像的處理效果,圖像同樣是人工合成的,由128×128像素構(gòu)成,它有2種灰度值[0.47,0.07],圖片分為2類。圖5(a)為原始圖像,圖5(b)為被混合高斯噪聲腐蝕的圖像,其中,參數(shù)值alPhal=0.25,均值 μ1=μ2=0.1,方差 σ1=0.002,σ2=0.2。圖5(c)~圖5(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到50.27%,49.96%,4.66%,本文方法的分割結(jié)果如圖5(f)所示,其誤分率降到1.08%,低于其他方法。
圖5 第3組實(shí)驗(yàn)圖像分割結(jié)果
4.3 真實(shí)圖像實(shí)驗(yàn)對(duì)比第4組實(shí)驗(yàn)使用的是由128×128像素構(gòu)成的真實(shí)圖像,圖像分為4類,分別是白質(zhì)、灰度、腦髓液和背景。圖6(a)是真實(shí)分割結(jié)果,圖6(b)為被混合高斯噪聲腐蝕的圖像,其中,alPhal=0.1,均值μ1= μ2=0.1,方差 σ1=0.002,σ2=0.2。圖 6(c)~圖6(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到37.46%,59.16%,11.33%,本文方法的分割結(jié)果如圖6(f)所示,其誤分率降到9.78%,低于其他方法。
圖6 第4組實(shí)驗(yàn)圖像分割結(jié)果
第5組實(shí)驗(yàn)比較的是各方法對(duì)真實(shí)圖像的處理效果,由 192×128像素構(gòu)成,圖像分為 2類。
圖7(a)是真實(shí)分割結(jié)果,圖7(b)為被混合高斯噪聲腐蝕的圖像,其中,alPhal=0.1,均值 μ1=μ2= 0.1,方差σ1=0.002,σ2=0.2。圖7(c)~圖7(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到37.20%,36.09%,21.74%,本文方法的分割結(jié)果如圖7(f)所示,其誤分率降到18.62%,同樣優(yōu)于其他方法。
圖7 第5組實(shí)驗(yàn)圖像分割結(jié)果
第6組實(shí)驗(yàn)是對(duì)添加Laplace噪聲的圖像進(jìn)行處理,使用的真實(shí)圖像由100×100像素構(gòu)成,圖像分為4類,圖8(a)為原始圖像,圖8(b)為被Lap lace腐蝕的圖像,其中,均值 μ=0.001,方差 σ=0.06。圖8(c)~圖8(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到20.58%,21.89%,32.66%,本文方法的分割結(jié)果如圖8(f)所示,其誤分率降到10.42%,低于其他方法。因?yàn)镾tudent-t分布相對(duì)而言處理重尾噪聲效果較好。
圖8 第6組實(shí)驗(yàn)圖像分割結(jié)果
實(shí)驗(yàn)結(jié)果表明,本文方法在處理被重尾噪聲腐蝕的合成圖像和真實(shí)圖像時(shí),其誤分率較低,分割效果較好。這是由于重尾噪聲尾部較長(zhǎng),而Student-t分布擁有相對(duì)于高斯分布較長(zhǎng)的尾部,因此它成為高斯分布的健壯替代。這進(jìn)一步的說(shuō)明了該方法的有效性和可行性。
本文提出一種基于Student-t分布的混合模型用于圖像分割,不僅考慮像素的空間鄰域關(guān)系,而且使用梯度下降法進(jìn)行參數(shù)估計(jì)。通過(guò)實(shí)驗(yàn)結(jié)論驗(yàn)證了基于Student-t分布的混合模型圖像分割方法的優(yōu)越性。然而,本文的參數(shù) k是用戶根據(jù)先驗(yàn)知識(shí)自己設(shè)定的,主觀性影響較大,今后將針對(duì)該問(wèn)題進(jìn)行研究,進(jìn)一步完善該方法。
[1] Mclachan G,Peel D.Finite Mixture Model[M]. New York,USA:John Wiley&Sons,2000.
[2] Bishop C M.Pattern Recognition and Machine Learning[M].Berlin,Germany:Springer,2006.
[3] Titterington D M,Smith A F,Makov U E.Statistical Analysis of Finite Mixture Distributions[M].New York,USA:John Wiley&Sons,1985.
[4] Jain A K,Duin R PW.Statistical Pattern Recognition:A Review[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(1):4-37.
[5] Redner R A,Walker H F.Mixture Densities,Maximum Likelihood and the EM Algorithm[J].SIAM Review,1984,26(2):195-239.
[6] Choi H S,Haynor D R,Kim Y.Partial Volume Tissue Classification of Multichannel Magnetic Resonance Images——A Mixel Model[J].IEEE Transactions on Medical Imaging,1991,10(3):395-407.
[7] Santago P,Gage H D.Quantification of MR Brain Im ages by Mixture Density and Partial Volume Modeling[J].IEEE Transactions on Medical Imaging,1993,12(3):566-574.
[8] Thanh M N,Jonathan Q M.Gaussian-mixture-model-based Spatial Neighborhood Relationships for Pixel Labeling Problem[J].IEEE Transactions on System s M an and Cybernetics Part B:Cybernetics,2012,42(1):193-202.
[9] Mukherjee A,Sengupta A.Estimating the Probability Density Function of a Nonstationary Non-Gaussian Noise[J].IEEE Transactions on Industrial Electronics,2010,57(4):1429-1435.
[10] Wang Zhimin,Song Qing.Robust Curve Clustering Based on a Multivariate t-distribution Model[J].IEEE Transactions on Neural Networks,2010,21(12):1976-1984.
[11] 熊太松,章 毅.基于統(tǒng)計(jì)混合模型的圖像分割方法研究[D].成都:電子科技大學(xué),2013.
[12] Bishop C M.Pattern Recognition and Machine Learning[M].Berlin,Germ any:Springer,2006.
[13] 王 橋.數(shù)字圖像處理[M].北京:科學(xué)出版社,2009.
[14] Lange K,F(xiàn)essler J A.Globally Convergent Algorithms for Maximum a Posteriori Transmission Tomography[J].IEEE Transactions on Image Processing,1995,4(10):1430-1438.
[15] Zhang Y,Brady M,Smith S.Segmentation of Brain MR Images Through a Hidden Markov Random Field Model and the Expectation-maximization Algorithm[J].IEEE Transactions on Medical Imaging,2001,20(1):45-57.
編輯 劉 冰
Mixture Model Image Segmentation Method Based on Student-t Distribution
NIU Yirong,WANG Shitong
(School of Digital Media,Jiangnan University,Wuxi214122,China)
Traditional image segmentation methods can not effectively adapt to the case of image smearing with heavytailed noise.And the result of segmentation is not satisfactory in dealing with the image contaminated by heavy-tailed noise.This paper presents an image segmentation method based on Student-t distribution.The method calculates the prior probability according to the spatial relationship between the pixels,uses gradient descent method to optimize parameters so as to minimize the error function.The posterior probability values of pixels are obtained based on the optimal parameters. Image segmentation is realized by marking the pixels.Experimental results show that the misclassification ratio is lower and the performance is better when using the proposed method to deal with the image contaminated by heavy-tailed noise,compared with the traditional K-means and Fuzzy C-means(FCM),etc.
Student-t distribution;heavy-tailed noise;image segmentation;spatial neighborhood relationship;Gaussian Mixture Model(GMM)
牛藝蓉,王士同.基于Student-t分布的混合模型圖像分割方法[J].計(jì)算機(jī)工程,2015,41(10):204-209.
英文引用格式:Niu Yirong,Wang Shitong.Mixture Model Image Segmentation Method Based on Student-t Distribution[J].Computer Engineering,2015,41(10):204-209.
1000-3428(2015)10-0204-06
A
TP391
牛藝蓉(1989-),女,碩士研究生,主研方向:人工智能,模式識(shí)別,數(shù)字圖像處理;王士同,教授。
2014-10-28
2014-12-02E-mail:yirong1027@126.com