吳成茂, 孫佳美
(西安郵電大學 電子工程學院, 陜西 西安 710121)
圖像分割是將具有相似性特征的像素進行分類或聚類的過程,它是數(shù)據(jù)挖掘、機器視覺和模式識別等領域的重要內(nèi)容,受到國內(nèi)外學者的高度重視。由于人的視覺特性和圖像本身所具有的模糊性,使得圖像分割問題成為典型的結構不良問題,而模糊集理論具有描述這類問題的能力,將其應用于圖像分割已成為一種必然趨勢,特別是模糊聚類分割方法[1-2]越來越受到廣大學者的關注。
傳統(tǒng)模糊c-均值聚類(FCM)[3]算法應用于圖像分割,因僅考慮像素本身的聚類問題,忽視了當前像素與其鄰域像素之間的相關性,導致對灰度分布不均勻的復雜醫(yī)學和遙感影像等難以獲得滿意的分割效果。為了解決FCM僅用隸屬度表達樣本分類信息的不足,Chaira[4]將FCM算法推廣至直覺模糊集并提出直覺模糊c-均值聚類(IFCM)算法,該算法相比FCM算法更有利于醫(yī)學影像分割需要;但是,該算法對猶豫度定義不夠明確,且算法分類仍然依賴于模糊隸屬度,不是嚴格意義上的IFCM算法。近年來,Cuong[5]提出了具有4個屬性參數(shù)的圖形模糊集,相比直覺模糊集能更有效地表達信息的不確定性和未知性,并將直覺模糊集視為其特例。隨后Son[6]將圖形模糊集引入傳統(tǒng)FCM,提出了一種基于圖形模糊集的模糊聚類 (PFCM)算法,它將樣本圖形模糊正隸屬度、中立度和拒分度相結合,來刻畫樣本分類信息的不確定性和未知性,但該算法存在嚴重的聚類不適定性,未得到相關學者的高度重視。近年來,Thong等[7]又提出了一種新的正則化圖形模糊聚類(PFCA)方法,解決了PFCM有關樣本圖形模糊中立度和拒分度存在的不適定性,對醫(yī)學影像和衛(wèi)星云圖等[8-9]分割能獲得滿意的效果。另外,Thong等[10]采用分而治之原理對PFCA的收斂性進行了合理證明,給其應用推廣奠定了堅實的數(shù)學理論基礎。由于圖形模糊聚類是從FCM演化而來的計算智能方法,它與傳統(tǒng)FCM一樣對噪聲或奇異數(shù)據(jù)缺乏魯棒性。為此,基于圖形模糊聚類的改進算法[11-13]也不斷涌現(xiàn)。吳成茂等[11]提出了一種對稱正則化圖形模糊聚類最優(yōu)化模型,將現(xiàn)有的FCM魯棒分割(FCM_s)算法[14]思想引入該模型,并得到了相應的魯棒圖形模糊聚類分割方法,增強了現(xiàn)有的PFCA分割法對噪聲干擾的抑制能力。但是,這種利用平方歐氏距離導出的圖形模糊聚類分割法不僅難以滿足灰度空間分布不均勻的醫(yī)學和遙感等影像分割需要,而且對噪聲的抑制能力非常弱。
為此,本文引入一種具有旋轉(zhuǎn)不變性的全散度,用其替代PFCA中樣本與聚類中心之間的平方歐氏距離,獲得一種全散度圖形模糊聚類算法。為了進一步增強該算法對噪聲的抑制能力,將像素空間鄰域信息嵌入該聚類算法并得到魯棒全散度圖形模糊聚類分割法;利用當前聚類像素點與其鄰域像素均值之間的偏差自動調(diào)節(jié)魯棒全散度圖形模糊聚類正則化參數(shù)。最終獲得基于全散度的自適應魯棒圖形模糊聚類分割算法,以期對噪聲干擾及灰度分布不均勻圖像獲得更加滿意的分割效果。
針對傳統(tǒng)FCM僅用模糊隸屬度表達樣本分類信息的不足,文獻[7]提出了一種中立度和拒分度相結合的正則化圖形模糊聚類最優(yōu)化模型,可描述為
(1)
s.t.
1) 0≤μik+ηik+ξik≤1, 0≤μik,ηik,ξik≤1,
i=1,2,…,n,k=1,2,…,c;
式中:Jm(μ,η,ξ,V)為正則化圖形聚類模型的目標函數(shù),Jm為模糊聚類函數(shù)映射關系表示符號,μ為樣本隸屬度矩陣,η為樣本中立度矩陣,ξ為樣本拒分度矩陣,V為聚類中心矩陣;μik表示樣本xi屬于第k類的圖形正隸屬度;ξik表示樣本xi屬于第k類的圖形模糊拒分度;n為樣本數(shù);c為聚類數(shù);m為模糊指數(shù)且常取值為2;xi為數(shù)據(jù)集X中第i個樣本數(shù)據(jù);vk表示第k類的聚類中心;ηik表示樣本xi屬于第k類的圖形模糊中立度。
針對該聚類最優(yōu)化模型,采用拉格朗日乘子法可獲得樣本聚類的圖形模糊正隸屬度μik、中立度ηik和聚類中心vk的迭代表達式,而圖形模糊拒分度ξik則根據(jù)約束條件1并借助Yager補算子構造所得。
定義1假設可微函數(shù)Φ為嚴格凸函數(shù),x和y是函數(shù)Φ上兩個不同的點,則函數(shù)Φ上x和y之間的Bregman散度DΦ(x,y)[15]為
(2)
定義2假設可微函數(shù)Φ為嚴格凸函數(shù),x和y是函數(shù)Φ上兩個不同的點,則函數(shù)Φ的全Bregman散度δΦ(x,y)[16]為
(3)
文獻[16]指出,Bregman散度DΦ(x,y)會隨著坐標軸的變化而發(fā)生改變,而全Bregman散度δΦ(x,y)則對坐標軸旋轉(zhuǎn)變化具有不變性。因此,全Bregman散度相比Bregman散度具有一定的潛在優(yōu)勢,且已在醫(yī)學影像分析、圖像檢索和目標檢測等[16-18]方面得到了成功應用。
(4)
(5)
為了進一步增強TPFCA分割法的魯棒性,將文獻[14]中空間鄰域信息正則約束的魯棒聚類思想引入TPFCA,并提出具有一種噪聲抑制能力的TPFCA分割最優(yōu)化模型,其對應的目標函數(shù)為
(6)
(7)
其約束條件與模型(1)式完全相同。
利用拉格朗日乘子法構造(7)式的無約束最優(yōu)化目標函數(shù),具體表達式為
(8)
式中:λ為第2個約束條件的懲罰因子矩陣;β為第3個約束條件的懲罰因子矩陣;λi為第i個樣本滿足第2個約束的懲罰因子;βi為第i個樣本滿足第3個約束的懲罰因子。
目標函數(shù)L(μ,η,ξ,V,λ,β)存在極小值的必要條件為
(9)
當(8)式獲得最優(yōu)解時,樣本分類的隸屬度μik使得(9)式中的第1個方程式和第5個方程式同時成立,即
(10)
(11)
聯(lián)立(10)式和(11)式,獲得正隸屬度μik表達式為
(12)
當(8)式獲得最優(yōu)解時,樣本分類的中立度ηik滿足1階必要條件(9)式中的第2個方程式和第5個方程式同時成立,即
(13)
(14)
聯(lián)立(13)式和(14)式,獲得中立度ηik表達式為
(15)
當(8)式獲得最優(yōu)解時,則樣本分類的聚類中心vk滿足1階必要條件(9)式中的第3個方程式成立,即
(16)
由(16)式獲得聚類中心vk表達式為
(17)
另外,考慮到模型(7)式的第1個約束條件,利用Yager補算子獲得猶豫度ξik的表達式為
ξik=1-(μik+ηik)-(1-(μik+ηik)α)1/α.
(18)
由于最優(yōu)化模型(1)式所對應的PFCA是收斂的,從而保證了嵌入像素空間鄰域信息的最優(yōu)化模型(7)式所對應的基于ATPFAC也是收斂的。
本文針對最優(yōu)化模型(7)式所對應的迭代求解表達式(12)式、(15)式、(17)式以及(18)式,設計了ATPFAC圖像分割算法。具體迭代步驟詳細描述如下:
步驟3選取圖像聚類分割區(qū)域數(shù)c,設置算法迭代終止誤差ε=10-4,算法迭代次數(shù)初值t=0,最大迭代次數(shù)tmax=103,Yager補算子參數(shù)α常選取區(qū)間為[0.6,1.0)。
步驟5利用(17)式計算不同類的聚類中心,即
式中:n表示圖像總像素數(shù),即n=MN.
步驟6利用(12)式計算樣本新的圖形模糊正隸屬度,即
步驟7利用(15)式計算樣本新的圖形模糊中立度,即
步驟8利用(18)式計算樣本新的圖形模糊拒分度,即
步驟9更新算法迭代次數(shù)t,即t←t+1.
步驟10重復上述步驟5~步驟9,直至t>tmax或max {‖ρ(t)-ρ(t-1)‖1}≤ε,ρ∈{μ,η,ξ},終止算法迭代過程。
最后,利用本文聚類算法得到的樣本圖形模糊劃分信息,根據(jù)分類最大隸屬度原則對樣本像素進行歸類標記處理,完成圖像分割任務。
針對ATPFAC目標函數(shù)(7)式,將其分解為兩部分組成,即
其中
(19)
(19)式和最優(yōu)化模型(1)式的第2個約束條件相結合,得到ωik的表達式為
(20)
(21)
A=(aik,i1k1)(nc)×(nc),B=(bij)c×c,
式中:
很顯然,矩陣A和B是正定的。
其次,針對(15)式,利用函數(shù)g(x)=(1-x)ex是單調(diào)遞減的,可證明(15)式所對應的ηik是單調(diào)遞減的。再利用函數(shù)h(x)=1-x-(1-xα)1/α的單調(diào)性,可證明:當μik+ηik<(0.5)1/α時,ξik是單調(diào)遞增的。再利用(15)式可證明下列3種情況成立:
綜合上述兩個方面的分析討論,可知本文ATPFCA算法是收斂的。
為了驗證本文算法的有效性和魯棒性,首先采用標準灰度圖像和CT圖像進行算法有效性測試,其次對噪聲干擾的合成圖像和遙感圖像進行算法魯棒性測試,并與FCM、PFCA、TPFCA、FCM_s、模糊局部信息c-均值聚類(FLICM)[19]算法、PFCA_s (PFCA算法與文獻[14]魯棒算法思想相結合)以及文獻[11]算法進行分割性能比較。實驗測試環(huán)境為MATLAB R2014a,不同算法中所含參數(shù)及取值情況如表1所示,各算法迭代終止參數(shù):迭代終止誤差ε取10-4、最大迭代次數(shù)tmax取103.
針對模糊聚類族算法,模糊指數(shù)m取1時,聚類算法屬于硬聚類,聚類效果較差;m取1.5~2.5時,算法聚類效果相對較優(yōu),且對算法性能影響不顯著,m一般取2.
表1 不同算法所含參數(shù)情況
本文迭代終止誤差ε和最大迭代次數(shù)tmax所取數(shù)值均不會對各算法的收斂分割結果產(chǎn)生影響。對于采用平方歐氏距離測度的圖形模糊聚類算法,一般情況下,拒分度參數(shù)α的取值不會影響算法的分割結果,僅對算法收斂迭代次數(shù)和耗時有影響,且無明顯規(guī)律,通常取參數(shù)α在[0.5, 0.8]區(qū)間;對于采用改進全散度距離測度的圖形模糊聚類算法,拒分度參數(shù)α的取值越大,分割結果的誤分率越大,峰值信噪比、迭代收斂次數(shù)以及迭代收斂耗時越小,參數(shù)α宜取[0.6, 1.0)。綜合兩類距離測度聚類算法,參數(shù)α取[0.6, 0.8],本文選取α為0.68. 正則因子ω和鄰域窗口大小的取值均會影響算法分割結果,且對模糊聚類同族算法影響相同。二者取值越大,算法魯棒性越好,同時分割結果細節(jié)越模糊,因此正則因子取3,考慮到FLICM算法分割性能,鄰域窗口大小均選取5×5.
為了客觀評價不同算法的分割性能和噪聲抑制能力,本文采用文獻[20-21]提出的改進峰值信噪比和誤分率對分割結果進行定量評價。其中,改進峰值信噪比是理想分割結果和算法分割結果的差異性度量,是一種與誤分率相反的刻畫圖像分割算法性能新的評價指標,下文統(tǒng)稱為峰值信噪比。峰值信噪比(誤分率)的值越大(小),表示分割結果越接近理想分割結果,算法分割性能越好;反之,算法分割性能越差。
針對Lena圖像、腦CT圖像和華盛頓遙感圖像,采用FCM、FCA、TPFCA、FCM_s、FLICM、PFCA_s、文獻[11]算法,以及ATPFCA對其進行分割測試,結果如表2和表3所示。
從表2中可見,Lena圖采用FCM、PFCA、FCM_s、PFCA_s、FLICM以及文獻[11]算法所得結果均出現(xiàn)了嚴重的誤分現(xiàn)象,而本文TPFCA和ATPFCA算法在一定程度上保留了圖像輪廓以及細節(jié)部分,其中ATPFCA所得分割結果與理想分割結果相差不大。針對腦CT圖,采用FCM、PFCA、FCM_s、PFCA_s、FLICM以及文獻[11]算法所得結果中病變組織的完整性較差且存在一定噪聲,而本文TPFCA和ATPFCA相對其他6種算法所獲得病變部位區(qū)域更加清晰、完整,其中ATPFCA相對TPFCA算法噪聲點數(shù)明顯減少,病變部位也相對更完整,與實際的病變組織區(qū)域基本吻合(見圖1),表明本文方法對復雜醫(yī)學影像分割具有一定的有效性和準確性。針對華盛頓遙感圖像,采用TPFCA算法所得分割結果相比FCM和PFCA算法所得結果誤分點明顯減少,F(xiàn)CM_s、PFCA_s、FLICM以及文獻[11]算法所得分割結果的噪聲點數(shù)相對未加入鄰域信息的3種算法明顯減少,而本文算法ATPFCA所得分割結果相比前4種加入鄰域信息算法背景噪聲點顯著減少,目標河流區(qū)域分割較為準確,輪廓也更清晰。此外,從表3中不同算法分割結果所對應的誤分率和峰值信噪比值可見,TPFCA算法對應的誤分率(峰值信噪比)相比FCM和PFCA算法明顯減小(增大),而嵌入鄰域信息正則化約束的ATPFCA算法誤分率或峰值信噪比值均小于或大于TPFCA、FCM_s、PFCA_s、FLICM和文獻[11]算法。結合表2、圖1和表3分析可得,本文算法ATPFCA更適合于分割灰度分布不均勻圖像,而且具有較強的抑制奇異數(shù)據(jù)對分割性能影響的能力。
表2 原始圖像及其分割結果
Tab.2 Original images and their segmentation results
表3 無噪聲圖像分割結果的誤分率及峰值信噪比
原圖像評價指標FCM算法PFCA算法TPFCA算法FCM_s算法FLICM算法PFCA_s算法文獻[11]算法ATPFCA算法Lena圖誤分率/%信噪比/dB42.729.690 442.709.692 127.1611.653 243.669.536 544.349.486 043.659.536 943.349.622 826.1311.739 8腦CT圖誤分率/%信噪比/dB18.2713.397 517.4113.605 19.1616.382 617.4213.600 117.1713.662 917.3813.602 017.2413.648 17.6217.142 4華盛頓遙感圖誤分率/%信噪比/dB11.429.422 311.519.452 75.6212.504 04.4513.516 93.1215.064 24.3613.619 46.0412.192 22.6315.804 5
圖1 腦CT圖局部區(qū)域及分割結果Fig.1 Local region of brain CT image and its segmentation results
對圖2所示的3幅圖像分別添加均值為0且均方差為44、51和26(歸一化方差分別為0.03、0.04和0.01)的高斯噪聲,采用FCM、PFCA、TPFCA、FCM_s、FLICM、PFCA_s、文獻[11]算法,以及ATPFCA算法對其進行分割測試,結果如表4和表5所示。
圖2 原始圖像Fig.2 Original images
表5 高斯噪聲圖像分割結果的誤分率及峰值信噪比
圖像名稱評價指標FCM算法PFCA算法TPFCA算法FCM_s算法FLICM算法PFCA_s算法文獻[11]算法ATPFCA算法人工合成圖誤分率/%信噪比/dB45.8814.213 846.0914.206 146.6614.067 627.8823.271 730.7120.522 227.5023.342 526.7824.670 125.4027.191 7機場遙感圖誤分率/%信噪比/dB33.974.688 633.544.744 729.255.338 613.998.542 512.828.921 513.878.578 210.869.641 87.5911.196 9工業(yè)遙感圖誤分率/%信噪比/dB34.4913.919 434.0913.966 731.0314.463 021.2316.260 521.3516.233 620.6216.387 519.9916.520 915.6617.569 2
由表4所示的8種算法所得分割結果可見:嵌入鄰域信息正則約束的FCM_s、PFCA_s、FLICM、文獻[11]算法和本文算法ATPFCA所得分割結果圖,相比未嵌入鄰域信息的FCM、PFCA和TPFCA算法噪聲點數(shù)明顯減少,且區(qū)域分割效果也相對較優(yōu);而嵌入鄰域信息的5種算法,其中本文算法ATPFCA相比FCM_s、PFCA_s、FLICM和文獻[11]算法,所得分割結果噪聲點數(shù)均顯著減少,表明其具有更強的抑制噪聲干擾能力。另外,從圖3所示的工業(yè)遙感局部區(qū)域放大圖來看,采用FCM、PFCA和TPFCA算法得到的分割結果中均含有大量的噪聲點且各區(qū)域無明顯分界,采用FCM_s、FLICM、PFCA_s和文獻[11]算法得到的分割結果中噪聲點數(shù)相對前4種算法較少,各區(qū)域邊界也相對較為清晰,而采用ATPFCA算法得到的分割結果中幾乎沒有噪聲點,且其區(qū)域邊界輪廓也更為清晰。此外,從表5所示的誤分率和峰值信噪比值可見,本文算法ATPFCA相比FCM、PFCA、TPFCA、FCM_s、FLICM、PFCA_s和文獻[11]算法,能獲得較小的誤分率和較大的峰值信噪比,進一步表明本文算法ATPFCA的聚類分割性能更好、抑制高斯噪聲干擾的能力更強。
對圖2所示的3幅圖像分別添加概率為30%、10%和20%的椒鹽噪聲,采用FCM、PFCA、TPFCA、FCM_s、FLICM、PFCA_s、文獻[11]算法以及ATPFCA算法進行分割測試,所得測試結果如表6和表7所示。
表6 椒鹽噪聲干擾圖像及分割結果
Tab.6 Salt and pepper noise images and their segmentation results
從表6可見,F(xiàn)CM_s、FLICM、PFCA_s、文獻[11]算法和ATPFCA算法因加入了鄰域信息,使得其分割結果中的噪聲相對FCM、PFCA、TPFCA算法所得結果明顯減少,其中ATPFCA算法相比其他4種加入鄰域信息的算法具有更強的抗噪魯棒性。從圖4中工業(yè)遙感局部區(qū)域放大圖來看,F(xiàn)CM、PFCA和TPFCA算法所得結果含有大量的噪聲,F(xiàn)CM_s、FLICM、PFCA_s和文獻[11]算法所得結果噪聲相對較少,ATPFCA算法所得結果噪聲近乎為0,且獲取的目標輪廓相對其他7種算法也更為清晰。此外,從表7可見,嵌入鄰域信息的FCM_s、PFCA_s、FLICM、文獻[11]算法和ATPFCA算法的峰值信噪比(誤分率)均大于(小于)FCM、PFCA和TPFCA算法,而ATPFCA算法的峰值信噪比(誤分率)相對FCM_s、PFCA_s、文獻[11]算法和FLICM算法更高(低)。上述結果進一步表明,本文算法ATPFCA具有好的分割性能且抗椒鹽噪聲魯棒性更強。
圖4 遙感圖局部區(qū)域及分割結果Fig.4 Local region of SAR image and its segmentation results
本文引入全散度距離度量,與像素鄰域信息相結合,得到改進的全散度,并將像素空間鄰域信息嵌入算法目標函數(shù),提出了一種ATPFCA圖像分割算法。得出主要結論如下:
1)TPFCA算法能夠?qū)Σ煌愋突叶确植疾痪鶆驁D像進行有效分割,其分割結果的誤分率(峰值信噪比)均比傳統(tǒng)FCM、PFCA減少約30%~55%(增加約19%~33%)。全散度的引入在一定程度上提高了算法對不均勻圖像的有效分割程度。
2)ATPFCA算法相比傳統(tǒng)FCM、PFCA、FCM_s、FLICM以及PFCA_s算法具有更強的分割灰度不均勻圖像的能力,其分割結果的誤分率(峰值信噪比)相比上述聚類算法減少約38%~76%(增加約21%~67%),與TPFCA算法相比,對不均勻圖像的有效分割程度得到進一步提升。針對噪聲干擾圖像,ATPFCA算法對應分割結果的誤分率(峰值信噪比)相比FCM、PFCA、TPFCA、FCM_s、FLICM、文獻[11]算法和PFCA_s算法等減少約5%~77%(增加約6%~230%,特別是相對于FCM增加了高達230%)。自適應像素空間鄰域信息的嵌入,不僅提升了算法對灰度不均勻圖像的有效分割程度,而且增強了算法的抗噪魯棒性。
綜上所述,本文算法能夠?qū)叶确植疾痪鶆驁D像得到滿意的分割結果,且具有良好的抑制噪聲干擾能力。