龍建武,陳 都
(重慶理工大學(xué) 計算機科學(xué)與工程學(xué)院, 重慶 400054)
圖像分割作為圖像處理的主要分支,廣泛應(yīng)用于醫(yī)學(xué)圖像、遙感圖像、目標(biāo)檢測和視頻影像處理等領(lǐng)域[1]。目前主要分割算法有閾值[2]、聚類[3]、邊緣檢測[4]、區(qū)域提取[5]等。在聚類方法中模糊聚類,由于其原理簡單、收斂速度快,并且具有比硬聚類算法[6]保留更多的原始圖像信息的優(yōu)點而備受青睞,成為了當(dāng)下運用在圖像分割上最廣泛的聚類算法之一。
Bezdek等[7]基于模糊理論集提出了模糊C-均值(fuzzyC-means,FCM)聚類算法。經(jīng)過實驗驗證,傳統(tǒng)的FCM算法對噪聲非常敏感,Ahmed等[8]引入鄰域項來修改目標(biāo)函數(shù),提出基于空間信息的FCM算法,改善了FCM算法的抗噪能力,但過程中需要反復(fù)迭代計算鄰域信息,導(dǎo)致計算效率低。為了解決這個問題,Chen等[9]提出了FCM_S1和FCM_S2算法,將像素用中心像素的鄰域均值或中值來替換,降低了算法的時間復(fù)雜度??紤]到待處理的數(shù)據(jù)不完全處于線性空間,所以Chen等[9]在FCM_S1與FCM_S2的基礎(chǔ)上通過高斯核函數(shù)把輸入模式空間映射到一個高維特征空間,將聚類轉(zhuǎn)化到高維特征空間中進行,提出基于新核誘導(dǎo)距離測度的空間約束FCM算法,延伸了算法的可擴展性。Szilagyi等[10]提出增強型FCM算法,由原始圖像和每個像素的局部鄰域平均灰度級形成線性加權(quán)和圖像,將其轉(zhuǎn)化為基于灰度直方圖信息的圖像分割,加快了灰度圖像的聚類過程。
在這些算法中都涉及經(jīng)驗參數(shù)的設(shè)定,而其取值往往是復(fù)雜和不確定的。于是Krinidis等[11]基于局部空間信息提出了FLICM算法,避免了人為設(shè)定正則化參數(shù),提高了算法的自適應(yīng)能力。Gong等[12]在FLICM算法上利用高斯核度量來替代歐式距離,同時利用像素的空間信息和局部方差來修改局部模糊因子,提出了基于核函數(shù)的局部FCM算法,對圖像數(shù)據(jù)的優(yōu)化處理和抑制噪聲的能力都有所增強。Zhao等[13]利用局部上下文信息和結(jié)構(gòu)信息提出了一種鄰域加權(quán)FCM算法,在沒有噪聲先驗知識的情況下也能給出更準(zhǔn)確的距離度量。Guo等[14]提出了基于噪聲檢測的FCM算法,通過測量灰度級的局部方差來自動調(diào)整參數(shù),采用2種圖像濾波方法,既能去除噪聲又能保留細節(jié)信息。雖然像素的鄰域信息已經(jīng)被不斷考慮,但忽略了相應(yīng)隸屬度的鄰域信息,有助于提高分類效果,而HMRF[15]考慮了當(dāng)前隸屬度的先前狀態(tài),是解決該問題的常用算法。Chatzis等[16]利用鄰域像素的標(biāo)簽來估算中心像素的先驗概率,提出HMRF-FCM算法。上述算法因引入局部空間信息增加了計算復(fù)雜度,因此Lei等[17]通過形態(tài)學(xué)重建[18]和隸屬度濾波來解決該問題,提出一種快速穩(wěn)健的FCM算法。該算法存在難以計算彩色圖像的直方圖的問題。所以Lei等[19]繼續(xù)利用超像素作為預(yù)處理,提出一種基于超像素的快速FCM算法,以極低的計算成本來分割彩色圖像。Wu等[20]為了克服KWFLICM對高噪聲圖像敏感的缺點,提出基于局部信息的核化Bregman散度的FCM算法,將具有多項式核度量的TBD引入其中,降低了被不均勻噪聲污染的圖像分類錯誤率。像素級和區(qū)域級信息也被廣泛地進行結(jié)合使用,Guo等[21]提出一種像素級和區(qū)域級信息融合的隸屬度規(guī)范化模糊聚類圖像分割算法。構(gòu)建一個新的矩陣來存儲和呈現(xiàn)圖像空間信息作為先驗,并且在算法的迭代中使用固定的聚類中心,結(jié)果顯示出比最先進的聚類方法更好的分割結(jié)果。Zhao等[22]提出一種用于多目標(biāo)的魯棒模糊聚類算法。開發(fā)了像素和區(qū)域級適應(yīng)度函數(shù)來綜合考慮圖像中的空間約束和區(qū)域一致性,在彩色圖像和磁共振圖像上都證實了該算法的性能。
通過分析及實踐發(fā)現(xiàn),雖然上述算法各具優(yōu)勢,但運用模糊聚類進行圖像分割依然存在以下問題:① 噪聲依然是影響分割精度的主要因素;② 大多數(shù)算法的分割效果始終依賴經(jīng)驗參數(shù)的選擇;③ 適用于非線性處理的方法不多。針對以上問題,本文中提出一種基于多尺度核模糊聚類的圖像分割算法。打破傳統(tǒng)單一尺度濾波,對圖像構(gòu)建多尺度空間。將濾波后的圖像從上至下依次進行模糊聚類,平衡了高斯濾波對圖像噪聲的抑制效果。其次,將局部空間信息和權(quán)重信息引入到模糊平衡因子中,避免了空間距離無法反映當(dāng)像素點被噪聲污染后對其中心像素的影響。接著,引入高斯核度量來增大聚類的線性可分概率。最后,對隸屬度進行全局和局部加權(quán),不斷修正隸屬度。
為解決非線性問題并提高算法抗噪能力,文獻[9]提出了一種基于核函數(shù)的FCM算法,用內(nèi)核誘導(dǎo)距離替換FCM中的歐式距離,其目標(biāo)函數(shù)如式(1)所示。
(1)
(2)
式中:σ為函數(shù)的帶寬。對式(1)進行拉格朗日求導(dǎo),隸屬度和聚類中心計算如式(3)所示。
(3)
(4)
為提高算法對重度噪聲污染和異常值的魯棒性,提出一種基于多尺度核模糊聚類的圖像分割算法,算法流程如圖1所示。
圖1 基于多尺度核模糊聚類圖像分割算法流程框圖
在聚類算法中使用歐式距離進行像素度量,對被噪聲污染和對比度低的圖像非常敏感,容易陷入局部極小值,無法得到全局最優(yōu)解[23]。為解決上述問題,受文獻[9]的啟示,用高斯核空間距離替換傳統(tǒng)歐式距離,從而解決非線性問題的同時增強算法的抗噪性能。部分算法分割性能受一些參數(shù)的影響,而參數(shù)的選取通常需要大量的實驗計算。為了克服該問題,本文算法利用局部信息和亮度信息來自動調(diào)整權(quán)衡參數(shù),以提高算法的可擴展性。由于FLICM算法所提出來的空間距離約束1/(1+dij),存在各鄰域點對中心點的影響都是相同的局限性。
(5)
(6)
(7)
圖2 鄰域窗口示意圖
(8)
(9)
帶寬σ設(shè)置為di的方差,則有:
(10)
聚類準(zhǔn)則是求目標(biāo)函數(shù)的最小值,式(11)利用拉格朗日乘子法進行求解,其隸屬度計算如下:
(11)
在模糊聚類算法中隸屬度函數(shù)的計算有著至關(guān)重要的意義。圖像的一個重要特征是相鄰像素之間的緊密聯(lián)系,即相鄰像素屬于同一集群的可能性很大,此空間關(guān)系在模糊聚類算法中不容小覷,若圖像中存在大量異常值時,可能會誤分。為進一步提高分割精度,基于式(12)所計算出的隸屬度,利用鄰域隸屬度對當(dāng)前隸屬度進行二次修正,以便再次調(diào)整聚類中心,其定義如式(13)所示。
(13)
式中:Ωi表示像素點i的鄰域,|Ωi|表示其大小。于是,由改進的隸屬度更新出聚類中心vk的值為:
(14)
由于噪聲污染一直是圖像分割的主要障礙,因此學(xué)者們不僅在約束項上做了改進,在圖像預(yù)處理上也進行了嘗試。高斯濾波作為一種線性平滑濾波,被廣泛用于去除圖像噪聲。部分算法將濾波融入模糊聚類的算法中,在單一尺度上進行,容易造成小尺度上平滑不夠,大尺度上平滑過度的問題。不同尺度的高斯濾波會得到不同模糊度的圖像,其作用是抑制圖像非重要的特征,凸顯圖像的重要特征。為平衡高斯濾波對圖像噪聲的抑制作用,提出一種基于多尺度的魯棒聚類算法,將給定圖像與設(shè)置的高斯濾波器進行循環(huán)卷積操作,得到相應(yīng)尺度下的濾波圖像。
I(k)=I(k-1)*GFσ
(15)
式中:I(k)表示經(jīng)第k尺度高斯濾波后輸出的圖像;I(k-1)表示前一次濾波結(jié)果;GFσ表示高斯濾波器,其函數(shù)定義為:
(16)
基于所提出的多尺度魯棒聚類算法過程為:首先對初始圖像依次進行給定尺度的高斯濾波,對濾波后的圖像從上至下進行改進后的模糊聚類算法,更新隸屬度和聚類中心直到收斂。利用已更新好的隸屬度和聚類中心來指導(dǎo)第二層的圖像聚類,不斷進行迭代直到輸出最終聚類結(jié)果,整個過程如算法1所示。
算法1基于多尺度核模糊聚類的圖像分割算法
輸入:圖像I
輸出:圖像聚類結(jié)果
初始化:設(shè)定尺度計數(shù)k=0,窗口大小w,I(k)←I,給定聚類類別數(shù)c,n是像素個數(shù),隨機初始化隸屬度矩陣U(k)。
1.給定尺度因子σ和尺度數(shù)N,利用式(15)對圖像構(gòu)建高斯尺度空間;
2.對圖像I(k)計算聚類中心V(k);
3.對圖像I(k)根據(jù)式(6)計算加權(quán)模糊因子wij;
4.根據(jù)式(12)更新隸屬度矩陣U(k);
6.根據(jù)式(14)更新聚類中心V(k);
8.k←k-1,如果k≥1,轉(zhuǎn)向執(zhí)行步驟3,否則輸出聚類結(jié)果。
將KFCM[9]、HMRF-FCM[16]、FLICM[11]、NWFCM[13]、KWFLICM[12]、NDFCM[14]、FRFCM[17]和TKWFLICM[20]8種模糊聚類算法與本文算法在相同環(huán)境下進行實驗。整個實驗需要設(shè)置3個參數(shù),分別是模糊指數(shù)m=2,收斂條件ε=0.000 1,最大迭代次數(shù)100。算法的局部窗口大小為3×3,在FRFCM中,用于多元形態(tài)重構(gòu)的SE窗口和隸屬度濾波的窗口大小均為3×3。NDFCM的空間權(quán)重因子為λs=3,灰度權(quán)重因子為λg=5,標(biāo)度因子為λa=3,NWFCM的灰度權(quán)重因子為λg=5。TKWFLICM的多項式核函數(shù)取值為a=1,b=105,d=2。本文算法在人工合成圖像上的尺度個數(shù)為3,BSDS500和MRSC環(huán)境下的尺度個數(shù)為2。
實驗的測試環(huán)境如下:Windows 10,四核3.10 GHz的CPU和8 GB內(nèi)存,Matlab 2018b進行算法編程設(shè)計。為驗證算法的有效性,選取非均勻合成圖像以及BSDS500和MSRC這2個自然圖像數(shù)據(jù)集進行多組實驗。BSDS500數(shù)據(jù)集是伯克利大學(xué)提供用于圖像分割和物體邊緣檢測的數(shù)據(jù)集,包含500張大小為481×321或者321×481的自然圖像。MSRC是微軟公司提供的覆蓋23個類,包含591張大小為320×213或213×320的自然圖像。
采用以下8種評價指標(biāo)客觀評價各算法的性能,分別是劃分系數(shù)Vpc[24]、劃分熵Vpe[25]、分割精度(SA)[26]、概率邊緣指數(shù)(PRI)[27]、重疊比率(CV)[28]、邊界位移誤差(VI)[29]、全局一致性誤差(GCE)[30]、變化信息(BDE)[31]。當(dāng)Vpc越接近1,Vpe越接近0。VI、GCE和BDE的值越小,SA、PRI和CV的值越大,則圖像分割效果越理想。
為驗證本文算法在圖像被重度噪聲污染的情況下的分割效果,首先對比了2幅大小分別為256×256和244×244的人工合成圖像。圖3—圖6分別展示了合成圖像1和2在不同強度的椒鹽噪聲和均值為0的高斯白噪聲下的分割結(jié)果。通過分割結(jié)果可以看出,各算法在低噪聲環(huán)境下都能表現(xiàn)出良好的分割效果,但隨著噪聲強度的增加,各算法表現(xiàn)出了明顯差異。KFCM、HMRF-FCM、FLICM和NWFCM算法對兩類噪聲都非常敏感。KWFLICM、NDFCM和FRFCM對兩類噪聲表現(xiàn)出一定的抗噪能力,但是對于高強度的高斯白噪聲在圖像復(fù)雜的情況下較為敏感。TKWFLICM的分割結(jié)果僅次于本文算法,具有良好的抗噪能力??梢杂^測出本文算法在低噪聲和高噪聲下都保留更多的圖像細節(jié),有明顯的分割優(yōu)勢。
圖3 合成圖像1在椒鹽噪聲下各算法的分割結(jié)果
圖4 合成圖像1在高斯白噪聲下各算法的分割結(jié)果
圖5 合成圖像2在椒鹽噪聲下各算法的分割結(jié)果
圖6 合成圖像2在高斯白噪聲下各算法的分割結(jié)果
利用評價指標(biāo)繪制出數(shù)據(jù)結(jié)果,圖7—圖10分別是合成圖像1和2在4種椒鹽噪聲和高斯白噪聲下的Vpc和Vpe曲線??梢钥闯?在高斯白噪聲下各算法的Vpc和Vpe曲線下降趨勢更明顯。KFCM、HMRF-FCM、FLICM以及NWFCM對噪聲都很敏感,KWFLICM、NDFCM和FRFCM的走向趨勢相近。TKWFLICM變化趨勢與本文相似,本文算法在噪聲強度不斷增加的情況下保持穩(wěn)定分割。
圖7 合成圖像1椒鹽噪聲下的Vpc和Vpe曲線
圖8 合成圖像1高斯白噪聲下的Vpc和Vpe曲線
圖9 合成圖像2椒鹽噪聲下的Vpc和Vpe曲線
圖10 合成圖像2高斯白噪聲下的Vpc和Vpe曲線
表1和表2分別展示了各算法在2幅合成圖像上的分割精度。KFCM對重度噪聲依然敏感,HMRF-FCM、FLICM和NWFCM僅使用鄰域窗口將局部空間信息合并到目標(biāo)函數(shù)中,對被低密度噪聲破壞的圖像有效,但對于高密度噪聲損壞的圖像分割結(jié)果并不理想。NDFCM對于已知的噪聲分割有一定的抗噪能力,KWFLICM利用更多的局部空間信息來改善分割結(jié)果,獲得了較高的分割精度。TKWFLICM利用多項式核函數(shù)對TBD進行核化,分割精度高于前7種算法。可以看出,在對比的模糊聚類圖像分割算法中,本文的算法可以獲得最滿意的結(jié)果。
表1 合成圖像1上的分割精度(SA)
表2 合成圖像2上的分割精度(SA)
在MSRC和BSDS500這2個自然圖像數(shù)據(jù)集上進行實驗,如圖11所示,可以看出各算法在前景和背景有明顯差異的圖像上都是有效的。對于背景復(fù)雜的圖像如第4行所示,各算法都出現(xiàn)了大量小區(qū)域。盡管NDFCM和FRFCM使用改進的圖像濾波方法獲得了比KFCM、HMRF-FCM、FLICM、NWFCM以及KWFLICM更好的分割結(jié)果,但依然存在被誤分割的情況。TKWFLICM在自然圖像上對于背景復(fù)雜的圖像有良好的分割能力,可以看出本文算法在4幅自然圖像上的分割準(zhǔn)確度最高,因此本文算法在復(fù)雜背景情況下依舊能夠?qū)D像進行較為準(zhǔn)確的分割。
本文在使用BSDS500和MSRC這2個自然圖像數(shù)據(jù)集上與各算法進行對比分析。在實驗中,對于BSDS500中的圖像,聚類數(shù)c為2~6,而對于MSRC中的圖像,聚類數(shù)c為2~4。表3和表4分別展示的是本文算法與其余模糊聚類算法在2個數(shù)據(jù)集上的平均性能。
可以看出,在自然圖像數(shù)據(jù)集上,KFCM、FLICM、NWFCM以及KWFLICM的PRI、CV、VI和GCE值相似。NDFCM與HMRF-FCM的平均性能相似。由于FRFCM算法考慮形態(tài)學(xué)重建和隸屬度濾波,于是在PRI和BDE這兩方面優(yōu)于前面的算法。TKWFLICM算法開辟了新的度量方式,比KWFLICM算法的精確更高。本文算法在2個數(shù)據(jù)集上PRI、CV、VI和GCE的值都優(yōu)于其他對比算法,對于背景條件復(fù)雜的圖像分割存在很大的分割優(yōu)勢。
表3 BSDS500數(shù)據(jù)集上的平均性能
表4 MSRC數(shù)據(jù)集上的平均性能
為驗證本文算法中濾波尺度數(shù)的大小對分割結(jié)果的影響,在BSDS500和MRSC這2個自然圖像數(shù)據(jù)集上進行不同尺度的聚類實驗。平均性能如表5和表6所示,從各項指標(biāo)的統(tǒng)計結(jié)果可以看出,2個數(shù)據(jù)集對于尺度數(shù)從2到4,其結(jié)果變化并不是很敏感。尺度數(shù)越大,下降趨勢越大,尺度過小達不到平滑效果,過大會非常耗時并且過度平滑,不利于分割。
表5 BSDS500圖像上不同尺度(N)的分割平均性能
表6 MRSC圖像上不同尺度(N)的分割平均性能
執(zhí)行時間是衡量算法性能的一個重要指標(biāo),因此對不同算法的計算復(fù)雜度進行分析。如表7所示,各算法的復(fù)雜度主要由兩部分組成,一部分來自于每個像素的局部空間信息的計算,另一部分來自于算法的迭代。n為像素總數(shù),c為聚類數(shù),t為迭代次數(shù),w為局部窗口的大小,q為圖像的灰度級數(shù),N為尺度個數(shù)。
表7 9種算法的計算復(fù)雜度
可以看出,KFCM不適用任何鄰域窗口,計算復(fù)雜度最低。NDFCM的相鄰信息是提前計算的,計算復(fù)雜度相對較低。FLICM、NWFCM、KWFLICM和TKWFLICM在每次迭代中需要重復(fù)計算相鄰信息,導(dǎo)致計算復(fù)雜度較高。HMRF模型使用的先驗概率需要在每次迭代中計算,所以HMRF-FCM計算復(fù)雜度較高。NDFCM和FRFCM在圖像分割過程中都只計算一次局部空間信息,因此計算復(fù)雜度較低。本文算法的時間復(fù)雜度主要由高斯濾波O(n×w)和模糊聚類算法O(n×c×t×w2)迭代組成,再乘以尺度數(shù),在現(xiàn)有算法中計算復(fù)雜度處于中等,能夠滿足一定的實時性要求。
為了直觀地展示本文算法的運行效率,對分別受椒鹽噪聲和高斯白噪聲污染的合成圖像1與2在BSDS500和MSRC這2個自然圖像數(shù)據(jù)集進行測試,不同算法的平均運行時間如圖12所示,可以看出本文算法對自然圖像的分割時間略高于合成圖像,但是遠低于KWFLICM和TKWFLICM算法。因此,本文算法在分割精度和抗噪聲魯棒性方面均優(yōu)于其他比較算法,該算法具有潛在的應(yīng)用價值。
圖12 各算法的平均運行時間
為解決被重度噪聲污染的圖像分割問題,采取多尺度方式構(gòu)建模糊空間。利用上層圖像對噪聲不敏感和下層圖像保留更多圖像細節(jié)信息的特性,反向進行模糊聚類,為下層提供了一個有效的初始值。通過重構(gòu)模糊因子,有效地抑制了噪聲像素的干擾,同時避免了參數(shù)設(shè)置。結(jié)合鄰域信息對隸屬度進行二次修正。通過與其他算法的實驗對比,本文算法能夠有效抑制高強度噪聲的干擾,有一定的實際應(yīng)用價值。算法的最優(yōu)尺度個數(shù)為2~4時,分割結(jié)果變化并不明顯,所以可以容易確定其最優(yōu)尺度。不足之處在于聚類的個數(shù)是人為給定的,需要進一步優(yōu)化,使其自動確認。算法的執(zhí)行效率有待提升,后續(xù)將運用超像素結(jié)合等預(yù)處理工具來提升算法的運行效率。