陳 凱 陳秀宏
(江南大學(xué)數(shù)字媒體學(xué)院,無錫,214122)
圖像分割是圖像處理中的關(guān)鍵所在,被廣泛應(yīng)用在人臉識(shí)別、醫(yī)學(xué)影像及指紋識(shí)別等各種圖像處理應(yīng)用中。當(dāng)前,圖像分割方法有多種,比如區(qū)域增長(zhǎng)法等。其中基于聚類方法被廣為認(rèn)同,硬C均值聚類算法和模糊C均值聚類算法(Fuzzy C-means algorithm,F(xiàn)CM)[1]是最常用的兩種聚類算法。與硬C均值算法(Hard C-means algorithm,HCM)算法相比,F(xiàn)CM算法為每個(gè)像素的歸屬引入了模糊概念,保留了更多的紋理細(xì)節(jié)信息。
由于傳統(tǒng)的FCM算法存在不足,只關(guān)注到圖像像素灰度相似性,忽視了圖像其他影響信息,從而導(dǎo)致FCM的分割結(jié)果不理想。為此,國內(nèi)外學(xué)者研究了許多基于局部空間信息的改進(jìn)FCM算法。Ahmed等[2]在FCM的目標(biāo)函數(shù)中加入鄰域項(xiàng),提出了基于空間約束的模糊C均值算法(FCM algorithm based on space constraint,F(xiàn)CM-S),增強(qiáng)了抗噪聲能力,但也增加了算法的時(shí)間復(fù)雜度。針對(duì)該問題,Chen和Zhang[3]用鄰域像素的均值或中值來代替對(duì)應(yīng)的像素點(diǎn)提出了FCM_S1和FCM_S2模型。該模型減少了算法計(jì)算時(shí)間,但模糊了圖像的許多細(xì)節(jié)。于是,Cai等[4]提出了同時(shí)考慮鄰域位置和像素關(guān)系的快速FCM聚類算法(Fast generated fuzzy C-means algorithm,F(xiàn)GFCM)。該算法雖在一定程度上抑制了噪聲,卻引入了太多人工參數(shù),且分割精度不高。
對(duì)于參數(shù)比較多同時(shí)要人工進(jìn)行設(shè)定的問題,文獻(xiàn)[5]在經(jīng)過研究之后,闡述了局部空間信息模糊C均值算法(Fuzzy local information C-means algorithm,F(xiàn)LICM),該算法引入了模糊影響因子,考慮鄰域像素的空間信息和灰度信息,且參數(shù)不用人為設(shè)定,大大增強(qiáng)了算法適用范圍。其全部參數(shù)能夠自適應(yīng)確定,在魯棒性方面表現(xiàn)非常出色,能夠讓圖像細(xì)節(jié)得到有效的保存?;诖?,Gong等[6]在FLICM算法的基礎(chǔ)上引入了像素點(diǎn)的鄰域像素變異系數(shù)c_k,提出了修正的局部空間模糊C均值算法(Modi?fied fuzzy local information C-means algorithm,MFLICM)。若噪聲高度污染圖像時(shí),在一個(gè)像素的鄰域像素中可能會(huì)包含很多異常特征,容易出現(xiàn)分割錯(cuò)誤。此外,局部空間信息的模糊C均值算法(Weight?ed fuzzy local information c-means,WFLICM)算法用歐氏距離作相似性度量,容易造成低維空間線性不可分現(xiàn)象。
為解決此問題,本文用非局部信息將鄰域像素唯一標(biāo)識(shí)化,并用核距離代替原來算法中的歐氏距離,提出了改進(jìn)的新核局部空間信息的模糊C均值聚類圖像分割算法(New kernel weighted fuzzy local information C-means,NKWFLICM)算法。為了解決數(shù)據(jù)在低維空間線性不可分現(xiàn)象并提高算法效率,本文基于ELM特征映射技術(shù),先將原始數(shù)據(jù)通過ELM特征映射技術(shù)映射到高維ELM隱空間中,再利用NKWFLICM算法進(jìn)行聚類,提出了基于ELM的局部空間信息的模糊C均值聚類圖像分割算法(New kernel weighted fuzzy local information C-means based on ELM,ELM-NKWFLICM)算法。
為了克服傳統(tǒng)模糊C均值聚類算法在圖像分割時(shí)僅利用像素點(diǎn)灰度值信息的問題,WFLICM算法繼承了FCM算法的優(yōu)勢(shì),同時(shí)還融入了鄰域空間信息,綜合像素點(diǎn)鄰域框內(nèi)像素點(diǎn)對(duì)中心點(diǎn)的影響,構(gòu)造目標(biāo)函數(shù)
式中:xi為在WFLICM算法中表示第i個(gè)像素點(diǎn)的灰度值,vj為在WFLICM算法中第j類的類中心灰度值,Gij為加入的模糊影響因子。相關(guān)定義具體為
式中:Ni表示像素點(diǎn)xi所在的鄰域窗口;dik表示鄰域窗口中的點(diǎn)xk與中心像素點(diǎn)xi的坐標(biāo)位置距離;wik表示鄰域內(nèi)像素點(diǎn)影響因子權(quán)重,定義為
式中:ck為鄰域像素點(diǎn)的變異系數(shù)。以中心像素點(diǎn)xk為中心,則
式中:var(x)代表鄰域中全部像素點(diǎn)灰度值的方差;x為鄰域內(nèi)像素點(diǎn)灰度值的均值。
于是,由利用拉格朗日乘子法得到的隸屬度更新公式為
WFLICM算法充分考慮了局部空間信息和局部灰度值關(guān)系對(duì)像素點(diǎn)的影響,在很大程度上降低了對(duì)噪聲的敏感度。但當(dāng)圖像噪聲污染嚴(yán)重時(shí),一個(gè)像素點(diǎn)的鄰域像素會(huì)存在異常特征,造成局部信息對(duì)中心像素點(diǎn)聚類的影響,因此發(fā)生錯(cuò)誤。
如圖1,以x像素點(diǎn)為中心的3×3鄰域框內(nèi),a和b相對(duì)鄰域中心點(diǎn)的位置相同,而以a和b點(diǎn)為中心的鄰域像素點(diǎn)灰度值分布情況也相同,因此,在WFLICM算法中變異系數(shù)ca=cb。此時(shí)算法認(rèn)為a點(diǎn)和b點(diǎn)會(huì)同等影響像素點(diǎn)x,這是錯(cuò)誤的。若圖像被更多噪聲污染時(shí),會(huì)有更多的異常情況出現(xiàn),從而導(dǎo)致分割錯(cuò)誤。基于此,本文引入非局部空間信息系數(shù)sik對(duì)每個(gè)鄰域像素點(diǎn)的影響因子進(jìn)行正確的標(biāo)識(shí)。
圖1 以x為中心的3×3鄰域噪聲情況Fig.1 Pixel x of 3×3 window with noise
式中:λ1和λ2分別為wik和sik的相對(duì)權(quán)重。實(shí)驗(yàn)經(jīng)驗(yàn)表明,當(dāng)λ1wik和λ2sik的值在相同數(shù)量級(jí)上時(shí),該算法的性能表現(xiàn)最佳。
本文用高斯核距離[9-11]代替WFLICM算法中傳統(tǒng)的歐式距離。本文提出改進(jìn)的新核局部空間信息的模糊C均值聚類圖像分割算法(Fuzzy C-means clustering image segmentation algorithm of the im?proved new kernel local spatial information,NKWFLICM)算法,NKWFLICM的目標(biāo)函數(shù)為
式中:‖Φ ( xi)-Φ(vj)‖2在本文算法中表示在高維特征空間中定義的距離,Φ(?)則表示從低維到高維空間的一種映射,具體定義表示為[12]
本文的核函數(shù)使用的是高斯核函數(shù)[13]
σ為函數(shù)的寬度參數(shù),根據(jù)數(shù)據(jù)集波動(dòng)程度決定,定義為[12]
于是,由拉格朗日乘子法得到隸屬度更新公式為
極限學(xué)習(xí)機(jī)從本質(zhì)上來講是一種單隱層神經(jīng)網(wǎng)絡(luò),能夠隨機(jī)產(chǎn)生輸入層到隱含層權(quán)值,基于廣義逆法精準(zhǔn)地獲得隱含層到輸出層的權(quán)值,讓實(shí)際與期望的輸出偏差最低。極限學(xué)習(xí)機(jī)權(quán)值沒有通過迭代訓(xùn)練取得,而通過計(jì)算獲得,在訓(xùn)練速度、精度方面表現(xiàn)極為出色,其最初為解決單隱層前饋神經(jīng)網(wǎng)絡(luò)而提出。對(duì)于一個(gè)單隱層神經(jīng)網(wǎng)絡(luò),假設(shè)有N個(gè)任意樣本(Xi,ti),其中Xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tim]T∈Rm。一個(gè)有L個(gè)隱層節(jié)點(diǎn)的單隱層神經(jīng)網(wǎng)絡(luò)可以表示為
式中:g(x)表示激活函數(shù),Wi=[wi,1,wi,2,…,wi,n]T表示輸入權(quán)重,βi為輸出權(quán)重,bi是第i個(gè)隱層單元的偏置。其目標(biāo)是使得輸出的誤差最小,可以近似表示為
即存在βi,Wi和bi,使得
可用矩陣表示為
式中:H為隱層節(jié)點(diǎn)的輸出;β為輸出權(quán)重;T為期望輸出。
基于ELM的局部空間信息的模糊C均值聚類圖像分割算法(Fuzzy C-Means clustering image seg?mentation algorithm with local spatial information based on ELM,ELM-NKWFLICM)首先基于ELM特征映射技術(shù),將原始數(shù)據(jù)通過ELM特征映射技術(shù)映射到高維ELM隱空間中,隱藏層將數(shù)據(jù)從輸入空間Rd映射到執(zhí)行數(shù)據(jù)聚類的高維特征空間RL(L≤d),再利用NKWFLICM算法進(jìn)行聚類,可以使得NKWFLICM算法能夠在新的空間探索固有的數(shù)據(jù)結(jié)構(gòu)并提高算法分割精度和效率。
ELM-NKWFLICM算法:
(1)給定一個(gè)數(shù)據(jù)集D,激勵(lì)函數(shù)g(x)和隱含層節(jié)點(diǎn)數(shù)L。
(2)隨機(jī)生成輸入權(quán)重Wi和偏置bi,i=1,…,L。
(3)計(jì)算隱含層輸出矩陣H。
(4)在隱含層輸出矩陣H上用NKWFLICM算法進(jìn)行聚類。
為了對(duì)ELM-NKWFLICM算法圖像分割性能進(jìn)行測(cè)試,本文進(jìn)行了對(duì)比實(shí)驗(yàn),涵蓋了人工合成、醫(yī)學(xué)以及自然3種類型圖像。相關(guān)運(yùn)行環(huán)境是Matlab 2014b。以下實(shí)驗(yàn)中設(shè)定模糊指數(shù)m=2,迭代閾值ε=0.001,最大迭代次數(shù)T=500,Ni為3×3鄰域窗口,λ1=1,λ2=30。本次實(shí)驗(yàn)把快速模糊C均值算法(Fast and generalized FCM,FGFCM)[14]、WFLICM和核空間模糊局部信息C?均值聚類算法(Kernel weighted fuzzy local information C-means,KWFLICM)當(dāng)作實(shí)驗(yàn)對(duì)比算法。
實(shí)驗(yàn)圍繞人工合成圖像進(jìn)行,總數(shù)為3張,添加的高斯以及椒鹽噪聲強(qiáng)度有差異。對(duì)比分析圖像分割算法的抗噪聲能力,常采用分割準(zhǔn)確(Segmentation accuracy,SA)指標(biāo)來衡量其好壞。SA是指正確分類的像素點(diǎn)占總分割像素點(diǎn)的百分比,代表圖像分割精度為
式中:c為分割類數(shù);Ai為算法分割到第i類的像素點(diǎn);Ci為圖像中屬于第i類的像素點(diǎn)集。
第1張合成圖像分4類共256像素×256個(gè)像素點(diǎn),灰度值分別為0,100,145,199。圖2是4種算法在圖像中添加均值為0方差為0.02高斯噪聲后的分割結(jié)果。從分割結(jié)果可以看出,F(xiàn)GFCM算法的分割圖去噪效果最差;WFLICM算法,KWFLICM算法和ELM-NKWFLICM算法去噪效果最好,不過,在細(xì)節(jié)保留上和噪聲去除上本文算法要明顯優(yōu)于改進(jìn)前的算法和傳統(tǒng)算法。
圖2 第1張人工合成圖像分割實(shí)驗(yàn)Fig.2 Segmentation result of the first Synthetic image
4種算法在第1張合成圖像上的分割精度如表1所示。從表1可以看到,隨著高斯噪聲強(qiáng)度越來越大,對(duì)比算法會(huì)有著越來越低的SA值,而本文算法SA值卻有著很小的變化,表現(xiàn)出更好的魯棒性。在實(shí)際運(yùn)用中有一定的實(shí)際意義。
第2張合成圖像分4類共244像素×244個(gè)像素點(diǎn),灰度值分別為0,85,170,255,分割結(jié)果如圖3所示。從分割結(jié)果可以看出,F(xiàn)GFCM算法和WFLICM算法的分割圖去噪效果最差;KWFLICM算法和ELM-NKWFLICM算法在去噪聲和保持邊緣細(xì)節(jié)上表現(xiàn)最好,幾乎不受噪聲影響,分割圖幾乎和原圖一致。4種算法在第2張合成圖像上的分割精度如表2所示。由表2可以看到,高斯噪聲有著越來越大的強(qiáng)度,此時(shí)其他算法的SA值出現(xiàn)明顯下降,本文算法變化最小,表現(xiàn)出更好的魯棒性。在實(shí)際運(yùn)用中有一定的實(shí)際意義。
第3張合成圖像分為4類共256像素×256個(gè)像素點(diǎn),灰度值分別為32,150,201,255。圖4給出了4種算法在第3張圖像受均值為0,方差為0.03的高斯噪聲污染后的分割結(jié)果。FGFCM算法只能去除少
部分高斯噪聲;其次是WFLICM算法,分割圖上還能明顯看到噪聲點(diǎn);KWFLICM雖然有較強(qiáng)的去高斯噪聲能力,但明顯ELM-NKWFLICM算法的分割圖像上噪聲點(diǎn)更少,說明該算法有著很強(qiáng)的去高斯噪聲能力。表3主要為4種算法在第3張合成圖像受不同類型噪聲污染后的分割精度。SA數(shù)據(jù)明顯說明不論是對(duì)椒鹽噪聲還是高斯噪聲,ELM-NKWFLICM算法較其他3種算法有更好的去噪聲能力且魯棒性最好。
表1 4種算法在第1張合成圖像上的分割精度Tab.1 Segmentation performances comparison of four algorithms on the first synthetic image%
圖3 第2張人工合成圖像分割實(shí)驗(yàn)Fig.3 Segmentation result of the second synthetic image
表2 4種算法在第2張合成圖像上的分割精度Tab.2 Segmentation performances comparison of four algorithms on the second synthetic image%
圖4 第3張人工合成圖像分割實(shí)驗(yàn)Fig.4 Segmentation result of the third synthetic image
表3 4種算法在第3張合成圖像上的分割精度Tab.3 Segmentation per for mances compar ison of four algorithms on the thir d synthetic image%
醫(yī)學(xué)圖像容易受到萊斯噪聲[14-15]的污染。圖5顯示了一張的大腦切片影像圖像大小為256像素×256像素,受20%的萊斯噪聲污染。從分割結(jié)果可以看出,F(xiàn)GFCM算法、WFLICM算法和KWFLICM算法的分割圖依然存在著一些噪聲點(diǎn),ELM-NKWFLICM算法表現(xiàn)更好,圖像細(xì)節(jié)也保留最好。
圖5 醫(yī)學(xué)圖像分割實(shí)驗(yàn)Fig.5 Segmentation results on medical image
表4給出了3種分割精度較高的算法(WFLICM算法、KWFLICM算法和ELM-NK?WFLICM算法)分割醫(yī)學(xué)圖像的時(shí)間花費(fèi),數(shù)據(jù)說明ELM-NKWFLICM算法的分割時(shí)間效率比另兩種算法要更高。
實(shí)驗(yàn)用3張自然圖像來比較4種算法在處理自然噪聲圖像時(shí)的分割性能。圖6—8分別顯示了攝影者、花朵和琳娜3張圖像,并且分別被椒鹽(0.02)噪聲、高斯(0,0.03)噪聲和椒鹽(0.02)噪聲污染。從實(shí)驗(yàn)結(jié)果可以看出,ELM-NKWFLICM算法分割圖要比其他算法分割圖去噪效果更好,紋理也更為細(xì)膩,表現(xiàn)出本文算法對(duì)含噪聲的自然圖像分割能力要優(yōu)于其他3種算法。表5給出了3種分割精度較高的算法(WFLICM算法、KWFLICM算法和ELM-NKWFLICM算法)分割圖像的時(shí)間花費(fèi),數(shù)據(jù)說明ELM-NKWFLICM算法的分割效率比另兩種算法要更高。
表4 3種算法在醫(yī)學(xué)圖像上的時(shí)間對(duì)比Tab.4 Time comparison of three algorithms on medi?cal image s
圖6 第1張自然圖像分割實(shí)驗(yàn)Fig.6 Segmentation results on the first natural image
圖7 第2張自然圖像分割實(shí)驗(yàn)Fig.7 Segmentation results on the second natural image
圖8 第3張自然圖像分割實(shí)驗(yàn)Fig.8 Segmentation results on the third natural image
表6給出了3種分割精度較高的算法(WFLICM算法、KWFLICM算法和ELM-NKWFLICM算法)分割第2張自然圖像的時(shí)間花費(fèi),數(shù)據(jù)說明ELM-NKWFLICM算法的分割時(shí)間效率比另兩種算法要更高。
表5 3種算法在第1張自然圖像上的時(shí)間花費(fèi)Tab.5 Time cost of three algorithms on the first natu?ral image s
表7給出了3種分割精度較高的算法(WFLICM算法、KWFLICM算法和ELM-NKWFLICM算法)分割第3張自然圖像的時(shí)間花費(fèi),數(shù)據(jù)說明ELM-NKWFLICM算法的分割時(shí)間效率比另兩種算法要更高。
表6 3種算法在第2張自然圖像上的時(shí)間花費(fèi)Tab.6 Time cost of three algorithms on the second natural image s
表7 3種算法在第3張自然圖像上的時(shí)間花費(fèi)Tab.7 Time cost of thr ee algorithms on the thir d natural image s
分析結(jié)果,ELM-NKWFLICM算法表現(xiàn)出更優(yōu)秀的去噪聲能力和更好的魯棒性,并且在保證高精度分割的情況下花費(fèi)時(shí)間最短。
本文提出了ELM-NKWFLICM算法,實(shí)驗(yàn)結(jié)果表明該方法具有強(qiáng)大而高效的圖像分割能力。同時(shí),算法對(duì)模糊指數(shù)和隱節(jié)點(diǎn)數(shù)目等重要參數(shù)不敏感,解決了參數(shù)選擇困難的問題,極限學(xué)習(xí)機(jī)技術(shù)的應(yīng)用提高了算法效率,減少了圖像分割時(shí)間。此外,本文在WFLICM算法的基礎(chǔ)上,充分融合了非局部空間信息系數(shù),從而實(shí)現(xiàn)鄰域像素點(diǎn)對(duì)中心點(diǎn)影響因子的正確標(biāo)識(shí)。通過不同類型的分割實(shí)驗(yàn)證明了本文算法的優(yōu)秀去噪聲能力和良好的魯棒性,圖像細(xì)節(jié)同時(shí)也得到了一定的保留,具有一定的實(shí)際應(yīng)用價(jià)值。由于ELM隱空間隨著隱節(jié)點(diǎn)數(shù)目的增加,會(huì)造成效率逐步降低且引入噪聲,以后可以根據(jù)這點(diǎn)進(jìn)一步優(yōu)化模型。