溫金玉,宣士斌,黃亞武,肖石林
(廣西民族大學(xué) 信息科學(xué)與工程學(xué)院,廣西 南寧 530006)
隨著計(jì)算機(jī)技術(shù)的日漸成長(zhǎng),圖像分割技術(shù)逐漸受到海內(nèi)外研究者的高度重視[1],分割算法也如雨后春筍般涌現(xiàn),如基于特殊性能區(qū)域識(shí)別分割[2]、基于不規(guī)則組織與規(guī)則組織的方法[3]、基于數(shù)據(jù)融合方法[4]、基于混合方法[5],還有基于模糊理論的分割方法。文獻(xiàn)[6]先通過(guò)像素之間的灰度與間隔來(lái)說(shuō)明像素之間的相似度,輪回地迭代出圖像的超像素,繼而選取每一個(gè)超像素的小波能量特質(zhì),并利用模糊C對(duì)提取到的特征進(jìn)行聚類。該方法分割精確度高,能有效抑制孤立點(diǎn)影響,但是當(dāng)噪聲復(fù)雜的情況下,抗噪能力較差,時(shí)間復(fù)雜度也高。文獻(xiàn)[7]操縱像素的空間范疇信息映射出的二維直方圖作為FCM的聚類樣本,以減緩樣本空間的維度,有效解決了傳統(tǒng)聚類算法速度慢的問(wèn)題,分割結(jié)果也有效,但是抗噪性能有限。文獻(xiàn)[8-9]是基于超像素的圖像分類,能靈活地減少噪聲與獨(dú)處點(diǎn)的影響,也能夠一定程度地提升處理的性能,但是該算法比較耗時(shí),計(jì)算復(fù)雜度高。Gong Maoguo等[10]提出改進(jìn)的基于局部信息的FCM,聯(lián)合局部空間與灰度信息來(lái)產(chǎn)生新的局部范疇的模糊因子,該模糊因子不含任何參數(shù)。該算法在迭代過(guò)程中利用了原始圖像,防止預(yù)操作可能會(huì)致使細(xì)微部分的失真。然而,因?yàn)槠浼軜?gòu)的部分空間的限制,致使分類過(guò)程中產(chǎn)生部分細(xì)節(jié)的失真。Pinti Antonio等[11]提出將動(dòng)態(tài)窗口與圖像中空間數(shù)據(jù)挖掘算法進(jìn)行融合,采用FCM的標(biāo)準(zhǔn)目標(biāo)函數(shù),并用n維特征陣描述圖像中的每個(gè)像素。
該方法在真實(shí)圖像上取得了滿意的效果,但未能對(duì)背景、皮質(zhì)骨、可延展的顎骨、脂肪肉、肌肉及大腿等核磁共振成像進(jìn)行有效分類。Zhao Zaixin等[12]聯(lián)合了圖像塊和部分空間信息,并增加一權(quán)值函數(shù)表示,通過(guò)結(jié)合加權(quán)的高斯歐氏距離提出了領(lǐng)域的FCM加權(quán)算法,能有效地保留圖像有組織的信息,對(duì)無(wú)噪圖像或含噪強(qiáng)度較低的圖像能獲得相比大的分類精度,然而當(dāng)增大噪聲強(qiáng)度后,分割精度不高。并且,分割過(guò)程當(dāng)中對(duì)圖像的中間像素考慮不足,便于形成邊沿恍惚。Siu Kai Choy等[13]提出基于模糊模型的聚類算法,該算法將器量廣義幾率分布之間空間差距的Kullback Leibler間隔引入到模糊聚類的目的函數(shù)中,獲得一種模糊廣義高斯密度分割。算法的優(yōu)點(diǎn)是對(duì)初始參數(shù)不敏感,并有效地分割不同的紋理圖像,具有較好的分割效果,但抗噪性弱。
目前,也有許多基于最大后驗(yàn)概率的圖像處理方法,例如Jian等[14]提出了一種改進(jìn)的基于ICA統(tǒng)計(jì)估計(jì)的SAR圖像去噪方法。但是這些方法必須假定先驗(yàn)概率分布,然而,真正的分布是很難符合所有的SAR圖像遵循相同的分布。Mohamad M等[15]提出結(jié)合融合方法進(jìn)行分割,該交融過(guò)程首先依賴于小波變換技術(shù),運(yùn)用技術(shù)在不同的參數(shù)下運(yùn)行好幾次。交融的圖像與小波技術(shù)聯(lián)合,增進(jìn)了分割的準(zhǔn)確性。然而,較佳的成效得要先探尋到較優(yōu)的融合方式,驗(yàn)證過(guò)程的期間復(fù)雜度相對(duì)冗長(zhǎng)。
最近很多的研究者對(duì)模糊的聚類方法進(jìn)行了研究,新的分類方式如中性均值聚類(neutrosophic c-means clustering,NCM)[16],可以將數(shù)據(jù)集進(jìn)行有效分類,并獲得了較精確的分割。但是,該方法在定義模糊類的聚類中心時(shí)使用的是最大與次大的隸屬度的平均值,這樣未充分考慮每個(gè)樣本點(diǎn)對(duì)于每一類的隸屬情況,不能自適應(yīng)。
近來(lái),文獻(xiàn)[17]提出了一種新的分割方法,結(jié)合中性均值聚類和不確定性濾波(neutrosophic c-means clustering and indeterminacy filtering,IFNCM)。IFNCM是在NCM的前后加了一個(gè)不確定性濾波器。根據(jù)中性圖像中的不確定性值來(lái)定義一個(gè)新的濾波器,即不確定性濾波器。對(duì)于不確定性子集域創(chuàng)建不確定性高斯濾波器,在某種程度上可以降低噪聲,但是由于不確定性子集本身的不確定性和模糊度使得參數(shù)的選擇不可能完全正確。
針對(duì)上述文獻(xiàn)存在的問(wèn)題,文中利用確定性子集的數(shù)據(jù)分布來(lái)確定模糊類子集的聚類中心。同時(shí)引進(jìn)自適應(yīng)的權(quán)重因子,依據(jù)確定性、模糊類和噪聲類的樣本數(shù)目占有的比例定義每次迭代過(guò)程中的權(quán)重系數(shù),以提高分割精確度和收斂速度。對(duì)圖像的預(yù)處理,引入了小波去噪,采用閾值去噪的方法分別處理小波分解的高低頻系數(shù),在去噪的同時(shí)能有效克服一般平滑去噪會(huì)去除一些邊緣信息的問(wèn)題,此閾值的獲取用最大熵原理。
與已有的聚類分割方法相比較,該方法分割精確度高,不僅有良好的分割效果,而且也大大提高了收斂速度。
小波分析具備多分辨率分析的特點(diǎn),其特征是一種建立在函數(shù)的空間概念上的理論。小波在時(shí)域與頻域都有表征信號(hào)部分信息的能力,在信號(hào)平穩(wěn)時(shí)能用較低的時(shí)間分辨率來(lái)提升頻率的分辨率。在頻率轉(zhuǎn)變不大時(shí)能夠用較低的分辨率來(lái)獲取到精準(zhǔn)的時(shí)分位置。
去噪方式包括平滑去噪和小波去噪,也有多方法融合去噪,如文獻(xiàn)[18]先采用中值濾波方式對(duì)圖像去噪,其中權(quán)值是自適應(yīng)的。然后對(duì)已去噪圖像實(shí)行小波分解,分解后將差異子帶采用異同的濾波方式進(jìn)行濾波,其中低頻部分采用低通濾波器濾波,高頻分量用中值濾波,最后進(jìn)行小波重構(gòu)。這樣從理論上也可以認(rèn)為是有一定去噪效果的,但從實(shí)際對(duì)含噪圖像去噪處理的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),該方法在去噪的同時(shí)也忽略了一些細(xì)節(jié)部分,特別是邊緣的細(xì)節(jié)信息在平滑過(guò)程中也被平滑了,如圖1的左圖所示。
圖1 文獻(xiàn)[18]與文中去噪方法的比較
整體看很模糊,具體看人的鼻子、嘴巴都沒(méi)有準(zhǔn)確定位,相機(jī)的攝像頭部分也都被模糊化了,不能看清邊緣的細(xì)節(jié)。文中采用的去噪方法充分地考慮了高低頻分量的特性,對(duì)高頻采用閾值法去噪,將低頻進(jìn)行閾值分割,實(shí)驗(yàn)結(jié)果較為明顯,特別的攝像頭的齒輪都可以清晰顯示,還有人的輪廓信息都比較清楚,保留了更多的細(xì)節(jié)部分,整體效果沒(méi)有被虛化。這也是文中方法的一個(gè)優(yōu)勢(shì)。
中性模糊聚類(neutrosophic fuzzy clustering,NFC)是在中性均值聚類[16]基礎(chǔ)上的改進(jìn)。文中算法的目標(biāo)函數(shù)同參考文獻(xiàn)[16-17],如下:
(1)
從式1可以發(fā)現(xiàn)前面兩項(xiàng)均是傳統(tǒng)聚類的拓展,表示確定性聚類與邊緣區(qū)域的類別,但第三項(xiàng)跟聚類原型無(wú)關(guān),可見這部分將作為噪聲數(shù)據(jù)集合。N為樣本數(shù)目,C為類別數(shù),m為模糊因子,w1、w2、w3分別為三個(gè)權(quán)重因子,δ為異常值的數(shù)量,Cp為新定義的模糊項(xiàng)聚類中心。
在基于模糊聚類的圖像分割中,最容易產(chǎn)生錯(cuò)分的是位于不同類相連接區(qū)域的像素點(diǎn)。事實(shí)上,NCM就是為解決此類問(wèn)題而提出的,但其用于控制邊緣區(qū)域的第二項(xiàng)中的中心點(diǎn)Cimax總是由樣本點(diǎn)xi的隸屬度最大的兩個(gè)類確定,未充分考慮到每個(gè)樣本點(diǎn)對(duì)于每一類的隸屬情況。
對(duì)于模糊類的聚類原型,用Cp表示:
(2)
(3)
(4)
其中,pi和qi分別為T的最大與次大值。文獻(xiàn)[16]是根據(jù)確定性隸屬度T的最大和次大數(shù)所屬的類別數(shù)的平均值來(lái)決定模糊集的中心,這種定義不能充分考慮到每個(gè)樣本點(diǎn)隸屬每個(gè)類的情況,不能自適應(yīng)。
文中用Cp表示模糊子集的聚類中心,這個(gè)中心根據(jù)隸屬度的數(shù)據(jù)分布可以分為兩種情況,除了最大的隸屬度外其他均小于閾值的時(shí)候,Cp等于最大隸屬的那類中心;另一方面是只有當(dāng)兩個(gè)以上隸屬度超過(guò)閾值,那么Cp就等于最大和次大隸屬度所屬類中心的平均值,它的值是由每個(gè)數(shù)據(jù)點(diǎn)i的常數(shù)數(shù)目計(jì)算的,當(dāng)然該閾值為每個(gè)點(diǎn)隸屬于每個(gè)類的最適閾值,用tt表示。可以確定的是,當(dāng)幾個(gè)數(shù)據(jù)屬于某一類的可能性最大時(shí),加上比其他的隸屬度大很多的情況下,次大的隸屬度已經(jīng)沒(méi)有多大的意義,所以說(shuō)Cimax的值并不能減輕不確定程度,反而加大了模糊程度。
接下來(lái)是最優(yōu)化目標(biāo)函數(shù),通常使用拉格朗日方法最小化算式1,構(gòu)造拉格朗日目標(biāo)函數(shù):
Ii+Fi-1)
(5)
最小化拉格朗日方程使用的操作是計(jì)算每個(gè)未知元素的偏導(dǎo)數(shù),例如Tij,Ii,F(xiàn)i和cj,使用指定的歐氏范數(shù),讓各階導(dǎo)數(shù)等于0,得到如下公式:
(6)
(7)
(8)
(9)
(10)
二維小波分解可以在水平與垂直方向分別處理,一幅圖可以在每個(gè)尺度上被分解為四個(gè)通道,每個(gè)通道上的小波系數(shù)能量都代表著圖像空間和頻率的主要信息,可以作為圖像紋理分析的特征[19]。運(yùn)用小波閾值去噪方法,根據(jù)最大熵定理求閾值的具體過(guò)程如下:
(1)小波分解成三層,提取到各層分化的低頻與高頻部分。對(duì)各層三個(gè)高頻分量采用最大熵的原理得到自適應(yīng)的閾值,分別對(duì)高頻系數(shù)分量進(jìn)行閾值化去噪處理。
(a)根據(jù)圖像的直方圖信息求出所有的可能灰度,計(jì)算圖像的大小,并求出各灰度點(diǎn)出現(xiàn)的概率hi,及橫縱方向的概率之和并記為P1、P2;
過(guò)度的流失會(huì)給酒店帶來(lái)顧客忠誠(chéng)度降低、經(jīng)營(yíng)成本提高等后果。近幾年來(lái)我國(guó)酒店員工流失率不斷升高甚至已遠(yuǎn)遠(yuǎn)超過(guò)酒店行業(yè)員工流失的基本標(biāo)準(zhǔn)15%。酒店員工流失大多數(shù)為基層員工,而正是這些基層的一線員工才反映了一個(gè)酒店的服務(wù)質(zhì)量,由此可見,酒店員工流失率對(duì)酒店的服務(wù)質(zhì)量和發(fā)展有著極為重要的影響。
(d)根據(jù)高概率的事物總更容易出現(xiàn)的情況來(lái)選擇N中最大的概率,并相應(yīng)的找到其所對(duì)應(yīng)的點(diǎn),即為要求的閾值分割點(diǎn)。
(2)在逐層重構(gòu)前先對(duì)低一層的低頻分量進(jìn)行閾值分割,比閾值大的保留,否則置為零。
最后,文中方法具體步驟如下:
Step1:預(yù)處理階段。
(a)利用維納濾波對(duì)圖像進(jìn)行初步去噪;
(b)用小波閾值去噪進(jìn)行深度去噪。
Step2:用NFC方法將預(yù)處理過(guò)的圖像進(jìn)行分割。
(a)通過(guò)傳統(tǒng)的模糊分類算法將圖像分為三個(gè)子集,即初始化T,I與F,并計(jì)算出初始的權(quán)重因子w1,w2,w3。設(shè)置調(diào)節(jié)參數(shù)(C、m、δ、ε),ε是迭代終止參數(shù);
(b)利用式9計(jì)算各類別聚類中心,同時(shí)通過(guò)式2根據(jù)T的值來(lái)計(jì)算模糊聚類中心Cp;
(c)用式6~8分別更新三個(gè)子集T',I'與F';
(d)判斷終止條件,若|T'-T|<ε則結(jié)束迭代,否則跳到步驟b循環(huán)繼續(xù);
(e)根據(jù)確定性子集T得到聚類結(jié)果。
根據(jù)上文所述,在中性模糊聚類分割的過(guò)程中結(jié)合小波變換,使得文中方法在分割的實(shí)現(xiàn)上,完美地控制了噪聲的干擾,也避免了圖像邊緣的失真現(xiàn)象,使得分割速度快,分割效果更佳。在小波去噪中設(shè)置尺度向量為[2 2 3]能得到更好的效果,分別設(shè)置調(diào)節(jié)參數(shù)m為2,δ為50,ε為0.000 1,權(quán)重因子分別設(shè)置為w1=0.7,w2=0.15,w3=0.15。接下來(lái)證明其有效性,具體情況如圖2所示。
圖2中(a1)為傳統(tǒng)的模糊均值聚類方法,可以看出分割效果一般,左褲腿上有被分段的情況,可能是由于噪聲的影響,使得湖面與人的左腿褲腳地方也有了錯(cuò)亂的聚類現(xiàn)象,導(dǎo)致分割的結(jié)果不怎么完好。(a2)為文獻(xiàn)[10]的方法,不給模糊因子任何參數(shù),也就是讓其自適應(yīng),這樣可以提高收斂速度,但是會(huì)導(dǎo)致一些細(xì)節(jié)部分丟失,使得分割精確度不高,與(a1)相比分割效果更佳,如右下角孤立點(diǎn)更少。文獻(xiàn)[13]是基于廣義高斯分布的模糊聚類,在求高斯密度的時(shí)候要用到估計(jì)的方法,該方法自帶隨機(jī)性比較高,所以也會(huì)更大尺度地影響著分割結(jié)果。如(a3)所示,人的上衣及褲腿的分類情況比其他方法有很大的差別,一些細(xì)節(jié)部分信息也容易丟失,如支架的中間部分與末端。文獻(xiàn)[16]是基于中性集的思想的模糊聚類,可以獲得較精確的分割,如(a4)所示,攝像師的頭部紋理特征及攝像頭的輪廓都可以較清晰地顯現(xiàn),但攝像師右褲腳及水面還是有一些孤立點(diǎn),可能是噪聲引起的。圖(a5)是文獻(xiàn)[17]的算法實(shí)現(xiàn),該算法也是對(duì)傳統(tǒng)的模糊聚類進(jìn)行的改進(jìn),可以看出其效果較前幾種更佳,但也有一些缺陷,如攝影師的鼻子與下巴幾乎是被分錯(cuò)類了,還有右腿褲腳部分,細(xì)心看就可以看到有兩個(gè)白點(diǎn),這也是誤分的結(jié)果。(a6)是文中方法,與其他方法相比分割效果較好,對(duì)細(xì)節(jié)的信息有較好地保留。
圖2 多種算法對(duì)攝像師圖像的實(shí)驗(yàn)比較
精確度優(yōu)劣的問(wèn)題,因單從視覺(jué)上比較難分辨高低,文中從計(jì)算像素聚集數(shù)量的區(qū)間比例進(jìn)行客觀的評(píng)價(jià)。根據(jù)直方圖來(lái)劃分區(qū)間,對(duì)使用不同的方法分別取對(duì)應(yīng)區(qū)間的像素點(diǎn)數(shù),計(jì)算處理后該區(qū)間的數(shù)量與原圖差異的大小也可以用來(lái)說(shuō)明正確率的高低,即精確度也成正比,表1為對(duì)其中的三個(gè)區(qū)間(0-130,130-200,200-256)的取樣情況,通過(guò)與原始圖像該區(qū)間數(shù)量之差所占比例判斷精確度。
表1 多種算法對(duì)攝像師圖像的數(shù)據(jù)分析
表1列出了各種方法在每個(gè)區(qū)間的數(shù)量顯示和原圖的數(shù)量大小比較,可以發(fā)現(xiàn)文中方法與原圖的差異最小。該圖是以不同像素區(qū)間的數(shù)據(jù)顯示,原圖在0-130區(qū)間的樣本點(diǎn)共有12 407個(gè),在130-200區(qū)間所占比例最大,達(dá)到了36 584個(gè),剩下的也有16 545。這說(shuō)明只要圖像處理后的數(shù)據(jù)分布能與原圖保持一致或是相差不大的情況下精確度高,分割效果更好。此外,原始聚類、文獻(xiàn)[10]與文獻(xiàn)[13]的數(shù)據(jù)分布是一頭大,剩余的較平均小。而文獻(xiàn)[16]和文獻(xiàn)[17]及文中方法同原始數(shù)據(jù)一樣,是中間大,兩頭小。但再細(xì)心地看,文中方法顯示的兩頭數(shù)據(jù)同真實(shí)數(shù)據(jù)更加接近。所以可以證明文中方法分割的精確度相對(duì)較高。接下來(lái)通過(guò)實(shí)驗(yàn)再來(lái)測(cè)試各方法對(duì)噪聲的魯棒性。
在圖1中加入高斯噪聲(方差為0.01),分析它們的平均絕對(duì)誤差與信噪比數(shù)據(jù),如表2所示。
表2 平均絕對(duì)誤差的數(shù)據(jù)分析
表2是針對(duì)攝像師含噪情況下的各種方法處理后的平均絕對(duì)誤差(MAE)數(shù)據(jù)顯示,該值越小代表效果越好。從MAE的5個(gè)值可以看出,進(jìn)行了5次試驗(yàn)比較分析,MAE1到MAE5添加的噪聲都是高斯白噪聲,但是方差略有千秋,分別是0.01、0.02、0.05和0.1。可以看出,文獻(xiàn)[13]與文獻(xiàn)[16]對(duì)噪聲更敏感,特別是文獻(xiàn)[16],隨著方差的增加其MAE值也在不斷上升。文中方法對(duì)函數(shù)圖像處理效果較好,不管方差是否變化MAE值均小于其他方法,且MAE值跨度不大。
表3 信噪比的數(shù)據(jù)分析
表3是在含噪情況下各個(gè)方法處理后的信噪比(SNR)數(shù)據(jù)顯示,該值越大代表效果越好。原始的模糊聚類與文獻(xiàn)[10]的SNR差不多,文獻(xiàn)[13]與文獻(xiàn)[16]會(huì)相對(duì)小一些,文獻(xiàn)[17]的SNR變化跟不同的方差沒(méi)有關(guān)系,總體比文獻(xiàn)[13]與[16]好些,但劣于文中方法。不管是添加哪個(gè)方差的噪聲,文中方法的SNR都比其他方法大,而且值都在8~12直接上下波動(dòng)。從以上兩個(gè)數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)可以證明文中方法的抗噪能力較強(qiáng)。
文中提出一種多尺度特征的中性模糊聚類圖像分割算法,先分析了傳統(tǒng)方法與現(xiàn)有方法的優(yōu)缺點(diǎn),再闡述了小波去噪與中性模糊聚類的理論分析,最終經(jīng)過(guò)實(shí)驗(yàn)的對(duì)比與剖析,證實(shí)了其有效性。中性模糊聚類在小波的結(jié)合下,使得在分割有效的情況下更具抗噪能力,結(jié)果相對(duì)完美。
但是對(duì)于中性模糊聚類的分割算法在日后的學(xué)習(xí)中還需在精確度上繼續(xù)完善,以使得更多的細(xì)節(jié)信息被保留下來(lái)。