覃小素, 黃成泉, 雷 歡, 陳 陽(yáng), 彭家磊, 周麗華
(1 貴州民族大學(xué) 數(shù)據(jù)科學(xué)與信息工程學(xué)院, 貴陽(yáng) 550025;2 貴州民族大學(xué) 工程技術(shù)人才實(shí)踐訓(xùn)練中心, 貴陽(yáng) 550025)
作為民族文化和精神的重要載體之一,民族服飾與國(guó)家的發(fā)展和傳承密不可分。 民族服飾也體現(xiàn)了不同民族之間的文化差異和多樣性,具有重要的歷史、文化和藝術(shù)價(jià)值。 隨著時(shí)間的推移,民族服飾不斷演變,原材料、風(fēng)格、顏色以及制作工藝和圖案等方面的變化,都能夠反映出相應(yīng)民族文化的歷史演變和發(fā)展軌跡[1]。 而苗族服飾是傳統(tǒng)民族服飾的代表之一,具有獨(dú)特魅力和多元性,有利于不同民族之間文化的傳播與交流,也是其民族的身份象征和文化符號(hào),對(duì)于傳承民族精神和提升民族自信心具有重要作用。 苗族服飾具有紋理圖騰復(fù)雜、色彩繽紛等特點(diǎn),隨著時(shí)間的推移,服飾受環(huán)境和噪聲等多種因素的影響,導(dǎo)致部分圖案和紋理變得模糊不清。 因此,及時(shí)保護(hù)和傳承民族文化意義非凡。
圖像分割是將圖像按照一定的規(guī)則劃分為若干個(gè)具有相似特征(如亮度、色彩、紋理、密度等等)區(qū)域的技術(shù)和過(guò)程。 信息化時(shí)代,圖像分割技術(shù)已廣泛應(yīng)用于各個(gè)領(lǐng)域,在醫(yī)學(xué)和遙感領(lǐng)域尤為常見(jiàn)。傳統(tǒng)的模糊C 均值(FCM)是一種簡(jiǎn)單高效的算法,這個(gè)算法對(duì)于無(wú)噪聲圖像,具有分割準(zhǔn)確率高和速度快的優(yōu)勢(shì)[2]。 但處理含噪聲圖像時(shí)效果不佳,無(wú)法充分體現(xiàn)其分割準(zhǔn)確率高的優(yōu)勢(shì)。 為了提高算法對(duì)噪聲的魯棒性,許多研究者不斷的對(duì)FCM 算法進(jìn)行改進(jìn),Ahmed 等[3]提出具有空間約束的改進(jìn)算法(FCM with Spatial constraints, FCM-S),充分考慮像素的鄰域信息,從而提高算法對(duì)噪聲的魯棒性,但是在算法運(yùn)行的過(guò)程中,需要一次次計(jì)算像素點(diǎn)的鄰域信息,導(dǎo)致計(jì)算成本高;Chen 等[4]引入兩個(gè)變量來(lái)替換FCM-S 中的鄰域信息,即均值濾波(FCMS1)和中值濾波(FCM-S2),旨在提前計(jì)算空間鄰域信息,降低了計(jì)算成本;Krinidis 等[5]定義了一種新的模糊因子(Fuzzy Local Information C -Means,F(xiàn)LICM),來(lái)抑制迭代過(guò)程中的噪聲;高云龍等[6]提出簇間可分的魯棒模糊C 均值聚類(lèi)(Robust Fuzzy C-Means Clustering Integrating Between - cluster Information,RBI-FCM)算法,利用像素的稀疏性,提高簇之間的分類(lèi);Zhang 等[7]提出具有鄰域信息約束的偏差稀疏模糊C 均值(Deviation-Sparse Fuzzy C-means With Neighbor Information Constraint,DSFCM-N),基于像素的鄰域信息,對(duì)測(cè)量值與理論值之間的偏差施加稀疏性來(lái)降低算法噪聲的敏感性。 然而苗族服飾圖像的紋理復(fù)雜、色彩鮮艷、圖案豐富,經(jīng)過(guò)長(zhǎng)期保存的服飾圖像存在折痕、磨損等現(xiàn)象。 盡管改進(jìn)后的算法在一定程度上能夠提高對(duì)苗族服飾圖像的分割效果,但并沒(méi)有考慮到像素邊緣點(diǎn)對(duì)算法的影響,對(duì)于存在折痕、磨損、色彩差異大的苗族服飾圖像分割效果仍有待進(jìn)一步提高。
由于傳統(tǒng)FCM 算法對(duì)噪聲敏感,無(wú)法有效分割具有折痕、污漬、色彩差異大的苗族服飾圖像,本文提出了可靠性模糊局部信息C 均值聚類(lèi)算法的苗族圖像分割(Dependable Fuzzy Local Information Cmeans, DFLICM)算法,構(gòu)造一個(gè)模糊因子來(lái)度量空間信息和灰度信息的相似性,既不需調(diào)節(jié)參數(shù)也可以自動(dòng)確定空間約束項(xiàng),旨在平衡噪聲和細(xì)節(jié);使用一個(gè)不確定性聚類(lèi)模型進(jìn)一步降低噪聲點(diǎn)和邊緣點(diǎn)的影響。 實(shí)驗(yàn)結(jié)果表明,本文所提算法對(duì)噪聲具有魯棒性,對(duì)于邊緣點(diǎn)分割效果較好,能較完整的分割出苗族服飾圖案。
傳統(tǒng)的FCM 是一種基于模糊邏輯的無(wú)監(jiān)督聚類(lèi)算法,通過(guò)一個(gè)迭代的最小化過(guò)程將n個(gè)被測(cè)量的像 素 劃 分 為c個(gè) 類(lèi)[6]。 FCM 的 目 標(biāo) 函 數(shù)JFCM(U,V) 如式(1)所示:
其中,X ={x1,x2,…,xn}為圖像的像素集;n為像素的個(gè)數(shù);xi為圖像中第i像素的灰度值;c為劃分X的類(lèi)別數(shù)(c >1);m為模糊加權(quán)指數(shù),決定聚類(lèi)的模糊性, 在實(shí)際應(yīng)用中,m通常取為2;V =和U ={uki |1 ≤k≤c,1 ≤i≤n}分別為聚類(lèi)中心矩陣和模糊隸屬度矩陣,其中隸屬度滿足=1 約束條件,‖xi - vk‖2為像素xi與聚類(lèi)中心vk的歐氏距離。
利用拉格朗日乘子法對(duì)JFCM(U,V) 進(jìn)行迭代更新,實(shí)現(xiàn)最小化目標(biāo)函數(shù),獲得隸屬度uki和聚類(lèi)中心vk更新,式(2)和式(3):
但是傳統(tǒng)的FCM 算法對(duì)噪聲較敏感,對(duì)具有折痕、污漬、色彩差異大的苗族服飾圖像分割效果難以令人滿意。
像素具有明顯和非明顯的特征,對(duì)于非明顯特征的像素,無(wú)法定義其類(lèi)別屬性時(shí)稱(chēng)為像素的模糊不確定性。 對(duì)于屬性不明確的像素,基于當(dāng)前的聚類(lèi)結(jié)果,僅用距離來(lái)度量不確定性的大小。 當(dāng)一個(gè)像素距離交疊的簇越遠(yuǎn)時(shí),像素的模糊不確定性就越小,反之越大[8]。
像素i的模糊不確定性模型如式(4)所示:
其中,q為不確定性因子。
在像素聚類(lèi)的過(guò)程中盡可能的使不確定性最小,即不確定性的聚類(lèi)模型,式(5):
基于式(5),分析像素的可靠性。 對(duì)于隸屬度值大的像素,具有明顯的特征,可以確定像素類(lèi)別;而對(duì)于距離交疊簇較遠(yuǎn)的噪聲點(diǎn)和邊緣點(diǎn),像素的隸屬度特征不夠明顯,其大小只與像素點(diǎn)到聚類(lèi)中心的距離有關(guān),距離交疊簇越遠(yuǎn),像素的模糊不確定性越小,則對(duì)應(yīng)δi的權(quán)重較小,從而降低了噪聲點(diǎn)和邊緣點(diǎn)的影響。
傳統(tǒng)的FCM 算法對(duì)噪聲較為敏感,分割的苗族服飾圖像的效果難以令人滿意。 本文考慮像素的局部空間信息和灰度信息,在目標(biāo)函數(shù)中使用一個(gè)模糊因子來(lái)自動(dòng)確立空間約束項(xiàng),并通過(guò)降低像素之間的不確定性來(lái)進(jìn)一步提高算法對(duì)噪聲點(diǎn)和邊緣點(diǎn)的魯棒性,獲得DFLICM 算法的目標(biāo)函數(shù),式(6):
其中,α為不確定性模型的占比系數(shù);Ni為xj周?chē)翱谥械泥徲蛳袼兀籊ki為模糊因子,滿足式(7):
用拉格朗日乘子法對(duì)式(6),即目標(biāo)函數(shù)構(gòu)建輔助函數(shù),式(8):
對(duì)式(8)中的隸屬度uki求偏導(dǎo),并基于隸屬度的約束條件得到式(9):
對(duì)式(8)中的聚類(lèi)中心vk求偏導(dǎo),式(10):
求解式(10)得到式(11):
算法實(shí)現(xiàn)的步驟:
(1) 設(shè)置加權(quán)模糊指數(shù)m、聚類(lèi)的個(gè)數(shù)c、窗口N、不確定性因子q,不確定性比例系數(shù)α、閾值ε和最大迭代次數(shù)Tmax;
(2)初始化聚類(lèi)中心v(1)和隸屬度,設(shè)置迭代次數(shù)Tnums =1;
(3) 根據(jù)式(4)計(jì)算δi;
(4) 根據(jù)式(8)計(jì)算隸屬度;
(5)根據(jù)式(10)計(jì)算聚類(lèi)中心;
(6)運(yùn)行過(guò)程中滿足‖J(Tnums+1)- J(Tnums)‖<ε,或者Tmums >Tmax 這兩個(gè)條件中的一個(gè),則停止迭代。 均不滿足條件時(shí),令Tnums =Tnums +1,轉(zhuǎn)到第三步,繼續(xù)下一輪迭代。
將本文算法(DFLICM)與FCM、FCM-S1、FCMS2、FLICM 和RBI-FCM 算法在苗族服飾圖像上進(jìn)行對(duì)比,旨在驗(yàn)證本文算法的優(yōu)勢(shì)。 數(shù)據(jù)集來(lái)源于北京服裝學(xué)院民族服飾圖像博物館(http:/ /www.biftmuseum.com/),實(shí)驗(yàn)中部分參數(shù)設(shè)置:模糊加權(quán)指數(shù)為2,窗口為3,閾值為10-5,聚類(lèi)數(shù)為2,最大迭代次數(shù)為100,不確定性因子為2。
實(shí)驗(yàn)環(huán)境:MATLAB R2018b,Intel(R) Core(TM) i7-3770 CPU @3.40 GHz,8.00 GB 內(nèi)存。
本文選用兩個(gè)客觀評(píng)價(jià)指標(biāo)即劃分系數(shù)(Partition Coefficient,Vpc) 和 劃 分 熵(Partition Entropy,Vpe) 來(lái)驗(yàn)證DFLICM 算法的優(yōu)勢(shì)。Vpc和Vpe的值在0~1 之間波動(dòng),Vpc的值越接近于1,效果越好;Vpe的值越接近于0,模糊聚類(lèi)越緊湊,分割效果越好。 指標(biāo)的定義如式(12) 和式(13):
實(shí)驗(yàn)一選取3 張蠟染圖像,由簡(jiǎn)單的色彩組成,但是圖像中存在磨損、折痕、污漬的現(xiàn)象。 本文對(duì)這類(lèi)苗族服飾圖像添加5%高斯和5%椒鹽混合噪聲,增加算法的分割難度,旨在驗(yàn)證DFLICM 算法的優(yōu)勢(shì),實(shí)驗(yàn)結(jié)果如圖1 和表1 所示。 由圖1 和表1可知,F(xiàn)CM 和RBI-FCM 算法分割的圖像不同程度地受到噪聲的影響,部分像素出現(xiàn)錯(cuò)分和漏分的現(xiàn)象,圖像中仍有磨損和折痕。 FCM-S1 和FCM-S2算法能去掉大部分噪聲點(diǎn),分割效果較好,但是分割的圖像邊緣部分還存在稀疏的噪聲點(diǎn);FLICM 算法分割的圖像輪廓和背景劃分較為明確,消除大部分噪聲點(diǎn)的影響,但是分割的蠟染圖中邊緣部分被模糊掉。 FCM、RBI-FCM、FCM-S1、FCM-S2 和FLICM算法難以分割具有磨損、折痕、污漬的苗族服飾圖像。 DFLICM 算法不僅能分割出完整的圖騰,而且邊緣部分也較為清晰,DFLICM 算法獲得最高的Vpc值和最低的Vpe值,說(shuō)明DFLICM 算法分割蠟染圖像的效果較理想。
表1 不同算法分割含有5%混合噪聲的苗族服飾圖像的Vpc 和Vpe(%)值Tab.1 Vpc and Vpe (%) values of 5% mixed noise image segmentation by different algorithms
圖1 不同算法分割含有5%混合噪聲的苗族服飾圖像Fig.1 Segmentation results on Miao clothing images containing 5%mixed noise from different algorithms
實(shí)驗(yàn)二選取3 張色彩差異大的苗族服飾圖像,對(duì)這一類(lèi)苗族服飾圖像添加10%高斯和10%椒鹽混合噪聲,進(jìn)一步驗(yàn)證DFLICM 算法的分割性能,實(shí)驗(yàn)結(jié)果如圖2 和表2 所示。 由圖2 和表2 可知,F(xiàn)CM 和RBI-FCM 算法的分割效果較差,圖像的輪廓與背景大部分混在一起,出現(xiàn)虛假分割的情況,不同顏色的像素分割不夠準(zhǔn)確,RBI-FCM 算法的Vpc和Vpe值部分高于FCM 算法,由于RBI-FCM 算法考慮到了簇之間的關(guān)系,一定程度上抑制了噪聲點(diǎn),增強(qiáng)像素的可分性。 FCM-S1 和FCM-S2 算法對(duì)于色差大的圖像分割效果略好,但是Vpc均低于其他算法,而Vpe值又高于其他算法。 從指標(biāo)上分析,F(xiàn)CM-S1和FCM-S2 算法的分割性能較差。 FLICM 和DFLICM 算法分割的圖案清晰明亮,但是FLICM 算法邊緣部分的噪聲點(diǎn)仍不能有效消除,DFLICM 算法的Vpc值最高,Vpe值最低,DFLICM 算法的分割質(zhì)量佳,分割性能優(yōu)于對(duì)比算法。
表2 不同算法分割含有10%混合噪聲的苗族服飾圖像的Vpc 和Vpe(%)值Tab.2 Vpc and Vpe (%) values of 10% mixed noise image segmentation by different algorithms
圖2 不同算法分割含有10%混合噪聲的苗族服飾圖像Fig.2 Segmentation of Miao clothing images containing 10%mixed noise of different algorithms
針對(duì)傳統(tǒng)FCM 算法對(duì)含噪的苗族服飾圖像分割質(zhì)量不佳的問(wèn)題,本文提出了可靠性模糊局部信息C 均值聚類(lèi)算法。 考慮到像素的空間鄰域信息,在FCM 的目標(biāo)函數(shù)中構(gòu)造一個(gè)模糊因子,結(jié)合空間信息與灰度信息,提高算法對(duì)噪聲的魯棒性,并自動(dòng)調(diào)節(jié)算法在去噪聲和保留細(xì)節(jié)之間的關(guān)系;除此之外,根據(jù)幾何意義,對(duì)像素點(diǎn)進(jìn)行可靠性分析,在聚類(lèi)的過(guò)程中,降低像素的不確定性,進(jìn)一步降低了噪聲點(diǎn)和邊緣點(diǎn)的影響。 實(shí)驗(yàn)結(jié)果表明,DFLICM 算法對(duì)具有折痕、污漬、色彩差異大的苗族服飾圖像分割效果好,既能去噪,又能完整的分割出苗族服飾圖案。 但是DFLICM 算法也存在不足,每次運(yùn)行均需要計(jì)算局部信息,耗時(shí)、計(jì)算成本高;參數(shù)大小影響著實(shí)驗(yàn)結(jié)果,一定程度上存在不穩(wěn)定性,調(diào)參過(guò)程也較困難;實(shí)驗(yàn)對(duì)象比較局限,沒(méi)有對(duì)圖騰復(fù)雜、紋理細(xì)小、背景與圖案差異小的服飾圖像進(jìn)行研究,存在部分漏分割的現(xiàn)象。