楊 夢 雷 博 史露娜 蘭 蓉
(西安郵電大學(xué)通信與信息工程學(xué)院 陜西 西安 710121)
圖像分割是圖像處理過程中的關(guān)鍵步驟[1]。常用的有基于閾值、區(qū)域、邊緣及聚類的圖像分割方法[2-5]。閾值化算法因?qū)崿F(xiàn)簡單且性能穩(wěn)定,成為應(yīng)用相對較廣的算法之一。
閾值化算法分為單閾值分割算法和多閾值分割算法,當圖像包含多個目標時,單閾值分割算法不能滿足實際需求。因此,多閾值分割算法受到廣泛關(guān)注[6-8]。然而,傳統(tǒng)多閾值分割算法采用窮舉搜索法,計算復(fù)雜性隨閾值數(shù)呈指數(shù)形式增長[9-10]。因此,研究人員將元啟發(fā)式算法應(yīng)用于多閾值分割算法[11-12],常用的有粒子群算法、人工蜂群算法和遺傳算法[11-13]等。由于粒子群算法參數(shù)少,易于實現(xiàn),被廣泛討論[11,14]。
圖像邊緣具有漸變特性,且受成像設(shè)備影響,使得圖像具有一定的模糊性,因此,將模糊理論應(yīng)用于圖像分割具有合理性。Bandrian[15]引入K-L散度衡量兩個模糊集之間的差別,并將其應(yīng)用于圖像分割。蘭蓉等[16-17]給出α-型模糊散度并將其用于圖像分割,然而,這些算法均未討論復(fù)雜圖像的多閾值分割問題。在基于模糊理論的圖像分割算法中,需要選擇隸屬度函數(shù)將圖像轉(zhuǎn)換成模糊集。由于隸屬度的選擇取決于專家偏好,易受主觀因素影響,文獻[18]提出加權(quán)平均算子法構(gòu)造隸屬度函數(shù),實現(xiàn)信息的均衡化處理,但該算法假設(shè)每個隸屬度函數(shù)的權(quán)重是相同的,會忽略一些有價值的信息。
本文提出基于標準離差法的模糊散度多閾值圖像分割算法。該算法將常用的單閾值隸屬度函數(shù)推廣至多閾值形式,利用標準離差法,為選取最佳閾值的準則函數(shù)構(gòu)造一種新的多閾值隸屬度函數(shù),并采用粒子群優(yōu)化(ParticleSwarmOptimization,PSO)算法求解準則函數(shù)的最優(yōu)閾值,實現(xiàn)圖像多閾值分割。實驗結(jié)果表明,本文算法可以實現(xiàn)復(fù)雜圖像的多閾值分割,且性能優(yōu)于對比算法。
定義1 設(shè)X為論域,則X上的模糊集A可以表示為:
A={(x,μA(x)):x∈X}
(1)
式中:映射μA:X→[0,1]稱為模糊集A的隸屬度函數(shù)。
模糊散度單閾值分割算法中,選取最佳閾值的準則函數(shù)為α-型模糊散度,具體如下:
(2)
式中:α>0且α≠1;g∈{0,1,…,L-1},L為圖像最大灰度級;T為分割閾值;μA(g;T)是將圖像轉(zhuǎn)換成模糊集的單閾值隸屬度函數(shù)。當式(2)取最小值時對應(yīng)的T為最佳分割閾值。
(3)
(4)
w(t)=wmax-(wmax-wmin)×t/G
(5)
式中:r1和r2均為[0,1]上的隨機數(shù);c1和c2均為學(xué)習(xí)因子;w是慣性因子;t和G分別為當前迭代次數(shù)和最大迭代次數(shù)。
假設(shè)T1,T2,…,Tn-1是將圖像I分為n類的n-1個閾值。常用的單閾值隸屬度函數(shù)有Gamma型[21]、限制等價型(Restricted Equivalence Function,REF)[22]和改進指數(shù)型[23],本文將其推廣到多閾值形式。具體形式如下:
(6)
(7)
(8)
(9)
(10)
其中,c和m1,m2,…,mn的計算如下:
(11)
(12)
式中:gmax和gmin分別為圖像的最大和最小灰度值;T0=0,Tn=L-1。
采用模糊集(即隸屬度函數(shù))表示圖像時,單一隸屬度函數(shù)的適應(yīng)性較差,且隸屬度函數(shù)的選擇取決于專家的偏好。為了客觀評價不同隸屬度函數(shù)對圖像分割的重要性,本文將2.1節(jié)所推廣的5種多閾值隸屬度函數(shù)進行線性加權(quán),構(gòu)造一種新的隸屬度函數(shù),其中每個隸屬度函數(shù)的權(quán)重用標準離差法[24]客觀計算。具體如下:
(13)
(14)
式中:ki為第i個隸屬度函數(shù)的權(quán)重;σi為第i個隸屬度函數(shù)在整個灰度級上的方差;μA(g;T1,T2,…,Tn-1)為標準離差法構(gòu)造的新隸屬度函數(shù)。
本文仍然選取α-型模糊散度作為選取最佳閾值的準則函數(shù)。準則函數(shù)中的隸屬度函數(shù)不再是單一的單閾值隸屬度函數(shù),而是基于標準離差法構(gòu)造的多閾值隸屬度函數(shù)μA(g;T1,T2,…,Tn-1)。模糊散度具體計算如下:
D(A,B;T1,T2,…,Tn-1)=
2α-1(1-μA(g;T1,T2,…,Tn-1))+
(15)
當式(15)取最小值對應(yīng)的閾值為最優(yōu)閾值,即:
(16)
傳統(tǒng)多閾值分割算法采用窮舉法搜索最佳閾值,計算復(fù)雜性隨閾值數(shù)呈指數(shù)形式增加。因此,本文用PSO算法優(yōu)化式(15)表示的多閾值α-型模糊散度?;跇藴孰x差法的模糊散度多閾值圖像分割算法的具體步驟如下:
步驟1 輸入待分割圖像,若為彩色圖像,則將其轉(zhuǎn)化為灰度圖像;統(tǒng)計灰度直方圖;計算最大灰度值gmax和最小灰度值gmin。
步驟2 設(shè)置PSO算法的各參數(shù),并隨機初始化粒子群的位置和速度,位置的范圍為[gmin,gmax],并對位置按升序排序且賦值給閾值。
步驟3 用標準離差法計算2.1節(jié)5種多閾值隸屬度函數(shù)的客觀權(quán)重ki,并根據(jù)式(13)得到新的隸屬度函數(shù),再由式(15)計算多閾值α-型模糊散度作為PSO算法的適應(yīng)度函數(shù),通過極小化適應(yīng)度函數(shù)確定個體最優(yōu)和全局最優(yōu)的適應(yīng)度值與位置。
步驟4 根據(jù)式(3)-式(5)更新粒子的慣性因子,速度與位置,并將更新的位置按升序排序。
步驟5 判斷是否滿足終止條件,若滿足,輸出全局最優(yōu)位置作為最優(yōu)閾值實現(xiàn)圖像的多閾值分割;若不滿足,則返回步驟 3。
本文所有實驗環(huán)境為:Windows 8;Intel Core-i5 CPU;4.00 GB RAM;MATLAB R2014a。
本文選擇Berkeley BSD500[25]標準圖庫中的#55067、#8068,UCMerced_LandUses數(shù)據(jù)集[26]中的合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像#runway22、#airplane00、#airplane20和自然圖像#mountain進行多閾值分割,分割閾值分別為2、2、2、3、3、4。
為驗證本文算法的有效性,設(shè)計6種對比算法,即基于PSO的最大熵、指數(shù)熵、Tsallis熵、模糊熵、K-L散度和最大類間方差(Otsu)的多閾值圖像分割算法。對于Tsallis熵,本文取參數(shù)q=0.8[27]。本文算法中,參數(shù)α的取值并沒有理論指導(dǎo),因此取值與文獻[17]一致,即α=0.5。PSO算法具體的參數(shù)設(shè)置如表1所示。
表1 參數(shù)設(shè)置
為了客觀評價本文算法的性能,選擇如下3種性能指標。
(1) 峰值信噪比。峰值信噪比[27](Peak Signal to Noise Ration,PSNR)值越大,表示失真越小,圖像分割質(zhì)量越好。PSNR具體定義如下:
(17)
(18)
(2) 均勻性測度。均勻性測度[28](Uniformity Measure,UM)值越大,表示圖像分割效果越好。UM的定義如下:
(19)
(20)
(21)
(22)
(3) 分類誤差。分類誤差[29](Misclassification Error,ME)值越小,表示被錯分的像素越少,分割精度越高。ME的定義如下:
(23)
式中:mo1,mo2,…,mon和mT1,mT2,…,mTn分別表示標準分割圖像和實際分割圖像對應(yīng)區(qū)域的像素。
所選6幅測試圖像的多閾值分割結(jié)果如圖1-圖6所示。表2列出了7種算法搜索到各測試圖像的最優(yōu)閾值。表3列出了7種算法對各測試圖像的性能指標值。
圖1 #runway22圖像的二閾值分割結(jié)果
圖3 #8068圖像的二閾值分割結(jié)果
圖4 #airplane00圖像的三閾值分割結(jié)果
圖5 #airplane20圖像的三閾值分割結(jié)果
圖6 #mountain圖像的四閾值分割結(jié)果
表2 7種算法對各測試圖像的最優(yōu)閾值組合
表3 7種算法的性能指標對比
續(xù)表3
在圖1-圖6中,(a)和(b)分別為原始圖像和標準分割圖。由于UCMerced_LandUses數(shù)據(jù)庫中的圖像和自然圖像沒有Ground-Truth,因此選取人工分割圖作為標準分割圖。(c)-(h)依次為基于PSO的最大熵、指數(shù)熵、Tsallis熵、模糊熵、K-L散度和最大類間方差(Otsu)算法的分割結(jié)果。(i)為本文算法的分割結(jié)果。由圖1-圖5可以看出,本文算法的分割結(jié)果更接近于標準分割,圖6(d)-(e),(h)-(i)的分割結(jié)果視覺效果上差異較小,均接近標準分割。
進一步觀察表3可以看出,對于6幅測試圖像,本文算法的PSNR值均優(yōu)于對比算法。對于UM,基于PSO的最大類間方差分割算法取值最優(yōu),這是由于該算法選取最佳閾值的準則是分割后圖像的類間方差最大,類內(nèi)方差最小,而一個區(qū)域的均勻性與方差成反比。由此可知,該算法的UM值最優(yōu)。對于圖像#8068,本文算法的UM值與最優(yōu)UM值都是0.992 4;對于圖像#runway22、#airplane00、#airplane20和#mountain,本文算法的UM值與最優(yōu)UM值誤差最小,分別低于最優(yōu)UM值0.000 9、0.000 2、0.000 5、0.000 3;對于圖像#55067,本文算法的UM值低于最優(yōu)UM值0.001 8,但基于PSO的模糊熵分割算法對應(yīng)的UM值低于最優(yōu)UM值0.000 4,誤差最小。對于ME值,本文算法在圖像#runway22、#55067、#airplane00、airplane20和#mountain上均可取到最優(yōu)值,說明本文算法的誤判像素較少,但圖像#8068的ME值不及基于PSO的K-L散度分割算法對應(yīng)的ME值。
為進一步分析算法的性能,本文選取12幅測試圖像統(tǒng)計PSNR、UM和ME的平均值,對7種算法的性能進行客觀分析。12幅測試圖像具體包括Berkeley BSD500圖庫中的#8068、#55067、#241004,UCMerced_LandUses數(shù)據(jù)集中的#runway22、#airplane00、#airplane20、#airplane36、#airplane67、#airplane93、#storagethank54,MATLAB R2014a圖庫中的#MRI和自然圖像#mountain。統(tǒng)計結(jié)果如圖7-圖9所示。
圖7 7種算法的PSNR值對比
圖8 7種算法的UM值對比
圖9 7種算法的ME值對比
由圖7可以看出,本文算法獲得較優(yōu)的PSNR值。經(jīng)之前的理論分析,基于PSO的最大類間方差分割算法對應(yīng)的UM值最優(yōu)。由圖8可見,本文算法的UM值與最優(yōu)UM值誤差最小。圖9顯示本文算法的ME值最小,說明本文算法的誤判像素較少,分割精度較高。
由于圖像具有模糊性且單閾值分割算法不能滿足實際需求,同時考慮單一隸屬度函數(shù)適應(yīng)性較差的問題,本文提出基于標準離差法的模糊散度多閾值圖像分割算法。首先,將常用的單閾值隸屬度函數(shù)推廣至多閾值形式,采用標準離差法構(gòu)造新的隸屬度函數(shù),并推導(dǎo)出多閾值α-型模糊散度計算式。其次,用PSO算法優(yōu)化α-型模糊散度以降低多閾值分割算法的運行時間。實驗結(jié)果表明,本文算法的PSNR值和ME值均優(yōu)于對比算法,對于性能指標UM,本文算法與最優(yōu)的UM值誤差最小,提高了分割精度。