古麗江·庫(kù)爾班
(伊犁師范學(xué)院電子與信息工程學(xué)院,新疆伊寧835000)
基于DCT編碼圖像分割算法研究*
古麗江·庫(kù)爾班*
(伊犁師范學(xué)院電子與信息工程學(xué)院,新疆伊寧835000)
針對(duì)傳統(tǒng)圖像分割算法存在的計(jì)算量大和實(shí)時(shí)性能不佳等問(wèn)題提出了基于DCT編碼圖像分割算法。該算法的是一種改進(jìn)的交互式快速分割算法,通過(guò)DC系數(shù)與AC系數(shù)提取出紋理特征,結(jié)合自適應(yīng)的正則化參數(shù)構(gòu)造成一個(gè)能量函數(shù)。測(cè)試結(jié)果表明此算法不但分割效果很好,而且算法效率也大大提高。
DCT;圖像分割;能量函數(shù);效率提高
圖像分割是圖像分析領(lǐng)域中一個(gè)很大的難題,圖像分割就是把靜態(tài)圖像或視頻序列中某個(gè)目標(biāo)分離出來(lái)。因?yàn)橥耆詣?dòng)分割是很難實(shí)現(xiàn)的,所以交互式半自動(dòng)分割是圖像分割中應(yīng)用最廣泛的。通過(guò)較少的用戶交互,可以得到更多的分割信息,這樣就能實(shí)現(xiàn)對(duì)目標(biāo)快速、準(zhǔn)確的分割[1]。
目前互式圖像分割算法非常多,應(yīng)用比較廣泛的有基于隨機(jī)游走的算法和GrabCut算法等。但是這些算法都存在缺點(diǎn),比如GrabCut雖然在圖像的區(qū)域信息與邊界信息等方面考慮比較全面,能通過(guò)最大流算法在多項(xiàng)式時(shí)間內(nèi)進(jìn)行求解,但是GrabCut算法會(huì)產(chǎn)生Shrinking Bias現(xiàn)象[2]?;陔S機(jī)游走的算法需要對(duì)帶分割圖像進(jìn)行預(yù)處理,而且預(yù)處理算法往往本身就較復(fù)雜。
針對(duì)這些問(wèn)題,文章提出了基于DCT編碼圖像分割算法研究,DCT編碼圖像被用在JPEG和MPEG中,本算法中的紋理特征是通過(guò)提取DC與AC系數(shù)來(lái)實(shí)現(xiàn)的,自適應(yīng)的顏色、紋理特征比例系數(shù)都是通過(guò)計(jì)算獲得,在通過(guò)自適應(yīng)的正則化參數(shù)構(gòu)造成一個(gè)能量函數(shù)。測(cè)試結(jié)果表明,此算法提高了分割效率,通過(guò)本算法分割的效果比傳統(tǒng)的分割算法要好得多。
圖割算法就是把分割問(wèn)題轉(zhuǎn)化成了二元標(biāo)號(hào)問(wèn)題,首先轉(zhuǎn)換成二元標(biāo)號(hào)的能量函數(shù),最后求出能量函數(shù)的最小值[3]。能量函數(shù)的定義是:
式(1)中S是邊界項(xiàng),D是區(qū)域項(xiàng),α是標(biāo)號(hào)值,θ是觀察數(shù)據(jù),λ是調(diào)節(jié)因子。
傳統(tǒng)的圖割算法有3個(gè)缺點(diǎn):第1個(gè)缺點(diǎn)是對(duì)高分辨率圖像算法的實(shí)時(shí)性不夠好;第2個(gè)缺點(diǎn)特征單一,對(duì)顏色描述不夠全面;第3個(gè)缺點(diǎn)是存在Shrinking Bias現(xiàn)象。
基于圖割傳統(tǒng)算法的缺點(diǎn),文章提出了基于DCT編碼圖像分割算法。
首先將原始圖像進(jìn)行分割,可以分成n×n的小塊,對(duì)這些小塊都進(jìn)行二維DCT變換,變化的結(jié)果是大部分能量集中低頻、中頻,高頻的能量相對(duì)較少,同時(shí)還有不少零值。經(jīng)過(guò)DCT變換的能量分布方向性非常明顯,如圖1所示。
圖1 DCT能量分布示意圖
圖(1)中A0部分是低頻部分,A2部分是對(duì)角方的頻率變化,A3是垂直方向的頻率變化。
圖像塊的均值是M(0,0)/n。假設(shè)提取某個(gè)圖像塊P的顏色特征,可表示為:
提取的顏色特征為:Cp={CRp,CGp,CBp}。
圖像的紋理變化可以通過(guò)能量分布的方向性表示[4]。各個(gè)區(qū)域能量變化的方差可表示為:
人類的眼睛對(duì)色度信號(hào)Cb和Cr的變化非常敏感,所以只需提取Y分量的紋理特征即可,最終的紋理特征向量就是
顏色特征Cp和紋理特征Tp的分布可描述為:
式中g(shù)(·)是高斯函數(shù),πk是混合權(quán)重,K是常數(shù)。
首先要確定特征系數(shù),特征系數(shù)由顏色特征與紋理特征共同決定[5]:
式(5)中ρ是權(quán)重。
任意兩個(gè)GMM之間的KL距離可表示為:
式(6)中F表示前景,B表示背景,gFk表示第個(gè)k高斯函數(shù),和gBi表示第i個(gè)高斯函數(shù)。這兩個(gè)高斯函數(shù)的KL距離可以表示為:
其次選取局部自適應(yīng)正則化參數(shù),設(shè)此參數(shù)為λ。為了避免圖像分割算法在進(jìn)行細(xì)長(zhǎng)邊界分割時(shí)產(chǎn)生Shrinking Bias現(xiàn)象,必須選擇合適的局部自適應(yīng)正則化參數(shù)[6]。文章采用AC系數(shù)計(jì)算像素成為邊緣點(diǎn)的概率,邊緣強(qiáng)度可表示為:
通過(guò)歸一化處理可以計(jì)算出圖像在位置p的邊緣概率:
把較低的λ值分配到圖像的邊緣,這樣就能得到自適應(yīng)的λ取值,通過(guò)式(8)~式(10)可以構(gòu)造出能量函數(shù):
所以光滑項(xiàng)為:
第1步:預(yù)處理,首先提取出原始圖像DCT系數(shù),然后計(jì)算出Cp、Tp和Pbp3個(gè)參數(shù),這樣就能構(gòu)造成DC圖像,并且得到紋理特征和每個(gè)像素點(diǎn)的邊界概率。
第2步:初始化GMM,并計(jì)算兩種特征的權(quán)重系數(shù)。
第3步:迭代估計(jì)GMM參數(shù)[7]。
第4步:最后一次分割,輸出結(jié)果圖像,因?yàn)樵紙D像相應(yīng)的紋理特征與邊緣概率,必須通過(guò)DCT變換得到相應(yīng)的紋理特征與邊緣概率。
實(shí)驗(yàn)平臺(tái)參數(shù)為:WindowsDXP,ProfessionalE-dition,MicrosoftVisualStudio2012,CPU:Inteli520,RAM:8GB。選用兩幅分辨率比較高的JPEG圖像分別使用傳統(tǒng)分割法和基于DCT編碼圖像分割算法進(jìn)行分割,如圖2和圖3所示(兩圖中圖a是用戶交互標(biāo)記圖像,圖b是GrabCut分割法的分割效果,圖c是本文算法分割結(jié)果)。
通過(guò)圖2和圖3可已看出,本算法基本保持了GrabCut分割算法良好的分割效果,同時(shí)和GrabCut的分割算法相比,使用基于DCT編碼圖像分割算法對(duì)圖像進(jìn)行分割時(shí)還有兩個(gè)主要的優(yōu)點(diǎn),一是對(duì)紋理的分割效果很好,比如圖2中斑馬的條紋和腿部;二是物體的細(xì)長(zhǎng)型邊界分割很好,比如圖3中細(xì)長(zhǎng)觸須。
圖2 1152×720圖像
圖3 1024×768圖像
使用基于DCT編碼圖像分割算法對(duì)圖像分割的耗時(shí)主要由圖像提取DCT系數(shù)進(jìn)行預(yù)處理耗時(shí)和圖像分割耗時(shí)兩部分耗時(shí)組成。GrabCut分割法和基于DCT編碼圖像分割算法耗時(shí)對(duì)比如表1所示。
同過(guò)表1可以看出基于DCT編碼圖像分割算法耗時(shí)只有GrabCut分割法的百分之五十左右(耗時(shí)比=GrabCut分割法耗時(shí)/基于DCT編碼圖像分割算法耗時(shí))。不但算法精度大大提高,而且算法效率也大大增加。
表1 GrabCut分割法和基于DCT編碼圖像分割算法耗時(shí)對(duì)比
傳統(tǒng)圖像分割法的缺點(diǎn)是計(jì)算量較大和實(shí)時(shí)分割性能不佳,基于DCT編碼圖像分割算法能很好的解決這些問(wèn)題?;贒CT編碼圖像分割算法基本思想是通過(guò)解碼DC系數(shù)與AC系數(shù)提取顏色與紋理特征,同時(shí)使這兩個(gè)參數(shù)很好的結(jié)合在一起,在提高分割速度的同時(shí)對(duì)紋理圖像和細(xì)長(zhǎng)型邊界的分割能力也大大加強(qiáng)。
[1]王建青,郭敏,徐秋平.結(jié)合小波變換與圖像分割的快速目標(biāo)提?。跩].計(jì)算機(jī)工程與應(yīng)用,2010,46(33):215-217.
[2]PengB,ZhengL,YangJ.IteratedGraphCutsforImageSegmentation[C]//ProceedingsofACCV.Heidelberg,Germany:Springer Press,2009:23-27.
[3]VicenteS,KolmogorovV,RotherC.GraphCutBasedImageSegmentationwithConnectivityPriors[C]//ProceedingsofComputerVision andPatternRecognition.LosAlamitos,USA:IEEEComputerSociety Press,2008:1-8.
[4]張懷柱,向長(zhǎng)波,宋建中,等.基于Fisher準(zhǔn)則的自適應(yīng)遺傳算法在圖像分割中的應(yīng)用[J].電子器件,2007,30(5):661 -664.
[5]黃祥林,沈蘭蓀.基于DCT壓縮域的紋理圖像分類[J].電子與信息學(xué)報(bào),2002,2(2):216-221.
[6]GoldbergerJ,GordonS,GreenspanH.AnEfficientImageSimilarity MeasureBasedonApproximationsofKL-DivergencebetweenTwo GaussianMixtures[C]//ProceedingsofComputerVisionandPatternRecognition.LosAlamitos,USA:IEEEComputerSocietyPress,2004:487-494.
[7]CandemirS,AkgulYS.AdaptiveRegularizationParameterforGraph CutSegmentation[C]//ProceedingsofICIAR.Heidelberg,Germany: SpringerPress,2010:117-126.
[8]劉毅,孫懷江,夏德深.基于圖割的JPEG圖像快速分割算法[J].計(jì)算機(jī)工程,2012,38(10):194-197.
Image Segmentation Based on DCT Coded*
Guljan·kuerban*
(School of electronic and Information Engineering,YILINormal University,Yining Xinjiang 835000,China)
The traditional image segmentation algorithm is not satisfied for its interactive computation and its weak real time performance.A new method was proposed based on DCT codeu image segmentation algorithm.The algorithm is an improved interactive fast segmentation algorithm,DC coefficients and AC coefficients extracted texture features,combined with adaptive regularization parameter structure into an energy function.The test results show that this algorithm not only split a good effect,but also greatly improved the efficiency of the algorithm.
DCT;image segmentation;energy function;improve efficiency
10.3969/j.issn.1005-9490.2014.01.040
TP391.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-9490(2014)01-0168-03
項(xiàng)目來(lái)源:伊犁師范學(xué)院項(xiàng)目(2012YB018)
2013-04-21修改日期:2013-05-26
EEACC:6140C
古麗江·庫(kù)爾班(1973-),女,哈薩克族,新疆伊寧市人,伊犁師范學(xué)院工作,講師,碩士(東北師范大學(xué)),研究方向?yàn)閿?shù)字圖像處理,guljankuerban@163.com。