郭昕
(西安交通大學(xué)電子與信息工程學(xué)院,陜西西安710049)
統(tǒng)計(jì)區(qū)域合并的彩色圖像分割算法*
郭昕
(西安交通大學(xué)電子與信息工程學(xué)院,陜西西安710049)
∶針對(duì)傳統(tǒng)區(qū)域合并算法中存在的分割復(fù)雜度高、分割精度低的問題,提出一種將統(tǒng)計(jì)理論應(yīng)用于區(qū)域合并的彩色圖像分割算法,該算法通過建立圖像生成模型,得到新的合并預(yù)測(cè)準(zhǔn)則,有效地避免合并過程中可能導(dǎo)致的區(qū)域邊界破壞,提高分割精度,降低分割復(fù)雜度。在對(duì)已有算法分析的基礎(chǔ)上,提出基于古典概率理論的圖像生成模型,重點(diǎn)介紹區(qū)域合并思想與統(tǒng)計(jì)理論相結(jié)合的合并預(yù)測(cè)準(zhǔn)則,該準(zhǔn)則是逐步松弛的,確保在無(wú)像素遺漏的同時(shí)分割的精度。算法不但考慮了像素的相似性,還考慮了空間上的鄰接性,因此可以有效消除孤立噪聲的干擾。通過與基于連接圖的系統(tǒng)工程分割方法比較發(fā)現(xiàn),文中算法的運(yùn)算時(shí)間具有明顯優(yōu)勢(shì)。實(shí)驗(yàn)結(jié)果表明,該算法還具有較高的分割精確度和較強(qiáng)的魯棒性,分割尺度可調(diào)。
∶彩色圖像分割;觀測(cè)圖像;統(tǒng)計(jì)區(qū)域;合并預(yù)測(cè)
在科學(xué)研究及應(yīng)用中,人們往往只關(guān)注圖像中的特定部分。這些部分就常被定義為目標(biāo)或者前景。為了對(duì)這些特定部分進(jìn)行分析研究,往往需要將其從整體圖像中分割提取出來[1]。圖像分割,即一種將圖像分成若干個(gè)特定的、具有獨(dú)特性質(zhì)的區(qū)域并提取感興趣目標(biāo)的技術(shù)。提取出的目標(biāo)可以用于圖像語(yǔ)義識(shí)別[1]、圖像搜索等領(lǐng)域[2]。
目前圖像分割法主要有∶基于區(qū)域的分割法,包括區(qū)域生長(zhǎng)法和分裂合并法,其分割過程后續(xù)步驟的處理要根據(jù)前面步驟的結(jié)果進(jìn)行判斷而確定;基于邊緣的分割法,是利用不同區(qū)域間象素灰度不連續(xù)的特點(diǎn)檢測(cè)出區(qū)域間的邊緣,從而實(shí)現(xiàn)圖像分割[3];基于區(qū)域和邊界技術(shù)相結(jié)合的分割法,它是將基于區(qū)域的方法和邊緣檢測(cè)的方法相結(jié)合的圖像分割法;基于特定理論的分割法,包括基于數(shù)學(xué)形態(tài)學(xué)的邊緣檢測(cè)方法、基于模糊集理論的方法、基于小波變換的邊緣檢測(cè)方法和基于神經(jīng)網(wǎng)絡(luò)的分割方法等[4]。
圖像分割算法的研究已有幾十年的歷史,借助各種理論至今已提出了上千種各種類型的分割算法。但由于尚無(wú)通用分割理論,因此沒有一種適合于所有圖像的通用的分割算法。
設(shè)觀測(cè)圖像I有|I|個(gè)像素點(diǎn)(其中符號(hào)|I|代表基數(shù)),每個(gè)像素點(diǎn)包含紅綠藍(lán)(RGB)值,它們都屬于集合{1,2,…,m},實(shí)際中設(shè)m=256.
統(tǒng)計(jì)圖像I*將給定待分割圖像的像素點(diǎn)表示為一系列分布族,I*中任意統(tǒng)計(jì)區(qū)域內(nèi)部具有一致性,即對(duì)于給定色彩通道∈{RGB},任意統(tǒng)計(jì)區(qū)域的像素點(diǎn)均具有相同期望,且在至少一個(gè)色彩通道∈{RGB}內(nèi),相鄰統(tǒng)計(jì)區(qū)域的期望不同。也就是說,統(tǒng)計(jì)圖像I*中的每個(gè)像素在每個(gè)色彩通道,均由一系列N維獨(dú)立隨機(jī)變量(r.v.)代替,區(qū)域邊界取正值g/N,這樣任何N維獨(dú)立隨機(jī)變量(r.v.)總和均屬于{1,2,…,m}。
I是未知的統(tǒng)計(jì)圖像I*的觀測(cè)圖像,是由I*中觀測(cè)RGB色彩通道采樣得到的。圖1給出了一幅統(tǒng)計(jì)圖像I*(由下文算法得到)以及由該統(tǒng)計(jì)圖像生成的觀測(cè)圖像I.
考慮到均一性,統(tǒng)計(jì)區(qū)域之間的邊界是具有不同色彩期望值的連通像素點(diǎn),I的理想分割就是基于統(tǒng)計(jì)區(qū)域I*邊界,如圖1(a)和圖1(b)所示。
需要注意的是,每個(gè)像素的采樣和它的顏色通道應(yīng)該彼此獨(dú)立,這是文中關(guān)于統(tǒng)計(jì)圖像I*的唯一假設(shè)。頻率獨(dú)立同分布假設(shè)并非充分條件,即在統(tǒng)計(jì)區(qū)域內(nèi),只要滿足均一性,對(duì)應(yīng)于每個(gè)像素的所有分布均可有所不同?;谏鲜黾僭O(shè),引入尺度調(diào)節(jié)因子N,使模型更具實(shí)用性。N=1會(huì)使得對(duì)于小區(qū)域的估計(jì)可靠性變差,那么,就要考慮增大圖片尺寸圖像來提高統(tǒng)計(jì)分割的準(zhǔn)確性。參數(shù)N的意義在于量化統(tǒng)計(jì)圖像I*的統(tǒng)計(jì)復(fù)雜度。從實(shí)踐的角度來看,調(diào)節(jié)N值可以控制分割的精細(xì)程度,使得構(gòu)建多尺度分割成為可能。
圖1 統(tǒng)計(jì)圖像及對(duì)應(yīng)的觀測(cè)圖像Fig.1 Statistical image and the corresponding observed image
2.1 合并預(yù)測(cè)
首先陳述合并預(yù)測(cè)的理論基礎(chǔ)。
設(shè)X=(X1,X2,…,Xn)是一組n維獨(dú)立隨機(jī)變量,Xk的值屬于集合Ak,假定實(shí)函數(shù)f滿足|f(x)-f'(x)|≤ck,其中向量x與x'僅在k軸不同。設(shè)μ為f(X)的值,則對(duì)于任何一個(gè)τ≥0,
其中Pr是概率,τ是一個(gè)大于零的常量;Ck為f(x)與其倒數(shù)之差。
由以上定理[5],得到推論∶設(shè)區(qū)域?qū)?R,R')屬于觀測(cè)圖像I,?0<δ≤1有,
其中E(R)是觀測(cè)區(qū)域R中所有統(tǒng)計(jì)像素的期望,ˉR是觀測(cè)區(qū)域R的均值。
綜上,合并預(yù)測(cè)公式為
將上述合并預(yù)測(cè)理論應(yīng)用于彩色圖像(RGB),得到的預(yù)測(cè)公式如下
2.2 合并順序
判定觀測(cè)圖像中任意兩相鄰區(qū)域是否可以合并需要遵循一定的順序[6],為了得到一個(gè)合理的順序,下文提出不變量A.
定義A為在任何兩個(gè)統(tǒng)計(jì)區(qū)域之間進(jìn)行合并預(yù)測(cè)計(jì)算之前,需要完成在這2個(gè)區(qū)域內(nèi)的所有的合并預(yù)測(cè)計(jì)算。
需要注意的是,不變量A并沒有以統(tǒng)計(jì)圖像I*的分割知識(shí)為先驗(yàn)條件。為了說明為何需要滿足不變量A,首先需要明確分割過程中可能遇到的3類分割錯(cuò)誤[7]。第1,針對(duì)于分割結(jié)果太粗(欠分割),在該種情況下,一個(gè)或多個(gè)分割區(qū)域是統(tǒng)計(jì)區(qū)域的子區(qū)域;第2,針對(duì)于分割結(jié)果太細(xì)(過分割),在該種情況下,一些分割區(qū)域包含多個(gè)統(tǒng)計(jì)區(qū)域;第3,針對(duì)一種“混合”情況,在該種情況下,一些分割區(qū)域包含多個(gè)統(tǒng)計(jì)區(qū)域的子區(qū)域。
不變量A可以定量以及定性地控制分割錯(cuò)誤。下文提出的定理用于說明過分割發(fā)生的概率上限。此定理中,定義s*(I)為觀測(cè)圖像I的理想分割區(qū)域集合,s(I)為觀測(cè)圖像I的區(qū)域集合。
當(dāng)概率≥1-O(|I|δ),觀測(cè)圖像I滿足不變量A的分割是統(tǒng)計(jì)圖像I*的過分割。即?0∈s*(I),?R∈s(I)∶O?R.
對(duì)?0<δ<1,且概率≥1-O(|I|δ),
2.3 算法描述
在四連通區(qū)域,存在N<2|I|對(duì)連通像素點(diǎn),設(shè)SI為這些像素對(duì)的集合,f(p,p')是一個(gè)實(shí)函數(shù),其自變量是觀測(cè)圖像I中的p和p'個(gè)像素點(diǎn)。
筆者提出的基于統(tǒng)計(jì)區(qū)域合并的彩色圖像分割算法,首先,將SI中的像素利用函數(shù)f(p,p')進(jìn)行升序排列,然后,單次遍歷這一序列,對(duì)現(xiàn)有排布中?(p,p')∈SI且滿足R(p)≠R(p')的像素對(duì),計(jì)算其P(R(p),r(p')),若結(jié)果為1則合并R (p)與R(p').可見,選擇一個(gè)適當(dāng)?shù)膄(p,p')是至關(guān)重要的。
3.1 算法實(shí)現(xiàn)結(jié)果
由文中提出的圖像生成模型得到的觀測(cè)圖像中,任意劃分區(qū)域的內(nèi)部色彩方差小于區(qū)域之間的色彩方差。因此,先計(jì)算像素間局部梯度[8],再代入函數(shù)f(p,p')計(jì)算每個(gè)通道的最大變化量,即可得到f(p,p')。
對(duì)于fa(p,p'),算法為
采用文中提出的圖像分割算法得到的實(shí)驗(yàn)結(jié)果,需要說明,實(shí)驗(yàn)中采用的圖片是從北京星聯(lián)圖客科技有限公司“微利圖片庫(kù)”購(gòu)買的110張彩色攝影圖片,未經(jīng)任何處理,分辨率均為300 dpi,格式為“.bmp”,尺寸從1 650*2 482到5 120*3 413不等[9]。
基于這一理論,編程實(shí)現(xiàn)算法,圖2(a)、圖2 (b)分別為ipc004.bmp及其分割結(jié)果。
圖2 Ipc004.bmp及其分割結(jié)果Fig.2 Ipc004.bmp and the segmentation result
另外,表1給出在產(chǎn)生相同區(qū)域數(shù)情況下算法與JSEG算法[10]的耗時(shí)對(duì)比。表中的ipc004. bmp,ipc005.bmp,ipc072.bmp分別對(duì)應(yīng)圖2,圖4,圖5中原始圖像。
表1 文中算法與jseg算法的耗時(shí)對(duì)比Tab.1 Time-consum ing of our algorithm and JSEG algorithm s
3.2 算法分割尺度調(diào)節(jié)
圖3(a)從左上到右下依次為N值取256,128,64,32,16,8,4,2,1時(shí)的統(tǒng)計(jì)圖像。圖3(b)為對(duì)應(yīng)的觀測(cè)圖像。
從實(shí)驗(yàn)結(jié)果可以看出,隨著分割尺度N值的不斷增加,劃分得到的區(qū)域越來越小,而它們往往對(duì)應(yīng)于不同尺度下更小的圖像感知區(qū)域。例如,隨著櫻桃圖像被逐漸分割,它的葉脈以及背景中虛化的葉片等細(xì)節(jié)逐漸顯現(xiàn)出來。
圖3 不同尺度下的統(tǒng)計(jì)圖像及對(duì)應(yīng)的觀測(cè)圖像Fig.3 Different scales statistical images and the corresponding observed image
3.3 算法抗噪性分析
圖4展示了圖片庫(kù)中ipc005.bmp加入不同等級(jí)的加性高斯白噪聲[11](awgn)后采用文中提出算法進(jìn)行圖像分割的結(jié)果,其中縱列由左到右依次為原始圖像、統(tǒng)計(jì)圖像、觀測(cè)圖像以及分割結(jié)果,橫列由上到下依次對(duì)應(yīng)退化等級(jí)由小到大。
3個(gè)等級(jí)選取的退化參數(shù)[12]分別為0.004,0. 018,0.036(退化參數(shù)增大,對(duì)應(yīng)的退化程度加重)。實(shí)驗(yàn)中采用δ=1/(6(I)2),N=32.
從實(shí)驗(yàn)結(jié)果可以看出,對(duì)于三個(gè)等級(jí)的失真,文中提出的算法可以得到比較理想的分割結(jié)果,當(dāng)尺度較小時(shí),依然可以實(shí)現(xiàn)有效分割,同時(shí)為了對(duì)比算法的魯棒性,抗噪性能較為顯著。
圖4 Ipc005.bmp及其三個(gè)等級(jí)的加性高斯白噪聲時(shí)得到的分割結(jié)果Fig.4 Ipc005.bmp and the segmentation result of three levels of the additive Gauss white noise
3.4 關(guān)于遮擋的討論
圖5 具有遮擋的ipc072.bmp的分割結(jié)果Fig.5 Segmentation results of ipc072.bmp picture with shielding
文中算法屬于區(qū)域合并的分割方法。在基于區(qū)域的分割方法中,區(qū)域是一系列具有均勻性的像素的集合,通過不斷合并更小的區(qū)域或像素進(jìn)行迭代生長(zhǎng)。這種方法需要事先進(jìn)行決定合并區(qū)域的統(tǒng)計(jì)測(cè)試,隨后進(jìn)行合并預(yù)測(cè),進(jìn)而建立基于局部決策的分割算法。
將古典概率思想應(yīng)用于圖像分組問題,將圖像分割視為基于未知的統(tǒng)計(jì)圖像的觀測(cè)圖像區(qū)域重建,給出了一種全新的圖像生成模型;通過處理由模型生成的觀測(cè)圖像,結(jié)合區(qū)域合并思想以及2個(gè)統(tǒng)計(jì)性質(zhì),提出了區(qū)域合并預(yù)測(cè)準(zhǔn)則;實(shí)現(xiàn)了精確性高、復(fù)雜度低的的彩色圖像分割算法,并與其他算法進(jìn)行比較分析。該算法在實(shí)驗(yàn)中取得了理想的效果,能較好地滿足圖像分割的精確性要求,具有一定的抗噪聲干擾能力,可應(yīng)用于不同尺度的分割。在未來的研究中,將從實(shí)踐應(yīng)用角度對(duì)該算法進(jìn)行更加深入地分析。
References
[1]李繪卓,范勇,唐駿,等.一種非線性變換的雙直方圖紅外線增強(qiáng)方法[J].計(jì)算機(jī)工程與應(yīng)用,2014 (9)∶155-159.
LIHui-zhuo,F(xiàn)AN Yong,TANG Jun,et al.A nonlinear transformation of double histogram infrared enhanced method[J].Computer Engineering and Application,2014(9)∶155-159.
[2]岳改麗,王棟,楊蕊.幾種邊緣檢測(cè)算子在紅外圖像處理方面應(yīng)用研究[J].西安科技大學(xué)學(xué)報(bào),2012,32(4)∶500-504.
YUE Gai-li,WANG Dong,YANG Rui.Application of several edge detection operator in infrared images processing[J].Journal of Xi’an University of Science and Technology,2012,32(4)∶500-504.
[3]邵明,徐向纮.分水嶺變換和統(tǒng)計(jì)區(qū)域合并的圖像分割算法研究[J].中國(guó)計(jì)量學(xué)學(xué)報(bào),2012,12(23)∶373-378.
SHAO Ming,XU Xiang-hong.Image watershed transformation and statistical regionmerging image segmentation algorithm[J].Journal of Chinese Measurement,2012,12 (23)∶373-378.
[4]劉海賓,何希勤,劉向東.基于分水嶺和區(qū)域合并的圖像分割算法[J].計(jì)算機(jī)應(yīng)用研究,2007,3(9)∶158 -170.
LIU Hai-bin,HE Xi-qin,LIU Xiang-dong.Algorithm for image segmentation based on watershed and region merging[J].Application Research of Computers,2007,3 (9)∶158-170.
[5]McDiarmid C,Habib M,McDiarmid C,et al.Probabilisticmethods for algorithmic discretemath[M].Springer-Verlag Berlin and Heidelberg Gmb H&Co.K,1998.
[6]許元飛.基于紋理的圖像檢索算法[J].西安科技大學(xué)學(xué)報(bào),2013,33(4)∶470-474.
XU Yuan-fei.The image retrieval algorithm based on texture[J].Journal of Xi’an University of Science and Technology,2013,33(4)∶470-474.
[7]段娜,劉力政.基于最大間隔符號(hào)特征的車牌字符分割算法[J].西安科技大學(xué)學(xué)報(bào),2014,34(5)∶620 -624.
DUAN Na,LIU Li-zheng.Characteristics segmentation of license plate based on the features ofmaximum interval segmentationmethod[J].Journal of Xi’an University of Science and Technology,2014,34(5)∶620-624.
[8]項(xiàng)德良,粟毅,趙凌君,等.一種基于局部梯度比率特征度量SAR圖像相似性的新方法[J].電子學(xué)報(bào),2014,42(1)∶9-13.
XIANG De-liang,SU Yi,ZHAO Ling-jun,et al.A local gradient ratio featuremeasurement based on SAR image similaritymethod[J].Acta Electronica Sinica,2014,42 (1)∶9-13.
[9]王秀晚.基于眼動(dòng)信號(hào)的混合失真類型圖像質(zhì)量主觀數(shù)據(jù)庫(kù)的建設(shè)研究[D].西安∶西安交通大學(xué),2013.
WANG Xiu-wan.Study on the construction ofmixed eye movement signal distortion type based on image quality subjective database[D].Xi’an∶Xi’an Jiaotong University,2013.
[10]Yining Deng,Manjunath B S.Hyundoo shin,color image segmentation[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1999.
[11]張敏.基于邊緣點(diǎn)位置的圖像質(zhì)量視覺感知模型[D].西安∶西安交通大學(xué),2010.
ZHANG Min.Image quality visual perception model based on the position of edge points[D].Xi’an∶Xi’an Jiaotong University,2010.
[12]張曉光,李蕾蕾,高芳,等.可變碼長(zhǎng)的OFCDM系統(tǒng)及其仿真分析[J].西安科技大學(xué)學(xué)報(bào),2012,32 (2)∶264-268.
ZHANG Xiao-guang,LILei-lei,GAO Fang,et al.Variable code length of OFCDM system and its simulation analysis[J].Journal of Xi’an University of Science and Technology,2012,32(2)∶264-268.
Color image segmentation method of statistical region merging
GUO Xin
(School of Electronic and Information Engineering,Xi’an Jiaotong University,Xi’an 710049,China)
∶Aiming at the traditional region merging segmentation algorithm with the problems of high complexity and low accuracy,an image segmentation method based on statistical region merging is proposed.Through the establishment of image generation model,this paper obtains the new merging prediction criteria which effectively avoids the region boundary damage in the merging process,improves the segmentation accuracy and reduces the segmentation complexity.Based on the analysis of existing algorithm,amodel of image generation is generated using classical probability theory,then themerging prediction criteria as a blend of the region merging and the statistical property is explained in detail.This criteria is gradually relaxed,ensuring segmentation accuracy without pixel omission.This algorithm not only considers the similarity of pixel but also the adjacency space,therefore it can effectively eliminate the interference of isolated noise.By comparison with the Joint Systems Engineering Group Segmentation Method,this algorithm has obvious advantages in computation time.Experimental results show that the algorithm with the adjustable segmentation scale is of high segmentation accuracy and strong robustness.
∶color image segmentation;observed image;statistical region;merging prediction
∶TP 391.4
∶A
00/j.cnki.xakjdxxb.2015.0320
∶1672-9315(2015)03-0392-05
∶2015-02-24責(zé)任編輯∶高佳
∶郭昕(1991-),女,陜西西安人,碩士研究生,E-mail∶56185538@qq.com