郭 健,李向陽,哀 薇
(華南理工大學(xué) 自動化科學(xué)與工程學(xué)院,廣州 510641)
?
基于PCA的彩色印刷圖像色彩分割算法
郭 健,李向陽,哀 薇
(華南理工大學(xué) 自動化科學(xué)與工程學(xué)院,廣州 510641)
針對彩色圖像的印刷過程中,原圖像的色彩分割問題,提出了基于PCA(主成分分析)并結(jié)合其它典型彩色圖像分割方法的新分割算法;該算法首先利用PCA算法把圖像分解為主特征分量和殘?zhí)卣鞣至績煞至繄D;然后采用二次分水嶺算法對殘?zhí)卣鞣至繄D進(jìn)行分割;利用K-Means算法對主特征分量圖進(jìn)行聚類初分割,接著對聚類初分割后的圖像進(jìn)行相似色彩區(qū)域融合;最后把分割后的兩分量圖的進(jìn)行融合,得到最終的分割結(jié)果圖;該算法可以應(yīng)用于彩色印刷圖像的色彩自動分割和彩色印刷過程的自動色彩控制中。
色彩分割;主成分分析;分水嶺算法;K均值聚類
在彩色圖像印刷系統(tǒng)中,被印刷圖像(原圖像)的色彩提取和區(qū)域分割是實(shí)現(xiàn)自動彩色油墨配置和色彩濃度控制的前提。印刷圖像中包含有豐富的色彩和輪廓及紋理特征,各種色彩的區(qū)域面積不均衡,需要避免因區(qū)域面積不均衡而造成紋理區(qū)域被更大區(qū)域“吞并”現(xiàn)象;同時(shí),通過成像設(shè)備獲取圖像不可避免含有噪聲,分割算法必須對噪聲有很好的濾除能力。典型的圖像分割算法各有優(yōu)缺點(diǎn),單獨(dú)使用并不能適合印刷圖像分割。例如,K-Means算法存在易受噪聲和孤立點(diǎn)影響的問題;分水嶺算法對圖像的梯度變化很敏感,可以用于色彩漸進(jìn)過渡的印刷圖像分割,但是容易造成過分割;基于圖論的分割算法,由于需要人工參與確定前景和背景,不滿足自動分割的要求;基于區(qū)域生長和區(qū)域分裂合并的分割算法也存在需要人工確定種子點(diǎn)的缺陷。
為了綜合利用現(xiàn)有典型算法的優(yōu)點(diǎn),本文應(yīng)用主成分分析(principal component analysis,PCA)算法對原圖像進(jìn)行主成份分解,然后針對分解后的圖像應(yīng)用典型的圖像分割算法,最后把分割后的不同成份圖像分量進(jìn)行融合,從而實(shí)現(xiàn)對原圖像的分割。
假設(shè)數(shù)據(jù)集在維空間中有個(gè)樣本,PCA的核心思想是利用K-L變換對數(shù)據(jù)集的階協(xié)方差矩陣進(jìn)行正交特征分解,求出協(xié)方差矩陣的n個(gè)特征值;接著求出矩陣的n個(gè)特征向量,這n個(gè)特征向量構(gòu)成了n維空間的標(biāo)準(zhǔn)正交基;然后將數(shù)據(jù)集投影到這n個(gè)標(biāo)準(zhǔn)正交基上。特征值的模代表數(shù)據(jù)集在每個(gè)基上的的投影長度;特征值越大,說明數(shù)據(jù)集在對應(yīng)特征向量上的方差越大,信息量越多。前個(gè)最大特征值對應(yīng)的投影分量包含了主要特征,而最小特征值上對應(yīng)的投影信息量很小,主要包含了細(xì)節(jié)特征。對一幅有M個(gè)像素點(diǎn)的彩色圖像而言,每個(gè)像素點(diǎn)都可以看作是一個(gè)3維向量,X=[x1,x2,x3]如果在RGB色彩空間中,則x1,x2,x3分別代表圖像的3個(gè)顏色分量R、G、B。對圖像做K-L變換的基本思想是通過求分量x1,x2,x3間的協(xié)方差矩陣Cx=[cov(xi,xj)]的特征值及特征向量ui。用特征向量ui組成正交矩陣Φ=[u1,u2,u3]T作為變換矩陣,將[x1,x2,x3]變換到正交系[y1,y2,y3]。
對印刷圖像做K-L變換的步驟如下:
Step 1:對M個(gè)像素點(diǎn)的X=[x1,x2,x3]計(jì)算各分量的均值
(1)
然后對每個(gè)像素點(diǎn)求xi-uxi(i=1,2,3),這等價(jià)于將[x1,x2,x3]的原點(diǎn)移至像素點(diǎn)中心。
Step 2:計(jì)算協(xié)方差矩陣
E[(xi-Exi)(xj-Exj)T]=
(2)
Step 3:根據(jù)|λI-Cx|計(jì)算協(xié)方差陣Cx的特征值并降序排列為λ1>λ2>λ3和對應(yīng)的特征向量u1,u2,u3。將特征向量ui作為行向量構(gòu)成正交變換矩陣Φ=[u1,u2,u3]T。
Step 4:通過y=Φ·x將像素點(diǎn)投影到特征向量上[u1,u2,u3],求出y=[y1,y2,y3]。
經(jīng)過上述變換后,圖像的協(xié)方差矩陣Cx變?yōu)閷顷嚕瑈1,y2,y3之間相互獨(dú)立,K-L變換去除了分量間的相關(guān)性。對圖1(a)的原圖像做K-L變換,得到正交系[y1,y2,y3]的分布如圖2所示。
圖1 PCA分解后的成分圖
圖2 K-L變換
從圖2可以看出,在y1和y2上的投影包含了圖像主要特征,而在y3上的投影包含圖像的紋理特征,圖1的(b)、(c)和(d)為根據(jù)PCA算法在y1,y2和y3上的投影后的第1成分圖、第2成分圖和第3成分圖。為了后續(xù)敘述方便,把較大特征值的投影圖稱為主特征分量圖,在圖2中是第1成分圖和第2成分圖;最小特征值的投影圖稱為殘?zhí)卣鞣至繄D,在圖2中是第3成分圖。分別對主特征分量圖和殘?zhí)卣鞣至繄D采用不同的分割算法,首先對殘?zhí)卣鞣至繄D進(jìn)行分割,然后對剔除殘?zhí)卣鞣至繄D后的主特征分量圖進(jìn)行分割,最后融合兩部分分割結(jié)果。
由圖1(d)可以看到,在殘?zhí)卣鞣至繄D中,紋理特征具有較大的投影值,而其他點(diǎn)則相對較暗。因此只需對殘?zhí)卣鞣至繄D進(jìn)行合適的閾值分割就可以獲得圖像絕大部分的紋理特征,采用最大類間方差算法(OTSU),并自適應(yīng)地確定閾值可以實(shí)現(xiàn)第3分量圖的二值化,從而提取出圖像的重要紋理特征。
OTSU算法把圖像閾值化為只包含前景和背景的一幅二值圖像。其核心思想是選取最佳閾值使得前景和背景的類間方差最大,類內(nèi)方差最小。對第3成分圖二值化后的結(jié)果如圖3所示。
圖3 閾值化圖
最終所得到的二值圖包含了圖像主要的紋理特征。由以上結(jié)果可以看出,圖中紋理特征豐富的區(qū)域(如臉部)最后被分割出來。
經(jīng)PCA分解后的殘?zhí)卣鞣至繄D包含豐富的紋理特征,圖像中的梯度變化較大,分割算法必須對圖像中的梯度變化有良好的響應(yīng),分水嶺算法能較好地適應(yīng)具有該圖像特征的圖像分割。分水嶺算法是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割算法,模擬了集水盆中漫水筑壩的過程,較經(jīng)典的實(shí)現(xiàn)是Luc Vincent和 Pierre Soille提出的基于梯度圖的分割,其基本思想是對彩色圖像先求其梯度圖,然后對梯度圖進(jìn)行漫水筑壩。針對分水嶺算法對圖像存在過分割情況,本文提出了二次分水嶺分割算法。在初次分水嶺分割圖的基礎(chǔ)上,對分割后的梯度圖做形態(tài)學(xué)閉開平滑,然后再進(jìn)行第二次分水嶺分割,最后對二次分水嶺的結(jié)果進(jìn)行適當(dāng)?shù)男^(qū)域合并,該方法較好地解決了過分割的問題,結(jié)果如圖4所示。
圖4 殘?zhí)卣鞣至糠指顖D
圖1中的第1成分圖和第2成分圖是經(jīng)過PCA分解后的原圖像的主特征分量,對于原圖像的主特征分量圖,首先利用K-Means聚類分割算法對主特征分量圖的進(jìn)行初分割。由于實(shí)際印刷過程中圖像可印刷的色彩種類有限,K-Means算中的值取為實(shí)際印刷色彩上限。若原圖像的實(shí)際色彩種類大于上限,則表明該彩色印刷機(jī)不能完成原圖像的印刷任務(wù),需要更換可印色彩更多的印刷機(jī)或者采用在同一印刷機(jī)上進(jìn)行多次印刷。若圖像實(shí)際色彩種類小于上限,則經(jīng)過初分割之后,圖像中可能還存在色彩相近的區(qū)域,因此還需要進(jìn)行相似顏色區(qū)域的融合。
K-Means的基本原理是隨機(jī)選取圖像中的個(gè)點(diǎn)作為初始聚類中心點(diǎn),而后迭代求取圖像中最優(yōu)聚類中心和最優(yōu)分類,使得(3)式定義的誤差平方和準(zhǔn)則函數(shù)值最小。
(3)
其中,Mj是屬于類Cj的所有點(diǎn)的均值,xi是屬于類Cj的點(diǎn)。K-Means算法的計(jì)算過程如下:
Step 1:給定包含n個(gè)點(diǎn)的圖像,隨機(jī)選取K個(gè)初始聚類中心Z(I)=(z1,z2,…,zk),j=1,2,3,…,k,其中I是迭代次數(shù)標(biāo)志,初始化為1;
Step 2:計(jì)算每個(gè)點(diǎn)到聚類中心距離d(xi,Z(I)),如果d(xi,zj)≤min{d(xi,Z(I))},則xizj;
Step 3:計(jì)算誤差平方和準(zhǔn)則函數(shù)Jc:
(4)
上述過程結(jié)束后,圖像的初分割已經(jīng)完成,然后檢查如色彩相似性,對于極相似的色彩要進(jìn)一步色彩合并和融合。對于初分割形成的區(qū)域,本文采用色彩的歐式距離度量作為區(qū)域融合的度量標(biāo)準(zhǔn),實(shí)現(xiàn)區(qū)域融合的具體步驟如下。
Step 1:取初分割圖像的一個(gè)區(qū)域xi做為第一個(gè)類簇Cm|m=1;
Step 2:計(jì)算下一個(gè)區(qū)域xi+1到所有類簇Cj(1≤j≤m)間的歐式距離d(xi+1,Cj),并取得最小值d(xi+1,Ck)=min1≤j≤md(xi+1,Cj),若d<θ,則Ck={xi,xi+1},并且更新Ck為所有成員的均值;否則新建類簇Cm+1={xi+1};
Step 3:重復(fù)2直到所有區(qū)域迭代完畢。
區(qū)域融合過程中的相似性度量閾值根據(jù)經(jīng)驗(yàn)取為θ=50,上述過程的分割效果圖如圖5所示。
圖5 主特征分量分割圖
經(jīng)過主特征分量圖和殘?zhí)卣鞣至繄D的分割后,把主特征分量的分割圖和殘?zhí)卣鞣至康姆指顖D再融合得到圖像的最終分割圖,如圖6所示,共分割成7種不同顏色,用于配置印刷機(jī)的油墨色彩和生成印刷圖案。
對于圖1(a)的原圖像,實(shí)驗(yàn)對比了本文算法與SLIC算法、傳統(tǒng)K-Means算法、分水嶺分割算法,圖7分別給出了它們的色彩分割結(jié)果圖。
圖7 分割對比圖
從圖7可以看出,SLIC算法分割效果不理想,不符合人眼的視覺分割效果;K-Means算法和分水嶺分割算法丟失了圖像的部分特征,分割結(jié)果也不理想,不能應(yīng)用于彩色圖像的印刷控制中。本文提出的算法很好的滿足了印刷圖像色彩分割的需求,明顯優(yōu)于其他分割算法,適合彩色圖像的印刷控制。
針對彩色印刷圖像的色彩分割問題,本文提出了基于PCA的彩色圖像分割算法,該算法能夠結(jié)合了現(xiàn)有典型算法的優(yōu)點(diǎn),實(shí)驗(yàn)結(jié)果表明本算法的圖像分割效果較好地符合人眼的視覺分割效果,能夠很好的適用于印刷圖像的色彩控制。
[1]Chen B, Harrison R, Pan Y. Novel Hybrid Hierarchical-K-means Clustering Method (H-K-means) for Microarray Analysis [A]. Proceedings of the 2005 IEEE Computational Systems Bioinformatics Conference Workshops (CSBW’05).[C]. 2005: 105-108.
[2]Tapas Kanungo, Nathan S. Netanyahu. An Efficient k-Means Clustering Algorithm: Analysis and Implementation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 881-891.
[3]Fan J P. Automatic Image Segmentation by Integrating Color-Edge Extraction and Seeded Region Growing [J]. IEEE Transactions on Image Processing, 2001, 10(10): 1454-1466.
[4]吳夙慧.K-Means算法研究綜述[J].知識組織與知識管理,2011,205(5):25-35.
[5]孫吉貴.聚類算法研究[J].軟件學(xué)報(bào),2008,19(1):48-61.
[6]林開顏.彩色圖像分割方法綜述[J].中國圖像圖形學(xué)報(bào),2005,10(1):1-10.
[7]何 俊.圖像分割算法研究綜述[J].計(jì)算機(jī)工程與科學(xué),2009,31(12):58-61.
[8]張武強(qiáng),穆瑞輝.基于模糊K均值和節(jié)點(diǎn)位置的負(fù)載均衡傳感網(wǎng)路由策略[J].科學(xué)技術(shù)與工程,2013(1):912-916.
[9]柯尊海,劉 勇,徐義春,等.基于改進(jìn)K均值的運(yùn)動目標(biāo)檢測算法研究[J].三峽大學(xué)學(xué)報(bào):自然科學(xué)版,2012,24(6):98-102.
[10]張 靖,段 富.優(yōu)化初始聚類中心的改進(jìn)K-Means算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34(5):1691-1694.
[11]任 磊,賴惠成,陳欽政,等.基于改進(jìn)K均值聚類與HSV模型的棉花分割算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34(5):1772-1776.
[12]王雪光,陳淑紅.基于K均值聚類的成熟草莓圖像分割算法[J].農(nóng)機(jī)化研究,2013,35(6):51-54.
[13]王聯(lián)國,韓曉慧,宋 磊.基于改進(jìn)混合蛙-K均值聚類算法的無功電壓控制分區(qū)[J].傳感器與微系統(tǒng),2013,32(6):18-21.
Color Segmentation of Color Printing Image Algorithm based on PCA
Guo Jian, Li Xiangyang, Ai Wei
(School of Automation Science and Engineering, South China University of Technology, Guangzhou 510641, China)
To solve the color image segmentation problem in the color image printing process, a new segmentation algorithm is proposed based on PCA and combined with other typical image segmentation algorithms. According to the proposed algorithm, firstly PCA is used to decompose the original image into two parts; secondly, the K-Means algorithm is used to divide the primal part of image and then twice-watershed algorithm is used to divide the remnant part of image; finally, the segmented images are got by merging the two kinds of segmentation images. This proposed algorithm can be applied to color printing image segmentation and automatic color printing control during the process of color image printing.
color segmentation; PCA; watershed; algorithim; k-means clustering
2015-09-15;
2015-11-11。
郭 健(1990-),男,碩士研究生,主要從事圖像處理和印刷控制系統(tǒng)方向的研究。
李向陽(1969-),男,副教授,主要從事學(xué)習(xí)控制和嵌入式系統(tǒng)方向的研究。
1671-4598(2016)03-0211-03
10.16526/j.cnki.11-4762/tp.2016.03.057
TP391
A
哀 薇(1979-),女,副教授,主要從事數(shù)據(jù)驅(qū)動控制方向的研究。