李峰,苗奪謙,劉財輝,楊偉
(1.同濟大學 計算機科學與技術系,上海 201804; 2.同濟大學 嵌入式系統(tǒng)與服務計算教育部重點實驗室,上海 201804)
圖像分割是將圖像細分為構成它的子區(qū)域或?qū)ο?,把其中感興趣的對象提取出來的技術和過程。它既是圖像處理中的重要內(nèi)容,又是由圖像處理到圖像分析的關鍵步驟。圖像分割在實際中已得到廣泛的應用,如工業(yè)自動化、文檔圖像處理、生物醫(yī)學圖像分析等方面。
Sezgin等[1]總結了2003年以前的40種經(jīng)典的閾值分割方法,這些方法按照分割時考慮的圖像信息分為6類:直方圖形狀、測試空間聚集度、熵、目標屬性、空間相關性和局部灰度圖。Sankar等[2]將粒計算和粗糙集思想運用于閾值分割,提出了一種基于粒計算和粗糙熵的目標提取方法。該方法主要解決灰度圖像中物體之間的邊界灰度值常常模糊的問題,圖像信息具有較強的空間復雜性、相關性,處理過程中會遇到不完整和不確定性問題。Sankar等[3]還做了進一步的工作,將這種處理方式運用于運動目標檢測。Sankar的方法是單閾值的分割,只是把圖像分割成背景和感興趣的目標區(qū)域,但有時感興趣的目標是多個,所以為了能分割出多目標區(qū)域,Dariusz等[4]提出了自適應多閾值粗糙熵優(yōu)化算法,這樣可以比較靈活地處理一些特殊需求。這2種方法都是在灰度圖像上進行處理,只是一維的,Dariusz等[5]又把處理的維度提升到兩維。Dariusz等[6-7]針對粗糙集與圖像分割的結合,還做了其他一系列工作。
上述的方法雖然解決了圖像分割中模糊性的問題,但忽略了噪聲對處理結果的影響。因為其使用的是Pawlak粗糙集模型,而Pawlak粗糙集模型使用的是絕對集合包含關系,對像素點的灰度值要求較嚴格,不能很好地處理帶噪聲的數(shù)據(jù),所以上述方法都不宜處理帶有噪聲的圖像。而決策粗糙集魯棒性較好,能處理帶噪聲的數(shù)據(jù),于是為了能夠較好地處理帶有噪聲的圖像,本文在文獻[2]的基礎上,結合決策粗糙集,提出一種能較好處理帶噪聲圖像的基于決策粗糙集的圖像分割方法。這里之所以選擇單閾值分割這種簡單情況,是因為方便闡述這種解決帶噪聲圖像的思想,對于多閾值分割情況,可以在單閾值分割基礎上進行擴展。
目前圖像分割的方法主要可以分為以下3類:基于閾值的圖像分割、基于邊緣檢測和連接的圖像分割以及基于區(qū)域的圖像分割。其中基于閾值的圖像分割是一種簡單有效的圖像分割方法,它用一個或幾個閾值T將圖像的灰度級分為幾個部分,認為屬于同一個部分的像素是同一個物體。如對于單閾值的圖像分割,可以有
(1)
式中:g(i,j)為該像素點的所屬部分,1代表目標區(qū)域,0代表背景區(qū)域,f(i,j)是指像素點第i行第j列的灰度值,T為閾值。閾值分割以其實現(xiàn)簡單、計算量小且性能穩(wěn)定的特點,在重視運算效率的應用場合得到了廣泛的應用。但是,圖像分割仍然是一個公認的難題。
粗糙集理論[8]是1982年波蘭科學家Pawlak提出的。給定信息系統(tǒng)S=(U,A,V,f),U為論域,A為屬性集,V為值域,f:U×A→V為信息函數(shù)。設屬性B?A和集合X?U,則可以在屬性B下用集合X的上下近似來近似模擬X。X的下近似和上近似分別定義為:
圖1 集合X的上近似、下近似示意圖Fig.1 The upper and lower approximations of set X
基于X的上、下近似,可以得到論域U的一個劃分,分別定義為X的正域POS(X)、負域NEG(X)和邊界域BND(X):
由此可知,如果x∈POS(X),則x一定屬于X;如果x∈NEG(X),則x一定不屬于X,即屬于X的補集Xc;如果x∈BND(X),則不能判斷x一定屬于或者不屬于X。
由于Pawlak粗糙集模型使用絕對集合包含關系來定義上、下近似,對于帶有噪聲的數(shù)據(jù)不能很好地處理。在文獻[9]中,Wong和Ziarkao將概率近似空間引入到粗糙集的研究中。令Pr(X|[x])表示等價類[x]中元素屬于X的條件概率。那么,可以得到粗糙集的另一種等價表示:
Pr(X|[x])=1?[x]?X
Pr(X|[x])=0?[x]∩X=?
0 則粗糙集中的3個域可以有另一種表示: 這樣,定性粗糙集3個域僅用了概率的2個極端值,即0和1。如果將0和1用其他的值來表示,就可以獲得一種定量粗糙集。 在1990年,Yao等在文獻[10]中提出了一個更一般性的概率粗糙集模型,稱為決策粗糙集模型。該模型用一對概率閾值來定義概率正、負和邊界域。設0≤β≤α≤1,決策粗糙集模型的一個基本結果是(α,β)-概率正、負和邊界域: 同Pawlak的3個域相比,α和β分別取代了概率極值1和0。為了表示集合X在B下的不確定程度,粗糙度R的定義被提出,即: (2) 當粗糙度為0時,X在B下是精確的,即是一個精確集;而當粗糙度大于0時,X在B下是模糊不可辨的,是一個粗糙集。關于粗糙集更多詳細的介紹可以參見文獻[6]。 在圖像分割的過程中,圖像中的所有像素點構成論域U,將一幅圖像劃分成大小為m×n個重疊的塊,每個塊被看成是一個粒G。那么,每個粒中有m×n個像素點。定義粒后,圖像中的目標區(qū)域就可以用粗糙集思想來模擬,即目標區(qū)域的上下近似可以分別看成內(nèi)部含有的最大粒簇和外部包含他的最小粒簇。 本文處理的是二值化灰度圖像,即將圖像分割成目標區(qū)域B和背景區(qū)域O兩部分。假設整幅圖像的灰度級為L,只要找到一個最好的閾值T,就能將圖像分成B(0,1,…,T)和O(T+1,T+2,…,L-1) 2類。這樣就可以得到目標區(qū)域和背景區(qū)域的上、下近似,分別表示為 式中:g(j,k)是粒Gi中像素點調(diào)用式(1)后的結果。因為做的是二值化,圖像中除了目標區(qū)域便是背景區(qū)域,背景也就是目標的補集,每個粒的像素點個數(shù)為mn,那么背景的正域便是目標的負域,因此可得: (3) 可以看出,對于屬于目標(背景)下近似的粒,嚴格要求粒中的所有像素點的灰度值必須大于(小于)閾值T。此類式子對于沒有噪聲的圖像分割效果很好,但是在實際中有一些圖像帶有噪聲,對于這類帶有噪聲(如高斯噪聲)的圖像處理效果卻不盡人意,因為此類圖像幾乎找不到屬于下近似的粒,沒有辦法進行處理。 為了更好地處理帶有噪聲的圖像,因此將決策粗糙集的思想引入到圖像分割中,允許一些噪聲點的存在,這樣定義目標的上下近似時,概率閾值不再是{0,1},而是{1-α,α}(α∈[0.5,1]),于是從式(3)得到新的定義公式: 再根據(jù)式(2)就能得到目標和背景的粗糙度: (4) 式中:|·|表示集合的基,即集合元素的個數(shù)。這里定義圖像的粗糙熵: (5) 文獻[2]中指出,當粗糙熵最大時,取得最優(yōu)的分割閾值T,即T*=argmaxRET。當熵取得最大值時,粗糙度也降到最低,取得最好的分類效果。 假設max_gray和min_gray分別表示圖像中最大的灰度級值和最小的灰度級值。圖像劃分成大小為m×n的粒Gi,粒的總數(shù)用total_num表示 分別表示目標和背景的上、下近似,ROT、RBT則分別表示目標和背景的粗糙度,RET表示粗糙熵。 初始化:置 為空集 1)fori=1 to total_num *對所有的圖像粒Gi進行如下操作*初始化Ni為0 forj=1 tomn *計算該粒中大于閾值T的像素點個數(shù)Ni* if the gray ofj>T Ni=Ni+1 end end ifNi/mn≥α else end ifNi/mn≤1-α else end end 2)forL=min_gray to max_gray *對所有圖像灰度級進行如下操作*在進行運算前先調(diào)用 1) 根據(jù)式(4)分別得到在閾值L下目標和背景的粗糙度ROT(L)和RBT(L)。再根據(jù)式(5)計算出相應的粗糙熵RET(L)。 end 3)當粗糙熵值取得最大時圖像分割閾值取得最優(yōu)值,即: 本文所提出的方法是在文獻[2]的基礎上做出的改進,能很好地處理帶噪聲的圖像,所以為了驗證本文方法的優(yōu)勢,分別用文獻[2]中的方法和本文所提出的方法去處理帶噪聲的圖像,并進行了實驗對比。 要完成圖像分割最優(yōu)閾值的選擇,首先需要的是將圖像劃分成一簇尺寸大小相等的粒,而粒的大小的選取影響著最終分割的效果。這里依據(jù)圖像的灰度直方圖,選取直方圖中各峰值對應的區(qū)域?qū)挾戎凶钚≈档囊话胱鳛榱5拈L和寬[2]。選的太大會出現(xiàn)漏判目標區(qū)域為背景區(qū)域的情況,而選的太小則會把一些不必要的區(qū)域誤判為目標區(qū)域,增加算法復雜度。粒的尺寸變大(變小)會使求出的最佳閾值T減小(增大)。 實驗選取了文獻[2]實驗中的塊圖片(BLOCKS),并對其進行了尺寸變換(變換為512×512和加噪聲(椒鹽噪聲)處理,然后用本文提出的方法和文獻[2]提出的方法分別進行處理,并比較最終的實驗結果,即最后閾值的選擇情況和分割效果。 首先是選擇粒的尺寸,圖片的灰度直方圖如圖2所示,只要選擇峰值對應區(qū)域?qū)挾茸钚≈档囊话胱鳛榱5拈L寬是最合適的。圖2中峰值對應區(qū)域最小的部分為180和220之間,即最小寬度為40,這樣將圖像劃分成20×20的粒群是最合適的。 圖2 灰度直方圖Fig.2 Histogram of the image 圖像劃分完成后,分別按本文前面所提算法和文獻[2]中所提方法進行實驗,這里參數(shù)α取0.05,參數(shù)α的取值是根據(jù)經(jīng)驗和多次實驗迭代而來。實驗結果如圖3所示。 圖3(b)的閾值選擇結果在預期之中,如前面所講,按文獻[2]方法很難讓下近似不為0,導致所求的閾值無意義,根本起不到分類的效果。針對這個問題,實驗還選取了其他一些圖片,同樣進行加噪處理后,得到的閾值結果也為254,所以這個方法處理帶噪聲的圖片是不行的。 而本文的方法則有相對較好的結果,在處理帶噪聲的圖片時,允許粒中部分像素點為噪點,不會影響分割效果。而且在得到二值化的圖像后,再進行去噪,也簡單方便許多。所以在處理帶噪聲的圖片上,本文的方法是比較可行的。 (a)加噪聲原始圖片 (b)T=254[2] (c)本文方法結果(T=104)圖3 實驗結果Fig.3 Experimental results 當前已有的大部分圖像分割方法都是針對不帶噪聲圖像提出的,然而實際生活中的圖像常常是存在噪聲的。為了較好地解決帶噪聲的圖像分割問題,本文利用粗糙集方法模擬圖像的目標和背景區(qū)域,提出了一種基于決策粗糙集的圖像分割方法。實驗結果表明,該方法在處理帶噪聲的圖像分割問題中能夠取得較理想的效果,并簡化了以往處理帶噪聲圖像的過程。在本文提出的方法中,如何進行參數(shù)α選取是一個較困難的問題,接下來的工作是如何尋找一種高效地選取參數(shù)α的方法。 參考文獻: [1]SEZGIN M, SANKUR B. Survey over image thresholding techniques and quantitative performance evaluation[J]. Journal of Electronic Imaging, 2004, 13(1): 146-165. [2]PAL S K, SHANKAR B U, MITRA P. Granular computing, rough entropy and object extraction[J]. Pattern Recognition Letters, 2005, 26(16): 2509-2517. [3]CHAKRABORTY D, SHANKAR B U, PAL S K. Granulation, rough entropy and spatiotemporal moving object detection[J]. Applied Soft Computing, 2013, 13(9): 4001-4009. [8]PAWLAK Z. Rough sets[J]. International Journal of Computer and Information Science, 1982(11): 341-356. [9]WONG S K M, ZIARKO W. Comparison of the probabilistic approximate classification and the fuzzy set model[J]. Fuzzy Sets and Systems, 1987, 21: 357-362. [10]YAO Y Y, WONG S K M, LINGRAS P. A decision-theoretic rough set model[C]//Proceedings of the 5th International Symposium on Methodologies for Intelligent Systems, Knoxville, USA, 1990 : 17-25.2 基于決策粗糙集的圖像分割
2.1 圖像的粗糙集描述
2.2 閾值最優(yōu)選擇算法
3 實驗分析
3.1 粒尺寸的大小選擇
3.2 實驗結果
3.3 結果分析
4 結束語