蔣宜勤,周基賢,馮俊羲,滕奇志
(1.新疆油田分公司實(shí)驗(yàn)檢測(cè)研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)
?
DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用
蔣宜勤1,周基賢1,馮俊羲2,滕奇志2
(1.新疆油田分公司實(shí)驗(yàn)檢測(cè)研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)
在巖石薄片圖像處理中,針對(duì)巖屑礦物個(gè)數(shù)未知、成像多為聚集的點(diǎn)狀的特點(diǎn),提出了一種基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法與數(shù)學(xué)形態(tài)學(xué)的礦物分割方法。首先,標(biāo)記出每個(gè)顆粒目標(biāo),求得其中心坐標(biāo);其次,利用DBSCAN算法對(duì)巖屑顆粒目標(biāo)中心進(jìn)行聚類,將不同區(qū)域的巖屑目標(biāo)分離出來(lái);最后,利用數(shù)學(xué)形態(tài)學(xué)方法對(duì)聚類結(jié)果做膨脹、填孔、腐蝕等處理,得到顆粒的邊界。實(shí)驗(yàn)分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,對(duì)巖屑顆粒目標(biāo)的提取有較好的效果。
DBSCAN聚類;圖像分割;巖石薄片圖像;數(shù)學(xué)形態(tài)學(xué)
引用格式:蔣宜勤,周基賢,馮俊羲,等. DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用[J].微型機(jī)與應(yīng)用,2016,35(17):39-41,48.
利用巖石薄片圖像進(jìn)行巖石顆粒的粒度分析是地質(zhì)實(shí)驗(yàn)室的一種常用方法,而巖石顆粒的分割是粒度分析和礦物識(shí)別的前提。根據(jù)顆粒的光學(xué)性質(zhì)和礦物成分,可以分為以下兩類:
(1)碎屑顆粒。該類顆粒成分較為單一,在正交偏光下,明暗變化比較一致,通常呈現(xiàn)整體地變亮變暗。其特點(diǎn)是顆粒目標(biāo)面積較大,邊界清晰,容易確定。隨著圖像處理技術(shù)的發(fā)展,目前已經(jīng)有一些典型顆粒分割方法應(yīng)用在碎屑顆粒分割上,取得了較好的效果,已經(jīng)在一定程度上解決了分割的問(wèn)題。
(2)巖屑顆粒。該類顆粒成分較為復(fù)雜,在正交偏光下明暗變化不一致,通常呈現(xiàn)出點(diǎn)狀。特點(diǎn)是目標(biāo)面積較小,邊界模糊,難以確定。目前有一些學(xué)者提出了超像素分割方法[1],該方法應(yīng)用到巖石薄片圖像的分割上,能夠大致地?cái)M合出顆粒的邊界,但是存在目標(biāo)過(guò)分割及區(qū)域合并易出錯(cuò)的問(wèn)題。
針對(duì)巖屑礦物的光學(xué)特性和成像特點(diǎn),本文提出一種基于算法密度的聚類算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)與數(shù)學(xué)形態(tài)學(xué)的巖屑顆粒分割方法。該方法首先利用顆粒中心代表本身來(lái)簡(jiǎn)化模型,然后利用DBSCAN算法對(duì)目標(biāo)中心進(jìn)行聚類,標(biāo)記出不同的顆粒目標(biāo);最后再結(jié)合改進(jìn)的數(shù)學(xué)形態(tài)學(xué)方法,近似地得到顆粒邊界。實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)顆粒的分割和邊界提取有較好的效果,為顆粒邊界的刻畫(huà)提供了一種有效的途徑。
圖1是一幅巖石薄片樣本的單偏光圖像,其中既包含碎屑顆粒,又包含巖屑顆粒。對(duì)顆粒進(jìn)行分割的目的就是確定其邊界,但是僅通過(guò)這一張單片光圖片是很難對(duì)兩種顆粒進(jìn)行分割的。
碎屑顆粒目標(biāo)成分單一,在正交偏光下成像簡(jiǎn)單,通常為一整個(gè)顆粒,邊界比較容易確定,利用礦物在正交偏光下的這一消光特性[2],目前已有學(xué)者提出了一些分割算法[3],在工程應(yīng)用中取得了較好的效果;而對(duì)于巖屑顆粒而言,在正交偏光下成像復(fù)雜,通常呈現(xiàn)若干聚集的點(diǎn)狀,邊界模糊難以確定,常用的顆粒分割方法沒(méi)有明顯的效果。針對(duì)巖屑顆粒的光學(xué)特性和成像的特點(diǎn),考慮利用聚類的方法來(lái)進(jìn)行分割,再結(jié)合數(shù)學(xué)形態(tài)學(xué)做后期處理,就可以擬合出目標(biāo)邊界。
1.1聚類算法分類
目前的聚類算法大致可以分為以下4種:(1)基于分割的算法,如k-均值[4]、k-中心等。這類算法是將數(shù)據(jù)集分成若干的子集。特點(diǎn)是需要設(shè)定簇的數(shù)量,根據(jù)對(duì)象間的相似程度將每個(gè)對(duì)象劃歸最近的簇。(2)層次聚類算法。層次聚類是把數(shù)據(jù)按層次進(jìn)行分解,最終的結(jié)果形成了一顆類別樹(shù),每個(gè)子集是樹(shù)的節(jié)點(diǎn)。算法有最近鄰、最遠(yuǎn)鄰和CURE等。(3)基于模型的算法。這類算法基于統(tǒng)計(jì)理論,假定給定的數(shù)據(jù)集是按照一個(gè)確定的模型產(chǎn)生的,找出數(shù)據(jù)集的最佳擬合模型。如期望最大化(EM)[5]算法。(4)基于密度的算法。主要思路是在數(shù)據(jù)集中,根據(jù)密度的高低,分隔出低密度區(qū)域,尋找到高密度區(qū)域,并將每個(gè)獨(dú)立的高密度區(qū)域作為一個(gè)簇。比較典型的算法有DBSCAN[6]、OPTICS[7]等。
1.2基于密度的聚類算法特點(diǎn)
基于密度的聚類方法,是根據(jù)數(shù)據(jù)集在空間分布上的密集程度來(lái)進(jìn)行聚類,不需要人為設(shè)定簇的數(shù)量,非常適用于數(shù)據(jù)集的簇?cái)?shù)量未知的場(chǎng)合。本文所使用的DBSCAN算法是一種經(jīng)典的基于密度聚類算法,它以單位超球狀區(qū)域內(nèi)所包含數(shù)據(jù)對(duì)象的數(shù)量作為依據(jù),來(lái)衡量此區(qū)域密度的高低[8],它的特點(diǎn)是可以自動(dòng)確定簇的數(shù)量,能夠在帶有噪聲的數(shù)據(jù)空間中發(fā)現(xiàn)任意形狀的簇,并且可以標(biāo)記出離群點(diǎn)。
2.1DBSCAN算法基本理論
DBSCAN算法最早由ESTER M[6]等人提出,是一種經(jīng)典的基于密度聚類算法,已經(jīng)在交通監(jiān)控[9]、數(shù)據(jù)挖掘等方面有著廣泛的應(yīng)用。DBSCAN算法的主要定義[6,8]如下:
定義1(Eps鄰域):給定一個(gè)數(shù)據(jù)對(duì)象p,p的Eps鄰域NEps定義為以p為核心,以Eps為半徑的d維超球體區(qū)域,即:
NEps(p)={q∈D|dist(p,q)≤Eps}
定義2(核心點(diǎn)與邊界點(diǎn)):對(duì)于某個(gè)數(shù)據(jù)對(duì)象p∈D,給定一個(gè)整數(shù)minPts,若p的Eps鄰域內(nèi)對(duì)象的數(shù)量滿足|NEps(p)|≥minPts條件,則稱p為(Eps,minPts)條件下的核心點(diǎn);若p不滿足此條件,則它不是核心點(diǎn),又若p落在某個(gè)核心點(diǎn)的Eps鄰域內(nèi),則稱它為邊界點(diǎn)。
定義3(直接密度可達(dá)):給定(Eps,minPts),如果對(duì)象p和q滿足以下兩個(gè)條件:p∈NEps(q);|NEps(q)|≥minPts,(即q是核心點(diǎn)),則稱對(duì)象p是從對(duì)象q出發(fā),直接密度可達(dá)的。
定義4(直接密度可達(dá)):給定一個(gè)數(shù)據(jù)集D,當(dāng)存在一個(gè)對(duì)象鏈p1,p2,p3,...,pn,其中p1=q,pn=p對(duì)于pi∈D,如果在條件(Eps,minPts)下pi+1從pi直接密度可達(dá),則稱對(duì)象p從對(duì)象q在條件(Eps,minPts)下密度可達(dá)。
定義5(密度相連):如果數(shù)據(jù)集D中存在一個(gè)對(duì)象o,使得對(duì)象p和q是從o在(Eps,minPts)條件下密度可達(dá)的,那么就稱對(duì)象p和q密度相連,密度相連是對(duì)稱的。
定義6(簇和噪聲):由任意一個(gè)核心點(diǎn)對(duì)象開(kāi)始,從該對(duì)象密度可達(dá)的所有對(duì)象構(gòu)成一個(gè)簇。不屬于任何簇的對(duì)象為噪聲。
在巖石薄片圖像中,巖屑顆粒目標(biāo)就是呈現(xiàn)的聚集的點(diǎn)狀。而噪聲分布是雜亂無(wú)章的,聚集程度較低,與巖屑顆粒目標(biāo)的分布有著差別。在工程中,無(wú)法獲得顆粒數(shù)量等先驗(yàn)知識(shí),而DBSCAN算法在目標(biāo)簇的數(shù)量未知的情況下,可以尋找到任意形狀的簇。因此,DBSCAN算法很適合這種場(chǎng)景下的應(yīng)用。
2.2巖屑顆粒分割及邊界提取步驟
實(shí)際中本文得到的是一幅復(fù)雜多樣的圖片,首先要進(jìn)行面積預(yù)處理,然后為了簡(jiǎn)化模型,利用目標(biāo)中心來(lái)代表本身,進(jìn)一步需要聚類、去噪、數(shù)學(xué)形態(tài)學(xué)處理等過(guò)程,最終才能得到分割的結(jié)果。
在本文中,分割的結(jié)果是多值的,傳統(tǒng)二值圖像的形態(tài)學(xué)處理是不適用的,需要做一些改進(jìn),如對(duì)目標(biāo)進(jìn)行膨脹,邊界的顏色需要與當(dāng)前處理的目標(biāo)顏色一致。
在實(shí)際中,巖石薄片圖像里既有大面積的碎屑顆粒目標(biāo),也有小面積、呈現(xiàn)出聚集點(diǎn)狀的巖屑顆粒目標(biāo),如圖2所示。提取巖屑顆粒目標(biāo)需要以下幾個(gè)步驟:
圖2 含有碎屑、巖屑、噪聲的一幅圖片
(1)利用兩種顆粒面積大小不同的特點(diǎn),通過(guò)設(shè)定面積閾值,提取出巖屑顆粒目標(biāo),對(duì)其進(jìn)行單獨(dú)處理;
(2)標(biāo)記出每個(gè)連通區(qū)域,并求出其中心坐標(biāo);
(3)運(yùn)用DBSCAN算法對(duì)各區(qū)域進(jìn)行聚類,標(biāo)記出不同的巖屑顆粒和噪聲點(diǎn);
(4)去除噪聲點(diǎn)并進(jìn)行膨脹、填孔等數(shù)學(xué)形態(tài)學(xué)的處理,得到巖屑顆粒的邊界。
對(duì)于實(shí)際中的一幅圖片,如圖2所示,先進(jìn)行面積的預(yù)處理,去除大面積的碎屑顆粒目標(biāo),便得到了含有噪聲的巖屑顆粒目標(biāo),如圖3所示。首先標(biāo)記出每個(gè)連通區(qū)域并求得其中心坐標(biāo);其次運(yùn)用DBSCAN算法對(duì)顆粒中心進(jìn)行聚類,提取出巖屑顆粒目標(biāo),并標(biāo)識(shí)出噪聲點(diǎn),其中灰色的為巖屑顆粒目標(biāo),純白色的為噪聲點(diǎn),結(jié)果如圖4所示。去除噪聲并對(duì)巖屑顆粒進(jìn)行膨脹,得到的結(jié)果如圖5所示。對(duì)膨脹結(jié)果進(jìn)行填孔、腐蝕處理得到最終的結(jié)果,如圖6所示。
圖3 提取巖屑顆粒目標(biāo)
圖4 DBSCAN聚類效果(純白色目標(biāo)為噪聲)
圖5 去除噪聲并進(jìn)行膨脹結(jié)果圖
圖6 填孔和腐蝕結(jié)果圖
對(duì)比圖3和圖4可以看出,DBSCAN算法可以有效地去除噪聲點(diǎn),能夠提取出巖屑顆粒,具有較好的抗噪性能。得到了巖屑顆粒目標(biāo)后,由于它們是呈散點(diǎn)狀的,還需要通過(guò)膨脹和后期的填孔處理。從圖5可以看出,膨脹后在顆粒邊界周圍,存在著一些小面積目標(biāo),這些目標(biāo)是孤立的,并不影響顆粒的總體輪廓,所以可以去除它們。從總體上看,經(jīng)過(guò)多次膨脹,目標(biāo)面積增大了,需要進(jìn)行適當(dāng)?shù)母g或開(kāi)操作的處理,圖6表示了巖屑顆粒目標(biāo)邊界提取的最終結(jié)果。可以看出,本文算法能夠近似模擬出巖屑顆粒邊界,對(duì)巖屑顆粒邊界的刻畫(huà)有一定的效果。
基于DBSCAN算法和數(shù)學(xué)形態(tài)學(xué)的巖石薄片圖像分割方法,首先經(jīng)過(guò)面積預(yù)處理,去除碎屑顆粒目標(biāo),保留巖屑顆粒目標(biāo);然后利用DBSCAN算法對(duì)含有噪聲的巖屑顆粒中心坐標(biāo)進(jìn)行聚類,從而去除大部分的噪聲點(diǎn);再對(duì)結(jié)果進(jìn)行改進(jìn)的膨脹、填孔、腐蝕等形態(tài)學(xué)處理,最終得到分割結(jié)果和顆粒目標(biāo)的邊界。
實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)巖屑顆粒的分割與邊界提取有一定的效果,為顆粒目標(biāo)提取和粒度分析提供了一種途徑。但該方法也存在著一些不足,如經(jīng)過(guò)數(shù)學(xué)形態(tài)學(xué)處理的結(jié)果邊緣不夠平滑;DBSCAN算法需要人為設(shè)定經(jīng)驗(yàn)性的參數(shù),目前還不能很好地自適應(yīng)。如何根據(jù)實(shí)際中復(fù)雜多樣的情況做出相應(yīng)的改進(jìn),將是需要進(jìn)一步解決的問(wèn)題。
[1] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to state-of-the-art superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274-2282.
[2] 常麗華,陳曼云,金巍,等. 透明礦物薄片鑒定手冊(cè)[M]. 北京:地質(zhì)出版社, 2006.
[3] 吳擁, 蘇桂芬, 滕奇志, 等. 巖石薄片正交偏光圖像的顆粒分割方法[J]. 科學(xué)技術(shù)與工程, 2013,13(31): 9201-9206.
[4] MACQUEEN J. Some methods for classification and analysis of multivariate observations[C].Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1967, 1(14): 281-297.
[5] MOON T K. The expectation-maximization algorithm[J]. Signal Processing Magazine, IEEE, 1996, 13(6): 47-60.
[6] ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD′96).AAAI Press,1996: 226-231.
[7] ANKERST M, BREUNIG M M, KRIEGEL H P, et al. OPTICS: ordering points to identify the clustering structure[C]. In: Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data, SIGMOD 1999:49-60.
[8] 夏魯寧, 荊繼武. SA-DBSCAN: 一種自適應(yīng)基于密度聚類算法[J]. 中國(guó)科學(xué)院研究生院學(xué)報(bào), 2009, 26(4): 530-538.
[9] 劉衛(wèi)寧,曾嬋娟,孫棣華. 基于DBSCAN算法的營(yíng)運(yùn)車輛超速點(diǎn)聚類分析[J]. 計(jì)算機(jī)工程,2009,35(5):268-270.
The application of DBSCAN algorithm and mathematical morphology in rock slice image segmentation
Jiang Yiqin1, Zhou Jixian1, Feng Junxi2, Teng Qizhi2
(1. Institute of Xinjiang Oilfield Detection Petro China, Karamay 834000, China;2. Institute of Image Information, School of Electronics and Information Engineering, Sichuan University, Chengdu 610065, China)
In the processing of rock slice image, according to debris mineral has characteristics of that its number is unknown and its imaging is mostly aggregate points ,this paper presents a method that based on DBSCAN(Density-Based Spatial Clustering of Applications with Noise) and mathematical morphology for mineral segmentation. Firstly, the target of each particle is marked, and the center coordinate is obtained. Secondly, using DBSCAN algorithm to cluster debris targets center, and separating the debris targets in different areas. Finally, the result is processed by dilating, filing hole and corroding by using mathematical morphology so that particle targets’ boundaries are obtained. The experimental results show that the method can achieve good effect with that its parameters are easy to control and it has a good noise immunity in some extent.
DBSCAN clustering; image segmentation; rock slice image; mathematical morphology
TP391.4
ADOI: 10.19358/j.issn.1674- 7720.2016.17.012
2016-04-06)
蔣宜勤(1966-),女,博士,高級(jí)工程師,主要研究方向:沉積儲(chǔ)層研究。
周基賢(1978-),女,碩士,工程師,主要研究方向:沉積儲(chǔ)層研究。
馮俊羲(1992-),男,碩士研究生,主要研究方向,圖像處理與網(wǎng)絡(luò)通信。
滕奇志(1961-),通信作者,女,博士,教授,博士生導(dǎo)師,主要研究方向:圖像處理與模式識(shí)別。E-mail:nic5602@scu.edu.cn。