蔣宜勤,周基賢,馮俊羲,滕奇志
(1.新疆油田分公司實驗檢測研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)
?
DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用
蔣宜勤1,周基賢1,馮俊羲2,滕奇志2
(1.新疆油田分公司實驗檢測研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)
在巖石薄片圖像處理中,針對巖屑礦物個數(shù)未知、成像多為聚集的點狀的特點,提出了一種基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法與數(shù)學(xué)形態(tài)學(xué)的礦物分割方法。首先,標記出每個顆粒目標,求得其中心坐標;其次,利用DBSCAN算法對巖屑顆粒目標中心進行聚類,將不同區(qū)域的巖屑目標分離出來;最后,利用數(shù)學(xué)形態(tài)學(xué)方法對聚類結(jié)果做膨脹、填孔、腐蝕等處理,得到顆粒的邊界。實驗分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,對巖屑顆粒目標的提取有較好的效果。
DBSCAN聚類;圖像分割;巖石薄片圖像;數(shù)學(xué)形態(tài)學(xué)
引用格式:蔣宜勤,周基賢,馮俊羲,等. DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用[J].微型機與應(yīng)用,2016,35(17):39-41,48.
利用巖石薄片圖像進行巖石顆粒的粒度分析是地質(zhì)實驗室的一種常用方法,而巖石顆粒的分割是粒度分析和礦物識別的前提。根據(jù)顆粒的光學(xué)性質(zhì)和礦物成分,可以分為以下兩類:
(1)碎屑顆粒。該類顆粒成分較為單一,在正交偏光下,明暗變化比較一致,通常呈現(xiàn)整體地變亮變暗。其特點是顆粒目標面積較大,邊界清晰,容易確定。隨著圖像處理技術(shù)的發(fā)展,目前已經(jīng)有一些典型顆粒分割方法應(yīng)用在碎屑顆粒分割上,取得了較好的效果,已經(jīng)在一定程度上解決了分割的問題。
(2)巖屑顆粒。該類顆粒成分較為復(fù)雜,在正交偏光下明暗變化不一致,通常呈現(xiàn)出點狀。特點是目標面積較小,邊界模糊,難以確定。目前有一些學(xué)者提出了超像素分割方法[1],該方法應(yīng)用到巖石薄片圖像的分割上,能夠大致地擬合出顆粒的邊界,但是存在目標過分割及區(qū)域合并易出錯的問題。
針對巖屑礦物的光學(xué)特性和成像特點,本文提出一種基于算法密度的聚類算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)與數(shù)學(xué)形態(tài)學(xué)的巖屑顆粒分割方法。該方法首先利用顆粒中心代表本身來簡化模型,然后利用DBSCAN算法對目標中心進行聚類,標記出不同的顆粒目標;最后再結(jié)合改進的數(shù)學(xué)形態(tài)學(xué)方法,近似地得到顆粒邊界。實驗結(jié)果表明,本文方法對顆粒的分割和邊界提取有較好的效果,為顆粒邊界的刻畫提供了一種有效的途徑。
圖1是一幅巖石薄片樣本的單偏光圖像,其中既包含碎屑顆粒,又包含巖屑顆粒。對顆粒進行分割的目的就是確定其邊界,但是僅通過這一張單片光圖片是很難對兩種顆粒進行分割的。
碎屑顆粒目標成分單一,在正交偏光下成像簡單,通常為一整個顆粒,邊界比較容易確定,利用礦物在正交偏光下的這一消光特性[2],目前已有學(xué)者提出了一些分割算法[3],在工程應(yīng)用中取得了較好的效果;而對于巖屑顆粒而言,在正交偏光下成像復(fù)雜,通常呈現(xiàn)若干聚集的點狀,邊界模糊難以確定,常用的顆粒分割方法沒有明顯的效果。針對巖屑顆粒的光學(xué)特性和成像的特點,考慮利用聚類的方法來進行分割,再結(jié)合數(shù)學(xué)形態(tài)學(xué)做后期處理,就可以擬合出目標邊界。
1.1聚類算法分類
目前的聚類算法大致可以分為以下4種:(1)基于分割的算法,如k-均值[4]、k-中心等。這類算法是將數(shù)據(jù)集分成若干的子集。特點是需要設(shè)定簇的數(shù)量,根據(jù)對象間的相似程度將每個對象劃歸最近的簇。(2)層次聚類算法。層次聚類是把數(shù)據(jù)按層次進行分解,最終的結(jié)果形成了一顆類別樹,每個子集是樹的節(jié)點。算法有最近鄰、最遠鄰和CURE等。(3)基于模型的算法。這類算法基于統(tǒng)計理論,假定給定的數(shù)據(jù)集是按照一個確定的模型產(chǎn)生的,找出數(shù)據(jù)集的最佳擬合模型。如期望最大化(EM)[5]算法。(4)基于密度的算法。主要思路是在數(shù)據(jù)集中,根據(jù)密度的高低,分隔出低密度區(qū)域,尋找到高密度區(qū)域,并將每個獨立的高密度區(qū)域作為一個簇。比較典型的算法有DBSCAN[6]、OPTICS[7]等。
1.2基于密度的聚類算法特點
基于密度的聚類方法,是根據(jù)數(shù)據(jù)集在空間分布上的密集程度來進行聚類,不需要人為設(shè)定簇的數(shù)量,非常適用于數(shù)據(jù)集的簇數(shù)量未知的場合。本文所使用的DBSCAN算法是一種經(jīng)典的基于密度聚類算法,它以單位超球狀區(qū)域內(nèi)所包含數(shù)據(jù)對象的數(shù)量作為依據(jù),來衡量此區(qū)域密度的高低[8],它的特點是可以自動確定簇的數(shù)量,能夠在帶有噪聲的數(shù)據(jù)空間中發(fā)現(xiàn)任意形狀的簇,并且可以標記出離群點。
2.1DBSCAN算法基本理論
DBSCAN算法最早由ESTER M[6]等人提出,是一種經(jīng)典的基于密度聚類算法,已經(jīng)在交通監(jiān)控[9]、數(shù)據(jù)挖掘等方面有著廣泛的應(yīng)用。DBSCAN算法的主要定義[6,8]如下:
定義1(Eps鄰域):給定一個數(shù)據(jù)對象p,p的Eps鄰域NEps定義為以p為核心,以Eps為半徑的d維超球體區(qū)域,即:
NEps(p)={q∈D|dist(p,q)≤Eps}
定義2(核心點與邊界點):對于某個數(shù)據(jù)對象p∈D,給定一個整數(shù)minPts,若p的Eps鄰域內(nèi)對象的數(shù)量滿足|NEps(p)|≥minPts條件,則稱p為(Eps,minPts)條件下的核心點;若p不滿足此條件,則它不是核心點,又若p落在某個核心點的Eps鄰域內(nèi),則稱它為邊界點。
定義3(直接密度可達):給定(Eps,minPts),如果對象p和q滿足以下兩個條件:p∈NEps(q);|NEps(q)|≥minPts,(即q是核心點),則稱對象p是從對象q出發(fā),直接密度可達的。
定義4(直接密度可達):給定一個數(shù)據(jù)集D,當(dāng)存在一個對象鏈p1,p2,p3,...,pn,其中p1=q,pn=p對于pi∈D,如果在條件(Eps,minPts)下pi+1從pi直接密度可達,則稱對象p從對象q在條件(Eps,minPts)下密度可達。
定義5(密度相連):如果數(shù)據(jù)集D中存在一個對象o,使得對象p和q是從o在(Eps,minPts)條件下密度可達的,那么就稱對象p和q密度相連,密度相連是對稱的。
定義6(簇和噪聲):由任意一個核心點對象開始,從該對象密度可達的所有對象構(gòu)成一個簇。不屬于任何簇的對象為噪聲。
在巖石薄片圖像中,巖屑顆粒目標就是呈現(xiàn)的聚集的點狀。而噪聲分布是雜亂無章的,聚集程度較低,與巖屑顆粒目標的分布有著差別。在工程中,無法獲得顆粒數(shù)量等先驗知識,而DBSCAN算法在目標簇的數(shù)量未知的情況下,可以尋找到任意形狀的簇。因此,DBSCAN算法很適合這種場景下的應(yīng)用。
2.2巖屑顆粒分割及邊界提取步驟
實際中本文得到的是一幅復(fù)雜多樣的圖片,首先要進行面積預(yù)處理,然后為了簡化模型,利用目標中心來代表本身,進一步需要聚類、去噪、數(shù)學(xué)形態(tài)學(xué)處理等過程,最終才能得到分割的結(jié)果。
在本文中,分割的結(jié)果是多值的,傳統(tǒng)二值圖像的形態(tài)學(xué)處理是不適用的,需要做一些改進,如對目標進行膨脹,邊界的顏色需要與當(dāng)前處理的目標顏色一致。
在實際中,巖石薄片圖像里既有大面積的碎屑顆粒目標,也有小面積、呈現(xiàn)出聚集點狀的巖屑顆粒目標,如圖2所示。提取巖屑顆粒目標需要以下幾個步驟:
圖2 含有碎屑、巖屑、噪聲的一幅圖片
(1)利用兩種顆粒面積大小不同的特點,通過設(shè)定面積閾值,提取出巖屑顆粒目標,對其進行單獨處理;
(2)標記出每個連通區(qū)域,并求出其中心坐標;
(3)運用DBSCAN算法對各區(qū)域進行聚類,標記出不同的巖屑顆粒和噪聲點;
(4)去除噪聲點并進行膨脹、填孔等數(shù)學(xué)形態(tài)學(xué)的處理,得到巖屑顆粒的邊界。
對于實際中的一幅圖片,如圖2所示,先進行面積的預(yù)處理,去除大面積的碎屑顆粒目標,便得到了含有噪聲的巖屑顆粒目標,如圖3所示。首先標記出每個連通區(qū)域并求得其中心坐標;其次運用DBSCAN算法對顆粒中心進行聚類,提取出巖屑顆粒目標,并標識出噪聲點,其中灰色的為巖屑顆粒目標,純白色的為噪聲點,結(jié)果如圖4所示。去除噪聲并對巖屑顆粒進行膨脹,得到的結(jié)果如圖5所示。對膨脹結(jié)果進行填孔、腐蝕處理得到最終的結(jié)果,如圖6所示。
圖3 提取巖屑顆粒目標
圖4 DBSCAN聚類效果(純白色目標為噪聲)
圖5 去除噪聲并進行膨脹結(jié)果圖
圖6 填孔和腐蝕結(jié)果圖
對比圖3和圖4可以看出,DBSCAN算法可以有效地去除噪聲點,能夠提取出巖屑顆粒,具有較好的抗噪性能。得到了巖屑顆粒目標后,由于它們是呈散點狀的,還需要通過膨脹和后期的填孔處理。從圖5可以看出,膨脹后在顆粒邊界周圍,存在著一些小面積目標,這些目標是孤立的,并不影響顆粒的總體輪廓,所以可以去除它們。從總體上看,經(jīng)過多次膨脹,目標面積增大了,需要進行適當(dāng)?shù)母g或開操作的處理,圖6表示了巖屑顆粒目標邊界提取的最終結(jié)果??梢钥闯?,本文算法能夠近似模擬出巖屑顆粒邊界,對巖屑顆粒邊界的刻畫有一定的效果。
基于DBSCAN算法和數(shù)學(xué)形態(tài)學(xué)的巖石薄片圖像分割方法,首先經(jīng)過面積預(yù)處理,去除碎屑顆粒目標,保留巖屑顆粒目標;然后利用DBSCAN算法對含有噪聲的巖屑顆粒中心坐標進行聚類,從而去除大部分的噪聲點;再對結(jié)果進行改進的膨脹、填孔、腐蝕等形態(tài)學(xué)處理,最終得到分割結(jié)果和顆粒目標的邊界。
實驗結(jié)果表明,本文方法對巖屑顆粒的分割與邊界提取有一定的效果,為顆粒目標提取和粒度分析提供了一種途徑。但該方法也存在著一些不足,如經(jīng)過數(shù)學(xué)形態(tài)學(xué)處理的結(jié)果邊緣不夠平滑;DBSCAN算法需要人為設(shè)定經(jīng)驗性的參數(shù),目前還不能很好地自適應(yīng)。如何根據(jù)實際中復(fù)雜多樣的情況做出相應(yīng)的改進,將是需要進一步解決的問題。
[1] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to state-of-the-art superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274-2282.
[2] 常麗華,陳曼云,金巍,等. 透明礦物薄片鑒定手冊[M]. 北京:地質(zhì)出版社, 2006.
[3] 吳擁, 蘇桂芬, 滕奇志, 等. 巖石薄片正交偏光圖像的顆粒分割方法[J]. 科學(xué)技術(shù)與工程, 2013,13(31): 9201-9206.
[4] MACQUEEN J. Some methods for classification and analysis of multivariate observations[C].Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1967, 1(14): 281-297.
[5] MOON T K. The expectation-maximization algorithm[J]. Signal Processing Magazine, IEEE, 1996, 13(6): 47-60.
[6] ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD′96).AAAI Press,1996: 226-231.
[7] ANKERST M, BREUNIG M M, KRIEGEL H P, et al. OPTICS: ordering points to identify the clustering structure[C]. In: Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data, SIGMOD 1999:49-60.
[8] 夏魯寧, 荊繼武. SA-DBSCAN: 一種自適應(yīng)基于密度聚類算法[J]. 中國科學(xué)院研究生院學(xué)報, 2009, 26(4): 530-538.
[9] 劉衛(wèi)寧,曾嬋娟,孫棣華. 基于DBSCAN算法的營運車輛超速點聚類分析[J]. 計算機工程,2009,35(5):268-270.
The application of DBSCAN algorithm and mathematical morphology in rock slice image segmentation
Jiang Yiqin1, Zhou Jixian1, Feng Junxi2, Teng Qizhi2
(1. Institute of Xinjiang Oilfield Detection Petro China, Karamay 834000, China;2. Institute of Image Information, School of Electronics and Information Engineering, Sichuan University, Chengdu 610065, China)
In the processing of rock slice image, according to debris mineral has characteristics of that its number is unknown and its imaging is mostly aggregate points ,this paper presents a method that based on DBSCAN(Density-Based Spatial Clustering of Applications with Noise) and mathematical morphology for mineral segmentation. Firstly, the target of each particle is marked, and the center coordinate is obtained. Secondly, using DBSCAN algorithm to cluster debris targets center, and separating the debris targets in different areas. Finally, the result is processed by dilating, filing hole and corroding by using mathematical morphology so that particle targets’ boundaries are obtained. The experimental results show that the method can achieve good effect with that its parameters are easy to control and it has a good noise immunity in some extent.
DBSCAN clustering; image segmentation; rock slice image; mathematical morphology
TP391.4
ADOI: 10.19358/j.issn.1674- 7720.2016.17.012
2016-04-06)
蔣宜勤(1966-),女,博士,高級工程師,主要研究方向:沉積儲層研究。
周基賢(1978-),女,碩士,工程師,主要研究方向:沉積儲層研究。
馮俊羲(1992-),男,碩士研究生,主要研究方向,圖像處理與網(wǎng)絡(luò)通信。
滕奇志(1961-),通信作者,女,博士,教授,博士生導(dǎo)師,主要研究方向:圖像處理與模式識別。E-mail:nic5602@scu.edu.cn。