劉燁,程國建,馬微,郭超(.西安石油大學 計算機學院,陜西 西安,70065;.西安理工大學 圖書館,陜西 西安,70048;.陜西延長石油(集團)有限責任公司 研究院,陜西 西安,70075)
基于鑄體薄片圖像顏色空間與形態(tài)學梯度的巖石分類
劉燁1,程國建1,馬微2,郭超3
(1.西安石油大學 計算機學院,陜西 西安,710065;
2.西安理工大學 圖書館,陜西 西安,710048;
3.陜西延長石油(集團)有限責任公司 研究院,陜西 西安,710075)
為實現(xiàn)自動高效且結(jié)果可靠的巖石分類,提出一種基于巖石薄片圖像的自動分類方法。該方法通過偏光顯微鏡采集的鑄體薄片圖像,由圖像的原始顏色空間與其形態(tài)學梯度中提取特征參數(shù),統(tǒng)計各圖像矩陣分量的標準算術(shù)值構(gòu)建巖石分類的特征空間,利用支持向量機方法建立特征空間與巖石類別之間的映射關(guān)系。采用鄂爾多斯盆地蘇里格地區(qū)的100幅沉積巖巖石薄片圖像對該方法進行測試。研究結(jié)果表明:該自動分類方法結(jié)果的正確率達95%以上,說明結(jié)合顏色空間與形態(tài)學梯度的高效巖石圖像自動分類方法具有較高的準確性與可靠性。
巖石圖像;分類;顏色空間;形態(tài)學梯度;支持向量機
巖石分類是地質(zhì)學研究中的一項重要工作,將巖心鑄體薄片在顯微鏡下觀測能夠完成這一工作。分類標準與巖石的沉積環(huán)境等地質(zhì)特征相關(guān),其結(jié)果有助于人們對巖石樣品的區(qū)域沉積相以及物性特征等規(guī)律進行研究。通常巖石樣品的鏡下觀察、解釋及分類是一項人工工作,傳統(tǒng)分類方法是基于巖石顆粒的組成、粒徑,膠結(jié)物的組成與膠結(jié)方式以及巖石孔隙形態(tài)結(jié)構(gòu)等進行巖石定名與分類等研究。在這一過程中存在許多復雜問題:耗時費力;巖石樣品的鑒定時間較長、人眼識別存在一定誤差以及不同研究人員的標準不一等都會對分類結(jié)果造成一定誤差影響。而基于計算機技術(shù),使用數(shù)字圖像處理方法可以提取巖石鑄體薄片的圖像特征,通過分析不同巖石類別的圖像特征可以得到巖石分類依據(jù),以此實現(xiàn)巖石圖像的自動分類工作。研究人員可以借此快速分析大量巖石薄片樣品,以此提高工作效率[1]。本文作者針對巖石圖像分類識別工作中存在的問題,提出一種基于圖像處理與人工智能技術(shù)的巖石圖像自動分類方法,并且通過鄂爾多斯盆地蘇里格地區(qū)的真實巖石樣品資料對方法的有效性進行測試。人工智能技術(shù)使得自動化工作迅速發(fā)展,其基于信息技術(shù)給出問題的解決方案,已經(jīng)應用于諸多研究與工業(yè)領(lǐng)域如天文學、行為科學、工業(yè)、環(huán)境、醫(yī)學、農(nóng)業(yè)以及地球物理等。近年來,許多研究者對圖像分類研究進行大量工作,如:徐碩等[2]應用BP神經(jīng)網(wǎng)絡(luò)方法對圖像進行識別與分類;張憲等[3]根據(jù)支持向量機建立顯微圖像分類識別模型。在地質(zhì)學研究中,基于人工智能的巖石圖像分析也隨著圖像智能識別領(lǐng)域高速發(fā)展而廣泛應用。李培軍[4]用變差函數(shù)作為紋理的計算函數(shù)來提取圖像紋理,并與原始的光譜數(shù)據(jù)結(jié)合對巖性進行分類。程國建等[5-6]基于神經(jīng)網(wǎng)絡(luò)與圖像分割實現(xiàn)巖石圖像分類與孔隙自動化識別;葉潤青等[7]根據(jù)巖石圖像的光譜和紋理特征測定礦物含量。MARMO等[1]基于圖像處理和神經(jīng)網(wǎng)絡(luò)方法對碳酸鹽巖進行分類研究。BAYKAN等[8]根據(jù)從火成巖、變質(zhì)巖以及沉積巖的薄片圖像中提取的特征,利用神經(jīng)網(wǎng)絡(luò)實現(xiàn)巖性識別的最小二乘約束,測試結(jié)果的準確性能夠達到81%。M?YNARCZUK等[9]基于圖像處理以及數(shù)學形態(tài)學方法通過激光表面光度儀對巖石進行分類。SINGH等[10]從300個巖石薄片圖像中提取27個參數(shù),建立多層感知神經(jīng)網(wǎng)絡(luò)模型,并用這些參數(shù)對模型進行訓練。選取訓練樣本之外的90個樣本數(shù)據(jù)對該模型進行測試,準確性達到92.22%。GHIASI-FREEZ等[11]構(gòu)建實現(xiàn)對孔隙類別的半自動化識別的模型。ISHIKAWA等[12]提出一個自動化的礦物分類器,用于分析火成巖,其研究表明機器學習特別是人工智能技術(shù)能夠通過準確識別火成巖中的主要礦物從而對巖石組分進行描述。在上述巖石圖像分析方法中,通過特定的圖像特征算法提取巖石圖像特征參數(shù)是核心因素。而相對簡單并且快速的分類方法應滿足各類圖像特征提取的廣泛適用條件。一些研究者對此進行了研究,但其方法仍然存在以下不足:1)自動分類的核心問題在于其可靠性,現(xiàn)有方法的準確性仍然不能滿足實際應用需求;2)目前分類方法的目標主要針對巖石大類的分類問題,實質(zhì)上,在實際應用中,人們更關(guān)心某一具體類型下的次級分類,如沉積巖下的幾種與物性巖性相關(guān)的類型,這些樣品的數(shù)據(jù)量巨大,也應該成為自動分類的主要目標;3)現(xiàn)有方法中所采用的分類器多以神經(jīng)網(wǎng)絡(luò)為主,向量機等模型應用較少。本文作者針對這些問題,提出基于圖像的原始顏色空間并結(jié)合其形態(tài)學梯度特征,統(tǒng)計各圖像矩陣分量的標準算術(shù)值描述巖石圖像的特征空間,通過支持向量機方法構(gòu)建特征空間與巖石圖像類別之間的映射關(guān)系。其中,顏色空間能夠從色彩學角度表示彩色巖石圖像的特征,形態(tài)學梯度可以較好地反映出圖像像素灰度的變化趨勢,有效地獲取巖石微觀結(jié)構(gòu)變化的特征。這2類特征直接從面積以及形態(tài)學2個角度對孔隙進行表征,其結(jié)果直接與巖石物性相關(guān),因而與生產(chǎn)相關(guān)的巖石類型具有較強的相關(guān)性。而統(tǒng)計標準算術(shù)值的優(yōu)點則是能夠避免巖石薄片圖像采集時的不同放大倍數(shù)對分類帶來的影響;此外,支持向量機方法在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出較強的優(yōu)勢與泛化能力。
巖石薄片是從巖石標本的垂直層理方向上切取的一小塊巖片,粘在載玻片上磨制成厚度為0.03 mm的薄片,通常是由經(jīng)驗豐富的巖石學研究人員通過光學顯微鏡進行觀察與鑒定,從而確定巖石樣本的類型與結(jié)構(gòu)參數(shù)[13]。本文中巖石薄片圖像來自鄂爾多斯盆地蘇里格地區(qū),薄片均為鑄體薄片,其中有色膠體為紅色,占據(jù)孔隙空間。從樣本中選擇具有代表性的若干類鑄體薄片圖像,根據(jù)其巖石類型、致密程度和孔隙發(fā)育特點,將巖石薄片圖像分為4種類型(圖1),每種類型巖石的特點分述如下。
1)第1類巖石。巖石膠結(jié)極為致密,類型以灰?guī)r、泥砂巖為主,顆粒細小,分選與磨圓程度均較好,光學顯微鏡下少量孔隙零星分布(見圖1(a))。
2)第2類巖石。巖石膠結(jié)致密,以細—中粒石英砂巖為主,顆粒粒度較小,分選性較差,磨圓為次棱角—棱角狀,顆粒接觸方式為線狀與點狀接觸。粒間孔不發(fā)育,多被泥質(zhì)雜基充填(見圖1(b))。
3)第3類巖石。巖石比較致密,類型以粗粒石英砂巖為主,粒度較大、磨圓和分選程度較好,顆粒接觸方式為線狀與凹凸狀接觸。石英顆粒次生加大,殘余粒間孔少量發(fā)育(見圖1(c))。
圖1 4類巖石薄片圖像(單偏光)Fig.1 Four types rock slice images(single polarization)
4)第4類巖石。巖石較疏松,類型同樣以粗粒石英砂巖為主,巖屑石英砂巖與長石石英砂巖次之;顆粒粒度較大,分選較好,磨圓為次棱角狀,顆粒接觸方式為點狀與線狀接觸。石英顆粒發(fā)生脆性破裂,大量粒間孔發(fā)育(圖1(d))。
這4類巖石反映不同的沉積環(huán)境與水動力條件,其中:第1類巖石代表深水沉積,水動力較弱,如河流相的河漫灘、沼澤與深湖相泥巖等;第2類巖石骨架顆粒搬運距離近,屬三角洲前緣亞相沉積,水動力較強;第3類與第4類巖石沉積環(huán)境相似,均為河流—三角洲沉積體系,兩者主要區(qū)別是經(jīng)歷的成巖作用不同;第3類巖石的壓實作用較強,而第4類巖石的溶蝕作用更強烈。通過對不同巖石薄片的分類與識別,可以進行巖石樣品的區(qū)域沉積相研究。巖石圖像的自動化分類研究有助于快速分析大量巖石樣品。
模式分類是基于特征空間而進行研究的,特征空間是1個抽象概念,每個樣本在n維空間中表示為1個點。樣本特征的屬性數(shù)量決定空間維度,因此,進行模式分類需要先確定樣本的特征空間[14]。模式分類的基礎(chǔ)是提取不同類樣本最敏感的特征,在巖石圖像分類問題中,骨架孔隙結(jié)構(gòu)最重要。鑄體薄片制作的目的是為了從顏色上區(qū)分骨架與孔隙,因此,顏色空間在本次研究中被選為一組主要特征值。此外,巖石微觀結(jié)構(gòu)的幾何形態(tài)也是分類的重要因素。針對此情況,圖像的形態(tài)學梯度也被選為主要特征值。
本文將圖像的原始顏色空間與其形態(tài)學梯度特征結(jié)合起來作為特征來源,統(tǒng)計各圖像矩陣分量的標準算術(shù)值構(gòu)建其特征空間,為隨后分類器運行提供基礎(chǔ)依據(jù)。統(tǒng)計標準算術(shù)值的優(yōu)點是可以避免巖石薄片圖像采集時的不同放大倍數(shù)對分類帶來的影響,可以有效地提取巖石圖像的特征參數(shù)。
2.1顏色空間
“顏色空間”源于英文中的“color space”一詞,在顏色學中建立有多種顏色模型,以一維、二維、三維甚至四維空間坐標表示某一顏色,這種坐標系統(tǒng)所能定義的顏色范圍稱為顏色空間。RGB(紅色、綠色、藍色)顏色空間是一種最常見使用的顏色模型,但其并不是唯一的顏色空間。計算機上顯示通常使用RGB顏色空間,其中3種顏色(紅色、綠色、藍色)分布被當作X,Y和Z坐標軸。另外1個生成同樣顏色的方法是使用色相(X軸)、飽和度(Y軸)和明度(Z軸)表示,此外還有許多其他顏色空間,可以按照這種方法用三維、更多或者更少維表示。基于圖像的顏色空間特征進行分類與檢索已有許多成功的研究成果,如翟永平等[15]提出一種基于顏色及梯度統(tǒng)計特征的結(jié)核桿菌目標識別算法,識別率可達91%;王娟等[16]討論基于顏色特征的圖像檢索技術(shù),其中包括顏色空間的選擇、顏色的量化、顏色特征的提取以及顏色的相似性量度;李巍等[17]提出一種基于紋理和顏色的目標跟蹤方法,通過手勢和人臉跟蹤仿真對改進方法的有效性進行驗證。
在巖石薄片圖像的研究工作中,所有圖像采集均為JPG格式,應用MATLAB讀入圖像后,表示在RGB顏色空間中。然而,RGB顏色空間可以轉(zhuǎn)換到另一個顏色空間,許多不同的顏色空間適用于分析光學顯微鏡下的巖石薄片圖像,最終確定RGB,HSV,YIQ和YCbCr這4個顏色空間用于本文研究中。
2.2形態(tài)學梯度
形態(tài)學梯度是圖像處理形態(tài)學研究中若干種梯度之一,其主要用于各類圖像的邊緣檢測。因為梯度圖像具有邊緣增長特征,并且形態(tài)學梯度可以使原始圖像的灰度級躍變更加明顯,所以,形態(tài)學梯度圖像能夠較好地反映出圖像像素灰度的變化趨勢?;趫D像的形態(tài)學梯度特征研究已有許多成功的案例,如嚴天峰等[18]提出了一種基于形態(tài)學梯度的信號噪聲分離算法,通過檢測信號的邊緣實現(xiàn)信號噪聲分離;張毅等[19]在形態(tài)學的梯度圖像上提出一種結(jié)合小波變換和分水嶺算法的圖像分割方法;袁悅鋒等[20]根據(jù)嫦娥一號采集的月球圖像,基于數(shù)學形態(tài)學方法對撞擊坑進行自動識別提取研究。因此,在巖石圖像分類研究中,通過分別提取各顏色分量的形態(tài)學梯度,可以有效地獲得巖石微觀結(jié)構(gòu)變化的特征。
在圖像形態(tài)學的研究中,通常是使用1個稱作結(jié)構(gòu)元素的探針進行圖像信息收集,這個探針在圖像中不斷移動,以便獲取圖像中各部分之間的相互關(guān)系,從而確定圖像的結(jié)構(gòu)特征。形態(tài)學梯度是通過圖像的形態(tài)學計算而得,其基本運算有4種:膨脹、腐蝕、開運算和閉運算,這些均是由一組形態(tài)學的代數(shù)算子組成。對原始灰值圖像分別進行膨脹與腐蝕運算,從膨脹后的圖像減去腐蝕后的圖像即產(chǎn)生1個形態(tài)學梯度。本文研究的巖石圖像按顏色分量進行處理,因此,僅討論基于灰值圖像的形態(tài)學梯度計算。
2.2.1膨脹
令F表示灰值圖像,S為結(jié)構(gòu)元素,使用S對F進行膨脹,記作F⊕S,形式化定義為
其中:(x,y)為F中的像素點;(x′,y′)∈D,D是結(jié)構(gòu)元素S的定義域。計算過程是結(jié)構(gòu)元素S關(guān)于原點的鏡像S′在圖像F的所有位置上依次滑過,膨脹結(jié)果F⊕S在其定義域內(nèi)每一點的取值是:以(x,y)為中心,在S′規(guī)定的局部鄰域內(nèi)F與S'之和的最大值。本文中所選用的形態(tài)學結(jié)構(gòu)元素S是3*3大小的形態(tài)學算子。
2.2.2腐蝕
令F表示灰值圖像,S為結(jié)構(gòu)元素,使用S對F進行腐蝕,記作FΘS,形式化定義為
計算過程是結(jié)構(gòu)元素S在圖像F的所有位置上依次滑過。腐蝕結(jié)果FΘS在其定義域內(nèi)每點的取值是:以(x,y)為中心,在S規(guī)定的局部鄰域內(nèi)F與S之差的最小值。
2.2.3形態(tài)學梯度
基于上述的形態(tài)學理論,形態(tài)學梯度的定義為
對原始灰值圖像分別進行膨脹與腐蝕運算后,膨脹結(jié)果減去腐蝕結(jié)果即產(chǎn)生1個形態(tài)學梯度。
2.3特征空間
由于RGB等顏色空間的分量有3個,依據(jù)這3個顏色分量可以產(chǎn)生對應的3個形態(tài)學梯度結(jié)果,分別對這6個矩陣統(tǒng)計標準算術(shù)值,即每個矩陣的平均值和標準偏差作為巖石圖像的特征參數(shù)。至此,通過上述對圖像顏色空間與形態(tài)學梯度的計算描述,確定巖石圖像分類的12維特征空間定義如下:特征1,2 和3分別為第1,2和3個顏色分量灰度的平均值;特征4,5和6分別為第1,2和3個顏色分量灰度的標準偏差;特征7,8和9分別為第1,2和3個顏色分量形態(tài)學梯度的平均值;特征10,11和12分別為第1,2和3個顏色分量形態(tài)學梯度的標準偏差。
以RGB顏色空間為例,上述特征的第1,2和3個顏色分量分別對應R,G和B顏色分量,其他的顏色空間與之相同。在HSV顏色空間中,這3個顏色分量依次是色調(diào)(H)、飽和度(S)和亮度(V);YIQ顏色空間中,Y分量代表圖像的亮度,I分量代表從橙色到青色的顏色變化,而Q分量則代表從紫色到黃綠色的顏色變化;在YCbCr顏色空間中,Y為顏色的亮度、而Cb和Cr則分別為藍色和紅色的濃度偏移量。
支持向量機(support vector machine,SVM)是一種新型具有潛力的分類技術(shù)。SVM是一種基于統(tǒng)計學習理論的模式識別方法,主要應用于模式識別領(lǐng)域,在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多較強優(yōu)勢,并且能夠泛化應用于函數(shù)擬合等其他機器學習問題中[21]。
SVM方法是基于統(tǒng)計學習中的VC維(Vapnik-Chervonenkis dimension)理論,在結(jié)構(gòu)風險最小原理的基礎(chǔ)上建立,根據(jù)有限的樣本特征信息,在模型的復雜性和學習能力之間尋求最佳平衡,以此獲取最優(yōu)的泛化能力。通常研究中希望分類過程是機器進行學習的過程,這些樣本數(shù)據(jù)是n維空間中的點,因此,可以尋找1個n-1維超平面將這些樣本點分開。這個平面稱為線性分類器。有很多分類器符合問題的要求,超平面亦稱為最大間隔超平面,若能找到這個平面,則這個分類器就稱為最大間隔分類器。SVM將向量映射到1個高維空間,在這個空間中建立1個最大間隔超平面,在分開數(shù)據(jù)的超平面 2邊存在2個互相平行的超平面。建立方向合適的分隔超平面使得2個與之平行超平面間的距離最大化,其中超平面間的距離越大,則該分類器的總誤差越小。
SVM與神經(jīng)網(wǎng)絡(luò)相似,均為學習型機制,但與神經(jīng)網(wǎng)絡(luò)相區(qū)別的是:SVM使用的是數(shù)學方法及優(yōu)化技術(shù),其已經(jīng)在許多領(lǐng)域(生物信息學,文本和手寫識別等)都獲得成功應用。SVM在模式分類問題上具有較強的泛化能力,具有如下優(yōu)點:通用性,能夠在廣泛的各類函數(shù)集中構(gòu)造新的函數(shù);魯棒性,不需要進行微調(diào)整;有效性;計算簡單,其方法實現(xiàn)只需要簡單的優(yōu)化技術(shù);理論完善(基于VC維理論)。
在支持向量和輸入空間抽取向量之間的內(nèi)積核是構(gòu)造SVM學習算法的關(guān)鍵,其中K為核函數(shù),這也是SVM的關(guān)鍵(見圖2)。通常低維空間中向量集難以劃分,1個較好的解決方法是將其投影到高維空間,但增加計算復雜度。核函數(shù)能有效地解決該問題,為此,選取合適的核函數(shù)就可以獲得高維空間的有效分類函數(shù)。常用的核函數(shù)主要有線性、多項式、徑向基和兩層感知器核函數(shù)等,本文采用線性核函數(shù)為
式中:x為數(shù)據(jù)樣本總體的特征空間;xT為x的轉(zhuǎn)置矩陣;xi為第i個樣本的特征向量。
圖2 SVM的體系結(jié)構(gòu)Fig.2 Architecture of SVM
首先使用圖像處理技術(shù)獲得巖石圖像分類的12維特征空間,而后應用SVM尋找圖像特征空間與分類之間的映射關(guān)系,最后分別應用各個顏色空間進行分類訓練與測試,并對比分析實驗結(jié)果。
4.1特征空間計算
表1 巖石圖像的12維特征參數(shù)(灰度)Table 1 Characteristic parameters of rock images
實驗圖像由鄂爾多斯盆地蘇里格地區(qū)的100幅鑄體薄片圖像組成,4個不同類別均為25幅?;贛ATLAB進行巖石圖像的顏色空間與形態(tài)學梯度計算,以此得到100幅圖像的特征空間。表1所示為基于RGB顏色空間所提取的部分巖石圖像12維特征參數(shù),圖3所示為基于RGB顏色空間所提取的12維特征空間分維顯示。從圖3可見:特征1~3分布范圍較廣,空間分維數(shù)多數(shù)集中在125~180之間;特征4~6分布范圍適中,空間分維數(shù)多數(shù)集中在30~60之間;特征7~12分布范圍均較小,空間分維數(shù)主要分布在0~20之間,其中特征7~9空間分維數(shù)均處于0~1之間。每個樣本的具有獨立的12維特征空間,為了防止單一變量影響其他變量以及獲得可以比較的取值范圍,對特征參數(shù)進行線性變換,變換后的參數(shù)取值范圍為[0,1],變換公式為
圖3 巖石圖像特征空間的可視化圖Fig.3 Visualization of feature space of rock images
式中:xmin為數(shù)據(jù)序列中的最小數(shù);xmax為數(shù)據(jù)序列中的最大數(shù)。
4.2分類結(jié)果
應用SVM對上述計算得到12維特征空間進行訓練,用于相應的巖石圖像分類測試,實驗基于MATLAB的libsvm工具箱進行。100幅巖石圖像樣本隨機分為訓練集和測試集2部分,其中訓練集為80 組(每個類別分別為20幅),測試集為剩余20幅巖石圖像。基于RGB顏色空間與其形態(tài)學梯度對巖石圖像分類進行測試,結(jié)果見圖4。從圖4可見:其分類正確率達到95%,即SVM正確分類19幅圖像,錯誤分類1幅;在錯誤分類中,SVM將其中1幅2類巖石錯誤識別為3類巖石;而第1類、第3類和第4類的全部巖石圖像得到正確分類;相應訓練集的分類正確率為98.75%,即80幅訓練圖像中僅有1幅被錯誤分類。
取3次測試集的分類實驗結(jié)果進行分析,結(jié)果見表2。從表2可知:3次實驗結(jié)果的平均分類正確率達95%,特別是第3次實驗中測試集的正確分類達到100%,即所有20幅巖石圖像得到正確分類;效果最差的是第2次實驗,其分類正確率為90%;在4類巖石圖像的分類結(jié)果中,第1類和第3類的識別效果最佳,3次實驗的平均正確率為100%,而識別誤差最大的是第2類巖石圖像,其平均分類正確率為87%。上述測試結(jié)果表明基于顏色空間與形態(tài)學梯度的巖石圖像特征空間,應用SVM方法進行巖石圖像分類具有一定有效性,多次重復性的實驗結(jié)果也表明該方法具有良好的穩(wěn)定性與較高分類精度,在有限的實驗次數(shù)中并沒有產(chǎn)生誤差大幅度波動的情況。通過分析各類巖石圖像的特征參數(shù),少量第2類巖石圖像的特征參數(shù)與第1類及第3類參數(shù)近似,這可能是由于第2類巖石處于第1類與第3類巖石的過渡區(qū)域,因而造成該方法仍然存在較小的分類誤差。
圖4 測試集的分類結(jié)果Fig.4 Classification results of test set
表2 實驗的3次分類正確率Table 2 Classification rates of three experiments %
4.3顏色空間對比
為獲得最優(yōu)的顏色空間與分類精度,除上述實驗中使用的RGB顏色空間外,分別使用HSV,YIQ和YCbCr顏色空間的進行實驗測試,這3種顏色空間的巖石圖像分類分別取得較好的分類效果,見圖5。從圖5可以看到:基于YIQ顏色空間的測試集中4類巖石圖像分類的正確率達95%;HSV與YCbCr這2種顏色空間的分類效果較RGB與YIQ顏色空間的分類效果稍差,正確率均為90%;在4個顏色空間中,第1類巖石圖像的分類正確率均為100%,分類效果最佳;而第2類巖石圖像的分類誤差最大,正確分類率為85%;第3類與第4類巖石圖像在4個顏色空間中分類正確率居中,分別為90%和95%。這4個顏色空間測試集的總體分類正確率到達92.5%。
圖5 不同顏色空間下的測試集分類結(jié)果Fig.5 Classification results under different color spaces
基于不同的顏色空間,支持向量機對巖石圖像的分類效果不一,見表3。使用RGB顏色空間進行巖石圖像分類時訓練集與測試集效果均最佳,分類正確率分別為98.75%和95.00%;而使用其他3種顏色空間進行巖石圖像分類時的總正確率結(jié)果一致,均為97.00%。綜合4種顏色空間的實驗結(jié)果,巖石圖像樣本訓練集的平均分類正確率為98.44%,測試集的平均分類正確率為92.50%,總正確率平均為97.33%。上述實驗結(jié)果表明應用顏色空間與形態(tài)學梯度作為巖石圖像的特征空間,同時利用SVM進行分類的方法具有較高的擬合精度與較強的泛化能力,因此,該方法可以在巖石圖像的自動分類識別中進行推廣使用。與此同時,巖石圖像的分類精度仍存在較小誤差,應與樣本數(shù)量偏少有關(guān)。
表3 基于不同顏色空間的分類正確率Table 3 Classification rates based on different color spaces %
1)基于圖像處理以及SVM方法提出一種高效的巖石圖像自動分類方法。該方法利用光學顯微鏡采集巖石薄片圖像,基于圖像的原始顏色空間并結(jié)合其形態(tài)學梯度特征,統(tǒng)計各圖像矩陣分量的標準算術(shù)值進行巖石圖像的特征空間描述,通過支持向量機方法建立特征空間與巖石圖像類別之間的映射關(guān)系。
2)采用鄂爾多斯盆地蘇里格地區(qū)的100幅巖石薄片圖像進行測試,該方法的自動識別正確率均達95.00%以上,證明該分類方法具有一定有效性與可靠性。
3)利用統(tǒng)計標準算術(shù)值避免巖石薄片圖像采集時不同放大倍數(shù)對分類帶來的影響,多次重復性的實驗結(jié)果也表明該方法具有較強的穩(wěn)定性和較高的分類精度。而分類結(jié)果中存在的較小誤差可能是樣本數(shù)量偏少所致,因此,下一步研究工作會增加實驗中巖石圖像的類別與數(shù)量,以期望獲取更好的分類效果。
[1]MARMO R,AMODIO S,TAGLIAFERRI R,et al.Textural identification of carbonate rocks by image processing and neural network:methodology proposal and examples[J].Computers& Geosciences,2005,31(5):649-659.
[2]徐碩,王洲.基于紋理特征和神經(jīng)網(wǎng)絡(luò)的圖像識別[J].中國農(nóng)學通報,2007,23(9):590-594. XU Shuo,WANG Zhou.Recognition of image based on the character of textures and neural network[J].Chinese Agricultural Science Bulletin,2007,23(9):590-594.
[3]張憲,李曉娟.支持向量機在顯微圖像分類中的應用研究[J].計算機應用,2008,28(3):790-791. ZHANGXian,LIXiaojuan.Studyonclassificationof micrograph based on SVM[J].Journal of Computer Applications, 2008,28(3):790-791.
[4]李培軍.用ASETR圖像和地統(tǒng)計學紋理進行巖性分類[J].礦物巖石,2004,24(3):116-120. LI Peijun.Lithological discrimination using aster image and geostatistical texture[J].Journal of Mineralogy and Petrology, 2004,24(3):116-120.
[5]程國建,楊靜,黃全舟,等.基于概率神經(jīng)網(wǎng)絡(luò)的巖石薄片圖像分類識別研究[J].科學技術(shù)與工程,2013,13(31): 9231-9235. CHENG Guojian,YANG Jing,HUANG Quanzhou,et al.Rock image classification recognition based on probabilistic neural networks[J].Science Technology and Engineering,2013,13(31): 9231-9235.
[6]程國建,馬微,魏新善,等.基于圖像處理與神經(jīng)網(wǎng)絡(luò)的巖石組構(gòu)識別[J].西安石油大學學報(自然科學版),2013,27(5): 105-109. CHENG Guojian,MA Wei,WEI Xinshan,et al.Research ofRock texture identification based on image processing and neural networks[J].JournalofXi’anShiyouUniversity(Natural Science Edition),2013,27(5):105-109.
[7]葉潤青,牛瑞卿,張良培,等.基于圖像分類的礦物含量測定及精度評價[J].中國礦業(yè)大學學報,2011,40(5):810-815,822. YE Runqing,NIU Ruiqing,ZHANG Liangpei,et al.Mineral contentsdeterminationandaccuracyevaluationbasedon classificationof petrographicimages[J].Journalof China University of Mining&Technology,2011,40(5):810-815,822.
[8]BAYKAN N,YILMAZ N.Mineral identification using color spacesandartificialneuralnetworks[J].Computersand Geosciences,2010,36(1):91-97.
[9]M?YNARCZUKM,GóRSZCZYKA,?LIPEKB.The application of pattern recognition in the automatic classification of microscopic rock images[J].Computers&Geosciences,2013, 60:126-133.
[10]SINGHN,SINGHTN,TIWARYA,etal.Textural identification of basaltic rock mass using image processing and neural network[J].Computers and Geosciences,2010,14(2): 301-310.
[11]GHIASI-FREEZJ,SOLEIMANPOURI,KADKHODAIEILKHCHI A,et al.Semi-automated porosity identification from thinsectionimagesusingimageanalysisandintelligent discriminant classifiers[J].Computers and Geosciences,2012,45: 36-45.
[12]ISHIKAWA S T,GULICK V C.An automated mineral classifier using Raman spectra[J].Computers and Geosciences, 2013,54:259-268.
[13]朱筱敏.沉積巖石學[M].4版.北京:石油工業(yè)出版社,2008: 5-15. ZHU Xiaomin.Sedimentary petrology[M].4th ed.Beijing: Petroleum Industry Press,2008:5-15.
[14]張錚,倪紅霞,苑春苗,等.精通Matlab數(shù)字圖像處理與識別[M].北京:人民郵電出版社,2013:200-214,290-299. ZHANG Zheng,NI Hongxia,YUAN Chunmiao,et al.Proficient in Matlab digital image processing and recognition[M].Beijing: People’s Posts and Telecommunications Press,2013:200-214, 290-299.
[15]翟永平,周東翔,劉云輝.基于顏色及梯度統(tǒng)計特征的結(jié)核桿菌目標識別[J].國防科技大學學報,2012,34(5):146-152. ZHAI Yongping,ZHOU Dongxiang,LIU Yunhui.Recognition of mycobacterium tuberculosis in microscopic images based on color and gradient feature[J].Journal of National University of Defense Technology,2012,34(5):146-152.
[16]王娟,孔兵,賈巧麗.基于顏色特征的圖像檢索技術(shù)[J].計算機系統(tǒng)應用,2011,20(7):160-164. WANG Juan,KONG Bing,JIA Qiaoli.Color-based image retrieval[J].Computer Systems&Applications,2011,20(7): 160-164.
[17]李巍,趙英凱,錢厚亮.一種基于紋理和顏色的目標跟蹤方法[J].計算機仿真,2011,28(1):273-276. LI Wei,ZHAO Yingkai,QIAN Houliang.Camshift tracking algorithm based on LBP feature[J].Computer Simulation,2011, 28(1):273-276.
[18]嚴天峰,馬睿.基于形態(tài)學梯度的信號噪聲分離算法[J].計算機應用,2011,31(11):2922-2925. YAN Tianfeng,MA Rui.Signal noise separation algorithm basedonmorphologygradient[J].JournalofComputer Applications,2011,31(11):2922-2925.
[19]張毅,王福龍.基于小波變換的分水嶺圖像分割[J].小型微型計算機系統(tǒng),2014,35(6):1382-1386. ZHANG Yi,WANG Fulong.Watershed image segmentation based on wavelet transform[J].Small Microcomputer System, 2014,35(6):1382-1386.
[20]袁悅鋒,朱培民,趙娜,等.基于數(shù)學形態(tài)學的月海圓形撞擊坑自動識別方法[J].中國科學(G輯),2013,43(3):324-332. YUAN Yuefeng,ZHU Peimin,ZHAO Na,et al.Automatic identification of circular mare craters based on mathematical morphology[J].Chinese Science(G),2013,43(3):324-332.
[21]史峰,王小川,郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)30個案例分析[M].北京:北京航空航天大學出版社,2010:282-283. SHI Feng,WANG Xiaochuan,YU Lei,et al.MATLAB neural network analysis of 30 cases[M].Beijing:Beijing University of Aeronautics and Astronautics Press,2010:282-283.
(編輯陳燦華)
Rock classification based on features form color space and morphological gradient of rock thin section image
LIU Ye1,CHENG Guojian1,MAWei2,GUO Chao3
(1.School of Computer Science,Xi'an Shiyou University,Xi’an 710065,China;
2.Library of Xi’an University of Technology,Xi’an 710048,China;
3.Research Institute of Shaanxi Yanchang Petroleum(Group)Co.Ltd.,Xi’an 710075,China)
A new high efficiency automatic rock classification method for thin section images of rocks was proposed to solve the problems caused by subjective errors and the difference of capture equipments and conditions.This classification method,whose basic data were from polarizing microscope,was based on original color space and morphology gradient features to build the relationship between these features extracted from images and rock types with SVM.Practical test data set composed of 100 image samples was from Sulige gas field in Ordos basin.The results show that the accuracy of this method reaches 95%,which proves the method is stable and dependable both in theoretical and practical aspects.
rock images;classification;color space;morphological gradient;SVM
劉燁,博士,講師,從事儲層描述與智能計算研究;E-mail:yeliu@xsyu.edu.cn
P588;TP751.1
A
1672-7207(2016)07-2375-08
10.11817/j.issn.1672-7207.2016.07.027
2015-06-20;
2015-09-24
陜西省自然科學基礎(chǔ)研究計劃項目(2014JQ5193);西安石油大學青年科技創(chuàng)新基金資助項目(2014BS13) (Project(2014JQ5193)supported by the Natural Science Basic Research Plan in Shaanxi Province of China;Project(2014BS13)supported by the Youth Science and Technology Innovation Fund of Xi'an Shiyou University)