張鈺帆,鄭 寒,王艷霞
(西南林業(yè)大學(xué),云南 昆明 650224)
地質(zhì)復(fù)雜程度主要是某一地區(qū)水文、礦產(chǎn)、構(gòu)造、巖相、巖性以及地層等各種地質(zhì)內(nèi)容變化的程度。相對的來說,變化較小的簡單、變化較大的復(fù)雜,介于兩者間視為中等。它是影響地質(zhì)工作方法的選取、效率以及工作量大小等重要因素,同樣也是制定地質(zhì)工作計劃的依據(jù)之一[1]。其中地質(zhì)復(fù)雜程度主要是指工作區(qū)域中,各種各樣的地質(zhì)條件以及地質(zhì)狀況總稱,例如:地質(zhì)特征是否明顯、斷裂構(gòu)造是否發(fā)育,地層的變化是否頻繁等。通常來說,地質(zhì)情況越復(fù)雜,所需要的觀察點就多一些,相反就會少一些,對應(yīng)的效率會造成一定影響。而地質(zhì)復(fù)雜的程度與自然地理條件是影響地質(zhì)測量工作效率兩個主要因素,在制訂勞動定額時,需要先對兩個因素進(jìn)行分類,反之,即會使勞動定額缺失準(zhǔn)確性,影響勞動定額生產(chǎn)、調(diào)動職工的勞動積極性。為此,相關(guān)學(xué)者進(jìn)行了研究,取得了一定的進(jìn)展。張雁等人提出基于地質(zhì)成因的砂巖儲層微觀孔隙結(jié)構(gòu)分形特征分析方法[2],通過掃描電鏡等對松遼盆地大慶長垣滲透性砂巖儲層微觀分形特征進(jìn)行分析,通過成巖作用以及次生孔隙的發(fā)育情況研究地質(zhì)成因,此方法能夠有效實現(xiàn)地質(zhì)分形特征的提取,但是精準(zhǔn)性不佳。張鵬等人對黔西北地區(qū)龍?zhí)督M海陸過渡相泥頁巖孔隙分形特征進(jìn)行研究[3],通過FHH模型獲取頁巖孔隙分形維數(shù),分析頁巖其它地質(zhì)參數(shù)與分形維數(shù)的相關(guān)性,得到其分析特征結(jié)果。此方法能夠獲得較為全面的地質(zhì)特征,但是勘探工作效率較低。
為了解決上述方法中存在的問題,精確的找出某種物質(zhì),本文提出一種基于支持向量機(jī)的復(fù)雜地質(zhì)分形特征自動提取方法,能夠很好的區(qū)分出泥巖性質(zhì),完成地質(zhì)勘探工作。
先考慮最簡易兩種線性可分,把最佳的分類面完成簡化,將其轉(zhuǎn)變成最佳分類直線。具體如圖1所示。
圖1 最佳分類平面
通過圖1能夠看出,○與Δ分別表示兩種可分的訓(xùn)練樣本,而H分類面就是把兩種樣本精確無誤分開,分成H1,H2使二者分別代表兩種樣本內(nèi)離H最近的點,并且要平行于H平面。將H1與H2間距離稱之為兩種分類間隔。最佳分類面不僅要確保兩種標(biāo)本無錯分開,且還要讓分類的距離達(dá)到最大。主要是前者可以確保經(jīng)驗風(fēng)險達(dá)至最低,不過后者會致使推廣性界置信的范圍達(dá)到最低,即為真實的風(fēng)險達(dá)到最低[4]。
線性可分樣本的集主要為n個樣本(xi,yi),其中i=1,2,…,n,x∈Rd,y∈{-1,1}代表類別標(biāo)號。而處在高維的空間內(nèi),分開兩種樣本的分類超平面需要滿足g(x)=w·x-b=0。利用歸一化處理向量系數(shù)w,能夠致使全部的樣本滿足|g(x)|≥1,所以圖1內(nèi)H1與H2分別要滿足公式為
H1:w·x-b=+1
(1)
H2:w·x-b=-1
(2)
將式(1)、(2)總結(jié),全部樣本的精準(zhǔn)分類公式為
yi(w·xi-b)-1≥0
(3)
(4)
風(fēng)險最小就是指求解最佳的分類面處于式(3)約束時,能夠求出式(4)內(nèi)Φ(w)極值。而超平面H1與H2樣本點即為式(9)內(nèi)所獲的極值樣本點,同時支持最佳的分類面,因此將其稱之為支持向量[5]。
而為了對上述問題解答,需要對w與b采用最小化的Lagrange泛函數(shù),具體公式可以得到
(5)
式中:σi>0,i=1,2,…,n為引入Lagrange的系數(shù),經(jīng)過約束優(yōu)化理論條件,在式(5)內(nèi)的極值問題可以簡化成對偶的問題,具體公式為
(6)
σi≥0i=1,2,…,n
(7)
而下極大化的泛函公式為
(8)
通過KT條件能夠看出,不等式約束條件下,二次函數(shù)的極值擁有唯一的解答,具體最佳公式為
ai[yi(w·xi-b)-1],i=1,2,…,n
(9)
式中:σi≥0相應(yīng)的樣本xi現(xiàn)實中即為支持向量,a′代表優(yōu)化的最佳解,具體通過可以通過式(8),得到最佳平面系數(shù)的向量公式為
(10)
基于最佳超平面分類規(guī)則,能夠利用下列指示函數(shù)進(jìn)行表述,具體公式為
(11)
而常數(shù)b0能夠通過式(9)在兩種樣本內(nèi)獲得隨意的一個支持向量[6]。
真實的情況內(nèi),在對噪聲或其它的干擾因素所造成的線性不可分問題進(jìn)行考慮,不能夠按照要求令樣本落在圖1內(nèi)H1與H2超平面間,在引入?yún)⒘喀蝘≥0,則式(8)內(nèi)約束的條件能夠推廣成公式為
yi(w·xi-b)-1+ξi≥0,i=1,2,…,n
(12)
廣義最佳超平面的解決問題,即為在條件式(12)與ξi≥0,i=1,2,…,n約束下極小化的泛函數(shù),具體公式為
(13)
式中:常量C可以對越界的樣本點施加懲罰系數(shù),即而在算法復(fù)雜度以及樣本錯分率間進(jìn)行折中,在C→∞時,即可以成為最優(yōu)分類理想的狀況[7]。
和以上解決方式相同,式(13)的轉(zhuǎn)變形式與式(8)同樣的對偶問題,具體將約束條件轉(zhuǎn)換成公式為
0≤ai≤C,i=1,2,…,n
(14)
討論線性超平面以及推廣形式,說明最佳的分類判別函數(shù)在式(11)內(nèi),僅包括待預(yù)測的樣本以及支持向量間內(nèi)積,通常需要考慮分類的問題處于定義特征的空間內(nèi),并不一定是線性可分的,因此采用非線性的映射T把特征x映射到高維線性特征空間F內(nèi),具體公式為
(15)
接著利用之前所介紹的廣義最佳分類面方法進(jìn)行解決,而高維線性空間內(nèi)積公式為
K(xi,xj):=T(xi)·T(xj)
(16)
式中:K(xi,xj)代表核函數(shù),選取要滿足的Mercer條件。
上述支持向量機(jī)的優(yōu)點,是無須知道必要映射的T具體形式,只需要定義高維空間內(nèi)積的運算K(x,y)即可完成,這樣就算是經(jīng)過變換之后,空間維數(shù)同樣會增加許多,不過復(fù)雜度的計算也并沒有較大變化[8]。
假設(shè)x∈En(En為n維的歐式空間),f(x)為關(guān)于x實值的隨機(jī)函數(shù),如果具有常數(shù)H(0 (17) 式中:F(t)為一個和x·Δx沒有關(guān)系的分布函數(shù),那么f(x)將稱為分維布朗函數(shù)。 如果F(t)的服從均值是0,方差則為σ正態(tài)分布,那么實際的布朗噪聲具體公式為 (18) 將式(18)兩邊取對數(shù),那么可以得到公式為 (19) D=3-H (20) 式中:D代表分維數(shù)。 抽取異常重磁分維數(shù)方法如下: E[|f(X+ΔX)-f(x)|]→E[i](i=1,2,…,k) (21) 其中 (22) 2)對式(19)采用最小二乘法,算出H與lgC結(jié)果。 通過頻率域角度觀看分維值,能夠反映出不同頻率能量關(guān)系,例如從低頻向著高頻的能量衰弱。在從空間域角度觀看,分維數(shù)能反映出目標(biāo)區(qū)域地形復(fù)雜程度,非常直觀的表示表面粗糙程度,D越大,則表面的起伏就越劇烈,且相關(guān)程度就越低。D越小,則表面變化就越緩慢,而相關(guān)程度就越高。 選擇需要兩部分復(fù)雜地質(zhì)圖像樣本,計算圖像內(nèi)的方差、均值、相關(guān)性、對比度以及角二階矩。 L代表灰度級的個數(shù),P(m,n)代表共生矩陣第m行和第n列元素值,其主要是以灰度級m作為起點,生成灰度級n概率。 具體角二階矩公式為 (23) 對比度公式為 (24) 式中,t代表灰度級。 而相關(guān)性G公式為: (25) (26) (27) (28) (29) 式中:μ1,μ2代表均值,σ1,σ2代表方差。 均值E計算公式為 (30) 方差σ計算公式為 (31) 式中:μ代表P(m,n)均值。建立特征子向量P1=[β,α,G,E,σ]。 分解兩部分的樣品圖像尺度是3,計算各個尺度低頻系數(shù)圖像的方差、均值、相關(guān)性、對比度以及角二階矩。建立特征子向量P2=[βLL(i),αLL(i),GLL(i),ELL(i),σLL(i)]i=1,2,3,其中:βLL(i)、αLL(i)、GLL(i)、ELL(i)、σLL(i)分別代表分解尺度是i時LL子帶的方差、均值、相關(guān)性、對比度以及角二階矩。 而HH子帶系數(shù)的均值公式為 (32) 式中:HH(i)代表分解尺度值是i時的子帶HH,m代表系數(shù)的行數(shù),n代表系數(shù)的列數(shù),M代表總系數(shù)的行數(shù),N代表總系數(shù)的列數(shù)。而其它子帶的系數(shù)均值能夠利用類似方法計算。經(jīng)過分解以后各個分解尺度均值公式為 (33) (34) 其它子帶系數(shù)的方差能夠利用類似方法進(jìn)行計算。 經(jīng)過分解以后,各個分解尺度總方差公式為 (35) 建立特征子向量P3=[μ(i),σ(i)]i=1,2,3,構(gòu)建紋理特征向量P=[P1,P2,P3]。即完成復(fù)雜地質(zhì)特征提取工作。 圖像收集系統(tǒng)采用Canon EOS 20D照相機(jī),配上Canon Macro MP-E65mmf/2.81-5X微距鏡頭。在進(jìn)行實際拍攝的過程內(nèi),鏡頭至巖屑距離8cm,避免出現(xiàn)過多陰影。實驗樣品采用《巖譜色譜集》內(nèi)鋁土質(zhì)泥巖、石膏質(zhì)泥巖、灰質(zhì)泥巖一共3種泥巖樣品,將粉砂巖、灰質(zhì)粉砂巖、粉細(xì)砂巖、中砂巖以及石英砂巖5種作統(tǒng)一砂巖樣品。 將拍攝的復(fù)雜土質(zhì)樣品圖像,截取整幅正方形大小為128×128的小圖像。泥巖標(biāo)準(zhǔn)圖像樣品取樣為120幅,實際現(xiàn)場截取樣品為200幅,砂巖標(biāo)準(zhǔn)圖像樣品截取110幅,實際現(xiàn)場截取樣品為300幅。 通過計算4種紋理特征向量,獲取3種泥巖表面紋理,僅以兩種特征向量進(jìn)行舉例,具體如圖2所示。 圖2 泥巖的特征向量提取曲線圖像 通過圖2能夠看出,不同類型的泥巖表面紋理特征數(shù)據(jù)存在顯著差異,因為這些參量代表圖像紋理特征的某一個方面性質(zhì),所以利用對比這些參量,能夠反映出不同圖像的紋理特征差異,因此把作為分類器輸入的特征矢量,分類識別泥巖表面的紋理是可行的,能夠完成對不同泥巖分類。 而在圖2(a)內(nèi),曲線表示各個泥巖二階距的特征,數(shù)值越大,則說明紋理就越粗,即為能量越大,圖內(nèi)表示鋁土質(zhì)泥巖與石膏質(zhì)泥巖兩條曲線的差距較大,因為鋁土質(zhì)泥巖的值要比石膏質(zhì)泥巖大很多,這就說明鋁土質(zhì)泥巖的紋理要比石膏質(zhì)泥巖紋理粗,即能量也大,以此就能夠利用二階矩區(qū)分開兩種泥土種類。不過其中表示灰質(zhì)泥巖與石膏質(zhì)泥巖二階矩曲線互相重疊,很難分辨。所以這時需要看圖2(b)中,在圖內(nèi)曲線表示各個泥巖紋理對比度特征,其中表示石膏質(zhì)泥巖與灰質(zhì)泥巖對比度曲線差距比較大,因為灰質(zhì)泥巖值要比石膏質(zhì)泥巖值大許多,所以就表示灰質(zhì)泥巖值要比石膏質(zhì)泥巖紋理清晰許多,這時就能夠區(qū)分開灰質(zhì)泥巖值與石膏質(zhì)泥巖,以此類推,本文方法能夠通過提取的特征值輕松區(qū)分出3種泥巖。 本文提出的基于支持向量機(jī)的復(fù)雜地質(zhì)分形特征自動提取方法,能夠很好通過提取出的特征,區(qū)分各種泥巖,不過因為復(fù)雜地質(zhì)中的存在較多種泥巖,部分泥巖的成分較為相似,可能會存在提取出的泥巖特征用于識別或分類時出現(xiàn)差錯,導(dǎo)致最終結(jié)果偏移,影響勘探工作,所以未來本文需要進(jìn)一步研究,提升地質(zhì)特征提取的精度,盡可能的減少提取時誤差。3.2 復(fù)雜地質(zhì)特征提取
4 實驗證明
4.1 實驗環(huán)境
4.2 實驗結(jié)果與分析
5 結(jié)束語