孫振宇,彭蘇萍,鄒冠貴
(中國礦業(yè)大學(xué)(北京) 煤炭資源與安全開采國家重點實驗室,北京 100083)
基于SVM算法的地震小斷層自動識別
孫振宇,彭蘇萍,鄒冠貴
(中國礦業(yè)大學(xué)(北京) 煤炭資源與安全開采國家重點實驗室,北京 100083)
為了提高小斷層解釋的準(zhǔn)確率,構(gòu)建基于支持向量機(jī)(SVM)算法的斷層自動識別方法。通過分析構(gòu)造部位和非構(gòu)造部位地震屬性特征,建立SVM兩分類的斷層識別模型。首先,研究支持向量機(jī)兩分類算法的基本原理和結(jié)構(gòu),表明支持向量機(jī)在兩分類問題上具有準(zhǔn)確率高的優(yōu)點;然后建立斷層正演模型,分析不同地震屬性的斷層響應(yīng)特征,表明斷層分布與屬性值變化趨勢相關(guān);通過對支持向量機(jī)算法和正演模型的分析,表明利用地震屬性作為支持向量機(jī)的輸入,預(yù)測小斷層具有可行性。從疊后地震數(shù)據(jù)中提取方差、曲率等與斷層相關(guān)的屬性集合;通過相關(guān)性分析和聚類分析評估屬性,確定4種互相關(guān)性低的地震屬性。利用14口鉆井、3條巷道的地震屬性和斷層信息共606個數(shù)據(jù),選取400個作為訓(xùn)練樣本,構(gòu)造SVM斷層識別模型;206個數(shù)據(jù)作為測試樣本,進(jìn)行斷層識別,識別正確率達(dá)到98%。利用地震屬性建立的SVM斷層自動識別模型,能夠有效識別小斷層,降低人為主觀因素的影響,縮短了解釋周期;鉆孔分布越均勻、數(shù)目越多,解釋精度就越高。
支持向量機(jī);斷層;自動識別;地震屬性
常規(guī)的斷層解釋通過觀察地震剖面上振幅、相位和時差等特征識別斷層,由于小斷層在時間剖面上的變化微小,難以肉眼識別[1],解釋結(jié)果受到解釋人員主觀因素影響較大。地震屬性是地震數(shù)據(jù)通過數(shù)學(xué)計算得到的運動學(xué)、動力學(xué)、幾何學(xué)及統(tǒng)計學(xué)特征。在構(gòu)造解釋,地層巖性解釋等領(lǐng)域得到了廣泛應(yīng)用[2],能夠解釋時間剖面難以解釋的小斷層。相干屬性與曲率屬性是與斷層密切相關(guān)的地震屬性,相干屬性使用相鄰地震道信號的相似性描述地層的橫向不均勻性,能表示地層的不連續(xù)性;地層曲率屬性反映地層受構(gòu)造應(yīng)力擠壓時層面彎曲的程度,曲率的絕對值越大,說明彎曲程度越大,小構(gòu)造越發(fā)育[3-5]。相干體和曲率體都被用于解釋斷層,相干體常用于解釋發(fā)生錯斷的斷層,而曲率體常用于解釋褶曲性的斷層,故某一種屬性只能解釋地質(zhì)現(xiàn)象的某一個方面。因此,采用多屬性融合識別斷層的方法既能避免單一屬性的局限性,也能解決人工解釋不能識別的小斷層問題;多屬性融合的優(yōu)點是把大量的地震屬性信息整合在一起,可充分挖潛數(shù)據(jù)內(nèi)含信息,去除重復(fù)冗雜信息[6],提高斷層解釋的精度和效率。
支持向量機(jī)(Support Vector Machine,簡稱SVM)為一種新型的模式分類方法[7],是使用最為廣泛的核學(xué)習(xí)算法,應(yīng)用于煤層氣和瓦斯涌出量預(yù)測[8-9]、煤層頂板導(dǎo)水?dāng)嗔褞Ц叨阮A(yù)測、底板突水量預(yù)測及突水危險性評價[10-12]。支持向量機(jī)在解決小樣本、非線性及高維模式識別中表現(xiàn)出特有優(yōu)勢,具有優(yōu)良的泛化能力并且對解決分類問題和回歸問題具有魯棒性。
巖體在構(gòu)造應(yīng)力的作用下發(fā)生破裂,破裂面兩側(cè)的巖體發(fā)生顯著位移或失去連續(xù)性或完整性,形成斷層[13]??臻g上與某一斷裂帶有關(guān)的高裂縫巖石變形區(qū)都可以稱為破碎帶[14],斷層破碎帶的規(guī)模與地質(zhì)條件有關(guān)。斷層破碎帶由于張應(yīng)力或擠壓力的作用,使破碎帶處巖石經(jīng)歷復(fù)雜的地質(zhì)作用,甚至破碎帶兩側(cè)巖體的物性發(fā)生變化,如巖石密度、硬度、孔隙度,出現(xiàn)斷層泥和斷層角礫巖等。由于斷層處的物性發(fā)生變化,其地震上的響應(yīng)也會發(fā)生一定變化,可以利用地震屬性,比如頻率、振幅、傾角等,分析這種地質(zhì)變化。圖1,建立的斷層正演模型參數(shù)如下:模型分為3層:上、下兩層為砂巖層,速度均為3 000 m/s,密度為2.7 g/cm3;中間為煤層,埋深300~330 m,速度為2 000 m/s,密度1.5 g/cm3,層厚為10 m。煤層含有4個斷層,其中2個為正斷層,2個為逆斷層,自左至右斷層落差分別為10,5,10,5 m,對應(yīng)地震道號為40,60,95和135道。模型地震道間距為1 m,震源為雷克子波,頻率60 Hz,采用垂直激發(fā),模型正演剖面,如圖2所示。
圖1 斷層模型Fig.1 Model of faults
圖2 斷層模型正演剖面Fig.2 Cross-section of fault forward modeling
圖3 各屬性與斷層的關(guān)系Fig.3 Relationship between attributes and faults
對上述的正演模型提取方差、走向曲率、信號嘈雜程度、反射強(qiáng)度、瞬時相位、瞬時頻率、傾角導(dǎo)數(shù)、傾角連續(xù)性、衰減系數(shù)以及最大振幅共10種地震屬性。在屬性數(shù)據(jù)上,有斷層則用‘1’表示,無斷層則用‘0’表示,構(gòu)成屬性值和斷層信息的數(shù)據(jù)集。將每種屬性值和斷層信息分別投到平面直角坐標(biāo)系中,由于每種屬性的數(shù)量級不同,為將這些屬性用同一坐標(biāo)系顯示,對每個屬性進(jìn)行歸一化處理。通過觀察屬性值變化和斷層信息變化的特征,可以看出:斷層信息大致隨屬性值的變化呈現(xiàn)一定的規(guī)律性(圖3),圖中“豎直虛線”表示有斷層存在。圖3(a)顯示:無論是正曲率還是負(fù)曲率,一定范圍內(nèi)無絕對值最大處有斷層存在;方差屬性值在一定范圍內(nèi)的最大值處,有斷層存在;一定的范圍內(nèi),混沌體數(shù)值大位置,有斷層存在;傾角偏差的局部極大值位置,存在斷層;傾角連續(xù)性絕對值的局部極大值位置,存在斷層;圖3(b)顯示:瞬時頻率在局部極小值位置,存在斷層;一般情況下,發(fā)生正負(fù)相位轉(zhuǎn)換的位置,存在斷層;衰減系數(shù)的局部最小值處,存在斷層;局部范圍內(nèi),反射強(qiáng)度最小的位置,存在斷層;最大振幅屬性的局部極小值的位置,存在斷層。
以上10種屬性都能識別物性或幾何形態(tài)的變化;但反過來,地層物性變化和幾何形態(tài)變化,不一定是由斷層引起的。如圖3(a)中方差屬性的第95道是局部最大值有斷層,第85道也是局部最大值,但沒有斷層,所以單獨使用方差體,不能完全正確識別斷層。同一數(shù)據(jù)點,兩個屬性識別的結(jié)果不同,說明單一屬性識別存在多解性,而兩種屬性同時識別能夠有效的減少多解性。
通過對上述屬性與斷層分布的分析,可以看出10種屬性都與斷層存在一定的關(guān)系;同時,單獨利用某一種屬性,存在多解性。因此,應(yīng)該綜合利用上述屬性,減少斷層預(yù)測的多解性,提高識別精度。
通過對斷層與地震屬性響應(yīng)特征的分析,可以知道地震屬性與斷層存在密切的關(guān)系,但是這些屬性可能與斷層有相似的關(guān)系,因此需要對屬性進(jìn)行評估。屬性評估的主要目標(biāo)是找到獨立的變量,標(biāo)記出相關(guān)性好的屬性。首先,沿著目的層T0波開1個寬度為10 ms的時窗,提取上述的10個屬性,組成屬性集合;然后,計算各屬性的相關(guān)系數(shù),見表1。表1中的數(shù)值越大,兩個屬性的相關(guān)性越強(qiáng),即說明兩種屬性與斷層的關(guān)系更加相似。這種數(shù)值方法,與在屬性剖面上通過視覺的定性解釋類似,但是由于是通過數(shù)值計算得到的,因此擁有更多的定量描述。對這些屬性進(jìn)行評估,可以降低潛在的偽相關(guān)性。偽相關(guān)性是偶然發(fā)生的相關(guān)性,不是真正的物理相關(guān)性。偽相關(guān)性出現(xiàn)的概率與用于分類的地震屬性的數(shù)量成正比,與數(shù)據(jù)控制點的數(shù)量成反比。為了把出現(xiàn)偽相關(guān)性的概率降到最低,應(yīng)盡量多地選擇樣本數(shù)量。數(shù)據(jù)評估的結(jié)果證明了一些地震屬性的密切關(guān)系,表明屬性集中的一些屬性需要剔除。
為了更進(jìn)一步的評估各屬性之間的相關(guān)關(guān)系,通過統(tǒng)計測試,進(jìn)行R型聚類分析,根據(jù)聚類分析的結(jié)果,選擇相互獨立的屬性,即關(guān)系較小的屬性。
屬性評估之后,從屬性集合中剔除無效的屬性完成屬性選擇,為了確定一個選擇有效屬性的客觀流程,需要制定一套屬性選擇的標(biāo)準(zhǔn):① 選擇有限個屬性,在分類中限制地震屬性的數(shù)目,降低偽相關(guān)性發(fā)生概率,這對識別斷層尤為重要;② 每個屬性都有一個突出的地質(zhì)意義,一些地震屬性受多個地質(zhì)因素的影響,但是確定每個屬性所代表的地質(zhì)意義是非常必要的,見表1;③ 每個屬性都是獨立統(tǒng)計的,通常情況下,相關(guān)性強(qiáng)的屬性是不能用來進(jìn)行分類的。相關(guān)性強(qiáng)的屬性共同組成一個屬性簇,因此每個屬性簇里只能選擇一個屬性。
表1各地震屬性的地質(zhì)意義
Table1Geologicalmeaningofsomeseismicattributes
地震屬性沉積環(huán)境結(jié)構(gòu)連續(xù)性斷層厚度走向曲率——瞬時頻率——方差—混沌體—瞬時相位——衰減系數(shù)—傾角偏差——反射強(qiáng)度——傾角連續(xù)性——最大振幅——
注:‘—’表示具有該地質(zhì)意義。
某一種地震屬性單獨識別斷層,具有多解性。因此需要綜合利用地震屬性共同識別斷層。該問題可以看作二分類問題,即將樣本分為‘?dāng)鄬印汀菙鄬印瘍深?每個取樣點的各個屬性為樣本特征,即每個樣本點由各屬性值組成,利用支持向量機(jī)能夠解決二分類問題。利用已知斷層信息和選擇的地震屬性組成學(xué)習(xí)樣本,構(gòu)建支持向量機(jī)模型,對采區(qū)未知區(qū)域進(jìn)行斷層識別。
WTX+b≥0,di=+1
WTX+b<0,di=-1
圖4 非線性可分?jǐn)?shù)據(jù)映射到高維空間Fig.4 Non-linear data mapping to high-dimensional space
構(gòu)建支持向量機(jī)模型需要選擇合適的核函數(shù)參數(shù)g和懲罰參數(shù)c,使模型識別的準(zhǔn)確率達(dá)到要求。人工選擇這些參數(shù)需要不斷的改變參數(shù),對比準(zhǔn)確率,工作量很大,并且很難短時間內(nèi)找到最合適的參數(shù),利用粒子群算法來尋找最合適的參數(shù),可以做到自動尋優(yōu)。
粒子群算法是一種模擬鳥類相互協(xié)作尋找食物的智能算法[20]。鳥類尋找食物,首先在個體飛行過程中找到距離食物最近的地方,同時和其他同伴交流,找到群體中最接近食物位置,不斷縮小與食物的距離,最后找到食物。在粒子群算法中,每個解決方案稱為粒子,通過最優(yōu)粒子解決問題[21]。粒子群算法是基于群體的,不依賴個體的演化,而是根據(jù)對環(huán)境的適應(yīng)度,找到群體的最優(yōu)值。在一維空間中,某個個體的位置表示為xi,該個體運動過程中,適應(yīng)值最好的位置為pi,群體中所有個體中適應(yīng)值最好的位置為pg,個體的運動速度為vi,則對于每一代,個體的位置和速度將進(jìn)行以下變化:
vi=wvi+c1rand( )(pi-xi)+
其中,w為慣性權(quán)重;c1和c2為加速常數(shù);rand( )和Rand( )為在0到1范圍內(nèi)的隨機(jī)值。w保證在全局范圍內(nèi)尋優(yōu),c1使個體在自身運動中尋優(yōu),c2在群落中信息共享。尋優(yōu)時,重復(fù)(1),(2)直到找到最優(yōu)適應(yīng)值或達(dá)到最大代數(shù)時停止。粒子群算法易實現(xiàn),收斂速度快,所以在許多領(lǐng)域都廣泛應(yīng)用,如人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練、函數(shù)優(yōu)化、模式識別[22]、數(shù)據(jù)挖掘中的優(yōu)化問題等[23]。
利用學(xué)習(xí)樣本對支持向量機(jī)進(jìn)行訓(xùn)練,同時應(yīng)用粒子群算法尋找到最適合的參數(shù)c和g,使模型分類正確率最高,得到最優(yōu)支持向量機(jī)模型。利用構(gòu)建的支持向量機(jī)模型,進(jìn)行采區(qū)未知區(qū)域的斷層識別。
以羊東礦的2號煤層為例,通過區(qū)內(nèi)測井標(biāo)定該煤層,利用斯倫貝謝公司捐贈我校的Petrel地震解釋軟件,解釋得到2號煤的層位;采區(qū)地震數(shù)據(jù)的面元為5 m×10 m,在解釋軟件中的面元為5 m×5 m,對采區(qū)地震數(shù)據(jù)提取上述10種地震屬性,形成采區(qū)屬性數(shù)據(jù);屬性數(shù)據(jù)同樣為5 m×5 m的網(wǎng)格,采區(qū)內(nèi)共48 000個數(shù)據(jù)點;將鉆井處、巷道處的屬性值和斷層信息,匯總成網(wǎng)絡(luò)的樣本數(shù)據(jù)。采區(qū)內(nèi)共有鉆井14口、巷道3條;提取鉆井處2號煤層和巷道處的10種屬性值,其中巷道中除揭露的斷層外,每5 m一個采樣點提取屬性值,并記錄每個取樣點處,是否存在斷層,“存在”用‘1’表示,“不存在”用‘0’表示,共提取606個樣本數(shù)據(jù)。
分析樣本數(shù)據(jù),計算各屬性間的相關(guān)系數(shù),見表2;然后進(jìn)一步分析,利用R型聚類分析,評估各屬性間的相關(guān)性,如圖5所示??梢缘贸?方差、傾角連續(xù)性、混沌體的相關(guān)性較高;反射強(qiáng)度、瞬時頻率和最大振幅3種屬性的相關(guān)性高;根據(jù)相關(guān)系數(shù)的計算和R型聚類分析的結(jié)果,可知:方差、走向曲率、瞬時相位和最大振幅相關(guān)性較差,相對獨立,同時4種屬性都具有斷層的地質(zhì)意義。因此,選擇這4種屬性作為支持向量機(jī)的樣本。
表2地震屬性相關(guān)系數(shù)
Table2Correlationcoefficientsofseismicattributes
參數(shù)1234567891011-0.0743-0.0771-0.5490.0051-0.14310.04750.23430.68320.63822-0.07431-0.06310.23570.44090.06490.0540-0.1151-0.0127-0.14583-0.0771-0.063110.27940.03790.22320.0772-0.1420-0.1003-0.00154-0.54900.23570.27941-0.00500.37140.3575-0.2144-0.3505-0.513050.00510.44090.0379-0.005010.1327-0.39690.06830.06700.07756-0.14310.06490.22320.37140.132710.31740.0039-0.1985-0.031570.04750.05400.07720.3575-0.39690.317410.0746-0.19440.107880.2343-0.1151-0.1420-0.21440.06830.00390.074610.04910.258890.6832-0.0127-0.1003-0.35050.0670-0.1985-0.19440.049110.0987100.6382-0.1458-0.0015-0.51300.0775-0.03150.10780.25880.09871
注:1—方差;2—衰減系數(shù);3—走向曲率;4—反射強(qiáng)度;5—瞬時相位;6—最大振幅;7—瞬時頻率;8—傾角偏差;9—傾角連續(xù)性;10—混沌體。
圖5 R型聚類分析Fig.5 R cluster analysis1—方差;2—衰減系數(shù);3—走向曲率;4—反射強(qiáng)度;5—瞬時相位;6—最大振幅;7—瞬時頻率;8—傾角偏差;9—傾角連續(xù)性;10—混沌體
由于4種屬性的量綱不同,影響網(wǎng)絡(luò)訓(xùn)練結(jié)果,所以在訓(xùn)練之前,對樣本進(jìn)行歸一化處理,以消除量綱。從處理后的數(shù)據(jù)中,選出已知的606個樣本數(shù)據(jù),其中斷層樣本105個,非斷層樣本501個。從樣本數(shù)據(jù)中選取400個數(shù)據(jù)作為訓(xùn)練樣本,206個樣本作為測試數(shù)據(jù)。
利用粒子群算法,把預(yù)測斷層的支持向量機(jī)模型的正確率作為適應(yīng)度函數(shù),將模型的懲罰參數(shù)c和核函數(shù)參數(shù)g作為待優(yōu)化參數(shù),優(yōu)化預(yù)測斷層的支持向量機(jī)模型。通過優(yōu)化得到進(jìn)化代數(shù)和適應(yīng)度關(guān)系的曲線(圖6),可知進(jìn)化到20代后最佳適應(yīng)度值就不再發(fā)生變化,此時最佳的懲罰參數(shù)c=70.644 6,核函數(shù)參數(shù)g=62.326 0。經(jīng)過訓(xùn)練后的支持向量機(jī)模型的權(quán)值向量為w=[5.634 6,-2.792 0,-1.004 3,-4.607 8]T,偏置b為0.007 9,對訓(xùn)練后的模型進(jìn)行測試,模型預(yù)測的正確率達(dá)到了98.54%(表3)。
圖6 進(jìn)化代數(shù)與適應(yīng)度關(guān)系Fig.6 Relationship between evolutionary algebra and fitness
預(yù)測錯誤個數(shù)數(shù)據(jù)總個數(shù)正確率/%均方誤差(MSE)平方相關(guān)系數(shù)(R2)320698.540.01460.9291
利用支持向量機(jī),通過對采區(qū)的斷層預(yù)測分析,得到斷層預(yù)測模型中各屬性的權(quán)值,見表4。由表4可以得出:預(yù)測斷層的屬性因子中由幾何特征和信號特征主導(dǎo);瞬時相位等與運動特征相關(guān)的屬性相對來說權(quán)值較小,對斷層預(yù)測結(jié)果的影響較小。
表4屬性因子權(quán)重分析
Table4Analysisofattributeweight
判別因子幾何特征方差走向曲率運動特征瞬時相位信號特征最大振幅權(quán)值5.6346-2.7920-1.0043-4.6078順序1342
圖7(a)為常規(guī)的振幅剖面,巷道揭露6個斷層,圖7箭頭所指的位置,巷道揭露A處斷層的落差為10~15 m,B處斷層落差為8~10 m,C處斷層的落差為4~5 m,D處斷層落差為3~4 m,E處斷層落差為7~8 m,F(xiàn)處斷層落差為6~7 m。利用訓(xùn)練好的支持向量機(jī),對該剖面進(jìn)行斷層識別,結(jié)果如圖7(b)所示。圖7(a)中斷層的位置,在支持向量機(jī)模型識別的結(jié)果中均有斷層,說明模型識別具有很高的正確率。將支持向量機(jī)模型與常規(guī)剖面解釋、單屬性解釋的斷層分布情況進(jìn)行對比分析:常規(guī)剖面解釋如果僅利用同相軸的錯斷、扭曲、分叉、相位轉(zhuǎn)換等斷層的標(biāo)志,2號煤層的4個斷層,只解釋出斷層A,B,E,F,這4個斷層的落差較大,而C處和D處的同相軸沒有錯斷、扭曲等斷層的標(biāo)志出現(xiàn),落差較小,因而不能識別C,D這種落差小的不明顯斷層;而圖7(b)中將常規(guī)剖面不能識別的C,D處的斷層識別出來,體現(xiàn)了支持向量機(jī)模型較常規(guī)剖面識別小斷層方面的優(yōu)越性。
圖7 支持向量機(jī)模型與常規(guī)解釋的斷層識別對比Fig.7 Comparison of SVM model with conventional interpretation
利用方差體屬性識別斷層,剖面中錯斷型斷層均識別出來,但因為C處和D處沒有錯斷,所以沒有方差值異常,顯示無斷層存在;利用走向曲率體屬性識別斷層,C處有顏色變化,說明有斷層存在,但是D處沒有顏色變化,走向曲率值接近于0,依然不能識別D處的斷層;利用瞬時相位屬性識別斷層,D處位于兩個不同相位的分界處,同時D處前后取樣點的瞬時相位值分別為26.74和-35.58,瞬時相位發(fā)生反轉(zhuǎn),說明有斷層存在。瞬時相位屬性將方差屬性與走向曲率屬性不能識別的D處斷層識別出來,但是通過瞬時相位屬性剖面,很難直接看出斷層的分布情況和趨勢。通過對比,每個屬性在識別斷層方面各具優(yōu)勢,但支持向量機(jī)模型能夠準(zhǔn)確、直觀地識別斷層,更重要的是能夠識別出落差3~5 m的小斷層。
總體來看,支持向量機(jī)模型綜合每種屬性的識別能力,具有識別準(zhǔn)確率高,斷層傾向明顯、直觀,能夠識別小斷層的特點,有效減少了斷層解釋的多解性,這些特點是常規(guī)剖面解釋和單屬性斷層解釋所不能比擬的。
通過支持向量機(jī)模型識別斷層,得到采區(qū)斷層分布,如圖8所示,可以看出:向量機(jī)模型預(yù)測斷層相對連續(xù)。
圖8 模型預(yù)測與人工解釋對比Fig.8 Comparison between model prediction and manual interpretation
在圖8的A處,利用方差體、走向曲率、瞬時相位單屬性預(yù)測均無斷層特征,說明無斷層存在;但利用最大振幅屬性預(yù)測有斷層存在。向量機(jī)模型預(yù)測結(jié)果表明A處存在斷層,與常規(guī)人工解釋的結(jié)果相同,同時與鉆井資料吻合。表明支持向量機(jī)模型能夠融合各個屬性的特征,從不同角度挖掘斷層信息,發(fā)揮各屬性的優(yōu)勢。
在圖8的B處,利用方差體、走向曲率單屬性預(yù)測無斷層,而瞬時相位和最大振幅單屬性預(yù)測存在斷層,但是利用向量機(jī)模型預(yù)測的結(jié)果B處沒有斷層,與常規(guī)人工解釋B處存在斷層的結(jié)果相悖。由于B處沒有鉆井,就是說B處沒有鉆井提供學(xué)習(xí)樣本,使得向量機(jī)模型存在誤差。因此,提高支持向量機(jī)模型預(yù)測斷層的準(zhǔn)確率,除了模型本身的準(zhǔn)度之外,對鉆井的數(shù)量和分布情況也有一定的要求:首先,鉆井的數(shù)目不能過少。學(xué)習(xí)樣本越豐富,模型學(xué)習(xí)的斷層信息就越全面,預(yù)測斷層的效果就越接近實際情況;其次,鉆井的分布要均勻,這樣得到的學(xué)習(xí)數(shù)據(jù)具有代表性,能夠代表整個采區(qū)斷層的特征。
通過對比模型解釋和人工解釋的結(jié)果,兩者的差異不是很大,斷層的主要分布格局基本相同,貫穿全區(qū)的3條大斷層,基本吻合,只有一些規(guī)模較小的斷層不吻合。同時,模型解釋與人工解釋相比縮短了解釋周期,該采區(qū)利用模型解釋從屬性數(shù)據(jù)處理、評估到模型訓(xùn)練、預(yù)測所用的時間不到人工解釋時間的一半。
綜合從剖面和平面兩個角度的分析對比:無論是常規(guī)斷層解釋,還是單屬性斷層識別,都無法識別出所有類型的斷層,但支持向量機(jī)模型能夠識別所有種類的斷層,同時還具有快速、準(zhǔn)確、直觀、識別小斷層等優(yōu)點。
(1)支持向量機(jī)模型融合了各屬性預(yù)測斷層的優(yōu)勢,從不同角度挖掘斷層信息,較單屬性預(yù)測的結(jié)果更準(zhǔn)確,基本與人工解釋相吻合,降低了解釋人員主觀因素對解釋結(jié)果的影響。
(2)采區(qū)鉆井空間分布的密度及均勻情況都直接影響到模型預(yù)測的準(zhǔn)確率。鉆井分布越密集,越均勻,學(xué)習(xí)樣本就越豐富,越具有代表性,預(yù)測的結(jié)果準(zhǔn)確率就越高。若采區(qū)的鉆井或巷道信息較少,也可以考慮利用常規(guī)剖面上能夠確定的斷層,作為學(xué)習(xí)樣本,這樣可以增加學(xué)習(xí)樣本的豐富程度,提高模型預(yù)測的準(zhǔn)確率。
(3)方差、走向曲率與最大振幅是影響斷層預(yù)測的主導(dǎo)因素,權(quán)重分析驗證了屬性選取的科學(xué)性。因此,可以通過權(quán)重分析反證屬性選擇的合理性。
(4)在構(gòu)建支持向量機(jī)模型時,模型本身的結(jié)構(gòu),如輸入樣本種類多少、參數(shù)選擇、直接影響模型識別準(zhǔn)確率外,地震屬性的選擇更加重要。采區(qū)不同,斷層類型不同,選擇的地震屬性也會不同,因此,選擇哪些地震屬性,需要根據(jù)采區(qū)斷層的具體情況決定。
(5)支持向量機(jī)模型預(yù)測斷層工作周期較常規(guī)人工解釋大幅縮短,能更有效的指導(dǎo)生產(chǎn)工作,提高生產(chǎn)的效率。
[1] 董守華,石亞丁,汪洋.地震多參數(shù)BP人工神經(jīng)網(wǎng)絡(luò)自動識別小斷層[J].中國礦業(yè)大學(xué)學(xué)報,1997,26(3):14-18.
[2] 王開燕,徐清彥,張桂芳,等.地震屬性分析技術(shù)綜述[J].地球物理學(xué)進(jìn)展,2013,28(2):815-823.
WANG Kaiyan,XU Qingyan,ZHANG Guifang,et al.Summary of seismic attribute analysis[J].Progress in Geophysics,2013,28(2):815-823.
[3] DI Haibin,GAO Dengliang.A new algorithm for evaluating 3D curvature and curvature gradient for improved fracture detection[J].Computer & Geosciences,2014,70:15-15.
[4] 杜文鳳,彭蘇萍.利用地震層曲率進(jìn)行煤層小斷層預(yù)測[J].巖石力學(xué)與工程學(xué)報,2008,27(S1):2901-2906.
DU Wenfeng,PENG Suping.Seismic horizon curvature for predicting small fault in coalseam[J].Chinese Journal of Rock Mechanics and Engineering,2008,27(S1):2901-2906.
[5] 杜文鳳,彭蘇萍,黎咸威.基于地震層曲率體屬性預(yù)測煤層裂隙[J].煤炭學(xué)報,2006,31(S0):30-33.
DU Wenfeng,PENG Suping,LI Xianwei.Seismic horizon curvature attribute for predicting coalseam fracture[J].Journal of China Coal Society,2006,31(S0):30-33.
[6] 李婷婷,王釗,馬世忠,等.地震屬性融合方法綜述[J].地球物理學(xué)進(jìn)展,2015,30(1):378-385.
LI Tingting,WANG Zhao,MA Shizhong,et al.Summary of seismic attributes fusion method[J].Progress in Geophysics,2015,30(1):378-385.
[7] LIN Shihwei,LEE Znejung,CHEN Shihchieh,et al.Parameter determination of support vector machine and feature selection using simulated annealing approach[J].Applied Soft Computing,2008,8:1505-1512.
[8] 李艷芳,程建遠(yuǎn),王成.基于支持向量機(jī)的地震屬性優(yōu)選及煤層氣預(yù)測[J].煤田地質(zhì)與勘探,2012,40(6):75-78.
LI Yanfang,CHENG Jianyuan,WANG Cheng.Seismic attribute optimization based on support vector machine and coalbed methane prediction[J].Coal Geology & Exploration,2012,40(6):75-78.
[9] 邵良杉,張宇.基于小波理論的支持向量機(jī)瓦斯涌出量的預(yù)測[J].煤炭學(xué)報,2011,36(S1):104-107.
SHAO Liangshan,ZHANG Yu.Mine gas gushing forecasting based on wavelet theory support vector machine[J].Journal of China Coal Society,2011,36(S1):104-107.
[10] 孫云普,王云飛,鄭曉娟.基于遺傳-支持向量機(jī)法的煤層頂板導(dǎo)水?dāng)嗔褞Ц叨鹊姆治鯷J].煤炭學(xué)報,2009,34(12):1610-1615.
SUN Yunpu,WANG Yunfei,ZHENG Xiaojuan.Analysis the height of water conducted zone of coal seam roof based on GA-SVR[J].Journal of China Coal Society,2009,34(12):1610-1615.
[11] 曹慶奎,趙斐.基于遺傳-支持向量機(jī)的煤層底板突水量預(yù)測研究[J].煤炭學(xué)報,2011,36(12):2097-2101.
CAO Qingkui,ZHAO Fei.Forecast of water inrush quantity from coal floor based on genetic algorithm-support vector regression[J].Journal of China Coal Society,2011,36(12):2097-2101.
[12] 施龍青,譚希鵬,王娟,等.基于PCA_Fuzzy_PSO_SVC的底板突水危險性評價[J].煤炭學(xué)報,2015,40(1):167-171.
SHI Longqing,TAN Xipeng,WANG Juan,et al.Risk assessment of water inrush based on PCA_Fuzzy_PSO_SVC[J].Journal of China Coal Society,2015,40(1):167-171.
[13] 羅勝元,何生,王浩.斷層內(nèi)部結(jié)構(gòu)及對封閉性的影響[J].地球科學(xué)進(jìn)展,2012,27(2):151-164.
LUO Shengyuan,HE Sheng,WANG Hao.Review on fault internal structure and the influence on fault sealing ability[J].Advances in Earth Science,2012,27(2):151-164.
[14] KIM Y S,PEACOCK D C P,SANDERSON D J.Mesoscale strike-slip faults and damage zones at Marsalforn,Gozo Island,Malta[J].Journal of Structural Geology,2003,25(5):793-812.
[15] SAMMA H,LIM C P,SALEH J M,et al.A memetic-based fuzzy support vector machine model and its application to license plate recognition[J].Memetic Computing,2016,8:235-251.
[16] LIN Shihwei,LEE Znejung,CHEN Shihchieh.Particle swarm optimization for parameter determination and feature selection of support vector machines[J].Expert Systems with Applications,2008,35:1817-1824.
[17] BARATI Masoud,SHARIFIAN Saeed.A hybrid heuristic-based tuned support vector regression model for cloud load prediction[J].The Journal of Supercomputing,2015,71:4235-4259.
[18] CHENG W Y,JUANG C F.An incremental support machine-trained TS-type fuzzy system for online classification problems[J].Fuzzy Sets and Systems,2011,163:24-44.
[19] HONG W C.Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model[J].Energy Conversion and Management,2009,50:105-117.
[20] 賈義鵬,呂慶,尚岳全.基于粒子群算法和廣義回歸神經(jīng)網(wǎng)絡(luò)的巖爆預(yù)測[J].巖石力學(xué)與工程學(xué)報,2013,32(2):343-348.
JIA Yipeng,Lü Qing,SHANG Yuequan.Rockburst prediction using particle swarm optimization algorithm and general regression neural network[J].Chinese Journal of Rock Mechanics and Engineering,2013,32(2):343-348.
[21] KUO R J,WANG M J,HUANG T W.An application of particle swarm optimization algorithm to clustering analysis[J].Soft Computing,2011,15:533-542.
[22] BONYADI M R,MICHALEWICZ Z,LI Xiaodong.An analysis of the velocity updating rule of the particle swarm optimization algorithm[J].Journal of Heuristics,2014,20:417-452.
[23] 劉建華.粒子群算法的基本理論及其改進(jìn)研究[D].長沙:中南大學(xué),2009:8-9.
LIU Jianhua.The research of basic theory and improvement on particle swarm optimization[D].Changsha:Central South University,2009:8-9.
AutomaticidentificationofsmallfaultsbasedonSVMandseismicdata
SUN Zhenyu,PENG Suping,ZOU Guangui
(StateKeyLaboratoryofCoalResourcesandSafeMining,ChinaUniversityofMiningandTechnology(Beijing),Beijing100083,China)
In order to improve the seismic identification accuracy of small fault,an automatic fault recognition method based on support vector machine (SVM) is constructed.The fault identification model of SVM two classification was established by analyzing the characteristics of seismic attributes of tectonic and non-tectonic sites.Firstly,the basic principle and structure of the algorithm about SVM two classification were studied.It showed that SVM has the advantages of high accuracy in two classification problems.Then,a fault forward model was established to analyze the fault response characteristics of different seismic attributes,indicating that the fault distribution is related to the trend of the attribute value.By analyzing the SVM and forward model,it showed that it is feasible to use the seismic attribute as learning modules to predict small faults.A set of attributes related to faults,such as variance and curvature,was extracted from the post-stack seismic data.Four attributes with low correlation were determined by correlation and cluster analysis.Among total 606 data that consisted of the faults and attributes information from 14 drillings and 3 tunnels,400 data were used as training samples and constructed SVM fault identification model.The authors used 206 data as test samples to identify faults.The correct rate is 98%.The SVM fault identification established by seismic attributes can effectively identify faults,reduce the influence of human subjective factors,and shorten the time of interpretation.The more uniform the drilling distribution,the more the number,the higher the interpretation accuracy.
support vector machine;faults;automatic identification;seismic attributes
孫振宇,彭蘇萍,鄒冠貴.基于SVM算法的地震小斷層自動識別[J].煤炭學(xué)報,2017,42(11):2945-2952.
10.13225/j.cnki.jccs.2017.0972
SUN Zhenyu,PENG Suping,ZOU Guangui.Automatic identification of small faults based on SVM and seismic data[J].Journal of China Coal Society,2017,42(11):2945-2952.doi:10.13225/j.cnki.jccs.2017.0972
P631.4
A
0253-9993(2017)11-2945-08
2017-07-14
2017-09-22責(zé)任編輯韓晉平
國家自然科學(xué)基金青年基金資助項目(41402143);國家重點研發(fā)計劃資助項目(2016YFC0501102);國家科技重大專項資助項目(2016ZX05066001-001)
孫振宇(1991—),男,吉林松原人,碩士研究生。E-mail:szy93126@126.com。
彭蘇萍(1959—),男,江西萍鄉(xiāng)人,中國工程院院士。E-mail:psp@cumtb.edu.cn