張軍華, 任雄風(fēng), 趙 杰, 譚明友, 于正軍
(1.中國(guó)石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,青島 266580;2.勝利油田物探研究院,東營(yíng) 257022)
東營(yíng)凹陷中淺部?jī)?chǔ)層油氣勘探,大多都形成了技術(shù)系列與規(guī)范。而深部?jī)?chǔ)層其成因及成藏機(jī)制的研究還不夠深入,地震資料品質(zhì)相對(duì)較差,鉆遇井又比較少,儲(chǔ)層厚度預(yù)測(cè)有較大的困難。
儲(chǔ)層預(yù)測(cè)有很多方法,支持向量機(jī)方法(SVM)由于能很好地解決樣本少、非線性、高維數(shù)和局部極小點(diǎn)問題[1],對(duì)于少井區(qū)的儲(chǔ)層預(yù)測(cè),是值得優(yōu)先使用的方法[2-3]。SVM最早由Vapnik根據(jù)模式識(shí)別中廣義肖像算法發(fā)展而來[4-5],隨著對(duì)ε不敏感損失函數(shù)的引入[6],學(xué)習(xí)性能得到提高,在建模、預(yù)測(cè)等方面取得了很好的應(yīng)用效果[7-9]。鄒華勝等將SVM引入少訓(xùn)練樣本的儲(chǔ)層厚度預(yù)測(cè)中,預(yù)測(cè)相對(duì)誤差較BP人工神經(jīng)更小[10]。張長(zhǎng)開等通過SVM的屬性優(yōu)選方法選出有效屬性,基于SVM對(duì)儲(chǔ)層進(jìn)行了有效預(yù)測(cè)[11]。林年添等利用聚類分析法對(duì)用卷積升維形成的各類縱、橫波地震屬性進(jìn)行降維,將用聚合法得到的多波地震聚合屬性作為SVM的學(xué)習(xí)集進(jìn)行含油氣儲(chǔ)層預(yù)測(cè),預(yù)測(cè)儲(chǔ)層邊界更加清晰與實(shí)際情況較吻合[12]。SVM儲(chǔ)層預(yù)測(cè),關(guān)鍵因素有兩個(gè):一是選好核函數(shù),本文采用的是適用于高維、小樣本的高斯徑向基函數(shù);二是調(diào)好核函數(shù)參數(shù)g和懲罰因子C,它們會(huì)直接影響SVM泛化能力和預(yù)測(cè)精度[13-14]。為了使每口井都能參加訓(xùn)練并且得到驗(yàn)證,在選取懲罰因子和核函數(shù)參數(shù)的訓(xùn)練過程中應(yīng)用了交叉驗(yàn)證方法[15],進(jìn)一步提高了儲(chǔ)層厚度的預(yù)測(cè)精度。
東營(yíng)凹陷深層發(fā)育紫紅色泥巖或棕紅色砂巖,地質(zhì)界稱其為“紅層”。由于年代老、埋深大,砂、泥巖波阻抗差異較小,地震反射相對(duì)較弱,砂體疊置,致使其研究具有很強(qiáng)的挑戰(zhàn)性,研究成果對(duì)拓展油氣勘探領(lǐng)域有重要科研及生產(chǎn)價(jià)值。
如圖1所示為研究區(qū)王古9井(鉆遇紅層)的過井剖面,可以大致將地層范圍分為紅層上覆地層、紅層和紅層下伏地層,可以看到,紅層以上地層和紅層以下中生界地層成層性都很好,但是中部紅層成層性反而低。結(jié)合該井目標(biāo)層段——孔一段錄井資料(圖2),可見其速度結(jié)構(gòu)復(fù)雜,測(cè)井曲線抖動(dòng)非常多,綜合地震相特征分析,說明紅層是以速度變化很大的薄互層為典型特征。
圖1 研究區(qū)王古9井過井剖面
圖2 王古9井孔一段錄井圖
研究區(qū)埋深較大,多在3 000 m以上;而面積較大(586 km2),鉆遇目標(biāo)層的井卻很少,有可靠測(cè)井?dāng)?shù)據(jù)的只有三十幾口。儲(chǔ)層埋深大、層薄、成層性差,地震資料分辨率不夠高,加上鉆遇井少等多種因素,決定著儲(chǔ)層預(yù)測(cè)有很大的難度。
地震屬性是地震數(shù)據(jù)經(jīng)過數(shù)學(xué)變換而得來的有關(guān)地震波幾何學(xué)、運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)或統(tǒng)計(jì)特征,地質(zhì)含義明確的地震屬性常與儲(chǔ)層有一定的對(duì)應(yīng)關(guān)系。對(duì)于孔一中儲(chǔ)層,提取振幅、頻率、相位等12種沿層屬性,利用基于核相似性度量的特征選擇方法,優(yōu)選出帶寬、能量半時(shí)、最大振幅、均方根振幅、過零點(diǎn)個(gè)數(shù)和弧長(zhǎng)等6種地震屬性,用于樣本訓(xùn)練。它們的物理意義和地質(zhì)含義是明確的:帶寬是指優(yōu)勢(shì)頻帶的寬度,與地震資料的品質(zhì)相關(guān)性較大;能量半時(shí)屬性反映了分析時(shí)窗內(nèi)能量相對(duì)變化關(guān)系,能夠指示沉積環(huán)境與巖性巖相變化;最大振幅適合于巖性分析及砂巖百分比研究,儲(chǔ)層含油氣后一般振幅會(huì)增強(qiáng);均方根振幅間接地反映了地震反射系數(shù)的大小,可以用來指示地下巖性的變化;過零點(diǎn)個(gè)數(shù)屬性能夠較好地描述地震波振幅過零點(diǎn)的個(gè)數(shù),包含了巖性、流體等信息;弧長(zhǎng)屬性是指時(shí)窗內(nèi)地震道波形的長(zhǎng)度,對(duì)于阻抗差較大的儲(chǔ)層反映效果不錯(cuò)。
如圖3所示為6種地震屬性和孔一中井點(diǎn)厚度圖?;\統(tǒng)地看,帶寬、能量半時(shí)、最大振幅、均方根振幅、過零點(diǎn)個(gè)數(shù)和弧長(zhǎng)6種地震屬性,對(duì)孔一中的儲(chǔ)層局部均有較好的相關(guān)度,但單個(gè)屬性還不能全面描述整個(gè)工區(qū)儲(chǔ)層變化。為此,要建立井點(diǎn)厚度與屬性的定量關(guān)系,用SVM來進(jìn)行訓(xùn)練和預(yù)測(cè)。
圖3 孔一中地震屬性及井點(diǎn)厚度
給定樣本集{(xi,yi),i=1,2,…,m},其中xi是輸入數(shù)據(jù),yi是與之對(duì)應(yīng)的標(biāo)簽值,m為樣本個(gè)數(shù)。SVM回歸具有稀疏性,若樣本點(diǎn)與回歸模型足夠接近,即落入回歸模型的間隔邊界內(nèi),則不計(jì)算損失,對(duì)應(yīng)的損失函數(shù)被稱為ε-不敏感損失函數(shù):
error[y,f(x)]=max[0,|f(x)-y|-ε]
(1)
式(1)中:ε是決定邊界寬度的超參數(shù),訓(xùn)練學(xué)習(xí)就是為了使構(gòu)造的函數(shù)f(x)與輸入數(shù)據(jù)對(duì)應(yīng)目標(biāo)值y的距離小于ε。當(dāng)樣本集為非線性時(shí),SVM首先在低維空間中完成計(jì)算,而后經(jīng)過核函數(shù)φ(x)將輸入數(shù)據(jù)x映射到一個(gè)高維線性空間,在高維線性空間中完成回歸模型的構(gòu)建,即:
f(x)=ω·φ(x)+b
(2)
式(2)中:ω是權(quán)重向量;b是偏置項(xiàng)。
SVM回歸為式(3)所示的二次凸優(yōu)化問題:
(3)
由于ε-不敏感損失函數(shù)采用max并非處處可導(dǎo),微分時(shí)會(huì)有問題,因此使用松弛變量ξ、ξ*進(jìn)行表示,可得:
(4)
式(4)中:C為懲罰因子;ε為誤差上限。通過引入拉格朗日因子α、α*、μ、μ*,可得式(4)的拉格朗日函數(shù)[式(5)]和式(6)所示的對(duì)偶優(yōu)化模型:
L(ω,b,ξ,ξ*,α,α*,μ,μ*)=
(5)
(6)
式中:φ(xi)φ(xj)為核函數(shù),可記為k(xi,xj)。上述對(duì)偶問題有如式(7)的KKT條件(一組解是最優(yōu)解的必要條件):
(7)
對(duì)該對(duì)偶問題進(jìn)行求解,可以得到如式(8)所示的SVM回歸函數(shù)形式:
(8)
由式(8)可知,將非線性樣本從低維映射到高維空間只需要計(jì)算核函數(shù)k(xi,xj),核函數(shù)有多種,選擇高斯徑向基函數(shù),如式(9):
g>0
(9)
由上述可知,SVM的訓(xùn)練過程中有兩個(gè)重要參數(shù):懲罰因子C和核函數(shù)參數(shù)g。懲罰因子C用來控制目標(biāo)函數(shù)兩項(xiàng)間的權(quán)重,其值大小將影響回歸模型的泛化能力。核函數(shù)參數(shù)g取值偏小,高次特征衰減速度會(huì)很快,可降低空間維數(shù);若取值偏大,則會(huì)出現(xiàn)過擬合。在對(duì)儲(chǔ)層厚度進(jìn)行預(yù)測(cè)時(shí),C和g這兩個(gè)參數(shù)的取值大小對(duì)預(yù)測(cè)精度至關(guān)重要,因此采用了交叉驗(yàn)證方法對(duì)二者進(jìn)行選取,優(yōu)選出最優(yōu)參數(shù)。交叉驗(yàn)證用于評(píng)估模型的預(yù)測(cè)性能,尤其是訓(xùn)練好的模型在新數(shù)據(jù)上的表現(xiàn),可以在一定程度上減小過擬合,還可以從有限的數(shù)據(jù)中獲取盡可能多的信息。采用k折交叉驗(yàn)證法,通過對(duì)k個(gè)不同子集的訓(xùn)練結(jié)果進(jìn)行平均來減少方差,使模型的性能對(duì)數(shù)據(jù)的劃分不那么敏感。首先將訓(xùn)練集隨機(jī)等分為k份,每次選取一份作為測(cè)試集,其他k-1份作為訓(xùn)練集進(jìn)行模型訓(xùn)練,每次訓(xùn)練得到一個(gè)模型,在相應(yīng)的測(cè)試集上測(cè)試,k組測(cè)試結(jié)果的平均值作為當(dāng)前超參數(shù)(懲罰因子C和核函數(shù)參數(shù)g)下模型精度的估計(jì)。在超參數(shù)優(yōu)選范圍內(nèi)進(jìn)行訓(xùn)練,優(yōu)選出精度最高的預(yù)測(cè)模型對(duì)應(yīng)的超參數(shù),再對(duì)全部訓(xùn)練集重新訓(xùn)練得到最優(yōu)模型?;诮徊骝?yàn)證SVM儲(chǔ)層預(yù)測(cè)具體步驟如下。
(1)設(shè)置懲罰因子C和核函數(shù)參數(shù)g的優(yōu)選范圍Cmin、Cmax、gmin、gmax,以及二者的優(yōu)選步長(zhǎng)ΔC、Δg。
(2)將訓(xùn)練集隨機(jī)等分為n份,令C=Cmin,g=gmin,k=1,i=1。
(3)取第i組作為驗(yàn)證集,其他組作為訓(xùn)練數(shù)據(jù)。
(4)計(jì)算訓(xùn)練后在驗(yàn)證集上損失函數(shù)的大小εi。
(5)令i=i+1,若i≤n,轉(zhuǎn)到(3),否則轉(zhuǎn)到(6)。
(7)令C=C+ΔC,k=k+1,若C≤Cmax,轉(zhuǎn)到(2),否則轉(zhuǎn)向(8)。
(8)在計(jì)算出的損失誤差Lk中選取最小值,其對(duì)應(yīng)的超參數(shù)作為最優(yōu)參數(shù)在整個(gè)訓(xùn)練集上重新進(jìn)行訓(xùn)練。
利用鉆遇孔一中目標(biāo)層的33口井,從中選取3口井驗(yàn)證儲(chǔ)層預(yù)測(cè)效果。將優(yōu)選出來的帶寬、能量半時(shí)、最大振幅、均方根振幅、過零點(diǎn)個(gè)數(shù)和弧長(zhǎng)等6種地震屬性作為輸入數(shù)據(jù),以其他30口井點(diǎn)處的屬性值及對(duì)應(yīng)的儲(chǔ)層厚度作為訓(xùn)練樣本進(jìn)行訓(xùn)練。懲罰因子C和核函數(shù)參數(shù)g的取值按照上述的交叉驗(yàn)證步驟在一定范圍來優(yōu)選,令n=6,經(jīng)訓(xùn)練得到最優(yōu)參數(shù)C=14、g=3。圖4(a)為用C=14、g=3預(yù)測(cè)出來的應(yīng)用工區(qū)的儲(chǔ)層厚度,在表1中給出了預(yù)留下3口井的預(yù)測(cè)值以及與實(shí)際值的相對(duì)誤差,誤差都在10%以下。
如果不采用交叉驗(yàn)證優(yōu)選出的參數(shù)C和g,預(yù)測(cè)精度會(huì)受到較大影響,圖4(b)是使用非優(yōu)選出來的參數(shù)C=14、g=1預(yù)測(cè)得到實(shí)際工區(qū)的儲(chǔ)層厚度圖,在表1中也給出了3口驗(yàn)證井出的預(yù)測(cè)值及其與實(shí)際值的相對(duì)誤差大小,可以看到每口井的預(yù)測(cè)誤差都有較大增幅,其中W113和Tg1井的誤差都大于14%。結(jié)果表明,用交叉驗(yàn)證優(yōu)選出的懲罰因子C和核函數(shù)g進(jìn)行儲(chǔ)層預(yù)測(cè),可以有效提高預(yù)測(cè)精度。
表1 驗(yàn)證井儲(chǔ)層預(yù)測(cè)厚度及誤差統(tǒng)計(jì)
注:( )中為相對(duì)誤差。
用線性擬合方法計(jì)算儲(chǔ)層厚度,結(jié)果如圖4(c)所示。從驗(yàn)證井的誤差分析來看,交叉驗(yàn)證SVM方法要好于不采用交叉驗(yàn)證的SVM方法,但綜合來看兩種方法都要好于直接擬合的線性回歸方法。
東營(yíng)凹陷孔一段儲(chǔ)層埋深大、層薄、成層性差,地震資料分辨率不夠高,加上鉆遇井少,單一地震屬性僅對(duì)儲(chǔ)層局部有較好的相關(guān)度,不能全面描述整個(gè)工區(qū)儲(chǔ)層變化。而SVM算法作為一種基于統(tǒng)計(jì)學(xué)理論的機(jī)器學(xué)習(xí)算法,在樣本數(shù)少的情況下也擁有良好的學(xué)習(xí)能力和預(yù)測(cè)精度,要好于直接擬合的線性回歸方法。但要充分發(fā)揮SVM的學(xué)習(xí)和預(yù)測(cè)性能,懲罰因子C和核函數(shù)參數(shù)g的選取至關(guān)重要,它們對(duì)預(yù)測(cè)精度影響較大。實(shí)際資料應(yīng)用誤差分析表明,交叉驗(yàn)證SVM方法有較好的預(yù)測(cè)精度,對(duì)中外深部?jī)?chǔ)層預(yù)測(cè)有借鑒作用。