富 宇,李 滕,郭曉萍
(東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)
大慶薩中開發(fā)區(qū)經(jīng)過長(zhǎng)期的水驅(qū)開發(fā),儲(chǔ)層結(jié)構(gòu)發(fā)生非均質(zhì)性變化,儲(chǔ)層內(nèi)形成優(yōu)勢(shì)滲流通道,在注采井之間形成了滲透率很高的流動(dòng)通道,被稱之為優(yōu)勢(shì)滲流通道。優(yōu)勢(shì)滲流通道形成后,儲(chǔ)層內(nèi)微觀流場(chǎng)發(fā)生巨大變化,這些變化會(huì)在測(cè)井曲線上形成響應(yīng)特征。提取這些響應(yīng)特征,將響應(yīng)特征組成特征向量,利用機(jī)器學(xué)習(xí)相關(guān)理論建立智能識(shí)別模型,從而實(shí)現(xiàn)優(yōu)勢(shì)滲流通道的識(shí)別[1]。目前國(guó)內(nèi)外優(yōu)勢(shì)滲流通道主要識(shí)別方法有生產(chǎn)動(dòng)態(tài)監(jiān)測(cè)法、試井資料法、示蹤劑監(jiān)測(cè)法、測(cè)井解釋資料法、大孔道的模糊識(shí)別和灰色判別方法等[2]。近幾年,隨著機(jī)器學(xué)習(xí)理論及其技術(shù)的快速發(fā)展,其應(yīng)用的場(chǎng)景和范圍越來越廣,效果也越來越明顯。如何有效地將優(yōu)勢(shì)滲流通道識(shí)別和機(jī)器學(xué)習(xí)方法結(jié)合起來,將機(jī)器學(xué)習(xí)相關(guān)理論應(yīng)用到優(yōu)勢(shì)滲流通道的識(shí)別中,建立測(cè)井曲線與優(yōu)勢(shì)滲流通道的識(shí)別之間合理的預(yù)測(cè)模型,提高預(yù)測(cè)的精度和可靠性,具有重要的意義和價(jià)值[3]。
支持向量機(jī)(SVM)[4]是Cortes和Vapnik于1995年首先提出的,基于VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則。它在解決小樣本、非線性及高維模式識(shí)別等問題中表現(xiàn)出許多特有的優(yōu)勢(shì)。但是,支持向量機(jī)存在參數(shù)難以選取、選取不當(dāng)?shù)膯栴}。粒子群算法具有易實(shí)現(xiàn)、精度高、收斂快等優(yōu)點(diǎn)[5]。粒子群算法可以通過調(diào)節(jié)種群數(shù)目、迭代次數(shù)等參數(shù),確保優(yōu)化參數(shù)的質(zhì)量。利用粒子群算法對(duì)這兩個(gè)參數(shù)進(jìn)行優(yōu)化選擇,尋找全局最優(yōu)解,以降低人為因素對(duì)模型的影響,進(jìn)一步提高SVM分類模型判別的精度和運(yùn)行效率。
支持向量機(jī)方法是建立在VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原則的基礎(chǔ)上,根據(jù)對(duì)特定訓(xùn)練樣本的學(xué)習(xí)精度和學(xué)習(xí)能力(即無錯(cuò)誤地識(shí)別任意樣本的能力)之間尋求最佳折衷,以期獲得最好的泛化能力。支持向量機(jī)有兩個(gè)參數(shù)需要在模型的建立過程中選取。
(1)正則化參數(shù)C[6]。
給定訓(xùn)練樣本(x1,y1),…,(xk,yk),x∈Rn,y∈R,x為優(yōu)勢(shì)滲流通道識(shí)別的測(cè)井曲線響應(yīng)特征組合。支持向量機(jī)需要解決的非線性問題是在[7]
(1)
前提下尋找到
(2)
的最優(yōu)解。其中,訓(xùn)練向量xi通過函數(shù)φ被映射到一個(gè)更高維的空間中。
(2)核函數(shù)g[8]。
內(nèi)積函數(shù)K(x,xi)=φT(xi)φ(xj)被稱為核函數(shù),核函數(shù)引入后,在更高維的空間中SVM可以用線性函數(shù)對(duì)樣本進(jìn)行線性判別,最終得到最優(yōu)判別函數(shù)為:
(3)
文中選取了使用最廣泛的高斯徑向基核函數(shù)(RBF):
(4)
為了便于計(jì)算、表示,令:
(5)
傳統(tǒng)的參數(shù)選擇方法有實(shí)驗(yàn)法、網(wǎng)格搜索法等,由于耗時(shí)過長(zhǎng)和不必要的驗(yàn)證流程等缺點(diǎn),目前更常用的方法是群智能算法,如蟻群算法、遺傳算法和粒子群算法等[9]。
假設(shè)F維空間中,有N個(gè)粒子[10]:
粒子i的位置:Xi=(xi1,xi2,…,xiF)
粒子i的速度:Vi=(vi1,vi2,…,viF)
個(gè)體最優(yōu)位置:pbi=(pi1,pi2,…,piF)
全局最優(yōu)位置:gb=(g1,g2,…,gF)
其中,1≤d≤F,1≤i≤N。
則粒子i的迭代公式如下[11]:
速度:
vi+1=ωvi+c1r1(pbi-xi)+c2r2(gb-xi)
(6)
位置:
xi+1=xi+vi+1
(7)
粒子群算法優(yōu)化支持向量機(jī)參數(shù)步驟見圖1。
圖1 粒子群算法優(yōu)化參數(shù)
粒子群算法優(yōu)化參數(shù)具體步驟[12]:
(1)隨機(jī)生成參數(shù)C和g作為粒子群中每個(gè)粒子的初始位置。
(2)根據(jù)支持向量機(jī)模型所要求的精度和泛化性能,構(gòu)建相應(yīng)的適應(yīng)度函數(shù),作為評(píng)價(jià)粒子優(yōu)劣的計(jì)算公式。
(3)計(jì)算粒子適應(yīng)度值,據(jù)此判斷粒子當(dāng)前位置好壞,并更新粒子速度和位置,準(zhǔn)備下一次迭代搜索。
(4)若滿足終止條件,則停止整個(gè)搜索過程,輸出得到的最優(yōu)參數(shù)C和g,否則轉(zhuǎn)步驟(3),繼續(xù)循環(huán)操作。
(5)最后利用求得的最優(yōu)參數(shù)C和g組合重新構(gòu)建支持向量機(jī)模型,并對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)評(píng)價(jià),得到模型最終性能。
依據(jù)測(cè)井曲線特征建立的SVM的特征向量,它的組成參數(shù)一般來說有二類[13]:第一類是常規(guī)測(cè)井曲線進(jìn)行的特征參數(shù)提取;第二類是依據(jù)當(dāng)前的測(cè)井曲線,采用測(cè)井曲線特征比值法獲取合成曲線的特征參數(shù)提取,這類參數(shù)常見的有三個(gè):自然電位與微電極幅度的比值(SP/RMN)、深側(cè)向與微電極幅度的比值(R3LLD/RMN)、自然電位與深側(cè)向幅度的比值(SP/R3LLD)[14]。在本研究中,發(fā)現(xiàn)特征比值法獲取的參數(shù)并沒有明顯使用效果,所以,實(shí)際使用的還是依據(jù)常規(guī)測(cè)井曲線進(jìn)行的特征參數(shù)提取[15]。簡(jiǎn)要介紹一下特征參數(shù)提取的8種方法,包括平均波峰振幅、總絕對(duì)值振幅、平均能量、平均振幅、振幅的峰態(tài)、均方根振幅、能量半衰時(shí)、復(fù)數(shù)道平均瞬時(shí)振幅。下面詳細(xì)介紹2種方法[16]。
(1)能量半衰時(shí)。
在所研究的層段內(nèi),依據(jù)樣點(diǎn)數(shù)從上到下求能量總和。當(dāng)能量之和達(dá)到計(jì)算時(shí)窗內(nèi)總能量的一半時(shí),到這點(diǎn)的樣點(diǎn)個(gè)數(shù)除以總的樣點(diǎn)個(gè)數(shù)為這點(diǎn)的能量半衰時(shí)。能量半衰時(shí)是在一個(gè)周期內(nèi)時(shí)間是總測(cè)量時(shí)間一半所消耗的能量。用這個(gè)周期的時(shí)間域的百分?jǐn)?shù)來表示。能量半衰時(shí)計(jì)算如圖2所示。
圖2 能量半衰時(shí)計(jì)算
在分析層段內(nèi)能量這一屬性是定量分布,地層的變化或由流體含量、不整合或巖性有關(guān)所造成的振幅異??赡苁悄芰堪胨r(shí)的橫向變化表示的。與油氣含量有關(guān),能量半衰時(shí)也能對(duì)振幅異常描述有幫助,當(dāng)這些異常改變了分析層段內(nèi)能量的分布時(shí),能量半衰時(shí)中的變化就可以被看到。
(2)復(fù)數(shù)道平均瞬時(shí)振幅。
復(fù)數(shù)道由實(shí)部(常規(guī)道f(t))和虛部(正交道h(t))組成。
F(t)=f(t)+ih(t)
(8)
其瞬時(shí)振幅強(qiáng)度的計(jì)算方法如下:
(9)
此屬性可以突出表示振幅的異常,特別適合用于描述優(yōu)勢(shì)滲流通道形成時(shí)的振幅異常。
首先從2018到2019年中區(qū)西部高臺(tái)子油水井措施庫中篩選出24個(gè)優(yōu)勢(shì)滲流通道層段作為分析處理對(duì)象,再依據(jù)數(shù)模結(jié)果人工選取23個(gè)典型的不存在優(yōu)勢(shì)滲流通道的層段,形成兩類提供給SVM進(jìn)行學(xué)習(xí)的分類學(xué)習(xí)樣本。
對(duì)于作為學(xué)習(xí)樣本的每一對(duì)油水井,選擇8種測(cè)井曲線(AC、CAL、R25、RLLD、RLLS、RMG、RMN、SP)作為特征提取的對(duì)象,采用前述的8種特征提取方法,這樣就形成了一個(gè)學(xué)習(xí)樣本具有128個(gè)特征值組成的特征向量。圖3所示為一個(gè)優(yōu)勢(shì)通道訓(xùn)練樣本的特征向量(共128維)的一部分。
圖3 特征向量
經(jīng)過反復(fù)試驗(yàn),SVM算法最終的參數(shù)設(shè)置為:正則化參數(shù)的取值范圍C∈[0.01,100],核函數(shù)的參數(shù)取值范圍g∈[0,100];粒子群算法的參數(shù)設(shè)置為:粒子種群數(shù)量N=25,粒子維度F=2;慣性權(quán)重ω=0.6,局部學(xué)習(xí)因子c1=2,全局學(xué)習(xí)因子c2=2,算法最大迭代次數(shù)maxgen=100,算法收斂精度ξ=0.001。r1,r2為(0,1)的隨機(jī)數(shù)。
為了驗(yàn)證所提改進(jìn)理論的效果,將實(shí)驗(yàn)分為3組:
(1)Ⅰ組:采用常規(guī)的支持向量機(jī)來識(shí)別測(cè)試樣本中是否存在優(yōu)勢(shì)滲流通道。
(2)Ⅱ組:對(duì)第一組的支持向量機(jī)進(jìn)行粒子群參數(shù)優(yōu)化,在測(cè)試樣本集不變的情況下,識(shí)別優(yōu)勢(shì)滲流通道的存在與否,并做與第一組相同屬性數(shù)據(jù)的統(tǒng)計(jì)。
(3)Ⅲ組:為了更全面地利用測(cè)井曲線資料,本組考慮增加測(cè)井曲線的種類,試驗(yàn)是否能達(dá)到更好的識(shí)別效果。本組新增了兩種測(cè)井曲線,地層傾角、自然伽馬能譜二項(xiàng)。
實(shí)驗(yàn)結(jié)果如表1所示。
表1 實(shí)驗(yàn)結(jié)果對(duì)比
實(shí)驗(yàn)結(jié)果分析:
(1)Ⅰ組由于SVM沒有進(jìn)行參數(shù)的優(yōu)化選取,得到的SVM參數(shù)不夠精確,使得SVM不能進(jìn)行充分學(xué)習(xí),致使分類器泛化能力受到了很大影響,所以總體識(shí)別率較低。
(2)Ⅱ組分類效果有了較大程度的改善,主要是因?yàn)椴捎昧W尤核惴?,?duì)SVM模型參數(shù)進(jìn)行了優(yōu)化選取,在一定程度上提高了分類器的泛化能力。
(3)Ⅲ組的實(shí)驗(yàn)結(jié)果說明當(dāng)前測(cè)井曲線的種類已經(jīng)足夠,測(cè)井曲線的種類對(duì)實(shí)驗(yàn)結(jié)果的影響不大,說明優(yōu)化SVM的泛化能力依然較好。
優(yōu)勢(shì)滲流通道形成后,會(huì)在測(cè)井曲線上形成響應(yīng)特征,提取這些特征,通過8種特征處理方法,組成特征集。同時(shí)通過粒子群算法優(yōu)化支持向量機(jī)參數(shù),確保最終選擇的支持向量機(jī)參數(shù)組合最優(yōu),以期達(dá)到最佳的識(shí)別效果。通過對(duì)比實(shí)驗(yàn),傳統(tǒng)的支持向量機(jī)識(shí)別,由于參數(shù)的選擇,最終的識(shí)別結(jié)果并不是很好,而通過粒子群算法的擇優(yōu),證明通過優(yōu)化的支持向量機(jī)有更好的識(shí)別率。