摘要:精細(xì)儲層描述一直是非常規(guī)油氣資源開發(fā)和生產(chǎn)的重點,但常規(guī)測井曲線的縱向分辨率難以滿足對厘米級甚至毫米級儲層的有效識別。針對這一問題,本文以集成機器學(xué)習(xí)技術(shù)為核心,從多視多尺度的角度出發(fā),提出了一種兩級知識遷移的測井曲線大尺度差異超分辨方法提高測井曲線的縱向分辨率,實現(xiàn)低成本情況下的儲層精細(xì)描述;選取地層反映較好的微球電阻率、自然伽馬、聲波時差曲線作為目標(biāo)曲線,實現(xiàn)高分辨成像電阻率曲線信息到目標(biāo)測井曲線映射模型的構(gòu)建,進(jìn)而實現(xiàn)目標(biāo)測井曲線的大尺度差異超分辨,并將超分辨結(jié)果與不同超分辨方法進(jìn)行對比。結(jié)果表明,本文方法得到的超分辨曲線與真實高分辨曲線相關(guān)系數(shù)大于0.9,與對比方法相比提高了3.6%~16.0%,均方誤差
、均方根誤差、平均絕對誤差、平均絕對百分比誤差、對稱平均絕對百分比誤差
分別降低了28.9%~90.8%、15.7%~69.8%、24.4%~74.7%、25.0%~74.2%、25.2%~77.4%。本文方法能夠在一定程度上實現(xiàn)現(xiàn)有常規(guī)測井曲線的毫米級超分辨處理,得到的超分辨曲線能夠大致地捕捉到地層的變化,降低了精細(xì)儲層有效識別問題的難度。
關(guān)鍵詞:
精細(xì)儲層描述;測井曲線;集成機器學(xué)習(xí);大尺度;超分辨
doi:10.13278/j.cnki.jjuese.20230352
中圖分類號:P631.8
文獻(xiàn)標(biāo)志碼:A
Large-Scale Difference Super-Resolution of Logging Curves Based on Integrated Machine Learning
Cao Zhimin"1, 2, Ding Lu2, Han Jian1, 2, Hao Lechuan3, 4
1. NEPU Sanya Offshore Oil amp; Gas Research Institute, Sanya 572024, Hainan, China
2. School of Physics and Electronic Engineering, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
3. Postdoctoral Work Station, Daqing Oil Field, Daqing 163318, Heilongjiang, China
4. Postdoctoral Mobile Station, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
Abstract:
Fine reservoir description has always been the focus of development and production of unconventional oil and gas resources, but the vertical resolution of conventional logging curves is difficult to satisfy the
effective identification of thin layers at centimeter or even millimeter scale. Aiming at this problem, this paper proposes a two-level knowledge migration super-resolution method for large-scale difference in logging curves to improve the vertical resolution of logging curves, thus realizing high-resolution target reservoir fine description in low-cost cases, using integrated machine learning as the basic tool and the perspective of multi-view and multi-scale as the core. The microsphere resistivity, natural gamma ray, and acoustic time difference curves with better formation response are selected as the target curves, and the construction of a mapping model from the information of high-resolution imaging resistivity curves to the target logging curves is realized, which in turn realizes the large-scale difference super-resolution of target logging curves , and the super-resolution results are compared with different super-resolution methods. The results show that the correlation coefficients between the super-resolution curves obtained by the method of this paper and the real high-resolution curves are greater than 0.9, which are improved by 3.6% to 16.0% compared with the comparison methods, and the mean square error,
the root mean square error, the mean absolute error, the mean absolute percentage error, the symmetric mean absolute percentage error
are reduced by 28.9% to 90.8%, 15.7% to 69.8%, 24.4% to 74.7%, "25.0% to 74.2%, and 25.2% to 77.4% , respectively. Therefore, the method of this paper is able to largely realize the millimeter-level super-resolution processing of the existing conventional logging curves, and the obtained super-resolution curves are able to roughly capture the formation changes, which alleviates the difficulty of the problem of effective identification of fine reservoirs.
Key words:
fine reservoir description; logging curves; integrated machine learning; large-scale; super-resolution
0"引言
石油被稱為“工業(yè)血液”,是工業(yè)生產(chǎn)中最重要的燃料資源之一,也是目前世界上最重要的能源之一,占據(jù)世界能源總消耗量的33%左右。隨著油氣勘探目標(biāo)的變化,傳統(tǒng)的構(gòu)造性油氣藏勘探已逐漸轉(zhuǎn)為巖性油氣藏、裂縫油氣藏和隱蔽油氣藏等更加復(fù)雜的油氣藏勘探,非常規(guī)油氣資源已成為全球勘探開發(fā)的主要目標(biāo)[1]。非常規(guī)油氣藏通常需要采取大規(guī)模的增產(chǎn)措施或者是特殊的開采技術(shù)和開采工藝來獲取經(jīng)濟油氣流量的油氣藏[2],這使得生產(chǎn)過程比傳統(tǒng)的開采更加困難,勘探開發(fā)成本比常規(guī)油氣藏高得多。為了持續(xù)推動非常規(guī)油氣資源的開發(fā)和生產(chǎn),對精細(xì)儲層描述工作的要求也在不斷提高。因此,精細(xì)儲層描述的準(zhǔn)確性一直是相關(guān)領(lǐng)域研究的重點。
提高測井?dāng)?shù)據(jù)的分辨率是精細(xì)儲層描述工作中的一個重要環(huán)節(jié)。為了增強測井?dāng)?shù)據(jù)的分辨率,可以從以下兩個方面進(jìn)行努力:一是通過研究新的測井探測儀器和改進(jìn)測量技術(shù),提高測井?dāng)?shù)據(jù)采集系統(tǒng)的靈敏度和分辨能力,從而獲得縱向分辨率高的測井資料[3];二是采用數(shù)據(jù)處理技術(shù),對已采集到的測井?dāng)?shù)據(jù)進(jìn)行更精細(xì)的處理和解釋,并通過應(yīng)用先進(jìn)的數(shù)據(jù)處理算法和模型,進(jìn)一步提煉和提高數(shù)據(jù)的分辨能力,使測井曲線既具有較大的探測深度又具有較高的縱向分辨率[4]。雖然前者是最有效的方法,但需要大量人力、物力、財力及時間的投入,并且這種方法無法充分利用現(xiàn)有的測井?dāng)?shù)據(jù)資料。相比之下,研究和開發(fā)用于提高測井曲線分辨率的處理技術(shù)不需要大規(guī)模的設(shè)備更新或深入的技術(shù)改進(jìn),不僅可以最大程度地利用現(xiàn)有的測井資料,還可以更快地獲得準(zhǔn)確的地下信息,被認(rèn)為是一種投資回報快、成本較低的途徑[5]。
早在1980年,Conaway[6]率先提出了用于提高測井曲線縱向分辨率的反褶積技術(shù)。1986年,Lyle等[7]提出了一種基于卡爾曼濾波的反褶積算法,應(yīng)用于提高聲波時差和自然伽馬測井曲線的分辨率,并取得了良好的效果。1991年,Mitchell等[8]提出了一種匹配分辨率的方法,通過匹配濾波與非線性擬合組合,將已知的測井曲線數(shù)據(jù)與具有更高分辨率的測量數(shù)據(jù)進(jìn)行匹配,從而提高測井曲線的縱向分辨率。1998年,王祝文等[9]提出了“反褶積-開窗”法,有效地提高了碳氧比能譜測井曲線的分辨率,使其能夠更準(zhǔn)確地判別油層和水層之間的區(qū)別,增強了碳氧比能譜測井技術(shù)在油氣勘探中的應(yīng)用能力。2004年,馮國慶等[10]基于小波變換在時間域和頻率域都有良好的局部化性質(zhì),可以聚集到信號任意細(xì)節(jié)的特點,采用Mallat方法對測井曲線進(jìn)行分解和重構(gòu),重構(gòu)后的測井曲線可以顯著提高縱向分辨率。2010年,Myrontsov[11]提出了電感測井方法,根據(jù)線性多爾理論框架內(nèi)測量的視電阻率,利用卷積型第一類弗雷德霍姆方程的解法確定電阻率,提高了電阻率測井曲線的縱向分辨率。2013年,Bagheripour等[12]使用巖石物理核磁共振測井?dāng)?shù)據(jù),將其中一半的中值數(shù)據(jù)點使用普通克里金技術(shù)構(gòu)建地質(zhì)統(tǒng)計模型,其余的數(shù)據(jù)點用于評估所構(gòu)建模型的性能,使測井分辨率提高了兩倍。2019年,Zhang等[13]運用一種深度學(xué)習(xí)輔助的彈性全波形反演的策略,利用測井?dāng)?shù)據(jù)以及其他地球物理數(shù)據(jù)(如井下記錄)進(jìn)行速度估計,從而提高分辨率。2021年,Zhang等[14]提出了“數(shù)字巖心”新算法,該方法結(jié)合了礦物學(xué)和沉積學(xué)信息,生成了地層礦物學(xué)高分辨率測井信號,可以達(dá)到精細(xì)薄層描述的目的。
常規(guī)測井曲線的分辨率通常為0.125 m左右,但對于精細(xì)儲層描述工作,特別是頁巖油的勘探開采工作來說,這樣的分辨率往往達(dá)不到要求。為了有效實現(xiàn)精細(xì)儲層的識別及精確定位,往往需要以巖心提取或高分辨率成像電阻率測井等高成本方式進(jìn)行。然而,面對復(fù)雜多變的國際油價異常波動,降本增效已成為行業(yè)發(fā)展的必然趨勢。因此,需要尋求一種更為經(jīng)濟高效的方法來提升測井曲線的分辨率。為此,建立可測高分辨數(shù)據(jù)與常規(guī)測井?dāng)?shù)據(jù)間的大尺度非線性映射關(guān)系顯得尤為重要。一旦這種映射關(guān)系得以確立,便可以利用它來對常規(guī)測井曲線進(jìn)行大尺度差異超分辨處理,從而提高曲線的分辨率,實現(xiàn)儲層精細(xì)描述的目的。集成機器學(xué)習(xí)為此類問題的解決提供了強大的工具。與傳統(tǒng)的數(shù)據(jù)處理方法相比,集成機器學(xué)習(xí)具有諸多優(yōu)勢,它能夠自動地從海量數(shù)據(jù)中學(xué)習(xí)和挖掘潛在的非線性關(guān)系,避免了繁瑣的人工建模過程。同時,集成機器學(xué)習(xí)具有出色的泛化能力,可以處理各種復(fù)雜多變的數(shù)據(jù),提高了模型的適用性和準(zhǔn)確性。此外,通過集成多個機器學(xué)習(xí)模型的預(yù)測結(jié)果,可以進(jìn)一步減少預(yù)測誤差,提高超分辨處理的精度和穩(wěn)定性。
基于此,本文以集成機器學(xué)習(xí)為基本工具,采用基于兩級知識遷移的研究策略,并結(jié)合多視聯(lián)合挖掘的方法,充分利用多種插值方法和非線性映射模型提取測井?dāng)?shù)據(jù)中隱含的精細(xì)儲層結(jié)構(gòu)信息,旨在實現(xiàn)常規(guī)測井曲線大尺度差異超分辨處理,進(jìn)行相關(guān)關(guān)鍵技術(shù)攻關(guān)。
1"基本理論
1.1"埃爾米特插值
對于給定的插值節(jié)點x0, x1, …, xn,插值函數(shù)p(x)在這些節(jié)點上與被插函數(shù)f(x)具有相同的函數(shù)值,即p(xi)=f(xi)(i=0, 1, ..., n),并且在某些或所有節(jié)點上,不僅是函數(shù)值,而且是導(dǎo)數(shù)值,甚至是高階導(dǎo)數(shù)值都相等的插值問題被稱為埃爾米特(Hermite)插值[15]。設(shè)f∈cn[a,b],x0,x1,…,xn為[a, b]上的不同節(jié)點,則f[x0, x1, …, xn]是其變量的連續(xù)函數(shù),埃爾米特插值多項式中的n階重節(jié)點的均差為
f[x0,x1,…,xn]=
limx1→x0x2→x0"xn→x0f[x0,x1,…,xn]=1n!f(n)(x0)。(1)
由式(1)與泰勒多項式可得出埃爾米特插值多項式為
Pn(x)=f(x0)+f(x0)(x-x0)+…+ f(n)(x0)n?。▁-x0)n。(2)
1.2"二次樣條插值
對于給定區(qū)間[a, b],劃分a=x0lt;x1lt;…lt;xn-1lt;xn=b,若函數(shù)S(x)滿足:在每個小區(qū)間[xk, xk+1](k=0, 1, …, n-1)上是二次多項式;在每個內(nèi)部節(jié)點xk(k=0, 1, …, n-1)上具有一階連續(xù)導(dǎo)數(shù);在節(jié)點xk上給定函數(shù)值yk=f(xk)(k=0, 1, …, n),并成立S(xk)=yk(k=0, 1, …, n),則稱S(x)是f(x)在[a, b]上關(guān)于劃分a=x0lt;x1lt;…lt; xn-1lt;xn=b的二次樣條插值函數(shù)[16]。在區(qū)間[x0, x1]上,已知S(x0)=y0,S(x1)=y1且S′(x0)=y′0,可得
S(x)=y1-y0-h(huán)0y′0h20(x-x0)2+y′0(x-x0)+y0。(3)
式中,hi=xi+1-xi(i=0, 1, …, n-1)。此時y′1=S′(x1)=2(y1-y0)h0-y′0,再由S(x1)=y1,S(x2)=y2得到區(qū)間[x1, x2]內(nèi)的二次插值函數(shù),以此類推可推導(dǎo)出區(qū)間[xi, xi+1](i=0, 1, …, n-1)內(nèi)二次樣條插值函數(shù)的表達(dá)式為
S(x)=yi+1-yi-h(huán)iy′ih2i(x-xi)2+y′i(x-xi)+yi。(4)
1.3"三次樣條插值
對于給定區(qū)間[a, b],劃分a=x0lt;x1lt;…lt;xn-1lt;xn=b,若函數(shù)S(x)滿足:1)在每個小區(qū)間[xk, xk+1](k=0, 1, …, n-1)上是三次多項式;2)在每個內(nèi)部節(jié)點xk(k=0, 1, …, n-1)上具有二階連續(xù)導(dǎo)數(shù);3)在節(jié)點xk上給定函數(shù)值yk=f(xk)(k=0, 1, …, n),并成立S(xk)=yk(k=0, 1, …, n),則稱S(x)是f(x)在[a, b]上關(guān)于劃分a=x0lt;x1lt;…lt; xn-1lt;xn=b的三次樣條插值函數(shù)[17]。以區(qū)間[xk, xk+1]為例,S(xk)的二階導(dǎo)數(shù)值為S″(xk)=Mj(j=0, 1, …, n),則該區(qū)間上S(x)的三次樣條插值表達(dá)式為
S(x)=Mj(xj+1-x)36hj+Mj+1(x-xj)36hj+(yj-Mjh2j6)xj+1-xhj+(yj+1-Mj+1h2j6)x-xjhj(j=0,1,…,n-1)。(5)
令μj=hj-1hj-1+hj、λj=hjhj-1+hj、dj=6f[xj-1,xj,xj+1],可得
2λ000μ1μ12λ10000μn-12λn-1λn00μn2M0M1Mn-1Mn=d0d1dn-1dn。 (6)
求解矩陣(6),代入式(5)中得到每個小區(qū)間上的三次樣條插值的表達(dá)式[18]。
1.4"分段線性插值
假定區(qū)間[a, b]上的連續(xù)函數(shù)f(x)在節(jié)點a=x0lt;x1lt;…lt;xn-1lt;xn=b上的函數(shù)值為f(xk)=yk(k=0, 1, …, n),則可以得到n+1個數(shù)據(jù)點(xk, yk)。連接相鄰點(xk, yk)和(xk+1, yk+1)得到n條線段,這些線段組成一條折線,該折線對應(yīng)的函數(shù)稱為分段線性插值函數(shù)[17],記作S(x):
S(x)=y0x-x1x0-x1-y1x-x0x1-x0,x∈[x0,x1];y1x-x2x1-x2-y2x-x1x2-x1,x∈[x1,x2];""""""yn-1x-xnxn-1-xn-ynx-xn-1xn-xn-1,x∈[xn-1,xn]。(7)
1.5"徑向基函數(shù)插值
徑向基函數(shù)Φ(·)=φ(‖·‖)(‖·‖表示歐式距離)以空間距離r為基本變量。在d維歐氏空間中,對于一組位置不同的中心點X={xc1, xc2, …, xcn}Rd以及對應(yīng)的標(biāo)量值gc1, gc2, …, gcn,給定的基函數(shù)φ(x)找到連續(xù)函數(shù)
f(x)=∑γiφx-xci,(8)
且滿足
f(xck)=∑γiφxck-xci=gck(k=1,2,…,n) (9)
的過程被稱為徑向基函數(shù)插值[19]。式中,γi為插值系數(shù)。
1.6"SVR
支持向量回歸(support vector regression, SVR)是一種用于解決回歸問題的機器學(xué)習(xí)算法,它基于支持向量機(support vector machine, SVM)的原理,但在目標(biāo)函數(shù)和約束條件上有所不同[20-21]。SVR通過最大化間隔ε找到一個決策邊界,在決策邊界內(nèi)盡可能多地將樣本點位于間隔內(nèi),以實現(xiàn)對樣本點的回歸預(yù)測,這些位于間隔之內(nèi)的樣本點被稱為非支持向量;與SVM相比,SVR注重決策邊界內(nèi)的點,而SVM注重分離超平面外部的點。SVR的優(yōu)化目標(biāo)為
minω,ξi,ξ*i12
‖ω‖2
+Q∑ni=1(ξi+ξ*i)
s.t.yi-ωφ(xi)-b≤ε+ξi,i=1,2,…,n;-yi-ωφ(xi)+b≤ε+ξ*i,ξi≥0,ξ*i≥0。 (10)
式中:ω為權(quán)重系數(shù);ξi和ξ*i為松弛變量;Q為懲罰因子;b為偏差。從式(10)中可以看出,當(dāng)樣本點位于間隔ε內(nèi)時,不會計算其損失,只有當(dāng)樣本位于間隔外才會計入其損失。
SVR的結(jié)構(gòu)示意圖如圖1所示。
1.7"隨機森林
隨機森林(random forest, RF)是一種集成學(xué)習(xí)算法,通過隨機的方式構(gòu)建一個森林,森林由多棵決策樹組成,每棵決策樹之間都是相互獨立的。RF的基本原理[22]為:
1)使用Bootstrap重采樣方式從訓(xùn)練數(shù)據(jù)集中隨機有放回地(即可重復(fù)抽樣)取出m個數(shù)據(jù)集,得到m個訓(xùn)練子集;
2)每個訓(xùn)練子集都訓(xùn)練1棵決策樹,如此重復(fù),得到構(gòu)成RF的m棵決策樹;
3)在每棵決策樹的生成過程中,每個節(jié)點的特征劃分會在一個隨機選擇的特征子集上進(jìn)行,通常使用基尼系數(shù)或均方誤差等指標(biāo)來選擇每個節(jié)點的分裂特征和分裂點;
4)每棵決策樹的預(yù)測結(jié)果取均值就是RF的最終預(yù)測結(jié)果。
RF的結(jié)構(gòu)示意圖如圖2所示。
1.8"LSTM
長短期記憶(long short-term memory, LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN),主要被設(shè)計用來解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題[23-24]。LSTM細(xì)胞是相互連接的,取代了普通RNN中的傳統(tǒng)隱藏單元,它由遺忘門、輸入門和輸出門組成。LSTM的結(jié)構(gòu)示意圖如圖3所示。
遺忘門使用sigmoid函數(shù)決定細(xì)胞單元從網(wǎng)絡(luò)中接收多少信息,控制著從狀態(tài)Ct-1到Ct的信息保留程度,從而實現(xiàn)信息的遺忘功能。通過讀取輸入值xt和前一個時間步的隱藏狀態(tài)ht-1,可以計算出一個0~1之間的值,表示細(xì)胞單元獲取網(wǎng)絡(luò)信息的百分比,計算方法為
ft=σ(Wf[ht-1,xt]+bf)。(11)
式中:ft為遺忘門的輸出;σ為sigmoid函數(shù);Wf為遺忘門循環(huán)權(quán)重;bf為遺忘門偏置量。
輸入門決定了在當(dāng)前時刻有多少輸入信息會被保存到單元狀態(tài)中,這一過程分為決定更新哪些值和生成新候選值兩個部分,計算方法為:
it=σ(Wi[ht-1,xt]+bi);(12)
C~t=tanh(WC[ht-1,xt]+bC)。(13)
式中:it為輸入門的輸出;Wi為輸入門循環(huán)權(quán)重;bi為輸入門偏置量;C~t為新的候選細(xì)胞狀態(tài);WC為候選細(xì)胞狀態(tài)循環(huán)權(quán)重;bC為候選細(xì)胞狀態(tài)偏置量。此時,細(xì)胞狀態(tài)會根據(jù)遺忘門和輸入門的輸出進(jìn)行更新,計算方法為
Ct=ftCt-1+itC~t。(14)
式中:Ct為此時的細(xì)胞狀態(tài);Ct-1為前一時刻的細(xì)胞狀態(tài)。
輸出門用來確定輸出的值。使用sigmoid函數(shù)得到新的細(xì)胞狀態(tài)傳遞給tanh函數(shù),細(xì)胞狀態(tài)經(jīng)過tanh函數(shù)處理,并與sigmoid函數(shù)的輸出相乘,得到輸出值:
ot=σ(Wo[ht-1,xt]+bo);(15)
ht=ottanh(Ct)。(16)
式中:ot為輸出門的輸出;Wo為輸出門循環(huán)權(quán)重;bo為輸出門偏置量。
1.9"雙向GRU
門控循環(huán)單元(gated recurrent unit, GRU)是LSTM的一種簡化結(jié)構(gòu),較LSTM網(wǎng)絡(luò)的結(jié)構(gòu)更加簡單,又保持了LSTM的預(yù)測效果,由更新門和重置門兩個門組成[25]。
更新門決定了多少前一時刻的隱藏狀態(tài)應(yīng)該保留到當(dāng)前狀態(tài):
zt=σ(Wz[ht-1,xt]+bz)。(17)
式中:zt為更新門的輸出;Wz為輸出門循環(huán)權(quán)重;bz為輸出門偏置量。
重置門決定了多少當(dāng)前時刻的輸入應(yīng)該影響到當(dāng)前的隱藏狀態(tài):
rt=σ(Wr[ht-1,xt]+br)。(18)
式中:rt為重置門的輸出;Wr為輸出門循環(huán)權(quán)重;br為輸出門偏置量。GRU的結(jié)構(gòu)示意圖見圖4。
雙向GRU同時訓(xùn)練正向和反向傳遞,然后通過線性融合算法來結(jié)合它們的結(jié)果[26]。正向網(wǎng)絡(luò)層的計算公式為
ht=f(W→xt+V→ht-1+b→)。(19)
式中:W→、V→為正向網(wǎng)絡(luò)層的權(quán)重矩陣;b→為正向網(wǎng)絡(luò)層的偏置量。反向網(wǎng)絡(luò)層的計算公式為
ht=f(W←xt+V←ht+1+b←)。(20)
式中:W←、V←為反向網(wǎng)絡(luò)層的權(quán)重矩陣;b←為反向網(wǎng)絡(luò)層的偏置量。最終輸出的計算公式為
yt=g(U[h→t;h←t]+c)。(21)
式中:U為權(quán)重矩陣;c為偏置量。雙向GRU的結(jié)構(gòu)示意圖如圖5所示。
1.10"生成對抗網(wǎng)絡(luò)
生成對抗網(wǎng)絡(luò)(generative adversarial networks, GAN)是基于零和博弈的思想而提出的,由生成器和判別器兩個神經(jīng)網(wǎng)絡(luò)組成[27-28]。生成器通過學(xué)習(xí)真實數(shù)據(jù)的分布并生成偽數(shù)據(jù),盡可能地使生成的偽數(shù)據(jù)與真實數(shù)據(jù)相似,以欺騙判別器網(wǎng)絡(luò);判別器網(wǎng)絡(luò)則盡可能地辨別輸入的數(shù)據(jù)是由生成器生成的偽數(shù)據(jù)還是真實數(shù)據(jù)。兩者的最終目標(biāo)是達(dá)到納什均衡狀態(tài),使生成器盡可能地學(xué)習(xí)到真實數(shù)據(jù)的分布。GAN的目標(biāo)函數(shù)為
V(D,G)=
Ex~Px[logD(x)]+Ez~Pz[log(1-D(G(z)))]。(22)
式中:D為判別器;G為生成器;E為樣本期望;Px為真實數(shù)據(jù)的分布;Pz為輸入數(shù)據(jù)的分布;G(z)為生成器生成的偽造數(shù)據(jù)。生成器的目標(biāo)是最大化D(G(z))的值,以欺騙判別器;而判別器的目標(biāo)則是最大化D(x)的值,以正確判別真實數(shù)據(jù),并最小化D(G(z))的值。GAN的結(jié)構(gòu)示意圖如圖6所示。
2"常規(guī)測井曲線大尺度差異超分辨模型設(shè)計
2.1"總體設(shè)計
本文所進(jìn)行的超分辨處理需要將常規(guī)測井曲線(如0.125 m采樣間隔)超分辨到常規(guī)高分辨曲線(如2~3 mm采樣間隔),即系統(tǒng)的輸入與輸出尺度差異超過50倍。面對這種大尺度差異的實際情況,傳統(tǒng)插值或超分辨方法很難實現(xiàn),解決這個問題最關(guān)鍵的難題在于如何抓住高分辨信息,如何能夠?qū)F(xiàn)有高分辨數(shù)據(jù)中隱含的儲層高分辨信息轉(zhuǎn)移到常規(guī)曲線超分辨結(jié)果中。為了解決這一難題,采用如圖7所示的兩級知識遷移的系統(tǒng)總體設(shè)計過程。其中,第一級知識遷移實現(xiàn)常規(guī)曲線高分辨參考信號的構(gòu)建,第二級知識遷移實現(xiàn)常規(guī)曲線大尺度差異超分辨信號的估計。
2.2"深度向多尺度非線性映射集成高分辨參考數(shù)據(jù)構(gòu)建
為了實現(xiàn)圖7總體方案中的第一級知識遷移,需要建立已有高分辨數(shù)據(jù)與目標(biāo)常規(guī)低分辨數(shù)據(jù)間的精確非線性映射模型。由于高分辨數(shù)據(jù)與低分辨數(shù)據(jù)尺度差異大,而且深度向測井曲線具有一定的連續(xù)性,因此,某具體采樣點處有豐富的高分辨上下文信息用于進(jìn)行到低分辨數(shù)據(jù)的非線性映射。那么,為了充分發(fā)揮豐富的高分辨上下文信息,采用多尺度非線性映射集成的方式進(jìn)行高分辨數(shù)據(jù)到低分辨數(shù)據(jù)的映射,如圖8所示,模型可以表示為
Lm=∪rF(Nrm)。(23)
式中:m為深度;Lm為深度m處的低分辨數(shù)據(jù);r為局部鄰域集的數(shù)目;Nrm為在尺度r下深度m處高分辨數(shù)據(jù)的局部鄰域點集。每個尺度下的非線性映射模型F均可采用RF回歸來實現(xiàn)。
利用模型井?dāng)?shù)據(jù),在完成不同尺度下非線性映射模型的構(gòu)建后,即可連續(xù)獲取高分辨數(shù)據(jù)局部多尺度鄰域進(jìn)行低分辨目標(biāo)曲線在高分辨深度采樣點上的取值估計。為了進(jìn)一步增強第一級知識遷移的精度和可靠性,可以把多尺度估計結(jié)果看作一種編碼信息,通過對這種編碼信息的再學(xué)習(xí)或再映射實現(xiàn)非線性映射的精度提升。該環(huán)節(jié)可以采用RF等回歸方法實現(xiàn)。
2.3"序貫式多視多尺度超分辨集成測井曲線超分辨模型構(gòu)建
獲得目標(biāo)曲線高分辨參考數(shù)據(jù)后,即可建立高分辨參考數(shù)據(jù)與對應(yīng)常規(guī)低分辨數(shù)據(jù)間的非線性映射關(guān)系。對于常規(guī)曲線1/8 m(0.125 m)的采樣率,首先對高分辨參考數(shù)據(jù)進(jìn)行便于超分辨處理的重采樣,如1/512 m采樣率。那么,在下采樣后的高分辨參考數(shù)據(jù)與常規(guī)低分辨數(shù)據(jù)間就可以獲得多個尺度的參考信號,如采樣率分別為1/256 m、1/128 m、1/64 m、1/32 m、1/16 m等。這樣的話,就可以將1/8 m采樣率到1/512 m采樣率的64倍超分辨問題轉(zhuǎn)換為1/8 m到1/16 m、1/16 m到1/32 m等多個二倍超
分辨問題。這樣,通過逐級下采樣,最高采樣率下的高頻信息就可以逐級轉(zhuǎn)移到低分辨數(shù)據(jù)上,使大尺度差異超分辨成為可能。此序貫式多視多尺度超分辨集成的總體框架圖如圖9所示。
基于以上分析,所提出的序貫式多視多尺度差異超分辨的關(guān)鍵環(huán)節(jié)在于二倍尺度差異的超分辨。為了保證二倍尺度差異超分辨結(jié)果的精確性和可靠性,采用了生成對抗網(wǎng)絡(luò)回歸的方式,即:
LH(i)=fGAN(L(i))。 (24)
式中:LH(i)為第i個數(shù)據(jù)點二倍超分辨后的數(shù)據(jù);fGAN為GAN模型;L(i)為第i個數(shù)據(jù)點的
低分辨數(shù)據(jù)。顯然,由于低分辨數(shù)據(jù)與高分辨數(shù)據(jù)之間的尺度差異,需要將低分辨數(shù)據(jù)先插值到一個初始二倍高分辨數(shù)據(jù)L′,這樣就可以得到一個一對一的關(guān)系。然而,這種情況下信息量還無法完成初始二倍高分辨數(shù)據(jù)到實際高分辨數(shù)據(jù)的高精度映射,為了保證映射質(zhì)量,采用了多視非線性映射的方式,即
LH(i)=fGAN(∪v∪jL′(gv,j)(i))。(25)
式中,j=1, 2, 3, 4, 5,表示五個不同的視,即用不同的插值方法得到的不同二倍高分辨數(shù)據(jù)估計,分別采用了埃爾米特插值、二次樣條插值、三次樣條插值、分段線性插值、徑向基函數(shù)插值五種插值方法;gv(v=1, 2, 3, 4)表示不同非線性映射模型,分別采用了SVR、RF、LSTM、雙向GRU四個非線性映射模型。每個二倍尺度差異的超分辨框架圖如圖10所示。
2.4"評價指標(biāo)
為了客觀地評價所提出的超分辨模型的性能,本文采用了常規(guī)的誤差函數(shù)和皮爾遜相關(guān)系數(shù)(Pearson correlation coefficients, PCCs)作為評價指標(biāo)。其中:誤差函數(shù)包括均方誤差(mean square error, MSE)、均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)、平均絕對百分比誤差(mean absolute percentage error, MAPE)和對稱平均絕對百分比誤差(symmetric mean absolute percentage error, SMAPE),數(shù)值越小,模型的性能越好;PCCs用來衡量真實值與預(yù)測值之間的相關(guān)性,數(shù)值越大,模型的性能越好。各評價指標(biāo)的計算方式如下:
MSE=1N∑Ni=1(y′i-yi)2; (26)
RMSE=1N∑Ni=1(y′i-yi)2; (27)
MAE=1N∑Ni=1y′i-yi;(28)
MAPE=100%N∑Ni=1y′i-yiyi;(29)
SMAPE=100%N∑Ni=1y′i-yi(y′i+yi)/2;(30)
PCCs=cov(y′i,yi)σyiσy′i。(31)
式中:N為樣本數(shù)目;y′i為預(yù)測值;yi為真實值; cov( )為協(xié)方差;σyi、σy′i為標(biāo)準(zhǔn)差。
3"實驗結(jié)果及分析
為了驗證所提超分辨方法的有效性,對具有高分辨電成像電阻率(LLD3)曲線(分辨率為0.002 m左右)的大慶油田某頁巖油區(qū)塊的4口井(W1—W4)進(jìn)行了實驗,實驗分為2個部分:1)利用深度向多尺度非線性映射模型完成常規(guī)測井曲線(分辨率為0.125 m)高分辨參考數(shù)據(jù)的構(gòu)建;2)利用序貫式多尺度超分辨模型分別完成LLD3曲線和常規(guī)測井曲線的超分辨實驗。
3.1"高分辨參考數(shù)據(jù)構(gòu)建
首先對LLD3曲線進(jìn)行便于超分辨處理的重采樣到1/512 m采樣率。本文選擇地層反映較好的微球電阻率(MSFL)、自然伽馬(GR)、聲波時差(AC)作為目標(biāo)曲線進(jìn)行實驗。采用已有的高分辨數(shù)據(jù)LLD3曲線與目標(biāo)低分辨數(shù)據(jù)間建立非線性映射模型,同時選用了4、8、10和14四個不同的尺度,再將多尺度的結(jié)果進(jìn)行集成。圖11展示了部分目標(biāo)曲線得到高分辨參考數(shù)據(jù)的過程,可以看出,通過第一級知識遷移可以得到準(zhǔn)確的高分辨參考數(shù)據(jù)。
3.2"超分辨實驗
為了驗證本文提出序貫式多尺度超分辨模型的有效性,先以實際的LLD3曲線進(jìn)行超分辨實驗,這里以W1井為例。以W1井作為測試集,其他三口井作為訓(xùn)練集,首先分別對這四口井的LLD3曲線(1/512 m采樣率)進(jìn)行下采樣到1/256 m(2倍)、1/128 m(4倍)、1/64 m(8倍)、1/32 m(16倍)、1/16 m(32倍)、1/8 m(64倍)采樣率。將采樣率為1/8 m的LLD3曲線進(jìn)行64倍到32倍的二倍超分辨實驗到采樣率為1/16 m,再將得到的采樣率為1/16 m的LLD3曲線進(jìn)行32倍到16倍的二倍超分辨實驗到采樣率為1/32 m……以此類推,最終得到采樣率為1/512 m(1倍)的超分辨LLD3曲線。圖12給出了各個二倍尺度LLD3曲線超分辨實驗結(jié)果,為了更清晰地展示,這里選取了50 m的范圍。其部分局部放大圖如圖13所示??梢钥闯觯S著采樣率從1/8 m逐步提升至1/512 m,曲線的變化趨勢更加平滑且連續(xù),原本因低采樣率而丟失的高頻信息得到了有效的恢復(fù)。在實際測試中,將低分辨測井曲線輸入模型可直接得到最終的超分辨曲線。
為了進(jìn)一步體現(xiàn)本文提出的模型超分辨效果,將W1井的LLD3曲線最終超分辨結(jié)果與雙線性插值、隨機分形和稀疏表示直接64倍超分辨結(jié)果一起繪制,結(jié)果如圖14所示。從圖14中可以看出,本文方法得到的超分辨曲線更接近真實高分辨曲線的整體特征,且高頻細(xì)節(jié)更豐富。其定量評價結(jié)果在表1中給出。
表2—表4分別列舉了W2井—W4井LLD3曲線不同超分辨方法和本文方法的定量評價結(jié)果。
從各個評價指標(biāo)結(jié)果來看,本文方法相較于對比方法得到的超分辨曲線均具有更高的相關(guān)性和更小的誤差。以W2井為例,本文方法得到的超分辨曲線與真實高分辨曲線相關(guān)系數(shù)為0.924 5,與對比方法相比提高了3.6%~16.0%,誤差分別降低了28.9%~90.8%(MSE)、15.7%~69.8%(RMSE)、24.4%~74.7%(MAE)、25.0%~74.2%(MAPE)、25.2%~77.4%(SMAPE)。
獲得各目標(biāo)曲線的高分辨參考數(shù)據(jù)后,即可應(yīng)用序貫式多尺度超分辨模型完成各目標(biāo)曲線的超分辨實驗,步驟與LLD3曲線的超分辨實驗相似。表5—表8給出了W1井—W4井各曲線的高分辨參考數(shù)據(jù)與超分辨數(shù)據(jù)的定量評價結(jié)果。結(jié)合解釋巖性信息與電成像元素數(shù)據(jù)作為參考,圖15—圖18分別給出了W1井—W4井各曲線的部分超分辨結(jié)果。盡管部分曲線的評價指標(biāo)一般,但是超分辨曲線相比原始曲線引入了足夠的高頻信息,能夠大致地捕捉到地層的變化。結(jié)果顯示,本文所提的測井曲線大尺度差異超分辨方法具有顯著的高頻信息捕獲及傳遞能力。
4"結(jié)論
1)針對頁巖油精細(xì)儲層有效識別與現(xiàn)有常規(guī)測井曲線分辨能力間存在巨大差異這一難題,本文提出了一種兩級知識遷移的測井曲線大尺度差異超分辨方法。第一級知識遷移實現(xiàn)了常規(guī)曲線高分辨參考信號的構(gòu)建,解決了高分辨數(shù)據(jù)與低分辨數(shù)據(jù)存在屬性差異這一問題——跨屬直接映射效果差,需要充分利用高分辨信息降低屬性差異的影響。第二級知識遷移實現(xiàn)了常規(guī)曲線大尺度差異超分辨信號的估計,解決了高分辨數(shù)據(jù)與低分辨數(shù)據(jù)的尺度差異大這一問題——直接映射效果差,需要設(shè)計合理的間接映射模型。
2)本文以具有高分辨電成像電阻率數(shù)據(jù)的大慶油田某頁巖油區(qū)塊的4口井作為實驗對象進(jìn)行實驗,結(jié)果表明本文方法能夠很大程度上實現(xiàn)現(xiàn)有常規(guī)測井曲線的毫米級超分辨處理,降低了頁巖油精細(xì)儲層有效識別問題的難度。
參考文獻(xiàn)(References):
[1] 鄒才能,楊智,張國生,等. 非常規(guī)油氣地質(zhì)學(xué)理論技術(shù)及實踐[J]. 地球科學(xué),2023,48(6):2376-2397.
Zou Caineng, Yang Zhi, Zhang Guosheng, et al.Theoretical Techniques and Practice of Unconventional Oil and Gas Geology[J]. Earth Science, 2023, 48(6): 2376-2397.
[2] 羅昌魁. 非常規(guī)油氣地質(zhì)學(xué)理論技術(shù)及實踐[J]. 價值工程,2013,32(17):308-309.
Luo Changkui. Mechanism of Unconventional Oil and Gas Reservoir Formation and Key Technology of Development[J]. Value Engineering, 2013, 32(17): 308-309.
[3] 蘇艷麗. 提高測井曲線分辨率的方法研究及應(yīng)用[D]. 武漢:長江大學(xué),2012.
Su Yanli. Research and Application of Methods to Improve the Resolution of Logging Curve [D]. Wuhan: Changjiang University, 2012.
[4] 李鳳琴,劉麗瓊,杜淑艷,等. 提高測井資料分辨率處理方法在東濮凹陷的應(yīng)用[J]. 內(nèi)蒙古石油化工,2012,38(13):135-137.
Li Fengqin, Liu Liqiong, Du Shuyan, et al. Application of Improved Logging Data Resolution Processing Method in Dongpu Depression [J]. Inner Mongolia Petrochemical Industry, 2012, 38(13): 135-137.
[5] 侯賢沐,王付勇,宰蕓,等. 基于機器學(xué)習(xí)和測井?dāng)?shù)據(jù)的碳酸鹽巖孔隙度與滲透率預(yù)測[J]. 吉林大學(xué)學(xué)報(地球科學(xué)版),2022, 52(2): 644-653.
Hou Xianmu, Wang Fuyong, Zai Yun, et al.Prediction of Carbonate Porosity and Permeability Based on Machine Learning and Logging Data[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(2): 644-653.
[6] Conaway J G. Exact Inverse Filters for the Deconvolution of Gamma-Ray Logs[J]. Geoexploration, 1980, 18(1): 1-14.
[7] Lyle W D, Williams D M. Deconvolution of Well Log Data: An Innovations Approach[J]. The Log Analyst, 1986, 28(3): 667.
[8] Mitchell W K,Nelson R J. Improved Vertical Resolution of Well Logs by Resolution Matching[J]. The Log Analyst,1991,32(4):SPWLA-1991-v32n4a1.
[9] 王祝文,李舟波,陸敬安,等. 提高碳氧比能譜測井分辨率的反褶積法[J]. 地球物理學(xué)報,1998, 41(4): 570-578.
Wang Zhuwen, Li Zhoubo, Lu Jing’an, et al. Inverse Folding Method to Improve the Resolution of Carbon and Oxygen Specific Energy Spectral Logging[J]. Chinese Journal of Geophysics, 1998, 41(4): 570-578.
[10] 馮國慶,楊琨,陳忠強,等. 提高測井曲線縱向分辨率的小波變換技術(shù)[J]. 新疆石油地質(zhì),2004, 25(5): 529-531.
Feng Guoqing, Yang Kun, Chen Zhongqiang, et al.Wavelet Transform Technique for Improving Longitudinal Resolution of Logging Curves[J]. Xinjiang Petroleum Geology, 2004, 25(5): 529-531.
[11] Myrontsov N. Method for Improving the Spatial Resolution of Resistivity Logging[J]. Геофизический журнал, 2010, 32(4): 119-121.
[12] Bagheripour P, Asoodeh M, Nazarpour A. Vertical Resolution Enhancement of Petrophysical Nuclear Magnetic Resonance (NMR) Log Using Ordinary Kriging[J]. Central European Journal of Geosciences, 2013, 5(3): 450-456.
[13] Zhang Z, Alkhalifah T. Regularized Elastic Full-Waveform Inversion Using Deep Learning[J]. Geophysics, 2019, 84(5): 741-751.
[14] Zhang Q, Peyaud J B. Development and Validation of a Novel Interpretation Algorithm for Enhanced Resolution of Well Logging Signals[J]. Journal of Sensors, 2021(1): 1-10.
[15] 方宗華,王文豐,董健華,等. 基于埃爾米特插值法的DBSCAN算法研究[J].南昌工程學(xué)院學(xué)報,2020, 39(4): 80-84.
Fang Zonghua, Wang Wenfeng, Dong Jianhua, et al. Research on DBSCAN Algorithm Based on Hermite Interpolation[J]. Journal of Nanchang Institute of Technology, 2020,39(4): 80-84.
[16] 劉為,高毅,高尚. 二次樣條插值研究[J]. 計算機與數(shù)字工程,2011, 39(3): 21-23, 64.
Liu Wei, Gao Yi, Gao Shang. Research on Quadratic Spline Interpolation[J]. Computer and Digital Engineering, 2011,39(3):21-23, 64.
[17] 邢麗. 一維插值算法在實際問題中的應(yīng)用和比較[J]. 上海第二工業(yè)大學(xué)學(xué)報,2013, 30(4): 311-314.
Xing Li. Application and Comparison of One-dimensional Interpolation Algorithm in Practical Problems [J]. Journal of Shanghai Second Polytechnic University, 2013, 30(4): 311-314.
[18] 張凱選,馬傳寧. 結(jié)合三次樣條和時序模型的橋墩沉降預(yù)測[J]. 測繪科學(xué),2016, 41(12): 229-232, 253.
Zhang Kaixuan, Ma Chuanning. Prediction of Pier Sett-lement Based on Cubic Spline and Time Series Model [J]. Science of Surveying and Mapping, 2016, 41(12): 229-232,253.
[19] 林言中,陳兵,徐旭. 徑向基函數(shù)插值方法在動網(wǎng)格技術(shù)中的應(yīng)用[J]. 計算物理,2012, 29(2): 191-197.
Lin Yanzhong, Chen Bing, Xu Xu. Application of Rad-Ial Basis Function Interpolation Method in Dynamic Me-Shing Technique [J]. Computational Physics, 2012, 29(2): 191-197.
[20] Peng X, Xu D. Projection Support Vector Regression Algorithms for Data Regression[J]. Knowledge-Based Systems, 2016, 36(3): 369-374.
[21] 秦喜文,劉媛媛,王新民,等. 基于整體經(jīng)驗?zāi)B(tài)分解和支持向量回歸的北京市PM2.5預(yù)測[J]. 吉林大學(xué)學(xué)報(地球科學(xué)版),2016, 46(2): 563-568.
Qin Xiwen, Liu Yuanyuan, Wang Xinmin, et al.PM2.5 Prediction of Bejing City Based on Ensemble Empirical Mode Decomposition and Support Vector Regression[J]. Journal of Jilin University (Earth Science Edition), 2016, 46(2): 563-568.
[22] 王明常,丁文,趙競爭,等. 基于知識圖譜與隨機森林的落葉松毛蟲害遙感識別[J]. 吉林大學(xué)學(xué)報(地球科學(xué)版),2023, 53(6): 2006-2017.
Wang Mingchang, Ding Wen, Zhao Jingzheng, et al.Remote Sensing Identification of Dendrolimus Superans Infestation Based on Knowledge Graph and Random Forest[J]. Journal of Jilin University (Earth Science Edition), 2023, 53(3): 2006-2017.
[23] Pulver A, Lyu S. LSTM with Working Memory[C]// 2017 International Joint Conference on Neural Networks. [S. l.]: IEEE, 2017: 845-851.
[24] 張東曉,陳云天,孟晉. 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的測井曲線生成方法[J]. 石油勘探與開發(fā),2018, 45(4): 598-607.
Zhang Dongxiao, Chen Yuntian, Meng Jin. Synthetic Well Logs Generation Recurrent Neural Network[J]. Petroleum Exploration and Development, 2018, 45(4): 598-607.
[25] 滕建強,邱萌,楊明任,等. 基于門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)的測井曲線預(yù)測方法[J]. 油氣地質(zhì)與采收率,2023, 30(1): 93-100.
Teng Jianqiang, Qiu Meng, Yang Mingren, et al.Logging Curve Prediction Method Based on GRU[J]. Petroleum Geology and Recovery Efficiency, 2023, 30(1): 93-100.
[26] 沈記全,魏坤. 融合殘差網(wǎng)絡(luò)的CR-BiGRU入侵檢測模型[J]. 吉林大學(xué)學(xué)報(理學(xué)版),2023, 61(2): 353-361.
ShenJiquan, Wei Kun. CR-BiGRU Intrusion Detection Model Based on Residual Network[J]. Journal of Jilin University (Science Edition), 2023, 61(2): 353-361.
[27] Ghanem R, Loey M. Face Completion Using Generative Adversarial Network with Pretrained Face Landmark Generator [J]. International Journal of Intelligent Engineering and Systems, 2021, 14(2): 295-305.
[28] 王良基. 基于生成對抗網(wǎng)絡(luò)(GAN)的地質(zhì)統(tǒng)計學(xué)反演方法研究[D]. 成都:電子科技大學(xué),2021.
Wang Liangji. Geostatistical Inversion Using Generative Adversarial Network (GAN)[D]. Chengdu: University of Electronic Science and Technology of China, 2021.