滕建強,邱 萌,楊明任,申輝林,曲 薩,孫啟鵬
(1.中國石化西北油田分公司石油工程技術(shù)研究院,新疆烏魯木齊830011;2.中國石化碳酸鹽巖縫洞型油藏提高采收率重點實驗室,新疆烏魯木齊830011;3.中國石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,山東青島266580)
測井資料在儲層描述和油氣儲集能力評價中具有十分重要的作用,通常只能在鉆井后通過測井工程獲取,而在隨鉆測井過程中需對未鉆地層的測井資料提前預(yù)測,這對隨鉆測井具有重要意義。如果能夠提前預(yù)測到未鉆地層深度序列的測井?dāng)?shù)據(jù),則會有效提高鉆探過程的可靠性和安全性,且節(jié)約生產(chǎn)成本。在鉆探前預(yù)測未鉆地層測井曲線方法與測井曲線重構(gòu)方法具有一定的相似性,前人研究中曾使用傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)預(yù)測未知深度序列方向的測井曲線[1-5],以上方法雖然能夠?qū)W習(xí)到測井曲線之間的非線性關(guān)系,但由于測井信息受地層沉積特征的影響具有時序漸變性,曲線深度序列的變化趨勢和測井曲線的前后關(guān)聯(lián)性將會發(fā)生改變[6]。因此,基于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的方法極大簡化了地質(zhì)沉積漸變過程,與實際地層參數(shù)相比,該方法構(gòu)建的測井預(yù)測模型誤差太大,導(dǎo)致預(yù)測未鉆地層測井曲線質(zhì)量難以保證。
近年來,機器學(xué)習(xí)快速發(fā)展,在科學(xué)和工程領(lǐng)域應(yīng)用廣泛并獲得了突破性的進展,為預(yù)測未鉆地層測井曲線提供了新思路和方法,且已將一些常規(guī)的機器學(xué)習(xí)算法應(yīng)用到測井曲線預(yù)測,如支持向量機(SVM)[7-8]、模糊邏輯模型(FLM)[9-10]、隨機森林[11]、極端梯度提升[12]等,在一定條件下取得了較好的效果,但這些常規(guī)的機器學(xué)習(xí)算法網(wǎng)絡(luò)結(jié)構(gòu)簡單,無法解決地層復(fù)雜的非線性問題。由于測井曲線與地質(zhì)參數(shù)間的非線性關(guān)系復(fù)雜,用簡單的機器學(xué)習(xí)算法無法明確其數(shù)學(xué)關(guān)系,因此,應(yīng)用這些方法具有一定的局限性[13]。深度學(xué)習(xí)方法是當(dāng)前機器學(xué)習(xí)領(lǐng)域最熱門的方向之一,其網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜且具有多個隱含層,不僅能通過提取每一項特征將樣本的原始空間特征轉(zhuǎn)換成新的高維空間特征表征,還能為數(shù)據(jù)建立更加抽象的特征描述,從而將預(yù)測或分類問題簡單化且提高準確性[14]。長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(GRU)模型作為深度學(xué)習(xí)的研究熱點之一,是一種具有記憶功能的神經(jīng)網(wǎng)絡(luò)模型,較適用于未鉆地層測井曲線預(yù)測,與其他網(wǎng)絡(luò)結(jié)構(gòu)的不同之處在于增加了自循環(huán)體,可以將前一個深度序列的樣本輸出并與下一個深度序列的樣本進行運算,使模型處理得到的測井?dāng)?shù)據(jù)不僅具有前一個深度序列的特征信息,還具有樣本自身的特征信息,能較好地預(yù)測未鉆地層測井曲線。王俊等研發(fā)一種基于深度雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的儲層孔隙度預(yù)測方法,有效解決了孔隙度預(yù)測中的空間尺度問題和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)無法提供前后序列信息的問題,提高了孔隙度預(yù)測的準確性和穩(wěn)定性[15],但該網(wǎng)絡(luò)對數(shù)據(jù)量需求過大,且容易出現(xiàn)過擬合現(xiàn)象。宋輝等將卷積神經(jīng)網(wǎng)絡(luò)與門控循環(huán)單元網(wǎng)絡(luò)相結(jié)合,有效地提取測井?dāng)?shù)據(jù)特征,提高了儲層參數(shù)的預(yù)測精度[16],但該網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜且訓(xùn)練時容易出現(xiàn)局部最小值,池化層也會丟失大量有價值信息,忽略局部與整體之間的關(guān)聯(lián)性。
測井?dāng)?shù)據(jù)是具有非線性和序列化特性的數(shù)據(jù)結(jié)構(gòu),為此,應(yīng)用GRU 模型對新疆油田和南海西部油田進行實際測井?dāng)?shù)據(jù)預(yù)測,并與LSTM 模型進行對比分析,結(jié)果表明,GRU 模型預(yù)測效果更好,可有效預(yù)測未鉆地層地球物理測井特征并指導(dǎo)鉆井和測井工程。
循環(huán)神經(jīng)網(wǎng)絡(luò)是一類專門處理深度序列數(shù)據(jù)的深度學(xué)習(xí)模型,在不同深度序列數(shù)據(jù)的步長上,該網(wǎng)絡(luò)模型能夠循環(huán)共享權(quán)重,并進行跨越深度序列鏈接,這在處理測井深度序列數(shù)據(jù)上具有較大優(yōu)勢。LSTM模型新增加了遺忘門、輸入門、tanh層、輸出門4個交互層(圖1),使自循環(huán)的權(quán)重成為變化的參數(shù)。各個門限可以對前一時刻的單元狀態(tài)進行處理,并將新的測井信息添加到當(dāng)前時刻的單元狀態(tài)。因此,在模型參數(shù)不變的情況下,不同時刻的積分尺度可以動態(tài)變化,從而解決了梯度消失或梯度爆炸問題,也無需確定窗口的延遲長度[17]。
圖1 LSTM模型結(jié)構(gòu)Fig.1 Structure of LSTM model
第1 個交互層為遺忘門,決定哪些測井信息需要被忘記(丟棄),即上一時刻的單元狀態(tài)有多少測井信息傳遞到當(dāng)前時刻的單元狀態(tài),當(dāng)前時刻的輸入值和上一時刻的隱含層節(jié)點的輸出值組合成一個新的特征向量,然后乘以權(quán)重,最后輸入到sigmoid函數(shù)中。其表達式為:
第2 個交互層為輸入門,決定當(dāng)前時刻的輸入值中有多少測井信息保存到當(dāng)前時刻的單元狀態(tài),其表達式為:
第3 個交互層為tanh 層,決定當(dāng)前時刻的候選值。與輸入向量相乘,以確定候選值中有多少新的測井信息被存放到單元狀態(tài)中,其表達式為:
將攜帶記憶信息的單元狀態(tài)與攜帶新的測井信息的候選值相結(jié)合,t時刻的遺忘門決定忘記t-1 時刻的單元狀態(tài)中的哪些測井信息,t時刻的輸入門決定保留和添加t- 1 時刻的單元狀態(tài)中的哪些測井信息。t時刻的單元狀態(tài)表達式為:
第4 個交互層為輸出門,決定當(dāng)前時刻需要輸出的測井信息,其表達式為:
LSTM 模型不僅能從序列數(shù)據(jù)中提取測井信息,還能夠記憶先前步驟的長期相關(guān)性的測井信息,這反映了該模型能較好地考慮到前期的測井曲線對未鉆地層的影響。
GRU 模型是對LSTM 模型的改進和優(yōu)化,保留了LSTM 模型處理深度序列方向測井?dāng)?shù)據(jù)的能力,使其在保留長期記憶功能的同時簡化了網(wǎng)絡(luò)結(jié)構(gòu),且訓(xùn)練參數(shù)減少,收斂速度加快,預(yù)測精度提高。由圖2 可以看出,GRU 模型將LSTM 模型中的輸入門、遺忘門和輸出門用更新門和重置門代替。GRU模型將原來的輸入門和遺忘門變成單一的更新門,決定了當(dāng)前時刻的輸入值中有多少測井?dāng)?shù)據(jù)將被保留,更新門的值越大,當(dāng)前時刻測井?dāng)?shù)據(jù)保留越多;重置門決定前一時刻的輸出值對當(dāng)前時刻的輸入值的影響,重置門的值越大,當(dāng)前時刻的輸入受前一時刻的輸出影響越大[18]。這說明GRU 模型不僅結(jié)構(gòu)更簡單,收斂速度更快,而且還避免了過擬合現(xiàn)象發(fā)生。
圖2 GRU模型結(jié)構(gòu)Fig.2 Structure of GRU model
更新門和重置門在t時刻的狀態(tài)定義分別為:
當(dāng)前神經(jīng)元的特定輸出值表達式為:
GRU模型的輸出值表達式為:
利用已鉆地層的測井?dāng)?shù)據(jù)作為訓(xùn)練模型,預(yù)測下一深度序列方向的測井?dāng)?shù)據(jù),其預(yù)測模型為:
首先選取已鉆地層的測井?dāng)?shù)據(jù)及鄰井的數(shù)據(jù)(圖3中深度井段為M的測井訓(xùn)練數(shù)據(jù))并將其輸入到GRU 模型中用于訓(xùn)練模型,優(yōu)化網(wǎng)絡(luò)模型參數(shù),更新隱含層節(jié)點單元的狀態(tài),然后將訓(xùn)練好的模型用于預(yù)測未鉆地層的測井?dāng)?shù)據(jù)(圖3 中深度井段為N的測井測試數(shù)據(jù))。圖3中,h0是GRU 模型隱含層節(jié)點的初始狀態(tài),ht-1和Ct-1是深度井段為M的測井訓(xùn)練數(shù)據(jù)t-1 時刻的輸出值和單元狀態(tài),當(dāng)前時刻的輸出被傳遞到深度井段為N的測井測試數(shù)據(jù)作為第一步預(yù)測的輸入數(shù)據(jù)。預(yù)測數(shù)據(jù)段的起始數(shù)據(jù)序號為t,則在t- 1 時刻可用GRU 網(wǎng)絡(luò)基于深度井段為M的測井訓(xùn)練數(shù)據(jù)獲取輸出節(jié)點的單元狀態(tài)和內(nèi)部狀態(tài),再結(jié)合t時刻的鄰井測井?dāng)?shù)據(jù)預(yù)測t時刻的單元狀態(tài)和內(nèi)部狀態(tài),進而預(yù)測t時刻的值。最后結(jié)合t時刻的單元狀態(tài)和t- 1時刻的鄰井測井?dāng)?shù)據(jù)就可獲得t- 1時刻的單元狀態(tài)和預(yù)測值。
圖3 GRU模型流程Fig.3 Flow chart of GRU model
數(shù)據(jù)預(yù)處理工作將確保各測井參數(shù)處于規(guī)范的分布范圍內(nèi),這樣能夠使網(wǎng)絡(luò)模型更易學(xué)習(xí)到各參數(shù)之間的關(guān)聯(lián)性。數(shù)據(jù)標準化是機器學(xué)習(xí)中最基本的預(yù)處理工作,為了減小不同測井參數(shù)間的量綱影響,采用分數(shù)歸一化方法對測井?dāng)?shù)據(jù)進行標準化處理,以期各參數(shù)間具有可比性,處理后的測井?dāng)?shù)據(jù)須服從標準正態(tài)分布,數(shù)據(jù)標準化表達式為:
為了加快網(wǎng)絡(luò)收斂速度,優(yōu)化學(xué)習(xí)率,減少迭代次數(shù),需要選擇優(yōu)化算法進行網(wǎng)絡(luò)模型訓(xùn)練。常用的優(yōu)化算法包括SGD,RMSProp,Adam,AdaGrad等,其中SGD 算法簡單,收斂速度快,但容易陷入局部最小值,導(dǎo)致無法獲得最優(yōu)解。為此,采用Adam算法,并結(jié)合RMSProp和AdaGrad兩個算法的優(yōu)點,這樣不僅適用于稀疏梯度,還具備解決非平穩(wěn)數(shù)據(jù)的特性[19]。
GRU 模型訓(xùn)練過程大致包括以下步驟:①以測井曲線作為輸入?yún)?shù),輸入到LSTM 和GRU 模型中進行訓(xùn)練,沿著深度前向傳播方向有序計算GRU 單元的輸出值。②將測井曲線輸出值與實際值進行比較,沿著反向傳播方向計算每個GRU 單元的誤差。③根據(jù)反向傳播計算的誤差,計算每個權(quán)重梯度,并用Adam 算法更新權(quán)重,使測井曲線預(yù)測值與實際值逐步逼近。④不斷重復(fù)上述步驟,使GRU 模型不斷得以訓(xùn)練并優(yōu)化。
以測井曲線的實際值與預(yù)測值之間的均方根誤差和相關(guān)系數(shù)作為評價預(yù)測方法的標準,即均方根誤差越小,相關(guān)系數(shù)越大,則測井?dāng)?shù)據(jù)預(yù)測方法更優(yōu),預(yù)測精度更高,其計算公式如下:
為了驗證上述兩種方法預(yù)測測井曲線的應(yīng)用效果,對多個油田的測井曲線進行預(yù)測,均取得了理想的應(yīng)用效果。以新疆油田已鉆直井電纜測井曲線和南海西部油田水平井隨鉆測井曲線為例進行預(yù)測效果和精度分析。
新疆油田A1井為直井,對常規(guī)電纜測井曲線以及鄰井測井?dāng)?shù)據(jù)中的自然伽馬(GR)、深感應(yīng)電阻率(Rt)、聲波時差(AC)、密度(DEN)、井徑(CAL)5 條測井曲線數(shù)據(jù)進行預(yù)測處理,將其分別輸入到GRU 和LSTM 模型中進行預(yù)測,以評價兩種模型利用已鉆地層測井?dāng)?shù)據(jù)以及鄰井測井?dāng)?shù)據(jù)預(yù)測未鉆地層深度序列測井曲線的能力,并分析兩種模型預(yù)測結(jié)果的精度和優(yōu)劣。
實際預(yù)測搭建的GRU 模型由2 個GRU 層和1個全連接層組成,其中每個隱含層的節(jié)點數(shù)為10,批處理大小為20,退出率為0.3,測井序列長度為20,可以通過改變序列長度調(diào)整GRU 模型的記憶范圍,學(xué)習(xí)率為0.01,學(xué)習(xí)率是網(wǎng)絡(luò)模型中重要的超參數(shù)。學(xué)習(xí)率過低,會減緩模型收斂速度;學(xué)習(xí)率過高,在梯度下降時易錯過最低點,導(dǎo)致模型收斂效果不佳。此外,與其對應(yīng)的LSTM 模型也采用相同的預(yù)測參數(shù)和算法進行測井曲線預(yù)測。
圖4 為新疆油田A1 井常規(guī)電纜測井曲線GRU和LSTM 模型訓(xùn)練-預(yù)測結(jié)果,1 895~1 928 m 井段為模型的訓(xùn)練擬合層段,1 928~1 940 m 井段為模型的預(yù)測層段。從圖4 中可以看出,GRU 和LSTM 模型在訓(xùn)練階段實際測井值與預(yù)測值基本重合,說明兩模型均已學(xué)習(xí)訓(xùn)練完成,且GRU 模型學(xué)習(xí)訓(xùn)練效果更好。兩種模型在預(yù)測深度序列方向未鉆地層測井曲線上均取得了較好的預(yù)測效果,雖然存在一定誤差,但總體上能夠逼近實際測井曲線,尤其是在測井曲線沒有發(fā)生大幅度突變時,GRU 模型預(yù)測效果更好。尤其是新疆油田A1 井在埋深為1 930~1 935 m 處GR和Rt測井曲線發(fā)生較大幅度突變,由于該井訓(xùn)練階段學(xué)習(xí)過程有類似的曲線特征趨勢變化,因此兩種模型均比較好地預(yù)測到巖電曲線以及其他測井曲線這一變化趨勢,但GRU 模型能夠綜合考慮測井曲線隨深度序列的變化趨勢和曲線前后的關(guān)聯(lián)性,使得預(yù)測結(jié)果比LSTM 模型更接近實際測井曲線,這表明GRU 模型的長時記憶功能在預(yù)測未鉆地層深度序列測井曲線上應(yīng)用效果更佳。其余三條測井曲線AC,DEN和CAL訓(xùn)練階段模型學(xué)習(xí)也充分,訓(xùn)練效果也不錯,使兩種模型預(yù)測結(jié)果更加逼近實際測井曲線,且GRU 模型的預(yù)測效果同樣比LSTM模型更好。
圖4 A1井常規(guī)電纜測井訓(xùn)練-預(yù)測結(jié)果Fig.4 Prediction results of regular logging training in Well A1
由GRU和LSTM模型的相關(guān)系數(shù)和均方根誤差評價參數(shù)計算結(jié)果(表1)也可以看出,GRU 模型預(yù)測未鉆地層深度序列的測井曲線效果比LSTM 模型好,因此,相對于LSTM 模型,新疆油田A1 井應(yīng)用GRU模型預(yù)測的GR,Rt,AC,DEN和CAL曲線的相關(guān)系數(shù)分別提升了5.13%,33.33%,7.87%,16.67%和5.88%,均方根誤差分別下降了3.14%,47.99%,19.96%,50%和14.29%。其中,GRU 模型比LSTM模型平均相關(guān)系數(shù)提高13.78%,平均均方根誤差下降27.08%。這些預(yù)測結(jié)果均表明,GRU 模型預(yù)測對具有深度序列特性的測井?dāng)?shù)據(jù)效果好、精度高、適用性更強。
表1 A1井GRU和LSTM模型相關(guān)系數(shù)和均方根誤差對比Table1 Comparison of correlation coefficient and root mean square error between LSTM and GRU models in Well A1
南海西部油田B6井為水平井,本次實際預(yù)測搭建的LSTM 和GRU 模型結(jié)構(gòu)與新疆油田A1 井所用模型具有相同的預(yù)測參數(shù)和算法,這樣能夠保證訓(xùn)練與預(yù)測的曲線具有可靠性與對比性。
圖5 是南海西部油田B6 井隨鉆測井曲線GRU和LSTM 模型訓(xùn)練-預(yù)測結(jié)果。1 260~1 290 m 井段為模型的訓(xùn)練擬合層段,1 290~1 306 m 井段為模型的預(yù)測層段。由圖5 可知,發(fā)現(xiàn)GRU 和LSTM 模型同樣在訓(xùn)練階段預(yù)測值與實際值基本重合,且GRU模型的預(yù)測效果同樣比LSTM 模型更好,說明GRU模型適用性比LSTM模型更強。
圖5 B6井隨鉆測井訓(xùn)練-預(yù)測結(jié)果Fig.5 Prediction results of logging-while-drilling(LWD)training in Well B6
由南海西部油田B6 井GRU 和LSTM 模型處理的相關(guān)系數(shù)和均方根誤差評價參數(shù)計算結(jié)果(表2)可知,GRU 模型預(yù)測的GR,Rt,AC,DEN和CAL曲線的相關(guān)系數(shù)分別提高8.14%,18.52%,20.78%,6.67% 和6.52%,均方根誤差分別下降23.18%,54.64%,49.68%,33.33%和50%。其中,GRU 模型比LSTM 模型平均相關(guān)系數(shù)提高12.13%,平均均方根誤差下降42.17%。這些預(yù)測結(jié)果再次表明,GRU模型處理對具有深度序列特性的測井?dāng)?shù)據(jù)可靠性強、精度高、適用性強。
表2 B6井LSTM和GRU模型相關(guān)系數(shù)和均方根誤差對比Table2 Comparison of correlation coefficient and root mean square error between LSTM and GRU models
以新疆油田已鉆直井電纜測井曲線和南海西部油田水平井隨鉆測井曲線為例,利用GRU 和LSTM 模型進行了預(yù)測效果和精度分析,結(jié)果表明,兩種模型在直井常規(guī)電纜測井和水平井隨鉆測井中均能提前獲取未鉆地層的測井信息,可有效指導(dǎo)鉆井和測井工程,為地質(zhì)導(dǎo)向提供科學(xué)依據(jù)。受井眼環(huán)境特別是擴徑影響嚴重的測井曲線,如DEN和AC曲線,可應(yīng)用GRU 模型預(yù)測測井曲線的方法進行井眼影響校正,有助于提高測井解釋精度。但GRU 模型的預(yù)測效果比LSTM 模型更好、適用性更強、精度更高。另外GRU 模型還可以應(yīng)用于測井曲線重構(gòu),有助于降低測井費用,可達到降本增效的目的。
符號解釋
b——偏置項;
bc—候選值狀態(tài)下的偏置項;
bf——遺忘門狀態(tài)下的偏置項;
bi——輸入門狀態(tài)下的偏置項;
bo——輸出門狀態(tài)下的偏置項;
——候選狀態(tài);
C0——初始時刻的單元狀態(tài);
C1——第1時刻的單元狀態(tài);
Ct——t時刻的單元狀態(tài);
——t時刻的候選值;
Ct+1——t +1時刻的單元狀態(tài);
Ct-1——t- 1時刻的單元狀態(tài);
Ct-2——t- 2時刻的單元狀態(tài);
Ct-M——t-M時刻的單元狀態(tài);
ft——t時刻的遺忘門;
f——GRU模型;
h0——GRU模型隱含層節(jié)點的初始狀態(tài);
ht——測井序列t時刻隱含層節(jié)點的輸出值;
——測井序列t時刻隱含層節(jié)點的候選狀態(tài);
ht-1——測井序列t- 1時刻隱含層節(jié)點的輸出值;
ht-2——測井序列t- 2時刻隱含層節(jié)點的輸出值;
ht-M——測井序列t-M時刻隱含層節(jié)點的輸出值;
ht+N-1——測井序列t+N- 1 時刻隱含層節(jié)點的輸出值;
i——當(dāng)前時刻的輸入值;
it——t時刻的輸入門;
M,N——分別為測試樣本的采樣數(shù)目;
n——深度序列長度;
ot——t時刻的輸出門;
p——測試樣本的采樣數(shù)目;
r——測井曲線實際值與預(yù)測值之間的相關(guān)系數(shù);
rt——GRU模型的重置門;
t——測井序列的測試時刻;
Ur——重置門的權(quán)重矩陣;
Uz——更新門的權(quán)重矩陣;
wc——候選狀態(tài)的權(quán)重參數(shù);
wi——輸入門的權(quán)重參數(shù);
wo——輸出門的權(quán)重參數(shù);
wf——遺忘門的權(quán)重參數(shù);
Wh——隱含層的權(quán)重矩陣;
Wr——重置門的權(quán)重矩陣;
Wz——更新門的權(quán)重矩陣;
xt——測井序列t時刻隱含層節(jié)點的輸入值;
xi——各輸入?yún)?shù);
Xi——測井曲線各參數(shù)的實測序列;
Xt——t時刻的輸入值;
——t時刻測井曲線的預(yù)測值;
yt-1,yt-2,yt-3,yt-n+1——GRU模型t時刻之前輸入值;
yi,——測井曲線各參數(shù)的實際值和預(yù)測值;
Yi——測井曲線各參數(shù)的生成序列;
zt——GRU模型的更新門;
Z*——標準化后的參數(shù);
σ——sigmoid函數(shù);
*——哈達瑪積;
μi——各輸入?yún)?shù)的平均值;
δi——各輸入?yún)?shù)的標準方差,其分布范圍為[-1,1];
εRMSE——測井曲線實際值與預(yù)測值之間的均方根誤差。