楊雨希,譚成仟,李 航,侯 斌,潘景宇,鄭曉梅,付雨萱
(1.西安石油大學(xué)地球科學(xué)與工程學(xué)院,陜西西安 710065;2.陜西省油氣成藏地質(zhì)學(xué)重點(diǎn)實(shí)驗(yàn)室,陜西西安 710065;3.中國石油長(zhǎng)慶油田分公司第八采油廠,陜西西安 710016)
致密油已成為全球石油地質(zhì)領(lǐng)域研究的一大熱點(diǎn),然而致密油聚集條件和聚集機(jī)理與常規(guī)油藏明顯不同,加上地質(zhì)、開發(fā)、工程等諸多因素影響[1-2],使得致密油水平井開發(fā)存在產(chǎn)量遞減快、單井產(chǎn)能差、采出程度低等問題。對(duì)致密油水平井產(chǎn)能預(yù)測(cè)成為非常規(guī)油氣田開發(fā)規(guī)劃與部署的重要依據(jù)。通過機(jī)器學(xué)習(xí)對(duì)油井產(chǎn)能預(yù)測(cè)的研究已成為領(lǐng)域研究趨勢(shì)[3-7],但是對(duì)于油井初期產(chǎn)能預(yù)測(cè)的研究貢獻(xiàn)較少[8],本文將研究神經(jīng)網(wǎng)絡(luò)對(duì)初期產(chǎn)能的預(yù)測(cè)。通過對(duì)致密油水平井相關(guān)資料分析出哪些因素會(huì)影響初期產(chǎn)能。使用DNN 模型進(jìn)行預(yù)測(cè)。實(shí)例證明,該方法可以對(duì)致密油水平井的初期產(chǎn)能進(jìn)行很好的預(yù)測(cè)。
深層神經(jīng)網(wǎng)絡(luò)已經(jīng)成為機(jī)器學(xué)習(xí)社區(qū)開發(fā)的主流策略。深層神經(jīng)網(wǎng)絡(luò)作為多層無監(jiān)督神經(jīng)網(wǎng)絡(luò),具有多個(gè)非線性映射的特征變換,可以對(duì)高度復(fù)雜的函數(shù)進(jìn)行擬合。
函數(shù)f(x) 初始公式采用以下形式:
式中:w-隨機(jī)初始化權(quán)重;b-偏置。
模型隱藏層的激活函數(shù)采用sigmoid:
初始化線性函數(shù)之后模型開始前向傳播(圖1):
圖1 深層神經(jīng)網(wǎng)絡(luò)模型
通過進(jìn)行前向傳播,模型可以獲得預(yù)測(cè)值。為了衡量預(yù)測(cè)值和真實(shí)值之間的差異,以W 和b 作為變量構(gòu)建損失函數(shù)。本研究選擇均方誤差(MSE)方法作為模型的損失函數(shù):
本文的資料為Z 地區(qū)Z183 油藏長(zhǎng)7 段,位于鄂爾多斯盆地的南部,主要為致密油藏。整體是以深湖-半深湖沉積為主的沉積環(huán)境,平均孔隙度僅為6.68%,主要集中在2%~10%,滲透率集中在0.05~0.20 mD。儲(chǔ)層多以巖屑長(zhǎng)石砂巖、長(zhǎng)石巖屑砂巖為主,總體上Z地區(qū)具有高石英、低長(zhǎng)石的特點(diǎn)[9]。自2013 年開始建產(chǎn)至今,已開發(fā)水平井?dāng)?shù)量97 口,累計(jì)產(chǎn)油57.8 t,形成了以壓裂水平井為主體的致密油藏開發(fā)技術(shù)[10]。
實(shí)驗(yàn)選用Z183 油藏25 口井相關(guān)資料,整理得出13 個(gè)影響因素。通過分析將這13 個(gè)因素分為3 大類。其中地質(zhì)因素包括視儲(chǔ)能系數(shù)、滲透率、脆性指數(shù);開發(fā)因素包括井距、水平段長(zhǎng)、裂縫密度、返排率、返排時(shí)間、生產(chǎn)壓差;工程因素包括用液強(qiáng)度、加砂強(qiáng)度、砂比、總排量;影響致密油水平井初期產(chǎn)能因素?cái)?shù)量眾多。為了避免某些因素對(duì)產(chǎn)能預(yù)測(cè)產(chǎn)生負(fù)相關(guān)影響,導(dǎo)致模型的準(zhǔn)確率降低。通過熱力圖分析每個(gè)因素對(duì)水平井初期產(chǎn)能相關(guān)系數(shù)的強(qiáng)弱,篩選出影響初期產(chǎn)能具有正相關(guān)性的影響因素,為模型建立最優(yōu)解(圖2)。
由圖2 可以看出,有8 個(gè)特征和初產(chǎn)水平有緊密的關(guān)系,那么數(shù)值篩選可以篩選出這8 個(gè)因素作為模型的輸入。
通過上節(jié)的數(shù)據(jù)分析,其中地質(zhì)因素包括視儲(chǔ)能系數(shù)、脆性指數(shù);開發(fā)因素包括井距、水平段長(zhǎng)、裂縫密度;工程因素包括用液強(qiáng)度、加砂強(qiáng)度、總排量。提取8個(gè)相關(guān)因素。實(shí)驗(yàn)將20 口井共160 個(gè)數(shù)據(jù)用于訓(xùn)練,5口井共40 個(gè)數(shù)據(jù)用于測(cè)試。輸入神經(jīng)元設(shè)為8 個(gè)影響產(chǎn)能的因素,隱藏層設(shè)為5 層,通過DNN 模型來進(jìn)行訓(xùn)練(公式1,公式3~6)。激活函數(shù)采用sigmoid(公式2),損失函數(shù)采用MSE(公式7)。
由于篩選過后的模型參數(shù)數(shù)量依然很多,因此,在訓(xùn)練過程中加入dropout,用來減少模型對(duì)主要參數(shù)的依賴而忽視其他參數(shù)對(duì)數(shù)據(jù)的影響(下節(jié)會(huì)對(duì)dropout 的設(shè)置進(jìn)行說明)。為了自適應(yīng)調(diào)整學(xué)習(xí)率來改進(jìn)梯度下降,優(yōu)化器使用Adam 算法。
將訓(xùn)練次數(shù)設(shè)置為1 000,每次訓(xùn)練數(shù)量為5,dropout 設(shè)為0.3。測(cè)試了深層神經(jīng)網(wǎng)絡(luò)和淺層神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練誤差的影響,結(jié)果見圖3、表1。
表1 不同隱藏層深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差表
圖3 不同隱藏層深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差:a.隱藏層為1;b.隱藏層為5;c.隱藏層為7
通過圖3a、圖3b 和表1 可以看出,深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差能控制在5.000%以下而淺層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差變化幅度很大,基本上在5.000%以上,至于迭代4 000 次出現(xiàn)的異常會(huì)在下部分說明。
通過圖3b 和圖3c 展示了深層神經(jīng)網(wǎng)絡(luò)的隱藏層為5 層和7 層的訓(xùn)練誤差。可以看出隱藏層數(shù)量的增加會(huì)增加訓(xùn)練的速度,在隱藏層為7 層時(shí),訓(xùn)練誤差的下降速度比5 層快4 倍,但是迭代次數(shù)繼續(xù)增加,7 層的訓(xùn)練誤差波動(dòng)很明顯,5 層雖也有波動(dòng)但整體呈下降趨勢(shì)。不能更好的說明隱藏層數(shù)增加訓(xùn)練效果好。
由圖4 可以看出,dropout 的設(shè)置對(duì)訓(xùn)練誤差的影響,當(dāng)dropout 設(shè)置為0 時(shí),訓(xùn)練誤差為14.000%。設(shè)置為0.1 時(shí),訓(xùn)練誤差達(dá)到最大16.300%。隨后逐漸降低達(dá)到訓(xùn)練誤差的最小值7.410%。之后訓(xùn)練誤差逐步增加。說明dropout 為0.3 時(shí),模型的效果最好。
圖4 dropout 的設(shè)置對(duì)訓(xùn)練誤差的影響
通過調(diào)整超參數(shù)來提高神經(jīng)網(wǎng)絡(luò)性能,當(dāng)學(xué)習(xí)率為0.01 時(shí)深層神經(jīng)網(wǎng)絡(luò)和淺層神經(jīng)網(wǎng)絡(luò)的測(cè)試誤差不再減少。
隱藏層為5 層時(shí),測(cè)試誤差達(dá)到最小值為9.734%(圖5),模型的準(zhǔn)確率為90.266%,模型為淺層神經(jīng)網(wǎng)絡(luò)的測(cè)試誤差為10.260%,隱藏層為7 層時(shí),測(cè)試誤差為10.340%。5 層的準(zhǔn)確率相對(duì)淺層和隱藏層為7 層的模型高出20.000%。層數(shù)的增加并沒有使得準(zhǔn)確率變高。對(duì)比5 層模型的訓(xùn)練誤差和測(cè)試誤差,沒有出現(xiàn)較大的方差和偏差,說明5 層神經(jīng)網(wǎng)絡(luò)模型沒有出現(xiàn)過擬合和欠擬合的現(xiàn)象,模型效果很好。
圖5 隱藏層為5 層時(shí)的測(cè)試誤差
實(shí)驗(yàn)數(shù)據(jù)與開發(fā)模型的預(yù)測(cè)見圖6 中。在圖6 中,繪制了預(yù)測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)與總數(shù)據(jù)點(diǎn)的數(shù)據(jù)索引。從該圖中可以明顯看出,所開發(fā)模型的結(jié)果精確地遵循實(shí)驗(yàn)數(shù)據(jù)的趨勢(shì),這從目標(biāo)數(shù)據(jù)和模型結(jié)果之間的驚人覆蓋顯而易見。因此,該模型用于預(yù)測(cè)Z 地區(qū)致密油水平井初產(chǎn)水平具有很高的可靠性。
圖6 初期產(chǎn)能訓(xùn)練和測(cè)試數(shù)據(jù)集索引圖
深層神經(jīng)網(wǎng)絡(luò)對(duì)致密油水平井的初期產(chǎn)能預(yù)測(cè)具有出色的魯棒性。特別是加入dropout 以后,模型性能極大改善,對(duì)模型不依賴影響力大的參數(shù)的適應(yīng)性提高。使測(cè)試集的損失達(dá)到了90.266%。
致密油水平井初期產(chǎn)能影響因素按照重要程度為水平段長(zhǎng)、加砂強(qiáng)度、裂縫密度、脆性指數(shù)、用液強(qiáng)度、總排量、井距、視儲(chǔ)能系數(shù)。預(yù)示著影響致密油水平井初期產(chǎn)能的影響因素主要在開發(fā)和工程方面,其次是地質(zhì)因素。說明同一地區(qū)在地質(zhì)因素相近的情況下,開發(fā)和工程因素是影響致密油水平井初期產(chǎn)能的重要因素。基于此效果,可以通過這些因素指導(dǎo)Z 地區(qū)致密油水平井的開發(fā),獲取更高的產(chǎn)能。
通過上述實(shí)驗(yàn)可以發(fā)現(xiàn),通過開發(fā)因素、工程因素、地質(zhì)因素是可以預(yù)測(cè)出水平井的初產(chǎn)水平,相對(duì)于其他人通過油井動(dòng)態(tài)生產(chǎn)數(shù)據(jù)預(yù)測(cè)產(chǎn)能,該方法更加便捷,需要的數(shù)據(jù)少,更重要的是可以對(duì)剛開發(fā)的新井進(jìn)行預(yù)測(cè)。對(duì)于模型在訓(xùn)練迭代次數(shù)達(dá)到4 000 次時(shí)所產(chǎn)生的異常值,是因?yàn)閿?shù)據(jù)集的數(shù)量少,導(dǎo)致模型的訓(xùn)練誤差產(chǎn)生波動(dòng)。
雖然這個(gè)模型對(duì)于致密油水平井初期產(chǎn)能的預(yù)測(cè)有著不錯(cuò)的效果,但是通過熱力圖顯示的13 個(gè)影響因素對(duì)初產(chǎn)水平的預(yù)測(cè)仍然偏低,還需要更全面的影響因素?cái)?shù)據(jù)參與到模型訓(xùn)練中來,而且誤差的效果一般,這是因?yàn)閿?shù)據(jù)集的數(shù)量少,訓(xùn)練曲線波動(dòng)依然很大。因此,可以通過增加數(shù)據(jù)達(dá)到更好的效果。
在這項(xiàng)研究中,設(shè)計(jì)了深層神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)致密油水平井初期產(chǎn)能。該方法先將開發(fā)、工程、地質(zhì)13 個(gè)影響因素作為參數(shù),通過前期的數(shù)據(jù)分析得出影響Z地區(qū)致密油水平井初期產(chǎn)能的主要因素是工程因素和開發(fā)因素,篩選出8 個(gè)相關(guān)數(shù)值特征作為模型輸入?yún)?shù)。在訓(xùn)練和測(cè)試過程中使用了200 個(gè)數(shù)據(jù)點(diǎn),通過開發(fā)模型的統(tǒng)計(jì)和圖形評(píng)估表明該模型具有魯棒性,可以非常準(zhǔn)確的預(yù)測(cè)致密油水平井初期產(chǎn)能。此外通過對(duì)比隱藏層數(shù)量來確定最佳模型。結(jié)果表明當(dāng)隱藏層數(shù)量為5 層時(shí),模型預(yù)測(cè)致密油水平井初期產(chǎn)能最準(zhǔn)確,達(dá)到了90.266%。而其他數(shù)量的隱藏層模型的準(zhǔn)確率在90.000%以下??傊ㄟ^深層神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)致密油水平井初期產(chǎn)能達(dá)到了很好的效果,在預(yù)測(cè)產(chǎn)能數(shù)據(jù)方面也表現(xiàn)出合理的誤差,證明了該模型不遜色于其他傳統(tǒng)方法。