李彥尊 白玉湖 陳桂華 徐兵祥 陳 嶺 董志強(qiáng)
(中海油研究總院有限責(zé)任公司 北京 100028)
頁(yè)巖油氣主要賦存在微納尺度孔隙中,儲(chǔ)層致密、滲透性差,須采用長(zhǎng)水平井多段壓裂才能實(shí)現(xiàn)商業(yè)開(kāi)發(fā)。因此頁(yè)巖油氣產(chǎn)量遞減規(guī)律與常規(guī)油氣不同,表現(xiàn)為產(chǎn)量高峰出現(xiàn)在初始階段且初始遞減率高,之后長(zhǎng)期低產(chǎn)[1-2],如美國(guó)Eagle Ford頁(yè)巖油氣田,單井峰值產(chǎn)量300~500 BOE/d,第1年遞減率高達(dá)70%~90%,5~6年后油氣產(chǎn)量維持在約40 BOE/d,這種生產(chǎn)特征給頁(yè)巖油氣產(chǎn)量預(yù)測(cè)帶來(lái)了挑戰(zhàn)。目前頁(yè)巖油氣產(chǎn)量預(yù)測(cè)方法主要包括遞減曲線分析方法(DCA方法)、解析模型法、數(shù)值模擬法等[3-4]。DCA方法通過(guò)數(shù)學(xué)模型對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行擬合,預(yù)測(cè)精度主要受生產(chǎn)歷史長(zhǎng)短的影響[5-6];解析模型法基于滲流理論建立產(chǎn)能方程,多應(yīng)用于單相流動(dòng)、雙孔雙滲等條件下的油氣井滲流;數(shù)值模擬方法同樣基于滲流理論,可實(shí)現(xiàn)多相流動(dòng)、多重滲流系統(tǒng)條件下的產(chǎn)能計(jì)算。但由于儲(chǔ)層描述的不確定性及真實(shí)滲流過(guò)程的復(fù)雜性,影響了上述方法的應(yīng)用效果。
近幾年隨著人工智能技術(shù)的蓬勃發(fā)展,人工神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)手段也越來(lái)越多地應(yīng)用到油氣產(chǎn)量預(yù)測(cè)領(lǐng)域。在國(guó)內(nèi),囿于頁(yè)巖油氣數(shù)據(jù)較少,機(jī)器學(xué)習(xí)方法主要應(yīng)用在常規(guī)油藏產(chǎn)量預(yù)測(cè)方面[7-9]。國(guó)外學(xué)者開(kāi)展頁(yè)巖油氣產(chǎn)量機(jī)器學(xué)習(xí)研究時(shí),目前多以測(cè)井、壓力數(shù)據(jù)等為基礎(chǔ),水平段長(zhǎng)度、壓裂液量等工程因素考慮較少[10-12]。為了考慮地質(zhì)油藏工程等多方面因素對(duì)頁(yè)巖油氣產(chǎn)量的影響,本文以Eagle Ford頁(yè)巖某區(qū)塊數(shù)百口生產(chǎn)井的動(dòng)靜態(tài)數(shù)據(jù)為基礎(chǔ),探索人工神經(jīng)網(wǎng)絡(luò)方法適用性,進(jìn)而實(shí)現(xiàn)無(wú)生產(chǎn)數(shù)據(jù)條件下,不同地質(zhì)、油藏、工程設(shè)計(jì)參數(shù)條件下的產(chǎn)量預(yù)測(cè)。
頁(yè)巖油氣產(chǎn)能影響因素眾多[13-15],且相互影響,各因素間非線性關(guān)系較強(qiáng),常規(guī)分析方法難以建立起影響因素與產(chǎn)能的綜合關(guān)系[16-17]。人工神經(jīng)網(wǎng)絡(luò)方法是一種基于生物神經(jīng)網(wǎng)絡(luò)原理的機(jī)器學(xué)習(xí)算法,適用于多因素關(guān)系分析;該方法模型為多層結(jié)構(gòu),根據(jù)每層作用可分為輸入層、隱含層和輸出層,其中隱含層又可以包含多層結(jié)構(gòu)。
該方法的基本原理是首先將數(shù)據(jù)通過(guò)輸入層傳遞至神經(jīng)元:
式(1)中:X為初始輸入數(shù)組;x為樣本參數(shù)數(shù)據(jù);j為參數(shù)類(lèi)別。
數(shù)據(jù)經(jīng)過(guò)神經(jīng)元處理生成輸出值:
式(2)中:Y為神經(jīng)元輸出值;f(x)為激活函數(shù);w為權(quán)重系數(shù);b為偏置系數(shù);jmax為參數(shù)類(lèi)別個(gè)數(shù)。
本文中激活函數(shù)采用sigmoid函數(shù),即
通過(guò)大量數(shù)據(jù)樣本的學(xué)習(xí)訓(xùn)練,不斷調(diào)整輸入層、隱含層及輸出層的參數(shù),建立起目標(biāo)參數(shù)與輸入?yún)?shù)之間的相互關(guān)系。這種方法不要求參數(shù)間關(guān)系明確,只要給出足夠的數(shù)據(jù)樣本,便可通過(guò)調(diào)整模型參數(shù),最終實(shí)現(xiàn)目標(biāo)參數(shù)的準(zhǔn)確預(yù)測(cè)。頁(yè)巖油氣人工神經(jīng)網(wǎng)絡(luò)產(chǎn)能預(yù)測(cè)技術(shù)流程如圖1所示,在這個(gè)過(guò)程中,人工神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建、優(yōu)化和訓(xùn)練是實(shí)現(xiàn)參數(shù)預(yù)測(cè)的關(guān)鍵環(huán)節(jié)。
圖1 頁(yè)巖油氣人工神經(jīng)網(wǎng)絡(luò)產(chǎn)能預(yù)測(cè)技術(shù)Fig.1 Shale gas and oil production prediction technology using artificial neural network
以Eagle Ford某產(chǎn)區(qū)414口生產(chǎn)井為研究對(duì)象,考慮參數(shù)與產(chǎn)量的相關(guān)性、全面性和可量化性,篩選整理出各井?dāng)?shù)據(jù)齊全的13個(gè)參數(shù)作為輸入?yún)?shù),包括水平段長(zhǎng)度、壓裂級(jí)數(shù)、垂深、壓裂段間距、每簇間距、每簇射孔、每級(jí)簇?cái)?shù)、支撐劑量、壓裂液量、初始井口壓力、滲透率、孔隙度、TOC等,這些參數(shù)反映了儲(chǔ)層物性、含油氣性、壓裂改造、地層能量等與產(chǎn)能相關(guān)的多方面信息,能夠滿足本研究需要。對(duì)應(yīng)單井的一組輸入特征向量為
式(4)中:i為樣本組數(shù)。
輸出參數(shù)為
式(5)中:y i1、y i2、y i3分別為第i組樣本的初始產(chǎn)量、遞減率、遞減指數(shù)。
采用z-score標(biāo)準(zhǔn)化方法對(duì)參數(shù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除數(shù)據(jù)量綱的影響,即
式(6)中:x′ij為標(biāo)準(zhǔn)化后的數(shù)據(jù);xij為原始數(shù)據(jù);為所有樣本同類(lèi)參數(shù)的均值;n為樣本總數(shù)。
人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度和可靠性主要受模型網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練函數(shù)適用性及訓(xùn)練方法等影響。因此在模型調(diào)試過(guò)程中,需要對(duì)上述參數(shù)進(jìn)行優(yōu)化。
1)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化。
當(dāng)人工神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)置較為合理時(shí),能夠大幅度提高模型的訓(xùn)練擬合精度。對(duì)于隱含層數(shù)、神經(jīng)元數(shù)等參數(shù),前人總結(jié)并給出了相應(yīng)的經(jīng)驗(yàn)方法[18-19],但在本研究中,根據(jù)這些經(jīng)驗(yàn)方法所得到的模型擬合結(jié)果并不理想。因此在結(jié)構(gòu)參數(shù)優(yōu)化時(shí),采用了試算對(duì)比的方法,通過(guò)調(diào)整層數(shù)和神經(jīng)元數(shù)目,經(jīng)過(guò)迭代計(jì)算,選取達(dá)到預(yù)期精度時(shí)最簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu)為最佳模型結(jié)構(gòu),部分模型結(jié)構(gòu)預(yù)測(cè)精度對(duì)比見(jiàn)表1。最終確定了人工神經(jīng)網(wǎng)絡(luò)兩隱含層結(jié)構(gòu),第1層包含40個(gè)神經(jīng)元,第2層包含8個(gè)神經(jīng)元,擬合精度可達(dá)到99%。
表1 不同神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)下的擬合精度Table 1 Fitting accuracy of different neural network structure
2)訓(xùn)練函數(shù)優(yōu)化。
人工神經(jīng)網(wǎng)絡(luò)的全局誤差是通過(guò)訓(xùn)練函數(shù)控制的,對(duì)于模型的權(quán)值調(diào)整和訓(xùn)練效果具有顯著影響。研究中結(jié)合頁(yè)巖油氣產(chǎn)能數(shù)據(jù),對(duì)不同訓(xùn)練函數(shù)的擬合預(yù)測(cè)精度進(jìn)行了對(duì)比評(píng)價(jià)后,根據(jù)擬合和預(yù)測(cè)精度的大小,最終選取Levenberg-Marquardt算法(簡(jiǎn)稱(chēng)L-M算法)[20]作為產(chǎn)量預(yù)測(cè)模型的訓(xùn)練函數(shù)。L-M算法是人工神經(jīng)網(wǎng)絡(luò)中應(yīng)用較為廣泛的非線性最小二乘算法,其迭代方程為
式(7)中:f為損失函數(shù);α為在某方向上的損失速率;s為迭代步數(shù);J f為損失函數(shù)f的雅各比矩陣;I為單位矩陣;λ為阻尼因子。
當(dāng)阻尼因子λ較小時(shí),該方法步長(zhǎng)與高斯牛頓法類(lèi)似;當(dāng)λ較大時(shí),該方法與梯度下降法類(lèi)似。該算法針對(duì)頁(yè)巖油氣產(chǎn)能數(shù)據(jù)非線性強(qiáng)、關(guān)系復(fù)雜的特點(diǎn)具有良好的適應(yīng)性,實(shí)現(xiàn)損失函數(shù)的較快收斂。
通常人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練中訓(xùn)練集和檢驗(yàn)集是通過(guò)人為劃分且獨(dú)立存在,模型訓(xùn)練中只使用訓(xùn)練集,訓(xùn)練好的模型用檢驗(yàn)集進(jìn)行檢驗(yàn),整體樣本覆蓋率較低。為了提高計(jì)算效率和樣本的覆蓋率,采用了交叉驗(yàn)證方法進(jìn)行模型訓(xùn)練。交叉驗(yàn)證方法的原理是將樣本分為m份,取其中1份為檢驗(yàn)集,剩余m-1份為訓(xùn)練集,通過(guò)不斷對(duì)樣本隨機(jī)抽樣參與訓(xùn)練,最終篩選出達(dá)到預(yù)測(cè)精度的模型[21]。該方法使每個(gè)樣本均參與了模型訓(xùn)練,對(duì)于樣本數(shù)據(jù)較少的情況具有良好的訓(xùn)練效果。對(duì)簡(jiǎn)單驗(yàn)證法與交叉驗(yàn)證法的訓(xùn)練誤差進(jìn)行了對(duì)比,結(jié)果見(jiàn)圖2,可以看出,與常規(guī)樣本選擇方法相比,交叉驗(yàn)證法所訓(xùn)練的模型檢驗(yàn)誤差可控制在10%以?xún)?nèi),大幅度提高了模型的預(yù)測(cè)精度。
同時(shí)為了避免模型訓(xùn)練中局部訓(xùn)練誤差減小、全局預(yù)測(cè)誤差增大的情況,本研究中提出將訓(xùn)練精度和檢驗(yàn)精度共同設(shè)置為篩選條件,模型優(yōu)化篩選流程如圖3所示。當(dāng)模型訓(xùn)練精度達(dá)到要求之后,采用檢驗(yàn)集對(duì)模型進(jìn)行評(píng)價(jià)。如果檢驗(yàn)集預(yù)測(cè)結(jié)果達(dá)不到精度要求,則調(diào)整參數(shù)重新對(duì)模型進(jìn)行訓(xùn)練,直到模型的訓(xùn)練精度和檢驗(yàn)精度共同達(dá)到90%以上為止。
通過(guò)上述過(guò)程,最終確定并優(yōu)化人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練函數(shù)和訓(xùn)練方法,分別建立和訓(xùn)練了Eagle Ford研究區(qū)內(nèi)初始產(chǎn)量、遞減率、遞減指數(shù)等產(chǎn)能參數(shù)預(yù)測(cè)模型。
圖2 簡(jiǎn)單驗(yàn)證法與交叉驗(yàn)證法的訓(xùn)練誤差對(duì)比Fig.2 Comparison of error between simple and cross validation
圖3 人工神經(jīng)網(wǎng)絡(luò)模型優(yōu)化篩選流程Fig.3 Model optimization flow of ANN
以美國(guó)Ealge Ford頁(yè)巖某區(qū)塊400多口井?dāng)?shù)據(jù)為樣本建立人工神經(jīng)網(wǎng)絡(luò)方法模型,然后針對(duì)研究區(qū)內(nèi)的5口生產(chǎn)井進(jìn)行產(chǎn)量預(yù)測(cè),其中1~4號(hào)井位于產(chǎn)油區(qū),5號(hào)井位于產(chǎn)氣區(qū),其生產(chǎn)井基礎(chǔ)數(shù)據(jù)見(jiàn)表2。這5口井分別在2011—2013年間投產(chǎn),具有較長(zhǎng)的生產(chǎn)時(shí)間,可以利用實(shí)際生產(chǎn)數(shù)據(jù)對(duì)人工神經(jīng)網(wǎng)絡(luò)方法模型預(yù)測(cè)的結(jié)果進(jìn)行檢驗(yàn)。研究中將基于地質(zhì)、油藏、工程參數(shù)的人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果、基于生產(chǎn)歷史數(shù)據(jù)的DCA分析結(jié)果和實(shí)際生產(chǎn)數(shù)據(jù)進(jìn)行對(duì)比,以論證人工神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)精度和方法有效性。
不同方法對(duì)遞減參數(shù)的預(yù)測(cè)結(jié)果存在較明顯的差異(表3)。因此,需要結(jié)合實(shí)際生產(chǎn)數(shù)據(jù)從遞減曲線形態(tài)和預(yù)測(cè)誤差等方面對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。
圖4分別為各井實(shí)際產(chǎn)量數(shù)據(jù)、DCA法擬合產(chǎn)量與人工神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)產(chǎn)量三者之間的對(duì)比。從日產(chǎn)量趨勢(shì)可以看出,DCA方法與人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)方法均能反映頁(yè)巖油氣早期產(chǎn)量快速遞減、后期產(chǎn)量遞減較慢的生產(chǎn)特征。2種方法預(yù)測(cè)結(jié)果差異主要體現(xiàn)在產(chǎn)量快速遞減階段:DCA方法預(yù)測(cè)的產(chǎn)量曲線初始產(chǎn)量高,曲率變化較快;人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)的產(chǎn)量曲線初始產(chǎn)量普遍較低,遞減較為緩慢。這主要是由于初始產(chǎn)量計(jì)算方法不同造成的。DCA方法在與實(shí)際產(chǎn)量進(jìn)行擬合時(shí),普遍將產(chǎn)量曲線的最高值作為初始產(chǎn)量,而人工神經(jīng)網(wǎng)絡(luò)方法則是以開(kāi)始生產(chǎn)后連續(xù)30 d的平均產(chǎn)量作為初始產(chǎn)量進(jìn)行模型訓(xùn)練,其值相對(duì)較小,但同時(shí)也減小了產(chǎn)量波動(dòng)所帶來(lái)的預(yù)測(cè)誤差。從曲線形態(tài)上看,人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)的產(chǎn)量曲線能更好地反映產(chǎn)量變化的整體趨勢(shì)。
表2 美國(guó)Ealge Ford頁(yè)巖某區(qū)塊5口生產(chǎn)井?dāng)?shù)據(jù)Table 2 Basic data of 5 wells in Eagle Ford shale
表3 美國(guó)Ealge Ford頁(yè)巖某區(qū)塊5口生產(chǎn)井遞減參數(shù)預(yù)測(cè)結(jié)果Table 3 Prediction results of decline parameters of 5 wells in Eagle Ford shale
圖4 美國(guó)Ealge Ford頁(yè)巖某區(qū)塊5口生產(chǎn)井產(chǎn)油(氣)量及累計(jì)產(chǎn)量預(yù)測(cè)結(jié)果對(duì)比Fig.4 Comparison of prediction results of production and cumulative production of 5 wells in Eagle Ford shale
在累計(jì)產(chǎn)量曲線對(duì)比中可以看出,隨著預(yù)測(cè)時(shí)間的增加,2種方法預(yù)測(cè)結(jié)果差異逐漸增大,這種差異表明無(wú)論是人工神經(jīng)網(wǎng)絡(luò)方法還是DCA方法,對(duì)頁(yè)巖油氣井中后期的產(chǎn)量預(yù)測(cè)均存在一定的不確定性。
表4為人工神經(jīng)網(wǎng)絡(luò)方法5 a內(nèi)年累計(jì)產(chǎn)量預(yù)測(cè)值與實(shí)際值對(duì)比,從表中可以看出,預(yù)測(cè)誤差普遍小于10%,且預(yù)測(cè)誤差隨時(shí)間逐漸增大。但在本研究中由于生產(chǎn)井后期實(shí)際產(chǎn)量比預(yù)測(cè)結(jié)果偏低,縮小了與預(yù)測(cè)產(chǎn)量的差距,5年累產(chǎn)預(yù)測(cè)誤差有所減小。同時(shí)產(chǎn)量波動(dòng)對(duì)模型預(yù)測(cè)精度影響較大,如2號(hào)井,模型累計(jì)產(chǎn)量預(yù)測(cè)結(jié)果與實(shí)際相比,誤差達(dá)到了11%。從整體來(lái)看,在投產(chǎn)5年內(nèi)本文模型產(chǎn)量預(yù)測(cè)具有較高的精度(>90%),能夠滿足布井方案評(píng)價(jià)、未投產(chǎn)井或投產(chǎn)時(shí)間較短情況下產(chǎn)量預(yù)測(cè)要求。
表4 人工神經(jīng)網(wǎng)絡(luò)方法累計(jì)產(chǎn)量預(yù)測(cè)誤差Table 4 The error of accumulative production prediction by ANN method
1)利用美國(guó)Eagle Ford頁(yè)巖油氣區(qū)塊數(shù)據(jù)建立的人工神經(jīng)網(wǎng)絡(luò)頁(yè)巖油氣產(chǎn)量預(yù)測(cè)新模型,考慮了多種因素對(duì)產(chǎn)能的影響,同時(shí)克服了油氣滲流理論的局限性,可以進(jìn)行無(wú)生產(chǎn)數(shù)據(jù)條件下的產(chǎn)量預(yù)測(cè),5 a內(nèi)產(chǎn)量預(yù)測(cè)具有較高的精度,誤差在10%以?xún)?nèi)。
2)人工神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法在頁(yè)巖油氣產(chǎn)量預(yù)測(cè)方面具有較大的推廣應(yīng)用價(jià)值,能有效提高頁(yè)巖油氣產(chǎn)能評(píng)價(jià)工作效率和預(yù)測(cè)水平,在數(shù)據(jù)不斷豐富的基礎(chǔ)上,其預(yù)測(cè)精度和應(yīng)用潛力仍會(huì)不斷提升。