侯亞偉,劉 超,徐中波,安玉華,李景玲
(中海石油(中國)有限公司天津分公司渤海石油研究院,天津 300459)
蓬萊19-3是儲量十億噸級特大型油田[1],目前采出程度15.5%,綜合含水率82.5%。油層凈毛比變化大,非均質(zhì)強(qiáng)[2],孔隙度15.0%~35.4%,滲透率18~3 619 mD,原油黏度7~46 mPa·s[3],生產(chǎn)壓差變化大。影響采收率的因素復(fù)雜[4],如何快捷而準(zhǔn)確預(yù)測不同區(qū)塊和不同儲層的采收率是亟需解決的問題。目前預(yù)測采收率的方法有經(jīng)驗(yàn)公式法[5]、水驅(qū)曲線法[6-7]和數(shù)值模擬法等[8-9]。采收率預(yù)測經(jīng)驗(yàn)公式未充分考慮非均質(zhì)性和生產(chǎn)壓差等因素,預(yù)測可靠性差,適用范圍小。水驅(qū)曲線法預(yù)測的采收率嚴(yán)重依賴生產(chǎn)數(shù)據(jù)的選取,不同開發(fā)階段的數(shù)據(jù)反映的規(guī)律差異大,直線段不唯一[10],計(jì)算結(jié)果差異大,實(shí)用性差。此外,水驅(qū)曲線在特高含水階段出現(xiàn)“上翹”現(xiàn)象[11-13],拐點(diǎn)和斜率難確定,方法失效。油藏數(shù)值模擬法雖然考慮因素全面,但存在動態(tài)、靜態(tài)數(shù)據(jù)準(zhǔn)確提取難度大、計(jì)算工作量大和歷史擬合不唯一性等問題。
近年來,采用機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)(ANN)解決油田開發(fā)預(yù)測問題取得了一定進(jìn)展[14-19],但尚未見到綜合考慮油藏因素和油井工作制度的ANN預(yù)測采收率方法。為此,筆者選取滲透率變異系數(shù)、原油黏度、凈毛比和生產(chǎn)壓差4個關(guān)鍵因素,采用油藏數(shù)值模擬方法對625組方案數(shù)據(jù)進(jìn)行了模擬,建立了625組采收率及其影響因素關(guān)系數(shù)據(jù)庫;采用基于機(jī)器學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)理論,構(gòu)建了影響采收率的參數(shù)輸入層、隱含層和輸出層,建立了快速預(yù)測采收率的人工神經(jīng)網(wǎng)絡(luò)方法;選取500組數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練,125組數(shù)據(jù)進(jìn)行測試檢驗(yàn),采收率預(yù)測結(jié)果的平均相對誤差為0.16%,在精度和計(jì)算速度上具有明顯優(yōu)勢。
根據(jù)蓬萊19-3油田的地質(zhì)、油藏和流體等數(shù)據(jù)[1,3],構(gòu)建了三維模型,網(wǎng)格數(shù)量為60×60×7,平面網(wǎng)格尺寸為10 m×10 m;縱向7層網(wǎng)格由上至下分別對應(yīng)油組L50、L54、L60、L62、L64、L72和L76,其主要參數(shù)見表1。
該油田前期的研究表明,生產(chǎn)壓差是影響滲流速度、油井產(chǎn)量、有效泄油面積和最終采收率最顯著的動態(tài)參數(shù),能較好地反映生產(chǎn)動態(tài)。層間滲透率變異系數(shù)是層間非均質(zhì)性的定量表征參數(shù),是影響合注合采多層非均質(zhì)性油藏層間儲量動用差異和采出程度的地質(zhì)因素;水的黏度相對變化較小,因此原油黏度是影響油水流度比、含水率和對應(yīng)含水率情況下采收率的最主要因素;凈毛比定量表征了有效厚度和砂體厚度的比值,能夠反映油層的品質(zhì)和采收率。由此可見,滲透率變異系數(shù)、原油黏度和凈毛比能較全面地反映油藏特性。因此,選取這4個關(guān)鍵因素,每個影響因素設(shè)置5個水平(見表2)。
表1 概念地質(zhì)模型基本參數(shù)Table 1 Basic parameters of conceptual geological model
根據(jù)蓬萊19-3油田地層流體性質(zhì),原油黏度在5~45 mPa·s 范圍內(nèi)取5個水平值。滲透率變異系數(shù)作為反映滲透率非均質(zhì)性的參數(shù),能夠定量表征滲透率非均質(zhì)程度??紤]油田實(shí)際地質(zhì)情況復(fù)雜,儲層非均質(zhì)性強(qiáng),滲透率變異系數(shù)范圍大,根據(jù)蓬萊19-3油田的非均質(zhì)特征,滲透率變異系數(shù)選取0~1.0之間的5個水平值。凈毛比是有效厚度與砂體厚度的比值,根據(jù)該油田砂體的凈毛比,將凈毛比設(shè)置為0.6~1.0之間的5個等差水平值。根據(jù)該油田單井的實(shí)際井底壓力變化范圍,將生產(chǎn)壓差設(shè)置為0.7~3.5 MPa之間的5個水平值。此外,基于該油田不同滲透率巖心相對滲透率測試結(jié)果,建立并采用了不同滲透率儲層相對應(yīng)的相對滲透率曲線。
將設(shè)計(jì)的625組數(shù)據(jù)輸入油藏數(shù)值模擬軟件Eclipse進(jìn)行模擬,提取采收率及其影響因素參數(shù),建立625組采收率及其影響因素的數(shù)據(jù)庫(見表3)。
表3 采收率及其影響因素關(guān)系的數(shù)據(jù)庫Table 3 Database indicating the relationship between oil recovery and influencing factors
采收率預(yù)測的神經(jīng)網(wǎng)絡(luò)原理見圖1,BP算法學(xué)習(xí)過程分為2步:1)輸入影響采收率因素的神經(jīng)網(wǎng)絡(luò)權(quán)值和閥值,經(jīng)過隱含層,計(jì)算輸出值(f代表采收率),實(shí)現(xiàn)正向傳遞[20-21];2)反向依次對權(quán)值和閥值進(jìn)行修正[22],2個過程反復(fù)交替,直到收斂為止。
圖1 預(yù)測采收率的三層BP神經(jīng)網(wǎng)絡(luò)典型架構(gòu)Fig.1 Typical architecture of three-layer BP neural network predictiong oil recovery
如圖1中,輸入向量為X=(x1,x2,x3,x4),其中4個因素分別代表滲透率變異系數(shù)、原油黏度、凈毛比和生產(chǎn)壓差。
隱含層各神經(jīng)元的激活值:
激活函數(shù)采用S型的sigmoid函數(shù)[23],得到的輸出層的輸出值:
式中:Sj1為隱含層的激活值;上標(biāo)l代表隱含層;下標(biāo)j代表隱含層節(jié)點(diǎn);為輸入層至隱含層連接權(quán);i代表第i個因素;xi為第i個因素的影響采出程度;為隱含層節(jié)點(diǎn)的閥值;m為隱含層節(jié)點(diǎn)總數(shù);yk為實(shí)際輸出采收率;k為輸出層節(jié)點(diǎn);f為輸出層隱函數(shù)標(biāo)記;為輸出層的激活值;上標(biāo)2代表輸出層;n為輸出層節(jié)點(diǎn)總數(shù)。
當(dāng)計(jì)算輸出的采收率與期望采收率不一致時要進(jìn)行校正,校正誤差表示為:
隱含層的校正誤差為:
網(wǎng)絡(luò)全局誤差為[24]:
當(dāng)E小于給定精度 ε時,收斂到最優(yōu)值。只有選取合適的權(quán)值和閾值,預(yù)測誤差才能夠快速達(dá)到預(yù)期,完成整個訓(xùn)練過程。
為了解決神經(jīng)網(wǎng)絡(luò)收斂速度慢和局部最小值的問題,需優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,獲取最優(yōu)是初始權(quán)值和閾值。S. Mirjalili等人[25]提出了一種基于仿生學(xué)的群智能優(yōu)化算法(又稱“蜻蜓算法(DA)”),其技術(shù)思路來源于自然界中蜻蜓群集的分離、對齊、內(nèi)聚、尋覓和躲避等5種行為[26],蜻蜓的位置和步長迭代式為:
式中:ΔXt+1為t+1代位置更新步長;a,c,e,f和s分別為對齊、內(nèi)聚、躲避、尋覓和分離等5種行為的權(quán)重系數(shù);t為當(dāng)前迭代次數(shù);w為慣性權(quán)重;Si為第i個體的分離度;Ai為第i個體的對齊度;Ci為第i個體的內(nèi)聚度;Ei為第i個體對外排斥力;Fi為第i個體對食物的吸引力;Xt+1為t+1代種群位置;Xt為當(dāng)前t代種群位置。
上述算法解決了局部最優(yōu)問題,可以得到全局最優(yōu)解。為了便于快速計(jì)算,筆者利用MATLAB工具編制了以上算法的計(jì)算程序。
將625組油藏數(shù)值模擬方案的模擬結(jié)果作為學(xué)習(xí)樣本的來源,提取500組數(shù)據(jù)用來建立采收率學(xué)習(xí)樣本庫(訓(xùn)練集),125組數(shù)據(jù)作為測試檢驗(yàn)樣本(測試集),樣本庫如表3所示。對學(xué)習(xí)組的每個影響采收率因素對應(yīng)的樣本參數(shù)進(jìn)行歸一化處理,處理后數(shù)值范圍為[0,1];將歸一化參數(shù)作為BP網(wǎng)絡(luò)的參數(shù)輸入,利用“蜻蜓”群智能優(yōu)化算法對網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化;將優(yōu)化得到的最優(yōu)權(quán)值和閾值作為BP神經(jīng)網(wǎng)絡(luò)中權(quán)值和閾值的初始值,對BP網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練;訓(xùn)練結(jié)束后,得到最佳的神經(jīng)網(wǎng)絡(luò)采收率預(yù)測模型DA-BP,然后使用測試檢驗(yàn)樣本檢驗(yàn)DA-BP的預(yù)測準(zhǔn)確率。
將網(wǎng)絡(luò)模型計(jì)算的采收率和油藏數(shù)值模擬計(jì)算的采收率進(jìn)行對比可知,二者所對應(yīng)的點(diǎn)很好地分布在直線y=x附近(見圖2),均方誤差為0.48%,相關(guān)系數(shù)為0.997 4,表明訓(xùn)練精度達(dá)到要求。
將125組測試數(shù)據(jù)的已知采收率值作為橫坐標(biāo),將DA-BP模型預(yù)測采收率作為縱坐標(biāo),得到圖3。圖3表明,經(jīng)過機(jī)器學(xué)習(xí)和優(yōu)化得到的神經(jīng)網(wǎng)絡(luò)預(yù)測的125組采收率與檢驗(yàn)數(shù)據(jù)基本在對角線位置附近,二者吻合較好。蓬萊19-3油田不同巖樣試驗(yàn)測定的水驅(qū)油效率為62.9%~84.6%,根據(jù)該油田的儲層物性和流體性質(zhì),波及系數(shù)取值范圍為65.0%~90.0%,計(jì)算得到不同小層的采收率范圍為40.8%~76.1%,平均為58.5%;本方法預(yù)測的125組采收率范圍為40.5%~76.4%,平均為57.3%;經(jīng)驗(yàn)公式預(yù)測的采收率范圍為38.0%~45.0%,可以看出經(jīng)驗(yàn)公式法預(yù)測的采收率明顯偏低。
圖2 500組訓(xùn)練集的數(shù)值模擬采收率與神經(jīng)網(wǎng)絡(luò)預(yù)測值交會圖Fig.2 Intersection of oil recovery values from numerical simulation and neural network prediction (500 groups of data from training set)
圖3 125組測試集的數(shù)值模擬采收率與神經(jīng)網(wǎng)絡(luò)預(yù)測值交會圖Fig.3 Intersection of oil recovery values from numerical simulation and neural network prediction (125 groups of data from test set)
125組測試集的預(yù)測采收率與數(shù)值模擬得到的采收率誤差如圖4所示。采收率絕對誤差(預(yù)測采收率減去測試樣本采收率)-1.70%~2.00%,均值為0.08%;相對誤差(絕對誤差與測試樣本采收率的比值)-2.91%~5.08%,均值為0.16%。
預(yù)測的采收率相對誤差區(qū)間的頻數(shù)如圖5所示,誤差分布直方圖呈近似正態(tài)分布,相對誤差集中在-1.0~1.0%,占總樣本的81.6%,表明經(jīng)過優(yōu)化神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度較高,能夠滿足水驅(qū)開發(fā)油田采收率預(yù)測精度要求。
圖4 125組測試集的BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果誤差分析Fig.4 Error analysis of prediction by BP neural network(125 groups of data from test set)
圖5 預(yù)測采收率相對誤差分布直方圖Fig.5 Relative error distribution histogram of predicted oil recovery
1)引入了反映油井開發(fā)動態(tài)的生產(chǎn)壓差,建立了基于BP網(wǎng)絡(luò)優(yōu)化算法的多層水驅(qū)開發(fā)油田采收率快速預(yù)測方法。
2)智能優(yōu)化算法實(shí)現(xiàn)了合適的權(quán)值和閾值的初始化,加速了收斂速度,提高了神經(jīng)網(wǎng)絡(luò)預(yù)測采收率的精度,并解決了局部最小值問題。
3)建立的水驅(qū)油田采收率預(yù)測方法彌補(bǔ)了采收率預(yù)測經(jīng)驗(yàn)公式法適用范圍小,水驅(qū)曲線方法直線段選取難度大,數(shù)值模擬方法參數(shù)多、計(jì)算工作量大和歷史擬合結(jié)果多解性等不足。
4)水驅(qū)開發(fā)油田采收率預(yù)測方法具有快速預(yù)測采收率的優(yōu)勢,但訓(xùn)練模型的精度受控于訓(xùn)練樣本的質(zhì)量、數(shù)量和來源,建議進(jìn)一步擴(kuò)大訓(xùn)練樣本的來源和影響因素的參數(shù)取值范圍,拓寬該方法的適用范圍。