任燕龍, 谷建偉*, 崔文富, 張以根
(1.中國石油大學(xué)(華東)石油工程學(xué)院,青島 266580;2.中國石化勝利油田分公司勘探開發(fā)研究院,東營 257015;3.中國石化勝利油田分公司勝利采油廠,東營 257015)
油田的產(chǎn)量預(yù)測(cè)是油田開發(fā)方案的重要內(nèi)容,在很大程度上決定著油田的整體開發(fā)水平與開發(fā)效果[1]?,F(xiàn)階段,中國東部油田大多進(jìn)入了生產(chǎn)開發(fā)后期,傳統(tǒng)的產(chǎn)量預(yù)測(cè)方法,如水驅(qū)曲線法、產(chǎn)量遞減法等對(duì)于油田的產(chǎn)量預(yù)測(cè)出現(xiàn)了不適應(yīng)的狀況。而產(chǎn)量預(yù)測(cè)是一個(gè)時(shí)序性的問題,對(duì)于時(shí)間序列的預(yù)測(cè)問題,長短期記憶神經(jīng)網(wǎng)絡(luò)[2](long-short term memory,LSTM)已廣泛應(yīng)用于語音識(shí)別[3]、網(wǎng)絡(luò)流量預(yù)測(cè)[4]、鉆前測(cè)井曲線預(yù)測(cè)[5]、電力預(yù)測(cè)[6-8]、有毒氣體規(guī)律預(yù)測(cè)[9]等領(lǐng)域中。因此,選用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)油田產(chǎn)量進(jìn)行預(yù)測(cè),但是由于油田產(chǎn)量具有很強(qiáng)的階段性,在油藏工程中分為產(chǎn)量上升期、產(chǎn)量穩(wěn)定期、產(chǎn)量遞減期,簡單地直接應(yīng)用LSTM神經(jīng)網(wǎng)絡(luò)會(huì)出現(xiàn)網(wǎng)絡(luò)泛化性差的問題,預(yù)測(cè)精度很低,預(yù)測(cè)產(chǎn)量甚至?xí)霈F(xiàn)負(fù)值,偏差很大。
針對(duì)LSTM神經(jīng)網(wǎng)絡(luò)泛化性差的問題,對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)的架構(gòu)進(jìn)行優(yōu)化。毛焱穎[10]提出一種基于注意力雙層LSTM的長文本情感傾向性分析方法;Peng等[11]使用雙LSTM層來調(diào)整參數(shù)以提高語句生成的準(zhǔn)確性。雙LSTM層較單LSTM層可以進(jìn)行更加深度的學(xué)習(xí),能夠捕捉長期依賴性,記錄更久的時(shí)序特征,預(yù)測(cè)更加準(zhǔn)確。因此,建立了基于雙層LSTM的深度學(xué)習(xí)網(wǎng)絡(luò),在深度學(xué)習(xí)網(wǎng)絡(luò)之中還加入了隨機(jī)失活層,消除了神經(jīng)元之間的依賴,進(jìn)一步提高了神經(jīng)網(wǎng)絡(luò)的泛化能力。除優(yōu)化網(wǎng)絡(luò)架構(gòu)外,還通過果蠅優(yōu)化算法[12](fruit fly optimization algorithm,F(xiàn)OA)在全局空間上搜尋最優(yōu)解,避免神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu)解。目前,果蠅算法已經(jīng)廣泛應(yīng)用于科學(xué)與工程領(lǐng)域[13-16],同時(shí)對(duì)于果蠅算法的優(yōu)化研究也在不斷開展,陳明揚(yáng)等[17]自適應(yīng)調(diào)整果蠅種群數(shù)量和搜索步長,同時(shí)優(yōu)化初始迭代位置;李梅紅[18]對(duì)果蠅種群進(jìn)行劃分,利用了優(yōu)勢(shì)種群與弱勢(shì)種群的協(xié)同配合;Hassan等[19]提出了離散果蠅算法。這些方法都提高了果蠅優(yōu)化算法的全局尋優(yōu)能力和局部收斂速度。
基于此,提出一種新的果蠅群體聚集思路,并結(jié)合優(yōu)勢(shì)群體和動(dòng)態(tài)搜索半徑的方法對(duì)傳統(tǒng)的果蠅優(yōu)化算法進(jìn)行改進(jìn),基于改進(jìn)的果蠅算法對(duì)所建立的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)產(chǎn)量預(yù)測(cè)模型進(jìn)行優(yōu)化,建立基于改進(jìn)果蠅算法的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)油田產(chǎn)量預(yù)測(cè)模型,以期可以較為準(zhǔn)確地預(yù)測(cè)變化波動(dòng)幅度大的油田產(chǎn)量時(shí)序序列。
建立深層學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,其核心部分是雙LSTM層,另外加入隨機(jī)失活層極大提高了神經(jīng)網(wǎng)絡(luò)泛化能力。
長短期記憶神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種特殊形式,而循環(huán)神經(jīng)網(wǎng)絡(luò)模型[20](recurrent neural networks,RNN)是在普通多層前饋網(wǎng)絡(luò)(back propagation neuron network,BPNN)的基礎(chǔ)上,增加了隱藏層各單元間的橫向聯(lián)系,通過一個(gè)權(quán)重矩陣,可以將上一個(gè)時(shí)間序列的神經(jīng)單元的值傳遞至當(dāng)前的神經(jīng)單元,從而使神經(jīng)網(wǎng)絡(luò)具備了記憶功能,如圖1所示。
x為輸入;h為隱含層;o為網(wǎng)絡(luò)預(yù)測(cè)輸出;y為真實(shí)輸出;L為預(yù)測(cè)輸出與真實(shí)輸出之間的損失;W為隱含層的權(quán)重矩陣,記憶時(shí)間序列的變化規(guī)律圖1 RNN結(jié)構(gòu)圖Fig.1 RNN structure diagram
但是RNN神經(jīng)網(wǎng)絡(luò)存在梯度彌散和梯度指數(shù)上升的問題,這是因?yàn)槠溆?xùn)練算法使用的是反向傳播算法(back propagation trough time,BPTT),當(dāng)時(shí)間比較長時(shí),回傳的殘差將指數(shù)下降,導(dǎo)致網(wǎng)絡(luò)權(quán)重更新緩慢,無法體現(xiàn)出長期記憶的效果,需要一個(gè)存儲(chǔ)單元來存儲(chǔ)記憶,因此LSTM模型被提出。LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)模型的一種變體,LSTM之所以可以進(jìn)行長期記憶,主要是由于其獨(dú)特的細(xì)胞結(jié)構(gòu)。傳統(tǒng)的RNN中都具有一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)降男问?。在?biāo)準(zhǔn)的RNN中,這個(gè)重復(fù)的模塊只有一個(gè)非常簡單的結(jié)構(gòu),例如一個(gè)tanh層,而LSTM的細(xì)胞結(jié)構(gòu)比較獨(dú)特,如圖2所示。
圖2 LSTM細(xì)胞結(jié)構(gòu)示意圖Fig.2 LSTM cell structure diagram
如圖2所示,A代表某一時(shí)刻的細(xì)胞單元,Xt-1、Xt、Xt+1分別為上一時(shí)刻、當(dāng)前時(shí)刻、下一時(shí)刻細(xì)胞單元的輸入特征向量;ht-1、ht、ht+1分別為上一時(shí)刻、當(dāng)前時(shí)刻、下一時(shí)刻細(xì)胞單元的輸出信息;σ為激活函數(shù),決定著信息保留,一般是sigmod函數(shù);tanh層創(chuàng)建并更新候選信息,從而實(shí)現(xiàn)對(duì)變量隨時(shí)間變化規(guī)律的長期記憶;ft為遺忘門輸出信息;it為輸入門輸出信息;ot為輸出門輸出信息;為候選細(xì)胞狀態(tài);Ct-1為上一時(shí)刻的細(xì)胞狀態(tài);Ct為當(dāng)前時(shí)刻的細(xì)胞狀態(tài)。
LSTM的細(xì)胞結(jié)構(gòu)包括一個(gè)記憶鏈(紅線)、遺忘門(黃線)、輸入門(藍(lán)線)、輸出門(橙線)。通過記憶鏈Ct記錄和更新當(dāng)前的細(xì)胞狀態(tài),并向下一個(gè)時(shí)間步傳遞。通過三個(gè)門來保護(hù)和控制細(xì)胞狀態(tài),對(duì)信息進(jìn)行篩選和更新。
遺忘門:作用于細(xì)胞狀態(tài),選擇性遺忘記憶細(xì)胞中的信息。
ft=σ[Wf(ht-1,xt)+bf]
(1)
輸入門:作用于細(xì)胞狀態(tài),將新的信息選擇性的記錄到新的細(xì)胞狀態(tài)中。
it=σ[Wi(ht-1,xt)+bi]
(2)
(3)
(4)
輸出門:作用于輸入和隱含層輸出,使得最后輸出既包括細(xì)胞狀態(tài)又包括輸入,將其結(jié)果更新到下一個(gè)隱層。
ot=σ[Wo(ht-1,xt)+bo]
(5)
ht=ottanhCt
(6)
式中:xt為當(dāng)前時(shí)刻的輸入信息;Wf為遺忘門的連接權(quán)重;bf為遺忘門的偏置系數(shù);Wi為輸入門的連接權(quán)重;bi為輸入門的偏置系數(shù);Wc為記憶單元的連接權(quán)重;bc為記憶單元的偏置系數(shù);Wo為輸出門的連接權(quán)重;bo為輸出門的偏置系數(shù)。
圖2可看作LSTM層內(nèi)部上一時(shí)刻與當(dāng)前時(shí)刻的單節(jié)點(diǎn)信息傳遞。圖3表示多節(jié)點(diǎn)的信息傳遞。輸入層的節(jié)點(diǎn)數(shù)由輸入數(shù)據(jù)的特征個(gè)數(shù)決定;隱含層節(jié)點(diǎn)數(shù)通常根據(jù)需要或者經(jīng)驗(yàn)公式給出,一般基于訓(xùn)練與預(yù)測(cè)結(jié)果進(jìn)行調(diào)整;由于是多層神經(jīng)網(wǎng)絡(luò)相連,輸出層的個(gè)數(shù)由下一層的節(jié)點(diǎn)數(shù)確定,通常由所預(yù)測(cè)的指標(biāo)個(gè)數(shù)確定。在隱含層中,上一時(shí)刻所有節(jié)點(diǎn)的輸出均輸入到下一時(shí)刻的所有節(jié)點(diǎn)。
圖3 LSTM信息傳遞圖Fig.3 LSTM information transfer diagram
具有大量參數(shù)的深層學(xué)習(xí)網(wǎng)絡(luò)通常會(huì)出現(xiàn)過擬合問題,導(dǎo)致神經(jīng)網(wǎng)絡(luò)的泛化能力很低。Srivastava等[21]提出了隨機(jī)失活的方法:在訓(xùn)練過程中,隨機(jī)丟棄(按照伯努利概率使得部分節(jié)點(diǎn)在訓(xùn)練過程中不進(jìn)行更新)深度學(xué)習(xí)網(wǎng)絡(luò)中的部分節(jié)點(diǎn),使得網(wǎng)絡(luò)結(jié)構(gòu)簡單化,但是在測(cè)試過程中依然用全部的神經(jīng)節(jié)點(diǎn)進(jìn)行測(cè)試。由于是隨機(jī)丟棄,這就相當(dāng)于在每一個(gè)最小步長中訓(xùn)練的都是不同的神經(jīng)網(wǎng)絡(luò),假設(shè)某一層有n個(gè)節(jié)點(diǎn),那么就有2n種組合(子網(wǎng)絡(luò))。所以最后訓(xùn)練所得的神經(jīng)網(wǎng)絡(luò)具有一種網(wǎng)絡(luò)種群平均化,即集成學(xué)習(xí)的概念,可以提高網(wǎng)絡(luò)的泛化能力。全連接層的每一個(gè)節(jié)點(diǎn)與上一層所有節(jié)點(diǎn)均相互連接,可以將上一層所提取的特征綜合起來。
標(biāo)準(zhǔn)果蠅優(yōu)化算法(fruit fly optimization algorithm,FOA)采用基于種群的全局隨機(jī)尋優(yōu)優(yōu)化算法,通過跟蹤當(dāng)前最優(yōu)解的信息來指導(dǎo)種群的下一步搜索,使得種群能夠以當(dāng)前最優(yōu)解為中心開展局部隨機(jī)搜索,并朝著更優(yōu)的方向搜索前進(jìn)。首先,給出果蠅種群的中心位置,眾多果蠅個(gè)體從中心出發(fā),賦予其隨機(jī)的飛行方向與距離,使其隨機(jī)分布在空間上,然后找出當(dāng)前種群中距離食物最近的個(gè)體,此時(shí),其他果蠅通過視覺效果向最優(yōu)個(gè)體靠近,重復(fù)上面的步驟,使得果蠅種群逐步向食物靠近。
建立了改進(jìn)果蠅優(yōu)化算法(improved fruit fly optimization algorithm,IFOA),主要從三方面對(duì)果蠅算法進(jìn)行改進(jìn)。首先,在果蠅進(jìn)行位置更新時(shí)挑選出上一代個(gè)體總數(shù)k%的優(yōu)勢(shì)個(gè)體作為下一代種群的產(chǎn)生基礎(chǔ),保留優(yōu)勢(shì)個(gè)體的位置,即權(quán)重矩陣和閾值矩陣,剩下的(100-k)%的個(gè)體向優(yōu)勢(shì)個(gè)體位置的附近聚集。因?yàn)楫?dāng)前的最優(yōu)個(gè)體附近并不一定在全局最優(yōu)的附近,如果只向最優(yōu)個(gè)體附近聚集,極易陷入局部最優(yōu)解,因此向優(yōu)勢(shì)群體聚集可以減小陷入局部最優(yōu)的概率;考慮到優(yōu)勢(shì)個(gè)體附近劣勢(shì)個(gè)體的聚集比例問題,提出了兩種聚集方法:等比例聚集,即每一個(gè)優(yōu)勢(shì)個(gè)體附近都聚集比原來多(100-k)/k倍的個(gè)體數(shù);按味道濃度的大小比例聚集,先將優(yōu)勢(shì)群體的味道濃度求和,計(jì)算出每一個(gè)優(yōu)勢(shì)個(gè)體味道濃度占優(yōu)勢(shì)群體味道濃度和的比重,劣勢(shì)群體按照此比重進(jìn)行分配聚集;最后,在種群局部尋優(yōu)時(shí),采用動(dòng)態(tài)改變果蠅算法搜索半徑的方法對(duì)果蠅算法進(jìn)行改進(jìn),使得搜索半徑逐代減小,因?yàn)樵诘跗冢介L過長有利于全局尋優(yōu),不易陷入局部最優(yōu)解,但是在迭代后期,迭代步長過長會(huì)使得局部尋優(yōu)能力下降,有可能跳出最優(yōu)解,因此需要?jiǎng)討B(tài)變化搜索半徑。
考慮到優(yōu)化深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的要求,主要是通過改進(jìn)的果蠅優(yōu)化算法對(duì)神經(jīng)網(wǎng)絡(luò)層的權(quán)值和閾值矩陣進(jìn)行優(yōu)化,尋找最優(yōu)的神經(jīng)網(wǎng)絡(luò)層的初始值,因?yàn)樯窠?jīng)網(wǎng)絡(luò)的初始位置對(duì)訓(xùn)練結(jié)果有很大的影響。對(duì)尋優(yōu)過程做了如下的特殊化處理。
Step 1初始化種群。
設(shè)置種群的最大規(guī)模p,最大迭代步數(shù)g,種群個(gè)體的位置即為各神經(jīng)網(wǎng)絡(luò)層的權(quán)值與閾值矩陣,考慮到神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的訓(xùn)練結(jié)果受權(quán)值與閾值矩陣的影響很大,因此將位置范圍R設(shè)置在-1~1,初始位置由式(7)、式(8)確定:
R(i)_L(j)·W(m,n)=rand(-1,1)
(7)
R(i)_L(j)·B(k,l)=rand(-1,1)
(8)
式中:R(i)為第i個(gè)個(gè)體的位置,i=1,2,…,p;L(j)為第j層神經(jīng)網(wǎng)絡(luò),j=2,3,4,6;W(m,n)為該層權(quán)重矩陣的第m行、第n列的數(shù)據(jù);B(k,l)為該層權(quán)重矩陣的第k行、第l列的數(shù)據(jù)。
記R(i)_L(j)W(m,n)為RLW,記R(i)_L(j)B(k,l)為RLB。
Step 2嗅覺搜索過程。
每一個(gè)個(gè)體都會(huì)朝著不同的方向飛行不同的距離,設(shè)置最大的搜索半徑Rmax為0.001,使其隨著迭代步數(shù)的增加逐漸減小,則R由式(9)確定,果蠅個(gè)體的位置更新由式(10)、式(11)確定:
(9)
(10)
(11)
式中:I為當(dāng)前迭代步數(shù);RI為第I次迭代的搜索半徑。
Step 3計(jì)算味道濃度。
將深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練所得的均方誤差作為味道濃度判定函數(shù):
(12)
Step 4優(yōu)選個(gè)體
通過式(12)計(jì)算出的種群個(gè)體的味道濃度,選出前k%優(yōu)勢(shì)個(gè)體,假設(shè)有T個(gè)優(yōu)勢(shì)個(gè)體,按味道濃度的大小比例P聚集:
(13)
則第I代第h個(gè)優(yōu)勢(shì)個(gè)體附近聚集的劣勢(shì)個(gè)體數(shù)目G由式(14)確定。
G(I,h)=P(I,h)p(1-k)%
(14)
Step 5迭代求解。
重復(fù)Step2~Step4,優(yōu)選個(gè)體、更新種群,直到迭代步數(shù)達(dá)到g,最后以最優(yōu)個(gè)體的位置作為深度學(xué)習(xí)網(wǎng)絡(luò)的網(wǎng)絡(luò)層權(quán)重和閾值矩陣。
實(shí)例油田選自勝利油區(qū)的勝坨油田,該油田從1966年投入開發(fā),截至目前開發(fā)周期已達(dá)53年。由于該油田開發(fā)過程中層系、井網(wǎng)相對(duì)穩(wěn)定,中間數(shù)據(jù)記錄比較完整,因此選為研究對(duì)象??偣蹭浫×嗽撚吞?974年1月—2018年12月,共540月的月度生產(chǎn)數(shù)據(jù)。該油田的產(chǎn)量變化有明顯的階段性特征,油田剛開始投入生產(chǎn)時(shí),產(chǎn)量很高,并且變化幅度劇烈,處于不穩(wěn)定期,而后經(jīng)過開發(fā)調(diào)整進(jìn)行穩(wěn)產(chǎn)期,產(chǎn)量略有下降,一段時(shí)間之后產(chǎn)量又開始降低,開始進(jìn)入下一個(gè)穩(wěn)產(chǎn)期。穩(wěn)產(chǎn)—遞減兩個(gè)階段交替進(jìn)行,總體來看產(chǎn)量的波動(dòng)變化很大,如圖4所示。
圖4 油田產(chǎn)量變化Fig.4 Oilfield production change
由油藏工程方法選出11個(gè)與產(chǎn)油量相關(guān)的屬性,其中,油水井?dāng)?shù)比可以反映油田的布井方式,部分?jǐn)?shù)據(jù)如表1所示。
表1 部分原始數(shù)據(jù)(2018年)Table 1 Partial raw data(2018)
由于原始數(shù)據(jù)的單位不同,存在著數(shù)量級(jí)差異,數(shù)量級(jí)差異會(huì)導(dǎo)致量級(jí)較大的屬性占據(jù)主導(dǎo)地位,使產(chǎn)油量僅依賴于某一屬性;還會(huì)導(dǎo)致訓(xùn)練的收斂速度減慢,因此需要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理。油田數(shù)據(jù)是不斷變化的,且與開發(fā)階段和調(diào)整方式有很大關(guān)系,某一屬性最大值與最小值未知,因此選用z-score標(biāo)準(zhǔn)化 (zero-mean normalization),對(duì)于每一個(gè)屬性,x(j),j=1,2,…,12,根據(jù)式(15)、式(16)計(jì)算出該屬性下的均值μ和標(biāo)準(zhǔn)差σ′。
(15)
(16)
然后根據(jù)式(17)、式(18)計(jì)算標(biāo)準(zhǔn)化后的屬性值:
(17)
(18)
實(shí)例驗(yàn)證選擇平均相對(duì)誤差(mean relative error,MRE)和歸一化均方根誤差(normalized root mean square error,nRMSE)作為評(píng)價(jià)標(biāo)準(zhǔn),具體計(jì)算公式如式(19)、式(20)所示:
(19)
(20)
式中:y′為神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值;y為實(shí)際數(shù)據(jù)值;ymax為測(cè)試數(shù)據(jù)的最大值;ymin為測(cè)試數(shù)據(jù)的最小值。
現(xiàn)通過單層LSTM、雙層LSTM、三層LSTM、四層LSTM的四種不同的網(wǎng)絡(luò)層架構(gòu)對(duì)油田現(xiàn)場數(shù)據(jù)進(jìn)行訓(xùn)練測(cè)試,將數(shù)據(jù)集的前486月的歸一化生產(chǎn)數(shù)據(jù)作為訓(xùn)練集,后54個(gè)月作為測(cè)試集進(jìn)行驗(yàn)證。將每一種神經(jīng)網(wǎng)絡(luò)架構(gòu)訓(xùn)練并驗(yàn)證100次,取100次的平均值,預(yù)測(cè)情況對(duì)比如圖5所示。
圖5 多層LSTM模型產(chǎn)油量預(yù)測(cè)對(duì)比Fig.5 Multi-layer LSTM model oil production forecast comparison
如圖5所示,實(shí)際產(chǎn)油量處于一個(gè)波動(dòng)變化但是相對(duì)平穩(wěn)的狀態(tài),單層LSTM的預(yù)測(cè)產(chǎn)油量偏低,預(yù)測(cè)誤差較大,這是由于單層LSTM不能較好地記憶長期的變化規(guī)律;三層LSTM和四層LSTM的預(yù)測(cè)產(chǎn)油量偏高,誤差比較大,所預(yù)測(cè)的產(chǎn)油量沒有隨油田生產(chǎn)參數(shù)的變化波動(dòng)情況,這是由于LSTM層數(shù)增多,導(dǎo)致神經(jīng)網(wǎng)絡(luò)模型過擬合,泛化性能力較差。相比較而言,雙層LSTM的預(yù)測(cè)產(chǎn)油量比較接近實(shí)際。
四種神經(jīng)網(wǎng)絡(luò)架構(gòu)的預(yù)測(cè)誤差如表2所示。由表2可以看出,雙層LSTM架構(gòu)的MRE和nRMSE最小,預(yù)測(cè)精度最高,因此在雙層LSTM的基礎(chǔ)上進(jìn)行優(yōu)化。
表2 預(yù)測(cè)誤差對(duì)比表Table 2 Comparison error forecast table
采用雙層LSTM、深層學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)(deep learning network,DLN)、經(jīng)過改進(jìn)果蠅算法優(yōu)化的雙層LSTM、DLN四種模型分別進(jìn)行訓(xùn)練和預(yù)測(cè),對(duì)比情況如圖6所示。
黑色實(shí)線為實(shí)際產(chǎn)油量;虛線為未優(yōu)化的神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)產(chǎn)油量;另外兩條實(shí)線為優(yōu)化后的神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)產(chǎn)油量圖6 優(yōu)化效果圖Fig.6 Optimized comparison chart
由圖6可知,雙層LSTM的預(yù)測(cè)產(chǎn)油量偏高,DLN的預(yù)測(cè)產(chǎn)油量偏低,DLN比雙層LSTM神經(jīng)網(wǎng)絡(luò)的雙層LSTM更加接近實(shí)際曲線,誤差更小,經(jīng)過改進(jìn)的果蠅算法優(yōu)化之后的兩種神經(jīng)網(wǎng)絡(luò)架構(gòu)中依然是DLN架構(gòu)的誤差更小,即IFOA-DLN預(yù)測(cè)精度更高,可以很好地?cái)M合實(shí)際產(chǎn)油量曲線。另外,DLN與IFOA-雙層LSTM相比較而言,DLN是優(yōu)化了神經(jīng)網(wǎng)絡(luò)架構(gòu),IFOA-雙層LSTM是通過改進(jìn)的果蠅算法進(jìn)行尋優(yōu),結(jié)果表明IFOA-雙層LSTM的預(yù)測(cè)效果更好,說明通過改進(jìn)的果蠅算法尋優(yōu)比優(yōu)化架構(gòu)更能提高預(yù)測(cè)精度。
四種神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)誤差,如表3所示。
表3 預(yù)測(cè)誤差對(duì)比Table 3 Comparison error forecast
種群的最優(yōu)值和平均值隨迭代步數(shù)的變化情況,如圖7所示。
圖7 誤差迭代變化Fig.7 Error iteration change
由圖7可以看出,隨著迭代步數(shù)的增加,種群的平均的MRE與nRMSE和最優(yōu)的MRE與nRMSE都在逐漸降低,說明通過改進(jìn)的果蠅優(yōu)化算法尋找最優(yōu)的深度學(xué)習(xí)網(wǎng)絡(luò)的網(wǎng)絡(luò)權(quán)值和閾值是切實(shí)可行的,較大提高了神經(jīng)網(wǎng)絡(luò)的泛化能力,提高了預(yù)測(cè)精度。
(1)經(jīng)過長期開發(fā)的油田,其生產(chǎn)數(shù)據(jù)波動(dòng)性較為劇烈,直接應(yīng)用單層LSTM神經(jīng)網(wǎng)絡(luò)模型具有泛化性很差的問題。首先對(duì)多層LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)選,結(jié)果表明雙層LSTM的預(yù)測(cè)精度較高,且可以反映產(chǎn)油量隨其他生產(chǎn)指標(biāo)變化的波動(dòng)性,說明泛化性較好,所以選擇雙層神經(jīng)網(wǎng)絡(luò)作為研究基礎(chǔ)。
(2)通過添加全連接層以及隨機(jī)失活層進(jìn)一步增加了神經(jīng)網(wǎng)絡(luò)的泛化能力。最后,利用果蠅優(yōu)化算法,通過優(yōu)勢(shì)群體的多目標(biāo)尋優(yōu)、按味道濃度比例聚集的方式以及搜索半徑的動(dòng)態(tài)變化對(duì)果蠅優(yōu)化算法進(jìn)行改進(jìn)。
(3)基于改進(jìn)的果蠅優(yōu)化算法,尋找最優(yōu)的DLN網(wǎng)絡(luò)參數(shù),建立了IFOA-DLN油田產(chǎn)量預(yù)測(cè)模型,預(yù)測(cè)精度進(jìn)一步提高。結(jié)果表明,IFOA-DLN神經(jīng)網(wǎng)絡(luò)模型泛化能力強(qiáng),可以克服油田生產(chǎn)數(shù)據(jù)隨時(shí)間變化幅度大的問題,對(duì)于時(shí)序序列數(shù)據(jù)具有較高的適應(yīng)性,預(yù)測(cè)精度可以滿足礦場需要,對(duì)于油田的生產(chǎn)開發(fā)調(diào)整具有一定的意義。