高麗潔,檀朝東*,程心平,鄭春峰,李欣倫,劉萍
?
基于混沌時(shí)序方法的油田產(chǎn)量預(yù)測研究
高麗潔1,檀朝東1*,程心平2,鄭春峰2,李欣倫1,劉萍3
(1.中國石油大學(xué)(北京),北京昌平,102249; 2.中海油能源發(fā)展股份有限公司工程技術(shù)分公司,天津塘沽,300450;3.北京雅丹石油技術(shù)開發(fā)有限公司,北京昌平,102200;)
油田產(chǎn)量的預(yù)測一直是石油工業(yè)的重要研究課題。由于油田產(chǎn)量影響因素多且復(fù)雜,本文采用混沌時(shí)序預(yù)測方法進(jìn)行研究。構(gòu)造油田產(chǎn)量預(yù)測的混沌時(shí)序分析模型,用C-C方法確定相空間重構(gòu)參數(shù)嵌入維度與延遲時(shí)間;使用小數(shù)據(jù)量法計(jì)算最大Lyapunov指數(shù)用于判別產(chǎn)量時(shí)間序列的混沌性;利用加權(quán)一階局域預(yù)測法對油田產(chǎn)量進(jìn)行預(yù)測。最后利用渤中油田某平臺(tái)某井?dāng)?shù)據(jù)進(jìn)行產(chǎn)量預(yù)測并驗(yàn)證模型的準(zhǔn)確性。
混沌時(shí)序;相空間重構(gòu);C-C方法;產(chǎn)量預(yù)測.
油田產(chǎn)量的預(yù)測在油田動(dòng)態(tài)分析中一直占有重要的地位,對油田產(chǎn)量預(yù)測的研究也從未停止。但是油田的產(chǎn)量變化是一個(gè)比較復(fù)雜的問題。雖然從總體上講,油田產(chǎn)量都要經(jīng)歷從上升到平穩(wěn)再到下降的過程,但是由于油田的自然地質(zhì)條件不同,開發(fā)方式不同,采取的措施不同,多數(shù)油田產(chǎn)量呈現(xiàn)非常復(fù)雜的變化。同時(shí),一個(gè)油田的產(chǎn)量是由各單井的產(chǎn)量疊加而成,而油井也處在投產(chǎn)、作業(yè)和停產(chǎn)的不斷更替之中,各種驅(qū)替液的注入,油水井各種增產(chǎn)增注措施無不改變地下滲流狀況及整個(gè)油田的產(chǎn)量。所以說油田是一個(gè)高度復(fù)雜的開放的系統(tǒng),高度非線性的,既有主導(dǎo)地下復(fù)雜介質(zhì)下滲流的各種線性或非線性確定性方程,又有人為的各種隨機(jī)因素的作用。國內(nèi)外常規(guī)的產(chǎn)量預(yù)測方法主要有神經(jīng)網(wǎng)絡(luò)、遞減曲線法、翁氏旋回法、組合預(yù)測等[7]。但是常規(guī)方法已經(jīng)不再適用于具有高度非線性的復(fù)雜油田了,所以需要在常規(guī)的方法之外,尋找一種新的油田復(fù)雜系統(tǒng)中產(chǎn)量的預(yù)測方法,即基于混沌時(shí)間序列預(yù)測方法。文獻(xiàn)[1]以勝利油區(qū)孤島油田某區(qū)塊產(chǎn)油量為實(shí)際數(shù)據(jù)進(jìn)行分析,提出以部分復(fù)雜油田產(chǎn)量序列為混沌時(shí)序的方法。但具體問題還需具體分析,所以本文仍需對油田時(shí)間序列進(jìn)行判別然后再預(yù)測。
混沌是廣泛存在著的一種非周期性運(yùn)動(dòng)的形式,具有內(nèi)在隨機(jī)性的表現(xiàn)。時(shí)間序列分析就是根據(jù)事物發(fā)展的過去、現(xiàn)在的序列數(shù)據(jù),挖掘系統(tǒng)的內(nèi)在特性和規(guī)律,并建立盡可能準(zhǔn)確的數(shù)學(xué)模型?;煦鐣r(shí)序分析則為解決具有與隨機(jī)噪聲相似的混亂無序特征的時(shí)間序列的有力工具。
混沌時(shí)序分析包括對各種時(shí)間序列進(jìn)行混沌判別及預(yù)測控制?;煦缦到y(tǒng)會(huì)表現(xiàn)出“貌似無規(guī)則的、類似隨機(jī)”的現(xiàn)象,但未必所有系統(tǒng)都適用于混沌時(shí)序分析方法進(jìn)行研究,如果不加以判斷,盲目套用混沌方法,將得到不準(zhǔn)確甚至錯(cuò)誤的結(jié)論,結(jié)果也無法令人信服?;煦绗F(xiàn)象的出現(xiàn)是有條件的,所以任何非線性系統(tǒng)進(jìn)行混沌時(shí)序分析前需進(jìn)行判別。混沌時(shí)間序列分析的基礎(chǔ)是相空間重構(gòu)理論,因?yàn)榛煦缦到y(tǒng)性質(zhì)參數(shù)的計(jì)算、判別及預(yù)測模型的建立等都必須在相空間進(jìn)行[1]。相空間重構(gòu)的質(zhì)量直接影響到后續(xù)分析的效果?;煦鐣r(shí)序分析首先用C-C算法計(jì)算該樣本的延遲時(shí)間和嵌入維數(shù),以延遲時(shí)間和嵌入維數(shù)參數(shù)組合進(jìn)行相空間重構(gòu),運(yùn)用小數(shù)據(jù)量法計(jì)算出序列的最大Lyapunov指數(shù),Lyapunov指數(shù)值大于0說明該系統(tǒng)存在混沌特性,然后運(yùn)用加權(quán)一階局域預(yù)測法進(jìn)行混沌時(shí)序預(yù)測。
1.1 相空間重構(gòu)
相空間重構(gòu)的目的:在高維相空間中恢復(fù)出體現(xiàn)混沌系統(tǒng)規(guī)律性的混沌吸引子,從而獲取更多的隱藏信息。相是指某一系統(tǒng)在一個(gè)特定時(shí)間的狀態(tài),以該系統(tǒng)的可能狀態(tài)所組成的集合被稱作相空間。引起非線性混沌的過程基本上是多變量的,通常時(shí)間序列并不能記錄某個(gè)系統(tǒng)的所有方面,而僅僅是其中的一部分,一般只能得到一維的標(biāo)量時(shí)序,因此需要重構(gòu)系統(tǒng)的相空間。通過相空間的重構(gòu),在無須已知原油生產(chǎn)動(dòng)態(tài)系統(tǒng)數(shù)學(xué)模型的情況下,可以獲得系統(tǒng)的多變量狀態(tài)表示,使非線性動(dòng)力學(xué)分析方法能用于實(shí)驗(yàn)數(shù)據(jù)的分析和處理,普遍采用坐標(biāo)延遲重構(gòu)法[2]。
在原油生產(chǎn)動(dòng)態(tài)系統(tǒng)中,設(shè)最主要的觀測量——產(chǎn)油量時(shí)間序列為{xn},n=1,2,…,N,N為序列總長度。以延遲時(shí)間τ和嵌入維數(shù)m進(jìn)行相空間重構(gòu)得:
相空間中的相點(diǎn)可以表示為:
X(n)=[x(n),x(n+t),…x(n+(m-1)t)];n=1,2,…,M
M=N-(m-1)t
如果參數(shù)延遲時(shí)間和嵌入維數(shù)選擇恰當(dāng),則X(n)可描述原系統(tǒng)。由x(n)構(gòu)造X(n)稱為相空間重構(gòu)。在具體實(shí)施相空間重構(gòu)過程中,如何正確確定延遲時(shí)間和嵌入維數(shù)是相空間重構(gòu)成功的關(guān)鍵。本文利用文獻(xiàn)[5]提出的C-C算法同時(shí)確定延遲時(shí)間和嵌入維數(shù)。
1.1.1 延遲時(shí)間與嵌入維度的確定
1999年,Kim、Eykholt和Salas提出C-C算法[3],利用關(guān)聯(lián)積分同時(shí)計(jì)算出最優(yōu)延遲時(shí)間t和嵌入窗寬w,并利用公式tw=(m-1)*t計(jì)算出嵌入維數(shù)。
將原始產(chǎn)油量時(shí)間序列{xn},n=1,2,…,N分成t 個(gè)不相交的時(shí)間子序列,長度l=[N/t]([?]表示取整):
{ x(1),x(t+1),x(2t+1),…}
{ x(2),x(t+2),x(2t+2),…}
?
{ x(t),x(t+t),x(2t+t),… }
分別計(jì)算每個(gè)子序列的統(tǒng)計(jì)量S(m,N,r,t):
S(m,N,r,)=
式中Cl是第l個(gè)子序列的關(guān)聯(lián)積分,表征相空間中任意兩點(diǎn)間距離小于鄰域半徑的概率,定義如下:
C(m,N,r,)=
r為鄰域半徑,M=N-(m-1)t為相空間中相點(diǎn)數(shù)目,N 是時(shí)間序列總長度),q(?)為 Heaviside 單位函數(shù)(定義為,q(x)=0,if x< 0;q(x)=1,if x≥0)。
當(dāng)N→∞時(shí),記:
S(m, r,)=
根據(jù)BDS統(tǒng)計(jì)結(jié)論,如果時(shí)間序列是獨(dú)立同分布,則N→∞時(shí)S(m,r,t)恒為0。S(m,r,t)~t反映了時(shí)間序列的自相關(guān)特性,當(dāng)其第一次過零點(diǎn),或?qū)λ邪霃?r 相互差別最小時(shí),表示重構(gòu)相空間中的點(diǎn)幾乎是均勻分布,重構(gòu)吸引子軌道在相空間完全展開。
定義:
?S(m,t)度量S(m,r,t)~t的第一個(gè)零點(diǎn)或?S(m,t)~t的第一個(gè)極小點(diǎn)。
應(yīng)用BDS統(tǒng)計(jì)可得到N,m,r的合理估計(jì),取N=3000,m=2,3,4,5,r=k?σ/2,k=1,2,3,4,σ是時(shí)間序列的均方差。得到方程如下:
現(xiàn)有的C-C算法認(rèn)為S ?(t)的第一個(gè)零點(diǎn)或?S ?(t)的第一個(gè)極小點(diǎn)就是最優(yōu)延遲時(shí)間t,Scor(t)的全局最小點(diǎn)就是嵌入窗寬tw[5]。由tw=(m-1)*t即可得到嵌入維數(shù)m的值。
根據(jù)上述理論建立模型,在MATLAB上編寫程序,以要分析的油田實(shí)際產(chǎn)量數(shù)據(jù)為對象,求取延遲時(shí)間和嵌入寬度。
圖1 C-C算法重構(gòu)油田產(chǎn)量系統(tǒng)x分量
1.2 混沌系統(tǒng)判別
混沌運(yùn)動(dòng)具有初值敏感性,從兩個(gè)相鄰初始點(diǎn)出發(fā)的鄰近軌道之間的距離將隨時(shí)間呈指數(shù)式分離,這種相空間中相體積收縮和膨脹的幾何特性可用Lyapunov指數(shù)定量地描述。1983年,格里波基證明只要最大Lyapunov指數(shù)大于0,系統(tǒng)就具有混沌性[6]。這成為了混沌判別的主要量化方法之一。本文運(yùn)用文獻(xiàn)[4]中的適合小樣本集的小數(shù)據(jù)量法計(jì)算最大Lyapunov指數(shù)。
方法原理如下:
在重構(gòu)相空間后,尋找產(chǎn)量時(shí)間序列中每個(gè)相點(diǎn)的最近鄰近點(diǎn),例如相點(diǎn)Xj的最近鄰點(diǎn)為X(h(j)),記最小距離為:
則最大Lyapunov指數(shù)λL可以通過每個(gè)相點(diǎn)與其最近鄰近點(diǎn)在軌道上的平均發(fā)散速率估計(jì)出來,即:
其中?t是所用時(shí)間序列的樣本周期。
根據(jù)Lyapunov指數(shù)的定義:
兩邊取對數(shù)有:
若該時(shí)間序列的最大Laypunov指數(shù)λL>0,則表明該時(shí)間序列演化軌跡是發(fā)散的,序列具有混沌特征,因而不能夠進(jìn)行長期預(yù)報(bào),但可以預(yù)知它的最大預(yù)報(bào)時(shí)間尺度Tf,它與最大Laypunov指數(shù)有如下的關(guān)系,即
Tf=1/λL
這里Tf與?t的單位相同。
根據(jù)上述原理在MATLAB中編程實(shí)現(xiàn)小數(shù)據(jù)量法求取最大Lyapunov指數(shù)。以要分析的油田實(shí)際產(chǎn)量數(shù)據(jù)為對象。延遲時(shí)間取8,嵌入維度取7,結(jié)果如圖2所示:
通過最小二乘法對線性較好的一段進(jìn)行擬合,并求斜率,得到最大Lyapunov指數(shù)為:0.0062,這一結(jié)果證明了該實(shí)際油田產(chǎn)量時(shí)間序列確實(shí)具有混沌性質(zhì)。并可進(jìn)行161天的產(chǎn)量預(yù)測。
圖2 小數(shù)據(jù)量法求最大Lyapunov指數(shù)
1.3 混沌時(shí)間序列預(yù)測
混沌時(shí)間序列由于內(nèi)在的非線性動(dòng)力學(xué)特性,不可長期預(yù)測,但確定性結(jié)構(gòu)又使系統(tǒng)演化軌跡短期內(nèi)發(fā)散較小,滿足短期可預(yù)測性。混沌時(shí)序預(yù)測就是在重構(gòu)后的相空間中找到某種模型去最大程度地逼近系統(tǒng)的動(dòng)力學(xué)特性,并用這個(gè)模型實(shí)現(xiàn)系統(tǒng)未來趨勢的預(yù)測。本文運(yùn)用加權(quán)一階局域預(yù)測法預(yù)測油田產(chǎn)量[2]。
一般的局域預(yù)測算法中,在找到中心點(diǎn)鄰域后,便將鄰域中的幾個(gè)點(diǎn)進(jìn)行擬合,并不考慮鄰域中各點(diǎn)與中心點(diǎn)的空間距離對其的影響。但是,相空間中各點(diǎn)與中心點(diǎn)的空間距離是一個(gè)非常重要的參數(shù),預(yù)測的準(zhǔn)確性往往取決于與中心點(diǎn)的空間距離最近的那幾個(gè)點(diǎn),因此,將中心點(diǎn)的空間距離作為一個(gè)擬合參數(shù)引入預(yù)測過程,在一定程度上可以提高精度,并有一定的消噪能力。其基本原理如下:
式中:a為參數(shù),一般取a=1。
加權(quán)一階局域預(yù)測法是用一階線性擬合的方式來逼近相點(diǎn)的演化趨勢:
將每個(gè)相點(diǎn)分解為各維分量,則有:
使用加權(quán)最小二乘法來求取最佳的a和b兩個(gè)參數(shù)值,則問題轉(zhuǎn)化為:
可以初步分為專業(yè)崗位(通訊、云計(jì)算、軟件、財(cái)務(wù)等)、管理崗位(營銷、行政、客服等)、公務(wù)崗位(教師、公務(wù)員、軍官等)、私有崗位(創(chuàng)業(yè)者、自由職業(yè)等)四級,按照不同的崗位層級進(jìn)行分類培養(yǎng)。
將上式看成是關(guān)于a和b的一元函數(shù),為了求最小值,分別求對a和對b的偏導(dǎo)數(shù):
可求得a和b,從而得到相點(diǎn)演化的預(yù)測公式,得到下一步演化相點(diǎn)的預(yù)測,提取最后一維分量即為時(shí)間序列的預(yù)測值。
應(yīng)用以上所建立的混沌時(shí)序預(yù)測模型對渤中油田某平臺(tái)某井2006年1月3日到2010年12月29日的日產(chǎn)油量數(shù)據(jù)進(jìn)行分析,共421條數(shù)據(jù),產(chǎn)量時(shí)間序列變化特征如圖3所示。
圖3 原始產(chǎn)量數(shù)據(jù)變化曲線
首先根據(jù)C-C算法計(jì)算系統(tǒng)的延遲時(shí)間為t=8嵌入維度為m=7,利用加權(quán)一階局域預(yù)測法進(jìn)行預(yù)測,在MATLAB上編程演示,用最后20個(gè)樣本對預(yù)測模型進(jìn)行了驗(yàn)證,產(chǎn)生結(jié)果的平均誤差為4.14%,產(chǎn)量時(shí)間序列預(yù)測值與實(shí)際值對比如圖4。
圖4 實(shí)際與預(yù)測產(chǎn)量對比圖
可以看出,產(chǎn)量預(yù)測曲線能夠很好地吻合實(shí)際值曲線的變化趨勢,兩條曲線基本重合,但個(gè)別點(diǎn)的預(yù)測值與實(shí)際值差別較大。平均誤差不能更好的體現(xiàn)模型預(yù)測的準(zhǔn)確率,所以為了更客觀地評價(jià)產(chǎn)量混沌時(shí)間序列預(yù)測模型的優(yōu)劣,本文采用性能指標(biāo)均方誤差對模型進(jìn)行評價(jià)。經(jīng)過計(jì)算得出油田產(chǎn)量預(yù)測混沌時(shí)間序列分析模型的均方誤差為0.01629。
根據(jù)實(shí)例計(jì)算結(jié)果以及誤差分析可以看出,基于渤中油田某平臺(tái)某井?dāng)?shù)據(jù)進(jìn)行的產(chǎn)量預(yù)測,其預(yù)測準(zhǔn)確性達(dá)到96%,產(chǎn)量時(shí)間序列的混沌預(yù)測達(dá)到了較高的精度,能夠運(yùn)用于實(shí)際油田的產(chǎn)量預(yù)測中。
圖5 相對誤差曲線
(1) 本文建立了油田產(chǎn)量預(yù)測的混沌時(shí)序分析模型,并以渤中油田某平臺(tái)某井2006年-2010年的實(shí)際日產(chǎn)油量數(shù)據(jù)進(jìn)行了分析,利用MATLAB編程和計(jì)算,得到最大Laypunov指數(shù)為0.0062>0,確實(shí)存在混沌特性。
(2) 利用已建立的模型對渤中油田某平臺(tái)某油井產(chǎn)量進(jìn)行了預(yù)測,得到較好預(yù)測結(jié)果,證實(shí)混沌時(shí)序分析法的確可用于油田產(chǎn)量的預(yù)測。同時(shí),雖然整體誤差比較小,但仍存在個(gè)別誤差較大點(diǎn),所以算法仍需改進(jìn)。
(3) 同樣必須指出對于油田產(chǎn)量序列預(yù)測問題,必須具體問題具體分析,有部分油田可能由于開發(fā)規(guī)律性較強(qiáng),并不存在混沌現(xiàn)象,所以應(yīng)用混沌時(shí)序分析前務(wù)必觀察和判別原始序列是否為混沌狀態(tài)。
[1] 范海軍,張麗麗. 復(fù)雜油田產(chǎn)量序列的相空間重構(gòu)及混沌特征分析[J]. 大慶石油地質(zhì)與開發(fā),2005,02:43-45+106.
[2] 高俊杰. 混沌時(shí)間序列預(yù)測研究及應(yīng)用[D].上海交通大學(xué),2013.
[3] KimHSEykholtR, SalasJ. Nonlineardynamics, delay times, and embedding windows [J]. Physica D: Nonlinear Phenomena, 1999, 127(1-2): 48-60.
[4] 陳益峰,呂金虎,周創(chuàng)兵. 基于Lyapunov指數(shù)改進(jìn)算法的邊坡位移預(yù)測[J]. 巖石力學(xué)與工程學(xué)報(bào),2001,05:671-675..
[5] 胡瑜,陳濤. 基于C-C算法的混沌吸引子的相空間重構(gòu)技術(shù)[J]. 電子測量與儀器學(xué)報(bào),2012,05:425-430.
[6] 修妍. 混沌時(shí)序分析中的若干問題及其應(yīng)用研究[D].天津大學(xué),2007.
[7] 鐘儀華,林旭旭,劉雨鑫. 基于多元混沌時(shí)間序列的油田產(chǎn)量預(yù)測模型[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識,2016,06:99-105.
[8] 楊永鋒,仵敏娟,高喆,吳亞鋒,任興民. 小數(shù)據(jù)量法計(jì)算最大Lyapunov指數(shù)的參數(shù)選擇[J]. 振動(dòng).測試與診斷, 2012,03:371-374.
[9] 張海龍,閔富紅,王恩榮. 關(guān)于Lyapunov指數(shù)計(jì)算方法的比較[J]. 南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版),2012,01:5-9.
[10] 李國輝,徐得名,周世平. 時(shí)間序列最大Lyapunov指數(shù)的計(jì)算[J]. 應(yīng)用科學(xué)學(xué)報(bào),2003,02:127-131.
Oilfield Output Forecast Based on the Chaotic Sequence Time Forecasting Method
GAO Lijie1, TAN Chaodong1*, CHENG Xi,nping2, ZHENG Chunfeng2, LI Xinlun1, LIU Ping3
(1.College of Petroleum Engineering, China University of Petroleum (Beijing), Beijing Changping 102249, China; 2.CNOOC Energy Technology & Services- Engineering Technology Co,Tianjin Tanggu 300450;3.Beijing Yandan Petroleum Technology Development Co, Ltd, Beijing Changping 102200)
Oilfield output forecasting is an important research topic for the industry. The factors that impact the oil production are numerous and complex. In this paper, we propose a chaotic sequence time forecasting method. First, the chaotic sequence time analysis model is constructed. The embedding dimension and delay time of phase space reconstruction parameters are determined with C-C method. Second , the Small Datais used to calculate the maximum Lyapunov exponent for judging chaotic characteristics of sequence time. Third, the weighted first order local prediction methodis used to predict oil production. Finally, the data of Bohai oilfield platform are used to predict production and verify the accuracy of the model.
Chaotic time series; phase space reconstruction; C-C method; production forecast.
1672-9129(2016)02-0047-05
TP3
A
2016-09-15;
2016-09-27。
高麗潔(1993-),女,遼寧寬甸,學(xué)生,碩士研究生,主要研究方向:數(shù)據(jù)挖掘、油井措施診斷;檀朝東(1968-),男,安徽,副研究員,博士,采油工程,智能油田:程心平(1968 -),男,高級工程師,采油工藝和井下工具。
(*通信作者電子郵箱 tantcd@126.com)