李欣倫,檀朝東*,檀芃菲,2,張勝利
?
應(yīng)用時(shí)序分析ARIMA模型預(yù)測抽油井生產(chǎn)系統(tǒng)效率
李欣倫1,檀朝東1*,檀芃菲1,2,張勝利3
(1.中國石油大學(xué)(北京),北京昌平,102249;2. 新南威爾士大學(xué),悉尼,NSW2052;3.華北油田采油工藝研究院河北任丘,062550)
抽油井生產(chǎn)系統(tǒng)效率是抽油系統(tǒng)的重要工況指標(biāo)。系統(tǒng)效率預(yù)測是指通過對歷史數(shù)據(jù)的分析和研究,找出系統(tǒng)效率內(nèi)部變化規(guī)律及影響因素之間的關(guān)聯(lián),然后對系統(tǒng)效率做出預(yù)測。以前,油田多采用機(jī)理模型實(shí)現(xiàn)系統(tǒng)效率預(yù)測,但因抽油井系統(tǒng)效率的不確定性、復(fù)雜性和時(shí)間性的特點(diǎn),預(yù)測效果并不理想。因此本文建立時(shí)序分析中的差分自回歸移動(dòng)平均模型對華北油田抽油井生產(chǎn)數(shù)據(jù)進(jìn)行了擬合及抽油機(jī)井生產(chǎn)系統(tǒng)效率預(yù)測。此數(shù)據(jù)模型著重強(qiáng)調(diào)了相鄰時(shí)間點(diǎn)的抽油井系統(tǒng)效率的相關(guān)性。實(shí)驗(yàn)結(jié)果表明持續(xù)更新最新數(shù)據(jù)點(diǎn)的ARIMA模型能夠及時(shí)糾正預(yù)測方向,大幅提高抽油井生產(chǎn)系統(tǒng)效率預(yù)測的準(zhǔn)確度。
ARIMA模型;時(shí)序分析;預(yù)測;系統(tǒng)效率;抽油井
抽油井系統(tǒng)效率是抽油系統(tǒng)的重要工況指標(biāo)。抽油井生產(chǎn)系統(tǒng)是一個(gè)強(qiáng)的機(jī)電液耦合系統(tǒng),柔性的細(xì)的細(xì)長桿傳遞運(yùn)動(dòng)和能量,不可見的井下泵運(yùn)動(dòng)和復(fù)雜的油液流動(dòng),都給認(rèn)識(shí)帶來了困難。能夠精準(zhǔn)的預(yù)測抽油經(jīng)系統(tǒng)效率可以提前采取預(yù)防措施,控制抽油機(jī)的生產(chǎn)系統(tǒng)效率,達(dá)到節(jié)能減耗目的。
所謂預(yù)測,就是在分析以往數(shù)據(jù)的基礎(chǔ)上預(yù)知未來可能發(fā)生的情況。然而,由于抽油井系統(tǒng)效率變化受到多種因子的制約,并且因子間又保持著極其復(fù)雜的關(guān)系,運(yùn)用結(jié)構(gòu)性因果模型對其進(jìn)行預(yù)測,一般難以達(dá)到較為理想的預(yù)測效果。
所以本文考慮引入時(shí)間序列分析模型ARIMA模型對抽油井系統(tǒng)效率指標(biāo)進(jìn)行預(yù)測,為實(shí)際生產(chǎn)提供指導(dǎo)。
時(shí)間序列模型最主要的特征就是承認(rèn)觀測值之間的依賴關(guān)系和相關(guān)性,它是一種動(dòng)態(tài)模型,能夠應(yīng)用于動(dòng)態(tài)預(yù)測。時(shí)間序列預(yù)測方法的基本思想是:對一現(xiàn)象進(jìn)行預(yù)測時(shí),用該現(xiàn)象的過去行為來預(yù)測未來變化。即通過時(shí)間序列的歷史數(shù)據(jù)揭示現(xiàn)象隨時(shí)間變化的規(guī)律,將這種規(guī)律延伸到未來,從而對該現(xiàn)象的未來作出預(yù)測。ARIMA模型則在此基礎(chǔ)上對歷史數(shù)據(jù)進(jìn)行了比重分配。越臨近預(yù)測值的歷史數(shù)據(jù)所占比例越大,越遠(yuǎn)的歷史數(shù)據(jù)則對預(yù)測值影響越小。
時(shí)間序列分析方法在多個(gè)領(lǐng)域廣泛研究并應(yīng)用。自1970年Box和Jenkins的著作《時(shí)間序列分析、預(yù)測和控制》[1]問世以來,逐漸形成了一整套時(shí)間序列識(shí)別、估計(jì)建模、預(yù)測及控制的理論和方法。國內(nèi)外已有許多學(xué)者對時(shí)間序列建模給予研究。1999年,查正洪[2]利用時(shí)間序列分析對上證綜合指數(shù)進(jìn)行建模分析與研究,從而建立了ARIMA模型。薛黎明等[3]運(yùn)用ARIMA模型,對我國 2020 年前的能源消費(fèi)總量及煤炭消費(fèi)總量、非化石能源消費(fèi)總量進(jìn)行了預(yù)測,對我國能源結(jié)構(gòu)現(xiàn)狀及未來能源結(jié)構(gòu)發(fā)展趨勢進(jìn)行了分析。袁振洲[4]在分析鐵路貨源數(shù)據(jù)的背部規(guī)律及其時(shí)間序列特性的基礎(chǔ)上,采用ARIMA模型對貨運(yùn)煤炭總量進(jìn)行了預(yù)測。張利等[5]提出了一種對ARIMA模型改進(jìn)的預(yù)測算法,并對短時(shí)間內(nèi)的交通流量時(shí)間序列建模,取得較準(zhǔn)確的預(yù)測結(jié)果。文獻(xiàn)[6-7],將方差檢驗(yàn)引入時(shí)間序列建模的流程中,并對中國CPI時(shí)間序列進(jìn)行了實(shí)例驗(yàn)證。在國外,Contreras.J[8]對電價(jià)進(jìn)行了短期預(yù)測,得到ARIMA模型的短期預(yù)測能力要好于長期預(yù)測能力。Md Zakir Hossain等人[9]針對三種豆類的價(jià)格,通過ARIMA模型進(jìn)行分析預(yù)測,發(fā)現(xiàn)這一模型的預(yù)測精度較高。在石油領(lǐng)域中,丁靜之等人[10]建立ARIMA模型對1999年至2005年的國際原油價(jià)格數(shù)據(jù)進(jìn)行分析,對原油價(jià)格的未來走勢給出了精確判斷。陳汶濱等[11]運(yùn)用ARIMA方法對油田產(chǎn)量的遞減規(guī)律進(jìn)行了研究。但目前尚未有人實(shí)現(xiàn)用ARIMA模型對抽油井系統(tǒng)效率指標(biāo)進(jìn)行預(yù)測。
所以本文嘗試引用時(shí)間序列分析模型ARIMA模型對抽油井系統(tǒng)效率指標(biāo)進(jìn)行預(yù)測,以此來實(shí)現(xiàn)系統(tǒng)效率預(yù)測從機(jī)理預(yù)測模型到數(shù)據(jù)預(yù)測模型的轉(zhuǎn)變并大幅提高預(yù)測準(zhǔn)確性。
1.1 模型分析與建模
設(shè)抽油機(jī)井生產(chǎn)系統(tǒng)效率的時(shí)間序列為{()},經(jīng)過有限次差分可以將其轉(zhuǎn)化為平穩(wěn)序列。對于平穩(wěn)時(shí)間序列{()},=0,±1,…,如果滿足:,=0,±1,…
基于上述定義,一方面可以把AR(p),MA(q)兩個(gè)模型歸結(jié)為模型ARMA(p,q),另一方面在模型ARMA(p,q)中,令q=0,則ARMA(p,q)就是模型AR(p);若令p=0,則ARMA(p,q)就是模型MA(q)。由此可看出三類模型AR(p),MA(q),ARMA(p,q)之間存在著深刻的聯(lián)系。
設(shè)隨機(jī)序列{()},=0,±1,...,算子B滿足t=t-1,=0,±1,...,那么,稱算子B為一部延遲算子,且滿足kt=t-k+1=t-k,==0,±1,...稱k為步延遲算子引入延遲算子后,令f(B)=1-f1B-f2B2-…-fqBq,(B)=1-q1B-q2B2-…-qpBp,則有表達(dá)式:f(B)t=q(B)e(t)
1.2 ARIMA模型預(yù)測的基本步驟
基于ARIMA模型進(jìn)行時(shí)序分析預(yù)測的基本思路:對于非平穩(wěn)的時(shí)間序列,用若干次差分使其稱為平穩(wěn)序列,再用ARMA(p,q)模型對該平穩(wěn)序列建模,之后反變換得到原序列。并且根據(jù)樣本自相關(guān)函數(shù)、偏自相關(guān)函數(shù)的統(tǒng)計(jì)特性來判斷隨機(jī)序列適合哪一模型,進(jìn)而確定其模型的階數(shù)。
用ARIMA(p,d,q)模型作預(yù)測的步驟,如圖1所示:
圖1 ARIMA模型使用步驟
1.2.1 進(jìn)行平穩(wěn)性檢驗(yàn)
首先得到抽油機(jī)系統(tǒng)效率的時(shí)間序列數(shù)據(jù),繪制時(shí)間序列的折線圖、散點(diǎn)圖,計(jì)算該時(shí)間序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù),從直觀上對序列進(jìn)行初步的平穩(wěn)性判斷。一般以ADF單位根檢驗(yàn)其方差、趨勢及其季節(jié)性變化規(guī)律,對序列的平穩(wěn)性進(jìn)行識(shí)別。
設(shè)時(shí)間序列為{(t)}則樣本自協(xié)方差為:
自相關(guān)函數(shù)為:
(4)平穩(wěn)性檢驗(yàn)
如果{(t)}的自相關(guān)函數(shù)或偏自相關(guān)函數(shù)既不截尾又不拖尾,則可以斷定該序列是非平穩(wěn)的。
1.2.2 平穩(wěn)化處理
如果抽油機(jī)系統(tǒng)效率的時(shí)間序列是非平穩(wěn)的,需要先對其作平穩(wěn)化處理。對于非平穩(wěn)的含指數(shù)趨勢的時(shí)間序列,需要先通過取對數(shù)見時(shí)間序列的指數(shù)趨勢轉(zhuǎn)化為線性趨勢,再用差分法進(jìn)行處理。
對{(t)}進(jìn)行差分處理,每進(jìn)行一次差分處理后,對其進(jìn)行平穩(wěn)化處理,直至序列平穩(wěn)為止,若序列{(t)}具有d次多項(xiàng)式趨勢,則通過d次差分后可變平穩(wěn)序列。
1.2.3 模型定階及預(yù)測
對差分后平穩(wěn)序列進(jìn)行ARMA(p,q)模型定階,計(jì)算出自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的值之后,利用和的性質(zhì)來估計(jì)自相關(guān)階數(shù)p和移動(dòng)平均階數(shù)q的值,選擇適當(dāng)?shù)腁RMA(p,q)進(jìn)行擬合。
ARMA(p,q)模型定階的基本原則如表1所示:
表1 ARMA(p,q)模型定階的基本原則
采用確定ARMA(p,q)模型對Wt進(jìn)行預(yù)測。
由Wt可計(jì)算Xt:
本文以華北油田XX井從2010年11月1日到2013年7月28日的產(chǎn)生的抽油機(jī)生產(chǎn)系統(tǒng)效率數(shù)據(jù)進(jìn)行實(shí)驗(yàn),首先將這1000天的抽油機(jī)生產(chǎn)系統(tǒng)效率按照時(shí)間排序得到時(shí)間序列{X(t)}。以1000個(gè)時(shí)間點(diǎn)作為訓(xùn)練樣本,如圖2所示,建立ARIMA(p,d,q)模型。
圖2 XX井系統(tǒng)效率實(shí)測值
首先對時(shí)間序列{X(t)}進(jìn)行平穩(wěn)型檢驗(yàn),以ADF單位根法進(jìn)行檢驗(yàn),發(fā)現(xiàn){X(t)}為非平穩(wěn)時(shí)間序列。對{X(t)}一次差分得到{X¢(t)},差分后發(fā)現(xiàn){X¢(t)}為平穩(wěn)時(shí)間序列,則ARIMA的d=1,差分后的時(shí)間序列{X¢(t)}如圖3所示。
結(jié)合自相關(guān)函數(shù)和偏自相關(guān)函數(shù)根據(jù)ACI準(zhǔn)則從ARMA(1,1)開始逐步嘗試,可供選擇p和q的組合有(1,1)、(1,2)、(1,3)、(1,4)、(2,1)、(2,2)、(2,3)、(2,4),計(jì)算每個(gè)組合的模型信息函數(shù)值(如表2所示),確定模型的類型和階數(shù)。
圖3 XX井系統(tǒng)效率一階差分值
表2 各模型檢驗(yàn)結(jié)果
pq 1234 112.1576212.2123911.6382211.92738 212.0231811.7231612.8654911.86431
當(dāng)(p,q)為(1,3)時(shí),模型信息函數(shù)達(dá)到最小值,從而選擇ARIMA(1,1,3),利用ARIMA(1,1,3)模型對1000個(gè)數(shù)據(jù)中的后200個(gè)數(shù)據(jù)進(jìn)行預(yù)測,將預(yù)測結(jié)果與實(shí)際數(shù)據(jù)進(jìn)行對比,計(jì)算各項(xiàng)指標(biāo),判斷預(yù)測模型是否滿足要求。
表3 預(yù)測結(jié)果的各項(xiàng)指標(biāo)
指標(biāo)名稱計(jì)算結(jié)果/10-3 平均誤差(SE)50.5 均方根誤差(RMSE)63.2 平均絕對誤差百分比(MAPE)288
由表3可以看出用ARIMA(1,1,3)預(yù)測模型預(yù)測結(jié)果十分接近真實(shí)值,預(yù)測效果很好。
圖4 第一次預(yù)測效果圖
圖5 兩次預(yù)測效果圖對比圖
首先2010年11月1日值2013年1月9日的800個(gè)樣本數(shù)據(jù)作為歷史數(shù)據(jù),預(yù)測之后的2013年1月10日以后的200個(gè)時(shí)間點(diǎn)的系統(tǒng)效率值,得到結(jié)果如圖4所示。然后將2010年11月1日值2013年4月19日產(chǎn)生的900個(gè)實(shí)測數(shù)據(jù)點(diǎn)作為歷史數(shù)據(jù)預(yù)測之后2013年4月20日以后的100個(gè)時(shí)間點(diǎn)的系統(tǒng)效率值,將預(yù)測結(jié)果與第一次預(yù)測結(jié)果進(jìn)行對比(如圖5所示),發(fā)現(xiàn)第二次的預(yù)測值與系統(tǒng)效率的實(shí)測值更為接近,可以看出ARIMA(1,1,3)模型的預(yù)測精度隨著歷史數(shù)據(jù)的增多,預(yù)測的誤差減小。
本文根據(jù)油田抽油機(jī)井生產(chǎn)系統(tǒng)效率的數(shù)據(jù)具有不確定性、復(fù)雜性和時(shí)間性的特點(diǎn),建立了ARIMA模型作為預(yù)測工具,發(fā)現(xiàn)系統(tǒng)效率數(shù)據(jù)存在非平穩(wěn)現(xiàn)象,通過一階差分將其平穩(wěn)化處理,用模型的信息函數(shù)值來確定ARIMA模型的階數(shù)。根據(jù)對華北油田抽油井生產(chǎn)系統(tǒng)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果認(rèn)為ARIMA(1,1,3)模型對該油井的生產(chǎn)系統(tǒng)效率進(jìn)行預(yù)測比較準(zhǔn)確。同時(shí)得出以下兩點(diǎn)結(jié)論:1.由于ARIMA模型假定時(shí)間序列的未來模式與過去的趨勢一致,因此它往往值適用于作短期預(yù)測,預(yù)測時(shí)間較長會(huì)導(dǎo)致精度的迅速下降;2.靠近預(yù)測點(diǎn)附近的歷史數(shù)據(jù)所占權(quán)重較大,持續(xù)更新測試的數(shù)據(jù)信息,可以大幅提高ARIMA模型的預(yù)測精度。
[1] Box G E, Jenkins G M.時(shí)間序列分析預(yù)測與控制[M]. 北京; 中國統(tǒng)計(jì)出版社, 2003; 25-90.
[2] 查正洪. 上證綜合指數(shù)的統(tǒng)計(jì)分析與預(yù)測[J]. 上海海運(yùn)學(xué)院學(xué)報(bào),1999,(04):82-89.
[3] 薛黎明, 侯運(yùn)炳, 閆旭, 何廣. 基于ARIMA模型的我國能源消費(fèi)結(jié)構(gòu)趨勢分析與預(yù)測[J]. 中國礦業(yè),2011,(04):24-27+35.
[4] 袁振洲. 應(yīng)用自回歸積分移動(dòng)平均法預(yù)測鐵路貨源貨流發(fā)展趨勢[J]. 鐵道學(xué)報(bào), 1996, S1: 52-56.
[5] 張利, 李星毅, 施化吉. 基于ARIMA模型的短時(shí)交通流量預(yù)測算法研究[J]. 鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版), 2008, 04: 89-92.
[6] 謝佳利, 楊善朝, 梁鑫. 我國CPI時(shí)間序列預(yù)測模型的比較及實(shí)證檢驗(yàn)[J]. 統(tǒng)計(jì)與決策, 2008, 09: 4-6.
[7] 汪淼, 鄭舒婷. 基于ARIMA模型的中國消費(fèi)者價(jià)格指數(shù)時(shí)間序列分析[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, S1:130-132.
[8] Contreras J, Espinola R, Nogales F J, et al. ARIMA models to predict next-day electricity prices [J]. IEEE transactions on power systems, 2003, 18(3): 1014-1020.
[9] Hossain Z, Abdus Samad Q, Ali Z. ARIMA model and forecasting with three types of pulse prices in Bangladesh: a case study [J]. International Journal of Social Economics, 2006, 33(4): 344-353.
[10] 丁靜之, 閔騏, 林怡. ARIMA模型在石油價(jià)格預(yù)測中的應(yīng)用[J]. 物流技術(shù), 2008, (10): 156-159.
[11] 陳汶濱, 時(shí)瓊, 程大勇, 王君. ARIMA模型在研究油氣田產(chǎn)量遞減規(guī)律中的應(yīng)用[J]. 中國西部科技, 2010, 06: 21-23+59.
Application of ARIMA Model in Time Series Analysis to Predict the Efficiency of Pumping Well Production System
LI Xinlun1, TAN Chaodong1*, TAN Pengfei1, 2, ZHANG Shengli3
(1.China University of Petroleum, Beijing 102249, China; 2.The University of New South Wales, Sydney NSW2052, Australia; 3. Huabei Oil Field Production Technology Research Institute, Renqiu 062552, China)
The efficiency prediction of oil well production system is an important index of pumping system. System efficiency prediction is based on the relationship between the internal variation and the influencing factors, which is learned from the analysis of historical data. Previously, oil fields used mechanism model to predict system efficiency. However, the outcome is not desired due to the uncertainty, complexity and timing of pumping well system efficiency. Therefore, this paper establishes the Autoregressive Integrated Moving Average Model (ARIMA) in time series analysis to predict and analyze the efficiency of Huabei oil field pumping well production system. This model emphasis the effects of the previous nearby data on the prediction by keep updating the latest data. The result indicates ARIMA model could adjust the direction of the prediction and hence improve the accuracy of the prediction for oil production system efficiency.
ARIMA model; time series analysis; prediction; system efficiency; pumping well
10.19551/j.cnki.issn1672-9129.2017.01.11
TE83
A
1672-9129(2017)01-0041-04
2017-01-10;
2017-01-22。
李欣倫,男,重慶長壽,碩士研究生在讀,主要研究方向:油氣田開發(fā)、數(shù)據(jù)挖掘。檀朝東 (1968-),男,安徽望江,副研究員,博士,主要研究方向:石油工程、物聯(lián)網(wǎng)教學(xué)及科研。檀芃菲,女,北京海淀,碩士研究生在讀,主要研究方向:數(shù)據(jù)分析。張勝利,男,高級(jí)工程師,主要研究方向:采油工程技術(shù)研究及應(yīng)用。E-mail:tanchaodong@cup.edu.cn