張醫(yī)銘
(中國石化上海石油化工股份有限公司統(tǒng)計中心,上海 200540)
時間序列是以時間為順序排列并隨時間而變化,同時又具有一定關(guān)聯(lián)關(guān)系的數(shù)據(jù)序列。時間序列分析是根據(jù)相鄰數(shù)據(jù)點之間具有相關(guān)性的特點,建立相應(yīng)的數(shù)學(xué)模型來對觀測數(shù)據(jù)進(jìn)行擬合,并實現(xiàn)相關(guān)信息的有效預(yù)測[1]。時間序列分析通常在經(jīng)濟領(lǐng)域應(yīng)用較為廣泛。文章試圖采用這一方法對中國石化上海石油化工股份有限公司(以下簡稱上海石化)海運碼頭出廠數(shù)據(jù)的計量誤差進(jìn)行預(yù)測,為計量數(shù)據(jù)管理提供決策依據(jù)。上海石化的柴油海運出廠通過計量流量計進(jìn)行結(jié)算,但是計量數(shù)據(jù)和商檢量之間存在著隨機誤差,并且隨著季節(jié)變化存在周期性特點。為方便管理,需要知道該誤差的趨勢范圍,以便能夠及時發(fā)現(xiàn)異常情況,因此擬采用時間序列分析方法來進(jìn)行分析建模,這里將采用移動平均自回歸模型(ARMA)對誤差數(shù)據(jù)進(jìn)行預(yù)測分析。ARMA模型是一種專門處理一維時間序列數(shù)據(jù)的模型,可為柴油出廠計量誤差規(guī)律性分析提供一種新思路。
時間序列分析方法最初只有自回歸模型(AR)用于市場變化規(guī)律的預(yù)測,在此基礎(chǔ)上數(shù)學(xué)家瓦格兒又提出了滑動平均模型(MA)和移動平均自回歸模型(ARMA),這3個模型奠定了時間序列分析理論的基礎(chǔ)。ARMA模型主要應(yīng)用于對一維、方差穩(wěn)定的平穩(wěn)時間序列分析,認(rèn)為時間序列當(dāng)前觀測項的值可以表示為其之前的p項觀測值及q項隨機誤差的線性組合,即滿足式(1),為移動平均自回歸模型,并記作ARMA(p,q)模型[2]。
移動平均自回歸模型的數(shù)學(xué)表達(dá)形式為:
Xy-φ1Xt-1-...φpXt-p=εt-θt-1-θqεt-q
(1)
式中:φ1為自回歸因子,θ1為滑動平均因子,{ε1}為白噪聲序列。
引入后移算子B,用Bk表示k步線性推移算子,即BkX1=Xt-k,Bkε1=εt-k,令
φ(B)=1-φ1B-φ2B2-...-φpBp
(2)
θ(B)=1-θ1B-θ2B2-...-θpBp
(3)
則(1)式簡寫為:
φ(B)Xt=θ(B)εt
(4)
這就是p階自回歸q階移動平均模型,記為ARMA(p,q)。當(dāng)p=0時為純滑動平均模型,記為MA(q);當(dāng)q=0時為純自回歸模型,記為AR(p);當(dāng)p=q=0時,則模型表示為Xt=εt,此時,該序列為白噪聲序列[3]。
ARMA模型建模過程主要包括數(shù)據(jù)預(yù)處理、階數(shù)選取、參數(shù)估計和模型檢驗4個步驟。
(1)數(shù)據(jù)預(yù)處理:使用ARMA模型需要對數(shù)據(jù)進(jìn)行預(yù)處理,主要包括異常數(shù)據(jù)剔除和序列平穩(wěn)性檢驗。序列平穩(wěn)性可以通過時序圖初步判斷,然后通過計算樣本數(shù)據(jù)的自相關(guān)函數(shù)與偏相關(guān)函數(shù)等判斷。如果自相關(guān)圖是截尾或者拖尾,則可以判斷數(shù)據(jù)適用ARMA模型。如果樣本數(shù)據(jù)非平穩(wěn),則可通過差分法處理進(jìn)行非平穩(wěn)序列建模。
(2)階數(shù)選取:確定模型的階數(shù),即p和q值??梢酝ㄟ^自相關(guān)圖選擇相應(yīng)的階數(shù)進(jìn)行擬合,也可以采用AIC準(zhǔn)則進(jìn)行判斷。
(3)參數(shù)估計:確定自回歸因子和移動平均因子的值。參數(shù)估計主要包括最小二乘法和極大似然估計等,文章擬采用極大似然估計,使用Eviews軟件進(jìn)行數(shù)據(jù)計算。
(4)模型檢驗:模型檢驗的方法主要包括卡方檢驗和實測檢驗法。卡方檢驗的基本思路是,在相應(yīng)的顯著性水平下檢驗?zāi)P偷臍埐钚蛄惺欠駷榘自肼曅蛄?;實測檢驗法是將模型預(yù)測值與實測數(shù)據(jù)進(jìn)行比對,計算相應(yīng)的誤差,從而進(jìn)一步修改完善模型[4]。
由于柴油海運出廠并非每天都有,因此數(shù)據(jù)不可能嚴(yán)格連續(xù),為了更好地分析時間序列方法在誤差數(shù)據(jù)中的預(yù)測[5],選取2015—2017年誤差實測月平均數(shù)據(jù)作為樣本數(shù)據(jù),根據(jù)直觀法剔除明顯的異常數(shù)據(jù)后得到誤差數(shù)據(jù)時間序列{Xt},剔除異常值后的柴油計量數(shù)據(jù)誤差值時序圖見圖1。序列自相關(guān)和偏自相關(guān)情況見圖2。
圖1 序列時序
圖2 序列自相關(guān)情況
綜合分析序列時序圖、自相關(guān)圖,判定該序列為非平穩(wěn)序列,可以考慮使用差分法對序列進(jìn)行處理。
一階差分后的序列時序(y)、一階差分序列自相關(guān)(ACF)和一階段差分序列偏自相關(guān)(PACF)情況見圖3~5。
圖4 一階差分序列自相關(guān)
圖5 一階差分序列偏自相關(guān)情況
由圖4~5可知:該序列圍繞0點上下波動,且樣本自相關(guān)和偏自相關(guān)因子很快落入隨機區(qū)間,說明一階差分后的序列呈現(xiàn)平穩(wěn)性,可以對其建立ARMA模型。由圖5可見,序列的樣本自相關(guān)因子在k=3處顯著不為0,表現(xiàn)為拖尾性,因此可以考慮q=3;偏自相關(guān)因子表現(xiàn)為一階截尾性,因此可以考慮取p=1。由于對原數(shù)列進(jìn)行了一階差分,因此最終可以建立ARIMA(1,1,3)模型。模型參數(shù)估計結(jié)果見表1。
表1 模型參數(shù)估計結(jié)果
根據(jù)自相關(guān)圖顯示的自相關(guān)因子的3階截尾的性質(zhì),嘗試擬合MA(3)模型,使用極大似然估計方法,確定MA(3)模型的口徑為:
xt=(1-0.6 046B+0.0 583B2-0.4 535B3)εt
(5)
根據(jù)偏自相關(guān)圖的1階截尾性,可以嘗試使用AR(1)模型進(jìn)行擬合,使用極大似然估計方法確定模型口徑為:
(6)
參數(shù)估計完成后,為了驗證ARIMA(1,1,3)模型是否符合意義,運用白噪聲檢驗法對殘差序列進(jìn)行檢驗。通過對殘差序列的檢驗后,發(fā)現(xiàn)該模型是合適的,因此可以對此進(jìn)行短期預(yù)測。預(yù)測結(jié)果見表2,擬合預(yù)測見圖6。
表2 5期預(yù)測結(jié)果
圖6 擬合預(yù)測情況
(1)根據(jù)誤差數(shù)據(jù)的時序圖分析,發(fā)現(xiàn)該序列為非白噪聲、非平穩(wěn)序列,在對其數(shù)列進(jìn)行差分后滿足ARMA模型的建模要求。
(2)通過AIC定階準(zhǔn)則選取了ARMA(1,3)模型作為最終的擬合模型對數(shù)據(jù)進(jìn)行分析,最終使用極大似然估計的方法確定了模型的擬合方程。
(3)通過小樣本時間序列的預(yù)測分析,運用ARMA模型對誤差數(shù)據(jù)進(jìn)行建模,得到具體的分析方程,可以預(yù)測短期的誤差值,在實際的計量數(shù)據(jù)管理中,可以提供甄別異常值的理論依據(jù),具有較高的實用價值。
(4)模型優(yōu)點:通過對油品出廠計量數(shù)據(jù)誤差進(jìn)行分析,建立了相應(yīng)的ARMA(p,q)模型,從預(yù)測的靜態(tài)圖上看,此種方法可以模擬數(shù)據(jù)的走勢,具有一定的參考意義,可以對異常數(shù)據(jù)進(jìn)行準(zhǔn)確的判斷。
(5)模型缺點:在數(shù)據(jù)處理上,由于這些數(shù)據(jù)本身具有一定的隨機性,規(guī)律性較弱,采用單一的模型處理時會存在較大的誤差,所以對于預(yù)測的具體數(shù)值精度較低,只能提供大概率的置信區(qū)間供參考。