摘要:本文為了能夠更好的預測農產品價格指數(shù)(簡稱API)以及更好地制定農業(yè)政策,對從2003年起至2020年第二季度的季度數(shù)據來進行時間序列分析。通過分析數(shù)據特點,消除其不平穩(wěn)性,然后來建立適合擬合和預測該數(shù)據的ARIMA模型和SARIMA季度乘積模型。通過對建立的三種模型的比較,挑選出最適合的模型,然后利用該模型對API進行預測。
關鍵詞:API;ARIMA模型;SARIMA模型;預測
一、引言
農產品價格頻繁異常波動,不僅會引起社會整體物價水平的波動,還影響到人民生活水平的穩(wěn)定,而且還將給廣大農產品生產者和經營者帶來額外的市場風險,與此同時也給國家的宏觀經濟運行帶來不穩(wěn)定因素。因此,穩(wěn)定農產品價格已經成為我國宏觀經濟調控的重要目標。通過運用合理的方法對農產品價格的短期變動做出較準確的預測,以把握農產品價格總體水平的未來走勢,可以為農產品生產者和經營者規(guī)避農產品價格波動風險、為政府平抑農產品價格波動提供預警和決策依據。農產品生產者價格指數(shù)是反映一定時期內,農產品生產者出售農產品價格水平變動趨勢及幅度的相對數(shù)。該指數(shù)可以客觀反映全國農產品生產價格水平和結構變動情況,滿足農業(yè)與國民經濟核算需要[1]。
二、數(shù)據介紹及處理
(一)數(shù)據來源
本文所使用的數(shù)據為2003 年第一季度~2020 年第二季度的我國農產品生產價格季度同比指數(shù)(上年同季=100),共73個數(shù)據(數(shù)據來源于國家統(tǒng)計局),將農產品價格指數(shù)的月度時間序列命名為API,由于該時間序列是以上年同季為基期計算得到的,本身已剔除了一部分季節(jié)因素,為了進一步減緩該序列的波動程度,使該序列平穩(wěn)化以滿足建模的條件,下文將對序列API 進行預處理并用該序列建模分析。
(二)數(shù)據處理
1.數(shù)據類型分析
在對數(shù)據進行建模分析之前,我們要對時間序列數(shù)據API的平穩(wěn)性和純隨機性進行檢驗,根據檢驗結果來判斷時間序列的類型。對于平穩(wěn)性檢驗的方法比較常用的是時序圖,自相關系數(shù)、偏自相關系數(shù)[2]。
可以從圖1 看出序列并沒有明顯的趨勢,但是其存在比較大的波動,并且在最后有明顯的上升,初步判斷該序列是非平穩(wěn)的。圖1 中的自相關圖顯示這個指數(shù)序列沒有一個樣本自相關系數(shù)嚴格等于零,并且自相關系數(shù)遞減到零的速度相當緩慢,在很長的延遲時期內,自相關系數(shù)以一定的周期趨勢在0 附近隨機波動。這是具有季節(jié)趨勢的非平穩(wěn)序列的一種典型的自相關圖形式。自相關函數(shù)圖顯示延遲3 階的自相關系數(shù)在2 倍標準差范圍之外,還具有明顯衰減的阻尼正弦波動特征,說明有周期變化規(guī)律。
偏自相關圖表示除了1-3 階偏自相關系數(shù)在2 倍標準差范圍之外,其他階數(shù)的偏自相關系數(shù)都在2 倍標準差范圍內,這是一個偏自相關系數(shù)3 階截尾的典型特征[3]。
2.消除不平穩(wěn)性
根據上文的分析可知,API 數(shù)據是不平穩(wěn)的非白噪聲序列,所以在對數(shù)據進行建模之前,要先消除數(shù)據的不平穩(wěn)性。一般的方法是進行差分處理,為了確定差分階數(shù),需要通運用ADF單位根檢驗確定d。單位根檢驗(ADF)。單位根檢驗是指檢驗序列中是否存在單位根,如果存在單位根就是非平穩(wěn)時間序列。若P 值<0.05,為平穩(wěn)[4]。
對API 序列進行ADF 檢驗,把ADF 檢驗值與臨界值(置信水平分別為1%、5%、10%時)進行比較,發(fā)現(xiàn)未通過檢驗,后續(xù)對其進行一階差分、二階差分的ADF 檢驗。
從表1 可以看出,1 階差分后,t 統(tǒng)計量的值為-2.5802,均小于置信水平為1%、5%、10%時的臨界值,實驗結果表明,該序列為1 階非平穩(wěn),即差分次數(shù)d 的值為1。
對原始序列進行一階差分,并檢驗差分序列的平穩(wěn)性,根據其時序圖、自相關圖、偏自相關圖,最終判斷1 階差分后的序列是符合白噪聲序列,表明該序列平穩(wěn)。后續(xù)研究均在一次差分處理后的時間序列基礎上展開。
三、模型建立與比較
(一)ARIMA 模型識別與定階
根據一次差分后序列的平穩(wěn)性檢驗結果,觀察其自相關函數(shù)圖和偏自相關函數(shù)圖發(fā)現(xiàn),這是一個截尾序列。另外,由于在前述的討論中,已經確定了ARIMA 模型的差分項為1,因此可將模型設定為ARIMA(p,1,q)。并且從圖1可以看出,該序列的自相關函數(shù)1 階是顯著的,2 階之后數(shù)值都位于虛線內,且較1階時下降明顯,即1階后截尾,所以先設定ARIMA( p, d, q) )模型中的q 值為0。同樣通過偏自相關函數(shù)圖,1 階時的數(shù)據偏相關系數(shù)均較為顯著,2 階之后截尾,數(shù)據都位于虛線內。所以,先設定模型中p 值為0、1。因此,經過排列組合后,得到了4 種可能的ARIMA模型。在此,本研究選用loglikelihood 、AIC 這2 個指標對4 個可能的模型的回歸結果進行比較,指標的數(shù)值越小,表示模型的擬合優(yōu)度越高。
其中ARIMA(0,1,0) 的loglikelihood224.32,AIC448.64;ARIMA(0,1,1)的loglikelihood222.23,AIC446.46;ARIMA(1,1,0)的loglikelihood221.96,AIC445.92;ARIMA(1,1,1)的loglikelihood221.96,AIC447.9
從上面的結果可以看出,在上述4 個可能的模型中,綜合log likelihood 、AIC指標比較,ARIMA(1,1,0)模型表現(xiàn)出了最好的預測性能,因此,選定的最終的模型為ARIMA(1,1,0),其模型表達式為: 1 0.2521 ) t t (B Ye 。
(二)自動定階模型
除了上面的模型識別方法,我們還可以使用R 語言中的auto.arima 函數(shù)進行自動模型定階,auto.arima 函數(shù)是Hyndman-Khandakar 算法[5]的一個變種,它結合了單位根檢驗,最小化AIC 和MLE 等評價標準來獲得一個ARIMA模型。
(三)SARIMA 模型識別與定階
之前提到過API 數(shù)據是季度數(shù)據,本身消除了一定的季節(jié)性,但是通過API 序列一階差分之后的ACF 和PACF 圖,我們可以發(fā)現(xiàn)仍然具有一定的季節(jié)性,所以為消除原序列存在的季節(jié)變動,對逐期差分后的時間序列API 做步長為s4的季節(jié)差分,以更好地擬合樣本數(shù)據。
通過觀察一階逐期差分和季節(jié)差分處理后的序列 API 4時序圖,我們發(fā)現(xiàn)該序列沒有明顯的趨勢,在一定范圍內進行小波動,暫判斷該序列是平穩(wěn)的。
綜合loglikelihood 和AIC 以及系數(shù)顯著與否來看,SARIMA(1,1,0)(2,1, 2)4 是相對更優(yōu)的模型。我們接下來對SARIMA(1,1,0)(2,1, 2)4進行參數(shù)估計,根據得到的回歸結果,我們可以識別出模型:
(五)模型比較
上文我們已經通過三種方法識別定階出了三種模型,接下來我們要對這三種模型進行比較選擇,首先比較這三種模型的log likelihood 和AIC 值。
通過比較這兩個指標,我們發(fā)現(xiàn)SARIMA(1,1,0)(2,1, 2)4是比較好的模型,為了進一步的比較,我們觀察用三個模型對API進行12 步預測,并畫出預測圖,來比較三種模型預測圖。
通過觀察預測圖,我們發(fā)現(xiàn)ARIMA(1,1,0)模型因為沒有考慮季節(jié)因素,預測值過于平均,沒有使用價值;自動識別階數(shù)4 ARIMA(2,0,0) (0,0,1) 模型預測值的發(fā)展趨勢與原序列非常接近,也體現(xiàn)了季節(jié)性,它的預測值比較有參考價值;我們通過季節(jié)差分后的定階識別的SARIMA(1,1,0)(2,1,2)4季節(jié)乘積模型的預測也比較符合API 發(fā)展趨勢,并且相比模型4 ARIMA(2,0,0) (0,0,1) 來說,少了一些極端值的影響,而且SARIMA(1,1,0)(1,1,1)4模型我們對經過季節(jié)差分后的平穩(wěn)序列進行定階,擬合的更加好。綜上,我們最終選擇SARIMA(1,1,0)(2,1,2)4模型來進行預測。
四、SARIMA 模型檢驗
我們通過對殘差序列的時序圖和ACF、PACF 圖進行觀察,檢驗殘差序列是否平穩(wěn)。
通過觀察殘差序列的時序圖,殘差沒有明顯的趨勢,觀察ACF、PACF 圖,值幾乎全部在虛線內,我們判斷該模型的殘差序列是平穩(wěn)的。再對殘差序列進行LB 檢驗,SARIMA(1,1,0)(2,1,2)4模型的殘差序列LB檢驗統(tǒng)計量滯后4階、8 階、12 階都>0.05,所以該序列是隨機的。綜上,我們最終判斷該模型的殘差序列是白噪聲序列,因此該模型通過了檢驗[7]。
五、模型預測及結論
我們用SARIMA(1,1,0)(2,1, 2) 4模型首先計算出未來6期的預測值及其預測區(qū)間。
為了能夠更加清晰的看出我們使用的SARIMA(1,1,0)(2,1, 2) 4模型預測的情況,我們畫出預測圖來進行觀察,如圖3 可以看出SARIMA(1,1,0)(2,1, 2)4季節(jié)乘積模型的預測比較符合API 發(fā)展趨勢。
雖然SARIMA(1,1,0)(2,1, 2) 4模型簡單,而且擬合和預測效果理想,但該模型只是對單變量時間序列進行建模及預測,我們無法從模型結構中了解到有哪些因素以及這些因素是如何影響農產品價格;而且從長期來看,其影響因素錯綜復雜且千變萬化,加劇了農產品價格波動,因此,SARIMA(1,1,0)(2,1, 2) 4模型的短期預測結果可能更理想。
參考文獻:
[1] 陳燦煌. 我國農產品價格指數(shù)短期預測——基于時間序列分解的分析[J]. 價格理論與實踐, 2011(07):55-56.
[2] Box G E P , Jenkins G M . Time series analysis :forecasting and control[J]. Journal of Time, 2010, 31(3).
[3] 石韻. 基于ARIMA 時間序列模型的中國塑料制品產量預測研究[J]. 塑料科技, 2020(3):115-118.
[4] 施龍青, 王雅茹, 邱梅,等. 時間序列模型在工作面涌水量預測中的應用. .
[5] Hyndman R J , Khandakar Y . Automatic TimeSeries Forecasting: The forecast Package for R[J].Journal of Statistical Software, 2008, 027.
[6] 陳娟, 余灼萍. 我國居民消費價格指數(shù)的短期預測[J]. 統(tǒng)計與決策, 2005, 000(02X):40-41.
[7] 方燕, 馬艷. 我國大豆價格波動及其未來走勢預測[J]. 價格理論與實踐, 2014, 000(006):67-69.
作者簡介:
郭玉昆(1996-),女,首都經濟貿易大學,漢族,山東省聊城市,碩士研究生在讀,應用統(tǒng)計。