傅洪亮, 王少航, 曹培格, 樊 超, 楊鐵軍
(河南工業(yè)大學 a.信息科學與工程學院; b.糧食信息處理與控制教育部重點實驗室, 河南 鄭州 450001)
糧食對于經(jīng)濟發(fā)展和社會穩(wěn)定十分重要,我國是一個農(nóng)業(yè)大國,糧食產(chǎn)量的多少、能否滿足需要,一直是各級政府關注的主要問題之一,因此預測糧食產(chǎn)量對指導糧食生產(chǎn)具有重要的意義[1-2]。目前用于糧食產(chǎn)量預測的方法很多,主要有時間序列的回歸方法[3]、BP神經(jīng)網(wǎng)絡法[4]、灰度預測法[5]及多元線性回歸預測法[6]等。受多種因素的影響,糧食產(chǎn)量的時間序列具有非平穩(wěn)性,而傳統(tǒng)預測方法的預測精度不高,魯棒性不強。
本文在研究灰色理論及多元回歸的基礎上,提出一種基于指數(shù)平滑及差分處理的糧食產(chǎn)量組合預測方法,在分析與處理糧食作物播種總面積、總勞動力、化肥總用量、有效灌溉面積、用電總量、機械總動力、受災總面積等數(shù)據(jù)的基礎上,運用多元線性回歸及殘差修正方法對中短期(5年)和中長期(10年)全國及河南省的年度糧食總產(chǎn)量進行預測。
灰色理論由華中理工大學鄧聚龍教授于20世紀80年代創(chuàng)立。該理論以部分已知信息、部分未知信息的“少數(shù)據(jù)”“貧信息”不確定性系統(tǒng)為研究對象,通過對部分已知信息的挖掘,提取有價值的信息,實現(xiàn)對系統(tǒng)運行行為、演化規(guī)律的正確描述和有效監(jiān)控[7]。
目前使用比較廣泛的灰色預測模型是關于數(shù)列預測的一個變量、一階微分的GM(1,1)模型[7]:
設時間序列X(0)有n個觀測值,X(0)={X(0)(1),X(0)(2),…,X(0)(n)},通過累加生成新序列X(1)={X(1)(1),X(1)(2) ,…,X(1)(n)},則GM(1,1)模型相應的微分方程為:
(1)
式中:a為發(fā)展灰數(shù)。
待估參數(shù)向量為α,α=[aμ]T。通過最小二乘法求解可得:
α=(BTB)-1BTYn
(2)
式中:
求解微分方程式(1),可得預測模型:
(3)
有預測公式:
(4)
設系統(tǒng)中有m個輸入變量(影響因子)x1,x2,…xm,輸出為Y,可建立輸入與輸出之間的如下關系模型:Y=f(x1,x2,…xm)。考慮到該函數(shù)的復雜性,通常用Volterra級數(shù)展開的多項式去逼近[8-10]。該多項式為:
(5)
進一步簡化式(5),可得多元一次方程:
Y=a0+a1x1+a2x2+…aixi
(6)
式中,ai可通過線性回歸求得,i=0,1,2,…,m。
本文提出的組合預測方法首先對影響糧食產(chǎn)量的因素(包括糧食作物播種總面積、總勞動力、化肥總用量、有效灌溉面積、用電總量、機械總動力、受災總面積等)進行分析,對影響因子的以往數(shù)據(jù)進行指數(shù)平滑處理,運用灰色理論,通過迭代預測影響因子的新數(shù)據(jù),預設一個閾值后,通過影響因子關聯(lián)度分析,自動選取關聯(lián)度大的因子,對以往糧食產(chǎn)量數(shù)據(jù)進行差分處理,運用多元線性回歸及殘差修正預測未來的年度糧食產(chǎn)量。其預測流程如圖1所示。
圖1 指數(shù)平滑及差分處理組合預測的流程
首先運用灰色理論預測影響糧食產(chǎn)量的因子。
步驟1:對往年糧食產(chǎn)量影響因子的數(shù)據(jù)進行差分運算,計算影響因子相鄰數(shù)據(jù)的波動量。相鄰數(shù)據(jù)的波動量為:
(7)
如果某一波動量絕對值大于整體平均波動量z(z=Average(|z(k)|)),則此時數(shù)據(jù)用前一數(shù)據(jù)加上(或減去)整體平均波動量來代替,x(k)=x(k-1)+(1+Sign(z(k))×z。這里:Average()表示取平均運算;Sign()表示取符號運算。
步驟2:對步驟1處理過的數(shù)據(jù)進行指數(shù)平滑處理,以進一步減小數(shù)據(jù)的波動。指數(shù)平滑處理公式如下:
x′(k)=ex(k)
(8)
步驟3:運用式(1)~式(4)及處理過的往年糧食產(chǎn)量影響因子的數(shù)據(jù)x′(k),預測未來若干年的影響因子數(shù)據(jù)。然后運用預測的未來影響因子數(shù)據(jù)和多元回歸方法預測糧食產(chǎn)量。
步驟4:對往年糧食產(chǎn)量及影響因子數(shù)據(jù)進行初始像和一階緩沖算子運算。其目的在于歸一化及平滑處理數(shù)據(jù)。
初始像為:
(9)
一階緩沖算子為:
(10)
步驟5:計算糧食產(chǎn)量和影響因子間的關聯(lián)系數(shù),即:
(11)
步驟6:篩選關聯(lián)系數(shù)大的影響因子。為了提高預測精度,只保留關聯(lián)系數(shù)大于0.8的影響因子。
步驟8:進行步驟4的逆運算。
一階緩沖算子逆運算如下:
k′=N,N-1,…,n,n-1,…,3,2,1
(12)
初始像逆運算如下:
K=n,n+1,…,N,k=1,2,3,…,n
(13)
步驟9:殘差修正。將預測的糧食產(chǎn)量與往年的實際產(chǎn)量之差作為輸入數(shù)據(jù),運用灰色理論(按步驟4)預測未來若干年的糧食產(chǎn)量誤差,再運用此誤差修正未來若干年的年度糧食總產(chǎn)量。
步驟10:計算糧食產(chǎn)量預測相對誤差。
步驟11:完成預測。
基于全國及河南省糧食總產(chǎn)量以及影響糧食產(chǎn)量的主要因素(包括糧食作物播種總面積、總勞動力、化肥總用量、有效灌溉面積、用電總量、機械總動力、受災總面積)對應于1978~2013年的數(shù)據(jù),進行預測驗證。
針對5年以內(nèi)的中短期預測,用1978~2008年共31年的數(shù)據(jù)預測2009~2013年的產(chǎn)量并做驗證;10年以內(nèi)的中長期預測,用1978~2003年共26年的數(shù)據(jù)預測2004~2013年的產(chǎn)量并做驗證。本文對灰色預測、指數(shù)平滑及差分處理組合預測(無殘差修正,DI-AFS多元預測)和指數(shù)平滑及差分處理組合預測(有殘差修正,DI-AFS-EM多元預測)3種方法進行比較,預測結果如圖2~圖5所示。
(a) 產(chǎn)量預測值
(b) 各年度相對誤差
(c) 糧食產(chǎn)量影響因子關聯(lián)系數(shù)
(d) 平均相對誤差圖2 用31年數(shù)據(jù)預測5年中短期全國糧食年度總產(chǎn)量的結果
圖3 用31年數(shù)據(jù)預測5年中短期河南省糧食年度總產(chǎn)量的結果
圖4 用26年數(shù)據(jù)預測10年中長期全國糧食年度總產(chǎn)量的結果
(a) 產(chǎn)量預測值
(b) 各年度相對誤差
(c) 糧食產(chǎn)量影響因子關聯(lián)系數(shù)
(d) 平均相對誤差圖5 用26年數(shù)據(jù)預測10年中長期河南省糧食年度總產(chǎn)量的結果
比較3種方法的預測結果可知,無論是中短期預測(5年)還是中長期預測(10年),指數(shù)平滑及差分處理組合預測在預測精度上要好于灰色預測。這是由于預測時對數(shù)據(jù)的預處理使得數(shù)據(jù)的波動量減小,并且預測中考慮了全部的影響因素。另外,從圖2~圖5還可以看出,帶有殘差修正的指數(shù)平滑及差分處理組合預測可進一步提高預測精度。
為了進一步提高糧食產(chǎn)量的預測精度,增強預測算法的魯棒性,本文在研究灰色理論及多元回歸的基礎上,提出了一種基于指數(shù)平滑及差分處理的糧食產(chǎn)量組合預測方法。該方法首先對影響糧食產(chǎn)量的因素進行分析,對影響因子的以往數(shù)據(jù)進行指數(shù)平滑處理,運用灰色理論,通過迭代預測影響因子的新數(shù)據(jù);然后通過影響因子關聯(lián)度分析,自動選取關聯(lián)度大的因子,對以往糧食產(chǎn)量數(shù)據(jù)進行差分處理,以減小數(shù)據(jù)的波動;最后運用多元線性回歸及殘差修正預測未來糧食產(chǎn)量。對全國及河南省年度糧食總產(chǎn)量的中短期(5年)和中長期(10年)預測可知,本文提出的預測方法預測效果較好。
該算法可用于不同糧食品種的產(chǎn)量預測(如稻谷、小麥等),但通過實驗得知,該算法對玉米的產(chǎn)量預測精度有待提高。由于玉米數(shù)據(jù)波動較大,因此其預處理方法還存在進一步改進的空間。