陳燦虎 陳英偉
(河北經(jīng)貿(mào)大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,河北 石家莊 050061)
我國自古以來就是農(nóng)業(yè)大國?!懊褚允碁樘臁?,糧食安全與糧食生產(chǎn)是國民經(jīng)濟(jì)安全的戰(zhàn)略性問題,是農(nóng)業(yè)經(jīng)濟(jì)工作的根本重心,關(guān)系到國計民生,因此精準(zhǔn)預(yù)測糧食產(chǎn)量及變化趨勢是非常有必要的。由于氣候、自然災(zāi)害以及其它不可控因素的影響,糧食產(chǎn)量預(yù)測往往具有較大難度和不確定性。
糧食產(chǎn)量預(yù)測是一個復(fù)雜性極高的重大現(xiàn)實問題,學(xué)者對糧食產(chǎn)量的預(yù)測主要體現(xiàn)在3個方面。從投入占用產(chǎn)出、遙感技術(shù)、氣象學(xué)等角度入手,這類方法關(guān)注的是農(nóng)作物的生長過程;依靠糧食產(chǎn)量歷史數(shù)據(jù)挖掘內(nèi)生規(guī)律,常見的方法有灰色預(yù)測模型、時間序列模型等,此類方法所需數(shù)據(jù)量小,預(yù)測簡單;以糧食產(chǎn)量相關(guān)影響因素建模并預(yù)測,常見的方法有支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等模型,這類方法所需數(shù)據(jù)量適中,由于數(shù)據(jù)的易獲得性和科學(xué)性,預(yù)測結(jié)果更加合理,預(yù)測精確更高。
近年來,智能算法成為糧食預(yù)測領(lǐng)域研究的寵兒。2002年王啟平采用BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測糧食產(chǎn)量[1],對比發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)對于單輸入單輸出的時間序列預(yù)測具有一定的優(yōu)越性,且泛化能力強(qiáng);李武鵬提出以自適應(yīng)遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)建立模型預(yù)測糧食產(chǎn)量[2];郭慶春等以非線性最小二乘法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),拓寬了糧食產(chǎn)量預(yù)測的途徑[3];2017年戎陸慶等把灰色關(guān)聯(lián)分析和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合預(yù)測糧食產(chǎn)量[4];2020年Saleh I A等提出以一種反向傳播的神經(jīng)網(wǎng)絡(luò)改進(jìn)薩爾普群算法(SSA)預(yù)測糧食產(chǎn)量[5];2021年胡程磊等以改進(jìn)的粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),大幅度提高了糧食產(chǎn)量預(yù)測精度[6];2021年黃琦蘭等提出使用改進(jìn)的差分進(jìn)化算法優(yōu)化最小二乘SVM參數(shù),建立了ADE-LSSVM糧食產(chǎn)量預(yù)測模型[7]。綜上所述,近年來糧食產(chǎn)量預(yù)測主要通過對各種算法加以組合和優(yōu)化,預(yù)測精度不斷提高。
新形勢下,我國糧食安全面臨需求增長與土地勞動力消耗的雙重挑戰(zhàn)。因此本文提出以差分進(jìn)化改進(jìn)灰狼算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型對糧食產(chǎn)量進(jìn)行預(yù)測[8],該算法具有結(jié)構(gòu)簡單、通俗易懂的特點,通過實證對比,驗證了該模型預(yù)測具有精度高、預(yù)測結(jié)果穩(wěn)定性高的優(yōu)點。
本文研究數(shù)據(jù)來自于《中國統(tǒng)計年鑒》,圖1為1981—2021年全國糧食產(chǎn)量時序圖[9]??偟膩碚f,1981—2021年間,糧食產(chǎn)量由32000萬t上漲到約68000萬t,實現(xiàn)了總量上的“翻番”,整體呈現(xiàn)波動中增長的趨勢。具體來說,有11個年份較前一年出現(xiàn)了糧食減產(chǎn)的現(xiàn)象。在1985—1997年這段時間,每間隔2a就會出現(xiàn)1次糧食減產(chǎn),而減產(chǎn)的原因都是受災(zāi)面積的猛增。在1999—2003年期間,只有2002年糧食產(chǎn)量較前一年有增加,其余年份都在減少,累計下降超過8000萬t,主要原因是糧食播種面積出現(xiàn)大幅度下降[10]。此外,只有2016年、2018年出現(xiàn)小幅度減產(chǎn)現(xiàn)象,原因是機(jī)械總動力下降和受災(zāi)面積的增加。目前,全國糧食產(chǎn)量呈連續(xù)3a增加趨勢。
1.2.1 指標(biāo)選取
為了對糧食產(chǎn)量進(jìn)行精準(zhǔn)有效預(yù)測,本文研究了影響全國糧食產(chǎn)量的眾多指標(biāo)及相關(guān)數(shù)據(jù)[9]。結(jié)合前人研究從中選取第一產(chǎn)業(yè)從業(yè)人數(shù)、上一年糧食商品零售價格指數(shù)等8個指標(biāo)作為輸入變量[11,12],糧食產(chǎn)量作為輸出變量。指標(biāo)選擇具體見表1。
表1 糧食產(chǎn)量預(yù)測相關(guān)指標(biāo)
1.2.2 數(shù)據(jù)預(yù)處理
由于各指標(biāo)的單位不全相同,在進(jìn)行糧食產(chǎn)量預(yù)測前,需要進(jìn)行數(shù)據(jù)的歸一化來消除量綱,本文采用最小—最大規(guī)范化:
(1)
式中,x′i代表已處理的數(shù)據(jù);xi代表待處理的數(shù)據(jù);xmax、xmin分別代表指標(biāo)x的最大值、最小值。
關(guān)于指標(biāo)x2,從中國統(tǒng)計年鑒中只能獲取以前一年為基期的糧食零售價格指數(shù),而指標(biāo)x2要求以1980年的糧食零售價格指數(shù)為基期(1980=100),因此需要進(jìn)行累乘來獲取1981—2021年的指標(biāo)x2數(shù)據(jù)。數(shù)據(jù)中2021年的用電量是缺失的,利用時間序列預(yù)測的方法對該數(shù)據(jù)進(jìn)行了插補(bǔ),預(yù)測結(jié)果為9883.6億kWh。
1.2.3 探索性分析
對插補(bǔ)得到的數(shù)據(jù)集進(jìn)行相關(guān)系數(shù)分析和描述性統(tǒng)計分析,得到表2。
表2 糧食產(chǎn)量影響因素相關(guān)性及描述統(tǒng)計表
根據(jù)表2可知,x1、x8這2個指標(biāo)與指標(biāo)y之間呈負(fù)相關(guān)關(guān)系。指標(biāo)x1、x8的增大會導(dǎo)致糧食產(chǎn)量的降低。x2、x3、x4、x5、x6、x7這6個指標(biāo)與指標(biāo)y之間呈正相關(guān)關(guān)系,要想增加糧食產(chǎn)量,理論上可以從加大這6個指標(biāo)的投入入手。其中,導(dǎo)致x7與y之間關(guān)聯(lián)度不高(只有0.52)的原因很明顯——可供種糧的土地有限,而糧食產(chǎn)量卻發(fā)生了翻天覆地的改變。在1981—2021年這41a中糧食產(chǎn)量由32000萬t上漲至68000萬t,而糧食播種面積卻始終在112000千hn2上下小范圍內(nèi)浮動。有學(xué)者證明糧食作物播種面積對糧食產(chǎn)量的影響是顯著的[13]。由此可見,以上指標(biāo)的選取還是很可行的。
由各指標(biāo)的最大值、最小值和區(qū)間長度了解到,糧食播種面積的波動范圍最小,其區(qū)間長度僅為該指標(biāo)最小值的1/5。農(nóng)村用電量的波動范圍最大,由最初的370億kWh增加到了9884億kWh,增長超25倍;漲幅第2大的指標(biāo)為上一年糧食零售價格指數(shù),漲幅超11倍,由基期的100%增長到了1227%。結(jié)合標(biāo)準(zhǔn)差和平均數(shù)來看,各指標(biāo)的變異系數(shù)由大到小依次為x4、x2、x5、x6、x8、x1、x3、x7,同樣是農(nóng)村用電量的變異系數(shù)最大,達(dá)到0.84,說明其離散程度最大;糧食播種面積的變異系數(shù)僅為0.04,其離散程度最小。
在農(nóng)業(yè)領(lǐng)域上逐漸采用人工智能方法。其中在糧食預(yù)測方面,BP神經(jīng)網(wǎng)絡(luò)發(fā)揮著巨大的作用。
BP神經(jīng)網(wǎng)絡(luò)中,假設(shè)輸入層、隱含層以及輸出層節(jié)點數(shù)依次為l、m、n。隱藏層節(jié)點數(shù)可由經(jīng)驗式(2)確定,其中p∈[1,10]。
(2)
記輸入層、隱藏層、輸出層分別為Xi、Yj、Zk;wij表示輸入層第i節(jié)點到隱藏層中第j節(jié)點的權(quán)重;wjk表示隱藏層第j節(jié)點到輸出層中第k節(jié)點的權(quán)重;bj表示隱藏層中第j節(jié)點的閾值;bk表示輸出層中第k節(jié)點的閾值。信號激活函數(shù)用f(x)表示。信息的正向傳播可用公式表示如下:
Yj=f(∑wijXi+bj)
(3)
Zk=f(∑wjkYj+bk)
(4)
(5)
在BP神經(jīng)網(wǎng)絡(luò)中,參數(shù)的選取對預(yù)測精度影響特大,大量參數(shù)的選取也必將導(dǎo)致迭代時間久、效率低,故通常先利用粒子群優(yōu)化或差分進(jìn)化等其它智能方法來優(yōu)化權(quán)值和閾值初始值,再進(jìn)行神經(jīng)網(wǎng)絡(luò)建模預(yù)測。
本文建立了差分進(jìn)化改進(jìn)灰狼優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型。差分進(jìn)化算法(DE)具有如下特點:結(jié)構(gòu)簡單,利于使用;性能優(yōu)越;自適應(yīng)性;算法通用;具有利用個體局部信息和群體全局信息指導(dǎo)算法進(jìn)一步搜索的能力?;依莾?yōu)化算法(GWO)脫胎于灰狼捕食獵物的過程,其優(yōu)點是能夠有效避免陷入局部最優(yōu)?;依欠N群內(nèi)遵循嚴(yán)格的社會等級制度,可表示為α、β、δ和ω狼。其中α狼為頭狼,在種群內(nèi)有著絕對的領(lǐng)導(dǎo)地位,其位置始終是最優(yōu)位置,β狼次之,δ狼更次,β、δ狼起輔助決策的作用,ω狼僅服從命令。
然而灰狼優(yōu)化用來確定最優(yōu)的權(quán)值和閾值中,變異的單位是一頭狼(個體),或者是多頭狼的線性組合,無法明顯體現(xiàn)單個屬性的變異,變異的程度不夠大。并且也無法體現(xiàn)出α、β、δ狼在領(lǐng)導(dǎo)性上的先后順序。而差分進(jìn)化變異的單位(屬性)更小,因此借助差分進(jìn)化算法來對灰狼優(yōu)化算法進(jìn)行改進(jìn),從而增加了種群多樣性,避免早熟狀況的出現(xiàn)。實踐表明,采用差分進(jìn)化改進(jìn)灰狼算法來確定BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值的最優(yōu)初始值是可行的,效率更高。
以1981—2021年中國糧食產(chǎn)量作為輸出數(shù)據(jù),對應(yīng)年份的第一產(chǎn)業(yè)從業(yè)人數(shù)、農(nóng)村用電量等8個指標(biāo)為輸入數(shù)據(jù),其中2019—2021年數(shù)據(jù)作為測試集。本文采用Matlab 2016b軟件,DE-GWO-BP模型的參數(shù)設(shè)定如表3所示。
表3 DE-GWO-BP模型參數(shù)
根據(jù)DE-GWO-BP神經(jīng)網(wǎng)絡(luò)模型對2019—2021年糧食產(chǎn)量進(jìn)行預(yù)測。由于每次預(yù)測的精度并不完全相同,因此進(jìn)行5次仿真實驗,見圖2。
圖2 DE-GWO-BP神經(jīng)網(wǎng)絡(luò)模型5次預(yù)測結(jié)果
從圖2可以發(fā)現(xiàn),DE-GWO-BP模型5次預(yù)測中,仿真3的預(yù)測最精準(zhǔn),對2019年、2020年、2021年的預(yù)測都是5次仿真的最優(yōu)值,分別為0.04萬t、14.25萬t和172.23萬t;仿真1和仿真2的預(yù)測效果較差,但5次仿真綜合來看,該模型預(yù)測效果還是很好的。從預(yù)測值與實際值的平均絕對誤差來看,3a預(yù)測結(jié)果中2021年的預(yù)測效果最差。平均絕對誤差為577.16萬t,平均相對誤差不到1%,預(yù)測效果同樣不錯。
DE-GWO-BP模型與其它模型的預(yù)測結(jié)果對比,本文選擇的對照模型是粒子群PSO-BP、BP模型,見表4,其中PSO-BP、BP模型用到的參數(shù)盡可能與DE-GWO-BP模型保持一致。實驗結(jié)果顯示了該模型的優(yōu)越性。
表4 3種模型5次預(yù)測結(jié)果的均值比較
取5次仿真的最大誤差MaxEr(億t)、平均相對誤差MRE(%)和均方根誤差RMSE(億t)作為評價指標(biāo)[6,7]。從均方根誤差RMSE來看,DE-GWO-BP模型的RMSE遠(yuǎn)小于PSO-BP模型和BP模型。實驗表明,GWO-BP模型預(yù)測的穩(wěn)定性最好,多次預(yù)測之間的差異最??;從最大誤差MaxEr來看,DE-GWO-BP模型的最大誤差同樣遠(yuǎn)小于另外兩模型,僅為2019年的0.04億t、2020年的0.06億t和2021年的0.11億t,這說明DE-GWO-BP糧食產(chǎn)量預(yù)測模型有效地減小了預(yù)測誤差;從平均相對誤差MRE來看,在2019—2021年糧食產(chǎn)量預(yù)測中,DE-GWO-BP模型的平均相對誤差分別為0.36%、0.42%、0.85%,顯著地降低了預(yù)測誤差,提高了預(yù)測精度。綜合來看,均方根誤差、最大誤差和平均相對誤差3個指標(biāo)的結(jié)果都體現(xiàn)了DE-GWO-BP模型的優(yōu)越性。
由于該模型具有較高的預(yù)測精度,對2022—2026年全國的糧食產(chǎn)量進(jìn)行預(yù)測。首先根據(jù)ARIMA模型對2022—2026年的全國糧食產(chǎn)量及其影響因素進(jìn)行預(yù)測,以獲取DE-GWO-BP模型這5a所需數(shù)據(jù)。
在預(yù)測的過程中,始終秉持多次預(yù)測取平均以減小誤差的原則。利用DE-GWO-BP模型成功預(yù)測出了2022—2026年我國的糧食產(chǎn)量,取5次預(yù)測平均值作為最后的結(jié)果,見表5。
表5 2022—2026年我國糧食產(chǎn)量DE-GWO-BP預(yù)測結(jié)果
在DE-GWO-BP模型的預(yù)測結(jié)果中,2022年、2023年糧食產(chǎn)量連續(xù)減產(chǎn),于2024年有了一定的恢復(fù),在2024—2026年連續(xù)增產(chǎn),最終在2026年全國糧食產(chǎn)量達(dá)到69679.02萬t。預(yù)測結(jié)果呈現(xiàn)波動結(jié)果的原因是利用ARIMA模型獲取的未來5a所需數(shù)據(jù)存在一定的誤差,在預(yù)測中,指標(biāo)x1、x5、x8在2022年和2023年上的數(shù)值與周圍年份存在較大差距,受災(zāi)面積和第一產(chǎn)業(yè)從業(yè)人數(shù)有大幅度的增加,而機(jī)械總動力出現(xiàn)大幅度降低。
糧食產(chǎn)量預(yù)測對于國家糧食安全政策制定具有重要的意義。本文通過實際數(shù)據(jù),驗證了DE-GWO-BP糧食預(yù)測模型的優(yōu)越性。并應(yīng)用該模型對未來5a(2022—2026年)的全國糧食產(chǎn)量進(jìn)行預(yù)測,得出以下3條結(jié)論。
掌握近年我國糧食產(chǎn)量變化規(guī)律。通過觀察1981—2021年全國糧食產(chǎn)量時間序列圖,發(fā)現(xiàn)我國糧食產(chǎn)量在41a間整體呈上升趨勢,由1981年的32502萬t上漲至2021年的68284.75萬t,實現(xiàn)了“翻番”。在1999—2003年全國糧食產(chǎn)量出現(xiàn)大幅度下降,累計下降超8000萬t。全國糧食產(chǎn)量呈連續(xù)3a增加趨勢。
構(gòu)建DE-GWO-BP糧食產(chǎn)量預(yù)測新模型。DE-GWO算法提高了BP神經(jīng)網(wǎng)絡(luò)算法的全局搜索能力,降低了陷入局部最優(yōu)的可能性。在2019—2021年糧食產(chǎn)量預(yù)測上,DE-GWO-BP模型的預(yù)測值與實際值的平均相對誤差MRE分別為0.36%、0.42%、0.85%。相對PSO-BP和BP模型,最大誤差和平均相對誤差的縮小說明了DE-GWO-BP模型的準(zhǔn)確性,均方根誤差的減小證明了DE-GWO-BP模型的穩(wěn)定性??偟膩碚f,DE-GWO-BP糧食產(chǎn)量預(yù)測模型的準(zhǔn)確性和有效性均得到了驗證,具有較大應(yīng)用價值。
短期預(yù)測了未來5a的全國糧食產(chǎn)量。利用DE-GWO-BP模型預(yù)測2022—2026年的全國糧食產(chǎn)量,分別為67362.16萬t、67095.97萬t、67886.80萬t、68995.71萬t和69679.02萬t。準(zhǔn)確預(yù)測我國的糧食產(chǎn)量,可對政府政策制定和計劃實施提供一定程度上的數(shù)據(jù)支持。