王曉蕾,張艷,柳平增,溫孚江,任萬(wàn)明,鄭勇,王剛,延賓
基于LSTM與GARCH族組合模型的蘋(píng)果價(jià)格預(yù)測(cè)分析
王曉蕾1,張艷1,柳平增1,溫孚江1,任萬(wàn)明2,鄭勇2,王剛3,延賓3
1. 山東農(nóng)業(yè)大學(xué)信息科學(xué)與工程學(xué)院, 山東 泰安 271018 2. 山東省現(xiàn)代農(nóng)業(yè)農(nóng)村發(fā)展研究中心, 山東 濟(jì)南 250100 3. 德州市陵城區(qū)農(nóng)業(yè)農(nóng)村局, 山東 德州 253500
為提高蘋(píng)果價(jià)格的預(yù)測(cè)精度,提出了一種將深度神經(jīng)網(wǎng)絡(luò)與計(jì)量經(jīng)濟(jì)模型相結(jié)合的新方法。發(fā)揮LSTM模型的自身學(xué)習(xí)特性,以及GARCH族模型挖掘經(jīng)濟(jì)特征的能力,研究構(gòu)建了長(zhǎng)短期記憶模型(LSTM)與GARCH族多模型結(jié)合的組合模型。對(duì)比分析多個(gè)組合模型的預(yù)測(cè)性能,實(shí)驗(yàn)結(jié)果顯示,(1)加入波動(dòng)聚集性、波動(dòng)持續(xù)性、非對(duì)稱波動(dòng)性、杠桿效應(yīng)以及增強(qiáng)非對(duì)稱波動(dòng)靈活性等特性的LSTM與GARCH族組合模型(LSTM-GTEP)預(yù)測(cè)性能最優(yōu)。(2)對(duì)比含有GARCH項(xiàng)、TGARCH項(xiàng)、EGARCH項(xiàng)、PGARCH項(xiàng)的組合模型損失函數(shù)均值,含有非對(duì)稱波動(dòng)效應(yīng)的TGARCH項(xiàng)的組合模型整體最優(yōu),其次為含有波動(dòng)聚集、波動(dòng)持續(xù)效應(yīng)的GARCH項(xiàng)的組合模型。最后,基于組合模型中的最優(yōu)模型對(duì)蘋(píng)果價(jià)格進(jìn)行預(yù)測(cè),驗(yàn)證了組合模型的有效性。
蘋(píng)果; 價(jià)格預(yù)測(cè); 模型
我國(guó)是世界上最大的蘋(píng)果生產(chǎn)國(guó)和消費(fèi)國(guó),蘋(píng)果已成為部分農(nóng)民增收致富的支柱產(chǎn)業(yè),受供求、季節(jié)和自然災(zāi)害等因素的影響,蘋(píng)果市場(chǎng)價(jià)格波動(dòng)愈發(fā)顯著,價(jià)格波動(dòng)直接影響著蘋(píng)果產(chǎn)業(yè)從業(yè)者的收益。開(kāi)展蘋(píng)果市場(chǎng)價(jià)格的短期預(yù)測(cè),對(duì)果農(nóng)規(guī)避市場(chǎng)風(fēng)險(xiǎn),以及對(duì)穩(wěn)定農(nóng)業(yè)生產(chǎn)、平衡物價(jià)水平、保障消費(fèi)者福利水平至關(guān)重要,也是制定農(nóng)業(yè)產(chǎn)業(yè)政策、維護(hù)市場(chǎng)健康發(fā)展的重要依據(jù)。
從農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)方面來(lái)看,學(xué)者們主要從兩個(gè)方面進(jìn)行了探討:一是基于傳統(tǒng)的時(shí)間序列、神經(jīng)網(wǎng)絡(luò)以及機(jī)器學(xué)習(xí)等單模型進(jìn)行預(yù)測(cè),二是使用組合模型進(jìn)行農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)。單模型方面,
早期的農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)方法主要為時(shí)間序列預(yù)測(cè),因ARIMA能較好的擬合時(shí)間序列,因此多采用ARIMA系列模型進(jìn)行價(jià)格預(yù)測(cè)[1-3],但ARIMA未能完全提取季節(jié)因素特征,利用季節(jié)分解方法剔除季節(jié)因素后[4],再利用非平穩(wěn)時(shí)間序列模型進(jìn)行預(yù)測(cè)分析能得到更好的預(yù)測(cè)結(jié)果[5];神經(jīng)網(wǎng)絡(luò)由于其自身自動(dòng)學(xué)習(xí)數(shù)據(jù)特征、靈活考慮多種因素等特點(diǎn)[6-8],能充分考慮影響價(jià)格的多種因素,如種植面積、產(chǎn)量及自然災(zāi)害等因素,也被廣泛應(yīng)用于農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)[9]。組合模型方面,組合模型能夠滿足對(duì)預(yù)測(cè)精度進(jìn)一步提高的要求[10-12],能夠預(yù)測(cè)序列波動(dòng)趨勢(shì)[13-15],為防止特征項(xiàng)冗余,將多個(gè)特性項(xiàng)進(jìn)行特征提取后,利用模型進(jìn)行預(yù)測(cè)也能得到較好預(yù)測(cè)結(jié)果[16,17];利用機(jī)器學(xué)習(xí)模型對(duì)預(yù)測(cè)結(jié)果誤差進(jìn)行分析[18],對(duì)預(yù)測(cè)精度也有所改善[19]。綜上組合模型研究結(jié)果發(fā)現(xiàn),組合模型在農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)方面具有顯著性優(yōu)勢(shì)。預(yù)測(cè)模型方面,學(xué)者們主要從兩方面對(duì)LSTM神經(jīng)網(wǎng)絡(luò)模型開(kāi)展了研究,一是使用LSTM模型對(duì)價(jià)格進(jìn)行預(yù)測(cè)[20,21],利用改進(jìn)和優(yōu)化后的LSTM來(lái)提高預(yù)測(cè)精度[22-24]。二是采用與LSTM相結(jié)合的組合模型進(jìn)行價(jià)格預(yù)測(cè)也能達(dá)到很好的效果[25,26],其中LSTM-BP與LSTM-RNN組合模式被廣泛應(yīng)用于趨勢(shì)預(yù)測(cè)、特征信息融合及語(yǔ)義分類等[27],此類組合模型在趨勢(shì)預(yù)測(cè)方面未充分考慮數(shù)據(jù)的時(shí)間序列特性,以及特征項(xiàng)冗余問(wèn)題對(duì)趨勢(shì)預(yù)測(cè)的影響。
本文擬采用能夠提取價(jià)格序列特征信息的GARCH族模型與LSTM組合模型,以提高蘋(píng)果價(jià)格預(yù)測(cè)精度。為避免數(shù)據(jù)特征的過(guò)度擬合,本文擬采用客觀賦權(quán)的熵值法對(duì)GARCH族進(jìn)行成分提取,利用LSTM進(jìn)行預(yù)測(cè)分析,并分析時(shí)間序列特征對(duì)數(shù)據(jù)的影響。最后基于LSTM與GARCH族組合模型對(duì)蘋(píng)果價(jià)格進(jìn)行預(yù)測(cè),并分析驗(yàn)證預(yù)測(cè)結(jié)果的準(zhǔn)確性。
本研究使用的數(shù)據(jù)源自中華人民共和國(guó)商務(wù)部創(chuàng)辦的全國(guó)農(nóng)產(chǎn)品商務(wù)信息公共服務(wù)平臺(tái),選取山東濟(jì)南市堤口果品批發(fā)市場(chǎng)、山東德州市黑馬農(nóng)副產(chǎn)品批發(fā)市場(chǎng)、山東青島市城陽(yáng)蔬菜水產(chǎn)品批發(fā)市場(chǎng)、山東威海市農(nóng)副產(chǎn)品批發(fā)市場(chǎng)、山東壽光市農(nóng)產(chǎn)品物流園五大市場(chǎng)富士蘋(píng)果平均日批發(fā)價(jià)格,單位為元/kg,選取區(qū)間為2014年1月1日—2020年12月31日。
1.2.1 GARCH族模型GARCH模型。廣義自回歸條件異方差(GARCH)模型能夠較好地解決蘋(píng)果價(jià)格序列在市場(chǎng)震蕩期內(nèi)波動(dòng)較劇烈而在市場(chǎng)穩(wěn)定期內(nèi)波動(dòng)較小的異方差現(xiàn)象。均值方程、μ波動(dòng)方程、條件方差方程如公式(1)、(2)、(3)所示。式中為解釋變量向量,為解釋變量前的系數(shù)向量,μ為擾動(dòng)項(xiàng),ε為獨(dú)立同分布,α為ARCH項(xiàng)系數(shù),β為GARCH項(xiàng)系數(shù)。
TGARCH模型。該模型均值方程與GARCH模型相同,以TARCH(1,1)模型為例,該模型中的條件方差如公式(4)所示,其中,當(dāng)均值方程中的μ<0時(shí),其值為1,否則其值為0;若1*≠0則存在非對(duì)稱效應(yīng)。式中d1為虛擬變量,1*μ-12d-1為非對(duì)稱效應(yīng)項(xiàng)。
1.2.2 長(zhǎng)短期記憶模型長(zhǎng)短期記憶模型LSTM是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),能解決RNN的梯度消失和梯度爆炸問(wèn)題,能夠用來(lái)預(yù)測(cè)特征間隔長(zhǎng)、延遲長(zhǎng)的價(jià)格數(shù)據(jù)[23]。LSTM的核心思想是門(mén)控邏輯,內(nèi)部結(jié)構(gòu)如圖1所示。LSTM由遺忘門(mén)、輸入門(mén)、輸出門(mén)組成,其中遺忘門(mén)通過(guò)sigmoid函數(shù)取舍,決定對(duì)前一時(shí)刻狀態(tài)的遺忘程度,如公式(7)所示,其中,f介于0與1之間,式中h1為輸出變量,X為輸入變量,U、W為變量的權(quán)重,b為截距項(xiàng),為sigmoid函數(shù)。
公式(9)中輸出門(mén)根據(jù)激活函數(shù)確定輸出變量,并利用激勵(lì)函數(shù)處理細(xì)胞狀態(tài)。
LSTM是由記憶塊而不是神經(jīng)元組成的,通過(guò)一個(gè)存儲(chǔ)單元和三個(gè)控制門(mén)使得LSTM能夠更好地選擇數(shù)據(jù)并學(xué)習(xí),對(duì)時(shí)間間隔長(zhǎng)的有效的歷史信息形成記憶。隨著信息量的增加,LSTM模型能夠可以有效地學(xué)習(xí)預(yù)測(cè)已實(shí)現(xiàn)的價(jià)格波動(dòng)所需的特征,讓價(jià)格數(shù)據(jù)中的關(guān)鍵信息進(jìn)行有效的更新和傳遞,能更好地捕捉蘋(píng)果市場(chǎng)價(jià)格波動(dòng)規(guī)律,從而提高對(duì)蘋(píng)果市場(chǎng)價(jià)格的預(yù)測(cè)準(zhǔn)確性。
圖 1 LSTM模型結(jié)構(gòu)
1.2.3 熵值法熵值法是一種客觀賦權(quán)方法,它通過(guò)計(jì)算各GARCH項(xiàng)系數(shù)的信息熵,根據(jù)各項(xiàng)系數(shù)的相對(duì)變化程度對(duì)蘋(píng)果價(jià)格整體的影響來(lái)決定各項(xiàng)系數(shù)的權(quán)重,例如,相對(duì)變化程度大的GARCH項(xiàng)系數(shù)具有較大的權(quán)重,指標(biāo)的信息熵值與權(quán)重分別如公式(10)、(11)所示,式中為指標(biāo)信息熵值,為信息效用值。
1.2.4 GARCH-LSTM組合模型在預(yù)測(cè)數(shù)據(jù)精度上,深度學(xué)習(xí)與GARCH族模型各有特點(diǎn)。將含有序列信息的GARCH族模型系數(shù)加入到LSTM模型的輸入層中,利用LSTM模型能夠預(yù)測(cè)特征間隔長(zhǎng)、延遲長(zhǎng)的數(shù)據(jù)等優(yōu)點(diǎn)來(lái)學(xué)習(xí)序列特征,提高模型預(yù)測(cè)性能。并通過(guò)熵值法將多個(gè)GARCH項(xiàng)系數(shù)進(jìn)行數(shù)據(jù)降維后的系數(shù)。GARCH項(xiàng)系數(shù)表示波動(dòng)持續(xù)性以及波動(dòng)沖擊大小,TGARCH項(xiàng)系數(shù)代表沖擊的非對(duì)稱性,EGARCH項(xiàng)系數(shù)代表杠桿效應(yīng),PGARCH項(xiàng)系數(shù)代表靈活的非對(duì)稱沖擊性。
蘋(píng)果價(jià)格數(shù)據(jù)呈現(xiàn)出尖峰后尾現(xiàn)象,根據(jù)JB統(tǒng)計(jì)量<0.05說(shuō)明分布不同于正態(tài)分布,可以假設(shè)時(shí)間序列存在依賴性或異質(zhì)性,通過(guò)ARCH-LM檢驗(yàn)結(jié)果表明,滯后3期的蘋(píng)果價(jià)格序列存在ARCH效應(yīng)。進(jìn)行ADF的單位根檢驗(yàn),結(jié)果表明價(jià)格序列一階差分平穩(wěn)。圖2為樣本期內(nèi)蘋(píng)果價(jià)格對(duì)數(shù)波動(dòng)率,直觀地反映了價(jià)格波動(dòng)的集聚性問(wèn)題。運(yùn)行基于蘋(píng)果價(jià)格數(shù)據(jù)的GARCH模型,誤差分布選擇學(xué)生t分布,以GARCH(p,q,r)模型為例,其中1≤≤3且1≤≤2且0≤≤,根據(jù)AIC、SC、HQ準(zhǔn)則在15種GARCH(,,)模型中選取最優(yōu)GARCH模型,得出GARCH項(xiàng),TGARCH、EGARCH、PGARCH模型選取規(guī)則相同。
圖 2 蘋(píng)果價(jià)格對(duì)數(shù)波動(dòng)率
2.2.1 單一模型首先生成了一個(gè)單獨(dú)LSTM模型。本文收集50個(gè)蘋(píng)果價(jià)格數(shù)據(jù)來(lái)預(yù)測(cè)下一日的價(jià)格,實(shí)驗(yàn)在LSTM模型中使用了五個(gè)隱藏層,其中,三個(gè)LSTM層以及兩個(gè)全連接層,三個(gè)LSTM層的隱藏節(jié)點(diǎn)數(shù)分別為20、15和10,兩個(gè)全連接層包含的隱藏節(jié)點(diǎn)數(shù)分別是5和1。為了防止過(guò)擬合,在三個(gè)LSTM層中加入了dropout函數(shù),分別設(shè)置為0.3、0.8、0.8。本文將10%樣本數(shù)據(jù)設(shè)為驗(yàn)證區(qū)間。模型的輸入層變量如表1所示。
2.2.2 雙模型將LSTM分別與GARCH(LSTM-G)、TGARCH(LSTM-T)、EGARCH(LSTM-E)、PGARCH (LSTM-P)相結(jié)合,把GARCH族模型中的GARCH參數(shù)加入到LSTM的輸入層進(jìn)行預(yù)測(cè)。
2.2.3 三模型將LSTM與兩個(gè)GARCH模型組合成LSTM-GT、LSTM-GE、LSTM-GP、LSTM-TE、LSTM-TP、LSTM-EP模型,分別用三模型對(duì)價(jià)格數(shù)據(jù)進(jìn)行預(yù)測(cè)。
2.2.4 四模型將LSTM與三個(gè)GARCH模型合成一個(gè)組合模型,分別為L(zhǎng)STM-GTE、LSTM-GEP、LSTM-TEP,分別用四模型對(duì)價(jià)格數(shù)據(jù)進(jìn)行預(yù)測(cè)。
2.2.5 GARCH族組合模型利用四個(gè)GARCH族模型與LSTM組合(LSTM-GETP)來(lái)預(yù)測(cè)蘋(píng)果價(jià)格。
2.2.6 組合熵值模型利用熵值法(Entropy Method)將GARCH、TGARCH、EGARCH、PGARCH四個(gè)模型的GARCH項(xiàng)進(jìn)行數(shù)據(jù)降維,擬合為一個(gè)指標(biāo),與LSTM組合(LSTM-E-G)進(jìn)行價(jià)格預(yù)測(cè)。
2.2.7 模型預(yù)測(cè)性能對(duì)比
表1 模型中的輸入層變量
根據(jù)損失函數(shù)值評(píng)估模型預(yù)測(cè)性能,結(jié)果如表2所示。
表2 模型損失函數(shù)比較
2.3.1 單一模型 比較各模型的損失函數(shù)發(fā)現(xiàn),損失函數(shù)MAE為0.3557,說(shuō)明深度學(xué)習(xí)模型對(duì)蘋(píng)果價(jià)格波動(dòng)有良好的預(yù)測(cè)性能。
2.3.2 雙模型結(jié)合LSTM的單一GARCH類模型預(yù)測(cè)性能優(yōu)于單一的LSTM模型,因捕捉到蘋(píng)果價(jià)格的波動(dòng)沖擊大小、波動(dòng)持久性、波動(dòng)方向以及杠桿效應(yīng)等經(jīng)濟(jì)特征信息,LSTM-G對(duì)比LSTM損失函數(shù)HMAE從0.0577降低到0.0509。LSTM-T加入了TGARCH模型的系數(shù),加入一個(gè)非對(duì)稱性附加項(xiàng)來(lái)解釋非對(duì)稱沖擊影響,使損失函數(shù)MAE從0.3557降低到0.3321。LSTM-E加入了EGARCH模型的系數(shù),其中加入杠桿系數(shù)能夠捕捉到蘋(píng)果市場(chǎng)的杠桿效應(yīng),使損失函數(shù)HMSE從0.0053降低到0.0037。LSTM-P加入了PGARCH模型的系數(shù),增強(qiáng)了時(shí)間序列非對(duì)稱波動(dòng)的靈活性,使損失函數(shù)MSE從0.1930降低到0.1661。對(duì)比發(fā)現(xiàn),加入序列特征項(xiàng)能夠提高模型預(yù)測(cè)性能,其中,加入了杠桿系數(shù)的的LSTM-E模型為雙模型中的最優(yōu)模型,說(shuō)明杠桿效應(yīng)對(duì)蘋(píng)果價(jià)格影響較大。
2.3.3 三模型結(jié)合LSTM的兩個(gè)GARCH類模型預(yù)測(cè)性能較優(yōu)于雙模型,LSTM-TE的損失函數(shù)MAE最小為0.2979,在三模型里最優(yōu),說(shuō)明加入非對(duì)稱沖擊的杠桿系數(shù)后預(yù)測(cè)結(jié)果較好。
2.3.4 四模型四模型的預(yù)測(cè)精度接近三模型,但預(yù)測(cè)精度略低于雙模型與三模型,說(shuō)明并不是輸入越多GARCH族系數(shù)模型越優(yōu)。
2.3.5 GARCH族組合模型LSTM結(jié)合四個(gè)GARCH族模型的LSTM-GTEP組合模型預(yù)測(cè)性能是最優(yōu)的,對(duì)比損失函數(shù)MAE,LSTM-GTEP模型損失函數(shù)低至0.2945。
2.3.6 組合熵值模型將多項(xiàng)GARCH系數(shù)擬合為一項(xiàng)系數(shù)后結(jié)合LSTM進(jìn)行蘋(píng)果價(jià)格預(yù)測(cè)的結(jié)果優(yōu)于單模型LSTM,對(duì)比損失函數(shù)MAE可以發(fā)現(xiàn),LSTM-E-G優(yōu)于LSTM-T、LSTM-P、LSTM-GE、LSTM-EP、LSTM-TEP模型,但預(yù)測(cè)精度低于LSTM-GTEP組合模型。
2.3.7 模型預(yù)測(cè)性能對(duì)比對(duì)比以上17個(gè)模型的預(yù)測(cè)結(jié)果,可以發(fā)現(xiàn),組合模型的預(yù)測(cè)精度普遍高于單一模型,并且LSTM-GTEP組合模型預(yù)測(cè)性能是最優(yōu)的,說(shuō)明預(yù)測(cè)條件中加入波動(dòng)聚集性和波動(dòng)持續(xù)性的條件異方差、非對(duì)稱波動(dòng)性、杠桿效應(yīng)以及增強(qiáng)非對(duì)稱波動(dòng)靈活性等特性,模型的預(yù)測(cè)性能得到了顯著提升。將單模型、雙模型、三模型、四模型以及熵值模型的損失函數(shù)均值對(duì)比LSTM-GTEP模型損失函數(shù),從圖3可以看出不同模型個(gè)數(shù)的組合模型的MAE、MSE、HMAE、HMSE四類損失函數(shù)均值。根據(jù)MAE損失函數(shù)發(fā)現(xiàn),單模型LSTM預(yù)測(cè)比模型LSTM-GTEP預(yù)測(cè)的精度降低20.79%,損失百分比最高,其中熵值模型損失對(duì)比LSTM-GTEP最低占比2.41%。加入GARCH族的其他預(yù)測(cè)模型的損失精度較為接近。以上結(jié)論證明,考慮蘋(píng)果價(jià)格的時(shí)間序列特性有助于提高預(yù)測(cè)精度,同時(shí)從圖4中根據(jù)真實(shí)值、單模型分別對(duì)比雙模型、三模型、四模型中的最優(yōu)模型以及熵值模型的100條預(yù)測(cè)結(jié)果,可以發(fā)現(xiàn),組合模型的預(yù)測(cè)能力更強(qiáng)。
圖 3 不同模型個(gè)數(shù)的組合模型損失函數(shù)均值
分別對(duì)含有GARCH項(xiàng)、TGARCH項(xiàng)、EGARCH項(xiàng)、PGARCH項(xiàng)的組合模型損失函數(shù)均值,以及單模型與熵值模型的損失函數(shù)值進(jìn)行比較,圖5以損失函數(shù)MAE值為參考標(biāo)準(zhǔn),對(duì)不同類別的組合模型MAE均值進(jìn)行可視化展示,可以發(fā)現(xiàn),含有GARCH族的組合模型以及熵值模型優(yōu)于單LSTM模型。在含有GARCH族的組合模型中,含有TGARCH項(xiàng)的組合模型整體最優(yōu),損失函數(shù)最小為0.3176,其次為GARCH項(xiàng)的組合模型較優(yōu),損失函數(shù)為0.3189,說(shuō)明未來(lái)蘋(píng)果價(jià)格受非對(duì)稱波動(dòng)的影響最大,其次受波動(dòng)聚集、波動(dòng)持續(xù)的影響較大。
根據(jù)上述對(duì)蘋(píng)果價(jià)格預(yù)測(cè)方法的研究,LSTM與GARCH族的組合模型LSTM-GTEP預(yù)測(cè)精度較高?;诖耍媒M合模型預(yù)測(cè)2021年1月1日到2021年1月30日的蘋(píng)果價(jià)格,驗(yàn)證組合模型的預(yù)測(cè)能力。通過(guò)LSTM-GTEP組合模型預(yù)測(cè)30 d蘋(píng)果價(jià)格的損失函數(shù)MAE為0.2598,低于單模型LSTM預(yù)測(cè)價(jià)格的損失函數(shù)MAE的0.3296。從圖6預(yù)測(cè)結(jié)果中可以發(fā)現(xiàn),LSTM-GTEP預(yù)測(cè)數(shù)值在真實(shí)值附近波動(dòng),預(yù)測(cè)趨勢(shì)與真實(shí)價(jià)格數(shù)據(jù)波動(dòng)趨勢(shì)相符,這進(jìn)一步驗(yàn)證了基于LSTM與GARCH族的組合模型LSTM-GTEP對(duì)蘋(píng)果價(jià)格預(yù)測(cè)的有效性。
圖 4 預(yù)測(cè)結(jié)果對(duì)比
圖 5 不同類別的組合模型損失函數(shù)MAE均值
圖 6 LSTM、LSTM-GTEP預(yù)測(cè)30 d蘋(píng)果價(jià)格對(duì)比
通過(guò)GARCH族模型可以獲得價(jià)格時(shí)間序列的經(jīng)濟(jì)特征信息,如波動(dòng)聚集性、波動(dòng)持續(xù)性、非對(duì)稱性以及杠桿效應(yīng)等特性,以及LSTM模型的自身學(xué)習(xí)數(shù)據(jù)特征的特性,本文提出了一種將深度神經(jīng)網(wǎng)絡(luò)與計(jì)量經(jīng)濟(jì)模型相結(jié)合的新方法,結(jié)合兩模型優(yōu)勢(shì)提高價(jià)格預(yù)測(cè)精度。實(shí)驗(yàn)分析表明,(1)在17個(gè)預(yù)測(cè)模型中,加入波動(dòng)聚集性、波動(dòng)持續(xù)性、非對(duì)稱波動(dòng)性、杠桿效應(yīng)以及增強(qiáng)非對(duì)稱波動(dòng)靈活性等特性的LSTM-GTEP組合模型預(yù)測(cè)性能最優(yōu)。(2)含有非對(duì)稱波動(dòng)效應(yīng)的TGARCH項(xiàng)的組合模型整體最優(yōu),其次為含有波動(dòng)聚集、波動(dòng)持續(xù)效應(yīng)的GARCH項(xiàng)的組合模型。
本文在現(xiàn)有價(jià)格預(yù)測(cè)基礎(chǔ)上,通過(guò)增添數(shù)據(jù)序列的聚集性、波動(dòng)特性及非對(duì)稱性,進(jìn)一步提高了價(jià)格的預(yù)測(cè)精度。由于價(jià)格數(shù)據(jù)受多種因素影響,如蘋(píng)果的種植面積、國(guó)家政策、進(jìn)出口貿(mào)易、蘋(píng)果替代水果的價(jià)格變動(dòng)等,眾多因素共同對(duì)蘋(píng)果價(jià)格波動(dòng)產(chǎn)生影響,下一步的工作將增加影響因素的輸入維度,進(jìn)一步提高蘋(píng)果價(jià)格的預(yù)測(cè)精度。
[1] 劉峰,王儒敬,李傳席.ARIMA模型在農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(25):238-239,248
[2] Jadhav V, Chinnappa RB, Gaddi G. Application of ARIMA model for forecasting agricultural prices [J]. Journal of Agricultural Science and Technology, 2017,9(4):981-992
[3] Nyoni T. Modeling and forecasting inflation in Kenya: Recent insights from ARIMA and GARCH analysis [J]. Dimorian Review, 2018,5(6):16-40
[4] 劉雪,劉錦濤,李佳利,等.基于季節(jié)分解和長(zhǎng)短期記憶的北京市雞蛋價(jià)格預(yù)測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2020,36(9):331-340
[5] Xiong T, Li C, Bao Y. Seasonal forecasting of agricultural commodity price using a hybrid STL and ELM method: Evidence from the vegetable market in China [J]. Neurocomputing, 2018,275:2831-2844
[6] Zhang D, Zang G, Li J,. Prediction of soybean price in China using QR-RBF neural network model [J]. Computers and electronics in agriculture, 2018,154:10-17
[7] Namin SS, Namin AS. Forecasting economic and financial time series: Arima vs. LSTM [J]. Machine Learning, 2018:1-19
[8] Kurumatani K. Time series forecasting of agricultural product prices based on recurrent neural networks and its evaluation method [J]. SN Applied Sciences, 2020,2(8):1-17
[9] 劉斌,何進(jìn)榮,李遠(yuǎn)成,等.基于分布式神經(jīng)網(wǎng)絡(luò)的蘋(píng)果價(jià)格預(yù)測(cè)方法[J].計(jì)算機(jī)應(yīng)用,2020,40(2):369-374
[10] Abidoye RB, Chan AP, Abidoye FA. Predicting property price index using artificial intelligence techniques [J]. International journal of housing markets and analysis, 2019,12(6),1072-1092
[11] Airlangga G, Rachmat A, Lapihu D. Comparison of exponential smoothing and neural network method to forecast rice production in Indonesia [J].Telkomnika, 2019,17(3):1367-1375
[12] 崔文喆,李寶毅,于德勝.基于GARCH模型和BP神經(jīng)網(wǎng)絡(luò)模型的股票價(jià)格預(yù)測(cè)實(shí)證分析[J].天津師范大學(xué)學(xué)報(bào)(自 然科學(xué)版),2019,39(5):30-34
[13] 劉雪,李亞妹,劉嬌,等.基于BP神經(jīng)網(wǎng)絡(luò)的鮮雞蛋貨架期預(yù)測(cè)模型[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(10):328-334
[14] Chuentawat R, Loetyingyot S. Determination of artificial neural network structure with autoregressive form of arima and genetic algorithm to forecast monthly paddy prices in Thailand [J]. International Journal of Intelligent Systems and Applications, 2019,11(3):22
[15] Büyük?ahin ü?, Ertekin ?. Improving forecasting accuracy of time series data using a new ARIMA-ANN hybrid method and empirical mode decomposition [J]. Neurocomputing, 2019,361:151-163
[16] 于卓熙,秦璐,趙志文,等.基于主成分分析與廣義回歸神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2018,34(18):168-171
[17] Jianwei E, Ye J, Jin H. A novel hybrid model on the prediction of time series and its application for the gold price analysis and forecasting [J]. Physica A: Statistical Mechanics and its Applications, 2019,527:121454
[18] Domingos SDO, de Oliveira JF, de Mattos Neto PS. An intelligent hybridization of ARIMA with machine learning models for time series forecasting [J]. Knowledge-Based Systems, 2019,175:72-86
[19] Wang B, Liu P, Chao Z,. Research on hybrid model of garlic short-term price forecasting based on big data [J]. CMC: Comput. Mater. Continua, 2018,57(2):283-296
[20] Shin S, Lee M, Song SK. A Prediction model for agricultural products price with LSTM network [J]. The Journal of the Korea Contents Association, 2018,18(11):416-429
[21] 賈寧,鄭純軍.基于LSTM-DA神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品價(jià)格指數(shù)短期預(yù)測(cè)模型[J].計(jì)算機(jī)科學(xué),2019,46(S2):62-65,71
[22] Peng L, Liu S, Liu R,. Effective long short-term memory with differential evolution algorithm for electricity price prediction [J]. Energy, 2018,162:1301-1314
[23] Yang B, Sun S, Li J,. Traffic flow prediction using LSTM with feature enhancement [J]. Neurocomputing, 2019,332:320-327
[24] 宋剛,張?jiān)品?包芳勛,等.基于粒子群優(yōu)化LSTM的股票預(yù)測(cè)模型[J].北京航空航天大學(xué)學(xué)報(bào),2019,45(12):2533-2542
[25] Alameer Z, Fathalla A, Li K,. Multistep-ahead forecasting of coal prices using a hybrid deep learning model [J]. Resources Policy, 2020,65:101588
[26] Niu H, Xu K, Wang W. A hybrid stock price index forecasting model based on variational mode decomposition and LSTM network [J]. Applied Intelligence, 2020,50(12):4296-4309
[27] 翟社平,楊媛媛,邱程,等.基于注意力機(jī)制Bi-LSTM算法的雙語(yǔ)文本情感分析[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(12):251-255
Predictive Analysis of Apple Price Based on the Model Combining LSTM and GARCH family
WANG Xiao-lei1, ZHANG Yan1, LIU Ping-zeng1, WEN Fu-jiang1, REN Wan-ming2, ZHENG Yong2, WANG Gang3, YAN Bin3
1. College of Information Science and Engineering/Shandong Agricultural University, Tai'an 271018, China 2. Shandong Modern Agriculture and Rural Development Research Center, Jinan 250100, China 3.Dezhou Lingcheng District Agriculture and Rural Bureau, Dezhou 253500, China
In order to improve precision of apple price prediction. We proposed a new method combining deep neural network with econometric model to put the self-learning characteristics of LSTM model and economic characteristic mining ability of GARCH family to good use. And studied to build a combination model of long - short - term memory model (LSTM) and GARCH family model. We compared and analyzed the prediction performance of several combination models and the results showed that: (1) The combination model of LSTM and GARCH family (LSTM-GTEP) with the characteristics of volatility aggregation, volatility persistence, asymmetric volatility, leverage effect and enhancement of the flexibility of asymmetric volatility has the best prediction performance. (2) Compared with the mean loss functions of the combined models with GARCH, TGARCH, EGARCH and PGARCH, we found that the combination model of TGARCH with asymmetric wave effect is the best in general. And the second is a GARCH combination model with volatility aggregation and volatility persistence effect. And at last, we predicted apple price based on the best performance model of the combination models. And proved the effectiveness of the combination models.
Apple; price prediction; model
TP3-05
A
1000-2324(2021)06-1055-08
2021-04-26
2021-05-10
山東省農(nóng)業(yè)重大應(yīng)用技術(shù)創(chuàng)新項(xiàng)目(SD2019ZZ019);2019年度山東省重點(diǎn)研發(fā)計(jì)劃(公益類專項(xiàng))項(xiàng)目(2019GNC106103);山東省科技特派員項(xiàng)目(2020KJTPY078);山東省重大科技創(chuàng)新工程項(xiàng)目(2019JZZY010713)
王曉蕾(1995-),女,碩士研究生,主研領(lǐng)域:農(nóng)業(yè)大數(shù)據(jù). E-mail:wangxl4015@163.com
通訊作者:Author for correspondence. E-mail:zhangyandxy@sdau.edu.cn
山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年6期