楊銀花 金 雁 汪 敏* 張矢宇
(武漢理工大學(xué)船海與能源動(dòng)力工程學(xué)院1) 武漢 430063) (武漢理工大學(xué)交通與物流工程學(xué)院2) 武漢 430063)
長江航運(yùn)干散貨運(yùn)價(jià)指數(shù)(Yangtze River bulk freight index,YBFI)是用來反映我國內(nèi)河干散貨運(yùn)輸市場貨運(yùn)水平變動(dòng)情況的重要航運(yùn)經(jīng)濟(jì)指標(biāo).由于內(nèi)河干散貨市場的動(dòng)態(tài)性和不穩(wěn)定性都與沿海干散貨市場有較大差異,例如,內(nèi)河運(yùn)價(jià)指數(shù)樣本數(shù)據(jù)點(diǎn)少、周期性不明顯且比沿海相關(guān)指數(shù)更容易受到外界因素的干擾等,沿海干散貨相關(guān)預(yù)測分析方法不適用.現(xiàn)階段對內(nèi)河航運(yùn)干散貨運(yùn)輸市場波動(dòng)分析及預(yù)測的研究較少,國內(nèi)外學(xué)者主要對中國沿海散貨運(yùn)輸市場的CBFI、國際(波羅的海)干散貨運(yùn)輸市場的BDI和中國集裝箱市場變化趨勢的CCFI等進(jìn)行了研究.主流的研究方法有:GARCH模型、小波分析理論、支持向量機(jī)(SVM)等.GARCH模型能夠衡量波動(dòng)的非均衡性,但精度無法保證;小波分析理論缺乏適應(yīng)性,容易受到基函數(shù)選擇的約束;SVM等機(jī)器學(xué)習(xí)方法容易出現(xiàn)過擬合導(dǎo)致預(yù)測失效[1-2].EMD是一種經(jīng)驗(yàn)、直觀、自適應(yīng)的數(shù)據(jù)處理方法,能很好地提取非線性和非平穩(wěn)性數(shù)據(jù)的時(shí)間尺度特征,結(jié)合傳統(tǒng)預(yù)測方法從而克服單一方法的不足.
文中選取2009年5月—2021年4月YBFI月度數(shù)據(jù)為樣本,結(jié)合“分解-預(yù)測-重構(gòu)”分析思路,將EMD分解后的數(shù)據(jù)作為樣本,從而降低數(shù)據(jù)噪聲和網(wǎng)絡(luò)復(fù)雜性,再對分解序列進(jìn)行預(yù)測,綜合得出最終預(yù)測值,從而提高YBFI預(yù)測分析的準(zhǔn)確性.
YBFI時(shí)間序列具有含噪聲、非線性、非平穩(wěn)和多尺度性.現(xiàn)今對航運(yùn)指數(shù)研究基本是單一算法預(yù)測或針對序列整體進(jìn)行建模[3],少有學(xué)者對數(shù)據(jù)的內(nèi)在波動(dòng)性出發(fā)進(jìn)行預(yù)測研究.預(yù)測主要思想為“分解-預(yù)測-重構(gòu)”[4].
采用EMD方法對YBFI序列進(jìn)行降噪分解,得到不同頻率周期相對穩(wěn)定的YBFI本征模態(tài)分量(intrinsic model function,IMF)和趨勢項(xiàng)(residual);運(yùn)用ARIMA模型或者Holt-Winters模型對子序列和趨勢項(xiàng)進(jìn)行預(yù)測,將各個(gè)IMF的預(yù)測結(jié)果進(jìn)行集成組合即得到最終的YBFI預(yù)測結(jié)果.YBFI預(yù)測模型構(gòu)建流程見圖1.
圖1 YBFI預(yù)測模型構(gòu)建流程圖
經(jīng)驗(yàn)?zāi)B(tài)分解算法(empirical mode decomposition,EMD)是一種處理非線性、平穩(wěn)時(shí)間序列的前沿時(shí)頻分析處理方法[5].分解得到不同波動(dòng)時(shí)間尺度的IMF需同時(shí)滿足2個(gè)條件:①各分量的極值點(diǎn)確定的包絡(luò)線均值為0;②各分量通過極值點(diǎn)的個(gè)數(shù)與通過零點(diǎn)的個(gè)數(shù)不多于一個(gè).具體建模步驟見圖2.
圖2 EMD分解過程
ARIMA模型是將自回歸過程(AR)與移動(dòng)平均過程(MA)相結(jié)合的時(shí)間序列組合模型.其識別流程圖見圖3.
圖3 ARIMA模型識別流程圖
該模型的一般表示方式為:ARIMA(p,d,q)×(P,D,Q)S.其中:S為周期步長;d為非季節(jié)部分提取趨勢信息所用的差分階數(shù);D為季節(jié)部分提取趨勢信息所用的差分階數(shù).乘法模型的實(shí)質(zhì)是通過差分將原始序列化為平穩(wěn)序列,再對其進(jìn)行擬合,其模型結(jié)構(gòu)為
式中:{εt}為白噪聲序列;Θ(B)為q階移動(dòng)平均系數(shù)多項(xiàng)式;Φ(B)為p階自回歸系數(shù)多項(xiàng)式;▽為差分算子;B為滯后算子.在ARIMA建模過程中,建模的重點(diǎn)在于確定(p,d,q)、(P,D,Q)的值.建模的主要思路[6]為:分析數(shù)據(jù)特征,對數(shù)據(jù)進(jìn)行相應(yīng)變換,直到通過ADF檢驗(yàn)獲得平穩(wěn)時(shí)間序列為止,這是ARIMA建模的前提條件;根據(jù)ACF/PACF圖形的峰值個(gè)數(shù)確定模型的參數(shù),根據(jù)參數(shù)建模預(yù)測并對預(yù)測結(jié)果進(jìn)行評估.
根據(jù)統(tǒng)計(jì)學(xué)誤差分析規(guī)則,選擇下列7個(gè)指標(biāo)作誤差評價(jià),見表1.
表1 誤差評估指標(biāo)
由于2008年1月—2009年4月數(shù)據(jù)振幅較大,初步預(yù)測結(jié)果與現(xiàn)實(shí)情況不符.為了準(zhǔn)確預(yù)測長江航運(yùn)干散貨2021—2030年的運(yùn)價(jià)指數(shù)數(shù)據(jù),選取交通運(yùn)輸部長江航務(wù)管理局官網(wǎng)公布的從2009年5月—2021年4月共144個(gè)樣本數(shù)據(jù).對數(shù)據(jù)進(jìn)行初步調(diào)整并繪制時(shí)序圖,見圖4.
圖4 長江航運(yùn)干散貨運(yùn)價(jià)指數(shù)(YBFI)時(shí)序圖
由圖4可知:數(shù)據(jù)呈現(xiàn)出較明顯的季節(jié)性和波動(dòng)性,具有明顯的非線性特征.在Eviews軟件中進(jìn)行ADF非平穩(wěn)性檢驗(yàn),見表2.t統(tǒng)計(jì)量(-2.893 456)大于不同顯著水平下的臨界值,在10%置信水平下不拒絕存在單位根的假設(shè),P值(0.167 8)大于0.05,故YBFI序列是非平穩(wěn)序列.
表2 ADF非平穩(wěn)性檢驗(yàn)結(jié)果
EMD方法相比傳統(tǒng)的小波分析、傅里葉分解方法存在一定的優(yōu)勢,EMD脫離了預(yù)定好的基函數(shù)的約束,能夠最大程度保留時(shí)間序列自身的特性.YBFI序列經(jīng)EMD分解后得到三個(gè)IMF分量和一個(gè)趨勢項(xiàng)Residual,見圖5.
圖5 EMD分解結(jié)果
由圖5可知:IMF1的波動(dòng)頻率最高,并依次遞減,平均振幅也從大到小變動(dòng),表現(xiàn)出YBFI序列的內(nèi)在多尺度波動(dòng)特性.從周期性角度看,IMF1的周期最小,初步分析是市場基礎(chǔ)經(jīng)濟(jì)要素對YBFI序列的影響;IMF2、IMF3依次變大,初步分析IMF2是政府宏觀調(diào)控,定期出臺的政策規(guī)定對YBFI的影響,而IMF3則可能是航運(yùn)市場重大事件影響,例如2008年金融危機(jī)、2020年新冠疫情等.趨勢項(xiàng)自2008年(根據(jù)官網(wǎng)數(shù)據(jù)可得)便呈現(xiàn)緩慢下降趨勢,到2014年末2015年初達(dá)到谷值,之后開始緩慢增長,查閱有關(guān)資料,航運(yùn)市場中周期為10~15年[7],這與趨勢項(xiàng)展示的規(guī)律一致.
通過EMD分解將YBFI序列分解為相對平穩(wěn)的IMF分量,將三個(gè)IMF分量運(yùn)用ARIMA模型或Holt-Winters指數(shù)平滑法進(jìn)行比較、預(yù)測、分析,此類分析主要在SPSS和Eviews軟件中實(shí)現(xiàn).趨勢項(xiàng)Residual數(shù)列采用曲線擬合方法,根據(jù)其分布特征和干散貨運(yùn)輸市場的周期波動(dòng)特性,運(yùn)用MATLAB 2018a實(shí)驗(yàn)平臺進(jìn)行擬合研究,通過訓(xùn)練,發(fā)現(xiàn)三角函數(shù)對Residual數(shù)列的擬合效果較好.
1) IMF1擬合模型 通過擬合發(fā)現(xiàn)ARIMA(2,0,10)×(2,0,0)12能夠很好的反映IMF1序列的波動(dòng)特性.其擬合優(yōu)度R2為0.483(接近0.5,擬合較好),均方根誤差RMSE僅為21.093;DW統(tǒng)計(jì)量為2.032;AIC值為9.034.
2) IMF2擬合模型 通過比較ARIMA模型、指數(shù)平滑模型以及專家建模結(jié)果,發(fā)現(xiàn)ARMA(4,7)能對IMF2的周期、波動(dòng)特性進(jìn)行很好的預(yù)測.其R2達(dá)到了一般線性擬合模型R2,為0.996,接近1;均方根誤差RMSE僅為1.257;平均絕對誤差MAE僅為0.803;DW值為1.672;AIC值為3.102.
3) IMF3擬合模型 通過比較擬合發(fā)現(xiàn)ARMA(6,1)能對IMF3的特征數(shù)列進(jìn)行較好的擬合.在該模型擬合過程中,R2為0.998,幾乎等于1;均方根誤差RMSE與平均絕對誤差MAE均處于較低區(qū)間,DW值為1.912,說明擬合精度較優(yōu).
4) Residual擬合模型 趨勢項(xiàng)主要反映了YBFI序列在發(fā)展過程中的整體趨勢和變化周期.經(jīng)過在MATLAB實(shí)驗(yàn)平臺中反復(fù)驗(yàn)算,調(diào)參,最終確定該序列的較優(yōu)擬合、預(yù)測模型方程式為
Residual-PREt=778.2+14.49×
cos(t×0.027 86)-95.89×sin(t×0.027 86)+
24.64×cos(2×t×0.027 86)+
22.71×sin(2×t×0.027 86)-3.695×
cos(3×t×0.027 86)+0.497 1×
sin(3×t×0.027 86)
式中:Residual_PREt為第t期趨勢項(xiàng)Residual的預(yù)測值;t為時(shí)間序號,記2009年5月為t=1;依次往后t=2,3,…,n.
圖6為Residual的擬合預(yù)測模型效果和殘差分析圖.
圖6 Residual擬合與殘差分布
從殘差分布曲線,發(fā)現(xiàn)擬合效果較好,殘差基本在[-0.95,0.60]之間,且平均殘差僅為0.036 09,與0無明顯差異.
5) YBFI預(yù)測結(jié)果 由式(1),將上述經(jīng)驗(yàn)?zāi)B(tài)分量和趨勢項(xiàng)求和即可得到相應(yīng)年份YBFI預(yù)測結(jié)果,見圖7.
圖7 YBFI擬合效果圖
預(yù)測值略有滯后,但基本能夠反映樣本波動(dòng)規(guī)律和變化趨勢.通過計(jì)算,得到殘差均值僅為0.312 8(與0無明顯差異),說明總體誤差水平較低;均方根誤差RMSE為20.317,若以基期1 000點(diǎn)算,均方根誤差僅為2%,說明高值部分預(yù)測效果較好;平均相對誤差絕對值MAPE為1.62%,在10%范圍內(nèi),表明平穩(wěn)部分預(yù)測效果較好;平均絕對誤差MAE=12.184;相對誤差RE中僅有五組數(shù)據(jù)超過5%,2組數(shù)據(jù)超過10%,占樣本總數(shù)的比例分別為0.034 7、0.013 9,可忽略不計(jì),故可判斷整體誤差較低;R2為0.973 5,說明該模型對YBFI序列的預(yù)測效果較準(zhǔn)確.
將EMD-ARIMA組合模型相關(guān)參數(shù)與傳統(tǒng)、單一的季節(jié)性預(yù)測方法[8]進(jìn)行對比,見表3.
表3 EMD-ARIMA組合模型及其對比模型預(yù)測誤差比較
總體來看,相比ARIMA模型和簡單季節(jié)模型,EMD-ARIMA組合模型對YBFI序列的預(yù)測表現(xiàn)更優(yōu),說明EMD分解能有效提取含噪聲、非線性、非平穩(wěn)性數(shù)據(jù)的時(shí)間尺度特征,通過對本征模態(tài)變量IMF和趨勢項(xiàng)Residual的預(yù)測結(jié)果進(jìn)行重新組合,可以得到準(zhǔn)確的YBFI預(yù)測結(jié)果.
該模型對未來年份YBFI預(yù)測結(jié)果(部分)見表4.
表4 未來年份預(yù)測結(jié)果
由表4可知:2022—2023年,YBFI將達(dá)到一個(gè)較高水平,之后又緩慢下跌,在不考慮“通貨膨脹”等因素的情況下,預(yù)計(jì)2030年的YBFI將處于一個(gè)較低的水平.根據(jù)我國內(nèi)河運(yùn)輸?shù)拈L期發(fā)展現(xiàn)狀來看,在未來很長一段時(shí)間內(nèi),若沒有較大的技術(shù)突破,干散貨航運(yùn)市場將維持原來的周期波動(dòng)規(guī)律,整體略有上漲趨勢.
1) EMD模型能有效分解YBFI序列,在保留數(shù)據(jù)自身的內(nèi)在波動(dòng)特性的同時(shí)對不同波動(dòng)頻率數(shù)據(jù)進(jìn)行分解,為后續(xù)預(yù)測操作提供周期較穩(wěn)定的分解序列.
2) EMD-ARIMA組合模型的相對誤差RE中超過5%的樣本僅占樣本總數(shù)的0.0347,其整體誤差水平基本在5%內(nèi).
3) EMD-ARIMA組合模型預(yù)測效果和精度均優(yōu)于傳統(tǒng)單一的時(shí)間序列預(yù)測方法.在預(yù)測精度和擬合優(yōu)度方面提高了將近15%,平穩(wěn)部分和中高值預(yù)測效果均得到較大幅度提升,其RMSE、MAPE、MAE值(相比單一ARIMA模型)分別下降了31.83%、3.11%、1.69%.
本方法可利用有限數(shù)量樣本,較好模擬出長江干散貨運(yùn)價(jià)指數(shù)周期性不明顯、非線性、非平穩(wěn)的波動(dòng)特性,為長江干線散貨運(yùn)輸市場發(fā)展態(tài)勢預(yù)測提供支持.