王振振, 萇道方, 朱宗良, 羅 天
(上海海事大學(xué) 物流科學(xué)與工程研究院, 上海 201306)
隨著“一帶一路”新型經(jīng)濟(jì)帶的提出,我國(guó)海運(yùn)業(yè)發(fā)展日益蓬勃,集裝箱運(yùn)輸方式已成為海洋運(yùn)輸?shù)臉?biāo)志。與此同時(shí)港口作為“一帶一路”的重要節(jié)點(diǎn),在“一帶一路”建設(shè)中有著舉足輕重的作用,港口集裝箱吞吐量不僅是港口地區(qū)經(jīng)濟(jì)發(fā)展的晴雨表,更標(biāo)志著一個(gè)港口在國(guó)際經(jīng)濟(jì)貿(mào)易中的地位。[1]因此,利用有效的數(shù)學(xué)方法對(duì)港口集裝箱吞吐量進(jìn)行精準(zhǔn)預(yù)測(cè),是對(duì)港口未來(lái)的規(guī)劃發(fā)展做出科學(xué)決策的重要前提。
自20世紀(jì)80年代起,關(guān)于港口集裝箱吞吐量預(yù)測(cè)方面的研究很多,國(guó)內(nèi)外學(xué)者提出多種預(yù)測(cè)方法,如時(shí)間序列預(yù)測(cè)法[2-3]、TEI@I方法論[4]、灰色模型法[5-6]、支持向量回歸機(jī)法[7]、神經(jīng)網(wǎng)絡(luò)法[8]和組合模型法[9-11]等。一方面大部分單一模型的預(yù)測(cè)精度較低,而組合模型建模求解過(guò)程較復(fù)雜,在實(shí)際應(yīng)用中難以發(fā)揮理想效果;另一方面,大部分文獻(xiàn)集中于研究年度集裝箱吞吐量預(yù)測(cè),沒(méi)有對(duì)季度數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,無(wú)法準(zhǔn)確地掌握港口集裝箱吞吐量的季度發(fā)展規(guī)律,僅有少量文獻(xiàn)考慮月度數(shù)據(jù),但沒(méi)有深入分析各月份吞吐量對(duì)總體吞吐量的影響程度。與以往的研究相比,本文的做法:首先用加權(quán)灰色關(guān)聯(lián)分析對(duì)各季度影響總體吞吐量的程度進(jìn)行排序;然后利用三次指數(shù)平滑法對(duì)該港口集裝箱季度吞吐量進(jìn)行初值預(yù)測(cè),并結(jié)合馬爾科夫模型修正初值,改善其對(duì)轉(zhuǎn)折點(diǎn)的不適應(yīng)所造成的誤差,提高預(yù)測(cè)精度;最后與傳統(tǒng)三次指數(shù)平滑法和灰色模型法的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,充分證明所提組合模型的預(yù)測(cè)效果更好,可為港口經(jīng)營(yíng)發(fā)展提供決策支持。
設(shè)X={xσ|σ=0,1,2,…,m}為序列關(guān)聯(lián)因子集,X0為參考函數(shù),Xi為比較函數(shù),xσ(k)為xσ在第k點(diǎn)的值,其中k=1,2,3,…,n。
設(shè)x=(x(1),x(2),x(3),…,x(n))的累減生成序列為
x′=(x′(1),x′(2),x′(3),…,x′(n))
(1)
其計(jì)算方法為
x′(1)=x(1),x′(k)=x(k)-x(k-1),k=2,3,…,n
(2)
對(duì)于x0、xi
令
(3)
式(3)中:ζi(k)為關(guān)聯(lián)系數(shù),即第k時(shí)刻比較曲線xi對(duì)于參考曲線x0的相對(duì)差值;兩個(gè)層級(jí)的最大差為maxi∈mmaxk∈n|x0(k)-xi(k)|;ε為分辨系數(shù);λ1為位移加權(quán)系數(shù);λ2為變化率加權(quán)系數(shù),均取0.5。ε取值過(guò)大或過(guò)小都可能導(dǎo)致相關(guān)參數(shù)產(chǎn)生誤差,最終影響模型的準(zhǔn)確度。許多文獻(xiàn)表明:ε較為合理的取值為0.5或0.6,此時(shí)不僅計(jì)算簡(jiǎn)單,而且可信度較高,本文取ε= 0.5。[12]
xi對(duì)于x0的加權(quán)灰色關(guān)聯(lián)度γi為
(4)
式(4)中:βk為因子k常態(tài)化的權(quán)重系數(shù),通過(guò)白化權(quán)函數(shù)來(lái)確定[12],過(guò)程如下:
設(shè)白化權(quán)函數(shù)為
f(x)=xe1-x+(1-x)ex-1
(5)
已知序列為
xi(k)=(xi(1),…,xi(2),…,xi(k),xi(n)),
i=1,2,…,n
(6)
1) 求各序列中屬性因子總和為
(7)
2) 求因子熵為
(8)
3) 求熵總和為
(9)
4) 求相對(duì)權(quán)重為
(10)
5) 利用正規(guī)化法求各因子權(quán)重為
(11)
選取深圳港2012—2017年各季度集裝箱吞吐量數(shù)據(jù)見(jiàn)表1,對(duì)其進(jìn)行季度灰色加權(quán)關(guān)聯(lián)分析,旨在找出該港口集裝箱季度吞吐量發(fā)展變化規(guī)律。
設(shè)該港口每年的集裝箱吞吐量為參考序列如下:
x0=(2 101.69,2 096.70,2 401.77,2 369.78,
2 283.23,2 460.49)
(12)
不同季度對(duì)應(yīng)的集裝箱吞吐量為比較序列xi(i=1,2,3,4),由式(3)可得每年度集裝箱吞吐量總數(shù)與各季度吞吐量的關(guān)聯(lián)系數(shù)矩陣為
(13)
式(13)中:ξ1、ξ2、ξ3、ξ4分別為第一、第二、第三、第四季度的關(guān)聯(lián)系數(shù)。
通過(guò)上述白化權(quán)函數(shù)求得各因子權(quán)重為β1=0.172、β2=0.172、β3=0.162、β4=0.163、β5=0.166、β6=0.165,由式(2)可得每年度集裝箱吞吐量總數(shù)與各季度吞吐量的加權(quán)關(guān)聯(lián)度為
表1 深圳港2012—2017各季度集裝箱吞吐量 萬(wàn)TEU
(14)
式(14)中:γ1、γ2、γ3、γ4分別為第一、第二、第三、第四季度的關(guān)聯(lián)度。
由式(14)可知:γ3>γ4>γ2>γ1,即第三季度與年度總數(shù)的關(guān)聯(lián)度最大,其次是第四季度、第二季度,這兩個(gè)季度的影響度接近,關(guān)聯(lián)度最低的是第一季度。這與直觀對(duì)數(shù)據(jù)分析的結(jié)果一致,表明每年從第一季度開始深圳港集裝箱吞吐量逐漸遞增,在第三季度達(dá)到峰值,第四季度稍稍回落到與第二季度接近的水平,而來(lái)年第一季度吞吐量又迅速降低。根據(jù)量化結(jié)果,深圳港在未來(lái)的規(guī)劃發(fā)展中應(yīng)依據(jù)此規(guī)律,制定有效計(jì)劃,合理規(guī)劃交通、資源配置等問(wèn)題。
指數(shù)平滑法是特殊的移動(dòng)平均法,其特點(diǎn)在于對(duì)過(guò)去的觀測(cè)值分配不一樣的權(quán)重,新數(shù)據(jù)給予較大的權(quán)重,舊數(shù)據(jù)給予較小的權(quán)重,預(yù)測(cè)值是以前觀測(cè)值的加權(quán)和。指數(shù)平滑預(yù)測(cè)法包括3種,其中:一次指數(shù)平滑法適合無(wú)趨勢(shì)的平穩(wěn)時(shí)間序列;二次指數(shù)平滑法適合呈線性趨勢(shì)的時(shí)間序列;三次指數(shù)平滑預(yù)測(cè)法適用于不規(guī)則、呈非線性趨勢(shì)的時(shí)間序列。港口集裝箱吞吐量受國(guó)家政策、周邊經(jīng)濟(jì)發(fā)展?fàn)顩r和自然環(huán)境等因素影響,導(dǎo)致其具有明顯的非線性特征。因此,使用三次指數(shù)平滑法來(lái)對(duì)其進(jìn)行初值預(yù)測(cè)。三次指數(shù)平滑公式[13]為
(15)
第t+m期的預(yù)測(cè)值為
(16)
式(16)中:m為預(yù)測(cè)步長(zhǎng),取正整數(shù)1,2,3,…。其中預(yù)測(cè)參數(shù)為
(17)
一般情況下確定平滑初值有兩種方式:
1) 當(dāng)數(shù)據(jù)量較多時(shí),應(yīng)取
(18)
2) 當(dāng)數(shù)據(jù)量較少時(shí),一般選取最初三期的平均數(shù)作為初值,即
(19)
另外,選取合適的平滑系數(shù)對(duì)于建立平滑模型非常關(guān)鍵。若數(shù)據(jù)波動(dòng)較大,為提高預(yù)測(cè)精度,應(yīng)將α值取大一些,以增加近期數(shù)據(jù)的權(quán)重;若數(shù)據(jù)波動(dòng)平穩(wěn),則α值應(yīng)取小一些。
當(dāng)數(shù)據(jù)量較多時(shí),可編制通用化程序,計(jì)算動(dòng)態(tài)平滑系數(shù);當(dāng)數(shù)據(jù)量較少時(shí),一般采用試算法確定α值,即先根據(jù)自身數(shù)據(jù)變化趨勢(shì)來(lái)大致確定取值范圍,再根據(jù)取值范圍選取不同的α值進(jìn)行試算,將預(yù)測(cè)誤差平方和最小的α選為最終參數(shù)。誤差平方和最小公式為
(20)
ES-Markov模型結(jié)合三次指數(shù)平滑法與馬爾科夫模型,首先利用三次指數(shù)平滑法得出初始預(yù)測(cè)值,再用馬爾科夫原理得到狀態(tài)轉(zhuǎn)移矩陣,修正初始預(yù)測(cè)值,以此提高預(yù)測(cè)精度。以下為具體步驟。
2.2.1計(jì)算精確度[14]
精確度為實(shí)際值與三次指數(shù)平滑預(yù)測(cè)初值之比,即
(21)
2.2.2狀態(tài)區(qū)間劃分
通過(guò)簡(jiǎn)單層次聚類將精確度劃分為n個(gè)狀態(tài),其狀態(tài)區(qū)間表示為Ei=[Ei1,Ei2],其中:Ei1、Ei2分別為狀態(tài)Ei的上下限,總的精確度集合為E= (E1,E2,…,En)。
2.2.3構(gòu)建狀態(tài)轉(zhuǎn)移概率矩陣
狀態(tài)轉(zhuǎn)移概率Pij(k)計(jì)算為
(22)
式(22)中:Pij(k)為客觀事物經(jīng)一種狀態(tài)轉(zhuǎn)移至另一種狀態(tài)發(fā)生的概率,其中Mi為Ei狀態(tài)的原始數(shù)據(jù)數(shù)量;Mij(k)為Ei經(jīng)過(guò)k步轉(zhuǎn)移至狀態(tài)Ej的原始數(shù)據(jù)數(shù)量,處于樣本序列末尾的Mi不計(jì)入算式。
狀態(tài)轉(zhuǎn)移矩陣由狀態(tài)轉(zhuǎn)移概率組成,其代表著客觀事物在t時(shí)刻所處狀態(tài)轉(zhuǎn)變?yōu)?t+1)時(shí)刻所處狀態(tài)時(shí)的條件概率矩陣,其表達(dá)式為
(23)
2.2.4確定預(yù)測(cè)時(shí)刻轉(zhuǎn)移狀態(tài)
馬爾科夫鏈具有無(wú)后效性,即轉(zhuǎn)移的發(fā)生只與當(dāng)前狀態(tài)有關(guān),假設(shè)預(yù)測(cè)對(duì)象處于Ei狀態(tài),則僅考察當(dāng)前狀態(tài)轉(zhuǎn)移概率矩陣第i行狀態(tài)向量P(t),若第j列概率值最大,則預(yù)測(cè)對(duì)象下一時(shí)刻最有可能轉(zhuǎn)向Ej狀態(tài)。
2.2.5修正預(yù)測(cè)初值
超聲波模塊固定在小車的正前方,用來(lái)檢測(cè)正前方的障礙物。在這里筆者選用的型號(hào)是US-100,其測(cè)距范圍為2cm-450cm,自帶溫度傳感器可以自動(dòng)對(duì)測(cè)試結(jié)果進(jìn)行校正,具有電平輸出和UART輸出兩種輸出方式,小車使用的是電平輸出。該模塊具有五個(gè)端子,1號(hào)端子接VCC電源;4號(hào)和5號(hào)端子接外部電路的地;2號(hào)端子為 Trig端;3號(hào)端子為 Echo端。需要測(cè)距時(shí),單片機(jī)會(huì)從Trig管腳輸入一個(gè)10微秒以上的高電平,系統(tǒng)會(huì)發(fā)出8個(gè)40KHz的超聲波脈沖,然后檢測(cè)回波信號(hào),經(jīng)過(guò)溫度校正后,將結(jié)果通過(guò)Echo管腳輸出[3]。
首先確定預(yù)測(cè)對(duì)象下一步轉(zhuǎn)移到狀態(tài)Ei,然后結(jié)合三次指數(shù)平滑法所得初值和所處狀態(tài)確定組合預(yù)測(cè)優(yōu)化值yt。
(24)
設(shè)置以下3個(gè)檢驗(yàn)精度的指標(biāo):
1) 將t時(shí)刻實(shí)際值與預(yù)測(cè)值的相對(duì)誤差記為δ(t),其表達(dá)式為
(25)
2) 將所有時(shí)刻的平均絕對(duì)百分誤差記為(Mean Absolute Percentage Error, MAPE),其表達(dá)式為
(26)
3) 將所有時(shí)刻的均方根誤差記(Root Mean Square Error, RMSE),其表達(dá)式為
(27)
以2012—2016年深圳港集裝箱季度吞吐量作為原始數(shù)據(jù),如表1所示。首先使用三次指數(shù)平滑法、組合預(yù)測(cè)優(yōu)化模型分別對(duì)數(shù)據(jù)進(jìn)行擬合,再預(yù)測(cè)2017年4個(gè)季度的集裝箱吞吐量,并將預(yù)測(cè)值與實(shí)際值進(jìn)行對(duì)比。
首先確定平滑初值,由于本文數(shù)據(jù)量只有20個(gè),而初始值對(duì)預(yù)測(cè)值影響較大,因此,采用前3個(gè)數(shù)據(jù)的平均數(shù)作為初始值,即
(28)
本文利用MATLAB,首先選取幾個(gè)大致區(qū)間臨界值代入進(jìn)行試算,找出誤差平方和最小的區(qū)間,再?gòu)脑搮^(qū)間內(nèi)找到使誤差平方和最小的α值,經(jīng)過(guò)計(jì)算,確定α=0.1時(shí)預(yù)測(cè)誤差最小。
通過(guò)三次指數(shù)平滑模型得出預(yù)測(cè)結(jié)果,由于篇幅所限,各季度對(duì)應(yīng)的平滑值與參數(shù)無(wú)法全部展示。主要預(yù)測(cè)2016年之后的集裝箱吞吐量,因此,取t=20,根據(jù)式(16)可得a20=598.140 1,b20=3.81,c20=0.042 7,根據(jù)式(16)得到三次平滑預(yù)測(cè)式為
(29)
由式(29)得出2017年4個(gè)季度的3次平滑預(yù)測(cè)初值分別為601.99萬(wàn)TEU、605.93萬(wàn)TEU、609.95萬(wàn)TEU、614.06萬(wàn)TEU。
3.2.1劃分狀態(tài)區(qū)間
根據(jù)三次指數(shù)平滑法的初步預(yù)測(cè)結(jié)果,可得到預(yù)測(cè)初值的精確度序列,通過(guò)簡(jiǎn)單層次聚類,將精確度序列劃分為(0.854 2,0.939)、(0.939,1.032 8)、(1.032 8,1.126 6)、(1.126 6,1.220 4)等4個(gè)狀態(tài),各季度集裝箱吞吐量所處狀態(tài)見(jiàn)表2。
表2 各預(yù)測(cè)模型擬合精度對(duì)比與狀態(tài)劃分
3.2.2預(yù)測(cè)狀態(tài)向量及預(yù)測(cè)值計(jì)算
通過(guò)式(24)得到由Markov優(yōu)化后的2012—2016年吞吐量組合預(yù)測(cè)值如表2所示。根據(jù)馬爾科夫預(yù)測(cè)原理,得到1步轉(zhuǎn)移矩陣P1為
(30)
由于2016年第四季度處于狀態(tài)E3,由P1可知2017年第一季度預(yù)測(cè)狀態(tài)向量P(1)=(1/5,2/5,1/5,1/5),則2017年第一季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預(yù)測(cè)值為593.50萬(wàn)TEU;此時(shí)再求出二步轉(zhuǎn)移矩陣P2=(P1)2,得到2017年第二季度預(yù)測(cè)狀態(tài)向量P(2)=(21/160,169/320,9/40,37/320),則2017年第二季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預(yù)測(cè)值為597.39萬(wàn)TEU;同理,2017年第三季度預(yù)測(cè)狀態(tài)向P(3)=(390/2 203,950/2 753,587/1 600,646/5 819),則2017年第三季度集裝箱吞吐量最有可能處于狀態(tài)E3,求出組合預(yù)測(cè)值為658.57萬(wàn)TEU;同理,2017年第四季度預(yù)測(cè)狀態(tài)向量P(4)=(860/4 879,167/464,583/1 678,287/2 466),則該港口2017年第四季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預(yù)測(cè)值為605.40萬(wàn)TEU。
由表2可知:相比傳統(tǒng)的三次指數(shù)平滑模型、灰色預(yù)測(cè)模型,組合優(yōu)化模型使相對(duì)誤差都降至5%以下,再計(jì)算出各模型的平均相對(duì)百分誤差及均方根誤差,見(jiàn)表3。
表3 各模型精度檢驗(yàn)結(jié)果
由表3可知:組合模型所得平均相對(duì)百分誤差(MAPE)相比灰色模型降低4.21%,比三次指數(shù)平滑模型降低4.97%;組合模型所得均方根誤差(RMSE)相比灰色模型降低29.56,比三次指數(shù)平滑模型降低36.55,預(yù)測(cè)精度大幅提高。2012—2017年的實(shí)際值與3種模型的預(yù)測(cè)值對(duì)比見(jiàn)圖1,可看出相對(duì)于傳統(tǒng)的三次指數(shù)平滑模型和灰色預(yù)測(cè)模型,組合模型的預(yù)測(cè)曲線與實(shí)際值曲線更加吻合,模型效果更優(yōu)。
圖1 3種模型預(yù)測(cè)結(jié)果對(duì)比圖
本文使用加權(quán)灰色關(guān)聯(lián)分析和ES-Markov組合模型,對(duì)深圳港2012—2017年集裝箱季度吞吐量數(shù)據(jù)進(jìn)行定量研究,結(jié)果表明:港口集裝箱吞吐量存在季節(jié)性波動(dòng),組合預(yù)測(cè)模型能很好地適應(yīng)其發(fā)展變化規(guī)律,且預(yù)測(cè)精度和擬合度較高,同時(shí)建模相對(duì)簡(jiǎn)單、易于實(shí)現(xiàn),可為港口未來(lái)的決策規(guī)劃提供新思路。