范林勝,鄧建新,2,閔 浩,張 琦
(1.廣西大學 制造系統(tǒng)與先進制造技術重點實驗室,廣西 南寧 530004;2.廣西大學 機械工程學院,廣西 南寧 530004)
基于TEI@I方法論的防城港港口吞吐量預測
范林勝1,鄧建新1,2,閔 浩1,張 琦1
(1.廣西大學 制造系統(tǒng)與先進制造技術重點實驗室,廣西 南寧 530004;2.廣西大學 機械工程學院,廣西 南寧 530004)
針對防城港港口吞吐量的波動趨勢,基于TEI@I方法論,提出一種預測防城港港口吞吐量的框架。采用多元線性回歸擬合其線性特征,采用三層BP神經(jīng)網(wǎng)絡模型擬合其非線性特征,并將其結果集成相加得到防城港港口吞吐量的預測模型。實際預測結果表明,這種預測方法有較高預測精度,優(yōu)于單一的預測方法,平均絕對百分比誤差從9.33%下降到1.52%,該方法可為未來防城港的發(fā)展規(guī)劃提供數(shù)據(jù)支撐。
TEI@I方法論;多元線性回歸;BP神經(jīng)網(wǎng)絡;防城港;港口吞吐量;預測
防城港位于廣西南部北部灣北岸,是全國19個樞紐港之一,地處中國—東盟自由貿易區(qū)、泛珠三角經(jīng)濟圈和廣西壯族自治區(qū)北部灣經(jīng)濟區(qū)的結合部,現(xiàn)與世界80個國家的220個港口通商通航。隨著北部灣經(jīng)濟地位的提升、中國—東盟自由貿易區(qū)的進一步發(fā)展以及“一帶一路”的推進,防城港對于西南地區(qū)通往東盟和海外各國的大通道將發(fā)揮越來越重要的作用。當前經(jīng)過防城港港口的經(jīng)濟貿易往來更加頻繁,在2014年,防城港港口的吞吐量為1.15萬t,同比增長8.9%。隨著該港口的物流吞吐量迅猛增長,運輸能力不足、貨物壓港嚴重等問題日漸凸顯,同時,港口吞吐量對周邊地區(qū)的經(jīng)濟發(fā)展也十分重要,在很大程度上能影響一個地區(qū)的投資方向和經(jīng)濟走向。因此,急需科學有效地預測和分析其港口吞吐量,以實現(xiàn)優(yōu)化調度和資源配置、促進運輸系統(tǒng)的高效運作,為港口規(guī)劃建設、確定港口投資規(guī)模提供重要決策信息,從而提高投資效益,促進港口及其所在城市的發(fā)展和經(jīng)濟增長。
針對港口吞吐量的預測,國內外學者開展了大量類似的研究,得到了豐富的研究成果,涉及港口吞吐量、集裝箱量、物流需求量等,提出了多種預測方法或模型,但還鮮見對防城港吞吐量的預測。王景敏等[1]采用三次指數(shù)平滑法預測了廣西北部灣港口物流需求;J.G.de Gooijer等[2]使用多變量時間序列模型預測了安特衛(wèi)普港的交通流量;Chien-Chang Chou[3]運用修改的回歸模型預測了臺灣進口的集裝箱量;C.H.Wei等[4]使用人工神經(jīng)網(wǎng)絡研究預測了高雄港的集裝箱量;M.T.Chou等[5]應用SARIMA模型分析了高雄港的集裝箱量;C.I.Hsu等[6]應用灰色模型預測了航空貨運業(yè)務數(shù)量;Xiao Jin等[7]運用粒子群算法預測了轉移集裝箱吞吐量;Shih-Huang Chen等[8]采用遺傳規(guī)劃預測了集裝箱吞吐量;侯寶燕[9]基于組合預測方法預測了營口物流需求量;黃俊聰[10]基于組合預測方法預測了福州港物流需求量;許利枝等[11]基于TEI@I方法論預測了青島港口的貨運量;Huang Anqiang等[12]使用混合模型預測了青島港口集裝箱吞吐量;Gang Xie等[13]基于LSSVR的混合模型預測了集裝箱吞吐量。傳統(tǒng)的線性回歸和時間序列預測方法雖然易于操作而且簡單,但是預測精度很難達到要求,智能算法在一定程度上能達到預測的精度,但預測對參數(shù)十分敏感,很難就有穩(wěn)定性。TEI@I方法論在處理具有高度波動性和復雜系統(tǒng)的預測問題上(例如原油價格、匯率),取得了很好的預測效果。
港口吞吐量受港口所在區(qū)域的經(jīng)濟產業(yè)發(fā)展的多種因素的影響,具有高度的波動性、復雜性和不確定性,表現(xiàn)出很強的線性和非線性特征。圖1所示為防城港1990-2013的吞吐量數(shù)據(jù),在1990到2004年這段時間,吞吐量增長速率較穩(wěn)定,表現(xiàn)為一定的線性關系,從2005到2013年增長速率不穩(wěn)定,表現(xiàn)為非線性關系,單獨運用線性和非線性模型進行預測,誤差都較大,如對圖1中的數(shù)據(jù)應用指數(shù)模型預測,平均相對誤差在9%左右。為了更準確地預測其吞吐量,本文引入TEI@I框架,定量地分析港口吞吐量的線性和非線性部分,以提高對港口吞吐量的分析能力和預測能力。
圖1 防城港港口歷年吞吐量
TEI@I方法論是汪壽陽等[14]提出的一種針對具有突現(xiàn)性、不穩(wěn)定性、非線性和不確定性等特征的現(xiàn)實復雜系統(tǒng)進行分析的全新研究方法論。該方法基于先分解后集成的思想。首先,用計量經(jīng)濟模型預測線性部分,其次,用人工智能方法,如BP神經(jīng)網(wǎng)絡擬合非線性部分;然后,利用專家預測系統(tǒng)來量化重要事件的影響結果;最后,集成三者的結果,得到一個綜合的預測數(shù)據(jù)。
然而,對于影響防城港港口吞吐量不規(guī)則的事件,如因北部灣經(jīng)濟區(qū)的批準、政府加大投資等,處理難度較大,且不易量化,很難預測,因此,本文暫不考慮不規(guī)則事件對吞吐量的影響,即只基于防城港吞吐量線性和非線性部分進行集成預測,得到一個綜合的預測數(shù)據(jù)。本文建立的基于TEI@I方法的防城港港口吞吐量集成預測框架如圖2所示。
圖2 防城港港口吞吐量集成預測框架
設防城港港口每年的吞吐量實際數(shù)據(jù)為{Yt,t=1,2,3,...}。綜合考慮數(shù)據(jù)的可得性和對防城港港口的實際考察,影響防城港港口吞吐量的可能因素有:防城港市的第一產業(yè)總值、第二產業(yè)總值、第三產業(yè)總值、全年固定資產投資、社會消費品零售總額、進出口總額等。因此,首先用多元線性回歸來擬合防城港港口吞吐量的歷年數(shù)據(jù),產生一個新的預測序列,記為{}:
式(1)中,x1表示防城港市的第一產業(yè)總值,x2為第二產業(yè)總值,x3為第三產業(yè)總值,x4表示全年固定資產投資,x5表示社會消費品零售總額,x6表示進出口總額,a和bi(i=1,2,…,6)是需要確定的預測參數(shù)。
通過分析{Yt}和{}序列,可以得到防城港港口吞吐量的誤差序列,記為{et}。
在此基礎上,應用三層的BP神經(jīng)網(wǎng)絡來擬合得到的誤差序列,如圖3所示,即包含1個輸入層、1個隱含層和1個輸出層,每層都有若干個神經(jīng)元組成,神經(jīng)元的傳遞函數(shù)為S型函數(shù),輸出量是0到1之間的連續(xù)量,權值的調整采用反向傳播(Baekpropagation)學習算法,每個輸入都通過一個適當?shù)臋嘀礧與下一層相連,網(wǎng)絡輸出表示為a=f(WP+c)。其輸入層為式(2)得到的誤差序列,輸入層的節(jié)點個數(shù)N,需要根據(jù)誤差序列數(shù)量的多少來確定,一般不少于3個,如果序列數(shù)據(jù)量大,輸入為3個以上。輸出層為預測得到的吞吐量新誤差,該吞吐量新誤差仍然是一個時間序列,記為{}。
圖3 三層BP神經(jīng)網(wǎng)絡模型
用三層BP神經(jīng)網(wǎng)絡擬合得到的吞吐量誤差序列仍然是一個時間序列,記為{}。實際上{}是一個非線性函數(shù),根據(jù)圖3可以表示為:
其中 fi為第i層網(wǎng)絡的輸出值,Wi為第i層的權值矩陣,P為輸入變量矩陣,ci為閾值(i=1,2,3)。
根據(jù)式(4)確定隱含層數(shù)。
式(4)中,N為輸入層節(jié)點數(shù),L為隱含層節(jié)點數(shù),M為輸出層節(jié)點數(shù),a為0到10之間的常數(shù)。
為了評價預測的性能,本文使用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)作為評價準則,定義為:
式中D為測試周期。
3.1 數(shù)據(jù)來源
綜合分析,影響防城港港口吞吐量的可能相關因素為防城港市的第一產業(yè)總值、第二產業(yè)總值、第三產業(yè)總值、全年固定資產投資等。根據(jù)廣西年鑒及廣西統(tǒng)計信息網(wǎng)(http://www.gxtj. gov.cn/tjsj/tjnj)的相關信息,統(tǒng)計得到防城港港口1990-2013年的吞吐量數(shù)據(jù)及影響吞吐量因素的相關數(shù)據(jù),見表1。
表1 影響防城港港口吞吐量的各項經(jīng)濟指標
3.2 預測模型及預測分析
為了建立預測模型和進行驗證,以下選取1990-2010年數(shù)據(jù)進行模型建立,使用2011-2013年的數(shù)據(jù)為測試樣本數(shù)據(jù),用于檢測預測誤差和評估預測精度。同時,為了評估集成預測模型的性能,還將與二次曲線等獨立預測方法的預測結果進行對比分析。
3.2.1 二次曲線預測。從圖1知,防城港港口1990-2013年吞吐量呈指數(shù)發(fā)展趨勢,可直接建立指數(shù)模型進行預測。根據(jù)1990-2010年的數(shù)據(jù),利用Excel求解,可以得到對應的指數(shù)擬合模型為
3.2.2 多元線性回歸模型。按照圖1所示的框架,首先使用多元回歸模型進行防城港吞吐量的預測分析,處理其線性部分的特征。
使用SPSS20,輸入1990-2010年防城港市的第一產業(yè)總值(x1)、第二產業(yè)總值(x2)、第三產業(yè)總值(x3)、全年固定資產投資(x4)、社會消費品零售總額(x5)、進出口總額(x6)的數(shù)據(jù),作為多元線性回歸的訓練樣本,采用逐步進入的方式,選入P≤0.05,剔除標準P≥0.10得到的進入變量和對應的系數(shù),求解結果見表2、表3。
表2 模型概要
表3 模型系數(shù)
從表2可以看出R2為0.990,擬合效果較好,從表3中得到對應多元線性回歸模型為:
從模型可以看出,吞吐量主要與第三產業(yè)總值、全年固定資產投資直接相關,這與陳濤燾等[15]得出的結論相一致。這是因為防城港及其周邊地區(qū)第一產業(yè)和第二產業(yè)一直薄弱,而且需求比較穩(wěn)定,在1990至2010年前沒有大量大型企業(yè)投產,產生的需求不大。2012年后,防城港才開始了千億元產業(yè)園的建立,如防城港鋼鐵項目,但目前這些企業(yè)仍未投產,因此對其吞吐量影響不夠明顯。
把2011-2013年防城港港口的吞吐量作為測試樣本,結果見表4。
表4 測試樣本的誤差值
根據(jù)式(1)得到誤差序列,將得到的預測誤差序列制作成散點圖,如圖4所示。
圖4 多元線性回歸預測誤差散點圖
從圖4中可以看出,得到的多元線性回歸預測誤差不穩(wěn)定、呈非線性特征。
3.3 BP神經(jīng)網(wǎng)絡
根據(jù)前面已建立好的三層BP神經(jīng)網(wǎng)絡模型,使用Matlab求解計算實現(xiàn)時,首先將得到得多元線性預測值標準化處理,其中e*t為標準化的多元線性回歸預測誤差值,et為多元線性回歸預測誤差值,h和g分別是多元線性回歸預測誤差值中的最大值和最小值,設置學習目標誤差值為0.000 1,訓練最大次數(shù)為2 000次。其它的網(wǎng)絡參數(shù)確定過程如下:
(1)輸入層節(jié)點數(shù)。由于數(shù)據(jù)的有限性,確定該實例中的輸入層節(jié)點為3個,即將相鄰三年誤差序列作為一組輸入數(shù)據(jù),如將1990、1991、1992年多元線性回歸預測模型的誤差序列為第一組輸入數(shù)據(jù),將1991、1992、1993作為第二組輸入等。
(2)隱含層節(jié)點數(shù)。參考式(4),用逐一試算法確定最佳的節(jié)點數(shù),經(jīng)過試算,該實例預測隱含層節(jié)點數(shù)為4。
(3)輸出層節(jié)點數(shù)。本文將擬合的誤差序列作為輸出值,即輸出節(jié)點數(shù)為1。
(4)轉換和學習函數(shù)。第一層的轉化函數(shù)選為logsig,第二層的轉化函數(shù)選為purelin,學習函數(shù)選為traimlm。
(5)訓練樣本集。樣本集選為1990-2010年多元線性回歸預測模型的誤差序列。
(6)測試樣本集。測試樣本選為2011、2012和2013年多元線性回歸預測模型的誤差序列。
最后得到以下擬合曲線,如圖5所示,其中橫軸表示誤差序列組,縱軸表示標準化后的預測誤差值或者真實值。
從運行結果可以得出,最后3個點的測試平均絕對百分比誤差分別為57.55%、24.69%、2.86%,隨著樣本量的提高,絕對誤差會逐漸降低。
圖5 BP神經(jīng)網(wǎng)絡擬合數(shù)值與真實值的比較
3.4 綜合集成與單一預測比較
將多元線性回歸擬合值E^t與BP神經(jīng)網(wǎng)絡值I^t求和,得到綜合預測結果Y^t,預測結果見表5。
從表5可以看出,指數(shù)回歸模型預測、單一多元線性回歸預測與集成模型預測的平均絕對百分比誤差分別為9.33%、6.78%和1.52%。它們的均方根誤差分別為1 058.997、290.35和239.60。無論是預測的準確性還是穩(wěn)定性,綜合集成預測的結果都大大高于單一模型的預測。這也充分說明了集成預測適合防城港港口吞吐量預測。
防城港的吞吐量近年不斷增加,波動較大,有明顯的線性和非線性特征,本文基于TEI@I集成理論框架,提出防城港港口吞吐量的預測模型,模型將吞吐量的線性部分通過多元線性回歸進行擬合,非線性部分轉化為線性部分的預測誤差,通過BP神經(jīng)網(wǎng)絡進行建模預測,該模型框架操作簡單,不存在復雜的數(shù)據(jù)處理。由實際預測可知,目前防城港的吞吐量主要與第三產業(yè)總值、全年固定資產投資直接相關,從預測的效果可以看出,所提出的模型可較好地用于防城港港口吞吐量的預測,在平均絕對誤差和平方誤差上都優(yōu)于單一的多元線性回歸模型和直接的非線性預測,能較好地適應防城港吞吐量的波動趨勢,可為港口運營管理和相關部門投資決策等提供更準確的依據(jù)。
表5 指數(shù)回歸模型和多元線性回歸模型與集成模型的比較
[1]王景敏,朱芳陽,隋博文,等.廣西北部灣港口物流需求預測及發(fā)展模式研究[J].物流科技,2010,(12):26-28.
[2]Gooijer J G de,Klein A.Forecasting the Antwerp maritime steel traffic flow:A case study[J].Journal of Forecasting,1989,8(4):381-398.
[3]Chou C,C Chu,G Liang.A modified regression model for forecasting the volumes of Taiwan's import containers[J].Mathematical and Computer Modelling,2008,47(9-10):797-807.
[4]Wei C H,Yang Y C.A study on transit containers forecast in Kaohsiung port-applying artificial neural networks to evaluating input variables[J].Journal of the Chinese Institute of Transportation,1999,11(3): 1-20.
[5]Chou M T,Lee H S,Lin K.A study of forecasting the volume of trans and the harbor operation for port of Kaohsiung[J].Journal of Maritime Sciences,2003,12(1):235-250.
[6]Hsu C I,Wen Y H.Applying grey forecast models to predict international air travel demand for Taiwan area[J].Transportation Planning Journal,1997,6(3):525-555.
[7]Xiao Jin,Xiao Yi,Fu Ju Lei,et.al.A transfer forecasting model for container throughput guided by discrete pso[J].系統(tǒng)科學與復雜性(英文版),2014,27(1):181-192.
[8]Chen S,J Chen.Forecasting container throughputs at ports using genetic programming[J].Expert Systems with Applications,2010,37(3):2 054-2 058.
[9]侯寶燕.基于組合預測法的營口港物流需求預測研究[D].大連:大連交通大學,2013.
[10]黃俊聰.基于組合方法的港口物流需求預測研究[D].福州:福建農林大學,2009.
[11]許利枝,汪壽陽.港口物流預測研究:基于TEI@I方法論[J].交通運輸系統(tǒng)工程與信息,2012,(1):173-179.
[12]Anqiang Huang,Kinkeung Lai,Yinhua Li,Shouyang Wang.Forecastingcontainer throughput of Qingdao port with a hybrid model[J]. Journal of Systems Science and Complexity,2015,28(1):105-121.
[13]Xie Gang,Wang Shouyang,Zhao Yingxue,etal.Hybrid approaches based on LSSVR model for container throughput forecasting:A comparative study[J].Applied Soft Computing Journal,2013,13(5):2 232-2 241.
[14]Wang S Y,Yu L,Lai K K.Crude oil price forecasting with TEI@I methodology[J].Journal of Systems Science and Complexity,2005,18 (2):145-166.
[15]陳濤燾,高琴.港口集裝箱吞吐量影響因素研究[J].武漢理工大學學報(信息與管理工程版),2008,(6):991-994,1 003.
Throughput Forecasting of Fangcheng Port Based on TEI@I Methodology
Fan Linsheng1,Deng Jianxin1,2,Min Hao1,Zhang Qi1
(1.Guangxi Key Laboratory of Manufacturing System&Advanced Manufacturing Technology,Guangxi University,Nanning 530004; 2.School of Mechanical Engineering,Guangxi University,Nanning 530004,China)
In this paper,in view of the fluctuation of the throughput of the Fangcheng Port,and based on the TEI@I methodology,we proposed a framework for the forecasting of the throughput of the port,built the corresponding throughput forecasting model and through an empirical test,showed that the method could yield more accurate result and reduce the average absolute error from 9.33%to 1.52%.
TEI@I methodology;multiple linear regression;BP neural network;Fangcheng Port;port throughput;forecasting
U691.71;F224
A
1005-152X(2015)10-0075-05
2015-08-25
廣西自然科學基金項目“面向資源利用優(yōu)化的物流業(yè)務協(xié)同感知模型研究”(2014GXNSFBA118281)
范林勝(1989-),男,廣西桂林人,廣西大學機械工程學院碩士研究生,主要研究方向:物流工程;鄧建新(1979-),男,四川廣元人,博士,副教授,主要研究方向:制造系統(tǒng)及其信息學、物流信息學;閔浩(1989-),男,湖北仙桃人,廣西大學機械工程學院碩士研究生,主要研究方向:物流作業(yè)流程管理和智能化決策系統(tǒng);張琦(1989-),男,河南信陽人,廣西大學機械工程學院碩士研究生,主要研究方向:物流信息化。
10.3969/j.issn.1005-152X.2015.10.022