張華春, 黃有方, 胡堅堃
(上海海事大學 物流科學與工程研究院,上海 201306)
基于GRA-TOOPSO-LSSVM的港口吞吐量預測
張華春, 黃有方, 胡堅堃
(上海海事大學 物流科學與工程研究院,上海 201306)
為對港口吞吐量進行科學預測,在最小二乘支持向量機(Least Squares Support Vector Machine, LSSVM)基礎上,引入灰色關聯(lián)分析(Grey Relational Analysis, GRA)和二階振蕩粒子群優(yōu)化(Two-Order Oscillating Particle Swarm Optimization, TOOPSO),提出一種新的GRA-TOOPSO-LSSVM算法預測港口吞吐量.采用GRA法篩選出對上海港吞吐量有重大影響的因素,并將其作為LSSVM的輸入變量;采用TOOPSO法對LSSVM的參數(shù)進行尋優(yōu);運用LSSVM非線性映射的優(yōu)勢對上海港吞吐量進行預測.在上海港吞吐量實證研究的過程中,GRA-TOOPSO-LSSVM算法與TOOPSO-LSSVM和基于交叉驗證的LSSVM算法進行對比分析.研究結(jié)果表明,GRA-TOOPSO-LSSVM算法具有更好的預測精度和收斂速度,為港口吞吐量預測的研究提供了一種新的方法.
最小二乘支持向量機(LSSVM); 灰色關聯(lián)分析(GRA); 二階振蕩粒子群優(yōu)化(TOOPSO); 吞吐量預測
隨著“一帶一路”國家戰(zhàn)略的推廣,港口作為國際物流的重要節(jié)點,其作用將逐漸得以凸顯.長江經(jīng)濟帶及國際航運中心建設的不斷推進,國際經(jīng)濟形勢呈現(xiàn)出的L型發(fā)展和周期性弱化趨勢使影響港口物流量的因素不斷涌現(xiàn).在這種形勢下,需要新的模型和方法對港口發(fā)展進行有效預測.
預測港口吞吐量的方法很多,主要有時間序列分析法[1]、回歸分析法[2]、灰色預測法[3]、神經(jīng)網(wǎng)絡法[4-5]、支持向量機(Support Vector Machine, SVM)[6-8]、最小二乘支持向量機(Least Squares SVM, LSSVM)[9-10]等.時間序列分析法和回歸分析法都是線性模型,無法全面反映港口吞吐量與影響因素之間的非線性關系;利用灰色預測法預測時不需要大量的樣本,計算十分簡單;神經(jīng)網(wǎng)絡法具有非線性映射特點,其自適應性和自學習特性可以揭示港口吞吐量與影響因素間的非線性關系,但極易陷入局部極小值,泛化能力差;SVM基于結(jié)構(gòu)風險最小化原理構(gòu)造算法,其具有的良好泛化能力有利于獲得全局最優(yōu)解;LSSVM利用最小二乘算法取代標準二次優(yōu)化算法,簡化了計算過程,提高了學習速度,適用于港口吞吐量預測研究.
基于前人的研究,考慮到目前港口吞吐量影響因素逐漸增多、波動性加劇的特點,提出基于灰色關聯(lián)分析(Grey Relational Analysis, GRA)和二階振蕩粒子群優(yōu)化(Two-Order Oscillating Particle Swarm Optimization, TOOPSO)[11-14]的LSSVM (GRA-TOOPSO-LSSVM)模型預測港口吞吐量.通過對上海港吞吐量的實證研究檢驗該方法的有效性.
1.1 GRA
GRA是對一個系統(tǒng)發(fā)展變化態(tài)勢的定量描述和比較的方法,其基本思想是通過確定參考數(shù)列與若干個比較數(shù)列的幾何形狀差別程度來判斷其聯(lián)系是否緊密,可用于分析物流系統(tǒng)內(nèi)各因素間的關聯(lián)程度.步驟如下:
步驟1 確定y(t)(t=1,2,…,l)(本文為集裝箱吞吐量數(shù)列)為反映系統(tǒng)行為特征的參考數(shù)列,x1(t),x2(t),…,xn(t)為n個影響系統(tǒng)行為特征的比較數(shù)列.
步驟3 計算參考數(shù)列y(t)與比較數(shù)列xi(t)的關聯(lián)系數(shù).
(1)
步驟4 計算關聯(lián)度.
(2)
式中0 步驟5 關聯(lián)度Ri排序.按Ri從大到小對n個數(shù)列進行排序,xi(t)排位越靠前,其與y(t)的關聯(lián)程度越強. 1.2 TOOPSO對LSSVM參數(shù)的優(yōu)化 選徑向基函數(shù)為核函數(shù),LSSVM需確定對其預測精度有極大影響的正則化參數(shù)γ和核函數(shù)參數(shù)δ2.TOOPSO將振蕩環(huán)節(jié)引入進化過程,利用前一代粒子信息,增強算法多樣性與全局收斂性.采用TOOPSO尋找最優(yōu)參數(shù)γ和δ2的步驟如下: 步驟1 初始化粒子群.令m為粒子群體規(guī)模,c1和c2為模型加速系數(shù),wmax和wmin分別為最大和最小慣性權(quán)重,tmax為最大迭代次數(shù).把γ和δ2當作粒子初始位置和速度,并將γ作為個體最優(yōu)位置. 步驟2 確定適應度函數(shù).LSSVM本質(zhì)上是尋求經(jīng)驗誤差與泛化能力之間的最佳平衡點,使該點結(jié)構(gòu)誤差最小化.為提高模型預測的精度,將N組樣本分成2部分,前m組用來訓練模型,后n組用來檢驗模型的預測能力.適應度函數(shù)為 (3) 式中:等號右邊的兩項分別為訓練誤差和檢驗誤差;ym,i和f(xm,i)分別為訓練樣本實際值和預測值;yn,j和f(xn,j)分別為檢驗樣本實際值和預測值. 步驟3 更新粒子最優(yōu)位置.按式(3)計算各粒子適應度值,并確定初始全局最優(yōu)位置.粒子i(i=1, 2, …,m)的更新速度和位置分別為 vi(t+1)=wvi(t)+c1r1(pI-(1+ε1)xi(t)+ε1xi(t-1))+c2r2(pG- (1+ε2)xi(t)+ε2xt(t-1)) (4) xi(t+1)=xi(t)+vi(t+1) (5) 式中:t為迭代次數(shù);pI和pG分別為粒子個體和粒子全局最優(yōu)位置;r1和r2為[0,1]上的隨機數(shù);ε1和ε2為振蕩參數(shù).當t 當t≥tmax時, 更新粒子個體最優(yōu)位置pI為min(f(xi),f(pI)),更新粒子全局最優(yōu)位置pG為min(f(pI),f(pG)),慣性權(quán)重w為 (6) 若所有粒子迭代次數(shù)滿足預先設定值,則停止計算(此時,全局最優(yōu)位置為LSSVM的最優(yōu)參數(shù)γ*和δ2*);否則轉(zhuǎn)步驟2. 步驟4 利用最優(yōu)參數(shù)γ*和δ2*建立LSSVM模型,并計算港口吞吐量. 1.3 GRA-TOOPSO-LSSVM模型計算流程 在GRA-TOOPSO-LSSVM預測算法中,用GRA法分析各因素的影響程度,用TOOPSO法確定LSSVM的最優(yōu)參數(shù).GRA-TOOPSO-LSSVM港口吞吐量預測模型計算流程見圖1. 圖1 GRA-TOOPSO-LSSVM港口吞吐量預測模型計算流程 由圖1可知,港口吞吐量預測過程分3步:(1)利用GRA法確定輸出變量和輸入變量.1995—2014年的數(shù)據(jù)樣本被歸一化到[0,1]區(qū)間并分成2組,前15年數(shù)據(jù)作為訓練樣本,后5年數(shù)據(jù)作為檢驗樣本.(2)選取適當?shù)腖SSVM核函數(shù),設置初始核函數(shù)參數(shù),用訓練樣本對LSSVM進行訓練,通過TOOPSO確定LSSVM的最優(yōu)參數(shù)γ*和δ2*.(3)利用最優(yōu)參數(shù)γ*和δ2*建立港口吞吐量預測模型并進行預測,利用檢驗樣本驗證模型的有效性. 選擇1995—2014年上海港相關數(shù)據(jù)進行實證研究,比較分析上海港吞吐量的變化情況. 2.1 輸出輸入變量的確定 2.1.1 輸出變量的確定 對港口吞吐量規(guī)模有重要影響的分別為集裝箱吞吐量(Y1)和港口貨物吞吐量(Y2).通過MATLAB編程分別分析1995—2014年Y1和Y2與上海市進出口總額(Y3)的關聯(lián)度,結(jié)果為:Y3與Y1的關聯(lián)度為0.895 2,遠遠大于Y3與Y2的關聯(lián)度0.646 0.因此,與Y2相比,Y1更能反映上海港吞吐量情況.同時,Y1不僅能反映港口現(xiàn)代物流的發(fā)展水平,而且能反映港口吞吐量的規(guī)模.因此,從理論和實踐層面選取Y1為輸出變量來反映港口吞吐量,具有一定的合理性. 2.1.2 輸入變量的確定 上海港直接腹地主要是長三角地區(qū),包括上海、江蘇南部和浙江北部.通過對直接經(jīng)濟腹地和港口各項影響因素的分析,選取以下變量作為上海港吞吐量預測的輸入變量:市內(nèi)生產(chǎn)總值(X1)、腹地固定投資額(X2)、腹地第一產(chǎn)業(yè)總值(X3)、腹地第二產(chǎn)業(yè)總值(X4)、腹地第三產(chǎn)業(yè)總值(X5)、腹地貨運周轉(zhuǎn)量(X6)、腹地人均消費水平(X9)、腹地城市消費品零售額(X10)、腹地能源消耗量(X11)、腹地貨物運輸量(X12).在這些變量中:X1對港口吞吐量規(guī)模有很大影響;X2,X3,X4,X5反映經(jīng)濟結(jié)構(gòu);X6,X10,X12反映港口區(qū)域與腹地區(qū)域的商品流通程度.(數(shù)據(jù)來源:《2015年上海統(tǒng)計年鑒》《2015年長三角統(tǒng)計年鑒》《2015年江蘇省統(tǒng)計年鑒》《2015年浙江省統(tǒng)計年鑒》) 需注意的是,長江經(jīng)濟帶作為沿海沿江全面推進的開放帶,國家正依托黃金水道將其打造成中國經(jīng)濟新支撐帶.同時,依托自貿(mào)區(qū)平臺不僅使上海港的國際樞紐地位進一步鞏固,而且正在助推國際航運中心建設.在國際航運中心建設的過程中,內(nèi)河航道里程數(shù)會得到拓展,對外貿(mào)易總額也會增加.因此,在“一帶一路”、長江經(jīng)濟帶和國際航運中心建設不斷推進的背景下,將內(nèi)河航道里程(X7)和對外貿(mào)易總額(X8)納入考慮范圍. 利用GRA對選取的12個變量進行篩選,得到影響Y1的主要變量,將其作為LSSVM的輸入.具體步驟如下: 步驟1 將輸入變量進行歸一化處理,設分辨系數(shù)r=0.5,計算Xi與Y1的關聯(lián)度(見表1). 步驟2 根據(jù)表1,按Ri從大到小對Xi進行排序:X8,X5,X1,X10,X4,X9,X12,X6,X2,X11,X3,X7. 表1 Xi與Y1的關聯(lián)度 步驟3 由關聯(lián)度計算結(jié)果可知,X11,X3,X7與Y1的關聯(lián)度較小,可舍去.將剩下的對Y1影響較大的Xi進行分類:X1歸于經(jīng)濟總量類;X2,X4,X5歸于產(chǎn)業(yè)結(jié)構(gòu)類;X8歸于對外貿(mào)易類;X9,X10歸于消費類;X6,X12歸于運輸類. 步驟4 根據(jù)關聯(lián)度的大小,從5個類別中分別選取1個具有代表性的變量作為影響Y1的主要變量.選取結(jié)果為X1,X5,X8,X10,X12. 2.2 TOOPSO對LSSVM參數(shù)的確定 將X1,X5,X8,X10,X12作為輸入變量,Y1作為輸出變量,建立LSSVM模型.由LSSVM可知,核函數(shù)選擇及相關參數(shù)的確定是提高預測性能的關鍵.在MATLAB環(huán)境下使用TOOPSO算法,求得LSSVM參數(shù)γ=6.453 5,δ2=100. 2.3 基于GRA-TOOPSO-LSSVM的Y1預測 將LSSVM的最優(yōu)參數(shù)γ= 6.453 5,δ2= 100代入LSSVM來進行上海港吞吐量預測(見表2). 表2 3種模型對上海港2010—2014年吞吐量預測結(jié)果比較 3.1 GRA-TOOPSO-LSSVM模型預測效果 為證明GRA-TOOPSO-LSSVM模型的有效性,將其預測結(jié)果與TOOPSO-LSSVM模型和基于交叉驗證(Cross Validation, CV)的LSSVM(CV-LSSVM)模型的預測結(jié)果進行對比,見表2. 由表2可知,與TOOPSO-LSSVM和CV-LSSVM模型相比,GRA-TOOPSO-LSSVM模型有更好的港口吞吐量預測效果,其預測誤差始終控制在[-6.56%,0.26%]內(nèi),明顯小于另外兩個模型的預測誤差. 3.2 GRA-TOOPSO-LSSVM模型預測性能評估 利用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均相對誤差(MRE)評價3種模型的預測性能,見表3.各項誤差值越小,說明模型預測性能越好. 表3 3種模型的預測性能比較 由表3可知,GRA-TOOPSO-LSSVM模型的各項誤差值明顯小于另外兩個模型的各項誤差值,說明GRA-TOOPSO-LSSVM模型的港口吞吐量預測性能極大地優(yōu)于另外兩個模型的預測性能.由此,得出結(jié)論:采用以LSSVM為中心,利用GRA法確定輸入和輸出變量,利用TOOPSO法確定LSSVM參數(shù)的算法,是一種極為有效的港口吞吐量預測方法,不僅能提高模型預測精度,而且能節(jié)約模型預測的時間. 3.3 上海港2016—2020年吞吐量預測 利用GRA-TOOPSO-LSSVM模型對上海港2016—2020年的吞吐量進行預測,并使用平均相對誤差值1.57%(見表3)進行微調(diào),最終預測結(jié)果見表4. 表4 上海港2016—2020年吞吐量預測 萬TEU 利用灰色關聯(lián)分析(GRA)法對影響港口吞吐量的主要因素進行篩選,利用二階振蕩粒子群優(yōu)化(TOOPSO)法對最小二乘支持向量機(LSSVM)的參數(shù)進行選擇,最后利用優(yōu)化的LSSVM對上海港吞吐量進行預測,預測結(jié)果較為理想.然而,由于模型訓練的復雜性和不穩(wěn)定性,今后仍需要對模型進行進一步修正.從預測結(jié)果看,上海港集裝箱吞吐量的增長速度明顯放緩,說明在當前經(jīng)濟新常態(tài)和國際經(jīng)濟形勢不穩(wěn)定的環(huán)境下,上海港需借助“一帶一路”、長江經(jīng)濟帶等國家戰(zhàn)略,不斷改善港口服務水平,增強自身實力,提升上海港核心競爭力,以期躋身國際樞紐港之列. [1]王景敏, 朱芳陽, 隋博文, 等. 廣西北部灣港口物流需求預測及發(fā)展模式研究[J]. 物流科技, 2010(12): 26-28. [2]陳其超. 基于線性回歸模型的重慶市港口物流需求分析[J]. 物流技術, 2013, 32(8): 121-122. [3]司玲玲, 王亞楠, 徐貴軍. 改進灰色模型在物流需求預測中的應用[J]. 計算機仿真, 2012, 29(6): 192-194. [4]萬福來. 天津港物流需求預測和物流發(fā)展策略研究[D]. 天津: 天津大學, 2012. [5]朱美華. 港口物流需求的BP神經(jīng)網(wǎng)絡預測模型研究[D]. 桂林: 桂林電子科技大學, 2011. [6]鐘映竑, 黃鑫. 基于粗糙集和支持向量機理論的物流需求預測研究[J]. 工業(yè)工程, 2015, 18(2): 28-33. [7]王建國, 張文興. 支持向量機建模及其智能優(yōu)化[M]. 5版. 北京: 清華大學出版社, 2015: 42-74. [8]王定成. 支持向量機建模預測與控制[M]. 4版. 北京: 氣象出版社, 2009: 44-107. [9]耿立艷, 丁璐璐. 基于灰色關聯(lián)分析的最小二乘支持向量機物流需求預測[J]. 物流技術, 2013, 32(10): 130-135. [10]閻威武, 邵惠鶴. 支持向量機和最小二乘支持向量機的比較及應用研究[J]. 控制與決策, 2003, 18(3): 358-360. [11]胡建秀, 曾建潮. 二階振蕩粒子群算法[J]. 系統(tǒng)仿真學報, 2007, 19(5): 102-105. [12]黃勤. 基于改進PSO的組合預測模型研究[J]. 計算機工程與應用, 2015, 51(14): 258-263. [13]蔣妍妍, 李洪林. 基于改進粒子群優(yōu)化LSSVM的水泥熟料的fCaO軟測量[J]. 現(xiàn)代化工, 2014, 34(6): 152-155. [14]XU Yitian, GUO Rui, WANG Laisheng. A twin multi-class classification support vector machine[J]. Cognitive Computation, 2013, 5(4): 580-588. DOI: 10.1007/s12559-012-9179-7. (編輯 趙勉) Port throughput forecasting based on GRA-TOOPSO-LSSVM ZHANG Huachun, HUANG Youfang, HU Jiankun (Institute of Logistics Science & Engineering, Shanghai Maritime University, Shanghai 201306, China) In order to forecast port throughput scientifically, Grey Relational Analysis (GRA) and Two-Order Oscillating Particle Swarm Optimization (TOOPSO) are introduced on the basis of Least Squares Support Vector Machine (LSSVM), and a new GRA-TOOPSO-LSSVM algorithm of port throughput forecasting is proposed. GRA method is used to select the factors that have great influence on Shanghai Port throughput, and the factors are used as input variables of LSSVM. TOOPSO method is used to optimize the parameters of LSSVM. The nonlinear mapping advantage of LSSVM is used to forecast Shanghai Port throughput. In the process of empirical study on Shanghai Port throughput, GRA-TOOPSO-LSSVM algorithm, TOOPSO-LSSVM algorithm and LSSVM algorithm based on cross validation are compared. Results show that GRA-TOOPSO-LSSVM algorithm is of better forecasting accuracy and convergence rate, which provides a new method for forecasting port throughput. Least Squares Support Vector Machine (LSSVM); Grey Relational Analysis (GRA); Two-Order Oscillating Particle Swarm Optimization (TOOPSO); throughput forecasting 10.13340/j.jsmu.2017.01.009 1672-9498(2017)01-0043-04 2016-06-13 2016-11-29 交通運輸部建設科技項目(2015328810160);上海市科學技術委員會重大項目(15DZ1100900,14DZ2280200) 張華春(1989—),男,碩士研究生,研究方向為港口運作、采購與供應鏈管理,(E-mail)2420099302@qq.com; 黃有方(1959—),男,教授,博導,博士,研究方向為現(xiàn)代港口物流管理與工程、港航物流智能化信息理論與系統(tǒng)、采購與供應鏈管理綜合環(huán)境等,(E-mail)yhuang@shmtu.edu.cn U691.71 A2 實證分析
3 結(jié)果分析
4 結(jié) 論