賈飛躍 韓曉龍
摘要:為提高集裝箱吞吐量的預(yù)測(cè)精度,提出基于因子分析和曲線擬合的集裝箱吞吐量預(yù)測(cè)模型。以上海港為例,通過因子分析,分析影響集裝箱吞吐量的主要因素,篩選出主因子,得到不同年份的綜合經(jīng)濟(jì)發(fā)展值;再運(yùn)用曲線擬合方法,建立以綜合經(jīng)濟(jì)發(fā)展值為自變量,以集裝箱吞吐量為因變量的三次曲線模型;運(yùn)用自回歸積分移動(dòng)平均(autoregressive integrated moving average, ARIMA)模型預(yù)測(cè)2016—2020年的綜合經(jīng)濟(jì)發(fā)展值,進(jìn)而求得2016—2020年上海港集裝箱吞吐量預(yù)測(cè)值。結(jié)果表明:該模型的擬合效果和預(yù)測(cè)精度均較高,可以運(yùn)用到集裝箱吞吐量預(yù)測(cè)中。給出上海港在國(guó)內(nèi)經(jīng)濟(jì)新常態(tài)下轉(zhuǎn)型升級(jí)的建議。
關(guān)鍵詞:自回歸積分移動(dòng)平均(autoregressive integrated moving average, ARIMA)模型; 因子分析; 曲線擬合; 集裝箱吞吐量預(yù)測(cè)
中圖分類號(hào):U691.71
文獻(xiàn)標(biāo)志碼:A
收稿日期:2018-06-02
修回日期:2018-08-20
基金項(xiàng)目:國(guó)家自然科學(xué)基金(71471110);上海市科學(xué)技術(shù)委員會(huì)創(chuàng)新項(xiàng)目(16DZ1201402,16040501500);上海市科學(xué)技術(shù)委員會(huì)工程中心能力提升項(xiàng)目(14DZ2280200);上海海事大學(xué)研究生學(xué)術(shù)新人培育計(jì)劃(YXR2017014)
作者簡(jiǎn)介:
賈飛躍(1994—),男,河南開封人,碩士研究生,研究方向?yàn)槲锪鞴こ膛c管理,(E-mail)1761262763@qq.com
韓曉龍(1978—),男,山東濰坊人,副教授,碩導(dǎo),博士,研究方向?yàn)槲锪髋c供應(yīng)鏈管理,(E-mail)xlhan@shmtu.edu.cn
Abstract:In order to improve the prediction accuracy of container throughput, a container throughput prodiction model based on factor analysis and curve fitting is proposed. Shanghai Port is taken as an example. Through factor analysis, the main factors affecting the container throughput are analyzed, the principal component factors are selected, and the comprehensive economic development values of different years are obtained; a curve fitting method is used to establish a cubic curve model, where the comprehensive economic development value is taken as an independent variable and the container throughput is taken as a dependent variable; the comprehensive economic development values of 2016-2020 are predicted by the autoregressive integrated moving average (ARIMA) model, thus the predicted values of the container throughput of Shanghai Port in 2016-2020 are obtained. The results show that the fitting effect and the prediction accuracy of the model are both high and can be applied to the container throughput prediction. The suggestions of the transformation and upgrading of Shanghai Port under the new normal of Chinese economy are given.
Key words:autoregressive integrated moving average (ARIMA) model; factor analysis; curve fitting; container throughput prediction
0 引 言
隨著國(guó)際貿(mào)易的發(fā)展,世界各港口之間的競(jìng)爭(zhēng)正逐步演變?yōu)橐约b箱吞吐量為核心的港口綜合實(shí)力的競(jìng)爭(zhēng),而集裝箱吞吐量的精準(zhǔn)預(yù)測(cè)是合理規(guī)劃港口碼頭的重要基礎(chǔ)。
江艦等[1]利用近年來(lái)的相關(guān)數(shù)據(jù)對(duì)港口集裝箱吞吐量、港口所在城市的國(guó)民生產(chǎn)總值以及地方進(jìn)出口商品總值進(jìn)行了計(jì)量經(jīng)濟(jì)分析,通過二元線性回歸模型對(duì)港口未來(lái)集裝箱吞吐量進(jìn)行預(yù)測(cè),并對(duì)模型進(jìn)行了相關(guān)檢驗(yàn)。朱小檬等[2]采用時(shí)間序列-因果關(guān)系結(jié)合法,把國(guó)內(nèi)生產(chǎn)總值(GDP)作為解釋變量,利用多項(xiàng)式回歸模型擬合集裝箱吞吐量序列,形成GDP時(shí)間序列對(duì)集裝箱吞吐量序列的因果關(guān)系。王文[3]采用季節(jié)性復(fù)合序列分解方法,得到通過季節(jié)指數(shù)分離的序列數(shù)據(jù)的回歸模型,用來(lái)預(yù)測(cè)未來(lái)兩年外貿(mào)吞吐量,并由它與箱量間的線性關(guān)系得到相對(duì)應(yīng)的集裝箱吞吐量預(yù)測(cè)值,預(yù)測(cè)效果顯著。楊金花等[4]根據(jù)上海港集裝箱碼頭的具體情況計(jì)算其通過能力,通過產(chǎn)能利用率指標(biāo)得出上海港集裝箱碼頭不存在產(chǎn)能過剩的結(jié)論,并提出了在現(xiàn)有碼頭設(shè)施條件下提高產(chǎn)能的建議。陳昌源等[5]引入弱化算子理論對(duì)GM(1,1)模型原始數(shù)據(jù)進(jìn)行預(yù)處理,分別應(yīng)用傳統(tǒng)模型和改進(jìn)GM(1,1)模型對(duì)上海港集裝箱吞吐量進(jìn)行預(yù)測(cè),比較兩種模型的預(yù)測(cè)精度及曲線擬合度。崔巍等[6]通過對(duì)歷年內(nèi)河集裝箱吞吐量的統(tǒng)計(jì)與分析,采用三次指數(shù)平滑法建立預(yù)測(cè)模型,對(duì)珠江內(nèi)河集裝箱吞吐量進(jìn)行了分析和預(yù)測(cè)。
目前,預(yù)測(cè)集裝箱吞吐量的方法很多,如線性回歸法、指數(shù)平滑法[6-7]、人工神經(jīng)網(wǎng)絡(luò)法[8-9]、灰色預(yù)測(cè)法[10-11]等,其中:線性回歸法不能根據(jù)數(shù)據(jù)的差異進(jìn)行靈活調(diào)整,預(yù)測(cè)精度往往不高;指數(shù)平滑法的平滑次數(shù)和平滑系數(shù)的確定相對(duì)困難;人工神經(jīng)網(wǎng)絡(luò)法存在收斂速度慢、對(duì)數(shù)據(jù)質(zhì)量要求高等問題;灰色預(yù)測(cè)法需要原始序列呈現(xiàn)非負(fù)指數(shù)增長(zhǎng)趨勢(shì),而所研究的原始序列有時(shí)無(wú)法滿足該條件。為此,本文提出基于因子分析和曲線擬合的集裝箱吞吐量預(yù)測(cè)模型,即首先確定影響集裝箱吞吐量的主要影響因素,并通過因子分析消除因素間的多重共線性,然后得到各年份的綜合經(jīng)濟(jì)發(fā)展值,最后對(duì)綜合經(jīng)濟(jì)發(fā)展值與集裝箱吞吐量進(jìn)行曲線擬合,找出最佳預(yù)測(cè)模型,從而對(duì)集裝箱吞吐量作出預(yù)測(cè)并進(jìn)行檢驗(yàn)。
1 預(yù)測(cè)模型建立步驟
基于因子分析和曲線擬合的集裝箱吞吐量預(yù)測(cè)模型的建立步驟[12]如下:
步驟1 對(duì)問題進(jìn)行分析,收集數(shù)據(jù),并選取影響集裝箱吞吐量的指標(biāo)。
步驟2 判斷指標(biāo)矩陣是否適合進(jìn)行因子分析。通常采取相關(guān)系數(shù)矩陣計(jì)算、KMO檢驗(yàn)和Bartlett球度檢驗(yàn)來(lái)進(jìn)行判斷。若適合,則轉(zhuǎn)到步驟3,否則轉(zhuǎn)到步驟1。
步驟3 確定主因子。設(shè)x1,x2,…,xn為n個(gè)影響因素,當(dāng)前k(k 式中:λi為主因子的方差占總方差的比例。 步驟4 若k個(gè)主因子無(wú)法確定或?qū)嶋H含義不很明顯,則需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。把n個(gè)原始變量表達(dá)為k個(gè)主因子的線性組合。要尋找的前k個(gè)主因子記為E1,E2,…,Ek,依據(jù)主因子與原始變量之間的關(guān)系建立因子分析數(shù)學(xué)模型: 式中:aij表示第i個(gè)變量與第j個(gè)主因子之間的線性相關(guān)系數(shù)。這個(gè)模型表示成矩陣形式為 式中:E為主因子向量,E1,E2,…,Ek可以理解為高維空間中相互垂直的k個(gè)坐標(biāo)軸;A為因子載荷矩陣;ε為特殊因子向量。 步驟5 確定綜合經(jīng)濟(jì)發(fā)展值(亦稱為綜合因子得分)。以主因子的方差貢獻(xiàn)率為權(quán)重,由各主因子的線性組合得到主因子得分函數(shù),進(jìn)而確定各主因子的綜合經(jīng)濟(jì)發(fā)展值。主因子的方差貢獻(xiàn)率權(quán)重為 其值越高,說明主因子的重要程度越高。 步驟6 運(yùn)用曲線擬合方法對(duì)綜合經(jīng)濟(jì)發(fā)展值與集裝箱吞吐量進(jìn)行曲線擬合,找出最佳預(yù)測(cè)模型。 步驟7 運(yùn)用自回歸積分移動(dòng)平均(autoregressive integrated moving average, ARIMA)模型預(yù)測(cè)未來(lái)時(shí)期綜合經(jīng)濟(jì)發(fā)展值,然后將其代入最佳預(yù)測(cè)模型中預(yù)測(cè)未來(lái)集裝箱吞吐量。 2 實(shí)證分析 2.1 數(shù)據(jù)收集及指標(biāo)選取 為評(píng)價(jià)基于因子分析和曲線擬合的集裝箱吞吐量預(yù)測(cè)模型的擬合效果和預(yù)測(cè)精度,選取上海港作為研究對(duì)象。影響上海港集裝箱吞吐量Y的因素很多,鑒于數(shù)據(jù)可得性,選取地區(qū)生產(chǎn)總值X1、進(jìn)出口總額X2、工業(yè)總產(chǎn)值X3、貨物運(yùn)輸量X4和社會(huì)消費(fèi)品零售總額X5等5個(gè)指標(biāo)作為集裝箱吞吐量的影響因素。采用2002—2015年上海港集裝箱吞吐量及其影響因素?cái)?shù)據(jù)(見表1)進(jìn)行實(shí)證研究。 通過對(duì)上海港集裝箱吞吐量影響因素的相關(guān)性分析可知,指標(biāo)間存在高度線性相關(guān)性,同時(shí)Bartlett球度檢驗(yàn)統(tǒng)計(jì)量觀測(cè)值為171.508,KMO值為0.782,均通過檢驗(yàn),因而所建指標(biāo)矩陣適合進(jìn)行因子分析。 2.2 因子分析 運(yùn)用SPSS軟件進(jìn)行因子分析[13],可得以下結(jié)論:(1)在提取主因子時(shí),地區(qū)生產(chǎn)總值、進(jìn)出口總額、工業(yè)總產(chǎn)值、貨物運(yùn)輸量和社會(huì)消費(fèi)品零售總 額的共同度分別為0.977、0.992、0.977、0.950和0.936,因子載荷值分別為0.988、0.996、0.989、0.975和0.967,同時(shí)所提取的主因子的特征根為4.833,并且能夠解釋5個(gè)指標(biāo)總方差的96.65%,因此此次提取主因子的效果較好。 (2)各主因子得分系數(shù)分別為0.205、0.206、0.205、0.202和0.200,從而可得2002—2015年綜合經(jīng)濟(jì)發(fā)展值分別為-1.61、-1.37、-1.10、-0.86、-0.61、-0.26、0.06、-0.07、0.41、0.90、0.98、1.06、1.20和1.28。 2.3 曲線擬合 在上面的因子分析中得到的不同年份的綜合因子得分反映了不同年份的綜合經(jīng)濟(jì)發(fā)展值,于是可以利用綜合因子得分預(yù)測(cè)未來(lái)上海港集裝箱吞吐量。通過繪制以綜合經(jīng)濟(jì)發(fā)展值X為橫坐標(biāo)、以上海港集裝箱吞吐量Y為縱坐標(biāo)的散點(diǎn)圖(見圖1),可以初步判斷兩者間存在的函數(shù)模型有線性模型、二次曲線模型和三次曲線模型。利用SPSS軟件的曲線擬合功能,評(píng)估這3個(gè)模型對(duì)綜合經(jīng)濟(jì)發(fā)展值與集裝箱吞吐量?jī)烧叩臄M合效果,具體見表2和3,其中R2為可決系數(shù),F(xiàn)為特征值,df1、df2表示模型自由度(degree of freedom),sig表示顯著性,b1、b2、b3分別表示曲線的一次項(xiàng)、二次項(xiàng)和三次項(xiàng)系數(shù)。 根據(jù)各模型的可決系數(shù)R2可知,三次曲線模型的擬合度最好,因而可得綜合經(jīng)濟(jì)發(fā)展值與集裝箱吞吐量?jī)烧叩墓烙?jì)方程為 2.4 運(yùn)用ARIMA模型預(yù)測(cè)綜合經(jīng)濟(jì)發(fā)展值 首先,繪制綜合經(jīng)濟(jì)發(fā)展時(shí)間序列圖,見圖2。由圖2可知,2002—2015年間綜合經(jīng)濟(jì)發(fā)展時(shí)間序列總體呈現(xiàn)波動(dòng)式上升,即該序列處于非平穩(wěn)狀態(tài)。由于樣本數(shù)據(jù)存在上升態(tài)勢(shì),為消除樣本數(shù)據(jù)可能存在的異方差現(xiàn)象,需要進(jìn)行差分處理。經(jīng)過一階差分后序列趨于平穩(wěn),其自相關(guān)性和偏相關(guān)性如圖3和4所示:一階差分序列的自相關(guān)函數(shù)值和偏相關(guān)函數(shù)值在其二階差分值達(dá)到峰值后都呈現(xiàn)出拖尾衰減特性。由此可以認(rèn)為,一階差分時(shí)間序列為平穩(wěn)的白噪聲序列,從而可以構(gòu)建ARIMA(2,1,2)模型。該模型的可決系數(shù)R2為0.983,標(biāo)準(zhǔn)化BIC為-2.502,因而可以認(rèn)為該模型的擬合效果相對(duì)較好。用該模型預(yù)測(cè)的2016—2020年上海港集裝箱吞吐量的綜合經(jīng)濟(jì)發(fā)展值分別為1.501 91、1.692 35、1.785 82、1.884 16和1.993 02。 2.5 三次曲線模型擬合效果檢驗(yàn) 運(yùn)用ARIMA(2,1,2)模型,求出2003—2015年綜合經(jīng)濟(jì)發(fā)展值,然后將其代入三次曲線模型中可 得2003—2015年上海港集裝箱吞吐量擬合值,將其與2003—2015年的觀察值進(jìn)行比較,可求出觀察值與擬合值的平均絕對(duì)誤差僅為5.04%,其具體擬合效果見圖5。從圖5可以看出,2012—2015年集裝箱吞吐量擬合誤差率趨于0,因而可以認(rèn)為模型擬合效果非常好,用該模型得到的2016—2020年上海港集裝箱吞吐量預(yù)測(cè)結(jié)果可以認(rèn)為是較為精確的。 2.6 預(yù)測(cè)集裝箱吞吐量 預(yù)計(jì)“十三五”期間全國(guó)港口吞吐量增長(zhǎng)速度可能會(huì)低于國(guó)民經(jīng)濟(jì)發(fā)展速度,我國(guó)港口在今后一段時(shí)期內(nèi)總體上會(huì)處于平穩(wěn)發(fā)展的階段,即我國(guó)港口貨物吞吐量和集裝箱吞吐量增長(zhǎng)將進(jìn)入中低速增長(zhǎng)的“常態(tài)”[14]。將2016—2020年綜合經(jīng)濟(jì)發(fā)展的預(yù)測(cè)值代入三次曲線模型中,可求得上海港集裝箱吞吐量預(yù)測(cè)值分別為3 762.2萬(wàn)、3 954.2萬(wàn)、4 056.8萬(wàn)、4 171.4萬(wàn)、4 306.7萬(wàn)TEU。2016和2017年上海港集裝箱吞吐量預(yù)測(cè)值與觀察值(分別為3 713.3萬(wàn)和4 030.0萬(wàn)TEU)相比,其絕對(duì)誤差分別為1.32%和1.88%。根據(jù)預(yù)測(cè)結(jié)果分析可知,在“十三五” 期間上海港集裝箱吞吐量仍將呈現(xiàn)平穩(wěn)增長(zhǎng)態(tài)勢(shì),且2016—2020年的環(huán)比增長(zhǎng)率分別為3.21%、5.10%、2.60%、2.82%、3.24%。由此可知,年平均增長(zhǎng)率為3.40%,符合我國(guó)港口在“十三五”期間集裝箱吞吐量增長(zhǎng)進(jìn)入中低速增長(zhǎng)的“常態(tài)”。 3 結(jié)束語(yǔ) 基于因子分析和曲線擬合對(duì)上海港集裝箱吞吐量進(jìn)行預(yù)測(cè),得出以下結(jié)論: 第一,在確定影響集裝箱吞吐量主要因素的基礎(chǔ)上,通過因子分析確定主因子,進(jìn)而求得各年份的綜合經(jīng)濟(jì)發(fā)展值,然后通過對(duì)綜合經(jīng)濟(jì)發(fā)展值與集裝箱吞吐量進(jìn)行曲線擬合找出最佳預(yù)測(cè)模型,從而可建立基于因子分析和曲線擬合的集裝箱吞吐量預(yù)測(cè)模型。結(jié)果表明:該模型的擬合效果好,預(yù)測(cè)精度高,可以運(yùn)用到集裝箱吞吐量預(yù)測(cè)中。 第二,上海港集裝箱吞吐量在平穩(wěn)增長(zhǎng)的同時(shí)其增速將明顯放緩。因此,面對(duì)中國(guó)經(jīng)濟(jì)的新常態(tài)和國(guó)際貿(mào)易形勢(shì)的復(fù)雜性,上海港作為一個(gè)國(guó)際航運(yùn)樞紐,在提升港口硬件實(shí)力的同時(shí),更需注重提升自身軟實(shí)力。借助“一帶一路”和“海運(yùn)強(qiáng)國(guó)”的發(fā)展契機(jī),上海港應(yīng)積極實(shí)現(xiàn)港口專業(yè)化和集約化經(jīng)營(yíng)的轉(zhuǎn)型升級(jí),深化完善“兩型”港口建設(shè),提升上海港核心競(jìng)爭(zhēng)力。對(duì)于我國(guó)集裝箱港口而言,集裝箱港口企業(yè)一定要延伸物流服務(wù),在做大做強(qiáng)港口主業(yè)的基礎(chǔ)上,加強(qiáng)港口與區(qū)域內(nèi)產(chǎn)業(yè)互動(dòng),積極發(fā)展臨港工業(yè)服務(wù)功能,進(jìn)一步服務(wù)腹地經(jīng)濟(jì)產(chǎn)業(yè)鏈,增加港口服務(wù)價(jià)值。 參考文獻(xiàn): [1]江艦, 王海燕, 楊贊. 集裝箱吞吐量及主要影響因素的計(jì)量經(jīng)濟(jì)分析[J]. 大連海事大學(xué)學(xué)報(bào), 2007, 33(1):83-86. [2]朱小檬, 欒維新, 朱義勝. 基于時(shí)間序列-因果關(guān)系結(jié)合法的中國(guó)海港集裝箱吞吐量中長(zhǎng)期預(yù)測(cè)[J]. 大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2014, 13(5):1-5. [3]王文. 線性回歸結(jié)合季節(jié)性復(fù)合序列的深圳港集裝箱吞吐量預(yù)測(cè)[J]. 中國(guó)水運(yùn), 2012, 12(12):23-25, 27. [4]楊金花, 楊藝. 基于灰色模型的上海港集裝箱吞吐量預(yù)測(cè)[J]. 上海海事大學(xué)學(xué)報(bào), 2014, 35(2):28-32. [5]陳昌源, 戴冉, 楊婷婷, 等. 基于改進(jìn)GM(1,1)模型的上海港集裝箱吞吐量預(yù)測(cè)[J]. 船海工程, 2016, 45(4):153-156. [6]崔巍, 葉佳. 基于三次指數(shù)平滑的珠江內(nèi)河集裝箱吞吐量預(yù)測(cè)[J]. 珠江水運(yùn), 2011(12):112-114. [7]關(guān)克平, 齊夢(mèng)雅. 基于指數(shù)平滑法的寧波舟山港港口吞吐量預(yù)測(cè)研究[J]. 中國(guó)水運(yùn), 2013, 13(12):28-29. [8]范瑩瑩, 余思勤. 基于NARX神經(jīng)網(wǎng)絡(luò)的港口集裝箱吞吐量預(yù)測(cè)[J]. 上海海事大學(xué)學(xué)報(bào), 2015, 36(4):1-5.DOI:10.13340/j.jsmu.2015.04.001. [9]劉長(zhǎng)儉, 張慶年. 基于時(shí)間序列BP神經(jīng)網(wǎng)絡(luò)的集裝箱吞吐量動(dòng)態(tài)預(yù)測(cè)[J]. 水運(yùn)工程, 2007(1):4-11. [10]王再明, 王宏波. 灰色系統(tǒng)理論在港口吞吐量預(yù)測(cè)中的應(yīng)用[J]. 武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版), 2005, 29(3):456-459. [11]陳秀瑛, 古浩. 灰色線性回歸模型在港口吞吐量預(yù)測(cè)中的應(yīng)用[J]. 水運(yùn)工程, 2010(5):89-92. [12]徐國(guó)祥. 統(tǒng)計(jì)預(yù)測(cè)和決策[M]. 上海:上海財(cái)經(jīng)大學(xué)出版社, 2006:202-216. [13]王璐, 王沁. SPSS統(tǒng)計(jì)分析基礎(chǔ)、應(yīng)用與實(shí)戰(zhàn)精粹[M]. 北京:化學(xué)工業(yè)出版社, 2012:230-256. [14]陳羽. 2015年我國(guó)港口集裝箱發(fā)展現(xiàn)狀及趨勢(shì)[J]. 中國(guó)港口, 2016(4):48-53. (編輯 趙勉)