楊思凡
摘要:港口貨物吞吐量預(yù)測對我國對外進(jìn)出口貿(mào)易、沿海進(jìn)出設(shè)施建設(shè)以及相關(guān)政策的發(fā)布具有重要參考意義,然而港口貨物吞吐量數(shù)據(jù)表現(xiàn)出不平穩(wěn)和非線性特性,給預(yù)測帶來了一定的難度。因此,文章提出基于多因素選擇和誤差修正的BP神經(jīng)網(wǎng)絡(luò)港口貨物吞吐量預(yù)測。首先,根據(jù)已有文獻(xiàn)研究得出港口貨物吞吐量的有關(guān)影響因素,包括GDP、進(jìn)出口總額、社會消費(fèi)品零售總額、泊位個(gè)數(shù)、碼頭長度、貨運(yùn)量數(shù)據(jù)等。其次,運(yùn)用多元線性回歸分析對相關(guān)影響因素進(jìn)行處理,選擇相關(guān)程度高和影響程度大的因素作為港口貨物吞吐量的輸入。然后,用BP神經(jīng)網(wǎng)絡(luò)對其進(jìn)行預(yù)測,得出該階段的預(yù)測值,該結(jié)果與實(shí)際值相近,但仍存在一定差距。由此本文對其預(yù)測結(jié)果進(jìn)行誤差修正,獲得最終預(yù)測值。最后,為驗(yàn)證模型的有效性,對本模型進(jìn)行實(shí)證分析,實(shí)驗(yàn)結(jié)果表明,結(jié)合多因素和誤差修正的混合預(yù)測方法能更準(zhǔn)確的擬合歷史數(shù)據(jù),得到更優(yōu)化的預(yù)測結(jié)果。
關(guān)鍵詞:多因素模型;誤差修正;BP神經(jīng)網(wǎng)絡(luò);港口貨物吞吐量預(yù)測
Abstract: Port cargo throughput prediction has important reference significance for China's foreign import and export trade, coastal facilities construction and the release of relevant policies, but the cargo throughput data of the port shows unsteady and nonlinear characteristics which brings certain difficulties to the prediction. Therefore, this paper proposes a BP neural network cargo throughput prediction based on multi-factor and error correction. Firstly, according to the existing literature, relevant influencing factors of port cargo throughput are obtained, which mainly include GDP, total volume of imports and exports, total retail sales of social consumer goods, number of berths, length of terminals, data of freight volume, etc. Secondly, multiple linear regression analysis was used to deal with the relevant factors, and the factors with high degree of correlation and large degree of influence are selected as the input of port cargo throughput. Then, BP neural network is used to predict it, and the predicted value of this stage is obtained. The result is close to the expected output, but there is still a gap. The error correction of the prediction results is carried out to obtain the final prediction value. Finally, in order to verify the validity of the model, the empirical analysis of the model is carried out. The experimental results show that the hybrid forecasting method combined with multi factor and error correction can more accurately fit the historical data and get more optimized forecasting results.
Key words: multi-factor model;error correction;BP neural network;port throughput forecast
0? 引言
港口貨物吞吐量體現(xiàn)著港口經(jīng)營的成果,是我國港口建設(shè)、運(yùn)輸能力、經(jīng)濟(jì)發(fā)展實(shí)力的體現(xiàn)。隨著我國經(jīng)濟(jì)實(shí)力的不斷增長,國際貿(mào)易規(guī)模不斷增大,貿(mào)易活動與港口建設(shè)的相互推進(jìn),促進(jìn)著經(jīng)濟(jì)再生長。而對我國港口貨物吞吐量的預(yù)測有利于國家對港口的發(fā)展進(jìn)行更有效的規(guī)劃建設(shè)、結(jié)構(gòu)調(diào)整等,以此確保國際商貿(mào)快速穩(wěn)固發(fā)展、保障國家參與國際經(jīng)濟(jì)合作和競爭實(shí)力。因此,有必要提高港口吞吐量的預(yù)測精確度。
目前,已有許多研究者對港口貨物吞吐量預(yù)測的方法進(jìn)行研究,主要分成統(tǒng)計(jì)計(jì)量方法和人工智能方法。其中統(tǒng)計(jì)計(jì)量方法包括指數(shù)平滑、ARIAM和灰色模型。貢文偉等[1]提出了指數(shù)平滑法結(jié)合灰色預(yù)測模型。Min Liu等[2]探討了指數(shù)平滑法的波動率預(yù)測。薛俊強(qiáng)[3]利用ARIMA模型對寧波港的集裝箱吞吐量進(jìn)行預(yù)測。趙一棋等[4]基于時(shí)間序列模型,構(gòu)建ARIMA模型對其月度數(shù)據(jù)進(jìn)行預(yù)處理后預(yù)測。劉明英等[5]采用灰色預(yù)測方法針對特定港口季度吞吐量進(jìn)行預(yù)測,用灰色模型抵消數(shù)據(jù)統(tǒng)計(jì)不完善的缺點(diǎn),但效果有待提高。田雪等[6]采用灰色模型對曹妃甸港口的貨物吞吐量進(jìn)行研究。上述研究在線性假設(shè)條件下表現(xiàn)出良好的預(yù)測效果,但是港口貨物吞吐量具有非線性、非平穩(wěn)性等特征的情況下,統(tǒng)計(jì)計(jì)量模型對復(fù)雜性、波動性數(shù)據(jù)的預(yù)測結(jié)果不夠完善,精確度也有待提高。
人工智能方法具有較強(qiáng)的非線性映射能力,被廣泛的應(yīng)用于港口貨物吞吐量預(yù)測當(dāng)中,主要包括BP、RBF、Elman神經(jīng)網(wǎng)絡(luò)模型。陳錦文、孫巧萍等[7,8]通過對 BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)對港口吞吐量進(jìn)行預(yù)測。席申娥等[9]提出雙時(shí)間序列與RBF的組合預(yù)測方法,首先利用ARIMA模型和灰色預(yù)測模型分別對歷史數(shù)據(jù)進(jìn)行預(yù)測,選取灰色時(shí)間序列作為RBF的輸入量進(jìn)行預(yù)測。楊珩等[10]利用Elman神經(jīng)網(wǎng)絡(luò)模型對港口吞吐量進(jìn)行預(yù)測。以上研究者針對港口貨物吞吐量的研究只是單純對港口貨物吞吐量歷史數(shù)據(jù)進(jìn)行預(yù)測,忽略了相關(guān)因素對港口貨物吞吐量的影響。因此,本文考慮相關(guān)影響因素對港口貨物吞吐量預(yù)測的重要性,提出將重要影響要素與歷史數(shù)據(jù)相結(jié)合進(jìn)行預(yù)測。
以往對港口貨物吞吐量的預(yù)測研究忽視了預(yù)測誤差的意義,沒有從誤差中提取有效的信息并加以利用,造成預(yù)測結(jié)果不理想的情況。Hongyuan Luo等[11]提出基于誤差修正模型的精度明顯高于修正前的預(yù)測模型。目前基于誤差修正的研究越來越多,并且在預(yù)測方面取得了較好的研究成果,但在貨物吞吐量上還沒有應(yīng)用。BP神經(jīng)網(wǎng)絡(luò)可以對多維數(shù)據(jù)進(jìn)行較好的預(yù)測,但是預(yù)測結(jié)果的精確度還有待提高。王洪樂等[12]利用BP神經(jīng)網(wǎng)絡(luò)對數(shù)控機(jī)床進(jìn)行了綜合誤差彌補(bǔ)。因此,本文提出利用BP神經(jīng)網(wǎng)絡(luò)模型對初始預(yù)測的結(jié)果進(jìn)行誤差修正,優(yōu)化預(yù)測結(jié)果。
綜上可知,現(xiàn)有研究存在兩個(gè)問題:一是現(xiàn)有研究僅利用港口貨物吞吐量單項(xiàng)數(shù)據(jù)研究,沒有考慮相關(guān)因素對港口貨物吞吐量的預(yù)測結(jié)果的影響。二是現(xiàn)有研究模型所得出的預(yù)測結(jié)果的精確度還有待提高,并且沒有對結(jié)果進(jìn)行誤差修正,因此采用誤差修正可以進(jìn)一步提高預(yù)測的精確程度。
針對上述問題,本文提出基于多因素選擇和誤差修正的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型對我國港口貨物吞吐量進(jìn)行預(yù)測。首先,利用SPSS軟件對可能的影響因素進(jìn)行多元線性模型分析,并選取影響程度較大并且線性不相關(guān)的三個(gè)因素作為港口貨物吞吐量的影響因素。其次,用BP神經(jīng)網(wǎng)絡(luò)對其組成的多維時(shí)間序列進(jìn)行預(yù)測,得到預(yù)測結(jié)果。然后,經(jīng)過初步對比分析,多維時(shí)間序列預(yù)測結(jié)果較好,但其預(yù)測精度仍有提升較大空間,所以對初次BP預(yù)測結(jié)果進(jìn)行誤差修正,并輸出最終預(yù)測值。最后,為驗(yàn)證模型的有效性和適用性,運(yùn)用相對誤差對預(yù)測結(jié)果進(jìn)行分析。結(jié)果表明,此模型的擬合程度較高,能夠更精確的預(yù)測出港口貨物吞吐量。該方法考慮了主要影響因素的影響,并對預(yù)測結(jié)果進(jìn)行了誤差修正,提高了預(yù)測的合理性,并且在預(yù)測精度上也達(dá)到了滿意效果,為后續(xù)的研究提供了新思路。
1? 基本模型
1.1 多元線性回歸
多元線性回歸模型通常是由一個(gè)因變量和與其線性相關(guān)的多個(gè)自變量組成的模型。設(shè)因變量y和自變量x1,x2,…xn均有n組數(shù)據(jù),若y與x1,x2,…xn線性相關(guān),則
1.2 因素選擇
因素篩選方法主要有多元線性回歸分析、主成分分析和灰色關(guān)聯(lián)分析法。劉枚蓮[13]在研究港口貨物吞吐量影響因素的篩選方法時(shí)提出主成分分析法無法考慮各指標(biāo)之間的關(guān)聯(lián)度。而灰色關(guān)聯(lián)分析法缺乏客觀性和確定性。因此本文選擇多元線性回歸分析作為篩選關(guān)鍵指標(biāo)的方法。
主要步驟如下:
Step1:將港口貨物吞吐量設(shè)為因變量,GDP、社會消費(fèi)品零售總額、碼頭長度、泊位個(gè)數(shù)和進(jìn)出口總額設(shè)為自變量建立多元線性回歸模型。
Step2:對模型進(jìn)行共線性檢驗(yàn),發(fā)現(xiàn)模型存在多重共線性。對模型進(jìn)行調(diào)整,采用逐步回歸法。分別對5個(gè)自變量和因變量做一元線性回歸分析,根據(jù)擬合優(yōu)度選出第一個(gè)關(guān)鍵指標(biāo)。
Step3:將剩余變量分別與選出的自變量和因變量做二元線性回歸分析,綜合擬合優(yōu)度和F值,選出第二個(gè)關(guān)鍵指標(biāo)。以此類推選出第三個(gè)關(guān)鍵指標(biāo)。
Step4:剩余2個(gè)變量分別與選出的3個(gè)自變量和因變量做四元線性回歸分析,由于P值均過大,因此剔除這2個(gè)變量,選定三個(gè)關(guān)鍵指標(biāo)。
1.3 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差反向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層之間加入隱含層來處理非線性問題。BP神經(jīng)網(wǎng)絡(luò)經(jīng)過將信號正向傳播后,逆向進(jìn)行誤差反饋,通過自行調(diào)整輸入層與隱含層以及隱含層與輸出之間的閾值和連接強(qiáng)度,反復(fù)學(xué)習(xí),訓(xùn)練出與與期望輸出擬合最好所相對應(yīng)的權(quán)值和閾值。模型結(jié)構(gòu)圖如圖1所示。
2? 基于多因素選擇和誤差修正的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型
本文提出的基于多因素選擇和誤差修正的BP神經(jīng)網(wǎng)絡(luò)港口貨物吞吐量預(yù)測模型基本步驟如下:
Step1:多因素選擇。對港口貨物吞吐量及其影響因素做多元線性回歸分析,由于自變量之間存在多重共線性,對模型進(jìn)行調(diào)整,采用逐步回歸法,綜合擬合優(yōu)度和顯著性效果,選出三個(gè)因素,分別為碼頭長度、GDP和進(jìn)出口總額。
Step2:BP神經(jīng)網(wǎng)絡(luò)預(yù)測。將上述三個(gè)影響因素與歷史數(shù)據(jù)共同作為輸入量,并用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測。
Step3:誤差修正。前一階段的預(yù)測精度仍有待提高,因此進(jìn)行誤差修正,將BP神經(jīng)網(wǎng)絡(luò)預(yù)測出的數(shù)據(jù)與歷史數(shù)據(jù)相減得到的誤差序列,此時(shí)再用BP神經(jīng)網(wǎng)絡(luò)對誤差序列進(jìn)行預(yù)測,并將預(yù)測結(jié)果與BP預(yù)測結(jié)果相加得到港口貨物吞吐量最終預(yù)測值。
Step4:對比分析。為驗(yàn)證模型的有效性,利用MAPE值、相對誤差和誤差均值作為評價(jià)指標(biāo)進(jìn)行分析。并與其他模型進(jìn)行對比,結(jié)果表明,本文提出的基于多因素和誤差修正的BP神經(jīng)網(wǎng)絡(luò)港口貨物吞吐量預(yù)測模型具有更優(yōu)預(yù)測效果的結(jié)論。
3? 實(shí)例分析
3.1 數(shù)據(jù)來源與評價(jià)指標(biāo)選擇
3.1.1 數(shù)據(jù)來源
本文選擇2000-2018年全國港口貨物吞吐量及其影響因素的年度數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)來源于國家統(tǒng)計(jì)局(http://www.stats.gov.cn/),如圖3所示。樣本數(shù)據(jù)為進(jìn)出口總額、GDP及碼頭長度的年度數(shù)據(jù),將樣本數(shù)據(jù)分為兩個(gè)部分,2000-2014年的作為訓(xùn)練集,2015-2018年的作為測試集。