于少強,周鈺博,陳 康,肖長凱,林宇玲
(大連海事大學 航運經(jīng)濟與管理學院,遼寧 大連 116026)
集裝箱運輸相較于傳統(tǒng)的雜貨運輸方式有著能保障貨物運輸安全、提高裝卸作業(yè)效率、便于自動化管理等優(yōu)勢,可大幅提高港口作業(yè)的工作效率及經(jīng)濟效益,已成為國際貿(mào)易運輸?shù)闹饕问?。而集裝箱吞吐量作為衡量各港口發(fā)展狀況的關鍵指標,是港口發(fā)展狀態(tài)分析與相關政策制定的重要參考依據(jù)。鑒于“十四五規(guī)劃”中我國集裝箱港口群已經(jīng)被賦予了推動“一帶一路”高質(zhì)量發(fā)展的艱巨使命,精確預測港口吞吐量,進而分析和把握我國港口群的發(fā)展態(tài)勢,挖掘存在的問題和機遇便顯得尤為重要。
然而,集裝箱港口的吞吐量預測并不容易,其受國家政策、自然天氣、科技水平等多種因素的影響,具有顯著的隨機性和不確定性。因而港口吞吐量預測也是港航領域?qū)W術界討論的熱點之一。目前學術界基于港口集裝箱吞吐量預測提出的方法較為豐富,主要有時間序列法、灰色預測法、神經(jīng)網(wǎng)絡法等??琢樟?,等基于時間序列分析建立模型,借助R軟件預測了某港口十個月的集裝箱吞吐量數(shù)據(jù)。Javed考慮到季節(jié)變化對吞吐量的影響,建立SARIMA模型為港口吞吐量的短期預測提供了一種思路。劉宇璐,等運用ARIMA模型,對武漢港貨物吞吐量做出預測及規(guī)律分析。而在運用灰色預測模型方面,嚴雪晴基于灰色理論,利用GM(1,1)模型對廣東省貨運總量發(fā)展趨勢提供了參考;劉連花,等利用港口三個貨運指標,反映了新冠疫情對廣州港貨運增長的影響程度;杜泊松,等引入無偏灰色預測理論對傳統(tǒng)GM(1,1)模型進行優(yōu)化,并用馬爾可夫理論對模型預測殘差值進行修正,為預測貨物吞吐量提供了新方法。楊金花運用灰色預測法預測上海港未來3年的集裝箱吞吐量。近年來很多學者利用神經(jīng)網(wǎng)絡具有高度自組織、自學習、泛化能力強等優(yōu)點,結(jié)合歷史數(shù)據(jù)對港口吞吐量進行預測:劉長儉,等采用逐步遞歸的方法,運用神經(jīng)網(wǎng)絡對集裝箱吞吐量的預測提供了一種方法。李廣儒,等引入寧波舟山港的數(shù)據(jù),結(jié)合Elman網(wǎng)絡證實了模型的有效性。程文忠,等運用支持向量機(SVM)理論,對九江港貨物吞吐量進行預測,驗證了模型的可行性。Huang,等提出了基于人工蜂群(ABC)優(yōu)化BP神經(jīng)網(wǎng)絡的港口吞吐量預測模型。除此之外,組合模型、指數(shù)平滑法等方法在港口吞吐量預測方面也發(fā)揮了重要作用。這些方法從各種角度為港口的吞吐量預測提供了思路,但各自也有一定的局限性。
具體而言,灰色分析預測法使用的是生成的數(shù)據(jù)序列,適合近似指數(shù)增長的預測,不適用于長期預測。而時間序列法強調(diào)歷史數(shù)據(jù),當外界環(huán)境發(fā)生變化時對預測結(jié)果影響較大。組合模型法中各方法被主觀賦予的不同權重數(shù)值會使預測結(jié)果產(chǎn)生較大偏差。針對以上不足,神經(jīng)網(wǎng)絡預測法是一種具有顯著潛在優(yōu)勢的選擇。但是在傳統(tǒng)的神經(jīng)網(wǎng)絡中,用于網(wǎng)絡訓練的輸入變量的選取往往是基于個人經(jīng)驗,各輸入變量之間可能存在較大的耦合性,影響模型訓練效果;單純應用神經(jīng)網(wǎng)絡會導致其收斂陷入局部最優(yōu),降低訓練速率,影響預測精度。
針對上述不足,本文將基于既有的研究成果,提出一種基于GRA-GA-BP神經(jīng)網(wǎng)絡的港口集裝箱吞吐量預測模型。對于復雜多樣的集裝箱吞吐量的影響因素群,首先利用灰色關聯(lián)度分析法進行篩選及排序,選取關鍵影響因素作為輸入變量賦給GA-BP神經(jīng)網(wǎng)絡模型進行訓練和測試。遺傳算法是一種具有全局搜索能力、搜索效率高的搜索算法,獨特的編碼方式使其可以進行多種數(shù)據(jù)處理,在交通運輸領域應用普遍且廣泛。利用遺傳算法改進BP神經(jīng)網(wǎng)絡建立預測模型,能夠優(yōu)化網(wǎng)絡的初始權值與閾值,使模型預測準確度得到有效提高,避免陷入局部極值,提升運算效率。最終利用環(huán)渤海港口群中核心港口2001-2019年的集裝箱吞吐量數(shù)據(jù)作為訓練樣本橫向?qū)Ρ葌鹘y(tǒng)BP神經(jīng)網(wǎng)絡模型、GA-BP神經(jīng)網(wǎng)絡模型和優(yōu)化后的GRA-GA-BP神經(jīng)網(wǎng)絡模型,預測結(jié)果表明,與前兩種模型相比,GRA-GA-BP神經(jīng)網(wǎng)絡模型預測準確度更高。
針對集裝箱吞吐量易受多種因素影響的特點,運用灰色關聯(lián)分析法處理數(shù)據(jù)靈活、能顯示對象間動態(tài)關聯(lián)程度的優(yōu)勢,對港口集裝箱吞吐量及其影響因素進行分析,篩選出影響吞吐量變化的主要關聯(lián)因素。然后將這些因素作為遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的輸入神經(jīng)元,從而建立集裝箱吞吐量的預測模型。
灰色關聯(lián)分析(GRA,Grey Relational Analysis)是一種能顯示事物動態(tài)聯(lián)系程度的分析方法,其步驟如下:
步驟1確定y(t)(t=1,2,...,l)為反映系統(tǒng)特征的母序列,x(t),x(t),…,x(t)為影響系統(tǒng)特征的子序列。
步驟2對子、母序列進行標準化處理,消除量綱對各數(shù)列的影響。得到?()、?()、?()、…、?()。
步驟3計算子數(shù)列與母序列的關聯(lián)系數(shù):
步驟4計算關聯(lián)度并排序:
其中0≤R≤1,R越接近1,y(t)與x(t)的關聯(lián)性越強,計算出結(jié)果后按n個數(shù)列排序,x(t)排名越高,與y(t)關聯(lián)越強。
BP神經(jīng) 網(wǎng) 絡(BPNN,Back Propagation Neural Network)是模仿人類神經(jīng)元激活、傳遞過程的神經(jīng)網(wǎng)絡,具有自學習和自適應能力、能進行分布存儲、可以并行處理信息等特點,具有很強的非線性映射能力,因此可作為多因素影響前提下的理想預測工具。其工作流程如圖1所示。遺傳算法的基本思想來源于達爾文的生物進化論,通過自然選擇、交叉、變異以及迭代等步驟,最終選出最優(yōu)表征個體及其體內(nèi)的基因編碼。相比于傳統(tǒng)的優(yōu)化方法,遺傳算法在多參數(shù)探優(yōu)過程中有著出色的啟發(fā)式搜索能力。遺傳算法對BP神經(jīng)網(wǎng)絡輸出層間的連接權值和隱含層的閾值進行優(yōu)化,最后進行網(wǎng)絡輸出,具體流程如圖2所示。
圖1 BP神經(jīng)網(wǎng)絡流程圖
圖2 GRA-GA-BP模型流程圖
步驟1種群初始化。確定初始種群數(shù)量、最大迭代次數(shù)、期望輸出最大誤差、染色體的范圍等參數(shù)。每個個體包含輸入層和隱含層的連接權值、隱含層的閾值、隱含層和輸出層的連接權值及輸出層的閾值。
步驟2確定適應度函數(shù)。用訓練樣本數(shù)據(jù)訓練BP神經(jīng)網(wǎng)絡后,計算個體適應度值。計算公式為:
式(3)中,N為訓練數(shù)據(jù)個數(shù);P、Q分別為集裝箱吞吐量的實測輸出值和預測輸出值。
步驟3選擇操作。采用輪盤賭法進行選擇,復制當前種群適應度高的染色體,以此生長出新的種群,每個個體i被選擇的概率為:
步驟4交叉操作。用實數(shù)編碼法對選中的成對個體,交換它們之中的部分染色體以產(chǎn)生新的個體。其中第x個染色體a與第y個染色體a在第j點的概率公式為:
式(5)中,b是[0,1]之間的隨機數(shù)。
步驟5變異操作。對被選中的個體,以自適應遺傳算法得出的概率將某些基因染色體值進行重新編譯,得到全新個體。
步驟6賦值并訓練神經(jīng)網(wǎng)絡。更換為新染色體后重新計算個體適應度,若迭代次數(shù)在規(guī)定范圍內(nèi),將最優(yōu)個體中的權值和閾值賦予BP神經(jīng)網(wǎng)絡進行自我訓練直至誤差達到預期設定值,否則回到步驟2繼續(xù)訓練,得到新的適應度。
隨著海上貿(mào)易量不斷走高,我國逐漸形成了五大港口群,其中環(huán)渤海港口群作為北部沿海地區(qū)貿(mào)易運輸?shù)闹c,也是我國沿海規(guī)模最大的港口群,對北方經(jīng)濟發(fā)展有著舉足輕重的作用。近年來隨著中國開放型經(jīng)濟的發(fā)展,環(huán)渤海港口群技術迭代不斷加強,集裝箱吞吐量不斷走高,已經(jīng)成為我國北部經(jīng)濟發(fā)展的先鋒。環(huán)渤海港口群中,沿線億噸級大港包括青島港、大連港、天津港等,這些大港的經(jīng)營狀況很大程度上能體現(xiàn)環(huán)渤海港口群的運行狀態(tài)。對環(huán)渤海港口群的三大代表港口及直接腹地城市產(chǎn)生影響的各項因素進行分析,結(jié)合已有文獻研究,從綜合政策環(huán)境、經(jīng)濟發(fā)展、社會民生、港口集疏運能力等角度考慮,選取以下因素作為預測模型的輸入變量:全市生產(chǎn)總值(X)、全市社會商品零售額(X)、全市規(guī)模以上固定資產(chǎn)投資總額(X)、外貿(mào)進出口額(X)、第一產(chǎn)業(yè)產(chǎn)值(X)、第二產(chǎn)業(yè)產(chǎn)值(X)、第三產(chǎn)業(yè)產(chǎn)值(X)、全市居民人均可支配收入(X)、全市城鄉(xiāng)居民年末儲蓄余額(X)、全市水路貨物運輸量(X)、全市總?cè)丝跀?shù)(X)、全市本??粕藬?shù)(X),選取集裝箱吞吐量(Y)作為輸出變量,數(shù)據(jù)來源于國家統(tǒng)計網(wǎng)站、各港口城市統(tǒng)計年鑒、《中國港口年鑒》,少量缺失數(shù)據(jù)由插值法結(jié)合相關新聞報道加以填補。部分年份具體數(shù)據(jù)見表1。
表1 部分年份輸入變量基礎數(shù)據(jù)
利用灰色關聯(lián)分析法對選取的12個輸入變量按照灰色關聯(lián)度的大小進行篩選和排序,得到影響Y程度較大的因素,將其作為GA-BP模型的輸入變量,具體步驟為:
步驟1為消除量綱對分析的影響,歸一化輸入變量。設分辨系數(shù)r為0.5,利用matlab軟件編寫灰色關聯(lián)度計算程序,計算X與Y的關聯(lián)度值,見表2。
表2 Xi與Y1的關聯(lián)度
步驟2根據(jù)表2,按照關聯(lián)度的大小對X至X進行排序。
步驟3由灰色關聯(lián)度計算結(jié)果可知,X,X,X,X,X,X,X,X對Y影響較大,將它們作為輸入變量賦予GA-BP神經(jīng)網(wǎng)絡模型進行訓練和測試。
將X,X,X,X,X,X,X,X作為輸入變量,將Y作為輸出變量,建立GA-BP模型,設置網(wǎng)絡輸入層單元數(shù)為8,輸出層單元數(shù)為1,隱含層的神經(jīng)單元數(shù)L一般由經(jīng)驗公式獲得:
式(6)中,m為輸入層中的神經(jīng)單元數(shù),n為輸出層中的神經(jīng)單元數(shù),a為1至10之間的任意常數(shù)。由多次實驗比較結(jié)果可知,當L取8時預測精度和網(wǎng)絡收斂效率較高。網(wǎng)絡拓撲結(jié)構為8-6-1,權值個數(shù)設置為6×8+6×1=54個,閾值個數(shù)為6+1=7個。在遺傳算法中基因編碼長度設置為54+7=61個,迭代次數(shù)設置為50,種群規(guī)模為20,交叉概率為0.2,變異概率為0.1。神經(jīng)網(wǎng)絡設置最大訓練次數(shù)為1 000,模型訓練誤差為1×10,學習率為0.01。完成網(wǎng)絡結(jié)構設置后,利用matlab R2021a實現(xiàn)網(wǎng)絡的自我訓練與預測,選用2001-2015年三大港口及其腹地城市數(shù)據(jù)作為訓練樣本數(shù)據(jù),2016-2019年作為測試樣本數(shù)據(jù)。
利用2001-2015年的數(shù)據(jù),為證明GRA-GA-BP模型預測結(jié)果的準確性,分別對傳統(tǒng)BP網(wǎng) 絡、GA-BP網(wǎng) 絡、GRA-GA-BP網(wǎng)絡三種模型進行訓練,再利用訓練后的模型對2016-2019年的集裝箱吞吐量進行預測。設置三種模型的隱含層神經(jīng)元數(shù)和主要參數(shù)均相同,利用matlab軟件對數(shù)據(jù)進行分析和計算,分別得到預測結(jié)果和預測相對誤差,見表3。
由表3可知,GRA-GA-BP神經(jīng)網(wǎng)絡模型相比于未改進的傳統(tǒng)BP神經(jīng)網(wǎng)絡模型與GA-BP神經(jīng)網(wǎng)絡模型,在預測港口集裝箱吞吐量的效果上表現(xiàn)更好,預測的相對誤差區(qū)間范圍明顯小于另外兩種模型。再利用機器學習中評價預測精度常用的均方根誤差(RMSE)、平均絕對誤差(MAE)、平均相對誤差(MAPE)測試三種模型,各項誤差數(shù)據(jù)越小,代表預測精度高(見表4)。
表3 三種模型的預測值及與實際值的相對誤差
由表4可知,在其他參數(shù)設置相同的前提下,GRA-GA-BP模型的預測輸出表現(xiàn)優(yōu)于其他兩種模型,說明在集裝箱吞吐量預測方面,GRA-GA-BP模型相比傳統(tǒng)BP模型及GA-BP模型具有更高的準確性。由此得出結(jié)論,采用以BP神經(jīng)網(wǎng)絡為中心,利用灰色關聯(lián)分析篩選得出精簡后的輸入變量,利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值及閾值參數(shù)的綜合模型,是一種有效的港口集裝箱吞吐量預測方法,不僅能提高模型預測精度,也能更好地篩選出影響集裝箱吞吐量預測的因素,提高模型運算效率,節(jié)省模型運行時間。
表4 三種模型的預測誤差比較
針對航運業(yè)集裝箱吞吐量多影響因素為輸入變量的非線性系統(tǒng)特點,將灰色關聯(lián)度分析法、遺傳算法和BP神經(jīng)網(wǎng)絡模型相結(jié)合,提出一種應用于預測港口集裝箱吞吐量的GRA-GA-BP神經(jīng)網(wǎng)絡預測模型。為了確定對集裝箱吞吐量有關鍵影響的因素,使模型輸入變量的選取更準確有效,采用灰色關聯(lián)度分析確定集裝箱吞吐量的關鍵影響因素作為神經(jīng)網(wǎng)絡的輸入變量;引入遺傳算法作為優(yōu)化BP神經(jīng)網(wǎng)絡初始權值和閾值的工具。從環(huán)渤海港口群中核心港口的預測實例可以得到以下結(jié)論:本文中提出的GRAGA-BP神經(jīng)網(wǎng)絡模型的預測值均高于傳統(tǒng)BP模型與GA-BP模型,預測誤差也均小于后兩種模型,提高了預測精度,可以作為集裝箱吞吐量關鍵指標預測的一種有效工具。