黃 娟,劉雙賢
(四川旅游學院經(jīng)濟管理學院,四川 成都610100)
貨運量預測是港口規(guī)劃過程中非常關鍵的環(huán)節(jié),如何對現(xiàn)有數(shù)據(jù)進行分析,得到期望的參數(shù)和模型;如何發(fā)現(xiàn)各個變量之間的關系,準確預測港口未來的運量一直是值得研究的問題。
關于運量的預測問題,現(xiàn)有的預測方法包括時間序列分析方法、灰色預測方法、指數(shù)平滑法[1]、KS檢驗[2]、重力模型[3-4]等。曾佑新[5]等采用一元線性回歸模型、直線趨勢模型、自回歸模型、二次指數(shù)平滑法對中國鐵路煤炭的運量進行預測,對四種預測模型的誤差進行比較與分析;FITE等[6]使用逐步多元線性回歸模型,將貨運量與各種經(jīng)濟指標聯(lián)系起來;RAHIM等[7]通過用模糊時間序列和指數(shù)平滑方法提出了一種CPO價格預測方法。
本文基于線性回歸和趨勢預測構建組合預測模型,通過R語言篩選剔除自變量,并對模型進行擬合,建立組合預測模型。以瀘州市2006—2018年的貨運量數(shù)據(jù)為例驗證模型的有效性。
線性回歸預測方法是屬于因果分析預測方法的一種典型方法。主要探究導致運量增加的原因與總運量之間的關系,假設運量V1j表示如下:
式(1)中:a為截距;b、c、m、q、k為自變量系數(shù);X1j為某年城鄉(xiāng)人均消費收入;X2j為某年人口總量;X3j為某年城鄉(xiāng)人均消費支出;X4j為某年第二產(chǎn)業(yè)的總產(chǎn)值;X5j為某年礦建材料吞吐量。
根據(jù)模型的現(xiàn)實意義,現(xiàn)有自變量反復冗雜,需要對自變量進行剔除,對模型進行擬合得到關于總運量的線性模型。
假設總運量變化情況符合線性趨勢,則:
式(2)中:V2j為某一年的預測總運量值;α為截距;β為自變量系數(shù);Xj為年份;εj為不可測因素。
根據(jù)上述所提出的兩種預測方法,可以分別對總運量作出基本合理的預測,以兩種預測結果的平均值作為最終預測值,如式(3)所示。
本文以瀘州市2006—2018年的貨運量(公路、水路、鐵路)為基數(shù)數(shù)據(jù),采用R語言進行自變量剔除和模型擬合,基礎數(shù)據(jù)如表1、表2所示。
表1 瀘州市2006—2018年貨運量
表2 瀘州市運量變化的影響因素
由現(xiàn)有數(shù)據(jù)可以看出,瀘州市的總運量基本隨著年份的增加而均勻增加,受其他因素的影響較小,顯著呈現(xiàn)出線性趨勢。從模型的精確度的層面來說,選擇線性回歸方法來對參數(shù)進行標定更能夠精確地說明運量的變化趨勢。但是在實際運用中,對某一年度的運量進行預測,實質上是對某一年度運量的影響因素進行量化與預測,需要特別注意自變量的數(shù)量,以便減小誤差。R語言初步的運算結果如表3所示。
表3 初步運算結果
僅從p值的角度來看,因數(shù)據(jù)冗雜,模型的擬合程度很低,效果較差。Signif.codes標注預測變量的顯著性,顯著性依次遞減,p值越小,越顯著,就拒絕原假設(即系數(shù)為0)。p值越大,將對應的變量從模型中移除。首先對X4進行剔除,運算結果如表4所示。
表4 剔除自變量X4
這一步的運算結果展示中,在自變量部分已經(jīng)出現(xiàn)一個自變量的p值顯著,說明了數(shù)據(jù)之間的相關性。再依次剔除X5、X1、X2,經(jīng)過計算,總運量預測模型為:
其中:
由于這一步采用的是趨勢預測法,因此不涉及自變量剔除的情況,運算結果如表5所示。
表5 計算結果
由運算結果可知,截距與自變量X都極為顯著,模型擬合效果非常顯,著總運量預測模型為:
組合預測結果如圖1、表6所示。由預測結果可知,組合預測的最大最小相對誤差分別為11.05%和2.38%,平均相對誤差為6.04%,平均誤差值為446.61。
圖1 組合預測結果
準確預測貨運量是開展貨運組織工作的關鍵環(huán)節(jié),本文基于線性回歸和趨勢預測構建的組合預測模型計算簡單,通過R語言剔除自變量和模型擬合,平均預測相對誤差為6.04%,適用于波動較小的短期貨運量預測,可為決策者提供參考。