曹志成,劉伊生,董繼偉
(北京交通大學經濟管理學院,北京100044)
隨著我國高速鐵路建設的不斷發(fā)展,高速鐵路以其載客數量大、耗時少、安全性強、正點率高等特點吸引著越來越多的旅客作為其出行的首選交通方式。據統計,2008—2017年我國鐵路旅客發(fā)送量年均增長8.70%,鐵路旅客發(fā)送量呈現逐年增長的態(tài)勢。只有鐵路的運輸能力匹配客運需求,才能確保鐵路營運暢通,提高運輸質量[1]。因此,科學有效地預測鐵路旅客發(fā)送量,有利于鐵路資源合理配置,促進我國鐵路運輸健康發(fā)展[2]。
目前,鐵路旅客發(fā)送量預測的研究方法主要采用線性回歸分析、灰色預測法、馬爾科夫預測模型、神經網絡模型等。例如,陳鵬等[3]采用灰色GM (1,1)模型和馬爾科夫模型相結合形成的一種新的灰色馬爾科夫鐵路客運量預測模型對鐵路客運量進行預測;郝軍章等[2]建立SARIMA模型,并經過逐期差分和季節(jié)差分后最終建立ARIMA (1,2,2)×(1,1,1)6模型,并對我國鐵路客運量進行預測;侯麗敏等[4]運用灰色預測理論構建灰色模型GM (1,1)與線性回歸相結合的數學模型,并對河南省的鐵路客運量進行了預測;楊祺煊[5]針對鐵路客運量變量關系復雜、影響因素多的特點,建立了主成分分析與GA-BP網絡相結合的預測模型,并對天津鐵路客運量進行了預測;王梟[6]提出了一種優(yōu)化的遺傳算法模型,并對我國鐵路旅客發(fā)送量進行了預測。上述方法雖然對我國鐵路旅客發(fā)送量進行了較好預測,但存在可信度低、周期長[7]等缺點。三次指數平滑法能夠根據時序的變化,清晰地顯示出時序的變化趨勢,對波動范圍較大且呈非線性變化規(guī)律的數據具有很強的適用性,具有預測可信度較高、基礎數據周期要求短、操作便捷且使用方便等優(yōu)點,而鐵路旅客發(fā)送量數據具有一定的波動性,并呈現出一定的非線性變化趨勢。因此,選用三次指數平滑法對鐵路旅客發(fā)送量進行預測,并通過實例驗證其適用性。
指數平滑法是一種時間序列分析預測法,該方法是通過計算指數的平滑值,結合合理的時間序列預測模型,根據目前的現狀數據對未來趨勢進行預測。三次指數平滑法是指數平滑法的一種,適用于時間序列呈現拋物線趨勢的非線性數據,使用便捷,在各個領域均有應用[8]。
以n年為原始時間序列的期數,即選取鐵路旅客發(fā)送量數據的期數。記Xt為第t年的鐵路旅客實際發(fā)送量(t= 1,2,…,n),預測未來年的鐵路旅客發(fā)送量。
構建基于三次指數平滑法的鐵路旅客發(fā)送量預測模型為
式中:Yt+T為當期鐵路旅客發(fā)送量預測值;T為預測超前期數;at,bt,ct為第t年的預測系數;分別為第t年對應的一次、二次、三次指數平滑值;α為權重系數,且分別為一次、二次、三次指數平滑的平滑初始值。
(1)確定初始值。在一般的指數平滑法預測過程中,當原始時間序列的期數較多(一般為大于15項)時,可認為初始值對預測結果產生的影響較小,因而選擇原始數列第1期的實際數據值作為初始值;當原始時間序列的期數較少(一般為小于15項)時,可認為初始值對預測結果產生的影響較大,因而一般選擇原始數據前3期的平均值作為初始值。
(2)選擇權重系數。權重系數α是在預測過程中,新舊數據起不同作用的比例因子[9],0 <α< 1。α越大,表明預測中對新數據重視度越高,新數據所起作用越大,預測結果的靈敏度越高,適應新水平能力越好;α越小,表明預測中對舊數據的重視程度越高,預測結果比較保守,對實際數據的變動反應較遲緩,易于產生滯后性。通常情況下,α取值的規(guī)律為:當時間序列呈現較穩(wěn)定的水平趨勢時,選取較小的α值,一般在0.05 ~ 0.2之間取值;當時間序列有波動,但長期趨勢變化不大時,選取稍大的α值,一般在0.3 ~ 0.5之間取值;當時間序列波動很大,長期趨勢變化幅度較大,呈現明顯且迅速的上升或下降趨勢時,選取較大的α值,一般在0.6 ~ 0.8之間取值。
(3)進行數據預測。①將求得的初始值與權重系數α代入公式 ⑸ 至公式 ⑺,得出一次、二次、三次平滑修勻新數列值;②根據公式 ⑵ 至公式 ⑷計算各年的預測系數,為三次指數平滑計算提供基礎;③根據三次指數平滑公式 ⑴,選取合適的預測超前指數,對未來數據進行預測,并得到最終的結果。
以我國鐵路旅客發(fā)送量的預測為例,選取2008—2017年我國鐵路旅客發(fā)送量數據作為原始數據樣本,預測2018年、2019年我國鐵路旅客發(fā)送量數據。
2008—2017年我國鐵路旅客發(fā)送量如表1所示。
表1 2008—2017年我國鐵路旅客發(fā)送量 萬人Tab.1 National railway passenger volume from 2008 to 2017
根據表1中2008—2017年我國鐵路旅客發(fā)送量數據可看出原始時間序列的期數n= 10,小于15,因而選擇原始數據的前3者取平均值作為平滑初始值,可得
將表1中的原始數據代入公式⑻可得
為了觀測2008—2017年我國鐵路旅客發(fā)送量的變化情況,計算出每年鐵路旅客量的變化值,即相鄰2年旅客量的差值。通過計算得到2008—2017年我國鐵路旅客發(fā)送量變化值如表2所示。
表2 2008—2017年我國鐵路旅客發(fā)送量變化值 萬人Tab.2 Variation value of railway passenger transport in China from 2008 to 2017
可以看出,我國鐵路旅客發(fā)送量存在波動,除2008—2009年和2011—2012年2個時間段的波動較大以外,其他時間段的斜率值基本穩(wěn)定在2 000左右,因而長期趨勢變化不大,α可在0.3~0.5之間取值。在實際的權重系數確定過程中,通常情況下會在取值范圍內選擇幾個α進行試算,之后根據實際數據與預測結果比較后,選擇誤差較小者。為了選擇準確的α值,分別選取α= 0.3,α=0.4,α= 0.5對我國鐵路旅客發(fā)送量進行預測,α=0.3,α= 0.4,α= 0.5時預測值與實際值對比結果如表3所示。
由表3可以看出α= 0.5時,預測值與實際值的誤差較小,且2016、2017年的預測值基本上與實際值相差無幾,預測誤差分別為0.86%、0.42%。因此,選用α= 0.5作為預測權重系數。
表3 α = 0.3,α = 0.4,α = 0.5時預測值與實際值對比結果萬人Tab.3 Comparison between predicted value and actual value at α = 0.3, α = 0.4, α = 0.5
(1)預測結果與實際數據比較分析。為了分析實際數據與預測結果之間是否具有較高的相關性,對2009—2017年的實際數據與預測結果采用皮爾遜相關系數進行檢驗,皮爾遜相關系數是一種度量2組數據相關程度的方法。運用SPSS對數據進行分析處理后得到α= 0.05時實際值與預測值相關性的計算表。實際值與預測值相關性計算表如表5所示。
表4 三次指數平滑法預測值Tab.4 Predictive value of cubic exponential smoothing method
由表5可知,實際值與預測值相關系數R= 0.988,表明實際值與預測值顯著相關。概率值P = 0.000 <0.05,即說明實際值與預測值之間存在顯著相關性。
為分析實際數據與預測結果是否有較大的差異性,采用F檢驗來判斷2009—2017年的實際值與預測結果之間的差異性程度。運用Excel對數據進行分析處理,得到實際值與預測值差異性計算表如表6所示。
表5 α = 0.05時實際值與預測值相關性計算表Tab.5 Correlation between actual value and predicted value at α = 0.05
表6 α = 0.05時實際值與預測值差異性計算表Tab.6 Difference between actual value and predicted value at α = 0.05
由表6可知,F = 0.008 456,F crit = 4.600 11,F < F crit,表明F值在α= 0.05的水平上不顯著,即實際值與預測值在α= 0.05的水平上不存在顯著的差異性。由此可知,預測結果與實際數據具有顯著的相關性和不顯著的差異性,因而預測結果可信度較高。
(2)預測結果精確度分析。從目前已有的實際值與計算出的預測值的誤差分析可以得出整體預測誤差為4.47%,2016年、2017年實際值與預測值的誤差分別為0.86%和0.42%,誤差極小,由此可知,采用三次指數平滑法預測鐵路旅客發(fā)送量具有較高精度。
對于2018年、2019年的預測結果,從預測誤差方面看,根據三次指數平滑法的短周期的特點,預測出的2018年、2019年的數據誤差應該靠近2016年、2017年的誤差,初步判斷2018年、2019年2年的預測誤差應在1%~5%之間;從預測數字方面看,未來2年的旅客發(fā)送量呈現出較為穩(wěn)定的上升趨勢,旅客數量將不斷增加,鐵路相關部門應該采取相應的措施,保證出行旅客數量與鐵路運輸能力的匹配,使我國的鐵路旅客運輸能夠安全、健康、有秩序地運行。
鐵路旅客發(fā)送量的預測是鐵路客運部門編制客運計劃和制定客運發(fā)展政策的基礎,是一項具有重要意義的工作。由于鐵路旅客發(fā)送量的數據具有一定的波動性,鐵路旅客發(fā)送量的預測往往難以達到絕對精準。將三次指數平滑法模型應用到我國鐵路旅客發(fā)送量的預測中,避免了其他預測方法冗雜、繁復的問題,且預測結果分析表明,三次指數平滑法預測結果整體上精度較高、效果較好。三次指數平滑法僅僅基于數據對鐵路旅客發(fā)送量進行預測,而在大多數情況下,鐵路旅客發(fā)送量是受多種復雜因素影響的,在今后的研究中,應考慮多種主客觀因素對鐵路旅客發(fā)送量預測產生的影響。