楊 飛 張云嬌 范丁元
(中鐵工程設(shè)計咨詢集團(tuán)有限公司,北京 100055)
隨著我國工業(yè)化和城鎮(zhèn)化的快速發(fā)展,鐵路因其大運(yùn)量、便捷、快速、舒適等特性,在保障城鎮(zhèn)人口大量流動,促進(jìn)經(jīng)濟(jì)聯(lián)系,帶動相關(guān)產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級方面起到了重要作用。鐵路客運(yùn)量預(yù)測是制定鐵路客運(yùn)宏觀發(fā)展戰(zhàn)略和編制客運(yùn)計劃的重要依據(jù),其準(zhǔn)確性與可靠性對制定鐵路線網(wǎng)規(guī)劃、設(shè)計列車開行方案、優(yōu)化客運(yùn)產(chǎn)品結(jié)構(gòu)、提升旅客運(yùn)輸服務(wù)水平等具有重要意義[1]。
鐵路客運(yùn)量預(yù)測方法可分為線性預(yù)測和非線性預(yù)測模型兩類。其中,線性預(yù)測模型中應(yīng)用較廣的是線性回歸預(yù)測,而神經(jīng)網(wǎng)絡(luò)預(yù)測模型憑借其高度的非線性、強(qiáng)大的學(xué)習(xí)性等特點(diǎn)成為非線性預(yù)測方法的代表。無論采用哪一種預(yù)測方法,預(yù)測結(jié)果與實(shí)際客運(yùn)量均存在一定的誤差。因此,許多學(xué)者會先對研究對象進(jìn)行運(yùn)量預(yù)測,再借助馬爾科夫模型對預(yù)測結(jié)果進(jìn)行修正,以提高模型預(yù)測結(jié)果的精度。呂鵬飛[2]應(yīng)用馬爾科夫模型對船舶交通量的多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果進(jìn)行修正;裴同松[3]應(yīng)用馬爾科夫模型對公路客運(yùn)量的多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果進(jìn)行改進(jìn);尚慶松[4]結(jié)合馬爾科夫模型與灰色預(yù)測模型對售票窗口的客運(yùn)量進(jìn)行預(yù)測;周子?xùn)|[5]利用馬爾科夫模型對最小二乘回歸模型的預(yù)測結(jié)果進(jìn)行修正;馬彩雯[6]利用馬爾科夫模型對灰色預(yù)測模型的預(yù)測結(jié)果進(jìn)行改進(jìn)。馬爾科夫模型在預(yù)測過程中,通常采用統(tǒng)計估算法對預(yù)測結(jié)果所屬的狀態(tài)區(qū)間進(jìn)行劃分,常用的有均等劃分、均值-方差法和黃金分割法等。這類方法劃分狀態(tài)區(qū)間時,狀態(tài)區(qū)間劃分的數(shù)量和取值具有一定的主觀性和隨機(jī)性,使得馬爾科夫模型對預(yù)測值的改進(jìn)效果具有一定的不確定性,可能導(dǎo)致馬爾科夫修正值的精度更差,影響整體預(yù)測精度。潘麗[7]將預(yù)測誤差狀態(tài)區(qū)間劃分為長度相等的區(qū)間并進(jìn)行馬爾科夫修正,即區(qū)間均等劃分,其第5 組馬爾科夫預(yù)測修正值的誤差較修正前大1.87%;何啟[8]通過均值-方差法將預(yù)測結(jié)果劃分為5 個不同的狀態(tài),其第4 組馬爾科夫預(yù)測修正值的誤差較修正前大0.336%。
為了解決馬爾科夫模型在預(yù)測過程中的不確定性問題,并提高其預(yù)測精度,本文在預(yù)測精度更優(yōu)條件下,研究馬爾科夫模型中狀態(tài)區(qū)間劃分的取值方法。通過多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測2004—2019年的北京市鐵路客運(yùn)量,運(yùn)用改進(jìn)的馬爾科夫模型對多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果進(jìn)行修正,并與均等劃分、均值-方差法劃分狀態(tài)區(qū)間的馬爾科夫模型的預(yù)測修正結(jié)果進(jìn)行對比,以驗(yàn)證改進(jìn)馬爾科夫模型的預(yù)測效果。
馬爾科夫理論多用于研究時間序列數(shù)據(jù)的狀態(tài)和轉(zhuǎn)移規(guī)律,其認(rèn)為一個序列可劃分為若干種狀態(tài),時刻ti的狀態(tài)僅由時刻ti-1的狀態(tài)決定,而與ti-1之前的狀態(tài)無關(guān),即馬爾科夫性質(zhì)。假設(shè)鐵路客運(yùn)量預(yù)測誤差的狀態(tài)變化具有馬爾科夫性質(zhì),一組鐵路客運(yùn)量的預(yù)測誤差序列S(t)可劃分為m 種狀態(tài),通過研究序列S(t)中各狀態(tài)的初始概率向量和狀態(tài)轉(zhuǎn)移規(guī)律,來預(yù)測該序列下一時刻最有可能所處的狀態(tài),進(jìn)一步對預(yù)測結(jié)果進(jìn)行修正。運(yùn)用馬爾科夫模型對鐵路客運(yùn)量進(jìn)行預(yù)測修正過程可分為以下5 步:
(1)鐵路客運(yùn)量預(yù)測
選擇一種合適的方法先對研究區(qū)域往年及預(yù)測年度的鐵路客運(yùn)量進(jìn)行預(yù)測并計算其誤差。
(2)劃分狀態(tài)區(qū)間
(3)計算狀態(tài)轉(zhuǎn)移概率矩陣
根據(jù)狀態(tài)劃分區(qū)間將往年客運(yùn)量的預(yù)測誤差歸屬于相應(yīng)的狀態(tài),并計算狀態(tài)Ei經(jīng)過一步轉(zhuǎn)移到狀態(tài)Ej的概率[9]:
則一步狀態(tài)轉(zhuǎn)移矩陣為:
根據(jù)C-K 方程,狀態(tài)Ei經(jīng)過k 步轉(zhuǎn)移到狀態(tài)Ej的概率矩陣為:
(4)計算初始狀態(tài)的概率向量
假設(shè)往年鐵路客運(yùn)量預(yù)測誤差序列S(t)中最后一組樣本的狀態(tài)為Ei,則其初始狀態(tài)概率向量P(0)是第j 列概率為1 且其余列概率為0 的行向量:
(5)修正鐵路客運(yùn)量預(yù)測值
初始狀態(tài)概率向量經(jīng)過k 步轉(zhuǎn)移到預(yù)測年度的狀態(tài)概率向量P(k)為:
根據(jù)狀態(tài)向量P(k)可以判斷預(yù)測年度所處的誤差狀態(tài)Ei,原預(yù)測值的馬爾科夫修正值計算公式為:
式中:S預(yù)測——鐵路客運(yùn)量預(yù)測值;
S修正——鐵路客運(yùn)量預(yù)測值的馬爾科夫修正值;
ai、bi——狀態(tài)Ei的區(qū)間取值。
為提高預(yù)測年度馬爾科夫預(yù)測修正值的精度,馬爾科夫預(yù)測修正值與原預(yù)測值、實(shí)際值具有以下關(guān)系:
式中:S實(shí)際——實(shí)際鐵路客運(yùn)量。
將式(6)帶入式(7)可得:
整理可得狀態(tài)劃分區(qū)間取值范圍為:
同理,求解可得狀態(tài)劃分區(qū)間的取值范圍:
式(11)、式(13)為劃分的狀態(tài)區(qū)間取值與鐵路客運(yùn)量預(yù)測值和實(shí)際值的關(guān)系,當(dāng)滿足其一時,可進(jìn)一步提高馬爾科夫預(yù)測修正值的精度。
根據(jù)劃分狀態(tài)區(qū)間的取值范圍約束,對馬爾科夫預(yù)測過程進(jìn)行優(yōu)化,如圖1所示。
圖1 馬爾科夫預(yù)測優(yōu)化過程圖
該方法是根據(jù)式(11)或式(13)先計算往年的客運(yùn)量預(yù)測誤差序列S(t)中每一組數(shù)據(jù)對應(yīng)的ai+bi的取值范圍[αi,βi],將每組數(shù)據(jù)取中值,即(αi+βi)/2,再取其平均值帶入式(6)對預(yù)測年度的預(yù)測值進(jìn)行修正。此法打破傳統(tǒng)馬爾科夫預(yù)測的流程和模式,無需計算k 步狀態(tài)轉(zhuǎn)移概率矩陣,解決了狀態(tài)劃分方法優(yōu)化難度大、狀態(tài)轉(zhuǎn)移概率矩陣計算量大等問題,其誤差精度的優(yōu)劣是本文論證研究的重點(diǎn)。
影響鐵路客運(yùn)量預(yù)測的因素[10]可分為宏觀因素和微觀因素兩類。宏觀因素包括經(jīng)濟(jì)實(shí)力、人口規(guī)模、社會發(fā)展水平、交通建設(shè)情況、旅游業(yè)發(fā)展水平、國家政策等;微觀因素包括鐵路運(yùn)輸設(shè)施設(shè)備屬性和旅客屬性兩類,主要有運(yùn)輸時間、費(fèi)用、服務(wù)質(zhì)量、出行目的、出行距離、出行偏好等??紤]北京市鐵路客運(yùn)量的特點(diǎn)及指標(biāo)數(shù)據(jù)獲取的可操作性,本文主要考慮地區(qū)生產(chǎn)總值、地區(qū)常住人口、人均消費(fèi)水平、旅游人數(shù)對鐵路客運(yùn)量預(yù)測的影響。通過北京市2020年統(tǒng)計年鑒獲取相關(guān)數(shù)據(jù),借助SPSS 軟件構(gòu)造其多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測模型,如圖2所示。其中,隱藏層數(shù)設(shè)為1 層,隱藏單元為1 個,隱藏層激活函數(shù)為雙曲正切函數(shù)。
圖2 北京市鐵路客運(yùn)量多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測模型圖
借助SPSS 軟件預(yù)測北京市2004—2019年鐵路客運(yùn)量,預(yù)測殘差如圖3所示,預(yù)測結(jié)果如表1所示。
表1 北京市鐵路客運(yùn)量預(yù)測結(jié)果表
圖3 北京市鐵路客運(yùn)量多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測殘差圖
由圖3 可知,部分多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測值與真實(shí)值存在一定的差異,可結(jié)合馬爾科夫模型對預(yù)測值進(jìn)行進(jìn)一步修正,以提高預(yù)測精度。
為了對比常用的均等劃分、均值-方差法劃分誤差狀態(tài)區(qū)間的馬爾科夫預(yù)測精度以及本文提出的優(yōu)化馬爾科夫預(yù)測過程法的預(yù)測精度,將2004—2016年北京市鐵路客運(yùn)量實(shí)際值和多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測值視為研究對象,研究其狀態(tài)區(qū)間劃分及狀態(tài)轉(zhuǎn)移規(guī)律,并視2017—2019年為預(yù)測年度,對其鐵路客運(yùn)量多層感知器神經(jīng)網(wǎng)絡(luò)的預(yù)測值進(jìn)行修正計算。
(1)均等劃分法
由表1 可知,2004—2016年北京市鐵路客運(yùn)量預(yù)測誤差范圍為-3.881%~3.006%,將誤差序列平均劃分為E1、E2、E3、E4、E5共5 個狀態(tài),則每個狀態(tài)區(qū)間長度均為1.377%。因此,各狀態(tài)區(qū)間取值為:E1∈[-3.881%,-2.504%)、E2∈[-2.504%,-1.126%)、E3∈[-1.126%,0.251%)、E4∈[0.251%,1.629%)和E5∈[1.629%,3.006%]。
將2004—2016年多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測的誤差按照狀態(tài)區(qū)間劃分結(jié)果進(jìn)行分類,根據(jù)馬爾科夫過程,狀態(tài)Ei經(jīng)過一步轉(zhuǎn)移到狀態(tài)Ej的頻數(shù),如表2所示。
表2 均等劃分法的狀態(tài)轉(zhuǎn)移頻數(shù)表
由表2 和式(1)~式(3)計算得2016年鐵路客運(yùn)量預(yù)測誤差狀態(tài)的一步、兩步和三步狀態(tài)轉(zhuǎn)移概率矩陣分別為:
2016年北京市鐵路客運(yùn)量預(yù)測誤差所處狀態(tài)為E3,故其初始狀態(tài)的概率向量為P(0)=(0 0 1 0 0),根據(jù)式(5)計算可得2017—2019年?duì)顟B(tài)轉(zhuǎn)移概率向量分別為:
可知2017—2019年預(yù)測誤差最有可能所處的狀態(tài)分別為E4、E3、E3,概率分別為0.4、0.573、0.48。根據(jù)式(6)計算得其預(yù)測修正值,如表3所示。
表3 均等劃分法的馬爾科夫預(yù)測修正結(jié)果表
由表3 可知,采用均等劃分法對誤差狀態(tài)區(qū)間進(jìn)行劃分時,2019年的馬爾科夫預(yù)測修正值的誤差比多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測更小,這表明馬爾科夫模型在一定程度上能夠提高預(yù)測精度。然而,2017年、2018年的馬爾科夫預(yù)測修正值的誤差絕對值更大,這是因?yàn)闋顟B(tài)區(qū)間劃分時未考慮誤差精度的影響,確定的誤差狀態(tài)數(shù)和區(qū)間取值具有一定的主觀性和隨機(jī)性,影響馬爾科夫預(yù)測修正值的整體精度。
(2)均值-方差法
均值-方差法將預(yù)測誤差分為5 組,其變化區(qū)間計算公式為:
s——預(yù)測誤差方差。
表4 均值-方差法的馬爾科夫預(yù)測修正結(jié)果表
由表4 可知,均值-方差法的狀態(tài)區(qū)間劃分時也未考慮誤差精度的影響,其2017年、2018年的馬爾科夫預(yù)測修正值的誤差絕對值更大,影響馬爾科夫預(yù)測修正的整體精度。
(3)優(yōu)化馬爾科夫預(yù)測過程法
根據(jù)式(13)計算得2004—2016年北京市鐵路客運(yùn)量預(yù)測誤差狀態(tài)區(qū)間的ai+bi取值范圍,如表5所示。
表5 ai + bi 取值范圍表
由表1、表5 可知,當(dāng)實(shí)際值大于預(yù)測值時,相應(yīng)年份ai+bi取值范圍中值的平均值為-0.03;實(shí)際值小于預(yù)測值時,相應(yīng)年份ai+bi取值范圍中值的平均值為0.013。計算可知2017年與2018年的ai+bi取0.013,2019年的ai+bi取-0.03 時預(yù)測精度最好,由式(6)計算可得2017—2019年鐵路客運(yùn)量預(yù)測修正值如表6所示。
表6 優(yōu)化馬爾科夫預(yù)測過程法的預(yù)測修正結(jié)果表
由表6 可知,本文提出的優(yōu)化馬爾科夫預(yù)測過程法進(jìn)行預(yù)測值修正時,其預(yù)測修正值的誤差絕對值均小于多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測值的誤差,優(yōu)化模型的精度較好。
綜上所述,各預(yù)測方法預(yù)測誤差絕對值的均值如圖4所示。
圖4 各預(yù)測方法誤差對比圖(%)
由圖4 可知:
①均等劃分和均值-方差法劃分的狀態(tài)區(qū)間取值受到劃分方法和劃分狀態(tài)數(shù)量的影響,具有一定的主觀性和隨機(jī)性,無法保證每一組預(yù)測修正值的誤差精度較原預(yù)測結(jié)果有所提升,導(dǎo)致馬爾科夫預(yù)測修正值的平均誤差較多層感知器神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差更大。
②本文考慮誤差精度而改進(jìn)的馬爾科夫預(yù)測過程法的精度更佳,其誤差比均等劃分和均值-方差的馬爾科夫預(yù)測方法分別降低了0.601%、0.683%,比多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測誤差降低了0.541%,且無需計算k 步狀態(tài)概率轉(zhuǎn)移矩陣,降低了預(yù)測過程的復(fù)雜性。
馬爾科夫預(yù)測模型一定程度上能提高鐵路客運(yùn)量預(yù)測的精度,但其狀態(tài)劃分方法及狀態(tài)數(shù)量的選擇具有一定的主觀性和隨機(jī)性,導(dǎo)致模型的預(yù)測精度存在不確定性。為解決這一問題,本文在考慮誤差精度的條件下,對劃分狀態(tài)區(qū)間的取值范圍進(jìn)行了研究,得到的主要結(jié)論如下:
(1)考慮誤差精度更優(yōu)條件下確定馬爾科夫模型劃分狀態(tài)區(qū)間取值范圍對解決馬爾科夫預(yù)測精度的不確定性問題具有重要意義,能有效保證馬爾科夫?qū)︻A(yù)測值進(jìn)行改進(jìn)的效果。
(2)改進(jìn)的馬爾科夫模型無需計算k 步狀態(tài)轉(zhuǎn)移概率矩陣,降低了預(yù)測過程的復(fù)雜性。
(3)相比于多層感知器神經(jīng)網(wǎng)絡(luò)、均等劃分的馬爾科夫模型、均值-方差的馬爾科夫模型,改進(jìn)的馬爾科夫模型具有更高的預(yù)測精度。
未來的研究仍需重點(diǎn)關(guān)注考慮誤差精度后狀態(tài)區(qū)間劃分方法的優(yōu)化,以進(jìn)一步提高馬爾科夫模型的預(yù)測精度。