呂秋霞,鐘曉情,任雅思
(五邑大學(xué) 軌道交通學(xué)院,廣東 江門 529020)
近年來,隨著我國經(jīng)濟(jì)的發(fā)展,城市的空間邊界快速外延,城際鐵路客流規(guī)模不斷擴(kuò)大. 如何科學(xué)把握城市間客運(yùn)需求狀態(tài),合理配置運(yùn)輸資源,從而持續(xù)提升運(yùn)輸服務(wù)質(zhì)量是一個(gè)重要問題. 客流預(yù)測是把握客運(yùn)需求的重要途徑,是鐵路企業(yè)運(yùn)營決策和動(dòng)態(tài)調(diào)整運(yùn)營的決定因素. 以日為單位的短期客流預(yù)測尤其具有挑戰(zhàn)性,因?yàn)槿湛土髁渴艿街苣?、?jié)假日、大型活動(dòng)等因素的影響,呈現(xiàn)出波動(dòng)性大、隨機(jī)性強(qiáng)的特點(diǎn),為提高預(yù)測的準(zhǔn)確性增加了難度.
傳統(tǒng)的預(yù)測模型多為參數(shù)模型,如灰色預(yù)測模型、指數(shù)平滑模型[1]、ARIMA[2]模型等,但當(dāng)原始數(shù)據(jù)存在非線性、不平穩(wěn)性等特征時(shí),預(yù)測的準(zhǔn)確性不夠. 神經(jīng)網(wǎng)絡(luò)模型[3-4]憑借其適應(yīng)性、非線性和映射力強(qiáng)等特點(diǎn),在客流預(yù)測中獲得了較好的預(yù)測效果,但是這類模型對(duì)已有數(shù)據(jù)的依賴性較大,對(duì)于開始運(yùn)營時(shí)間較短的線路,即歷史數(shù)據(jù)不充分情況,仍需要進(jìn)一步的改進(jìn). 近年來,隨著深度學(xué)習(xí)的興起,長期短期記憶網(wǎng)絡(luò)(LSTM)因適合預(yù)測時(shí)序數(shù)據(jù),被應(yīng)用于客流預(yù)測中[5-6],有效提高了預(yù)測精度. Zhang等[7]設(shè)計(jì)了一種基于車站類別的長短期記憶網(wǎng)絡(luò)(CB-LSTM)模型預(yù)測地鐵短期客流,證明了使用有限的數(shù)據(jù)集來預(yù)測網(wǎng)絡(luò)規(guī)模的短期客流的可行性. 但是,由于LSTM模型只能進(jìn)行前向或者后向一個(gè)方向的傳播計(jì)算,容易導(dǎo)致前后時(shí)間段記憶關(guān)聯(lián)的信息缺失.
為了解決以上問題,本文考慮了前后多天日客流的相關(guān)性,選擇雙向長期短期記憶網(wǎng)絡(luò)(Bi-LSTM)建立廣珠城際日客流量預(yù)測模型,以期更加準(zhǔn)確地預(yù)測不同日期的城際鐵路客流量.
廣珠城際鐵路是廣東省內(nèi)首條城際客運(yùn)專線鐵路,廣州南站、小欖站和珠海站因其特殊地理位置,日均旅客發(fā)送量在全線總發(fā)送量中的占比分別為47%、10%和21%. 文中選擇廣州南、小欖、珠海3個(gè)典型的車站進(jìn)行客流預(yù)測研究. 分析全年日旅客發(fā)送量,發(fā)現(xiàn)3個(gè)車站的客流呈現(xiàn)出相似的波動(dòng)規(guī)律,如圖1所示,工作日旅客發(fā)送量的峰值都出現(xiàn)在4月初、5月初和9月底,日客流量分別高達(dá)114 362人次、27 556人次、44 107人次. 選取11月5日至12月2日4周的旅客發(fā)送量進(jìn)行分析,如圖2所示,發(fā)現(xiàn)各個(gè)車站的發(fā)送客流量均呈現(xiàn)出了周期為7天的變化規(guī)律,從周四至周日客流呈現(xiàn)出明顯增長勢態(tài),并且在周日到達(dá)頂峰. 周一又開始出現(xiàn)回落勢態(tài),周二和周三的客流相對(duì)平穩(wěn). 因此,在客流預(yù)測時(shí)平日客流可考慮按星期的不同種類來進(jìn)行.
圖1 2018年車站旅客日發(fā)送量
圖2 每周各車站旅客發(fā)送量周期性變化
在元旦、清明、五一、端午、中秋、十一等節(jié)假日,客流相較于平日會(huì)有明顯的增長,如圖3所示,節(jié)假日3個(gè)車站的日均旅客發(fā)送量遠(yuǎn)高于全年工作日日均旅客發(fā)送量,其中廣州南站“國慶”期間日均客流量約為平日的2倍. 以“清明”、“五一”、“端午”3個(gè)小長假為例,如圖4所示,圖中Q1、D1、H1分別表示節(jié)假日的前一天,第一天和后一天,其余的符號(hào)含義以此類推. 對(duì)比分析節(jié)假日3天、節(jié)前4天和節(jié)后3天的日客流量,不同節(jié)假日的日客流量均呈現(xiàn)出了較為相似的變化規(guī)律,即節(jié)前一天以及假期第一天的客流量最大,第二天的客流量出現(xiàn)下降趨勢,假期最后一天又出現(xiàn)了新的高峰,直至節(jié)后客流逐漸恢復(fù)到平日水平. 綜上可知,節(jié)假日對(duì)于廣珠城際鐵路客流的影響顯著突出,在進(jìn)行客流預(yù)測時(shí)要考慮節(jié)假日因素.
圖3 節(jié)假日與工作日日均旅客發(fā)送量對(duì)比
圖4 廣州南站、小欖站和珠海站節(jié)假日旅客發(fā)送量
本文將元旦、清明節(jié)、勞動(dòng)節(jié)、端午節(jié)、中秋節(jié)以及國慶節(jié)的客流從全年日客流數(shù)據(jù)中剔除,最終得到2017~2018年的512組日客流量數(shù)據(jù).除了受到節(jié)假日的影響,平日客流數(shù)據(jù)仍可能存在一些較大的波動(dòng),這會(huì)影響模型的預(yù)測效果. 因此,有必要通過相關(guān)的統(tǒng)計(jì)分析作進(jìn)一步的數(shù)據(jù)處理,以識(shí)別和修復(fù)平日客流中的一些異常值. 以廣州南站進(jìn)站客流數(shù)據(jù)為例,通過SPSS軟件的箱線圖法進(jìn)行異常值識(shí)別,樣本中有3個(gè)離散群點(diǎn),分別是第55、第64和第154個(gè)數(shù)據(jù),說明這3個(gè)值為異常值,需要進(jìn)行異常值修復(fù)處理. 本文采用平均值法對(duì)異常值進(jìn)行修復(fù),即取前3周同一天的日客流量求其平均值作為修復(fù)值.計(jì)算方法如式(1)所示.
神經(jīng)網(wǎng)絡(luò)在提取數(shù)據(jù)特征的過程中,每一層的參數(shù)都會(huì)隨著上一層參數(shù)的更新而改變,如果參數(shù)變化很大,就會(huì)導(dǎo)致協(xié)變量偏移的現(xiàn)象出現(xiàn). 由于客流量數(shù)據(jù)變化范圍較大,因此需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,讓數(shù)據(jù)的分布不產(chǎn)生太大的變化. 由于權(quán)重取0~1之間的值,通常在標(biāo)準(zhǔn)化過程中把數(shù)據(jù)也處理成0~1之間的數(shù)值,以方便權(quán)重值的計(jì)算. 如式(2)所示:
式中,x是原始樣本;y是標(biāo)準(zhǔn)樣本;xmin、xmax是原始樣本的取值范圍;ymin、ymax是標(biāo)準(zhǔn)樣本的取值范圍.
長短期記憶網(wǎng)絡(luò)(LSTM)是對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn),RNN因?qū)η懊鏁r(shí)段的輸入信息具有記憶功能,并可以對(duì)輸出結(jié)果產(chǎn)生影響,對(duì)于時(shí)序數(shù)據(jù)的處理非常有效,但模型在訓(xùn)練時(shí)存在梯度消失的情況,LSTM模型為了改變隱含層結(jié)構(gòu),設(shè)置了細(xì)胞狀態(tài)及輸入門、遺忘門和輸出門3種結(jié)構(gòu),用遺忘門和輸入門來控制細(xì)胞狀態(tài)的內(nèi)容,用輸出門來控制細(xì)胞狀態(tài)對(duì)輸出值的影響,從而有效解決了RNN對(duì)信息的長期依賴,避免了梯度消失問題,其模型結(jié)構(gòu)如圖5所示.
圖5 長短期記憶網(wǎng)絡(luò)(LSTM)結(jié)構(gòu)圖
輸入門決定了當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入tx有多少保持到細(xì)胞狀態(tài)tc,它由兩部分組成:一是sigmoid函數(shù),如式(3)、(4)所示,其輸出結(jié)果用ti表示,取值在0到1之間,輸出為0表示不允許任何信息通過,輸出為1則允許全部信息通過,輸出在0到1之間表示允許部分信息通過;二是tanh激活函數(shù),輸出記作ta,如式(5)、(6)所示.ti和ta兩者按位相乘后更新細(xì)胞狀態(tài).
式中,Wi,Ui,bi,Wa,Ua,ba為線性關(guān)系的系數(shù)和偏移量.遺忘門決定了上一時(shí)刻的細(xì)胞狀態(tài)ct1-有多少保留到當(dāng)前時(shí)刻tc,其輸出用ft表示,代表著遺忘上一層細(xì)胞狀態(tài)ct1-的概率. 如式(7)所示.
式中,Wf,Uf,bf為線性關(guān)系的系數(shù)和偏移量.σ為sigmoid激活函數(shù).
細(xì)胞狀態(tài)tc的更新受兩部分的影響,如式(8)所示,第一部分是遺忘門決定上一個(gè)序列的細(xì)胞狀態(tài)ct1-要保留及遺忘的信息,即ct1-和遺忘門的輸出ft的乘積,第二部分是將當(dāng)前序列的信息加入到細(xì)胞狀態(tài)中,即輸入門的輸出ti和ta的乘積.
式中,*表示Hadamard積.
輸出門狀態(tài)th的更新由兩個(gè)部分組成. 第一部分由上一個(gè)序列的狀態(tài)h(t-1)根據(jù)sigmoid函數(shù)來決定輸出的狀態(tài)to;第二部分由當(dāng)前序列的狀態(tài)tc和tanh激活函數(shù)決定輸出狀態(tài)th,如式(9)、(10)所示.
式中,Wo,Uo,bo為線性關(guān)系的系數(shù)和偏移量.
本文采用的雙向長短期記憶網(wǎng)絡(luò)(Bi-LSTM)結(jié)構(gòu)如圖6所示,是由前向LSTM和后向LSTM結(jié)合而成的,將其應(yīng)用于交通時(shí)間序列數(shù)據(jù)的預(yù)測中,能夠考慮到前后時(shí)刻信息之間的規(guī)律,進(jìn)行雙向的預(yù)測,其輸出層是由前向?qū)雍秃笙驅(qū)庸餐瑳Q定的,這樣能夠更好地提高預(yù)測精度,其函數(shù)表達(dá)式為:
圖6 雙向長短期記憶網(wǎng)絡(luò)(Bi-LSTM)結(jié)構(gòu)圖
為驗(yàn)證預(yù)測模型的準(zhǔn)確性,本文選取了均方誤差(MSE)、均方根誤差(RMSE)以及平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)指標(biāo),從不同的角度來刻畫客流實(shí)際值和預(yù)測值的偏差,指標(biāo)值越小說明預(yù)測值和實(shí)際值越接近,預(yù)測效果越好;反之,則預(yù)測效果越差. 計(jì)算公式如下:
1)均方誤差
2)均方根誤差
3)平均絕對(duì)百分誤差
式中iy是第i天的實(shí)際客流值;iy′是第i天的預(yù)測客流值;N是測試樣本個(gè)數(shù).
本文以廣珠城際鐵路的廣州南、小欖以及珠海3個(gè)車站的日客流量為例. 對(duì)2017年1月1日到2018年12月31日的3個(gè)車站的日客流量數(shù)據(jù)進(jìn)行處理. 根據(jù)1.2節(jié)客流量周期性變化的規(guī)律及相鄰日期客流量的相關(guān)性,綜合考慮了模型復(fù)雜度、預(yù)測效果及樣本量等多種因素,進(jìn)行了兩種設(shè)計(jì):① 以本周前兩天的日客流量作為輸入,當(dāng)日客流量作為輸出. ② 以本周前兩天及前兩周同一周次共4天的日客流量作為輸入,當(dāng)日客流量作為輸出,例如預(yù)測本周四的日客流量,則以本周二、本周三、上周四、上上周四的日客流量作為輸入. 按照時(shí)間窗步長分為2、4整理得到客流量時(shí)間序列,并將時(shí)間序列按照 :
8 2的比例分別設(shè)為訓(xùn)練集和測試集.在Bi-LSTM網(wǎng)絡(luò)訓(xùn)練時(shí),先前向計(jì)算并輸出預(yù)測值,再后向計(jì)算輸出另一個(gè)預(yù)測值,接著將兩個(gè)預(yù)測值與實(shí)際值進(jìn)行對(duì)比,以更新前向、后向計(jì)算的模型梯度參數(shù)和權(quán)重系數(shù). 模型的主要參數(shù)有迭代次數(shù)、隱含層神經(jīng)元個(gè)數(shù)、批處理數(shù)量、時(shí)間窗步長等. 本文對(duì)參數(shù)的取值如表所示. 其中優(yōu)化器選擇Adam,學(xué)習(xí)率learning-rate設(shè)置為0.001.
表1 Bi-LSTM模型參數(shù)取值組合情況
對(duì)2017、2018兩年廣州南、小欖、珠海3個(gè)車站的日進(jìn)站客流量進(jìn)行預(yù)測,評(píng)價(jià)結(jié)果如表2所示.
表2 Bi-LSTM模型預(yù)測結(jié)果情況
當(dāng)時(shí)間窗步長為4時(shí),廣州南站、小欖站和珠海站客流預(yù)測的3個(gè)誤差指標(biāo)值都更小,其中MAPE分別為11.380 2%、12.372 9%、11.955 6%,模型的預(yù)測精度較高.
選取同等條件下的模型參數(shù),將Bi-LSTM網(wǎng)絡(luò)與LSTM網(wǎng)絡(luò)的預(yù)測結(jié)果進(jìn)行對(duì)比分析,如表3所示. 發(fā)現(xiàn)Bi-LSTM網(wǎng)絡(luò)的MSE、RMSE、MAPE3個(gè)評(píng)價(jià)指標(biāo)均比LSTM網(wǎng)絡(luò)的小. 其中對(duì)小欖站客流預(yù)測中,Bi-LSTM網(wǎng)絡(luò)比LSTM網(wǎng)絡(luò)預(yù)測精度高了近3%.
表3 Bi-LSTM網(wǎng)絡(luò)與LSTM網(wǎng)絡(luò)預(yù)測結(jié)果對(duì)比
綜上所述,本文構(gòu)建Bi-LSTM模型在城際鐵路日客流預(yù)測上能獲得較高的預(yù)測精度,具有較好的實(shí)用性.
針對(duì)城際鐵路短時(shí)客流量難以準(zhǔn)確預(yù)測的問題,本文構(gòu)建了基于Bi-LSTM網(wǎng)絡(luò)的車站日進(jìn)站客流預(yù)測模型,以廣州城際廣州南、小欖、珠海3個(gè)車站為例進(jìn)行實(shí)證分析,發(fā)現(xiàn)Bi-LSTM網(wǎng)絡(luò)與LSTM網(wǎng)絡(luò)相比能獲得更好的預(yù)測效果,且時(shí)間窗越長,預(yù)測效果越好. 未來本文的方法可以考慮短期客流的日波動(dòng)規(guī)律,將日期因素作為一個(gè)輸入量進(jìn)行訓(xùn)練,以增強(qiáng)模型對(duì)不同類別日期的適用性.