姚禎龍,高 芮,王 恒
(中國中鐵二院工程集團(tuán)有限責(zé)任公司,四川 成都 610031)
根據(jù)我國城市軌道交通協(xié)會(huì)統(tǒng)計(jì)數(shù)據(jù)顯示[1],我國城市軌道交通運(yùn)營里程從2012 年的2286km,增加到2020 年底的7969.7km;年平均增長約16%。截至2020年底,中國大陸地區(qū)已有45 個(gè)城市開通了244 條軌道交通線。從變化趨勢來看,隨著運(yùn)營里程的增加以及城市化率的提高,乘客運(yùn)量也在不斷上升[1]。2012 年,我國城市軌道交通累計(jì)運(yùn)送約87 億人次,2019 年、2020 年分別達(dá)237、175.9 億人次,2019 年較2012 年增長約175%[1]。
準(zhǔn)確預(yù)測城市軌道交通客流對(duì)合理的城市軌道交通規(guī)劃具有重要意義。國內(nèi)學(xué)者對(duì)客流預(yù)測模型與方法做了較多的研究。研究目標(biāo)包括具體車站客流預(yù)測[2]、城市軌道交通環(huán)線客流預(yù)測[3]、新開城市軌道交通預(yù)測方法[4,5]、月度客流數(shù)據(jù)預(yù)測方法[6]等,提出了受影響客流的界定算法,建立了突發(fā)事件下網(wǎng)絡(luò)受影響客流重分布預(yù)測算法。
本文基于重慶市軌道交通客流數(shù)據(jù),考慮客流的周期性以及客流的時(shí)間依賴性,對(duì)不同時(shí)段(工作日/周末/節(jié)假日)的客流分別進(jìn)行分析,并建立基于支持向量機(jī)、長短記憶循環(huán)神經(jīng)網(wǎng)絡(luò)模型,提高了客流預(yù)測精度?;趯?shí)證分析證明了所用方法在客流預(yù)測中的有效性。
引入拉格朗日函數(shù)L 和拉格朗日乘子(α-α^),分別對(duì)ω,b,ξ,ξ^求偏導(dǎo)并令其為0 后,再次代入拉格朗日函數(shù),可以得到其對(duì)偶問題,如式(1)所示。
其中,k(Xn,Xm)是支持向量機(jī)的核函數(shù),它是利用內(nèi)積運(yùn)算實(shí)現(xiàn)將輸入映射到高維特征空間的一種簡化計(jì)算方式,一般有線性(Linear)核函數(shù)、多項(xiàng)式(Polynomial)核函數(shù)、徑向基(Radial Basis)核函數(shù)等。顯然,對(duì)偶問題有解的充要條件是滿足庫恩塔克條件(Kuhn-Tucker conditions,KKT 條件),如式(2)所示。
本網(wǎng)絡(luò)是一種門控循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)[7]。在LSTM 神經(jīng)網(wǎng)絡(luò)中,一共存在3 種門。分別介紹如下。
式中:i——細(xì)胞;t——當(dāng)前時(shí)刻;X(t)——當(dāng)前的輸入向量;ht——當(dāng)前隱藏層向量,其同時(shí)含有所有LSTM“細(xì)胞”輸出,b、U、W 分別是LSTM“細(xì)胞”得偏置、輸入權(quán)重和循環(huán)權(quán)重。
針對(duì)城市軌道交通客流量預(yù)測,將每日的歷史數(shù)據(jù)客流量視為一個(gè)時(shí)間序列,設(shè)為P={p1,p2,…,pn}。由于城市軌道交通客流基本保持平穩(wěn)狀態(tài),對(duì)LSTM 預(yù)測精度影響有限。但同時(shí),和其他神經(jīng)網(wǎng)絡(luò)模型一樣,LSTM 的輸入數(shù)據(jù)范圍最好能保持在其激活函數(shù)(為雙曲正切,取值-1~1 之間)的范圍以內(nèi)。因此,還是要對(duì)原始的客流數(shù)據(jù)輸入需要進(jìn)行進(jìn)一步加工,本文采用歸一化方法(MinMaxScaler class)進(jìn)行處理,計(jì)算原理如式(7)所示。
本文數(shù)據(jù)來源于重慶軌道交通集團(tuán)有限公司。本文數(shù)據(jù)采用的是重慶市軌道交通3 號(hào)線,2018 年1 月1 日—6 月29 日運(yùn)營數(shù)據(jù),其中工作日125d;節(jié)假日包括周末、元旦、春節(jié)(春節(jié)客流數(shù)據(jù)偏差較大,7 個(gè)數(shù)據(jù)點(diǎn)被剔除)清明節(jié)、勞動(dòng)節(jié),共計(jì)48d。分別將工作日和節(jié)假日數(shù)據(jù)的70%與30%作為訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù),即對(duì)工作日,共計(jì)87 個(gè)訓(xùn)練數(shù)據(jù)及38 個(gè)測試數(shù)據(jù);對(duì)節(jié)假日,共計(jì)34 個(gè)訓(xùn)練數(shù)據(jù)及14 個(gè)測試數(shù)據(jù)。本文所有建模、測試均基于Python 3.6。
為了精確度量各類預(yù)測方法的精度,本文選擇采用兩個(gè)常用指標(biāo),分別是平均絕對(duì)百分比誤差(mean absolute percentage error, MAPE),用以計(jì)算相對(duì)誤差;均方根誤差(root mean square error, RMSE),用以計(jì)算絕對(duì)誤差。
2.3.1 SVR 回歸
使用上述訓(xùn)練數(shù)據(jù)及測試數(shù)據(jù)進(jìn)行支持向量回歸分析,由于數(shù)據(jù)明顯呈現(xiàn)非線性,建模采用徑向基作為支持向量機(jī)核函數(shù),圖1a 和圖1b 分別展示了SVR 針對(duì)工作日和節(jié)假日的不同回歸結(jié)果,圖中灰色豎線兩側(cè)分別為訓(xùn)練集與測試集,藍(lán)線部分表示訓(xùn)練及預(yù)測的絕對(duì)誤差。
圖1 SVR 模型預(yù)測值及誤差情況
2.3.2 LSTM 預(yù)測
LSTM 模型相關(guān)參數(shù)標(biāo)定如下:①定值參數(shù),時(shí)間步長為7,預(yù)測步長為1,迭代次數(shù)300 次,損失函數(shù)為Mean_Squared_Error;②網(wǎng)格搜索參數(shù),批量大小為1/2/4/6/8/10/12/14/16(最終取值為1),隱藏層細(xì)胞元為5/10/20/50/75/100(最終取值為10)。圖2 可以看到,對(duì)工作日客流,迭代100 次后誤差趨于穩(wěn)定;節(jié)假日客流迭代150 次后誤差趨于穩(wěn)定。圖3 顯示了LSTM 預(yù)測模型的計(jì)算結(jié)果,結(jié)果可見,當(dāng)客流呈現(xiàn)規(guī)律性波動(dòng)時(shí),預(yù)測效果較好;對(duì)于節(jié)假日等客流波動(dòng)較大且數(shù)據(jù)量不足的情況時(shí),LSTM 模型效果顯得較為不足。
圖2 LSTM 預(yù)測模型誤差隨迭代次數(shù)下降曲線
圖3 LSTM 預(yù)測模型預(yù)測結(jié)果
為了說明兩種機(jī)器學(xué)習(xí)方法在工作日、節(jié)假日客流預(yù)測上的有效性,使用平均絕對(duì)百分比誤差MAPE及均方根誤差RMSE 對(duì)它們進(jìn)行誤差量化計(jì)算,結(jié)果如表1 所示。從中可以看到,在數(shù)據(jù)量較大(工作日)時(shí),長短記憶神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有較好的預(yù)測效果,MAPE 僅為6.58%,但其在處理節(jié)假日數(shù)據(jù)時(shí),表現(xiàn)欠佳;支持向量回歸預(yù)測模型,通過參數(shù)比選,最終對(duì)工作日、節(jié)假日的預(yù)測均表現(xiàn)出不錯(cuò)的效果。
表1 不同預(yù)測模型預(yù)測誤差計(jì)算
本文根據(jù)重慶市軌道交通3 號(hào)線半年客流數(shù)據(jù),分工作日、節(jié)假日兩種情況,分別利用支持向量回歸預(yù)測和長短記憶神經(jīng)網(wǎng)絡(luò)預(yù)測兩種機(jī)器學(xué)習(xí)模型進(jìn)行了預(yù)測分析。根據(jù)預(yù)測結(jié)果,基于均方根誤差(RMSE)和平均百分誤差(MAPE)對(duì)比分析結(jié)果表明:
(1)在數(shù)據(jù)量較大(工作日)時(shí),長短記憶神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有較好的預(yù)測效果,MAPE 僅為6.58%,但其在處理節(jié)假日數(shù)據(jù)時(shí),表現(xiàn)欠佳。
(2)支持向量回歸預(yù)測模型,通過參數(shù)比選,最終對(duì)工作日、節(jié)假日的預(yù)測均表現(xiàn)出不錯(cuò)的效果。