黃海超,陳景雅,王 爽,王方偉
(河海大學土木與交通學院,江蘇 南京 210098)
軌道交通客流量預(yù)測是城市智能交通系統(tǒng)的重要組成部分,客流量不僅受歷史客流量、日期屬性等時間因素影響,也受空間因素如:溫度、風速、氣壓等影響。 時間因素與空間因素對客流量的影響存在復(fù)雜非線性關(guān)系,是多種因素共同作用的結(jié)果[1]。
李潔等[2]在傳統(tǒng)預(yù)測模型的基礎(chǔ)上引入出行日期特征及節(jié)假日因素, 建立季節(jié)性差分自回歸滑動平均模型(SARIMA),有效提高預(yù)測精度。 Sui等[3]建立了周末客流量與天氣因素之間關(guān)系的多元回歸模型,分析兩者的內(nèi)在聯(lián)系。 Xue 等[4]著重研究降雨因素對客流的影響。許熳靈等[5]進一步引入不同的天氣因素, 并驗證其對地鐵客流量時空分布的影響。Ni 等[6]考慮地鐵附近的媒體事件與客流變化規(guī)律,提高客流量的預(yù)測精度。 Tselentis 等[7]證明了單一模型具有局限性,加之如今龐大的數(shù)據(jù)規(guī)模,基于深度學習的混合預(yù)測模型[8]逐步替代了傳統(tǒng)機器學習。滕靖等[9]在考慮日期屬性和天氣因素的同時,采用粒子群算法(PSO)優(yōu)化長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)并證明混合模型優(yōu)于傳統(tǒng)的LSTM。謝宇等[10]引入突發(fā)事件因素建立混合模型,提高模型對突發(fā)事件的預(yù)測精度。 此外,不引入外部因素,考慮鄰近站點的空間關(guān)聯(lián)的預(yù)測模型,如時空長短期記憶 (ST-LSTM)[11], 多模式深度融合(MPDF)[12]等也一定程度上提高預(yù)測精度。 但是引入越多因素必然導(dǎo)致模型的復(fù)雜度提高, 需要在保證模型精度的同時提高模型效率。 李澤文等[13]提出主成分分析 (PCA) 對引入的多因素進行降維,減少預(yù)測時間。 徐先峰等[14]通過K 近鄰算法提取特征,結(jié)合雙向長短期記憶(BiLSTM)兼顧預(yù)測精度與速度。 李梅等[15]提出Pearson 相關(guān)分析法提取顯著影響因子,確定引入因素的維數(shù),具有良好的適用性。
由于空間、時間因素與客流量之間存在復(fù)雜的非線性關(guān)系,目前針對多因素與客流量關(guān)系的研究較少。 本文提出一種多因素建模方式,首先采用顯著性檢驗確定采集的天氣因素是否與客流量序列相互獨立。 再通過GRA 提取天氣因素與客流量潛在的非線性關(guān)系并量化, 根據(jù)GRA 值逐步篩選關(guān)聯(lián)度低的天氣因素,降低模型復(fù)雜度。 最后采用深度學習的BiLSTM 進行預(yù)測,構(gòu)建GRA-BiLSTM 混合模型。 同時與傳統(tǒng)預(yù)測模型進行對比,驗證模型可靠性。
軌道交通客流量數(shù)據(jù)來自明尼蘇達州明尼阿波利斯至圣保羅2017-01-01~2018-09-30 每小時軌道交通客流量,明尼阿波利斯與圣保羅分別是明尼蘇達州第一、二大城市,旅客往來頻繁,客流規(guī)模大; 天氣數(shù)據(jù)來自美國國家海洋和大氣管理局,天氣數(shù)據(jù)共7 類,包括:大氣壓、溫度、露點、風速、云量、可見度、天氣狀況。 對完全相同的、明顯異常及缺失的數(shù)據(jù)進行清洗,獲得8 種數(shù)據(jù),每種數(shù)據(jù)15 246 條。 考慮到工作日與非工作日,人群出行規(guī)律,受天氣因素影響不同,從而使得客流量數(shù)據(jù)在工作日與非工作日呈現(xiàn)不同的特征,將數(shù)據(jù)劃分為工作日(約8.7 萬條)與非工作日(約3.4 萬條),分別訓(xùn)練。
采用Person 相關(guān)系數(shù)檢驗天氣變量與客流量的相關(guān)程度, 利用t 雙邊檢驗確定天氣因素是否與客流量服從不同分布。 結(jié)果如表1 所示,Person 系數(shù)均不超過0.4, 表明天氣因素與客流量并非簡單的線性關(guān)系,所有天氣因素在0.05 水平上存在顯著差異,可作為獨立影響因素。
表1 天氣因素相關(guān)性分析Tab.1 Correlation analysis of weather factors
GRA 是灰色系統(tǒng)理論中的一種多因素統(tǒng)計分析方法,對一個系統(tǒng)發(fā)展變化態(tài)勢進行定量描述和比較,適用于探究非線性相關(guān)性。 其基本思想是通過確定參考序列和若干個比較序列的幾何形狀相似程度來衡量因素間關(guān)系的強弱。 天氣因素對客流量的影響不是簡單的線性關(guān)系,采用GRA對其潛在的非線性關(guān)系進行進一步分析,步驟如下:
1) 確定系統(tǒng)中的參考序列(客流量)和比較序列(天氣因素)。
2) 對客流量序列與天氣因素序列進行無量綱化處理,消除不同量綱的影響,考慮到之后要將其作為神經(jīng)網(wǎng)絡(luò)的輸入變量,將其歸一到[-1,1]。
3) 計算客流量序列與天氣序列的關(guān)聯(lián)系數(shù)
式中:ξi(k)為客流量序列與第i 個天氣序列的關(guān)聯(lián)系數(shù),k 為序列元素的索引;x0(k)為歸一化的客流量序列;xi(k)為歸一化的天氣因素序列;ρ 為分辨系數(shù),ρ 越小,關(guān)聯(lián)系數(shù)間差異越大,區(qū)分能力越強,通常取0.5。
4) 計算灰色關(guān)聯(lián)度
式中:m 為天氣因素的數(shù)目。
灰色關(guān)聯(lián)度如表2 所示,天氣因素與客流量相關(guān)性強弱為: 大氣壓>溫度>露點>風速>云量>天氣狀況>可見度。
表2 天氣因素灰色關(guān)聯(lián)度Tab.2 Grey relational degree of weather factors
LSTM 是深度循環(huán)神經(jīng)網(wǎng)絡(luò)的代表, 通過門控單元實現(xiàn)時空記憶功能,同時有效緩解循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和爆炸問題。 通過引入輸入門、遺忘門和輸出門等門控單元系統(tǒng),LSTM 可以控制何時忘記歷史信息或使用新信息更新單元狀態(tài),在解決非線性時間序列問題時效果極佳,其過程可表達為
式中:it,ft,ot,ct分別為輸入門i,遺忘門f,輸出門o, 細胞狀態(tài)c 在t 時刻的輸出;Wxti,Wxtf,Wxto,Wxtc分別為輸入Xt與輸入門i,遺忘門f,輸出門o,細胞 狀 態(tài)c 的 權(quán) 重;Whti,Whtf,Whto,Whtc為 隱 藏 層 輸 出Ht與相應(yīng)門的權(quán)重;Wcti,Wctf,Wcto為細胞狀態(tài)輸出Ct與相應(yīng)門的權(quán)重;bi,bf,bo,bc為偏置向量;σ 為激活函數(shù)。
BiLSTM 基本原理與普通LTSM 相同, 結(jié)合正向、反向LSTM 同時對輸入時間序列Xt進行前向和后向兩次訓(xùn)練,獲得預(yù)測交通流序列Yt。 BiLSTM 考慮數(shù)據(jù)間的關(guān)聯(lián)性, 進一步提高LSTM 特征提取的全局性和完整性。 BiLSTM 結(jié)構(gòu)如圖1 所示。
圖1 BiLSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 BiLSTM neural network structure
將天氣數(shù)據(jù)與客流量數(shù)據(jù)歸一化處理,并以前70 周數(shù)據(jù)作為訓(xùn)練集, 最后21 周作為測試集驗證模型性能。 將前3 h 天氣因素、客流量(24 維)及當前天氣因素(7 維)共31 維數(shù)據(jù)作為輸入,當前客流量作為輸出。 迭代次數(shù)取200, 初始學習率設(shè)為0.005,同時為防止學習率過大,模型來回震蕩,采用衰減法動態(tài)調(diào)整學習率, 每迭代50 次學習率衰減50% 。 損 失 函 數(shù) 采 用 均 方 根 誤 差, 通 過AdamOptimizer 優(yōu)化器對模型進行優(yōu)化。 為優(yōu)化隱含層神經(jīng)元個數(shù),隨機抽取20%作為樣本進行試驗,結(jié)果如圖2 所示。 當隱含層神經(jīng)元超過64 個后訓(xùn)練時間大幅上升, 訓(xùn)練誤差減小效果不明顯,確定隱含層神經(jīng)元個數(shù)為64。
圖2 隱含層神經(jīng)元數(shù)目尋優(yōu)Fig.2 Optimization of neurons number in the hidden layer
根據(jù)以上參數(shù),建立BiLSTM 神經(jīng)網(wǎng)絡(luò),將包含所有天氣因素的神經(jīng)網(wǎng)絡(luò)命名為GRA-0, 根據(jù)GRA 值,逐步篩選關(guān)聯(lián)度低的天氣因素,如GRA-1為剔除“可見度”因素,輸入變量為27 維的模型,GRA-2 為剔除“可見度”、“天氣狀況”后輸入變量為23 維的模型,最終GRA-7 即為剔除7 種天氣因素,輸入變量僅為歷史客流量的模型,也就是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型。
平均絕對百分誤差(MAPE)體現(xiàn)了真實值與預(yù)測值的相對偏差, 可直接衡量預(yù)測結(jié)果的好壞,常被用于評價預(yù)測模型的優(yōu)劣。 均方根誤差(RMSE)可直接體現(xiàn)真實值與預(yù)測值的絕對差值,且特大或特小誤差對指標影響明顯,可有效彌補MAPE 的不足。 采用這兩種指標評價模型性能。 考慮到日期屬性對客流量的影響, 工作日與非工作日分別訓(xùn)練,每種模型訓(xùn)練3 次取平均值,結(jié)果如圖3 所示。
圖3 GRA-BiLSTM 工作日與非工作日預(yù)測結(jié)果Fig.3 GRA-BiLSTM prediction results on weekdays and weekend
從圖3 可以看出,無論是否處于工作日,不考慮天氣因素的神經(jīng)網(wǎng)絡(luò)(GRA-7),其預(yù)測誤差均小于考慮所有因素的神經(jīng)網(wǎng)絡(luò) (GRA-0)。這說明將所有天氣因素作為輸入并不能提高預(yù)測精度, 反而因為關(guān)聯(lián)度低的天氣因素含有大量與客流量無關(guān)的信息, 相當于訓(xùn)練過程擬合了樣本噪聲,預(yù)測精度反而降低。通過GRA 逐步篩選關(guān)聯(lián)度低的天氣因素,預(yù)測誤差有所降低,這是因為通過剔除低關(guān)聯(lián)度的因素相當于樣本降噪。
天氣因素對工作日與非工作日客流量的影響存在明顯差異。 在工作日期間,僅考慮“大氣壓”的神經(jīng)網(wǎng)絡(luò)(GRA-6)誤差最小,這說明工作日客流量受天氣因素影響較小,大部分天氣因素相當于冗余的噪聲, 降低模型的學習效率; 在非工作日期間,同時考慮“大氣壓”、“溫度”、“露點”、“風速”的神經(jīng)網(wǎng)絡(luò)(GRA-3)誤差最小,這說明非工作日的客流量受天氣影響比較明顯,這些天氣因素都能給神經(jīng)網(wǎng)絡(luò)帶來正向影響。由表2 可知,最佳神經(jīng)網(wǎng)絡(luò)模型考慮的天氣因素,其GRA 值均大于0.6。 當天氣因素與客流量的GRA 值高于0.6 時,才可認為該因素與客流量存在潛在關(guān)聯(lián),能提高神經(jīng)網(wǎng)絡(luò)的預(yù)測精度。
模型的收斂速度能反映所需的訓(xùn)練時間,收斂越快,訓(xùn)練時間相應(yīng)越短。 為驗證根據(jù)GRA 篩選天氣因素對神經(jīng)網(wǎng)絡(luò)收斂速度的影響。 分別取工作日與非工作日中預(yù)測效果最佳的神經(jīng)網(wǎng)絡(luò)與GRA-0,GRA-7 訓(xùn)練過程的LOSS 曲線進行對比。 結(jié)果如圖4 所示。
圖4 工作日與非工作日收斂速度對比Fig.4 Comparison of convergence rates on weekdays and weekend
可以看出,輸入維數(shù)最高的GRA-0,早期波動較大,且收斂速度最慢,需要最長的訓(xùn)練時間。 采用GRA 降維后,神經(jīng)網(wǎng)絡(luò)收斂速度顯著提高,訓(xùn)練效果更加穩(wěn)定, 且最終的訓(xùn)練效果優(yōu)于傳統(tǒng)模型GRA-7。
為驗證模型可靠性,同時比較常用預(yù)測模型對多種天氣因素的應(yīng)答。分別采用LSTM 神經(jīng)網(wǎng)絡(luò)、隨機森林(RF)、最小二乘支持向量機(LSSVM)作為基準模型。 LSTM 采用與原模型相同的參數(shù)設(shè)置,RF預(yù)測模型根據(jù)經(jīng)驗公式確定子樹數(shù)目,LSSVM 預(yù)測模型采用網(wǎng)格搜索確定最佳超參數(shù)c,g,預(yù)測結(jié)果如圖5 所示。 各模型經(jīng)GRA 處理后的預(yù)測誤差RMSE匯總于表3,最優(yōu)模型的預(yù)測結(jié)果加橫線表示。
圖5 工作日與非工作日預(yù)測模型對比Fig.5 Comparison of prediction model on weekdays and weekend
表3 不同預(yù)測模型對天氣因素的應(yīng)答Tab.3 Responses of different prediction models to weather factors
可以看出,無論是工作日還是非工作日,最優(yōu)GRA-BiLSTM 預(yù)測誤差顯著低于各最優(yōu)基準模型。由于關(guān)聯(lián)度低的天氣因素包含大量噪聲,絕大部分GRA-0 模型的預(yù)測誤差高于GRA-7,且相差較大。BiLSTM 在工作日與非工作日的誤差波動均低于其他模型,體現(xiàn)良好的抗噪聲干擾能力。
本文同時考慮時間因素(歷史客流、日期屬性)及空間因素(天氣),提出GRA-BiLSTM 預(yù)測模型,有效降低預(yù)測誤差,同時提高收斂速度及抗噪聲干擾能力。
1) 根據(jù)GRA 逐步剔除低關(guān)聯(lián)度變量, 發(fā)現(xiàn)工作日與非工作日客流量對天氣的應(yīng)答不同,但GRA 值0.6 可作為天氣因素對客流量是否具有正向影響的分界。
2) 關(guān)聯(lián)度低的天氣因素可能與客流量相關(guān)的信息較少,并非完全無關(guān)。 簡單剔除仍會損失部分有效信息,天氣因素對客流量如何影響還需進一步研究。