黃海超,陳景雅,孫 睿
(河海大學(xué)土木與交通學(xué)院,江蘇 南京210098)
由于軌道交通安全、準(zhǔn)時(shí)和環(huán)保等特點(diǎn),已逐漸成為人們出行的首選交通方式,基于數(shù)據(jù)挖掘技術(shù)的客流量預(yù)測是城市智能交通系統(tǒng)的重要組成部分,不僅對人們出行和智能交通管控有著重要的指導(dǎo)意義,也有助于相關(guān)部門提前進(jìn)行運(yùn)營規(guī)劃和調(diào)度。
客流量預(yù)測模型主要分為以差分自回歸移動(dòng)平均模型[1](ARIMA)和灰色模型(GM)為代表的參數(shù)模型與以支持向量機(jī)[2](SVM)和神經(jīng)網(wǎng)絡(luò)[3]為代表的非參數(shù)模型。 但傳統(tǒng)模型收斂慢,時(shí)效性低,很難滿足交通大數(shù)據(jù)情況下智能管控需求[4]。 基于深度學(xué)習(xí)的長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)LSTM (long shortterm memory)不僅預(yù)測性能、收斂時(shí)間優(yōu)于傳統(tǒng)參數(shù)[5]與非參數(shù)[6]預(yù)測模型,偏差分布波動(dòng)與預(yù)測魯棒性也明顯優(yōu)于傳統(tǒng)預(yù)測模型[7];針對非平穩(wěn)的客流量數(shù)據(jù),經(jīng)驗(yàn)?zāi)B(tài)分解[8](EMD)、集成經(jīng)驗(yàn)?zāi)B(tài)分解[9](EEMD) 被用于降低樣本噪聲干擾并有效提高預(yù)測精度。 變分模態(tài)分解(variational mode decomposition,VMD)作為最新提出的分解算法,雖然在交通領(lǐng)域應(yīng)用較少,但在電力荷載[10]、期貨[11]等領(lǐng)域已證明其對非平穩(wěn)信號良好的處理能力。
目前研究大多集中于短時(shí)客流量預(yù)測[12](15 min內(nèi)),然而過短時(shí)間的預(yù)測不能為人們出行規(guī)劃預(yù)留充足時(shí)間,提供有價(jià)值的出行指導(dǎo)。 為此,文章創(chuàng)新性地將VMD 引入客流量預(yù)測領(lǐng)域,降低客流量信號的非平穩(wěn)性,結(jié)合深度學(xué)習(xí)的LSTM 進(jìn)行預(yù)測,提出VMD-LSTM 預(yù)測模型,實(shí)現(xiàn)對每小時(shí)軌道交通客流量的準(zhǔn)確預(yù)測,提高LSTM 神經(jīng)網(wǎng)絡(luò)的預(yù)測性能。
VMD 是一種全新的自適應(yīng)、完全非遞歸時(shí)頻信號分解算法,通過構(gòu)建變分模型,將原始時(shí)間序列s(t)分解為不同的具有有限帶寬的分量uk(t),對應(yīng)的中心頻率為ωk,交替迭代更新尋找約束變分模型的最優(yōu)解,在此過程中實(shí)現(xiàn)本征模態(tài)函數(shù)IMF 的有效分離,克服了EMD 存在端點(diǎn)效應(yīng)和模態(tài)分量混疊的問題,其算法可表示為[13]
1) 對每一個(gè)uk(t)進(jìn)行Hilbert 變換得到單側(cè)頻譜
式中:δ(t)表示Dirac 分布函數(shù);*表示卷積運(yùn)算。
2) 通過將每個(gè)模式的分析信號乘以估計(jì)的中心頻率e-jωkt,將頻譜移到基帶
3) 通過對解調(diào)信號梯度的L2 正則化進(jìn)行高斯平滑估計(jì),得到各模態(tài)函數(shù)的帶寬,約束變分模型可表示為
式中:?t表示求偏導(dǎo);k 為分量的個(gè)數(shù)。
LSTM 是深度循環(huán)神經(jīng)網(wǎng)絡(luò)的代表,通過門的開關(guān)實(shí)現(xiàn)時(shí)空記憶功能,能有效解決循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和爆炸問題。 通過引入一個(gè)門控單元系統(tǒng),可以控制何時(shí)忘記歷史信息或使用新信息更新單元狀態(tài), 使LSTM 在解決非線性時(shí)間序列問題時(shí)效果極佳[14],其過程可表達(dá)為
VMD-LSTM 預(yù)測模型建立主要分為兩部分。 第一部分為數(shù)據(jù)預(yù)處理,首先將對原始數(shù)據(jù)中的重復(fù)、異常、 缺省值進(jìn)行清洗獲得時(shí)序客流量數(shù)據(jù)。 基于VMD 分解原理,設(shè)定合適的超參數(shù),將非平穩(wěn)的每小時(shí)客流量數(shù)據(jù)分解為本征模態(tài)函數(shù)IMF 和余量信號R(t),弱化樣本噪聲干擾;第二部分為分量預(yù)測,首先選擇LSTM 神經(jīng)網(wǎng)絡(luò)時(shí)間步長、 輸入層隱藏層神經(jīng)元個(gè)數(shù)等基本參數(shù),確定神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式與代價(jià)函數(shù),獲得網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。 建立與分解分量個(gè)數(shù)相同的LSTM 神經(jīng)網(wǎng)絡(luò),對分量分別進(jìn)行預(yù)測,獲得仿真本征模態(tài)函數(shù)(SimIMF)最后將各預(yù)測值進(jìn)行重構(gòu)獲得最終客流量預(yù)測值, 并與真實(shí)客流量進(jìn)行比較,評價(jià)模型性能。 模型建立流程如圖1 所示。
圖1 VMD-LSTM 神經(jīng)網(wǎng)絡(luò)模型流程圖Fig.1 VMD-LSTM neural network model flow chart
采集明尼蘇達(dá)州明尼阿波利斯至圣保羅301站臺(tái)2017 年每小時(shí)軌道交通客流量,明尼阿波利斯與圣保羅分別是明尼蘇達(dá)州第一、 二大城市,旅客往來頻繁,客流規(guī)模大;301 站臺(tái)為圣保羅通往明尼阿波利斯及其他城市的主要站臺(tái),人員出行規(guī)律復(fù)雜,因此采用該站臺(tái)作為研究對象。 對軌道交通數(shù)據(jù)中的異常數(shù)據(jù)進(jìn)行預(yù)處理。 包括完全相同的記錄、明顯異常的記錄及缺失的記錄,數(shù)據(jù)清洗后共獲得10 605 條時(shí)間數(shù)據(jù)。 由于數(shù)據(jù)樣本較大,有效避免了機(jī)器學(xué)習(xí)過程中預(yù)測模型對個(gè)別樣本的偏好,無需對樣本進(jìn)行抽樣訓(xùn)練。
采用VMD 算法對非平穩(wěn)交通量時(shí)間序列數(shù)據(jù)進(jìn)行分解時(shí),由于VMD 在軌道交通客流量預(yù)測領(lǐng)域應(yīng)用較少,缺乏先驗(yàn)知識確定超參數(shù)。 綜合考慮重構(gòu)誤差與中心頻率分布,二次罰因子α 取1 000,分解模態(tài)數(shù)K 取11。分解得到10 個(gè)IMF 分量以及一個(gè)余量信號R(t),分解結(jié)果如圖2 所示。 分量頻率由高到低進(jìn)行排列,更加清晰的呈現(xiàn)原始客流量數(shù)據(jù)在不同時(shí)間尺度下的變化規(guī)律,其中高頻信號表示客流量變化的細(xì)節(jié),含有大量樣本噪聲;低頻部分則表征客流量的趨勢,頻率最低的余量信號R(t)也稱為趨勢項(xiàng),表征全年軌道交通客流量的波動(dòng)趨勢。
選擇前10 個(gè)月(8 880 條時(shí)間數(shù)據(jù))作為訓(xùn)練集,最后兩個(gè)月(1 725 條時(shí)間數(shù)據(jù))用于測試模型性能。 時(shí)間步長取4,隱含層數(shù)取1,隱含層神經(jīng)元個(gè)數(shù)取200;迭代次數(shù)取250。初始學(xué)習(xí)率設(shè)為0.01,同時(shí)為防止學(xué)習(xí)率過大,模型來回震蕩,采用衰減法動(dòng)態(tài)調(diào)整學(xué)習(xí)率,每迭代50 次學(xué)習(xí)率衰減50%。損失函數(shù)采用均方根誤差,通過AdamOptimizer 優(yōu)化器對模型進(jìn)行優(yōu)化, 得到LSTM 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
根據(jù)以上參數(shù),建立11 個(gè)LSTM 神經(jīng)網(wǎng)絡(luò),對分解獲得的分量分別進(jìn)行訓(xùn)練、預(yù)測,根據(jù)VMD 算法對預(yù)測結(jié)果進(jìn)行重構(gòu),得到最終每小時(shí)客流量預(yù)測值。 并繪制總體預(yù)測殘差,如圖3 所示,可以看出LSTM 神經(jīng)網(wǎng)絡(luò)僅在初期前1%數(shù)據(jù)范圍內(nèi)預(yù)測誤差較大,隨后殘差迅速變小并趨于穩(wěn)定,表現(xiàn)出良好的魯棒性。
同時(shí)為驗(yàn)證VMD-LSTM 神經(jīng)網(wǎng)絡(luò)模型的性能,分別與LSTM 神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林(RF)、支持向量機(jī)(SVM)進(jìn)行對比。 對比模型與原模型采用相同的參數(shù)設(shè)置,RF 預(yù)測模型利用經(jīng)驗(yàn)公式確定子樹數(shù)目為103,SVM 預(yù)測模型采用自適應(yīng)算法搜索最佳超參數(shù)c,g,預(yù)測結(jié)果如圖4 所示。
圖2 客流量數(shù)據(jù)VMD 分解結(jié)果Fig.2 VMD decomposition results of passenger flow sequence
圖3 預(yù)測殘差Fig.3 Predicting residual
圖4 神經(jīng)網(wǎng)絡(luò)模型對比Fig.4 Comparison of neural network models
平均絕對百分誤差(MAPE)體現(xiàn)了真實(shí)值與預(yù)測值的相對偏差,可直接衡量預(yù)測結(jié)果的好壞,常被用于評價(jià)預(yù)測模型的優(yōu)劣,但不能直觀反映真實(shí)值與預(yù)測值的差值。 均方根誤差(RMSE)可直接體現(xiàn)真實(shí)值與預(yù)測值的絕對差值,且特大或特小誤差對指標(biāo)影響明顯,可有效彌補(bǔ)MAPE 的不足,相關(guān)系數(shù)(R)可用于表征真實(shí)值與預(yù)測值變化趨勢的相似程度。 分別采取以上指標(biāo)對各預(yù)測模型性能進(jìn)行評價(jià),結(jié)果如表1 所示。
表1 經(jīng)典預(yù)測模型性能對比Tab.1 Performance comparison of classical prediction models
結(jié)合圖4 和表1 可以看出,在軌道交通客流量數(shù)據(jù)樣本足夠大的情況下,所有預(yù)測模型均有極高的預(yù)測精度。傳統(tǒng)的時(shí)間序列預(yù)測模型RF,SVM 與基于深度學(xué)習(xí)的LSTM 預(yù)測誤差相差不大。 但LSTM 神經(jīng)網(wǎng)絡(luò)克服傳統(tǒng)預(yù)測模型每次加入新數(shù)據(jù),需要重新訓(xùn)練的缺陷,收斂速度也有較大提高,體現(xiàn)神經(jīng)網(wǎng)絡(luò)良好的綜合性能。
當(dāng)采用VMD 優(yōu)化LSTM 后,預(yù)測誤差顯著降低,VMD-LSTM 模型的預(yù)測精度相對三種對比模型總體有了較大提高。 對比傳統(tǒng)時(shí)間序列預(yù)測模型RF,SVM,MAPE 分別減小了8.58%,6.64%,RMSE分別減小了271.05,246.99; 相比LSTM 神經(jīng)網(wǎng)絡(luò),MAPE 減小了8.38%,RMSE 減小了256.99,R 值也有一定的提高。 這是因?yàn)閂MD 將含噪聲的客流量數(shù)據(jù)分解成模態(tài)分量與余量信號,將含噪聲的高頻信號單獨(dú)分離出來,從而弱化樣本噪聲對總體預(yù)測精度的干擾,有效提高神經(jīng)網(wǎng)絡(luò)的預(yù)測精度;同時(shí)使非平穩(wěn)客流量數(shù)據(jù)轉(zhuǎn)換為多個(gè)平穩(wěn)時(shí)間序列,LSTM 神經(jīng)網(wǎng)絡(luò)對這些平穩(wěn)信號進(jìn)行預(yù)測,進(jìn)一步提高模型的魯棒性。
1) 采用VMD 將含噪聲的軌道交通客流量數(shù)據(jù)分解成具有原始數(shù)據(jù)局部特征的不同頻率信號,降低噪聲對模型的干擾,提出VMD-LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
2) 采用明尼蘇達(dá)州軌道交通數(shù)據(jù)驗(yàn)證VMDLSTM 預(yù)測模型性能,結(jié)果表明VMD 改進(jìn)LSTM 能顯著提高神經(jīng)網(wǎng)絡(luò)的預(yù)測精度與魯棒性,預(yù)測誤差相對傳統(tǒng)預(yù)測模型更小。