龔彭鈺 鄔群勇
摘 要:短時交通流預(yù)測是智能交通管理的重要依據(jù)。為了提高短時交通流預(yù)測的精度,從交通流內(nèi)在的穩(wěn)態(tài)特征和動態(tài)特征著手,提出一種基于巴特沃茲濾波(Butterworth filter, BF),結(jié)合支持向量回歸(support vector regression, SVR)算法和門控循環(huán)單元(gated recurrent unit, GRU)模型的預(yù)測方法,即BF-SVR-GRU模型。該方法先對交通流標準化處理,以加快后續(xù)模型計算的速度。通過設(shè)置適當閾值,利用巴特沃茲濾波將交通流信息分解為穩(wěn)態(tài)分量和動態(tài)分量:穩(wěn)態(tài)分量反映交通流總體變化趨勢,動態(tài)分量反映突發(fā)因素(如交通事故、天氣影響等)對交通流的影響。利用門控循環(huán)單元對穩(wěn)態(tài)分量進行訓(xùn)練與預(yù)測,克服門控循環(huán)單元在預(yù)測變化劇烈的序列精度較低的問題;支持向量回歸對非線性序列預(yù)測存在適應(yīng)性較好、低泛化誤差等優(yōu)點,利用支持向量回歸對動態(tài)序列進行訓(xùn)練與預(yù)測。最后,將穩(wěn)態(tài)分量與動態(tài)分量的預(yù)測結(jié)果整合得到最終預(yù)測結(jié)果。采用某市不同的兩個路口的數(shù)據(jù)集進行相關(guān)實驗,結(jié)果表明,BF-SVR-GRU預(yù)測方法具有較好的預(yù)測精度,可為智能交通規(guī)劃與管理提供有效的建議。
關(guān)鍵詞:智能交通;巴特沃茲濾波;短時交通流預(yù)測;門控循環(huán)單元;支持向量回歸
中圖分類號:U495
文獻標志碼:A
隨著我國城市現(xiàn)代化進程的加快,城市中的機動車擁有量也隨之增長,機動車數(shù)量同現(xiàn)有交通設(shè)施的供需不平衡,造成城市中的交通擁堵。加快智能交通管理,緩解交通擁堵是當前各城市交通治理的一個重要趨勢。短時交通流預(yù)測能夠有效反映未來短期的交通流量變化,為交通信號控制、交通誘導(dǎo)等提供重要依據(jù),因而受到相關(guān)部門和科研機構(gòu)的廣泛重視。
隨著交通數(shù)據(jù)采集技術(shù)和傳輸設(shè)備的普及,數(shù)據(jù)獲取途徑的增多,可以獲得大量的交通流數(shù)據(jù),同時計算能力的極大提高,可以應(yīng)對大量數(shù)據(jù)以及復(fù)雜模型,以實現(xiàn)對短時交通流數(shù)據(jù)的分析和預(yù)測。一般來說,預(yù)測時長少于30 min為短時預(yù)測。早期短時交通流預(yù)測主要采用統(tǒng)計模型進行,如自回歸滑動平均模型(autoregressive integrated moving average model, ARIMA)[1]、卡爾曼濾波[2]等。統(tǒng)計模型通過歷史交通信息建立數(shù)學(xué)模型進行預(yù)測,但不論模型如何去擬合數(shù)據(jù),其代表的只是交通流在特定環(huán)境下的一種規(guī)律性的體現(xiàn),真實的交通情況更加復(fù)雜多變。隨著深度學(xué)習(xí)技術(shù)在圖像識別、語音生成等領(lǐng)域的應(yīng)用成熟,將徑向基函數(shù)(radial basis function, RBF)神經(jīng)網(wǎng)絡(luò)[3]、長短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò)[4]、卷積神經(jīng)網(wǎng)絡(luò)(convolution neural networks, CNN)、圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network, GCN)[5]等深度學(xué)習(xí)模型應(yīng)用于短時交通流預(yù)測領(lǐng)域成為熱門。文獻[6]分別使用ARIMA模型、LSTM網(wǎng)絡(luò)、GRU(gated recurrent unit,門控循環(huán)單元)模型預(yù)測交通流;文獻[7]通過對道路網(wǎng)絡(luò)進行抽象,建立快速圖卷積循環(huán)神經(jīng)網(wǎng)絡(luò)進行交通流預(yù)測。但單一的深度學(xué)習(xí)模型只能反映交通流特定方面的特征,預(yù)測精度提高有限。相關(guān)研究開始組合不同模型來提取交通流不同的特征,以提高短時交通流預(yù)測精度。文獻[8]利用CNN與GRU提取時空特征,利用交通流周相似性捕獲周期特征;文獻[9]利用模糊C均值聚類劃分交通流,再輸入BP神經(jīng)網(wǎng)絡(luò)預(yù)測;文獻[10]利用擴散卷積門控循環(huán)單元(diffusion convolutional gated recurrent unit-random forest, DCGRU)來捕獲交通流序列中的時空相關(guān)性特征,再使用隨機森林模型進行預(yù)測;文獻[11]充分利用交通流每日/每周的周期性以及其時空特征,通過組合注意力機制、CNN以及GRU各個模型的優(yōu)勢,提出DNN-BTF(deep neural networks based traffic flow prediction model)的短時交通流預(yù)測模型。這些研究主要著眼于交通流外在的時空特征,缺少對交通流內(nèi)在特征的考慮。
對于現(xiàn)實中的路段,由于駕駛者工作生活的需要、駕駛習(xí)慣以及周遭建筑物的影響,整體上看,交通流在一定的周期范圍內(nèi)是穩(wěn)定的;另一方面,由于交通事故、惡劣天氣等突發(fā)因素的影響,交通流也是具有動態(tài)性的,在突發(fā)因素對交通流影響較大的情況下,交通流往往發(fā)生較大起伏。因此,如何結(jié)合交通流內(nèi)在的穩(wěn)態(tài)性和動態(tài)性進行短時交通流預(yù)測,是一個重要的問題。將交通流分解為不同的分量是一種行之有效的方法,如使用離散傅里葉變換[12]、主成分分析[13]、離散小波變換[14]、Tucker分解[15]等方法先提取交通流的趨勢序列[16],再采用其他算法處理殘差序列,但多數(shù)研究主要關(guān)注點在殘差序列,疏忽對趨勢序列的預(yù)測。
為了有效利用交通流內(nèi)在的穩(wěn)態(tài)性和動態(tài)性,本研究利用巴特沃茲濾波(Butterworth filter,BF)將交通流數(shù)據(jù)分解為穩(wěn)態(tài)分量和動態(tài)分量,引入GRU網(wǎng)絡(luò)提取交通流的穩(wěn)態(tài)特征,利用SVR(support vector regression,支持向量回歸)算法捕獲交通流的動態(tài)特征,構(gòu)成BF-SVR-GRU模型進行交通流的預(yù)測。最后使用兩組不同數(shù)據(jù)集驗證該模型的魯棒性,通過與傳統(tǒng)預(yù)測方法進行對比,驗證分析其有效性。
1 基于BF-SVR-GRU的短時交通流預(yù)測方法
GRU是一種適用于時序數(shù)據(jù)進行回歸預(yù)測的神經(jīng)網(wǎng)絡(luò),其通過大量的時序數(shù)據(jù)訓(xùn)練一個泛化程度較高的回歸模型。研究中,采用某路口3個月內(nèi)所有工作日的流量數(shù)據(jù),利用GRU進行短時交通流預(yù)測實驗發(fā)現(xiàn),雖然GRU模型預(yù)測的變化趨勢大體吻合,但對交通流數(shù)據(jù)中出現(xiàn)的較大波動無法很好地處理。因此,提出對單路口交通流數(shù)據(jù)進行標準化處理,再將交通流分解為穩(wěn)態(tài)分量和動態(tài)分量。將分解出的穩(wěn)態(tài)分量輸入GRU,利用穩(wěn)態(tài)分量起伏變化小、曲線較為平滑的特點,以提高GRU的預(yù)測精度;采用SVR預(yù)測動態(tài)分量,利用其對于振幅較大的數(shù)據(jù)具有較好的預(yù)測精度,且對訓(xùn)練數(shù)據(jù)量要求低的特性。最后,整合穩(wěn)態(tài)分量與動態(tài)分量,得到最終預(yù)測值?;贐F-SVR-GRU的短時交通流預(yù)測方法流程如圖1所示。
1.1 路口流量數(shù)據(jù)標準化
路口的交通流量數(shù)據(jù)由磁感線圈或其他數(shù)據(jù)采集設(shè)備,每隔固定時長進行采集,將其表示為Do={x1,x2,x3,…,xt,…,xn}。其中:xt為不同時刻采集的流量值。
為了避免數(shù)據(jù)值過大,導(dǎo)致模型訓(xùn)練時收斂速度過慢,需要對路口交通流量數(shù)據(jù)Do進行標準化。通過對數(shù)據(jù)進行縮放,使其滿足均值為0和標準差為1的條件。數(shù)據(jù)標準化計算如下:
x*t=xi-μσ(1)
式中:x*t為標準化后的交通流量值,xi為未標準化的流量值,μ、σ分別為交通流量數(shù)據(jù)集的均值和標準差。流量數(shù)據(jù)標準化后為Dnorm={x*1,x*2,x*3,…,x*t,…,x*n}。
1.2 交通流分解
為了有效利用路口交通流內(nèi)在的穩(wěn)態(tài)性和動態(tài)性,采用巴特沃茲濾波對交通流進行分解,其步驟如下:
步驟1 為路口交通流數(shù)據(jù)Dnorm設(shè)計巴特沃茲低通濾波器Flow,用于從交通流中過濾出穩(wěn)態(tài)信息。在交通流分解過程中,階數(shù)N和截止頻率ωc是兩個重要參數(shù)。階數(shù)N越大,濾波器對交通流分解效果越好,但隨著階數(shù)提高,需要計算參數(shù)也隨之增多,計算量更加復(fù)雜;截止頻率ωc影響分解出的穩(wěn)態(tài)分量和動態(tài)分量的振幅起伏程度。
先結(jié)合階數(shù)N計算出交通流的模擬低通濾波器Glow。模擬濾波器用于現(xiàn)實中對連續(xù)信號的過濾,而交通流是離散信號,無法直接用模擬濾波器濾波。其公式為
pk=ejπ12+2k+12N
Glow(p)=1∏N-1k=0(p-pk) (2)
其中,p為復(fù)變量,即交通流中的流量值在復(fù)平面上的表示形式,pk為Glow在復(fù)平面上的極點,結(jié)合雙線性變換法與截止頻率ωc,將Glow轉(zhuǎn)換為數(shù)字低通濾波器Flowz,公式如下:
Flow(z)=Glow(p)p=cot(ωc
2)1-z-11+z-1(3)
步驟2 對路口交通流D norm 做Z變換,將所有流量值轉(zhuǎn)換為z平面上的值,得到Dnorm(z)。同F(xiàn)low做卷積計算,分別得到穩(wěn)態(tài)分量與動態(tài)分量,計算公式如下:
Ds(z)=Flow(z)Dnorm(z)
Dd(z)=Dnorm(z)-Ds(z) (4)
將Ds(z)與Dd(z)通過逆Z變換,得到Ds與Dd。Dd為最終從交通流中分解出的動態(tài)分量,反映不定因素(如交通事故、天氣變化、信號控制等)對交通流的影響;Ds為穩(wěn)態(tài)分量,反映了交通流變化的整體趨勢及周期變化規(guī)律。
1.3 動態(tài)分量預(yù)測
支持向量回歸(SVR)允許f(x)與y之間存在誤差,相當于在擬合曲線上建立“間隔帶”(如圖2),只計算落間隔帶外的訓(xùn)練樣本的誤差損失。通過最大化間隔和減少總損失來擬合回歸模型,具有泛化能力強、魯棒性高、運算速率較快的特點。
將其用于動態(tài)分量預(yù)測的步驟如下:
動態(tài)分量預(yù)測目標在于學(xué)習(xí)關(guān)于動態(tài)分量Dd的回歸模型,公式如下:
f(x)=ωTφ(x)+b(5)
其中:ω={ω1,ω2,…,ωi,…,ωm}為f(x)的系數(shù)向量;φ(x)為核函數(shù),x代表Dd中的值,通過核函數(shù),將x由低維空間映射至高維空間,使其在高維空間線性可分;b代表f(x)的偏置項。
支持向量回歸通過f(x)的損失函數(shù)來計算動態(tài)分量Dd的預(yù)測值同真實值之間的誤差。采用拉格朗日對偶法提高計算效率,通過不斷迭代,獲得一個能夠有效提取交通流動態(tài)特征的SVR模型。
對于回歸模型,為了獲得最優(yōu)的ω、b,引入松弛變量εi、ε^i。松弛變量的引入有利于提高回歸模型對振幅較大的動態(tài)分量Dd的容忍度,得到公式(6)、(7)。通過不斷減小動態(tài)分量的損失誤差,提取交通流中的動態(tài)特征。
minω,b,εi,i12‖ω‖2+C∑mi=1(εi+ε^i)(6)
f(xi)-yi≤ +εi
yi-f(xi)≤ +ε^i
εi≥0,ε^i≥0,i=1,2,…,m (7)
其中:松弛變量εi、ε^i為間隔帶外的訓(xùn)練樣本投影到間隔邊界上的誤差值,C為懲罰系數(shù),用于調(diào)整樣本滿足括號內(nèi)的約束程度; 為間隔帶的寬度;minω,b12‖ω‖2是最大化間隔maxω,b2‖ω‖的等價;C∑mi=1(εi+ε^i)為訓(xùn)練樣本的損失誤差。
1.4 穩(wěn)態(tài)分量預(yù)測
GRU(圖3)能夠有效解決循環(huán)神經(jīng)網(wǎng)絡(luò)中長時依賴的問題,主要通過更新門和復(fù)位門來控制歷史狀態(tài)值的“記憶”與“遺忘”,公式如下:
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
ht=tan h(Wh~t·[rtht-1,xt])
ht=(1-zt)ht-1+ztht (11)
其中:·為矩陣乘法,為Hadamard積,[]表示將兩個矩陣相連,σ為sigmoid函數(shù)。xt為輸入特征,ht-1為上一時刻輸出的狀態(tài),ht為當前時刻的狀態(tài),也可以理解為網(wǎng)絡(luò)最后能記憶的“知識”;ht是候選集,也可以理解為網(wǎng)絡(luò)刷新認知后記下的“知識”;rt是復(fù)位門,用于控制前一時刻的信息有多少同當前時刻信息整合后,被保留在候選集ht中,復(fù)位門越大,前一時刻留在ht中的越多;zt是更新門,用于權(quán)衡前一時刻信息和當前時刻信息的保留與“遺忘”。具體步驟如下:
步驟1 將穩(wěn)態(tài)分量Ds構(gòu)造成輸入特征集X和輸出特征集Y:輸入特征集X用于輸入GRU模型計算,輸出特征Y用于計算損失函數(shù)。其中,穩(wěn)態(tài)分量Ds可以表示成Ds={s1,s2,…,si,…,sn},si代表不同時刻的穩(wěn)態(tài)值??紤]當前穩(wěn)態(tài)值與其前m時刻的穩(wěn)態(tài)值相關(guān),取前m時刻的值作為輸入特征,第m+1時刻的值作為輸出特征,特征集如下:
X=X1X2Xk=
s1s2…sm
s2s3…sm+1
sksk+1…sm+k-1
Y=Y1Y2Yk=sm+1sm+2sm+k? (12)
其中,k代表最終構(gòu)造的樣本集個數(shù)。
步驟2 將輸入特征集X輸入GRU模型進行訓(xùn)練。GRU神經(jīng)網(wǎng)絡(luò)是由許多個GRU單元(如圖3)組成,通過多個單元的組合來提取時序數(shù)據(jù)的隱藏特征。其中,Xk代表特征集X中的特征,將Xk=[sk sk+1 … sm+k-1]輸入GRU神經(jīng)網(wǎng)絡(luò)計算出(參考公式(11))穩(wěn)態(tài)值Y′k=[s′m+k]。
步驟3 計算真實值與GRU預(yù)測的穩(wěn)態(tài)值之間的損失。這里采用均方誤差計算損失,公式如下:
lloss=∑ni=1(Y′i-Yi)2n(13)
步驟4 采用隨機梯度下降法對GRU神經(jīng)網(wǎng)絡(luò)進行優(yōu)化。由于預(yù)測的穩(wěn)態(tài)值是由GRU神經(jīng)網(wǎng)絡(luò)中的Wz、Wr、Wt等權(quán)重計算得來的,需要對損失函數(shù)(13)求梯度,以更新網(wǎng)絡(luò)中的參數(shù)。用W指代GRU網(wǎng)絡(luò)中涉及的所有參數(shù),參考公式
W=W-α×(W)(14)
式中:α代表學(xué)習(xí)率,(W)為GRU網(wǎng)絡(luò)中參數(shù)的梯度,W為計算出新的參數(shù)。
更新GRU網(wǎng)絡(luò)的參數(shù),返回步驟2,將新的輸入特征輸入GRU進行計算。之后不斷重復(fù)這個過程,利用梯度下降法不斷訓(xùn)練GRU神經(jīng)網(wǎng)絡(luò),直到訓(xùn)練出較好的GRU模型,實現(xiàn)對穩(wěn)態(tài)分量Ds的預(yù)測。
2 實驗準備
2.1 數(shù)據(jù)集
本研究數(shù)據(jù)來源于某市兩個不同的路口2017年10月到2018年1月的交通流量數(shù)據(jù)。以下用路口A、路口B分別代表兩個路口,其采樣周期為5 min,每天采集288個數(shù)據(jù),共計22 464個數(shù)據(jù)點。如圖4所示。
從圖中可以發(fā)現(xiàn)兩個路口的數(shù)據(jù)流量變化趨勢具有明顯的不同,路口A交通流量較為平緩,路口B交通流量在一些時間點起伏較大。通過使用不同流量變化趨勢的兩個路口,來驗證BF-SVR-GRU模型預(yù)測的有效性。
在數(shù)據(jù)標準化后,需要構(gòu)造樣本集。依據(jù)時間順序,對兩個路口分別取13 824個數(shù)據(jù)點作為訓(xùn)練集,3 744個數(shù)據(jù)點作為驗證集,4 896個數(shù)據(jù)點作為測試集。
2.2 參數(shù)設(shè)置
文中提出的BF-SVR-GRU預(yù)測方法涉及3方面的參數(shù),經(jīng)過多次實驗得到以下設(shè)置:采用Butterworth濾波進行交通流分解時,階數(shù)N=5,截止頻率ωc根據(jù)實驗需要調(diào)整;穩(wěn)態(tài)分量預(yù)測的時間窗口設(shè)置為12,即使用前1 h的數(shù)據(jù)預(yù)測未來5 min的交通流量,GRU層數(shù)為2,隱藏單元數(shù)為32,全連接層數(shù)為2,隱藏特征數(shù)為16,輸出特征為1,學(xué)習(xí)率為0.02,損失函數(shù)設(shè)為MSE,采用SGD(stochastic gradient descent)優(yōu)化器;動態(tài)分量預(yù)測中SVR的核函數(shù)為linear,懲罰系數(shù)C為1.0。
2.3 性能指標
為了對比不同算法及模型的性能,采用均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)、決定系數(shù)(R2)。其中,RMSE、MAE越小,說明預(yù)測的誤差越小;R2可以用于反映預(yù)測值同真實值之間的擬合程度,越接近1越好。公式如下:
lRMSE=1n∑ni=1y^i-yi2(15)
lMAE=1n∑ni=1y^i-yi(16)
lR2=∑ni=1(y^i-y)2∑ni=1(yi-y)2(17)
式中:y^i代表預(yù)測值,y代表整個數(shù)據(jù)集的均值,yi代表真實值。
3 實驗結(jié)果分析
3.1 模型預(yù)測結(jié)果
實驗中兩個路口的截止頻率ωc取0.45,其他參數(shù)依據(jù)2.2進行設(shè)置。選取兩個路口2017年12月20日3點至2017年12月21日2點的預(yù)測結(jié)果進行分析,結(jié)果見圖5、6。
由圖可見,該方法對兩個路口的交通流量都有較好的預(yù)測效果,能較為準確地反映交通流的變化趨勢,對于交通流中發(fā)生的“振蕩”,模型也能較好地擬合。
3.2 不同截止頻率下模型預(yù)測實驗及分析
實驗的主要參數(shù)依據(jù)2.2進行設(shè)置,截止頻率從0到1,每隔0.1取1個值,在不同截止頻率下使用BF-SVR-GRU預(yù)測模型進行實驗,最后得到預(yù)測模型的誤差及對應(yīng)的性能指標。
如圖7,不同路口在相同閾值下最后的預(yù)測精度差異較大:路口A的數(shù)據(jù)分布較為平穩(wěn),模型的預(yù)測精度較高;路口B的數(shù)據(jù)分布起伏較大,超出模型的泛化能力,實驗中發(fā)現(xiàn)路口B在極端流量值的預(yù)測誤差較大,而路口B的極端流量值較多,造成整體RMSE較高。表1中,雖然路口B的RMSE、MAE整體較低,但路口B的R2基本維持在0.9以上,也就是說路口B的預(yù)測流量曲線基本吻合實際流量曲線,造成RMSE高的原因很大程度在極端流量值的出現(xiàn)。
路口A頻率從0.05到0.25,誤差下降趨勢較大,在0.25到0.35誤差下降趨勢減緩,在0.35之后誤差以較穩(wěn)定的趨勢上升;路口B在頻率0.05至0.35時誤差劇烈下降,0.35之后誤差陡峭上升,其上升的趨勢較路口A較快。截止頻率ωc作為交通流分解模塊的一個重要參數(shù),控制著分解出的動穩(wěn)態(tài)分量的成分,故截止頻率ωc的取值對整個預(yù)測方法有較大的影響。
如表1所示,當頻率取0.1或者0.9時,預(yù)測方法對路口A、B的預(yù)測精度都較低,流量趨勢的擬合能力都較差。當頻率取0.3時,路口A的RMSE相比于頻率取0.1時,降低了50.19%,MAE降低了50.73%,R2提高了9.72%;路口B的RMSE相比于頻率取0.1時,降低了45.52%,MAE降低了45.65%,R2提高了3.57%。
3.3 工作日、非工作日數(shù)據(jù)預(yù)測實驗及分析
為了驗證預(yù)測方法在不同數(shù)據(jù)特性下的有效性,將路口B的數(shù)據(jù)分為全部、工作日、非工作日數(shù)據(jù),分別應(yīng)用BF-SVR-GRU進行預(yù)測,截止頻率取0.45,其他參數(shù)依2.2進行設(shè)置。得到預(yù)測誤差如表2所示。
由表2可以了解,使用全部數(shù)據(jù)、工作日數(shù)據(jù)進行預(yù)測得到的誤差相近,說明該BF-SVR-GRU預(yù)測方法可以適用于不同數(shù)據(jù)特性的數(shù)據(jù)集;使用非工作日數(shù)據(jù)進行預(yù)測的誤差值較高,其可能是參與模型訓(xùn)練的數(shù)據(jù)集過少,以及非工作日居民出行模式復(fù)雜多變,導(dǎo)致交通流變化趨勢不穩(wěn)定。
3.4 不同模型性能對比實驗
為了進一步評價提出的BF-SVR-GRU模型的性能,將本模型與4種流行的預(yù)測模型——支持向量回歸(SVR)、長短期記憶(LSTM)網(wǎng)絡(luò)、門控循環(huán)單元(GRU)、卷積-長短期記憶(convolutional long short-term memory, Conv-LSTM)網(wǎng)絡(luò)分別進行對比分析(見表3)。不同模型參數(shù)設(shè)置如下:支持向量回歸核函數(shù)為linear,懲罰系數(shù)C=1;LSTM和GRU參數(shù)設(shè)置相同,迭代次數(shù)為300次,學(xué)習(xí)率0.02,輸入特征、隱藏特征、輸出特征個數(shù)分別為24、32、1,學(xué)習(xí)步長為288;Conv-LSTM模型迭代次數(shù)300次,學(xué)習(xí)率0.02,卷積層1層,LSTM層2層,學(xué)習(xí)步長288,輸入特征、隱藏特征、輸出特征個數(shù)分別為24、32、1。
表3給出各種模型的預(yù)測結(jié)果。表中BF-SVR-GRU模型路口A的RMSE為4.182,MAE為2.992,R2為0.969,相比于GRU的預(yù)測結(jié)果,其RMSE降低了58.9%,MAE降低了59.04%,R2提高了18.32%;路口B的RMSE為8.828,MAE為6.268,為0.985,相比與GRU的預(yù)測結(jié)果,其RMSE降低了53.59%,MAE降低了52.79%,R2提高了6.03%??梢园l(fā)現(xiàn):在不同路況,BF-SVR-GRU同SVR、LSTM、GRU、Conv-LSTM這些模型相比,其預(yù)測精度具有較大的提升;并且路口A的數(shù)據(jù)集相比路口B更為平穩(wěn),對于其他基準模型雖然其RMSE、MAE能保持較低的值,但其對真實交通流量曲線的擬合能力卻無法保證,BF-SVR-GRU在不同的數(shù)據(jù)分布下,都能保證較好的擬合能力。
4 結(jié)論
從交通流本身特性出發(fā),提出基于BF-SVR-GRU的短時交通流預(yù)測模型,有效利用交通流內(nèi)在的穩(wěn)態(tài)特征與動態(tài)特征,同SVR、LSTM網(wǎng)絡(luò)、GRU、Conv-LSTM網(wǎng)絡(luò)相比,本研究中提出的BF-SVR-GRU模型具有較好的預(yù)測精度,對智能交通管理具有一定的參考價值。然而,BF-SVR-GRU模型在實際預(yù)測交通流時受截止頻率等參數(shù)影響,預(yù)測效果會產(chǎn)生一定波動,并且截止頻率需要人為設(shè)置,不利于實際生產(chǎn)應(yīng)用。后續(xù)研究考慮利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型的原理,讓模型學(xué)習(xí)交通流分解的參數(shù)設(shè)置。交通流的變化除了同自身特性相關(guān)外,還受其周遭的路段影響,即交通流的空間特征。在未來的研究工作中,應(yīng)考慮到上述因素,進一步提高預(yù)測精度。
參考文獻:
[1]SHAHRIARI S, GHASRI M, SISSON S, et al. Ensemble of ARIMA: combining parametric and bootstrapping technique for traffic flow prediction [J]. Transportmetrica A:Transport Science, 2020, 16(3): 1552-1573.
[2] 朱征宇, 劉琳, 崔明. 一種結(jié)合SVM與卡爾曼濾波的短時交通流預(yù)測模型 [J]. 計算機科學(xué), 2013, 40(10): 248-251.
[3] AI C, JIA L, HONG M, et al. Short-term road speed forecasting based on hybrid RBF neural network with the aid of fuzzy system:based techniques in urban traffic flow [J]. IEEE Access, 2020(99): 1.
[4] LI J, LEI G, WEI S, et al. Short term traffic flow prediction based on LSTM [C]//The 2018 Ninth International Conference on Intelligent Control and Information Processing (ICICIP). IEEE, 2018:251-255.
[5] NIEPERT M, AHMED M, KUTZKOV K. Learning convolutional neural networks for graphs [C]//The International Conference on Machine Learning. PMLR, 2016:2014-2023.
[6] FU R, ZHANG Z, LI L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//The 2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). IEEE, 2016:324-328.
[7] ZHANG Y, LU M M, LI H F,et al. Urban traffic flow forecast based on FastGCRNN [J]. Journal of Advanced Transportation, 2020, 2020. DOI: 10. 1155/2020/8859538.
[8] 桂智明, 李壯壯, 郭黎敏. 基于ACGRU模型的短時交通流預(yù)測 [J]. 計算機工程與應(yīng)用, 2020, 56(21): 260-265.
[9] YANG S J, HE G G. A short-term traffic flow forecasting method based on combination of fuzzy C-mean clustering and neural network [J]. Systems Engineering, 2004(8):83-86.
[10]熊亭, 戚湧, 張偉斌. 基于DCGRU-RF模型的路網(wǎng)短時交通流預(yù)測 [J]. 計算機科學(xué), 2020, 47(5):84-89.
[11]WU Y, TAN H, QIN L, et al. A hybrid deep learning based traffic flow prediction method and its understanding [J]. Transportation Research Part C: Emerging Technologies, 2018, 90:166-180.
[12]LUO X L, LI D Y, ZHANG S R, et al. Traffic flow prediction during the holidays based on DFT and SVR [J]. Journal of Sensors, 2019, 2019(10):1-10. DOI: 10. 1155/2019/6461450.
[13]ZHAO Z, ZHANG Y. A traffic flow prediction approach: LSTM with detrending [C]// 2018 IEEE International Conference on Progress in Informatics and Computing (PIC). IEEE, 2018: 101-105.
[14]CHAOVALIT P, GANGOPADHYAY A, KARABATIS G, et al. Discrete wavelet transform:based time series analysis and mining [J]. ACM Computing Surveys, 2011, 43(2):1-37.
[15]周思楚. 基于張量理論的短時交通流預(yù)測算法[D]. 北京:北京交通大學(xué).
[16]RAJABZADEH Y, REZAIE A H, AMINDAVAR H. Short-term traffic flow prediction using time-varying Vasicek model [J]. Transportation Research Part C:Emerging Technologies, 2017, 74:168-181.
(責(zé)任編輯:曾 晶)
Short-term Traffic Flow Prediction Method Based on BF-SVR-GRU
GONG Pengyu ??WU Qunyong
(1.Key Lab of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350108, China; 2.National & Local Joint Engineering Research Center of Satellite Geospatial Information Technology, Fuzhou 350108, China; 3.The Academy of Digital China (Fujian), Fuzhou University, Fuzhou 350108, China)
Abstract:
Short-term traffic flow prediction is an important basis for intelligent traffic management. In order to improve the prediction accuracy, starting from the inherent steady-state and dynamic characteristics of traffic flow, a method based on Butterworth filtering, SVR and GRU was proposed. The method was named BF-SVR-GRU. First, the traffic flow was standardized by this method to speed up the subsequent model calculations. To set the appropriate threshold, Butterworth filtering was used to divide steady-state components and dynamic components from the traffic flow information. The general trend of traffic flow was reflected in the steady-state component, and the impact of uncertain factors (such as traffic accidents, weather effects, etc.) was reflected in the dynamic component. Aiming at the problem of GRU's low accuracy in predicting rapidly changing sequences, steady-state sequences were used to train and predict GRUs; considering the advantages of SVR's better adaptability to non-linear sequences and low generalization errors, SVR was used to train and predict dynamic sequences. Finally, the results of steady-state components and dynamic components predictions were integrated as the final prediction result. The datasets of two different intersections in a certain city were used to carry out related experiments. The results show that the BF-SVR-GRU prediction method has better prediction accuracy, and can provide effective suggestions for intelligent transportation planning and management.
Key words:
intelligent transportation; Butterworth filtering; short-term traffic flow prediction; gated recurrent unit; support vector regression
2900500520355