摘 要:短時(shí)交通流預(yù)測是智能交通管理的重要依據(jù)。為了提高短時(shí)交通流預(yù)測的精度,從交通流內(nèi)在的穩(wěn)態(tài)特征和動(dòng)態(tài)特征著手,提出一種基于巴特沃茲濾波(Butterworth filter, BF),結(jié)合支持向量回歸(support vector regression, SVR)算法和門控循環(huán)單元(gated recurrent unit, GRU)模型的預(yù)測方法,即BF-SVR-GRU模型。該方法先對交通流標(biāo)準(zhǔn)化處理,以加快后續(xù)模型計(jì)算的速度。通過設(shè)置適當(dāng)閾值,利用巴特沃茲濾波將交通流信息分解為穩(wěn)態(tài)分量和動(dòng)態(tài)分量:穩(wěn)態(tài)分量反映交通流總體變化趨勢,動(dòng)態(tài)分量反映突發(fā)因素(如交通事故、天氣影響等)對交通流的影響。利用門控循環(huán)單元對穩(wěn)態(tài)分量進(jìn)行訓(xùn)練與預(yù)測,克服門控循環(huán)單元在預(yù)測變化劇烈的序列精度較低的問題;支持向量回歸對非線性序列預(yù)測存在適應(yīng)性較好、低泛化誤差等優(yōu)點(diǎn),利用支持向量回歸對動(dòng)態(tài)序列進(jìn)行訓(xùn)練與預(yù)測。最后,將穩(wěn)態(tài)分量與動(dòng)態(tài)分量的預(yù)測結(jié)果整合得到最終預(yù)測結(jié)果。采用某市不同的兩個(gè)路口的數(shù)據(jù)集進(jìn)行相關(guān)實(shí)驗(yàn),結(jié)果表明,BF-SVR-GRU預(yù)測方法具有較好的預(yù)測精度,可為智能交通規(guī)劃與管理提供有效的建議。
關(guān)鍵詞:智能交通;巴特沃茲濾波;短時(shí)交通流預(yù)測;門控循環(huán)單元;支持向量回歸
中圖分類號(hào):U495
文獻(xiàn)標(biāo)志碼:A
隨著我國城市現(xiàn)代化進(jìn)程的加快,城市中的機(jī)動(dòng)車擁有量也隨之增長,機(jī)動(dòng)車數(shù)量同現(xiàn)有交通設(shè)施的供需不平衡,造成城市中的交通擁堵。加快智能交通管理,緩解交通擁堵是當(dāng)前各城市交通治理的一個(gè)重要趨勢。短時(shí)交通流預(yù)測能夠有效反映未來短期的交通流量變化,為交通信號(hào)控制、交通誘導(dǎo)等提供重要依據(jù),因而受到相關(guān)部門和科研機(jī)構(gòu)的廣泛重視。
隨著交通數(shù)據(jù)采集技術(shù)和傳輸設(shè)備的普及,數(shù)據(jù)獲取途徑的增多,可以獲得大量的交通流數(shù)據(jù),同時(shí)計(jì)算能力的極大提高,可以應(yīng)對大量數(shù)據(jù)以及復(fù)雜模型,以實(shí)現(xiàn)對短時(shí)交通流數(shù)據(jù)的分析和預(yù)測。一般來說,預(yù)測時(shí)長少于30 min為短時(shí)預(yù)測。早期短時(shí)交通流預(yù)測主要采用統(tǒng)計(jì)模型進(jìn)行,如自回歸滑動(dòng)平均模型(autoregressive integrated moving average model, ARIMA)[1]、卡爾曼濾波[2]等。統(tǒng)計(jì)模型通過歷史交通信息建立數(shù)學(xué)模型進(jìn)行預(yù)測,但不論模型如何去擬合數(shù)據(jù),其代表的只是交通流在特定環(huán)境下的一種規(guī)律性的體現(xiàn),真實(shí)的交通情況更加復(fù)雜多變。隨著深度學(xué)習(xí)技術(shù)在圖像識(shí)別、語音生成等領(lǐng)域的應(yīng)用成熟,將徑向基函數(shù)(radial basis function, RBF)神經(jīng)網(wǎng)絡(luò)[3]、長短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò)[4]、卷積神經(jīng)網(wǎng)絡(luò)(convolution neural networks, CNN)、圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network, GCN)[5]等深度學(xué)習(xí)模型應(yīng)用于短時(shí)交通流預(yù)測領(lǐng)域成為熱門。文獻(xiàn)[6]分別使用ARIMA模型、LSTM網(wǎng)絡(luò)、GRU(gated recurrent unit,門控循環(huán)單元)模型預(yù)測交通流;文獻(xiàn)[7]通過對道路網(wǎng)絡(luò)進(jìn)行抽象,建立快速圖卷積循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行交通流預(yù)測。但單一的深度學(xué)習(xí)模型只能反映交通流特定方面的特征,預(yù)測精度提高有限。相關(guān)研究開始組合不同模型來提取交通流不同的特征,以提高短時(shí)交通流預(yù)測精度。文獻(xiàn)[8]利用CNN與GRU提取時(shí)空特征,利用交通流周相似性捕獲周期特征;文獻(xiàn)[9]利用模糊C均值聚類劃分交通流,再輸入BP神經(jīng)網(wǎng)絡(luò)預(yù)測;文獻(xiàn)[10]利用擴(kuò)散卷積門控循環(huán)單元(diffusion convolutional gated recurrent unit-random forest, DCGRU)來捕獲交通流序列中的時(shí)空相關(guān)性特征,再使用隨機(jī)森林模型進(jìn)行預(yù)測;文獻(xiàn)[11]充分利用交通流每日/每周的周期性以及其時(shí)空特征,通過組合注意力機(jī)制、CNN以及GRU各個(gè)模型的優(yōu)勢,提出DNN-BTF(deep neural networks based traffic flow prediction model)的短時(shí)交通流預(yù)測模型。這些研究主要著眼于交通流外在的時(shí)空特征,缺少對交通流內(nèi)在特征的考慮。
對于現(xiàn)實(shí)中的路段,由于駕駛者工作生活的需要、駕駛習(xí)慣以及周遭建筑物的影響,整體上看,交通流在一定的周期范圍內(nèi)是穩(wěn)定的;另一方面,由于交通事故、惡劣天氣等突發(fā)因素的影響,交通流也是具有動(dòng)態(tài)性的,在突發(fā)因素對交通流影響較大的情況下,交通流往往發(fā)生較大起伏。因此,如何結(jié)合交通流內(nèi)在的穩(wěn)態(tài)性和動(dòng)態(tài)性進(jìn)行短時(shí)交通流預(yù)測,是一個(gè)重要的問題。將交通流分解為不同的分量是一種行之有效的方法,如使用離散傅里葉變換[12]、主成分分析[13]、離散小波變換[14]、Tucker分解[15]等方法先提取交通流的趨勢序列[16],再采用其他算法處理殘差序列,但多數(shù)研究主要關(guān)注點(diǎn)在殘差序列,疏忽對趨勢序列的預(yù)測。
為了有效利用交通流內(nèi)在的穩(wěn)態(tài)性和動(dòng)態(tài)性,本研究利用巴特沃茲濾波(Butterworth filter,BF)將交通流數(shù)據(jù)分解為穩(wěn)態(tài)分量和動(dòng)態(tài)分量,引入GRU網(wǎng)絡(luò)提取交通流的穩(wěn)態(tài)特征,利用SVR(support vector regression,支持向量回歸)算法捕獲交通流的動(dòng)態(tài)特征,構(gòu)成BF-SVR-GRU模型進(jìn)行交通流的預(yù)測。最后使用兩組不同數(shù)據(jù)集驗(yàn)證該模型的魯棒性,通過與傳統(tǒng)預(yù)測方法進(jìn)行對比,驗(yàn)證分析其有效性。
1 基于BF-SVR-GRU的短時(shí)交通流預(yù)測方法
GRU是一種適用于時(shí)序數(shù)據(jù)進(jìn)行回歸預(yù)測的神經(jīng)網(wǎng)絡(luò),其通過大量的時(shí)序數(shù)據(jù)訓(xùn)練一個(gè)泛化程度較高的回歸模型。研究中,采用某路口3個(gè)月內(nèi)所有工作日的流量數(shù)據(jù),利用GRU進(jìn)行短時(shí)交通流預(yù)測實(shí)驗(yàn)發(fā)現(xiàn),雖然GRU模型預(yù)測的變化趨勢大體吻合,但對交通流數(shù)據(jù)中出現(xiàn)的較大波動(dòng)無法很好地處理。因此,提出對單路口交通流數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,再將交通流分解為穩(wěn)態(tài)分量和動(dòng)態(tài)分量。將分解出的穩(wěn)態(tài)分量輸入GRU,利用穩(wěn)態(tài)分量起伏變化小、曲線較為平滑的特點(diǎn),以提高GRU的預(yù)測精度;采用SVR預(yù)測動(dòng)態(tài)分量,利用其對于振幅較大的數(shù)據(jù)具有較好的預(yù)測精度,且對訓(xùn)練數(shù)據(jù)量要求低的特性。最后,整合穩(wěn)態(tài)分量與動(dòng)態(tài)分量,得到最終預(yù)測值。基于BF-SVR-GRU的短時(shí)交通流預(yù)測方法流程如圖1所示。
1.1 路口流量數(shù)據(jù)標(biāo)準(zhǔn)化
路口的交通流量數(shù)據(jù)由磁感線圈或其他數(shù)據(jù)采集設(shè)備,每隔固定時(shí)長進(jìn)行采集,將其表示為Do={x1,x2,x3,…,xt,…,xn}。其中:xt為不同時(shí)刻采集的流量值。
為了避免數(shù)據(jù)值過大,導(dǎo)致模型訓(xùn)練時(shí)收斂速度過慢,需要對路口交通流量數(shù)據(jù)Do進(jìn)行標(biāo)準(zhǔn)化。通過對數(shù)據(jù)進(jìn)行縮放,使其滿足均值為0和標(biāo)準(zhǔn)差為1的條件。數(shù)據(jù)標(biāo)準(zhǔn)化計(jì)算如下:
x*t=xi-μσ(1)
式中:x*t為標(biāo)準(zhǔn)化后的交通流量值,xi為未標(biāo)準(zhǔn)化的流量值,μ、σ分別為交通流量數(shù)據(jù)集的均值和標(biāo)準(zhǔn)差。流量數(shù)據(jù)標(biāo)準(zhǔn)化后為Dnorm={x*1,x*2,x*3,…,x*t,…,x*n}。
1.2 交通流分解
為了有效利用路口交通流內(nèi)在的穩(wěn)態(tài)性和動(dòng)態(tài)性,采用巴特沃茲濾波對交通流進(jìn)行分解,其步驟如下:
步驟1 為路口交通流數(shù)據(jù)Dnorm設(shè)計(jì)巴特沃茲低通濾波器Flow,用于從交通流中過濾出穩(wěn)態(tài)信息。在交通流分解過程中,階數(shù)N和截止頻率ωc是兩個(gè)重要參數(shù)。階數(shù)N越大,濾波器對交通流分解效果越好,但隨著階數(shù)提高,需要計(jì)算參數(shù)也隨之增多,計(jì)算量更加復(fù)雜;截止頻率ωc影響分解出的穩(wěn)態(tài)分量和動(dòng)態(tài)分量的振幅起伏程度。
先結(jié)合階數(shù)N計(jì)算出交通流的模擬低通濾波器Glow。模擬濾波器用于現(xiàn)實(shí)中對連續(xù)信號(hào)的過濾,而交通流是離散信號(hào),無法直接用模擬濾波器濾波。其公式為
pk=ejπ12+2k+12N
Glow(p)=1∏N-1k=0(p-pk) (2)
其中,p為復(fù)變量,即交通流中的流量值在復(fù)平面上的表示形式,pk為Glow在復(fù)平面上的極點(diǎn),結(jié)合雙線性變換法與截止頻率ωc,將Glow轉(zhuǎn)換為數(shù)字低通濾波器Flowz,公式如下:
Flow(z)=Glow(p)p=cot(ωc
2)1-z-11+z-1(3)
步驟2 對路口交通流D norm 做Z變換,將所有流量值轉(zhuǎn)換為z平面上的值,得到Dnorm(z)。同F(xiàn)low做卷積計(jì)算,分別得到穩(wěn)態(tài)分量與動(dòng)態(tài)分量,計(jì)算公式如下:
Ds(z)=Flow(z)Dnorm(z)
Dd(z)=Dnorm(z)-Ds(z) (4)
將Ds(z)與Dd(z)通過逆Z變換,得到Ds與Dd。Dd為最終從交通流中分解出的動(dòng)態(tài)分量,反映不定因素(如交通事故、天氣變化、信號(hào)控制等)對交通流的影響;Ds為穩(wěn)態(tài)分量,反映了交通流變化的整體趨勢及周期變化規(guī)律。
1.3 動(dòng)態(tài)分量預(yù)測
支持向量回歸(SVR)允許f(x)與y之間存在誤差,相當(dāng)于在擬合曲線上建立“間隔帶”(如圖2),只計(jì)算落間隔帶外的訓(xùn)練樣本的誤差損失。通過最大化間隔和減少總損失來擬合回歸模型,具有泛化能力強(qiáng)、魯棒性高、運(yùn)算速率較快的特點(diǎn)。
將其用于動(dòng)態(tài)分量預(yù)測的步驟如下:
動(dòng)態(tài)分量預(yù)測目標(biāo)在于學(xué)習(xí)關(guān)于動(dòng)態(tài)分量Dd的回歸模型,公式如下:
f(x)=ωTφ(x)+b(5)
其中:ω={ω1,ω2,…,ωi,…,ωm}為f(x)的系數(shù)向量;φ(x)為核函數(shù),x代表Dd中的值,通過核函數(shù),將x由低維空間映射至高維空間,使其在高維空間線性可分;b代表f(x)的偏置項(xiàng)。
支持向量回歸通過f(x)的損失函數(shù)來計(jì)算動(dòng)態(tài)分量Dd的預(yù)測值同真實(shí)值之間的誤差。采用拉格朗日對偶法提高計(jì)算效率,通過不斷迭代,獲得一個(gè)能夠有效提取交通流動(dòng)態(tài)特征的SVR模型。
對于回歸模型,為了獲得最優(yōu)的ω、b,引入松弛變量εi、ε^i。松弛變量的引入有利于提高回歸模型對振幅較大的動(dòng)態(tài)分量Dd的容忍度,得到公式(6)、(7)。通過不斷減小動(dòng)態(tài)分量的損失誤差,提取交通流中的動(dòng)態(tài)特征。
minω,b,εi,i12‖ω‖2+C∑mi=1(εi+ε^i)(6)
f(xi)-yi≤ +εi
yi-f(xi)≤ +ε^i
εi≥0,ε^i≥0,i=1,2,…,m (7)
其中:松弛變量εi、ε^i為間隔帶外的訓(xùn)練樣本投影到間隔邊界上的誤差值,C為懲罰系數(shù),用于調(diào)整樣本滿足括號(hào)內(nèi)的約束程度; 為間隔帶的寬度;minω,b12‖ω‖2是最大化間隔maxω,b2‖ω‖的等價(jià);C∑mi=1(εi+ε^i)為訓(xùn)練樣本的損失誤差。
1.4 穩(wěn)態(tài)分量預(yù)測
GRU(圖3)能夠有效解決循環(huán)神經(jīng)網(wǎng)絡(luò)中長時(shí)依賴的問題,主要通過更新門和復(fù)位門來控制歷史狀態(tài)值的“記憶”與“遺忘”,公式如下:
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
ht=tan h(Wh~t·[rtht-1,xt])
ht=(1-zt)ht-1+ztht (11)
其中:·為矩陣乘法,為Hadamard積,[]表示將兩個(gè)矩陣相連,σ為sigmoid函數(shù)。xt為輸入特征,ht-1為上一時(shí)刻輸出的狀態(tài),ht為當(dāng)前時(shí)刻的狀態(tài),也可以理解為網(wǎng)絡(luò)最后能記憶的“知識(shí)”;ht是候選集,也可以理解為網(wǎng)絡(luò)刷新認(rèn)知后記下的“知識(shí)”;rt是復(fù)位門,用于控制前一時(shí)刻的信息有多少同當(dāng)前時(shí)刻信息整合后,被保留在候選集ht中,復(fù)位門越大,前一時(shí)刻留在ht中的越多;zt是更新門,用于權(quán)衡前一時(shí)刻信息和當(dāng)前時(shí)刻信息的保留與“遺忘”。具體步驟如下:
步驟1 將穩(wěn)態(tài)分量Ds構(gòu)造成輸入特征集X和輸出特征集Y:輸入特征集X用于輸入GRU模型計(jì)算,輸出特征Y用于計(jì)算損失函數(shù)。其中,穩(wěn)態(tài)分量Ds可以表示成Ds={s1,s2,…,si,…,sn},si代表不同時(shí)刻的穩(wěn)態(tài)值??紤]當(dāng)前穩(wěn)態(tài)值與其前m時(shí)刻的穩(wěn)態(tài)值相關(guān),取前m時(shí)刻的值作為輸入特征,第m+1時(shí)刻的值作為輸出特征,特征集如下:
X=X1X2Xk=
s1s2…sm
s2s3…sm+1
sksk+1…sm+k-1
Y=Y1Y2Yk=sm+1sm+2sm+k" (12)
其中,k代表最終構(gòu)造的樣本集個(gè)數(shù)。
步驟2 將輸入特征集X輸入GRU模型進(jìn)行訓(xùn)練。GRU神經(jīng)網(wǎng)絡(luò)是由許多個(gè)GRU單元(如圖3)組成,通過多個(gè)單元的組合來提取時(shí)序數(shù)據(jù)的隱藏特征。其中,Xk代表特征集X中的特征,將Xk=[sk sk+1 … sm+k-1]輸入GRU神經(jīng)網(wǎng)絡(luò)計(jì)算出(參考公式(11))穩(wěn)態(tài)值Y′k=[s′m+k]。
步驟3 計(jì)算真實(shí)值與GRU預(yù)測的穩(wěn)態(tài)值之間的損失。這里采用均方誤差計(jì)算損失,公式如下:
lloss=∑ni=1(Y′i-Yi)2n(13)
步驟4 采用隨機(jī)梯度下降法對GRU神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化。由于預(yù)測的穩(wěn)態(tài)值是由GRU神經(jīng)網(wǎng)絡(luò)中的Wz、Wr、Wt等權(quán)重計(jì)算得來的,需要對損失函數(shù)(13)求梯度,以更新網(wǎng)絡(luò)中的參數(shù)。用W指代GRU網(wǎng)絡(luò)中涉及的所有參數(shù),參考公式
W=W-α×(W)(14)
式中:α代表學(xué)習(xí)率,(W)為GRU網(wǎng)絡(luò)中參數(shù)的梯度,W為計(jì)算出新的參數(shù)。
更新GRU網(wǎng)絡(luò)的參數(shù),返回步驟2,將新的輸入特征輸入GRU進(jìn)行計(jì)算。之后不斷重復(fù)這個(gè)過程,利用梯度下降法不斷訓(xùn)練GRU神經(jīng)網(wǎng)絡(luò),直到訓(xùn)練出較好的GRU模型,實(shí)現(xiàn)對穩(wěn)態(tài)分量Ds的預(yù)測。
2 實(shí)驗(yàn)準(zhǔn)備
2.1 數(shù)據(jù)集
本研究數(shù)據(jù)來源于某市兩個(gè)不同的路口2017年10月到2018年1月的交通流量數(shù)據(jù)。以下用路口A、路口B分別代表兩個(gè)路口,其采樣周期為5 min,每天采集288個(gè)數(shù)據(jù),共計(jì)22 464個(gè)數(shù)據(jù)點(diǎn)。如圖4所示。
從圖中可以發(fā)現(xiàn)兩個(gè)路口的數(shù)據(jù)流量變化趨勢具有明顯的不同,路口A交通流量較為平緩,路口B交通流量在一些時(shí)間點(diǎn)起伏較大。通過使用不同流量變化趨勢的兩個(gè)路口,來驗(yàn)證BF-SVR-GRU模型預(yù)測的有效性。
在數(shù)據(jù)標(biāo)準(zhǔn)化后,需要構(gòu)造樣本集。依據(jù)時(shí)間順序,對兩個(gè)路口分別取13 824個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集,3 744個(gè)數(shù)據(jù)點(diǎn)作為驗(yàn)證集,4 896個(gè)數(shù)據(jù)點(diǎn)作為測試集。
2.2 參數(shù)設(shè)置
文中提出的BF-SVR-GRU預(yù)測方法涉及3方面的參數(shù),經(jīng)過多次實(shí)驗(yàn)得到以下設(shè)置:采用Butterworth濾波進(jìn)行交通流分解時(shí),階數(shù)N=5,截止頻率ωc根據(jù)實(shí)驗(yàn)需要調(diào)整;穩(wěn)態(tài)分量預(yù)測的時(shí)間窗口設(shè)置為12,即使用前1 h的數(shù)據(jù)預(yù)測未來5 min的交通流量,GRU層數(shù)為2,隱藏單元數(shù)為32,全連接層數(shù)為2,隱藏特征數(shù)為16,輸出特征為1,學(xué)習(xí)率為0.02,損失函數(shù)設(shè)為MSE,采用SGD(stochastic gradient descent)優(yōu)化器;動(dòng)態(tài)分量預(yù)測中SVR的核函數(shù)為linear,懲罰系數(shù)C為1.0。
2.3 性能指標(biāo)
為了對比不同算法及模型的性能,采用均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)、決定系數(shù)(R2)。其中,RMSE、MAE越小,說明預(yù)測的誤差越小;R2可以用于反映預(yù)測值同真實(shí)值之間的擬合程度,越接近1越好。公式如下:
lRMSE=1n∑ni=1y^i-yi2(15)
lMAE=1n∑ni=1y^i-yi(16)
lR2=∑ni=1(y^i-y)2∑ni=1(yi-y)2(17)
式中:y^i代表預(yù)測值,y代表整個(gè)數(shù)據(jù)集的均值,yi代表真實(shí)值。
3 實(shí)驗(yàn)結(jié)果分析
3.1 模型預(yù)測結(jié)果
實(shí)驗(yàn)中兩個(gè)路口的截止頻率ωc取0.45,其他參數(shù)依據(jù)2.2進(jìn)行設(shè)置。選取兩個(gè)路口2017年12月20日3點(diǎn)至2017年12月21日2點(diǎn)的預(yù)測結(jié)果進(jìn)行分析,結(jié)果見圖5、6。
由圖可見,該方法對兩個(gè)路口的交通流量都有較好的預(yù)測效果,能較為準(zhǔn)確地反映交通流的變化趨勢,對于交通流中發(fā)生的“振蕩”,模型也能較好地?cái)M合。
3.2 不同截止頻率下模型預(yù)測實(shí)驗(yàn)及分析
實(shí)驗(yàn)的主要參數(shù)依據(jù)2.2進(jìn)行設(shè)置,截止頻率從0到1,每隔0.1取1個(gè)值,在不同截止頻率下使用BF-SVR-GRU預(yù)測模型進(jìn)行實(shí)驗(yàn),最后得到預(yù)測模型的誤差及對應(yīng)的性能指標(biāo)。
如圖7,不同路口在相同閾值下最后的預(yù)測精度差異較大:路口A的數(shù)據(jù)分布較為平穩(wěn),模型的預(yù)測精度較高;路口B的數(shù)據(jù)分布起伏較大,超出模型的泛化能力,實(shí)驗(yàn)中發(fā)現(xiàn)路口B在極端流量值的預(yù)測誤差較大,而路口B的極端流量值較多,造成整體RMSE較高。表1中,雖然路口B的RMSE、MAE整體較低,但路口B的R2基本維持在0.9以上,也就是說路口B的預(yù)測流量曲線基本吻合實(shí)際流量曲線,造成RMSE高的原因很大程度在極端流量值的出現(xiàn)。
路口A頻率從0.05到0.25,誤差下降趨勢較大,在0.25到0.35誤差下降趨勢減緩,在0.35之后誤差以較穩(wěn)定的趨勢上升;路口B在頻率0.05至0.35時(shí)誤差劇烈下降,0.35之后誤差陡峭上升,其上升的趨勢較路口A較快。截止頻率ωc作為交通流分解模塊的一個(gè)重要參數(shù),控制著分解出的動(dòng)穩(wěn)態(tài)分量的成分,故截止頻率ωc的取值對整個(gè)預(yù)測方法有較大的影響。
如表1所示,當(dāng)頻率取0.1或者0.9時(shí),預(yù)測方法對路口A、B的預(yù)測精度都較低,流量趨勢的擬合能力都較差。當(dāng)頻率取0.3時(shí),路口A的RMSE相比于頻率取0.1時(shí),降低了50.19%,MAE降低了50.73%,R2提高了9.72%;路口B的RMSE相比于頻率取0.1時(shí),降低了45.52%,MAE降低了45.65%,R2提高了3.57%。
3.3 工作日、非工作日數(shù)據(jù)預(yù)測實(shí)驗(yàn)及分析
為了驗(yàn)證預(yù)測方法在不同數(shù)據(jù)特性下的有效性,將路口B的數(shù)據(jù)分為全部、工作日、非工作日數(shù)據(jù),分別應(yīng)用BF-SVR-GRU進(jìn)行預(yù)測,截止頻率取0.45,其他參數(shù)依2.2進(jìn)行設(shè)置。得到預(yù)測誤差如表2所示。
由表2可以了解,使用全部數(shù)據(jù)、工作日數(shù)據(jù)進(jìn)行預(yù)測得到的誤差相近,說明該BF-SVR-GRU預(yù)測方法可以適用于不同數(shù)據(jù)特性的數(shù)據(jù)集;使用非工作日數(shù)據(jù)進(jìn)行預(yù)測的誤差值較高,其可能是參與模型訓(xùn)練的數(shù)據(jù)集過少,以及非工作日居民出行模式復(fù)雜多變,導(dǎo)致交通流變化趨勢不穩(wěn)定。
3.4 不同模型性能對比實(shí)驗(yàn)
為了進(jìn)一步評價(jià)提出的BF-SVR-GRU模型的性能,將本模型與4種流行的預(yù)測模型——支持向量回歸(SVR)、長短期記憶(LSTM)網(wǎng)絡(luò)、門控循環(huán)單元(GRU)、卷積-長短期記憶(convolutional long short-term memory, Conv-LSTM)網(wǎng)絡(luò)分別進(jìn)行對比分析(見表3)。不同模型參數(shù)設(shè)置如下:支持向量回歸核函數(shù)為linear,懲罰系數(shù)C=1;LSTM和GRU參數(shù)設(shè)置相同,迭代次數(shù)為300次,學(xué)習(xí)率0.02,輸入特征、隱藏特征、輸出特征個(gè)數(shù)分別為24、32、1,學(xué)習(xí)步長為288;Conv-LSTM模型迭代次數(shù)300次,學(xué)習(xí)率0.02,卷積層1層,LSTM層2層,學(xué)習(xí)步長288,輸入特征、隱藏特征、輸出特征個(gè)數(shù)分別為24、32、1。
表3給出各種模型的預(yù)測結(jié)果。表中BF-SVR-GRU模型路口A的RMSE為4.182,MAE為2.992,R2為0.969,相比于GRU的預(yù)測結(jié)果,其RMSE降低了58.9%,MAE降低了59.04%,R2提高了18.32%;路口B的RMSE為8.828,MAE為6.268,為0.985,相比與GRU的預(yù)測結(jié)果,其RMSE降低了53.59%,MAE降低了52.79%,R2提高了6.03%??梢园l(fā)現(xiàn):在不同路況,BF-SVR-GRU同SVR、LSTM、GRU、Conv-LSTM這些模型相比,其預(yù)測精度具有較大的提升;并且路口A的數(shù)據(jù)集相比路口B更為平穩(wěn),對于其他基準(zhǔn)模型雖然其RMSE、MAE能保持較低的值,但其對真實(shí)交通流量曲線的擬合能力卻無法保證,BF-SVR-GRU在不同的數(shù)據(jù)分布下,都能保證較好的擬合能力。
4 結(jié)論
從交通流本身特性出發(fā),提出基于BF-SVR-GRU的短時(shí)交通流預(yù)測模型,有效利用交通流內(nèi)在的穩(wěn)態(tài)特征與動(dòng)態(tài)特征,同SVR、LSTM網(wǎng)絡(luò)、GRU、Conv-LSTM網(wǎng)絡(luò)相比,本研究中提出的BF-SVR-GRU模型具有較好的預(yù)測精度,對智能交通管理具有一定的參考價(jià)值。然而,BF-SVR-GRU模型在實(shí)際預(yù)測交通流時(shí)受截止頻率等參數(shù)影響,預(yù)測效果會(huì)產(chǎn)生一定波動(dòng),并且截止頻率需要人為設(shè)置,不利于實(shí)際生產(chǎn)應(yīng)用。后續(xù)研究考慮利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型的原理,讓模型學(xué)習(xí)交通流分解的參數(shù)設(shè)置。交通流的變化除了同自身特性相關(guān)外,還受其周遭的路段影響,即交通流的空間特征。在未來的研究工作中,應(yīng)考慮到上述因素,進(jìn)一步提高預(yù)測精度。
參考文獻(xiàn):
[1]SHAHRIARI S, GHASRI M, SISSON S, et al. Ensemble of ARIMA: combining parametric and bootstrapping technique for traffic flow prediction [J]. Transportmetrica A:Transport Science, 2020, 16(3): 1552-1573.
[2] 朱征宇, 劉琳, 崔明. 一種結(jié)合SVM與卡爾曼濾波的短時(shí)交通流預(yù)測模型 [J]. 計(jì)算機(jī)科學(xué), 2013, 40(10): 248-251.
[3] AI C, JIA L, HONG M, et al. Short-term road speed forecasting based on hybrid RBF neural network with the aid of fuzzy system:based techniques in urban traffic flow [J]. IEEE Access, 2020(99): 1.
[4] LI J, LEI G, WEI S, et al. Short term traffic flow prediction based on LSTM [C]//The 2018 Ninth International Conference on Intelligent Control and Information Processing (ICICIP). IEEE, 2018:251-255.
[5] NIEPERT M, AHMED M, KUTZKOV K. Learning convolutional neural networks for graphs [C]//The International Conference on Machine Learning. PMLR, 2016:2014-2023.
[6] FU R, ZHANG Z, LI L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//The 2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). IEEE, 2016:324-328.
[7] ZHANG Y, LU M M, LI H F,et al. Urban traffic flow forecast based on FastGCRNN [J]. Journal of Advanced Transportation, 2020, 2020. DOI: 10. 1155/2020/8859538.
[8] 桂智明, 李壯壯, 郭黎敏. 基于ACGRU模型的短時(shí)交通流預(yù)測 [J]. 計(jì)算機(jī)工程與應(yīng)用, 2020, 56(21): 260-265.
[9] YANG S J, HE G G. A short-term traffic flow forecasting method based on combination of fuzzy C-mean clustering and neural network [J]. Systems Engineering, 2004(8):83-86.
[10]熊亭, 戚湧, 張偉斌. 基于DCGRU-RF模型的路網(wǎng)短時(shí)交通流預(yù)測 [J]. 計(jì)算機(jī)科學(xué), 2020, 47(5):84-89.
[11]WU Y, TAN H, QIN L, et al. A hybrid deep learning based traffic flow prediction method and its understanding [J]. Transportation Research Part C: Emerging Technologies, 2018, 90:166-180.
[12]LUO X L, LI D Y, ZHANG S R, et al. Traffic flow prediction during the holidays based on DFT and SVR [J]. Journal of Sensors, 2019, 2019(10):1-10. DOI: 10. 1155/2019/6461450.
[13]ZHAO Z, ZHANG Y. A traffic flow prediction approach: LSTM with detrending [C]// 2018 IEEE International Conference on Progress in Informatics and Computing (PIC). IEEE, 2018: 101-105.
[14]CHAOVALIT P, GANGOPADHYAY A, KARABATIS G, et al. Discrete wavelet transform:based time series analysis and mining [J]. ACM Computing Surveys, 2011, 43(2):1-37.
[15]周思楚. 基于張量理論的短時(shí)交通流預(yù)測算法[D]. 北京:北京交通大學(xué).
[16]RAJABZADEH Y, REZAIE A H, AMINDAVAR H. Short-term traffic flow prediction using time-varying Vasicek model [J]. Transportation Research Part C:Emerging Technologies, 2017, 74:168-181.
(責(zé)任編輯:曾 晶)
Short-term Traffic Flow Prediction Method Based on BF-SVR-GRU
GONG Pengyu ""WU Qunyong
(1.Key Lab of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350108, China; 2.National amp; Local Joint Engineering Research Center of Satellite Geospatial Information Technology, Fuzhou 350108, China; 3.The Academy of Digital China (Fujian), Fuzhou University, Fuzhou 350108, China)
Abstract:
Short-term traffic flow prediction is an important basis for intelligent traffic management. In order to improve the prediction accuracy, starting from the inherent steady-state and dynamic characteristics of traffic flow, a method based on Butterworth filtering, SVR and GRU was proposed. The method was named BF-SVR-GRU. First, the traffic flow was standardized by this method to speed up the subsequent model calculations. To set the appropriate threshold, Butterworth filtering was used to divide steady-state components and dynamic components from the traffic flow information. The general trend of traffic flow was reflected in the steady-state component, and the impact of uncertain factors (such as traffic accidents, weather effects, etc.) was reflected in the dynamic component. Aiming at the problem of GRU's low accuracy in predicting rapidly changing sequences, steady-state sequences were used to train and predict GRUs; considering the advantages of SVR's better adaptability to non-linear sequences and low generalization errors, SVR was used to train and predict dynamic sequences. Finally, the results of steady-state components and dynamic components predictions were integrated as the final prediction result. The datasets of two different intersections in a certain city were used to carry out related experiments. The results show that the BF-SVR-GRU prediction method has better prediction accuracy, and can provide effective suggestions for intelligent transportation planning and management.
Key words:
intelligent transportation; Butterworth filtering; short-term traffic flow prediction; gated recurrent unit; support vector regression