劉 志,陳 洋,周涵林,卞紀新
(浙江工業(yè)大學 計算機科學與技術學院,浙江 杭州 310023)
隨著城市化進程的發(fā)展,城市交通的健康運行面臨著巨大挑戰(zhàn)[1]。準確的交通流預測不僅能幫助智能交通系統(tǒng)(ITS)更好運行,而且可以對交通擁堵和交通事故做出及時的響應,從而提高城市交通運行效率。交通流預測是一個典型的時空數(shù)據(jù)預測問題。交通流數(shù)據(jù)在時間上呈現(xiàn)趨勢性和周期性,上一個時間片的交通流會影響下個時間片的交通流狀態(tài),并且工作日的交通流基本呈現(xiàn)同一趨勢,這是由于人們工作上下班而導致的。交通流數(shù)據(jù)的空間性體現(xiàn)在一個道路內(nèi)的車輛會隨著路網(wǎng)流到相連的路網(wǎng),也稱為路網(wǎng)傳播性。此外交通流還存在動態(tài)相關性,交通流特征親和度高的道路通常會表現(xiàn)出相似的交通演變規(guī)律[2]。高速公路交通流數(shù)據(jù)在時間上和空間上都表現(xiàn)出強的相關性和動態(tài)性。準確的交通流量預測在緩解道路擁堵[3]、預警交通事故[2]和交通控制管理[4]等領域發(fā)揮著越來越重要的作用。交通數(shù)據(jù)的主要特征是復雜的空間和時間相關性,以往的交通流預測模型通常基于統(tǒng)計的方法建模時間關聯(lián),如歷史平均值、向量自回歸[5]和自回歸綜合移動平均[6]等方法,然而這類方法通常依賴專家知識,且由于模型限制無法建模時空關聯(lián)。因此,筆者回顧了交通流預測的相關工作。在交通流預測中,空間信息起著非常重要的作用,道路的拓撲結構以及車道間的聯(lián)系等都在一定程度上影響著交通流預測的準確性。傳統(tǒng)的交通流預測使用網(wǎng)格處理空間信息,即用數(shù)學方法把道路網(wǎng)劃分為大小相同的網(wǎng)格區(qū)域,再使用卷積神經(jīng)網(wǎng)絡(CNN)提取空間特征[7],然而基于CNN的方法難以處理交通中的非歐幾里得數(shù)據(jù),因此圖形神經(jīng)網(wǎng)絡(GNN)被提出來,GNN可以很好地處理關系依賴,隨著GCN的出現(xiàn),經(jīng)典的卷積隨之被推廣到了圖域,更多學者們把目光轉(zhuǎn)移到了GCN的研究上,GCN可以對不規(guī)則的道路拓撲結構建立其空間相關性[8-11],然而以往的研究側重于建模其路網(wǎng)相連的空間相關性,忽略了節(jié)點之間的動態(tài)空間相關性。
傳統(tǒng)的處理時間相關性的方法采用的是時間序列預測方法,如自回歸移動綜合平均和向量自回歸模型等,以捕捉多個時間序列中的線性相關性。然而他們難以捕捉交通流中的高度非線性。遞歸神經(jīng)網(wǎng)絡由于能夠捕獲時間相關性,被廣泛地用作交通預測模型中的一個組成部分[12]。李朝陽等[8]將交通流數(shù)據(jù)分解為具有不同空間相關性的穩(wěn)定分量和動態(tài)分量,通過雙流圖卷積提取穩(wěn)定和動態(tài)的空間相關性,并通過參數(shù)化跳過連接方法來融合時空相關性預測交通流數(shù)據(jù)。Bai等[13]提出用節(jié)點自適應參數(shù)學習和數(shù)據(jù)自適應圖生成模塊來增強傳統(tǒng)的圖卷積網(wǎng)絡,但是他們訓練的耗時較長,且難以處理長輸入序列。CNN訓練速度相對較快,結構更為簡單[11,14]。然而CNN不僅難以處理長時間序列,而且在模型中要堆疊很多層?;谧宰⒁饬C制的Transformer得益于具有全局并行的特點,在自然語言處理領域取得非常好的效果[15]。Zhang等[16]認為樣本卷積和交互網(wǎng)絡(SCINet),以多分辨率執(zhí)行樣本卷積和交互,實現(xiàn)良好的時間序列預測效果。以往建模時間相關性的方法,沒有考慮到交通中局部和全局的時間相關性。為應對上述挑戰(zhàn),筆者提出一種動態(tài)圖循環(huán)網(wǎng)絡(DRGCN),首先,在每個循環(huán)神經(jīng)網(wǎng)絡模塊中,使用親和度建模節(jié)點空間相似性;然后,結合預定義鄰接矩陣,有效地建模路網(wǎng)中的時空動態(tài)性;最后,在此基礎上對樣本卷積交互網(wǎng)絡進行一次全局時間依賴建模,有效地捕獲交通中的時間相關性,提升模型效果。通過在真實數(shù)據(jù)集下的實驗結果證明,筆者模型在短期交流預測上的效果優(yōu)于其他基線模型。
筆者提出的動態(tài)圖循環(huán)網(wǎng)絡如圖1所示??蚣苁褂脮r空交通數(shù)據(jù)去生成未來的交通流。該模型分為兩個模塊,基于RNN結構的動態(tài)時空圖卷積模塊建模局部時空依賴和基于樣本卷積交互網(wǎng)絡模塊建模全局時間依賴。前者通過生態(tài)動態(tài)鄰接矩陣結合預定義的鄰接矩陣實現(xiàn)動態(tài)交通特征提取;后者輸入提取后的交通特征建模全局的時間依賴。
圖1 基于動態(tài)圖神經(jīng)網(wǎng)絡的交通流預測流程框架
將傳感器視為圖上的節(jié)點,傳感器所在道路的連接視為圖上節(jié)點對之間的邊權重。根據(jù)傳感器之間的道路網(wǎng)絡聚集進行鄰接矩陣構建[17],預定義鄰接矩陣權重的計算式為
(1)
式中:A(i,j)為鄰接矩陣中節(jié)點i和節(jié)點j連接的權重;d(i,j)為節(jié)點i和節(jié)點j之間的距離,指路網(wǎng)拓撲連接的距離;δ為距離的標準差;k為控制矩陣的稀疏度閾值。
從Caltrans performance measurement system(PeMS)收集了歷史的交通數(shù)據(jù)。正如Chen等[18]的研究,PeMS是加利福尼亞州實時交通數(shù)據(jù)集中存儲數(shù)據(jù)庫,通過布置傳感器,每30 s收集一次交通數(shù)據(jù),每5 min聚合一次,得到完整周期的交通數(shù)據(jù)集。交通態(tài)勢體現(xiàn)當前道路運行情況,可以用于指導交通信號控制[19]。因此,引入擁堵系數(shù)CI來表示當前路網(wǎng)的擁堵情況,CI表達式為
(2)
式中:當前區(qū)域的限速統(tǒng)一使用70 km/h;當前速度為當前道路的平均速度。當CI系數(shù)小于0時,即存在超速現(xiàn)象,這里將CI置為0,否則為公式計算值。高峰期是交通周期性的重要體現(xiàn),將高峰期定義為
(3)
式中:P為早晚高峰期,將08:00—09:00和17:00—19:00作為高峰期。在每個時間片進行輸入到樣本卷積交互網(wǎng)絡建模全局時間依賴前,將這兩個指標結合天氣作為輔助因素輸入到模型中。
為了建模交通中動態(tài)的時空依賴,受Li等[12]啟發(fā),提出一個基于RNN結構的動態(tài)圖卷積結構去處理圖序列信息,具體情況如圖2(a)所示。
圖2 子模塊結構圖
(4)
(5)
(6)
通過上面的公式,將當前的交通數(shù)據(jù),隱藏狀態(tài)和輔助交通信息進行聚合,目的是通過節(jié)點特征相似性構建出當前的鄰接矩陣。具體來講,對于每個節(jié)點vi,通過圖神經(jīng)網(wǎng)絡得到節(jié)點的隱藏變量ai,進而將道路中的節(jié)點對親和度關系建模為
(7)
(8)
基于預定義的圖鄰接矩陣進行聚合無法捕獲的動態(tài)的交通變化,然而僅基于動態(tài)圖鄰接矩陣的進行聚合會丟失一些交通路網(wǎng)的信息。結合預定義鄰接矩陣和動態(tài)鄰接矩陣進行聚合,如圖2(b)所示。具體而言,在每一個圖卷積層,將兩種圖卷積的結果進行權重求和。第l層圖卷積表示為
(9)
H(0)=Hin
(10)
式中:α,β均為超參數(shù),定義兩個圖卷積神經(jīng)網(wǎng)絡權重;σ(·)為ReLU激活函數(shù);度矩陣D=∑jAij為對角矩陣;W為可學習參數(shù)。第t時刻的隱藏狀態(tài)表示為
Ht=σ(X×W(1)×W(2)+b)
(11)
式中:σ(·)為softmax激活函數(shù);W(1),W(2)均為可學習參數(shù);b為偏置項。
循環(huán)神經(jīng)網(wǎng)絡、自注意力機制和傳統(tǒng)的時域卷積網(wǎng)絡忽略了時間序列預測的一些特性,尤其是趨勢、季節(jié)性和不確定性。樣本交互卷積模塊如圖2(c)所示,首先通過將輸入的數(shù)據(jù)或特征下采樣成兩個子序列;然后用一組不同的卷積濾波器從每個序列中提供同質(zhì)和異構的信息,并引入交互學習來補償采樣過程中的信息損失;最后將所有低分辨率向量連接成一個新的向量,并添加到原始序列中進行預測。
(12)
(13)
多個樣本卷積交互模塊以樹形排列組成樣本卷積交互網(wǎng)絡。第l層有2l個模塊組成(l=1,2,…,L)。輸入的時間序列數(shù)據(jù)通過樣本卷積交互模塊逐步下采樣成不同的粒度進行處理,在經(jīng)過l層的處理后,通過逆轉(zhuǎn)奇偶分裂操作,重新排列子特征中的元素,將它們重新連接成一個新的序列,并通過殘差連接添加到原始序列中進行預測。
通過多層前饋神經(jīng)網(wǎng)絡得到最終預測結果。定義為
(14)
(15)
在真實數(shù)據(jù)集上進行實驗。交通數(shù)據(jù)集包括:1)MERT-LA指的是洛杉磯高速公路環(huán)路檢測器收集的公共交通速度數(shù)據(jù)集,包括207個道路上的傳感器收集的2012年3月1日至2012年6月30日的數(shù)據(jù);2)PEMS-BAY包含加州交通局收集的2017年1月1日至2017年5月31日灣區(qū)公共交通速度,共有325個傳感器。為了避免缺失數(shù)據(jù)對實驗結果造成影響,受周曉等[21]的啟發(fā),對時間序列進行簡單修復。
2.2.1 實驗細節(jié)
首先,將數(shù)據(jù)集按照60%,20%,20%的比例進行切分,分別代表訓練集、驗證集和測試集;然后,將模型通過反向傳播進行優(yōu)化,對于框架中的所有模型,將學習率設置為0.01并應用Adam優(yōu)化器進行優(yōu)化;最后,將預定義圖鄰接矩陣的閾值k設置為0.1,對于圖生成器,將其中的圖卷積模塊設置為3層,動態(tài)圖卷積隱藏狀態(tài)輸出維度為64,輔助信息為4維,設置輸入時間片長度T為12,預測時間片長度P為1,6,12,樣本卷積交互網(wǎng)絡l為2,并使用MAE作為訓練的損失函數(shù)。
2.2.2 評估指標
為了對比不同模型的實驗效果,采用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對誤差百分比(MAPE)作為評價指標。
2.2.3 基線模型
將DRGCN與傳統(tǒng)的基于統(tǒng)計的方法(HA,VAR[5],ARIMA[6])和最新提出的圖神經(jīng)網(wǎng)絡的方法(FNN,STGCN[9],Graph WaveNet[14],DGCRN[12],AGCRN[13],GMAN[10],MTGNN34])進行比較。傳統(tǒng)的方法和一些神經(jīng)網(wǎng)絡方法(HA,VAR,ARIMA等)無法處理圖的數(shù)據(jù),因此不保留圖拓撲結構,將圖轉(zhuǎn)變?yōu)樾蛄凶鳛槟P偷妮斎搿?/p>
為了取得最好的實驗效果,對動態(tài)時空卷積網(wǎng)絡的輸入層長度進行了對比實驗,隱藏層長度對比情況如圖3所示。由圖3可知:在預測15,30,60 min的時間片長度上,隱藏層越長,模型取得的效果越好,這是因為隱藏層越長,保存的交通特征信息越多。但一味地增加隱藏層長度會導致模型效率下降,考慮到模型效果和模型效率,選擇64作為隱藏層長度輸入到全局信息建模中進行實驗。
圖3 隱藏層長度對比
筆者模型和基線模型在兩個數(shù)據(jù)集上的實驗效果分別如表1,2所示。由表1,2可知:1)深度學習模型的效果普遍好于機器學習的方法,這是因為機器學習的方法往往依賴于先驗知識并且難以建模交通中復雜的時空關系;2)基線模型中,GMAN由于采用了相對簡單的時空自注意力機制建模時空相關性,導致模型在短期預測效果變差,Graph WaveNet,MTGNN使用的自適應的鄰接矩陣無法在每個時間片上建模動態(tài)的時空依賴,因此模型效果不如使用RNN生成動態(tài)鄰接矩陣的DGCRN,而DGCRN使用RNN單元建模時空關系,會損失一些全局時間信息,降低了短期預測的性能;3)可以看到PEMS-BAY的模型效果均好于MERT-LA,這是因為PEMS-BAY的數(shù)據(jù)集相對簡單,這也說明了不同的數(shù)據(jù)集對交通流預測的效果會造成比較大的影響,越復雜的數(shù)據(jù)集,模型效果越差;4)筆者模型雖然在預測15 min的評價指標均優(yōu)于其他方法,但在其他時間片長度上模型效果差于一些基線模型,主要原因有兩個:第一,設計的DRGCN通過動態(tài)圖卷積網(wǎng)絡進行時空特征建模,這使得短期的交通流預測有更好的性能,但隨著時間片變長,交通的不確定性增加,導致模型效果變差;第二,通過樣本交互卷積網(wǎng)絡進行全局時間依賴建模,彌補了RNN結構的缺陷,因此在短期預測時取得更好的效果。
表1 MERT-LA實驗結果對比
表2 PEMS-BAY實驗結果對比
為了比較模型中各個組件的作用,進行了消融實驗:1)w/o pre-define DRGCN去掉預定義的圖鄰接矩陣,僅用動態(tài)鄰接矩陣;2)w/o dynamic DRGCN去掉動態(tài)鄰接矩陣,僅用預定義圖鄰接矩陣;3)w/o SCINetDRGCN去掉樣本卷積交互網(wǎng)絡。
實驗結果如圖4所示。由圖4可知:每個模塊的減少都會導致模型效果下降。動態(tài)圖鄰接矩陣和預定義鄰接矩陣對模型的造成影響接近,這說明兩個鄰接矩陣都能建模交通中的信息。樣本卷積交互網(wǎng)絡對模型性能的影響最大,因為RNN結構往往會丟失一些全局的信息,所以導致模型效果下降。
圖4 消融試驗對比
近年來,城市汽車保有量不斷提高,給城市道路交通的健康運行帶來嚴峻的挑戰(zhàn)。作為智能交通系統(tǒng)的關鍵部分之一,準確的交通流預測能幫助城市管理者制定科學有效的交通控制方案。除了時間相關性和空間相關性,交通數(shù)據(jù)還具有明顯的動態(tài)時空相關性,建模交通數(shù)據(jù)的動態(tài)時空相關性可以有效地提高交通流預測的精度。筆者提出一個新的基于RNN和圖神經(jīng)網(wǎng)絡的框架(DRGCN)。首先在每個RNN模塊通過圖生成器建模交通中的動態(tài)空間關聯(lián);然后結合預定義的鄰接矩陣建模交通中動態(tài)時空關聯(lián);最后通過樣本卷積交互網(wǎng)絡層進行全局時間依賴建模以增加時間序列學習能力。實驗結果表明所提出的DRGCN模型在真實數(shù)據(jù)集上結果優(yōu)于基線模型。