阮鴻柱 王金寶 杜夢輝
關(guān)鍵詞:智能交通;流量預測;自適應圖卷積網(wǎng)絡;時空相關(guān)性
中圖分類號:TP391.4 文獻標志碼:A
0 引言(Introduction)
準確的高速公路流量預測對提升智能交通系統(tǒng)的安全性、穩(wěn)定性和效率至關(guān)重要。受多種復雜因素的影響,例如道路拓撲結(jié)構(gòu)、可見度、降水量等,交通數(shù)據(jù)中存在復雜的時空相關(guān)性[1-3]。基于圖卷積神經(jīng)網(wǎng)絡的深度學習方法可以建模交通數(shù)據(jù)中的動態(tài)時空相關(guān)性,但是這些方法需要根據(jù)距離等特征預先定義鄰接關(guān)系圖建??臻g相關(guān)性[4-8]。本文通過對桂林市路網(wǎng)數(shù)據(jù)集中的流量數(shù)據(jù)進行分析發(fā)現(xiàn),根據(jù)有限先驗知識構(gòu)建的鄰接關(guān)系圖難以反映完整的空間相關(guān)性[9-10]?;诖耍疚幕跀?shù)據(jù)驅(qū)動的方式生成自適應鄰接矩陣,在此基礎上設計了一個自適應圖卷積網(wǎng)絡,以便更全面地捕獲交通數(shù)據(jù)中的空間相關(guān)性。
為更好地捕獲具有較大時間跨度的交通數(shù)據(jù)間的依賴性,采用門控循環(huán)單元建模時間相關(guān)性,將其與自適應圖卷積網(wǎng)絡整合成具有編碼器-解碼器結(jié)構(gòu)的自適應時空圖卷積循環(huán)神經(jīng)網(wǎng)絡(ASTGCRN)實現(xiàn)準確地預測多時間步流量。
1 流量數(shù)據(jù)特性分析(Analysis of flow datafeatures)
高速公路網(wǎng)承載各種交通工具的運行,其流量的變化與人們的生活出行緊密相關(guān),表現(xiàn)出一定的時空分布規(guī)律,分析這種規(guī)律是對交通流量進行有效預測的前提與基礎。本文對桂林高速公路網(wǎng)的流量變化做以下分析:(1)相鄰節(jié)點流量變化趨勢相近,但數(shù)據(jù)尺度可能會有差異。如圖1所示,“粟家6-靈川西3”和“馬面立交2-桂林南3”斷面在鄰接圖中具有鄰接關(guān)系,它們的斷面流量分布的整體趨勢相近,但平均值與峰值水平相差較大。在很多工作中,研究對象選取的是普通的城區(qū)道路,采樣點的密度很大,并且采樣點之間的距離很短,所以相鄰的節(jié)點流量數(shù)值相近、變化更平緩;但是,本文選取的高速公路的斷面總是伴隨互通與收費站出現(xiàn),采樣點之間的距離相隔較遠且稀疏,流量變化與節(jié)點所處地段密切相關(guān),所以流量變化會隨著總車流量的整體變化而表現(xiàn)出趨勢上的相似性,但也會因進出高速車流量的不同,導致不同采樣點在數(shù)據(jù)尺度上存在差異性。(2)路網(wǎng)中距離相隔較遠的兩個節(jié)點也可能表現(xiàn)出較強的相關(guān)性。如圖1中“粟家6-靈川西3”與“興桂路起點1-興安城南5”斷面雖然沒有鄰接關(guān)系,但是都處于同一方向的高速路線上,其流量變化也表現(xiàn)出相似的趨勢。由于先驗知識有限,因此根據(jù)距離等特征預先定義鄰接關(guān)系圖難以捕獲交通數(shù)據(jù)中完整的空間相關(guān)性。
為解決以上問題,本文使用自適應圖卷積網(wǎng)絡學習路網(wǎng)交通數(shù)據(jù)中的空間相關(guān)性,將其與門控循環(huán)單元整合,用于學習交通數(shù)據(jù)中復雜的時空相關(guān)性,進而實現(xiàn)準確的流量預測。
2 自適應時空圖卷積循環(huán)神經(jīng)網(wǎng)絡(Adaptivespatio-temporal graph convolutional recurrentneural network)
本文提出面向高速公路流量預測的自適應時空圖卷積循環(huán)神經(jīng)網(wǎng)絡,如圖2所示。以多個時間步的圖信號矩陣為輸入,利用自適應圖卷積捕獲路網(wǎng)交通數(shù)據(jù)中的空間相關(guān)性,利用門控循環(huán)單元捕獲數(shù)據(jù)中的時間相關(guān)性,將編碼后的節(jié)點嵌入表示輸入門控循環(huán)單元構(gòu)成的解碼器,預測多個時間步的交通流量。
2.2 自適應圖卷積網(wǎng)絡
圖卷積網(wǎng)絡(Graph Convolutional Network, GCN)是一種用于處理非歐式結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡?,F(xiàn)實中的高速公路路網(wǎng)是不規(guī)則的,可以視作非歐式結(jié)構(gòu),并且可以使用圖卷積網(wǎng)絡處理高速公路路網(wǎng)數(shù)據(jù),捕獲不同檢測點交通數(shù)據(jù)的空間相關(guān)性,提升交通數(shù)據(jù)預測的精度。圖卷積運算可以用一階切比雪夫多項式展開實現(xiàn)很好的逼近,并且可以推廣到高維圖卷積:
2.4 模型訓練
模型訓練的損失函數(shù)使用均方誤差函數(shù),優(yōu)化算法選用Adam算法,Adam算法是一種基于動量思想的自適應隨機梯度下降算法,在迭代前計算梯度的兩階動量并計算滑動平均值,并用于更新參數(shù)。
3 實驗與結(jié)果(Experiments and results)
實驗使用桂林市路網(wǎng)區(qū)域的交通數(shù)據(jù),共有36個節(jié)點,從2022年1月1日到2月28日共59天,以1 h為單位聚合每個節(jié)點的流量。按6∶2∶2的比例劃分訓練集、驗證集和測試集,使用訓練集的均值和標準差對所有數(shù)據(jù)進行歸一化,輸入時間步Th 設置為8,預測時間步Tp 設置為8。
3.1 評價指標
為驗證本文提出模型的預測性能,研究人員選取了回歸任務常使用的平均絕對誤差(Mean Absolute Error, MAE)、均方根誤差(Root Mean Squared Error, RMSE)和平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)。
3.2 基準線模型
選取以下基準線模型與本文提出的模型進行對比:(1)HA:歷史平均模型,即對每一個節(jié)點都以前Th 個時間步流量的平均值作為下一時間步的預測值;(2)GCN[11]:標準圖卷積神經(jīng)網(wǎng)絡,使用譜域中對角化的線性算子替代經(jīng)典卷積算子實現(xiàn)卷積操作;(3)RNN[12]:循環(huán)神經(jīng)網(wǎng)絡,能很好地挖掘數(shù)據(jù)中的時序信息與語義信息,這里使用門控循環(huán)單元(GRU)作為編碼器和解碼器;(4)GMAN[4]:圖多注意網(wǎng)絡,借助自注意力機制實現(xiàn)了空間與時間維度的注意力模塊,多個時空注意力模塊堆疊組成編碼器與解碼器;(5)AGCRN[10]:自適應圖卷積循環(huán)神經(jīng)網(wǎng)絡,使用數(shù)據(jù)自適應圖和自適應圖卷積循環(huán)神經(jīng)網(wǎng)絡模塊,為每個節(jié)點都學習了一個特定的參數(shù)空間,挖掘流量序列中不同的模式。
3.3 參數(shù)設置
模型擴散圖卷積的擴散維度設置為2,自適應圖卷積模塊的嵌入維度設置為10,堆疊的圖卷積模塊數(shù)設置為2,圖卷積隱藏維度設置為64,門控循環(huán)神經(jīng)網(wǎng)絡層數(shù)設置為2,循環(huán)單元隱藏狀態(tài)的維度設置為64,解碼器中的全連接層數(shù)設置為1,訓練時,小批量大小設置為8,初始學習率設置為0.001,早停步數(shù)設置為10。
3.4 實驗結(jié)果分析
按上述使用不同的方法在相同場景下進行預測,結(jié)果如表1所示。
從表1中看出,效果最差的是歷史平均模型(HA),其次是僅使用了圖鄰接關(guān)系的GCN,擅長捕獲節(jié)點間特征相關(guān)性的GMAN在訓練過程中產(chǎn)生了過擬合,最終結(jié)果也只是稍好于GCN,原因是節(jié)點間數(shù)據(jù)尺度的差異導致了過擬合。RNN僅關(guān)注數(shù)據(jù)中的時序信息,卻在本任務中表現(xiàn)出色,說明高速公路數(shù)據(jù)具有較強的周期性,在門控神經(jīng)循環(huán)網(wǎng)絡中嵌入了自適應圖卷積的AGCRN表現(xiàn)則好于RNN,這也證明節(jié)點間存在空間相關(guān)性,并且自適應圖卷積能在一定程度上解決不同位置流量數(shù)據(jù)尺度不同的問題,而ASTGCRN一方面通過擴散卷積學習節(jié)點與更高階鄰接節(jié)點間的相關(guān)性,通過自適應圖卷積學習不同尺度數(shù)據(jù)間的相關(guān)性,很好地捕捉到了空間相關(guān)性,另一方面使用基于門控循環(huán)神經(jīng)網(wǎng)絡的編碼器和解碼器捕獲數(shù)據(jù)中的時間相關(guān)性,效果優(yōu)于其他最優(yōu)基準線模型,平均絕對誤差、均方根誤差、平均絕對百分比誤差分別降低了約17.6%、18.6%和10.8%。
為了更全面地分析本文提出方法(ASTGCRN)的優(yōu)勢,對各模型在“蒙村互通3-陽朔高田5”斷面從某年2月24日23時到2月25日23時時間區(qū)段的交通流量預測值和真實值(truth)進行可視化(如圖3所示)。從圖3中可以看出,各個基準線模型基本保持了與真實值相似的變化趨勢,但在數(shù)值水平上相差較大。從中也能直觀地看到RNN、AGCRN和ASTGCRN要優(yōu)于其他三個模型,而在車流量整體水平的預測上ASTGCRN優(yōu)于RNN。當車流量值在短時間內(nèi)發(fā)生較大波動時,如2月25日15時到2月25日17時時間區(qū)段,ASTGCRN的預測效果優(yōu)于AGCRN。
3.5 消融實驗分析
為進一步分析模型中各個組件的作用,設計了原模型ASTGCRN 的三個變體進行消融實驗,將這三個變體與ASTGCRN進行比較,變體的描述如下。
ASTGCRN_wo_diff:在ASTGCRN的基礎上,去掉擴散圖卷積模塊,考查模型是否學習到了高階鄰接信息。
ASTGCRN_wo_adap:在ASTGCRN的基礎上,去掉自適應圖卷積模塊,考查模型是否克服了不同節(jié)點交通數(shù)據(jù)的尺度差異性,并學習到了更全面的空間相關(guān)性。
ASTGCRN_wo_GRU:在ASTGCRN的基礎上,使用全連接層替代以門控循環(huán)單元為基礎的編解碼器。
消融實驗的結(jié)果如表2所示,在去掉擴散圖卷積模塊(ASTGCRN_wo_diff)后,模型的預測準確性要稍好于去掉之前,而去掉自適應圖卷積模塊(ASTGCRN_wo_adap)后模型預測準確性顯著降低,證明自適應圖卷積很好地捕獲到了交通數(shù)據(jù)中的空間相關(guān)性,而擴散圖卷積在本實驗中的作用并不大,在高階鄰居節(jié)點的信息得到融合的情況下,預定義圖結(jié)構(gòu)的信息可能對空間相關(guān)性的學習產(chǎn)生了干擾,使得擴散圖卷積沒能充分發(fā)揮作用。在去掉以門控循環(huán)單元為基礎的編解碼器(ASTGCRN_wo_GRU)后,模型預測準確性大幅下降,這證明門控循環(huán)單元對于學習數(shù)據(jù)在時間維度的變化規(guī)律是非常重要的。
4 結(jié)論(Conclusion)
本文通過分析桂林路網(wǎng)中高速公路流量的時空分布,針對其分布特性提出了一種自適應時空圖卷積循環(huán)神經(jīng)網(wǎng)絡模型,該模型基于自適應圖卷積網(wǎng)絡解決了根據(jù)有限先驗知識構(gòu)建的鄰接關(guān)系圖難以反映交通數(shù)據(jù)中完整空間相關(guān)性的問題,并結(jié)合門控循環(huán)單元捕獲了交通數(shù)據(jù)中復雜的時空相關(guān)性。將本文所提模型同其他常用的預測方法在桂林市高速公路網(wǎng)真實的交通數(shù)據(jù)集上進行了實驗,實驗結(jié)果表明本文所提模型的預測效果最優(yōu),并通過消融實驗說明了提出方法的有效性。但是,該方法依然存在一些優(yōu)化空間,例如可以考慮其他因素,如節(jié)假日、交通事故對車流量的影響,合理地量化這些因素可以作為優(yōu)化模型的方向。
作者簡介:
阮鴻柱(1993-),男,碩士,高級工程師。研究領域:智慧高速,交通信息工程。
王金寶(1973-),男,本科,正高級工程師。研究領域:智慧交通。
杜夢輝(1999-),男,碩士生。研究領域:智慧交通。