李朝陽,李 琳+,陶曉輝
1.武漢理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,武漢430070
2.南昆士蘭大學(xué) 理學(xué)院,澳大利亞 圖文巴4350
交通預(yù)測為智能交通系統(tǒng)(intelligent transportation system,ITS)的決策提供了有力的依據(jù),有助于緩解城市中的交通擁堵問題。近年來隨著交通行業(yè)的發(fā)展,許多信息收集設(shè)備,如電磁線圈等,已經(jīng)廣泛部署在道路上。這些檢測設(shè)備產(chǎn)生了多種形式的海量交通數(shù)據(jù),包括交通流數(shù)據(jù)、浮動車數(shù)據(jù)、自行車數(shù)等。其中,交通流數(shù)據(jù)所包含的速度、交通量等參數(shù)通常被選作反映交通狀況的基本測量指標(biāo),而交通流預(yù)測是交通管理部門進(jìn)行交通管制的重要前提。
作為智能交通系統(tǒng)不可缺少的一部分,交通流預(yù)測一直是國內(nèi)外研究重點(diǎn)。一般來說,交通流預(yù)測根據(jù)預(yù)測時(shí)長分為短期預(yù)測(≤30 min)和中長期預(yù)測(≥30 min)。相關(guān)研究中,早期大多采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法,如回歸滑動平均模型(auto-regressive moving average model,ARIMA)及其他技術(shù)。這些方法將交通流看作一個(gè)簡單的時(shí)間序列,因此對長期交通流的處理能力不足。近年來,隨著深度學(xué)習(xí)技術(shù)在文本處理、語音識別等領(lǐng)域的發(fā)展,越來越多的研究也將深度學(xué)習(xí)應(yīng)用于交通流預(yù)測領(lǐng)域。由于交通流數(shù)據(jù)是典型的時(shí)空數(shù)據(jù),同時(shí)分析交通流的時(shí)間相關(guān)性和空間相關(guān)性是一個(gè)巨大的挑戰(zhàn)。在分析時(shí)間相關(guān)性時(shí),基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的方法能充分捕捉當(dāng)前時(shí)刻及歷史時(shí)刻的時(shí)間信息。作為交通流預(yù)測的另一項(xiàng)重要工作,如何從已知的交通路網(wǎng)和交通流數(shù)據(jù)中充分挖掘空間相關(guān)性也受到了廣泛關(guān)注。一些交通流預(yù)測模型將交通流數(shù)據(jù)視為圖像和網(wǎng)格,然后應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)提取這些網(wǎng)格或圖像內(nèi)的空間特征。然而,基于卷積神經(jīng)網(wǎng)絡(luò)對屬于圖結(jié)構(gòu)數(shù)據(jù)的交通流的空間相關(guān)性分析,仍然還在探索當(dāng)中。
在交通流預(yù)測問題中,基于圖卷積的方法可以直接在圖結(jié)構(gòu)數(shù)據(jù)上進(jìn)行相關(guān)卷積操作。目前,基于GCN 的方法可以分為基于譜域的方法和基于空域的方法這兩個(gè)主流方法。從基于譜域的角度來看,該方法通過對稱的拉普拉斯矩陣來研究圖的特性。因此,在處理有向圖時(shí),基于譜域的方法通常將有向圖簡化為無向圖。而在現(xiàn)實(shí)世界中,交通流受下游交通流和上游交通流的影響不同,因此交通網(wǎng)絡(luò)中檢測節(jié)點(diǎn)之間的空間相關(guān)性表示為一組不對稱的空間影響關(guān)系。如圖1(3)所示,在時(shí)刻,節(jié)點(diǎn)v對節(jié)點(diǎn)v的影響強(qiáng)于v對v的影響。這說明空間相關(guān)性是有向的,且對其進(jìn)行有效的分析和建模在交通流預(yù)測問題中至關(guān)重要。然而,基于譜域的GCN方法未充分考慮交通流數(shù)據(jù)有向的空間相關(guān)性。同樣,一些基于空間的方法也未在交通流預(yù)測問題中充分考慮空間相關(guān)性的有向性。
此外,惡劣天氣、交通事故等特殊的事件會影響駕駛者的交通行為,最終導(dǎo)致檢測節(jié)點(diǎn)間的空間相關(guān)性發(fā)生改變。如圖1 所示,時(shí)刻-1 到時(shí)刻,節(jié)點(diǎn)v對節(jié)點(diǎn)v在空間上的影響逐漸加強(qiáng),同時(shí)其他節(jié)點(diǎn)之間的空間相關(guān)性也在不斷變化??紤]到交通事故和惡劣天氣可能會經(jīng)常發(fā)生,動態(tài)空間相關(guān)性的有效建模對交通流預(yù)測的準(zhǔn)確性至關(guān)重要。由于現(xiàn)實(shí)路網(wǎng)和駕駛者交通習(xí)慣的約束,從整體上看,交通流相關(guān)性也是穩(wěn)定的。綜上,本文認(rèn)為交通流數(shù)據(jù)包括穩(wěn)定分量和動態(tài)分量,且這兩個(gè)部分的空間相關(guān)性具有不同的特性。然而,目前基于譜域圖卷積的交通流預(yù)測研究通常認(rèn)為節(jié)點(diǎn)間空間相關(guān)性僅基于其在現(xiàn)實(shí)路網(wǎng)中的連通關(guān)系,而且忽略了空間相關(guān)性的動態(tài)變化。
圖1 交通流數(shù)據(jù)的時(shí)空相關(guān)性建模Fig.1 Spatial-temporal correlation modeling of traffic flow data
雖然有大量的交通流預(yù)測方法被提出,但如何同時(shí)考慮交通流數(shù)據(jù)空間相關(guān)性的動態(tài)性和有向性仍然是一個(gè)挑戰(zhàn)。為了分析交通流數(shù)據(jù)復(fù)雜的動態(tài)時(shí)空相關(guān)性,本文提出了一種端到端的用于動態(tài)交通流預(yù)測的雙流圖卷積網(wǎng)絡(luò)模型,設(shè)計(jì)了一組穩(wěn)定和動態(tài)圖卷積網(wǎng)絡(luò),因此本模型稱為雙流圖卷積網(wǎng)絡(luò)(two-stream graph convolution network,TSG-CN)。本文工作的主要貢獻(xiàn)概括如下:
(1)構(gòu)建雙流圖卷積層分別提取穩(wěn)定空間相關(guān)性和動態(tài)空間相關(guān)性。首先,采用近似Tucker 分解的分解層將交通流數(shù)據(jù)劃分為包含不同的空間相關(guān)性的穩(wěn)定分量和動態(tài)分量。然后利用兩個(gè)并行的基于空域的圖卷積分別從穩(wěn)定分量和動態(tài)分量中提取空間相關(guān)性,以提高動態(tài)交通流的預(yù)測能力。其中,采用基于空域的圖卷積旨在捕捉非歐式空間數(shù)據(jù)的復(fù)雜拓?fù)浣Y(jié)構(gòu)。
(2)在兩個(gè)真實(shí)的高速公路交通流數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。結(jié)果證明,本文提出的TSGCN 模型的中長期和短期預(yù)測效果均優(yōu)于其他幾個(gè)現(xiàn)有的交通流預(yù)測方法。
自20 世紀(jì)80 年代以來,交通預(yù)測問題經(jīng)過不斷研究和實(shí)踐,取得了大量成果。交通預(yù)測問題包括預(yù)測所有交通相關(guān)的數(shù)據(jù),如出租車需求和交通流(本文研究的問題)等。面向不同類型的交通數(shù)據(jù)的研究過程并不完全一致,因此本文只討論交通流預(yù)測的問題。
已有很多學(xué)者在交通流預(yù)測問題上進(jìn)行了大量嘗試。早期的工作大都應(yīng)用傳統(tǒng)的機(jī)器學(xué)習(xí)方法來處理交通流數(shù)據(jù),如ARIMA 等。然而,這類方法基于一些前提假設(shè),因此對復(fù)雜非線性的交通流數(shù)據(jù)處理能力不足。隨后發(fā)展起來的深度學(xué)習(xí)技術(shù)則能夠?qū)Ω鼜?fù)雜的數(shù)據(jù)進(jìn)行建模。Sutskever 等人提出了一種通用的端到端序列學(xué)習(xí)方法,采用多層長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)提取復(fù)雜的時(shí)間相關(guān)性。Wu 等人采用基于卷積神經(jīng)網(wǎng)絡(luò)的空洞因果卷積,以更少的層數(shù)捕獲較長的時(shí)間序列,因此可以更有效地學(xué)習(xí)時(shí)間相關(guān)性進(jìn)行長期預(yù)測。此外,考慮到交通流數(shù)據(jù)本質(zhì)上是時(shí)空數(shù)據(jù),因此在空間維度上挖掘交通流數(shù)據(jù)的空間模式也是需要研究的重要問題。其中,基于卷積神經(jīng)網(wǎng)絡(luò)的方法大多通過將非歐式空間的交通流數(shù)據(jù)映射到歐式空間,如圖像和網(wǎng)格,來提取空間相關(guān)性。由于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的平移不變性,只能處理標(biāo)準(zhǔn)的網(wǎng)格數(shù)據(jù),該類方法并不適合應(yīng)用于具有不同數(shù)量鄰居的圖結(jié)構(gòu)數(shù)據(jù)。與之相比,圖卷積可以直接在圖結(jié)構(gòu)數(shù)據(jù)上實(shí)現(xiàn)卷積操作,因此在處理交通流數(shù)據(jù)時(shí)具有優(yōu)勢。
圖卷積最早由Bruna 等人基于圖譜的方法,采用將拉普拉斯矩陣的特征向量變換到譜域進(jìn)行近似求解的方法提出,隨后由Defferrard 等人利用傅里葉變換進(jìn)行擴(kuò)展優(yōu)化。圖卷積用于圖結(jié)構(gòu)數(shù)據(jù)的分析,如社交網(wǎng)絡(luò)和文本分類。主流的圖卷積方法包括基于譜域的方法和基于空域的方法。具體來說,基于譜域的方法借助圖的拉普拉斯矩陣的特征值和特征向量來研究圖的性質(zhì)。Diao 等人提出了一種基于譜域的交通流預(yù)測方法,該方法基于圖譜理論計(jì)算動態(tài)拉普拉斯矩陣。然而,由于基于譜域的方法在交通流預(yù)測問題中未充分考慮空間相關(guān)性的有向性,本文更傾向于使用基于空域的圖卷積。
基于空域的方法對節(jié)點(diǎn)及其鄰居進(jìn)行卷積,其核心是選擇合適的鄰居。早期基于空間的方法未充分考慮交通流數(shù)據(jù)中的空間相關(guān)性的有向性。近期的方法卻考慮到了這一點(diǎn),使用雙向隨機(jī)游走來捕捉有向空間依賴性。Wu 等人進(jìn)一步提出了從整個(gè)交通流數(shù)據(jù)中提取自適應(yīng)鄰接矩陣來表示隱含的有向空間相關(guān)性。然而,這些方法沒有充分考慮檢測節(jié)點(diǎn)間的空間相關(guān)性的動態(tài)變化。同時(shí)考慮到交通流預(yù)測問題中空間相關(guān)性的有向性和動態(tài)變化,本文提出了TSGCN 模型,將空間相關(guān)性細(xì)化為穩(wěn)定空間相關(guān)性和動態(tài)空間相關(guān)性并分別考慮。
如圖1 所示,將空間路網(wǎng)定義有向圖=(,,),其中是節(jié)點(diǎn)集;為邊集,表示節(jié)點(diǎn)間的連通性;∈R為中個(gè)節(jié)點(diǎn)的鄰接矩陣,中非零元素代表兩個(gè)連通節(jié)點(diǎn)的連接關(guān)系,如距離等。在時(shí)刻,表示為檢測得到的交通流信號矩陣X∈R,其中是每個(gè)監(jiān)測點(diǎn)檢測的信號值(例如平均速度等),給定時(shí)段內(nèi)歷史數(shù)據(jù)X,X,…,X,本文研究的交通流預(yù)測問題是學(xué)習(xí)一個(gè)能夠預(yù)測未來時(shí)段內(nèi)交通流數(shù)據(jù)X, X,…,X的函數(shù)(·),其映射關(guān)系表示為式(1)。
基于上述定義,需要同時(shí)對歷史交通流數(shù)據(jù)的空間和時(shí)間相關(guān)性進(jìn)行建模。圖卷積可以從交通流數(shù)據(jù)中提取空間相關(guān)性,而擴(kuò)散卷積則在圖卷積的基礎(chǔ)上進(jìn)一步考慮交通流的有向性。
圖卷積分為基于譜域的圖卷積和基于空域的圖卷積兩種方法?;谧V域的圖卷積為了分析圖的拓?fù)鋵傩?,將圖用其對應(yīng)的拉普拉斯矩陣表示為代數(shù)形式。因此在處理圖結(jié)構(gòu)時(shí),首先需要用到拉普拉斯矩陣,一般定義為如式(2)所示。
其中,*為圖卷積操作;g為自學(xué)習(xí)運(yùn)算符;∈R為輸入數(shù)據(jù)。從基于譜域的角度看,有向圖被簡化為無向圖并由其對應(yīng)的拉普拉斯矩陣表示??紤]到交通圖信號由交通網(wǎng)絡(luò)中節(jié)點(diǎn)上交通流量的特征屬性組成,其本質(zhì)上是有向圖結(jié)構(gòu)。
基于空域的圖卷積通過聚合和轉(zhuǎn)換其鄰居節(jié)點(diǎn)的信息來實(shí)現(xiàn)圖結(jié)構(gòu)數(shù)據(jù)上的卷積操作。為了捕獲交通流數(shù)據(jù)受上游和下游的不同影響,擴(kuò)散卷積使用前向和后向轉(zhuǎn)移矩陣對有向交通圖進(jìn)行一組反向的隨機(jī)游走。層擴(kuò)散卷積過程定義如式(4)所示,更多詳細(xì)信息在3.3 節(jié)中進(jìn)行介紹。
其中,=/(),=/()分別表示擴(kuò)散卷積中的向前轉(zhuǎn)移矩陣和向后轉(zhuǎn)移矩陣。
本文提出的TSGCN 模型的總體框架如圖2 上半部分所示,它主要由多層時(shí)空層組成。歷史交通流數(shù)據(jù)經(jīng)輸入層轉(zhuǎn)換后,傳遞到層疊加的時(shí)空層中。在每個(gè)時(shí)空層中,輸入特征的殘差被添加到時(shí)空塊提取的輸出特征中,作為下一層時(shí)空層的輸入特征。最后,通過參數(shù)化的跳轉(zhuǎn)連接,將各個(gè)時(shí)空層的輸出特征連接送到輸出層,最終得到預(yù)測結(jié)果。如圖2 下半部分所示,時(shí)空層由時(shí)間模塊和空間模塊組成,分別用來對時(shí)間相關(guān)性和空間相關(guān)性進(jìn)行建模。
圖2 TSGCN 模型整體框架Fig.2 Framework of TSGCN model
時(shí)間相關(guān)性建模通過時(shí)間模塊完成,如圖2 左下角所示。具體來說,時(shí)間模塊由兩個(gè)并行的時(shí)間卷積和一個(gè)基于門控機(jī)制的激活單元(GTU)組成?;谏鲜龇绞綐?gòu)建的時(shí)間模塊,可以利用輸入數(shù)據(jù)的全時(shí)序來分析時(shí)序趨勢,詳細(xì)內(nèi)容在3.2 節(jié)中介紹,更多細(xì)節(jié)來自文獻(xiàn)[27]。時(shí)間相關(guān)性的建模不是本文的主要目標(biāo),可以選擇其他先進(jìn)的模型來替代它以提高性能。
本文主要的改進(jìn)在于空間相關(guān)性建模,通過如圖2 的右下角所示的空間模塊完成??臻g模塊包含一個(gè)分解層和一個(gè)由S-GCN 和D-GCN 組成的雙流圖卷積層。首先,通過提取交通流數(shù)據(jù)的關(guān)鍵特征,分解層將輸入的交通流數(shù)據(jù)分為穩(wěn)定分量和動態(tài)分量。然后,通過雙流圖卷積層中的S-GCN 和D-GCN分別提取穩(wěn)定和動態(tài)空間特征,經(jīng)過拼接后作為整個(gè)時(shí)空層的輸出。作為本文研究的重點(diǎn),空間模塊的具體內(nèi)容將在3.3 節(jié)中介紹。
時(shí)間模塊如圖2 的左下角所示,首先將輸入特征∈R通過兩個(gè)時(shí)間卷積捕獲時(shí)間特征。采用基于CNN 的空洞因果卷積作為TSGCN 的時(shí)間卷積,以分析交通流數(shù)據(jù)中的時(shí)間相關(guān)性??斩匆蚬矸e通過指定步長來跳過相鄰時(shí)刻交通流信息的方式,使本文提出的TSGCN 模型有能力對長期交通流數(shù)據(jù)進(jìn)行處理。經(jīng)過時(shí)間卷積后,時(shí)刻節(jié)點(diǎn)的交通流信息已包含其前面時(shí)刻的信息。然后將其作為GTU 中門控的輸入,GTU 的計(jì)算形式如式(5)。
其中,*表示卷積運(yùn)算;⊙表示元素Hadamard 乘積;(·)是sigmoid 激活函數(shù),它控制當(dāng)前狀態(tài)傳遞到下一層的比率;W 和W分別是第層的濾波器和門控自學(xué)習(xí)卷積濾波器。
TSGCN 模型的空間模塊如圖2 右下角所示,通過時(shí)間模塊對交通流數(shù)據(jù)的時(shí)間特征進(jìn)行建模后,將時(shí)間模塊的輸出特征與路網(wǎng)結(jié)構(gòu)進(jìn)行圖卷積等操作。具體來說,本文采用基于空域圖卷積方法進(jìn)行圖卷積操作,以捕捉交通流數(shù)據(jù)中有意義的空間相關(guān)性和特征。空間相關(guān)性對于提高交通流預(yù)測的準(zhǔn)確性至關(guān)重要。為了獲得準(zhǔn)確的空間相關(guān)性,需要考慮以下兩方面:(1)檢測節(jié)點(diǎn)之間的空間相關(guān)性是有向的;(2)空間相關(guān)性在總體穩(wěn)定的基礎(chǔ)上不斷波動?;谝陨戏治?,本文構(gòu)建的空間模塊中首先引入了一個(gè)分解層,然后構(gòu)建了一種用于動態(tài)空間相關(guān)性提取的雙流圖卷積神經(jīng)網(wǎng)絡(luò)。
Tucker分解是實(shí)現(xiàn)大規(guī)模數(shù)據(jù)處理的有效方法,可以從高階張量分解出特征更加明顯或結(jié)構(gòu)更加簡單的核心張量,從而更好地發(fā)掘數(shù)據(jù)內(nèi)部的結(jié)構(gòu)特征。本文采用近似Tucker 分解的分解層將輸入數(shù)據(jù)劃分為穩(wěn)定和動態(tài)分量。Tucker 分解的核心思想是將一個(gè)階的高維張量χ 分解為一個(gè)階低維的核心張量G 和個(gè)因子矩陣,,…,U。首先,在輸入數(shù)據(jù)時(shí)間和空間分別引入自學(xué)習(xí)時(shí)間投影因子∈R和空間投影因子∈R,從而獲得輸入數(shù)據(jù)∈R中的 時(shí)空核心張量G,如式(6)所示。
其中,和d分別為時(shí)空核心張量G 的時(shí)間維度和空間維度。時(shí)空核心張量G 包含了交通流數(shù)據(jù)的關(guān)鍵時(shí)空信息,然后通過式(7)將時(shí)空核心張量G 恢復(fù)至與輸入數(shù)據(jù)相同維度,作為穩(wěn)定分量∈R。
最后,將輸入數(shù)據(jù)中減去穩(wěn)定分量得到的剩余部分作為反映交通流動態(tài)變化的動態(tài)分量∈R。
通過上述分解層,可以從交通流數(shù)據(jù)中提取出穩(wěn)定分量和動態(tài)分量。其中,穩(wěn)定分量表示由固定的道路網(wǎng)絡(luò)約束下的穩(wěn)定性;動態(tài)分量代表了由于受到交通環(huán)境短期改變導(dǎo)致的動態(tài)變化。
考慮到穩(wěn)定和動態(tài)分量包含不同的交通流數(shù)據(jù),且具有不同的空間相關(guān)性,本文構(gòu)建雙流圖卷積層從穩(wěn)定分量∈R和動態(tài)分量∈R中分別分析空間相關(guān)性,如圖3 所示。
穩(wěn)定分量的空間相關(guān)性分析過程如圖3 上部所示。交通流數(shù)據(jù)中的穩(wěn)定分量表示受固定路網(wǎng)約束的部分,同時(shí)考慮到鄰接矩陣可以表示路網(wǎng)結(jié)構(gòu)。本文基于有向擴(kuò)散卷積構(gòu)建S-GCN 從穩(wěn)定分量中提取有向的穩(wěn)定空間相關(guān)性,計(jì)算過程如式(4)所示。
圖3 雙流圖卷積層結(jié)構(gòu)圖Fig.3 Process of two-stream GCN layer
為了評估本文提出的TSGCN 模型的性能,使用美國洛杉磯和加利福尼亞州的兩個(gè)真實(shí)高速公路交通流數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)。
(1)METR-LA:包含來自洛杉磯高速公路段上部署的環(huán)路檢測器的交通信息。METR-LA 數(shù)據(jù)集選擇了由1 515 條道路連接的207 個(gè)傳感器,并在2012年3 月1 日 至2012年6月30日的4個(gè)月內(nèi)每2 min 記錄一次交通速度,包含的觀測值總數(shù)為34 272。
(2)PeMS-BAY:包含PeMS(Caltrans performance measurement system)在加州灣區(qū)高速公路上收集的真實(shí)速度數(shù)據(jù)。PeMS-BAY 數(shù)據(jù)集選擇了由2 369 條道路連接的325 個(gè)傳感器,從2017 年1 月1 日到2017年5 月31 日,以每30 s 的間隔收集6 個(gè)月的數(shù)據(jù)。包含的觀測值總數(shù)為52 116 個(gè)。
本文基于文獻(xiàn)[16]發(fā)布的METR-LA 和PeMSBAY 數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。由于公開的數(shù)據(jù)集已經(jīng)過篩選等預(yù)處理操作,沒有缺失值,其值分布如圖4 所示。數(shù)據(jù)集還包含一個(gè)預(yù)定義的鄰接矩陣,該矩陣根據(jù)傳感器間的距離來反映連接關(guān)系。
圖4 METR-LA 數(shù)據(jù)集和PEMS-BAY數(shù)據(jù)集測試數(shù)據(jù)可視化Fig.4 Visualization of test data of METR-LA and PEMS-BAY datasets
本文采用與對比方法相同的數(shù)據(jù)預(yù)處理方式,將數(shù)據(jù)匯總成以5 min 為時(shí)間間隔的樣本,且通過ZScore 方法進(jìn)行歸一化。根據(jù)時(shí)間順序?qū)?shù)據(jù)集進(jìn)行劃分,其中70%用于訓(xùn)練,10%用于驗(yàn)證,20%用于測試。所有實(shí)驗(yàn)都根據(jù)過去60 min 內(nèi)12 個(gè)觀測時(shí)刻的歷史交通流數(shù)據(jù)來預(yù)測交通流的平均速度。為了評估TSGCN 模型的性能,本文使用3 個(gè)誤差評估指標(biāo),包括平均絕對誤差、均方根誤差(root mean square error,)和平均絕對百分比誤差(mean absolute percentage error,)。其中,計(jì)算如式(10)所示,計(jì)算如式(11)所示,計(jì)算如式(12)所示。
將本文提出的模型與以下四種交通流預(yù)測方法進(jìn)行比較:
(1)ARIMA:帶有卡爾曼濾波器的自回歸積分滑動平均法,是一種經(jīng)典的時(shí)間序列分析模型。
(2)FC-LSTM:具有全連接層的長短時(shí)記憶網(wǎng)絡(luò),是一種經(jīng)典的遞歸神經(jīng)網(wǎng)絡(luò)。
(3)DCRNN:擴(kuò)散卷積神經(jīng)網(wǎng)絡(luò)在時(shí)間維度上使用編碼器-解碼器結(jié)構(gòu),在空間維度上使用雙向隨機(jī)游走,是一種基于空域的GCN 方法。
(4)Graph WaveNet:一種用于時(shí)空圖建模的卷積網(wǎng)絡(luò)體系結(jié)構(gòu),在交通流預(yù)測問題上取得了很好的效果。
本文基于Pytorch 框架實(shí)現(xiàn)了包含8 個(gè)堆疊的時(shí)空層的TSGCN 模型。其中,時(shí)間模塊中時(shí)間卷積的擴(kuò)散參數(shù)分別為1、2、1、2、1、2、1、2,且時(shí)間卷積核的長度在每一層中為2,輸出通道為32。
空間模塊包含一個(gè)分解層和一個(gè)雙流圖卷積層。TSGCN 模型通過分解層將交通流數(shù)據(jù)劃分為穩(wěn)定分量和動態(tài)分量,因此分解層是模型的一個(gè)重要組成部分。為了選擇核心張量G 在空間上最優(yōu)的空間維度,本文選擇了不同的維度分別進(jìn)行實(shí)驗(yàn),并基于3 個(gè)誤差指標(biāo)進(jìn)行對比。
由于METR-LA 數(shù)據(jù)集包含207 個(gè)監(jiān)測點(diǎn),從[32,64,100,128]中進(jìn)行核心空間維度的選擇。根據(jù)如圖5 所示的誤差值,本文將核心張量的空間維度設(shè)為100。同時(shí),在PeMS-BAY 數(shù)據(jù)集的實(shí)驗(yàn)中設(shè)為160。作為空間模塊另一個(gè)重要組成部分,雙流圖卷積層中的輸出通道仍設(shè)置為32,其中圖卷積層的卷積核均設(shè)為1。
圖5 基于METR-LA 數(shù)據(jù)集的參數(shù)ds 設(shè)置對比Fig.5 Comparison of parameter ds setting based on METR-LA dataset
TSGCN 模型的訓(xùn)練優(yōu)化器采用Adam 算法,初始學(xué)習(xí)率為0.001,在70 個(gè)周期后的衰減率為0.1。實(shí)驗(yàn)在Intel Xeon CPU和NVIDIA Titan XP顯卡上進(jìn)行。
本文在兩個(gè)真實(shí)數(shù)據(jù)集上將提出的TSGCN 模型與4 個(gè)對比方法進(jìn)行了比較。由于使用了相同的數(shù)據(jù)集和相同的預(yù)測范圍,本文引用了文獻(xiàn)[17]公開的ARIMA、FC-LSTM、DCRNN 結(jié)果,及文獻(xiàn)[18]公開的Graph WaveNet 的結(jié)果。表1 顯示了TSGCN 和對比方法在預(yù)測未來15 min、30 min 和60 min 交通流的實(shí)驗(yàn)結(jié)果。可以看出,本文提出的TSGCN 模型在兩個(gè)數(shù)據(jù)集上均表現(xiàn)最佳。并且與對比方法相比,3 個(gè)評價(jià)指標(biāo)以相似的幅度減小。例如,與Graph WaveNet相比,在對未來60 min 的流量預(yù)測中,在METR-LA數(shù)據(jù)集上的MAE 和RMSE 分別降低了約11.1%、15.3%;在PeMS-BAY 數(shù)據(jù)集上的MAE 和RMSE 則分別降低了16.9%、20.1%。
表1 TSGCN 模型與基線模型的性能對比Table 1 Performance comparison of TSGCN with baseline models
相比之下,傳統(tǒng)的時(shí)間序列分析方法ARIMA 由于無法處理復(fù)雜的交通流數(shù)據(jù)而預(yù)測誤差最大。此外,同時(shí)考慮時(shí)間和空間相關(guān)性的模型(包括DCRNN、Graph WaveNet和TSGCN)優(yōu)于僅考慮時(shí)間因素的深度學(xué)習(xí)模型FC-LSTM。值得注意的是,與其他時(shí)空模型相比,本文提出的TSGCN 在短期和長期預(yù)測任務(wù)中都超過了DCRNN 和Graph WaveNet這兩個(gè)基于空域圖卷積的交通流預(yù)測模型,這表明考慮動態(tài)空間相關(guān)性對交通流預(yù)測具有不可忽視的作用。
為了更好地分析TSGCN 模型,本文隨機(jī)選擇了一個(gè)監(jiān)測點(diǎn)并對其在測試集上一周內(nèi)的預(yù)測值進(jìn)行了可視化操作,如圖6 所示。TSGCN 模型能檢測到出現(xiàn)較大波動的開始和結(jié)束時(shí)刻,并能夠較好地?cái)M合交通流的速度。由圖6 可知,在短期預(yù)測和長期預(yù)測中,較大的誤差出現(xiàn)在谷值點(diǎn)。這是由于TSGCN模型將交通流數(shù)據(jù)劃分為穩(wěn)定和波動分量并分別進(jìn)行空間相關(guān)性建模,而最終的預(yù)測結(jié)果受穩(wěn)定和波動兩種空間相關(guān)性的同時(shí)影響。穩(wěn)定部分受路網(wǎng)和交通習(xí)慣的約束部分,在圖6 中表示為除25 日和26日兩天外其他日期的近似時(shí)刻均有一個(gè)速度大幅下降的波動。在誤差較大的谷值點(diǎn),TSGCN 的預(yù)測值低于真實(shí)值,即呈現(xiàn)出類似于過去谷值的特點(diǎn),體現(xiàn)出穩(wěn)定空間相關(guān)性的影響。此外,TSGCN 模型的預(yù)測值與真實(shí)值之間存在一定誤差,如何更準(zhǔn)確地?cái)M合波動谷值處的交通流速度也是下一步要考慮的重點(diǎn)。
圖6 METR-LA 數(shù)據(jù)集一周內(nèi)數(shù)據(jù)可視化結(jié)果Fig.6 Visualization results within one week on METR-LA dataset
TSGCN 模型通過分解層將交通流數(shù)據(jù)劃分出動態(tài)分量,進(jìn)一步從動態(tài)分量中提取動態(tài)空間相關(guān)性用于預(yù)測。動態(tài)空間相關(guān)性在更有效的交通流預(yù)測問題中起著至關(guān)重要的作用。本文提出的TSGCN模型在短期預(yù)測和中長期預(yù)測問題上都優(yōu)于其他對比方法。并且隨著預(yù)測時(shí)間的延長,預(yù)測性能提升越大,如圖7 所示。例如,在METR-LA 數(shù)據(jù)集上,與目前較新的交通流預(yù)測方法Graph WaveNet 相比,對未來15 min 的預(yù)測時(shí),本文提出的TSGCN 模型的MAE 誤差值降低了5.20%;對于60 min 的預(yù)測則降低了約11.1%??梢哉J(rèn)為TSGCN 模型分別提取穩(wěn)定和動態(tài)的空間相關(guān)性,能夠更有效地捕獲長時(shí)間范圍內(nèi)空間相關(guān)性的動態(tài)變化。這也表明,空間相關(guān)性在短期預(yù)測中可以簡單視為不變,但是對于長期交通流預(yù)測任務(wù),空間相關(guān)性的動態(tài)變化更為明顯和重要。
圖7 TSGCN 模型與基線模型在不同預(yù)測時(shí)間下的MAE 對比Fig.7 Comparison of MAE between TSGCN model and baseline models under different prediction time
本文提出了一種用于交通流預(yù)測的深度學(xué)習(xí)框架TSGCN。采用分解層對交通流數(shù)據(jù)的動態(tài)空間依賴性進(jìn)行建模,將實(shí)時(shí)交通流數(shù)據(jù)分解為穩(wěn)定分量和動態(tài)分量。然后,通過雙流圖卷積層分別從兩個(gè)分量中分析穩(wěn)定和動態(tài)空間相關(guān)性,以捕獲更準(zhǔn)確的空間相關(guān)性以進(jìn)行動態(tài)交通預(yù)測。在兩個(gè)公開的真實(shí)交通流數(shù)據(jù)集上,本文提出的TSGCN 模型優(yōu)于最新的對比方法??梢宰C明從交通流數(shù)據(jù)的穩(wěn)定和動態(tài)分量中提取空間相關(guān)性能更好地反映復(fù)雜交通流數(shù)據(jù)的動態(tài)變化,并為交通流預(yù)測提供更準(zhǔn)確的信息。
在以后的工作中,將在交通預(yù)測中考慮特殊時(shí)間的時(shí)間依賴性,包括周末和節(jié)假日。此外,還將嘗試將外部交通環(huán)境信息(例如事故數(shù)據(jù)和天氣信息)引入交通流預(yù)測中。