溫 雯,江建強,蔡瑞初,郝志峰
(廣東工業(yè)大學(xué) 計算機學(xué)院, 廣東 廣州 510006)
交通擁堵是許多城市所面臨的問題,準(zhǔn)確的交通流量預(yù)測[1-2]能讓交通擁堵情況得到有效緩解,從而縮短人們的通勤時間,同時也能降低環(huán)境污染。交通流量預(yù)測屬于時空數(shù)據(jù)預(yù)測范疇,能否有效地捕獲并利用其時空依賴關(guān)系是作出準(zhǔn)確預(yù)測的關(guān)鍵,也是研究的難點。交通流量預(yù)測問題的復(fù)雜性體現(xiàn)為:(1) 時間依賴方面。交通流量的變化是受潛在狀態(tài)影響的,不同的潛在狀態(tài)決定了交通流量的上升與下降,以及上升或下降的速度。例如,在同一個路口,上班高峰期與下班高峰期流量的潛在狀態(tài)是不同的。交通流量的潛在狀態(tài)是隨著時間變化的。一方面,交通流量數(shù)據(jù)整體上呈現(xiàn)出日周期性規(guī)律,每天數(shù)據(jù)波形都較為相似,這體現(xiàn)了交通流量的潛在狀態(tài)的規(guī)律性;另一方面,交通流量數(shù)據(jù)幾乎在任何時刻都在變化,受交通狀況及前面時間段的交通流量影響,變化趨勢是動態(tài)變化的,體現(xiàn)了交通流量潛在的狀態(tài)時變性。(2) 空間依賴方面。每個交通節(jié)點的交通流量都會受到附近交通網(wǎng)絡(luò)影響,且受到的影響也是動態(tài)變化的。如上游位置的交通流量會對下游位置的交通流量產(chǎn)生影響;并且每個路口會受到來自多個不同方向的影響。此外,交通流量受不同方向的影響也是不同的。因此,交通流量的空間依賴是復(fù)雜多樣的。
現(xiàn)有的交通預(yù)測方法中,有基于統(tǒng)計的系列方法,如HA(History Average)和ARIMA(Autoregressive Integrated Moving Average Model)[3],HA采用歷史平均值來預(yù)測,ARIMA將數(shù)據(jù)進行差分處理后移動平均自回歸,但在預(yù)測交通流量高復(fù)雜度非線性數(shù)據(jù)時會產(chǎn)生很大的誤差;傳統(tǒng)機器學(xué)習(xí)方法如SVM(Support Vector Machine)[4]、KNN(K-Nearest Neighbor)[5]等,過度依賴特征提取工程與先驗知識,在預(yù)測交通流量這種擁有復(fù)雜的時空關(guān)系的數(shù)據(jù)時難以達到準(zhǔn)確效果。隨著深度學(xué)習(xí)的發(fā)展,越來越多問題都可以用合適的神經(jīng)網(wǎng)絡(luò)來解決。用深度學(xué)習(xí)進行交通流量預(yù)測時,無需大量先驗知識。Zhang等[6]使用基于CNN(Convolutional Neural Networks)的殘差網(wǎng)絡(luò)來構(gòu)建短時交通流量預(yù)測模型,其使用的利用近期、周期、趨勢多層次的數(shù)據(jù)的方法被許多論文借鑒。但CNN只能處理網(wǎng)格狀的結(jié)構(gòu)化數(shù)據(jù),現(xiàn)實中交通道路的拓撲結(jié)構(gòu)往往是復(fù)雜的,因此該模型不具備普適性。圖神經(jīng)網(wǎng)絡(luò)[7]的發(fā)展解決了此問題,F(xiàn)eng等[8]提出了基于多組件的預(yù)測方法,在沿用多層次交通流數(shù)據(jù)的基礎(chǔ)上使用了GCN(Graph Convolutional Networks)來捕獲鄰居的特征,取得了更好的效果。目前許多交通流量預(yù)測方法都使用GCN,然而GCN在分配權(quán)重時很依賴于圖結(jié)構(gòu),無法靈活地給不同的鄰居節(jié)點分配權(quán)重[9]。循環(huán)神經(jīng)網(wǎng)絡(luò)常被應(yīng)用于序列數(shù)據(jù)的預(yù)測,如經(jīng)典的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),但RNN在捕捉數(shù)據(jù)的長期依賴關(guān)系方面效果欠佳,并且其存在梯度爆炸以及梯度消失問題。LSTM(Long Short Term Memory)[10]是一種采用了門控機制的循環(huán)神經(jīng)網(wǎng)絡(luò),解決了梯度消失及梯度爆炸問題,在處理數(shù)據(jù)的長期依賴關(guān)系方面也有更好的效果。GRU(Gate Recurrent Unit)[11]也是一種使用門控機制的循環(huán)神經(jīng)網(wǎng)絡(luò),與LSTM類似,GRU也能更好地捕獲數(shù)據(jù)的長期依賴。RNN、LSTM、GRU等都被應(yīng)用到交通流量預(yù)測上,但如何捕獲交通流量的潛在狀態(tài),將交通流量數(shù)據(jù)的時間依賴關(guān)系與空間依賴關(guān)系有效地結(jié)合起來,依然是交通流量預(yù)測問題中的一大難點。對此,本文提出一種新的交通流量預(yù)測模型(Graph Temopral Recurrent Independent Mechanisms,G-tRIM),該模型通過融合RIM(Recurrent Independent Mechanisms)與圖注意力網(wǎng)絡(luò),來高效捕捉交通流量數(shù)據(jù)的時空依賴關(guān)系,以做出更精準(zhǔn)的預(yù)測。其中,RIM網(wǎng)絡(luò)通過多個子網(wǎng)絡(luò)的協(xié)調(diào)合作,建模交通流量的潛在狀態(tài);圖注意力網(wǎng)絡(luò)計算鄰居的attention系數(shù),以此來聚合鄰居信息,捕獲節(jié)點受到的空間影響。本文的主要貢獻點為:
(1) 在使用RIM來捕獲交通流量的潛在狀態(tài)時,巧妙地融入了時間信息,結(jié)合潛在狀態(tài)的時變性讓RIM能更好地選擇子網(wǎng)絡(luò)進行激活,以此更準(zhǔn)確地捕獲交通流量的潛在狀態(tài)。
(2) 根據(jù)各節(jié)點交通流量受到不同空間的影響,動態(tài)地使用GAT(Graph Attention Networks) 計算節(jié)點鄰居的attention系數(shù),更精準(zhǔn)地分配鄰居的不同的權(quán)重。
(3) 實驗結(jié)果表明,在網(wǎng)格狀與非網(wǎng)格狀的數(shù)據(jù)集上,該模型的預(yù)測結(jié)果都優(yōu)于其他現(xiàn)有模型。
交通流量數(shù)據(jù)是序列數(shù)據(jù)?;诮y(tǒng)計的HA、ARIMA等經(jīng)典方法能在較小計算量的要求下給出預(yù)測,但存在誤差較大的缺陷。隨著算力的增加,神經(jīng)網(wǎng)絡(luò)的運用也更為廣泛。其中,循環(huán)神經(jīng)網(wǎng)絡(luò)[12]在解決有關(guān)序列結(jié)構(gòu)數(shù)據(jù)的問題時,往往能取得很好的效果。循環(huán)神經(jīng)網(wǎng)絡(luò)RNN使用了隱藏層參數(shù)共享的方法,來獲取序列結(jié)構(gòu)數(shù)據(jù)的序列依賴關(guān)系。但是,RNN存在梯度消失以及梯度爆炸問題,難以捕捉到數(shù)據(jù)的長期依賴關(guān)系。長短期記憶網(wǎng)絡(luò)LSTM使用了門控機制,在捕獲序列結(jié)構(gòu)數(shù)據(jù)的序列依賴的同時,也避免了梯度消失與梯度爆炸問題。RIM[13]由多個參數(shù)空間一致的子網(wǎng)絡(luò)組成,使用注意力機制對每一個輸入數(shù)據(jù)進行匹配篩選,分配到不同的子網(wǎng)絡(luò)。一般情況下,同一時間步分配給各個子網(wǎng)絡(luò)的輸入是不完全相同的,各個子網(wǎng)絡(luò)則會根據(jù)對應(yīng)的輸入完成動態(tài)轉(zhuǎn)換,更新相應(yīng)的隱狀態(tài)。各子網(wǎng)絡(luò)之間在進行自身的動態(tài)轉(zhuǎn)換時相互獨立,在完成動態(tài)轉(zhuǎn)換后會進行稀疏的信息交互。RIM對比LSTM具有更好的預(yù)測效果以及更強的魯棒性。但是,RIM在預(yù)測交通流量時,只使用過去時間段的流量而忽略了時間本身這一信息,因此未能準(zhǔn)確地捕獲交通流量的潛在狀態(tài)。
交通流量預(yù)測不僅要考慮時間影響,同時也需要聚合鄰居信息。卷積神經(jīng)網(wǎng)絡(luò)CNN是聚合鄰居信息的一種方法,在圖像識別等方面的應(yīng)用取得了很好的效果。Zhang等[6]使用CNN和殘差網(wǎng)絡(luò)來預(yù)測北京的交通流量,但僅適用于劃分為網(wǎng)格狀的結(jié)構(gòu)化數(shù)據(jù)。CNN無法應(yīng)用于交通道路這種非結(jié)構(gòu)化的圖數(shù)據(jù)中。圖卷積網(wǎng)絡(luò)GCN是一種將卷積思想應(yīng)用在圖結(jié)構(gòu)數(shù)據(jù)上的方法,通過傅里葉變換與逆變換完成,GCN解決了CNN不適用于圖結(jié)構(gòu)數(shù)據(jù)的問題。STGCN(Spatio-Temporal Graph Convolutional Networks)[14]使用GCN的方法聚合非結(jié)構(gòu)化鄰居的信息,擺脫了GCN的束縛。但GCN在聚合過程中對于鄰居的權(quán)重是固定的,沒有區(qū)分同一節(jié)點的不同鄰居的影響程度。圖注意力網(wǎng)絡(luò)GAT[15]通過計算節(jié)點與每個鄰居的attention權(quán)值,捕捉不同路口或者區(qū)域的交通流量對當(dāng)前路口或者區(qū)域交通流量的不同影響,更適用于交通流量的真實情況。此外,T-GCN(Temporal Graph Convolutional Network)[16]、STGCN和ASTGCN(Attention Based Spatial-Temporal Graph Convolutional Networks)[17]在預(yù)測時使用經(jīng)過聚合鄰居信息的交通流量數(shù)據(jù),可能會改變節(jié)點本身的流量數(shù)據(jù)的模式規(guī)律。
定義1給定城市交通圖G=(V,E), 其中V={v1,v2,···,vN} 為交通圖中的所有節(jié)點,E是節(jié)點之間的邊。根據(jù)數(shù)據(jù)集的不同,節(jié)點可以是交通路口,也可以是按照經(jīng)緯度劃分的塊狀區(qū)域,邊可以是有向的,也可以是無向的,這取決于所獲取的數(shù)據(jù)集。
定義2給定流量矩陣X=(X1,X2,···,XN)T∈RN×P,X為N個節(jié)點的P個時間段的交通流量序列。其中Xi=(Xi1,Xi2,···,XiP)T∈RP,i∈(1,2,···,N) ,且Xt=(X1t,X2t,···,XNt)∈RN,t∈(1,2,···,P)。Xi為某一節(jié)點的所有流量序列,Xt為某一時刻所有節(jié)點的流量。
根據(jù)給定的城市交通圖G,前τ 段時間內(nèi)的交通流量張量為 {Xt|t=1,2,···,τ} , 對應(yīng)的時間序列{ti|i∈{1,2,···,τ},預(yù)測下一個時間段內(nèi)的城市交通流量X?τ+1。
交通流量預(yù)測的重點在于對交通流量數(shù)據(jù)的時空依賴關(guān)系進行捕獲。本文對交通流量預(yù)測提出以下思路:使用2個模塊分別捕獲交通流量數(shù)據(jù)的時間依賴關(guān)系與空間依賴關(guān)系,融合2個模塊的結(jié)果作出最后的預(yù)測。
基于以上思路,如圖1所示,G-tRIM模型主要由tRIM和GAT+LSTM兩部分組成。圖1上半部分,tRIM利用中心節(jié)點的流量數(shù)據(jù)與時間步數(shù)據(jù)對中心節(jié)點的潛在狀態(tài)進行建模,捕獲交通流量數(shù)據(jù)的時間依賴關(guān)系;圖1下半部分通過GAT聚合鄰居節(jié)點的信息,然后把聚合的結(jié)果輸入LSTM,以此捕獲交通流量數(shù)據(jù)的空間依賴關(guān)系。
圖1 G-tRIM模型Fig.1 G-tRIM model
2.3.1 時間依賴關(guān)系建模
現(xiàn)在時序數(shù)據(jù)的處理方法大多數(shù)使用循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,然而RNN在序列過長時會出現(xiàn)梯度消失和梯度爆炸的問題;LSTM是一種使用門控機制的循環(huán)神經(jīng)網(wǎng)絡(luò),并且不存在梯度消失或者梯度爆炸問題;RIM是由多個LSTM組合成的,擁有更好的穩(wěn)定性。然而,RIM只是接收了數(shù)據(jù)序列,不知道該數(shù)據(jù)序列所對應(yīng)的時間。因此,在交通流量預(yù)測的應(yīng)用中并沒有利用交通流量數(shù)據(jù)呈現(xiàn)的“日周期性”的特點,未能準(zhǔn)確捕獲交通流量的潛在狀態(tài)。G-tRIM的時間依賴關(guān)系由tRIM來捕獲,圖2展示的是1個tRIMcell處理1個時間步輸入的過程,每個時間步都使用一次tRIMcell。tRIM是由若干個(如圖(2)所示是4個)子網(wǎng)絡(luò)組成的循環(huán)神經(jīng)網(wǎng)絡(luò),其每個子網(wǎng)絡(luò)都是大小一樣的LSTM。每個時間步中,數(shù)據(jù)經(jīng)過了輸入階段、轉(zhuǎn)化階段、交互階段。在輸入階段,該時間步的交通流量以及對應(yīng)的時間經(jīng)過了MLP(Multilayer Perceptron)層投影到指定的空間后串聯(lián)起來進入注意力層,與各個子網(wǎng)絡(luò)的隱狀態(tài)做匹配,選中最相關(guān)的f個子網(wǎng)絡(luò)進行激活。圖2中虛線框部分展示了單個時間步輸入階段計算得到與該次輸入數(shù)據(jù)最相關(guān)的2個子網(wǎng)絡(luò)的過程,并使用灰色框格表示被激活的子網(wǎng)絡(luò)。
圖2 tRIMcellFig.2 tRIMcell
第m個節(jié)點的n時刻中,第k個子網(wǎng)絡(luò)所對應(yīng)的輸入為
式(2)中:St指在t時間步被激活的子網(wǎng)絡(luò)集合;h?t+1,k為第k個子網(wǎng)絡(luò)在接收t時間步的輸入并完成動態(tài)轉(zhuǎn)換后的隱狀態(tài);Dk為動態(tài)轉(zhuǎn)換方式,本文選擇了LSTM; θ(kD)為第k個子網(wǎng)絡(luò)LSTM的參數(shù)。各個子網(wǎng)絡(luò)接收處理輸入之后,更新自己的隱狀態(tài)。在交互階段,各個子網(wǎng)絡(luò)之間進行稀疏交互,被激活的子網(wǎng)絡(luò)此時利用注意力機制聚合所有的子網(wǎng)絡(luò)的信息,用來更新自身的隱狀態(tài)。轉(zhuǎn)化過程與交互過程如圖2虛線框外部分所示,被激活的子網(wǎng)絡(luò)除了能利用有效的輸入更新自身的隱狀態(tài)外,還會在交互階段利用其他子網(wǎng)絡(luò)的信息再次更新的隱狀態(tài)。
式(3)~(5)分別為在t時刻第k個子網(wǎng)絡(luò)的Q(Query)、K(Key)、V(Value) 構(gòu)造方式,式(6)為子網(wǎng)絡(luò)的更新方式。式(6)中ht+1,k為第k個子網(wǎng)絡(luò)經(jīng)過了稀疏信息交互之后得到的隱狀態(tài),式(3)中W?kq為第k個子網(wǎng)絡(luò)的稀疏信息交互查詢參數(shù),式(4)和式(5)中Wke和Wkva為生成K和V的參數(shù),式(6)中Kt,:為式(4)中Kt,k串聯(lián)的結(jié)果。可知,在時間步t,只有被激活的子網(wǎng)絡(luò)才能獲取所有子網(wǎng)絡(luò)的信息。到此,一個時間步的輸入處理完成。在最后一個時間步中,tRIM得到了交通流量的潛在狀態(tài)。在這過程中,每個子網(wǎng)絡(luò)所接收的輸入是不同的,因此能訓(xùn)練出不同的函數(shù)表示。
2.3.2 空間依賴關(guān)系建模
許多模型使用CNN來建模數(shù)據(jù)的空間關(guān)系,然而CNN只適用于歐氏結(jié)構(gòu)化的數(shù)據(jù),對于非結(jié)構(gòu)化的數(shù)據(jù)并不適用;GCN借助圖的拉普拉斯矩陣對圖上的數(shù)據(jù)進行卷積操作,解決了CNN不能在非結(jié)構(gòu)化數(shù)據(jù)上操作的問題,但沒有對不同的鄰居分配不同的權(quán)重;GAT計算節(jié)點間的attention系數(shù),為不同的鄰居分配了不同的權(quán)重。現(xiàn)實中,在同一時間里,不同的中心節(jié)點受到的鄰居節(jié)點的影響不同;在同一中心節(jié)點中,不同時間所受到的鄰居節(jié)點的影響也不同。因此,使用GAT可動態(tài)地計算中心節(jié)點與鄰居間的attention系數(shù),動態(tài)地分配鄰居的權(quán)重。先把r個鄰居的數(shù)據(jù)Xn∈Rr×τ使 用GAT聚合成Xn′∈Rτ,然后使用LSTM對Xn′進行處理,得到隱狀態(tài)表示和數(shù)據(jù)的空間依賴關(guān)系。使用GAT對鄰居數(shù)據(jù)進行聚合的表達式為
式(7)為根據(jù)中心節(jié)點交通流量數(shù)產(chǎn)生Q(Query)的過程,式(8)為根據(jù)某個鄰居節(jié)點交通流量數(shù)據(jù)產(chǎn)生單個Ki(Key)的過程,式(9)是GAT聚合中心節(jié)點的所有鄰居的交通流量數(shù)據(jù)的過程,Wq、Wke為可訓(xùn)練參數(shù)。式(10)展示了利用鄰居節(jié)點信息所捕獲的中心節(jié)點所受到的空間依賴關(guān)系的方法。其中,Yc={Xct|t=1,2,···,τ}為給出的中心節(jié)點的交通流量數(shù)據(jù)序列;Yi={Xit|t=1,2,···,τ},i∈{1,2,···,r}為Xn中的一行的一部分,是具體某一個鄰居的數(shù)據(jù)序列。
把tRIM得到的交通流量的潛在狀態(tài)與空間依賴關(guān)系的隱狀態(tài)串聯(lián)起來,經(jīng)過全連接層得到G-tRIM的預(yù)測值。最終的表述為
因此,該模型的損失函數(shù)為
將本文提出的G-tRIM模型放在2個真實世界的數(shù)據(jù)集上進行實驗,并與其他的基準(zhǔn)方法進行對比,以驗證該模型的性能。
數(shù)據(jù)集1:貴州數(shù)據(jù)集。該數(shù)據(jù)集提供了貴州某一地區(qū)的道路地圖,并給出了各個路口之間連續(xù)8 d從早上6點到晚上8點的交通流量,流量數(shù)據(jù)以30 s為周期統(tǒng)計一次。使用所有道路的所有數(shù)據(jù)。由于原始數(shù)據(jù)中有過多為0的數(shù)據(jù),把數(shù)據(jù)聚合為10 min統(tǒng)計一次,降低數(shù)據(jù)的稀疏性。選取其中前5 d的數(shù)據(jù)作為訓(xùn)練集,后面3 d的數(shù)據(jù)作為測試集。
數(shù)據(jù)集2:北京數(shù)據(jù)集。該數(shù)據(jù)集把北京市按經(jīng)緯度均等切分為32×32的1 024個網(wǎng)格,并以30 min 為周期統(tǒng)計一次每個網(wǎng)格的流入流出流量,記錄時間為2015年11月1日至2016年4月10日。選取最中央的16×16的256個網(wǎng)格的流出數(shù)據(jù)進行實驗。選取其中2015年11月、12月以及2016年1月的數(shù)據(jù)作為訓(xùn)練集,2016年2月、3月和4月的數(shù)據(jù)作為測試集。
因為以上2個數(shù)據(jù)集的數(shù)據(jù)都存在相近的交通節(jié)點的流量值相差過大的特點,所以把流量縮小為原來的1/50,以縮小交通節(jié)點間的差異。
對比實驗的模型為:(1) 差分整合移動平均自回歸模型(Autoregressive Integrated Moving Average model, ARIMA) ,ARIMA是一種經(jīng)典的參數(shù)模型,適合使用在線性數(shù)據(jù)上,處理交通流量這種非線性高復(fù)雜度的數(shù)據(jù)時效果欠佳。(2) 長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM) ,LSTM是使用門控機制的循環(huán)神經(jīng)網(wǎng)絡(luò),LSTM的預(yù)測效果好于ARIMA。(3)循環(huán)獨立機制(Recurrent Independent Mechanisms,RIM) ,RIM由多個子網(wǎng)絡(luò)組成,各個子網(wǎng)絡(luò)都訓(xùn)練出了不同的模塊化的功能,能更有效地提取輸入數(shù)據(jù)中的有效信息,因此RIM的預(yù)測效果要比LSTM好。(4) 時空圖卷積神經(jīng)網(wǎng)絡(luò)(Spatio-Temporal Graph Convolutional Networks, STGCN) ,STGCN使用連續(xù)的2個時空卷積塊捕獲交通流量的時空依賴性,每個時空卷積塊都包含一維時域卷積與二維空域卷積。(5) 基于注意力機制的時空圖卷積網(wǎng)絡(luò)(Attention Based Spatial-Temporal Graph Convolutional Networks,ASTGCN) ,ASTGCN使用3個一致的結(jié)構(gòu)提取數(shù)據(jù)3個層次的特征,每個結(jié)構(gòu)都由包含時空注意力提取模塊與時空卷積模塊的時空卷積塊殘差連接組成。
STGCN與ASTGCN都考慮了交通流量的空間影響,但還存在以下2個問題:(1) 忽略了交通流量潛在狀態(tài)是會隨時間變化的,只輸入流量序列,而沒給出對應(yīng)的時間,讓模型在判斷對應(yīng)的潛在狀態(tài)時不太準(zhǔn)確;(2) 沒有考慮交通流量的空間影響的時刻動態(tài)變化的特性。
針對上述2個問題,本文提出了G-tRIM(Graph Temopral Recurrent Independent Mechanisms)模型。GtRIM在捕獲交通流量的時間依賴關(guān)系時,給tRIM輸入了每個時間片的流量數(shù)據(jù)以及對應(yīng)的時間數(shù)據(jù),因此能更準(zhǔn)確地計算該時間步的輸入與各個子網(wǎng)絡(luò)的相關(guān)性,再選擇子網(wǎng)絡(luò)進行激活,這樣能更準(zhǔn)確地建模當(dāng)前的潛在狀態(tài);在捕獲空間依賴關(guān)系時,GAT能對不同時刻的鄰居信息動態(tài)地賦予不同的影響權(quán)重,更符合交通流量時刻變化的空間影響的建模需求。
以均方誤差MSE和平均絕對誤差MAE為指標(biāo),G-tRIM模型在貴州和北京數(shù)據(jù)集中獲得最優(yōu)結(jié)果。實驗結(jié)果如表1所示。
表1 不同模型的實驗結(jié)果Table 1 Experiments' results based on different models
3.3.1 時間步數(shù)據(jù)
把輸入數(shù)據(jù)中的時間步信息拿掉,只輸入節(jié)點數(shù)據(jù)序列與圖結(jié)構(gòu)得到G-RIM模型(Graph Recurrent Independent Mechanisms)。該模型用RIM捕獲交通流量數(shù)據(jù)的時間依賴關(guān)系,用GAT來捕獲交通流量數(shù)據(jù)的空間依賴關(guān)系。因為加入了鄰居信息,能捕獲節(jié)點所受到的空間影響,其實驗結(jié)果優(yōu)于RIM;但是RIM忽略了時間信息對交通流量的潛在狀態(tài)的影響,只使用了交通流量數(shù)據(jù)捕獲到的交通流量的時間依賴,因此不如G-tRIM的實驗結(jié)果。
3.3.2 鄰居信息
把輸入數(shù)據(jù)中的鄰居數(shù)據(jù)拿掉,只輸入節(jié)點數(shù)據(jù)與時間步內(nèi)容得到tRIM模型(Temopral Recurrent Independent Mechanisms)。該模型用tRIM捕獲交通流量數(shù)據(jù)的時間依賴關(guān)系,能更準(zhǔn)確地捕獲交通流量的潛在狀態(tài),該方案的實驗結(jié)果優(yōu)于RIM,但是缺乏了鄰居信息導(dǎo)致無法捕獲空間影響,所以不如GtRIM的實驗結(jié)果。實驗結(jié)果如表2所示。
表2 消融實驗結(jié)果Table 2 Ablation experiments' results
本文提出的G-tRIM模型有2個重要參數(shù)需要設(shè)置,分別是tRIM中的子網(wǎng)絡(luò)的個數(shù)g,和每次激活的子網(wǎng)絡(luò)個數(shù)f。圖3為在貴州數(shù)據(jù)集中以MSE為指標(biāo)進行實驗,在不同實驗參數(shù)設(shè)置下的結(jié)果。
圖3 不同參數(shù)的實驗結(jié)果Fig.3 Experiments' results under defferent parameters setting
實驗表明,選擇子網(wǎng)絡(luò)的數(shù)量并非越多越好,當(dāng)子網(wǎng)絡(luò)的數(shù)量太少時,各子網(wǎng)絡(luò)無法訓(xùn)練出足夠細致的模式,模型無法充分建模流量的潛在狀態(tài);當(dāng)子網(wǎng)絡(luò)數(shù)量太多時,各子網(wǎng)絡(luò)的功能存在重復(fù),加大模型的訓(xùn)練難度,模型的預(yù)測精準(zhǔn)度反而下降。如圖3所示,在貴州數(shù)據(jù)集的實驗結(jié)果中,最好的是選擇4個子網(wǎng)絡(luò),每次激活2個子網(wǎng)絡(luò)。選定了4個子網(wǎng)絡(luò)(g= 4),若選擇1個子網(wǎng)絡(luò)進行激活,每個時間步網(wǎng)絡(luò)都會丟棄較多內(nèi)容,結(jié)果欠佳;若選擇2個子網(wǎng)絡(luò)進行激活,網(wǎng)絡(luò)獲得的信息量恰好,得到最好的Loss為0.129;若選擇3個子網(wǎng)絡(luò)進行激活,網(wǎng)絡(luò)接收的信息中包含了不重要的信息甚至是錯誤信息,影響實驗效果;若選擇4個子網(wǎng)絡(luò)進行激活,則無法達到不同子網(wǎng)絡(luò)訓(xùn)練出不同效果的作用。
消融實驗證實了時間步信息與鄰居信息對于交通流量預(yù)測的重要性;通過參數(shù)討論實驗選擇合適的超參數(shù),使模型獲得最精準(zhǔn)的預(yù)測結(jié)果。G-tRIM分別使用tRIM與GAT來建模交通流量數(shù)據(jù)的時間依賴關(guān)系與空間依賴關(guān)系,實驗結(jié)果在2個數(shù)據(jù)集上都優(yōu)于各對比方法,展現(xiàn)了G-tRIM的較優(yōu)性能。
針對交通流量預(yù)測問題中如何精準(zhǔn)地捕獲交通流量數(shù)據(jù)的時空依賴關(guān)系的難題,本文提出了基于循環(huán)獨立機制RIM的G-tRIM模型。該模型使用改進的RIM有效地融合了交通流量數(shù)據(jù)中的流量數(shù)據(jù)與時間步數(shù)據(jù),精準(zhǔn)刻畫了交通流量數(shù)據(jù)的潛在狀態(tài),有效地捕獲了交通流量數(shù)據(jù)的時間依賴關(guān)系;使用圖注意力網(wǎng)絡(luò)給節(jié)點的各個鄰居動態(tài)地分配不同的權(quán)重,解決了交通流量受空間影響動態(tài)變化的難題,有效地捕獲了交通流量數(shù)據(jù)的空間依賴關(guān)系。該模型在2個數(shù)據(jù)集上的實驗均得到了較精準(zhǔn)的預(yù)測結(jié)果。