徐 麗,符祥遠(yuǎn),李浩然
(長安大學(xué) 信息工程學(xué)院,西安 710064)
隨著科技的發(fā)展和人民收入的不斷提升,汽車保有量每年持續(xù)上升,智能交通系統(tǒng)用于規(guī)劃管理和智能調(diào)度交通運(yùn)行,占有越來越重要地位。作為智能交通的關(guān)鍵技術(shù),交通流預(yù)測在路徑規(guī)劃中發(fā)揮著越來越重要的作用,不僅可以為交通部門提前感知擁堵情況,還可以提高出行者的出行效率[1-3]。然而復(fù)雜的時(shí)空特征導(dǎo)致交通預(yù)測成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)。
交通流預(yù)測是實(shí)現(xiàn)交通智能化服務(wù)的重要任務(wù)之一,自20 世紀(jì)30 年代出現(xiàn)以來,經(jīng)過廣大學(xué)者的積極研究與實(shí)踐,已經(jīng)取得了相當(dāng)多的研究成果。早期的機(jī)器學(xué)習(xí)方法和統(tǒng)計(jì)方法[4-5]在交通預(yù)測方面取得了廣泛的應(yīng)用。Huang 等[6]認(rèn)為早期人工神經(jīng)網(wǎng)絡(luò)方法大多采用單隱層結(jié)構(gòu),他首次將深度學(xué)習(xí)方法引入交通預(yù)測領(lǐng)域,提出了利用深度置信網(wǎng)絡(luò)進(jìn)行交通流量特征學(xué)習(xí),在深度置信網(wǎng)絡(luò)的輸出層中加入多任務(wù)回歸層進(jìn)行多條道路交通流量的預(yù)測。但是上述方法僅考慮了交通序列的時(shí)間特征,沒有考慮復(fù)雜的動態(tài)空間特征。
此后,隨著卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、長短時(shí)記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)的蓬勃發(fā)展,越來越多的學(xué)者開始將交通預(yù)測方法轉(zhuǎn)移到深度學(xué)習(xí)技術(shù)。交通序列的空間特征也逐漸在預(yù)測中被考慮到。Sun 等[7]利用全球定位系統(tǒng)(Global Positioning System,GPS)軌跡數(shù)據(jù)考慮前30~90 min 的交通速度數(shù)據(jù),構(gòu)建了CNN、RNN、支持向量回歸(Support Vector Regression,SVR)等幾種交通速度預(yù)測模型,結(jié)果表明深度學(xué)習(xí)方法的預(yù)測效果優(yōu)于機(jī)器學(xué)習(xí)方法。閻嘉琳等[8]綜合利用城市道路交通的時(shí)空關(guān)聯(lián)特征,搭建了基于LSTM 的城市道路交通速度預(yù)測模型,在時(shí)間特征上考慮了近歷史時(shí)間段和遠(yuǎn)歷史時(shí)間段以及待預(yù)測時(shí)間段的速度信息;在空間特征上將上下游路段速度信息集成到目標(biāo)路段。交通路網(wǎng)具有復(fù)雜的空間特征,每一時(shí)刻的交通流量都會受到相鄰路段的影響,上述方法提到的CNN 處理的是歐氏空間的數(shù)據(jù),而復(fù)雜路網(wǎng)具有非歐氏的空間特征,CNN 在復(fù)雜路網(wǎng)的交通數(shù)據(jù)中存在空間特征提取不足的問題。
隨著計(jì)算機(jī)視覺和圖像處理領(lǐng)域的發(fā)展,圖卷積網(wǎng)絡(luò)(Graph Convolution Network,GCN)被提出用于處理非歐氏空間的數(shù)據(jù)。Wu 等[9]提出自適應(yīng)鄰接矩陣,通過節(jié)點(diǎn)嵌入學(xué)習(xí),利用GCN 和空洞卷積網(wǎng)絡(luò)學(xué)習(xí)時(shí)空車流量模型。Wu等[10]提出了一種GCN-LSTM 模型,該模型組合了GCN、LSTM和殘差網(wǎng)絡(luò)(Residual Network,ResNet)來捕獲交通流數(shù)據(jù)的時(shí)空特征。Li 等[11]提出的擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)(Diffusion Convolutional Recurrent Neural Network,DCRNN)利用擴(kuò)散圖卷積和門控循環(huán)單元(Gated Recurrent Unit,GRU)提取交通數(shù)據(jù)的時(shí)空相關(guān)性。Zhao 等[12]提出了時(shí)間圖卷積網(wǎng)絡(luò)(Temporal Graph Convolutional Network,T-GCN)用于提取交通流數(shù)據(jù)的時(shí)空相關(guān)性以預(yù)測交通流數(shù)據(jù)。Yu 等[13]提出的時(shí)空圖卷積網(wǎng)絡(luò)(Spatio-Temporal Graph Convolutional Network,STGCN)同樣利用GCN 提取交通數(shù)據(jù)的空間相關(guān)性,利用一維擴(kuò)張卷積提取交通數(shù)據(jù)的時(shí)間相關(guān)性。Guo等[14]提出了一種基于注意力的時(shí)空圖卷積網(wǎng)絡(luò)(Attention based Spatial-Temporal Graph Convolutional Network,ASTGCN)來解決交通預(yù)測問題,引入時(shí)間和空間注意力機(jī)制并采用GCN 和一維卷積提取時(shí)空相關(guān)性。Guo 等[15]提出一種基于注意力的時(shí)空圖神經(jīng)網(wǎng)絡(luò)(Attention based Spatial-Temporal Graph Neural Network,ASTGNN)模型并用于交通預(yù)測,引入自注意力機(jī)制來捕獲交通數(shù)據(jù)的時(shí)間相關(guān)性,并引入動態(tài)卷積模塊捕獲交通數(shù)據(jù)的空間相關(guān)性。
上述方法在交通預(yù)測中雖然綜合考慮了交通數(shù)據(jù)的時(shí)空相關(guān)性,同時(shí)也在單步預(yù)測中體現(xiàn)了良好的預(yù)測效果,但是大部分模型不能準(zhǔn)確體現(xiàn)未來交通數(shù)據(jù)的多步時(shí)序關(guān)系。此后,王博文等[16]提出基于CNN 與GRU 的交通流預(yù)測模型ED CNN-GRU(CNN and GRU model based on Encoder-Decoder),利用CNN 作為編碼器,GRU 作為解碼器,搭建模型對交通流數(shù)據(jù)進(jìn)行多步預(yù)測。汪鳴等[17]提出基于門控循環(huán)圖卷積網(wǎng)絡(luò)的交通流預(yù)測模型GR-GCN(Gated Recurrent Graph Convolutional Network),利用GRU 結(jié)合GCN 構(gòu)建時(shí)空組件對數(shù)據(jù)進(jìn)行時(shí)空特征提取,引入編碼解碼機(jī)制達(dá)到多步預(yù)測效果。編碼器-解碼器雖然很經(jīng)典,但是有很大的局限性,比如當(dāng)輸入長序列時(shí),由于編碼器的輸出僅為上下文變量C,C包含所有序列的特征信息,不難看出編碼器對序列的特征信息編碼不足會導(dǎo)致解碼效果大打折扣。
以上方法雖然考慮到了復(fù)雜的時(shí)空特征,模型也得到了很好的驗(yàn)證;但是,這些模型要么僅利用時(shí)空圖卷積網(wǎng)絡(luò)捕獲交通數(shù)據(jù)的時(shí)空特征,沒有對時(shí)空圖卷積網(wǎng)絡(luò)的有效性進(jìn)行校驗(yàn);要么僅在單步預(yù)測中體現(xiàn)出良好的預(yù)測性能,而在多步預(yù)測中的預(yù)測性能并不理想。綜合考慮以上方面,本文提出將GCN 與GRU 注入編碼解碼機(jī)制中,利用門控卷積對原始數(shù)據(jù)與時(shí)空特征數(shù)據(jù)進(jìn)行拼接篩選,最終將篩選的信息注入解碼器,以預(yù)測交通流序列,并構(gòu)建了基于門控卷積的時(shí)空交通流預(yù)測模型(Spatio-Temporal Traffic Flow Prediction Model based on Gated Convolution,GC-STTFPM)。本文主要工作如下:
1)通過編碼器-解碼器的引入成功解決了交通數(shù)據(jù)多步預(yù)測不佳的問題。
2)門控卷積的引入成功校驗(yàn)了GCN-GRU 對交通數(shù)據(jù)時(shí)空特征提取的有效性,并解決了解碼器解碼效果不佳的問題。
3)開展了同一模型在不同尺度下及不同模型在同一尺度下的對比實(shí)驗(yàn)。利用可視化結(jié)果圖表明,GC-STTFPM 在不同尺度下仍能保持良好的預(yù)測性能。
交通流預(yù)測是一個(gè)典型的對時(shí)間序列進(jìn)行預(yù)測的問題,即通過已知過去的交通流序列來預(yù)測將來的交通流序列。具體公式如下:
編碼器-解碼器(encoder-decoder)是一種很成功的機(jī)器翻譯模型,編碼器的作用是將一個(gè)長序列轉(zhuǎn)化成一個(gè)固定長度的背景變量,并在該背景變量中編碼輸入序列信息;解碼器的作用是將編碼后的序列進(jìn)行解碼輸出,編碼器-解碼器的結(jié)構(gòu)如圖1 所示。
圖1 編碼器-解碼器的結(jié)構(gòu)Fig.1 Structure of encoder-decoder
編碼器-解碼器有很強(qiáng)的變通性,編碼器可以采用GCN、RNN、LSTM 等;解碼器可以采用神經(jīng)網(wǎng)絡(luò)的任意組合,只需滿足如下關(guān)系式:
其中:p為編碼器的長度,q為解碼器的長度,兩者可以不相等。編碼器-解碼器結(jié)構(gòu)被廣泛用于多步序列預(yù)測,將歷史時(shí)間序列通過編碼器編碼為一個(gè)上下文變量C,然后將C通過解碼器輸出為預(yù)測的交通時(shí)間序列。本文采用GCN 與GRU 并結(jié)合門控卷積作為編碼器,提取交通序列的時(shí)空相關(guān)性;采用GRU 作為解碼器,對交通序列進(jìn)行預(yù)測輸出。
1.2.1 圖卷積網(wǎng)絡(luò)
圖卷積網(wǎng)絡(luò)(GCN)用于提取數(shù)據(jù)特征,相較于傳統(tǒng)的處理歐氏空間的數(shù)據(jù)的CNN,GCN 處理的是非歐氏空間的數(shù)據(jù)。交通路網(wǎng)相關(guān)數(shù)據(jù)具有復(fù)雜的非拓?fù)浣Y(jié)構(gòu),屬于非歐氏空間數(shù)據(jù),所以本文采用GCN 提取交通流的空間特征。
GCN 的核心思想是將鄰接矩陣與特征矩陣進(jìn)行傅里葉變換,將時(shí)域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù),時(shí)域的卷積操作轉(zhuǎn)換為頻域乘積,最終將鄰接矩陣與特征矩陣轉(zhuǎn)化為頻域數(shù)據(jù),在頻域內(nèi)對數(shù)據(jù)進(jìn)行相乘,最終完成時(shí)域上的卷積操作,將周邊節(jié)點(diǎn)的信息聚合到中心節(jié)點(diǎn)。
假設(shè)有一批圖形數(shù)據(jù),其中有N個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)對應(yīng)的節(jié)點(diǎn)特征構(gòu)成一個(gè)N×D維的特征矩陣X;節(jié)點(diǎn)之間的關(guān)系形成一個(gè)N×D維的鄰接矩陣A,A和X為模型的輸入矩陣。GCN 為神經(jīng)網(wǎng)絡(luò)層,具體傳播方式如下:
1.2.2 門控循環(huán)單元
門控循環(huán)單元(GRU)與LSTM 相似,是RNN 中的一種門控機(jī)制,兩者都會保存現(xiàn)有的內(nèi)容,并增加新的輸入數(shù)據(jù)。與LSTM 不同的是,GRU 不會保存內(nèi)部記憶,使用的參數(shù)更少,對大數(shù)據(jù)的訓(xùn)練速度也更快。GRU 主要解決了RNN 中的梯度消失和梯度爆炸問題,同時(shí)保留了序列的長期信息。GRU 引入了重置門和更新門,重置門決定了有多少過去的信息需要遺忘,更新門決定了有多少過去的信息傳遞到將來,以此控制信息的流動。本文采用GRU 捕獲交通數(shù)據(jù)的時(shí)間特征。GRU 的結(jié)構(gòu)如圖2 所示。
圖2 門控循環(huán)單元的結(jié)構(gòu)Fig.2 Structure of gated recurrent unit
各門控的計(jì)算公式如下:
其中:h為隱藏單元數(shù);Xt∈Rn×(d樣本數(shù)為n,輸入個(gè)數(shù)為d)為t時(shí)間步長的時(shí)間序列;Rt∈Rn×h為重置門;Ut∈Rn×h為更新門;Ht-1∈Rn×h為上一個(gè)時(shí)間步的輸出響應(yīng);W和b分別為權(quán)重矩陣和偏置矢量;σ為Sigmoid 激活函數(shù)。GRU 在每個(gè)時(shí)間步上都會生成一個(gè)隱藏狀態(tài)Ht∈Rn×h,它也被看作是每一個(gè)時(shí)間步的記憶狀態(tài),允許信息沿網(wǎng)絡(luò)流動而不會流失或爆炸。在每一個(gè)時(shí)間步中,當(dāng)前的隱藏狀態(tài)通過時(shí)間步迭代進(jìn)入到下一次時(shí)間循環(huán),從而將前面的有用信息依次向后傳遞。最終,經(jīng)過這些門控單元的學(xué)習(xí),就可以捕獲到交通數(shù)據(jù)的時(shí)間相關(guān)性。
1.2.3 門控卷積單元
上述方法利用時(shí)空圖卷積網(wǎng)絡(luò)提取了交通流數(shù)據(jù)的時(shí)空特征,但是考慮到時(shí)空圖神經(jīng)網(wǎng)絡(luò)單元作為編碼器存在著一些局限性,比如上文提到的對長序列特征編碼不足導(dǎo)致解碼效果不佳及時(shí)空特征數(shù)據(jù)的有效性不能校驗(yàn)的情況,本文采用兩種方法改進(jìn):1)縮短序列的輸入長度從根源上解決此問題;2)采用注意力機(jī)制的思路,對特征序列進(jìn)行權(quán)重分配間接解決此問題。對于交通流序列,縮短序列長度不現(xiàn)實(shí)。綜合考慮到這些因素,本文提出了一種門控卷積單元,對初始序列及特征序列進(jìn)行了拼接和篩選,從而對序列的有效性進(jìn)行校驗(yàn),并將校驗(yàn)后的特征序列作為GRU 狀態(tài)信息的輸入,保證了上下文關(guān)系的相關(guān)性,最終編碼器的輸出(即上下文變量C)包含每一時(shí)刻特征序列的權(quán)重信息,成功解決了編碼器對長序列特征編碼不足的問題。門控卷積單元的結(jié)構(gòu)如圖3 所示。
圖3 門控卷積單元的結(jié)果Fig.3 Structure of gated convolution unit
計(jì)算公式如下:
其中:εt為Xt和兩個(gè)向量的權(quán)重分配;Wn為門控卷積單元中的第n個(gè)卷積核即權(quán)重;Wo為融合各卷積結(jié)果的參數(shù)矩陣;σ表示Sigmoid 函數(shù),將值映射到[0,1]內(nèi)。
綜合考慮到交通流數(shù)據(jù)的時(shí)空相關(guān)性及多步預(yù)測性能,本文基于GCN、GRU、門控卷積單元及編碼器-解碼機(jī)制提出了一種基于門控卷積的時(shí)空交通流預(yù)測模型(GCSTTFPM)。具體的模型框架如圖4 所示。
圖4 基于門控卷積的時(shí)空交通流預(yù)測模型的框架Fig.4 Framework of spatial-temporal traffic flow prediction model based on gated convolution
圖4 中的門控卷積(GC)、GCN 和GRU 共同構(gòu)成了編碼器單元,簡稱門控圖卷積網(wǎng)絡(luò)(Gated Graph Convolutional Network,GGCN)。該網(wǎng)絡(luò)采用GCN 和GRU 對交通流數(shù)據(jù)進(jìn)行時(shí)空特征提取,然后對捕獲到的信息及原始信息進(jìn)行拼接并采用卷積門控單元對拼接后的信息進(jìn)行篩選,篩選后的信息作為前一時(shí)刻的狀態(tài)信息輸入到門控循環(huán)單元,再進(jìn)行下一時(shí)刻的特征提取,當(dāng)整個(gè)歷史序列輸入完成后,最后一時(shí)刻的信息輸入到上下文變量C,C表示輸入序列的語義概要而且聚集了經(jīng)過編碼所有時(shí)刻的交通信息。編碼計(jì)算過程如下:
其中:編碼器單元GGCN 接受交通時(shí)序數(shù)據(jù)輸入X以及上一時(shí)間步的隱藏狀態(tài)ht-1;輸出ht為第t時(shí)刻的隱藏狀態(tài)。
解碼器單元的解碼與編碼過程類型,由于它已經(jīng)采用圖卷積捕獲了交通數(shù)據(jù)的空間相關(guān)性,所以不再需要對數(shù)據(jù)進(jìn)行圖卷積操作,只需要采用GRU 作為解碼器即可。上下文變量C經(jīng)過解碼器后得到一個(gè)隱藏狀態(tài),然后通過一個(gè)前饋神經(jīng)網(wǎng)絡(luò)對交通信息進(jìn)行預(yù)測,得到預(yù)測信息。
解碼器的計(jì)算過程如下:
其中:C=ht;st為解碼器輸出的隱藏狀態(tài)。根據(jù)解碼器的隱藏狀態(tài)進(jìn)行連接計(jì)算,并通過前饋神經(jīng)網(wǎng)絡(luò)對交通信息的隱藏狀態(tài)進(jìn)行計(jì)算預(yù)測輸出Yt。
本文利用真實(shí)的數(shù)據(jù)集Los-loop 環(huán)路[12]驗(yàn)證模型的性能。該數(shù)據(jù)集由環(huán)路檢測器從洛杉磯高速公路實(shí)時(shí)采集(https://paperswithcode.com/dataset/metr-la)。本文在該數(shù)據(jù)集中選擇了207 個(gè)傳感器及它們的交通流數(shù)據(jù)。同時(shí),數(shù)據(jù)集中包括一個(gè)鄰接矩陣和一個(gè)特征矩陣:鄰接矩陣為207 個(gè)傳感器之間的關(guān)系;特征矩陣為是2012 年5 月1 日至5 月7日每一條道路的交通流數(shù)據(jù),采集交通速度的時(shí)間步長為5 min。該交通流數(shù)據(jù)集中共2 016 條數(shù)據(jù),可以更好地提取交通流的時(shí)空相關(guān)性進(jìn)行多步預(yù)測。實(shí)驗(yàn)中將數(shù)據(jù)集按8∶2 分為訓(xùn)練集、測試集。
本文將學(xué)習(xí)率設(shè)置為0.001,批大小設(shè)置為32,隱藏單元數(shù)設(shè)置為64,迭代次數(shù)設(shè)置為5 000。
為了更精確地判斷模型是否可靠,本文采用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)作為評估指標(biāo),具體公式如下:
實(shí)驗(yàn)選取的基準(zhǔn)對比模型如下:
歷史平均(History Average,HA)模型:直接利用平均值作為交通數(shù)據(jù)的預(yù)測結(jié)果。
支持向量回歸(SVR):將交通數(shù)據(jù)擬合成一條曲線,對下一時(shí)刻進(jìn)行預(yù)測。
差分整合移動平均自回歸(AutoRegressive Integrated Moving Average,ARIMA)模型:一種應(yīng)用廣泛的經(jīng)典預(yù)測模型。
GCN:針對復(fù)雜交通路網(wǎng)的非拓?fù)浣Y(jié)構(gòu),將時(shí)域數(shù)據(jù)卷積擴(kuò)展到頻域進(jìn)行乘積操作。
GRU:可以捕獲交通序列的長期依賴性。
T-GCN[12]:能有效提取交通數(shù)據(jù)的時(shí)空相關(guān)性,模型參數(shù)設(shè)置隱藏單元數(shù)為64,輸入時(shí)間步長為12。
DCRNN[11]:集成擴(kuò)散圖卷積與GRU 來提取交通數(shù)據(jù)的時(shí)空相關(guān)性,用于交通時(shí)序數(shù)據(jù)預(yù)測。
ASTGCN[14]:是一種改進(jìn)的時(shí)空圖卷積網(wǎng)絡(luò),引入時(shí)空注意力機(jī)制并利用一維卷積和GCN 捕獲時(shí)空相關(guān)性。
將測試集中的數(shù)據(jù)輸入訓(xùn)練好的GC-STTFPM 中,得到2012 年5 月7 日一天的預(yù)測結(jié)果。評價(jià)結(jié)果如表1 所示。可以看出,本文的GC-STTFPM 融合了時(shí)間序列特征和空間特征兩方面的預(yù)測優(yōu)勢,在5、15、30、60 min 這4 個(gè)尺度上都取得了最好或次優(yōu)的預(yù)測結(jié)果,充分說明了GC-STTFPM 的正確性、有效性和廣泛的適應(yīng)性。
表1 不同尺度下交通流預(yù)測的評價(jià)指標(biāo)Tab.1 Evaluation indicators of traffic flow prediction under different scales
由表1 可以看出,在未來一個(gè)或多個(gè)時(shí)間步內(nèi),對比現(xiàn)有的機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型,本文的GC-STTFPM 模在單步和多步預(yù)測方面都有著很好的擬合度,可以更有效地提取交通流數(shù)據(jù)的時(shí)空特征,本節(jié)將從3 方面對GC-STTFPM的通用性作出闡述:
1)在時(shí)間特征提取上表現(xiàn)優(yōu)異。本文采用了HA、SVR、ARIMA、GRU 時(shí)間序列預(yù)測模型與GC-STTFPM 進(jìn)行了對比。這些對比模型均能捕獲交通數(shù)據(jù)的時(shí)間相關(guān)性,就單步預(yù)測(5 min)而言,GC-STTFPM 相較于擬合度最好的GRU 模型和傳統(tǒng)機(jī)器學(xué)習(xí)模型SVR 的MAE 下降了2.5%、14.5%,RMSE下降了2.7%、15.5%,這是由于傳統(tǒng)機(jī)器學(xué)習(xí)模型只能處理一些簡單的時(shí)間序列,不能夠精確處理復(fù)雜度較高的交通序列。
2)在時(shí)空特征提取上表現(xiàn)優(yōu)異。本文采用T-GCN、ASTGCN、DCRNN 預(yù)測模型進(jìn)行對比,這些模型均可捕獲交通數(shù)據(jù)的時(shí)空相關(guān)性。就單步預(yù)測(5 min)而言,GCSTTFPM 相較于擬合度最好的T-GCN 模型,MAE 下降了3.1%,RMSE 下降了2.3%;相較于GCN、ASTGCN 和DCRNN模型,MAE 下降了42.1%、5.9% 和9.9%,RMSE 下降了36.0%、1.7%和5.8%,這是由于GCN 模型只能單純捕獲交通數(shù)據(jù)的空間相關(guān)性而忽略了交通數(shù)據(jù)的時(shí)間相關(guān)性。
3)在多步預(yù)測表現(xiàn)優(yōu)異。從表1 可以看出,本文的GCSTTFPM 相較于效果好的ASTGCN 模型在15、30、60 min 的MAE 分別下降了2.4%、9.8%和6.3%,RMSE 下降了1.2%、0.2% 和3.6%。但是相較于DCRNN 模型只在30 min 的RMSE 提升了1.3%,在其他時(shí)間尺度都有著良好的預(yù)測性能。這些數(shù)據(jù)驗(yàn)證了GC-STTFPM 不僅在捕獲交通數(shù)據(jù)的時(shí)空方面表現(xiàn)突出,還在多步預(yù)測中表現(xiàn)優(yōu)異。
任取一條道路某一天的預(yù)測數(shù)據(jù),將不同模型的預(yù)測結(jié)果和真實(shí)數(shù)據(jù)疊加顯示,如圖5 所示。從圖5 可以看出,GC-STTFPM 相比其他模型有著更好的預(yù)測性能。為了更直觀地觀測GC-STTFPM 的性能,本文選取了不同模型的局部細(xì)節(jié)(18:00 到00:00),如圖6 所示。從圖6 可以看到GC-STTFPM 相比其他的模型在極值處收斂較快,能夠更好地?cái)M合交通數(shù)據(jù)的真實(shí)值。
圖5 不同模型的預(yù)測效果對比Fig.5 Comparison of prediction results of different models
圖6 不同模型預(yù)測結(jié)果18:00到00:00局部細(xì)節(jié)圖Fig.6 Local details of prediction results of different models from 18:00 to 00:00
為驗(yàn)證模型在不同尺度下的預(yù)測性能,選取同一條路,進(jìn)行不同尺度預(yù)測,如圖7 所示。可以看出,GC-STTFPM 隨著時(shí)間步的增加,擬合度降低。這是由于隨著時(shí)間步的增加,當(dāng)前時(shí)刻與過去時(shí)刻信息的相關(guān)性在減少,從而出現(xiàn)到達(dá)峰底不能夠盡快收斂導(dǎo)致預(yù)測性能不佳的情況。選取GC-STTFPM 在峰值處的可視化預(yù)測的局部效果圖(15:00 到21:00),如圖8 所示,可以直觀地看到GC-STTFPM 在不同的尺度下均具有良好的預(yù)測性能。
圖7 不同尺度下的預(yù)測效果對比Fig.7 Comparison of prediction results under different scales
圖8 GC-STTFPM預(yù)測結(jié)果15:00至21:00局部細(xì)節(jié)圖Fig.8 Local details of prediction results of GC-STTFPM from 15:00 to 21:00
本文針對現(xiàn)有交通流預(yù)測方法在特征提取及預(yù)測精度方面的不足,提出了一種基于門控卷積的時(shí)空交通流預(yù)測模型(GC-STTFPM)。通過實(shí)驗(yàn)對比現(xiàn)有的基準(zhǔn)模型,本文提出的GC-STTFPM 不僅在捕獲交通數(shù)據(jù)的時(shí)空特征上表現(xiàn)優(yōu)異,在多步預(yù)測中的精度也顯著提升。下一步將利用Transformer 捕獲交通數(shù)據(jù)的時(shí)空特征;此外,綜合考慮天氣、節(jié)假日等因素也是今后的研究重點(diǎn)。