包銀鑫,曹 陽,2,施 佺,2*
(1.南通大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇南通 226019;2.南通大學(xué)交通與土木工程學(xué)院,江蘇南通 226019)
隨著我國城市化進(jìn)程的加快,交通基礎(chǔ)設(shè)施得到極大的改善。然而,汽車數(shù)量的日益增長,導(dǎo)致城市交通擁堵問題越發(fā)嚴(yán)重。實時準(zhǔn)確地獲取城市交通流信息,對出行者和交通管理部門具有重要意義[1]。近些年來,研究人員嘗試了多種方法來提高交通流的預(yù)測精度。這些方法大體分為兩類:模型驅(qū)動方法和數(shù)據(jù)驅(qū)動方法[2-3]。
模型驅(qū)動方法也稱為參數(shù)方法,該方法根據(jù)數(shù)學(xué)理論假設(shè)預(yù)先確定模型,用少量數(shù)據(jù)去擬合模型,實現(xiàn)交通流預(yù)測目的。這種方法存在模型結(jié)構(gòu)固化、假設(shè)情況與實際交通狀態(tài)不符等問題,導(dǎo)致預(yù)測模型在實際應(yīng)用中預(yù)測精度不高。常用的有時間序列模型[4]、卡爾曼濾波模型[5]等。與模型驅(qū)動方法不同,數(shù)據(jù)驅(qū)動方法可以很好反映交通數(shù)據(jù)的不確定性,數(shù)據(jù)驅(qū)動方法分為傳統(tǒng)機器學(xué)習(xí)方法和基于深度學(xué)習(xí)的方法。傳統(tǒng)機器學(xué)習(xí)方法中的支持向量機(Support Vector Machine,SVM)[6]、貝葉斯模型[7]、K最近鄰(K-Nearest Neighbor,KNN)[8]等都被用于交通流預(yù)測。盡管傳統(tǒng)機器學(xué)習(xí)相比模型驅(qū)動方法可以從交通數(shù)據(jù)中學(xué)習(xí)統(tǒng)計規(guī)律,但處理高維度復(fù)雜數(shù)據(jù)時預(yù)測精度會大打折扣[9]。
隨著深度學(xué)習(xí)的興起,具有高維數(shù)據(jù)處理和非線性數(shù)據(jù)特征挖掘能力的深度神經(jīng)網(wǎng)絡(luò)模型受到越來越多研究人員的青睞。Lv 等[10]在實驗中證明了基于深度學(xué)習(xí)架構(gòu)的神經(jīng)網(wǎng)絡(luò)對高維數(shù)據(jù)的處理能力。Polson 等[11]證明深度神經(jīng)網(wǎng)絡(luò)比單隱藏層的神經(jīng)網(wǎng)絡(luò)更能捕捉交通狀態(tài)的非線性。此外,深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)[12]、時滯神經(jīng)網(wǎng)絡(luò)(Time Delay Neural Network,TDNN)[13]也被用于交通流預(yù)測。城市路網(wǎng)每一個區(qū)域的交通流會受到相鄰區(qū)域和上一個時間段的交通流影響,上述模型每次只能提取部分區(qū)域的交通流信息,僅依靠部分區(qū)域的信息來預(yù)測交通流遠(yuǎn)遠(yuǎn)不夠。
計算機視覺和圖像識別領(lǐng)域的發(fā)展,推動了深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)可以通過卷積算子實現(xiàn)對圖像空間特征的捕獲[14],這一特性啟發(fā)研究人員考慮使用卷積算子挖掘交通流的空間特性,Ma 等[15]將交通網(wǎng)絡(luò)利用灰度算子轉(zhuǎn)化為灰度圖像,將圖像轉(zhuǎn)化為二維時空矩陣來預(yù)測交通速度,該模型雖有效捕獲了交通流空間特征,但忽視了交通流的時間特性。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)被廣泛用于處理交通流時間特性,王祥雪等[16]使用RNN 對交通流情況進(jìn)行預(yù)測,但RNN 容易受到梯度消失的影響,難以捕獲長期時間特性。因此,RNN 的改進(jìn)模型長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)[17]和門控遞歸單元(Gated Recurrent Unit,GRU)網(wǎng)絡(luò)[18]常被用于交通流預(yù)測。RNN 及RNN 改進(jìn)模型有效捕獲了交通流的時間特性,但無法捕獲交通流的空間特性。為充分挖掘交通流的時間和空間特性,考慮交通流時間和空間信息的時空混合模型ConvLSTM(Convolutional LSTM)[19]被提出來,相較于僅考慮單一特性的預(yù)測模型提高了交通流的預(yù)測精度。由于混合模型結(jié)構(gòu)的復(fù)雜性,模型的訓(xùn)練會隨著網(wǎng)絡(luò)層數(shù)的增加而變得困難,He 等[20]針對網(wǎng)絡(luò)深度增加而模型訓(xùn)練精度下降的問題,在深度網(wǎng)絡(luò)結(jié)構(gòu)中引入殘差單元提高模型的訓(xùn)練精度。Zhang 等[21]在交通流預(yù)測中引入時空殘差網(wǎng)絡(luò)(Spatio-Temporal Residual Network,ST-ResNet),該方法將城市劃分為時空柵格矩陣,利用卷積操作和殘差搭建ST-ResNet 模型,提高模型的時空間依賴性。Guo 等[22]在ST-ResNet 網(wǎng)絡(luò)的基礎(chǔ)上引入兩種時間模式,提高了模型對時空特性的自動捕獲能力。Guo 等[23]在兩種時間模式的基礎(chǔ)上,引入天氣、節(jié)假日等外部因素,實現(xiàn)了交通流動態(tài)特征的捕獲。趙建立等[24]和Zheng 等[25]分別通過改進(jìn)殘差網(wǎng)絡(luò)的模型結(jié)構(gòu),實現(xiàn)了交通流預(yù)測效果的提升。
如何有效挖掘交通流的時間和空間相關(guān)性是交通流的重點研究方向之一。為了充分挖掘交通流的時間相關(guān)性和空間相關(guān)性,針對傳統(tǒng)時空殘差模型缺乏對交通流數(shù)據(jù)進(jìn)行相關(guān)性分析、捕獲微小變化容易忽略長期時間特征等問題,本文提出一種基于改進(jìn)時空殘差卷積神經(jīng)網(wǎng)絡(luò)的城市路網(wǎng)短時交通流預(yù)測方法,實現(xiàn)對周期序列和鄰近序列長期時間特征的捕獲,從而降低訓(xùn)練誤差,提高城市路網(wǎng)短時交通流預(yù)測的精度。
城市路網(wǎng)交通流預(yù)測是一個典型的時空序列預(yù)測問題,如圖1 所示,將城市路網(wǎng)轉(zhuǎn)化成I×J的交通柵格網(wǎng)絡(luò),每一個柵格代表一個區(qū)域的交通狀態(tài),這種狀態(tài)可以表示當(dāng)前區(qū)域的車流量或者擁擠情況,將柵格網(wǎng)絡(luò)記作X={xi,j}。將處理后的車輛定位數(shù)據(jù)按照固定時間間隔統(tǒng)計到每個柵格中,對于每一個位置(i,j)∈R 表示在時間間隔ΔT時,位置(i,j)中的交通狀態(tài),將所有I×J位置的觀測值都表示成張量Xt∈RI×J。因此,城市網(wǎng)絡(luò)的交通流預(yù)測問題可以轉(zhuǎn)化為交通柵格數(shù)據(jù)預(yù)測問題,給定歷史交通柵格數(shù)據(jù){Xt|t=0,1,2,…,k},目標(biāo)是預(yù)測時間間隔k+1 時刻的交通柵格數(shù)據(jù)Xt+Δk,其中t是給定的最后一條歷史數(shù)據(jù),Δk是所要預(yù)測的時間節(jié)點和給定的最后一條歷史數(shù)據(jù)所在時間節(jié)點的時間差。
圖1 交通柵格數(shù)據(jù)轉(zhuǎn)化Fig.1 Traffic grid data transformation
城市路網(wǎng)交通流不僅受到相鄰時間段交通流的影響,還受到鄰接路口的影響,因此城市路網(wǎng)交通流波動具有一定的時間和空間相關(guān)性。為了充分挖掘城市路網(wǎng)的時空相關(guān)性,本文以傳統(tǒng)的時空殘差模型作為改進(jìn)時空殘差卷積模型的基本框架。傳統(tǒng)時空殘差模型主要是由2D 卷積和殘差單元構(gòu)成,其基本結(jié)構(gòu)如圖2 所示。利用2D 卷積挖掘路網(wǎng)的空間特征,將2D 卷積與殘差單元結(jié)合挖掘路網(wǎng)的時間特征,得到時空殘差輸出Xt,最后通過激活函數(shù)得到最終預(yù)測值。
圖2 傳統(tǒng)時空殘差模型結(jié)構(gòu)Fig.2 Structure of traditional spatio-temporal residual model
交通柵格數(shù)據(jù)中每個網(wǎng)格的數(shù)據(jù)都受到鄰近網(wǎng)格的影響,不同網(wǎng)格之間具有復(fù)雜的空間相關(guān)性。使用2D 卷積對空間特征進(jìn)行挖掘,卷積操作來源于圖像處理中的CNN,對圖像做卷積操作的目的在于從簡單特征中提取復(fù)雜特征。將交通柵格數(shù)據(jù)看作一張二維圖片,對其進(jìn)行卷積操作可以挖掘局部空間特征。其中,2D 卷積特指對二維矩陣進(jìn)行卷積操作,一般將公式定義為:
其中:Xl-1為第l層卷積層的輸入,Wl為第l層卷積層的卷積核參數(shù),Xl為第l層卷積層的輸出,bl為第l層卷積層的偏置項,L為總共需要卷積的層數(shù)。圖3 為2D 卷積示意圖,低層特征維度為4× 4,卷積核維度為3× 3,移動步長設(shè)置為1,最后輸出維度為2× 2。
圖3 2D卷積示意圖Fig.3 Schematic diagram of 2D convolution
堆疊多個2D 卷積可以實現(xiàn)對路網(wǎng)空間特征和時間特征的提取,但隨著卷積層深度的增加,模型的訓(xùn)練和精度都會隨之下降[21],因此引入殘差單元來提高模型的訓(xùn)練精度。殘差單元主要用來突出微小的變化,與2D 卷積結(jié)合可以更好地發(fā)現(xiàn)時間特征,殘差模塊結(jié)構(gòu)如圖4 所示,殘差單元公式定義為:
圖4 殘差模塊結(jié)構(gòu)Fig.4 Structure of residual module
其中:Zl-1為第l層殘差單元的輸入,Zl為第l層殘差單元的輸出,θl為第l層殘差單元中所有可學(xué)習(xí)的參數(shù)集合,F(xiàn)為殘差映射,L為總共需要殘差操作的層數(shù)。
針對傳統(tǒng)時空殘差模型處理城市路網(wǎng)交通流時缺乏對交通流數(shù)據(jù)進(jìn)行相關(guān)性分析、捕獲微小變化容易忽略長期時間特征等問題,提出改進(jìn)時空殘差卷積神經(jīng)網(wǎng)絡(luò)。首先,對時間序列引入皮爾遜相關(guān)系數(shù)的分析,確定相關(guān)性高的周期序列和鄰近序列;同時,建立周期序列模型和鄰近序列模型,引入LSTM 網(wǎng)絡(luò)作為混合模型提取時間特征,捕獲周期序列和鄰近序列的長期時間特征;最后,輸出加權(quán)融合為Xf,通過激活函數(shù)得到模型預(yù)測值,其改進(jìn)時空殘差卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖5 所示。
圖5 改進(jìn)時空殘差卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Structure of improved spatio-temporal residual convolutional neural network
已知一組交通柵格數(shù)據(jù)序列{Xt|t=0,1,2,…,k},k是最后一個時間節(jié)點。采用皮爾遜相關(guān)系數(shù)對交通柵格數(shù)據(jù)進(jìn)行周期序列和鄰近序列的相關(guān)性分析,規(guī)定周期序列與預(yù)測節(jié)點Xt的間隔大于1 d,鄰近序列與預(yù)測節(jié)點Xt的間隔小于等于1 d。皮爾遜相關(guān)系數(shù)公式為:
其中:xi為目標(biāo)交通柵格數(shù)據(jù),yi為待比較的交通柵格數(shù)據(jù),σx為目標(biāo)交通柵格數(shù)據(jù)的樣本總體標(biāo)準(zhǔn)差,σy為待比較交通柵格數(shù)據(jù)的樣本總體標(biāo)準(zhǔn)差。根據(jù)皮爾遜相關(guān)系數(shù)可以將原始交通柵格數(shù)據(jù)序列劃分成周期序列輸入Xt-w={Xt-w+1,Xt-w+2,…,Xt-w},鄰近序 列輸入Xt-c={Xt-c+1,Xt-c+2,…,Xt-c}。
為了避免殘差網(wǎng)絡(luò)操作后丟失交通柵格數(shù)據(jù)長期特征,在周期序列模型和鄰近序列模型中引入LSTM 網(wǎng)絡(luò),LSTM 可以解決RNN 對長期信息依賴的缺失,避免梯度消失和梯度爆炸現(xiàn)象。LSTM 網(wǎng)絡(luò)結(jié)構(gòu)如圖6 所示,通過遺忘門、輸入門和輸出門實現(xiàn)對數(shù)據(jù)的輸出。其中,遺忘門決定從前邊時間狀態(tài)中丟棄多少信息。輸入門決定采取多少新信息輸入當(dāng)前時間狀態(tài)。輸出門決定輸出的值。LSTM隱藏單元計算公式為:
圖6 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Structure of LSTM network
其中:x(t)為當(dāng)前時刻的輸入,h(t)為當(dāng)前時刻的單元輸出,h(t-1)為上一時刻的單元輸出,s(t)為當(dāng)前時刻的單元狀態(tài),s(t-1)為上一時刻的單元狀態(tài),g(t)為用于描述當(dāng)前輸入的單元狀態(tài),f(t)為遺忘門,i(t)為輸入門,o(t)為輸出門,Wix、Wfx、Wox、Wgx分別為三個門和單元狀態(tài)的輸入層權(quán)重,Wih、Wfh、Woh、Wgh分別為三個門和單元狀態(tài)的隱藏層權(quán)重,bi、bf、bo、bg分別為三個門和單元狀態(tài)的偏置項,σ為Sigmoid激活函 數(shù),σ(x)=1/(1+e-x),“*”為哈達(dá)瑪積(Hadamard product)。
由于交通流具有明顯的周期性,如圖7 所示,隨著季節(jié)的變化,交通流也會呈現(xiàn)出某種趨勢變化。為解決上述問題,建立周期序列模型,周期序列模型由兩個組件構(gòu)成,包括2D 卷積和混合模型LSTM,用來學(xué)習(xí)交通流的周期性特征和趨勢,將周期序列模型2D 卷積操作定義為:
圖7 交通流周期性變化Fig.7 Periodic changes in traffic flow
其中:為周期序列模型第l層卷積層的周期序列輸入,為周期序列模型第l層卷積層的卷積核參數(shù),為周期序列模型第l層卷積層的周期序列輸出,為周期序列模型第l層卷積層的偏置項,Lw為周期序列模型總共需要卷積的層數(shù)。
將經(jīng)過多層2D 卷積操作的輸出,輸入混合模型LSTM提取長期時間特征,操作定義為:
其中:Xw為周期序列模型的最終輸出,LSTMw為周期序列模型的LSTM 操作。
交通流在時間相關(guān)性上受到周期性和鄰近性的影響,并且鄰近性的影響一般更為明顯,比如在某個路口發(fā)生堵塞,那這個堵塞勢必會對一段時間后的交通流產(chǎn)生影響。為解決上述問題,引入鄰近序列模型,鄰近序列模型由三個組件構(gòu)成,包括2D 卷積、殘差單元和混合模型LSTM,用來學(xué)習(xí)交通流的鄰近性特征,鄰近序列模型的2D 卷積操作定義為:
其中:為鄰近序列模型第l層卷積層的輸入,為鄰近序列模型第l層卷積層的卷積核參數(shù)為鄰近序列模型第l層卷積層的輸出為鄰近序列模型第l層卷積層的偏置項,Lc為鄰近序列模型總共需要卷積的層數(shù)。
鄰近序列經(jīng)過2D 卷積操作后,輸入到殘差單元,殘差單元操作為:
其中:為鄰近序列模型第l層殘差單元的輸入,為鄰近序列模型第l層殘差單元的輸出,為鄰近序列模型第l層殘差單元中所有可學(xué)習(xí)的參數(shù)集合,F(xiàn)為鄰近序列模型的殘差映射,Lrc為鄰近序列模型總共需要進(jìn)行殘差操作的層數(shù)。
為了提高對長期特征的捕獲能力,鄰近序列經(jīng)過殘差單元輸出后,輸入到混合模型LSTM 提取長期時間特征,操作定義為:
其中:Xc為鄰近序列模型最終的輸出,LSTMc為鄰近序列模型的LSTM 操作。
周期序列模型和鄰近序列模型的輸出分別為Xw和Xc,兩種模式在城市交通流中分別具有一定權(quán)重,兩種模式的權(quán)重會隨著交通環(huán)境的變化而具有不同的比重。在某些環(huán)境中,周期序列模型所占的比重較大;而在其他環(huán)境中,鄰近序列模型所占的比重較大,因此,將兩種輸出進(jìn)行加權(quán)融合。從歷史數(shù)據(jù)中學(xué)習(xí)權(quán)重值,權(quán)重融合后連接激活函數(shù)進(jìn)行輸出:
其中:Ww和Wc分別代表周期序列模型和鄰近序列模型所占比重,f為激活函數(shù),設(shè)置激活函數(shù)為Sigmoid 函數(shù)。
4.1.1 數(shù)據(jù)來源
數(shù)據(jù)來源于2014 年8 月3 日到2014 年8 月30 日的成都市出租車經(jīng)緯度數(shù)據(jù),數(shù)據(jù)全部采集于真實道路,數(shù)據(jù)獲取于百度網(wǎng)盤[26]。該實驗數(shù)據(jù)記錄了成都市早上6 點到晚上12 點的出租車運行情況。以成都市繞城公路為邊界將成都市城市路網(wǎng)轉(zhuǎn)化為交通柵格網(wǎng)絡(luò),進(jìn)行數(shù)據(jù)預(yù)處理后,將數(shù)據(jù)映射到柵格網(wǎng)絡(luò)中,以5 min 為采樣間隔,共計生成6 048個交通柵格數(shù)據(jù)記錄,每條記錄代表一個時刻的城市路網(wǎng)擁擠狀態(tài),一天共有216 個交通柵格數(shù)據(jù),共計28 d。在本文中,每個網(wǎng)格狀態(tài)代表當(dāng)前區(qū)域的擁擠程度,將當(dāng)前網(wǎng)絡(luò)中出租車的數(shù)量作為擁擠程度的度量。將柵格網(wǎng)絡(luò)劃分為24×24 維度以直觀分析區(qū)域擁擠情況,具體參數(shù)如表1。實驗中將前三周的數(shù)據(jù)作為訓(xùn)練集,最后一周的數(shù)據(jù)作為測試集。原始數(shù)據(jù)映射到交通柵格網(wǎng)絡(luò)的判別函數(shù)如下:
表1 數(shù)據(jù)集參數(shù)Tab.1 Dataset parameters
其中:Min(lon(xi,j))代表交通柵格網(wǎng)絡(luò)xi,j位置的經(jīng)度最小值;Max(lon(xi,j))代表交通柵格網(wǎng)絡(luò)xi,j位置的經(jīng)度最大值;Dlon(n)代表原始數(shù)據(jù)的經(jīng)度;Min(lat(xi,j))代表交通柵格數(shù)據(jù)網(wǎng)絡(luò)xi,j位置的緯度最小值;Max(lat(xi,j))代表交通柵格數(shù)據(jù)網(wǎng)絡(luò)xi,j位置的緯度最大值;Dlat(n)代表原始數(shù)據(jù)的緯度。式(16)用來判別第n條記錄的原始數(shù)據(jù)記錄的車輛定位是否在xi,j網(wǎng)格中。
4.1.2 相關(guān)性分析
交通柵格數(shù)據(jù)生成后,以柵格數(shù)據(jù)x7,3為例,利用式(3)對其進(jìn)行相關(guān)性分析,得到相關(guān)性曲線如圖8 所示,圖8(a)中得到與預(yù)測時間節(jié)點相鄰14 天的相關(guān)性變化趨勢,其中相鄰一天的相關(guān)性最高,因此將相鄰一天的交通柵格數(shù)據(jù)作為周期序列模型的輸入。圖8(b)中得到與預(yù)測時間節(jié)點相鄰一天內(nèi)的相關(guān)性變化情況,與其相鄰的時間節(jié)點相關(guān)性較高,因此將相鄰的3 個時間間隔作為鄰近序列模型的輸入。
圖8 交通柵格數(shù)據(jù)的相關(guān)性分析Fig.8 Correlation analysis of traffic grid data
4.1.3 評價指標(biāo)
使用均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)來測試模型訓(xùn)練效果,兩者公式為:
其中:yi為交通流數(shù)據(jù)真實值,為模型預(yù)測的交通流數(shù)據(jù),m為樣本數(shù)量。
實驗基于深度學(xué)習(xí)框架Pytorch-GPU 開發(fā),使用Adam 優(yōu)化器對模型進(jìn)行優(yōu)化,設(shè)置訓(xùn)練步長為0.000 01,BATCH_SIZE為每次訓(xùn)練樣本數(shù),設(shè)置為20,迭代次數(shù)設(shè)置為800,模型結(jié)構(gòu)其他參數(shù)如表2 所示。
表2 改進(jìn)時空殘差卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù)Tab.2 Structural parameters of improved spatio-temporal residual convolutional neural network model
4.3.1 預(yù)測結(jié)果可視化
模型參數(shù)設(shè)置完成后,利用訓(xùn)練集對模型進(jìn)行訓(xùn)練,將數(shù)據(jù)輸入模型前,需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,降低不同量綱的影響,采用式(19)進(jìn)行計算:
其中:xreal為交通柵格數(shù)據(jù)中一個時間段數(shù)據(jù),μ(X)為交通柵格全體數(shù)據(jù)的平均值,σ(X)為交通柵格總體數(shù)據(jù)的標(biāo)準(zhǔn)差。
將標(biāo)準(zhǔn)化后的數(shù)據(jù)輸入模型進(jìn)行訓(xùn)練,利用測試集對模型進(jìn)行訓(xùn)練,圖9 展示了柵格網(wǎng)絡(luò)x7,3在2014 年8 月26 日中的交通流真實值和預(yù)測值對比,可以看到,該模型能較好地挖掘交通流的時間特性。圖10(a)展示了成都市在某一時刻的整體車流量情況,圖10(b)為預(yù)測出的交通柵格圖,模型能較好地挖掘城市網(wǎng)絡(luò)的空間特性。
圖9 2014年8月26日x7,3 路口車流量真實值與預(yù)測值對比Fig.9 Comparison of real and predicted traffic flow values at intersection x7,3 on August 26,2014
圖10 城市路網(wǎng)車流量真實值與預(yù)測值Fig.10 Real value and predicted value of traffic flow in urban road network
4.3.2 性能對比
為驗證模型的優(yōu)越性,選取LSTM、CNN、ST-ResNet 作為基準(zhǔn)模型進(jìn)行模型對比。每個基準(zhǔn)模型參數(shù)設(shè)置都與本文模型參數(shù)設(shè)置對標(biāo)。為了測試每個模型的性能,使用基準(zhǔn)模型和本文改進(jìn)的模型對路網(wǎng)的數(shù)據(jù)進(jìn)行預(yù)測,使用測試集7 d 的路網(wǎng)數(shù)據(jù)作為模型輸入,利用均方根誤差(RMSE)和平均絕對誤差(MAE)比較模型輸出結(jié)果,得到模型平均測試結(jié)果如表3 所示。
表3 模型性能比較結(jié)果Tab.3 Model performance comparison results
根據(jù)表3 實驗結(jié)果發(fā)現(xiàn),本文模型綜合預(yù)測性能最優(yōu);LSTM 是基于時間序列的預(yù)測模型,對于交通流時空特性中的空間特性捕獲能力較弱;CNN 作為傳統(tǒng)的挖掘空間特性的預(yù)測模型,難以捕捉交通流中的時間特性;傳統(tǒng)殘差模型在處理城市路網(wǎng)交通流時,沒有對時間序列進(jìn)行篩選,容易捕獲相關(guān)度低的時間序列,并且殘差方法在捕獲變化微小特征時,容易忽略長期時間特征等問題。
圖11 給出了不同模型對測試集中一天路口交通流數(shù)據(jù)的擬合情況。
圖11 模型預(yù)測數(shù)據(jù)擬合對比Fig.11 Comparison of model prediction data fitting
圖12 為傳統(tǒng)殘差模型和本文模型針對城市路網(wǎng)的預(yù)測對比圖,可以發(fā)現(xiàn)傳統(tǒng)的時空殘差模型在面對復(fù)雜交通網(wǎng)絡(luò)時,可以較好地捕捉空間特征,但是時間特征捕獲能力相對較差。
圖12 本文模型與傳統(tǒng)殘差模型預(yù)測效果對比Fig.12 Prediction effect comparison between the proposed model and traditional residual model
圖13 給出了改進(jìn)時空殘差卷積模型測試集7 d 的RMSE和MAE 比較結(jié)果。綜合實驗結(jié)果可知,本文模型在預(yù)測城市路網(wǎng)數(shù)據(jù)中相比其他模型具有較高的準(zhǔn)確性。
圖13 測試集上RMSE和MAE比較結(jié)果Fig.13 RMSE and MAE comparison results on test set
針對城市路網(wǎng)交通流預(yù)測受到時空相關(guān)性的影響問題,本文提出一種基于改進(jìn)時空殘差卷積神經(jīng)網(wǎng)絡(luò)的城市路網(wǎng)短時交通流預(yù)測模型,對交通柵格數(shù)據(jù)進(jìn)行皮爾遜相關(guān)系數(shù)分析,確定相關(guān)性高的周期序列和鄰近序列,提高了模型輸入數(shù)據(jù)的關(guān)聯(lián)性;建立周期序列模型和鄰近序列模型分別對兩種序列數(shù)據(jù)進(jìn)行處理,引入LSTM 神經(jīng)網(wǎng)絡(luò)作為混合模型提取時間特征,實現(xiàn)了對周期性和鄰近性的長期時間特征的捕獲。采用成都市出租車數(shù)據(jù)驗證模型預(yù)測效果,結(jié)果顯示該模型預(yù)測精度優(yōu)于其他基準(zhǔn)模型,表明考慮交通流相關(guān)性的時空混合模型對城市路網(wǎng)交通流預(yù)測是一個較好的嘗試。下一步將重點對模型結(jié)構(gòu)固化問題進(jìn)行研究,使模型在復(fù)雜城市路網(wǎng)下具有較強的適應(yīng)能力。