王婧娟,陳慶奎
1(上海立信會計(jì)金融學(xué)院 信息管理學(xué)院,上海 201209)2(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
因?yàn)榻煌〒矶碌痊F(xiàn)象易引起交通事故,不利于交通安全,因此治理交通擁堵問題刻不容緩[1].交通流量是辨別交通擁堵因素之一.精確的交通流量預(yù)測能為交通參與者提供參考.人們可根據(jù)交通流預(yù)測信息提前規(guī)劃出行計(jì)劃,避開擁堵路段,縮減出行時間.精確的交通流量預(yù)測也作為交通安全的一部分[2].
交通流量會隨著時間和空間的變化而變化,交通流具有以下顯著特征:
1)隨機(jī)性.因?yàn)榈缆飞系母鞣N車輛隨機(jī)決定路徑另有外界環(huán)境的種種因素的影響和干擾,呈現(xiàn)出劇烈的隨機(jī)特征.
2)周期性.一周有7天,包含5天工作日和2天周末,人們的駕駛外出也展現(xiàn)出規(guī)律性.對于交通流量,相同路段的交通流量表現(xiàn)出周期性的通暢、擁擠等現(xiàn)象,并且相同路段每隔一段時間,交通流狀態(tài)呈現(xiàn)出重復(fù)性.
3)時空特性.下一時刻的交通流受之前交通流的影響,即歷史交通流量對現(xiàn)在和將來的交通流量有影響,且鄰近路段的交通流間也會相互影響[3].
4)網(wǎng)狀特性.道路間縱橫交錯,比如城市的關(guān)鍵交通樞紐靠主干道彼此連接,其它小路段利用輔助交通路線連接至主干道,而駕駛?cè)艘勒崭髯缘某鲂薪?jīng)驗(yàn)或使用不同的導(dǎo)航系統(tǒng)選取不同的駕駛路徑,致使整個路網(wǎng)像一個錯綜復(fù)雜的網(wǎng)絡(luò).
綜上所述,交通網(wǎng)絡(luò)受各類因素影響,不同時段、不同道路的交通流間相互關(guān)聯(lián)、彼此作用,且顯示出不確定性和復(fù)雜性,難以準(zhǔn)確預(yù)測交通流量.交通預(yù)測不單能為交通管理員提早覺察交通狀態(tài),且能為本文提供較合理的路線、提升交通效率.但是因?yàn)槠鋸?fù)雜的時間和空間依賴性,使得交通流預(yù)測成為一項(xiàng)難題.
針對交通流量的空間相關(guān)性和時間依賴性的特征,本文提出了基于時空周期性注意力網(wǎng)絡(luò)的交通流量預(yù)測模型(STPAN).首先,使用GCN構(gòu)造空間相關(guān)性.其次,綜合考慮短期和長期的周期性信息對流量進(jìn)行預(yù)測,并采用LSTM獲取時序依賴關(guān)系.因?yàn)闀r間周期性非真正意義上的周期,因此文本利用周期性注意力機(jī)制來解決此問題.此外,還將天氣等外部因素增添到模型中,以提升模型的預(yù)測精度.最后在PeMS數(shù)據(jù)集上驗(yàn)證了所提出的模型的有效性.
深度學(xué)習(xí)模型能學(xué)習(xí)到更復(fù)雜的特征,可以有效解決一些難題.現(xiàn)在深度神經(jīng)網(wǎng)絡(luò)在各個行業(yè)各個領(lǐng)域均被廣泛使用.目前大量研究人員將深度學(xué)習(xí)模型引入到交通預(yù)測問題中.
文獻(xiàn)[4]構(gòu)造了基于數(shù)據(jù)驅(qū)動的城市路網(wǎng)短期交通流預(yù)測模型.該模型先將時間序列劃分為趨勢序列和殘差序列.對這兩個時間序列重構(gòu)后,進(jìn)行了基于LSTM-RNN的模型訓(xùn)練和預(yù)測.然后,將這兩個結(jié)果組合在一起,產(chǎn)生最后的預(yù)測.最后用兩個城市道路網(wǎng)對模型進(jìn)行評價.結(jié)果顯示,數(shù)據(jù)處理模塊增強(qiáng)了模型的魯棒性.但LSTM和RNN存在梯度彌散和梯度爆炸問題.
文獻(xiàn)[5]提出了基于DNN的交通預(yù)測模型(DNN-BTF),該模型運(yùn)用交通流的周期性和時空特性以及注意力機(jī)制,可以自動學(xué)習(xí)歷史交通流量的重要特征.使用CNN模型提取交通流的空間特征,使用RNN提取交通流的時間特征.雖然CNN可以有效的提取網(wǎng)格數(shù)據(jù)的空間特征,但不適合圖結(jié)構(gòu)的時空數(shù)據(jù)的特征描述和時空相關(guān)性分析.
文獻(xiàn)[6]提出了基于圖像的交通速度預(yù)測模型,可以自動學(xué)習(xí)抽象的時空交通特征來提取時空關(guān)系.此方法分為兩大步驟:1)將路網(wǎng)流量變換成圖像,此圖像將交通網(wǎng)絡(luò)的時間和空間維度分別作為圖像的兩個維度.因?yàn)橄噜徛范卧趫D像中也是鄰近的,因此能夠保存時空信息;2)使用基于CNN的深度網(wǎng)絡(luò)模型對此圖像進(jìn)行交通預(yù)測.但CNN無法直接處理路網(wǎng)結(jié)構(gòu).
文獻(xiàn)[7]提出了基于誤差反饋遞歸卷積神經(jīng)網(wǎng)絡(luò)(eRCNN)進(jìn)行車速預(yù)測.將相鄰道路的時空車速視為輸入矩陣,eRCNN運(yùn)用相鄰路段間的隱含相關(guān)性來提升模型的預(yù)測精度.最后對北京市二三環(huán)出租車的真實(shí)數(shù)據(jù)進(jìn)行大量實(shí)驗(yàn),驗(yàn)證了eRCNN模型的優(yōu)秀的預(yù)測能力,但模型并沒有考慮道路的交通流方向.
文獻(xiàn)[8]使用GCN與GRU組合模型用于高速公路和出租車數(shù)據(jù)集進(jìn)行車速的預(yù)測,且加入噪聲驗(yàn)證模型的魯棒性,結(jié)果顯示此模型達(dá)到較好的性能.但此模型未考慮到路網(wǎng)內(nèi)交通流之間的特性.
文獻(xiàn)[9]根據(jù)最小二乘支持向量機(jī)提出了一種改進(jìn)型的灰狼優(yōu)化算法進(jìn)行交通流量預(yù)測.為避免陷入局部最優(yōu),設(shè)計(jì)了灰狼優(yōu)化算法內(nèi)部的交叉、變異和選擇操作,提升了算法的搜索性能.但此文獻(xiàn)并沒有考慮外部特征對模型的影響.
文獻(xiàn)[10]構(gòu)造了基于關(guān)鍵路段的混合卷積長短期記憶神經(jīng)網(wǎng)絡(luò)模型(CRS-ConvLSTM NN)來估計(jì)未來的交通變化.首先根據(jù)時空相關(guān)算法鑒別出對子網(wǎng)絡(luò)影響最大的關(guān)鍵路段.然后,將關(guān)鍵路段的交通速度當(dāng)作ConvLSTM的輸入來預(yù)測整個網(wǎng)絡(luò)的將來的交通狀態(tài).實(shí)驗(yàn)結(jié)果驗(yàn)證了CRS-ConvLSTM模型在不同關(guān)鍵路段下的預(yù)測能力.但該文獻(xiàn)沒有考慮周期特性和外部環(huán)境信息.
文獻(xiàn)[11]提出了DCRNN(擴(kuò)散卷積循環(huán)網(wǎng)絡(luò)),分別采用擴(kuò)散卷積和循環(huán)網(wǎng)絡(luò)在有向圖上捕獲交通流的空間和時間依賴性,結(jié)果表明該模型具有良好的預(yù)測精度.文獻(xiàn)[12]提出了STGCN(時空圖卷積網(wǎng)絡(luò)),可以提取時空特征且捕捉空間的依賴關(guān)系.但文獻(xiàn)[11]和文獻(xiàn)[12]均沒有考慮周期特性和外部環(huán)境信息.
綜上所述,有些方法在建模時沒有同時考慮空間依賴和時間依賴,還有些研究忽略了時間序列預(yù)測中的長期周期性影響.交通數(shù)據(jù)具有周期性,但交通數(shù)據(jù)的周期性非真正意義上的按日或按周的.因此,本文構(gòu)造一個周期性注意力機(jī)制來解決周期性時間變化問題.
在本小節(jié)中,先描述研究過程中使用的基本理論,以及研究問題的定義.
定義1.道路網(wǎng)絡(luò)拓?fù)銰.本文按照行駛方向用有向圖G(V,L)刻畫道路網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),把每個傳感器當(dāng)作圖中的一個節(jié)點(diǎn),其中,V={v1,v2,…,vN}是一組傳感器節(jié)點(diǎn),L表示路段,A是道路的鄰接矩陣描述道路間的連接關(guān)系.鄰接矩陣A僅包含兩個元素,即0和1,如公式(1)所示.
(1)
定義2.交通流量.交通流量是指在一定時間段內(nèi)途經(jīng)某個地點(diǎn)的車輛的個數(shù),其隨時間的推移構(gòu)成時間序列,且具備嵌入在連續(xù)空間中的空間屬性.交通流量的計(jì)算公式見公式(2)所示.交通流量預(yù)測是一個典型的時空數(shù)據(jù)預(yù)測問題.
(2)
其中,x是交通流量,T是觀測時間,N是在觀察時間內(nèi)經(jīng)過的車輛個數(shù).
在路段li(li∈L)的第tth個時間間隔(比如5分鐘)處的流量被定義為該路段在該時間間隔期間的車輛的平均流量,用xi,t表示.將在第tth個時間間隔的道路網(wǎng)絡(luò)的流量定義為向量Xt,其中第ith個元素是(Xt)i=xi,t.
問題表述.交通流量預(yù)測的目標(biāo)是利用一系列的歷史交通流量數(shù)據(jù)對各路段的將來流量值進(jìn)行預(yù)測.具體來說,給定先前Tp時間步長的歷史流量記錄{Xt-Tp+1,…,Xt},目標(biāo)是預(yù)測未來TF時間步的交通流量Xt+TF.交通流量預(yù)測問題可當(dāng)作是描述將歷史流量數(shù)據(jù)映射到未來流量數(shù)據(jù)的非線性映射函數(shù)f,如公式(3)所示:
Xt+TF=f({Xt-Tp+1,…,Xt},G)
(3)
獲取復(fù)雜的空間依賴性是交通預(yù)測中的重要難題.傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)能獲取局部空間特征,但CNN限于處理歐式數(shù)據(jù)(如圖像,語音等).城市道路網(wǎng)是非歐幾里得拓?fù)鋱D,這表明CNN模型不能描述城市道路網(wǎng)的復(fù)雜拓?fù)浣Y(jié)構(gòu),因此不可以正確地捕捉道路網(wǎng)的空間相關(guān)性.GCN用于提取基于圖的數(shù)據(jù)的空間相關(guān)性.空間相關(guān)性的提取過程對應(yīng)于框架圖1中的a部分.
圖1 STPAN的整體框架結(jié)構(gòu)圖
首先,本文定義了道路網(wǎng)絡(luò)拓?fù)銰=(V,L)上的空間卷積.
通常,鄰接矩陣是一跳鄰域矩陣A,K跳鄰域矩陣可以通過計(jì)算A的K次冪得到.本文將對角線元素添加到鄰域矩陣,其定義為:
(4)
其中,Ci(·)是矩陣的clip函數(shù),目的是將每個非零元素修改為1.
(5)
圖的一跳和二跳的圖示例
根據(jù)上述鄰域矩陣,圖卷積的簡明形式可以定義如下:
(6)
為了使并行計(jì)算更加適用和靈活,將公式(6)分解為一維卷積得到公式(7).
(7)
很多文獻(xiàn)僅將前幾個時間間隔(往往是幾個小時)進(jìn)行流量預(yù)測.而這些方法忽視了長期相關(guān)性(如周期性),周期性也被視為時空預(yù)測問題的一個重要特征[13].交通數(shù)據(jù)在時空相關(guān)性上表現(xiàn)出周期性變化,在本小節(jié),不但考慮短期信息,也將考慮長期的周期信息.
經(jīng)過第4節(jié)提取數(shù)據(jù)的空間特征后,接著使用LSTM來獲得時間序列依賴關(guān)系.本文使用文獻(xiàn)[14]中的LSTM版本.還選取天氣信息特征一同輸入進(jìn)LSTM,此等同于對輸入LSTM的數(shù)據(jù)增添一維特征,繼而對道路上的交通流量進(jìn)行預(yù)測.交通數(shù)據(jù)隨時間和空間的改變而不斷改變,呈現(xiàn)出強(qiáng)烈的不確定性和復(fù)雜性,所以在交通預(yù)測中,需考慮這些復(fù)雜性和不確定性對預(yù)測結(jié)果的影響.
hi,t=LSTM([xi,t;ei,t],hi,t-1)
(8)
其中,hi,t是時間t處路段i的輸出表示.ei,t表示外部變量(如天氣).因此,hi,t包含空間和短期時間信息.此方法僅使用了與預(yù)測時段相鄰的歷史時間序列片段,由于一個節(jié)點(diǎn)先前時刻的流量數(shù)據(jù)必然會對其下一時刻的流量造成較大的影響.這種網(wǎng)絡(luò)僅利用最近的幾個時間間隔,為了能更好地進(jìn)行長期預(yù)測,還需考慮周期性信息.由于本文的工作時間較統(tǒng)一,容易出現(xiàn)交通早晚高峰現(xiàn)象,交通流量數(shù)據(jù)在相同時刻有較強(qiáng)的相似性.交通流量數(shù)據(jù)也擁有明顯的周周期模式,比如,周一的交通模式通常與之前的周一的交通模式相似,而與周末的交通模式略有不同.
訓(xùn)練LSTM處理長期信息是一項(xiàng)艱巨任務(wù),因?yàn)殡S著時間序列長度的增加,會顯著減弱周期性的影響.為解決此問題,應(yīng)該對預(yù)測目標(biāo)的相對時段(例如,昨天的這個時候,前天的這個時候等)進(jìn)行建模.然而,僅考慮相對時段是不足的,因?yàn)檫@忽略了周期的時間變化,即交通數(shù)據(jù)非嚴(yán)格周期性的.例如,工作日的高峰期常出現(xiàn)在下午的后半段,可能在下午4:30到下午7:00之間.如果遇到交通事故或出現(xiàn)交通擁堵現(xiàn)象,周期的變化在交通序列中是廣泛存在的.即周期性非嚴(yán)格按日或按周的.因此,本研究設(shè)計(jì)了一個周期性注意力機(jī)制來解決這些限制.具體的描述如下.
圖1中的b部分,包含了前P天對應(yīng)的時段用于處理周期性依賴.對于每天,為解決周期性時間變化問題,從每天中額外的選擇Q個時段.例如,假若預(yù)測的時間是上午9:00-9:30,本文選擇前一個小時和后一個小時,即上午8:00-10:30,|Q|=5.這些時段q∈Q用來處理潛在的時間周期性變化.另外,使用LSTM來處理每天p∈P的序列信息,其公式如式(9)所示:
(9)
(10)
(11)
參考文獻(xiàn)[15],注意力分?jǐn)?shù)的定義可以視為基于內(nèi)容的函數(shù):
(12)
(13)
(14)
(15)
其中,Wfa和bfa是參數(shù).由于本文做了歸一化操作,因此模型的輸出范圍是(-1,1).稍后對預(yù)測值進(jìn)行歸一化的反向操作,使其回到實(shí)際范圍.
在訓(xùn)練階段,目標(biāo)是讓道路上的實(shí)際交通流量和預(yù)測值間的誤差最小.模型的損失函數(shù)如公式(16)所示.
(16)
公共數(shù)據(jù)集PeMS是從多于39000個單獨(dú)的探測器中收集的.這些傳感器橫跨加利福尼亞州主要大都市,提供了十多年的數(shù)據(jù),其中包含影響車流量的各類信息.本文使用的是2017-2018年的圣地亞哥地區(qū)的探測器.交通流的搜集時間段從2017年的6月至2018年的4月(共13個月).選取前12個月的數(shù)據(jù)作為訓(xùn)練集,并用最后一個月(2018年4月)的數(shù)據(jù)作為測試集.
本文將數(shù)據(jù)集的標(biāo)準(zhǔn)時間間隔設(shè)置為5min.因而,道路圖中的每個節(jié)點(diǎn)每天有288個數(shù)據(jù)點(diǎn).對數(shù)據(jù)清理后的缺失值使用線性插值法進(jìn)行填充.另外,利用Z-Score方法對輸入進(jìn)行歸一化.
在PeMS中,道路圖的鄰接矩陣是根據(jù)交通網(wǎng)絡(luò)中站點(diǎn)之間的距離來計(jì)算的.加權(quán)鄰接矩陣W可以表示為:
(17)
其中,ωij表示從站點(diǎn)i到站點(diǎn)j的邊的權(quán)重,dij表示從站點(diǎn)i到站點(diǎn)j的道路距離,σ是距離的標(biāo)準(zhǔn)差,ξ是控制矩陣分布和稀疏性的閾值.在本節(jié)中,將σ2和ξ分別指定為1.5和0.5.
為了評估STPAN模型的預(yù)測性能,使用3個標(biāo)準(zhǔn)指標(biāo)來計(jì)算現(xiàn)實(shí)的交通狀態(tài)與預(yù)測狀態(tài)之間的誤差.它們的定義如下:
1)平均絕對誤差(MAE):
(18)
2)均方根誤差(RMSE):
(19)
3)平均絕對百分比誤差(MAPE):
(20)
在本小節(jié)中,評估STPAN和其它方法在PeMS數(shù)據(jù)集的預(yù)測性能.對比方法有傳統(tǒng)的時間序列分析方法(HA、ARIMA)、機(jī)器學(xué)習(xí)方法(SVR、XGBoost)和深度學(xué)習(xí)模型(STGCN、DCRNN).
1)HA:歷史平均值.歷史平均模型根據(jù)訓(xùn)練集的經(jīng)驗(yàn)統(tǒng)計(jì)來預(yù)測測試數(shù)據(jù)集的未來交通流量.例如,路段li∈L的9:00-9:05期間的平均交通流量是依據(jù)同一路段的9:00-9:05期間訓(xùn)練數(shù)據(jù)集中的歷史交通流量的平均值來估計(jì).
2)ARIMA:自回歸移動平均模型.對于ARIMA(p,d,q)模型[17],對數(shù)據(jù)進(jìn)行差分的階數(shù)設(shè)置為d=1,通過使用p∈[0,2],q∈[7,12]計(jì)算訓(xùn)練數(shù)據(jù)集的相關(guān)赤池信息準(zhǔn)則(AIC)來確定自回歸部分和移動平均部分(p,q).
3)SVR:支持向量回歸.本文選取徑向基核函數(shù)進(jìn)行訓(xùn)練,其中核系數(shù)設(shè)置為0.1.
4)XGBoost:極端梯度提升.XGBoost[18]是一套提升樹可擴(kuò)展的機(jī)器學(xué)習(xí)系統(tǒng).它是基于樹結(jié)構(gòu)的端到端的提升系統(tǒng).
5)STGCN:時空圖卷積網(wǎng)絡(luò)[12].ST-Conv塊的3層通道分別是64、16和64.圖卷積和時間卷積的核大小設(shè)置為3.STGCN模型使用RMSprop優(yōu)化器對MSE進(jìn)行最小化訓(xùn)練,batch大小為50.初始學(xué)習(xí)率為0.001,每5個epochs之后衰減率為0.7.
6)DCRNN:擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)[11].DCRNN是通過Adam優(yōu)化器最小化MAE進(jìn)行訓(xùn)練的.編碼器和解碼器均有兩個LSTM層,每個LSTM層有64個單元.最初的學(xué)習(xí)率是0.01,從第20個epoch開始,每10個epochs縮短10%.隨機(jī)游走的最大步數(shù)設(shè)置為3,最大epoch為100,根據(jù)監(jiān)測驗(yàn)證誤差決定是否采取提前終止的措施.
本文的實(shí)驗(yàn)設(shè)備是Intel?CoreTMi7-4790 3.60GHZ CPU和4個NVIDIA GeForce Titan X Pascal GPU.
對于PeMS數(shù)據(jù)集,本文采用的是13個月(2017年4月到2018年4月)的交通流量,在實(shí)驗(yàn)時,選擇前12個月的交通流量數(shù)據(jù)作為訓(xùn)練集,并用最后一個月(2018年4月)的數(shù)據(jù)作為測試集,隨機(jī)抽取20%的訓(xùn)練樣本作為驗(yàn)證集.
本文根據(jù)驗(yàn)證集的性能來設(shè)置STPAN模型的超參數(shù).對于空間信息,將卷積核大小設(shè)置為3×3,64個過濾器.把K設(shè)為3.對于時間信息,將短期LSTM長度設(shè)為為7(即前3.5個小時),長期周期信息|P|=3(即前3天),周期性注意力機(jī)制|Q|=3(即考慮相對于預(yù)測時間的前后半小時),LSTM的隱藏層的維數(shù)設(shè)為128.模型STPAN使用Adam進(jìn)行優(yōu)化,batch size為64,學(xué)習(xí)率為0.001.LSTM中的dropout為0.5.
圖3展示的是在PeMS數(shù)據(jù)集上預(yù)測2018年4月10日的交通流量圖.從圖中可看到本文提出的模型STPAN可以較好地捕獲到早高峰和晚高峰時段的趨勢走向,與真實(shí)交通流量非常接近.
圖3 2018年4月10日的交通流量預(yù)測
圖4描述的是在PeMS數(shù)據(jù)集上預(yù)測2018年4月1日的交通流量.因?yàn)?018年復(fù)活節(jié)的時間是2018年4月1日,與愚人節(jié)是同一天,高于往常交通流量,因此圖4的整體交通流量高于圖3的交通流量,本文提出的STPAN模型能捕捉到流量的變化趨勢,圖4的趨勢走向和圖3的趨勢走向較吻合,交通流量的高峰時段大致相似.
圖4 2018年4月1日的交通流量預(yù)測
圖5描述的是在PeMS數(shù)據(jù)集上對2018年4月3日至2018年4月10日共一周的交通流量預(yù)測結(jié)果.預(yù)測的時間間隔為5分鐘.從圖中能看到交通流量數(shù)據(jù)隨時間動態(tài)變化,每天的早高峰和晚高峰時段相似,呈現(xiàn)出強(qiáng)烈的周期性特征,盡管每天的流量趨勢相似但又不完全相同.本文提出的STPAN模型在PeMS數(shù)據(jù)集上較好地實(shí)現(xiàn)了對交通流量的預(yù)測.
圖5 2018年4月3日至4月10日的交通流量預(yù)測
表2描述的是STPAN模型與其它方法在PeMS數(shù)據(jù)集上進(jìn)行15分鐘、30分鐘和45分鐘的流量預(yù)測的實(shí)驗(yàn)對比結(jié)果,從表中看到本文提出的STPAN模型在3個評價指標(biāo)中均獲得了最好的性能.傳統(tǒng)的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法對于短期預(yù)測表現(xiàn)良好,但因?yàn)檎`差積累和缺乏空間信息,它們的長期預(yù)測并不準(zhǔn)確.深度學(xué)習(xí)模型通常比傳統(tǒng)的機(jī)器學(xué)習(xí)模型更能取得好的預(yù)測效果.由于模型STPAN不僅對傳感器的空間拓?fù)溥M(jìn)行建模,而且在時間維度上利用周期性注意力機(jī)制以及外部環(huán)境信息,從而使得本文的模型STPAN在短期和中長期預(yù)測方面均優(yōu)于STGCN和DCRNN.
表2 不同交通流量預(yù)測方法的性能比較
為證明STPAN模型中的每個組件對預(yù)測效果的影響,本文用控制變量法對STPAN的變體做進(jìn)一步的研究.雖然更改了部件,但所有變體均擁有相同的框架結(jié)構(gòu)和參數(shù)設(shè)置.具體地說,在提出的STPAN框架中,一次刪除一個組件.首先,將STPAN的變體命名如下.
1)STPAN/noGCN:不帶GCN組件的STPAN模型.這種沒有GCN的STPAN變體對空間相關(guān)性不敏感.
2)STPAN/noPA:沒有周期性注意力機(jī)制的STPAN模型.STPAN/noPA有兩個LSTM網(wǎng)絡(luò).一個是作為捕獲短期依賴關(guān)系,另一個是根據(jù)前3天信息中的相對時間來獲取長期信息.注意,本文設(shè)置|Q|=1(僅考慮前3天的相對預(yù)測時間).
圖6描述的是STPAN及其兩個變體在不同預(yù)測時間間隔下的MAPE的對比結(jié)果.從圖中看出,STPAN取得了最低的MAPE值,STPAN/noGCN是3種方法中最高的MAPE值,由于此變體模型沒有對空間信息進(jìn)行提取,預(yù)測效果遠(yuǎn)低于STPAN模型,這表明空間依賴性對最終模型的預(yù)測效果影響很大,也側(cè)面說明了GCN(對空間相關(guān)性進(jìn)行建模)在交通流預(yù)測中的重要性.此外,通過對比STPAN/noPA和STPAN的性能,表明周期性注意力機(jī)制的加入對模型的預(yù)測性能有了一定的提升.
圖6 不同預(yù)測時間間隔下STPAN和其變體的性能對比圖
預(yù)測未來交通流量是智能交通系統(tǒng)中的關(guān)鍵問題之一.交通流量數(shù)據(jù)受各種因素共同影響,其是一個非線性、隨時間改變的復(fù)雜的隨機(jī)過程.由于道路按功能區(qū)域的空間分布、人們出行需求的差異,使得交通流具有時空特性,且交通流量的預(yù)測受大量復(fù)雜因素的影響.
準(zhǔn)確的交通流量預(yù)測不但為交通管理員和出行人提供有價值的信息,且有利于提升道路資源利用率,減少人們的出行和時間成本,實(shí)現(xiàn)交通管理從“被動”變?yōu)椤爸鲃印钡年P(guān)鍵.
本文提出了一種時空周期性注意力網(wǎng)絡(luò)的交通流量預(yù)測模型(STPAN).首先,使用GCN來描述基于圖的交通流數(shù)據(jù)的空間相關(guān)性.其次,綜合考慮短期和長期的周期性信息進(jìn)行流量預(yù)測,并使用LSTM獲得時序依賴關(guān)系.因?yàn)闀r間上的周期性非嚴(yán)格固定的,因此本文利用周期性注意力機(jī)制來處理此問題.本文還將天氣等外部信息增添到模型中,以提高模型的預(yù)測性能.
本文將STPAN模型與HA、ARIMA、SVR、XGBoost、STGCN、DCRNN在PeMS數(shù)據(jù)集上分別進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,在不同的預(yù)測間隔下,STPAN模型的預(yù)測性能均優(yōu)于其他方法.此外,還將STPAN和兩種其變體(STPAN/noGCN、STPAN/noPA)進(jìn)行了對比實(shí)驗(yàn),結(jié)果表明,STPAN模型的預(yù)測效果是最好的.