王海起,王志海,李留珂,孔浩然,王瓊,徐建波
基于網(wǎng)格劃分的城市短時(shí)交通流量時(shí)空預(yù)測(cè)模型
王海起,王志海*,李留珂,孔浩然,王瓊,徐建波
(中國(guó)石油大學(xué)(華東) 海洋與空間信息學(xué)院,山東 青島 266580)( ? 通信作者電子郵箱m15169527853@163.com)
準(zhǔn)確的交通流量預(yù)測(cè)在幫助交通管理部門采取有效的交通控制和誘導(dǎo)手段以及幫助出行者合理規(guī)劃路線等方面具有重要意義。針對(duì)傳統(tǒng)深度學(xué)習(xí)模型對(duì)交通數(shù)據(jù)時(shí)空特性考慮不足的問題,在卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長(zhǎng)短時(shí)記憶(LSTM)單元的理論框架下,結(jié)合城市交通流量的時(shí)空特性,建立了一種基于注意力機(jī)制的CNN-LSTM預(yù)測(cè)模型——STCAL。首先,采用細(xì)粒度的網(wǎng)格劃分方法來構(gòu)建交通流量的時(shí)空矩陣;其次,利用CNN模型作為空間組件來提取城市交通流量不同時(shí)期下的空間特性;最后,利用基于注意力機(jī)制的LSTM模型作為動(dòng)態(tài)時(shí)間組件來捕獲交通流量的時(shí)序特征和趨勢(shì)變動(dòng)性,并實(shí)現(xiàn)交通流量的預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,STCAL模型與循環(huán)門單元(GRU)和時(shí)空殘差網(wǎng)絡(luò)(ST-ResNet)相比,均方根誤差(RMSE)指標(biāo)分別減小了17.15%和7.37%,均絕對(duì)誤差(MAE)指標(biāo)分別減小了22.75%和9.14%,決定系數(shù)(R2)指標(biāo)分別提升了11.27%和2.37%。同時(shí),發(fā)現(xiàn)該模型在規(guī)律性較高的工作日的預(yù)測(cè)效果好于周末,且對(duì)工作日早高峰的預(yù)測(cè)效果最好,可見該模型可為短時(shí)城市區(qū)域交通流量變化監(jiān)測(cè)提供依據(jù)。
短時(shí)交通流量預(yù)測(cè);時(shí)空特性;卷積神經(jīng)網(wǎng)絡(luò);長(zhǎng)短時(shí)記憶;注意力機(jī)制
在經(jīng)濟(jì)快速發(fā)展的背景下,我國(guó)的汽車保有量逐年攀升,過快的汽車增長(zhǎng)速度和較低的道路容納力之間的矛盾愈發(fā)突出。交通問題是個(gè)極為重要的現(xiàn)實(shí)問題,如何有效地緩解交通壓力、提高路網(wǎng)的通行能力,已成為大中城市迫切需要解決的問題之一。隨著數(shù)據(jù)采集技術(shù)和信息處理技術(shù)的快速發(fā)展和在交通運(yùn)輸領(lǐng)域的廣泛應(yīng)用,智能交通系統(tǒng)(Intelligent Transportation System, ITS)也隨之發(fā)展起來[1]。精準(zhǔn)、實(shí)時(shí)的城市交通流量預(yù)測(cè)是城市交通控制和引導(dǎo)的基礎(chǔ),也是智能交通系統(tǒng)的重要組成部分。由于交通情況變化迅速,長(zhǎng)時(shí)交通流在現(xiàn)實(shí)應(yīng)用中很難發(fā)揮作用;而預(yù)測(cè)時(shí)長(zhǎng)不超過15 min的短時(shí)交通流量預(yù)測(cè),更符合現(xiàn)實(shí)生活需求,更具有實(shí)際意義。
目前,現(xiàn)有的交通預(yù)測(cè)方法大體可以分為動(dòng)態(tài)建模和數(shù)據(jù)驅(qū)動(dòng)兩類。數(shù)據(jù)驅(qū)動(dòng)類方法當(dāng)前有著相當(dāng)廣泛的應(yīng)用,以典型的統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)及其組合為代表[2],其中主要的方法有三類,分別為基于統(tǒng)計(jì)的線性預(yù)測(cè)方法、基于非線性模型的預(yù)測(cè)方法以及基于深度學(xué)習(xí)的預(yù)測(cè)方法?;诮y(tǒng)計(jì)的線性預(yù)測(cè)方法中典型的模型為自回歸差分移動(dòng)平均(AutoRegressive Integrated Moving Average, ARIMA)模型,Kohonen ARIMA模型[3]、subset ARIMA模型[4]、seasonal ARIMA模型[5]等的變體模型提高了交通流預(yù)測(cè)的精度,但ARIMA模型預(yù)測(cè)要求交通流數(shù)據(jù)是平穩(wěn)的,面對(duì)復(fù)雜的交通狀況時(shí),則難以保證預(yù)測(cè)精度?;诜蔷€性模型的預(yù)測(cè)方法包括支持向量機(jī)[6]、小波分析[7]、人工神經(jīng)網(wǎng)絡(luò)[8]等,該方法在交通流預(yù)測(cè)中的數(shù)據(jù)擬合能力較強(qiáng),但未考慮道路間的空間關(guān)系,且需要大量數(shù)據(jù)。1997年,Kirby等[9]討論了神經(jīng)網(wǎng)絡(luò)和時(shí)間序列在交通預(yù)測(cè)方面的優(yōu)缺點(diǎn),發(fā)現(xiàn)在數(shù)據(jù)量少的情況下神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果并不好,且未考慮道路間空間關(guān)系對(duì)交通預(yù)測(cè)的影響?;谏疃葘W(xué)習(xí)的預(yù)測(cè)方法,相對(duì)于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)方法,有更強(qiáng)大的特征學(xué)習(xí)能力,適用于交通流的預(yù)測(cè)任務(wù)。Sun等[10]利用GPS軌跡數(shù)據(jù)考慮了前30~90 min的交通速度數(shù)據(jù),構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)、支持向量機(jī)回歸(Support Vector Regression, SVR)等幾種交通速度預(yù)測(cè)模型,結(jié)果表明深度學(xué)習(xí)方法優(yōu)于機(jī)器學(xué)習(xí)方法。Zhang等[11]使用一種時(shí)空殘差卷積網(wǎng)絡(luò)對(duì)城市范圍的人流動(dòng)進(jìn)行預(yù)測(cè)。陳治亞等[12]深入探究了時(shí)間占有率等因素對(duì)交通流預(yù)測(cè)結(jié)果的影響,提出了基于多維度長(zhǎng)短時(shí)記憶(Long Short-Term Memory,LSTM)單元模型的短時(shí)交通流預(yù)測(cè)模型。王體迎等[13]利用循環(huán)門單元(Gated Recurrent Unit,GRU)對(duì)加拿大大不列顛哥倫比亞的真實(shí)交通流量數(shù)據(jù)進(jìn)行建模分析。各研究發(fā)現(xiàn)深度學(xué)習(xí)方法在交通預(yù)測(cè)上有不錯(cuò)表現(xiàn),但是絕大多數(shù)深度學(xué)習(xí)方法對(duì)于交通數(shù)據(jù)的時(shí)空特征考慮不全,使得預(yù)測(cè)精度降低,且內(nèi)部結(jié)構(gòu)復(fù)雜,模型訓(xùn)練工作量加重。
為了充分提取交通流的時(shí)空特征、提高模型的預(yù)測(cè)精度,基于出租車GPS數(shù)據(jù),根據(jù)城市交通流的時(shí)空特性,利用CNN模型和基于注意力機(jī)制的LSTM模型建立了交通流短時(shí)預(yù)測(cè)模型。
1.1.1城市交通流網(wǎng)格表示
其中:R為軌跡集,為軌跡集中的一條軌跡,為軌跡上的軌跡點(diǎn),和為的經(jīng)緯度坐標(biāo),為集合的基數(shù)。
1.1.2交通流時(shí)空矩陣的劃分
根據(jù)上述交通流存在的特性,將輸入數(shù)據(jù)分為三部分,分別為鄰近項(xiàng)、日周期項(xiàng)和周周期項(xiàng)。
根據(jù)城市交通流量存在的時(shí)空特性及現(xiàn)有模型存在的不足,提出了一種基于注意力機(jī)制的CNN-LSTM預(yù)測(cè)模型STCAL (Spatial-Temporal Convolutional Attention-LSTM network),如圖2所示。模型由空間組件和動(dòng)態(tài)時(shí)間組件所構(gòu)成:空間組件根據(jù)交通流的時(shí)間特性分為3個(gè)模塊(鄰近模塊、日周期模塊和周周期模塊),分別獨(dú)立使用多層的卷積神經(jīng)網(wǎng)絡(luò)模型來提取不同時(shí)期下城市交通的空間特征;動(dòng)態(tài)時(shí)間組件使用了以長(zhǎng)短時(shí)記憶單元作為基本單元搭建的編解碼器(Encoder-Decoder)模型,并嵌入注意力機(jī)制來處理交通流的趨勢(shì)變動(dòng)性,實(shí)現(xiàn)最終的預(yù)測(cè)結(jié)果。
圖2 模型結(jié)構(gòu)
1.2.1空間組件:CNN模型
1.2.2動(dòng)態(tài)時(shí)間組件:基于注意力機(jī)制的LSTM模型
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)最有代表性的變體之一[15],它通過門函數(shù)和記憶細(xì)胞的共同作用,可以有選擇性地控制信息的傳遞?;贚STM搭建的Encoder-Decoder架構(gòu)來處理交通流量的時(shí)間特性,并引入注意力機(jī)制,來適應(yīng)城市交通流量的趨勢(shì)變動(dòng)性。其中,Encoder端負(fù)責(zé)捕獲交通流量時(shí)間依賴性,并編碼成一個(gè)向量輸入到Decoder端;Decoder端對(duì)編碼向量進(jìn)行解構(gòu)并且輸出多步預(yù)測(cè)。
圖3 注意力機(jī)制
研究使用的數(shù)據(jù)源來自北京市33 000多輛出租車于2015年5月4日至2015年6月20日所產(chǎn)生的GPS軌跡點(diǎn)數(shù)據(jù)。根據(jù)北京市軌跡數(shù)據(jù)的核密度分布(圖4),可以發(fā)現(xiàn)數(shù)據(jù)集中分布在北京市五環(huán)內(nèi)區(qū)域,所以研究范圍選擇為北京市五環(huán)內(nèi)區(qū)域,即坐標(biāo)范圍經(jīng)度116.207 958至116.549 958,緯度39.758 235至40.024 828。本文選擇前36 d的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),后12 d為測(cè)試數(shù)據(jù)。
圖4 GPS軌跡點(diǎn)核密度分布
車輛GPS數(shù)據(jù)采集裝置的采樣間隔為60 s,原始數(shù)據(jù)量大,但也包含著較多的噪聲數(shù)據(jù),并不適合直接使用,需要進(jìn)行數(shù)據(jù)預(yù)處理。GPS裝置在定位、采集和傳輸過程中不可避免地會(huì)出現(xiàn)多種形式的誤差,出租車GPS數(shù)據(jù)的異常與誤差可以劃分為冗余數(shù)據(jù)、漂移數(shù)據(jù)和定位偏差數(shù)據(jù)。
1) 冗余數(shù)據(jù)。由于GPS設(shè)備故障或司機(jī)短時(shí)間內(nèi)重復(fù)打表,導(dǎo)致出現(xiàn)了多個(gè)字段完全相同的數(shù)據(jù),需要對(duì)重復(fù)數(shù)據(jù)剔除,只保留一條數(shù)據(jù)。
2) 漂移數(shù)據(jù)。漂移數(shù)據(jù)指的是出租車GPS設(shè)備受城市高大建筑、樹木或電磁干擾,出現(xiàn)了坐標(biāo)位置或者速度明顯異常。本文采用閾值判別法,對(duì)漂移數(shù)據(jù)進(jìn)行識(shí)別,綜合實(shí)際情況將速度閾值設(shè)置為180 km/h,對(duì)超出閾值范圍的數(shù)據(jù)予以剔除;并對(duì)區(qū)間速度正常,但是坐標(biāo)位置與行程距離明顯不匹配的予以剔除;對(duì)坐標(biāo)正常但區(qū)間速度過大的予以剔除。
3) 定位偏差數(shù)據(jù)。由于GPS自身定位偏差,會(huì)出現(xiàn)GPS軌跡點(diǎn)偏離路網(wǎng)道路的情況,本文采用基于隱馬爾可夫模型(Hidden Markov Model, HMM)[16]的地圖匹配算法,對(duì)GPS軌跡數(shù)據(jù)進(jìn)行糾偏。
網(wǎng)格單元的尺寸的確定,因考慮到北京市道路最寬處為長(zhǎng)安街120 m,網(wǎng)格步長(zhǎng)設(shè)置在120 m到1 400 m,以5 min的單位時(shí)間間隔來統(tǒng)計(jì)每個(gè)網(wǎng)格交通量總數(shù),計(jì)算不同網(wǎng)格步長(zhǎng)下失效網(wǎng)格比例(圖5)。結(jié)果表明:網(wǎng)格步長(zhǎng)在1 000 m時(shí),網(wǎng)格失效比低于25%;網(wǎng)格步長(zhǎng)在1 000 m之后,網(wǎng)格失效比的走勢(shì)趨于平緩,所以選擇1 000 m的步長(zhǎng)劃分網(wǎng)格,共39×39個(gè)網(wǎng)格。
圖5 不同尺寸網(wǎng)格失效比例
基于北京市出租車GPS軌跡數(shù)據(jù),每隔15 min統(tǒng)計(jì)了北京市五環(huán)內(nèi)7:00 — 9:00共8個(gè)時(shí)間片的車流量。以7:00 — 7:15的車流量為基準(zhǔn),與剩下7個(gè)時(shí)間片的車流量進(jìn)行了Peason相關(guān)性分析。
如圖6所示,7:00 — 7:15的車流量與7:15 — 7:30的車流量的相關(guān)系數(shù)R值最高,且Peason相關(guān)系數(shù)隨時(shí)間增長(zhǎng),相關(guān)性減弱,這說明城市交通流量具有時(shí)間鄰近性。
圖6 北京市7:00 — 9:00車流量Peason相關(guān)系數(shù)
如圖7所示,城市交通流量遵循著日周期模式和周周期模式,但工作日與周末的車流量變化差異較大,這說明兩者的交通狀態(tài)具有顯著的差異。
如圖8所示,每天的交通流量變化具有明顯的“三峰”特征,即早高峰、午平峰、晚高峰。但從高峰時(shí)間的細(xì)節(jié)來看,這個(gè)時(shí)間并不是嚴(yán)格固定的,這說明城市交通流量具有趨勢(shì)變動(dòng)性。以上分析表明,北京市出租車的交通流量數(shù)據(jù)具有明顯的城市交通流量的時(shí)間特性,很適用于本文所提出的STCAL模型的訓(xùn)練和測(cè)試工作。
圖7 北京市連續(xù)兩周(05-04 — 05-17)出租車交通流量統(tǒng)計(jì)
圖8 北京市單周每日交通流量統(tǒng)計(jì)
選用均方根誤差(Root Mean Square Error,RMSE)、均絕對(duì)誤差(Mean Absolute Error,MAE)以及決定系數(shù)(R2)作為模型的評(píng)價(jià)指標(biāo),具體計(jì)算方式如下:
選用5種傳統(tǒng)的交通流量基準(zhǔn)方法,包括歷史均值法(Historical Average,HA)、ARIMA、SVR、GRU、LSTM和時(shí)空殘差網(wǎng)絡(luò)(Spatio-Temporal Residual Network, ST-ResNet),來反映STCAL模型的預(yù)測(cè)性能。
STCAL模型中主要的參數(shù)有卷積層數(shù)、卷積核大小、空間組件的全連接層神經(jīng)元個(gè)數(shù)、LSTM隱藏層個(gè)數(shù)、隱藏層單元數(shù)目等。其中空間組件CNN模型中卷積層為2,卷積核大小為3×3,第一層和第二層的卷積核數(shù)目分別為16和1,激活函數(shù)(·)為L(zhǎng)eakyReLU,全連接層中激活函數(shù)(·)為tanh;動(dòng)態(tài)時(shí)間組件LSTM模型中層數(shù)為2??臻g組件的全連接層神經(jīng)元個(gè)數(shù)和LSTM隱藏層單元數(shù)目是兩個(gè)比較關(guān)鍵的參數(shù),因?yàn)闀r(shí)間組件中LSTM的輸入維度取決于空間組件全連接層的輸出維度,這控制著時(shí)間組件的初始信息量,而LSTM隱藏層單元數(shù)目代表隱狀態(tài)的維度,控制著最后傳遞的信息量。這二者對(duì)最后的預(yù)測(cè)結(jié)果影響較大需要進(jìn)行實(shí)驗(yàn)來確定,根據(jù)數(shù)據(jù)維度和網(wǎng)絡(luò)架構(gòu)復(fù)雜度,設(shè)置全連接層神經(jīng)元個(gè)數(shù)為500、1 000、1 500,LSTM隱藏層單元數(shù)目為8、16、32、64、128。在不同全連接層神經(jīng)元個(gè)數(shù)和LSTM隱藏層單元數(shù)目下進(jìn)行實(shí)驗(yàn),利用均方根誤差(RMSE)進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)結(jié)果如圖9所示,最終選擇了預(yù)測(cè)精度最高的一組參數(shù),全連接層神經(jīng)元數(shù)目為1 000,LSTM隱藏層單元數(shù)目為128。
圖 9 不同參數(shù)設(shè)置下的精度評(píng)定
另外鄰近項(xiàng)、日周期項(xiàng)和周周期項(xiàng)輸入的時(shí)間長(zhǎng)度會(huì)影響模型所承載的信息量和預(yù)測(cè)精度,為簡(jiǎn)化計(jì)算,將各項(xiàng)輸入的時(shí)間長(zhǎng)度設(shè)置為相同的,各項(xiàng)輸入時(shí)間長(zhǎng)度分別設(shè)置為15 min、25 min、35 min、45 min,即輸入的時(shí)間片段總長(zhǎng)度為9、15、21、27。使用RMSE來評(píng)價(jià),結(jié)果如圖10所示。從結(jié)果上看,各項(xiàng)輸入時(shí)間長(zhǎng)度為35 min,輸入時(shí)間片總長(zhǎng)度為21時(shí),預(yù)測(cè)效果最好,因此設(shè)置各項(xiàng)輸入時(shí)間長(zhǎng)度為35 min作為最后的輸入?yún)?shù)。
圖10 不同輸入時(shí)間長(zhǎng)度下的精度評(píng)定
其他參數(shù)設(shè)置有批尺寸batch size為64,學(xué)習(xí)率設(shè)置為0.001,損失函數(shù)為均方誤差MSE,并使用批量歸一化層BN和學(xué)習(xí)率自適應(yīng)優(yōu)化算法Adam來優(yōu)化訓(xùn)練速度;在訓(xùn)練集中,隨機(jī)選擇80%的數(shù)據(jù)來訓(xùn)練模型,20%的數(shù)據(jù)用于驗(yàn)證。
為了更好地驗(yàn)證STCAL模型的預(yù)測(cè)效果,使用RMSE、MAE和R2來評(píng)價(jià)模型,與經(jīng)典的交通流量預(yù)測(cè)模型HA、ARIMA、SVR、GRU和ST-ResNet進(jìn)行對(duì)比,結(jié)果如表1所示。
表1不同方法在預(yù)測(cè)時(shí)長(zhǎng)為5 min下的性能比較
Tab.1 Performance comparison of different methods under prediction duration of 5 minutes
從表1可以看出,傳統(tǒng)方法HA因只依賴于歷史觀測(cè)值,而ARIMA模型本質(zhì)上只能捕捉線性關(guān)系,所以兩種模型在城市范圍內(nèi)交通量預(yù)測(cè)方面表現(xiàn)較差;SVR為非線性模型,所以預(yù)測(cè)效果好于前兩種方法;GRU和LSTM好于SVR,這是因?yàn)閮烧呔哂姓{(diào)節(jié)信息傳遞的門控函數(shù),在訓(xùn)練過程中根據(jù)預(yù)測(cè)結(jié)果與真實(shí)結(jié)果的誤差反饋,來調(diào)節(jié)丟棄和保留信息的比例;ST-ResNet是一種時(shí)空神經(jīng)網(wǎng)絡(luò),所以預(yù)測(cè)誤差較低。而模型STCAL在兩種評(píng)價(jià)指標(biāo)中均表現(xiàn)出了最佳性能,相較于SVR、GRU、LSTM和ST-ResNet,其中RMSE指標(biāo)分別減小了58.48%、17.15%、17.07%和7.37%;MAE指標(biāo)分別減少了63.45%、22.75%、22.53%和9.14%;R2指標(biāo)分別提升了50.83%、11.27%、11.14%和2.37%。表2是本文模型不同時(shí)長(zhǎng)下的預(yù)測(cè)結(jié)果,從結(jié)果上看出,5 min到15 min的預(yù)測(cè)效果比較好,隨著預(yù)測(cè)時(shí)長(zhǎng)的增長(zhǎng),預(yù)測(cè)性能也在逐漸下降,這說明模型并不適合長(zhǎng)時(shí)段預(yù)測(cè)。
表2STCAL模型在不同預(yù)測(cè)時(shí)長(zhǎng)下的性能
Tab.2 Performance of STCAL model under different prediction durations
人們對(duì)于高峰期的交通擁堵狀態(tài)更加在意,將工作日和周末的高平峰時(shí)期的數(shù)據(jù)進(jìn)行測(cè)試,其中早高峰為8:00 — 9:00,午平峰為14:00 — 15:00,晚高峰為20:00 — 21:00,預(yù)測(cè)時(shí)長(zhǎng)為5 min,每個(gè)高平峰期共12個(gè)預(yù)測(cè)結(jié)果,進(jìn)行平均得到最后的預(yù)測(cè)結(jié)果。結(jié)果如表3所示,其中工作日預(yù)測(cè)誤差比周末預(yù)測(cè)誤差整體較小,且工作日早高峰的預(yù)測(cè)效果最好,RMSE和MAE分別為7.260和3.412。因?yàn)楣ぷ魅盏慕煌空w高于周末交通量,且工作日較周末表現(xiàn)出明顯的規(guī)律性,模型對(duì)于交通流量周期性學(xué)習(xí)較好,所以工作日預(yù)測(cè)效果較好,而對(duì)于規(guī)律性較弱的周末,預(yù)測(cè)效果一般。
表3STCAL模型在高峰時(shí)段性能比較
Tab.3 STCAL model performance comparison during peak hours
選擇北京市車流量較大的西直門進(jìn)行車流量預(yù)測(cè),圖11是預(yù)測(cè)時(shí)長(zhǎng)5 min下的工作日(6月17日)和周末(6月20日)的交通流量預(yù)測(cè)值與真實(shí)值對(duì)比,STCAL模型的預(yù)測(cè)值的趨勢(shì)走向與真實(shí)值基本一致,工作日的預(yù)測(cè)效果強(qiáng)于周末,而且工作日的早晚上下班的高峰時(shí)段的預(yù)測(cè)值與真實(shí)值吻合度較高,但也存在像震蕩較為明顯的午間時(shí)段的預(yù)測(cè)值與真實(shí)值之間存在一定的偏差。
圖11 易堵地點(diǎn)的預(yù)測(cè)值與真實(shí)值對(duì)比
依據(jù)城市交通流的時(shí)空特性,提出了一種新的基于注意力的CNN-LSTM的時(shí)空預(yù)測(cè)模型——STCAL。該模型分為空間組件和時(shí)間組件兩部分:空間組件負(fù)責(zé)提取捕獲城市交通流量動(dòng)態(tài)的空間特征;時(shí)間組件為基于LSTM的編解碼器,編碼器負(fù)責(zé)捕獲交通流量時(shí)間依賴性,解碼器負(fù)責(zé)對(duì)編碼向量進(jìn)行解構(gòu)并且輸出多步預(yù)測(cè),并由嵌入時(shí)間組件的注意力機(jī)制來捕捉交通流的趨勢(shì)變動(dòng)性。STCAL模型能夠同時(shí)捕獲交通流的時(shí)空特性,與經(jīng)典的交通流量預(yù)測(cè)模型HA、ARIMA、SVR、GRU和ST-ResNet相比,模型的預(yù)測(cè)精度最高。在不同時(shí)長(zhǎng)的預(yù)測(cè)結(jié)果對(duì)比中,發(fā)現(xiàn)模型更適用于短時(shí)交通流量預(yù)測(cè),可為短時(shí)城市區(qū)域交通流量變化監(jiān)測(cè)提供依據(jù)。對(duì)比模型在工作日與周末的預(yù)測(cè)結(jié)果,工作日高峰時(shí)段的預(yù)測(cè)效果優(yōu)于周末高峰時(shí)段,因?yàn)楣ぷ魅杖藗兓顒?dòng)更有規(guī)律性,模型對(duì)于周期規(guī)律性學(xué)習(xí)較好,所以預(yù)測(cè)效果更好。
STCAL模型只單純考慮了城市交通流量自身因素,未考慮外部因素對(duì)于預(yù)測(cè)所帶來的影響,例如交通事故、天氣情況、大型事件,這些都會(huì)造成交通流量的短時(shí)突變,所以未來可以考慮其他特征的提取模塊來對(duì)非典型情況下的交通流量進(jìn)行預(yù)測(cè)。
[1] 張任,謝楊. 智能交通系統(tǒng)在中國(guó)的發(fā)展趨勢(shì)與前景[J]. 科技視界,2013(7):32-33.(ZHANG R, XIE Y. Intelligent transportation system in China’s development trends and prospects[J]. Science and Technology Vision, 2013(7):32-33.)
[2] YU B, YIN H T, ZHU Z X. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]// Proceeding of the 27th International Joint Conference on Artificial Intelligence. California: IJCAI.org, 2018:3634-3640.
[3] VAN DER VOORT M, DOUGHERTY M, WATSON S. Combining Kohonen maps with ARIMA time series models to forecast traffic flow[J]. Transportation Research Part C: Emerging Technologies, 1996, 4(5):307-318.
[4] LEE S, FAMBRO D B. Application of subset autoregressive integrated moving average model for short-term freeway traffic volume forecasting[J]. Transportation Research Record, 1999, 1678(1):179-188.
[5] WILLIAMS B M, HOEL L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6):664-672.
[6] 楊剛,王樂,戴麗珍,等. 自適應(yīng)權(quán)重粒子群優(yōu)化LS-SVM的交通流預(yù)測(cè)[J]. 控制工程, 2017, 24(9):1838-1843.(YANG G, WANG L, DAI L Z, et al. Traffic flow prediction based on adaptive particle swarm optimization of least square support vector machine[J]. Control Engineering of China, 2017, 24(9):1838-1843.)
[7] 賀國(guó)光,馬壽峰,李宇. 基于小波分解與重構(gòu)的交通流短時(shí)預(yù)測(cè)法[J]. 系統(tǒng)工程理論與實(shí)踐, 2002, 22(9):101-106, 131.(HE G G, MA S F, LI Y. Study on the short-term forecasting for traffic flow based on wavelet analysis[J]. System Engineering — Theory and Practice, 2002, 22(9):101-106, 131.)
[8] QIU C Y, WANG C L, ZUO X Q, et al. A Bayesian regularized neural network approach to short-term traffic speed prediction[C]// Proceeding of the 2011 IEEE International Conference on Systems, Man, and Cybernetics. Piscataway: IEEE, 2011: 2215-2220.
[9] KIRBY H R, WATSON S M, DOUGHERTY M S. Should we use neural networks or statistical models for short-term motorway traffic forecasting?[J]. International Journal of Forecasting, 1997, 13(1): 43-50.
[10] SUN S M, CHEN J, SUN J. Traffic congestion prediction based on GPS trajectory data[J]. International Journal of Distributed Sensor Networks, 2019, 15(5): No.1550147719847440.
[11] ZHANG J B, ZHENG Y, QI D K. Deep spatio-temporal residual networks for citywide crowd flows prediction[C]// Proceeding of the 31st AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2017: 1655-1661.
[12] 陳治亞,王小軍. 基于多維度LSTM模型的短時(shí)交通流預(yù)測(cè)[J]. 鐵道科學(xué)與工程學(xué)報(bào), 2020, 17(11):2946-2952.(CHEN Z Y, WANG X J. Short-term traffic flow prediction based on multi-dimensional LSTM model[J]. Journal of Railway Science and Engineering, 2020, 17(11):2946-2952.)
[13] 王體迎,時(shí)鵬超,劉蔣瓊,等. 基于門限遞歸單元循環(huán)神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)方法研究[J]. 重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版), 2018, 37(11):76-82(WANG T Y, SHI P C, LIU J Q, et al. Research on traffic flow prediction method based on gated recurrent unit recurrent neural network[J]. Journal of Chongqing Jiaotong University (Natural Science), 2018, 37(11):76-82.)
[14] GU J X, WANG Z H, KUEN J, et al. Recent advances in convolutional neural networks[J]. Pattern Recognition, 2018, 77: 354-377.
[15] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[16] 高文超,李國(guó)良,塔娜. 路網(wǎng)匹配算法綜述[J]. 軟件學(xué)報(bào), 2018, 29(2):225-250.(GAO W C, LI G L, TA N. Survey of map matching algorithms[J]. Journal of Software, 2018, 29(2):225-250.)
WANG Haiqi, born in 1972, Ph. D., associate professor. His research interests include geographic information, machine learning, spatial/spatiotemporal statistical analysis.
WANG Zhihai, born in 1998, M. S. candidate. His research interests include urban spatial-temporal data prediction, machine learning.
LI Liuke, born in 1997, M. S. candidate. Her research interests include spatiotemporal big data mining, geographic knowledge graph.
KONG Haoran, born in 1997, M. S. candidate. His research interests include geographic named entity recognition.
WANG Qiong, born in 1999, M. S. candidate. His research interests include spatial-temporal big data mining.
XU Jianbo, born in 1994, M. S. candidate. His research interests include spatial-temporal distribution characteristics of cities based on specific themes.
Spatial-temporal prediction model of urban short-term traffic flow based on grid division
WANG Haiqi, WANG Zhihai*, LI Liuke, KONG Haoran, WANG Qiong, XU Jianbo
(,(),266580,)
Accurate traffic flow prediction is very important in helping traffic management departments to take effective traffic control and guidance measures and travelers to plan routes reasonably. Aiming at the problem that the traditional deep learning models do not fully consider the spatial-temporal characteristics of traffic data, a CNN-LSTM prediction model based on attention mechanism, namely STCAL (Spatial-Temporal Convolutional Attention-LSTM network), was established under the theoretical frameworks of Convolutional Neural Network (CNN) and Long Short-Term Memory (LSTM) unit and with the combination of the spatial-temporal characteristics of urban traffic flow. Firstly, the fine-grained grid division method was used to construct the spatial-temporal matrix of traffic flow. Secondly, CNN model was used as a spatial component to extract the spatial characteristics of urban traffic flow in different periods. Finally, the LSTM model based on attention mechanism was used as a dynamic time component to capture the temporal characteristics and trend variability of traffic flow, and the prediction of traffic flow was realized. Experimental results show that compared with Gated Recurrent Unit (GRU) and Spatio-Temporal Residual Network (ST-ResNet), STCAL model has the Root Mean Square Error (RMSE) index reduced by 17.15% and 7.37% respectively, the Mean Absolute Error (MAE) index reduced by 22.75% and 9.14% respectively, and the coefficient of determination (R2) index increased by 11.27% and 2.37% respectively. At the same time, it is found that the proposed model has the prediction effect on weekdays with high regularity higher than that on weekends, and has the best prediction effect of morning peak on weekdays, showing that it can provide a basis for short-term urban regional traffic flow change monitoring.
short-term traffic flow prediction; spatial-temporal feature; Convolutional Neural Network (CNN); Long Short-Term Memory (LSTM); attention mechanism
This work is partially supported by National Natural Science Foundation of China (62071492), Natural Science Foundation of Shandong Province (ZR202102180193).
TP181
A
1001-9081(2022)07-2274-07
10.11772/j.issn.1001-9081.2021050838
2021?05?21;
2021?09?15;
2021?09?22。
國(guó)家自然科學(xué)基金資助項(xiàng)目(62071492);山東省自然科學(xué)基金資助項(xiàng)目(ZR202102180193)。
王海起(1972—),男,河南南陽人,副教授,博士,主要研究方向:地理信息、機(jī)器學(xué)習(xí)、空間和時(shí)空統(tǒng)計(jì)分析; 王志海(1998—),男,山東濰坊人,碩士研究生,主要研究方向:城市時(shí)空數(shù)據(jù)預(yù)測(cè)、機(jī)器學(xué)習(xí); 李留珂(1997—),女,河南商丘人,碩士研究生,主要研究方向:時(shí)空大數(shù)據(jù)挖掘、地理知識(shí)圖譜; 孔浩然(1997—),男,山東濟(jì)寧人,碩士研究生,主要研究方向:地理命名實(shí)體識(shí)別; 王瓊(1999—),男,安徽宿州人,碩士研究生,主要研究方向:時(shí)空大數(shù)據(jù)挖掘; 徐建波(1994—),男,江蘇鹽城人,碩士研究生,主要研究方向:基于特定主題的城市時(shí)空分布特征。