摘 要:目前,基于深度學(xué)習(xí)的交通流量預(yù)測(cè)方法存在不足。首先,基于圖卷積網(wǎng)絡(luò)的預(yù)測(cè)模型使用簡(jiǎn)化的路網(wǎng)拓?fù)?,忽視了?shí)際交通組織信息,影響預(yù)測(cè)準(zhǔn)確性。其次,基于聚類的預(yù)測(cè)模型未考慮交通流的區(qū)域和時(shí)間相似性,未能有效利用時(shí)空模式,導(dǎo)致聚類結(jié)果對(duì)預(yù)測(cè)提升有限。此外,過大的訓(xùn)練樣本增加了訓(xùn)練和預(yù)測(cè)時(shí)間,影響實(shí)時(shí)性。為了解決上述問題,提出了基于深度聚類的城市卡口短時(shí)流量預(yù)測(cè)模型(deep temporal clustering traffic flow prediction,DTCTFP)。首先,構(gòu)建包含實(shí)際交通組織信息的路網(wǎng)拓?fù)?,利用圖卷積網(wǎng)絡(luò)挖掘卡口間的時(shí)空特性;其次,引入改進(jìn)的動(dòng)態(tài)時(shí)間規(guī)整和最短路徑分析方法,將相似的交通流對(duì)象歸類到同一簇,使模型充分利用流量、時(shí)間、位置等特征信息,提升預(yù)測(cè)精度;最后利用基于簇的循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),提高模型的實(shí)時(shí)性和計(jì)算效率?;谥貞c大渡口交通數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果顯示,相較于最新基準(zhǔn)模型,在MAE、RMSE、MAPE指標(biāo)上,平均降低了15.02%、10.72%、10.98%,并通過消融實(shí)驗(yàn)證實(shí)了所提出的聚類方法能夠提升14.5%的預(yù)測(cè)準(zhǔn)確性。
關(guān)鍵詞: 深度聚類; 交通流量預(yù)測(cè); 循環(huán)神經(jīng)網(wǎng)絡(luò); 動(dòng)態(tài)時(shí)間規(guī)整; 交通卡口
中圖分類號(hào): TP391 文獻(xiàn)標(biāo)志碼: A 文章編號(hào): 1001-3695(2025)02-007-0371-10
doi: 10.19734/j.issn.1001-3695.2024.07.0284
Short-term traffic flow prediction of city intersection
based on deep temporal clustering
Guo Jian1, Zheng Jiaoling1’, Qiao Shaojie1, Deng Hongyao2, Sun Jigang2, Li Xinjia2
(1. School of Software Engineering, Chengdu University of Information Technology, Chengdu 610225, China; 2. Sichuan Efang Intelligence Technology Co., Ltd., Chengdu 610000, China)
Abstract:Currently, deep learning-based traffic flow prediction methods have deficiencies. Firstly, the prediction model based on graph convolutional network uses a simplified road network topology, ignores the actual traffic organization information, and affects the prediction accuracy. Secondly, the clustering-based prediction model does not consider the regional and temporal similarity of traffic flow and fails to effectively utilize spatio-temporal patterns, resulting in limited enhancement of prediction by clustering results. In addition, overly large training samples increases the training and prediction time, affecting real-time performance. In order to solve the above problems, this paper proposed a deep temporal clustering traffic flow prediction (DTCTFP) model based on deep temporal clustering for short-term traffic flow prediction at urban chokepoints. Firstly, the method constructed the road network topology containing actual traffic organization information and used a graph convolutional network to mine the spatio-temporal characteristics between chokepoints. Secondly, it introduced improved dynamic temporal regularization and shortest path analysis methods to classify similar traffic flow objects into the same cluster, allowing the model to make full use of feature information such as flow rate, time, and location to improve prediction accuracy. Finally, it used a cluster-based recurrent neural network for prediction to enhance the real-time and computational efficiency of the model. Using Chongqing Dadukou traffic data, experiments show that the model reduces MAE, RMSE, and MAPE by 15.02%, 10.72%, and 10.98% on average compared to the latest benchmark. The ablation test also confirms a 14.5% improvement in prediction accuracy with the proposed clustering method.
Key words:deep clustering; traffic flow prediction; recurrent neural network; dynamic time warping; traffic intersection
0 引言
十字路口交通信號(hào)控制是調(diào)節(jié)交通流量、緩解交通擁堵的一種低成本手段。隨著數(shù)據(jù)采集技術(shù)的成熟,數(shù)據(jù)驅(qū)動(dòng)的交通流量預(yù)測(cè)方法因其能夠識(shí)別隱藏在歷史數(shù)據(jù)中的交通流特征而日益成為主流交通量預(yù)測(cè)方法。
從時(shí)間關(guān)系的角度來看,交通流量數(shù)據(jù)由一組時(shí)間序列組成。雖然每個(gè)位置的交通狀況不斷變化,但每個(gè)時(shí)間片的交通狀態(tài)與其最近的過去狀態(tài)密切相關(guān)。為捕捉這種時(shí)間關(guān)系,研究者們采用了參數(shù)或非參數(shù)方法。Lyu等人[1]將自編碼器(autoencoder,AE)應(yīng)用于高速公路交通流預(yù)測(cè)。結(jié)果證實(shí),該方法從交通數(shù)據(jù)中識(shí)別出了潛在的交通流特征,如非線性時(shí)空相關(guān)性。Pang等人[2]應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)提取時(shí)間維度的特征,用于公交出行時(shí)間和到達(dá)時(shí)間預(yù)測(cè)。結(jié)果表明,RNN的優(yōu)勢(shì)在于學(xué)習(xí)與時(shí)間序列相關(guān)的任務(wù)。然而,RNN存在梯度消失問題,為了解決這一問題,提出了長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[3]。Abduljabbar等人[4]應(yīng)用LSTM預(yù)測(cè)單條道路的交通速度和流量。研究結(jié)果表明,LSTM及其變體有效地捕獲了交通數(shù)據(jù)的短期變化。
從空間關(guān)系的角度來看,交通路網(wǎng)拓?fù)浣Y(jié)構(gòu)的不規(guī)則性使得人工構(gòu)建網(wǎng)絡(luò)級(jí)規(guī)則輸入變得非常困難。為了滿足這一要求,引入圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[5]從基于圖的數(shù)據(jù)中預(yù)測(cè)交通流量和速度[6~8]。對(duì)于基于圖的數(shù)據(jù),每個(gè)檢測(cè)器的位置都被視為一個(gè)節(jié)點(diǎn),并捕獲相鄰節(jié)點(diǎn)之間的空間關(guān)系。圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)[9]可以使用譜圖理論將卷積操作擴(kuò)展到非歐幾里德域。然而,如果增加更多的GCN層,數(shù)據(jù)將會(huì)過度擬合。而且,GCN中每個(gè)節(jié)點(diǎn)的鄰居數(shù)量是固定的,不能反映實(shí)際的流量情況,提取網(wǎng)絡(luò)中所有探測(cè)器的交通流量變化仍然很困難。道路網(wǎng)絡(luò)的出行行為是復(fù)雜的、動(dòng)態(tài)的,用一張圖很難捕捉到所有檢測(cè)器的所有特征。使用所有檢測(cè)器作為節(jié)點(diǎn)將導(dǎo)致一個(gè)非常大的圖。而且,學(xué)習(xí)如此龐大的圖也非常具有挑戰(zhàn)性,很容易過擬合。
除了從流量數(shù)據(jù)中提取時(shí)空相關(guān)性以進(jìn)行準(zhǔn)確預(yù)測(cè)外,研究人員還將重點(diǎn)放在了網(wǎng)絡(luò)級(jí)交通流量預(yù)測(cè)上。許多研究都集中在高速公路數(shù)據(jù)上,如Caltrans Performance Measurement System (PeMS)[10]提供的由加州運(yùn)輸公司在加州高速公路上實(shí)時(shí)采集的高速公路流量數(shù)據(jù)集。但由于交通信號(hào)控制而更加復(fù)雜的城市交通流量卻很少得到研究。Vlahogianni等人[11]報(bào)道,人口密集的城市道路網(wǎng)絡(luò)中的相互作用使得網(wǎng)絡(luò)級(jí)預(yù)測(cè)具有挑戰(zhàn)性。
目前大部分短時(shí)交通量預(yù)測(cè)方法局限于高速公路和城市主干道。然而,將這些方法推廣到涉及不同功能的多個(gè)路段、異構(gòu)道路網(wǎng)絡(luò)中是具有挑戰(zhàn)性的。
如圖1(a)所示,在重慶市大渡口某區(qū)域存在四個(gè)卡口,它們展示了交通流數(shù)據(jù)具有時(shí)間和空間屬性的特點(diǎn)。在早高峰時(shí)段(7:00~9:00),這四個(gè)卡口的流量變化趨勢(shì)如圖1(b)所示,并通過深度學(xué)習(xí)模型提取了特征,時(shí)間粒度為5 min,時(shí)間跨度為一周。觀察發(fā)現(xiàn),卡口1和3的流量變化更為相似,而卡口2和4的流量變化更為相似。圖中黑色虛線部分為周一早高峰的變化情況(見電子版),在這24個(gè)時(shí)間點(diǎn)中,可以觀察到四個(gè)不同的卡口在早高峰期間表現(xiàn)出不同的特征。其中卡口1和3呈現(xiàn)出相似的波動(dòng)變化,具有明顯的周期性。與此不同,卡口2和4在早高峰期間車流量始終保持在較高位置,變化幅度大。這種現(xiàn)象可能有以下原因:卡口1和3位于立交橋的出口,而卡口2靠近醫(yī)院,卡口4則在學(xué)校附近。在早高峰時(shí)段,主要的車流是由南向北流動(dòng)的。醫(yī)院和學(xué)校周圍的交通情況通常更為復(fù)雜,流量波動(dòng)也更加顯著。
針對(duì)上述問題,本文提出了基于深度聚類的交通流時(shí)間序列預(yù)測(cè)框架DTCTFP,下文將具體進(jìn)行介紹。
1 問題定義
定義1 交通流序列。給定一個(gè)大規(guī)模路網(wǎng)Φ由Nsection(后續(xù)簡(jiǎn)寫為Nsect)個(gè)卡口組成,Φ={x(i)}Nsect,卡口x(i)包含的路段集合為L(zhǎng)i,其中x(i)=[x(i)1,x(i)2,…,x(i)Nhist]表示第i個(gè)卡口上的歷史交通流序列。
原始問題:流量預(yù)測(cè)。交通流量預(yù)測(cè)的目標(biāo)是構(gòu)建歷史流量值xNhist與未來流量值xNpred之間的映射函數(shù)f(·):
x(i)n+Npred=f(x(i)n-Nhist+1,x(i)n-Nhist+2,…,x(i)n)(1)
在交通流量預(yù)測(cè)中,傳統(tǒng)的方法通常是直接構(gòu)建歷史流量值與未來流量值之間的映射函數(shù),如式(1)。這種方法雖然可以在一定程度上捕捉交通流量的變化趨勢(shì),但在處理大規(guī)模路網(wǎng)時(shí)可能存在一些局限性,直接對(duì)整個(gè)路網(wǎng)的所有卡口應(yīng)用單一模型,可能難以有效捕捉各個(gè)區(qū)域內(nèi)流量模式的差異,尤其是在路網(wǎng)規(guī)模龐大、卡口眾多的情況下。為了更精準(zhǔn)地預(yù)測(cè)各個(gè)區(qū)域的流量,本文提出了一種基于聚類的流量預(yù)測(cè)方法。
本文要解決的問題(基于聚類的流量預(yù)測(cè)):將大規(guī)模路網(wǎng)Φ劃分為k簇{C(1),C(2),…,C(k)}的過程稱為交通流序列聚類,C(k)表示第k簇,其中0lt;klt;lt;Nsect,x(i,k)表示第i個(gè)卡口聚集到第k簇C(k)中,x(k)trend表示每簇聚類中心。這種方法是基于某一相似性度量將特征相似的交通流序列分在同一簇。而在每個(gè)簇中,為所有卡口訓(xùn)練一個(gè)基于簇模型的預(yù)測(cè)模型,C(k)dynamic={x(i,k)Nhist}為由滑動(dòng)窗口生成的每簇動(dòng)態(tài)的訓(xùn)練樣本,C(k)pred={x(i,k)Npred}為每簇預(yù)測(cè)的流量值:
C(k)pred=f(k)(C(k)dynamic)(2)
當(dāng)前問題面臨的挑戰(zhàn)及解決方案:
現(xiàn)有基于聚類的交通流量預(yù)測(cè)模型通常以時(shí)間序列聚類為主,側(cè)重于通過時(shí)序相似性來挖掘交通流量的變化規(guī)律。這類方法假設(shè)相似的時(shí)間序列模式意味著相似的交通流狀況,因此常忽略交通流在時(shí)間和空間上的復(fù)雜特性。然而,交通流不僅在時(shí)間上表現(xiàn)出高峰期的錯(cuò)位、波動(dòng)等非線性特征,還在空間上受到交通組織措施的顯著影響。僅僅依賴時(shí)間序列的聚類分析,往往難以捕捉這些關(guān)鍵因素。因此,必須結(jié)合時(shí)間和空間兩個(gè)角度對(duì)交通流量進(jìn)行更深入地分析。
在時(shí)間維度上,交通流量表現(xiàn)出復(fù)雜的非線性特征,不同位置的高峰時(shí)段可能存在顯著的時(shí)間錯(cuò)位;而在空間維度上,交通流量不僅僅受物理距離的影響,交通管制和組織措施對(duì)交通流量的分布和流動(dòng)同樣起著至關(guān)重要的作用。這兩者都對(duì)現(xiàn)有基于時(shí)間序列聚類和圖卷積網(wǎng)絡(luò)的方法提出了挑戰(zhàn)。時(shí)間維度主要面臨挑戰(zhàn)1,而空間維度則主要體現(xiàn)為挑戰(zhàn)2。
a)挑戰(zhàn)1:現(xiàn)有基于聚類的交通流量預(yù)測(cè)模型中,時(shí)序聚類算法未能充分挖掘交通流的非線性特征。在圖1中,可以看到卡口2的早高峰時(shí)間明顯早于卡口4的早高峰時(shí)間,這表明交通流量在不同地點(diǎn)的時(shí)序差異。這種時(shí)間上的錯(cuò)位不僅反映了交通流受時(shí)間和空間兩個(gè)維度的復(fù)雜影響,還會(huì)導(dǎo)致傳統(tǒng)的相似性度量方法如動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)[12]在對(duì)齊和捕捉這種時(shí)序延遲時(shí)出現(xiàn)問題。由于卡口2和4兩個(gè)交通流序列在趨勢(shì)形狀上基本一致但出現(xiàn)了平移、壓縮和拉伸現(xiàn)象,DTW錯(cuò)誤地將交通流數(shù)據(jù)的不同部分進(jìn)行匹配,導(dǎo)致病態(tài)對(duì)齊現(xiàn)象。這種錯(cuò)誤的對(duì)齊會(huì)使得DTW算法無法準(zhǔn)確反映實(shí)際的交通流時(shí)空特征,從而限制了基于DTW的聚類結(jié)果在預(yù)測(cè)中的有效性。
針對(duì)挑戰(zhàn)1,在圖2(a)交通流聚類模塊中,改進(jìn)后的梯度約束動(dòng)態(tài)時(shí)間規(guī)整算法在原有基礎(chǔ)上進(jìn)行了重要優(yōu)化,不僅對(duì)早高峰期間交通流對(duì)齊路徑的斜率變化進(jìn)行了限制,還增強(qiáng)了對(duì)交通流序列中噪聲和突發(fā)事件的應(yīng)對(duì)能力。具體而言,該算法通過對(duì)齊路徑的斜率進(jìn)行梯度約束,避免了在交通流延遲現(xiàn)象下出現(xiàn)的病態(tài)對(duì)齊問題。這種改進(jìn)使得算法在處理實(shí)際交通數(shù)據(jù)時(shí)更為魯棒,特別是在早高峰等關(guān)鍵時(shí)段,能夠更準(zhǔn)確地匹配具有復(fù)雜時(shí)空特征的流量模式。
b)挑戰(zhàn)2:如圖1所示,卡口2實(shí)施了“禁止左轉(zhuǎn)”的交通管制措施,導(dǎo)致卡口1和2雖然在物理距離上很近,但早高峰的流量變化情況卻完全不同。這表明,交通組織信息(如“禁止左轉(zhuǎn)”)對(duì)交通流量的影響非常顯著,并直接影響交通流的分布和變化。然而,現(xiàn)有的基于圖卷積網(wǎng)絡(luò)的交通流量預(yù)測(cè)模型通常通過交通網(wǎng)絡(luò)的物理結(jié)構(gòu)來構(gòu)建節(jié)點(diǎn)關(guān)系,例如基于節(jié)點(diǎn)之間的地理距離。這些模型假設(shè)物理上相鄰或距離較近的交通節(jié)點(diǎn)之間存在較強(qiáng)的交通流依賴性,因此更有可能受到相似的交通流量變化影響。然而,這種基于物理結(jié)構(gòu)的方式雖然能夠捕捉一定程度上的交通關(guān)聯(lián)性,但與實(shí)際的交通流量動(dòng)態(tài)變化并不完全貼切。交通流量不僅受到地理距離的影響,還受到諸如交通組織措施的顯著影響。這些措施能夠顯著改變流量的分布與流動(dòng)方向,導(dǎo)致物理距離較近的節(jié)點(diǎn)在流量表現(xiàn)上可能截然不同。
針對(duì)挑戰(zhàn)2,在圖2(b)路網(wǎng)特征提取模塊中提出了一種改進(jìn)的路網(wǎng)建模方法,以路段而非單個(gè)卡口作為節(jié)點(diǎn),構(gòu)建更具代表性的路網(wǎng)拓?fù)浣Y(jié)構(gòu)。在這一拓?fù)浣Y(jié)構(gòu)中,實(shí)際的交通組織信息,如“禁止左轉(zhuǎn)”等交通管制措施,被充分考慮并納入模型。這種方法不僅反映了交通網(wǎng)絡(luò)的物理連接,還捕捉了更復(fù)雜的交通規(guī)則和管制信息的影響。在早高峰期間,某些路段的流量可能會(huì)受到前方路段的交通管制措施的影響,導(dǎo)致非線性的流量變化。GCN通過整合這些復(fù)雜的關(guān)系,能夠更精準(zhǔn)地捕捉不同路段之間的流量變化規(guī)律,從而提高交通流量預(yù)測(cè)的準(zhǔn)確性。早高峰時(shí)段,交通流量變化頻繁且復(fù)雜,傳統(tǒng)模型可能難以準(zhǔn)確預(yù)測(cè)此時(shí)的流量動(dòng)態(tài)。而改進(jìn)后的模型通過綜合考慮物理結(jié)構(gòu)和交通組織信息,使得預(yù)測(cè)結(jié)果更貼近實(shí)際情況。
c)挑戰(zhàn)3:在交通流量預(yù)測(cè)中,實(shí)時(shí)性是一個(gè)至關(guān)重要的因素。準(zhǔn)確的流量預(yù)測(cè)需要模型能夠在短時(shí)間內(nèi)處理大量數(shù)據(jù)并生成結(jié)果。然而,當(dāng)訓(xùn)練樣本規(guī)模過大時(shí),模型的訓(xùn)練和預(yù)測(cè)時(shí)間可能顯著延長(zhǎng),這直接影響到預(yù)測(cè)結(jié)果的實(shí)時(shí)性。交通流量數(shù)據(jù)通常是連續(xù)的,并且隨著時(shí)間推移不斷積累,這導(dǎo)致模型在面對(duì)龐大數(shù)據(jù)集時(shí),計(jì)算負(fù)擔(dān)和資源消耗大幅增加。如果訓(xùn)練時(shí)間過長(zhǎng),模型的響應(yīng)速度會(huì)下降,無法滿足實(shí)際交通管理和調(diào)度的實(shí)時(shí)需求。
針對(duì)挑戰(zhàn)3,提出了基于模型共享的理念,如圖2(c)模型共享模塊,該模塊旨在提高交通流預(yù)測(cè)的實(shí)時(shí)性。這種方法通過對(duì)交通流模式進(jìn)行聚類,將具有相似交通特征的卡口分為同一簇,然后為每個(gè)簇構(gòu)建一個(gè)共享的預(yù)測(cè)模型。與傳統(tǒng)的獨(dú)立模型相比,這種基于簇的模型構(gòu)建方式顯著減少了需要訓(xùn)練的模型數(shù)量,從而有效降低了訓(xùn)練時(shí)間和計(jì)算資源的消耗。模型共享策略使得實(shí)時(shí)預(yù)測(cè)能力得到顯著提升,能夠及時(shí)響應(yīng)交通流量的動(dòng)態(tài)變化,為交通管理提供更具時(shí)效性的支持。
2 模型框架
模型框架的體系結(jié)構(gòu)如圖2所示,其主要功能包括深度聚類和流量預(yù)測(cè)。該模型由交通流聚類、路網(wǎng)特征提取以及模型共享三個(gè)關(guān)鍵部分組成。圖2(a)交通流聚類模塊主要功能是將具有時(shí)間相似性和空間相關(guān)性的交通流對(duì)象聚合成一簇,以便更好地理解和分析交通流的模式和行為。模塊通過輸入卡口的歷史流量數(shù)據(jù),能夠輸出k簇交通流,以及相應(yīng)的k種流量模式。圖2(b)路網(wǎng)特征提取模塊的主要功能是從構(gòu)建的實(shí)際交通組織信息的路網(wǎng)中提取特征。它將同一卡口的多個(gè)路段特征進(jìn)行聚合,并將卡口級(jí)別的特征按簇分離,每個(gè)簇的數(shù)據(jù)包含空間信息的時(shí)序數(shù)據(jù)。模塊通過輸入k簇交通流、具有交通組織信息的路網(wǎng)拓?fù)洌軌蜉敵鰇簇卡口級(jí)別的特征。圖2(c)模型共享模塊通過基于簇的模型,構(gòu)建了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)系統(tǒng),同時(shí)融合了對(duì)應(yīng)的流量模式。模塊通過將k種流量模式和k簇卡口級(jí)別的特征融合后作為輸入,輸出每個(gè)卡口的預(yù)測(cè)數(shù)據(jù)。
2.1 深度聚類
2.1.1 時(shí)間序列的時(shí)間相關(guān)性分析
交通流時(shí)間特征處理的目標(biāo)是從時(shí)間序列數(shù)據(jù)中提取有效的低維度表征,同時(shí)衡量這些表征之間的相似性。為了實(shí)現(xiàn)這一目標(biāo),本文采用深度自編碼器提取時(shí)間序列特征,并運(yùn)用改進(jìn)的動(dòng)態(tài)時(shí)間規(guī)整方法確定它們之間的相似度。
1)時(shí)間特征提取
通過對(duì)交通流時(shí)間序列數(shù)據(jù)進(jìn)行特征提取,可以自動(dòng)學(xué)習(xí)并保留數(shù)據(jù)中的短期波動(dòng)特征、長(zhǎng)期趨勢(shì)特征、周期性特征以及異常特征。這些特征反映了交通流量隨時(shí)間的變化模式,包括高峰時(shí)段的突增流量、隨時(shí)間推移的增長(zhǎng)或減少、每周的周期性變化,以及由于事故或天氣變化引起的異常流量。
時(shí)序聚類中,有效的潛在特征對(duì)于處理動(dòng)態(tài)和不確定的交通流至關(guān)重要。與靜態(tài)數(shù)據(jù)不同,交通流數(shù)據(jù)需要考慮時(shí)間上的變化。一種常見的方法是使用滑動(dòng)窗口來處理這種動(dòng)態(tài)性,通過選擇適當(dāng)大小的時(shí)間窗口,可以獲得近期歷史車流數(shù)據(jù),從而反映當(dāng)前交通流的狀態(tài)。
在得到最新的車流時(shí)序數(shù)據(jù)后,采用深度自編碼器(deep autoencoder)[13]來提取特征是一種有效的方法,提取過程如圖3所示。這個(gè)自編碼器的設(shè)計(jì)包括三個(gè)關(guān)鍵層次。首先,第一層采用了1D卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[14]。其主要作用是通過卷積操作降低時(shí)間序列數(shù)據(jù)的維度,同時(shí)捕捉時(shí)間序列中的非線性特征。通過這一層的處理,可以將原始數(shù)據(jù)轉(zhuǎn)換為更具有代表性的特征表示。其次,第二層采用最大池化(max pooling)操作。最大池化的主要目的是進(jìn)一步降低卷積結(jié)果的維度,從而減少模型的計(jì)算復(fù)雜度和參數(shù)數(shù)量。通過保留每個(gè)卷積核輸出中的最大值,最大池化能夠提取出最顯著的特征信息,使得后續(xù)處理更加高效。最后,第三層采用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(bi-directional long short-term memory recurrent neural network,Bi-LSTM)[15]。Bi-LSTM具有記憶能力,能夠有效地捕捉時(shí)間序列數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系,并且通過雙向結(jié)構(gòu),可以同時(shí)提取出時(shí)間序列數(shù)據(jù)前向和反向兩個(gè)時(shí)間維度的特征信息。這種設(shè)計(jì)使得模型能夠更全面地理解時(shí)間序列數(shù)據(jù)中的時(shí)序特征。
在解碼器中,首先通過上采樣層對(duì)數(shù)據(jù)進(jìn)行初步重構(gòu),然后通過反卷積層對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步重構(gòu),以得到解碼器的重構(gòu)數(shù)據(jù)。
損失函數(shù)采用均方誤差(mean squared error,MSE),用于衡量解碼器的重構(gòu)輸出數(shù)據(jù)與輸入編碼器的原始數(shù)據(jù)之間的差異。原始的車流時(shí)序數(shù)據(jù)為x(i)=[x(i)1,x(i)2,…,x(i)n],模型的編碼器輸出為y(i)=[y(i)1,y(i)2,…,y(i)m],其中mlt;lt;n,解碼器輸出為(i)=[(i)1,(i)2,…,(i)n],自編碼器的損失函數(shù)為
Lrecon=1N∑Nj=1((i)j-x(i)j)2(3)
基于交通流時(shí)間序列潛在特征提取如算法1所示。
算法1 交通流數(shù)據(jù)潛在特征提取算法
輸入:歷史交通流時(shí)間序列數(shù)據(jù)x(i)Nhist。
輸出:交通流的潛在特征y(i)。
a) 通過滑動(dòng)窗口從歷史數(shù)據(jù)x(i)Nhist中獲取近期歷史車流數(shù)據(jù)x(i)
b) for i=1 to N do
c)
將時(shí)間序列數(shù)據(jù)x(i)輸入到encoder中得到特征向量y(i)
d)
將特征向量y(i)輸入到decoder中得到重構(gòu)數(shù)據(jù)(i)
e)
計(jì)算重構(gòu)損失Lrecon
f)
基于SGDM方法,反向傳播更新網(wǎng)絡(luò)模型
g) end for
h) return 潛在特征y(i)
2) GCDTW距離計(jì)算
動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)作為廣泛采用的彈性相似性度量之一,旨在通過更精準(zhǔn)地對(duì)齊扭曲時(shí)間軸來彌補(bǔ)歐氏距離等傳統(tǒng)距離度量方法的不足。然而,傳統(tǒng)的DTW方法在時(shí)間序列之間的局部相似性或相關(guān)性不夠清晰時(shí)會(huì)出現(xiàn)病態(tài)對(duì)齊的問題,這一問題并沒有得到很好的解決。在這種情況下,本文提出梯度約束DTW(gradient-constrained dynamic time warping,GCDTW)作為一種新的變體方法,引入了梯度約束,限制了對(duì)齊路徑的斜率變化,有效地解決了病態(tài)對(duì)齊問題。
給定任意兩個(gè)卡口的時(shí)間序列x(1)=[x(1)1,x(1)2,…,x(1)n]、x(2)=[x(2)1,x(2)2,…,x(2)n],它們所對(duì)應(yīng)的低緯度特征分別為y(1)=[y(1)1,y(1)2,…,y(1)m]、y(2)=[y(2)1,y(2)2,…,y(2)m],其中mlt;lt;n。為了計(jì)算兩個(gè)卡口時(shí)間序列所對(duì)應(yīng)的特征之間的距離,構(gòu)建并初始化距離矩陣,從距離矩陣的左上角開始,使用一種距離度量方法(如歐氏距離),計(jì)算到達(dá)每個(gè)單元格的最小累積距離,通過回溯從終點(diǎn)到起點(diǎn)的路徑,選擇累積距離最小的路徑。圖4(b)為GCDTW計(jì)算的原理圖,紅色部分為DTW對(duì)齊路徑(見電子版)。為了限制對(duì)齊路徑的斜率變化,引入梯度約束函數(shù)
g(i, j)=|(i-iprev)-(j-jprev)|(4)
其中:(iprev, jprev)是前一個(gè)對(duì)齊點(diǎn)的坐標(biāo)。GCDTW距離可表示為
D(y(1)i,y(2)j)=d(y(1)i,y(2)j)+
minD(y(1)i-1,y(2)j)+a·g(i-1, j),
D(y(1)i,y(2)j-1)+a·g(i, j-1),
D(y(1)i-1,y(2)j-1)+a·g(i-1, j-1)(5)
其中:a是梯度約束的權(quán)重參數(shù);累積距離D(y(1)i,y(2)j)為當(dāng)前格點(diǎn)距離d(y(1)i,y(2)j),也就是點(diǎn)y(1)i和y(2)j的歐氏距離與可以到達(dá)該點(diǎn)的最小鄰近元素的累積距離之和。
圖4(a)展示了兩個(gè)卡口在某天早高峰時(shí)段的流量變化情況,并通過GCDTW計(jì)算兩條序列之間的相似度。相比之下,歐氏距離只是簡(jiǎn)單地考慮了數(shù)據(jù)點(diǎn)之間的距離,而忽略了時(shí)間上的結(jié)構(gòu),這可能導(dǎo)致其無法準(zhǔn)確捕捉到兩個(gè)時(shí)間序列在趨勢(shì)形狀上基本一致但出現(xiàn)了平移、壓縮和拉伸現(xiàn)象的相似度。由于城市路網(wǎng)的復(fù)雜性,卡口之間的交通流受時(shí)間和空間兩個(gè)維度的影響,出現(xiàn)延遲的現(xiàn)象時(shí)有發(fā)生,在圖4(a)中,可以觀察到兩個(gè)卡口的時(shí)間序列在7:05~7:30出現(xiàn)了平移現(xiàn)象,而在7:45~8:00出現(xiàn)了拉伸現(xiàn)象。
時(shí)間序列數(shù)據(jù)的降維處理雖然能夠提取出關(guān)鍵特征,但這些特征序列往往依舊保留著非線性的時(shí)間扭曲特性。此外,由于傳感器故障、數(shù)據(jù)采集誤差或偶發(fā)的交通事件,某些特征值可能會(huì)異常飆升,形成異常高峰。在這種情況下,傳統(tǒng)的歐氏距離度量方法會(huì)受到較大影響,因?yàn)樗鼰o法區(qū)分正常波動(dòng)與異常峰值。
與此相對(duì),GCDTW算法通過選擇性地繞過這些異常點(diǎn),能夠更有效地適應(yīng)數(shù)據(jù)中的噪聲和突發(fā)事件。GCDTW算法的核心優(yōu)勢(shì)在于其動(dòng)態(tài)路徑選擇機(jī)制,它允許算法在比較兩個(gè)時(shí)間序列時(shí),靈活地調(diào)整時(shí)間軸,從而最小化噪聲和突發(fā)事件的負(fù)面影響。這種獨(dú)特的動(dòng)態(tài)調(diào)整能力使得GCDTW算法在處理含有噪聲和異常值的時(shí)間序列數(shù)據(jù)時(shí),展現(xiàn)出更高的魯棒性和適應(yīng)性。因此,本文采用GCDTW計(jì)算相似度,以更好地反映交通流時(shí)間序列之間的真實(shí)相似程度。
2.1.2 時(shí)間序列的空間關(guān)聯(lián)性分析
本文的目標(biāo)是通過給定的路段卡口信息、路段長(zhǎng)度和卡口“禁左”信息來提取卡口空間特征。為了實(shí)現(xiàn)這一目標(biāo),本文將路段作為節(jié)點(diǎn)對(duì)路網(wǎng)進(jìn)行建模,并運(yùn)用迪杰斯特拉算法計(jì)算真實(shí)場(chǎng)景下卡口間的最短路徑。
1)路網(wǎng)建模
建立以路段為節(jié)點(diǎn)的路網(wǎng)拓?fù)浣Y(jié)構(gòu)如圖5(c)所示,將其描述為一個(gè)帶有權(quán)重的有向圖結(jié)構(gòu)G=(V,E,W),其中V為節(jié)點(diǎn)集,每個(gè)節(jié)點(diǎn)代表一個(gè)路段;E為圖的邊集,每個(gè)邊表示節(jié)點(diǎn)之間的連接關(guān)系;W為邊的權(quán)重即距離。特別是對(duì)于卡口2,由于其東西方向?qū)嵤┝恕敖棺筠D(zhuǎn)”的交通管制措施,在有向圖中對(duì)1號(hào)節(jié)點(diǎn)和7號(hào)節(jié)點(diǎn)相連的邊賦予了一個(gè)非常大但有限的權(quán)重值(圖5(c)中的虛線部分)。這樣可以保留邊的物理存在,同時(shí)確保在正常的交通分析中這些邊不會(huì)被考慮。如果交通管制措施取消,該權(quán)重可以自動(dòng)或手動(dòng)調(diào)整到新的水平。通過這種方式,有向圖G不僅能夠反映路網(wǎng)的物理結(jié)構(gòu),還包含了交通規(guī)則,為時(shí)間序列的空間關(guān)聯(lián)性分析提供了更加全面的視角。
2)Dijkstra最短路徑計(jì)算
迪杰斯特拉(Dijkstra)[16]是一種經(jīng)典的最短路徑算法,用于計(jì)算一個(gè)節(jié)點(diǎn)到其他節(jié)點(diǎn)的最短路徑。其主要特點(diǎn)是以起始點(diǎn)為中心,逐層向外擴(kuò)展(類似廣度優(yōu)先遍歷),直到擴(kuò)展到終點(diǎn)為止。本文利用路段長(zhǎng)度作為邊的權(quán)重,以在計(jì)算最短路徑時(shí)考慮道路的實(shí)際距離。如圖6所示,由于卡口2實(shí)施了“禁止左轉(zhuǎn)”的交通管制措施,導(dǎo)致卡口1和4之間的實(shí)際通行路徑存在差異:從卡口4到1的最短路徑為837 m,而從卡口1到4的最短路徑則為513 m。
2.1.3 特征矩陣加權(quán)融合
特征矩陣D1、D2分別為歸一化后的時(shí)序特征矩陣和卡口最短路徑矩陣的描述。設(shè)特征矩陣D1、D2對(duì)應(yīng)的權(quán)重分別為w1和w2,目標(biāo)是最大化輪廓系數(shù)S,最小化聚類的損失函數(shù)Lsc:
Lsc=-S(6)
該損失函數(shù)基于聚類質(zhì)量指標(biāo)輪廓系數(shù)的效果來評(píng)估,使用梯度下降法更新權(quán)重,更新規(guī)則如下所示。
w(t+1)1=w(t)1-a?Lsc?w1
w(t+1)2=w(t)2-a?Lsc?w2(7)
其中:a是學(xué)習(xí)率;t表示迭代次數(shù)。偏導(dǎo)數(shù)可以反映出微調(diào)權(quán)重w1和w2時(shí),損失函數(shù)Lsc的變化情況。期望最小化損失函數(shù),即期望損失函數(shù)對(duì)權(quán)重的變化率為負(fù)數(shù)。如果增加w1或w2會(huì)使損失函數(shù)減少,那么就應(yīng)該增加它們的值,反之亦然。加權(quán)融合后得到特征矩陣D′:
D′=w1·D1+w2·D2(8)
2.1.4 K-means++聚類
在交通流時(shí)間序列聚類中,K-means++[17]展現(xiàn)了獨(dú)特的優(yōu)勢(shì)。相比其他聚類算法,K-means++在處理大規(guī)模交通流數(shù)據(jù)時(shí)具有更高的計(jì)算效率,尤其是在初始中心選擇方面,其改進(jìn)的機(jī)制可以更好地捕捉交通流模式,減少隨機(jī)初始化帶來的誤差。層次聚類雖然能夠捕捉交通流的層次結(jié)構(gòu),但計(jì)算復(fù)雜度較高且難以擴(kuò)展至大規(guī)模數(shù)據(jù)。相比之下,K-means++能夠在保持聚類質(zhì)量的同時(shí),處理大量交通流時(shí)間序列數(shù)據(jù)。此外,盡管DBSCAN[18]能識(shí)別不同形狀的流量模式,并處理噪聲數(shù)據(jù),但其參數(shù)調(diào)整較為復(fù)雜,而K-means++則提供了更為直觀和穩(wěn)定的結(jié)果。在與高斯混合模型的比較中,盡管GMM[19]在處理不同流量形態(tài)時(shí)表現(xiàn)良好,但其計(jì)算復(fù)雜度較高,K-means++則在識(shí)別和分析交通流中的相似模式時(shí)更加高效和適用。因此,在交通流時(shí)間序列聚類中,K-means++是一種平衡效率和效果的理想選擇。
K-means++是傳統(tǒng)K-means聚類算法的改進(jìn)版本,其主要改進(jìn)之處在于初始化聚類中心的方式,將距離的平方作為概率分布選擇下一個(gè)聚類中心,從而提高了聚類結(jié)果的質(zhì)量并加速收斂速度。這個(gè)概率分布定義如下:
P(x(i))=D(x(i),C)2∑nj=1D(x(j),C)2(9)
其中:C為聚類中心集合;D(x(i),C)表示時(shí)間序列x(i)到聚類中心的最短距離;∑nj=1D(x(j),C)2是所有時(shí)間序列到最近聚類中心的距離平方和的總和。
在時(shí)序特征距離矩陣和卡口最短路徑距離矩陣進(jìn)行加權(quán)融合后,K-means++聚類算法步驟描述如下:
算法2 K-means++聚類算法
輸入:由滑動(dòng)窗口生成的訓(xùn)練樣本x(i)、加權(quán)融合后的距離矩陣D′。
輸出:聚類標(biāo)簽,每簇質(zhì)心。
a) 初始化聚類中心
b) 隨機(jī)選擇一個(gè)時(shí)間序列x(i)作為第一個(gè)聚類中心
c) while 聚類中心lt;k do
d)
根據(jù)D′計(jì)算每個(gè)時(shí)間序列到最近的聚類中心C的距離
e)
根據(jù)式(8)計(jì)算概率分布P(x(i))選擇新的聚類中心
f) end while
g) 初始化聚類標(biāo)簽
h) while 不收斂 do
i)
for 每個(gè)時(shí)間序列 do
j) 分配每個(gè)時(shí)間序列到最近的聚類中心
k) end for
l)
for 每個(gè)聚類中心 do
m) 重新計(jì)算每個(gè)聚類中心
n) end for
o) end while
p) return聚類標(biāo)簽,每簇質(zhì)心x(k)trend
2.2 流量預(yù)測(cè)
為了同時(shí)捕捉交通流時(shí)間序列的時(shí)空依賴性,本文設(shè)計(jì)了一種如圖7所示的流量預(yù)測(cè)模型結(jié)構(gòu)。該模型首先通過圖卷積網(wǎng)絡(luò)提取每個(gè)路段的特征。隨后,根據(jù)卡口-路段的映射關(guān)系,將屬于同一卡口的多個(gè)路段的特征進(jìn)行聚合。接著,依據(jù)聚類結(jié)果將特征分離。最后,將包含空間信息的時(shí)序數(shù)據(jù)與每簇質(zhì)心融合,一并輸入到雙向門控循環(huán)單元中進(jìn)行處理,從而得到最終的預(yù)測(cè)結(jié)果。
2.2.1 路網(wǎng)特征提取
本文使用圖卷積網(wǎng)絡(luò)提取整個(gè)路網(wǎng)的全局空間特征:
Hglobal=GCN(G,X)(10)
其中:G表示有向圖結(jié)構(gòu);X表示特征矩陣。
根據(jù)卡口-路段的映射關(guān)系,將屬于同一個(gè)卡口的多個(gè)路段的特征進(jìn)行聚合??诩蠟棣?{x(i)}Nsect,每個(gè)卡口x(i)包含的路段集合為L(zhǎng)i:
HLi=aggregate (Hglobal[Li])(11)
其中:Hglobal[Li]表示從全局特征Hglobal中提取的屬于卡口x(i)的路段特征,aggregate 表示聚合操作。
最后,將卡口級(jí)別的特征按簇分離,每簇?cái)?shù)據(jù)為包含空間信息的時(shí)序數(shù)據(jù)。
2.2.2 特征融合
為了有效地將不同的交通流量模式納入流量預(yù)測(cè)模型,本文采取了一種新的方法:將每個(gè)流量模式簇的質(zhì)心作為特征x(k)trend,并將其融合到相應(yīng)的流量預(yù)測(cè)模型中,與包含空間信息的時(shí)序數(shù)據(jù)進(jìn)行ADD加法操作,以生成更加豐富和高維的特征表示。
這一方法的核心思想是利用每個(gè)交通模式簇的質(zhì)心x(k)trend來代表該簇的整體特征,進(jìn)而提高了流量預(yù)測(cè)模型的準(zhǔn)確性和泛化能力。
2.2.3 模型共享
在對(duì)卡口進(jìn)行聚類后,每個(gè)簇都由具有相似特征的卡口組成。為了學(xué)習(xí)它們的共同特征并加快預(yù)測(cè)速度,可以應(yīng)用模型共享的思想。具體而言,使用雙向門控循環(huán)單元(bidirectional gated recurrent unit,BiGRU)模型來分析每個(gè)簇的歷史數(shù)據(jù)。BiGRU模型相比傳統(tǒng)的RNN更有效,因?yàn)樗肓穗p向性,能夠同時(shí)從過去和未來的上下文中學(xué)習(xí)信息。該模型由兩個(gè)門控循環(huán)單元(gated recurrent unit,GRU)[20]層組成,一個(gè)按正向順序處理輸入序列,另一個(gè)按逆向順序處理輸入序列。GRU單元通過更新門、重置門和隱藏狀態(tài)協(xié)同工作,捕獲序列中的依賴關(guān)系。
模型共享意味著每個(gè)簇使用相同的BiGRU模型,將同簇的卡口數(shù)據(jù)輸入到相應(yīng)的模型中進(jìn)行預(yù)測(cè)。這樣做的好處是,減少了輸入數(shù)據(jù)的維度,并且每個(gè)模型只需要處理特定簇的數(shù)據(jù),從而大大加快了預(yù)測(cè)速度。通過聚類降低了輸入數(shù)據(jù)的維度,并應(yīng)用模型共享的思想,既能加快BiGRU模型的預(yù)測(cè)速度,又能學(xué)習(xí)到同簇卡口的共同特征。深度聚類和流量預(yù)測(cè)整體算法如算法3所示。
算法3 DTCTFP算法
輸入:所有卡口連續(xù)5周歷史交通流時(shí)間序列數(shù)據(jù)x(i)Nhist。
輸出:所有卡口未來流量值x(i)Npred。
a) 執(zhí)行算法1獲得交通流低維度表示y(i)
b) 執(zhí)行GCDTW算法計(jì)算序列間的距離得到時(shí)序特征矩陣D1
c) 執(zhí)行Dijkstra算法構(gòu)建卡口最短路徑矩陣D2
d) 根據(jù)式(7)進(jìn)行矩陣加權(quán)融合得到D′
e) 執(zhí)行算法2得到聚類標(biāo)簽,每簇質(zhì)心x(k)trend
f) for 聚類標(biāo)簽=1 to k do
g)
根據(jù)聚類標(biāo)簽劃分每簇?cái)?shù)據(jù)
h) end for
i) for i=1 to N do
j)
每簇模型訓(xùn)練,預(yù)測(cè)
k)
計(jì)算損失
l)
基于Adam方法,反向傳播更新網(wǎng)絡(luò)模型
m) end for
n) return x(i)Npred
3 實(shí)驗(yàn)
3.1 實(shí)驗(yàn)?zāi)康?/p>
本章圍繞以下問題進(jìn)行實(shí)驗(yàn)驗(yàn)證:
a)RQ1:針對(duì)挑戰(zhàn)1,3.3節(jié)的實(shí)驗(yàn)通過結(jié)合交通流數(shù)據(jù)和包含實(shí)際交通組織信息的路網(wǎng)拓?fù)浣Y(jié)構(gòu),利用深度聚類方法,區(qū)分出具有不同時(shí)空相關(guān)性的交通模式。驗(yàn)證了該方法能夠有效識(shí)別不同交通模式,并揭示了在不同時(shí)空條件下的交通流量變化規(guī)律。
b)RQ2:針對(duì)挑戰(zhàn)2,為了驗(yàn)證包含實(shí)際交通組織信息的路網(wǎng)拓?fù)鋵?duì)預(yù)測(cè)的影響,3.4節(jié)的實(shí)驗(yàn)對(duì)比了兩種統(tǒng)計(jì)模型、兩種僅考慮時(shí)間依賴關(guān)系的模型,以及四種使用簡(jiǎn)化路網(wǎng)拓?fù)鋪聿蹲綍r(shí)空依賴關(guān)系的模型,驗(yàn)證了包含實(shí)際路網(wǎng)的方法具有最優(yōu)的預(yù)測(cè)效果。
c)RQ3:針對(duì)挑戰(zhàn)3,為了滿足交通預(yù)測(cè)的實(shí)時(shí)性需求,3.4.2節(jié)的實(shí)驗(yàn)比較了所有模型在每輪運(yùn)行中的耗時(shí)情況。驗(yàn)證了不同模型在處理交通流數(shù)據(jù)時(shí)的效率差異,最終確定最佳模型為DTCTFP。
d)RQ4:為了測(cè)試各個(gè)模塊的有效性,3.5節(jié)的實(shí)驗(yàn)設(shè)計(jì)了多種變體進(jìn)行消融實(shí)驗(yàn)。驗(yàn)證了各個(gè)模塊在整個(gè)系統(tǒng)中的貢獻(xiàn),特別是聚類結(jié)果對(duì)預(yù)測(cè)準(zhǔn)確性的顯著提升。
3.2 實(shí)驗(yàn)設(shè)計(jì)
1)交通流時(shí)間序列的獲取和設(shè)計(jì)
本文使用的交通數(shù)據(jù)集來自重慶市大渡口區(qū),其路網(wǎng)拓?fù)浜蚐UMO路網(wǎng)如圖8所示。該區(qū)域由203個(gè)交通卡口組成,卡口檢測(cè)器記錄2023年7月3日~2023年12月31日每天7:00~9:00的交通數(shù)據(jù),原始數(shù)據(jù)如表1所示,其中包含檢測(cè)器ID、車輛車牌號(hào)(已脫敏)、車輛通過時(shí)間。通過對(duì)卡口原始數(shù)據(jù)進(jìn)行預(yù)處理和結(jié)構(gòu)化,轉(zhuǎn)換成卡口流量數(shù)據(jù),具體操作如表2所示。處理后的流量數(shù)據(jù)包含檢測(cè)器ID、通過時(shí)間、交通流量三種屬性(表3)。最后通過檢測(cè)器-卡口對(duì)照表進(jìn)行匹配。
2)SUMO路網(wǎng)的獲取和設(shè)計(jì)
重慶市大渡口區(qū)SUMO路網(wǎng)如圖8所示,利用路網(wǎng)對(duì)應(yīng)的.xml文件,獲取卡口之間的空間關(guān)系,以便后續(xù)構(gòu)建有向圖和距離矩陣。
3)實(shí)驗(yàn)參數(shù)設(shè)計(jì)
歷史數(shù)據(jù)的完整程度對(duì)流量預(yù)測(cè)的準(zhǔn)確性至關(guān)重要。卡口根據(jù)交通狀況聚類成簇,因此缺失的數(shù)據(jù)會(huì)嚴(yán)重影響聚類結(jié)果。為了在實(shí)驗(yàn)中綜合考慮復(fù)雜性和數(shù)據(jù)完整性,選擇了缺失率低于10%的卡口進(jìn)行實(shí)驗(yàn),共計(jì)58個(gè)卡口符合條件。
在深度聚類模塊中,考慮到交通流的動(dòng)態(tài)性和不確定性,本文滑動(dòng)窗口的大小設(shè)置為1 008,即連續(xù)6周每天7:00~9:00時(shí)間粒度為5 min的流量數(shù)據(jù),將時(shí)間步設(shè)置為1周。CNN層的卷積核數(shù)量為50,每個(gè)卷積核大小為10;BiLSTM層的濾波器數(shù)量為50;deconvolution層的卷積核大小為10。自編碼器采用SGDM優(yōu)化器,momentum參數(shù)設(shè)置為0.9;學(xué)習(xí)率為0.01;batch_size大小為256;K-means++聚類方法由Python 3.9.18中的Scikit-learn包實(shí)現(xiàn);訓(xùn)練模型直到聚類變化小于0.1%或訓(xùn)練輪數(shù)超過50輪為止。
在流量預(yù)測(cè)模塊中,數(shù)據(jù)集為連續(xù)26周粒度為5 min的流量數(shù)據(jù),將數(shù)據(jù)集按照6∶2∶2的比例分為訓(xùn)練集、驗(yàn)證集、測(cè)試集,采用min-max歸一化將歷史交通流量的值縮放到[-1,1],以提高搜索最優(yōu)解的梯度下降速度。在測(cè)試階段將輸入數(shù)據(jù)歸一化,然后將輸出重新縮放到原始比例。batch_size大小為256;選擇LeakyReLU作為非線性激活函數(shù);優(yōu)化器是Adam算法;學(xué)習(xí)率設(shè)置為0.001。實(shí)驗(yàn)在PyTorch平臺(tái)上進(jìn)行,使用Intel? Xeon? Gold 5120, 2.20 GHz CPU, 128 GB RAM和GeForce RTX 3090 24 GB GPU。
4)評(píng)價(jià)指標(biāo)設(shè)計(jì)
為驗(yàn)證聚類的有效性,本文采用輪廓系數(shù)(silhouette coefficient,SC)[21]作為評(píng)價(jià)指標(biāo),對(duì)于每個(gè)樣本i,具體的計(jì)算公式為
S(i)=b(i)-a(i)max{a(i),b(i)}(12)
其中:a(i)代表樣本i與其所屬簇內(nèi)其他樣本的平均距離;b(i)代表樣本i與最近的一個(gè)簇中所有樣本的平均距離。
為驗(yàn)證提出預(yù)測(cè)模型的有效性,本文采用平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error, RMSE)和平均絕對(duì)百分比誤差(mean absolute percentage error, MAPE)作為評(píng)價(jià)指標(biāo), 具體的計(jì)算公式如下:
MAE(yi,i)=1N∑Ni=1|yi-i|(13)
RMSE(yi,i)=1N∑Ni=1(yi-i)2(14)
MAPE(yi,i)=1N∑Ni=1|yi-i|yi(15)
其中:N為樣本的數(shù)量;yi為真實(shí)值;i為預(yù)測(cè)值。
3.3 卡口聚類(RQ1)
首先,利用GCDTW算法計(jì)算了六周時(shí)間序列數(shù)據(jù)的對(duì)齊差異,作為相似性的衡量。接著,采用Dijkstra算法計(jì)算了已篩選卡口之間的最短路徑,并對(duì)得到的兩個(gè)特征矩陣進(jìn)行了歸一化處理。本文繪制了熱力圖,以直觀展示距離值的分布情況,在熱力圖中,距離值較小的區(qū)域呈現(xiàn)藍(lán)色,而距離值較大的區(qū)域呈現(xiàn)紅色(見電子版)。圖9顯示了58個(gè)卡口交通流對(duì)象的特征,熱力圖層次分明,揭示了交通流對(duì)象的一些特征之間的相關(guān)性,同時(shí)也顯示了其他特征之間顯著的差異。而圖10則顯示了卡口之間的最短路徑,結(jié)果顯示,這些卡口之間的距離大多臨近,一部分卡口之間的距離較遠(yuǎn)或者受到交通管制措施的影響。為確保時(shí)間相關(guān)性和空間相關(guān)性兩個(gè)維度的信息都得到充分考慮,本文將對(duì)兩個(gè)矩陣的初始權(quán)重均設(shè)置為0.5,并進(jìn)行加權(quán)平均融合,減輕單個(gè)特征矩陣可能帶來的誤差和噪聲,如圖11是融合后的矩陣。結(jié)果顯示,通過特征矩陣融合,潛在特征被增強(qiáng),而異常值則被平滑處理。通過加強(qiáng)潛在特征,模型能夠更好地捕捉數(shù)據(jù)中的細(xì)微變化,從而提高了對(duì)于復(fù)雜模式交通模式的識(shí)別能力。同時(shí),對(duì)于異常值的平滑處理則有助于減少模型在噪聲或異常數(shù)據(jù)點(diǎn)上的過度擬合,使模型更加穩(wěn)健和可靠。
其次,使用K-means++算法結(jié)合加權(quán)融合后的距離矩陣,對(duì)58個(gè)卡口進(jìn)行聚類分析。通過輪廓系數(shù)法,計(jì)算聚類數(shù)為2~10的輪廓系數(shù),觀察到數(shù)值從聚類數(shù)為2時(shí)的0.63上升至聚類數(shù)為3時(shí)的0.77,然后持續(xù)下降,如圖12所示。
基于這一觀察,確定了最佳的聚類數(shù)為3,并繪制出每個(gè)簇的時(shí)間序列,使用黑色虛線來標(biāo)示每個(gè)類的質(zhì)心,如圖13所示。
根據(jù)圖13的聚類結(jié)果,對(duì)聚類進(jìn)行可視化呈現(xiàn)(圖14),結(jié)合對(duì)路網(wǎng)結(jié)構(gòu)的分析,可以得出以下結(jié)論:
cluster 1:如圖13(a)所示,早高峰時(shí)段流量波動(dòng)顯著,容易出現(xiàn)高峰值。該類卡口位于車流量大且容易發(fā)生擁堵的區(qū)域,通常是住宅區(qū)、學(xué)校和醫(yī)院等人口密集的區(qū)域。
案例1:卡口24212位于雙城路與雙山路的交叉口。雙城路為南北方向雙向2車道,雙山路為東西方向雙向4車道。附近有3所學(xué)校和密集的住宅區(qū),早高峰時(shí)段車流量大且人員復(fù)雜,容易擁堵。
cluster 2:如圖13(b)所示,早高峰時(shí)段流量大但波動(dòng)較小,流量變化較為平穩(wěn)。該類卡口的車流量大但變化規(guī)律性較強(qiáng),通常位于交通干道和公交線路多的區(qū)域。
案例2:卡口31874位于春暉路與翠華路的交叉口。春暉路為南北方向雙向6車道,翠華路為東西方向雙向2車道。附近有多條公交線路,且靠近青峰隧道,車流多數(shù)為東西方向,流量較為規(guī)律。
cluster 3:如圖13(c)所示,流量變化受到一定程度的波動(dòng)影響,但總體相對(duì)穩(wěn)定。該類卡口車流方向單一,流量波動(dòng)有限。
案例3:卡口25836位于翠園路與湖榕路交叉口,這是一個(gè)丁字形路口。翠園路為東西方向雙向4車道,湖榕路為雙向4車道但只有南段通車。盡管位于立交橋附近,但車流方向簡(jiǎn)單,波動(dòng)有限。
真實(shí)卡口如圖15所示。
3.4 短時(shí)交通流量預(yù)測(cè)網(wǎng)絡(luò)(RQ2、RQ3)
3.4.1 基準(zhǔn)模型
為了驗(yàn)證DTCTFP的有效性,本文將與以下交通流量預(yù)測(cè)方法進(jìn)行比較,其中,前四種為基準(zhǔn)模型,后四種為近年來學(xué)者根據(jù)交通流量預(yù)測(cè)需求改進(jìn)的圖卷積神經(jīng)網(wǎng)絡(luò)模型。
a)ARIMA[22]:自回歸綜合移動(dòng)平均模型,利用歷史數(shù)據(jù)中的均值和趨勢(shì)來預(yù)測(cè)未來時(shí)間片的交通流量值。
b)SVR[23]:支持向量回歸模型,可以處理非線性關(guān)系,并在高維空間中構(gòu)建線性或非線性回歸模型。
c)GRU[24]:門控循環(huán)單元,是一種類似于LSTM的變體,與LSTM相比,GRU具有更簡(jiǎn)單的結(jié)構(gòu),但通常能夠取得與LSTM相當(dāng)甚至更好的效果。
d)Transformer[25]:以自注意力機(jī)制為基礎(chǔ),能夠有效地建模序列數(shù)據(jù)中的長(zhǎng)距離依賴關(guān)系。
e)DCRNN[26]:擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò),通過圖卷積捕捉交通網(wǎng)絡(luò)中的空間依賴關(guān)系,利用遞歸神經(jīng)網(wǎng)絡(luò)處理時(shí)間依賴關(guān)系,該模型在同時(shí)涉及空間和時(shí)間關(guān)聯(lián)的交通流量預(yù)測(cè)中表現(xiàn)出色。
f)STGCN[8]:時(shí)空?qǐng)D卷積網(wǎng)絡(luò),將GCN與時(shí)間卷積網(wǎng)絡(luò)結(jié)合起來,同時(shí)建模交通數(shù)據(jù)中的空間和時(shí)間依賴關(guān)系。這種雙重建模方法使得STGCN能夠更準(zhǔn)確地預(yù)測(cè)交通流量,充分考慮了空間和時(shí)間的動(dòng)態(tài)變化。
g)ASTGCN[27]:基于注意力的時(shí)空?qǐng)D卷積網(wǎng)絡(luò),在STGCN的基礎(chǔ)上引入了注意力機(jī)制。通過自適應(yīng)地分配不同節(jié)點(diǎn)和時(shí)間步的權(quán)重,ASTGCN能夠更精準(zhǔn)地捕捉重要的空間和時(shí)間特征,提升預(yù)測(cè)性能。
h)ASTGNN[28]:基于注意力的時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò),是一種綜合了注意力機(jī)制和圖神經(jīng)網(wǎng)絡(luò)的模型,通過動(dòng)態(tài)調(diào)整不同時(shí)間步和空間節(jié)點(diǎn)的權(quán)重,實(shí)現(xiàn)對(duì)時(shí)空數(shù)據(jù)的高效建模和預(yù)測(cè)。
3.4.2 實(shí)驗(yàn)結(jié)果與分析
本文在重慶市大渡口數(shù)據(jù)集上驗(yàn)證了DTCTFP模型。表4顯示了本文模型與基線方法在真實(shí)數(shù)據(jù)集上對(duì)未來30 min、1 h和2 h的平均預(yù)測(cè)結(jié)果,圖16顯示了預(yù)測(cè)未來30 min時(shí)滑動(dòng)窗口大?。J(rèn)為6周)對(duì)于預(yù)測(cè)結(jié)果的影響。結(jié)果表明,DTCTFP模型在所有實(shí)驗(yàn)中均勝過了基線模型。針對(duì)未來30 min交通流量的預(yù)測(cè),該模型在MAE、RMSE和MAPE三個(gè)指標(biāo)上相較ASTGNN模型,分別提升了12.09%、11.98%和8.14%;對(duì)于未來1 h和2 h的交通流量預(yù)測(cè),相比ASTGNN模型,性能提升分別達(dá)到了12.2%、9.81%、14.85%和14.82%、7.15%、6.3%。
表4的結(jié)果表明,傳統(tǒng)統(tǒng)計(jì)模型ARIMA、SVR可能難以捕捉交通流中復(fù)雜的非線性關(guān)系。相比之下,基于深度學(xué)習(xí)的方法在長(zhǎng)期預(yù)測(cè)方面通常表現(xiàn)更優(yōu)。這是因?yàn)殡S著預(yù)測(cè)視野的增加,時(shí)間依賴性變得越來越非線性,而深度學(xué)習(xí)模型能夠更好地處理這種非線性關(guān)系?;赗NN變體的GRU以及利用encoder-decoder結(jié)構(gòu)的Transformer模型則具有不同的優(yōu)勢(shì)。前者適合處理交通流中的長(zhǎng)期依賴關(guān)系,而后者能夠并行處理整個(gè)序列,從而在效率上有很大提升。以上四種模型僅僅考慮了交通流的時(shí)間依賴關(guān)系,而忽略了城市卡口之間的空間關(guān)系以及全局信息。在引入GCN以捕捉時(shí)間序列的空間依賴性后,預(yù)測(cè)性能相較于傳統(tǒng)的時(shí)間序列預(yù)測(cè)模型有了進(jìn)一步提升。然而,DCRNN、STGCN、ASTGCN 和ASTGNN這些模型在捕捉時(shí)間序列的空間關(guān)聯(lián)性時(shí),都依賴于簡(jiǎn)化的路網(wǎng)拓?fù)?。?duì)于充滿交通標(biāo)志和交通管制措施的城市路網(wǎng)來說,這種圖結(jié)構(gòu)往往無法充分反映真實(shí)的路網(wǎng)情況。
在對(duì)比DTCTFP與其他模型預(yù)測(cè)未來2 h每輪耗時(shí)以及總耗時(shí)表現(xiàn)時(shí),DTCTFP在復(fù)雜性與時(shí)間效率之間找到了理想的平衡點(diǎn)。與非圖結(jié)構(gòu)的深度學(xué)習(xí)模型(如Transformer)相比,DTCTFP提供了更優(yōu)的預(yù)測(cè)性能,同時(shí)在耗時(shí)方面也優(yōu)于更復(fù)雜的時(shí)空?qǐng)D卷積模型(如ASTGCN和ASTGNN)。由于DTCTFP能夠顯著減少計(jì)算時(shí)間,它在實(shí)際應(yīng)用中更具可操作性,尤其是在實(shí)時(shí)性要求較高的交通流量預(yù)測(cè)中。無論是處理大規(guī)模數(shù)據(jù)集,還是應(yīng)對(duì)頻繁的模型更新需求,DTCTFP都展現(xiàn)了出色的適應(yīng)性。這種優(yōu)勢(shì)使其成為應(yīng)對(duì)突發(fā)交通狀況或進(jìn)行動(dòng)態(tài)調(diào)度預(yù)測(cè)的理想工具。
本文介紹的DTCTFP模型利用具有交通組織信息的真實(shí)路網(wǎng),通過挖掘卡口間的時(shí)空相關(guān)性,提出模型共享的策略,針對(duì)各種交通模式建立了預(yù)測(cè)模型,在訓(xùn)練時(shí)間和預(yù)測(cè)精度方面都取得了良好的效果。
圖16中顯示了滑動(dòng)窗口大小對(duì)于預(yù)測(cè)精度的影響。結(jié)果表明,隨著滑動(dòng)窗口尺寸從4周增加到8周,模型對(duì)于卡口交通流時(shí)間依賴關(guān)系的捕捉能力逐漸增強(qiáng)。增大的滑動(dòng)窗口使模型更容易發(fā)現(xiàn)交通流潛在的趨勢(shì)和周期性。然而,隨著滑動(dòng)窗口進(jìn)一步增大,模型開始過度關(guān)注較遠(yuǎn)的歷史數(shù)據(jù),而忽略了更近期的信息。這種情況導(dǎo)致模型的響應(yīng)速度變慢,因?yàn)榇翱诟采w的歷史數(shù)據(jù)較長(zhǎng)。當(dāng)數(shù)據(jù)發(fā)生突變或者趨勢(shì)發(fā)生變化時(shí),模型需要更長(zhǎng)的時(shí)間來反應(yīng)并進(jìn)行適應(yīng),從而導(dǎo)致預(yù)測(cè)結(jié)果的延遲。因此,在選擇滑動(dòng)窗口大小時(shí),需要權(quán)衡預(yù)測(cè)性能和模型響應(yīng)速度之間的關(guān)系,以獲得更準(zhǔn)確和穩(wěn)定的預(yù)測(cè)結(jié)果。
3.4.3 預(yù)測(cè)結(jié)果與可視化
為了更生動(dòng)地展示模型的預(yù)測(cè)性能,本文從深度聚類得到的三簇中分別選取一個(gè)卡口,并通過可視化展示了未來2 h交通流量的預(yù)測(cè)結(jié)果(圖17)。結(jié)果顯示,DTCTFP在各個(gè)卡口中展現(xiàn)了出色的預(yù)測(cè)性能,驗(yàn)證了本文通過深度聚類挖掘城市卡口的時(shí)空相關(guān)性,結(jié)合模型共享策略進(jìn)行未來交通流量預(yù)測(cè)方法,可實(shí)現(xiàn)對(duì)復(fù)雜城市卡口的實(shí)時(shí)流量預(yù)測(cè)。
3.5 消融實(shí)驗(yàn)(RQ4)
為了更深入地驗(yàn)證DTCTFP模型中各個(gè)組成模塊的有效性,本文在重慶市大渡口區(qū)的數(shù)據(jù)集上進(jìn)行了消融實(shí)驗(yàn),結(jié)果如表5所示。
從消融實(shí)驗(yàn)結(jié)果可以看出,逐步引入模型中的各個(gè)模塊確實(shí)對(duì)預(yù)測(cè)性能有著積極的影響。首先,與傳統(tǒng)的單向GRU相比,使用BiGRU能夠在MAE和RMSE指標(biāo)上實(shí)現(xiàn)一定程度的降低,這表明雙向信息的引入有助于提高模型的預(yù)測(cè)準(zhǔn)確性。引入GCN后,預(yù)測(cè)性能進(jìn)一步提升,表明GCN對(duì)于提高模型的泛化能力和對(duì)交通流時(shí)間依賴、卡口空間信息的捕獲具有重要作用。而加入深度聚類DTC后,指標(biāo)再次有所下降,這進(jìn)一步驗(yàn)證了深度聚類在模型性能提升中的重要性,它使得模型能夠準(zhǔn)確識(shí)別和利用交通流的時(shí)空模式,聚類顯著提升了預(yù)測(cè)的準(zhǔn)確性。實(shí)驗(yàn)對(duì)不使用滑動(dòng)窗口的DTCTFP進(jìn)行測(cè)試,結(jié)果顯示它的性能略低于使用滑動(dòng)窗口的版本,這表明滑動(dòng)窗口的引入對(duì)于提高模型的預(yù)測(cè)性能也是必要的,它能動(dòng)態(tài)地捕捉交通流數(shù)據(jù)的變化,同時(shí)控制歷史數(shù)據(jù)的數(shù)量。最終,采用了DTCTFP模型后,預(yù)測(cè)性能得到了最大程度的提升,MAE、RMSE、MAPE指標(biāo)均有顯著降低,表明動(dòng)態(tài)時(shí)空特征融合在模型中的應(yīng)用具有顯著的優(yōu)勢(shì),有效提高了模型的預(yù)測(cè)準(zhǔn)確性。因此,通過這些實(shí)驗(yàn)結(jié)果,可以驗(yàn)證DTCTFP模型中各個(gè)模塊的有效性,以及它們相互融合后對(duì)模型性能的綜合提升。
4 結(jié)束語
城市卡口的多樣性和異質(zhì)性使得短時(shí)交通流量預(yù)測(cè)成為一個(gè)具有挑戰(zhàn)性和重要意義的問題,本文提出了一種用于大規(guī)模城市卡口短時(shí)交通流量預(yù)測(cè)的深度學(xué)習(xí)模型DTCTFP。該模型的關(guān)鍵在于深度時(shí)序聚類和流量預(yù)測(cè)的結(jié)合,以及模型共享策略。在重慶市大渡口區(qū)的真實(shí)卡口數(shù)據(jù)上對(duì)所提出的模型進(jìn)行了評(píng)估,DTCTFP優(yōu)于現(xiàn)有方法。在未來工作中,將進(jìn)一步探索卡口在路網(wǎng)中的局部特征以及它們與全局相關(guān)性之間的依賴關(guān)系,實(shí)現(xiàn)多視角下的城市卡口交通流量預(yù)測(cè)。
參考文獻(xiàn):
[1]Lyu Yisheng, Duan Yanjie, Kang Wenwen, et al. Traffic flow prediction with big data: a deep learning approach [J]. IEEE Trans on Intelligent Transportation Systems, 2015, 16(2): 865-873.
[2]Pang Junbiao, Huang Jing, Du Yong, et al. Learning to predict bus arrival time from heterogeneous measurements via recurrent neural network [J]. IEEE Trans on Intelligent Transportation Systems, 2019, 20(9): 3283-3293.
[3]杭菲璐, 郭威, 陳何雄, 等. 基于iForest和LOF的流量異常檢測(cè) [J]. 計(jì)算機(jī)應(yīng)用研究, 2022, 39(10): 3119-3123. (Hang Feilu, Guo Wei, Chen Hexiong, et al. Network traffic anomaly detection based on iForest and LOF [J]. Application Research of Compu-ters, 2022,39(10): 3119-3123.)
[4]Abduljabbar R L, Dia H, Tsai T W. Unidirectional and bidirectional LSTM models for short-term traffic prediction [J]. Journal of Advanced Transportation, 2021, 2021: 1-16.
[5]Lesouple J, Baudoin C, Spigai M, et al. Generalized isolation forest for anomaly detection [J]. Pattern Recognition Letters, 2021, 149: 109-119.
[6]Diao Zulong, Wang Xin, Zhang Dafang, et al. Dynamic spatial-temporal graph convolutional neural networks for traffic forecasting [C]//Proc of AAAI Conference on Artificial Intelligence. 2019: 890-897.
[7]Fang Shen, Zhang Qi, Meng Gaofeng, et al. GSTNet-Global spatial-temporal network for traffic flow prediction [C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann, 2019: 2286-2293.
[8]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting [C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann, 2018: 3634-3640.
[9]Defferrard M, Bresson X, Vandergheynst P. Convolutional neural networks on graphs with fast localized spectral filtering [C] //Proc of the 30th International Conference on Neural Information Processing Systems. Cambridge, CA: MIT Press, 2016: 3844-3852.
[10]Sun T Y. Research on urban traffic flow forecasting based on vector autoregression [M]. Beijing: Beijing Jiaotong University, 2022.
[11]Vlahogianni E I, Karlaftis M J, Golias J. Short-term traffic forecasting: where we are and where we’re going [J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 3-19.
[12]Berndt D J, Clifford J. Using dynamic time warping to find patterns in time series [C]// Proc of the 3rd International Conference on Know-ledge Discovery and Data Mining. San Francisco: Morgan Kaufmann, 1994: 359-370.
[13]Kim J Y, Cho S B. Explainable prediction of electric energy demand using a deep autoencoder with interpretable latent space [J]. Expert Systems with Applications, 2021, 186: 115842.
[14]Mo Jiqian, Gong Zhiguo, Chen Junyang. Attentive differential convolutional neural networks for crowd flow prediction [J]. Knowledge-based systems, 2022, 258: 110006.
[15]Ma Changxi, Dai Guowen, Zhou Jibiao. Short-term traffic flow prediction for urban road sections based on time series analysis and LSTM_BILSTM method [J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(6): 5615-5624.
[16]Johnson D B. A note on Dijkstra’s shortest path algorithm [J]. Journal of the ACM, 1973, 20(3): 385-388.
[17]Arthur D, Vassilvitskii S. K-means++: the advantages of careful seeding [C]//Proc of ACM-SIAM Symposium on Discrete Algorithms. New York: ACM Press, 2007: 1027-1035.
[18]Schubert E, Sander J, Ester M, et al. DBSCAN revisited, revisited: why and how you should (still) use DBSCAN [J]. ACM Trans on Database Systems, 2017, 42(3): article No. 19.
[19]Chen Wenlong, Wang Xiaoling, Cai Zhijian, et al. DP-GMM clustering-based ensemble learning prediction methodology for dam deformation considering spatiotemporal differentiation [J]. Know-ledge-based systems, 2021, 222: 106964.
[20]Fu Rui, Zhang Zuo, Li Li. Using LSTM and GRU neural network methods for traffic flow prediction [C]//Proc of Youth Academic Annual Conference of Chinese Association of Automation. 2016: 324-328.
[21]Hidayati R, Zubair A, Pratama A H, et al. Analisis Silhouette coefficient pada 6 perhitungan Jarak K-means clustering [J]. IEEE Trans on Computers, 2021, 20(2): 186-197.
[22]Tedjopurnomo D A, Bao Zhifeng, Zheng Baihua, et al. A survey on modern deep neural network for traffic prediction: trends, methods and challenges [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 34(4): 1544-1561.
[23]Xu Haibo, Jiang Chengshun. Deep belief network-based support vector regression method for traffic flow forecasting [J]. Neural Computing and Applications, 2019, 32(7): 2027-2036.
[24]Gao Shuai, Huang Yuefei, Zhang Shuo, et al. Short-term runoff prediction with GRU and LSTM networks without requiring time step optimization during sample generation [J]. Journal of Hydrology, 2020, 589:125188.
[25]周楚昊, 林培群. 基于多通道Transformer的交通量預(yù)測(cè)方法 [J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(2): 435-439. (Zhou Chuhao, Lin Peiqun. Traffic flow prediction method based on multi-channel Transformer [J]. Application Research of Computers, 2023,40(2): 435-439.)
[26]Li Yaguang, Yu R, Shahabi C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting [EB/OL]. (2018-02-22). https://arxiv.org/abs/1707.01926.
[27]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting [C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 922-929.
[28]Guo Shengnan, Lin Youfang, Wan Huaiyu, et al. Learning dynamics and heterogeneity of spatial-temporal graph data for traffic forecasting [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 34(11): 5415-5428.