高華兵,舒文迪,劉 志
(1.宜春職業(yè)技術(shù)學(xué)院 信息工程學(xué)院,江西 宜春 336000;2.浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023)
交通流預(yù)測可以獲得未來的交通流狀態(tài),在路徑引導(dǎo)、交通管控和交通信息服務(wù)等方面具有重要的意義[1]。在路徑引導(dǎo)方面,交通流量預(yù)測能夠?yàn)檐囕v路徑規(guī)劃提供重要參考,幫助出行者更好地選擇路線;在交通管控方面,交通流量預(yù)測能夠發(fā)現(xiàn)未來可能會(huì)發(fā)生擁堵的地點(diǎn)和時(shí)間,幫助管理者將資源分配到容易發(fā)生擁堵的道路上,最終緩解交通壓力;在交通信息服務(wù)方面,交通流量預(yù)測能夠幫助人們更好地使用商業(yè)車輛[2]。
時(shí)間序列分析模型采用曲線擬合和參數(shù)估計(jì)的方法預(yù)測交通流信息,其中最典型的方法是自回歸積分移動(dòng)平均(ARIMA)[3],ARIMA模型以自回歸模型和滑動(dòng)平均模型為基礎(chǔ),添加了積分環(huán)節(jié),以消除時(shí)間序列中的短期波動(dòng)。周曉等[4]基于卡曼濾波理論預(yù)測了道路的速度。近年來,深度神經(jīng)網(wǎng)絡(luò)已成為研究熱點(diǎn)[5],然而隨著城市道路感應(yīng)設(shè)備布置范圍增大,識(shí)別精度提升,許多深度學(xué)習(xí)模型被提出并用于解決交通流預(yù)測問題[6]。棧式自編碼神經(jīng)網(wǎng)絡(luò)(SAE)[7]采用分層貪婪算法獲取交通流的時(shí)空特征。循環(huán)神經(jīng)網(wǎng)絡(luò)能夠利用記憶單元處理任意長度的輸入,因此被廣泛應(yīng)用于短時(shí)交通流預(yù)測,在其基礎(chǔ)上衍生的長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)、門控循環(huán)單元(GRU)[8]表現(xiàn)出較好的預(yù)測性能。Tian等[9]使用LSTM對(duì)交通流進(jìn)行預(yù)測,不僅獲得了時(shí)間序列觀測值的長期和短期依賴關(guān)系,而且利用缺失模式改進(jìn)了預(yù)測結(jié)果。Wang等[10]將交通時(shí)間序列分解為趨勢序列和殘差序列,并使用LSTM分別進(jìn)行預(yù)測,最后綜合預(yù)測值得到結(jié)果。Zheng等[11]提出使用基于注意力機(jī)制的卷積LSTM神經(jīng)網(wǎng)絡(luò)提取交通流的時(shí)空維度的特征,并結(jié)合雙向LSTM模塊提取交通流的長期特征。目前也出現(xiàn)了許多關(guān)于圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)的研究[12-14]?;谏鲜鲅芯砍晒P者提出通過基于時(shí)間聚類的交通流量預(yù)測模型TC-ConvLSTM來提升交通流預(yù)測的精度。
基于深度學(xué)習(xí)的交通流量預(yù)測模型首先通過快速路上安裝的微波檢測器收集原始的流量數(shù)據(jù);其次是預(yù)處理環(huán)節(jié),對(duì)數(shù)據(jù)進(jìn)行清洗,去除異常點(diǎn);再次采用K-shape聚類方法對(duì)時(shí)序數(shù)據(jù)進(jìn)行聚類,使用卷積LSTM神經(jīng)網(wǎng)絡(luò)對(duì)不同的簇進(jìn)行訓(xùn)練,卷積LSTM神經(jīng)網(wǎng)絡(luò)同時(shí)考慮了交通流的時(shí)空特征,能夠提升交通流預(yù)測的精度。模型架構(gòu)如圖1所示。
圖1 預(yù)測模型架構(gòu)Fig.1 Prediction model architecture
筆者選用的快速路交通流數(shù)據(jù)來自杭州交通管理平臺(tái)。數(shù)據(jù)主要包含快速路主線車道級(jí)別的交通流量、占有率和速度數(shù)據(jù),以及快速路上匝道入口的過車數(shù)據(jù),主要采集自中河-上塘高架中的7個(gè)微波檢測點(diǎn)位。微波數(shù)據(jù)為2018年5月1日—7月17日總計(jì)78 d,總量約3 400萬條,中河-上塘高架部分微波點(diǎn)位的展示如圖2所示。
圖2 快速路微波點(diǎn)位Fig.2 Microwave points on the expressway
在選擇數(shù)據(jù)時(shí),盡量避免選擇包含大量缺失數(shù)據(jù)的路段或時(shí)間段,以免影響實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,然而大多數(shù)數(shù)據(jù)需要進(jìn)行修復(fù),并且需要對(duì)按照車道級(jí)別的微波數(shù)據(jù)進(jìn)行處理。
一方面,按照路段名對(duì)該路段的交通流數(shù)據(jù)進(jìn)行篩選,主要通過閾值方法剔除明顯的異常數(shù)據(jù),例如流量超過快速路運(yùn)載能力的數(shù)值,或是速度遠(yuǎn)高于同時(shí)段平均水平的數(shù)值。在對(duì)異常數(shù)據(jù)進(jìn)行處理之后,需要對(duì)缺失數(shù)據(jù)進(jìn)行填充處理。一般將缺失數(shù)據(jù)分為短時(shí)缺失數(shù)據(jù)和長時(shí)缺失數(shù)據(jù)。短時(shí)缺失數(shù)據(jù)指在連續(xù)時(shí)間中缺失3個(gè)以下數(shù)據(jù),對(duì)于這種情況,主要選取上一時(shí)刻的數(shù)據(jù)對(duì)缺失的數(shù)據(jù)進(jìn)行填充。長時(shí)缺失數(shù)據(jù)指在連續(xù)時(shí)間內(nèi)缺失3個(gè)及以上數(shù)據(jù),一般是微波檢測器的故障或者檢修導(dǎo)致大片數(shù)據(jù)的缺失。對(duì)于長時(shí)缺失數(shù)據(jù),利用交通流的時(shí)間相關(guān)性,對(duì)缺失數(shù)據(jù)進(jìn)行處理,采用平均值法修補(bǔ)缺失的數(shù)據(jù),修補(bǔ)公式為
(1)
式中:x(t)為需要補(bǔ)全的缺失數(shù)據(jù);k為相鄰數(shù)據(jù)總數(shù)。
另一方面,對(duì)完整數(shù)據(jù)進(jìn)行車道級(jí)別的處理。首先將每個(gè)車道的流量數(shù)據(jù)相加得到主線流量數(shù)據(jù);然后對(duì)每個(gè)車道的速度數(shù)據(jù)取平均得到主線的速度數(shù)據(jù),最終得到實(shí)驗(yàn)數(shù)據(jù)。結(jié)構(gòu)化后的交通數(shù)據(jù)樣例時(shí)間為2018年6月1日,其結(jié)果如表1所示。
表1 結(jié)構(gòu)化交通數(shù)據(jù)Table 1 Structured traffic data
時(shí)間序列數(shù)據(jù)是一組觀測值,時(shí)間序列一般是相對(duì)于其他向量而言,包含時(shí)間關(guān)系的離散點(diǎn)的集合。一組交通流量時(shí)間序列數(shù)據(jù)是由環(huán)路檢測器按照等間隔的時(shí)間戳收集的連續(xù)觀測值。一組時(shí)間序列可以表示為Q=[q1,q2,…,qi,…,qn],其中qi為基于時(shí)間指數(shù)值的交通流量觀測值。由于原始數(shù)據(jù)沒有經(jīng)過整理,需要對(duì)其進(jìn)行過濾、修復(fù)和平滑處理。
經(jīng)過數(shù)據(jù)清洗后,原始數(shù)據(jù)將成為串行數(shù)據(jù)。原始交通數(shù)據(jù)是指每條公路的檢測點(diǎn)在某一時(shí)刻的交通信息。在數(shù)據(jù)采集之后進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)修復(fù)工作,之后在使用局部加權(quán)回歸(LOWESS)方法的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行平滑處理。經(jīng)過處理后的數(shù)據(jù)比原始數(shù)據(jù)更加平滑、連續(xù),符合實(shí)際情況,有助于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,提高神經(jīng)網(wǎng)絡(luò)的預(yù)測性能。
為了探索不同時(shí)間段的交通流特性,對(duì)快速路主線交通流特性進(jìn)行研究。2018年6月1日星期五上塘—中河高架6個(gè)路段的流量立體圖如圖3所示。由圖3可知:選擇的路段方向是南北走向,即惠明路—大關(guān)路走向。流量呈現(xiàn)出較強(qiáng)的波動(dòng)性,在4:00到達(dá)波谷,隨后在4 h內(nèi)逐漸增長到達(dá)峰值,并且持續(xù)較長時(shí)間維持較高的流量值,在20:00之后流量逐漸下降。流量的波動(dòng)主要受到主線上游到達(dá)交通流和出入口匝道交通流的隨機(jī)性影響。從地理位置來看:惠明路路段的交通流量最大,其后依次是鳳起路和文暉路。而從惠明路—鳳起路—環(huán)城北路路段的流量依次遞減,出口匝道的流量隨機(jī)性影響對(duì)于這些路段的沖擊較大。
圖3 工作日上塘—中河快速路各路段流量立體圖Fig.3 Stereogram of different traffic flow of Shangtang-Zhonghe expressway in weekday
路段流量的波動(dòng)幅度與節(jié)假日關(guān)聯(lián)程度較大,2018年6月2日星期六上塘—中河高架6個(gè)路段的流量立體圖如圖4所示。由圖4與圖3的對(duì)比可知:快速路總體流量有較大幅度的減少,高峰時(shí)期從原來的8:00和18:00轉(zhuǎn)變?yōu)?6:00。在這個(gè)時(shí)間段,快速路承載著大部分通勤功能,在工作日的早高峰和晚高峰體現(xiàn)出較大的車流量,而節(jié)假日因?yàn)槌鲂袝r(shí)間段的改變,快速路流量高峰時(shí)期也有所變化。
圖4 周末上塘—中河快速路各路段流量立體圖Fig.4 Stereogram of different traffic flow of Shangtang-Zhonghe expressway in weekend
交通流量數(shù)據(jù)具有很強(qiáng)的時(shí)變性和周期性,許多研究者致力于開發(fā)各種各樣的神經(jīng)網(wǎng)絡(luò)以提升交通流量預(yù)測的精度,然而由于交通環(huán)境的不同,將所有的數(shù)據(jù)輸入到一個(gè)模型中可能會(huì)導(dǎo)致準(zhǔn)確率較低。因此,不應(yīng)該把所有的數(shù)據(jù)都輸入到一個(gè)模型中,其原因有:1) 許多傳感器的觀測數(shù)據(jù)往往是高度相關(guān)和冗余的,一個(gè)包含許多不重要變量的模型通常預(yù)測能力較差,而且往往難以解釋;2) 一些傳感器之間可能不存在因果關(guān)系,在預(yù)測中考慮這樣的傳感器只會(huì)增加成本,而不會(huì)提高性能,最近的一些研究部分支持了這一猜想,并表明了當(dāng)預(yù)測模型中考慮了足夠多的傳感器時(shí),預(yù)測誤差將達(dá)到一個(gè)飽和值;3) 預(yù)測模型的大小還受到其他一些因素的制約,包括通信帶寬、中央處理單元(CPU)和內(nèi)存的容量,以及算法的復(fù)雜性。一個(gè)包含所有數(shù)據(jù)的超額模型如果無法進(jìn)行實(shí)時(shí)預(yù)測,就會(huì)變得毫無用處[15],因而需要選擇具有較大相關(guān)性的交通流量時(shí)間序列數(shù)據(jù)作為輸入。
筆者采用一種無監(jiān)督的時(shí)間序列聚類方法K-shape對(duì)時(shí)序數(shù)據(jù)進(jìn)行劃分[16],使用K-shape進(jìn)行時(shí)間序列的聚類主要包括分配(Assignment)和細(xì)化(Refinement)兩個(gè)環(huán)節(jié)。在分配步驟中,算法比較每個(gè)時(shí)間序列與所有計(jì)算的質(zhì)心,并將每個(gè)時(shí)間序列分配給最接近質(zhì)心的簇。在細(xì)化步驟中,迭代更新集群中心以反映前一步中集群成員的變化。將歷史交通流量數(shù)據(jù)按天進(jìn)行劃分,1 d的交通流量時(shí)間序列數(shù)據(jù)是由環(huán)路檢測器按照等間隔時(shí)間戳收集的連續(xù)觀察數(shù)值,可以用D=[d1,d2,…,di,…,dn]表示,其中:di為根據(jù)時(shí)間索引值i觀測到的交通流量值;n為時(shí)間間隔數(shù)。所有天數(shù)的流量時(shí)間序列可以用矩陣Q=[D1,D2,…,Di,…,Dm]表示,其中:Di為其中某一天的流量時(shí)間序列;m為天數(shù)。
K-shape使用一種新的時(shí)間序列距離測度方法,基于形狀的距離(SBD),并根據(jù)SBD計(jì)算類的質(zhì)心,與其他方法相比,K-shape更適用于時(shí)間序列的聚類。使用系數(shù)歸一化,不管數(shù)據(jù)歸一化的情況如何,都會(huì)給出-1~1的值。系數(shù)歸一化將交叉相關(guān)序列除以各個(gè)序列自相關(guān)的幾何平均值。序列歸一化后,檢測互相關(guān)最大化的位置,得出距離度量。
使用K-shape進(jìn)行聚類的算法偽代碼如下:
輸入:Q為一個(gè)m×n的交通流時(shí)間序列矩陣,包含m天,每天長度為n的時(shí)間序列;k為聚類數(shù)。
輸出:C為一個(gè)k×n的矩陣,包含k個(gè)簇中心,長度為n;X為一個(gè)m×1的矩陣,包含了劃分給k個(gè)簇的m條時(shí)間序列。
1)iter←0
2)X′←[ ]
3)whileX!=X′ and iter < threshold do
4)X′←X
5)fori←1 tokdo
6)Q′←[ ]
7)forj←1 tondo
8)ifX(j)=ithen
9)Q′←[Q′;Q(j)]
10)C(i)←ShapeExtraction(Q′,C(i))
11)fori←1 tomdo
12)distmin←∞
13)forj←1 tokdo
14)[dist,q′]←SBD(C(j),Q(i))
15)if dist< distminthen
16)distmin←dist
17)X(i)←j
18)iter←iter+1
通過互相關(guān)方法度量時(shí)間序列的相關(guān)性,對(duì)于時(shí)間序列X=(x1,x2,…,xn),以及Y=(y1,y2,…,yn),互相關(guān)方法保持Y靜止,使X沿著Y滑動(dòng),對(duì)于X的每一次滑動(dòng)s,計(jì)算其內(nèi)積,具體表達(dá)式為
Xs=(x1,x2,…,xn)
(2)
(3)
對(duì)于所有可能的滑動(dòng)s,計(jì)算內(nèi)積CC(X,Y),作為2個(gè)時(shí)間序列X與Y之間的相似度,等式為
(4)
互相關(guān)是內(nèi)積的最大值,表示在最佳相位滑動(dòng)s條件下X與Y之間的相似度。因?yàn)樵谧罴训幕瑒?dòng)條件下,模式相似的X與Y剛好對(duì)齊,兩者的內(nèi)積為最大,所以互相關(guān)方法克服了相位滑動(dòng)問題,比較了2條時(shí)間序列的形狀相似性。基于形狀的距離SBD取值為[0, 2],其計(jì)算式為
(5)
式中s為1次滑動(dòng)。
交通流量通常與附近地點(diǎn)有較強(qiáng)的相關(guān)性。一條道路的未來交通狀況可以通過其相鄰道路的現(xiàn)狀來預(yù)測。相鄰2條道路之間的預(yù)測能力可以通過其時(shí)空相關(guān)性來估計(jì),即在時(shí)間維度之外,可以考慮擴(kuò)展空間維度提升交通流預(yù)測的準(zhǔn)確性。筆者選用一種深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測交通流量,卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM)是深度學(xué)習(xí)預(yù)測模塊的主要部分,最早由Shi等[17]提出用于解決時(shí)空序列問題,通過對(duì)全連接LSTM進(jìn)行擴(kuò)展,使?fàn)顟B(tài)之間的轉(zhuǎn)換也具有卷積結(jié)構(gòu)。ConvLSTM模塊包含卷積神經(jīng)網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)由2個(gè)卷積層組成,LSTM網(wǎng)絡(luò)分別包含2個(gè)LSTM層。ConvLSTM使用一維卷積操作提取交通流的空間特征,使用LSTM提取時(shí)間維度的特征,以此預(yù)測交通流量[11]。ConvLSTM結(jié)構(gòu)如圖5所示,將多個(gè)一維卷積和LSTM層進(jìn)行堆疊,以提升深度神經(jīng)網(wǎng)絡(luò)的預(yù)測效果。
圖5 卷積LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Convolutional-LSTM neural network structure
ConvLSTM的輸入如式(1)所示的時(shí)空交通流量,為了提取空間特征,在每個(gè)時(shí)間步長t對(duì)流量數(shù)據(jù)Fp×T進(jìn)行一維卷積運(yùn)算,一維卷積核濾波器通過滑動(dòng)濾波器獲取局部感知域。待預(yù)測點(diǎn)及其鄰近地區(qū)的歷史交通流量矩陣可以表示為
式中:p為檢測的站點(diǎn)數(shù);T為時(shí)間步長。
一維卷積核濾波器通過滑動(dòng)濾波器獲取局部感知域,卷積核濾波器的過程可以表示為
Y=σ(Ws*F+bs)
式中:Ws為濾波器權(quán)重矩陣;bs為偏置;Y為卷積層輸出。
由于數(shù)據(jù)有限,模型中空間特征的維度不大,在卷積層之后不應(yīng)用池化層??臻g信息經(jīng)過2個(gè)卷積層處理后,再將輸出連接到LSTM網(wǎng)絡(luò)。為了提高深度神經(jīng)網(wǎng)絡(luò)的性能,傳統(tǒng)的方法是增加模型的層數(shù),將多個(gè)LSTM層堆疊到模型中,以捕獲更高層次的交通流特征,通過堆疊LSTM層,每個(gè)LSTM層都會(huì)接收上一層的隱藏狀態(tài)作為輸入。通過本地的輸入和過去狀態(tài)來確定網(wǎng)絡(luò)中某個(gè)單元的未來狀態(tài),ConvLSTM的基本公式組為
it=σ(Wxi*Xt+Whi*Ht-1+Wci°Ct-1+bi)
ft=σ(Wxf*Xt+Whf*Ht-1+Wcf°Ct-1+bf)
Ct=f°Ct-1+it°tanh(Wxc*Xt+Whc*Ht-1+bc)
ot=σ(Wxo*Xt+Who*Ht-1+Wco°Ct+bo)
Ht=ot°tanh(Ct)
式中:σ為激活函數(shù);o為哈達(dá)瑪積(Hadamard product),即矩陣各元素之間的乘積;it為輸入門;ft為遺忘門;Xt為t時(shí)刻LSTM的輸入;Ct為當(dāng)前節(jié)點(diǎn)的狀態(tài);Ht為LSTM層的輸出??梢钥闯鲚敵鍪怯僧?dāng)前節(jié)點(diǎn)的狀態(tài)Ct和當(dāng)前時(shí)刻的輸出ot決定的。
K-shape對(duì)交通流量序列時(shí)間聚類結(jié)果如圖6所示。根據(jù)曲線的相似度進(jìn)行聚類,由圖6可知:在相同的簇中,流量曲線呈現(xiàn)相近的走勢;在2個(gè)不同的簇中,流量時(shí)間序列呈現(xiàn)出不同的趨勢。在6:00—7:00時(shí),2個(gè)簇中的流量序列差距達(dá)到峰值,可能是由于工作日與周末早高峰時(shí)期車流量的不同,以及天氣、事故和交通管制等外部因素共同導(dǎo)致的。在區(qū)分不同交通流量模式時(shí),如果考慮事故、天氣和交通管制等各種外部因素會(huì)導(dǎo)致變量過多,難以通過建模進(jìn)行區(qū)分。而K-shape基于曲線的相似度進(jìn)行聚類,綜合考慮了由于外部因素導(dǎo)致的曲線變化,可提升后續(xù)交通流量預(yù)測的精度。
圖6 時(shí)間聚類結(jié)果Fig.6 Time clustering results
使用TensorFlow和Keras框架搭建深度學(xué)習(xí)模型。選擇128作為批尺寸大小,訓(xùn)練時(shí)期設(shè)置為150,所有的深度學(xué)習(xí)模型均采用RMSprop作為優(yōu)化器。訓(xùn)練集使用了48 d的數(shù)據(jù)(占總天數(shù)的84.2%),測試集使用了剩余9 d的數(shù)據(jù)(15.8%)。最佳滯后時(shí)間可以使模型的預(yù)測誤差最小化,采用的最大滯后時(shí)間為60 min。使用12個(gè)歷史值來預(yù)測后一個(gè)值是比較合理的,較少的歷史值會(huì)導(dǎo)致預(yù)測結(jié)果偏差較大。歷史值越多導(dǎo)致計(jì)算時(shí)間越長,容易出現(xiàn)過擬合。除了滯后時(shí)間,還需選擇深度神經(jīng)網(wǎng)絡(luò)模型的最佳參數(shù)。
在對(duì)比實(shí)驗(yàn)的設(shè)置中,實(shí)驗(yàn)對(duì)照組的選擇方法有3種:
1) 棧式自編碼機(jī)(SAEs)[7]:棧式自編碼機(jī)是一種新型的基于深度學(xué)習(xí)的交通流量預(yù)測方法,該方法內(nèi)在地考慮了空間和時(shí)間的相關(guān)性。采用堆棧式自動(dòng)編碼器模型來學(xué)習(xí)通用的交通流特征,并以貪婪的層級(jí)方式對(duì)其進(jìn)行訓(xùn)練。
2) 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)[18]:LSTM是一種循環(huán)神經(jīng)網(wǎng)絡(luò)變體。LSTM通過加入記憶單元,克服網(wǎng)絡(luò)層間梯度傳播導(dǎo)致的爆炸或梯度消失問題,并通過遺忘門和選擇門加強(qiáng)對(duì)歷史信息的記憶。在訓(xùn)練階段,它通過對(duì)歷史數(shù)據(jù)的學(xué)習(xí),獲得權(quán)重、偏移量和輸出等參數(shù),可以幫助識(shí)別和記憶歷史數(shù)據(jù)的特征。
3) 卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM)[11]:ConvLSTM模塊由卷積神經(jīng)網(wǎng)絡(luò)和LSTM構(gòu)建而成,其中利用卷積神經(jīng)網(wǎng)絡(luò)提取交通流的空間特征,然后與LSTM連接,得到交通流的短期時(shí)間特征。
實(shí)驗(yàn)中使用平均絕對(duì)誤差(MAE)、根平均平方誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)和決定系數(shù)(R2)這幾種評(píng)價(jià)指標(biāo)對(duì)預(yù)測結(jié)果及進(jìn)行全方位評(píng)價(jià)。MAPE為0%表示模型完美,而MAPE大于100%表示模型有缺陷。當(dāng)預(yù)測值與真實(shí)值完全吻合時(shí),RMSE等于0,表示模型完美。R2值若為0,說明模型擬合效果很差,如果為1,說明模型無錯(cuò)誤。
評(píng)價(jià)指標(biāo)計(jì)算式分別為
各方法的預(yù)測性能如表2所示。由表2可知:與其他方法相比,TC-ConvLSTM取得了更好的預(yù)測效果和預(yù)測精度。與SAEs和LSTM對(duì)比,TC-ConvLSTM的MAE分別提升了1.181,1.262輛/h;MAPE分別提升了2.244%,0.698%;RMSE分別提升了1.603,1.131輛/h。與其他深度學(xué)習(xí)方法相比,TC-ConvLSTM取得了更高的預(yù)測精度。而對(duì)于沒有時(shí)間聚類的方法,聚類后的神經(jīng)網(wǎng)絡(luò)精度也有所提升。說明模型前使用時(shí)間聚類方法可以進(jìn)一步降低預(yù)測誤差。
表2 交通流預(yù)測效果評(píng)價(jià)Table 2 Evaluation of traffic flow prediction
在5 min預(yù)測范圍內(nèi),對(duì)0:00至24:00進(jìn)行交通流量預(yù)測性能比較,其流量預(yù)測效果如圖7所示。從圖7可以看出:TC-ConvLSTM所取得的預(yù)測流量更加接近真實(shí)流量,尤其是在交通量波動(dòng)較大的時(shí)段,并且在高峰和平峰時(shí)期都有較好的擬合度,而SAEs方法雖然在高峰時(shí)期精度較高,但是在平峰時(shí)期擬合度較差。與原先未添加聚類方法進(jìn)行對(duì)比發(fā)現(xiàn),時(shí)間聚類后模型預(yù)測精度更高,對(duì)于高峰時(shí)期的刻畫更加準(zhǔn)確。
圖7 流量預(yù)測效果Fig.7 Performance of traffic flow prediction
在交通流預(yù)測環(huán)節(jié)中,存在使用同一深度學(xué)習(xí)模型對(duì)所有的交通數(shù)據(jù)進(jìn)行訓(xùn)練、預(yù)測的問題,忽略了交通流在不同的外部條件影響下呈現(xiàn)不同的趨勢和波動(dòng)特性的情況,以及交通流空間維度的關(guān)聯(lián)性。針對(duì)以上問題,提出了一種基于時(shí)間序列聚類的深度神經(jīng)網(wǎng)絡(luò)交通流預(yù)測方法。筆者采集快速路的交通流數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行篩選、清洗和修復(fù);使用K-shape方法對(duì)交通流數(shù)據(jù)進(jìn)行聚類,K-shape是一種無監(jiān)督學(xué)習(xí)的時(shí)間聚類算法,考慮時(shí)間序列的波動(dòng)相似性,適用于對(duì)受到節(jié)假日、天氣和事故等外部因素影響的不同交通模式進(jìn)行劃分;對(duì)聚類得到的不同簇分別使用卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。實(shí)驗(yàn)結(jié)果表明:與其他深度學(xué)習(xí)方法相比,筆者方法預(yù)測的精度更高,而與未添加時(shí)間序列聚類的神經(jīng)網(wǎng)絡(luò)方法相比,筆者方法預(yù)測效果有較為明顯的提升,體現(xiàn)了前期聚類的效果。