張揚(yáng)永
(中共福建省委黨校 福建行政學(xué)院,福建 福州 350001)
當(dāng)前,交通擁堵已成為日常生活中常見(jiàn)的問(wèn)題,高速公路的交通擁堵也成為普通現(xiàn)象,影響道路通行能力的主要原因是常住人口城鎮(zhèn)化率和機(jī)動(dòng)車(chē)保有量提升與現(xiàn)有交通基礎(chǔ)設(shè)施發(fā)展不匹配之間的矛盾[1]。緩解交通擁堵和減少交通事故,提供更優(yōu)質(zhì)的道路行駛路線(xiàn),已經(jīng)成為提高路網(wǎng)的交通效率和安全性的重點(diǎn)研究課題。各類(lèi)研究理論和應(yīng)用實(shí)際已經(jīng)表明,修建更多的道路、投入更多的人員(交通警察)等各類(lèi)強(qiáng)化交通基礎(chǔ)設(shè)施,雖然在一定程度上緩解了交通擁堵但成本非常高[2],因此,很有必要利用科學(xué)技術(shù)手段來(lái)輔助解決交通擁堵問(wèn)題。智能交通系統(tǒng)(intelligent traffic system,ITS)隨之產(chǎn)生,并且發(fā)展迅速。針對(duì)加強(qiáng)建設(shè)交通基礎(chǔ)設(shè)施解決交通擁堵成本過(guò)高問(wèn)題,ITS通過(guò)交通實(shí)時(shí)預(yù)測(cè)、交通誘導(dǎo)等技術(shù)在很大程度上緩解了交通擁堵,尤其是在突發(fā)道路交通擁堵問(wèn)題上,ITS的交通實(shí)時(shí)預(yù)測(cè)不僅方便了大眾出行,也提升了道路交通的通行效率。
學(xué)者在ITS研究道路交通問(wèn)題中主要涉及的算法和模型大致可以分為3類(lèi):參數(shù)方法、非參數(shù)方法和深度學(xué)習(xí)方法[3]。大多數(shù)預(yù)測(cè)方法都是利用時(shí)間變量對(duì)交通流進(jìn)行預(yù)測(cè),而交通數(shù)據(jù)往往是以時(shí)間序列(time series,TS)的形式表示的。因此,整合移動(dòng)平均自回歸模型(autoregressive integrated moving average model,ARIMA)在交通科學(xué)的預(yù)測(cè)應(yīng)用中經(jīng)常使用,該模型假設(shè)未來(lái)交通量根據(jù)當(dāng)前交通量線(xiàn)性變化,如:早期學(xué)者大多數(shù)使用支持向量回歸(support vector regression,SVR)利用非線(xiàn)性變化進(jìn)行流量預(yù)測(cè),Dong-wei等人[4]基于道路交通歷史數(shù)據(jù)建立時(shí)間序列的ARIMA模型,張帆[5]在A(yíng)RIMA和支持向量機(jī)(support vector machines,SVM)結(jié)合,建立ARIMA-SVM組合模型,這些都具有較好的應(yīng)用效果。然而,對(duì)于交通科學(xué)而言,僅使用時(shí)間變化不足以準(zhǔn)確預(yù)測(cè)交通流的暫時(shí)擾動(dòng),如交通事故、建筑工地等也會(huì)造成通堵塞。因此,機(jī)器學(xué)習(xí)方法也被廣泛用于處理短期交通流預(yù)測(cè),如SVM、SVR、高斯過(guò)程、隨機(jī)方法等。近年來(lái),隨著人工智能(artificial intelligence,AI)的發(fā)展,許多人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,NNs)模型被應(yīng)用到交通科學(xué)中,BJZA[6]通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)來(lái)模擬特征之間復(fù)雜的非線(xiàn)性關(guān)系,Qiao Y等人[7]運(yùn)用OpenITS開(kāi)放數(shù)據(jù)平臺(tái),結(jié)合神經(jīng)網(wǎng)絡(luò)進(jìn)行的短時(shí)交通流預(yù)測(cè),Koesdwi等[8]在深層信任網(wǎng)絡(luò)中加入交通事故和天氣情況,如提供最佳導(dǎo)航策略,進(jìn)而提升預(yù)測(cè)道路交通狀況。較新的研究也在模型中加入時(shí)空因素,如熊振華等[9]從交通路網(wǎng)時(shí)空分布特征入手,曹堉等[10]基于時(shí)空節(jié)點(diǎn)選擇和深度學(xué)習(xí)的城市道路短時(shí)交通流預(yù)測(cè),在各自研究的實(shí)驗(yàn)數(shù)據(jù)中均取得很好的效果。
在最新道路交通大數(shù)據(jù)的研究中,如何充分有效地利用大數(shù)據(jù)下的海量交通流數(shù)據(jù),提升路網(wǎng)交通流進(jìn)行實(shí)時(shí)預(yù)測(cè)準(zhǔn)確率,如實(shí)時(shí)短期交通流預(yù)測(cè)信息(估計(jì)出行數(shù)據(jù)、預(yù)期延誤和備選路線(xiàn)),重點(diǎn)開(kāi)發(fā)動(dòng)態(tài)GPS誘導(dǎo)、路段速度估算、車(chē)流量預(yù)測(cè)等ITS關(guān)鍵技術(shù),已經(jīng)成為ITS研究中最核心的、最具挑戰(zhàn)的難題。本研究基于TS-NN(time series-neural network)模型的道路交通車(chē)流量預(yù)測(cè)重點(diǎn)圍繞車(chē)流量的預(yù)測(cè)算法,輔助提升ITS智能化,從計(jì)算機(jī)科學(xué)角度提升道路通行效率,從而緩解道路交通擁堵成本投入問(wèn)題。
ITS又稱(chēng)智能運(yùn)輸系統(tǒng)(intelligent transportation system),是將先進(jìn)的科學(xué)技術(shù)(信息技術(shù)、計(jì)算機(jī)技術(shù)、數(shù)據(jù)通信技術(shù)、傳感器技術(shù)、電子控制技術(shù)、自動(dòng)控制理論、運(yùn)籌學(xué)、人工智能等)有效地綜合運(yùn)用于交通運(yùn)輸、服務(wù)控制和車(chē)輛制造,加強(qiáng)車(chē)輛、道路、使用者三者之間的聯(lián)系[11]。隨著ITS技術(shù)不斷發(fā)展和交通信息采集技術(shù)的不斷完善,ITS可以獲取實(shí)時(shí)的交通數(shù)據(jù),提取實(shí)時(shí)的交通狀態(tài)信息,如交通流量、速度、占用率等,通過(guò)ITS中運(yùn)籌學(xué)、時(shí)間序列、人工通能、神經(jīng)網(wǎng)絡(luò)等各類(lèi)算法,提高了數(shù)據(jù)采集的質(zhì)量和預(yù)測(cè)(流量、密度、路況)的準(zhǔn)確性,如:高效的導(dǎo)航已成為交通出行的主要手段[12]。國(guó)內(nèi)外現(xiàn)有ITS算法設(shè)計(jì)中回歸、分類(lèi)等學(xué)習(xí)方法大多是淺層結(jié)構(gòu)算法,其局限性在于當(dāng)樣本和計(jì)算單元有限時(shí),而對(duì)于神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí)在一般的分類(lèi)問(wèn)題上,它們的泛化能力也受到一定的限制,往往忽略了交通流數(shù)據(jù)的某些特征(信息不全等),另外模型在高速公路和城市路段的適應(yīng)性也不盡如意。因此,將時(shí)間序列和神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái),采用了多變量時(shí)間序列方法和具有空間信息輸入的神經(jīng)網(wǎng)絡(luò)相結(jié)合方法(時(shí)間序列聯(lián)合神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱(chēng)為T(mén)S-NN),既包括交通流的時(shí)間性,又含有交通流的空間特征,在實(shí)驗(yàn)中,對(duì)比了神經(jīng)網(wǎng)絡(luò)典型應(yīng)用長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)模型和時(shí)間序列最經(jīng)典的ARIMA模型,TS-NN在準(zhǔn)確率預(yù)測(cè)方面確實(shí)能得到一定的提升。雖然交通科學(xué)明確區(qū)分了自由交通和擁擠交通,但在ITS學(xué)術(shù)界中道路交通的研究主要包括車(chē)輛誘導(dǎo)算法設(shè)計(jì)、道路實(shí)時(shí)數(shù)據(jù)采集、預(yù)測(cè)模型等3個(gè)方面,其中預(yù)測(cè)模型又包括了速度、密度、流量等,這些算法和模型仍然有很多需要改良的地方。
時(shí)間序列在ITS中的應(yīng)用,主要是按照時(shí)間排序的一組道路交通隨機(jī)變量如車(chē)流量、密度、路況等信息,它通常是在相等間隔的時(shí)間段內(nèi)(實(shí)時(shí)交通數(shù)據(jù)往往按秒或分鐘等小單位計(jì)量)依照給定的采樣率對(duì)道路交通潛在變化過(guò)程進(jìn)行觀(guān)測(cè)的結(jié)果,同時(shí)這些道路交通變量會(huì)隨時(shí)間呈現(xiàn)一定規(guī)律的變化趨勢(shì),其一般形式為:
X={(ti,xi)}ni=1
(1)
式中,X表示了第i個(gè)記錄了ti時(shí)刻的交通變量xi的信息,常見(jiàn)建立序列值隨時(shí)間變化的回歸模型有參數(shù)估計(jì)方法為最小二乘估計(jì),如Xt=a+bt+It,其中E(It)=0,在預(yù)測(cè)上主要采用簡(jiǎn)單平均數(shù)法和加權(quán)平均數(shù)法,典型的模型有AR、MA、ARMA、ARIMA。其中,ARIMA由自回歸移動(dòng)平均模型增加差分演化而來(lái),而ARMA由自回歸模型(auto regressive model,AR)和移動(dòng)平均模型(moving average model,MA)組成,具體如表1所示。
表1 時(shí)間序列模型對(duì)比
神經(jīng)網(wǎng)絡(luò)可簡(jiǎn)單理解為由眾多的輸入神經(jīng)元相互連接到輸出神經(jīng)元,輸入神經(jīng)元到輸出神經(jīng)元中間稱(chēng)為隱藏層(也稱(chēng)中間層,層數(shù)不限,層數(shù)越多,網(wǎng)絡(luò)越復(fù)雜,不同應(yīng)用需要的層數(shù)不統(tǒng)一,目前科學(xué)上沒(méi)有實(shí)例證明層數(shù)越多或越少準(zhǔn)確率越好,僅能說(shuō)明層數(shù)越多效率越差),同時(shí)連接各個(gè)神經(jīng)元的權(quán)重值是可以被訓(xùn)練調(diào)節(jié),因而可以大規(guī)模并行處理和網(wǎng)絡(luò)內(nèi)自我學(xué)習(xí)。早期,人工神經(jīng)網(wǎng)絡(luò)中以誤差反向傳播算法(back propagation,BP,如圖1左側(cè))是應(yīng)用較廣的一種監(jiān)督式的學(xué)習(xí)算法,具有很強(qiáng)的非線(xiàn)性映射能力,如輸入神經(jīng)元為各種交通網(wǎng)絡(luò)采集值,輸出神經(jīng)元為交通擁堵情況(歷史已經(jīng)發(fā)生的信息),通過(guò)BP學(xué)習(xí)后可以判斷出(未來(lái)或測(cè)試集)交通擁堵情況。BP數(shù)學(xué)表現(xiàn)方式也比較簡(jiǎn)潔,主要分為前向傳播和反向傳播,前向輸出表示為:
Y=σ(wTX+b)
(2)
式中,X、Y表示輸入、輸出的神經(jīng)元數(shù)據(jù),每一層都是如此,σ表示激活函數(shù),常用的激活函數(shù)參看表2所示;wT表示輸入層到輸出層之間的權(quán)重值矩陣,b表示偏置,這兩個(gè)參數(shù)都需要在后向傳播中被訓(xùn)練修正。
表2 神經(jīng)網(wǎng)絡(luò)中常用的激活函數(shù)
(3)
(4)
式中,α表示學(xué)習(xí)率,?表示求導(dǎo),權(quán)重值通過(guò)求導(dǎo)進(jìn)行梯度下降,在反向傳播后逐層更新直到第一層(輸入層)再進(jìn)行前向傳播,然后再反向傳播,一直循環(huán),直至神經(jīng)網(wǎng)絡(luò)中設(shè)置的迭代(循環(huán)次數(shù))完成。
深度學(xué)習(xí)在不斷的應(yīng)用過(guò)程中,發(fā)現(xiàn)BP網(wǎng)絡(luò)存在局部極小化問(wèn)題、樣本依賴(lài)、應(yīng)用實(shí)例與網(wǎng)絡(luò)規(guī)模的矛盾等問(wèn)題,因此發(fā)展出不同的應(yīng)用場(chǎng)景的網(wǎng)絡(luò)模型,如將隱藏層之間的節(jié)點(diǎn)不再無(wú)連接改為有連接的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(圖1中間部分),在自然語(yǔ)言處理、語(yǔ)音識(shí)別、文本相似度計(jì)算等都有著很大的優(yōu)勢(shì),假定在隱藏層中用t,t-1等表示當(dāng)前時(shí)序和前一刻時(shí)序,yt為t處記憶值則RNN的輸出表示為公式5。
yt=f(Uxt+Wyt-1)
(5)
式中,W表示輸入的權(quán)重,U表示此刻輸入的樣本的權(quán)重,誤差函數(shù)參看公式3,用V表示輸出的樣本權(quán)重,則更新權(quán)重就有如下公式所示:
(6)
(7)
(8)
RNN的缺點(diǎn)是無(wú)法“記憶”長(zhǎng)時(shí)間序列上的信息,因此LSTM(原理如圖1右側(cè))從神經(jīng)網(wǎng)絡(luò)科學(xué)上可以認(rèn)為是針對(duì)RNN存在的問(wèn)題改進(jìn)而來(lái)的,引入門(mén)(gate)的概念,主要有遺忘門(mén)F、輸入門(mén)I和輸出門(mén)O,用ht-1表示前一個(gè)輸出xt表示當(dāng)前輸入,則3個(gè)門(mén)可表示為如下公式:
圖1 神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)單到復(fù)雜)的變遷Fig.1 Transition of neural network (simple to complex)
ft=σ(Wf[ht-1,xt]+bf
(9)
It=σ(Wi[ht-1,xt]+bi
(10)
ot=σ(Wo[ht-1,xt]+bo
(11)
式中,b表示偏置。
LSTM通過(guò)門(mén)函數(shù),將一部分梯度遺忘掉,因此梯度消失發(fā)生的概率變得極低,LSTM是通過(guò)記憶和當(dāng)前輸入相加(不是相乘,如果有0值出現(xiàn)則信息會(huì)消失),因此,在之前網(wǎng)絡(luò)的信息會(huì)繼續(xù)存在而不是部分“消失”。
不管是時(shí)間序列還是神經(jīng)網(wǎng)絡(luò),都需要觀(guān)測(cè)樣本,時(shí)間序列可能有一個(gè)潛在的趨勢(shì),但這個(gè)趨勢(shì)如果不通過(guò)網(wǎng)絡(luò)去辨別,可能很難推斷出。因此,嘗試將時(shí)間序列和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起進(jìn)行模型設(shè)計(jì)。首先,假設(shè)所有交通信息的統(tǒng)計(jì)特性是具有時(shí)間依賴(lài)的,通過(guò)時(shí)間序列算法進(jìn)行預(yù)測(cè)分析,再采用神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法,以便網(wǎng)絡(luò)能夠“跟蹤時(shí)間”,同時(shí)對(duì)不斷變化的交通信息統(tǒng)計(jì)提取特征,解決時(shí)間序列、神經(jīng)網(wǎng)絡(luò)各自的缺陷。使用時(shí)間序列X={(ti,xi)}ni=1為基礎(chǔ)進(jìn)行設(shè)計(jì)的TS-NN算法,具體步驟如下:
第一步:數(shù)據(jù)預(yù)處理。首先進(jìn)行數(shù)據(jù)填充與修正,交通信息的在采集過(guò)程中數(shù)據(jù)會(huì)出現(xiàn)不完整,部分異常零值也需要修正,填充與修正方式主要根據(jù)時(shí)間前后進(jìn)行移動(dòng)平均處理,學(xué)術(shù)研究中常用此方法進(jìn)行填充。假定第m個(gè)記錄了tm時(shí)刻的交通變量xm的信息缺失,通過(guò)n個(gè)時(shí)刻信息進(jìn)行處理,可使用如下方式進(jìn)行填充:
(12)
式中,xm通過(guò)前面n個(gè)時(shí)刻信息進(jìn)行移動(dòng)平均處理所得。
第二步:時(shí)間序列模型。先判斷序列的平穩(wěn)性,觀(guān)測(cè)交通信息的時(shí)間序列數(shù)據(jù),通過(guò)AR(p)和MA(q)判斷是否為平穩(wěn)時(shí)間序列。
對(duì)于非平穩(wěn)時(shí)間序列,先進(jìn)行d階差分,化為平穩(wěn)時(shí)間序列,取得d值;同表1工作原理,ARIMA(p,d,q)中,p為自回歸項(xiàng)數(shù),d為使之成為平穩(wěn)序列所做的差分次數(shù)(階數(shù)),q為滑動(dòng)平均項(xiàng)數(shù)。
第三步:神經(jīng)網(wǎng)絡(luò)模型。訓(xùn)練實(shí)驗(yàn):將時(shí)間序列處理后的結(jié)果進(jìn)行神經(jīng)網(wǎng)絡(luò)的分類(lèi)訓(xùn)練,同時(shí)調(diào)整不同參數(shù)(學(xué)習(xí)率、迭代次數(shù)、激活函數(shù)、網(wǎng)絡(luò)層數(shù)、隱藏節(jié)點(diǎn)數(shù)等,lstm(lr,echos,active,nns,hn,p)。
首先,將道路交通數(shù)據(jù)分節(jié)點(diǎn)(設(shè)置好輸入節(jié)點(diǎn)、隱藏層數(shù)和隱藏層節(jié)點(diǎn)、輸出節(jié)點(diǎn))導(dǎo)入到神經(jīng)網(wǎng)絡(luò)模型中,在不斷迭代訓(xùn)練中,根據(jù)損失函數(shù)(預(yù)測(cè)值與正確值的偏離程度)趨于穩(wěn)定時(shí),獲得較優(yōu)訓(xùn)練參數(shù),然后進(jìn)入測(cè)試實(shí)驗(yàn)。
測(cè)試實(shí)驗(yàn):在訓(xùn)練集上獲得的訓(xùn)練參數(shù)運(yùn)用在測(cè)試上的實(shí)驗(yàn),主要是為了檢測(cè)在測(cè)試集上測(cè)試訓(xùn)練的模型效果,對(duì)準(zhǔn)確率、效率、損失函數(shù)進(jìn)行評(píng)價(jià)。
對(duì)比實(shí)驗(yàn):將測(cè)試結(jié)果與時(shí)間序列模型(ARIMA)、神經(jīng)網(wǎng)絡(luò)模型(LSTM)和本文模型(TS-NN)進(jìn)行對(duì)比分析。
將時(shí)間序列和神經(jīng)網(wǎng)絡(luò)相結(jié)合的城市道路速度預(yù)測(cè)算法TS-NN首先要對(duì)道路交通進(jìn)行預(yù)處理,處理后的道路交通數(shù)據(jù)(input_list)和交通量信息(target_list)即為模型的輸入信息,通過(guò)時(shí)間序列模型計(jì)算不同p、q值,再代入神經(jīng)網(wǎng)絡(luò)模型,TS-NN核心算法的實(shí)現(xiàn)如下代碼示:
Inputs: input_list: 道路交通數(shù)據(jù),輸入列表,target_list:交通量實(shí)際結(jié)果,目標(biāo)列表.Outputs: output_list: 測(cè)試后的效果,輸出列表.12345678910111213p15traffic_data ← input_list.diff().dropna() #對(duì)路交通數(shù)據(jù)進(jìn)行差分pmax,qmax ←int(len(traffic_data) / 10) #一般階數(shù)不超過(guò) length /10temp[] #存計(jì)算不同p、q值數(shù)據(jù)結(jié)構(gòu)for i in range(pmax+1):for j in range(qmax+1):a←ARIMA(data,(i,1,j)).fit().bictemp.append(a)p,q ← pd.DataFrame(temp).stack().idxmin() #找出最小值的位置inputs, targets← input_list.T ,target_list.T #輸入與目標(biāo)矩陣轉(zhuǎn)置m←model.get_lstm([12, 64, 64, 1]) #模型設(shè)置config ← {"batch": 256, "epochs": 600, "arima-p": p, "arima-q": q} #對(duì)比時(shí)會(huì)將迭代次數(shù)100至600不同的變化train_model(m, inputs, args.model, config) #模型訓(xùn)練output_list ←test_model(m, target, args.model, config)returnoutput_list
本實(shí)驗(yàn)操作系統(tǒng)環(huán)境為Windows 10專(zhuān)業(yè)版64位,開(kāi)發(fā)語(yǔ)言為python3.7,所需框架有Tensorflow GPU 1.5.0、Keras 2.1.3和scikit-learn 0.19;硬件上采用性能比較好的臺(tái)式計(jì)算機(jī)CPU為i7-8700 3.2 G(6核、12線(xiàn)程),內(nèi)存為DDR4 2666(16 G)及256 G固態(tài)硬盤(pán)。訓(xùn)練模型為有ARIMA、LSTM和TS-NN,各類(lèi)參數(shù)設(shè)定如表3所示。其中,參數(shù)選擇的依據(jù)主要依賴(lài)于多次迭代和訓(xùn)練效果的對(duì)比,學(xué)習(xí)率主要是根據(jù)大多數(shù)的訓(xùn)練設(shè)置。實(shí)驗(yàn)選取了城市道路交通和高速道路交通兩種類(lèi)型的道路交通數(shù)據(jù),分別為美國(guó)橫跨加州高速公路和我國(guó)安徽省黃山市徽州區(qū)黃山路段交通數(shù)據(jù)進(jìn)行測(cè)試,高速和城市的道路交通數(shù)據(jù)特點(diǎn)不一樣,用于TS-NN模型檢測(cè)是為了體現(xiàn)模型具備一定的適應(yīng)性,數(shù)據(jù)信息如表4所示。
表3 模型參數(shù)
表4 實(shí)驗(yàn)數(shù)據(jù)
在實(shí)驗(yàn)過(guò)程中,分別使用ARIMA、LSTM和TS-NN在城市道路交通和高速道路交通兩種不同的道路交通數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),同時(shí)在不同的迭代中觀(guān)察預(yù)測(cè)準(zhǔn)確率(預(yù)測(cè)準(zhǔn)確數(shù)除以總樣本數(shù))。實(shí)驗(yàn)?zāi)繕?biāo)為車(chē)流量,即在一定的時(shí)間內(nèi),某條公路點(diǎn)上所通過(guò)的車(chē)輛數(shù),該指標(biāo)與路段吞吐量、時(shí)間節(jié)點(diǎn)相結(jié)合可以判斷出道路交通的擁堵情況,為ITS系統(tǒng)做出科學(xué)判斷提供重要的依據(jù),實(shí)驗(yàn)結(jié)果如圖2(黃山市徽州區(qū)黃山路段)和圖3(美國(guó)加州高速公路)所示。
在圖2中,上半部分為測(cè)試全局對(duì)比,為更好的體現(xiàn)模型預(yù)測(cè)效果,下半部分為前50 min的車(chē)流量預(yù)測(cè)對(duì)比情況,實(shí)線(xiàn)代表實(shí)際的車(chē)流量,虛線(xiàn)表示時(shí)間序列預(yù)測(cè)結(jié)果,點(diǎn)劃線(xiàn)表示神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果,點(diǎn)表示本方法(下面圖示也同此表示,不再贅述)。從車(chē)流量預(yù)測(cè)結(jié)果上看ARIMA、LSTM、TS-NN準(zhǔn)確率分別為96.09%、95.58%、97.71%,TS-NN方法有小幅改進(jìn),相對(duì)ARIMA、LSTM模型分別提升了1.62%和2.13%。
同圖2的布局,從圖3前50個(gè)小時(shí)的車(chē)流量預(yù)測(cè)對(duì)比可以明顯看出TS-NN更貼近實(shí)際車(chē)流量。從車(chē)流量(按小時(shí))預(yù)測(cè)結(jié)果上看,ARIMA、LSTM、TS-NN準(zhǔn)確率分別為66.24%、83.58%、87.11%,神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率較時(shí)間序列有較大改進(jìn),這是因?yàn)辄S山路段訓(xùn)練數(shù)據(jù)較多,而加州高速測(cè)試數(shù)據(jù)占訓(xùn)練數(shù)據(jù)比重較大,因此時(shí)間序列模型呈現(xiàn)出較大的劣勢(shì)。對(duì)比兩個(gè)數(shù)據(jù)的模型訓(xùn)練效果使用誤差(預(yù)測(cè)值與真實(shí)值的差,不計(jì)正負(fù)),用零表示無(wú)偏差,具體如圖4所示。
圖2 安徽省黃山市徽州區(qū)黃山路段車(chē)流量預(yù)測(cè)對(duì)比Fig.2 Comparison of traffic flow prediction of Huangshan section in Huizhou District, Huangshan City, Anhui Province
圖3 美國(guó)加州高速公路車(chē)流量預(yù)測(cè)對(duì)比Fig.3 Comparison of traffic flow forecast of California expressway
從圖4可見(jiàn), ARIMA模型的誤差明顯有較大偏離,在訓(xùn)練數(shù)據(jù)不多的情況下(左半部分),隨著時(shí)間推移其偏離比較大, LSTM、TS-NN在兩個(gè)不同的數(shù)據(jù)集中都表現(xiàn)相對(duì)穩(wěn)定。
圖4 誤差對(duì)比Fig.4 Error comparison
隨著人口的增長(zhǎng)和經(jīng)濟(jì)的快速發(fā)展,城鎮(zhèn)率和車(chē)輛數(shù)量不斷上升,交通擁堵問(wèn)題日益突出,國(guó)內(nèi)外針對(duì)道路交通的誘導(dǎo)系統(tǒng)層出不窮,從科學(xué)技術(shù)上提供了出行方案。把時(shí)間序列和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起進(jìn)行的城市道路車(chē)流量預(yù)測(cè)研究,一方面從技術(shù)結(jié)合了時(shí)間序列和神經(jīng)網(wǎng)絡(luò)的算法,在算法上將時(shí)間序列ARIMA的參數(shù)導(dǎo)入到神經(jīng)網(wǎng)絡(luò)中,提升神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率,但也降低了模型的魯棒性;另一方面以車(chē)流量視角進(jìn)行預(yù)測(cè)研究,在高速公路、城市道路兩個(gè)路網(wǎng)數(shù)據(jù)集測(cè)試中,都能提升預(yù)測(cè)的準(zhǔn)確率,從一定程度上,確實(shí)有助于ITS核心算法改進(jìn)。然而,引起道路交通的擁堵的因素有很多,如:早晚上下班過(guò)度集中、城市路網(wǎng)結(jié)構(gòu)不合理等,這些通過(guò)科學(xué)技術(shù)層面仍然比較難以解決,另外,判斷城市道路交通擁堵除車(chē)流量外,還包括車(chē)輛類(lèi)型、車(chē)速、車(chē)密度等參數(shù),因此,要比較科學(xué)的、全面的提升ITS工作能力,還需要加強(qiáng)基礎(chǔ)道路設(shè)施的科學(xué)規(guī)劃,以及提升誘導(dǎo)系統(tǒng)算法準(zhǔn)確率和效率。