馮 微 陳 紅 張兆津 邵海鵬
(1.長安大學(xué)公路學(xué)院 西安 710064; 2.武威職業(yè)學(xué)院電子信息工程系 甘肅 武威 733000)
對城市道路交通流參數(shù)進(jìn)行實時、快速和準(zhǔn)確預(yù)測是智能交通系統(tǒng)控制與誘導(dǎo)的核心工作。短時交通流參數(shù)預(yù)測近年來已發(fā)展成為交通工程領(lǐng)域中的研究熱點之一。盡管眾多學(xué)者提出的短時交通流預(yù)測模型之間各有差異,但總體上能夠分為時間序列[1]、概率圖模型[2]、非參數(shù)統(tǒng)計[3]及組合模型等方法。時間序列法基于以往的歷史數(shù)據(jù),通過探尋交通流隨時間變化的模式進(jìn)行預(yù)測。J Xue等[4]運(yùn)用混沌時間序列分析方法,對交通流數(shù)據(jù)進(jìn)行相空間重構(gòu),提出最鄰近點的兩步優(yōu)化選擇方法,提高了預(yù)測精度。貝葉斯網(wǎng)絡(luò)作為一類常用概率圖模型,在短時交通流參數(shù)預(yù)測方面也得以深入發(fā)展。S Sun等[5]對城市路網(wǎng)中鄰近路段上的交通流參數(shù)進(jìn)行預(yù)測,將貝葉斯網(wǎng)絡(luò)中的鄰近概率分布構(gòu)建成為高斯混合模型,并通過競爭期望最大化算法進(jìn)行求解,獲取預(yù)測結(jié)果;J Wang等[6]提出了一種新的貝葉斯網(wǎng)絡(luò)組合預(yù)測方法,結(jié)合熵的灰色關(guān)聯(lián)性對歷史交通流量之間的相關(guān)性進(jìn)行分析,并利用組合模型預(yù)測短時交通流參數(shù)。為了更有效地解決交通流的非線性、復(fù)雜性和不確定性特點,非參數(shù)統(tǒng)計方法中的神經(jīng)網(wǎng)絡(luò)[7]、支持向量機(jī)[8-9]、隨機(jī)微分方程[10]等方法也逐漸被運(yùn)用到短時交通流預(yù)測中來。
在這些研究的基礎(chǔ)之上,學(xué)者們又對眾多模型進(jìn)行有效組合,旨在提高預(yù)測的準(zhǔn)確性和效率。李松等[11]利用改進(jìn)粒子群算法對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化,通過自適應(yīng)變異算子改善粒子群算法的尋優(yōu)性能,實現(xiàn)對短時交通流更好的非線性擬合能力;G Fusco等[12]將貝葉斯網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,并采用浮動車數(shù)據(jù),在城市大規(guī)模路網(wǎng)中進(jìn)行交通流預(yù)測;梅朵等[13]將遺傳算法中的交叉和變異因子引入粒子群算法進(jìn)行改進(jìn),用以優(yōu)化支持向量機(jī)的參數(shù),提高了預(yù)測精度。
以上短時交通流預(yù)測大多為“淺層學(xué)習(xí)”方法,而城市道路交通復(fù)雜系統(tǒng)中道路條件、交通需求、天氣狀況等因素以非線性方式相聯(lián)系,導(dǎo)致“淺層學(xué)習(xí)”方法在實際應(yīng)用中容易出現(xiàn)預(yù)測結(jié)果不穩(wěn)定、精度不高等情況。深度學(xué)習(xí)作為一種數(shù)據(jù)驅(qū)動型的多層表示學(xué)習(xí)方法,能夠克服“淺層學(xué)習(xí)”的過擬合、局部最優(yōu)解以及需要人工提取特征等問題[14],近年來在交通大數(shù)據(jù)的挖掘和處理方面取得了較大的進(jìn)展,提高了預(yù)測精度和效率。
在短時交通流預(yù)測方面,Y Lyu等[15]應(yīng)用自動編碼器的深層模型和交通大數(shù)據(jù)預(yù)測交通流參數(shù);羅向龍等[16]利用差分去除交通流量數(shù)據(jù)的趨勢向,并結(jié)合深度置信網(wǎng)絡(luò)和支持向量回歸模型對交通流量進(jìn)行預(yù)測;羅文慧等[17]在深度學(xué)習(xí)模型底層運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)提取交通流特征,并將提取結(jié)果輸入到支持向量機(jī)中進(jìn)行流量預(yù)測;王祥雪等[18]利用深度學(xué)習(xí)工具TensorFlow的Keras,構(gòu)建了基于長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(long short-term memory recurrent neural network, LSTM-RNN)的深度學(xué)習(xí)模型,并預(yù)測交通流中的速度參數(shù)。
目前國內(nèi)外學(xué)者利用深度學(xué)習(xí)對短時交通流的應(yīng)用主要集中在流量和速度預(yù)測方面,對占有率預(yù)測的研究較少。在對流量和速度進(jìn)行預(yù)測時,往往直接將數(shù)據(jù)輸入到深度學(xué)習(xí)網(wǎng)絡(luò)的底層結(jié)構(gòu)中,對網(wǎng)絡(luò)在二值和連續(xù)實值輸入量適用性方面的考慮較少,大部分預(yù)測結(jié)果也多為單個道路橫斷面上多個時刻的預(yù)測值。地點車速分布具有空間和時間上的共同特征,除了需要在多個時刻上進(jìn)行分析之外,也側(cè)重于空間中多條路段上的橫向?qū)Ρ?,因此地點車速預(yù)測往往要求一次輸出結(jié)果中包含多條路段的預(yù)測值。本文選取高斯-伯努利受限波爾茲曼機(jī)(Gauss-Bernoulli restricted Boltznann machine, GBRBM)輸入連續(xù)實值,并利用Softmax回歸模型來準(zhǔn)確預(yù)測多輸出值,對深度置信網(wǎng)絡(luò)進(jìn)行堆疊和改進(jìn);提出一種基于GBRBM-DBN網(wǎng)絡(luò)結(jié)構(gòu)的多路段多時刻地點車速預(yù)測方法,對地點車速的時空特征進(jìn)行提取和分析;利用大規(guī)模路網(wǎng)實測數(shù)據(jù)對所提網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,以期達(dá)到良好的預(yù)測性能和準(zhǔn)確的預(yù)測結(jié)果。
受限波爾茲曼機(jī)(restricted Boltznann machine, RBM)是一種典型的二層神經(jīng)網(wǎng)絡(luò),包含一個可視層和一個隱含層[19],見圖1,在RBM網(wǎng)絡(luò)結(jié)構(gòu)中,可視層v與隱含層h之間的神經(jīng)元相互連接,連接權(quán)重為w,而層內(nèi)的神經(jīng)元之間相互獨立。
圖1 受限波爾茲曼機(jī)示意圖Fig.1 RBM schematic diagram
一般采用吉布斯采樣法對RBM網(wǎng)絡(luò)進(jìn)行訓(xùn)練。根據(jù)Hinton等提出的對比離差算法,只需迭代k次吉布斯采樣步驟即可得到對模型的估計,通常k=1[20-21]。
圖2 DBN網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 DBN network structure
2.1.1 輸入層結(jié)構(gòu)設(shè)計
傳統(tǒng)RBM中采用伯努利-伯努利波爾茲曼機(jī)(Bernoulli-Bernoulli restricted Boltznann machine, BBRBM)結(jié)構(gòu),可視層和隱含層神經(jīng)元均為二值分布,即0或1。但是道路交通流參數(shù)的觀測值為連續(xù)的實數(shù),若將其直接轉(zhuǎn)換成二進(jìn)制數(shù)據(jù),則會損失大量的速度特征。因此,應(yīng)用DBN結(jié)構(gòu)對道路交通中的地點車速進(jìn)行預(yù)測時,需先對傳統(tǒng)RBM結(jié)構(gòu)進(jìn)行改進(jìn),使其輸入層適用于地點車速數(shù)據(jù)的連續(xù)實值這一特征。
本文中選擇將高斯(可視層)-伯努利(隱含層)波爾茲曼機(jī)加入到傳統(tǒng)BBRBM結(jié)構(gòu)中,這是因為GBRBM結(jié)構(gòu)中加入了高斯噪音的連續(xù)值,其可視層能夠輸入實值隨機(jī)變量。
2.1.2 輸出層回歸模型設(shè)計
DBN網(wǎng)絡(luò)結(jié)構(gòu)對輸入層中的地點車速數(shù)據(jù)進(jìn)行充分學(xué)習(xí)后,能夠輸出數(shù)據(jù)特征。要對多個路段在未來多個時刻的地點車速進(jìn)行預(yù)測,還需在DBN結(jié)構(gòu)的頂層加入回歸模型。Softmax回歸模型可以將輸入的向量映射為多個路段上地點車速預(yù)測值的得分,再將得分映射到概率域。通過使用交叉熵?fù)p失,將誤差的負(fù)對數(shù)似然概率最小化,得到誤差最小時該預(yù)測值的概率。相比支持向量回歸,更加適合本文中的多路段多時刻地點車速預(yù)測問題,因此,在本文預(yù)測模型框架設(shè)計過程中,選擇Softmax回歸模型對地點車速進(jìn)行預(yù)測。
2.1.3 GBRBM-DBN結(jié)構(gòu)的框架構(gòu)成
基于以上分析,通過對BBRBM改進(jìn)、堆疊以及在DBN頂層加入Softmax回歸模型,得到本文中基于GBRBM-DBN的多路段多時刻地點車速預(yù)測模型框架。預(yù)測模型底層為GBRBM結(jié)構(gòu),用于輸入地點車速連續(xù)值數(shù)據(jù);其他層均采用BBRBM,共同自下而上堆疊構(gòu)成改進(jìn)的DBN架構(gòu),用于地點車速的無監(jiān)督逐層訓(xùn)練;經(jīng)過有監(jiān)督的參數(shù)優(yōu)化微調(diào)后,得到GBRBM-DBN網(wǎng)絡(luò)自動學(xué)習(xí)到的地點車速數(shù)據(jù)的高層抽象特征;進(jìn)一步在頂層加入Softmax回歸模型,將GBRBM-DBN模型學(xué)習(xí)到的數(shù)據(jù)特征作為新的輸入,用于預(yù)測多個路段在未來多個時刻的地點車速。預(yù)測模型結(jié)構(gòu)見圖3,圖中:Y為Softmax回歸模型的輸出矩陣;n為隱含層層數(shù)。
圖3 GBRBM-DBN網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 GBRBM-DBN network structure
對城市道路上的地點車速進(jìn)行觀測與統(tǒng)計,能夠發(fā)現(xiàn)其具有空間和時間兩方面的特征。空間上,從整個城市路網(wǎng)的角度來看,不同觀測點的地點車速存在快慢不同的現(xiàn)象,特別是城市快速路和主干路,由于其斷面所處地理位置周邊的土地利用性質(zhì)、車道數(shù)、縱斷面線型等條件的差異,導(dǎo)致不同的車速在空間上呈現(xiàn)出一定的規(guī)律性;時間上,同一觀測點的地點車速在一天中的變化受到交通流量、交通組成及管理方式等的影響,同樣呈現(xiàn)出一定波動性,在較短時間統(tǒng)計粒度下,下一時段的地點車速與上一時段地點車速存在一定傳遞性,可以對上一時段速度進(jìn)行學(xué)習(xí),進(jìn)而推斷出下一時段地點車速。
根據(jù)2.2節(jié)中對地點車速數(shù)據(jù)的時空特征分析,要同時對未來多個路段上多個時刻的地點車速進(jìn)行預(yù)測,需要在定義預(yù)測模型的輸入及輸出矩陣時,考慮空間和時間特征的表達(dá)。
2.3.1 輸入矩陣
空間上,用sp,t表示城市路網(wǎng)中第p個觀測點在t時刻采集到的地點車速(單位:km/h),則m個觀測點在t時刻的速度輸入矩陣可表示為
St=(s1,t,s2,t,…,sp,t,…,sm,t)T,
p=1,2,…,m
(1)
時間上,為了探索地點車速在連續(xù)多天內(nèi)的特征,采用以1 d為基本單位的預(yù)測模型,時間粒度為10 min,因此輸入矩陣S可以表示為
S=(S1,S2,…,Sq,…,Sl),q=1,2,…,l
(2)
其中,l可以根據(jù)具體天數(shù)的計算結(jié)果而靈活改變。
2.3.2 輸出矩陣
設(shè)輸入矩陣經(jīng)過GBRBM-DBN模型學(xué)習(xí)后的輸出矩陣為O,則有
O=u(S)
(3)
式中:u(S)為深度學(xué)習(xí)函數(shù),本文中為GBRBM-DBN模型。
地點車速預(yù)測模型的輸出矩陣中同樣需要表征不同路段和不同時刻的地點車速預(yù)測值,設(shè)Softmax回歸模型的輸出矩陣為Y=(y1,y2,…,yp,…,ym),則有
yp(t+Δt)=f(O)
(4)
式中:yp為觀測點p在t+Δt時刻的地點車速(單位:km/h),p=1,2,…,m;f(O)為預(yù)測模型,本文中為Softmax回歸模型。
本文中GBRBM-DBN預(yù)測模型的訓(xùn)練過程包括向前傳播和向后傳播兩個過程,各自訓(xùn)練方法如下。
2.4.1 向前傳播中的吉布斯采樣法
設(shè)RBM中的可視層神經(jīng)元為v,隱含層神經(jīng)元為h,數(shù)目分別為I、J,即?i,j,都有vi∈{0,1},hj∈{0,1}。對于給定的一組(v,h)狀態(tài),得到RBM的能量函數(shù)E為
(5)
式中:θ為RBM的參數(shù),θ=(ωij,ai,bj);ωij為可視層神經(jīng)元i與隱含層神經(jīng)元j之間的連接權(quán)重;ai、bj分別為可視層、隱含層神經(jīng)元的偏置。
基于上式,得到RBM在(v,h)狀態(tài)下的聯(lián)合概率分布P(v,h|θ)和可視層神經(jīng)元v的分布P(v|θ)分別為
(6)
(7)
(8)
式中:Z(θ)為歸一化因子。
由于RBM結(jié)構(gòu)中可視層、隱含層內(nèi)部無連接,即各可視層神經(jīng)元、各隱含層神經(jīng)元之間的激活狀態(tài)是相互獨立的,則可得到第i個可視層神經(jīng)元、第j個隱含層神經(jīng)元的條件概率分布分別為
(9)
(10)
式中:σ(·)為sigmoid函數(shù)。
2.4.2 向后傳播中的梯度下降法
本文預(yù)測模型中反向傳播采用隨機(jī)梯度下降(stochastic gradient descent, SGD)+動量算法。SGD算法表達(dá)式為
xt+1=xt-ηtgt
(11)
式中:xt為計算梯度時第t步的位置;ηt為步長;gt為隨機(jī)梯度。
本文中基于GBRBM-DBN的地點車速預(yù)測模型的訓(xùn)練過程如下,其技術(shù)流程見圖4。
1)根據(jù)地點車速數(shù)據(jù)特征,構(gòu)造輸入矩陣S。
2)將S輸入底層的GBRBM可視層,根據(jù)第i個可視層神經(jīng)元的條件概率分布將GBRBM可視層中生成的輸出作為下一個RBM隱含層的輸入,并通過無監(jiān)督貪心算法獲取認(rèn)知權(quán)重。
3)重復(fù)步驟(2),對大量無標(biāo)簽數(shù)據(jù)逐層進(jìn)行吉布斯采樣,向上直到生成模型所需的隱含層數(shù)量為止(頂部兩層除外),對RBM進(jìn)行預(yù)訓(xùn)練求出每一層的認(rèn)知權(quán)重。
4)頂部兩層RBM向下進(jìn)行有監(jiān)督的BP算法微調(diào),根據(jù)下式中權(quán)值更新準(zhǔn)則獲得生成權(quán)重,即對網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化
Δωij=Edata(vihj)-Emodel(vihj)
(12)
式中:Edata(vihj)、Emodel(vihj)分別為觀測數(shù)據(jù)訓(xùn)練集、模型定義的期望。
網(wǎng)絡(luò)偏置ai、bj的更新規(guī)則與ωij類似。
5)將GBRBM-DBN學(xué)習(xí)到的地點車速特征輸入Softmax回歸模型進(jìn)行多個路段在未來多個時刻的地點車速預(yù)測。
圖4 預(yù)測模型訓(xùn)練流程Fig.4 Training process of prediction model
本文試驗中使用的交通流數(shù)據(jù)集來源于OpenITS聯(lián)盟的OpenData模塊,由中山大學(xué)提供(數(shù)據(jù)來源網(wǎng)址:http://www.openits.cn/openData2/792.jhtml)。此數(shù)據(jù)集為大規(guī)模路網(wǎng)中的實測車速數(shù)據(jù)集,空間上涵蓋了廣州市214條路段,時間跨度為2個月,時間窗為10 min,1條路段每天產(chǎn)生的數(shù)據(jù)量為144條,數(shù)據(jù)集說明見表1。
試驗中選取60條路段、60 d的數(shù)據(jù),共計518 400條實測地點車速。前50 d所有路段的數(shù)據(jù)用于訓(xùn)練,后10 d所有路段的數(shù)據(jù)用于測試。將60條路段1 d中的所有地點車速作為1組數(shù)據(jù)(數(shù)據(jù)量為8 640條),得到訓(xùn)練集數(shù)據(jù)量和測試集數(shù)據(jù)量分別為50組(432 000條)、10組(86 400條)。
鑒于Matlab軟件強(qiáng)大的矩陣處理能力,本次試驗在Matlab R2014a平臺中通過編程完成。
表1 數(shù)據(jù)集說明Tab.1 Data set discription
經(jīng)核查和計算,試驗數(shù)據(jù)集中的實測地點車速最大為93.83 km/h,最小為1.05 km/h,均值為39.09 km/h,標(biāo)準(zhǔn)差為10.74 km/h,可以看出:原始數(shù)據(jù)之間的差異過大,這樣容易導(dǎo)致網(wǎng)絡(luò)迭代收斂的速度變慢。在深度置信網(wǎng)絡(luò)中,數(shù)據(jù)間差異越小,越能更好地適應(yīng)網(wǎng)絡(luò)中激活函數(shù)的要求,提高網(wǎng)絡(luò)迭代收斂速度。因此在訓(xùn)練網(wǎng)絡(luò)之前,需要對所有數(shù)據(jù)進(jìn)行歸一化處理。
訓(xùn)練集中數(shù)據(jù)量較大,以路段1在2016年8月3日(周三)、8月6日(周六)的全天地點車速為例,歸一化前的數(shù)據(jù)樣本分布分別見圖5(a)、6(a),可以看出:地點車速在8:00~11:00,18:00~20:00時段內(nèi)有明顯的下降,且8月3日工作日的地點車速分布比8月6日周末的波動性更加顯著。采用Matlab中premnmx語句進(jìn)行歸一化后的結(jié)果見圖5(b)、6(b),數(shù)據(jù)分布在[-1,1]。
圖5 8月3日路段1地點車速分布Fig.5 Spot speed distribution in road-1 on August 3rd
圖6 8月6日路段1地點車速分布Fig.6 Spot speed distribution in road-1 on August 6th
本文選取2個最常見的性能指標(biāo)參數(shù)用于衡量網(wǎng)絡(luò)的優(yōu)劣,分別為平均絕對誤差(MAE)和平均相對誤差(MRE),計算方法為
(13)
(14)
式中:sreal,i為實際地點車速,km/h;spre,i為預(yù)測地點車速,km/h。
深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練過程中,需要對網(wǎng)絡(luò)參數(shù)進(jìn)行反復(fù)調(diào)試。設(shè)計本次試驗中GBRBM-DBN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)調(diào)節(jié)的邏輯框架見圖7。
圖7 GBRBM-DBN網(wǎng)絡(luò)參數(shù)調(diào)節(jié)過程Fig.7 Parameters adjustment process in GBRBM-DBN network
3.4.1 網(wǎng)絡(luò)輸入、輸出神經(jīng)元數(shù)量的確定
由于本文試驗中分別選取了50天、10天內(nèi)各個路段的實測地點車速作為訓(xùn)練集和測試集,因此確定網(wǎng)絡(luò)中的輸入和輸出神經(jīng)元數(shù)量分別為50和10。
3.4.2 網(wǎng)絡(luò)結(jié)構(gòu)的確定
網(wǎng)絡(luò)結(jié)構(gòu)包括網(wǎng)絡(luò)深度、每一個隱含層中神經(jīng)元的數(shù)量及其內(nèi)部的參數(shù)。設(shè)計4種不同的網(wǎng)絡(luò)結(jié)構(gòu),見表2。各層神經(jīng)元數(shù)量經(jīng)反復(fù)測試后可知少于200時網(wǎng)絡(luò)性能良好;同時為了防止過擬合現(xiàn)象,添加dropout層,并將隨機(jī)斷開的比例設(shè)定為20%。激活函數(shù)選擇tanh函數(shù),即雙曲正切函數(shù),用于將數(shù)據(jù)變換到[-1,1]區(qū)間,可以與輸入矩陣中的歸一化數(shù)據(jù)范圍保持一致。經(jīng)測試發(fā)現(xiàn),每一層的迭代次數(shù)增大到120次之后,網(wǎng)絡(luò)運(yùn)行速度明顯變慢,故設(shè)定迭代次數(shù)為100次。Batchsize設(shè)定為100,即每用100個樣本就調(diào)整一次權(quán)重。
根據(jù)圖8中4種網(wǎng)絡(luò)結(jié)構(gòu)的性能指標(biāo)結(jié)果對比,選擇方案3,即7層深度的網(wǎng)絡(luò)結(jié)構(gòu),此時MAE和MRE值最低,說明網(wǎng)絡(luò)預(yù)測性能最佳,同時確定各隱含層的神經(jīng)元數(shù)量為{50,100,200,50,100,50,10}。
表2 不同結(jié)構(gòu)的GBRBM-DBN網(wǎng)絡(luò)模型Tab.2 Different structures for GBRBM-DBN network structure
圖8 不同結(jié)構(gòu)網(wǎng)絡(luò)模型的性能指標(biāo)對比Fig.8 Performance indicators comparison of network models with different structures
3.4.3 神經(jīng)網(wǎng)絡(luò)函數(shù)中的參數(shù)調(diào)試
除了初始化DBN網(wǎng)絡(luò)中的權(quán)值和偏置用于執(zhí)行無監(jiān)督學(xué)習(xí)過程,還需要對網(wǎng)絡(luò)頂層中的有標(biāo)簽數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí),此時需調(diào)用神經(jīng)網(wǎng)絡(luò)函數(shù)。在神經(jīng)網(wǎng)絡(luò)參數(shù)調(diào)節(jié)過程中,確定節(jié)點數(shù)為10,選擇tanh函數(shù)作為激活函數(shù)。對迭代次數(shù)進(jìn)行調(diào)試,結(jié)果顯示當(dāng)?shù)螖?shù)大于某一個數(shù)量時,DBN測試結(jié)果沒有太大變化。證明在GBRBM-DBN網(wǎng)絡(luò)的預(yù)訓(xùn)練過程中,相關(guān)參數(shù)的調(diào)整已經(jīng)近乎較優(yōu)的判斷。經(jīng)反復(fù)調(diào)試后確定其他參數(shù)值,即學(xué)習(xí)率為0.08,迭代次數(shù)為20,batchsize為100。
GBRBM-DBN網(wǎng)絡(luò)訓(xùn)練好后,對第51~60 d(共計1 440個時間窗)60條路段的地點車速進(jìn)行預(yù)測,預(yù)測結(jié)果見圖9,運(yùn)算時間在30 s以內(nèi),能夠達(dá)到時效要求。圖中橫坐標(biāo)為預(yù)測的時間樣本點,縱坐標(biāo)表示樣本點對應(yīng)的地點車速,灰色圓圈為實際地點車速,黑色星號為預(yù)測地點車速,可以看出:黑色星號表示的預(yù)測數(shù)據(jù)大部分都落在了灰色圓圈所表示的實際數(shù)據(jù)所組成的區(qū)域內(nèi),說明本文中建立的GBRBM-DBN模型能夠?qū)崿F(xiàn)對多個路段上多個時刻地點車速變化趨勢的預(yù)測,特別是對于速度分布中的高峰值,預(yù)測效果良好。但是當(dāng)車速低于17 km/h時,模型的預(yù)測效果并不十分理想,分析其原因在于訓(xùn)練集中低于17 km/h的車速數(shù)據(jù)量過少,模型沒有充分學(xué)習(xí)到低車速值的特征。
圖9 預(yù)測值與實際值對比Fig.9 Comparison of predicted and actual values
輸出10天預(yù)測結(jié)果誤差得到表3,計算后得到MAE和MRE的平均值分別為4.67 km/h、13.4%。
為了探索本文建立的GBRBM-DBN深層網(wǎng)絡(luò)結(jié)構(gòu)性能,將本文預(yù)測結(jié)果與其他試驗方案預(yù)測結(jié)果進(jìn)行對比。
1)與BP神經(jīng)網(wǎng)絡(luò)的對比。運(yùn)用“淺層學(xué)習(xí)”中經(jīng)典的BP神經(jīng)網(wǎng)絡(luò)對地點車速進(jìn)行預(yù)測。設(shè)置BP神經(jīng)網(wǎng)絡(luò)中輸入、輸出神經(jīng)元個數(shù)分別為50和10,迭代次數(shù)為1 000次,激活函數(shù)為sigmoid函數(shù)。試驗發(fā)現(xiàn),由于訓(xùn)練集中的數(shù)據(jù)量過大,導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)無法預(yù)測出結(jié)果,分析原因為“淺層學(xué)習(xí)”網(wǎng)絡(luò)結(jié)構(gòu)簡單、神經(jīng)元個數(shù)少,無法完成大規(guī)模數(shù)據(jù)之間非線性關(guān)系的學(xué)習(xí)。說明當(dāng)需要對大規(guī)模數(shù)據(jù)的特征進(jìn)行提取時,應(yīng)選擇深層網(wǎng)絡(luò)模型。
表3 10天預(yù)測結(jié)果的MAE和MRETab.3 MAE and MRE values for prediction results in 10 days
2)與長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)的對比。長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)也是一種應(yīng)用廣泛的深度學(xué)習(xí)模型,能夠?qū)r序數(shù)據(jù)中的特征進(jìn)行長時間記憶。應(yīng)用LSTM-RNN模型對試驗中的實測地點車速進(jìn)行預(yù)測,經(jīng)調(diào)試得到網(wǎng)絡(luò)結(jié)構(gòu)為5層,迭代次數(shù)為600次,每次迭代權(quán)重調(diào)整比例為0.01。預(yù)測得到MAE為6.31 km/h,MRE為15.4%。與本文中建立的GBRBM-DNB預(yù)測模型結(jié)果進(jìn)行對比后發(fā)現(xiàn),盡管LSTM-RNN模型所得結(jié)果精度與GBRBM-DBN模型相差不大,但是運(yùn)用MATLAB平臺對這2種深度學(xué)習(xí)模型進(jìn)行預(yù)測時,LSTM-RNN模型所用時間超過20 min,時效性明顯不如本文建立的GBRBM-DBN預(yù)測模型。究其原因為,LSTM-RNN模型中的循環(huán)單元需要對輸入數(shù)據(jù)進(jìn)行循環(huán)重構(gòu),增加了預(yù)測模型的時間復(fù)雜度,因此對大規(guī)模數(shù)據(jù)進(jìn)行預(yù)測時,LSTM-RNN模型并不適合在MATLAB平臺中應(yīng)用。
3)與“深層網(wǎng)絡(luò)+小規(guī)模數(shù)據(jù)”的對比。為探尋數(shù)據(jù)規(guī)模大小對深層網(wǎng)絡(luò)模型預(yù)測結(jié)果的影響,選擇文獻(xiàn)[22]中預(yù)測結(jié)果與本文試驗結(jié)果進(jìn)行對比。文獻(xiàn)[22]中針對5條路段,選取了30天交通流量數(shù)據(jù),時間窗為15 min,輸入數(shù)據(jù)為5條路段上2個時間段的交通流量,共計10個輸入,網(wǎng)絡(luò)結(jié)構(gòu)為{10,12,10,8,6,4},數(shù)據(jù)量共計14 400條,明顯小于本文試驗中518 400條的數(shù)據(jù)規(guī)模。對比結(jié)果見表4,可以看到本文所提模型的預(yù)測誤差更小,MAE減小10.13 km/h,MRE減小14.5%。分析原因為,在“深層網(wǎng)絡(luò)+小規(guī)模數(shù)據(jù)”組合中,由于數(shù)據(jù)規(guī)模小,同時為了防止出現(xiàn)過擬合現(xiàn)象,需要將輸入層和隱含層的神經(jīng)元數(shù)量限定在一定范圍內(nèi),從而導(dǎo)致深層網(wǎng)絡(luò)模型在提高預(yù)測精度方面的優(yōu)勢并沒有充分發(fā)揮出來。
表4 兩種網(wǎng)絡(luò)的性能指標(biāo)對比Tab.4 Comparison of performance indicators of two networks
4)不同訓(xùn)練集和測試集數(shù)據(jù)比例劃分的對比。對GBRBM-DBN深層網(wǎng)絡(luò)模型中訓(xùn)練集和測試集的數(shù)據(jù)量比例重新進(jìn)行劃分,分為“40組訓(xùn)練集+20組測試集”、“30組訓(xùn)練集+30組測試集”兩種情況,用以測試模型在此方面的適應(yīng)性。預(yù)測結(jié)果分別見圖10、11,可以看出:當(dāng)改變訓(xùn)練集和測試集數(shù)據(jù)比例后,GBRBM-DBN模型仍然能夠較為準(zhǔn)確地對多個路段上多個時刻的地點車速變化趨勢做出預(yù)測,并且減少訓(xùn)練集數(shù)據(jù)后,模型對低車速值的預(yù)測能力得以提升。分析原因在于:訓(xùn)練集數(shù)據(jù)減少的過程中相當(dāng)于提高了低車速占訓(xùn)練集數(shù)據(jù)量的比例,促進(jìn)模型加強(qiáng)了對低車速數(shù)據(jù)的學(xué)習(xí),進(jìn)而提取到了低車速的特征,并通過Softmax回歸模型進(jìn)行了準(zhǔn)確預(yù)測。
圖10 “40組訓(xùn)練集+20組測試集”預(yù)測結(jié)果Fig.10 Prediction results of “40 groups train data and 20 groups test data”
圖11 “30組訓(xùn)練集+30組測試集”預(yù)測結(jié)果Fig.11 Prediction results of “30 groups train data and 30 groups test data”
將3種訓(xùn)練集、測試集劃分方式的預(yù)測結(jié)果性能指標(biāo)進(jìn)行對比,見表5,可以發(fā)現(xiàn):隨著訓(xùn)練集數(shù)據(jù)量比例的下降,MAE的變化較小,浮動在1.64 km/h以內(nèi),MRE僅增大了7.3%,說明誤差分布較為穩(wěn)定。試驗證明GBRBM-DBN模型在選擇訓(xùn)練集和測試集的數(shù)據(jù)量比例時,具有一定的靈活性,能夠適應(yīng)訓(xùn)練集和測試集中數(shù)據(jù)量的變化。同時在訓(xùn)練集較少(占總體數(shù)據(jù)50%)時,GBRBM-DBN模型仍然能夠挖掘大規(guī)模地點車速數(shù)據(jù)的本質(zhì)特征,取得較高的預(yù)測精度。分析其原因在于:模型中高斯-伯努利層保留了原始數(shù)據(jù)中連續(xù)實值的輸入,為預(yù)測模型提供了大量有效的數(shù)據(jù)特征,提高了深層網(wǎng)絡(luò)模型的學(xué)習(xí)程度。
表5 3種訓(xùn)練集和測試集數(shù)據(jù)比例劃分的性能指標(biāo)對比Tab.5 Comparison of performance indicators in three dataproportions between training data and test data
綜合以上分析得出,深層網(wǎng)絡(luò)模型中的網(wǎng)絡(luò)結(jié)構(gòu)會對預(yù)測結(jié)果產(chǎn)生明顯的影響;深層網(wǎng)絡(luò)模型適用于大規(guī)模數(shù)據(jù)預(yù)測。當(dāng)選取合適的網(wǎng)絡(luò)深度、神經(jīng)元節(jié)點及網(wǎng)絡(luò)其他參數(shù),運(yùn)用大規(guī)模數(shù)據(jù)對多路段多時刻的地點車速預(yù)測過程中,對訓(xùn)練集、測試集數(shù)據(jù)量比例進(jìn)行適度調(diào)整時,本文建立的GBRBM-DBN預(yù)測模型仍然具有較強(qiáng)的特征學(xué)習(xí)能力和較高的預(yù)測精度。
1) 運(yùn)用大規(guī)模實測數(shù)據(jù)訓(xùn)練模型以探尋最優(yōu)的深層網(wǎng)絡(luò)結(jié)構(gòu),當(dāng)網(wǎng)絡(luò)輸入、輸出神經(jīng)元數(shù)量分別為50和10,網(wǎng)絡(luò)深度為7層,迭代次數(shù)為100次時,平均絕對誤差為4.67 km/h,平均相對誤差為13.4%,網(wǎng)絡(luò)預(yù)測性能最佳。
2) 通過與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)、長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)、“深度結(jié)構(gòu)+小規(guī)模數(shù)據(jù)”以及不同訓(xùn)練集、測試集數(shù)據(jù)量比例的預(yù)測結(jié)果進(jìn)行對比,驗證了本文模型在多路段多時刻的地點車速預(yù)測方面具有更好的準(zhǔn)確性、時效性和泛化性,對地點車速高峰、低谷值的預(yù)測結(jié)果也更優(yōu)。
3)本文所提模型未考慮對地點車速產(chǎn)生影響的因素,如天氣狀況、車型分布等,下一步將結(jié)合多源數(shù)據(jù)融合進(jìn)行研究。