李秀麗,李星毅
(江蘇大學(xué) 計(jì)算機(jī)科學(xué)與通信工程學(xué)院 ,江蘇 鎮(zhèn)江212000)
多斷面相關(guān)性區(qū)間預(yù)測(cè)法在短期交通流預(yù)測(cè)中的應(yīng)用
李秀麗,李星毅
(江蘇大學(xué) 計(jì)算機(jī)科學(xué)與通信工程學(xué)院 ,江蘇 鎮(zhèn)江212000)
傳統(tǒng)的交通流短期預(yù)測(cè)方法以點(diǎn)預(yù)測(cè)為主,文中提出了基于多斷面相關(guān)性的區(qū)間預(yù)測(cè)方法。多斷面相關(guān)性預(yù)測(cè)是指把兩個(gè)或者兩個(gè)以上相鄰點(diǎn)看作一個(gè)整體考慮,也將考慮被看作一個(gè)整體的相鄰點(diǎn)的斷面交通流的變化規(guī)律和各種影響因素,創(chuàng)建預(yù)測(cè)方法和模型,進(jìn)而預(yù)測(cè)這些相鄰點(diǎn)的交通流在未來(lái)時(shí)間段的整體變化。區(qū)間預(yù)測(cè)的概念由傳統(tǒng)的點(diǎn)變?yōu)橛蓞^(qū)間預(yù)測(cè)的確定值,因此,它可以提供更多的信息,進(jìn)而讓用戶(hù)可以更好地估計(jì)未來(lái)的不確定性,在可能的范圍內(nèi)做出恰當(dāng)?shù)奶幚聿呗?。多斷面的相關(guān)性區(qū)間預(yù)測(cè)法則是綜合使用多個(gè)斷面數(shù)據(jù)進(jìn)行定量分析后,再選取合適的支持向量機(jī)(SVM)回歸模型進(jìn)行定量預(yù)測(cè),以期提高預(yù)測(cè)精度。我們?cè)诠驳?011年8月6日至8日的SBSJ數(shù)據(jù)集上進(jìn)行多組對(duì)比試驗(yàn),均得到了較好的準(zhǔn)確度。
交通流短期預(yù)測(cè);多斷面;相關(guān)性;區(qū)間預(yù)測(cè);支持向量機(jī)
Abstract:The traditional short-term traffic flow prediction methods to predict the main point,this paper presents a prediction method based on multi-sectional correlation interval.Multi-sectional traffic flow forecasting to two or more adjacent dots to be considered as a whole,taking into account these changes of traffic flow cross-section adjacent dots and a variety of factors,the establishment of forecasting methods and models to predict these changes in traffic flow adjacent point in the future the whole period.The idea is to use the interval prediction interval instead of the dot predicted value is determined,it is possible to provide more information, allowing users to better estimate the uncertainty of the future, in the extent possible, selectthe appropriate treatmentstrategy.Correlation Intervalprediction rules is a comprehensive multi-section using a plurality of cross-sectional data, quantitative analysis, and then select the appropriate support vector machine (SVM)regression model for quantitative prediction,in order to improve the prediction accuracy.We performed multiple sets of comparative tests on a common data set SBSJ on August 6 to 8th,2011 have received a good accuracy.
Key words:short-term traffic flow prediction; multi-section; correlation; prediction interval;support vector machines
交通系統(tǒng)為一個(gè)時(shí)變的、非平穩(wěn)的、非線性系統(tǒng),具有不確定性。這種不確定性是由多方面原因造成的,不僅包括天氣等自然原因,許多出乎意料小概率事件也是不可避免的。同時(shí),它還囊括了許多特殊的人為因素,比如司機(jī)在當(dāng)時(shí)的心理狀態(tài)下突發(fā)的交通事故等。由于上述這些不確定性因素是非常難以判斷的,也就導(dǎo)致交通預(yù)測(cè)這一工作的難度大大提升。
最原始的交通預(yù)測(cè)并不是一個(gè)單一的研究方向,僅僅是給交通控制提供一些數(shù)據(jù)參考,為它服務(wù)。最早期的城市交通控制系統(tǒng) (Urban Traffic Control Systems,UTCS)是一種利用綜合考慮交通流的以往信息利用離線預(yù)測(cè)的方法;隨后的城市交通控制系統(tǒng)則使用了實(shí)際測(cè)量得到的交通流數(shù)據(jù)來(lái)校正以往平均數(shù)據(jù)的缺陷,進(jìn)而進(jìn)行交通流量的預(yù)測(cè);而第三代城市交通控制系統(tǒng)雖然利用實(shí)測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),但是時(shí)滯問(wèn)題尚未解決??偟膩?lái)說(shuō),如今比較流行的交通預(yù)測(cè)模型主要有歷史平均模型,卡爾曼濾波模型,神經(jīng)網(wǎng)絡(luò)模型,SVM回歸模型,混沌理論模型,尖點(diǎn)突變模型,小波模型等。
SVM回歸模型預(yù)測(cè)方法在交通流預(yù)測(cè)中應(yīng)用非常廣泛[1-3]。相比神經(jīng)網(wǎng)絡(luò),SVM是以研究小樣本數(shù)據(jù)的內(nèi)在相關(guān)性,以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化可以較好的解決"小樣本”、"維數(shù)災(zāi)難”、"過(guò)擬合”和"局部極小點(diǎn)”等問(wèn)題。丁愛(ài)玲[4]提出了一種基于統(tǒng)計(jì)學(xué)理論的交通流量時(shí)間序列預(yù)測(cè)方法,并通過(guò)實(shí)驗(yàn)證明了其方法的有效性和先進(jìn)性。Lelitha V.,Laurence R.[5]把神經(jīng)網(wǎng)絡(luò)與SVM在交通速度方面預(yù)測(cè)的效果進(jìn)行了對(duì)比。王繼生等[6]研究了在交通流預(yù)測(cè)中SVM的應(yīng)用,并且將SVM與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較,進(jìn)而得出了一個(gè)結(jié)論:SVM在交通流預(yù)測(cè)中的應(yīng)用是有效的。楊兆升[7]通過(guò)實(shí)驗(yàn)得出了一種基于SVM的預(yù)測(cè)模型在精度、收斂時(shí)間及泛化能力等方面優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型,并稱(chēng)為基于SVM的短時(shí)交通流預(yù)測(cè)模型。但是眾多的文獻(xiàn)均是基于SVM的點(diǎn)預(yù)測(cè),鮮有文獻(xiàn)作區(qū)間預(yù)測(cè)。因此本文基于此,提出基于SVM的區(qū)間預(yù)測(cè)方法。
多斷面交通流預(yù)測(cè)是指以道路上的多個(gè)數(shù)據(jù)統(tǒng)計(jì)點(diǎn)的斷面交通流的數(shù)據(jù)作為進(jìn)行研究的對(duì)象,同時(shí)各個(gè)數(shù)據(jù)之間相互影響的預(yù)測(cè)。這些相鄰點(diǎn)中可以進(jìn)行劃分為同一線路的相鄰點(diǎn)和不同線路的相鄰點(diǎn)。近幾年,有關(guān)多斷面交通流預(yù)測(cè)相關(guān)的文獻(xiàn)主要有以下幾個(gè)方面。Joe Whittaker等[8]分析了一個(gè)道路交通網(wǎng)中的多個(gè)不同點(diǎn)間的交通流量和平均速度的相互影響,并建立了多點(diǎn)交通流模型,使用卡爾曼濾波方法來(lái)進(jìn)行求解和預(yù)測(cè)。Anthony Stathopoulos等[9-10]對(duì)不同地點(diǎn)的交通流進(jìn)行了交叉譜分析,結(jié)果表明相互關(guān)系存在于不同地點(diǎn)的斷面交通流。Markos等[11]利用推廣的卡爾曼濾波法結(jié)合宏觀交通流模型對(duì)高速公路進(jìn)行實(shí)時(shí)預(yù)測(cè),并詳細(xì)討論了模型建模和參數(shù)估計(jì)的過(guò)程。諸多文獻(xiàn)在使用多斷面方法分析時(shí),均采用了比較復(fù)雜的模型對(duì)交通流進(jìn)行預(yù)測(cè),隨之帶來(lái)的問(wèn)題則是由于考慮因素比較多且復(fù)雜導(dǎo)致泛化性效果較差。而相對(duì)簡(jiǎn)易的模型則相對(duì)靈活,因此移植多種場(chǎng)景其泛化性會(huì)更好。
為了提高在交通流預(yù)測(cè)模型的準(zhǔn)確率及適應(yīng)能力,本文提出了基于支持向量機(jī)的多斷面的相關(guān)性區(qū)間預(yù)測(cè)模型,并采用SBSJ數(shù)據(jù)集對(duì)模型進(jìn)行實(shí)驗(yàn)和定量分析,以驗(yàn)證模型的可行性與有效性。
SVM的主要思想是在給定的訓(xùn)練樣本中建立一個(gè)超平面作為決策曲面,使得正例和反例之間的間隔最大化[12]。SVM可用于求解非線性回歸問(wèn)題。
在二維空間中,如果樣本數(shù)據(jù)能被一個(gè)線性數(shù)據(jù)完全分開(kāi),則稱(chēng)樣本數(shù)據(jù)是線性可分的,該分類(lèi)線性函數(shù)可表示為:
式中,x為樣本向量,w為樣本向量的法向量,b為偏置值。
圖1 最優(yōu)超平面示意圖
圖1中,設(shè):
H1、H2平行于 H 且可以區(qū)分各類(lèi)樣本。H1、H2的訓(xùn)練樣本點(diǎn)稱(chēng)為支持向量(SV)。最優(yōu)超平面就是使分類(lèi)間隔最大的平面。
第 i(i=1,2,…,N;N 為訓(xùn)練樣本數(shù))個(gè)訓(xùn)練樣本由一個(gè)向量和一個(gè)類(lèi)別組成,可表示為:
式中,xi為輸入向量,yi為類(lèi)別標(biāo)記。對(duì)于二元線性分類(lèi),yi只有1和-1兩個(gè)值。樣本點(diǎn)到某個(gè)超平面的間隔為:
將式(1)中w和b進(jìn)行歸一化處理,可得到點(diǎn)到超平面的歐氏距離:
將所有樣本點(diǎn)中最小的間隔定義為1,此時(shí)相應(yīng)的兩條極端直線的幾何間隔為,如圖1所示。
由于幾何間隔與||w||成反比,最大化分類(lèi)間隔可以通過(guò)最小化||w||獲得,即:
等價(jià)于:
文中規(guī)定樣本點(diǎn)必須在H1或H2的一側(cè)或者在H1、H2上,由于所有樣本點(diǎn)之間的間隔大于1,因此:
交通流量斷面,即單位時(shí)間內(nèi)在某處通過(guò)的客流量?,F(xiàn)實(shí)中交通流量斷面之間的聯(lián)系受到各種因素的影響。從定性分析的角度來(lái)看,當(dāng)兩個(gè)斷面是上下游之間的關(guān)系并且距離比較近時(shí)相關(guān)性會(huì)相對(duì)較強(qiáng);隨著距離的增加或受其他交通流的交匯或道路斷面之間存在交叉口等因素影響時(shí),相關(guān)性會(huì)相對(duì)減弱。當(dāng)針對(duì)交通道路網(wǎng)短時(shí)交通流進(jìn)行預(yù)測(cè)時(shí),特別是針對(duì)較大規(guī)模的道路網(wǎng)時(shí),當(dāng)將道路網(wǎng)中的每一個(gè)斷面交通流數(shù)據(jù)都看成一個(gè)整體來(lái)考慮時(shí),其計(jì)算復(fù)雜性相對(duì)比較高,可能滿(mǎn)足不了短時(shí)交通流預(yù)測(cè)的實(shí)時(shí)性的要求。因此根據(jù)斷面交通流狀態(tài)的相關(guān)性,將一個(gè)較大規(guī)模的道路網(wǎng)切割成多個(gè)規(guī)模較小的子道路網(wǎng),進(jìn)而再進(jìn)行短時(shí)交通流預(yù)測(cè),這樣就可以在保證一定的實(shí)時(shí)性要求的基礎(chǔ)上,提高短時(shí)交通流預(yù)測(cè)的精確性。
因?yàn)榕袆e斷面交通流數(shù)據(jù)在總體水平上的相關(guān)程度比較困難,也就是說(shuō),要區(qū)別哪些斷面之間相關(guān)性比較強(qiáng),哪些斷面的相關(guān)性比較弱的問(wèn)題,是根據(jù)整體上的相關(guān)性將眾多的道路斷面進(jìn)行分組,使一個(gè)較大規(guī)模的道路網(wǎng)分成幾個(gè)較小的子路網(wǎng)。因此引進(jìn)一種自定義度量方法,進(jìn)行多元數(shù)據(jù)的分析。該方法主要是考慮每個(gè)斷面數(shù)據(jù)采集的地理位置的相關(guān)性,主要有以下幾點(diǎn):
1)時(shí)間上,當(dāng)前斷面當(dāng)前時(shí)刻交通流大小受上一時(shí)刻斷面交通流變化的影響。
2)空間上,當(dāng)前斷面的交通流大小受相鄰斷面交通流變化的影響。
3)當(dāng)前斷面的交通流變化同時(shí)在時(shí)間與空間上受相關(guān)斷面的影響。
區(qū)間預(yù)測(cè)是在點(diǎn)預(yù)測(cè)的基礎(chǔ)上預(yù)測(cè)出總體參數(shù)一個(gè)可能的范圍。其理論基礎(chǔ)則是區(qū)間估計(jì)。
設(shè) θ為總體 X 的未知參數(shù),X1,X2,…,Xn為來(lái)自總體的容量為n的簡(jiǎn)單隨機(jī)樣本,對(duì)于預(yù)先給定的一個(gè)充分小的正數(shù)α(0<α<1),構(gòu)造兩個(gè)統(tǒng)計(jì)量:
使得:
由文獻(xiàn)[13-14]可知,在經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則學(xué)習(xí)機(jī)器的實(shí)際風(fēng)險(xiǎn)的組成為經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍,其中置信范圍不但受置信度1-α的影響,還受VC維h和訓(xùn)練樣本數(shù)n的影響,并且隨著它的增加而單調(diào)減少。將其用公式表示如下:
上式中,R為實(shí)際風(fēng)險(xiǎn),Renp為經(jīng)驗(yàn)風(fēng)險(xiǎn),Φ為置信區(qū)間。當(dāng)較大時(shí),置信范圍Φ較小,此時(shí)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的最優(yōu)解就接近實(shí)際的最優(yōu)解。另一方面,若樣本數(shù)n固定,此時(shí)VC維越高,則置信范圍越大,導(dǎo)致實(shí)際風(fēng)險(xiǎn)和經(jīng)驗(yàn)風(fēng)險(xiǎn)之間的可能差就越大。因此我們?cè)谶x擇模型時(shí),不但要使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,還要使VC維盡量小,從而縮小置信范圍,使期望風(fēng)險(xiǎn)最小。
為了使SVM回歸模型有效,必須具備一定的推廣能力。而式(14)中的置信區(qū)間Φ計(jì)算比較困難。但是它為模型參數(shù)的選取提供了思路,即根據(jù)文獻(xiàn)[14]可知,對(duì)于樣本數(shù)目較小的數(shù)據(jù)回歸分析,SVM回歸模型的參數(shù)選取應(yīng)該遵循以下原則:
2)損失函數(shù)的參數(shù)ε要適宜,為了在擬合精度與泛化能力之間平衡,ε取值范圍一般為 (0.000 1~0.01)。
3)為了控制模型復(fù)雜度,懲罰因子C應(yīng)取值偏小,但為了使模型的經(jīng)驗(yàn)誤差不要過(guò)大,C的值又不能過(guò)小,因此確定其范圍為(1~1 000)。
根據(jù)1.2節(jié)中描述的多維標(biāo)度法數(shù)據(jù)預(yù)處理技術(shù),對(duì)事先整理好的交通流數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)按監(jiān)測(cè)點(diǎn)地理位置分為斷面1、斷面2......,其中每個(gè)斷面中的數(shù)據(jù)時(shí)間間隔為10分鐘。利用自定義度量法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。
1)在當(dāng)前斷面的當(dāng)前時(shí)刻數(shù)據(jù)中增加上一時(shí)刻當(dāng)前斷面的數(shù)據(jù)。
2)在當(dāng)前斷面的當(dāng)前時(shí)刻數(shù)據(jù)中增加上下游N個(gè)斷面當(dāng)前時(shí)刻的數(shù)據(jù)。
3)在當(dāng)前斷面的當(dāng)前時(shí)刻數(shù)據(jù)中增加上下游N個(gè)斷面上M個(gè)時(shí)刻的數(shù)據(jù)。
其中,N與M為參數(shù),暫無(wú)理論值,需要通過(guò)試驗(yàn)確定其最佳取值。
建立好SVM模型以后,對(duì)未知點(diǎn)進(jìn)行預(yù)測(cè),可以得到預(yù)測(cè)點(diǎn)的點(diǎn)預(yù)測(cè),再根據(jù)點(diǎn)預(yù)測(cè),基于主元法[15],借助基于正態(tài)分布的區(qū)間估計(jì)法來(lái)計(jì)算預(yù)測(cè)區(qū)間。通過(guò)文獻(xiàn)[15]得知,置信區(qū)間的主元法的主要思想是:
1)尋找一個(gè)樣本函數(shù):
此函數(shù)只含有待估參數(shù)θ,而不含其他參數(shù),并Z且的分布已知且不依賴(lài)參數(shù)θ。
2)對(duì)給定的置信區(qū)間 1-α,定出常數(shù) λ1、λ2,使得:
3)從不等式:
中解得 θ1<θ<θ2, 即為 θ的置信系數(shù)為 1-α 的置信區(qū)間。
我們暫且認(rèn)為待處理數(shù)據(jù)符合正態(tài)分布,因此對(duì)于任意的真實(shí)值y和預(yù)測(cè)值之間存在關(guān)系為y=+ε,其中 ε 為誤差,現(xiàn)假設(shè) ε~N(0,σ2),于是 y0~N(,σ2),則有所以,根據(jù)置信區(qū)間的主元法可以得到:
則可求得置信度為95%,即α=0.5的預(yù)測(cè)區(qū)間為:
本文實(shí)驗(yàn)共基于兩個(gè)數(shù)據(jù)集。
實(shí)驗(yàn)一對(duì)象為46 005條監(jiān)控記錄,記錄時(shí)間為2011年8月8日0點(diǎn)至10點(diǎn),記錄地點(diǎn)為廣東省某地區(qū),監(jiān)控地點(diǎn)為20個(gè),每個(gè)地點(diǎn)監(jiān)控2-4個(gè)不等車(chē)道。將以上數(shù)據(jù)按照時(shí)間間隔5分鐘統(tǒng)計(jì)為車(chē)流量數(shù)據(jù),則每個(gè)監(jiān)控地點(diǎn)包含120個(gè)數(shù)據(jù)。
實(shí)驗(yàn)二對(duì)象為158 088條監(jiān)控記錄,記錄時(shí)間為2011年8月6日0點(diǎn)至10點(diǎn),記錄地點(diǎn)為廣東省某地區(qū),監(jiān)控地點(diǎn)為22個(gè),每個(gè)地點(diǎn)監(jiān)控2-4個(gè)不等車(chē)道。將以上數(shù)據(jù)按照時(shí)間間隔5分鐘統(tǒng)計(jì)為車(chē)流量數(shù)據(jù),則每個(gè)監(jiān)控地點(diǎn)包含120個(gè)數(shù)據(jù)。
本組實(shí)驗(yàn)的主要目的是對(duì)單斷面與多斷面在短期交通流實(shí)時(shí)預(yù)測(cè)準(zhǔn)確度方面進(jìn)行對(duì)比,其中兩組實(shí)驗(yàn)都是基于點(diǎn)預(yù)測(cè),通過(guò)計(jì)算預(yù)測(cè)值與實(shí)際值的方差進(jìn)行比較。方差越小,說(shuō)明預(yù)測(cè)值與實(shí)際值越吻合,即預(yù)測(cè)精度越高。
本實(shí)驗(yàn)中多斷面取值為N=1,M=1(見(jiàn)2.2節(jié)中介紹的N與M),即上游取1個(gè)地點(diǎn),下游取1個(gè)地點(diǎn)的前1個(gè)時(shí)刻和當(dāng)前時(shí)刻的取值。若無(wú)上游或下游,則用自身數(shù)據(jù)填補(bǔ)。
表1 單斷面與多斷面對(duì)比實(shí)驗(yàn)結(jié)果表
從表1和圖2可以看出,基于多斷面相似性預(yù)測(cè)方法要遠(yuǎn)小于基于單斷面預(yù)測(cè)的方差,其中圖2為某個(gè)點(diǎn)在120個(gè)時(shí)刻的走勢(shì)圖。同時(shí)觀察圖1可以看出,基于多斷面相似性的預(yù)測(cè)結(jié)果和預(yù)測(cè)值要更吻合,而且基本趨勢(shì)也更吻合。從現(xiàn)實(shí)角度考慮此問(wèn)題,上游的車(chē)流量肯定會(huì)對(duì)當(dāng)前位置的車(chē)流量有影響,也即當(dāng)前位置的車(chē)流量也會(huì)對(duì)下游車(chē)輛有影響,因此下游車(chē)流量對(duì)于當(dāng)前位置車(chē)流量的預(yù)測(cè)會(huì)有一定的幫助。同理歷史時(shí)刻的車(chē)流量也會(huì)對(duì)當(dāng)前時(shí)刻的車(chē)流量有一定的影響也合情合理。可以從圖3中得出以上假想成立,從圖中可以看出這幾個(gè)斷面的數(shù)據(jù)走勢(shì)基本趨同。
圖2 實(shí)驗(yàn)一20602406號(hào)監(jiān)測(cè)點(diǎn)的實(shí)際值、單斷面與多斷面預(yù)測(cè)值圖
圖3 實(shí)驗(yàn)一20602406號(hào)監(jiān)測(cè)點(diǎn)的單斷面與多斷面預(yù)測(cè)值方差圖
圖4 實(shí)驗(yàn)一20602406號(hào)監(jiān)測(cè)點(diǎn)的多斷面實(shí)際值圖
由于區(qū)間預(yù)測(cè)是基于點(diǎn)預(yù)測(cè)的,因此無(wú)法比較兩者孰優(yōu)孰劣。所以本組實(shí)驗(yàn)的主要目的是對(duì)區(qū)間預(yù)測(cè)在短期交通流實(shí)時(shí)預(yù)測(cè)中能提供更多容錯(cuò)信息進(jìn)行驗(yàn)證,其中兩組實(shí)驗(yàn)都是基于多斷面相似性預(yù)測(cè),通過(guò)計(jì)算實(shí)際值位于預(yù)測(cè)區(qū)間的準(zhǔn)確率進(jìn)行驗(yàn)證。
實(shí)驗(yàn)一中,經(jīng)過(guò)計(jì)算所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差σ=3;實(shí)驗(yàn)二中,經(jīng)過(guò)計(jì)算所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差為σ=7。所以,根據(jù)公式(19)可以計(jì)算出數(shù)據(jù)的預(yù)測(cè)區(qū)間。
表2 區(qū)間預(yù)測(cè)實(shí)驗(yàn)結(jié)果表
圖5 實(shí)驗(yàn)一20602406號(hào)監(jiān)測(cè)點(diǎn)預(yù)測(cè)區(qū)間與實(shí)際值關(guān)系圖
從圖中可以很明顯的看到粗虛線的實(shí)際值大部分處于區(qū)間范圍之內(nèi),說(shuō)明區(qū)間預(yù)測(cè)能提供更多的有用信息。
文中提出了基于多斷面相關(guān)性的交通流預(yù)測(cè)方法。通過(guò)綜合考慮上游車(chē)流量的擴(kuò)散作用、下游車(chē)流量的阻力作用以及歷史時(shí)刻對(duì)當(dāng)前時(shí)刻的車(chē)流量的作用,構(gòu)造多維度訓(xùn)練數(shù)據(jù),使得每一個(gè)訓(xùn)練樣本能盡可能包含多的可變因素,從而提高預(yù)測(cè)準(zhǔn)確度;同時(shí),本文也提出了對(duì)交通流的區(qū)間預(yù)測(cè)方法?;诮y(tǒng)計(jì)學(xué)理論,根據(jù)點(diǎn)預(yù)測(cè)計(jì)算出區(qū)間預(yù)測(cè)結(jié)果,通過(guò)給出預(yù)測(cè)區(qū)間的方式,提供更多信息,讓使用者能夠更好地估計(jì)車(chē)流量的范圍。
文中通過(guò)實(shí)驗(yàn)驗(yàn)證了方法的可行性。但尚有多點(diǎn)可以改進(jìn)的地方。下一步計(jì)劃完善多斷面中N與M的取值方式,因?yàn)楝F(xiàn)在的取值都是經(jīng)驗(yàn)值。另外一個(gè)則是本文默認(rèn)的數(shù)據(jù)分布為正態(tài)分布,因此計(jì)算結(jié)果會(huì)有一定的誤差,所以下一步需要研究的方向則是數(shù)據(jù)的分布問(wèn)題。
[1]Samia Djemai,Belkacem Brahmi,Mohand Ouamer Bibi.A Primal-Dual Method for SVM Training[J].Neurocomputing, 2016,36(1):132-138.
[2]Zhanquan Sun,Geoffrey Fox.Traffic flow forecasting based on combination of multidimensional scaling and SVM [J].International Journal of Intelligent Transportation Systems Research, 2014,12(1):20-25.
[3]ZHANG Ming-heng,ZHEN Yao-bao,HUI Ganglong,etal.Accurate Multisteps Traffic Flow Prediction Based on SVM [J].Mathematical Problems in Engineering,2013(1024-123x):1-8.
[4]崔立成.基于多斷面信息的城市道路網(wǎng)交通流預(yù)測(cè)方法研究[D].大連:大連海事大學(xué),2012.
[5]Chenyun Yu,Ka Chi Lam.Applying multiple kernel learning and support vector machine for solving the multicriteria and nonlinearity problems of traffic flow prediction[J].J.Adv.Transp., 2014,48(3):272-286.
[6]丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報(bào),2011(1):8-10.
[7]周桐,楊智勇,孫棣華.分車(chē)型的高速公路短時(shí)交通流量預(yù)測(cè)方法研究[J].計(jì)算機(jī)應(yīng)用研究,2015(7):13-15.
[8]Javad Abdi,Behzad Moshiri,Baher Abdulhai,et al.Short-term traffic flow forecasting:parametric and nonparametric approaches via emotional temporal difference learning [J].Neural Computing and Applications,2013,23(1):141-159.
[9]Hasan,Md AlMehedi,Nasser,Mohammed,Pal,Biprodip,Ahmad,Shamim,Support Vector Machine and Random Forest Modeling for Intrusion Detection System (IDS)[J].Journal of Intelligent Learning Systems and Applications, 2014,6(1):45-52.
[10]Zhuangquan Sun,Geoffrey Fox.Traffic Flow Forecasting Based on Combination of Multidimen-sional Scaling and SVM [J].International Journal of Intelligent Transportation Systems Research,2014,12(1):20-25.
[11]Wang Y,Papageorgiou M.Real-time freeway traffic state estimation based on extended Kalman filter:a generalapproach [J].Transportation Research Part B Methodological,2005,39(2):141-167.
[12]Haykin Simon.神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)[M].3版.申富饒,徐燁,鄭俊,譯.北京:機(jī)械工業(yè)出版社,201l.
[13]劉齊林,曾玲,曾祥艷.基于支持向量機(jī)的區(qū)間模糊數(shù)時(shí)間序列預(yù)測(cè) [J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2015(11):14-16.
[14]劉巖,張寧,邵星杰.城市軌道交通斷面客流短時(shí)預(yù)測(cè)[J].都市快軌交通, 2015(1):23-25.
[15]袁鍵,范炳全.交通流短時(shí)預(yù)測(cè)研究進(jìn)展[J].城市交通, 2012(6):12-14.
The application of multi-section similarity and interval forecasting in short-term traffic flow forecasting
LI Xiu-li,LI Xing-yi
(School of Computer Science and Telecommunications Engineering, Jiangsu University, Zhenjiang212000,China)
TN914
A
1674-6236(2017)19-0010-06
2016-08-12稿件編號(hào)201608090
李秀麗(1991—),女,山東濰坊人,碩士研究生。研究方向:智能交通。