熊文真,沈雪梅,李紅娟
(1.信陽職業(yè)技術(shù)學(xué)院,河南 信陽 464000;2.昆明理工大學(xué),云南 昆明 650000)
?
基于相關(guān)向量機的交通流量預(yù)測
熊文真1,沈雪梅1,李紅娟2
(1.信陽職業(yè)技術(shù)學(xué)院,河南 信陽 464000;2.昆明理工大學(xué),云南 昆明 650000)
目的在短時間內(nèi)實時性預(yù)測交通流量值是構(gòu)建交通管理系統(tǒng)的重要內(nèi)容。交通流量數(shù)據(jù)存在著不確定性、復(fù)雜性和非線性等顯著特點,使流量值的實時預(yù)測難度增大,交通流量的精準預(yù)測一直是行業(yè)內(nèi)亟待解決的問題?;谝延袑W(xué)者研究基礎(chǔ)之上,構(gòu)建基于相關(guān)向量機方法的交通流量預(yù)測模型。方法相關(guān)向量機的預(yù)測精度優(yōu)于邏輯回歸和支持向量機方法,且相關(guān)向量機方法具有產(chǎn)生預(yù)測誤差范圍的功能,對于實際交通流量序列數(shù)據(jù),采用基于相關(guān)RVM的交通流量預(yù)測模型。結(jié)果預(yù)測結(jié)果十分理想,預(yù)測速度比其他2種模型明顯加快,達到了交通流量預(yù)測的實時性要求,適合于實時在線預(yù)測,且所用方法的預(yù)測精度相對較高。三方面的對比分析表明,利用相關(guān)向量機方法對交通流量進行預(yù)測可以較為精確地描述出交通流量變化的非線性特點,模型性能和實時性都較好。結(jié)論實例分析表明,基于相關(guān)向量機的交通流量預(yù)測模型可以提高預(yù)測的速度和精度,非常適用于有實時性要求的交通流量預(yù)測估計,為實時性測量交通流量值提供了一種科學(xué)的方法。
相關(guān)向量機;交通流量;預(yù)測
隨著經(jīng)濟的不斷發(fā)展,城市化進程也隨之加快,造成城市交通流量的持續(xù)增加與堵塞,故可以有效解決交通問題的智能交通系統(tǒng)應(yīng)運而生,并逐漸獲得重視。該系統(tǒng)的核心在于如何精準預(yù)測時刻變化的交通流量值,且預(yù)測結(jié)果的優(yōu)劣將直接影響交通規(guī)劃和控制問題[1]。交通流量預(yù)測最為明顯的特征為其短時性,相比于長期性的預(yù)測,其更易受到隨機性因素的干擾,故具有更為明顯的不確定性,并呈現(xiàn)非規(guī)律性。
針對上述問題,多位學(xué)者開始研究交通流量的預(yù)測問題。目前主要應(yīng)用的方法有:時間序列模型、線性回歸模型、卡爾曼濾波模型、神經(jīng)網(wǎng)絡(luò)模型以及學(xué)習(xí)算法支持向量機模型等[2-4]。時間序列模型主要利用數(shù)據(jù)的線性特征對未來的數(shù)據(jù)進行預(yù)測,核心在于利用線性特征,但難以精確描述出有著非線性特征的交通流量數(shù)據(jù),預(yù)測的準確度有所偏頗;線性回歸模型主要利用多元線性回歸模型對交通流量值進行分析,在數(shù)據(jù)充足情況下,可以對較多的流量數(shù)據(jù)值進行較快的預(yù)測,但也存在一些缺點。例如若某一時刻的數(shù)據(jù)缺失,則預(yù)測精度會迅速降低;卡爾曼濾波模型也屬于線性回歸方法,其基于對多元線性回歸方法的進一步改進,可依據(jù)實際情況選擇預(yù)測因素,預(yù)測精度相比于多元線性回歸也有所提高,但由于該方法的運算過程中存在繁雜的向量與矩陣的運算,導(dǎo)致其計算時間的延長,故對于實時預(yù)測的實現(xiàn)存在一定的難度;神經(jīng)網(wǎng)絡(luò)算法主要基于風(fēng)險的處理,即最小化預(yù)測中的經(jīng)驗風(fēng)險,但并未對期望風(fēng)險做最小化處理,故存在著一定的不足,且該方法需要一些網(wǎng)絡(luò)結(jié)構(gòu)、局部極小值點、過學(xué)習(xí)等的確定,同時神經(jīng)網(wǎng)絡(luò)需要基于大量的訓(xùn)練樣本進行數(shù)據(jù)的預(yù)測[5]。支持向量機屬于機器學(xué)習(xí)方法,并獲得廣泛應(yīng)用,支持向量機解決了神經(jīng)網(wǎng)絡(luò)算法中易出現(xiàn)的過擬合、易陷入局部極值、收斂速度較慢等問題,主要針對性解決一些小樣本、非線性數(shù)據(jù)的處理問題,是交通流量預(yù)測中的新預(yù)測方法[6]。相關(guān)向量機(relevance vector machine,RVM)是基于支持向量機基礎(chǔ)所發(fā)展的新方法,同時具有一些特點,例如與支持向量相比,相關(guān)向量數(shù)目較少,且具有高稀疏性的特點;只利用核參數(shù),樣本的訓(xùn)練時間得以壓縮;同時核函數(shù)非單一,具有多種選擇空間等。因此,為達到提高交通流量預(yù)測方法的準確性和體現(xiàn)實時性的目的,本文提出一種基于相關(guān)向量機方法的交通流量預(yù)測,并利用該方法進行實例分析,驗證該方法的預(yù)測性能。
2.1交通流量的特性分析
交通流量是指在確定的單位時間內(nèi),某一路段所通過的車流量的總和。交通流量的數(shù)據(jù)變化有著不確定性、實時變化性和高度非線性等特點??紤]到上述特點,以及某一路段、某一時段上的交通流量與前幾個時段的交通流量存在著某種關(guān)系,可以利用前幾個時段流量數(shù)據(jù)序列對未來某一個短時間時段的交通流量進行預(yù)測研究[7],即依據(jù)歷史的交通流量數(shù)據(jù)與現(xiàn)有數(shù)據(jù),應(yīng)用一些數(shù)學(xué)與統(tǒng)計知識構(gòu)建預(yù)測模型,對未來某一時段的交通流量進行數(shù)值的預(yù)測。設(shè)前t時間段的流量為:X1,X2,…,Xt,則下一時間單位的交通流量Xt+1可以描述為:Xt+1=f(X1,X2,…,Xt)。
2.2樣本數(shù)據(jù)的預(yù)處理
交通流量值具有較大的差異性,在相關(guān)向量機模型的數(shù)據(jù)訓(xùn)練中,如果訓(xùn)練過程中所用數(shù)據(jù)具有較大的差異性,將導(dǎo)致模型學(xué)習(xí)速度變緩,從而影響數(shù)據(jù)預(yù)測的實時性。為了加快樣本的訓(xùn)練速度和收斂速度,需要對最初采集的交通流量樣本進行進一步的處理,以提高相關(guān)向量機模型的預(yù)測速度與精度。本文利用歸一化方法對交通流量的數(shù)據(jù)做進一步處理:
相關(guān)向量機是以支持向量機為根基進行構(gòu)建的,是基于貝葉斯學(xué)習(xí)理論提出的新的機器學(xué)習(xí)方法[8,9]。將同一時間段內(nèi)同等間隔的交通流量觀測值表示為一個時間序列S,S=[s1,s2,…,si,…,sM],假設(shè)觀測值si與觀測值si-1,si-2,…,si-r(si之前的r個觀測值)之間存在的高度非線性關(guān)系,該關(guān)系可以表示如下:
si=ξ(si-1,si-2,…,si-r),i=r+1,r+2,…,M
其中,K(X,Xi)是核函數(shù)(radial basis function,RBF),Wi是回歸系數(shù)。其中,核函數(shù)的構(gòu)造主要選擇高斯函數(shù)與二項式函數(shù)進行組合得到的多項式函數(shù)。輸出結(jié)果集相互獨立時,整個樣本集的似然函數(shù)可以表示為:
其中,α=[α0,α1,…αN]T表示為超參數(shù),αi具有對應(yīng)的權(quán)值Wi。在獲得先驗分布和訓(xùn)練樣本的情況下,定義先驗概率分布及似然分布之后,由貝葉斯原理,權(quán)值向量Wi后驗分布的數(shù)學(xué)表達式表示如下:
m=σ-2∑ΦTt∑=(σ-2ΦTΦ+A)-1
其中,A=diag(α1,α2,…,αN)。利用集成權(quán)重的方式獲得最大似然函數(shù)如下:
其中協(xié)方差可表示C=σ2I+ΦA(chǔ)-1ΦT。分別對α和σ2求偏導(dǎo),并且令偏導(dǎo)等于0,可以得到:
其中mi是第i個元素,同時γi=1-αi∑ii,∑ii是矩陣∑的第i個對角元。
相關(guān)向量機在循環(huán)計算過程中不斷改變m和∑的值,直至達到收斂要求或最大迭代次數(shù)。即在模型內(nèi)部的循環(huán)計算中,大部分權(quán)重趨近于0,故很大程度上核函數(shù)矩陣的項不會參與到實際的交通流量預(yù)測計算中。
為了驗證RVM模型的實時性與預(yù)測精度,本文采用某市某路段一檢測器的交通流量數(shù)據(jù)來進行對比驗證。流量數(shù)據(jù)的檢測周期是5 min。采用5個不同時間段的數(shù)據(jù)樣本,共360個檢測數(shù)據(jù)。對交通流量數(shù)據(jù)進行提前1個間隔點(5 min)的預(yù)測。建立模型前對數(shù)據(jù)進行預(yù)處理,用MATLAB軟件編制仿真實驗程序,選取合理的參數(shù)。圖1為對交通流量的采集數(shù)據(jù)歸一化處理之后的結(jié)果;圖2主要將基于相關(guān)向量機的交通流量預(yù)測模型的實際交通流量值與預(yù)測流量的結(jié)果進行比較分析。表1為與其它方法相比的評價結(jié)果。
圖1 交通流量原始數(shù)據(jù)的歸一化結(jié)果 圖2 支持向量機的預(yù)測結(jié)果
因為相關(guān)向量機為非線性預(yù)測能力模型,可以基本刻畫交通流量的變化規(guī)律,由圖2可知,RVM預(yù)測結(jié)果可以較好地描述交通流量的非線性變化規(guī)律,預(yù)測誤差得以降低,預(yù)測實時性提高,精度得以提高。為驗證應(yīng)用RVM方法預(yù)測交通流量的精度與可靠性,將邏輯回歸、支持向量機與相關(guān)向量機3種方法的預(yù)測結(jié)果進行對比分析,如表1所示。
表1 不同模型計算量的對比
從表1中3類方法的比較參數(shù)可知,邏輯回歸和支持向量機的交通流量預(yù)測實時性明顯高于相關(guān)向量機所用的預(yù)測時間,相關(guān)向量機的預(yù)測精度優(yōu)于其它2種方法,且相關(guān)向量機方法具有產(chǎn)生預(yù)測誤差范圍的功能。對于該組實際的交通流量序列,本文提出的基于RVM的交通流量預(yù)測模型的綜合預(yù)測性能優(yōu)于邏輯回歸模型和支持向量機模型。預(yù)測結(jié)果十分理想,預(yù)測速度相比其他兩種模型明顯加快,達到了交通流量預(yù)測的實時性要求,適合實時在線預(yù)測。同時從表1的預(yù)測精度結(jié)果可以得出,本文所用方法的預(yù)測精度相對較高。3種方法的對比分析表明,利用相關(guān)向量機方法對交通流量進行預(yù)測可以較為精確地描述出交通流量變化的非線性特點,模型性能和實時性都較好,是一種較為可靠的交通流量預(yù)測方法。綜上可知,相關(guān)向量機提供了一種精度高、實時性較好的交通流量預(yù)測工具。
文中基于交通流量數(shù)據(jù)的特殊性,提出了基于RVM的交通流量預(yù)測模型。RVM方法解決了神經(jīng)網(wǎng)絡(luò)預(yù)測時間較長、泛化能力較差等問題,體現(xiàn)了其強大的小樣本處理能力。實際數(shù)據(jù)驗證結(jié)果表明,通過運用相關(guān)向量機方法預(yù)測交通流量,提高了預(yù)測效率、準確性和實時性。與其它模型進行對比分析表明,基于RVM的交通流量預(yù)測模型在預(yù)測精度和時間方面都具有一定的優(yōu)勢,是一種有效的交通流量預(yù)測方法。RVM可以同時輸出預(yù)測值和預(yù)測值方差,非常適用于有實時性要求的交通流量預(yù)測估計,為交通流量預(yù)測這一關(guān)鍵技術(shù)領(lǐng)域的研究開拓了新的研究視角。下一步的工作內(nèi)容,可以考慮將相關(guān)向量機方法與其他方法進一步結(jié)合,即構(gòu)建基于相關(guān)向量機的組合預(yù)測模型,使預(yù)測精度更高、預(yù)測效度更詳細,在不斷的研究對比中擴展交通流量預(yù)測研究領(lǐng)域。
[1]傅貴,韓國強,逯峰,等.基于支持向量機回歸的短時交通流預(yù)測模型[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2013,41(09):71-76.
[2]劉子昱.基于流量的交通信號智能控制算法與仿真[J].計算機仿真,2007,24(12):226-229.
[3]叢新宇,虞慧群,范貴生.基于組合模型的交通流量預(yù)測方法[J].華東理工大學(xué)學(xué)報:自然科學(xué)版,2011,37(03):340-345.
[4]周桐,楊智勇,孫棣華,等.分車型的高速公路短時交通流量預(yù)測方法研究[J].計算機應(yīng)用研究,2015,37(07):1996-1999.
[5]楊顯立,許倫輝,周勇.基于小波神經(jīng)網(wǎng)絡(luò)的道路交通流量實時預(yù)測模型研究[J].公路交通技術(shù),2013,(05):111-114.
[6]鄭勛燁,黃晶晶.基于支持向量回歸機的交通狀態(tài)短時預(yù)測和北京某區(qū)域?qū)嵗治鯷J].數(shù)學(xué)的實踐與認識,2010,40(10):76-85.
[7]Wu C H,Ho J M,Lee D T.Travel-time prediction with support vector regression[J].Intell Transport Syst,IEEE Transact,2004,5(04):276-281.
[8]Tipping M E.Sparse Bayesian learning and the relevance vector machine[J].J Machine Learning Res,2001,1:211-244.
[9]楊國鵬,周欣,余旭初.稀疏貝葉斯模型與相關(guān)向量機學(xué)習(xí)研究[J].計算機科學(xué),2010,37(07):225-228.
[責(zé)任編輯:關(guān)金玉英文編輯:劉彥哲]
Traffic Flow Prediction Based on Relevance Vector Machine
XONG Wen-zhen1,SHEN Xue-mei1,LI Hong-juan2
(1.Xinyang Vocational & Technical College,Xinyang,Henan 464000,China;2.Engineering Research Center of Metallurgical Energy Conservation & Emission Reduction,Ministry of Education,Kunming University of Science and Technology,Kunming,Yunnan 650093,China)
ObjectiveThe traffic flow value prediction in short time is an important part of traffic management system.And the traffic flow data is uncertain,complex and nonlinear,and so on.So the difficulty of the real-time prediction of the flow rate is improved and becomes an urgent problem.The traffic flow forecasting model based on correlation vector machine is built upon the existing research.MethodsThe relevant vector machine prediction accuracy was better than logistic regression and support vector machine method and RVM method had the function of prediction error range.For the actual traffic flow data,relevance vector machine model model was used in this paper.ResultsThe prediction results were ideal and the prediction speeded significantly faster when compared with the other two models,which met the requirements of real-time traffic flow forecasting.The results were suitable for real-time online prediction,and the prediction accuracy was relatively high.Comparative analysis of three aspects showed that by using relevance vector machine,the prediction could accurately describe the nonlinear characteristics of the traffic flow changes of traffic flow model and real-time performance was good. ConclusionAnalysis of the example shows that the prediction model based on traffic in the relevance vector machine can improve the speed and accuracy of forecast.It is applicable to the requirements of the real-time traffic flow forecasting,and provides a scientific method for real-time measurement of traffic flow data.
relevance vector machine;traffic flow;prediction
10.3969/j.issn.1673-1492.2016.05.006
國家自然科學(xué)基金資助項目(51066002/E060701);云南聯(lián)合基金資助項目(U0937604)
熊文真(1983-),女,河南泌陽人,講師,碩士研究生,主要研究方向:數(shù)學(xué)建摸、數(shù)字圖象處理。
李紅娟(1984-),女,遼寧彰武人,博士研究生,副教授,主要研究方向:能源預(yù)測與調(diào)度。
F 721.7
A
來稿日期:2016-03-03