芮偉 謝泰 沙琨
(海軍軍醫(yī)大學(xué)海軍衛(wèi)生信息中心 上海 200433)
目前,城市交通問題日益突出,積極推動(dòng)智能交通信息系統(tǒng)(ITS)建設(shè)是解決問題的有效途徑之一。而城市道路交通流量的預(yù)測是智能交通系統(tǒng)的重要基礎(chǔ),為個(gè)人出行服務(wù)、各個(gè)區(qū)域之間交通信號的聯(lián)合控制、制定特定的出行計(jì)劃和城市道路建設(shè)規(guī)劃管理分析等各個(gè)場景進(jìn)行數(shù)據(jù)支撐。因此,構(gòu)建科學(xué)的交通流預(yù)測模型,以實(shí)時(shí)和歷史交通流數(shù)據(jù)為基礎(chǔ),對車流量預(yù)測這一關(guān)鍵問題進(jìn)行深入研究分析,可以為緩解和預(yù)防城市交通擁堵提供有效幫助。
交通流理論[1]是多學(xué)科交叉的一門學(xué)科,通過物理學(xué)、統(tǒng)計(jì)學(xué)、力學(xué)、交通工程等多學(xué)科的協(xié)同分析,可以實(shí)現(xiàn)交通流準(zhǔn)確、快速的預(yù)測。為了更好地進(jìn)行交通誘導(dǎo)和交通控制,需要及時(shí)準(zhǔn)確地掌握交通流預(yù)測信息和數(shù)據(jù)。關(guān)于交通流預(yù)測,國內(nèi)外學(xué)者已經(jīng)開展了一系列的相關(guān)研究,其中元胞自動(dòng)機(jī)[2](Cellular Automaton,CA)交通流模型能夠根據(jù)實(shí)際情況靈活設(shè)置車輛運(yùn)行規(guī)則,具有良好的并行性。而灰色GM(1,1)模型可以對不規(guī)則的原始數(shù)據(jù)進(jìn)行生成,得到規(guī)律性強(qiáng)的生成序列,且所需的數(shù)據(jù)量少,精度高。因而兩種模型在交通流研究領(lǐng)域都得到了廣泛應(yīng)用。冉磊、蔡遠(yuǎn)麗[3]在一維交通流元胞自動(dòng)機(jī)Nasch模型的基礎(chǔ)上,提出一種改進(jìn)的一維敏感駕駛元胞自動(dòng)機(jī)交通流模型。錢勇生、曾俊偉[4]等建立了有意外事件影響的車道管制下的高速公路元胞自動(dòng)機(jī)交通流模型,該模型考慮了交通事故和養(yǎng)護(hù)路段等意外事件對高速公路交通流的影響。葛紅霞、戴世強(qiáng)[5]在NaSch模型的基礎(chǔ)上,提出一種應(yīng)用智能交通系統(tǒng)的交通流元胞自動(dòng)機(jī)模型,模型考慮有效間距及剎車燈的作用,并引入可變安全間距的新概念。張敬裔,王曉原[6]將灰色模型與RBF結(jié)合并應(yīng)用于短時(shí)交通流預(yù)測中,取得了較好的預(yù)測效果。游中勝、何麗等[7]對于城市短時(shí)交通流的預(yù)測提出基于改進(jìn)累減還原方法的灰色模型,模擬及預(yù)測性能都取得了一定的提高。
Wolfram參照已有模型,通過大量的試驗(yàn)分析與理論論證提出了184號模型,其實(shí)質(zhì)上屬于一種一維交通流CA模型。該模型中車輛具有多種狀態(tài),即向前進(jìn)行元胞移動(dòng),或者停留在現(xiàn)有元胞,對于自由流和堵塞階段可以進(jìn)行很好地描述,該模型的缺點(diǎn)是對于實(shí)際情況中的駕駛特性沒有加以分析,因此,更多地停留在理論分析階段,對于指導(dǎo)實(shí)際交通沒有太大優(yōu)勢。1992年,德國學(xué)者Nagel和Schreckenberg在184號模型的基礎(chǔ)上構(gòu)建了NaSch模型,該模型與184號模型相比,最大的特點(diǎn)在于將實(shí)際系統(tǒng)中車輛的加速與延遲等加入到模型之中。
NaSch模型作為CA模型的一種,元胞狀態(tài)都是離散的,包括其時(shí)間、空間以及速度等。假設(shè)一段距離為I的道路,將其離散化,分散成一個(gè)一個(gè)的網(wǎng)格,也就是元胞,任何一個(gè)元胞的狀態(tài)只有兩種情況:空、車輛占據(jù)。本文給出具體的演化規(guī)則如下。
上面,xn和vn分別代表第n輛車的位置與速度,dn=xn+1-xn-lve?表示第n輛車與前面車輛的距離,lve?則代表了車輛的長度信息。
在NaSch模型中,其具體的演化規(guī)則是:1)描述的是車輛加速,表示所有的駕駛者都希望在道路中以最大的期望速度進(jìn)行行駛的行為;2)為了避免發(fā)生交通事故,保持與前面車輛的安全距離,需要在某些時(shí)刻降低行駛速度;3)在某些特殊的情況下,基于安全的考慮,以一定概率進(jìn)行減速行駛;4)車輛位置的更新。
鄧聚龍教授通過大量分析論證,提出并創(chuàng)立了灰色系統(tǒng)理論[8]。本文在具體研究分析過程中,選取了GM(1,1)模型,運(yùn)用時(shí)間序列預(yù)測方式,對時(shí)間序列構(gòu)建完善、可行的模型并預(yù)測未來值。
首先,利用合理的方式來檢驗(yàn)交通流時(shí)間序列,使其能夠利用灰色模型來實(shí)現(xiàn)建模,目前,初始序列為已知條件,具體為
計(jì)算該時(shí)間序列的級比為
此時(shí)數(shù)列的級比為
國內(nèi)外眾多學(xué)者與專家為了進(jìn)一步提升灰色模型的預(yù)測精度,將灰色模型建模機(jī)理作為著手點(diǎn),結(jié)合實(shí)際情況,對灰色理論GM(1,1)模型進(jìn)行了優(yōu)化改進(jìn)。劉常麗、屈紹建等[9]專家與學(xué)者主要借助模型背景值進(jìn)行優(yōu)化處理。黃克[10]則以遞推法作為基礎(chǔ),通過大量的分析論證,求出一種簡單、便捷的序列長度計(jì)算方式,從多個(gè)步長存在較大差異的GM(1,1)模型之中確定最佳預(yù)測步長,進(jìn)而提升預(yù)測精度。
經(jīng)過改進(jìn)優(yōu)化的方式絕大多數(shù)是以建模過程中與之相對應(yīng)數(shù)據(jù)序列為重要基礎(chǔ),對于GM(1,1)模型參數(shù)的選取,式(8)中列出數(shù)據(jù)廣義級比間存在的關(guān)聯(lián)未進(jìn)行深入的考慮與分析。因此,本文采用了孫波軍、尹偉石[11]提出的一種灰色模型算法,該模型基于日周期變化的數(shù)據(jù)特征,可自動(dòng)選擇步長來進(jìn)行城市道路交通流預(yù)測。
交通流數(shù)據(jù)存在一定的周期性變化規(guī)律,間隔單位一般為日,此種周期特性可以認(rèn)定為不同日期下交通流數(shù)據(jù)在任一時(shí)刻與之呈對應(yīng)關(guān)系的數(shù)據(jù)級比相近。第一步,通過科學(xué)合理的方式來分析交通流歷史數(shù)據(jù)級比;第二步,對GM(1,1)模型選取不同步長,對交通流進(jìn)行預(yù)測;第三步,對步長不同模型參數(shù)a相對應(yīng)的(1+0.5a)/(1?0.5a)值進(jìn)行深入的觀察與分析,選擇同交通流歷史數(shù)據(jù)級比最相似的模型作為預(yù)測模型。模型預(yù)測步驟如下。
Step1:確定 GM(1,1)模型步長選擇范圍(s,d),s>3;
Step2:對歷史上t時(shí)刻交通流數(shù)據(jù)級比σ1(k)借助式(6)進(jìn)行全方位、多層面的分析運(yùn)算,k值則在區(qū)間(s,d)間進(jìn)行選取。若為多個(gè)日期的數(shù)據(jù),那么需要選取不同日期數(shù)據(jù)的平均數(shù)值;
Step3:利用科學(xué)合理的方式來精準(zhǔn)預(yù)測t+1時(shí)刻交通流,然后把t定義為最后一個(gè)數(shù)據(jù),那么向前則以此選取s,s+1,…,dt個(gè)數(shù)據(jù),對于不同步長的數(shù)據(jù),通過恰當(dāng)?shù)姆绞?,并求出與之相對應(yīng)的發(fā)展系數(shù) as,as+1,…,ad,構(gòu)建GM(1,1)模型;
Step4:從 as,as+1,…,ad與之相對應(yīng)的(1+0.5a)/(1?0.5a)值之中,結(jié)合實(shí)際情況,確定與σ1(k)最相近的數(shù)值,并將其對應(yīng)的步長定義為預(yù)測步長,然后充分利用該步長的GM(1,1)模型來精準(zhǔn)預(yù)測t+1時(shí)刻交通流,并得出具體的預(yù)測值。
交通流特性[12~14]往往會(huì)受到多方面的影響,氣象條件就是其中不可忽視的因素之一,不同氣象條件會(huì)對車輛的速度、密度、流量等造成一定影響。單個(gè)模型預(yù)測的處理能力較差并且實(shí)用性較低,不能充分考慮到各種因素?;诖?,本文將集成預(yù)測思想融于其中。
集成預(yù)測模型[15]的思想可以概括為結(jié)合實(shí)際情況,對不同預(yù)測模型進(jìn)行組合處理,即賦予其不同的權(quán)值系數(shù),并從各模型系統(tǒng)之中提煉一些真實(shí)、全面、有效的信息數(shù)據(jù),充分應(yīng)用各模型預(yù)測結(jié)果,對預(yù)測誤差、預(yù)測風(fēng)險(xiǎn)實(shí)施分散處理,從而使預(yù)測可靠性、預(yù)測精度得到進(jìn)一步提升。不同模型的模型系數(shù)會(huì)隨著時(shí)間變化發(fā)生相應(yīng)改變,同固定權(quán)值集成預(yù)測相比,利用單個(gè)動(dòng)態(tài)變化的權(quán)值集成的獨(dú)立預(yù)測模型,其適應(yīng)性將更好。
2.3.1 降雨條件下的CA交通流模型
設(shè)定道路由N個(gè)元胞組成,長度為L。任何一個(gè)元胞在任意時(shí)刻的狀態(tài)只有被占據(jù)或者無車兩種;由于車輛長度和安全距離的影響,一輛車可以占據(jù)多個(gè)元胞。第i輛車的速度vi(i=0,1,2…vmax),其中vmax為車輛最大期望速度,設(shè)定每個(gè)時(shí)間步長為1s。本文的研究僅僅針對小客車,同時(shí),設(shè)定每輛車的最大期望速度和制動(dòng)減速均為一樣。
在構(gòu)建的模型中,車輛有三種狀態(tài):
1)兩車間距遠(yuǎn)遠(yuǎn)大于安全距離,車輛進(jìn)行加速,直至達(dá)到最大期望速度;
2)行駛過程中的車輛速度依賴于前方車輛的速度以及和前方車輛的距離,要保證安全的行車距離,以此進(jìn)行速度的調(diào)節(jié);
3)當(dāng)兩車間距不斷縮小,駕駛員要減速保證安全。
降雨條件下對交通流的直接影響是車輛速度降低、車輛距離增加,因此,該模型引入一些參數(shù):
β:降雨條件下的速度參數(shù),取值0~1之間;
βi·vmax:i種降雨條件下的最大期望速度;
α:降雨條件下的間距參數(shù),取值大于1;
α·ds:i種降雨條件下最小安全距離;
Ls:可視距離。
具體演化規(guī)則如下:
其中,vi為當(dāng)前車輛i的速度;di為當(dāng)前車i與前車間距;vmax為最大期望速度;ds為最小安全距離;xi為當(dāng)前車i的位置。
2.3.2 組合預(yù)測模型算法
假定在分析、研究某一問題的過程中,設(shè)計(jì)創(chuàng)造了n種預(yù)測方式,那么此問題之中,某變量的N個(gè)實(shí)際觀測值則具體為Yt(t=1,2…,N),t為觀測時(shí)間。設(shè)集成預(yù)測方法的權(quán)值系數(shù)向量為W=,其中wi為第i種預(yù)測方法在集成預(yù)測模型中的權(quán)值系數(shù),有假定第i種預(yù)測方式的預(yù)測值利用 fit進(jìn)行表示,那么集成預(yù)測模型的預(yù)測 ft則可以利用式(14)進(jìn)行表示,具體為
設(shè)元胞自動(dòng)機(jī)模型在t時(shí)刻的預(yù)測值為L(t),GM(1,1)模 型 在 t時(shí) 刻 的 預(yù) 測 值 為 G(t),t=1,2,…n。根據(jù)式(14)得出兩種模型集成的表達(dá)式為
Y(t)為利用動(dòng)態(tài)權(quán)值將元胞自動(dòng)機(jī)和GM(1,1)模型的預(yù)測值進(jìn)行累加所得的具體預(yù)測結(jié)果,其中w為動(dòng)態(tài)權(quán)值,t為該預(yù)測數(shù)值產(chǎn)生的時(shí)間。
結(jié)合實(shí)際情況,求出最佳權(quán)值系數(shù)是實(shí)現(xiàn)模型集成的重要前提與基礎(chǔ),本文的權(quán)值w則是在0~1之間所選取的11個(gè)數(shù)值。通過對圖1進(jìn)行觀察與分析,了解集成兩種模型預(yù)測結(jié)果的詳細(xì)流程與步驟,具體為
Step1:從t=1時(shí)刻開始,分別將兩種模型的預(yù)測結(jié)果和各自權(quán)值系數(shù)w進(jìn)行乘積處理;
Step2:把Step1中兩種模型乘積處理后的預(yù)測結(jié)果進(jìn)行疊加,然后求得經(jīng)過加權(quán)處理之后的時(shí)間點(diǎn)t具體預(yù)測結(jié)果;
Step3:重復(fù)Step1的流程,直至全部預(yù)測時(shí)間點(diǎn)的預(yù)測值均利用權(quán)值集成。
根據(jù)圖1中的步驟進(jìn)行循環(huán)計(jì)算與分析,共對外輸出11組同權(quán)值w存在密切關(guān)聯(lián)的數(shù)據(jù),從而獲得一組經(jīng)加權(quán)集成處理之后的交通流預(yù)測數(shù)據(jù),如式(16)所示:
圖1 元胞自動(dòng)機(jī)和GM(1,1)模型組合過程
為了更加方便、快捷地明確權(quán)值w,本文引入關(guān)聯(lián)度概念。若因素或者事物變化的大小、趨勢十分相似,那么認(rèn)定二者間存在較強(qiáng)的關(guān)聯(lián)度,若與此相反,則表明關(guān)聯(lián)度比較弱。本文以預(yù)測交通流曲線、實(shí)際交通流曲線二者形狀的相似度表示關(guān)聯(lián)度。若二者的形狀逐漸趨近,那么表明二者的關(guān)聯(lián)度較強(qiáng),若曲線形狀差別比較大,那么兩者間存在的關(guān)聯(lián)度比較弱。所以,對關(guān)聯(lián)度進(jìn)行評判時(shí),可以將實(shí)際值曲線、組合模型預(yù)測值曲線形狀的相似度作為衡量標(biāo)準(zhǔn)?;诖耍蟮?1組預(yù)測數(shù)據(jù)的實(shí)際值、組合模型預(yù)測值的關(guān)聯(lián)度,并結(jié)合實(shí)際情況,選出關(guān)聯(lián)度最大的預(yù)測數(shù)據(jù),然后匹配相對應(yīng)的權(quán)值,求出具體的預(yù)測結(jié)果。對關(guān)聯(lián)度進(jìn)行分析運(yùn)算的過程中,可以參照式(17):
由于GM(l,l)屬于特殊的動(dòng)態(tài)模型,其處于一種動(dòng)態(tài)變化之中,為保證權(quán)值系數(shù)的動(dòng)態(tài)步調(diào)與GM(1,1)模型保持同步,當(dāng)GM(1,1)的參數(shù)產(chǎn)生變化之后,需要借助EViews數(shù)據(jù)分析器進(jìn)行再次分析運(yùn)算,并得出新的權(quán)值系數(shù)。通過對11組實(shí)際值和組合模型預(yù)測值的關(guān)聯(lián)度全方位、多層面的研究分析,可以得到圖2的結(jié)果(橫軸為關(guān)聯(lián)系數(shù)r,縱軸為權(quán)值系數(shù)w)。
圖2 權(quán)值系數(shù)w對應(yīng)的關(guān)聯(lián)系數(shù)r的值
通過對圖2分析可知,當(dāng)權(quán)值系數(shù)w為0.6時(shí),實(shí)際值、組合模型預(yù)測值的關(guān)聯(lián)度最大,集成預(yù)測精度最高。因此,可以將組合預(yù)測模型的權(quán)值系數(shù)確定為0.6。
為了全面、深入地掌握交通流預(yù)測過程中天氣對其產(chǎn)生的影響程度,本文實(shí)驗(yàn)數(shù)據(jù)采用某城市交通檢測數(shù)據(jù),每間隔1min系統(tǒng)進(jìn)行檢測線圈數(shù)據(jù)采集。
數(shù)據(jù)集被細(xì)化為兩大部分,其一是訓(xùn)練數(shù)據(jù)集;其二是預(yù)測數(shù)據(jù)集。鑒于冰雪和不同能見度的氣象條件與雨天條件類似,且天氣數(shù)據(jù)較少,實(shí)驗(yàn)數(shù)據(jù)較難獲取,因此本次實(shí)驗(yàn)選擇了雨天、晴天這兩種狀況作為研究對象。對于晴天模式,選取數(shù)據(jù)的時(shí)間范圍為2017年11月2日~18日,訓(xùn)練集中共包括9395組數(shù)據(jù),其中11月19日的數(shù)據(jù),預(yù)測集共包含697組信息數(shù)據(jù)。對于雨天模式,選取數(shù)據(jù)的時(shí)間范圍為12月8日~16日,訓(xùn)練集共包含3763組信息數(shù)據(jù),其中12月17日的預(yù)測集共包含593組信息數(shù)據(jù)。
本文引進(jìn)兩個(gè)評價(jià)預(yù)測擬合度指標(biāo)來進(jìn)一步提高預(yù)測的精度,通過把預(yù)測值與真實(shí)值進(jìn)行對比分析,從而判斷預(yù)測方式是否合理。
1)平均平方誤差(MSE),主要是指實(shí)際數(shù)值、預(yù)測結(jié)果之間差值平方的算數(shù)平均數(shù)值:
2)平均絕對百分比誤差(MAPE),指實(shí)際測量值、預(yù)測數(shù)值之間的差值占實(shí)測數(shù)值百分比的算術(shù)平均數(shù)值:
上述公式之中,n、Y*i、Yi分別表示樣本數(shù)、預(yù)測值、實(shí)際值,平均平方誤差可以真實(shí)、充分、全面地展現(xiàn)預(yù)測精度,但是無偏性的衡量比較困難。而平均絕對百分比誤差則可以對預(yù)測模型的無偏性進(jìn)行精準(zhǔn)衡量,與平均絕對偏差進(jìn)行配合應(yīng)用,則可以實(shí)現(xiàn)良好互補(bǔ),能夠真實(shí)全面、詳細(xì)、客觀地評價(jià)真實(shí)數(shù)據(jù)、交通流預(yù)測的擬合度。
圖3所示是基于氣象條件改進(jìn)的CA和GM(1,1)組合交通流預(yù)測模型與單個(gè)模型預(yù)測結(jié)果和實(shí)際值的折現(xiàn)對比圖(橫軸為時(shí)間/min,縱軸為交通流量/輛)。
圖3 組合模型與單個(gè)模型的預(yù)測對比圖
由圖3可以看出,組合模型相比單個(gè)模型預(yù)測值更趨近于實(shí)際值,僅存在微小差別。結(jié)合實(shí)際情況,分別求出實(shí)際值、預(yù)測值的MAPE及MSE對比如表1所示。結(jié)果顯示,從MAPE或者是MSE指標(biāo)上,相對于單個(gè)模型,改進(jìn)后的組合模型預(yù)測方法雖然提高較小,但均有所改善。其中,MAPE值分別減少0.19%、0.55%,MSE值分別減少18.35、42.78,訓(xùn)練時(shí)間也分別減少0.25s、1.79s。因此,基于氣象條件改進(jìn)的CA和GM(1,1)組合交通流預(yù)測模型對于交通流量的預(yù)測情況較為理想,與單個(gè)模型相比較也具有一定優(yōu)勢。
表1 組合模型與單個(gè)模型性能比較
本文提出一種基于氣象條件改進(jìn)的CA和GM(1,1)組合交通流預(yù)測模型。首先針對氣象條件帶來的影響,引入了一些參數(shù),更新了演化規(guī)則,然后將改進(jìn)后的元胞自動(dòng)機(jī)預(yù)測模型和灰色理論GM(1,1)預(yù)測模型進(jìn)行組合。經(jīng)實(shí)驗(yàn)驗(yàn)證,組合交通流預(yù)測模型對于交通流量的預(yù)測情況較為理想,與單個(gè)模型相比較也具有一定優(yōu)勢。由于冰雪和不同能見度的氣象條件實(shí)驗(yàn)數(shù)據(jù)較難獲取,本文僅針對降雨條件進(jìn)行了實(shí)驗(yàn)論證,因此今后的研究工作將會(huì)補(bǔ)充其他氣象條件的數(shù)據(jù)和實(shí)驗(yàn),進(jìn)一步完善預(yù)測模型。