劉宇博, 李保珠
(1 濟南市歷城第二中學, 濟南 250104; 2 濟南大學 信息科學與工程學院, 濟南 250022)
隨著城市規(guī)模的不斷擴大和城市人口持續(xù)增長,市內(nèi)交通出行壓力越來越大[1]。傳統(tǒng)的路徑通行時間預測,往往基于當前各路段的采集信息,通過平均通行時間進行總體行程時間預測。然而隨著車輛的前進和時間的推移,尤其下游路段往往路況多變[2],由此總體行程時間預測呈現(xiàn)出2個顯著問題:
(1)車輛行程中途到達后期各路段的時間未知;
(2)未來一段時間內(nèi),出行路徑的路況信息未知[3]。
針對上述問題,本文的主要貢獻如下:
從時間與空間相結(jié)合的角度,基于歷史典型相似路徑樣本數(shù)據(jù)。獲取以歷史時間為縱軸的各路段的通行時間。隨后根據(jù)空間車輛的行進,確定下一路段的到達時間,以到達時間為橫軸進行歷史時間縱軸的數(shù)據(jù)截取,根據(jù)截取數(shù)據(jù)采用信息熵來判斷路況的變化。
通過對不同通行路段具體通行時間的劃分,基于采集數(shù)據(jù)計算獲取城市不同分類路段的通行時間,并得到路段通行時間待定參數(shù),從而實現(xiàn)基于實時采集數(shù)據(jù)獲取路段通行時間[4]。隨后基于信息熵實現(xiàn)路況變化狀態(tài)的判別[5],若信息熵較小,說明當前路況穩(wěn)定,可實時采集數(shù)據(jù)實現(xiàn)路徑通行時間的預測,若信息熵較大,說明在車輛通行時間過程中路況狀態(tài)變化,此時實時采集數(shù)據(jù)失效。而歷史典型相似路徑數(shù)據(jù)更能體現(xiàn)其實際通行時間,故通行時間更加依賴于歷史典型相似路徑數(shù)據(jù),從而實現(xiàn)基于路況變化的動態(tài)路徑通行時間預測。
傳統(tǒng)的路徑通行時間的預測,往往根據(jù)當前的路況采集數(shù)據(jù),對某一路徑的通行時間進行靜態(tài)的預測。然而隨著車輛的行進,時間不斷推移,各路段的實時交通狀態(tài)亦不斷發(fā)生變化[6],由此基于靜態(tài)預測的路徑通行時間預測與實際通行時間存在較大的差異。
本文采用基于信息熵動態(tài)擬合的路徑通行時間預測整體流程如圖1所示。一方面基于當前的采集數(shù)據(jù)進行穩(wěn)定路況的通行時間預測[7];另一方面基于歷史數(shù)據(jù)對下游路段的未來通行時間進行預測,從而提高模型的整體預測精準度。
圖1 時間預測整體流程圖
針對路況隨時間變化而導致實時采集數(shù)據(jù)失效的問題,本文采用信息熵對路況狀態(tài)進行精細化擬合,從而提高通行時間預估的準確性。
基于歷史數(shù)據(jù)采集樣本對當前路徑的通行時間進行預測,從歷史數(shù)據(jù)和當前采集數(shù)據(jù)2個維度進行?;诋斍奥窙r的當日已采集數(shù)據(jù),采用非線性最小二乘優(yōu)化算法對歷史相似典型路徑進行搜索,從而提高歷史樣本數(shù)據(jù)價值。
將當前路況采集特征數(shù)據(jù)與歷史樣本采集特征數(shù)據(jù),即計算每個歷史采集樣本X′與當前采集數(shù)據(jù)X的距離,采用非線性最小二乘優(yōu)化算法:
(1)
其中,u代表采集樣本特征個數(shù);xi為當前采集樣本X的屬性值;xi′為歷史采集數(shù)據(jù)X′的屬性值,進入路段的時間點t在采集數(shù)據(jù)時間間隔為τ時取整。
隨時間的推移,路況信息變化較大,故本文借鑒信息熵的概念,對路況的通行時間進行客觀權(quán)重衡量。具體表現(xiàn)為,當路況一直處于順暢狀態(tài)或擁堵狀態(tài)時,路徑的通行時間均相對穩(wěn)定,而當路況發(fā)生變化時導致后期各路段的通行時間變化較大,此時同類歷史交通數(shù)據(jù)的路徑通行時間的參考價值更大[8]。通過求路徑通行時間的信息熵來確定實時采集數(shù)據(jù)的路段通行數(shù)據(jù)與歷史典型相似路徑通行時間的權(quán)重。
設(shè)某樣本X有m個同類日采集樣本數(shù)據(jù),n個數(shù)據(jù)采集時間點,用x(i, j)表示第i個樣本的第j個時刻點的車輛通過該路段的行駛時間,則評價指標構(gòu)成的矩陣R為:
(2)
數(shù)據(jù)歸一化預處理得:
y(i,j)= [x(i,j)-minx(i,j)]/
[maxx(i,j)-minx(i,j)]
(3)
此時,y(i,j)∈[0,1],則第j個時刻點的歷史車輛通過時間的熵值為:
(4)
此時,熵權(quán)的大小代表著第j個時刻點,歷史車輛通過該路段時間的變化量。若Hj較小,則說明該路段在前j個時刻點的通行時間變化較大,此刻路況變化較大。反之,若Hj較大,則說明該路段在前j個時刻點的通行時間變化較小,此刻在路況平穩(wěn)期。
因此,基于時間數(shù)據(jù)推進,進入路段的時間點t在采集數(shù)據(jù)時間間隔為τ時取整,其前后通行時間變化的權(quán)重具體計算公式為:
Tt=Ta·wj+Tb(1-wj)
(5)
其中,wj表示的車輛在j時刻及其之前該路段的通行變化,Ta為歷史典型相似路徑的該路徑均值通過時間,并以(1-wj)的概率維持基于短期相似路段數(shù)據(jù)擬合的通行時間Tb,從而獲得該路段的預估通行時間Tt。
實驗內(nèi)容主要通過2方面進行,一方面,基于實時采集數(shù)據(jù)和歷史交通數(shù)據(jù),以信息熵動態(tài)擬合路徑通行時間,計算其擬合數(shù)據(jù);另一方面,基于預測結(jié)果分析,說明本文方法的優(yōu)越性。
為更好地體現(xiàn)本文提出方法的預測性能,針對濟南市經(jīng)十路的不同路段進行數(shù)據(jù)采集??傮w路徑分布為濟南東高速口附近到泉城公園附近,路徑信息如圖2所示。
圖2 濟南東高速口到泉城公園路徑示意圖
采集歷史數(shù)據(jù)為2018年3月5日到2018年9月2日26周的交通采集數(shù)據(jù),實驗數(shù)據(jù)為2018年9月3號(周一)分別在6:30~9:30、13:30~16:30和18:00~21:00,采用線圈檢測器采集數(shù)據(jù),以5 min為一個信號檢測周期。
表1歷史短期相似路段樣本擬合部分數(shù)據(jù)
Tab.1Historicalshort-termsimilarroadsegmentsamplefittingpartdata
潘莊路段367 m高新區(qū)路段558 m燕山立交橋路段452 m泉城公園路段579 mT/s166888116
隨后,以基于熵權(quán)法的路況動態(tài)擬合未來路況變化。首先,根據(jù)歷史交通數(shù)據(jù)對不同路段進行縱向的路況動態(tài)權(quán)值計算,同樣以7:00出發(fā)的濟南東高速口到泉城公園路段的部分典型路段為例,見表2。
表3為7:00~8:10濟南東高速口到泉城公園路段的部分典型路段的縱向歷史通行時間,由于出行時間為7點鐘,此時各路段均為暢通狀態(tài)。通過時空外推擬合獲取到達各路段的時間點及對應(yīng)通行時間,表3的陰影車輛行駛時段的橫向時間截斷獲取歷史數(shù)據(jù)的縱向各通行時間,采用熵權(quán)法對計算實時采集數(shù)據(jù)與歷史典型相似路徑的權(quán)重比例,由于到達潘莊路段基于歷史數(shù)據(jù)的通行時間基本無變化,故此時信息熵為0,故僅基于實時采集數(shù)據(jù)給出通行時間預測,而到達高新區(qū)路段基于歷史數(shù)據(jù)的通行時間變化較大,此時信息熵為0.664 7,到達燕山立交橋路段的信息熵為0.894 2,到達泉城公園路段的信息熵為0.937 1,故隨著時間的推移,較遠的路段通行時間變動較大,此時采用基于信息熵比例的動態(tài)數(shù)據(jù)擬合法,即高新區(qū)路段、燕山立交橋路段和泉城公園路段的通行時間分別為:
表2 同類歷史交通數(shù)據(jù)的部分典型路段通行時間
本文以信息熵度量變化路況信息,實現(xiàn)實時采集數(shù)據(jù)與歷史數(shù)據(jù)的綜合預測。
為驗證本文所述方法的優(yōu)越性,根據(jù)實驗采集數(shù)據(jù)分別設(shè)計以下實驗路徑:
行程1:9月3日7:00出發(fā),從濟南東高速口到泉城公園路段;
行程2:9月3日14:00出發(fā),從濟南東高速口到泉城公園路段;
行程3:9月3日19:00出發(fā),從濟南東高速口到泉城公園路段。
對上述行程分別采用4種方法進行預測數(shù)據(jù)對比。
基于系統(tǒng)的實際需求,并考慮到余量,本控制系統(tǒng)采用西門子的1214控制器,該控制器集成有14個數(shù)字量輸入,10個數(shù)字量輸出,另單配有1塊16入/16出數(shù)字量模塊和3塊8出數(shù)字量模塊。
(1)傳統(tǒng)方法預測(某導航APP實現(xiàn));
(2)基于實時采集數(shù)據(jù)的短期相似路段擬合預測;
(3)基于歷史典型相似路徑的擬合預測;
(4)本文預測,預測時間與預測誤差見表3。
表3 實驗數(shù)據(jù)預測值及預測誤差
其中,T為行程預測時間,e為預測誤差,由表3可以看出,在行程2時的通行路徑均處于平穩(wěn)期,即路況分別處于順暢狀態(tài),傳統(tǒng)預測方法在時間上與實際通行時間相差不大,預測誤差維持在7%左右。然而當預測時長面臨如行程1的路況進入早高峰狀態(tài),或者行程3路況開始脫離晚高峰的狀態(tài)時,傳統(tǒng)預測方法基于當前的采集數(shù)據(jù)難以根據(jù)時間的推移對路徑通行時間進行有效預測,而本文方法結(jié)合了實時采集數(shù)據(jù)和歷史數(shù)據(jù),分別結(jié)合了實時采集數(shù)據(jù)時效性和歷史數(shù)據(jù)穩(wěn)定性的優(yōu)點,即使路況狀態(tài)明顯變化時,預測誤差仍然在2%左右,可有效實現(xiàn)對未來短期內(nèi)的城市道路通行時間的預測。綜上所示,本方法具有顯著的實用性和優(yōu)越性。
本文通過對通行路徑的定點檢測數(shù)據(jù)獲取不同路段的歷史交通數(shù)據(jù),并基于分類分段的城市道路計算獲取各路段不同狀態(tài)下的待定參數(shù)和歷史通行時間[9]。基于最小二乘法獲取實驗數(shù)據(jù)的歷史典型相似路徑,隨著車輛通行時間的外推,實時路況不斷發(fā)生變化,此時依賴于實時采集數(shù)據(jù)難免導致預測的片面性,故需結(jié)合同類樣本的歷史典型相似路徑,以信息熵度量變化路況信息,從而實現(xiàn)實時采集數(shù)據(jù)與歷史數(shù)據(jù)的綜合預測,提高路徑通行時間預測的準確性[10]。實驗結(jié)果表明,本文提出的基于信息熵動態(tài)擬合的時間預測方法可很好地擬合短期內(nèi)的城市交通路況,對路徑的通行時間預測相對準確,從而為出行路徑選擇提供有效的時間參考與行程規(guī)劃。