基金項目:2022年橫向課題“廣西高速公路交通擁堵防治智能決策系統(tǒng)”(編號:GXHS-2022-016);2021年廣西交通職業(yè)技術(shù)學(xué)院重點科研項目“廣西高速公路交通擁堵防治的研究與應(yīng)用”(編號:JZY2021KAZ05);廣西高校中青年教師科研基礎(chǔ)能力提升項目“大數(shù)據(jù)背景下道路運輸安全風(fēng)險預(yù)警平臺研究與應(yīng)用”(編號:2022KY1122);“基于‘AI視覺+機(jī)器學(xué)習(xí)’的交通場景應(yīng)用研究”(編號:2023KY1157)
作者簡介:林立春(1974—),碩士,副教授,研究方向:計算機(jī)應(yīng)用技術(shù)和大數(shù)據(jù)技術(shù)。
摘要:基于門架和收費站大數(shù)據(jù)的特征維數(shù)不高、數(shù)據(jù)量大、擁堵預(yù)測為模糊預(yù)測等特點,文章選擇支持向量回歸(SVR)方法作為交通擁堵預(yù)測算法并加以優(yōu)化研究。通過研究和實踐表明,利用ETC門架和收費站數(shù)據(jù)能夠準(zhǔn)確地獲取高速公路區(qū)間平均車速、交通流量等信息,利用合適的模型能夠較為準(zhǔn)確地預(yù)測未來的擁堵狀態(tài)。
關(guān)鍵詞:高速公路;交通擁堵;預(yù)測;門架;SVR
中圖分類號:U491.1+4
0 引言
隨著我國高速公路里程、機(jī)動車保有量和交通運輸業(yè)務(wù)的增加,高速公路的交通擁堵也越來越嚴(yán)重。而全國高速公路ETC門架(以下簡稱門架)系統(tǒng)早在2019年底已完成23 974個,占比99.99%。門架產(chǎn)生的監(jiān)測數(shù)據(jù)以及眾多的收費站數(shù)據(jù),將其脫敏后,利用大數(shù)據(jù)分析等算法,可以科學(xué)地預(yù)測道路的擁堵程度。出行者可據(jù)此合理安排時間和路線,提高出行效率和經(jīng)濟(jì)效益,降低安全事故隱患,減少污染,節(jié)約寶貴的時間[1]。
基于門架和收費站大數(shù)據(jù)的特征維數(shù)不高、數(shù)據(jù)量大、擁堵預(yù)測為模糊預(yù)測等特點,文章選擇支持向量回歸(Support vector regression,簡稱SVR)方法作為交通擁堵預(yù)測算法并加以優(yōu)化。
1 支持向量回歸理論
SVR方法認(rèn)為預(yù)測值與實際值偏差不大即認(rèn)為預(yù)測正確,不用計算損失,只有當(dāng)超出范圍時才計算損失,這極大地減少了數(shù)據(jù)的計算,尤其是復(fù)雜數(shù)據(jù)的計算,正符合交通擁堵預(yù)測的需求。
回歸預(yù)測模型SVR的預(yù)測輸出值f(x)的一般公式如式(1)所示。
f(x)=wTx+b""" (1)
式中:w——法向量;
b——位移項。
僅當(dāng)預(yù)測值與實測值yi偏差大于ε時,即|f(xi)-yi|gt;ε時才計算損失,ε的計算如式(2)所示。
s.t.f(xi)-yi≤ε+ξiyi-f(xi)≤ε+ξ*iξigt;0,ξ*igt;0,i=1,2,…,N
式中:ξi和ξ*i——松弛變量,即允許少數(shù)樣本不落在以yi為中心兩側(cè)ε寬的間隔帶內(nèi);
C——懲罰函數(shù)。
定義拉格朗日函數(shù)如式(3)所示。
式中,μi≥0,μ^i≥0,αi≥0,α^i≥0為拉格朗日乘子。根據(jù)拉格朗日對偶性得到:
假如解為α*=(α*1,α*2,…,α*N),在α^*=(α^*1,α^*2,…,α^*N)T中找出α*j∈α*且滿足Cgt;α*jgt;0,則有:
由此得出模型輸出的預(yù)測值f(x)為:
式中,K(x,xi)為核函數(shù),通過試驗對比,選擇了徑向基核函數(shù),如公式(7)所示。
σ為核帶寬參數(shù),取值對預(yù)測效果有一定的影響。
2 擁堵預(yù)測模型
依據(jù)高速公路基本服務(wù)水平分析指標(biāo)與分級標(biāo)準(zhǔn),文章將區(qū)間平均車速作為擁堵判斷指標(biāo),共劃分6個交通擁堵狀況等級[2],如表1所示。
2.1 預(yù)測模型整體架構(gòu)
建立SVR交通擁堵預(yù)測模型,整體架構(gòu)如圖1所示。先抽取特征,對特征數(shù)據(jù)降噪,并進(jìn)行歸一化處理,將歸一化后的數(shù)據(jù)集分為訓(xùn)練樣本集和預(yù)測樣本集,利用式(1)中的SVR算法進(jìn)行預(yù)測,根據(jù)上一預(yù)測周期的預(yù)測數(shù)據(jù)與實測數(shù)據(jù)的誤差,進(jìn)行修正計算本輪預(yù)測結(jié)果,評估模型,優(yōu)化參數(shù),同時更新樣本集,逆歸一化,輸出結(jié)果。
2.2 抽取特征
目前,ETC門架、交調(diào)站、高清卡口、視頻監(jiān)控和浮動車數(shù)據(jù)等已覆蓋全國90%以上高速公路,廣西已全區(qū)覆蓋。將門架數(shù)據(jù)、收費站數(shù)據(jù)等多源數(shù)據(jù)進(jìn)行數(shù)據(jù)融合與清洗,脫敏后即可為高速路擁堵預(yù)防使用。例如對門架數(shù)據(jù)抽取如表2所示的特征。
2.3 降噪
如果某個特征中包含了大量的噪聲數(shù)據(jù),結(jié)果會在一定程度上影響預(yù)測模型的魯棒性?;诂F(xiàn)實中高速公路上有個別車輛在服務(wù)區(qū)停車、路上拋錨、事故、數(shù)據(jù)缺失、識別異常等情況,表現(xiàn)為趨于分散、能量較小的噪聲,采用陳淑燕等[3]等利用小波變換的方法可達(dá)到較滿意的降噪效果。
2.4 歸一化
交通流時間序列數(shù)據(jù)是隨機(jī)序列,若未歸一化,一來學(xué)習(xí)率大,二來收斂速度慢。對數(shù)據(jù)采用極差標(biāo)準(zhǔn)化歸一方法,將特征映射到[0,1]區(qū)間內(nèi),如式(8)所示。
式中: x*i——第i個數(shù)據(jù)xi的歸一化數(shù)據(jù);
xmax和xmin——最大和最小值[4]。
2.5 預(yù)測模型優(yōu)化
2.5.1 預(yù)測結(jié)果的修正計算
設(shè)時間窗步長為S,當(dāng)預(yù)測出t+1時刻的值之后,要增減一個修正量。修正量δt+1的計算如式(9)所示。
即取距離預(yù)測時刻t+1最近的t-S+1,t-S+2,…,t等時刻的實測值與預(yù)測值差值的平均值為修正量。目的是使預(yù)測值的曲線更加貼近或圍繞實測值的曲線發(fā)展,使預(yù)測值進(jìn)一步逼近實測值,提高預(yù)測準(zhǔn)確度。實測值獲取方法見2.5.2。
2.5.2 平均車速實測值的計算
通過研究表2的數(shù)據(jù)內(nèi)容可發(fā)現(xiàn),利用“vehicleSpeed”、“transTime”等多個數(shù)據(jù)可獲取統(tǒng)計周期內(nèi)(15 min、0.5 h、1 h……)每輛車的行駛速度,進(jìn)而得出統(tǒng)計周期(時間窗)內(nèi)的門架附近的平均車速vs,如式(10)所示。
式中:vi——第i輛車行駛速度;
n——統(tǒng)計周期內(nèi)通過門架的車輛總數(shù),即交通流量。
收費站附近的交通流量Q通過收費數(shù)據(jù)很容易統(tǒng)計,但是統(tǒng)計收費站附近的平均車速vs較難。為計算收費站附近的vs,可以根據(jù)公式Q=Kvs計算得出。Q為交通流量由收費數(shù)據(jù)得出,K為平均車流密度。因為K的采集難度較大,一般用時間占有率近似地表示K,計算公式如式(11)所示。
Occupancy=∑Δti/T""" (11)
式中:occupancy——時間占有率(%);
Δti——第i輛車占用檢測器的時間(s);
T——觀測時間段的長度(s)。
得出K后,通過Q=Kvs近似地計算出收費站附近的平均車速。
在得出統(tǒng)計周期內(nèi)門架和收費站平均車速之后,結(jié)合門架數(shù)據(jù)“gantryId”的GPS位置可知高速公路各個區(qū)間段的實時平均車速vs和交通流量Q。
2.5.3 SVR參數(shù)的優(yōu)化
SVR預(yù)測中,影響預(yù)測結(jié)果的參數(shù)有C、ε和σ三個。針對于式(6)、式(7)所示的預(yù)測函數(shù),主要是調(diào)整核帶寬參數(shù)σ,以期達(dá)到預(yù)測的最優(yōu)解。
在試驗中,閾值范圍為0.01~0.618,初始為0.1。實際應(yīng)用時可在每日凌晨3:00-5:00(也可設(shè)置為每周、每月優(yōu)化一次SVR參數(shù))服務(wù)器負(fù)載最低的時段將前一天或前一周的歷史數(shù)據(jù),通過差分灰狼優(yōu)化(Differential Evolution-Grey Wolf Optimizer,DE-GWO)算法[5]計算出每條高速公路的K個認(rèn)為比較理想的SVR參數(shù),并記錄每個參數(shù)對應(yīng)的均方根誤差(RMSE),作為接下來預(yù)測時使用的備選SVR參數(shù)。
在新的預(yù)測中,例如預(yù)測t+1時間的擁堵情況時,t時間的實測值已經(jīng)計算得出,計算t時間的預(yù)測值和實測值之間的RMSE,如果RMSE小于或等于該參數(shù)的最小誤差,更新最小誤差,且繼續(xù)使用該參數(shù),并將該參數(shù)的使用次數(shù)+1;如果RMSE在允許范圍內(nèi),仍繼續(xù)使用該參數(shù),并將該參數(shù)的使用次數(shù)+1;如果RMSE誤差較大超過允許范圍,繼續(xù)判斷預(yù)測值偏大還是偏小。如果偏大,從備選參數(shù)中選擇當(dāng)前參數(shù)的近鄰參數(shù),該近鄰參數(shù)應(yīng)該同樣使得產(chǎn)生的預(yù)測值比實測值偏大,且使用次數(shù)是最大的;如果偏小,從另一側(cè)選擇使用次數(shù)最大的近鄰參數(shù)。循環(huán)往復(fù)下去,目的是選擇“最優(yōu)”參數(shù)。
2.5.4 循環(huán)滾動更新樣本集
循環(huán)滾動預(yù)測的原理是在數(shù)據(jù)長度保持不變的情況下,對訓(xùn)練樣本集、預(yù)測樣本集循環(huán)滾動地加入新的數(shù)據(jù),剔除舊的數(shù)據(jù)。這種不斷向前更新數(shù)據(jù)集建立的數(shù)據(jù)序列能更好地反映出高速公路狀態(tài)的最新特征,體現(xiàn)出訓(xùn)練樣本集、預(yù)測樣本集的動態(tài)變化。因更改了樣本集,故動態(tài)數(shù)據(jù)集還在一定程度上解決了過擬合的問題。實施過程為:
設(shè)定時間窗步長為S,則輸入數(shù)據(jù)為X={X1,X2,…,XS},這里Xi={di,di+1,…,dN-S+p-1},1≤i≤S;i,S∈N。實測對比數(shù)據(jù)為Y={Y1,Y2,…,YS},Yi={di+1,di+2,…,dN-S+p}。下一個時間窗Xi從di+1開始,Yi則從di+2開始,循環(huán)向前滾動,不停地預(yù)測下一時段的交通狀態(tài)。
2.6 輸出預(yù)測結(jié)果
在預(yù)測得出區(qū)間平均車速vs后,即可建立每個門架以及收費站所處區(qū)域的速度演變趨勢圖。當(dāng)vs連續(xù)兩個周期低于65 km/h時,可通過相關(guān)管控平臺軟件進(jìn)行擁堵預(yù)警(管控平臺面向管理者,還可通過公眾號或App面向出行者),并提醒管理者及時介入,主動預(yù)防可能出現(xiàn)的更大擁堵[6]。
3 結(jié)果表征
基于上述預(yù)測算法,選擇南寧東至六景西樞紐高速公路段進(jìn)行預(yù)測與實測,得到預(yù)測的平均車速與實測的平均車速,如圖2所示,表3為對應(yīng)的預(yù)測與后來計算得出的實測數(shù)據(jù)。此實驗數(shù)據(jù)統(tǒng)計周期為60 min,即預(yù)測未來1 h內(nèi)的擁堵情況。圖2中虛線為實測值,實線為預(yù)測值。當(dāng)出現(xiàn)交通流突變時,誤差略微增大??傮w情況是預(yù)測值圍繞實測值上下波動,預(yù)測精度較為理想。
在誤差分析中采用常見的重要指標(biāo)有:平均絕對誤差(MAE)和均方根誤差(RMSE)。和常見的支持向量機(jī)(SVM)、長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)進(jìn)行對比,發(fā)現(xiàn)本文經(jīng)過優(yōu)化后的SVR預(yù)測精度最高。預(yù)測誤差對比如表4所示。
4 結(jié)語
通過研究和實踐表明,利用ETC門架和收費站數(shù)據(jù)能夠準(zhǔn)確地獲取高速公路區(qū)間平均車速、交通流量等信息,利用合適的模型能夠較為準(zhǔn)確地預(yù)測未來的擁堵狀態(tài)。
非門架附近的區(qū)域,在具有方便獲取浮動車相關(guān)GPS數(shù)據(jù)的情況下,同樣適用于本研究方法。
上述預(yù)測算法主要針對常發(fā)性擁堵,當(dāng)遇到交通事故等不可預(yù)測的偶發(fā)性擁堵時,算法具有較大的滯后性。解決辦法是車主第一時間報警,交警及時把數(shù)據(jù)反饋給平臺、公眾號、APP或高速公路管理部門,做出下一步擁堵預(yù)防措施。例如,全國已有部分高速公路交警支隊和百度地圖、高德地圖等相關(guān)方合作,及時反饋交通擁堵情況,以防止更嚴(yán)重、更大范圍的交通擁堵。此法已試行較長一段時間,效果較好。而且,隨著北斗衛(wèi)星精確定位的普及,還可以通過浮動車數(shù)據(jù)獲取偶發(fā)性擁堵情況。
其他諸如極端天氣、泥石流、塌方等自然災(zāi)害,或者臨時養(yǎng)護(hù)、交通稽查等造成的偶發(fā)性擁堵,需要管理者通過天氣預(yù)報、作業(yè)申請和管理部門的通知等信息及時地預(yù)警及管控。重大節(jié)假日亦應(yīng)通過算法預(yù)測和人工介入進(jìn)行擁堵預(yù)防,以實現(xiàn)較好的擁堵防治效果。
擁堵預(yù)防不僅從微觀上能夠帶來減少用時、節(jié)約經(jīng)濟(jì)、綠色環(huán)保等好處;從宏觀上來看,還可深度融入“一帶一路”,加快城鎮(zhèn)化進(jìn)程,構(gòu)建智能、平安、綠色、共享的現(xiàn)代化綜合交通體系,協(xié)助相關(guān)部門實現(xiàn)道路智能化管理,提高交通科學(xué)治理和服務(wù)水平,助力建設(shè)交通強(qiáng)國。
參考文獻(xiàn)
[1]林立春,洪 東,劉 華.基于大數(shù)據(jù)分析和多模融合的交通擁堵高效預(yù)測技術(shù)[J].西部交通科技,2021(7):151-155.
[2]黃承鋒.基于改進(jìn)GA算法的高速公路交通擁堵狀況預(yù)測[J].吉林大學(xué)學(xué)報(信息科學(xué)版),2022(3):198-205.
[3]陳淑燕,王 煒,李文勇.實時交通數(shù)據(jù)的噪聲識別和消噪方法[J].東南大學(xué)學(xué)報(自然科學(xué)版),2006(3):322-325.
[4]Lichun Lin,Shi Tong. Automatic Spatial Annotation of Image Based on Object Recognition [J].Journal of Informationamp;Computational Science. 2013,10(18):5 829-5 847.
[5]鄭曉亮,陳華亮,來文豪.參數(shù)優(yōu)化的SVR移動網(wǎng)絡(luò)流量預(yù)測[J].計算機(jī)應(yīng)用與軟件,2022(9):278-284.
[6]王 健.基于ETC系統(tǒng)數(shù)據(jù)的高速公路主動管控建設(shè)探討[J].中國交通信息化,2020,251(12):99-101.
收稿日期:2023-03-30