趙彪 劉曉鋒 付甜
摘? 要:為了實時判斷城市交通及快速路交通狀況,并充分考慮到快速路及交通系統(tǒng)的模糊性、差異性、波動性,文章首先給出了一套基于模糊C均值聚類法(Fuzzy C-Means)的快速路交通狀況判斷算法,將道路的交通狀況區(qū)分為通暢、基本順暢、緩行、堵塞4類。其次,利用了長短期記憶網(wǎng)絡(luò)(LSTM)的長短時預(yù)測技術(shù),給出了一個基于深度學(xué)習(xí)的模式,對交通運行三參數(shù)進(jìn)行預(yù)測,并利用路側(cè)檢測設(shè)備不斷獲取新的真實數(shù)據(jù),對預(yù)測模型進(jìn)行迭代訓(xùn)練。然后利用已形成的模糊聚類模型,得到快速路交通運行狀態(tài)的預(yù)測結(jié)果。最后以天津市黑牛城道的真實交通數(shù)據(jù)進(jìn)行實驗驗證,結(jié)果表明,文章提出的交通流狀態(tài)預(yù)測模型準(zhǔn)確性達(dá)到93.22%,能為快速路交通控制提供有效的狀態(tài)預(yù)測。
關(guān)鍵詞:城市快速路;模糊C均值聚類;深度學(xué)習(xí);LSTM短時預(yù)測方法;交通運行三參數(shù)
中圖分類號:TP391.9? ? 文獻(xiàn)標(biāo)識碼:A? ? 文章編號:2096-4706(2023)01-0001-08
Traffic Operation State Discrimination and Prediction of Urban Expressway
Based on Deep Learning
ZHAO Biao, LIU Xiaofeng, FU Tian
(Tianjin University of Technology and Education, Tianjin? 300222, China)
Abstract: In order to judge the urban traffic and traffic condition of expressway in real time, and to fully consider the fuzziness, variability, and fluctuation of expressway and traffic system, a set of judgment algorithms of expressway traffic condition based on Fuzzy C-Means is given in this paper firstly, which distinguishes the traffic conditions of roads into four categories: smooth, basically smooth, slow and blocked. Secondly, a model based on deep learning is given to predict the three parameters of traffic operation by using the Long Short-Term Memory (LSTM) long short-term prediction technique, and the prediction model is trained iteratively by continuously acquiring new real data using roadside detection equipments. Then using the developed fuzzy clustering model, the prediction results of the traffic operation state of the expressway are obtained. Finally, the real traffic data of Heiniu Road in Tianjin is used for experimental validation, and the results show that the accuracy of the traffic flow state prediction model proposed in this paper reach 93.22%, which can provide effective state prediction for expressway traffic control.
Keywords: urban expressway; Fuzzy C-Means; deep learning; LSTM short-time prediction method; three parameters of traffic operation
0? 引? 言
作為都市道路交通的主動脈,城市快速路以其大容量、高效、強聯(lián)通的特性承載著城市內(nèi)各個主要功能區(qū)域的交通,極大地減輕了城市壓力,提升了城市的整體服務(wù)質(zhì)量。對于道路交通的模糊性、隨機(jī)性、復(fù)雜性,實時準(zhǔn)確的短期交通流量預(yù)測,對快速路的智能控制和管理具有基礎(chǔ)性和決定性的作用。
以往的短期交通預(yù)測工具,主要可以分成以下三種:參數(shù)方法、非參數(shù)方法和混合方法。參數(shù)化方法包括時間排序方式和卡爾曼濾波[1,2]。焦朋朋等[3]充分利用其對高維特征數(shù)據(jù)預(yù)測精度高以及計算速度快的優(yōu)勢,提出了基于集成學(xué)習(xí)XGBoost模型的交通流預(yù)測。褚瑞娟[4]給出了基于CEEMDAN-IWEP和GWO-LSSVM的運輸流組合分析模型,通過CEEMDAN模型可以把原始運輸流時間序列劃分成若干個比較均勻、簡單的本征模態(tài)分量的殘余誤差序列,采用最小二乘支持向量機(jī)對重組后的序列和殘差分量進(jìn)行預(yù)測,將各LSSVM模型的預(yù)測結(jié)果相加得到最終的預(yù)測結(jié)果。張亮亮[5]等人給出了基于階段特征分析的城市快速路交通運營狀況預(yù)報方案,運用滑動變異系數(shù)的方法將道路運營狀況序列細(xì)分為幾個有不同特征的子序列,并分析了各個特征子序列的自關(guān)系,從而建立了門限自回歸的道路運營狀況多步預(yù)報模式。Guo[1]等采用動態(tài)的過程方差,生成可行的預(yù)測和估計水平間隔,運用改進(jìn)的自適應(yīng)卡爾曼濾波方法預(yù)測交通流。Lin[6]基于交通流理論,將ARIMA模型與GARCH模型相結(jié)合,得到相應(yīng)的波動特征,實現(xiàn)高速公路交通流預(yù)測。Shahriari[7]將bootstrapping抽樣方法和ARIMA結(jié)合,建立E-ARIMA交通流預(yù)測模型。
傳統(tǒng)的基于機(jī)器學(xué)習(xí)的方法利用人為的特征來捕捉交通流的特征,這不足以獲得準(zhǔn)確的預(yù)測性能。此外,早期基于神經(jīng)網(wǎng)絡(luò)的工作通常使用淺層網(wǎng)絡(luò)或只有一個隱藏層,這也無法捕捉交通流的不確定性和復(fù)雜的非線性。與傳統(tǒng)的ANN模型相比,深度學(xué)習(xí)模型使用多層架構(gòu),從大量的原始數(shù)據(jù)中自動提取固有的特征。最近,深度學(xué)習(xí)激發(fā)了交通研究的興趣。不同的深入了解模式,也被引入于交通流分析。然而,現(xiàn)有的基于深度學(xué)習(xí)模型的交通流預(yù)測工作存在以下缺點:
(1)很多作品的著眼點在于單參數(shù)的預(yù)測,比如交通量預(yù)測、交通速度預(yù)測,但往往缺乏對整體交通運行情況的控制要素的關(guān)注,使得預(yù)測結(jié)果不能完全反映出交通運行的具體情況,很難在具體的交通管理與控制中作為控制性指標(biāo)使用。
(2)目前大多數(shù)的快速路匝道控制策略研究的主要方法是人工定周期控制和自適應(yīng)控制。前者無法隨交通運行狀態(tài)的變化而進(jìn)行實時調(diào)整,后者則因為快速路交通系統(tǒng)的復(fù)雜性和模糊性而缺乏預(yù)見性,因此在國內(nèi)的推廣相對較慢。同時目前的研究缺乏對預(yù)測參數(shù)的歸類處理,也就很難開展對不同交通運行狀態(tài),如擁堵狀態(tài)、暢通狀態(tài)等的針對性交通管理與控制。本文提出的快速路交通運行狀態(tài)預(yù)測方法,可以有效解決這些問題,為快速路交通控制提供支持。
1? 基于FCM的快速路交通狀態(tài)判別
1.1? FCM算法簡介
C均值模糊聚類算法[8]由Bezdek和Castelaz于1972年提出,以同類對象相似度最大,不同類別對象相似度最小為原則,將多維數(shù)據(jù)樣本劃分為特定類數(shù)。具體方法如下:
設(shè)X={x1, x2,…, xn}為n元數(shù)據(jù)集合,xi∈Rs。FCM把X劃分為c個子集S1, S2,…,Sc,若用V={α1,…,αc}表示這c個子集的聚類中心,uij表示元素xj對Si的隸屬度,則FCM算法的優(yōu)化目標(biāo)函數(shù)為:
(1)
滿足如下約束條件:
(2)
其中,
(3)
(4)
(5)
式中U={uij}為c×n矩陣,V={α1,α2,…,αn}為c×s矩陣,xj與αi的距離為dij,本文中距離計算采用歐式距離。m為模糊指數(shù),用來控制分類矩陣U的模糊程度,其取值大于1,m越大,分類的模糊程度越高,在實際的交通運行預(yù)測應(yīng)用中m的最佳范圍為(1.5,2.5)。該算法的主過程通過不斷迭代收斂,獲取目標(biāo)函數(shù)的最小值,隸屬度值uij采用拉格朗日乘數(shù)法進(jìn)行計算。
結(jié)合式(1)~式(5),即可夠得到隸屬度矩陣U和聚類中心A以及使目標(biāo)函數(shù)最小化的迭代優(yōu)選過程。
1.2? 基于FCM交通狀態(tài)判別方法
1.2.1? 數(shù)據(jù)預(yù)處理
為增強數(shù)據(jù)處理的可信度,必須檢驗原始數(shù)據(jù)的完善與合理程度,并消除和舍棄不合理的原始數(shù)據(jù)記載。本文用三參數(shù)基本圖作為參照,依次繪就占有率—速度、占有率—交通量、速度—占有率的關(guān)系圖,對部分?jǐn)?shù)據(jù)進(jìn)行校正和剔除[9]。
1.2.2? 迭代聚類
通過式(3)、式(4)計算U(k),V(k+1),比較V(k+1)與V(k),如果滿足V(k+1)-V(k)≤?的條件,則停止迭代,得到各交通狀態(tài)的聚類中心,否則,以k=k+1繼續(xù)迭代分析。
1.2.3? 狀態(tài)判斷結(jié)果分析
在模擬數(shù)據(jù)分析中,隨機(jī)選擇了這些信息并和新的城市交通狀態(tài)聚類中心比較,以確定最有代表性的信息所對應(yīng)的新交通狀況。
狀態(tài)判別流程如圖1所示。
2? 基于深度學(xué)習(xí)的快速路交通運行狀態(tài)預(yù)測
2.1? LSTM算法簡介
長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的一個變體[10],是專為處理學(xué)習(xí)長期依賴性現(xiàn)象而設(shè)計并產(chǎn)生的,對傳統(tǒng)RNN的缺陷具有針對性,是當(dāng)前使用較為廣泛的神經(jīng)網(wǎng)絡(luò)模型,在時間序列預(yù)測、視頻信息處理、圖像處理及自然語言處理等諸多領(lǐng)域中能達(dá)到較好的應(yīng)用效果。
如圖2所示,RNN是一個循環(huán)的神經(jīng)網(wǎng)絡(luò),允許了信息的持久性。其中A被視為神經(jīng)網(wǎng)絡(luò)的一個縮影,接受某時刻的輸入Xt然后輸出對應(yīng)的結(jié)果ht,一個回路可以允許信息從一步傳遞到另一步。一個循環(huán)神經(jīng)網(wǎng)絡(luò)可以被認(rèn)為把若干個功能相同的基本單元連接起來,每一個基本單元都可以將信息傳遞到下一個基本單元。由于其獨特的時間記憶機(jī)制,參數(shù)共享并且圖靈完備,RNN可以記住輸入的有關(guān)重要信息,這使得RNN可以非常精準(zhǔn)的進(jìn)行預(yù)測。因此,人們在處理非線性的序列數(shù)據(jù)(比如時間序列數(shù)據(jù)、交通流數(shù)據(jù)、文本、金融數(shù)據(jù)、天氣等)時,常常將RNN作為首選的預(yù)測算法。
LSTM是RNN的一個分支,與RNN不同,RNN的隱藏層節(jié)點在LSTM中變成了記憶模塊。由于記憶模塊加入,LSTM具有了記憶能力,可在一定程度解決梯度消失問題及長期依賴問題。
LSTM的核心思想是其細(xì)胞狀態(tài)[11]。傳統(tǒng)的RNN會以不被控制的方法在每個時間步長里重復(fù)之前的記憶,因此信息和殘差在RNN神經(jīng)元中傳遞時會隨時間逐步損耗。因此RNN需要一定的結(jié)構(gòu)來支撐長期記憶能力,LSTM使用“細(xì)胞狀態(tài)”來刻畫神經(jīng)元記憶中不太容易衰減的部分,并圍繞細(xì)胞狀態(tài)構(gòu)造長期記憶。差異對比如圖3所示。
在圖4中,左圖為RNN的神經(jīng)元結(jié)構(gòu),右圖為LSTM的神經(jīng)元結(jié)構(gòu),LSTM中增加的部位即為細(xì)胞狀態(tài)(Cell State),我們以細(xì)胞狀態(tài)向量的形式,來儲存神經(jīng)元對之前序列的學(xué)習(xí)和記憶,細(xì)胞狀態(tài)在整個神經(jīng)網(wǎng)絡(luò)中一直延直線運行,將上個時間步的細(xì)胞狀態(tài)、當(dāng)前步的數(shù)據(jù)輸入、上一時步的隱藏狀態(tài)綜合起來,構(gòu)造出每個神經(jīng)元結(jié)構(gòu)的歷史長期記憶。
LSTM單元結(jié)構(gòu)中的輸入門、遺忘門、輸出門的計算公式為:
it=g(Wxixt+Whiht-1+hi)? ? ? ? ? ? ? ? ? ? ? ? ?(6)
ft=g(Wx? fxt+Wh? fht-1+bf)? ? ? ? ? ? ? ? ? ? ? ? (7)
Ot=g(Wxoxt+Whoht-1+bo)? ? ? ? ? ? ? ? ? ? ? ? (8)
輸入變化及狀態(tài)更新公式:
i_int=tanh(Wxcxt+Whcht-1+bc_in)? ? ? ? ? ? ? ? ? (9)
ct=ft·ct-1+it·c_int? ? ? ? ? ? ? ? ? ? ? ? (10)
ht=ot·tanh(ct)? ? ? ? ? ? ? ? ? ? ? ? ? ? (11)
2.2? 基于LSTM的快速路交通三要素短時預(yù)測流程
基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的交通運行三要素預(yù)測模型的基本步驟如下[12]:
(1)實驗數(shù)據(jù)預(yù)處理(校正、剔除)。
(2)選取訓(xùn)練集與測試集(對數(shù)據(jù)集進(jìn)行劃分)。
(3)根據(jù)預(yù)測因子和所需預(yù)測的變量確定輸入、輸出變量。
(4)確定網(wǎng)絡(luò)層數(shù)與各層神經(jīng)元數(shù)量。
(5)確定網(wǎng)絡(luò)的初始權(quán)值、隱層閥值、輸出層閥值、激勵函數(shù)、學(xué)習(xí)速率等。
(6)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型中,當(dāng)實驗誤差超過規(guī)定范圍以后或訓(xùn)練步數(shù)超過事先規(guī)定的值時終止訓(xùn)練系統(tǒng),若不滿足,進(jìn)行各網(wǎng)絡(luò)參數(shù)值的修正和調(diào)整。
(7)預(yù)測,輸入測試集數(shù)據(jù)得到網(wǎng)絡(luò)的實際輸出值。
(8)分析預(yù)測結(jié)果,得出最終最佳的預(yù)測結(jié)果。
本文快速路交通運行三要素短時預(yù)測流程如圖4所示。
3? 案例分析
3.1? 目標(biāo)道路概況
本文選擇天津市黑牛城道的通達(dá)尚城路段作為研究對象,該段道路為天津市快速環(huán)路的一部分,主路四車道,輔路兩車道。該道路作為天津市重要的東西向主干道,承擔(dān)著通道性功能,由于交通組織復(fù)雜,交通量大,同時缺乏必要的管控措施,在高峰時段常處于過飽和狀態(tài),擁堵問題嚴(yán)重。研究路段區(qū)位信息如圖5所示。道路車道渠化情況如圖6所示。
3.2? 交通調(diào)查與主要參數(shù)
本文主要通過多目標(biāo)跟蹤視覺雷達(dá)對汽車目標(biāo)路線的信息收集,該技術(shù)能夠?qū)崿F(xiàn)檢測道路的真實汽車跟蹤路徑信息,包含了汽車的時速、方位、車道號、三維位置,以及超車、變道、停車和逆行等的監(jiān)測信號,同時具有汽車流量數(shù)據(jù)、平均速度、市場占有率,以及汽車排隊時間等信息。雷達(dá)設(shè)備安置在該段快速路途中一座人行天橋上,正面面對被測道路,距離道路豎直距離大概7米。系統(tǒng)采用RS485通信模式設(shè)置,在多目標(biāo)跟蹤、觸發(fā)(單目標(biāo))和觸發(fā)(多目標(biāo))工作模式下同時發(fā)送RS485數(shù)據(jù)。該系統(tǒng)安裝后屏幕架構(gòu)如圖7所示。該多目標(biāo)雷達(dá)采集系統(tǒng)操作界面及檢測結(jié)果如圖8所示。
本文選擇的主要研究參數(shù)包括交通量、平均運行速度、占有率。同時以一些組合參數(shù)對調(diào)查時段進(jìn)行選取,包括堵塞指數(shù)(CI)、停止時間比例(PST)等。以120秒為檢測間隔,選擇早上7:00到8:30作為早高峰時段,中午11:30到13:00作為午高峰,下午5:30到7:00作為晚高峰時段,下午2:50到3:50和上午10:00到11:00作為平峰時段,進(jìn)行了斷面交通調(diào)查。各時段總體情況如表1所示。
經(jīng)過對調(diào)查數(shù)據(jù)的分析,并以后驗概率為主要衡量指標(biāo)在對原始聚類分析法中加以優(yōu)化,便可得出關(guān)于快速路交通運行狀況的原始聚類分析法中的4×3階矩陣。不同交通運行狀態(tài)的初始聚類中心如表2所示。
3.3? 交通運行狀態(tài)聚類分析
3.3.1? m值的確定
根據(jù)m值的選定的取值范圍為(1,2.5][13],采用啟發(fā)式的方法,以步長0.3在區(qū)間(1,2.5]中對進(jìn)行試取值,即m∈{1.3,1.6,1.9,2.2,2.5}。經(jīng)過不同m值的效果對比,最終選擇m=2.2。
3.3.2? 聚類類數(shù)c值的確定
在應(yīng)用算法進(jìn)行聚類分析時,需要預(yù)先給定聚類類數(shù),本文通過聚類有效性函數(shù)來確定聚類數(shù)目的取值,從而在最大程度上使聚類問題更有效。因而,對聚類分析而言,有效性問題可以轉(zhuǎn)化為最佳聚類類數(shù)的確定問題。本文采用類有效性函數(shù),確定不同聚類類數(shù)的有效性,類有效性函數(shù)如式(14)所示:
(14)
式中,n表示樣本數(shù)量,c表示類別數(shù),m表示模糊加權(quán)指數(shù),xj表示第j個樣本的值,uij表示第i個樣本對第j類的隸屬度,vi、vj表示第i類和第j類的聚類中心。
就模糊聚類的效果而言,同一類別的樣本間的相似度越大,分布越緊密,而不同類別的樣本間相似度越小,分離程度越大說明聚類效果越好。因此,式(14)中數(shù)值越大表示分類的緊密程度越高,分類分離程度越大,p的值越大就表示聚類效果越好。經(jīng)過計算,c=2,3,4,5,6,7,8,9,10時,有效性函數(shù)的函數(shù)值如表3所示。