李 萌 谷遠利 王 碩 陸文琦 張 源
(北京交通大學城市交通復雜系統(tǒng)理論與技術(shù)教育部重點實驗室 北京 100044)
路段行程時間作為描述交通狀態(tài)和進行交通控制的重要參數(shù),其獲取和預測是先進高速公路出行信息系統(tǒng)中不可或缺的部分。降雨等惡劣天氣會嚴重影響車輛平均運行速度、導致通行能力下降,致使出行者行程時間波動性和不確定性增加,因此,準確預測降雨條件下高速公路行程時間變得更加困難,卻也更加重要。
近年來行程時間預測方法研究多基于統(tǒng)計模型和人工智能方法:劉江用等[1]基于RBF神經(jīng)網(wǎng)絡模型對城市道路路段行程時間進行預測,輸入變量中考慮天氣因素,將天氣情況分為晴、多云等8類,采用不同的區(qū)別參數(shù)進行處理。孫娟等[2]應用支持向量機模型預測快速路行程時間,并以遺傳算法優(yōu)化模型參數(shù),文中指出天氣狀況對行車效率影響很大,但僅針對天氣良好下的情況進行了行程時間預測。Zeng Xiaosi等[3]考慮時空關(guān)聯(lián)性,并提出一種改進的遞歸神經(jīng)網(wǎng)絡模型—時間延遲空間狀態(tài)神經(jīng)網(wǎng)絡模型(TDSSNN),對高速公路行程時間進行預測。Fei Xiang等[4]提出一種基于動態(tài)線性模型(DLM)和隱馬爾可夫模型(HMM)的組合預測模型,計算交通流堵塞的概率,從而預測行程時間的波動性。王翔等[5]提出一種基于歷史數(shù)據(jù)集分類的KNN改進算法,進行短時行程時間預測。丁宏飛等[6]提出一種基于BP神經(jīng)網(wǎng)絡和SVM的組合預測模型。
在研究范圍方面,對于降雨等惡劣天氣的交通流特性和行車安全方面研究較多[6-8],而針對惡劣天氣下的行程時間預測研究較少,歷史文獻中存在預測行程時間時考慮天氣因素,但僅將天氣情況進行簡單分類。為彌補該缺陷,筆者針對降雨天氣,考慮將降雨條件作為重要影響因素之一,將降雨量和能見度測量值作為輸入變量進行預測。在預測方法上,組合預測方法的應用研究逐漸增多[9-11],設計完善的組合預測方法可以避免單一研究方法的局限性,有效提升預測精度,因此,選取在預測方面應用較多且表現(xiàn)優(yōu)異的人工智能算法(RBF神經(jīng)網(wǎng)絡)和非參數(shù)回歸算法(KNN)進行融合,定義動態(tài)誤差,并依據(jù)動態(tài)誤差計算動態(tài)融合權(quán)重,該組合預測模型能有效結(jié)合RBF神經(jīng)網(wǎng)絡和KNN算法各自的優(yōu)勢,提升預測精度。
數(shù)據(jù)來源為高速公路微波交通檢測數(shù)據(jù),可采集流量、速度等交通流參數(shù)信息,但無法直接獲取路段行程時間數(shù)據(jù),因此,需基于采集的交通流數(shù)據(jù)進行路段行程時間估計。
基于固定檢測器的行程時間估計方法可分為直接替代法和相關(guān)分析法[12]。考慮直接替代方法簡單及邏輯清晰的優(yōu)點[13],故采用直接替代法進行行程時間估計。直接替代法中,最常用的2種方法為半距離法和線性插值法[14-15]??紤]到線性插值法需假設速度在空間中為線性變化,即從路段起點到路段終點速度逐漸變大或變小,而實際速度是隨機變化,將影響線性插值法的估計精度[16],故采用半距離法進行行程時間估計。
半距離法是基于固定檢測器采集的速度進行計算,具體計算方法如下。
1) 將研究路段劃分為N個以固定檢測器安裝間隔為長度的路段,劃分路段i的長度為li。
2) 將每個劃分路段上、下游斷面檢測速度的調(diào)和平均值作為該路段空間平均速度的替代值,進而計算得出每個劃分路段的行程時間。路段i在第k時段的行程時間計算為
(1)
式中:t(i,k)為k時間段內(nèi)劃分路段i的行程時間估計值;v(i,k)為k時間段內(nèi)在劃分路段i上游斷面采集的平均速度;同理,v(i+1,k)為k時間段內(nèi)在劃分路段i下游斷面采集的平均速度。
3) 將各劃分路段的行程時間累加,得到研究路段k時段內(nèi)的行程時間Tk。
(2)
將上述方法計算所得的行程時間估計值作為實際值應用于后續(xù)預測研究中。
組合預測模型將遺傳算法優(yōu)化的RBF神經(jīng)網(wǎng)絡模型和KNN算法2種基本預測方法進行融合,并定義動態(tài)誤差,引入隨子模型預測動態(tài)誤差變化而變化的動態(tài)權(quán)重。與傳統(tǒng)的確定方法相比,如調(diào)查法、統(tǒng)計分析方法、單因素分析方法等,給每個因素的權(quán)重是固定不變的,但在實際預測過程中,預測的精度并不是一直保持穩(wěn)定[9]。故采用可依據(jù)動態(tài)誤差實時調(diào)整的動態(tài)融合權(quán)重,保證子模型中精度較高的預測結(jié)果對最終的預測結(jié)果有相對較大的影響程度,從而提高組合模型預測精度。
2.1.1 RBF神經(jīng)網(wǎng)絡模型
RBF神經(jīng)網(wǎng)絡是一種單隱層前饋神經(jīng)網(wǎng)絡,它使用徑向基函數(shù)作為隱層神經(jīng)元激活函數(shù),而輸出層則是對隱層神經(jīng)元輸出的線性組合[17]。假定輸入d維向量x,輸出實值,則RBF網(wǎng)絡可表示為
(3)
(4)
式中:q為隱層神經(jīng)元個數(shù),根據(jù)具體研究問題在網(wǎng)絡訓練階段自適應調(diào)整;wi為第i個隱層神經(jīng)元所對應權(quán)重;ρ(x,ci)是徑向基函數(shù),ci為與x同維的向量,是第i個隱層神經(jīng)元所對應的中心;σi為徑向基函數(shù)的擴展常數(shù),表示第i個基函數(shù)圍繞中心點的寬度。
RBF神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu)見圖1。RBF網(wǎng)絡具有自學習、自組織、自適應功能,對非線性連續(xù)函數(shù)具有一致逼近性,學習速度快。為改善神經(jīng)網(wǎng)絡易陷入局部極小值的問題,采用遺傳算法訓練RBF網(wǎng)絡以逼近全局最小值。
圖1 RBF神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu)示意圖Fig.1 RBF neural network topology
2.1.2 KNN算法
KNN算法是基于實例學習的非參數(shù)回歸預測法,搜索歷史數(shù)據(jù)庫中與預測值特征向量最相似的K個樣本,將選取的K個歷史值進行加權(quán)估計,得到預測值。采用距離度量的方式判斷歷史數(shù)據(jù)與預測值特征向量的近似程度,一般選取歐氏距離作為距離度量指標。假定xp為預測值yp的特征向量(假定為n維),通過KNN算法搜尋的特征向量xm(m=1,2,…,K)對應的歷史值為ym,則有
(5)
(6)
(7)
KNN算法具有結(jié)構(gòu)簡單、不要求數(shù)據(jù)的一致性,即不易受噪音干擾、精度高的特點,適合預測行程時間在時間軸上的非線性變化。
影響車輛路段行程時間的因素很多,筆者研究降雨條件下行程時間預測,天氣狀況是必要的考慮因素,除此之外,行程時間還受到交通流條件的影響。
Tk=f(Tk-1,Tk-2,…,Tk-n,Qk-1,Rk-1,Vk-1)
(8)
式中:Tk為預測時段的行程時間平均值;Tk-1,Tk-2,…,Tk-n為前n個時段中每個時段的行程時間平均值,Qk-1為上一時段交通流量;Rk-1為上一時段降雨量實測值;Vk-1為上一時段能見度實測值。
取n=3,將微波檢測器獲取的前3個時段行程時間、上一時段交通流量以及氣象監(jiān)測站獲取的上一時段的降雨量和能見度數(shù)據(jù)進行處理,作為預測模型的輸入變量。
RBF-KNN組合預測模型框架見圖2。
組合預測模型具體構(gòu)建過程如下。
步驟1。利用遺傳算法訓練RBF神經(jīng)網(wǎng)絡,得到網(wǎng)絡參數(shù)最優(yōu)初值c0,σ0和ω0。
步驟3。利用交叉驗證的方法標定KNN算法中的K值。
1) 假定K值的取值范圍K∈(Kmin,Kmax),將歷史數(shù)據(jù)集D劃分為N個大小相似且互斥的子集,即D=D1∪D2∪…∪DN,Di∩Dj=?(i≠j)。
2) 對于K=K0,K0∈(Kmin,Kmax),依次選取1個子集作為測試集,余下的N-1個子集作為訓練集,進行N次訓練和測試。
計算測試集Di中測試樣本相對誤差均值E(K0,Di)為
(9)
式中:h為測試集Di中的樣本數(shù)量,Ar為第r條測試樣本行程時間的真實值;Pr為第r條測試樣本數(shù)據(jù)采用KNN算法計算出的行程時間預測值。
計算N個測試集的誤差均值為
圖2 RBF-KNN組合預測模型框架Fig.2 RBF-KNN combination forecasting model framework
(10)
步驟5。子模型預測結(jié)果融合。
1) 定義當前時段的動態(tài)誤差為其前n段(取n=5)預測誤差的平均值,特別的,當預測時段1 ed,i(k)= (11) 式中:i=1,2分別為RBF網(wǎng)絡模型和KNN預測算法,es,i(k-1)為預測方法i預測k-1時段結(jié)果的相對誤差絕對值。 (12) 2) 依據(jù)子模型預測方法的不同動態(tài)誤差值分配其在k時段的融合權(quán)重,運用反比例法,即融合初始權(quán)重與動態(tài)誤差呈反比例關(guān)系,動態(tài)誤差越大,融合權(quán)重越小,特別的,在預測的第一時段無法獲取動態(tài)誤差值,故2種子模型的融合權(quán)重均為0.5,動態(tài)融合權(quán)重計算公式為 (13) (14) (15) 數(shù)據(jù)來源為京港澳高速公路(G4)湖北軍山—武漢南12.64 km路段的交通檢測器和氣象監(jiān)測站的歷史數(shù)據(jù),其中,交通檢測器原始數(shù)據(jù)以5 min為記錄單位,包含雙向分車型的流量、速度數(shù)據(jù);氣象原始數(shù)據(jù)以1 min為記錄單位,包含溫度、濕度、風速、能見度、降雨量等數(shù)據(jù)。采用的數(shù)據(jù)樣本間隔為5 min,故將氣象檢測原始數(shù)據(jù)由1 min間隔匯聚為5 min,且按時間將交通與氣象數(shù)據(jù)進行匹配。 選取該路段2013年1—3月上行方向降雨量大于零的4 509條數(shù)據(jù)作為訓練數(shù)據(jù),預測3月25日降雨天氣下15:00—23:30的行程時間。不同車型按照表1的系數(shù)進行折算,最終預測值為不同車型的行程時間平均值。 表1 不同車型折算系數(shù) 3.2.1 不同時段下行程時間的變化 不同時段下車輛行程時間會表現(xiàn)出不同的特性,見圖3。有無降雨條件下行程時間變化趨勢大致相同,但降雨條件下行程時間明顯高于無降雨。分析行程時間變化趨勢,白天與夜晚的車輛行程時間具有一定差異性。6:00—21:00行程時間較小,21:00—6:00行程時間較大。 圖3 不同時段行程時間變化曲線Fig.3 Curve of travel time in different periods 3.2.2 不同降雨強度下行程時間的變化 對歷史數(shù)據(jù)進行統(tǒng)計分析,計算出無雨、小雨、中雨和大雨條件下車輛在軍山—武漢南路段的平均行程時間,見圖4,行程時間隨著降雨強度的加強而增加,與無降雨條件下相比,分別增加了3.9%,9.8%和19.6%,且增加的速度也隨著降雨強度的加強而增大。表2為降雨強度劃分標準[18]。 3.3.1 數(shù)設定 使用Matlab遺傳算法工具箱(GATBX)優(yōu)化RBF網(wǎng)絡,設置種群大小為40,進化代數(shù)為200,代溝為0.9,選擇算法為隨機遍歷抽樣法,采用單點交叉,交叉概率0.7,變異概率0.1。優(yōu)化結(jié)果如圖5所示。應用十折交叉驗證法標定KNN算法中的K值,如圖6所示,測試誤差隨著K值的增大而減小,隨后趨于穩(wěn)定,然后誤差隨著K值的增大而增大。K=19時,測試誤差最小。 圖4 不同降雨強度下行程時間變化曲線Fig.4 Curve of travel time under different rainfall intensity 表2 降雨強度劃分標準 圖5 遺傳算法優(yōu)化RBF網(wǎng)絡累積誤差變化曲線Fig.5 Curve of accumulated error of RBF networkoptimized by genetic algorithm 圖6 交叉驗證法測試誤差隨K值變化曲線Fig.6 Curve of test error with K valuefor cross-validation 3.3.2 測結(jié)果分析 分別采用組合預測模型、RBF神經(jīng)網(wǎng)絡和KNN算法對3月25日15:00—23:30的行程時間進行預測。該時段隨著時間的推移降雨量由7.2 mm/h增大至20.6 mm/h,持續(xù)一段時間后又減小至13.1 mm/h,降雨強度是由中雨-暴雨-大雨的變化。選擇平均絕對誤差(mean absolute error, MAE)、均方根誤差(root mean squared error, RMSE)和平均絕對百分誤差(mean absolute percent error, MAPE)作為評價預測精度指標。3種方法的預測結(jié)果見圖7,誤差指標值見表3。 分析圖6和表3。 1) 觀察各項指標,組合預測模型的預測精度顯著優(yōu)于另外2種預測方法,證明了提出的組合預測模型具有更好的適應性。對于預測準確性,3種預測方法平均絕對百分誤差小于5%,均滿足預測精度要求,體現(xiàn)了人工智能算法和非參數(shù)回歸方法的優(yōu)越性。 圖7 降雨條件下行程時間預測結(jié)果比較Fig.7 Comparison of travel time forecastresults under rainfall conditions 表3 網(wǎng)絡預測性能評價 2) 降雨條件下行程時間波動性大,很難精確預測。組合預測模型能夠有效預測行程時間高峰變化,反應及時,具有較高的擬合程度。而RBF神經(jīng)網(wǎng)絡預測見圖7(b),RBF神經(jīng)網(wǎng)絡模型預測行程時間與實際值擬合度較低,與實際情況相比稍有一些滯后,反應及時性差;KNN算法預測見圖7(c),在15:00—19:30時間段內(nèi),KNN算法預測效果較好,20:00時左右,由于車流量增大且降雨強度增強,KNN算法難以準確預測行程時間高峰,預測精度降低。組合預測模型有效結(jié)合了RBF神經(jīng)網(wǎng)絡和KNN算法的優(yōu)勢,同時避免了它們在預測時的缺陷,使預測精度和擬合程度均達到較好的效果。 1) 提出基于遺傳算法優(yōu)化的RBF神經(jīng)網(wǎng)絡和KNN算法的組合預測模型,子模型融合權(quán)重是隨動態(tài)誤差變化而實時變化的。對降雨天氣下高速公路路段行程時間進行短時預測,預測結(jié)果可為出行者提供交通信息服務,為管理者提供交通誘導和決策支持,以減輕惡劣天氣給高速公路運輸系統(tǒng)帶來的不利影響。 2) 通過對京港澳高速公路湖北軍山—武漢南路段交通和氣象數(shù)據(jù)進行統(tǒng)計分析,得出行程時間隨降雨強度的加強而增大,且增長速度也隨著降雨強度的加強而增大的結(jié)論。掌握降雨條件下行程時間特性規(guī)律對于惡劣天氣下的交通誘導具有參考意義。 3) 交通檢測器無法直接獲取路段行程時間數(shù)據(jù),故采用半距離法進行行程時間估計,并以估計值作為行程時間預測的真實值。該方法計算簡單邏輯清楚,其他行程時間估計方法如:相關(guān)分析法、行程-時間域法等可能具有更高精確度,擬在后續(xù)研究中對此加以改進。3 實例分析
3.1 數(shù)據(jù)準備
3.2 降雨條件下行程時間特性分析
3.3 預測結(jié)果分析
4 結(jié) 論