劉 軍
(中國電建集團(tuán)北京勘測設(shè)計研究院有限公司,北京 100024)
雨天公路能見度低,駕駛員視野和視距受到影響,濕滑路面摩擦力降低,制動距有所增加,一旦遭遇突發(fā)情況,判斷、反應(yīng)和及時剎車控制能力大幅削弱,打滑、側(cè)滑甚至追尾等交通事故極易發(fā)生。傳統(tǒng)公路安全評估多以事故資料統(tǒng)計分析居多,存在事后評估不及時、預(yù)警性不足的弱點。而雨天公路安全狀態(tài)事前評估,可對雨天行車風(fēng)險進(jìn)行預(yù)判和預(yù)警,及時形成安全管控方案,做出及時有效的交通安全組織,從而降低交通事故發(fā)生率,保障高速公路雨天行車安全,減少惡劣事故帶來的人員、車輛和財產(chǎn)損失。
傳統(tǒng)車流速率預(yù)估將速率作為單一特征開展預(yù)估,換言之就是通過已有的上個時間段速率預(yù)估當(dāng)前或者未來時間段的速率。通過單一速率變量開展預(yù)估計算比較簡單,但是預(yù)估精確度有時存在不理想情況,原因是車輛速率受多種要素共同影響[1-2],如交通事故、時間段及天氣等。尤其在降水等惡劣天氣的影響下,車輛速率變化波動性相對較大,降水強(qiáng)度等特征變量均會影響車輛速率。所以,對降水天氣在高速公路出行的車輛速率開展預(yù)估時需考慮將多種影響要素作為模型輸入,以增強(qiáng)預(yù)估精確度。但是如果把采集的氣象、所有車流等數(shù)據(jù)均作為模型輸入,反而會使模型計算變得復(fù)雜,并且易出現(xiàn)明顯的過擬合現(xiàn)象,雖然在訓(xùn)練數(shù)據(jù)上能夠較好地擬合,但是測試數(shù)據(jù)上的擬合效果欠佳[3-5]。因此,需選用科學(xué)方法獲取與速率關(guān)聯(lián)性強(qiáng)的變量作為模型輸入特征,增強(qiáng)預(yù)估精確度的同時降低過擬合現(xiàn)象。
最大信息常數(shù)(以下簡稱:MIC)能夠?qū)Ψ呛瘮?shù)依托關(guān)系、非線性及變量間線性開展有效度量。速率及其影響要素間的關(guān)系不易經(jīng)過一個單獨函數(shù)開展表達(dá),一般是多種函數(shù)進(jìn)行疊加。MIC可以捕獲各個變量間的關(guān)聯(lián),不局限于單一函數(shù),所以通過MIC度量速率與其他變量關(guān)聯(lián)性,能夠有效獲取其重要特征。MIC的計算過程能夠簡述為:根據(jù)數(shù)據(jù)樣本把2個變量間的關(guān)系置于二維空間中進(jìn)行離散,并通過散點圖呈現(xiàn);對散點圖開展網(wǎng)絡(luò)劃分,依次求出各個劃分尺度下互信息最大值,并對所有劃分尺度下對應(yīng)互信息最大值開展比較,選用最大值作為MIC值?;バ畔ⅲㄒ韵潞喎Q:MI)表達(dá)2個變量共同具有的信息劑量,能夠衡量兩個變量間互相依托強(qiáng)弱程度。假設(shè)變量取值的集合V={(xi,yi),j=1,2,3,…,m},m是樣本數(shù)量,MI(X;Y)是隨機(jī)變量Y及X信息,能夠通過式(1)計算獲得。
式中:p(x,y)為x、y聯(lián)合概率密度;p(x)為量x的邊緣概率密度;p(y)為y的邊緣概率密度。
由網(wǎng)絡(luò)劃分原理以及公式(2)計算隨機(jī)變量對應(yīng)最大信息常數(shù)MIC(X:Y)。
式中:|Y|系為利用網(wǎng)絡(luò)劃分把Y值域劃分為|Y|段;|X|系為利用網(wǎng)絡(luò)劃分把變量X值域劃分為|X|段;B系為網(wǎng)絡(luò)劃分時|X|×|Y|的上限值,B(m)=m0.6功效最好。
以某公路氣象及車流數(shù)據(jù)為例,運用MIC對降水天氣下速率預(yù)估模型輸入特征開展選。其中,車流數(shù)據(jù)包含速率及車流量;氣象數(shù)據(jù)包括風(fēng)速、降水強(qiáng)度、能見度、濕度及溫度。基于MIC度量速率與其他特征變量間的關(guān)聯(lián)性,假設(shè)樣本數(shù)據(jù)對應(yīng)特征集合F={f1,f2,f3,…,fi},其中,f1~f6依次代表車流量、溫度、濕度、能見度、降水強(qiáng)度及風(fēng)速。計算任意特征fi以及速率vi對應(yīng)最大信息常數(shù)MIC(fi,vi),取值區(qū)域是[0,1]。MIC(fi,vi)越大,顯示fi與速率間的關(guān)聯(lián)性越強(qiáng),越凸顯該特征的重要性;MIC(fi,vi)越小,顯示fi與速率間的關(guān)聯(lián)性越弱,那么該特征越容易被忽略。其他變量與速率的MIC計算結(jié)果及其排序見圖1。
圖1 特征變量MIC計算成果
結(jié)果揭示,降水天氣下高速公路某時間段的能見度、降水強(qiáng)度及交通量與該時間段平均行車速率有顯著關(guān)聯(lián)性,同其他特征變量關(guān)聯(lián)性相對較弱[6]。所以模型輸入特征選取了能見度、降水強(qiáng)度及車流量。
為了實現(xiàn)LSTM神經(jīng)網(wǎng)格以及GRU神經(jīng)網(wǎng)格優(yōu)勢的綜合利用,基于LSTM 及GRU構(gòu)建預(yù)估模型,開展降水天氣影響下高速公路行車速率的預(yù)估[7]。L-G模型結(jié)構(gòu)見圖2。
圖2 L-G模型結(jié)構(gòu)
該模型由兩者深度學(xué)習(xí)結(jié)構(gòu)結(jié)合而成:第一層是LSTM層,能夠初步獲取輸入的特征信息;第二層是GRU層,能夠二次獲取上一層獲取的特征,最終通過全接連層(Dense)開展線性融合獲得預(yù)估時間段的速率預(yù)估值
L-G模型獲取的輸入變量是預(yù)估時間段t的前n個歷史時間段的特征,通過輸入矩陣可有如下表達(dá):
式中:vt-i為t-i時間段的速率;Rt-i為t-i時間段的降水強(qiáng)度;qt-i為t-i時間段的車流量;It-i為t-i時間段的能見度。
L-G模型訓(xùn)練目標(biāo)設(shè)定為實際值Vt對應(yīng)均方誤差與最小化速率預(yù)估值^vt,見公式(4)。表達(dá)L2正則化項,可降低過擬合,λ是正則化常數(shù)。w表達(dá)模型中全部權(quán)重常數(shù)。
L-G預(yù)估模型的具體過程如下所述:
(1)樣本數(shù)據(jù)選取雨天的氣象及車流數(shù)據(jù)。把輸入變量變?yōu)檫m當(dāng)格式并開展預(yù)處理,通過最大、最小標(biāo)準(zhǔn)化公式把輸入變量映射進(jìn)[0,1];
(2)確定GRISTMILL雙層深度學(xué)習(xí)相關(guān)的超參數(shù)以及神經(jīng)網(wǎng)格的結(jié)構(gòu);
(3)選用歷史訓(xùn)練數(shù)據(jù)和成果對L-G模型相關(guān)參數(shù)開展訓(xùn)練優(yōu)化,并獲得預(yù)估模型[8];
(4)通過測試數(shù)據(jù)及訓(xùn)練后的模型對降水條件下高速公路行車速率展開短時預(yù)估。
案例高速公路是連通我國南北交通網(wǎng)絡(luò)的大動脈,該線路G4段主線總長度大約294km。該路段設(shè)有交通調(diào)查設(shè)備站點總計48個,包括一類交調(diào)站點8個、二類交調(diào)站點40個;氣象檢測站點6個,包括能見度檢測站4個,多因素檢測站2個?;诎咐咚俟窔庀髾z測站數(shù)據(jù)和交調(diào)站點測量數(shù)據(jù),考慮一類交調(diào)設(shè)備多因素氣象檢測站數(shù)據(jù)豐富、數(shù)據(jù)準(zhǔn)確性及完整性高等要素,選含一類交調(diào)站點及相對接近多因素氣象檢測站的代表性區(qū)段K1196+490m至K1198+400m作為降雨條件下高速公路行車安全評估及預(yù)警的分析對象。
案例路段包含121、122號車流測量器的區(qū)段(K1196+490m至K1198+400m),該車流測量器可測量不同種類車輛截面瞬時速率及車流量;多因素氣象檢測站(設(shè)備ID=38)能夠檢測風(fēng)速、能見度、降水量、濕度、溫度等氣象參數(shù)。以2017年4月至2018年7月獲得的車流和氣象歷史數(shù)據(jù)為支撐,對區(qū)段在降水條件下(2018年7月6日9:00至7月7日9:30)的高速公路行車安全情況開展事前評估和預(yù)警管理。
3.1.1 描述數(shù)據(jù)樣本
數(shù)據(jù)樣本來源是2017年4月24日至2018年7月7日案例區(qū)段121、122號微波測量數(shù)據(jù)及氣象檢測數(shù)據(jù)。其中,車流數(shù)記錄間隔是5min,氣象數(shù)記錄間隔是1min。為防止基于短時速率預(yù)估所得安全評估結(jié)果時效性較短,對車流數(shù)據(jù)和原始?xì)庀髷?shù)據(jù)開展匯聚,調(diào)整數(shù)據(jù)記錄間隔是15min。
通過L-G預(yù)估模型依次對121截面、122截面的貨車及客車速率開展短時預(yù)估。篩選2017年4月24日至2018年7月5日該區(qū)段上行方向降水強(qiáng)度高出0的所有數(shù)據(jù)當(dāng)作訓(xùn)練數(shù)據(jù),總計37837條數(shù)據(jù)。選取2018年7月6日9:00至7月7日9:30連續(xù)降水天氣的數(shù)據(jù)當(dāng)作測試數(shù)據(jù),總計99條。
3.1.2 L-G模型設(shè)置
根據(jù)前述輸入特征選結(jié)果,把預(yù)估時間段前n個歷史時間段的能見度I、降水強(qiáng)度R、交通量q及速率v作為模型輸入變量,n是待定參數(shù),表達(dá)時間窗長度,該參數(shù)影響模型預(yù)估精確度,將經(jīng)過靈敏度分析并選取最優(yōu)值。
以PC為試驗平臺,基于Python語言和Keras深度學(xué)習(xí)框架進(jìn)行構(gòu)建模型。L-G模型的部分超參數(shù)及優(yōu)化算法設(shè)置如下:模型選用基于隨機(jī)梯度降低算法的Adam優(yōu)化器;訓(xùn)練迭代頻次(epoch)設(shè)置為200;批大?。╞atchsize)是32;為了降低過擬合,將Dropout設(shè)置為0.5。隱藏層節(jié)點數(shù)是待定參數(shù)u,將經(jīng)過靈敏度分析選取最優(yōu)值。
3.1.3 分析待定參數(shù)靈敏度
針對待定參數(shù)u及n開展靈敏度分析過程中,為掌握L-G模型的預(yù)估功效,選均方根誤差(以下簡稱:RMSE)、絕對百分誤差方差(以下簡稱:VAPE)及平均絕對誤差(以下簡稱:MAE)作為模型功效評價指標(biāo)。VAPE能夠?qū)λ惴ǚ€(wěn)定性進(jìn)行評價,MAE及RMSE能夠?qū)δP皖A(yù)估精確度進(jìn)行評價,計算公式如下:
在隱藏層節(jié)點u及不同時間窗長度n取值組合情況下,L-G模型預(yù)估結(jié)果的RMSE和VAPE變化見圖3。根據(jù)圖3(a)發(fā)現(xiàn)時間窗長度的同時,伴隨隱藏層節(jié)點增加RMSE對應(yīng)變化趨勢大體是:先加大后減小再加大。如果時間窗長度n=5,隱藏層節(jié)點u=64,此時預(yù)估結(jié)果RMSE有最小值,對應(yīng)模型預(yù)估精確度最高。根據(jù)圖3(b)能夠發(fā)現(xiàn),VAPE變化區(qū)域在5.5%~6.2%,顯示時間窗長度變化及隱藏層節(jié)點數(shù)量對L-G預(yù)估模型穩(wěn)定性的影響相對較小。如果時間窗長度n=5,隱藏層節(jié)點u=64,此時預(yù)估結(jié)果VAPE有最小值,對應(yīng)模型預(yù)估穩(wěn)定性最佳。綜上所述,通過L-G模型開展速率短時預(yù)估時,時間窗長度及隱藏層節(jié)點數(shù)的最佳參數(shù)組合是u=64,n=5。
圖3 L-G模型RMSE和VAPE變化
通過L-G模型依次對2018年7月6日9:00至7月7日9:30各時間段121截面及122截面的客貨車平均速率開展預(yù)估。依次對不同預(yù)估模型的預(yù)估結(jié)果和輸入特征選前后的模型預(yù)估結(jié)果開展比對及分析結(jié)果(見圖4~7)。由圖4~7揭示,在降水條件下的高速公路行駛時,貨車和客車速率均十分不穩(wěn)定,不同時間段速率變化和差異相對比較大,重點是受降水強(qiáng)度等天氣變化的影響[9]。根據(jù)圖中實際值及預(yù)估值對應(yīng)變化曲線能夠發(fā)現(xiàn),預(yù)估曲線對應(yīng)變化趨勢同實際值曲線幾乎始終保持一致,但是在速率實際值出現(xiàn)突變或者比較大波動的時間段,實際值與預(yù)估值誤差相對比較大,其他時間段預(yù)估誤差比較小。
圖4 斷面121客車速率預(yù)估與實際結(jié)果對比
為進(jìn)一步驗證基于MIC輸入特征選方法切實可行,通過所有特征變量(能見度、降水強(qiáng)度、溫度、風(fēng)速、濕度、車流量及速率)訓(xùn)練L-G模型并開展預(yù)估,然后同特征選后的L-G模型預(yù)估功效開展比對,如表1所示。
圖5 斷面121貨車速率預(yù)估與實際結(jié)果對比
圖6 斷面122客車速率預(yù)估與實際結(jié)果對比
圖7 斷面122貨車速率預(yù)估與實際結(jié)果對比
表1 特征選前后L-G模型預(yù)估功效對比
根據(jù)表1數(shù)據(jù)能夠發(fā)現(xiàn),特征選對訓(xùn)練誤差影響相對較小,無論特征選是否開展,模型訓(xùn)練數(shù)據(jù)集對應(yīng)的MAPE及RMSE均很小。而L-G模型將所有特征當(dāng)作輸入變量,對應(yīng)測試數(shù)據(jù)集的MAPE及RMSE分別為13.80%及12.03km/h,相比于訓(xùn)練誤差依次增加了11.42%及9.15km/h,由于存在非常明顯的過擬合情況,也就是在測試數(shù)據(jù)上擬合功效不佳,訓(xùn)練數(shù)據(jù)上卻擬合功效較好。針對特征選后的L-G模型,測試數(shù)據(jù)集的MAPE及RMSE依次是6.11%及6.60km/h,相比于特征選前,MAPE及RMSE依次減少了55.72%及45.14km/h,模型預(yù)估精確度有較大提升,與此同時,亦有效地減輕了過擬合現(xiàn)象。
本研究以案例路段(K1196+490m至K1190+400m)氣象數(shù)據(jù)及車流為依據(jù),對區(qū)段2018年7月6日9:00至7月7日9:30(降水天氣)開展預(yù)警管理及事前安全評估。通過運用L-G預(yù)估模型依次對區(qū)段121、122截面的客貨車速率開展預(yù)估,并進(jìn)一步分析驗證了降雨條件下基于速率預(yù)估的高速公路行車安全評估以及預(yù)警管理方法的可行性[10],有助于在雨天開展高速公路預(yù)警管理和安全評估工作。