李根,翟偉,朱興貝,楊晟,鄔嵐
(南京林業(yè)大學(xué),汽車與交通工程學(xué)院,南京210037)
交織區(qū)是高速公路主要的瓶頸路段,而大量的匯合行為是引發(fā)交通流紊亂、造成通行能力下降的主要原因之一。研究高速公路交織區(qū)匯合行為并構(gòu)建準(zhǔn)確的匯合模型,不僅能夠提升微觀交通仿真模型的精度,更能夠?yàn)檩o助駕駛技術(shù)和自動(dòng)駕駛技術(shù)提供理論支撐。
匯合決策模型由Gipps 提出,該模型是一種基于規(guī)則的模型,結(jié)構(gòu)簡(jiǎn)單、易于應(yīng)用,被廣泛引用于微觀交通流仿真軟件中,但該模型假設(shè)條件較多,與實(shí)際駕駛行為差異較大[1]。此后國(guó)內(nèi)外學(xué)者采用效用理論[2]、元胞自動(dòng)機(jī)[3]、馬爾可夫[4]、模糊邏輯[5]等理論對(duì)匯合決策行為進(jìn)行分析和建模。近幾年,不少學(xué)者將機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法應(yīng)用于匯合行為研究中。Xie 等[6]使用深度信念網(wǎng)絡(luò)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)建立基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)換道決策模型;楊達(dá)等[7]結(jié)合社會(huì)力跟馳模型與換道模型建立駕駛員主動(dòng)換道決策行為模型;谷新平等[8]基于貝葉斯優(yōu)化算法的支持向量機(jī)建立換道決策行為模型。但這些研究都是將匯合行為視為一個(gè)瞬時(shí)決策事件,忽略了長(zhǎng)達(dá)數(shù)秒的車輛匯合過(guò)程。Charisma等[9]開發(fā)了從入口匝道合并的加速?zèng)Q策組合模型,考慮合并計(jì)劃選擇、間隙接受、目標(biāo)間隙選擇對(duì)車道變換的影響。Zheng等[10]考慮駕駛員反應(yīng)時(shí)間和最小間距的變化,分析車道變換對(duì)駕駛員行為自身的影響,雖然研究本身考慮了反應(yīng)時(shí)間作為研究參量,但并沒有考慮車道變換對(duì)周圍車輛的影響,忽略了匯合決策的過(guò)程是復(fù)雜多變的;孫劍等[11]利用分類回歸樹建立匯合決策模型,考慮不同匯合行為對(duì)匯合過(guò)程的影響。鄧建華等[12]利用改進(jìn)雙車道元胞自動(dòng)機(jī)的換道規(guī)則模型,考慮不同空間占有率下不同車道分隔方式對(duì)換道行為的影響。但以上研究均未考慮匯合車輛與周圍車輛的碰撞風(fēng)險(xiǎn),特別是側(cè)向碰撞風(fēng)險(xiǎn)對(duì)匯合行為的影響。同時(shí),神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法能夠有效提高匯合模型精度,但其“黑箱”特性令研究者無(wú)法研究其行為機(jī)理;分類回歸樹盡管能夠得到匯合行為規(guī)則,但容易受到數(shù)據(jù)微小波動(dòng)的影響,從而導(dǎo)致過(guò)擬合現(xiàn)象。
梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)是一種基于分類回歸樹的集成算法,通過(guò)懲罰系數(shù)等參數(shù)的設(shè)置能夠有效防止模型過(guò)擬合,同時(shí)GBDT繼承了分類回歸樹挖掘數(shù)據(jù)內(nèi)部機(jī)理的特性,能夠深入挖掘數(shù)據(jù)的內(nèi)部機(jī)理。以往的研究表明GBDT 應(yīng)用于匯合決策行為研究能夠取得良好的效果[13]。因此,本文采用GBDT的方法對(duì)高速公路交織區(qū)匯合車輛的加速度進(jìn)行研究,深入挖掘各解釋變量與匯合加速度之間的潛在非線性關(guān)系,同時(shí)本文引入橫向碰撞時(shí)間指標(biāo)分析側(cè)向碰撞事故風(fēng)險(xiǎn)對(duì)匯合行為的影響。
梯度提升決策樹(GBDT)是一種基于樹的集成學(xué)習(xí)技術(shù),主要采用集成學(xué)習(xí)boosting 的基本思想,通過(guò)迭代一系列可疊加的回歸決策樹模型,在迭代過(guò)程中不斷對(duì)模型進(jìn)行優(yōu)化和提升,最終形成一個(gè)集成模型。GBDT 在每次迭代時(shí)通過(guò)最小化損失函數(shù)來(lái)逼近真實(shí)值,最后將每次迭代建立的決策樹所得結(jié)論累加起來(lái)得到最終的預(yù)測(cè)結(jié)果。
如圖1所示,給定具有N個(gè)訓(xùn)練樣本的數(shù)據(jù)集,其中,xi為訓(xùn)練樣本的輸入變量,yi為訓(xùn)練樣本的目標(biāo)變量,hm為目標(biāo)變量的基函數(shù),ρm為最佳下降梯度步長(zhǎng),m為第M個(gè)決策樹。GBDT 的目標(biāo)是讓輸入變量xi映射到目標(biāo)變量yi的損失函數(shù)最小,即
圖1 GBDT集成學(xué)習(xí)流程圖Fig.1 GBDT integrated learning flow chart
式中:δ為Huber-M 損失函數(shù)的一個(gè)參數(shù)。當(dāng)δ~0時(shí),Huber 損失會(huì)趨向于均方誤差(MSE);當(dāng)δ~∞時(shí),Huber 損失會(huì)趨向于平均絕對(duì)偏差(MAD)。為了有效估計(jì)參數(shù),采用梯度增強(qiáng)的方法,計(jì)算每棵樹的負(fù)梯度值,即
利用每棵樹的負(fù)梯度值作為訓(xùn)練數(shù)據(jù)進(jìn)行回歸擬合,將訓(xùn)練好的M-1 棵樹的預(yù)測(cè)結(jié)果與第1顆樹進(jìn)行疊加,即
式中:η為學(xué)習(xí)率;γJM為第M棵樹第J個(gè)葉子節(jié)點(diǎn)的值;nodes per tree(·)為每棵決策樹的結(jié)點(diǎn);N為訓(xùn)練樣本數(shù)量。
最后,通過(guò)均方誤差(MSE)、平均絕對(duì)偏差(MAD)和R值作為模型性能的評(píng)價(jià)指標(biāo),定義為
交織區(qū)指行駛方向相同的兩股或多股交通流在沒有交通控制設(shè)施的情況下,沿著相當(dāng)長(zhǎng)的路段進(jìn)行交叉。根據(jù)道路結(jié)構(gòu)和交叉形式,交織區(qū)一般可以分為A、B、C 這3 種類型。本文主要研究的是A型交織區(qū)路段的匯合行為,采用的數(shù)據(jù)集為美國(guó)聯(lián)邦公路局提供的Next Generation Simulation(NGSIM)數(shù)據(jù)。本文選取高速公路US-101 路段上采集的匯合車輛軌跡,該路段全長(zhǎng)640 m,包含5條目標(biāo)車道,1 條輔道以及兩個(gè)匝道出入口。本文研究?jī)蓚€(gè)匝道之間的交織區(qū),如圖2所示,該數(shù)據(jù)集采集于2005年6月15日7:50-8:35,包括車輛的加速度、速度、位置、車型、車頭間距、車頭時(shí)距等參量,時(shí)間精度為0.1 s·frame-1,原始數(shù)據(jù)集每0.1 s提供一個(gè)數(shù)據(jù)樣本,本文采用對(duì)稱指數(shù)移動(dòng)平均濾波器(sEMA)對(duì)車輛的加速度和速度進(jìn)行處理,即每1 s 對(duì)這些數(shù)據(jù)樣本進(jìn)行算術(shù)平均,以消除檢測(cè)誤差[14]。
如圖2所示,影響交通流匯合加速度的因素主要有匯合車輛與周圍車輛的速度差與距離差,然而匯合過(guò)程中匯合車輛難免會(huì)和周圍車輛產(chǎn)生交通事故,尤其受到與目標(biāo)車道領(lǐng)車的影響最大,因此猜想?yún)R合車輛在匯合過(guò)程中與目標(biāo)車道前車是否會(huì)發(fā)生側(cè)向碰撞風(fēng)險(xiǎn),在此考慮將匯合車輛與目標(biāo)車道前車右車身線的碰撞時(shí)間作為影響因素引入模型中,如圖3所示。
圖2 US-101路段以及匯合過(guò)程車輛布局Fig.2 US-101 section and vehicle layout in merging process
圖3 影響變量參數(shù)確定Fig.3 Affect variable parameter determination
式中:TC為匯合車輛與目標(biāo)車道前車右車身線的碰撞時(shí)間;ΔX為橫向距離差;Vx為匯合車輛的橫向速度;Ax為匯合車輛當(dāng)前時(shí)刻的加速度。
在匯合過(guò)程中,匯合車輛的加速度一般會(huì)受到目標(biāo)車道和輔道車輛的影響,匯合車輛會(huì)根據(jù)周圍車輛和自身的相對(duì)速度和相對(duì)距離對(duì)駕駛速度進(jìn)行調(diào)整。根據(jù)文獻(xiàn)[14-15],本文將駕駛員反應(yīng)時(shí)間定為1 s。表1 為所選取的影響變量的描述以及當(dāng)前時(shí)刻影響變量和1 s后匯合加速度之間的相關(guān)性系數(shù),可以發(fā)現(xiàn),所有影響變量與匯合加速度都存在顯著的相關(guān)性。
表1 匯合加速度與各變量之間的相關(guān)性系數(shù)Table 1 Correlation coefficient between merging acceleration and variables
本文采用美國(guó)Salford 公司開發(fā)的數(shù)據(jù)挖掘軟件Salford Predictive Modeler(SPM)建立GBDT 模型,GBDT 模型通過(guò)添加決策樹實(shí)現(xiàn)減少訓(xùn)練誤差,這將會(huì)導(dǎo)致模型過(guò)于接近訓(xùn)練樣本數(shù)據(jù),出現(xiàn)過(guò)擬合現(xiàn)象,為了降低過(guò)擬合現(xiàn)象,需選擇最優(yōu)的決策樹數(shù)目,同時(shí),在每一次迭代過(guò)程中,需訓(xùn)練一個(gè)弱決策樹來(lái)改進(jìn)模型,通過(guò)隨機(jī)采樣獲得新的訓(xùn)練數(shù)據(jù)集和新的特征向量,利用新的訓(xùn)練數(shù)據(jù)集和新的特征向量進(jìn)行擬合。因此,在構(gòu)建GBDT模型時(shí),所有決策樹都將被限制為生長(zhǎng)到相同大小,GBDT 模型的表現(xiàn)是由學(xué)習(xí)率η,屬性采樣數(shù)Sa,二次抽樣Sfrd,樹的復(fù)雜度J以及決策樹數(shù)目M這5 個(gè)參數(shù)決定。為了防止過(guò)擬合現(xiàn)象,需選擇最佳參數(shù)組合,本文采用五重交叉驗(yàn)證,選取NGSIM中的車輛軌跡數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,將高速公路US101路段上的車輛軌跡數(shù)據(jù)劃分成5個(gè)相等的子集,每個(gè)子集被用作測(cè)試數(shù)據(jù),剩余子集用于訓(xùn)練模型,將學(xué)習(xí)率設(shè)定為Auto模式,η會(huì)根據(jù)樣本數(shù)量隨機(jī)定義,取值在[0.00,0.05]可以保證擬合的最佳效果;Sa會(huì)根據(jù)隨機(jī)采樣獲得新的數(shù)據(jù)集,Sfrd會(huì)根據(jù)隨機(jī)采樣獲得新的特征向量,新樹會(huì)根據(jù)新的數(shù)據(jù)集和新的特征向量進(jìn)行擬合,本文將其值分別設(shè)定為7 和0.6;SPM 軟件可以根據(jù)目標(biāo)函數(shù)自動(dòng)確定決策樹數(shù)目M,從而確定取值設(shè)置在5000;樹的復(fù)雜度J選擇均方誤差(MSE)、平均絕對(duì)偏差(MAD)和R2作為評(píng)價(jià)標(biāo)準(zhǔn)。如表2所示,樹的復(fù)雜度反映影響變量之間未知的交互作用,樹的復(fù)雜度越高,影響變量之間的交互作用就會(huì)越高,同時(shí)不僅會(huì)降低計(jì)算速度,還會(huì)降低模型的泛化能力,根據(jù)以往的研究,本文將樹的復(fù)雜度設(shè)置在10以內(nèi)。
表2 樹復(fù)雜度的確定
Table 2 Determination of tree complexity
為獲得最佳參數(shù)組合,決策樹復(fù)雜度在10 的時(shí)候誤差和偏差值最小,再根據(jù)數(shù)據(jù)集的數(shù)量對(duì)模型進(jìn)行反復(fù)測(cè)試,最終確定參數(shù)最優(yōu)組合如表3所示。
表3 GBDT參數(shù)設(shè)定Table 3 GBDT parameter setting
根據(jù)高速公路US-101路段上獲得的車輛信息及交通流特征,從橫縱向距離差、速度差以及加速度等交通參數(shù)選取10 個(gè)候選變量,將1 s 后的匯合加速度作為預(yù)測(cè)變量構(gòu)建GBDT模型。此外,本文還根據(jù)文獻(xiàn)[16]構(gòu)建了基于視角的刺激-反應(yīng)模型(VASR)對(duì)模型精度進(jìn)行對(duì)比。如表4所示,GBDT模型在兩項(xiàng)評(píng)價(jià)指標(biāo)上都優(yōu)于傳統(tǒng)的刺激-反應(yīng)模型。圖4 選取編號(hào)為2990 和10864 的車輛對(duì)兩種模型的預(yù)測(cè)值和實(shí)際值進(jìn)行對(duì)比,發(fā)現(xiàn)GBDT模型能夠更好地反應(yīng)車輛加速度在換道過(guò)程中的動(dòng)態(tài)變化。
圖4 隨機(jī)選擇樣車的預(yù)測(cè)結(jié)果與實(shí)際匯合加速度的比較Fig.4 Comparison between predicted results of randomly selected sample cars and actual combined acceleration
表4 不同模型預(yù)測(cè)精度對(duì)比Table 4 Comparison of prediction accuracy of different models
相比于以往研究,本文側(cè)重于考慮匯合車輛匯合過(guò)程中的安全性,將匯合車輛與目標(biāo)車道前車右車身線的碰撞時(shí)間TC作為匯合過(guò)程的安全評(píng)價(jià)指標(biāo),分析側(cè)向碰撞時(shí)間對(duì)匯合加速度的影響程度。由表5 可以發(fā)現(xiàn):在引入側(cè)向碰撞時(shí)間之后,模型的精度也會(huì)有所提升,說(shuō)明側(cè)向碰撞時(shí)間對(duì)匯合過(guò)程是存在安全影響的,而且該變量的引入能夠讓GBDT模型更加適用于匯合決策執(zhí)行。
表5 GBDT模型不同影響變量精度對(duì)比Table 5 Comparison of accuracy of different influencing variables of GBDT model
各影響變量對(duì)匯合加速度影響的相對(duì)重要性如圖5所示,其中,ΔVPL對(duì)匯合加速度的影響最大,TC、VM、ΔYL對(duì)匯合加速度也存在顯著的影響,重要性超過(guò)了10%。通過(guò)影響變量的相對(duì)重要性分析可以發(fā)現(xiàn),側(cè)向碰撞時(shí)間TC對(duì)于匯合加速度的影響占據(jù)著重要的位置,表明側(cè)面碰撞事故風(fēng)險(xiǎn)是匯合車輛駕駛員調(diào)整加速度的重要依據(jù)。
圖5 影響變量的重要性Fig.5 Importance of influencing variables
為了進(jìn)一步探索影響變量對(duì)匯合加速度的影響,建立重要性超過(guò)10%的影響變量對(duì)匯合加速度的偏效應(yīng),如圖6所示,圖中偏效應(yīng)可以理解為在其他變量取均值并保持不變時(shí),單個(gè)影響變量對(duì)匯合加速度的影響。
由圖6 可以發(fā)現(xiàn):重要性排在前4 的解釋變量對(duì)匯合過(guò)程中匯合車輛加速度的影響存在著較強(qiáng)的非線性關(guān)系,匯合車輛與領(lǐng)車之間的速度差呈現(xiàn)較強(qiáng)的負(fù)相關(guān),尤其是與目標(biāo)車道領(lǐng)車的速度差,匯合加速度會(huì)隨著速度差的增加而加快下降,當(dāng)與領(lǐng)車的速度差ΔVPL達(dá)到2 m·s-1的時(shí)候,匯合車輛才會(huì)開始減速;新引入的變量,即側(cè)向碰撞時(shí)間TC也是和匯合加速度呈現(xiàn)負(fù)相關(guān),但有趣的是在TC值達(dá)到30 s的時(shí)候,與匯合加速度的偏效應(yīng)變成了線性的下降趨勢(shì),到70 s 的時(shí)候逐漸趨于平緩,說(shuō)明當(dāng)匯合車輛與目標(biāo)車道領(lǐng)車的碰撞時(shí)間達(dá)到30 s的時(shí)候,駕駛員會(huì)認(rèn)為這時(shí)候的車輛匯合相對(duì)安全從而降低減速的幅度,直到70 s的時(shí)候確認(rèn)安全,將速度變成勻減速,但匯合車輛在匯合過(guò)程中依舊處于減速狀態(tài);匯合車輛的速度也對(duì)匯合加速度有一定的影響,其中匯合加速度與匯合速度呈現(xiàn)正相關(guān),匯合速度在[6,8]m·s-1處波動(dòng)較大;相比于前三者,距離差對(duì)于加速度的影響相對(duì)比較平緩,處于上下波動(dòng),但也呈現(xiàn)下降的趨勢(shì),匯合車輛在相距40 m 的時(shí)候才會(huì)開始減速,在[80,95]m 處會(huì)出現(xiàn)減速不穩(wěn)定。
圖6 影響變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)Fig.6 Partial effect of influencing variables on forecast results
本文利用梯度提升決策樹(GBDT)構(gòu)建交織區(qū)匯合加速度模型,引入側(cè)向碰撞時(shí)間TC對(duì)模型進(jìn)行預(yù)測(cè)和偏效應(yīng)分析。測(cè)試結(jié)果表明:GBDT模型相比于基于視角的刺激-反應(yīng)模型(VASR),具有較高的預(yù)測(cè)精度;在所采用的影響變量中,匯合車輛與目標(biāo)車道領(lǐng)車的速度差ΔVPL對(duì)匯合加速度的影響最大,其次是側(cè)向碰撞時(shí)間TC;引入側(cè)向碰撞時(shí)間TC可以有效優(yōu)化模型的均方誤差(MSE)、平均絕對(duì)偏差(MAD)和R2這3個(gè)指標(biāo)值,說(shuō)明側(cè)面碰撞風(fēng)險(xiǎn)是匯合車輛調(diào)整加速度的重要依據(jù),能夠讓GBDT模型更加準(zhǔn)確預(yù)測(cè)車輛的匯合加速度。