車 鑫
(重慶交通大學(xué),重慶 400074)
匝道合流區(qū)作為匝道車輛與主路車輛交匯的區(qū)域,在匝道車輛進(jìn)行強(qiáng)制換道操作時(shí)容易出現(xiàn)交通流紊亂的現(xiàn)象,Kondyli[1]等人得出的研究表明,匝道影響區(qū)從匝道鼻端上游120 m處開始并于鼻端下游260 m處結(jié)束,而這種現(xiàn)象的出現(xiàn)會(huì)影響交通效率并帶來安全性問題。因此該區(qū)域一直是學(xué)者及相關(guān)技術(shù)人士研究的重點(diǎn)。張鑫[2]等以效率-交通沖突率作為評(píng)價(jià)指標(biāo),分析了加速車道幾何參數(shù)對(duì)合流區(qū)交通環(huán)境的影響;李巧茹[3]等提出了基于可變限速和換道控制的合流區(qū)協(xié)同控制模型;Kusuma[4]等人發(fā)現(xiàn)91%的臨近匝道車道行駛的駕駛員會(huì)在加速車道前方進(jìn)行減速,且48%的匝道合流車輛會(huì)在前25%的交通區(qū)段進(jìn)行換道操作;Beinum[5]等研究了匝道合流區(qū)的駕駛行為。以上文獻(xiàn)從人、車、路、環(huán)境四個(gè)角度對(duì)合流區(qū)交通環(huán)境進(jìn)行了分析與改善。然而當(dāng)前的文獻(xiàn)資料,大多集中在匝道車輛合流行為及區(qū)域交通效率提升等方面,討論主路及匝道車輛間微觀交通參數(shù)與車輛加減速行為關(guān)系的資料相對(duì)較少。而在匝道合流區(qū),車輛交互行為(如車輛換道)會(huì)比其它路段更多,當(dāng)保持多車跟馳狀態(tài)或匝道來車時(shí),駕駛員可能會(huì)出現(xiàn)無法正確判斷前方車輛運(yùn)行狀態(tài)的情況,從而提高車輛運(yùn)行風(fēng)險(xiǎn)并降低通行效率。而車輛周圍環(huán)境的變化往往會(huì)影響駕駛?cè)说囊鈭D,進(jìn)而影響駕駛員之后的決策行為,所以通過車輛交互信息來預(yù)判前車運(yùn)行狀態(tài)很有必要。在信息技術(shù)不斷發(fā)展的今天,隨著路端設(shè)備或車載傳感器的部署,我們可以很容易的獲取到這些車輛的自身信息與交互信息,使預(yù)判前方車輛行駛狀態(tài)成為可能。因此本文討論了速度、車輛間距、速度差等微觀運(yùn)行參數(shù)與車輛加減速行為的關(guān)系,并借助以上參數(shù)利用聚類分析的方式預(yù)判車輛未來短期的運(yùn)行狀態(tài)。
本次研究選取了清華大學(xué)蘇州汽車研究院提供的Mirror-Traffic數(shù)據(jù)集,該數(shù)據(jù)集記錄了某市高速公路匯入路口的車輛軌跡數(shù)據(jù),記錄時(shí)長為30 min。該數(shù)據(jù)集包含760輛車共計(jì)14.3萬余條數(shù)據(jù)。數(shù)據(jù)的采樣幀率為25 Hz,包含車輛編號(hào)、位置、速度、加速度等車輛運(yùn)行信息。數(shù)據(jù)集所選區(qū)域?yàn)殡p向四車道的匝道合流區(qū),匝道連接方式為平行式,限速80 km/h。在下面的研究中,將遠(yuǎn)離匝道一側(cè)的主路記作主路一,靠近匝道一側(cè)的主路記為主路二,合流區(qū)示意圖如圖1所示。
1—加速車道;2—主路二車道;3—主路一車道;4—x-y坐標(biāo)軸:車輛點(diǎn)位坐標(biāo)(x,y)對(duì)應(yīng)的基準(zhǔn)坐標(biāo)軸。圖1 平行式匝道合流區(qū)示意圖
在分析數(shù)據(jù)前需對(duì)其進(jìn)行簡單處理。首先處理匝道車輛數(shù)據(jù),匝道車輛軌跡圖如圖2所示??梢钥吹?匝道車輛最早在縱向點(diǎn)位y=160 m處左右開始出現(xiàn)平行于主路車道的軌跡,因此匝道合流車輛僅采集縱向點(diǎn)位前160 m處的車輛數(shù)據(jù);在提取車輛間距信息時(shí),兩車縱向間距最大值設(shè)置為70 m,同時(shí)由于加速度數(shù)據(jù)波動(dòng)較大,所以對(duì)其進(jìn)行了卡爾曼濾波處理。
注:將每輛車在各采樣點(diǎn)位的坐標(biāo)(x,y)按采樣時(shí)間順序進(jìn)行連接,形成匝道車輛行駛軌跡。圖2 匝道車輛行駛軌跡圖(單位:m)
由于車輛的運(yùn)行特性受所在車道、匝道是否有來車等因素影響,所以將合流區(qū)分為六個(gè)場景,分別為匝道來車時(shí),主路一與主路二車輛運(yùn)行場景、匝道無來車時(shí),主路一與主路二車輛運(yùn)行場景以及加速車道車輛行駛時(shí),斜前方與斜后方(位于主路二)有車的場景。為敘述方便,將上述場景以此記為場景一到場景六。其中場景一到場景四所選的參數(shù)為自車速度、前后兩車間的速度差、縱向間距、車頭時(shí)距,場景五和場景六所選參數(shù)為自車速度、速度差、橫向及縱向間距。以上所選參數(shù)經(jīng)驗(yàn)證均服從正態(tài)分布。
為了驗(yàn)證各個(gè)場景間的差異性,這里采用獨(dú)立樣本t檢驗(yàn)的方法來判斷。由于各樣本間的數(shù)量級(jí)不一致,會(huì)影響?yīng)毩颖総檢驗(yàn)得出的結(jié)論,故利用smote過采樣算法將各個(gè)樣本擴(kuò)容。擴(kuò)容后利用SPSS軟件求出的相應(yīng)結(jié)果如表1、表2所示。盡管場景一和場景二、場景三和場景四之間各有一個(gè)參數(shù)差異性不顯著,但場景間其他三個(gè)參數(shù)均存在明顯的差異,因此從整體上看六個(gè)場景間存在差異。接下來研究各場景對(duì)應(yīng)的參數(shù)與車輛運(yùn)行狀態(tài)即車輛加速度之間的關(guān)系。
表2 匝道場景差異性分析
為研究各參數(shù)與車量加速度間的關(guān)系,采用皮爾遜相關(guān)系數(shù)r來判別二者的相關(guān)性
(1)
式中:x、y為需要判別相關(guān)性的兩個(gè)樣本,Cov(x,y)為x與y的協(xié)方差;Var(x)、Var(y)分別為x與y的方差。
各場景參數(shù)與加速度的相關(guān)系數(shù)如表3、表4所示。
表3 各主路場景參數(shù)與加速度的相關(guān)系數(shù)
表4 各匝道場景參數(shù)與加速度的相關(guān)系數(shù)
分析包含兩條主路的場景,可以看到不同場景的參數(shù)與加速度的相關(guān)程度是存在差異的,這里以場景一和場景四為例,場景一中速度和速度差與加速度相關(guān)性高,而場景四中縱向距離與車頭時(shí)距與加速度相關(guān)性高。同時(shí)也可以發(fā)現(xiàn)不同場景下各參數(shù)與加速度的正負(fù)相關(guān)性、相關(guān)的的顯著性也存在著部分差異,這也側(cè)面驗(yàn)證了場景之間的差異性。再分析另外兩個(gè)場景,可以看到,場景五的整體相關(guān)性水平、相關(guān)的顯著性均強(qiáng)于場景六,說明加速車道車輛行駛狀態(tài)受前方車輛影響更大。
根據(jù)相關(guān)性分析結(jié)果,選取相關(guān)性最強(qiáng)的系數(shù)所對(duì)應(yīng)的場景作為案例進(jìn)行聚類分析,因此這里以場景四和場景五作為案例進(jìn)行分析。
在常規(guī)聚類方法中k-means算法憑借著其操作簡單,收斂速度快而備受廣大研究者青睞,如張建波[6]等利用k-means算法分析了駕駛員的急減速特征;蘇小會(huì)[7]等利用了改進(jìn)的k-means算法對(duì)車輛油耗進(jìn)行了分析。但由于k-means方法偏向于對(duì)球形簇進(jìn)行聚類,再加上簇之間容易發(fā)生交疊現(xiàn)象,聚類結(jié)果在有些情況下可能會(huì)不盡人意。而高斯混合模型(GMM)作為K-means模型的優(yōu)化,它可以試圖找到多維高斯模型概率分布的混合表示,從而擬合出任意形狀的數(shù)據(jù)分布,而該模型也廣泛地運(yùn)用在聚類方法的研究中,吳堅(jiān)[8]等基于高斯混合模型對(duì)駕駛員的特征進(jìn)行了辨識(shí);張建波[9]等利用該模型對(duì)不同交通條件下的駕駛員進(jìn)行了特征聚類。由于樣本數(shù)據(jù)服從高斯分布,符合GMM的應(yīng)用條件,因此這里可以選擇GMM聚類的方法對(duì)車輛運(yùn)行狀態(tài)進(jìn)行分類。在這里,將車輛的運(yùn)行狀態(tài)分為加速態(tài)、平穩(wěn)行駛態(tài)、減速態(tài)三類,并對(duì)K-means和GMM兩種聚類算法的效果進(jìn)行了對(duì)比。
k-means算法是通過在確定k個(gè)聚類個(gè)數(shù)的情況下隨機(jī)確立k個(gè)聚類中心,分別計(jì)算第i個(gè)樣本點(diǎn)到各個(gè)聚類中心的距離rij
rij=‖xi-μj‖2(j=1,2,…,kandi=1,2,…,N)
(2)
式中:xi為第i個(gè)樣本點(diǎn),μj為第j個(gè)聚類中心,k為聚類中心個(gè)數(shù),N為聚類樣本總個(gè)數(shù)。
GMM算法則通過多個(gè)正態(tài)分布的加權(quán)和來表示一個(gè)隨機(jī)變量的概率分布,其對(duì)應(yīng)的高斯混合分布可表示為
(0≤ωi≤1)
(3)
式中:m為高斯函數(shù)混合個(gè)數(shù);ωi為混合系數(shù);μi為第i個(gè)高斯混合分布的均值;σi為第i個(gè)高斯混合分布的標(biāo)準(zhǔn)差。
而利用GMM聚類過程即先劃分k個(gè)聚類簇,之后利用包含多元參數(shù)的訓(xùn)練集來訓(xùn)練該模型,形成k種不同的多元高斯分布圖(簇),最后將需要聚類的樣本(測試集)導(dǎo)入訓(xùn)練好的模型,求出該樣本在k個(gè)不同分布圖中的概率,選取概率最大的簇作為結(jié)果進(jìn)行輸出。
在樣本訓(xùn)練的過程中,首先對(duì)混合系數(shù)αi,均值向量μi以及協(xié)方差矩陣∑i進(jìn)行初始化,之后利用隱變量確定樣本來源于某一類,接下來計(jì)算該類中產(chǎn)生該樣本的概率,從而求出對(duì)應(yīng)的對(duì)數(shù)似然函數(shù)
(4)
式中:PM(xj)為樣本xj的后驗(yàn)概率;m為樣本個(gè)數(shù);k為聚類簇個(gè)數(shù);αi為混合系數(shù);μi與∑i分別為對(duì)應(yīng)的均值向量與協(xié)方差矩陣。
聚類分析前需要對(duì)聚類參數(shù)進(jìn)行合理的選取,這里以參數(shù)與加速度的相關(guān)性和聚類參數(shù)之間的相關(guān)性兩個(gè)方面進(jìn)行評(píng)判。在場景四中,由于車輛間距與車頭時(shí)距兩個(gè)參數(shù)間的相關(guān)系數(shù)高達(dá)0.918,因此利用表3得出的結(jié)論選取車頭時(shí)距與速度差作為聚類參數(shù);在場景五中,各參數(shù)間相關(guān)性并不高,所以根據(jù)表4得出的結(jié)果選取速度差、縱向間距、速度作為聚類參數(shù)。
為了更好地展現(xiàn)聚類效果,需對(duì)上述兩種場景的樣本進(jìn)行降維處理,即對(duì)同一輛車,每十幀數(shù)據(jù)做一次均值,得到聚類樣本數(shù)據(jù),之后對(duì)該樣本數(shù)據(jù)進(jìn)行聚類,通過聚類結(jié)果與實(shí)際運(yùn)行情況進(jìn)行對(duì)比的方式來評(píng)判聚類效果,其中實(shí)際運(yùn)行情況分別通過前述兩種聚類方式進(jìn)行了量化分級(jí)。場景四、場景五所對(duì)應(yīng)的車輛運(yùn)行趨勢的k-means算法聚類結(jié)果如圖3、圖4所示,GMM算法聚類結(jié)果如圖5、圖6所示。從聚類結(jié)果來看GMM算法均優(yōu)于K-means算法,但在場景四、場景五所對(duì)應(yīng)的兩算法的預(yù)判正確率卻僅為52.2%,40.74%與45.2%,43.1%。其正確率較低的原因主要?dú)w結(jié)為以下3點(diǎn)。
圖3 場景四車輛運(yùn)行趨勢k-means算法聚類圖
圖4 場景五車輛運(yùn)行趨勢k-means算法聚類圖
圖5 場景四車輛運(yùn)行趨勢GMM算法聚類圖
圖6 場景五車輛運(yùn)行趨勢GMM算法聚類圖
(1)在該場景下微觀交通參數(shù)與加速度之間的相關(guān)性依然較低。
(2)該區(qū)域交通環(huán)境復(fù)雜,受駕駛員心理因素(駕駛風(fēng)格)的影響相對(duì)于常規(guī)場景更大。比如在場景四中,就出現(xiàn)了在較低的車頭時(shí)距中依然有車輛加速行駛的情況。
(3)應(yīng)該考慮車道占有率等相對(duì)宏觀的交通信息。
綜上所述,在該區(qū)域進(jìn)行車輛運(yùn)行狀態(tài)預(yù)測時(shí)應(yīng)該強(qiáng)化對(duì)駕駛員駕駛風(fēng)格的辨識(shí),在車輛運(yùn)行狀態(tài)預(yù)判時(shí)應(yīng)該將駕駛風(fēng)格進(jìn)行量化,將其作為參數(shù)與其他相關(guān)交通參數(shù)一同作為預(yù)判依據(jù),從而減少誤判的可能。
著重分析了車輛交互信息與車輛加減速行為的關(guān)系,其中靠近匝道側(cè)的主路車輛運(yùn)行狀態(tài)與車頭時(shí)距、車輛間距相關(guān)性強(qiáng)。而匝道車輛運(yùn)行狀態(tài)受臨近車道前車影響更大,與其縱向距離相關(guān)性強(qiáng)。根據(jù)聚類的分析結(jié)果說明僅依靠車輛交互信息及自身速度并不能完全把握車輛運(yùn)行狀態(tài),還需要考慮駕駛員自身特性等因素。本次研究所得出的結(jié)論為車輛行駛狀態(tài)預(yù)測參數(shù)的提取提供了依據(jù)。