陳雪梅,李夢溪,王子嘉,歐洋佳欣
(北京理工大學(xué) 機械與車輛學(xué)院,北京 100081)
國內(nèi)無人駕駛車輛現(xiàn)已能夠在固定場景或者簡單城市環(huán)境下行駛。然而,真正實現(xiàn)復(fù)雜城市環(huán)境下的車輛自主行駛,依然面臨許多需要解決的關(guān)鍵技術(shù)問題,其中無人駕駛車輛城市交叉口通行決策就是制約其快速發(fā)展的關(guān)鍵問題之一。相比一般道路通行,受到交叉口型式、交通流量、交通參與者運動不確定性等多因素影響,城市交叉口通行比一般車道內(nèi)行為決策更加復(fù)雜。為了保障無人駕駛車輛在交叉口能夠安全且實時地決策并通行,需要對周邊車輛運動軌跡進行長時(>3 s)精準預(yù)測。
國內(nèi)外許多學(xué)者針對車輛軌跡預(yù)測開展了大量、系統(tǒng)的研究。現(xiàn)有的軌跡預(yù)測方法為基于物理學(xué)模型[1-2]、基于運動模式[3-4]和基于交互感知的軌跡預(yù)測方法[5-6]。ZHANG Ruifeng等[7]運用卡爾曼濾波 (Kalman Filter)和基于恒定車速的物理學(xué)模型對障礙物車輛進行狀態(tài)估計。該方法由于沒有考慮當前狀態(tài)的不確定性,僅適用于短時(<1 s)軌跡預(yù)測。KIM等[8]利用長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)來預(yù)測多模態(tài)的運動模式,網(wǎng)絡(luò)輸入的是車輛的歷史軌跡點。該方法依賴于訓(xùn)練數(shù)據(jù),并且存在無法預(yù)測未知環(huán)境中未知風險的缺點,很難在復(fù)雜城市交叉口得以應(yīng)用。BRAND等[9]使用基于交互感知的運動模型來預(yù)測車輛的軌跡,該方法考慮車輛之間的關(guān)聯(lián),雖然可長時準確預(yù)測,但耗費大量計算資源,實時性差。以上的算法都沒有很好地兼顧數(shù)據(jù)量、算法實時性和預(yù)測準確性的關(guān)系,且都只適用于簡單的駕駛場景,無法實現(xiàn)周邊車輛的長時且實時預(yù)測,特別是像城市交叉口這種由于大量車輛穿行而產(chǎn)生沖突的熱點區(qū)域,其對周邊車輛軌跡做出實時正確的預(yù)測有著極高的要求。針對城市交叉口,也有大量國內(nèi)外學(xué)者對此展開大量研究[10-12]。KAWASAKI等[13]利用交叉口斑馬線作為速度控制點提出了一個期望速度模型來對交叉口其他車輛進行軌跡預(yù)測,該模型能預(yù)測任意位置車輛左轉(zhuǎn)的軌跡。但是,該模型主要針對轉(zhuǎn)向車輛建模,沒有涵蓋周邊車輛的所有運動模式。北京理工大學(xué)梅維杰[14]針對3種不同運動模式(靜止、直行和轉(zhuǎn)向)利用GMM對其建模,當識別軌跡時長為1 s時,模型對運動模式的預(yù)測較為準確,并且保證了實時性的要求,但仍然不能滿足城市交叉口通行安全的需求。
本文首先利用路基和實車數(shù)據(jù)采集得到車輛的軌跡數(shù)據(jù),利用GMM混合模型對城市交叉路口周邊車輛的運動模式進行提取,再對每一種運動模式建立GPR預(yù)測模型來完成對周邊處于各種運動狀態(tài)的車輛軌跡預(yù)測,最后在路基和實車數(shù)據(jù)集上對算法的有效性進行驗證。該算法能夠以較小的數(shù)據(jù)量實現(xiàn)對車輛軌跡的長時精準實時的預(yù)測,較好地解決了其他算法存在的數(shù)據(jù)需求大、實時性差和適用車輛單一的問題。
本研究利用路基和實車數(shù)據(jù)采集系統(tǒng)采集北京市海淀區(qū)魏公村路口車輛通行數(shù)據(jù),采集頻率為10 Hz。
通過手動和自動標定軟件相結(jié)合的方式提取出目標車輛的位置、速度、加速度等運動信息進而組成訓(xùn)練和測試模型需要的軌跡數(shù)據(jù)。為了減少標定帶來的標定誤差和數(shù)據(jù)采集的系統(tǒng)誤差,應(yīng)用對稱指數(shù)移動平均法[15](sEMA)對原始數(shù)據(jù)進行預(yù)處理。sEMA是以依次遞減的形式對樣本數(shù)據(jù)加權(quán),使離目標均值最近的樣本數(shù)據(jù)的權(quán)重高,邊緣樣本數(shù)據(jù)的權(quán)重最小。具體公式為:
部分左轉(zhuǎn)車輛在平滑后的位置坐標(x,y)、橫向速度和縱向速度、加速度等數(shù)據(jù),見表1。
表1 交叉口部分左轉(zhuǎn)車輛數(shù)據(jù)
實車數(shù)據(jù)采集車輛(圖1)為北京理工大學(xué)智能車輛研究所比亞迪“速銳”線控智能車輛。本車搭載多動態(tài)要素跟蹤系統(tǒng),通過該系統(tǒng)可以采集到本車及本車周圍其他車輛的軌跡。實車采集的數(shù)據(jù)主要用于后續(xù)對模型和算法的驗證。
圖1 實車數(shù)據(jù)采集平臺
GMM[16]利用高斯概率密度函數(shù)(Probability Density Function,PDF)精確地量化事物,將一個事物分解為若干基于PDF行程的模型。根據(jù)PDF參數(shù)不同,可將每一個高斯模型看作一種類別,輸入1個樣本x,即可通過PDF計算其值,然后通過1個閾值來判斷該樣本屬于哪個高斯模型,進而確定樣本的類別。GMM具有多個模型,劃分更為精細,適用于多類別的劃分,可以應(yīng)用于復(fù)雜對象建模。因此,本文應(yīng)用GMM實現(xiàn)對交叉路口周邊車輛的運動模式識別的建模。
GMM的定義如式(2)和式(3)所示。
式中:p(x)為混合高斯分布的表達式;πk為第k個高斯成分的影響因子,滿足約束;為單個高斯分布密度函數(shù);μk為平均值;為標準差;為方差。由此可見,求混合高斯分布的過程,就是對GMM參數(shù)πk,μk,k∑的求取。基于GMM的運動模式識別模型的模型參數(shù)選取將在2.1節(jié)和2.2節(jié)中進行具體分析。
通過數(shù)據(jù)分析可以得出,無人駕駛車輛城市交叉路口運動模式包括左轉(zhuǎn)先行、左轉(zhuǎn)讓行、直行先行、直行讓行和右轉(zhuǎn)5種決策可能。
梅維杰[14]通過分析由激光雷達獲得的車輛運動數(shù)據(jù)發(fā)現(xiàn),轉(zhuǎn)向運動的方位角θ和相對航向角Δθ隨著時間呈線性變化,左轉(zhuǎn)向與右轉(zhuǎn)向的變化相反,而直線運動基本不發(fā)生變化,如圖2所示。因此,本研究選取航向角Δθ和方位角θ為特征參數(shù)用于區(qū)分車輛的左轉(zhuǎn)、直行和右轉(zhuǎn)狀態(tài)。通過分析正常通行車輛和讓行車輛穿越交叉口的加速度分布(圖3),可以發(fā)現(xiàn)兩種運動模式的加速度分布具有不同的特性,正常行駛的左轉(zhuǎn)和直行車輛的加速度普遍分布在0 m/s2附近的區(qū)間;而讓行模式車輛的加速度普遍分布在-0.5 m/s2附近的區(qū)間,兩者加速度呈現(xiàn)不同的密度分布。因此,選擇加速度為特征參數(shù)用于區(qū)分車輛的直行和讓行狀態(tài)。
圖2 三種狀態(tài)下的軌跡參數(shù)變化
通過上述分析,本文構(gòu)建動態(tài)障礙物的運動狀態(tài)向量M如式(4)所示。
式中:[kΔφ為相對航向角的變化率;kθ為相對方位角的變化率;[kΔφ和kθ分別用來區(qū)分車輛是轉(zhuǎn)向還是直行;a為目標車輛的加速度,用來區(qū)分車輛是讓行還是正常行駛;n為在運動模式識別中使用運動狀態(tài)向量的長度,選取n=6。
本文選擇使用0均值(z-crore)標準化處理狀態(tài)向量,標準化狀態(tài)向量可以消除不同量綱對后續(xù)運動模式識別產(chǎn)生的影響,有利于提高識別模型訓(xùn)練的收斂速度。對于長度是n的狀態(tài)向量M,其概率分布函數(shù)如式(5)所示。
式中:K為GMM中高斯分布的個數(shù),在這里同樣代表運動模式的個數(shù),由于提前給定了運動模式的個數(shù),所以運動模式預(yù)測問題就變成了GMM參數(shù)kλ的估計問題。對于每一個狀態(tài)向量M,可以求出對應(yīng)的每一個組件kλ的后驗概率,其中狀態(tài)向量對應(yīng)概率最大的類別就是運動模式識別的最終結(jié)果,如式(6)所示。
選取600組駕駛行為軌跡作為運動模式識別模型的訓(xùn)練數(shù)據(jù),其中,左轉(zhuǎn)、右轉(zhuǎn)和直行的軌跡數(shù)據(jù)分別有200條,左轉(zhuǎn)讓行、直行讓行和正常行駛的軌跡數(shù)據(jù)各100條。
選取聚類個數(shù)K=3,采用GMM對[kΔφ和kθ狀態(tài)向量數(shù)據(jù)進行訓(xùn)練建模得到穿行意圖(左轉(zhuǎn)、右轉(zhuǎn)和直行)的識別模型,然后對左轉(zhuǎn)和直行軌跡數(shù)據(jù)再次使用GMM對加速度狀態(tài)向量數(shù)據(jù)建模得到讓行意圖(正常行駛和讓行)的識別模型,最后得到完整運動模式識別模型的識別過程如圖4所示。
圖4 目標運動模式識別模型
GPR[17]算法是一種近幾年才發(fā)展起來的數(shù)據(jù)驅(qū)動建模方法,并且已經(jīng)成為機器學(xué)習領(lǐng)域的研究重點。由于GPR模型較高的預(yù)測精度,本文應(yīng)用GPR模型對車輛的軌跡進行長時精準預(yù)測分析。
使用路基平臺采集的軌跡數(shù)據(jù)訓(xùn)練GPR模型并優(yōu)化其超參數(shù)。GPR模型訓(xùn)練過程如圖5所示。
圖5 GPR模型訓(xùn)練過程
由于局部核函數(shù)具有較強的非線性逼近能力,而城市交叉口車輛軌跡數(shù)據(jù)測試集的運動參數(shù)空間與訓(xùn)練集的運動參數(shù)空間基本相同(即測試集的數(shù)據(jù)分布在訓(xùn)練集的領(lǐng)域),采用局部核函數(shù)可以很好地描述輸出與輸入之間的非線性映射關(guān)系。因此,本文采用局部核函數(shù)中的一種平方指數(shù)協(xié)方差函數(shù)(SE)作為核函數(shù)。
對于超參數(shù)的訓(xùn)練尋優(yōu),采用共軛梯度優(yōu)化算法搜索最優(yōu)超參數(shù),收斂標準設(shè)為最大迭代步數(shù)為100或迭代步之間的相對目標值小于0.001。
本文利用路基平臺采集的軌跡數(shù)據(jù)訓(xùn)練GPR模型并優(yōu)化其超參數(shù),訓(xùn)練過程如圖5所示。為了減小模型的復(fù)雜度,將加速度在X和Y方向解耦。使用目標的位置和速度[x(t),y(t),vx(t),vy(t)]作為預(yù)測模型的輸入,X方向上的模型預(yù)測值是加速度ax(t),Y方向上的模型預(yù)測值是加速度av(t),通過GPR算法建立加速度與車輛當前位置和速度的映射關(guān)系,訓(xùn)練得到的GPR加速度預(yù)測模型如圖6所示。
圖6 GPR加速度預(yù)測模型
GPR加速度預(yù)測模型訓(xùn)練完成后,采用物理學(xué)模型計算即可得到下一步車輛的運動狀態(tài),本文采用CA[18]模型計算得到下一步的車輛運動狀態(tài),通過下一步車輛的運動狀態(tài)得到下一步車輛的加速度,進而迭代計算出未來多步的車輛軌跡,GPR軌跡預(yù)測模型如圖7所示。
圖7 GPR軌跡預(yù)測模型
由于運動模式差異,本文將轉(zhuǎn)向車輛軌跡和直行車輛軌跡進行分開驗證。為了驗證不同運動狀態(tài)下的車輛軌跡預(yù)測效果,把軌跡數(shù)據(jù)分成不同片段,將直行車輛軌跡預(yù)測時長分別設(shè)為3 s、4 s、5 s和6 s,轉(zhuǎn)向車輛軌跡預(yù)測時長設(shè)為3 s、4 s和5 s,每組測試數(shù)據(jù)有80條軌跡片段。
采用均方根誤差(Root Mean Square Error,RMSE)來計算預(yù)測模型的誤差,如式(7)所示:
直行車輛軌跡的預(yù)測誤差如圖8a所示,在3 s、4 s、5 s、6 s的長時預(yù)測過程中,GPR模型的RMSE值均較大程度地小于恒定加速度(Constant Acceleration,CA)模型,相對于目前常用的CA模型,GPR軌跡預(yù)測模型的預(yù)測更加準確。轉(zhuǎn)向車輛軌跡的預(yù)測誤差如圖8b所示,同理,相對于常用的恒定轉(zhuǎn)向率和速度(Constant Turn Rate and Velocity,CTRV)模型[19],預(yù)測模型對于轉(zhuǎn)向車輛的長時軌跡預(yù)測更加準確。
圖8 直行和轉(zhuǎn)向車輛預(yù)測誤差結(jié)果
從測試集中挑出一條轉(zhuǎn)向軌跡數(shù)據(jù),對目標運動模式識別模型和GPR軌跡預(yù)測模型進行了統(tǒng)一驗證。圖9中是一條從西往北左轉(zhuǎn)的車輛加速度和軌跡的預(yù)測結(jié)果,通過運動模式識別判斷車輛處于左轉(zhuǎn)讓行的運動模式,并對后面3 s的運動軌跡進行預(yù)測??梢园l(fā)現(xiàn),在3 s左右的預(yù)測時長內(nèi),預(yù)測模型不但準確地預(yù)測了車輛未來的運動軌跡還準確地捕捉到了讓行車輛加速度的變化趨勢。
圖9 預(yù)測值和真實值對比
通過路基數(shù)據(jù)集的交叉驗證可以得出以下結(jié)論:與基于物理學(xué)的預(yù)測模型相比,基于GPR算法建立的軌跡預(yù)測模型誤差較低,并且長時預(yù)測誤差較為穩(wěn)定。
實車數(shù)據(jù)驗證中,由于車載傳感器得到的目標車輛運動狀態(tài)信息存在測量誤差,本文采用無跡卡爾曼的高斯過程濾波(GP-UKF)算法對車輛軌跡進行預(yù)測。
采用GP-UKF[20]算法對前0.6 s歷史軌跡數(shù)據(jù)進行濾波,基于濾波后的結(jié)果預(yù)測之后4.4 s的直行車輛運動狀態(tài),預(yù)測結(jié)果如圖10所示。由圖可知,相比于GPR算法直接利用目標觀測狀態(tài)進行預(yù)測,GP-UKF算法對未來軌跡的預(yù)測效果更好,更加貼近實際測量值。
圖10 試驗車輛數(shù)據(jù)預(yù)測結(jié)果分析
本文主要針對城市道路環(huán)境下交叉口的周邊車輛軌跡預(yù)測問題,通過基于GMM和GPR模型的車輛軌跡預(yù)測模型解決了城市交叉口周邊車輛軌跡預(yù)測問題。主要研究結(jié)論如下:
(1)分析軌跡數(shù)據(jù)得到不同運動模式的特征運動參數(shù)(相對方向角、相對航向角和加速度),構(gòu)建了運動軌跡特征向量,采用GMM訓(xùn)練得到動態(tài)目標運動模式識別模型。
(2)提出了基于GPR算法的城市交叉口周邊車輛軌跡預(yù)測模型。將城市交叉口周邊車輛軌跡預(yù)測問題與機器學(xué)習理論結(jié)合起來,利用高斯過程對每種運動模式進行建模,結(jié)合GPR預(yù)測周邊車輛的長時軌跡。
(3)利用路基數(shù)據(jù)集對模型進行交叉驗證,并與常見的物理模型進行對比;利用結(jié)合無跡卡爾曼的GP-UKF算法在實車數(shù)據(jù)上進行離線測試。經(jīng)驗表明,該算法在實現(xiàn)對城市交叉口周邊車輛軌跡的長時預(yù)測時表現(xiàn)良好,對智能駕駛汽車在交叉路口的決策有重要影響。
受限于本文篇幅,沒有考慮不同駕駛員,車輛與行人的交互以及不同結(jié)構(gòu)的城市交叉口等因素對決策行為的影響,這些影響將在后續(xù)工作中予以考慮。