譚紫陽(yáng) 高忠文 鄧宇
(1.哈爾濱理工大學(xué),哈爾濱 150080;2.西安交通大學(xué),動(dòng)力工程多相流國(guó)家重點(diǎn)實(shí)驗(yàn)室,西安 710049)
軌跡預(yù)測(cè)是智能汽車(chē)進(jìn)行可行域判斷的基礎(chǔ)[1]。目前,車(chē)輛軌跡預(yù)測(cè)主要采用基于物理的運(yùn)動(dòng)模型(Kinematic Model)和基于機(jī)器學(xué)習(xí)的模型。其中,基于物理的運(yùn)動(dòng)模型,如運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型,將車(chē)輛視為受物理定律支配的對(duì)象,主要控制輸入和車(chē)輛狀態(tài)[2]。這種預(yù)測(cè)方法對(duì)于短期軌跡預(yù)測(cè)是相當(dāng)準(zhǔn)確的,但對(duì)于長(zhǎng)期軌跡預(yù)測(cè)(超過(guò)1 s)不可靠。這是因?yàn)闆](méi)有考慮駕駛員操縱車(chē)輛引起的運(yùn)動(dòng)變化,而且機(jī)動(dòng)目標(biāo)運(yùn)動(dòng)軌跡非常復(fù)雜,要得到準(zhǔn)確目標(biāo)位置的表達(dá)式非常困難,且建立的模型很難與目標(biāo)的真實(shí)運(yùn)動(dòng)特性相吻合,預(yù)測(cè)模型及其方法難以選擇,而且會(huì)導(dǎo)致預(yù)測(cè)位置偏差大,預(yù)測(cè)精度不夠高。為了解決這個(gè)問(wèn)題,謝彬等提出了一種基于軌跡相似度的軌跡預(yù)測(cè)算法,在軌跡模式匹配過(guò)程中,查詢(xún)當(dāng)前軌跡與歷史軌跡模型的相似度[3]。范文超等針對(duì)高斯混合模型的運(yùn)動(dòng)目標(biāo)檢測(cè)算法的不足,提出一種基于分塊思想和高斯模型數(shù)量自適應(yīng)的高斯混合算法[4]。
基于機(jī)器學(xué)習(xí)的軌跡預(yù)測(cè)主要對(duì)馬爾科夫模型、概率圖模型[5]、支持向量機(jī)模型[6]、神經(jīng)網(wǎng)絡(luò)模型等機(jī)器學(xué)習(xí)模型進(jìn)行改進(jìn),挖掘移動(dòng)對(duì)象歷史軌跡的行為特征,實(shí)現(xiàn)移動(dòng)對(duì)象軌跡預(yù)測(cè)。特別地,長(zhǎng)期短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)已成功應(yīng)用于分析數(shù)據(jù)中的時(shí)間結(jié)構(gòu)[7]以及橫向位置預(yù)測(cè)[8]和駕駛員意圖預(yù)測(cè)[9]等領(lǐng)域。Byeoungdo Kim 直接將LSTM 網(wǎng)絡(luò)應(yīng)用于預(yù)測(cè)車(chē)輛在網(wǎng)格上的軌跡[10]。Florent Altché 提出了一種用于公路軌跡預(yù)測(cè)的LSTM網(wǎng)絡(luò),該網(wǎng)絡(luò)利用了目標(biāo)車(chē)輛周?chē)?chē)輛的信息[11]。分析現(xiàn)有的機(jī)器學(xué)習(xí)模型可以發(fā)現(xiàn):高斯和馬爾科夫等模型的訓(xùn)練需要耗費(fèi)大量時(shí)間[12-14],預(yù)測(cè)的時(shí)空復(fù)雜度高,不能滿足實(shí)時(shí)預(yù)測(cè)的要求;時(shí)間序列法易受外界條件影響,預(yù)測(cè)精度較低。此外,因?yàn)榍捌谀P偷挠?xùn)練不足,對(duì)于不同類(lèi)型的道路會(huì)無(wú)法適應(yīng)。
針對(duì)上述問(wèn)題,為了更加可靠地預(yù)測(cè)車(chē)輛軌跡,本文提出一種基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)的多元信息融合方法來(lái)解決回歸問(wèn)題,以期在1 s、2 s、3 s 的預(yù)測(cè)中得到較好的效果。
為了更加可靠地預(yù)測(cè)車(chē)輛軌跡,本文提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的多元信息融合方法,利用DNN、極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)建立模型,該模型將車(chē)輛速度、加速度、偏航角速度、轉(zhuǎn)向角和道路曲率作為輸入。深度神經(jīng)網(wǎng)絡(luò)可以通過(guò)輸入數(shù)據(jù)、模型建立訓(xùn)練和測(cè)試網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)[15-16]。極限學(xué)習(xí)機(jī)的優(yōu)勢(shì)有[17]:需要手動(dòng)設(shè)置的參數(shù)只有隱含層結(jié)點(diǎn)個(gè)數(shù),算法執(zhí)行過(guò)程中不需要人工調(diào)整參數(shù);避免了傳統(tǒng)訓(xùn)練算法反復(fù)迭代的過(guò)程,快速收斂,極大地縮短了訓(xùn)練時(shí)間;所得解是唯一最優(yōu)解,保證了網(wǎng)絡(luò)的泛化性能。將相同數(shù)據(jù)分別輸入到2 個(gè)性能不同的神經(jīng)網(wǎng)絡(luò)(DNN、ELM),將2個(gè)神經(jīng)網(wǎng)絡(luò)融合,可獲得不同神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)。因此,多信息融合系統(tǒng)將比使用單個(gè)網(wǎng)絡(luò)具有更好的性能。其中,融合系統(tǒng)分為3個(gè)部分:數(shù)據(jù)處理、信息收集和結(jié)果信息融合。采用基于深度神經(jīng)網(wǎng)絡(luò)的信息融合預(yù)測(cè)方法可以構(gòu)建無(wú)需設(shè)計(jì)且具有復(fù)雜方程的系統(tǒng)模型。此外,通過(guò)擴(kuò)展當(dāng)前的仿真場(chǎng)景,該方法可以很容易地?cái)U(kuò)展到在各種駕駛場(chǎng)景中預(yù)測(cè)車(chē)輛的軌跡。
將輸入數(shù)據(jù)歸一化到[-1,1]范圍內(nèi),主要方法是將信息反映到共同的描述空間,然后單獨(dú)輸入2個(gè)神經(jīng)網(wǎng)絡(luò),其中DNN 和ELM 的隱藏層分別為hDNN、hELM,然后通過(guò)1個(gè)完全連接(融合)層融合2個(gè)神經(jīng)網(wǎng)絡(luò)的隱含層輸出,模型結(jié)構(gòu)如圖1所示。將來(lái)自融合層的輸出傳遞到輸出層進(jìn)行預(yù)測(cè),輸出層分別計(jì)算1 s、2 s、3 s預(yù)測(cè)的橫向和縱向位置。融合層執(zhí)行的計(jì)算為:
式中,Wf、bf為學(xué)習(xí)到的模型參數(shù);e為融合層的輸出。
圖1 模型結(jié)構(gòu)
訓(xùn)練過(guò)程的損失函數(shù)采用預(yù)測(cè)軌跡與地面真實(shí)軌跡之間的均方誤差(Mean Square Error,MSE):
式中,yt為t時(shí)刻的實(shí)際位置;pt為t時(shí)刻位置的預(yù)測(cè)值;T為總體時(shí)間。
此時(shí),神經(jīng)網(wǎng)絡(luò)結(jié)果的融合已經(jīng)生成,信息融合已經(jīng)完成。
DNN 用于軌跡預(yù)測(cè)時(shí),可以對(duì)各種駕駛條件和駕駛模式進(jìn)行訓(xùn)練,在離線階段的訓(xùn)練過(guò)程中計(jì)算連接的權(quán)重。為了提高車(chē)輛軌跡預(yù)測(cè)的準(zhǔn)確性,進(jìn)行了離線訓(xùn)練,其中包括各種道路曲率的各種駕駛場(chǎng)景。輸入的數(shù)據(jù)經(jīng)過(guò)輸入層和多個(gè)隱藏層到達(dá)輸出層,每個(gè)層由幾個(gè)節(jié)點(diǎn)組成。數(shù)據(jù)在層間傳輸時(shí)需要乘以權(quán)重,隱藏層需要通過(guò)激活函數(shù)將數(shù)據(jù)傳送到下一層。Sigmoid和雙曲正切函數(shù)是常用的激活函數(shù),但是,這兩種激活函數(shù)可能產(chǎn)生梯度消失的問(wèn)題,因?yàn)楫?dāng)存在許多隱藏層時(shí),數(shù)據(jù)不會(huì)正確地傳播到輸入層,這影響了網(wǎng)絡(luò)的成功訓(xùn)練。此問(wèn)題可以通過(guò)使用修正線性單元(Rectified Linear Unit,ReLU)函數(shù)替換激活函數(shù)來(lái)解決,ReLU 函數(shù)在輸入數(shù)據(jù)大于零時(shí)輸出與輸入相同。然而,ReLU函數(shù)不適合在本模型中使用,因?yàn)镈NN 模型的最終輸出包括預(yù)測(cè)未來(lái)的橫向運(yùn)動(dòng)。這里使用帶泄露修正線性單元(Leaky ReLU)激活函數(shù),Leaky ReLU 激活函數(shù)與原始ReLU激活函數(shù)的定義有所不同,其定義為:
式中,λ=0.15為固定常數(shù)。
成本函數(shù)將輸入所需的值和輸出值作為輸入來(lái)計(jì)算成本C:
式中,m為用于培訓(xùn)的數(shù)據(jù)集的數(shù)量;為DNN的輸出值;yi為期望值。
為實(shí)現(xiàn)成本最小化,使用梯度下降算法來(lái)更新權(quán)重:
式中,α為學(xué)習(xí)率;Wi為i時(shí)刻的權(quán)重。
然后使用均方根反向傳播(Root Mean Square Propagation,RMSProp)算法來(lái)優(yōu)化深度神經(jīng)網(wǎng)絡(luò),該算法使用變量M(w,to)來(lái)保留前一時(shí)間段每個(gè)周期梯度平方的平均值,從而實(shí)現(xiàn)學(xué)習(xí)率的自適應(yīng)調(diào)整。RMSProp算法為:
式中,w為深度神經(jīng)網(wǎng)絡(luò)的工作權(quán)重;to為訓(xùn)練的步驟;為訓(xùn)練步驟to中w的梯度。
輸入層數(shù)據(jù)包括車(chē)輛速度、加速度、偏航角速度、轉(zhuǎn)向角和道路曲率等車(chē)輛狀態(tài)信息。輸出層有6個(gè)節(jié)點(diǎn),分別對(duì)應(yīng)后續(xù)1 s、2 s、3 s處的縱向預(yù)測(cè)和橫向預(yù)測(cè),采用Leaky ReLU激活函數(shù)。隱藏層的數(shù)量設(shè)置為5,神經(jīng)元的數(shù)量設(shè)置為200,小批量數(shù)量設(shè)置為128,學(xué)習(xí)率設(shè)置為0.1,迭代次數(shù)設(shè)置為100。
ELM[18]具有強(qiáng)大的網(wǎng)絡(luò)概括性,其模型輸入矩陣X和輸出矩陣Y假定為:
假設(shè)隱藏層激活函數(shù)為g(x),隱藏層神經(jīng)元的數(shù)量為1,網(wǎng)絡(luò)輸出T為:
式中,ti為網(wǎng)絡(luò)輸出;l為隱藏層節(jié)點(diǎn)的個(gè)數(shù);為連接隱藏層與輸出層的輸出權(quán)重;bj為隱藏層偏置;為第K個(gè)輸入層與隱藏層之間的權(quán)值;g(ωj,bj,xi)為第i個(gè)隱藏層神經(jīng)元的輸出。
式(11)可表示為T(mén)=Hβ,其中H為隱藏層輸出矩陣[18],β可以通過(guò)最小二乘估計(jì),即=H+T,H+為H的Moore-Penrose 廣義逆,T由訓(xùn)練樣本輸出Y代替。
粒子群優(yōu)化(Particle Swarm Optimization,PSO)的本質(zhì)是搜索最佳位置,并通過(guò)迭代找到全局最優(yōu)解。假設(shè)粒子群位置和速度是S維向量,則更新公式為:
式中,tm為迭代的步驟;vis、xis分別為第i個(gè)粒子的速度和位置;c1和c2分別為粒子群學(xué)習(xí)因數(shù);r1、r2為[0,1]范圍內(nèi)的隨機(jī)數(shù);pis為目前個(gè)體的最優(yōu)極值;pgs為目前的全局最優(yōu)極值;ω為功率常數(shù)。
ω較大時(shí),全局搜索能力強(qiáng),但很容易跳過(guò)最優(yōu)解;ω較小時(shí),局部搜索能力強(qiáng),但很容易陷入局部最優(yōu)解,并且收斂緩慢。因此,本文提出了一種基于模擬退火粒子群算法的改進(jìn)的ω自適應(yīng)公式:
式中,ωmin和ωmax分別為功率常數(shù)的最小值和最大值;f為粒子的當(dāng)前個(gè)體適應(yīng)度;fmin為整個(gè)粒子群的最小適應(yīng)度;favg為整個(gè)粒子群適應(yīng)度的當(dāng)前平均值。
設(shè)粒子群算法迭代次數(shù)為50、群體個(gè)體數(shù)量為100、學(xué)習(xí)因子c1和c2均為1.539 2,設(shè)ωmin=0.4、ωmax=0.9,激勵(lì)函數(shù)為S 型函數(shù),隱藏層神經(jīng)元的數(shù)量為15。ELM 輸入權(quán)重矩陣和隱藏層閾值由隨機(jī)算法給出,通常需要更多隱藏層神經(jīng)元才能達(dá)到理想的預(yù)測(cè)精度。測(cè)試集均方誤差被認(rèn)為是適應(yīng)度函數(shù),利用SAPSO 算法可以提高ELM 模型的隨機(jī)性,因此ELM 只需要少量隱藏層神經(jīng)元便可以獲得更好的預(yù)測(cè)效果,改善網(wǎng)絡(luò)泛化的問(wèn)題。
為了驗(yàn)證基于信息融合的深度神經(jīng)網(wǎng)絡(luò)的軌跡預(yù)測(cè)的性能,使用PreScan 和MATLAB/Simulink 構(gòu)建了仿真環(huán)境。從車(chē)輛駕駛模擬中獲得了用于學(xué)習(xí)和驗(yàn)證的必要數(shù)據(jù)集,從模擬試驗(yàn)收集了車(chē)輛狀態(tài)信息,同時(shí)在真實(shí)數(shù)據(jù)集Lankershim Boulevard Dataset 上進(jìn)行了驗(yàn)證。車(chē)輛狀態(tài)信息包括車(chē)速、加速度、偏航角速度、車(chē)輪轉(zhuǎn)向角和道路曲率。
為評(píng)估本文提出的車(chē)輛軌跡預(yù)測(cè)方法的可靠性,針對(duì)每個(gè)預(yù)測(cè)項(xiàng)計(jì)算均方誤差(Mean Square Error,MSE)和標(biāo)準(zhǔn)偏差(Standard Deviation,Std Dev)。使用70%的模擬數(shù)據(jù)進(jìn)行訓(xùn)練,另外20%用于驗(yàn)證,其余10%用于測(cè)試。用于測(cè)試的數(shù)據(jù)集是在2 條彎曲道路組成的單獨(dú)模擬駕駛場(chǎng)景中收集的。仿真場(chǎng)景如圖2所示,車(chē)速設(shè)定為72 km/h。
圖2 模型結(jié)構(gòu)
實(shí)際車(chē)輛軌跡以及測(cè)試場(chǎng)景的預(yù)測(cè)結(jié)果如圖3 所示,預(yù)測(cè)在1 s之后進(jìn)行。
圖3 車(chē)輛軌跡的實(shí)際位置與預(yù)測(cè)位置
將本文提出的方法與3 層隱藏層的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、ELM、DNN 等數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法進(jìn)行比較,軌跡預(yù)測(cè)結(jié)果的均方誤差、標(biāo)準(zhǔn)偏差如表1 所示,基于動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)的相似度計(jì)算結(jié)果如表2所示。
表1 不同算法的軌跡預(yù)測(cè)可靠性
表2 不同方法的軌跡相似度
兩條軌跡間的相似度Sm用公式表示為:
式中,‖· ‖ 為兩點(diǎn)坐標(biāo)的二范數(shù),即歐氏距離;P、R分別為兩條軌跡相應(yīng)點(diǎn)的集合;pi、ri分別為對(duì)應(yīng)的點(diǎn)的坐標(biāo)。
將所提出的DNN+ELM 方法在真實(shí)數(shù)據(jù)集Lankershim Boulevard Dataset 上進(jìn)行驗(yàn)證,該數(shù)據(jù)收集區(qū)域的長(zhǎng)度約為500 m,包括3~4個(gè)車(chē)道,并完全覆蓋3個(gè)信號(hào)交叉口。數(shù)據(jù)是由安裝在毗鄰美國(guó)101 號(hào)高速公路和Lankershim 大道的36 層建筑物屋頂上的5 個(gè)攝像機(jī)獲得的。該方法與基于物理的運(yùn)動(dòng)模型、高斯過(guò)程回歸(Gaussian Process Regression,GPR)在3 種場(chǎng)景下左轉(zhuǎn)、右轉(zhuǎn)、直行的預(yù)測(cè)結(jié)果如圖4所示,軌跡中前10個(gè)位置用于對(duì)模型進(jìn)行訓(xùn)練,誤差范圍如圖5所示。
與其他模型相比,本文提出的融合模型在1 s、2 s、3 s的預(yù)測(cè)更精準(zhǔn)。該結(jié)果表明,采用基于融合的深度神經(jīng)網(wǎng)絡(luò)的車(chē)輛軌跡預(yù)測(cè)可以用于風(fēng)險(xiǎn)評(píng)估和駕駛輔助。
圖4 不同方法在真實(shí)數(shù)據(jù)集上的預(yù)測(cè)結(jié)果
圖5 3種方法誤差范圍的比較
本文提出了一種基于改進(jìn)極限學(xué)習(xí)機(jī)和深度神經(jīng)網(wǎng)絡(luò)融合的車(chē)輛軌跡預(yù)測(cè)方法,改進(jìn)的極限學(xué)習(xí)機(jī)以模擬退火粒子群優(yōu)化算法為基礎(chǔ),改進(jìn)的深度神經(jīng)網(wǎng)絡(luò)使用修正線性單元函數(shù)替換激活函數(shù),并使用均方根反向傳播算法來(lái)優(yōu)化深度神經(jīng)網(wǎng)絡(luò)。模擬結(jié)果驗(yàn)證了該方法在道路曲率變化工況下的可行性。在未來(lái)的工作中,該方法將擴(kuò)展到基于周?chē)h(huán)境中其他車(chē)輛進(jìn)行軌跡預(yù)測(cè),以及碰撞檢測(cè)和警告算法的研究。