趙 健,宋東鑒,朱 冰,吳杭哲,韓嘉懿,劉宇翔
(1. 吉林大學(xué),汽車仿真與控制國家重點實驗室,長春 130022;2. 中國第一汽車集團(tuán)有限公司智能網(wǎng)聯(lián)開發(fā)院,長春 130011)
隨著汽車智能化技術(shù)的不斷發(fā)展,智能汽車所面臨的交通場景更加復(fù)雜,為應(yīng)對復(fù)雜交通態(tài)勢下的自動駕駛?cè)蝿?wù),高等級智能汽車必須具備對周圍相關(guān)交通態(tài)勢的感知和認(rèn)知能力,而交通車的意圖識別是其中的重要內(nèi)容。
目前用于車輛意圖或行為識別的方法可分為機理建模和數(shù)據(jù)驅(qū)動兩類。機理建模通常利用車輛運動學(xué)模型、對行為決策過程的抽象表征、人為制定的規(guī)則識別交通車行為;數(shù)據(jù)驅(qū)動方法則將意圖識別視為機器學(xué)習(xí)中的分類問題,通過學(xué)習(xí)型算法構(gòu)建意圖分類器。
機理模型方面,謝楓等利用車輛側(cè)向速度和橫擺角速度,結(jié)合高精度地圖進(jìn)行車輛意圖識別。謝輝等通過定義相似度函數(shù),根據(jù)車輛與當(dāng)前車道中心線的位置誤差和航向角誤差計算相似度函數(shù),通過手寫規(guī)則建立了車輛意圖識別體系。近年來,也有研究將車間的交互關(guān)系引入機理建模當(dāng)中。Bahram 等基于非合作博弈對可能發(fā)生的交通場景進(jìn)行全面考量,通過構(gòu)建成本地圖描述被識別車輛和周圍相關(guān)車輛之間的交互關(guān)系,進(jìn)而構(gòu)建意圖識別模型。
數(shù)據(jù)驅(qū)動方法方面,以隱式馬爾科夫模型(hidden Markov model,HMM)為代表的動態(tài)貝葉斯網(wǎng)絡(luò)在概率圖模型基礎(chǔ)上引入時間流,在處理具有時序依賴性的意圖識別問題上效果較好。支持向量機等也被用于車輛意圖識別。近年來考慮車間交互機制的深度學(xué)習(xí)方法開始用于車輛意圖識別和運動預(yù)測,其中以長短期記憶(long-shot term memory,LSTM)和門控循環(huán)單元(gated recurrent unit,GRU)兩種循環(huán)神經(jīng)網(wǎng)絡(luò)模型及其變體的應(yīng)用最為廣泛。季學(xué)武等基于LSTM 網(wǎng)絡(luò)構(gòu)建交通車意圖識別模塊,以被預(yù)測對象和周圍相關(guān)車輛的位置和速度信息為輸入進(jìn)行意圖識別。Dai 等通過改進(jìn)LSTM 網(wǎng)絡(luò)結(jié)構(gòu)建立車輛空間交互關(guān)系。宋曉琳等基于條件隨機場(condition random field,CRF)與注意力機制下的LSTM,構(gòu)建了換道意圖識別方法。蔡英鳳等將LSTM 和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)相結(jié)合,考量車輛社交特征信息,通過注意力機制提升了算法的特征表達(dá)能力。圖神經(jīng)網(wǎng)絡(luò)由于其強大的表現(xiàn)力也開始被應(yīng)用在車輛行為識別和預(yù)測。Zhao 等將CNN和GRU相結(jié)合,利用CNN學(xué)習(xí)復(fù)雜拓?fù)浣Y(jié)構(gòu)以捕獲空間依賴性,利用GRU 學(xué)習(xí)數(shù)據(jù)時序上動態(tài)變化以捕捉時間依賴性,進(jìn)而構(gòu)建時間圖卷積網(wǎng)絡(luò)模型用于城市道路路網(wǎng)下的交通預(yù)測。Jeon等基于邊緣增強圖卷積神經(jīng)網(wǎng)絡(luò)(ECGN)建立車間交互關(guān)系模型,利用具有編碼器(encoder)-解碼器(decoder)架構(gòu)的LSTM網(wǎng)絡(luò)進(jìn)行車輛運動預(yù)測。
目前的數(shù)據(jù)驅(qū)動方法普遍通過完全黑盒化的模型從被識別車輛及其周圍相關(guān)交通車的基礎(chǔ)運動學(xué)信息中提取車間的隱式交互依賴關(guān)系,再通過LSTM等對序列的時序關(guān)系進(jìn)行處理,這樣的架構(gòu)被證明能夠?qū)崿F(xiàn)較高精度的意圖識別或運動預(yù)測。但模型效果受訓(xùn)練數(shù)據(jù)影響較大,且由于不同駕駛?cè)嗽谙嗤煌☉B(tài)勢下行為決策的差異性和非理智駕駛行為,導(dǎo)致自然駕駛數(shù)據(jù)中存在著異質(zhì)性的車間交互和依賴關(guān)系,使得完全黑盒模型在部分場景中的泛化能力可能不如機理模型穩(wěn)定,且不具備良好的可解釋性。
針對上述問題,本文從駕駛行為內(nèi)在生成機理出發(fā),站在被識別車輛駕駛?cè)说慕嵌龋治銎鋸漠a(chǎn)生駕駛意圖到尋找執(zhí)行時機、再到執(zhí)行操作控制車輛完成駕駛意圖的全過程,論述其中各階段的內(nèi)在機理、可供利用的顯式信息和對應(yīng)的建模方法,通過構(gòu)建數(shù)據(jù)機理混合驅(qū)動架構(gòu)將具有明確時序關(guān)系的各階段對應(yīng)的模型進(jìn)行融合,構(gòu)建數(shù)據(jù)機理混合驅(qū)動的交通車意圖識別方法。
本文的主要貢獻(xiàn)為:(1)通過建立駕駛行為時間軸,明晰了駕駛行為的產(chǎn)生過程,并按照時序關(guān)系將交通車行為識別問題拆解為駕駛?cè)艘鈭D預(yù)測、換道可行性分析和車輛行為識別3 個層次,提升了模型的泛化性和可解釋性;(2)站在被識別車輛駕駛?cè)说慕嵌?,基于馬爾可夫決策過程(Markov decision process,MDP),通過量化不同交通態(tài)勢下駕駛?cè)藢Ω黢{駛行為收益的認(rèn)知,從駕駛?cè)笋{駛行為生成機理角度出發(fā)建立了駕駛?cè)艘鈭D預(yù)測模型;(3)通過建立換道可行性分析模型表征駕駛?cè)藢τ趽Q道時機的把握和判斷,并進(jìn)一步構(gòu)建數(shù)據(jù)機理混合驅(qū)動架構(gòu),將考慮機理的駕駛?cè)艘鈭D預(yù)測和換道可行性分析與數(shù)據(jù)驅(qū)動的車輛行為識別進(jìn)行結(jié)果級融合,利用機理模型延長提前識別時間,利用數(shù)據(jù)驅(qū)動方法保證識別準(zhǔn)確率,最后通過與目前主流的考慮車間交互的深度學(xué)習(xí)模型對比,證明了本文提出方法在識別準(zhǔn)確率、提前識別時間和模型可解釋性上的優(yōu)勢。
駕駛?cè)说膿Q道行為可分為兩類,一是根據(jù)駕駛?cè)蝿?wù)需求產(chǎn)生的強制換道,如為上下匝道或換至轉(zhuǎn)彎車道等而采取的換道行為;二是駕駛?cè)说闹鲃訐Q道即自由換道,駕駛?cè)嘶趯煌☉B(tài)勢的分析,為了追求更高的行駛效率、行駛安全性等產(chǎn)生換道意圖,可基于經(jīng)驗和規(guī)則進(jìn)行收益分析,從而推斷駕駛?cè)艘鈭D。本文以自由換道行為為研究對象,建立了如圖1 所示的換道行為時間軸和意圖識別方法架構(gòu),一次換道行為的完成需經(jīng)過以下階段:
階段I:外界交通態(tài)勢刺激駕駛?cè)水a(chǎn)生換道意圖,并尋找目標(biāo)車道。該階段為駕駛?cè)说膬?nèi)在思考過程,沒有可直接獲取的顯式特征,只能通過抽象建模分析交通態(tài)勢與駕駛?cè)艘鈭D之間的映射關(guān)系,進(jìn)行駕駛?cè)艘鈭D預(yù)測。
階段II:針對性感知、認(rèn)知交通態(tài)勢,尋找換道時機。駕駛?cè)烁兄煌☉B(tài)勢時可觀測的顯式特征包括其頭部、眼部等移動,基于這些顯示特征可以對駕駛?cè)说囊鈭D進(jìn)行提前識別;而駕駛?cè)藢煌☉B(tài)勢的針對性認(rèn)知則難以直接通過顯式特征表達(dá),需通過抽象模型表征駕駛?cè)朔治鰮Q道可行性和尋找換道時機的過程。
階段III:駕駛?cè)藞?zhí)行操作,控制車輛完成換道。當(dāng)駕駛?cè)苏J(rèn)為換道時機到來時,開始執(zhí)行轉(zhuǎn)動轉(zhuǎn)向盤、踩下油門/制動踏板等具體操縱行為以改變車輛的運動學(xué)、動力學(xué)狀態(tài),從而控制車輛完成換道。該過程可觀測的顯式特征可分為兩類,一是駕駛?cè)说氖謩雍湍_動等生理信息,二是車輛的運動學(xué)、動力學(xué)參數(shù)信息。
在非網(wǎng)聯(lián)環(huán)境下,無法獲取被識別車輛(predicted vehicle,PV)駕駛?cè)说念^眼動和手腳動等生理信息,因此難以構(gòu)建PV 駕駛?cè)艘鈭D識別模型。如圖1 所示,本文根據(jù)目前交通環(huán)境和車輛感知技術(shù)可觀測的PV相關(guān)信息,面向駕駛?cè)藫Q道的各個階段進(jìn)行建模:(1)面向階段I構(gòu)建基于MDP 的駕駛?cè)艘鈭D預(yù)測模型,MDP 的基本原理與駕駛?cè)笋{駛行為生成機理高度吻合,因此通過獎勵函數(shù)的合理設(shè)計,MDP 能夠有效描述駕駛?cè)恕摆吚芎Α钡幕抉{駛原則,從而從駕駛行為生成機理角度出發(fā),在駕駛?cè)藞?zhí)行操縱行為前預(yù)測其意圖;(2)面向階段II構(gòu)建基于動態(tài)行車安全場的換道可行性分析模型,駕駛?cè)嗽谠u估換道可行性和尋找換道時機時會對影響其駕駛行為的交通態(tài)勢進(jìn)行主觀且連續(xù)的認(rèn)知,選用安全場這一描述交通態(tài)勢的經(jīng)典模型,并進(jìn)一步地在其空間屬性基礎(chǔ)上引入時變屬性,從認(rèn)知機理角度來表征駕駛?cè)朔治鰮Q道可行性和選擇換道時機的過程;(3)面向階段III 構(gòu)建基于雙向長短期記憶(bidirectional long-short term memory,Bi-LSTM)的車輛行為識別模型,Bi-LSTM 善于基于歷史信息,從正反兩方向提取時間序列中的依賴關(guān)系,能夠從數(shù)據(jù)驅(qū)動角度識別已經(jīng)在運動學(xué)上顯著的車輛行為。最終通過構(gòu)建數(shù)據(jù)機理混合驅(qū)動架構(gòu)將上述3 組具有明確時序關(guān)系的模型進(jìn)行融合得到本文提出的交通車意圖識別方法(中同時包含意圖預(yù)測和行為識別,為描述方便寫作意圖識別)。
圖1 駕駛?cè)藫Q道行為時間軸與意圖識別方法架構(gòu)
意圖預(yù)測模型本質(zhì)上是對當(dāng)前交通態(tài)勢與駕駛?cè)艘鈭D的映射關(guān)系建模。駕駛?cè)水a(chǎn)生意圖的思考過程可以描述為,基于駕駛?cè)吮旧淼恼J(rèn)知特性,分析當(dāng)前交通態(tài)勢,預(yù)測執(zhí)行各種駕駛行為后面臨的新的交通環(huán)境和獲得的收益,從中選擇收益最高的行為作為當(dāng)前的駕駛意圖,這與1階MDP類似,因此將駕駛?cè)笋{駛意圖的產(chǎn)生建模為MDP(,,,),其中為狀態(tài)空間,為動作空間,為狀態(tài)轉(zhuǎn)移概率,為獎勵函數(shù),在該MDP 中即為執(zhí)行某種駕駛行為帶來的收益。s表征PV 在時刻所處的交通環(huán)境,包含PV及其周圍相關(guān)交通車的運動學(xué)狀態(tài)信息;動作空間包含左換道(lane changing to left,LCL)、車道保持(lane keeping,LK)和右換道(lane changing to right,LCR)這3種駕駛行為;駕駛?cè)嗽诋?dāng)前狀態(tài)s執(zhí)行動作a后轉(zhuǎn)移至狀態(tài)s,并獲得行為收益(a,s),其中a∈{,,}。
假設(shè)駕駛?cè)司抢碇堑模趫?zhí)行駕駛行為時遵從“趨利避害”的基本原則,則可通過計算在當(dāng)前交通態(tài)勢下各駕駛行為的收益對駕駛?cè)瞬扇∧撤N駕駛行為的傾向性進(jìn)行判斷,以預(yù)測駕駛?cè)艘鈭D。如圖2 所示,本文假設(shè)PV 駕駛?cè)说囊鈭D主要受周圍6 臺車輛的影響,即當(dāng)前車道前車(front vehicle,F(xiàn)V),當(dāng)前車道后車(rear vehicle,RV),左車道前車(leftlane front vehicle,LFV),左車道后車(left-lane rear vehicle,LRV) ,右 車 道 前 車(right-lane front vehicle,RFV),右車道后車(right-lane rear vehicle,RRV)。
圖2 影響PV的周圍相關(guān)車輛
行為收益(a,s)應(yīng)能夠體現(xiàn)PV駕駛?cè)藢Ξ?dāng)前交通態(tài)勢的認(rèn)知和對各駕駛行為產(chǎn)生收益和損失的判斷。本文設(shè)計速度收益、跟馳安全性收益、跟馳空間收益、換道碰撞風(fēng)險和舒適性損失來綜合表征行為收益:
式中為收益權(quán)重矩陣。本文基于Softmax 函數(shù)結(jié)構(gòu)建立駕駛?cè)艘鈭D預(yù)測結(jié)果與駕駛行為收益之間的映射關(guān)系:
可假設(shè)中各組數(shù)據(jù)獨立同分布于式(2)所表征的概率分布,則關(guān)于待征參數(shù)的對數(shù)似然函數(shù)為
對于該MDP,從s到s 的一步狀態(tài)轉(zhuǎn)移包含了執(zhí)行一次完整駕駛行為的全過程,而非傳統(tǒng)意義上MDP 的單時間步狀態(tài)轉(zhuǎn)移,因此需要對PV 駕駛?cè)藞?zhí)行某種駕駛行為的預(yù)期軌跡和執(zhí)行該駕駛行為過程中周圍相關(guān)車輛的運動軌跡進(jìn)行預(yù)測。
2.2.1 PV預(yù)期車道保持軌跡預(yù)測
對于采取車道保持行為的PV,若不存在FV,可直接利用恒加速度模型預(yù)測PV的預(yù)期運動軌跡;若PV 跟馳FV 行駛,則利用智能駕駛員模型(intelligent drvier model,IDM)預(yù)測PV的縱向加速度():
式中:Δ()和()分別為PV 與FV 之間的相對速度和車距;((),Δ())為期望跟車距離。期望速度ˉ、最小安全車距、期望跟車時距、最大加速度ˉ和最大減速度ˉ為待標(biāo)定參數(shù)。本文采用全局最小二乘法,以最小化IDM 輸出的加速度和NGSIM中人類駕駛?cè)苏鎸嵓铀俣戎g的均方誤差為目標(biāo)進(jìn)行參數(shù)標(biāo)定,參數(shù)標(biāo)定結(jié)果如表1所示。
表1 IDM參數(shù)標(biāo)定結(jié)果
2.2.2 PV預(yù)期換道軌跡預(yù)測
對于執(zhí)行換道行為的PV,其換道軌跡預(yù)測不同于已知一段PV的歷史運動學(xué)軌跡預(yù)測其未來軌跡,而是在PV 還未在運動學(xué)特征上表現(xiàn)出換道傾向時進(jìn)行提前預(yù)測,即若當(dāng)前時刻駕駛?cè)丝刂芇V執(zhí)行換道操作,駕駛?cè)祟A(yù)期的換道軌跡應(yīng)是什么形式。本文采用5 次多項式擬合從軌跡規(guī)劃角度進(jìn)行PV 駕駛?cè)祟A(yù)期的換道軌跡預(yù)測。
以PV 當(dāng)前位置為原點,以PV 行駛方向為軸正方向,軸與軸垂直,進(jìn)而建立直角坐標(biāo)系,則PV預(yù)期換道軌跡描述為
圖3 換道持續(xù)時間概率密度分布
式中和分別為對數(shù)正態(tài)分布的均值和方差。
圖4給出了不同換道初始速度下的換道持續(xù)時間概率密度分布對比,由圖4(a)可知,當(dāng)換道初始時刻的速度在6-14 m/s 之間時,換道持續(xù)時間的分布較為接近,因此對6-14 m/s 的換道持續(xù)時間分布進(jìn)行統(tǒng)一描述,得到如圖4(b)所示的3組概率分布,表2給出3組對數(shù)正態(tài)分布參數(shù)。
圖4 換道持續(xù)時間概率密度分布對比
表2 對數(shù)正態(tài)分布參數(shù)
為了排除小概率數(shù)值的影響,取對數(shù)正態(tài)分布的90%置信區(qū)間繪制了如圖5 所示的箱型圖,并以90%置信區(qū)間內(nèi)的數(shù)學(xué)期望作為該速度區(qū)間內(nèi)的換道持續(xù)時間,如表3 所示。基于對不同初始速度下?lián)Q道持續(xù)時間的分析,能夠在給定初始邊界條件下,根據(jù)換道持續(xù)時間對駕駛?cè)说念A(yù)期換道軌跡進(jìn)行預(yù)測。
表3 不同換道初始速度下的換道持續(xù)時間
圖5 換道持續(xù)時間箱型圖
2.2.3 PV周圍相關(guān)車輛運動軌跡預(yù)測
人類駕駛?cè)嗽谶M(jìn)行行為決策時,通常會預(yù)測周圍相關(guān)車輛的運動,從而對將要采取的駕駛行為進(jìn)行評估。對PV 周圍車輛的運動軌跡預(yù)測是基于其歷史運動學(xué)信息和當(dāng)前運動狀態(tài)進(jìn)行的,通過具有序列到序列(sequence to sequence,Seq2seq)結(jié)構(gòu)的LSTM 網(wǎng)絡(luò)再現(xiàn)PV 駕駛?cè)藢χ車囕v的預(yù)測過程,網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。
圖6 基于Seq2seq的PV周圍車輛軌跡預(yù)測模型結(jié)構(gòu)
設(shè)時刻Seq2seq 網(wǎng)絡(luò)的輸入為長度的歷史時間窗內(nèi)的特征序列X ,輸出為預(yù)測時間窗內(nèi)的預(yù)測軌跡Y :
式中:和分別為被預(yù)測周車與PV 的相對縱、側(cè)向位置;、為被預(yù)測周車的縱、側(cè)向速度;、為被預(yù)測周車的縱、側(cè)向加速度?;贜GSIM數(shù)據(jù)集對Seq2seq模型進(jìn)行訓(xùn)練和測試。為計算PV駕駛行為的收益值,需要對圖2 所示的PV 周圍6 臺車在PV 換道持續(xù)時間內(nèi)的軌跡進(jìn)行預(yù)測,即預(yù)測時窗應(yīng)當(dāng)取表2給出的3組不同換道持續(xù)時間。
不同長度預(yù)測時間窗下測試集的預(yù)測誤差如表4 所示,預(yù)測誤差隨著預(yù)測時間窗長度變長而增加,誤差隨時間的累計效應(yīng)較為明顯。但是駕駛?cè)艘鈭D預(yù)測模型中對PV 周車軌跡預(yù)測的精確性要求并不高,因為該部分預(yù)測僅用于表征PV駕駛?cè)藢煌☉B(tài)勢大致判斷,因此較大的誤差是可以接受的。圖7給出了預(yù)測時間窗長度為4.7 s時NGSIM中某PV周圍6臺車的軌跡預(yù)測結(jié)果。
表4 不同預(yù)測時間窗下的RMSE
圖7 預(yù)測時間窗為4.7 s時PV周圍車輛軌跡預(yù)測結(jié)果
(1) 速度收益
設(shè)PV 當(dāng)前車道前車FV 車速為,目標(biāo)車道前車(target-lane front vehicle,TFV)車速為,LC(lane changing)泛指所有換道行為,則PV 的速度收益為
(2) 跟馳安全性收益評估
通過危險感知系數(shù)表征PV 跟馳過程中的安全性收益:
式中:和分別為PV 與跟馳目標(biāo)的車頭時距和碰撞時間倒數(shù);、為線性加權(quán)系數(shù)。
(3) 跟馳空間收益
PV 執(zhí)行換道操作的另一重要誘因是渴望獲得更大的跟車距離以進(jìn)行更安全舒適的跟車行為,PV的跟馳空間收益可表征為
式中和分別為PV與FV和TFV的縱向距離。
(4) 換道碰撞風(fēng)險
車輛換道過程中的碰撞風(fēng)險通常來自于目標(biāo)車道前車TFV 和目標(biāo)車道后車(target-lane rear vehicle,TRV)。駕駛?cè)藢τ趽Q道碰撞風(fēng)險的認(rèn)知是一個連續(xù)過程,不能以是否碰撞評價,因此本文利用PV 執(zhí)行換道后與TFV 和TRV 到達(dá)臨界碰撞點的時間差來量化表征駕駛?cè)藢Q道碰撞風(fēng)險的評估。
圖8分析了PV 執(zhí)行換道操作后與TRV 可能出現(xiàn)的碰撞情況。圖8(c)給出了PV 與TRV 發(fā)生碰撞的中間情況,即PV車身剛剛進(jìn)入TRV 軌跡,PV車頭便與TRV車頭發(fā)生“點接觸”,設(shè)點C為臨界碰撞點。利用兩車到達(dá)臨界碰撞點的時間差來表征換道過程中來自于TRV的碰撞風(fēng)險:
圖8 PV與TRV發(fā)生碰撞情況
式中:和分別為PV 與TRV 到達(dá)臨界碰撞點C的時間;為安全時間差閾值。同理可得PV 換道過程中由TFV 所產(chǎn)生風(fēng)險的評估指標(biāo)。則換道碰撞風(fēng)險為
(5)舒適性損失評估
車輛的變速運動會造成駕駛?cè)说氖孢m性損失,且應(yīng)當(dāng)同時考慮縱向和側(cè)向的舒適性,則定義舒適性損失為
若PV 執(zhí)行,則可以近似認(rèn)為不存在側(cè)向舒適性損失。以上駕駛行為收益和損失的計算均基于對PV預(yù)期軌跡及其周圍相關(guān)車軌跡的預(yù)測。
由圖1 所示的換道時間軸可知,駕駛?cè)嗽诋a(chǎn)生換道意圖后,會根據(jù)交通態(tài)勢評估換道可行性并選擇換道時機。BALAL 等指出,駕駛?cè)诉x定目標(biāo)車道后,可以認(rèn)為影響其評估換道可行性和選擇換道時機的主要為FV、TFV、TRV。在現(xiàn)實交通環(huán)境中,駕駛?cè)嗽谶x擇換道時機時需綜合考量上述車輛的位置、車速和運動趨勢等對自車產(chǎn)生的影響,這是一個連續(xù)的過程。本文通過行車安全場表征駕駛?cè)藢τ绊懫鋼Q道行為的交通態(tài)勢的認(rèn)知,進(jìn)而構(gòu)建換道可行性評估模型。
本文在常規(guī)安全場的空間屬性基礎(chǔ)上引入時變特性,則車輛在時刻對場中物體產(chǎn)生的場強():
式中()為車輛在時刻的等效質(zhì)量,與車輛類型、體積、質(zhì)量、速度有關(guān),定義為
式中:m為車輛質(zhì)量;V為車輛體積系數(shù);Q為車輛類別;-為待定常數(shù)項。圖9 給出了NGSIM 中某場景下,在PV 換道起始時刻FV、TRV、TFV 的場強分布圖。
圖9 換道起始時刻FV、TRV、TFV場強分布
駕駛?cè)诉x擇換道時機時會面向整個預(yù)期的換道過程而不是某一個時間點進(jìn)行換道可行性評估。基于第2 節(jié)中對PV 預(yù)期軌跡與其周圍相關(guān)車輛軌跡的預(yù)測,本文在安全場中引入時變特性來考量整個換道過程中FV、TRV、TFV 施加給PV 的影響,定義換道可行性因子為
式中:為換道初始時刻;E()為車輛在時刻施加給PV 的場強;E()表征PV 在換道過程中能夠接受的來自車輛的最大臨界場強。假設(shè)PV換道過程中與車輛的最小距離剛好滿足式(7)中的最小安全距離,則根據(jù)車輛的當(dāng)前運動狀態(tài)及對其未來軌跡的預(yù)測,可求得該假設(shè)成立情況下車輛在時刻所處的位置,進(jìn)而可根據(jù)PV 和車輛的運動狀態(tài)求得|E()|。
在第2 節(jié)中,基于MDP 從駕駛?cè)笋{駛行為生成機理角度對其意圖進(jìn)行預(yù)測,但是這建立在駕駛?cè)俗裱摆吚芎Α痹瓌t的假設(shè)上,在實際情況中并非所有駕駛行為均能夠用行為收益進(jìn)行解釋,本文中從速度、距離和安全性3 個維度評價了NGSIM 數(shù)據(jù)集中的1 657組自由換道行為的驅(qū)動誘因,結(jié)果如表5 所示。在表5 中,1 代表該換道行為中存在該類型的驅(qū)動誘因,0 代表不存在,可以看到速度、距離、安全性優(yōu)勢雖然能覆蓋大部分的換道行為,但是仍有9.58%的換道行為無法用上述驅(qū)動誘因解釋。因此為了避免基于MDP 的意圖預(yù)測模型輸出錯誤意圖,建立了考量PV 歷史運動學(xué)信息的車輛行為識別模型。車輛運動學(xué)信息是車輛行為最直接的反應(yīng),但考慮到駕駛?cè)说牟倏v隨機性,在識別PV已經(jīng)發(fā)生的駕駛行為時,應(yīng)考慮一定時間域內(nèi)的運動學(xué)信息,進(jìn)行“序列到類別”的分類。本文中構(gòu)建雙向多長短期記憶網(wǎng)絡(luò)Bi-LSTM從自然駕駛數(shù)據(jù)中學(xué)習(xí)得到歷史運動學(xué)信息與車輛行為之間的映射模型,基于數(shù)據(jù)驅(qū)動實現(xiàn)對PV已經(jīng)發(fā)生的駕駛行為的識別,對應(yīng)于圖1所示的換道時間軸上的階段III。
表5 換道行為驅(qū)動誘因統(tǒng)計
Bi-LSTM 網(wǎng)絡(luò)結(jié)構(gòu)如圖10所示,網(wǎng)絡(luò)輸入為PV的歷史運動學(xué)時序特征:
圖10 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)
本文中構(gòu)建了如圖11 所示的數(shù)據(jù)機理混合驅(qū)動架構(gòu),將上述3 個模型進(jìn)行時序耦合,設(shè)判別閾值為。PV 及其周圍相關(guān)交通車信息輸入后,基于MDP 的駕駛?cè)艘鈭D預(yù)測模型、基于Bi-LSTM 的車輛行為識別模型、基于動態(tài)行車安全場的換道可行性分析模型分別輸出駕駛?cè)艘鈭D預(yù)測概率(a)、車輛行為識別概率(a)和換道可行性因子。若() <,說明當(dāng)前交通態(tài)勢并不足以刺激駕駛?cè)水a(chǎn)生換道意圖,則輸出最終識別結(jié)果(a)=(a);若() ≥,說明當(dāng)前交通態(tài)勢已能夠刺激駕駛?cè)水a(chǎn)生換道意圖。本文通過換道可行性因子將(a)和(a)結(jié)合,越大表征此時換道可行性越高,因此越傾向于相信駕駛?cè)艘鈭D預(yù)測結(jié)果,則混合驅(qū)動的意圖概率為
圖11 數(shù)據(jù)機理混合驅(qū)動的交通車意圖識別架構(gòu)
由前文對換道行為驅(qū)動誘因的統(tǒng)計分析可知,并非所有駕駛?cè)说膿Q道行為均是理智的,且侵略性較強的駕駛?cè)嗽趽Q道可行性較低時也可能執(zhí)行換道,因此本文設(shè)置了第2 層判斷邏輯,即選擇充分相信車輛行為識別結(jié)果,當(dāng)() ≥()時,即使此時的換道行為收益并不充分或換道可行性較低,依然認(rèn)為PV發(fā)生了換道行為:
本文使用NGSIM 數(shù)據(jù)集進(jìn)行模型標(biāo)定、訓(xùn)練和測試。NGSIM 由美國聯(lián)邦公路局采集,采樣周期0.1 s,包含在公路I-80 和US-101 上于不同時間段采集的數(shù)據(jù),涵蓋采集時段內(nèi)出現(xiàn)的所有車輛信息,數(shù)據(jù)處理過程如下:
(1)根據(jù)車道編號變化,提取所有發(fā)生換道行為的數(shù)據(jù)段;
(2)由于本文主要關(guān)注車輛的自由換道行為,因此去除涉及匯入及駛出匝道而采取的換道行為和連跨多條車道的換道行為,以避免強制換道因素對模型訓(xùn)練和標(biāo)定產(chǎn)生影響;
(3)由于NGSIM 原始數(shù)據(jù)中存在大量噪聲和誤差,本文使用時間窗長度為2 s、3 階多項式擬合的Savitzky-Golay濾波器對原始數(shù)據(jù)進(jìn)行處理;
(4)以換道軌跡與車道分界線的交點為換道點,計算每個采樣點的車輛偏航角,從換道點開始,沿時間軸正方向遍歷每個采樣點的偏航角,若連續(xù)5個采樣點的||≤(換道起始點航向角閾值),則將第1 次滿足||≤的采樣點定義為換道起始點;采用同樣方法,通過判定||≤可確定換道終止點;
(5)為對駕駛?cè)艘鈭D預(yù)測模型進(jìn)行訓(xùn)練和測試,在換道起始點處向前擴展長度為3 s 的車輛車道保持?jǐn)?shù)據(jù),并將其與換道起始點和換道終止點之間的數(shù)據(jù)進(jìn)行組合作為一次完整的換道行為,最終共提取1 657 次有效的自由換道數(shù)據(jù),同時提取了1 231次穩(wěn)定的車道保持?jǐn)?shù)據(jù),按照80%和20%劃分訓(xùn)練集和測試集。
取的輸入序列長度為4 s,圖12 給出了在一次意圖識別過程中的表現(xiàn),如圖12(a)所示,PV在5 s 時越過車道分界線,該點即為換道點,取閾值= 0.6。從圖12(b)和(e)的對比可以看出,能夠在PV處于車道保持階段即實現(xiàn)對PV駕駛?cè)艘鈭D的提前預(yù)測,而僅使用PV歷史運動學(xué)特征的車輛行為識別模型則只能在PV 的換道行為在運動學(xué)上顯著之后才能正確識別出。基于對交通態(tài)勢的分析和預(yù)測計算駕駛行為收益進(jìn)而預(yù)測PV 駕駛?cè)艘鈭D,如圖12(c)所示,從0 時刻開始即超過,表明PV 駕駛?cè)艘呀?jīng)產(chǎn)生了意圖,但由圖12(d)可知由于左換道可行性因子()在0-1.2 s之間未上升至足夠高的數(shù)值,說明駕駛?cè)松形凑业胶线m的時機執(zhí)行,因此圖12(e)中的在閾值附近上下波動,從而出現(xiàn)了圖12(f)中在和之間不斷切換的情況。在1.2 s后,()開始穩(wěn)定上升,說明換道時機已經(jīng)到來,開始穩(wěn)定超過,識別PV 意圖為。如圖12(b)和圖12(e)所示,()在3.4 s 處開始大于(),說明此時PV 已經(jīng)開始在運動學(xué)上表現(xiàn)出特征,選擇相信車輛行為識別結(jié)果(),至此()識別概率迅速上升至100%。
圖12 交通車意圖識別過程
表6給出了在測試集中,在換道點處的意圖識別混淆矩陣,可以看到能夠精準(zhǔn)識別3 種意圖。此外,為充分驗證本文提出方法的有效性,本文構(gòu)建了5 個對比模型:以PV 運動學(xué)信息為特征值,基于HMM 進(jìn)行PV 行為識別,記為HMM;以PV 運動學(xué)信息為特征值,基于Bi-LSTM 進(jìn)行PV 行為識別,記為Bi-LSTM-1;在PV 運動學(xué)信息基礎(chǔ)上,加入PV周圍車輛的速度及與其PV 的相對位置信息作為特征值,基于Bi-LSTM 進(jìn)行PV 意圖識別,記為Bi-LSTM-2;在Bi-LSTM 基礎(chǔ)上,引入條件隨機場(conditional random field,CRF)以考慮意圖的前后依賴性,記為Bi-LSTM-CRF;建立包含PV 本身信息、周圍相關(guān)車輛信息和道路信息的社交特征集合,通過CNN 提取PV 的社交特征信息,利用具有注意力機制的LSTM 模型進(jìn)行PV 意圖識別,記為Social-LSTM。上述模型與采用完全相同的訓(xùn)練集和測試集,圖13 給出了6 種模型在測試集上意圖識別準(zhǔn)確率隨距離換道點時間變化情況的對比,可以明顯看到,僅基于PV運動學(xué)信息的HMM 和Bi-LSTM-1在6種模型當(dāng)中表現(xiàn)最差,Bi-LSTM-1由于模型本身優(yōu)勢,表現(xiàn)略優(yōu)于HMM,Bi-LSTM-CRF 與Social-LSTM的表現(xiàn)較為接近。
圖13 識別準(zhǔn)確率對比
表6 意圖識別混淆矩陣
表7 給出了、Social-LSTM 和Bi-LSTM-2 在換道點前1.5 s 處的意圖識別性能量化對比。結(jié)合圖13和表7可以看到,直接將PV和周圍車輛的基礎(chǔ)運動信息輸入網(wǎng)絡(luò)Bi-LSTM-2 雖然相較HMM 和Bi-LSTM-1 性能有所提升,但由于其并沒有對車間的深層依賴關(guān)系進(jìn)行提取和建模,因此提升效果并不明顯,且模型的可解釋性較差。Social-LSTM 通過CNN提取車輛的社交信息從而使網(wǎng)絡(luò)在意圖識別時考慮了車間的交互和依賴關(guān)系,在識別準(zhǔn)確率和提前識別時間上有明顯提升。但通過CNN 這樣的完全黑盒模型提取隱式特征的方式,缺乏足夠的可解釋性,雖然在換道點前1.5 s 以內(nèi),Social-LSTM 和的識別準(zhǔn)確率差距不大,但是在換道點前3~1.5 s 的區(qū)間內(nèi),的表現(xiàn)要優(yōu)于Social-LSTM,尤其在換道點前3 s 處,相比其他方法明顯具有更高的識別準(zhǔn)確率,表明不僅具有較強的可解釋性,且能夠更早地預(yù)測PV意圖。
表7 識別性能指標(biāo)對比 %
此外,根據(jù)表5 中對換道行為驅(qū)動誘因的統(tǒng)計分析,即使利用自然駕駛數(shù)據(jù)進(jìn)行模型標(biāo)定,但是僅憑意圖預(yù)測模型仍然無法給出足夠高的識別準(zhǔn)確率,圖13 中換道點前3 s 處的識別準(zhǔn)確率雖然高于其他模型,但仍有相當(dāng)?shù)腻e誤識別率。而這正是本文使用數(shù)據(jù)-機理混合驅(qū)動架構(gòu)的原因,通過駕駛行為機理模型延長提前識別時間,而數(shù)據(jù)驅(qū)動的車輛行為識別模型則保證了足夠高的準(zhǔn)確率,最后通過換道可行性分析將兩者有效結(jié)合,在換道點前1.8 s左右識別準(zhǔn)確率超過90%,在換道點處識別準(zhǔn)確率達(dá)到97.88%。
本文中針對智能汽車技術(shù)領(lǐng)域中的交通車意圖識別問題,從分析駕駛?cè)笋{駛行為生成機理角度入手,利用非網(wǎng)聯(lián)條件下車載傳感器能夠獲取的有限交通車信息,面向駕駛行為產(chǎn)生的各階段分別建立機理模型和數(shù)據(jù)驅(qū)動模型,構(gòu)建數(shù)據(jù)機理混合驅(qū)動的交通車意圖識別方法,并利用自然駕駛數(shù)據(jù)集NGSIM進(jìn)行模型訓(xùn)練和驗證。結(jié)果表明在換道點前1.8 s處識別準(zhǔn)確率可達(dá)90%,在換道點處識別準(zhǔn)確率為97.88%,并從不同建模方法、不同輸入特征、不同隱式特征提取方式等維度對進(jìn)行對比驗證,說明了在識別準(zhǔn)確率、提前識別時間和可解釋性上的優(yōu)勢,能夠為智能汽車行為決策和運動規(guī)劃提供有效支撐,對智能汽車技術(shù)發(fā)展具有一定意義。但駕駛?cè)诵袨樯蓹C理很難完全清晰準(zhǔn)確的描述,不僅因為該機理本身目前并不清晰,還源于不同類型駕駛?cè)诵袨榈漠愘|(zhì)性、認(rèn)知的差異性和時變性等眾多復(fù)雜因素。將在后續(xù)研究中基于數(shù)據(jù)機理混合驅(qū)動構(gòu)建更加完善的駕駛行為模型,并將其應(yīng)用于意圖識別、軌跡預(yù)測和決策規(guī)劃等研究。