摘 要:駕駛意圖識別對于確保交通安全和提升交通效率至關重要。為實現(xiàn)對未來車輛駕駛意圖的預測,本研究基于軌跡預測與駕駛意圖識別方法,選用Argoverse公開數據集作為訓練和測試數據集,并提出了一種結合VectorNet軌跡預測模型和隨機森林分類模型的駕駛意圖識別方法,實現(xiàn)對未來3s的駕駛意圖識別。為驗證該方法的有效性,本文將新提出的VectorNet-隨機森林模型與LSTM-隨機森林模型進行了對比,結果表明本文方法的效果更佳。這一方法為未來自動駕駛和智能交通系統(tǒng)的發(fā)展提供了參考和借鑒。
關鍵詞:軌跡預測 駕駛意圖識別 圖神經網絡 隨機森林
0 引言
據2023年世界衛(wèi)生組織調查報告顯示,每年有119萬人死于交通事故。交通事故是5-29歲兒童和年輕人的主要死因,死于交通事故的人中有超過一半是行人、自行車和摩托車的駕駛者。為了減少交通事故的危害,智慧交通受到學術界和工業(yè)界越來越多的關注。駕駛意圖識別作為其重要研究分支,可以通過意圖識別幫助駕駛人員規(guī)避駕駛過程中可能出現(xiàn)的風險。為此,本文應用Argoverse公開數據集,基于VectorNet軌跡預測模型和隨機森林分類模型,構建基于軌跡預測的駕駛意圖識別模型,以實現(xiàn)對車輛駕駛意圖的預測。
1 駕駛意圖識別研究現(xiàn)狀
高速公路交通流特征分析是交通工程領域的一個核心議題,其研究旨在深入理解高速公路上車輛運行的規(guī)律,為交通擁堵治理和智能交通系統(tǒng)的發(fā)展提供科學依據。在國內外眾多學者的共同努力下,關于高速公路交通流特征的研究已經形成了一系列深刻的認識。
Singh等[1]通過統(tǒng)計證實,90%的交通事故源于人為失誤,主要原因是在駕駛過程中信息收集和處理能力非常有限,無法同時獲取人、車、路等多方面信息,尤其是在自身或者周圍車輛存在變道行為時,不能準確判斷車輛所處環(huán)境進而引發(fā)交通事故。
智能交通系統(tǒng)(ITS)作為智慧交通的重要分支,可以信息通信、數據采集等手段,實現(xiàn)道路交通的信息化、智能化和網絡化。宋大治等[2]將分散的各個機電系統(tǒng)聯(lián)結成為一個有機的整體,實現(xiàn)各專業(yè)系統(tǒng)之間的信息互通、資源共享以及系統(tǒng)間的聯(lián)動。
生成模型通過學習駕駛數據中的分布情況,理解駕駛行為中的潛在意圖。Li等[3]基于馬爾科夫模型和貝葉斯濾波技術識別駕駛員變道意圖,解決了傳統(tǒng)駕駛輔助系統(tǒng)在遇到不良駕駛習慣,如未使用轉向燈時,對駕駛意圖識別造成的影響;深度學習模型基于神經網絡,其能通過多層非線性變換來建立駕駛數據與駕駛意圖之間的映射關系,莊皓等[4]基于Attention機制,構建了一種CNN-LSTM駕駛意圖識別模型,其能準確識別駕駛員的意圖;基于規(guī)則的駕駛意圖識別依托于設定的規(guī)則庫,對駕駛員的意圖進行判斷,Bocklisch等[5]基于自適應模糊模式,實現(xiàn)在識別左換道和右換道行為上的準確率分別達到89.3%和86.3%;車輛移動軌跡預測領域,馮雷[6]采用多項式模型對換道車輛橫向移動軌跡進行擬合,實現(xiàn)對換道車輛橫向移動距離以及換道時間的預測。
上述方法有效提升了駕駛意圖識別和估計預測的準確率,但仍存在以下問題:在特征提取方面,難以獲取基于當前環(huán)境的有效特征;將車輛未來軌跡特征加入識別模型中,能有效提升識別準確率。當前研究多基于歷史軌跡,尚未考慮未來軌跡。
針對以上問題,本文基于深度學習模型、規(guī)則模型和判別模型的思想,提出一種基于VectorNet、隨機森林的駕駛意圖識別模型,主要貢獻為:
(1)基于VectorNet的軌跡預測:該方法將車輛的歷史軌跡和環(huán)境信息整合作為輸入,利用VectorNet算法來預測未來的軌跡。通過這種方式,可以更準確地預測車輛的運動軌跡,為智能駕駛系統(tǒng)提供更可靠的決策依據。
(2)基于隨機森林算法的駕駛意圖識別:該方法通過對歷史軌跡數據進行駕駛行為標注,結合軌跡預測,應用隨機森林算法來準確識別駕駛員的意圖。這一方法的優(yōu)勢在于能夠提高模型的準確率,為智能駕駛系統(tǒng)的設計和優(yōu)化提供了重要支持。
2 模型描述
2.1 整體描述
本文提出的駕駛意圖識別框架由基于圖神經網絡的軌跡預測模塊和基于隨機森林的駕駛意圖識別模塊組成。圖神經網絡模塊通過將車輛軌跡及周邊環(huán)境信息作為輸入,進而輸出未來軌跡。駕駛意圖識別模塊則基于軌跡預測模塊得出的駕駛軌跡,應用決策樹的方法判別駕駛員的駕駛行為。兩個模塊共同完成駕駛意圖識別任務。
2.2 軌跡預測模塊
本文中軌跡預測模塊參考Gao等[7]提出的VectorNet框架,該框架首先對車輛軌跡和高清地圖進行矢量化,隨后基于各子圖的局部信息聚合得到全局信息,之后基于圖神經網絡進行軌跡預測,下文簡要概述該框架原理。
2.2.1 車輛軌跡及高清地圖的表示
本文中將高清地圖向量化處理,經處理后的行駛場景中的元素以向量、閉合形狀和點的形式存在。對于地圖特征,本文在相同的空間距離均勻采樣關鍵點,并將相鄰的關鍵點依次連接成向量;對于軌跡,本文用固定時間間隔采樣關鍵點,并將關鍵點依次連接。即將折線中的每個向量視為圖中的一個節(jié)點,數學表達式如下:
其中和分別為起點和終點的坐標,為屬性特征,j為的標識符,表示。
2.2.2 構造向量子圖
為保證語義局部性,本文基于向量元素構建分層子圖,屬于同一折線的所有向量節(jié)點首位連接。一條折線定義為,本文將子圖傳播的單個層定義為:
(2)
式中,為子圖網絡l層的節(jié)點特征,為輸入特征,函數為映射各節(jié)點信息,聚合所有鄰近節(jié)點信息,為節(jié)點與其鄰近節(jié)點的關系運算符。為一個多層感知器,為一個最大池化操作,為串聯(lián)操作。
2.2.3 全局圖構建
為訓練子圖間的關系,構成圖神經網絡框架,本文基于向量子圖構建全局交互圖。
式中,為折線節(jié)點特征集,為對應圖神經網絡的單層,A為折線節(jié)點集的鄰接矩陣,將A作為全連接圖得到如下公式:
其中,P為節(jié)點特征矩陣,、、均為其線性投影。待訓練完成后,本文對agent對應節(jié)點進行解碼,得到未來軌跡,如下公式所示:
式中,為GNN的總層數,為軌跡解碼器。
2.3 駕駛意圖識別模塊
本研究基于駕駛軌跡預測數據,應用隨機森林法進行分類。隨機森林算法的特點是通過構建多個決策樹來大規(guī)模復雜數據集,其能有效避免過擬合現(xiàn)象。本文的隨機森林算法采用Bagging方法,從訓練集中隨機抽樣出多個子集,每個子集作為每個決策樹的訓練數據集。最終,通過投票機制集成各樹的預測結果。
3 數據預處理
本文采用了Argoverse公開數據集,該數據集包含三十多萬條車輛軌跡,并且數據是通過激光雷達、環(huán)形攝像頭和前置立體攝像頭采集的。這些數據涵蓋了采樣車輛周邊200米的行駛情景,為研究提供了豐富的真實場景數據支持。
3.1 特征篩選
在實際車輛駕駛過程中,駕駛意圖是車輛駕駛態(tài)勢、周邊環(huán)境信息等多種因素共同作用的結果。本文提出的駕駛意圖識別方法綜合了四種主要信息,包括車輛態(tài)勢、周邊車輛信息、道路信息和歷史軌跡,可以將車輛自身轉化為若干段向量組成的折線,為后續(xù)的操作提供基礎。本文的需將車輛行駛的環(huán)境向量化,例如行車軌跡、行駛車道線可以被轉化為若干段折線段,交通斑馬線可以被轉化為一段密閉四邊形。具體的轉化過程如下圖1、2所示。
3.2 駕駛意圖標注
駕駛車輛涉及一系列復雜的操作,包括變道、加速、減速等多種行為。這些操作受到多個因素的綜合影響,如駕駛人的個體狀態(tài)、車輛狀況、周圍交通環(huán)境以及其他車輛的行駛行為等。為準確識別駕駛意圖,本文首先基于歷史數據對未來車輛軌跡進行預測。通過對行車歷史數據中的駕駛行為進行學習,推斷駕駛人在未來可能采取的駕駛行為。
本文中駕駛意圖主要包括橫向和縱向駕駛意圖,橫向駕駛意圖包含左、右變道,縱向駕駛意圖包括加速、減速和直行。
3.2.1 橫向意圖識別
橫向駕駛意圖主要包括左變道和右變道。換道信息需要提取的主要信息包括換道起點、換道終點和發(fā)生車道變化的時刻,本文的換道判別方法參照趙建東等[8]的論文,判別方式如下:
式中,和分別為換道行為起始和終止的時間;為車輛跨越車道線的時間;為車輛跨越車道線的橫向坐標;為車輛在時刻的橫向坐標;為車道的寬度。
3.2.2 縱向意圖識別
縱向駕駛意圖主要包括加速、減速和直行,本文中的縱向駕駛意圖是根據車輛的加速度值來劃分,具體縱向意圖參照莊皓等[4]的論文,劃分如表1所示。
3.3 軌跡序列提取
本文采用滑動窗口的方法實現(xiàn)對軌跡序列的有效提取,方法將軌跡序列劃分為多個子序列,以更好地捕捉軌跡中的關鍵特征,將軌跡序列的長度限定為80,以確保充分覆蓋關鍵信息。設置滑動窗口的長度為1,以實現(xiàn)對每一步中的微小信息變化進行捕獲。此外,將行駛軌跡子序列的5秒處時刻的換道標簽視為整個序列的換道意圖。
最終,將處理完的數據按照3:1:1的比例劃分成訓練集、測試集和驗證集,該數據集中共劃分出五種意圖,分別用數字0到4來表示,其中,0表示左變道,1表示右變道,2表示加速,3表示減速,4表示直行,各種換道意圖類型的樣本數量如表2所示。
4 模塊性能分析
為了更好的驗證本文模型的性能,本文采用精確率、召回率、F1-Score 和準確率等指標,將VectorNet-隨機森林與LSTM-隨機森林進行對比,兩種模型的結果如表3。
5 結語
本研究提出了一種基于VectorNet-隨機森林的駕駛意圖識別模型,該模型的優(yōu)勢為較為準確的實現(xiàn)較短時間內駕駛意圖的預測。本研究將繼續(xù)探索模型的改進方法,以進一步提升模型的準確率。該技術可嵌入智能交通系統(tǒng),以實現(xiàn)對多車環(huán)境下駕駛員的駕駛意圖識別并基于此對可能出現(xiàn)的駕駛事故進行預警。
參考文獻:
[1]SINGH S. Critical Reasons for Crashes Investigated in the National Motor Vehicle Crash Causation Survey[J]. mag, 2015.
[2]宋大治,張海桃,陳敦惠,等.全自動無人駕駛對綜合監(jiān)控系統(tǒng)的需求研究[J].交通世界,2021(21):1-3.
[3]LI K, WANG X, XU Y, et al. Lane changing intention recognition based on speech recognition models[J]. Transportation Research Part C: Emerging Technologies, 2016,69: 497-514.
[4]莊皓.面向高速環(huán)境下基于LSTM的駕駛人意圖識別關鍵技術研究[D].濟南:齊魯工業(yè)大學,2023.
[6]馮雷.換道車輛橫向移動軌跡預測研究[J].交通世界,2021(19):150-151.
[7]GAOJ,SUNC,ZHAOH,etal.VectorNet:EncodingHDMapsandAgentDynamicsfromVectorizedRepresentation,2020.
[8]趙建東,趙志敏,屈云超,等.軌跡數據驅動的車輛換道意圖識別研究[J].交通運輸系統(tǒng)工程與信息,2022,22(04):63-71.