【摘要】以自動(dòng)駕駛場(chǎng)景庫(kù)為研究對(duì)象,通過(guò)分析當(dāng)前自動(dòng)駕駛場(chǎng)景庫(kù)的不足和行業(yè)需求,研究形成基于真實(shí)交通數(shù)據(jù)的自動(dòng)駕駛場(chǎng)景生成規(guī)范。首先,對(duì)場(chǎng)景要素和格式進(jìn)行說(shuō)明和規(guī)范;其次,通過(guò)場(chǎng)景挖掘、自動(dòng)化標(biāo)簽處理和數(shù)據(jù)合規(guī)脫敏生成場(chǎng)景數(shù)據(jù)集;最后,通過(guò)對(duì)真實(shí)場(chǎng)景的風(fēng)險(xiǎn)評(píng)估以及對(duì)異常事件場(chǎng)景的標(biāo)準(zhǔn)化加工最終形成安全合規(guī)、高質(zhì)量、高價(jià)值的城市級(jí)挑戰(zhàn)性場(chǎng)景庫(kù)。
關(guān)鍵詞:交通數(shù)據(jù) 自動(dòng)駕駛 場(chǎng)景庫(kù) 數(shù)據(jù)合規(guī)
中圖分類號(hào):U467.1+3" "文獻(xiàn)標(biāo)志碼:A" "DOI: 10.20104/j.cnki.1674-6546.20240059
Research on Autonomous Driving Scenarios Library Based on Real Traffic Data
(Beijing Connected and Autonomous Vehicles Technology Co., Ltd., Beijing 100176)
【Abstract】This paper takes the autonomous driving scenario library as the research object,and by analyzing shortcomings of autonomous driving scenario library and industry demand, and formes a set of operation guidelines for autonomous driving scenarios construction based on real world traffic data. Firstly, the elements and formats of autonomous driving scenarios have been illustrated and standardized. Secondly, scenario datasets are generated by a three-step procedure, including scenario mining, automated annotating and data compliance desensitization. Finally, a set of safe, compliant, high-quality, and high-value city level challenging autonomous driving scenarios was ultimately formed by risk assessment of real collection scenarios and standardized processing of abnormal events.
Key words: Traffic data, Autonomous driving, Scenario library, Data compliance
【引用格式】 鄭方丹, 宋娟, 路鵬飛. 基于真實(shí)交通數(shù)據(jù)的自動(dòng)駕駛場(chǎng)景庫(kù)研究[J]. 汽車工程師, 2024(7): 11-17.
ZHENG F D, SONG J, LU P F. Research on Autonomous Driving Scenarios Library Based on Real Traffic Data[J]. Automotive Engineer, 2024(7): 11-17.
1 前言
隨著自動(dòng)駕駛技術(shù)的快速發(fā)展,行業(yè)愈發(fā)認(rèn)識(shí)到基于真實(shí)道路測(cè)試存在高成本、高耗時(shí)等局限性,模擬仿真測(cè)試可以作為道路測(cè)試的重要補(bǔ)充,從仿真測(cè)試到封閉場(chǎng)地測(cè)試,再到開放道路測(cè)試的測(cè)試路徑早已成為共識(shí)。因此,仿真技術(shù)的研究和應(yīng)用受到廣泛關(guān)注,數(shù)據(jù)集和場(chǎng)景庫(kù)作為仿真測(cè)試的基礎(chǔ),在自動(dòng)駕駛技術(shù)測(cè)試驗(yàn)證和優(yōu)化過(guò)程中具有重要作用,其數(shù)據(jù)來(lái)源的真實(shí)性和多樣性對(duì)自動(dòng)駕駛技術(shù)的發(fā)展尤為重要[1-5]。
國(guó)內(nèi)外自動(dòng)駕駛科技企業(yè)、整車企業(yè)和模擬仿真測(cè)試企業(yè)都在積極協(xié)調(diào)行業(yè)資源,建設(shè)自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集和場(chǎng)景庫(kù)。其中,國(guó)內(nèi)外第三方測(cè)試服務(wù)企業(yè)先后公開發(fā)布了多個(gè)自動(dòng)駕駛數(shù)據(jù)集,涵蓋普通障礙物檢測(cè)、信號(hào)燈識(shí)別、行人檢測(cè)等多種通用場(chǎng)景,可以支撐開展自動(dòng)駕駛測(cè)試驗(yàn)證活動(dòng)[6-7]。與此同時(shí),國(guó)外領(lǐng)先的自動(dòng)駕駛科技企業(yè)特斯拉,正在基于自身龐大的用戶存量,利用眾采方式收集大量的交通場(chǎng)景,并從中挖掘高價(jià)值的異常事件場(chǎng)景和事故場(chǎng)景,開展場(chǎng)景重建,可顯著提升自動(dòng)駕駛算法的測(cè)試和訓(xùn)練效果。相比之下,國(guó)內(nèi)的場(chǎng)景數(shù)據(jù)集和場(chǎng)景庫(kù)開發(fā)主要依賴場(chǎng)景泛化,場(chǎng)景庫(kù)的真實(shí)度較低,且大多數(shù)場(chǎng)景庫(kù)所涵蓋的場(chǎng)景依然以普通車輛的運(yùn)行場(chǎng)景為主,與自動(dòng)駕駛車輛的運(yùn)行模式存在較大差異。
基于真實(shí)交通情況的數(shù)據(jù)集和場(chǎng)景庫(kù)越來(lái)越受到自動(dòng)駕駛科技企業(yè)和整車企業(yè)的重視,但在數(shù)據(jù)安全層面,業(yè)內(nèi)相關(guān)企業(yè)尚未建立起完善的數(shù)據(jù)安全共享流程和保障辦法,同時(shí)缺少專業(yè)的自動(dòng)駕駛數(shù)據(jù)安全治理工具,使得場(chǎng)景數(shù)據(jù)的流轉(zhuǎn)面臨安全合規(guī)風(fēng)險(xiǎn)[8]。
針對(duì)行業(yè)在自動(dòng)駕駛數(shù)據(jù)集和場(chǎng)景庫(kù)方面的迫切需求,考慮國(guó)家對(duì)汽車行業(yè)日趨嚴(yán)格的數(shù)據(jù)安全合規(guī)要求,本文重點(diǎn)研究基于真實(shí)交通數(shù)據(jù)的自動(dòng)駕駛場(chǎng)景庫(kù)建設(shè)方法,提出能夠滿足數(shù)據(jù)安全合規(guī)要求的自動(dòng)駕駛景庫(kù)搭建方法。
2 自動(dòng)駕駛場(chǎng)景定義
2.1 自動(dòng)駕駛場(chǎng)景要素
自動(dòng)駕駛場(chǎng)景可以概括描述為自動(dòng)駕駛車輛與其所在道路交通環(huán)境的總和,包括靜態(tài)道路信息、動(dòng)態(tài)交通狀況、天氣等環(huán)境信息等諸多要素的集合。場(chǎng)景作為上述要素的抽象與映射,本質(zhì)上闡述了要素組成及其內(nèi)部邏輯關(guān)系,是場(chǎng)景庫(kù)搭建的理論基礎(chǔ),同時(shí)也是技術(shù)開發(fā)的基礎(chǔ),能夠幫助自動(dòng)駕駛系統(tǒng)識(shí)別和理解路面環(huán)境、其他車輛及行人等各種不同的交通參與者,并作出正確決策。
在自動(dòng)駕駛場(chǎng)景庫(kù)構(gòu)建方面,世界各國(guó)政府及智能汽車產(chǎn)業(yè)都給予了相當(dāng)?shù)闹匾暋5聡?guó)的PEGASUS項(xiàng)目提出了6層場(chǎng)景模型,用于指導(dǎo)構(gòu)建標(biāo)準(zhǔn)化的智能汽車系統(tǒng)開發(fā)和測(cè)試驗(yàn)證場(chǎng)景庫(kù);自動(dòng)化及測(cè)量系統(tǒng)標(biāo)準(zhǔn)協(xié)會(huì)(Association for Standardization of Automation and Measuring systems,ASAM)在此基礎(chǔ)上建立了仿真領(lǐng)域的OpenX系列虛擬仿真測(cè)試場(chǎng)景標(biāo)準(zhǔn)體系;美國(guó)國(guó)家高速公路交通安全管理局(National Highway Traffic Safety Administration,NHTSA)發(fā)布了關(guān)于自動(dòng)駕駛測(cè)試場(chǎng)景和用例的框架;在國(guó)內(nèi),中國(guó)汽車技術(shù)研究中心、中國(guó)道路交通事故深入研究(China In-Depth Accident Study,CIDAS)項(xiàng)目、百度Apollo、國(guó)汽(北京)智能網(wǎng)聯(lián)汽車研究院有限公司等也開展了諸多相關(guān)工作。
本文采用OpenX標(biāo)準(zhǔn)的6層模型場(chǎng)景描述架構(gòu),6層場(chǎng)景要素分別為道路、交通基礎(chǔ)設(shè)施、臨時(shí)路況、對(duì)象、環(huán)境、數(shù)字信息。如圖1所示:第1層為道路層,包括車道數(shù)量、特殊車道等靜態(tài)信息要素,用于描述場(chǎng)景的靜態(tài)道路環(huán)境;第2層為交通基礎(chǔ)設(shè)施,用于描述場(chǎng)景的地物信息;第3層為臨時(shí)路況,指第1層和第2層上的臨時(shí)操作,用于描述場(chǎng)景的動(dòng)態(tài)環(huán)境信息;第4層為交通狀況,是場(chǎng)景的核心內(nèi)容;第5層為環(huán)境,用于描述場(chǎng)景的氣象環(huán)境信息;第6層為數(shù)字信息。
2.2 自動(dòng)駕駛場(chǎng)景格式
為實(shí)現(xiàn)場(chǎng)景仿真測(cè)試、場(chǎng)景元素組合、場(chǎng)景微調(diào)、場(chǎng)景復(fù)用等多種需求下的場(chǎng)景應(yīng)用,必須定義標(biāo)準(zhǔn)化的場(chǎng)景文件格式。目前,國(guó)際上較為通用的場(chǎng)景文件格式為ASAM提出的OpenX仿真標(biāo)準(zhǔn)系列,即OpenDRIVE及OpenSCENARIO,前者實(shí)現(xiàn)地圖解析,后者實(shí)現(xiàn)場(chǎng)景轉(zhuǎn)換,兩者均以統(tǒng)一建模語(yǔ)言(Unified Modeling Language,UML)數(shù)據(jù)模型為基礎(chǔ),可以導(dǎo)出xml格式的拓展文件。
OpenDRIVE定義仿真場(chǎng)景中的靜態(tài)內(nèi)容,包括道路幾何形狀、車道數(shù)量、道路沿線特征、車道限速標(biāo)志和信號(hào)燈等影響車輛通行的交通標(biāo)志以及道路基礎(chǔ)設(shè)施,描述仿真中的道路環(huán)境信息;OpenSCENARIO定義仿真場(chǎng)景中的動(dòng)態(tài)內(nèi)容,包括車輛的軌跡路線、速度距離變化、換道偏移等復(fù)雜的、同時(shí)發(fā)生的車輛操作動(dòng)作,描述仿真中道路上或道路外活動(dòng)的車輛或行人的行為。將OpenDRIVE和OpenSCENARIO搭配使用,能夠完整描述一個(gè)包含靜態(tài)信息和動(dòng)態(tài)信息的仿真測(cè)試場(chǎng)景,滿足自動(dòng)駕駛仿真、虛擬測(cè)試、開發(fā)和驗(yàn)證需求。
2.3 自動(dòng)駕駛場(chǎng)景來(lái)源
自動(dòng)駕駛場(chǎng)景的數(shù)據(jù)來(lái)源于真實(shí)數(shù)據(jù)和仿真數(shù)據(jù),如圖2所示。前者是真實(shí)道路交通情況的數(shù)字映射,后者是模擬仿真情況的參數(shù)設(shè)定,可通過(guò)邏輯推演獲得。
真實(shí)數(shù)據(jù)來(lái)源于自然駕駛數(shù)據(jù)、事故數(shù)據(jù)、路側(cè)單元采集到的數(shù)據(jù)、封閉場(chǎng)地測(cè)試數(shù)據(jù)和開放道路測(cè)試數(shù)據(jù)。自然駕駛數(shù)據(jù)是通過(guò)在汽車上加裝攝像頭、雷達(dá)等多類傳感器,在車輛正常行駛過(guò)程中采集到的包含各場(chǎng)景要素的數(shù)據(jù);事故數(shù)據(jù)是各國(guó)家、地區(qū)、城市記錄存儲(chǔ)的交通事故數(shù)據(jù),基于這些數(shù)據(jù)能夠分析提煉出適用于自動(dòng)駕駛場(chǎng)景測(cè)試的特征要素;路側(cè)單元數(shù)據(jù)是來(lái)源于交通、路政、車路協(xié)同等政府部門和企業(yè)在交叉路口、主次干道、事故多發(fā)路段等處搭設(shè)的路側(cè)單元雷達(dá)、攝像頭等設(shè)備采集到的場(chǎng)景要素?cái)?shù)據(jù);封閉場(chǎng)地測(cè)試和開放道路測(cè)試數(shù)據(jù)來(lái)源于企業(yè)在自動(dòng)駕駛車輛研發(fā)測(cè)試、示范應(yīng)用和商業(yè)化試點(diǎn)過(guò)程中,在測(cè)試場(chǎng)或測(cè)試示范區(qū)道路等地采集到的場(chǎng)景要素?cái)?shù)據(jù)。
仿真數(shù)據(jù)來(lái)源于仿真測(cè)試過(guò)程中,通過(guò)人為設(shè)定軟件(虛擬仿真系統(tǒng))和硬件(駕駛模擬器等)參數(shù),使測(cè)試車輛在設(shè)置的駕駛?cè)蝿?wù)或行駛路線下進(jìn)行虛擬場(chǎng)景測(cè)試,從而產(chǎn)生的仿真場(chǎng)景數(shù)據(jù)。
本文的數(shù)據(jù)來(lái)源于真實(shí)交通環(huán)境,對(duì)國(guó)內(nèi)智能網(wǎng)聯(lián)示范區(qū)范圍內(nèi)產(chǎn)生的車端、路側(cè)、地圖等自動(dòng)駕駛數(shù)據(jù)進(jìn)行高效提煉和加工,形成高真實(shí)度、特色鮮明且具備行業(yè)應(yīng)用價(jià)值的自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集和異常事件場(chǎng)景庫(kù),在安全合規(guī)的框架內(nèi)通過(guò)異常事件場(chǎng)景共享系統(tǒng)面向自動(dòng)駕駛科技企業(yè)、整車企業(yè)、模擬仿真測(cè)試服務(wù)企業(yè)、研究機(jī)構(gòu)等提供高價(jià)值、標(biāo)準(zhǔn)化且安全合規(guī)的場(chǎng)景服務(wù)。圍繞國(guó)內(nèi)智能網(wǎng)聯(lián)示范區(qū)運(yùn)營(yíng)過(guò)程中產(chǎn)生的全方位車端和路側(cè)自動(dòng)駕駛數(shù)據(jù)以及地圖數(shù)據(jù),開發(fā)自動(dòng)駕駛場(chǎng)景挖掘引擎,本文對(duì)采集的真實(shí)自動(dòng)駕駛數(shù)據(jù)開展特色場(chǎng)景挖掘,提煉出具備高應(yīng)用價(jià)值的自動(dòng)駕駛脫離場(chǎng)景、緊急制動(dòng)場(chǎng)景、復(fù)雜交通流場(chǎng)景等,并對(duì)場(chǎng)景進(jìn)行自動(dòng)化剪裁和標(biāo)簽處理,形成自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集,供相關(guān)企業(yè)開展場(chǎng)景庫(kù)開發(fā)工作。
3 自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集構(gòu)建
3.1 自動(dòng)駕駛場(chǎng)景挖掘
在自動(dòng)駕駛場(chǎng)景庫(kù)建設(shè)過(guò)程中,遍歷了國(guó)內(nèi)智能網(wǎng)聯(lián)示范區(qū)60 km2范圍內(nèi)近800輛自動(dòng)駕駛車輛和330多個(gè)智能化路口的真實(shí)自動(dòng)駕駛運(yùn)行數(shù)據(jù),挖掘出1 000余條高價(jià)值的自動(dòng)駕駛真實(shí)異常事件場(chǎng)景,通過(guò)場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估,挖掘出100余例自動(dòng)駕駛危險(xiǎn)工況和事故場(chǎng)景,并從數(shù)據(jù)庫(kù)中檢索場(chǎng)景相關(guān)的車路協(xié)同感知數(shù)據(jù),包含全量交通參與者的位置、速度、航向角、目標(biāo)物類型等真實(shí)運(yùn)行數(shù)據(jù),通過(guò)場(chǎng)景還原工具轉(zhuǎn)化為OpenX格式仿真場(chǎng)景數(shù)據(jù)。
自動(dòng)駕駛場(chǎng)景建設(shè)的第一步是對(duì)自動(dòng)駕駛汽車運(yùn)行過(guò)程中發(fā)生的異常事件進(jìn)行自動(dòng)化識(shí)別。目前,針對(duì)已有數(shù)據(jù)資源,可采用車輛運(yùn)行狀態(tài)數(shù)據(jù)濾波優(yōu)化和視頻圖像數(shù)據(jù)特征識(shí)別兩條技術(shù)路線實(shí)現(xiàn)異常事件的自動(dòng)挖掘。
其中,基于車輛運(yùn)行狀態(tài)數(shù)據(jù)的濾波優(yōu)化是通過(guò)監(jiān)測(cè)智能網(wǎng)聯(lián)汽車當(dāng)前運(yùn)行模式(driveMode)字段,自動(dòng)判斷自動(dòng)駕駛系統(tǒng)退出或被接管的異常事件,并分析自動(dòng)駕駛車輛的實(shí)際運(yùn)行數(shù)據(jù),包括加速度、航向角變化率、駕駛行為等與異常事件發(fā)生頻次之間的關(guān)聯(lián)度,如圖3所示,通過(guò)設(shè)定運(yùn)行數(shù)據(jù)閾值篩選異常事件場(chǎng)景。在實(shí)際應(yīng)用中,可對(duì)車輛運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行滑動(dòng)濾波,以去除數(shù)據(jù)噪聲,提升場(chǎng)景識(shí)別準(zhǔn)確率。
視頻圖像數(shù)據(jù)的場(chǎng)景特征識(shí)別以特殊訓(xùn)練的基于自監(jiān)督一致性學(xué)習(xí)框架的交通事故檢測(cè)(Traffic Accident Detection for driving systems by proposing a Self-Supervised Consistency learning framework,SSC-TAD)為基礎(chǔ),吸收幀預(yù)測(cè)框架和軌跡預(yù)測(cè)框架的性能優(yōu)點(diǎn),從幀外觀一致性、目標(biāo)運(yùn)動(dòng)一致性和場(chǎng)景上下文一致性三個(gè)方面對(duì)異常事件場(chǎng)景檢測(cè)進(jìn)行建模,如圖4所示。使用上下文表示模塊提取參與者內(nèi)部以及整個(gè)視頻幀的信息關(guān)系,并設(shè)計(jì)一個(gè)圖生成式對(duì)抗網(wǎng)絡(luò)(Graph Generative Adversarial Networks,GraphGAN)模型來(lái)訓(xùn)練視覺(jué)場(chǎng)景上下文生成器和判別器,根據(jù)預(yù)先定義的多任務(wù)損失函數(shù)判斷每一幀中異常事件的發(fā)生概率。
上述場(chǎng)景挖掘工作將挖掘自動(dòng)駕駛脫離場(chǎng)景、急減速場(chǎng)景、緊急制動(dòng)場(chǎng)景、異常低速場(chǎng)景、超速場(chǎng)景、自動(dòng)駕駛退出場(chǎng)景、復(fù)雜交通流場(chǎng)景和高速公路運(yùn)行場(chǎng)景等8類具備高應(yīng)用價(jià)值的場(chǎng)景。與這些場(chǎng)景相關(guān)的自動(dòng)駕駛車輛運(yùn)行數(shù)據(jù)還需要進(jìn)行整理和清洗,以提升數(shù)據(jù)質(zhì)量,滿足場(chǎng)景還原要求。
數(shù)據(jù)清洗過(guò)程中,除根據(jù)路側(cè)設(shè)備可信空間范圍裁剪數(shù)據(jù)規(guī)模外,還需要通過(guò)軌跡匹配識(shí)別自動(dòng)駕駛車輛編號(hào)(ID),從而為還原后的動(dòng)態(tài)場(chǎng)景提供主視角,如圖5所示。
同時(shí),還需要針對(duì)感知設(shè)備精度造成的數(shù)據(jù)質(zhì)量問(wèn)題進(jìn)行修復(fù),如圖6所示,包括:采用長(zhǎng)短時(shí)記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)算法,對(duì)由車輛遮擋、檢測(cè)丟失等問(wèn)題引起的車輛軌跡斷續(xù)的情況進(jìn)行修正,基于車輛的歷史軌跡點(diǎn),實(shí)現(xiàn)對(duì)中間缺失值的差值補(bǔ)全;基于指數(shù)和多項(xiàng)式平滑算法糾正車輛航向角偏差;基于采用匈牙利匹配算法與卡爾曼濾波并融合豐富微觀交通運(yùn)動(dòng)特征的時(shí)空軌跡歷史數(shù)據(jù),實(shí)現(xiàn)同目標(biāo)軌跡匹配,從而消除同一目標(biāo)ID不一致的問(wèn)題。
3.2 自動(dòng)化標(biāo)簽處理
自動(dòng)駕駛場(chǎng)景來(lái)源于采集的真實(shí)自動(dòng)駕駛車輛運(yùn)行狀態(tài)數(shù)據(jù),是構(gòu)建自動(dòng)駕駛測(cè)試場(chǎng)景的基礎(chǔ)來(lái)源。自動(dòng)化標(biāo)簽處理是場(chǎng)景庫(kù)建設(shè)的第二步?;趯?duì)包含自動(dòng)駕駛車輛所處的人、車、環(huán)境等信息的全方位數(shù)據(jù)分析,通過(guò)對(duì)場(chǎng)景數(shù)據(jù)的挖掘,研究交通環(huán)境和駕駛行為特征,完成對(duì)場(chǎng)景的理解和場(chǎng)景要素的特征提取與類聚,并可通過(guò)場(chǎng)景要素的重組,衍生出更多合理的場(chǎng)景,為后續(xù)場(chǎng)景數(shù)據(jù)庫(kù)建設(shè)奠定基礎(chǔ)。
場(chǎng)景構(gòu)成要素包括車、路、行駛環(huán)境等,對(duì)多種要素進(jìn)行組合,存在無(wú)限豐富、極其復(fù)雜、不確定性強(qiáng)的特點(diǎn)。現(xiàn)階段,各機(jī)構(gòu)沒(méi)有形成統(tǒng)一的場(chǎng)景定義標(biāo)準(zhǔn),場(chǎng)景的理解、定義及合理高效、明確統(tǒng)一的場(chǎng)景要素分類方式研究,是場(chǎng)景庫(kù)構(gòu)建的開始和關(guān)鍵,對(duì)于建立場(chǎng)景庫(kù)模型非常必要。本文以采集到的自動(dòng)駕駛場(chǎng)景數(shù)據(jù)為依據(jù)具體開展場(chǎng)景定義和場(chǎng)景要素分類研究,從測(cè)試車輛、靜態(tài)環(huán)境、動(dòng)態(tài)環(huán)境、交通參與者和氣象環(huán)境的角度對(duì)場(chǎng)景要素進(jìn)行分析,提出場(chǎng)景要素分類體系。根據(jù)場(chǎng)景要素分類體系分析自動(dòng)駕駛交通環(huán)境場(chǎng)景和異常事件的場(chǎng)景要素及場(chǎng)景主體要素,對(duì)場(chǎng)景的各種動(dòng)、靜態(tài)元素進(jìn)行特征提取,研究場(chǎng)景信息提取與挖掘理論,設(shè)計(jì)場(chǎng)景提取的算法,實(shí)現(xiàn)場(chǎng)景的提??;根據(jù)場(chǎng)景要素分類體系構(gòu)建通用的場(chǎng)景要素層次模型,分析各維度場(chǎng)景要素的可能屬性,設(shè)計(jì)場(chǎng)景要素標(biāo)注模型,為場(chǎng)景數(shù)據(jù)統(tǒng)一標(biāo)準(zhǔn)化的要素標(biāo)注提供依據(jù);通過(guò)元素之間的關(guān)聯(lián)關(guān)系對(duì)場(chǎng)景元素進(jìn)行重新組合及通過(guò)基于人工經(jīng)驗(yàn)的標(biāo)注方式進(jìn)行場(chǎng)景組合形成新的典型性場(chǎng)景,從而形成自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集。
3.3 數(shù)據(jù)合規(guī)脫敏
近年來(lái),國(guó)家高度重視汽車數(shù)據(jù)安全。自動(dòng)駕駛作為汽車領(lǐng)域涉及海量數(shù)據(jù)交互流轉(zhuǎn)的典型代表,場(chǎng)景庫(kù)數(shù)據(jù)來(lái)源涉及對(duì)大量個(gè)人信息和道路環(huán)境信息的采集和加工處理。因此,考慮場(chǎng)景庫(kù)的數(shù)據(jù)安全合規(guī)需求,在完成自動(dòng)化標(biāo)簽處理后,需要對(duì)個(gè)人隱私信息和道路標(biāo)志等可能涉及重要數(shù)據(jù)的部分進(jìn)行脫敏處理。
本文開發(fā)并部署了針對(duì)自動(dòng)駕駛場(chǎng)景庫(kù)的數(shù)據(jù)脫敏系統(tǒng),利用FlowCV底層技術(shù),感知多平臺(tái)、多數(shù)據(jù)端、多種類型數(shù)據(jù),經(jīng)由分布式數(shù)據(jù)處理框架進(jìn)行視頻、圖片等內(nèi)容的關(guān)鍵敏感信息檢測(cè),從而形成關(guān)聯(lián)敏感數(shù)據(jù)網(wǎng)絡(luò)。研發(fā)人員可以通過(guò)系統(tǒng)提供的規(guī)則引擎,在數(shù)據(jù)網(wǎng)絡(luò)中發(fā)現(xiàn)特定的敏感內(nèi)容,并對(duì)視頻、圖片等敏感內(nèi)容進(jìn)行脫敏處理。數(shù)據(jù)脫敏系統(tǒng)工作流程如圖7所示,包含數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)脫敏三大模塊。
其中,數(shù)據(jù)處理模塊用于識(shí)別視頻中的敏感信息,包括:人臉、車牌、時(shí)間戳、路口標(biāo)志、路牌;重要敏感區(qū)域的地理信息、人員流量、車輛流量,如軍事管理區(qū);反映經(jīng)濟(jì)運(yùn)行情況的數(shù)據(jù),如車輛流量等。該模塊采用金字塔解析網(wǎng)絡(luò)(Pyramid Scene Parsing Network,ESPNet)作為目標(biāo)檢測(cè)分割網(wǎng)絡(luò),并將傳統(tǒng)高效空間金字塔(Efficient spatial pyramid,ESP)模塊中的逐點(diǎn)卷積改為分組的逐點(diǎn)卷積,以進(jìn)一步提升網(wǎng)絡(luò)效率,并降低過(guò)擬合。采用歸一化指數(shù)函數(shù)(Softmax函數(shù))作為損失函數(shù),將多個(gè)神經(jīng)元的輸出映射到(0,1)區(qū)間內(nèi),從而將輸出視為概率來(lái)解釋目標(biāo)識(shí)別結(jié)果。
數(shù)據(jù)脫敏模塊基于系統(tǒng)定義的脫敏策略,對(duì)視頻中的敏感信息進(jìn)行脫敏處理(馬賽克、模糊等),生成脫敏后的視頻和圖片,包括服務(wù)器模塊、數(shù)據(jù)讀取模塊、目標(biāo)檢測(cè)模塊、馬賽克處理模塊、轉(zhuǎn)碼子模塊和靜態(tài)服務(wù)器模塊。數(shù)據(jù)脫敏模塊能夠?qū)崿F(xiàn)對(duì)敏感信息的位置檢測(cè),獲得敏感信息位置數(shù)據(jù)并輸入馬賽克處理模塊,輸出RGB圖片數(shù)據(jù)信息,進(jìn)而將上一階段輸出的RGB圖片數(shù)據(jù)暫存到一個(gè)臨時(shí)視頻文件中,利用轉(zhuǎn)碼模塊對(duì)臨時(shí)視頻文件進(jìn)行壓縮轉(zhuǎn)碼,輸出最終的視頻文件,其工作流程如圖8所示。
4 自動(dòng)駕駛異常事件場(chǎng)景庫(kù)開發(fā)
4.1 自動(dòng)駕駛運(yùn)行風(fēng)險(xiǎn)評(píng)估
在自動(dòng)駕駛異常事件場(chǎng)景庫(kù)開發(fā)過(guò)程中,為進(jìn)一步提升場(chǎng)景庫(kù)應(yīng)用價(jià)值,以及后續(xù)基于場(chǎng)景庫(kù)開展的模擬仿真測(cè)試工作的價(jià)值密度,對(duì)識(shí)別出的異常事件場(chǎng)景進(jìn)行風(fēng)險(xiǎn)評(píng)估,目的是從異常事件場(chǎng)景中進(jìn)一步篩選出存在較高事故風(fēng)險(xiǎn)的場(chǎng)景,用于后續(xù)場(chǎng)景庫(kù)開發(fā)。
為綜合定量評(píng)估自動(dòng)駕駛車輛的交通運(yùn)行風(fēng)險(xiǎn),本文結(jié)合國(guó)內(nèi)智能網(wǎng)聯(lián)示范區(qū)交通特征和駕駛行為習(xí)慣,全面考慮道路線形與道路類型等設(shè)施因素、天氣等環(huán)境因素、交通流量等交通因素、機(jī)動(dòng)車與行人等道路使用者因素,提出自動(dòng)駕駛汽車開放測(cè)試安全風(fēng)險(xiǎn)評(píng)估方法。安全風(fēng)險(xiǎn)度越低,安全度就越高,可開放給自動(dòng)駕駛汽車道路測(cè)試的可能性就越大。反之,安全風(fēng)險(xiǎn)度高的場(chǎng)景,對(duì)于自動(dòng)駕駛測(cè)試而言有利于解決“長(zhǎng)尾”問(wèn)題,真實(shí)場(chǎng)景的危險(xiǎn)性使得該類場(chǎng)景庫(kù)的開發(fā)更具價(jià)值且更為迫切,基于高運(yùn)行風(fēng)險(xiǎn)的真實(shí)場(chǎng)景開發(fā)出的自動(dòng)駕駛場(chǎng)景庫(kù)的價(jià)值就越高、應(yīng)用意義越大。本文通過(guò)分析交通安全風(fēng)險(xiǎn)因素、制定風(fēng)險(xiǎn)評(píng)估方法及流程,實(shí)現(xiàn)自動(dòng)駕駛事件場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估。
4.1.1 自動(dòng)駕駛車輛的交通運(yùn)行風(fēng)險(xiǎn)致因因素分析
綜合考慮交通基礎(chǔ)設(shè)施、交通工程設(shè)施、交通流量、非機(jī)動(dòng)車與行人、交通環(huán)境等因素,結(jié)合自動(dòng)駕駛交通事件以及接管情況數(shù)據(jù),解析自動(dòng)駕駛車輛交通安全風(fēng)險(xiǎn)致因因素,定量分析各致因因素對(duì)自動(dòng)駕駛車輛運(yùn)行風(fēng)險(xiǎn)的影響程度。
4.1.2 自動(dòng)駕駛車輛的交通運(yùn)行風(fēng)險(xiǎn)評(píng)估方法
自動(dòng)駕駛車輛在感知、執(zhí)行、決策方面與人工駕駛車輛均存在明顯區(qū)別,本文構(gòu)建綜合考慮道路設(shè)施因素、環(huán)境因素、交通因素、道路使用者等類因素的自動(dòng)駕駛運(yùn)行風(fēng)險(xiǎn)評(píng)估指標(biāo),研究提出自動(dòng)駕駛運(yùn)行風(fēng)險(xiǎn)評(píng)估模型和方法,并對(duì)自動(dòng)駕駛運(yùn)行風(fēng)險(xiǎn)進(jìn)行分級(jí)。
4.1.3 自動(dòng)駕駛事件場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估系統(tǒng)
在評(píng)估指標(biāo)和方法研究的基礎(chǔ)上,研究自動(dòng)駕駛事件場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估系統(tǒng)的功能框架,開發(fā)自動(dòng)駕駛事件場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估系統(tǒng),面向自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集開展高風(fēng)險(xiǎn)異常事件場(chǎng)景的挖掘,結(jié)合自動(dòng)駕駛真實(shí)交通數(shù)據(jù),開展自動(dòng)駕駛場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估,總結(jié)提煉自動(dòng)駕駛交通安全風(fēng)險(xiǎn)評(píng)估流程,形成自動(dòng)駕駛交通安全風(fēng)險(xiǎn)評(píng)估標(biāo)準(zhǔn)。
4.2 異常事件場(chǎng)景標(biāo)準(zhǔn)化加工
本文以場(chǎng)景定義和場(chǎng)景元素為基礎(chǔ)理論體系,設(shè)計(jì)場(chǎng)景標(biāo)簽分類體系,以此為基礎(chǔ)完成數(shù)據(jù)預(yù)處理、場(chǎng)景標(biāo)注、場(chǎng)景提取、場(chǎng)景泛化、場(chǎng)景生成等數(shù)據(jù)處理過(guò)程,生成自動(dòng)駕駛場(chǎng)景文件夾和標(biāo)準(zhǔn)格式的OpenSCENARIO文件,如圖9所示。
利用預(yù)處理后且經(jīng)過(guò)場(chǎng)景運(yùn)行風(fēng)險(xiǎn)評(píng)估系統(tǒng)篩選的數(shù)據(jù)集,基于規(guī)則與機(jī)器學(xué)習(xí)的算法,針對(duì)指定的道路交通環(huán)境,依據(jù)主車行駛特點(diǎn)、主車與目標(biāo)物的相對(duì)狀態(tài)對(duì)典型場(chǎng)景進(jìn)行識(shí)別??商崛〉降膱?chǎng)景包括行人橫穿場(chǎng)景、會(huì)車場(chǎng)景、主車換道場(chǎng)景、跟車行駛場(chǎng)景、鄰車切入場(chǎng)景、前車切出場(chǎng)景、主車轉(zhuǎn)向場(chǎng)景和主車掉頭場(chǎng)景等,該方法用于實(shí)現(xiàn)對(duì)典型駕駛場(chǎng)景的離線自動(dòng)提取。
考慮到人工的思考力和經(jīng)驗(yàn)優(yōu)勢(shì),在標(biāo)注過(guò)程中加入人工校驗(yàn)環(huán)節(jié),目的是補(bǔ)充自動(dòng)標(biāo)注時(shí)部分沒(méi)有體現(xiàn)的標(biāo)簽,豐富場(chǎng)景標(biāo)簽,并自動(dòng)提取真值數(shù)據(jù),以優(yōu)化迭代自動(dòng)提取算法。利用預(yù)處理后的原始采集數(shù)據(jù),基于場(chǎng)景分類體系中的要素標(biāo)簽進(jìn)行標(biāo)注。標(biāo)注信息涵蓋自動(dòng)駕駛退出、緊急制動(dòng)、異常低速、復(fù)雜交通流、事故等9類典型真實(shí)異常事件類型,車輛、行人、非機(jī)動(dòng)車、交通標(biāo)志等10類道路常見(jiàn)障礙物目標(biāo),晴朗、雨雪、霧霾等7類天氣屬性,黑夜、逆光、復(fù)雜光照等5類光照條件屬性,以及濕滑路面、坑洼路面等3類行駛環(huán)境要素,如圖10所示。
利用高運(yùn)行風(fēng)險(xiǎn)場(chǎng)景數(shù)據(jù),提取出不同場(chǎng)景中的自車軌跡和目標(biāo)物軌跡,根據(jù)軌跡的航向角、速度和位置等特征進(jìn)行分析匯總,生成基礎(chǔ)軌跡庫(kù),為場(chǎng)景應(yīng)用打下基礎(chǔ)。測(cè)試應(yīng)用場(chǎng)景的主要目的是基于實(shí)際車輛行為生成定制化的測(cè)試用例場(chǎng)景,可用于決策和控制算法的測(cè)試和驗(yàn)證。真實(shí)世界中能夠獲得的事故場(chǎng)景或邊緣場(chǎng)景數(shù)量較少,且獲取方式難度較大,通常需要采用手工搭建的方式生成測(cè)試用例場(chǎng)景,而利用真實(shí)自動(dòng)駕駛數(shù)據(jù)進(jìn)行場(chǎng)景重建可以在保障場(chǎng)景可信度的情況下快速獲得所需的場(chǎng)景。
5 結(jié)束語(yǔ)
本文從行業(yè)當(dāng)前對(duì)挑戰(zhàn)性場(chǎng)景的高質(zhì)量需求出發(fā),提出基于真實(shí)交通數(shù)據(jù)的自動(dòng)駕駛場(chǎng)景庫(kù)建設(shè)方案。首先,對(duì)自動(dòng)駕駛場(chǎng)景的要素、格式和來(lái)源進(jìn)行了梳理和闡述;其次,逐步論述了自動(dòng)駕駛場(chǎng)景數(shù)據(jù)集的高效挖掘、自動(dòng)化標(biāo)簽處理和數(shù)據(jù)合規(guī)脫敏流程;最后,闡明了高價(jià)值挑戰(zhàn)性真實(shí)自動(dòng)駕駛場(chǎng)景庫(kù)的生成需經(jīng)過(guò)風(fēng)險(xiǎn)評(píng)估和標(biāo)準(zhǔn)化加工兩個(gè)階段。基于本文方法生成的場(chǎng)景庫(kù)在數(shù)據(jù)真實(shí)性、工況全面性和場(chǎng)景挑戰(zhàn)性方面均具備明顯優(yōu)勢(shì):事件集已形成超過(guò)50×104幀標(biāo)注圖片,涵蓋千余條自動(dòng)駕駛車路協(xié)同感知數(shù)據(jù);事件集已標(biāo)注10類道路常見(jiàn)障礙物目標(biāo)、7類天氣屬性、5類光照條件屬性以及3類路面環(huán)境要素,場(chǎng)景庫(kù)全面涵蓋全量交通參與者的位置、速度、航向角、目標(biāo)物類型等;異常事件集包含自動(dòng)駕駛系統(tǒng)退出、緊急制動(dòng)、復(fù)雜交通流等8類異常場(chǎng)景。
后續(xù)研究將繼續(xù)加強(qiáng)對(duì)更大范圍區(qū)域內(nèi)真實(shí)交通場(chǎng)景的異常事件提取,對(duì)更多種類的異常場(chǎng)景進(jìn)行分析挖掘,促進(jìn)生成OpenX標(biāo)準(zhǔn)格式仿真場(chǎng)景,為行業(yè)提供更豐富的仿真測(cè)試場(chǎng)景用例。
參考文獻(xiàn)
[1] 朱冰, 張培興, 趙健, 等. 基于場(chǎng)景的自動(dòng)駕駛汽車虛擬測(cè)試研究進(jìn)展[J]. 中國(guó)公路學(xué)報(bào), 2019, 32(6): 1-19.
ZHU B, ZHANG P X, ZHAO J, et al. Research Progress on Scene-Based Virtual Test of Autonomous Driving Vehicle[J]. China Journal of Highway and Transport, 2019, 32(6): 1-19.
[2] 王軍雷, 王亮亮, 王靜, 等. 基于專利分析的自動(dòng)駕駛汽車虛擬場(chǎng)景庫(kù)構(gòu)建技術(shù)研究[J]. 汽車技術(shù), 2022(12): 9-14.
WANG J L, WANG L L, WANG J, et al. Research on Autonomous Vehicle Virtual Scenario Construction Technologies Based on Patent Analysis[J]. Automobile Technology, 2022(12): 9-14.
[3] 郭柏蒼, 雒國(guó)鳳, 金立生, 等. 面向自動(dòng)駕駛虛擬測(cè)試的變道切入場(chǎng)景庫(kù)構(gòu)建方法[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2023, 53(11): 3130-3140.
GUO B C, LUO G F, JIN L S, et al. Construction Method of Cut-in Scenario Library for Automatic Driving Virtual Tests[J]. Journal of Jilin University (Engineering and Technology Edition), 2023, 53(11): 3130-3140.
[4] 曾杰, 譚龍, 丁雪聰, 等. 仿真測(cè)試在智能網(wǎng)聯(lián)汽車準(zhǔn)入測(cè)試的政策應(yīng)用與技術(shù)基礎(chǔ)分析[J]. 汽車文摘, 2022(10): 19-23.
ZENG J, TAN L, DING X C, et al. Analysis of Simulation Test Technology and Policy for Intelligent and Connected Vehicle Product Access Application[J]. Automotive Digest, 2022(10): 19-23.
[5] 蔣拯民, 黨少博, 李慧云, 等. 自動(dòng)駕駛汽車場(chǎng)景測(cè)試研究進(jìn)展綜述[J]. 汽車技術(shù), 2022(8): 10-22.
JIANG Z M, DANG S B, LI H Y, et al. A Survey on the Research Progress of Scenario-Based Testing for Autonomous Vehicles[J]. Automobile Technology, 2022(8): 10-22.
[6] 徐向陽(yáng), 胡文浩, 董紅磊, 等. 自動(dòng)駕駛汽車測(cè)試場(chǎng)景構(gòu)建關(guān)鍵技術(shù)綜述[J]. 汽車工程, 2021, 43(4): 610-619.
XU X Y, HU W H, DONG H L, et al. Review of Key Technologies for Autonomous Vehicle Test Scenario Construction[J]. Automotive Engineering, 2021, 43(4): 610-619.
[7] 徐向陽(yáng), 周兆輝, 胡文浩, 等. 基于事故數(shù)據(jù)挖掘的AEB路口測(cè)試場(chǎng)景[J]. 北京航空航天大學(xué)學(xué)報(bào), 2020, 46(10): 1817-1825.
XU X Y, ZHOU Z H, HU W H, et al. Intersection Test Scenarios for AEB Based on Accident Data Mining[J]. Journal of Beijing University of Aeronautics and Astronautics, 2020, 46(10): 1817-1825.
[8] 曾小松. 智能網(wǎng)聯(lián)汽車數(shù)據(jù)安全治理框架研究[J]. 智能網(wǎng)聯(lián)汽車, 2022(3): 22-26.
ZENG X S. Intersection Test Scenarios for AEB Based on Accident Data Mining[J]. Intelligent Connected Vehicles, 2022(3): 22-26.
(責(zé)任編輯 斛 畔)
修改稿收到日期為2024年3月25日。