常嘉偉,施 衛(wèi),劉 斌,李展峰,封功源
(江蘇理工學(xué)院 機(jī)械工程學(xué)院,江蘇 常州 213000)
無(wú)人駕駛系統(tǒng)核心技術(shù)包括環(huán)境感知、行為決策、運(yùn)動(dòng)規(guī)劃與控制等方面,其中行為決策系統(tǒng)作為無(wú)人駕駛汽車的“大腦”,決定車輛行駛過(guò)程的安全性、有效性和合法性。因此,優(yōu)化提升無(wú)人駕駛行為決策系統(tǒng),使其盡可能地代替駕駛員,做到?jīng)Q策的“擬人化”,一直是研究者需要努力的方向。雖然在高速路段下的自動(dòng)輔助駕駛系統(tǒng)已較為成熟,并已大量商業(yè)化,但作為上層統(tǒng)籌的無(wú)人車行為決策系統(tǒng)仍因?qū)崟r(shí)性、安全性等方面的不足,無(wú)法應(yīng)對(duì)現(xiàn)實(shí)駕駛場(chǎng)景。尤其在城區(qū)路段,無(wú)人車輛需要面對(duì)更為復(fù)雜的導(dǎo)航需求和道路狀況,對(duì)周圍道路、障礙物、交通標(biāo)識(shí)、紅綠燈及全局導(dǎo)航信息需要有更為全面有效的評(píng)估,同時(shí)對(duì)周圍交通參與者的行為意圖也要有更為及時(shí)和精確的判斷。
面對(duì)當(dāng)前無(wú)人駕駛行為決策中的難題,狀態(tài)機(jī)模型是應(yīng)用最為廣泛的決策模型,即通過(guò)建立環(huán)境輸入與駕駛動(dòng)作之間的狀態(tài)遷移條件來(lái)實(shí)現(xiàn)駕駛過(guò)程中的決策任務(wù),它運(yùn)用簡(jiǎn)單、易于實(shí)現(xiàn),但無(wú)法有效應(yīng)對(duì)復(fù)雜工況和帶有不確定性場(chǎng)景?;谥R(shí)推理的決策模型對(duì)駕駛場(chǎng)景的描述清晰,控制邏輯合理,但隨著場(chǎng)景輸入條件的增多,容易出現(xiàn)規(guī)則的組合爆炸?;谏疃葘W(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的決策方法透明性差,同時(shí)依賴于大規(guī)模的數(shù)據(jù)訓(xùn)練,訓(xùn)練時(shí)間較長(zhǎng)。貝葉斯網(wǎng)絡(luò)是基于統(tǒng)計(jì)的決策模型,對(duì)于不確定場(chǎng)景下的決策推理,有較高的置信度。但是其網(wǎng)絡(luò)建模存在維度災(zāi)難,條件概率分布表(Conditional Probability Table,CPT)需考慮的數(shù)量隨著節(jié)點(diǎn)數(shù)量呈指數(shù)級(jí)增長(zhǎng)。
采用有向無(wú)環(huán)圖可以顯著降低貝葉斯網(wǎng)絡(luò)建模的維度,同時(shí)如何設(shè)計(jì)合理的網(wǎng)絡(luò)結(jié)構(gòu)也就成了研究的難點(diǎn)。本體作為一種能在知識(shí)層次上描述知識(shí)模型的建模工具,可以統(tǒng)一、規(guī)范地描述場(chǎng)景知識(shí),但其本身并不具備獨(dú)立的推理能力。通過(guò)本體理論對(duì)駕駛周邊道路場(chǎng)景進(jìn)行合理的建模,以知識(shí)邏輯推理將決策任務(wù)合理拆分,選擇對(duì)應(yīng)所需的本體信息構(gòu)建有向無(wú)環(huán)圖。通過(guò)先驗(yàn)信息和專家經(jīng)驗(yàn)生成CPT文件,即可構(gòu)建完整的貝葉斯網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)推理功能。最后通過(guò)貝葉斯網(wǎng)絡(luò)(Bayesian Network, BN)推理得到當(dāng)前駕駛環(huán)境下的最佳行為模式。
本體是一種統(tǒng)一的、規(guī)范的知識(shí)描述方法,通常用來(lái)描述領(lǐng)域知識(shí)。運(yùn)用本體知識(shí)可以將駕駛場(chǎng)景概念化,分解歸納為合理類集,同時(shí)清楚地表達(dá)概念類之間的屬性關(guān)系。
根據(jù)無(wú)人駕駛場(chǎng)景中需要考慮的環(huán)境因素,設(shè)定道路類、行為類、對(duì)象類、自身車輛類四種基礎(chǔ)概念類別,同時(shí)引入安全類和目的類兩類直接作用于行為決策的上層概念類集。
(1)道路類表示與道路相關(guān)的信息要素,包括車道數(shù)、車道線、路面標(biāo)記、路段類型等。
(2)行為類表示無(wú)人車輛可以執(zhí)行的駕駛動(dòng)作,分為橫向行為與縱向行為。為了更為簡(jiǎn)化,將單獨(dú)的駕駛動(dòng)作組合為完整的駕駛模式,包括直道行駛:自適應(yīng)巡航控制(Adaptive Cruise Control, ACC)&車道保持輔助功能(Lane Keeping Assistance, LKA)、左變道、右變道和緊急制動(dòng)。
(3)對(duì)象類表示當(dāng)前道路上存在對(duì)象,包括車輛、行人、障礙物等。
(4)自身車輛類表示自身車輛狀態(tài),主要包括自車與其他車輛或障礙物的相對(duì)速度、距離等。
(5)安全類是基于其他基礎(chǔ)類別的上層判定類別,判定結(jié)果直接決定行為類的輸出。
(6)目的類表示服務(wù)于當(dāng)前駕駛行程的有效性,為換道行為提供主要參考依據(jù)。
駕駛場(chǎng)景分類如圖1所示。
考慮到無(wú)人車駕駛行為決策主要服務(wù)于最終的輸出模式,即本體中的行為類,因此,其父節(jié)點(diǎn)應(yīng)為行為類中各項(xiàng)的直接影響因素,同時(shí)每一節(jié)點(diǎn)的設(shè)計(jì)都應(yīng)考慮到安全性、合法性、有效性三個(gè)角度。
導(dǎo)航信息直接決定本次駕駛?cè)蝿?wù)的有效性,若無(wú)法到達(dá)目的地,整個(gè)駕駛過(guò)程將無(wú)意義。因此,當(dāng)前路段的導(dǎo)航信息為確定性要求,即到路口時(shí)是否需要左轉(zhuǎn)或右轉(zhuǎn)是確定的。但是導(dǎo)航信息無(wú)法直接轉(zhuǎn)換為變道條件,變道行為還需考慮到當(dāng)前道路是否滿足變道條件,即左右車道線的虛實(shí)以及此時(shí)本車道與周邊車道的安全性。
安全類作為行為決策的父節(jié)點(diǎn)之一,提供當(dāng)前道路環(huán)境的安全性依據(jù)。為駕駛過(guò)程帶來(lái)不確定因素的是其他車輛的駕駛動(dòng)作,它的影響主要體現(xiàn)在本車跟車和變道的過(guò)程中,同時(shí)直接決定了當(dāng)前駕駛的安全性。無(wú)人車決策前,應(yīng)知道當(dāng)前車道以及左右車道安全與否,因此,設(shè)定G,G,G作為行為決策的三個(gè)父節(jié)點(diǎn),分別代表左車道、本車道以及右車道的安全性。
換道意圖的產(chǎn)生不僅僅取決于當(dāng)前駕駛?cè)蝿?wù)的目的性,在保證駕駛方向正確與行駛安全的基礎(chǔ)上,適當(dāng)?shù)某囆袨橐彩邱{駛更順暢的關(guān)鍵。為避免持續(xù)地跟車行駛導(dǎo)致整個(gè)駕駛?cè)蝿?wù)的總時(shí)長(zhǎng)過(guò)大,引入限速達(dá)成度(SpeedLimitDisparity)作為換道超車行為的參考依據(jù)。當(dāng)車輛在跟車狀態(tài)下與限速上限差值超過(guò)20%的時(shí)間到達(dá)閾值,則視為超出容忍度,可以進(jìn)行換道超車,因此,限速達(dá)成度也作為最終決策的父節(jié)點(diǎn)之一。
最終無(wú)人駕駛行為決策受到三大類別共5個(gè)父節(jié)點(diǎn)的影響,其本體知識(shí)模型如圖2所示。
在此基礎(chǔ)上,安全類主要與自身車輛類、對(duì)象類相關(guān)聯(lián)。目標(biāo)車道是否安全,主要取決于車道上的交通參與對(duì)象,即其他車輛、障礙物(Obstacle)、行人以及他們此時(shí)的狀態(tài)。
基于導(dǎo)航的換道需求(LaneChangeDemand)是由導(dǎo)航信息直接決定的,以車輛為主體,當(dāng)所在車道與導(dǎo)航(Navigation)信息相匹配,則無(wú)換道需求,反之,則需進(jìn)行換道準(zhǔn)備。同時(shí)換道行為受到左右車道線的約束,當(dāng)車道線為實(shí)線,則無(wú)法進(jìn)行換道。
因此,可以建立城區(qū)交通環(huán)境下的無(wú)人駕駛行為決策本體模型,如圖3所示。
其條件概率公式為
根據(jù)貝葉斯定理可得
式中,()為類“先驗(yàn)”概率;(,)為樣本相對(duì)于類標(biāo)記的條件概率。
貝葉斯的推理過(guò)程是指在網(wǎng)絡(luò)結(jié)構(gòu)和CPT已知的情況下,計(jì)算某個(gè)變量取值的最大概率。本文主要基于的后驗(yàn)概率問(wèn)題來(lái)決定無(wú)人車輛當(dāng)下應(yīng)該采取的駕駛動(dòng)作。后驗(yàn)概率問(wèn)題是指在已知一些節(jié)點(diǎn)概率的基礎(chǔ)上,再根據(jù)新的先驗(yàn)概率,通過(guò)貝葉斯公式修正,得到后驗(yàn)概率,取對(duì)應(yīng)節(jié)點(diǎn)中概率值最大的狀態(tài)作為無(wú)人車輛的動(dòng)作輸出。
利用貝葉斯網(wǎng)絡(luò)的推理過(guò)程如圖4所示。
將上文中的無(wú)人駕駛行為決策本體模型中的節(jié)點(diǎn)及其父子關(guān)系映射為貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。本體模型中每一類集中的每一對(duì)象即可成為貝葉斯網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),本體理論中的對(duì)象屬性則可映射為有向無(wú)環(huán)圖中的有向邊。相對(duì)于本體模型,新構(gòu)建的貝葉斯網(wǎng)絡(luò)只需為各個(gè)節(jié)點(diǎn)添加合理的狀態(tài)變量及其可能的取值。貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)變量及其狀態(tài)取值如表1所示。C表示與后車碰撞可能較高,即1.7 s<≤3.5 s。
Behavior節(jié)點(diǎn)包含四種狀態(tài),作為無(wú)人車行為決策的最終輸出,分別對(duì)應(yīng)四種駕駛模式:LKC+ACC的直道駕駛模式、向左換道模式、向右換道模式以及自主剎車模式;G、G、G三個(gè)節(jié)點(diǎn)分別對(duì)應(yīng)左中右三車道的安全性,有安全和危險(xiǎn)兩種狀態(tài),若無(wú)左或右車道,則同樣歸類為危險(xiǎn);PresentLane節(jié)點(diǎn)表示本車當(dāng)前所處車道(駕駛場(chǎng)景默認(rèn)為三車道);LaneChangeDemand表示根據(jù)導(dǎo)航(Navigation)以及左右車道線約束給出的換道建議;Left(Center/Right)LaneCondition表示本車與對(duì)應(yīng)道路上其他車輛之間的相互行駛狀態(tài),引入兩車從沖突開始到發(fā)生碰撞的時(shí)間(Time To Contact, TTC)作為評(píng)價(jià)車輛狀態(tài)安全與否的指標(biāo),TTC越小表示兩車越容易發(fā)生碰撞。評(píng)估公式為
式中,為跟隨車與被跟隨車的相對(duì)距離;為跟隨車的速度;為被跟隨車的速度。
節(jié)點(diǎn)中狀態(tài)含義如下:
C表示即將與前車碰撞,即≤1.7 s;
C表示即將與后車碰撞,即≤1.7 s;
C表示與前車碰撞可能較高,即1.7 s<≤3.5 s;
C表示與前后車不會(huì)發(fā)生碰撞,即>3.5 s&>3.5 s。
構(gòu)建完整的有向無(wú)環(huán)圖后,需要根據(jù)歷史駕駛案例和專家經(jīng)驗(yàn)確定每個(gè)節(jié)點(diǎn)的條件概率表。
沒有父節(jié)點(diǎn)的變量在決策系統(tǒng)中是作為外部環(huán)境感知的輸入,只需給節(jié)點(diǎn)一個(gè)初始概率。G、G、G和LaneChangeDemand節(jié)點(diǎn)都有一個(gè)以上的父節(jié)點(diǎn),以G和LaneChangeDemand節(jié)點(diǎn)為例,G節(jié)點(diǎn)的條件概率分布如表2所示。
LaneChangeDemand節(jié)點(diǎn)的部分條件概率分布如表3所示。
完整的貝葉斯網(wǎng)絡(luò)構(gòu)建完成,即可根據(jù)先驗(yàn)信息推理當(dāng)前最佳駕駛行為。
Netica是當(dāng)下最為流行的可視化貝葉斯推理工具,它的優(yōu)點(diǎn)是可以圖形化,簡(jiǎn)易快速地建立貝葉斯網(wǎng)絡(luò)。本文通過(guò)Netica作為貝葉斯網(wǎng)絡(luò)的推理工具,并驗(yàn)證上文構(gòu)建網(wǎng)絡(luò)的有效性。
本文采用Prescan仿真軟件來(lái)預(yù)設(shè)駕駛場(chǎng)景,預(yù)設(shè)駕駛場(chǎng)景為城區(qū)道路環(huán)境下的一個(gè)十字路口,如圖4所示。
該十字路口為雙向六車道,規(guī)定限速為60 km/h,場(chǎng)景(1)如圖5所示。本車(紅色小車)行駛在中間車道,距離路口尚且有一段距離,其左右和前方車道都有車輛在行駛。本車目前行駛速度為50 km/h,中間車道最前方車輛(車輛1)因即將駛?cè)肼房?,故開始減速,車輛1后方車輛(車輛2)未開始減速,仍保持48 km/h的速度行駛,與本車距離為8 m,左車道兩車均以55 km/h的速度行駛,右車道車輛(車輛3)以54 km/h的速度行駛,車身超出本車車頭3 m。
根據(jù)導(dǎo)航本車需在該路口右轉(zhuǎn),傳感器獲取的當(dāng)前道路信息作為先驗(yàn)條件,貝葉斯網(wǎng)絡(luò)給出的判斷如圖6所示。由圖6可以看出,保持當(dāng)前車道行駛的概率為90%,制動(dòng)的概率為10%。雖然目前有向右換道的需求,但是右方車道不滿足換道條件,因此,車輛仍將保持直道行駛。
駕駛場(chǎng)景(2)如圖7所示。
車輛1減速后,車輛2緊跟著減速,本車在看到前車剎車燈亮起后也開始減速,由此,車輛3與本車的速度差變大,兩車之間的前后距離也隨之增加。貝葉斯網(wǎng)絡(luò)給出的判斷如圖7所示。
向右換道的概率為90%,直道行駛和制動(dòng)的概率分別為8%和2%。由于向右換道的需求持續(xù)存在,在此時(shí)刻,右方車輛與本車已經(jīng)拉開了距離,右車道具備了換道條件,因此,本車可以順利地做出向右換道的選擇。
駕駛場(chǎng)景(2)的BN如圖8所示。
本文通過(guò)本體知識(shí)推理建立城區(qū)駕駛場(chǎng)景本體模型,再映射為貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)模型的推理功能,通過(guò)最大后驗(yàn)概率選擇當(dāng)前最佳無(wú)人駕駛行為,最后在Prescan中設(shè)置駕駛場(chǎng)景并通過(guò)Netica建立貝葉斯網(wǎng)絡(luò)驗(yàn)證該模型在一般場(chǎng)景中的可行性。該方法能有效地利用當(dāng)前道路因素,并反應(yīng)它們之間的相互關(guān)系,通過(guò)增設(shè)安全類與目的類使繁多的類別合并以降低建模的維度,同時(shí)使設(shè)計(jì)能更好地符合安全性、合法性、有效性的初衷。貝葉斯網(wǎng)絡(luò)面對(duì)城區(qū)復(fù)雜多變的駕駛場(chǎng)景也有較高魯棒性,通過(guò)父節(jié)點(diǎn)與子節(jié)點(diǎn)的連接可以更直觀地反應(yīng)道路因素與駕駛行為間的因果關(guān)系。在面對(duì)城區(qū)復(fù)雜駕駛環(huán)境時(shí),本方法能使車輛較好地判斷當(dāng)前最優(yōu)駕駛行為。