李宇寂 魯奉軍 王迪 尚秉旭
(中國(guó)第一汽車股份有限公司 智能網(wǎng)聯(lián)開發(fā)院,長(zhǎng)春 130013)
主題詞: 無(wú)人駕駛 行為決策 變道決策
隨著無(wú)人駕駛技術(shù)的飛速發(fā)展,無(wú)人駕駛汽車的運(yùn)行環(huán)境也從單一的封閉場(chǎng)地?cái)U(kuò)展到普通的開放城市道路,城市道路的最基本工況是車道保持和車道變換。隨著車輛上布置的傳感器不斷豐富,無(wú)人駕駛系統(tǒng)可以從周圍環(huán)境獲得更多的信息,從而為車輛自主判斷行為決策帶來(lái)可能。然而即使是有經(jīng)驗(yàn)的駕駛員在做變道動(dòng)作的時(shí)候也是格外小心,因此無(wú)人駕駛系統(tǒng)進(jìn)行變道行為分析需要非常的準(zhǔn)確和謹(jǐn)慎,才能保證足夠的安全性,這也正是目前為止還沒有非常完善的無(wú)人駕駛變道系統(tǒng)的原因。針對(duì)無(wú)人車的行為決策難題,不同的學(xué)者提出了多種方法來(lái)輔助車輛進(jìn)行自主決策:熊璐[1]對(duì)無(wú)人駕駛系統(tǒng)的行為決策技術(shù)現(xiàn)狀做了綜述,提出目前行為決策技術(shù)主要分基于規(guī)則的決策和基于學(xué)習(xí)的決策兩大方向;杜明博[2]提出通過決策樹的計(jì)算來(lái)進(jìn)行車輛動(dòng)作的判斷;陳佳佳[3]提出一種新的駕駛行為灰色理想值逼近模型,用于進(jìn)行決策評(píng)判,使得被選方案不僅在空間位置上與最優(yōu)方案較為接近,同時(shí),其模型形狀也貼近于最優(yōu)方案。
本文提出一種新穎和精確的變道決策技術(shù),其整個(gè)系統(tǒng)的處理過程為:先根據(jù)不同決策(車道保持、向左換道和向右換道)所對(duì)應(yīng)的不同車輛周圍環(huán)境,計(jì)算其所生成的安全性指標(biāo)集,再將其乘以相應(yīng)的權(quán)重從而得到不同的安全性概率,最后選取最大的概率所對(duì)應(yīng)的車輛動(dòng)作作為最終行為決策的輸出。
有經(jīng)驗(yàn)的駕駛員使車輛的駕駛狀態(tài)一直處在自己的監(jiān)視中,并對(duì)其進(jìn)行評(píng)估,而這個(gè)評(píng)估的結(jié)果也就是當(dāng)時(shí)的駕駛風(fēng)險(xiǎn)。駕駛風(fēng)險(xiǎn)通常反映了駕駛員對(duì)當(dāng)前駕駛環(huán)境的理解,因此也很大程度上反映了無(wú)人駕駛車輛需要關(guān)注的環(huán)境風(fēng)險(xiǎn)以及不同風(fēng)險(xiǎn)對(duì)應(yīng)的重要程度。在變道行為決策中,有經(jīng)驗(yàn)的駕駛員主要關(guān)注車輛與前后左右障礙物的相對(duì)距離以及相對(duì)速度,選擇最安全的路線進(jìn)行行駛。無(wú)人駕駛車輛同樣需要結(jié)合周圍障礙物的相對(duì)位置關(guān)系以及相對(duì)速度關(guān)系來(lái)進(jìn)行接下來(lái)行為的判斷,選擇風(fēng)險(xiǎn)最小的駕駛行為決策。
根據(jù)車輛與障礙物的相對(duì)位置關(guān)系和相對(duì)速度關(guān)系選擇如下5類指標(biāo)作為變道行為的相關(guān)決定因素。
(1)車輛的車道居中指標(biāo)
(2)車輛與前方障礙物的相對(duì)距離
(3)車輛與后方障礙物的相對(duì)距離
(4)車輛與前方障礙物的安全性指標(biāo)
(5)車輛與后方障礙物的安全性指標(biāo)
車道居中指標(biāo):車輛在正常行駛時(shí),應(yīng)該盡量保持在道路中間,并且出于安全考慮不應(yīng)頻繁變道,所以將傳感器獲得的車輛與左右邊界的距離轉(zhuǎn)換成車輛的車道居中指標(biāo)。
車輛與前方障礙物的相對(duì)距離:車輛距離前方障礙物的距離能有效反映車輛是否處于安全狀態(tài),該距離越長(zhǎng)車輛越安全。車輛在當(dāng)前時(shí)刻進(jìn)行車道保持或者向左變道,向右變道決策時(shí),與前方障礙物存在不同的相對(duì)位置關(guān)系,從而得到不同的相對(duì)距離指標(biāo)。
車輛與后方障礙物的相對(duì)距離:同車輛與前方障礙物的相對(duì)距離指標(biāo),車輛在當(dāng)前時(shí)刻進(jìn)行車道保持或者左右換道決策時(shí),與后方障礙物存在不同的相對(duì)位置關(guān)系,從而得到不同的相對(duì)距離。
車輛與前方障礙物的安全性指標(biāo):車輛距離前后方障礙物的安全距離雖然能一定程度上反映車輛的安全狀態(tài),但由于車輛與障礙物的相對(duì)速度也會(huì)影響車輛的安全狀態(tài),所以必須要同時(shí)引入相對(duì)距離和相對(duì)速度才能得到車輛與前方障礙物的安全性指標(biāo)。
車輛與后方障礙物的安全性指標(biāo):與車輛與前方障礙物的安全性指標(biāo)類似,區(qū)別僅在于研究對(duì)象變?yōu)檐囕v后方的障礙物。
在無(wú)人駕駛的行為決策中,不同指標(biāo)在決策中所起作用的大小是不同的,正如有經(jīng)驗(yàn)的駕駛員會(huì)將更多的精力放在與前車距離的控制上,而將較少的精力用于使車輛保持在車道線中央。因此為了準(zhǔn)確地輸出變道決策無(wú)人駕駛策略的研究者需要給不同的指標(biāo)更準(zhǔn)確的描述,將指標(biāo)集根據(jù)影響因素的大小分成主要指標(biāo)和次要指標(biāo),并配以不同的權(quán)重,最終組成合理的屬性指標(biāo)集。
為了完成上述5類指標(biāo)的定量計(jì)算,需要車輛多個(gè)傳感器輸入不同的感知信息,需求的傳感器信號(hào)輸入如表1所示。
表1 傳感器信號(hào)輸入
車輛在正常行駛時(shí),應(yīng)該盡量保持處在道路中央,并且出于安全考慮不應(yīng)該經(jīng)常變道,所以可以將傳感器輸出的車輛與左右邊界的距離轉(zhuǎn)換成車輛居中的指標(biāo),計(jì)算如下:
如圖1,Distance1和Distance2如表1所示為車輛與左右兩側(cè)邊界的距離,DistanceMax為車輛距離左右兩側(cè)道路邊界距離差的最大值。
車輛距離前后方障礙物的距離通常能有效的反應(yīng)車輛是否處于安全的狀態(tài),距離越遠(yuǎn)越安全,由于傳感器的有效探測(cè)距離是有限的,所以可以設(shè)定安全距離為其探測(cè)的最大有效范圍,認(rèn)為前方或者后方障礙物距離在其有效范圍以外是安全距離,此時(shí)車輛可以繼續(xù)車道保持行駛。
圖1 車輛前后和左右道路邊界的距離
如表1,DistanceX表示車輛與前后方障礙物的距離 (Distance3,Distance4,Distance5,Distance6,Distance7,Distance8);DistanceSafe為設(shè)定的安全距離
車輛距離前后方障礙物的安全距離指標(biāo)雖然能一定程度上反應(yīng)車輛的安全狀態(tài),但由于車輛與障礙物的相對(duì)速度也會(huì)影響車輛的安全狀態(tài),所以必須要同時(shí)引入相對(duì)距離和相對(duì)速度才能得到車輛與障礙物的安全性指標(biāo)
參看圖1,DistanceX表示車輛與前后方障礙物的 距 離(Distance3,Distance4,Distance5,Distance6,Distance7,Distance8),RangeRateX表示車輛與前后方障 礙 物 的 相 對(duì) 速 度(RangeRate1,RangeRate2,RangeRate3,RangeRate4,RangeRate5,RangeRate6),RangeAcceleration為設(shè)定的相對(duì)加速度,WarningDistance為根據(jù)當(dāng)前相對(duì)速度和相對(duì)加速度計(jì)算的安全警示距離。
在求解多屬性決策問題的過程中,使用權(quán)重值來(lái)定量地表示屬性間相對(duì)的重要程度。設(shè)wj為屬性Cj的權(quán)重值,則有=1。采用經(jīng)典層次分析法來(lái)確定由熟練駕駛員駕駛經(jīng)驗(yàn)制定的決策矩陣主觀權(quán)重,針對(duì)駕駛員選取相應(yīng)駕駛行為所關(guān)注因素的不同,對(duì)熟練駕駛員進(jìn)行問卷調(diào)查,獲取駕駛決策過程中的主要屬性值,確定各屬性基于駕駛經(jīng)驗(yàn)的權(quán)重。
雖然很多因素都會(huì)影響車輛在當(dāng)前情況下的行為決策,但不同的因素對(duì)最終決策影響度是不同的,因此需要對(duì)不同因素賦予不同的權(quán)重。通常認(rèn)為車輛的車道居中指標(biāo)和相對(duì)距離指標(biāo)只能部分反映車輛所處的安全狀態(tài),車輛的安全性指標(biāo)更能決定車輛與前后方障礙物的安全性,所以實(shí)際策略中會(huì)對(duì)車輛的安全性指標(biāo)賦予更大的權(quán)重。最終的決策輸出為先根據(jù)不同的指標(biāo)乘以相應(yīng)的權(quán)重得到不同的安全性概率,再選取最大的概率所對(duì)應(yīng)的車輛動(dòng)作,作為最終行為決策的輸出。
其中Pr obVector表示車輛執(zhí)行不同動(dòng)作(車道保持、向左變道和向右變道)所對(duì)應(yīng)的安全性概率向量,IndexMatr ix表示車輛的決策矩陣(由車道居中指標(biāo)、相對(duì)距離指標(biāo)和安全性指標(biāo)構(gòu)成),WeightVector表示不同指標(biāo)賦予的權(quán)重。
為驗(yàn)證變道決策算法的正確性,在紅旗H7車型上進(jìn)行實(shí)車驗(yàn)證,通過激光雷達(dá)獲得車輛周圍障礙物的信息,在Autobox(快速原型控制器)上運(yùn)行變道決策模型計(jì)算決策輸出,實(shí)際測(cè)試時(shí),讓車輛分別以不同的速度三次接近前方障礙車輛,最終得到如下三組實(shí)驗(yàn)結(jié)果。
圖2 數(shù)據(jù)序列分析結(jié)果
結(jié)合圖2和圖3可以看出:
(1)車輛在這輪試驗(yàn)中以不同的相對(duì)速度總共進(jìn)行了3次靠近障礙物的試驗(yàn),分別在不同的相對(duì)距離下得到了3次變道決策的輸出。
圖3 向左變道采集的數(shù)據(jù)系列分析
(2)從圖2可以看出,實(shí)車的試驗(yàn)過程中,在一定的相對(duì)速度下,當(dāng)車輛與前方障礙物距離小于決策的分界點(diǎn)時(shí),系統(tǒng)會(huì)輸出向左變道的決策。
(3)從圖3可以看出,前兩次變道決策輸出時(shí),車輛與障礙物的相對(duì)速度比較一致此時(shí)決策的分界點(diǎn)也較接近,最后一次變道決策輸出時(shí),車輛與障礙物的相對(duì)速度比前兩次大,此時(shí)決策的分界點(diǎn)對(duì)應(yīng)的相對(duì)距離明顯大于前兩次變道命令輸出的相對(duì)距離。
本文為無(wú)人駕駛汽車設(shè)計(jì)了一套精確的變道行為決策系統(tǒng),通過傳感器感知車輛周圍不同障礙車輛的相對(duì)位置關(guān)系,計(jì)算其所生成的安全性指標(biāo)集,再將其乘以相應(yīng)的權(quán)重從而得到不同的安全性概率,最后選取最大的概率所對(duì)應(yīng)的車輛動(dòng)作作為最終行為決策的輸出。
在復(fù)雜的交通環(huán)境下,安全保守的駕駛決策是最穩(wěn)妥的駕駛策略,即使對(duì)于有經(jīng)驗(yàn)的駕駛員變道超車也不會(huì)是經(jīng)常的行為,本文提出的決策技術(shù)是定量計(jì)算各項(xiàng)指標(biāo)來(lái)決定決策輸出,并沒有完全借鑒熟練駕駛員的類人化駕駛策略,因此某些情況下不會(huì)是最舒適的決策;同時(shí)為了得到更高的通行效率,車輛可以在保證安全的前提下采用更激進(jìn)的變道決策,這樣就需要對(duì)影響變道決策的因素進(jìn)行更精細(xì)和全面的計(jì)算,同時(shí)結(jié)合通行效率的因素,這也正是未來(lái)的工作方向。