張榮珅 王玉田 胡榮權(quán) 楊靈芳 黃 智
1.湖南大學(xué)機(jī)械與運(yùn)載工程學(xué)院,長(zhǎng)沙,410009 2.湖南大學(xué)土木工程學(xué)院,長(zhǎng)沙,410009
智能車輛的使用提高了道路交通安全性。由于技術(shù)制約和不可控因素,絕對(duì)安全的智能駕駛難以實(shí)現(xiàn)。當(dāng)智能車輛(本文特指具有自主避障能力的智能車輛)無(wú)法保障全部交通參與者的安全時(shí),將不可避免地陷入兩難困境。由于各種原因(如行人的突然出現(xiàn)或車輛制動(dòng)故障等),車輛無(wú)法同時(shí)避免對(duì)本車道及對(duì)向車道交通參與者的沖突,由此陷入兩難選擇:減速避障與本車道交通參與者發(fā)生碰撞,或?yàn)闇p小傷亡而轉(zhuǎn)向減速與對(duì)向車道交通參與者發(fā)生碰撞。
對(duì)于沖突不可避免的困境,有研究對(duì)避險(xiǎn)規(guī)劃中所涉及的因素人為設(shè)定優(yōu)先級(jí),以獲得最優(yōu)的避險(xiǎn)規(guī)劃。RASEKHIPOUR等[1]、WANG等[2]依據(jù)障礙物的可穿越性和碰撞傷害程度對(duì)障礙物進(jìn)行分級(jí)排序,其中人類被賦予最高優(yōu)先級(jí)。LUETGE[3]也提出人類在所有障礙物中必須具有最高優(yōu)先級(jí)。CASTRO等[4]、TUMOVA等[5]對(duì)駛?cè)肴诵械?、?duì)向車道等違反交通規(guī)則的駕駛行為進(jìn)行優(yōu)先級(jí)排序。裴曉飛等[6]對(duì)轉(zhuǎn)向、直行制動(dòng)等操作劃分優(yōu)先級(jí),避險(xiǎn)時(shí)選擇優(yōu)先級(jí)最高的操作。然而,基于優(yōu)先級(jí)的方法對(duì)于受傷害的各方均涉及人的困境難以給出合理避險(xiǎn)規(guī)劃。
兩難困境下的避險(xiǎn)決策涉及社會(huì)倫理問(wèn)題,倫理原則為解決困境下的避險(xiǎn)決策提供依據(jù)。多數(shù)研究者認(rèn)為智能車輛避險(xiǎn)決策應(yīng)遵守道義論和后果論[7-9]。THORNTON等[7]認(rèn)為后果論和道義論是最有效、最切實(shí)際的兩難困境避險(xiǎn)決策理論,并將后果論和道義論映射為兩難工況下避險(xiǎn)決策的代價(jià)和約束條件,力求符合道義論前提且最小后果的避險(xiǎn)決策。LIM等[10]強(qiáng)調(diào)智能車輛的避險(xiǎn)決策應(yīng)該與社會(huì)倫理價(jià)值觀、法規(guī)相結(jié)合。后果論追求最小沖突代價(jià),道義論強(qiáng)調(diào)對(duì)規(guī)則的遵守,倫理原則本身具有一定的復(fù)雜性并且難以用意義明確的數(shù)學(xué)模型描述。另外,對(duì)規(guī)則的絕對(duì)服從是不現(xiàn)實(shí)的,而違背規(guī)則的代價(jià)也難以量化,因此給兩難困境下應(yīng)用倫理原則解決避險(xiǎn)決策問(wèn)題帶來(lái)困難。
相對(duì)于道義論,后果論便于量化,研究者更傾向于通過(guò)獲得沖突中的代價(jià)損失,選擇最小代價(jià)的避險(xiǎn)決策[11-15]。RASEKHIPOUR等[12]提出根據(jù)碰撞相對(duì)速度、相對(duì)角度、相對(duì)質(zhì)量等建立代價(jià)模型??紤]沖突的不確定性,張東亞[13]以碰撞概率和傷亡概率的乘積為代價(jià)模型。KUMFER等[14]通過(guò)實(shí)驗(yàn)得出在特定的碰撞場(chǎng)景中,盡管其他倫理體系有助于建立機(jī)器學(xué)習(xí)開(kāi)發(fā)所需要的規(guī)則,但后果論具有減少事故中人員傷亡的優(yōu)點(diǎn)。PUGNETTI等[15]依據(jù)兩難困境中行人的年齡、性別、社會(huì)地位等性質(zhì)得到的生命價(jià)值代價(jià)進(jìn)行避險(xiǎn)決策。上述研究在計(jì)算代價(jià)損失時(shí),忽略了道義對(duì)代價(jià)的影響。無(wú)差別地計(jì)算處于道路不同位置(如行車道和人行道)的人的傷害代價(jià),顯然有悖于公眾的倫理價(jià)值觀。
綜上所述,現(xiàn)有研究工作未能有效解決沖突各方均涉及人的傷害的兩難困境的避險(xiǎn)決策問(wèn)題,對(duì)符合公眾倫理價(jià)值的沖突傷害代價(jià)的量化建模及規(guī)劃問(wèn)題優(yōu)化求解是解決兩難工況避險(xiǎn)決策的關(guān)鍵。
本文以兩難困境下智能車輛避險(xiǎn)規(guī)劃為研究對(duì)象,考慮碰撞傷害程度、法規(guī)、倫理和沖突不確定等因素,建立沖突各方中對(duì)人的傷害名義代價(jià)模型,以量化對(duì)人的代價(jià)損失。以名義代價(jià)為優(yōu)化目標(biāo),車輛物理系統(tǒng)限制為約束條件,構(gòu)建分層避險(xiǎn)軌跡規(guī)劃優(yōu)化問(wèn)題。設(shè)計(jì)了幾種典型的兩難困境場(chǎng)景,對(duì)提出方法的有效性及可行性進(jìn)行仿真驗(yàn)證。
盡管困境場(chǎng)景復(fù)雜多樣,但交通參與者可分為三類:本車乘員(U1)、當(dāng)前車道的道路使用者(U2)、非當(dāng)前車道的道路使用者(U3)。為便于表述,研究以圖1所示僅涉及U2和U3傷害的困境場(chǎng)景為例進(jìn)行探討,由于兩難困境發(fā)生在極短時(shí)間內(nèi),忽略U2和U3的運(yùn)動(dòng)。不失一般性,研究所提出的方法同樣適用于傷害涉及U1、U2和U3的復(fù)雜困境。
圖1 一種典型的兩難困境
困境沖突中,涉及對(duì)人、動(dòng)物及財(cái)產(chǎn)的侵害?;谌说纳辽显瓌t,在涉及對(duì)人傷害的沖突中,忽略動(dòng)物及財(cái)產(chǎn)的損失代價(jià),僅考慮對(duì)人傷害造成的代價(jià)。
名義代價(jià)為量綱一參數(shù),描述傷害的相對(duì)大小,不僅由生命健康損失所決定,還取決于法律、倫理道德等多個(gè)因素。采用名義代價(jià)可避免對(duì)人生命健康物化造成的倫理爭(zhēng)議。
沖突中對(duì)人的傷害是名義代價(jià)的主要構(gòu)成。傷亡人數(shù)及傷害程度是確定對(duì)人傷害代價(jià)的關(guān)鍵因素。盡管現(xiàn)實(shí)中人的性別、年齡、社會(huì)地位、親屬關(guān)系等均會(huì)影響傷害代價(jià)的量化,但對(duì)人的區(qū)分對(duì)待易引起倫理爭(zhēng)議,因此上述因素在名義代價(jià)建模時(shí)被忽略。
困境中避險(xiǎn)決策的實(shí)質(zhì)是在各交通參與者間進(jìn)行風(fēng)險(xiǎn)分配。以圖1工況為例,直行制動(dòng)避險(xiǎn)行為使U2承受碰撞風(fēng)險(xiǎn),轉(zhuǎn)向制動(dòng)避險(xiǎn)行為則通過(guò)違反規(guī)則(如逆向行駛)將風(fēng)險(xiǎn)從U2轉(zhuǎn)移至U3而獲得較小的社會(huì)總?cè)藛T傷害。公眾普遍存在兩個(gè)共識(shí):①將風(fēng)險(xiǎn)轉(zhuǎn)移至無(wú)辜的第三方是不道德的行為;②道路使用者應(yīng)該承擔(dān)意外的風(fēng)險(xiǎn),自動(dòng)駕駛應(yīng)當(dāng)挽救更多人的生命。同時(shí),違反規(guī)則總會(huì)給智能車輛的使用者(或所有者)帶來(lái)額外的法律風(fēng)險(xiǎn)和道德壓力,即使違反規(guī)則可能會(huì)降低總的人員傷害。因此,上述倫理、法律因素應(yīng)在量化對(duì)U2和U3傷害的名義代價(jià)時(shí)體現(xiàn)。
如前述,名義代價(jià)不是簡(jiǎn)單地將對(duì)人造成的傷害量化,還受到法規(guī)、倫理等因素的影響,倫理實(shí)驗(yàn)是獲取名義代價(jià)的途徑之一。本課題組前期開(kāi)展了倫理實(shí)驗(yàn)研究,通過(guò)在線問(wèn)卷調(diào)查形式,獲得受調(diào)查者以智能車輛用戶的角度,在面對(duì)各種兩難困境時(shí)的倫理傾向,建立了轉(zhuǎn)向避險(xiǎn)傾向IES模型[16](以圖1僅涉及U2和U3傷亡的工況為例):
(1)
式中,N2和D2分別為直行避險(xiǎn)造成U2傷害的傷亡數(shù)量和傷害程度;N3和D3分別為轉(zhuǎn)向避險(xiǎn)造成U3傷害的傷亡數(shù)量和傷害程度;其余為模型擬合參數(shù)。
問(wèn)卷調(diào)查表假設(shè)直行時(shí)僅造成對(duì)U2的傷害,轉(zhuǎn)向時(shí)僅造成對(duì)U3的傷害。式(1)中分子部分表示直行避險(xiǎn)和轉(zhuǎn)向避險(xiǎn)間的傷害代價(jià)之差。顯然,當(dāng)直行避險(xiǎn)的代價(jià)大于轉(zhuǎn)向避險(xiǎn)的代價(jià)時(shí),公眾傾向轉(zhuǎn)向避險(xiǎn),且代價(jià)差越大,轉(zhuǎn)向傾向性越強(qiáng)烈。
由于傳感誤差、動(dòng)態(tài)環(huán)境的不確定性,確定性模型難以準(zhǔn)確描述避險(xiǎn)行為造成的人員傷害??紤]沖突不確定,并基于式(1)IES模型的研究結(jié)論,第i條避險(xiǎn)軌跡的名義代價(jià)期望為
(2)
傷亡人數(shù)期望與人車沖突概率有關(guān),即
(3)
由于Uj方每個(gè)人位置不同,故對(duì)于同一避險(xiǎn)軌跡,車輛與Uj中每個(gè)人的沖突概率也不同。
車輛與行人之間的相對(duì)距離是判斷二者是否發(fā)生碰撞的依據(jù)[17]。如圖2所示,dla、dfp、Δθ分別為人車曼哈頓距離、歐氏距離以及相對(duì)方位角。OXY和oxy分別為大地坐標(biāo)系和車輛坐標(biāo)系。車輛用一個(gè)長(zhǎng)L、寬W、航向角為φ的矩形框表示,行人用半徑rp的圓表示。僅考慮前碰撞,車頭用半徑為rv、圓心位于前軸中心的圓表示。
圖2 人車碰撞模型簡(jiǎn)化圖
采用曼哈頓距離(即車輛y軸橫向距離)描述人車沖突概率:
Pc=1/[1+exp(kc(dla-(rp+rv)-ds))]
(4)
式中,kc為擬合參數(shù);ds為人車間的安全距離,用于描述人車定位誤差。
KONG等[18]通過(guò)分析2003—2009年中國(guó)真實(shí)人車碰撞案例,得到傷亡概率與碰撞速度vc的邏輯回歸模型:
(5)
式(5)中PAIS3+(vc)和Pfatal(vc)為碰撞速度vc下行人的重傷和死亡的概率,傷亡程度AIS3以下為輕傷,AIS3+為重傷,fatal為死亡。依據(jù)式(5)可以得出碰撞速度vc下行人輕傷概率Pm(vc)、重傷概率Ps(vc)和死亡概率Pd(vc)分別為
(6)
依據(jù)AIS的創(chuàng)傷嚴(yán)重度評(píng)分法[19],輕傷、重傷、死亡分別評(píng)分為 1、3、6 。碰撞速度vc下行人傷亡程度量化值為
s(v7)=1×Pm(vc)+3×Ps(vc)+6×Pd(vc)
(7)
Uj傷亡程度期望用人群平均傷亡程度表示:
(8)
兩難困境中,軌跡規(guī)劃不能獲得無(wú)沖突的避險(xiǎn)軌跡。以名義代價(jià)期望為目標(biāo)函數(shù),車輛物理系統(tǒng)限制和道路邊界等為約束條件,建立避險(xiǎn)軌跡優(yōu)化問(wèn)題,以期獲得最小沖突名義代價(jià)且滿足車輛動(dòng)力學(xué)、車輛穩(wěn)定性及道路限制的最優(yōu)軌跡。
車輛動(dòng)力學(xué)系統(tǒng)具有高度非線性,考慮模型精度和計(jì)算代價(jià),研究采用小角度轉(zhuǎn)向假設(shè)下基于線性輪胎模型的單軌車輛動(dòng)力學(xué)模型[20],如圖3所示。
圖3 單軌車輛模型
得到動(dòng)力學(xué)方程:
(9)
式中,X、Y和φ分別為全局坐標(biāo)系下車輛質(zhì)心位置和航向角;vx、vy和ω分別為車輛質(zhì)心的縱向速度、橫向速度和角速度;m為車輛質(zhì)量;Iz為車身繞z軸的轉(zhuǎn)動(dòng)慣量;lf、lr分別為車輛質(zhì)心到前后軸的距離;FxT為前后輪縱向合力;Fyf、Fyr為前、后輪側(cè)向力;Cf、Cr分別為車輛前、后輪胎的側(cè)偏剛度;af、ar為前后輪側(cè)偏角;δ為車輛前輪轉(zhuǎn)角。
取狀態(tài)量x=(X,Y,φ,vx,vy,ω)T,控制量u=(FxT,δ)T,即式(9)可表示為
(10)
使用采樣時(shí)間為Δt的一階差商方法對(duì)式(10)進(jìn)行離散化得
xk+1=Akxk+Bkuk
(11)
Ak=I+ΔtAtBk=ΔtBt
2.2.1控制量約束
約束條件如下:
(12)
式中,F(xiàn)xT,max為地面提供的最大縱向力;δmax為最大前輪轉(zhuǎn)角;Δδmax為前輪轉(zhuǎn)角變化率Δδ的最大值。
這里僅考慮制動(dòng)避險(xiǎn),故縱向力取負(fù)值。
2.2.2輪胎附著力約束
考慮輪胎附著力約束,將前后軸輪胎的橫、縱向力限制在摩擦圓中:
(13)
(14)
α∈{f,r}
式中,F(xiàn)yα,max為忽略荷載轉(zhuǎn)移時(shí)的前后軸輪胎最大側(cè)向力;μ為地面附著系數(shù);G為重力。
由于道路邊界外環(huán)境的復(fù)雜性及難以預(yù)測(cè)性,這里僅討論在道路內(nèi)的避險(xiǎn)規(guī)劃。采用圖4所示的對(duì)車輛前后軸中心限制的道路邊界約束:
圖4 道路邊界限制
(15)
α∈{f,r}
式中,Yu、Yl為道路上、下界的Y向坐標(biāo)值;rf、rr為車前后軸輪廓圓半徑;bf,k、br,k為第k個(gè)時(shí)刻前后軸中心的Y向坐標(biāo)值;Yk為第k個(gè)時(shí)刻質(zhì)心的橫向坐標(biāo)值。
2.4.1軌跡規(guī)劃問(wèn)題的建立
智能車輛避險(xiǎn)軌跡規(guī)劃的優(yōu)化問(wèn)題描述如下:
(16)
s.t.k=1,2,…,N
xk=f(xk-1,uk-1)
(17)
E(xk,uk-1)≤1
(18)
bα,k∈lane,α∈{f,r}
(19)
x0=x(t)
(20)
xk∈Xtuk-1∈Utκk≤κmax
(21)
式(17)為車輛動(dòng)力學(xué)離散模型;式(18)為輪胎摩擦圓約束,如式(13)所示;式(19)為道路邊界約束,如式(15)所示;式(20)為狀態(tài)量的初始值約束,其中x(t)為t時(shí)刻的車輛狀態(tài)量;式(21)為狀態(tài)量、控制量以及軌跡曲率的邊界約束,其中Xt、Ut、κmax為狀態(tài)量、控制量以及軌跡曲率的邊界值。
2.4.2軌跡規(guī)劃問(wèn)題求解
2.4.2.1 分層優(yōu)化框架
式(16)所述的軌跡規(guī)劃問(wèn)題具有非線性和非凸性。為實(shí)現(xiàn)高效求解并避免陷入局部最優(yōu),采用分層優(yōu)化算法[21-22](如圖5所示):上層為“暖啟動(dòng)”層,采用曲線插值的方法[23]在可行域中搜索一條名義代價(jià)期望次優(yōu)軌跡作為下層優(yōu)化迭代的初始值;下層為數(shù)值優(yōu)化層,采用非線性優(yōu)化方法在上層給出的初始參考軌跡附近迭代優(yōu)化,得到滿足約束的最優(yōu)軌跡。
圖5 分層優(yōu)化框架
2.4.2.2 暖啟動(dòng)層
圖6 暖啟動(dòng)候選軌跡
2.4.2.3 數(shù)值優(yōu)化層
由于暖啟動(dòng)參考軌跡未考慮車輛物理系統(tǒng)限制,需以其為初始值,在連續(xù)空間內(nèi)進(jìn)一步迭代尋優(yōu)。對(duì)于式(16)所示的優(yōu)化問(wèn)題,采用基于序列二次規(guī)劃(sequential quadratic programming,SQP)求解器的非線性模型預(yù)測(cè)控制算法(nonlinear model predictive control,NLMPC)進(jìn)行優(yōu)化求解,得到滿足名義代價(jià)期望最低且符合車輛動(dòng)力學(xué)、車輛物理約束的最優(yōu)軌跡X*。
文獻(xiàn)[16]根據(jù)對(duì)公眾的倫理調(diào)查結(jié)果,對(duì)IES模型參數(shù)進(jìn)行了擬合,沖突概率模型參數(shù)根據(jù)經(jīng)驗(yàn)選取,如表1所示。軌跡規(guī)劃算法及車輛主要參數(shù)如表2所示。
表1 名義代價(jià)與沖突概率模型參數(shù)
設(shè)計(jì)了3個(gè)涉及U2和U3傷害的沖突場(chǎng)景,場(chǎng)景信息如表3所示。假設(shè)車輛初始檢測(cè)到兩難困境時(shí),位于當(dāng)前車道中心線上縱向距離1.434 m處,以60 km/h速度行駛,道路附著系數(shù)為0.7。
表3 仿真場(chǎng)景參數(shù)
3.3.1實(shí)驗(yàn)結(jié)果
3個(gè)困境場(chǎng)景的直行制動(dòng)軌跡、暖啟動(dòng)參考軌跡、優(yōu)化后的最優(yōu)軌跡如圖7所示。車輛縱向力規(guī)劃、速度響應(yīng)如圖8所示。前輪轉(zhuǎn)角規(guī)劃如圖9所示。優(yōu)化軌跡的車輛前后輪輪胎附著力摩擦圓如圖10所示。三個(gè)困境場(chǎng)景的直行制動(dòng)軌跡(Xbra)、暖啟動(dòng)參考軌跡(Xwarm)、優(yōu)化軌跡(Xopt)對(duì)應(yīng)的對(duì)U2、U3方造成的傷亡人數(shù)期望、傷亡程度期望以及名義代價(jià)期望見(jiàn)表4~表6。
(a)場(chǎng)景1
圖8 車輛縱向力與速度變化曲線圖
圖9 車輛前輪轉(zhuǎn)角變化曲線圖
(a)場(chǎng)景1前輪摩擦圓 (b)場(chǎng)景1后輪摩擦圓
表4 場(chǎng)景1傷害與名義代價(jià)期望
表5 場(chǎng)景2傷害與名義代價(jià)期望
表6 場(chǎng)景3傷害與名義代價(jià)期望
3.3.2試驗(yàn)結(jié)果分析
由圖7和表4~表6可知,場(chǎng)景1中最優(yōu)軌跡為制動(dòng)并轉(zhuǎn)向進(jìn)入對(duì)向車道,與U3方碰撞。與直行制動(dòng)軌跡相比,雖然對(duì)U2、U3方的傷亡程度期望都有所增加,但對(duì)U2方的傷亡人數(shù)期望由3降至0.074,對(duì)U3方的傷亡人數(shù)期望由0增至0.999,最終使得名義代價(jià)期望由1.106下降到0.857。在實(shí)踐中及倫理調(diào)查中發(fā)現(xiàn),若違反規(guī)則可以顯著降低總的社會(huì)傷害代價(jià)時(shí),公眾傾向于違反規(guī)則將風(fēng)險(xiǎn)進(jìn)行轉(zhuǎn)移至U3。
場(chǎng)景2中,最優(yōu)避險(xiǎn)軌跡選擇違反規(guī)則越過(guò)道路實(shí)線,使得對(duì)U2的傷亡人數(shù)期望顯著降低(由2降至0.486),而對(duì)U3的傷害風(fēng)險(xiǎn)略微增加(傷亡人數(shù)期望由0增至0.272),總的名義代價(jià)期望大幅降低(由直行制動(dòng)的0.783減小至0.480)。優(yōu)化的避險(xiǎn)軌跡基本符合公眾的顯著降低社會(huì)總傷害的預(yù)期。
場(chǎng)景3中,U2、U3方行人數(shù)量相同,轉(zhuǎn)向避險(xiǎn)僅將風(fēng)險(xiǎn)由U2轉(zhuǎn)移到U3方,不會(huì)產(chǎn)生傷亡程度期望和傷亡人數(shù)期望的顯著下降,智能車輛的用戶反而會(huì)因?yàn)檗D(zhuǎn)移風(fēng)險(xiǎn)至所謂“無(wú)辜”的第三方(即U3)而承擔(dān)法律風(fēng)險(xiǎn)和道德壓力。最優(yōu)避險(xiǎn)軌跡選擇以最大減速度直線行使,通過(guò)降低沖突速度以降低對(duì)人的傷害。
對(duì)比表4~表6,盡管場(chǎng)景1~3暖啟動(dòng)參考軌跡產(chǎn)生最小名義代價(jià)期望,但暖啟動(dòng)軌跡未考慮車輛物理系統(tǒng)限制,軌跡無(wú)法跟蹤。優(yōu)化后的避險(xiǎn)軌跡的名義代價(jià)期望則是系統(tǒng)狀態(tài)可達(dá)條件下的最小名義代價(jià)。由圖10可知,3個(gè)場(chǎng)景下優(yōu)化軌跡的前輪胎縱橫向附著力始終位于輪胎的附著極限,充分利用了輪胎附著力實(shí)現(xiàn)轉(zhuǎn)向和減速。
(1)針對(duì)沖突各方均涉及人員傷害的兩難困境,綜合碰撞傷亡代價(jià)、法規(guī)、倫理和沖突不確定等因素,建立避險(xiǎn)軌跡對(duì)沖突各方的名義代價(jià)期望模型,以量化對(duì)道路參與者的代價(jià)損失。
(2)基于所提出的名義代價(jià)期望模型,建立了困境下避險(xiǎn)軌跡規(guī)劃的優(yōu)化問(wèn)題。以名義代價(jià)期望為目標(biāo),車輛物理系統(tǒng)限制、道路邊界等為約束條件,采用分層優(yōu)化算法,解決了兩難困境中最優(yōu)避險(xiǎn)軌跡的規(guī)劃問(wèn)題。
(3)由3個(gè)涉及U2和U3傷害的兩難困境場(chǎng)景仿真實(shí)驗(yàn)表明,所提出的方法獲得的優(yōu)化避險(xiǎn)軌跡符合倫理實(shí)驗(yàn)調(diào)查時(shí)的公眾預(yù)期。
(4)盡管本文僅討論了傷害涉及U2和U3方,提出的方法不失一般性,可滿足傷害同時(shí)涉及U1、U2和U3方的一般困境場(chǎng)景的避險(xiǎn)規(guī)劃要求。