章軍輝,郭曉滿,王靜賢,付宗杰,劉禹希
(1.常熟理工學(xué)院 電氣與自動化工程學(xué)院,江蘇 蘇州 215500;2.無錫物聯(lián)網(wǎng)創(chuàng)新中心有限公司,江蘇 無錫 214029;3.江蘇省物聯(lián)網(wǎng)創(chuàng)新中心昆山分中心,江蘇 蘇州 215347)
在當下無人駕駛發(fā)展尚未成熟、商業(yè)化落地難度較大的情況下,未來可能呈現(xiàn)人機共駕、有人-無人駕駛車輛共存的交通局面,因而對人機共駕問題的研究受到了汽車制造商及相關(guān)科研機構(gòu)的廣泛關(guān)注[1-2].
人機共駕是指駕駛?cè)伺c智能系統(tǒng)同時在環(huán),共同享有對車輛的駕駛控制權(quán),人機一體化協(xié)同完成駕駛?cè)蝿?wù)[2].人機共駕研討的核心問題是對駕駛控制權(quán)交接方式及駕駛控制權(quán)動態(tài)分配過程的定性定量描述[3-5].當人與機并行控制車輛時,駕駛?cè)伺c智能系統(tǒng)的駕駛控制權(quán)隨場景轉(zhuǎn)移的分配機制變得十分關(guān)鍵[6-8].若在車輛駕駛控制權(quán)切換過程中發(fā)生沖突,則很可能會導(dǎo)致車輛失控的嚴重后果.
目前,大部分車道保持系統(tǒng)(lane keeping assist system,LKAS)都是將前輪轉(zhuǎn)角或轉(zhuǎn)向力矩作為控制量,未考慮駕駛?cè)嗽诃h(huán)或?qū)Ⅰ{駛?cè)瞬僮饕暈橥饨鐢_動[9-10].LKAS 與駕駛?cè)嗽谵D(zhuǎn)向任務(wù)中都擁有獨立的控制方式,容易引發(fā)控制權(quán)上的沖突,需要對二者進行協(xié)調(diào)控制.根據(jù)駕駛?cè)伺c智能系統(tǒng)同時在環(huán)與否,將人機協(xié)同控制方式概括如下.1)智能輔助駕駛.2)特定場景下的駕駛控制權(quán)切換,如基于駕駛?cè)松硖卣髋c心理狀態(tài)的切換準則研究[11]、基于駕駛意圖、駕駛風(fēng)格及駕駛能力裕度的切換準則研究[12]、綜合考慮人-車-路的切換準則研究[13].3)共駕過程中的駕駛控制權(quán)動態(tài)分配,即通過合理設(shè)計權(quán)值分配策略來綜合協(xié)調(diào)控制效果,但如何設(shè)計適宜的權(quán)值及明確介入準則缺少足夠的理論支撐[14-15].現(xiàn)有研究更多的是在權(quán)值分配與跟蹤精度之間尋求折中設(shè)計,優(yōu)先保證橫向偏差、橫擺角偏差(方位偏差)、橫向加速度等控制目標,這樣容易導(dǎo)致智能系統(tǒng)對駕駛?cè)瞬僮鬟^度干預(yù)的現(xiàn)象.
在變道決策、交叉口決策、超車決策等場景應(yīng)用中,駕駛?cè)伺c智能系統(tǒng)的輸入是并行的,具有冗余與博弈的特征[2].與模糊控制[10]、LPVH∞[16]理論相比,博弈論是研究多個決策主體相互對抗與沖突時如何獲得各自最佳策略的理論,能夠更好地描述共駕過程中駕駛?cè)伺c智能系統(tǒng)之間的交互行為,在車輛安全性、動力性、路面附著情況等約束條件下,讓駕駛?cè)伺c智能系統(tǒng)協(xié)同高效完成操作任務(wù),達到納什均衡(Nash equilibrium),實現(xiàn)全局優(yōu)化控制的目標[17-18].為了減少共駕過程中的人機沖突,本文研究基于非合作博弈的人機共駕控制策略.對車道保持共享控制問題進行數(shù)學(xué)描述.基于非合作博弈理論,設(shè)計控制權(quán)博弈模型.基于MPC框架,將共駕型LKAS前輪轉(zhuǎn)角決策問題轉(zhuǎn)化成帶約束的在線二次規(guī)劃問題.設(shè)計不同的駕駛狀態(tài),利用駕駛?cè)嗽诃h(huán)的集成仿真環(huán)境,對該控制算法與控制策略進行驗證與探討.
1.1.1 狀態(tài)空間方程 針對駕駛?cè)伺c智能系統(tǒng)共同控制車輛轉(zhuǎn)向,構(gòu)建共駕型LKAS 模型,并作如下約束.
1)當車輛速度變化較小時,常縱向速度假設(shè)是近似成立的.
2)忽略車輛的側(cè)傾與俯仰運動.
3)考慮到車輛質(zhì)心隨載荷、輪胎、路面等擾動因素而發(fā)生變化,工程應(yīng)用時以車輛后軸中點作為參考點.
如圖1 所示,XOY 表示慣性坐標系,xoy 表示車身坐標系,基于線性二自由度汽車模型,采用一階微分方程對該車路參考模型進行數(shù)學(xué)描述[19].
圖1 車路參考模型Fig.1 Vehicle-road reference model
式中:dy為車身坐標系下車輛質(zhì)心與車道中心線之間的橫向位移,vy為車身坐標系下的橫向速度,vx為車身坐標系下的縱向速度,vy與 vx的合成速度為質(zhì)心速度,φ為橫擺角,ωr為橫擺角速度,Cf為前輪的側(cè)偏剛度,Cr為后輪的側(cè)偏剛度,a為前軸與車輛質(zhì)心之間的距離,b為后軸與車輛質(zhì)心之間的距離,δf為前輪轉(zhuǎn)角,Iz為繞z 軸的轉(zhuǎn)動慣量.
以x=[dy,vy,φ,ωr]T為狀態(tài)向量,y=[dy,φ]T為模型預(yù)測輸出,u1為駕駛?cè)说目刂戚斎?,u2為智能系統(tǒng)的控制輸入,建立連續(xù)狀態(tài)空間方程:
式中:各系數(shù)矩陣滿足
以Ts為采樣周期,對式(2)進行離散化處理,得到離散狀態(tài)空間方程:
式中:各系數(shù)矩陣滿足
1.1.2 多步預(yù)測模型 令當前時刻為k,預(yù)測時域為[k,k+p-1],控制時域為[k,k+c-1],其中c ≤ p.由式(3)逐步迭代整理得到
控制層的協(xié)同互補是人機共駕領(lǐng)域關(guān)注的焦點.人機并行控制具有雙環(huán)并行的控制結(jié)構(gòu),駕駛?cè)伺c智能系統(tǒng)的輸入具有冗余與博弈的特征[2].基于非合作博弈理論[20-21],設(shè)計基于非合作博弈的模型預(yù)測控制(non-cooperative game based model predictive control,NCG-MPC)算法,以提高雙駕雙控系統(tǒng)的友好性.
2.1.1 非合作人機共駕策略 如圖2 所示,在非合作人機共駕策略中,根據(jù)環(huán)境感知、車輛模型規(guī)劃出車輛運動可行域,按照車道偏離程度[6]將車輛運動可行域劃分成安全域、過渡域、預(yù)警域、危險域.根據(jù)駕駛?cè)四P?、車輛模型得到駕駛?cè)说钠谕壽E,通過車輛運動可行域與駕駛?cè)似谕壽E進行危險態(tài)勢估計.權(quán)重 w1、w2分別為駕駛?cè)伺c智能系統(tǒng)的駕駛參與度,滿足 w1+w2=1.
圖2 非合作人機共駕策略Fig.2 Non-cooperative driver-automation shared control strategy
非合作人機共駕策略的作用是根據(jù)危險態(tài)勢估計模型來綜合協(xié)調(diào)駕駛?cè)伺c智能系統(tǒng)的駕駛參與度,能夠較好地兼顧駕乘舒適性與行駛安全性,保證駕駛?cè)藭r刻在環(huán).當車輛處于安全域或過渡域前期時,在保證一定的橫向運動控制精度的前提下,給予駕駛?cè)俗銐虻目刂茩?quán)裕度,以提升駕駛?cè)说氖孢m體驗.當因駕駛?cè)苏`操作、走神、疲勞等而導(dǎo)致車輛進入預(yù)警域或危險域時,該策略會逐步將駕駛控制權(quán)從駕駛?cè)艘平唤o智能系統(tǒng).
2.1.2 控制權(quán)博弈模型 定義預(yù)瞄偏移距離(preview offset distance,POD)為車輛在預(yù)瞄點處偏移車道中心線的距離.根據(jù)JTG B01-2014 公路工程技術(shù)標準可知,我國高速公路車道的寬度為3.75 m,轎車寬度約為1.6~1.8 m.基于POD 距離,將車輛運動可行域劃分成以下區(qū)域:1)安全域[0,0.35] m,駕駛?cè)苏贾鲗?dǎo)權(quán);2)過渡域(0.35,0.6] m,逐漸提高智能系統(tǒng)的控制權(quán)值;3)預(yù)警域(0.5,∞)m,啟動分級預(yù)警[22];4)危險域(0.6,∞)m,智能系統(tǒng)快速接管駕駛控制權(quán).
為了提高駕駛?cè)说闹饔^感受度及其對智能系統(tǒng)的信任感,宜盡量減少駕駛?cè)丝刂茩?quán)重低于0.5 的情況[6].此外,考慮到駕駛?cè)藢€性函數(shù)的接受度較佳,設(shè)計控制權(quán)博弈模型,如圖3 所示.圖中,POD 距離dPOD是時間的函數(shù).
圖3 控制權(quán)博弈模型Fig.3 Game-theoretical model of control authority
駕駛?cè)丝刂茩?quán)的數(shù)學(xué)描述如下:
式中:w1(dPOD)為駕駛?cè)丝刂茩?quán)函數(shù).
2.2.1 代價函數(shù) 車道保持的任務(wù)是使車輛橫向位置應(yīng)盡可能逼近期望路徑,為了保證控制效果,控制輸入宜盡可能小.在非合作人機共駕策略中,包含2 個決策者(即系統(tǒng)有2 個控制輸入):駕駛?cè)?、智能系統(tǒng).這2 個決策者都期望自身在實現(xiàn)控制目標時所花費的成本最小,構(gòu)造代價函數(shù)如下:
在代價函數(shù)中,第1 項體現(xiàn)了對期望軌跡的跟蹤能力,第2 項反映了對控制平穩(wěn)性的要求.式中:
y1,des(k)、y2,des(k)分別為駕駛?cè)伺c智能系統(tǒng)的局部期望軌跡;r1(k)、r2(k)分別為相應(yīng)的控制輸入的加權(quán)系數(shù);q1(k)、q2(k)分別為相應(yīng)的狀態(tài)加權(quán)矩陣,也稱為置信度矩陣,用來動態(tài)調(diào)整駕駛?cè)伺c智能系統(tǒng)之間的駕駛參與度;λ1(k)、λ2(k)影響相應(yīng)規(guī)劃軌跡的超調(diào)特性[20].
基于圖3 所示的控制權(quán)博弈模型,當車輛進入危險域時,通過逐步下調(diào) w1(k)與上調(diào) w2(k),增加智能系統(tǒng)規(guī)劃路徑的置信度,進而確保行駛安全性.當車輛進入安全域時,通過逐步上調(diào) w1(k)與下調(diào) w2(k),提高駕駛?cè)说目刂茩?quán)裕度,改善駕駛舒適性.通過合理調(diào)整駕駛?cè)伺c智能系統(tǒng)的駕駛參與度,能夠較好地實現(xiàn)駕駛?cè)伺c智能系統(tǒng)之間駕駛控制權(quán)的平穩(wěn)交接.
2.2.2 約束條件及松弛化處理 考慮到車輛自身的物理限制及實際應(yīng)用場景,對由控制輸入、系統(tǒng)狀態(tài)所構(gòu)成的控制器工作域進行邊界約束:
式中:u1,min、u2,min為控制下界,u1,max、u2,max為控制上界,dy,min、φmin為輸出下界,dy,max、φmax為輸出上界.
將式(8)所示的硬約束條件所構(gòu)成的約束空間稱為求解可行域.在MPC 有限時域滾動優(yōu)化過程中,可能會出現(xiàn)求解可行域內(nèi)無可行解的問題.采用松弛因子對硬約束條件進行松弛化處理,以擴展求解可行域[19],保證可行解存在.
2.2.3 算法演變 為了防止因引入松弛因子而導(dǎo)致對控制器工作域的邊界約束作用失效,在代價函數(shù)中增加正則化項,以懲罰松弛因子擴展工作域邊界的能力,從而在硬約束問題求解可行性與工作域邊界的松弛程度之間尋求平衡[19].根據(jù)式(6)、(7)與(9),重構(gòu)代價函數(shù)如下.
式中:C1、C2為常數(shù)項,
其中,
將共駕型LKAS 算法設(shè)計問題轉(zhuǎn)化為線性不等式約束的二次規(guī)劃(quadratic programming,QP)問題.對于每一個參與者來說,非合作博弈的均衡解,即納什均衡,可以通過求解QP 問題得到.在滾動優(yōu)化求解過程中,選取向量解的第1 個數(shù)值作為下一步的輸入,如此重復(fù),實現(xiàn)滾動在線控制.
為了驗證控制算法與控制策略的有效性,基于Matlab/Simulink 及CarSim 集成環(huán)境,搭建駕駛?cè)嗽诃h(huán)的共駕型LKAS 模型.整車動力學(xué)參數(shù)見表1,駕駛?cè)后w特性參數(shù)[22]見表2,試驗臺架如圖4所示.基于筆者等[22]的研究,將駕駛?cè)说鸟{駛狀態(tài)劃分為正常駕駛狀態(tài)、激進駕駛狀態(tài)、疲勞駕駛狀態(tài),不同駕駛狀態(tài)下駕駛?cè)藢?cè)偏的敏感程度不一樣,即局部期望路徑 y1,des(k)不一樣,智能系統(tǒng)的局部期望路徑一直是車道中心線.對比控制方法采用MPC 控制,將駕駛?cè)溯斎肱c智能系統(tǒng)輸入的線性加權(quán)組合作為MPC 控制器的輸入,假設(shè)駕駛?cè)丝刂茩?quán)重為0.5.
表1 整車動力學(xué)參數(shù)Tab.1 Vehicular dynamics parameters
表2 駕駛狀態(tài)特性參數(shù)Tab.2 Parameters of driving state characteristics
圖4 駕駛?cè)嗽诃h(huán)試驗臺架Fig.4 Driver-in-loop experimental platform
如圖5 所示,針對不同的駕駛狀態(tài),分別對人駕與共駕模式下的橫向位移進行仿真對比.大約在第25 s 時刻,開始轉(zhuǎn)向操作.與人駕模式相比,NCG-MPC 共駕模式能夠有效地提高路徑的跟蹤精度,尤其是對疲勞駕駛狀態(tài)下因誤操作而導(dǎo)致的異常側(cè)偏具有較明顯的抑制作用.MPC 共駕模式相當于駕駛?cè)撕鸵粋€優(yōu)秀的駕駛助理按照平等控制權(quán)共同操控車輛,跟蹤效果好,響應(yīng)快.如圖6(c)所示,駕駛?cè)说鸟{駛控制權(quán)是逐步移交給智能系統(tǒng)的,即智能系統(tǒng)的介入有一定的延時,導(dǎo)致NCG-MPC 共駕的側(cè)偏相對較大.這種固定權(quán)重分配會影響到駕駛?cè)说闹饔^感受[6],即友好性相對不足.
圖5 不同駕駛狀態(tài)下的橫向位移對比Fig.5 Comparison of lateral displacements under different driving states
圖6 不同駕駛狀態(tài)下駕駛?cè)丝刂茩?quán)的對比Fig.6 Comparison of control authority under different driving states
如圖6 所示,針對不同的駕駛狀態(tài),分別對駕駛?cè)丝刂茩?quán)進行仿真對比.與正常駕駛狀態(tài)相比,激進駕駛狀態(tài)下由于駕駛?cè)说膽?yīng)急反應(yīng)較快,對側(cè)偏的敏感度較高,能夠?qū)?cè)偏位移控制在±0.4 m 范圍內(nèi)(見圖5(b)),所以能夠一直掌握較高的駕駛控制權(quán).在疲勞駕駛狀態(tài)下,當側(cè)偏過大時,利用設(shè)計的控制權(quán)博弈模型,能夠及時將駕駛控制權(quán)移交給智能系統(tǒng),此時智能駕駛系統(tǒng)占絕對主導(dǎo)權(quán).當側(cè)偏變小時,智能系統(tǒng)將駕駛控制權(quán)逐步歸還給駕駛?cè)?,即針對不同的駕駛狀態(tài),該控制權(quán)博弈模型具有較好的適應(yīng)能力.
如圖7 所示,針對不同的駕駛狀態(tài),分別對NCG-MPC 共駕模式下駕駛?cè)?、智能系統(tǒng)及共駕的方向盤轉(zhuǎn)角δw進行仿真對比.在0~25 s 過程中,CarSim 直道并非嚴格直線,故該過程中智能系統(tǒng)會有一定的輸入.由于該過程中的側(cè)偏很小,控制權(quán)博弈模型給智能系統(tǒng)分配的輸入權(quán)重很小甚至為0,這樣使得合成輸入接近于0.在疲勞駕駛狀態(tài)下,當駕駛?cè)朔较虮P轉(zhuǎn)向過大時,在控制權(quán)博弈模型的作用下智能駕駛系統(tǒng)將會及時介入,快速接管方向盤以糾正車輛的偏離行為,有效提高了車輛橫向控制的抗擾動能力.
圖7 不同駕駛狀態(tài)下方向盤轉(zhuǎn)角的對比Fig.7 Comparison of steering wheel angles under different driving states
(1)基于MPC 模型預(yù)測控制框架提出共駕型LKAS 控制算法,采用二次型性能指標及線性不等式約束的形式,將前輪轉(zhuǎn)角決策問題轉(zhuǎn)化成帶約束的在線二次規(guī)劃問題.
(2)基于非合作博弈理論設(shè)計非合作人機共駕策略,以提高駕駛?cè)伺c智能系統(tǒng)雙駕雙控過程中的友好性.按照車道偏離程度,將車輛運動可行域劃分成安全域、過渡域、預(yù)警域、危險域,綜合車輛運動可行域與駕駛?cè)似谕壽E進行危險態(tài)勢估計.采用POD 距離對駕駛?cè)伺c智能系統(tǒng)的置信度矩陣進行更新,以實現(xiàn)駕駛?cè)伺c智能系統(tǒng)之間駕駛控制權(quán)的平穩(wěn)交接,在保證駕駛?cè)藭r刻在環(huán)的同時,能夠有效避免因交接突兀而影響駕乘舒適性的不足.
(3)為了提高駕駛?cè)说闹饔^感受度及其對智能系統(tǒng)的信任感,設(shè)計控制權(quán)博弈模型.在保證一定的橫向運動控制精度的前提下,給予駕駛?cè)俗銐虻目刂茩?quán)裕度,以滿足駕駛?cè)说闹饔^感受.