【摘要】為了解決高速行駛工況下自動駕駛車輛決策模型的車間互動性不足、規(guī)劃控制匹配性差等問題,構(gòu)建了基于斯塔克爾伯格(Stackelberg)博弈的閉環(huán)換道決策模型,將障礙車響應(yīng)納入自車換道決策中,同時(shí)引入駕駛風(fēng)格特征優(yōu)化多目標(biāo)決策成本函數(shù),并使用粒子群優(yōu)化(PSO)算法求解博弈決策模型,采用考慮質(zhì)心側(cè)偏角影響下的運(yùn)動學(xué)模型預(yù)測車輛狀態(tài),設(shè)計(jì)了基于動態(tài)風(fēng)險(xiǎn)勢場法的非線性模型預(yù)測規(guī)劃控制器。仿真結(jié)果表明,所提出的閉環(huán)換道決策模型可有效結(jié)合車間互動行為與駕駛風(fēng)格特征輸出正確的決策指令并完成相應(yīng)的運(yùn)動規(guī)劃和控制。
主題詞:自動駕駛車輛 換道決策規(guī)劃 駕駛風(fēng)格 斯塔克爾伯格博弈
中圖分類號:U461.91 " 文獻(xiàn)標(biāo)志碼:A " DOI: 10.19620/j.cnki.1000-3703.20230357
Research on High-Speed Automatic Lane Change Decision-Making and Planning Considering Driving Style
Zhang Xinfeng1,2, Wang Yajun1, Zhang Haojie1, Zhao Juan1, Jia Ruihao1
(1. Chang’an University, Xi’an 710064; 2. Xinjiang Agricultural University, Urumqi 830052)
【Abstract】There are insufficient vehicle-vehicle interaction and poor matching between planning and control in the decision-making model of high-speed autonomous vehicles. In order to solve these problems, a closed-loop lane change decision model based on Stackelberg game was constructed. Faulty vehicle response was incorporated into lane changing decision while introducing driving style feature. The multi-objective decision-making cost function was optimized. Particle Swam Optimization (PSO) algorithm was used to solve the game decision model, and the vehicle state was predicted by using a kinematic model that considers the influence of center of mass sideslip angle. A nonlinear model predictive planning controller based on dynamic risk potential field method was designed. The simulation test results show that the closed-loop lane-changing decision-making model proposed in this paper can effectively combine the interaction behavior and driving style characteristics of vehicles to make correct decision-making instructions and implement corresponding motion planning and control.
Key words: Autonomous vehicle, Lane change decision-making and planning, Driving style, Stackelberg game theory
【引用格式】 張新鋒, 汪亞君, 張浩杰, 等. 考慮駕駛風(fēng)格的高速行駛工況自動換道決策規(guī)劃研究[J]. 汽車技術(shù), 2024(7): 17-28.
ZHANG X F, WANG Y J, ZHANG H J, et al. Research on High-Speed Automatic Lane Change Decision-Making and Planning Considering Driving Style[J]. Automobile Technology, 2024(7): 17-28.
1 前言
近年來,自動駕駛技術(shù)在提高駕駛安全性和運(yùn)輸效率方面表現(xiàn)出巨大的潛在優(yōu)勢,換道決策規(guī)劃是其關(guān)鍵技術(shù)之一[1-3]。隨著支持向量機(jī)(Support Vector Machines,SVM)[4]、極限學(xué)習(xí)機(jī)(Extreme Learning Machines,ELM)[5]和強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)[6]等數(shù)據(jù)驅(qū)動模型的興起,簡單場景的安全換道決策[7-8]得以實(shí)現(xiàn),而博弈論注重交通參與者的駕駛風(fēng)格與互動性,博弈決策更適用于實(shí)際駕駛環(huán)境[9]。
在考慮駕駛風(fēng)格特征的博弈決策方面:Wei等[10]通過分析駕駛風(fēng)格對決策的影響,基于博弈論提出考慮車間互動性的并線決策模型,解決了高速公路匝道并線沖突問題;Lopez等[11]基于路口環(huán)境信息,引入駕駛風(fēng)格特征,提出博弈論與深度學(xué)習(xí)相結(jié)合的決策模型,增強(qiáng)了模型的泛化性;Zhang等[12]根據(jù)車輛攻擊性提出分層博弈決策框架,采用帶圖靈測試的貝葉斯博弈理論模擬決策過程,解決了車間多模態(tài)互動問題,但僅用攻擊性描述自動駕駛車輛(Autonomous Vehicle,AV)并不全面。
在運(yùn)動規(guī)劃博弈決策方面,人工勢場(Artificial Potential Field,APF)法因結(jié)構(gòu)簡單、便于底層精確控制得以廣泛應(yīng)用[13]:Wang等[14]在APF中引入虛擬目標(biāo)點(diǎn)以解決局部最優(yōu)的缺陷,但未解決全局范圍內(nèi)的局部最優(yōu)問題;Orozco-Rosas等[15]通過將APF與遺傳算法結(jié)合,解決自動駕駛車輛路徑規(guī)劃問題;Tu等[16]將傳統(tǒng)的引力和斥力擴(kuò)展為符合車輛實(shí)際形狀的橢圓形風(fēng)險(xiǎn)勢場,將其運(yùn)用到車輛碰撞檢測算法中,但相應(yīng)的算力負(fù)擔(dān)大幅增加。
現(xiàn)有的決策規(guī)劃模型雖然解決了異質(zhì)交通參與者間的沖突,但仍未充分考慮異質(zhì)交通參與者間的互動性,忽略了自動駕駛車輛乘員駕駛風(fēng)格差異與個(gè)性化需求,且多數(shù)側(cè)重意圖識別和決策的開發(fā),缺少規(guī)劃控制的匹配性,導(dǎo)致規(guī)劃軌跡未能完全滿足預(yù)測模型的各項(xiàng)控制約束,控制效果難以提升。為解決上述問題,本文將縱向速度規(guī)劃融入決策環(huán)節(jié),結(jié)合Stackelberg主從博弈理論[17],將車間互動行為納入自車決策中,同時(shí)引入駕駛風(fēng)格特征,使模型的結(jié)果更加符合實(shí)際駕駛需求。針對規(guī)劃控制部分匹配性差的問題,設(shè)計(jì)基于動態(tài)勢場法的非線性模型預(yù)測規(guī)劃控制器(Dynamic Potential Field-Nonlinear Model Predictive Controller,DPF-NMPC),將風(fēng)險(xiǎn)勢場與控制器結(jié)合,實(shí)現(xiàn)實(shí)時(shí)動態(tài)規(guī)劃及運(yùn)動控制,同時(shí)使規(guī)劃結(jié)果滿足運(yùn)動約束,提高規(guī)劃控制部分的匹配性,保證車輛在風(fēng)險(xiǎn)最低的安全區(qū)域內(nèi)行駛。最后,采用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法對模型進(jìn)行求解,并通過仿真測試驗(yàn)證其有效性。
2 閉環(huán)換道決策模型架構(gòu)
常見的高速公路換道場景主要分為并線換道和自由換道,如圖1所示,以典型的兩車道并線換道和三車道自由換道場景為例,開展考慮駕駛風(fēng)格的高速自動換道決策規(guī)劃研究。
假定上述換道場景中的自車(Host Vehicle,HV)均為自動駕駛車輛,前車(Front Vehicle,F(xiàn)V)和后車(Rear Vehicle,RV)均為網(wǎng)聯(lián)的人類駕駛車輛,車輛駕駛風(fēng)格(包含激進(jìn)型、正常型和保守型)的特征信息可根據(jù)運(yùn)行狀態(tài)進(jìn)行估計(jì)和標(biāo)定,并通過車聯(lián)網(wǎng)(Vehicle to Everything,V2X)實(shí)現(xiàn)信息交互[14-15]。
兩車道并線換道場景中,為保證車輛換道安全的同時(shí)滿足乘員的個(gè)性化需求,需結(jié)合HV與RV1的互動決策結(jié)果,選擇不同的換道方式。三車道自由換道場景中,當(dāng)HV產(chǎn)生換道意圖時(shí),F(xiàn)V和RV統(tǒng)稱為障礙車(Obstacle Vehicle,OV),其中,F(xiàn)V包括FV1、FV2和FV3,RV包括RV1和RV2。此時(shí),F(xiàn)V1、FV3與HV行駛狀態(tài)相對穩(wěn)定且具備換道空間,HV的換道行為決策主要取決于RV的駕駛風(fēng)格:若RV1的駕駛風(fēng)格為正常型或保守型,RV2為偏好加速行駛的激進(jìn)型,則HV更傾向于工況2,反之,則HV更傾向于工況4;若RV1和RV2同為激進(jìn)型,均偏好加速行駛,則HV不具備換道條件,只能選擇工況3,反之,HV換道不受影響。
上述換道決策過程屬于典型的Stackelberg主從博弈,當(dāng)HV產(chǎn)生換道意圖,OV獲得信息后作出相應(yīng)的行為決策,HV根據(jù)OV的響應(yīng)修正決策,經(jīng)過多輪博弈最終達(dá)到平衡,即得到最優(yōu)換道決策。鑒于HV決策過程中能夠融合OV決策并進(jìn)行實(shí)時(shí)信息互動,因此,將決策、規(guī)劃和控制構(gòu)成閉環(huán),構(gòu)建基于Stackelberg博弈的閉環(huán)換道決策模型架構(gòu),如圖2所示。
該模型主要由輸入信息模塊、Stackelberg博弈決策模型和DPF-NMPC規(guī)劃控制器組成。輸入信息模塊將V2X接收的各周期駕駛風(fēng)格和環(huán)境信息(OV狀態(tài)和道路特征)傳遞給其他模塊;Stackelberg博弈決策模型構(gòu)建基于安全性、舒適性及通行效率的決策成本函數(shù),建立車間Stackelberg主從博弈關(guān)系,通過優(yōu)化求解得到最優(yōu)換道指令[λ*]和最優(yōu)縱向加速度[a*x],并輸出給規(guī)劃控制器;DPF-NMPC將基于動態(tài)風(fēng)險(xiǎn)勢場(Dynamic Potential Field,DPF)與車輛預(yù)測狀態(tài)信息所建立的道路、各車風(fēng)險(xiǎn)勢場、博弈結(jié)果作為非線性模型預(yù)測控制(Nonlinear Model Predictive Control,NMPC)的輸入,結(jié)合車輛運(yùn)動學(xué)模型建立控制目標(biāo)優(yōu)化函數(shù),求解得到最優(yōu)前輪轉(zhuǎn)角[δ*f],并將車輛實(shí)時(shí)狀態(tài)反饋給決策模型,以此構(gòu)成閉環(huán)的決策控制過程。
3 Stackelberg博弈決策模型構(gòu)建
本文研究的高速換道場景中,相鄰車道僅存在1輛RV,即該換道決策問題可視為博弈對象僅為HV和RV 2個(gè)參與者的Stackelberg主從博弈,建立對應(yīng)的Stackelberg博弈決策模型為:
[uhv*=argminuhv(maxurv∈U(urv)rhv(uhv))] " " " " " " " " " "(1)
[U(urv)=τ∈Θ:rrv(τ)≤rrv(urv),?urv∈Θ] " " " " " " " " " "(2)
式中:uhv、urv分別為HV和RV的決策變量,uhv*為HV的最優(yōu)決策變量,rhv(uhv)、rrv(urv)分別為HV和RV根據(jù)對方?jīng)Q策的響應(yīng)決策成本,U(urv)為RV根據(jù)HV的決策作出的最優(yōu)決策行為集合,τ為該最優(yōu)決策行為集合中的任意元素;Θ為RV的決策行為集合。
由于Stackelberg博弈決策模型以HV和RV的決策成本函數(shù)為博弈依據(jù),故需要對決策成本函數(shù)進(jìn)行優(yōu)化設(shè)計(jì)。
3.1 決策成本函數(shù)設(shè)計(jì)
高速場景的行駛過程中不僅要考慮駕駛安全性與舒適性,通行效率也十分重要。
3.1.1 駕駛安全性
駕駛安全性可分為縱向安全性和橫向安全性[18-19],HV安全性成本[rhvsa]可表示為:
[rhvsa=λ-1rhvsalog+λrhvsalat] " " " " " " " " " " (3)
式中:λ為換道指令,可取值為-1、0和1,分別代表向右換道、跟馳行駛和向左換道;[rhvsalog]、[rhvsalat]分別為縱向和橫向的安全成本。
通常,[rhvsalog]為縱向相對距離[Δshvx,δ]和縱向相對車速[Δvhvx,δ]的函數(shù),當(dāng)車輛運(yùn)動狀態(tài)發(fā)生變化時(shí),λ隨之改變以滿足博弈期望。若HV安全性成本[rhvsa]、HV舒適性成本[rhvcom]和HV通行效率成本[rhvef]之間相差過大,車輛運(yùn)動狀態(tài)發(fā)生變化時(shí),λ保持不變或發(fā)生錯(cuò)誤的改變均滿足博弈期望,導(dǎo)致決策失誤。為解決此問題,采用[Δshvx,δ]和[Δvhvx,δ]的累計(jì)誤差描述安全性成本,則[rhvsalog]可表示為:
[rhvsalog=khvvlogβhvδ0TΔvhvx,δdt+khvslog0TΔshvx,δdt+ε] " " " " " " "(4)
[Δvhvx,δ=vfvx,δ-vhvx,δΔshvx,δ=Xfvx,δ-Xhvx,δ] " " " " " " " " " " " " " (5)
[βhvδ=1, Δvhvx,δlt;00, Δvhvx,δ≥0] " " " " " " " " " " " " " " (6)
式中:[vfvx,δ]、[Δvhvx,δ]分別為FV和HV的速度,并線場景中,[vfvx,δ=0];[khvvlog]、[khvslog]分別為速度和距離的權(quán)重系數(shù);[βhvδ]為調(diào)節(jié)參數(shù);[Xfvx,δ]、[Xhvx,δ]分別為FV和HV的縱向位置,并線場景中,[Xhvx,δ]為前方障礙物位置;δ為車道編號,其值為1、2和3,分別表示左、中、右車道;ε為避免分母為零而設(shè)置的極小值;T為車輛預(yù)測狀態(tài)的采樣周期。
同理,[rhvsalat]可表示為:
[rhvsalat=khvvlatβhvδ+λ0TΔvhvx,δ+λdt+khvslat0TΔshvx,δ+λdt+ε] " " " "(7)
[Δvhvx,δ+λ=vhvx,δ-vrvx,δ+λΔshvx,δ+λ=Xhvx,δ-Xrvx,δ+λ] " " " " " " " " " " " "(8)
[βhvδ+λ=1, Δvhvx,δ+λlt;00, Δvhvx,δ+λ≥0] " " " " " " " " " " " " "(9)
式中:[khvvlat]、[khvslat]分別為速度和距離的權(quán)重系數(shù),[Δvhvx,δ+λ]、[Δshvx,δ+λ]分別為HV與RV的相對速度和相對距離,[vrvx,δ+λ]、[vhvx,δ]分別為RV和HV的速度,[Xrvx,δ+λ]、[Xhvx,δ]分別為RV和HV的縱向位置,[βhvδ+λ]為調(diào)節(jié)參數(shù)。
3.1.2 車輛舒適性
車輛舒適性評價(jià)中常用加速度衡量車輛行駛時(shí)的舒適程度,舒適性成本[rhvcom]可表示為:
[rhvcom=khvlog0Tahvx,δdt2+λkhvlat0Tahvy,δdt2] " " " " (10)
式中:[khvlat]、[khvlog]分別為橫、縱向舒適性權(quán)重系數(shù),[ahvx,δ]、[ahvy,δ]分別為HV橫、縱向加速度。
3.1.3 通行效率
通行效率主要與通行時(shí)間、行駛速度相關(guān),因此,通行效率成本[rhvef]可表示為:
[rhvef=vhvx,δ-min(vmaxx,δ-vfvx,δ)2] " " " " " " " " " (11)
式中:[vmaxx,δ]為車道δ允許的最大行駛車速。
3.1.4 決策總成本
為了滿足自動駕駛車輛乘員的個(gè)性化需求,對各成本分配不同的權(quán)重系數(shù)來模擬不同的駕駛風(fēng)格,HV決策總成本rhv表示為:
[rhv=ωsarhvsa+ωcomrhvcom+ωcfrhvcf] " " " " " " " " "(12)
式中:ωsa、ωcom、ωef分別為安全性、舒適性和通行效率的權(quán)重系數(shù)。
同理,RV的決策總成本函數(shù)rrv為:
[rrv=ωsarrvsa+ωcomrrvcom+ωcfrrvcf] " " " " " " " (13)
式中:[rrvsa]、[rrvcom]、[rrvcf]分別為RV的安全性成本、舒適性成本、通行效率成本。
由于HV和RV的橫向安全性是由彼此決定的,則RV橫向安全成本[rrvsalat=rhvsalat],縱向安全成本與HV類似。假設(shè)RV不產(chǎn)生換道行為,只采取加減速操作,其舒適性成本為[rrvcom=krvlog0Tarvx,δ+λdt2],其中[arvx,δ+λ]為RV縱向加速度,[krvlog]為縱向舒適性權(quán)重系數(shù)。通行效率成本也與HV類似,僅考慮縱向相對車速即可。
駕駛風(fēng)格是影響車間互動決策的重要因素,本文使用美國聯(lián)邦公路管理局的公開軌跡數(shù)據(jù)集NGSIM,該數(shù)據(jù)集包括US101、I-80等道路上的所有車輛在一定時(shí)間內(nèi)的車輛行駛狀況,采用K-均值(K-Means)聚類算法對其聚類分析,各駕駛風(fēng)格及行駛特征如圖3所示。
由圖3a、圖3d可知,激進(jìn)型駕駛風(fēng)格速度最高,保守型駕駛風(fēng)格速度最低,這表明激進(jìn)型駕駛風(fēng)格對通行效率要求最高;由圖3b、圖3e可知,激進(jìn)型駕駛風(fēng)格加速度最大,保守型駕駛風(fēng)格次之,正常型駕駛風(fēng)格加速度最小,這表明正常型駕駛風(fēng)格相比其余駕駛風(fēng)格更注重舒適性;由圖3c、圖3f可知,保守型、正常型和激進(jìn)型駕駛風(fēng)格的車頭時(shí)距依次減小,這表明三者對安全性的重視程度依次減輕。
鑒于不同駕駛風(fēng)格對通行效率、舒適性和安全性具有相應(yīng)的傾向性,可結(jié)合行駛特征分布情況,通過設(shè)置不同的權(quán)重系數(shù)ωsa、ωcom和ωef模擬考慮不同駕駛風(fēng)格的博弈決策行為。正常型駕駛風(fēng)格的行駛特征中加速度分布較為離散,車頭時(shí)距分布較為集中,即正常型駕駛風(fēng)格個(gè)體對舒適性的選擇具有較大差異性,對安全性的選擇更為統(tǒng)一,因此,可適當(dāng)增加正常型駕駛風(fēng)格中的安全性權(quán)重比例,具體權(quán)重系數(shù)如表1所示[20-21]。
3.2 博弈決策模型的求解
選取[ahvx,δ]、[arvx,δ+λ]和λ為博弈求解變量,則[uhv=ahvx,δ,λ],[urv=arvx,δ+λ],博弈決策模型可轉(zhuǎn)化為:
[uhv*=arg min(maxrhv(uhv))ahvx,δ,λ " "arvx,δ+λ∈U(arvx,δ+λ)s.t.U(arvx,δ+λ)=τ∈Θ:rrv(τ)≤rrv(arvx,δ+λ),?arvx,δ+λ∈Θλ(λ+1)(λ-1)=0vx,δ∈0,vmaxx,δax,δ∈aminx,δ,amaxx,δ] " " " " "(14)
式中:[ahv*x,δ]、λ*分別為HV最優(yōu)縱向加速度和最優(yōu)換道指令,[U(arvx,δ+λ)]為RV的最優(yōu)決策行為集合,[rhv(ahvx,δ,λ)]、[rhv(ahvx,δ+λ)]分別為HV和RV的決策總成本函數(shù),[aminx,δ]、[amaxx,δ]分別為車道δ縱向加速度的最小值和最大值。
鑒于PSO算法具有精度高、收斂快且易實(shí)現(xiàn)等特點(diǎn),采用PSO算法求解博弈決策模型,具體求解流程如圖4所示。
4 規(guī)劃控制器設(shè)計(jì)
由式(1)~式(14)可知,求解上述決策及縱向規(guī)劃問題,需要控制部分在跟蹤規(guī)劃目標(biāo)時(shí)獲得車輛運(yùn)動學(xué)參數(shù)。因此,本文設(shè)計(jì)動態(tài)勢場法的非線性模型預(yù)測規(guī)劃控制器,將橫、縱向換道加速度規(guī)劃與控制環(huán)節(jié)相互耦合,同時(shí)在規(guī)劃中考慮車輛預(yù)測模型的運(yùn)動學(xué)約束,實(shí)現(xiàn)實(shí)時(shí)動態(tài)規(guī)劃和運(yùn)動控制。
4.1 風(fēng)險(xiǎn)勢場函數(shù)
DPF法可在動態(tài)場景中改善陷入局部最優(yōu)的缺陷,因而廣泛用于AV的避障規(guī)劃中[22]。DPF總風(fēng)險(xiǎn)勢場Pxy包括OV動態(tài)風(fēng)險(xiǎn)勢場和道路標(biāo)線風(fēng)險(xiǎn)勢場,可表示為:
[Pxy=exy+rxy] " " " " " " " " " " " " " (15)
式中:exy為OV對HV產(chǎn)生的動態(tài)風(fēng)險(xiǎn)勢場,rxy為道路標(biāo)線對HV產(chǎn)生的風(fēng)險(xiǎn)勢場。
4.1.1 OV動態(tài)風(fēng)險(xiǎn)勢場
根據(jù)道路幾何特征及車輛的運(yùn)動特性分析,OV橫向風(fēng)險(xiǎn)勢場隨著車間橫向距離變化,而縱向風(fēng)險(xiǎn)勢場與縱向相對距離及相對速度有關(guān),故使用不同函數(shù)描述各方向的風(fēng)險(xiǎn)勢場。
以車輛尾部中心為坐標(biāo)原點(diǎn)o建立坐標(biāo)系,令行駛方向?yàn)閤軸正向,左側(cè)為y軸正向,垂直向上方向?yàn)閦軸正向,得到OV風(fēng)險(xiǎn)勢場范圍如圖5所示。其中,L為OV車長,S為安全距離。OV的風(fēng)險(xiǎn)勢場范圍以縱向?yàn)橹?,向橫、縱兩個(gè)方向延伸,可分為α、β和γ區(qū)域[22],可用分段函數(shù)描述:
[Acar=Ucar , " " " " " " " " " " " " " " " " " " " "P∈β?γUcar?exp-(Kr-S)/vr, (P∈α)?(vrgt;0)0, " " " " " " " " " " " " " " " " " " " " " " (P∈α)?(vr≤0)] " (16)
式中:Acar為風(fēng)險(xiǎn)勢場范圍系數(shù);Ucar為OV風(fēng)險(xiǎn)勢場的最大值;Kr、vr分別為HV與OV的縱向相對距離、相對車速,同向運(yùn)動時(shí),若HV的速度大于OV的速度,vrgt;0,反之,vrlt;0;S=vrΔT+Smin為安全影響因子,與最小安全距離和系統(tǒng)延遲有關(guān),以防止HV與OV相撞;ΔT為由傳感器傳輸特性帶來的時(shí)間延遲;Smin為最小安全距離;P為勢場中的點(diǎn)。
當(dāng)HV位于α區(qū)域P1點(diǎn)時(shí),若vrgt;0,則[Acar=Ucar?exp-(Kr-S)/vr],若vr≤0,則Acar=0,表明風(fēng)險(xiǎn)勢場與Kr呈負(fù)相關(guān),與vr呈正相關(guān)。因此,OV動態(tài)風(fēng)險(xiǎn)勢場可表示為:
[exy=Acar?exp-D2/2σr] " " " " " " " " " " " (17)
式中:σr為收斂系數(shù),主要決定OV風(fēng)險(xiǎn)勢場的側(cè)向作用范圍;D為等效距離,主要決定OV風(fēng)險(xiǎn)勢場的縱向作用范圍,當(dāng)HV位于α區(qū)域P1點(diǎn)時(shí),則D=d1,當(dāng)HV位于β區(qū)域P2點(diǎn)時(shí),則D=d2,當(dāng)HV位于γ區(qū)域P3點(diǎn)時(shí),則D=d3;d1為HV坐標(biāo)點(diǎn)到OV車身方向中心軸線的垂直距離;d2為HV坐標(biāo)點(diǎn)到OV風(fēng)險(xiǎn)勢場邊界的垂直距離;d3為HV坐標(biāo)點(diǎn)到OV車身側(cè)邊線的垂直距離。
4.1.2 道路標(biāo)線風(fēng)險(xiǎn)勢場
車輛在行駛過程中,需保證在車行道邊緣線之內(nèi),當(dāng)滿足換道條件時(shí),可控制車輛跨越車行道分界線到達(dá)相鄰車道行駛。建立以車道1和車道2分界線觀測點(diǎn)為坐標(biāo)原點(diǎn)or,行駛方向?yàn)閤r軸正向,左側(cè)為yr軸正向,垂直向上方向?yàn)閦r軸正向的道路坐標(biāo)系,如圖6所示。
道路標(biāo)線風(fēng)險(xiǎn)勢場可表示為:
[rxy=rxyline=Uline?exp-d2line,i/2σ2rrxyroad=exp-droad,l+dc+b/2?hi] " " " " " (18)
式中:rxyline、rxyroad分別為車行道分界線、邊緣線的風(fēng)險(xiǎn)勢場,Uline為道路風(fēng)險(xiǎn)勢場的最大值,dline,i、droad,l分別為HV至車行道分界線和邊緣線的距離,i∈[i1,i2],l∈[l1,l2],l1、l2分別為左、右道路邊界線位置,i1、i2為車道邊界線位置,dc為邊界距離安全閾值,b為車輛寬度,hi為風(fēng)險(xiǎn)勢場調(diào)節(jié)系數(shù)。
綜上所述,當(dāng)HV位于道路不同位置時(shí),會同時(shí)受到道路上OV的動態(tài)風(fēng)險(xiǎn)勢場和道路標(biāo)線的風(fēng)險(xiǎn)勢場作用。將行駛過程中HV的總風(fēng)險(xiǎn)勢場Pxy實(shí)時(shí)傳遞給NMPC控制部分作為系統(tǒng)輸出量,令控制部分的目標(biāo)函數(shù)以此為依據(jù)求解最優(yōu)控制量,可避免HV在行駛過程中發(fā)生碰撞。
4.2 NMPC控制部分設(shè)計(jì)
NMPC控制部分接收到λ*和[ahv*x,δ]后,結(jié)合總風(fēng)險(xiǎn)勢場Pxy進(jìn)行橫向規(guī)劃和運(yùn)動控制,采用單軌運(yùn)動學(xué)模型作為車輛預(yù)測模型:
[fX(t),u(t)=vhvx,δφhvδXhvδYhvδ=vjx,δahvx,δ/vhvx,δtanβ/lrcosθ/cosβsinθ/cosβ] " " " " " " (19)
[β=arctanlr?tanδflr+lf] " " " " " " " " " " " (20)
[θ=φhvδ+β] " " " " " " " " " " " " " " " (21)
式中:lf、lr分別為HV質(zhì)心到前、后軸的距離,β、θ分別為HV的質(zhì)心側(cè)偏角和航向角,[X=vhvx,δ,φhvδ,Xhvδ,YhvδT]為狀態(tài)向量,[vhvx,δ]、[φhvδ]、[Xhvδ]、[Yhvδ]分別為HV的縱向速度、橫擺角、縱向位移、橫向位移,u=[δf]為控制向量,δf為前輪轉(zhuǎn)角。
實(shí)際上,對控制目標(biāo)的求解已包含車輛橫向換道軌跡的規(guī)劃。
根據(jù)模型預(yù)測控制理論[22],可將基于DPF的MPC控制問題轉(zhuǎn)化為求凸函數(shù)的帶約束非線性規(guī)劃問題:
[minJ(k)=PTxy(k)Q1Pxy(k)+ΔMT(k)Q2ΔM(k)+ " " " " " " " " " " "ΔvT(k)Q3Δv(k)+ΔuT(k)RΔu(k)s.t.0≤vx,δ≤vmaxx,δumin≤u(k+i-1k)≤umaxΔu(k)=u(k)-u(k-1), k=1,2,…,NpΔM(k)=Yhvδ(k)-Yδ(k)Δv(k)=v(k)-v(k-1)] "(22)
式中:Np為預(yù)測時(shí)域;[Yhvδ(k)]、Yδ(k)分別為HV在k時(shí)刻的橫向位置序列和對應(yīng)的道路中心線橫向位置;v(k)為HV在k時(shí)刻的速度序列;Pxy(k)為風(fēng)險(xiǎn)勢場序列;ΔM(k)為道路中心線偏差序列;Δv(k)為速度增量序列;Δu(k)為控制增量序列;Q1、Q2、Q3、R分別為Pxy(k)、ΔM(k)、Δv(k)、Δu(k)的權(quán)重矩陣;umax、umin分別為最大和最小的控制量序列。
求解上述有約束的非線性規(guī)劃問題,當(dāng)前k時(shí)刻的最優(yōu)控制增量為Δu*(k|k),則最優(yōu)控制量u*(k|k)為:
[u*(k|k)=u(k-1|k-1)+Δu*(k|k)] " " " " " " (23)
在(k+1)時(shí)刻,重復(fù)NMPC的預(yù)測、優(yōu)化和求解過程,不斷更新車輛狀態(tài),從而完成實(shí)時(shí)決策控制。
5 模型驗(yàn)證分析
使用MATLAB平臺對基于Stackelberg博弈的閉環(huán)換道決策模型進(jìn)行仿真測試。為了簡化測試方案,將圖1所示的4種工況中的FV均設(shè)置為勻速行駛,HV和RV的駕駛風(fēng)格均按照第3.1節(jié)的決策成本函數(shù)及表1執(zhí)行,以式(14)構(gòu)建博弈決策模型,車道寬度設(shè)置為4 m,仿真參數(shù)及車輛初始狀態(tài)分別如表2和表3所示。其中,x0為初始縱向位移,y0為初始橫向位移。
為驗(yàn)證所設(shè)風(fēng)險(xiǎn)勢場的合理性,根據(jù)第4.1節(jié)建立相對速度為10 m/s時(shí)障礙車動態(tài)風(fēng)險(xiǎn)勢場和道路標(biāo)線風(fēng)險(xiǎn)勢場,如圖7所示。
當(dāng)HV處于道路不同位置時(shí),所受OV動態(tài)風(fēng)險(xiǎn)勢場的大小隨橫、縱向位置變化,且縱向勢場受相對車速影響而變化趨勢更平緩,這使得車輛換道更加順暢,不會因所受勢場變化而發(fā)生換道抖動現(xiàn)象或直接導(dǎo)致?lián)Q道失敗。道路標(biāo)線勢場中,道路中心線位置勢場最小,車行道邊緣線勢場遠(yuǎn)大于分界線,HV始終不會駛出車行道邊緣,且能順利換道至相鄰車道并保持在道路中心線上行駛。因此,該風(fēng)險(xiǎn)勢場可用于本文高速換道場景模型驗(yàn)證研究。
5.1 基于HV不同駕駛風(fēng)格的并線場景驗(yàn)證
針對圖1a中的工況1,假設(shè)RV1駕駛風(fēng)格為正常型,并將工況1的車輛初始狀態(tài)輸入Stackelberg博弈決策模型和規(guī)劃控制器中,仿真結(jié)果如圖8~圖10所示。
圖8a中,此場景下3種駕駛風(fēng)格的HV博弈決策模型的初始輸出結(jié)果均為λ*=1。圖8、圖9表明,可用到達(dá)車行道分界線的位置反映不同駕駛風(fēng)格在HV換道過程中的差異。保守型、正常型和激進(jìn)型HV到達(dá)車行道分界線的縱向位移分別為50.30 m、62.55 m和70.41 m,激進(jìn)型HV橫向誤差最大,為0.071 m,正常型和保守型HV誤差分別為0.055 m和0.045 m,均滿足通行效率和跟蹤誤差要求。并線過程中,激進(jìn)型、正常型和保守型HV最大縱向加速度分別為0.49 m/s2、0.28 m/s2和0.24 m/s2,滿足行駛舒適性要求。由圖10可知,此場景下,3種駕駛風(fēng)格的HV均會選擇向左側(cè)加速換道,且并線過程中均未與周圍車輛和前方道路終止處發(fā)生碰撞。
由于保守型駕駛風(fēng)格注重安全性,激進(jìn)型駕駛風(fēng)格注重行駛效率,正常型駕駛風(fēng)格居于二者之間,該場景下,3種駕駛風(fēng)格中保守型HV最先換道,其次是正常型,激進(jìn)型換道最遲。同時(shí),考慮到前方路況,過大的縱向加速度會增加決策成本,此時(shí),激進(jìn)型HV縱向加速度遠(yuǎn)小于其他駕駛風(fēng)格,在博弈決策過程中也會降低輸出的縱向加速度。由3種駕駛風(fēng)格換道速度變化情況可知,為了與RV1保持安全距離,HV均會先緩慢地加速,其中,正常型與激進(jìn)型前期加速情況高度相同。若該路況下激進(jìn)型HV采取更高的加速度,則難以保證與RV1的安全距離,極易產(chǎn)生碰撞。因此,需確保安全換道后再加速,從而提高通行效率。
5.2 基于RV保守型駕駛風(fēng)格的左換道場景驗(yàn)證
針對圖1b中的工況2,假設(shè)HV駕駛風(fēng)格為正常型,RV1和RV2駕駛風(fēng)格均為保守型,并將工況2的車輛初始狀態(tài)輸入Stackelberg博弈決策模型和規(guī)劃控制器,仿真結(jié)果如圖11~圖13所示。
如圖11a可知,博弈決策模型在該工況下初始輸出結(jié)果為λ*=1。由于FV2速度過低,HV行駛一段時(shí)間后未減速或換道將會發(fā)生碰撞,此時(shí)決策部分評估左、右車道行車情況,發(fā)現(xiàn)左、右側(cè)RV均無明顯加速意圖,即均具備換道條件,但左側(cè)RV1速度更低,且與HV距離更遠(yuǎn),因此,HV需選擇向左側(cè)加速換道。在換道過程中,HV換道后的軌跡與道路中心線的最大誤差為0.128 m,縱向加速度最大值為2.00 m/s2,回正橫向加速度最大值為1.73 m/s2,均滿足換道舒適性和跟蹤誤差要求。換道過程耗時(shí)6.3 s,HV在換道完成后7.7 s時(shí),跟蹤至與FV1保持相同速度行駛,滿足高速工況下通行效率的要求,由圖13可知,HV在左換道過程中未與周圍車輛發(fā)生碰撞。
由于RV1和RV2的駕駛風(fēng)格為保守型,更加注重安全性,即HV加速換道時(shí),RV1和RV2不會以加速行為阻礙HV換道,僅為提高通行效率而緩慢加速以跟蹤前車車速。FV1車速(30 m/s)與FV3車速(24 m/s)均大于后方車輛,使得后方車輛具備加速條件,因此初始階段位于FV1后方的RV1縱向加速度會大于位于FV3后方的RV2。隨著RV2的加速,與前車FV3的車速不斷接近,RV2的縱向加速度會逐漸減?。籖V1初始時(shí)跟蹤前車FV1的車速,當(dāng)HV換道至車道1后,RV1轉(zhuǎn)為跟蹤HV的車速,并且與HV不斷博弈以達(dá)到兩車整體運(yùn)行情況最優(yōu),由于HV在博弈過程中需要跟蹤FV1的車速,且HV車速小于FV1車速,因此導(dǎo)致RV1的縱向加速度在HV換道成功后出現(xiàn)減小,隨后緩慢變化的情況。HV在換道起始階段為縱向加速階段,決策部分發(fā)出換道指令后,HV加速為周圍車輛提供換道信號,同時(shí)為保證換道安全,需與相鄰車道的車輛保持一定距離。隨著HV車速不斷提高,HV與FV2的距離也隨之接近,HV受決策部分縱向安全性成本函數(shù)的限制,會出現(xiàn)加速度再度減小的情況,隨后,HV則以決策出的最優(yōu)縱向加速度完成換道過程。
5.3 基于RV激進(jìn)型駕駛風(fēng)格的跟馳場景驗(yàn)證
針對圖1b中的工況3,假設(shè)HV的駕駛風(fēng)格為正常型、RV1和RV2均為激進(jìn)型,并將工況3的車輛初始狀態(tài)輸入Stackelberg博弈決策模型和規(guī)劃控制器,仿真結(jié)果如圖14~圖16所示。
由圖14a可知,博弈決策模型在該工況下初始輸出結(jié)果λ*=0。HV發(fā)出換道信號時(shí),激進(jìn)型的RV1和RV2均會以加速行為阻礙HV換道,且RV1和RV2的車速和位置均與HV相近,強(qiáng)行換道極易發(fā)生碰撞,因此,HV減速跟馳行駛。在跟馳過程中,HV沿道路中心線安全行駛,縱向加速度在2.00 m/s2以內(nèi),橫向加速度最大值為0.68×10-5 m/s2,均滿足舒適性要求。HV在跟馳過程中由22 m/s減速至與FV2的速度18 m/s相同,耗時(shí)6.0 s,兩車間最短距離為14.86 m,滿足駕駛安全性要求,由圖16可知,HV在跟馳過程中未與周圍車輛發(fā)生碰撞。
由于RV1和RV2駕駛風(fēng)格均為激進(jìn)型,加速意圖比工況2中的保守型更為明顯,所以RV1和RV2的起始縱向加速度均大于工況2的起始縱向加速度。HV在行駛過程中未換道,即RV1和RV2的前方車輛始終保持不變,且RV1和RV2駕駛風(fēng)格相同,跟馳過程中RV1和RV2的速度趨勢保持一致。為了提高跟馳起始階段的通行效率,HV會選擇緩慢加速,當(dāng)HV與FV2距離達(dá)到跟馳閾值時(shí),會接受決策部分的跟馳指令,使得HV開始減速直至與FV2車速保持一致。
5.4 基于RV不同駕駛風(fēng)格的右換道場景驗(yàn)證
針對圖1b中的工況4,假設(shè)HV、RV1和RV2駕駛風(fēng)格分別為正常型、激進(jìn)型和保守型,且將工況4的車輛初始狀態(tài)輸入Stackelberg博弈決策模型和規(guī)劃控制器,仿真結(jié)果如圖17~圖19所示。
由圖17a可知,博弈決策模型在該工況下初始輸出結(jié)果λ*=-1,若此時(shí)RV1與RV2為同種駕駛風(fēng)格,根據(jù)起始車速和位置判斷,HV向左換道更為有利。但此時(shí)RV1為激進(jìn)型駕駛風(fēng)格,在HV準(zhǔn)備向左換道時(shí),RV1將為保證己車速度和可行駛空間而加速,阻礙HV成功換道,而保守型的RV2會更加注重安全性,進(jìn)而放棄加速,為HV讓行。因此,HV可以選擇向右側(cè)加速換道。在換道過程中,HV換道后的軌跡與道路中心線的最大誤差為0.128 m,縱向加速度最大值為2.00 m/s2,HV回正橫向加速度最大值為1.74 m/s2,均滿足換道舒適性和跟蹤誤差要求。整個(gè)換道過程耗時(shí)5.6 s,HV在換道完成后9.4 s時(shí),跟蹤至與FV3保持相同速度行駛,滿足通行效率的需求,由圖19可知,HV在右換道過程中未與周圍車輛發(fā)生碰撞。
由于RV1的駕駛風(fēng)格為激進(jìn)型且跟蹤FV1的起始縱向加速度達(dá)到2.35 m/s2,以此阻礙HV向左側(cè)換道。工況4中RV2起始縱向加速度與工況2的RV1相同,但后續(xù)過程中縱向加速度明顯較工況2低,兩種工況下RV的前車速度均為30 m/s,而工況4中RV2起始速度高于工況2的RV1,且起始位置更靠近HV。因此,當(dāng)HV向RV2所在車道換道時(shí),由于二者的速度、位置相較于工況2更為接近,為了保證安全性,RV2在博弈中降低縱向加速度的輸出。
5.5 仿真測試結(jié)果分析
由測試結(jié)果可知,本文模型在上述換道場景下均能夠結(jié)合車間互動行為及駕駛風(fēng)格特征作出最優(yōu)決策,并實(shí)施相應(yīng)的運(yùn)動控制。為了驗(yàn)證本文提出的DPF-NMPC控制效果,將采用第4.2節(jié)運(yùn)動學(xué)模型與文獻(xiàn)[19]中的運(yùn)動學(xué)模型的結(jié)果進(jìn)行對比分析,如表4所示。
本文采用的運(yùn)動學(xué)模型以車輛質(zhì)心為原點(diǎn),考慮了輪胎側(cè)偏等因素對質(zhì)心側(cè)偏的影響,對橫向加速度的限制更為充分。因此,該模型相較于文獻(xiàn)[19]的運(yùn)動學(xué)模型,雖在跟蹤精度上并無顯著差異,但橫向穩(wěn)定性方面表現(xiàn)良好,表明本文提出的規(guī)劃控制器合理有效。
為了進(jìn)一步驗(yàn)證3.2節(jié)提出的博弈決策模型的求解算法效率,仿真驗(yàn)證在中央處理器(Central Processing Unit,CPU)為Core i5的計(jì)算環(huán)境下,將4種工況的博弈決策模型使用PSO算法的平均求解耗時(shí)與內(nèi)點(diǎn)法(Interior Point Method,IPM)進(jìn)行對比,如圖20所示。IPM算法的平均求解耗時(shí)為0.153 s,PSO算法僅為0.042 s,對于實(shí)時(shí)性要求較高的高速自動換道場景而言,采用PSO算法明顯占優(yōu)。
6 結(jié)束語
本文針對高速換道決策時(shí)車間互動性不足、規(guī)劃控制間匹配性差等問題,基于Stackelberg主從博弈理論,綜合分析駕駛風(fēng)格特征和博弈雙方的動態(tài)交互行為因素,對高速場景下的自動換道決策規(guī)劃問題進(jìn)行了研究,根據(jù)提出的Stackelberg博弈決策模型,將車間互動行為納入自車決策,考慮交通參與者間的互動性與個(gè)性差異,更加貼合真實(shí)場景,并設(shè)計(jì)基于動態(tài)勢場法的非線性模型規(guī)劃控制器,利用風(fēng)險(xiǎn)勢場評估換道風(fēng)險(xiǎn),將橫向運(yùn)動規(guī)劃與控制問題整合到同一優(yōu)化系統(tǒng)中,通過質(zhì)心側(cè)偏的運(yùn)動學(xué)模型預(yù)測車輛狀態(tài),實(shí)時(shí)反饋車輛狀態(tài),共同完成規(guī)劃控制任務(wù),大幅提高規(guī)劃控制部分的匹配性,使規(guī)劃結(jié)果更加可靠,控制效果顯著提升。
仿真結(jié)果表明,隨著相對速度及場景的變化,本文提出的模型可結(jié)合車間互動性及各車駕駛風(fēng)格作出正確的決策,較好地完成相應(yīng)的運(yùn)動控制。當(dāng)前決策主要針對僅存在1輛RV的簡單高速公路場景,未來,將開展多車間交互的HV博弈決策模型研究,使決策更加具備實(shí)用性。
參 考 文 獻(xiàn)
[1] ZHU X, GU Z Q, WANG Z. Ethical Challenges and Countermeasures of Autonomous Vehicles[J]. E3S Web of " " " " " "Conferences, 2021, 233(2).
[2] CLAUSSMANN L, REVILLOUD M, GRUYER D, et al. A Review of Motion Planning for Highway Autonomous Driving[J]. IEEE Transactions on Intelligent Transportation " " " " Systems, 2020, 21(5): 1826-1848.
[3] SU J T, LOU J P, JIANG X L. Overview of Intelligent " " " " Vehicle Core Technology and Development[J]. IOP " " " " "Conference Series: Earth and Environmental Science, 2021, 769(4).
[4] 谷新平, 韓云鵬, 于俊甫. 基于決策機(jī)理與支持向量機(jī)的車輛換道決策模型[J]. 哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2020, 52(7): 111-121.
GU X P, HAN Y P, YU J F. Vehicle Lane-Changing " " " " "Decision Model Based on Decision Mechanism and Support Vector Machine[J]. Journal of Harbin Institute of " " " " " " " Technology, 2020, 52(7): 111-121.
[5] CHENG S L, XU Y, ZONG R X, et al. A Fast Decision " " Making Method for Mandatory Lane Change Using Kernel Extreme Learning Machine[J]. International Journal of " " "Machine Learning and Cybernetics, 2019, 10(12): 3363-3369.
[6] WU "J, "HUANG "W, "DE "BOER "N, et al. Safe Decision-Making for Lane-Change of Autonomous Vehicles via " " "Human Demonstration-Aided Reinforcement Learning[C]// 2022 IEEE 25th International Conference on Intelligent Transportation Systems (ITSC). Macau, China: IEEE, 2022: 1228-1233.
[7] LIU Q, LI X Y, YUAN S H, et al. Decision-Making " " " " "Technology for Autonomous Vehicles: Learning-Based " "Methods, Applications and Future Outlook[C]// 2021 IEEE International Intelligent Transportation Systems Conference (ITSC). Indianapolis, IN, USA: IEEE, 2021: 30-37.
[8] ESKANDARIAN A, WU C X, SUN C Y. Research Advances and Challenges of Autonomous and Connected Ground " " " Vehicles[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(2): 683-711.
[9] JI A, LEVINSON D. A Review of Game Theory Models of Lane Changing[J]. Transportmetrica A: Transport Science, 2020, 16(3): 1628-1647.
[10] WEI C, HE Y H, TIAN H Q, et al. Game Theoretic Merging Behavior Control for Autonomous Vehicle at Highway On-Ramp[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11): 21127-21136.
[11] LOPEZ V G, LEWIS F L, LIU M S, et al. Game-Theoretic Lane-Changing Decision Making and Payoff Learning for Autonomous Vehicles[J]. IEEE Transactions on Vehicular Technology, 2022, 71(4): 3609-3620.
[12] ZHANG Y R, HANG P, HUANG C, et al. Human-Like " " " Interactive Behavior Generation for Autonomous Vehicles: A Bayesian Game-Theoretic Approach with Turing Test[J]. Advanced Intelligent Systems, 2022, 4(5).
[13] 張殿富, 劉福. 基于人工勢場法的路徑規(guī)劃方法研究及展望[J]. 計(jì)算機(jī)工程與科學(xué), 2013, 35(6): 88-95.
ZHANG D F, LIU F. Research and Development Trend of Path Planning Based on Artificial Potential Field Method[J]. Computer Engineering amp; Science, 2013, 35(6): 88-95.
[14] WANG P W, GAO S, LI L, et al. Obstacle Avoidance Path Planning Design for Autonomous Driving Vehicles Based on an Improved Artificial Potential Field Algorithm[J]. " " " " Energies, 2019, 12(12): 2342.
[15] OROZCO-ROSAS U, MONTIEL O, SEPULVEDA R. " " Mobile Robot Path Planning Using Membrane Evolutionary Artificial Potential Field[J]. Applied Soft Computing " " "Journal, 2019, 77: 236-251.
[16] TU Q, CHEN H, LI J C. A Potential Field Based Lateral Planning Method for Autonomous Vehicles[J]. SAE " " " " "International Journal of Passenger Cars-Electronic and Electrical Systems, 2016, 10(1): 24-34.
[17] VON STACKELBERG H. Market Structure and " " Equilibrium[M]. Springer Science amp; Business Media, 2010.
[18] HANG P, LV C, HUANG C, et al. Cooperative Decision Making of Lane-Change for Automated Vehicles " " " " " "Considering Human-Like Driving Characteristics[C]// 2021 40th Chinese Control Conference (CCC). Shanghai, China: IEEE, 2021: 6106-6111.
[19] JI K, ORSAG M, HAN K. Lane-Merging Strategy for a Self-Driving Car in Dense Traffic Using the Stackelberg Game Approach[J]. Electronics, 2021, 10(8): 894.
[20] LV C, HU X S, SANGIOVANNI-VINCENTELLI A, et al. Driving-Style-Based Codesign Optimization of An " " " " "Automated Electric Vehicle: A Cyber-Physical System " " "Approach[J]. IEEE Transactions on Industrial Electronics, 2019, 66(4): 2965-2975.
[21] MARTINEZ C M, HEUCKE M, WANG F Y, et al. Driving Style Recognition for Intelligent Vehicle Control and " " " "Advanced Driver Assistance: A Survey[J]. IEEE " " " " " "Transactions on Intelligent Transportation Systems, 2018, 19(3): 666-676.
[22] 皇甫淑云, 唐守鋒, 童紫原, 等. 自主移動機(jī)器人路徑規(guī)劃方法研究綜述[J]. 軟件導(dǎo)刊, 2018, 17(10): 1-5.
HUANGFU S Y, TANG S F, TONG Z Y, et al. A Survey of Path Planning Methods for Autonomous Mobile Robots[J]. Software Guide, 2018, 17(10): 1-5.
[22] WU Y L, LI S M, ZHANG Q J, et al. Route Planning and Tracking Control of An Intelligent Automatic Unmanned Transportation System Based on Dynamic Nonlinear Model Predictive Control[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(9): 16576-16589.
(責(zé)任編輯 瑞 秋)
修改稿收到日期為2023年8月16日。