阮仕峰,惠 飛,于建游,張志剛,杜繹如,郭 星
(1.長安大學(xué)信息工程學(xué)院,陜西 西安 710064; 2.河北省高速公路延崇籌建處,河北 張家口 075400)
我國雙向車道公路里程占公路總里程的比例超過80%[1],而雙向車道的交通特性是有別于單向車道的,在雙向車道上,必須借用對向車道完成超車,這種駕駛行為被稱為逆向超車。在復(fù)雜的交通環(huán)境下,逆向超車時會受到其他車輛的干擾,如前車和后車會遮擋駕駛員的視野,使駕駛員難以察覺其他車輛的潛在威脅,尤其與對向來車發(fā)生碰撞的風(fēng)險極高,威脅著駕駛?cè)说纳敭a(chǎn)安全。相關(guān)研究表明,逆向超車所引發(fā)的交通事故占雙向車道所有事故的60%[2],逆向超車存在的安全問題亟待解決?,F(xiàn)有研究已經(jīng)給出了多種實現(xiàn)超車的具體方法,Dixit等人[3-4]分析了現(xiàn)有的超車策略,給出了高速超車軌跡規(guī)劃與跟蹤的可行方法,并在此基礎(chǔ)上進一步提出了在結(jié)構(gòu)化的高速道路環(huán)境中自行識別道路安全區(qū)域的框架,通過魯棒預(yù)測控制器(Robust MPC)生成可行的超車軌跡。Brunke[5]設(shè)計了基于學(xué)習(xí)的模型預(yù)測控制器(LMPC),通過在預(yù)定車道上多代理競爭來確定局部最優(yōu)軌跡。張家旭等人[6]提出了基于人工勢場法的路徑規(guī)劃算法以及線性魯棒控制理論最優(yōu)成本控制策略,為最優(yōu)路徑的判斷提供了一種量化的方法。Chen等人[7]采用雙向快速隨機擴展樹法(bi-RRT),在狀態(tài)空間中構(gòu)建連通圖,從初始狀態(tài)到最終狀態(tài)的路徑中通過碰撞檢測算法尋找最優(yōu)路徑。Asaithambi等人[8]通過分析各種類型車輛的超車行為特征,建立了復(fù)雜場景下的交通流模型。以上研究對于超車過程中所存在的超越、交錯、追尾等交通沖突[9]都進行了充分考慮,其有效性也已得到了驗證,但是這些算法并不適用于逆向超車場景,盡管逆向超車與一般超車的過程是大致相似的,但是逆向超車還存在車輛相會的交通沖突[10],在超車之前需要額外考慮對向來車的行駛狀況,這在上述研究中并未涉及。車聯(lián)網(wǎng)技術(shù)的成熟為解決逆向超車的問題提供了解決思路[11],通過車車通信共享對向來車信息,可以克服視線遮擋所造成的信息不足的問題。但是現(xiàn)有車聯(lián)網(wǎng)應(yīng)用中僅對對向來車進行預(yù)警,并未給出具體的超車策略,針對這一問題,本文從全局信息獲取以及駕駛員信息獲取2個角度出發(fā),將對向來車的影響因素引入到?jīng)Q策方法中,并最終實現(xiàn)逆向超車的軌跡規(guī)劃和跟蹤控制。
逆向超車場景中需要將對向來車的影響納入到超車決策中,因此必須找到一種可以判斷其對主車的威脅程度大小的指標。在現(xiàn)有研究中,通常會將環(huán)境車輛對主車所造成的影響進行抽象或者量化,使用數(shù)學(xué)模型或者物理指標對其進行描述,例如勢場法[12]。本章將給出超車決策中具體的衡量指標和參考依據(jù)。
全局信息主要包括速度、加速度、兩車間距,在現(xiàn)有車聯(lián)網(wǎng)技術(shù)的研究成果下,已經(jīng)能夠保證傳輸?shù)牡蜁r延和可靠性[13],因此可以依托車車通信來獲取決策所需的全局信息。通過速度、加速度等全局信息環(huán)境車輛的駕駛行為和位置信息進行預(yù)測,可以得知該路徑點有車或者無車的概率,這一概率即可視作該區(qū)域發(fā)生碰撞的概率。如圖1所示,如果在當前時刻C1選擇超車,預(yù)測時段內(nèi),C1在超車過程中會與C2、C3發(fā)生碰撞,于是則可以認為預(yù)測中C2、C3所在的區(qū)域不安全。對當前道路段的所有離散路徑點進行風(fēng)險評估,最終生成整個路段的碰撞熱圖,從而將交通環(huán)境對智能車所構(gòu)成的風(fēng)險進行量化,為決策和規(guī)劃提供直觀依據(jù)。
圖1 安全評估方法示意圖
與車輛的位置相關(guān)程度最高的參數(shù)為車輛的加速度,經(jīng)過大量的數(shù)據(jù)驗證及實際測試后證實,車輛行駛過程中的加速度變化情況近似服從特定數(shù)學(xué)分布[14-16],如果加速度的變化是可以預(yù)知的,那么借助現(xiàn)有智能車技術(shù)的信息交換來獲取其他車輛的信息,并依托于結(jié)構(gòu)化道路[17]的特性,可以對環(huán)境車輛位置的變化情況進行預(yù)測,下面將從橫向和縱向?qū)囕v的位置進行預(yù)測。
1.1.1 位置預(yù)測
在逆向超車場景下,超車能否成功很大程度取決于對向來車的位置,如果掌握了對向來車縱向位移的分布情況,那么對向來車的實時位置就可以得到預(yù)測。記車輛縱向加速度ax∈[ax,min,ax,max],在實際行駛過程中,車輛總體上是趨于保持勻速行駛的,即縱向加速度集中分布在0點附近,因此一般認為ax近似服從正態(tài)分布,其取值概率為:
(1)
車輛的縱向位置si與速度、加速度關(guān)系如下:
(2)
其中,s0、v0是車輛當前的縱向位移和速度,Δti=ti-t0,ay為加速度。故縱向位移取值概率可表示為:
(3)
橫向位置預(yù)測實際就是對車輛變道的預(yù)測,車輛如何行駛?cè)Q于駕駛員的駕駛意圖,在駕駛行為意圖研究領(lǐng)域,可以采用sigmoid函數(shù)[18]來描述駕駛員的行為特征分布情況,因此通過sigmoid函數(shù)描述駕駛員做出變道行為的概率為:
(4)
其中,m為斜率,λ定義為:
(5)
其中,l是前后兩車的間距,vf是前車的速度,vb是后車的速度。在駕駛員做出決策后,車輛的換道情況可以用向左或者向右的加速度進行描述,記ay∈[ay,min,ay,max],經(jīng)過大量的數(shù)據(jù)分析后得出,ay的概率密度函數(shù)為:
(6)
其中,u和α是形狀參數(shù),β為速率參數(shù),Γ(α)為伽馬函數(shù)。在上述公式的基礎(chǔ)上,可以得出車輛在特定時刻的橫向加速度的具體情況??梢耘袛啻藭r車輛的3種狀態(tài),即向左換道、向右換道、直行,仍然以概率來描述加速度取值的情況:
(7)
事實上,加速度與位移互為反函數(shù),于是進一步得到車輛橫向位置的預(yù)測概率為:
(8)
其中,lmin、lmax是橫向位移的最小值和最大值,其值取決于道路寬度的大小。
1.1.2 碰撞熱區(qū)圖
車輛的實際運動中,橫向和縱向上的加速度可能同時存在,因此將縱向和橫向運動的概率整合為車輛的真實運動預(yù)測:
P=[1-P(λ)]Px+P(λ)PxPy
(9)
概率P表示車輛在在特定時間節(jié)點位于某一位置的概率。根據(jù)這一公式對所有離散道路采樣點進行評估,智能車可以根據(jù)路段的安全狀況規(guī)劃軌跡。
在多車場景下,所有車輛構(gòu)成了一個動態(tài)變化、相互影響的系統(tǒng),每一輛車的狀態(tài)變化都會反饋給系統(tǒng)從而影響系統(tǒng)的狀態(tài),因此在考察道路區(qū)域安全性時,將所有可對該區(qū)域產(chǎn)生影響的車輛按照如下公式納入計算:
(10)
道路評估結(jié)果如圖2所示,圖中各區(qū)域值的分布反映了道路不同區(qū)域的碰撞概率大小。
圖2 安全評估結(jié)果
1.1.3 最小安全距離
在占用對向車道時容易發(fā)生碰撞事故,因此在進行逆向超車決策時,必須考慮從開始超車到并入原來車道的整個期間是否會與對向來車發(fā)生碰撞,下文將對逆向超車的最小安全超車距離進行研究,只需確保超車距離大于最小安全距離,即可避免碰撞事故的發(fā)生。
圖3展示了逆向超車的具體過程,L0、L1、L2為各車間距,d1、d2分別為主車完成變道及并道所行駛的路程,L為主車開始超車時與對向來車的距離,即超車視距[19],主車一旦開始超車,必須確保有足夠的時間超越前車并完成并道,避免與對向來車發(fā)生碰撞,因此超車前必須考慮會車間距是否滿足安全要求。L計算方法為:
圖3 逆向超車過程
(11)
式(11)中,v0為主車的初始速度,a為主車的加速度,主車的超車速度為道路最大限速vm;v2、v3分別為前車和對向來車的速度;L0為主車與前車的車頭間距。
在時間節(jié)點t主車與對向來車的預(yù)測間距為:
Lt=|s-sopp|
(12)
其中,s表示智能車的實時位置,sopp表示在預(yù)測中對向來車將會到達的位置。由于下文的路徑選擇算法所選路徑點發(fā)生碰撞的概率并不總是為0,因此當Lt 上文的決策方法依賴于對加速度、行車間距等全局信息的快速獲取,從而預(yù)測車輛的狀態(tài),因此對于車聯(lián)網(wǎng)通信有著時延和穩(wěn)定性等方面的要求。但實際也會存在離開服務(wù)基站服務(wù)范圍而失效等異常情況,加之目前車聯(lián)網(wǎng)未得到大規(guī)模普及,仍然以駕駛員手動駕駛為主,為了降低算法對車車通信的依賴程度,保證算法在非車聯(lián)網(wǎng)場景下仍然有效,本節(jié)提出一種基于駕駛員視覺信息以及車載傳感器的決策方法。 就目前市面的主流汽車產(chǎn)品而言,駕駛員的信息來源除了自身獲取的視覺信息外,還包括車載傳感器提供的一些信息。在自動駕駛?cè)〈謩玉{駛之前,由于駕駛員的判斷主導(dǎo)車輛的行為,因此車輛并不是簡單做機械運動的物體,駕駛員的個人風(fēng)格會切實影響到行車過程。假定所有駕駛員都希望在安全范圍內(nèi)將駕駛行為的收益最大化,那么各車之間存在著相互競爭關(guān)系,駕駛員要利用已有的信息來使得自身贏得競爭。這種互相競爭的局面正好符合博弈論[20-21]的應(yīng)用場景。 駕駛員獲取的視覺信息大致可以劃分為2類:1)對于其它車輛位置的判斷,如兩車間距的拉近、車輛行駛方向的改變等,基于這一類信息駕駛員可以初步判斷其它車輛的行為意圖;2)車輛的信號燈(轉(zhuǎn)向燈和尾燈)的信息對于駕駛員來說至關(guān)重要,是駕駛員判斷其他車輛行為意圖的主要依據(jù)。視覺信息的獲取也會影響博弈中雙方的收益對比,假設(shè)車輛A和車輛B進入同一行駛區(qū)域,雙方將會觀察對方的行為,并估算對方到達期望位置所需要的時間,車輛會根據(jù)估算的時間行動,在自身快速通過的同時確保雙方通過同一區(qū)域的時間差能夠安全。車輛A決策并實施之后會觀察車輛B對本車行為的反應(yīng),車輛B采取的反應(yīng)行為將會影響車輛A下一次的決策,兩車之間的這種決策可以看作從兩車進入路口區(qū)域第一次決策時間點T0到使用場圖判斷兩車沖突關(guān)系[22]結(jié)束時的最后一次決策時間點T1內(nèi)的動態(tài)重復(fù)博弈,如圖4所示。 圖4 兩車博弈示意圖 博弈論的關(guān)鍵點在于參與方都在尋求自身收益的最大化。對于超車過程來說,可以將收益劃分為2個部分,一部分是位置收益,可以理解為位置領(lǐng)先的車輛收益更大;另一部分則是安全收益,承受的風(fēng)險越小則安全收益越大。這2個部分收益在一定程度上是互相沖突的。下面用收益函數(shù)來描述2種收益的變化狀態(tài)。收益函數(shù)定義為: (13) 其中,F(xiàn)( )表示歸一化計算,α和β分別表示安全因素和時間因素的權(quán)重系數(shù),且α+β=1,ΔT為博弈雙方通過沖突區(qū)域的時間差,計算方法為: (14) 軌跡規(guī)劃的目的在于引導(dǎo)智能車按照既定策略行駛,必須考慮軌跡會對智能車產(chǎn)生的影響。路徑規(guī)劃要考慮曲線的平滑,這對車輛行駛的安全性以及駕駛的舒適性來說非常重要,同時還要保證擬合曲線與路徑點足夠接近。得到合適的路徑后,將路徑與預(yù)期的時間序列信息相互結(jié)合,可以進一步得到速度分布。 h(n)=Pc(ti,tj)+G(t)+|k(i,j)|+W(i,j) (15) 其中,k(i,j)表示頂點Vi、Vj之間的邊的斜率,斜率絕對值越大則表示變道越急促。W(i,j)表示頂點Vi、Vj的邊偏離道路中心線地程度,其計算方式為: W(i,j)=(dj-dc)2-(di-dc)2 (16) 其中,di、dj為i、j點處的橫向位置,dc為道路中心線的橫向位置。 搜索過程如圖5所示,搜索算法會對當前頂點的每個鄰近頂點進行檢查,邊的估值被累計到當前的路徑中,通過總估值的大小來判斷可達性。首次搜尋出的路徑雖然是代價最低的,但是在軌跡規(guī)劃時未必是最優(yōu)選擇,因此圖搜索算法完成后,將所選路徑添加到參考路徑的集合中,并將路徑已經(jīng)包含的邊進行標記,然后開始新的搜索。參考路徑的可達性直接反映了其風(fēng)險程度的大小。 圖5 路徑搜索過程 軌跡規(guī)劃采用了基于多項式曲線擬合的方法,根據(jù)車輛初始時刻和超車完成時的狀態(tài),在指定時間序列內(nèi)完成相應(yīng)操作?;诙囗検降能壽E規(guī)劃的一般方法是分別在車輛行駛的橫縱方向上構(gòu)建如下多項式函數(shù)[25]: (17) 其中,x(t)、y(t)分別是智能車橫向和縱向的行駛曲線,ai、bj為各自的待定系數(shù)。 由于車輛實際駕駛過程中,其控制需要滿足運動學(xué)和動力學(xué)約束,加速度約束需曲線二階連續(xù),因此本文采用四次多項式進行路徑擬合。根據(jù)安全路徑點[(xi,yi)1,(xi,yi)2,…,(xi,yi)n],i=1,2,…,k,分別計算為: (18) 其中,(xi,yi)為路徑點坐標,r=4,之后建立正規(guī)方程組: (19) 對上式進行求解以得到多項式函數(shù)的各系數(shù)[m0,m1,…,mk]T,之后得到智能車的擬合路徑曲線為: 微課的授課時間短,要想在10 min內(nèi)把要講的知識點講完,就必須做到精煉,就必須做到重難點突出,學(xué)生看完就能很快知道授課的重點和難點,就能很快掌握所學(xué)的知識點.相反,如果微課做的不精煉,雜亂無章,學(xué)生看后不知所云,更是摸不著頭腦,那么這樣的微課是失敗的,不但浪費了教師制作時付出的時間和精力,而且浪費了課堂上的授課時間,浪費了學(xué)生的精力和時間,降低了教學(xué)效率,給學(xué)生的學(xué)習(xí)添加更多的困難和阻力. y=m0+m1x+m2x2+…+mkxk (20) 速度規(guī)劃必須滿足2個要求:首先是速度分布必須在允許范圍之內(nèi),不應(yīng)超速或者速度過低;其次速度的變化能夠保證車輛平穩(wěn)地完成超車,車輛之間不會相互造成干擾甚至發(fā)生沖突。因此可以在已經(jīng)規(guī)劃完成的路徑的基礎(chǔ)上,添加時間序列信息,對速度進行規(guī)劃,根據(jù)時間序列信息得到的指定時間和預(yù)期位移,計算目標速度,這樣得到的速度分布必定滿足超車過程中任意時刻的速度要求。 如圖6所示,將規(guī)劃所得的路徑近似表示為不光滑的多段直線,在此針對i、j之間的路徑進行研究。記i、j間的位移為Sij,i點處的速度記為vi,加速度記為ai,j點的速度記為vj,則有: 圖6 速度規(guī)劃 vj=vi+aitw (21) 其中,tw表示從i點到達j點的預(yù)期時間,可以表示為: (22) 于是式(21)可以進一步表示為: (23) 本章將設(shè)計一種模型預(yù)測控制器來對智能車的軌跡跟蹤進行控制,其主要方法是根據(jù)算法規(guī)劃出的軌跡數(shù)據(jù),不斷地進行滾動優(yōu)化和更新,并最終輸出車輛可用的信號從而對智能車進行控制。這也是模型預(yù)測控制的基本思想,即利用已有的模型系統(tǒng)當前的狀態(tài)和下一個時域的控制量去預(yù)測系統(tǒng)下一個時域的輸出,通過求解帶有邊界條件的優(yōu)化問題來實現(xiàn)控制目的。 (24) 該模型能夠比較詳細地反映車輛各項狀態(tài)變量之間的非線性關(guān)系,其一般形式可表示為: λ=f(ξ,u) (25) λ=A(t)[ξ-ξref]+B(t)[u-uref] (26) 通過前向歐拉法對其進行離散化處理,處理后的狀態(tài)方程為: (27) 預(yù)測時域內(nèi)的參考值記為r(k),k時刻的預(yù)測誤差記為z(k),則根據(jù)上式可以得到整個預(yù)測時域Np內(nèi)的誤差: (28) 為了找到最佳的控制量Uk,使得預(yù)測時域內(nèi)的狀態(tài)向量與參考值盡可能接近,從而系統(tǒng)的狀態(tài)能準確跟蹤期望的軌跡,根據(jù)預(yù)測狀態(tài)向量與參考值之間的累計誤差定義優(yōu)化目標函數(shù),并對Uk添加約束[27]: (29) 由于本文選用的是動力學(xué)模型,其約束條件較多,為了確??刂破髂軌蛟谟嬎銜r間內(nèi)得到最優(yōu)解,在目標函數(shù)中添加松弛因子[28]。綜合目標函數(shù)及約束條件,得到基于動力學(xué)模型的優(yōu)化問題如下: (30) 其中,yhc、ysc分別為模型預(yù)測控制器的硬約束和軟約束,Q、R、ρ為權(quán)重系數(shù),ε為松弛因子,軟約束可以通過松弛因子進行調(diào)節(jié)。在進行優(yōu)化求解之后,可以得到控制時域內(nèi)一系列控制輸入量,在接下來的控制周期,序列中的元素將實際作用于系統(tǒng),從而實現(xiàn)對期望軌跡的跟蹤。 為了驗證本文所提出的控制算法對整個逆向超車過程的實際控制效果,本文搭建一個仿真平臺用于測試。在CarSim中完成對仿真工況、車輛、道路及車輛參數(shù)的配置,借助MATLAB/Simulink完成轉(zhuǎn)向系統(tǒng)路徑規(guī)劃與跟蹤控制策略的搭建,如圖7所示。本模型將根據(jù)規(guī)劃層中優(yōu)化求解得到的路徑曲線和參考速度作為模型預(yù)測控制器的參考軌跡輸入,模型預(yù)測算法作為控制器,在預(yù)測時域內(nèi)對參考軌跡進行跟蹤,控制時域內(nèi)輸出前輪轉(zhuǎn)向角及加速度,并將數(shù)據(jù)注入被控車輛,以此實現(xiàn)對車輛的實時控制。 圖7 Carsim/Simulink聯(lián)合仿真界面 仿真驗證過程如圖8所示,圖中分別展示了跟隨、變道、超越、并道4個階段的情況,主車順利完成了超車。軌跡跟蹤效果如圖9、圖10所示,從圖中可以看出,直行時的橫向跟蹤誤差接近于0,由于轉(zhuǎn)向所帶來的誤差最大不超過0.1 m,跟蹤效果良好,而車輛從起步到完成超車的整個過程,速度的跟蹤誤差不超過3 km/h。圖11為超車過程中的車輛參數(shù),從上而下分別為方向盤轉(zhuǎn)角、前輪轉(zhuǎn)角、輪胎滑移角、方向盤轉(zhuǎn)角和前輪轉(zhuǎn)角,直觀地體現(xiàn)了模型預(yù)測控制器對車輛的控制過程,輪胎滑移角則反映出了軌跡滿足車輛實際行駛的要求。 圖8 仿真實時動畫 圖9 跟蹤效果 圖10 跟蹤誤差 圖11 車輛動力學(xué)參數(shù) 并道階段與變道階段的試驗方法完全類似。上文先對變道階段進行了跟蹤測試,在確定了模型預(yù)測控制器的性能后,進一步對整個超車過程進行跟蹤試驗。圖12展示了軌跡跟蹤效果以及誤差,跟蹤過程的最大誤差約為0.15 m,誤差率不超過4%,跟蹤誤差主要發(fā)生在轉(zhuǎn)向階段,這是由車輛的動力學(xué)因素所決定的。實驗結(jié)果表明本文算法規(guī)劃的軌跡平滑,軌跡跟蹤的結(jié)果準確,性能達到了預(yù)期要求。 圖12 超車軌跡 為了進一步驗證模型的控制性能,將本模型與預(yù)瞄最優(yōu)曲率駕駛員模型[29]進行對比試驗,結(jié)果如圖13所示,可以看出,本文模型的最大誤差約為0.12 m,而預(yù)瞄最優(yōu)模型最大誤差約為0.15 m,相較于對比模型誤差下降了約20%,并且跟蹤誤差的波動更小,說明跟蹤過程更加平穩(wěn)。 圖13 模型性能對比 本文針對智能車逆向超車所存在的安全性問題提出了超車策略,該策略通過全局信息預(yù)測和基于博弈論的協(xié)作控制進行決策,對智能車的行車環(huán)境進行了直觀的參數(shù)化描述,并且實現(xiàn)了軌跡規(guī)劃與跟蹤控制,仿真結(jié)果驗證了算法在逆向超車場景下的有效性。本文所提出的方法充分考慮了近年的相關(guān)研究工作[30-32]所具備的優(yōu)點,并在現(xiàn)有研究的基礎(chǔ)上進一步補充了以下工作內(nèi)容: 1)提出的超車控制方法考慮了多車場景下車輛之間的相互作用,不但將當前的交通狀況作為判斷依據(jù),還考慮了車輛未來的潛在運動趨勢。換而言之,環(huán)境車輛的運動預(yù)測和主車的運動規(guī)劃是有機結(jié)合的,這使得決策的可靠性得到了提高。 2)發(fā)揮了車聯(lián)網(wǎng)所具有的優(yōu)勢,相較于其他依賴于傳感器的超車策略,車聯(lián)網(wǎng)能更加可靠地提供環(huán)境感知信息,這從根本上確保了算法的正確運行,因此本文的方法對于車聯(lián)網(wǎng)場景是完全適用的。 3)除了對車聯(lián)網(wǎng)場景的研究外,本文還兼顧了非車聯(lián)網(wǎng)場景下的應(yīng)用,借助現(xiàn)在已經(jīng)頗具規(guī)模的車載傳感器,發(fā)揮駕駛員自身的主導(dǎo)作用,采用了基于博弈論的超車方法,降低了算法對于車聯(lián)網(wǎng)的依賴性,使得本文對于非車聯(lián)網(wǎng)場景同樣適用,這是其他車聯(lián)網(wǎng)相關(guān)研究尚不具備的優(yōu)勢。 4)本文在采用博弈論的方法時,考慮了駕駛員的主觀判斷對于車輛的主導(dǎo)作用,把多車場景下的所有實體視作一個動態(tài)變化的交通系統(tǒng),相較于其他研究,不再把環(huán)境車輛視作機械的障礙物體,這其實更加貼合真實行車過程的特點。 本文同樣存在局限性,首先是對于車聯(lián)網(wǎng)相關(guān)設(shè)施的普及有一定要求,只有在相對完整的車聯(lián)網(wǎng)環(huán)境下,本文中的方法才能發(fā)揮最佳性能。此外為了降低算法對車車通信的依賴程度,使算法能充分利用駕駛員的視覺信息,本文采用了非合作博弈的方法,但是博弈的過程還局限于2個參與者之間,在真實場景中,交通參與者并不是孤立的個體,而是相互影響,彼此博弈,因此,未來筆者的研究還需要進一步向多方博弈的方向進行完善。1.2 基于博弈論的決策方法
2 軌跡規(guī)劃
2.1 路徑規(guī)劃
2.2 速度規(guī)劃
3 軌跡跟蹤控制
4 仿真實驗結(jié)果分析
5 結(jié)束語