陳曉明,李 柏,范麗麗,張友民
(1.湖南大學(xué) 機(jī)械與運(yùn)載工程學(xué)院,湖南 長(zhǎng)沙 410082;2.北京理工大學(xué) 信息與電子學(xué)院,北京 100081;3.康考迪亞大學(xué) 機(jī)械、工業(yè)與航空工程系,魁北克 蒙特利爾 H3G 1M8)
自動(dòng)駕駛系統(tǒng)集成了傳感技術(shù)、數(shù)據(jù)處理技術(shù)以及自動(dòng)化技術(shù)等[1],能夠?qū)崿F(xiàn)自動(dòng)感知、決策規(guī)劃和控制跟蹤功能,它在提升交通安全性、通行效率、環(huán)境與資源友好性等方面具有巨大的潛力[2]。自動(dòng)泊車是自動(dòng)駕駛技術(shù)的重要應(yīng)用之一,它能夠讓車輛在停車場(chǎng)或道路上實(shí)現(xiàn)自動(dòng)泊車和取車,從而節(jié)省司乘時(shí)間、提升出行便捷度[3]。
眾多汽車制造商和技術(shù)公司競(jìng)相研發(fā)并推出各自的自動(dòng)泊車產(chǎn)品,展現(xiàn)出在自動(dòng)駕駛技術(shù)領(lǐng)域的高度競(jìng)爭(zhēng)力和持續(xù)創(chuàng)新性。例如,奔馳的Drive Pilot、日產(chǎn)的ProPilot、凱迪拉克的Super Cruise、特斯拉的FSD、小鵬汽車的XNGP、問(wèn)界電動(dòng)汽車搭載的華為ADS 2.0以及寶駿云朵純電家用車搭載的大疆成行平臺(tái)等都是備受關(guān)注的代表性產(chǎn)品。盡管這些自動(dòng)駕駛系統(tǒng)發(fā)展勢(shì)頭強(qiáng)勁,但泊車系統(tǒng)的泛化性仍存在挑戰(zhàn)。目前這些系統(tǒng)的性能仍受到特定條件和環(huán)境的制約,當(dāng)遇到難度較大的泊車情境時(shí),系統(tǒng)可能會(huì)采取保守的策略,選擇將車輛的控制權(quán)交還給人類駕駛員,這降低了用戶的使用體驗(yàn)感,也在一定程度上說(shuō)明了自動(dòng)泊車系統(tǒng)的智能性仍有提升空間。在自動(dòng)泊車系統(tǒng)中,決策規(guī)劃模塊負(fù)責(zé)通過(guò)車載傳感器和通信網(wǎng)絡(luò)系統(tǒng)接收?qǐng)鼍靶畔ⅲ贫ㄖ悄苘嚨男旭偛呗院瓦\(yùn)動(dòng)軌跡[4]。大量文獻(xiàn)表明,不同的運(yùn)動(dòng)規(guī)劃方法已被應(yīng)用于泊車場(chǎng)景,但在無(wú)序、多變的復(fù)雜環(huán)境中實(shí)時(shí)地規(guī)劃出無(wú)碰撞、易于跟蹤執(zhí)行、高效率的泊車軌跡仍是挑戰(zhàn)[5-8]。
現(xiàn)有文獻(xiàn)對(duì)感知、決策與控制這3 個(gè)模塊的發(fā)展進(jìn)行了較為全面的描述,然而對(duì)運(yùn)動(dòng)規(guī)劃模塊,特別是泊車場(chǎng)景下的具體技術(shù)與方法,闡述得相對(duì)較少。為填補(bǔ)這一研究空白,本文聚焦運(yùn)動(dòng)規(guī)劃模塊,梳理了自動(dòng)泊車領(lǐng)域現(xiàn)有的智能車運(yùn)動(dòng)規(guī)劃方法,介紹各研究團(tuán)隊(duì)提出的方法/技術(shù)及其貢獻(xiàn),并對(duì)比了這些方法/技術(shù)的優(yōu)點(diǎn)和適用條件,最后闡述了自動(dòng)泊車運(yùn)動(dòng)規(guī)劃領(lǐng)域未來(lái)的研究方向和應(yīng)用前景。
運(yùn)動(dòng)規(guī)劃是車載決策規(guī)劃模塊中的一個(gè)功能環(huán)節(jié),它承接上游路由尋徑獲得的全局路線、任務(wù)指派調(diào)度等宏觀全局信息,在其基礎(chǔ)上實(shí)施局部的軌跡規(guī)劃[9]。局部軌跡規(guī)劃負(fù)責(zé)規(guī)劃出一條銜接始末位姿的時(shí)空軌線,以使車輛按制定的行駛方案從起點(diǎn)行駛到目標(biāo)位置,同時(shí)確保車輛安全、高效、舒適以及能耗低[10]。運(yùn)動(dòng)規(guī)劃的求解質(zhì)量與效率直接反映了自動(dòng)泊車系統(tǒng)的智能水平[11-12],而自動(dòng)泊車是實(shí)現(xiàn)高級(jí)自動(dòng)駕駛系統(tǒng)商業(yè)應(yīng)用和批量生產(chǎn)最有前景的場(chǎng)景之一[13]。
泊車通常發(fā)生在停車場(chǎng)、路側(cè)等非結(jié)構(gòu)化的場(chǎng)景中。與道路上巡航的場(chǎng)景不同,這些場(chǎng)景不存在明確的參考線指引車輛行駛;同時(shí),泊車時(shí)車輛通常需要進(jìn)行倒車、滿舵以及多次方向調(diào)整[14]。因此,泊車的運(yùn)動(dòng)規(guī)劃需要充分考慮車輛的機(jī)械性能,如極限轉(zhuǎn)向角、微小幅度速度調(diào)整等[15]。此外,泊車場(chǎng)景中存在運(yùn)動(dòng)軌跡難以預(yù)測(cè)的行人、難以預(yù)先定義形狀和數(shù)量的障礙物、目標(biāo)泊位狹小或非標(biāo)準(zhǔn)(圖1)等情況,這些因素考驗(yàn)著泊車運(yùn)動(dòng)規(guī)劃方法的泛化性,即其是否能夠處理復(fù)雜環(huán)境中的避障任務(wù)。這一特性也使得泊車的運(yùn)動(dòng)規(guī)劃方法能夠推廣應(yīng)用于其他復(fù)雜、非結(jié)構(gòu)化的環(huán)境,如港口、礦山和園區(qū)等[16]。雖然這些場(chǎng)景的任務(wù)本質(zhì)是相同的,即所規(guī)劃出的軌跡能夠避讓環(huán)境中的障礙物、滿足符合運(yùn)動(dòng)學(xué)的可行性要求,但需要結(jié)合應(yīng)用場(chǎng)景的特征和具體需求進(jìn)行適配處理[17]。
圖1 停車場(chǎng)靜態(tài)雜亂障礙物實(shí)拍圖Fig.1 Static and cluttered obstacles in the parking lot
泊車運(yùn)動(dòng)規(guī)劃的輸出結(jié)果是軌跡,該軌跡包含一系列時(shí)序路途點(diǎn)以及相應(yīng)的車輛運(yùn)動(dòng)狀態(tài)[18];而路徑規(guī)劃的結(jié)果僅是二維平面上的一條曲線,在獲得可行路徑后需要額外匹配與時(shí)間相關(guān)的物理量,從而生成完整的軌跡,因此路徑規(guī)劃實(shí)質(zhì)上是將運(yùn)動(dòng)規(guī)劃解耦為路徑規(guī)劃和速度規(guī)劃后的兩個(gè)模塊之一。路徑規(guī)劃的局限之處在于與時(shí)間相關(guān)的控制變量信息需要通過(guò)逆運(yùn)動(dòng)學(xué)分析來(lái)獲得。如果將泊車規(guī)劃任務(wù)視同為路徑規(guī)劃問(wèn)題,那么泊車過(guò)程中常見的車身原地靜止而車輪轉(zhuǎn)向的“原地打輪”等復(fù)雜行駛動(dòng)作無(wú)法通過(guò)路徑規(guī)劃結(jié)果來(lái)反映,因此泊車規(guī)劃任務(wù)需要處理的是軌跡規(guī)劃問(wèn)題而非路徑規(guī)劃問(wèn)題。即便如此,早期的研究大多僅聚焦于路徑規(guī)劃本身,而專注于在獲得路徑后進(jìn)行速度規(guī)劃的研究較少(速度規(guī)劃往往按照恒定速度或最優(yōu)速度方式實(shí)現(xiàn),或者將速度規(guī)劃的任務(wù)下放至控制跟蹤階段實(shí)現(xiàn)),這是由于早期的技術(shù)水平不足以支撐高性能軌跡規(guī)劃方法的開發(fā)。因此,本文尊重該領(lǐng)域的歷史發(fā)展進(jìn)程,同時(shí)對(duì)自動(dòng)泊車路徑規(guī)劃方法以及軌跡規(guī)劃方法進(jìn)行回顧。
現(xiàn)定義車輛的狀態(tài)變量為z∈Rnz,控制變量為u∈Rnu,其中nz表示狀態(tài)空間的維數(shù),nu表示控制空間的維數(shù),集合C表示車輛行駛的二維平面空間,COBS表示二維平面上由環(huán)境中靜態(tài)障礙物占據(jù)的子空間區(qū)域,CFREE=CCOBS表示環(huán)境中車輛的可行駛區(qū)域。自動(dòng)泊車軌跡規(guī)劃任務(wù)可被直觀、準(zhǔn)確地描述為如下數(shù)學(xué)模型:
式中:tf——泊車運(yùn)動(dòng)過(guò)程的終止時(shí)刻;J——待最小化的代價(jià)函數(shù);——車輛運(yùn)動(dòng)學(xué)的常微分方程組;[zmin,zmax] ——受到車輛自身物理屬性限制的z(t)的容許區(qū)間;[umin,umax]——受到車輛自身物理屬性限制的u(t)的容許區(qū)間;zinit與uinit——z(t)在初始時(shí)刻的取值;zend與uend——u(t)在終止時(shí)刻的取值;fp(·):Rnz→R2——從車輛狀態(tài)位姿z到其占據(jù)環(huán)境空間區(qū)域(即車身足跡)的非線性映射。
早在20世紀(jì)70年代,Miller J A[19]已將移動(dòng)機(jī)器人的運(yùn)動(dòng)規(guī)劃方法衍生到阿克曼轉(zhuǎn)向的車輛的運(yùn)動(dòng)規(guī)劃,并考慮了車輛的倒車行為和車輛運(yùn)動(dòng)學(xué)約束,這項(xiàng)工作呈現(xiàn)了泊車運(yùn)動(dòng)規(guī)劃的初步形態(tài)。早期,規(guī)劃未被視為獨(dú)立的研究課題,而是與控制融合在一起。Harris C J 與Moore C G[20]在1989年設(shè)計(jì)了控制車輛跟蹤簡(jiǎn)單泊車路徑的方案(圖2),那時(shí)的泊車運(yùn)動(dòng)規(guī)劃方法主要解決標(biāo)準(zhǔn)泊位的泊車問(wèn)題。隨著計(jì)算機(jī)硬件的發(fā)展,學(xué)者們開始考慮更復(fù)雜、更貼近日常實(shí)際交通情景的泊車場(chǎng)景。
圖2 文獻(xiàn)[20]方法設(shè)計(jì)概覽Fig.2 Overview of the methodology in reference [20]
當(dāng)前,面向自動(dòng)泊車任務(wù)的主流運(yùn)動(dòng)規(guī)劃方法主要包括幾何方法、搜索方法、采樣方法、數(shù)值優(yōu)化方法以及機(jī)器學(xué)習(xí)方法[21]。
幾何方法是針對(duì)特定的泊車場(chǎng)景展開的研究[22],如平行泊車、垂直泊車或斜列泊車。在1957年,Dubins L E[23]忽略環(huán)境中的障礙物,僅聚焦規(guī)劃出車輛可執(zhí)行的路徑,證明了在轉(zhuǎn)彎半徑受限時(shí)連接兩點(diǎn)之間的路徑可以由最大曲率的弧線和直線段組成。由于Dubins 曲線只允許車輛向前行駛,在某些情景下車輛不得不在目標(biāo)點(diǎn)附近繞行以滿足目標(biāo)位姿的要求。Reeds J和Shepp L[24]基于Dubins算法提出了RS曲線,與Dubins 曲線不同,RS 曲線允許車輛有倒退行為,因此在特定場(chǎng)景中能夠找到更優(yōu)的路徑。針對(duì)低速的泊車場(chǎng)景,許多研究者延用圓弧與直線段的組合作為行車路徑這一思想,通過(guò)探究泊車過(guò)程中車輛與泊位的相對(duì)位置關(guān)系并結(jié)合車輛的運(yùn)動(dòng)學(xué)模型以及幾何參數(shù)求得關(guān)鍵的航跡點(diǎn),隨后使用直觀的解析式表示泊車路徑。Hsieh M F和Ozguner U[25]基于車輛的最小轉(zhuǎn)彎半徑生成了連接泊車起始點(diǎn)與泊位中線上任意一點(diǎn)的圓弧,隨后回正方向,沿直線將車泊入泊位。Jeevan P等[26]根據(jù)垂直泊位的幾何特征計(jì)算車輛可以成功泊出的點(diǎn),并將其設(shè)置為中繼點(diǎn),由此將泊車任務(wù)劃分為前進(jìn)階段和倒退階段,在前進(jìn)階段用三次樣條插值連接車輛當(dāng)前位置與中繼點(diǎn),倒退階段是從中繼點(diǎn)泊入車位。為了提升閉環(huán)跟蹤性能,Liang Z 等[27]在獲取無(wú)碰撞路徑點(diǎn)后,使用Bezier 曲線平滑由一系列路徑點(diǎn)連接的折線。上述方法成功與否很大程度上取決于起始時(shí)刻車輛相對(duì)泊位的位姿。為了能夠讓車輛在任意起始點(diǎn)均可生成可行路徑,Du X 和Tan K K[28]通過(guò)劃分車輛與泊位的位置關(guān)系類型,并依此枚舉各車輛在不同起始點(diǎn)時(shí)銜接始末位姿的直線與圓弧組合,當(dāng)確定車輛在初始時(shí)刻的位置后,根據(jù)其歸屬的類型從備選路徑集合中選擇滿足要求的直線與圓弧組合。由于泊車場(chǎng)景中通常涉及速度方向的切換,圓弧和直線組合的路徑在速度切換時(shí)會(huì)出現(xiàn)曲率不連續(xù)的尖點(diǎn),對(duì)遵循非完整性約束的車輛而言,曲率不連續(xù)的路徑會(huì)使其需要改變速度甚至完全靜止之后再改變轉(zhuǎn)角,這一操作會(huì)加重車輪磨損[29]。早期的研究者認(rèn)為這一問(wèn)題在低速的泊車場(chǎng)景中可以被忽略,或是傾向于在控制跟蹤階段緩解這一問(wèn)題[28]。Vorobieva H等[30]在規(guī)劃階段,根據(jù)車輛和平行泊車位的幾何特征生成由兩段圓弧組成的路徑,再使用回旋曲線(Clothoid)將其平滑成曲率連續(xù)的路徑。而后,基于曲率連續(xù)的回旋曲線的方法引起了學(xué)者們的關(guān)注[31-32]?;诨匦€的幾何方法的計(jì)算耗時(shí)主要源于Fresnel積分計(jì)算[33],為了減輕計(jì)算負(fù)擔(dān),近似回旋曲線的方法被提出[33],其通過(guò)設(shè)置虛擬牽引點(diǎn)逐步引導(dǎo)車輛泊入垂直泊位。文獻(xiàn)[34]忽略道路寬度限制,采用一次機(jī)動(dòng)的方式完成泊車路徑規(guī)劃,即待車輛駛出泊位后再滿舵行駛。Cai L等[35]考慮了道路狹窄的平行泊車場(chǎng)景,借用泊位的空間調(diào)整車輛的姿態(tài),并以目標(biāo)線作為中間媒介,先將車輛從泊位中駛出,隨后沿設(shè)置的目標(biāo)線機(jī)動(dòng),以此使車輛在任意位姿均可完成泊車規(guī)劃,并在圓弧和直線的交界處使用Bezier曲線進(jìn)行平滑處理。此外,因?yàn)檫@些方法基于泊位特征,是通過(guò)車輛與車位特殊的幾何關(guān)系推導(dǎo)出相關(guān)關(guān)系式的,各方法有其特異的泊位。例如,面向平行泊車的方法可能無(wú)法直接適用于垂直泊車[36]。
為了滿足避障需求,這類方法采用預(yù)先定義的規(guī)則作為限制。在運(yùn)動(dòng)規(guī)劃的初始階段,環(huán)境地圖已得到處理(圖3),有分散、雜亂障礙物的環(huán)境均被轉(zhuǎn)化為規(guī)整的幾何形狀。圖3中,綠色框線表示車輛的既定泊車空位。因此,在運(yùn)動(dòng)規(guī)劃階段只需考慮自車的運(yùn)動(dòng)與規(guī)整的泊位之間的幾何關(guān)系。然而,這類預(yù)設(shè)會(huì)減小車輛運(yùn)動(dòng)的可行域,這意味著車輛將會(huì)舍棄一些具有挑戰(zhàn)性的泊位。這一方法適用于現(xiàn)階段停車場(chǎng)的情況,這是因?yàn)樵谠O(shè)計(jì)現(xiàn)階段停車場(chǎng)的泊位時(shí)需要為乘客上下車預(yù)留一定的空間,而自動(dòng)泊車技術(shù)將提高停車場(chǎng)空間的利用率,未來(lái)的智慧停車場(chǎng)將不再需要考慮乘客上下車預(yù)留空間這一問(wèn)題[37],因此自動(dòng)泊車運(yùn)動(dòng)規(guī)劃方法具備應(yīng)對(duì)非標(biāo)準(zhǔn)化泊位的能力。這類方法的局限性在于缺乏最優(yōu)性和泛化能力,它們難以應(yīng)對(duì)障礙物分布不規(guī)則且場(chǎng)景復(fù)雜的非結(jié)構(gòu)化泊車任務(wù)。這些方法著重規(guī)劃路徑,需要額外配置控制信息,在實(shí)際跟蹤階段,可能會(huì)出現(xiàn)較大的誤差。
圖3 幾何方法環(huán)境地圖預(yù)處理示意Fig.3 Map preprocessing by geometric method
采樣方法是在連續(xù)的空間中生成樣本點(diǎn),隨后尋找車輛運(yùn)動(dòng)學(xué)可行且能夠滿足避障要求的點(diǎn)序列作為規(guī)劃結(jié)果。
快速隨機(jī)擴(kuò)展樹(rapidly-exploring random trees,RRT)系列算法是經(jīng)典的采樣方法。LaValle S M等[38]提出RRT,以蒙特卡洛的方式隨機(jī)生成樣本點(diǎn),但連接節(jié)點(diǎn)的折線不適合作為阿克曼轉(zhuǎn)向車輛的行駛路徑。Karaman S等[39]提出RRT*,其在節(jié)點(diǎn)拓展過(guò)程中考慮了車輛的非完整性約束,并證明了RRT算法的概率完備性。在基礎(chǔ)RRT 方法的基礎(chǔ)上,Kuwata Y 等[40]考慮了車輛的運(yùn)動(dòng)學(xué)限制,采用Dubins路徑長(zhǎng)度評(píng)估采樣點(diǎn)的可行性,據(jù)此擴(kuò)展節(jié)點(diǎn),將RRT算法應(yīng)用于泊車運(yùn)動(dòng)規(guī)劃。為提升擴(kuò)展效率,Han L 等[41]提出雙向RRT(bidirectional-RRT,Bi-RRT)方法,它采用并行的策略,分別以起始位姿和終止位姿為樹根同時(shí)擴(kuò)展節(jié)點(diǎn),兩棵樹不斷朝向?qū)Ψ浇惶鏀U(kuò)展,直到二者擴(kuò)展的節(jié)點(diǎn)連接。Klemm S等[42]將connect-RRT方法應(yīng)用在狹小泊位的運(yùn)動(dòng)規(guī)劃中,并證明了雙向搜索的RRT算法在迭代時(shí)間上有顯著收益。Jhang J H 等[43]在Bi-RRT 中引入RS曲線加速生成可行的避障路徑,并設(shè)計(jì)了更貼合人類駕駛習(xí)慣的代價(jià)函數(shù)。Shin S 等[44]考慮進(jìn)一步提升節(jié)點(diǎn)的拓展效率,提出結(jié)合人工磁場(chǎng)模型確定RRT的節(jié)點(diǎn)拓展方向,磁場(chǎng)的磁力線具有與Dubins曲線相似的形狀,障礙物的斥力將誘導(dǎo)車輛遠(yuǎn)離。Zheng K 和Liu S[45]考慮RRT的重規(guī)劃能力,當(dāng)環(huán)境中出現(xiàn)新的障礙物時(shí),對(duì)原樹進(jìn)行剪枝后繼續(xù)擴(kuò)展,以提升規(guī)劃效率。類似地,Karaman S 等[46]將RRT 與分支限界算法(branch-and-bound)相結(jié)合來(lái)更有效地構(gòu)建樹,降低重規(guī)劃時(shí)樹結(jié)構(gòu)修改的計(jì)算成本。
動(dòng)態(tài)窗口方法(dynamic window approach,DWA)是在線速度和角速度組合的速度空間內(nèi)進(jìn)行采樣,以生成多條候選軌跡并進(jìn)行評(píng)估,根據(jù)代價(jià)函數(shù)值選擇最優(yōu)軌跡。Lei Y等[47]將DWA應(yīng)用在無(wú)人駕駛礦用卡車的泊車運(yùn)動(dòng)規(guī)劃中,為解決基礎(chǔ)DWA算法難以生成嚴(yán)格符合目標(biāo)姿態(tài)角邊值約束的困難,提出了一種基于模糊邏輯控制的DWA規(guī)劃方法,用模糊邏輯控制設(shè)計(jì)代價(jià)函數(shù)中的懲罰權(quán)重,如圖4所示。圖中,DWA在每一步選擇當(dāng)前步的最優(yōu)軌跡。Yang H等[48]采用改進(jìn)的A*搜索和DWA 算法實(shí)施非完整約束車輛的運(yùn)動(dòng)規(guī)劃。
圖4 DWA 方法示意Fig.4 Schematic of DWA method
概率路線圖(probabilistic roadmap,PRM)是在構(gòu)型空間(configuration space)上采樣出固定點(diǎn)并連接樣本點(diǎn)而構(gòu)建的(其中采樣的狀態(tài)點(diǎn)稱為節(jié)點(diǎn),邊表示節(jié)點(diǎn)的連接關(guān)系),對(duì)邊進(jìn)行碰撞檢測(cè)并剔除相應(yīng)的會(huì)產(chǎn)生碰撞的節(jié)點(diǎn)和邊[49]。PRM是通過(guò)采樣構(gòu)建一個(gè)圖形結(jié)構(gòu),之后可以使用搜索算法在圖中找到連接起始狀態(tài)和目標(biāo)狀態(tài)的最短路徑[50]。Song G和Amato N M[51]提出一種基于客制化PRM(customized PRM,C-PRM)的泊車運(yùn)動(dòng)規(guī)劃方法,其在構(gòu)建路線圖階段先粗略地檢查節(jié)點(diǎn)和邊的有效性,在查詢階段對(duì)必經(jīng)路徑的部分進(jìn)行細(xì)致的檢驗(yàn),這使得C-PRM的效率和泛化性較傳統(tǒng)PRM的大幅提升。
搜索方法是先用有限個(gè)涵蓋環(huán)境信息的網(wǎng)格表征連續(xù)的空間,隨后在網(wǎng)格圖中搜索銜接初始位姿到目標(biāo)位姿的泊車路徑。Dolgov D等[52]提出了一種混合A*搜索算法,它在基本A*搜索方法的基礎(chǔ)上考慮了車輛運(yùn)動(dòng)學(xué)規(guī)律并設(shè)置了更恰當(dāng)?shù)膯l(fā)函數(shù),但該算法不具備求解完備性。有別于混合A*搜索算法用RS曲線嘗試尋找可行路徑,Klaudt S等[53]提出的考慮車輛轉(zhuǎn)向角的模型更為精準(zhǔn)。為提升混合A*搜索算法的搜索效率,Sedighi S等[54]結(jié)合可見圖算法搜索出的連接始末位置的折線,引導(dǎo)混合A*搜索算法沿該折線拓展節(jié)點(diǎn),以此加速生成運(yùn)動(dòng)學(xué)的路徑。類似地,Sedighi S等[55]提出一種基于Voronoi圖的混合A*搜索算法,其先用Voronoi圖搜索出符合完整性約束的最短路徑,再用混合A*搜索算法對(duì)該路徑進(jìn)行優(yōu)化,生成滿足非完整性約束的路徑。He J與Li H[56]用快速A*算法判斷能否在特定時(shí)間內(nèi)完成泊車任務(wù),若這一泊車任務(wù)有可行解,則記錄粗略的路徑點(diǎn),再通過(guò)專家經(jīng)驗(yàn)的方法平滑路徑。但A*搜索算法不考慮姿態(tài)角,仍需做一些后處理。Chen C等[57]提出一種考慮車頭姿態(tài)角度因素的啟發(fā)函數(shù)來(lái)引導(dǎo)狀態(tài)空間的遍歷搜索過(guò)程,其先搜索出能夠滿足避障要求的一系列彼此重疊的圓,隨后在這些圓中搜索滿足運(yùn)動(dòng)學(xué)約束的路徑,以此提升搜索效率。Bergman K等[58]改進(jìn)了state-lattice方法并將其應(yīng)用于泊車運(yùn)動(dòng)規(guī)劃,通過(guò)搜索離線構(gòu)建的符合車輛運(yùn)動(dòng)學(xué)的狀態(tài)格,生成銜接起始節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)的可避障鏈路。Fuji H等[59]提出一種基于狀態(tài)路線圖的搜索方法,其首先構(gòu)造包括位置信息和離散姿態(tài)角信息的地圖,隨后搜索能夠連通始末位姿的無(wú)碰撞路徑。當(dāng)車輛沿規(guī)劃好的軌跡行駛時(shí),若因車輛自身突發(fā)故障或外部突發(fā)風(fēng)險(xiǎn)造成緊急制動(dòng)駐車,該方法能夠重新規(guī)劃出脫困軌跡。Leu J等[60]基于A*搜索算法設(shè)計(jì)了包含后退(retreat)機(jī)制的路徑規(guī)劃方法,當(dāng)車輛停止在原參考軌跡上時(shí)觸發(fā)后退機(jī)制,則可在自由空間中找到一個(gè)最短的點(diǎn)邊序,并以此快速對(duì)原軌跡進(jìn)行修復(fù)。
數(shù)值優(yōu)化方法是將泊車運(yùn)動(dòng)規(guī)劃問(wèn)題描述為一則最優(yōu)控制問(wèn)題(optimal control problem,OCP),將這一時(shí)間連續(xù)的問(wèn)題離散化為一個(gè)非線性規(guī)劃問(wèn)題(nonlinear program,NLP),并采用梯度下降的優(yōu)化方法予以數(shù)值求解。數(shù)值優(yōu)化方法也稱數(shù)值最優(yōu)控制方法或計(jì)算最優(yōu)控制方法[5]。
Kondak K 與Hommel G[61]于2001 年將泊車任務(wù)描述為非線性最優(yōu)控制問(wèn)題,引入人工勢(shì)場(chǎng)描述避障約束,將障礙物視為點(diǎn)簇,對(duì)每個(gè)點(diǎn)施加相應(yīng)的不等式約 束,并用序 貫二次規(guī)劃(sequential quadratic programming,SQP)方法進(jìn)行求解。雖然這項(xiàng)工作計(jì)算時(shí)間長(zhǎng),但其為數(shù)值優(yōu)化方法在泊車領(lǐng)域的應(yīng)用奠定了基礎(chǔ)。Yamamoto M 等[62]于2005 年提出利用模型預(yù)測(cè)控制的方法對(duì)泊車問(wèn)題進(jìn)行建模,考慮了泊車場(chǎng)景中可能存在障礙物的情況,通過(guò)設(shè)置中繼點(diǎn)得以將車輛安全地泊入車位。雖然該工作不能保證在苛刻泊位條件下能成功泊車,且計(jì)算的時(shí)效性不一定能滿足實(shí)時(shí)性的需求,但它指示了最優(yōu)控制方法在泊車領(lǐng)域應(yīng)用的方向。泊車運(yùn)動(dòng)規(guī)劃的OCP 中包含一則代價(jià)函數(shù)、避障約束、邊值約束以及運(yùn)動(dòng)學(xué)約束等,要求在滿足約束條件的前提下,使得代價(jià)函數(shù)值最?。?3]。早期的探索是先通過(guò)精準(zhǔn)建模描述泊車軌跡規(guī)劃問(wèn)題,再運(yùn)用拉格朗日插值法或高斯偽譜法等將時(shí)間連續(xù)的狀態(tài)變量和控制變量離散成有限個(gè)配置點(diǎn),最后進(jìn)行數(shù)值求解。Zips P等[64]提出采用Runge-Kutta的方式離散化連續(xù)的路徑,通過(guò)求解優(yōu)化問(wèn)題獲得原優(yōu)化問(wèn)題的解。Li B與Shao Z[65]提出了一種利用三角形面積判據(jù)來(lái)解析地描述車身與不規(guī)則凸多邊形障礙物之間的避障約束條件,其能夠表述任意不規(guī)則姿態(tài)下的障礙物與車身之間的避障約束,如圖5 所示。圖中,點(diǎn)P用于判斷障礙物是否在凸多邊形ABCDE內(nèi)。為了提升數(shù)值求解效率,Moon J等[66]基于三角形判據(jù)的避障方法提出一種動(dòng)態(tài)優(yōu)化的方法,通過(guò)時(shí)空解耦將平行泊車過(guò)程劃分為兩個(gè)階段,在其中一個(gè)環(huán)境相對(duì)簡(jiǎn)單且車輛的運(yùn)動(dòng)區(qū)域確定的階段內(nèi),避障約束被表達(dá)為車輛位于矩形區(qū)域內(nèi),這在一定程度上緩解了非凸不可微的避障約束對(duì)計(jì)算效率的影響。類似地,Li B 等[67]構(gòu)造了slot 函數(shù)來(lái)表征平行泊車的障礙物邊界,能夠統(tǒng)一處理各種平行泊車問(wèn)題,其中采用了時(shí)空解耦方式[68]漸進(jìn)地生成初始解,以便提升泊車軌跡規(guī)劃的穩(wěn)定性與實(shí)時(shí)性。除了采用圖形學(xué)表述避障約束外,Zhang X等[69]提出了一種基于優(yōu)化的避障方法(optimizationbased collision avoidance,OBCA),其分別將車和環(huán)境中的障礙物描述為多面體,利用凸優(yōu)化學(xué)科領(lǐng)域的符號(hào)距離概念表示車與障礙物之間的避障約束,利用凸優(yōu)化的強(qiáng)對(duì)偶性重構(gòu)凸集之間的距離函數(shù),將不可微分的避障約束轉(zhuǎn)化為光滑的可微分約束條件。
圖5 三角形面積判據(jù)示意Fig.5 Schematic of a triangle area criterion
迭代起點(diǎn)的選擇會(huì)影響NLP 問(wèn)題的收斂性和收斂速度等,因此研究人員們提出分級(jí)的方式,即用其他方法(如采樣/搜索方法)生成一條粗略的軌跡作為優(yōu)化問(wèn)題的初始解,并以暖啟動(dòng)(warm start)[70]的方式加速優(yōu)化求解過(guò)程,這相當(dāng)于是在梯度優(yōu)化的求解過(guò)程中選擇了近似可行/最優(yōu)的高質(zhì)量迭代優(yōu)化起始點(diǎn)[71]。Zhang X 等[72]設(shè)計(jì)了采用混合A*搜索方法作為優(yōu)化問(wèn)題的啟發(fā),從而提升求解效率和求解質(zhì)量。He R等[73]基于OBCA 方法提出TDR-OBCA(temporal and dual warm starts with reformulated optimization-based collision avoidance)方法,其采樣時(shí)間可非均勻,目標(biāo)位姿為軟約束,從而增強(qiáng)算法的魯棒性和計(jì)算效率。
大量非凸非線性的避障約束是影響求解效率的主要因素,R?smann C 等[74]提出一種時(shí)間彈性帶方法(timed elastic band,TEB),它將最優(yōu)控制問(wèn)題中非凸非線性的避障約束以及運(yùn)動(dòng)學(xué)約束軟化作為代價(jià)函數(shù)中的懲罰項(xiàng),從而把原始的最優(yōu)控制問(wèn)題轉(zhuǎn)化為無(wú)約束的優(yōu)化問(wèn)題,雖然優(yōu)化的求解速度快,但其求解結(jié)果的可行性差,這也表明了單純依賴懲罰約束的方法存在穩(wěn)定性不足的弱點(diǎn)。降低優(yōu)化求解耗時(shí)的另一種思路是將避障約束表示為線性約束,Shi S等[75]提出了雙層最優(yōu) 運(yùn)動(dòng)規(guī) 劃模型(bi-level optimal motion planning,BOMP),采用J2-function來(lái)線性地描述避障約束。Li B 等[76]提出了一種安全行車隧道(safe travel corridor,STC)概念,其非凸的避障約束重構(gòu)為線性的盒約束。該方法用兩個(gè)圓盤覆蓋車身,將雙圓盤收縮為兩質(zhì)點(diǎn)并相應(yīng)膨化環(huán)境中的障礙物(圖6),沿著依據(jù)混合A*搜索算法生成的參考軌跡鋪設(shè)安全行車隧道,將車輛與周圍的障礙物分隔開,使車輛僅在這一安全行車隧道中行駛,這樣,避障約束的規(guī)模不再受環(huán)境中障礙物個(gè)數(shù)及其頂點(diǎn)數(shù)量的影響,即原先大規(guī)模的避障約束可被控制在較低水平,使最優(yōu)控制問(wèn)題易于求解。STC方法受制于參考軌跡的質(zhì)量,由于混合A*搜索算法生成的路徑并不能完全滿足車輛運(yùn)動(dòng)學(xué)約束,倘若所有符合運(yùn)動(dòng)學(xué)可行性的軌跡均在所生成的STC外,則會(huì)導(dǎo)致優(yōu)化問(wèn)題求解失敗。為解決混合A*搜索算法生成的初始解不理想而導(dǎo)致STC 失敗的問(wèn)題,Li B等[77]在使用STC 的基礎(chǔ)上提出輕量化迭代方法(lightweight iterative optimization method,LIOM),極大地降低了車輛對(duì)參考軌跡的依賴程度。它將最優(yōu)控制問(wèn)題中非凸非線性的約束軟化為外罰函數(shù)并補(bǔ)入代價(jià)函數(shù)中,并將前一次迭代生成的優(yōu)化軌跡視為初始解來(lái)重新構(gòu)建STC,隨后予以數(shù)值求解,直到軟化約束的罰函數(shù)代價(jià)值低于某一預(yù)設(shè)閾值為止。雖然將硬性約束條件軟化為外罰函數(shù)多項(xiàng)式并不能保證生成軌跡的可行性,但據(jù)此構(gòu)造的每個(gè)中間過(guò)渡最優(yōu)控制問(wèn)題的約束條件都是輕量級(jí)的盒約束且能夠確保有解。車輛的運(yùn)動(dòng)學(xué)可行性與避障要求通常容易相互掣肘,倘若初始解僅指示了繞行障礙物的方式但運(yùn)動(dòng)學(xué)完全不可行,LIOM也有能力在每一次迭代過(guò)程中朝違背運(yùn)動(dòng)學(xué)約束程度更輕的方向進(jìn)化。此外,由于文獻(xiàn)[76]的質(zhì)點(diǎn)模型形成了一定的冗余區(qū)域,且STC的構(gòu)建導(dǎo)致自由空間中臨近膨化障礙物的邊角區(qū)域無(wú)法被局部矩形包括在內(nèi),這可能導(dǎo)致該方法無(wú)法獲得最優(yōu)解。不同于文獻(xiàn)[76],Han Z等[78]則采用凸多邊形表征安全行車隧道替代了橫平豎直的矩形框,這使它不會(huì)過(guò)于保守,能夠提高自由空間的利用率。Lian J等[79]則認(rèn)為文獻(xiàn)[76]中恒定的拓展步長(zhǎng)難以兼顧優(yōu)化效率和軌跡可行性/最優(yōu)性,因此,提出沿著A*粗略搜索的路徑鋪設(shè)粗略隧道,并計(jì)算局部矩形的尺寸來(lái)大致判定該區(qū)域的寬窄程度,依此自適應(yīng)更改拓展步長(zhǎng),以求提升軌跡最優(yōu)性。然而,STC的求解可行性/最優(yōu)性受限以及它面對(duì)狹小空間失敗的主要原因是雙圓盤模型引入的冗余區(qū)域而非恒定的拓展步長(zhǎng)。將離散點(diǎn)順次連接,近似獲得原連續(xù)問(wèn)題的數(shù)值解。求解精度和求解時(shí)間與離散后的配置點(diǎn)的數(shù)量相關(guān),但數(shù)值優(yōu)化方法求解高維問(wèn)題時(shí),求解時(shí)間不會(huì)隨著維數(shù)增長(zhǎng)而驟增[80],并且求解質(zhì)量不會(huì)隨著有限元數(shù)量增加而無(wú)限增強(qiáng)[81]。
圖6 安全行車隧道構(gòu)建方法Fig.6 Schematics of the principle to construct safe travel corridors
除梯度優(yōu)化外,還有一些研究工作著眼于以隨機(jī)搜索的方法確定尋優(yōu)迭代的步長(zhǎng)與梯度方向。例如,采用粒子群優(yōu)化算法(particle swarm optimization,PSO)求解。PSO 是基于隨機(jī)性模擬群體行為,一組個(gè)體(粒子)被隨機(jī)初始化,并在搜索空間中移動(dòng),每個(gè)粒子的運(yùn)動(dòng)受到個(gè)體經(jīng)驗(yàn)和群體經(jīng)驗(yàn)的影響。PSO 算法主要聚焦于構(gòu)建目標(biāo)函數(shù)(適應(yīng)度函數(shù)),用罰函數(shù)法將包含車輛運(yùn)動(dòng)學(xué)約束以及環(huán)境限制約束等的泊車運(yùn)動(dòng)規(guī)劃問(wèn)題轉(zhuǎn)化為無(wú)約束問(wèn)題,隨后進(jìn)行求解,當(dāng)約束條件不滿足時(shí),會(huì)對(duì)適應(yīng)度函數(shù)施加較大的懲罰,從而引導(dǎo)搜索過(guò)程向滿足約束條件的方向進(jìn)行。Huang W等[82]結(jié)合人工勢(shì)場(chǎng)法,用PSO確定最優(yōu)的目標(biāo)位姿和泊車軌跡,最后通過(guò)樣條曲線對(duì)軌跡進(jìn)行平滑處理。由于隨機(jī)性,PSO具有全局搜索的能力,但也可能導(dǎo)致它陷入局部最小值,通常需要在不同隨機(jī)數(shù)種子條件下并行計(jì)算以增加尋找到全局最優(yōu)性的概率。
機(jī)器學(xué)習(xí)方法將軌跡規(guī)劃問(wèn)題轉(zhuǎn)化為求解輸入與輸出的映射關(guān)系[83]。Gorinevsky D等[84]于1996年提出一種通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò)生成泊車軌跡并進(jìn)行跟蹤控制的方案。Zhao Y 和Collins JR E G[85]基于模糊邏輯控制-遺傳算法展開研究,將泊車過(guò)程抽象成多個(gè)階段,依據(jù)制定的模糊規(guī)則設(shè)定各階段的隸屬函數(shù),并用遺傳算法確定模糊控制系統(tǒng)的參數(shù),依此輸出泊車軌跡。它是基于人類駕駛員泊車的操作經(jīng)驗(yàn)所設(shè)計(jì)的一種運(yùn)動(dòng)規(guī)劃方案?;谝?guī)則和經(jīng)驗(yàn)設(shè)計(jì)的模糊邏輯控制的避障方法在遇到不規(guī)整的障礙物或在泊位附近存在障礙物的情況時(shí),所規(guī)劃軌跡的質(zhì)量很大程度上取決于所設(shè)定的隸屬函數(shù)的質(zhì)量,這是因?yàn)殡`屬函數(shù)的準(zhǔn)確度直接影響模糊推理的結(jié)果[86]。Liu W等[87]提出將車速和目標(biāo)位姿作為神經(jīng)網(wǎng)絡(luò)的輸入,通過(guò)足夠數(shù)量的樣本學(xué)習(xí)輸入的車速/姿態(tài)角與軌跡之間的映射關(guān)系。為提升學(xué)習(xí)模型的泛化性,Lin Y L等[88]提出一種平行學(xué)習(xí)的軌跡規(guī)劃方法,它將數(shù)據(jù)驅(qū)動(dòng)方法與預(yù)測(cè)學(xué)習(xí)、遷移學(xué)習(xí)相結(jié)合來(lái)構(gòu)建深度學(xué)習(xí)模型。Chai R等[89]提出使用 基于深 度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)的架構(gòu)來(lái)解決泊車軌跡規(guī)劃問(wèn)題,其下層構(gòu)建的DNN 使用由上層優(yōu)化方法生成的時(shí)間最優(yōu)軌跡進(jìn)行訓(xùn)練,以獲得泊車軌跡和轉(zhuǎn)向角之間的映射關(guān)系(圖7)。為提升算法的實(shí)時(shí)性以及遷移能力,Chai R等[90]繼而提 出循環(huán)DNN(recurrent deep neural network,RDNN)算法,它具有反饋連接機(jī)制,允許信息在網(wǎng)絡(luò)中傳遞循環(huán),從而能夠捕捉序列中的時(shí)間依賴關(guān)系,因此能更好地發(fā)掘車輛狀態(tài)之間的內(nèi)在聯(lián)系,借助遷移學(xué)習(xí)策略使這一方法能夠適配不同類型的智能車。Zhang P 等[91]提出一種基于強(qiáng)化學(xué)習(xí)的端到端的泊車運(yùn)動(dòng)規(guī)劃方法,旨在能夠從大量的數(shù)據(jù)中持續(xù)學(xué)習(xí)泊車行為背后的意圖與最優(yōu)前輪轉(zhuǎn)向角之間的映射關(guān)系。由于期望的運(yùn)動(dòng)規(guī)劃輸出是多指標(biāo)綜合最優(yōu)的泊車軌跡,故基于數(shù)據(jù)的學(xué)習(xí)模型對(duì)所采用的訓(xùn)練數(shù)據(jù)集質(zhì)量要求較高。為了減弱對(duì)高水平人類駕駛員的泊車數(shù)據(jù)/基于先驗(yàn)規(guī)則的高質(zhì)量數(shù)據(jù)的依賴,Zhang J等[92]基于強(qiáng)化學(xué)習(xí)的架構(gòu),迭代地執(zhí)行數(shù)據(jù)生成、數(shù)據(jù)評(píng)估和訓(xùn)練網(wǎng)絡(luò),通過(guò)構(gòu)建獎(jiǎng)勵(lì)函數(shù)評(píng)估和過(guò)濾泊車數(shù)據(jù),隨后用神經(jīng)網(wǎng)絡(luò)從過(guò)濾后的數(shù)據(jù)中學(xué)習(xí)泊車策略。Song S等[93]使用非線性規(guī)劃的結(jié)果作為離線訓(xùn)練數(shù)據(jù),然后利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),以期望生成近似最優(yōu)的泊車軌跡,并將其應(yīng)用在狹小泊位的運(yùn)動(dòng)規(guī)劃中。
圖7 基于DNN 方法的架構(gòu)[89]Fig.7 Framework based on DNN method in reference [89]
幾何方法是通過(guò)解析表達(dá)式描述泊車路徑曲線的,即使是在狹窄環(huán)境中,也能夠保持高效計(jì)算。該方法在輔助泊車系統(tǒng)中商用程度高,但適用的場(chǎng)景比較簡(jiǎn)單,雖然可以通過(guò)前置處理生成一個(gè)適用于這一方案的簡(jiǎn)化場(chǎng)景,但會(huì)不可避免地降低空間的利用率,且對(duì)復(fù)雜環(huán)境的處理能力受限。
采樣方法不受維數(shù)限制,在高維空間內(nèi)仍能夠高效求解。以RRT系列算法為代表的采樣方法求解效率高且不受構(gòu)型空間的維數(shù)限制,在高維的構(gòu)型空間隨機(jī)采樣,連接各節(jié)點(diǎn),并評(píng)估各節(jié)點(diǎn)的代價(jià)值,其搜索結(jié)果是漸進(jìn)最優(yōu)的。但由于這一方法是隨機(jī)拓展的,算法的錯(cuò)誤難以穩(wěn)定復(fù)現(xiàn),在量產(chǎn)落地時(shí)的優(yōu)先級(jí)不高。
搜索方法將連續(xù)的狀態(tài)空間離散成網(wǎng)格圖,并在圖中尋找始末狀態(tài)的鏈接。然而在面臨高維度問(wèn)題時(shí),求解精度和實(shí)時(shí)性會(huì)受到網(wǎng)格分辨率的限制。如果場(chǎng)景中存在狹窄區(qū)域,為了找到可行路徑,需要使用足夠小的網(wǎng)格分辨率,這會(huì)顯著增加計(jì)算成本。
數(shù)值優(yōu)化方法可通過(guò)增加離散有限元的數(shù)量提高規(guī)劃的精度,這類方法所規(guī)劃的軌跡具備最優(yōu)性,但對(duì)算力的要求較高,為提升求解的實(shí)時(shí)性,需要一個(gè)合適的初始解來(lái)加速求解過(guò)程。
機(jī)器學(xué)習(xí)方法將車輛當(dāng)前的狀態(tài)視為輸入,將近似最優(yōu)的軌跡視作輸出,通過(guò)提取已有泊車數(shù)據(jù)中的時(shí)空特征信息,構(gòu)建能夠反映輸入與輸出映射關(guān)系的學(xué)習(xí)網(wǎng)絡(luò)[94],隨后訓(xùn)練網(wǎng)絡(luò)參數(shù)獲得學(xué)習(xí)模型,并用這一模型求解實(shí)際的泊車軌跡規(guī)劃問(wèn)題。這類方法具有應(yīng)對(duì)復(fù)雜環(huán)境的潛力,但為了獲取更準(zhǔn)確的學(xué)習(xí)模型,在學(xué)習(xí)階段需要提供大量的數(shù)據(jù)集進(jìn)行迭代訓(xùn)練,挑戰(zhàn)在于在訓(xùn)練樣本時(shí)如何避免過(guò)擬合。此外,機(jī)器學(xué)習(xí)的可行性受到質(zhì)疑的主要原因在于其不可解釋的黑盒特性,目前的中間特征表示不足以解釋其推理過(guò)程的因果關(guān)系,而缺乏可解釋性的后果可能是災(zāi)難性的[95]。
上述5類自動(dòng)泊車運(yùn)動(dòng)規(guī)劃方法均有各自適用的場(chǎng)景,并且穩(wěn)步并行發(fā)展。表1示出多種自動(dòng)泊車軌跡/路徑規(guī)劃方法性能對(duì)比。目前,融合各方法優(yōu)勢(shì)的組合型方法是發(fā)展趨勢(shì)。這一思路并不新鮮,許多學(xué)者提出了采用采樣/搜索方法規(guī)劃出粗略軌跡作為數(shù)值優(yōu)化方法的初始解的兩階段分級(jí)(hierarchy)運(yùn)動(dòng)規(guī)劃方法[96],而且兩類方法的融合也將同時(shí)推進(jìn)各自的發(fā)展。例如,LIOM 需要由采樣/搜索方法作為初始解,但是對(duì)于實(shí)際問(wèn)題而言,這個(gè)初始的參考軌跡只要能夠正確選擇繞行的同倫類別(homotopy class)即可,那么可以通過(guò)降低第一階段路徑精度來(lái)降低搜索的耗時(shí)。于是一種具有容錯(cuò)機(jī)制的FTHA 作為混合A*搜索算法不完備性的備選方案被同時(shí)提出,以確保采樣/搜索方法有解,隨后采用數(shù)值優(yōu)化方法進(jìn)行精細(xì)求解。第一階段可以弱化運(yùn)動(dòng)學(xué)可行性的重要程度,從而軟化相互掣肘的約束條件。類似地,可以結(jié)合機(jī)器學(xué)習(xí)的方法與采樣/搜索的方法設(shè)計(jì)分級(jí)運(yùn)動(dòng)規(guī)劃方法,具體方案可參見文獻(xiàn)[97]。
表1 多種自動(dòng)泊車軌跡/路徑規(guī)劃方法性能對(duì)比表Table 1 Performance comparison of multiple trajectory/path planning methods for automatic parking
目前的自動(dòng)泊車軌跡規(guī)劃方法與完全成熟的泊車技術(shù)還存在一些差距,需要更深入的研究來(lái)彌補(bǔ),這為未來(lái)的運(yùn)動(dòng)規(guī)劃方法的研究指明了新的方向。
更細(xì)致地考慮模型中的避障約束,比如高底盤的車身能夠掃過(guò)障礙物,車身矩形覆蓋顯然會(huì)有更多冗余[98]??紤]障礙物的空間復(fù)雜結(jié)構(gòu)以及自車底盤的高度因素,例如在路側(cè)泊位泊車時(shí),若車輛的地盤高于路肩,則車輛在揉庫(kù)時(shí)能夠借用部分路肩的空間,這相當(dāng)于增大了泊車可機(jī)動(dòng)的空間。此外,當(dāng)環(huán)境非常復(fù)雜時(shí),避障約束的規(guī)模將劇烈增大,如何統(tǒng)一地描述避障約束,使得其能夠在保障安全冗余的同時(shí)兼?zhèn)涓呔龋ɡ缯吩負(fù)Q向),以及如何合理簡(jiǎn)化避障約束(例如:周圍存在大量無(wú)序障礙物),從而保障在復(fù)雜環(huán)境中泊車運(yùn)動(dòng)規(guī)劃的效率和成功率值得進(jìn)一步探索,且這能夠進(jìn)一步發(fā)揮車輛的高性能,在脫困、競(jìng)技等方面會(huì)有更廣闊的應(yīng)用。
對(duì)于自動(dòng)泊車系統(tǒng)而言,保障運(yùn)動(dòng)規(guī)劃的質(zhì)量仍然是未來(lái)研究的重點(diǎn),尤其是應(yīng)對(duì)狹窄的或周圍環(huán)境復(fù)雜的泊位時(shí),運(yùn)動(dòng)規(guī)劃方法需要具備算法的穩(wěn)定性,即仍然能夠快速、高精度、低耗時(shí)地完成計(jì)算[99]。為提升規(guī)劃算法在復(fù)雜環(huán)境中的計(jì)算穩(wěn)定性,分級(jí)的軌跡規(guī)劃方法值得更深入的研究。例如,文獻(xiàn)[63]融合了采樣/搜索方法和數(shù)值優(yōu)化方法的優(yōu)勢(shì),所提出的全局最優(yōu)性增強(qiáng)的混合A*搜索算法具備篩選更多備選解的能力,隨后將其作為數(shù)值優(yōu)化過(guò)程的初始解,數(shù)值優(yōu)化方法的使用有望提升軌跡的局部最優(yōu)性,而采樣/搜索方法為結(jié)果的全局最優(yōu)性提供了支撐。值得注意的是,應(yīng)慎重引入包含隨機(jī)性的方案,因?yàn)檫@會(huì)損害方法的穩(wěn)定性。此外,如果一則軌跡規(guī)劃問(wèn)題是無(wú)解的,算法應(yīng)具備fail-fast 屬性,即面對(duì)無(wú)解問(wèn)題時(shí),算法能夠快速拋出異常提醒,從而觸發(fā)相應(yīng)的異常處理模塊工作。
當(dāng)車輛在遇到緊急情況而制動(dòng),導(dǎo)致失去跟蹤原軌跡的能力,或者在原軌跡上突然出現(xiàn)新的障礙物時(shí),運(yùn)動(dòng)規(guī)劃方法應(yīng)在短時(shí)間內(nèi)重規(guī)劃出近似最優(yōu)的軌跡。相比結(jié)構(gòu)化道路上的高速行駛過(guò)程,泊車場(chǎng)景中障礙物擺放的變化會(huì)導(dǎo)致場(chǎng)景可通行拓?fù)浣Y(jié)構(gòu)的可行性與最優(yōu)性發(fā)生本質(zhì)變化,因此在線泊車軌跡重規(guī)劃的難度遠(yuǎn)高于道路場(chǎng)景中的重規(guī)劃[100]。但泊車軌跡重規(guī)劃過(guò)程中畢竟車輛行駛速度不快,一般允許在稍長(zhǎng)的時(shí)間(如0.5~ 2 s)內(nèi)完成計(jì)算。如何在有限時(shí)間內(nèi)生成高質(zhì)量的泊車軌跡重規(guī)劃結(jié)果,以何種方式利用此前計(jì)算的名義參考泊車軌跡(將其直接舍棄還是將其部分地視作先驗(yàn)信息),是未來(lái)值得深入研究的關(guān)鍵問(wèn)題。
本文所提文獻(xiàn)大多數(shù)致力于提升單車的智能水平,而在現(xiàn)實(shí)的交通流中泊車時(shí),往往涉及與正常通行的車輛以及其他動(dòng)態(tài)交通參與者的交互和博弈[101-102]。隨著車路云一體化智能網(wǎng)聯(lián)系統(tǒng)的發(fā)展,考慮交互的泊車運(yùn)動(dòng)規(guī)劃方法將提升自動(dòng)泊車系統(tǒng)的實(shí)用性。例如,系統(tǒng)檢測(cè)到他車試圖進(jìn)入自車的目標(biāo)泊位時(shí),簡(jiǎn)單地選擇禮讓他車并不能提升用戶的使用體驗(yàn),車路云一體化背景下的自車有能力獲取他車的歷史駕駛習(xí)慣數(shù)據(jù)來(lái)綜合評(píng)估搶行的風(fēng)險(xiǎn)與收益,依此進(jìn)行運(yùn)動(dòng)規(guī)劃,而此決策過(guò)程可以借助云端所記錄的數(shù)據(jù),確保自車能夠在安全和高效之間取得平衡。
在泊車過(guò)程中,由于周圍障礙物的遮擋,可能會(huì)產(chǎn)生盲區(qū),而在這些盲區(qū)中可能會(huì)出現(xiàn)意外的障礙物[103];此外,當(dāng)車輛駛過(guò)已停泊車輛時(shí),乘客可能會(huì)突然打開車門,這類無(wú)意識(shí)的開門行為相當(dāng)于場(chǎng)景中突然出現(xiàn)難以預(yù)測(cè)的障礙物(圖8)。在這些情況下,采用防御性駕駛的泊車規(guī)劃方法可以預(yù)先避免與障礙物發(fā)生干涉,在規(guī)劃中提前預(yù)測(cè)或預(yù)設(shè)此類事件的發(fā)生并采取措施來(lái)降低風(fēng)險(xiǎn)。防御性運(yùn)動(dòng)規(guī)劃方法能夠增加泊車過(guò)程的安全性和可靠性,確保在泊車時(shí)也能考慮不可預(yù)見的情況,減小潛在的事故風(fēng)險(xiǎn)。這是強(qiáng)調(diào)在泊車規(guī)劃中的避險(xiǎn)主動(dòng)性,以提前應(yīng)對(duì)可能的危險(xiǎn)情況。
圖8 防御性駕駛場(chǎng)景案例Fig.8 Examples of defensive driving scenarios
本文對(duì)現(xiàn)有的應(yīng)用于自動(dòng)泊車領(lǐng)域的運(yùn)動(dòng)規(guī)劃方法進(jìn)行了分類、梳理與分析,具體包括幾何方法、采樣方法、搜索方法、數(shù)值優(yōu)化方法以及機(jī)器學(xué)習(xí)方法;探討了未來(lái)運(yùn)動(dòng)規(guī)劃方法可能的研究方向,主要包括構(gòu)建泛化性更強(qiáng)的模型、提升規(guī)劃方法的穩(wěn)定性、關(guān)注在線實(shí)時(shí)高質(zhì)量重規(guī)劃的能力和防御性駕駛的能力,以及考慮與其他交通參與者的交互等。
在自動(dòng)泊車技術(shù)的賽道上,各品牌商家均在加速研發(fā),力求推出更智能、泛化性更強(qiáng)的自動(dòng)泊車系統(tǒng)。隨著技術(shù)的不斷迭代更新以及數(shù)據(jù)的積累,未來(lái)泊車技術(shù)將向著成熟的、穩(wěn)定的、高階智能的商用化方向發(fā)展,并為汽車行業(yè)帶來(lái)巨大的潛力和機(jī)會(huì)。