吳永剛,梁華為,余 彪,孫 超
1.安徽大學(xué) 物質(zhì)科學(xué)與信息技術(shù)研究院,合肥 230601
2.中國(guó)科學(xué)院 合肥物質(zhì)科學(xué)研究院,合肥 230088
在搶險(xiǎn)救災(zāi)、消防救援、軍事作戰(zhàn)等典型應(yīng)用領(lǐng)域[1-2],往往要求無(wú)人車具有高度靈活的機(jī)動(dòng)性,且需要兼顧跟蹤精度和行駛穩(wěn)定性,準(zhǔn)確的模型和合理的控制律設(shè)置是路徑跟蹤控制算法的關(guān)鍵[3]。
在現(xiàn)有的控制理論領(lǐng)域,傳統(tǒng)控制算法如比例積分微分(PID)控制[4]、純跟蹤控制算法[5],這些控制算法利用幾何關(guān)系,在一個(gè)或多個(gè)預(yù)瞄位置計(jì)算誤差,只能在一定范圍內(nèi)簡(jiǎn)單適用。為了適應(yīng)更多場(chǎng)景,研究人員探索了如模糊控制[6]、滑??刂芠7]等方法,然而這些控制方法只能對(duì)當(dāng)前狀態(tài)量計(jì)算控制動(dòng)作,無(wú)法預(yù)測(cè)未來(lái)狀態(tài)信息,且無(wú)法處理如偏離軌道等極限工況。為了提高控制器的魯棒性和保持車輛航向的能力,文獻(xiàn)[8]提出了魯棒控制器,將車輛航向偏差用于跟蹤誤差建模,可以在一定干擾條件下減小車輛航向偏差。文獻(xiàn)[9]提出了一種通過(guò)跟蹤車輛航向來(lái)計(jì)算轉(zhuǎn)向的控制器,并通過(guò)低摩擦系數(shù)的路況實(shí)驗(yàn)來(lái)驗(yàn)證該控制器。然而這些控制器沒(méi)有考慮車輛運(yùn)動(dòng)過(guò)程中的瞬時(shí)動(dòng)力學(xué)特性,如在側(cè)滑等情況時(shí),減小航向偏差的同時(shí)無(wú)法保證橫向偏差較小。模型預(yù)測(cè)控制方法(model predictive controller,MPC)能夠有效處理車輛和輪胎動(dòng)力學(xué)[10-11],且考慮的是未來(lái)一段時(shí)間內(nèi)的最優(yōu)控制量,因此有利于提高車輛控制穩(wěn)定性[12]。但在進(jìn)行高速?gòu)?fù)雜路況的路徑跟蹤時(shí),這些基于固定參數(shù)模型設(shè)計(jì)的控制器無(wú)法克服車輛未建模的不確定性和復(fù)雜路況的干擾,難以保證穩(wěn)定的跟蹤性能。隨著人工智能和傳感器技術(shù)等的發(fā)展,文獻(xiàn)[13]有效考慮模型偏差的問(wèn)題,基于模型預(yù)測(cè)控制建立學(xué)習(xí)的高斯擾動(dòng)模型,但其超參數(shù)選擇較為復(fù)雜,文獻(xiàn)[14]采用模糊算法自適應(yīng)調(diào)整MPC 的權(quán)重系數(shù),以改善跟蹤性能,但并不能克服不確定性干擾的影響。文獻(xiàn)[15]提出了一種數(shù)據(jù)驅(qū)動(dòng)的無(wú)模型自適應(yīng)控制方法,用于無(wú)人駕駛車輛橫向運(yùn)動(dòng)控制,這種方法的參數(shù)需要大量數(shù)據(jù)集進(jìn)行訓(xùn)練,文獻(xiàn)[16]考慮了未建模的車輛非線性動(dòng)力學(xué)和道路不確定性,通過(guò)無(wú)模型的迭代學(xué)習(xí)控制方法研究賽車的跟蹤控制,這種方法適合參考軌跡固定的路徑跟蹤,遇到新的場(chǎng)景和干擾需要重新進(jìn)行訓(xùn)練學(xué)習(xí)來(lái)確定參數(shù)。
考慮到在高速跟蹤越野環(huán)境復(fù)雜路況的場(chǎng)景,無(wú)人車在高速運(yùn)動(dòng)過(guò)程中的非線性動(dòng)力學(xué)特性較為復(fù)雜,無(wú)法建立精確的車輛動(dòng)力學(xué)模型,導(dǎo)致控制參數(shù)和控制律設(shè)置較為困難[17],并且越野環(huán)境下復(fù)雜路況不斷變化的曲率和路面條件、地形因素等也給路徑跟蹤控制帶來(lái)了影響[18],這使得現(xiàn)有的路徑跟蹤控制技術(shù)難以滿足跟蹤精度和穩(wěn)定性要求。
針對(duì)越野環(huán)境下高速跟蹤復(fù)雜路況的任務(wù)需求,為了減小模型失配和道路曲率等干擾帶來(lái)的影響,本文基于車輛動(dòng)力學(xué)誤差模型,設(shè)計(jì)了一種在線更新學(xué)習(xí)系數(shù)的參數(shù)自學(xué)習(xí)前饋控制器(parameters self-learning feedforward controller),與模型預(yù)測(cè)控制方法構(gòu)成前饋-反饋控制框架,并在越野路況進(jìn)行了實(shí)驗(yàn)驗(yàn)證。越野環(huán)境實(shí)車實(shí)驗(yàn)結(jié)果表明,相比傳統(tǒng)模型預(yù)測(cè)控制方法,所設(shè)計(jì)的控制器在跟蹤精度和穩(wěn)定性上都有較大改善。
無(wú)人車以較高的速度在越野環(huán)境下進(jìn)行復(fù)雜路況的路徑跟蹤時(shí),簡(jiǎn)單的車輛運(yùn)動(dòng)學(xué)模型難以滿足復(fù)雜工況下的車輛行駛的瞬態(tài)特性和穩(wěn)定性需求。因此,進(jìn)行了車輛動(dòng)力學(xué)模型的建立,基于車輛單軌模型,如圖1所示,推導(dǎo)出了車輛運(yùn)動(dòng)過(guò)程中的狀態(tài)量與控制量前輪偏角之間的關(guān)系式。
圖1 車輛單軌模型Fig.1 Vehicle monorail model
車輛動(dòng)力學(xué)模型采用的狀態(tài)量:y表示車輛橫向位置信息,φ表示車輛偏航角信息,δ為前輪偏角,經(jīng)推導(dǎo)計(jì)算可得到如下車輛動(dòng)力學(xué)模型狀態(tài)方程:
其中,m為整車質(zhì)量,Iz為車輛繞z軸轉(zhuǎn)動(dòng)的轉(zhuǎn)動(dòng)慣量,Vx為車輛速度,lf和lr為車輛質(zhì)心距前、后軸的距離,Cαf和Cαr為車輛前、后輪的側(cè)偏剛度。
在復(fù)雜環(huán)境下,為有效提高無(wú)人車路徑跟蹤精度,使用相對(duì)于參考路徑的位置誤差和航向角偏差作為動(dòng)力學(xué)模型的狀態(tài)變量建立動(dòng)力學(xué)誤差模型,求解控制變量前輪偏角。因此,在現(xiàn)有車輛動(dòng)力學(xué)模型的基礎(chǔ)上經(jīng)推導(dǎo)可得出以下基于跟蹤誤差變量的狀態(tài)空間模型:
式中,ey為橫向誤差,eφ為航向偏差,φ?des為參考橫擺角速度。
傳統(tǒng)控制方法基于誤差模型在參考路徑附近近似線性化,沒(méi)有考慮車輛動(dòng)力學(xué)模型與實(shí)際系統(tǒng)的不匹配,此外,路況等實(shí)驗(yàn)環(huán)境存在無(wú)法建模的干擾,如路面起伏顛簸程度、土壤條件等,導(dǎo)致路徑跟蹤控制器的效果難以達(dá)到預(yù)期目標(biāo)?;趧?dòng)力學(xué)誤差模型,設(shè)計(jì)了一種參數(shù)自學(xué)習(xí)控制器結(jié)構(gòu),前饋控制器根據(jù)誤差在線更新學(xué)習(xí)系數(shù),模型預(yù)測(cè)控制器作為反饋控制??刂破鹘Y(jié)構(gòu)如圖2所示。
圖2 控制器框圖Fig.2 Controller block diagram
如式(3),控制輸入由前饋動(dòng)作和反饋動(dòng)作組成:
其中,δb為反饋控制輸入量,δf為前饋控制輸入量,在以下小節(jié)中闡述。
式(3)中反饋動(dòng)作δb由動(dòng)力學(xué)MPC 計(jì)算所得,考慮以下動(dòng)力學(xué)線性時(shí)域模型:
式中,Np和Nc分別為預(yù)測(cè)時(shí)域和控制時(shí)域,Q和R是系統(tǒng)權(quán)重矩陣,η為狀態(tài)向量,Δu為控制量增量。
在每個(gè)控制周期完成上述求解后,得到控制時(shí)域內(nèi)的一系列輸入增量:
前饋控制動(dòng)作δf由參數(shù)自學(xué)習(xí)控制算法求得:
式中,δr為參考前饋控制動(dòng)作,由參考路徑信息獲得。L和H為前饋控制輸入的更新系數(shù),也即參數(shù)自學(xué)習(xí)控制算法所要求解的學(xué)習(xí)系數(shù)。
由上述動(dòng)力學(xué)誤差模型,得到控制量和橫向誤差及航向誤差的表達(dá)式:
其中,λ為正的常數(shù),即λ >0,也就是說(shuō),如果代價(jià)函數(shù)E收 斂 于0,則 滿 足 魯 棒 控 制 性 能 條 件,e?y+2λe?y+λ2ey=0,e?φ+2λe?φ+λ2eφ=0,也即橫向誤差和航向誤差收斂于0。
梯度下降法是一種尋找函數(shù)最小值的一階迭代優(yōu)化算法,在這種方法中,步長(zhǎng)的取值與閉環(huán)誤差函數(shù)梯度的負(fù)值成正比,以下用梯度下降法尋找代價(jià)函數(shù)E的最小值:
故而,前輪偏角的前饋控制輸入表達(dá)式中的學(xué)習(xí)系數(shù)L的更新式為:
代價(jià)函數(shù)E是半正定的李雅普諾夫函數(shù),即E≥0,為驗(yàn)證參數(shù)自學(xué)習(xí)控制算法的穩(wěn)定性,將李雅普諾夫函數(shù)E對(duì)時(shí)間求導(dǎo)數(shù):
可知,如果學(xué)習(xí)系數(shù)選取合適,李雅普諾夫函數(shù)E的時(shí)間導(dǎo)數(shù)為負(fù),即E?<0,證明參數(shù)自學(xué)習(xí)控制算法的漸進(jìn)穩(wěn)定性。
參數(shù)自學(xué)習(xí)控制算法中還需要考慮的問(wèn)題是系統(tǒng)可能會(huì)停留在某些局部極小值而無(wú)法求得全局最小值解。接下來(lái)我們將分析參數(shù)自學(xué)習(xí)控制算法是否能夠跳出局部最小值,求解出全局最小值,這里取代價(jià)函數(shù)
式(22)和式(23)表明前輪偏角的代價(jià)函數(shù)的二階導(dǎo)符號(hào)是正的,因此沒(méi)有局部最小值,這就說(shuō)明系統(tǒng)達(dá)到了全局最小值,由于α為常數(shù),δr是有界的,表明學(xué)習(xí)系數(shù)收斂到有界值,穩(wěn)態(tài)下系數(shù)的有界值計(jì)算出有界前饋動(dòng)作。
實(shí)驗(yàn)平臺(tái)采用的是基于奇瑞瑞虎車改裝后的“智能先鋒號(hào)”無(wú)人車,車載感知系統(tǒng)有64線激光雷達(dá)1臺(tái)、彩色攝像頭1臺(tái)以及GPS慣導(dǎo)組合導(dǎo)航系統(tǒng),計(jì)算平臺(tái)配有兩臺(tái)工控機(jī),自動(dòng)駕駛軟件架構(gòu)包含感知、決策、規(guī)劃、控制四部分,相互之間進(jìn)行TCP 通信,各自并行計(jì)算。實(shí)驗(yàn)平臺(tái)如圖3所示,平臺(tái)參數(shù)如表1所示。
圖3 實(shí)車實(shí)驗(yàn)平臺(tái)Fig.3 Real vehicle experimental platform
表1 實(shí)車平臺(tái)參數(shù)Table 1 Parameters of real vehicle platform
為保證路徑跟蹤實(shí)車實(shí)驗(yàn)的安全性以及有效性,選取了起伏顛簸的磚石場(chǎng)地和起伏大曲率的越野路面兩個(gè)實(shí)驗(yàn)場(chǎng)景分別進(jìn)行30 km/h速度下的直角轉(zhuǎn)彎路徑跟蹤和50 km/h速度下的S型路徑跟蹤實(shí)驗(yàn),如圖4和圖5所示。初始時(shí),車輛位置從參考軌跡起點(diǎn)出發(fā),航向與參考軌跡初始方向一致。每組實(shí)驗(yàn)分別進(jìn)行多次,選取其中3 組較為合理的實(shí)驗(yàn)數(shù)據(jù)取平均值進(jìn)行數(shù)據(jù)處理。實(shí)驗(yàn)參數(shù)設(shè)置如表2所示。
表2 實(shí)驗(yàn)參數(shù)Table 2 Experimental parameters
圖4 直角彎實(shí)驗(yàn)場(chǎng)地Fig.4 Right-angle turning experimental site
圖5 S型實(shí)驗(yàn)場(chǎng)地Fig.5 S-type path experimental site
本次實(shí)驗(yàn)?zāi)康臑轵?yàn)證所設(shè)計(jì)的參數(shù)自學(xué)習(xí)控制器的路徑跟蹤控制效果,并與不加前饋控制的模型預(yù)測(cè)控制器(MPC)的路徑跟蹤控制結(jié)果對(duì)比,實(shí)驗(yàn)結(jié)果對(duì)比圖如圖6 和圖7 所示,控制器A 代表所設(shè)計(jì)的參數(shù)自學(xué)習(xí)控制器結(jié)構(gòu),控制器B代表傳統(tǒng)模型預(yù)測(cè)控制器。橫向誤差和航向誤差分別代表了無(wú)人車控制算法位置跟蹤和航向跟蹤的能力;橫擺角速度和車輛的穩(wěn)定性直接相關(guān),且極限值與路面摩擦系數(shù)等道路條件有關(guān)。這里只考慮數(shù)值大小,分別對(duì)直角彎路徑跟蹤和S型路徑跟蹤兩種路況下的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了分析處理,處理結(jié)果如表3所示。
圖6 直角型路徑跟蹤實(shí)驗(yàn)結(jié)果對(duì)比Fig.6 Comparison of experimental results of right-angle path tracking
圖7 S型路徑跟蹤實(shí)驗(yàn)結(jié)果對(duì)比Fig.7 Comparison of experimental results of S-type path tracking
表3 實(shí)驗(yàn)數(shù)據(jù)Table 3 Experimental data
由實(shí)驗(yàn)結(jié)果對(duì)比圖分析,誤差的波動(dòng)是因?yàn)楦咚俑櫰鸱嶔さ膹?fù)雜路況需要及時(shí)地修正誤差,而誤差較大的地方是在道路曲率快速變化的地方,這也說(shuō)明了高速?gòu)?fù)雜路況路徑跟蹤的控制難點(diǎn),結(jié)合實(shí)驗(yàn)數(shù)據(jù)表格,與模型預(yù)測(cè)控制(MPC)相比,所設(shè)計(jì)的參數(shù)自學(xué)習(xí)控制器在兩種高速越野場(chǎng)景下的路徑跟蹤實(shí)驗(yàn)中橫向誤差和航向誤差都較小,表明所設(shè)計(jì)的控制器比MPC 跟蹤精度更高;且在兩種路況下,所設(shè)計(jì)的控制器的橫擺角速度最大值在極限值范圍內(nèi)比MPC 更小,表明路徑跟蹤過(guò)程中車輛橫擺穩(wěn)定性更好,安全性更高,驗(yàn)證了所設(shè)計(jì)的控制器能夠在一定程度上克服車輛動(dòng)力學(xué)未建模的不確定性和路況的干擾對(duì)路徑跟蹤控制帶來(lái)的影響,相比模型預(yù)測(cè)控制(MPC)有著更好的跟蹤控制性能。
針對(duì)越野環(huán)境下高速?gòu)?fù)雜路況的路徑跟蹤場(chǎng)景,為了克服車輛動(dòng)力學(xué)未建模的不確定性和道路條件的干擾,提高跟蹤精度和車輛行駛穩(wěn)定性,以車輛動(dòng)力學(xué)誤差模型為基礎(chǔ),設(shè)計(jì)了一種參數(shù)自學(xué)習(xí)的前饋補(bǔ)償控制器,與模型預(yù)測(cè)控制構(gòu)成前饋-反饋的控制器結(jié)構(gòu),根據(jù)實(shí)時(shí)狀態(tài)的誤差大小在線更新前饋控制器參數(shù),自適應(yīng)調(diào)整前饋控制動(dòng)作和反饋控制動(dòng)作的權(quán)重,并在野外場(chǎng)景進(jìn)行了復(fù)雜路況的實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的模型預(yù)測(cè)控制(MPC)相比,所設(shè)計(jì)的控制器在兩種場(chǎng)景下路徑跟蹤的橫向誤差和航向偏差更小,橫擺角速度也在穩(wěn)定范圍內(nèi)有所減小,即所設(shè)計(jì)的控制算法在進(jìn)行高速?gòu)?fù)雜路況的路徑跟蹤中,跟蹤精度和車輛穩(wěn)定性都有所改善,能夠保證較好的路徑跟蹤性能。
計(jì)算機(jī)工程與應(yīng)用2022年19期