賈金豆,徐 博,王陳亮,郭克信
(1. 北京航空航天大學(xué)自動(dòng)化科學(xué)與電氣工程學(xué)院,北京 100083; 2. 哈爾濱工程大學(xué)自動(dòng)化學(xué)院,哈爾濱 150000)
隨著近些年空間技術(shù)的不斷發(fā)展,在低重力、高輻射、高溫高壓的太空環(huán)境中有越來越多的任務(wù)需要人類去完成,能夠替代人類在太空自由行動(dòng)的空間飛行器在世界各國得到了大力發(fā)展,例如日本的工程試驗(yàn)衛(wèi)星-7(Engineering Test Satellite VII,ETS-VII)、歐洲的地球靜止軌道服務(wù)車(Geostationary Service Vehicle,GSV)和服務(wù)于空間站的歐洲臂(European Robotic Arm,ERA)、美國的Ranger TFX空間飛行器等。我國起步較晚,在“八五”期間,一些研究所及高校進(jìn)行了許多空間機(jī)器人基礎(chǔ)項(xiàng)目研究,其中最具代表性的項(xiàng)目是艙外自由移動(dòng)機(jī)器人(Extravehicular Mobile Robot,EMR)[1],屬于一套能夠執(zhí)行行走及操作能力的艙外空間機(jī)器人系統(tǒng)。
自由空間飛行器由基座及搭載其上的空間機(jī)械臂組成,與地面飛行器的顯著區(qū)別是其在微重力下運(yùn)行且基體不固定,相當(dāng)于增加了6個(gè)自由度[2]。當(dāng)空間飛行器抓取非合作目標(biāo)時(shí),目標(biāo)會(huì)對(duì)整個(gè)系統(tǒng)動(dòng)量產(chǎn)生影響,如果控制不當(dāng),將使系統(tǒng)姿勢發(fā)生改變,進(jìn)而導(dǎo)致通信受到干擾、太陽能收集不穩(wěn)定等惡劣后果。
空間飛行器抓捕目標(biāo)的過程主要分為4個(gè)部分:接近、同步、消旋及穩(wěn)定抓捕。當(dāng)目標(biāo)質(zhì)量等參數(shù)未知時(shí),抓捕后形成的組合體具有很大的穩(wěn)定不確定性,本文即是針對(duì)組合體的穩(wěn)定問題進(jìn)行更深一步的探討及研究。
穩(wěn)定控制的前提是需要一個(gè)精確的動(dòng)力學(xué)模型,以往研究空間動(dòng)力學(xué)建模的方法較為統(tǒng)一。文獻(xiàn)[3-5,11-12]介紹了目前現(xiàn)有的空間飛行器的動(dòng)力學(xué)建模方法,較為統(tǒng)一的建模方法為拉格朗日建模,通過機(jī)械臂幾何關(guān)系及角動(dòng)量、線動(dòng)量守恒,推導(dǎo)出末端速度、角速度與關(guān)節(jié)角度的運(yùn)動(dòng)學(xué)方程,再通過拉格朗日方程得到系統(tǒng)受到底座力/力矩、關(guān)節(jié)力矩、末端受力的動(dòng)力學(xué)方程。
抓捕前,根據(jù)目標(biāo)運(yùn)行軌跡選定抓取位置,并調(diào)整機(jī)械臂末端到規(guī)定位置進(jìn)行抓捕,文獻(xiàn)[6-7]研究了抓捕前空間飛行器的軌跡及姿態(tài)規(guī)劃問題。抓捕瞬間,機(jī)械臂末端會(huì)與目標(biāo)發(fā)生碰撞,受到脈沖式的沖擊力,對(duì)系統(tǒng)的動(dòng)量產(chǎn)生影響;為減少脈沖力對(duì)系統(tǒng)角動(dòng)量的影響,文獻(xiàn)[3,5]在該方面做了詳細(xì)研究。抓捕后,空間飛行器與非合作目標(biāo)構(gòu)成組合體,組合體穩(wěn)定控制方法主要分為兩類,一類是目標(biāo)慣量和質(zhì)量等參數(shù)已知或可以通過其他手段精確辨識(shí),對(duì)于該類情況可通過反作用輪或其他方法吸收多余角動(dòng)量。文獻(xiàn)[2]運(yùn)用了關(guān)節(jié)阻抗控制和關(guān)節(jié)函數(shù)參數(shù)化協(xié)調(diào)控制,通過協(xié)調(diào)飛輪和關(guān)節(jié)運(yùn)動(dòng)使系統(tǒng)角動(dòng)量轉(zhuǎn)移至飛輪,最終使組合體達(dá)到穩(wěn)定。另一類是目標(biāo)質(zhì)量和慣量等參數(shù)未知,對(duì)于該類情況,目前主要通過設(shè)計(jì)自適應(yīng)魯棒控制算法或干擾觀測器以實(shí)現(xiàn)組合體的穩(wěn)定控制。文獻(xiàn)[7]采用了系繩消除角動(dòng)量的方法;文獻(xiàn)[9]將系統(tǒng)動(dòng)力學(xué)模型轉(zhuǎn)換為線性回歸矩陣,通過自適應(yīng)控制原理設(shè)計(jì)更新律來估計(jì)未知參數(shù);文獻(xiàn)[4]在關(guān)節(jié)空間內(nèi)實(shí)行自適應(yīng)控制;文獻(xiàn)[10]通過遞歸運(yùn)動(dòng)學(xué)方程對(duì)組合體進(jìn)行建模,將基座視為一個(gè)虛擬關(guān)節(jié),以基座姿態(tài)設(shè)置控制率,通過不斷更新抓取后的角動(dòng)量,運(yùn)用動(dòng)量守恒方法估計(jì)出不確定參數(shù)。在干擾觀測器的應(yīng)用方面,文獻(xiàn)[16]將非合作目標(biāo)引起的系統(tǒng)不確定性部分視為干擾,進(jìn)而設(shè)計(jì)了非線性干擾觀測器(Nonlinear Disturbance Observer,NDOB)來估計(jì)干擾并給予前饋補(bǔ)償。
上述文獻(xiàn)的自適應(yīng)控制應(yīng)用均以控制組合體達(dá)到穩(wěn)態(tài)為最終目的,并沒有分析并精確估計(jì)出非合作目標(biāo)的真實(shí)參數(shù),為后續(xù)穩(wěn)定控制及其他任務(wù)提供便利,因此稱這些方法為被動(dòng)自適應(yīng)控制;主動(dòng)自適應(yīng)控制則是精確估計(jì)出系統(tǒng)未知參數(shù)并給予后續(xù)應(yīng)用。
本文針對(duì)空間自由飛行器系統(tǒng),首先第1節(jié)基于傳統(tǒng)拉格朗日法,在關(guān)節(jié)空間內(nèi)建立動(dòng)力學(xué)模型;第2節(jié)設(shè)計(jì)了自適應(yīng)控制算法及基于干擾觀測器的控制算法,并理論分析了二者的優(yōu)缺點(diǎn);第3節(jié)開創(chuàng)性地提出了一種結(jié)合自適應(yīng)控制及干擾觀測器的控制方法;第4節(jié)進(jìn)行了仿真驗(yàn)證;最后在第5節(jié)進(jìn)行了總結(jié)。
如圖1所示,空間飛行器可以簡化為被n個(gè)關(guān)節(jié)連接的n+1節(jié)剛體,將機(jī)械臂各關(guān)節(jié)編號(hào)1~n,用變量q=(q1,q2,…,qn)T表示各關(guān)節(jié)角度狀態(tài),基座命名為B,用mi和Ii表示第i節(jié)剛體的質(zhì)量及慣量?;诳臻g飛行器運(yùn)行的軌道建立慣性坐標(biāo)系∑I;以基座質(zhì)心為原點(diǎn),建立基座坐標(biāo)系∑B;分別用向量Ri和ri表示慣性坐標(biāo)系∑I和基座坐標(biāo)系∑B下第i節(jié)剛體的位置[11-12]。
圖1 自由飛行空間飛行器Fig.1 Free flying spacecraft
變量ζ=[bx,by,bz,q0x,q0y,q0z,q1,…qn]T;bx、by、bz表示基座的位置;q0x、q0y、q0z表示基座的姿態(tài);q1,…,qn表示關(guān)節(jié)1~n的關(guān)節(jié)角度。系統(tǒng)的總動(dòng)能為
(1)
其中,M(ζ)為系統(tǒng)斜對(duì)稱動(dòng)能矩陣。因?yàn)榭臻g飛行器工作在無重力環(huán)境下,假設(shè)系統(tǒng)內(nèi)沒有彈性構(gòu)件,系統(tǒng)勢能為0。運(yùn)用拉格朗日方程動(dòng)力學(xué)原則,得到飛行器動(dòng)力學(xué)方程為
(2)
另外,空間動(dòng)力學(xué)模型具有一些特性:
1)M(ζ)為正定對(duì)稱矩陣,所以M(ζ)-1也為正定矩陣;
為了便于后續(xù)控制方法的分析及仿真驗(yàn)證,這里以平面二關(guān)節(jié)空間飛行器[14]為主進(jìn)行動(dòng)力學(xué)建模。
平面二關(guān)節(jié)飛行器對(duì)應(yīng)的動(dòng)力學(xué)模型為
(3)
其中,ζ=[bx,by,q0,q1,q2]T,M0、C0詳細(xì)表達(dá)式可參考文獻(xiàn)[14]。
空間飛行器抓取非合作目標(biāo)后,組合體的慣量參數(shù)都發(fā)生了改變。
(4)
如圖2所示,當(dāng)空間飛行器抓取非合作目標(biāo)后,手端與目標(biāo)硬接觸,并保持相對(duì)靜止。推導(dǎo)組合體動(dòng)力學(xué)模型與空間飛行器類似,僅需將非合作目標(biāo)與遠(yuǎn)離基座的機(jī)械臂視為一體m2e,等效看作質(zhì)量和慣量參數(shù)改變后的機(jī)械臂。
m2e=m2+mel2e=2(m2l2/2+me(l2/2+le/2))/(m2+me)
圖2 組合體模型Fig.2 Combination
本部分主要分析對(duì)比文獻(xiàn)[9]與文獻(xiàn)[16]中提到的自適應(yīng)控制方法及基于干擾觀測器的控制方法,為后續(xù)提出復(fù)合控制方法提供理論前提。
當(dāng)空間飛行器抓取的目標(biāo)參數(shù)已知,并且系統(tǒng)不存在模型不確定時(shí)[15],設(shè)計(jì)控制器為
(5)
將式(5)代入組合體模型式(4)中,可得系統(tǒng)偏差動(dòng)力學(xué)方程為
由偏差動(dòng)力學(xué)方程可知,隨著t→0,復(fù)合偏差s→0,廣義變量偏差e→0,系統(tǒng)最終能保持穩(wěn)定。
由于自適應(yīng)設(shè)計(jì)過程是后續(xù)組合控制的關(guān)鍵部分,這里將給出具體設(shè)計(jì)過程。根據(jù)文獻(xiàn)[9,13],將組合體動(dòng)力學(xué)模型轉(zhuǎn)換為線性回歸矩陣形式
(6)
其中,θ=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10]T為組合體所有未知參數(shù)的表達(dá)式。記θ*表示組合體未知參數(shù)的真實(shí)值。
將式(6)代入式(5)中
(7)
因此,在自適應(yīng)控制下,控制器為
(8)
(9)
其中,Γ為正定對(duì)角線矩陣。
(10)
將式(8)代入系統(tǒng)動(dòng)力學(xué)模型式(4)中
(11)
用式(11)減去式(6),結(jié)合式(10)得
由動(dòng)力學(xué)特性1),構(gòu)造李雅普諾夫函數(shù)V
結(jié)合動(dòng)力學(xué)特性2)及式(11)得
基于非線性干擾觀測器控制的基本思路[13,16],設(shè)計(jì)非線性干擾觀測器來估計(jì)系統(tǒng)存在的內(nèi)外干擾及模型不確定性,并對(duì)估計(jì)出來的干擾值進(jìn)行前饋補(bǔ)償?shù)窒?/p>
變換組合體動(dòng)力學(xué)模型如下
(12)
(13)
對(duì)式(13)設(shè)計(jì)干擾觀測器如下
(14)
(15)
L=M-1c
(16)
最終結(jié)合反饋線性化非線性控制,控制器設(shè)計(jì)為
(17)
AC和NDOBC的控制思路均是通過估計(jì)系統(tǒng)的不確定性部分以達(dá)到穩(wěn)定,AC直接通過線性矩陣變化分析未知參數(shù)的具體結(jié)構(gòu)θ=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10]T進(jìn)行估計(jì);NDOBC是將組合體的不確定性看作一個(gè)復(fù)合干擾d進(jìn)行估計(jì),無法反映出具體未知參數(shù)的真實(shí)值θ。
由式(9)可知,參數(shù)估計(jì)律與復(fù)合偏差具有耦合關(guān)系,會(huì)相互影響。當(dāng)存在一定的偏差s,估計(jì)參數(shù)就會(huì)隨之發(fā)生變動(dòng),由于最后必然存在系統(tǒng)穩(wěn)態(tài)誤差,參數(shù)估計(jì)值與真實(shí)值之間也必會(huì)存在一定誤差,該誤差量級(jí)與控制增益Γ的量級(jí)有關(guān)。
由Basic NDOBC[13]理論可知,在NDOBC中,d觀測的精確率與d的變化速率有關(guān),當(dāng)其相對(duì)觀測器更新速率較慢時(shí),可以較為精確地估計(jì)出d。
基于上述分析,倘若可以結(jié)合AC與NDOBC各自的優(yōu)點(diǎn),即達(dá)到精確估計(jì)系統(tǒng)不確定參數(shù)的效果,則會(huì)給空間飛行器精確完成后續(xù)的控制任務(wù)帶來極大便利。
已知在自適應(yīng)控制下
(18)
構(gòu)造一個(gè)虛擬干擾
(19)
直觀上分析,式(19)反映了AC估計(jì)下的動(dòng)力學(xué)模型與真實(shí)動(dòng)力學(xué)模型的偏差,構(gòu)造一個(gè)輔助動(dòng)力學(xué)模型
(20)
設(shè)計(jì)輔助動(dòng)力學(xué)方程相應(yīng)的觀測器NDOB[14]為
(21)
(22)
(23)
(24)
式(21)、式(23)、式(24)給出了輔助動(dòng)力學(xué)方程的干擾觀測器表達(dá)式。
將系統(tǒng)動(dòng)力學(xué)模型以及輔助動(dòng)力學(xué)模型表示為線性回歸矩陣的形式
(25)
(26)
(27)
(28)
整個(gè)復(fù)合控制系統(tǒng)的控制框圖如圖3所示。
圖3 復(fù)合控制框圖Fig.3 Diagram of composited control
由ASSUMPTION,結(jié)合式(21)可以得到
(29)
構(gòu)造李雅普諾夫函數(shù)
其中,I表示單位陣。
仿真初始化設(shè)置,初始位置及期望跟蹤軌跡為:[1;1;0.02;0.05;0.9]、[0;0;0;sin(0.1t);cos(0.1t)],仿真時(shí)間t=20s,飛行器參數(shù)和控制參數(shù)如表1和表2所示。
表1 平面二關(guān)節(jié)飛行器仿真參數(shù)
表2 仿真控制參數(shù)
軌跡跟蹤誤差對(duì)比如圖4~圖8所示,給出了AC及NDOBC下的空間飛行器抓取非合作目標(biāo)后的軌跡跟蹤誤差,其中圖4、圖5、圖6所示為基座在X、Y方向及姿態(tài)的跟蹤誤差,圖7、圖8所示為關(guān)節(jié)1和關(guān)節(jié)2的跟蹤誤差。
可知,AC及NDOBC均可以使組合體達(dá)到穩(wěn)定。在動(dòng)態(tài)性能方面,自適應(yīng)控制的超調(diào)大,但是響應(yīng)快;穩(wěn)態(tài)性能方面,NDOBC表現(xiàn)良好,穩(wěn)態(tài)誤差相對(duì)小一些。
圖4 基座在X方向跟蹤誤差Fig.4 Tracking error of base in X direction
圖5 基座在Y方向跟蹤誤差Fig.5 Tracking error of base in Y direction
圖6 基座姿態(tài)跟蹤誤差Fig.6 Tracking error of base attitude
圖7 關(guān)節(jié)1跟蹤誤差 Fig.7 Tracking error of joint 1
圖8 關(guān)節(jié)2跟蹤誤差Fig.8 Tracking error of joint 2
圖9 AC參數(shù)估計(jì)值Fig.9 Parameters estimation of AC
表3 AC估計(jì)值誤差
圖10 NDOBC的估計(jì)值d1Fig.10 d1 of NDOBC
圖11 NDOBC的估計(jì)值d2Fig.11 d2 of NDOBC
圖12 NDOBC的估計(jì)值d3Fig.12 d3 of NDOBC
圖13 NDOBC的估計(jì)值d4Fig.13 d4 of NDOBC
圖14 NDOBC的估計(jì)值d5Fig.14 d5 of NDOBC
由圖9可以發(fā)現(xiàn),AC的參數(shù)估計(jì)值與真實(shí)值有超過4倍的偏差,所以自適應(yīng)控制下的參數(shù)估計(jì)在保證組合體穩(wěn)定的情況下,并不能達(dá)到準(zhǔn)確估計(jì)未知參數(shù)的效果,與2.5節(jié)理論分析結(jié)果一致。
由圖10~圖14可以發(fā)現(xiàn),NDOBC的干擾觀測器可以相當(dāng)準(zhǔn)確地估計(jì)出復(fù)合干擾d,與2.5節(jié)理論分析及文獻(xiàn)[16]得出的結(jié)論一致。
仿真初始化各參數(shù)與4.1節(jié)均一致,AC控制參數(shù)保持不變,NDOB控制增益cf=8,仿真時(shí)間t=100s。
圖15和圖16所示為整個(gè)仿真時(shí)間和達(dá)到穩(wěn)態(tài)時(shí)間系統(tǒng)未知參數(shù)估計(jì)的變化規(guī)律;圖17所示為系統(tǒng)達(dá)到穩(wěn)態(tài)虛擬干擾df的真實(shí)變化,以驗(yàn)證ASSUMPTION是否合理。
圖15 0~100s的參數(shù)估計(jì)Fig.15 Parameters estimation for 0~100s
圖16 20~100s的參數(shù)估計(jì)Fig.16 Parameters estimation for 20~100s
由圖16可以看出,在NDOB觀測下,系統(tǒng)參數(shù)估計(jì)值在較長時(shí)間內(nèi)圍繞定值周期性波動(dòng),發(fā)生波動(dòng)的原因可能由ASSUMPTION引起,分析如圖17所示。
圖17 穩(wěn)態(tài)期間虛擬干擾d的真實(shí)變化Fig.17 Real change of virtual disturbance d for 20~100s
由圖17可以看出,虛擬干擾df的變化并非緩慢或近似為0,而是圍繞著df=0這條線以固定周期往復(fù)變化,并且該固定周期近似為期望關(guān)節(jié)運(yùn)動(dòng)軌跡的周期。因此由ASSUMPTION可知,用Basic NDOB方法估計(jì)虛擬干擾df會(huì)帶來一定的誤差。
為分析參數(shù)估計(jì)波動(dòng)所帶來的影響,對(duì)20~100s時(shí)間段內(nèi)的估計(jì)值求平均值,如表4所示。
表4 復(fù)合控制估計(jì)值誤差
其中,誤差=|R-E|/R%,R為真值,E為估計(jì)值。
由表4可知,雖然采用Basic NDOB得到的參數(shù)估計(jì)值具有一定周期性波動(dòng),但是其平均值近似為系統(tǒng)參數(shù)真實(shí)值,相對(duì)于表3中AC參數(shù)估計(jì)誤差有顯著改善。
本文針對(duì)空間飛行器抓取參數(shù)未知非合作目標(biāo)后的穩(wěn)定控制問題,提出了一種可以在線精確估計(jì)未知參數(shù)的復(fù)合控制方法。算法分析與實(shí)驗(yàn)結(jié)果表明:
1)在空間飛行器穩(wěn)定控制應(yīng)用方面,相對(duì)自適應(yīng)控制下的組合體穩(wěn)定過程動(dòng)態(tài)響應(yīng)快、穩(wěn)態(tài)跟蹤誤差較差、參數(shù)估計(jì)值與真實(shí)值相差大,NDOBC的非線性干擾觀測器能準(zhǔn)確地反映組合體的不確定性部分,但是無法反映具體未知參數(shù)。
2)復(fù)合控制方法結(jié)合了二者各自的優(yōu)點(diǎn),相對(duì)于自適應(yīng)控制,參數(shù)估計(jì)誤差得到了顯著改善,最終可限制在6%以內(nèi)。
3)由于Basic NDOB的局限性,導(dǎo)致最終估計(jì)參數(shù)的周期變化,雖然可以通過求平均值來反映真實(shí)值,但是也限制了其在實(shí)際情況中的應(yīng)用,如何克服這一局限性將是下一步研究方向。