劉將輝,李海陽(yáng)
(國(guó)防科技大學(xué)空天科學(xué)學(xué)院,長(zhǎng)沙 410073)
近年來(lái),航天器失聯(lián)事件不斷發(fā)生,如歐空局的Envisat衛(wèi)星于2012年4月8日與地面失去了聯(lián)系,印度發(fā)射的通信衛(wèi)星GSAT- 6A于2018年3月31日進(jìn)行最后一次軌道機(jī)動(dòng)時(shí)與地面失去了聯(lián)系。失聯(lián)航天器一般處于低速無(wú)控制的自由翻滾狀態(tài),對(duì)在軌航天器的安全造成嚴(yán)重威脅。如果能對(duì)失控翻滾目標(biāo)進(jìn)行在軌維修檢查、燃料加注和捕獲,則具有重要的意義[1-3]。面向失控翻滾目標(biāo)的逼近是實(shí)施上述任務(wù)的基礎(chǔ),追蹤器需要對(duì)失控翻滾目標(biāo)進(jìn)行精確的位置跟蹤和姿態(tài)同步。失控翻滾目標(biāo)的非合作特性,大大增加了逼近過(guò)程的難度[4-5]。
針對(duì)這一問(wèn)題,研究人員提出了各種非線性的控制方法[6]。文獻(xiàn)[7]采用Smith模糊控制、文獻(xiàn)[8]采用滑模控制、文獻(xiàn)[9]采用人工視場(chǎng)法、文獻(xiàn)[10]采用反饋線性法來(lái)設(shè)計(jì)航天器的相對(duì)運(yùn)動(dòng)。假設(shè)目標(biāo)衛(wèi)星的運(yùn)動(dòng)學(xué)是完全已知的,文獻(xiàn)[11]設(shè)計(jì)了一種控制律,并給出了最優(yōu)性準(zhǔn)則,使跟蹤器沿著所設(shè)計(jì)的軌跡向翻滾目標(biāo)移動(dòng),直到兩者之間保持相對(duì)靜止。文獻(xiàn)[12]利用逆動(dòng)力學(xué)直接方法和非線性規(guī)劃求解器序列梯度恢復(fù)算法研究了兩個(gè)模擬航天器間協(xié)同對(duì)接策略的最小能量問(wèn)題,并給出了一種近最優(yōu)的制導(dǎo)策略。文獻(xiàn)[13]基于雙四元數(shù)的非線性和角速度反饋實(shí)現(xiàn)了追蹤器對(duì)目標(biāo)器的姿態(tài)同步。文獻(xiàn)[14]闡述了具有通用目標(biāo)的動(dòng)力學(xué)和制導(dǎo)、導(dǎo)航與控制(GNC)方案,測(cè)試了基于線性二次型調(diào)節(jié)器(LQR)的位置跟蹤控制器和角速度約束的比例微分(PD)姿態(tài)跟蹤控制器。在有限時(shí)間控制和自適應(yīng)控制策略的基礎(chǔ)上,文獻(xiàn)[15]實(shí)現(xiàn)了兩航天器間的有限時(shí)間姿態(tài)同步與跟蹤控制。采用狀態(tài)相關(guān)的Riccati方程控制,文獻(xiàn)[16]實(shí)現(xiàn)了兩航天器間運(yùn)動(dòng)耦合的平動(dòng)和旋轉(zhuǎn)運(yùn)動(dòng)。文獻(xiàn)[17]將滑??刂婆c逆最優(yōu)控制相結(jié)合,考慮兩航天器間的平移與姿態(tài)耦合,設(shè)計(jì)了魯棒逆最優(yōu)位置姿態(tài)控制器。文獻(xiàn)[18]利用偽普法求得了追蹤器與翻滾目標(biāo)逼近的最小時(shí)間和最小能量消耗的最優(yōu)軌跡。文獻(xiàn)[19-20]針對(duì)非合作目標(biāo)具有建模不確定性的問(wèn)題,提出了一種具有標(biāo)準(zhǔn)可測(cè)信息的魯棒自適應(yīng)控制方法。文獻(xiàn)[21-22] 應(yīng)用模型預(yù)測(cè)控制器來(lái)控制追蹤器逼近翻滾目標(biāo)。文獻(xiàn)[23]提出了一種基于非線性優(yōu)化的運(yùn)動(dòng)規(guī)劃方法,將安全成本放在首位,為追蹤器接近非合作目標(biāo)衛(wèi)星提供一個(gè)安全的接近軌道。然而,多數(shù)文獻(xiàn)存在以下不足:追蹤器和目標(biāo)器之間的相對(duì)位置和相對(duì)姿態(tài)耦合不完整,甚至忽略耦合作用;一般將標(biāo)稱軌跡或標(biāo)稱姿態(tài)單獨(dú)設(shè)計(jì)以便對(duì)位置或姿態(tài)單獨(dú)進(jìn)行控制。設(shè)計(jì)參數(shù)的時(shí)候未考慮未建模動(dòng)態(tài)和參數(shù)不確定性,甚至忽略外界擾動(dòng)。
相比多層前饋反向傳播(BP)網(wǎng)絡(luò),徑向基函數(shù)(Radical basis function,RBF)網(wǎng)絡(luò)具有良好的泛化能力,網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,避免不必要的和冗長(zhǎng)的計(jì)算。RBF神經(jīng)網(wǎng)絡(luò)能夠在一個(gè)緊湊集合任意精度下,逼近任何非線性函數(shù)[24]?;?刂浦?,由于建模不確定性需要切換增益,這就容易造成抖振。本文在姿軌一體化模型中,考慮姿態(tài)和軌道耦合效應(yīng),設(shè)計(jì)標(biāo)稱軌跡和標(biāo)稱姿態(tài),將滑??刂平Y(jié)合RBF神經(jīng)網(wǎng)絡(luò)逼近用于非線性系統(tǒng)的控制中,采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)模型未知部分的自適應(yīng)逼近。神經(jīng)網(wǎng)絡(luò)自適應(yīng)律通過(guò)Lyapunov方法導(dǎo)出,通過(guò)自適應(yīng)權(quán)重的調(diào)節(jié)保證整個(gè)閉環(huán)系統(tǒng)的穩(wěn)定性和收斂性。仿真結(jié)果表明,本文所設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)滑??刂破髂軌蚴棺粉櫰骺焖?、安全地逼近失控翻滾目標(biāo)器,整個(gè)控制過(guò)程中無(wú)抖振問(wèn)題,追蹤器輸出力矩和控制加速度連續(xù)平滑。
圖1 相對(duì)運(yùn)動(dòng)坐標(biāo)系統(tǒng)Fig.1 Relative motion coordinate system
在目標(biāo)航天器軌道坐標(biāo)系下,選用非線性的T-H方程描述追蹤航天器與目標(biāo)航天器的相對(duì)運(yùn)動(dòng)[25]
(1)
(2)
(3)
其中,n為目標(biāo)航天器的平均軌道角速度,e為目標(biāo)航天器軌道偏心率。由式(1)可得到如下形式的非線性軌道相對(duì)運(yùn)動(dòng)方程
(4)
式中:
根據(jù)剛體動(dòng)量矩定理,可得到航天器姿態(tài)動(dòng)力學(xué)方程
(5)
其中,J為航天器的轉(zhuǎn)動(dòng)慣量,ω為航天器姿態(tài)運(yùn)動(dòng)角速度矢量,τc為航天器姿態(tài)控制力矩,τd為航天器所受的外部未知有界干擾力矩,τg為航天器所受的重力梯度力矩,τg表達(dá)式為
(6)
(7)
由于追蹤航天器與失控翻滾目標(biāo)航天器進(jìn)行姿態(tài)同步旋轉(zhuǎn)的過(guò)程中存在大角度機(jī)動(dòng),為避免姿態(tài)控制中出現(xiàn)奇異,本文使用四元數(shù)描述航天器的姿態(tài)運(yùn)動(dòng)。下面基于誤差四元數(shù)推導(dǎo)追蹤航天器和目標(biāo)航天器的相對(duì)姿態(tài)動(dòng)力學(xué)模型。
設(shè)航天器當(dāng)前姿態(tài)四元數(shù)為q,期望姿態(tài)四元數(shù)為qd,誤差四元數(shù)qe的表達(dá)式為
(8)
(9)
設(shè)追蹤器當(dāng)前的角速度矢量為ω,期望的姿態(tài)角速度矢量為ωd,角速度誤差矢量為ωe,其表達(dá)式為
ωe=ω-Meωd
(10)
(11)
其中,
(12)
式中:G=ωe+Meωd。
(13)
對(duì)式(13)兩邊求導(dǎo)可得
(14)
基于誤差四元數(shù),由式(14)可得到如下形式的航天器相對(duì)姿態(tài)動(dòng)力學(xué)方程
(15)
式中:
(16)
式中:
根據(jù)本文對(duì)目標(biāo)器軌道坐標(biāo)系的定義,由慣性坐標(biāo)系OEXEYEZE至目標(biāo)器軌道坐標(biāo)系OTXTYTZT的姿態(tài)轉(zhuǎn)移矩陣MIG為
(17)
式中:
(18)
(19)
(20)
(21)
(22)
(23)
(24)
(25)
(26)
其中,
(27)
式中:
(28)
(29)
(30)
(31)
考慮系統(tǒng)中存在未建模動(dòng)態(tài)及參數(shù)不確定性,由式(16)得到進(jìn)一步的姿軌一體化模型
(Cd3+ΔC3)+C4(u+d)
(32)
(33)
(34)
基于式(34)所建立的姿軌一體化動(dòng)力學(xué)模型,通過(guò)控制輸入u來(lái)對(duì)追蹤器逼近過(guò)程進(jìn)行控制。取
(35)
式(34)寫成狀態(tài)方程的形式為
(36)
e=X1-Xd
(37)
(38)
滑模函數(shù)設(shè)計(jì)為
(39)
其中,c為滑模函數(shù)系數(shù),c=diag(c1,…,c7),ci>0,i=1,2,…,7。則
(40)
(41)
(42)
(43)
由于
(44)
定義Lyapunov函數(shù)為
(45)
其中,γ>0。
于是
(46)
設(shè)計(jì)控制律為
(47)
其中,η=diag(η1,…,η7),ηi>0,i=1,2,…,7, sgn(s)=[sgn(s1),…,sgn(s7)]T,則
(48)
其中,κ=[η1,…,η7]T,取ηi>|εi|max,i=1,2,…,7,自適應(yīng)律為
(49)
假設(shè)目標(biāo)航天器在空間中處于失控翻滾狀態(tài),且不存在軌道機(jī)動(dòng)??紤]J2項(xiàng)攝動(dòng)和大氣阻力的影響,仿真采用高精度數(shù)值積分軌道模型。目標(biāo)航天器的軌道六根數(shù)為:a=6739200 m,e=0.005,i=51.6°,Ω=315°,ω=41°,f=320°。追蹤器在距目標(biāo)器質(zhì)心15 m時(shí)對(duì)目標(biāo)器進(jìn)行逼近,終端逼近位置距目標(biāo)器質(zhì)心1 m,逼近期間假設(shè)追蹤器和目標(biāo)器的轉(zhuǎn)動(dòng)慣量不隨時(shí)間而變化。
表1 仿真參數(shù)Table 1 Simulation parameters
設(shè)追蹤器受到的外部有界攝動(dòng)加速度ad和外部有界攝動(dòng)力矩τd分別為[26]
(50)
(51)
式(50)和(51)中,ωo為追蹤器軌道角速度,{ad1,ad2,ad3}與{τd1,τd2,τd3}滿足均值為0且方差為υ=10-5高斯分布N(0,υ)。RBF神經(jīng)網(wǎng)絡(luò)滑??刂破鲄?shù)如表2所示。
表2 神經(jīng)網(wǎng)絡(luò)滑??刂破鲄?shù)Table 2 Neural network sliding mode control parameters
需要說(shuō)明的是,表2中的高斯基參數(shù)pj和bj由網(wǎng)絡(luò)輸入X1和X2的實(shí)際范圍來(lái)設(shè)計(jì),本文采用了嘗試法,并沒(méi)有進(jìn)行最優(yōu)化處理。仿真結(jié)果如圖2~圖7所示。
圖2 誤差四元數(shù)、位置偏差和速度偏差Fig.2 Error quaternion, relative position and relative velocity
圖3 追蹤器的控制力矩和控制加速度Fig.3 Control torque and control acceleration of the chaser
圖4 三維空間中追蹤器與目標(biāo)逼近點(diǎn)的相對(duì)位置Fig.4 Relative position of the chaser and approach point in three-dimensional space
圖3為追蹤器的控制力矩和控制加速度變化曲線。在神經(jīng)網(wǎng)絡(luò)自適應(yīng)滑??刂破鞯淖饔孟?,追蹤器x與z方向輸出的控制力矩變化較小,y方向輸出的控制力矩較大,一段時(shí)間之后,各方向的控制力矩趨向于0,這是因?yàn)樽粉櫰饕呀?jīng)跟上了目標(biāo)器的姿態(tài),追蹤器和目標(biāo)器一起做相同的姿態(tài)運(yùn)動(dòng)。當(dāng)完成姿態(tài)捕獲后,后續(xù)所需的控制力矩極??;追蹤器需要將其質(zhì)心位置始終保持在逼近點(diǎn)的軸線上,初始時(shí)刻,追蹤器距逼近點(diǎn)較遠(yuǎn),所以初期所需的控制加速度較大。隨著兩者的距離逐漸減小,其控制加速度呈現(xiàn)振蕩減小的趨勢(shì),最后趨向于0。整個(gè)過(guò)程中,控制力矩和控制加速度較為平緩,沒(méi)有出現(xiàn)抖振現(xiàn)象,神經(jīng)網(wǎng)絡(luò)自適應(yīng)滑??刂破鞒晒朔藗鹘y(tǒng)滑模控制器抖振特性的影響。
圖4為追蹤器與逼近點(diǎn)的三維相對(duì)位置的變化曲線,與常規(guī)交會(huì)對(duì)接任務(wù)最后逼近段的準(zhǔn)直線相對(duì)運(yùn)動(dòng)軌跡不同。由于目標(biāo)航天器處于失控翻滾狀態(tài),追蹤器逼近軌跡始終位于目標(biāo)器體坐標(biāo)系x軸上,所以追蹤器三維相對(duì)運(yùn)動(dòng)為同步指數(shù)減速逼近曲線。
圖5 f(x)和估計(jì)值Fig.5 f(x) and the estimation
圖6 f(x)和估計(jì)值Fig.6 f(x) and the estimation
圖7 f(x)和估計(jì)值Fig.7 f(x) and the estimation
為了說(shuō)明所設(shè)計(jì)控制器的優(yōu)越性,將RBF神經(jīng)網(wǎng)絡(luò)滑??刂破髋c傳統(tǒng)滑??刂破鬟M(jìn)行對(duì)照。在沒(méi)有RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)條件下,式(47)在傳統(tǒng)滑??刂浦锌杀硎緸?/p>
(52)
圖8 滑??刂破飨碌恼`差四元數(shù)、位置偏差和速度偏差Fig.8 Error quaternion, relative position and relative velocity under sliding mode control
圖9 滑??刂破飨碌淖粉櫰鞯目刂屏睾涂刂萍铀俣菷ig.9 Control torque and control acceleration of the chaser under sliding mode control
通過(guò)將圖8~圖9與圖2~圖3對(duì)比可知,傳統(tǒng)滑模控制器完成姿態(tài)同步需要約56 s,比RBF神經(jīng)網(wǎng)絡(luò)滑??刂破髀?1 s。傳統(tǒng)滑模控制器下的控制力矩和控制加速度出現(xiàn)了明顯的抖振現(xiàn)象,初始控制加速度比RBF神經(jīng)網(wǎng)絡(luò)滑??刂破飨碌母?。
本文研究了逼近失控翻滾目標(biāo)的相對(duì)軌道和相對(duì)姿態(tài)的六自由度耦合控制問(wèn)題,建立了兩航天器相對(duì)運(yùn)動(dòng)的六自由度耦合的一體化模型,對(duì)逼近翻滾目標(biāo)的標(biāo)稱軌跡和標(biāo)稱姿態(tài)進(jìn)行了分析和設(shè)計(jì)??紤]外部干擾、系統(tǒng)不確定性以及滑??刂浦械亩墩竦纫蛩?,推導(dǎo)了六自由度逼近的神經(jīng)網(wǎng)絡(luò)自適應(yīng)滑??刂破鞑⒔o出了穩(wěn)定性證明。仿真結(jié)果表明,該控制器能夠有效克服系統(tǒng)不確定因素的影響。追蹤器按照設(shè)計(jì)的標(biāo)稱軌跡對(duì)目標(biāo)實(shí)現(xiàn)了快速逼近,保證了逼近過(guò)程的安全性??刂七^(guò)程中產(chǎn)生的控制力矩和控制加速度連續(xù)平滑,克服了抖振問(wèn)題。