殷春武 佟 威 何 波
西安建筑科技大學信息與控制工程學院,西安 710055
航天器在執(zhí)行空間任務(wù)時,必須保證其姿態(tài)穩(wěn)定,但受環(huán)境和航天器自身運動的影響,航天器的姿態(tài)常會發(fā)生偏移,姿態(tài)跟蹤控制器主要用于航天器的姿態(tài)穩(wěn)定控制。航天器一方面受導航帶寬及角速度陀螺量程的限制,存在角速度有界約束,另一方面,航天器附件的形狀改變(如機械臂伸展、太陽帆展開)會帶動其質(zhì)心偏移,導致姿態(tài)控制系統(tǒng)中的參數(shù)發(fā)生未知攝動。因此,研究存在角速度有界約束、參數(shù)攝動及外部干擾等約束下的姿態(tài)跟蹤控制,具有重要的實際工程應(yīng)用價值。
學者在不同的假設(shè)條件下,采用非線性控制理論和方法,設(shè)計了不同的航天器姿態(tài)跟蹤控制器[1-5],其中滑??刂埔蚱鋵?shù)攝動的強魯棒性,被廣泛應(yīng)用于干擾上界已知條件下的姿態(tài)跟蹤控制器設(shè)計[1-2]。實際工程應(yīng)用中,轉(zhuǎn)動慣量攝動和外部干擾的上界均不可能預(yù)先知道,因此,航天器動力學方程的干擾上界已知的假設(shè)并不成立。為解決航天器動力學方程的干擾上界未知的問題,學者利用自適應(yīng)技術(shù)[3-4]或智能逼近技術(shù)[5-6]對上界未知干擾進行估計或補償,設(shè)計自適應(yīng)姿態(tài)跟蹤控制器,解決了航天器姿態(tài)控制系統(tǒng)中存在未知參數(shù)攝動的問題。但這些自適應(yīng)姿態(tài)控制器在設(shè)計過程中,并沒有考慮角速度有界的約束問題,且控制器結(jié)構(gòu)較為復雜,無形中會增加航天器的故障率。因此,考慮角速度有界約束和簡化控制器結(jié)構(gòu),提升姿態(tài)控制器的魯棒性是本文的主要研究目的。
航天器角速度有界約束是當前學者關(guān)注的熱點問題[7-9]。為滿足角速度有界約束,學者主要采用障礙李雅普諾夫函數(shù)設(shè)計姿態(tài)控制器,但仿真結(jié)果顯示,該控制器下的航天器角速度會不斷振蕩,影響航天器姿態(tài)收斂的動態(tài)品質(zhì)。為解決角速度收斂震蕩的問題,本文將通過規(guī)劃角速度變化軌跡,使角速度平滑收斂到0,提升姿態(tài)收斂的動態(tài)品質(zhì)。
反演控制具有設(shè)計便利的優(yōu)勢,本文對反演控制進行簡化,根據(jù)航天器姿態(tài)控制系統(tǒng)的特點,給出一種雙環(huán)跟蹤控制策略。為提升控制器的魯棒性,將極限學習機逼近技術(shù)和滑??刂萍夹g(shù)用于雙環(huán)姿態(tài)跟蹤控制器的設(shè)計中。在雙環(huán)跟蹤控制過程中,最關(guān)鍵的問題是要求實際角速度在有限時間內(nèi)精確跟蹤上預(yù)設(shè)虛擬角速度,因此將有限時間控制用于本文姿態(tài)跟蹤控制器的設(shè)計。終端滑??刂埔蚓哂休^好的魯棒性和抗干擾性,被廣泛應(yīng)用于非線性系統(tǒng)的有限時間控制器設(shè)計中[10]。本文將構(gòu)建一個基于角速度跟蹤誤差的非奇異終端滑模面,使角速度跟蹤誤差在有限時間內(nèi)收斂到0。設(shè)計極限學習機逼近未知攝動部分,構(gòu)造自適應(yīng)姿態(tài)控制器,最終實現(xiàn)整個閉環(huán)系統(tǒng)的漸近穩(wěn)定性。該控制策略解決了航天器角速度有界的約束問題,簡化了控制器結(jié)構(gòu),使航天器對參數(shù)攝動和外部干擾具有較強的魯棒性,保證航天器的姿態(tài)收斂軌跡具有較優(yōu)的動態(tài)品質(zhì)。
基于單位四元數(shù){q0,q}={q0,q1,q2,q3}的航天器姿態(tài)運動學方程為
(1)
考慮外部干擾的姿態(tài)動力學方程為:
(2)
式中,J=JΤ∈R3×3為轉(zhuǎn)動慣量陣,設(shè)J0為名義轉(zhuǎn)動慣量,ΔJ為轉(zhuǎn)動慣量攝動量,則J=J0+ΔJ。d∈R3為干擾力矩;u∈R3為控制力矩;ω×為ω=[ω1,ω2,ω3]Τ的反對稱矩陣
(3)
q(t)→0,ω(t)→0
(4)
在設(shè)計控制器前,先給出如下引理。
引理1[12]:如果存在正定Lyapunov函數(shù)及參數(shù)λ1>0,λ2>0和0<α<1滿足:
(5)
則系統(tǒng)狀態(tài)能夠在有限時間內(nèi)到達原點,且到達時間為:
(6)
機器學習方法能有效提升擬合精度,結(jié)合實際的生物習性等,學者提出了一系列的機器學習方法,早期的機器學習方法有人工神經(jīng)網(wǎng)絡(luò)(BP),支持向量機(SVM),但是實際工程應(yīng)用中發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)計算復雜,SVM擬合速度很慢,而基于神經(jīng)網(wǎng)絡(luò)提出的極限學習機(Extreme Learning Machine ,ELM)通過隨機產(chǎn)生隱層結(jié)點參數(shù),再利用計算的外權(quán)決定輸出,大大簡化了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)復雜的迭代過程,在保證高精度擬合的基礎(chǔ)上降低了外權(quán)的運算量[14]。下面給出極限學習機的建模原理。
(7)
其中,ai=[ai1,ai2,…,ain]Τ∈Rn是第i個隱含層結(jié)點連接所有n個輸入結(jié)點的連接權(quán)重向量;wi=[wi1,wi2,…,wim]Τ∈Rm是第i個隱含結(jié)點連接所有m個輸出結(jié)點的連接權(quán)重向量,其中ai·xj表示向量ai和向量xj的內(nèi)積。
經(jīng)過對N個樣本的不斷學習則有如下線性矩陣方程成立:
HW=Y
(8)
其中,
H一般稱為神經(jīng)網(wǎng)絡(luò)隱含層輸出矩陣,其中H的第i個列是第i個關(guān)于輸入x1,x2,…,xN的隱含層結(jié)點輸出。
雙環(huán)姿態(tài)跟蹤控制器的結(jié)構(gòu)圖如圖1。其主要思想是將航天器姿態(tài)動力學系統(tǒng)(1)和(2)分解為2個獨立的子系統(tǒng)—內(nèi)環(huán)和外環(huán)。將子系統(tǒng)(1)中的ω看作輸入,設(shè)計虛擬控制器ωv,使子系統(tǒng)(1)跟蹤上期望姿態(tài)qd。再將ωv看作子系統(tǒng)(2)的期望軌跡,設(shè)計控制器u,使子系統(tǒng)(2)在有限時間內(nèi)精確跟蹤上ωv,形成有限時間雙環(huán)跟蹤控制策略。
為滿足航天器角速度有界的物理限制,提升姿態(tài)收斂速度,對子系統(tǒng)(1)設(shè)計虛擬角速度:
ωv=-ωTtanh(k1q)
(9)
式中,ωT>0為ωv的最大允許值;tanh(·)為雙曲正切函數(shù),常數(shù)k1>0。
設(shè)Lyapunov函數(shù)V1(q)=(q0-1)2+qΤq,則
(10)
將式(1)中的ω用ωv代替,有
(11)
根據(jù)Lyapuno穩(wěn)定性理論容易推出,當t→∞時,q0→1,q→0。
下面設(shè)計控制器u使ω有限時間內(nèi)跟蹤上ωv。定義實際角速度ω與虛擬角速度ωv的跟蹤誤差 :
e=ω-ωv
(12)
圖1 自適應(yīng)雙環(huán)跟蹤控制結(jié)構(gòu)圖
定義非奇異終端滑模面為:
(13)
定理1: 考慮動力學系統(tǒng)(2),則由式(12)和(13)確定的非奇異終端滑模面滿足σ=0時,系統(tǒng)能夠在有限時間內(nèi)收斂于{e≡0}。
(14)
(15)
下面基于滑模面(13)設(shè)計姿態(tài)控制器。
(16)
(17)
(18)
設(shè)計非奇異終端滑模雙環(huán)跟蹤自適應(yīng)姿態(tài)控制器和自適應(yīng)更新律為:
(19)
(20)
(21)
定理2:針對存在外部干擾的航天器動力學系統(tǒng)式(2),姿態(tài)控制器式(19)和自適應(yīng)律式(20)和(21)能保證系統(tǒng)式(2)漸近收斂到滑模面σ=0。
綜合以上分析,可得到如下定理。
定理3: 航天器姿態(tài)動力學系統(tǒng)式(1)和(2)在姿態(tài)控制器式(19)和自適應(yīng)律式(20)和(21)下全局漸近穩(wěn)定,且當t→∞時,q(t)→0,ω(t)→0。
該證明過程同文獻[15]。
注:當采用反演控制設(shè)計控制器時,需要構(gòu)建Lyapunov函數(shù)V5=V1+V4,反演控制器為
(22)
式(22)比式(19)多了一項σ(σσΤ)-1(qΤe)。通過該項可以得到,在滑模面上時,控制力矩將達到∞。
航天器在完成對非合作目標的抓捕過程中,其轉(zhuǎn)動慣量會從初始轉(zhuǎn)動慣量J0開始,產(chǎn)生非線性攝動。其中攝動量ΔJ的變化特性可表示為[15]:
(23)
其中:λ1(t)為機械臂伸展過程中轉(zhuǎn)動慣量增長速度。λ2為抓捕非合作目標后轉(zhuǎn)動慣量突增比例,實際抓捕過程中,該參數(shù)未知,但有界。λ3(t)為機械臂回收過程中轉(zhuǎn)動慣量遞減速度。T0和T1分別為抓捕目標時間和完成機械臂回收時間。
外部干擾d為(單位:N·m,ωΔ=0.1)
式中,3rectpuls(t-T0,0.1)表示航天器在抓捕非合作目標瞬間,受到非合作目標的反帶動,會產(chǎn)生一個持續(xù)0.1s的瞬間方波強干擾。
采用ELM逼近中,隱層節(jié)點個數(shù)為6,激活函數(shù)為
仿真時間為80s,仿真參數(shù)見表1。
圖2~5分別為航天器姿態(tài)角變化曲線、控制力矩曲線、實際角速度與預(yù)設(shè)虛擬角速度的變化曲線及滑模面的變化曲線。
圖2顯示,基于非奇異終端滑模雙環(huán)跟蹤姿態(tài)控制器,航天器的姿態(tài)角呈指數(shù)收斂到0。在第20s抓捕非合作目標的瞬間,被控系統(tǒng)出現(xiàn)0.1s的方波瞬態(tài)強干擾下,圖3中的控制力矩有一個相對較大的波動,圖5中的滑模面也在第20s有個突變,但姿態(tài)收斂軌跡沒有發(fā)生任何改變,說明本文控制器能使抓捕航天器的姿態(tài)快速穩(wěn)定,具有較強的魯棒性和抗強干擾能力。
表1 航天器仿真參數(shù)
圖2 姿態(tài)角變化趨勢
圖3 控制力矩變化曲線
圖4 ω和ωv軌跡曲線
圖5 滑模面的軌跡
對存在轉(zhuǎn)動慣量攝動、外部干擾和角速度有界約束的航天器姿態(tài)控制,給出了一種有限時間雙環(huán)跟蹤控制策略。
1)先對運動學方程預(yù)設(shè)有界虛擬角速度,并將該虛擬角速度作為動力學方程的期望軌跡,設(shè)計姿態(tài)控制器,使動力學方程的角速度輸出在有限時間內(nèi)精確跟蹤上預(yù)設(shè)虛擬角速度,并按照虛擬角速度軌跡收斂到0,滿足了航天器對角速度有界的物理約束;
2)構(gòu)建了非奇異終端滑模面,當跟蹤誤差到達滑模面,其能在有限時間內(nèi)收斂到0。基于非奇異終端滑模面設(shè)計了魯棒姿態(tài)控制器,使實際角速度在有限時間內(nèi)精確跟蹤上期望角速度;
3)采用極限學習機技術(shù)對含未知轉(zhuǎn)動慣量的部分進行逼近,設(shè)計自適應(yīng)律估計逼近誤差和外部環(huán)境干擾構(gòu)成的復合干擾,增強了姿態(tài)控制器的魯棒性,擴大了該控制器的使用范圍。實際仿真結(jié)果顯示,對瞬間產(chǎn)生的外部強干擾,該控制器也具有較好的控制效果。