羅建軍,韓 楠,柴 源
(1. 西北工業(yè)大學(xué) 航天學(xué)院·西安·710072;2. 西北工業(yè)大學(xué) 航天飛行動力學(xué)技術(shù)重點實驗室·西安·710072)
對失效航天器進行姿態(tài)接管控制提供一種回收和利用其上高價值有效載荷的方法,近年來得到了廣泛的關(guān)注[1]??臻g機器人與微小衛(wèi)星提供了兩種不同的實施失效航天器接管控制的方法??臻g機器人的控制效率高,能夠在較短時間內(nèi)滿足失效航天器的接管控制要求,但其研制成本高,任務(wù)設(shè)計復(fù)雜,且不適合于長期實施對失效航天器的接管控制。微小衛(wèi)星具有研制周期短、發(fā)射成本低、任務(wù)設(shè)計簡單的優(yōu)點[2],且能夠通過與失效航天器形成組合體的方式,為失效航天器提供所需的控制力矩,以實現(xiàn)對失效航天器長期的姿態(tài)接管控制。近年來,國外航天機構(gòu)提出了包括鳳凰計劃、iBOSS項目等在內(nèi)的模塊化航天器設(shè)計概念。未來,基于模塊化設(shè)計的在軌組裝航天器將具有適合于標準化設(shè)計的微小衛(wèi)星對接接口。因此,微小衛(wèi)星將能夠為失效航天器的在軌服務(wù)與接管控制問題提供一種低成本、低復(fù)雜度的解決途徑。
為了實現(xiàn)失效航天器的姿態(tài)接管控制,多顆微小衛(wèi)星需要通過互相協(xié)同的方式,提供失效航天器姿態(tài)運動所需的控制力矩。目前,面向單個大型航天器的姿態(tài)控制問題已有很多研究[3-6],其基本思路是先設(shè)計航天器的姿態(tài)控制器,并根據(jù)設(shè)計的姿態(tài)控制器來計算航天器姿態(tài)機動所需的控制力矩,最后將計算獲得的控制力矩分配到航天器平臺的多個執(zhí)行機構(gòu)上。基于這一思想,文獻[7]面向多顆微小衛(wèi)星接管控制失效航天器姿態(tài)運動的問題,提出了一種辨識控制一體化的設(shè)計方法,實現(xiàn)了在慣量參數(shù)不確定情況下的失效航天器姿態(tài)接管控制,但是該方法需要集中進行控制解算與分配,因而其容錯性不足。文獻[8]面向空間細胞機器人實施接管控制的問題,提出了一種分布式控制分配方法。其中,各細胞機器人通過自由拍賣和一致性協(xié)商實現(xiàn)了控制任務(wù)的分配,但文中沒有考慮細胞機器人的控制約束問題。由于將姿態(tài)控制器設(shè)計與控制分配相結(jié)合的接管控制方法在每一時刻都要進行控制指令的分配,因此,接管控制任務(wù)在每一時刻都需要較大的計算量,設(shè)計一種能夠避免控制分配的接管控制方法,將能夠有效降低任務(wù)執(zhí)行過程中的計算負擔。
博弈論研究多參與者的最優(yōu)決策問題,其中每一位參與者通過局部目標函數(shù)的優(yōu)化獲得控制策略[9]。通過合理設(shè)計博弈參與者的目標函數(shù),可以在盡可能最大化參與者收益的情況下、通過各參與者的博弈決策完成博弈活動事先設(shè)定的全局目標。近年來,博弈控制方法在越來越多的實際工程問題研究中得到了關(guān)注和應(yīng)用。文獻[10]研究了無人機編隊飛行的博弈控制方法。其中,各無人機通過獨立優(yōu)化經(jīng)過合理設(shè)計的目標函數(shù)來進行自主協(xié)同控制,實現(xiàn)了考慮燃料均衡的編隊飛行。在文獻[11]中,多智能體通過獨立進行目標函數(shù)的優(yōu)化并獲得控制策略,以非合作博弈的方式實現(xiàn)了碰撞規(guī)避。文獻[12]通過博弈控制方法研究了無人機自主防碰撞的控制問題。文獻[13]將博弈控制方法應(yīng)用到了多智能體一致性問題的研究中。面向多顆微小衛(wèi)星接管控制失效航天器姿態(tài)運動的問題,文獻[14]設(shè)計了多顆微小衛(wèi)星的微分博弈控制器。其中,各微小衛(wèi)星通過獨立進行局部目標函數(shù)優(yōu)化的方式獲得了各自的控制策略,能夠在避免進行控制分配且盡可能使自身能量消耗最優(yōu)的情況下實現(xiàn)對失效航天器的姿態(tài)接管控制。然而,由于各微小衛(wèi)星僅追求自身局部目標函數(shù)的最優(yōu)化,未能實現(xiàn)全局意義下的能量消耗最優(yōu)。為盡可能減少執(zhí)行姿態(tài)接管控制任務(wù)的微小衛(wèi)星的整體能量消耗,本文研究了多顆微小衛(wèi)星的合作博弈控制方法,并通過求解多顆微小衛(wèi)星合作博弈的帕累托最優(yōu)策略,進行了失效航天器的姿態(tài)接管控制。
本文的組織結(jié)構(gòu)如下:第一節(jié)介紹了微小衛(wèi)星合作博弈控制器的設(shè)計思路;第二節(jié)設(shè)計了能夠?qū)崿F(xiàn)失效航天器姿態(tài)接管控制的微小衛(wèi)星局部目標函數(shù),并在考慮組合體動力學(xué)約束、微小衛(wèi)星控制約束的基礎(chǔ)上建立了多顆微小衛(wèi)星的合作博弈模型;第三節(jié)在考慮失效航天器跟蹤時變期望姿態(tài)軌跡的情況下,研究了微小衛(wèi)星合作博弈帕累托最優(yōu)策略的求解問題;第四節(jié)通過數(shù)值仿真驗證了微小衛(wèi)星合作博弈控制方法的有效性;第五節(jié)給出了本文的結(jié)論。
本文面向多顆微小衛(wèi)星接管失效航天器姿態(tài)運動的控制問題,試圖提出一種基于多顆微小衛(wèi)星合作博弈的協(xié)同控制方法。
首先,面向失效航天器姿態(tài)接管控制任務(wù)的需求,設(shè)計能夠使失效航天器跟蹤期望姿態(tài)軌跡的微小衛(wèi)星的局部目標函數(shù)
(1)
在式(1)中,tf為失效航天器姿態(tài)接管控制任務(wù)的終端時刻;xe為系統(tǒng)誤差姿態(tài)狀態(tài)量,其具體含義將在下文中給出;ui為微小衛(wèi)星i的控制量;Qi>0、Ri>0均為對稱矩陣。
(2)
最后,通過構(gòu)建由組合體誤差姿態(tài)狀態(tài)量與期望姿態(tài)狀態(tài)量相對于時間導(dǎo)數(shù)所構(gòu)成的增廣姿態(tài)運動方程,將失效航天器跟蹤期望姿態(tài)軌跡的任務(wù)要求轉(zhuǎn)化為合作博弈控制優(yōu)化問題中的動力學(xué)約束問題,并通過約束優(yōu)化問題的求解獲得各顆微小衛(wèi)星的合作博弈控制策略,以在盡可能優(yōu)化微小衛(wèi)星整體能量消耗的前提下實現(xiàn)對失效航天器姿態(tài)運動的接管控制。
失效航天器姿態(tài)接管控制過程會受到組合體的動力學(xué)約束及微小衛(wèi)星控制約束。本節(jié)先給出組合體的動力學(xué)約束,之后建立考慮約束的微小衛(wèi)星的合作博弈模型。
動力學(xué)約束由組合體的姿態(tài)運動方程給出。本文通過修正羅德里格斯參數(shù)(Modified Rodrigues Parameters,MRPs)來描述組合體的姿態(tài)運動,相應(yīng)的姿態(tài)運動學(xué)方程為
(3)
在式(3)中,σ∈R3為組合體的姿態(tài)MRPs,ω∈R3為組合體的姿態(tài)角速度,且有
(4)
組合體姿態(tài)機動所需的控制力矩完全由微小衛(wèi)星提供,因此,組合體的姿態(tài)動力學(xué)方程為
(5)
在式(5)中,J∈R3×3為組合體的轉(zhuǎn)動慣量矩陣;Cj∈R3×3為微小衛(wèi)星j本體坐標系Ojxjyjzj(j∈N)到參考坐標系Oxyz的轉(zhuǎn)換矩陣;Oj為微小衛(wèi)星j的質(zhì)心;xj、yj、zj分別為微小衛(wèi)星j的3個體軸。本文選取微小衛(wèi)星1的本體坐標系為參考坐標系。uj∈R3為微小衛(wèi)星j的控制力矩。
根據(jù)組合體的姿態(tài)運動學(xué)方程和姿態(tài)動力學(xué)方程,可得組合體的姿態(tài)運動模型為
(6)
在式(6)中,x=[σT,ωT]T∈R6,且有
(7)
式(6)即為組合體動力學(xué)約束的表達式。
任何一個博弈活動都由以下3個要素構(gòu)成:博弈參與者N:={1,2,…,N}、各參與者容許策略集Ui、各參與者局部目標函數(shù)Ji[15]。為滿足失效航天器跟蹤期望姿態(tài)軌跡的任務(wù)要求,可設(shè)計如下的參與者(微小衛(wèi)星)局部目標函數(shù)
(8)
當參與者進行非合作博弈時,便通過獨立優(yōu)化式(8)中的局部目標函數(shù)來獲得控制策略。然而,由于非合作博弈難以實現(xiàn)全局意義下的目標函數(shù)最優(yōu),本文采用多顆微小衛(wèi)星的合作博弈來進行失效航天器的姿態(tài)接管控制。
帕累托最優(yōu)策略是一種典型的合作博弈最優(yōu)策略,本文通過求解微小衛(wèi)星合作博弈的帕累托最優(yōu)策略來進行失效航天器的姿態(tài)接管控制。帕累托最優(yōu)策略的定義如下:
(9)
在式(9)中,Ui為微小衛(wèi)星i的容許控制策略集。
帕累托最優(yōu)策略為這樣一個解,即任意的策略改變至少會使1位參與者的局部目標函數(shù)受到損失。
為求得微小衛(wèi)星合作博弈的帕累托最優(yōu),考慮如下的各顆微小衛(wèi)星局部目標函數(shù)的加權(quán)組合量
(10)
通過優(yōu)化式(10)給出的微小衛(wèi)星局部目標函數(shù)的加權(quán)組合量,便可獲得微小衛(wèi)星合作博弈的帕累托最優(yōu)策略,并實現(xiàn)對失效航天器的姿態(tài)接管控制。
根據(jù)上述分析,可將失效航天器的姿態(tài)接管控制問題描述為如下的多顆微小衛(wèi)星的合作博弈問題
(11)
求解上述優(yōu)化問題,便能獲得N顆微小衛(wèi)星的帕累托最優(yōu)策略,以實現(xiàn)N顆微小衛(wèi)星的合作博弈。
失效航天器的姿態(tài)接管控制可分為姿態(tài)調(diào)節(jié)控制與姿態(tài)跟蹤控制。姿態(tài)調(diào)節(jié)可認為是姿態(tài)跟蹤的一種特例,即期望姿態(tài)軌跡始終保持為0。組合體的姿態(tài)運動模型本身具有較強的非線性,這使得微小衛(wèi)星的合作博弈控制策略十分難以求解。此外,當失效航天器需要跟蹤的姿態(tài)軌跡時變性較強時,微小衛(wèi)星合作博弈的帕累托最優(yōu)策略的求解難度將進一步增加。為此,本節(jié)首先給出了組合體的誤差姿態(tài)運動方程,之后在合理設(shè)計組合體期望姿態(tài)軌跡的基礎(chǔ)上,構(gòu)造了由誤差姿態(tài)狀態(tài)量與期望姿態(tài)狀態(tài)量相對于時間導(dǎo)數(shù)所構(gòu)成的增廣姿態(tài)運動方程,最后在考慮組合體動力學(xué)約束及微小衛(wèi)星控制約束的前提下,研究了能夠?qū)崿F(xiàn)失效航天器跟蹤時變期望姿態(tài)軌跡的微小衛(wèi)星合作博弈控制問題。
令σe和ωe分別表示組合體的誤差MRPs和誤差角速度。根據(jù)文獻[17],有
(12)
誤差MRPs相對于時間的導(dǎo)數(shù)為[17]
(13)
誤差角速度為
ωe=ω-ωd
(14)
誤差角速度相對于時間的導(dǎo)數(shù)為
(15)
為了進行組合體增廣姿態(tài)運動方程的構(gòu)造,將期望姿態(tài)狀態(tài)的導(dǎo)數(shù)設(shè)計為期望姿態(tài)狀態(tài)的函數(shù),即
(16)
根據(jù)式(3),期望MRPs相對于時間的導(dǎo)數(shù)為
(17)
記
(18)
(19)
在式(19中)
(20)
由于在跟蹤時變姿態(tài)軌跡的任務(wù)中,僅要求控制xe至0,因此在微小衛(wèi)星局部目標函數(shù)中不引入xd,其局部目標函數(shù)的加權(quán)組合量為
(21)
根據(jù)式(21),可得如下的非線性約束優(yōu)化問題
(22)
式(22)給出了能夠滿足失效航天器跟蹤期望姿態(tài)軌跡任務(wù)要求的微小衛(wèi)星合作博弈帕累托最優(yōu)策略的求解框架。通過求解式(22)給出的約束優(yōu)化問題,便可在不需要進行微小衛(wèi)星控制分配的情況下直接得到能夠?qū)崿F(xiàn)失效航天器姿態(tài)接管控制的各顆微小衛(wèi)星的合作博弈控制策略。
本節(jié)通過2組數(shù)值仿真算例驗證了將微小衛(wèi)星合作博弈控制方法應(yīng)用于失效航天器姿態(tài)接管控制問題的有效性。假設(shè)有4顆微小衛(wèi)星進行失效航天器的姿態(tài)接管控制,其各自本體坐標系到參考坐標系的轉(zhuǎn)換矩陣分別為
組合體轉(zhuǎn)動慣量矩陣為
算例1假設(shè)期望軌跡為xd=[0,0,0,0,0,0]T,此時失效航天器跟蹤期望姿態(tài)軌跡的接管控制問題變?yōu)榱俗藨B(tài)調(diào)節(jié)問題。
假設(shè)組合體的初始MRPs為σ0=[0.2787,0.2036,0.7508]T,初始角速度為ω0=[0,0,0]T。選擇微小衛(wèi)星局部目標函數(shù)中的矩陣為:Q1=Q2=Q3=Q4=I6,R1=R2=R3=R4=0.2I3。全局目標函數(shù)中的可調(diào)系數(shù)為α1=α2=α3=α4=0.25。控制幅值為umax=0.5N·m,控制時長為tf=100s。
圖1和圖2分別為失效航天器姿態(tài)接管控制過程中組合體姿態(tài)MRPs和姿態(tài)角速度的變化曲線。由圖1、圖2可以看出,采用本文的合作博弈控制方法,多顆微小衛(wèi)星通過合作博弈實現(xiàn)了失效航天器的姿態(tài)鎮(zhèn)定。
圖3給出了4顆微小衛(wèi)星的控制力矩,其中綠色的虛線代表控制幅值約束。從圖3可以看出,在整個姿態(tài)接管控制過程中,各顆微小衛(wèi)星的控制力矩始終滿足控制約束要求,且隨組合體的姿態(tài)狀態(tài)量逐漸逼近期望姿態(tài)狀態(tài)xd,各顆微小衛(wèi)星的控制力矩逐漸趨于0。
圖1 組合體姿態(tài)MRPs隨時間的變化曲線Fig.1 Attitude MRPs trajectories of combination
圖2 組合體姿態(tài)角速度隨時間的變化曲線Fig.2 Attitude angular velocity trajectories of combination
圖3 微小衛(wèi)星控制力矩隨時間的變化曲線Fig.3 Control torques of microsatellites
算例2假設(shè)失效航天器的姿態(tài)角速度需要跟蹤如下的期望軌跡
(23)
則期望角加速度為
(24)
其中
期望MRPs的初值為σd0=[0,0,0]T,給定期望角速度式(23),期望MRPs軌跡可由式(17)得到。
假設(shè)組合體的初始MRPs為σ0=[0,0,0]T,初始角速度為ω0=[0,0,0]T。選擇微小衛(wèi)星局部目標函數(shù)中的矩陣為:Q1=Q2=Q3=Q4=400I6,R1=R2=R3=R4=0.2I3。全局目標函數(shù)中的可調(diào)系數(shù)為α1=α2=α3=α4=0.25??刂品禐閡max=0.5N·m,控制時長為tf=1000s。
圖4和圖5分別給出了組合體誤差和期望MRPs隨時間的變化曲線,可以看出通過文中的合作博弈控制方法,組合體的誤差MRPs在初始20s內(nèi)發(fā)生輕微變化后很快趨近于0。在圖4中,誤差MRPs在姿態(tài)接管控制任務(wù)剛開始時發(fā)生輕微變化的原因是在初始時刻,組合體的實際角速度ω0與期望角速度ωd0(ωd0=[0,0.05,0]Trad/s)不一致。為跟上期望角速度,組合體的姿態(tài)角偏離了σ0=[0,0,0]T。圖6給出了組合體姿態(tài)MRPs隨時間的變化曲線,其中綠色的虛線表示期望姿態(tài)MRPs軌跡。從圖6可以看出,失效航天器在整個姿態(tài)接管控制過程中都較好地沿著期望MRPs的軌跡運動。圖7和圖8分別給出了誤差和期望姿態(tài)角速度隨時間的變化曲線??梢钥闯?,通過文中的合作博弈控制方法,組合體的誤差姿態(tài)角速度很快趨近于0。圖9給出了組合體姿態(tài)角速度隨時間的變化曲線,其中綠色的虛線表示期望姿態(tài)角速度軌跡,可以看出在整個姿態(tài)接管控制過程中,失效航天器都較好地沿著期望的姿態(tài)角速度軌跡運動。以上分析表明,多顆微小衛(wèi)星采用合作博弈控制實現(xiàn)了失效航天器對期望姿態(tài)運動軌跡的跟蹤。
圖10給出了4顆微小衛(wèi)星的控制力矩隨時間的變化曲線。可以看出,為實現(xiàn)對期望姿態(tài)角速度軌跡的跟蹤,在整個姿態(tài)接管控制過程中,各顆微小衛(wèi)星都需要持續(xù)不斷地為失效航天器提供控制力矩,但4顆微小衛(wèi)星的控制力矩需始終滿足控制約束的要求。
圖4 組合體誤差MRPs隨時間的變化曲線Fig.4 Error MRPs trajectories of combination
圖5 組合體期望MRPs隨時間的變化曲線Fig.5 Desired MRPs trajectories of combination
圖6 組合體MRPs隨時間的變化曲線Fig.6 MRPs trajectories of combination
圖7 組合體誤差角速度隨時間的變化曲線Fig.7 Error angular velocity trajectories of combination
圖8 組合體期望角速度隨時間的變化曲線Fig.8 Desired angular velocity trajectories of combination
圖9 組合體角速度隨時間的變化曲線Fig.9 Angular velocity trajectories of combination
圖10 微小衛(wèi)星控制力矩隨時間的變化曲線Fig.10 Control torques of microsatellites
本文針對多顆微小衛(wèi)星協(xié)同完成失效航天器姿態(tài)接管的控制問題,通過合作博弈方法設(shè)計了微小衛(wèi)星的協(xié)同控制器。文中面向失效航天器跟蹤時變姿態(tài)軌跡的任務(wù)要求,合理設(shè)計了微小衛(wèi)星的局部目標函數(shù),并在考慮組合體動力學(xué)約束及微小衛(wèi)星控制約束的情況下,通過優(yōu)化多顆微小衛(wèi)星局部目標函數(shù)的加權(quán)組合量,實現(xiàn)了對微小衛(wèi)星合作博弈的數(shù)學(xué)描述。通過將失效航天器跟蹤時變姿態(tài)軌跡的任務(wù)要求轉(zhuǎn)化為1組由增廣姿態(tài)運動方程描述的約束條件,得到了能夠?qū)崿F(xiàn)失效航天器跟蹤期望姿態(tài)軌跡的微小衛(wèi)星合作博弈問題的求解框架,從而能夠在不需要進行控制分配的情況下實現(xiàn)失效航天器的姿態(tài)接管控制。數(shù)值仿真驗證了本文設(shè)計的微小衛(wèi)星合作博弈控制方法的有效性。本文未考慮微小衛(wèi)星的能量均衡問題,后續(xù)研究將進一步考慮能夠?qū)崿F(xiàn)微小衛(wèi)星能量均衡的博弈控制問題。