胡慶雷,邵小東,楊昊旸,段超
1. 北京航空航天大學(xué) 自動化科學(xué)與電氣工程學(xué)院,北京 100191 2. 北京航空航天大學(xué) 杭州創(chuàng)新研究院(余杭),杭州 311100 3. 北京航空航天大學(xué) 航空科學(xué)與工程學(xué)院,北京 100191
姿態(tài)控制系統(tǒng)作為航天器最為重要的分系統(tǒng)之一,是航天器實現(xiàn)高精度高穩(wěn)定度姿態(tài)調(diào)整的保障,對空間任務(wù)的順利實施尤為關(guān)鍵。航天器的姿態(tài)控制系統(tǒng)主要由以下4部分組成[3]:測量單元、規(guī)劃單元、控制單元和執(zhí)行機構(gòu),如圖1所示。測量單元利用星載姿態(tài)和角速度測量敏感器(如星敏感器、速率陀螺等)實時監(jiān)測航天器運動信息并反饋給規(guī)劃和控制單元,規(guī)劃單元則根據(jù)航天任務(wù)需求規(guī)劃出任務(wù)軌跡并生成相應(yīng)的控制指令,隨后控制環(huán)節(jié)根據(jù)這些指令輸出控制信號,通過驅(qū)動執(zhí)行機構(gòu)實現(xiàn)航天器穩(wěn)定飛行或跟蹤制導(dǎo)指令。強自主、高可靠、高精度的姿態(tài)規(guī)劃與控制技術(shù)是保證航天器在復(fù)雜空間環(huán)境下穩(wěn)定可靠運行并安全實施空間任務(wù)的關(guān)鍵。
航天器在軌執(zhí)行姿態(tài)機動時往往會面臨復(fù)雜的約束,本文將這些約束分為 4 大類。第 1 類為狀態(tài)約束,主要包括空間指向約束和角速度約束[4-5],而且空間指向約束又細分為禁止指向約束和強制指向約束[6]。禁止指向約束源于星載光學(xué)敏感載荷(如紅外望遠鏡、激光干涉儀等)應(yīng)避免直接指向太陽、月亮等光亮目標,以防止光線影響觀測[7]。例如,紅外天文學(xué)衛(wèi)星(Infrared Astronomical Satellite, IRAS)要求搭載的紅外望遠鏡的指向與太陽方向的夾角不小于60°以防止光線直射,使其能夠工作在紅外觀測所需的低溫環(huán)境下。JWST、Hubble 望遠鏡、紅外空間天文臺(Infrared Space Observatory, ISO)以及 Cassini 號深空探測器也都存在類似的禁止指向約束[8]。強制指向約束的場景是承擔中繼通信、深空探測和編隊飛行等任務(wù)的航天器需要保持天線對準地面站或鄰居航天器,以穩(wěn)定地維持通信鏈路[9]。角速度約束源于速率陀螺、星敏感器等角速度傳感器的量程有限,要求航天器的角速度必須維持在特定的范圍內(nèi),例如美國的 X 射線計時探測器(X-ray Timing Explorer, XTE)[10]。第 2 類為物理約束,包括執(zhí)行機構(gòu)輸出幅值和速率約束,主要源于反作用飛輪、控制力矩陀螺等姿控執(zhí)行機構(gòu)的有限輸出能力[11]。第 3 類為任務(wù)性能約束,包括時間和能耗約束,其中時間約束主要是由任務(wù)時間窗口造成的[12],而能耗約束則是源于航天器所攜帶的工質(zhì)燃料有限,且其所配備的電能生產(chǎn)和存儲設(shè)備有限[13]。規(guī)劃環(huán)節(jié)需要重點考慮前述 3 類約束。第 4 類為廣義約束,主要包括參數(shù)不確定性、多源干擾、執(zhí)行機構(gòu)故障、暫穩(wěn)態(tài)性能以及測量信息不完備等,這些約束都嚴重影響了航天器安全、姿態(tài)控制精度及穩(wěn)定度,在姿態(tài)控制器設(shè)計中需要對這些約束進行考慮,才能從穩(wěn)定性和安全性角度保證航天器姿態(tài)控制系統(tǒng)的正常工作。綜上所述,研究復(fù)雜約束下的航天器姿態(tài)規(guī)劃與控制新理論與新方法,是當前航天器控制領(lǐng)域的前沿?zé)狳c方向,已成為進一步提升航天器智能自主性、安全可靠性和任務(wù)執(zhí)行能力的核心關(guān)鍵,具有重要的現(xiàn)實意義。
本文基于課題組前期研究成果,并參閱國內(nèi)外知名團隊和學(xué)者的部分代表性工作,總結(jié)和梳理了現(xiàn)有航天器多約束姿態(tài)規(guī)劃與控制方法的研究思路和優(yōu)缺點,并給出了未來發(fā)展建議,希望對從事相關(guān)研究的同行學(xué)者和工程人員提供一定的參考。航天器多約束姿態(tài)規(guī)劃與控制技術(shù)經(jīng)過20多年的發(fā)展,算法研究仍方興未艾,尤其是結(jié)合人工智能等前沿技術(shù)的新成果近年來更是層出不窮,論文未能提及之處,敬請諒解。
正如引言中所分析,在航天器執(zhí)行在軌任務(wù)的過程中,姿態(tài)系統(tǒng)面臨著多種約束。在針對這些約束設(shè)計安全的規(guī)劃和控制算法之前,需要首先針對這些約束進行分析并利用適當?shù)臄?shù)學(xué)表達式來刻畫。本節(jié)將對狀態(tài)約束、物理約束、任務(wù)性能約束以及廣義約束進行分析與表征。其中前 3 類約束主要面向姿態(tài)規(guī)劃算法設(shè)計,而廣義約束則主要是面向姿態(tài)控制器設(shè)計。
1.1.1 空間指向約束
在軌飛行任務(wù)中,由于星上載荷保護和通信保障等原因,航天器的姿態(tài)將受限于特定的指向空間中,這使得航天器姿態(tài)機動路徑的可行空間大大減小,因此分析姿態(tài)指向約束的形成原理及其分類具有重要的實際工程指導(dǎo)意義。本文所考慮的指向約束可以分為 2 大類[6]:禁止指向約束和強制指向約束。
1) 禁止指向約束
(1)
(2)
(3)
(4)
(5)
2) 強制指向約束
(6)
同樣的,也可以用修正羅德里格斯參數(shù)和單位四元數(shù)的形式表述:
(7)
qTMfq≤0
(8)
上述對于指向約束的描述是以傳感器視線場約束為圓錐體,而實際的傳感器視線場約束區(qū)有可能為臺體等形狀,對于這一類多面體的約束在工程上也往往以其外包絡(luò)圓錐(或內(nèi)切圓錐)進行描述以便于實現(xiàn)。
本節(jié)的分類是根據(jù)約束區(qū)域的進入和逃出劃分的,除此之外還可以根據(jù)約束區(qū)域的時變性分為動態(tài)指向約束和靜態(tài)指向約束。而且還可根據(jù)約束所承受的嚴格程度分為硬約束和軟約束,前者是在全過程中都要滿足的約束,而后者則為時間積分約束,當其積分值小于某個指標值時不產(chǎn)生約束效果,當大于指標值時,該約束轉(zhuǎn)變?yōu)橛布s束。在一些復(fù)雜的任務(wù)場景中,上述2種約束可能同時存在,且往往是動靜、軟硬并存的,這種更為復(fù)雜的約束情況會給航天器的規(guī)劃與控制系統(tǒng)帶來了更大的挑戰(zhàn)。
1.1.2 角速度約束
以光纖陀螺為代表的角速度測量儀器,往往存在著測量范圍的限制[10],因此需要保證航天器的角速度ω=[ω1,ω2,ω3]T∈3的3個分量都需要在量程范圍ωR內(nèi),數(shù)學(xué)表示為
|ωi|≤ωRi=1,2,3
(9)
對于以星敏感器為代表的姿態(tài)測量儀器在軌工作時需要保證整體的轉(zhuǎn)動角速率不能過大以保證光學(xué)測量系統(tǒng)能正常捕獲定位,同時也考慮到航天器本身的部件結(jié)構(gòu)強度在轉(zhuǎn)動過程中不會被甩出,因此在姿態(tài)機動的過程中的角速度必須保持在星體可承受的上限ωM內(nèi)[15]。這類角速度約束可以由如下不等式描述:
(10)
1) 執(zhí)行機構(gòu)幅值飽和
航天器姿態(tài)控制系統(tǒng)常見的執(zhí)行機構(gòu)主要包括:推力器、反作用飛輪、控制力矩陀螺、磁力矩器等[16]。盡管這些執(zhí)行機構(gòu)的工作原理有所不同,但它們的輸出幅值均受限。鑒于此,在姿態(tài)規(guī)劃和控制算法設(shè)計時,控制輸入τ∈N(N為執(zhí)行機構(gòu)的數(shù)量)需要滿足如下約束:
|τi|≤τMi=1,2,…,N
(11)
式中:τM>0為幅值限制。
2) 執(zhí)行機構(gòu)速率飽和
除了輸出幅值限制,由于執(zhí)行機構(gòu)自身響應(yīng)機理等原因,其輸出力矩的變化率也受限,具體可描述為如下不等式[11]:
(12)
式中:sM>0為速率幅值限制。
對于某些航天器姿態(tài)機動任務(wù),機動時間和能量消耗是重要的任務(wù)性能指標,為規(guī)劃算法的設(shè)計引入了相應(yīng)的約束。
1.3.1 任務(wù)時間約束
考慮到一些在軌觀測任務(wù)(如重要目標的偵察等),其存在最佳的觀測窗口[12],需要在最佳觀測窗口開始之前使航天器機動到特定的指向范圍內(nèi),可以描述為如下時間約束:
0 (13) 式中:Tf為姿態(tài)機動過程所用時間;Tw為當前時間距離任務(wù)最佳觀測窗口開始的時間。 1.3.2 能量消耗約束 在軌航天器不僅所攜帶的工質(zhì)燃料不多,其所配備的電能生產(chǎn)和存儲設(shè)備也是有限的。因此在姿態(tài)機動過程中執(zhí)行機構(gòu)所消耗的燃料也會受到限制。 對于使用推力裝置的航天器而言,其能量消耗以工質(zhì)燃料的質(zhì)量減少來計算,其過程可表示為[17] (14) 式中:mF為最大工質(zhì)燃料消耗質(zhì)量限制;fk為每個推力器產(chǎn)生的推力;NT為推力器的數(shù)量;Isp為推力器的比沖系數(shù);g0為重力系數(shù)。 對于使用電機作為動量交換裝置進行姿態(tài)機動的任務(wù)而言,其能量消耗以電機消耗的能量來計算,其過程可表示為[13] (15) 式中:E為本次任務(wù)可消耗的最大電能;Nτ為電機的數(shù)量;Pi為每個電機的瞬時功率,可以由如式(16)計算: (16) 其中:τi為每個電機的輸出力矩;Ωi為每個電機的轉(zhuǎn)速;KT、Rm、βm分別表示電機的扭矩系數(shù)、電樞電阻、黏滯摩擦系數(shù)。 在姿態(tài)機動任務(wù)中,往往不是由單一種類執(zhí)行機構(gòu)實現(xiàn)的,在考慮混合執(zhí)行機構(gòu)的能量消耗時,可綜合考慮式(14)和式(15)來處理。 上述2點闡述的性能約束主要是考慮時間或者能耗小于一個確切的值。但是,在大多數(shù)姿態(tài)控制系統(tǒng)的設(shè)計中,往往將它們作為優(yōu)化的性能指標綜合處理。在數(shù)學(xué)上可以表示為如下的性能指標最優(yōu): (17) 式中:Q(e)為關(guān)于狀態(tài)誤差e的代價函數(shù);R(u)為關(guān)于控制輸入u的代價函數(shù)。前者在物理意義上即對應(yīng)為任務(wù)完成時間的指標,后者則對應(yīng)能量消耗的代價。在姿態(tài)控制系統(tǒng)設(shè)計中,通過調(diào)節(jié)兩者的權(quán)重大小,即可根據(jù)實際的任務(wù)需求調(diào)整性能指標。 將參數(shù)不確定性、多源干擾、執(zhí)行機構(gòu)故障、暫穩(wěn)態(tài)性能約束、測量信息不完備等歸結(jié)為廣義約束。這些約束主要影響軌跡規(guī)劃后的跟蹤控制器設(shè)計。下面將對各類廣義約束進行簡要介紹和數(shù)學(xué)描述。 1.4.1 參數(shù)不確定性 航天器在軌運行期間,載荷運動、工質(zhì)及燃料消耗、目標抓捕等因素不可避免地會導(dǎo)致慣量參數(shù)存在不確定性。對于時變的慣量參數(shù),可以將其寫成如下形式[18]: J=J0+ΔJ (18) 式中:J0∈3×3為名義的慣量矩陣;ΔJ∈3×3為慣量矩陣的不確定部分。針對這一情況,通??蓪⒆藨B(tài)動力學(xué)中的ΔJ相關(guān)項集總到系統(tǒng)干擾中,并應(yīng)用抗干擾控制方法對其進行處理。對于不變/慢變的慣量參數(shù),可將動力學(xué)方程中關(guān)于J的函數(shù)項進行如下仿射線性化處理: Jx=L(x)θ?x∈3 (19) 其中:θ=[J11,J22,J33,J12,J13,J23]T代表未知參數(shù)向量;L(x):3→3×6為已知的回歸矩陣。針對線性回歸式(19),可設(shè)計自適應(yīng)律對未知參數(shù)θ進行在線估計[19]。 1.4.2 多源干擾 航天器在軌運行不可避免地會受到外部環(huán)境干擾力矩(包括重力梯度力矩、太陽光壓和輻射力矩、氣動力矩、地磁力矩等)以及內(nèi)部非環(huán)境干擾力矩(包括系統(tǒng)建模誤差、執(zhí)行機構(gòu)安裝偏差、撓性部件振動等)的影響,這些內(nèi)外部干擾力矩形成了多源異質(zhì)的干擾因素,極大地影響了航天器姿態(tài)控制的精度及穩(wěn)定度。文獻[20] 詳細分析了各類環(huán)境干擾力矩的特性以及對航天器姿態(tài)的影響,并提供了相應(yīng)的數(shù)學(xué)模型,這里不再贅述。對于系統(tǒng)建模誤差、執(zhí)行機構(gòu)安裝偏差等內(nèi)部擾動,一般對它們不進行精細化建模,而將它們視為外部干擾。這里重點描述撓性部件振動??紤]撓性航天器的動力學(xué)方程[21]: (20) (21) 式中:ω∈3為航天器的角速度;J∈3×3為航天器的慣量矩陣;τ∈3和τd∈3為控制和干擾力矩;η∈n為模態(tài)向量;δ∈n×3為耦合矩陣;D=diag{2ξ1w1,2ξ2w2,…,2ξnwn}和分別代表阻尼和剛性矩陣,ξi∈和wi∈(i=1,2,…,n)分別為阻尼比和模態(tài)頻率。 需要指出的是,為便于設(shè)計現(xiàn)有抗干擾控制方法大多將內(nèi)外多源干擾以及第1.4.3節(jié)提到的加性偏差故障歸結(jié)為總干擾,并加以處理。 1.4.3 執(zhí)行機構(gòu)故障 航天器長時間運行在高低溫、強輻射的惡劣太空環(huán)境中,執(zhí)行機構(gòu)(如推力器、反作用飛輪等)因需要頻繁工作,極易發(fā)生故障。執(zhí)行機構(gòu)故障輕則導(dǎo)致姿態(tài)控制性能下降,重則造成系統(tǒng)失穩(wěn)。通過分析故障對姿態(tài)控制系統(tǒng)的影響,可將執(zhí)行機構(gòu)故障分為以下4類[22]: 1) 控制輸出減?。河捎陔姎?、機械等原因?qū)е聢?zhí)行機構(gòu)的實際輸出力矩小于控制指令。 2) 輸出力矩偏移:由于執(zhí)行機構(gòu)的結(jié)構(gòu)原因和外部不確定性,其實際輸出力矩在指令控制的基礎(chǔ)上產(chǎn)生了附加偏移力矩。 3) 執(zhí)行機構(gòu)卡死:由于執(zhí)行機構(gòu)部件損壞或部分失效(如:噴氣推力裝置的節(jié)流閥泄漏等情況),導(dǎo)致其輸出為某一不為零的常值。 4) 對控制信號無響應(yīng):由于電路、電源失效或機械結(jié)構(gòu)損毀,導(dǎo)致執(zhí)行機構(gòu)不能響應(yīng)控制指令,實際的輸出為零。 為對1)~4)類故障進行建模,可將執(zhí)行機構(gòu)的實際輸出力矩改寫為如下形式: τ=Euc+ud (22) 式中:E=diag{e1,e2,…,eN}(0≤ei≤1)代表故障因子矩陣;uc∈N為控制力矩指令;ud∈N為加性偏差故障。 1.4.4 暫穩(wěn)態(tài)性能約束 深空探測、在軌服務(wù)與維護以及空間對抗等新一代航天任務(wù)對航天器姿態(tài)控制提出了更高的性能要求,主要體現(xiàn)在以下幾個方面: 1) 完成時間:由于任務(wù)時間緊,要求航天器在規(guī)定時間內(nèi)完成給定的姿態(tài)機動任務(wù),即ts≤T,其中ts表示系統(tǒng)的穩(wěn)定時間,T>0為規(guī)定的任務(wù)時間。典型的例子是非合作目標在軌捕獲要求在服務(wù)航天器進入陰影區(qū)前完成,否則視覺傳感器將無法為捕獲操作提供相對導(dǎo)航信息。 2) 最大超調(diào):超調(diào)量是衡量系統(tǒng)動態(tài)性能的重要指標,姿態(tài)控制的最大超調(diào)一般不能超過規(guī)定的值,即(xmax-x∞)/x∞≤om,其中xmax代表瞬時最大偏差值,x∞代表輸出穩(wěn)態(tài)值,om為最大可允許的超調(diào)量。例如,航天器在對滿足禁止指向約束的姿態(tài)軌跡進行跟蹤的過程中,為避免光學(xué)敏感器的視線軸進入禁止區(qū)域,要求跟蹤誤差無超調(diào)。 3) 穩(wěn)態(tài)誤差:穩(wěn)態(tài)誤差是衡量控制系統(tǒng)穩(wěn)態(tài)性能的重要指標,為了確保航天器高品質(zhì)地完成指定任務(wù),要求姿態(tài)和角速度收斂到期望值附近的可接受范圍內(nèi),即穩(wěn)態(tài)誤差界,數(shù)學(xué)上可描述為ess≤em,其中ess代表穩(wěn)態(tài)誤差,em為穩(wěn)態(tài)誤差上界。通常,穩(wěn)態(tài)誤差界可根據(jù)星載敏感器的測量精度來設(shè)定。 上述性能要求對姿態(tài)控制系統(tǒng)施加了嚴格的暫穩(wěn)態(tài)性能約束。 1.4.5 測量信息不完備 對于一些小型航天器(如立方衛(wèi)星、微納衛(wèi)星等),由于所能容納的載荷成本、體積、重量和功率有限,往往沒有安裝能夠直接測量角速度的敏感元件,因此對于控制系統(tǒng)設(shè)計來說,得到的狀態(tài)反饋只有姿態(tài)信息。上述的測量信息受限的問題可以由如下測量方程表述: y=Hx+w (23) 式中:y∈m為測量信息;H∈m×(m+3)為測量矩陣;x∈m+3表示由姿態(tài)和角速度整合的運動狀態(tài)向量,當姿態(tài)由四元數(shù)表示時m=4,由 MRPs 或者歐拉角表示時m=3;w∈m為傳感器測量中引入的干擾噪聲。需要指出的是,對于控制器而言,其接收到的反饋信號為m維,小于被控狀態(tài)的(m+3)維。 為滿足深空探測、在軌服務(wù)等新型航天任務(wù)日益提升的需求,航天器需要搭載越來越多的高精度載荷與設(shè)備。為此,姿態(tài)規(guī)劃算法設(shè)計不但需要考慮既定的任務(wù)目標與任務(wù)性能約束,還應(yīng)當兼顧在任務(wù)執(zhí)行過程中由載荷、執(zhí)行機構(gòu)等設(shè)備引入的各種狀態(tài)和物理約束。例如,ISO 衛(wèi)星設(shè)計了使載荷規(guī)避地球熱輻射源的機動策略,避免對探測結(jié)果造成影響[23];Cassini 號深空探測器要求具備姿態(tài)規(guī)避機制以保護配置的傳感器受到太陽照射[24];太陽能電池陣列需指向太陽,保證電力供應(yīng);XTE 衛(wèi)星要求機動速度不超過速度陀螺儀的測量上限等。因此,研究多約束自主姿態(tài)規(guī)劃方法,使航天器的姿態(tài)能夠沿著一條滿足約束的軌跡運動,盡可能地避免對設(shè)備載荷的損傷,從而有效地延長航天器壽命,是一項亟需解決的關(guān)鍵技術(shù)。 現(xiàn)有的多約束自主規(guī)劃方法可大致分為幾何方法、基于勢函數(shù)的方法、空間離散化方法、隨機采樣方法、基于優(yōu)化的方法與智能規(guī)劃方法6類。這些方法能夠處理的約束類型、軌跡尋優(yōu)能力、以及計算復(fù)雜度有所不同,表1 簡要總結(jié)了 6 種方法對指向約束、角速度約束與執(zhí)行機構(gòu)飽和的處理能力。圖4 給出了方法關(guān)于尋優(yōu)能力與計算復(fù)雜度的遞進關(guān)系,本文也將著重在這些方面對現(xiàn)有多約束規(guī)劃方法進行分析。 表1 不同規(guī)劃方法約束處理能力對比Table 1 Comparison of constraint-handling capability of different planning methods 通過建立敏感器視線指向與特定指向之間的幾何關(guān)系,傳統(tǒng)幾何方法能夠有效應(yīng)對姿態(tài)指向約束。一般來說,傳統(tǒng)幾何方法首先在無約束環(huán)境下,設(shè)計一種能夠準確驅(qū)動航天器從起點到期望姿態(tài)的最優(yōu)控制策略,而后在空間內(nèi)尋找一個中間姿態(tài),使得無約束的控制策略能夠直接應(yīng)用于兩段路徑,并且不違反任何的約束。幾何方法設(shè)計簡單,且能夠獲得解析的姿態(tài)規(guī)劃策略,在計算效率上具有顯著的優(yōu)勢。 針對太陽、異常和磁層粒子探測器 (Solar, Anomalous, and Magnetospheric Particle Explorer, SAMPEX),F(xiàn)rakes等[25]研究了探測器規(guī)避星體速度方向的方法,降低了空間碎片與微流星體對微粒子探測精度的影響。同時,考慮對明亮天體規(guī)避與對地通訊保持約束,Hablani[9]提出了2種替代最小旋轉(zhuǎn)路徑的機動方案,使得視線軸能夠相切地通過禁止區(qū),并基于其中一種方案進一步設(shè)計了天線指向策略。針對欠驅(qū)動航天器,文獻[26-27] 利用非標準歐拉軸角參數(shù),將欠驅(qū)動約束描述可行驅(qū)動軸與欠驅(qū)動軸的垂直幾何關(guān)系;進一步提出了兩種兩步相切姿態(tài)機動策略,實現(xiàn)了視線軸對某個指向約束區(qū)域的規(guī)避。針對空間內(nèi)多個錐形約束,徐瑞等[28]提出了有效路徑約束的檢測方法;通過將有效三維指向約束投影到二維平面,導(dǎo)出了滿足約束的中間姿態(tài)的解析解??紤]太陽規(guī)避約束,Ayoubi 和 Hsin[7]提出了一種新型最優(yōu)幾何規(guī)劃策略。 意大利Biggs團隊針對連續(xù)時間系統(tǒng)的幾何最優(yōu)控制問題,取得了一系列重要成果[31-33]。Biggs 和 Colley[31]提出了一種基于特殊正交群(Special Orthogonal group, SO(3))的半解析最優(yōu)規(guī)劃策略,通過優(yōu)化權(quán)重因子與控制參數(shù),可實現(xiàn)對系統(tǒng)軌跡和控制幅值的限制。利用ε截面曲率的連通曲面的標架叢,Henninger 和 Biggs[32]將最優(yōu)規(guī)劃問題轉(zhuǎn)化為兩點邊值問題,導(dǎo)出了基于拉克斯對(Lax pair)的解析解。結(jié)合人工勢函數(shù)方法與滑??刂?,Geng等[33]提出了一種基于對偶單位群的姿態(tài)控制律,獲得了滑動階段系統(tǒng)軌跡的解析形式,而后通過對系統(tǒng)初值與控制參數(shù)的整定,可以按需地改變系統(tǒng)軌跡的曲率,從而實現(xiàn)障礙規(guī)避。 另一方面,國內(nèi)外學(xué)者研究了航天器動力學(xué)系統(tǒng)的幾何離散化方法。針對受頻率約束與點約束的李群系統(tǒng),Kotpalliwar 等[34]研究了離散形式的龐特里亞金原理最優(yōu)條件。李益群等[35]提出了一種基于李群譜配點法的航天器姿態(tài)仿真方法。文獻[36] 提出了將變分積分子與譜方法通過伽遼金方法與打靶法結(jié)合的方法,在很好地保持了系統(tǒng)幾何結(jié)構(gòu)(辛結(jié)構(gòu)、李群結(jié)構(gòu)等)和物理特性(動量、能量等)的同時,不降低譜方法原有的收斂速度和計算效率。 由以上的研究結(jié)果可以看出,幾何規(guī)劃方法能夠獲得解析或半解析的最優(yōu)姿態(tài)機動路徑,在計算效率上具有明顯優(yōu)勢;能夠很好的保守群結(jié)構(gòu)與物理特性,有利于數(shù)值計算。但是,幾何方法應(yīng)對較多的約束時能力有限,并且能夠考慮的優(yōu)化指標相對單一。 勢函數(shù)方法是一種處理運動學(xué)約束非常有效的方法,該方法的基本原理如圖6所示??紤]目標在一個人工勢場中運動,其中障礙物處于高勢能處,期望位置處于最低勢能處。只需根據(jù)當前位置勢能的負梯度方向設(shè)計控制力,就能實現(xiàn)目標遠離高勢能的障礙區(qū)域,驅(qū)向低勢能的期望平衡點?;趧莺瘮?shù)的控制器無需提前規(guī)劃完整的系統(tǒng)軌跡,具有良好的實時性。國內(nèi)外眾多學(xué)者通過構(gòu)造出形式多樣的勢函數(shù)形成特定的人工勢場,來實現(xiàn)不同系統(tǒng)動態(tài)性能。目前,常見的勢函數(shù)有指數(shù)函數(shù)(包括高斯函數(shù))、二次型函數(shù)、對數(shù)函數(shù)、導(dǎo)航函數(shù)等。 針對空間光亮天體指向,Mclnnes[37]采用無歧義的高斯函數(shù)建立障礙高勢能區(qū)域,結(jié)合轉(zhuǎn)動動能與姿態(tài)勢能的 Lyapunov 函數(shù),提出了一種有界的姿態(tài)控制策略。Wisniewski和Kulczycki[38]基于四元數(shù)建立了哈密頓形式的姿態(tài)動力學(xué)方程,通過能量成型方法設(shè)計控制律,使得敏感指向為勢能高點,期望平衡點為唯一的勢能極小值點。針對航天器姿態(tài)規(guī)避問題,鄭重等[39]提出一種新型的高斯勢函數(shù),保證了控制律的連續(xù)與有界。郭延寧等[40]提出了排斥勢函數(shù)存在的條件,避免了不必要的退繞問題;進一步針對控制受限,設(shè)計了自適應(yīng)的反步跟蹤控制器,實現(xiàn)了控制幅值的在線自動調(diào)整??紤]多個空間內(nèi)禁止區(qū)域與強制區(qū)域,美國 University of Washington 的 Lee 和 Mesbaihi[6,41]提出了一系列基于對數(shù)函數(shù)的勢函數(shù)方法,實現(xiàn)了控制律光滑性與近似全局收斂性,進而保證了多約束求解的可行性與穩(wěn)定性。崔祜濤和程小軍[42]考慮了輸入飽和與常值干擾下的姿態(tài)規(guī)避控制問題,利用導(dǎo)航函數(shù)避免了勢函數(shù)方法局部極小的問題,并采用輔助系統(tǒng)解決了輸入飽和的問題。 此外,勢函數(shù)方法還能夠方便地處理角速度受限約束。針對靜止到靜止的航天器姿態(tài)機動問題,Shen等[43]利用滑模面變量設(shè)計了一種對數(shù)型勢函數(shù),使得系統(tǒng)在臨近角速度限制邊界時具有極高的勢能。筆者團隊[4,44]分別考慮減小階姿態(tài)系統(tǒng)與不確定姿態(tài)系統(tǒng),通過設(shè)計角速度的對數(shù)勢函數(shù),實現(xiàn)了角速度約束。 筆者團隊基于勢函數(shù)方法解決了航天器姿態(tài)機動與近距離交會的問題。針對交會對接問題,Dong等[45]利用對偶四元數(shù)參數(shù),設(shè)計了基于一種新型勢函數(shù)的姿軌控制律,能夠同時滿足視場約束與對接走廊約束。考慮多個姿態(tài)禁止約束,筆者團隊[14,46]提出了幾種基于對數(shù)型勢函數(shù)的姿態(tài)機動控制策略,克服了四元數(shù)的退繞問題;還針對航天器姿態(tài)機動問題,基于導(dǎo)航函數(shù)設(shè)計了系統(tǒng)的勢能函數(shù),在避免將禁止約束轉(zhuǎn)化為凸約束的前提下,嚴格證明了勢函數(shù)的極小值點能夠無線趨近于系統(tǒng)的平衡點[47-48]。 從以上分析可以看到,勢函數(shù)方法能夠有效處理多類型姿態(tài)約束,且不依賴于全局信息,可以實現(xiàn)動態(tài)的規(guī)劃。此外,勢函數(shù)方法能夠直接用于解析控制律設(shè)計,在計算實時性上具有明顯的優(yōu)勢。然而,勢函數(shù)方法通常會存在局部極小值問題,導(dǎo)致系統(tǒng)駐留在極小值點,不能實現(xiàn)既定的控制目標。 相比于前述方法共有的解析特征,下面主要介紹一系列數(shù)值優(yōu)化方法,它們對多種優(yōu)化指標具有更強的軌跡優(yōu)化能力,為多約束運動規(guī)劃問題求解提供了新思路。首先介紹一種離散化方法。這種方法利用多面體(比如立方體、二十面體)均勻離散化姿態(tài)單位球,將指向向量轉(zhuǎn)換為整數(shù),建立起指向向量的拓撲結(jié)構(gòu);通過路徑規(guī)劃算法將約束集轉(zhuǎn)化為單位球上的像素點集;最后,定義一個關(guān)于路徑長度的代價函數(shù),利用路徑搜索算法獲得最(次)優(yōu)路徑,這一過程如圖7所示。當?shù)玫狡谕穆窂街?,就形成了描述旋轉(zhuǎn)序列的一系列姿態(tài),可以進一步通過反饋控制器來實現(xiàn)期望的軌跡。 目前,姿態(tài)單位球離散化的方法主要包括天立方算法(Cosmic Background Explorer,COBE)[49]、正二十面體算法[50-52]等。在 COBE 天立方算法的基礎(chǔ)上,Tegmark[50]提出了一種基于正二十面體的離散化方法。該方法相比于COBE天立方算法具有2方面優(yōu)勢:①用六邊形像素替代COBE天立方算法里的正方形像素,空間離散化需要更少的像素;②每個像素點有6個相似等距的鄰居,使得生成的軌跡更加光滑。針對 Bevo-2 或 ARMADILLO 立方星所攜帶的低等級光學(xué)儀器對強光的敏感,Kjellgerg和Lightsey[51-52]基于正二十面體離散化算法提出了滿足姿態(tài)指向約束與控制約束的路徑規(guī)劃方法。該方法將連續(xù)點離散為姿態(tài)單位球內(nèi)接二十面體的正六邊形像素點,并采用 A*圖搜索算法搜尋可行路徑。但是該方法只能考慮單一敏感設(shè)備,缺乏多敏感設(shè)備軌跡規(guī)劃能力。針對這一問題,Tanygin[53-54]提出了 ARPs (Airy-Rodrigues Parameters)的定義以及一種新型最小形變投影,在新的參數(shù)下描述姿態(tài)約束并進行離散化,通過改進的 A*算法,實現(xiàn)了多路姿態(tài)的最優(yōu)路徑規(guī)劃。 離散化方法具有明確的物理含義,在機器人運動規(guī)劃領(lǐng)域也得到了廣泛的應(yīng)用。離散化方法能夠有效地處理姿態(tài)指向約束與控制約束,實現(xiàn)概率意義下的最短機動路徑。但是,離散化方法也具有明顯的缺點,一方面是依賴于離線求解的結(jié)構(gòu),另一方面是相比于解析的方法(幾何方法與勢函數(shù)方法),離散化方法的計算量較大,故而難以實現(xiàn)動態(tài)規(guī)劃,限制了其應(yīng)用。 2.3節(jié)中基于空間離散化的規(guī)劃方法更適用于低維度空間上的路徑規(guī)劃問題,它在這類問題中往往具有較好的完備性,而且需要對環(huán)境進行完整的建模,并且在高維度空間中很容易導(dǎo)致現(xiàn)“維數(shù)災(zāi)難”。為了解決這些問題,基于隨機采樣的規(guī)劃算法被提出來[55],這一方法以概率完備性來代替完備性,從而提高搜索效率,適用于高維度空間的規(guī)劃問題。這一類方法的主要原理是在可行的空間中隨機生成狀態(tài)點,然后找到一組可行的連通方式將這些狀態(tài)點連接得到一條規(guī)劃軌跡[56],具體過程如圖8中所示。 利用隨機規(guī)劃算法的原理,許多學(xué)者也開展了航天器姿態(tài)機動規(guī)劃研究。美國麻省理工大學(xué)的Feron等[57]提出了一種基于快速擴展隨機樹(Rapidly exploring Random Tree, RRT)的隨機姿態(tài)規(guī)劃方法,并基于 Lyapunov 函數(shù)建立局部制導(dǎo)律,在多種類型的姿態(tài)約束下,實現(xiàn)了航天器大角度姿態(tài)指向路徑規(guī)劃。Yershova 和 Lavalle[58]提出了在旋轉(zhuǎn)矩陣空間上的確定性采樣算法,這種分辨率完備性的采樣方式為姿態(tài)隨機規(guī)劃算法的發(fā)展提出了嶄新的方向。利用確定性采樣方法來更換傳統(tǒng) RRT 算法中的完全隨機采樣方法,可以在一定程度上減少 RRT 算法所用時間。文獻[59-60] 將姿態(tài)描述從旋轉(zhuǎn)矩陣映射到羅德里格參數(shù)中進行姿態(tài)指向規(guī)劃,減小了變量維度、提高了規(guī)劃速度,但也造成了某些工況下的搜索范圍擴大。 采用基于隨機算法的規(guī)劃方法的優(yōu)點是能夠解決各種類型的運動軌跡約束,利用基于概率的方法提高了計算效率。但是,正是因為采用了隨機概率的機制,所以這類方法只能在概率意義上規(guī)劃到期望狀態(tài)的附近。最終狀態(tài)的偏差也會隨著狀態(tài)圖中的頂點數(shù)的增加而指數(shù)收斂到零。而且與2.3節(jié)中離散化方法相似,這一類方法也難以滿足多個敏感軸的約束。同時,這類方法大多是規(guī)劃出一條可行的安全路徑,并未能將動力學(xué)約束和角速度約束同時考慮在規(guī)劃策略設(shè)計中,并且對于姿態(tài)機動過程中的最優(yōu)性就難以滿足。 由于航天器攜帶的工質(zhì)推進燃料有限和特定任務(wù)的機動時間需求,航天器姿態(tài)控制系統(tǒng)設(shè)計在考慮各類運動約束的同時,還需要針對特定的性能指標優(yōu)化。因此,基于數(shù)值優(yōu)化的方法也被廣泛的用于姿態(tài)規(guī)劃的研究。這一類方法的核心思想是將給定的性能指標作為目標函數(shù),把姿態(tài)運動學(xué)和動力學(xué)方程作為等式約束,并刻畫運動過程中的各類物理約束成不等式約束,從而特定工況下的性能最優(yōu)的控制問題轉(zhuǎn)化為約束條件下數(shù)值優(yōu)化進行求解,如圖9所示。 針對求解姿態(tài)機動的最優(yōu)控制問題,密歇根大學(xué)的團隊[61-62]基于間接法將最優(yōu)控制問題轉(zhuǎn)換成了兩點邊值問題求解了約束下航天器的重新定向的問題,這一系列方法中使用的李群變分積分的離散化方法有助于提高離散化精度,提高了求解精度和效率。凸優(yōu)化技術(shù)作為一種相對成熟的優(yōu)化問題求解工具,近年來也在航天器運動中得到了廣泛的研究[63]。華盛頓大學(xué)的Kim和Mesbahi[64]采用了凸優(yōu)化的思路進行處理,針對 Planck 空間觀測衛(wèi)星等典型的實際型號的約束下姿態(tài)重定向任務(wù),將姿態(tài)約束轉(zhuǎn)化為凸的線性矩陣不等式(Linear Matrix Inequality, LMI)形式的約束,并證明了轉(zhuǎn)化后的問題與原問題等價。文獻[65] 針對更為復(fù)雜的軟約束、動態(tài)約束以及混合約束進行約束凸化處理,解決了姿態(tài)機動中的凸優(yōu)化規(guī)劃問題。Sun和Dai[66]提出了基于二次約束二次規(guī)劃(Quadratically Constrained Quadratic Programming, QCQP)的迭代算法。在文獻[64] 的基礎(chǔ)上,姿態(tài)禁止區(qū)約束及強制區(qū)約束被轉(zhuǎn)化成了基于四元數(shù)的不等式約束,并考慮了姿態(tài)機動過程中存在的角速度約束和控制飽和限制。該方法采用半定松弛技術(shù)對將問題轉(zhuǎn)化為帶有秩約束的半定規(guī)劃問題,提出了一種逐次迭代的秩最小化迭代算法,最后利用凸優(yōu)化求解工具得到姿態(tài)機動的最優(yōu)軌跡。此外,Tam和Glenn[67]也在Kim的工作的基礎(chǔ)上,使用了混合整數(shù)規(guī)劃算法,求解對應(yīng)的航天器多約束姿態(tài)規(guī)劃問題。 上述基于數(shù)值優(yōu)化的方法是通過刻畫最優(yōu)問題并求其數(shù)值解,從而得到特定工況下的最優(yōu)姿態(tài)機動軌跡。但是求解這一類問題往往需要較高的計算硬件支持和較長的求解時間,尤其是當約束非線性且相互耦合的時候,更會導(dǎo)致運算成本增加。此外,這類方法是基于數(shù)學(xué)模型的,它們的求解往往依賴于精確的模型信息,因此基于數(shù)值規(guī)劃的方法也存在一定的局限性。 正如2.5節(jié)中分析,傳統(tǒng)基于數(shù)值優(yōu)化的方法存在求解效率低和模型依賴強等不足,特別是對于一些復(fù)雜的問題(如模型非完全精確已知的“灰/黑箱”問題、非凸形式的博弈問題等)很難有效地處理。值得注意的是,人工智能技術(shù)的近期進展為空間智能自主規(guī)劃提供理論、方法及技術(shù)支撐[68-70]?;谠獑l(fā)式的智能優(yōu)化算法在航天器姿態(tài)機動中也得到了廣泛研究,如遺傳算法(Genetic Algorithm, GA)及其拓展方法[71-73]、粒子群算法(Particle Swarm Optimization, PSO)[74-76]以及差分進化算法(Differential Evolution, DE)[77]等。這些算法利用仿生學(xué)的特點和機制能夠緩解傳統(tǒng)優(yōu)化算法中問題非凸造成的局部極小值的問題。 值得注意的是,近年來以強化學(xué)習(xí)技術(shù)為代表的新一代人工智能技術(shù)已經(jīng)在各類無人系統(tǒng)中受到了重點關(guān)注[78]。這類方法的基本原理如圖10所示,通過構(gòu)建環(huán)境反饋(“獎勵”或“懲罰”),從而激勵智能體在環(huán)境反饋中學(xué)習(xí)調(diào)整當前策略,最終實現(xiàn)“獎勵”最大化的執(zhí)行策略[79]。因此,在利用環(huán)境反饋處理約束時,將期望的運動狀態(tài)構(gòu)造成“獎勵”,將違背約束的運動狀態(tài)刻畫成“懲罰”是一種處理運動約束規(guī)劃的有效途徑。 在航天器姿態(tài)機動任務(wù)中,文獻[80] 針對非合作目標抓捕任務(wù),基于深度 Q 網(wǎng)絡(luò)(Deep-Q Networks, DQN)學(xué)習(xí)算法設(shè)計了一套姿態(tài)鎮(zhèn)定策略,該方法利用歷史數(shù)據(jù)進行訓(xùn)練,不依賴于空間目標的質(zhì)量參數(shù),具有比較強的智能性和適應(yīng)性。文獻[81] 提出了一種基于近端策略優(yōu)化算法(Proximal Policy Optimization, PPO)的姿態(tài)機動策略,在無需轉(zhuǎn)動慣量信息的情況下,顯著提升了性能。Elkin等[82]針對航天器姿態(tài)機動問題,提出了一個新型的強化學(xué)習(xí)框架,該框架利用地面高保真的數(shù)字仿真環(huán)境進行訓(xùn)練,同時由測量的運動狀態(tài)更新仿真環(huán)境的數(shù)字模型,并近乎實時的將最新的姿態(tài)機動策略更新,實現(xiàn)了策略在線更新的運動規(guī)劃。上述方法主要是針對無約束情況下的姿態(tài)機動,筆者團隊[5]針對多約束下的航天器姿態(tài)機動問題,在自適應(yīng)動態(tài)規(guī)劃(Adaptive Dynamic Programming, ADP)框架下設(shè)計了一種在線學(xué)習(xí)的算法,結(jié)合歷史數(shù)據(jù)與實時測量狀態(tài),在線近似求解最優(yōu)問題對應(yīng)的哈密頓-雅可比-貝爾曼(Hamilton-Jacobi-Bellman equation, HJB)方程,對姿態(tài)機動策略的實時更新,實現(xiàn)了在指向和角速度雙重約束下的姿態(tài)重定向機動。文獻[83] 進一步考慮了執(zhí)行機構(gòu)偏差,改進在線學(xué)習(xí)策略,實現(xiàn)了姿態(tài)約束和執(zhí)行機構(gòu)不確定性下的高精度姿態(tài)機動。上述方法首先設(shè)計了比例微分算法得到初始的規(guī)劃策略,然后通過在線的“獎勵”反饋完成策略的實時更新,實現(xiàn)了小計算代價的安全規(guī)避和性能的在線優(yōu)化。 以強化學(xué)習(xí)為代表的人工智能方法是解決航天器運動規(guī)劃的新途徑,前述工作中約束的處理主要取決于環(huán)境“環(huán)境獎勵”的構(gòu)造,如何針對航天任務(wù)的需求,設(shè)計更為精準合理的“獎勵量化”機制是一項有待研究的內(nèi)容。此外,考慮到航天器機動任務(wù)的特殊性,利用小樣本數(shù)據(jù)進行快速在線策略學(xué)習(xí)有著十分重要的作用,故設(shè)計高效的學(xué)習(xí)律是亟需突破的關(guān)鍵技術(shù)。 姿態(tài)控制是保障航天器穩(wěn)定飛行或跟蹤制導(dǎo)指令的關(guān)鍵技術(shù)之一。在實際工程中,比例積分微分控制(Proportional-Integral-Derivative control, PID)因其結(jié)構(gòu)簡單、參數(shù)調(diào)整直觀、易于工程實現(xiàn)等優(yōu)點,一直被廣泛應(yīng)用于航天器姿態(tài)控制系統(tǒng)的設(shè)計中[84]。然而,傳統(tǒng) PID 控制不能有效處理姿態(tài)控制設(shè)計面臨的系統(tǒng)不確定性、多源干擾、執(zhí)行機構(gòu)故障、暫穩(wěn)態(tài)性能約束以及測量信息不完備等廣義約束,難以滿足新興空間任務(wù)對姿態(tài)控制系統(tǒng)高自主、高可靠和高精度的發(fā)展需求。近年來,國內(nèi)外學(xué)者圍繞航天器姿態(tài)控制問題(包括姿態(tài)鎮(zhèn)定、姿態(tài)機動和姿態(tài)跟蹤)開展了大量的理論與應(yīng)用研究,提出了一系列先進的控制方法。下面將著重面向參數(shù)不確定性、多源干擾、執(zhí)行機構(gòu)故障和暫穩(wěn)態(tài)性能約束,依次介紹自適應(yīng)控制、抗干擾控制、容錯控制、預(yù)設(shè)性能控制等姿態(tài)控制方法的研究進展。 航天器的慣量不確定性可能會導(dǎo)致控制精度下降,嚴重時甚至?xí)斐上到y(tǒng)失穩(wěn)?;凇耙宰儜?yīng)變”思想的自適應(yīng)控制可以有效處理參數(shù)不確定性問題。傳統(tǒng)自適應(yīng)控制方法大多基于確定等價(Certainty-Equivalence, CE)原則,其基本思想是[85]:首先在假設(shè)不確定參數(shù)已知的前提下進行反饋控制設(shè)計,而后用估計值替換控制律中的不確定參數(shù),并設(shè)計相應(yīng)的自適應(yīng)律在線更新參數(shù)的估計值,保證閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)跟蹤誤差的收斂?;?CE 的自適應(yīng)控制因思路簡單、直觀,在航天器姿態(tài)控制中得到了廣泛的應(yīng)用[19,86]。然而,在 CE 框架下,自適應(yīng)律的設(shè)計主要是為了精確抵消由參數(shù)不確定性所引入的附加“擾動”項,但當參數(shù)估計無法收斂到它們的真值時,這種脆弱的抵消操作往往會降低閉環(huán)系統(tǒng)的暫態(tài)性能和魯棒性。然而,參數(shù)收斂僅在參考軌跡滿足嚴格的持續(xù)激勵(Persistent Excitation, PE)條件時才能實現(xiàn)。 為了提高自適應(yīng)控制性能,相關(guān)學(xué)者脫離CE原則,基于浸入與不變(Immersion and Invariance, I&I)技術(shù)提出了非確定等價自適應(yīng)控制方法。I&I方法論最早是由Astolfi和Ortega[87]基于微分幾何概念提出的。I&I自適應(yīng)控制方法主要是通過在參數(shù)估計中額外增加一個函數(shù)項以構(gòu)造一個微分流形,并設(shè)計控制律和自適應(yīng)律使得所構(gòu)造的流形不變且吸引,從而以魯棒的思想處理系統(tǒng)參數(shù)不確定性。這一方法極大地放寬了 CE 自適應(yīng)控制對 PE 條件的依賴。需要指出的是,I&I 自適應(yīng)控制需要求解一個特定的 PDE 來構(gòu)造微分流形,但對于航天器姿態(tài)動力學(xué)這類多輸入非線性系統(tǒng)而言,PDE 通常無解析解,即所謂的“可積性障礙”。這一障礙極大地限制了傳統(tǒng) I&I 自適應(yīng)控制在航天姿態(tài)控制中的應(yīng)用。為了克服此問題,Seo 和 Akella[88]分別針對航天器姿態(tài)跟蹤問題,提出了基于回歸濾波的 I&I 自適應(yīng)控制方法,通過引入狀態(tài)和回歸矩陣濾波器,構(gòu)造了一個增廣濾波系統(tǒng),并利用增廣濾波狀態(tài)和濾波回歸矩陣直接給出了PDE的解析解。文獻[89]利用這一方法設(shè)計了I&I自適應(yīng)姿態(tài)控制器。Karagiannis等[90]將動態(tài)縮放(Dynamic Scaling)技術(shù)應(yīng)用到I&I自適應(yīng)控制設(shè)計中,為克服可積性障礙提供了一個新思路。該方法通過引入狀態(tài)濾波器,將原始回歸矩陣中的積分變量按照一定方式替換為相應(yīng)的濾波狀態(tài)量,使回歸矩陣可積,并給出ODE的近似解,之后設(shè)計動態(tài)縮放因子補償近似解導(dǎo)致的誤差。與文獻[88]相比,基于動態(tài)縮放的方法只需對原系統(tǒng)進行低維的動態(tài)擴張便可實現(xiàn)與之相似的性能。Yang等[91]將該方法應(yīng)用到了航天器姿態(tài)跟蹤控制問題中,并改進了動態(tài)增益的設(shè)計,有效避免了高增益控制問題。Wen等[92]進一步改進了動態(tài)縮放因子,移除了文獻[91]需要慣量矩陣最小特征值的假設(shè)。Xia和Yue[93]針對航天器抗退繞姿態(tài)穩(wěn)定問題,提出了基于動態(tài)縮放的 I&I 自適應(yīng)控制方法,并通過引入飽和的縮放因子,使得控制器不需要任何動態(tài)增益。本文作者團隊將基于動態(tài)縮放的 I&I 自適應(yīng)控制方法應(yīng)用于航天器受限的姿態(tài)重定向中[4]。 CE 和 I&I 自適應(yīng)控制方法均僅當回歸矩陣滿足 PE 條件時,才能保證參數(shù)估計收斂到它們的真值[94]。但 PE 條件較為嚴苛,在實際中通常難以滿足。近年來,國內(nèi)外眾多學(xué)者都開展了放寬參數(shù)收斂對 PE 條件依賴的研究。Chowdhary 和 Johnson[95]在 MRAC 框架下,提出了一種基于并行學(xué)習(xí)(Concurrent Learning, CL)的自適應(yīng)控制方法,通過并行使用豐富的歷史數(shù)據(jù)和當前量測數(shù)據(jù)設(shè)計自適應(yīng)律,可在系統(tǒng)狀態(tài)僅滿足寬松的有限激勵(Finite Excitation, FE)條件下保證參數(shù)收斂。這一方法自提出以來就獲得了廣泛的關(guān)注與應(yīng)用。Zhao 和 Duan[96]針對慣量不確定性下的組合體航天器姿態(tài)跟蹤問題,提出了 CL 自適應(yīng)律,精確地估計出了組合體未知的慣量參數(shù)。由于 CL 算法需要數(shù)據(jù)選取與存儲,為使存儲的數(shù)據(jù)盡可能多地包含線性無關(guān)元素,需要選擇一個合適的記錄方案,這極大地增加了算法設(shè)計的復(fù)雜度。而且,傳統(tǒng) CL 算法需要狀態(tài)導(dǎo)數(shù)(如角加速度)來構(gòu)造參數(shù)估計誤差,但狀態(tài)導(dǎo)數(shù)一般是不可測的信號。盡管可以使用固定點平滑器、滑模微分器等對狀態(tài)導(dǎo)數(shù)進行在線估計,但這種處理方法對測量噪聲比較敏感。為避免使用狀態(tài)導(dǎo)數(shù)信息,Cho等[97]提出了復(fù)合自適應(yīng)控制方法,無需狀態(tài)導(dǎo)數(shù)信息,在 FE 條件下實現(xiàn)了參數(shù)收斂,而且由于其使用濾波回歸的積分進行數(shù)據(jù)存儲,也避免了在線數(shù)據(jù)選取?;谙嗨频乃枷?,文獻[98] 提出了復(fù)合學(xué)習(xí)控制方法,并成功應(yīng)用于機械臂控制中。本文作者團隊針對航天器姿態(tài)跟蹤和多約束姿態(tài)再定向問題,基于復(fù)合學(xué)習(xí)思想,提出了幾種自適應(yīng)與學(xué)習(xí)控制方法,在保證高精度姿態(tài)控制的前提下,實現(xiàn)了慣量參數(shù)的在線辨識[99-100]。 雖然國內(nèi)外研究人員在航天器姿態(tài)自適應(yīng)控制方面取得了一定的進展,但現(xiàn)有的自適應(yīng)控制方法大多要求慣量參數(shù)是常值或慢變的(近似于常值)。對于未知時變慣量條件下的航天器姿態(tài)自適應(yīng)控制技術(shù),尤其是時變慣量參數(shù)進行在線辨識,有待系統(tǒng)性的探索。 航天器在軌運行期間所受的多源干擾極大地影響了航天器姿態(tài)控制的精度及穩(wěn)定度。姿態(tài)控制設(shè)計需要針對性地抑制或抵消這些干擾,以提升姿態(tài)控制系統(tǒng)的抗擾能力和控制精度。現(xiàn)有航天器姿態(tài)抗干擾控制方法可大致歸為3類:①魯棒控制方法;②自抗擾控制方法;③基于干擾觀測器的控制方法。 魯棒控制誕生于20世紀 70 年代末期,最初是為解決航空航天領(lǐng)域的控制問題,直到 1988 年著名的 DGKF 方法發(fā)表[101],相關(guān)理論才趨于成熟。至今,魯棒控制仍是最為廣泛使用的姿態(tài)抗干擾控制方法。Liu等[102]提出了一種非脆弱的魯棒H∞控制方法,解決了存在建模不確定性、控制攝動、外部干擾和控制輸入限制的撓性航天器姿態(tài)穩(wěn)定和振動抑制問題。一些學(xué)者結(jié)合H2和H∞魯棒控制方法,提出了混合H2/H∞魯棒姿態(tài)控制方法[103-104]。Luo等[105]針對存在外部干擾的航天器姿態(tài)跟蹤問題,結(jié)合魯棒控制和最優(yōu)控制方法,提出了一種H∞逆最優(yōu)控制器,實現(xiàn)對干擾的H∞最優(yōu)。Wang 和 Li[106]提出了一種魯棒最優(yōu)控制方法,解決了存在執(zhí)行機構(gòu)安裝偏差和干擾的航天器姿態(tài)穩(wěn)定問題。 變結(jié)構(gòu)控制憑借其對不確定性和干擾的強魯棒性,也是最為廣泛應(yīng)用的魯棒抗干擾方法。筆者團隊[107]針對撓性航天器大角度姿態(tài)機動問題,結(jié)合主動振動抑制技術(shù),提出了滑??刂?Sliding Mode Control, SMC)方案,有效抑制了外部干擾和撓性振動。為實現(xiàn)有限時間控制,相關(guān)學(xué)者也提出了終端 SMC 方案[108-109]。針對存在外部干擾和控制幅值受限的航天器姿態(tài)控制問題,Wallsgrove 和 Akella[110]提出了一種飽和的光滑變結(jié)構(gòu)姿態(tài)控制方案,通過構(gòu)造時變的濾波變量,并引入一個銳度函數(shù),有效抑制了干擾對閉環(huán)系統(tǒng)的影響,實現(xiàn)了漸進的姿態(tài)收斂。本文作者團隊基于文獻[110] 也提出了幾種光滑的變結(jié)構(gòu)控制方法[111-112],解決了控制輸入和角速度受限下的航天器抗退繞姿態(tài)穩(wěn)定問題,在干擾下實現(xiàn)了姿態(tài)和角速度的漸進收斂。魯棒控制方法的核心思想是“以不變應(yīng)萬變”,即考慮系統(tǒng)可能面臨的“最壞”擾動情況,設(shè)計一個結(jié)構(gòu)不變的魯棒控制器,實現(xiàn)對有界擾動的有效抑制,故而具有較強的保守性。相比而言,自抗擾控制和基于干擾觀測器的方法通過對擾動進行估計和補償,可有效減小控制器的保守性。 自韓京清[113]1998 年提出自抗擾控制(Active Disturbance Rejection Control, ADRC)以來,該方法一直受到控制界的廣泛關(guān)注,并已成功應(yīng)用于航空航天、工業(yè)控制等領(lǐng)域。ADRC 繼承了經(jīng)典 PID 控制的誤差反饋精髓,并引入擾動估計補償技術(shù),使其不依賴于被控對象精確的數(shù)學(xué)模型,對干擾具有較好的抑制能力。ADRC 一般由跟蹤微分器、擴張狀態(tài)觀測器(Extended State Observer, ESO)、非線性狀態(tài)誤差反饋控制律和擾動補償?shù)葞讉€環(huán)節(jié)組成[18]。Xia 等[18]針對航天器姿態(tài)跟蹤問題,提出了一種基于 ESO 的 SMC 方案,通過設(shè)計 ESO 對系統(tǒng)集總干擾進行估計補償,極大地放寬了傳統(tǒng) SMC 的保守性。文獻[114] 針對外部擾動、輸入/測量噪聲及飽和約束等影響下的無拖曳衛(wèi)星位姿控制問題,采用基于擴展狀態(tài)的卡爾曼濾波器對系統(tǒng)狀態(tài)和擾動進行估計,并設(shè)計自抗擾控制器,實現(xiàn)了無拖曳衛(wèi)星的聯(lián)合控制。 盡管前述的非線性 ADRC 方法具有參數(shù)效率高、干擾觀測性能好等突出優(yōu)點,但其結(jié)構(gòu)較為復(fù)雜,需要調(diào)節(jié)的參數(shù)較多,導(dǎo)致參數(shù)整定困難。針對此問題,美國 Cleveland State University 的Gao[115]提出了線性 ADRC 方法,給出了基于觀測器帶寬的觀測器增益整定方法,通過將多參數(shù)整定問題簡化為單參數(shù)整定問題,極大地簡化了控制器設(shè)計和理論分析。Bai等[116]針對存在干擾的航天器姿態(tài)跟蹤問題,采用線性 ESO 對外部干擾進行估計和補償,并設(shè)計一種自適應(yīng)控制方法,實現(xiàn)了姿態(tài)和角速度跟蹤誤差的快速高精度收斂。除此之外,還有很多基于 ADRC 的姿態(tài)抗干擾控制成果,但限于篇幅,這里不再一一羅列?,F(xiàn)有 ADRC 方法在測量噪聲明顯時,因觀測器增益限制,極易導(dǎo)致擾動估計不精確,進而造成控制性能下降。 基于干擾觀測器的控制方法(Disturbance Observer Based Control, DOBC)起源于 20 世紀 80 年代,最初是日本學(xué)者 Ohishi等[117]針對直流伺服電機的控制問題,提出了一種頻域干擾觀測器對伺服電機干擾進行估計和補償。DOBC 方法的基本思想是設(shè)計干擾觀測器對系統(tǒng)的內(nèi)外干擾進行估計和前饋補償,以抵消干擾對系統(tǒng)的影響,并結(jié)合其他控制方法,實現(xiàn)特定的控制需求。由于結(jié)構(gòu)簡單、參數(shù)整定方便,DOBC 方法自提出以來便在控制領(lǐng)域得到了廣泛關(guān)注。盡管頻域干擾觀測器被成功應(yīng)用于各類系統(tǒng),但其分析設(shè)計均基于線性化的模型和線性系統(tǒng)理論,極大地限制了其應(yīng)用范圍。 英國 Loughborough University 的陳文華[118]于2000年首次利用時域方法提出了一種非線性干擾觀測器,并應(yīng)用于機械臂控制中實現(xiàn)了精確的摩擦估計和補償。此后,非線性DOBC理論得到了迅速發(fā)展。針對航天器姿態(tài)控制系統(tǒng),該方法的結(jié)構(gòu)如圖11所示。Sun 和 Zheng[119]針對存在測量噪聲和控制輸入飽和的航天器姿態(tài)穩(wěn)定問題,將測量噪聲、參數(shù)攝動和外部干擾當成“集總干擾”,采用非線性 DOB 對集總干擾進行估計和前饋補償,并基于抗積分飽和補償器設(shè)計了飽和魯棒控制器。Zhang等[120]結(jié)合積分型 DOB 和終端滑模控制技術(shù),設(shè)計了自適應(yīng)滑??刂破?,實現(xiàn)了有限時間姿態(tài)跟蹤。Zhu等[121]針對撓性航天器的主振動抑制和姿態(tài)抗擾控制問題,分別設(shè)計了自適應(yīng) DOB 和撓性振動觀測器,有效補償了集總干擾和撓性振動。北京航空航天大學(xué)吳忠團隊分別設(shè)計了有限時間 DOB[122]和迭代學(xué)習(xí) DOB[123],并應(yīng)用于撓性航天器姿態(tài)控制中。 值得注意的是,航天器姿態(tài)控制系統(tǒng)往往會受到模型不確定性、未建模動態(tài)、時滯、執(zhí)行器誤差、測量噪聲以及外部環(huán)境干擾等內(nèi)外部多源干擾的影響,這些干擾具有不同的表征形式,如范數(shù)有界變量、諧波變量、階躍變量、非高斯/高斯隨機變量以及變化率有界變量等[124]。傳統(tǒng)的 DOBC 大多僅能對單一干擾進行補償,沒有充分挖掘出各類干擾的內(nèi)在特征,并有針對性地進行精細化補償和抑制。文獻[125-126] 在傳統(tǒng) DOBC 的基礎(chǔ)上,首次提出了復(fù)合分層抗干擾控制方法,在對系統(tǒng)干擾進行分析和分類建模的基礎(chǔ)上,采用內(nèi)環(huán)+外環(huán)的雙環(huán)控制結(jié)構(gòu),實現(xiàn)對系統(tǒng)多源干擾的精細估計和補償,該方法目前已在航天器、機器人等系統(tǒng)中進行了應(yīng)用,并取得了較好的效果。Zhu等[127]結(jié)合 ADRC 和 DOBC 方法提出了一種增強的復(fù)合抗擾控制方法,該方法建立了一個外部模型對撓性振動引起的干擾進行描述,并將參數(shù)不確定性、環(huán)境干擾等其他干擾歸結(jié)為一個微分有界的等效干擾,然后利用 DOBC 對撓性振動干擾進行精細估計與補償,并采用 ADRC 補償其他干擾,相較于單一的 DOBC 或 ADRC 方法具有更強的抗擾能力。Yu等[21]首次提出了干擾可估計性和可補償性概念,并與文獻 [127] 相似,結(jié)合 ADRC 和 DOBC 技術(shù)設(shè)計了一種增強的抗干擾姿態(tài)控制器,實現(xiàn)了撓性航天器的精細干擾補償和高精度姿態(tài)控制。 雖然過去20年 DOBC 技術(shù)取得了長足的發(fā)展,并在航天器姿態(tài)抗干擾控制中得到了應(yīng)用與驗證,但是提高 DOBC 在大延時、高對抗和強干擾等復(fù)雜環(huán)境下的精細抗干擾能力,仍是一項有待深入研究的工作。 世界各空間機構(gòu)在航天器的設(shè)計、生產(chǎn)及其在軌運行過程中,都非常重視航天器的可靠性和操作的安全性。但受制造工藝水平、成本限制等客觀因素的制約,以及高/低溫、強輻射、強電磁干擾等惡劣太空環(huán)境的影響,航天器故障事件仍時有發(fā)生,如太陽帆板損壞、陀螺儀失效、遙測指令系統(tǒng)異常等。航天器故障給航天器的安全性帶來了極大隱患。據(jù)統(tǒng)計表明[128],1980—2005年間在軌航天器所發(fā)生的 156 起故障事件中,姿態(tài)和軌道控制系統(tǒng)(Attitude and Orbit Control System, AOCS)與電力系統(tǒng)(Power)故障占總故障的 59%。進一步分析故障對任務(wù)的影響,發(fā)現(xiàn)近 65% 的故障是非致命性故障,致使了航天任務(wù)降級,而近 40% 的故障是致命性的,導(dǎo)致航天任務(wù)完全失敗,造成了巨大的經(jīng)濟損失。 姿態(tài)控制系統(tǒng)因功能和結(jié)構(gòu)復(fù)雜,是航天器故障事件最高發(fā)的子系統(tǒng)之一。根據(jù)文獻[128]可知,1980—2005年發(fā)生的 156 起故障事件中AOCS 故障占總故障的 32%,而且近 50% 的 AOCS 故障是由反作用飛輪、動量輪、推力器等姿軌控執(zhí)行機構(gòu)故障引起的。航天器長期在軌運行期間,這些姿軌控執(zhí)行機構(gòu)需要頻繁工作以驅(qū)動航天器完成指定任務(wù),這也是它們故障高發(fā)的原因。表2 和表3 分析了典型的推力器和反作用飛輪故障案例。由此可見,執(zhí)行機構(gòu)故障輕則會導(dǎo)致航天器任務(wù)降級、壽命縮減,重則直接致使航天器完全失效甚至失控解體,造成巨大的經(jīng)濟損失和災(zāi)難性的后果。因此,使航天器具備自主故障處理能力尤為重要。 表2 推力器故障典型案例Table 2 Typical cases of thruster faults 表3 反作用飛輪故障典型案例Table 3 Typical cases of reaction wheel faults 為滿足航天器日益提升的安全性、可靠性和可維護性需求,迫切需要發(fā)展容錯控制(Fault-Tolerant Control, FTC)技術(shù),使航天器具備自主故障處理能力。FTC 發(fā)端于航空航天高可靠性需求,20 世紀 80 年代美國空軍提出了“自修復(fù)飛行控制系統(tǒng)”等概念,以保證飛行器在故障情況下仍能安全著陸。文獻[129]對FTC技術(shù)進行了系統(tǒng)性梳理和回顧。根據(jù)文獻[130],現(xiàn)有的航天器姿態(tài)FTC方法可分為2大類:被動FTC和主動FTC。 被動 FTC 本質(zhì)上屬于“以不變應(yīng)萬變”的魯棒控制方法,在設(shè)計過程中需要充分考慮潛在的故障,并將它們視為系統(tǒng)不確定性,而后設(shè)計一個魯棒控制器實現(xiàn)容錯控制。該方法不需要故障的在線信息,且無需進行控制重構(gòu),能夠同時處理多種類型故障,具有設(shè)計簡單、工程實用性強等優(yōu)勢,目前已在航天器控制領(lǐng)域得到了廣泛關(guān)注?,F(xiàn)有的航天器姿態(tài)被動 FTC 方法主要集中于“自適應(yīng) + X”方法(如自適應(yīng) + 滑??刂?、自適應(yīng) + 魯棒控制等)。Cai等[131]針對航天器姿態(tài)跟蹤問題,提出了一種“間接自適應(yīng)+滑模控制”的魯棒容錯控制方法,該方法不僅能夠在有限推力下應(yīng)對推力器故障,還對參數(shù)不確定性和外部干擾具有強魯棒性。Shen等[132]結(jié)合終端滑??刂坪妥赃m應(yīng)控制技術(shù),研究了有限時間FTC問題。Xiao等[133]研究了剛?cè)狁詈虾教炱鞯淖藨B(tài)跟蹤問題,考慮執(zhí)行機構(gòu)故障、測量噪聲、未知模態(tài)位移、參數(shù)不確定性和外部干擾等,設(shè)計了自適應(yīng)容錯控制器,采用序列Lyapunov方法分析了跟蹤誤差的保性能收斂界。近年來,本文作者團隊[134-135]提出了“自適應(yīng)+預(yù)設(shè)性能控制”的航天器姿態(tài)FTC方法,在參數(shù)不確定性、外部干擾和執(zhí)行機構(gòu)故障下實現(xiàn)了姿態(tài)跟蹤誤差的預(yù)設(shè)性能收斂。盡管被動FTC能夠有效處理一大類執(zhí)行機構(gòu)故障,且對干擾具有強魯棒性,但控制器的保守性較強,難以恢復(fù)理想的控制性能。 不同于被動 FTC,主動 FTC 方法主要是通過引入一個故障檢測和診斷(Fault Dection and Digonosis, FDD)算法對執(zhí)行機構(gòu)故障進行在線實時檢測與診斷,而后利用 FDD 模塊的診斷信息重構(gòu)控制器,以“精準診斷-對癥下藥”的思想主動地應(yīng)對執(zhí)行機構(gòu)故障,保證整個系統(tǒng)在故障下仍具有可接受的性能。主動 FTC 方法的框架如圖12所示,該方法能夠充分利用系統(tǒng)的物理和解析冗余,主動地應(yīng)對執(zhí)行機構(gòu)故障,故具有較小的保守性。主動 FTC 系統(tǒng)一般包含故障診斷與容錯控制2部分內(nèi)容,而故障診斷又分為 3 部分:① 故障檢測,即檢測出系統(tǒng)是否發(fā)生故障與故障發(fā)生的時間;② 故障隔離,即獲知系統(tǒng)哪個部件發(fā)生故障以及故障類型和發(fā)生的具體位置;③ 故障辨識,即根據(jù)系統(tǒng)測量信息辨識出故障大小。目前,大量學(xué)者對航天器姿態(tài)控制系統(tǒng)的故障診斷問題進行了研究,現(xiàn)有成果可劃分為基于模型的方法、基于數(shù)據(jù)的方法和基于知識的方法3大類。哈爾濱工業(yè)大學(xué)沈毅等[136]和筆者團隊[137]已對現(xiàn)有航天器姿態(tài)控制系統(tǒng)的故障診斷算法進行了梳理與總結(jié),這里不再詳述。盡管故障診斷技術(shù)取得了一些的研究成果,但大多方法在多源干擾的影響下面臨故障虛警率高、隔離難、辨識精度低等問題,如何提高干擾下的故障診斷精度有待深入研究。 接下來,重點回顧故障辨識與容錯控制方法的研究進展。Shen等[138]研究了姿態(tài)主動 FTC 問題,提出可避免虛警的故障檢測方案,并構(gòu)造了指數(shù)收斂的間接故障辨識器對系統(tǒng)總故障進行估計,在此基礎(chǔ)上進一步設(shè)計了自適應(yīng)滑模容錯控制器,在滿足輸入飽和的前提下有效補償執(zhí)行機構(gòu)故障對系統(tǒng)的影響。筆者團隊[139]針對航天器單框架控制力矩陀螺的故障診斷問題,提出了一種基于神經(jīng)網(wǎng)絡(luò)的干擾觀測器在線學(xué)習(xí)周期干擾,實現(xiàn)了故障和干擾的解耦,并基于神經(jīng)網(wǎng)絡(luò)和自適應(yīng)估計器設(shè)計了故障診斷方案,實現(xiàn)對控制力矩陀螺故障的隔離和估計。近年來,一些學(xué)者也將執(zhí)行機構(gòu)故障和干擾統(tǒng)一歸結(jié)為“集總干擾”,并基于 ADRC 或 DOBC 方法提出了一系列容錯抗干擾控制方法[140-142]。筆者團隊[142]提出了基于迭代學(xué)習(xí)干擾觀測器的姿態(tài)容錯抗干擾控制方法,并通過硬件在環(huán)實驗驗證了算法的有效性。Gui[143]研究了基于觀測器的航天器姿態(tài) FTC 問題,考慮執(zhí)行機構(gòu)故障、慣量不確定性、外部干擾以及狀態(tài)估計誤差,設(shè)計了一種連續(xù)滑模容錯控制器,并使用序列 Lypunov 方法預(yù)測了穩(wěn)態(tài)跟蹤誤差的收斂界。 基于控制重分配的容錯控制方法具有故障發(fā)生時無需改變控制器結(jié)構(gòu)的特點,也被廣泛應(yīng)用于主動 FTC 系統(tǒng)設(shè)計中。Shen等[144]針對航天器姿態(tài)跟蹤問題,基于故障辨識結(jié)果,結(jié)合滑模控制和非魯棒控制分配技術(shù),提出了一種容錯控制分配方法,該方法可充分利用健康和尚未完全失效的執(zhí)行機構(gòu)應(yīng)對故障;隨后,Shen等[145]又進一步提出了一種魯棒容錯控制分配方案。Li等[146]考慮執(zhí)行機構(gòu)故障、控制輸入飽和以及外部干擾,提出了一種基于閉環(huán)控制分配的姿態(tài) FTC 方法,在控制輸入飽和限制下,通過將基準控制信號分配到冗余執(zhí)行機構(gòu),并將分配誤差納入控制閉環(huán),保證了閉環(huán)系統(tǒng)的穩(wěn)定性。筆者團隊[147]也提出了一種閉環(huán)的魯棒容錯控制分配方法,充分考慮故障估計誤差,將控制分配問題描述為一個魯棒最小方差問題,并給出了相應(yīng)的解析解,克服了傳統(tǒng)控制分配方法僅能給出數(shù)值解,且缺乏嚴格閉環(huán)穩(wěn)定性保證的局限。 隨著航天器星載設(shè)備集成化程度和航天任務(wù)品質(zhì)需求的不斷提升,以及空間對抗態(tài)勢的日益升級,航天器發(fā)生執(zhí)行/傳感故障以及部件損傷的概率劇增。盡管目前航天器容錯控制技術(shù)在理論和應(yīng)用方面均取得了顯著的進展,但針對航天器結(jié)構(gòu)性故障(如航天器受攻擊或撞擊而發(fā)生帆板損壞等)的容錯控制技術(shù)仍有待研究。 為確保航天器高品質(zhì)地完成深空探測、在軌服務(wù)、空間對抗等新一代空間任務(wù),姿態(tài)控制系統(tǒng)的設(shè)計需要考慮第1.4.4節(jié)總結(jié)的暫穩(wěn)態(tài)性能要求。然而,現(xiàn)有的非線性控制方法(如滑??刂啤⒆赃m應(yīng)控制等)大多都側(cè)重于分析閉環(huán)系統(tǒng)的穩(wěn)定性與輸出誤差的穩(wěn)態(tài)行為,缺乏對暫態(tài)性能指標的分析與保證。盡管混合H2和H∞魯棒控制[148]和L2增益性能指標[149]可以分析閉環(huán)系統(tǒng)的暫態(tài)性能,但所引入的性能指標均與軌跡導(dǎo)向的暫態(tài)性能沒有預(yù)先確定的關(guān)系,因此需要繁瑣的參數(shù)選取才能獲得期望的暫態(tài)性能。希臘學(xué)者 Bechlioulis 和 Rovithakis[150]提出了預(yù)設(shè)性能控制(Prescribed Performance Control, PPC),為保證控制系統(tǒng)暫穩(wěn)態(tài)性能提供了嶄新的設(shè)計思路。該方法的核心思想是通過引入性能函數(shù)為受控系統(tǒng)的狀態(tài)或誤差設(shè)定性能包絡(luò),刻畫收斂速度、最大超調(diào)量和穩(wěn)態(tài)誤差等暫穩(wěn)態(tài)控制性能,如圖13所示,并結(jié)合誤差轉(zhuǎn)換技術(shù)和非線性控制方法,保證狀態(tài)或誤差嚴格在預(yù)設(shè)的性能包絡(luò)內(nèi)收斂。由于 PPC 框架并沒有指定特定的控制器設(shè)計方法,故而可以根據(jù)實際控制需求,利用現(xiàn)有先進的非線性控制方法(如 SMC、DOBC、自適應(yīng)控制等)對誤差轉(zhuǎn)換后的系統(tǒng)進行控制器設(shè)計。 鑒于 PPC 方法在保證系統(tǒng)暫穩(wěn)態(tài)性能上的優(yōu)勢,該方法自 2008 年提出以來便得到了大量的應(yīng)用。文獻[151-152] 對航天器姿態(tài) PPC 方法的研究進展和未來趨勢進行了綜述??紤] PPC 方法的魯棒性、抗干擾性和容錯能力,本文從新的視角對航天器姿態(tài) PPC 方法的進展進行重新梳理,將現(xiàn)有方法劃分為2大類:“PPC + 估計/觀測”方法和無模型 PPC 方法,其中第一類方法主要包括“PPC + 自適應(yīng)控制”“PPC + DOBC”“PPC + 神經(jīng)網(wǎng)絡(luò)逼近”等。本文作者團隊[89]針對航天器逼近操作問題,將空間運動約束轉(zhuǎn)換為位姿跟蹤誤差的暫穩(wěn)態(tài)性能約束,并考慮航天器質(zhì)量特性不確定性,提出了一種 I&I 自適應(yīng) PPC 方法,能夠保證航天器按照預(yù)設(shè)的性能要求完成對空間目標的逼近操作,且在逼近過程中嚴格遵循空間運動約束。此外,筆者團隊[134-135]還研究了執(zhí)行機構(gòu)故障和輸入飽和下的航天器姿態(tài)跟蹤 PPC 問題,提出了兩種基于障礙函數(shù)的自適應(yīng)容錯 PPC 方案,能夠在執(zhí)行機構(gòu)故障和飽和下保證姿態(tài)跟蹤誤差的暫穩(wěn)態(tài)性能要求。Liu 等[153]考慮外部干擾和執(zhí)行機構(gòu)影響下的航天器姿態(tài)跟蹤問題,提出了一種自適應(yīng)容錯 PPC 方法,實現(xiàn)了姿態(tài)和角速度跟蹤誤差的預(yù)設(shè)性能收斂。哈爾濱工業(yè)大學(xué)Huang和Duan[154]針對組合體航天器姿態(tài)跟蹤 PPC 問題,考慮慣量不確定性、外部干擾、執(zhí)行機構(gòu)故障和飽和等因素,提出了一種基于非線性 ESO 的抗積分飽和容錯 PPC 方案。 盡管前述的姿態(tài) PPC 方法具備較強的魯棒性、抗干擾性和容錯能力,但大多需要在線估計或觀測,致使算法復(fù)雜度高、計算量大,在星載計算資源嚴重受限的情況下,難以在軌應(yīng)用。為了提高 PPC 算法的實用性,近年來一些學(xué)者探究了低復(fù)雜度的無模型 PPC 方法[155],并在航天控制領(lǐng)域得到了應(yīng)用。Zhou等[156]針對 SO(3) 描述下的航天器姿態(tài)跟蹤問題,提出了一種無坐標的魯棒 PPC 方法,該方法具有簡單的控制器結(jié)構(gòu),無需動力學(xué)參數(shù)信息,但對外部干擾具有強魯棒性。西北工業(yè)大學(xué)殷澤陽等[157-159]針對航天器姿態(tài)穩(wěn)定、跟蹤和組合體航天器姿態(tài)接管控制問題,提出了幾種低復(fù)雜度的無模型 PPC 方法,這些方法無需對模型參數(shù)和干擾進行先驗估計或在線辨識,能夠保證系統(tǒng)輸出在存在參數(shù)不確定性和外部干擾的條件下仍能滿足預(yù)設(shè)的暫穩(wěn)態(tài)性能要求。特別的是,文獻[159] 基于終端滑模設(shè)計了一個指定時間性能函數(shù),并在此基礎(chǔ)上提出了無模型雙層 PPC 方法。Hu等[160]進一步為撓性航天器姿態(tài)跟蹤設(shè)計了一種無模型雙層 PPC 方法。 現(xiàn)有姿態(tài) PPC 方法大多僅能處理暫穩(wěn)態(tài)性能約束,而難以兼顧各類運動和物理約束。文獻 [161] 通過引入一個基于正系統(tǒng)理論的輔助系統(tǒng)來放寬飽和發(fā)生時的性能約束包絡(luò),克服了控制輸入飽和下的 PPC 設(shè)計難題,但該方法仍無法用于處理運動約束下的 PPC 設(shè)計問題。如何在多運動和物理約束并存的情況下,形成有效的姿態(tài) PPC 方法,完成多約束下的航天器姿態(tài)預(yù)設(shè)性能控制是亟待解決的難題。 除了3.1~3.4節(jié)介紹的4種姿態(tài)控制方法外,一些典型的姿態(tài)控制方法還有: 1) 航天器姿態(tài)輸出反饋控制。由于成本和容積的限制,一些衛(wèi)星(尤其是小型化衛(wèi)星)通常不裝備角速度測量元件,或因傳感器故障,導(dǎo)致其無法獲得角速度測量信息。輸出反饋控制能夠在角速度信息缺失下實現(xiàn)控制目標。傳統(tǒng)方法基于航天器姿態(tài)動力學(xué)的無源性(Passivity),利用姿態(tài)信息設(shè)計輸出反饋控制器[162]。但這類方法需要在控制設(shè)計中額外引入一個動態(tài)環(huán)節(jié),降低了系統(tǒng)的動態(tài)響應(yīng)?;跔顟B(tài)觀測器的輸出反饋控制方法是另一種被廣泛應(yīng)用的方法。美國德克薩斯大學(xué)奧斯汀分校的Akella等[163]提出了全局漸近收斂的角速度觀測器,并利用觀測信息設(shè)計了類 PD 姿態(tài)控制器,解決了觀測器和控制器之間分離性質(zhì)(Separation Property)難以建立的難題,證明了閉環(huán)系統(tǒng)的穩(wěn)定性。 2) 航天器姿態(tài)事件觸發(fā)控制(Event-triggered Control, ETC)?,F(xiàn)有航天器姿態(tài)控制方法大多是時間驅(qū)動的,即控制指令更新和通信是周期性采樣的。盡管周期性采樣易于工程實現(xiàn),但從資源利用的角度來看,周期性采樣和控制方式不可避免地會導(dǎo)致大量的計算和通信資源浪費。ETC 為克服這一問題提供了解決思路,該方法通過預(yù)先設(shè)定閾值和觸發(fā)條件,保證控制指令和通信僅在特定事件觸發(fā)時才執(zhí)行,極大降低了控制指令和通信的更新頻率[164]。文獻[165] 首次在 ETC 框架下研究了航天器的姿態(tài)穩(wěn)定控制問題,通過設(shè)計基于狀態(tài)的觸發(fā)條件保證姿態(tài)信息和控制指令只在離散的觸發(fā)時刻被傳遞和更新。筆者團隊[166]在角速度和通信資源受限的情況下,提出了一種基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)事件觸發(fā)姿態(tài)機動控制算法,有效降低了通信資源消耗。 3) 航天器姿態(tài)智能控制。隨著人工智能技術(shù)的迅猛發(fā)展,在航天器控制中得到了廣泛的關(guān)注與應(yīng)用。在文獻[167-168]中,全面分析并展望了智能方法在解決航天任務(wù)中執(zhí)行器故障、參數(shù)不確定、控制性能優(yōu)化等問題的案例,為多約束下的航天器姿態(tài)控制設(shè)計提供了嶄新的途徑。針對模型參數(shù)不確定性,文獻[169]提出了一種智能 PD 撓性航天器姿態(tài)控制器,利用徑向基函數(shù)(Radial Basis Function,RBF)網(wǎng)絡(luò)以實現(xiàn)對未知擾動項的補償。Schram等[170]則設(shè)計了智能自適應(yīng)姿態(tài)控制算法,利用強化學(xué)習(xí)技術(shù)對不確定性進行在線逼近,實現(xiàn)了高精度姿態(tài)跟蹤。在文獻[171] 中,基于深度神經(jīng)網(wǎng)絡(luò)的參數(shù)估計設(shè)計了自適應(yīng)魯棒姿態(tài)跟蹤算法。Li等[172]針對分布式航天器的姿態(tài)協(xié)同跟蹤問題,設(shè)計了自適應(yīng)神經(jīng)網(wǎng)絡(luò)逼近系統(tǒng)不確定項,從而進一步設(shè)計反饋控制器。面向執(zhí)行機構(gòu)故障,Baldi等[173]使用 RBF 網(wǎng)絡(luò)建立主動容錯控制系統(tǒng)對故障產(chǎn)生的控制偏差進行補償,實現(xiàn)了容錯故障跟蹤控制。Chen和Tao[174]也采用 RBF 網(wǎng)絡(luò)構(gòu)建閉環(huán)自適應(yīng)容錯控制器,實現(xiàn)了存在未知死區(qū)和不確定擾動的姿態(tài)高精度跟蹤。文獻[175] 考慮了多個控制力矩陀螺多種故障發(fā)生的工況,采用深度神經(jīng)網(wǎng)絡(luò)建立了自適應(yīng)容錯控制架構(gòu),實現(xiàn)了高精度的容錯控制。針對控制性能的優(yōu)化,Liu等[176]針對組合航天器的姿態(tài)跟蹤,基于 Q-learning 的方法實現(xiàn)利用離線數(shù)據(jù)學(xué)習(xí)的控制器設(shè)計。在文獻[177] 中,使用深度神經(jīng)網(wǎng)絡(luò)替代傳統(tǒng)的 PID 算法設(shè)計姿態(tài)跟蹤控制器,并利用遺傳算法進行網(wǎng)絡(luò)初始權(quán)值的選取,提升了智能算法的部署效率。Zhang等[178]設(shè)計了一種 PID-Guide TD3 的學(xué)習(xí)算法,用來訓(xùn)練航天器姿態(tài)控制器, 利用 PID 控制器作為引導(dǎo)訓(xùn)練,提高了傳統(tǒng) TD3 算法的離線學(xué)習(xí)效率。筆者團隊[179-181]最近提出了一系列基于在線學(xué)習(xí)的在線強化學(xué)習(xí)控制策略,實現(xiàn)了航天器在線最優(yōu)姿態(tài)控制,并在半物理實驗平臺上得到了驗證。 限于篇幅,其他方法在這里不再介紹。 針對航天器姿態(tài)規(guī)劃與控制面臨的各類復(fù)雜約束,自主規(guī)劃與控制技術(shù)從滿足飛行任務(wù)需求出發(fā),從系統(tǒng)級、任務(wù)級的規(guī)劃,發(fā)展到設(shè)備級的精細化規(guī)劃與控制,在保障航天器安全與健康運行、延長航天器的在軌壽命具有顯著的學(xué)術(shù)價值和應(yīng)用前景。從當前的研究進展和需要解決的問題來看,建議多約束姿態(tài)規(guī)劃與控制技術(shù)在未來研究的發(fā)展方向為如下幾方面: 1) 復(fù)雜不確定環(huán)境下多約束多目標在線姿態(tài)規(guī)劃技術(shù) 傳統(tǒng)規(guī)劃方法大多是在任務(wù)執(zhí)行前,根據(jù)航天器初始姿態(tài)和目標姿態(tài),預(yù)先規(guī)劃出一條可行軌跡。然而,航天器在執(zhí)行空間對抗、深空探測等任務(wù)的過程中,復(fù)雜不確定的飛行環(huán)境、突發(fā)事件造成的任務(wù)目標改變等因素會導(dǎo)致預(yù)先規(guī)劃難以正常執(zhí)行。所以,需要研究復(fù)雜不確定環(huán)境下的在線快速重規(guī)劃方法,以快速應(yīng)對預(yù)先規(guī)劃失效的問題,在保證航天器在軌飛行安全的前提下盡可能地完成任務(wù)目標。另一方面,隨著空間任務(wù)日趨復(fù)雜,姿態(tài)規(guī)劃問題逐漸由傳統(tǒng)單目標運動規(guī)劃向多約束多目標運動規(guī)劃發(fā)展,需要考慮執(zhí)行時間、能量消耗等性能指標,且面臨的約束更加復(fù)雜,除了常見的靜態(tài)硬約束外,還可能存在動態(tài)軟約束(如時變指向約束、進入禁止區(qū)的時長限制)等。因此,考慮靜態(tài)硬約束、動態(tài)軟約束等復(fù)雜多約束,并綜合各性能指標,研究復(fù)雜不確定環(huán)境下的多約束多目標在線姿態(tài)規(guī)劃技術(shù)是未來值得探討的問題。 2) 控制系統(tǒng)能力退化下的柔性任務(wù)重構(gòu)與多約束姿態(tài)控制一體化技術(shù) 當一個或多個執(zhí)行機構(gòu)發(fā)生完全失效、卡死等嚴重故障時,會導(dǎo)致航天器姿態(tài)控制系統(tǒng)能力退化,甚至導(dǎo)致系統(tǒng)由過/全驅(qū)動系統(tǒng)變?yōu)榍夫?qū)動系統(tǒng),嚴重影響了既定空間任務(wù)的順利執(zhí)行以及航天器在復(fù)雜環(huán)境下的運行安全。已有成果大多假設(shè)在執(zhí)行機構(gòu)故障條件下,姿態(tài)控制系統(tǒng)仍是過/全驅(qū)動的,并側(cè)重于保證系統(tǒng)的穩(wěn)定性和穩(wěn)態(tài)性能,而對故障下的系統(tǒng)剩余驅(qū)動能力量化分析的研究尚不多見。從工程的角度來看,控制系統(tǒng)能力退化可能會導(dǎo)致既定的任務(wù)無法完成,需要進行在線任務(wù)重構(gòu)(如任務(wù)降級等),以確??刂葡到y(tǒng)的剩余驅(qū)動能力能夠順利完成任務(wù)。另一方面,控制系統(tǒng)能力下降,尤其是導(dǎo)致系統(tǒng)欠驅(qū)動的情況,會顯著減小航天器姿態(tài)機動路徑的可行空間,給多約束姿態(tài)規(guī)劃與控制設(shè)計帶來了巨大挑戰(zhàn),目前鮮有這方面的研究。因此,亟需開展控制系統(tǒng)能力退化下的柔性任務(wù)重構(gòu)與多約束姿態(tài)控制一體化關(guān)鍵技術(shù)研究,突破控制系統(tǒng)能力量化評估、柔性任務(wù)重構(gòu)、欠驅(qū)動系統(tǒng)姿態(tài)可行空間與能控性分析等關(guān)鍵技術(shù),重點解決欠驅(qū)動系統(tǒng)的多約束姿態(tài)規(guī)劃與控制難題。 3) 基于“數(shù)字孿生 + 深度強化學(xué)習(xí)”的多約束姿態(tài)規(guī)劃與控制技術(shù) 隨著計算機硬件算力的顯著提升,考慮到空間環(huán)境復(fù)雜、未知因素多等特點,以深度強化學(xué)習(xí)為代表的人工智能技術(shù)應(yīng)用于規(guī)劃與控制也將是必然的趨勢。然而,這類方法大多是探索驅(qū)動的,即需要通過積累大量的“動作-反饋”數(shù)據(jù)進行學(xué)習(xí)訓(xùn)練,從而形成最佳策略。但是,對于空間任務(wù)來說,考慮到在軌燃料稀缺、安全性以及部件壽命,航天器不能進行大量的“反復(fù)試錯”,無法獲取豐富的經(jīng)驗數(shù)據(jù)。數(shù)字孿生技術(shù)的出現(xiàn)為這一問題提供了解決思路。數(shù)字孿生可將航天任務(wù)中的復(fù)雜環(huán)境和航天器系統(tǒng)進行數(shù)字化鏡像,從而對約束場景、執(zhí)行機構(gòu)、傳感器等虛擬映射,進而實現(xiàn)環(huán)境模擬,約束演化,故障的預(yù)測診斷等。因此,利用數(shù)字孿生技術(shù)可以讓智能算法積累與真實環(huán)境近乎相同的“探索經(jīng)驗”,并根據(jù)傳感的數(shù)據(jù)實時更新孿生模型。通過“數(shù)字孿生 + 人工智能”的模式,實現(xiàn)數(shù)據(jù)模型混合驅(qū)動的多約束在線規(guī)劃與控制必將是今后發(fā)展的重要方向。 4) 基于合作博弈強化學(xué)習(xí)的細胞衛(wèi)星姿態(tài)接管控制技術(shù) 隨著微小衛(wèi)星技術(shù)的發(fā)展,以利用多個細胞衛(wèi)星附著在失效航天器上實施接管控制為代表的技術(shù),為航天器的在軌維護提供了新的發(fā)展方向。在細胞衛(wèi)星附著組合后,航天器具有冗余的執(zhí)行機構(gòu)和較高的可靠性。為了使各個細胞衛(wèi)星能夠協(xié)調(diào)控制并使得控制的代價消耗最小,對于每個細胞衛(wèi)星來說都是一個合作博弈的過程,即“付出最小的單體代價,實現(xiàn)整體最優(yōu)目標”。而傳統(tǒng)的控制技術(shù)難以應(yīng)對這一需求?;谖⒎植┺牡暮献骺刂撇呗允菍崿F(xiàn)這一任務(wù)的解決方案??紤]到細胞衛(wèi)星附著后的組合體質(zhì)量特性未知,且多體博弈控制所轉(zhuǎn)化而成的數(shù)值優(yōu)化問題較為復(fù)雜,難以利用已有基于模型的數(shù)值求解工具進行求解。而以自適應(yīng)動態(tài)規(guī)劃為代表的強化學(xué)習(xí)技術(shù)為這一新興任務(wù)提供了解決途徑。因此,研究基于強化學(xué)習(xí)的合作博弈控制技術(shù)是面向細胞衛(wèi)星接管控制為代表的新興航天任務(wù)的技術(shù)基礎(chǔ),也是未來航天器在軌服務(wù)技術(shù)發(fā)展的新方向。 5) 多約束下的航天器編隊飛行分布式協(xié)同規(guī)劃與控制技術(shù) 近年來,隨著星載計算、通信、傳感等技術(shù)的迅猛發(fā)展,利用多顆小型衛(wèi)星構(gòu)成一個大規(guī)模的航天器編隊系統(tǒng),并通過無線通信與感知形成特定的構(gòu)型進行自主協(xié)同飛行,協(xié)作地完成傳統(tǒng)大型單航天器無法完成的大孔徑、長基線等新興空間探測和成像任務(wù),已成為航天技術(shù)發(fā)展的新趨勢。相比于單航天器系統(tǒng),編隊系統(tǒng)具有研發(fā)周期短、適用性強、容錯性高等特點,以及快速的空間響應(yīng)能力和空間攻防對抗下的空間任務(wù)保護與生存能力,在科學(xué)研究、國民經(jīng)濟以及國防建設(shè)等領(lǐng)域發(fā)揮著至關(guān)重要的作用。在編隊系統(tǒng)運行的過程中,各航天器之間需要保持通信并避免碰撞,這給協(xié)同規(guī)劃與控制算法設(shè)計帶來了復(fù)雜約束,同時空間環(huán)境往往是高動態(tài)的,任務(wù)也可能是變化的,這都對規(guī)劃和控制算法的在線適應(yīng)能力提出了更高的要求。另外,編隊飛行任務(wù)可能會發(fā)生一個或多個成員故障或損毀、新航天器補充等情況,這對編隊系統(tǒng)的任務(wù)協(xié)同、編隊飛行安全以及通信拓撲帶來了巨大挑戰(zhàn)?,F(xiàn)有的編隊系統(tǒng)協(xié)同規(guī)劃與控制方法大多沒有考慮復(fù)雜約束條件,且大多采用集中式處理方式,具有實時性差、響應(yīng)慢、一致性差等缺陷。因此,亟需突破現(xiàn)有局限,設(shè)計具有強約束處理能力的航天器編隊分布式協(xié)同規(guī)劃與控制技術(shù)、成員故障或損毀下的“任務(wù)重規(guī)劃-編隊構(gòu)型重構(gòu)”一體化在線規(guī)劃與控制技術(shù)等,保證多約束下的航天器編隊系統(tǒng)飛行安全和穩(wěn)定性。 隨著航天器自主規(guī)劃與控制技術(shù)的不斷發(fā)展以及在深空探測、在軌服務(wù)等一系列航天任務(wù)的成功應(yīng)用,極大提升了航天器的自主性和智能化水平。多約束姿態(tài)規(guī)劃與控制技術(shù)是保證航天器在復(fù)雜空間環(huán)境下穩(wěn)定可靠運行并安全實施各類空間任務(wù)的關(guān)鍵,因此受到了廣泛的關(guān)注與深入的研究。本文在總結(jié)航天器姿態(tài)機動任務(wù)所面臨的各類約束的基礎(chǔ)上,梳理了現(xiàn)有航天器多約束姿態(tài)規(guī)劃與控制方法的設(shè)計思路,并對各方法的優(yōu)缺點和部分代表成果進行了綜述。最后,面向航天任務(wù)未來需求,給出了航天器多約束姿態(tài)規(guī)劃與控制技術(shù)的發(fā)展方向。1.4 廣義約束
2 多約束姿態(tài)規(guī)劃方法
2.1 幾何方法
2.2 勢函數(shù)方法
2.3 離散化方法
2.4 基于隨機規(guī)劃算法的姿態(tài)規(guī)劃方法
2.5 基于數(shù)值優(yōu)化的姿態(tài)規(guī)劃方法
2.6 基于人工智能的姿態(tài)規(guī)劃方法
3 航天器姿態(tài)控制方法
3.1 航天器姿態(tài)自適應(yīng)控制
3.2 航天器姿態(tài)抗干擾控制
3.3 航天器姿態(tài)容錯控制
3.4 航天器姿態(tài)預(yù)設(shè)性能控制
3.5 其他航天器姿態(tài)控制方法
4 發(fā)展趨勢
5 結(jié) 論