張晗,康國華,*,張琪,魏建宇,戴澗峰
1. 南京航空航天大學 航天學院,南京 211106 2. 航天東方紅衛(wèi)星有限公司,北京 100094
在航天器軌道機動中通常需要根據(jù)期望(標稱)軌跡對軌道進行控制,矯正運動中的位置與速度誤差。為適應(yīng)復(fù)雜空間環(huán)境的影響,要求運動控制策略必須滿足強魯棒性、高精度及穩(wěn)定性等性能屬性[1-2]以及安全避障、有限時間收斂、燃料消耗等特定約束條件。
針對空間相對動力學的控制問題,文獻[3]基于狀態(tài)轉(zhuǎn)移矩陣研究了空間多脈沖懸停的多脈沖控制方法。文獻[4]使用高斯偽譜法生成了航天器交會逼近問題的優(yōu)化解決方案,并使用閉環(huán)控制對軌跡進行跟蹤優(yōu)化。文獻[5]提出一種以最小時間算法執(zhí)行航天器大角度機動的改進滑模控制方法,并與先前開發(fā)的控制方案本征四元數(shù)調(diào)節(jié)器進行對比,驗證了該算法的優(yōu)越性。為保障追蹤航天器的安全,文獻[6]針對航天器近距離逼近問題,在建立的相對運動和避碰模型的基礎(chǔ)上,設(shè)計了考慮外界擾動上界已知和未知兩種情況下的有限時間收斂避碰控制器,并通過Lyapunov理論和避碰勢函數(shù)證明控制器系統(tǒng)能在有限時間收斂。上述方法成功地將多種約束條件引入航天器相對動力學模型中,為本文提出的滑模控制約束條件的引入提供了基礎(chǔ)。
隨著航天器任務(wù)變軌需求的增加和軌控能力增強,目前很多成熟控制方法開始應(yīng)用于航天器相對變軌任務(wù)中。其中,滑??刂?sliding mode control, SMC)因其良好的魯棒性以及擾動抑制能力[7],被廣泛使用。文獻[8]提出一種魯計模糊神經(jīng)網(wǎng)絡(luò)(FNN)自適應(yīng)調(diào)節(jié)滑??刂破?,能夠在航天器質(zhì)量分布改變時仍然保持控制器的有效性和穩(wěn)定性。文獻[9]就橢圓軌道上的航天器近距離無碰撞交會相對運動控制進行了研究,提出一種結(jié)合最優(yōu)滑模控制(OSMC)和人工勢函數(shù)(APF)的防撞自主混合控制算法,實現(xiàn)空間交會的無碰撞接近控制。上述算法基于有限時間、最優(yōu)控制以及防碰撞等約束條件,與滑??刂评碚撓嘟Y(jié)合進行了研究,并成功應(yīng)用到航天器變軌控制任務(wù)中,為本文研究多約束的變軌滑??刂频於斯こ虒崿F(xiàn)基礎(chǔ)。
然而,在實際的航天器軌道相對運動控制任務(wù)中,滑模控制器控制參數(shù)取值直接影響了控制的效果和精度[10],以及燃料消耗的情況?;诖?,本文在指數(shù)趨近的滑??刂破骰A(chǔ)上,提出一種綜合考慮時間、燃耗以及誤差的參數(shù)自主尋優(yōu)規(guī)則。首先,深入分析了各項控制參數(shù)在量級取值上的約束條件,融入避碰時間約束制定了控制參數(shù)量級尋優(yōu)規(guī)則;其次,采用慣性權(quán)值優(yōu)化的粒子群算法設(shè)計了燃料最優(yōu)、誤差有界的多輸出適應(yīng)度函數(shù),并綜合考慮誤差和燃料約束,確定了系數(shù)尋優(yōu)規(guī)則;最后,輸出最優(yōu)量級/系數(shù)組合的控制參數(shù),實現(xiàn)有限時間內(nèi)的狀態(tài)收斂,使消耗的燃料盡可能最少。
根據(jù)航天任務(wù)的實際需求,在以目標航天器為原點建立的相對運動坐標系中,通常要求追蹤航天器(Sat)在控制指令存在初始誤差和受外界擾動的情況下,能夠在有限時間內(nèi)其運動軌跡收斂至軌跡規(guī)劃器輸出的任務(wù)標稱軌跡(期望軌跡),如圖1所示。
圖1 相對運動坐標系中的軌跡修正控制Fig.1 Trajectory correction control in relative motion coordinate system
鑒于當前空間碎片威脅以及目標機動等突發(fā)因素,該控制過程要求具有抗擾能力:可以處理緊急避障及時間最短等突發(fā)情況。這類相似問題,通常采用滑??刂芠11]處理,但該算法:
1)依據(jù)經(jīng)驗人工調(diào)節(jié)控制參數(shù),自主性弱;
2)通常以誤差收斂精度作為唯一標準,未考慮時間、燃料約束;
3)容易因參數(shù)設(shè)置不合理引起控制抖振[12]。
鑒于軌跡的安全性與燃料的重要性,針對上述問題,需設(shè)計一種能夠需要滿足如下規(guī)則的控制器:
1)可自主完成滑??刂破鲄?shù)設(shè)置;
2)具有實時避障能力,軌跡躲避障礙物收斂至標稱軌跡允許誤差范圍內(nèi);
3)滿足燃料、時間最優(yōu)等參數(shù)設(shè)置要求,且避免抖振。
根據(jù)上述目標,選擇合適的指數(shù)趨近律對滑模偏差控制器進行建模。
滑??刂谱鳛橐活愄厥獾姆蔷€性控制,主要包含兩部分:設(shè)計合適的滑模面;選擇合適的趨近律使系統(tǒng)狀態(tài)向滑模面運動。當系統(tǒng)狀態(tài)到達滑模面后,在滑模面的約束下系統(tǒng)狀態(tài)誤差將實現(xiàn)收斂。構(gòu)建相對變軌控制中滑模偏差控制器:
(1)
s=λe(t)=Cep(t)+Iev(t)
(2)
式中:k=diag[kx,ky,kz]與ε=diag[εx,εy,εz]是待尋優(yōu)的三維參數(shù)。構(gòu)成的滑模偏差控制器:
(λB)-1[-λAe(t)-ks-εsgn(s)]
(3)
為驗證控制器的有效性,需要證明其穩(wěn)定性。首先,根據(jù)上述滑模偏差控制器構(gòu)建Lyapunov函數(shù)如下:
然后,對上式進行求導(dǎo)得:
-ks2-ε|s|
(4)
在式(1)滑模偏差控制器模型基礎(chǔ)上引入滑??刂茀?shù)自主尋優(yōu)器,使其具有參數(shù)自主設(shè)置的能力,構(gòu)建的航天器相對運動軌跡修正控制器如圖2所示。
圖2 航天器相對運動軌跡修正控制器Fig.2 Spacecraft relative motion trajectory correction controller
圖2中的PSO為粒子群算法(particle swarm optimization)。通過分析發(fā)現(xiàn),滑模初始化的控制參數(shù)存在無法尋優(yōu)情況,即在粒子迭代尋優(yōu)之前初始化參數(shù)本身無最優(yōu)空間或?qū)?yōu)耗時極長;通過對各種初始化參數(shù)對比分析發(fā)現(xiàn),若已知各控制參數(shù)的具體量級,在此基礎(chǔ)上使用粒子算法尋找各參數(shù)對應(yīng)量級下的最優(yōu)系數(shù),可使尋優(yōu)的效果更加快速,精確。因此,這里設(shè)置的參數(shù)量級分析模塊,可以通過考慮Lyapunov條件、收斂時間以及外界干擾的約束關(guān)系,確定各參數(shù)對應(yīng)的具體最優(yōu)量級。然后將各參數(shù)量級作為后續(xù)系數(shù)尋優(yōu)模塊的輸入條件,從而更加快速、準確地找到最優(yōu)控制參數(shù)。不失一般性,對圖2算法對應(yīng)的場景作如下假設(shè):
1)航天器受到的干擾力量級已知,范圍有限;
2)軌跡規(guī)劃器已經(jīng)輸出了符合能量最優(yōu)的標稱狀態(tài)與標稱控制;
3)目標航天器未施加主動控制,追蹤航天器具有機動能力(各個方向均安裝推力器,可提供任意矢量方向的推力,施加推力前不需要建立點火姿態(tài));
4)軌跡規(guī)劃器所進行的避障判斷準確有效,能夠為滑??刂茀?shù)尋優(yōu)器提供精確的時間約束,使其在該時刻實際狀態(tài)收斂后就能實現(xiàn)避障。
基于以上假設(shè),對圖2中虛線框出部分進行設(shè)計,主要分為量級尋優(yōu)策略與系數(shù)尋優(yōu)策略兩類。
(1)參數(shù)k與ε的量級尋優(yōu)策略
通過分析,若想讓滑模面在有限時間內(nèi)達到穩(wěn)定點,需修改Lyapunov條件為:
(5)
式中:α為引入的三維中間變量。對改進后的條件進行分離變量和積分:
(6)
式中:tcv為滑模面收斂至0時間。對式(6)左邊積分:
整理式(6)得到α與tcv之間的關(guān)系為:
(7)
聯(lián)立式(4)(5)得到控制器參數(shù)k與ε約束關(guān)系為:
也就是說,只有滿足上式才能使滑模面在有限時間內(nèi)收斂,故將其作為量級尋優(yōu)策略的基礎(chǔ)。
綜合考慮狀態(tài)誤差、滑模面以及控制的有限時間收斂,通過多次調(diào)參測試(見表1),基于如下假設(shè)構(gòu)建參數(shù)k與ε的量級尋優(yōu)模型:針對參數(shù)k,當其與參數(shù)α的量級差小于0時,狀態(tài)誤差不收斂,控制輸出抖振;量級差大于或等于0時,狀態(tài)誤差收斂,控制輸出正常;量級差過大時(大于標準量級差),控制器幾乎失效。于是確定參數(shù)k的量級Nk=[Nkx,Nky,Nkz]與參數(shù)α的量級Nα=[Nαx,Nαy,Nαz]之間的偏差關(guān)系為Dm=Nki-Nαi≥0,i=x,y,z,且經(jīng)過測試,默認Nki越大,燃料消耗越多。針對參數(shù)ε,當其與外界干擾(L)量級差大于0時,控制輸出抖振;量級差小于或等于0時,狀態(tài)誤差收斂,控制輸出正常。于是確定參數(shù)ε的量級Nε=[Nεx,Nεy,Nεz]與干擾的量級NL=[NLx,NLy,NLz]關(guān)系為Dm=Nεi-NLi≤0,i=x,y,z,同樣經(jīng)過測試,默認Nεi越大,燃料消耗越多。
表1 待尋優(yōu)參數(shù)多次測試規(guī)律總結(jié)
根據(jù)上述假設(shè)與多次測試規(guī)律總結(jié),提出以下兩條規(guī)則用以確定參數(shù)k與ε的最優(yōu)量級:
規(guī)則1:對于收斂時間tcv確定的滑模偏差控制器,根據(jù)式(7)確定參數(shù)向量α的量級Nα,取參數(shù)k的量級尋優(yōu)策略為:Nki-Nαi≥ξ1i,i=x,y,z,其中ξ1=[ξ1x,ξ1y,ξ1z]中各個參數(shù)取值范圍大于或等于0(初始值為0,依次加1),直到tcv時狀態(tài)誤差收斂至閾值δtcv;tcv→tF時段收斂至δtcv→tF且不出現(xiàn)抖振,輸出確定的參數(shù)向量k的最優(yōu)量級為Nk。
規(guī)則2:若已知干擾參數(shù)的向量L對應(yīng)的量級NL=[NLx,NLy,NLz],取參數(shù)ε的量級尋優(yōu)策略為:Nεi-NLi=ξ2i,i=x,y,z,其中ξ2=[ξ2x,ξ2y,ξ2z]中各個參數(shù)取值范圍在[δε,0] (初始值為0,依次減1),直到tcv時狀態(tài)誤差收斂至閾值δtcv;tcv→tF時段收斂至δtcv→tF且不出現(xiàn)抖振,輸出確定的參數(shù)向量ε的最優(yōu)量級為Nε,如圖3所示。
圖3 參數(shù)k與ε的量級尋優(yōu)規(guī)則Fig.3 Magnitude optimization rule for parameters kand ε
(2)參數(shù)λ的量級/系數(shù)確定策略
根據(jù)式(3)設(shè)計的滑模偏差控制器,能夠使整個系統(tǒng)的狀態(tài)s在有限時間內(nèi)收斂至滑模面上,但系統(tǒng)的狀態(tài)誤差e(t)只能在無窮時刻才能收斂至零。因此,需要對狀態(tài)誤差收斂的程度進行分析。首先,在式(2)的基礎(chǔ)上得出下式:
若取狀態(tài)誤差的收斂時間為tcv,且用參數(shù)βi=Citcv,i=x,y,z表示狀態(tài)誤差的收斂程度,從而確定誤差量級譜的公式如下:
Nβi=[lg |epi(0)e-βi|]
(8)
當參數(shù)k與ε一定時,改變參數(shù)λ,工質(zhì)的消耗與收斂的速度成反比。在保障安全的情況下,收斂時間tcv越長,消耗的燃料越少。然后,根據(jù)誤差精度的要求,確定合適的收斂量級βi,從而確定參數(shù)C的值,即確定參數(shù)λ。
(1) 慣性權(quán)值變化的粒子群算法
傳統(tǒng)的粒子群算法在早期的收斂速度過快,極易陷入局部最優(yōu)[14]。因此,文獻[15]引入慣性權(quán)值ω用以反映粒子依賴本身運動習慣的程度,將粒子的狀態(tài)轉(zhuǎn)移方程改寫成如下形式:
vi(t+1)=ωvi(t)+c1r1[pi(t)-xi(t)]+
c2r2[g(t)-xi(t)]xi(t+1)=
xi(t)+vi(t+1)
式中:xi(t)=(xi1,xi2,…,xid)表示粒子位置;vi(t)=(vi1,vi2,…,vid)表示粒子方向和速度;i∈[1,N],N為設(shè)置粒子總數(shù);c1和c2表示學習因子,反映粒子對自身歷史經(jīng)驗記憶的依賴程度;r1和r2是在[0,1]區(qū)間變化的隨機加速度權(quán)重系數(shù)。
慣性權(quán)值的設(shè)置對算法影響較大,主要規(guī)律為:1)當慣性權(quán)值ω較大時,算法在全局搜索上表現(xiàn)較強;2)當慣性權(quán)值ω較小時,算法在局部搜索上表現(xiàn)力強,收斂性強。已知參數(shù)k與ε的量級,以及初始化粒子期間已獲得的第1個全局極值對應(yīng)的最優(yōu)參數(shù)xi(0)。在此基礎(chǔ)上,構(gòu)建慣性權(quán)值變化模型:當?shù)螖?shù)Mj 規(guī)則3:對于總迭代次數(shù)Mm,給定絕對局部搜索閾值比率為η,于是絕對局部搜索閾值為Mδ=ηMm。當?shù)螖?shù)Mj 式中:km為收斂系數(shù)。當Mj≥Mδ時,令ω=ωmin。 (2)適應(yīng)度值及其評價規(guī)則 1)適應(yīng)度值。將每個粒子攜帶的位置信息作為適應(yīng)度函數(shù)的輸入,并分別計算該位置信息下的適應(yīng)度值,將輸出的適應(yīng)度值設(shè)置為3個參考量:3軸在時刻tcv的誤差絕對值之和eptcv: eptcv=|epxtcv|+|epytcv|+|epztcv| 式中:epxtcv、epytcv、epztcv為時刻tcv時各軸的誤差值;三軸的速度增量Δv為 Δv= 式中:ux、uy、uz分別為在時間段[0,tF]內(nèi)各軸的偏差控制加速度輸出;三軸在時間tcv后的誤差平均值eptcv→tF: eptcv→tF= 2)評價規(guī)則。根據(jù)3個指標,確定初始化階段(階段1,見圖4)和更新階段(階段2,見圖5)的全局極值粒子以及所有粒子的個體極值位置,構(gòu)建如下評價規(guī)則。 圖4 階段1的個體與全局最優(yōu)更新規(guī)則Fig.4 Individual and global optimal update rules of stage 1 圖5 階段2的個體與全局最優(yōu)更新規(guī)則示意Fig.5 Individual and global optimal update rules of stage 2 規(guī)則4 (階段1):初始化第一個全局極值的系數(shù)為g=[9.9,9.9,9.9,9.9,9.9,9.9](即參數(shù)k與ε在最優(yōu)量級下能取的最大值),然后該粒子的適應(yīng)度值Fitg[eptcv(g),Δv(g),eptcv→tF(g)]進行計算。當進入循環(huán)迭代后,再對每個粒子個體極值pi,i∈[1,N]的適應(yīng)度值Fiti[eptcv(pi),Δv(pi),eptcv→tF(pi)]進行計算;當同時滿足下述條件eptcv(pi)<δtcv,eptcv→tF(pi)<δtcv→tF以及Δv(pi)<Δv(g)時,更新初始全局極值g。如圖4所示,虛線框出部分對應(yīng)規(guī)則4的判定條件。 利用Matlab搭建算法程序,整個仿真運行環(huán)境如表2所示。 表2 仿真環(huán)境參數(shù) 追蹤航天器在存在初始誤差與外界干擾條件下,在以目標航天器為坐標原點的相對運動坐標系中,進行相對運動軌跡修正控制,仿真參數(shù)如表3所示。 表3 仿真參數(shù)設(shè)置 在本例中,追蹤航天器與目標航天器處于異面狀態(tài),初始條件下的追蹤航天器在相對坐標系下實際狀態(tài)誤差如表4所示(參考軌道高度500 km,初始相對距離約2.69 km,目標航天器在追蹤航天器右前方)。為使整個仿真過程更具一般性,現(xiàn)取3組數(shù)據(jù)加以驗證,并設(shè)計最優(yōu)量級確定策略與最優(yōu)系數(shù)確定策略中的仿真參數(shù)如表5所示(擾動施加為-5量級的正弦函數(shù))。 表4 追蹤航天器在相對坐標下的實際狀態(tài)誤差 表5 最優(yōu)量級/系數(shù)確定策略仿真參數(shù) 根據(jù)表3-5進行仿真環(huán)境初始化,分別驗證參數(shù)自主尋優(yōu)算法中量級尋優(yōu)策略與系數(shù)尋優(yōu)策略的有效性。根據(jù)式(8)得出的參數(shù)β下收斂時間tcv時的誤差量級譜如圖6所示。 圖6 參數(shù)β下收斂時間tcv時的誤差量級譜Fig.6 Error magnitude spectrum at convergence timetcv under parameter β 由圖6分析可知,β的增大使得誤差收斂的精度變高,但是,由于βi=Citcv,i=x,y,z(tcv給定)也會直接導(dǎo)致參數(shù)C(λ)的增大,從而使燃料消耗增多。于是,β的取值應(yīng)該在逐漸增大直至滿足誤差收斂條件的循環(huán)中產(chǎn)生。 根據(jù)表4中的3組數(shù)據(jù)(數(shù)據(jù)編號唯一),結(jié)合參數(shù)λ量級/系數(shù)確定策略得出λ中參數(shù)C的值如表6所示;結(jié)合參數(shù)k與ε的量級尋優(yōu)規(guī)則得出參數(shù)最優(yōu)量級如表7所示。 表6 β自適應(yīng)變化時的參數(shù)C的取值 表7 量級尋優(yōu)策略下的各參數(shù)量級分布 表6和表7證明了參數(shù)λ量級/系數(shù)確定策略與參數(shù)k與ε量級尋優(yōu)策略的有效性,以及對控制精度要求變化的適應(yīng)性。將表6中的值組合形成參數(shù)λ,以及表7中參數(shù)k與ε的最優(yōu)量級,作為系數(shù)尋優(yōu)策略的輸入,得到適應(yīng)度曲線如圖7所示,參數(shù)k與ε的最優(yōu)量級與最優(yōu)系數(shù)組合之后的結(jié)果如表8所示。 表8 參數(shù)自動尋優(yōu)的滑??刂破髦饕阅苤笜思皡?shù)結(jié)果 從圖7可知,在使用粒子群算法進行參數(shù)系數(shù)尋優(yōu),可使適應(yīng)度值(速度增量)在有限迭代次數(shù)達到收斂,確定各參數(shù)在其量級下的最優(yōu)系數(shù)。由表8可知,參數(shù)自主尋優(yōu)過程可使滑??刂破髦械母黜梾?shù)的值穩(wěn)定至小數(shù)點后多位,這是人為設(shè)置參數(shù)難以達到的精度;同時,對比表4可知,尋優(yōu)器輸出的速度增量變化與誤差初始值的大小成正比,符合一般性。此外,為驗證尋優(yōu)器性能,針對表4序號1的數(shù)據(jù)做了50次測試,得出系數(shù)尋優(yōu)策略的速度增量變化如圖8所示。 圖8 速度增量50次測試(表4序號1數(shù)據(jù))Fig.8 Speed increment test,50 times (No. 1 data,Table 4) 結(jié)果說明,粒子群算法的隨機性導(dǎo)致適應(yīng)度值中的速度增量并不唯一(即系數(shù)組合不唯一),但始終在平均值附近波動,并未出現(xiàn)不合理的結(jié)果,進一步驗證了系數(shù)尋優(yōu)策略的有效性與穩(wěn)定性。最后,將表8中序號為1的6個參數(shù)代入滑模偏差控制器,最終得到的位置誤差曲線、速度誤差曲線如圖9~10所示。 圖9 位置誤差曲線(表8序號1數(shù)據(jù))Fig.9 Position error curve (No.1 data,Table 8) 圖10 速度誤差曲線(表8序號1數(shù)據(jù))Fig.10 Speed error curve (No.1 data,Table 8) 綜上,使用本文提出的量級/系數(shù)組合參數(shù)自主尋優(yōu)器,可以優(yōu)化滑模控制器手動且無規(guī)律參數(shù)設(shè)置步驟,輸出粒子群算法優(yōu)化的最優(yōu)量級/系數(shù)參數(shù)組合。進一步,該控制參數(shù)組合下的滑模偏差控制器能夠使相對位置和速度誤差在規(guī)定時間和誤差允許范圍內(nèi)達到收斂;同時,結(jié)合圖7~8進行分析,以速度增量降低方向作為評價標準的參數(shù)自主尋優(yōu)器,能夠在有限迭代次數(shù)內(nèi)收斂,說明該參數(shù)自主尋優(yōu)器滿足了燃料最優(yōu)的要求。 本文提出的時間與燃料約束的參數(shù)自主尋優(yōu)變軌滑??刂扑惴?,具有較強的抗干擾能力,通過建立參數(shù)量級與系數(shù)的尋優(yōu)規(guī)則,自主配置控制參數(shù),實現(xiàn)滑模的燃料最優(yōu)控制。該方法融合了相對運動方程與指數(shù)趨近的滑??刂疲⒔Y(jié)合能量最優(yōu)的軌跡規(guī)劃器確定了具體的收斂時間,實現(xiàn)有效避障;其次,分析各控制參數(shù)的量級選取約束條件,制定了量級尋優(yōu)的規(guī)則;然后,結(jié)合慣性權(quán)值優(yōu)化的粒子群算法,限制適應(yīng)度函數(shù)與最優(yōu)系數(shù)更新規(guī)則;最后,輸出最優(yōu)量級與系數(shù)組合的控制參數(shù),實現(xiàn)有限時間收斂的燃料最優(yōu)滑??刂?。通過仿真測試,本文方法輸出的控制參數(shù)組合可使整個控制過程穩(wěn)定收斂、且燃料消耗少。5 仿真校驗與分析
5.1 仿真參數(shù)設(shè)置
5.2 仿真結(jié)果與分析
6 結(jié)論