李敏,袁利,魏春嶺
1.北京控制工程研究所,北京 100190
2.空間智能控制技術重點實驗室,北京 100190
3.中國空間技術研究院,北京 100190
近年來,在軌服務技術逐漸成為各國航天領域關注的重點方向。當在軌服務對象為非合作目標時,由于相關先驗信息少,需要對其進行跟蹤觀測,識別其特征后才能開展后續(xù)的服務過程。通過繞飛從不同方位、不同光照條件下獲取目標的觀測信息是一種有效的跟蹤觀測方式,能夠提煉更加全面的目標特征。然而繞飛觀測是一個長時間過程,期間航天器可能面對許多未知不確定的情況,因而需要航天器控制系統(tǒng)具有自主控制能力,根據(jù)系統(tǒng)運行狀態(tài)改變控制策略,調(diào)整控制器參數(shù),從而應對不確定性情況,自主完成繞飛觀測過程[1-2]。
針對自主繞飛控制問題,目前已經(jīng)有一定的文獻研究了相關控制方法。文獻[3]針對不具備主動機動能力目標的繞飛控制問題,對近圓和橢圓軌道上的航天器間相對運動進行了分析和建模,求解了常值推力下相對運動模型的解析解,通過模型預測方法獲得了全狀態(tài)預期偏差,設計了相對位置保持和循跡繞飛任務下的全狀態(tài)反饋控制器。文獻[4]研究了對無控旋轉目標的強迫繞飛控制問題,建立了視線坐標系的三維相對運動模型,并通過坐標變換將對目標繞飛的三維控制問題轉化視線坐標系旋轉平面內(nèi)的二維控制問題,提出了模糊切換增益調(diào)節(jié)的滑模繞飛控制策略。文獻[5]研究了對橢圓軌道上的非合作目標長期繞飛控制問題,建立了安全約束下的繞飛軌道非線性規(guī)劃模型,采用最優(yōu)控制理論設計了燃料最優(yōu)的繞飛軌道保持控制策略。文獻[6]研究了有限推力下的航天器軌道繞飛與保持控制問題,建立了線性化后的動力學系統(tǒng)模型,結合線性二次最優(yōu)控制理論設計了最優(yōu)反饋繞飛控制器。文獻[7]利用T-H方程建立了航天器繞飛相對運動控制系統(tǒng)模型,基于模型參考控制思想,結合狀態(tài)反饋和參數(shù)化前饋跟蹤補償設計了模型參考繞飛軌跡跟蹤控制器。文獻[8]建立了航天器控制任意方位快速繞飛相對運動模型,設計了基于期望相對繞飛軌跡的跟蹤控制策略。
然而需要指出的是上述大多數(shù)結果中繞飛對象是不具備主動機動能力的目標,且控制策略單一,任務模式簡單[9]。當目標具有主動機動能力時,由于其機動策略未知,可能會給繞飛過程會帶來很多不確定性,甚至會給航天器造成碰撞風險。另一方面,空間環(huán)境的日益擁擠也可能會給航天器繞飛過程中帶來了一定的碰撞風險,因此航天器控制系統(tǒng)需要具備保障航天器在完成自主繞飛任務的同時還能保障航天器與非合作目標以及其他空間目標之間的安全性的能力[10-11]。此外,在繞飛過程中,為了能夠?qū)δ繕诉M行有效觀測,需要根據(jù)光照條件來自主決策觀測窗口,在光照條件好的地方進行長時間觀測,在光照條件差的地方不進行觀測,其任務模式是復雜的,需要根據(jù)不同任務模式來自主改變航天器行為狀態(tài)[12]。因此,針對具有主動機動能力的非合作目標進行繞飛,由于面臨許多不確定性且任務模式復雜,需要航天器具備可靠且更加自主的控制能力,能夠根據(jù)實際情況來選擇合適的控制策略和參數(shù),控制自身行為狀態(tài),例如相對位置保持、繞飛轉移、碰撞規(guī)避等,即具有多種模態(tài)控制能力,來實現(xiàn)既定的控制任務目標的同時還能夠有效規(guī)避空間目標的碰撞威脅事件。有限狀態(tài)機能夠有效描述系統(tǒng)運行邏輯和狀態(tài),并能夠通過設計系統(tǒng)狀態(tài)之間的轉換函數(shù)來實現(xiàn)對系統(tǒng)運行狀態(tài)之間切換的監(jiān)控和決策管理,控制策略和控制參數(shù)的選擇本質(zhì)上也是根據(jù)系統(tǒng)運行狀態(tài)來在已設計好的策略和參數(shù)當中進行切換,因此有限狀態(tài)機整提供了一種可借鑒手段。綜上所述,航天器自主繞飛多模態(tài)控制問題還是一個開放的問題,目前還沒有得到較好的解決。
本文研究了對具有主動機動能力的非合作目標自主繞飛控制問題,提出了基于混雜系統(tǒng)的自主繞飛多模態(tài)控制方法。首先,建立了混雜系統(tǒng)模型,根據(jù)自主繞飛任務目標和安全性分析,定義了遠程接近、近程接近、相對位置保持、繞飛轉移、碰撞規(guī)避、撤離等狀態(tài)以及各個狀態(tài)下的控制目標;為了實現(xiàn)各個狀態(tài)之間的協(xié)調(diào),以狀態(tài)機為基礎建立各個狀態(tài)的自主管理和監(jiān)控方法,定義了狀態(tài)之間相互轉化的函數(shù)關系。其次,根據(jù)不同狀態(tài)的控制目標,設計相應的控制策略,實現(xiàn)對混雜系統(tǒng)的多模態(tài)控制。最后,對提出的自主繞飛控制方法進行了仿真驗證,仿真結果說明了所提出的方法的有效性。
對非合作目標繞飛的全過程自主控制是一個非常復雜的過程,行為狀態(tài)根據(jù)與目標之間的相對運動關系以及任務目標可分為遠程接近、近程接近、相對位置保持、繞飛轉移、碰撞規(guī)避和撤離6個狀態(tài)。在繞飛的過程,航天器既要能夠通過決策對行為狀態(tài)轉換進行自主控制,又要能夠根據(jù)決策給出的行為狀態(tài)對相對運動關系進行控制,被控對象特性混雜,屬于一類典型的混雜系統(tǒng),難以僅用微分方程建立系統(tǒng)模型,本文用混合狀態(tài)機建立混雜系統(tǒng)模型[13]。自主繞飛控制系統(tǒng)的混合狀態(tài)機模型主要分為3個部分:有限狀態(tài)機模型、相對運動模型以及相互之間的轉換函數(shù)。
在對非合作目標自主繞飛觀測過程中,正常情況下,主要為遠程接近、近程接近、相對位置保持、繞飛轉移和撤離5個行為狀態(tài),其狀態(tài)機如圖1所示[14]。
圖1 無碰撞風險下的自主繞飛過程Fig.1 Process of autonomous fly around without collision risk
然而,近年來隨著空間碎片的增加以及大型星座的建造使得軌道空間越來越擁擠,航天器面臨的碰撞風險激增。此外,非合作目標自身具有機動能力,也可能給航天器帶來碰撞風險,使得航天器的安全性受到威脅。為了能夠使得航天器在軌運行過程中能夠有效規(guī)避碰撞威脅事件,從安全性考慮,需要引入碰撞規(guī)避狀態(tài),即檢測到碰撞風險時,對碰撞威脅進行規(guī)避。由于航天器為高價值資產(chǎn),任何時候都不希望出現(xiàn)事故,因此碰撞威脅規(guī)避的優(yōu)先級最高,即任何行為狀態(tài)下,一旦檢測到碰撞風險都需要進入碰撞威脅規(guī)避行為狀態(tài)。因此,在原來的基礎上,對非合作目標繞飛過程設計為由遠程接近、近程接近、相對位置保持、繞飛轉移、碰撞規(guī)避和撤離6個狀態(tài)組成的新狀態(tài)機,如圖2所示。
圖2 對非合作目標自主繞飛狀態(tài)機模型Fig.2 State machine model of autonomous fly-around for non-cooperative target
T={Ti} (i=0,1,2,3,4,5)表 示 狀 態(tài) 之 間的轉換函數(shù),決定航天器6個行為狀態(tài)的轉換。另外,為了方便后續(xù)描述,定義Q={q0,q1,q2,q3,q4,q5}分別表示表示遠程接近、近程接近、相對位置保持、繞飛轉移、碰撞威脅規(guī)避和撤離等6個行為狀態(tài)。
為了方便描述航天器的相對軌道運動行為,首先構建相關坐標系,如圖3所示。其中:FI表示地心慣性坐標系,原點為地心,X軸指向春分點,Z軸指向天球北極,Y軸與其它兩軸構成右手坐標系;Fo表示參考質(zhì)點軌道坐標系,原點即為參考質(zhì)點,Zo軸從參考質(zhì)點指向地心,Yo軸垂直于瞬時軌道平面并指向軌道面的負法線方向,Xo軸指向與其他兩軸構成右手坐標系。圖3中航天器P和航天器E分別為繞飛航天器和非合作目標,航天器C為空間其他目標,存在一定的碰撞風險。
圖3 相關坐標系Fig.3 Relevant coordinate system
假設航天器E具有主動機動能力,在不考慮軌道攝動及其他外部擾動情況下,根據(jù)文獻[15],可知在參考軌道坐標系Fo下,航天器P、航天器E以及空間其它目標C與參考質(zhì)點之間的相對運動方程為
式中:ρi1=[xi,yi,zi]T表示坐標系Fo下航天器i與參考質(zhì)點的相對位置矢量,其中i={P,E};ρi2=[vxi,vyi,vzi]T表示坐標系Fo下航天器i的相對速度矢量;fi=-μri/r3i+μrR/r3R,rR=[0,0,-rR]T,rR表示參考質(zhì)點的軌道半徑,ri=為地球引力常數(shù);ui=[uxi,uyi,uzi]T表 示 航 天 器i的 控 制 輸 入;A1=-[ωR×]2;A2=-2ωR×;ωR×表 示 向 量ωR=[0,-θ˙,0]T的反對稱矩陣˙表示參考質(zhì)點軌道角速度。
定義ρPE1=ρP1-ρE1和ρPE2=ρP2-ρE2表示航天器P和航天器E之間的相對位置矢量和相對速度矢量,根據(jù)式(1)和式(2)可得航天器P和航天器E之間的相對運動關系方程為
式中:ρPE1=[x,y,z]T;ρPE2==[vx,vy,vz]T;fPE=fP-fE=-μrP/r3P+μrE/r3E。
注釋1航天器C泛指空間其他目標,不具有主動碰撞意圖,航天器P在對航天器E自主繞飛過程中與航天器C之間的碰撞風險是隨機突發(fā)事件。航天器P在碰撞威脅規(guī)避過程中與航天器C之間的相對運動與式(3)類似,這里不做詳細說明,用ρPC和ρ˙PC表示兩者之間的相對距離和速度。
根據(jù)式(3)可以看出航天器P和航天器E之間的相對運動受航天器P和航天器E的控制策略共同影響,由于航天器E是非合作目標,uE是未知的,因此具有博弈性質(zhì),相對運動關系的可控性和穩(wěn)定性未知。此外,空間其它目標的軌道運動與航天器P的軌道運動存在交會,可能存在碰撞風險,航天器P要較好地實現(xiàn)繞飛任務且保障自身安全性,需要根據(jù)與空間目標的相對運動關系自主決策改變行為狀態(tài),并根據(jù)對應行為狀態(tài),建立控制任務目標設并計合適的控制策略使得系統(tǒng)滿足指標要求。
分析各個行為狀態(tài)下對相對運動關系的需求,建立相應行為狀態(tài)控制目標如下所示。
1) 遠程接近狀態(tài)
遠程接近狀態(tài)是指通過制導接近目標,使得與目標之間的相對距離滿足期望要求,即
式中:d為與目標實際相對距離;||ρPE1||=為近程接近開始的期望相對距離;ε為允許的誤差范圍。
2) 近程接近狀態(tài)
近程接近狀態(tài)是指通過高精度制導使得航天器P到達期望的繞飛位置,即
式 中:ρn,ref為 期 望 繞 飛 位 置,ρn,ref滿 足||ρn,ref||<d0,ref。
3) 相對位置保持狀態(tài)
相對位置保持狀態(tài)的目的主要是航天器P用于狀態(tài)調(diào)整或者在有利位置對航天器E進行成像觀測,這個狀態(tài)下要求航天器P與航天器E之間的相對位置保持穩(wěn)定[14],即
式中:ρPE1,k表示某一固定相對位置。
4) 繞飛轉移狀態(tài)
繞飛轉移是為能夠?qū)Ψ呛献髂繕诉M行多方位觀測,更好的認知目標,一般為共面繞飛,即要求航天器P與航天器E始終共面。為了保障航天器P與航天器E共面,如圖4所示,需要對繞飛軌跡進行規(guī)劃,使得繞飛軌跡與航天器E共面,然后設計控制策略使得航天器P跟蹤參考軌跡即可實現(xiàn)航天器P對航天器E的共面繞飛[15]。
圖4 繞飛軌跡Fig.4 Track of fly-around
假設繞飛半徑為r,繞飛軌跡所處的平面為W,根據(jù)幾何關系可知,繞飛軌跡為平面與半徑為r的球面與平面W的交線,即
式中:a、b和c為已知實數(shù),可根實際情況進行選擇。
根據(jù)繞飛任務要求,求解式(7)即可得到繞飛軌跡曲 線參數(shù)ρr,ref和ρ˙r,ref。繞 飛轉移過 程 實際就是跟蹤參考軌跡曲線過程,即
式中:表示期望軌跡跟蹤速度。
5) 碰撞規(guī)避狀態(tài)
在碰撞規(guī)避狀態(tài),航天器的目標主要是進行碰撞威脅規(guī)避控制。設航天器之間安全距離為ds,航天器之間的碰撞預警距離為dc,當兩者之間距離為||ρPi1||≤dc(i={E,C}),且1/||ρPi1||>0時存在碰撞威脅,此時航天器需要改變行為狀態(tài),通過控制使得與目標之間保持在安全距離[16],即
式中:ρPi1表示與航天器E以及其他空間目標C之間的相對位置;εs為允許誤差。
6) 撤離狀態(tài)
撤離狀態(tài)的目的是當航天器結束繞飛任務后,使其能夠返回至既定的目標軌道,即
式 中:ρc,ref、和分 別 表 示 參 考 軌 道 坐 標 系下既定目標軌道位置、軌道速度及軌道加速度。
注釋2在對目標觀測過程中,考慮到光學載荷對目標觀測受到與目標是否逆光的條件影響,只有處于與目標的非逆光條件下才能對目標進行有效觀測,因此對目標進行繞飛觀測時,選取的觀測點需要滿足非逆光條件,即
式中:θ=2π/3,表示ρPE1與太陽光矢量之間的不被允許的逆光角度;εθ表示允許的偏差;s表示地心慣性系下太陽光矢量在參考軌道坐標系下的矢量投影,s=R(φ,φ,?)sg,sg表示太陽光矢量在地心慣性坐標系下的投影;˙(φ,φ,?)=-ωR×R(φ,φ,?),R(φ,φ,?)表示地心慣性坐標系到軌道坐標系的轉移矩陣[17]。此外,考慮到若相鄰的2個觀測點之間的弧度較小可能無法獲取目標的新的觀測信息,因此,從一個觀測方位繞飛轉移到另一個觀測方位需要大于一定的弧度。
注釋3式(5)、式(6)、式(8)以及式(10)所示的條件僅理論數(shù)值上成立,考慮到實際系統(tǒng)存在一定的誤差,因此在實際情況下需要考慮允許的誤差大小。
為了實現(xiàn)對非合作目標繞飛的自主控制,航天器P的狀態(tài)qh(h=0,1,…,5)之間要能夠自主根據(jù)相對運動關系進行決策自主進行行為狀態(tài)轉換。因此需要根據(jù)定義的狀態(tài)集合Q={qh}(h=0,1,…,5),設 計 相 應 的 狀 態(tài) 轉 換 函數(shù)Tl(l=0,1,…,5)實現(xiàn)狀態(tài)qh1與qh2(h1≠h2;h1,h2=0,1,…,5)之間的自主轉換。設計Tl為由一系列事件集和狀態(tài)qh組合構成的邏輯函數(shù)。
定義事件集E={ej}(j=1,2,…,8),其中e1表示繞飛任務;e2表示遠程接近;e3表示近程接近,e4表示相對位置保持;e5表示目標觀測;e6表示碰撞威脅規(guī)避;e7表示繞飛轉移;e8表示撤離;ej=1或者ej=0(j=1,2,…,8)表示事件的發(fā)生或者結束(未發(fā)生)。為了實現(xiàn)事件的自主觸發(fā),根據(jù)1.2節(jié)當中的各個行為狀態(tài)下的控制目標設計事件ei的觸發(fā)條件如表1所示。
表1 事件集合及觸發(fā)條件Table 1 Event collection and triggered condition
注釋4表1中n表示繞飛圈數(shù);nref表示期望的繞飛圈數(shù);t表示繞飛花費的總時長,tt,ref表示繞飛任務期望的總時長;to表示某一觀測方位上花費的觀測時長;to,ref表示某一觀測方位上期望的觀測時長。
注釋5ρn,ref表示近程接近過程中的期望繞飛位置,ρf,ref表示繞飛轉移過程中arccos(ρTPE1(tk-1)ρPE1/(||ρPE1(tk-1)||||ρPE1||))>2π/m&arccos(-ρTPE1s/||ρPE1||)≤θ+εθ滿足時的位置;ρPE1(tk-1)表示上一次觀測目標的相對位置,ρPE1(tk)表示e6=0條件滿足時的航天器與繞飛目標的相對位置,只在q4狀態(tài)下檢測事件e6作為事件e4的判斷條件。
注釋6ε、εc和εθ表示允許的偏差;δn、δv和δa表示相對位置、速度和加速度允許的偏差向量。
注釋7繞飛轉移結束,即e7=0表示航天器從上一個滿足對目標觀測條件的方位到現(xiàn)在的滿足對目標觀測條件的方位已經(jīng)繞飛轉移至少超過2π/m,m為正整數(shù),根據(jù)實際情況設計。
注釋8事件ej(j=1,2,…,8)當中部分事件屬于全局事件,部分事件屬于局部事件,全局事件在所有行為狀態(tài)下都會被檢測,局部事件只有在特定的行為狀態(tài)下才會被檢測,其中e1、e4、e6和e8為全局事件,e2、e3、e5和e7為局部事件。
注釋9表1為事件發(fā)生和結束的條件,并不決定航天器的行為狀態(tài)轉換,相應的事件信息需要反饋到行為狀態(tài)監(jiān)控與管理模塊,根據(jù)航天器的當前行為狀態(tài)以及狀態(tài)轉換函來決定航天器的行為狀態(tài)是否發(fā)生改變,行為狀態(tài)轉換函數(shù)具體見表2。
表2 狀態(tài)轉換及轉換函數(shù)Table 2 State transition and transition functions
根據(jù)設計的事件觸發(fā)條件,為了協(xié)調(diào)系統(tǒng)運行,保障繞飛任務的完成和航天器自身的安全性,設 計 行 為 狀 態(tài)qh1到qh2(h1≠h2;h1,h2=0,1,…,5)之間的轉換函數(shù),具體如表2所示。
通過邏輯分析可知,各狀態(tài)轉換函數(shù)之間為互斥的,即各個狀態(tài)轉換函數(shù)不存在同時為真的情況,不存在沖突,邏輯是自洽的,能夠保證系統(tǒng)的協(xié)調(diào)。
注釋10空間環(huán)境的不確定導致航天器任務的執(zhí)行不確定性,通過建立狀態(tài)機模型用于對航天器的行為狀態(tài)監(jiān)控和管理,使得航天器能夠自適應改變自身的行為狀態(tài),更加自主的應對空間環(huán)境和任務的不確定性。狀態(tài)轉換函數(shù)是狀態(tài)機的重要組成部分,決定狀態(tài)機的各個狀態(tài)之間的跳轉。狀態(tài)轉換函數(shù)是由航天器的行為狀態(tài)和一系列事件串構成的邏輯函數(shù),狀態(tài)轉換函數(shù)的設計要避免相互之間的邏輯沖突,要保障狀態(tài)機的有序和有向運行。
注釋11航天器的行為狀態(tài)轉換是由航天器當前的行為狀態(tài)和當前發(fā)生的事件串來決定的,只有特定的行為狀態(tài)下特定的事件串為真的情況才會改變航天器的行為狀態(tài),使其進入下一個對應的行為狀態(tài),其它情況下,則維持當前狀態(tài)不改變,即使該事件發(fā)生也不會改變航天器的行為狀態(tài),例如從遠程接近狀態(tài)進入近程接近狀態(tài)后,假設此時事件e2=1,它并不會讓航天器由近程接近狀態(tài)跳轉為遠程接近狀態(tài),不會在這兩個狀態(tài)之間來回切換,因為在近程接近狀態(tài)下沒有狀態(tài)轉換函數(shù)使得航天器可以跳轉到遠程接近狀態(tài)。
根據(jù)1.1節(jié)~1.3節(jié)的描述,自主繞飛控制系統(tǒng)的混雜模型可以用如下所示的混合狀態(tài)機模型進行描述[18-19]。
式中:Q={qh}(h=0,1,…,5)表示有限狀態(tài)集合;X={ρPE1,}表示連續(xù)變量;E={ej}(j=1,2,…,8)表示離散事件集合;U={uph(t)}表示連續(xù)動態(tài)系統(tǒng)分段控制策略;T={Tl}(l=0,1,2,…,5)表示狀態(tài)轉換函數(shù);Y、f、Init和Inv分別為連續(xù)動態(tài)系統(tǒng)輸出變量集合、連續(xù)動態(tài)系統(tǒng)微分方程、系統(tǒng)初始值和連續(xù)變量約束邊界。
考慮到自主繞飛過程中各個行為狀態(tài)下的控制目標不一樣,因此控制策略需要根據(jù)實時控制目標進行自主調(diào)整。本節(jié)要解決的問題是針對各個行為狀態(tài)下的控制目標設計自主繞飛控制策略設計使得各個行為狀態(tài)之間的轉換過程中,系統(tǒng)動態(tài)性能指標是滿足設計要求。整個混雜系統(tǒng)的控制結構如圖5所示。
圖5 混雜系統(tǒng)閉環(huán)結構Fig.5 Structure of closed-loop hybrid systems
注釋12從圖5可知,相比較于傳統(tǒng)的航天器控制系統(tǒng)框架,本文提出的控制系統(tǒng)框架,采用分層控制的思想,頂層為離散事件控制系統(tǒng),監(jiān)控、規(guī)劃和管理航天器的行為狀態(tài),底層為傳統(tǒng)的航天器控制系統(tǒng),用于軌道控制,反饋信息也由單一的軌道信息變?yōu)槭录畔⒑蛙壍佬畔?,具有?chuàng)新性。
由于不同行為狀態(tài)下的控制目標不同,因而采取的控制策略也不相同,為了降低在控制策略切換的過程對控制系統(tǒng)動態(tài)性能的影響,對部分狀態(tài)的運動需要進行規(guī)劃,給出參考軌跡曲線。
1)q0遠程接近狀態(tài)下的運動規(guī)劃
在距離目標較遠的情況下,為了更加靈活的接近目標,采用基于C-W方程的勢函數(shù)運動規(guī)劃方法給出期望運動曲線。假設航天器P與非合作目標航天器E的期望相對運動C-W方程為
式中:ρhPE1,ref和ρhPE2,ref分別表示期望相對運動軌跡和相對速度;uref表示期望控制輸入。
構造勢函數(shù)為
期望控制輸入設計為
式中:κ>0為正常數(shù),從而得到遠程接近參考運動軌跡。
2)q1近程接近狀態(tài)下的運動規(guī)劃
為了能夠更好地到達期望繞飛位置并調(diào)整狀態(tài),采用多項式運動規(guī)劃方法給出期望曲線。在不考慮碰撞威脅規(guī)避情況下,假設上一個狀態(tài)為qh1,下一個狀態(tài)為qh2,h1∈{0,2},h2∈{2}。假設在狀態(tài)qh1的終止時刻與目標的相對位置、速度和加速度信息分別為,狀態(tài)qh3的初始時刻與目標的相對位置、速度和加速度信息分別為的控制目標),則給定規(guī)劃時長t,可采用五次多項式給出狀態(tài)qh下的運動規(guī)劃,具體形式為
式中:b0、b1、b2、b3、b4和b5為參數(shù)矢量。
初始時刻約束條件為上一狀態(tài)qh1的終止時刻相對位置、速度和加速度信息,即
終止時刻約束條件為下一狀態(tài)qh2的初始時刻相對位置、速度和加速度信息,即
最終通過解式(19)~式(22)方程可求得相關參數(shù)為
式中:
最終給出航天器近程接近狀態(tài)的運動參考軌跡。
在撤離狀態(tài)q5下,航天器P返回到既定的軌道上,在不考慮碰撞威脅規(guī)避情況下,其運動規(guī)劃采用多項式運動規(guī)劃方法給出期望曲線。其初始時刻相對運動參數(shù)為上一個狀態(tài)的終止時刻相對位置、速度和加速度信息,終止時刻相對運 動 參 數(shù) 為ρc,ref、、,然 后 根 據(jù) 式(23)和式(24)可得相應的參數(shù)。
3)q4碰撞威脅規(guī)避狀態(tài)下的運動規(guī)劃
考慮到任務過程中航天器的安全性問題,航天器在自主繞飛過程中需要與繞飛目標以及其他空間目標之間保持安全距離,當碰撞威脅規(guī)避預警事件發(fā)生時,航天器進入威脅規(guī)避狀態(tài),需要進行重規(guī)劃,以確保對碰撞威脅的規(guī)避,保障航天器的安全運行。在進行威脅規(guī)避狀態(tài)下,重規(guī)劃的初時時刻相對位置、速度和加速度信息為當前狀態(tài)qh的相對位置ρPi1、速度ρ˙Pi1和加速度ρ¨Pi1(i表示第i個其他空間目標),終止時刻的相對位置、速度和加速度信息為相對位置保持狀態(tài)q2的初始時刻相對位置ρPik、速度0和加速度信息0。重規(guī)劃也采用C-W方程的勢函數(shù)規(guī)劃方法,構造如下勢函數(shù):
式中:n表示碰撞威脅目標的數(shù)量;Us表示總勢能函數(shù);Uia和Uir分別表示與第i個目標之間的引力勢能函數(shù)和斥力勢能函數(shù);n表示碰撞威脅預警空間目標總數(shù);η1表示吸引力因子,η2表示斥力因子。
在碰撞威脅規(guī)避狀態(tài),參考期望控制輸入為
式中:ρPi1和ρPi2分別表示與空間第i個目標之間的相對距離和速度,從而得到期望相對運動軌跡。
注釋13在q2相對位置保持和q3繞飛轉移狀態(tài)下,相對運動狀態(tài)為既定的,不需要進行相對運動規(guī)劃。
注釋14在遠程接近狀態(tài)和碰撞威脅規(guī)避狀態(tài),考慮到目標的行為不確定性,采用基于模型的勢函數(shù)規(guī)劃方法能夠更好的克服不確定性影響,而對于近程接近狀態(tài)和撤離狀態(tài),由于信息精確已知,采用多項式規(guī)劃能夠取得更符合預期的結果。
注釋15與傳統(tǒng)的基于勢函數(shù)的規(guī)劃方法相比較,本文提出的基于模型的勢函數(shù)規(guī)劃方法,結合了航天器的任務目標和碰撞威脅規(guī)避目標來建立相關勢函數(shù),具有創(chuàng)新性。
注釋16由于碰撞威脅規(guī)避事件是不確定的,其可能在任意狀態(tài)qh(h≠4)下發(fā)生,導致當前任務狀態(tài)中斷。在沒有碰撞威脅規(guī)避事件情況下,只需進行一次規(guī)劃,在發(fā)生碰撞威脅規(guī)避事件后,需要根據(jù)當前行為狀態(tài)以及下一個行為狀態(tài)的既定控制目標進行重規(guī)劃,給出新的參考運動軌跡。
在規(guī)劃給出的參考軌跡后,需要設計自適應跟蹤控制策略保障控制目標的實現(xiàn)??紤]到非合作目標的機動策略未知以及其它不確定性項,星上通過相對導航系統(tǒng)可以測量目標的相對距離和速度,根據(jù)式(3)可構造如下降階非線性觀測器對相關不確定參數(shù)進行估計。定義f=fPE-uE=[fx,fy,fz]T,降階非線性觀測器設計如下為
定理1給定參數(shù)σ1>0,σ2>0使得式(32)成立,則觀測器式(31)是有限時間收斂的,即limt→tke2=0,limt→tkef=0,其 中tk為 收 斂 時 間,ef=^-f。
式中:α>0滿足≤α。
證明定 義 估 計 誤 差e2,η=β^η-vη,η={x,y,z}和ef,η=f^η-fη,根據(jù)式(3)和式(31)可得
定義ξ=[ξ1,ξ2]T,其 中ξ1=|e2,η|1/2·sign(e2,η)和ξ2=ef,η,對ξ1和ξ2求導,根據(jù)式(33)可得
選擇Lyapunov函數(shù)為
對式(35)求導,根據(jù)式(34)可得
選擇σ1>0和σ2>0使得矩陣Σ正定,假設λmin>0為矩陣Σ的最小特征值,那么式(36)可以寫成:
根據(jù)規(guī)劃器給出的運動規(guī)劃結果以及觀測器給出的對于不確定性參數(shù)的估計,設計自適應跟蹤控制策略實現(xiàn)不同行為狀態(tài)下的控制目標??紤]到不同行為狀態(tài)下,控制目標和控制對象發(fā)生變化,因此航天器控制器設計為多模態(tài)的以適應不同行為狀態(tài)下對參考軌跡的跟蹤,整個連續(xù)變量閉環(huán)控制系統(tǒng)框架如圖6所示。
圖6 連續(xù)變量閉環(huán)控制系統(tǒng)Fig.6 Continuous variable close-loop control system
假設狀態(tài)qh(h∈{0,1,…,5})下規(guī)劃器給出的 參 考 軌 跡 為,本 文 設 計一種新型的多模態(tài)有限時間收斂自適應跟蹤控制器為如下形式:
式中:k1,h>0和k2,h>0為正常數(shù),h∈{0,1,2,…,5}表示控制器模態(tài),對應航天器的行為狀態(tài);在h∈{0,1,2,3,4}情 況 下,在h=5的情 況 下式(38)中^項用于 補 償 系 統(tǒng)中 不 確 定 性f額 影 響,項 用 于 補 償 跟 蹤 誤 差,項 用 于 保 證 系 統(tǒng) 漸 進 收 斂,用 于 加 速 跟 蹤 誤差收斂速度。
根據(jù)系統(tǒng)動力學模型可知,跟蹤誤差動力學方程為
定理2對于誤差動力學系統(tǒng)式(39),在控制器式(38)的作用下,其是漸進收斂的,即成立。
證明構建如下Lyapunov函數(shù):
對式(40)求導,可得
將uph代入到上式,因為limt→tkef=0可得
根據(jù)式(42)可知,當eh,ref+≠0時,<0成立,因此誤差最終會在有限時間內(nèi)收斂到-eh,ref,從 而 可 知從 而 進 一 步 有,即系統(tǒng)是漸近收斂的。證畢。
本節(jié)通過數(shù)值仿真驗證本文提出的算法的有效性。具體仿真參數(shù)設置為[20]:參考質(zhì)點軌道半軸長為3×104km,偏心率為0,軌道傾角為π/6 rad,升交點赤經(jīng)為π/4 rad,近地點輻角為0°,真近點角為0°。航天器P與參考質(zhì)點之間的相對運 動 參 數(shù) 初 始 值 為ρP(0)=[200,200,200]T×航天器E與參考質(zhì)點之間的相對運動參數(shù)初始 值 為:ρE(0)=[0,0,0]T×103km,ρ˙E(0)=[0,0,0]T×103km/s。航天器P的近程接近期望距離為d0,ref=100×103km,航天器P的繞飛平面參數(shù)設定為a=1,b=1和c=-(ax+by)/z;繞飛期望位置ρn,ref為航天器P與E相對位置與繞飛曲線的交點,期望繞飛圈數(shù)為nref=1;航天器P的期望繞飛半徑為R=40×103km;航天器P的碰撞威脅告警距離為dc=30×103km。航天器P的碰撞威脅告警解除距離為ds=50×103km。太陽光矢量方向初始值為s0=[1,0,0]。降階觀測器參 數(shù)選擇 為狀態(tài)q0、q2和q3:σ1=0.3,σ2=0.05;狀 態(tài)q1和q5:σ1=0.2,σ2=0.03;狀 態(tài)q4:σ1=0.5,σ2=0.05。控 制 參 數(shù) 設 計 為 狀 態(tài)q0:k1,h=0.005,k2,h=0.002;狀 態(tài)q1、q2、q3和q5:k1,h=0.05,k2,h=0.01;狀 態(tài)q4:k1,h=0.035,k2,h=0.01。仿真結果如圖7~圖24所示。
圖7 不確定參數(shù)fx估計值及誤差Fig.7 Estimation and estimation error of uncertainty fx
圖8 不確定參數(shù)fy估計值及誤差Fig.8 Estimation and estimation error of uncertainty fy
圖7~圖9為不確定參數(shù)f(t)=[fx(t),fy(t),fz(t)]T的三軸估計曲線及估計誤差曲線,圖10~圖12為狀態(tài)q0~q4下,航天器P和航天器E之間的三軸相對運動變化曲線及跟蹤誤差曲線,圖13~圖15為航天器P與既定返回目標軌道位置之間的三軸相對位置變化曲線及跟蹤誤差曲線。圖16為航天器P的事件活動圖;圖17為航天器P的狀態(tài)轉換圖;圖18為航天器P與E之間的相對位置與太陽光矢量之間的夾角;圖19為航天器P與E以及C之間的相對距離變化曲線;圖20為狀態(tài)q0~q4下,航天器P和E之間三維空間坐標下的相對天器P的運動曲線圖;圖21~圖23為三軸控制器輸出;圖24為正常情況和碰撞威脅規(guī)避情況下,航天器之間的相對運動曲線比較。
圖9 不確定參數(shù)fz估計值及誤差Fig.9 Estimation and estimation error of uncertainty fz
圖10 x軸相對位置及跟蹤誤差曲線Fig.10 Relative motion and tracking error of x axis
圖11 y軸相對位置及跟蹤誤差曲線Fig.11 Relative and tracking error motion of y axis
圖14 航天器P與返回軌道的y軸相對位置Fig.14 Relative position of y axis between spacecraft P and return trajectory
圖15 航天器P與返回軌道z軸相對位置Fig.15 Relative position z axis between spacecraft P and return trajectory
圖16 航天器P的事件活動Fig.16 Event activity of Spacecraft P
圖17 航天器P的狀態(tài)轉換Fig.17 State transition of Spacecraft P
圖18 相對位置矢量與太陽光矢量之間的夾角Fig.18 Angle of relative position vector and sunlight Vector
圖19 航天器之間的相對距離Fig.19 Relative distance of spacecrafts
圖20 航天器P與航天器E之間的相對運動三維視圖Fig.20 3D view of relative motion between Spacecraft P and Spacecraft E
圖21 x軸控制輸出Fig.21 Control output of x axis
圖22 y軸控制輸出Fig.22 Control output of y axis
圖23 z軸控制輸出Fig.23 Control output of z axis
圖24 正常情況和碰撞威脅規(guī)避情況軌跡Fig.24 Trajectories of normal and collision threat avoidance case
根據(jù)圖7~圖9可知,所設計的觀測器能夠有效估計包含非合作目標未知機動參數(shù)在內(nèi)的不確定性估計。根據(jù)圖10、圖13和圖15可知,所設計的控制策略能夠有效跟蹤規(guī)劃器規(guī)劃出來的參考軌跡(紅色為規(guī)劃器輸出參考相對運動軌跡,藍色為實際相對運動軌跡),說明設計的多模態(tài)自適應控制器是有效的。圖16~圖17中縱坐標是無單位的,事件ej(j=1,2,…,8)和狀態(tài)qh(h=0,1,…,5)的取值都是0和1,這里為了方便看清楚事件活動和狀態(tài)行為的轉換,將每個事件的縱坐標分別進行了一定的平移。根據(jù)圖16和圖17可知,航天器P的行為狀態(tài)轉換能夠主動根據(jù)事件觸發(fā)其轉換,整個過程的轉換關系為q0→q1→q4→q2→q1→q2→q3→q2→q3→…→q2→q5,與設計的狀態(tài)轉換函數(shù)關系分析對應一致,說明設計狀態(tài)轉換函數(shù)是可靠的,能夠?qū)崿F(xiàn)航天器的行為協(xié)調(diào)控制。
根據(jù)圖17和圖19可知,在碰撞威脅規(guī)避事件發(fā)生后,航天器P能夠進入威脅規(guī)避狀態(tài),對運動軌跡進行重規(guī)劃,實現(xiàn)對空間目標碰撞威脅規(guī)避,在完成對空間目標碰撞威脅規(guī)避后,進入相對位置保持狀態(tài),重新調(diào)整規(guī)劃接近目標。圖18為航天器P在對航天器E繞飛過程中,相對位置矢量與太陽光矢量之間的夾角變化,設當夾角>5π/6 rad時視為逆光,不利于對航天器E的觀測。根據(jù)圖20可知,在整個繞飛過程,航天器P能夠在規(guī)避威脅的同時實現(xiàn)對航天器E的接近繞飛詳查,實現(xiàn)既定任務的同時保障自身安全。
根據(jù)圖21~圖23可知,航天器的控制輸出在對應的行為狀態(tài)下是連續(xù)的,只有當航天器的行為狀態(tài)發(fā)生改變時,其才會發(fā)生較大變化。圖24展示了正常(即沒有碰撞威脅目標時)和碰撞威脅規(guī)避2種情況下,航天器的運動軌跡,從圖中可以看出,相比較正常情況下,航天器的運動軌跡在碰撞威脅事件發(fā)生后,進行了重規(guī)劃,運動軌跡與正常情況下發(fā)生了一定的偏離,同時由于要對碰撞威脅進行規(guī)避,整個繞飛過程花費的時間也稍微多于正常情況。
通過仿真驗證,本文提出的航天器自主繞飛與威脅規(guī)避控制方法能夠根據(jù)觸發(fā)事件,通過有限狀態(tài)機進行協(xié)調(diào)管理,實現(xiàn)系統(tǒng)行為的協(xié)調(diào),自主根據(jù)觸發(fā)事件改變行為狀態(tài),規(guī)劃自身的安全運動軌跡,并通過所設計的自適應控制策略實現(xiàn)對參考軌跡的高精度跟蹤,具備在完成控制目標任務的同時實現(xiàn)對空間碰撞威脅的規(guī)避的能力。本文所提出的自主控制方法使得航天器具備自主實現(xiàn)更加復雜任務的能力,模型具有可解釋性,所設計的多模態(tài)控制器能夠從理論上分析其可靠性和安全性,為航天器智能自主控制提供一種設計思路。
本文提出了一種基于混合狀態(tài)機的航天器自主繞飛多模態(tài)控制方法,具有以下特點。
1) 基于混合狀態(tài)機建立了航天器自主繞飛與碰撞威脅規(guī)避控制系統(tǒng)的混雜模型,能夠有效描述自主繞飛和碰撞威脅過程的行為變化規(guī)律,并設計的狀態(tài)轉換函數(shù)實現(xiàn)對航天器行為狀態(tài)的監(jiān)控和管理,保障航天器行為狀態(tài)之間的轉換協(xié)調(diào)。
2) 結合任務目標和威脅規(guī)避,設計了多模態(tài)運動規(guī)劃算法,其能夠根據(jù)不同行為調(diào)整規(guī)劃輸出,使得給出的參考軌跡既滿足控制目標要求,同時能夠保障航天器的安全性。
3) 提出了基于觀測器的自適應有限時間多模態(tài)控制策略,能夠有效克服不確定參數(shù)的影響,跟蹤規(guī)劃器給出的參考軌跡,保障對應行為狀態(tài)的控制目標的實現(xiàn),具有較強的適應性和魯棒性。
4) 提出了分層控制系統(tǒng)框架,反饋信息由單一的軌道信息變?yōu)槭录畔⒑蛙壍佬畔ⅰT谠摽刂瓶蚣芟?,所設計的航天器自主繞飛多模態(tài)控制方法能夠?qū)崿F(xiàn)對非合作目標的繞飛自主控制的同時實現(xiàn)對空間目標碰撞威脅規(guī)避,保障航天器任務的遂行和空間運行的安全性。