何海鋒,曾海波
(1.北京控制工程研究所,北京100190;2.空間智能控制技術(shù)重點實驗室,北京100190)
撓性航天器姿態(tài)機動時間最優(yōu)控制研究
何海鋒1,2,曾海波1,2
(1.北京控制工程研究所,北京100190;2.空間智能控制技術(shù)重點實驗室,北京100190)
針對撓性航天器單軸姿態(tài)快速機動的控制問題,將系統(tǒng)的模型處理成非約束模型,采用極小值原理求解了問題的時間最優(yōu)控制律,并結(jié)合邊值條件推導(dǎo)了時間最優(yōu)控制的切換時間應(yīng)滿足的充要條件.利用切換時間所滿足的非線性方程組分析和證明了時間最優(yōu)控制的對稱性及滿足的條件:在不考慮阻尼系數(shù)時,問題的時間最優(yōu)控制是機動時間上的對稱函數(shù).利用這個規(guī)律,對剛體+1階撓性模態(tài)的時間最優(yōu)姿態(tài)機動問題進行了解析求解.針對撓性模態(tài)階次較高時難以求解非線性方程組的問題,將模型離散化,把問題處理成一系列受約束的最小二乘優(yōu)化問題來求解,數(shù)學(xué)仿真表明了該方法的有效性.
撓性航天器;姿態(tài)快速機動;時間最優(yōu)控制
航天器在軌運行時,由于任務(wù)需要,需要具有姿態(tài)快速機動和穩(wěn)定能力.最初,航天器被簡化為剛體模型,由此得到了經(jīng)典的時間最優(yōu)“Bang-Bang”控制規(guī)律[1].文獻[2-4]對剛體的三軸姿態(tài)機動時間最優(yōu)控制進行了研究,文中對時間最優(yōu)的旋轉(zhuǎn)軸進行了分析和討論.文獻[2]和文獻[3]均對剛體模型轉(zhuǎn)動慣量做了限制,以此消除動力學(xué)方程中的陀螺力矩非線性項,使得系統(tǒng)保持線性特性.文獻[4]考慮了陀螺力矩非線性項,取得了較好的結(jié)果.
剛體航天器的時間最優(yōu)姿態(tài)機動問題已經(jīng)取得了較為成熟的成果,對撓性航天器姿態(tài)機動最優(yōu)控制的研究,最早的成果見于文獻[5].文中考慮單軸撓性航天器模型的動力學(xué)特性,將其看作約束模型,為了不激起撓性模態(tài)的振動,根據(jù)所給的期望姿態(tài)角,結(jié)合動力學(xué)方程設(shè)計姿態(tài)角的變化曲線,按此完成姿態(tài)機動后,撓性模態(tài)的振動最小.之后,以一個中心剛體+撓性附件為模型的單軸旋轉(zhuǎn)機動問題得到了廣泛的研究[6-15].文獻[6-7]運用線性二次型調(diào)節(jié)器對以控制量和系統(tǒng)能量作為性能指標(biāo)的問題進行了求解.文獻[8]研究了以控制量和時間為性能指標(biāo)的噴氣推力最優(yōu)控制問題.文獻[9-10]則把機動時間和機動完成后的剩余能量作為性能指標(biāo),得出了近似最小時間控制的結(jié)果.
撓性航天器姿態(tài)機動的純時間最優(yōu)控制以文獻[11]開始,文中用相平面方法來研究帶有1階撓性模態(tài)模型的時間最優(yōu)問題.文獻[12-13]針對無阻尼的撓性航天器,將其轉(zhuǎn)化為非約束模型,利用極小值原理列出了時間最優(yōu)控制滿足的充分必要條件,且通過仿真曲線說明了控制輸入的對稱性.文獻[14]研究了撓性航天器模型中撓性模態(tài)頻率和阻尼系數(shù)這兩個參數(shù)對機動時間的影響.最近的研究見于文獻[15],文中利用時間最優(yōu)控制的規(guī)律來規(guī)劃方波控制序列,對不考慮阻尼系數(shù)的撓性航天器姿態(tài)快速機動取得了較好的控制效果.
撓性航天器的姿態(tài)快速機動問題,仍然需要采用最優(yōu)控制的方法實現(xiàn)姿態(tài)機動時間最優(yōu).因為撓性航天器的三軸姿態(tài)機動不僅有剛體姿態(tài)的非線性項,還有撓性模態(tài)的非線性項,為了便于研究,本文依然以撓性航天器的單軸姿態(tài)機動為研究對象.對于文獻[12-13]中提出的控制輸入的對稱性,本文將給出其成立的條件和證明,利用這一規(guī)律可以簡化兩點邊值問題的解析求解.對于撓性模態(tài)階次較高的情形,本文引入了基于離散模型的約束線性最小二乘優(yōu)化方法,完成了數(shù)學(xué)仿真,并得出了一般情況下切換次數(shù)與撓性模態(tài)階次的對應(yīng)關(guān)系、機動時間隨撓性模態(tài)階次增加的變化規(guī)律.
以俯仰軸姿態(tài)角θ為例,令撓性附件轉(zhuǎn)動的角速度ωa=0,則單軸撓性航天器的動力學(xué)方程[16]為(考慮撓性附件自身阻尼)
式中,Is為俯仰軸的轉(zhuǎn)動慣量,θ為姿態(tài)角,q為模態(tài)坐標(biāo)(考慮n階)為模態(tài)藕合系數(shù)行為模態(tài)阻尼對角陣為模態(tài)頻率對角陣T為作用在中心剛體上的姿態(tài)控制力矩.
定義如下的狀態(tài)和控制變量:
定義
則,式(3)~(4)可寫為如下形式:
式中,A=block diag{A0,A1,A2,…,An},block diag{·}表示以其中元素矩陣
“靜止到靜止”的時間最優(yōu)姿態(tài)機動問題,就是選擇滿足
的標(biāo)量控制函數(shù)u(t),使得式(5)描述的系統(tǒng)從初始狀態(tài)
轉(zhuǎn)移到最終狀態(tài)
的機動時間tf最小,即最小化如下的性能指標(biāo)函數(shù)
上述系統(tǒng)(5)是線性定常,而且完全能控.
引理1.若線性定常系統(tǒng)(5)是完全能控的,則式(5)~(9)所描述的時間最優(yōu)控制問題是正常的(即u( t)僅在有限個數(shù)的切換點處為0).
引理2.對式(5)~(9)所描述的時間最優(yōu)控制問題,若矩陣A的特征值均具有非正的實部,則從任意初態(tài)轉(zhuǎn)移到坐標(biāo)原點的時間最優(yōu)控制存在.
引理3.對式(5)~(9)所描述的時間最優(yōu)控制問題,若問題是正常的,則時間最優(yōu)控制是含有若干次切換的“Bang-Bang”控制.
引理4.若式(5)~(9)所描述的時間最優(yōu)控制問題是正常的,且時間最優(yōu)控制存在,則最優(yōu)控制必唯一.
以上引理的相關(guān)證明參見文獻[1].
由以上引理可知,式(5)~(9)所描述的時間最優(yōu)控制問題是含有若干次切換的“Bang-Bang”控制,且最優(yōu)控制是唯一的.
由極大值原理,時間最優(yōu)控制為
其中,*表示最優(yōu)控制,符號函數(shù)定義為
協(xié)態(tài)方程
式中,協(xié)態(tài)向量
哈密頓函數(shù)
滿足
由式(10)所描述的最優(yōu)控制可知
式中,t1,t2,t3,t4,…,tk表示切換時間,共有k次切換,tf表示機動時間,α表示初始時刻u()0的符號.
由式(5)可得
其中,L-1(·)表示求拉普拉斯反變換.
將邊值條件(7)~(8)和控制輸入(13)代入(14)整理得
式(17)和(18)中i=1,2,…,n.
式(11)表明
時間最優(yōu)控制中符號函數(shù)的變量滿足在切換時刻
即
整理式(19)和(20),可得
其中,
式(22)~(23)中i=1,2,…,n;j=1,2,…,k,f.
式(15)~(18)和(21)組成了2+2n+(k+1)個非線性方程.而未知量有:k+1個時刻t1,t2,…,+2n+(k+1)+1個.
此外,滿足式(15)~(18)和(21)組成的非線性方程組的解還必須滿足
式(15)~(18)、(21)和(24)構(gòu)成了時間最優(yōu)控制的切換時間的充分必要條件.
3.1 阻尼系數(shù)ξi=0,i=1,2,…,n的情形
ξi=0,i=1,2,…,n時,式(17)~(18)化為
式(25)~(26)中i=1,2,…,n.
由式(10)~(11)可得ξi=0,i=1,2,…,n時,式(22)~(23)化為
式(27)中
式(28)中
a)當(dāng)k為奇數(shù)時,設(shè)k=2m+1,m=0,1,2,…,將式(21)前k行中的1,3,…,2m+1行分別乘以-1再與剩下的 2,4,…,2m行加在一起,并將式(15)~(16)、(25)~(26)代入,可得
因為b1,b2,…,bn≠0,而tf是與任意給定的θf對應(yīng)的,要式(32)恒成立,必要求
將(30)~(31)、(33)代入(27)~(28)得,t∈[0,
b)當(dāng)k為偶數(shù)時,同以上方法可得
將(30)~(31)、(35)代入(27)~(28)可得,t∈[0,
而由系統(tǒng)狀態(tài)方程(5)可得
于是,
得到x1(tf)=-θf,這是與終端條件x1(tf)=0相矛盾的,故k為偶數(shù)不成立.因此,k必為奇數(shù),u(t)具有對稱性,且滿足
3.2 阻尼系數(shù)ξi≠0,i=1,2,…,n的情形
此時u(t)和u(-t+tf)及相關(guān)項的表達式仍形如(27)~(28)、(30)~(31)所示,但因式(22)~(23)中fij(t)和gij(t)在時間t上均不具有對稱性,所以,此時控制量u(t)也不具有對稱性.
利用上面的規(guī)律:當(dāng)ξi=0,i=1,2,…,n時,k必為奇數(shù),u(t)具有對稱性.可以將關(guān)于切換時間的非線性方程組(15)~(16)、(25)~(26)中的未知量的個數(shù)減少一半.
取n=1,ξ1=0時,根據(jù)文獻[12]的仿真結(jié)果,假設(shè)u(t)的初始符號α=sgn(θf),且有不多于3次切換.由u(t)的對稱性知,第一次和第三次的切換時間t1、t3關(guān)于中間第二次切換時間可設(shè)t2-t1=t3-t2=ta,則t1、t2、t3表示為
代入方程組(15)~(16)、(25)~(26),整理得
又由式(21)可得
滿足式(37)~(40)的解還必須滿足
式(37)~(41)構(gòu)成了時間最優(yōu)控制的充要條件,因此,滿足(37)~(41)的解必是時間最優(yōu)控制所對應(yīng)的切換時間.
代入式(38)可得,
i)當(dāng)ta=0時,t1=t2=t3,僅有一次切換,而且僅當(dāng)=0時, BTp(=0,滿足時間最優(yōu)控制充要條件.此時,時間最優(yōu)控制是類似于剛體模型的情形.
然而,對于模態(tài)階次較高的情形,關(guān)于時間最優(yōu)控制的切換時間和機動時間的非線性方程維數(shù)也相應(yīng)較多,求解它們是一項很復(fù)雜的工作,需要尋找更高效的方法.
總結(jié)1.對于n=1,ξ1=0的情形,切換次數(shù)一般為3次.僅在期望姿態(tài)角滿足條件
[14]基于離散化的模型,將問題處理成一系列受約束線性最小二乘優(yōu)化問題,給出了一種新的求解方法.
采用零階保持器,將連續(xù)系統(tǒng)(5)化成如下的離散形式
其中
Ts是采樣時間,于是,由遞推式(45)可得
其中,C矩陣表示為
u是由各時刻控制量所組成的向量
在式(46)中,x(k)為u的函數(shù).故可設(shè)初始狀態(tài)x(0)和終端狀態(tài)x(tf)由式(7)~(8)給定.
于是,前面的時間最優(yōu)控制問題可以描述為如下的一系列受約束的最小二乘問題:需要找到一個最小的k,并求取一個對應(yīng)的控制向量 u(其tf=kTs.
仿真參數(shù)Is=1500kg·m2,力矩T≤150N·m,變換后對應(yīng)(5)中的ω1=1.5rad/s,ω2=3.1rad/s, ω3=7.5rad/s(以三階撓性模態(tài)為例分析),阻尼系數(shù)ξi=0,i=1,2,3,b0=1,b1=1,b2=0.3,b3=0.1,期望機動的姿態(tài)角θf=60°=1.047 rad.
為了節(jié)省仿真時間,先解析計算剛體的時間最優(yōu)控制姿態(tài)機動時間.
剛體的時間最優(yōu)控制姿態(tài)機動為僅有一次切換的“Bang-Bang”控制.于是
若取采樣時間Ts=0.01s,剛體的機動時間是最小的,則k的值可以從小于剛體時間647的附近選,如可取k=600開始計算,這樣就減少了600步的最小二乘優(yōu)化步驟,節(jié)省了仿真時間.
圖1~4是系統(tǒng)(5)分別以剛體、剛體+1階、2階、3階撓性模態(tài)為模型時姿態(tài)機動時間最優(yōu)控制隨時間的變化曲線,從圖中可以看出,控制量切換次數(shù)分別為1、3、5、7次,機動時間分別為tf=6.47s、6.67s、6.70s、6.71s.仿真結(jié)果表明,若考慮系統(tǒng)是剛體+n階撓性模態(tài)的無阻尼模型,則問題的時間最優(yōu)控制一般有2n+1次切換(不計t=0和t=tf時刻).而且,機動時間tf的增加量隨模態(tài)階次的增加越來越小.
系統(tǒng)(5)在圖 1~4的控制量作用下姿態(tài)角θ(t)的響應(yīng)曲線如圖5所示,機動完成后的姿態(tài)響應(yīng)曲線局部如圖6所示,曲線表明,控制的撓性模態(tài)階次越多,姿態(tài)機動完成后姿態(tài)的穩(wěn)定度越高,在實
求解可得剛體的時間最優(yōu)控制姿態(tài)機動時間為際工程中應(yīng)該根據(jù)穩(wěn)定度的要求,確定需要控制的撓性模態(tài)階次.
圖1 剛體的姿態(tài)機動時間最優(yōu)控制Fig.1 Time-optimal control for attitude maneuver of rigid body
圖2 剛體+1階撓性姿態(tài)機動時間最優(yōu)控制Fig.2 Time-optimal control for attitude maneuver of rigid body with one flexible mode
圖3 剛體+2階撓性姿態(tài)機動時間最優(yōu)控制Fig.3 Time-optimal control for attitude maneuver of rigid body with two flexible modes
圖4 剛體+3階撓性姿態(tài)機動時間最優(yōu)控制Fig.4 Time-optimal control for attitude maneuver of rigid body with three flexible modes
當(dāng)阻尼系數(shù)不可忽略時,如取ξi=0.2,i=1, 2,3,為了對比方便,不妨取剛體+3階撓性模態(tài)的模型,姿態(tài)機動時間最優(yōu)控制隨時間變化曲線如圖7所示,對比圖4可知,其在機動時間上不具有對稱性.
圖5 控制量作用下的姿態(tài)角θ(t)響應(yīng)曲線Fig.5 Attitude-time historiy under optimal control
圖7 阻尼系數(shù)ξi=0.2,i=1,2,3時,剛體+3階撓性姿態(tài)機動時間最優(yōu)控制Fig.7 Time-optimal control for attitude maneuver of rigid body with three flexible modes,damping factorξi=0.2,i=1,2,3
對撓性航天器單軸姿態(tài)快速機動的控制問題,本文利用極小值原理,求解了時間最優(yōu)控制律.結(jié)合邊值條件推導(dǎo)了時間最優(yōu)控制的切換時間應(yīng)滿足的充要條件,并利用其所滿足的非線性方程組分析了控制量的對稱性及滿足的條件.在不考慮阻尼系數(shù)時,利用控制量的對稱性可以將非線性方程組的未知量個數(shù)減半,極大地簡化了求解的難度.然而,考慮高階撓性模態(tài)時,求解非線性方程組的計算量仍然很大,更高效的求解方法還有待尋求.為此,文中引入了離散模型的約束最小二乘優(yōu)化方法完成數(shù)值仿真,仿真結(jié)果也驗證了控制量的對稱性.同時,仿真結(jié)果顯示了一般情況下切換次數(shù)與撓性模態(tài)階次的對應(yīng)關(guān)系、機動時間隨撓性模態(tài)階次增加的變化規(guī)律,這些規(guī)律還有待進一步地分析和證明.機動完成后的姿態(tài)響應(yīng)曲線表明:控制的撓性模態(tài)階次越多,機動完成后姿態(tài)的穩(wěn)定度越高.如何給出其精確的定量描述,這也有待解決.
參 考 文 獻
[1] 解學(xué)書.最優(yōu)控制理論與應(yīng)用[M].北京:清華大學(xué)出版社,1986,167-189 Xie X S.Optimal control theory and application[M]. Beijing:Tsinghua University Press,1986,167-189
[2] Bilimoria K D,W ie B.Time-optimal three-axis reorientation of a rigid spacecraft[J].Journal of Guidance, Control,and Dynam ics,1993,16(3):446-452
[3] Bai X L,Junklins JL.New results for time-optimal reorientation of a rigid spacecraft[J].Journal of Guidance,Control,and Dynam ics,2009,32(4):1071-1076
[4] Andrew F,Pooya S,Ross IM.M inimum-time reorientation of a rigid body[J].Journal of Guidance,Control, and Dynam ics,2010,33(1):160-170
[5] Farrenkopf R L.Optimal open-loop maneuver profiles for flexible spacecraft[J].Journal of Guidance,Control,and Dynam ics,1979,2(6):491-498
[6] Turner JD,Junkins JL.Optimal large-angle single-axis rotationalmaneuvers of flexible spacecraft[J].Journal of Guidance,Control,and Dynamics,1980,3(6): 578-585
[7] Turner JD,Chun H M.Optimal distributed control of a flexible spacecraft during a large angle maneuver[J]. Journal of Guidance,Control,and Dynamics,1984,7 (3):257-264
[8] Velde V,He W J.Design of space structure control system using on-off thruster[J].Journal of Guidance, Control,and Dynamics,1983,6(1):53-60
[9] Thompson R C,Junkins J L,Vadali S R.Near-m inimum time open-loop slewing of flexible vehicles[J]. Journal of Guidance,Control,and Dynamics,1987,12 (1):82-88
[10] Byers R M,Vadali S R,Junkins J L.Near-minimum time,closed-loop slewing of flexible spacecraft[J]. Journal of Guidance,Control,and Dynamics,1990,13 (1):57-65
[11] Barbieri E.Rest-to-rest slewing of flexible structures in m inimum time[C].The 27thConference on Decision and Control,Texas,USA,December 1988
[12] Singh G,Kabamba P T,McClam roch N H.Planar, time-optimal,rest-to-rest slewing maneuvers of flexible spacecraft[J].Journal of Guidance,Control,and Dynam ics,1989,12(1):71-81
[13] Asher B J,Burns JA,Cliff E M.Time-optimal slewing of flexible spacecraft[J].Journal of Guidance,Control,and Dynamics,1992,15(2):360-367
[14] Pao L Y.M inimum-time control characteristics of flexible structures[J].Journal of Guidance,Control,and Dynamics,1996,19(1):123-129
[15] 張洪華,黎康,趙宇.撓性衛(wèi)星姿態(tài)快速機動控制[J].中國空間科學(xué)技術(shù),2005,25(1):53-59 Zhang H H,Li K,Zhao Y.Fast maneuver control of flexible satellites system[J].Chinese Space Science and Technology,2005,25(1):53-59
[16] 章仁為.衛(wèi)星軌道姿態(tài)動力學(xué)與控制[M].北京:北京航空航天大學(xué)出版社,1998 Zhang R W.Dynamics and control of spacecraft orbit and attitude[M].Beijing:Beijing University of Aeronautics and Astronautics Press,1998
Tim e-Op tim al Control for Flexib le Spacecraft A ttitude M aneuver
HE Haifeng1,2,ZENG Haibo1,2
(1.Beijing Institute of Control Engineering,Beijing 100190,China;2.Science and Technology on Space Intelligent Control Laboratory,Beijing 100190,China)
The problem of single-axis fast attitude maneuver for a flexible spacecraft is considered in this article.By converting the system into unconstrained model and applying the Minimum Principle,the solution for time-optimal control is obtained,while the necessary and sufficient condition for the controlswitching time are also established under boundary value conditions.By analyzing the nonlinear equations of the switching time,it is found that if the damping coefficient can be negligible,the control input for time-optimal attitudemaneuver will be a symmetrical function of the maneuver time,and the complexity of solving the nonlinear equations could be reduced greatly.Based on this kind of symmetry,an analytic solution for the rigid body with only one flexible mode is obtained.To overcome the difficulty in solving the nonlinear equations with large number of flexible modes,the system is then transformed into a discrete-timemodel and further simplified to a set of constrained least-squares problems.Finally,numerical simulation is conducted to demonstrate the effectiveness of the method.
flexible spacecraft;fast attitude maneuver;time-optimal control
V448
A
1674-1579(2012)01-0010-08
何海鋒(1986-),男,碩士研究生,研究方向為航天器姿態(tài)控制;曾海波(1972-),男,研究員,研究方向為航天器智能控制.
2011-09-29
DO I:10.3969/j.issn.1674-1579.2012.01.002