陳佳曄,穆榮軍,白瑜亮,張 新,崔乃剛
(哈爾濱工業(yè)大學(xué)航天工程系,哈爾濱 150001)
近年來,由于重復(fù)使用運載器(Reusable launch vehicle, RLV)具有降低發(fā)射成本、全球快速可達、飛行安全可靠等優(yōu)勢,在航空航天、軍用民用等領(lǐng)域內(nèi)成為研究熱點。由于RLV的再入段具有速度變化范圍大、模型不確定性顯著、外部環(huán)境存在嚴(yán)重干擾以及多通道存在較強耦合等特點,使得RLV再入段控制系統(tǒng)設(shè)計面臨更大挑戰(zhàn)[1-2]。因此,設(shè)計對飛行環(huán)境、外界干擾以及模型不確定性都具有魯棒性的先進控制器對于提升RLV再入段飛行控制性能具有重要意義。
近期眾多學(xué)者對再入飛行器控制系統(tǒng)設(shè)計方法進行了研究,如增益調(diào)度[3]、軌跡線性化方法[4]、動態(tài)逆[5]、狀態(tài)Riccati方程[6]、反演控制[7]等。盡管這些線性和非線性控制方法能夠跟蹤再入段RLV的制導(dǎo)指令,但滑??刂品椒ㄔ诳紤]到模型不確定性和外部干擾時,則更為有效[8]。為更好地解決RLV再入段存在干擾無法建模的問題,根據(jù)其特點設(shè)計相應(yīng)的干擾觀測器,以提高系統(tǒng)的魯棒性。在文獻[8]中,設(shè)計了一種基于干擾觀測器的非線性動態(tài)逆控制方法,控制導(dǎo)彈縱向自動駕駛,相關(guān)研究中的主要問題是:基礎(chǔ)非線性干擾觀測器(Basic nonlinear disturbance observer,BNDO)只能估計時不變干擾,如果干擾隨時間變化,BNDO對干擾的估計值將存在偏差。目前,雖然有眾多非線性觀測器可供使用,例如擴展卡爾曼濾波器、粒子濾波器以及非線性序貫+迭代時域估計方法等,但粒子濾波器和滾動時域估計方法的計算量較大,需要的計算時間較長[11]。因此,設(shè)計一種計算簡單、能夠估計時變干擾的觀測器的需求非常迫切。
本文針對RLV再入飛行階段的復(fù)雜特性,根據(jù)奇異攝動理論及時標(biāo)分離原則將RLV動力學(xué)方程分解為內(nèi)、外環(huán)子系統(tǒng),由于在該飛行階段存在模型不確定性和未建模的外部時變干擾,設(shè)計基于2型模糊神經(jīng)系統(tǒng)結(jié)構(gòu)的SLDO,用于觀測和估計干擾,與傳統(tǒng)的干擾觀測器相比,該方法具有更強的魯棒性和更高的計算效率,且可在未知干擾邊界時對干擾進行有效估計。通過仿真校驗,基于SLDO設(shè)計的RLV多元超螺旋滑??刂破?,可準(zhǔn)確地實現(xiàn)再入段姿態(tài)跟蹤,并快速收斂。
RLV的剛體6自由度動力學(xué)方程是由3自由度平動方程以及3自由度轉(zhuǎn)動方程組成。
3自由度平動方程如下所示:
(1)
(2)
(3)
(4)
(5)
(6)
3自由度轉(zhuǎn)動方程表示為:
(7)
(8)
(9)
(10)
(11)
(12)
式中:α為攻角,β為側(cè)滑角,σ為傾側(cè)角,ωx,ωy,ωz分別表示滾轉(zhuǎn)角、偏航角以及俯仰角角速度,Jij(i,j=x,y,z)為飛行器的慣量,Mx,My,Mz分別表示滾轉(zhuǎn)、偏航和俯仰力矩。
(13)
(14)
(15)
為了盡可能準(zhǔn)確地描述RLV再入飛行段過程,需要考慮由于簡化模型和不同通道之間的耦合帶來的模型不確定性。因此,一個更加實際的面向控制的動力學(xué)模型如下:
(16)
(17)
y=Θ
(18)
控制力矩矢量M如下所示:
(19)
式中:Cl,Cm,Cn是空氣動力學(xué)力矩系數(shù),通過三次多項式擬合方法,將它們隨α∈[-10°, 40°],Ma∈[0.4,7]的變化擬合為:
Cl=0.02-0.05Ma-1.2×10-3α+0.02Ma2-
7×10-4Maα+1×10-4α2-1.7×10-3Ma3+
1.5×10-4Ma2α-1.8×10-5Maα2-
4.42×10-7α3
Cm=0.45-0.24Ma-6×10-3α+0.05Ma2+
1.7×10-3Maα+3.32×10-5α2-2.9×
10-3Ma3-1.4×10-4Ma2α+1.37×10-6
Maα2+1.5×10-7α3
Cn=-8×10-4-0.05Ma-5×10-3α+
0.014Ma2-0.008Maα+3×10-4α2-
0.005Ma3+0.005Ma2α-1×10-3Maα2-
3×10-5α3
為了方便后文設(shè)計,將上述由式(16)~式(18)描述的姿態(tài)控制動力學(xué)模型寫為下列形式:
(20)
2.1.1基本非線性干擾觀測器
在第1節(jié)建立的面向控制系統(tǒng)動力學(xué)模型(20)中,干擾d(t)在實際情況下是不可測量的,需要對其進行估計,從而提高控制系統(tǒng)的魯棒性。文獻[9]中提出的BNDO如下所示:
(21)
(22)
(23)
2.1.2基于T2NFS的自學(xué)習(xí)干擾觀測器
本文所設(shè)計的自學(xué)習(xí)干擾觀測器形式如下:
(24)
式中:τc,τr和τn分別代表傳統(tǒng)估計律項、魯棒估計律項和T2NFS項。圖2為自學(xué)習(xí)干擾觀測器的結(jié)構(gòu)圖。
圖2 自學(xué)習(xí)干擾觀測器(SLDO)示意圖Fig.2 Framework of the self-learning disturbance observer(SLDO)
傳統(tǒng)估計律項定義如下:
(25)
魯棒估計律項形式如下:
(26)
lrZ為正,即lrZ>0,lr代表魯棒增益向量。
1)2型神經(jīng)模糊結(jié)構(gòu)
區(qū)間2型TSK(Takagi-Sugeno-Kang)的if-then模糊規(guī)則Rij定義如下:
按照A2-C0模糊系統(tǒng)規(guī)則,激活值計算方法如下所示:
(27)
網(wǎng)絡(luò)輸出公式如下所示:
(28)
2)基于滑模控制理論的學(xué)習(xí)算法
將滑模面設(shè)計為如下形式:
s(τc)=τc
(29)
式中:τc為傳統(tǒng)估計律輸出值,采用滑模面作為學(xué)習(xí)誤差來訓(xùn)練基于滑??刂评碚摰膶W(xué)習(xí)算法,過程如下所述。
T2NFS參數(shù)的適應(yīng)規(guī)則:
(30)
(31)
ηsgn(s)
(32)
(33)
(34)
證.李雅普諾夫函數(shù)寫為如下形式:
(35)
根據(jù)文獻[10]可得:
(36)
(37)
由上述設(shè)計可以看出,在2型神經(jīng)模糊結(jié)構(gòu)中采用基于滑??刂评碚摰膶W(xué)習(xí)算法具有自適應(yīng)能力,因此SLDO能夠在未知干擾的上界以及干擾對時間的一階導(dǎo)數(shù)的上界時對干擾進行估計。
根據(jù)奇異攝動理論及時標(biāo)分離的原則,系統(tǒng)中的角速度與姿態(tài)信息變化快慢不同,將控制系統(tǒng)分為快慢回路,使控制系統(tǒng)能夠在存在模型不確定性以及外部干擾時,跟蹤指令姿態(tài)角Φd以及期望角速度ωd。
2.2.1外環(huán)控制器設(shè)計
對于子系統(tǒng)(16),設(shè)計實際控制ωd使得姿態(tài)角Φ能夠在考慮模型不確定性Δf的情況下,在有限時間內(nèi)跟蹤制導(dǎo)指令Φd。
定義跟蹤誤差為:
eΦ=Φ-Φd=[eΦ1,eΦ2,eΦ3]T
(38)
eΦ的導(dǎo)數(shù)為:
(39)
為了使系統(tǒng)以較快的速度收斂到平衡點,設(shè)計新型滑模面如下:
(40)
其中,γΦ1≥1,0<γΦ2<1,kΦ>0。
對式(40)求導(dǎo)可得:
(41)
設(shè)計基于多元超螺旋算法的快速到達控制律如下所示:
(42)
然后,將式(42)代入式(41),設(shè)計連續(xù)虛擬控制律為:
(43)
2.2.2內(nèi)環(huán)控制器設(shè)計
設(shè)計控制力矩M使ω能夠在考慮到模型不確定性ΔJ和外部干擾Δd時,跟蹤上期望指令ωd。
根據(jù)方程(17),可得如下方程:
(44)
內(nèi)環(huán)多變量SLDO被設(shè)計為方程(48)和(51)。
(45)
輔助滑模變量如下:
sM=eω-wM
(46)
方程(46)對時間的導(dǎo)數(shù)為:
(47)
(48)
將式(48)代入式(47)可得:
(49)
采用類似外環(huán)控制器的設(shè)計方法設(shè)計內(nèi)環(huán)系統(tǒng)控制器,定義快速滑模面:
(50)
式中:kω>0,常數(shù)γω1≥1,0<γω2<1。
應(yīng)用與式(42)相似的控制律可得:
(51)
2.2.3穩(wěn)定性證明
(52)
對于系統(tǒng)(52),定義如下李雅普諾夫候選函數(shù):
(53)
根據(jù)文獻[11]中類似的證明過程,若取
可得:
可以得到結(jié)論:如果參數(shù)kΦ1,…,kΦ4都選擇合適,sΦ以及其導(dǎo)數(shù)能夠內(nèi)收斂到零。
(54)
考慮到如下正定李雅普諾夫函數(shù):
(55)
其導(dǎo)數(shù)可以被寫為:
針對系統(tǒng)(16)~(18),設(shè)置不確定性參數(shù)為ΔI=random(0,1)×10%I0,其中I0(kg·m2)為RLV再入段轉(zhuǎn)動慣量常數(shù)矩陣,其形式為I0=diag(56241,1×106,985392) kg·m2,外部時變干擾d(t)×105(N·m),其中
分別采用BNDO和SLDO兩種觀測器對干擾進行觀測,得出兩種觀測器估計值以及干擾估計誤差,如圖3所示。從圖3可以看出,對于階躍類常值的干擾,SLDO與BNDO對干擾的估計速度相近,都能夠比較快地估計出干擾值并且收斂至真值附近;對于隨時間變化的干擾值,SLDO的收斂速度比BNDO快,收斂效果也比BNDO好。仿真結(jié)果說明,SLDO可以有效地估計時變干擾,收斂速度和收斂效果都優(yōu)于BNDO。
圖3 BNDO或SLDO對干擾觀測值Fig.3 Curves of estimation value from BNDO and SLDO
針對RLV再入段對控制系統(tǒng)進行仿真校驗,首先選取PID控制方法與本文所提出的控制方法進行對比分析,仿真結(jié)果如圖4~圖5所示。
圖4 PID控制系統(tǒng)以及所提出控制方法的跟蹤曲線Fig.4 Tracking curves of the PID control system and the proposed control system
圖4中曲線分別為PID控制系統(tǒng)以及本文所提出控制系統(tǒng)的攻角、側(cè)滑角以及傾側(cè)角跟蹤軌跡曲線,圖5為兩種控制方法輸出的誤差曲線。
圖5 PID控制系統(tǒng)以及所提出控制方法的姿態(tài)跟蹤誤差Fig.5 Tracking error of the PID control system and the proposed control system
從圖4~5可以看出,本文所提出控制系統(tǒng)對三個角的最大誤差分別為1.05°,0.2°,1°以內(nèi),而PID控制系統(tǒng)的三個角最大誤差分別為3.89°,2.3°,6.1° 以內(nèi),本文所提出的控制器在系統(tǒng)存在不確定性時的跟蹤誤差小于傳統(tǒng)PID控制器的跟蹤誤差,收斂速度快、收斂效果好。
圖6 有無SLDO的控制系統(tǒng)輸出曲線Fig.6 Curves of the outputs from control system with and without SLDO
其后,選取有無SLDO的控制系統(tǒng)進行仿真對比分析,圖6分別為有無SLDO情況下的控制系統(tǒng)輸出的姿態(tài)角Φ曲線,通過仿真結(jié)果可以看出,在存在未知時變干擾時,基于SLDO的控制系統(tǒng)與不含有SLDO的控制系統(tǒng)相比,精度更高、抖動更小、收斂速度更快、控制效果較好、滿足控制需求。
本文針對RLV再入段存在時變不確定干擾情況下的控制問題進行了研究。提出了自主學(xué)習(xí)干擾觀測器,該觀測器結(jié)合了基礎(chǔ)非線性干擾觀測器、傳統(tǒng)估計律、魯棒估計律以及T2NFS項,實現(xiàn)了在未知干擾邊界情況下對時變干擾的觀測和估計,并分析和證明了觀測器學(xué)習(xí)算法的穩(wěn)定性。然后提出了由SLDO驅(qū)動的多元超螺旋滑??刂品椒ǎ鶕?jù)干擾估計值調(diào)整控制器的參數(shù),從而使控制器更具魯棒性,實現(xiàn)對姿態(tài)指令的跟蹤。以某型RLV再入段為研究對象,進行數(shù)值仿真,通過BNDO和SLDO的干擾觀測對比,校驗了SLDO對時變干擾的估計能力優(yōu)于BNDO;通過PID控制系統(tǒng)與SLDO驅(qū)動的控制系統(tǒng)對比,校驗了在系統(tǒng)中存在時變干擾時,SLDO驅(qū)動的控制系統(tǒng)的收斂更快、收斂效果更好;通過對有無SLDO情況下的控制系統(tǒng)輸出對比,校驗了由SLDO驅(qū)動的多元超螺旋控制方法能夠有效估計外部干擾和模型不確定性,提高控制精度。