宋 超,司維超,黎志強(qiáng)
(海軍航空大學(xué),煙臺(tái),264001)
高超聲速飛行器經(jīng)過遠(yuǎn)距離、長(zhǎng)時(shí)間滑翔飛行后到達(dá)目標(biāo)區(qū)域,開始執(zhí)行作戰(zhàn)任務(wù)。作為飛行器再入飛行的最后階段,末攻擊段的制導(dǎo)效果直接影響到作戰(zhàn)任務(wù)的成敗。
針對(duì)攻擊目標(biāo)移動(dòng)的特點(diǎn),再入攻擊末制導(dǎo)多采用預(yù)測(cè)校正制導(dǎo)方法[1~3]。文獻(xiàn)[1]研究了一種基于負(fù)加速度的預(yù)測(cè)校正制導(dǎo)方法,該方法首先獲取阻力加速度剖面模型,通過數(shù)值預(yù)測(cè),得到阻力加速度與航程的關(guān)系實(shí)時(shí)校正從而消除航程偏差。文獻(xiàn)[3]采用基于航路點(diǎn)的預(yù)測(cè)校正制導(dǎo)方法,將整個(gè)軌跡分為預(yù)測(cè)校正階段及在線生成跟蹤階段,在線生成新的可行參考軌跡。雖然預(yù)測(cè)校正制導(dǎo)不依賴于預(yù)先裝訂的軌跡,但仍存在兩個(gè)問題:一是軌跡優(yōu)化算法大多需要耗費(fèi)計(jì)算機(jī)時(shí),難以實(shí)現(xiàn)在線實(shí)時(shí)計(jì)算;二是算法執(zhí)行過程中出現(xiàn)的誤差難以在線實(shí)時(shí)修正。
而近年,偽譜反饋算法在各種導(dǎo)航、制導(dǎo)與控制問題中得到了有效的應(yīng)用,如航天器轉(zhuǎn)向機(jī)動(dòng)[4]、實(shí)時(shí)最優(yōu)控制穩(wěn)定性分析[5]、最優(yōu)反饋制導(dǎo)[6]等。文獻(xiàn)[5]給出了2種基于Radau偽譜的實(shí)時(shí)反饋控制算法,在自由采樣情況下,對(duì)閉環(huán)系統(tǒng)的穩(wěn)定性進(jìn)行分析,并應(yīng)用到了機(jī)械臂及倒立擺的控制問題中。文獻(xiàn)[6]給出了基于hp自適應(yīng)偽譜法的實(shí)時(shí)最優(yōu)反饋控制方法,并將其應(yīng)用到軌跡優(yōu)化領(lǐng)域中。文獻(xiàn)[7]利用最優(yōu)反饋控制和軌跡快速重構(gòu)技術(shù),設(shè)計(jì)一種有限推力空間遠(yuǎn)程變軌自適應(yīng)閉環(huán)制導(dǎo)方法。
為滿足飛行器在線實(shí)時(shí)計(jì)算的要求,本文將利用偽譜反饋算法對(duì)飛行器末制導(dǎo)方法進(jìn)行研究。首先,給出了一種在線求解非線性最優(yōu)控制問題的算法;然后,證明了該算法的收斂性;最后通過分別對(duì)固定目標(biāo)及移動(dòng)目標(biāo)進(jìn)行仿真,驗(yàn)證了所提方法的有效性。
實(shí)時(shí)最優(yōu)偽譜反饋算法的應(yīng)用過程如圖1所示。具體的算法步驟描述如下:
圖1 偽譜反饋連續(xù)應(yīng)用過程Fig.1 Pseudospectral Feedback Application Process
a)步驟1:選定節(jié)點(diǎn)個(gè)數(shù)N、第1次優(yōu)化時(shí)刻1t,初始狀態(tài)x0及終端狀態(tài)xf,應(yīng)用GPOPS離線計(jì)算最優(yōu)控制量,生成最優(yōu)軌跡。
b)步驟2:計(jì)算t1時(shí)刻的狀態(tài)為x1=x1(t),在[t0,t1]時(shí)間段內(nèi),將u0*(x(t0),t)應(yīng)用于軌跡控制上,令i=1。
c)步驟3:在時(shí)間段[ti,ti+1]內(nèi),根據(jù)上步計(jì)算的ti時(shí)刻的狀態(tài)值xi和終端狀態(tài)值xf,應(yīng)用GPOPS實(shí)時(shí)計(jì)算最優(yōu)控制量,t?[ti,tf],生成ti時(shí)刻點(diǎn)至終點(diǎn)的最優(yōu)軌跡;而在此時(shí)間段內(nèi),作用在系統(tǒng)上的控制量是。設(shè)Δti為優(yōu)化時(shí)間,則ti+1=ti+Δti。
d)步驟4:令i=i+1,返回步驟3。
以u(píng)2*(x(t2),t)為例,來說明偽譜反饋末制導(dǎo)算法的實(shí)施過程:用u*2(x(t2),t)表示以t2時(shí)刻狀態(tài)量x2為初始狀態(tài)、xf為終端狀態(tài),應(yīng)用GPOPS優(yōu)化生成最優(yōu)軌跡時(shí)所需的系統(tǒng)控制量,記所需的優(yōu)化時(shí)間為Δt2,在此期間,作用于系統(tǒng)上的最優(yōu)控制為前一次優(yōu)化過程得到的控制量u1*(x(t1),t),而在t2+Δt2=t3時(shí)刻后,最優(yōu)控制量u2*(x(t2),t)才被應(yīng)用于系統(tǒng)上,且應(yīng)用時(shí)間的長(zhǎng)短取決于以x3為初始狀態(tài)、xf為終端狀態(tài),優(yōu)化計(jì)算新的最優(yōu)軌跡所需的時(shí)間。
定義實(shí)際系統(tǒng)動(dòng)力學(xué)方程為
式中p為實(shí)際系統(tǒng)參數(shù);d(t)為外部干擾輸入。
式中xR為實(shí)際系統(tǒng)狀態(tài)量;xM為理想的系統(tǒng)狀態(tài)量;p0為系統(tǒng)參數(shù)初始值;t為控制量作用時(shí)間。
因此,t=ti+1時(shí)刻系統(tǒng)的狀態(tài)決定于控制量的作用,即:
由于存在計(jì)算時(shí)間延遲及干擾d(t)和不確定性p的影響,實(shí)際系統(tǒng)狀態(tài)量xR與理想的系統(tǒng)狀態(tài)量xM之間存在偏差。將式(4)減去式(2)得:
假設(shè)1:對(duì)于任意狀態(tài)量x,函數(shù)f(x,u,t;p)是利普希茨(Lipschitz)連續(xù)的,則式(5)可寫成:
式中L為函數(shù)的Lipschitz常數(shù)。
引理1:(Gronwall 定理[8])令y(t)R+?是滿足如下Gronwall不等式的可積函數(shù):
式中a,b為連續(xù)非負(fù)有界函數(shù),且a(t)在[t0,tf]時(shí)間內(nèi)非減。則有下式成立:
令δ>0是使得下式成立的最小值:
式中αi?(0,1)且。則有下述結(jié)論成立:
定理1:對(duì)任意ε>0,若計(jì)算時(shí)間滿足:
證明:由式(6)至式(9)可得:
則由引理1,式(11)化為:
由Lambert W函數(shù)定義可知,對(duì)y,z?R+,若z≤W(y),則有zez≤y。因此,由式(10)和式(12)可得:
高超聲速飛行器無動(dòng)力運(yùn)動(dòng)方程見參考文獻(xiàn)[9]。各變量的限制為
式中h,θ,φ,v,ψ,χ分別為高度、經(jīng)度、緯度、速度、航跡角、航向角,均為狀態(tài)量;α,σ分別為攻角、傾斜角,為控制量。
設(shè)飛行器再入初始值如表1所示。
表1 飛行器狀態(tài)初始值Tab.1 Initial Value of Aircraft State
假設(shè)地面固定目標(biāo)位置:經(jīng)度為5°,緯度為3°。為提高末攻擊段的制導(dǎo)精度,引入終端約束為
仿真結(jié)果見圖2至圖9。
圖2 高度變化曲線Fig. 2 The Curve of Height
圖3 速度變化曲線Fig.3 The Curve of Speed
圖4 經(jīng)度變化曲線Fig.4 The Curve of Longitude
圖5 緯度變化曲線Fig.5 The Curve of Latitude
圖6 航跡角變化曲線Fig.6 The Curve of Flight Path Angle
圖7 航向角變化曲線Fig.7 The Curve of Azitude Angle
圖8 攻角變化曲線Fig.8 The Curve of Attack Angle
圖9 傾斜角變化曲線Fig.9 The Curve of Bank Angle
從圖2至圖9可以看到:終端約束條件得到滿足,高度、速度和航跡角均在設(shè)定的約束范圍之內(nèi);且飛行器最終準(zhǔn)確攻擊到位于(5°,3°)的目標(biāo)點(diǎn)。
目標(biāo)由于機(jī)動(dòng),其位置并非時(shí)刻精確已知,而是通過衛(wèi)星、地基雷達(dá)、預(yù)警機(jī)等偵查預(yù)警系統(tǒng)和飛行器的機(jī)載雷達(dá)或紅外傳感器等設(shè)備探測(cè)。當(dāng)目標(biāo)信息傳輸給飛行器,飛行器將根據(jù)新的末端位置,應(yīng)用偽譜反饋制導(dǎo)算法生成新的最優(yōu)再入軌跡。目標(biāo)未知信息校正次數(shù)越多,攻擊命中精度越高。算法流程如圖10所示。
圖10 攻擊機(jī)動(dòng)目標(biāo)制導(dǎo)算法流程Fig.10 Guidance Algorithm Flow Chart of Attacking Maneuvering Target
不失一般性,本文對(duì)目標(biāo)位置進(jìn)行3次校正,并仿真比較其落點(diǎn)偏差。
假設(shè)移動(dòng)目標(biāo)初始位置為:經(jīng)度5°,緯度2°。沿著經(jīng)度線做勻速運(yùn)動(dòng),速度為37.04 km/h。
從圖11、圖12可見,飛行器通過偽譜反饋制導(dǎo)方 法可以修正由于目標(biāo)移動(dòng)帶來的落點(diǎn)偏差。且校正次數(shù)越多,制導(dǎo)精度越高。但是制導(dǎo)時(shí)間也會(huì)相應(yīng)增加。制導(dǎo)誤差對(duì)比如表2所示。
圖11 校正的三維軌跡Fig.11 Three-dimensional Trajectory of Adjusting Once
圖12 三維軌跡的地面投影Fig.12 Ground Projection Figure of Adjusting Once
表2 制導(dǎo)誤差對(duì)比Tab.2 Guidance Error Constrast
本文針對(duì)飛行器攻擊機(jī)動(dòng)目標(biāo)的任務(wù)要求,提出了一種偽譜反饋實(shí)時(shí)最優(yōu)制導(dǎo)方法,并從理論上證明了該算法的收斂性。通過仿真可以看出,攻擊固定目標(biāo)時(shí),該方法能引導(dǎo)飛行器準(zhǔn)確飛向目標(biāo);當(dāng)目標(biāo)慢速機(jī)動(dòng)時(shí),制導(dǎo)精度隨著目標(biāo)位置的校正次數(shù)增多而增高。仿真驗(yàn)證了偽譜反饋制導(dǎo)方法的可行性和優(yōu)越性。