方科,張慶振,倪昆,程林,黃云濤
1.北京航空航天大學(xué) 自動化科學(xué)與電氣工程學(xué)院,北京 100083 2. 北京航天自動控制研究所,北京 100076
以無動力高超聲速再入飛行器為代表的遠(yuǎn)程作戰(zhàn)武器具有作戰(zhàn)范圍廣、飛行速度快、跟蹤難度大、作戰(zhàn)效能高等特點(diǎn)[1],在近些年來受到各國越來越多的關(guān)注。與此同時,各國相繼研發(fā)了近迫武器系統(tǒng)(CIWS)、“宙斯盾”等一系列反導(dǎo)系統(tǒng)[2],使得其作戰(zhàn)效能與突防能力大幅下降。在此背景下,相對于傳統(tǒng)提高單兵作戰(zhàn)效能的方法,發(fā)展多飛行器協(xié)同飽和打擊更加符合未來戰(zhàn)場作戰(zhàn)需要,其個體之間通過功能互補(bǔ)可以實(shí)現(xiàn)飽和攻擊、協(xié)同抗干擾等復(fù)雜功能。
高超聲速飛行器的遠(yuǎn)距離飛行和復(fù)雜不確定性環(huán)境特點(diǎn),使得飛行時間具有較大波動,難以實(shí)現(xiàn)在同一時刻對目標(biāo)進(jìn)行飽和打擊的任務(wù)需求。其中再入飛行段占據(jù)了90%以上的飛行時間,是決定最終飽和打擊效果的關(guān)鍵因素之一。因而發(fā)展多高超聲速飛行器協(xié)同再入制導(dǎo)技術(shù)是未來協(xié)同體系作戰(zhàn)的必要條件之一。
本文以多高超聲速飛行器協(xié)同飽和打擊為應(yīng)用背景[3-5],將其飛行過程分為初始發(fā)射段、協(xié)同再入段和協(xié)同末制導(dǎo)段。其中初始發(fā)射段通過程序發(fā)射序列確保協(xié)同再入的可行性;協(xié)同末制導(dǎo)段由文獻(xiàn)[5-9]實(shí)現(xiàn)。而在這之間的協(xié)同再入段占據(jù)了整個飛行過程中的絕大多數(shù)時間與路程,在傳統(tǒng)單飛行器高精度、高可靠性的再入制導(dǎo)律基礎(chǔ)上,要求多飛行器能在同一時刻到達(dá)指定的中末交班地點(diǎn)。協(xié)同再入飛行[3,10]作為近兩年來的新型任務(wù)需求,針對其協(xié)同制導(dǎo)結(jié)構(gòu)與制導(dǎo)律的設(shè)計,現(xiàn)有文獻(xiàn)均鮮有涉及。
單個高超聲速飛行器的再入制導(dǎo)是一個復(fù)雜的多約束軌跡規(guī)劃問題,現(xiàn)階段主要有“標(biāo)稱軌跡法”和“預(yù)測-校正法”[11-14]。前者離線生成標(biāo)準(zhǔn)彈道并在實(shí)際再入過程中進(jìn)行軌跡跟蹤,簡單易行但自主性和精度較差。后者在彈道預(yù)測的基礎(chǔ)上進(jìn)行軌跡校正,自主性與精度較高,但實(shí)時性較差且在線約束管理能力較弱[11-12]。
多彈協(xié)同制導(dǎo)技術(shù)不同于多無人機(jī)[15-16]和多機(jī)器人[17-18]的協(xié)同控制,其運(yùn)動速度快、運(yùn)動方向單一、能量耗散過程不可逆等特點(diǎn)[6,19]使得多無人機(jī)的協(xié)同控制方法無法直接使用。林濤等[19]首先對多彈協(xié)同的基本問題進(jìn)行闡述;2006年,Jeon等[5]實(shí)現(xiàn)指定飛行時間的最優(yōu)末導(dǎo)引律設(shè)計。趙世鈺和周銳[6-7]結(jié)合協(xié)調(diào)變量[8]提出雙層協(xié)同制導(dǎo)架構(gòu);2009年,張友安等[9]提出“領(lǐng)彈-從彈”的協(xié)同制導(dǎo)架構(gòu)。后續(xù)的研究工作大部分是針對這兩套架構(gòu)的拓展與完善,并且主要集中于末制導(dǎo)律的設(shè)計上。
高超聲速飛行器時間協(xié)同再入制導(dǎo)將以上兩個技術(shù)相結(jié)合的同時,也催生出其特有的難點(diǎn):
1) 時間協(xié)同再入飛行對再入制導(dǎo)律的實(shí)時性、在線約束管理等方面提出更高的要求,需要對現(xiàn)有方法加以優(yōu)化。
2) 現(xiàn)有再入制導(dǎo)律并沒有考慮飛行時間約束,飛行過程中的參數(shù)攝動使得再入時間不可知且不可控,難以滿足協(xié)同再入飛行的時間一致性要求。因而需要將時間約束加入到制導(dǎo)律的設(shè)計之中,解決再入時間的不可預(yù)知性和不可控性。
3) 高超聲速飛行器相對于傳統(tǒng)導(dǎo)彈,其飛行速度更快、再入過程更為復(fù)雜、控制變量較為單一,并且無動力的再入飛行特點(diǎn)使得總能量有限且控制過程不可逆,無法直接將例如文獻(xiàn)[6]中的雙層協(xié)同結(jié)構(gòu)運(yùn)用于協(xié)同再入制導(dǎo)中,因而需要在協(xié)同結(jié)構(gòu)和協(xié)調(diào)策略上進(jìn)行改進(jìn)和創(chuàng)新。
本文首先對現(xiàn)有單個飛行器的制導(dǎo)律加以改進(jìn),提升其實(shí)時性、在線約束管理能力以滿足協(xié)同再入制導(dǎo)任務(wù)需要;進(jìn)而針對再入飛行時間可知性與可控性問題,提出時間可控再入制導(dǎo)律;最后根據(jù)協(xié)同再入任務(wù)背景需求,基于多飛行器時間協(xié)調(diào)信息提出協(xié)同再入制導(dǎo)結(jié)構(gòu)和協(xié)調(diào)策略,實(shí)現(xiàn)多高超聲速飛行器的時間協(xié)同再入飛行過程。
在不考慮地球自轉(zhuǎn)的情況下,多個無動力高超聲速飛行器三自由度運(yùn)動方程為
(1)
式中:下標(biāo)i代表第i個飛行器;v為其相對于地球的速度;r為飛行器到地球中心的距離;λ和φ為地球經(jīng)緯度;Se為射程角;θ為速度傾角,向上為正;ψ為速度偏航角,以正北順時針為正;σ為傾側(cè)角,右偏為正;m為飛行器質(zhì)量;g為地球重力加速度;L和D為升力和阻力。
(2)
(3)
(4)
(5)
再入過程中終端約束與控制約束如式(6)~式(8)所示:
h(tf,i)=hf,i,v(tf,i)=vf,i
(6)
λ(tf,i)=λf,i,φ(tf,i)=φf,i
(7)
(8)
針對終端時刻一致的協(xié)同再入過程,給出整個飛行過程的時間約束如式(9)所示:
tf,1=tf,2=…=tf, n
(9)
式中:tf,i為第i個飛行器的終端時刻。
仿真對象為CAV-H,相關(guān)參數(shù)詳見文獻(xiàn)[20-21]。由文獻(xiàn)[20]可知再入過程中采用的固定攻角剖面為
(10)
多高超聲速飛行器協(xié)同再入的核心任務(wù)是在同一時刻到達(dá)指定交班點(diǎn)。結(jié)合文獻(xiàn)[6]與協(xié)同再入背景,設(shè)計協(xié)同再入制導(dǎo)架構(gòu)如圖1所示。其中再入過程分為初始下滑段、平衡滑翔段和再入終段[14]。
圖1 協(xié)同再入制導(dǎo)架構(gòu)Fig.1 Architecture of cooperative reentry guidance
整個協(xié)同結(jié)構(gòu)分為兩層,上層為協(xié)調(diào)層,適用于分布式/集中式的通訊結(jié)構(gòu),生成時間協(xié)調(diào)信息[8];下層為執(zhí)行層,由時間可控再入制導(dǎo)律進(jìn)行在線軌跡預(yù)測與校正。
本文以集中式的通訊結(jié)構(gòu)為例進(jìn)行相關(guān)結(jié)構(gòu)的設(shè)計。多個飛行器通過中繼衛(wèi)星等外部設(shè)備,將各自的預(yù)估飛行時間Ti傳給集中運(yùn)算單元。運(yùn)算單元根據(jù)協(xié)調(diào)策略計算時間協(xié)調(diào)信息tneed,并將其傳回至各飛行器,各飛行器以時間協(xié)調(diào)信息為約束進(jìn)行在線軌跡設(shè)計。不同再入飛行階段的協(xié)調(diào)策略各不相同,具體見本文3.3.3節(jié)。
時間可控再入制導(dǎo)總體方案如圖2所示,主要包括軌跡預(yù)測-校正、在線約束管理和再入飛行時間預(yù)估-校正3個模塊。圖中:α為功角;σd為軌跡規(guī)劃模塊求得的傾側(cè)角;σcmd為指定的傾側(cè)角。
圖2 總體制導(dǎo)方案Fig.2 Overall scheme of reentry guidance
首先,軌跡預(yù)測與校正模塊在理論推導(dǎo)的基礎(chǔ)上進(jìn)行控制剖面參數(shù)化,在滿足約束的前提下將原本復(fù)雜的軌跡規(guī)劃問題轉(zhuǎn)換為單參數(shù)的規(guī)劃,通過在線傾側(cè)角剖面調(diào)整信息的收集與預(yù)測,利用一次軌跡積分完成傾側(cè)角剖面的調(diào)整,減少制導(dǎo)周期內(nèi)的冗余計算并提高實(shí)時性。其次,在線約束強(qiáng)化管理模塊引入控制理論的相關(guān)方法,實(shí)現(xiàn)對過程約束、終端約束和控制約束的在線強(qiáng)化管理,在不需要前期大量參數(shù)試湊的前提下提高制導(dǎo)律的在線約束管理能力。最后,時間預(yù)估-校正模塊在時間敏感性分析的基礎(chǔ)上,將視線角走廊作為控制變量,采用神經(jīng)網(wǎng)絡(luò)和Gauss-Newton迭代法實(shí)現(xiàn)基于時間誤差的視線角走廊動態(tài)調(diào)整策略,實(shí)現(xiàn)指定時間的再入飛行。
3.1.1 控制剖面參數(shù)化
再入過程是一個復(fù)雜的多約束規(guī)劃問題,傳統(tǒng)方法通過人為設(shè)定規(guī)劃點(diǎn)以達(dá)到在線求解的目的,限制了飛行器的能力,難以滿足協(xié)同再入任務(wù)自主性要求,因而需要進(jìn)行改進(jìn)。首先構(gòu)建圖 3所示的高度-速度(H-V)走廊和如圖 4所示的復(fù)合傾側(cè)角走廊,具體流程見文獻(xiàn)[11]。
圖3 高度-速度走廊Fig.3 Altitude-velocity corridor
圖4 復(fù)合傾側(cè)角走廊Fig.4 Compound bank angle corridor
終端經(jīng)緯度約束可轉(zhuǎn)化為如式(11)所示的射程約束:
(11)
將式(1)中的射程角對速度求導(dǎo)可得
(12)
式中:CD為阻力系數(shù);Sref為參考?xì)鈩用娣e。
聯(lián)立式(11)和式(12)可以定性的得出以下結(jié)論:一定速度下,|dSe/dv|關(guān)于高度h的增加而單調(diào)遞減;結(jié)合擬平衡滑翔假設(shè)[11]可進(jìn)一步得到推論,隨著傾側(cè)角的增大,|dSe/dv|增大,飛行器滑翔能力和飛行距離減??;反而反之[14]。
再入軌跡規(guī)劃本質(zhì)上是多約束條件下的非線性規(guī)劃問題。在上述推導(dǎo)的基礎(chǔ)上進(jìn)行控制剖面參數(shù)化,將傾側(cè)角走廊上下界進(jìn)行加權(quán)得到規(guī)劃的傾側(cè)角剖面。
σd(v)=ωσmin(v)+(1-ω)σmax(v)
(13)
式中:σd(v)為某速度下規(guī)劃的傾側(cè)角;σmin(v)和σmax(v)分別為某速度下傾側(cè)角走廊上下界;ω為權(quán)重系數(shù)。不同權(quán)重下的射程規(guī)劃能力如圖 5所示。
通過控制剖面參數(shù)化,在滿足過程約束、終端約束的基礎(chǔ)上,將再入過程中的射程約束轉(zhuǎn)化為權(quán)重系數(shù)ω的單參數(shù)規(guī)劃問題,并且二者呈如圖5所示的單調(diào)遞增關(guān)系,降低了問題求解難度和提高了射程規(guī)劃能力。
圖5 權(quán)重系數(shù)-射程Fig.5 Weight coefficient-range
3.1.2 跨周期軌跡預(yù)測-校正
傳統(tǒng)預(yù)測-校正制導(dǎo)方法在每個周期內(nèi)通過多次的軌跡積分來獲取必要的參數(shù)調(diào)整信息,造成大量冗余計算和規(guī)劃周期不穩(wěn)定情況出現(xiàn)[14],難以滿足協(xié)同再入要求。由于多個制導(dǎo)周期之間的控制剖面調(diào)整信息存在一定的連續(xù)遞推關(guān)系,因而采用校正信息在線收集與預(yù)測方法,將這部分遞推信息進(jìn)行有效的收集與模型辨識。由圖 5的單調(diào)性可知,規(guī)劃射程與權(quán)重系數(shù)可在小范圍內(nèi)近似成式(14)的一階線性函數(shù)關(guān)系:
Spre(ω)≈aω+b
(14)
式中:Spre為規(guī)劃射程;a、b為待估計參數(shù)。通過前k個周期的剖面調(diào)整收集,得到的觀測模型為
Hkx+Ek=Zk
(15)
為達(dá)到最優(yōu)的參數(shù)估計結(jié)果,最小化式(16)性能評價指標(biāo):
(16)
式中:正定陣Qk為權(quán)重矩陣。利用前k個周期的剖面調(diào)整與預(yù)測信息,對第k+1個周期的權(quán)重系數(shù)進(jìn)行估計,其中加權(quán)矩陣迭代設(shè)置為
(17)
最終估計參數(shù)表達(dá)式為
(18)
(19)
通過式(18)和式(19),將原本隱函數(shù)關(guān)系的權(quán)重-射程函數(shù)式(14)進(jìn)行了顯式的遞推表達(dá)。因而在整個制導(dǎo)過程中,利用式(19)對前k個周期剖面調(diào)整與預(yù)測信息的觀測,遞推出如式(18)所示的第k+1個周期的估計參數(shù),進(jìn)而直接求解出第k+1個周期的剖面調(diào)整信息,即
零工經(jīng)濟(jì)(Gig Economy)中的零工(Gig)原意是指臨時工,是一些勞動者無法獲得正式工作,只能從事一些臨時性工作[1]。由于產(chǎn)業(yè)的周期性以及季節(jié)的周期性,有些工作并長期不雇傭勞動力,往往是需要的時候才雇傭工人,此時就會出現(xiàn)大量勞動力以團(tuán)隊(duì)形式暫時的集聚于某一地方或某一產(chǎn)業(yè)的現(xiàn)象,例如農(nóng)民工[2,3]。由這種臨時工所形成的經(jīng)濟(jì)現(xiàn)象被稱為零工經(jīng)濟(jì)。改革開放以來,我國的很多城市中都出現(xiàn)過這種“零工”現(xiàn)象。
Spre(ω)=Sgo
(20)
(21)
式中:Sgo為所需的剩余射程。
通過在線的參數(shù)收集與遞推,在每個制導(dǎo)周期內(nèi)僅需要一次軌跡積分即可完成傾側(cè)角剖面的調(diào)整,大大提高了在線軌跡規(guī)劃效率,滿足協(xié)同再入制導(dǎo)的在線軌跡規(guī)劃實(shí)時性要求。
軌跡預(yù)測-校正為再入過程提供可行的縱向軌跡,但實(shí)際飛行中再入軌跡仍然存在違反約束的情況[11,14],因而需要對其進(jìn)行在線約束強(qiáng)化管理,提高制導(dǎo)律的可靠性與穩(wěn)定性。具體流程如圖6所示,其中約束管理對象包括過程約束、終端約束和控制約束。圖中:σco為修正的傾側(cè)角指令;σpo為濾波前的傾側(cè)角指令。
圖6 在線約束管理Fig.6 Online constraint management
3.2.1 過程約束管理
由式(2)~式(4)可知,再入過程中的熱流、動壓、過載約束可以轉(zhuǎn)化為H-V走廊下界,并且存在唯一的高度-速度對應(yīng)關(guān)系。引入剩余高度:
Δhd=h-hdown>0
(22)
式中:hdown為當(dāng)前速度下H-V走廊下界高度。
為保證飛行高度總是在走廊下界之上,對高度求導(dǎo)并設(shè)計如式(23)所示的高度下降速率限制器為
(23)
式中:λh為高度趨近系數(shù)。
當(dāng)飛行器存在超過下界趨勢時,該模塊將傾側(cè)角限制到合理的范圍之內(nèi),而這其中產(chǎn)生的射程誤差又能在后續(xù)的制導(dǎo)周期中得到補(bǔ)償,因而不會影響整個再入過程的精度。同時,其計算量極小且校正過程基于當(dāng)前高度信息因而不需要前期的參數(shù)試湊,具有較高的約束管理可靠性。
3.2.2 終端約束管理
再入過程還需要滿足如式(6)的終端高度與速度約束。對式(1)中的高度與速度傾角在擬平衡滑翔條件的平衡點(diǎn)(h,θ)處小擾動線性化可得
(24)
式中:
(25)
σco=arccos(cosσd+Δcosσ)
(26)
3.2.3 控制約束管理
規(guī)劃的傾側(cè)角剖面在實(shí)際執(zhí)行過程中受限于式(9)執(zhí)行速率,需要加入的指令濾波環(huán)節(jié)為
(27)
通過以上3種約束強(qiáng)化算法的設(shè)計,在不影響實(shí)時性的前提下,提高再入制導(dǎo)律的在線約束管理能力,為之后的協(xié)同過程提供實(shí)時可靠的縱向軌跡支持。
3.3.1 視線角走廊設(shè)計
一套完整的再入制導(dǎo)律還需要橫向上的傾側(cè)角符號規(guī)劃。本文在傳統(tǒng)的三段式視線角(Line of Sight,LOS)走廊的基礎(chǔ)上進(jìn)行時間可控制導(dǎo)律設(shè)計。反轉(zhuǎn)邏輯如式(28)所示,走廊如圖7所示。
(28)
式中:Δψu(yù)p和Δψdown分別為當(dāng)前速度下的視線角走廊的上下界。視線角走廊根據(jù)CAV-H的再入任務(wù)[20]進(jìn)行設(shè)置,v0~v4分別為視線角走廊轉(zhuǎn)折點(diǎn)速度,初始速度v0=7 000 m/s,初始下滑段走
圖7 視線角走廊Fig.7 Line of sight (LOS) corridor
廊上限為5°;終端速度v4=800 m/s,走廊上限為2°;中間段上限為x。
通過對中間段x的調(diào)整,可以改變再入過程中橫向移動范圍。當(dāng)需要增大橫向機(jī)動距離時,中間段寬度沿①方向擴(kuò)大;反之沿②方向收窄。橫向機(jī)動距離的改變一定程度上影響再入時間,具體方法見3.3.4節(jié)。
3.3.2 再入時間影響因素分析
由于再入過程極為復(fù)雜,干擾因素眾多,首先對能夠影響再入飛行時間的因素進(jìn)行劃分,具體如表1所示。其中,主動因素有攻角剖面的切換速度、最小攻角和視線角走廊的寬度等;被動因素有大氣不確定、初始投放不確定和動態(tài)特性(氣動系數(shù)、動導(dǎo)數(shù)等)不確定等。
表1 再入時間影響因素Table 1 Influencing factors of reentry time
以標(biāo)稱環(huán)境下飛行時間為1 592 s的再入任務(wù)為例,對被動因素進(jìn)行2 000次蒙特卡羅仿真并統(tǒng)計最終飛行時間誤差,結(jié)果如圖 8所示。
圖8 被動因素產(chǎn)生的時間誤差直方圖Fig.8 Histogram of time errors caused by passive factors
在標(biāo)稱環(huán)境下對主動因素進(jìn)行調(diào)節(jié)以研究其時間調(diào)整能力,結(jié)果如表2所示。其中視線角走廊上界的調(diào)節(jié)是通過設(shè)置圖7視線角走廊的中間段角度x而實(shí)現(xiàn)的。
表2 主動因素的影響Table 2 Influence of active factors
由表2可知,通過對主動因素的調(diào)整可以實(shí)現(xiàn)再入飛行時間的調(diào)節(jié),為再入過程的時間調(diào)整提供了可行性的基礎(chǔ)。但通過改變攻角剖面進(jìn)行時間調(diào)節(jié)的能力有限且能量損耗大。
在傳統(tǒng)多彈協(xié)同制導(dǎo)律的設(shè)計中,通常在基本導(dǎo)引律之上疊加橫向過載指令,改變橫向機(jī)動距離以實(shí)現(xiàn)飛行時間的調(diào)整[4,7]。高超聲速飛行器的操控能力有限,面對稱的外形無法直接疊加橫向過載,因而最有效地增加橫向機(jī)動距離的方法是改變視線角走廊的寬度,表2中的視線角走廊寬度與再入飛行時間的關(guān)系如圖9所示。由圖可知,調(diào)節(jié)視線角走廊寬度可以有效地改變飛行時間且呈單調(diào)遞增趨勢,因而在再入過程中采用動態(tài)改變視線角走廊寬度的方法以調(diào)整再入飛行時間。
圖9 視線角走廊寬度與再入飛行時間Fig.9 Width of LOS corridor vs reentry flight time
3.3.3 協(xié)調(diào)信息計算
集群內(nèi)個體之間的信息共享是實(shí)現(xiàn)集群協(xié)同運(yùn)行的基礎(chǔ),其中所必需的最小量信息被稱之為協(xié)調(diào)信息或協(xié)調(diào)變量[6,8]。若每個個體都能接收到相同的協(xié)調(diào)信息并由此進(jìn)行動作,則集群的協(xié)同運(yùn)行即可實(shí)現(xiàn)?;趨f(xié)調(diào)信息的協(xié)同控制作為一種通用方法,為集群協(xié)同控制問題提供了一套具有普遍意義的解決方案[6]。
基于協(xié)調(diào)信息的協(xié)同控制方法已成功運(yùn)用于機(jī)器人、無人機(jī)等領(lǐng)域之中[7],因而也為高超聲速飛行器時間協(xié)同再入制導(dǎo)提供可能的探索方向。由于協(xié)同再入飛行的目的是對目標(biāo)進(jìn)行飽和打擊,該過程要求所有飛行器具有相同的再入飛行時間,因而可將其期望值tneed作為協(xié)調(diào)信息。
若各飛行器再入飛行時間可知且能夠與tneed達(dá)成一致,則在多飛行器必然能夠同時完成再入飛行過程。期望再入飛行時間tneed的求取是基于對象特點(diǎn)所設(shè)計的協(xié)調(diào)函數(shù)[8]。本文的協(xié)調(diào)函數(shù)具有特殊性,主要由于高超聲速飛行器控制方式單一且控制過程不可逆。前期仿真表明,調(diào)整范圍為整個再入時間的4%~5%。以至少需要1 600 s的再入過程為例,可調(diào)節(jié)的范圍在1 600-1 670 s。其次由于再入過程的復(fù)雜性,難以實(shí)現(xiàn)文獻(xiàn)[7]中具有明確物理意義且具有次優(yōu)性的協(xié)調(diào)信息。因而需要根據(jù)不同的飛行階段特點(diǎn)設(shè)計相應(yīng)的協(xié)調(diào)函數(shù)以得到協(xié)調(diào)信息tneed。
在初始下滑段,飛行器氣動力和機(jī)動能力弱,僅需要將運(yùn)動方向?qū)?zhǔn)目標(biāo)和保證存在可行的協(xié)同再入時間域即可。因而只在初始投放時刻對各飛行器的可行再入飛行時間范圍進(jìn)行預(yù)估并做可協(xié)同性分析,即保證多個可行時間域存在重疊,進(jìn)而求解如式(29)所示的初始可行協(xié)調(diào)時間:
(29)
式中:tmin,i和tmax,i分別為第i個飛行器的最小和最大飛行時間。在整個初始下滑段中以固定的時間協(xié)調(diào)信息進(jìn)行再入軌跡規(guī)劃。
在所有飛行器進(jìn)入平衡滑翔段后,氣動力和機(jī)動能力增強(qiáng),加之長距離的飛行過程使得其有一定的時間調(diào)整能力,此時計算中心根據(jù)各飛行器預(yù)估時間求解時間協(xié)調(diào)信息,即
(30)
在第m個制導(dǎo)周期,所有飛行器進(jìn)入再入終段,此時以減小落點(diǎn)誤差和細(xì)調(diào)再入時間為目標(biāo),協(xié)調(diào)信息沿用第m-1個周期的計算結(jié)果:
(31)
3.3.4 時間預(yù)估與校正
飛行器再入時間的可知性與可控性是協(xié)同制導(dǎo)的基礎(chǔ),在選定視線角走廊寬度作為時間調(diào)整變量和定義協(xié)調(diào)函數(shù)之后,構(gòu)造如圖10所示的時間可控再入制導(dǎo)系統(tǒng)。
其中時間預(yù)估模塊根據(jù)當(dāng)前時刻飛行器狀態(tài)對剩余再入飛行時間進(jìn)行預(yù)估,實(shí)現(xiàn)再入時間的可知性。進(jìn)而與期望飛行時間(即協(xié)調(diào)信息)比較得到時間誤差為
Δtco=tpre-tneed
(32)
式中:tpre為預(yù)估剩余飛行時間。偏差量Δtco通過在線的視線角走廊寬度調(diào)整得以消除,實(shí)現(xiàn)再入飛行時間的可控性。
再入過程是一個復(fù)雜的飛行運(yùn)動學(xué)問題,再入時間與諸多因素有關(guān),現(xiàn)階段缺乏有效的方法對其進(jìn)行分析。通過仿真,在固定視線角走廊下,某次再入過程中的不同參數(shù)與再入時間關(guān)系如圖11所示。
圖10 時間可控再入制導(dǎo)系統(tǒng)Fig.10 Time-controlled reentry guidance system
在加入視線角走廊寬度之后,圖11將更為復(fù)雜,本文不再具體展開?;跀?shù)值計算的方法很難對如此復(fù)雜且連續(xù)的函數(shù)進(jìn)行有效的擬合,而神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的自學(xué)習(xí)、自適應(yīng)與非線性映射能力,常被運(yùn)用于關(guān)系復(fù)雜的非確定問題研究,因此本文將其用于再入過程中的時間預(yù)估。前期仿真與理論分析可知再入時間與飛行器當(dāng)前的高度、速度、剩余距離、視線角、視線角走廊上界有關(guān),即
(33)
時間預(yù)估模塊采用如圖12所示的BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)。在一定大小的訓(xùn)練數(shù)據(jù)集(105~106及以上)基礎(chǔ)上,根據(jù)Kosmogorov定理,在合理的結(jié)構(gòu)和恰當(dāng)?shù)臋?quán)值條件下,3層BP網(wǎng)絡(luò)可以逼近任意的連續(xù)函數(shù)[22-23]。
圖11 不同參數(shù)與再入時間的關(guān)系Fig.11 Relationship between different parameters and reentry time
圖12 3層BP神經(jīng)網(wǎng)絡(luò)Fig.12 Three-layer BP neural network
(34)
(35)
輸出層采用斜率為ko(ko>0)的ReLU函數(shù):
G(x)=max(0,kox)
(36)
最終輸出剩余飛行時間預(yù)估值為
(37)
1) 標(biāo)稱環(huán)境下,在可達(dá)飛行距離范圍內(nèi)等距離選擇50個經(jīng)緯度坐標(biāo)作為仿真的初始投放點(diǎn),再入任務(wù)目標(biāo)見表 4。
2) 針對每一個再入過程,橫向制導(dǎo)模塊的視線角走廊寬度x以1°為步長由3°變化至28°,重復(fù)進(jìn)行再入軌跡仿真,制導(dǎo)仿真周期為1 s。
3) 記錄整個仿真過程中的5個飛行器狀態(tài)量,并由最終的飛行時間倒推出不同狀態(tài)量所對應(yīng)的剩余飛行時間,兩兩結(jié)合組成訓(xùn)練集。
通過以上流程可獲得大小在2×106級別的時間預(yù)估網(wǎng)絡(luò)訓(xùn)練集。網(wǎng)絡(luò)訓(xùn)練采用貝葉斯正則化算法以提高其泛化能力和抑制過擬合現(xiàn)象[22]。在每一代的訓(xùn)練過程中,隨機(jī)選擇整個數(shù)據(jù)集中的85%作訓(xùn)練集,10%作驗(yàn)證集,5%作測試集。隱藏層神經(jīng)元個數(shù)的確定采用網(wǎng)格搜索法,在1000代的訓(xùn)練代數(shù)下,網(wǎng)絡(luò)效果如圖13,橫坐標(biāo)nh為隱藏層神經(jīng)元個數(shù),縱坐標(biāo)為訓(xùn)練集和測試集的均方根誤差(Root Mean Square Error,RMSE)
由圖13可知,即使是采用非線性的Sigmoid函數(shù)作隱藏層的激活函數(shù),時間預(yù)估網(wǎng)絡(luò)仍然存在一定誤差,并且與隱藏層神經(jīng)元個數(shù)存在一定的關(guān)系。當(dāng)神經(jīng)元個數(shù)較少時,網(wǎng)絡(luò)出現(xiàn)欠擬合;隨著數(shù)量的增加,網(wǎng)絡(luò)擬合精度逐漸提高,但在超過一定閾值后出現(xiàn)過擬合現(xiàn)象。在多次測試和綜合考慮精度、計算量的基礎(chǔ)上,最終選定的網(wǎng)絡(luò)結(jié)構(gòu)為5-20-1。進(jìn)而對預(yù)估模塊實(shí)際運(yùn)行效果進(jìn)行測試,結(jié)果如圖14所示。由圖可知即使在加入?yún)?shù)拉偏后,整個再入過程中的時間預(yù)估誤差仍在±7 s以內(nèi)。其中由于在初始下滑段和再入終段,視線角走廊存在拐點(diǎn),從而造成較大的估計誤差,但不影響總體的時間預(yù)估效果。
橫向走廊的寬度直接影響了再入過程的橫向機(jī)動范圍,調(diào)節(jié)橫向機(jī)動范圍可以對再入飛行時間進(jìn)行調(diào)整,并且存在如圖9的連續(xù)單調(diào)遞增關(guān)系。以圖7為例,具體的走廊調(diào)整策略如下:
1) 初始下滑段氣動能力較弱,需要飛行器對準(zhǔn)目標(biāo)方向,不進(jìn)行走廊的調(diào)整。
圖13 隱藏層神經(jīng)元個數(shù)-均方根誤差Fig.13 Number of hidden layer neurons vs RMSE
圖14 剩余飛行時間預(yù)估效果Fig.14 Test results of estimated time-to-go
2) 再入終段為了到達(dá)目標(biāo)點(diǎn)需要一定的視線角限制,不對最終角度進(jìn)行調(diào)整。
3) 調(diào)整區(qū)域?yàn)橹虚g段寬度x,由式(32)得到時間誤差Δtco,Δtco<0時,說明以當(dāng)前視線角走廊飛行,最終再入時間將小于期望飛行時間,需要沿①方向擴(kuò)大走廊以延長再入時間;同理當(dāng)Δtco>0時,沿②方向縮小視線角走廊以縮短再入飛行時間。
(38)
(39)
(40)
(41)
(42)
針對設(shè)計的時間可控再入制導(dǎo)律和協(xié)同結(jié)構(gòu),首先進(jìn)行標(biāo)稱環(huán)境下多任務(wù)仿真,驗(yàn)證時間可控再入制導(dǎo)律的自主性與時間可控性;進(jìn)而進(jìn)行蒙特卡羅仿真,驗(yàn)證時間可控再入制導(dǎo)律在參數(shù)拉偏情況下的魯棒性;最后進(jìn)行協(xié)同再入仿真,驗(yàn)證整套協(xié)同結(jié)構(gòu)的有效性。
由于飛行器控制能力有限,需要對時間調(diào)節(jié)范圍進(jìn)行限制。本文可行時間調(diào)節(jié)范圍為初始預(yù)估飛行時間的0%~4%。不確定性參數(shù)采用正態(tài)分布,具體如表3所示;再入任務(wù)如表4所示。
表3 拉偏參數(shù)表Table 3 Parameter deviation
表4 再入任務(wù)Table 4 Cases of reentry mission
在標(biāo)稱環(huán)境下進(jìn)行多任務(wù)指定再入時間仿真,測試時間可控再入制導(dǎo)律的自主性,飛行軌跡如圖15所示。以Case 2為例,再入過程中的具體參數(shù)如圖16~圖18。飛行時間誤差、制導(dǎo)精度與制導(dǎo)周期平均耗時的對比如表5所示,其中以文獻(xiàn)[11]為代表的再入制導(dǎo)律記為“制導(dǎo)律1”(Law 1),本文的再入制導(dǎo)律記為“制導(dǎo)律2”(Law 2),二者均在相同軟硬件條件下仿真。由圖15(b)的軌跡可知,文獻(xiàn)[20]中的初始投放條件較為保守,對于飛行過程約束留有較大余量,為進(jìn)一步測試本文制導(dǎo)律的約束管理能力,加入表3的參數(shù)拉偏并將Case 2的初始投放條件改為150 km、6 500 m/s,約束校正效果如圖19所示,其中終端約束為16 km、850 m/s。
圖15 橫向和縱向軌跡Fig.15 Horizonfal and longitudinal trajectory
圖16 視線角與走廊變化曲線Fig.16 Changing curves of LOS and corridor
圖17 速度-傾側(cè)角剖面Fig.17 Velocity-bank angle profile
圖18 剩余飛行時間估計效果(Case 2)Fig.18 Test resuts of estimated of time-to-go (Case 2)
圖19 有無在線約束效果對比Fig.19 Comparison of results with and without online constraint management
表5 多任務(wù)仿真結(jié)果Table 5 Results of multitasking simulation
在初始下滑段,由于飛行器氣動能力弱,采取大攻角、固定傾側(cè)角、固定視線角走廊的方式進(jìn)行再入飛行,因而產(chǎn)生了圖 18中的預(yù)估時間誤差;在進(jìn)入平衡滑翔段之后,各校正模塊工作,預(yù)估時間誤差快速收斂并穩(wěn)定趨向于零。與此同時,由于真實(shí)走廊存在如圖 7所示的線性連接區(qū)域,而時間校正模塊直接輸出的是視線角走廊中間段的寬度x,因而會產(chǎn)生如圖 16所示的在初始下滑段和再入終段期望視線角走廊與實(shí)際不符的情況。圖 16中的再入橫側(cè)向走廊在再入時間預(yù)估-校正模塊的作用下呈現(xiàn)不規(guī)則的外形,其正是對時間誤差進(jìn)行主動調(diào)節(jié)的有效證明。圖 17表明傾側(cè)角翻轉(zhuǎn)次數(shù)在可接受的范圍之內(nèi)。表 5說明時間可控再入制導(dǎo)律在多任務(wù)下均有良好的時間控制能力與較高的制導(dǎo)精度,并且本文預(yù)測-校正方法的制導(dǎo)周期平均耗時相對于傳統(tǒng)方法縮短了80%以上;圖 18說明在線約束強(qiáng)化管理模塊的加入,有效地改善了飛行過程中約束違反現(xiàn)象的發(fā)生,并且對于終端狀態(tài)約束的滿足提供了更好保障。
本節(jié)以Case 2為對象,記無時間預(yù)估-校正模塊的制導(dǎo)律為“制導(dǎo)律 3”(Law 3),時間可控再入制導(dǎo)律為“制導(dǎo)律 4”(Law 4)。在可行時間范圍內(nèi)(1 355~1 408 s)隨機(jī)選擇4個期望時間進(jìn)行蒙特卡羅仿真,以驗(yàn)證時間可控再入制導(dǎo)律的魯棒性。拉偏參數(shù)見表3,兩種制導(dǎo)律在每個期望飛行時間下的仿真次數(shù)均為1 000次,最終飛行時間和距離誤差的對比如表6所示。以1 390 s為例,時間可控再入制導(dǎo)律軌跡與時間誤差如圖20~圖22所示。
圖20 橫向和縱向軌跡(Case 2)Fig.20 Horizontal and longitudinal trajectory (Case 2)
表6 蒙特卡羅仿真結(jié)果Table 6 Monte Carlo simulation results
圖22說明再入飛行時間誤差在±10 s以內(nèi),滿足協(xié)同任務(wù)需求[3-4];通過表6的對比可知,時間可控再入制導(dǎo)律可以有效地降低飛行時間誤差,并且不會影響制導(dǎo)精度。由仿真可知,時間可控再入制導(dǎo)律在參數(shù)不確定性下仍有良好的表現(xiàn),具有一定的魯棒性。其主要原因有:
1) 雖然時間預(yù)估網(wǎng)絡(luò)來源于離線訓(xùn)練,但其本身具有一定的泛化能力[22]和較高的精度。
2) 時間預(yù)估網(wǎng)絡(luò)的輸入來源于實(shí)際飛行狀態(tài),而參數(shù)不確定性所帶來的干擾直接影響當(dāng)前飛行狀態(tài),使其偏離期望值,進(jìn)而間接地影響預(yù)估時間結(jié)果,從而產(chǎn)生時間誤差。
3) 長距離的飛行過程、軌跡預(yù)測校正和時間校正模塊的在線迭代使得誤差能及時得到修正。
圖21 剩余飛行時間估計效果(Case 2)Fig.21 Estimated time-to-go (Case 2)
圖22 最終飛行時間誤差直方圖Fig.22 Histogram of final flight time error
針對多高超聲速飛行器協(xié)同再入任務(wù)需求,在協(xié)調(diào)時間存在的前提下,隨機(jī)選擇5個初始投放點(diǎn),進(jìn)行協(xié)同再入仿真以驗(yàn)證協(xié)同結(jié)構(gòu)的有效性。參數(shù)拉偏如表3所示,各飛行器之間相互獨(dú)立。最終期望協(xié)同再入時間為1 702.8 s。最終再入軌跡與協(xié)調(diào)時間變化曲線如圖23和圖24所示,協(xié)同再入結(jié)果如表7所示。
仿真結(jié)果表明在整個飛行過程中,期望協(xié)同飛行時間信息相對平滑,各飛行器的實(shí)際飛行時間均能趨向于期望值。其中在平衡滑翔段,由于參數(shù)不確定性等原因的干擾,使得部分飛行器預(yù)估時間出現(xiàn)較大誤差,但通過時間校正模塊和協(xié)同結(jié)構(gòu)的共同作用可以有效地將其進(jìn)行消除。整個飛行過程表明協(xié)同結(jié)構(gòu)可以有效的對可協(xié)同的多個飛行器進(jìn)行協(xié)調(diào)時間計算,而時間可控再入制導(dǎo)律可以有效地將時間協(xié)調(diào)信息作為約束之一進(jìn)行實(shí)時的在線軌跡預(yù)測與校正,實(shí)現(xiàn)多飛行器協(xié)同再入任務(wù)需求。
圖23 時間協(xié)同橫向和縱向軌跡Fig.23 Time-coordinated horizontal and longitudinal trajectory
圖24 剩余飛行時間估計效果(時間協(xié)同)Fig.24 Estimation of time-to-go (time-coordinated)
表7 協(xié)同再入結(jié)果Table 7 Results of collaborative reentry flight
1) 本文針對多高超聲速飛行器時間協(xié)同再入制導(dǎo)問題,提出協(xié)同再入制導(dǎo)架構(gòu)和時間可控再入制導(dǎo)律。
2) 時間可控再入制導(dǎo)律在跨周期軌跡預(yù)測-校正制導(dǎo)律的基礎(chǔ)上,通過對時間影響因素的仿真與分析,將橫向制導(dǎo)模塊中的視線角走廊寬度作為控制量,利用神經(jīng)網(wǎng)絡(luò)和Gauss-Newton迭代法實(shí)現(xiàn)再入飛行時間的預(yù)估與校正。
3) 時間可控再入制導(dǎo)律根據(jù)當(dāng)前實(shí)時的飛行狀態(tài)進(jìn)行時間預(yù)估,得到時間誤差并由此對視線角走廊進(jìn)行動態(tài)調(diào)整,仿真驗(yàn)證了其具有良好的自主性、魯棒性、實(shí)時性和時間可控性。
4) 協(xié)同再入制導(dǎo)架構(gòu)分為兩層,適用于集中式或分布式的通訊結(jié)構(gòu)。上層協(xié)調(diào)層的協(xié)同函數(shù)可以根據(jù)飛行任務(wù)需求進(jìn)行有針對性設(shè)計;下層執(zhí)行層由時間可控再入制導(dǎo)律進(jìn)行在線軌跡規(guī)劃。仿真驗(yàn)證了該結(jié)構(gòu)的有效性,能夠?qū)崿F(xiàn)多高超聲速飛行器的協(xié)同再入飛行任務(wù)需求。
參 考 文 獻(xiàn)
[1] 胡冬冬, 劉曉明, 張紹芳, 等. 2016年國外高超聲速飛行器技術(shù)發(fā)展綜述[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2017(1): 28-33.
HU D D, LIU X M, ZHANG S F, et al. Review of hypersonic technologies progress abroad in 2016[J]. Tactical Missile Technology, 2017(1): 28-33 (in Chinese).
[2] 高雁翎, 張夢湉, 賈晨陽. 2016年國外防空反導(dǎo)發(fā)展綜述[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2017(2): 16-20.
GAO Y L, ZHANG M T, JIA C Y. Development review of world air and missile defense system in 2016[J]. Tactical Missile Technology, 2017(2): 16-20 (in Chinese).
[3] 李聰穎, 韓蕾, 高曉冬, 等. 再入反艦導(dǎo)彈多彈協(xié)同飽和攻擊突防最優(yōu)彈道研究[J]. 指揮與控制學(xué)報, 2015, 1(1): 72-80.
LI C Y, HAN L, GAO X D, et al. Study on optimalpe-netration trajectories of multi reentry anti-ship missiles for cooperative saturation attack[J]. Journal of comma-nd and control, 2015, 1(1): 72-80 (in Chinese).
[4] 王少平, 董受全, 李曉陽, 等. 助推滑翔高超聲速反艦導(dǎo)彈多方向協(xié)同突防可行性研究[J]. 指揮控制與仿真, 2017, 39(2): 55-60.
WANG S P, DONG S Q, LI X Y, et al. Feasibility study of multi-direction coordinated penetration of the boost-glide hypersonic anti-ship missile[J]. Command Control and Simulation, 2017, 39(2): 55-60 (in Chinese).
[5] JEON I S, LEE J I, TAHK M J. Impact-time-control guidance law for anti-ship missiles[J]. IEEE Transactions on Control Systems Technology, 2006, 14(2): 260-266.
[6] 趙世鈺, 周銳. 基于協(xié)調(diào)變量的多導(dǎo)彈協(xié)同制導(dǎo)[J]. 航空學(xué)報, 2008, 29(6):1605-1611.
ZHAO S Y, ZHOU R. Multi-missile cooperativeguid-ance using coordination variables[J]. Acta Aeronautica et Astronautica Sinica, 2008, 29(6): 1605-1611 (in Chinese).
[7] ZHAO S Y, ZHOU R. Cooperativeguidance for multi-missile salvo attack[J]. Chinese Journal of Aeronautics, 2008, 21(6): 533-539.
[8] MCLAIN T W, BEARD R W. Coordinationvariables, coordination functions, and cooperative timing mission[J]. Journal of Guidance Control & Dynamics, 2005, 28(1): 150-161.
[9] 張友安, 馬國欣, 王興平. 多導(dǎo)彈時間協(xié)同制導(dǎo): 一種領(lǐng)彈-被領(lǐng)彈策略[J]. 航空學(xué)報, 2009, 30(6): 1109-1118.
ZHANG Y A, MA G X, WANG X P. Time-cooperative guidance for multi-missiles: A Leader-Follower strategy[J]. Acta Aeronautica et Astronautica Sinica, 2009, 30(6): 1109-1118 (in Chinese).
[10] 趙啟倫, 陳建, 李清東, 等. 高超武器與常規(guī)導(dǎo)彈協(xié)同攻擊策略可行域研究[J]. 航空學(xué)報, 2015, 36(7): 2291-2300.
ZHAO Q L, CHEN J, LI Q D, et al. Feasible region of hypersonic and ballistic missiles’ cooperative attack strategy[J]. Acta Aeronautica et Astronautica Sinica, 2015, 36(7): 2291-2300 (in Chinese).
[11] LU P. Entry guidance: A unifiedmethod[J]. Journal of Guidance Control & Dynamics, 2014, 37(3): 713-728.
[12] 劉思源, 梁子璇, 任章, 等. 高超聲速滑翔飛行器再入段制導(dǎo)方法綜述[J]. 中國空間科學(xué)技術(shù), 2016, 36(6): 1-13.
LIU S Y, LIANG Z X, REN Z, et al. Review of reentry guidance methods for hypersonic gliding vehicles[J]. Chinese Space Science and Technology, 2016, 36(6): 1-13 (in Chinese).
[13] WANG Z, GRANT M J. Constrained trajectory optimiza-tion for planetary entry via Sequential convex program-ming[C]∥AIAA Atmospheric Flight Mechanics Conference. Reston, VA: AIAA, 2017: 1-13.
[14] CHENG L, WANG Z, CHENG Y, et al.Multiconstrain-ed predictor-corrector reentry guidance for hypersonic vehicles[J]. Proceedings of the Institution of Mechanical Engineers Part G Journal of Aerospace Engineering, 2017: 095441001772418.
[15] KURIKI Y, NAMERIKAWA T. Consensus-based coop-erative formation control with collision avoidance for a multi-UAV system[C]∥American Control Conference. Piscataway, NJ: IEEE Press, 2014: 2077-2082.
[16] BRARD R W, MCLAIN T W, GOODRICH M A, et al. Coordinated target assignment and intercept for unmanned air vehicles[J]. IEEE Transactions on Robotics & Automation, 2002, 18(6): 911-922.
[17] TOMIC S, BEKO M, RUI D. RSS-Based localization in wireless sensor networks using convex relaxation: noncooperative and cooperative schemes[J]. IEEE Transactions on Vehicular Technology, 2015, 64(5): 2037-2050.
[18] SHI P, SHEN Q. Cooperative control of multi-agent systems with unknown state-dependent controlling effects[J]. IEEE Transactions on Automation Science & Engineering, 2015, 12(3): 827-834.
[19] 林濤, 劉永才, 關(guān)成啟, 等. 飛航導(dǎo)彈協(xié)同作戰(zhàn)使用方法探討[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2005(2): 8-12.
LIN T, LIU Y C, GUAN C Q, et al. An investigation into the methods of cooperative engagenment for aerodynamic missile[J]. Tactical Missile Technology, 2005(2): 8-12 (in Chinese).
[20] 王光倫. 高超聲速飛行器再入段預(yù)測校正制導(dǎo)研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2010: 18-19.
WANG G L. Predictor-corrector reentry guidance for hypersonic vehicles[D].Harbin: Harbin Institute of Technology, 2010: 18-19 (in Chinese).
[21] PHILLIPS T H. A common aero vehicle (CAV) model, description, and employment guide[R]. Albuqerque, New Mexico: Schafer Corp-oration for AFRL and AFSPC, 2003.
[22] SUTTON R, BARTO A. Reinforcement Learning: An Introduction[M]. Massachusetts: MIT Press, 2005: 235-304.
[23] DU X, GAO M F.The application of identifying numbers on artificial neural network[J]. Computer Systems Applications, 2007(2): 21-22.