丁一波,毛 偉,王小剛, 崔乃剛
(1. 哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱 150001;2. 試驗(yàn)物理與計(jì)算數(shù)學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100076)
為了應(yīng)對(duì)日趨完善的導(dǎo)彈防御系統(tǒng),進(jìn)攻彈頭在發(fā)射的同時(shí)會(huì)伴隨一枚防衛(wèi)彈頭,對(duì)來(lái)襲攔截彈進(jìn)行主動(dòng)攔截,掩護(hù)彈頭突防。這對(duì)導(dǎo)彈攔截提出了巨大挑戰(zhàn)。因此,近年來(lái),設(shè)計(jì)三體飛行器的追蹤-逃逸場(chǎng)景備受關(guān)注,為了應(yīng)對(duì)這種場(chǎng)景,為攔截彈設(shè)計(jì)一種可行的新型制導(dǎo)律迫在眉睫。三體攻防博弈場(chǎng)景主要涉及3個(gè)對(duì)象飛行器:進(jìn)攻彈、防衛(wèi)彈和攔截彈,如圖1所示。
圖1 三體攻防博弈作戰(zhàn)場(chǎng)景示意圖Fig.1 Engagement scenario of conflict for three players
李博文[1]以一對(duì)一攔截制導(dǎo)問(wèn)題為背景,將博弈末制導(dǎo)問(wèn)題轉(zhuǎn)化為博弈論中的二人競(jìng)爭(zhēng)博弈模型。Horie等[2]利用數(shù)值方法和帶有非線性規(guī)劃的半主動(dòng)分配方法求解一對(duì)一追逃博弈問(wèn)題。孫傳鵬[3]利用模型預(yù)測(cè)控制的思想,求解一對(duì)一攔截問(wèn)題動(dòng)態(tài)博弈模型的均衡解。Talebi等[4]研究了多枚攔截彈與一枚進(jìn)攻彈博弈對(duì)抗的作戰(zhàn)場(chǎng)景,并分析了3種不同的攔截博弈策略:第1種考慮多枚攔截彈協(xié)同編隊(duì)實(shí)施攔截;第2種考慮多枚攔截彈不合作單獨(dú)攔截;第3種考慮多枚攔截彈各自獨(dú)立作戰(zhàn),并且互相競(jìng)爭(zhēng)攔截。韓冰[5]、Sun等[6]考慮多彈協(xié)同問(wèn)題,進(jìn)攻彈與防衛(wèi)彈相互協(xié)作與攔截彈實(shí)施博弈,輔助進(jìn)攻彈突防,提升進(jìn)攻彈生存能力。Qi等[7]通過(guò)全面分析三體攻防博弈中的多種作戰(zhàn)情況與作戰(zhàn)策略,劃分?jǐn)r截彈可攔截區(qū)域,并以此為依據(jù),為進(jìn)攻彈設(shè)計(jì)有效的突防制導(dǎo)律。Liu等[8]針對(duì)攔截彈提出一種基于模糊評(píng)估與納什均衡的分布式在線任務(wù)規(guī)劃算法。Sun等[9]考慮了四體問(wèn)題,即一枚進(jìn)攻彈、一枚攔截彈與兩枚防衛(wèi)彈的攻防作戰(zhàn)博弈問(wèn)題。通過(guò)設(shè)計(jì)兩枚防衛(wèi)彈相互協(xié)作,高效輔助進(jìn)攻彈實(shí)施突防。
本文以三體攻防博弈對(duì)抗為研究對(duì)象,針對(duì)不同的攻防對(duì)抗初始作戰(zhàn)條件進(jìn)行分析,并為攔截彈提出新型制導(dǎo)律,實(shí)現(xiàn)對(duì)防衛(wèi)彈的躲避以及對(duì)進(jìn)攻彈的成功攔截。
三體攻防博弈任務(wù)圖如圖2所示。在三體攻防博弈下,進(jìn)攻彈(T)的作戰(zhàn)任務(wù)是規(guī)避攔截彈;防衛(wèi)彈(D)的任務(wù)是追擊攔截彈,掩護(hù)進(jìn)攻彈突防;攔截彈(A)的任務(wù)是躲避防衛(wèi)彈,追蹤進(jìn)攻彈,成功實(shí)施攔截。作戰(zhàn)平面如圖3所示。
圖2 三體攻防博弈任務(wù)圖Fig.2 Task of conflict for three players
圖3 作戰(zhàn)平面Fig.3 Engagement plane
其中,VA、VD和VT分別為攔截彈、防衛(wèi)彈和進(jìn)攻彈的速度。γA、γD和γT分別為攔截彈、防衛(wèi)彈和進(jìn)攻彈的飛行路徑角。λAT為AT之間視線角,λAD為AD之間視線角。RAT為AT之間相對(duì)距離,RAD為AD之間相對(duì)距離。aA、aT和aD分別為攔截彈、進(jìn)攻彈和防衛(wèi)彈的機(jī)動(dòng)加速度。
動(dòng)力學(xué)方程如下:
(1)
(2)
(3)
(4)
將碰撞三角形附近的飛行運(yùn)動(dòng)在LOS0周?chē)€性化,下標(biāo)0表示初始狀態(tài)。A與T之間垂直于LOSAT0的位移表示為yAT,A與D之間垂直于LOSAD0的位移表示為yAD。
定義A垂直于視線AT的加速度為uA,T垂直于視線AT的加速度為uT,D垂直于視線AD的加速度為uD。其滿足如下條件
(5)
選擇如下?tīng)顟B(tài)變量
(6)
狀態(tài)方程給出如下[10]:
(7)
狀態(tài)方程整合如下:
(8)
其中,
(9)
式中,下標(biāo)0表示作戰(zhàn)初始狀態(tài)。由于防衛(wèi)彈的作戰(zhàn)任務(wù)是掩護(hù)進(jìn)攻彈,所以要求AD之間作戰(zhàn)時(shí)間必須小于AT作戰(zhàn)時(shí)間。即
(10)
定義零控脫靶量為導(dǎo)彈與目標(biāo)在無(wú)控狀態(tài)下,在預(yù)測(cè)命中時(shí)刻相對(duì)于當(dāng)前視線方向的側(cè)向位移,符號(hào)ZAT(t)與ZAD(t)分別表示AT、AD之間的零控脫靶量。
(11)
其滿足如下動(dòng)力學(xué)方程:
(12)
式中ZAT與yAT的正負(fù)符號(hào)定義如圖4所示。
圖4 ZAT與yAT 的正負(fù)符號(hào)定義Fig.4 Definitions of signs for ZAT and yAT
選定如下性能指標(biāo):
(13)
求解最優(yōu)問(wèn)題可以得到攔截彈與防衛(wèi)彈之間作戰(zhàn)的最優(yōu)制導(dǎo)律如下[11]:
(14)
攔截彈與進(jìn)攻彈之間作戰(zhàn)的最優(yōu)制導(dǎo)律如下:
(15)
(16)
ZAD(t)=ZAD(t=0)+
(17)
(18)
假定在AD作戰(zhàn)中,A與D均應(yīng)用式(14)的最優(yōu)機(jī)動(dòng)策略,則若ZAD位于兩條邊界圍成的區(qū)域內(nèi),攔截彈將會(huì)被防衛(wèi)彈攔截;若ZAD位于兩條邊界圍成的區(qū)域外,攔截彈可以成功躲避防衛(wèi)彈。
(19)
ZAT(t)=ZAT(t=0)+
(20)
(21)
假定在AT作戰(zhàn)中,A與T均應(yīng)用式(15)的最優(yōu)機(jī)動(dòng)策略,則若ZAT位于兩條邊界圍成的區(qū)域內(nèi),攔截彈可以成功攔截進(jìn)攻彈;若ZAT位于兩條邊界圍成的區(qū)域外,攔截彈無(wú)法攔截進(jìn)攻彈。
求解可得對(duì)于攔截彈,實(shí)現(xiàn)成功攔截的初始最大允許脫靶量如下:
(22)
下面將三體攻防對(duì)抗作戰(zhàn)場(chǎng)景劃分為2種情況:ZAT(t=0)與ZAD(t=0)的符號(hào)相反,ZAT(t=0)與ZAD(t=0)的符號(hào)相同。其中第2種情況分為3種條件:1)ZAD(t=0)屬于較大正數(shù);2)ZAD(t=0)屬于較小正數(shù); 3)ZAD(t=0)不滿足條件1)與條件2)。(本文僅討論ZAD(t=0)為正數(shù)的情況,對(duì)于ZAD(t=0)為負(fù)數(shù)的情況,結(jié)論與正數(shù)情況下相對(duì)稱,因此不再贅述。)
第1種情況下,ZAT(t=0)與ZAD(t=0)的符號(hào)相反,分析制導(dǎo)律式(14)與式(15),此種情況下,攔截彈實(shí)現(xiàn)最優(yōu)躲避與最優(yōu)追蹤的控制方向相同。因此,攔截彈可以在對(duì)進(jìn)攻彈執(zhí)行最優(yōu)追蹤的同時(shí),實(shí)現(xiàn)對(duì)于防衛(wèi)彈的最優(yōu)躲避。圖5給出情況1下的零控脫靶量初始條件。
圖 5 情況1下零控脫靶量初始條件Fig.5 Initial condition of ZEM(Zero-effort-miss) for case 1
第2種情況下,ZAT(t=0)與ZAD(t=0)的符號(hào)相同,分析制導(dǎo)律式(14)與式(15),此種情況下,攔截彈實(shí)現(xiàn)最優(yōu)躲避與最優(yōu)追蹤的控制方向相反。因此,攔截彈相對(duì)于進(jìn)攻彈執(zhí)行最優(yōu)追蹤的同時(shí),相對(duì)于防衛(wèi)彈執(zhí)行的則是最壞躲避。圖6給出情況2下的零控脫靶量初始條件。
圖6 情況2下零控脫靶量初始條件Fig.6 Initial condition of ZEM for case 2
本小節(jié)對(duì)這種情況下AD作戰(zhàn)結(jié)果進(jìn)行研究,分析攔截彈成功躲避防衛(wèi)彈的所需條件。下面將所需條件分3類進(jìn)行討論。
(1)條件1
在第1種條件下,ZAD(t=0)屬于較大正數(shù)。圖7給出第1種條件下的零控脫靶量初始條件。
圖7 條件1下零控脫靶量初始條件Fig.7 Initial condition of ZEM for condition 1
(23)
求解可得:
ZAD(t=0)≥dD+
(24)
結(jié)合式(22)與式(24)可以得到保證攔截彈贏得三體攻防博弈的ZAD(t=0)與ZAT(t=0)初始條件:
(25)
(2)條件2
在第2種條件下,ZAD(t=0)屬于較小正數(shù)。圖8給出第2種條件下的零控脫靶量初始條件。
圖8 條件2下零控脫靶量初始條件Fig.8 Initial condition of ZEM for condition 2
同樣類比條件1,可得到如下方程:
(26)
(27)
結(jié)合式(22)與式(27)可以得到保證攔截彈完成三體攻防博弈的ZAD(t=0)與ZAT(t=0)的初始條件:
(28)
(3)條件3
(29)
(30)
在這種條件下,若ZAT(t=0)滿足式(30),則應(yīng)用本文提出的新型制導(dǎo)律可以保證攔截彈在成功躲避防衛(wèi)彈的同時(shí)命中進(jìn)攻彈,贏得三體攻防博弈對(duì)抗。
結(jié)合式(15)與式(29)可得最終的攔截彈制導(dǎo)律:
(31)
其中:
(32)
(33)
本小節(jié)中,應(yīng)用實(shí)際攻防對(duì)抗場(chǎng)景驗(yàn)證所提出的制導(dǎo)律的有效性,其中大氣層外攔截器(A)攔截進(jìn)攻彈頭(T),小型智能攔截器(D)作為防衛(wèi)彈攻擊大氣層外攔截器,保護(hù)進(jìn)攻彈頭。防衛(wèi)彈與攔截器的殺傷半徑dD與dA分別設(shè)定為2m與1m。
仿真作戰(zhàn)場(chǎng)景如圖9所示,表1~表2分別給出大氣層外攔截器的性能參數(shù)與仿真初始參數(shù)。
圖9 仿真作戰(zhàn)場(chǎng)景Fig.9 Simulation scenario
參數(shù)名稱參數(shù)數(shù)值初始質(zhì)量/kg35燃料質(zhì)量/kg10軌控發(fā)動(dòng)機(jī)推力/N3400
表2 初始參數(shù)
表3給出情況1下的初始仿真參數(shù)。
表3 情況1初始參數(shù)
初始脫靶量值ZAT(t=0)和ZAD(t=0)分別為-1526m和364.6m,符號(hào)相反。攔截彈僅相對(duì)于進(jìn)攻彈采用最優(yōu)追蹤制導(dǎo)律即可命中進(jìn)攻彈同時(shí)躲避防衛(wèi)彈。
圖10給出的是3個(gè)飛行器的攻防博弈飛行軌跡。其中AT作戰(zhàn)脫靶量為0.044226m,AD作戰(zhàn)脫靶量為1093.4345m。仿真表明,攔截彈可以成功躲避防衛(wèi)彈并成功攔截進(jìn)攻彈,贏得三體攻防博弈。
圖10 情況1的飛行軌跡Fig.10 Fight path of case 1
ZAT(t=0)和ZAD(t=0)符號(hào)相同。
(1)條件1
表4給出情況2條件1下的初始仿真參數(shù)。
表4 例1初始參數(shù)
對(duì)應(yīng)條件1,ZAD(t=0)屬于較大正數(shù)。初始脫靶量值ZAT(t=0)和ZAD(t=0)分別為-1526m和-1725m,符號(hào)相同。
圖11顯示AT作戰(zhàn)脫靶量為0.044226m,AD作戰(zhàn)脫靶量為498.2268m。因此,攔截彈可以成功躲避防衛(wèi)彈并成功攔截進(jìn)攻彈,贏得三體攻防博弈。
圖11 條件1的飛行軌跡Fig.11 Fight path of condition 1
(2)條件2
表5給出情況2條件2下的初始仿真參數(shù)。
表5 例2初始參數(shù)
對(duì)應(yīng)條件2,ZAD(t=0)屬于較小正數(shù)。初始脫靶量值ZAT(t=0)和ZAD(t=0)分別為-1526m和-157.6m,符號(hào)相同。
圖12顯示AT作戰(zhàn)脫靶量為0.044226m,AD作戰(zhàn)脫靶量為624.0914m。因此,攔截彈可以成功躲避防衛(wèi)彈并成功攔截進(jìn)攻彈,贏得三體攻防博弈。
圖12 例2的飛行軌跡Fig.12 Fight path of condition 2
(3)條件3
表6給出了情況2條件3下的初始仿真參數(shù)。
表6 例3初始參數(shù)
對(duì)應(yīng)條件3,ZAD(t=0)不滿足條件1與條件2。在這一條件下,執(zhí)行2組仿真。第1組仿真中,攔截彈僅應(yīng)用一對(duì)一最優(yōu)制導(dǎo)律追蹤進(jìn)攻彈。第2組仿真中攔截彈使用本文提出的新型制導(dǎo)律。
圖13給出的是第1組仿真結(jié)果。該組仿真情況下,AT作戰(zhàn)脫靶量為0.016644m,但AD作戰(zhàn)脫靶量為0.31179m。表明盡管攔截彈可以依據(jù)最優(yōu)制導(dǎo)律成功攔截進(jìn)攻彈,但是卻無(wú)法成功躲避防衛(wèi)彈,攔截彈博弈失敗。
圖13 例3第1組仿真的飛行軌跡Fig.13 Fight path for the first simulation of example 3
圖14給出的是應(yīng)用本文制導(dǎo)律的第2組仿真結(jié)果。該組仿真情況下,AT作戰(zhàn)脫靶量為0.22464m,AD作戰(zhàn)脫靶量為327.0642m。表明應(yīng)用本文制導(dǎo)律,攔截彈可以成功躲避防衛(wèi)彈,然后精確命中進(jìn)攻彈,完成預(yù)定任務(wù)。
圖14 例3第2組仿真的飛行軌跡Fig.14 Fight path for the second simulation of example 3
本文針對(duì)三體攻防博弈問(wèn)題,基于微分對(duì)策理論,研究分析了攔截彈贏得博弈的不同情況,并為攔截彈提出一種新型制導(dǎo)律。在ZAT(t=0)和ZAD(t=0)符號(hào)相反時(shí),攔截彈僅使用最優(yōu)一對(duì)一制導(dǎo)律追蹤進(jìn)攻彈,即可同時(shí)躲避防衛(wèi)彈并命中進(jìn)攻彈。在ZAT(t=0)和ZAD(t=0)符號(hào)相同時(shí),分3種條件討論。前2種條件下,攔截彈同樣僅應(yīng)用最優(yōu)一對(duì)一制導(dǎo)律追蹤進(jìn)攻彈即可贏得三體博弈。對(duì)于第3種條件,本文提出一種新型制導(dǎo)律,使得攔截彈可在AD作戰(zhàn)時(shí)間內(nèi)有效躲避防衛(wèi)彈,并保證與進(jìn)攻彈之間零控脫靶量最小,在AD作戰(zhàn)結(jié)束后,攔截彈對(duì)進(jìn)攻彈實(shí)施最優(yōu)追蹤,贏得三方博弈。