于江龍 董希旺,2 李清東 呂金虎,2 任章,2
未來(lái)戰(zhàn)爭(zhēng)將會(huì)呈現(xiàn)高動(dòng)態(tài)、強(qiáng)博弈的特點(diǎn),智能化體系作戰(zhàn)博弈對(duì)抗將會(huì)成為未來(lái)作戰(zhàn)的趨勢(shì),單彈攔截智能化惡意機(jī)動(dòng)目標(biāo)難度將會(huì)大大提升,多彈協(xié)同攔截是應(yīng)對(duì)惡意機(jī)動(dòng)目標(biāo)的重要作戰(zhàn)方式,多彈進(jìn)行設(shè)備與功能的差異配置,憑借數(shù)量和策略優(yōu)勢(shì),采取合適的協(xié)同博弈攔截策略,能夠?qū)崿F(xiàn)對(duì)惡意機(jī)動(dòng)目標(biāo)的有效攔截[1?5].
然而經(jīng)典的多導(dǎo)彈協(xié)同制導(dǎo)策略大多關(guān)注攻擊時(shí)間的同時(shí)性[6]、攻擊角度的一致性[7],或者二者兼?zhèn)鋄8],適合攔截靜止的或者低速小機(jī)動(dòng)的目標(biāo).因此需要研究適合攔截機(jī)動(dòng)目標(biāo)的新型協(xié)同導(dǎo)引律.
在博弈對(duì)抗場(chǎng)景下,基于微分博弈理論的導(dǎo)引律并不需要目標(biāo)的機(jī)動(dòng)信息,能夠充分發(fā)揮攔截導(dǎo)彈的機(jī)動(dòng)性能與機(jī)動(dòng)策略.文獻(xiàn)[9?10]針對(duì)單枚導(dǎo)彈攔截單目標(biāo)的微分對(duì)策制導(dǎo)問(wèn)題開(kāi)展了研究,文獻(xiàn)[11?15]運(yùn)用動(dòng)態(tài)博弈理論設(shè)計(jì)了最優(yōu)協(xié)同策略導(dǎo)引律.近年來(lái),學(xué)者對(duì)三體(攔截導(dǎo)彈、目標(biāo)和防御導(dǎo)彈)協(xié)同制導(dǎo)問(wèn)題進(jìn)行了廣泛的研究[16?18],其原理就是協(xié)同微分對(duì)策制導(dǎo)的應(yīng)用.
本文將重點(diǎn)研究基于微分對(duì)策的協(xié)同制導(dǎo)問(wèn)題,構(gòu)建新型的協(xié)同微分對(duì)策導(dǎo)引律,實(shí)現(xiàn)多導(dǎo)彈對(duì)惡意機(jī)動(dòng)目標(biāo)的有效攔截,以期為未來(lái)信息時(shí)代的防空反導(dǎo)體系建設(shè)及智能作戰(zhàn)指揮與控制系統(tǒng)的發(fā)展提供可能的技術(shù)支撐.
考慮以下一般的非線性動(dòng)態(tài)博弈系統(tǒng)[9];
其中,x∈Rn為上述系統(tǒng)的狀態(tài)變量,(u,v)為博弈雙方的控制量,t表示時(shí)間,t0>0和tf>0為博弈的初始時(shí)刻和終止時(shí)刻.
博弈問(wèn)題的終端任務(wù)狀態(tài)集為:
選取代價(jià)函數(shù)為
其中,h(t,x(t),u(t),v(t))為任意的給定實(shí)值函數(shù),且有
μ的維數(shù)與φ(t,x(t))是匹配的,g(t,x(t))是附加終端狀態(tài)集合.
引理1[19],設(shè)U和V是兩個(gè)閉區(qū)域且邊界光滑,函數(shù)f(t,x,u,v)和h(t,x(t),u(t),v(t))連續(xù)可微且在[t0,tf]×Rn×U×V的有界子集中關(guān)于(t,x)是一致李雅普諾夫連續(xù);函數(shù)g(t,x(t))和φ(t,x(t))在[t0,tf]×Rn的有界子集中一致李雅普洛夫連續(xù)且連續(xù)可微.如果(u?(t),v?(t))是微分對(duì)策問(wèn)題的鞍點(diǎn),則(u?(t),v?(t),x?(t))滿足以下方程:
其中,x?(t)是相對(duì)于鞍點(diǎn)(u?(t),v?(t))的最優(yōu)軌跡,?t是從初始狀態(tài)沿著最優(yōu)軌跡到達(dá)目標(biāo)集邊界所用的時(shí)間.
在多導(dǎo)彈的協(xié)同制導(dǎo)問(wèn)題中,每枚導(dǎo)彈除了對(duì)目標(biāo)進(jìn)行制導(dǎo),還受到其他鄰居導(dǎo)彈的影響,而形成協(xié)同制導(dǎo),本文利用代數(shù)圖來(lái)描述描述導(dǎo)彈之間的相互影響.
定義集合V={1,2,···,M} 用來(lái)表示多導(dǎo)彈集,ε ?V×V用來(lái)表示導(dǎo)彈之間對(duì)應(yīng)的邊集,用圖G=G(V,ε)來(lái)描述多導(dǎo)彈之間的拓?fù)潢P(guān)系,邊集中的邊(i,j)用來(lái)表示信息從導(dǎo)彈i流向j,如果滿足(i,j)∈ε ?(j,i)∈ε,則(i,j)為雙向邊,如果圖G中每一個(gè)邊都是雙向邊,則稱該圖為無(wú)向圖;反之,如果圖G中存在一個(gè)邊是單向的,則稱之為有向圖.
如果(j,i)∈ε,則j是i的一個(gè)鄰居導(dǎo)彈,定義一個(gè)圖的鄰接矩陣A=[μij] ∈RM×M,如果(j,i)∈ε,則μij>0,反之,則有μij=0,定義圖G的入度矩陣D=[dij]∈RM×M,如果i≠j,則dij=0,如果i=j,則有dij=
對(duì)于無(wú)向圖G,如果任意兩枚導(dǎo)彈之間都存在一條路徑,則稱該圖是連通的;對(duì)于有向圖G,若對(duì)于任意兩枚導(dǎo)彈之間都存在一條路徑,則該圖是強(qiáng)連通的,在圖G中,存在一枚導(dǎo)彈,到其他任意一枚導(dǎo)彈都存在路徑,則圖G含有一棵有向生成樹(shù).
多導(dǎo)彈憑借數(shù)量和策略優(yōu)勢(shì),能夠降低目標(biāo)逃逸區(qū)域、增大有效殺傷區(qū),進(jìn)而實(shí)現(xiàn)對(duì)惡意機(jī)動(dòng)目標(biāo)的有效攔截,本文考慮N(N≥2)枚導(dǎo)彈對(duì)1枚目標(biāo)的協(xié)同制導(dǎo)問(wèn)題,如圖1所示.
圖1 多導(dǎo)彈協(xié)同制導(dǎo)示意Fig.1 Schematic of multiple missile cooperative guidance
在本文中,將三維協(xié)同制導(dǎo)問(wèn)題分解為縱向制導(dǎo)與橫向制導(dǎo)的兩個(gè)二維制導(dǎo)問(wèn)題.
在二維平面內(nèi)的慣性坐標(biāo)系下,導(dǎo)彈i和目標(biāo)T運(yùn)動(dòng)學(xué)模型可以表示為:
其中,i∈{1,2,···,N},導(dǎo)彈i和目標(biāo)T的坐標(biāo)分別為(xi(t),yi(t))和(xT(t),yT(t)),VM,i(t)為飛行器i速度大小,VT(t)為目標(biāo)速度大小,γM,i(t)、γT(t)分別為速度角(速度傾角或者速度偏角,本文簡(jiǎn)稱速度角).
根據(jù)上述模型,本文研究的是運(yùn)動(dòng)學(xué)層面的制導(dǎo)問(wèn)題,也就是通過(guò)速度角的控制實(shí)現(xiàn)位置回路的制導(dǎo),此外,本文研究多枚同樣配置(同構(gòu))導(dǎo)彈的協(xié)同制導(dǎo)問(wèn)題,暫不考慮多導(dǎo)彈之間的性能匹配問(wèn)題.
在二維平面內(nèi)視線坐標(biāo)系下,可以將式(1)轉(zhuǎn)化得到彈目相對(duì)運(yùn)動(dòng)學(xué)模型:
其中,λi(t)表示二維平面內(nèi)的視線角,θM,i(t)、θT,i(t)分別表示導(dǎo)彈i和目標(biāo)的前置角,在本文中,假設(shè)導(dǎo)彈和目標(biāo)的速度均為常值.
在經(jīng)典的微分對(duì)策制導(dǎo)問(wèn)題中,微分對(duì)策制導(dǎo)問(wèn)題一般描述為單枚導(dǎo)彈經(jīng)過(guò)最優(yōu)機(jī)動(dòng)實(shí)現(xiàn)對(duì)目標(biāo)的攔截,而在現(xiàn)有的協(xié)同微分對(duì)策制導(dǎo)問(wèn)題中,大多考慮三體協(xié)同微分對(duì)策制導(dǎo)問(wèn)題[16?18];或者僅考慮了多彈在過(guò)載約束下的攔截問(wèn)題,而沒(méi)有考慮多彈之間的信息交互問(wèn)題[11?15].
本文考慮了多導(dǎo)彈之間的信息交互問(wèn)題,多導(dǎo)彈之間的通信拓?fù)錆M足下列假設(shè).
假設(shè)1[20],多導(dǎo)彈之間的通信拓?fù)鋱D用G描述,G為一個(gè)連通的有向圖,且每枚導(dǎo)彈均能夠獲得對(duì)于目標(biāo)的制導(dǎo)信息.
多導(dǎo)彈協(xié)同微分對(duì)策制導(dǎo)問(wèn)題的核心一般包括兩個(gè)方面,一是協(xié)同制導(dǎo)的模型,二是代價(jià)函數(shù)的選擇.上節(jié)已給出運(yùn)動(dòng)學(xué)層面的制導(dǎo)問(wèn)題.本節(jié)核心在于給出協(xié)同微分對(duì)策制導(dǎo)問(wèn)題的代價(jià)函數(shù),包括以下方面.
考慮初始制導(dǎo)時(shí)刻為0,首先定義各枚導(dǎo)彈對(duì)目標(biāo)的攔截時(shí)刻分別為tF,i,i∈{1,2,···,N}.
1)協(xié)同的代價(jià)建模
多枚攔截導(dǎo)彈在各自的攔截時(shí)刻,如果他們之間的相對(duì)距離越小,則說(shuō)明多枚導(dǎo)彈實(shí)現(xiàn)了準(zhǔn)同時(shí)攔截,在一定程度上表征了多攔截導(dǎo)彈之間的攔截時(shí)間一致性,因此,定義一個(gè)代價(jià)函數(shù)為:
2)攔截的代價(jià)建模
本文考慮的協(xié)同制導(dǎo)問(wèn)題在于實(shí)現(xiàn)多枚導(dǎo)彈對(duì)目標(biāo)的攔截,如果攔截時(shí)刻導(dǎo)彈i和目標(biāo)T之間的相對(duì)距離(可近似為脫靶量)越小,則代表了導(dǎo)彈i對(duì)目標(biāo)T的攔截效果越好.因此,定義一個(gè)代價(jià)函數(shù)為:
其中,μi表示導(dǎo)彈i和目標(biāo)T的通信權(quán)重.
3)能量的代價(jià)建模
攔截過(guò)程中,期望導(dǎo)彈機(jī)動(dòng)的范圍越小越好,這樣能夠節(jié)省攔截過(guò)程中的能量,因此定義一個(gè)代價(jià)函數(shù)為:
其中,βi>0,γM,i,0為常數(shù),表示初始時(shí)刻的最佳速度角(其值可參考文獻(xiàn)[9]),對(duì)于攔截導(dǎo)彈來(lái)說(shuō),越小,則代表攔截軌跡約平緩.為了將微分對(duì)策中的目標(biāo)最優(yōu)逃逸問(wèn)題引入,在這里將修正為J3,即:
其中,ψT>0,γT,0也為一個(gè)常數(shù),表示目標(biāo)T初始時(shí)刻的最佳速度角(其值可參考文獻(xiàn)[9]).
因此,多導(dǎo)彈和目標(biāo)組成了一個(gè)最優(yōu)攔截追逃的協(xié)同微分對(duì)策制導(dǎo)問(wèn)題,控制輸入為(γM,i(t),γT(t)),代價(jià)函數(shù)定義為:
可以看出,代價(jià)函數(shù)(6)是由子代價(jià)函數(shù)(1)、(3)、(5)組成的,因此代價(jià)函數(shù)(6)表征了多彈協(xié)同制導(dǎo)過(guò)程中需要同時(shí)滿足協(xié)同約束、攔截約束和能量約束,此外,3個(gè)子代價(jià)函數(shù)的加權(quán)系數(shù)可以通過(guò)參數(shù)μik、μi、βi、ψT來(lái)進(jìn)行調(diào)節(jié).
在本節(jié)中,將給出協(xié)同微分對(duì)策導(dǎo)引律的設(shè)計(jì)過(guò)程.
針對(duì)攔截導(dǎo)彈來(lái)說(shuō),期望J最小化;針對(duì)目標(biāo)來(lái)說(shuō),期望J最小化,因此定義哈密頓函數(shù)為:
其中,λi1(t)、λi2(t),i∈{1,2,···,N},λT1、λT2為伴隨狀態(tài),.
對(duì)于攔截導(dǎo)彈i來(lái)說(shuō),由
可得攔截導(dǎo)彈i的協(xié)同微分對(duì)策導(dǎo)引律:
根據(jù)引理1,伴隨狀態(tài)動(dòng)態(tài)特性及其終端值為:
因此,有:
可以看出,協(xié)同微分對(duì)策導(dǎo)引律(9)是一個(gè)超越方程,如果βj≡0,則式(9)有解析解;而如果βj是一個(gè)小量的話,可以用牛頓迭代法進(jìn)行精確的數(shù)值求解,如果βj取小量,則式(9)的近似可行解為:
此外,對(duì)哈密頓函數(shù)H求二次微分,有
因此,微分對(duì)策導(dǎo)引律(9)在一定范圍內(nèi)是最優(yōu)制導(dǎo)問(wèn)題的解.
用同樣方法,可得到目標(biāo)最優(yōu)逃逸導(dǎo)引律:
其中
tF,T為目標(biāo)逃逸成功的時(shí)刻.
值得注意的是,導(dǎo)引律(9)和式(15)中并不顯含時(shí)間t,而是含有攔截時(shí)刻tF,i,一般來(lái)說(shuō),tF,i的獲取相對(duì)復(fù)雜,可采用初始相對(duì)距離除以相對(duì)速度得到,也可通過(guò)分段求解進(jìn)行計(jì)算tF,i.
此外,如果目標(biāo)T有多個(gè),則本文的問(wèn)題轉(zhuǎn)化為多對(duì)多協(xié)同博弈對(duì)抗的問(wèn)題.從目標(biāo)角度來(lái)看,協(xié)同攔截導(dǎo)引律構(gòu)成了協(xié)同突防導(dǎo)引律.因此,本文方法對(duì)多對(duì)多協(xié)同博弈對(duì)抗問(wèn)題求解具有一定的啟發(fā).
本節(jié)將給出兩個(gè)仿真示例來(lái)說(shuō)明本文提出的協(xié)同微分對(duì)策導(dǎo)引律的有效性.
兩枚導(dǎo)彈和目標(biāo)的初始陣位設(shè)置為:xT(0)=以及VT=400 m/s,γM,1=35?,γM,2=32?,γT=180?.
兩枚導(dǎo)彈之間可以互相通信,兩枚導(dǎo)彈也均能獲得目標(biāo)的信息,因此多導(dǎo)彈與目標(biāo)之間的通信拓?fù)浣Y(jié)構(gòu)滿足假設(shè)1的條件.
協(xié)同微分對(duì)策導(dǎo)引律的目標(biāo)是使得代價(jià)函數(shù)J取極小值,而攔截效果則與導(dǎo)彈、目標(biāo)的速度以及其他設(shè)計(jì)參數(shù)有關(guān),實(shí)際攔截情況應(yīng)以仿真脫靶量為準(zhǔn).本節(jié)主要關(guān)注多彈對(duì)目標(biāo)的攔截情況,目標(biāo)過(guò)載設(shè)置為aT=0.5 g,仿真結(jié)果如圖2和圖3所示.
多導(dǎo)彈協(xié)同微分博弈模式下的攔截軌跡曲線如圖2所示,多導(dǎo)彈在攔截過(guò)程中的過(guò)載曲線aM,1(t)和aM,2(t)如圖3所示,可以看出過(guò)載是有界的,此外,兩枚導(dǎo)彈的最終攔截脫靶量為0.55 m和0.62 m,而且兩枚導(dǎo)彈的攔截時(shí)間之差為0.17 s,這意味著兩枚導(dǎo)彈在導(dǎo)引律(9)對(duì)目標(biāo)實(shí)現(xiàn)了對(duì)目標(biāo)的協(xié)同攔截.
為了證明本節(jié)算法有效性,增加一組仿真實(shí)驗(yàn),初始狀態(tài)與本節(jié)相同,導(dǎo)彈導(dǎo)引律為比例導(dǎo)引法,導(dǎo)引系數(shù)為4,仿真結(jié)果如圖4和圖5.
圖2 多導(dǎo)彈協(xié)同攔截目標(biāo)的軌跡Fig.2 Trajectories of multiple missile cooperative interception against target
圖3 多導(dǎo)彈協(xié)同攔截目標(biāo)的過(guò)載曲線Fig.3 Overload curves of multiple missiles cooperative interception against target
圖4 多導(dǎo)彈比例導(dǎo)引律下攔截目標(biāo)的軌跡Fig.4 Trajectories of multiple missiles cooperative interception against target using proportional guidance law
圖5 多導(dǎo)彈比例導(dǎo)引律下攔截目標(biāo)的過(guò)載曲線Fig.5 Overload curves of multiple missiles using proportional guidance laws
本文研究了智能化體系作戰(zhàn)博弈對(duì)抗場(chǎng)景下的協(xié)同博弈制導(dǎo)問(wèn)題,基于微分對(duì)策理論設(shè)計(jì)了一種新型的多導(dǎo)彈協(xié)同導(dǎo)引律,進(jìn)行了協(xié)同微分對(duì)策導(dǎo)引律與比例導(dǎo)引律的對(duì)比仿真實(shí)驗(yàn),證明協(xié)同導(dǎo)引律較經(jīng)典的比例導(dǎo)引律具有更好的攔截效果.此外,協(xié)同微分對(duì)策導(dǎo)引律可以進(jìn)一步轉(zhuǎn)化為多目標(biāo)協(xié)同突防導(dǎo)引律,及多對(duì)多協(xié)同博弈導(dǎo)引律,因此,本文方法對(duì)于多對(duì)多協(xié)同博弈對(duì)抗的問(wèn)題求解具有一定的啟發(fā)性,后續(xù)研究中,將進(jìn)一步考慮多彈之間的過(guò)載匹配、功能匹配問(wèn)題.