嵇慧明,余敏建,喬新航,楊海燕,張帥文
(1. 中國(guó)人民解放軍94701部隊(duì), 安徽 安慶 246000; 2. 空軍工程大學(xué) 空管領(lǐng)航學(xué)院, 陜西 西安 710051)
隨著技術(shù)的快速發(fā)展,戰(zhàn)機(jī)性能逐步得到提升,空戰(zhàn)對(duì)抗也變得異常激烈??諔?zhàn)機(jī)動(dòng)是為了使我機(jī)取得最優(yōu)空戰(zhàn)態(tài)勢(shì),對(duì)目標(biāo)機(jī)構(gòu)成威脅并實(shí)施有效的攻擊,甚至在我機(jī)處于劣勢(shì)時(shí),通過(guò)機(jī)動(dòng)擺脫目標(biāo)機(jī)的鎖定,脫離危險(xiǎn)[1-3]。當(dāng)前,空軍航空兵在空戰(zhàn)決策時(shí),仍以飛行員的自主判斷決策為主,在復(fù)雜多變的戰(zhàn)場(chǎng)環(huán)境中,無(wú)疑造成飛行員的精力分散,降低機(jī)動(dòng)決策效率和精度。因此,對(duì)空戰(zhàn)機(jī)動(dòng)決策問(wèn)題展開(kāi)研究,實(shí)時(shí)生成合理、可靠、精確的機(jī)動(dòng)策略則顯得至關(guān)重要。
目前,用于空戰(zhàn)機(jī)動(dòng)決策的智能方法主要有影響圖法[4-5]、貝葉斯網(wǎng)絡(luò)[6-7]、專(zhuān)家系統(tǒng)法[8]、強(qiáng)化學(xué)習(xí)[9-11]、遺傳算法[12-14]及其改進(jìn)算法[15]等。利用影響圖法對(duì)空戰(zhàn)要素之間的關(guān)系進(jìn)行分析,結(jié)合博弈法生成空戰(zhàn)機(jī)動(dòng)對(duì)策,所得結(jié)果較為貼近空戰(zhàn)實(shí)際,但計(jì)算時(shí)間長(zhǎng),難以滿足空戰(zhàn)實(shí)時(shí)性要求;將客觀信息和專(zhuān)家知識(shí)融入貝葉斯算法中,可以更好地描述復(fù)雜空戰(zhàn)環(huán)境,從而提高空戰(zhàn)機(jī)動(dòng)決策仿真效果,但是對(duì)提升空戰(zhàn)決策效率沒(méi)有明顯改善;強(qiáng)化學(xué)習(xí)、遺傳算法及其改進(jìn)算法等進(jìn)化算法穩(wěn)定性不夠,在應(yīng)用中存在收斂性差、易陷入局部最優(yōu)、實(shí)時(shí)性不夠等缺點(diǎn)。
Kaneshige等[16]利用生物學(xué)中的免疫機(jī)制,將態(tài)勢(shì)-機(jī)動(dòng)視為免疫應(yīng)答,建立了戰(zhàn)術(shù)免疫機(jī)動(dòng)系統(tǒng)(Tactical Immunized Maneuver System,TIMS),可有效提高決策精度和速度,但是在免疫搜索進(jìn)化時(shí)效率較低;Jiang等[17]對(duì)自然界中天牛覓食現(xiàn)象進(jìn)行模擬,建立了天牛須智能搜索(Beetle Antennae Search, BAS)算法,該算法具有良好的搜索適應(yīng)性,但是搜索時(shí)間較長(zhǎng),且全局搜索能力有待進(jìn)一步提升。若對(duì)BAS算法實(shí)施改進(jìn),并與TIMS進(jìn)行融合,可以進(jìn)一步提升算法的搜索收斂穩(wěn)定性和搜索速度,在實(shí)際空戰(zhàn)機(jī)動(dòng)決策中更加具有實(shí)際應(yīng)用意義。
本文基于改進(jìn)BAS-TIMS算法對(duì)空戰(zhàn)機(jī)動(dòng)對(duì)策生成問(wèn)題展開(kāi)研究。對(duì)傳統(tǒng)的機(jī)動(dòng)動(dòng)作庫(kù)進(jìn)行擴(kuò)充并給出了機(jī)動(dòng)動(dòng)作控制模型,進(jìn)一步貼近空戰(zhàn)機(jī)動(dòng)實(shí)際;利用非參量法對(duì)戰(zhàn)機(jī)機(jī)動(dòng)決策優(yōu)勢(shì)進(jìn)行評(píng)估,彌補(bǔ)了參量法的參數(shù)多、模型復(fù)雜的缺陷;針對(duì)天牛須算法全局搜索能力低的缺點(diǎn),引入了蒙特卡洛概率迭代方法,對(duì)BAS算法進(jìn)行改進(jìn),并和戰(zhàn)術(shù)免疫機(jī)動(dòng)系統(tǒng)融合,使戰(zhàn)機(jī)機(jī)動(dòng)策略搜索具有一定的方向性,從而進(jìn)一步提升空戰(zhàn)機(jī)動(dòng)決策效率,更好地解決空戰(zhàn)機(jī)動(dòng)決策問(wèn)題。
目前,空戰(zhàn)機(jī)動(dòng)策略集模型主要分成兩類(lèi):第一類(lèi)是基于典型空戰(zhàn)戰(zhàn)術(shù)的機(jī)動(dòng)序列,如定常盤(pán)旋、蛇形機(jī)動(dòng)、半筋斗、斜筋斗等;第二類(lèi)是基于戰(zhàn)機(jī)在三維空間中操縱方式的基本機(jī)動(dòng)動(dòng)作庫(kù),NASA學(xué)者設(shè)計(jì)了7種基本機(jī)動(dòng)動(dòng)作庫(kù)[18]——減速前飛、勻速前飛、加速前飛、右轉(zhuǎn)、左轉(zhuǎn)、爬升和俯沖。本文在這7種基本機(jī)動(dòng)動(dòng)作的基礎(chǔ)上,增加了左爬升、右爬升、左俯沖、右俯沖4種機(jī)動(dòng),對(duì)原機(jī)動(dòng)動(dòng)作庫(kù)予以擴(kuò)充,得到了11種基本機(jī)動(dòng)策略,并給出了每種機(jī)動(dòng)策略的控制方法,使得機(jī)動(dòng)更加精細(xì),能夠更為全面地反映飛機(jī)在三維空間內(nèi)的運(yùn)動(dòng)情況,如圖1所示。
圖1 空戰(zhàn)機(jī)動(dòng)策略庫(kù)Fig.1 Air combat maneuver strategy library
為了對(duì)機(jī)動(dòng)動(dòng)作實(shí)現(xiàn)精確控制,現(xiàn)將11種基本策略分成3類(lèi)來(lái)研究:平飛機(jī)動(dòng)、俯仰機(jī)動(dòng)和轉(zhuǎn)彎?rùn)C(jī)動(dòng)。用三自由度的方式對(duì)上述11種指揮引導(dǎo)策略建立相應(yīng)的模型,以nx、ny、γ作為控制變量,nx、ny、γ分別表示切向過(guò)載、法向過(guò)載和轉(zhuǎn)彎坡度,建立統(tǒng)一的戰(zhàn)機(jī)機(jī)動(dòng)策略控制模型。
(1)
每種基本機(jī)動(dòng)策略的控制量見(jiàn)表1。
對(duì)式(1)實(shí)施變換,可以將戰(zhàn)機(jī)控制量轉(zhuǎn)換為更加直觀的飛行姿態(tài)變化。
(2)
當(dāng)明確控制量nx,ny,γ的大小以及初始飛行狀態(tài)時(shí),可對(duì)式(2)進(jìn)行積分,得到控制后戰(zhàn)機(jī)的新的姿態(tài)α,β,V,從而可得戰(zhàn)機(jī)三維位置坐標(biāo)的變化率。
(3)
表1 11種基本機(jī)動(dòng)策略控制量
戰(zhàn)機(jī)機(jī)動(dòng)決策的根本目的是使我方戰(zhàn)機(jī)的空戰(zhàn)態(tài)勢(shì)最優(yōu),且受到目標(biāo)機(jī)的威脅最小。空戰(zhàn)態(tài)勢(shì)優(yōu)勢(shì)評(píng)估主要有參量法和非參量法兩類(lèi),非參量法在實(shí)際應(yīng)用中需要大量的參數(shù),可行性不高,因此在傳統(tǒng)的距離、高度、速度和角度等空戰(zhàn)優(yōu)勢(shì)評(píng)估指標(biāo)的基礎(chǔ)上,增加了戰(zhàn)機(jī)性能優(yōu)勢(shì)評(píng)估指標(biāo),用非參量法建立空戰(zhàn)優(yōu)勢(shì)評(píng)價(jià)指標(biāo)體系,如圖2所示。
圖2 空戰(zhàn)優(yōu)勢(shì)評(píng)價(jià)指標(biāo)體系Fig.2 Evaluation index system of air combat superiority
(4)
其中:D,DRmax,DMmax分別為戰(zhàn)機(jī)間相對(duì)距離、雷達(dá)最大探測(cè)距離和導(dǎo)彈最大攻擊距離;DMkmax,DMkmin分別為導(dǎo)彈最大、最小不可逃逸距離。
(5)
其中:HW,HM分別為我機(jī)與目標(biāo)機(jī)的高度;Hbest為戰(zhàn)機(jī)最佳空戰(zhàn)高度,通常可根據(jù)戰(zhàn)機(jī)的高度以查表的方式獲得。
(6)
其中:VW,VM分別為我機(jī)與目標(biāo)機(jī)的速度;Vbest為我機(jī)最佳空戰(zhàn)速度。
(7)
其中:Sφ,Sq分別為方位角優(yōu)勢(shì)和進(jìn)入角優(yōu)勢(shì);λ1,λ2為權(quán)重系數(shù);λ1+λ2=1,具體取值通常由專(zhuān)家打分給出,本文中取λ1=λ2=0.5。
(8)
其中:φ,q分別為目標(biāo)方位角和我機(jī)進(jìn)入角;φRmax為雷達(dá)最大搜索方位角;φMmax為空空導(dǎo)彈最大離軸發(fā)射角;φMkmax為空空導(dǎo)彈不可逃逸區(qū)最大偏角。
(9)
當(dāng)φ>90°時(shí),令φ′=180°-φ;當(dāng)φ<-90°時(shí),令φ′=-180°-φ,并以φ′替代原式中的φ。當(dāng)q<φ≤0時(shí),令q′=q+360°;當(dāng)q>-φ>0時(shí),令q′=q-360°,并以q′替代原式中的q。
戰(zhàn)機(jī)的空戰(zhàn)性能通常用對(duì)數(shù)公式表示。
C=[lnB+ln(∑A1+1)+ln(∑A2+1)]ε1ε2ε3ε4
(10)
式中:B,A1,A2分別為戰(zhàn)機(jī)的機(jī)動(dòng)性參數(shù)、火力打擊能力參數(shù)和探測(cè)能力參數(shù);ε1,ε2,ε3和ε4分別為戰(zhàn)機(jī)的操縱效能系數(shù)、生存能力系數(shù)、航程性能系數(shù)和電抗能力系數(shù),且εi≠0(i=1,2,3,4)。這7個(gè)參數(shù)可以根據(jù)飛機(jī)的相關(guān)性能參數(shù)獲得,具體計(jì)算方式參考文獻(xiàn)[22-23],對(duì)于典型的作戰(zhàn)飛機(jī)型號(hào),可通過(guò)查表的方式獲取。此處不再詳述。
根據(jù)式(10)可建立戰(zhàn)機(jī)性能優(yōu)勢(shì)函數(shù):
(11)
其中:CW,CM分別為我機(jī)與目標(biāo)機(jī)的空戰(zhàn)性能,SP∈(0,1)。
SSC=ωDSD+ωHSH+ωVSV+ωASA+ωPSP
(12)
式中,ωD,ωH,ωV,ωA,ωP分別為各項(xiàng)指標(biāo)對(duì)應(yīng)的權(quán)重。傳統(tǒng)的權(quán)重值通常由專(zhuān)家打分法求取,有著較強(qiáng)的人為主觀性。為了提高信息處理的客觀性,本文采用文獻(xiàn)[24-25]中的改進(jìn)粗糙集理論方法求取指標(biāo)對(duì)應(yīng)的權(quán)重。
(13)
式中,φ(i)為單個(gè)屬性i的重要度表示,具體計(jì)算步驟可參考文獻(xiàn)[24-25]。
天牛須搜索算法是在2017年提出的一種新的智能搜索算法,其生物學(xué)原理是對(duì)自然界中天牛覓食現(xiàn)象的模擬。天牛覓食時(shí),在不知道食物位置的情況下,會(huì)通過(guò)左右兩只觸角對(duì)食物的氣味強(qiáng)度進(jìn)行比較,從而確定下一步的飛行方向,直至找到食物的位置,如圖3所示。
圖3 天牛覓食示意圖Fig.3 Schematic diagram of beetle finding food
在對(duì)天牛覓食過(guò)程模擬時(shí),食物的氣味強(qiáng)度可以作為待優(yōu)化問(wèn)題的適應(yīng)度函數(shù),前進(jìn)方向作為搜索的選擇結(jié)果,前進(jìn)距離作為仿真步長(zhǎng),則天牛的覓食過(guò)程可以抽象成相應(yīng)的算法模型,描述如下:
1)天牛是在三維空間內(nèi)移動(dòng),為了提升模型的適用度,現(xiàn)將其范圍擴(kuò)展到任意維空間,假設(shè)天牛可以在一個(gè)任意維度的空間內(nèi)搜索;
2)為了更好地描述天牛的覓食搜索過(guò)程,現(xiàn)將天牛的身體視為一個(gè)質(zhì)點(diǎn),天牛須位于兩側(cè),且以質(zhì)點(diǎn)為中心對(duì)稱,則左右兩側(cè)天牛須的長(zhǎng)度之和即為天牛的身體寬度;
3)天牛每一次搜索后的前進(jìn)距離和身體寬度成一定的比例;
4)假設(shè)天牛在每次前進(jìn)后頭的朝向隨機(jī),則天牛須的方向也隨之成為隨機(jī)變量;
5)氣味在整個(gè)空間里分布是連續(xù)變化的。
運(yùn)用BAS算法對(duì)目標(biāo)實(shí)施搜索時(shí),首先需要初始化參數(shù)并隨機(jī)生成天牛方向,然后計(jì)算天牛的左右須位置及其適應(yīng)度值,接著通過(guò)適應(yīng)度函數(shù)值判斷前進(jìn)方向,滿足結(jié)束條件后輸出最優(yōu)值。具體如圖4所示。
圖4 天牛須搜索算法流程Fig.4 Flow of BAS algorithm
步驟1:初始化相關(guān)參數(shù)。對(duì)于k維空間內(nèi)的最優(yōu)化搜索問(wèn)題,設(shè)天牛的質(zhì)心為x,左須向量為xl,右須向量為xr,x、xl和xr均為k維向量。
步驟2:對(duì)天牛的方向向量予以定義:
(14)
(15)
其中:xt為迭代t次后天牛的質(zhì)心位置,dt為迭代t次后左、右須之間的距離。
步驟3:判斷前進(jìn)方向。分別計(jì)算天牛左須xl和右須xr的適應(yīng)度函數(shù)值fl和fr,故天牛的前進(jìn)方向?yàn)椋?/p>
xt=xt-1-bδtsgn(fl-fr)
(16)
式中:δt為第t步時(shí)天牛的移動(dòng)步長(zhǎng)。sgn(C)為符號(hào)函數(shù),當(dāng)C<0時(shí),sgn(C)=-1;當(dāng)C>0時(shí),sgn(C)=1;當(dāng)C=0時(shí),sgn(C)=0。
步驟4:計(jì)算天牛移動(dòng)后新的適應(yīng)度函數(shù)值,并對(duì)天牛的步長(zhǎng)和左右須之間的距離進(jìn)行更新。
(17)
其中:attd為距離衰減系數(shù),attδ為步長(zhǎng)衰減系數(shù)。一般情況下,初始時(shí)刻天牛的搜索步長(zhǎng)大,隨著距離氣味源的距離拉近,搜索步長(zhǎng)逐漸減小。
步驟5:判斷過(guò)程是否滿足終止條件,若滿足,則輸出對(duì)應(yīng)的選擇方案,否則返回步驟二,直至滿足結(jié)束條件。
BAS算法在搜索時(shí)具有很強(qiáng)的適應(yīng)性,每次迭代后,將進(jìn)化個(gè)體視為正在覓食的天牛,計(jì)算算法在移動(dòng)后的適應(yīng)度函數(shù)值,并與移動(dòng)前的算法適應(yīng)度函數(shù)值進(jìn)行對(duì)比,若移動(dòng)后的適應(yīng)度函數(shù)值更優(yōu),則予以移動(dòng),否則不移動(dòng)。具體搜索模型為:
(18)
利用BAS算法對(duì)問(wèn)題的最優(yōu)解實(shí)施搜索,具有搜索速度快等優(yōu)點(diǎn),但是在迭代過(guò)程中容易陷入局部最優(yōu)。為了提高BAS算法的全局搜索能力,引入模擬退火算法中的蒙特卡洛準(zhǔn)則,對(duì)BAS算法進(jìn)行改進(jìn)。圖5為搜索選擇概率圖,在每次搜索選擇時(shí),以概率p接受較差解,從而提升BAS的全局搜索能力。且有:
(19)
其中:f(xt)表示第t次迭代后預(yù)計(jì)適應(yīng)度函數(shù)值;f(xt-1)表示第t-1次迭代后的適應(yīng)度函數(shù)值;k為衰減系數(shù)。
由計(jì)算公式可以看出,隨著迭代次數(shù)的不斷增加,選擇較差解的概率值p將越來(lái)越小。
圖5 搜索選擇概率圖Fig.5 Search selection probability
免疫是一種科學(xué)的內(nèi)建防御體系,存在于所有的生物中,以減弱外部攻擊。生物免疫系統(tǒng)在免疫應(yīng)答產(chǎn)生的過(guò)程中,接收來(lái)自抗原-抗體復(fù)合物的連續(xù)反饋,從而產(chǎn)生越來(lái)越特異的抗體應(yīng)答。它可以記住先前的遭遇是如何被擊敗的,從而在后期發(fā)生類(lèi)似的遭遇時(shí)能夠快速做出反應(yīng),這是一個(gè)學(xué)習(xí)范式,能夠開(kāi)發(fā)解決方案,并不斷增加系統(tǒng)的精度。
對(duì)生物免疫系統(tǒng)進(jìn)行數(shù)學(xué)化描述,在人工免疫算法的基礎(chǔ)上,建立了戰(zhàn)術(shù)免疫機(jī)動(dòng)系統(tǒng),該系統(tǒng)良好的自學(xué)習(xí)能力與實(shí)時(shí)性能,能夠較好地克服空戰(zhàn)中影響戰(zhàn)機(jī)決策的不確定因素,從而對(duì)求解空戰(zhàn)對(duì)策的實(shí)時(shí)生成問(wèn)題有著良好的適配性。系統(tǒng)主要由以下幾個(gè)部分組成。
3.3.1 機(jī)動(dòng)動(dòng)作庫(kù)的構(gòu)建
在第1節(jié)中,建立了11種基本指揮引導(dǎo)策略,并對(duì)其控制方法加以描述?;诳刂谱兞縩x,ny,γ及其范圍,可以構(gòu)建戰(zhàn)機(jī)的機(jī)動(dòng)動(dòng)作庫(kù):
Mk=[nx,ny,γ]∈[-2,2; -5,7; -0.5π,0.5π]
(20)
在三自由度控制模型中,當(dāng)控制變量的值確定時(shí),戰(zhàn)機(jī)的機(jī)動(dòng)動(dòng)作也唯一確定。例如,當(dāng)(nx,ny,γ)=(0,1,0)時(shí),戰(zhàn)機(jī)做勻速前飛機(jī)動(dòng)。
3.3.2 機(jī)動(dòng)策略編碼
將戰(zhàn)機(jī)的機(jī)動(dòng)策略存于24位二進(jìn)制字符串中,該字符串被分成四個(gè)部分:6位(1~6)代表戰(zhàn)機(jī)識(shí)別碼,6位(7~12)代表控制變量nx,6位(13~18)代表控制變量ny,6位(19~24)代表控制變量γ。具體如圖6所示。
圖6 機(jī)動(dòng)策略編碼示意圖Fig.6 Schematic diagram of maneuver strategy coding
nx的數(shù)值精度為1/16,ny的數(shù)值精度為3/16,γ的數(shù)值精度為π/64。
3.3.3 機(jī)動(dòng)策略評(píng)估
建立機(jī)動(dòng)動(dòng)作庫(kù)后,可以對(duì)后續(xù)的機(jī)動(dòng)策略充分預(yù)測(cè),并構(gòu)造親和度函數(shù)對(duì)機(jī)動(dòng)策略實(shí)施評(píng)估?;谑?12),機(jī)動(dòng)策略評(píng)估的親和度函數(shù)為:
fk(C)=α·S′k(G)+(1-α)·[1-T′k(G)]
(21)
式中,fk(C)表示戰(zhàn)機(jī)做機(jī)動(dòng)k時(shí)的親和度函數(shù)值,S′k(G)表示戰(zhàn)機(jī)做機(jī)動(dòng)k時(shí)的態(tài)勢(shì)優(yōu)勢(shì)值,T′k(G)表示戰(zhàn)機(jī)做機(jī)動(dòng)k時(shí)受到目標(biāo)機(jī)的態(tài)勢(shì)威脅值,α為態(tài)勢(shì)優(yōu)勢(shì)重要度系數(shù)。
3.3.4 空戰(zhàn)態(tài)勢(shì)編碼
空戰(zhàn)態(tài)勢(shì)主要包括目標(biāo)機(jī)和我方戰(zhàn)機(jī)的位置信息、航向、高度、速度等,在戰(zhàn)術(shù)免疫機(jī)動(dòng)系統(tǒng)中,為了實(shí)現(xiàn)機(jī)動(dòng)策略與空戰(zhàn)態(tài)勢(shì)間的免疫操作,需要對(duì)空戰(zhàn)態(tài)勢(shì)進(jìn)行編碼,選取以下6個(gè)特征進(jìn)行編碼:戰(zhàn)機(jī)間距離、相對(duì)高度、目標(biāo)方位角、航向交叉角、我方戰(zhàn)機(jī)速度、目標(biāo)機(jī)速度。
相對(duì)高度的范圍為 [0 m,4800 m],精度為150 m;目標(biāo)方位角范圍為 [0°,360°],精度為6°;航向交叉角的范圍為 [0°,360°],精度為6°;我方戰(zhàn)機(jī)和目標(biāo)機(jī)的速度范圍為 [0 m/s,400 m/s],精度為12.5 m/s。利用上述方法對(duì)其進(jìn)行編碼操作。
3.3.5 機(jī)動(dòng)策略選擇
將戰(zhàn)機(jī)當(dāng)前的機(jī)動(dòng)狀態(tài)作為初始狀態(tài),利用相應(yīng)的算子對(duì)機(jī)動(dòng)策略進(jìn)行選擇,最終將親和度函數(shù)值最大的機(jī)動(dòng)策略作為最優(yōu)選擇。當(dāng)發(fā)現(xiàn)成功的機(jī)動(dòng)動(dòng)作時(shí),將其機(jī)動(dòng)策略以及相應(yīng)的空戰(zhàn)態(tài)勢(shì)特征放入相應(yīng)的數(shù)據(jù)庫(kù)中,為后續(xù)的模型進(jìn)化提供依據(jù)。
3.3.6 機(jī)動(dòng)策略解碼
首先根據(jù)選擇的機(jī)動(dòng)策略的編碼,計(jì)算出控制變量nx,ny,γ的值,然后由表1中的11種指揮引導(dǎo)策略控制量范圍得出我方戰(zhàn)機(jī)的基本機(jī)動(dòng)策略,接著根據(jù)式(2)、式(3)計(jì)算機(jī)動(dòng)后我方戰(zhàn)機(jī)的位置和機(jī)動(dòng)后的航向、速度和高度。
改進(jìn)的天牛須搜索算法雖然具備良好的全局搜索能力,但是在每次搜索時(shí),計(jì)算復(fù)雜度是相同的,若對(duì)機(jī)動(dòng)動(dòng)作進(jìn)行精確化搜索,則計(jì)算量十分龐大,影響收斂速度;TIMS模型能夠隨著迭代次數(shù)的增加對(duì)機(jī)動(dòng)策略選擇庫(kù)進(jìn)行擴(kuò)充,在后續(xù)選擇中降低計(jì)算復(fù)雜度,但是對(duì)于之前未出現(xiàn)的態(tài)勢(shì),進(jìn)化搜索時(shí)收斂速度較慢。將改進(jìn)BAS算法和TIMS模型進(jìn)行融合,并在仿真實(shí)驗(yàn)中對(duì)融合算法的優(yōu)越性進(jìn)行檢驗(yàn),具體過(guò)程如圖7所示。
圖7 改進(jìn)BAS算法和TIMS模型融合Fig.7 Fusion of improved BAS algorithm and TIMS model
空戰(zhàn)時(shí),敵我雙方都在試圖通過(guò)機(jī)動(dòng)使目標(biāo)機(jī)對(duì)己方的威脅最小,同時(shí)盡量使己方獲得最優(yōu)空戰(zhàn)態(tài)勢(shì),構(gòu)成攻擊條件對(duì)目標(biāo)實(shí)施打擊。因此,需要根據(jù)敵我雙方的空戰(zhàn)態(tài)勢(shì)實(shí)時(shí)生成機(jī)動(dòng)決策方案,基于上述的改進(jìn)BAS-TIMS,生成我方戰(zhàn)機(jī)的機(jī)動(dòng)對(duì)策,其過(guò)程如圖8所示。
步驟1:獲取我方戰(zhàn)機(jī)和目標(biāo)機(jī)的空戰(zhàn)態(tài)勢(shì)數(shù)據(jù),并做格式化處理。
步驟2:對(duì)空空導(dǎo)彈彈道進(jìn)行仿真,并計(jì)算出實(shí)時(shí)攻擊線的距離,判斷是否構(gòu)成攻擊條件,若滿足則對(duì)目標(biāo)機(jī)實(shí)施攻擊,否則轉(zhuǎn)入下一步機(jī)動(dòng)。
步驟3:對(duì)我方戰(zhàn)機(jī)的空戰(zhàn)態(tài)勢(shì)和受到目標(biāo)機(jī)的威脅實(shí)施評(píng)估,并在此基礎(chǔ)上利用改進(jìn)的BAS-TIMS算法求解下一步的機(jī)動(dòng)策略。
步驟4:機(jī)動(dòng)完成后,轉(zhuǎn)入步驟1,反復(fù)迭代生成機(jī)動(dòng)策略,直至我方戰(zhàn)機(jī)對(duì)敵方構(gòu)成攻擊條件并發(fā)射導(dǎo)彈。
圖8 空戰(zhàn)機(jī)動(dòng)對(duì)策生成Fig.8 Generation of air combat maneuver countermeasures
為了驗(yàn)證本文算法在空戰(zhàn)機(jī)動(dòng)決策中的有效性,現(xiàn)以敵我一對(duì)一空戰(zhàn)對(duì)抗為背景設(shè)計(jì)算例進(jìn)行仿真。初始條件:我機(jī)初始位置坐標(biāo)為(0 km,40 km,6200 m),航向135°,速度900 km/h;目標(biāo)機(jī)初始位置坐標(biāo)為(70 km,30 km,6000 m),航向330°,速度800 km/h。假設(shè)敵我雙方戰(zhàn)機(jī)選擇同一型號(hào)戰(zhàn)機(jī),經(jīng)計(jì)算,戰(zhàn)機(jī)綜合優(yōu)勢(shì)的各項(xiàng)指標(biāo)對(duì)應(yīng)權(quán)重ωD,ωH,ωV,ωA,ωP分別為0.181,0.181,0.189 7,0.212 7,0.235 6。該型戰(zhàn)機(jī)的性能優(yōu)勢(shì)為0.680 9,雷達(dá)最大搜索角φRmax=80°,空空導(dǎo)彈最大離軸發(fā)射角φMmax=50°,空空導(dǎo)彈不可逃逸區(qū)最大偏角φMkmax=30°,雷達(dá)最大探測(cè)距離DRmax=120 km,導(dǎo)彈最大攻擊距離DMmax=60 km,導(dǎo)彈最大、最小不可逃逸距離分別為DMkmax=30 km、DMkmin=5 km。態(tài)勢(shì)優(yōu)勢(shì)重要度系數(shù)α取0.7,設(shè)仿真步長(zhǎng)為5 s,仿真時(shí)長(zhǎng)為300 s。初始時(shí)刻,TIMS模型庫(kù)中置入1000條實(shí)際空戰(zhàn)訓(xùn)練的機(jī)動(dòng)序列。當(dāng)敵我雙方均采用本文改進(jìn)算法策略實(shí)施機(jī)動(dòng)時(shí),仿真結(jié)果如圖9所示。
圖9 空戰(zhàn)對(duì)抗三維軌跡Fig.9 Three-dimensional trajectory of air combat
圖9在水平面上的投影如圖10所示。
圖10 敵我雙方空戰(zhàn)對(duì)抗軌跡水平面投影Fig.10 Plane projection of air combat trajectory
我方戰(zhàn)機(jī)與目標(biāo)機(jī)對(duì)應(yīng)的機(jī)動(dòng)策略切向過(guò)載nx、法向過(guò)載ny、轉(zhuǎn)彎坡度γ的變化分別如圖11所示,高度和速度變化如圖12所示。
圖9~12對(duì)敵我雙方的空戰(zhàn)軌跡和機(jī)動(dòng)策略參數(shù)進(jìn)行了描述。初始階段,我方戰(zhàn)機(jī)相對(duì)目標(biāo)機(jī)在高度和速度上具有一定的優(yōu)勢(shì),角度上處于劣勢(shì),通過(guò)左轉(zhuǎn)機(jī)動(dòng),試圖化解角度劣勢(shì);在一段時(shí)間的調(diào)整后,我機(jī)通過(guò)左轉(zhuǎn)機(jī)動(dòng),對(duì)目標(biāo)進(jìn)行攻擊,并不斷調(diào)整高度和速度以保持自身優(yōu)勢(shì),目標(biāo)機(jī)也實(shí)施大坡度轉(zhuǎn)彎?rùn)C(jī)動(dòng),試圖擺脫我機(jī)的攻擊,第一次攻擊占位完畢后,我方戰(zhàn)機(jī)迅速左轉(zhuǎn)回撤,為下一波次的攻擊做準(zhǔn)備,目標(biāo)機(jī)也積極實(shí)施機(jī)動(dòng),試圖在擺脫我方戰(zhàn)機(jī)的攻擊后,通過(guò)機(jī)動(dòng)對(duì)我方戰(zhàn)機(jī)構(gòu)成威脅。綜上所述,我方戰(zhàn)機(jī)和目標(biāo)機(jī)都在積極機(jī)動(dòng)占位,試圖使己方保持空戰(zhàn)態(tài)勢(shì)優(yōu)勢(shì),并對(duì)目標(biāo)構(gòu)成威脅。敵我方戰(zhàn)機(jī)空戰(zhàn)態(tài)勢(shì)優(yōu)勢(shì)隨時(shí)間的變化如圖13所示。
(a) 切向過(guò)載(a) Tangential overload
(b) 法向過(guò)載(b) Normal overload
(c) 轉(zhuǎn)彎坡度(c) Turning slope圖11 切向過(guò)載、法向過(guò)載和轉(zhuǎn)彎坡度隨時(shí)間的變化Fig.11 Changes of tangential overload, normal overload and turning slope with time
(a) 高度(a) Atitude
(b) 速度(b) Velocity圖12 高度和速度隨時(shí)間的變化Fig.12 Changes of a titude and velocity with time
圖13 空戰(zhàn)態(tài)勢(shì)優(yōu)勢(shì)隨時(shí)間的變化Fig.13 Changes of air combat situation superiority with time
由圖13可以看出,初始階段,我方戰(zhàn)機(jī)相對(duì)處于劣勢(shì),通過(guò)合理的機(jī)動(dòng)決策,不斷增大態(tài)勢(shì)優(yōu)勢(shì);目標(biāo)機(jī)在態(tài)勢(shì)變?nèi)鹾?,也開(kāi)始實(shí)施機(jī)動(dòng)來(lái)增強(qiáng)自己的空戰(zhàn)態(tài)勢(shì)。證明了改進(jìn)BAS-TIMS算法生成的空戰(zhàn)機(jī)動(dòng)決策能夠?qū)⒓悍降牧觿?shì)地位轉(zhuǎn)化成優(yōu)勢(shì)地位。
為了進(jìn)一步驗(yàn)證改進(jìn)BAS-TIMS算法的可靠性和有效性,現(xiàn)選取文獻(xiàn)[26]中的博弈論方法和文獻(xiàn)[27]中的改進(jìn)共生生物免疫進(jìn)化算法進(jìn)行比較。選取上述算例中第250 s處的空戰(zhàn)態(tài)勢(shì)作為輸入,對(duì)3種算法分別迭代50次后,其收斂精度對(duì)比如圖14所示。
圖14 3種算法收斂過(guò)程對(duì)比Fig.14 Comparison of convergence processes of 3 algorithms
將3種算法分別計(jì)算50次,算法最優(yōu)值和收斂時(shí)間對(duì)比見(jiàn)表2。
表2 3種算法最優(yōu)值和收斂時(shí)間
綜合圖14和表2可知,本文算法收斂速度明顯快于博弈論法和改進(jìn)共生生物免疫進(jìn)化算法,且收斂時(shí)適應(yīng)度值也高于其他兩種算法。驗(yàn)證了本文所提改進(jìn)BAS-TIMS算法能夠更好地解決空戰(zhàn)機(jī)動(dòng)決策問(wèn)題。
為了檢驗(yàn)改進(jìn)算法的優(yōu)越性,現(xiàn)選取一靜態(tài)飛行數(shù)據(jù)作為目標(biāo)機(jī)的機(jī)動(dòng)軌跡,分別用改進(jìn)BAS-TIMS算法、傳統(tǒng)BAS算法和傳統(tǒng)TIMS算法的計(jì)算結(jié)果與目標(biāo)機(jī)展開(kāi)對(duì)抗。初始時(shí)刻,我機(jī)位置坐標(biāo)為(92 km, 27 km, 5800 m),航向270°,速度900 km/h;目標(biāo)機(jī)位置坐標(biāo)為(2 km, 26 km, 5400 m),航向90°,速度800 km/h。靜態(tài)仿真條件同上。仿真結(jié)果如圖15所示。
圖15 3種算法空戰(zhàn)對(duì)抗三維軌跡對(duì)比Fig.15 Comparison of 3D trajectories of air combat confrontation with three algorithms
圖15在水平面上的投影如圖16所示。
圖16 3種算法空戰(zhàn)對(duì)抗軌跡水平面投影Fig.16 Plane projection of air combat trajectory with three algorithms
3種算法的空戰(zhàn)態(tài)勢(shì)優(yōu)勢(shì)隨時(shí)間變化的對(duì)比結(jié)果如圖17所示,3種算法每次迭代的收斂時(shí)間對(duì)比結(jié)果如表3所示。
圖17 3種算法戰(zhàn)機(jī)空戰(zhàn)態(tài)勢(shì)優(yōu)勢(shì)隨時(shí)間的變化Fig.17 Changes of air combat situation superiority with time based on three algorithms
結(jié)合圖17及表3,可以得出本文BAS算法計(jì)算的機(jī)動(dòng)策略明顯優(yōu)于傳統(tǒng)的BAS和TIMS算法,且收斂速度也明顯得到提升,進(jìn)一步證明了本文算法的優(yōu)越性。
表3 3種算法最優(yōu)值和收斂時(shí)間
本文主要對(duì)空戰(zhàn)機(jī)動(dòng)決策問(wèn)題展開(kāi)研究,對(duì)天牛須搜索算法進(jìn)行改進(jìn),并與戰(zhàn)術(shù)免疫機(jī)動(dòng)系統(tǒng)融合,采用改進(jìn)的BAS-TIMS算法對(duì)空戰(zhàn)機(jī)動(dòng)策略進(jìn)行解算,對(duì)我方戰(zhàn)機(jī)的機(jī)動(dòng)進(jìn)行優(yōu)化決策。
1) 通過(guò)算例仿真,發(fā)現(xiàn)戰(zhàn)機(jī)能夠在自身處于劣勢(shì)時(shí),及時(shí)實(shí)施機(jī)動(dòng),增大空戰(zhàn)優(yōu)勢(shì),并減弱目標(biāo)對(duì)自身的威脅,驗(yàn)證了改進(jìn)BAS-TIMS算法的有效性。
2)通過(guò)與博弈論方法、改進(jìn)共生生物免疫進(jìn)化算法、傳統(tǒng)BAS算法和TIMS模型算法結(jié)果對(duì)比,驗(yàn)證本文算法在適應(yīng)度最優(yōu)值、收斂速度以及運(yùn)行時(shí)間上都具有一定的優(yōu)勢(shì)。
著眼于未來(lái)多機(jī)型、多機(jī)種、多批次的編隊(duì)協(xié)同作戰(zhàn)發(fā)展趨勢(shì),下一步將在主要工作的基礎(chǔ)上,重點(diǎn)研究戰(zhàn)機(jī)間的戰(zhàn)術(shù)協(xié)同機(jī)動(dòng),為多機(jī)協(xié)同空戰(zhàn)機(jī)動(dòng)對(duì)策生成問(wèn)題提供理論依據(jù)。