吳詩輝,賈 軍,鮑 然,周 宇,夏青元
(1.空軍工程大學(xué)裝備管理與無人機(jī)工程學(xué)院,陜西西安710051;2.上海機(jī)電工程研究所,上海201109;3.南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇南京 210094)
當(dāng)前,世界軍事強(qiáng)國(guó)都十分重視發(fā)展無人集群作戰(zhàn)裝備,可以預(yù)見,無人集群將成為未來空防作戰(zhàn)的重要威脅。美軍率先提出了多導(dǎo)彈協(xié)同作戰(zhàn)的概念,通過多枚導(dǎo)彈協(xié)同提高突防能力[1]。國(guó)內(nèi)在多導(dǎo)彈多目標(biāo)協(xié)同作戰(zhàn)方面也開展了一些研究[2-8]。其中:文獻(xiàn)[3]研究了多導(dǎo)彈協(xié)同作戰(zhàn)的目標(biāo)分配問題,主要針對(duì)多導(dǎo)彈對(duì)空中戰(zhàn)機(jī)和地面目標(biāo)的分配,以對(duì)目標(biāo)形成的威脅指數(shù)和毀傷效果最大為目標(biāo)函數(shù),構(gòu)建了優(yōu)化模型,但攻擊的目標(biāo)并非集群目標(biāo);文獻(xiàn)[5]研究了多導(dǎo)彈多目標(biāo)協(xié)同探測(cè)的信息融合方法,能夠完成多機(jī)動(dòng)目標(biāo)的協(xié)同探測(cè)任務(wù);文獻(xiàn)[6]研究了一種面向突防的多導(dǎo)彈協(xié)同彈道規(guī)劃方法,通過彈道設(shè)計(jì)降低飛行過程中雷達(dá)探測(cè)概率,針對(duì)同地先后發(fā)射和不同地同時(shí)發(fā)射情況,均得到了滿足攻擊時(shí)間/攻擊角度協(xié)同的優(yōu)化彈道;文獻(xiàn)[7]針對(duì)多無人機(jī)超視距協(xié)同作戰(zhàn)多目標(biāo)分配問題進(jìn)行了探討,主要針對(duì)的是多無人機(jī)對(duì)多作戰(zhàn)飛機(jī)的目標(biāo)優(yōu)化分配,旨在解決如何根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)合理分配目標(biāo),以避免重復(fù)攻擊,并相互支援,充分發(fā)揮作戰(zhàn)無人機(jī)的打擊效能;文獻(xiàn)[8]針對(duì)多導(dǎo)彈攔截高馬赫數(shù)飛行器問題,研究了多個(gè)導(dǎo)彈如何協(xié)同配合,以覆蓋其可能的機(jī)動(dòng)空間并實(shí)施攔截的策略。同時(shí),針對(duì)多導(dǎo)彈協(xié)同作戰(zhàn)問題,許多學(xué)者就多導(dǎo)彈協(xié)同攔截目標(biāo)的制導(dǎo)律[9-11]、多導(dǎo)彈協(xié)同發(fā)射時(shí)序規(guī)劃[12]等問題進(jìn)行了大量研究。
但是,現(xiàn)有文獻(xiàn)缺乏對(duì)多導(dǎo)彈與無人機(jī)集群對(duì)抗的智能化目標(biāo)分配方法的研究。本文針對(duì)多導(dǎo)彈多目標(biāo)的空中集群對(duì)抗的目標(biāo)分配問題開展研究,將該問題視為一個(gè)有約束的非平衡任務(wù)分配問題[13]。該問題不同于常規(guī)的武器目標(biāo)分配問題(weapon target assignment,WTA)[2,14-19],區(qū)別在于不能直接得到彈目?jī)蓛稍庥鰰r(shí)的攔截效果,而是需要利用比例導(dǎo)引法進(jìn)行彈道仿真,因此需要考慮過載約束、導(dǎo)彈運(yùn)動(dòng)時(shí)間約束、軌跡交叉等因素。同時(shí),提出了分配均勻度的概念,以保證將導(dǎo)彈均勻分配給每個(gè)集群目標(biāo),提高綜合毀傷效果。
假設(shè)有nm枚導(dǎo)彈,欲協(xié)同抗擊nt個(gè)無人機(jī)組成的集群。已知導(dǎo)彈的初始坐標(biāo)和速度,如何快速進(jìn)行任務(wù)分配,對(duì)nt個(gè)無人機(jī)進(jìn)行最大程度的毀傷,是本文的研究目標(biāo)。為方便研究,做以下假設(shè):
1)導(dǎo)彈數(shù)量大于目標(biāo)無人機(jī)數(shù)量,即nm>nt;
2)每個(gè)目標(biāo)無人機(jī)至少分配一枚導(dǎo)彈進(jìn)行攻擊;
3)一枚導(dǎo)彈只能選擇一個(gè)目標(biāo)進(jìn)行攻擊;
4)考慮到導(dǎo)彈與目標(biāo)遭遇時(shí)間非常短,通常只有幾秒,認(rèn)為只完成一次任務(wù)分配,即導(dǎo)彈分配一個(gè)目標(biāo)后,不再更改目標(biāo);
5)假設(shè)導(dǎo)彈按照比例導(dǎo)引法對(duì)目標(biāo)進(jìn)行攻擊,目標(biāo)無人機(jī)始終勻速平飛,且導(dǎo)彈的初始速度遠(yuǎn)大于無人機(jī)飛行速度,導(dǎo)彈因空氣阻力做勻減速飛行,減速的加速度為α;
6)用第i枚導(dǎo)彈與第j個(gè)目標(biāo)遭遇時(shí)導(dǎo)彈與目標(biāo)的末速度差ΔVij作為衡量打擊效果的指標(biāo),目標(biāo)是如何指派使完成任務(wù)的總效率最高,即
由于導(dǎo)彈數(shù)量nm大于目標(biāo)數(shù)量nt,該問題可看作一個(gè)非平衡指派問題。不同于傳統(tǒng)的非平衡指派問題,該問題的打擊效果指標(biāo)ΔVij需要經(jīng)過比例導(dǎo)引法仿真得到,且存在導(dǎo)彈未能毀傷目標(biāo)的情況(如導(dǎo)彈的末速度過低(假設(shè)最低攔截速度為Vlim),導(dǎo)彈在規(guī)定飛行時(shí)間tlim內(nèi)不能飛到目標(biāo)附近,導(dǎo)彈由于過載限制不能命中目標(biāo)等)。
假設(shè)有nm個(gè)導(dǎo)彈,編號(hào)為{M1,M2,…,Mnm},欲協(xié)同抗擊nt個(gè)無人機(jī)組成的集群,編號(hào)為{T1,T2,…,Tnt}。
用一個(gè)六維向量表示導(dǎo)彈或者目標(biāo)的初始態(tài)勢(shì),即:{X,Y,Z,v,θv,φv},如圖1所示,其中前三項(xiàng)表示該實(shí)體的三維坐標(biāo)值,第4項(xiàng)表示其速度大?。ㄓ民R赫數(shù)表示),第5 項(xiàng)表示速度矢量與oxz平面的夾角(也稱彈道傾角),第6 項(xiàng)表示速度矢量在oxz平面的投影OW′與ox軸的夾角(也稱彈道偏角)。
圖1 三維空間速度矢量表示Fig.1 Velocity vector in 3-D space
這樣,nm個(gè)導(dǎo)彈形成態(tài)勢(shì)矩陣為:
nt個(gè)目標(biāo)形成態(tài)勢(shì)矩陣為:
比例導(dǎo)引法是在自尋的導(dǎo)彈上采用較多的一種導(dǎo)引規(guī)律,它易于工程實(shí)現(xiàn),同時(shí)不需要太大的法向過載,對(duì)不同機(jī)動(dòng)特性的目標(biāo)適應(yīng)能力較強(qiáng),因此被廣泛應(yīng)用于各類導(dǎo)彈上[20]。
假設(shè)導(dǎo)彈(追蹤實(shí)體)和無人機(jī)(逃逸實(shí)體)為質(zhì)點(diǎn),從運(yùn)動(dòng)學(xué)角度,實(shí)現(xiàn)三維空間中比例導(dǎo)引彈道的仿真,計(jì)算過程如下。
2.2.1 輸入初始態(tài)勢(shì)
逃逸實(shí)體位置(xt,yt,zt),速度Vt,彈道傾角θt,彈道偏角φt;追蹤實(shí)體的位置(xm,ym,zm),速度Vm,彈道傾角θm,彈道偏角φm。
初始化循環(huán)次數(shù)n=1,運(yùn)動(dòng)時(shí)間t=0。
2.2.2 計(jì)算彈目相對(duì)距離R
2.2.3 判斷是否攔截成功
判斷R是否小于距離閾值,若是,表示攔截成功,結(jié)束循環(huán),記錄運(yùn)動(dòng)時(shí)間t,追蹤實(shí)體末速度Vm1,及末速度差ΔV=Vm1-Vt;否則繼續(xù)下一步計(jì)算。
2.2.4 計(jì)算追蹤實(shí)體的飛行距離
選定一個(gè)足夠小的時(shí)間間隔Δt,計(jì)算追蹤實(shí)體在Δt時(shí)間內(nèi)的飛行距離在三個(gè)坐標(biāo)方向的分量,即
2.2.5 計(jì)算逃逸實(shí)體的運(yùn)動(dòng)距離
計(jì)算逃逸實(shí)體在Δt時(shí)間內(nèi)的飛行距離在三個(gè)坐標(biāo)方向的分量,即
2.2.6 計(jì)算追蹤實(shí)體-逃逸實(shí)體相對(duì)距離變化量
計(jì)算在Δt時(shí)間內(nèi)的追蹤實(shí)體與逃逸實(shí)體相對(duì)距離變化,即
2.2.7 計(jì)算縱向過載ny和側(cè)向過載nz
式中:k1、k2分別為縱向通道和偏航通道導(dǎo)引系數(shù);
計(jì)算總過載nyz
如果nyz超過過載限制范圍nmax,取
2.2.8 計(jì)算追蹤實(shí)體彈道角變化量
計(jì)算在Δt時(shí)間內(nèi)的追蹤實(shí)體彈道傾角變化
計(jì)算在Δt時(shí)間內(nèi)的追蹤實(shí)體彈道偏角變化
2.2.9 更新追蹤實(shí)體及逃逸實(shí)體位置及速度
更新追蹤實(shí)體位置在三個(gè)坐標(biāo)方向的分量:
更新逃逸實(shí)體位置在三個(gè)坐標(biāo)方向的分量:
更新追蹤實(shí)體彈道傾角:
更新追蹤實(shí)體彈道偏角:
更新追蹤實(shí)體速度大?。?/p>
2.2.10 判斷是否攔截失敗
更新運(yùn)動(dòng)時(shí)間:t=t+Δt。判斷運(yùn)動(dòng)時(shí)間是否達(dá)到最大運(yùn)動(dòng)時(shí)間tlim,或追蹤實(shí)體運(yùn)動(dòng)速度達(dá)到最低速度Vlim,若是,表示攔截失敗,令t=-1 且Vm1=Vt,則末速度差ΔV=Vm1-Vt=0,計(jì)算結(jié)束,跳出循環(huán);否則,令循環(huán)次數(shù)n=n+1,重復(fù)2.2.2~2.2.10。
令nm個(gè)導(dǎo)彈{M1,M2,…,Mnm},分別攻擊nt個(gè)無人機(jī)集群{T1,T2,…,Tnt},用ΔVij表示導(dǎo)彈Mi攻擊目標(biāo)Tj時(shí),二者遭遇時(shí)的末速度差,則兩兩匹配后可得到末速度差矩陣(ΔVij)nm×nt。
為計(jì)算方便,假定
由于遭遇時(shí)刻的末速度差越大,成功攔截的概率就越大,因此可用末速度差作為衡量方案優(yōu)劣的指標(biāo)。
則優(yōu)化模型可描述為
式中:目標(biāo)函數(shù)表示所有導(dǎo)彈與其分配的目標(biāo)遭遇時(shí)的末速度差之和達(dá)到最大;第一個(gè)約束函數(shù)表示分配用來攻擊第j個(gè)目標(biāo)的導(dǎo)彈的最大數(shù)量為L(zhǎng),最少為L(zhǎng)min個(gè)(默認(rèn)取1,若考慮至少兩發(fā)導(dǎo)彈攻擊1 個(gè)目標(biāo),則可取2),這里L(fēng)也稱為分配均勻度,Lmin為最小分配均勻度,且Lmin≥1。例如,當(dāng)L=2 時(shí),表示每個(gè)目標(biāo)最多有2 發(fā)導(dǎo)彈對(duì)其進(jìn)行攻擊;第2 個(gè)約束函數(shù)表示每個(gè)導(dǎo)彈必須選擇且只能選擇一個(gè)攻擊目標(biāo)。
該模型是一個(gè)0-1 整數(shù)線性規(guī)劃問題,常用的求解方法有隱枚舉法和匈牙利算法。運(yùn)用MATLAB 或LINGO軟件,可以很快得出最優(yōu)解。
在仿真的同一時(shí)刻,若兩追蹤實(shí)體之間的距離小于dmin時(shí),認(rèn)為存在軌跡交叉。在采用以上尋優(yōu)方法得到分配方案后,需要驗(yàn)證在該分配方式下整個(gè)運(yùn)動(dòng)過程中是否存在軌跡交叉的情況,即遍歷在所有運(yùn)動(dòng)時(shí)刻,判斷任意兩個(gè)追蹤實(shí)體Mi1、Mi2之間的距離是否滿足
式中:(xMi1,yMi1,zMi1)、(xMi2,yMi2,zMi2)分別表示Mi1、Mi2在同一時(shí)刻的坐標(biāo)。
若某一時(shí)刻存在某兩個(gè)追蹤實(shí)體之間的距離不滿足以上條件,則采取對(duì)其中一條軌跡增加懲罰系數(shù)的方法,以避免出現(xiàn)軌跡交叉的分配方案。令其中一條末速度差較低的軌跡為攔截失敗即可,即該軌跡對(duì)應(yīng)的導(dǎo)彈-目標(biāo)組合的末速度差取為0。
步驟1:初始化。隨機(jī)生成導(dǎo)彈群的態(tài)勢(shì)集、目標(biāo)無人機(jī)群的態(tài)勢(shì)集。
步驟2:獲取彈目遭遇末速度差矩陣。遍歷每個(gè)導(dǎo)彈對(duì)每個(gè)目標(biāo)的攻擊效果,利用第2.2 節(jié)的比例導(dǎo)引法,仿真得到導(dǎo)彈運(yùn)動(dòng)軌跡,以及末速度差矩陣。
步驟4:判斷最優(yōu)分配方案是否出現(xiàn)兩兩交叉。如果未出現(xiàn)交叉,認(rèn)為導(dǎo)彈群不會(huì)出現(xiàn)軌跡交叉情況,輸出最優(yōu)方案,算法結(jié)束;否則,令交叉軌跡中末速度差較小的一個(gè)導(dǎo)彈-目標(biāo)組合為攔截失?。僭O(shè)ΔVIJ為出現(xiàn)交叉中末速度差較小的一個(gè)),即令ΔVIJ=0,返回步驟3重新進(jìn)行優(yōu)化,直到找到最優(yōu)方案。
假設(shè)已知初始態(tài)勢(shì)如表1所示。其中前10行表示導(dǎo)彈的態(tài)勢(shì);后5行表示無人機(jī)集群的態(tài)勢(shì)。假設(shè)彈目遭遇成功的閾值為:dmin=5 m,導(dǎo)彈的最大過載:nmax=20g(超出最大過載按照最大過載運(yùn)動(dòng)),導(dǎo)彈在飛行過程中因阻力做勻減速運(yùn)動(dòng)(α=-87.43 m/s2),比例導(dǎo)引法導(dǎo)引系數(shù)均取5,導(dǎo)彈Vlim=0.3Ma,tlim=10.5 s。
表1 初始態(tài)勢(shì)數(shù)據(jù)Tab.1 Initial situation data
利用第2.2 節(jié)的仿真方法,得到追蹤實(shí)體-逃逸實(shí)體末速度差如表2所示。
表2 遍歷末速度差表Tab.2 Final speed gap matrix for all pairwise combinations m/s
利用第2.4 節(jié)的優(yōu)化模型,假設(shè)分配均勻度L為2、3、4,可算出最優(yōu)方案如表3所示。其中,當(dāng)L=2時(shí),最優(yōu)分配[2,2,1,5,5,1,3,3,4,4],表示T1分配給導(dǎo)彈M3和M6,T2分配給M1和M2,T3分配給M7和M8,T4分配給M9和M10,T5分配給M4和M5。此時(shí),末速度差之和為1 577.6,未出現(xiàn)軌跡交叉。該最優(yōu)分配方案對(duì)應(yīng)的三維軌跡圖如圖2所示,從圖2 中也可以看出,對(duì)每個(gè)目標(biāo),均有2發(fā)導(dǎo)彈對(duì)其攻擊,且攔截點(diǎn)有一定距離,故軌跡未出現(xiàn)交叉。
表3 不同分配均勻度對(duì)應(yīng)的最優(yōu)化方案(當(dāng)Lmin=1時(shí))Tab.3 Optimum schemes for different maximum assigned missiles for a single target(when Lmin=1)
圖2 L=2時(shí)的最優(yōu)分配方案(未出現(xiàn)軌跡交叉)Fig.2 Optimum assignment scheme for L=2(No trajectory intersection occurs)
對(duì)于L=3,最優(yōu)分配方案為[2,1,1,3,5,1,3,2,2,4],經(jīng)判斷,導(dǎo)彈M1和M8在攻擊T2時(shí)出現(xiàn)了軌跡交叉。該最優(yōu)分配方案對(duì)應(yīng)的三維軌跡圖如圖3所示,從圖3 中也可以看出,對(duì)于目標(biāo)T2,有3 發(fā)導(dǎo)彈對(duì)其攻擊,且攔截點(diǎn)幾乎重疊,這導(dǎo)致了飛行末段出現(xiàn)軌跡交叉。因此,該方案不可行,根據(jù)2.5 節(jié)的方法,令其中一條末速度差較低的軌跡為攔截失敗即可,即該軌跡的末速度差取為0。由表2 可知,ΔV12=ΔV82=173.3 m/s,故隨機(jī)選擇其中一條軌跡,假設(shè)ΔV12=0,得到表4,利用優(yōu)化算法,得到新的最優(yōu)分配策略為[3,1,1,3,5,1,2,2,2,4],經(jīng)檢驗(yàn),此方案未出現(xiàn)軌跡交叉。該最優(yōu)分配方案對(duì)應(yīng)的三維軌跡圖如圖4所示,從圖4 中也可以看出,對(duì)于目標(biāo)T2,有3 發(fā)導(dǎo)彈對(duì)其攻擊,且攔截點(diǎn)相互錯(cuò)開一定距離,未出現(xiàn)軌跡交叉,可作為L(zhǎng)=3 時(shí)最優(yōu)分配方案。
圖3 L=3時(shí)的最優(yōu)分配方案(出現(xiàn)軌跡交叉)Fig.3 Optimum assignment scheme for L=3(Trajectory intersection occurs)
圖4 L=3(改)時(shí)的最優(yōu)分配方案(未出現(xiàn)軌跡交叉)Fig.4 Optimum assignment scheme for L=3 with modified final speed gap matrix(No trajectory intersection occurs)
表4 修改后的遍歷末速度差表(*表示修改的)Tab.4 Modified final speed gap matrix for all pairwise combinations(where*means the modified value)m/s
為了說明本文方法的有效性,本文對(duì)比了文獻(xiàn)[21]在武器目標(biāo)分配問題中采用的遺傳算法,其中遺傳算法按照實(shí)數(shù)編碼,編碼共10位,取1到5之間的整數(shù),如表5中的最優(yōu)分配結(jié)果的形式(2254513314表示一個(gè)染色體編碼),非線性約束條件為10 個(gè)編碼位取值1 到5 的次數(shù)均應(yīng)介于[Lmin,L]。算例運(yùn)算均在Intel Core i5 2.3GHz 的計(jì)算機(jī)上實(shí)現(xiàn),優(yōu)化結(jié)果及用時(shí)如表5所示。
由表5 可知,采取文獻(xiàn)[21]的遺傳算法建模求解該問題,隨機(jī)運(yùn)行5次,優(yōu)化的平均用時(shí)達(dá)到3 s以上,且只有第5 次的結(jié)果達(dá)到了最優(yōu)解,其余4 次均為滿意解。本文方法隨機(jī)運(yùn)行了3 次,每次都能夠精確找到最優(yōu)解,且用時(shí)均不超過20 ms,能夠滿足實(shí)時(shí)性要求。顯然,無論從解的精度、還是實(shí)時(shí)性要求上,本文方法均優(yōu)于文獻(xiàn)[21]的遺傳算法。
表5 不同算法的比較(當(dāng)Lmin=1且L=2時(shí))Tab.5 Comparison results of different methods(when Lmin=1 and L=2)
幾點(diǎn)說明:
1)關(guān)于分配均勻度L的選擇。筆者認(rèn)為,分配均勻度不宜過大,盡管分配均勻度為3時(shí),可以得到更大的末速度差之和(如表3所示),但是,L取值過大可能導(dǎo)致以下問題:一方面,可能出現(xiàn)多個(gè)導(dǎo)彈被分配打擊同一個(gè)目標(biāo)的情況,增大了發(fā)生軌跡交叉的概率,如L=3 和4 時(shí),均出現(xiàn)了軌跡交叉;另一方面,會(huì)導(dǎo)致更多的目標(biāo)只能被分配到1 枚導(dǎo)彈,這樣勢(shì)必帶來命中概率降低的問題,如表3 中,當(dāng)L=4 時(shí)目標(biāo)T3和T5均只有1 枚導(dǎo)彈對(duì)其實(shí)施攻擊,成功概率將會(huì)低于兩發(fā)導(dǎo)彈同時(shí)對(duì)其攻擊的情況(如L=2 的最優(yōu)方案)。故建議分配均勻度取值介于和之間,其中表示比該值大的最小整數(shù),表示比該值小的最大整數(shù)。如表6所示,按此分配均勻度設(shè)計(jì),可保證每個(gè)目標(biāo)分配到數(shù)量接近的導(dǎo)彈數(shù),從而保證對(duì)目標(biāo)集群的最大毀傷概率。
表6 分配均勻度的優(yōu)化設(shè)計(jì)Tab.6 Optimum design of maximum assigned missiles for a single target
2)關(guān)于目標(biāo)威脅權(quán)重不同的情況。對(duì)于集群中威脅度高的目標(biāo),應(yīng)分配更多的導(dǎo)彈。對(duì)于這類問題,可以通過修改模型公式(22),通過增加設(shè)定一個(gè)約束條件(其中,J為需要指定攻擊導(dǎo)彈數(shù)量的目標(biāo)序號(hào),LJ為針對(duì)目標(biāo)J指定的分配導(dǎo)彈數(shù)量),以保證對(duì)威脅度高的目標(biāo)具有更高摧毀概率。
本文設(shè)計(jì)了一種面向集群對(duì)抗的多導(dǎo)彈協(xié)同目標(biāo)分配方法。將該問題轉(zhuǎn)化為一個(gè)帶約束的非平衡任務(wù)優(yōu)化分配問題,其中的約束主要包括目標(biāo)分配方案可能出現(xiàn)的軌跡交叉、過載約束、導(dǎo)彈飛行時(shí)間約束、分配均勻度約束等。通過仿真分析可知,本文方法能夠有效進(jìn)行目標(biāo)分配,實(shí)現(xiàn)對(duì)目標(biāo)集群打擊效率的最大化。案例部分對(duì)比了不同分配均勻度下的最優(yōu)方案,并據(jù)此提出了分配均勻度L的選擇建議,同時(shí),對(duì)目標(biāo)威脅權(quán)重不同的情況如何優(yōu)化分配進(jìn)行了說明。
本文算法假定目標(biāo)始終勻速運(yùn)動(dòng),未考慮目標(biāo)的機(jī)動(dòng),同時(shí),由于比例導(dǎo)引法無法解析計(jì)算末速度,需用仿真方法求得,而仿真需要消耗較大的計(jì)算量,是整個(gè)分配優(yōu)化算法的計(jì)算瓶頸。針對(duì)以上問題的改進(jìn),是下一步的研究重點(diǎn)。