王宇琦, 張 安, 畢文豪
(西北工業(yè)大學,西安 710086)
有人/無人機編隊協(xié)同打擊地面時敏目標(TCT)是指將有人機作為編隊中的指揮機,將無人機(UAV)作為攻擊機,兩者通過數(shù)據(jù)鏈支持協(xié)同完成作戰(zhàn)任務(wù)。有人/無人機編隊協(xié)同任務(wù)分配的目的是在滿足各項戰(zhàn)術(shù)和技術(shù)指標的前提下,將不同的任務(wù)合理地分配給UAV,使得整個編隊的作戰(zhàn)效能最好[1-2]。近年來,國內(nèi)外針對協(xié)同作戰(zhàn)的任務(wù)分配進行了很多研究,特別是以遺傳算法為代表的智能算法得到廣泛應(yīng)用[3]。例如,文獻[3]對多UAV打擊TCT的任務(wù)進行了研究并利用變長度染色體整數(shù)編碼遺傳算法進行了仿真驗證。但相關(guān)文獻中的部分分配算法模型存在著模型約束條件簡單以及只限于單類型任務(wù)等問題。因此,本文針對有人/無人機打擊地面TCT協(xié)同任務(wù)分配問題的特點,采用一種矩陣型編碼遺傳算法,在考慮了TCT的時間約束和時序約束影響的同時,能夠解決多類型任務(wù)的分配。
在有人機和多架無人機協(xié)同打擊地面TCT任務(wù)中[4-5],當有人機通過機載傳感器獲取了需要打擊的TCT信息或接到了上級作戰(zhàn)指令后,有人機飛行員基于專家經(jīng)驗將編隊作戰(zhàn)任務(wù)進行分解,根據(jù)編隊內(nèi)各UAV執(zhí)行任務(wù)的能力進行任務(wù)分配,形成任務(wù)分配方案。隨后有人機向各UAV發(fā)布作戰(zhàn)指令,各UAV接收作戰(zhàn)指令后立即執(zhí)行任務(wù)。在任務(wù)執(zhí)行過程中,UAV通過各自的機載傳感器感知戰(zhàn)場態(tài)勢[6],向有人機回傳任務(wù)、態(tài)勢信息等,接收有人機的指令,同時與其他UAV相互通信和協(xié)同,共同完成編隊任務(wù)[7]。圖1所示為有人/無人機編隊協(xié)同對地TCT打擊任務(wù)分配框架。
圖1 有人/無人機編隊協(xié)同對地TCT打擊任務(wù)分配框架
(1)
UAV任務(wù)分配的結(jié)果即為每架UAV分配一個有先后順序的任務(wù)執(zhí)行序列,第j架UAV的任務(wù)序列可表示為
(2)
式中,lj為第j架UAV中所含的子任務(wù)總數(shù)。
本文中,TCT的初始價值由有人機按照作戰(zhàn)意圖和戰(zhàn)場態(tài)勢進行事先設(shè)定,在任務(wù)執(zhí)行過程中TCT的價值隨著時間變化而呈現(xiàn)出相應(yīng)的變化。
(3)
任務(wù)收益模型分為偵察任務(wù)、打擊任務(wù)和評估任務(wù)3部分,因此任務(wù)分配收益模型為
(4)
1) 時間約束。
任務(wù)時間約束是指對第i個TCT的打擊任務(wù)必須在其限定的時間窗口內(nèi)完成。本文中,假設(shè)已得知TCT的任務(wù)時間窗口[8]。
2) 時序約束。
本文中,偵察任務(wù)C完成后可執(zhí)行打擊任務(wù)A,打擊任務(wù)執(zhí)行完后可執(zhí)行評估任務(wù)V。可表示為
(5)
(6)
3) UAV任務(wù)約束。
① 1個子任務(wù)只能分配給1架UAV,每個子任務(wù)都要被執(zhí)行。因此約束條件可表示為
(7)
② 假設(shè)在整個作戰(zhàn)過程中每架UAV的任務(wù)序列中最多針對兩個目標執(zhí)行任務(wù),此即UAV的任務(wù)能力。
4) 航路約束。
設(shè)在作戰(zhàn)區(qū)域中有NP個圓形威脅區(qū),用P表示威脅區(qū)集合,則P={P1,P2,…,PNP}。各UAV的航路需避開這些威脅區(qū),即
Path(Vj)∩P=?j=1,2,…,n。
(8)
假設(shè)Vj要完成Ti上的偵察任務(wù),圖2中,線段1,4分別是過UAV做威脅圓的切線,線段3是過目標點做威脅圓的切線,圓弧段2是威脅圓上的一段。由于β<α,則其航路預估長度為
l=l1+l2+l3
(9)
圖2 航路預估方法示意圖Fig.2 Schematic diagram of route estimation method
時序約束在打擊TCT多任務(wù)規(guī)劃中非常重要,而在處理有時序約束的多任務(wù)分配過程中,不可避免會碰到死鎖問題。死鎖有多種形式,主要可分為自鎖死和互鎖死。本文中,在得到一個染色體編碼后,通過調(diào)整染色體中同一架UAV的基因順序使它們按照C,A,V的順序排列來解決死鎖問題。如圖3所示,V2自鎖死,因為它在目標2上的C任務(wù)應(yīng)早于A任務(wù)被執(zhí)行,調(diào)整兩個基因的順序使得染色體不再死鎖。
圖3 死鎖染色體及其解鎖Fig.3 Deadlock chromosome and its unlocking
基于矩陣型GA任務(wù)分配的過程如下。
1) 構(gòu)造一個3×NT維的矩陣型染色體,NT為任務(wù)數(shù)量,NT=3m,m為TCT數(shù)量。由NT個這樣的基因構(gòu)成一個矩陣染色體,編碼如圖4所示,這樣的一個染色體對應(yīng)一個完整的任務(wù)分配方案。n個UAV被分配去執(zhí)行任務(wù),它們的序號在矩陣染色體中從小到大排列,即V1 TV11…TV1l1TV21…TV2l2…TVn1…TVnlnkV11…kV1l1kV21…kV2l2…kVn1…kVnlnV1…V1V2…V2…Vn…Vn 圖4 染色體編碼方式 Fig.4 Chromosome encoding method 2) 根據(jù)有人/無人機打擊TCT的任務(wù)分配數(shù)學模型,適應(yīng)度函數(shù)如式(4)所示,計算種群中每個染色體所對應(yīng)的適應(yīng)度值。 3) 使用輪盤賭方法對種群進行選擇操作,并使用精英保留策略,保留當代種群中適應(yīng)度最高的多個染色體。 4) 采用單點交叉及單點變異對種群中的染色體進行交叉及變異操作。 5) 判斷是否滿足算法結(jié)束條件,若滿足則退出循環(huán),否則轉(zhuǎn)向2)。 假定作戰(zhàn)區(qū)域為100 km×100 km,1架有人機與6架UAV組成作戰(zhàn)編隊,在作戰(zhàn)區(qū)域內(nèi)分布著2個疑似TCT,位置分別為(300 km,80 km),(75 km,90 km),目標價值分別為40,30,3個威脅點分別為(20 km,45 km),(50 km,55 km)和(85 km,60 km)。6架UAV初始航向為正北,飛行高度為6 km,速度恒定為50 m/s,初始位置見表1。兩個TCT的時間窗分別為[0 min,25 min],[0 min,30 min],設(shè)時間窗內(nèi)TCT是靜止的。UAV執(zhí)行攻擊目標1,2的任務(wù)概率信息見表2。 表1 UAV初始位置 表2 UAV執(zhí)行攻擊目標1,2的任務(wù)概率信息 遺傳算法的基本參數(shù)設(shè)定:遺傳代數(shù)為200,交叉概率為0.8,變異概率為0.1。經(jīng)過基于矩陣型遺傳算法的任務(wù)分配后得到的結(jié)果如圖5所示。 圖5 任務(wù)分配結(jié)果示意圖Fig.5 Task assignment results 根據(jù)圖5可以發(fā)現(xiàn),本文所提算法滿足UAV打擊TCT的任務(wù)規(guī)劃要求。通過本文所提算法的計算,得出與TCT1的交戰(zhàn)時間為1400 s,即23.3 min,與TCT2的交戰(zhàn)時間為1687 s,即28.1 min。23.3 min<25 min,28.1 min<30 min,即任務(wù)分配結(jié)果滿足戰(zhàn)場上TCT的時間窗口要求。 本文從不同迭代次數(shù)中各染色體對應(yīng)的整個任務(wù)交戰(zhàn)收益來分析遺傳算法的收斂性能。根據(jù)作戰(zhàn)想定仿真,可得到染色體在迭代過程中的最佳適應(yīng)度值隨著迭代次數(shù)的變化曲線,如圖6所示。可以看出,隨著迭代次數(shù)的增加,仿真中任務(wù)收益明顯增大。當?shù)螖?shù)在60左右時,整體任務(wù)收益最大,得到最優(yōu)分配方案。 圖6 基于矩陣型遺傳算法收斂性 協(xié)同任務(wù)分配是有人/無人機編隊協(xié)同作戰(zhàn)的關(guān)鍵技術(shù)之一,任務(wù)分配的合理性很大程度上決定協(xié)同作戰(zhàn)的成敗。本文通過分析有人/無人機編隊的作戰(zhàn)過程,建立了編隊系統(tǒng)的總體框架;然后引入時敏特性函數(shù),以任務(wù)分配收益最大為評估指標建立了有人/無人機編隊打擊地面時敏目標的任務(wù)分配模型;最后提出了一種基于矩陣型編碼方式的遺傳算法對任務(wù)分配模型進行仿真驗證。仿真結(jié)果表明,本文所提算法合理有效,能夠很好地滿足要求。4 仿真驗證
5 結(jié)論