陳 俠,喬艷芝
(沈陽(yáng)航空航天大學(xué),沈陽(yáng) 110136)
多機(jī)協(xié)同指的是多架無(wú)人機(jī)通過(guò)相互配合、協(xié)作的作戰(zhàn)方式執(zhí)行任務(wù)[1],具有同時(shí)攻擊多個(gè)敵方目標(biāo)和能提高殺傷概率的優(yōu)點(diǎn)。在多無(wú)人機(jī)執(zhí)行任務(wù)的過(guò)程中,無(wú)人機(jī)之間的妥善協(xié)調(diào)問(wèn)題是其可否成功完成任務(wù)的重要因素之一[2]。通過(guò)選擇合理的決策策略使得多無(wú)人機(jī)之間相互協(xié)調(diào)完成復(fù)雜的任務(wù),目前是無(wú)人機(jī)領(lǐng)域研究的熱點(diǎn)問(wèn)題[3]。近十多年來(lái),這方面的研究已經(jīng)取得了一些成果[4-11]。文獻(xiàn)[4]以雙層規(guī)劃為基礎(chǔ),提出了無(wú)人機(jī)協(xié)同攻擊目標(biāo)分配模型;文獻(xiàn)[5]對(duì)環(huán)境中威脅的描述比較簡(jiǎn)單,但是考慮了飛機(jī)能力的裕度約束,從而建立了多無(wú)人機(jī)任務(wù)分配模型;文獻(xiàn)[6]在多機(jī)任務(wù)協(xié)調(diào)問(wèn)題中引入了買(mǎi)賣(mài)合同機(jī)制。雖然關(guān)于多無(wú)人機(jī)協(xié)同任務(wù)分配的研究已經(jīng)取得了一些研究成果,但在已有的文獻(xiàn)中,建立的多機(jī)協(xié)同任務(wù)分配模型沒(méi)有考慮多無(wú)人機(jī)協(xié)同打擊的能力問(wèn)題,也沒(méi)有考慮目標(biāo)需要獲得被打擊的能力值問(wèn)題,計(jì)算航程代價(jià)均考慮始發(fā)點(diǎn)與目標(biāo)點(diǎn)之間的航程,并沒(méi)有考慮無(wú)人機(jī)發(fā)射導(dǎo)彈的航程,建立的多無(wú)人機(jī)作戰(zhàn)模型還不是很完善。而在多機(jī)器人任務(wù)分配中,考慮機(jī)器人能力函數(shù)的研究成果吸引了越來(lái)越多學(xué)者的關(guān)注[12-13],文獻(xiàn)[12]將效用函數(shù)應(yīng)用于多機(jī)器人系統(tǒng)任務(wù)分配策略中;文獻(xiàn)[13]提出了一種基于機(jī)器人效用函數(shù)的多機(jī)器人系統(tǒng)任務(wù)分配新方法。但迄今為止,關(guān)于多無(wú)人機(jī)協(xié)同打擊能力的任務(wù)分配問(wèn)題尚無(wú)文獻(xiàn)報(bào)道。本文通過(guò)建立無(wú)人機(jī)的能力函數(shù)及其雅可比矩陣,給出了多無(wú)人機(jī)協(xié)同打擊位置和無(wú)人機(jī)俯仰角的計(jì)算方法,提出了多無(wú)人機(jī)協(xié)同打擊任務(wù)的動(dòng)態(tài)任務(wù)分配方法,仿真結(jié)果表明:考慮多無(wú)人機(jī)協(xié)同打擊能力的任務(wù)分配與未考慮的分配方案相比,可獲得更大的目標(biāo)收益值,提高了多無(wú)人機(jī)協(xié)同打擊能力。
能力函數(shù)指的是根據(jù)無(wú)人機(jī)所執(zhí)行任務(wù)的主要要求和形式對(duì)目標(biāo)釋放的能量建立的具體量化函數(shù)。在無(wú)人機(jī)執(zhí)行偵察和攻擊任務(wù)時(shí),為了最大可能地發(fā)揮作用,無(wú)人機(jī)與目標(biāo)之間的距離、方位和所攜帶武器的發(fā)射距離、方位等都需要重點(diǎn)考慮。所以,建立的能力函數(shù)與距離和方位等因素都有關(guān)系,將單無(wú)人機(jī)的能力函數(shù)相加就是群無(wú)人機(jī)的能力函數(shù)。為方便計(jì)算,只考慮無(wú)人機(jī)與目標(biāo)點(diǎn)之間的距離和角度兩個(gè)因素,當(dāng)無(wú)人機(jī)與目標(biāo)點(diǎn)的距離和角度都滿(mǎn)足要求時(shí),無(wú)人機(jī)就能釋放最大的能力。將無(wú)人機(jī)的位置信息和目標(biāo)點(diǎn)信息分別存儲(chǔ)在n×3和m×3矩陣中,n和m分別為無(wú)人機(jī)和目標(biāo)的數(shù)量。無(wú)人機(jī)與目標(biāo)的初始位置矩陣為
(1)
無(wú)人機(jī)i與目標(biāo)j的距離dij描述為
(2)
如圖1所示,建立地面坐標(biāo)系,坐標(biāo)原點(diǎn)為O,U為無(wú)人機(jī),U′為無(wú)人機(jī)在XOY平面的投影,T為目標(biāo),無(wú)人機(jī)的視線(xiàn)和U′與目標(biāo)連線(xiàn)的夾角θij(俯仰角)描述為[14]
(3)
假定能力函數(shù)的最大值為1,目標(biāo)j獲得無(wú)人機(jī)的能力函數(shù)Bi為
(4)
圖1 空戰(zhàn)態(tài)勢(shì)圖Fig.1 Air combat situation
以下兩個(gè)方面的因素是進(jìn)行多無(wú)人機(jī)任務(wù)分配時(shí)需要重點(diǎn)考慮的:1)在攻擊敵方目標(biāo)的過(guò)程中我方付出的代價(jià),我方代價(jià)由被對(duì)方防空火力系統(tǒng)攻擊所受到的毀傷代價(jià)和攻擊目標(biāo)時(shí)我方的燃油代價(jià)兩部分組成;2)作戰(zhàn)時(shí)對(duì)敵方目標(biāo)的整體打擊和毀傷效果。
目標(biāo)價(jià)值收益是指我方無(wú)人機(jī)攻擊敵方目標(biāo)對(duì)敵方目標(biāo)造成的損耗。令無(wú)人機(jī)對(duì)目標(biāo)的殺傷概率矩陣為P=[P1P2…Pm],第i架無(wú)人機(jī)對(duì)目標(biāo)的殺傷概率為
Pi=1-(1-ηi)ni
(5)
式中:ηi為第i架無(wú)人機(jī)對(duì)目標(biāo)的單發(fā)命中概率,且無(wú)人機(jī)對(duì)目標(biāo)打擊是相互獨(dú)立的事件;ni為第i架無(wú)人機(jī)攜帶的武器數(shù)。則第i架無(wú)人機(jī)攻擊第j個(gè)目標(biāo)時(shí)所產(chǎn)生的期望價(jià)值為
(6)
(7)
(8)
式中:dij為無(wú)人機(jī)i與目標(biāo)j的距離;e為敵方防空火力的有效射程;θ∈[0,1]是當(dāng)敵方防空火力與無(wú)人機(jī)接觸時(shí)摧毀無(wú)人機(jī)的效能。在作戰(zhàn)過(guò)程中,無(wú)人機(jī)受到來(lái)自敵方防空火力的攻擊,該無(wú)人機(jī)總的毀傷代價(jià)損失為
(9)
無(wú)人機(jī)執(zhí)行任務(wù)的航程代價(jià)與無(wú)人機(jī)執(zhí)行任務(wù)期間飛行的路徑有正相關(guān)的關(guān)系,則航程代價(jià)可表示為
(10)
式中:di為無(wú)人機(jī)i實(shí)際飛行的航程,即無(wú)人機(jī)i初始位置與打擊位置之間的距離;dmax為所有無(wú)人機(jī)i中實(shí)際飛行的最大航程。
已知無(wú)人機(jī)的初始位置和目標(biāo)的位置后,就可將無(wú)人機(jī)在空中任意一點(diǎn)的能力量化,從而計(jì)算多無(wú)人機(jī)協(xié)同打擊能力的決策位置和角度,計(jì)算各個(gè)方案總體目標(biāo)收益函數(shù),實(shí)現(xiàn)最優(yōu)分配。
雅可比矩陣可以將無(wú)人機(jī)的運(yùn)動(dòng)變化和能力函數(shù)聯(lián)系起來(lái),能力函數(shù)的雅可比矩陣可表示為
(11)
目標(biāo)j獲得的能力函數(shù)Bi相對(duì)于無(wú)人機(jī)i的坐標(biāo)偏導(dǎo)數(shù)為
(12)
(13)
(14)
(15)
(16)
(17)
能力函數(shù)由無(wú)人機(jī)的位置和角度決定,能力函數(shù)的變化與位置和角度的關(guān)系為
(18)
(19)
J+=JT(JJT)-1
(20)
(21)
(22)
多無(wú)人機(jī)任務(wù)分配模型的總體目標(biāo)函數(shù)可表示為
J=max(w1R-w2C1-w3C2)
(23)
s.t.
(24)
(25)
w1+w2+w3=1
(26)
式中:w1為價(jià)值收益指標(biāo);w2為毀傷代價(jià)權(quán)重;w3為航程代價(jià)指標(biāo)權(quán)重。式(24)要求每架無(wú)人機(jī)每次最多分配給一個(gè)目標(biāo),式(25)要求最多h架無(wú)人機(jī)協(xié)同打擊一個(gè)目標(biāo)。
4架無(wú)人機(jī)攻擊2個(gè)目標(biāo),有6種方案,如表1所示。
表1 分配方案Table 1 Allocation plan
表1中,方案1的分配矩陣為[1 2 3 4],表示第1架和第2架無(wú)人機(jī)攻擊目標(biāo)1,第3架和第4架無(wú)人機(jī)攻擊目標(biāo)2。以下方案類(lèi)似。
假設(shè)無(wú)人機(jī)的雷達(dá)掃描半徑為4.5 km,不考慮導(dǎo)彈速度的前提下,當(dāng)無(wú)人機(jī)與目標(biāo)的位置距離為4.5 km,且無(wú)人機(jī)與目標(biāo)的夾角φi為90°時(shí),無(wú)人機(jī)具有最大的打擊能力,在其他位置,距離越靠近4.5 km,夾角越靠近90°時(shí),打擊能力越大。
下面采用3種方法給出多無(wú)人機(jī)分配方案。
方法1通過(guò)式(21)更新無(wú)人機(jī)的位置,通過(guò)式(4)計(jì)算出多無(wú)人機(jī)協(xié)同打擊位置能力值,然后分別通過(guò)式(6)、式(9)和式(10)計(jì)算目標(biāo)價(jià)值收益、毀傷代價(jià)和航程代價(jià),最后通過(guò)式(23)分別計(jì)算各個(gè)方案的收益值,最終得到各個(gè)方案收益值如表2所示。
表2 方法1的分配方案收益值Table 2 Revenue value of the allocation scheme of Method 1
通過(guò)表2可以看出,方案1的收益值最大,即第1架和第2架無(wú)人機(jī)攻擊目標(biāo)1,第3架和第4架無(wú)人機(jī)攻擊目標(biāo)2。目標(biāo)1被打擊的能力值見(jiàn)圖2,目標(biāo)2被打擊的能力值見(jiàn)圖3。
圖2 目標(biāo)1被打擊的能力值Fig.2 The strike capability for Object 1
圖3 目標(biāo)2被打擊的能力值Fig.3 The strike capability for Object 2
方法2通過(guò)式(21)更新無(wú)人機(jī)的角度,通過(guò)式(4)計(jì)算出多無(wú)人機(jī)協(xié)同打擊角度能力值,然后分別通過(guò)式(6)、式(9)和式(10)計(jì)算目標(biāo)價(jià)值收益、毀傷代價(jià)和航程代價(jià),最后通過(guò)式(23)分別計(jì)算各個(gè)方案的收益值,最終得到各個(gè)方案收益值如表3所示。
表3 方法2的分配方案收益值Table 3 Revenue value of the allocation scheme of Method 2
通過(guò)表3可以看出,方案1的收益值最大,即第1架和第2架無(wú)人機(jī)攻擊目標(biāo)1,第3架和第4架無(wú)人機(jī)攻擊目標(biāo)2。
方法3以往多無(wú)人機(jī)任務(wù)分配方法[15]沒(méi)有考慮多無(wú)人機(jī)打擊位置能力函數(shù),也沒(méi)有考慮目標(biāo)需要獲得的能力值。按式(23)模型,得到各個(gè)方案收益值如表4所示。
表4 方法3的分配方案收益值Table 4 Revenue value of the allocation scheme of Method 3
第4種方案收益值最大,收益值為1.323 4,即第2架和第3架無(wú)人機(jī)攻擊目標(biāo)1,第1架和第4架無(wú)人機(jī)攻擊目標(biāo)2。
將表2、表3分別與表4對(duì)比可以看出:1) 方法1和方法2考慮了多無(wú)人機(jī)的協(xié)同打擊能力函數(shù);2) 方法1和方法3、方法2和方法3的決策結(jié)果完全不同;3) 方法1的收益和方法2的收益均比方法3的收益大,即方法1的最大收益為1.620 3,方法2的最大收益為1.682 0,而方法3的最大收益為1.323 4。因此,可以得出結(jié)論:在多無(wú)人機(jī)協(xié)同打擊任務(wù)分配中,考慮能力函數(shù)與未考慮的分配方案相比,可獲得更大的目標(biāo)收益值,提高了多無(wú)人機(jī)協(xié)同打擊能力。
通過(guò)建立無(wú)人機(jī)的能力函數(shù)及其雅可比矩陣,給出了多無(wú)人機(jī)協(xié)同打擊位置和角度的計(jì)算方法,建立了多無(wú)人機(jī)協(xié)同打擊任務(wù)分配模型,仿真結(jié)果表明:考慮多無(wú)人機(jī)協(xié)同打擊能力的任務(wù)分配與未考慮的分配方案相比,可獲得更大的目標(biāo)收益值和毀傷效能,提高多無(wú)人機(jī)協(xié)同打擊能力,是多無(wú)人機(jī)協(xié)同作戰(zhàn)任務(wù)分配的一種技術(shù)探索嘗試。
參考文獻(xiàn)
[1] 付昭旺,寇英信,黃文卿,等.多機(jī)協(xié)同空戰(zhàn)火力控制研究[J].電光與控制,2010,17(9):5-8.
[2] JOHNSON L B,PONDA S S,CHOI H L,et al.Asynchronous decentralized task allocation for dynamic environments[C]//Proceedings of the AIAA Infotech@Aerospace Conference,2011.doi:10.2514/6.2011-1441.
[3] 龍濤,沈林成,朱華勇,等.面向協(xié)同任務(wù)的多UCAV分布式任務(wù)分配與協(xié)調(diào)技術(shù)[J].自動(dòng)化學(xué)報(bào),2007,33(7):731-737.
[4] 劉毅,李為民,邢清華,等.基于雙層規(guī)劃的攻擊無(wú)人機(jī)協(xié)同目標(biāo)分配優(yōu)化[J].系統(tǒng)工程與電子技術(shù),2010,32(3):579-584.
[5] 魏鐵濤,屈香菊.多機(jī)協(xié)同與多目標(biāo)分配任務(wù)規(guī)劃方法[J].北京航空航天大學(xué)學(xué)報(bào),2009,35(8):917-920.
[6] 杜繼永,張鳳鳴,楊驥,等.多UCAV協(xié)同任務(wù)分配模型及粒子群算法求解[J].控制與決策,2012,27(11):1751-1755.
[7] 陳俠,胡永新,徐光延.面向多無(wú)人機(jī)任務(wù)分配的二維編碼粒子群算法[J].系統(tǒng)仿真學(xué)報(bào),2013,25(12):3045-3049.
[8] O′ROURKE K P,CARLTON W B,BAILEY T G,et al.Dynamic routing of unmanned aerial vehicles using reactive tabu search[J].Military Operations Research,2001, 6(1):5-30.
[9] HARDER R W.A Java universal vehicle router in support of routing unmanned aerial vehicles air missions[D].Ohio:Air Force Institute of Technology,2000.
[10] NYGARD K E,CHANDLER P R,PACHTER M.Dyna-mic network flow optimization models for air vehicle resource allocation[C]//Proceedings of the American Control Conference,Arlington,Texas,2001:1853-1856.
[11]ALIGHANBARI M.Task assignment algorithms for teams of UAVs in dynamic environments[D].Cambridge:Massachusetts Institute of Technology,2004.
[12] 黎萍,楊宜民,練家樂(lè).基于效用函數(shù)的多機(jī)器人系統(tǒng)任務(wù)分配[J].計(jì)算機(jī)應(yīng)用研究,2009,26(2):537-539.
[13] 陳建平,苑召?lài)?guó),楊宜民.基于機(jī)器人效用函數(shù)的多機(jī)器人系統(tǒng)任務(wù)分配[J].計(jì)算機(jī)應(yīng)用研究,2010,27(4):1339-1341.
[14] 李望西,黃長(zhǎng)強(qiáng),王勇.三維空間空戰(zhàn)態(tài)勢(shì)評(píng)估角度優(yōu)勢(shì)建模與仿真[J].電光與控制,2012,19(2):21-25.
[15] GIANLUCA A,STEFANO C,ALESSANDRO M.Decen-tralized deployment with obstacle avoidance for UAVs[C]//Proceedings of the 18th IFAC World Congress, Italy,2011:12807-12812.