李 兵, 劉正敏, 趙新路
(四川航天系統(tǒng)工程研究所, 四川 成都 610100)
美國戰(zhàn)略與預(yù)算評估中心2007年發(fā)布的《制導(dǎo)彈藥與作戰(zhàn)網(wǎng)絡(luò)》[1]研究報(bào)告中明確指出,現(xiàn)裝備的制導(dǎo)彈藥對于大多數(shù)目標(biāo)的精確打擊問題已基本解決,但對于面目標(biāo),時(shí)間敏感和加固或深埋目標(biāo)的攻擊仍然是挑戰(zhàn)。巡飛彈具有傳統(tǒng)制導(dǎo)彈藥所不能實(shí)現(xiàn)的一些功能,如攻擊反斜面的洞內(nèi)目標(biāo);在目標(biāo)隱藏區(qū)域上盤旋監(jiān)視與封鎖;偵察并打擊在崎嶇道路上運(yùn)動(dòng)的目標(biāo)等[2]。陸戰(zhàn)場上可以深入敵方腹地,有選擇性地打擊高價(jià)值目標(biāo)和時(shí)間敏感目標(biāo),適應(yīng)城區(qū)作戰(zhàn)、山區(qū)作戰(zhàn)等不確定環(huán)境作戰(zhàn)條件,以較小的投入換取較大的戰(zhàn)場效益,是活躍在陸軍信息化戰(zhàn)場上的“幽靈”,擔(dān)負(fù)陸軍戰(zhàn)術(shù)縱深內(nèi)的點(diǎn)目標(biāo)精確打擊和任務(wù)地域協(xié)同封控等作戰(zhàn)任務(wù),不僅可以彌補(bǔ)傳統(tǒng)炮兵彈道投送火力對時(shí)敏目標(biāo)、活動(dòng)目標(biāo)、有遮蔽目標(biāo)等類型目標(biāo)打擊能力的不足,而且通過偵察、打擊、評估的一體化,可大幅提高對敵火力打擊的綜合作戰(zhàn)效能[3]。
隨著集群技術(shù)的進(jìn)一步發(fā)展,通過巡飛彈群的自組網(wǎng),實(shí)現(xiàn)網(wǎng)絡(luò)化協(xié)同作戰(zhàn),能夠?qū)崿F(xiàn)全覆蓋地毯式的封控壓制和毀傷攻擊,火力打擊變化表現(xiàn)為,發(fā)射前瞄準(zhǔn)或鎖定的對象從目標(biāo)變?yōu)閰^(qū)域,每次發(fā)射的效果從瞬間釋能轉(zhuǎn)變?yōu)檫B續(xù)封控與瞬間釋能復(fù)合,火力打擊方式變化產(chǎn)生“時(shí)空壓制”新質(zhì)能力,形成新的群蜂作戰(zhàn)樣式[4]。
作戰(zhàn)任務(wù)的實(shí)現(xiàn)需要建立在對任務(wù)科學(xué)合理的管理基礎(chǔ)上,這也是動(dòng)態(tài)資源管理研究的出發(fā)點(diǎn)。實(shí)際應(yīng)用中,戰(zhàn)場環(huán)境的不可預(yù)測性、攻防雙方的對抗性、目標(biāo)信息的時(shí)變性等不確定因素,要求在實(shí)施作戰(zhàn)過程中,根據(jù)作戰(zhàn)任務(wù)使命,要在考慮對方所有可能的策略的基礎(chǔ)之上選擇有利于己方的策略,實(shí)現(xiàn)實(shí)時(shí)的最大作戰(zhàn)效能。關(guān)于動(dòng)態(tài)資源管理當(dāng)前通用的做法是將目標(biāo)抽象為多目標(biāo)組合優(yōu)化問題,Schumacher等為實(shí)現(xiàn)多無人機(jī)協(xié)同決策問題,利用網(wǎng)絡(luò)流模型,以多無人機(jī)總的航跡最短為目標(biāo),面向具體的使命任務(wù)實(shí)現(xiàn)高效的協(xié)同任務(wù)分配[5]。文獻(xiàn)[6-8]以無人機(jī)集群OODA(observation,orientation,decision,action)自閉環(huán)為作戰(zhàn)任務(wù),研究了無人機(jī)集群和目標(biāo)規(guī)模不匹配問題,重點(diǎn)研究了集群規(guī)模大于目標(biāo)數(shù)目飽和打擊問題,利用最優(yōu)化方法給出了協(xié)同決策最優(yōu)任務(wù)匹配。文獻(xiàn)[9]在研究動(dòng)態(tài)目標(biāo)分配問題時(shí),以全局航行距離最短為目標(biāo),以O(shè)ODA自閉環(huán)典型任務(wù)場景下,建立了動(dòng)態(tài)任務(wù)分配模型,利用智能優(yōu)化方法實(shí)現(xiàn)了任務(wù)分配。Marjorie等[10-11]在集中式任務(wù)分配問題中,利用遺傳算法實(shí)現(xiàn)了巡飛彈群集中式協(xié)同任務(wù)分配。在分布式任務(wù)分配研究過程中,Wang等[12]采用合同機(jī)制利用Petri網(wǎng)實(shí)現(xiàn)了協(xié)同任務(wù)分配。文獻(xiàn)[13] 考慮任務(wù)適應(yīng)度和機(jī)群關(guān)系特征,針對任務(wù)需要多機(jī)協(xié)同完成現(xiàn)實(shí)需求,利用優(yōu)化算法實(shí)現(xiàn)了協(xié)同任務(wù)分配。文獻(xiàn)[14]設(shè)計(jì)了兩層耦合的任務(wù)規(guī)劃求解策略,利用模擬退火算法實(shí)現(xiàn)了協(xié)同對地打擊任務(wù)分配問題。張赟[15]等利用空間自適應(yīng)博弈算法實(shí)現(xiàn)了分布式任務(wù)分配。彭雅蘭[16]等利用交替方向網(wǎng)絡(luò)進(jìn)化博弈的方法實(shí)現(xiàn)了無人機(jī)集群任務(wù)分配。谷旭平[17]等利用細(xì)菌覓食算法實(shí)現(xiàn)異構(gòu)無人機(jī)協(xié)同任務(wù)規(guī)劃。
動(dòng)態(tài)資源管理的過程中往往會(huì)遇到巡飛彈或敵目標(biāo)的動(dòng)態(tài)加入和退出等問題。為了更好地利用和協(xié)調(diào)巡飛彈的資源,提高其作戰(zhàn)效能,需要給出合適的方法來進(jìn)行動(dòng)態(tài)目標(biāo)分配。本文首先對動(dòng)態(tài)資源管理問題進(jìn)行分析,給出了概念和內(nèi)涵,其次建立了巡飛彈群的動(dòng)態(tài)目標(biāo)分配模型,并給出了主要的計(jì)算步驟,最后利用Hungarian算法求解了動(dòng)態(tài)目標(biāo)分配問題。
為了更好地利用巡飛彈群的資源和提高彈群的作戰(zhàn)效能。根據(jù)巡飛彈察打一體和一次性作戰(zhàn)使用的特點(diǎn),給出其目標(biāo)分配的原則是在打擊目標(biāo)前保存自己,提高殺傷敵目標(biāo)的概率,力求最大限度的發(fā)揮巡飛彈群的作戰(zhàn)效能[18]。
同時(shí)部署n個(gè)巡飛彈構(gòu)成巡飛彈群,不妨設(shè)巡飛彈具有相同的性能,每個(gè)具有固定值tmax的巡飛時(shí)間,則
V={1,2,…,n}
(1)
表示一系列部署的巡飛彈群。目標(biāo)類型已知,這里用m來為目標(biāo)編號(hào),Nt表示被發(fā)現(xiàn)目標(biāo)的數(shù)量并且T={1,2,…,Nt}。
動(dòng)態(tài)資源管理問題的模型可描述為
(2)
式中:C=(Cij)n×m為威脅矩陣,Cij表示為第j個(gè)敵目標(biāo)相對于第i枚巡飛彈的威脅程度;X=(Xij)n×m為目標(biāo)分配解矩陣,Xij表示是否把第j個(gè)敵目標(biāo)分配給第i枚巡飛彈,其值為0或1,1表示已分配,0表示未分配。
未來信息化條件下的彈群集群作戰(zhàn)將是以體系與體系對抗為特征的一體化作戰(zhàn)。敵目標(biāo)威脅評估是彈群中一項(xiàng)重要內(nèi)容,同時(shí)也是動(dòng)態(tài)資源管理系統(tǒng)中目標(biāo)分配的基礎(chǔ)。
目前,國內(nèi)外對威脅評估進(jìn)行了深入的研究,根據(jù)目標(biāo)特點(diǎn)和規(guī)模采用的方法不同,主要包括:基于知識(shí)智能體的方法、基于模糊數(shù)學(xué)多準(zhǔn)則決策系統(tǒng)、基于統(tǒng)計(jì)學(xué)Bayes推理、基于不確定的D-S(Dempster-Shafer)證據(jù)理論、博弈論、基于云計(jì)算模型推理的方法等??梢跃C合以上方法,結(jié)合具體任務(wù)提高威脅估計(jì)的準(zhǔn)確度[19]。
威脅評估的目標(biāo)是確定對方目標(biāo)對我方形成威脅的程度,其可通過威脅要素提取、威脅度估計(jì)以及威脅等級確定來實(shí)現(xiàn)對威脅的估計(jì)。
(1) 威脅要素提取
對于巡飛彈群來講,威脅主要來自防空、干擾、誘導(dǎo)等反彈群作戰(zhàn)的威脅,其主要因素是威脅類型、敵我距離、威脅目標(biāo)的速度以及敵打擊、干擾或者誘騙的能力等。
(2) 威脅度估計(jì)
威脅度是充分考慮敵作戰(zhàn)意圖的前提下定量描述防空、干擾、誘導(dǎo)等對巡飛彈群威脅程度,利用概率計(jì)算的方法完成威脅要素統(tǒng)計(jì)分析,凝練敵威脅對巡飛彈群威脅程度的量化指標(biāo)。
(3) 威脅等級確定
根據(jù)威脅度的估計(jì),綜合考慮目標(biāo)特性和威脅程度,構(gòu)建威脅等級的評價(jià)指標(biāo)體系,判定敵目標(biāo)的威脅等級。
目標(biāo)的威脅系數(shù)矩陣為C=(Cij)n×m,作為巡飛彈群任務(wù)決策模型中的效率矩陣。
本文將影響決策的要素分為如下兩部分:一是敵目標(biāo)對我彈群的威脅,二是彈群對敵目標(biāo)的作戰(zhàn)效能。根據(jù)使命任務(wù),利用加權(quán)平均的方式將威脅和效能組合可以實(shí)現(xiàn)對敵目標(biāo)不同的作戰(zhàn)意圖,具體步驟如下。
步驟 1面向使命任務(wù),利用威脅估計(jì)的方法構(gòu)建威脅矩陣,并進(jìn)行無量綱歸一化處理:
步驟 2根據(jù)巡飛彈平臺(tái)的性能構(gòu)建基于作戰(zhàn)效能的效能矩陣,并進(jìn)行無量綱歸一化處理:
式中:B為效能矩陣,Bij為第i枚巡飛彈對第j個(gè)目標(biāo)的攻擊效能值。
步驟 3效率矩陣的構(gòu)建方式如下:
Z=αC-βB
(3)
式中:Z為評價(jià)矩陣,C為威脅矩陣,B為效能矩陣,α,β為權(quán)重系數(shù),滿足0≤α≤1,0≤β≤1,α+β=1。根據(jù)作戰(zhàn)使命可以選擇優(yōu)先對敵打擊模式、優(yōu)先巡飛彈群生存模式、打擊和生存平衡模式以及自定義模式。根據(jù)實(shí)際需求,當(dāng)選擇已打擊效能為目標(biāo)的風(fēng)險(xiǎn)模式時(shí),α=1,β=0;當(dāng)選擇保存彈群為目標(biāo)效益模式時(shí),α=0,β=1;當(dāng)選擇風(fēng)險(xiǎn)和收益均衡模式時(shí),α=0.5,β=0.5;可自選權(quán)重值以決定攻擊和防御的比重。
不確定環(huán)境下,敵我作戰(zhàn)決策是一個(gè)典型的非合作非零和對策問題,本文根據(jù)巡飛彈集群作戰(zhàn)的特點(diǎn),綜合考慮敵目標(biāo)的威脅程度與彈群的效率函數(shù)模型進(jìn)行動(dòng)態(tài)目標(biāo)分配研究。
Hungarian算法是基于Hall定理的二部圖匹配最有效的算法,可快速高效的求解目標(biāo)函數(shù)為線性函數(shù)、分配策略為敵我目標(biāo)規(guī)模相當(dāng)?shù)膬?yōu)化問題。對于敵我目標(biāo)規(guī)模不匹配問題[20],可利用增補(bǔ)變量的方法變成匹配問題,求解巡飛彈群的規(guī)模和目標(biāo)的規(guī)模動(dòng)態(tài)變化使得動(dòng)態(tài)資源管理具有很好的擴(kuò)展性,其步驟如下。
步驟 1效率矩陣的構(gòu)建。
步驟 2根據(jù)矩陣行、列減去一個(gè)常數(shù)最優(yōu)解等價(jià)進(jìn)行效率矩陣的變換。
步驟 3根據(jù)定理Hall尋找最優(yōu)解。
經(jīng)過步驟2后形成新效率矩陣,新的效率矩陣?yán)貌襟E2中矩陣變換后求得行、列都有了0,根據(jù)Hall定理一定存在并m個(gè)相互獨(dú)立的0。其具體操作步驟如下:
步驟 3.1標(biāo)記只有一個(gè)0的行,不妨將0記作※,表示行所代表的巡飛彈對列對應(yīng)的敵目標(biāo)執(zhí)行作戰(zhàn)任務(wù),然后劃去※所在列,記作◎,表示列所代表的目標(biāo)已被分配。
步驟 3.2標(biāo)記只有一個(gè)0元素的列,將0元素記作※,然后劃去※所在行。
步驟 3.3重復(fù)步驟3.1和步驟3.2,直到找不到包含1個(gè)0元素的行或列為止。
步驟 3.4經(jīng)過步驟3.1和步驟3.2以后,如果存在至少2個(gè)0元素行或列,此時(shí)問題的解不唯一??蓮暮?元素少的行或列進(jìn)行標(biāo)記,然后將同行或列中0元素忽略,反復(fù)步驟3.1和步驟3.2,直到矩陣中0元素標(biāo)記或劃掉。
步驟 3.5標(biāo)記※的數(shù)目等于效率矩陣的維數(shù),可得最優(yōu)解。否則轉(zhuǎn)至步驟4。
步驟 4標(biāo)記※的數(shù)目小于維數(shù),為得到效率矩陣中最多的獨(dú)立0元素。其具體操作步驟如下:
步驟 4.1標(biāo)注為標(biāo)記※的行,記作X。
步驟 4.2標(biāo)注X的行所包含0元素的列同樣記作X;
步驟 4.3再對標(biāo)注X的列所包含0元素的行記作X;
步驟 4.4重復(fù)步驟4.2和步驟4.3操作,直到結(jié)束;
步驟 4.5橫線劃過未被標(biāo)注的行,豎線劃過未被標(biāo)注的列,可得效率矩陣中全覆蓋0元素的最少直線數(shù)。若k 步驟 5重新變換得到的效率矩陣是為盡快找到最優(yōu)解,得到更多0元素。經(jīng)過步驟4后行或列中還未找到最小值,將此行按照步驟2矩陣運(yùn)算的性質(zhì)減去最小值,此列都加上最小值,經(jīng)過變換后得到n個(gè)相互獨(dú)立的0元素,則為最優(yōu)分配方案,否則回到步驟3重復(fù)進(jìn)行。 敵我雙方的態(tài)勢通過效率矩陣來體現(xiàn),態(tài)勢分析是彈群作戰(zhàn)過程中目標(biāo)分配的基礎(chǔ),根據(jù)作戰(zhàn)任務(wù)的需求,巡飛彈的動(dòng)態(tài)加入或巡飛彈自身的故障及其他原因退出彈群。此時(shí),進(jìn)行目標(biāo)分配時(shí),根據(jù)效率矩陣的定義和變量的含義可利用增補(bǔ)變量(可取效率矩陣相應(yīng)的行或列為較大數(shù)值)的方式實(shí)現(xiàn)突發(fā)狀況的目標(biāo)分配。 針對上述突發(fā)狀況及復(fù)雜戰(zhàn)場環(huán)境和目標(biāo)時(shí)敏特性,使得戰(zhàn)場敵我態(tài)勢信息具有動(dòng)態(tài)性,即效率矩陣中對應(yīng)的元素隨時(shí)間變化,為了得到穩(wěn)定的目標(biāo)分配結(jié)果,不妨構(gòu)建一個(gè)穩(wěn)定的目標(biāo)分配機(jī)制,可設(shè)置一個(gè)體現(xiàn)作戰(zhàn)的效能閾值,作為是否重分配的依據(jù)。 為了減少可能目標(biāo)的丟失和重分配的計(jì)算量,當(dāng)敵目標(biāo)分配給巡飛彈并執(zhí)行打擊任務(wù)時(shí),重新分配可能會(huì)導(dǎo)致原目標(biāo)的遺漏,從而影響整體的作戰(zhàn)效能。為提升分配效率,本文擬建立彈目一定條件下的鎖定機(jī)制來確保在當(dāng)前任務(wù)進(jìn)程中,目標(biāo)一旦鎖定,被分配的巡飛彈不再參與其他作戰(zhàn)任務(wù)。 將戰(zhàn)場區(qū)域設(shè)置為2 km×2 km。巡飛彈從陣地打出后,快速由陣地介入到戰(zhàn)場區(qū)域。其攜帶的探測傳感器鎖定目標(biāo)的距離為200 m,敵我規(guī)模皆為12且初始任務(wù)分配的位置隨機(jī)生成,如表1所示。任務(wù)分配結(jié)果如表2所示,1表示該行的巡飛彈打擊該列的目標(biāo),后文同此。 表1 算例的初始條件 表2 基于Hungarian的任務(wù)決策方案 此時(shí)評價(jià)矩陣如下: 定義巡飛彈的鎖定距離為200 m,所以當(dāng)已配對的距離小于200 m時(shí),則該敵目標(biāo)已被鎖定,從上述鎖定距離矩陣來看,巡飛彈3、5、6分別對目標(biāo)7、11、10進(jìn)行了鎖定,則鎖定目標(biāo)后任務(wù)分配結(jié)果如表3所示。 表3 基于鎖定目標(biāo)的任務(wù)決策方案 敵我目標(biāo)規(guī)模均為4,此時(shí)若敵目標(biāo)5加入戰(zhàn)場,此時(shí)的評價(jià)矩陣如下: 計(jì)算可得到分配方案如表4所示。 表4 敵目標(biāo)加入任務(wù)決策方案 若敵目標(biāo)3由于自身故障或敵作戰(zhàn)方案的需要退出戰(zhàn)場,則根據(jù)本文構(gòu)建規(guī)則,得到如下評價(jià)矩陣: 得到的分配結(jié)果如表5所示。 表5 敵目標(biāo)退出任務(wù)決策方案 巡飛彈動(dòng)態(tài)加入或退出彈群時(shí),彈群規(guī)模針對現(xiàn)有敵目標(biāo)出現(xiàn)以多打少或以少打多現(xiàn)象,為此,重新分配任務(wù)。本文擬采用對初分配未使用的巡飛彈,采取作戰(zhàn)效能最大,對彈群威脅最小策略來進(jìn)行再?zèng)Q策。 巡飛彈5加入到彈群中,此時(shí)的評價(jià)矩陣為 按照新的策略經(jīng)過計(jì)算得到的目標(biāo)分配方案如表6所示。 表6 巡飛彈動(dòng)態(tài)加入任務(wù)決策方案 巡飛彈3退出彈群,則按照規(guī)則得到如下評價(jià)矩陣: 按照二次分配的方法經(jīng)過計(jì)算得到的目標(biāo)分配方案如表7所示。 表7 巡飛彈退出任務(wù)決策方案 設(shè)敵我雙方規(guī)模為5,其評價(jià)矩陣為 利用Hungarian算法得到的目標(biāo)分配方案如表8所示。 表8 基于Hungarian算法的任務(wù)決策方案(有退出) 此時(shí),若巡飛彈4和敵目標(biāo)3和目標(biāo)4退出戰(zhàn)場,則根據(jù)上述規(guī)則,此時(shí)評價(jià)矩陣為 按照二次分配的方法經(jīng)過計(jì)算得到目標(biāo)分配方案如表9所示。 表9 巡飛彈和敵目標(biāo)退出任務(wù)決策方案 本文研究了不確定環(huán)境下巡飛彈群動(dòng)態(tài)資源管理問題,充分考慮現(xiàn)實(shí)環(huán)境下,目標(biāo)態(tài)勢的動(dòng)態(tài)更新和巡飛彈群規(guī)模的動(dòng)態(tài)變化,利用增補(bǔ)變量的方式將非平衡匹配問題變?yōu)槠胶馄ヅ鋯栴}。數(shù)值實(shí)驗(yàn)中,本文方法較好地實(shí)現(xiàn)了平衡/非平衡問題的動(dòng)態(tài)資源管理,比傳統(tǒng)的最優(yōu)化方法具有更好的擴(kuò)展性,為巡飛彈群完成作戰(zhàn)任務(wù),實(shí)現(xiàn)科學(xué)的集群化“偵、控、打、評”提供了重要支撐,對推動(dòng)巡飛彈群的實(shí)戰(zhàn)化運(yùn)用具有重要學(xué)術(shù)價(jià)值。2.4 不確定環(huán)境下態(tài)勢變化及策略研究
3 動(dòng)態(tài)資源管理算例分析
3.1 基于鎖定目標(biāo)的任務(wù)決策
3.2 敵目標(biāo)動(dòng)態(tài)加入或退出戰(zhàn)場
3.3 巡飛彈動(dòng)態(tài)加入或退出巡飛彈群
3.4 敵我雙方各有單元退出的情況
4 結(jié) 論