田忠良,劉 昊
(中國人民解放軍31696部隊(duì),遼寧 錦州 121000)
兵棋對抗推演是軍事演習(xí)中的常見對抗樣式,相比于實(shí)兵對抗推演,兵棋對抗基于敵我電子態(tài)勢信息和后臺數(shù)據(jù)庫,最大限度地?cái)M合真實(shí)戰(zhàn)場環(huán)境和敵我實(shí)兵對抗態(tài)勢,力求還原現(xiàn)實(shí)對抗場景并推演戰(zhàn)法策略。由于無需動用實(shí)兵實(shí)裝,相比于實(shí)兵演習(xí)的組織保障需求更低,更能反映戰(zhàn)法策略的對抗綜合效果,通過對電子態(tài)勢的復(fù)盤分析查缺補(bǔ)漏,在反復(fù)推演中修正完善原有戰(zhàn)法策略。隨著人工智能技術(shù)日趨成熟并融入軍事指揮實(shí)踐,智能算法與兵棋對抗推演融合逐步成為計(jì)算機(jī)和人工智能領(lǐng)域的研究熱點(diǎn),與此相關(guān)的研究成果推動軍事智能深化發(fā)展,并為部隊(duì)?wèi)?zhàn)斗力提升發(fā)揮日益顯著的作用。
隨著國內(nèi)外專家對其研究的逐步深入,如何更有效地利用其數(shù)據(jù)資源,使其作為戰(zhàn)法策略和兵力火力對抗載體,在更廣闊的空間中發(fā)揮出綜合使用價(jià)值,是今后一段時(shí)期內(nèi)重點(diǎn)研究的工作內(nèi)容。智能算法作為大數(shù)據(jù)和云計(jì)算的核心研究領(lǐng)域,與兵棋對抗平臺的有機(jī)結(jié)合,能夠發(fā)揮出二者的比較優(yōu)勢,即以兵棋對抗推演的數(shù)據(jù)資源作為支撐,以智能算法作為手段對敵我對抗演習(xí)的實(shí)時(shí)數(shù)據(jù)進(jìn)行分析處理,挖掘能夠輔助后續(xù)戰(zhàn)法策略擬制的高價(jià)值經(jīng)驗(yàn)。國內(nèi)外相關(guān)研究成果眾多,文獻(xiàn)[1]以智能優(yōu)化算法為基礎(chǔ)構(gòu)建遺傳模糊系統(tǒng),進(jìn)而實(shí)現(xiàn)兵棋推演的關(guān)鍵點(diǎn)推理,取得較好的優(yōu)化效果;文獻(xiàn)[2]以模擬退火算法為基礎(chǔ)設(shè)計(jì)局部搜索算法,實(shí)現(xiàn)了簡單規(guī)則下的兵棋推演;文獻(xiàn)[3-4]則對兵棋推演中的路徑優(yōu)化問題進(jìn)行了深入探討,并提供了基于智能優(yōu)化算法的解決思路;文獻(xiàn)[5]以多智能體對抗進(jìn)化作為算法設(shè)計(jì)思路,實(shí)現(xiàn)簡單規(guī)則兵棋推演。在復(fù)雜兵棋推演中,文獻(xiàn)[6]深入探討了當(dāng)代戰(zhàn)役兵棋推演的規(guī)則體系,提出了基于復(fù)雜網(wǎng)絡(luò)的規(guī)則約束體系概念;文獻(xiàn)[7]以循環(huán)神經(jīng)網(wǎng)絡(luò)為智能體基礎(chǔ),實(shí)現(xiàn)了對兵棋推演的輔助決策;文獻(xiàn)[8]構(gòu)建了決策樹推理機(jī)以實(shí)現(xiàn)兵棋推演中的人機(jī)博弈對抗。在兵棋推演數(shù)據(jù)分析方面,文獻(xiàn)[9]詳細(xì)分析了基于AlphaGo的自我博弈的指揮控制智能化問題,提出了數(shù)據(jù)耕耘的自我增值思路;文獻(xiàn)[10]設(shè)計(jì)基于堆棧自編碼器的深度學(xué)習(xí)方法,利用兵棋實(shí)體決策大數(shù)據(jù)建立了評估模型;文獻(xiàn)[11-12]使用數(shù)據(jù)挖掘算法在兵棋推演數(shù)據(jù)中提取有價(jià)值信息并輔助智能決策;文獻(xiàn)[13-15]則從兵棋推演的文本數(shù)據(jù)中抽取有價(jià)值信息,以實(shí)現(xiàn)最大限度的語義理解,進(jìn)而實(shí)現(xiàn)人機(jī)結(jié)合的智能輔助決策。
本文以兵棋對抗推演平臺為測試對象,對其制權(quán)癱體階段的主要工作進(jìn)行梳理,找到智能算法應(yīng)用的切入點(diǎn),嘗試使用智能算法一體化生成輔助決策建議,并優(yōu)化諸軍兵種聯(lián)合作戰(zhàn)的協(xié)調(diào)配合狀態(tài),以聯(lián)合火力打擊計(jì)劃形式約束諸軍兵種火力打擊部隊(duì)的制權(quán)癱體作戰(zhàn)行動。
制權(quán)癱體階段的目標(biāo)價(jià)值評估,主要是依據(jù)作戰(zhàn)決心對火力打擊的備選目標(biāo)確定火力打擊優(yōu)先級,通過量化分析算法形成目標(biāo)價(jià)值評分,并通過融合算法輸出目標(biāo)體系總體評分。常見的目標(biāo)價(jià)值評估主要有三種方法:專家評分法、多屬性融合評分法和體系價(jià)值評估法。專家評分法在演習(xí)中應(yīng)用范圍最廣,使用目標(biāo)屬性表依據(jù)目標(biāo)的各側(cè)面屬性依靠專家主觀評分確定量化評估分值,以此確定目標(biāo)的重要程度等級;多屬性評分法則在專家評分法基礎(chǔ)上,通過公式對目標(biāo)的多個(gè)屬性融合計(jì)算并形成統(tǒng)一的綜合評分值;體系價(jià)值評估法主要是從目標(biāo)關(guān)聯(lián)關(guān)系出發(fā),構(gòu)建目標(biāo)體系的復(fù)雜網(wǎng)絡(luò),并從網(wǎng)絡(luò)中觀察并確定制約體系價(jià)值的關(guān)鍵節(jié)點(diǎn)目標(biāo),最終形成火力打擊排序。從當(dāng)前演習(xí)效果看,專家評分法依然占據(jù)主流地位,體系價(jià)值評估尚未被指揮員接受,必須從算法層面研究擬制更為科學(xué)合理的輔助決策建議,使指揮員掌握當(dāng)前態(tài)勢下的目標(biāo)各方面性能參數(shù),為擬制更為合理的目標(biāo)排序提供量化依據(jù)。
制權(quán)癱體階段的諸軍兵種聯(lián)合火力打擊力量眾多,型號、彈種多樣,地域分布廣泛,制約關(guān)系復(fù)雜交錯(cuò),使聯(lián)合火力打擊計(jì)劃的擬制和優(yōu)化火力分配計(jì)算難度大增,如果依據(jù)傳統(tǒng)的以軍兵種參戰(zhàn)力量為主體的軍兵種火力打擊階段任務(wù)分工,聯(lián)合作戰(zhàn)指揮機(jī)構(gòu)只需將目標(biāo)按類別或重要程度、地域所屬劃分給諸軍兵種參戰(zhàn)力量,并由各參戰(zhàn)力量單獨(dú)擬制軍兵種火力打擊計(jì)劃并在規(guī)定時(shí)刻區(qū)分波次執(zhí)行即可,這種火力分配方式的缺點(diǎn)在于:沒有發(fā)揮出聯(lián)合作戰(zhàn)中諸軍兵種火力打擊力量的合力,沒有統(tǒng)一的計(jì)算平臺對目標(biāo)和力量進(jìn)行優(yōu)化分配,沒有對參戰(zhàn)部隊(duì)彈種的最佳使用方式進(jìn)行量化分析和統(tǒng)一調(diào)配,聯(lián)合作戰(zhàn)指揮機(jī)構(gòu)只發(fā)揮出了任務(wù)劃分職能,未擔(dān)當(dāng)起任務(wù)優(yōu)化和統(tǒng)籌職責(zé)。因此有必要引入智能算法優(yōu)化聯(lián)合火力分配。
制權(quán)癱體階段的火力打擊和評估通常區(qū)分波次執(zhí)行,每波次火力打擊都能區(qū)分為火力打擊執(zhí)行階段、打擊效果評估階段和補(bǔ)充火力打擊階段。參戰(zhàn)火力打擊力量在火力打擊執(zhí)行階段根據(jù)聯(lián)合火力打擊計(jì)劃對分配目標(biāo)按時(shí)間階段和彈藥量執(zhí)行火力打擊,在打擊效果評估階段根據(jù)目標(biāo)的毀傷效果統(tǒng)計(jì)敵方當(dāng)前各方面的性能指標(biāo)毀傷情況,而后根據(jù)戰(zhàn)役企圖對未達(dá)成作戰(zhàn)目的的目標(biāo)擬制補(bǔ)充火力打擊計(jì)劃,并執(zhí)行補(bǔ)充火力打擊。制權(quán)癱體階段一般由多個(gè)波次的火力打擊和評估環(huán)節(jié)交疊組成,即評估與打擊相互印證,用小范圍的火力打擊檢驗(yàn)評估效果,又用評估效果修正火力打擊執(zhí)行缺漏。但在實(shí)際執(zhí)行過程中,評估和火力打擊規(guī)劃兩個(gè)環(huán)節(jié)難以有效結(jié)合,由于火力打擊計(jì)劃在戰(zhàn)前已經(jīng)反復(fù)推演并固化,當(dāng)評估結(jié)果與打擊預(yù)期存在較大偏差時(shí),聯(lián)合作戰(zhàn)指揮機(jī)構(gòu)難以在有效時(shí)限內(nèi)修正并下發(fā)補(bǔ)充火力打擊計(jì)劃,進(jìn)而使評估與火力打擊脫離,難以發(fā)揮聯(lián)合火力打擊實(shí)效。
智能算法又稱為軟計(jì)算方法,相比于按規(guī)則設(shè)計(jì)的常規(guī)算法,智能算法最大的特點(diǎn)在于隨機(jī)性和不可復(fù)現(xiàn)性。隨機(jī)性表現(xiàn)為算法內(nèi)部大量采用隨機(jī)函數(shù)設(shè)計(jì)思路,為算法提供了多種可行的計(jì)算方向;不可復(fù)現(xiàn)性表現(xiàn)為算法每次執(zhí)行的結(jié)果不可精確預(yù)判,只能依據(jù)算法的過往執(zhí)行效果對結(jié)果范圍進(jìn)行一定程度上的預(yù)估,難以準(zhǔn)確復(fù)現(xiàn)兩種一模一樣的算法執(zhí)行結(jié)果。正是由于智能算法具備上述特征,其在復(fù)雜系統(tǒng)問題的求解中體現(xiàn)了超越常規(guī)算法的計(jì)算效率和廣闊的適用性。根據(jù)兵棋對抗推演在制權(quán)癱體階段的任務(wù)特點(diǎn),智能算法主要應(yīng)用如圖1所示。
圖1 智能算法應(yīng)用示例
目標(biāo)選擇采用體系價(jià)值評估的方法實(shí)現(xiàn)目標(biāo)的火力打擊先后排序,具體執(zhí)行過程為:首先,根據(jù)專家評分表確定目標(biāo)的所屬種類、所屬子類、所屬部隊(duì),據(jù)此構(gòu)建目標(biāo)關(guān)聯(lián)表,進(jìn)而形成目標(biāo)超網(wǎng)絡(luò);其后,統(tǒng)計(jì)各目標(biāo)的種類、子類和所屬部隊(duì)評分;最后,使用智能算法在目標(biāo)超網(wǎng)絡(luò)中實(shí)現(xiàn)目標(biāo)聚類分析,進(jìn)而判斷出目標(biāo)的體系價(jià)值評分并輸出。根據(jù)智能算法應(yīng)用的側(cè)重點(diǎn),下面主要分析智能算法應(yīng)用于目標(biāo)超網(wǎng)絡(luò)并計(jì)算體系價(jià)值評分具體計(jì)算過程如下:
步驟1根據(jù)目標(biāo)的種類關(guān)系、子類關(guān)系和所屬部隊(duì)關(guān)系生成目標(biāo)關(guān)聯(lián)表。導(dǎo)入系統(tǒng)采集的基本目標(biāo)信息,目標(biāo)由包含不同功能屬性的同一打擊對象子目標(biāo)組合構(gòu)成,同一次火力打擊能夠?qū)ν荒繕?biāo)組合內(nèi)的所有子目標(biāo)構(gòu)成不同程度的損害。其中所屬部隊(duì)是目標(biāo)組合的最小劃分,也是火力打擊作用的對象,如“驅(qū)護(hù)艦X號艦”;目標(biāo)子類是目標(biāo)組合內(nèi)各子目標(biāo)根據(jù)其所屬功能具體劃分出的系統(tǒng)單元,如“艦隊(duì)防空火力系統(tǒng)”;目標(biāo)種類是各子目標(biāo)依據(jù)其具體自然屬性劃分出的類別單元,如“防空-空空導(dǎo)彈”。一般來說,以目標(biāo)劃分的精細(xì)度區(qū)分,子目標(biāo)>所屬部隊(duì)>目標(biāo)子類>目標(biāo)種類。獲取目標(biāo)的種類、子類和所屬部隊(duì)關(guān)系,3類關(guān)系如圖2所示。
圖2 采集信息表中3類關(guān)系
目標(biāo)關(guān)聯(lián)表生成原則為:若兩個(gè)目標(biāo)之間存在3類關(guān)系中任意一個(gè),則判定目標(biāo)之間關(guān)聯(lián)度為1,否則為0。
步驟2生成目標(biāo)超網(wǎng)絡(luò)。依據(jù)敵方子目標(biāo)構(gòu)成的目標(biāo)關(guān)聯(lián)表,依據(jù)表內(nèi)關(guān)聯(lián)度為1在超網(wǎng)絡(luò)中連線的原則,生成目標(biāo)超網(wǎng)絡(luò),其中可依據(jù)目標(biāo)所屬的不同子類和所屬部隊(duì)劃分不同的子網(wǎng)絡(luò)。圖2的示例能夠轉(zhuǎn)換為超網(wǎng)絡(luò)如圖3所示。
圖3 超網(wǎng)絡(luò)示例
(1)
(2)
(3)
步驟4計(jì)算目標(biāo)的綜合評分。使用熵權(quán)理想點(diǎn)法將各子目標(biāo)的子類評分、種類評分和所屬部隊(duì)評分融合并輸出為綜合評分fi,熵權(quán)理想點(diǎn)算法首先根據(jù)各目標(biāo)的屬性值分布規(guī)律計(jì)算出各屬性值的熵權(quán)重,再依據(jù)理想點(diǎn)法生成正負(fù)理想點(diǎn),并計(jì)算出加權(quán)屬性值與正負(fù)理想點(diǎn)之間的距離對比值作為輸出綜合評分。
(4)
聯(lián)合火力打擊計(jì)劃的擬制是制權(quán)癱體階段聯(lián)合作戰(zhàn)指揮機(jī)構(gòu)的重點(diǎn)工作內(nèi)容,計(jì)劃優(yōu)化包含如下工作:目標(biāo)量化評估優(yōu)選、火力打擊力量梳理、火力打擊限制條件梳理、初始計(jì)劃生成、最優(yōu)計(jì)劃輸出。智能算法借鑒了自然界生物進(jìn)化過程中的協(xié)作與競爭機(jī)制,通過設(shè)計(jì)智能體結(jié)構(gòu)模擬參與火力打擊的部隊(duì)彈種,利用智能體變異產(chǎn)生豐富多樣的“彈種-目標(biāo)”組合,通過多個(gè)智能體之間的搭配組合產(chǎn)生聯(lián)合火力打擊計(jì)劃,進(jìn)而實(shí)現(xiàn)聯(lián)合火力分配的優(yōu)化。智能體功能示例如圖4所示。
圖4 智能體功能示例
由圖4可知,智能體實(shí)現(xiàn)“彈種-目標(biāo)”組合的核心在于目標(biāo)排序表結(jié)構(gòu),其生成原則為:根據(jù)智能體的部隊(duì)彈種在目標(biāo)限制表中調(diào)用所有能夠打擊的目標(biāo);根據(jù)目標(biāo)屬性表中的所屬方排除非藍(lán)方目標(biāo)(鑒于實(shí)際對抗中存在紫方、綠方等中立目標(biāo));根據(jù)偵察情報(bào)排除未被發(fā)現(xiàn)或更新不及時(shí)目標(biāo)。將篩選出的目標(biāo)序號導(dǎo)入目標(biāo)排序表,并加入適量冗余項(xiàng)-1。其意義表述為:若選擇執(zhí)行冗余項(xiàng),則部隊(duì)原地待命3分鐘不執(zhí)行火力打擊。智能體的使用流程為:若智能體參與生成火力打擊計(jì)劃,則根據(jù)目標(biāo)排序表依次選中靠前目標(biāo)序號并判斷是否能夠?qū)崿F(xiàn)火力打擊:超程不予打擊;部隊(duì)彈種剩余彈藥量不足不予打擊;部隊(duì)已殲滅不予打擊;目標(biāo)已殲滅不予打擊。如能夠執(zhí)行火力打擊則輸出“彈種-目標(biāo)”組合;如不能執(zhí)行則依次選中后續(xù)目標(biāo)序號,直至排序表所有目標(biāo)選擇完畢,退出循環(huán)?;诖?聯(lián)合火力分配算法的操作流程如下。
步驟1生成我方智能體種群。按照種群進(jìn)化原則,為所有部隊(duì)彈種生成對應(yīng)智能體,依據(jù)目標(biāo)綜合評分由高至低生成目標(biāo)排序表,并通過變異操作產(chǎn)生同類智能體。變異操作:隨機(jī)選中目標(biāo)排序表中兩個(gè)位置的目標(biāo)序號并交換,置壽命和智能體評分為0??紤]種群多樣性,種群內(nèi)相同部隊(duì)彈種的智能體數(shù)量至少為3個(gè)。
步驟2生成聯(lián)合火力打擊任務(wù)規(guī)劃。隨機(jī)抽取每個(gè)部隊(duì)彈種中的1個(gè)智能體搭配組合,選中智能體壽命+1,選中智能體目標(biāo)排序表中的目標(biāo)序號并生成“彈種-目標(biāo)”組合,根據(jù)目標(biāo)與部隊(duì)距離、射彈飛行速度、部隊(duì)機(jī)動速度、打擊間隔時(shí)間計(jì)算出任務(wù)規(guī)劃時(shí)刻和火力打擊時(shí)刻,進(jìn)而匯總生成聯(lián)合火力打擊計(jì)劃[10]。設(shè)第j個(gè)部隊(duì)彈種的經(jīng)緯度坐標(biāo)為bj和lj,第i個(gè)目標(biāo)的經(jīng)緯度坐標(biāo)為bi和li,則部隊(duì)與目標(biāo)之間距離dij計(jì)算公式為
(5)
(6)
(7)
(8)
下次任務(wù)規(guī)劃開始時(shí)刻t1計(jì)算公式為
t1=t0+gj
(9)
步驟3生成智能體反饋評分。將聯(lián)合火力打擊任務(wù)規(guī)劃代入對抗推演,并生成各目標(biāo)的毀傷程度和部隊(duì)的彈藥兵力損耗,進(jìn)而計(jì)算出對抗評分,將其反饋參與任務(wù)規(guī)劃生成的智能體組合。
步驟4種群淘汰更新。將種群內(nèi)同部隊(duì)彈種的最高分智能體變異產(chǎn)生新智能體,并替代同部隊(duì)彈種的最低分智能體。
步驟5重復(fù)上述步驟1-4,直至達(dá)成迭代上限,選取種群內(nèi)各部隊(duì)彈種最高分智能體搭配組合并生成聯(lián)合火力打擊任務(wù)規(guī)劃,作為優(yōu)化結(jié)果輸出。
對抗推演算法用于執(zhí)行聯(lián)合火力打擊任務(wù)規(guī)劃并最終輸出反饋評分,為了盡可能貼合實(shí)戰(zhàn)對抗環(huán)境,算法包含航空部隊(duì)損耗計(jì)算、目標(biāo)毀傷程度計(jì)算和反饋評分計(jì)算3個(gè)核心環(huán)節(jié)[8]。其中,防空部隊(duì)損耗計(jì)算流程如下:
步驟1計(jì)算當(dāng)前敵方體系總體防空能力。遍歷目標(biāo)屬性表,并計(jì)算所有防空目標(biāo)的當(dāng)前毀傷程度,設(shè)第i個(gè)目標(biāo)屬于防空目標(biāo),毀傷程度為hi,綜合評分為fi,匯總并計(jì)算敵方體系總體防空能力K,計(jì)算公式為
(10)
(11)
(12)
(13)
(14)
為了檢驗(yàn)智能算法應(yīng)用于兵棋對抗推演的總體優(yōu)化效果,引入對比遺傳算法作為對比算法,同時(shí)選取手工火力打擊計(jì)劃作為對比結(jié)果,分析智能體優(yōu)化結(jié)果的分布特征和搭配規(guī)律。
本實(shí)驗(yàn)設(shè)計(jì)使用熵權(quán)理想點(diǎn)法實(shí)現(xiàn)目標(biāo)子類、種類和所屬部隊(duì)評分的融合輸出,在算法選擇上稍顯突兀,因此選取求和公式作為對比融合算法計(jì)算兩種算法生成的目標(biāo)綜合評分。為了更好觀察對比效果,將橫坐標(biāo)目標(biāo)綜合評分按求和公式結(jié)果由大至小排序,輸出對比結(jié)果如圖5所示。
圖5 綜合評分算法對比
通過對比分析可知,求和公式優(yōu)于計(jì)算較為簡單,因此各目標(biāo)綜合評分之間的差異度較大,相比較而言,熵權(quán)理想點(diǎn)法的最大小值差異度在1以內(nèi),相對波動較小;在綜合評分比較上,求和公式?jīng)]有對3個(gè)屬性值賦予傾向性權(quán)重,但優(yōu)于所屬部隊(duì)評分相對于另2種屬性值區(qū)分度更高,因此求和公式主要反映了所屬部隊(duì)評分的波動情況,實(shí)際走勢也趨向于部隊(duì)屬性,對于目標(biāo)子類和種類評分的作用影響有限,而熵權(quán)理想點(diǎn)法對各屬性值賦予了傾向性熵權(quán)評分,更能反映3個(gè)屬性值的綜合波動效果,圖像上并未完全遵循所屬部隊(duì)評分走勢,因此后續(xù)實(shí)驗(yàn)中采用熵權(quán)理想點(diǎn)法作為融合評分算法。
在對抗推演算法中,引入了火力打擊性價(jià)比概念,并用以輸出為智能體的反饋評分,作為智能體優(yōu)勝劣汰的生存依據(jù),為了檢查火力打擊性價(jià)比在對抗推演中對任務(wù)規(guī)劃智能提升的有效性,選取敵方平均毀傷程度作為對比反饋評分,對比結(jié)果如圖6所示。
圖6 反饋評分對比
通過對比分析可知,以目標(biāo)毀傷程度作為反饋評分時(shí),隨著迭代次數(shù)增長,目標(biāo)平均體系價(jià)值評分持續(xù)走低,相比而言,以火力打擊性價(jià)比作為反饋評分的目標(biāo)毀傷程度降幅不如前者,差異值持續(xù)增大,并在 100 000 代后達(dá)到1 695.4分(占目標(biāo)初始體系評分的4.52%),如果僅以目標(biāo)毀傷程度作為評判標(biāo)準(zhǔn),則以目標(biāo)毀傷程度作為反饋評分更為高效;在對比二者部隊(duì)損失實(shí)力中,以目標(biāo)毀傷程度作為反饋評分的部隊(duì)損失持續(xù)增大,而以火力打擊性價(jià)比的反饋評分方法則緩慢走低,二者差異度由最初的0擴(kuò)展為486.74(占部隊(duì)總實(shí)力的2.4%),表明以目標(biāo)毀傷程度作為反饋評分方法隨著優(yōu)化持續(xù)而導(dǎo)致部隊(duì)毀傷程度持續(xù)增長,這種增長不以敵方主觀意志為轉(zhuǎn)移,僅是對部隊(duì)火力打擊的被動反擊;在對比二者火力打擊性價(jià)比后,以目標(biāo)毀傷程度為反饋評分方法在多代迭代后的總體火力打擊性價(jià)比并未發(fā)生明顯提升,僅是在8.16~12.80之間波動,而以火力打擊性價(jià)比為反饋評分方法在 19 000 代前與前方法基本相同,但隨著代數(shù)推演和對抗經(jīng)驗(yàn)積累,在26 000代后的打擊性價(jià)比產(chǎn)生明顯陡增(14.59),并在此后超越前方法,并在 100 000 代迭代后產(chǎn)生了最高分值18.75。綜上可知,以火力打擊性價(jià)比為反饋評分方法在綜合比較中優(yōu)于前方法,而如不計(jì)我方部隊(duì)損耗,以目標(biāo)毀傷程度為反饋評分方法更為適用。
為了檢驗(yàn)算法在同類算法中的綜合對比性能,選取遺傳算法作為對照算法,取進(jìn)化代數(shù)為100代,觀察各代的最優(yōu)智能體評分結(jié)果,對比結(jié)果如圖7所示。
圖7 最優(yōu)智能體評分對比
通過對比分析可知,多智能體協(xié)同進(jìn)化方法明顯優(yōu)于同類的遺傳算法,原因主要在于協(xié)同進(jìn)化在短時(shí)間內(nèi)汲取同類智能體中的優(yōu)秀基因結(jié)構(gòu),使其綜合評分迅速上揚(yáng),評分水平明顯優(yōu)于遺傳算法;在長時(shí)間的迭代中,遺傳算法逐步改善最優(yōu)智能體的基因結(jié)構(gòu),使其綜合評分水平逐步趨近協(xié)同進(jìn)化方法的綜合評分;通過實(shí)驗(yàn)可知,在時(shí)效性要求較高的領(lǐng)域可優(yōu)先選取協(xié)同進(jìn)化算法作為智能算法,如對時(shí)間要求不高且對算法編程復(fù)雜度要求較高,可選取簡單易行的遺傳算法作為智能算法。
選取以智能體組合作為最小變異單位的種群結(jié)構(gòu),分析最優(yōu)種群中的高分智能體組合產(chǎn)生的聯(lián)合火力打擊任務(wù)規(guī)劃,并與人工產(chǎn)生的任務(wù)規(guī)劃相比較,部隊(duì)損耗情況對比結(jié)果如圖8所示。
圖8 部隊(duì)損耗情況對比
通過對比分析可知,對于各類航空部隊(duì)編號單元,手工擬制任務(wù)規(guī)劃的毀傷程度維持在85%左右,而智能算法優(yōu)化的航空部隊(duì)毀傷程度維持在98%,各航空部隊(duì)毀傷程度保持一致的原因在于算法中對于毀傷程度計(jì)算取決于敵方防空體系的毀傷百分比,因此對于防空體系毀傷較大,則各航空部隊(duì)對應(yīng)的毀傷程度相應(yīng)降低,應(yīng)用智能算法優(yōu)化后的各航空部隊(duì)毀傷程度明顯優(yōu)于手工規(guī)劃。在任務(wù)規(guī)劃對比中,打擊各種類目標(biāo)的數(shù)量對比如圖9所示。
圖9 打擊各種類目標(biāo)數(shù)量對比
通過對比分析可知,優(yōu)化任務(wù)規(guī)劃的打擊子目標(biāo)總數(shù)明顯多于手工任務(wù)規(guī)劃子目標(biāo)數(shù)(5829>5212),在目標(biāo)種類中,機(jī)堡類目標(biāo)(戰(zhàn)時(shí)軍用機(jī)場備用機(jī)庫)增幅最大,高于手工規(guī)劃的131%;其次為傳感器站點(diǎn)類目標(biāo),增幅為32.62%;同時(shí)對于導(dǎo)彈部隊(duì)、防空-空空導(dǎo)彈、裝卸設(shè)施類目標(biāo)的打擊數(shù)量明顯降低,最大降幅達(dá)58.12%,考慮敵方防空體系降低,優(yōu)化任務(wù)規(guī)劃重點(diǎn)打擊了敵方的子目標(biāo)較少的防空目標(biāo),提升了子目標(biāo)打擊效率。對于剩余目標(biāo)統(tǒng)計(jì)分析,敵方目標(biāo)子類0數(shù)表明該目標(biāo)子類全部被殲滅;所屬部隊(duì)0數(shù)表明該所屬部隊(duì)對應(yīng)的目標(biāo)全部被殲滅,對應(yīng)對比結(jié)果如圖10所示。
圖10 剩余目標(biāo)和防空能力對比
通過對比分析可知,經(jīng)過智能算法優(yōu)化,剩余目標(biāo)中的目標(biāo)子類0數(shù)和所屬部隊(duì)0數(shù)明顯增長,分別提升了30%和34%,表明經(jīng)過優(yōu)化的敵方目標(biāo)中的具體類別數(shù)量明顯降低,網(wǎng)絡(luò)體系價(jià)值得到有效削弱;在防空能力降幅對比中,智能優(yōu)化方法能夠?qū)崿F(xiàn)對敵方更多的降幅(5.69%)。經(jīng)過綜合比較可知,智能優(yōu)化后的任務(wù)規(guī)劃明顯優(yōu)于指揮員手工擬制的任務(wù)規(guī)劃。
本文針對兵棋對抗推演中的制權(quán)癱體階段聯(lián)合火力打擊任務(wù)規(guī)劃問題,研究了智能算法應(yīng)用的可行性,設(shè)計(jì)了以多智能體協(xié)同進(jìn)化為設(shè)計(jì)理念的群體智能優(yōu)化算法,同時(shí)針對聯(lián)合火力打擊毀傷特點(diǎn)設(shè)計(jì)了對抗模擬平臺,通過計(jì)算機(jī)迭代進(jìn)化推演輸出優(yōu)化智能體,并分析對應(yīng)最優(yōu)任務(wù)規(guī)劃的結(jié)構(gòu)特點(diǎn)。實(shí)驗(yàn)分析表明,本算法應(yīng)用于聯(lián)合火力打擊任務(wù)規(guī)劃相比于手工擬制任務(wù)規(guī)劃具備全方位的優(yōu)勢,能夠有效與兵棋對抗推演結(jié)合,并通過任務(wù)規(guī)劃優(yōu)化輔助指揮員決策,達(dá)成人機(jī)結(jié)合和智能決策的智能算法應(yīng)用目的。下一步將根據(jù)兵棋對抗推演的實(shí)戰(zhàn)特點(diǎn)設(shè)計(jì)更為貼近戰(zhàn)場環(huán)境的對抗算法,并引入綠、紫軍對抗環(huán)境,研究智能體在多元環(huán)境中的進(jìn)化規(guī)律。