褚凱軒, 常天慶, 孔德鵬, 張 雷, 孫皓澤
(1. 陸軍裝甲兵學(xué)院兵器與控制系, 北京 100072; 2. 中國人民解放軍92942部隊(duì), 北京 100161; 3. 中國人民解放軍78123部隊(duì), 四川 成都 610081)
多武器對(duì)多目標(biāo)的協(xié)同火力打擊能夠有效地提高作戰(zhàn)集群的整體作戰(zhàn)效能,火力協(xié)同既能充分發(fā)揮多武器的作戰(zhàn)優(yōu)勢,又能減少武器所受的戰(zhàn)場威脅。坦克作為陸上主要突擊武器,承擔(dān)對(duì)敵一線防御陣地和縱深要點(diǎn)實(shí)施攻擊的任務(wù)。僅打擊決策這個(gè)層面,坦克分隊(duì)對(duì)目標(biāo)的射擊問題是一個(gè)武器目標(biāo)分配(weapon-target allocation, WTA)問題,與防空反導(dǎo)任務(wù)相似,但是坦克分隊(duì)WTA模型與傳統(tǒng)的防空反導(dǎo)類WTA模型有所不同。首先,坦克作為地面突擊武器,具有高機(jī)動(dòng)性,坦克不是定點(diǎn)的炮臺(tái)而是移動(dòng)的武器平臺(tái),因此坦克分隊(duì)作戰(zhàn)決策中,不僅需考慮誰打誰的問題,還需根據(jù)戰(zhàn)場態(tài)勢,決定坦克從集結(jié)區(qū)域到作戰(zhàn)區(qū)域的兵力部署。其次,坦克作戰(zhàn)是武器平臺(tái)之間的攻防,而不是對(duì)導(dǎo)彈的攔截,因此需要考慮雙方的動(dòng)態(tài)對(duì)攻,既要考慮我方的打擊策略也要考慮目標(biāo)對(duì)我方的打擊,只有將雙方的博弈對(duì)抗特性加入到?jīng)Q策優(yōu)化過程中,才能獲得具有說服力的火力協(xié)同決策
WTA問題的實(shí)質(zhì)是帶約束的組合優(yōu)化問題,是典型的非確定性多項(xiàng)式(non-deterministic polynomial, NP)問題。WTA問題的求解是目前的一個(gè)研究熱點(diǎn)。如大規(guī)模鄰域搜索算法、離散粒子群算法、蟻群算法、進(jìn)化算法、人工蜂群(artificial bee colony, ABC)算法、遺傳算法等,這些優(yōu)化方法能夠求得WTA問題的滿意解。但是,戰(zhàn)場態(tài)勢瞬息萬變,需在短時(shí)間內(nèi)做出決策;而且NP類問題隨著維數(shù)的增多解空間呈指數(shù)規(guī)模增長,當(dāng)敵我數(shù)量較多時(shí),優(yōu)化算法耗時(shí)明顯增長??紤]到戰(zhàn)場態(tài)勢變化迅速,尤其短兵相接時(shí)需要快速做出決策,因此繼續(xù)研究提升群智能算法求解WTA模型的性能有重要意義。不同模型有其固有的特點(diǎn),如果能夠充分利用模型中的先驗(yàn)知識(shí)和特有規(guī)律,對(duì)群智能算法進(jìn)行有針對(duì)的改進(jìn)和具體設(shè)計(jì),會(huì)取得良好的效果。
本文旨在優(yōu)化坦克分隊(duì)進(jìn)攻戰(zhàn)斗中,坦克從集結(jié)區(qū)域到作戰(zhàn)區(qū)域的兵力部署決策和坦克在作戰(zhàn)區(qū)域的火力分配決策。首先建立多對(duì)一的確定性火力對(duì)抗模型,在此基礎(chǔ)上以目標(biāo)價(jià)值加權(quán)平均毀傷概率最大為目標(biāo)函數(shù)建立坦克火力分配模型;然后在坦克火力分配最優(yōu)的基礎(chǔ)上,建立坦克分隊(duì)從集結(jié)區(qū)域到作戰(zhàn)區(qū)域的數(shù)量分配模型,即坦克陣地部署模型。火力分配模型和陣地部署模型在邏輯上構(gòu)成了雙層迭代關(guān)系。算法方面,本文針對(duì)坦克火力分配模型和坦克陣地部署模型的實(shí)際情況,對(duì)ABC算法進(jìn)行特定的應(yīng)用和設(shè)計(jì)。最后,通過仿真實(shí)驗(yàn)對(duì)本文提出模型的有效性和算法的進(jìn)步性進(jìn)行驗(yàn)證。
坦克進(jìn)攻戰(zhàn)斗中,坦克分隊(duì)在集結(jié)區(qū)域集結(jié),之后分派到多個(gè)作戰(zhàn)區(qū)域,參與對(duì)敵作戰(zhàn)。如圖1所示,為一次進(jìn)攻戰(zhàn)斗中坦克分隊(duì)的作戰(zhàn)決策圖,包括陣地部署和火力分配,我方共計(jì)40輛坦克從集結(jié)區(qū)域出發(fā),分派往10個(gè)射擊區(qū)域,對(duì)15個(gè)目標(biāo)進(jìn)行打擊,各射擊區(qū)域坦克數(shù)量和各目標(biāo)被分配的火力數(shù)量如圖1中所示,其中火力分配階段不同顏色的線段表示各目標(biāo)分配的火力數(shù)量。通過合理的陣地部署和火力分配,可以實(shí)現(xiàn)決策優(yōu)化,提高作戰(zhàn)效能。
圖1 作戰(zhàn)決策圖Fig.1 Operational decision graph
針對(duì)坦克分隊(duì)作戰(zhàn)中的陣地部署和火力分配的最優(yōu)決策問題,本文建立雙層迭代模型,如圖2所示。陣地部署方案決定了坦克與目標(biāo)的敵我毀傷概率,而敵我毀傷概率影響火力分配,是火力分配的依據(jù),火力分配方案決定了作戰(zhàn)效能。以最優(yōu)作戰(zhàn)效能為引導(dǎo),搜索最優(yōu)火力分配方案和最優(yōu)陣地部署方案。模型的最終目標(biāo)是找到最優(yōu)的陣地部署方案以及與其配套的火力分配方案,兩個(gè)模型同時(shí)最優(yōu),達(dá)到最佳的作戰(zhàn)效能。
圖2 雙層迭代模型Fig.2 Two layer iterative model
輛坦克于集結(jié)區(qū)域集結(jié)完畢,待前往個(gè)射擊區(qū)域,對(duì)個(gè)目標(biāo)實(shí)施打擊。模型表達(dá)式如下:
(1)
式中:(·)為底層尋優(yōu)模型的評(píng)價(jià)函數(shù);為目標(biāo)個(gè)數(shù);為目標(biāo)的價(jià)值;()為當(dāng)前火力分配方案下目標(biāo)被毀傷的概率;向量為決策向量;=表示坦克打擊目標(biāo);(·)為上層尋優(yōu)模型的評(píng)價(jià)函數(shù);()表示陣地部署方案下,采取最優(yōu)火力分配方案時(shí)達(dá)到的作戰(zhàn)效能;決策向量中,表示被分配到射擊區(qū)域的坦克數(shù)量。模型表達(dá)式體現(xiàn)了雙層迭代的思想,即陣地部署決策的優(yōu)化必須以底層火力分配決策最優(yōu)為基礎(chǔ)。
現(xiàn)介紹確定型火力對(duì)抗下對(duì)目標(biāo)毀傷概率的計(jì)算方法。不同于防空反導(dǎo)類WTA問題,坦克作戰(zhàn)是一個(gè)動(dòng)態(tài)的持續(xù)的對(duì)抗過程,我方坦克打擊目標(biāo)的同時(shí),還要面臨敵目標(biāo)對(duì)我方坦克的攻擊。由于地形等環(huán)境因素相對(duì)穩(wěn)定,可假設(shè)在射擊區(qū)域內(nèi),坦克對(duì)某一目標(biāo)的毀傷概率和該目標(biāo)對(duì)坦克的毀傷概率保持不變,我方各坦克最多發(fā)射次,各次發(fā)射相互獨(dú)立。
我方指派輛坦克對(duì)目標(biāo)實(shí)施打擊,我方在第1次射擊即毀傷目標(biāo)的概率為
(2)
我方坦克第2次射擊發(fā)生在敵目標(biāo)第1輪打擊后,第2輪射擊坦克毀傷目標(biāo)的概率為
(3)
式中:為無窮小值,滿足=1,=0。()為目標(biāo)射擊結(jié)果標(biāo)記值,當(dāng)()=1,表示目標(biāo)第次射擊毀傷我方一輛坦克,當(dāng)()=0,表示目標(biāo)第次射擊未能毀傷我方坦克。
第3次射擊毀傷目標(biāo)的概率為
(4)
第次射擊毀傷目標(biāo)的概率為
(5)
綜上所述,我方輛坦克能在次射擊內(nèi),毀滅目標(biāo)的概率為
(6)
模型M1是一種WTA模型,是一個(gè)典型的NP問題,隨著坦克數(shù)量和目標(biāo)數(shù)量的增多,解空間呈指數(shù)規(guī)律增長,模型M2雖然不是NP問題,但是隨著坦克數(shù)量和可選射擊區(qū)域的增多,解空間的數(shù)量也較大,且模型M2的求解需要以模型M1的結(jié)果為基礎(chǔ),是一種雙層迭代,計(jì)算量巨大。本文針對(duì)模型M1和模型M2分別對(duì)ABC算法進(jìn)行有針對(duì)性的設(shè)計(jì)和調(diào)整,以提高算法求解模型的收斂速度和收斂精度。
ABC算法是模擬蜜蜂采蜜行為的群智能算法,具有收斂良好、參數(shù)少、實(shí)現(xiàn)流程簡單等優(yōu)點(diǎn)。人工蜂群由雇傭蜂、觀察蜂和偵查蜂組成。每個(gè)蜜蜂所在的位置即為一個(gè)可行解,所在位置對(duì)應(yīng)蜜源的質(zhì)量為解的質(zhì)量。
211 初始化
對(duì)于一個(gè)維問題,每個(gè)蜜源的位置向量=[1,2,…,](=1,2,…,SN),SN表示種群個(gè)數(shù)。蜜源初始位置隨機(jī)產(chǎn)生,解空間上限=[ub,ub,…,ub],下限=[lb,lb,…,lb],初始蜜源位置(即初始解)為
=lb+(ub-lb)·rand(0,1)
(7)
式中:=1,2,…,SN;=1,2,…,;為向量的第維變量;rand(0,1)是[0,1]上的隨機(jī)數(shù)。
212 雇傭蜂
每一個(gè)蜜源對(duì)應(yīng)一個(gè)雇傭蜂,蜜源處的雇傭蜂隨機(jī)選擇另一只蜜源處的蜜蜂進(jìn)行鄰域搜索并更新位置,獲得新的蜜源:
=+(-)·rand(-1,1)
(8)
式中:為向量的第維變量;rand(-1,1)為[-1,1]上均勻分布的隨機(jī)數(shù);∈{1,2,…,SN},且滿足≠。獲得新的蜜源后,按照貪婪選擇的方式更新蜜源。如果新的蜜源的質(zhì)量高于原蜜源的質(zhì)量,則取代;否則保持不變,迭代重復(fù)值trial加1,迭代重復(fù)值trial表示經(jīng)過多次搜索,蜜源質(zhì)量仍沒有得到改善。
213 觀察蜂
雇傭蜂更新一輪后,將蜜源信息分享給觀察蜂,觀察蜂根據(jù)蜜源的質(zhì)量進(jìn)行概率選擇。第個(gè)蜜源被觀察蜂選擇的概率為
(9)
適應(yīng)度值fit按照下式計(jì)算:
(10)
式中:是第個(gè)蜜源的評(píng)價(jià)值,由所求解問題的目標(biāo)函數(shù)計(jì)算得。
觀察蜂依據(jù)概率選擇蜜源,與雇傭蜂相同,按照式(8)進(jìn)行搜索。
214 偵查蜂
當(dāng)雇傭蜂和觀察蜂多次搜索未發(fā)生更新,即trial>limit時(shí),則放棄該蜜源,變?yōu)閭刹榉?偵查蜂按照式(7)隨機(jī)初始化一個(gè)新的蜜源代替。
坦克火力分配模型是一個(gè)典型的WTA模型,群智能算法是WTA模型求解的一個(gè)重要工具,學(xué)者對(duì)粒子群算法、協(xié)同拍賣算法、禁忌搜索算法、遺傳算法、ABC算法等進(jìn)行改進(jìn),用來解決WTA問題,顯著提高了算法的收斂速度和收斂精度。本文針對(duì)提出的坦克火力分配模型特點(diǎn),對(duì)ABC算法進(jìn)行有針對(duì)性的設(shè)計(jì)。
2.2.1 初始化策略和偵察蜂策略
標(biāo)準(zhǔn)ABC算法種群初始化采取式(7)從整個(gè)解空間中隨機(jī)選擇,缺乏方向性,產(chǎn)生高質(zhì)量解的概率較低。本文提出基于毀傷概率的種群初始化方法。初始化的解向量中,第個(gè)元素等于的概率為
(11)
式中:為坦克對(duì)目標(biāo)的命中概率。
采用式(11)進(jìn)行初始化,使坦克更傾向于選擇有較大命中概率的目標(biāo)作為打擊對(duì)象,更容易產(chǎn)生高質(zhì)量的初始解。另外,當(dāng)雇傭蜂或觀察蜂放棄當(dāng)前蜜源,變?yōu)閭刹榉鋾r(shí),也采取式(11)的方式產(chǎn)生新解。
222 搜索策略
標(biāo)準(zhǔn)ABC算法中,雇傭蜂和觀察蜂都采用式(8)進(jìn)行搜索,雇傭蜂是盲目搜索,沒有任何方向性,只在進(jìn)行貪婪選擇時(shí)確保優(yōu)質(zhì)解被保留,觀察蜂在選擇鄰居時(shí),傾向于選擇適應(yīng)度高的個(gè)體作為鄰居,有一定的方向性,但是針對(duì)WTA這類整數(shù)規(guī)劃問題,收斂性不強(qiáng)。另外,在WTA的決策變量中,解向量中元素值代表的是目標(biāo)的編號(hào),不具有數(shù)字的意義。例如,當(dāng)坦克打擊目標(biāo)9獲得高打擊收益,而坦克打擊目標(biāo)1獲得低打擊收益,采用式(8)進(jìn)行優(yōu)質(zhì)解引導(dǎo),可能會(huì)產(chǎn)生坦克對(duì)目標(biāo)5進(jìn)行打擊,但是1、5、9僅僅是坦克的編號(hào),這種引導(dǎo)沒有實(shí)際意義?;谝陨戏治?本文對(duì)搜索策略進(jìn)行如下改進(jìn)。
(1) 雇傭蜂鄰域最優(yōu)解引導(dǎo)策略
雇傭蜂階段應(yīng)側(cè)重探索能力,提高發(fā)現(xiàn)優(yōu)良區(qū)域的概率。在雇傭蜂之間建立信息交互機(jī)制,每只雇傭蜂擁有各自的局部視野,能夠發(fā)現(xiàn)局部視野內(nèi)的最優(yōu)解,并飛向局部最優(yōu)解。通過這種方式,在雇傭蜂之間建立起了協(xié)作機(jī)制,雇傭蜂進(jìn)化策略有了方向性。
定義雇傭蜂與距離公式:
(12)
式中:bool為邏輯判斷函數(shù),當(dāng)括號(hào)中內(nèi)容為true時(shí),bool值為1,當(dāng)括號(hào)中內(nèi)容為false時(shí),bool值為0
定義雇傭蜂視野范圍:
(13)
(2) 觀察蜂全局精英引導(dǎo)策略
觀察蜂擁有全局視野,能夠發(fā)現(xiàn)全局的精英解,并飛向精英解所在位置。選擇種群中適應(yīng)度值最高的一部分群體組成精英群體,觀察蜂隨機(jī)選擇精英解并接受引導(dǎo)。精英的數(shù)量
=ceil(·SN)
(14)
式中:為精英解比例;ceil(·)為向上取整函數(shù)。
(3) 替代策略
由于解向量中元素值不具備數(shù)字意義,固摒棄式(8)搜索方式,采取精英解(或鄰域最優(yōu)解)相應(yīng)元素直接替代策略。
雇傭蜂搜索方程為
(15)
觀察蜂搜索方程為
=gelite,
(16)
式中:表示隨機(jī)選擇的一個(gè)全局精英解。
223 選擇策略
采用貪婪算法對(duì)雇傭蜂和觀察蜂搜索之后的新舊解進(jìn)行選擇,該策略會(huì)造成過收斂,陷入局部最優(yōu),本文提出-貪心策略,更新過程中當(dāng)新解適應(yīng)度值高于舊解,以的概率選擇新解,以1-的概率維持舊解。
-貪心策略公式為
(17)
224 算法偽代碼
坦克火力分配模型改進(jìn)ABC算法偽代碼如算法1所示。
算法 1 坦克火力分配模型改進(jìn)ABC算法01初始化:根據(jù)式(11)產(chǎn)生SN個(gè)初始解x1,x2,…,xSN,根據(jù)式(10)計(jì)算初始解的適應(yīng)度值fit(x1),fit(x2),…,fit(xSN)02while FES
坦克陣地部署是確定從集結(jié)區(qū)域開進(jìn)到各作戰(zhàn)區(qū)域的坦克數(shù)量,為實(shí)現(xiàn)火力協(xié)同打下基礎(chǔ)。坦克陣地部署也是一個(gè)整數(shù)規(guī)劃模型,與火力分配模型不同的是,坦克陣地部署中,變量值具有數(shù)字的意義,表示該區(qū)域被分配的坦克數(shù)量,因此觀察蜂的引導(dǎo)方程具備方向性。另外,模型M2中的約束條件在算法尋優(yōu)中較苛刻,搜索過程中非常容易超出可行域,造成計(jì)算資源浪費(fèi)?;谝陨?本文提出針對(duì)坦克陣地部署的ABC算法。
2.3.1 雇傭蜂
采取式(12)和式(13)求取雇傭蜂的鄰域最優(yōu)解,采用下式進(jìn)行更新:
(18)
為避免新解超出可行域,直接引入修正算子
(19)
232 觀察蜂
觀察蜂隨機(jī)選擇全局精英解,并接受其引導(dǎo):
(20)
修正算子:
(21)
式中:為隨機(jī)選擇的一個(gè)精英解。
233 選擇策略
采用-貪婪選擇策略對(duì)雇傭蜂和觀察蜂搜索之后的新舊解進(jìn)行選擇,同式(17)。
234 算法偽代碼
坦克陣地部署改進(jìn)算法偽代碼如算法2所示。
算法 2 坦克陣地部署模型改進(jìn)ABC算法01初始化:隨機(jī)產(chǎn)生SN個(gè)初始解y1,y2,…,ySN,根據(jù)式(10)計(jì)算初始解的適應(yīng)度值fit(y1),fit(y2),…,fit(ySN)02while FES
本節(jié)為了驗(yàn)證算法1和算法2的性能以及雙層迭代優(yōu)化策略的科學(xué)性,共設(shè)置3個(gè)實(shí)驗(yàn)。首先驗(yàn)證算法1用于求解坦克火力分配模型的性能,設(shè)置小、中、大3種規(guī)模戰(zhàn)例進(jìn)行實(shí)驗(yàn)驗(yàn)證,采取同樣用于解決WTA問題的改進(jìn)群智能算法作為對(duì)比,證明算法1的進(jìn)步性。然后,驗(yàn)證算法2用于求解坦克陣地部署模型的性能,同樣設(shè)置小、中、大3種規(guī)模戰(zhàn)例進(jìn)行比較實(shí)驗(yàn),與經(jīng)過benchmark檢驗(yàn)的改進(jìn)群智能算法比較,證明算法2中對(duì)ABC改進(jìn)和設(shè)計(jì)的合理性。最后,用本文的雙層迭代算法與文獻(xiàn)[29]的層次風(fēng)驅(qū)動(dòng)優(yōu)化(wind driven optimization, WDO)算法進(jìn)行對(duì)比,證明本文雙層迭代尋優(yōu)策略的有效性。
共設(shè)定小規(guī)模、中規(guī)模、大規(guī)模3種戰(zhàn)例,每種規(guī)模下,隨機(jī)生成3組坦克陣地部署向量,各組測試的坦克數(shù)量、射擊區(qū)域數(shù)量、目標(biāo)數(shù)量及陣地部署方案設(shè)定如表1所示。坦克位于各射擊區(qū)域時(shí)對(duì)目標(biāo)毀傷概率如表2所示,目標(biāo)對(duì)各射擊區(qū)域內(nèi)坦克的毀傷概率如表3所示。小規(guī)模戰(zhàn)例共有10輛坦克,采用表中目標(biāo)1~3、射擊區(qū)域1~4的數(shù)據(jù),中規(guī)模戰(zhàn)例共有20輛坦克,采用表中目標(biāo)1~7、射擊區(qū)域1~7的數(shù)據(jù),大規(guī)模戰(zhàn)例共有40輛坦克,采用表中目標(biāo)1~15、射擊區(qū)域1~10的數(shù)據(jù)。為簡便起見,所有戰(zhàn)例均為我方坦克先發(fā),最多射擊3次,目標(biāo)價(jià)值均為1。通過窮舉的方式求得最優(yōu)火力分配方案下的打擊效益。最優(yōu)打擊效益和所需評(píng)價(jià)次數(shù)見表6??梢钥闯?采用窮舉法所需的函數(shù)評(píng)價(jià)次數(shù)遠(yuǎn)遠(yuǎn)大于群智能算法的函數(shù)評(píng)價(jià)次數(shù)。
表1 戰(zhàn)例設(shè)定
表2 射擊區(qū)域?qū)δ繕?biāo)毀傷概率
表3 目標(biāo)對(duì)射擊區(qū)域坦克毀傷概率
表4 最優(yōu)打擊效益和評(píng)價(jià)次數(shù)
為了驗(yàn)證算法1的性能,將算法1與ABC-NEH(Nawaz,Enscore,Ham)算法、隨機(jī)鄰域的自適應(yīng)差分進(jìn)化(random neighborhood adaptive differential evolution, RNADE)算法、IABC(ABC with heuristic factor initialization)算法和標(biāo)準(zhǔn)ABC算法進(jìn)行對(duì)比實(shí)驗(yàn),3種規(guī)模下算法的最大函數(shù)評(píng)價(jià)次數(shù)分別為2 000、16 000、40 000。每組實(shí)驗(yàn)各算法獨(dú)立運(yùn)行100遍。5種算法實(shí)驗(yàn)測試報(bào)告如表5所示。
表5 5種算法求解M1實(shí)驗(yàn)測試報(bào)告
Mean表示算法求得的打擊效益值與戰(zhàn)例的理論最高效益值的差值的均值,Mean越接近0算法收斂性越好;Std表示各獨(dú)立實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)差,Std越小算法穩(wěn)定性越好。SR(100%)表示函數(shù)值在最大函數(shù)評(píng)價(jià)次數(shù)內(nèi)收斂到最優(yōu)值的概率,SR(99%)表示函數(shù)值在最大函數(shù)評(píng)價(jià)次數(shù)內(nèi)收斂到0.99·的概率。從表5中數(shù)據(jù)可以看出,本文算法在小、中、大規(guī)模戰(zhàn)例中均表現(xiàn)最好,小規(guī)模戰(zhàn)例中,在規(guī)定評(píng)價(jià)次數(shù)內(nèi)以100%的概率收斂到全局最優(yōu);中規(guī)模戰(zhàn)例中以95%以上的概率收斂到0.99·;大規(guī)模戰(zhàn)例中,以平均71%的概率收斂到0.99·。在算法的平均收斂精度(Mean)、收斂穩(wěn)定性(Std)指標(biāo)中,本文算法均優(yōu)于對(duì)比算法。
為了更直觀地展示各算法的收斂過程,3種規(guī)模戰(zhàn)例、3種不同陣地部署方案下的火力分配模型的平均收斂曲線如圖3~圖5所示??梢钥闯?本文算法的收斂速度和收斂精度均優(yōu)于其他算法。由于本文采取基于毀傷概率選擇的種群初始化方法,初始解質(zhì)量明顯優(yōu)于文獻(xiàn)[20]、文獻(xiàn)[21]和文獻(xiàn)[23]的方法,文獻(xiàn)[22]方法采用NEH的初始化方法,種群初始化水平也較高,但是該方法僅能在種群初始化階段使用,且NEH方法產(chǎn)生的種群數(shù)量較少,而本文的初始化公式既可以在種群初始化時(shí)起作用,也能在偵察蜂階段起到一定的方向性指引作用。文獻(xiàn)[20]、文獻(xiàn)[22]和文獻(xiàn)[23]算法和本文的算法均優(yōu)于標(biāo)準(zhǔn)ABC算法,說明對(duì)群智能算法的改進(jìn)是有意義的。
圖3 小規(guī)模戰(zhàn)例火力分配模型平均收斂曲線Fig.3 Average convergence curve of small-scale battles firepower allocation
圖4 中規(guī)模戰(zhàn)例火力分配模型平均收斂曲線Fig.4 Average convergence curve of middle-scale battles firepower allocation
圖5 大規(guī)模戰(zhàn)例火力分配模型平均收斂曲線Fig.5 Average convergence curve of large-scale battles firepower allocation
在算法1的基礎(chǔ)上,對(duì)算法2的性能進(jìn)行驗(yàn)證。實(shí)驗(yàn)數(shù)據(jù)仍采用表2和表3中的坦克毀傷目標(biāo)概率和目標(biāo)毀傷坦克概率。坦克陣地部署模型是本文提出的原創(chuàng)模型,文獻(xiàn)中沒有針對(duì)該模型改進(jìn)群智能算法,所以選擇在benchmark上取得優(yōu)良效果的算法作為對(duì)比算法,對(duì)比算法均采用罰函數(shù)應(yīng)對(duì)約束條件。即
小、中、大3種規(guī)模戰(zhàn)例中,最大函數(shù)適應(yīng)度評(píng)價(jià)次數(shù)分別為500,2 000,8 000。4種指標(biāo)Mean、Std、SR(100%)和SR(99%)的意義同實(shí)驗(yàn)1。通過窮舉的方式,預(yù)先求得小規(guī)模戰(zhàn)例和中規(guī)模戰(zhàn)例的和,大規(guī)模戰(zhàn)例由于解空間太大,無法通過窮舉法獲得最優(yōu)解,以所有次實(shí)驗(yàn)獲得的最優(yōu)值近似看作大規(guī)模戰(zhàn)例的,如表6所示。
表6 最優(yōu)陣地部署方案及打擊效益
為了驗(yàn)證算法2的性能,將算法2與qABC(quick ABC)、基于基因重組的人工蜂群 (ABC algorithm with gene recombination, GRABC)算法、eABC(ABC algorithm with elite guidance)和標(biāo)準(zhǔn)ABC算法進(jìn)行對(duì)比實(shí)驗(yàn)。底層循環(huán)均采用本文的算法1。每組實(shí)驗(yàn)各算法獨(dú)立運(yùn)行25次。5種算法求解M2實(shí)驗(yàn)測試報(bào)告如表7所示。收斂曲線如圖6所示。可以看出,除了大規(guī)模戰(zhàn)例中eABC算法的標(biāo)準(zhǔn)差略小于本文算法,其他指標(biāo)均為本文算法最優(yōu),本文算法的收斂速度和收斂精度優(yōu)于其他算法。需要說明的是,實(shí)驗(yàn)2不能證明本文算法優(yōu)于4種對(duì)比算法,因?yàn)楸疚乃惴ㄊ浅浞掷媚P偷南闰?yàn)知識(shí)和特定規(guī)律而有針對(duì)性的設(shè)計(jì)和調(diào)整,但是僅針對(duì)本文的陣地部署模型,本文算法在收斂速度和收斂精度上有明顯優(yōu)勢,這種特定的設(shè)計(jì)是具有實(shí)用意義的。
大規(guī)模戰(zhàn)例的最優(yōu)陣地部署和火力分配決策如圖1所示。40輛坦克從集結(jié)區(qū)域,向10個(gè)射擊區(qū)域開進(jìn),各射擊區(qū)域分配的坦克數(shù)量為6、2、6、2、7、3、2、6、3、3,坦克到達(dá)射擊區(qū)域后對(duì)15個(gè)目標(biāo)進(jìn)行打擊,可以看出,每個(gè)目標(biāo)被分配的坦克數(shù)量均為2或3,考慮到共有40輛坦克、15個(gè)目標(biāo),這屬于典型的分火射擊,這是與實(shí)驗(yàn)中設(shè)定所有目標(biāo)價(jià)值均為1有關(guān),如果某目標(biāo)戰(zhàn)略地位較高,可設(shè)定高價(jià)值,模型和算法就會(huì)輸出集火射擊決策。
表7 5種算法求解M2實(shí)驗(yàn)測試報(bào)告
圖6 陣地部署模型平均收斂曲線Fig.6 Average convergence curve of force allocation model
本實(shí)驗(yàn)將文獻(xiàn)[29]的WDO算法作為對(duì)比算法,以證明本文算法雙層迭代結(jié)構(gòu)的合理性。層次WDO算法求解過程簡述如下:
設(shè)定兩層WDO算法的種群規(guī)模、迭代次數(shù)參數(shù);
初始化上層、下層初始解、;
定住上層決策變量,在約束條件范圍內(nèi),用WDO算法對(duì)下層模型優(yōu)化求解,更新下層解;
定住下層決策變量,在約束條件范圍內(nèi),用WDO算法對(duì)上層規(guī)劃優(yōu)化求解,更新上層解;
輸出最優(yōu)解、。
對(duì)比算法與本文算法采用相同的編碼方式。由于對(duì)比算法采用的是“一定一動(dòng)”交互迭代,無法獨(dú)立分析各層的尋優(yōu)能力,以最終尋優(yōu)結(jié)果作為比較對(duì)象。本文算法和層次WDO求解雙層迭代模型的結(jié)果對(duì)比如圖7所示。
圖7 本文算法和WDO算法求解模型結(jié)果對(duì)比Fig.7 Results comparison of solving the model by the proposed algorithm and WDO
從圖7中可以看出,本文算法比WDO算法收斂精度更優(yōu),說明了本文提出的雙層迭代尋優(yōu)策略的有效性。WDO算法效果不理想的原因是該方法采用“一定一動(dòng)”的交互迭代方式,對(duì)底層WTA問題沒有充分尋優(yōu),而且火力分配和兵力問題是相互影響的,上層決策的變化會(huì)影響下層決策的科學(xué)性。本文雙層迭代算法是在上層迭代計(jì)算中調(diào)用下層尋優(yōu)計(jì)算的結(jié)果,可以有效地克服這一問題。上層迭代是以下層最優(yōu)決策為基礎(chǔ),本質(zhì)上是將上、下兩層的迭代獨(dú)立開,避免相互影響。實(shí)驗(yàn)一中的數(shù)據(jù)顯示下層迭代在中、小規(guī)模戰(zhàn)例中,以接近100%的概率收斂到0.99·、大規(guī)模戰(zhàn)例中以平均71%的概率收斂到0.99,對(duì)下層迭代的充分開發(fā)以及下層優(yōu)化算法的高收斂精度為上層迭代打下良好基礎(chǔ)。
本文針對(duì)坦克分隊(duì)進(jìn)攻戰(zhàn)斗中從集結(jié)區(qū)域到射擊區(qū)域進(jìn)軍以及射擊區(qū)域的火力打擊中的決策問題,在考慮雙方對(duì)抗關(guān)系的基礎(chǔ)上,提出坦克火力分配模型和坦克陣地部署,為解決坦克分隊(duì)兵力部署和火力協(xié)同提供了一種定量的決策方法。針對(duì)模型的特點(diǎn)對(duì)ABC算法進(jìn)行有針對(duì)性的應(yīng)用和設(shè)計(jì),仿真實(shí)驗(yàn)表明采用的ABC算法在特定模型上收斂速度和收斂精度明顯提高,在相同的適應(yīng)度評(píng)估下,得到了更好的解決方案質(zhì)量,可以顯著提高作戰(zhàn)中指揮決策的時(shí)效性和科學(xué)性。
下一步研究擬進(jìn)一步充實(shí)陣地部署模型,結(jié)合實(shí)際戰(zhàn)場情況,增加陣地部署模型的變量和影響行軍的因素,比如進(jìn)軍途中的行進(jìn)間射擊和受到目標(biāo)伏擊情況,以及考慮行軍隊(duì)形對(duì)作戰(zhàn)的影響。