孫文娟許 可宮 華
(1.沈陽(yáng)理工大學(xué)理學(xué)院,沈陽(yáng) 110159;2.遼寧省兵器工業(yè)智能優(yōu)化與控制重點(diǎn)實(shí)驗(yàn)室,沈陽(yáng) 110159)
火力分配是指根據(jù)作戰(zhàn)目標(biāo)、戰(zhàn)場(chǎng)態(tài)勢(shì)、武器性能等因素,將不同類型和一定數(shù)量的火力單元針對(duì)來(lái)襲目標(biāo)以某種準(zhǔn)則進(jìn)行分配,以有效攻擊敵方目標(biāo)的過(guò)程。 在地對(duì)空防御體系中,火力分配是決定作戰(zhàn)效果的關(guān)鍵因素,其任務(wù)是針對(duì)多個(gè)來(lái)襲目標(biāo),防御方能及時(shí)有效地分配防御武器,消除敵方威脅,使防御方所遭受的損失減少到最小[1]。 在火力分配問(wèn)題的解決方案中,主要考慮的優(yōu)化目標(biāo)包括整體打擊效能最大[2]、防御方資源損失最小[3]、來(lái)襲目標(biāo)生存概率最小[4]以及被保護(hù)資產(chǎn)存留價(jià)值最大[5]等。 采用的優(yōu)化方法主要包括近似動(dòng)態(tài)規(guī)劃方法[6],混合遺傳算法[7],蟻群算法[8]、蜂群算法[9]、布谷鳥(niǎo)搜索算法[10]、生物地理學(xué)優(yōu)化[11]等智能優(yōu)化算法。
在火力分配問(wèn)題中,攻擊方和防御方之間往往存在著利益沖突。 對(duì)于某一方來(lái)說(shuō),不同優(yōu)化目標(biāo)之間也存在著對(duì)武器資源的競(jìng)爭(zhēng),而優(yōu)化模型很難考慮各競(jìng)爭(zhēng)主體之間的沖突關(guān)系。 非合作博弈理論主要用于解決有約束、多人多目標(biāo)且目標(biāo)函數(shù)相互矛盾的決策問(wèn)題,是研究具有競(jìng)爭(zhēng)現(xiàn)象的理論和方法,因此非合作博弈建模是解決多目標(biāo)火力分配問(wèn)題的有效工具。 針對(duì)火力分配中的競(jìng)爭(zhēng)問(wèn)題,大多以攻防雙方為博弈方,考慮不同的收益函數(shù),基于博弈理論建立相應(yīng)的火力分配模型。 張毅等[12]、Galati[13]、馬飛等[14]分別以作戰(zhàn)效能、目標(biāo)毀傷概率、目標(biāo)生存價(jià)值為收益,建立火力分配非合作博弈模型,采用啟發(fā)式遺傳-蟻群優(yōu)化算法及鄰域搜索算法進(jìn)行求解。 曾松林等[15]、周興旺等[16]針對(duì)火力資源分配問(wèn)題,分別建立動(dòng)態(tài)博弈模型及貝葉斯混合博弈模型,利用混合粒子群算法求解納什均衡。 針對(duì)多目標(biāo)火力分配問(wèn)題,趙玉亮等[17]、Leboucher 等[18]分別建立了雙矩陣博弈模型及演化博弈模型,采用粒子群算法求解。 綜上可知,在利用博弈理論研究火力分配問(wèn)題時(shí),考慮攻防雙方之間競(jìng)爭(zhēng)現(xiàn)象的較多。 而在多目標(biāo)火力分配問(wèn)題中,各優(yōu)化目標(biāo)之間同樣存在對(duì)武器資源的競(jìng)爭(zhēng),利用博弈理論研究多目標(biāo)火力分配問(wèn)題,通過(guò)納什均衡分配方案,使目標(biāo)之間的博弈策略實(shí)現(xiàn)最優(yōu),可以在保證作戰(zhàn)效能的同時(shí),得到滿足多方利益的均衡火力分配方案。
本文針對(duì)地對(duì)空防御中的火力分配問(wèn)題,以最大化總體毀傷概率和最小化使用武器價(jià)值為優(yōu)化目標(biāo),通過(guò)將優(yōu)化目標(biāo)映射為博弈方建立非合作博弈模型,結(jié)合禁忌搜索技術(shù)設(shè)計(jì)改進(jìn)遺傳算法NE-IGA 尋求納什均衡解,從而獲得使優(yōu)化目標(biāo)間達(dá)到均衡的地對(duì)空防御火力分配決策方案。
在地對(duì)空防御火力分配問(wèn)題中,一般包含空中進(jìn)攻和地面防御兩種力量,分別記為敵方和我方。 假設(shè)在某次作戰(zhàn)中,敵方有n個(gè)空中來(lái)襲目標(biāo)攻擊我方陣地,我方防御陣地中有r種武器單元,第i(i=1,2,…,r)種武器單元中有mi個(gè)武器可用于防御,且不同性能的武器具有不同的作戰(zhàn)效能。 并進(jìn)一步假設(shè)如下:
1)每個(gè)武器只能攻打一個(gè)來(lái)襲目標(biāo),每個(gè)來(lái)襲目標(biāo)可以被多個(gè)武器攻打;
2)同種武器對(duì)同一來(lái)襲目標(biāo)的毀傷概率相同;
3)我方武器可以精準(zhǔn)打擊在攻擊能力范圍內(nèi)的來(lái)襲目標(biāo)。
火力分配的任務(wù)是為各個(gè)來(lái)襲目標(biāo)分配武器,達(dá)成在武器資源使用較少的基礎(chǔ)上毀傷效果最好的結(jié)果。
相關(guān)參數(shù)及變量說(shuō)明見(jiàn)表1。
表1 參數(shù)及變量說(shuō)明表
本文利用毀傷概率衡量火力分配方案的毀傷效果,在滿足作戰(zhàn)要求的前提下,通過(guò)攻擊空中來(lái)襲目標(biāo),使其毀傷概率達(dá)到最大,同時(shí)最小化我方武器資源的價(jià)值。 因此,目標(biāo)函數(shù)描述為
式中:f1為對(duì)所有來(lái)襲目標(biāo)的總毀傷概率;f2為使用武器的總價(jià)值。
為保障攻擊效果,在我方有一定數(shù)量武器的前提下,要求總毀傷概率不低于p,因此模型應(yīng)滿足以下約束,其中i=1,2,…,r。
考慮到來(lái)襲目標(biāo)的總體毀傷概率和使用武器的總價(jià)值兩個(gè)目標(biāo)函數(shù)之間存在著對(duì)武器資源的競(jìng)爭(zhēng),本文利用非合作博弈建模方法求解多目標(biāo)優(yōu)化問(wèn)題。 以兩個(gè)目標(biāo)函數(shù)作為博弈方,分別表示為毀傷概率P和武器價(jià)值V,建立非合作博弈模型G={P,V;S1,S2;U1,U2},其中S1、S2分別表示博弈方P和V的策略集,U1、U2分別表示博弈方P和V的收益。
1)策略及策略組合。 令s1表示博弈方P對(duì)部分武器單元的決策,s2表示博弈方V對(duì)剩余部分武器單元的決策,構(gòu)成策略組合s,s=(s1,s2),其中s1∈S1,s2∈S2。 策略組合s對(duì)應(yīng)一個(gè)火力分配方案{X1,X2,…,Xr},其中Xi(i=1,2,…,r)表示博弈方對(duì)第i種武器單元的決策,用mi×n階矩陣表示為
滿足式(3) ~(5)的策略組合為可行策略組合,所有可行策略組合s的集合等價(jià)于多目標(biāo)優(yōu)化問(wèn)題的可行域。
2)收益函數(shù)。 為了統(tǒng)一博弈方收益的優(yōu)化方向,令U1=f1,U2=-f2。
3)納什均衡。 在博弈G={P,V;S1,S2;U1,U2}中,如果對(duì)任一博弈方K(K=1,2),策略組合滿足
基于地對(duì)空防御火力分配問(wèn)題非合作博弈模型,將多目標(biāo)優(yōu)化問(wèn)題轉(zhuǎn)化為滿足式(7)的納什均衡的求解。
當(dāng)來(lái)襲目標(biāo)和防御武器數(shù)量較多時(shí),由于解空間較大,根據(jù)式(7)利用定義求解納什均衡比較困難。 遺傳算法(GA)以其全局尋優(yōu)、魯棒性強(qiáng)等特點(diǎn),被廣泛應(yīng)用于各個(gè)領(lǐng)域,但在進(jìn)化后期,收斂速度較慢,容易陷入局部最優(yōu)。 而禁忌搜索的核心思想是標(biāo)記對(duì)應(yīng)已搜索的局部最優(yōu)解的對(duì)象,并在以后的迭代搜索中盡量避開(kāi),從而保證多樣化的有效搜索[19]。 因此,本文結(jié)合禁忌搜索技術(shù)設(shè)計(jì)基于納什均衡的改進(jìn)遺傳算法NE-IGA 求解火力分配問(wèn)題的博弈模型,從而避免算法早熟收斂,優(yōu)化算法性能。
針對(duì)地對(duì)空防御火力分配問(wèn)題,采用實(shí)數(shù)編碼表示待優(yōu)化問(wèn)題的解。 將各武器按照武器單元順序編號(hào),設(shè)武器總數(shù)為m,來(lái)襲目標(biāo)總數(shù)為n,用(c1,c2,…,cm)表示火力分配問(wèn)題的一個(gè)方案。其中ck(k=1,2,…,m)為0 ~n的整數(shù),ck=0 表示第k個(gè)武器不攻打,ck=j(luò)(j=1,2,…,n)表示第k個(gè)武器攻打第j個(gè)來(lái)襲目標(biāo)。 如有兩個(gè)武器單元,共有6 個(gè)武器,武器數(shù)量分別為2 和4,則個(gè)體編碼(2,3,0,1,4,3)中的基因“2”表示武器單元1中的第1 個(gè)武器攻打第2 個(gè)來(lái)襲目標(biāo);基因“0”表示武器單元2 中的第1 個(gè)武器不攻打任何來(lái)襲目標(biāo)。
多目標(biāo)博弈中的納什均衡,每一個(gè)優(yōu)化目標(biāo)的決策都是給出其他優(yōu)化目標(biāo)策略后的最佳策略。 納什均衡求解算法的主要目的是使各優(yōu)化目標(biāo)盡可能地逼近自己的最優(yōu)解,并且不損害其他優(yōu)化目標(biāo)的利益。 為求解博弈模型的納什均衡,定義NJ為
式中:NJ為判斷第J個(gè)個(gè)體是否為納什均衡的指標(biāo)和分別為當(dāng)前種群中個(gè)體J的毀傷概率和武器價(jià)值;maxf1和minf2分別為各單目標(biāo)下的最優(yōu)毀傷概率及最優(yōu)武器價(jià)值。 當(dāng)越接近越接近minf2時(shí),第J個(gè)個(gè)體對(duì)應(yīng)的NJ就會(huì)越小。 此時(shí),每一個(gè)目標(biāo)函數(shù)都在試圖逼近其最優(yōu)值,并且任一目標(biāo)函數(shù)都不能單獨(dú)決定多目標(biāo)問(wèn)題的解。 尋求NJ的最小值,就等價(jià)于尋求納什均衡。
3.3.1初始化參數(shù)
初始化問(wèn)題及算法參數(shù),其中火力分配問(wèn)題參數(shù):武器個(gè)數(shù)m,來(lái)襲目標(biāo)數(shù)n,優(yōu)化目標(biāo)f1和f2;遺傳算法參數(shù):種群大小Pos,最大迭代次數(shù)MI,交叉概率Pc,相似度t,納什均衡因子ε。 按照編碼規(guī)則隨機(jī)生成Pos個(gè)初始個(gè)體。
3.3.2選擇算子
采用二元錦標(biāo)賽選擇操作,在當(dāng)前種群中隨機(jī)選擇兩個(gè)個(gè)體,將適應(yīng)度值大的個(gè)體放入下一代種群,較小的放回原種群,以參加下一次選擇。
3.3.3交叉算子
為避免基本遺傳算法容易早熟的缺點(diǎn),采用兩點(diǎn)交叉方式,并利用禁忌搜索技術(shù)改進(jìn)交叉操作,產(chǎn)生子代個(gè)體。
1)在0 和1 之間生成隨機(jī)數(shù)rand(0,1),若rand(0,1)小于交叉概率Pc,進(jìn)行兩點(diǎn)交叉,即隨機(jī)選擇兩個(gè)交叉點(diǎn),交換兩個(gè)父代個(gè)體中位于交叉點(diǎn)之間的部分基因,生成兩個(gè)子代個(gè)體;否則不進(jìn)行。
2)禁忌搜索獲取子代個(gè)體。 以父代個(gè)體的平均適應(yīng)度值作為期望水平,將父代個(gè)體的適應(yīng)度值作為禁忌對(duì)象存在禁忌表中。 若子代個(gè)體的適應(yīng)度值大于期望水平,則保留該子代個(gè)體;若小于期望水平,查看禁忌表中是否有此適應(yīng)度值,如沒(méi)有,保留該子代個(gè)體,否則選擇適應(yīng)度值高的父代個(gè)體替代該子代個(gè)體。
3.3.4變異算子
采用均勻變異方式。 應(yīng)用相似度在個(gè)體長(zhǎng)度中的占比判斷是否進(jìn)行變異操作。 相似度是指兩個(gè)個(gè)體相同位置處編碼相同的個(gè)數(shù),若相似度在整個(gè)編碼中占比大于t,則隨機(jī)生成需變異的個(gè)體位置進(jìn)行變異操作。
NE-IGA 流程如圖1 所示,其中I為當(dāng)前迭代次數(shù)。
圖1 NE-IGA 流程圖
本節(jié)通過(guò)實(shí)例驗(yàn)證求解火力分配問(wèn)題的博弈建模方法及NE-IGA 的可行性和有效性。 實(shí)驗(yàn)采用Windows 10 操作系統(tǒng)、PyCharm Community Edition 2020.3 x64 編譯環(huán)境、Python 3.8 語(yǔ)言編程實(shí)現(xiàn)。
假設(shè)我方有5 種武器單元,包括:GPS/毫米波W1,誘餌彈/箔條W2,煙霧彈W3,防空導(dǎo)彈W4以及高炮W5,各武器單元的武器價(jià)值和數(shù)量如表2 所示。 有10 個(gè)敵方來(lái)襲目標(biāo),包括兩枚BGM-109C“戰(zhàn)斧”式巡航導(dǎo)彈T1、T2,兩臺(tái)F-16C 戰(zhàn)斗機(jī)T3、T4,1 枚AGM-86 巡航導(dǎo)彈T5,1 架MQ-9“死神”無(wú)人機(jī)T6,兩架AH-64A“阿帕奇”直升機(jī)T7、T8,1 架F-22 隱形戰(zhàn)斗機(jī)T9和1 架B-52H 戰(zhàn)略轟炸機(jī)T10,敵方來(lái)襲目標(biāo)的威脅度如表3 所示,各武器對(duì)不同來(lái)襲目標(biāo)的毀傷概率如表4 所示。
表2 我方武器價(jià)值及數(shù)量
表3 敵方來(lái)襲目標(biāo)的威脅度
表4 各武器對(duì)各來(lái)襲目標(biāo)的毀傷概率
本例中,設(shè)置參數(shù)Pos =30、MI=60、Pc=0.9、t=0.94、ε=0.01;結(jié)合武器單元種類及數(shù)量,設(shè)置毀傷概率下限p=0.9。
為驗(yàn)證本文提出算法NE-IGA 的有效性,將多目標(biāo)優(yōu)化模型中目標(biāo)函數(shù)f1和f2采用線性加權(quán)方式變?yōu)閱文繕?biāo),由于兩個(gè)目標(biāo)優(yōu)化方向不同,將其權(quán)重分別取相反數(shù),并將加權(quán)后的單目標(biāo)作為適應(yīng)度函數(shù),比較基于禁忌搜索改進(jìn)的遺傳算法(TSGA)及基本遺傳算法(GA)求解結(jié)果。 其中TSGA 是在GA 的基礎(chǔ)上,利用禁忌搜索技術(shù)改進(jìn)交叉算子,改進(jìn)方法同NE-IGA。 TSGA 及GA 的選擇算子及變異算子以及算法其他參數(shù)設(shè)置同NE-IGA。 得到的火力分配方案如表5所示。
表5 三種算法獲得的火力分配方案
三種算法得到的火力分配方案的目標(biāo)函數(shù)值及武器總數(shù)如表6 所示。
表6 三種算法獲得方案的目標(biāo)函數(shù)值及武器總數(shù)
由表6 可知,與TSGA 及GA 求解多目標(biāo)優(yōu)化模型相比,本文提出的NE-IGA 求解博弈模型得到的分配方案效果較好,總體毀傷概率較高,武器價(jià)值和使用武器數(shù)量均最低。 與TSGA 相比,雖然NE-IGA 毀傷概率優(yōu)勢(shì)較小,但武器價(jià)值降低了13.2%;與GA 相比,NE-IGA 毀傷概率提高0.6%,武器價(jià)值降低了17.7%。 此外,由TSGA得到的分配方案中各目標(biāo)函數(shù)值均優(yōu)于GA。
本文利用非合作博弈理論研究地對(duì)空防御的火力分配問(wèn)題。 針對(duì)以最大化毀傷概率和最小化武器價(jià)值作為優(yōu)化目標(biāo)的多目標(biāo)優(yōu)化問(wèn)題,通過(guò)將目標(biāo)函數(shù)映射為博弈方,以對(duì)各武器的決策作為策略建立非合作博弈模型。 在遺傳算法的基礎(chǔ)上,為提高遺傳算法的尋優(yōu)能力,加入禁忌搜索技術(shù),設(shè)計(jì)了算法NE-IGA 以尋求博弈模型的納什均衡。 實(shí)驗(yàn)結(jié)果驗(yàn)證了本文模型及算法的可行性和有效性。 未來(lái)將應(yīng)用博弈理論對(duì)來(lái)襲目標(biāo)動(dòng)態(tài)到達(dá)、威脅度動(dòng)態(tài)變化等更為復(fù)雜的戰(zhàn)場(chǎng)環(huán)境進(jìn)行研究,設(shè)計(jì)更加高效的納什均衡求解算法。