宋遐淦, 江駒, 徐海燕
(1.南京航空航天大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 211106; 2.南京航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211106)
改進(jìn)模擬退火遺傳算法在協(xié)同空戰(zhàn)中的應(yīng)用
宋遐淦1, 江駒1, 徐海燕2
(1.南京航空航天大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 211106; 2.南京航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211106)
針對(duì)不確定環(huán)境下的目標(biāo)分配問題,本文建立了相應(yīng)的評(píng)估及分配模型。構(gòu)建空戰(zhàn)態(tài)勢評(píng)估指標(biāo)體系,并用區(qū)間層次分析法(interval analytic hierarchy process, IAHP)和模糊優(yōu)選法確定指標(biāo)的主客觀權(quán)重。然后建立相應(yīng)的不確定環(huán)境下多目標(biāo)優(yōu)化攻擊效能評(píng)估模型,將協(xié)同多目標(biāo)攻擊決策問題轉(zhuǎn)化為導(dǎo)彈攻擊配對(duì)優(yōu)化問題。進(jìn)一步提出一種基于區(qū)間灰數(shù)的模擬退火遺傳算法(interval grey number-simulated annealing genetic algorithm, ISAGA)用于該決策問題的求解,設(shè)計(jì)了選擇操作和相應(yīng)的模擬退火機(jī)制,有效防止算法陷入局部最優(yōu)。最后根據(jù)尋優(yōu)所得的解確定合理的攻擊方案。仿真結(jié)果表明:所提出的算法可以勝任不確定環(huán)境下目標(biāo)分配問題的評(píng)估和尋優(yōu),并且在10步以內(nèi)能夠找到比較好的解,這在一定程度上是對(duì)傳統(tǒng)的目標(biāo)分配問題的完善。
區(qū)間層次分析法; 可能度函數(shù); 區(qū)間灰數(shù); 區(qū)間遺傳算法; 模擬退火; 協(xié)同空戰(zhàn)
協(xié)同多目標(biāo)空戰(zhàn)主要包括戰(zhàn)場環(huán)境評(píng)估和火力分配兩個(gè)方面。戰(zhàn)場環(huán)境評(píng)估是指根據(jù)戰(zhàn)機(jī)本身的空戰(zhàn)能力和空戰(zhàn)態(tài)勢計(jì)算出敵方編隊(duì)?wèi)?zhàn)機(jī)對(duì)我方戰(zhàn)機(jī)的威脅評(píng)估矩陣。火力分配是指根據(jù)作戰(zhàn)目的、戰(zhàn)場態(tài)勢和武器性能等因素,將一定類型和數(shù)量的火力單元以某種準(zhǔn)則進(jìn)行分配,攻擊一定數(shù)量敵機(jī)的過程[1-2]。
戰(zhàn)場環(huán)境評(píng)估問題國內(nèi)外已經(jīng)有大量研究,算法也相對(duì)成熟,如層次分析法、逼近理想排序法[3]等。考慮在實(shí)際空戰(zhàn)中,某些信息的不確定性,一些學(xué)者針對(duì)這些“柔”性信息將傳統(tǒng)的威脅評(píng)估方法進(jìn)行了推廣,提出了基于區(qū)間的改進(jìn)的評(píng)估方法[4-5]。然而目前大多研究僅獲得基于區(qū)間的威脅權(quán)重,在應(yīng)用到協(xié)同多目標(biāo)空戰(zhàn)中時(shí)并不能給出進(jìn)一步導(dǎo)彈分配的攻擊方案。
目標(biāo)分配問題屬于一類NP-hard問題。國內(nèi)外研究以對(duì)目標(biāo)殺傷最大化為目的,采用智能優(yōu)化算法,如啟發(fā)式遺傳算法[6]、模擬退火遺傳算法[7]、蟻群算法[8]、粒子群算法[9]等對(duì)模型進(jìn)行求解。在智能優(yōu)化算法改進(jìn)方案[10-11]的研究中,雖然改進(jìn)后的智能優(yōu)化算法的快速收斂性和尋優(yōu)能力有了一定的提高,但是仍然無法處理威脅評(píng)估后的不確定信息。
1982年,鄧聚龍教授創(chuàng)立的灰色系統(tǒng)理論[12],是一種基于少數(shù)據(jù)、貧信息不確定環(huán)境下決策的有效工具。本文為了更好地處理威脅評(píng)估結(jié)果,實(shí)現(xiàn)不確定環(huán)境下的空戰(zhàn)目標(biāo)分配,引入?yún)^(qū)間灰數(shù)來表征戰(zhàn)場信息的不確定性,引入灰色系統(tǒng)理論中的“可能度”的概念很好地解決了灰區(qū)間比較的問題。通過設(shè)計(jì)合適的適應(yīng)度函數(shù)、新的區(qū)間選擇機(jī)制和模擬退火機(jī)制使遺傳算法能勝任個(gè)體適應(yīng)度為灰區(qū)間形式的尋優(yōu),在較少的迭代次數(shù)內(nèi)能得到比較接近最優(yōu)解的解。
現(xiàn)代超視距多目標(biāo)空戰(zhàn)中,目標(biāo)威脅程度取決于戰(zhàn)機(jī)本身的空戰(zhàn)能力和空戰(zhàn)態(tài)勢[13]。參考文獻(xiàn)[13]考慮先進(jìn)四代機(jī)的低探測性和超機(jī)動(dòng)性,因此在傳統(tǒng)空戰(zhàn)態(tài)勢考慮因素的基礎(chǔ)上作了一些修改,考慮角度、速度、距離、高度、隱身和空戰(zhàn)能力因素。
本文參考現(xiàn)有研究成果,計(jì)算敵方戰(zhàn)機(jī)編隊(duì)每架飛機(jī)對(duì)我方戰(zhàn)機(jī)編隊(duì)每架飛機(jī)的優(yōu)勢值,最終構(gòu)成威脅灰矩陣作為目標(biāo)分配的依據(jù)。
在權(quán)重確定時(shí)考慮主觀權(quán)重和客觀權(quán)重兩種情況。主觀權(quán)重采用層次分析法(analytic hierarchy process, AHP)。但是傳統(tǒng)AHP只能處理“剛”性信息,在構(gòu)建判斷矩陣時(shí),決策者對(duì)于復(fù)雜環(huán)境下威脅因子的評(píng)估難以給出確定的偏好,更傾向于給出一個(gè)區(qū)間,因此采用區(qū)間層次分析法來處理瞬時(shí)空戰(zhàn)態(tài)勢中的“柔”性信息??陀^權(quán)重采用模糊優(yōu)選法。
1.1運(yùn)用IAHP確定主觀權(quán)重的步驟
為了描述信息的不確定性有必要引入灰色系統(tǒng)理論中區(qū)間灰數(shù)的概念。有學(xué)者提出把不知某一確切值但只知道其取值范圍的數(shù)稱為灰數(shù),它是組成灰色系統(tǒng)的“單元”或“細(xì)胞”,常用符號(hào)“?”表示。
定義2區(qū)間灰數(shù)基本的運(yùn)算法則如下:設(shè)?1∈[a,b],a
加法運(yùn)算:?1+?2∈[a+c,b+d]
減法運(yùn)算:?1-?2∈[a-d,b-c]
乘法運(yùn)算:
?1·?2∈[min{ac,ad,bc,bd},max{ac,ad,bc,bd}]
除法運(yùn)算:
其中,c≠0,d≠0,cd>0。
3)解算權(quán)重W=(w1,w2,…,wn)T,并歸一化處理。
1.2運(yùn)用模糊優(yōu)選法確定客觀權(quán)重的步驟
1)根據(jù)文獻(xiàn)[13]中的威脅因子構(gòu)造威脅評(píng)估矩陣F,矩陣F中的第i行第j列元素fij表示目標(biāo)機(jī)j關(guān)于屬性i的威脅度值。然后,進(jìn)行無量綱化處理,得到新的相對(duì)威脅度評(píng)估矩陣μ
構(gòu)造拉格朗日函數(shù)解算出模糊優(yōu)選法確定的最終客觀權(quán)重表達(dá)式:
3)將運(yùn)用IAHP得到的主觀權(quán)重區(qū)間和運(yùn)用模糊優(yōu)選法得到的客觀權(quán)重進(jìn)行綜合計(jì)算,得到組合權(quán)重區(qū)間,即
ω=ηωs+(1-η)ωo
(1)
式中:ωs、ωο分別為主、客觀權(quán)重;η為主觀權(quán)重影響因子,可根據(jù)對(duì)專家的信任程度確定,這個(gè)組合權(quán)重能比較全面地反映威脅評(píng)估的相對(duì)重要程度。
2.1空戰(zhàn)決策問題數(shù)學(xué)模型的描述
通過上面的一系列步驟可以得到某一時(shí)刻敵機(jī)對(duì)我機(jī)的威脅灰矩陣T。另外,假設(shè)我方一個(gè)空戰(zhàn)編隊(duì)有m架飛機(jī),每架飛機(jī)擁有ri枚導(dǎo)彈,敵機(jī)n架。首先對(duì)這m架飛機(jī)的導(dǎo)彈進(jìn)行編號(hào),m架飛機(jī)共有∑ri=r枚導(dǎo)彈,導(dǎo)彈編號(hào)為k。設(shè)pkj為第k枚導(dǎo)彈攻擊第j個(gè)目標(biāo)的毀傷概率。設(shè)xkj為決策變量,xkj=1表示分配第k枚導(dǎo)彈攻擊第j個(gè)目標(biāo),xkj=0表示沒有實(shí)施攻擊,則可以建立如下協(xié)同多目標(biāo)攻擊空戰(zhàn)決策模型:
目標(biāo)函數(shù):
(2)
式中:目標(biāo)一表示剩余目標(biāo)的威脅評(píng)估函數(shù)值最小化,目標(biāo)二表示盡可能多的毀傷空戰(zhàn)目標(biāo)。
約束條件:
(3)
式中:約束條件一表示最多可以分配sj枚導(dǎo)彈攻擊第j個(gè)目標(biāo)。約束條件二表示最多可使用r枚導(dǎo)彈。約束條件三表示一枚導(dǎo)彈不能同時(shí)攻擊兩個(gè)和兩個(gè)以上的目標(biāo)。
文獻(xiàn)[14]采用線性加權(quán)法將多目標(biāo)優(yōu)化轉(zhuǎn)化為單目標(biāo)優(yōu)化,另外采用罰函數(shù)法來處理約束條件,得到最終的簡化后的目標(biāo)函數(shù)模型:
minω1F+ω2(n-E)/n+
(4)
式中:N為懲罰因子,用來對(duì)解空間中出現(xiàn)攻擊兩個(gè)目標(biāo)以上的情形進(jìn)行“懲罰”。
2.2可能度函數(shù)的描述
本文采用基于區(qū)間灰數(shù)的遺傳算法來解決多目標(biāo)空戰(zhàn)的尋優(yōu)問題,由于目標(biāo)函數(shù)中的威脅矩陣是一個(gè)灰矩陣,目標(biāo)函數(shù)計(jì)算出來的適應(yīng)度值必定是灰區(qū)間而不是“剛性”點(diǎn)數(shù)值。
但是區(qū)間灰數(shù)的排序問題至今研究比較少[15],有必要尋求一種新的適用于區(qū)間灰數(shù)的排序方法作為遺傳算法選擇操作的理論依據(jù)。
定義3設(shè)a為任意實(shí)數(shù),?∈[?-,?+]為任意區(qū)間灰數(shù),則稱
為實(shí)數(shù)a小于區(qū)間灰數(shù)?的點(diǎn)可能度函數(shù)。
定義4?1∈[?1-,?1+],?2∈[?2-,?2+]為任意兩個(gè)區(qū)間灰數(shù),?(γ)為區(qū)間灰數(shù)標(biāo)準(zhǔn)化形式。若γ1是給定的,則p(?1(γ1)2)為固定點(diǎn)?1(γ1)小于區(qū)間數(shù)?2的可能度函數(shù),那么稱
?1(γ1)2)dγ1
為區(qū)間?1小于區(qū)間?2的可能度函數(shù)。并且滿足“互補(bǔ)性”,即p(?1≥?2)=1-p(?12)
通過可能度函數(shù)的定義,可以很方便地描述某個(gè)區(qū)間相對(duì)于另一個(gè)區(qū)間“大”或者“小”的程度,因此非常適合多個(gè)灰區(qū)間的相互比較。
2.3空戰(zhàn)決策問題數(shù)學(xué)模型的修正
考慮到以下兩種情況:
1)從耗彈量的角度考慮,某些分配方案耗彈量少但是目標(biāo)函數(shù)計(jì)算出的適應(yīng)度值相差不大,這時(shí)需要進(jìn)行相應(yīng)的“獎(jiǎng)勵(lì)”。
2)從機(jī)載導(dǎo)彈發(fā)展的角度考慮,隨著導(dǎo)彈技術(shù)的發(fā)展,未來機(jī)載導(dǎo)彈可以同時(shí)攻擊多個(gè)空中目標(biāo),此時(shí)需要對(duì)模型進(jìn)行改進(jìn)。引入變量Si為一枚機(jī)載導(dǎo)彈最多可以攻擊的目標(biāo)數(shù)量。
將式(4)記為E0,對(duì)目標(biāo)函數(shù)作如下修正,修正后的目標(biāo)函數(shù)為
(5)
式中:M為導(dǎo)彈攻擊目標(biāo)超過Si的懲罰因子,P為彈藥節(jié)省的獎(jiǎng)勵(lì)因子。
設(shè)種群個(gè)體數(shù)量為N,規(guī)定迭代次數(shù)M,交叉概率為pc,變異概率為pm。為了提高搜索效率,首先產(chǎn)生N個(gè)滿足約束條件的初始解X0。利用初始解根據(jù)式(5)計(jì)算粒子的適應(yīng)度值為
當(dāng)(迭代次數(shù)小于規(guī)定的迭代次數(shù))
初始化種群
1)編碼
采用二進(jìn)制編碼,解是以矩陣形式給出,只要給出我方導(dǎo)彈總數(shù)量r和敵機(jī)數(shù)量n就可以用二進(jìn)制矩陣的形式表示出分配方式。
2)選擇操作
以f(?01)為基準(zhǔn),分別計(jì)算其他適應(yīng)度值灰區(qū)間相對(duì)于f(?01)的可能度函數(shù)值,并以此為依據(jù)用輪盤賭的方式進(jìn)行遺傳算法選擇操作。如有三個(gè)灰區(qū)間分別為 [0,1]、[0.5,1.5]、[2,3],根據(jù)式(5)可以計(jì)算出?1>?1、?2>?1、?3>?1的可能度為分別為0.5、0.875、1。為了使優(yōu)良的個(gè)體更容易被選擇,可以進(jìn)行N輪回的比較,將每輪比較后得到的可能度值進(jìn)行積累。在第二輪比較中可以得到?1>?2、?2>?2、?3>?2的可能度分別為0.125、0.5、1。第三輪?1>?3、?2>?3、?3>?3的可能度分別為0、0、0.5。最終的可能度積累可以用優(yōu)勢積累矩陣C來表示:
Cij表示第i個(gè)灰區(qū)間與第j個(gè)灰區(qū)間的比較結(jié)果,分別計(jì)算列和得到三個(gè)灰區(qū)間的累積適應(yīng)度值分別為0.625、1.375、2.5。用“歸一法”得到最終的三個(gè)個(gè)體被選擇的概率分別為0.137、0.315、0.548。本文采用聯(lián)賽制多輪比較將每個(gè)個(gè)體與其他個(gè)體比較后得到的可能度進(jìn)行累加,最終的累加值作為選擇操作評(píng)判依據(jù)。
3)交叉操作
交叉操作是采用單點(diǎn)交叉的方式。先產(chǎn)生一個(gè)隨機(jī)數(shù)r,假如r 4)變異操作 先產(chǎn)生一個(gè)隨機(jī)數(shù)r,假如r 5)模擬退火操作 首先確定當(dāng)前種群最佳個(gè)體,找出最佳染色體并通過個(gè)體得到新個(gè)體。 產(chǎn)生新個(gè)體方法:在最佳個(gè)體的基礎(chǔ)上隨機(jī)選取兩行進(jìn)行交換,然后隨機(jī)選取兩列進(jìn)行交換,這樣交換后的解依然是可行解。 定義初始溫度T0及系數(shù)γ?(0,1), 當(dāng)(T0>Tmin)時(shí) 計(jì)變異操作后的最佳個(gè)體P0,產(chǎn)生的新個(gè)體P1。計(jì)算適應(yīng)度值Fit(P0)和Fit(P1) 在本文中,p(Fit(P1) 反之,則以概率p=exp(-ΔF/T)接受劣質(zhì)個(gè)體,其中ΔF=Fit(P0)+-Fit(P1)-。 T=T×γ,判斷是否T 4.1仿真1 設(shè)我方的一個(gè)4機(jī)編隊(duì)與敵方的6架飛機(jī)進(jìn)行空戰(zhàn),假設(shè)每架飛機(jī)攜帶兩枚導(dǎo)彈。規(guī)定每個(gè)目標(biāo)最多收到兩枚導(dǎo)彈的攻擊。顯然分配方案是一個(gè)48維的離散0-1空間。設(shè)初始種群個(gè)體的數(shù)量設(shè)為40,迭代次數(shù)設(shè)為100,式(6)中兩個(gè)目標(biāo)的權(quán)重ω1和ω2設(shè)為0.6和0.4。罰因子N設(shè)為100,罰因子M設(shè)為100。獎(jiǎng)勵(lì)因子P設(shè)為0.001。8枚導(dǎo)彈對(duì)6個(gè)目標(biāo)的命中概率矩陣見表1,6個(gè)目標(biāo)對(duì)我方4個(gè)目標(biāo)的威脅值灰區(qū)間矩陣見表2(綜合威脅評(píng)估)。 表1 導(dǎo)彈對(duì)目標(biāo)的命中概率 表2 目標(biāo)對(duì)我機(jī)的威脅值灰矩陣 采用區(qū)間灰數(shù)模擬退火遺傳算法對(duì)該算例進(jìn)行仿真。每次均能快速收斂,其中一次仿真,未引入模擬退火算法仿真中綜合最佳適應(yīng)度期望值,剩余目標(biāo)期望值F評(píng)估值E的進(jìn)化曲線如圖1~3所示。可以看到未引入模擬退火時(shí)算法收斂性一般,大概在25代左右得到本次運(yùn)行的最優(yōu)解。 引入模擬退火算法仿真后綜合最佳適應(yīng)度期望值,剩余目標(biāo)期望值F和殺傷目標(biāo)期望評(píng)估值E的進(jìn)化曲線如圖4~6所示。 圖1 綜合最佳適應(yīng)度期望值變化曲線(未引入模擬退火)Fig.1 Curves of the comprehensive best fitness (without SA) 圖2 F變化曲線(未引入模擬退火)Fig.2 Curves of F(without SA) 圖3 E變化曲線(未引入模擬退火)Fig.3 Curves of E(without SA) 圖4 綜合最佳適應(yīng)度期望值變化曲線(引入模擬退火)Fig.4 Curves of the comprehensive best fitness(with SA introduced) 圖5 F變化曲線(引入模擬退火)Fig.5 Curves of F(with SA introduced) 結(jié)果分析: 1)引入模擬退火后算法的快速性和收斂性變得很好,在十代左右就可以得到一個(gè)理想值。 2)由于“可能度”的引入使得最終得到的最佳適應(yīng)度值和剩余目標(biāo)評(píng)估值E以區(qū)間形式給出,仿真中用兩條曲線分別來表征最好和最壞的情形。 3)本次運(yùn)行的可行解為X: 由矩陣X可知,第1枚導(dǎo)彈攻擊目標(biāo)4,第2、3枚導(dǎo)彈攻擊目標(biāo)1,第4、5枚導(dǎo)彈攻擊目標(biāo)3,第6枚導(dǎo)彈攻擊目標(biāo)2,第7枚導(dǎo)彈攻擊目標(biāo)5,第7枚導(dǎo)彈攻擊目標(biāo)6。此時(shí)最佳適應(yīng)度值區(qū)間為[0.809 3,0.860 2],剩余目標(biāo)期望值F的區(qū)間為[1.247 5,1.332 3],殺傷評(píng)估值E為5.088 4。 4.2仿真2 仿真1只是檢驗(yàn)了本文所提出算法的有效性,其性能優(yōu)劣還需與其他智能算法進(jìn)行對(duì)比才能得出結(jié)論。由于其他智能算法并不能解決不確定環(huán)境下的目標(biāo)分配問題,在此將仿真1中設(shè)置的情景進(jìn)行簡化,將目標(biāo)對(duì)我機(jī)的威脅值灰矩陣簡化為常值矩陣;仿真2中威脅值矩陣中各元素值均取仿真1中威脅值矩陣中各灰區(qū)間左側(cè)的值,其他參數(shù)設(shè)置均相同。 文獻(xiàn)[16]中作者設(shè)計(jì)了模擬退火遺傳算法用于協(xié)同多目標(biāo)攻擊決策問題的尋優(yōu),與本文不同的是算法中個(gè)體采用整數(shù)編碼,并采用非常規(guī)的交叉與變異操作產(chǎn)生新的個(gè)體,具體操作過程在此不再贅述。將文獻(xiàn)[16]所設(shè)計(jì)的算法用于本文多目標(biāo)攻擊決策問題的尋優(yōu),殺傷目標(biāo)期望評(píng)估值E的進(jìn)化曲線如圖7所示。 圖7 E變化曲線對(duì)比圖Fig.7 Comparison curves of E 結(jié)果分析: 1)用文獻(xiàn)中給出的模擬退火遺傳算法解決本文協(xié)同多目標(biāo)攻擊決策問題,最終得到了比本文所采用的算法更好的解。因此,文獻(xiàn)提出的算法的搜索準(zhǔn)確性要優(yōu)于本文所提算法。 2)可以初步斷定算法的搜索效率和搜索準(zhǔn)確性與編碼方式有一定的關(guān)系,倘若只強(qiáng)調(diào)搜索準(zhǔn)確性,則優(yōu)先考慮十進(jìn)制編碼,倘若只強(qiáng)調(diào)搜索快速性,則優(yōu)先考慮二進(jìn)制編碼。但是,算法性能也與交叉與變異操作方式有一定關(guān)系,要弄清楚交叉與變異操作方式對(duì)算法性能影響的大小還有待深入研究。 3)空戰(zhàn)中態(tài)勢瞬息萬變,要想在有限時(shí)間內(nèi)得出當(dāng)前態(tài)勢下最優(yōu)的分配方案往往是很困難的,本文所提出的算法雖然沒有得到最優(yōu)的分配方案,但是在較少的時(shí)間內(nèi)得到了比較滿意的解,這也是可以被決策者接受的。 1)本文所提出的算法能適應(yīng)個(gè)體適應(yīng)度為灰區(qū)間形式的尋優(yōu),可以作為傳統(tǒng)確定環(huán)境下目標(biāo)分配問題的補(bǔ)充和完善。 2)在不確定環(huán)境下,引入模擬退火算法后,遺傳算法的收斂性和快速性都能得到有效提高。 3)本文所提出的算法雖然沒有得到最優(yōu)的分配方案,但是在較少的時(shí)間內(nèi)得到了比較滿意的解,這也是可以被決策者接受的。 如何進(jìn)一步提高算法的實(shí)時(shí)性,使之能運(yùn)用于武器火控系統(tǒng)是下一階段的研究內(nèi)容。 [1] 羅德林,吳順祥,段海濱,等. 無人機(jī)協(xié)同多目標(biāo)攻擊空戰(zhàn)決策研究[J].系統(tǒng)仿真學(xué)報(bào), 2008, 20(24): 6778-6782. LUO Delin, WU Shunxiang, DUAN Haibin, et al. Air-combat decision-making for UAVS cooperatively attacking multiple targets[J]. Journal of system simulation, 2008, 20(24): 6778-6782. [2] 董朝陽,路遙,王青. 改進(jìn)的遺傳算法求解火力分配優(yōu)化問題[J].兵工學(xué)報(bào), 2016, 37(1): 97-102. DONG Chaoyang, LU Yao, WANG Qing. Improved genetic algorithm for solving firepower distribution[J]. Acta armamentarii, 2016, 37(1): 97-102. [3] WILLIAM P F. Ranking terrorist targets using a hybrid AHP-TOPSIS methodology[J]. The journal of defense modeling and simulation, 2016, 1(13): 77-93. [4] WU Qunli, PENG Chenyang. Comprehensive benefit evaluation of the power distribution network planning project based on improved IAHP and multi-level extension assessment method[J]. Sustainability, 2016, 8(8): 796. [5] XU Long, LI Yi. A network selection scheme based on TOPSIS in heterogeneous network environment[J]. Journal of Harbin Institute of Technology, 2014, 1(21): 43-48. [6] 張毅,姜青山.基于模糊-灰色非合作Nash博弈的多組動(dòng)態(tài)武器-目標(biāo)分配方法[J]. 云南大學(xué)學(xué)報(bào), 2012, 34(1): 26-32. ZHANG Yi, JIANG Qingshan. An approach of basing-on fuzzy-grey noncooperative nash games to multi-team dynamic weapon-target assignment[J]. Journal of Yunnan University, 2012, 34(1): 26-32. [7] ASIM T,SEROL B. Weapon target assignment with combinatorial optimization techniques[J]. International journal of advanced research in artificial intelligence, 2013, 2(7): 39-50. [8] WANG Yanxia, QIAN Longjun. Weapon target assignment problem satisfying expected damage probabilities based on ant colony algorithm[J]. Journal of systems engineering and electronics, 2008,19(5): 939-944. [9] YI Yang, DING Jia. A novel video salient object extraction method based on visual attention[J]. Signal processing image communication, 2013, 28(1): 45-54. [10] KESHANCHI B, SOURI A, NAVIMIPOUR N J. An improved genetic algorithm for task scheduling in the cloud environments using the priority queues: formal verification, simulation, and statistical testing[J]. Journal of systems and software, 2017, 124: 1-21. [11] ZHANG Junhao, XIA Pinqi. An improved PSO algorithm for parameter identification of nonlinear dynamic hysteretic model[J]. Journal of sound and vibratione, 2017, 389: 153-167. [12] DENG J L. Control problems of unknown system[J]. Proceedings of the bilateral meeting on control systems, 1981: 156-171. [13] 肖冰松,方洋旺. 一種新的超視距空戰(zhàn)威脅評(píng)估方法[J].系統(tǒng)工程與電子技術(shù), 2009, 31(9): 2163-2166. XIAO Bingsong, FANG Yangwang. New threat assessment method in beyond-the-horizon range air combat[J]. Systems engineering and electronics, 2009, 31(9): 2163-2166. [14] 郭輝,徐浩軍,谷向東,等. 基于改進(jìn)粒子群算法的協(xié)同多目標(biāo)攻擊空戰(zhàn)決策[J].火力與指揮控制, 2011, 36(6): 49-51. YANG Rong, LI Changjun, GONG Huajun, et al. Air-combat decision-making for cooperative multiple target attack based on improved particle swarm algorithm[J]. Fire control & command control, 2011, 36(6): 49-51. [15] 王俊杰,黨耀國,李雪梅,等. 連續(xù)型區(qū)間灰數(shù)排序的應(yīng)用研究[J].系統(tǒng)工程, 2014, 32(8): 148-152. WANG Junjie,DANG Yaoguo, LI Xuemei, et al. Research on the application of sorting interval grey number of continuous type[J]. Systems engineering, 2014, 32(8): 148-152. [16] 羅德林,王彪,龔華軍,等. 基于SAGA的協(xié)同多目標(biāo)攻擊決策[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2007, 39(7): 1154-1158. LUO Delin, WANG Biao, GONG Huajun, et al. Air combat decision-making for cooperative multiple target attack based on SAGA[J]. Journal of Harbin Institute of Technology, 2007, 39(7): 1154-1158. 本文引用格式: 宋遐淦, 江駒, 徐海燕. 改進(jìn)模擬退火遺傳算法在協(xié)同空戰(zhàn)中的應(yīng)用[J]. 哈爾濱工程大學(xué)學(xué)報(bào), 2017, 38(11): 1762-1768. SONG Xiagan, JIANG Ju, XU Haiyan. Application of improved simulated annealing genetic algorithm in cooperative air combat[J]. Journal of Harbin Engineering University, 2017, 38(11): 1762-1768. Applicationofimprovedsimulatedannealinggeneticalgorithmincooperativeaircombat SONG Xiagan1, JIANG Ju1, XU Haiyan2 (1.College of Automation Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China; 2.College of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China) The corresponding evaluation and assignment model is established to solve the problem of weapons target assignment in dynamic uncertain environments. Firstly, the index system of air combat situation assessment is established and the interval analytic hierarchy process and fuzzy optimization are used to obtain the subjective and objective weight of these indexes. Secondly, corresponding effectiveness evaluation mode of multi-objective optimization is constructed with a dynamic environment, and the decision-making problem for cooperative multiple target attack is converted to the optimization problem for missile attack matching. Furthermore, the interval grey number-simulated annealing genetic algorithm is put forward to solve this problem. The proposed ISAGA designs a new selection operation and a special simulated annealing mechanism to enhance the global search ability. Finally, the reasonable attack scheme can be confirmed according to the optimal solution, and simulation results show that the proposed algorithm can be used to evaluate and optimize the weapons target assignment problem in uncertain environments and obtains a solution closer to the optimal solution in ten iterations, which is a consummation to some extent. interval analytic hierarchy process; possibility degree function; interval grey number; simulated annealing; cooperative air combat 10.11990/jheu.201606094 http://www.cnki.net/kcms/detail/23.1390.u.20170427.1544.152.html V249 A 1006-7043(2017)11-1762-07 2016-06-30. 網(wǎng)絡(luò)出版日期:2017-04-27. 國家自然科學(xué)基金項(xiàng)目(71471084,61304223);南京航空航天大學(xué)研究生開放基金項(xiàng)目(kfjj20150320,kfjj20150323,kfjj20160318). 宋遐淦(1990-), 男, 碩士研究生; 江駒(1963-), 男, 教授,博士生導(dǎo)師; 徐海燕(1963-),女,教授,博士生導(dǎo)師. 宋遐淦,E-mail:Songxiagan@Foxmail.com.4 算法對(duì)比性仿真分析
5 結(jié)論