韓玉龍,嚴(yán)建鋼,陳 榕,李 俊,2,孫守福,林 云
(1.海軍航空工程學(xué)院,山東 煙臺(tái) 264001;2.解放軍92913部隊(duì),海南 臨高 571820)
改進(jìn)博弈論的艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配*
韓玉龍1,嚴(yán)建鋼1,陳榕1,李俊1,2,孫守福1,林云1
(1.海軍航空工程學(xué)院,山東煙臺(tái)264001;2.解放軍92913部隊(duì),海南臨高571820)
目標(biāo)分配問題是UAV自主控制的重要問題。針對(duì)艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配問題,首先建立了基于離散動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的目標(biāo)價(jià)值評(píng)估模型,在此基礎(chǔ)上構(gòu)建了艦載無人機(jī)編隊(duì)的益損值矩陣,設(shè)計(jì)了艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配的決策函數(shù),提出了一種基于改進(jìn)博弈論的目標(biāo)分配方法,為4種不同約束條件下的目標(biāo)分配問題分別設(shè)計(jì)了算法。最后對(duì)所建立的目標(biāo)價(jià)值評(píng)估模型和改進(jìn)博弈論的目標(biāo)分配算法進(jìn)行了實(shí)例仿真,仿真結(jié)果表明了模型和算法的可行性和有效性。
艦載無人機(jī),對(duì)海突擊,目標(biāo)分配,貝葉斯網(wǎng)絡(luò),博弈論
打擊敵海上目標(biāo),奪取制海權(quán)是航母艦載無人機(jī)的主要使命任務(wù)之一。協(xié)同作戰(zhàn)是艦載無人機(jī)的基本作戰(zhàn)樣式,航母艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊作戰(zhàn)包括對(duì)敵水面艦艇以及呈水面狀態(tài)潛艇的進(jìn)攻和防御,其目的是在敵方水面艦艇威脅危我方航母編隊(duì)之前,發(fā)現(xiàn)、識(shí)別、標(biāo)定并成功組織攻擊,在確保航母編隊(duì)安全的基礎(chǔ)上,奪取制海權(quán)。
現(xiàn)代海戰(zhàn)是網(wǎng)絡(luò)化協(xié)同作戰(zhàn),艦載無人機(jī)編隊(duì)利用數(shù)據(jù)鏈交換和共享作戰(zhàn)信息,協(xié)同完成多目標(biāo)攻擊是未來海戰(zhàn)發(fā)展的方向。為了使艦載無人機(jī)編隊(duì)協(xié)同對(duì)海多目標(biāo)突擊的效率得到進(jìn)一步提高,有必要深入研究艦載無人機(jī)編隊(duì)對(duì)海突擊目標(biāo)分配的相關(guān)技術(shù)[1-2]。
目標(biāo)分配問題的核心是如何把具有不同殺傷力和經(jīng)濟(jì)價(jià)值的武器,分配到射擊不同的目標(biāo),構(gòu)成整體的火力打擊體系[3-4]。艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配即在滿足戰(zhàn)術(shù)和技術(shù)指標(biāo)、作戰(zhàn)任務(wù)要求、艦載無人機(jī)及其武器系統(tǒng)性能等約束的前提下,將位置、價(jià)值和威脅不同的水上目標(biāo),按照一定的原則和策略,科學(xué)合理地分配給類型、價(jià)值和戰(zhàn)斗力各不相同的艦載無人機(jī),使得艦載無人機(jī)編隊(duì)整體以最小代價(jià)獲得最大作戰(zhàn)效能。
目標(biāo)分配的模型主要體現(xiàn)在目標(biāo)函數(shù)和約束條件上,相應(yīng)的求解方法也不盡相同,體現(xiàn)了處理問題的不同思路。滿意決策方法是對(duì)窮舉法的改進(jìn),將每個(gè)參與目標(biāo)分配的個(gè)體看作一個(gè)Agent。個(gè)體Agent提出符合自己的滿意集,把搜索空間限制在個(gè)體A-gent的滿意集之內(nèi),舍棄不可行解與效率較低的分配策略,以此達(dá)到提高搜索效率的目的[5]。基于協(xié)同拍賣的方法通過買方競(jìng)價(jià)的方式實(shí)現(xiàn)資源的有效配置,可以獲得較滿意的分配結(jié)果,但整個(gè)過程耗時(shí)較長(zhǎng);基于合同網(wǎng)(Contract net protocol CNP)的方法采用多種合同類型,通過個(gè)體之間的協(xié)商和競(jìng)爭(zhēng)機(jī)制,實(shí)現(xiàn)目標(biāo)的分配和動(dòng)態(tài)調(diào)整[6];智能算法的興起為大規(guī)模目標(biāo)分配問題的解決提供了新的途徑,遺傳算法[7]、蟻群算法、粒子群算法[8]等在解決目標(biāo)分配問題時(shí)具有較好的收斂速度,但也存在易陷入局部最優(yōu)的缺陷。上述方法基本沒有考慮攻防雙方的對(duì)抗對(duì)目標(biāo)分配的影響,文獻(xiàn)[9-10]等將博弈論的思想引入目標(biāo)分配,能夠更加逼真地還原作戰(zhàn)過程,在目標(biāo)分配領(lǐng)域是一種非常有研究前景的方法。
本文在已有研究成果的基礎(chǔ)上,針對(duì)艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配這一熱點(diǎn)問題,采用離散動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Networks, DBN)方法實(shí)現(xiàn)對(duì)目標(biāo)價(jià)值的實(shí)時(shí)評(píng)估,對(duì)傳統(tǒng)目標(biāo)分配模型和基于博弈論的方法進(jìn)行一點(diǎn)改進(jìn),根據(jù)不同的戰(zhàn)術(shù)原則,適應(yīng)不同的目標(biāo)分配約束。
假設(shè)由艦載無人機(jī)組成的編隊(duì)對(duì)敵水面艦艇目標(biāo)進(jìn)行突擊,對(duì)問題進(jìn)行簡(jiǎn)化,不考慮敵空中攔截,僅考慮水面艦艇預(yù)警雷達(dá)、艦炮和艦空導(dǎo)彈組成的防御系統(tǒng)。在衛(wèi)星、預(yù)警機(jī)等信息保障下,進(jìn)行艦載無人機(jī)任務(wù)規(guī)劃,制定目標(biāo)分配策略。
2.1艦載無人機(jī)益損值矩陣
假定有m架艦載無人機(jī)組成的編隊(duì)對(duì)敵方n個(gè)不同類型水面艦艇目標(biāo)進(jìn)行突擊。首先在衛(wèi)星、預(yù)警機(jī)等平臺(tái)的信息支援下獲得態(tài)勢(shì)數(shù)據(jù),由航母編隊(duì)指揮中心對(duì)敵水面艦艇目標(biāo)價(jià)值進(jìn)行評(píng)估,然后根據(jù)態(tài)勢(shì)評(píng)估的結(jié)果構(gòu)造編隊(duì)目標(biāo)分配決策函數(shù)。設(shè)vj為對(duì)目標(biāo)進(jìn)行實(shí)時(shí)評(píng)估并歸一化后得出的目標(biāo)相對(duì)價(jià)值(0<vj≤1,j=1,2,…,n),pij為第i架艦載無人機(jī)對(duì)第j個(gè)水面艦艇目標(biāo)的殺傷概率,那么第i架艦載無人機(jī)攻擊第j個(gè)目標(biāo)時(shí)獲得的收益為eij=f (vj,pij)=vj·pij,第i架艦載無人機(jī)攻擊各個(gè)目標(biāo)時(shí)獲得的收益為ei=g(ei1,ei2,…,ein),各架艦載無人機(jī)對(duì)攻擊各個(gè)目標(biāo)獲得收益如式(1)。
ui為我方艦載無人機(jī)歸一化后得出的價(jià)值(0<ui≤1,i=1,2,…,m),qij為第i架艦載無人機(jī)被第j個(gè)水面艦艇目標(biāo)反擊時(shí)的殺傷概率,那么第j個(gè)目標(biāo)反擊第i架艦載無人機(jī)時(shí)獲得的收益為cij=f(ui,qij)=ui·qij,第j個(gè)目標(biāo)反擊各架艦載無人機(jī)時(shí)獲得的收益c·j=g(c1j,c2j,…,cmj),各目標(biāo)反擊各架艦載無人機(jī)獲得收益也即各艦載無人機(jī)編隊(duì)攻擊各敵方目標(biāo)的損失如式(2)。
構(gòu)造基于攻防對(duì)抗雙方博弈的目標(biāo)分配決策函數(shù)ρ(e,c)。
W為艦載無人機(jī)編隊(duì)攻擊敵方目標(biāo)的益損值(收益損失比)矩陣,為第i架艦載無人機(jī)攻擊第j個(gè)目標(biāo)時(shí)獲得的收益與所付出代價(jià)的比值,其中,i= 1,2,…,m,j=1,2,…,n。由上述定義易知,對(duì)于敵方水面艦艇編隊(duì)來說,W是其損益值(損失收益比)矩陣。
2.2基于離散DBN的目標(biāo)價(jià)值評(píng)估
目標(biāo)的價(jià)值是隨時(shí)間的變化而變化的,對(duì)目標(biāo)價(jià)值的實(shí)時(shí)評(píng)估也就為目標(biāo)的實(shí)時(shí)分配奠定了基礎(chǔ)。水面艦艇目標(biāo)的移動(dòng)速度相對(duì)較慢,因而對(duì)其預(yù)警探測(cè)相對(duì)容易;艦載無人機(jī)具有速度大、隱身性能好等特點(diǎn),敵方在對(duì)我艦載無人機(jī)進(jìn)行價(jià)值評(píng)估時(shí),對(duì)初始值的依賴較大。作為我方?jīng)Q策者來講,對(duì)敵方目標(biāo)不可能完全了解,需要實(shí)時(shí)探測(cè)。而模擬敵方評(píng)價(jià)我方艦載無人機(jī)的價(jià)值時(shí),不知道敵方對(duì)我方裝備的熟悉程度,按照最不利的情形,即敵方對(duì)我方艦載無人機(jī)裝備完全了解。本文采用離散DBN模型方法對(duì)目標(biāo)的價(jià)值進(jìn)行評(píng)估[11]。
2.2.1網(wǎng)絡(luò)結(jié)構(gòu)
貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)式表示條件獨(dú)立性信息的一種自然方式,網(wǎng)絡(luò)中的每個(gè)結(jié)點(diǎn)都表示特定域中的一個(gè)變量,結(jié)點(diǎn)間的連接(有向弧)表示相互間因果關(guān)系,體現(xiàn)了領(lǐng)域知識(shí)性方面的特征。建立目標(biāo)價(jià)值評(píng)估離散DBN模型需要首先確定其網(wǎng)絡(luò)結(jié)構(gòu)[12]。
對(duì)于艦載無人機(jī)編隊(duì)來說,目標(biāo)價(jià)值體現(xiàn)在固有價(jià)值(Int)和體系價(jià)值(Sys)兩個(gè)方面。其中,目標(biāo)的固有價(jià)值,又可以從經(jīng)濟(jì)價(jià)值(Eco)、政治價(jià)值(Pol)和心理價(jià)值(Psy)3個(gè)方面進(jìn)行刻畫。而目標(biāo)的體系價(jià)值,需要充分考慮目標(biāo)在整個(gè)目標(biāo)體系中的地位和作用,可分為關(guān)鍵結(jié)點(diǎn)(Key)、重要結(jié)點(diǎn)(Imp)以及普通結(jié)點(diǎn)(Gen)。通過上述分析,建立基于離散DBN的目標(biāo)價(jià)值評(píng)估網(wǎng)絡(luò)模型。
圖1 目標(biāo)價(jià)值評(píng)估網(wǎng)絡(luò)模型
目標(biāo)價(jià)值分析模型中,各結(jié)點(diǎn)變量的狀態(tài)集合可表示為:目標(biāo)價(jià)值(Val)={高(H),中(M),低(L)};目標(biāo)經(jīng)濟(jì)價(jià)值(Eco)={高(H),中(M),低(L)},目標(biāo)的政治價(jià)值(Pol)={高(H),中(M),低(L)},目標(biāo)心理價(jià)值(Psy)={高(H),中(M),低(L)};目標(biāo)的體系價(jià)值(Sys)={關(guān)鍵結(jié)點(diǎn)(key),重要結(jié)點(diǎn)(Imp),普通結(jié)點(diǎn)(Gen)}。
2.2.2構(gòu)造條件概率表
建立了基于離散DBN的目標(biāo)價(jià)值評(píng)估網(wǎng)絡(luò)模型以后,需要構(gòu)造條件概率表。條件概率表的建立要綜合多方面的海戰(zhàn)場(chǎng)信息,同時(shí)還要考慮軍事專家的建議,也可以對(duì)經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)習(xí)來獲得。
對(duì)于圖1建立的離散DBN目標(biāo)價(jià)值評(píng)估模型,建立條件概率表如表1和表2所示。
表1 條件概率表(1)
表2 條件概率表(2)
2.2.3目標(biāo)價(jià)值歸一化
對(duì)于該模型,可利用Netica軟件進(jìn)行仿真計(jì)算,得到每個(gè)目標(biāo)的絕對(duì)價(jià)值。在此基礎(chǔ)上,對(duì)目標(biāo)價(jià)值進(jìn)行歸一化。
2.3指標(biāo)函數(shù)
在分配目標(biāo)時(shí)根據(jù)不同的分配原則,可以設(shè)定不同的指標(biāo)函數(shù)。“保存自己,消滅敵人”,目標(biāo)分配的首要原則就是益損值最優(yōu)。因此,目標(biāo)分配的指標(biāo)函數(shù)為:
文獻(xiàn)[13]提出了改進(jìn)矩陣法的無人機(jī)編隊(duì)內(nèi)目標(biāo)分配算法,但是僅從己方的角度出發(fā),忽略了敵方針對(duì)我方目標(biāo)分配可能采取的反擊策略;文獻(xiàn)[9]從攻防對(duì)抗雙方的角度提出了基于博弈論的目標(biāo)分配方法,但是該算法為避免目標(biāo)重復(fù)分配,僅考慮了每個(gè)目標(biāo)只能分配給一架艦載無人機(jī)這樣一個(gè)特殊的情況,而實(shí)際上,有些情況下一架艦載無人機(jī)無法達(dá)成對(duì)某個(gè)目標(biāo)的突擊企圖?;诖耍疚尼槍?duì)不同的分配約束設(shè)計(jì)不同的算法,以適應(yīng)艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配的需要。該算法的基本思路是:首先進(jìn)行目標(biāo)價(jià)值評(píng)估,建立艦載無人機(jī)編隊(duì)益損值矩陣,然后根據(jù)不同的約束條件確定對(duì)應(yīng)的選取規(guī)則尋找符合要求的元素,并在每一次選取之后考慮敵方的應(yīng)對(duì)策略,這樣依次為每一架艦載無人機(jī)分配目標(biāo)[14]。
3.1約束1:艦載無人機(jī)可攻擊多個(gè)目標(biāo)且目標(biāo)可以重復(fù)分配
Step1進(jìn)行目標(biāo)價(jià)值評(píng)估,建立益損值矩陣W。
Step2為第1架艦載無人機(jī)選擇攻擊目標(biāo)。從益損值矩陣中尋找最大元素,如果有相同元素則隨機(jī)任選一個(gè)。記下i和j的標(biāo)號(hào),即由艦載無人機(jī)Ui攻擊敵方水面艦艇目標(biāo)Sj,記作Ui→Sj。
Step3調(diào)整益損值矩陣,確定攻擊Ui的目標(biāo)。將元素所在行和列元素分別乘以益損值下降系數(shù)β,β∈[0,1],β=0表示該水面艦艇目標(biāo)完全毀傷;β=1表示該水面艦艇目標(biāo)完全沒有毀傷。在第i行中搜索最小的非零元素ia,即敵方會(huì)派出目標(biāo)Sa對(duì)Ui進(jìn)行攔截,記作:Sa→Ui。
Step4調(diào)整益損值矩陣,確定攻擊目標(biāo)Sa的艦載無人機(jī)。將元素ia乘以益損值下降系數(shù)β。在益損值矩陣第a列中尋找最大的元素ca,記下標(biāo)號(hào)c 和a,即艦載無人機(jī)Uc攻擊敵方水面艦艇目標(biāo),記作:Uc→Sa。
Step5判斷所有艦載無人機(jī)是否都已達(dá)到最大分配目標(biāo)數(shù)。如果已達(dá)到,則停止。否則,重復(fù)Step3~Step5。
Step6選取分配結(jié)果。按照益損值最大的原則進(jìn)行選取,對(duì)分配結(jié)果進(jìn)行優(yōu)化提取。
3.2約束2艦載無人機(jī)可攻擊多個(gè)目標(biāo)且目標(biāo)不可重復(fù)分配
算法在約束1基礎(chǔ)上對(duì)Step3~Step5作以下調(diào)整:
Step3調(diào)整益損值矩陣,確定攻擊Ui的目標(biāo)。將元素所在行和列的元素乘以益損值下降系數(shù)β。在第i行中搜索最小的非零元素ia,即敵方會(huì)派出目標(biāo)Sa對(duì)Ui進(jìn)行攔截,記作:Sa→Ui。
Step4調(diào)整益損值矩陣,確定攻擊目標(biāo)Sa的艦載無人機(jī)。將元素所在行和列元素分別乘以益損值下降系數(shù)β。在益損值矩陣第a列沒有被分配過目標(biāo)Ma的艦載無人機(jī)中尋找最大的元素ca,記下標(biāo)號(hào)c和a,即艦載無人機(jī)Uc攻擊敵方水面艦艇目標(biāo)Sa,記作:Uc→Sa。
Step5判斷所有目標(biāo)分配是否完成。如果完成,則停止。否則,則重復(fù)Step3~Step5的過程,直至所有目標(biāo)分配完成。
3.3約束3艦載無人機(jī)僅能攻擊一個(gè)目標(biāo)且目標(biāo)可以重復(fù)分配
算法在約束1基礎(chǔ)上對(duì)Step3~Step5作以下調(diào)整:
Step3調(diào)整益損值矩陣,確定攻擊Ui的目標(biāo)。將元素所在行和列的元素乘以益損值下降系數(shù)β。在第i行中搜索最小的非零元素(iaa=1,2,…,n且a≠j),即敵方會(huì)派出目標(biāo)Sa對(duì)Ui進(jìn)行攔截,記作:Sa→Ui。
Step4調(diào)整益損值矩陣,確定攻擊目標(biāo)Sa的艦載無人機(jī)。將元素ia乘以益損值下降系數(shù)β。在益損值矩陣第a列沒有被分配過目標(biāo)的艦載無人機(jī)中尋找最大的元素ca,記下標(biāo)號(hào)c和a,即艦載無人機(jī)Uc攻擊敵方水面艦艇目標(biāo)Sa,記作:Uc→Sa。
Step5判斷所有艦載無人機(jī)是否都已分配目標(biāo)。如果是,則停止。否則,則重復(fù)Step3~Step5的過程,直至所有艦載無人機(jī)都已分配到目標(biāo)。
3.4約束4艦載無人機(jī)僅能攻擊一個(gè)目標(biāo)且目標(biāo)不可重復(fù)分配
算法與3.1基本相同,由于分配原則不同,對(duì)Step3~Step5作以下調(diào)整:
Step3調(diào)整益損值矩陣,確定攻擊Ui的目標(biāo)。將元素所在行和列的元素乘以益損值下降系數(shù)β。在第i行中搜索最小的非零元素(a=1,2,…,n且a≠j),即敵方會(huì)派出目標(biāo)Sa對(duì)Ui進(jìn)行攔截,記作:Sa→Ui。
Step4調(diào)整益損值矩陣,確定攻擊目標(biāo)Sa的艦載無人機(jī)。將元素ia乘以益損值下降系數(shù)β。在益損值矩陣第a列搜索沒有被分配過目標(biāo)的艦載無人機(jī)中尋找最大的元素ca,記下標(biāo)號(hào)c和a,即艦載無人機(jī)Uc攻擊敵方水面艦艇目標(biāo)Sa,記作:Uc→Sa。
Step5判斷所有目標(biāo)分配是否完成。如果完成,則停止。否則,則重復(fù)Step3~Step5的過程,直至所有目標(biāo)分配完成。
4.1仿真算例
假定我預(yù)警機(jī)探測(cè)到敵方由驅(qū)逐艦、護(hù)衛(wèi)艦等6搜水面艦艇組成的編隊(duì)向我航母方向航行,我艦載航空兵指揮所接到航母編隊(duì)指揮所命令,可派出由9架艦載無人機(jī)組成的編隊(duì)對(duì)敵水面艦艇編隊(duì)進(jìn)行突擊。
首先對(duì)敵方目標(biāo)的價(jià)值進(jìn)行評(píng)估。
對(duì)模型進(jìn)行初始化,在獲得進(jìn)一步目標(biāo)信息前,無法對(duì)目標(biāo)價(jià)值進(jìn)行判斷,為了保證其后的評(píng)估不帶有任何傾向性,假定某目標(biāo)在初始時(shí)刻的目標(biāo)價(jià)值狀態(tài)為Value[High,Middle,Low]=[33.3 33.3 33.3],也就是目標(biāo)價(jià)值處于高、中、低3個(gè)狀態(tài)的概率相同,如下頁圖2所示。
對(duì)目標(biāo)1,通過偵察探測(cè)兵力的實(shí)時(shí)偵察,得出了如表3所示目標(biāo)1三個(gè)時(shí)刻的影響因子值。
表3 目標(biāo)1三個(gè)時(shí)刻的影響因子值
將目標(biāo)1的相關(guān)參數(shù)輸入模型中,得到的推理結(jié)果如下頁圖3~圖5所示。
圖2 模型進(jìn)行初始化示意圖
圖3 1時(shí)刻目標(biāo)1價(jià)值評(píng)估結(jié)果
圖4 2時(shí)刻目標(biāo)1價(jià)值評(píng)估結(jié)果
圖5 3時(shí)刻目標(biāo)1價(jià)值評(píng)估結(jié)果
圖6 4種約束條件下程序運(yùn)行時(shí)間(s)
將實(shí)驗(yàn)參數(shù)代入到建立的離散DBN模型中進(jìn)行仿真,仿真結(jié)果如圖5~圖6所示,可以得到0,1,2,3時(shí)刻目標(biāo)1的優(yōu)先級(jí)為高的概率分別為33.3%,45.9%,53.7%,58.8%,為體現(xiàn)目標(biāo)評(píng)估的實(shí)時(shí)性,將目標(biāo)1價(jià)值為高的概率確定為58.8%。以此類推,計(jì)算出所有目標(biāo)價(jià)值為高的概率為[0.588,0.645,0.344,0.675,0.568,0.900],經(jīng)過歸一化,得到目標(biāo)價(jià)值的歸一化值為V=[0.158 1,0.173 4,0.092 5,0.181 5,0.152 7,0.241 9]。
我方艦載無人機(jī)的歸一化價(jià)值直接給出,S= [0.154 3,0.171 5,0.024 1,0.172 9,0.119 8,0.018 4,0.052 7,0.103 6,0.182 7]。各艦載無人機(jī)對(duì)每個(gè)目標(biāo)的毀傷概率和各目標(biāo)對(duì)我艦載無人機(jī)的毀傷概率分別如表4和表5所示。根據(jù)式(1)~式(4)得到艦載無人機(jī)編隊(duì)的益損值矩陣如表6所示。
表4 各艦載無人機(jī)對(duì)各目標(biāo)的毀傷概率
表5 各目標(biāo)對(duì)各艦載無人機(jī)的毀傷概率
表6 各艦載無人機(jī)突擊各目標(biāo)的易損值
運(yùn)用基于改進(jìn)博弈論的艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配方法,對(duì)4種不同原則下的目標(biāo)分配情況分別進(jìn)行仿真,益損值下降系數(shù)取為0.5,通過Matlab7.6編程仿真,仿真結(jié)果如表7~表10所示,0表示沒有分配目標(biāo)。
表7 艦載無人機(jī)可分配多個(gè)目標(biāo)且目標(biāo)可重復(fù)分配
表8 艦載無人機(jī)可分配多個(gè)目標(biāo)且目標(biāo)不能重復(fù)分配
表9 艦載無人機(jī)可分配一個(gè)目標(biāo)且目標(biāo)可重復(fù)分配
表10 艦載無人機(jī)可分配一個(gè)目標(biāo)且目標(biāo)不可重復(fù)分配
4.2結(jié)果分析
分別對(duì)4種分配原則下的目標(biāo)分配結(jié)果進(jìn)行分析。在艦載無人機(jī)可攻擊多個(gè)目標(biāo)且目標(biāo)可重復(fù)分配的約束下,從表7的分配結(jié)果看,按照益損值最優(yōu)的原則,所有艦載無人機(jī)都達(dá)到了最大目標(biāo)分配數(shù),所有目標(biāo)都已分配完畢,并且被攻擊的次數(shù)都不少于2次;在艦載無人機(jī)可攻擊多個(gè)目標(biāo)且目標(biāo)不能重復(fù)分配的約束下,從表8的分配結(jié)果看,按照艦載無人機(jī)U3,U6分別分配了兩個(gè)目標(biāo),而U1,U2,U4,U5,U7沒有分配目標(biāo),這是由于在目標(biāo)不可被重復(fù)分配的限制下追求益損值最優(yōu),如果改變分配策略,則會(huì)使益損值下降,這是沒有被分配的目標(biāo)的艦載無人機(jī)可對(duì)編隊(duì)內(nèi)的其他成員進(jìn)行支援與掩護(hù);在艦載無人機(jī)僅能攻擊一個(gè)目標(biāo)且目標(biāo)可重復(fù)分配的約束下,從表9的分配結(jié)果看,所有艦載無人機(jī)都分配到了一個(gè)目標(biāo),S3、S5分別被分配給了3架艦載無人機(jī);在艦載無人機(jī)僅能攻擊一個(gè)目標(biāo)且目標(biāo)不可重復(fù)分配的約束下,從表10的分配結(jié)果看,所有艦載無人機(jī)都分配到了一個(gè)目標(biāo),每個(gè)目標(biāo)也分別被分配給了一架艦載無人機(jī)。算法的運(yùn)行時(shí)間從圖6可以看出,都能保證在0.01 s內(nèi)完成目標(biāo)分配,符合艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊實(shí)時(shí)性的要求,不同的約束條件體現(xiàn)著不同的戰(zhàn)術(shù)原則,結(jié)果合理可信。
艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊目標(biāo)分配問題是艦載無人機(jī)編隊(duì)協(xié)同對(duì)海突擊任務(wù)規(guī)劃中的重要環(huán)節(jié)。本文在對(duì)其概念和研究現(xiàn)狀進(jìn)行研究的基礎(chǔ)上,提出了基于改進(jìn)博弈論的目標(biāo)分配方法,并針對(duì)其中的目標(biāo)價(jià)值評(píng)估問題,構(gòu)建了基于離散DBN的目標(biāo)價(jià)值評(píng)估方法,對(duì)4種約束條件下的目標(biāo)分配情況分別設(shè)計(jì)了算法,仿真結(jié)果表明算法可行有效,可以為指揮員提供輔助決策。實(shí)際上,在目標(biāo)分配的過程中,不僅反映了攻防雙方的對(duì)抗特點(diǎn),也體現(xiàn)了一定的時(shí)序特征。但該方法的前提是攻防雙方完全理性,且對(duì)對(duì)方的裝備非常了解,這在實(shí)際作戰(zhàn)中可能過于理想,下一步需要研究在信息不完全情況下的目標(biāo)分配問題。
[1]梁國(guó)偉,王社偉,趙雪森.多無人機(jī)協(xié)同任務(wù)分配方法[J].火力與指揮控制,2014,39(11):13-17.
[2]羅賀,王國(guó)強(qiáng).基于Agent的多無人機(jī)任務(wù)分配模型[J].火力與指揮控制,2014,39(7):22-26
[3]陳閩.編隊(duì)協(xié)同作戰(zhàn)目標(biāo)分配建模綜述[J].電光與控制,2013,20(9):53-58.
[4]李勇君,黃卓,郭波.武器—目標(biāo)分配問題綜述[J].兵工自動(dòng)化,2009,28(11):1-4.
[5]葉媛媛,閔春平.基于滿意決策的多UAV協(xié)同目標(biāo)分配方法[J].國(guó)防科技大學(xué)學(xué)報(bào),2005,27(4):116-120.
[6]唐蘇妍,梅珊,朱一凡,等.基于擴(kuò)展合同網(wǎng)協(xié)議的分布式武器目標(biāo)分配方法[J].系統(tǒng)工程與電子技術(shù),2011,33 (3):568-574.
[7]羅紅英.遺傳算法在目標(biāo)優(yōu)化分配中的應(yīng)用[J].電光與控制,2008,15(3):18-20.
[8]范成禮,邢清華.基于IDPSO的武器目標(biāo)分配優(yōu)化算法[J].系統(tǒng)工程與電子技術(shù),2015,37(2):336-342.
[9]唐傳林,杜海文.基于博弈論的多UCAV對(duì)地攻擊目標(biāo)分配[J].電光與控制,2011,18(10):28-31.
[10]曾松林,王文惲,丁大春,等.基于動(dòng)態(tài)博弈的目標(biāo)分配方法研究[J].電光與控制,2011,18(2):26-29.
[11]史建國(guó),高曉光,李相民.基于離散模糊動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的空戰(zhàn)態(tài)勢(shì)評(píng)估及仿真[J].系統(tǒng)仿真學(xué)報(bào),2006,18 (5):1093-1096.
[12]史建國(guó).變結(jié)構(gòu)離散動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的快速推理算法[J].火力與指揮控制,2012,37(9):71-74.
[13]楊濤,周德云.改進(jìn)的無人機(jī)編隊(duì)內(nèi)目標(biāo)分配算法研究[J].計(jì)算機(jī)測(cè)量與控制,2008,16(11):1641-1643.
[14]張琳,馬良,萬新龍.改進(jìn)遺傳算法的多機(jī)超視距同空戰(zhàn)目標(biāo)分配法[J].四川兵工學(xué)報(bào),2013,24(1):154-157.
Improved Game Theory Based Targets Assigning for Ship-based UAV Formation Coordinated Air-to-Sea Attack
HAN Yu-long1,YAN Jian-gang1,CHEN Rong1,LI Jun1,2,SUN Shou-Fu1,LIN Yun1
(1.Naval Aeronautical and Astronautical University,Yantai 264001,China;2.Unit 92913 of PLA,Lingao 571820,China)
Target assigning is an important problem for autonomous control and management of cooperative UAVs.To resolve targets assigning for Ship-based UAV Formation coordinated Air-to-Sea attack,a target value assessment model base on discrete Dynamic Bayesian networks(DBN)is proposed,on the basis of which the profit and loss matrix is formed.Then a decision function and an improved game theory based model of targets assigning for Ship-based UAV formation coordinated air-to-sea attack are proposed.Four special kinds of algorithm are designed for corresponding restriction.Lastly,the improved game theory algorithm is simulated.The experimental results shows that the method can quickly and efficiently resolve the target assigning problem for Ship-based UAV formation coordinated air-to-sea attack.
ship-based UAV,air-to-sea attack,targets assigning,Bayesian networks,game theory
TP391;TJ85
A
1002-0640(2016)07-0065-06
2015-05-20
2015-07-15<* class="content">*基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金軍事學(xué)項(xiàng)目(11GJ003074);軍事學(xué)博士研究生基金資助項(xiàng)目(2014JY473)*
國(guó)家社會(huì)科學(xué)基金軍事學(xué)項(xiàng)目(11GJ003074);軍事學(xué)博士研究生基金資助項(xiàng)目(2014JY473)< class="content">作者簡(jiǎn)介:韓玉龍(1987-),男,山東濰坊人,博士研究生。研究方向:武器裝備攻防體系對(duì)抗和信息化,艦載無人機(jī)作戰(zhàn)使用。
韓玉龍(1987-),男,山東濰坊人,博士研究生。研究方向:武器裝備攻防體系對(duì)抗和信息化,艦載無人機(jī)作戰(zhàn)使用。