徐克虎,孔德鵬,張志勇,王增發(fā),陳金玉
(1.裝甲兵工程學(xué)院,北京100072;2.解放軍78098部隊,四川崇州611237)
合成分隊火力分配自適應(yīng)決策模型研究*
徐克虎1,孔德鵬1,張志勇1,王增發(fā)1,陳金玉2
(1.裝甲兵工程學(xué)院,北京100072;2.解放軍78098部隊,四川崇州611237)
針對合成分隊武器和打擊目標種類多樣,戰(zhàn)場態(tài)勢變化迅速的特點,提出了一種火力分配自適應(yīng)決策模型。該模型在火力分配中加入滿意度函數(shù)以提高整體火力打擊效率,根據(jù)各決策單元評估信息通過灰色關(guān)聯(lián)法獲得目標價值,根據(jù)目標類型和特點通過BP神經(jīng)網(wǎng)絡(luò)自動選擇適合打擊武器,通過GM(1,1)模型預(yù)測目標狀態(tài)指標并結(jié)合相應(yīng)的影響因素預(yù)測命中概率。仿真實例表明,自適應(yīng)火力分配模型能夠依據(jù)態(tài)勢變化信息調(diào)整火力分配模型參數(shù),獲得更加合理有效的火力分配結(jié)果。
合成分隊,火力分配,自適應(yīng),決策模型
合成分隊指揮員在作戰(zhàn)的指揮控制決策過程中,往往面對大量的即時信息,這些信息會直接影響火力分配決策,而決策的合理與否關(guān)系到分隊整體火力打擊的效能發(fā)揮。戰(zhàn)場態(tài)勢不斷變化,目標的位置、速度等時刻變化,武器平臺有多種武器可選,因此,火力分配決策也應(yīng)當根據(jù)態(tài)勢的變化而變化?;鹆Ψ峙渥赃m應(yīng)決策就是在態(tài)勢信息不斷變化的情況下,自動調(diào)整決策模型中的相關(guān)參數(shù)以適應(yīng)決策系統(tǒng)的需求。
火力分配的基礎(chǔ)是獲得目標戰(zhàn)場價值、目標威脅程度,合理選擇我方打擊武器,獲得我方的打擊概率矩陣。目前針對因信息和態(tài)勢變化而參數(shù)自適應(yīng)調(diào)整的研究較少,見文獻[1-6]。但這些方法沒有把自適應(yīng)參數(shù)調(diào)整與火力分配模型應(yīng)用結(jié)合起來,與態(tài)勢變化的適應(yīng)性不夠。
本文結(jié)合前面文獻的研究成果,提出了一種火力分配的自適應(yīng)決策模型,該模型的目標價值、打擊武器選擇、命中概率參數(shù)根據(jù)態(tài)勢信息自適應(yīng)調(diào)整,從而獲得更為合理的分配方案。
傳統(tǒng)的武器目標分配方法是基于經(jīng)典的WTA模型之上建立的,但是在決策的過程中,戰(zhàn)場態(tài)勢時刻變化,求解參數(shù)始終變化,所以決策方法應(yīng)當能夠滿足這種變化的要求。自適應(yīng)火力分配就是指在態(tài)勢發(fā)生變化,目標價值、武器選擇、命中概率不斷變化過程中,自適應(yīng)獲得分配參數(shù),從而獲得最佳打擊效能?;鹆Ψ峙渥赃m應(yīng)決策模型結(jié)構(gòu)如圖1所示。
圖1 火力分配自適應(yīng)決策結(jié)構(gòu)圖
火力分配問題中,考慮我方有m個武器平臺,對n個目標需要進行打擊,期望獲得最大的打擊效能。假設(shè)目標的戰(zhàn)場價值V=[v1,v2,…,vn],各武器對目標的命中概率矩陣為P=(pij)m×n,假設(shè)每個武器平臺一次只能打擊一個目標,目標j的集火打擊規(guī)模最大為Cj,則火力分配模型為
自適應(yīng)決策需要解決適應(yīng)性問題,在模型中需要考慮火力適度打擊問題,要使得火力打擊整體效用最大,防止火力浪費和不足;打擊目標需要考慮集火規(guī)模的費效比,應(yīng)當以較少的彈藥獲得較好的打擊效果。一般滿意打擊概率設(shè)為0.7,打擊概率過小則不能滿足毀傷需求,過大導(dǎo)致彈藥浪費,建立滿意度函數(shù)μ(x)。
引入滿意度函數(shù)μ(x)后,目標綜合打擊概率需結(jié)合滿意度評價值,使得火力分配的打擊概率遠離滿意區(qū)間時減小目標函數(shù)值,可減少無法打擊目標的火力浪費和集火過度的浪費,從而提高整體打擊效能。加入滿意度隸屬函數(shù)可取消集火規(guī)模約束,求解模型變?yōu)?/p>
在求解模型中,需要獲得適應(yīng)態(tài)勢變化的戰(zhàn)場目標價值評估、武器平臺的自適應(yīng)選擇、打擊概率的自適應(yīng)調(diào)整,本文將介紹其求解方法。
指揮決策的基礎(chǔ)是獲得戰(zhàn)場的各種信息,在分隊作戰(zhàn)過程中,指揮員會獲得多種態(tài)勢信息,需要對相應(yīng)的信息進行綜合,更加科學(xué)合理地評估目標的威脅度、價值等[7]。這里采用權(quán)重自適應(yīng)調(diào)整的方法。目標價值是火力分配的重要參考,一般分布式評估的過程中,每個決策單元都會對目標進行評估,是一種群體決策行為。對于上層的決策單元,應(yīng)當根據(jù)這些信息從整體角度進行綜合評估,通過群體決策獲得最終目標價值[8]。
假設(shè)有m個下層的決策單元,作戰(zhàn)中都對n個目標進行評估,vi=[vi1vi2…vin],獲得的價值評估矩陣為
式中vij表示第i個決策單元對第j個目標的評估值。設(shè)m個決策單元的權(quán)重為w=[w1w2…wm],則整體的價值評估值為
由于戰(zhàn)場態(tài)勢的變化和決策中心位置等因素影響,各決策中心權(quán)重應(yīng)當適應(yīng)性變化。對于這些參數(shù)信息不完全和信息模糊不確定的問題,運用灰色系統(tǒng)理論可以有效解決。將個體決策者的評估值作為比較序列,整體評估值作為參考序列,計算兩者之間的關(guān)聯(lián)度,關(guān)聯(lián)度越大說明其評分值與群體決策值越接近,那么該決策者的權(quán)重就應(yīng)越大。
參考序列為一致加權(quán)綜合值V0=[V1V2…Vn],比較序列為vi=[vi1vi2…vin],兩者的關(guān)聯(lián)系數(shù)為
式中,ρ∈[0,1]為分辨系數(shù),ρ越小分辨率越大,一般取0.5。
進行群決策需考慮各決策單元提供的信息,防止追求意見一致而忽略了專家對結(jié)果的影響,調(diào)整專家的權(quán)值
合成分隊的武器平臺有多種武器使用,如主戰(zhàn)坦克,其武器系統(tǒng)有主炮、并列機槍、高射機槍、炮射導(dǎo)彈等。需要針對不同的目標采用不同的武器進行打擊,如近距離的步兵應(yīng)當使用并列機槍,低空飛行器應(yīng)當使用高射機槍,打擊裝甲目標選擇主炮,距離較遠的可以使用炮射導(dǎo)彈等。
為了獲得自適應(yīng)決策,采用如下方法,對于我方武器平臺Wi(以坦克為例),目標的參數(shù)如表1所示。
表1 坦克武器選擇影響因素
目標類型量化方法采用標度法,目標類型Sj= {單兵,裝甲車輛,低空飛行器,作戰(zhàn)工事},所以可以設(shè)置Sj={Sj1,Sj2,Sj3,Sj4}={1,2,3,4};輸出武器類型Wi={并列機槍,高射機槍,主炮,炮射導(dǎo)彈},Wi={Wi1,Wi2,Wi3,Wi4},其中Wik=0 or 1,這里假定每次只能使用一種武器進行打擊。目標聚集度取值區(qū)間如表2所示。
BP神經(jīng)網(wǎng)絡(luò)具有良好自學(xué)習(xí)能力、泛化效果好、使用簡單[9]。采用BP神經(jīng)網(wǎng)絡(luò)進行適應(yīng)性武器類型選擇,選用目標類型Si、目標距離Di、目標聚集度Ci為輸入,適用的武器類型為輸出,建立3個輸入4個輸出的BP神經(jīng)網(wǎng)絡(luò)模型,如圖2所示。再根據(jù)經(jīng)驗公式選取隱含層節(jié)點數(shù)為7。通過德爾菲法獲得樣本數(shù)據(jù)[10],然后依據(jù)樣本數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)。
表2 目標聚集度量化值
圖2 BP網(wǎng)絡(luò)預(yù)測的武器自適應(yīng)選擇
命中概率矩陣是火力優(yōu)化分配的基礎(chǔ)之一,由于我方武器平臺和目標都處于時刻變化的戰(zhàn)場態(tài)勢之下,其毀傷概率也是實時變化的。通過上節(jié)的方法確定的打擊武器類型,然后預(yù)測打擊時的目標參數(shù),確定命中概率影響因素和其大小,最后計算命中概率。
4.1 動態(tài)指標預(yù)測
第i個武器平臺打擊第j個目標:獲得了目標的距離和速度時間序列,預(yù)測下一時刻的速度和距離。已知位置序列Dij(1),Dij(2),Dij(3),…,Dij(k),速度序列VFij(1),VFij(2),VFij(3),…,VFij(k),從而獲得預(yù)測值Dij(k+1),VFij(k+1)。采用GM(1,1)預(yù)測模型,GM(1,1)預(yù)測模型需要的原始數(shù)據(jù)量小,預(yù)測精度高,計算過程簡單,符合動態(tài)指標預(yù)測的一般要求[11]。預(yù)測的一般步驟如下:
①設(shè)原始數(shù)據(jù)序列為X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),對X(0)進行下式處理:
生成新序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n));
②生成X(1)的緊鄰均值序列Z(1)=(z(1)(1),z(1)(2),…,z(1)(n)):
⑤將響應(yīng)序列值還原到式(11),完成動態(tài)指標預(yù)測。
GM(1,1)建模的基本作用是消除原始信息的隨機性和波動性,更好地反映信息變化的規(guī)律,因此,按照上述步驟可以計算出Dij(k+1),VFij(k+1)。
4.2 目標命中概率影響因素
4.2.1 距離影響因子μijD
Dij(k)為當前時刻目標j與武器平臺Wi的距離,Dij(k+1)為預(yù)測的打擊時刻的目標j與武器平臺Wi的距離。Sgn()為符號函數(shù),距離減小時,命中概率會增大,否則減小,距離影響因子不能使命中概率大于1,因此,命中概率需要滿足約束限制。
4.2.2 速度影響因子μijVF
VFij(k+1)為預(yù)測的打擊時刻目標速度,VFijmax為該類型武器適合打擊的目標最大速度,定義為第i類武器對第j個目標命中概率降低為靜止時一半的目標速度。σ為調(diào)整系數(shù),取σ為0.693 1。
4.2.3 環(huán)境影響因子μijE
4.3 自適應(yīng)命中概率
Pij0表示是第i個武器平臺的理想情況下靜止命中概率,可由武器裝備效能參數(shù)和實彈實驗獲得。經(jīng)過距離影響因子調(diào)整后的打擊概率可能增大,但不能超出其限制,即pij∈[0,1]。
為了對自適應(yīng)決策算法進行驗證,戰(zhàn)場態(tài)勢地圖如圖3所示,我方兵力和敵目標分別為:我方:坦克4輛、步戰(zhàn)車2輛、防空導(dǎo)彈車2輛、武裝直升機2架,編號為W1-W10;敵方:坦克3輛、武裝直升機1架、防空導(dǎo)彈車1輛、軍事碉堡1座,編號為E1-E6。共有6個決策單元對目標的價值進行評估,結(jié)果如表3所示。
圖3 戰(zhàn)場態(tài)勢簡化示意圖
表3 各決策中心目標戰(zhàn)場價值評估
6個決策單元的初始權(quán)重為w=[0.2 0.2 0.1 0.2 0.15 0.15],通過灰色關(guān)聯(lián)法,計算獲得自適應(yīng)權(quán)重為w=[0.174 60.182 70.103 40.222 7 0.179 3 0.137 3],目標的戰(zhàn)場價值為v=[0.427 5 0.644 3 0.514 1 0.839 6 0.507 7 0.338 9];通過神經(jīng)網(wǎng)絡(luò)獲得打擊目標適宜武器選擇,如下頁表4所示。
表4 我方武器單元打擊武器選擇表
通過目標的動態(tài)參數(shù)預(yù)測,結(jié)合戰(zhàn)場環(huán)境,可以計算出所選擇武器對目標的命中概率。以我方坦克W1打擊敵坦克E1為例,D=[3 200 3 130 3 100 3 0202 970 2 9002 8402 790],VF=[3.94.5 6.0 6.7 8.28.8 9.5 10.2],獲得的預(yù)測值為D11=2 734.291 1,V11=11.996 6;則μ11D=1.000 4;μ11VF= 0.641 9;μ11E=1;根據(jù)裝備參數(shù)獲得P110=0.85;則p11=μ11Dμ11VFμ11EP110=0.545 8;無法打擊的目標命中概率設(shè)為0.01,因此,可以獲得命中概率矩陣,如表5所示。
表5 我方所選打擊武器對目標打擊概率
通過粒子群算法對模型進行計算,獲得分配結(jié)果如表6和圖4所示。
從分配結(jié)果可以看出,我方武裝直升機對敵坦克和防空導(dǎo)彈進行了打擊,我方防空導(dǎo)彈對敵方直升機進行打擊,坦克和步兵戰(zhàn)車按照條件不同分別使用主炮和炮射導(dǎo)彈進行打擊,分配結(jié)果合理有效。通過對6個決策單元的的戰(zhàn)場價值評估結(jié)果進行群決策融合,提高了目標戰(zhàn)場價值的科學(xué)性;通過選擇合適的打擊武器,考慮了影響因素的自適應(yīng)命中概率,能夠獲得有效的火力分配方案。我方的綜合打擊概率多在0.6-0.8之間,打擊的效用較高,從而有效利用戰(zhàn)場信息優(yōu)勢,提高了整體打擊效果。
表6 我方武器對目標打擊火力分配
圖4 自適應(yīng)火力分配決策結(jié)果
通過對合成分隊作戰(zhàn)過程中態(tài)勢變化快、環(huán)境復(fù)雜的特點,建立火力分配自適應(yīng)決策模型。通過群決策理論對多決策中心的評估信息進行自適應(yīng)融合,通過BP神經(jīng)網(wǎng)絡(luò)對打擊武器進行選擇,考慮命中概率環(huán)境影響因素并應(yīng)用GM(1,1)對動態(tài)指標進行預(yù)測,計算了自適應(yīng)命中概率。仿真結(jié)果說明模型具有一定決策自適應(yīng)性功能,能夠根據(jù)態(tài)勢信息自適應(yīng)調(diào)整相關(guān)參數(shù),提高火力分配的科學(xué)性。
[1]王少蕾,陳維義,顧雪峰.自適應(yīng)差分進化算法求解多平臺多武器-目標分配問題[J].系統(tǒng)工程與電子技術(shù),2013,35(10):2115-2120.
[2]傅調(diào)平,陳建華,李剛強.基于動態(tài)自適應(yīng)遺傳算法的艦艇防空火力分配[J].廣西師范大學(xué)學(xué)報(自然科學(xué)版),2010,28(3):187-190.
[3]歐微,王克勤,朱岑.基于自適應(yīng)變異粒子群算法的火力分配方法研究[J].指揮控制與仿真,2012,34(3):50-53.
[4]吳玲,盧發(fā)興.WTA問題的截止期定義及Anytime算法分析[J].武漢理工大學(xué)學(xué)報,2010,32(6):140-143.
[5]隋永華,郭雷,俞利新,等.基于不完全信息空戰(zhàn)的火力分配建模與應(yīng)用[J].火力與指揮控制,2012,37(7):74-76.
[6]孫義,黃海峰,丁建華.多屬性群決策權(quán)重自適應(yīng)算法[J].計算機工程與應(yīng)用,2014,50(2):35-38.
[7]馮卉,毛紅保,王美乂.一種基于區(qū)間數(shù)的防空保衛(wèi)目標價值評估技術(shù)[J].彈箭與制導(dǎo)學(xué)報,2014,34(2):145-148.
[8]楊雷,作文宜.動態(tài)群體決策:個體交互、知識學(xué)習(xí)和觀點演化[M].北京:科學(xué)出版社,2012.
[9]陳華,張可,曹建蜀.基于PSO-BP算法的目標威脅評估[J].計算機應(yīng)用研究,2012,29(3):900-901.
[10]劉偉濤,顧鴻,李春洪.基于德爾菲法的專家評估方法[J].計算機工程,2011,37S:189-191.
[11]徐克虎,陳金玉,孔德鵬.基于GM(1,1)預(yù)測與改進Vague集距離的裝甲分隊目標威脅評估[J].裝甲兵工程學(xué)院學(xué)報,2015,29(1):25-29.
Research on Adaptive Decision Model of Fire Distribution of Synthetic Unit
XU Ke-hu1,KONG De-peng1,ZHANG Zhi-yong1,WANG Zeng-fa1,CHEN Jin-yu2
(1.Academy of Armored Force Engineering,Beijing 100072,China;2.Unit 78098 of PLA,Chongzhou 611237,China)
Aiming at the variety of weapon and target species of the synthetic unit,and the characteristics of rapid change of the battlefield situation,an adaptive decision model of fire distribution is put forward.The model in the fire distribution added satisfaction function to enhance the overall firepower efficiency,according to each Decision Making Unit(DMU)assessment information through gray correlation method obtained value goal,according to the types and characteristics of the target by BP neural network automatically select suited combat weapons,based on GM(1,1)model to predict the target state index and combined with the corresponding factors predict hit probability.The simulation results show that the model can adjust the parameters of the fire distribution model based on the situation information and get more reasonable and effective fire distribution results.
synthesis unit,fire distribution,self-adaptive,decision model
E924
A
1002-0640(2017)02-0043-05
2016-01-08
2016-02-20
軍隊科研計劃基金資助項目(2013ZB15)
徐克虎(1963-),男,安徽蚌埠人,教授,碩士生導(dǎo)師。研究方向:作戰(zhàn)評估與決策優(yōu)化。