田福平,汶博,鄭鵬鵬
(1.清華大學(xué),北京100084;2.解放軍68210部隊,陜西寶雞721001)
基于貝葉斯網(wǎng)絡(luò)的作戰(zhàn)目標(biāo)評估
田福平1,2,汶博2,鄭鵬鵬2
(1.清華大學(xué),北京100084;2.解放軍68210部隊,陜西寶雞721001)
在作戰(zhàn)指揮決策活動的籌劃階段,對敵體系要害和關(guān)鍵點的分析,當(dāng)前尚未形成系統(tǒng)方法。針對此問題,利用貝葉斯網(wǎng)絡(luò)在非精確知識表達與推理領(lǐng)域的優(yōu)勢,提出了綜合考慮目標(biāo)價值、打擊難度、打擊效果等因素的作戰(zhàn)目標(biāo)評估模型。根據(jù)判別貝葉斯網(wǎng)絡(luò)分類器性能優(yōu)于生成貝葉斯網(wǎng)絡(luò)分類器的特點,在經(jīng)相關(guān)領(lǐng)域?qū)<艺撟C的樣本數(shù)據(jù)集的基礎(chǔ)上,采取梯度下降法訓(xùn)練得出評估模型各結(jié)點條件概率分布。最后,利用Netica仿真軟件,經(jīng)樣本數(shù)據(jù)測試,證明了作戰(zhàn)目標(biāo)評估模型的合理性。
作戰(zhàn)目標(biāo),評估,貝葉斯網(wǎng)絡(luò),梯度下降
敵作戰(zhàn)體系的要害和關(guān)鍵節(jié)點,是現(xiàn)代戰(zhàn)爭指揮員必須掌握的敵情信息,是執(zhí)行精確打擊等作戰(zhàn)行動的依據(jù)。《軍語》定義“作戰(zhàn)目標(biāo)”是作戰(zhàn)行動所要打擊、奪取或防衛(wèi)的對象,包括有生力量、武器裝備、軍事設(shè)施及對作戰(zhàn)進程和結(jié)局有重要影響的其他目標(biāo)。作戰(zhàn)目標(biāo)評估就是對目標(biāo)價值、打擊難度、打擊效果等因素綜合分析,劃定等級,為作戰(zhàn)籌劃提供量化分析結(jié)果。
目前,對作戰(zhàn)目標(biāo)評估的研究,主要是使用概率網(wǎng)絡(luò)等方法[1-3],分析模型多是針對某一類型目標(biāo)[4-6],尚未形成全類型目標(biāo)的系統(tǒng)分析方法。本文通過研究美軍目標(biāo)分析方法,基于貝葉斯網(wǎng)絡(luò),構(gòu)建了全類型作戰(zhàn)目標(biāo)評估模型,并利用Netica進行仿真驗證。
貝葉斯網(wǎng)絡(luò)是一種重要的概率模型,自1986年由Pearl提出后[7-8],就成為人工智能中非精確知識表達與推理領(lǐng)域的研究熱點。
1.1 貝葉斯網(wǎng)絡(luò)定義
一個貝葉斯網(wǎng)絡(luò)[9]是一個二元組B=<G,P>,其中:
貝葉斯網(wǎng)絡(luò)變量的聯(lián)合概率為:
貝葉斯網(wǎng)絡(luò)規(guī)定,結(jié)點Vi條件獨立于由Vi的父結(jié)點給定的非Vi后代結(jié)點構(gòu)成的任何結(jié)點子集,即:
其中,C(Vi)為非Vi后代結(jié)點構(gòu)成的任何結(jié)點子集。因此,式(1)可轉(zhuǎn)化為:
1.2 貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)
假設(shè)貝葉斯網(wǎng)絡(luò)最后一個變量為類別變量C∈{1,…,|C|},用|C|表示所有取值的個數(shù)。這時數(shù)據(jù)集的對數(shù)條件似然函數(shù)為:
給定一個未知類別變量的實例,貝葉斯網(wǎng)絡(luò)通過貝葉斯準(zhǔn)則計算給定屬性值類別的條件后驗概率進行分類:
其中,θ是貝葉斯網(wǎng)絡(luò)的參數(shù),1≤cd≤|C|。通過計算所有可能類別的條件后驗概率,然后取概率最大的值作為類別變量的取值。
貝葉斯網(wǎng)絡(luò)學(xué)習(xí)就是找出一種網(wǎng)絡(luò),能夠按照某種測度最大程度地與給定的樣本數(shù)據(jù)集吻合,包括參數(shù)學(xué)習(xí)和結(jié)構(gòu)學(xué)習(xí)兩部分[10]。本文依據(jù)專家經(jīng)驗建立貝葉斯網(wǎng)絡(luò)拓撲結(jié)構(gòu),采用梯度優(yōu)化法,經(jīng)樣本數(shù)據(jù)集學(xué)習(xí),得出條件概率集合P。
1.3 梯度下降法
梯度下降法會在目標(biāo)函數(shù)的梯度方向進行小步搜索,并且每一次的搜索值均會優(yōu)于上次搜索的結(jié)果,當(dāng)步長為?時,搜索的點為Θ+?·ΔΘ,在達到一個局部最優(yōu)值時停止,這時的梯度為0。
2.1 評估模型拓撲結(jié)構(gòu)
圖1 目標(biāo)評估模型
貝葉斯網(wǎng)絡(luò)作戰(zhàn)目標(biāo)評估模型拓撲結(jié)構(gòu)定性描述了網(wǎng)絡(luò)中各結(jié)點之間的因果關(guān)系。本文在參考美軍目標(biāo)選擇標(biāo)準(zhǔn)的基礎(chǔ)上,進一步細化評估指標(biāo),構(gòu)建了具有三級評估指標(biāo)的目標(biāo)評估模型(如圖1)。一級評估指標(biāo)包括關(guān)鍵性(Importance)、可行性(Feasibility)、復(fù)原力(Resilience)、脆弱性(Vulnerability)、效果(Effect)和可辨認(rèn)性(Identifiability);關(guān)鍵性二級指標(biāo)包括體系支撐能力(System Support A-bility,SSA)和威脅等級(Threat Level,THL),可行性二級指標(biāo)包括防御等級(Defense Level,DL)、目標(biāo)位置(Target Location,TLO)和打擊手段(Blow Means,BM),可辨認(rèn)性二級指標(biāo)包括目標(biāo)幾何大?。═arget Size,TS)、偽裝能力(Camouflage Ability,CA)和偽造能力(Forging Ability,F(xiàn)A);威脅等級三級指標(biāo)包括指揮控制能力(Command and Control Ability,CCA)、空中攻擊能力(Air Attack Ability,AAA)、地面攻擊能力(Ground Attack Ability,GAA)、遠程打擊能力(Long-distance Attack Ability,LAA)和信息作戰(zhàn)能力(Information warfare Ability,IAA),防御等級三級指標(biāo)包括空中防御能力(Air Defense Capability,ADC)、地面防御能力(Ground Defense Capability,GDC)和信息防御能力(Information Defense Capability,IDC),打擊手段三級指標(biāo)包括空中打擊(Air Strike,AIS)、戰(zhàn)役戰(zhàn)術(shù)導(dǎo)彈打擊(Campaign tactical Missile Strike,CMS)、火炮打擊(Artillery Strike,ARS)和特種打擊(Special Strike,SS)。
2.2 評估模型參數(shù)
2.2.1 評估模型中結(jié)點狀態(tài)分析
目標(biāo)等級和一級指標(biāo)均采取三級評定制,由一級至三級,目標(biāo)的綜合評定等級和一級指標(biāo)等級遞減。一級指標(biāo)評估標(biāo)準(zhǔn)如表1所示。二級指標(biāo)中體系支撐能力、偽裝能力、偽造能力分為強、中、弱三級,威脅等級、防御等級分為高、中、差三級,目標(biāo)位置分為前沿和縱深,打擊手段分多樣和單一,目標(biāo)幾何大小分大和小。三級指標(biāo)中指揮控制能力、遠程打擊能力、空中攻擊能力、地面攻擊能力、信息作戰(zhàn)能力、空中防御能力、地面防御能力、信息防御能力均分強、中、弱三級,空中打擊、戰(zhàn)役戰(zhàn)術(shù)導(dǎo)彈打擊、火炮打擊、特種打擊皆有是和否兩種狀態(tài)。
表1 一級指標(biāo)等級標(biāo)準(zhǔn)
2.2.2 樣本數(shù)據(jù)集
經(jīng)相關(guān)領(lǐng)域?qū)<遗袛?,建立作?zhàn)目標(biāo)樣本數(shù)據(jù)集。由于篇幅限制,此處僅列出一級指標(biāo)樣本數(shù)據(jù)集(如表2),包含作戰(zhàn)力量、武器裝備、軍事設(shè)施等不同類型的35個樣本數(shù)據(jù)。
2.2.3 網(wǎng)絡(luò)參數(shù)訓(xùn)練
本文采用Netica貝葉斯網(wǎng)絡(luò)仿真工具,建立貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),并利用Netica集成的梯度下降法對樣本數(shù)據(jù)集進行學(xué)習(xí),得出結(jié)點的概率分布,如下頁圖2所示。
表2 貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)樣本數(shù)據(jù)集(一級指標(biāo))
論證實驗同樣運用Netica仿真工具。限于篇幅,本文以目標(biāo)評估模型中的一級指標(biāo)為例進行測試評估。隨機選取指揮所、作戰(zhàn)力量、機場、導(dǎo)彈陣地等類型非樣本數(shù)據(jù)集中目標(biāo)作為測試樣本數(shù)據(jù)(如下頁表3)。
圖2 貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖
表3 作戰(zhàn)目標(biāo)評估模型測試數(shù)據(jù)集
將測試樣本分別輸入到評估模型中,得出評估結(jié)果如表4所示。將表4綜合評定等級與表3目標(biāo)等級進行對比可得出,評估結(jié)果正確率為100%。由此可見,本文建立的貝葉斯網(wǎng)絡(luò)作戰(zhàn)目標(biāo)評估模型,能夠準(zhǔn)確評估作戰(zhàn)目標(biāo)等級。
表4 作戰(zhàn)目標(biāo)評估模型測試結(jié)果
本文將貝葉斯網(wǎng)絡(luò)應(yīng)用到作戰(zhàn)目標(biāo)評估中,運用專家經(jīng)驗法建立參數(shù)訓(xùn)練、模型測試數(shù)據(jù)集,通過采用梯度下降判別參數(shù)學(xué)習(xí)算法,訓(xùn)練得出貝葉斯網(wǎng)絡(luò)結(jié)點條件概率分布,構(gòu)建作戰(zhàn)目標(biāo)評估模型,實現(xiàn)了對敵作戰(zhàn)體系要害和關(guān)鍵點的分析評定,為輔助決策提供了新手段。
[1]LUCIA F.Using bayesian network analysis to support center of gravity analysis in military planning[J].Eumpean Journal of Operational Research,2006(170):629-643.
[2]KUTER U,NAU D,GOSSINK D,et al.Interactive course-ofaction planning using causal models[C]//Proceedings of the Third International Conference on Knowledge Systems for Coalition Operations(KSCO-2004),2004:1-12.
[3]JOUNI P.Decision analytical approach to effects based operations[D].Helsinki:Helsinki University of Technology,2009.
[4]宋乃華,邢清華,劉付顯.基于Agent的空襲目標(biāo)流的反應(yīng)行為模型[J].計算機工程,2007,33(19):210-212.
[5]賈子英,陳松輝,鐘常綠.南海島礁火力打擊作戰(zhàn)目標(biāo)選擇模型[J].艦船電子工程,2014,34(8):21-24.
[6]徐克虎,黃大山,王天召.基于RBF-GA的坦克分隊作戰(zhàn)目標(biāo)評估[J].火力與指揮控制,2013,38(12):83-87.
[7]PEARL J.Fusion propagation and structuring in belief networks[J].Artificial Intelligence,1986,29(3):241-288.
[8]PEARL J.Belief networks revisited[J].Artificial Intelligence,1993,59(1):49-56.
[9]孫兆林.基于貝葉斯網(wǎng)絡(luò)的態(tài)勢估計方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué)研究生院,2005.
[10]史建國,高曉光.動態(tài)貝葉斯網(wǎng)絡(luò)及其在自主智能作戰(zhàn)中的應(yīng)用[M].北京:兵器工業(yè)出版社,2008:3-7.
[11]GREINER R,SU X Y,SHEN B.Structural extension to logistic regression-discriminative parameter learning of belief net classifers.pdf[J].Machine Learning,2005,38(1):1-10.
[12]DARWICHE A.A differential approach to inference in Bayesian networks[C]//Proceedings of the 16th coference on uncertainty in artificial intelligence San Francisco:Morgan Kaufman,1995:1146-1152.
Warfare Targets Assessment Based on Bayesian Network
TIAN Fu-ping1,2,WEN Bo2,ZHENG Peng-peng2
(1.Tsinghua University,Beijing 100084,China;2.Unit 68210 of PLA,Baoji 721001,China)
During the operational command,there is no systematic method,in the analysis of the key points of the enemy system.Bayesian network has advantages in the field of imprecise knowledge representation and reasoning,which is just the value to establish an evaluation model.The model considers the target value,the difficulty and the effect.The performance of discriminative Bayesian network classifier is better than that of generated.So,the gradient descent method is used to carry out parameter learning on the basis of the sample data set which is demonstrated by experts.Finally,the sample data test proves the rationality of the model by the use of Netica.
warfaretargets,assessment,bayesiannetwork,gradientdescent
E917
A
1002-0640(2017)02-0079-04
2016-01-05
2016-02-07
田福平(1965-),男,陜西彬縣人,博士研究生。研究方向:作戰(zhàn)指揮。