趙曉輝,姚佩陽(yáng),張 鵬
(1.空軍工程大學(xué)電訊工程學(xué)院,西安 710077;2.空軍工程大學(xué)工程學(xué)院,西安 710038)
戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)是把來(lái)自多傳感器和信息源的數(shù)據(jù)和信息加以聯(lián)合、相關(guān)和組合,以獲得精確的位置估計(jì)和身份估計(jì),以及對(duì)戰(zhàn)場(chǎng)情況和威脅及其重要程度進(jìn)行實(shí)時(shí)的完整評(píng)價(jià)。由于戰(zhàn)場(chǎng)信息復(fù)雜多變,具有高度的不確定性、不完備性,因此態(tài)勢(shì)估計(jì)必須能對(duì)這種不確定性進(jìn)行有效推理,并能對(duì)敵方下一步行動(dòng)做出預(yù)測(cè)。
貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)是一種進(jìn)行不確定性推理和數(shù)據(jù)分析的有效工具,在戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)中已經(jīng)得到一定應(yīng)用[1-2]。但是該方法未考慮連續(xù)時(shí)間因素,系統(tǒng)參數(shù)不能得到及時(shí)調(diào)整,有可能出現(xiàn)對(duì)未來(lái)態(tài)勢(shì)的錯(cuò)誤預(yù)測(cè)。而動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Network,DBN)將BN擴(kuò)展到對(duì)時(shí)間演化的過(guò)程進(jìn)行表示,能夠根據(jù)多個(gè)時(shí)刻的觀測(cè)值對(duì)系統(tǒng)的各個(gè)時(shí)刻或某一時(shí)刻的狀態(tài)進(jìn)行估計(jì)和預(yù)測(cè)。
本文將DBN應(yīng)用于戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì),構(gòu)建了包含連續(xù)變量的模型,并提出以卡爾曼濾波圖模型法對(duì)連續(xù)隱狀態(tài)DBN進(jìn)行推理預(yù)測(cè),有效解決了DBN的推理問(wèn)題。通過(guò)實(shí)驗(yàn)仿真,證明了此方法的正確性。
所謂的BN是指基于概率分析、圖論的一種不確定性知識(shí)的表達(dá)和推理的模型。從直觀上講BN表現(xiàn)為一個(gè)賦值的復(fù)雜因果關(guān)系網(wǎng)絡(luò)圖,網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn)表示一個(gè)變量,即一個(gè)事件,各變量之間的弧表示事件發(fā)生的直接因果關(guān)系。一個(gè)BN可以看成一個(gè)二元組 B=〈G,P〉,其中:網(wǎng)絡(luò)結(jié)構(gòu) G,G=〈X,A〉是一個(gè)有向無(wú)環(huán)圖(DAG),其節(jié)點(diǎn)為隨機(jī)變量 X={X1,X2,…,Xn},n≥1,A是弧的集合。網(wǎng)絡(luò)參數(shù)P,P中的每一個(gè)元素代表節(jié)點(diǎn)Xi的條件概率密度,由概率的鏈規(guī)則得:
BN在態(tài)勢(shì)估計(jì)上的應(yīng)用已經(jīng)有很多文獻(xiàn)進(jìn)行了研究[4],下面以戰(zhàn)爭(zhēng)中一個(gè)簡(jiǎn)單場(chǎng)景為例,對(duì)BN的結(jié)構(gòu)建模、參數(shù)學(xué)習(xí)和概率推理分別進(jìn)行介紹。
假設(shè)我方直升機(jī)超低空飛行突襲敵方重要設(shè)施,欲對(duì)突襲的成功率進(jìn)行估計(jì)。軍事專(zhuān)家分析出影響成功率的態(tài)勢(shì)因素為敵方部隊(duì)組成、我方直升機(jī)情況、天氣狀況,詳細(xì)包括:
1)環(huán)境因素,天氣TQ(好、中、差);
2)敵方部隊(duì)因素,攻擊力GJ(強(qiáng)、弱)、偵察能力ZC(強(qiáng)、弱),電子干擾強(qiáng)度DG(強(qiáng)、弱),它們受敵方部隊(duì)組成DZ和天氣TQ影響;
3)我方部隊(duì)因素,駕駛員技術(shù)等級(jí)JS(特級(jí)、一級(jí))、抗干擾設(shè)備等級(jí)KG(一級(jí)、二級(jí)),其中KG與DG決定雙方干擾的結(jié)果GR(干擾成功、干擾失敗)。
根據(jù)態(tài)勢(shì)因素之間的因果關(guān)系確定BN的結(jié)構(gòu)[5],建立BN模型如圖1所示。圖1中圓形代表態(tài)勢(shì)因素節(jié)點(diǎn),其中 CG 為目標(biāo)節(jié)點(diǎn),DZ、TQ、KG、JS為輸入節(jié)點(diǎn),ZC、GJ、DG、GR 為過(guò)渡節(jié)點(diǎn);有向線段代表節(jié)點(diǎn)間的因果關(guān)聯(lián)。
圖1 貝葉斯網(wǎng)絡(luò)模型Fig.1 Bayesian network model
確定各節(jié)點(diǎn)概率參數(shù),方法主要有領(lǐng)域?qū)<医?jīng)驗(yàn)法、歷史數(shù)據(jù)學(xué)習(xí)法,以及兩者相結(jié)合的知識(shí)和數(shù)據(jù)融合法。經(jīng)驗(yàn)法是指依靠領(lǐng)域?qū)<?,?duì)節(jié)點(diǎn)直接給出影響概率分布,這種方法簡(jiǎn)單但是誤差較大。學(xué)習(xí)法指利用大量觀測(cè)數(shù)據(jù),對(duì)節(jié)點(diǎn)概率進(jìn)行估計(jì),該方法較復(fù)雜但是在數(shù)據(jù)量大的情況下準(zhǔn)確性高。融合法是指先用經(jīng)驗(yàn)法進(jìn)行估計(jì),然后再用學(xué)習(xí)法提高精確度,其中領(lǐng)域?qū)<业闹眯艡?quán)值設(shè)定是關(guān)鍵。
為戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)建立BN的主要目的就是利用觀測(cè)數(shù)據(jù)對(duì)目標(biāo)節(jié)點(diǎn)進(jìn)行概率推理,將結(jié)果用于戰(zhàn)場(chǎng)輔助決策。BN推理算法可分為精確算法(包括全局聯(lián)合推理、圖規(guī)約法、團(tuán)樹(shù)傳播法、組合優(yōu)化方法等)和近似算法(基于搜索的方法、仿真方法、變換方法、參數(shù)近似方法等)。使用BayesiaLab4.4工具自帶的SPI算法對(duì)圖1所示BN中成功率CG進(jìn)行概率推理,推理結(jié)果:采用領(lǐng)域?qū)<医?jīng)驗(yàn)法自定義概率分布后進(jìn)行的推理,得到CG=65.31%;在經(jīng)驗(yàn)法基礎(chǔ)上采用歷史數(shù)據(jù)學(xué)習(xí)法對(duì)1000組數(shù)據(jù)學(xué)習(xí)后進(jìn)行的推理,得到CG=78.33%;已知當(dāng)前時(shí)刻所有輸入節(jié)點(diǎn)取值情況下進(jìn)行概率推理[6],得到 CG=81.56%。
由于BN未考慮時(shí)間因素,無(wú)法對(duì)變量節(jié)點(diǎn)進(jìn)行解釋?zhuān)鐖D1中TQ和DZ都是隨著時(shí)間而變化的節(jié)點(diǎn)。而戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)中的數(shù)據(jù)往往是時(shí)間序列數(shù)據(jù),若能對(duì)其進(jìn)行分析,不僅可以預(yù)測(cè)未來(lái)時(shí)間目標(biāo)節(jié)點(diǎn)的概率取值,而且能對(duì)最大概率進(jìn)行最優(yōu)求解。這對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)的應(yīng)用是非常重要的。
在現(xiàn)代化戰(zhàn)爭(zhēng)中,戰(zhàn)場(chǎng)態(tài)勢(shì)瞬息萬(wàn)變,隨著時(shí)間因素的引入,在不同時(shí)刻的狀態(tài)所形成的數(shù)據(jù),反映了所代表的變量的發(fā)展變化規(guī)律。要分析這種變化規(guī)律就必須建立相適應(yīng)的動(dòng)態(tài)模型。DBN將BN擴(kuò)展到對(duì)時(shí)間演化的過(guò)程,反映變量的發(fā)展變化規(guī)律,可以用來(lái)解釋動(dòng)態(tài)的數(shù)據(jù)并對(duì)未來(lái)態(tài)勢(shì)進(jìn)行分析和預(yù)測(cè)。
為使DBN能夠?qū)?fù)雜系統(tǒng)進(jìn)行研究并建立相應(yīng)的模型,首先需要做一些假設(shè),即引入Markov假設(shè)和轉(zhuǎn)移概率時(shí)不變假設(shè)。Markov假設(shè)是指每一時(shí)刻的狀態(tài)變量集合只與前一個(gè)時(shí)刻狀態(tài)變量的取值有關(guān)。轉(zhuǎn)移概率時(shí)不變假設(shè)是指在一個(gè)有限的時(shí)間內(nèi)條件概率變化過(guò)程對(duì)所有t是一致平穩(wěn)的,不隨時(shí)間的變化而變化。
DBN可定義為〈B0,B→〉,其中 B0表示最開(kāi)始的BN,B→表示有兩個(gè)以上時(shí)間片段的BN組成的圖形。若用P(Xt|Xt-1)表示已知任一變量前一個(gè)時(shí)刻狀態(tài)時(shí),當(dāng)前狀態(tài)發(fā)生的概率表示第i個(gè)變量t時(shí)刻取值,Pa()表示其父節(jié)點(diǎn);N表示變量數(shù)。DBN中任一節(jié)點(diǎn)的聯(lián)合分布概率為
圖1所示BN模型中,敵方部隊(duì)組成DZ和天氣TQ是不斷變化的,為了能表示出這種變化,并能對(duì)未來(lái)的場(chǎng)景進(jìn)行預(yù)測(cè),將BN沿時(shí)間軸變化構(gòu)建DBN,圖2為DBN模型示意圖。
圖2 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型Fig.2 Dynamic Bayesian network model
圖2分為左右兩部分。左半部為BN的結(jié)構(gòu),與圖1類(lèi)似;右半部中,Y表示變化的觀測(cè)量,包括DZ和TQ兩個(gè)變量節(jié)點(diǎn);Q表示受Y影響的隱變量,包括ZC、GJ、DG、GR 4個(gè)與Y相關(guān)的過(guò)渡變量;A為目標(biāo)變量,即成功率CG。
DBN對(duì)應(yīng)的場(chǎng)景與BN相同,態(tài)勢(shì)因素的確定方法也相同。但是DBN的結(jié)構(gòu)需要表達(dá)出時(shí)間相關(guān)性,為了能夠利用數(shù)據(jù)D中的時(shí)間信息,通過(guò)借鑒戰(zhàn)爭(zhēng)領(lǐng)域豐富的模型知識(shí),將BN與卡爾曼濾波圖模型(Kalman Filter Models,KFM)或隱馬爾可夫模型(Hidden Markov Models,HMM)相結(jié)合,沿時(shí)間軸變化來(lái)構(gòu)建DBN。其難點(diǎn)在于如何確定觀測(cè)量Y與隱變量Q的相關(guān)性。
和BN相比,DBN的結(jié)構(gòu)發(fā)生變換,其條件概率分布不可能像BN那樣直接獲得。首先要對(duì)數(shù)據(jù)D進(jìn)行數(shù)據(jù)分析,得到BN的概率分布P,然后再根據(jù)D的時(shí)間序列獲取觀測(cè)量、隱變量相互關(guān)系,構(gòu)建關(guān)系模型并學(xué)習(xí)得到影響參數(shù)r。最后將P與r代入DBN結(jié)構(gòu)中,生成與時(shí)間t相關(guān)的條件概率分布函數(shù)。
利用DBN模型可以很好地表達(dá)隨時(shí)間變化成功率CG的變化情況,可以根據(jù)大量觀測(cè)數(shù)據(jù)推理變量可能取到的最大的值,對(duì)未來(lái)態(tài)勢(shì)進(jìn)行推測(cè)。它不僅具有靜態(tài)BN的優(yōu)勢(shì),如易于理解,建??旖莸龋铱梢蕴幚韯?dòng)態(tài)問(wèn)題,大大擴(kuò)展了使用范圍。
對(duì)DBN進(jìn)行推理,最容易理解的方法是將DBN展開(kāi)成為BN,然后從時(shí)間的起點(diǎn)開(kāi)始逐個(gè)片段地推算。但是在時(shí)間長(zhǎng)片段多的情況下,該網(wǎng)絡(luò)模型將會(huì)非常巨大,推算起來(lái)非常困難。文獻(xiàn)[8]提出了用HMM模型解決DBN推理,然而圖2中天氣因素TQ為連續(xù)型隨機(jī)變量,因此考慮用KFM進(jìn)行推理。
對(duì)于隱變量連續(xù)的KFM,可以應(yīng)用經(jīng)典的LDS濾波或光滑算法進(jìn)行學(xué)習(xí)和推理。對(duì)于所有隨機(jī)變量的條件概率分布(Conditional Probability Distribution,CPD)都服從線性高斯分布的DBN,可以把它轉(zhuǎn)化成KFM,用前向返回算法(Front Back,F(xiàn)B)對(duì)某一節(jié)點(diǎn)進(jìn)行推理。用(xt|t,Vt|t)來(lái)分別定義P(Xt|y1:t)的均值和協(xié)方差,則前向算法可表示為
隨后計(jì)算預(yù)計(jì)的誤差及預(yù)測(cè)協(xié)方差矩陣、增益矩陣:
利用得到的數(shù)據(jù)更新估計(jì)數(shù)值的期望與協(xié)方差矩陣:
在光滑的基礎(chǔ)上,較準(zhǔn)確地估計(jì)出xt后,應(yīng)用預(yù)測(cè)公式:xt+H|t=A(t,t+H)xt|t,可預(yù)測(cè) xt+H的值,A(t,t+H)為t時(shí)刻到t+H時(shí)刻系統(tǒng)的轉(zhuǎn)移矩陣。
為了驗(yàn)證圖2所示DBN模型的正確性與有效性,采用Matlab7.0及貝葉斯網(wǎng)絡(luò)工具BNT進(jìn)行仿真驗(yàn)證。首先應(yīng)用mk_KFM()函數(shù)建立與DBN對(duì)應(yīng)的KFM網(wǎng)絡(luò),采用經(jīng)典的LDS推理方式利用BayesiaLab生成的1000組數(shù)據(jù)進(jìn)行學(xué)習(xí),將各節(jié)點(diǎn)概率分布引入,最后應(yīng)用FB算法對(duì)CG從時(shí)間上進(jìn)行推理,得到20組CG的預(yù)測(cè)概率取值。推理結(jié)果和實(shí)際數(shù)據(jù)的誤差比較見(jiàn)圖3,其中橫坐標(biāo)為預(yù)測(cè)時(shí)間,縱坐標(biāo)為平均相對(duì)誤差。
圖3 不同時(shí)間片斷的預(yù)測(cè)概率誤差Fig.3 Prediction probability errors of different time fragments
由圖3可知,在預(yù)測(cè)的初期誤差較小,而后期誤差逐漸增大,這是因?yàn)樵陬A(yù)測(cè)時(shí)沒(méi)有對(duì)新樣本進(jìn)行更新,得到的結(jié)果必然會(huì)隨時(shí)間推移而出現(xiàn)大的偏移。因此采用KFM算法對(duì)DBN模型的推理預(yù)測(cè)可用于短時(shí)推理,通過(guò)仿真實(shí)驗(yàn),說(shuō)明了采用KFM算法的有效性,在DBN推理研究中具有很好的推廣性。
本文針對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)中大量數(shù)據(jù)隨時(shí)間變化的特點(diǎn),通過(guò)構(gòu)建動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型,解決了變量節(jié)點(diǎn)的表達(dá)問(wèn)題,分析了概率參數(shù)與推理的過(guò)程,并利用卡爾曼濾波模型法對(duì)推理進(jìn)行仿真實(shí)驗(yàn)。仿真實(shí)驗(yàn)結(jié)果表明了所建立模型的有效性。在實(shí)際應(yīng)用中根據(jù)變量的特性以及實(shí)時(shí)性的要求,可采用更快速的Boyen-Koller算法或者HMM算法。對(duì)于戰(zhàn)場(chǎng)因素動(dòng)態(tài)變化的問(wèn)題,在研究軍事問(wèn)題中會(huì)經(jīng)常遇到。動(dòng)態(tài)貝葉斯網(wǎng)給出了建模和解決這類(lèi)問(wèn)題的數(shù)學(xué)方法,可以實(shí)時(shí)動(dòng)態(tài)地處理影響分析和決策的種種因素,對(duì)指揮員的作戰(zhàn)決策具有極大的參考價(jià)值。
[1]冀俊忠,劉椿年.貝葉斯網(wǎng)模型的學(xué)習(xí)、推理和應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2003(5):24-27.
[2]王三民,王寶樹(shù).貝葉斯網(wǎng)絡(luò)在戰(zhàn)術(shù)態(tài)勢(shì)評(píng)估中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2004(11):84-87,143.
[3]張連文,郭海鵬.貝葉斯網(wǎng)引論[M].北京:科學(xué)出版社,2006:34-35.
[4]IVANSSON J.Situation assessment in a stochastic environment using Bayesian network[D].Sweden:Linkoping University,2002.
[5]蘇暢,宋亞兵,王力軍,等.考慮天氣因素的飛機(jī)作戰(zhàn)效能對(duì)數(shù)模型[J].電光與控制,2008,15(1):26-30.
[6]李偉生,王寶樹(shù).用于態(tài)勢(shì)評(píng)估中因果推理的貝葉斯網(wǎng)絡(luò)[J].計(jì)算機(jī)科學(xué),2002(11):50-52.
[7]PEARL J.Probabilistic reasoning in intelligent systems:networks of plausible inference[M].San Francisco:Morgan Kaufmann,1988.
[8]樊紅東,胡昌華,丁力.基于貝葉斯動(dòng)態(tài)模型的某器件性能預(yù)測(cè)[J].電光與控制,2006,13(1):70-72.
[9]肖秦琨,高蒿.動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)推理學(xué)習(xí)理論及應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2007,28-31.
[10]肖秦琨,高曉光.動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的無(wú)人機(jī)炮火校射[J]. 火力與指揮控制,2006,31(11):38-41.
[11]唐吉祥,沈云山.卡爾曼濾波器在炮位偵察雷達(dá)中的應(yīng)用[J].電光與控制,2004,11(1):48-49.