袁德平 鄭娟毅 史浩山
(1.西北工業(yè)大學(xué) 電子信息學(xué)院, 陜西 西安710129;2.西安郵電大學(xué) 通信與信息工程學(xué)院, 陜西 西安710121)
在現(xiàn)代戰(zhàn)爭(zhēng)中,通過(guò)對(duì)大量的精確或不確定的知識(shí)和信息進(jìn)行推理來(lái)實(shí)現(xiàn)對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的估計(jì),對(duì)做出正確的指揮與決策有著重大的意義.基于貝葉斯網(wǎng)絡(luò)(BN)的推理方法不僅應(yīng)用在推理預(yù)測(cè)中[1],還應(yīng)用于戰(zhàn)場(chǎng)的態(tài)勢(shì)估計(jì)中.當(dāng)前應(yīng)用靜態(tài)BN 進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)估計(jì)的算法[2-3]難以適應(yīng)目標(biāo)信息變化的連貫性和戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)變化;而應(yīng)用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)進(jìn)行態(tài)勢(shì)估計(jì)[4-6]時(shí),雖然能適應(yīng)戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)變化,但DBN 網(wǎng)絡(luò)參數(shù)依靠專家經(jīng)驗(yàn)給出,且在推理過(guò)程中固定不變,不能隨環(huán)境的變化而變化,因此無(wú)法保證推理結(jié)果的合理性與準(zhǔn)確性.基于在線參數(shù)學(xué)習(xí)的DBN 算法能更合理地隨環(huán)境的變化修改網(wǎng)絡(luò)參數(shù),具有更好的態(tài)勢(shì)估計(jì)效果.由于戰(zhàn)場(chǎng)態(tài)勢(shì)更新和態(tài)勢(shì)要素生成受其周期的限制,觀測(cè)樣本在一般情況下具有小樣本的特性.對(duì)于觀測(cè)值具有小樣本的問(wèn)題,采用DBN 進(jìn)行參數(shù)學(xué)習(xí)時(shí),最大似然估計(jì)法會(huì)產(chǎn)生較大的誤差[7],而采用最大期望法(EM)學(xué)習(xí)的實(shí)時(shí)性和精度較差[8].由于小樣本含有的分布信息量少,故采用自助法將樣本的分布視為總體分布時(shí),存在以偏概全的行為較大的誤差[9].參數(shù)的貝葉斯估計(jì)方法利用了樣本的先驗(yàn)信息,從而在進(jìn)行參數(shù)估計(jì)時(shí)能夠得到更精確的預(yù)測(cè)結(jié)果,其中基于狄利克雷共軛先驗(yàn)分布的參數(shù)估計(jì)方法,以其先驗(yàn)分布與后驗(yàn)分布形式一致而使計(jì)算簡(jiǎn)單.為快速實(shí)現(xiàn)對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的精確估計(jì),文中提出了一種帶先驗(yàn)約束DBN(PS-DBN)在線學(xué)習(xí)的態(tài)勢(shì)估計(jì)方法.即在DBN 結(jié)構(gòu)模型確定的情況下,先用前向遞歸方法獲得DBN 的時(shí)間片間的隱變量狀態(tài)轉(zhuǎn)移概率和時(shí)間片內(nèi)的隱變量與觀測(cè)變量間的轉(zhuǎn)移概率,然后用狄利克雷先驗(yàn)分布作為這些概率的先驗(yàn)分布,用矩估計(jì)法對(duì)先驗(yàn)分布的超參數(shù)進(jìn)行估計(jì),最后用該先驗(yàn)分布采樣形成的等價(jià)樣本與觀測(cè)值對(duì)DBN 的參數(shù)進(jìn)行學(xué)習(xí).
文中針對(duì)態(tài)勢(shì)要素的不確定性,采用DBN 對(duì)態(tài)勢(shì)要素進(jìn)行推理,對(duì)目標(biāo)態(tài)勢(shì)作出估計(jì).
在軍事上,態(tài)勢(shì)估計(jì)包括態(tài)勢(shì)覺(jué)察、態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè)3 個(gè)階段.態(tài)勢(shì)覺(jué)察主要實(shí)現(xiàn)態(tài)勢(shì)元素的提取和目標(biāo)編群;對(duì)態(tài)勢(shì)覺(jué)察的結(jié)果進(jìn)行推理,可獲得高層次態(tài)勢(shì)估計(jì)(態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè))[10].
態(tài)勢(shì)估計(jì)的結(jié)構(gòu)原理如圖1所示,通過(guò)多傳感器對(duì)目標(biāo)進(jìn)行跟蹤和識(shí)別后,獲得目標(biāo)的各種屬性.從目標(biāo)的多種屬性中提取態(tài)勢(shì)要素,通過(guò)對(duì)態(tài)勢(shì)要素的推理估計(jì)出目標(biāo)當(dāng)前的態(tài)勢(shì)[11].兩次態(tài)勢(shì)要素生成的時(shí)間間隔稱為態(tài)勢(shì)要素生成周期Tsu;經(jīng)過(guò)一定次數(shù)的Tsu而形成的態(tài)勢(shì)要素集,通過(guò)推理方法實(shí)現(xiàn)一次態(tài)勢(shì)結(jié)果的更新時(shí)間稱為態(tài)勢(shì)更新周期Ts.戰(zhàn)場(chǎng)態(tài)勢(shì)的更新周期是基于作戰(zhàn)節(jié)奏并隨作戰(zhàn)意圖、作戰(zhàn)效果的顯著變化而確定的平均更新周期,以美軍為例,美軍陸、海、空軍戰(zhàn)役級(jí)態(tài)勢(shì)更新周期分別為5min、1min 和20s,戰(zhàn)術(shù)級(jí)態(tài)勢(shì)的更新周期更短,要求更快地實(shí)現(xiàn)態(tài)勢(shì)估計(jì).
圖1 態(tài)勢(shì)估計(jì)的結(jié)構(gòu)Fig.1 Structure of situation assessment
現(xiàn)代戰(zhàn)場(chǎng)敵我態(tài)勢(shì)瞬息萬(wàn)變,將DBN 模型應(yīng)用于態(tài)勢(shì)估計(jì),不但滿足態(tài)勢(shì)要素的不確定性,還能滿足對(duì)當(dāng)前態(tài)勢(shì)的動(dòng)態(tài)分析和預(yù)測(cè),比靜態(tài)BN 更具合理性[12].
DBN 是一個(gè)有向無(wú)環(huán)結(jié)構(gòu)的拓?fù)鋱D,是依據(jù)觀測(cè)數(shù)據(jù)Y={y1,y2,…,ym}推導(dǎo)出隱變量X={x1,x2,…,xn}最大可能取值的概率.一個(gè)簡(jiǎn)單的單隱變量的DBN 圖如圖2所示,其中Y 表示離散變量,具有m種可能的值[13],X={x}表示單隱變量,設(shè)x 存在n種狀態(tài).在估計(jì)戰(zhàn)場(chǎng)環(huán)境態(tài)勢(shì)時(shí),DBN 中的隱變量的狀態(tài)節(jié)點(diǎn)對(duì)應(yīng)于態(tài)勢(shì)節(jié)點(diǎn),觀測(cè)數(shù)據(jù)節(jié)點(diǎn)對(duì)應(yīng)于態(tài)勢(shì)要素節(jié)點(diǎn),也就是根據(jù)態(tài)勢(shì)要素節(jié)點(diǎn)的觀測(cè)值推導(dǎo)出態(tài)勢(shì)節(jié)點(diǎn)的狀態(tài),以解釋?xiě)B(tài)勢(shì)發(fā)展的趨勢(shì).
圖2 單隱變量的DBN 模型Fig.2 DBN model of single hidden variable
為確定態(tài)勢(shì)節(jié)點(diǎn)的狀態(tài),定義DBN 的參數(shù)如下.
初始隱變量先驗(yàn)分布矩陣為π,初始狀態(tài)是依專家經(jīng)驗(yàn)給出,其中π=(πi)1×n,πi=P(xi=i),i=1,2,…,n.
隱變量間狀態(tài)轉(zhuǎn)移矩陣A=(aij)n×n,其 中aij=
隱變量與觀測(cè)變量間的狀態(tài)轉(zhuǎn)移矩陣B=(bi)1×n,其中;k表示觀測(cè)變量在t 時(shí)刻的狀態(tài).
在動(dòng)態(tài)變化時(shí),隨著觀測(cè)狀態(tài)變量的隨機(jī)變化,對(duì)DBN 的推理可以采用前向遞歸方法進(jìn)行[14].
根據(jù)初始條件,計(jì)算初始時(shí)刻的后驗(yàn)概率ψ1:
式中:i,j=1,2,…,n.再計(jì)算t-1 時(shí)刻到t 時(shí)刻隱變量之間的轉(zhuǎn)移概率:
戰(zhàn)場(chǎng)環(huán)境下,一個(gè)態(tài)勢(shì)更新周期內(nèi)生成的態(tài)勢(shì)要素在進(jìn)行參數(shù)估計(jì)時(shí)具有小樣本的特點(diǎn).尤其對(duì)空戰(zhàn)術(shù)級(jí)作戰(zhàn)態(tài)勢(shì)估計(jì),要求態(tài)勢(shì)更新周期為數(shù)秒.假設(shè)跟蹤雷達(dá)精確跟蹤級(jí)的數(shù)據(jù)率是亞秒級(jí),且一次態(tài)勢(shì)要素生成所耗時(shí)間在雷達(dá)對(duì)目標(biāo)兩次精確跟蹤時(shí)間內(nèi)可實(shí)現(xiàn),那么一個(gè)態(tài)勢(shì)更新周期內(nèi)態(tài)勢(shì)要素的生成最多只有幾十批,依靠這些樣本數(shù)據(jù)對(duì)DBN 的參數(shù)進(jìn)行估計(jì),屬于小樣本參數(shù)估計(jì).由于小樣本在基于統(tǒng)計(jì)方法的參數(shù)估計(jì)中存在較大的誤差,故文中提出的帶先驗(yàn)約束DBN 推理方法(PS-DBN)是在狄利克雷先驗(yàn)分布對(duì)DBN 參數(shù)進(jìn)行估計(jì)下,采用前向遞歸法對(duì)DBN 進(jìn)行推理.
設(shè)多分布向量X=(x1,x2,…,xn),X 分布是狄利克雷分布,那么
其中Γ(·)為Gamma 函數(shù),α=(α1,α2,…,αn)為狄利克雷分布的超參數(shù)[15].
狄利克雷分布的一階矩E(xi)和二階矩E(xixj)有如下性質(zhì):
根據(jù)式(6)和(7)可以推導(dǎo)出超參數(shù)與向量X 的均值E(xi)與二階矩E(xixj)的關(guān)系為
分別根據(jù)式(6)、(7)計(jì)算概率向量ai=(ai1,ai2,…,ain)的均值E(aij)、二階混合矩E(aipaiq)與超參數(shù)的關(guān)系,得出與式(8)形式一致的超參數(shù)與向量均值、二階矩的關(guān)系:
其中p,q∈{1,2,…,n},p≠q.
DBN 網(wǎng)絡(luò)初始參數(shù)0={A0,B0},初始先驗(yàn)條件為π0,后驗(yàn)概率為φ,先驗(yàn)概率為a(k),隱變量之間的轉(zhuǎn)移概率為ξij.每個(gè)態(tài)勢(shì)更新周期包含r 個(gè)態(tài)勢(shì)要素生成周期,r 根據(jù)實(shí)際需要確定.參數(shù)B 更新需要的Ts的次數(shù)H 根據(jù)需要確定.態(tài)勢(shì)要素D={y1,y2,…,ym}.
在數(shù)據(jù)完備情況下參數(shù)估計(jì)的過(guò)程如下:當(dāng)一個(gè)Ts到來(lái),即r 個(gè)Tsu到來(lái)時(shí),通過(guò)前向遞歸算法可以獲得r-1 個(gè)隱狀態(tài)j 到隱狀態(tài)i 之間的轉(zhuǎn)移概率ξij.對(duì)于每一種轉(zhuǎn)移概率,采用狄利克雷分布模型定義先驗(yàn)分布,采用矩估計(jì)法計(jì)算先驗(yàn)分布的超參數(shù)以確定先驗(yàn)分布,并對(duì)該分布進(jìn)行采樣形成等價(jià)樣本,通過(guò)遞歸計(jì)算樣本ξMij(Μ=1,2,…,r)與等價(jià)樣本ξisj(s=1,2,…,r)的均值,對(duì)當(dāng)前時(shí)刻的參數(shù)A 進(jìn)行更新:
經(jīng)過(guò)H 個(gè)Ts后,對(duì)生成的H 組(k)進(jìn)行狄利克雷分布參數(shù)估計(jì),估計(jì)出參數(shù)后進(jìn)行采樣形成等價(jià)樣本,以該等價(jià)樣本與H 組(k)的均值對(duì)參數(shù)B 進(jìn)行更新.
參數(shù)估計(jì)及推理的算法步驟如下:
2)在Ts1u到來(lái)后,根據(jù)態(tài)勢(shì)要素D1={y11,y21,…,ym1}及、π0計(jì)算出第1 時(shí)刻隱變量的后驗(yàn)概率φ1,并根據(jù)φ1和 0 計(jì)算出下一時(shí)刻隱變量的先驗(yàn)概率a2(k).
3)Ts2u到來(lái)后,根據(jù)態(tài)勢(shì)要素D2={y12,y22,…,ym2}、計(jì)算出φ2,并根據(jù)φ2和 0 計(jì)算出Ts3u時(shí)刻隱變量的先驗(yàn)概率a3(k),計(jì)算Ts1u到Ts2u時(shí)隱變量之間的轉(zhuǎn)移概率.
4)依此類推,直到Tsru時(shí)計(jì)算出φr、ar+1(k)和.
5)T1s結(jié)束,用ξikj(k=1,2,…,r-1)對(duì)參數(shù)A0進(jìn)行狄利克雷法采樣,并更新形成,將作為T(mén)2s的隱變量間的轉(zhuǎn)移矩陣,即計(jì)算bj1(k).
7)根據(jù)H 個(gè)Ts生成的bjl(k)(l=1,2,…,m)對(duì)參數(shù)B0進(jìn)行狄利克雷法采樣,并更新形成,將作為從Tm+1s開(kāi)始的隱變量與觀測(cè)變量間的轉(zhuǎn)移矩陣,即B1=
8)依此類推,參數(shù)A 在每個(gè)Ts內(nèi)更新一次,參數(shù)B 在H 個(gè)Ts內(nèi)更新一次.
完整的P-DBN 算法的偽代碼如下:
想定一空戰(zhàn)場(chǎng)景:我方實(shí)時(shí)監(jiān)視敵方飛機(jī)狀態(tài),并對(duì)敵方飛機(jī)意圖進(jìn)行推斷.假設(shè)敵方飛機(jī)的ZU作戰(zhàn)企圖有攻擊(AT)、偵查(SU)和相持(ST)3 種狀態(tài).為快速準(zhǔn)確地推斷敵方意圖,我方根據(jù)各種傳感器收到該目標(biāo)的有關(guān)狀態(tài)屬性以形成態(tài)勢(shì)要素,實(shí)現(xiàn)對(duì)敵機(jī)的戰(zhàn)術(shù)態(tài)勢(shì)估計(jì).將推斷出的態(tài)勢(shì)狀態(tài)設(shè)置為態(tài)勢(shì)節(jié)點(diǎn),觀測(cè)到的事件設(shè)置為事件節(jié)點(diǎn),構(gòu)建如圖3所示的DBN 模型.
圖3 空中目標(biāo)作戰(zhàn)企圖的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型Fig.3 Dynamic Bayesian network model for the intention of aerial target
事件節(jié)點(diǎn)的敵、我屬性分別對(duì)應(yīng)敵我識(shí)別(IF)的1、2 狀態(tài);敵方機(jī)載雷達(dá)的開(kāi)、關(guān)分別對(duì)應(yīng)雷達(dá)(RA)的1、2 狀態(tài);敵方飛機(jī)距離的長(zhǎng)、中、短分別對(duì)應(yīng)距離(DI)的1、2、3 狀態(tài);敵方飛機(jī)的高、中、低方位威脅等級(jí)分別對(duì)應(yīng)方位(AZ)的1、2、3 狀態(tài);敵方飛機(jī)速度的高、中、低速分別對(duì)應(yīng)速度(SP)的1、2、3狀態(tài).
為評(píng)估文中算法對(duì)參數(shù)學(xué)習(xí)的實(shí)時(shí)性和精度,構(gòu)造一組標(biāo)準(zhǔn)參數(shù),包括隱變量之間、隱變量與條件變量之間的條件轉(zhuǎn)移概率,并以此網(wǎng)絡(luò)參數(shù)模型采樣得到的觀測(cè)值作為參數(shù)學(xué)習(xí)的輸入態(tài)勢(shì)要素.通過(guò)統(tǒng)計(jì)幾個(gè)態(tài)勢(shì)周期內(nèi)態(tài)勢(shì)估計(jì)的平均耗時(shí)與最大耗時(shí)來(lái)比較文中算法與EM 算法在該標(biāo)準(zhǔn)模型下參數(shù)學(xué)習(xí)的實(shí)時(shí)性.通過(guò)兩個(gè)態(tài)勢(shì)周期的參數(shù)學(xué)習(xí)給出網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)結(jié)果,并給出態(tài)勢(shì)周期為2、6、8、16 時(shí)的學(xué)習(xí)精度,用來(lái)表示網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)精度.標(biāo)準(zhǔn)參數(shù)值如表1、2 所示.
表1 標(biāo)準(zhǔn)的參數(shù)值Table1 Standard values of parameter
表1 標(biāo)準(zhǔn)的參數(shù)值Table1 Standard values of parameter
xt-1)xt=AT xt=SU xt=ST AT 0.6 0.2 0.2 SU 0.1 0.7 0.2 ST 0.1 0.1 0.8 xt-1 P(xt
設(shè)態(tài)勢(shì)更新周期Ts=20s,雷達(dá)對(duì)目標(biāo)跟蹤后到形成態(tài)勢(shì)要素需要2 s,也就是態(tài)勢(shì)要素更新周期Tsu=2s,在Pentium 雙核處理器、主頻2.1 GHz、2 GB內(nèi)存的計(jì)算機(jī)上用Matlab R2009b 軟件對(duì)文中算法的有效性和準(zhǔn)確性進(jìn)行仿真.主要參數(shù)設(shè)置如下:隱變量的初始先驗(yàn)概率P(AT)=P(SU)=P(ST)=1/3,初始隱變量間的轉(zhuǎn)移概率如表3所示.
表2 標(biāo)準(zhǔn)的參數(shù)值Table2 Standard values of parameter
表2 標(biāo)準(zhǔn)的參數(shù)值Table2 Standard values of parameter
P(yt xt)yt 狀態(tài)值IF 1 2 RA 1 2 xt=AT xt=SU xt=ST 0.5 0.2 0.6 0.3 0.4 0.3 0.2 0.4 0.1 0.5 0.2 0.3 DI 12 3 0.5 0.4 0.1 0.1 0.4 12 2 3 0.2 0.3 0.5 0.8 0.3 0.3 0.4 0.1 AZ 0.4 0.2 3 1 0.4 0.8 0.3 0.1 0.3 0.1 SP 0.6 0.2 0.3 0.5 0.1 0.3
表3 初始隱變量間的轉(zhuǎn)移概率Table3 Initial transition probabilities between hidden variables
初始隱變量與觀測(cè)變量間的轉(zhuǎn)移概率如表4所示.xt表示態(tài)勢(shì)的狀態(tài),yt表示態(tài)勢(shì)要素的不同狀態(tài).
通過(guò)文獻(xiàn)[12]提供的網(wǎng)址下載EM 算對(duì)DBN進(jìn)行推理.EM 和PS-DBN 算法采用的初始條件與觀測(cè)數(shù)據(jù)一致,PS-DBN 算法中參數(shù)r 取10,H 取8,EM 算法的迭代次數(shù)為10.對(duì)每個(gè)態(tài)勢(shì)要素生成周期實(shí)現(xiàn)估計(jì)的平均耗時(shí)與最大耗時(shí)進(jìn)行記錄,結(jié)果如表5所示.EM 算法的計(jì)算復(fù)雜度為O(nkI),而PS-DBN 算法核心部分的計(jì)算復(fù)雜度為O(K2L),其中n 是觀測(cè)值,I 是迭代次數(shù),K 是態(tài)勢(shì)狀態(tài)數(shù),L是態(tài)勢(shì)要素序列長(zhǎng)度.在態(tài)勢(shì)狀態(tài)數(shù)為3、態(tài)勢(shì)要素序列長(zhǎng)度為5 的情況下,PS-DBN 算法的估計(jì)速度明顯高于EM 算法.從表5可以看出,經(jīng)過(guò)一個(gè)態(tài)勢(shì)周期的態(tài)勢(shì)推理,PS-DBN 算法參數(shù)學(xué)習(xí)的實(shí)時(shí)性明顯高于EM 算法.
表4 初始隱變量與觀測(cè)變量間的轉(zhuǎn)移概率Table4 Initial transition probabilities between hidden variables and observed variables
表5 EM 與PS-DBN 算法的耗時(shí)比較Table5 Comparison of time consuming between EM algorithm and PS-DBN algorithm s
對(duì)PS-DBN 和EM 算法進(jìn)行兩個(gè)態(tài)勢(shì)周期的參數(shù)學(xué)習(xí)(即Ts=2),結(jié)果如表6、7 所示.
表6 參數(shù)的學(xué)習(xí)結(jié)果Table6 Learning results of parameter
表6 參數(shù)的學(xué)習(xí)結(jié)果Table6 Learning results of parameter
P(xt算法 xt-1 EM AT SU xt-1)xt=AT xt=SU xt=ST 0.71 0.13 0.16 0.16 0.61 0.23 ST AT 0.15 0.58 0.16 0.24 0.69 0.18 PS-DBN SU ST 0.11 0.13 0.66 0.09 0.23 0.78
從表6、7 可以看出,在參數(shù)學(xué)習(xí)時(shí)PS-DBN 算法的精度高于EM 算法.為直觀看出PS-DBN 和EM算法的參數(shù)學(xué)習(xí)精度,采用KL(Kullback-Leibler)距離表示算法學(xué)習(xí)的參數(shù)與標(biāo)準(zhǔn)參數(shù)的相似度:
其中f1(x)和f2(x)為兩個(gè)概率分布.dKL(f1/f2)≥0,其值越小表示兩個(gè)分布越接近.
表7 參數(shù)的學(xué)習(xí)結(jié)果Table7 Learning results of parameter
表7 參數(shù)的學(xué)習(xí)結(jié)果Table7 Learning results of parameter
P(yt xt)EM 算 法 PS-DBN 算 法xt=AT xt=SU xt=ST xt=AT xt=SU xt=ST IF 1 0.55 0.41 0.04 0.54 0.38 0.08 2 0.19 0.39 0.42 0.17 0.34 0.49 RA 1 0.65 0.16 0.19 0.62 0.17 0.21 2 0.27 0.37 0.36 0.33 0.38 0.29 yt狀態(tài)值DI 1 0.25 0.37 0.38 0.22 0.33 0.45 2 0.34 0.31 0.35 0.33 0.28 0.39 3 0.52 0.43 0.05 0.48 0.38 0.14 AZ 1 0.75 0.13 0.12 0.83 0.08 0.09 2 0.46 0.44 0.10 0.43 0.38 0.19 3 0.37 0.27 0.36 0.42 0.27 0.31 SP 1 0.75 0.12 0.13 0.83 0.08 0.09 2 0.68 0.21 0.11 0.64 0.28 0.08 3 0.25 0.55 0.20 0.21 0.52 0.27
表8給出了Ts取不同值時(shí)兩種算法的參數(shù)學(xué)習(xí)精度.從表中可以看出,在Ts=2s 時(shí),PS-DBN 算法的參數(shù)A 和B 的學(xué)習(xí)精度高于EM 算法.隨著態(tài)勢(shì)周期的增加,參數(shù)B 的學(xué)習(xí)精度更高,且在態(tài)勢(shì)周期為8 和16s 時(shí),由于PS-DBN 算法的參數(shù)B 的更新加入了先驗(yàn)信息,使得參數(shù)B 的學(xué)習(xí)精度明顯提高,這說(shuō)明在小樣本下,PS-DBN 算法具有較高的參數(shù)學(xué)習(xí)精度.
表8 兩種算法的參數(shù)學(xué)習(xí)精度比較Table8 Comparison of parameter learning precision between two algorithms
針對(duì)戰(zhàn)場(chǎng)環(huán)境目標(biāo)態(tài)勢(shì)估計(jì)中,一個(gè)態(tài)勢(shì)更新周期內(nèi)生成的態(tài)勢(shì)要素在進(jìn)行參數(shù)估計(jì)時(shí)具有小樣本的特點(diǎn),文中在前向遞歸算法的基礎(chǔ)上,采用狄利克雷先驗(yàn)分布對(duì)DBN 參數(shù)進(jìn)行估計(jì),將先驗(yàn)信息融入到小樣本數(shù)據(jù)的參數(shù)估計(jì)中,從而保證了小樣本下對(duì)戰(zhàn)場(chǎng)環(huán)境目標(biāo)態(tài)勢(shì)估計(jì)的精確性和有效性.仿真實(shí)驗(yàn)結(jié)果顯示:文中算法能夠快速估計(jì)出態(tài)勢(shì)節(jié)點(diǎn)的狀態(tài)概率,可以滿足目標(biāo)跟蹤中精跟級(jí)態(tài)勢(shì)估計(jì)的參數(shù)在線學(xué)習(xí)和態(tài)勢(shì)的在線推理;文中算法學(xué)習(xí)到的參數(shù)更加接近真實(shí)網(wǎng)絡(luò)的實(shí)際參數(shù).
[1]宗芳,張慧永,賈洪飛.基于貝葉斯網(wǎng)絡(luò)的停車(chē)收費(fèi)政策評(píng)價(jià)[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2010,39(7):78-83.Zong Fang,Zhang Hui-yong,Jia Hong-fei.Evaluation of parking pricing policy based on Bayesian network [J].Journal of South China University of Technology:Natural Science Edition,2010,39(7):78-83.
[2]王三民,王寶樹(shù).貝葉斯網(wǎng)絡(luò)在戰(zhàn)術(shù)態(tài)勢(shì)評(píng)估中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2004,26(11):1620-1623.Wang San-min,Wang Bao-shu.Application of Bayesian networks in tactical situation assessment [J].Systems Engineering and Electronics,2004,26(11):1620-1623.
[3]王曉帆,王寶樹(shù).基于貝葉斯網(wǎng)絡(luò)和直覺(jué)模糊推理的態(tài)勢(shì)估計(jì)方法[J].系統(tǒng)工程與電子技,2009,31(11):2742-2745.Wang Xiao-fan,Wang Bao-shu.Situation assessment method based on Bayesian network and intuitionistic fuzzy reasoning [J].Systems Engineering and Electronics,2009,31(11):2742-2745.
[4]史建國(guó),高曉光,李相民.基于離散模糊動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的空戰(zhàn)態(tài)勢(shì)評(píng)估及仿真[J].系統(tǒng)仿真學(xué)報(bào),2006,18(5):1093-1096.Shi Jian-guo,Gao Xiao-guang,Li Xiang-min.Modeling air combat situation assessment by using fuzzy dynamic Bayesian network[J].Journal of System Simulation,2006,18(5):1093-1096.
[5]Li Fu,Liu Jianbo,Chang Feihu,et al.Situation assessment for beyond-visual-range air combat situation assessment based on dynamic Bayesian network [C]//Proceedings of the 25th Chinese Control and Decision Conference.Guiyang:IEEE,2013:591-594.
[6]Zou M,Conzen S D.A new dynamic Bayesian network approach for identifying gene regulatory networks from time course microarray data [J].Bioinformatics,2005,21(1):71-79.
[7]Meng D,Sivakumar K,Kargupta H.Privacy-sensitive Bayesian network parameter learning [C]//Proceedings of the Fourth IEEE International Conference on Data Ming.Brighton:IEEE,2004:487-490.
[8]Lamine F B,Kalti K,Mahjoub M A.The threshold EM algorithm for parameter learning in Bayesian network with incomplete data[J].International Journal of Advanced Computer Science and Applications,2011,2(7):86-91.
[9]Friedman N,Goldszmidt M,Wyner A.Data analysis with Bayesian networks:a bootstrap approach [C]//Proceedings of the 15th Conference on Uncertainty in Artificial Intelligence.Stockholm:Morgan Kaufmann,1999:196-205.
[10]唐政,高曉光.基于離散動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的輻射源目標(biāo)識(shí)別研究[J].系統(tǒng)仿真學(xué)報(bào),2009,21(1):117-120.Tang Zheng,Gao Xiao-guang.Research on radiant point identification based on discrete dynamic Bayesian network [J].Journal of System Simulation,2009,21(1):117-120.
[11]Steinberg A.A model for situation and threat assessment[C]//Information Fusion for Command Support.Neuilly-sur-Seine:RTO,2006:KN1-1-KN1-4.
[12]Powell Gerald M.Tactical situation assessment challenges and implications for computational support [C]//Proceedings of the 8th International Conference on Information Fusion.Piscataway:IEEE,2005:xxiv-xxvi.
[13]任佳,高曉光,茹偉.目標(biāo)數(shù)據(jù)缺失下離散動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí) [J].系統(tǒng)工程與電子技術(shù),2011,33(8):1885-1890.Ren Jia,Gao Xiao-guang,Ru Wei.Parameter learning of discrete dynamic Bayesian network with missing target data [J].Systems Engineering and Electronics,2011,33(8):1885-1890.
[14]Tomovic A,Oakeley E J.Quality estimation of multiple sequence alignments by Bayesian hypothesis testing [J].Bioinformatics,2007,22(18):2488-2490.
[15]Murphy K P.Dynamic Bayesian networks:representation,inference and learning [D].Berkeley:Computer Science Division,UC Berkeley,2002.