龐策,單甘霖,*,段修生
(1.陸軍工程大學(xué)石家莊校區(qū) 電子與光學(xué)工程系,石家莊050003; 2.石家莊鐵道大學(xué) 機(jī)械工程學(xué)院,石家莊050043)
在目標(biāo)探測過程中,如何尋找一種有效的傳感器管理方法使傳感器網(wǎng)絡(luò)發(fā)揮最大效用,一直是軍事方面研究的熱點(diǎn)和難點(diǎn)問題。目前,主要存在3類基于貝葉斯理論的傳感器管理方法,即:基于任務(wù)的傳感器管理方法[1-3]、基于信息論的傳感器管理方法[4-6]、基于風(fēng)險理論的傳感器管理方法[7-9]。
在以往對傳感器管理問題研究中,并不區(qū)分目標(biāo)種類,而在對目標(biāo)攔截的作戰(zhàn)背景下,探明目標(biāo)類型至關(guān)重要,因?yàn)獒槍Σ煌哪繕?biāo)后應(yīng)對措施也應(yīng)不同,例如當(dāng)目標(biāo)為偵察機(jī)時,即可采取干擾措施也可發(fā)射導(dǎo)彈攔截,甚至在威脅不大的情況下保持一定預(yù)警即可,而當(dāng)目標(biāo)為導(dǎo)彈時,應(yīng)發(fā)射導(dǎo)彈攔截。由此,針對不同目標(biāo)探測情況下的代價函數(shù)[10]不同,傳感器管理模型也應(yīng)有所區(qū)別。此外,在目標(biāo)來襲過程中,敵方會采取電子干擾等措施,探測到的目標(biāo)中通常摻雜著虛假目標(biāo),在傳感器資源十分珍貴有限的情況下,對這些目標(biāo)探測必定造成資源浪費(fèi);此外,在判定來襲目標(biāo)為導(dǎo)彈之后,應(yīng)當(dāng)通過武器系統(tǒng)對目標(biāo)攔截,若對虛假目標(biāo)攔截必定同時造成武器資源浪費(fèi)。
本文主要研究傳感器同時對目標(biāo)識別跟蹤背景下的傳感器管理方法。首先建立風(fēng)險理論、貝葉斯理論和證據(jù)理論的目標(biāo)識別模型;隨后考慮邊跟蹤邊識別的情況,建立跟蹤情況下的目標(biāo)識別模型,并對模型進(jìn)行理論分析,在模型求解過程中提出一種基于多Agent分布計(jì)算理論的分布式算法;最后通過仿真,驗(yàn)證了本文方法、模型和算法的有效性、可行性。
本文將風(fēng)險定義為不確定性事件發(fā)生后帶來的損失與該事件發(fā)生的概率乘積。將來襲目標(biāo)分為兩類,一類是具有攻擊性的真實(shí)導(dǎo)彈目標(biāo)C(1),另一類是虛假目標(biāo)C(2)。當(dāng)判定目標(biāo)為C(1)時,我方將發(fā)射導(dǎo)彈攔截,則存在的風(fēng)險為R(1)=c(1)p(2),其中,c(1)為發(fā)射導(dǎo)彈產(chǎn)生的消耗,p(2)為k時刻目標(biāo)類型為C(2)的概率。當(dāng)判定目標(biāo)為C(2)時,存在的風(fēng)險為R(2)=c(2)p(1),其中,c(2)為敵方導(dǎo)彈擊中我方設(shè)施后帶來的損失,p(1)為k時刻目標(biāo)類型為C(1)的概率。
我方在作決策過程中,遵循風(fēng)險最低原則,將風(fēng)險定義為
對目標(biāo)類型的判斷為C=arg R。
在傳感器si獲得觀測值后,si獲得的關(guān)于k+1時刻目標(biāo)tj類型的后驗(yàn)概率為
式中:K為證據(jù)之間的沖突概率。
目標(biāo)tj的運(yùn)動狀態(tài)狀態(tài)轉(zhuǎn)移矩陣為
式中:T為采樣時間,本文取T=1 s。
在k+1時刻,目標(biāo)tj的狀態(tài)為式中:W 為過程演化噪聲,為均值為0的高斯白噪聲。
協(xié)方差矩陣為式中:σx、σy為噪聲的功率譜密度。
在k時刻傳感器si對目標(biāo)tj的觀測為
狀態(tài)觀測矩陣為
將上述極坐標(biāo)轉(zhuǎn)化為Cartesian坐標(biāo)系坐標(biāo),有
對模型進(jìn)行線性近似,觀測矩陣為
此時,目標(biāo)坐標(biāo)協(xié)方差在Cartesian坐標(biāo)系坐標(biāo)中的協(xié)方差矩陣為
給定k=0時刻目標(biāo)tj的初始狀態(tài)Xj0,及其均值E()=u0,協(xié)方差矩陣P0=E[(-u0)·(-u0)T]。
式中:Hi、Ri分別為傳感器si觀測矩陣、觀測噪聲矩陣。
目標(biāo)識別的過程是在目標(biāo)跟蹤的過程中進(jìn)行的,在目標(biāo)跟蹤過程中,存在目標(biāo)丟失的風(fēng)險,同時考慮目標(biāo)跟蹤與目標(biāo)識別,建立風(fēng)險函數(shù),有
此時,有
圖1 風(fēng)險值分析Fig.1 Analysis of value-at-risk
由圖1可知,當(dāng)目標(biāo)為虛假目標(biāo)時,即p(1)=0,無論目標(biāo)丟失概率為何值,風(fēng)險值均為0;當(dāng)目標(biāo)為導(dǎo)彈時,即p(1)=1,目標(biāo)丟失概率越低,風(fēng)險值越低;目標(biāo)丟失概率越高,風(fēng)險值越高,模型與實(shí)際情況相符。由式(16)和圖1可知,當(dāng)目標(biāo)為真目標(biāo)C(1)的概率較低(p(1)→0)時,風(fēng)險主要來自目標(biāo)識別,一旦將真目標(biāo)判定為假目標(biāo),真目標(biāo)擊毀我方軍事設(shè)施,將會為我方帶來損失;當(dāng)目標(biāo)為真目標(biāo)C(1)的概率較高(p(1)→1)時,風(fēng)險主要來自于目標(biāo)跟蹤,此時將發(fā)射導(dǎo)彈對目標(biāo)實(shí)施攔截,在跟蹤精度較低,目標(biāo)丟失概率較高的情況下,一旦攔截失敗,依然會給我方帶來損失;若 目 標(biāo) 丟 失 概 率 較 高(p(miss)→1),則R(1)>R(2)恒成立,此時,不再發(fā)射導(dǎo)彈,由于目標(biāo)跟蹤精度較低,丟失概率較高,導(dǎo)彈命中率較低,使武器資源浪費(fèi)。
圖2 目標(biāo)丟失概率示意圖Fig.2 Sketch map of target losing probability
用于求解傳感器管理方案的算法主要有集中式算法和分布式算法兩種[13-15],前者計(jì)算時間長、通信壓力大,但求解質(zhì)量高,后者計(jì)算時間短、通信壓力小,但求解質(zhì)量不如前者。由于傳感器管理過程中作戰(zhàn)態(tài)勢變化較快,使用求解速度較快的分布式算法求解傳感器管理方案,同時提高求解質(zhì)量,成為研究的熱點(diǎn)和難點(diǎn)。
本文采用分布計(jì)算的思想,其優(yōu)化思路為將整體效能函數(shù)轉(zhuǎn)化為單目標(biāo)的局部效能函數(shù),將每個傳感器看作一個具有自主計(jì)算功能的Agent,每個目標(biāo)通過分別優(yōu)化自身局部效能,使局部效能最優(yōu)的同時達(dá)到全局最優(yōu)。
基于以上敘述,傳感器管理流程如圖3所示。
圖3 傳感器管理流程圖Fig.3 Flowchart of sensormanagement
傳感器的探測性能和目標(biāo)參數(shù)如表1、表2所示,pf為傳感器的誤警率。我方用于目標(biāo)跟蹤的傳感器為4個,在k=0時刻,同時探測到4個目標(biāo),假定目標(biāo)飛行過程中均在所有傳感器的探測范圍內(nèi),作戰(zhàn)態(tài)勢如圖4所示。
表1 傳感器信息Tab le 1 In form ation of sensors
表2 目標(biāo)信息Tab le 2 In form ation of targets
圖4 作戰(zhàn)態(tài)勢Fig.4 Combat situation
當(dāng)用傳感器s1對目標(biāo)t1跟蹤識別時,取前30 s,其過程如圖5所示。當(dāng)用傳感器s2對目標(biāo)t3跟蹤識別時,取前30 s,其過程如圖6所示。
圖5 傳感器s1 對目標(biāo)t1 的目標(biāo)識別過程Fig.5 Process of target identification of sensor s1 to target t1
圖6 傳感器s2 對目標(biāo)t3 的目標(biāo)識別過程Fig.6 Process of target identification of sensor s2 to target t3
在k=0時刻,生成k=1時刻的傳感器-目標(biāo)分配方案,以便后續(xù)時刻對目標(biāo)進(jìn)行跟蹤。在仿真過程中,將本文提出的分布式算法與貪婪算法、拍賣算法作對比,如圖7所示。
圖7 算法對比Fig.7 Comparison of algorithms
由圖7可知,與貪婪算法相比,本文算法求解質(zhì)量較高;與拍賣算法相比,本文算法求解速度較快,說明本文算法具有良好性能。
比較經(jīng)典的傳感器管理方法為基于協(xié)方差矩陣的傳感器管理方法與基于信息論的傳感器管理方法,本文分別選取基于跟蹤精度控制的傳感器管理方法[16](簡稱跟蹤精度控制)和基于Rényi矩陣的傳感器管理方法[17](簡稱信息增量控制)與本文方法作對比。分別計(jì)算3種傳感器管理方法生成的傳感器管理方案對應(yīng)的風(fēng)險值以及目標(biāo)跟蹤精度,其過程如圖8所示。由圖8(a)可以看出,風(fēng)險值整體呈下降的趨勢,由此可見,隨著對目標(biāo)的跟蹤探測,對目標(biāo)的識別風(fēng)險和跟蹤風(fēng)險降低。在風(fēng)險值方面,傳感器管理方法的優(yōu)劣依次為:本文方法>跟蹤精度控制>信息增量控制。由圖8(b)可以看出,雖然本文方法尚未采取跟蹤精度控制的方法,但其獲得的目標(biāo)跟蹤精度值最低,原因?yàn)樵趉=5時刻后,傳感器不再對虛假目標(biāo)t3、t4跟蹤,節(jié)省出傳感器資源對真目標(biāo)t1、t2跟蹤,由此避免了傳感器資源浪費(fèi)。而采用跟蹤精度控制和信息增量控制的傳感器管理方法,未考慮到跟蹤目標(biāo)的種類,一味追求對包括虛假目標(biāo)在內(nèi)的所有目標(biāo)提高跟蹤精度,由此造成了傳感器資源浪費(fèi)。該分析在圖8(c)~圖8(f)中得到證實(shí)。
圖8 傳感器管理方法對比Fig.8 Comparison of sensor managementmethods
本文研究多傳感器協(xié)同跟蹤多目標(biāo)作戰(zhàn)背景的傳感器管理問題,建立同時考慮目標(biāo)跟蹤和目標(biāo)識別任務(wù)的傳感器管理模型,并針對模型的求解提出基于多Agent分布計(jì)算理論的分布式算法,通過仿真驗(yàn)證了模型和算法的有效性,仿真結(jié)果表明,本文方法不但能夠得到最低的風(fēng)險值,還能及時停止對虛假目標(biāo)跟蹤,從而避免傳感器資源浪費(fèi)。在多目標(biāo)跟蹤情況下,伴隨著已有目標(biāo)的消失與新目標(biāo)的出現(xiàn),若在對目標(biāo)數(shù)目估計(jì)不準(zhǔn)確情況下對傳感器進(jìn)行管理,得到的傳感器管理方案可能欠準(zhǔn)確,下一步將研究此種情況下的傳感器風(fēng)險管理問題。