李志匯,劉昌云,于 潔
(空軍工程大學(xué) 防空反導(dǎo)學(xué)院,陜西 西安710051)
在彈道導(dǎo)彈防御系統(tǒng)中,傳感器在不同的時刻獲得的量測主要由以下因素決定:1)傳感器部署的位置;2)傳感器的觀測性能;3)當(dāng)前目標(biāo)的狀態(tài);4)戰(zhàn)場環(huán)境。如何充分利用這些傳感器獲取的數(shù)據(jù)對彈道目標(biāo)進行無縫交接和連續(xù)跟蹤面臨著許多挑戰(zhàn),迫切需要多傳感器之間相互協(xié)同。協(xié)同跟蹤屬于傳感器管理的范疇,其研究方法主要有協(xié)方差控制的方法及其改進方法[1,2]、基于信息論的方法[3~7]、后驗克拉美羅界的方法[8]和基于多貝努力濾波的方法[9]等。
根據(jù)彈道導(dǎo)彈防御系統(tǒng)中對彈道目標(biāo)跟蹤的要求、以及彈道目標(biāo)的特點,把信息增量的方法引入到多傳感器彈道目標(biāo)的協(xié)同跟蹤問題中。采用無跡卡爾曼濾波(unscented Kalman filtering,UKF)計算不同時刻各傳感器對彈道目標(biāo)的信息增量,選擇信息增量最大的傳感器對彈道目標(biāo)進行跟蹤。仿真表明:所提的方法能夠及時動態(tài)地選擇能提供給目標(biāo)最多信息的傳感器對彈道目標(biāo)進行跟蹤,并能選擇合理的傳感器交接班時機。
反導(dǎo)傳感器網(wǎng)絡(luò)對彈道目標(biāo)協(xié)同跟蹤的示意圖如圖1所示,多傳感器彈對道目標(biāo)的跟蹤與對其他目標(biāo)跟蹤的不同之處在于:彈道目標(biāo)軌跡跨度范圍大,會不斷脫離一個傳感器的視野而進入另一個傳感器的視野,需要多個傳感器之間進行協(xié)同跟蹤;彈道目標(biāo)速度快,需要提前規(guī)劃傳感器部署方案。在局部戰(zhàn)場態(tài)勢下,從傳感器資源優(yōu)化的角度,當(dāng)多個傳感器可以同時對彈道目標(biāo)進行跟蹤時,選擇其中一個對其進行跟蹤,既能提高傳感器網(wǎng)的整體跟蹤性能和資源效能,也能提高傳感器的生存時間和反偵察的能力。
圖1 多傳感器對彈道目標(biāo)協(xié)同跟蹤示意圖Fig 1 Diagrams of multi-sensor collaboration tracking on ballistic target
根據(jù)文獻(xiàn)[10]提出的分段勻加速模型,建立自由段彈道目標(biāo)分段勻加速跟蹤模型,如圖2 所示。
圖2 自由段彈道目標(biāo)運動模型假設(shè)示意圖Fig 2 Kinematic model of ballistic target in free flight
在這種假設(shè)下,得到彈道目標(biāo)的分段勻加速模型離散形式
雷達(dá)的量測方程為
其中,Z(k+1)=[r(k+1),θ(k+1),φ(k+1)]',)為目標(biāo)與雷達(dá)的距離,和φ(k+1)=分別為目標(biāo)的方位角和俯仰角,VPV(k+1)為協(xié)方差矩陣為R(k+1)的高斯量測噪聲。
采用不敏卡爾曼濾波進行跟蹤,一方面是因為上述模型的雷達(dá)量測方程是非線性的,UKF 采用對概率密度函數(shù)的近似代替了擴展卡爾曼濾波(extended Kalman filtering,EKF)中對非線性函數(shù)的近似,具有更高的跟蹤精度;另一方面,彈道目標(biāo)的跟蹤實時性要求很高,相對于粒子濾波(particle filtering,PF),UKF 的濾波速度更快。
Shannon 第一次提出采用信息熵作為信息的測量。在連續(xù)情形下,隨機變量X 的信息熵為[4]
信息熵反映了隨機變量X 的隨機性,不能反映信息量的變化;信息熵的變化才能反映信息量變化的多少。針對跟蹤問題,采用信息論中先驗信息熵與后驗信息熵之間的差定義為信息增量,假設(shè)I(X)表示先驗信息熵,I(X|z)表示后驗信息熵,則
那么,由傳感器的量測z 帶來的信息增量為
在目標(biāo)跟蹤過程中[11],協(xié)方差陣P 表示目標(biāo)狀態(tài)的不確定性,因此,信息增量可以利用觀測前后協(xié)方差矩陣的變化來計算。
針對隨機變量X,假設(shè)其概率密度函數(shù)p(x)服從標(biāo)準(zhǔn)正態(tài)分布,根據(jù)香農(nóng)信息論,其信息熵為
傳感器對目標(biāo)觀測前,其預(yù)測協(xié)方差陣為P(k+1|k),先驗信息熵為
傳感器對目標(biāo)觀測后,其狀態(tài)估計協(xié)方差陣為P(k+1|k+1),后驗信息熵為
觀測前后信息熵的差即信息增量為
式中 ‖P‖為協(xié)方差陣的范數(shù),對式(9)進行化簡[6],得到
假設(shè)條件:k 表示時間,N 為傳感器的只數(shù),L 為協(xié)同跟蹤時間,i 表示第i 只傳感器。
初始化:k=0,i=1,初始化N 只傳感器的濾波初值。
1)第i 只傳感器采用UKF 跟蹤目標(biāo),并利用式(10)計算第i 只傳感器k 時刻的信息增量ΔIi,i=i+1,執(zhí)行步驟(2)。
2)如果i <N,執(zhí)行步驟(1);否則,執(zhí)行步驟(3)。
3)比較ΔII~ΔIN的大小,選出其中的最大值ΔImax和最大值對應(yīng)的傳感器標(biāo)號imax,第imax只傳感器采用UKF 算法對目標(biāo)進行跟蹤,執(zhí)行步驟(4)。
4)將第imax只傳感器跟蹤獲得的有關(guān)目標(biāo)的信息送到網(wǎng)絡(luò)中心,并置i=1,k=k+1,如果k <L,執(zhí)行步驟(1);否則,執(zhí)行步驟(5)。
5)協(xié)同跟蹤任務(wù)結(jié)束,輸出最優(yōu)傳感器分配結(jié)果。
如圖3 所示,假設(shè)仿真環(huán)境為多只傳感器對一個自由段飛行的彈道目標(biāo)進行跟蹤,傳感器網(wǎng)絡(luò)采用3 部雷達(dá){s1,s2,s3}進行仿真分析,假設(shè)雷達(dá)部署位置與目標(biāo)的運動軌跡位于X-Z 平面內(nèi)。三部雷達(dá)性能參數(shù)相同,距離和角度量測噪聲標(biāo)準(zhǔn)差分別為100 m 和0.02°,采樣間隔為T=0.5 s,部署坐標(biāo)分別為(0,0)km,(87.45,0)km 和(176,0)km。目標(biāo)由雷達(dá)s1飛向雷達(dá)s3,其初始狀態(tài)為x0=1 km,z0=72.24 km,v0=1.589 km/s,目標(biāo)的初始速度方向與X 軸正向夾角為φ0=12.8°,仿真時間為235 s。
圖3 目標(biāo)的運動軌跡和雷達(dá)部署位置Fig 3 Motion trajectory of target and deployment location of radars
評價指標(biāo):采用目標(biāo)估計位置(^x,^z)到實際位置(xr,zr)的距離誤差均值作為跟蹤性能的評估指標(biāo),即
其中,M 表示Monto-Calo 次數(shù)。
通過單次仿真,得到雷達(dá)1 采用UKF 跟蹤,三部雷達(dá)采用EKF 和信息增量法相結(jié)合的協(xié)同跟蹤(EKF-ΔI)以及本文的方法(UKF-ΔI)的跟蹤濾波距離誤差均值對比,如圖4所示。圖5 為三部雷達(dá)采用UKF 獲得的歸一化信息增量對比。表1 為100 次蒙特卡羅實驗的距離誤差均值。
從圖4、圖5 和表1 可以看出:本文的彈道目標(biāo)協(xié)同跟蹤誤差最小。首先,在非線性條件下,EKF 對非線性函數(shù)進行近似,造成了較大的線性化誤差,固其濾波效果較差;其次,單部雷達(dá)雖然也用UKF 跟蹤,但57 s 后,其歸一化信息增量不是最大的,不能提供更多有關(guān)目標(biāo)的信息,故本文方法選擇信息增量最大的傳感器對目標(biāo)進行跟蹤,提供了更多的信息,跟蹤效果最好。
圖4 距離誤差均值對比Fig 4 Contract of distance error mean value
圖5 歸一化信息增量對比Fig 5 Contract of normalized information gain
表1 目標(biāo)跟蹤性能對比Tab 1 Contract of target tracking performance
圖6 為本文方法得到的雷達(dá)跟蹤選擇結(jié)果。在三部雷達(dá)性能參數(shù)相同時,對雷達(dá)的選擇近似于從雷達(dá)到目標(biāo)的距離選擇雷達(dá)。
圖6 雷達(dá)跟蹤選擇結(jié)果Fig 6 Results of selection of radar tracking
同仿真場景一中的布置情況相同,不同之處是三部雷達(dá)的距離和角度量測噪聲標(biāo)準(zhǔn)差分別為400 m,0.05°;200 m,0.02°;50 m,0.01°,其他參數(shù)設(shè)置同仿真場景一。
采用本文的方法進行跟蹤,對比方法為根據(jù)雷達(dá)離目標(biāo)的遠(yuǎn)近選擇雷達(dá)進行跟蹤,簡稱UKF 距離法。圖7 為單次仿真實驗距離誤差均值對比,圖8 為兩種方法得到的雷達(dá)選擇結(jié)果,表2 為100 次蒙特卡羅實驗距離誤差均值。
表2 目標(biāo)跟蹤性能對比Tab 2 Contract of target tracking performance
圖7 距離誤差均值對比Fig 7 Contract of distance error mean value
圖8 雷達(dá)跟蹤選擇結(jié)果Fig 8 Results of selection of radar tracking
從圖7、圖8 和表2 可以看出:本文的方法比UKF 距離方法的整體跟蹤誤差較小。首先,在52 s 和176 s 左右,UKF 距離方法的距離誤差均值相比本文方法略有增大的趨勢;其次,跟UKF 距離方法對比,本文方法均提前進行雷達(dá)1 和雷達(dá)2 以及雷達(dá)2 和雷達(dá)3 的切換。表明在雷達(dá)性能參數(shù)不同時,本文方法能夠及時動態(tài)地選擇性能參數(shù)更好的雷達(dá)對目標(biāo)進行跟蹤,合理地選擇雷達(dá)交接班的時機,從而提高整體的跟蹤精度。
針對彈道導(dǎo)彈防御系統(tǒng)中的多傳感器對彈道目標(biāo)的協(xié)同跟蹤問題。本文采用信息增量作為傳感器跟蹤性能的量測標(biāo)準(zhǔn),并選擇信息增量最大的傳感器對彈道目標(biāo)進行跟蹤。通過仿真結(jié)果表明:本文方法能夠及時動態(tài)地選擇跟蹤性能最佳的傳感器對彈道目標(biāo)進行跟蹤,提高整體的跟蹤性能,同時能夠合理地選擇傳感器交接班的時機。
[1] Kalandros M,Pao L Y.Covariance control for multisensor systems[J].IEEE Transactions on Aerospace and Electrionic Systems,2002,38(4):1138-1157.
[2] 王 琳,于 雷,寇英信,等.以任務(wù)需求為驅(qū)動的多傳感器資源管理方法[J].系統(tǒng)工程與電子技術(shù),2010,32(9):1925-1930.
[3] 羅開平,姜 維,李一軍.傳感器管理述評[J].電子學(xué)報,2010,38(8):1900-1907.
[4] Aughenbaugh J M,La Cour B R.Sensor management for particle filter tracking[J].IEEE Transactions on Aerospace and Electrionic Systems,2011,47(1):503-523.
[5] 劉 欽,劉 錚.一種基于Rényi 信息增量的機動目標(biāo)協(xié)同跟蹤算法[J].控制與決策,2012,27(9):1438-1440.
[6] 李彬彬,馮新喜,王朝英,等.基于信息增量的被動多傳感器資源分配算法[J].系統(tǒng)工程與電子技術(shù),2012,34(3):502-507.
[7] 王 勇.基于Fisher 信息距離的被動傳感器目標(biāo)協(xié)同跟蹤方法[J].傳感器與微系統(tǒng),2014,33(7):119-122.
[8] Kirubajan R tharmarasa.Decentralized sensor selection for largescale multisensor-multitarget tracking[J].IEEE Transactions on Aerospace and Electrionic Systems,2011,47(2):1307-1324.
[9] Hung Gia Hoang,Ba Tuong Vo.Sensor management for multitarget tracking via multi-Bernoulli filtering[J].Automatica,2014,50(2):1135-1142.
[10]Li X Rong,Jilkov Vesselin P.Survey of maneuvering target tracking—Part II:Motion models of ballistic and space targets[J].IEEE Transactions on Aerospace and Electrionic Systems,2010,46(1):96-119.
[11]張華睿.面向目標(biāo)跟蹤的傳感器管理算法研究[D].長沙:國防科技大學(xué),2006.