谷雨,石晶輝,石彎彎,董華清,彭冬亮
(1.杭州電子科技大學(xué)通信信息傳輸與融合技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,杭州310018;2.首都航天機(jī)械公司,北京100076)
基于Rényi信息增量的機(jī)動(dòng)目標(biāo)協(xié)同跟蹤算法*
谷雨1,石晶輝2,石彎彎1,董華清1,彭冬亮1
(1.杭州電子科技大學(xué)通信信息傳輸與融合技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,杭州310018;2.首都航天機(jī)械公司,北京100076)
針對(duì)基于多傳感器組網(wǎng)進(jìn)行機(jī)動(dòng)目標(biāo)跟蹤的傳感器管理問(wèn)題,提出了一種基于Rényi信息增量的機(jī)動(dòng)目標(biāo)協(xié)同跟蹤算法。首先結(jié)合“當(dāng)前”統(tǒng)計(jì)模型和交互式多模型不敏卡爾曼濾波算法設(shè)計(jì)了一種變結(jié)構(gòu)多模型算法,來(lái)進(jìn)行機(jī)動(dòng)目標(biāo)的狀態(tài)估計(jì);然后以Rényi信息增量為評(píng)價(jià)準(zhǔn)則,選擇使Rényi信息增量最大的單個(gè)傳感器進(jìn)行目標(biāo)跟蹤;最后利用得到的最優(yōu)加速度估計(jì)進(jìn)行網(wǎng)格劃分,更新變結(jié)構(gòu)多模型中的模型集合。在一般機(jī)動(dòng)及強(qiáng)機(jī)動(dòng)場(chǎng)景下進(jìn)行了算法性能分析,仿真結(jié)果表明,該算法能夠合理地選擇傳感器,提高了對(duì)機(jī)動(dòng)目標(biāo)的跟蹤精度。
協(xié)同跟蹤,Rényi信息增量,變結(jié)構(gòu)多模型,網(wǎng)格劃分,“當(dāng)前”統(tǒng)計(jì)模型
隨著軍事電子技術(shù)的發(fā)展,利用單傳感器對(duì)機(jī)動(dòng)目標(biāo)進(jìn)行檢測(cè)、跟蹤和識(shí)別已經(jīng)無(wú)法滿足需求,而多傳感器組網(wǎng)能夠通過(guò)各單傳感器間的協(xié)同實(shí)現(xiàn)資源的有效利用,從而提升對(duì)機(jī)動(dòng)目標(biāo)的跟蹤性能[1]。交互式多模型(Interacting multiple model, IMM)算法[2-4]是一類典型的機(jī)動(dòng)目標(biāo)跟蹤算法,通過(guò)采用由多個(gè)固定模型組成的模型集來(lái)描述目標(biāo)的可能運(yùn)動(dòng)模式。隨著濾波技術(shù)的發(fā)展,學(xué)者們不斷地將IMM與其他濾波器相結(jié)合,提出了多種有效的機(jī)動(dòng)目標(biāo)跟蹤算法。由于該模型集合是固定的,當(dāng)模型失配時(shí)IMM算法會(huì)造成跟蹤精度下降。此后,研究學(xué)者提出了變結(jié)構(gòu)多模型算法[5],其根據(jù)目標(biāo)的狀態(tài)估計(jì)合理地確定目標(biāo)的可能模型集合,是一種更有效的機(jī)動(dòng)目標(biāo)跟蹤算法。
在多傳感器組網(wǎng)中,協(xié)同跟蹤是利用跟蹤信息的融合結(jié)果對(duì)傳感器資源進(jìn)行動(dòng)態(tài)分配,并作為反饋環(huán)節(jié)使多傳感器信息融合系統(tǒng)形成閉環(huán)控制系統(tǒng)[6]。本質(zhì)上,協(xié)同跟蹤是在傳感器管理的基礎(chǔ)上實(shí)現(xiàn)了傳感器組網(wǎng)的整體跟蹤性能最優(yōu)。目前解決多傳感器管理的方法主要見(jiàn)文獻(xiàn)[7-10]。
針對(duì)利用多傳感器組網(wǎng)進(jìn)行機(jī)動(dòng)目標(biāo)跟蹤的傳感器管理問(wèn)題,提出了一種基于Rényi信息增量的機(jī)動(dòng)目標(biāo)協(xié)同跟蹤算法[11]。通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了提出算法的有效性。
假設(shè)目標(biāo)的運(yùn)動(dòng)方程為
其中wk為系統(tǒng)過(guò)程噪聲。
假設(shè)傳感器組網(wǎng)中的傳感器為雷達(dá),則第j個(gè)傳感器的觀測(cè)方程為:
其中(xk,yk)表示k時(shí)刻目標(biāo)的位置,(Ysensorxj,Ysensoryj)為第j個(gè)傳感器的位置,nrj與nθj分別為第j個(gè)傳感器的距離觀測(cè)噪聲和角度觀測(cè)噪聲。
若多雷達(dá)組網(wǎng)中每一時(shí)刻只允許選擇一部雷達(dá)進(jìn)行目標(biāo)跟蹤,當(dāng)采用基于Rényi信息增量的傳感器管理方法尋找k時(shí)刻為系統(tǒng)帶來(lái)最多信息的傳感器jk,其目標(biāo)函數(shù)可描述為:
其中,[Dα(p1||p0)]jk為k時(shí)刻傳感器j的Rényi信息增量;m為組網(wǎng)中傳感器總數(shù);jk為k時(shí)刻所選出的最佳傳感器。
目標(biāo)可能的運(yùn)動(dòng)模型包括CV、CA、CT和Singer模型等,本文采用式(4)描述的變加速度模型來(lái)描述目標(biāo)的運(yùn)動(dòng)模型。
由于“當(dāng)前”統(tǒng)計(jì)模型(Current Statistics,CS)[12]采用修正的瑞利分布來(lái)描述目標(biāo)機(jī)動(dòng)加速度的統(tǒng)計(jì)特征,故可利用其估計(jì)目標(biāo)可能的加速度。本文結(jié)合“當(dāng)前”統(tǒng)計(jì)模型和IMMUKF設(shè)計(jì)了一種變結(jié)構(gòu)多模型算法,由交互作用器、多個(gè)UKF濾波器、模型概率估計(jì)器和估計(jì)混合器組成,并利用網(wǎng)格劃分技術(shù)[11]在線更新目標(biāo)的可能模型集合。該算法流程為將上一時(shí)刻得到的最優(yōu)估計(jì)初始化,作為這一時(shí)刻的交互輸入值;然后各CS模型利用UKF濾波器平行濾波,獲得系統(tǒng)的狀態(tài)估計(jì);再利用模型概率估計(jì)器更新各模型的概率;然后估計(jì)混合器交互輸出;最后利用最終選擇得到的最優(yōu)加速度估計(jì)進(jìn)行網(wǎng)格劃分,旨在生成目標(biāo)下一時(shí)刻可能的模型集合,即采用變加速度模型來(lái)描述目標(biāo)的運(yùn)動(dòng)模式。具體濾波步驟如下:
①輸入交互
各個(gè)模型初始狀態(tài)Xi(k-1|k-1)及其協(xié)方差矩陣Pi(k-1|k-1)通過(guò)交互和混合得到各模型混合概率μij(k-1|k-1),輸入混合狀態(tài)估計(jì)值Xoj(k-1|k-1),Poj(k-1|k-1)。
②各個(gè)CS模型利用UKF濾波器平行濾波,得到各模型k時(shí)刻狀態(tài)估計(jì)Xj(k|k),Pj(k|k),通過(guò)量測(cè)預(yù)測(cè)值Z(k|k-1)、量測(cè)預(yù)測(cè)殘差Sj(k)得到各模型的似然度:
③模型概率更新
④估計(jì)融合
⑤網(wǎng)格劃分
網(wǎng)格劃分[11]的基本思路為:假設(shè)最優(yōu)加速度估計(jì)S?k位于下頁(yè)圖1中▲位置,初始設(shè)定9個(gè)加速度模型組成一個(gè)粗略的模型集合M,M={ai,i=0,1,…,8},然后根據(jù)得到的最優(yōu)加速度估計(jì)調(diào)整網(wǎng)格,動(dòng)態(tài)生成一個(gè)與目標(biāo)真實(shí)運(yùn)動(dòng)模式更匹配的精確的細(xì)網(wǎng)格(即新的模型集合Ck+1={aij,i=1,…,4;j=0,1,…,4},i為象限數(shù)、j為模型數(shù)),并用于下一時(shí)刻的濾波估計(jì)。網(wǎng)格劃分過(guò)程如圖1所示。
圖1 自適應(yīng)網(wǎng)格劃分
針對(duì)多雷達(dá)組網(wǎng)中每一時(shí)刻只允許選擇一個(gè)傳感器進(jìn)行單機(jī)動(dòng)目標(biāo)跟蹤的問(wèn)題,利用前述算法估計(jì)得到目標(biāo)的狀態(tài)后,采用Rényi信息增量進(jìn)行傳感器的選擇,從而實(shí)現(xiàn)對(duì)機(jī)動(dòng)目標(biāo)的有效跟蹤。
Rényi熵是Shannon熵的廣義形式,用以描述一個(gè)事件的信息,反映了系統(tǒng)信息的高階特性。假設(shè)先、后驗(yàn)概率密度函數(shù)p0、p1服從高斯分布p0~G(μ0,∑0),p1~(μ1,∑1),基于Shannon熵的信息增量[15]為:
Rényi信息增量被定義為:
若采用以卡爾曼濾波為代表的濾波算法,當(dāng)?shù)玫侥繕?biāo)狀態(tài)估計(jì)的均值和協(xié)方差時(shí),Rényi信息增量的計(jì)算公式可簡(jiǎn)化為[10]:
其中參數(shù)選取α=0.5可獲得較好的跟蹤性能[13]。
前述變結(jié)構(gòu)多模型算法是針對(duì)利用單傳感器進(jìn)行目標(biāo)跟蹤的,當(dāng)利用多傳感器時(shí),對(duì)傳感器進(jìn)行最優(yōu)選擇后,由于能夠獲得目標(biāo)更準(zhǔn)確的測(cè)量信息,此時(shí)利用估計(jì)得到的狀態(tài)信息進(jìn)行網(wǎng)格劃分,在線更新目標(biāo)可能的狀態(tài),有利于提高目標(biāo)跟蹤的精度。設(shè)計(jì)的基于Rényi信息增量的協(xié)同跟蹤算法流程如圖2所示。
假設(shè)目標(biāo)在X-O-Y平面飛行,觀測(cè)噪聲均為閃爍噪聲[14-15],傳感器S1、S2、S3的測(cè)量標(biāo)準(zhǔn)差均為100 m,15 mrad,閃爍效應(yīng)對(duì)應(yīng)的測(cè)量標(biāo)準(zhǔn)差均為300 m,45 mrad,閃爍效應(yīng)系數(shù)ε=0.05。過(guò)程噪聲方差Q=E{w(k)w(k)T},其中w(k)是零均值、高斯過(guò)程白噪聲序列,采樣周期T=1 s,amax=[50 50]T,機(jī)動(dòng)頻率α取1/60,本文算法粗略模型集如下:a0=[0 0]T,a1=[40 0]T,a2=[40 40]T,a3=[0 40]T,amax=[-40 40]T,a5=[-40 0]T,a6=[-40-40]T,a7=[0-40]T,a8=[40 -40]T。各模型的初始概率為1/4,MonteCarlo仿真的次數(shù)為100次。本文所采用的仿真軟件為Matlab8.1。
仿真場(chǎng)景1:目標(biāo)運(yùn)動(dòng)模型為CA、CV。
①一般機(jī)動(dòng)情況:目標(biāo)在整個(gè)過(guò)程中的加速度變化如下頁(yè)表1所示。
圖2 基于Rényi信息增量的機(jī)動(dòng)目標(biāo)協(xié)同跟蹤算法框圖
表1 一般機(jī)動(dòng)情況下各時(shí)刻加速度
圖3 一般機(jī)動(dòng)情況下3種算法性能比較
表2 一般機(jī)動(dòng)情況下3種算法性能比較
表3 強(qiáng)機(jī)動(dòng)情況下各時(shí)刻加速度
圖4 強(qiáng)機(jī)動(dòng)情況下3種算法性能比較
3種算法的均方根誤差如表4所示:
表4 強(qiáng)機(jī)動(dòng)情況下3種算法均方根誤差
當(dāng)目標(biāo)運(yùn)動(dòng)模式為CA,CV時(shí),對(duì)于一般機(jī)動(dòng)及強(qiáng)機(jī)動(dòng)情況,本文算法利用CS模型實(shí)時(shí)修正加速度分布,并通過(guò)方差反饋到下一時(shí)刻的濾波增益中,實(shí)現(xiàn)閉環(huán)自適應(yīng)跟蹤,并與IMMUKF相結(jié)合進(jìn)行濾波估計(jì)。從表2和表4可知,跟蹤性能要優(yōu)于文獻(xiàn)[9]、文獻(xiàn)[10]算法。其中,在強(qiáng)機(jī)動(dòng)情況下效果更為明顯。另一方面,與目標(biāo)的距離遠(yuǎn)近決定傳感器的探測(cè)性能,從圖3、圖4中3種算法的傳感器使用情況看,本文算法和文獻(xiàn)[10]算法傳感器使用情況最佳,與傳感器和目標(biāo)間的距離相對(duì)應(yīng),說(shuō)明簡(jiǎn)化計(jì)算Rényi信息增量是有效的。
仿真場(chǎng)景2:
表5 仿真場(chǎng)景2的各時(shí)刻角速度
圖5 仿真場(chǎng)景2的3種算法性能比較
表6 仿真場(chǎng)景2的3種算法均方根誤差
表7 仿真場(chǎng)景2的各時(shí)刻角速度
圖6 仿真場(chǎng)景2的3種算法性能比較
3種算法的均方根誤差如表8所示。
表8 仿真場(chǎng)景2的3種算法均方根誤差
由圖5、表6可知,對(duì)于目標(biāo)運(yùn)動(dòng)模型為CV、CT時(shí),由于CS模型性能依賴于加速度參數(shù),跟蹤性能受到加速度參數(shù)的影響,且修正的瑞利分布本身的局限性,使得模型無(wú)法快速、精確地描述目標(biāo)運(yùn)動(dòng)的加速度情況,導(dǎo)致跟蹤精度略微下降,這也是CS模型一個(gè)固有的缺陷。而文獻(xiàn)[10]算法的濾波模型本身含有協(xié)同轉(zhuǎn)彎模型,故在CT場(chǎng)景下性能最優(yōu);另一方面,從圖5、圖6中傳感器使用情況看,文獻(xiàn)[9]算法中由于計(jì)算Rényi信息增量時(shí)將積分運(yùn)算轉(zhuǎn)換為求和運(yùn)算,可能導(dǎo)致傳感器選擇不準(zhǔn)確而影響跟蹤精度,文獻(xiàn)[10]算法和本文算法傳感器選擇情況最優(yōu);由表8可知,當(dāng)目標(biāo)運(yùn)動(dòng)模型為CV、CT、CA時(shí),本文算法表現(xiàn)出自身優(yōu)勢(shì),跟蹤精度略高于其他算法。因?yàn)樽兘Y(jié)構(gòu)多模型算法是采用變加速度模型集來(lái)描述目標(biāo)可能的運(yùn)動(dòng)模式,因此,具有更好適應(yīng)性。
本文針對(duì)多雷達(dá)組網(wǎng)中機(jī)動(dòng)目標(biāo)跟蹤問(wèn)題,提出了一種基于Rényi信息增量的機(jī)動(dòng)目標(biāo)協(xié)同跟蹤算法。結(jié)合“當(dāng)前”統(tǒng)計(jì)模型和IMMUKF設(shè)計(jì)了一種變結(jié)構(gòu)多模型算法來(lái)解決目標(biāo)狀態(tài)估計(jì)問(wèn)題,并以Rényi信息增量最大為評(píng)價(jià)準(zhǔn)則來(lái)選擇最佳單傳感器進(jìn)行跟蹤,最后通過(guò)網(wǎng)格劃分動(dòng)態(tài)生成目標(biāo)在下一時(shí)刻可能的運(yùn)動(dòng)模型集合。當(dāng)目標(biāo)出現(xiàn)強(qiáng)機(jī)動(dòng)情況時(shí),本文算法優(yōu)勢(shì)明顯,其他場(chǎng)景下與文獻(xiàn)[10]算法跟蹤性能相當(dāng),均優(yōu)于文獻(xiàn)[9]算法。仿真實(shí)驗(yàn)結(jié)果表明本文算法能夠合理選擇最優(yōu)傳感器進(jìn)行目標(biāo)狀態(tài)估計(jì),實(shí)現(xiàn)協(xié)同跟蹤。
[1]彭冬亮,文成林,薛安克.多傳感器多源信息融合理論及應(yīng)用[M].北京:科學(xué)出版社,2010:183-229.
[2]許天野,徐雪松.交互多模型算法在目標(biāo)跟蹤領(lǐng)域的應(yīng)用[J].四川兵工學(xué)報(bào),2013,34(11):116-119.
[3]JULIER S J,UHLMANN J K.Unscented filtering and nonlinear estimation[J].Proceedings of the IEEE,2004,92(3):401-422.
[4]BOERS Y,DRIESSEN J N.Interacting multiple model particle filter[J].IEE Proceedings-Radar,Sonar and Navigation,2003,150(5):344-349.
[5]于紅娟,牛竹云,張春濤,等.基于變結(jié)構(gòu)多模型的機(jī)動(dòng)目標(biāo)跟蹤算法[J].火力與指揮控制,2012,37(S1):36-39.
[6]劉欽.多傳感器組網(wǎng)協(xié)同跟蹤方法研究[D].西安:西安電子科技大學(xué),2013.
[7]羅開(kāi)平,姜維,李一軍.傳感器管理述評(píng)[J].電子學(xué)報(bào),2010,38(8):1900-1907.
[8]AUGHENBAUGH J M,LA COUR B R.Metric selection for information theoretic sensor management[C]//11th International Conference on Information Fusion,2008:1-8.
[9]劉欽,劉崢.一種基于Renyi信息增量的機(jī)動(dòng)目標(biāo)協(xié)同跟蹤方法[J].控制與決策,2012,36(9):1437-1440.
[10]劉欣怡,趙誠(chéng),單甘霖,等.面向目標(biāo)跟蹤的基于Rényi信息增量多的傳感器管理[J].信息與控制,2015,34(2):184-189.
[11]何丹敏,彭冬亮,石彎彎,等.基于“當(dāng)前”統(tǒng)計(jì)模型的混合網(wǎng)格多模型算法[J].光電工程,2015,42(7):49-54.
[12]簡(jiǎn)金蕾,李靜,任宏斌,等.基于“當(dāng)前”統(tǒng)計(jì)模型的自適應(yīng)不敏卡爾曼濾波算法[J].現(xiàn)代雷達(dá),2011,33(9):48-52.
[13]LIU Y,WANG H,HOU C.UKF based nonlinear filtering using minimum entropy criterion[J].IEEE Transactions on Signal Processing,2013,61(20):4988-4999.
[14]李彬彬,馮新喜,王朝英,等.基于信息增量的多被動(dòng)傳感器資源分配算法[J].系統(tǒng)工程與電子技術(shù),2012,34(3):502-507.
[15]胡洪濤,敬忠良,李安平,等.非高斯條件下基于粒子濾波的目標(biāo)跟蹤[J].上海交通大學(xué)學(xué)報(bào),2004,38(12):1996-1999.
A Maneuvering Target Collaboration Tracking Algorithm Based on Rényi Information Gain
GU Yu1,SHI Jing-hui2,SHI Wan-wan1,DONG Hua-qing1,PENG Dong-liang1
(1.Fundamental Science on Communication Information Transmission and Fusion Technology Laboratory,
Hangzhou Dianzi University,Hangzhou 310018,China;2.Captial Spaceflight Machinery Company,Beijing 100076,China)
To solve sensor management problem when tracking one maneuvering target using multiple netted sensors,the maneuvering target collaboration tracking algorithm based on Rényi information gain is proposed.A variable structure multiple model algorithm combining current statistics model and interacting multiple model unscented kalman filter is first proposed to estimate the states of maneuvering target.One sensor is then selected according to maximal Rényi information gain to perform target tracking.Grid partition is finally performed by estimation of the optimal acceleration to update possible model sets of the target.The performance of the proposed algorithm is analyzed in general and strong maneuvering scenarios,and simulation results demonstrate that the proposed algorithm can select the optimal sensor reasonably and improves the accuracy for maneuvering target tracking.
collaborative tracking,Rényi information gain,variable structure multiple model,grid partition,current statistic model
TP273
A
1002-0640(2016)12-0025-06
2015-11-09
2015-12-27
國(guó)家自然科學(xué)基金資助項(xiàng)目(61174024)
谷雨(1982-),男,吉林雙陽(yáng)人,博士,副教授。研究方向:目標(biāo)跟蹤、視覺(jué)伺服。