程佳林,張貞凱
(1.江蘇科技大學(xué) 電子與信息學(xué)院,江蘇 鎮(zhèn)江 212003; 2.華中科技大學(xué) 電子信息與通信學(xué)院,湖北 武漢 430074)
目前,利用有限的傳感器資源在跟蹤性能與系統(tǒng)資源之間實(shí)現(xiàn)系統(tǒng)整體性能最優(yōu)[1],是傳感器資源管理技術(shù)重要的研究方向。在目標(biāo)跟蹤領(lǐng)域和控制領(lǐng)域中,卡爾曼濾波(KF)是處理多傳感器數(shù)據(jù)融合問(wèn)題最常用的方法,但是在實(shí)際工程應(yīng)用中存在融合過(guò)程運(yùn)算量較大的問(wèn)題。機(jī)動(dòng)策略自適應(yīng)目標(biāo)跟蹤算法,可以利用機(jī)動(dòng)策略轉(zhuǎn)移矩陣來(lái)改善不可避免的驟增的估計(jì)誤差[2]。信息濾波[3,4](IF)融合理論已基本完善,擴(kuò)展卡爾曼濾波作為一種經(jīng)典的非線性濾波算法在非線性系統(tǒng)中被廣泛使用。基于擴(kuò)展卡爾曼濾波的非線性集中式融合算法及分布式融合算法[5,6]能夠有效處理應(yīng)用于非線性系統(tǒng)。利用擴(kuò)展信息濾波器進(jìn)行信息融合不僅解決了非線性系統(tǒng)的濾波問(wèn)題,而且能夠有效降低融合過(guò)程中運(yùn)算量。
傳感器選擇是在利用有限的傳感器資源的基礎(chǔ)上滿足對(duì)目標(biāo)跟蹤以及掃描空間的需求,從而獲取目標(biāo)各具體特性的最優(yōu)值,并對(duì)傳感器資源進(jìn)行優(yōu)化分配[7],達(dá)到跟蹤性能與系統(tǒng)資源之間的平衡。其中,基于信息論以及集與協(xié)方差控制等傳感器選擇方法能夠自適應(yīng)選擇傳感器,提高跟蹤精度[8,9]。為了保持跟蹤精度及時(shí)效性的同時(shí),控制系統(tǒng)資源消耗,采用基于任務(wù)控制的傳感器管理方案獲取目標(biāo)威脅度[10],在此基礎(chǔ)之上利用改進(jìn)的效能函數(shù)[11],對(duì)傳感器進(jìn)行自適應(yīng)選擇,實(shí)現(xiàn)對(duì)傳感器資源的調(diào)度。不過(guò)這些方法會(huì)面臨組網(wǎng)中傳感器數(shù)量增加時(shí)傳統(tǒng)傳感器選擇方法計(jì)算量過(guò)大的問(wèn)題。因此,本文考慮在線比較期望信息增益與各傳感器當(dāng)前信息增益,每次選取信息增益與期望信息增益最接近的傳感器。最后計(jì)算傳感器組合的信息增益進(jìn)行融合,達(dá)到對(duì)傳感器進(jìn)行選擇的目的。
1.1.1 信號(hào)模型
在k時(shí)刻,雷達(dá)對(duì)目標(biāo)所發(fā)射的波形信號(hào)為
(1)
其中,pk為雷達(dá)在當(dāng)前時(shí)刻對(duì)目標(biāo)的發(fā)射功率,Sk(t)表示發(fā)射信號(hào)的復(fù)包絡(luò)。
因此,雷達(dá)系統(tǒng)接收信號(hào)的基帶形式如下
(2)
式中:hk為復(fù)數(shù)代表目標(biāo)的RCS;τk是目標(biāo)回波時(shí)延;αk為衰減因子,它與發(fā)射天線的增益,接收天線孔徑和雙向路徑損耗有關(guān)。
1.1.2 目標(biāo)狀態(tài)模型
考慮如下離散時(shí)間非線性動(dòng)態(tài)系統(tǒng),目標(biāo)的運(yùn)動(dòng)方程為
Xk=f(Xk-1)+wk
(3)
1.1.3 量測(cè)模型
目標(biāo)的量測(cè)方程為
Zk=h(Xk)+vk
(4)
其中
h(Xk)=(Rk,θk)T
(5)
此處,Zk∈Rnx為觀測(cè)向量,h:Rnx→Rnz為量測(cè)矩陣為可微函數(shù)。nx、nz分別為系統(tǒng)狀態(tài)的維數(shù)和觀測(cè)維數(shù)。vk是均值為零并且互獨(dú)立的白色高斯過(guò)程噪聲向量,協(xié)方差陣為非負(fù)定陣R。Rk可以通過(guò)時(shí)延信號(hào)τk求出,表示雷達(dá)和目標(biāo)之間的徑向距離
(6)
(xm,ym)表示雷達(dá)坐標(biāo);θk為目標(biāo)方位
(7)
vs=[v1,v2]T為量測(cè)噪聲向量。
非線性系統(tǒng)中,擴(kuò)展卡爾曼濾波遞推計(jì)算公式如下
(8)
(9)
(10)
Pk+1|k+1=[I-Kk+1Hk+1]Pk+1|k
(11)
(12)
其中,Hk為雅克比矩陣,F(xiàn)k為線性化狀態(tài)矩陣
(13)
(14)
(15)
(16)
將式(15)、式(16)式帶入擴(kuò)展卡爾曼濾波可得擴(kuò)展信息濾波方程,其信息狀態(tài)向量和信息矩陣的預(yù)測(cè)如下
(17)
(18)
信息狀態(tài)向量和信息矩陣的估計(jì)如下
(19)
Yk+1|k+1=Yk+1|k+Ik
(20)
其中,狀態(tài)貢獻(xiàn)i(k)和信息矩陣I(k)的定義如下
(21)
(22)
多傳感器融合的主要思路是利用多個(gè)低維傳感器的觀測(cè)向量擴(kuò)展成單個(gè)高維觀測(cè)向量,在此基礎(chǔ)上來(lái)對(duì)其進(jìn)行濾波得到多傳感器融合的狀態(tài)估計(jì),考慮由N個(gè)傳感器節(jié)點(diǎn)組成的跟蹤系統(tǒng)
h(x)=[h1(x),h2(x),…,hN(x)]
(23)
Zk=[Z1,k,Z2,k,…,ZN,k]
(24)
vk=[v1,k,v2,k,…,vN,k]
(25)
h(x)、Zk和vk分別為觀測(cè)矩陣、觀測(cè)向量和觀測(cè)誤差。由上述條件可知
E[vk]=0
(26)
Rk=diag{R1,k,R2,k,…,RN,k}
(27)
由式(19)得融合中心信息狀態(tài)向量估計(jì)
(28)
由式(18)得融合中心信息矩陣估計(jì)
(29)
則擴(kuò)展卡爾曼信息濾波狀態(tài)更新方程即為
(30)
狀態(tài)估計(jì)協(xié)方差為
Pk+1|k+1=(Yk+1|k+1)-1
(31)
傳統(tǒng)的傳感器選擇算法是通過(guò)期望協(xié)方差確定與其最符合的傳感器分配組合對(duì)目標(biāo)進(jìn)行跟蹤濾波。假設(shè)傳感器系統(tǒng)中有N個(gè)傳感器,那么傳感器組合方式則有2N-1個(gè),這樣當(dāng)組網(wǎng)中的傳感器數(shù)量增加時(shí),全遍歷步長(zhǎng)則會(huì)爆炸式增長(zhǎng)。本章提出一種傳感器選擇算法,基于信息增益的思想,每次都將選取信息增益與期望信息增益最接近的傳感器組成傳感器組合,并將傳感器組合的信息增益在擴(kuò)展信息濾波的融合中心進(jìn)行融合得到濾波結(jié)果。
由式(29)可以得信息矩陣的更新遞推表達(dá)式,即協(xié)方差更新表達(dá)式;因此通過(guò)式(22)可以計(jì)算出各個(gè)傳感器的對(duì)目標(biāo)進(jìn)行觀測(cè)時(shí)的信息增益
(32)
通過(guò)設(shè)定的期望協(xié)方差矩陣,結(jié)合上述協(xié)方差更新表達(dá)式可知,滿足跟蹤精度要求Pd(k|k)的期望信息增益為
(33)
利用矩陣度量計(jì)算目標(biāo)函數(shù)f(Ji,Jd),本文矩陣度量采用絕對(duì)值求跡,具體定義如下
(34)
即計(jì)算trace(Ji(k|k)-Jd(k)),根據(jù)協(xié)方差思想,若目標(biāo)函數(shù)f(Ji,Jd)≥0,則表示第i個(gè)傳感器可作為傳感器組合的候選傳感器,根據(jù)目標(biāo)函數(shù)選取與期望信息增益最接近的傳感器組合。
得到當(dāng)前傳感器組合后,利用Eif估計(jì)目標(biāo)位置并融合。根據(jù)傳感器組合中各傳感器的觀測(cè)值進(jìn)行濾波,在擴(kuò)展信息濾波器中融合中心進(jìn)行信息融合。與傳統(tǒng)傳感器管理方法待選傳感器組合數(shù)2N-1相比,本文方法中待選的傳感器組合數(shù)為N,降低了傳感器組合數(shù)量。
在多傳感器系統(tǒng)中,基于擴(kuò)展信息濾波的傳感器選擇算法的具體步驟如下:
步驟1 系統(tǒng)初始化設(shè)置,即設(shè)定目標(biāo)的初始狀態(tài)變量及期望協(xié)方差矩陣。
步驟2 計(jì)算各傳感器的信息增益,并求解目標(biāo)函數(shù)f(Ji,Jd)。
步驟3 根據(jù)目標(biāo)函數(shù)每次選取與期望信息增益最接近的信息增益組成傳感器組合,直到滿足跟蹤精度要求即Pd(k)-Ps(k|k)對(duì)角線上最小值大于零。
步驟4 利用Eif估計(jì)目標(biāo)位置并融合。獲得步驟3所選擇的傳感器的觀測(cè)值進(jìn)行濾波,由式(28)、式(29)得到擴(kuò)展信息濾波器中融合中心的融合結(jié)果,輸出目標(biāo)跟蹤位置。
步驟5 跳轉(zhuǎn)至步驟2,進(jìn)行下一時(shí)刻的傳感器選擇,直至跟蹤結(jié)束。
仿真的主要目的是驗(yàn)證本文提出的基于擴(kuò)展信息濾波的跟蹤傳感器選擇算法(TSSA)的有效性,并分別和文獻(xiàn)[12]中的多傳感器加權(quán)融合算法(MWFA)及只選擇3個(gè)性能最優(yōu)的傳感器直接融合進(jìn)行對(duì)比。
仿真場(chǎng)景是由6個(gè)傳感器構(gòu)成的傳感器系統(tǒng)對(duì)一個(gè)目標(biāo)進(jìn)行觀測(cè),每個(gè)傳感器將給出目標(biāo)在x,y兩個(gè)坐標(biāo)上的位置信息,量測(cè)噪聲參數(shù)見(jiàn)表1。
表1 傳感器各方向上的量測(cè)噪聲標(biāo)準(zhǔn)差
仿真時(shí)目標(biāo)采用CA模型,x,y方向的加速度都受到均值為零的高斯白噪聲擾動(dòng),并且每個(gè)時(shí)刻都相互間獨(dú)立。采樣周期為1 s,目標(biāo)運(yùn)動(dòng)持續(xù)時(shí)間為100 s。仿真中期望協(xié)方差設(shè)置為兩斷,轉(zhuǎn)換時(shí)刻為51 s,特征值分別為diag([0.4,0.15,0.4,0.4,0.3,0.4])、diag([0.9,0.3,0.6,0.5,0.5,0.6])。目標(biāo)的初始狀態(tài)x0=[10 50 5 10 2 4]T。
圖1是跟蹤軌跡曲線,圖2是傳感器系統(tǒng)對(duì)目標(biāo)進(jìn)行跟蹤時(shí)的各傳感器選擇情況與掃描次數(shù)的關(guān)系,其中的點(diǎn)表示該時(shí)刻傳感器的被選擇;從圖中不難看出,前50 s所設(shè)期望協(xié)方差特征值較小即跟蹤要求較高,S1、S2、S3這3個(gè)高精度傳感器使用率較高,過(guò)了第51次掃描之后期望協(xié)方差水平降低,總體的傳感器使用率也隨之下降。因此,本文提出的傳感器選擇算法可以根據(jù)期望協(xié)方差水平的變化自適應(yīng)選擇跟蹤傳感器。
圖1 目標(biāo)跟蹤軌跡
圖2 傳感器選擇結(jié)果
圖3、圖4、圖5分別是50次Montente Carlo仿真的位置、速度以及加速度的RMSE變化曲線。
圖3 位置跟蹤均方根誤差比較
圖4 速度均方根誤差比較
圖5 加速度均方根誤差比較
在目標(biāo)跟蹤過(guò)程中當(dāng)前時(shí)刻k時(shí)的均方根誤差(RMSE)表達(dá)式如下
由圖3、圖4及圖5的RMSE曲線可以看出,利用擴(kuò)展信息濾波算法對(duì)傳感器信息進(jìn)行融合,是解決非線性目標(biāo)跟蹤的有效方法。文獻(xiàn)[12]的方法是考慮全局狀態(tài)估計(jì)的多傳感器加權(quán)融合方法,并未對(duì)傳感器進(jìn)行選擇。因此,當(dāng)多傳感器系統(tǒng)中存在性能較差的傳感器時(shí),會(huì)產(chǎn)生較大的量測(cè)誤差,性能過(guò)差的傳感器參與融合時(shí)反而會(huì)降低跟蹤精度。通過(guò)比較可以看出,本文提出的基于擴(kuò)展信息濾波的多傳感器跟蹤算法的跟蹤精度與3個(gè)性能最優(yōu)的傳感器直接融合的跟蹤精度基本一致,驗(yàn)證了傳感器選擇算法的有效性。
在實(shí)際跟蹤及控制領(lǐng)域,非線性狀態(tài)模型和觀測(cè)模型比較常見(jiàn)。擴(kuò)展信息濾波在非線性系統(tǒng)中具有很好的跟蹤性能,并且融合中心計(jì)算量也相對(duì)較小。當(dāng)傳感器系統(tǒng)對(duì)目標(biāo)進(jìn)行跟蹤時(shí),在滿足跟蹤精度的要求下,需要最大化降低傳感器資源的使用,本文提出的傳感器選擇算法在有效降低傳感器使用數(shù)量的同時(shí)保證了跟蹤精度,實(shí)現(xiàn)了對(duì)傳感器資源的管理。