張萬(wàn)里,何金剛,趙紅梅
(1.中國(guó)空空導(dǎo)彈研究院,河南洛陽(yáng)471009; 2.中國(guó)航空工業(yè)集團(tuán)公司洛陽(yáng)電光設(shè)備研究所,河南洛陽(yáng)471009)
改進(jìn)的Rao-Blackwellized粒子濾波算法在目標(biāo)跟蹤中的應(yīng)用
張萬(wàn)里1,何金剛1,趙紅梅2
(1.中國(guó)空空導(dǎo)彈研究院,河南洛陽(yáng)471009; 2.中國(guó)航空工業(yè)集團(tuán)公司洛陽(yáng)電光設(shè)備研究所,河南洛陽(yáng)471009)
在雷達(dá)信號(hào)處理領(lǐng)域,運(yùn)動(dòng)目標(biāo)跟蹤問(wèn)題一直是研究的重點(diǎn),涉及的非線性濾波問(wèn)題是難點(diǎn)所在;以Rao-Blackwellized粒子濾波(RBPF)算法為基礎(chǔ),針對(duì)其應(yīng)用于雷達(dá)目標(biāo)跟蹤時(shí)產(chǎn)生的若干問(wèn)題進(jìn)行研究,為提高算法的收斂性能及濾波精度,對(duì)其中重采樣算法進(jìn)行改進(jìn),利用數(shù)字仿真對(duì)更改后的算法進(jìn)行驗(yàn)證,經(jīng)過(guò)表明更改后的RBPF算法在各個(gè)方面均有較大程度改善。
粒子濾波;RBPF算法;雷達(dá)目標(biāo)跟蹤;重采樣
在雷達(dá)信號(hào)處理領(lǐng)域,如何實(shí)現(xiàn)精確的運(yùn)動(dòng)目標(biāo)估計(jì)與跟蹤,一直是長(zhǎng)期以來(lái)的研究的重點(diǎn)所在。20世紀(jì)60年代已證明在線性高斯系統(tǒng)中利用最小均方根誤差準(zhǔn)則進(jìn)行目標(biāo)狀態(tài)估計(jì)的Kalman濾波方法[1]是最優(yōu)的估計(jì)方法,但針對(duì)非線性非高斯系統(tǒng),盡管采用局部線性化近似的擴(kuò)展Kalman濾波(Extend KF,EKF)[2]以及確定性采樣的Unscented卡爾曼濾波(Unscented KF,UKF)[3]方法可以解決一定形式的弱非線性,弱高斯條件下的目標(biāo)跟蹤問(wèn)題,但由于其對(duì)動(dòng)態(tài)模型的限制過(guò)強(qiáng),在實(shí)際應(yīng)用中大多無(wú)法滿足應(yīng)用前提,20世紀(jì)90年代出現(xiàn)了以粒子濾波(Particle filter,PF)[4]為代表的非線性濾波方法,即利用蒙特卡羅采樣得到的隨機(jī)樣本(也稱為粒子)的加權(quán)和來(lái)近似狀態(tài)的整個(gè)后驗(yàn)概率密度,其本質(zhì)是采用蒙特卡羅仿真來(lái)獲得高維積分的近似數(shù)值解,并用以解決各種估計(jì)問(wèn)題。
粒子濾波面臨實(shí)踐中面臨兩個(gè)最大問(wèn)題,一是粒子退化問(wèn)題,即經(jīng)過(guò)若干次迭代后,重要性權(quán)值可能集中到少數(shù)粒子上,這些粒子已經(jīng)不能有效表達(dá)后驗(yàn)概率密度函數(shù),為解決此問(wèn)題,Gordon等[5]提出了重采用方法,其思想是減少權(quán)值較小的粒子數(shù),增加權(quán)值較大的粒子數(shù)。另一個(gè)問(wèn)題是采用粒子數(shù)目過(guò)多導(dǎo)致計(jì)算的復(fù)雜度增加,當(dāng)前的解決方法主要是從系統(tǒng)模型出發(fā),利用模型自身的特性來(lái)提高濾波器性能。Rao-Blackwellized方法[6]即將線性狀態(tài)從系統(tǒng)中分離出來(lái),利用Kalman濾波器對(duì)線性狀態(tài)進(jìn)行估計(jì),利用粒子濾波對(duì)剩余的非線性狀態(tài)進(jìn)行估計(jì),后基于貝葉斯定理求取狀態(tài)的后驗(yàn)概率。由于RBPF降低了粒子濾波狀態(tài)的維數(shù),與使用相同粒子數(shù)的傳統(tǒng)PF算法相比,可以獲得更優(yōu)的性能。
當(dāng)前的Rao-Blackwellized粒子濾波(RBPF)中的重采樣雖然可以一定程度上緩解權(quán)值退化的現(xiàn)象,但同樣也會(huì)帶來(lái)粒子貧化的問(wèn)題;同時(shí)采用單一系統(tǒng)模型作為Rao-Blackwellized粒子濾波中近似線性狀態(tài)的估計(jì),在跟蹤機(jī)動(dòng)目標(biāo)時(shí)與真實(shí)飛行軌跡存在偏差,因此為解決此類問(wèn)題,本文采用權(quán)重分區(qū)并實(shí)施改進(jìn)的重采樣算法的方法在大權(quán)值與小權(quán)值粒子之間對(duì)權(quán)重重新計(jì)算以獲取新粒子,從而實(shí)現(xiàn)粒子狀態(tài)的估計(jì),同時(shí)以僅有角度信息的雷達(dá)雙目標(biāo)跟蹤問(wèn)題為例,對(duì)改進(jìn)的算法進(jìn)行驗(yàn)證。
1.1 粒子濾波算法原理
解決目標(biāo)跟蹤問(wèn)題的最優(yōu)方法是貝葉斯濾波方法,它通過(guò)兩個(gè)步驟來(lái)實(shí)現(xiàn):狀態(tài)預(yù)測(cè)和狀態(tài)更新。貝葉斯濾波的實(shí)質(zhì)是通過(guò)獲得目標(biāo)的后驗(yàn)概率密度,根據(jù)某些準(zhǔn)則(如最大后驗(yàn)估計(jì))近似地計(jì)算出目標(biāo)狀態(tài)值。定義系統(tǒng)模型如下:
其中xk為目標(biāo)在k時(shí)刻的狀態(tài),如目標(biāo)的位置、速度、加速度等信息。yk為k時(shí)刻的測(cè)量值,如目標(biāo)的位置、彈目距離、目標(biāo)與傳感器的相對(duì)角度等。p(xk|xk-1)為目標(biāo)的動(dòng)態(tài)模型,表征目標(biāo)狀態(tài)的動(dòng)態(tài)變化情況,p(yk|xk)為系統(tǒng)的測(cè)量模型,表征目標(biāo)在干擾情況下的測(cè)量變化情況。最優(yōu)濾波的目的就是為了在已知觀測(cè)信息z1:k的前提下獲得目標(biāo)的后驗(yàn)概率p(xk|z1:k)。
利用Chapman-Kolmogoroff公式可得目標(biāo)的后驗(yàn)概率密度為
式(2)從理論意義上提供了最優(yōu)濾波問(wèn)題的解決方法,但在非線性系統(tǒng)求解過(guò)程中無(wú)窮維積分的運(yùn)算極為困難,無(wú)法得到其精確最優(yōu)解。
1.2 Rao-Blackwellized粒子濾波算法流程
在Rao-Blackwellized粒子濾波算法中,引入任意潛在變量λ,系統(tǒng)的動(dòng)態(tài)模型和測(cè)量模型分別變?yōu)閜(xk|xk-1,λk-1)和p(yk|xk,λk),已知重要性分布為π),對(duì)當(dāng)前粒子群進(jìn)行處理,其中m為均值,P為協(xié)方差,ω為粒子權(quán)重,N為粒子數(shù)。在K時(shí)刻,Rao-Blackwellized粒子濾波算法的流程如下:
1)對(duì)粒子均值m和協(xié)方差P做卡爾曼濾波預(yù)測(cè):
2)根據(jù)相應(yīng)的重要性分布,更新潛在變量λ(i)k:
3)計(jì)算新的權(quán)重:
4)歸一化權(quán)重:
對(duì)粒子均值m和協(xié)方差P做卡爾曼濾波更新:
利用RBPF算法可將多目標(biāo)跟蹤問(wèn)題分為兩個(gè)部分:多目標(biāo)數(shù)據(jù)關(guān)聯(lián)中后驗(yàn)概率分布的估計(jì)和基于數(shù)據(jù)關(guān)聯(lián)單個(gè)目標(biāo)跟蹤的估計(jì)??梢苑謩e通過(guò)序列重要性采樣及Kalman濾波進(jìn)行最小均方誤差估計(jì)來(lái)解決,將跟蹤過(guò)程簡(jiǎn)化為目標(biāo)判別,即判別當(dāng)前得到的測(cè)量值是目標(biāo)還是雜波,并在此基礎(chǔ)上對(duì)目標(biāo)進(jìn)行跟蹤。
通過(guò)設(shè)定數(shù)據(jù)關(guān)聯(lián)指標(biāo)Ck,當(dāng)Ck=j時(shí)表示當(dāng)前測(cè)量值對(duì)應(yīng)第j個(gè)目標(biāo),當(dāng)Ck=0時(shí)表示當(dāng)前測(cè)量值經(jīng)判別為雜波。
為使用RBPF濾波算法,必須首先確定一個(gè)重要性分布用以計(jì)算不同時(shí)刻k各個(gè)粒子的權(quán)值,即確定分布π(ck|,利用貝葉斯公式可以方便求取概率密度p(ck|),因此RBPF算法默認(rèn)將p()作為最優(yōu)的重要性分布π來(lái)計(jì)算。
在采用RBPF算法解決雷達(dá)目標(biāo)跟蹤問(wèn)題時(shí),發(fā)現(xiàn)了當(dāng)前算法存在的一系列問(wèn)題,包括重采樣算法導(dǎo)致粒子貧乏性增加以及EKF或UKF算法導(dǎo)致預(yù)測(cè)精度較低等等,嚴(yán)重可能導(dǎo)致濾波算法發(fā)散,為此本文對(duì)以上算法進(jìn)行適應(yīng)性改進(jìn),以適應(yīng)雷達(dá)目標(biāo)跟蹤問(wèn)題更好的解決。
RBPF算法重采樣的目的是為了緩解權(quán)值退化現(xiàn)象,即避免在權(quán)重較小的狀態(tài)處散步同樣概率的粒子數(shù)目導(dǎo)致計(jì)算復(fù)雜度增加的問(wèn)題,其本質(zhì)是以犧牲粒子多樣性來(lái)減小計(jì)算量和提高魯棒性,但通過(guò)若干次迭代可能會(huì)導(dǎo)致重要性權(quán)值集中到少數(shù)粒子上,這樣當(dāng)目標(biāo)機(jī)動(dòng)時(shí)狀態(tài)變化頻繁,此時(shí)可能導(dǎo)致粒子貧化進(jìn)而濾波無(wú)法收斂到目標(biāo)實(shí)際的狀態(tài)。在利用RBPF算法針對(duì)雙目標(biāo)跟蹤問(wèn)題進(jìn)行仿真時(shí)發(fā)現(xiàn),常常出現(xiàn)濾波算法發(fā)散的情況,經(jīng)分析此問(wèn)題為重采樣導(dǎo)致粒子貧化所致。
為解決此問(wèn)題需在重采樣時(shí)適當(dāng)增加粒子的多樣性,可采用改進(jìn)的重采樣算法,即改變重采樣后權(quán)重的分配方式,這樣處理雖然可能增加一定的計(jì)算量,但同時(shí)會(huì)很大程度上避免粒子貧化的問(wèn)題。具體的計(jì)算步驟如下:
1)首先按照重采樣前的權(quán)重將粒子分為高、中、低權(quán)重3個(gè)域,對(duì)于中權(quán)重域的粒子直接保留,為保證粒子的多樣性,對(duì)低、高權(quán)重域的粒子重新分配。
2)假設(shè)低、中權(quán)重的粒子共有n個(gè),將這兩個(gè)域的權(quán)重重新歸一化后,得到新的權(quán)重,計(jì)算這兩個(gè)域粒子歸一化后的權(quán)重加權(quán)和:
其中[]代表小數(shù)的取整部分。
3)重采樣之后的低、高權(quán)重的新的權(quán)重計(jì)算如下:
改進(jìn)的重采樣的算法相比當(dāng)前的重采樣的算法在保留中權(quán)重對(duì)粒子影響的基礎(chǔ)上,能夠適當(dāng)增加小權(quán)重粒子的比例,不會(huì)像原始重采樣算法那樣降低粒子的多樣性,當(dāng)目標(biāo)實(shí)施機(jī)動(dòng)狀態(tài)突變情況下提高濾波跟蹤的可靠性,能夠有效地避免濾波算法發(fā)散。
3.1 單目標(biāo)跟蹤的數(shù)字仿真實(shí)現(xiàn)
首先以雜波環(huán)境跟蹤獨(dú)立目標(biāo)的情況進(jìn)行分析,系統(tǒng)的狀態(tài)為目標(biāo)的兩維位置與速度,即:
其離散化的狀態(tài)方程為
其中qk-1為離散高斯過(guò)程噪聲。f1(Δt)、f2(Δt)描述目標(biāo)在X向和Y向速度的變化情況。
然后針對(duì)雜波環(huán)境進(jìn)行建模,可雜波測(cè)量值建模為視場(chǎng)范圍內(nèi)任意隨機(jī)值,由于是針對(duì)于單目標(biāo)跟蹤的問(wèn)題,因此數(shù)據(jù)關(guān)聯(lián)因子ck為0和1兩種狀態(tài)。且:
下面針對(duì)此問(wèn)題分別采用線性Kalman濾波及RBPF粒子濾波來(lái)仿真,采用粒子數(shù)目為10。從圖1可以看出,采用kalman濾波得到的目標(biāo)運(yùn)動(dòng)軌跡輸出完全不能夠跟蹤上目標(biāo)的真實(shí)運(yùn)動(dòng)軌跡,這是因?yàn)槟繕?biāo)的觀測(cè)模型中不止存在高斯噪聲,而是在整個(gè)視場(chǎng)內(nèi)存在均勻散步的雜波測(cè)量值,這樣導(dǎo)致Kalman濾波算法很快失效。
圖1 采用Kalman濾波的估計(jì)結(jié)果
圖2 ~圖4給出了采用RBPF粒子濾波的結(jié)果,從圖中可見(jiàn),粒子鋁箔可以較好的分辨出目標(biāo)運(yùn)動(dòng)軌跡及雜波,并通過(guò)數(shù)據(jù)關(guān)聯(lián)參數(shù)表示出來(lái)。
圖2 粒子濾波得到的目標(biāo)運(yùn)動(dòng)軌跡
圖3 粒子濾波得到的目標(biāo)運(yùn)動(dòng)軌跡及粒子散布情況
圖4 數(shù)據(jù)關(guān)聯(lián)參數(shù)ck
3.2 雙目標(biāo)跟蹤的數(shù)字仿真實(shí)現(xiàn)
下面對(duì)僅有方位角測(cè)量信息的雷達(dá)雙目標(biāo)跟蹤問(wèn)題進(jìn)行仿真驗(yàn)證,圖5為雷達(dá)測(cè)量的示意圖,此時(shí)目標(biāo)的動(dòng)態(tài)方程與上例中相同,但測(cè)量模型不同,此時(shí)測(cè)量量為角度值,使用兩個(gè)固定位置的傳感器對(duì)于兩個(gè)目標(biāo)進(jìn)行測(cè)量,測(cè)量方程如下:
其中xj,k,yj,k為目標(biāo)j的位置,,為第i個(gè)傳感器的位置,~N(0,σ2)為測(cè)量噪聲,此時(shí)測(cè)量方程為非線性形式,因此需采用EKF或UKF配合使用RBPF算法。
圖6給出了雷達(dá)的角度測(cè)量值隨時(shí)間的變化情況,從圖6中可以看出,針對(duì)兩個(gè)傳感器及兩個(gè)目標(biāo)可測(cè)量得到4組測(cè)量值,同時(shí)在視場(chǎng)范圍內(nèi)存在一定數(shù)量的雜波測(cè)量值。
圖5 雙目標(biāo)雷達(dá)測(cè)角示意圖
圖6 雷達(dá)角度測(cè)量值隨時(shí)間的變化關(guān)系
從圖7可見(jiàn),采用原始RBPF算法得到的目標(biāo)軌跡估值與真實(shí)值在飛行中段明顯存在一定的偏差,從粒子散布的變化情況看,在這一階段采用的粒子無(wú)法覆蓋真實(shí)軌跡造成其估值與真值逐漸偏離,且在偏離時(shí)刻明顯兩個(gè)目標(biāo)的測(cè)量值較為接近。可以通過(guò)增加粒子數(shù)目來(lái)解決此問(wèn)題,但這會(huì)大大增加算法的計(jì)算量。經(jīng)進(jìn)一步分析可知由于實(shí)時(shí)調(diào)用RBPF算法計(jì)算的有效粒子數(shù)目neff未必能夠反映目標(biāo)機(jī)動(dòng)情況下的運(yùn)動(dòng)軌跡,當(dāng)前權(quán)值較小的狀態(tài)未必不是后期的真實(shí)狀態(tài),重采樣導(dǎo)致粒子集中在當(dāng)前權(quán)值較大的粒子附近,對(duì)其他位置的粒子進(jìn)行舍棄。為此使用上文中介紹的改進(jìn)重采樣算法,綜合考慮各種不同域內(nèi)權(quán)重的粒子來(lái)確定后續(xù)的粒子分布,使得粒子的多樣性增加,仿真結(jié)果如圖8所示。
圖7 采用原始RBPF算法濾波得到的目標(biāo)估計(jì)軌跡
圖8 采用改進(jìn)重采樣算法RBPF得到的目標(biāo)估計(jì)軌跡
下面比較兩種濾波方法的估值與真值的差的均方根的變化情況,如圖9所示。
圖9 兩種算法濾波估值與真值的誤差均值比較
為解決僅有角度測(cè)量信息的雷達(dá)雙目標(biāo)跟蹤問(wèn)題,在此對(duì)Rao-Blackwellized粒子濾波算法進(jìn)行改進(jìn),為增加粒子的多樣性,解決濾波局部存在的不收斂問(wèn)題,將重采樣算法進(jìn)行改進(jìn),增加小權(quán)重粒子的比例,同時(shí)為獲得更高的濾波精度,采用交互多模型的方法對(duì)粒子的估值進(jìn)行預(yù)測(cè)與更新,通過(guò)算法更改及數(shù)字仿真驗(yàn)證可以看出,更改后濾波算法的收斂性更好且跟蹤精度更高。
[1]Kalman R E.A new Approach to Linear Filtering and Prediction Problems[J].Transactions of the ASME,Journal of Basic Engineering,1960,82(1):35-45.
[2]Sunahara Y.An Approximate Method of State Estimation for Nonlinear Dynamical Systems[J].Joint Automatic Control Conference,University of Colorado,1970,92(2):385-393.
[3]Julier S,Uhlman J.A New Method for the Nonlinear Transformation of Means and Covariances in Filters and Estimators[J].IEEE Transactions on Automatic Control,2000,45 (3):477-482.
[4]Oliver C,Simon JG,Eric M.An overview of existingmethods and recent advances in sequential Monte Carlo[J].Proceedings of the IEEE,2007,95(5):899-924.
[5]Gordon N,Salmond D.Novel approach to non-linear and non Gaussian Bayesian state estimation[J].Proceedings of Institute Electric Engineering,1993,140(2):107-113.
[6]Sarkka S,Vehtari A,Lampinen J.Rao-Blackwellized Particle Filter for Multiple Target Tracking[J].Information Fusion,2007,8(1):2-15.
(責(zé)任編輯周江川)
Target Track Based on Im proved Rao-Blackwellized Particle Filter Algorithm
ZHANGWan-li1,HE Jin-gang1,ZHAO Hong-mei2
(1.China Airborne Missile Academy,Luoyang 471009,China; 2.Luoyang Institute of Electro-Optical Equipment,AVIC,Luoyang 471009,China)
In radar signal processing field,moving target tracking is always the focus.And it involves the nonlinear filter problem which is the difficult point.In this paper,we focused on the radar target tracking problem based on the Rao-Blackwellized particle filter algorithm.To improve the convergence and the precision of the filter algorithm,resample algorithm in the RBPF algorithm is improved,which is validated by numerical simulation.The simulation result shows that RBPF algorithm is improved in every aspect.
particle filter;RBPF algorithm;radar target tracking;resample
:A
1006-0707(2014)07-0082-05
format:ZHANGWan-li,HE Jin-gang,ZHAO Hong-mei.Target Track Based on Improved Rao-Blackwellized Particle Filter Algorithm[J].Journal of Sichuan Ordnance,2014(7):82-86.
本文引用格式:張萬(wàn)里,何金剛,趙紅梅.改進(jìn)的Rao-Blackwellized粒子濾波算法在目標(biāo)跟蹤中的應(yīng)用[J].四川兵工學(xué)報(bào),2014(7):82-86.
10.11809/scbgxb2014.07.024
2014-01-27
張萬(wàn)里(1983—),男,工程師,主要從事導(dǎo)彈制導(dǎo)與控制、雷達(dá)信號(hào)處理研究。
TP277