陳 輝 魏鳳旗 韓崇昭
①(蘭州理工大學(xué)電氣工程與信息工程學(xué)院 蘭州 730050)
②(西安交通大學(xué)自動化科學(xué)與工程學(xué)院 西安 710049)
現(xiàn)代目標跟蹤系統(tǒng)[1-6]中,傳感器的智能性和可控性越來越高,科學(xué)制定最優(yōu)管理策略以控制傳感器合理運行,能夠很大程度上改善并優(yōu)化傳感器接收信息的質(zhì)量,從而顯著提升目標跟蹤系統(tǒng)的整體性能,這就是傳感器控制(亦稱為傳感器管理)的根本意義之所在。傳感器控制是為了滿足操作約束并完成相應(yīng)的操作目標,在一個靈活可調(diào)節(jié)的傳感器系統(tǒng)中進行相應(yīng)的自由度控制[7],其目的是在正確的時間將正確平臺上的可控傳感器引導(dǎo)至最優(yōu)的觀測狀態(tài),從而獲取最優(yōu)的量測過程[8,9]。然而,復(fù)雜的多目標跟蹤系統(tǒng)往往伴隨著目標的不確定性,同時還受傳感器檢測的不確定性以及雜波干擾等因素的影響,使得能有效決策最優(yōu)傳感器控制的方法研究極為困難。
近些年,基于有限集統(tǒng)計(FInite Set STatistics, FISST)理論[10-12]的多目標跟蹤方法因其更為科學(xué)的多目標建模方式而廣受關(guān)注。在FISST理論框架下更有利于對集群目標進行跟蹤估計,對于多目標跟蹤估計整體優(yōu)化的傳感器控制決策方案的制定是極其便利的。目前已經(jīng)產(chǎn)生了一些頗為有效的傳感器控制方法并應(yīng)用于目標跟蹤優(yōu)化,這些傳感器控制方法基本可分為兩大類:一種是基于信息驅(qū)動,此類方法通過多目標概率密度的信息增益來評估量測過程的優(yōu)劣,而信息增益可以由各類散度函數(shù)來量化(例如Kullback-Leible散度[13]、Cauchy-Schwarz散度[14,15]、Rényi散度[16]、巴氏距離[8]等),旨在控制傳感器獲得最大的信息增益。另一種是基于任務(wù)驅(qū)動,此類方法基于特定任務(wù)優(yōu)化而決策,通常在實際應(yīng)用環(huán)境下能夠發(fā)揮其重要作用,包括基于目標威脅評估[17,18]、基于目標勢估計方差[19]、基于狀態(tài)和勢估計誤差的后驗期望[20]、基于目標勢的后驗期望[21]等?;谌蝿?wù)驅(qū)動的傳感器控制的目標更為明確,直接針對多目標跟蹤系統(tǒng)的預(yù)期性能和特定要求。但是如何科學(xué)設(shè)計任務(wù)規(guī)劃準則,以增強濾波器在復(fù)雜環(huán)境下的多目標綜合多特征估計的穩(wěn)健性,顯然還值得深入研究。
隨著高精度傳感器不斷運用和被跟蹤目標的集群化發(fā)展,對多擴展目標跟蹤(Multiple Extended Targets Tracking, METT)[22-28]問題的深入研究已經(jīng)成為現(xiàn)代目標跟蹤領(lǐng)域的焦點。METT借助辨識度更高且更豐富的量測信息利用信息融合技術(shù)可獲得各目標更多的特征估計,例如可從目標觀測的稀疏點量測集中提取各目標的形狀輪廓信息,這對目標的深度識別具有極其重要的現(xiàn)實意義。但是,由于METT中每個目標對應(yīng)了多個量測,目標與量測之間的關(guān)聯(lián)關(guān)系更加模糊和不確定,為METT的實現(xiàn)過程帶來很大的挑戰(zhàn)。另外,METT中借助傳感器控制技術(shù)進行跟蹤優(yōu)化,需要在最優(yōu)決策中考慮更多的特征優(yōu)化(如形狀估計的優(yōu)化),這對科學(xué)制定傳感器控制的最優(yōu)任務(wù)準則提出了更為綜合的要求。
鑒于此,本文利用隨機矩陣(Random Matrix,RM)將擴展目標的形狀輪廓建模為橢圓,這能夠合理有效地描述擴展目標的大小和方向信息,將多擴展目標建模為多伯努利隨機集,通過控制多擴展目標多特征的后驗離差最小,使算法在優(yōu)化多擴展目標運動狀態(tài)估計的同時,也優(yōu)化了目標形狀的估計,最后采用伽馬高斯逆威沙特多伯努利(Gamma Gaussian Inverse Wishart Multi-Bernoulli,GGIW-MBer)濾波器實現(xiàn)本文提出的多擴展目標跟蹤中的傳感器控制策略。值得一提的是,本文所提出的基于廣義離差的優(yōu)化準則也可拓展在基于多特征距離的復(fù)雜優(yōu)化問題上。本文的主要貢獻為:給出了加權(quán)廣義最優(yōu)子模式分配(Weighted Generalized Optimal Sub-Pattern Assignment,WGOSPA)距離構(gòu)造多目標多特征估計的廣義離差,同時研究提出了多特征融合下的傳感器控制最優(yōu)決策方法,優(yōu)化了多擴展目標跟蹤系統(tǒng)的整體性能。本文所提傳感器控制方法的基本原理如圖1所示。
圖1 多擴展目標跟蹤中的傳感器控制基本原理圖
控制量測過程最優(yōu)是提高多擴展目標跟蹤精度的有效方法,因此傳感器控制問題即變?yōu)榭刂泼?或稱為控制方案)子集的決策問題??紤]基于隨機矩陣的多擴展目標跟蹤建模,傳感器控制決策必要的相關(guān)要素包括以下內(nèi)容:
(1) 后驗密度fk-1+H(ξk-1+H|Z1:k-1+H);
(2) 可實現(xiàn)傳感器動作的控制命令集Uk;
(3) 傳感器控制評價函數(shù)V(u)。
首先要以合理的方式建立傳感器可控集合,在每個時刻傳感器沿Nθ個方向中的某一個方向步進一到兩個單位的距離,或者保持靜止不動??紤]到0<Nθ<∞,且要保證傳感器能夠快速精準地運動到最佳觀測點,因此取Nθ=8,如圖2所示。圖中,五角星代表當前時刻傳感器的位置,其他點(含五角星)均代表下一時刻傳感器可能的位置。
圖2 傳感器動作空間示意圖
H增大會導(dǎo)致遞推過程的不確定性,本文選用經(jīng)典的“近視”策略(H=1)。在傳感器動作空間中,每個方案u都有一個對應(yīng)的評價函數(shù)V(u),它能夠評估傳感器控制方案的優(yōu)劣。以下研究構(gòu)造多擴展目標后驗密度在其統(tǒng)計平均周圍的廣義離差作為評價函數(shù),令其表達式為
其中,D(·)表示多擴展目標狀態(tài)的后驗密度在其統(tǒng)計平均周圍的廣義離差,它能反映綜合多特征估計信息的整體質(zhì)量。
由式(7)可以看出,評價函數(shù)是傳感器動作后,關(guān)于未來量測信息的函數(shù),而這組量測信息顯然不可預(yù)知,通用的解決方法是為每個可能的傳感器動作生成一組偽量測,即預(yù)測理想量測集(Prediction Ideal Measurement Set, PIMS)[16,29]。若用u?k表示最優(yōu)的傳感器控制方案,則最終用式(8)確定該方案
由于需要考慮多擴展目標綜合多特征(運動狀態(tài)、形狀等)估計的聯(lián)合優(yōu)化,制定合適的評價函數(shù)是多擴展目標跟蹤傳感器控制的核心問題。本文擬研究構(gòu)造多擴展目標多特征估計在其后驗統(tǒng)計均值周圍的廣義離差來評估傳感器控制。為此,本文將給出一種 WGOSPA距離,該指標能夠以合理的方式懲罰檢測到的目標定位錯誤以及由于遺漏或假目標而產(chǎn)生的錯誤,鼓勵濾波器盡可能少地產(chǎn)生估計錯誤和遺漏,同時,該指標能夠綜合多擴展目標的估計特征,以在多特征融合的條件下綜合評判多擴展目標跟蹤濾波性能。
(1) 廣義最優(yōu)子模式分配距離。令c >0,0<α ≤2 ,1≤p <∞。設(shè)d(x,y) 表 示x,y ∈RN的某種距離度量,d(c)(x,y)=min(d(x,y),c)。集合{1,2,...,n},n ∈N 的 所有排列方式記為Πn,任意元素χ∈Πn代表(χ(1),χ(2),...,χ(n))。 設(shè)X與Y為 RN的有限子集。若|X|≤|Y|, 則X與Y的廣義最優(yōu)子模式分配距離[30]為
值得注意的是,由于式(9)是嚴格意義上的距離(證明過程見文獻[30]),而式(10)也是嚴格意義上的距離,因此WGOSPA距離亦符合嚴格意義上的距離的定義。
利用序貫蒙特卡羅(Sequential Monte Carlo,SMC)方法計算式(18)的數(shù)值為
由多伯努利隨機集的貝葉斯濾波可以得到如下的GGIW-MBer濾波過程:
將GGIW-MBer預(yù)測過程和更新過程應(yīng)用于算法1中,即可實現(xiàn)本文所提的傳感器控制,如算法2和算法3所示。
算法1 多擴展目標跟蹤基于多特征優(yōu)化的傳感器控制算法
算法2 GGIW-MBer預(yù)測過程
算法3 GGIW-MBer更新過程
為了測試本文算法對密集多擴展目標跟蹤優(yōu)化效果,在監(jiān)控區(qū)域內(nèi)設(shè)有10個橢圓形擴展目標,建立動態(tài)跟蹤環(huán)境,驗證本文提出方法的有效性。實驗中,GOSPA距離的參數(shù)設(shè)置為p=1,c=2,α=2。W G O S P A 距 離 的 參 數(shù) 設(shè) 置 為cw=2,cγ=5,cx=10 ,cX=10,wγ=0.1,wx=0.7,wX=0.2。采樣間隔Ts=1 s ,遺忘因子ηk=8,雜波平均數(shù)設(shè)置為λFA=5,目標的檢測概率和存活概率分別為pD=0.99 和pS=0.99,GGIW分量的最大數(shù)量為Jmax=100 , 時間衰減常數(shù)τ=5 s。橢圓擴展目標的長半軸和短半軸的長度分別設(shè)定為A=6 m,a=3 m,方向角設(shè)為45°。每個采樣周期內(nèi)的量測個數(shù)服從參數(shù)為λ=15的泊松分布。目標的運動模型以及量測模型如式(2)和式(6)所示,其中,
本節(jié)將選用不同的控制方案與本文提出的控制方法進行比較。其中,方案1是基于柯西-施瓦茨散度[14]的傳感器控制;方案2為本文提出的傳感器控制方案。目標的初始參數(shù)見表1,真實軌跡見圖3。
圖3 目標的實際軌跡
表1 多擴展目標初始參數(shù)
圖4記錄了本文所提優(yōu)化控制方案的傳感器運動軌跡。從圖中解讀到,傳感器自動按照多擴展目標多特征的后驗密度廣義離差最小化動態(tài)調(diào)節(jié)自身位置,使其在每個采樣時刻都能獲取最優(yōu)量測過程。也注意到,目標個數(shù)發(fā)生突變的時刻,傳感器的坐標也會產(chǎn)生明顯的變化趨勢,以應(yīng)對由于多伯努利密度的瞬變帶來的廣義離差的瞬變,使傳感器在最短時間內(nèi)到達最優(yōu)觀測位置。
圖4 方案2中的傳感器運動軌跡
圖5記錄了100次獨立的蒙特卡羅(Monte Carlo,MC)仿真實驗中傳感器經(jīng)過的所有位置,可以看出,在相同的評價準則下由于受到環(huán)境隨機因素的影響,每次MC仿真實驗中的傳感器運動軌跡存在一定差異。但是從圖中還是可以反映出傳感器優(yōu)化運動所在的大致活躍區(qū)域,反映了傳感器在多擴展目標跟蹤系統(tǒng)中的最優(yōu)觀測軌跡的運動趨勢。
圖5 MC實驗中方案2傳感器軌跡控制圖
圖6為100次獨立的MC仿真實驗中多擴展目標質(zhì)心位置估計的GOSPA距離統(tǒng)計,表2為各方案目標質(zhì)心位置估計GOSPA距離的統(tǒng)計均值,綜合圖表可以分析出,本文方案對多擴展目標質(zhì)心位置的估計效果是要優(yōu)于方案1。
表2 目標質(zhì)心估計的GOSPA距離統(tǒng)計均值(m)
圖6 目標質(zhì)心位置估計GOSPA距離統(tǒng)計
為了比較清晰地對多目標形狀輪廓估計效果進行比對,在圖7呈現(xiàn)擴展目標跟蹤估計的放大效果??梢苑治龅贸?,本文所提方法對目標形狀的估計效果更加接近于實際,直觀地體現(xiàn)出所提方法更好地優(yōu)化了對目標擴展狀態(tài)的估計。
圖7 目標跟蹤軌跡圖
擴展狀態(tài)估計效果的優(yōu)劣可由橢圓長短軸估計誤差的大小來評估。鑒于此,統(tǒng)計得到MC實驗中長短軸估計信息的GOSPA距離如圖8,而表3是相應(yīng)的統(tǒng)計平均值,由圖表聯(lián)合分析可得,本文方案對多擴展目標綜合多特征估計的優(yōu)化效果更優(yōu)。
圖8 橢圓長短軸GOSPA距離統(tǒng)計
圖9顯示了MC仿真實驗中多擴展目標勢(即目標的個數(shù))估計的統(tǒng)計效果,可以看出,所有傳感器控制方案對目標勢的估計差別并不大,由于GOSPA距離是綜合評價指標(聯(lián)合評價目標勢和目標狀態(tài)估計),結(jié)合前述各GOSPA距離統(tǒng)計的效果圖,也突顯了本文所提算法的優(yōu)化效果著重體現(xiàn)在多擴展目標的多特征估計上。
圖9 多擴展目標跟蹤的勢估計
本文的主要工作和創(chuàng)新點是利用基于多特征距離廣義離差最小化的傳感器控制方法提出了一種有效的多擴展目標跟蹤優(yōu)化算法,使其對多擴展目標運動狀態(tài)和形狀的估計得到明顯優(yōu)化,通過仿真實驗可知,各項跟蹤性能指標均優(yōu)于其他傳感器控制方案,有效提升了多擴展目標跟蹤系統(tǒng)的性能。所提算法的意義在于實現(xiàn)了多擴展目標的運動狀態(tài)估計與擴展狀態(tài)估計的聯(lián)合優(yōu)化,實現(xiàn)了多特征共同決策下的傳感器最優(yōu)控制技術(shù),這對于精度要求更高的現(xiàn)代目標跟蹤系統(tǒng)來說有著重要的理論價值。