孟令同 易 偉 孔令講
(電子科技大學(xué)信息與通信學(xué)院, 四川成都 611731)
近年來,隨著動平臺分布式雷達(dá)系統(tǒng)如無人機(jī)(Unmanned Aerial Vehicle, UAV),在區(qū)域監(jiān)視、目標(biāo)跟蹤、定位、物流、搜索和緊急救援等方面的廣泛應(yīng)用,研究動平臺分布式雷達(dá)系統(tǒng)協(xié)同探測已經(jīng)引起了廣泛關(guān)注[1]。動平臺分布式雷達(dá)系統(tǒng)在執(zhí)行任務(wù)時可以利用空間分集從不同角度對目標(biāo)進(jìn)行觀測,并在某種準(zhǔn)則(檢測概率、定位精度等)來自適應(yīng)地調(diào)整動平臺的位置,以提高系統(tǒng)對目標(biāo)的探測、跟蹤和識別的能力[2]。
在進(jìn)行探測任務(wù)時,如何利用動平臺分布式雷達(dá)實現(xiàn)對目標(biāo)的快速實時高精度探測成為了一個亟待解決的重要問題。新世紀(jì)以來,大量的研究機(jī)構(gòu)一直致力于解決動平臺分布式雷達(dá)的路徑優(yōu)化問題[3-15]??偟膩碚f,動平臺分布式雷達(dá)路徑優(yōu)化通常被建模為數(shù)學(xué)優(yōu)化問題[4-5],決策過程一般通過最小化代價函數(shù)(最短路徑、均方誤差等)或者最大化與量測相關(guān)的費歇爾信息矩陣(Fisher Information Matrix, FIM)也即克拉美羅下界的逆(Cramer-Rao Lower Bound, CRLB)來控制系統(tǒng)的輸入[6-7]。針對地面目標(biāo)的跟蹤,一種基于信息理論的方法在[8]中被提出來優(yōu)化動平臺的路徑。文獻(xiàn)[9]以后驗克拉美羅下界(posterior Cramer-Rao lower bound, PCRLB)為目標(biāo)函數(shù), 針對測向傳感器模型, 建立了動平臺分布式雷達(dá)最優(yōu)協(xié)同觀測模型,并提出了一種金字塔式搜索方法。文獻(xiàn)[10]以目標(biāo)位置協(xié)方差矩陣行列式為目標(biāo)函數(shù),采用梯度下降法對基于測向測距組合傳感器的多平臺觀測航跡進(jìn)行設(shè)計。文獻(xiàn)[11]研究了基于目標(biāo)狀態(tài)方差的動平臺分布式雷達(dá)路徑優(yōu)化問題,并且分析了目標(biāo)和跟蹤無人機(jī)的定位誤差的上界和下界。在文獻(xiàn)[13]中,針對靜止目標(biāo)研究了基于波達(dá)方向和到達(dá)時間差量測模型的動平臺路徑優(yōu)化算法,目標(biāo)函數(shù)是FIM(克拉美羅界CRLB的逆),并提出了一種貪婪算法從而提高定位性能。最近,文獻(xiàn)[15]研究協(xié)同跟蹤問題時,利用滾動時域控制的方法用來預(yù)測FIM,采用分布式求解框架優(yōu)化動平臺的路徑。國內(nèi)對于動平臺分布式雷達(dá)系統(tǒng)協(xié)同路徑優(yōu)化研究的較少,文獻(xiàn)[17]基于角度量測研究了無人機(jī)編隊的隊形對多機(jī)協(xié)同定位影響,但沒有研究無人機(jī)的路徑規(guī)劃方法。文獻(xiàn)[18]研究了在兩個動平臺的路徑確定的條件下,用于運動多平臺無源跟蹤的濾波方法。需要指出的是上述算法的代價函數(shù)大都無法用于多個動平臺對目標(biāo)的快速實時高精度跟蹤,而且對有約束的多動平臺分布式雷達(dá)路徑優(yōu)化問題研究的很少。此外,以上很多算法基本都是基于遍歷的方法實現(xiàn)的,因而均具有較高的計算復(fù)雜度,從而大大限制了動平臺分布式雷達(dá)的實際應(yīng)用。因此,研究一種實時高效的用于目標(biāo)跟蹤的動平臺分布式雷達(dá)路徑優(yōu)化方法具有重要的實際應(yīng)用價值。
本文著眼于動平臺分布式雷達(dá)協(xié)同跟蹤靜止或移動目標(biāo)的路徑優(yōu)化問題,基于角度量測導(dǎo)出了閉合形式的費歇爾信息矩陣,以D最優(yōu)準(zhǔn)則建立了包含目標(biāo)和動平臺位置信息的代價函數(shù),提出了一種基于最速下降法的動平臺分布式雷達(dá)路徑優(yōu)化算法,從而實現(xiàn)動平臺分布式雷達(dá)快速高效的跟蹤目標(biāo)。此外,本文還研究了動平臺在威脅區(qū)域和動平臺固有的物理限制下有約束的動平臺分布式雷達(dá)路徑優(yōu)化問題,利用懲罰函數(shù)來修正代價函數(shù)來規(guī)避障礙,并應(yīng)用物理約束來限制動平臺的轉(zhuǎn)彎角。最后通過仿真實驗驗證了所提方法的有效性。
圖1 動平臺分布式雷達(dá)系統(tǒng)協(xié)同跟蹤目標(biāo)示意圖Fig.1 Distributed radar system with moving platform for cooperative target tracking
xk+1=Fxk+Γvk
(1)
(2)
Ts表示采樣周期,系統(tǒng)過程噪聲輸入矩陣為
(3)
系統(tǒng)噪聲vk假設(shè)是零均值的高斯白噪聲,即vk~N(0,Qk),Qk是過程噪聲vk的協(xié)方差矩陣。
對于純角度跟蹤,動平臺分布式雷達(dá)系統(tǒng)對目標(biāo)的量測方程為
Zk=h(xk)+wk
(4)
其中,Zk代表n個動平臺分布式雷達(dá)在k時刻的角度量測,上式中的量測函數(shù)可表示為
(5)
wk是零均值的高斯白噪聲,即wk~N(0,Rk),且Rk滿足
(6)
σi是第i架動平臺分布式雷達(dá)的角度量測噪聲的標(biāo)準(zhǔn)差,假設(shè)不同動平臺分布式雷達(dá)的量測噪聲相互獨立。
(7)
估計量方差的CRLB定義為費歇爾信息矩陣G(xk)(FIM)的逆,即
(8)
上式中的不等式意味著CRLB(xk)-G-1(xk)是半正定矩陣。對于量測的似然函數(shù),費歇爾信息矩陣[20]G(xk)表達(dá)式為
G(xk)Ε[(lnp(α|x))(lnp(α|x))T]x=xk
(9)
上式中的α表示角度參數(shù)估計值,假設(shè)參數(shù)的概率密度函數(shù)p(α|x)服從高斯分布,FIM的計算可以很容易得到
(10)
其中,Rk是量測噪聲的協(xié)方差矩陣,J是雅克比矩陣,即
(11)
假設(shè)各動平臺分布式雷達(dá)以相同的飛行高度飛行,那么在二維笛卡爾坐標(biāo)系中,上式可進(jìn)一步表示為
(12)
由式(10~12),可得G(xk)是2×2的矩陣,即
(13)
其中
(14)
(15)
(16)
一個恰當(dāng)?shù)拇鷥r函數(shù)以及優(yōu)化準(zhǔn)則對于路徑優(yōu)化至關(guān)重要,為了構(gòu)建一個恰當(dāng)且便于計算的代價函數(shù),本文利用FIM的行列式作為代價函數(shù)。在優(yōu)化理論中,這種優(yōu)化準(zhǔn)則被稱為D最優(yōu)準(zhǔn)則(D-optimality Criterion)。參數(shù)的D優(yōu)化準(zhǔn)則的數(shù)學(xué)含義是使由CRLB產(chǎn)生的不確定性橢圓體的體積最小化[11]。D最優(yōu)準(zhǔn)則被廣泛應(yīng)用于路徑優(yōu)化問題[20],并且它相較于E最優(yōu)更具優(yōu)勢,因為它將FIM的每一個元素都考慮進(jìn)去,而E最優(yōu)僅考慮了FIM的主對角線的元素[2]。本文采用D最優(yōu)準(zhǔn)則得到的代價函數(shù)如下式所示:
(17)
xk|k-1=Fxk-1|k-1
(18)
Pk|k-1=FPk-1|k-1FT+Γk|k-1QkΓTk|k-1
(19)
(20)
xk|k=xk|k-1+Kk(Zk-h(xk|k-1))
(21)
Pk|k=(I-KkHk)Pk|k-1
(22)
其中,xk|k-1是濾波器在k時刻的一步狀態(tài)預(yù)測,Pk|k-1是濾波器在k時刻的一步預(yù)測誤差的協(xié)方差矩陣,xk|k是在k時刻的卡爾曼濾波狀態(tài)估計,Pk|k是在k時刻的卡爾曼濾波狀態(tài)估計誤差協(xié)方差矩陣,Kk是卡爾曼增益,Hk是非線性量測h(xk)的雅克比矩陣。
分布式融合是每個傳感器對目標(biāo)狀態(tài)估計及其協(xié)方差的進(jìn)行交換和組合,以產(chǎn)生最終的全局估計。使用以下簡單但通用的融合關(guān)系來組合量測[19]:
(23)
(24)
在任務(wù)優(yōu)化時,由于先驗知識,可能已經(jīng)確定了附近的某些威脅,威脅位置的先驗信息可用于約束代價函數(shù)。增加約束的目的是為了是使動平臺遠(yuǎn)離已識別的威脅。本文通過修正代價函數(shù)使動平臺避免威脅,修正的代價函數(shù)為:
(25)
由于動平臺具有固有的物理限制,如速度、加速度和偏轉(zhuǎn)角等,因此動平臺在移動過程中不能突然改變方向,動平臺只能以小于或等于預(yù)定最大轉(zhuǎn)向角φmax的角度移動。由于動平臺固有的物理約束且優(yōu)先于其他約束,因此最后解決動平臺的偏轉(zhuǎn)方向問題。動平臺的偏轉(zhuǎn)角約束可以表示為
(26)
在實際電子戰(zhàn)環(huán)境中,由于先驗知識,動平臺分布式雷達(dá)需要避免一些威脅,且動平臺具有固有的物理限制,因此,需要解決帶有威脅和動平臺物理約束的優(yōu)化問題。路徑優(yōu)化的目標(biāo)是確定移動傳感器的軌跡以最大化跟蹤性能。本文提出的代價函數(shù)是采用D最優(yōu)下的費歇爾信息矩陣,于是最終建立的帶有約束的路徑優(yōu)化問題的數(shù)學(xué)模型為
(27)
費歇爾信息矩陣可以較好的評估動平臺分布式雷達(dá)對目標(biāo)的跟蹤性能,D最優(yōu)準(zhǔn)則又能較好的利用費歇爾信息矩陣的全部信息,因此本文提出的D最優(yōu)準(zhǔn)則下基于費歇爾信息矩陣的代價函數(shù)可以很好的用于動平臺分布式雷達(dá)路徑優(yōu)化。修正的代價函數(shù)可以用于動平臺分布式雷達(dá)對已知威脅的規(guī)避,動平臺偏轉(zhuǎn)角的約束可以讓動平臺的飛行路徑光滑,利于動平臺的實際飛行。最終建立的帶有約束的數(shù)學(xué)優(yōu)化問題可以很好的反應(yīng)動平臺分布式雷達(dá)協(xié)同跟蹤目標(biāo)的實際場景。由于本文在上節(jié)推導(dǎo)出了費歇爾信息矩陣的閉式形式,因此即使是修正后的代價函數(shù)也不是特別復(fù)雜,于是提出利用梯度下降法求解該優(yōu)化問題。
在本節(jié)中,為了解決動平臺分布式雷達(dá)系統(tǒng)路徑優(yōu)化問題,提出了一種基于最速下降的高效動平臺分布式雷達(dá)路徑優(yōu)化方法。圖2是基于最速下降[17]的動平臺分布式雷達(dá)路徑優(yōu)化算法框架。梯度控制是該算法框架的核心,它包含代價函數(shù)的梯度計算。
ξk+1=ξk+uk
(28)
其中,uk是包含動平臺移動步長和移動方向的控制輸入。隨著動平臺的數(shù)目增加,代價函數(shù)的計算將復(fù)雜,如何快速的得到各個動平臺分布式雷達(dá)的控制輸入將變得的至關(guān)重要。為了解決這一難點,本文提出利用最速下降法來求解最優(yōu)的控制輸入。實際上,動平臺以梯度的方向移動是使費歇爾信息矩陣的行列式ΨZ增長最快的方向,也就是最大化代價函數(shù)的方向,于是更多的信息被利用,從而提高協(xié)同跟蹤精度。動平臺分布式雷達(dá)下一時刻位置的更新公式如下:
ξk+1=ξk+εkΨZ(ξk)
(29)
其中εk是動平臺分布式雷達(dá)的移動步長。動平臺分布式雷達(dá)下一時刻的移動方向為
(30)
(31)
利用公式(28~31),式(28)可改寫為
(32)
在本文所提的方法中,動平臺分布式雷達(dá)首先將獲得的量測進(jìn)行局部濾波得到目標(biāo)的局部狀態(tài)估計,然后分布式融合中心將動平臺分布式雷達(dá)的目標(biāo)狀態(tài)估計融合得到更加準(zhǔn)確的全局目標(biāo)狀態(tài)估計。之后計算代價函數(shù),然后采用梯度法計算動平臺的最優(yōu)移動方向和移動步長。最后,動平臺移動至下一點以獲取新的量測,如此循環(huán)迭代更新得到動平臺的路徑。
圖2 基于最速下降的動平臺分布式雷達(dá)路徑優(yōu)化算法框架Fig.2 Flow chart of efficient path planning algorithm based on steepest descent for cooperative target tracking
圖3 兩種方法跟蹤靜止目標(biāo)得到的動平臺移動路徑(五角星代表靜止的目標(biāo)位置,圓代表動平臺最終位置)Fig.3 The paths of distributed radar system with moving platform for tracking a fixed target obtained by the proposed method and grid based search method (The target location and final sensors locations are marked with pink star, green circle, red circle and blue circle, respectively)
圖4 所提方法得到的動平臺跟蹤移動目標(biāo)路徑Fig.4 The paths of distributed radar system with moving platform track a moving target obtained by the proposed method
圖5是所提出的方法與柵格搜索法在代價函數(shù)值、均方誤差和運行時間方面的性能比較。圖5(a)表明所提方法可以達(dá)到與柵格搜索法基本相當(dāng)?shù)拇鷥r函數(shù)值,說明了本文所推導(dǎo)的代價函數(shù)的精確性和有效性。代價函數(shù)隨著時間逐漸上升,表示動平臺分布式雷達(dá)所搜集的信息逐漸增加,跟蹤性能也越好。圖5(b)描述了所提出的算法求解每幀的優(yōu)化問題需要大約0.45 ms,而柵格搜索法則需要55 ms。對比圖5(b)和圖5(c)可以發(fā)現(xiàn)所提方法得到與柵格搜索法幾乎沒有差異的均方誤差,但柵格搜索法所用時間卻是所提算法的幾十倍。仿真結(jié)果表明所推導(dǎo)的代價函數(shù)的有效性,此外,所提出的動平臺路徑優(yōu)化方法可以快速實時的以較為平滑的路徑跟蹤靜止和移動目標(biāo),相比于柵格搜索法,所提方法在計算復(fù)雜度上具有明顯優(yōu)勢。
圖5 兩種方法的性能分析Fig.5 The performance comparison of the two methods versus time
本文討論了動平臺分布式雷達(dá)協(xié)同跟蹤目標(biāo)的路徑優(yōu)化問題,提出了一種快速實時的高精度跟蹤目標(biāo)的動平臺路徑優(yōu)化算法。首先,本文導(dǎo)出了閉合形式的費歇爾信息矩陣,之后利用D最優(yōu)準(zhǔn)則建立包含目標(biāo)和動平臺位置信息的代價函數(shù),然后提出了一種基于最速下降的方法來解決該優(yōu)化問題。另外,本文還研究了有約束的動平臺路徑優(yōu)化問題,利用懲罰函數(shù)來修正代價函數(shù)來規(guī)避障礙,并應(yīng)用物理約束來限制動平臺的轉(zhuǎn)彎角。最后,通過仿真實驗證明了本文所提算法的優(yōu)越性。數(shù)值仿真結(jié)果驗證了所推導(dǎo)的閉式代價函數(shù)的精確性和有效性,且所提出的動平臺分布式雷達(dá)路徑優(yōu)化方法可以快速實時的以較為平滑的路徑跟蹤靜止和移動目標(biāo);此外,相比于柵格搜索法,所提方法在計算復(fù)雜度上具有明顯優(yōu)勢。