權(quán)宏偉,彭冬亮,薛安克
(1.華東理工大學(xué)信息科學(xué)與工程學(xué)院,上海 200237;2.杭州電子科技大學(xué)信息與控制研究所,浙江杭州 310037)
純方位角定位與跟蹤是信號(hào)檢測(cè)及濾波理論領(lǐng)域內(nèi)一類較難解決的問(wèn)題[1-5]。實(shí)際觀測(cè)過(guò)程中,目標(biāo)定位精度不僅受隨機(jī)觀測(cè)噪聲的影響,而且也與觀測(cè)平臺(tái)的運(yùn)動(dòng)軌跡有關(guān)[6]。為提高目標(biāo)的定位精度,通常要求觀測(cè)平臺(tái)沿某條最優(yōu)軌跡運(yùn)動(dòng),以保證最后得到的關(guān)于目標(biāo)狀態(tài)的估計(jì)量具有最小的估計(jì)誤差。觀測(cè)平臺(tái)最優(yōu)軌跡設(shè)計(jì)是指選取適當(dāng)?shù)南到y(tǒng)優(yōu)化性能指標(biāo),使得在該觀測(cè)軌跡下得到目標(biāo)定位精度最高。本文研究的即是如何設(shè)計(jì)最優(yōu)觀測(cè)平臺(tái)軌跡的問(wèn)題。
目前,國(guó)內(nèi)外大多數(shù)學(xué)者都使用Fisher信息矩陣(FIM)作為軌跡優(yōu)化的性能指標(biāo),但在具體算法上對(duì)FIM的處理不同。Andrew提出了信息論方法,通過(guò)最大化觀測(cè)量序列的互信息來(lái)求取最優(yōu)觀測(cè)路徑。這種方法實(shí)質(zhì)上等同于最大化FIM的行列式[7]。Passerieux引入信息率的概念,給出了目標(biāo)在勻速直線運(yùn)動(dòng)時(shí)的最優(yōu)觀測(cè)平臺(tái)軌跡[8]。上述方法在求取最優(yōu)觀測(cè)軌跡時(shí),都加入了一定的限制性條件,如限定觀測(cè)次數(shù)及觀測(cè)平臺(tái)終止?fàn)顟B(tài)等。同時(shí),將離散的觀測(cè)位置點(diǎn)處理成連續(xù)的觀測(cè)軌跡曲線,使得算法求取的觀測(cè)軌跡可能只具有局部最優(yōu)性。
本文提出了一種實(shí)踐上易于實(shí)現(xiàn)的最優(yōu)觀測(cè)平臺(tái)軌跡算法,即單步最優(yōu)觀測(cè)軌跡算法。與文獻(xiàn)[8]的方法類似,單步最優(yōu)觀測(cè)軌跡算法也以Fisher信息矩陣作為系統(tǒng)的觀測(cè)性能指標(biāo)??紤]到各次觀測(cè)相互獨(dú)立的條件下,系統(tǒng)總的Fisher信息矩陣等于單次觀測(cè)的Fisher信息矩陣之和[9],單步最優(yōu)觀測(cè)軌跡算法實(shí)現(xiàn)了從觀測(cè)平臺(tái)初始觀測(cè)位置開始,在后續(xù)每一時(shí)刻的觀測(cè)位置上達(dá)到目標(biāo)的觀測(cè)性能最優(yōu)。
選取直角坐標(biāo)系為系統(tǒng)的參考坐標(biāo)系。設(shè)目標(biāo)與觀測(cè)平臺(tái)運(yùn)動(dòng)軌跡位于同一坐標(biāo)平面內(nèi)。觀測(cè)平臺(tái)在k時(shí)刻的位置坐標(biāo)用狀態(tài)向量[Sx(k),Sy(k)]T表示。平臺(tái)從當(dāng)前觀測(cè)點(diǎn)運(yùn)動(dòng)到下一個(gè)觀測(cè)點(diǎn)的方向變量用u(k)表示。從而平臺(tái)在k+1時(shí)刻的位置坐標(biāo)總可以用k時(shí)刻的位置坐標(biāo)與方向變量u(k)表示。假定觀測(cè)平臺(tái)從當(dāng)前觀測(cè)位置以常速率V經(jīng)過(guò)時(shí)間T運(yùn)動(dòng)到下一個(gè)觀測(cè)位置,平臺(tái)的運(yùn)動(dòng)方程為:
觀測(cè)平臺(tái)初始位置已知的條件下,根據(jù)式(1)、式(2),平臺(tái)在任一時(shí)刻的位置都可以表示成控制變量序列{u(1),u(2),…,u(k)}的函數(shù)。第k次觀測(cè)的目標(biāo)與觀測(cè)平臺(tái)相對(duì)位置如圖1所示。
圖1 k時(shí)刻的目標(biāo)與觀測(cè)平臺(tái)相對(duì)位置Fig.1 Relative location of target and observer at time k
設(shè)目標(biāo)的位置狀態(tài)向量為 η=[Ox,Oy]T。目標(biāo)的觀測(cè)方程為:
式中:
β(k)是k時(shí)刻目標(biāo)相對(duì)于觀測(cè)平臺(tái)的真實(shí)方位角(以正北為參考方向);ω(k)為隨機(jī)高斯觀測(cè)噪聲,方差為;Z(k)表示實(shí)際測(cè)量角度。
對(duì)于適當(dāng)?shù)挠^測(cè)噪聲,在觀測(cè)平臺(tái)正確機(jī)動(dòng)的情況下,可以得到關(guān)于目標(biāo)狀態(tài)參量的無(wú)偏估計(jì)量,該估計(jì)量的協(xié)方差矩陣能夠達(dá)到Cramer-Rao下限,它等于Fisher信息矩陣的逆。就靜止目標(biāo)而言,N次觀測(cè)后目標(biāo)狀態(tài)參量的Fisher信息矩陣為[9]:
符號(hào)E(?)表示求數(shù)學(xué)期望。進(jìn)一步計(jì)算可得:
式中:
同理,可求得單次觀測(cè)的Fisher信息矩陣。第k次觀測(cè)的Fisher信息矩陣為:
比較式(7)與式(11),顯然有:
選取目標(biāo)狀態(tài)參量的Fisher信息矩陣為系統(tǒng)的觀測(cè)性能指標(biāo)。以第一步控制變量的確定為例來(lái)說(shuō)明單步最優(yōu)觀測(cè)軌跡算法。根據(jù)1.1節(jié)觀測(cè)平臺(tái)在初始位置狀態(tài)已知的假設(shè),由式(7)得到該觀測(cè)位置上的Fisher信息矩陣 I(η;1)。由式(1)、式(2)可知,觀測(cè)平臺(tái)在第2個(gè)觀測(cè)點(diǎn)的狀態(tài)[Sx(2),Sy(2)]T可以表示成控制變量u(1)的函數(shù)。代入式(11)得第2個(gè)觀測(cè)點(diǎn)的Fisher信息矩陣I(η;2)。根據(jù)公式(12),當(dāng)前系統(tǒng)的Fisher信息矩陣為:
因?yàn)镕isher信息矩陣是半正定的,根據(jù)矩陣分析中的知識(shí)可以得到以下結(jié)論:Fisher信息矩陣的逆矩陣即誤差協(xié)方差陣的二次型定義了一個(gè)超橢圓,它的n個(gè)特征值代表超橢圓的n個(gè)半軸。誤差協(xié)方差矩陣P的1-σ域由下式表示[10]:
根據(jù)Fisher信息矩陣I與誤差協(xié)方差矩陣P的關(guān)系,上式又可寫為:
由上式可以看出,1-σ域隨信息矩陣行列式的值增大而變小,這也意味著系統(tǒng)關(guān)于目標(biāo)的觀測(cè)性能越好。對(duì)式(13)兩邊取行列式:
Det(?)表示求矩陣的行列式。上式右端為系統(tǒng)的性能指標(biāo),令:
顯然J2是控制量u(1)的函數(shù),即。最優(yōu)控制量是使得系統(tǒng)當(dāng)前性能指標(biāo)J 2最大的控制量:
由上式求得最優(yōu)控制量^u(1),將^u(1)代入式(1)、式(2),得到第2個(gè)時(shí)刻的最優(yōu)觀測(cè)位置坐標(biāo)及相應(yīng)觀測(cè)點(diǎn)上的Fisher信息矩陣。迭代上述算法,可順序求得第k個(gè)時(shí)刻的最優(yōu)觀測(cè)平臺(tái)位置坐標(biāo)。這k個(gè)有序的觀測(cè)點(diǎn)位置坐標(biāo)構(gòu)成了最優(yōu)觀測(cè)平臺(tái)軌跡。單步最優(yōu)軌跡算法流程如圖2所示。
圖2 單步最優(yōu)軌跡算法流程圖Fig.2 Flow chart of single-step optimal trajectory algorithm
單步最優(yōu)軌跡算法是一個(gè)迭代求解觀測(cè)平臺(tái)最優(yōu)運(yùn)動(dòng)軌跡的算法。每進(jìn)行一次迭代,可求得觀測(cè)平臺(tái)的下一個(gè)最優(yōu)觀測(cè)位置點(diǎn)。理論上,該算法不受終止條件的限制,在求解最優(yōu)軌跡的過(guò)程中,一般把觀測(cè)平臺(tái)接近目標(biāo)位置作為算法的結(jié)束條件,當(dāng)然,也可以通過(guò)設(shè)定觀測(cè)次數(shù)來(lái)結(jié)束算法。
算法采用Matlab仿真平臺(tái)進(jìn)行仿真。取目標(biāo)的實(shí)際位置為(1 200 m,1 200 m)。觀測(cè)平臺(tái)初始位置位于坐標(biāo)原點(diǎn),速率V=5 m/s,觀測(cè)周期T=1 s。單步最優(yōu)觀測(cè)平臺(tái)軌跡如圖3所示。
由圖3可見,采用單步最優(yōu)觀測(cè)軌跡算法得到的軌跡有兩條。這是由于在第一個(gè)觀測(cè)點(diǎn)上存在兩個(gè)最優(yōu)控制量^u(1)的緣故,這可由圖4進(jìn)一步說(shuō)明。圖4給出了性能指標(biāo)J 2[u(1)]與控制變量u(1)之間的關(guān)系。
從圖4中不難看出,使得性能指標(biāo)J 2[u(1)]達(dá)到最大值的控制變量u(1)有兩個(gè),并且這兩個(gè)最優(yōu)控制量關(guān)于目標(biāo)與觀測(cè)平臺(tái)初始位置的連線是對(duì)稱的。因而,算法得到的兩條軌跡也關(guān)于該連線對(duì)稱。
圖3 單步最優(yōu)觀測(cè)平臺(tái)軌跡Fig.3 Single-step optimal observer trajectories
圖4 控制變量u(1)與性能指標(biāo)J 2[u(1)]的關(guān)系Fig.4 Relationships of control variable u(1)and Performance Index J 2[u(1)]
本文提出了一種在實(shí)踐上易于實(shí)現(xiàn)的最優(yōu)觀測(cè)平臺(tái)軌跡算法,即單步最優(yōu)觀測(cè)軌跡算法。該算法實(shí)現(xiàn)了從觀測(cè)平臺(tái)的初始觀測(cè)位置開始,在后續(xù)每一時(shí)刻的觀測(cè)位置上達(dá)到目標(biāo)的觀測(cè)性能最優(yōu)。仿真表明,算法獲得的單步最優(yōu)觀測(cè)平臺(tái)軌跡是有效的。需要指出的是,本文僅研究了目標(biāo)靜止?fàn)顟B(tài)下觀測(cè)平臺(tái)的單步最優(yōu)軌跡,對(duì)于目標(biāo)作勻速直線運(yùn)動(dòng)或其他運(yùn)動(dòng)的情況,還需作進(jìn)一步的研究。此外,對(duì)于觀測(cè)過(guò)程中的觀測(cè)噪聲不滿足高斯白噪聲假設(shè)的情況,也有待進(jìn)一步的分析。
[1]Trémois O,Le Cadre J P.Optimal observer trajectory in bearings-only tracking for maneuvering sources[J].IEE Proc Radar,Sonar Navig,1999,146(1):31-39.
[2]Song T L.Observability of target tracking with bearingonly measurements[J].IEEE Trans.on Aerospace and Electronic Systems,1996,32(4):1 468-1 472.
[3]許志剛.純方位系統(tǒng)定位與跟蹤的觀測(cè)器最優(yōu)機(jī)動(dòng)軌跡[J].連云港化工高等??茖W(xué)校學(xué)報(bào),2002,15(1):1-4.XU Zhigang.Optimal observer maneuver for bearings-only localization and tracking[J].Journal of Liangyungang College of Chemical Technology,2002,15(1):1-4.
[4]權(quán)宏偉,彭冬亮,薛安克.純方位角目標(biāo)運(yùn)動(dòng)分析的可觀測(cè)性研究[J].火力與指揮控制,2009,34(10):43-46.QUAN Hongwei,PENG Dongliang,XUE Anke.Observability of Bearings-only target motion analysis,Fire Control&Command Control,2009,34(10):43-46.
[5]Fogel E,Gavish M.Nth-order dynamics target observability from angle measurements[J].IEEE Trans on Aerospace and Electronic Systems,1988,24(3):305-308.
[6]Ghassemi F,Krishnamurthy V.A method for constructing the observer trajectory in bearings-only tracking of targets with a Markovian model[C]//Proc of the2005 IEEE Int Conf on Information Acquisition.USA:IEEE,2005:1-5.
[7]Logothetis A,Isaksson A,Evans R J.An information theoretic approach to observer path design for bearings-only tracking[C]//Proc of the 36th conf on Decision&Control.USA:IEEE,1997:3 132-3 137.
[8]Passerieux J M,Van Cappel D.Optimal observer maneuver for bearings-only tracking[J].IEEE Trans on Aerospace and Electronic Systems,1998,34(3):777-788.
[9]Bar-Shalom Y,Li X R,Kirubarajan T.Estimation with applications to tracking and navigation[M].New York:Academic Press,2001.
[10]Hammel S E.Optimal observer motion for bearings-only localization and tracking[D].RI,USA:University of Rhode Island,1988.