左 燕,郭寶峰,谷 雨,徐松柏
(杭州電子科技大學(xué)信息與控制研究所,杭州 310018)
?
基于Riccati方程的動(dòng)態(tài)傳感器分配算法*
左燕,郭寶峰,谷雨,徐松柏
(杭州電子科技大學(xué)信息與控制研究所,杭州310018)
摘要:針對(duì)組網(wǎng)跟蹤系統(tǒng)傳感器分配算法計(jì)算量過(guò)大的問(wèn)題,提出了一種基于Riccati方程的動(dòng)態(tài)傳感器分配算法。該算法通過(guò)Riccati方程離線計(jì)算各傳感器組合跟蹤下的穩(wěn)態(tài)濾波協(xié)方差,根據(jù)穩(wěn)態(tài)濾波協(xié)方差與期望協(xié)方差的接近程度動(dòng)態(tài)分配傳感器資源。仿真結(jié)果顯示,與傳統(tǒng)協(xié)方差控制和貪婪算法相比,基于Riccati方程的動(dòng)態(tài)傳感器分配算法在大大減少計(jì)算量的同時(shí)能夠保持較好的跟蹤性能。該方法能夠更好地應(yīng)用于大規(guī)模傳感器組網(wǎng)目標(biāo)協(xié)同跟蹤系統(tǒng)。
關(guān)鍵詞:多傳感器管理,傳感器分配,協(xié)方差控制,Riccati方程,目標(biāo)跟蹤
隨著現(xiàn)代戰(zhàn)爭(zhēng)環(huán)境的日益復(fù)雜,通過(guò)配置多個(gè)傳感器組網(wǎng)進(jìn)行協(xié)同探測(cè),可以提高防空預(yù)警體系對(duì)目標(biāo)的探測(cè)和跟蹤效果[1]。如何合理分配有限的傳感器資源,充分發(fā)揮傳感器的認(rèn)知能力,最大限度地獲取所需目標(biāo)信息已成為軍事領(lǐng)域研究的重點(diǎn)。在多傳感器目標(biāo)跟蹤系統(tǒng)中引入傳感器管理是在跟蹤性能和傳感器資源之間建立一種平衡,以達(dá)到系統(tǒng)整體性能最優(yōu)。
傳感器分配算法是傳感器管理算法中的一個(gè)重要組成部分,該算法的核心是依據(jù)一定的準(zhǔn)則,建立一個(gè)易于量化的目標(biāo)效能函數(shù),通過(guò)優(yōu)化效能函數(shù)獲得最優(yōu)傳感器組合進(jìn)行目標(biāo)跟蹤[2]。國(guó)內(nèi)外學(xué)者從不同的角度評(píng)估目標(biāo)跟蹤性能,在此基礎(chǔ)上提出了不同的效能函數(shù):濾波估計(jì)協(xié)方差[3 - 5]、信息增益[6 - 7]、Kullback-Leibler分辨力[8]、Reyi信息差異[9]、CRLB[10],PCRLB[11]等。通過(guò)在線遍歷所有可能的傳感器組合,實(shí)現(xiàn)最大化目標(biāo)效能函數(shù)下的資源優(yōu)化分配,然而隨著系統(tǒng)中傳感器數(shù)目的增加,上述傳感器分配算法的計(jì)算量急劇增長(zhǎng)。為了降低計(jì)算量,部分研究者將啟發(fā)式貪婪算法引入傳感器分配算法中[12-14]。通過(guò)每次選取“最佳”傳感器構(gòu)造傳感器組合進(jìn)行目標(biāo)跟蹤,減少傳感器分配算法的計(jì)算量,然而該算法是以選擇非最優(yōu)傳感器組合為代價(jià)來(lái)減輕計(jì)算代價(jià)。另一方面,部分研究工作集中在設(shè)計(jì)穩(wěn)態(tài)傳感器分配算法[15-16],即根據(jù)各傳感器對(duì)目標(biāo)的穩(wěn)態(tài)濾波協(xié)方差來(lái)進(jìn)行資源分配,當(dāng)目標(biāo)進(jìn)入穩(wěn)態(tài)跟蹤時(shí),能夠保證傳感器資源的優(yōu)化分配。然而穩(wěn)態(tài)傳感器分配方法是一種開(kāi)環(huán)的分配方法,無(wú)法適用于動(dòng)態(tài)變化的環(huán)境。如何減少算法的在線計(jì)算量,同時(shí)保證目標(biāo)跟蹤性能是將傳感器管理應(yīng)用于大規(guī)模網(wǎng)絡(luò)化目標(biāo)協(xié)同跟蹤的關(guān)鍵。
本文以雷達(dá)組網(wǎng)防空預(yù)警系統(tǒng)為背景,結(jié)合Riccati方程和協(xié)方差控制思想提出了一種基于Riccati方程的動(dòng)態(tài)傳感器分配算法。該方法采用Riccati方程離線計(jì)算出所有傳感器組合對(duì)應(yīng)的穩(wěn)態(tài)濾波協(xié)方差,通過(guò)期望協(xié)方差與穩(wěn)態(tài)濾波協(xié)方差的匹配來(lái)選擇一個(gè)最優(yōu)的組合進(jìn)行濾波跟蹤。最后將本方法與傳統(tǒng)協(xié)方差控制和貪婪算法進(jìn)行了仿真比較研究。
假設(shè)N個(gè)三坐標(biāo)(3D)雷達(dá)構(gòu)成的雷達(dá)網(wǎng)對(duì)空中運(yùn)動(dòng)目標(biāo)進(jìn)行組網(wǎng)跟蹤。傳感器組合的集合為D(不包括空集的組合),Dj為第j種傳感器組合,所有可能的傳感器組合個(gè)數(shù)為2N-1。動(dòng)態(tài)傳感器分配算法的一般優(yōu)化模型可描述為:
式中:D為傳感器組合的擴(kuò)展集合,Dopt為最優(yōu)傳感器組合;Ij為第j種傳感器組合下的性能指標(biāo);Id為期望的性能指標(biāo);f(·)為效能函數(shù)。
在實(shí)際應(yīng)用中,多傳感器組網(wǎng)協(xié)同跟蹤問(wèn)題通常都會(huì)有一些預(yù)期的指標(biāo),比如目標(biāo)的期望跟蹤精度。基于協(xié)方差控制的傳感器分配方法[3-5]為目標(biāo)設(shè)定期望的跟蹤精度,即期望協(xié)方差,根據(jù)濾波估計(jì)協(xié)方差和期望協(xié)方差的接近程度進(jìn)行傳感器資源分配?;趨f(xié)方差控制的傳感器分配模型可描述如下
其中,Pj(k|k)表示第j種傳感器組合下的濾波估計(jì)協(xié)方差陣,Pd(k)表示期望協(xié)方差陣;f(·)為兩個(gè)矩陣的度量,用于描述實(shí)際協(xié)方差和期望協(xié)方差陣之間的差異,本文采用矩陣求跡。
傳感器分配問(wèn)題是一個(gè)組合優(yōu)化問(wèn)題,對(duì)于傳感器組合的選擇一般都是采用全遍歷搜索方式?;趨f(xié)方差控制的傳感器分配算法在線遍歷搜索時(shí),算法的計(jì)算復(fù)雜度為O(2Nn3),N為傳感器個(gè)數(shù),n為目標(biāo)狀態(tài)向量的維數(shù)。隨著組網(wǎng)中傳感器個(gè)數(shù)的增加,傳感器在線分配算法的計(jì)算量呈幾何倍的增加,計(jì)算量過(guò)大則很可能會(huì)造成失跟。
基于協(xié)方差控制的傳感器分配算法需要每一時(shí)刻根據(jù)各傳感器組合的濾波估計(jì)協(xié)方差與期望協(xié)方差的接近程度來(lái)動(dòng)態(tài)分配傳感器組合進(jìn)行目標(biāo)跟蹤[3 - 5]。大量仿真分析發(fā)現(xiàn),經(jīng)過(guò)一段時(shí)間之后,目標(biāo)跟蹤進(jìn)入穩(wěn)態(tài)階段,各傳感器組合的濾波估計(jì)協(xié)方差達(dá)到一個(gè)穩(wěn)態(tài)值?;跒V波估計(jì)協(xié)方差與期望協(xié)方差的協(xié)方差控制分配結(jié)果維持不變。直到期望協(xié)方差發(fā)生變化,傳感器分配需要?jiǎng)討B(tài)調(diào)整。因此,綜合考慮跟蹤性能和計(jì)算效率,本文提出了一種基于Riccati方程的動(dòng)態(tài)傳感器分配方法。該方法采用Riccati方程離線計(jì)算出所有傳感器組合對(duì)應(yīng)的穩(wěn)態(tài)濾波協(xié)方差,通過(guò)期望協(xié)方差與穩(wěn)態(tài)濾波協(xié)方差的匹配來(lái)選擇一個(gè)最優(yōu)的組合進(jìn)行濾波跟蹤。
2.1基于Kalman濾波的Riccati方程
假設(shè)目標(biāo)在三維空間作勻速直線運(yùn)動(dòng),其運(yùn)動(dòng)方程為:
式中,T表示采樣間隔,?為矩陣直積的運(yùn)算符號(hào)。傳感器的量測(cè)方程為
其中,zi(k)是第i個(gè)傳感器在k時(shí)刻的量測(cè)值,;vi(k)表示量測(cè)噪聲,假定為零均值高斯白噪聲,服從vi(k):N(0,Ri)分布,Ri為第i個(gè)傳感器的量測(cè)噪聲協(xié)方差矩陣。Hi為觀測(cè)矩陣
Kalman濾波器預(yù)測(cè)協(xié)方差為:
對(duì)任一傳感器組合Dj(假設(shè)包含S個(gè)傳感器)構(gòu)成的多傳感器跟蹤系統(tǒng),其觀測(cè)矩陣H和量測(cè)噪聲R分別為
由更新方程可得:
Pj(k)=((Pj(k|k-1))-1+(Hj)TRjHj)-1
將式(11)代入式(8)可得:
根據(jù)矩陣求逆引理:(A+BD-1C)-1=A-1-A-1B
,得到預(yù)測(cè)協(xié)方差矩陣的代數(shù)Riccati方程為:
其穩(wěn)態(tài)解形式如下:
其中,Pjps表示傳感器組合Dj組網(wǎng)跟蹤下穩(wěn)態(tài)預(yù)測(cè)協(xié)方差矩陣。
由文獻(xiàn)[15]可知,對(duì)Kalman濾波器,濾波估計(jì)協(xié)方差最終要趨于穩(wěn)態(tài)值。將式(14)代入式(11)中,得到傳感器組合Dj組網(wǎng)跟蹤下穩(wěn)態(tài)的濾波估計(jì)協(xié)方差矩陣Pjfs為:
由式(9)和式(10)可知,對(duì)于不同的傳感器組合,Hj和Rj不同。根據(jù)式(14)和式(15)可以離線計(jì)算所有傳感器組合情況下的穩(wěn)態(tài)濾波協(xié)方差。
2.2基于Riccati方程動(dòng)態(tài)傳感器分配算法
基于Riccati方程的動(dòng)態(tài)傳感器分配方法根據(jù)各傳感器組合的穩(wěn)態(tài)濾波協(xié)方差與期望協(xié)方差的接近程度來(lái)分配傳感器組合進(jìn)行目標(biāo)跟蹤,它保證在穩(wěn)態(tài)情況下的跟蹤性能滿足期望跟蹤精度(見(jiàn)圖1)。
圖1 基于Riccati方程的動(dòng)態(tài)傳感器分配方法
由式(14)和式(15)可知,當(dāng)目標(biāo)運(yùn)動(dòng)模型和量測(cè)模型參數(shù)(F,G,H,Q,R)已知且固定不變的情況下,可以利用Riccati方程離線計(jì)算出不同組合下的穩(wěn)態(tài)濾波協(xié)方差。
在k時(shí)刻,通過(guò)選擇與期望協(xié)方差最匹配的穩(wěn)態(tài)濾波協(xié)方差對(duì)應(yīng)的傳感器組合作為最優(yōu)傳感器組合進(jìn)行分配
其中,Pjps表示第j種傳感器組合下的穩(wěn)態(tài)濾波協(xié)方差矩陣,可由式(13)離線計(jì)算;Pd(k)表示期望協(xié)方差矩陣;f(·)為兩個(gè)矩陣的度量,用于描述實(shí)際協(xié)方差和期望協(xié)方差陣之間的差異,本文f(·)采用絕對(duì)值求跡的方法。
在k+1時(shí)刻,若目標(biāo)期望協(xié)方差不發(fā)生變化,則不再作搜索比較,繼續(xù)采用上一時(shí)刻獲得的最優(yōu)傳感器組合Dopt(k)進(jìn)行目標(biāo)探測(cè)和濾波跟蹤;當(dāng)目標(biāo)的期望協(xié)方差發(fā)生變化時(shí),重新分配傳感器組合。
基于Riccati方程的動(dòng)態(tài)傳感器分配算法具體步驟如下:
Step 1:初始化:k=1,設(shè)置目標(biāo)狀態(tài)轉(zhuǎn)移矩陣F,噪聲分布矩陣G,各傳感器觀測(cè)矩陣H,以及過(guò)程噪聲協(xié)方差Q和量測(cè)噪聲協(xié)方差R。
Step 3:在線分配。
Step(3a)初始化j=1;
Step(3b)選擇k時(shí)刻第j種傳感器組合Dj;
Step(3d)令j=j+1,返回Step(3b),直到
Step 4:令k=k+1,若期望協(xié)方差Pd(k)不發(fā)生改變,則直接采用上一時(shí)刻的最優(yōu)傳感器組合Dopt(k-1)來(lái)進(jìn)行目標(biāo)探測(cè)和濾波跟蹤。否則,返回Step3,重新分配新的傳感器組合。
與傳統(tǒng)基于協(xié)方差控制的動(dòng)態(tài)傳感器分配算法相比,本文提出的基于Riccati方程的動(dòng)態(tài)傳感器分配算法利用Riccati方程離線計(jì)算穩(wěn)態(tài)濾波協(xié)方差矩陣集合,在線只需要比較穩(wěn)態(tài)濾波協(xié)方差與期望協(xié)方差的匹配程度,計(jì)算量可大大減小。同時(shí)通過(guò)穩(wěn)態(tài)傳感器分配控制協(xié)方差水平在一定范圍。一旦確定最優(yōu)傳感器組合,在整個(gè)過(guò)程中若目標(biāo)期望協(xié)方差不發(fā)生變化,則維持當(dāng)前的最優(yōu)傳感器組合,避免傳統(tǒng)的協(xié)方差控制算法出現(xiàn)頻繁切換傳感器組合的情況,減小了傳感器管理的負(fù)擔(dān),提高了傳感器管理的效率,增加了算法的實(shí)用性。
仿真場(chǎng)景是一個(gè)由10部雷達(dá)構(gòu)成的傳感器陣列對(duì)一個(gè)目標(biāo)進(jìn)行觀測(cè),每部雷達(dá)都測(cè)量目標(biāo)的x、y、z坐標(biāo),雷達(dá)的采樣間隔為1 s,量測(cè)噪聲參數(shù)如表1所示。
表1 雷達(dá)的量測(cè)噪聲參數(shù) 單位:m
目標(biāo)采用CV模型,兩個(gè)坐標(biāo)軸上的加速度為相互獨(dú)立的零均值高斯白噪聲,且具有相同的標(biāo)準(zhǔn)差1m/s2,目標(biāo)的狀態(tài)向量記為。目標(biāo)的初始位置在(1 000, 1 500,2 500)m,x方向的速度為200 m/s,y方向的速度為150 m/s,z方向的速度為300 m/s,采用周期為1 s。期望協(xié)方差設(shè)為對(duì)角陣,為了檢驗(yàn)算法對(duì)協(xié)方差的控制能力,期望協(xié)方差分為不同的兩段設(shè)置,第一段設(shè)置成diag[28,3.1,37.3,3.5,39,3.7],從99 s開(kāi)始,設(shè)置成diag[52.6,4.24,67.9,4.75,70.35,4.7]。
將本文提出的離線Riccati方程的在線傳感器分配算法與傳統(tǒng)協(xié)方差控制[5]和貪婪算法[14]進(jìn)行仿真比較,度量指標(biāo)均采用絕對(duì)值求跡,仿真結(jié)果如圖2和圖3所示。
圖2 3種算法的傳感器資源分配情況
圖3 各種算法的濾波估計(jì)協(xié)方差與期望協(xié)方差的對(duì)角元素比較
經(jīng)過(guò)50次Monte Carlo仿真,發(fā)現(xiàn)基于Riccati方程的動(dòng)態(tài)傳感器分配算法和貪婪算法運(yùn)算的matlab仿真平均耗時(shí)分別為0.001 2 s和0.001 1 s,而傳統(tǒng)的協(xié)方差控制算法的平均耗時(shí)為0.500 2 s,可以發(fā)現(xiàn)算法在減少計(jì)算量上取得了明顯的效果(不同的仿真平臺(tái)耗時(shí)也會(huì)不同)。
圖2給出了各種算法的傳感器分配情況,圖3給出了各種算法濾波估計(jì)協(xié)方差與期望協(xié)方差之間的對(duì)角元素的對(duì)比。
①在仿真時(shí)間99 s之前,因?yàn)槠谕母櫨容^高,3種算法的分配結(jié)果都使用了較多的傳感器資源。其中基于Riccati方程的動(dòng)態(tài)傳感器分配算法使用了最少的傳感器資源且在不切換傳感器組合的情況下很好地滿足了協(xié)方差控制要求;傳統(tǒng)的協(xié)方差控制算法雖然也能很好地滿足協(xié)方差控制要求,但是出現(xiàn)了頻繁切換傳感器資源的現(xiàn)象;貪婪算法也能滿足一定的協(xié)方差控制要求,但是過(guò)度地使用了傳感器資源。
②從仿真時(shí)間99 s之后,隨著期望跟蹤精度的下降,傳感器資源的使用都明顯減少,基于Riccati方程的動(dòng)態(tài)傳感器分配算法和傳統(tǒng)的協(xié)方差控制算法分配結(jié)果相近,兩種算法較好地滿足了協(xié)方差控制要求。但是貪婪算法使用了更多的傳感器資源,未能較好地達(dá)到協(xié)方差的控制要求。
通過(guò)上述分析可得,在計(jì)算效率方面,基于Riccati方程的動(dòng)態(tài)傳感器分配算法和貪婪算法都能大大提高計(jì)算效率,計(jì)算效率優(yōu)于傳統(tǒng)協(xié)方差控制算法。在協(xié)方差控制效果方面,基于Riccati方程的動(dòng)態(tài)傳感器分配算法比貪婪算法增加很少的額外計(jì)算量,可以找到一個(gè)更接近最優(yōu)組合的傳感器組合,從而使傳感器分配能夠選擇較少的傳感器資源來(lái)滿足目標(biāo)所需的協(xié)方差水平。基于Riccati方程的動(dòng)態(tài)傳感器分配算法在減少計(jì)算量提高計(jì)算效率和協(xié)方差控制水平上都取得了很好的效果,進(jìn)而使傳感器分配可以應(yīng)用于大規(guī)模雷達(dá)組網(wǎng)目標(biāo)跟蹤系統(tǒng)中。
為了解決多雷達(dá)組網(wǎng)目標(biāo)跟蹤系統(tǒng)中傳感器動(dòng)態(tài)分配方法計(jì)算量太大無(wú)法應(yīng)用于實(shí)際系統(tǒng)的問(wèn)題,本文給出了一種基于Riccati方程的動(dòng)態(tài)傳感器分配算法。該方法通過(guò)離線計(jì)算Riccati方程獲得各傳感器組合下的穩(wěn)態(tài)濾波協(xié)方差。在線判斷期望協(xié)方差和穩(wěn)態(tài)濾波協(xié)方差的接近程度動(dòng)態(tài)分配傳感器資源進(jìn)行目標(biāo)跟蹤。仿真結(jié)果表明,該方法能夠在大大減少計(jì)算量的同時(shí)保持較好的跟蹤精度控制,具有一定的工程應(yīng)用價(jià)值。本文研究了單目標(biāo)情況下的傳感器分配方法,在此基礎(chǔ)上研究多傳感器多目標(biāo)跟蹤下的傳感器分配是下一步研究工作的重點(diǎn)。
參考文獻(xiàn):
[1]葉朝謀,丁建江,李庭勝,等.雷達(dá)探測(cè)資源管理技術(shù)分析與評(píng)估[J].現(xiàn)代雷達(dá),2012,34(3):6-11.
[2]何友,王國(guó)宏,關(guān)欣.信息融合理論及應(yīng)用[M].北京:電子工業(yè)出版社,2010.
[3]NASH J M. Optimal allocation of tracking resources[C]// Proceedings of IEEE Conference on Decision and Control,New Orleans,LA,1977:1177-1180.
[4]KALANDROS M. Covariance control for multisensor systems [J]. IEEE Transactions on Aerospace and Electronic Systems,2002,38(4):1138-1157.
[5]周文輝.相控陣?yán)走_(dá)及組網(wǎng)跟蹤系統(tǒng)資源管理技術(shù)研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2004.
[6]MCINTYRE G A,Hintz K J. Sensor measurement scheduling:an enhanced dynamic preemptive algorithm[J]. Optical Engineering,1998,37(2):517-523.
[7]劉先省,周林,杜曉玉.基于目標(biāo)權(quán)重和信息增量的傳感器管理方法[J].電子學(xué)報(bào),2005,33(9):1683-1687.
[8]SCHMAEDEKE W W,KASTELLA K D. Information-based sensor management and IMMKF[C]// Proceeding of SPIE on Signal and Data Processing of Small Targets. Orlando,F(xiàn)L,USA,1998:390-401.
[9]KREUCHER C M,KASTELLA K D,HERO Iii A O. Information-based sensor management for multitarget tracking[C]// Proceeding of SPIE on Signal and Data of Small Targets. San Diego,CA,USA. 2003:480-489.
[10]童俊,單甘霖.基于Cramer-Rao下限的多傳感器跟蹤資源協(xié)同分配[J].宇航學(xué)報(bào),2012,33(9):1314-1321.
[11]楊小軍,馬祥,宋青松,等.基于條件后驗(yàn)克拉美-羅下界的目標(biāo)跟蹤傳感器管理[J].控制理論與應(yīng)用,2013,30(5):543-548.
[12]KALANDROS M,PAO L Y,HO Y C. Randomization and super-heuristics in choosing sensor sets in target tracking applications[C]// Proceedings of IEEE Conference Decision and Control,1999:1803-1808.
[13]方海濤,田康生,周紅陽(yáng).超啟發(fā)式傳感器選擇算法[J].火力與指揮控制,2006,31(5):29-32.
[14]徐松柏,左燕,谷雨,等.雷達(dá)組網(wǎng)多傳感器選擇快速啟發(fā)式算法[J].杭州電子科技大學(xué)學(xué)報(bào),2014,34(2):32-35.
[15]周文輝,胡衛(wèi)東,郁文賢.基于Riccati方程的穩(wěn)態(tài)傳感器分配算法研究[J].系統(tǒng)工程與電子技術(shù),2004,26 (7):863-866.
[16]童俊,單甘霖.基于修正Riccati方程與Kuhn-Munkres算法的多傳感器跟蹤資源分配[J].控制與決策,2012,27(5):747-751.
Study on Dynamic Sensor Allocation Algorithm Based on Riccati Equation
ZUO Yan,GUO Bao-feng,GU Yu,XU Song-bai
(Institute of Information and Control,Hangzhou Dianzi University,Hangzhou 310018,China)
Abstract:A dynamic multi-sensor allocation algorithm based on the Riccati equation is proposed to deal with the computational burden of the sensor allocation problem in the multi-sensor tracking system. The algorithm calculates the stable covariance with the Riccati equation outline and dynamically allocates the optimal sensor sets based on the difference between the expected covariance and the stable covariance. Simulation results show that the algorithm can obtain the better tracking accuracy and computation efficiency comparing with the traditional covariance control algorithm and the greedy algorithm. The algorithm can be applied to the multi-sensor collaborative tracking in large-scale sensor networks.
Key words:multi-sensor management,sensor allocation,covariance control,Riccati equation,target tracking
中圖分類號(hào):TN953
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1002-0640(2016)05-0046-05
收稿日期:2015-04-16修回日期:2015-05-18
*基金項(xiàng)目:國(guó)家自然科學(xué)基金(61004119,61375011);國(guó)家“973”計(jì)劃基金資助項(xiàng)目(2012CB821204)
作者簡(jiǎn)介:左燕(1980-),女,江西井岡山人,副教授。研究方向:信息融合與多傳感器管理技術(shù)等。