楊善超,田康生,劉仁爭(zhēng),2,劉鳳增,黃志良
(1.空軍預(yù)警學(xué)院預(yù)警情報(bào)系, 武漢 430019; 2.火箭軍指揮學(xué)院作戰(zhàn)實(shí)驗(yàn)室, 武漢 430012)
隨著多傳感器數(shù)據(jù)融合技術(shù)及其應(yīng)用的迅速發(fā)展,傳感器管理作為數(shù)據(jù)融合系統(tǒng)的反饋控制環(huán)節(jié),在提高系統(tǒng)有效性、促進(jìn)系統(tǒng)整體優(yōu)化方面起著不可替代的作用。傳感器管理就是利用有限的傳感器資源,滿足對(duì)多個(gè)目標(biāo)和空間的探測(cè)跟蹤需求,以獲得某些特性的最優(yōu)值,并以這個(gè)最優(yōu)準(zhǔn)則對(duì)傳感器資源進(jìn)行合理科學(xué)的分配,簡(jiǎn)而言之,傳感器管理的核心問(wèn)題就是進(jìn)行資源有限條件下傳感器對(duì)目標(biāo)的分配[1]。
現(xiàn)有的傳感器管理算法大致可以分為以下幾種:基于跟蹤精度控制的方法[2-4]、基于信息論的方法[4-5]、基于數(shù)學(xué)規(guī)劃的方法[6-8]等。其中,文獻(xiàn)[2-3]用估計(jì)協(xié)方差來(lái)衡量跟蹤精度,依據(jù)估計(jì)協(xié)方差矩陣與預(yù)設(shè)的期望協(xié)方差矩陣之間的差別進(jìn)行傳感器分配,使濾波后的協(xié)方差矩陣在更大程度上上逼近期望協(xié)方差矩陣,以滿足各目標(biāo)跟蹤精度方面的要求,這一類方法通常稱為基于協(xié)方差控制方法(Covariance Control based Sensor Management Method,CCSMM)。而文獻(xiàn)[4]則是通過(guò)后延克拉美羅下界來(lái)衡量目標(biāo)跟蹤精度。
這些方法在每一時(shí)刻都進(jìn)行獨(dú)立的傳感器分配,而且需要遍歷所有傳感器(組)以尋找最優(yōu)分配方案,必然會(huì)造成計(jì)算量的急劇增大,同時(shí)分配方案的無(wú)連續(xù)性會(huì)導(dǎo)致傳感器頻繁切換,進(jìn)而造成資源的浪費(fèi),甚至?xí)绊懙秸麄€(gè)傳感器系統(tǒng)的有效性和穩(wěn)定性。
為解決這一問(wèn)題,提出傳感器管理增量控制方法(Incremental Control Method for Sensor Management,ICMSM),每一次傳感器分配都是在前一次方案的基礎(chǔ)上進(jìn)行動(dòng)態(tài)調(diào)整,以增強(qiáng)分配方案之間的連續(xù)性,并且減少分配過(guò)程的計(jì)算量以及傳感器的切換頻率。
增量控制是過(guò)程控制和機(jī)器學(xué)習(xí)理論中,增強(qiáng)前后時(shí)刻控制量之間連續(xù)性,減少學(xué)習(xí)和控制復(fù)雜度,并提高效率的一種方法[9]。第n個(gè)時(shí)刻的控制量可以表示前一時(shí)刻的增量形式為:
u(n)=u(n-1)+Δu(n)
(1)
式(1)中,Δu(n)是與當(dāng)前輸出偏差有關(guān)的控制量的修正增量。
傳感器管理的增量控制過(guò)程,就是將增量控制理論應(yīng)用于傳感器管理問(wèn)題;將每一次的傳感器分配方案作為系統(tǒng)的控制量,目標(biāo)跟蹤精度作為輸出量,當(dāng)有目標(biāo)跟蹤精度不滿足閾值要求(包括跟蹤精度過(guò)高和過(guò)低兩方面)時(shí),針對(duì)其構(gòu)建控制量的修正增量,進(jìn)而得到增量控制分配方案。主要過(guò)程是:首先得到初始傳感器分配方案,沿用此傳感器分配方案直到出現(xiàn)目標(biāo)跟蹤精度不滿足設(shè)定閾值;再單獨(dú)針對(duì)此類目標(biāo)分配新的傳感器組(針對(duì)跟蹤精度過(guò)低的目標(biāo)),或者減少其傳感器占用(針對(duì)跟蹤精度過(guò)高的目標(biāo)),使其跟蹤精度恢復(fù)到滿足要求的狀態(tài),與此同時(shí)保持其他目標(biāo)傳感器分配狀態(tài)不變,最終形成增量控制分配方案;沿用此方案,直到再有目標(biāo)不滿足跟蹤精度閾值時(shí)重復(fù)上述過(guò)程。該方法重點(diǎn)部分是增量控制分配方案的形成。
增量控制的觸發(fā)條件以跟蹤精度作為衡量標(biāo)準(zhǔn),因此在初始時(shí)刻的傳感器分配中,采用同樣以期望跟蹤精度作為控制量的協(xié)方差控制方法,其流程如圖1所示。
設(shè)系統(tǒng)有N個(gè)傳感器,則可以分配給目標(biāo)的傳感器組有2N-1個(gè)(包括單傳感器及其組合)[10]。以Φi表示第i種傳感器組,其中包含傳感器Ni個(gè)。假設(shè)某目標(biāo)的狀態(tài)和量測(cè)方程如下:
X(k)=FX(k-1)+GU(k-1)+W(k-1)
(2)
Zj(k)=HjX(k)+Vj(k),j∈Φi
(3)
式(2)~(3)中,X(k)∈Rn是k時(shí)刻目標(biāo)的狀態(tài)向量;U(k)為已知的輸入或控制信號(hào);F、G、Hj分別是狀態(tài)轉(zhuǎn)移矩陣和傳感器j的量測(cè)矩陣;Zj(k)為傳感器j對(duì)目標(biāo)的量測(cè);W(k-1)和Vj(k)分別為過(guò)程噪聲和傳感器量測(cè)噪聲,假設(shè)都是零均值的高斯白噪聲,其協(xié)方差分別是Q(k-1)和Rj(k)。
圖1 基于協(xié)方差控制的傳感器管理模型框圖
目標(biāo)狀態(tài)的一步預(yù)測(cè)和狀態(tài)協(xié)方差一步預(yù)測(cè)為:
X(k|k-1)=FX(k-1)+GU(k-1)
(4)
P(k|k-1)=FP(k-1)FT+Q(k-1)
(5)
當(dāng)某目標(biāo)分配的傳感器組合中包含多于1個(gè)傳感器的時(shí)候,可采用序貫卡爾曼濾波方法,得到其經(jīng)過(guò)Ni個(gè)傳感器照射之后的最終狀態(tài)以及估計(jì)協(xié)方差[11-12]。此外,狀態(tài)估計(jì)協(xié)方差更新方程在多傳感器融合跟蹤中經(jīng)常采用逆協(xié)方差(也稱為信息矩陣)的表達(dá)形式,其遞推表達(dá)式為[13]:
(6)
(7)
式(7)中,Ji表示第i種傳感器組合Φi作用于目標(biāo)時(shí)對(duì)信息矩陣的貢獻(xiàn),定義為傳感器組合Φi的信息增益??梢酝ㄟ^(guò)式(5)-(7)得出每個(gè)目標(biāo)的估計(jì)協(xié)方差。
假設(shè)對(duì)m個(gè)目標(biāo)執(zhí)行任務(wù),k時(shí)刻所有分配方案的集合為D,則基于協(xié)方差控制的傳感器管理方法可以描述為:
(8)
比較兩個(gè)矩陣的差異性有多種度量方法,如矩陣的2范數(shù)、列范數(shù)、行范數(shù)、Frobenius范數(shù)、矩陣的跡等等,每一種度量方法都可以考慮用來(lái)對(duì)濾波協(xié)方差矩陣進(jìn)行控制[14,15]。本文采用矩陣的跡作為度量來(lái)計(jì)算矩陣之間差異性,即:
(9)
考慮到各傳感器組的覆蓋范圍以及最大跟蹤能力的限制,給目標(biāo)函數(shù)(式(8))附加以下約束條件:
(10)
(11)
式(10)~(11)中,X(Φi,l)、X(j,l)分別表示傳感器組Φi、每個(gè)單傳感器j是否與目標(biāo)l配對(duì)成功的度量;aj表示傳感器j的最大跟蹤能力。式(10)表示每個(gè)目標(biāo)占用的傳感器組不多于1個(gè),式(11)表示每個(gè)傳感器跟蹤目標(biāo)數(shù)目不超過(guò)其最大跟蹤數(shù)目。
假設(shè)t時(shí)刻共有n個(gè)目標(biāo)的跟蹤精度不滿足閾值要求,其中a個(gè)跟蹤精度過(guò)高的目標(biāo)構(gòu)成集合Ψ、b個(gè)精度過(guò)低的目標(biāo)構(gòu)成集合Γ(a+b=n)。對(duì)集合Ψ、Γ中目標(biāo)進(jìn)行優(yōu)先級(jí)由高到低排序,并釋放掉Γ中所有目標(biāo)占用的傳感器組合。
首先針對(duì)Ψ中目標(biāo)進(jìn)行增量控制,如果某目標(biāo)占用的傳感器數(shù)目大于1,則刪除其中量測(cè)誤差最大的傳感器;如果數(shù)目等于1,則繼續(xù)保持該目標(biāo)占用的傳感器不變。
從上述分析可以看出,增量控制方法的關(guān)鍵主要是以下三點(diǎn):增量控制觸發(fā)條件(也就是跟蹤精度閾值設(shè)定)、目標(biāo)優(yōu)先級(jí)排序、傳感器篩選模型。增量控制觸發(fā)條件確定了在何種情況下要進(jìn)行增量控制,目標(biāo)優(yōu)先級(jí)排序確定了目標(biāo)增量控制的先后順序,傳感器篩選模型確定待調(diào)整目標(biāo)最終的傳感器分配情況。
1.2.1增量控制觸發(fā)條件
為衡量目標(biāo)跟蹤精度,以協(xié)方差失調(diào)量作為增量控制的觸發(fā)條件[16],其定義為:
(12)
式(12)中,P、Pd分別表示某目標(biāo)的實(shí)際協(xié)方差水平和期望協(xié)方差水平。
通常情況下目標(biāo)優(yōu)先級(jí)越高,其所能容忍的協(xié)方差失調(diào)量越小。為了判斷是否要進(jìn)行增量控制,需要對(duì)每個(gè)目標(biāo)設(shè)定一個(gè)協(xié)方差失調(diào)量閾值,當(dāng)某目標(biāo)跟蹤精度過(guò)高或者過(guò)低導(dǎo)致協(xié)方差失調(diào)量超過(guò)該閾值時(shí),需要對(duì)其進(jìn)行增量控制。
1.2.2目標(biāo)優(yōu)先級(jí)
目標(biāo)優(yōu)先級(jí)主要由目標(biāo)的敵我屬性、運(yùn)動(dòng)方向、目標(biāo)高度、徑向速度、方位、加速度等因素決定,學(xué)者提出了很多目標(biāo)優(yōu)先級(jí)的確定方法,諸如加權(quán)求和、神經(jīng)網(wǎng)絡(luò)等方法[17-18],為了簡(jiǎn)便起見(jiàn),本文直接給出各目標(biāo)的優(yōu)先級(jí)。
1.2.3傳感器篩選
傳感器篩選只用針對(duì)Γ中目標(biāo)進(jìn)行。首先對(duì)2N-1種傳感器組和目標(biāo)Γl進(jìn)行探測(cè)能力篩選。假設(shè)在沒(méi)有地物遮擋情況下,單傳感器能否探測(cè)到目標(biāo)用兩者距離是否小于傳感器的最大探測(cè)距離來(lái)衡量,若能滿足式(13),則表明傳感器能夠探測(cè)到目標(biāo)Γl,有:
R(j,Γl)≤Rjmax
(13)
式(13)中,R(j,Γl)表示第j個(gè)單傳感器與目標(biāo)Γl之間的距離;Rjmax表示單傳感器的最大探測(cè)距離。對(duì)于傳感器組而言,需要組合中的每一個(gè)單傳感器都滿足公式(13),才表明該傳感器組能探測(cè)到該目標(biāo)。經(jīng)過(guò)探測(cè)能力篩選得到的傳感器組集合記為ΘΓl′。
接下來(lái),從ΘΓl′中篩選出還有剩余跟蹤能力的傳感器組集合,記為ΘΓl:
(14)
(15)
式(15)中,PdΓl、PtΓl分別為t時(shí)刻目標(biāo)Γl的期望協(xié)方差和估計(jì)協(xié)方差。
初始傳感器分配方案的形成采用基于協(xié)方差控制的方法,對(duì)于該方法的研究比較成熟,本文不再列出詳細(xì)算法步驟,主要針對(duì)初始方案之后的增量控制算法的實(shí)現(xiàn)流程進(jìn)行闡述。
步驟1初始化。令初始時(shí)刻時(shí)間指針t=1,采用初始分配方案進(jìn)行多目標(biāo)跟蹤。
步驟2增量控制條件觸發(fā)判斷。對(duì)t時(shí)刻各目標(biāo)跟蹤精度是否滿足閾值進(jìn)行判斷,若所有目標(biāo)都滿足,則t=t+1,重復(fù)該步驟;若有n≥1個(gè)目標(biāo)的精度不滿足要求,則根據(jù)其跟蹤精度情況將其分成:跟蹤精度過(guò)高目標(biāo)集合Ψ(a個(gè)目標(biāo))、跟蹤精度過(guò)低目標(biāo)集合Γ(b個(gè)目標(biāo))。
步驟3增量控制過(guò)程。
步驟3.1目標(biāo)優(yōu)先級(jí)排序。對(duì)Ψ和Γ中目標(biāo)按優(yōu)先級(jí)高低分別進(jìn)行排序,并令Ψ中目標(biāo)指針s=1、Γ中目標(biāo)指針l=1。
步驟3.2集合Ψ中目標(biāo)增量控制。
步驟3.2.1若Ψs占用的傳感器數(shù)目大于1,則從中去掉量測(cè)誤差最大的傳感器;如果數(shù)目等于1,則繼續(xù)保持Ψs占用的傳感器不變。
步驟3.2.2若s=a則轉(zhuǎn)到步驟3.3,否則令s=s+1,返回步驟3.2.1。
步驟3.3集合Γ中目標(biāo)增量控制。
步驟3.3.1釋放Γ中所有目標(biāo)所占用的傳感器組。
步驟3.3.2根據(jù)式(13)判斷Φi,i=1,2,…,2N-1是否能探測(cè)到目標(biāo)Γl,形成滿足探測(cè)要求的傳感器組集合ΘΓl′;再根據(jù)式(14)從ΘΓl′中篩選出有剩余跟蹤能力的傳感器組集合ΘΓl。
步驟3.3.3根據(jù)式(15)找出使目標(biāo)Γl跟蹤精度最優(yōu)的傳感器組,作為Γl的增量控制傳感器。
步驟3.3.4若l=b成立,則轉(zhuǎn)到步驟4,否則令l=l+1并回到步驟3.3.2。
步驟4增量控制分配方案確定。將新的傳感器組與目標(biāo)配對(duì)方案和原分配方案結(jié)合,形成t時(shí)刻的增量控制分配方案。執(zhí)行這一分配方案,令t=t+1,判斷該時(shí)刻跟蹤任務(wù)是否完成,若完成則結(jié)束算法,否則返回步驟2。
為了對(duì)ICMSM和CCSMM進(jìn)行比較,以跟蹤精度、傳感器組切換率、傳感器資源使用率、算法計(jì)算量作為算法評(píng)價(jià)指標(biāo)對(duì)兩種算法的性能進(jìn)行衡量。
跟蹤精度用傳感器濾波估計(jì)狀態(tài)與目標(biāo)實(shí)際狀態(tài)之間的位置均方誤差來(lái)表示:
(16)
傳感器組切換率,是指在整個(gè)仿真過(guò)程中,傳感器組切換的次數(shù)與傳感器目標(biāo)總配對(duì)次數(shù)的比值,即:
η=NC/Ns
(17)
式(17)中,NC表示相鄰時(shí)刻使用不同傳感器組的次數(shù);Ns是傳感器和目標(biāo)總配對(duì)的次數(shù)。
傳感器資源使用率指的是使用的傳感器占總傳感器數(shù)目的比例,即:
(18)
式(18)中,St表示每一時(shí)刻選擇的傳感器個(gè)數(shù)。
算法計(jì)算量則用仿真平均運(yùn)行時(shí)間T來(lái)表示,T越小則算法計(jì)算量越小。
系統(tǒng)中有3個(gè)傳感器,故共有7個(gè)傳感器組。各傳感器組中包含的傳感器如表1所示。3個(gè)傳感器以不同的噪聲對(duì)目標(biāo)位置狀態(tài)進(jìn)行量測(cè),其量測(cè)噪聲參數(shù)值見(jiàn)表2。噪聲協(xié)方差均為對(duì)角陣,對(duì)多個(gè)傳感器的量測(cè)數(shù)據(jù)采用集中式序貫Kalman濾波進(jìn)行跟蹤處理。仿真中共設(shè)置5個(gè)目標(biāo),狀態(tài)用(x,x′,x″,y,y′,y?)表示,運(yùn)動(dòng)過(guò)程受到兩坐軸上相互獨(dú)立的零均值高斯白噪聲擾動(dòng),設(shè)所有目標(biāo)的過(guò)程噪聲標(biāo)準(zhǔn)差都為diag[1,0.1,0.01,1,0.1,0.01],表3為各目標(biāo)在不同時(shí)段的運(yùn)動(dòng)模型,表4給出了5個(gè)目標(biāo)的初始狀態(tài)和期望狀態(tài)等參數(shù)。目標(biāo)運(yùn)動(dòng)持續(xù)時(shí)間60 s,采樣間隔為1 s。為了計(jì)算簡(jiǎn)便,為5個(gè)目標(biāo)設(shè)置統(tǒng)一的跟蹤精度閾值:δ=0.08,并假設(shè)各傳感器對(duì)所有目標(biāo)在整個(gè)仿真過(guò)程中保持可見(jiàn)。此外,3個(gè)傳感器的跟蹤容量分別是2,2,3;目標(biāo)權(quán)重大小為:l4>l3>l5>l2>l1。距離單位:米(m),速度單位:米每秒(m/s),加速度單位:米/秒2(m/s2),時(shí)間單位:秒(s)。
表1 傳感器組
表2 傳感器量測(cè)噪聲參數(shù)值
表3 目標(biāo)運(yùn)動(dòng)模型
表4 目標(biāo)初始狀態(tài)和期望狀態(tài)參數(shù)
通過(guò)仿真得到目標(biāo)跟蹤軌跡如圖2所示,圖3表明利用ICMSM方法能很好地完成對(duì)5個(gè)目標(biāo)的跟蹤。
圖2 目標(biāo)軌跡
兩種傳感器管理方法下得到的目標(biāo)位置均方誤差如圖3所示。可以發(fā)現(xiàn),采用ICMSM時(shí)目標(biāo)的平均位置誤差更大,但二者得到的跟蹤誤差都保持在可接受范圍之內(nèi)。這是由于CCSMM方法在每一時(shí)刻都會(huì)選擇使各目標(biāo)跟蹤精度最滿足要求的分配方案,而ICMSM方法不會(huì)在每一時(shí)刻都進(jìn)行傳感器分配,而是對(duì)精度過(guò)高或過(guò)低的目標(biāo)進(jìn)行增量控制。上述仿真結(jié)果可以反映出:ICMSM能控制各目標(biāo)的跟蹤精度既不過(guò)高也不過(guò)低,以確保傳感器資源的合理利用。在30 s之后,目標(biāo)4、5開始出現(xiàn)轉(zhuǎn)彎?rùn)C(jī)動(dòng),位置均方誤差會(huì)變大;同時(shí)由于這兩個(gè)目標(biāo)跟蹤難度變大,占用更多傳感器資源,導(dǎo)致其他目標(biāo)可利用的資源變少,位置均方誤差也相應(yīng)變大。
兩種方法的傳感器分配情況如圖4所示,可以發(fā)現(xiàn)ICMSM大大減少了傳感器間的切換,增大了傳感器分配周期以及分配方案之間的連續(xù)性。
相關(guān)性能如表5所示。結(jié)合圖4和表5,可以發(fā)現(xiàn)ICMSM相對(duì)于CCSMM在傳感器切換率和算法計(jì)算量上有了大幅優(yōu)化,但是傳感器資源使用率相對(duì)較低。這是由于采用ICMSM時(shí)會(huì)增大傳感器分配周期,可能會(huì)在一定時(shí)間段內(nèi)都持續(xù)選擇一種傳感器利用率不高的分配方案;而采用CCSMM時(shí),在每一時(shí)刻都選擇最滿足跟蹤精度要求的分配方案,跟蹤精度的優(yōu)化需要提高傳感器使用率。
算法RMSPEη/%τ/%T/sICMSM25.83.946.22.76CCMSM15.958.767.414.62
通過(guò)仿真實(shí)驗(yàn)可以看出,采用ICMSM進(jìn)行傳感器管理,能在保證目標(biāo)跟蹤效果的基礎(chǔ)上,有效減少傳感器的切換頻率和模型運(yùn)行計(jì)算量,確保傳感器資源的合理利用,提高傳感器管理效率。
本文提出傳感器增量控制算法,針對(duì)多目標(biāo)跟蹤過(guò)程中跟蹤精度不滿足要求的目標(biāo),進(jìn)行傳感器分配方案的動(dòng)態(tài)增量控制。該方法能夠大大減少傳感器的切換頻率以及模型運(yùn)行計(jì)算量,提升傳感器管理效率、避免資源浪費(fèi),保持系統(tǒng)的穩(wěn)定性。