李文娜 張順生* 王文欽
①(電子科技大學(xué)電子科學(xué)技術(shù)研究院 成都 611731)
②(電子科技大學(xué)信息與通信工程學(xué)院 成都 611731)
數(shù)據(jù)關(guān)聯(lián)是多目標(biāo)跟蹤技術(shù)的關(guān)鍵部分,它在偵察和監(jiān)視任務(wù)中起著至關(guān)重要的作用。數(shù)據(jù)關(guān)聯(lián)一直是機(jī)載雷達(dá)界的一個(gè)重要研究課題,因?yàn)樗哂刑嵘龣C(jī)載雷達(dá)系統(tǒng)多目標(biāo)跟蹤性能的潛力。傳統(tǒng)的多目標(biāo)跟蹤數(shù)據(jù)關(guān)聯(lián)算法可以分為兩類:一類是基于極大似然的數(shù)據(jù)關(guān)聯(lián)算法;另一類是基于貝葉斯的數(shù)據(jù)關(guān)聯(lián)算法[1]。
基于極大似然的數(shù)據(jù)關(guān)聯(lián)算法通過(guò)計(jì)算目標(biāo)與量測(cè)的相關(guān)似然函數(shù)值,尋求目標(biāo)與量測(cè)匹配的最佳方式。數(shù)據(jù)關(guān)聯(lián)是組合優(yōu)化問(wèn)題的一個(gè)例子,而多目標(biāo)跟蹤問(wèn)題被視為二維分配問(wèn)題[2]。匈牙利算法(Hungarian Algorithm,HA)是解決分配問(wèn)題的算法之一,它通過(guò)最大化對(duì)數(shù)似然函數(shù)的總和來(lái)最小化目標(biāo)的估計(jì)分配成本[3]。由于所有量測(cè)都與所有預(yù)測(cè)狀態(tài)進(jìn)行比較,因此該算法也稱為全局最近鄰算法。但在復(fù)雜場(chǎng)景中,尤其有噪聲干擾時(shí),HA的效果并不理想。
常用的基于貝葉斯的數(shù)據(jù)關(guān)聯(lián)算法包括多假設(shè)跟蹤器(Multiple Hypothesis Tracker,MHT)和聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)濾波器:它們是通過(guò)生成一組假設(shè)或目標(biāo)與量測(cè)的關(guān)聯(lián)概率來(lái)解決數(shù)據(jù)關(guān)聯(lián)問(wèn)題。MHT通過(guò)使用貝葉斯極大后驗(yàn)估計(jì)給假設(shè)賦值[4],但MHT生成假設(shè)的數(shù)量會(huì)隨著目標(biāo)數(shù)和雷達(dá)掃描數(shù)呈指數(shù)增長(zhǎng)。概率數(shù)據(jù)關(guān)聯(lián)濾波器采用貝葉斯方法通過(guò)后驗(yàn)概率密度函數(shù)找到量測(cè)與目標(biāo)的分配概率來(lái)解決數(shù)據(jù)關(guān)聯(lián)問(wèn)題[5]。然而,概率數(shù)據(jù)關(guān)聯(lián)算法僅有效處理雜波背景下的單目標(biāo)數(shù)據(jù)關(guān)聯(lián)問(wèn)題[6]。聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法(Joint Probabilistic Data Association,JPDA)可以解決多目標(biāo)數(shù)據(jù)關(guān)聯(lián)中量測(cè)同時(shí)落入多個(gè)跟蹤波門的問(wèn)題[7]。JPDA采用窮舉法計(jì)算互聯(lián)事件發(fā)生的概率,但隨著目標(biāo)數(shù)量的增加,聯(lián)合事件數(shù)目呈指數(shù)增長(zhǎng),導(dǎo)致算法的計(jì)算量巨大甚至出現(xiàn)組合爆炸的情況[8,9],因此該算法在實(shí)際工程中不易實(shí)現(xiàn)。
目前的許多研究表明神經(jīng)網(wǎng)絡(luò)可以解決匹配問(wèn)題[10]。神經(jīng)網(wǎng)絡(luò)并不需要計(jì)算復(fù)雜的概率分布,而是通過(guò)學(xué)習(xí)訓(xùn)練樣本,優(yōu)化隱藏參數(shù),使其最準(zhǔn)確地?cái)M合訓(xùn)練集,從而本質(zhì)上逼近所需的函數(shù)。Lee等人[11]提出使用深度神經(jīng)網(wǎng)絡(luò)來(lái)解決分配問(wèn)題,但僅適用于分配問(wèn)題受到1-1約束的情況。Milan等人[12]提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的算法來(lái)解決旅行商問(wèn)題,但該算法沒(méi)有考慮傳感器存在雜波和漏檢的情況。對(duì)于雷達(dá)領(lǐng)域的多目標(biāo)跟蹤問(wèn)題,Liu等人[13]的研究表明,基于LSTM的模型比JPDA和HA等經(jīng)典模型具有更好的關(guān)聯(lián)性能,但是該模型只考慮了簡(jiǎn)單雜波環(huán)境下的數(shù)據(jù)關(guān)聯(lián)問(wèn)題。Verma等人[14]提出基于雙向長(zhǎng)短時(shí)記憶(Bi-directional Long Short-Term Memory,Bi-LSTM)的算法用于解決數(shù)據(jù)關(guān)聯(lián)問(wèn)題,并表明Bi-LSTM在高效訓(xùn)練和性能方面優(yōu)于基于LSTM的模型,但是該算法僅考慮了無(wú)漏檢情況下的數(shù)據(jù)關(guān)聯(lián)問(wèn)題。Vaswani等人[15]提出Transformer模型,并在自然語(yǔ)言處理領(lǐng)域和計(jì)算機(jī)視覺(jué)領(lǐng)域得到廣泛應(yīng)用,例如問(wèn)答系統(tǒng)[16]、文本摘要[17]、語(yǔ)音識(shí)別[18]和視覺(jué)跟蹤[19–21]等。
針對(duì)傳感器存在漏檢及虛警情況下的數(shù)據(jù)關(guān)聯(lián)問(wèn)題,本文提出了一種基于Transformer網(wǎng)絡(luò)的多目標(biāo)跟蹤數(shù)據(jù)關(guān)聯(lián)(Data Association,DA)算法(Transformer-DA)。為了使網(wǎng)絡(luò)適用于量測(cè)數(shù)未知的情況,本文提出了一種掩蔽交叉熵?fù)p失與重疊度損失相結(jié)合的損失函數(shù)(Masked Cross entropy and Dice,MCD)用于模型訓(xùn)練。此外,所提算法是基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)網(wǎng)絡(luò)算法,不需要事先知道目標(biāo)運(yùn)動(dòng)模型和雜波密度等先驗(yàn)信息。
假設(shè)跟蹤n個(gè)目標(biāo),雷達(dá)掃描開(kāi)始時(shí)間為t1,結(jié)束時(shí)間為t2,在此期間進(jìn)行N次掃描,第k次掃描的量測(cè)集Z(k),k=1,2,...,N定義如下:
為了更好地表示傳感器的漏檢和虛警,引入了虛擬量測(cè)[22]的概念,通過(guò)向每個(gè)集合Z(k)添加一個(gè)索引為i=0的虛擬測(cè)量來(lái)重新定義式(1)。
其中,代 表虛擬量測(cè),mk代 表k時(shí)刻量測(cè)的數(shù)目。目標(biāo)的狀態(tài)估計(jì)集Γ(k),k=1,2,...,N定義如下:
在本節(jié)中,我們處理有檢測(cè)歧義的情況。具體而言,做出以下假設(shè):一是在每次掃描中傳感器可能存在漏檢;二是傳感器可能會(huì)產(chǎn)生虛警。假設(shè)意味著每次掃描中量測(cè)的數(shù)量是變化的并且不等于目標(biāo)的數(shù)量。這看似簡(jiǎn)單但對(duì)有檢測(cè)歧義的情況下開(kāi)發(fā)模型至關(guān)重要。通過(guò)引入定義數(shù)據(jù)關(guān)聯(lián)的決策變量來(lái)構(gòu)建Transformer-DA模型,首先定義了決策變量,然后開(kāi)發(fā)了一個(gè)目標(biāo)函數(shù)來(lái)量化數(shù)據(jù)關(guān)聯(lián)問(wèn)題的解決方案,最后提供了目標(biāo)函數(shù)的約束條件。
在跟蹤過(guò)程中處理航跡和量測(cè)的關(guān)聯(lián)問(wèn)題時(shí),會(huì)出現(xiàn)量測(cè)落入不同目標(biāo)跟蹤波門重疊區(qū)域的情況,這時(shí)候需要綜合分析每個(gè)量測(cè)的來(lái)源情況。我們引入二進(jìn)制變量并定義如下:
在本節(jié)中,定義了一個(gè)目標(biāo)函數(shù),用于衡量數(shù)據(jù)關(guān)聯(lián)問(wèn)題解決方案的質(zhì)量。定義表示在k時(shí)刻目標(biāo)的估計(jì)量測(cè)位置,其中F(·)為狀態(tài)轉(zhuǎn)移函數(shù),H(·)為 量測(cè)函數(shù)。在k時(shí)刻分配給目標(biāo)j的 量測(cè)給 出,因此在k時(shí)刻目標(biāo)j的 估計(jì)質(zhì)量由式(5)給出
因此,多目標(biāo)數(shù)據(jù)關(guān)聯(lián)的分配成本C(ω)由式(6)給出
為了找到使得成本最低的分配,我們需要在所有分配中最小化成本C(ω)。可以分析得知,當(dāng)所有量測(cè)與所有航跡一一正確關(guān)聯(lián)時(shí),可得到最小的C(ω)。
一個(gè)量測(cè)最多分配給一個(gè)目標(biāo),若量測(cè)沒(méi)有與目標(biāo)關(guān)聯(lián),則為雜波,此約束如式(7)所示:
一個(gè)目標(biāo)最多只被分配一個(gè)量測(cè),若目標(biāo)沒(méi)有與任何量測(cè)關(guān)聯(lián),即為漏檢,此約束如式(8)所示:
將上述目標(biāo)函數(shù)和約束條件合并,即可得到用于存在雜波和漏檢情況的數(shù)據(jù)關(guān)聯(lián)模型,表示如下:
最小化:
本文將上述數(shù)據(jù)關(guān)聯(lián)問(wèn)題制定為在盡可能多的目標(biāo)上執(zhí)行的分類任務(wù)。對(duì)于不同的目標(biāo)采用整體網(wǎng)絡(luò)架構(gòu)。我們的目標(biāo)是找到與目標(biāo)相對(duì)應(yīng)的量測(cè)。量測(cè)來(lái)源的不確定性和傳感器存在漏檢的可能性,使得數(shù)據(jù)關(guān)聯(lián)問(wèn)題復(fù)雜化。對(duì)此,我們使用Transformer網(wǎng)絡(luò)來(lái)解決這個(gè)問(wèn)題。
在上文中介紹了存在漏檢和雜波情況下的數(shù)據(jù)關(guān)聯(lián)模型。接下來(lái),我們將原始多航跡與多量測(cè)的關(guān)聯(lián)問(wèn)題重新表述為多個(gè)分類子問(wèn)題。
每個(gè)目標(biāo)與所有量測(cè)的匹配如圖1所示。輸入S是目標(biāo)j的4個(gè)歷史狀態(tài),Z為k時(shí)刻的所有量測(cè),在預(yù)測(cè)每個(gè)目標(biāo)的量測(cè)分配中,網(wǎng)絡(luò)將輸出一個(gè)匹配向量,它是目標(biāo)與在時(shí)間k的所有量測(cè)的分配概率,漏檢的目標(biāo)與虛擬量測(cè)關(guān)聯(lián),即圖1中紫色目標(biāo)關(guān)聯(lián)到虛擬量測(cè)。接下來(lái),我們將介紹圖1中的Network結(jié)構(gòu)。
圖1 每個(gè)目標(biāo)與所有量測(cè)的匹配關(guān)系示意圖Fig.1 A diagram of the matching relationship between each target and all measurements
作為一種特殊的查詢鍵機(jī)制,Transformer很大程度上依賴注意力機(jī)制來(lái)處理所提取的深度特征。假定一組序列對(duì)〈X,Y〉,Transformer的結(jié)構(gòu)可以通過(guò)調(diào)整參數(shù)去擬合序列對(duì)的映射關(guān)系。注意力機(jī)制和所提Transformer-DA網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。圖2(a)所示為注意力計(jì)算部分,其中,Query和Key先進(jìn)行矩陣相乘,然后通過(guò)Scale縮放到0和1之間,再通過(guò)Softmax得到注意力分?jǐn)?shù),最后與Value相乘得到最終輸出。圖2(b)是所提出的Transformer-DA網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)結(jié)構(gòu)可分為兩部分,左邊為網(wǎng)絡(luò)的編碼器結(jié)構(gòu),右邊為網(wǎng)絡(luò)的解碼器結(jié)構(gòu)。在編碼器的前端加入了全連接層用于特征提取,并在解碼器的輸出加入了多層感知機(jī)用于類別預(yù)測(cè)。輸入序列通過(guò)全連接層和位置編碼后進(jìn)入多層編碼器中,其中每一層由多頭注意力機(jī)制、層正則化和前向傳播模塊組成,同時(shí)加入了殘差連接可防止梯度消失。
圖2 注意力機(jī)制與Transformer-DA網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Attention mechanism and Transformer-DA network structure
量測(cè)隱式地表示在解碼器查詢中,這些查詢是解碼器用于輸出關(guān)聯(lián)概率的嵌入。解碼器在兩種類型的注意之間交替:一是對(duì)所有查詢的自我注意力機(jī)制,它允許對(duì)所有量測(cè)進(jìn)行聯(lián)合推理;二是編碼器-解碼器注意力機(jī)制,這使得查詢可以全局訪問(wèn)編碼器中的信息。Transformer的置換不變性要求對(duì)網(wǎng)絡(luò)的輸入加上位置編碼。
我們?cè)O(shè)計(jì)了基于Transformer-DA網(wǎng)絡(luò)的多目標(biāo)跟蹤框架,如圖3所示??紤]到航跡與量測(cè)的正確匹配與目標(biāo)的運(yùn)動(dòng)學(xué)特征有重要關(guān)系,使用了每個(gè)目標(biāo)前4個(gè)歷史狀態(tài),即目標(biāo)k-4,k-3,k-2,k-1時(shí)刻的估計(jì)狀態(tài);然后對(duì)每個(gè)目標(biāo)的4個(gè)歷史狀態(tài)進(jìn)行Flatten操作后作為輸入,n個(gè)目標(biāo)就得到了編碼器的輸入序列;然后將k時(shí)刻的所有量測(cè)輸入到Transformer-DA解碼器中得到量測(cè)與航跡的關(guān)聯(lián)概率;最后將關(guān)聯(lián)概率輸入到卡爾曼濾波器中以輸出多個(gè)目標(biāo)在k時(shí)刻的估計(jì)狀態(tài)。
圖3 基于Transformer-DA的多目標(biāo)跟蹤框架Fig.3 Multitarget-tracking framework based on Transformer-DA
我們?cè)O(shè)置了Transformer-DA解碼器輸入的最大量測(cè)數(shù),當(dāng)k時(shí)刻的量測(cè)數(shù)目沒(méi)有達(dá)到最大量測(cè)數(shù)時(shí),將會(huì)對(duì)k時(shí)刻的量測(cè)使用0值填充,并使用1標(biāo)記真實(shí)量測(cè),0標(biāo)記填充的量測(cè),然后將標(biāo)記組成mask向量。為了避免填充量測(cè)對(duì)損失的計(jì)算造成影響,在交叉熵?fù)p失函數(shù)的基礎(chǔ)上做了改進(jìn)得到Lossmask。由于多目標(biāo)場(chǎng)景中存在雜波數(shù)比目標(biāo)的真實(shí)量測(cè)多的情況,這樣會(huì)導(dǎo)致樣本的不均衡,為了推動(dòng)模型更加關(guān)注學(xué)習(xí)目標(biāo)與正確量測(cè)的關(guān)聯(lián)概率,引入Dice損失 Lossdice。最終使用的MCD損失函數(shù)為上述兩種損失之和,用式(11)表示:
其中,pi表 示預(yù)測(cè)關(guān)聯(lián)概率,yi表示真實(shí)關(guān)聯(lián)概率,γ為平滑項(xiàng),取值為1防止損失上溢。
本文基于Ubuntu16.04系統(tǒng)進(jìn)行實(shí)驗(yàn),使用深度學(xué)習(xí)的框架是Tensorflow。實(shí)驗(yàn)的硬件配置:CPU為Intel(R)i5-10400F,GPU為GeForce RTX 3080 Ti,內(nèi)存為16GB,使用CUDA11.1調(diào)用GPU進(jìn)行訓(xùn)練加速。訓(xùn)練過(guò)程中,使用Adam優(yōu)化器進(jìn)行參數(shù)更新,實(shí)驗(yàn)設(shè)置的初始學(xué)習(xí)率為0.001,模型采用從頭訓(xùn)練的方式,訓(xùn)練的batch size取256。
本文的多目標(biāo)跟蹤算法中使用的是基于勻速運(yùn)動(dòng)模型的卡爾曼濾波算法,Transformer-DA使用的目標(biāo)狀態(tài)特征為:[t,x,vx,y,vy],其中t,x,vx,y,vy分 別表示時(shí)間間隔、在x軸 方向的位置、在x軸方向的速度、在y軸方向的位置、在y軸方向的速度;網(wǎng)絡(luò)使用的量測(cè)特征為[t,R,α,θ],其中R,α,θ分別代表徑向距離、方位角、俯仰角。Transformer-DA網(wǎng)絡(luò)的參數(shù)如表1所示。
表1 Transformer-DA網(wǎng)絡(luò)參數(shù)Tab.1 Transformer-DA network parameters
本文在實(shí)驗(yàn)中使用最優(yōu)子模式分配[23](Optimal Sub-Pattern Assignment,OSPA)距離指標(biāo)來(lái)評(píng)估不同算法的跟蹤性能。均方根誤差的前提是所有估計(jì)的點(diǎn)跡之間存在著一一對(duì)應(yīng)關(guān)系,但是在大多數(shù)的多目標(biāo)場(chǎng)景中,跟蹤算法往往做不到在每個(gè)時(shí)刻建立這種對(duì)應(yīng)關(guān)系。
多個(gè)目標(biāo)的真實(shí)狀態(tài)集Φ={φ1,φ2,...,φm},其中φi={φi1,φi2,...,φiN};多個(gè)目標(biāo)估計(jì)狀態(tài)集其 中m和n分別表示實(shí)際目標(biāo)數(shù)和估計(jì)目標(biāo)數(shù),N表示掃描次數(shù)是兩個(gè)集合中所包含的元素,分別表示在一定探測(cè)時(shí)間內(nèi)目標(biāo)的真實(shí)狀態(tài)和估計(jì)狀態(tài)是兩個(gè)集合中包含的元素,分別表示目標(biāo)i在時(shí)間j ∈[1,N]時(shí)的真實(shí)狀態(tài)和估計(jì)狀態(tài)。OSPA的計(jì)算如下:
其中,Πn表 示從集合中取m個(gè)元素的所有排列組合,排列組合數(shù)‖·‖表 示2范數(shù)表示所有目標(biāo)的真實(shí)點(diǎn)跡與估計(jì)點(diǎn)跡之間距離相差最小的一組,c和p分別為距離敏感性參數(shù)和關(guān)聯(lián)敏感性參數(shù)。
4.2.1 訓(xùn)練數(shù)據(jù)及參數(shù)設(shè)置
在仿真實(shí)驗(yàn)中,我們分別仿真了多種運(yùn)動(dòng)模式的軌跡共1000條,每5條軌跡形成一個(gè)多目標(biāo)場(chǎng)景,總計(jì)仿真了200個(gè)多目標(biāo)場(chǎng)景,其中60%用于訓(xùn)練,20%用于驗(yàn)證和20%用于測(cè)試。通過(guò)在軌跡數(shù)據(jù)上加入均值μ=0、方差δR=100 m,δα=0.5°,δθ=0.5°的高斯噪聲坐標(biāo)轉(zhuǎn)換到空間直角標(biāo)系下模擬目標(biāo)的量測(cè),并加入均勻分布的雜波點(diǎn)來(lái)模擬環(huán)境的干擾。雜波在目標(biāo)運(yùn)動(dòng)場(chǎng)景內(nèi)服從均勻分布,雜波數(shù)服從密度為λ的泊松分布[24]。雜波數(shù)的期望定義為:Eλ=λ(xmax-xmin)(ymax-ymin),其中xmax和xmin分別代表運(yùn)動(dòng)范圍內(nèi)x坐標(biāo)的最大值和最小值,ymax和ymin分別代表運(yùn)動(dòng)范圍內(nèi)y坐標(biāo)最大值和最小值。
4.2.2 仿真場(chǎng)景
為了更好地展示目標(biāo)的跟蹤結(jié)果和比較不同算法的跟蹤性能,將所有量測(cè)通過(guò)坐標(biāo)轉(zhuǎn)換統(tǒng)一使用笛卡兒坐標(biāo)系顯示。圖4為雜波數(shù)的期望Eλ=80,檢測(cè)概率pd=0.99時(shí)的仿真軌跡與量測(cè)圖。在圖4所示場(chǎng)景中,每種顏色的量測(cè)點(diǎn)對(duì)應(yīng)同一顏色的目標(biāo),5個(gè)目標(biāo)在觀測(cè)范圍內(nèi)沿不同方向勻速直線運(yùn)動(dòng),采樣間隔為1 s,總采樣次數(shù)為47。4個(gè)目標(biāo)在第17到第23采樣時(shí)間范圍內(nèi)發(fā)生了第1次交叉,2個(gè)目標(biāo)在第38到第40采樣時(shí)間范圍內(nèi)發(fā)生了第2次交叉。
圖4 E λ=80,p d=0.99時(shí)的仿真軌跡與量測(cè)Fig.4 Simulation trajectory and measurement when Eλ=80,pd=0.99
4.2.3 實(shí)驗(yàn)結(jié)果與分析
圖5展示Eλ=80,pd=0.99時(shí)不同算法的跟蹤結(jié)果,圖6顯示了4種算法的OSPA距離對(duì)比,其中OSPA的參數(shù)為p=2,c=500 。在k=10之前存在Transformer-DA算法的OSPA距離高于JPDA算法和Bi-LSTM算法的情況,這是由于不同算法確定的量測(cè)不相同,會(huì)影響協(xié)方差的更新和濾波增益,進(jìn)而影響跟蹤結(jié)果。在第1次目標(biāo)交叉中,多個(gè)目標(biāo)的相互靠近產(chǎn)生了較為復(fù)雜的數(shù)據(jù)關(guān)聯(lián)問(wèn)題,可以定性地分析得到,HA算法的OSPA距離最大。在目標(biāo)發(fā)生數(shù)據(jù)關(guān)聯(lián)后,JPDA,Bi-LSTM的OSPA距離呈上升趨勢(shì)。HA在兩次交叉中的OSPA距離都會(huì)明顯增大。然而,本文所提出的Transformer-DA算法的OSPA距離總體來(lái)說(shuō)最小。
圖5 E λ=80,p d=0.99時(shí)不同算法的跟蹤結(jié)果(使用仿真數(shù)據(jù))Fig.5 Tracking results of different algorithms when E λ=80,p d=0.99 (using simulation data)
圖6 E λ=80,p d=0.99下不同算法的OSPA距離(使用仿真數(shù)據(jù))Fig.6 OSPA distance of different algorithms when Eλ=80, p d=0.99 (using simulation data)
不同檢測(cè)概率下的OSPA距離如表2所示,通過(guò)分析可以得到,HA算法受檢測(cè)概率的影響較大,Bi-LSTM算法受到檢測(cè)概率的影響較小,本文所提出的Transformer-DA算法在不同檢測(cè)概率下的OSPA距離都最小。
表2 使用仿真數(shù)據(jù)時(shí)算法在不同檢測(cè)概率下的OSPA對(duì)比Tab.2 OSPA comparison of the algorithm under different detection probabilities when using simulation data
為了進(jìn)一步評(píng)估所提多目標(biāo)跟蹤算法的有效性,我們使用了實(shí)際的目標(biāo)軌跡進(jìn)行實(shí)驗(yàn),由于缺少真實(shí)量測(cè)數(shù)據(jù),通過(guò)使用4.2節(jié)中加高斯噪聲的方法模擬量測(cè)。本節(jié)實(shí)驗(yàn)使用的實(shí)際軌跡共750條,每5條軌跡形成一個(gè)多目標(biāo)場(chǎng)景,總計(jì)150個(gè)多目標(biāo)場(chǎng)景,其中60%用于訓(xùn)練,20%用于驗(yàn)證和20%用于測(cè)試。
機(jī)載雷達(dá)工作在X頻段,信號(hào)帶寬為20 MHz,脈沖重復(fù)頻率為1000 Hz。跟蹤的目標(biāo)為空中目標(biāo),均作變速運(yùn)動(dòng),其中目標(biāo)4的軌跡存在機(jī)動(dòng)轉(zhuǎn)彎。
4.3.1 真實(shí)場(chǎng)景
Eλ=80,pd=0.99時(shí)的真實(shí)軌跡與仿真量測(cè)如圖7所示。在第55到第80掃描時(shí)間范圍內(nèi),目標(biāo)2和目標(biāo)4會(huì)產(chǎn)生數(shù)據(jù)關(guān)聯(lián)問(wèn)題,將會(huì)導(dǎo)致量測(cè)同時(shí)落入兩個(gè)目標(biāo)的跟蹤波門內(nèi)。
圖7 E λ=80, p d=0.99時(shí)的真實(shí)軌跡與仿真量測(cè)Fig.7 Real trajectory and simulation measurements when Eλ=80,pd=0.99
4.3.2 實(shí)驗(yàn)結(jié)果與分析
圖8展示了參數(shù)為Eλ=80,pd=0.99下不同算法的跟蹤結(jié)果,圖9顯示了4種算法的OSPA距離對(duì)比,其中OSPA的參數(shù)為p=2,c=2000。在第55到第80掃描時(shí)間范圍內(nèi),目標(biāo)的相互靠近產(chǎn)生了較為復(fù)雜的數(shù)據(jù)關(guān)聯(lián)問(wèn)題,可以定性地分析得到,HA,JPDA和Bi-LSTM算法的OSPA距離都會(huì)增大,其中,HA算法受到的影響最大。然而,本文所提出的Transformer-DA算法的OSPA距離總體來(lái)說(shuō)最小。
圖8 E λ=80,p d=0.99時(shí)不同算法的跟蹤結(jié)果(使用實(shí)際數(shù)據(jù))Fig.8 Tracking results of different algorithms when E λ=80,p d=0.99 (using actual data)
圖9 E λ=80,p d=0.99時(shí)不同算法的OSPA距離(使用實(shí)際數(shù)據(jù))Fig.9 OSPA distance of different algorithms when Eλ=80,p d=0.99 (using actual data)
不同檢測(cè)概率下的OSPA距離如表3所示,通過(guò)分析可以得到,HA算法受檢測(cè)概率的影響較大,Bi-LSTM算法受到檢測(cè)概率的影響較小,JPDA在檢測(cè)概率較高時(shí)的OSPA距離比HA和Bi-LSTM算法小,本文所提出的Transformer-DA算法在不同檢測(cè)概率下的OSPA距離都最小。
表3 使用實(shí)際數(shù)據(jù)時(shí)算法在不同檢測(cè)概率下的OSPA對(duì)比Tab.3 OSPA comparison of the algorithm under different detection probabilities when using actual data
本文通過(guò)引入虛擬量測(cè)這一概念,使得Transformer-DA算法可以適用于目標(biāo)漏檢的情況。對(duì)4.2節(jié)和本節(jié)實(shí)驗(yàn)的數(shù)據(jù)分析可以得到在不同檢測(cè)概率條件下所提Transformer-DA算法識(shí)別漏檢目標(biāo)的準(zhǔn)確率,如表4所示。
表4 不同檢測(cè)概率下所提算法識(shí)別漏檢目標(biāo)的準(zhǔn)確率(%)Tab.4 The accuracy of the proposed algorithm to identify missed targets under different detection probabilities (%)
JPDA算法的運(yùn)算復(fù)雜度為O(mn+MM+NM+Nn+NF+nMN),其中M為落入跟蹤波門的量測(cè)數(shù),N為可行聯(lián)合事件數(shù),F(xiàn)為雜波數(shù);H A算法的運(yùn)算復(fù)雜度為O(mn);Bi-LSTM算法的運(yùn)算復(fù)雜度為O(nd2),其中d為隱藏狀態(tài)大?。槐疚乃崴惴ǖ倪\(yùn)算復(fù)雜度為O(n2d+m2d)。當(dāng)目標(biāo)數(shù)和量測(cè)數(shù)較多時(shí),JPDA算法產(chǎn)生的可行聯(lián)合事件數(shù)N的值會(huì)很大,此時(shí)JPDA算法的計(jì)算復(fù)雜度最大。在所有算法中,HA算法的復(fù)雜度最低,本文所提算法比Bi-LSTM算法的運(yùn)算復(fù)雜度大。
本文提出了一種基于Transformer的數(shù)據(jù)關(guān)聯(lián)網(wǎng)絡(luò),可以在沒(méi)有目標(biāo)運(yùn)動(dòng)模型和雜波密度等先驗(yàn)信息的情況下,從訓(xùn)練樣本中學(xué)習(xí)目標(biāo)與量測(cè)的匹配關(guān)系。所提網(wǎng)絡(luò)可以提取目標(biāo)的運(yùn)動(dòng)特征信息并學(xué)習(xí)軌跡與量測(cè)之間的數(shù)據(jù)關(guān)聯(lián),從而預(yù)測(cè)輸出分類矩陣得到目標(biāo)與量測(cè)之間的關(guān)聯(lián)概率。通過(guò)對(duì)比實(shí)驗(yàn)可以發(fā)現(xiàn),提出的網(wǎng)絡(luò)具有以下優(yōu)點(diǎn):當(dāng)多個(gè)目標(biāo)交叉時(shí),提出的網(wǎng)絡(luò)可以解決多目標(biāo)和多量測(cè)的匹配問(wèn)題;在一定的噪聲干擾環(huán)境下,提出的網(wǎng)絡(luò)具有更好的跟蹤魯棒性;在不同檢測(cè)概率條件下,所提Transformer-DA算法的OSPA距離最小,因而能夠提升多目標(biāo)的跟蹤性能。