張宇軒, 胡士強
(上海交通大學 航空航天學院,上海 200240)
無論在軍事領域還是民用航空交通領域,雷達目標跟蹤技術都有著廣泛的應用。現(xiàn)代社會科技不斷發(fā)展,尤其是各種電子技術飛速發(fā)展,推動了雷達跟蹤精度的提升,隨之而來的是雷達跟蹤需要面對的日益復雜的電磁環(huán)境。此外,相關空域內的其他目標以及惡劣的天氣也是干擾雷達跟蹤的主要因素。如何盡可能有效排除這些干擾帶來的影響,是提升雷達跟蹤精度的重要方向之一。
傳統(tǒng)的數(shù)據(jù)關聯(lián)算法[1,2]由于計算量較大,組合爆炸問題會影響跟蹤的實時性。而基于隨機有限集的方法[3~5]把隨機集內多目標的狀態(tài)看成整體,避免了數(shù)據(jù)關聯(lián)問題,不過在雜波過多的復雜場景下依然存在漏檢虛警的情況。跟蹤—學習—檢測(tracking-learning-detection,TLD)是KALAL Z[6]提出的一種目標跟蹤框架,用于對視頻中單個物體的長時間跟蹤。近年來已有基于這種框架的對雷達目標跟蹤算法做出的改進[13],但僅限于對雷達兩個屬性的利用。雷達發(fā)射波在目標相互作用過程中會產生雷達目標散射波,而通過對散射波的頻率、相位、幅度等信息進行處理可以獲得對應跟蹤目標的屬性參數(shù)。在實際跟蹤場景中,兩個屬性信息不足以應對數(shù)量眾多且復雜的雜波環(huán)境。
本文引入多屬性分類算法,通過處理雷達獲取目標的多種特性參數(shù),來改善已有算法在更為復雜更接近實際的場景下的精度不足問題。本文基于TLD框架,以傳統(tǒng)高斯混合概率假設密度(Gaussian mixture PHD,GM-PHD)算法[7]作為跟蹤器,多屬性分類器支持向量機(support vector machine,SVM)[8]作為檢測器,同時加入PN學習過程。在GM-PHD算法基礎上,引入雷達獲取的目標與雜波的多種屬性信息,通過多屬性分類器進行初步分類。而在PN學習過程中,利用目標的時空特性對分類器的分類結果進行校正,并更新分類器的訓練集,同時對PHD的錯誤估計進行剪枝,以此實現(xiàn)目標跟蹤的在線學習,提升雜波環(huán)境下的雷達跟蹤精度。
本文提出的多屬性分類目標跟蹤算法主要基于計算機視覺領域的TLD算法框架,引入多屬性檢測與PN學習算法,實現(xiàn)目標的在線跟蹤。整個系統(tǒng)主要由跟蹤器、檢測器、學習器三個模塊構成。其中跟蹤器采用傳統(tǒng)的基于隨機有限集的目標跟蹤算法GM-PHD,檢測器采用多屬性下的支持向量機模型,學習器則是通過PN約束對分類結果進行評估。三個模塊互相作用使得整個系統(tǒng)具有很強的魯棒性和學習能力。
系統(tǒng)跟蹤器模塊采用GM-PHD算法。該算法假設目標的新生與衍生過程PHD都能表示為高斯混合模型。該算法將目標狀態(tài)和量測數(shù)據(jù)分別看作是隨機的單目標狀態(tài)集合與單量測傳感器集合,有效避免了數(shù)據(jù)關聯(lián)。其主要算法流程如下:
1)預測:在預測階段,目標狀態(tài)函數(shù)表示為
(1)
預測PHD函數(shù)為
νk|k-1(X)=νs,k|k-1(X)+νβ,k|k-1(X)+νγ,k|k-1(X)
(2)
式中νs為存活目標的PHD,而νβ和νγ分別為衍生目標與新生目標的PHD。
2)更新:在更新階段,目標PHD強度可記為
(3)
總的高斯分量個數(shù)
Jk=(1+|Zk|)Jk|k-1
(4)
早期雷達將跟蹤目標看成點目標,簡單地獲取目標位置、速度、加速度和運動軌跡等尺度量測信息,而隨著高分辨率寬帶雷達的誕生,跟蹤目標更多地被當做體目標來研究[9,10]。通過對雷達目標散射波的回波幅度及相位等的處理變換,可以得到目標的載頻、信噪比、雷達散射截面積(radar cross-section ,RCS)、散射極化矩陣、目標多散射中心等多種參數(shù),這些參數(shù)就是雷達目標的特征測量參數(shù)。屬性特征參數(shù)反映了目標的形狀、體態(tài)、姿態(tài)和表面材料等物理特征,可以很好地用于目標的分類與識別。本文選取載波、信噪比、RCS、體積四個屬性作為跟蹤目標與雜波的分類特征信息。
Corinna Cortes和Vapnik提出的SVM方法是一種監(jiān)督學習模型,在解決小樣本和高維數(shù)據(jù)問題上有很好的表現(xiàn)。本文利用該算法將待分類的目標和雜波屬性信息映射至更高維空間,通過核函數(shù)在高維空間中找到一個最優(yōu)分割超平面,以完成目標和雜波的分類。跟蹤開始階段,多屬性分類器利用先驗數(shù)據(jù)和前幾幀跟蹤數(shù)據(jù)完成訓練過程,得到分類器的初始模型。k時刻,系統(tǒng)將雷達獲取的量測數(shù)據(jù)Zk輸入多屬性分類器,分類器將Zk進行初步分類,獲得分類結果的置信度Lk。所有量測目標被分為正樣本與負樣本。而在學習模塊中,屬性分類結果將得到修正,修正過的分類結果被加入到訓練集中,保證了分類器模型的在線更新,這也進一步提升了屬性分類過程的準確性。
PN學習是一種利用帶標簽與不帶標簽兩種樣本之間的結構性特征差異來訓練并改善分類器性能的方法[11]。P約束用于修正被分類器錯誤標記為負的正樣本,而N約束反之,修正被錯誤分類的負樣本。在迭代過程中,PN分類器不斷更新分類器的訓練樣本集,使得分類器的分類性能得到學習與增強。
本文中的PN約束主要基于目標的時空特性,即目標的空間位置具有短時不變性,且在連續(xù)時間內具有變化緩慢的特點。K時刻GM-PHD跟蹤器獲得跟蹤結果Xk,檢測器獲得分類結果——置信度Lk。其中置信度高于一定閾值L2的樣本被認定為候選目標,低于一定閾值L1(0 圖1 PN學習工作原理 1)跟蹤器獲取K時刻目標跟蹤位置,以此為中心將量測結果劃分為候選區(qū)內和候選區(qū)外;2)檢測器利用雷達獲取的目標多維屬性特征信息將量測結果初步劃分為目標(正樣本)與雜波(負樣本);3)PN約束利用目標時空特性對檢測器分類結果進行更正,并完善檢測器正負樣本集,同時更新跟蹤估計結果;4)利用新的正負樣本集重新訓練檢測器的多屬性分類方法,新的分類器結構被用于下一時刻的特征分類。算法框架圖如圖2所示。 圖2 多屬性PN-PHD算法框圖 由圖可知,多屬性PN-PHD算法是迭代學習的過程。在每一時刻,檢測器的錯誤分類結果在PN約束下被一定程度更正,同時檢測器的分類能力在迭代過程中不斷得到加強,使得整個系統(tǒng)具有良好的魯棒性與學習能力,減少了傳統(tǒng)跟蹤算法在面對多雜波的復雜環(huán)境時漏檢和錯檢的問題。 圖3 真實運動軌跡 本文與基于隨機有限集的GM-PHD算法以及二屬性分類下的PN-PHD算法進行對比,驗證多屬性分類PN-PHD算法針對實際復雜雜波場景下目標跟蹤的有效性。 分別采用三種跟蹤濾波算法對雷達目標進行跟蹤,在雜波數(shù)cn=25,50,75的三種雜波環(huán)境下進行仿真。采用階次為2,階段距離為2 km的OSPA距離[12]對三種跟蹤濾波算法的精度進行評價。結果如圖4~圖6所示。 圖4 cn=25時跟蹤軌跡與OSPA距離曲線對比 圖5 cn=50時跟蹤軌跡與OSPA距離曲線對比 圖6 cn=75時跟蹤軌跡與OSPA距離曲線對比 計算三種條件下各算法的OSPA距離平均值,如表1。 表1 平均OSPA距離對比 平均OSPA距離越小,則表明跟蹤算法的跟蹤精度越高。觀察可知,雜波環(huán)境下二屬性PN-PHD算法相對傳統(tǒng)GM-PHD算法跟蹤性能有所提高,但由于雜波環(huán)境比較復雜,所以提升并不明顯,而獲取更多目標信息的多屬性PN-PHD算法則能夠更準確地跟蹤目標。而且隨著雜波數(shù)的增加,雷達目標跟蹤難度增大,二屬性PN-PHD和傳統(tǒng)GM-PHD算法算的算法精度下降很快,本文提出的多屬性PN-PHD則仍然保持了不錯的跟蹤精度。事實上,在雷達實際工作中,需要面對更為復雜多變的雜波環(huán)境,簡單的二屬性檢測往往無法實現(xiàn)目標與雜波的有效分類,多屬性檢測的實質則是引入了更多有效信息,拓寬了樣本空間的維度。結合目標更高維度下的屬性特征,整個跟蹤系統(tǒng)得以刻畫數(shù)據(jù)更為豐富的內在信息,從而實現(xiàn)跟蹤精度的提升。 本文針對TLD框架下的PN-PHD算法在實際場景中二屬性分類器無法有效分類,導致跟蹤精度受到影響的問題,引入了機器學習中的多屬性分類器。該算法充分利用多屬性分類器的優(yōu)勢,采信更多的雷達數(shù)據(jù)信息,實現(xiàn)了復雜環(huán)境下雷達對目標狀態(tài)更為穩(wěn)定精確的跟蹤。且在線迭代學習使得該算法具有很強的魯棒性,有一定的工程應用前景。2 多屬性PNPHD算法流程
3 仿真實驗
3.1 仿真條件
3.2 仿真結果
4 結 論