黃馨譽(yù), 胡士強(qiáng), 鄭世友
(1.上海交通大學(xué) 航空航天學(xué)院,上海 200240;2.中航雷達(dá)與電子設(shè)備研究院 射頻與仿真重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫 214063)
?
計(jì)算與測試
基于PN學(xué)習(xí)的雷達(dá)目標(biāo)魯棒跟蹤算法*
黃馨譽(yù)1, 胡士強(qiáng)1, 鄭世友2
(1.上海交通大學(xué) 航空航天學(xué)院,上海 200240;2.中航雷達(dá)與電子設(shè)備研究院 射頻與仿真重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫 214063)
傳統(tǒng)雷達(dá)目標(biāo)跟蹤算法在強(qiáng)雜波環(huán)境下跟蹤時(shí)會產(chǎn)生大量虛警估計(jì)的情況,單獨(dú)跟蹤或檢測算法都不能對干擾雜波進(jìn)行有效濾除。針對這個(gè)問題,在傳統(tǒng)概率假設(shè)密度濾波器(PHD)算法的基礎(chǔ)上,提出一種聯(lián)合檢測—跟蹤—學(xué)習(xí)的目標(biāo)魯棒跟蹤算法,即PN—PHD,引入屬性檢測器,將檢測跟蹤結(jié)果一起送入PN學(xué)習(xí)器,通過PN學(xué)習(xí)迭代更新檢測器,并修正PHD算法的跟蹤估計(jì),以此實(shí)現(xiàn)在強(qiáng)雜波環(huán)境目標(biāo)魯棒跟蹤的要求。仿真實(shí)驗(yàn)結(jié)果表明:PN—PHD濾波算法與傳統(tǒng)跟蹤算法相比,在強(qiáng)雜波環(huán)境下有效地提高了目標(biāo)跟蹤準(zhǔn)確性和跟蹤精度,同時(shí)也彌補(bǔ)了 PHD算法在提供目標(biāo)航跡信息方面的不足。
目標(biāo)跟蹤; PN學(xué)習(xí); 概率假設(shè)密度濾波器
復(fù)雜環(huán)境下的目標(biāo)精確跟蹤一直是目標(biāo)跟蹤領(lǐng)域研究的熱點(diǎn)問題之一。由于氣象、電磁、相似目標(biāo)等干擾影響,量測集中不僅包括目標(biāo)量測,還包括大量雜波信息,使得目標(biāo)精確跟蹤變得尤為困難。
為了減少干擾因素對跟蹤精度的影響,目前經(jīng)常使用的方法主要分為兩類:第一類方法[1]先通過數(shù)據(jù)關(guān)聯(lián)完成觀測與目標(biāo)間的分配,再利用濾波技術(shù)完成目標(biāo)狀態(tài)估計(jì)。在強(qiáng)雜波下該類算法會出現(xiàn)組合爆炸,關(guān)聯(lián)很難實(shí)現(xiàn)。第二類是基于隨機(jī)有限集的方法[2~4]將目標(biāo)狀態(tài)和觀測表達(dá)為隨機(jī)有限集合的形式,在貝葉斯框架下估計(jì)目標(biāo)狀態(tài)。該類算法雖然避免了數(shù)據(jù)關(guān)聯(lián),但在雜波強(qiáng)度增大的情況下會出現(xiàn)大量錯(cuò)估的情況。
而在視頻跟蹤領(lǐng)域中,Kalal Z提出的“跟蹤—學(xué)習(xí)—檢測”(tracking-learning-detection,TLD)算法[5]已實(shí)現(xiàn)了單視頻目標(biāo)長時(shí)間精確跟蹤。本文正是將TLD算法的學(xué)習(xí)機(jī)制引入點(diǎn)目標(biāo)跟蹤,提出基于PN學(xué)習(xí)[6]的高斯混合概率假設(shè)密度濾波器(GM—PHD)[4]目標(biāo)跟蹤算法,即PN-PHD。其基本思想是:先利用獨(dú)立的跟蹤器和檢測器分別對目標(biāo)狀態(tài)和屬性進(jìn)行估計(jì)和分類,再將估計(jì)分類結(jié)果一起輸入PN學(xué)習(xí)器進(jìn)行在線學(xué)習(xí),最后將學(xué)習(xí)結(jié)果反饋到跟蹤器并同時(shí)更新檢測器。通過該方法可以消除傳統(tǒng)PHD算法跟蹤時(shí)所產(chǎn)生虛警估計(jì)問題并提供了目標(biāo)航跡信息。
P-N 約束是具有以下功能的任意函數(shù):輸入是經(jīng)過分類后的標(biāo)記樣本集L,輸出是更正標(biāo)記樣本(Xc,k,Yc,k)。P-N約束的核心思想是目標(biāo)的時(shí)空特性,即目標(biāo)在同一時(shí)刻只能出現(xiàn)在一個(gè)地方,且目標(biāo)運(yùn)動在時(shí)間上具有連續(xù)性。
根據(jù)跟蹤器第K時(shí)刻的目標(biāo)跟蹤估計(jì)結(jié)果Xk,將目標(biāo)位置半徑為r以內(nèi)區(qū)域定義為目標(biāo)候選區(qū)。再將第K時(shí)刻檢測器的檢測結(jié)果Lk輸入學(xué)習(xí)器,將置信度高于α的量測樣本為候選目標(biāo)量測,置信度低于β標(biāo)記為雜波量測。如果在目標(biāo)候選區(qū)域內(nèi)存在“正”樣本,P約束首先對所有標(biāo)記為“負(fù)”的量測樣本進(jìn)行檢查,將位于目標(biāo)候選區(qū)域且置信度β<μ<α的量測樣本標(biāo)記更正為“正”,加入檢測器正訓(xùn)練集。N約束對所有標(biāo)記為“正”的量測樣本進(jìn)行檢查,當(dāng)候選目標(biāo)區(qū)域中存在高置信度量測樣本時(shí),N約束直接將候選區(qū)域外的量測樣本標(biāo)記更正為“負(fù)”,加入檢測器負(fù)訓(xùn)練集;而當(dāng)候選目標(biāo)區(qū)域中不存在高置信度量測樣本時(shí),N約束在域外“正”標(biāo)記樣本中選擇置信度最高的量測樣本作為目標(biāo)量測更新跟蹤器,同時(shí)將其余“正”標(biāo)記量測樣本更正為“負(fù)”加入檢測器負(fù)訓(xùn)練集。
3.1 屬性信息分類
PN學(xué)習(xí)中分類器需要對目標(biāo)觀測進(jìn)行檢測,由于無法就單幀的目標(biāo)狀態(tài)信息對目標(biāo)和雜波進(jìn)行分類,故本文引入目標(biāo)屬性信息。雷達(dá)、ESM等傳感器在對點(diǎn)目標(biāo)掃描時(shí)所產(chǎn)生的屬性量測可以作為目標(biāo)屬性特征,包括目標(biāo)信噪比、反射截面積以及載頻等。由于點(diǎn)目標(biāo)跟蹤存在先驗(yàn)數(shù)據(jù)少,單特征分類能力弱,信號漂移嚴(yán)重等問題,故本文中利用已有模型[7]建立雷達(dá)信噪比(SNR)和EMS載頻信息的仿真數(shù)據(jù),采用Adaboost算法對多個(gè)弱分類器進(jìn)行組合,達(dá)到強(qiáng)分類效果。
3.2 PN-PHD算法流程
本文基于GM-PHD以Adaboost為檢測器引入PN學(xué)習(xí),具體結(jié)構(gòu)框架如圖1所示。
圖1 PN-PHD 結(jié)構(gòu)框架圖Fig 1 Frame of PN-PHD
在GM-PHD濾波的更新迭代過程中,以歐氏距離為標(biāo)準(zhǔn),設(shè)定跟蹤結(jié)果半徑r內(nèi)為目標(biāo)門,并對門內(nèi)和門外的量測值做PN學(xué)習(xí)。其具體步驟如下:
1)將GM-PHD跟蹤器輸出的目標(biāo)估計(jì)位置作為目標(biāo)門中心點(diǎn),將檢測器分類結(jié)果劃分為門內(nèi)樣本集和門外樣本集;
2)根據(jù)P約束,檢查門內(nèi)是否存在高置信度樣本,將漏檢目標(biāo)更新到正樣本庫;
3)根據(jù)N約束,檢查門外高置信度樣本是否為目標(biāo)樣本,將虛假檢測更新到負(fù)樣本庫;
4)根據(jù)PN約束更新跟蹤估計(jì),并對PHD得出的錯(cuò)誤估計(jì)進(jìn)行剪枝;
5)利用更新后的正負(fù)樣本集訓(xùn)練下一步的檢測器。
由此可見,在起始目標(biāo)屬性信息較少的情況下,可以通過在線不斷學(xué)習(xí)來完善目標(biāo)屬性特征記錄,本文算法由于引入PN學(xué)習(xí)具有在線學(xué)習(xí)能力,即使目標(biāo)出現(xiàn)漏檢、錯(cuò)跟及失跟的情況,在下一時(shí)刻目標(biāo)出現(xiàn)時(shí),能根據(jù)檢測結(jié)果及跟蹤結(jié)果通過PN約束重新跟上目標(biāo)。其完整流程如下:
輸入:目標(biāo)初始位置X0,初始屬性信息訓(xùn)練集A0
輸出:Xkx,Akx,tracker()
初始化:使用A0訓(xùn)練檢測器detecter(),初始化跟蹤器tracker();
第kx幀時(shí)處理流程:
Xkx=tracker(Xkx-1),Lkx=detecter(Zkn),
P學(xué)習(xí)過程:
If size(Xkx)≠0
for everyxi∈Xkx(i=1,2…nkn)
計(jì)算觀測集Zkx與xi之間的歐氏距離;
取定小于門半徑r的觀測值為候選目標(biāo)值,記為Zindoor觀測集;
For everyzii∈Zindoor(i=1,2…nindoor)
ifZtrue={lzii>threshold|zii∈Zindoor(i=1,2,…nindoor)}
存在,即高置信度檢測結(jié)果存在于候選區(qū)域內(nèi),則xi=xi,保留跟蹤器結(jié)果;
else
Ztrue=0;等待轉(zhuǎn)入N學(xué)習(xí)器更正目標(biāo)位置;
end
end
將Z_tr={lzii>tr_thr|zii∈Zindoor(i=1,2…nindoor)},加入Akx正樣本訓(xùn)練集
end
else
從Zkx中選擇z(l>threshold)作為新的目標(biāo)點(diǎn)xnew加入Xkx中;
如果不存在則跳過該幀,認(rèn)為幀內(nèi)無目標(biāo);
end
N學(xué)習(xí)過程:
將zi?Zindoor歸類為Zoutdoor
IfZtrue≠0,即門內(nèi)已有真目標(biāo)
將z={lzii>threshold|zii∈Zoutdoor(i=1,2…nindoor)}加入Akx負(fù)樣本訓(xùn)練集
else
從Zoutdoor中選擇z(l>threshold)作為新的目標(biāo)點(diǎn)替換入Xkx中;
end
retraining(tracker(),Akx)
end
為簡化仿真實(shí)驗(yàn)的條件,本文僅考慮目標(biāo)在二維平面空間內(nèi)的情況。假設(shè)目標(biāo)的探測范圍為[0,20]km×[0,20]km,目標(biāo)的初始狀態(tài)為[5 10 0.15 0 0 0]km,目標(biāo)做幾字型機(jī)動運(yùn)動,目標(biāo)加速度(km/s2)在第15~20 s為[- 0.03 0.03],第35~40 s為[0.03 -0.03],第55~60 s為[-0.03 -0.03],第75~80 s[0.03 0.03],其余時(shí)間做勻速運(yùn)動。屬性量測采用目標(biāo)的信號幅度和載波頻率獲得。假設(shè)目標(biāo)真實(shí)平均信噪比為20 dB,目標(biāo)真實(shí)平均載頻為100 Hz。目標(biāo)檢測概率為pd=0.98,λc為單位容積內(nèi)雜波個(gè)數(shù)(10-6/m2)。
圖2 目標(biāo)運(yùn)動軌跡圖Fig 2 Target trajectory
下面采用三種不同的濾波算法進(jìn)行對比,即最近鄰卡爾曼濾波(NNK)算法,GM—PHD濾波算法以及PN—PHD濾波算法,對本文算法進(jìn)行驗(yàn)證。采用最優(yōu)次分配方法即OSPA距離[8]對不同算法的估計(jì)精度進(jìn)行比較,其中階次p=2,階段距離c=2km。圖3為不同λc(10-6/m2)下各算法的OSPA曲線圖??梢钥闯?,本文算法的跟蹤精度也明顯優(yōu)于已有算法。
圖3 不同λc下各算法OSPA距離對比圖Fig 3 Comparisons of OSPA distance with different λc algorithms
從圖3看出:強(qiáng)雜波單目標(biāo)的情況下最近鄰卡爾曼濾波與GM—PHD濾波算法都不能對目標(biāo)進(jìn)行有效跟蹤,而引入PN學(xué)習(xí)對跟蹤結(jié)果起到更新矯正的作用,在失跟錯(cuò)跟的情況下可以重新跟蹤到目標(biāo),同樣在虛警的情況下有效剔除了虛假目標(biāo),從而提高跟蹤的準(zhǔn)確性和精確性,且隨著雜波個(gè)數(shù)的增多本文提出的算法具有很好的魯棒性。
本文提出了一種基于在線學(xué)習(xí)結(jié)合檢測的PN—PHD目標(biāo)跟蹤方法,該算法夠在大量雜波干擾和虛警影響下,準(zhǔn)確地對目標(biāo)進(jìn)行實(shí)時(shí)精確跟蹤。本算法通過引入PN學(xué)習(xí),在目標(biāo)初始信息較少的情況下通過目標(biāo)屬性特征的在線學(xué)習(xí)更新檢測器并更正估計(jì)結(jié)果。無論是與傳統(tǒng)的目標(biāo)跟蹤方法還是和近期提出的PHD相關(guān)濾波技術(shù)相比較而言,本文所實(shí)現(xiàn)的目標(biāo)跟蹤算法在有效提升了復(fù)雜環(huán)境下對單目標(biāo)跟蹤的準(zhǔn)確率,并提供了航跡信息。
[1] 韓崇昭,朱洪艷,段戰(zhàn)勝.多源信息融合[M].北京:清華大學(xué)出版社有限公司,2006.
[2]MahlerRPS.MultitargetBayesfilteringviafirst-ordermultitargetmoments[J].IEEETransactionsonAerospaceandElectro-nicSystems,2003,39(4):1152-1178.
[3]ZajicT,MahlerRPS.Particle-systemsimplementationofthePHDmultitarget-trackingfilter[C]∥AeroSense2003,InternationalSocietyforOpticsandPhotonics,2003:291-299.[4] Vo B N,Ma W K.The Gaussian mixture probability hypothesis density filter[J].IEEE Transactions on Signal Processing,2006,54(11):4091-4104.
[5] Kalal Z, Mikolajczyk K, Matas J.Tracking-learning-detec-tion[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34(7):1409-1422.
[6] Kalal Z, Matas J, Mikolajczyk K.Pn learning:Bootstrapping binary classifiers by structural constraints[C]∥2010 IEEE Confe-rence on Computer Vision and Pattern Recognition(CVPR),IEEE,2010:49-56.
[7] Lerro D, Bar-Shalom Y.Automated tracking with target amplitude information[C]∥American Control Conference,IEEE,1990:2875-2880.
[8] Schuhmacher D,Vo B T,Vo B N.A consistent metric for performance evaluation of multi-object filters[J].IEEE Transactions on Signal Processing,2008,56(8):3447-3457.
Robust tracking algorithm for radar target based on PN-learning*
HUANG Xin-yu1, HU Shi-qiang1, ZHENG Shi-you2
(1.School of Aeronautics and Astronautics,Shanghai Jiao Tong University,Shanghai 200240,China; 2.Key Laboratory of Radio Frequency and Simulation,Radar and Electronic Equipment Research Institute,Aviation Industry Corporation,Wuxi 214063,China)
Traditional radar target tracking algorithms usually cause more false alarms under complex environment.It is useless for single tracking or detecting algorithm to filter clutters effectively.Aiming at this problem,a new learning pattern combined attribution-detector and PN-learning framework is proposed to improve performance of joint detection and tracking framework which is based on PHD algorithm.The PN module is used to extract high-confidence targets from the results of attribution detector.Then these filtered results is used to retrain detector and modify outputs of PHD.Simulation tests show that the new method PN—PHD not only effectively improve target tracking capability in strong clutter environment,but also provide tracking information which original PHD method cannot offer.
target tracking; PN learning; probability hypothesis density filter(PHD)
10.13873/J.1000—9787(2016)12—0116—03
2016—01—15
航空基金資助項(xiàng)目(2014ZC07003,20142057006)
TN 301,TP 391.9
B
1000—9787(2016)12—0116—03
黃馨譽(yù)(1990-),女,江蘇南通人,碩士研究生,主要研究方向?yàn)槟繕?biāo)跟蹤。