熊偉,朱洪峰,崔亞奇
海軍航空大學(xué) 信息融合研究所,煙臺 264001
目標(biāo)跟蹤在軍事和民用領(lǐng)域上均有著廣泛的應(yīng)用需求和發(fā)展,機(jī)動目標(biāo)跟蹤是其中的難點(diǎn)重點(diǎn)。隨著科技進(jìn)步,飛行器等目標(biāo)的機(jī)動性能不斷提高,以及應(yīng)用領(lǐng)域的擴(kuò)展、應(yīng)用場景越發(fā)復(fù)雜,使得現(xiàn)有的機(jī)動目標(biāo)算法難以滿足實(shí)際需要,因此研究機(jī)動目標(biāo)跟蹤算法具有較大的現(xiàn)實(shí)需求和實(shí)際意義。
經(jīng)典的機(jī)動目標(biāo)跟蹤算法,可以根據(jù)是否需要機(jī)動檢測分為2類:第1類通過機(jī)動檢測來對濾波器進(jìn)行調(diào)整,如變維濾波器;第2類不需要機(jī)動檢測,通過動態(tài)模型以及多模型進(jìn)行濾波器自適應(yīng),如Singer模型、當(dāng)前模型(Current Statistical model,CS)、交互式多模型(Interacting Multiple Model,IMM)等。上述的經(jīng)典機(jī)動目標(biāo)跟蹤算法,雖然有不同的機(jī)動自適應(yīng)機(jī)制和原理,但是存在以下2個共同的局限性:
一是引入了更多先驗信息和參數(shù)。機(jī)動檢測類算法需要機(jī)動檢測門限、動態(tài)模型類算法需要對過程噪聲進(jìn)行建模、多模型類算法需要模型空間。上述的信息是基于先驗信息的,同時引入了對應(yīng)的參數(shù)。
二是跟蹤能力受引入?yún)?shù)影響較大,環(huán)境適應(yīng)能力不強(qiáng)。經(jīng)典機(jī)動目標(biāo)跟蹤算法引入的參數(shù)決定了其對當(dāng)前環(huán)境的自適應(yīng)能力。但是一旦環(huán)境復(fù)雜多變時,算法模型容易失配,從而跟蹤精度降低甚至發(fā)散。
在實(shí)際的應(yīng)用中,難以準(zhǔn)確獲得上述參數(shù)的先驗信息,并且也很難去構(gòu)建環(huán)境、算法、引入?yún)?shù)之間的映射關(guān)系,因此經(jīng)典機(jī)動目標(biāo)跟蹤算法面臨著實(shí)際應(yīng)用的局限性。
神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性擬合、學(xué)習(xí)、聯(lián)想等能力,特別是近十年,以此為基礎(chǔ)的深度學(xué)習(xí)在許多行業(yè)得到應(yīng)用和探索,并展現(xiàn)出了強(qiáng)大的效能和發(fā)展前景。因此學(xué)者們不斷嘗試將神經(jīng)網(wǎng)絡(luò)運(yùn)用到機(jī)動目標(biāo)算法中,借以提高算法精度和適應(yīng)能力,根據(jù)應(yīng)用方式主要分為2種:
第1種為通過神經(jīng)網(wǎng)絡(luò)識別目標(biāo)的運(yùn)動模式、參數(shù)或者經(jīng)典跟蹤算法進(jìn)行外部直接修正,如文獻(xiàn)[10]使用長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)對IMM算法的模型概率進(jìn)行預(yù)測,文獻(xiàn)[11]使用LSTM對機(jī)動參數(shù)組進(jìn)行識別,文獻(xiàn)[12-13]通過神經(jīng)網(wǎng)絡(luò)輸出目標(biāo)的位置估計誤差,從而修正狀態(tài)估計。一方面這一類算法的原理雖然簡單,但是該類算法使用離線訓(xùn)練方式,在噪聲影響下,會使得網(wǎng)絡(luò)估計不穩(wěn)定,并且離線訓(xùn)練的方式難以建模目標(biāo)機(jī)動變化的場景,使得機(jī)動切換時跟蹤的峰值誤差增大;另一方面,外部修正的方式,破壞了經(jīng)典算法的閉環(huán)結(jié)構(gòu),降低了算法的魯棒性。從實(shí)際來看,很難將實(shí)際航跡進(jìn)行處理得到固定模式、參數(shù)的數(shù)據(jù)集。
第2種是通過循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)等對目標(biāo)進(jìn)行端到端的狀態(tài)估計和跟蹤。文獻(xiàn)[15]使用RNN和長短時循環(huán)網(wǎng)絡(luò)完成多目標(biāo)的端到端跟蹤,文獻(xiàn)[16]使用RNN構(gòu)造了一個自動編碼器,學(xué)習(xí)表示貝葉斯濾波器的3個步驟。同時在行人跟蹤、姿態(tài)估計等領(lǐng)域也有較多關(guān)于端到端的目標(biāo)狀態(tài)估計的研究成果。但是上述端到端的跟蹤算法跟蹤的軌跡較為簡單,或者有其他信息輔助,單純用于飛行器等機(jī)動目標(biāo)的跟蹤研究還需要進(jìn)一步發(fā)展。
為了解決上述問題,本文在理論推導(dǎo)機(jī)動目標(biāo)跟蹤中狀態(tài)轉(zhuǎn)移矩陣、過程噪聲和量測噪聲協(xié)方差矩陣可以在線端到端學(xué)習(xí)的基礎(chǔ)上,將神經(jīng)網(wǎng)絡(luò)與Kalman濾波器結(jié)合,得到一種可在線學(xué)習(xí)的循環(huán)Kalman神經(jīng)網(wǎng)絡(luò)(Recurrent Kalman Neural Network,RKNN),使得網(wǎng)絡(luò)中的參數(shù)能夠端到端的進(jìn)行在線學(xué)習(xí)和修正。通過生成的軌跡數(shù)據(jù)集對網(wǎng)絡(luò)進(jìn)行了訓(xùn)練和機(jī)動目標(biāo)跟蹤測試,并與3種經(jīng)典的機(jī)動目標(biāo)跟蹤算法進(jìn)行了仿真對比,結(jié)果表明,提出的在線學(xué)習(xí)的循環(huán)Kalman神經(jīng)網(wǎng)絡(luò)機(jī)動目標(biāo)跟蹤算法較之經(jīng)典算法有更高的精度、更廣泛的應(yīng)用環(huán)境以及更高的魯棒性,并且數(shù)據(jù)集獲取和預(yù)處理成本低,具有更大的實(shí)際應(yīng)用價值。
本文機(jī)動目標(biāo)跟蹤問題使用的混合狀態(tài)空間模型為
(+1)=()()+()()
(1)
(+1)=(+1)(+1)+(+1)
(2)
式中:(+1)、(+1)分別為+1時刻的狀態(tài)估計和量測;()、(+1)分別相應(yīng)時刻的狀態(tài)轉(zhuǎn)移矩陣和量測矩陣;()、(+1)分別為過程噪聲矩陣和量測噪聲向量。
高斯噪聲環(huán)境下,Kalman濾波主要過程為
(3)
(4)
(5)
(+1|)=()(|)′()+()
(6)
(+1)=(+1)(+1|)′(+1)+
(+1)
(7)
(+1)=(+1|)′(+1)(+1)
(8)
(9)
(+1|+1)=(+1|)-(+1)·
(+1)′(+1)
(10)
因此,本文需要解決的問題為,如何較傳統(tǒng)算法更加精確的建立()、()以及(+1)關(guān)于目標(biāo)機(jī)動、Kalman算法的映射模型,提高算法跟蹤機(jī)動目標(biāo)的能力。
一方面雖然Kalman的中間變量如殘差、協(xié)方差等能夠一定程度反映目標(biāo)的機(jī)動狀態(tài),但是其相對于()、()以及(+1)映射關(guān)系是難以構(gòu)建的,換言之,在制作數(shù)據(jù)集時,難以從真實(shí)目標(biāo)軌跡和量測,得到()、()以及(+1)的準(zhǔn)確值或者調(diào)節(jié)因子;另一方面,現(xiàn)實(shí)情況中,去獲取特定類型的目標(biāo)軌跡難以實(shí)現(xiàn)且人工成本高昂,軌跡數(shù)據(jù)的預(yù)處理較為復(fù)雜。因此,使用端到端的在線學(xué)習(xí)是最符合實(shí)際的選擇。
根據(jù)文獻(xiàn)[5]的推導(dǎo),本文中將加速度變化的機(jī)動目標(biāo)轉(zhuǎn)移矩陣建模為
(11)
式中:()為調(diào)節(jié)參數(shù)向量(其中每個元素∈(0, 1))。對于()、(+1),從簡化問題和便于處理的角度,將其分別建模為
()=()
(12)
(+1)=()
(13)
式中:()、()∈(0, 1)分別為過程噪聲和量測噪聲協(xié)方差矩陣的幅度調(diào)節(jié)因子;、分別為初始化的過程及量測噪聲常數(shù)矩陣。
令構(gòu)造的神經(jīng)網(wǎng)絡(luò)模型為Net,網(wǎng)絡(luò)時刻的輸入為(),則本文需要實(shí)現(xiàn)的模型為
(14)
′()=·()
(15)
式中:()為神經(jīng)網(wǎng)絡(luò)在時刻的輸入矢量,于2.2節(jié)中進(jìn)行具體說明;為幅度常數(shù)向量,使網(wǎng)絡(luò)輸出能夠符合使用需求。
(16)
(17)
(18)
(19)
(20)
(21)
Kalman算法結(jié)合神經(jīng)網(wǎng)絡(luò),在線通過上一時刻狀態(tài)和協(xié)方差,根據(jù)當(dāng)前時刻的量測,得到當(dāng)前時刻的狀態(tài)估計和協(xié)方差,并且修正中間參數(shù)、。將上一時刻狀態(tài)和協(xié)方差作為隱藏信息,量測和狀態(tài)估計分別作為輸入輸出,此時算法可以視為一種廣義的循環(huán)神經(jīng)網(wǎng)絡(luò)。為便于書寫,后面將循環(huán)Kalman神經(jīng)網(wǎng)絡(luò)簡稱為RKNN。
RNN由于其特殊的時序結(jié)構(gòu),即使其內(nèi)部結(jié)構(gòu)簡單(僅由2個激活函數(shù)和2層線性網(wǎng)絡(luò)構(gòu)成),仍然能夠?qū)W習(xí)大量時序信息。同時,理論上,單隱層線性網(wǎng)絡(luò)能夠趨近于任何非線性函數(shù)。因此,本文認(rèn)為,、兩個參數(shù)與機(jī)動和Kalman的映射關(guān)系,不必使用那么復(fù)雜的網(wǎng)絡(luò),要充分利用時序信息的時間特征。因此本文提出的RKNN網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。
圖1 RKNN網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 RKNN network structure diagram
令Linear為單層線性網(wǎng)絡(luò),normal(·)為歸一化處理,則圖一中網(wǎng)絡(luò)輸入到輸出計算如下:
()=normal(′()()())
(22)
(23)
(24)
(25)
(26)
(27)
根據(jù)循環(huán)網(wǎng)絡(luò)特性,當(dāng)設(shè)定好時間窗后,RKNN就可以根據(jù)時間窗內(nèi)的目標(biāo)信息對、進(jìn)行修正。令RKNN為seq-to-seq模式,為時間窗,即
(28)
令為第個時間窗內(nèi)的平均誤差,即
(29)
假設(shè)為網(wǎng)絡(luò)需要訓(xùn)練的參數(shù)集,則有
(30)
數(shù)值需要合理選擇,一方面目標(biāo)當(dāng)前時刻狀態(tài)依賴的歷史信息時間段不會太長,數(shù)值過小則無法讓網(wǎng)絡(luò)獲取足夠的歷史經(jīng)驗信息;另一方面其數(shù)值太大使得在BPTT反向傳播中,會出現(xiàn)梯度消失的問題(同RNN梯度消失原理一致)。
總結(jié)RKNN計算流程如下:
1) 選擇、參數(shù)值,目標(biāo)狀態(tài)向量和協(xié)方差矩陣初始化,采用Kalman濾波算法跟蹤一步或多步得到較為穩(wěn)定初始狀態(tài)和新息。
2) 由歷史信息和當(dāng)前量測根據(jù)式(22)~式(24) 計算神經(jīng)網(wǎng)絡(luò)當(dāng)前時刻輸入,再由式(25)~式(27)表示的神經(jīng)網(wǎng)絡(luò)結(jié)合式(11)~式(13)計算得到()、()以及(+1)。
4) 若為訓(xùn)練階段,重復(fù)流程2)~3)步驟完成一個時間窗即次后,計算時間窗內(nèi)平均誤差值,進(jìn)行誤差反向傳播訓(xùn)練RKNN,返回流程2),重復(fù)流程流程2)~4)直到目標(biāo)軌跡結(jié)束;若為跟蹤過程,返回流程2),重復(fù)流程2)~4)直到目標(biāo)軌跡結(jié)束。
本文采用仿真數(shù)據(jù)集。單模型類機(jī)動目標(biāo)跟蹤算法主要考查加速度變化的機(jī)動情況。目標(biāo)軌跡生成規(guī)則如表1所示。
表1中rand(,)表示從到的均勻分布。目標(biāo)在起始時進(jìn)行勻速直線運(yùn)動,到了隨機(jī)產(chǎn)生的機(jī)動時間點(diǎn)開始機(jī)動(加速度改變),轉(zhuǎn)變?yōu)閯蚣铀龠\(yùn)動,加速度變化方式為保證不超過最大加速度前提下的隨機(jī)階躍變化。
表1 數(shù)據(jù)集生成規(guī)則Table 1 Data set generation rules
隨機(jī)產(chǎn)生1 000條作為訓(xùn)練數(shù)據(jù)集,軌跡如圖2所示。
圖2 訓(xùn)練集軌跡Fig.2 Training set trajectory
根據(jù)第2節(jié)描述,Linear及Linear的輸入維度大小分別為4和1;本文設(shè)定該2個線性層輸出維度即隱層大小或Linear的輸入維度為20。
網(wǎng)絡(luò)輸入的歸一化規(guī)則為
(31)
(32)
(33)
由于目標(biāo)軌跡序列數(shù)值是在初始位置的基礎(chǔ)上進(jìn)行變化的,而目標(biāo)的初始位置數(shù)值變化區(qū)間較大,會對歸一化因子的選擇、歸一化后的數(shù)值壓縮程度產(chǎn)生負(fù)面影響,因此在式(31)~式(32)中通過對目標(biāo)狀態(tài)和量測的前后增量進(jìn)行歸一化來去除初始狀態(tài)這一“直流分量”的影響。式(33)是目標(biāo)機(jī)動檢測中常用的歸一化新息平方計算式。
本文認(rèn)為,當(dāng)目標(biāo)采樣率高于1 Hz時,其位置增量不會超過最大速度大小,根據(jù)表1,=400 m/s。歸一化新息加權(quán)范數(shù)的最大值,根據(jù)經(jīng)驗,設(shè)定為=10。
訓(xùn)練時,為了使算法初期穩(wěn)定,在目標(biāo)的前內(nèi)使用標(biāo)準(zhǔn)的勻速直線Kalman濾波(此后的算法測試和算法對比時所有算法均使用該設(shè)定)。后使用RKNN模型進(jìn)行跟蹤和訓(xùn)練,令采樣間隔為,令目標(biāo)過程噪聲和量測方差初值分別為、, 則有
(34)
=q
(35)
=[]
(36)
由于RKNN中,、根據(jù)式(12)和式(13)進(jìn)行調(diào)節(jié),sigmoid層會使得、輸出為[0,1],理論上只要將、設(shè)定為一個大于實(shí)際量測和過程噪聲方差即可,網(wǎng)絡(luò)能夠進(jìn)行自適應(yīng)調(diào)整。
(37)
由于訓(xùn)練集含有噪聲,為了提高網(wǎng)絡(luò)的泛化能力,減少過擬合,采用蒙特卡洛的方式進(jìn)行訓(xùn)練,即每輪訓(xùn)練開始時,數(shù)據(jù)集重新添加量測噪聲再送入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。雖然這樣會使得訓(xùn)練精度降低以及訓(xùn)練出現(xiàn)波動,但是能夠使得網(wǎng)絡(luò)更準(zhǔn)確的學(xué)習(xí)得到數(shù)據(jù)概率分布。
本文使用Python3.7作為編程語言,Pytorch1.2.0作為深度學(xué)習(xí)框架,采用一塊GeForce RTX 2080Ti GPU進(jìn)行實(shí)驗加速。
訓(xùn)練集軌跡條數(shù)為1 000,batch大小為1 000,訓(xùn)練輪數(shù)為2 000,初始學(xué)習(xí)率設(shè)為0.005,使用余弦退火函數(shù)進(jìn)行學(xué)習(xí)率調(diào)整,衰減的半周期為2 000輪,即第2 000輪學(xué)習(xí)率將衰減為0。
每輪訓(xùn)練完成后,將所有軌跡、所有時間窗的loss均值作為該輪整體loss。令訓(xùn)練集噪聲方差為,記錄網(wǎng)絡(luò)在1 900輪之后的最低loss,如表2 所示。
從表2可以看到,RKNN模型訓(xùn)練最后能夠收斂,且降低了約50%的量測噪聲,量測噪聲越大,降低幅度越大。參數(shù)設(shè)置要求不高,對于、,只要設(shè)置一個較大的值,在大于等于目標(biāo)噪聲參數(shù)閾值的情況下,算法訓(xùn)練時能夠自動調(diào)節(jié),魯棒性較強(qiáng)。
表2 RKNN最小訓(xùn)練誤差記錄Table 2 Record of RKNN minimum training error
在網(wǎng)絡(luò)訓(xùn)練好之后,需要進(jìn)行網(wǎng)絡(luò)測試。為了體現(xiàn)RKNN算法的性能和自適應(yīng)能力,將RKNN與經(jīng)典算法同時進(jìn)行測試與比較。對比算法分別采用當(dāng)前模型(CS)、Singer模型以及交互式多模型算法(IMM)。
分別在量測噪聲方差已知和未知2種環(huán)境下進(jìn)行算法測試。測試數(shù)據(jù)集為200條隨機(jī)生成的軌跡。選用表2中序號為2環(huán)境訓(xùn)練得到的網(wǎng)絡(luò)進(jìn)行測試。在測試數(shù)據(jù)集上疊加標(biāo)準(zhǔn)差為5~100 m,步長為5 m的高斯白噪聲作為量測噪聲,測試RKNN以及對比算法在測試集上的平均L1誤差。
1) 量測噪聲已知
此時對比的3個算法仿真所用噪聲均與測試集疊加噪聲一致。
CS模型算法機(jī)動頻率設(shè)為1/20,最大加速度為30 m/s;Singer模型算法機(jī)動頻率設(shè)為1/20,最大加速度為30 m/s時,概率為0.9,加速度為0 m/s時,概率為0.1;CS及Singer模型過程噪聲均設(shè)置為1。IMM算法采用3個過程噪聲方差分別為0.001、1、10的勻加速Kalman模型,IMM的模型轉(zhuǎn)移矩陣設(shè)置為
(38)
在測試集上測試RKNN以及3種對比算法量測噪聲與位置估計平均L1誤差的曲線如圖3所示。
圖3 位置估計平均L1誤差對比曲線(仿真1)Fig.3 Mean L1 error comparison curves for position estimation (simulation 1)
CS模型算法機(jī)動頻率設(shè)為1/60,最大加速度為20 m/s;Singer模型算法機(jī)動頻率設(shè)為1/60,最大加速度為20 m/s時,概率為0.5,加速度為0時,概率為0.5;CS及Singer模型過程噪聲均設(shè)置為1。IMM算法采用2個過程噪聲方差分別為0.001、1的Kalman勻加速模型,IMM的模型轉(zhuǎn)移矩陣設(shè)置為
(39)
在測試集上測試RKNN以及3種對比算法量測噪聲與位置估計平均L1誤差的曲線如圖4所示。
圖4 位置估計平均L1誤差對比曲線(仿真2)Fig.4 Mean L1 error comparison curves for position estimation (simulation 2)
2) 量測噪聲未知
此時3種算法對測試集噪聲參數(shù)未知。在仿真1下3種算法參數(shù)設(shè)置的基礎(chǔ)上,將這3種對比算法的量測噪聲標(biāo)準(zhǔn)差,分別固定在=30 m,70 m,重復(fù)仿真1的實(shí)驗,得到結(jié)果如圖5所示。
在量測噪聲已知的環(huán)境中,觀察圖3及圖4,使用量測噪聲標(biāo)準(zhǔn)差為50 m訓(xùn)練得到的RKNN模型跟蹤算法,較之其他3種經(jīng)典算法,測量噪聲標(biāo)準(zhǔn)差在約38~80 m處具有最低平均L1誤差,即跟蹤精度最高。同時對比圖3和圖4可以看到,經(jīng)典的機(jī)動跟蹤算法對自身參數(shù)較為敏感,不同的參數(shù)使得3種算法的表現(xiàn)前后相差較大。而這些參數(shù)需要先驗知識來進(jìn)行估計,而實(shí)際中很難獲取足夠的先驗知識來較為準(zhǔn)確的指定參數(shù)。RKNN需要很少的先驗參數(shù),并且其參數(shù)的選取要求較低,只需要足夠大使得算法調(diào)節(jié)范圍滿足要求即可。由激活函數(shù)sigmoid性質(zhì)可知,輸出在[0,1]區(qū)間,輸出值越遠(yuǎn)離0.5,函數(shù)梯度越緩。因此在圖3和圖4中,在量測噪聲小于約38 m 大于約80 m時,神經(jīng)網(wǎng)絡(luò)需要輸出較小(較大)的值才能使參數(shù)符合實(shí)際情況,越遠(yuǎn)離中心調(diào)節(jié)“精細(xì)”程度越低,輸出較小值時,目標(biāo)機(jī)動和噪聲對算法的影響程度變大;輸出較大值時,預(yù)設(shè)參數(shù)不足以達(dá)到實(shí)際值。以上2種原因造成了圖3和圖5中起始和結(jié)束階段RKNN優(yōu)勢較差。
在量測噪聲未知的環(huán)境中,由圖4和圖5可以看到,3種經(jīng)典的機(jī)動目標(biāo)跟蹤算法在實(shí)際噪聲大小與算法預(yù)設(shè)大小不匹配時,兩者相差越大,對算法的精度影響越大。而RKNN由于進(jìn)行了噪聲自適應(yīng),因此對噪聲先驗知識要求很低,并且在其最優(yōu)適應(yīng)范圍外,算法性能變化不大。
圖5 位置估計平均L1誤差對比曲線Fig.5 Mean L1 error comparison curves for position estimation
在仿真1中,隨機(jī)選取2條軌跡,進(jìn)行蒙特卡洛實(shí)驗,以進(jìn)一步分析RKNN性能。
(40)
對隨機(jī)抽出的2條軌跡進(jìn)行200次蒙特卡洛仿真實(shí)驗,疊加量測噪聲標(biāo)準(zhǔn)差為50 m。得到4種算法的RMSE對比圖如圖6所示。同時隨機(jī)抽取一次仿真,得到4種算法的跟蹤結(jié)果圖如圖7 和圖8所示。
將4種算法的加速度估計以及真實(shí)加速度對比于圖9,同時將RKNN的調(diào)節(jié)因子、、在軌跡中的變化情況相對于加速度的變化情況對比于圖10。
記錄4種算法在200次仿真實(shí)驗下的程序運(yùn)行時間以及圖7和圖8的4種算法在整條軌跡上的平均RMSE,見表3。
本節(jié)從測試集中隨機(jī)選取了2條軌跡進(jìn)行RKNN和在仿真1參數(shù)設(shè)定下的3種對比算法的跟蹤測試。由圖6~圖8可以看到,RKNN在目標(biāo)機(jī)動較小及非機(jī)動區(qū)域相比其他3種算法具有最高的跟蹤精度;而機(jī)動較大時,RKNN相比IMM和CS算法跟蹤更為穩(wěn)定,峰值RMSE誤差更小,稍微大于Singer跟蹤算法的峰值誤差。
圖6 4種算法跟蹤RMSE對比Fig.6 Comparison of tracking RMSE of four algorithms
圖7 4種算法估計軌跡對比(軌跡1)Fig.7 Comparison of estimating trajectories of four algorithms (trajectory 1)
圖8 4種算法估計軌跡對比(軌跡2)Fig.8 Comparison of estimating trajectories of four algorithms (trajectory 2)
從圖9可以看到,RKNN能夠估計目標(biāo)加速度變化的趨勢,并且較之其他3種對比算法,加速度估計更加平滑,因此跟蹤更為穩(wěn)定。同時可以發(fā)現(xiàn),RKNN對大加速度的估計較為“保守”,估計值更為偏小,因此其在小加速度的情況下,跟蹤優(yōu)勢更為明顯。
圖9 4種算法加速度估計對比Fig.9 Comparison of acceleration estimation with four algorithms
從圖10可以看到,RKNN的調(diào)節(jié)因子在目標(biāo)加速度變化之后,經(jīng)過短暫的延遲,、在開始發(fā)揮調(diào)節(jié)作用;對于,其穩(wěn)定在0.5左右,RKNN量測噪聲方差閾值設(shè)定為4 900 m,軌跡的量測噪聲方差為2 500 m,因此正確,也說明了RKNN在量測噪聲方面的自適應(yīng)能力。
圖10 RKNN調(diào)節(jié)因子變化圖Fig.10 Variation graph of RKNN regulatory factor
從圖9可以看到,RKNN的機(jī)動收斂時間在本文仿真環(huán)境下為5~10 s。而其他3種對比算法波動較大,收斂程度較差。
從時間復(fù)雜度上分析,令為目標(biāo)狀態(tài)維度,則可以計算出Singer、CS和IMM的單次迭代時間復(fù)雜度為(2)、(2)以及(6)(為了便于對比,保留了頻度最高階項系數(shù),IMM模型數(shù)為3,故濾波時間頻次為3倍);對于RKNN,其使用的神經(jīng)網(wǎng)絡(luò)簡單,中間的唯一參數(shù)為隱藏層大小,令量測維度為,神經(jīng)網(wǎng)絡(luò)輸出維度為,則根據(jù)式(25)~式(27)以及對比算法的復(fù)雜度,可以得到RKNN的復(fù)雜度為
=(2)+(2+++2)
(41)
式中:表示時間頻度,可見RKNN較之Singer、CS算法,增加的運(yùn)算成本不高,不存在高階復(fù)雜度項,而IMM的時間復(fù)雜度最高,增長最快。
從表3來看,RKNN由于弱機(jī)動和非機(jī)動時具有最高跟蹤精度,強(qiáng)機(jī)動時具有較強(qiáng)穩(wěn)定性,因此從整體軌跡來看,其具有最小的平均RMSE,較之3種算法中最優(yōu)的IMM能提高1~2 m的精度。從運(yùn)行時間來看,長度為200步的軌跡,進(jìn)行200次跟蹤,RKNN僅需要0.112 1 s,能夠滿足實(shí)際需要,雖然是CS、Singer耗費(fèi)時間的2倍,但較之3種算法中最優(yōu)的IMM算法,其時間僅為其20%左右。
表3 仿真運(yùn)行時間和結(jié)果記錄Table 3 Simulation running time and result recording
綜上,本文分別從整體和個體2個角度對RKNN及3種對比算法進(jìn)行了測試和跟蹤。仿真表明,RKNN機(jī)動目標(biāo)跟蹤算法在訓(xùn)練好之后,只需要很少的先驗知識就可以進(jìn)行穩(wěn)定的機(jī)動目標(biāo)跟蹤,魯棒性很強(qiáng),具有較寬的最優(yōu)適應(yīng)區(qū)域。在跟蹤弱機(jī)動和非機(jī)動軌跡時精度較之其他3種算法最高,而跟蹤強(qiáng)機(jī)動時,穩(wěn)定性也較強(qiáng),整體精度最高。
上述仿真均是從一維角度進(jìn)行的,從實(shí)際應(yīng)用考慮和進(jìn)一步研究,下面進(jìn)行簡單的二維目標(biāo)跟蹤仿真實(shí)驗。在一般跟蹤環(huán)境中,能對目標(biāo)的維度進(jìn)行分別跟蹤,此時使用RKNN對單個維度進(jìn)行分別跟蹤。采用表1的數(shù)據(jù)集生成規(guī)則隨機(jī)生成一條二維軌跡,使用4.2節(jié)單維跟蹤仿真實(shí)驗相同的噪聲和算法預(yù)設(shè)條件,得到仿真結(jié)果如圖11~圖13所示。
圖11 4種算法跟蹤RMSE對比(二維)Fig.11 Comparison of tracking RMSE of four algorithms (2D)
圖12 4種算法跟蹤結(jié)果對比(二維)Fig.12 Comparison of tracking results of four algorithms (2D)
圖13 4種算法加速度估計對比(二維)Fig.13 Comparison of acceleration estimation of four algorithms (2D)
從圖11~圖13可以看到,在二維解耦條件下時,RKNN仍然能以最好的效果完成跟蹤,具體表現(xiàn)與前面一維的仿真結(jié)果一致,這里不再贅述。在實(shí)際的應(yīng)用中,在目標(biāo)模式較為簡單或者維度之間耦合性不強(qiáng)的情況下,本文提出的一維RKNN可以直接應(yīng)用。
從成本上考慮,RKNN借鑒RNN的結(jié)構(gòu),只用很簡單的神經(jīng)網(wǎng)絡(luò)就能對目標(biāo)的時序信息進(jìn)行處理和記憶,因此只犧牲了很小的效率,就可以在穩(wěn)定性、適應(yīng)性以及綜合跟蹤能力優(yōu)于其他3種跟蹤算法,運(yùn)行時間更是只有IMM的20%。
從實(shí)際應(yīng)用考慮,一方面RKNN由于使用在線學(xué)習(xí)的方法,因此幾乎不需要對數(shù)據(jù)集進(jìn)行預(yù)處理,也不需要對目標(biāo)航跡進(jìn)行分類、篩選等處理,就可以對算法進(jìn)行訓(xùn)練。在實(shí)際應(yīng)用中,目標(biāo)的真實(shí)航跡,可以使用GPS等高精度位置信息以及AIS、ADS-B等數(shù)據(jù),數(shù)據(jù)集成本很低。另一方面,雖然本文為了簡化研究,處理的是一維目標(biāo)跟蹤,但是二維、三維均可以使用矩陣求導(dǎo)將算法推導(dǎo)出來,并且現(xiàn)在主流的深度學(xué)習(xí)平臺大多具有自動求導(dǎo)(Autograd)機(jī)制,如Pytorch,并不需要人為去實(shí)際求梯度,算法實(shí)現(xiàn)的成本也很低,這也是本文下一步的研究方向之一。RKNN提供了一種將經(jīng)典算法與深度學(xué)習(xí)結(jié)合的在線端到端學(xué)習(xí)的思路,未來可以進(jìn)一步進(jìn)行擴(kuò)展。
因此,在面對未來愈發(fā)復(fù)雜的跟蹤環(huán)境和復(fù)雜運(yùn)動目標(biāo),RKNN機(jī)動目標(biāo)跟蹤算法具有較大的發(fā)展價值和實(shí)際意義。
1) 從理論上證明了RKNN網(wǎng)絡(luò)端到端在線學(xué)習(xí)的可行性,通過訓(xùn)練證明算法能夠收斂。
2) RKNN訓(xùn)練成本較低,跟蹤時需要的先驗知識很少。運(yùn)行效率很高,效率是CS、Singer算法的50%,IMM算法的5倍。
3) RKNN魯棒性相比于其他3種算法最高,整體跟蹤精度在其最優(yōu)區(qū)域最低,最優(yōu)區(qū)域較寬,在跟蹤弱機(jī)動和非機(jī)動航跡時相比其他3種算法具有最高跟蹤精度,跟蹤強(qiáng)機(jī)動時穩(wěn)定性較強(qiáng)。
4) RKNN容易實(shí)現(xiàn),可擴(kuò)展性強(qiáng),數(shù)據(jù)集獲取和預(yù)處理成本低。