高 敏 劉 洪
(1.四川大學視覺合成圖形圖像技術(shù)重點學科實驗室 成都 610045)(2.四川大學計算機學院 成都 610065)
利用雷達監(jiān)測數(shù)據(jù)識別飛行動態(tài)目標無論是在軍事上還是民用上都具有重大的意義,近年來國內(nèi)外對飛行動態(tài)目標識別都是利用傳統(tǒng)的基于物理學原理、信息融合和圖像識別的方法,常用有以下幾種方法:1)利用空中目標旋轉(zhuǎn)部件對雷達回波有調(diào)制作用的原理,利用K近鄰分類方法對飛機進行分類[1];2)利用信息融合的方法識別出飛機類型[2];3)利用飛機圖像數(shù)據(jù)結(jié)合統(tǒng)計學原理的分類方法對飛機進行分類[3]。但是這幾種方法存在的缺點和問題是對動態(tài)飛行目標識別的準確率不高,近年來隨著人工智能深度學習的流行,基于深度學習神經(jīng)網(wǎng)絡(luò)的空管系統(tǒng)也逐漸受到人們的重視,成為了研究熱點。目前已經(jīng)有一些利用飛行目標圖像結(jié)合深度學習神經(jīng)網(wǎng)絡(luò)的方法來對飛行目標進行識別判斷。本文創(chuàng)新點是利用大量的雷達監(jiān)測數(shù)據(jù)結(jié)合谷歌的深度學習框架Tensorflow來對無人機和民航飛機這類的動態(tài)飛行目標進行識別,相較于以前的基于統(tǒng)計學的識別方法具有更高的識別準確率,并且利用深度學習方法對空管系統(tǒng)的智能化具有重要的研究意義,也為動態(tài)目標識別提供了新的思路和方法。
本文首先通過一次雷達和二次雷達監(jiān)測的飛行目標數(shù)據(jù),選取原始數(shù)據(jù)中距離、方位、俯仰、X、Y五個飛行特征數(shù)據(jù),將數(shù)據(jù)預(yù)處理清洗后的雷達數(shù)據(jù)通過公式計算轉(zhuǎn)換成WGS-84坐標系下的經(jīng)度、維度和高度的特征數(shù)據(jù),再綜合雷達監(jiān)測數(shù)據(jù)中航向、速度的特征數(shù)據(jù)作為飛行目標分類器的輸入數(shù)據(jù),并對輸入數(shù)據(jù)進行PCA主成分分析,將降維后的數(shù)據(jù)進行二維平面和三維空間的可視化分析,以此來展現(xiàn)雷達監(jiān)測的不同飛行目標特征數(shù)據(jù)之間的內(nèi)在隱藏關(guān)系。最后分別通過基于統(tǒng)計學原理方法的決策樹分類器和基于深度學習的DNN神經(jīng)網(wǎng)絡(luò)分類器來訓練分類模型,并比較評估兩種不同的分類器的訓練時間和分類準確率。主要過程如圖1所示。
本節(jié)主要內(nèi)容是對飛行目標數(shù)據(jù)進行數(shù)據(jù)清理和預(yù)處理。
通過一次雷達設(shè)備得到一段時間內(nèi)監(jiān)測和處理后的無人機飛行數(shù)據(jù),其中包括了時間,批號,距離、方位、俯仰、航速、航向、周期、系統(tǒng)時間等數(shù)據(jù),再通過不同坐標系下的坐標轉(zhuǎn)換方法得到WGS-84坐標系下的經(jīng)度、緯度、高度的特征數(shù)據(jù)。一次雷達設(shè)備監(jiān)測和處理后的無人機原始數(shù)據(jù)集部分實例如表1所示。
圖1 飛行目標識別流程圖
二次雷達設(shè)備監(jiān)測和處理的是民航飛機的飛行數(shù)據(jù),其中數(shù)據(jù)包括了時間、批號、SSR、X、Y、R、Hei、航速、航向等數(shù)據(jù),再通過不同坐標系下的坐標轉(zhuǎn)換方法得到WGS-84坐標系下的經(jīng)度和緯度的特征數(shù)據(jù)。二次雷達設(shè)備監(jiān)測和處理后的民航飛機原始數(shù)據(jù)集部分實例如表2所示。
由于雷達監(jiān)測的原始數(shù)據(jù)中有一些數(shù)據(jù)有缺項,部分數(shù)據(jù)信息不完整,所以過濾清洗掉這些數(shù)據(jù)來保證和提高分類器的分類效果。原始數(shù)據(jù)中還有一些數(shù)據(jù)項和飛行目標識別分類無關(guān),比如時間、批號、周期、系統(tǒng)時間、SSR和R等數(shù)據(jù)項,通過數(shù)據(jù)預(yù)處理清洗掉這些信息數(shù)據(jù),減少分類器訓練模型的參數(shù)個數(shù)和訓練時間[4]。
表1 無人機雷達數(shù)據(jù)
表2 民航飛機雷達數(shù)據(jù)
WGS-84坐標系是一個以地球質(zhì)心為坐標原點的協(xié)議地球坐標參考系,它在幾何上以X,Y,Z軸正交構(gòu)成右手坐標系的質(zhì)心坐標系統(tǒng)。文獻[5]介紹了笛卡爾坐標系,雷達局部坐標系,地理極坐標系三種坐標系,并且給出了三種坐標系互相轉(zhuǎn)換的公式,所以可以使用論文中的方法將一次雷達設(shè)備監(jiān)測的基于地理極坐標系的無人機飛行數(shù)據(jù)轉(zhuǎn)換為基于笛卡爾坐標系的WGS-84坐標系下的飛行數(shù)據(jù),以及可以將二次雷達設(shè)備監(jiān)測的基于局部坐標系的民航飛機飛行數(shù)據(jù)轉(zhuǎn)換為基于笛卡爾坐標系的WGS-84坐標系下的飛行數(shù)據(jù)[6]。
將飛行特征數(shù)據(jù)進行數(shù)據(jù)可視化,以圖形圖像的形式來表示和展現(xiàn)飛行特征數(shù)據(jù)中隱藏的關(guān)系和未知信息,幫助分析飛行特征數(shù)據(jù)信息之間的關(guān)系。
由于提取的飛行特征數(shù)據(jù)是多維度的,要進行數(shù)據(jù)可視化需要進行數(shù)據(jù)降維。PCA主成分分析可以在減少需要分析的飛行數(shù)據(jù)維度指標時,盡量減少原始飛行數(shù)據(jù)包含信息的損失,達到對原始飛行數(shù)據(jù)進行全面分析的目的[7]。通過PCA主成分分析將速度、航向、經(jīng)度、緯度、高度五個維度的特征數(shù)據(jù)降維成二維和三維特征的數(shù)據(jù),以此來進行飛行數(shù)據(jù)在二維平面和三維空間的數(shù)據(jù)可視化[8]。
部分民航飛機和無人機的飛行數(shù)據(jù)降維后在二維平面的可視化圖如圖2所示。
圖2 民航飛機和無人機飛行數(shù)據(jù)二維平面示意圖
部分民航飛機和無人機的飛行數(shù)據(jù)降維后在三維空間的可視化圖如圖3所示。
圖3 民航飛機和無人機飛行數(shù)據(jù)三維空間示意圖
從二維平面圖可視化圖中發(fā)現(xiàn)代表民航飛行數(shù)據(jù)點的圓形處于圖2中左上角位置,代表無人機飛行數(shù)據(jù)點的三角形處于圖2中右下角位置,而在三維空間可視化圖中發(fā)現(xiàn)代表民航飛行數(shù)據(jù)點的圓形處于圖3中靠里的位置,代表無人機飛行數(shù)據(jù)點的三角形處于圖3中靠外的位置。通過二維平面和三維空間飛行數(shù)據(jù)可視化圖像,能夠觀察到代表不同飛行目標的數(shù)據(jù)點的位置的分布不同,飛行特征數(shù)據(jù)可視化圖形象直觀地展現(xiàn)了民航飛機和無人機飛行特征數(shù)據(jù)之間的不同,給分類器提供了分類依據(jù)。
本章節(jié)介紹采用傳統(tǒng)統(tǒng)計學方法即決策樹方法來對雷達監(jiān)測的飛行目標進行分類的原理過程[9]。在特征獨立性假設(shè)成立的情況下(即飛行軌跡特征速度、航向、經(jīng)度、緯度、高度相互獨立),將預(yù)處理后的數(shù)據(jù)樣本集分為訓練集、驗證集和測試集,并且把這些樣本集都分為平均的兩類數(shù)據(jù),一類為普通民航飛機飛行的數(shù)據(jù),一類為無人機飛行的數(shù)據(jù),記為D={D1,D2},數(shù)據(jù)標簽屬性記為A={a1,a2},假設(shè)當前樣本集合D中第k類樣本所占的比例為Pk的(k=1,2…,|y|),則D的信息熵定義為
標簽屬性a假設(shè)有T個可能的取值[10],根據(jù)對應(yīng)的屬性a來對樣本集D進行劃分,因為a有T個可能的取值,則就會產(chǎn)生T個分支結(jié)點,根據(jù)樣本集中所有在屬性a上取值為at的樣本,選取第t個分支結(jié)點的樣本,記為Dt,由于不同的分支結(jié)點所包含的樣本數(shù)不同,賦予權(quán)重|Dt|/|D|給分支結(jié)點,結(jié)合之前計算出的信息熵可以計算出用屬性a對樣本集D進行劃分所獲得的信息增益[11]:
選擇信息增益最大的屬性a:
最后根據(jù)著名的ID3決策樹學習算法[12]中以信息增益為準則來選擇劃分屬性,根據(jù)計算出的信息增益,遞歸生成決策樹分類模型。
本節(jié)介紹了DNN神經(jīng)網(wǎng)絡(luò)的特點和它與決策樹模型的對比分析。
傳統(tǒng)的基于統(tǒng)計學的決策樹分類模型它在假定已知各種情況發(fā)生概率的前提下,運用概率分析構(gòu)成決策樹來求得當前值的期望值與零比較大小的概率,它一般用于評估項目風險和判斷其可行性的基于統(tǒng)計學的決策分析圖解方法。它的優(yōu)點是對缺失的數(shù)據(jù)不敏感,能同時處理常規(guī)型和數(shù)據(jù)型的大批量數(shù)據(jù),并且能在相對短的時間內(nèi)訓練出預(yù)測結(jié)果良好的模型,但是它的缺點是遞歸生成的決策樹模型往往會導致過擬合,導致模型在訓練集上能有很高的準確率,但是在測試集上預(yù)測結(jié)果不準確,而且處理特征相關(guān)和連續(xù)性的數(shù)據(jù)時候效果很差。
由于受到了神經(jīng)網(wǎng)絡(luò)科學的啟發(fā),機器學習從單層感知機發(fā)展到多層感知機,而深度學習通過神經(jīng)網(wǎng)絡(luò)的深層次架構(gòu)學習出高層特征,并且隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的增加,可以學習更加復(fù)雜的非線性模型,而DNN就是超過一個隱層的深層次的神經(jīng)網(wǎng)絡(luò)模型。現(xiàn)有的DNN模型主要有以下幾點:第一,對于權(quán)值空間中的收斂值它比采用純BP算法的隨機初始權(quán)值更加接近[13];第二,隨著神經(jīng)網(wǎng)絡(luò)隱藏層層數(shù)的增加,雖然增加了模型復(fù)雜度,但是卻增強了模型的表達和泛化能力;第三,激勵函數(shù)的使用,本次分類采用的是ReLU激勵函數(shù),它以0為中心,右邊是線性函數(shù)可以保證梯度回傳很遠,左邊直接對信號進行抑制,并且在最后一層使用softmax函數(shù)進行分類預(yù)測,并且使用了Adagrad優(yōu)化器[14]。基于深度學習的DNN模型通過構(gòu)建具有非線性網(wǎng)絡(luò)結(jié)構(gòu)和多層隱層的復(fù)雜模型,利用大量的訓練數(shù)據(jù)來將低層特征形成更加抽象的高層特征,從而提高模型分類和預(yù)測的準確率。DNN模型體系突出了模型的深度結(jié)構(gòu),強調(diào)特征學習的重要性,通過多層隱層將原本樣本空間的特征逐層轉(zhuǎn)換到新的特征空間,對比與傳統(tǒng)的采用人工規(guī)則構(gòu)造特征的方式,采用大數(shù)據(jù)來訓練的DNN模型能學習到更有用的特征和能夠刻畫出數(shù)據(jù)之間豐富的深層次的內(nèi)在信息[15]。現(xiàn)如今某些采用深度學習方法通過讓機器自動學習出模式特征的應(yīng)用中,有很多已經(jīng)超過原有通過算法來識別和分類的性能[16]。
決策樹模型和DNN神經(jīng)網(wǎng)絡(luò)的總的數(shù)據(jù)集有2840420條數(shù)據(jù)和對應(yīng)的2840420條標簽數(shù)據(jù),將總的數(shù)據(jù)集拆分為訓練集2808420條數(shù)據(jù),驗證集12000條數(shù)據(jù),測試集20000條數(shù)據(jù)。并且每一個數(shù)據(jù)集中民航飛機和無人機的數(shù)據(jù)各占一半。
測試集在兩種分類模型下的分類效果如表3所示。
表3 兩種模型的性能比較
從決策樹分模型和DNN神經(jīng)網(wǎng)絡(luò)模型,這兩種分類方法的實驗結(jié)果來看,DNN神經(jīng)網(wǎng)絡(luò)分類模型相對來說具有更好的效果,準確率對比決策樹有接近25%的提高。
7.2.1 訓練集、驗證集和測試集的交叉熵損失變化
訓練集、驗證集和測試集的交叉熵損失的變化曲線如圖4所示,其中實線代表訓練集的交叉熵損失的變化曲線,虛線代表驗證集的交叉熵損失的變化曲線,點線代表測試集的交叉熵損失的變化曲線??梢钥闯?,當模型訓練輪數(shù)迭代步數(shù)達到200時,訓練集、驗證集和測試集的交叉熵損失都由高到低最后趨近于0達到穩(wěn)定,其中訓練集交叉熵損失略低于驗證集和測試集。
圖4 訓練集、驗證集和測試集的交叉熵損失變化
7.2.2 訓練集、驗證集和測試集的準確率變化
圖5 訓練集、驗證集和測試集的準確率變化
訓練集、驗證集和測試集的分類準確率的變化曲線如圖5所示,其中實線代表訓練集的準確率的變化曲線,虛線代表驗證集的準確率的變化曲線,點線代表測試集的準確率的變化曲線??梢钥闯觯斈P陀柧気啍?shù)迭代步數(shù)達到200時,訓練集、驗證集和測試集的分類準確率都由低到高最后趨近于1達到穩(wěn)定,其中訓練集準確率略高于驗證集和測試集。
本文利用雷達監(jiān)測的飛行目標數(shù)據(jù),結(jié)合目前最新的谷歌人工智能深度學習框架Tensorflow來解決不同的飛行動態(tài)目標的識別的問題,通過實驗的結(jié)果比較分析,應(yīng)用深度學習中的DNN神經(jīng)網(wǎng)絡(luò)模型相較于傳統(tǒng)基于統(tǒng)計學原理的決策樹模型具有更高的識別準確率。而如何應(yīng)用深度學習神經(jīng)網(wǎng)絡(luò)模型識別更多不同類型的動態(tài)飛行目標,并且提高其識別準確率仍然是未來研究的方向。