李雨鑫 羅丁利 陳尹翔 楊 磊
(西安電子工程研究所 西安 710100)
隨著自動駕駛和智慧城市的發(fā)展,人們對各種環(huán)境下目標(biāo)檢測分類的需求也越來越大。與光學(xué)傳感器相比,由于雷達(dá)在全天候多環(huán)境下工作的特性,使其廣泛應(yīng)用于智慧城市和環(huán)境監(jiān)測等領(lǐng)域。然而,在雷達(dá)目標(biāo)分類領(lǐng)域,由于數(shù)據(jù)采集成本高和雷達(dá)形式參數(shù)多樣,難以針對每一種雷達(dá)采集大量數(shù)據(jù)來訓(xùn)練出一個高性能神經(jīng)網(wǎng)絡(luò)。多任務(wù)學(xué)習(xí)[1]方法,可以利用不同的任務(wù)之間的相似性來提高模型準(zhǔn)確率,從而解決微多普勒目標(biāo)分類任務(wù)中數(shù)據(jù)不足和運算量受限的問題。在本文中,我們設(shè)計了一種共享特征提取器的多任務(wù)學(xué)習(xí)方法,神經(jīng)網(wǎng)絡(luò)可以同時完成微多普勒單兵小分隊任務(wù)的區(qū)分和三種飛機(jī)的分類任務(wù)。通過這種方法使深度神經(jīng)網(wǎng)絡(luò)模型在微多普勒分類任務(wù)中獲得更好的準(zhǔn)確性和魯棒性。
對于深度學(xué)習(xí)方法來說,獲取高性能模型的前提是大量數(shù)據(jù),數(shù)據(jù)不足會導(dǎo)致模型精度低,過擬合現(xiàn)象[2]嚴(yán)重,使模型難以在實際環(huán)境中使用。微多普勒[3]目標(biāo)分類任務(wù)主要利用目標(biāo)運動過程中不同部位速度不同的特點,通過對目標(biāo)的連續(xù)跟蹤,得到目標(biāo)不同部位速度隨時間變化的頻譜。由于多數(shù)雷達(dá)都具有速度測量功能(雖然某些雷達(dá)速度模糊會很嚴(yán)重,導(dǎo)致大量速度成分混疊),因此使用微多普勒頻譜作為輸入進(jìn)行目標(biāo)分類具有非常廣泛的應(yīng)用。近年來,多任務(wù)學(xué)習(xí)在模式識別領(lǐng)域中非?;钴S,在Sanh[4]的工作中將不同難度的任務(wù)劃分為不同層次的輸出,通過從多個任務(wù)中提取不同深度來學(xué)習(xí)更魯棒的特征表示。在Bischke[5]的工作中,任務(wù)是在衛(wèi)星圖像中識別建筑物的屋頂,采用多任務(wù)學(xué)習(xí)框架,將圖像中物體高度的任務(wù)作為輔助任務(wù),以提高主任務(wù)的識別性能。許多任務(wù)也使用遙感圖像作為輸入,但對于作者所面臨的主要任務(wù),使用物體高度估計的輔助任務(wù)會有較好的效果。在Liu[6]中,使用硬參數(shù)共享[7]對共享編碼器進(jìn)行訓(xùn)練,然后使用該方法的私有神經(jīng)元將任務(wù)分開進(jìn)行分類,該方法在多任務(wù)學(xué)習(xí)領(lǐng)域中被廣泛使用。
多普勒效應(yīng)被廣泛應(yīng)用于雷達(dá)系統(tǒng)的各個部分。雷達(dá)發(fā)射一組固定頻率的電磁波照射目標(biāo),接收目標(biāo)反射回波。當(dāng)目標(biāo)沿雷達(dá)的徑向移動時,接收到的回波會發(fā)生頻率變化。雷達(dá)利用此頻率變化確定目標(biāo)的速度(fd=2v/λ,其中fd表示多普勒頻率變化,v為目標(biāo)速度,λ為信號波長)。在目標(biāo)運動的過程中,不同部位的速度會有所不同。例如,人在行走時胳膊和腳的速度波動范圍比較大,并且有周期性的變化,軀干的速度波動比較小。這種由目標(biāo)本身不同部位的速度變化引起的微多普勒頻率變化是雷達(dá)目標(biāo)識別的重要特征之一。當(dāng)目標(biāo)信噪比和雷達(dá)多普勒分辨率滿足條件時,通過對目標(biāo)進(jìn)行連續(xù)照射,記錄目標(biāo)微多普勒譜隨時間的變化,得到微多普勒譜。
給予兩個微多普勒目標(biāo)分類任務(wù),首先輸入兩個微多普勒頻譜,之后對送入一個共享參數(shù)的BLSTM特征提取器,特征提取器輸出的結(jié)果分別送入兩個任務(wù)私有的神經(jīng)網(wǎng)絡(luò)中進(jìn)一步特征提取和非線性映射,最終通過Softmax分類器進(jìn)行分類。詳細(xì)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 與傳統(tǒng)模式識別方法對比
通過這種特殊設(shè)計的網(wǎng)絡(luò)結(jié)構(gòu),在訓(xùn)練過程中,BLSTM特征提取器由兩個任務(wù)產(chǎn)生的梯度共同優(yōu)化,這種方式有效的提高了其特征提取能力,同時由于參與訓(xùn)練的數(shù)據(jù)增多,比起單獨任務(wù)訓(xùn)練一個模型,這種方法可以使特征提取器更加魯棒。在經(jīng)過特征提取器提取特征之后,兩個不同任務(wù)提取出的特征分別送入不同任務(wù)私有的全連接層,這種方式可以使模型針對不同任務(wù)的特點訓(xùn)練模型參數(shù),從而在單個任務(wù)上有更好的表現(xiàn)。
對于標(biāo)準(zhǔn)的分類問題,我們采用了大多數(shù)分類工作都會使用的Softmax交叉損失熵?fù)p失函數(shù)。給定神經(jīng)網(wǎng)絡(luò)輸入x=(x1,x2,x3,…,xk)和標(biāo)記y=(y1,y2,y3,…,yk)可以得到目標(biāo)損失函數(shù)為
在多任務(wù)學(xué)習(xí)框架下,兩個任務(wù)分別輸入數(shù)據(jù)和標(biāo)記,可以通過損失函數(shù)計算出每個樣本的損失,分別記為,在進(jìn)行參數(shù)優(yōu)化時,使用總的損失函數(shù)來優(yōu)化模型。對與BLSTM特征提取器,模型參數(shù)受兩個任務(wù)的梯度共同優(yōu)化,私有全連接層部分受自身任務(wù)損失優(yōu)化。
在本次試驗中我們使用了兩種微多普勒數(shù)據(jù)集:一種是針對單兵、小分隊的二分類問題,針對第一種數(shù)據(jù),我們使用Ku波段脈沖雷達(dá)對目標(biāo)進(jìn)行數(shù)據(jù)采集,對回波進(jìn)行512點積累最終通過提取目標(biāo)所在距離單元的微多普勒數(shù)據(jù),單人數(shù)據(jù)有1400幀數(shù)據(jù),小分隊數(shù)據(jù)有1300幀數(shù)據(jù),對上述數(shù)據(jù)選取70%作為訓(xùn)練集,30%作為評價集。另一種采用三種飛機(jī)分類任務(wù),數(shù)據(jù)集包含直升機(jī)、噴氣式飛機(jī)和螺旋槳飛機(jī),三種類別數(shù)據(jù)量均在1300幀左右,其余設(shè)置與任務(wù)一相同。
為了驗證我們提出方法的效果,我們首先對比了傳統(tǒng)分類方法,包括KNN,隨機(jī)森林,使用SVM對PCA降維后的特征進(jìn)行分類等方式,具體對比結(jié)果如表1所示。由表1可得,我們提出的方法對比傳統(tǒng)方法具有極高的優(yōu)勢。為了更具體分析我們提出的多任務(wù)學(xué)習(xí)方法對主任務(wù)的幫助,我們使用了一個與多任務(wù)模型具有同樣結(jié)構(gòu)的單一任務(wù)模型做為Biseline。通過實驗表明,在相同網(wǎng)絡(luò)結(jié)構(gòu)的情況下,使用多任務(wù)學(xué)習(xí)方法將對提高準(zhǔn)確率有很大幫助,并且這種多任務(wù)學(xué)習(xí)方法在部署應(yīng)用時,并不需要部署多余的輔助任務(wù)部分,這意味著我們使用和Biseline同樣的算力和存儲空間,得到了更高的準(zhǔn)確率。
表1 與傳統(tǒng)模式識別方法對比
為了進(jìn)一步驗證我們方法的性能。我們首先將我們的方法與傳統(tǒng)深度學(xué)習(xí)方法進(jìn)行對比,包括基本的BLSTM,LSTM和RNN模型,以及被廣泛使用的VGG 16,RestNet 50,Inception V3等。對比結(jié)果見表2所示,我們對比了4,32兩種微多普勒幀長的情況,由于較少的幀數(shù)難以提供足夠的有效信息,所以大多數(shù)情況下小幀數(shù)時的準(zhǔn)確率要小于大幀數(shù)情況。通過對比,我們提出的方法優(yōu)于傳統(tǒng)深度學(xué)習(xí)方法。同時,在一些遷移學(xué)習(xí)工作中,使用在ImageNet上訓(xùn)練過的模型參數(shù),使用微調(diào)的方法對微多普勒數(shù)據(jù)進(jìn)行分類,我們對比了使用上述三種網(wǎng)絡(luò)微調(diào)的方法處理微多普勒任務(wù)。通過表2中,VGG 16 fine-tune,RestNet 50 fine-tune,Inception V3 fine-tune的結(jié)果可知,同樣的模型使用微調(diào)的方法訓(xùn)練準(zhǔn)確率有一定提升,然而由于特征空間的巨大差異,這種方法難以達(dá)到更好的效果。我們的方法對比這一類方法具有更高的準(zhǔn)確率。最后,我們對比了幾種針對微多普勒分類任務(wù)特殊設(shè)計的分類方法,這一類方法包括DivNet[8],Mo-DCNN, VMo-DCNN[9]。通過試驗結(jié)果可以看出,這一類方法準(zhǔn)確率低于我們的方法,尤其在小幀數(shù)情況下,我們的方法準(zhǔn)確率遠(yuǎn)高于這一類方法。
表2 與深度學(xué)習(xí)方法對比
由于雷達(dá)所對應(yīng)的應(yīng)用場景大多需要極高的相應(yīng)速度,在有限的時間內(nèi)如果不能給出相應(yīng)將會造成難以挽回的損失。所以一個應(yīng)用于雷達(dá)的模型識別方法對計算速度有著更高的要求。為了驗證我們模型的規(guī)模,我們在相同的試驗環(huán)境中使用參數(shù)數(shù)量,F(xiàn)LOPs和運算時間來衡量我們模型的規(guī)模和實時性。對比的工作包括VGG16,Inception V3 和RestNet 50這一類廣泛應(yīng)用的網(wǎng)絡(luò)模型,以及DivNet[8],Mo-DCNN,VMo-DCNN[9]這一類針對微多普勒分類任務(wù)專用的方法。通過表3可以知道,我們的方法在這三項指標(biāo)中優(yōu)于上述大部分模型,在與Mo-DCNN,VMo-DCNN的對比中,雖然我們的模型參數(shù)數(shù)量略大于這兩種方法,但FLOPs和計算時間要遠(yuǎn)小于這兩種方法。通過上面的對比,我們的方法在計算量和計算時間上具有一定優(yōu)勢,這有利于本地部署和實際應(yīng)用。
表3 運算量對比
人工智能現(xiàn)如今已廣泛應(yīng)用于人類生活的各個角落,雷達(dá)作為一種重要的傳感器,雖然有大量使用經(jīng)典方法的模式識別工作[10],但是在深度學(xué)習(xí)方法上的發(fā)展遠(yuǎn)弱于計算機(jī)視覺,自然語言處理等領(lǐng)域。由于雷達(dá)探測方式和特征空間的不同,人們需要針對雷達(dá)的特點有針對性地設(shè)計模型訓(xùn)練方法和相關(guān)算法,從而提高雷達(dá)系統(tǒng)的智能化識別能力。