晏 媛,孫 俊,孫晶明,于俊朋
(1.南京電子技術(shù)研究所,江蘇 南京 210039;2.中國電子科技集團(tuán)公司智能感知技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 2100039)
雷達(dá)目標(biāo)識(shí)別技術(shù)不受天氣、光照等諸多條件影響,能夠及時(shí)準(zhǔn)確地提供場(chǎng)景中每個(gè)實(shí)體目標(biāo)的詳細(xì)屬性信息,具有較高的軍用和民用價(jià)值。但實(shí)際應(yīng)用場(chǎng)景的時(shí)效性約束和資源限制導(dǎo)致該領(lǐng)域一直存在小樣本問題,這嚴(yán)重制約了雷達(dá)目標(biāo)識(shí)別技術(shù)的發(fā)展[1]。雖然傳統(tǒng)雷達(dá)目標(biāo)識(shí)別技術(shù)對(duì)數(shù)據(jù)的需求量較小,但人工提取特征的方式導(dǎo)致該類算法環(huán)境適應(yīng)性差且工程推廣能力低[2]。深度學(xué)習(xí)技術(shù)依靠其優(yōu)秀的自動(dòng)特征提取能力,大幅提升了雷達(dá)目標(biāo)識(shí)別的準(zhǔn)確率[3-4],但其對(duì)大數(shù)據(jù)的需求依舊制約著模型性能的發(fā)揮[5-6]。因此,如何提升深度學(xué)習(xí)技術(shù)在雷達(dá)小樣本目標(biāo)識(shí)別應(yīng)用中的性能成為亟需解決的問題,也是本文的研究重點(diǎn)。
目前小樣本學(xué)習(xí)問題在光學(xué)圖像識(shí)別領(lǐng)域的研究最為廣泛,主要研究機(jī)器學(xué)習(xí)模型面對(duì)新類少量樣本的快速學(xué)習(xí)能力,代表方法是元學(xué)習(xí)和遷移學(xué)習(xí)[7]。元學(xué)習(xí)要求系統(tǒng)通過觀察機(jī)器學(xué)習(xí)方法在不同任務(wù)中的學(xué)習(xí)過程,積累經(jīng)驗(yàn)以實(shí)現(xiàn)新任務(wù)的快速學(xué)習(xí)[8]。元學(xué)習(xí)方法可分為3類:基于度量的元學(xué)習(xí)[9-12]、基于模型的元學(xué)習(xí)[13-14]和基于優(yōu)化的元學(xué)習(xí)[15-16]。其中基于度量的元學(xué)習(xí)方法由于強(qiáng)解釋性和優(yōu)越的識(shí)別性能而備受關(guān)注。不同于元學(xué)習(xí),遷移學(xué)習(xí)的核心思想是從相關(guān)領(lǐng)域遷移標(biāo)注數(shù)據(jù)或知識(shí)結(jié)構(gòu)用于改進(jìn)目標(biāo)領(lǐng)域或任務(wù)的學(xué)習(xí)效果,根據(jù)可遷移的內(nèi)容分為4類:模型遷移、特征遷移、樣本遷移和關(guān)系遷移[17]。其中模型遷移方法能夠降低小樣本模型的訓(xùn)練難度,加速網(wǎng)絡(luò)學(xué)習(xí),因此在小樣本學(xué)習(xí)領(lǐng)域也得到了一定的應(yīng)用[18-21]。文獻(xiàn)[20]將元學(xué)習(xí)方法與模型遷移相結(jié)合后算法性能明顯優(yōu)于普通元學(xué)習(xí)方法。
綜上可以看出,小樣本學(xué)習(xí)問題在光學(xué)領(lǐng)域已經(jīng)取得了一定的研究成果。相較于光學(xué)領(lǐng)域,雷達(dá)領(lǐng)域的小樣本目標(biāo)識(shí)別問題研究十分有限[22-26]。文獻(xiàn)[22-24]分別改進(jìn)原型網(wǎng)絡(luò)等光學(xué)領(lǐng)域小樣本學(xué)習(xí)模型,提升雷達(dá)小樣本目標(biāo)識(shí)別性能,但實(shí)驗(yàn)場(chǎng)景均設(shè)置簡單,無法滿足復(fù)雜的實(shí)際應(yīng)用需求,同時(shí)模型性能優(yōu)勢(shì)驗(yàn)證不明確。文獻(xiàn)[25]遷移光電域知識(shí)以提升雷達(dá)圖像域的小樣本目標(biāo)分類性能,但其未考慮目標(biāo)任務(wù)數(shù)據(jù)的難獲取問題,同樣未結(jié)合雷達(dá)實(shí)際應(yīng)用場(chǎng)景。
針對(duì)以上問題,本文通過探究元學(xué)習(xí)和遷移學(xué)習(xí)這兩類最主流的小樣本學(xué)習(xí)方法,提出了一套綜合解決方案用于處理實(shí)際工程應(yīng)用中的雷達(dá)小樣本目標(biāo)識(shí)別問題。該方案使用了具有強(qiáng)表示性的特征提取模塊,且能夠針對(duì)不同的應(yīng)用場(chǎng)景選擇合適的模型學(xué)習(xí)方式和分類方式,因此能夠最大程度發(fā)揮模型優(yōu)勢(shì),展現(xiàn)優(yōu)越的識(shí)別性能。同時(shí)本文基于雷達(dá)實(shí)測(cè)數(shù)據(jù)集,對(duì)元學(xué)習(xí)和遷移學(xué)習(xí)在不同實(shí)際應(yīng)用背景下的模型性能進(jìn)行深入挖掘,進(jìn)一步驗(yàn)證了所提出方案的有效性和可行性。
小樣本學(xué)習(xí)問題的核心關(guān)注點(diǎn)在于研究模型的快速學(xué)習(xí)能力,目前研究者們通過提升數(shù)據(jù)利用率解決此類問題,主要從元學(xué)習(xí)和遷移學(xué)習(xí)兩個(gè)角度出發(fā)進(jìn)行研究。
元學(xué)習(xí)通過學(xué)習(xí)多個(gè)任務(wù)的識(shí)別過程積累經(jīng)驗(yàn),從而面對(duì)全新的目標(biāo)任務(wù)時(shí)只需要少量樣本就能夠?qū)崿F(xiàn)快速學(xué)習(xí)[8]。其中元訓(xùn)練和元測(cè)試階段的算法思路相同,具體流程如下。
步驟 1確定目標(biāo)任務(wù)。假設(shè)全新的待識(shí)別目標(biāo)包括K個(gè)類別,目標(biāo)任務(wù)為僅通過學(xué)習(xí)每類目標(biāo)的M個(gè)樣本,就能實(shí)現(xiàn)對(duì)全新K類目標(biāo)的正確分類。
步驟 2從數(shù)據(jù)集中隨機(jī)采樣K類目標(biāo),每類N個(gè)樣本作為一個(gè)元任務(wù)數(shù)據(jù)集。
步驟 3從元任務(wù)數(shù)據(jù)集的每類樣本中隨機(jī)采樣M張樣本作為支撐集Ss,其余各類的N-M張樣本作為查詢集Qs。
步驟 4模型學(xué)習(xí)支撐集樣本,并對(duì)查詢集樣本類別進(jìn)行預(yù)測(cè)。
步驟 5最小化查詢集樣本的損失函數(shù)實(shí)現(xiàn)分類模型的訓(xùn)練。
算法需要重復(fù)迭代步驟2至步驟5,這在元訓(xùn)練階段能夠幫助模型實(shí)現(xiàn)更充分的經(jīng)驗(yàn)積累,也能在元測(cè)試時(shí)通過目標(biāo)任務(wù)識(shí)別結(jié)果的反復(fù)驗(yàn)證更準(zhǔn)確地判斷模型性能。同時(shí),元測(cè)試階段模型不需要重新調(diào)整便可以直接學(xué)習(xí)分類。
綜上可以看出,算法流程中元任務(wù)與目標(biāo)任務(wù)的數(shù)據(jù)學(xué)習(xí)形式相同,這種模擬目標(biāo)任務(wù)的模型訓(xùn)練方式能夠很好地提升模型的泛化能力。同時(shí),多任務(wù)訓(xùn)練機(jī)制能夠幫助模型學(xué)習(xí)元任務(wù)的共性特征,如學(xué)習(xí)樣本相似性比較等,而忽略任務(wù)針對(duì)性強(qiáng)的部分,因此在面對(duì)新的目標(biāo)任務(wù)時(shí)能夠發(fā)揮較好的性能。
遷移學(xué)習(xí)中的模型遷移方法因其高效性在深度學(xué)習(xí)圖像識(shí)別領(lǐng)域受到廣泛關(guān)注,通過知識(shí)遷移提升模型學(xué)習(xí)效率,具體算法流程如下。
步驟 1在源任務(wù)上對(duì)模型進(jìn)行預(yù)訓(xùn)練。
步驟 2遷移預(yù)訓(xùn)練模型的部分或全部結(jié)構(gòu)作為目標(biāo)任務(wù)模型的淺層模塊,并凍結(jié)該部分模型權(quán)重參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)。
步驟 3通過目標(biāo)任務(wù)的學(xué)習(xí)對(duì)模型的非凍結(jié)部分進(jìn)行微調(diào)完成模型訓(xùn)練。
模型遷移方法之所以有效,是因?yàn)樯疃葘W(xué)習(xí)通常使用神經(jīng)網(wǎng)絡(luò)提取樣本特征向量,而神經(jīng)網(wǎng)絡(luò)淺層部分權(quán)值是具有強(qiáng)適應(yīng)性的共性知識(shí)。因此,當(dāng)源任務(wù)與目標(biāo)任務(wù)存在一定相關(guān)性時(shí),模型遷移能夠?qū)崿F(xiàn)知識(shí)積累,從而降低訓(xùn)練難度,提高模型學(xué)習(xí)效率。
本文提出了一套結(jié)合元學(xué)習(xí)和遷移學(xué)習(xí)的綜合方案用于解決雷達(dá)小樣本目標(biāo)識(shí)別問題。該方案能夠根據(jù)實(shí)際應(yīng)用場(chǎng)景選取合適的模型學(xué)習(xí)方式和分類方式,實(shí)現(xiàn)目標(biāo)任務(wù)的快速學(xué)習(xí)。圖1體現(xiàn)了本文所提出方案的整體思路。
圖1 小樣本識(shí)別綜合解決方案Fig.1 Comprehensive solution for few shot recognition
算法首先通過模塊fθ進(jìn)行樣本的特征提取,并根據(jù)實(shí)際需求選擇后續(xù)合適的模型學(xué)習(xí)方式。首先,當(dāng)應(yīng)用場(chǎng)景源任務(wù)信息量缺乏或源任務(wù)與目標(biāo)任務(wù)間差異性大時(shí),算法選擇模型的上支路,即遷移學(xué)習(xí)方式。其遵循模型遷移的學(xué)習(xí)流程,遷移預(yù)訓(xùn)練模型的特征提取模塊并訓(xùn)練新的分類模塊C1(·|Wn)。遷移學(xué)習(xí)的知識(shí)積累優(yōu)勢(shì)一定程度上解決了源任務(wù)信息量缺乏的問題。同時(shí),微調(diào)機(jī)制能夠較好地克服任務(wù)間的差異,使模型更好地適配于目標(biāo)任務(wù)。其次,若源任務(wù)信息量充足或源任務(wù)與目標(biāo)任務(wù)間差異性小時(shí),算法選擇模型下支路即元學(xué)習(xí)方式進(jìn)行小樣本識(shí)別。其按照元學(xué)習(xí)流程采樣獲得支撐特征向量和查詢特征向量,并通過比較查詢特征向量和支撐特征向量原型之間的歐氏距離,使用分類模塊C2(·|Wbn)進(jìn)行查詢特征向量的分類。元學(xué)習(xí)的多任務(wù)訓(xùn)練機(jī)制能夠幫助模型更好地處理新的目標(biāo)任務(wù),同時(shí)訓(xùn)練過程中對(duì)目標(biāo)任務(wù)環(huán)境的模擬也很好地提高了模型的泛化能力。因此,本文所提方案通過在不同應(yīng)用情境下選擇不同支路能夠最大限度地發(fā)揮模型優(yōu)勢(shì),提升雷達(dá)小樣本目標(biāo)識(shí)別的效率和準(zhǔn)確率。本文的實(shí)驗(yàn)結(jié)果驗(yàn)證了所提方案的有效性和可行性。
下面重點(diǎn)介紹本文提出的綜合方案中的3個(gè)關(guān)鍵模塊:特征提取模塊,元學(xué)習(xí)支路和遷移學(xué)習(xí)支路。
小樣本學(xué)習(xí)方法通常采用的特征提取結(jié)構(gòu)為4層卷積神經(jīng)網(wǎng)絡(luò)[11-12],該網(wǎng)絡(luò)易于訓(xùn)練,但結(jié)構(gòu)簡單,學(xué)習(xí)能力有限。因此,本文提出使用殘差網(wǎng)絡(luò)進(jìn)行特征提取。該網(wǎng)絡(luò)能在避免過擬合和退化問題的情況下保證網(wǎng)絡(luò)學(xué)習(xí)能力,盡可能擬合復(fù)雜的雷達(dá)目標(biāo)特征提取過程,從而提升目標(biāo)識(shí)別的準(zhǔn)確率。
殘差網(wǎng)絡(luò)由殘差塊構(gòu)成,如圖2(b)所示為一個(gè)殘差塊,其與普通卷積模塊的區(qū)別在于通過快捷連接在神經(jīng)網(wǎng)絡(luò)前向傳播時(shí)跳過一層或多層連接實(shí)現(xiàn)了恒等映射。恒等映射的引入保證了層數(shù)加深后的模型性能永遠(yuǎn)優(yōu)于等于模型較淺時(shí)的性能。
圖2 恒等映射圖示Fig.2 Diagram of identity mapping
本文使用3個(gè)殘差塊堆疊構(gòu)建了一個(gè)10層的殘差網(wǎng)絡(luò),如圖3所示。每個(gè)殘差塊內(nèi)包含3層卷積模塊,每個(gè)卷積模塊包含卷積層、批歸一化層和激活層。
圖3 特征提取器的網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Network structure of feature extractor
原型網(wǎng)絡(luò)作為元學(xué)習(xí)的代表模型由于性能優(yōu)越而備受關(guān)注,因此本文的元學(xué)習(xí)支路也將借鑒原型網(wǎng)絡(luò)的學(xué)習(xí)方式,實(shí)現(xiàn)模型的高效識(shí)別。
元學(xué)習(xí)支路的數(shù)據(jù)學(xué)習(xí)方式與經(jīng)典元學(xué)習(xí)方法相同,均模擬目標(biāo)任務(wù)進(jìn)行學(xué)習(xí)。模型的整體思路參見圖1中的元學(xué)習(xí)支路,其具體思想如圖4所示。
圖4 原型網(wǎng)絡(luò)算法思路Fig.4 Prototypical network algorithm thinking
圖4(a)體現(xiàn)了每類支撐特征向量通過累加求均值獲得每類支撐樣本的原型ck,計(jì)算公式為
(1)
式中,Sk表示第k類目標(biāo)的支撐特征向量集,|Sk|表示第k類目標(biāo)支撐特征向量集的向量數(shù)量;(xi,yi)表示支撐特征向量集Sk中的各個(gè)向量,xi表示單個(gè)支撐特征向量,yi表示該支撐特征向量的標(biāo)簽信息。
圖4(b)則體現(xiàn)了單個(gè)查詢特征向量通過求解與每類原型的歐氏距離來獲得其類別概率分布,表達(dá)式為
(2)
(3)
最終模型的損失函數(shù)如下:
J(θ)=-lnpθ(y=k|x)
(4)
元學(xué)習(xí)支路模型魯棒性強(qiáng),泛化能力好,且相似性度量的使用強(qiáng)調(diào)類內(nèi)聚集性和類間疏遠(yuǎn)性,提升模型的學(xué)習(xí)效率。
模型遷移在深度學(xué)習(xí)領(lǐng)域應(yīng)用較為廣泛,但將其與小樣本學(xué)習(xí)結(jié)合的研究較少,在雷達(dá)小樣本學(xué)習(xí)問題中的性能表現(xiàn)也常被低估。因此,本文引入模型遷移方法作為方案的遷移學(xué)習(xí)支路解決雷達(dá)小樣本目標(biāo)識(shí)別問題。
小樣本遷移學(xué)習(xí)的流程如圖5所示,源任務(wù)的訓(xùn)練過程與傳統(tǒng)模型遷移方法相同。在目標(biāo)任務(wù)模型訓(xùn)練過程中,本文采用與元學(xué)習(xí)相同的數(shù)據(jù)學(xué)習(xí)方式,對(duì)數(shù)據(jù)集進(jìn)行小批量采樣以形成目標(biāo)任務(wù)數(shù)據(jù)集。目標(biāo)任務(wù)數(shù)據(jù)集包含少量的支撐集樣本ds和查詢集樣本dt。面對(duì)各個(gè)目標(biāo)任務(wù)時(shí),模型均通過學(xué)習(xí)少量的支撐集樣本進(jìn)行模型微調(diào),創(chuàng)建新的分類器C1(·|Wn)實(shí)現(xiàn)查詢集樣本的識(shí)別。模型每完成一個(gè)目標(biāo)任務(wù)就會(huì)對(duì)分類模塊重新初始化以避免經(jīng)驗(yàn)記憶問題,從而保證模型每次面對(duì)的目標(biāo)任務(wù)都是全新的。本文通過多次小批量采樣并不斷初始化的方式反復(fù)驗(yàn)證了模型在目標(biāo)任務(wù)的表現(xiàn)性能。
圖5 小樣本遷移學(xué)習(xí)Fig.5 Few shot transfer learning
模型通過最小化標(biāo)準(zhǔn)交叉熵分類損失函數(shù)完成訓(xùn)練。函數(shù)表達(dá)式為
(5)
遷移學(xué)習(xí)支路通過改進(jìn)數(shù)據(jù)學(xué)習(xí)方式將模型遷移用于小樣本學(xué)習(xí)問題,不僅提高了模型訓(xùn)練效率,還能幫助模型實(shí)現(xiàn)更好的適應(yīng)性學(xué)習(xí)。
為驗(yàn)證本文所提綜合解決方案的可行性,本節(jié)對(duì)方案的兩條支路算法元學(xué)習(xí)和遷移學(xué)習(xí)進(jìn)行多組對(duì)比試驗(yàn),為方案的最優(yōu)選擇支路提供依據(jù)。
本文基于DARPA/AFRL提供的MSTAR數(shù)據(jù)集完成實(shí)驗(yàn)。該數(shù)據(jù)集由Sandia國家實(shí)驗(yàn)室使用的X波段合成孔徑雷達(dá)(synthetic apeture radar,SAR)傳感器收集。其中包括十類地面軍用車輛,即自行榴彈炮2S1、裝甲偵察車BRDM2、裝甲運(yùn)輸車BTR60、BTR70(SN_C71)、推土機(jī)D7、坦克T62、T72(SN_132)、貨運(yùn)卡車ZIL131、自行高炮ZSU234、履帶式步兵戰(zhàn)車BMP-2(SN_9563)[9-11]。其中2S1,ZSU234和BTR70涉及15°,17°,30°和45°的4個(gè)姿態(tài)角。其余目標(biāo)僅涉及15°和17°姿態(tài)角。目標(biāo)類型及樣本數(shù)量等詳細(xì)信息如表1所示。其中,第3.3.1節(jié)和第3.3.2節(jié)實(shí)驗(yàn)均使用數(shù)據(jù)集中的BTR70(SN_C71),BTR60,D7,T62,ZIL131,BMP2(SN_9563),T72(SN_132)這七類樣本作為源數(shù)據(jù),使用2S1,BRDM2和ZSU234作為目標(biāo)任務(wù)數(shù)據(jù)。
表1 MSTAR數(shù)據(jù)集Table 1 MSTAR dataset
遷移學(xué)習(xí)實(shí)驗(yàn)中使用源任務(wù)數(shù)據(jù)集進(jìn)行模型預(yù)訓(xùn)練,并按照3:1獲取訓(xùn)練樣本和驗(yàn)證樣本。訓(xùn)練時(shí)批處理量為15,共訓(xùn)練200次。目標(biāo)任務(wù)微調(diào)過程中的數(shù)據(jù)學(xué)習(xí)方式與元學(xué)習(xí)相同,均采用3way-5shot模式,每次實(shí)驗(yàn)需從數(shù)據(jù)集中隨機(jī)取3類目標(biāo),每類20張樣本作為此次任務(wù)數(shù)據(jù)集,該數(shù)據(jù)集中隨機(jī)取5張為支撐集樣本,其余15張為查詢集樣本。元學(xué)習(xí)的訓(xùn)練過程需要重復(fù)采樣訓(xùn)練10 000次,遷移學(xué)習(xí)和元學(xué)習(xí)的測(cè)試過程均需要重復(fù)6 000次后取測(cè)試結(jié)果平均值作為最終的識(shí)別結(jié)果。
實(shí)驗(yàn)采用Adam優(yōu)化器,初始學(xué)習(xí)率為1e-3。
小樣本識(shí)別應(yīng)用通常關(guān)注兩個(gè)問題:一是指定目標(biāo)任務(wù)時(shí)源任務(wù)信息量的選取問題;二是源任務(wù)與目標(biāo)任務(wù)間的差異性問題。為更高效地完成以識(shí)別為目的的雷達(dá)成像,需分析小樣本識(shí)別算法所關(guān)注的顯著性特征。本文針對(duì)這3個(gè)問題,在第3.3.1節(jié)、第3.3.2節(jié)和第3.3.3節(jié)分別進(jìn)行探索,設(shè)置不同的應(yīng)用場(chǎng)景,探索模型性能并最終形成了幾條可有效指導(dǎo)雷達(dá)小樣本目標(biāo)識(shí)別的工程應(yīng)用結(jié)論,同時(shí)為雷達(dá)成像提供指導(dǎo)建議。
3.3.1 源任務(wù)信息量實(shí)驗(yàn)
本節(jié)探索當(dāng)目標(biāo)任務(wù)確定時(shí),源任務(wù)信息量變化對(duì)模型性能的影響。本文通過改變?cè)慈蝿?wù)樣本類別數(shù)體現(xiàn)源任務(wù)信息量的變化。共設(shè)置5組實(shí)驗(yàn),每組實(shí)驗(yàn)分別從源數(shù)據(jù)中隨機(jī)選擇3類、4類、5類、6類和7類目標(biāo)作為源任務(wù)數(shù)據(jù)集樣本。涉及目標(biāo)均只考慮15°和17°姿態(tài)角,訓(xùn)練樣本和測(cè)試樣本數(shù)量均為400。
圖6展示了當(dāng)目標(biāo)任務(wù)類別數(shù)為3的情況下,對(duì)于元學(xué)習(xí)來說,當(dāng)源任務(wù)樣本類別由3類增加到5類時(shí),識(shí)別率增加了21.4%,在這之后識(shí)別率提升幅度變小。峰值出現(xiàn)在源任務(wù)類別數(shù)為6類時(shí),為95.4%。對(duì)于遷移學(xué)習(xí)來說,平均樣本識(shí)別率為82.78%。源任務(wù)類別數(shù)為4時(shí),識(shí)別率達(dá)到峰值為83.1%。
圖6 小樣本識(shí)別率與源任務(wù)類別數(shù)變化關(guān)系Fig.6 Change relationship between few shot recognition rate and the number of source task categories
從實(shí)驗(yàn)結(jié)果可以看出,當(dāng)目標(biāo)任務(wù)確定時(shí),隨著源任務(wù)樣本類別數(shù)的增加,元學(xué)習(xí)性能有較大提升,遷移學(xué)習(xí)性能受影響很小。首先,因?yàn)樵獙W(xué)習(xí)模型關(guān)注不同類別之間的信息,源任務(wù)目標(biāo)類別數(shù)的增多會(huì)使得模型經(jīng)驗(yàn)積累更加豐富最終幫助提高模型識(shí)別率。但由于目標(biāo)任務(wù)簡單,源任務(wù)信息增加到一定程度后出現(xiàn)信息冗余狀況。其次,對(duì)于遷移學(xué)習(xí)來說,雖然總樣本量增加,但其每類樣本量不變,而樣本類別數(shù)的增加導(dǎo)致目標(biāo)類間差異性變?nèi)?模型的特征提取能力沒有得到增強(qiáng),因此隨著類別數(shù)增加遷移學(xué)習(xí)沒有得到提升。
由此給出兩點(diǎn)工程應(yīng)用建議:第一,當(dāng)源任務(wù)樣本類別數(shù)缺乏時(shí),采用遷移學(xué)習(xí)可取得較好結(jié)果;第二,當(dāng)源任務(wù)樣本類別數(shù)充分時(shí),采用元學(xué)習(xí)可取得較好的模型識(shí)別性能。
3.3.2 樣本差異性實(shí)驗(yàn)
本節(jié)探索樣本差異性變化對(duì)模型性能的影響,主要從源任務(wù)樣本與目標(biāo)任務(wù)樣本間的差異性和目標(biāo)任務(wù)樣本的類內(nèi)差異性兩個(gè)角度考慮。雷達(dá)SAR圖像成像過程中,目標(biāo)外形特征受姿態(tài)角影響較大,因此實(shí)驗(yàn)使用姿態(tài)角差異性表示樣本差異性,設(shè)置了11組對(duì)比實(shí)驗(yàn)進(jìn)行探索。具體實(shí)驗(yàn)設(shè)置及實(shí)驗(yàn)結(jié)果如表2所示。
表2 樣本差異性實(shí)驗(yàn)數(shù)據(jù)設(shè)置與實(shí)驗(yàn)結(jié)果Table 2 Experimental data setting and experimental results of sample difference
針對(duì)源任務(wù)與目標(biāo)任務(wù)間的差異性影響,從a~d和e~h實(shí)驗(yàn)繪制的折線圖(見圖7)可以看出隨著目標(biāo)任務(wù)樣本與源任務(wù)樣本間的差異性不斷增大,元學(xué)習(xí)和遷移學(xué)習(xí)識(shí)別性能均下降。圖7(a)展示了源任務(wù)姿態(tài)角為15°時(shí),隨著源任務(wù)與目標(biāo)任務(wù)間姿態(tài)角差異性增大,元學(xué)習(xí)識(shí)別率由97.3%降到了75.26%,下降了22.04%。而遷移學(xué)習(xí)識(shí)別率由84.9%下降到74.1%,下降了10.8%。二者的差距從12.4%縮小到1.16%。圖7(b)展示了源任務(wù)姿態(tài)角為15°和17°時(shí),隨著任務(wù)差異性的增大,模型性能變化趨勢(shì)與圖7(a)相同。當(dāng)目標(biāo)任務(wù)姿態(tài)角達(dá)45°且與源任務(wù)差異性達(dá)到最大時(shí),元學(xué)習(xí)模型識(shí)別率相較于遷移學(xué)習(xí)低3.2%。
圖7 小樣本識(shí)別率與任務(wù)差異性關(guān)系Fig.7 Relationship between few shot recognition rate and task difference
當(dāng)任務(wù)差異性增大時(shí),元學(xué)習(xí)和遷移學(xué)習(xí)性能均有明顯下降。但二者受影響程度不同,元學(xué)習(xí)的波動(dòng)幅度更大,遷移學(xué)習(xí)波動(dòng)幅度相對(duì)較小。因此,隨著源任務(wù)與目標(biāo)任務(wù)間差異性增大,元學(xué)習(xí)的優(yōu)勢(shì)逐漸消失,遷移學(xué)習(xí)性能優(yōu)勢(shì)凸顯。當(dāng)任務(wù)差異性增大到一定程度后,遷移學(xué)習(xí)性能將優(yōu)于元學(xué)習(xí)性能。這一性能優(yōu)勢(shì)主要得益于微調(diào)學(xué)習(xí),遷移學(xué)習(xí)通過對(duì)目標(biāo)任務(wù)的適應(yīng)性學(xué)習(xí)獲取了良好的識(shí)別性能。
在針對(duì)目標(biāo)任務(wù)樣本類內(nèi)差異性實(shí)驗(yàn)中,為避免任務(wù)間差異性影響,本文根據(jù)e~k的實(shí)驗(yàn)結(jié)果分開對(duì)比并繪制了圖8。從圖8(a)可以看出,元學(xué)習(xí)中,姿態(tài)角混合后的i識(shí)別率為94.7%,而單個(gè)姿態(tài)角e和f的識(shí)別率分別為96.7%和97.7%。姿態(tài)角混合后的i識(shí)別率低于單個(gè)姿態(tài)角識(shí)別率均值的2.5%。遷移學(xué)習(xí)中,姿態(tài)角混合后的i識(shí)別率為81.6%,而單個(gè)姿態(tài)角e和f的識(shí)別率分別為86.2%和86.8%。姿態(tài)角混合后識(shí)別率較單個(gè)姿態(tài)角識(shí)別率的均值下降了4.9%。圖8(b)和圖8(c)與圖8(a)的整體變化趨勢(shì)相同,姿態(tài)角混合后的模型性能均差于單個(gè)姿態(tài)角下的性能。因此,可以得出結(jié)論,隨著目標(biāo)任務(wù)樣本類內(nèi)差異性的增大,遷移學(xué)習(xí)和元學(xué)習(xí)識(shí)別性能均呈下降趨勢(shì),這說明類內(nèi)差異性對(duì)小樣本學(xué)習(xí)模型的性能影響較大。
圖8 小樣本識(shí)別率與類內(nèi)差異性關(guān)系Fig.8 Relationship between few shot recognition rate and intra class difference
由此本文建議在實(shí)際工程應(yīng)用時(shí),當(dāng)源任務(wù)與目標(biāo)任務(wù)之間差異性小時(shí),應(yīng)使用元學(xué)習(xí)解決雷達(dá)目標(biāo)小樣本識(shí)別問題,當(dāng)二者差異較大時(shí)應(yīng)使用遷移學(xué)習(xí);當(dāng)樣本類內(nèi)差異性大時(shí),現(xiàn)有的遷移學(xué)習(xí)和元學(xué)習(xí)方法均無法保證良好的識(shí)別性能,應(yīng)尋求適用于解決類內(nèi)差異性的模型進(jìn)行解決。
3.3.3 顯著性特征提取實(shí)驗(yàn)
本節(jié)探究小樣本學(xué)習(xí)模型的顯著性特征提取問題,從而為以目標(biāo)識(shí)別為目的的雷達(dá)成像提供建議。對(duì)于地面雷達(dá)軍事目標(biāo),其外在的履帶特征和炮管特征較為顯著。因此,本文根據(jù)有無炮管特征和有無履帶特征對(duì)MSTAR數(shù)據(jù)集內(nèi)的10類目標(biāo)樣本進(jìn)行歸類,歸類結(jié)果如圖9所示。
圖9 炮管特征和履帶特征歸類結(jié)果 Fig.9 Categorization results of barrel characteristics and track characteristics
在實(shí)驗(yàn)探究過程中,根據(jù)有無履帶特征和有無炮管特征分別設(shè)置源任務(wù)和目標(biāo)任務(wù),并將源任務(wù)與目標(biāo)任務(wù)交換形成4組對(duì)比試驗(yàn)。實(shí)驗(yàn)具體設(shè)置及結(jié)果如表3所示,實(shí)驗(yàn)涉及目標(biāo)均只考慮15°和17°姿態(tài)角情況。對(duì)表3的實(shí)驗(yàn)結(jié)果分析可知,對(duì)于元學(xué)習(xí),源任務(wù)是否學(xué)習(xí)炮管特征對(duì)目標(biāo)任務(wù)識(shí)別率影響較小,僅相差1.4%;但源任務(wù)是否學(xué)習(xí)履帶特征對(duì)目標(biāo)任務(wù)識(shí)別率影響較大,學(xué)習(xí)履帶特征的模型性能較未學(xué)習(xí)履帶特征的模型性能提高了7.9%。對(duì)于遷移學(xué)習(xí),源任務(wù)是否學(xué)習(xí)炮管特征和履帶特征對(duì)目標(biāo)任務(wù)識(shí)別率影響均較大,分別相差17.9%和9.6%。
表3 顯著性特征提取實(shí)驗(yàn)數(shù)據(jù)設(shè)置與實(shí)驗(yàn)結(jié)果Table 3 Experimental data setting and experimental results of salient feature extraction
而小樣本學(xué)習(xí)方法為提高模型泛化性能,通常會(huì)學(xué)習(xí)泛化性好的共性特征,結(jié)合表3的實(shí)驗(yàn)結(jié)果分析可知,元學(xué)習(xí)模型對(duì)履帶特征敏感而對(duì)炮管特征不敏感,說明履帶特征為元學(xué)習(xí)模型關(guān)注的共性特征,而模型并未關(guān)注炮管特征這種非顯著性特征。因此,在元學(xué)習(xí)方法下履帶特征是應(yīng)該被重點(diǎn)關(guān)注的顯著性特征。而遷移學(xué)習(xí)性能受炮管特征和履帶特征的影響均較大,說明遷移學(xué)習(xí)同時(shí)學(xué)習(xí)了這兩個(gè)特征。
所以,本文建議在進(jìn)行以目標(biāo)識(shí)別為目的的雷達(dá)成像時(shí),應(yīng)該重點(diǎn)關(guān)注顯著性特征部位的成像質(zhì)量。在使用元學(xué)習(xí)方法進(jìn)行小樣本目標(biāo)識(shí)別時(shí),其雷達(dá)成像過程應(yīng)該重視車輛履帶部位的成像質(zhì)量,保證此處的成像效果;而炮管部位的成像質(zhì)量不必過分關(guān)注。如此不僅能夠提高雷達(dá)目標(biāo)成像效率,減少成像成本,還能夠提升模型識(shí)別性能。
針對(duì)雷達(dá)小樣本目標(biāo)識(shí)別問題,本文結(jié)合元學(xué)習(xí)和遷移學(xué)習(xí),提出了一套綜合解決方案,使用具有強(qiáng)表示學(xué)習(xí)能力的殘差網(wǎng)絡(luò)作為特征提取模塊,并結(jié)合實(shí)際需求分成元學(xué)習(xí)和遷移學(xué)習(xí)兩條處理分支。該方案能夠依據(jù)實(shí)際應(yīng)用場(chǎng)景的不同,提供最恰當(dāng)?shù)男颖緦W(xué)習(xí)算法,最大限度發(fā)揮模型優(yōu)勢(shì),從而大大提升了雷達(dá)小樣本目標(biāo)識(shí)別的效率和準(zhǔn)確率。同時(shí),本文通過多組完備實(shí)驗(yàn)挖掘了小樣本學(xué)習(xí)方法在實(shí)際雷達(dá)目標(biāo)識(shí)別場(chǎng)景下的模型性能,探索了元學(xué)習(xí)和遷移學(xué)習(xí)方法的實(shí)際應(yīng)用條件,進(jìn)一步驗(yàn)證了所提方案的有效性和可行性,并獲得5點(diǎn)能夠指導(dǎo)實(shí)際工程應(yīng)用的重要結(jié)論:① 元學(xué)習(xí)性能優(yōu)越的前提為源任務(wù)樣本量充足以及源任務(wù)與目標(biāo)任務(wù)之間差異性較小,否則遷移學(xué)習(xí)性能表現(xiàn)更好;② 當(dāng)目標(biāo)任務(wù)確定時(shí),源任務(wù)信息量(本文主要指源任務(wù)樣本類別數(shù))的變化對(duì)遷移學(xué)習(xí)影響較小,但對(duì)元學(xué)習(xí)影響較大,隨著源任務(wù)樣本類別數(shù)的增加,元學(xué)習(xí)模型性能大幅提升;③ 源任務(wù)與目標(biāo)任務(wù)間差異性的增大將導(dǎo)致元學(xué)習(xí)和遷移學(xué)習(xí)模型性能變差,但元學(xué)習(xí)性能波動(dòng)更大,而遷移學(xué)習(xí)模型性能表現(xiàn)更為穩(wěn)定,這得益于遷移學(xué)習(xí)的微調(diào)學(xué)習(xí)機(jī)制;④ 小樣本學(xué)習(xí)算法對(duì)雷達(dá)目標(biāo)不同外在特征的關(guān)注度存在差異,因此以目標(biāo)識(shí)別為目的的雷達(dá)成像應(yīng)重點(diǎn)關(guān)注模型需求的顯著性特征。⑤ 元學(xué)習(xí)和遷移學(xué)習(xí)的小樣本識(shí)別性能均受目標(biāo)樣本類內(nèi)差異性影響較大,這是未來工作中需重點(diǎn)考慮的問題,將在下一步工作進(jìn)行深入分析研究。