韓 嘯, 陳世文, 陳 蒙, 楊錦程
(信息工程大學數(shù)據(jù)與目標工程學院, 河南 鄭州 450001)
隨著雷達“看見與不被看見”的現(xiàn)實需求不斷上升,低截獲概率(low probability of intercept, LPI)雷達信號的應用愈發(fā)廣泛,針對LPI信號調(diào)制類型識別問題的研究逐漸增多。在現(xiàn)有的針對LPI信號調(diào)制類型識別的方法中,許多方法采用時頻圖像結(jié)合深度學習模型,對比傳統(tǒng)的人工提取特征類方法,在性能上有較大提升,尤其在識別準確率與抗噪聲性能方面,具備顯著優(yōu)勢。文獻[3]較早地提出使用卷積神經(jīng)網(wǎng)絡(convolutional neural networks, CNN)自動提取雷達信號時頻圖像特征并進行分類,證明了該方法具有良好的抗噪聲性能;文獻[4]使用Choi-Williams分布(Choi-Williams distribution, CWD)得到時頻圖像并優(yōu)化了圖像預處理過程,降低噪聲對識別的影響,最后使用CNN實現(xiàn)對8種信號的分類,在-2 dB信噪比下取得93.7%的識別準確率;文獻[5]將遷移學習的思想引入,通過遷移預訓練網(wǎng)絡提升時頻圖特征的提取效果,并降低了此類方法對樣本量的要求,提取特征后用支持向量機(support vector machine, SVM)分類器,8種信號在-2 dB信噪比下識別準確率達到97.8%。文獻[6]構(gòu)建了新的CNN結(jié)構(gòu),將不同分辨率的特征融合,在-6 dB下對12種LPI信號的識別準確率達到95.1%。文獻[7]改進殘差網(wǎng)絡為擴張殘差網(wǎng)絡,提升了針對類線性調(diào)頻信號的識別準確率,并在-6 dB信噪比下對16種雷達信號整體識別準確率達到98.2%。文獻[8]在特征提取網(wǎng)絡前添加針對時頻圖的去噪卷積網(wǎng)絡,在-10 dB信噪比下對8種LPI信號識別準確率達到90%。
上述研究雖然在識別準確率和抗噪聲性能方面得到了很好的結(jié)果,但是都默認識別階段信號的種類與訓練階段一致,即設定在訓練階段能獲得全部種類的信號。如果識別階段出現(xiàn)了訓練集中未包含的信號種類,上述方法就會錯誤地將該信號劃分至某一類中。在實際非合作接收條件下,接收機面對的是開放的電磁環(huán)境,充滿各種干擾和不確定的信號,對重點關(guān)注的LPI信號進行跟蹤分類時,無法保證截獲信號一定是其中的種類。所以應用于LPI信號調(diào)制類型識別的模型必須具備開集識別能力,才能在分類的同時應對非目標信號的干擾。
開集識別問題一經(jīng)提出就受到廣泛的關(guān)注,現(xiàn)有的方法大致可以分為判別式和生成式兩類。但是,專門針對輻射源開集識別問題的研究較少,尤其是關(guān)于LPI信號的研究。文獻[18]提出SV-Means算法,基于隨機梯度下降和k均值(k-means)原理改進分位數(shù)單類支持向量機(quantile one-class support vector machine, q-OCSVM)求解過程,提高計算效率,用于解決相位調(diào)制信號的開集識別問題。文獻[20]提出一種基于生成網(wǎng)絡重構(gòu)已知類信號,擾亂未知類信號的方法,實現(xiàn)了通信信號的開集識別,取得了較好的結(jié)果。但是每新增一種已知類信號,就需要訓練一個重構(gòu)網(wǎng)絡,流程較繁瑣。文獻[21]對分類與回歸樹算法進行改進,使基分類器具有開集識別能力,利用脈沖特征參數(shù)實現(xiàn)雷達輻射源的開集增量學習,具有計算復雜度低、輕量化的優(yōu)勢;但是對特征的處理較簡單,不適合脈內(nèi)調(diào)制類型識別。本文引入一種基于互易點學習的開集識別模型,結(jié)合LPI信號時頻圖像的特點對特征提取網(wǎng)絡進行改進,在網(wǎng)絡中添加了注意力機制使其更關(guān)注時頻圖中能量聚集部分的信息。本文給出模型訓練、識別步驟和開集識別閾值選取方法,解決了LPI信號在開放電磁環(huán)境中的識別問題,并與現(xiàn)有方法有較好的兼容性。
非合作接收條件下,依靠庫內(nèi)已標記信號構(gòu)建訓練集進行訓練。假設已有標記好的截獲脈內(nèi)信號類,表示為
={(,),(,),…,(,)}
(1)
={(,),(,),…,(,)}
(2)
式中:表示截獲信號的樣本數(shù)量;∈{1,2,…,}∪{+1,+2,…,+},表示截獲信號中的未知信號種類數(shù)。中的一部分屬于已知類特征空間,表示為-;一部分屬于未知類開放特征空間,表示為-。本文方法對進行預處理,然后訓練模型,并確定開集識別閾值;用訓練好的模型和閾值實現(xiàn)中-的分類和-的識別。
特征提取網(wǎng)絡提取時頻圖像特征,將圖像映射到特征空間。模型采用以CNN為主的特征提取網(wǎng)絡,在此基礎上加入注意力機制模塊使網(wǎng)絡更關(guān)注時頻圖像中能量聚集部分。
注意力機制模擬人的視覺系統(tǒng),當人在觀察圖像時,更關(guān)注圖像中輔助判斷部分的信息,而忽略不相關(guān)的信息。卷積塊注意力模塊(convolutional block attention module, CBAM)結(jié)合了通道注意力和空間注意力兩種主要的注意力機制,將原始圖片中的信息變換到另一個空間中并提取關(guān)鍵的部分。LPI信號的時頻圖像與普通物體的圖像不同,有效信息只包含在時頻分布能量聚集的部分。模型輸入的是時頻圖像整體,但特征提取網(wǎng)絡應更關(guān)注時頻圖像中有效的部分。特別是開集識別模型面對的是開放的電磁環(huán)境,學習關(guān)注時頻圖重點區(qū)域有助于更好地將輸入映射至特征空間,使已知類和未知類信號更具區(qū)分性;同時降低噪聲對識別的干擾,一定程度減緩網(wǎng)絡因過于“關(guān)注”噪聲而造成分類錯誤。
特征提取網(wǎng)絡整體結(jié)構(gòu)如圖1所示,由9個卷積核大小為3×3的卷積模塊級聯(lián)構(gòu)成。這樣的結(jié)構(gòu)在保持較大的感受野的同時增加了線性整流函數(shù)(rectified linear unit, ReLU)層數(shù)量,且減少了參數(shù)量。每個卷積模塊的輸入輸出通道數(shù)在圖中列出。卷積模塊中的卷積層后接批歸一化(batch normalization, BN)層對數(shù)據(jù)進行歸一化提升訓練效率,然后通過ReLU激活函數(shù)。在網(wǎng)絡中添加Droupout層防止訓練過擬合。將注意力模塊加入分類網(wǎng)絡的最后一個卷積模塊中,經(jīng)過第9個卷積層并歸一化后的特征與其通過通道注意力模塊的系數(shù)相乘,然后再與生成的空間注意力系數(shù)相乘,得到最終的特征向量。
圖1 特征提取網(wǎng)絡結(jié)構(gòu)Fig.1 Structure of feature extraction network
圖2 互易點示意圖Fig.2 Diagram of reciprocal point
由于網(wǎng)絡在提取嵌入特征時,通常將未知類樣本隨機地映射至全空間的任意位置,所以互易點與未知類信號在特征空間中的相似性更高,即特征空間中未知類與互易點的距離應比已知類更近:
(3)
式中:(·,·)代表在特征空間中計算兩個樣本集中所有樣本之間的距離。為了更好地表達空間上的距離,模型使用的距離是歐式距離與點積的結(jié)合:
(4)
式中:表示信號樣本;(·)表示特征提取函數(shù),即將輸入樣本映射到特征空間的函數(shù);(·)表示由信號數(shù)據(jù)得到預處理后的時頻圖像過程;是特征空間中特征的維數(shù)。為了使和更具有區(qū)分性,需被限制在空間范圍內(nèi):
(5)
通過限制未知類樣本與其對應互易點的距離不超過,從而限制開放空間大小,降低開放風險。
對已知類樣本分類時,根據(jù)樣本與每個互易點的距離判斷樣本屬于哪一類。樣本屬于第類的概率通過softmax函數(shù)歸一化:
(6)
樣本在特征空間中與哪一類互易點的距離最大,屬于該類的概率就最大。損失函數(shù)設置為
(;,)=-ln(=|,,,)
(7)
(8)
對未知類信號分類時,目標函數(shù)為式(5)。然而未知信號實際上來自識別階段開放的環(huán)境,無法在訓練階段預知,所以實現(xiàn)式(8)是十分困難的。但是與是互補的,可以通過促使中樣本與的距離大于間接約束開放空間大小,損失函數(shù)表示為
(9)
(,;,,)=(;,)+(;,,)
(10)
對抗訓練結(jié)果是特征提取網(wǎng)絡學習到一個良好的特征空間。如第13節(jié)所描述,在該空間中,已知類樣本和未知類樣本具有顯著的分布差異:未知類映射到空間中心,已知類被推向空間邊緣并相互排斥。
使用模型對分類時,計算中樣本與已訓練模型中每一個已知類互易點的距離集合:
(,)={,,…,}
(11)
(12)
(13)
圖3 對抗訓練的最終特征空間Fig.3 Final embedding space of adversarial training
(14)
識別階段使用該閾值對樣本進行分類:
(15)
圖4是實驗中(,)和(,)的分布,模型訓練效果越好,已知類和未知類分布的區(qū)分度就越大,閾值適應性越強。
圖4 ξ(SR,P)max分布示意圖Fig.4 Diagram of distribution of ξ(SR,P)max
由于本文研究的重點是信號調(diào)制類型識別問題,所有仿真信號均是脈內(nèi)部分。重點以LPI信號為研究對象,按照文獻[28]的信號定義仿真全部12種LPI信號,參數(shù)設置參考文獻[29],仿真信號參數(shù)列表如表1所示。
表1 仿真信號參數(shù)Table 1 Parameters of simulated signal
采樣率設定為1 200 MHz,(·)表示均勻采樣;{·}表示隨機取值。載頻取值范圍是(12,4),信號長度的范圍是(512,1 920)。
221 時頻分析
雷達信號具有非平穩(wěn)特性,時頻分析作為處理非平穩(wěn)信號的有力工具,能夠同時獲得信號的時頻信息,已經(jīng)廣泛地應用于信號識別。研究表明,時頻分析方法的選擇對雷達信號識別的效果有較大影響,CWD同時具有較好的能量聚集性和抑制交叉項能力,故本文選擇CWD作為時頻分析方法。對于信號(),它的CWD表達式為
(16)
為平衡時頻分辨率和抑制交叉項,選擇=1;綜合考慮時頻分辨率和計算復雜度,選擇合適的時域、頻域窗長。
222 圖像處理
為了使得到的時頻圖像更好地體現(xiàn)不同LPI信號的調(diào)制特征,同時符合模型網(wǎng)絡輸入的要求,需要對時頻圖像進行預處理,如圖5所示。
圖5 時頻圖像預處理Fig.5 Preprocessing of time-frequency images
將得到的時頻圖像能量值通過最大最小法歸一化為灰度值;
對灰度圖像進行維納濾波;
根據(jù)網(wǎng)絡輸入尺寸要求,使用雙三次插值重置圖像大小。
(·)即為上述由信號數(shù)據(jù)生成時頻圖像和預處理圖像的過程。
使用庫內(nèi)已標記信號對特征提取網(wǎng)絡進行訓練,并通過訓練集得到閾值,然后使用該模型對截獲信號集合進行識別,訓練、識別流程如圖6所示。
圖6 訓練、識別流程Fig.6 Processing of training and recognition
231 模型訓練
對進行CWD時頻分析、圖像預處理,得到時頻圖像集()。
將()劃分為訓練集和驗證集。
設置模型訓練優(yōu)化器為Adam,損失函數(shù)為式(10),設置學習率衰減策略。
進行互易點對抗訓練。設置初始學習率為0001,batch size為64,最大epoch為50。訓練完成時得到分類器網(wǎng)絡。
根據(jù)訓練集數(shù)據(jù)通過分類器網(wǎng)絡后的分布計算得到開集閾值。
232 識別
從中取樣本,進行CWD時頻分析、圖像預處理,得到時頻圖像()。
將()輸入訓練好的模型,得到特征(())。
返回步驟1,直到中所有樣本全部被識別,結(jié)束識別過程。
下面分別以接收機工作特性曲線下面積(area under the receiver operating characteristic, AUROC)、識別準確率(accuracy, ACC)和F值(F-measure)為測試指標,開展實驗。
311 AUROC
引入一種與數(shù)據(jù)分布和閾值選擇均無關(guān)的指標對特征空間優(yōu)化效果進行評估。接收機工作特性(receiver operating characteristic, ROC)曲線通過改變分類器判決的閾值繪制真正例率與假正例率之間的關(guān)系。曲線的橫坐標是假正例率,縱坐標是真正例率,AUROC就是ROC曲線下的面積大小。
AUROC數(shù)值正常從0.5到1之間變化,當AUROC=0.5時,分類器相當于是一個隨機分類器,將接收到的LPI信號隨機判斷為已知類或未知類。面積越大,AUROC越接近1,模型特征空間中已知類和未知類區(qū)分度越強,故模型鑒別已知類和未知類的能力越強。
3.1.2 ACC
在雷達輻射源閉集識別場景中,一般用ACC衡量分類結(jié)果。為保持統(tǒng)一,在本文開集識別場景中,計算ACC時將接收信號中類未知信號全部歸為“未知類”,即第+1類。設中第類信號被識別為第類的個數(shù)為,識別準確率計算式為
∈{1,2,…,+1};∈{1,2,…,+1}
(17)
313 F-measure
F-measure調(diào)和了查全率和查準率,被廣泛應用于測試開集識別模型的性能。本文采用文獻[18]的F-measure定義:
(18)
將已知類信號設定為正例,未知類信號設定為負例。TP表示真正例數(shù),FP表示假正例數(shù),FN表示假負例數(shù)。
按照表1仿真產(chǎn)生庫內(nèi)的已標注信號包括線性調(diào)頻(linear frequency modulation, LFM)、BPSK、Costas、Frank、P1~P4共8類,信噪比范圍SNR∈{0 dB,2 dB,4 dB,6 dB,8 dB,10 dB},每個信噪比下每類信號產(chǎn)生300個,=14 400。有LFM、BPSK、Costas、Frank、P1~P4碼,T1~T4碼共12類。信噪比范圍SNR∈{-6 dB,-4 dB,-2 dB,0 dB,2 dB,4 dB,6 dB,8 dB,10 dB},每個信噪比下每類信號產(chǎn)生100個,=10 800。分別在添加注意力機制和未添加注意力機制條件下訓練相同輪次epoch=50,進行蒙特卡羅實驗10次訓練并保存模型。
通過梯度加權(quán)類激活映射(gradient-weighted class activation mapping, Grad-CAM)方法觀察添加注意力機制前后的訓練模型對相同信號時頻圖“關(guān)注”區(qū)域的變化。Grad-CAM不改變原網(wǎng)絡結(jié)構(gòu)并且不需要重新訓練,通過計算每個通道輸出特征圖對分類決策貢獻的權(quán)重并累加,得到輸入圖像各個部分對最終決策的影響值,可視化為熱力圖形式,影響越大的部分熱力圖中溫度越高。對添加注意力機制前后訓練好的網(wǎng)絡進行可視化分析,得到同一時頻圖像經(jīng)過兩種網(wǎng)絡后的類別激活熱力圖,如圖7所示。
圖7 添加CBAM前后熱力圖對比Fig.7 Comparison of thermal diagram before and after adding CBAM
由圖7可知,未添加注意力機制的網(wǎng)絡在提取低信噪比信號特征時更容易受到噪聲影響,對噪聲部分置以權(quán)重,這可能導致隨機分類,降低識別效果。添加注意力機制后,抑制一部分噪聲干擾,使網(wǎng)絡更關(guān)注能量聚集部分,從而提升鑒別已知類和未知類的能力。
使用開集測試數(shù)據(jù)對模型進行測試,取平均值,得到最終結(jié)果,如圖8所示。
圖8 不同信噪比條件下兩種網(wǎng)絡的AUROC測試結(jié)果Fig.8 AUROC test results of two networks under different signal-to-noise ratios
從圖8可以看出,添加CBAM能夠輔助互易點學習,使特征提取網(wǎng)絡提取到更好的特征,AUROC指標有所提升。
使用第3.2節(jié)蒙特卡羅實驗10次產(chǎn)生的模型,繼續(xù)進行實驗。
3.3.1 模型對開集信號數(shù)量增加的適應性
設置開放的接收環(huán)境中接收到信號有LFM、BPSK、Costas、Frank、P1~P4碼、T1~T4碼共12類。定義開集比例Ratio:
(19)
固定-中每一類產(chǎn)生100個信號,逐漸增加-數(shù)量,每次每一類增加50個,每個開集比例下測試10次并計算最終的平均結(jié)果,如圖9所示。
圖9 不同Ratio條件下的測試結(jié)果Fig.9 Test results under different Ratio
對比實驗采用的模型是閉集調(diào)制類型識別中的經(jīng)典特征提取網(wǎng)絡ResNet-18,采用遷移學習,替換最后的全連接層進行訓練,同樣進行蒙特卡羅實驗10次。對比實驗訓練集和測試集與開集模型完全一致。由測試結(jié)果圖9(a)可知,相比傳統(tǒng)的閉集識別網(wǎng)絡,本文模型在閉集條件下(Ratio=0)具有相同水平的ACC。但在開放電磁環(huán)境中,截獲信號包含未知類時,使用傳統(tǒng)閉集網(wǎng)絡失效,ACC迅速下降,本文模型卻仍然能夠保持較高的值。從圖9(b)結(jié)果可知,隨著截獲信號中未知類比例增大,本文模型在信噪比6 dB下F-measure能夠維持在0.98左右,0 dB下維持在0.90左右,對增長的未知類信號比例適應性較強。
3.3.2 模型對開集信號種類增加的適應性
進一步驗證本文模型對開放電磁環(huán)境的適應能力,保持-不變,增加-種類,參數(shù)見表2,其中調(diào)制類型有LFM/BPSK、LFM/頻移鍵控(frequency-shift keying, FSK)、BPSK/FSK復合調(diào)制和非線性調(diào)頻(non-linear frequency modulation, NLFM)。
表2 補充干擾信號參數(shù)Table 2 Parameters of supplementary interference signal
-隨機從{T1,T2,T3,T4,NLFM,LFM/FSK,LFM/BPSK,BPSK/LFM}中抽取一定種類數(shù)的信號,種類數(shù)從0依次增加至8,抽取的每一類信號仿真100個。根據(jù)文獻[31]定義開放率Openness:
(20)
進行蒙特卡羅實驗10次得到實驗結(jié)果如圖10所示。
由圖10可知,當截獲信號中存在大量非目標LPI信號或其他種類信號時,測試指標ACC和F-measure同樣均維持在較高值,模型能正確識別未知類信號,并正確分類已知的目標信號種類,對開集場景具有較好的適應能力。
圖10 不同Openness條件下的測試結(jié)果Fig.10 Test results under different Openness
本文分析了現(xiàn)有基于時頻圖和深度學習模型的LPI信號識別方法無法適應開集場景,引入互易點學習優(yōu)化特征提取網(wǎng)絡,得到具有良好表征特性的特征空間。在該空間中未知類信號分布在中心,已知類被推向邊緣并彼此分開。根據(jù)該分布特點給出未知類信號的開集識別閾值取值方法。在此基礎上為特征提取網(wǎng)絡加入CBAM,使網(wǎng)絡更關(guān)注能量集中部分的有效信息。文章給出完整的模型訓練、識別流程,并在設定的開集場景下測試了模型的有效性和適應性。