許 全,譚守標,孫 翔,樊 進
(1.安徽大學集成電路學院,合肥 230000;2.安徽大學網(wǎng)絡信息中心,合肥 230000)
特定輻射源識別是指從接收到的信號中識別單個無線電發(fā)射器,其主要是通過對雷達信號“指紋”特征分析,可以有效實現(xiàn)在調(diào)制類型和參數(shù)幾乎相近的情況下,對不同雷達發(fā)射器的識別。在軍事通信、電子偵察、戰(zhàn)場網(wǎng)絡態(tài)勢感知等領域具有至關重要的作用。
文獻[5]、[6]、[7]使用傳統(tǒng)的特定輻射源個體識別技術,通過提取信號的某些指紋特征,并基于該特征成功實現(xiàn)了對特定發(fā)射器的識別。但是這些技術需要輻射源信號發(fā)射器的參數(shù)保持不變,并且對這些基本參數(shù)做到精確的測量與計算。由于CNN具備強大的特征提取能力和學習能力,一些學者已經(jīng)將CNN應用在特定輻射源個體識別上,文獻[8]提出將接收到的I/Q信號輸入到卷積神經(jīng)網(wǎng)絡當中,來識別不同的輻射源個體;文獻[9]提出首先通過快速傅里葉變換將獲得的信號從時域變換到頻域,然后利用一維卷積網(wǎng)絡完成輻射源個體識別。單獨使用CNN進行輻射源個體識別忽略了雷達信號的時序特征。與CNN相比,循環(huán)神經(jīng)網(wǎng)絡(Recurrent neural network,RNN)更適合用于處理時間序列。但是RNN也存在著難以處理遠距離信息上下文依賴、梯度消失或梯度爆炸等相關問題。1997年,Hochreiter等提 出 了 長 短 期 記 憶(Long short time memory,LSTM)網(wǎng)絡,LSTM單元由輸入門、輸出門和遺忘門三個部分組成,通過這個機制,LSTM解決了RNN所存在的問題,并在語音識別、文本識別等方面有著廣泛的應用。
結合以上分析,CNN在空間特征的提取方面具有明顯的優(yōu)勢,能夠很好地提取出輻射源信號的波形特征,LSTM可以有效地提取輻射源信號波形時序上的依賴關系,本文將CNN與LSTM的優(yōu)勢結合,提出了一種新型輻射源識別方法,該方法直接將收集到的I/Q數(shù)據(jù)先送入1D-CNN網(wǎng)絡進行空間特征提取,再將卷積后的數(shù)據(jù)送入LSTM網(wǎng)絡。該方法減少人工進行特征變換的時間,并且適應了時序處理問題,有效提高了輻射源個體識別的精度與效率。
隨著一維CNN網(wǎng)絡的提出,越來越多的CNN被用于序列數(shù)據(jù)的處理。相比于將雷達信號從一維序列數(shù)據(jù)轉(zhuǎn)換成二維圖像數(shù)據(jù),直接使用一維CNN網(wǎng)絡對I/Q數(shù)據(jù)進行處理的方法不僅減少了人工處理信息的操作,而且保留了原始雷達信號的時間序列信息。
一維卷積網(wǎng)絡的特性和計算規(guī)則與二維卷積相同。與二維卷積的區(qū)別之處在于輸入數(shù)據(jù)的維數(shù),以及特征檢測器(或過濾器)如何在數(shù)據(jù)之間滑動。它的工作原理如圖1所示。
圖1 用于自然語言處理的一維卷積工作示意圖
與其他CNN網(wǎng)絡結構類似,1D-CNN模型也主要由卷積、池化、全連接三個部分組成。卷積層的主要作用是通過滑窗卷積運算提取上一層的輸入數(shù)據(jù)中的局部特征。池化層的引入是仿照人的視覺系統(tǒng)對視覺輸入對象進行降維和抽象。它實際上是一種降采樣,本文采用的是最大池化,即選取每個小區(qū)域的最大值作為輸出。全連接層在整個卷積神經(jīng)網(wǎng)絡中起到“分類器”的作用。
作為RNN的一種變體,LSTM通過可控門結構解決了RNN在訓練過程中出現(xiàn)的梯度消失和梯度爆炸問題。LSTM通過在隱藏層中加入記憶單元來控制時間序列數(shù)據(jù)的記憶信息。信息通過幾個可控門(遺忘門、輸入門、輸出門)在隱藏層的不同單元之間傳輸,從而可以控制先前和當前信息的記憶和遺忘程度。LSTM神經(jīng)元結構如圖2所示。
圖2 LSTM神經(jīng)元結構圖
LSTM的計算如公式(1)~(6)所示。
一維CNN網(wǎng)絡逐層捕捉雷達信號中的空間信息,并將最終得到的空間特征向量傳遞給LSTM。作為RNN網(wǎng)絡的特殊變體,LSTM具自動存儲和刪除時間狀態(tài)信息的能力,可以提取長時間序列的復雜特征關系。本文提出的基于1D-CNN-LSTM的輻射源個體識別方法的網(wǎng)絡結構如圖3所示。
圖3 輻射源個體識別網(wǎng)絡結構圖
該結構主要由1D-CNN部分、LSTM部分以及分類輸出部分組成,輸入信號為雷達個體的I/Q采樣信號,模型首先通過一系列的一維卷積層來提取雷達信號的圖像特征,為了盡可能保留輸入數(shù)據(jù)的時序特征,本文在1D-CNN與LSTM部分使用了Maxpooling操作取代了傳統(tǒng)的Flatten操作,Maxpooling操作同時也有效降低了輸入LSTM部分的數(shù)據(jù)的復雜度,加快了LSTM部分處理數(shù)據(jù)的速度。為了防止發(fā)生過擬合現(xiàn)象,本文還引入了dropout機制,通過隨機丟棄神經(jīng)元的權重,從而降低網(wǎng)絡對某一單一神經(jīng)元的依賴,實驗結果證明該方法行之有效。LSTM部分由4層LSTM網(wǎng)絡構成,充分提取出1D-CNN部分所忽略的時序特征,從而提高輻射源識別模型的精度,最后通過全連接層分類輸出分類結果。
本文所使用的數(shù)據(jù)集是由實際輻射源中頻信號經(jīng)過采樣組成,數(shù)據(jù)集中包含了38種不同的輻射源個體,共計77288條信號數(shù)據(jù)樣本,我們從中隨機抽取80%的樣本作為訓練集來訓練1DCLSTM模型,其余的20%作為測試集。
本文實驗的系統(tǒng)環(huán)境為ubantu18.04系統(tǒng),主要硬件設備為i7-9700KF和NVIDIA GTX 2080。本文所實現(xiàn)的1DCLSTM網(wǎng)絡是基于PyTorch搭建、訓練與測試的。訓練時,輸入的數(shù)據(jù)長度為156,I/Q兩個通道同時輸入,采用微調(diào)的方式完成模型訓練,我們使用Adam優(yōu)化器完成,損失函數(shù)選擇交叉熵損失函數(shù),實驗一共訓練了1000個epoch。
為了確定網(wǎng)絡的總體結構,實驗首先設定Dropout=0.1,通過改變1DCNN部分與LSTM部分的隱藏層數(shù)量,將分類精度進行對比驗證,結果如表1所示。
表1 不同隱藏層網(wǎng)絡結構的Top-1分類結果
為了觀察CNN卷積層所提取到的特征,我們將每一層的卷積輸出進行可視化輸出,如圖4所示。
圖4 卷積特征可視化圖
從可視化的特征圖中我們可以看出,隨著卷積網(wǎng)絡的加深,我們提取到的特征會越來越多,尤其是對于脈沖的上升沿與下降沿特征,卷積網(wǎng)絡可以進行充分的提取。我們將卷積層提取到的特征輸入到LSTM網(wǎng)絡中,進行時間特征的進一步提取,并最終得到分類結果。
從表1中的結果以及圖4的特征圖可以看出,當模型深度太淺時,模型無法充分提取信號的特征,分類效果也欠佳,當網(wǎng)絡模型只由一層CNN與一層LSTM所構成時,在測試集上的Top-1分類效果僅為88.21%。隨著模型深度的增大,我們發(fā)現(xiàn)CNN與LSTM的隱藏層數(shù)量均為4時,Top-1分類效果最好,精度達到了95.34%。此后,無論是增加CNN隱藏層數(shù)量還是增加LSTM隱藏層數(shù)量,分類效果均不增反降,所以本文所采用的模型總體結構由4層CNN網(wǎng)絡加4層LSTM網(wǎng)絡所組成。
Dropout機制的引入有效地抑制了模型的過擬合,為了驗證Dropout機制在本模型中的有效性以及確定合適的Dropout系數(shù),本文在確定了模型總體結構后使用不同的Dropout系數(shù)對模型進行調(diào)整,結果如表2所示。
表2 不同Dropout系數(shù)對Top-1分類效果的影響
通過表2我們可以看出,引入Dropout可以有效地提升模型的性能,當Dropout=0.2時,模型在數(shù)據(jù)集上的Top-1分類效果最好,Top-1分類精度達到95.98%,與不引入Dropout所訓練出來的模型測試精度相比,引入Dropout機制后,測試精度提升了1.15%。此外,我們還發(fā)現(xiàn)隨著Dropout系數(shù)的增大,測試精度反而會出現(xiàn)一定程度的下降,這是由于隨機丟棄了太多的神經(jīng)元權重導致后續(xù)隱藏層學習到的特征不足,所以本文確定的Dropout系數(shù)為0.2。
為了驗證上述模型在輻射源個體識別中有效性,本文將數(shù)據(jù)集分別送入1DCNN網(wǎng)絡、LSTM網(wǎng)絡中進行訓練。文獻[12]中使用包絡提取算法首先將信號包絡提取出來,并繪制成I-Q幅值圖送入DDFN網(wǎng)絡中訓練;文獻[11]中提出LSTM-FCN網(wǎng)絡,將原始數(shù)據(jù)同時送入卷積網(wǎng)絡與LSTM網(wǎng)絡結構,并將輸出特征進行融合得到分類結果。由于輻射源個體識別領域涉及敏感數(shù)據(jù),上述文獻中的方法所使用的源代碼與數(shù)據(jù)集均無法獲得。本文復現(xiàn)了上述文獻中的實驗,并在本地數(shù)據(jù)集中得到測試結果對比,如表3所示。
表3 不同網(wǎng)絡模型的測試結果
通過表3中的數(shù)據(jù)可以看出,直接使用I-Q數(shù)據(jù)的一維處理方法的各項指標都要優(yōu)于文獻[12]中介紹的二維處理方法。而文獻[11]提出的LSTM-FCN方法在輻射源個體識別中表現(xiàn)不佳,精度僅為92.56%。本文介紹的1D-CNNLSTM方法在Top-1分類精度這一指標上明顯優(yōu)于1DCNN和LSTM方法,比1DCNN模型、LSTM模型的分類精度分別提升了2.17%、1.65%。同時,在與1DCNN、LSTM模型測試速度的比較中,1D-CNN-LSTM模型的速度也沒有出現(xiàn)明顯的下降。
由于在實際的應用場景中,采集的數(shù)據(jù)中會包含各種不同類型的噪聲,為了檢驗模型的抗噪性,本文還進行了不同信噪比(Signal noise ratio,SNR)下的分類識別的實驗。實驗中,我們在數(shù)據(jù)集中加入從0~20 dB每隔5 dB生成不同的高斯噪聲。最終,不同信噪比下分類識別的準確率如圖5所示。
圖5 SNR對分類精度的影響圖
從圖5中的曲線可以看出,1DCLSTM模型擁有良好的抗噪聲性能,即使在=0 dB的情況下,其分類準確率仍然可以達到81.36%,隨著信噪比的提升,其分類效果也得到提升,在大于25 dB的環(huán)境中,分類精度可以達到95%以上,說明1DCLSTM模型完全可以在復雜的電磁環(huán)境中發(fā)揮良好的性能。
本文提出了一種基于一維網(wǎng)絡的1DCLSTM網(wǎng)絡模型,并將該模型應用于輻射源個體識別中,該模型可以同時提取輻射源個體信號的空間與時間特征,并取得了良好的分類效果。與其他模型相比,在一定程度上有效提升了分類精度,并能夠?qū)崿F(xiàn)復雜電磁環(huán)境下輻射源個體的識別。