張 姬 侯 進 陳觀業(yè)
(西南交通大學信息科學與技術(shù)學院 四川 成都 611756)
信號的調(diào)制識別是一個關(guān)鍵技術(shù),準確快速地識別和標記信號的調(diào)制模式,是頻譜干擾監(jiān)測、無線電故障檢測、動態(tài)頻譜接入、認知無線網(wǎng)絡(luò)等許多防御和監(jiān)管應(yīng)用的推動技術(shù)[1]。將復(fù)雜的高速射頻信號數(shù)據(jù)轉(zhuǎn)化為精確準確的標簽,使其能夠高效地傳輸和應(yīng)用,是當今無線電傳輸和通信系統(tǒng)中的一個關(guān)鍵組成部分。因此,關(guān)于無線電信號調(diào)制識別技術(shù)的研究具有重要的意義。
通信信號的自動調(diào)制識別的研究中,主要包括兩個技術(shù)方向:(1) 基于似然比判決理論的調(diào)制識別;(2) 基于特征統(tǒng)計理論的調(diào)制識別。似然比函數(shù)決策理論在最小代價準則下效果最佳,然而在實際工程中通信環(huán)境非常復(fù)雜,判決標準根據(jù)調(diào)制方式的不同需要重新設(shè)計似然函數(shù),而且需要許多先驗信息,這些原因?qū)е铝嗽摲椒]有得到普遍使用。
基于特征統(tǒng)計模式的信號識別最關(guān)鍵的步驟是提取出合適的通信信號特征,來區(qū)分不同的調(diào)制模式。當前基于特征統(tǒng)計的調(diào)制識別技術(shù)相關(guān)研究主要集中在以下兩方面:(1) 在復(fù)雜的物理場景上進一步研究更高效的信號特征;(2) 研究機器學習和深度學習方法在調(diào)制識別中的表現(xiàn)。一般特征提取方法有[2]:基于信號瞬時特征、基于小波變換、基于高階累積量、基于星座圖、基于循環(huán)譜等。在分類識別過程中,用深度置信網(wǎng)絡(luò)取代根據(jù)特征閾值進行決策的判決樹[3],或者對部分特征進行自動編碼重構(gòu)以改進分類性能[4],一定程度上提升了分類器對于復(fù)雜通信環(huán)境、復(fù)雜信號類型分類問題的自適應(yīng)性。但以上設(shè)計的神經(jīng)網(wǎng)絡(luò)模型都需要設(shè)計者從信號采樣數(shù)據(jù)中人工設(shè)計和提取特征,模型準確率很大程度取決于這部分。因此,需要一種更加魯棒和有效的神經(jīng)網(wǎng)絡(luò)架構(gòu),弱化前期的特征手動提取部分而達到自動識別的功能,并且提高信號的整體識別率。
近年來深度學習技術(shù)在計算機視覺、語音識別和自然語言處理領(lǐng)域取得了變革性的快速發(fā)展[5],這些領(lǐng)域曾極其依賴特征工程,而現(xiàn)在已經(jīng)逐漸被深度學習神經(jīng)網(wǎng)絡(luò)取代了,所有特征可通過深度神經(jīng)網(wǎng)絡(luò)自身提取,減少了特征提取的工作量。而針對自動調(diào)制識別的特征提取和分類問題,深度學習也逐漸開始在該領(lǐng)域得到應(yīng)用。根據(jù)輸入數(shù)據(jù)類型的不同,將基于深度學習的自動調(diào)制識別分為兩類:(1) 基于轉(zhuǎn)換特征圖像的算法,其主要是將信號序列經(jīng)過預(yù)處理轉(zhuǎn)換為特征圖像(如時頻圖、頻譜圖、循環(huán)譜圖、星座圖等)進而使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等圖像識別算法實現(xiàn)調(diào)制識別[6-7];(2) 基于時域波形數(shù)據(jù)的算法,其主要是利用CNN或循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)直接從時域信號中提取特征并進行分類[8-10]。文獻[8]率先將CNN應(yīng)用于時序信號數(shù)據(jù),并且效果好于使用專家特征的方法。文獻[10]采用將CNN與長短期記憶網(wǎng)絡(luò)(Long Short Term Memory Networks,LSTM)結(jié)合的CLDNN網(wǎng)絡(luò)對無線電信號進行調(diào)制識別。文獻[11]采用RNN對中頻信號的采樣序列進行調(diào)制識別。文獻[12]將端到端的深度學習神經(jīng)網(wǎng)絡(luò)ResNet應(yīng)用于無線電信號序列樣本數(shù)據(jù),獲得比現(xiàn)有最佳的傳統(tǒng)特征提取方法——基于高階矩的分類方法——更高的精度。結(jié)合通信信號本質(zhì)進行深度學習網(wǎng)絡(luò)研究,構(gòu)建具有自適應(yīng)性、自我學習、自主決策能力的通信信號處理機制具有重大的意義。
近年來卷積神經(jīng)網(wǎng)絡(luò)的明顯趨勢是建立更深的網(wǎng)絡(luò)來學習更復(fù)雜的函數(shù)和層次特征關(guān)系,然而隨著神經(jīng)網(wǎng)絡(luò)的深度增加,容易出現(xiàn)梯度消散的現(xiàn)象[13]。因此,本文嘗試通過改變網(wǎng)絡(luò)架構(gòu)和特征傳輸和融合的方式來使信息傳播更加高效,達到提升性能的效果。本文在卷積核尺寸、網(wǎng)絡(luò)容量大致相同的情況下,提出聯(lián)合卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)的并行雙路調(diào)制識別神經(jīng)網(wǎng)絡(luò)PCLD(Parallel CNN_LSTM_DNN)來改進復(fù)雜環(huán)境下多種無線電信號的調(diào)制識別網(wǎng)絡(luò)性能。該網(wǎng)絡(luò)在訓(xùn)練參數(shù)減少的情況下,相比其他卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提高了信號識別分類性能,更適合無線電信號的特征提取,兼顧了無線電信號的空間和時域信息。無線電信號IQ兩路信號兼具時域信息和空間關(guān)系,本文在PCLD基礎(chǔ)上添加了IQ分離數(shù)據(jù)作為輔助通道,設(shè)計了MCCLD(Multi-channel Combined CNN_LSTM_DNN)。該方法在訓(xùn)練參數(shù)量相近的情況下加快了收斂速度,在調(diào)制識別準確度上也有相應(yīng)提高。
無線電信號在信道和接收機的相互作用下,接收信號可表示為:
ω0)t+φn+θ))+g(n)
(1)
式中:An表示第n個符號的幅度;s(t)表示脈沖成形函數(shù);T表示符號周期;h(t)表示信道響應(yīng)函數(shù);φn表示相位;θ表示初始相位偏移;ωc表示載頻;ω0表示接收機頻率;g(n)表示高斯白噪聲。無線電信號本質(zhì)上是由發(fā)射器按照一定規(guī)則映射的,然而在發(fā)射、傳輸和接收過程中,由于載波ωc頻偏、初始相位偏移θ、信道響應(yīng)h(t)和接收機的載波頻率ω0恢復(fù)誤差、符號時鐘恢復(fù)誤差等影響,導(dǎo)致接收到的信號數(shù)據(jù)幅度或相位信息有所失真,存在不同程度的偏差與損傷。接收器將接收到的中頻輸出信號通過正交解調(diào)變換為正交的兩路基帶解析信號:
Z(t)=A(t)cosφt+jA(t)sinφt=ZI(t)+ZQ(t)
(2)
式中:A(t)為基帶信號的瞬時幅度;φt為瞬時相位;ZI(t)為同相分量;ZQ(t)為正交分量。
二維空間中的極坐標上任意點到原點的距離和相角,可以分別代表信號采樣點的振幅和相位,也可以說是代表載波的被調(diào)制情況。而這一點所代表的向量,在笛卡爾坐標中橫軸和縱軸上的投影分別為I值和Q值。所以相反地,如果已知接收信號的IQ數(shù)據(jù),由式(3)和式(4)同樣可得到其瞬時幅度相位信息:
(3)
P(t)=arctan(ZQ(t)/ZI(t))
(4)
本文將使用文獻[12]所發(fā)布的RadioML 2018.01調(diào)制識別數(shù)據(jù)集。該數(shù)據(jù)集使用了GNU Radio軟件連接軟件無線電外設(shè)(Universal Software Radio Peripheral,USRP)采集了共24種不同的模擬調(diào)制和數(shù)字調(diào)制信號,涵蓋了廣泛的單載波調(diào)制方案。調(diào)制信號包括:OOK、4ASK、8ASK、BPSK、QPSK、8PSK、16PSK、32PSK、16APSK、32APSK、64APSK、128APSK、16QAM、32QAM、64QAM、128QAM、256QAM、AM-SSB-WC、AM-SSB-SC、AM-DSB-WC、AM-DSB-SC、FM、GMSK、OQPSK。信道模擬考慮了中心頻率偏移、采樣率偏移、加性高斯白噪聲、多徑和衰落等影響。數(shù)據(jù)集樣本的信噪比均勻分布在-20 dB~30 dB范圍,間隔2 dB,總共26種信噪比參數(shù),數(shù)據(jù)集樣本數(shù)為:24×26×4 096。每個樣本均包含同相分量/正交分量(I/Q)兩路數(shù)據(jù),每一路數(shù)據(jù)有1 024個采樣點。
2.1.1Inception單元網(wǎng)絡(luò)結(jié)構(gòu)
Google提出的Inception架構(gòu)[14]是一種提高網(wǎng)絡(luò)性能的成功方法。本文設(shè)計的Inception單元如圖1所示,包含三個并行路徑:首先通過1×1卷積學習這些特征在通道間的組合方式,同時將輸入的維度降下來,再通過常規(guī)的卷積核來學習某個特征在空間的分布,因為樣本為二維數(shù)據(jù)格式,本文采取的卷積核尺寸為3×2和3×1,兩層小尺寸的卷積核等價于大尺寸卷積核的效果。最后將這些特征信息在通道軸上進行級聯(lián)后輸出。使用1×1卷積可以讓網(wǎng)絡(luò)自行決定使用哪些過濾器組合,在同一層級上擁有多個尺寸的卷積核,這種特征提取方式可以提供多尺度的特征檢測,增加了網(wǎng)絡(luò)寬度有效防止梯度消失。
圖1 Inception單元結(jié)構(gòu)示意圖
2.1.2Inception-Resnet單元網(wǎng)絡(luò)結(jié)構(gòu)
增加跨層連接的殘差網(wǎng)絡(luò)架構(gòu)可以減少梯度消散。文獻[15]將Inception結(jié)構(gòu)與Resnet結(jié)構(gòu)結(jié)合,同時應(yīng)用兩種特征連接方式,在Inception單元間添加跨層連接,得到Inception-ResNet網(wǎng)絡(luò)。本文設(shè)計的Inception-ResNet單元結(jié)構(gòu)如圖2所示。Inception單元提供多尺度的特征檢測及靈活的特征組合方式,殘差結(jié)構(gòu)不直接學習x到H(x)的映射關(guān)系,而是學習兩者的差異,圖2中用F(x)表示,然后需要計算H(x)時,將殘差加到輸入上即可,即學習F(x)+x。因為傳輸前層的信息迫使網(wǎng)絡(luò)將殘差函數(shù)作為特征提取的一部分。殘差結(jié)構(gòu)有效地減少了梯度消散問題,使更深的神經(jīng)網(wǎng)絡(luò)成為可能。
圖2 Inception-ResNet單元結(jié)構(gòu)示意圖
本文采用的網(wǎng)絡(luò)整體結(jié)構(gòu)如圖3所示,數(shù)據(jù)輸入后經(jīng)過一個卷積層增加通道數(shù),經(jīng)過N次卷積單元提取特征,卷積單元中的卷積核數(shù)量和尺寸可自定義。卷積提取單元的個數(shù)N可根據(jù)采樣點長度靈活選取,采樣點少的情況下可以不采用Maxpooling層降采樣,但是在采樣點較多的情況下不進行降采樣會造成運算量和參數(shù)量指數(shù)級增加,反而會導(dǎo)致過擬合現(xiàn)象。卷積單元提取的特征信息在通道維度經(jīng)全局均值池化層(Global Average Pooling,GAP)進行降維,GAP能夠加強最后的特征信息與類別的一致性[16],可以減少參數(shù)量,對整個網(wǎng)絡(luò)在結(jié)構(gòu)上做正則化防止過擬合,最后DNN將特征映射到獨立空間,其輸出通過Softmax回歸進行歸一化處理,得到預(yù)測分類的概率分布,如式(5)所示。
(5)
式中:y1,y2,…,yk,…,yn表示未歸一化的Softmax輸入,qk表示經(jīng)過Softmax歸一化后第k項的概率分布。
圖3 本文Inception網(wǎng)絡(luò)整體結(jié)構(gòu)
本文中選取N=6,卷積核數(shù)目為32,為了減少訓(xùn)練參數(shù)和運算量,在不影響精度的情況下本文在N=4時將特征降采樣至一維。本文中Inception網(wǎng)絡(luò)含有訓(xùn)練參數(shù)的層數(shù)有1層Conv+6×6×2層Conv+1層Dense=74,Inception-Resnet網(wǎng)絡(luò)增加了殘差結(jié)構(gòu),但是網(wǎng)絡(luò)層數(shù)和訓(xùn)練參數(shù)并未增加,與Inception網(wǎng)絡(luò)相同。
2.1.3PCLD調(diào)制識別網(wǎng)絡(luò)結(jié)構(gòu)
LSTM是一種特殊的RNN結(jié)構(gòu),通過遺忘門、輸入門和輸出門三個門來控制節(jié)點狀態(tài)。遺忘門選擇丟棄一部分信息,輸入門界定要更新哪些信息,然后更新這部分信息,最后將遺忘門保留的信息與輸入門更新的信息結(jié)合,經(jīng)過輸出門判斷其狀態(tài)后得到輸出,每一步都保存了前面節(jié)點的信息。文獻[17]首次將CLDNN模型將CNN、LSTM和DNN結(jié)合,該模型在語音識別任務(wù)中獲得了良好的性能。
CNN可以減小頻域的偏移變化,LSTM則適合對時序信息進行建模,本文在卷積調(diào)制識別網(wǎng)絡(luò)基礎(chǔ)上增加了CNN_LSTM并行路徑,結(jié)構(gòu)如圖4所示,構(gòu)建了PCLD網(wǎng)絡(luò)結(jié)構(gòu)來捕獲無線電信號數(shù)據(jù)的空間變化和時域動態(tài)特征。各種卷積網(wǎng)絡(luò)結(jié)構(gòu)可能涉及到通道的重排與融合,會破壞信號數(shù)據(jù)的時序完整性,所以本文將提取時序信息的通道CNN_LSTM設(shè)計為并行結(jié)構(gòu),單獨提取時域動態(tài)特征。本文實驗中卷積網(wǎng)絡(luò)部分選取了Inception_ResNet網(wǎng)絡(luò)結(jié)構(gòu)單元,卷積核數(shù)目、尺寸也與上文相同,CNN_LSTM中卷積層的卷積核尺寸為(3,2),數(shù)目為32,LSTM的輸出維度為16,LSTM層前后使用Reshape層與其他層保持維度一致。PCLD網(wǎng)絡(luò)在Inception-Resnet網(wǎng)絡(luò)基礎(chǔ)上增加了CNN_LSTM并行路徑,網(wǎng)絡(luò)層數(shù)為76。
考慮到接收到的信號數(shù)據(jù)不僅在通道間有空間關(guān)系,其分離的通道本身在時間上是連續(xù)變化的,有效提取到這部分信息,本文設(shè)計了多通道聯(lián)合卷積與長短期記憶網(wǎng)絡(luò)MCCLD。MCCLD由兩部分組成,結(jié)構(gòu)如圖5所示,包括用于提取多維IQ數(shù)據(jù)特征的主通道和提取單一維度時域信息的輔助通道。主通道主要用于提取IQ二維數(shù)據(jù)的時域信息和空間信息,而分離的同相分量I路數(shù)據(jù)和正交分量Q路數(shù)據(jù)作為輔助通道的輸入,主要用來提取單一維度信號分量的時域動態(tài)特征,也可將瞬時幅度A和瞬時相位P數(shù)據(jù)作為輸入數(shù)據(jù)。
圖5 MCCLD網(wǎng)絡(luò)結(jié)構(gòu)示意圖
本文使用的MCCLD網(wǎng)絡(luò)主通道部分使用的神經(jīng)網(wǎng)絡(luò)與上文中的PCLD結(jié)構(gòu)相似,卷積神經(jīng)網(wǎng)絡(luò)都使用Inception_ResNet模塊。輔助通道單一維度數(shù)據(jù)特征的提取采用Conv1D_LSTM結(jié)構(gòu)來提取時域信息,一維卷積層相當于卷積核長度的濾波器在一維數(shù)據(jù)上滑動提取特征,可以很好地用于分析具有固定長度周期的信號數(shù)據(jù)。本文中一維卷積核數(shù)目為32,卷積核長度為8,LSTM輸出維度為16。最后將所有通道提取的特征級聯(lián)后在通道維度進行全局平均池化,防止過擬合,再輸入連接全連接層,通過Softmax回歸進行歸一化處理,最后得到預(yù)測分類的概率分布。MCCLD網(wǎng)絡(luò)在PCLD網(wǎng)絡(luò)基礎(chǔ)上增加了兩條Conv1D_LSTM并行路徑,網(wǎng)絡(luò)層數(shù)為80。
本文設(shè)計的網(wǎng)絡(luò)中卷積層的激活函數(shù)都采用了LeakyReLU函數(shù),相比ReLU激活函數(shù),LeakyReLU可以減少神經(jīng)元死亡從而緩解梯度消失,加速收斂,提升網(wǎng)絡(luò)性能[18]。LeakyReLU的數(shù)學形式如式(6)所示。
(6)
式中:αi是一個常數(shù)(本文取0.05);xi是經(jīng)過卷積操作的輸出結(jié)果;yi是經(jīng)過激活函數(shù)后的輸出結(jié)果,也就是整個卷積層的計算結(jié)果。
對于調(diào)制識別等分類任務(wù),目標損失函數(shù)通常是度量預(yù)測概率與真實類別兩種概率分布之間差異的分類交叉熵,數(shù)學定義為:
(7)
式中:p、q分別表示真實值和預(yù)測值。預(yù)測值越接近真實值,預(yù)測概率越接近1,損失函數(shù)值就越小。由向后傳播算法得出每個參數(shù)關(guān)于損失函數(shù)的梯度,之后再使用梯度下降算法對權(quán)重和偏置參數(shù)進行優(yōu)化更新,找到能使損失函數(shù)最小的局部或全局最優(yōu)值。
網(wǎng)絡(luò)的超參數(shù)如學習率、權(quán)重初始化、梯度下降方法等都會影響網(wǎng)絡(luò)的性能。本文采用了統(tǒng)一的超參數(shù)設(shè)置,使用了自適應(yīng)矩估計(Adam)優(yōu)化器,Adam通過計算梯度的一階矩估計和二階矩估計而為不同的參數(shù)設(shè)計獨立的自適應(yīng)性學習率,在多種網(wǎng)絡(luò)結(jié)構(gòu)中都具有良好表現(xiàn),從而控制了學習率等超參數(shù)對不同網(wǎng)絡(luò)結(jié)構(gòu)性能的影響。本文Adam參數(shù)學習率設(shè)置為0.001,設(shè)置超參數(shù)beta_1為0.9、beta_2為0.999來控制梯度的指數(shù)移動均值的衰減率。
本文實驗所使用的硬件配置為:Inter Xeon CPU,48 GB內(nèi)存,NVIDIA GTX 1080Ti 580 3 GB GPU顯卡。系統(tǒng)環(huán)境為64位Ubuntu16.04操作系統(tǒng),網(wǎng)絡(luò)模型由Python實現(xiàn),基于TensorFlow計算框架并由CUDA10.0加速計算。數(shù)據(jù)集使用RadioML 2018.01調(diào)制信號數(shù)據(jù)集,本文將數(shù)據(jù)集隨機按比例劃分為訓(xùn)練樣本和測試樣本,使用信號調(diào)制識別top-1分類精度作為網(wǎng)絡(luò)性能的指標。
將本文中Inception、Inception_ResNet、PCLD與文獻[8]的CNN、文獻[10]的CLDNN網(wǎng)絡(luò)、文獻[12]的ResNet進行了對比。CNN[8]網(wǎng)絡(luò)由6層卷積層和全連接層構(gòu)成,CLDNN[10]由4個卷積層、2個LSTM層和全連接層組成,ResNet[12]由6個殘差單元和全連接層組成,網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)設(shè)置均參照文獻進行設(shè)置。實驗結(jié)果如表1所示,信噪比在0 dB以下的信號調(diào)制識別平均準確率用acc_low表示,信噪比在0 dB及以上的信號調(diào)制識別平均準確率用acc_high表示,-20 dB~30 dB全部信噪比信號調(diào)制識別準確率為acc_all。Incep_Res代表Inception_ResNet網(wǎng)絡(luò)。
表1 單一結(jié)構(gòu)網(wǎng)絡(luò)調(diào)制識別平均準確率
在不同網(wǎng)絡(luò)結(jié)構(gòu)模型中,本文中的Inception、Inception_ResNet和PCLD在數(shù)據(jù)集上整體識別率均高于CNN[8]、CLDNN[10]和ResNet[12]。ResNet[12]將輸出與輸入相加,形成一個殘差結(jié)構(gòu),比直接擬合所需的底層映射更容易,準確率與CNN[8]相比提高了很多。Inception網(wǎng)絡(luò)在多個尺寸上同時進行卷積運算提取特征積再聚合,提高網(wǎng)絡(luò)計算資源的利用率,在計算量不變的情況下,提高網(wǎng)絡(luò)的寬度和深度,在較高信噪比條件下準確率最高,達到89.67%,但是在低信噪比情況下準確率較低。Inception_ResNet網(wǎng)絡(luò)將殘差結(jié)構(gòu)與Inception單元結(jié)構(gòu)相結(jié)合,以獲得殘差結(jié)構(gòu)帶來的好處。整體結(jié)果上Inception網(wǎng)絡(luò)在數(shù)據(jù)集上的準確率高于ResNet[12],Inception_ResNet整體結(jié)果又好于Inception網(wǎng)絡(luò),在低信噪比情況下Inception_ResNet的表現(xiàn)比Inception表現(xiàn)好,在高信噪比情況下比ResNet[12]識別率更高,表明在不改變網(wǎng)絡(luò)深度的情況下改變網(wǎng)絡(luò)結(jié)構(gòu)可以提高信號調(diào)制識別的準確率。
加入LSTM層后,CLDNN[10]網(wǎng)絡(luò)最后由LSTM層提取特征后進行映射分類,在高信噪比情況下比CNN[8]識別準確率有提高。本文在卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上加入CNN_LSTM并行路徑,PCLD比Inception_ResNet網(wǎng)絡(luò)整體提高大約1百分點的精度,比Inception提高1.68百分點,比ResNet[12]提高3.34百分點,在高信噪比情況下可以達到平均90.54%的準確率,表明LSTM結(jié)構(gòu)可以提取到與卷積單元不同的時序信息。而PCLD的準確率要比CLDNN提高大約有8百分點,表明使用聯(lián)合卷積網(wǎng)絡(luò)結(jié)構(gòu)和長短期記憶網(wǎng)絡(luò)并行提取信號時序信息更高效。
圖6展示了上述幾個網(wǎng)絡(luò)結(jié)構(gòu)在各信噪比情況下的調(diào)制識別性能曲線。
圖6 -20 dB~30 dB不同信噪比情況下各網(wǎng)絡(luò)準確率曲線
整體上隨著信噪比的增加,信號的質(zhì)量提高,識別的準確率也在增加。信噪比的計算公式如下:
SNR=10lg(Ps/Pn)
(8)
式中:Ps表示信號的有效功率;Pn代表噪聲的有效功率。信噪比為負時,代表著無線電信號的有效功率小于噪聲的有效功率,已經(jīng)很難區(qū)分調(diào)制信號與噪聲的差別,-12 dB時準確率為10%,已經(jīng)沒有實用傳輸價值,實際應(yīng)用也較少出現(xiàn)負信噪比的信號。信噪比在0 dB時信號和噪聲的有效功率基本相等,這些網(wǎng)絡(luò)模型也達到了50%以上的準確率,8 dB時可以達到90%,在12 dB時趨于穩(wěn)定,達到95%以上。如果在24類信號調(diào)制識別任務(wù)中以90%準確率為標準時,PCLD模型可以接受的信號信噪比下限為8 dB。PCLD網(wǎng)絡(luò)結(jié)構(gòu)在信噪比為14 dB時準確率達到最高為97.54%,而ResNet[12]在16 dB時達到的最高準確率為95.25%。
本文將使用IQ數(shù)據(jù)和AP數(shù)據(jù)的PCLD網(wǎng)絡(luò)、MCCLD網(wǎng)絡(luò)與文獻[19]的SCC-CNN網(wǎng)絡(luò)在本文數(shù)據(jù)集上進行對比,網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)設(shè)置與原文相同。MCCLD除了提取多維數(shù)據(jù)的整體特征,也提取了獨立的同相分量通道和正交分量通道的時域變化特征信息,也可以將信號的其他特征數(shù)據(jù)輸入輔助通道來提取信息。信號的幅度和相位是兩個主要的調(diào)制變量,可以在二維空間中以極坐標形式表示信號的調(diào)制信息,相位在(-2π,2π)范圍內(nèi)連續(xù)變化,幅度變化體現(xiàn)在與原心距離的變化,再加上時間的維度就可以在三維空間中表示出信號的變化形式,因此本文也使用了AP數(shù)據(jù)輸入來對MCCLD進行實驗。實驗結(jié)果如圖7所示,PCLD_IQ和PCLD_AP表示只使用了信號IQ和AP數(shù)據(jù)的PCLD網(wǎng)絡(luò),MCCLD_IQ和MCCLD_AP表示使用了IQ數(shù)據(jù)和AP數(shù)據(jù)的多通道聯(lián)合MCCLD網(wǎng)絡(luò)。
(a) 各網(wǎng)絡(luò)訓(xùn)練集損失函數(shù)示意圖
(b) 各模型訓(xùn)練集準確率示意圖
(c) 各模型驗證集準確率示意圖圖7 神經(jīng)網(wǎng)絡(luò)訓(xùn)練損失函數(shù)和準確率變化
可以看出,MCCLD_IQ、MCCLD_AP的訓(xùn)練收斂速度和驗證準確率都高于PCLD_IQ、PCLD_AP,表明多通道聯(lián)合提取特征的方式可以提高調(diào)制識別網(wǎng)絡(luò)的性能,MCCLD_IQ、PCLD_IQ的訓(xùn)練收斂速度和驗證準確率也高于MCCLD_AP和PCLD_AP,推斷可能與輸入數(shù)據(jù)是否進行單位歸一化有關(guān)。
表2展示了多通道聯(lián)合的調(diào)制識別網(wǎng)絡(luò)SCC-CNN[19]、PCLD_IQ和MCCLD_IQ在數(shù)據(jù)集上的識別準確率。SCC-CNN[19]同樣采用二維IQ數(shù)據(jù)聯(lián)合分離的IQ通道進行調(diào)制識別,與本文MCCLD不同的是,SCC-CNN[19]只采用了卷積網(wǎng)絡(luò)層進行特征提取,而本文結(jié)合了LSTM層來提取動態(tài)時域特征。本文中聯(lián)合了LSTM層的PCLD和MCCLD的識別準確率均遠高于SCC-CNN[19],在高信噪比情況下有9.75百分點的提升,表明卷積神經(jīng)網(wǎng)絡(luò)與LSTM結(jié)合更適合提取信號數(shù)據(jù)的時域特征和空間特征??梢詮膱D7中看到SCC-CNN[19]網(wǎng)絡(luò)在訓(xùn)練過程中發(fā)生了過擬合現(xiàn)象,是因為其沒有采用降采樣層,參數(shù)量達到了1.9×107,這樣的設(shè)計雖然可以在采樣點較少的情況下減少信息損失,但是在采樣點較多的情況下就會因參數(shù)量過多而導(dǎo)致過擬合現(xiàn)象,反而不利于網(wǎng)絡(luò)的識別性能。本文設(shè)計的MCCLD網(wǎng)絡(luò)可根據(jù)樣本數(shù)據(jù)長度靈活選取參數(shù)N,避免產(chǎn)生過擬合現(xiàn)象。
表2 多通道聯(lián)合的調(diào)制識別網(wǎng)絡(luò)性能對比
MCCLD_IQ在-20 dB~30 dB時調(diào)制識別總體識別率達到63.46%,在低信噪比情況下準確率為19.34%,在高信噪比情況下識別率平均為90.94%,整體相比PCLD準確率有所提高。MCCLD模型在信噪比為0 dB時準確率為54.64%,在信噪比為8 dB時達到94.80%,在信噪比12 dB時趨于穩(wěn)定達到97.31%,14 dB時最高達到97.76%。常見接收信號的信噪比多在0 dB以上,本文中MCCLD_IQ相比PCLD_IQ訓(xùn)練時收斂速度更快,在0 dB到12 dB區(qū)間準確率有較大提升,性能也更加穩(wěn)定。MCCLD模型在信噪比為6 dB時準確率為89.98%,如果在24類信號調(diào)制識別任務(wù)中以90%準確率為標準時,MCCLD可以接受的信號信噪比下限為6 dB。
在圖8中,我們展示了所有24個類別的調(diào)制信號使用PCLD模型和MCCLD模型在低信噪比和高信噪比情況下的分類混淆矩陣。
(a) PCLD模型在SNR為4 dB時的混淆矩陣
(b) PCLD模型在SNR為14 dB時的混淆矩陣
(c) MCCLD模型在SNR為14 dB時的混淆矩陣圖8 所有信號類型的混淆矩陣
對比圖8(a)和圖8(b),低信噪比情況下一些低階調(diào)制或結(jié)構(gòu)有較大差異的信號(如2/4/8-PSK、4/8-ASK、GMSK和FM模擬調(diào)制等)更容易識別,而高階調(diào)制信號需要在較高的信噪比情況下才能獲得更高的識別率。這里我們可以看到,最大的誤差來源是高階相移鍵控(PSK)(16/32-PSK)、高階正交幅度調(diào)制(QAM)之間,以及AM模式(載波存在(WC)和載波抑制(SC))之間。隨著信噪比升高,這些信號的識別率提高,MPSK和MAPSK的識別率接近100%,64QAM識別準確率為98%,128QAM準確率為97%,256QAM準確率為95%,有了很好的提升效果。但AM模式間AM-SSB-WC與AM-SSB-SC,AM-DSB-WC與AM-DSB-SC相互混淆,AM-SSB-SC準確率只有68%,AM-DSB-SC準確率為87%,是識別率最低的兩類信號。對比圖8(b)和圖8(c),MCCLD模型在識別AM-SSB-SC時準確率為73%,AM-DSB-SC準確率為88%,相比PCLD模型減小了這兩類信號的識別誤差,在高階調(diào)制信號的識別準確率也有了略微提高,使得整體識別率也相應(yīng)提高。
本文設(shè)計了兩種適用于信號調(diào)制識別的深度學習網(wǎng)絡(luò)架構(gòu),并在包含24種常見單載波數(shù)字信號和模擬信號數(shù)據(jù)集上進行了實驗。聯(lián)合卷積與記憶神經(jīng)網(wǎng)絡(luò)結(jié)合的PCLD網(wǎng)絡(luò)在0 dB信噪比以上情況下平均識別準確率可以達到90.54%,在ResNet[12]基礎(chǔ)上提高了3.62百分點的準確率,最高可以達到97.54%。將信號分離數(shù)據(jù)作為輔助通道的多通道聯(lián)合MCCLD網(wǎng)絡(luò)可以加快收斂速度,并且提高了整體識別準確率,識別性能也更加穩(wěn)定,在高信噪比情況下平均準確率為90.94%,在SCC-CNN[19]基礎(chǔ)上有9.75百分點的提升,最高可以達到97.76%的準確率。本文研究重點在于不同網(wǎng)絡(luò)結(jié)構(gòu)對其調(diào)制識別性能的影響,網(wǎng)絡(luò)深度寬度等網(wǎng)絡(luò)容量以及超參數(shù)設(shè)置如何影響識別準確率,還有AM模式之間的分類優(yōu)化,將是我們下一步研究方向。