左曉亞 張俊杰 姚如貴 樊 曄 蔣麗鳳
(1.西北工業(yè)大學(xué)電子信息學(xué)院,陜西西安 710072;2.中國(guó)空間技術(shù)研究院,陜西西安 710100)
自動(dòng)調(diào)制方式識(shí)別(Automatic Modulation Classification,AMC)技術(shù)旨在缺乏參數(shù)信息的情況下智能的識(shí)別出信號(hào)的調(diào)制方式,在民用和軍用領(lǐng)域都有著廣泛的應(yīng)用;傳統(tǒng)自動(dòng)調(diào)制方式識(shí)別(AMC)技術(shù)主要分為兩類,一類是基于最大似然函數(shù)的調(diào)制方式識(shí)別,另一種是基于統(tǒng)計(jì)理論的信號(hào)調(diào)制方式識(shí)別技術(shù),基于最大似然函數(shù)的調(diào)制方式識(shí)別利用似然函數(shù)對(duì)接收到的信號(hào)進(jìn)行計(jì)算,得出該信號(hào)的似然判決比來(lái)實(shí)現(xiàn)調(diào)制方式識(shí)別,但由于該方法需要較多的先驗(yàn)知識(shí)以及計(jì)算過(guò)程較為復(fù)雜限制了其在實(shí)際情況中的應(yīng)用;基于統(tǒng)計(jì)理論的信號(hào)調(diào)制方式識(shí)別技術(shù)提取信號(hào)中的統(tǒng)計(jì)特征,再通過(guò)分類器進(jìn)行分類,這種方法同樣需要大量的先驗(yàn)知識(shí),對(duì)于先驗(yàn)信息不足的調(diào)制信號(hào)其識(shí)別準(zhǔn)確率會(huì)大幅下降。
隨著近些年來(lái)深度學(xué)習(xí)技術(shù)的不斷發(fā)展,深度學(xué)習(xí)技術(shù)不斷應(yīng)用到越來(lái)越多的領(lǐng)域和研究中,神經(jīng)網(wǎng)絡(luò)的發(fā)展?jié)摿薮螅{(diào)制方式識(shí)別領(lǐng)域正逐步與深度學(xué)習(xí)技術(shù)相結(jié)合,越來(lái)越多的研究將深度學(xué)習(xí)技術(shù)應(yīng)用到了調(diào)制方式識(shí)別中;例如利用深度學(xué)習(xí)技術(shù)將時(shí)域與頻域的數(shù)據(jù)相結(jié)合實(shí)現(xiàn)調(diào)制方式識(shí)別[1],將長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和空間注意力機(jī)制相結(jié)合進(jìn)行信號(hào)的特征提取[2],利用卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)聯(lián)合對(duì)信號(hào)的星座圖進(jìn)行特征提取[3],文獻(xiàn)[4]利用兩層的(Long Short Term Memory,LSTM)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)從時(shí)域信號(hào)幅度相位信息中進(jìn)行特征提取實(shí)現(xiàn)信號(hào)的調(diào)制方式分類;文獻(xiàn)[1-4]在對(duì)信號(hào)特征提取的過(guò)程中并沒(méi)有對(duì)中間過(guò)程的特征向量交互融合,最終提取到的特征可能并不充分;文獻(xiàn)[5]分別對(duì)輸入信號(hào)的IQ 序列數(shù)據(jù)、I 路數(shù)據(jù)、Q 路數(shù)據(jù)分別設(shè)計(jì)網(wǎng)絡(luò)單獨(dú)進(jìn)行處理,之后再將三個(gè)網(wǎng)絡(luò)輸出的特征向量融合,再利用神經(jīng)網(wǎng)絡(luò)對(duì)融合后的特征進(jìn)一步處理并分類,實(shí)現(xiàn)信號(hào)的調(diào)制方式識(shí)別;文獻(xiàn)[6]提出了一種基于兩層門(mén)控遞歸單元(Grated Recurrent Unit,GRU)的高效網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)提取原始IQ數(shù)據(jù)中的時(shí)域序列特征信息來(lái)實(shí)現(xiàn)信號(hào)分類,但在低信噪比的情況下該網(wǎng)絡(luò)識(shí)別性能急劇下降;文獻(xiàn)[7]不僅利用IQ 信息提取信號(hào)特征,還同時(shí)從信號(hào)的幅度相位信息與星座圖中并行提取特征,再將不同模態(tài)的特征向量串聯(lián)并相乘得到最終的分類結(jié)果,但是在融合不同模態(tài)的特征向量時(shí)只是簡(jiǎn)單串聯(lián)和相乘,并沒(méi)有設(shè)計(jì)特定的模塊來(lái)對(duì)特征向量進(jìn)行充分融合;文獻(xiàn)[8]使用殘差結(jié)構(gòu)的復(fù)數(shù)卷積神經(jīng)網(wǎng)絡(luò),直接對(duì)輸入信號(hào)進(jìn)行復(fù)數(shù)卷積操作;以上提到的調(diào)制識(shí)別算法使用的神經(jīng)網(wǎng)絡(luò)均為卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)或殘差神經(jīng)網(wǎng)絡(luò),三種網(wǎng)絡(luò)在單獨(dú)處理輸入數(shù)據(jù)時(shí),均有著對(duì)輸入數(shù)據(jù)特征提取不充分的問(wèn)題,對(duì)數(shù)據(jù)中關(guān)鍵特征的捕獲存在不足,導(dǎo)致分類結(jié)果難以提升,本文針對(duì)調(diào)制方式識(shí)別任務(wù)和三種網(wǎng)絡(luò)的特異性,融合卷積神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和殘差神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),并設(shè)置合適的網(wǎng)絡(luò)參數(shù),設(shè)計(jì)出本文的網(wǎng)絡(luò)模型。
本文提出了一種基于多維度特征端到端卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)并聯(lián)結(jié)構(gòu),模型由兩個(gè)并行分支構(gòu)成,一個(gè)分支是殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)(Dilated convolution-residual network,DCRN),另一個(gè)分支是CNN 串聯(lián)LSTM 形成CNN-LSTM 分支;原始的IQ 數(shù)據(jù)輸入進(jìn)網(wǎng)絡(luò)經(jīng)過(guò)數(shù)據(jù)預(yù)處理模塊提取出瞬時(shí)幅度和相位信息,之后原始IQ 數(shù)據(jù)和幅度相位信息兩種模態(tài)的數(shù)據(jù)分別輸入進(jìn)DCRN 和CNN-LSTM 兩個(gè)分支各自進(jìn)行特征提取得到兩種不同的特征信息,再通過(guò)特征融合模塊融合兩種模態(tài)的特征信息得到最終完備的特征,最后全連接層對(duì)特征的分類進(jìn)行輸出,實(shí)現(xiàn)信號(hào)調(diào)制方式的識(shí)別。
在完整的通信系統(tǒng)中,通常包含發(fā)射機(jī)、信道和接收機(jī)三部分,接收機(jī)的接收信號(hào)可表示為:
式中,y(t)表示接收到的信號(hào),x(t)表示發(fā)射信號(hào),h(t)表示相應(yīng)信道,n(t)表示噪聲,為了對(duì)后續(xù)的信號(hào)進(jìn)行處理,還要對(duì)接收到的信號(hào)y(t)進(jìn)行采樣得到離散的接收信號(hào)y(n):
式中,n為信號(hào)的采樣點(diǎn)數(shù)。
實(shí)際通信過(guò)程中,通常使用IQ 調(diào)制,因?yàn)镮Q 調(diào)制可以提高頻譜利用率,對(duì)信號(hào)序列進(jìn)行分量提取,將實(shí)部和虛部轉(zhuǎn)為二維矩陣,抽樣后的每一點(diǎn)可以表示為:
式中,In為同向分量,Qn為正交分量,j 為虛數(shù)單位,將In路數(shù)據(jù)和Qn路數(shù)據(jù)組合為矩陣形式即得到所要的二維矩陣。
常見(jiàn)的數(shù)字調(diào)制方式有ASK 調(diào)制、FSK 調(diào)制、PSK調(diào)制和MQAM調(diào)制。
ASK 是利用載波的幅度變化傳遞數(shù)字信息,其頻率和初始相位保持不變;2ASK 信號(hào)的一般表達(dá)式為:
其中:
式中,T為碼元持續(xù)時(shí)間,g(t)為持續(xù)時(shí)間為T(mén)的基帶脈沖波形,an是第n個(gè)符號(hào)的電平取值。
FSK 是利用載波的頻率變化傳遞數(shù)字信息;在2FSK 中,載波的頻率隨二進(jìn)制基帶信號(hào)在f1和f2兩個(gè)頻點(diǎn)之間變化,其表達(dá)式為:
一個(gè)2FSK 信號(hào)又可以看成是兩個(gè)不同載頻的2ASK 信號(hào)的疊加,因此2FSK 信號(hào)的時(shí)域表達(dá)式也可以表示為:
式中,g(t)為持續(xù)時(shí)間為T(mén)的基帶脈沖波形,是an的反碼,φn和θn分別為第n個(gè)信號(hào)碼元的初始相位,在FSK中φn和θn不攜帶信息,通??梢詾榱?。
PSK 是利用載波的相位變化傳遞數(shù)字信息,而振幅和頻率保持不變;在2PSK 中,通常用初始相位0 和π 分別表示二進(jìn)制“1”和“0”,2PSK 信號(hào)的時(shí)域表達(dá)式為:
式中,φn表示第n個(gè)符號(hào)的絕對(duì)相位:
MQAM 是幅度和相位的混合調(diào)制,利用兩個(gè)相互正交的載波cos(2πfct)和sin(2πfct)調(diào)制,然后再對(duì)兩路信號(hào)求和,其表達(dá)式為:
傳統(tǒng)的深度學(xué)習(xí)模型為卷積神經(jīng)網(wǎng)絡(luò)直接對(duì)原始輸入數(shù)據(jù)進(jìn)行特征提取,由于原始數(shù)據(jù)中所蘊(yùn)含的特征有限,導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)所提取的特征非常局限,分類結(jié)果并不理想;本文研究了一種端到端的神經(jīng)網(wǎng)絡(luò),可以在神經(jīng)網(wǎng)絡(luò)內(nèi)部把原始的輸入IQ 數(shù)據(jù)進(jìn)行預(yù)處理,然后將原始數(shù)據(jù)和預(yù)處理之后的數(shù)據(jù)分別進(jìn)行特征提取。
本文所搭建神經(jīng)網(wǎng)絡(luò)模型如圖1 所示,網(wǎng)絡(luò)中有兩個(gè)分支,原始數(shù)據(jù)輸入進(jìn)神經(jīng)網(wǎng)絡(luò)之后首先網(wǎng)絡(luò)對(duì)原始的IQ兩路數(shù)據(jù)進(jìn)行預(yù)處理,提取出瞬時(shí)的幅度和相位信息,然后再將原始數(shù)據(jù)和幅度相位信息分別通過(guò)兩個(gè)不同結(jié)構(gòu)并聯(lián)的網(wǎng)絡(luò)進(jìn)行特征提取,然后將兩個(gè)分支所提取的特征進(jìn)行特征融合,最后通過(guò)全連接層的最后一層Softmax 輸出分類結(jié)果。
圖1 本文網(wǎng)絡(luò)模型Fig.1 Our proposed network model
原始的IQ數(shù)據(jù)輸入進(jìn)網(wǎng)絡(luò)之后,最先經(jīng)過(guò)的是數(shù)據(jù)預(yù)處理模塊,數(shù)據(jù)預(yù)處理模塊的主要功能是提取原始數(shù)據(jù)中所蘊(yùn)含的幅度和相位信息。
幅度信息的提取用公式可表示為:
其中,amp(i)代表所提取到的第i時(shí)刻幅度信息,I(i)代表第i時(shí)刻I 路數(shù)據(jù),Q(i)代表第i時(shí)刻Q 路數(shù)據(jù)。
相位信息的提取用公式可表示為:
其中,pha(i)代表所提取到的第i時(shí)刻相位信息,I(i)代表第i時(shí)刻I路數(shù)據(jù),Q(i)代表第i時(shí)刻Q路數(shù)據(jù)。
輸入網(wǎng)絡(luò)的原始IQ兩路數(shù)據(jù)大小為2 × 128,即第一行為I路數(shù)據(jù),第二行為Q路數(shù)據(jù),由公式(11)和(12)對(duì)每一對(duì)IQ 數(shù)據(jù)計(jì)算即可得瞬時(shí)幅度相位信息,所得到的瞬時(shí)幅度相位信息矩陣大小為2 × 128。
特征提取部分主要通過(guò)兩個(gè)并聯(lián)的卷積神經(jīng)網(wǎng)絡(luò)同時(shí)進(jìn)行,其中膨脹卷積網(wǎng)絡(luò)處理原始IQ 數(shù)據(jù),另一個(gè)CNN2處理瞬時(shí)幅度相位信息,兩個(gè)CNN分支的結(jié)構(gòu)單獨(dú)設(shè)計(jì)。
處理原始IQ 數(shù)據(jù)的膨脹卷積網(wǎng)絡(luò)為殘差結(jié)構(gòu)(Dilated convolution-residual network,DCRN),膨脹卷積(Dilated Convolutional,DC)又稱為空洞卷積[9],膨脹卷積與普通的卷積核相比有特定的膨脹系數(shù)可以設(shè)置,通過(guò)設(shè)置相應(yīng)的膨脹系數(shù)使得卷積核在不增加計(jì)算量的情況下具有更大的感受野,同時(shí)當(dāng)設(shè)置不同的膨脹系數(shù)時(shí)可以獲取到不同尺度的特征信息,殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)(DCRN)分支如圖2所示,該網(wǎng)絡(luò)由三個(gè)殘差塊構(gòu)成,殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)整體結(jié)構(gòu)由圖2 的右邊所示,網(wǎng)絡(luò)具體細(xì)節(jié)部分由圖2的左邊殘差塊所示。
圖2 殘差膨脹卷積網(wǎng)絡(luò)模型Fig.2 Dilated convolution-residual network model
當(dāng)原始IQ數(shù)據(jù)輸入到膨脹卷積網(wǎng)絡(luò)分支后,網(wǎng)絡(luò)主要通過(guò)卷積操作對(duì)原始IQ數(shù)據(jù)進(jìn)行特征提取,與之前的卷積不同,本文使用膨脹卷積進(jìn)行特征提取,膨脹卷積旨在根據(jù)設(shè)置的膨脹系數(shù)在卷積核內(nèi)部相鄰值之間以固定的步長(zhǎng)填充0,通過(guò)在內(nèi)部填充0 的方式擴(kuò)大卷積核的尺寸,并增加原始卷積核內(nèi)部相鄰值之間的距離,使擴(kuò)張后卷積核在執(zhí)行卷積操作時(shí)的覆蓋范圍更廣,同時(shí)由于填充使用的是0 填充也不會(huì)額外增加計(jì)算量,以此擴(kuò)大卷積核的感受野,獲得更大尺度的信息,使得最終的輸出特征信息能夠更廣泛代表輸入信息,具有更強(qiáng)的泛化性,當(dāng)在卷積核間引入的膨脹系數(shù)為1時(shí),此時(shí)為標(biāo)準(zhǔn)的卷積操作;與此同時(shí),在不同的膨脹卷積層之間引入殘差結(jié)構(gòu),如圖2左半部分所示,圖中表示了在引入膨脹卷積特性的同時(shí)加入了殘差的結(jié)構(gòu),通過(guò)引入殘差的結(jié)構(gòu),使得膨脹卷積網(wǎng)絡(luò)分支處理輸入信息更加流暢,并且還可以緩解分支網(wǎng)絡(luò)的過(guò)擬合問(wèn)題。
另一個(gè)CNN2 分支主要是卷積神經(jīng)網(wǎng)絡(luò)(CNN)與長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的串聯(lián),其結(jié)構(gòu)如圖3 所示,卷積部分通過(guò)不同卷積核來(lái)實(shí)現(xiàn)對(duì)輸入矩陣的特征進(jìn)行提取,通過(guò)不同卷積層的特征提取,所提取到的特征也逐步抽象;LSTM 能夠提取在時(shí)間維度上的特征信息,將其串聯(lián)在卷積層之后能夠?qū)矸e層提取到的特征信息進(jìn)一步完善和補(bǔ)充,本文在卷積網(wǎng)絡(luò)之后串聯(lián)LSTM 網(wǎng)絡(luò)構(gòu)成CNNLSTM 分支網(wǎng)絡(luò)結(jié)構(gòu),以更加充分地提取幅度和相位中的特征信息。
圖3 CNN2分支網(wǎng)絡(luò)模型Fig.3 CNN2 branch network model
本文所設(shè)計(jì)的網(wǎng)絡(luò)中,一個(gè)是殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)(DCRN)分支,另一個(gè)是CNN-LSTM 分支,采用并聯(lián)結(jié)構(gòu)組合;單一的分支網(wǎng)絡(luò)只能提取某個(gè)單一維度輸入數(shù)據(jù)的特征信息,本文采用的并聯(lián)結(jié)構(gòu)能夠同時(shí)處理兩種模態(tài)的輸入信息。
數(shù)據(jù)預(yù)處理模塊輸出的瞬時(shí)幅度相位矩陣,其大小為2 × 128,另一個(gè)原始的IQ 數(shù)據(jù)矩陣大小同樣為2 × 128,兩種不同的特征矩陣分別輸入到兩個(gè)分支中,由兩個(gè)網(wǎng)絡(luò)分支分別對(duì)兩種不同模態(tài)特征信息的矩陣進(jìn)行特征提取。
普通單分支網(wǎng)絡(luò)結(jié)構(gòu)的CNN、LSTM 或者CNN串聯(lián)LSTM 只能對(duì)原始的IQ 輸入數(shù)據(jù)或者幅度相位信息中的一種進(jìn)行特征提取,由于單一維度的數(shù)據(jù)所蘊(yùn)含的信息有限,經(jīng)過(guò)網(wǎng)絡(luò)提取后的特征不夠充分,造成分類結(jié)果的準(zhǔn)確率下降;本文研究的雙流卷積結(jié)構(gòu)不僅能夠從原始的IQ 數(shù)據(jù)中提取相關(guān)特征信息,還能夠從原始數(shù)據(jù)的幅度相位信息中提取信息,兩種不同的原始信息分別從各自的網(wǎng)絡(luò)分支中被提取相應(yīng)的特征信息,經(jīng)過(guò)兩個(gè)不同的網(wǎng)絡(luò)分支特征提取之后得到兩種不同的高維特征信息,這兩種高維度的特征信息相互作用,共同決定最終的信號(hào)分類結(jié)果。
雙流結(jié)構(gòu)的網(wǎng)絡(luò)輸出兩個(gè)不同的特征信息,其中一個(gè)特征信息源自原始IQ數(shù)據(jù),另一個(gè)特征信息源自信號(hào)的瞬時(shí)幅度相位信息。
本文研究了一種特征融合方式,傳統(tǒng)的融合方式比如直接使兩個(gè)特征向量在對(duì)應(yīng)位置相乘或者相加進(jìn)行特征融合,這樣的方法只在兩個(gè)特征向量中相同的元素位置上作用,而不同位置的特征向量值無(wú)法得到充分地融合,造成兩個(gè)特征向量并沒(méi)有充分交互融合,對(duì)于分類的結(jié)果沒(méi)有充分提高。
本文使用的特征融合方式是將兩個(gè)網(wǎng)絡(luò)分支輸出的兩個(gè)特征向量進(jìn)行矩陣相乘[10],如圖4 所示,不單單是相同位置的元素相乘,通過(guò)矩陣相乘可以使每個(gè)元素都與另一個(gè)向量中的所有元素進(jìn)行相乘,生成融合后的特征矩陣,以此來(lái)達(dá)到兩個(gè)特征向量更加充分地交互融合;其公式可以表示為:
其中F代表融合后的特征向量,fA代表DCRN 分支的輸出特征向量代表DCRN 分支的輸出特征向量的轉(zhuǎn)置,其大小為50 × 1,fB代表CNN2 分支的輸出特征向量,其大小為1 × 50,兩個(gè)向量進(jìn)行矩陣相乘,在矩陣相乘過(guò)程中,不同位置的特征向量元素都能夠進(jìn)行相乘的操作,與傳統(tǒng)融合方法只能相同位置元素相乘操作相比,矩陣相乘能夠使兩個(gè)特征向量不同位置元素之間都能夠進(jìn)行充分地交互融合;矩陣相乘之后的特征向量為F,其大小為50 ×50,然后再將特征向量F進(jìn)行展平操作,輸入到全連接層中。
本文設(shè)計(jì)的全連接層由三層構(gòu)成,每一層都包含不同數(shù)量的神經(jīng)元,同時(shí)在每個(gè)神經(jīng)元后面搭配相應(yīng)的激活函數(shù),以實(shí)現(xiàn)非線性的分類,全連接層的最后一層神經(jīng)元數(shù)目即為分類個(gè)數(shù),搭配Softmax激活函數(shù)輸出每個(gè)類別的概率即最終的分類結(jié)果,整個(gè)全連接層起到一個(gè)分類器的作用,對(duì)融合后的特征進(jìn)行具體分類,識(shí)別出當(dāng)前為何種調(diào)制方式,從而達(dá)到調(diào)試方式識(shí)別的目的。
本實(shí)驗(yàn)仿真數(shù)據(jù)采用開(kāi)源RML2016.10a 作為輸入數(shù)據(jù),該數(shù)據(jù)集共有220000 條數(shù)據(jù),總共具有11種調(diào)制方式,8種數(shù)字調(diào)制,分別為:8PSK,BPSK,CPFSK,GFSK,PAM4,16QAM,64QAM,QPSK;3 種模擬調(diào)制,分別是:AM-DSB,AM-SSB,WBFM;采樣率為200 kHz,數(shù)據(jù)中包含加性高斯白噪聲、選擇性衰落、中心頻率偏移和采樣率偏移四種信道環(huán)境,同時(shí)還有一定的頻偏,具體參數(shù)如表1所示。
表1 數(shù)據(jù)集參數(shù)Tab.1 Parameters of dataset
該數(shù)據(jù)集的數(shù)據(jù)格式為IQ 兩路數(shù)據(jù),大小為2 × 128 矩陣,信噪比范圍為-20~18 dB,步長(zhǎng)為2 dB,由于過(guò)低信噪比數(shù)據(jù)中噪聲過(guò)大,所蘊(yùn)含的信號(hào)特征較少,故本實(shí)驗(yàn)選用-4~18 dB 信噪比的數(shù)據(jù)作為數(shù)據(jù)集。
將數(shù)據(jù)集中80%數(shù)據(jù)用作訓(xùn)練集,20%數(shù)據(jù)作為測(cè)試集,所使用的環(huán)境為python3.7,Tensor-flow2.1,硬件設(shè)備為Nvidia GTX 1050 GPU。
殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)(DCRN)分支主要用來(lái)提取原始IQ 數(shù)據(jù)中的特征,其利用卷積核的膨脹卷積特性和殘差網(wǎng)絡(luò)結(jié)構(gòu)處理IQ 數(shù)據(jù),如圖2所示,殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)(DCRN)分支主要由三個(gè)殘差塊構(gòu)成,每個(gè)殘差塊由兩個(gè)膨脹卷積層和一個(gè)殘差連接層構(gòu)成,采用Relu 激活函數(shù),每個(gè)殘差塊中卷積層的卷積核個(gè)數(shù)分別為32、32 和16,卷積核大小為1 × 3、3 × 3 和1 × 3,膨脹系數(shù)分別為1,2,4,對(duì)三個(gè)殘差塊卷積之后的輸出特征進(jìn)行展平并通過(guò)一層單元數(shù)為50 的全連接層,其輸出即為殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)提取出的特征信息。
網(wǎng)絡(luò)的第二個(gè)分支CNN2 是CNN-LSTM 分支,處理瞬時(shí)相位幅度信息的卷積神經(jīng)網(wǎng)絡(luò)由三個(gè)卷積層、兩個(gè)LSTM 層構(gòu)成,三個(gè)卷積層的卷積核個(gè)數(shù)分別為128、128 和80,其大小分別為1 × 3、2 × 3 和1 × 3,在卷積層之間加入的有正則化層,不僅加快網(wǎng)絡(luò)的收斂速度,還能夠在一定程度上緩解過(guò)擬合的問(wèn)題,在卷積過(guò)程中均采用Relu 激活函數(shù);兩個(gè)LSTM層的單元個(gè)數(shù)分別為100和50。
兩個(gè)網(wǎng)絡(luò)分支的輸出特征經(jīng)過(guò)特征融合模塊之后得到融合后的特征向量,將該特征向量傳輸?shù)饺B接層進(jìn)行分類處理,全連接層由三層構(gòu)成,第一層的單元個(gè)數(shù)為256,第二層單元個(gè)數(shù)為64,前兩層所使用的激活函數(shù)為Relu,第三層單元個(gè)數(shù)與分類信號(hào)類別數(shù)一致,即輸出層有11 個(gè)輸出單元,采用Softmax激活函數(shù)輸出最終的分類結(jié)果;整個(gè)全連接層中使用Dropout 隨機(jī)失活函數(shù),以防止全連接層過(guò)擬合。
在本節(jié)實(shí)驗(yàn)中,Batch_size 設(shè)置為500,迭代次數(shù)設(shè)置為35;將本文設(shè)計(jì)的殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)并聯(lián)CNN-LSTM 網(wǎng)絡(luò)模型與一層的卷積神經(jīng)網(wǎng)絡(luò)(1-CNN)模型、三層卷積神經(jīng)網(wǎng)絡(luò)(3-CNN)模型、注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)模型(attention-CNN)模型、雙層長(zhǎng)短期記憶神經(jīng)(2-LSTM)模型進(jìn)行對(duì)比仿真實(shí)驗(yàn),如圖5所示,可以看出本文所研究的基于多維度特征端到端卷積神經(jīng)網(wǎng)絡(luò)并聯(lián)結(jié)構(gòu)由于不僅利用原始信號(hào)的IQ兩路數(shù)據(jù),還利用原始數(shù)據(jù)中所蘊(yùn)含的幅度相位信息共同進(jìn)行信號(hào)的特征提取,并對(duì)兩種提取到的特征信息進(jìn)行充分地交互融合,進(jìn)而再通過(guò)全連接層進(jìn)行分類處理,所以在識(shí)別準(zhǔn)確率上明顯高于其他幾種模型;選取本文模型之外分類效果最好的注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)模型(attention-CNN)模型繪制其混淆矩陣,attention-CNN 模型在信號(hào)分類實(shí)驗(yàn)中的混淆矩陣如圖6 所示;仿真實(shí)驗(yàn)表明,attention-CNN模型的最高的分類識(shí)別率可達(dá)78%,通過(guò)高信噪比的混淆矩陣可以看出,attention-CNN 模型對(duì)于16QAM 和64QAM 兩種信號(hào)幾乎沒(méi)有識(shí)別能力。
圖5 不同模型識(shí)別準(zhǔn)確率對(duì)比圖Fig.5 Accuracy rate of different models
圖6 注意力機(jī)制CNN模型混淆矩陣Fig.6 Confusion matrix of attention-CNN
為驗(yàn)證本文所設(shè)計(jì)的雙流膨脹殘差卷積結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的有效性,將膨脹殘差卷積分支(DCRN)和CNN-LSTM 分支分別單獨(dú)作為網(wǎng)絡(luò)模型,設(shè)置與雙流卷積網(wǎng)絡(luò)模型相同參數(shù)并在同一數(shù)據(jù)集RML2016.10a 中訓(xùn)練,觀察其在驗(yàn)證集中表現(xiàn),對(duì)比結(jié)果如圖7所示,可以看出高信噪比時(shí)CNN-LSTM分支模型識(shí)別準(zhǔn)確率高于DCRN 分支模型,其識(shí)別準(zhǔn)確率最高達(dá)到77%,各分支模型以及原始網(wǎng)絡(luò)模型的識(shí)別準(zhǔn)確率具體數(shù)值如表2 所示;但是單獨(dú)的DCRN 或者CNN-LSTM 分支模型其識(shí)別準(zhǔn)確率均低于雙流膨脹殘差卷積結(jié)構(gòu)網(wǎng)絡(luò)模型,由此可以看出本文所設(shè)計(jì)的雙流膨脹殘差卷積結(jié)構(gòu)的有效性。
表2 實(shí)驗(yàn)數(shù)據(jù)對(duì)比Tab.2 Comparison of experimental data
圖7 總模型與分支模型準(zhǔn)確率對(duì)比Fig.7 Models accuracy comparison
本文所設(shè)計(jì)的基于多維度特征端到端卷積神經(jīng)網(wǎng)絡(luò)并聯(lián)結(jié)構(gòu)在信號(hào)分類實(shí)驗(yàn)中的表現(xiàn)如圖8混淆矩陣所示;通過(guò)實(shí)驗(yàn)結(jié)果可以看出,基于多維度特征端到端的卷積神經(jīng)網(wǎng)絡(luò)并聯(lián)網(wǎng)絡(luò)最高準(zhǔn)確率可達(dá)85.9%;根據(jù)高信噪比下的混淆矩陣可以看出,對(duì)于16QAM 和64QAM 兩種信號(hào)本文設(shè)計(jì)的網(wǎng)絡(luò)模型具有一定的分辨能力。
圖8 本文模型混淆矩陣Fig.8 Confusion matrix of our model
針對(duì)單分支網(wǎng)絡(luò)結(jié)構(gòu)的提取信號(hào)特征不足導(dǎo)致信號(hào)分類準(zhǔn)確度較低的情況,本文充分利用卷積神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)以及殘差結(jié)構(gòu)設(shè)計(jì)了一種端到端的雙流卷積網(wǎng)絡(luò)模型,在網(wǎng)絡(luò)內(nèi)部?jī)?nèi)嵌數(shù)據(jù)預(yù)處理模塊提取數(shù)據(jù)中的瞬時(shí)幅度和相位信息,之后是網(wǎng)絡(luò)的兩個(gè)分支殘差結(jié)構(gòu)的膨脹卷積網(wǎng)絡(luò)和CNN-LSTM 網(wǎng)絡(luò),兩個(gè)網(wǎng)絡(luò)為并聯(lián)結(jié)構(gòu),分別提取到特征之后將兩種特征進(jìn)行充分地交互融合形成最終的特征,再根據(jù)全連接層輸出該特征所代表的信號(hào)類型;實(shí)驗(yàn)表明本文所設(shè)計(jì)的雙流卷積網(wǎng)絡(luò)模型相比較于傳統(tǒng)結(jié)構(gòu)CNN 模型在信號(hào)識(shí)別準(zhǔn)確率上有很大的提升,對(duì)于難以識(shí)別的16QAM和64QAM 兩種類型的信號(hào)有一定的識(shí)別能力,但對(duì)于16QAM 和64QAM 兩種信號(hào)識(shí)別能力較弱,不夠精準(zhǔn),對(duì)于AM-DSB 信號(hào)和WBFM 信號(hào)不能夠很好的識(shí)別,提高模型對(duì)于以上四種信號(hào)的分類能力還有待進(jìn)一步研究。