吳子龍, 陳 紅, 雷迎科
(國防科技大學(xué)電子對抗學(xué)院, 安徽 合肥 230037)
深度學(xué)習(xí)網(wǎng)絡(luò)模型的可視化分析有利于掌握網(wǎng)絡(luò)模型的分類識別依據(jù),有利于掌握網(wǎng)絡(luò)模型分類識別的可靠性,也有利于改進網(wǎng)絡(luò)模型[1-2]。在通信協(xié)議標準未知的條件下,利用改進DenseNet[3-4]對短波電臺的建鏈行為信號進行識別,方法思路雖然較為新穎,但是網(wǎng)絡(luò)是否提取到同一類別行為信號的統(tǒng)一特征以及是否提取到不同類別行為信號之間的特征差異,這關(guān)系到網(wǎng)絡(luò)模型在識別建鏈行為時的可靠性。通過對改進DenseNet的可視化操作可以增大網(wǎng)絡(luò)模型識別性能的說服力,也有助于未知通信協(xié)議下的電臺建鏈行為信號本質(zhì)區(qū)別的機理研究。
短波電臺的建鏈行為指一方電臺開始通信時需要進行的通聯(lián)行為。最新的第三代短波通信電臺的自動建鏈行為主要分為:呼叫行為,握手行為,通知行為,時間校準行為,組時間廣播行為,廣播行為以及掃描呼叫行為[5]。一般情況下,需要在通信協(xié)議已知的條件下,通過協(xié)議幀識別的方法來推測電臺信號所表達的具體的建鏈行為[6]。但是,改進DenseNet則是在通信協(xié)議未知的條件下,通過信號的特征學(xué)習(xí)來完成對短波電臺建鏈行為的識別,可以有效避免信號的解跳、解調(diào)、解密等困難的問題。利用DenseNet的特征重復(fù)利用的優(yōu)勢,并且讓網(wǎng)絡(luò)模型適應(yīng)一維信號作為輸入,以此使得網(wǎng)絡(luò)模型應(yīng)用時較為有效和簡便。
當前在深度學(xué)習(xí)領(lǐng)域,網(wǎng)絡(luò)模型的可解釋性和可視化研究大多集中在卷積神經(jīng)網(wǎng)絡(luò)的可解釋性分析領(lǐng)域[7-8]。文獻[9]利用反卷積可視化理解卷積神經(jīng)網(wǎng)絡(luò)。文獻[10]中的導(dǎo)向反向傳播也是對網(wǎng)絡(luò)模型的輸入進行求導(dǎo),將輸入和梯度均大于零對應(yīng)的梯度傳遞回去。文獻[11]利用最后一層卷積層包含的豐富的空間和語義信息,將全連接層替換為全局池化層,求得每張?zhí)卣鲌D對應(yīng)的類別權(quán)重,然后通過特征加權(quán)的方法求出最后一層卷積層對應(yīng)的熱力圖。另外,基于可解釋模塊的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法中間層有明確的語義信息,但是只有少數(shù)關(guān)于這方面的研究,如文獻[12-13]所示。文獻[14]重點討論了卷積神經(jīng)網(wǎng)絡(luò)及其表示的可視化,并對基于模型可解釋性的中端學(xué)習(xí)進行了分析。關(guān)于傳統(tǒng)的機器學(xué)習(xí)的可解釋性分析,文獻[15]通過干擾原始樣本的特征信息,繼而探究對分類識別結(jié)果影響較大的特征信息,以達到可解釋性分析的目的。文獻[16]引入了Deep k-Nearest Neighbors,根據(jù)樣本點之間的差距,將測試輸入與其鄰近的訓(xùn)練點進行比較,并展示了這些相鄰點的標簽,提高了訓(xùn)練集之外的數(shù)據(jù)輸入時的可信度。
本文工作的重點在于解釋改進DenseNet在識別電臺不同建鏈行為信號的可靠性。首先根據(jù)第三代短波通信協(xié)議標準MIL-STD-188-141B仿真電臺的7種不同自動建鏈行為信號,利用改進的DenseNet進行訓(xùn)練學(xué)習(xí),完成對電臺行為的識別。但是網(wǎng)絡(luò)模型是否學(xué)習(xí)到建鏈行為信號的深層次特征,網(wǎng)絡(luò)模型的分類識別依據(jù)是否可靠是值得探討的問題。基于卷積層的可解釋性分析方法在改進DenseNet網(wǎng)絡(luò)中難以應(yīng)用,主要原因是卷積層的每個特征圖的維度較大,對于維度較大的一維線性特征圖難以通過直接可視化的圖像觀測出異同,而且一維的信號并不像圖像一樣可以通過視覺直接感受到原始特征,本文也通過實驗來說明基于卷積層的可解性分析的效果并不理想。因此本文主要通過可視化網(wǎng)絡(luò)模型的全連接層及其激活熱力圖來探究改進DenseNet是否對建鏈行為信號進行了有效可靠的學(xué)習(xí)訓(xùn)練。網(wǎng)絡(luò)模型可視化的實驗結(jié)果表明,改進DenseNet可以提取建鏈行為信號的深層次特征的異同,進一步說明在通信協(xié)議未知的條件下,利用深度學(xué)習(xí)去探究電臺的建鏈行為的思路是可行有效的。
短波電臺的自動建鏈行為是電臺要開始通信時的一個通聯(lián)行為。通過仿真7種建鏈行為信號,利用深度學(xué)習(xí)的方法進行分類識別,避免了電臺通信協(xié)議未知的限制,這對電子對抗領(lǐng)域的通信電臺對抗提供了新思路。短波電臺的自動建鏈行為分為7種建鏈行為,其功能如表1所示。
表1 7種建鏈行為及其功能
深度學(xué)習(xí)在信號分類識別應(yīng)用時,往往需要對信號進行特征域變換預(yù)處理,如頻域變換、時頻域變換、小波變換以及高階譜變換等等[17-21]。變換的目的是將信號的特征人為地進一步凸顯,但是短波電臺的不同建鏈行為信號屬于同一種突發(fā)波形,其編碼方式和調(diào)制方式幾乎相同,因此特征變換不會有良好的效果。所以,本文直接將物理層的一維建鏈行為信號作為DenseNet的輸入,并且在網(wǎng)絡(luò)中利用兩條支路來增強網(wǎng)絡(luò)的識別性能。其中一個支路的輸入后,信號的前半部分置零的主要原因是:不同建鏈行為信號之間的差異主要為突發(fā)波形后半部分攜帶不同有效比特的差異,不同行為對應(yīng)的信號后半部分會有較大差異。而突發(fā)波形前半部分主要為建鏈行為的數(shù)據(jù)幀頭,這代表著這個突發(fā)波形用于傳輸建鏈行為,因此7種建鏈行為信號的前半部分極為相似,所以信號前半部分作置零處理。改進的DenseNet結(jié)構(gòu)如圖1所示。圖1中的一維dense塊的內(nèi)部結(jié)構(gòu)如表2所示。
表2 一維dense塊的內(nèi)部結(jié)構(gòu)
圖1 改進DenseNet的結(jié)構(gòu)
深度學(xué)習(xí)網(wǎng)絡(luò)模型可以提取同一類別建鏈行為信號的深層次統(tǒng)一特征,并且可以提取不同類別建鏈行為信號的特征差異。由圖1可知,網(wǎng)絡(luò)模型的輸入信號維度較大為(5 888,1),而且可以看出網(wǎng)絡(luò)中間層的特征維度依然較大。那么,對卷積層提取的信號特征進行可視化分析的方法得到的可視化圖像,根據(jù)圖像很難發(fā)現(xiàn)提取信號的特征的異同之處,所以文獻[10]中的Grad-CAM方法在應(yīng)用時效果一般。因此,結(jié)合改進DenseNet的結(jié)構(gòu)特點,從其全連接層著手解釋網(wǎng)路模型。本文利用全連接層維度較小且處于卷積模塊和分類器模塊中間的位置特點,通過實驗探索網(wǎng)絡(luò)的可靠性。
YⅠ=H(XⅠ)
(1)
(2)
YⅡ=H(XⅡ)
(3)
(4)
全連接層輸出的深層次特征對最終識別結(jié)果的影響需要借助全連接的熱力圖進行解釋,可以進一步掌握網(wǎng)絡(luò)模型的分類依據(jù)。Softmax分類器中神經(jīng)元對應(yīng)的最大值代表著網(wǎng)絡(luò)最終的輸出類別。輸出類別Ⅰ表示為ZⅠ,類別Ⅱ表示為ZⅡ,那么全連接層到輸出類別的權(quán)重矩陣表示為
(5)
(6)
(7)
(8)
同一類別行為信號的權(quán)重矩陣所呈現(xiàn)的熱力圖應(yīng)該類似,即WⅠ和W′Ⅰ類似,WⅡ和W′Ⅱ類似。不同類別行為信號的權(quán)重矩陣應(yīng)該有較大差異,即WⅠ和WⅡ,WⅠ和W′Ⅱ有著較大差異。
結(jié)合全連接層輸出和全連接層熱力激活圖的可視化可以很好地解釋網(wǎng)絡(luò)模型是否學(xué)習(xí)到電臺的建鏈行為信號的深層次特征,可以判斷網(wǎng)絡(luò)模型的分類識別是否具有可靠性。
仿真得到總共14 000個建鏈行為信號樣本,隨機收取部分樣本作為訓(xùn)練集,剩下的部分作為測試集。網(wǎng)絡(luò)模型訓(xùn)練時,學(xué)習(xí)率設(shè)為0.01,批次處理大小設(shè)為8。隨著訓(xùn)練樣本數(shù)目的增加,當信噪比(signal to noise ratio,SNR)分別為-5 dB、 0 dB、 5 dB時,在迭代次數(shù)為15次網(wǎng)絡(luò)性能穩(wěn)定后,在測試集上的識別準確率如表3~表5所示。
表3 網(wǎng)絡(luò)識別性能(SNR=-5 dB)
表4 網(wǎng)絡(luò)識別性能(SNR=0 dB)
表5 網(wǎng)絡(luò)識別性能(SNR=5 dB)
根據(jù)表3~表5可知,隨著訓(xùn)練樣本數(shù)目的增加,網(wǎng)絡(luò)的識別性能有明顯的提升。當SNR為-5 dB,訓(xùn)練樣本數(shù)目從1 400增加到12 600時,網(wǎng)絡(luò)的識別準確率從56.34%增加到73.38%;當SNR為0 dB,訓(xùn)練樣本數(shù)目從1 400增加到12 600時,網(wǎng)絡(luò)的識別準確率從84.46%增加到99.14%;當SNR為5 dB,訓(xùn)練樣本數(shù)目從1 400增加到12 600時,網(wǎng)絡(luò)的識別準確率從99.58%增加到99.99%。根據(jù)實驗結(jié)果也可以看出在SNR大于0 dB時,訓(xùn)練樣本數(shù)目不少于1 400個,網(wǎng)絡(luò)模型的識別準確率可以達到90%以上,此時網(wǎng)絡(luò)模型可以有效地識別短波電臺不同的建鏈行為。
雖然在經(jīng)過訓(xùn)練后,改進后DenseNet能夠有效地對短波電臺建鏈行為信號進行有效地識別,但是網(wǎng)絡(luò)內(nèi)部的識別機理需要進一步探索。改進網(wǎng)絡(luò)的可視化分析既能說明網(wǎng)絡(luò)是否真正有效地學(xué)習(xí)到短波電臺建鏈行為信號的深度特征,也有利于理解不同的建鏈行為信號的本質(zhì)區(qū)別。在通信協(xié)議未知的情況下,掌握網(wǎng)絡(luò)的識別依據(jù),也進一步為網(wǎng)路模型識別的可靠性提供支撐。
改進的DenseNet網(wǎng)絡(luò)結(jié)構(gòu)主要有3部分構(gòu)成:卷積部分,全連接層部分和分類器。對于卷積層部分的網(wǎng)絡(luò)可解釋性,由于一維的建鏈行為信號較為冗長,并不像圖像樣本可以通過Grad-CAM算法清晰地找出網(wǎng)絡(luò)對樣本的關(guān)注區(qū)域。而且改進的DenseNet卷積部分最后一層的維度大小為(2 944, 32),利用Grad-CAM算法得到的激活熱力圖由于維度較大,難以作為可靠的依據(jù)。SNR為0 dB的數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)后,Grad-CAM得到的熱力圖如圖2所示。
圖2 改進的DenseNet的最后一層卷積層的激活熱力圖
由圖2可知,改進DenseNet的關(guān)注重點會聚集在一維信號的后半部分特征,這后半部分特征對網(wǎng)絡(luò)最后有效識別不同的建鏈行為起著重要作用,這也是本文利用兩條支路來提高網(wǎng)絡(luò)提取信號特征能力的重要原因。但是由于提取的特征維度較大,難以觀察出網(wǎng)絡(luò)能否有效地找到同一類信號樣本的共性,進一步找到不同類別信號樣本之間的區(qū)別。因此,需要針對改進DenseNet的全連接層進一步探究,全連接層的神經(jīng)元個數(shù)為256,數(shù)目相對較少,有利于推斷DenseNet是否找到識別不同建鏈行為信號的依據(jù)。全連接層在改進DenseNet中的位置如圖1所示。其中全連接層內(nèi)部包括全連接層,批次正規(guī)化層,激活層。
實驗時,首先導(dǎo)入訓(xùn)練好的網(wǎng)絡(luò)模型,然后輸入電臺的建鏈行為信號樣本,輸出網(wǎng)絡(luò)全連接部分,以探究同一類建鏈行為信號是否有相同或類似的輸出,據(jù)此可判斷網(wǎng)絡(luò)是否學(xué)習(xí)到每種行為信號的深層次特征。
在SNR分別為-5 dB、 0 dB、 5 dB條件下進行實驗,建鏈行為類別為呼叫的信號樣本作為輸入,得到全連接層的輸出。根據(jù)不同SNR下改進DenseNet的識別性能,首先分析具有一定代表性的SNR=0 dB條件下網(wǎng)絡(luò)可視化的結(jié)果,其全連接輸出如圖3所示。
由圖3可知,呼叫行為信號的全連接層輸出有較大的相似性。圖3(a)~圖3(d)中圖像的尾部都有一個小的“山峰”;在橫軸為150左右時,4個樣本的輸出圖像都有一個明顯的“低谷”區(qū)域;在橫軸為40左右時,4個樣本的輸出圖像都有一段類似“山峰”的曲線。這些共同點都說明,在信噪比SNR=0 dB條件下,改進DenseNet能夠提取出同一類別不同樣本的共同特征。
為了進一步探討改進DenseNet是否可以有效學(xué)習(xí)到通過不同信號質(zhì)量的建鏈行為信號的內(nèi)部統(tǒng)一特征,又在SNR分別為-5 dB、 5 dB條件下進行實驗,全連接層的輸出結(jié)果如圖4和圖5所示。
圖3 呼叫行為對應(yīng)的全連接層輸出(SNR=0 dB)
根據(jù)圖4和圖5可知,在SNR分別為-5 dB、 5 dB對應(yīng)的全連接層有統(tǒng)一類似的輸出特征,表明改進DenseNet可以有效學(xué)習(xí)不同SNR的行為信號的深層次統(tǒng)一特征。
綜合比較圖3~圖5可知,隨著SNR的提高,網(wǎng)絡(luò)模型全連接層的輸出越趨向于統(tǒng)一。比如,在SNR為-5 dB時圖4(a)~圖4(d)的統(tǒng)一相似度和在在SNR為5 dB時圖5(a)~圖5(d)的統(tǒng)一相似度,前者要低于后者,這與改進DenseNet對信噪比更高的建鏈行為信號有更好的識別性能相一致。
圖4 呼叫行為對應(yīng)的全連接層輸出(SNR=-5 dB)
圖5 呼叫行為對應(yīng)的全連接層輸出(SNR=5 dB)
不同類別的樣本的全連接層輸出是否有一定的區(qū)別,這對檢驗改進后網(wǎng)絡(luò)是否提取到不同類別樣本的本質(zhì)區(qū)別,檢驗改進網(wǎng)絡(luò)對電臺的建鏈行為識別是否有合理的依據(jù)以及研究網(wǎng)絡(luò)的識別機理有較大的意義。
利用SNR為-5 dB、 0 dB、 5 dB的建鏈行為信號數(shù)據(jù)分別進行實驗。但考慮本節(jié)實驗探究的重點在于探究改進DenseNet是否可以提取不同類別行為信號的深層次特征區(qū)別,而不側(cè)重探究提取特征的優(yōu)良情況,同時根據(jù)第4.1節(jié)的實驗結(jié)果,先選取SNR=0 dB的實驗結(jié)果進行詳細地展示和分析。除第4.1節(jié)探討的呼叫行為之外,短波電臺的握手行為,通知行為,時間校準行為,組時間廣播行為,廣播行為,掃描呼叫行為對應(yīng)的全連接層輸出如圖6所示。
圖6 不同建鏈行為對應(yīng)的全連接層輸出(SNR=0 dB)
由圖6可知,不同的建鏈行為對應(yīng)的全連接層輸出有著明顯區(qū)別,而相同的建鏈行為對應(yīng)的全連接層輸出有著較大的相似性。這不僅僅是對第4.1節(jié)中實驗結(jié)果的肯定,也進一步說明了改進后的網(wǎng)絡(luò)模型可以提取到不同類別樣本信號的本質(zhì)特征,并且網(wǎng)絡(luò)能據(jù)此正確識別電臺不同類別的建鏈行為。
為了說明不同SNR條件下,改進DenseNet是否能夠?qū)W習(xí)到不同建鏈行為信號的特征差異,是否符合SNR越高提取的特征差異應(yīng)該越大的實際情況。下面給出在-5 dB和5 dB條件下,握手行為對應(yīng)的全連接層輸出,如圖7和圖8所示。
根據(jù)圖3~圖8中不同SNR下呼叫行為和握手行為對應(yīng)的全連接輸出可知,隨著SNR的增加,不同類別行為對應(yīng)的全連接層輸出差異越大,這表明改進DenseNet對質(zhì)量越好的行為信號數(shù)據(jù)更能有效地提取不同類別的深層次特征差異,進一步說明改進DenseNet的識別可靠性。
圖7 不同建鏈行為對應(yīng)的全連接層輸出(SNR=-5 dB)
圖8 不同建鏈行為對應(yīng)的全連接層輸出(SNR=5 dB)
不同的建鏈行為信號的全連接層輸出圖像有著明顯區(qū)別,但是這些區(qū)別是否作為網(wǎng)絡(luò)識別的具體依據(jù)需要進一步探究分類器輸出節(jié)點與全連接層之間的隱藏關(guān)系,這種關(guān)系主要通過層與層之間的權(quán)值矩陣來實現(xiàn)。利用Grad-CAM算法的思想,選擇softmax值最大值的節(jié)點(對應(yīng)置信度最高的類別)反向傳播,對全連接層求梯度,此梯度作為全連接層對分類器輸出節(jié)點的影響權(quán)重。選取具有代表性的SNR為0 dB的數(shù)據(jù)信號進行實驗。如果能夠通過實驗表明,SNR為0 dB條件下,分類器的輸出節(jié)點確實與全連接層有著密切的隱藏關(guān)系,那么在SNR為-5 dB或5 dB條件下仍然有著密切關(guān)系,只不過會類比第4.1節(jié)和第4.2節(jié)的實驗結(jié)論,SNR越高這種關(guān)系會越明顯。短波電臺的不同建鏈行為信號的全連接層熱力圖,如圖9所示。
圖9 不同建鏈行為對應(yīng)全連接層的熱力圖(SNR=0 dB)
由圖9可知,同一類別的建鏈行為信號對應(yīng)全連接層的熱力圖較相似,不同類別的建鏈行為信號對應(yīng)全連接層的熱力圖差距較大。實驗結(jié)果表明,同一類別行為信號的全連接層對最后輸出類別有關(guān)鍵貢獻作用的區(qū)域片段較為接近,不同類別行為信號的全連接層對最后輸出類別有影響的區(qū)域片段明顯不同。
綜合第4.1節(jié)~第4.3節(jié)中的實驗結(jié)果可知,改進DenseNet可以有效地學(xué)習(xí)到同一種建鏈行為信號的本質(zhì)特征,不同建鏈行為信號的深層次特征區(qū)別以及中間層特征對行為類別判決的關(guān)鍵性貢獻區(qū)域。實驗結(jié)果證明了網(wǎng)絡(luò)的可靠性和有效性,同時也說明了在通信協(xié)議標準未知的條件下,通過深度學(xué)習(xí)的方法直接分析物理層信號以達到識別電臺不同行為信號的思路是可行且有效的。
在電子對抗領(lǐng)域,掌握短波電臺的建鏈行為類別,可以進一步掌握電臺的通聯(lián)意圖,對掌握電臺的戰(zhàn)術(shù)地位有重要作用。傳統(tǒng)的電臺的建鏈行為研究,往往需要借助通信協(xié)議標準的技術(shù)支持,這在電子對抗領(lǐng)域是極其困難的。因此,本文利用改進DenseNet直接學(xué)習(xí)電臺的建鏈行為信號的深層次特征,達到有效識別電臺不同建鏈行為的目的。并通過網(wǎng)絡(luò)模型的可視化分析實驗,表明改進的網(wǎng)絡(luò)模型可以有效提取電臺建鏈行為信號的深層次特征上的異同,也進一步說明了網(wǎng)絡(luò)模型在短波通信電臺建鏈行為識別應(yīng)用時的可靠性。