彭 闖,王倫文,胡煒林
(國防科技大學電子對抗學院,安徽合肥 230037)
隨著電磁設備以及通信技術的發(fā)展,電磁頻譜資源變得愈加寶貴. 在民用領域,移動通信、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、廣播電視、鐵路乃至于氣象播報都依賴頻譜實現(xiàn)[1]. 在信息化軍隊的建設背景下,未來信息化作戰(zhàn)將有大量的先進軍事裝備編入現(xiàn)役,各裝備都裝載有多個用頻設備,對頻譜資源的管理提出了新的要求. 認知無線電技術被認為是提高頻譜利用率和緩解頻譜稀缺的一種有效方法[2],但大規(guī)模的頻譜管理易受到攻擊及干擾,因此對頻譜異常檢測的研究是當前認知無線電領域的熱點.
頻譜異常檢測是認知無線電以及頻譜監(jiān)測領域的重要組成部分,能夠實現(xiàn)對惡意干擾、用戶沖突以及非法占用等異常狀態(tài)的檢測,對保障航空運輸安全、提升通信質量有重要作用. 同時,電磁頻譜異常檢測及研究對無線電設備管理以及電磁環(huán)境態(tài)勢評估具有重要意義. 為實現(xiàn)電磁頻譜異常檢測,學者們已經(jīng)取得一定成果. 傳統(tǒng)的電磁頻譜異常檢測算法多是利用信號統(tǒng)計特征進行數(shù)據(jù)分析實現(xiàn)的. 文獻[3]提出了基于二維交叉的異常檢測方法. 文獻[4]改進了奇異譜分析方法,構建了一個滑動窗口在線異常檢測器. 文獻[5]通過對時間序列分析實現(xiàn)對無線電頻譜異常的檢測,該方法無需歷史數(shù)據(jù)支持,即可識別典型頻譜異常類型. 此外,文獻[6]結合信息熵改進聚類算法實現(xiàn)異常檢測.上述基于信號分析的異常檢測算法雖然效果不錯,但都存在無法處理高維數(shù)據(jù)、對首次出現(xiàn)的異常信號不夠靈敏等問題. 隨著人工智能行業(yè)的不斷發(fā)展,深度學習展示出了強大的數(shù)據(jù)分析能力,學者們使用深度學習在異常檢測領域也已經(jīng)取得了一定成果. 文獻[7,8]使用監(jiān)督學習的方法實現(xiàn)了頻譜異常檢測,但該類方法僅能識別確定類別的異常. 在實際的頻譜數(shù)據(jù)中,異常數(shù)據(jù)獲取困難,難以支撐標簽化的深度訓練. 因此,利用無監(jiān)督學習的方法,基于頻譜預測的異常檢測技術是當前研究的主要方向. 文獻[9]提出一種基于對抗自編碼器(Adversarial AutoEncoder,AAE)的頻譜預測算法,并基于該預測方法實現(xiàn)了一種異常檢測系統(tǒng)SAIFE. 文獻[10]使用LSTM 網(wǎng)絡對LTE 信號頻譜中的多種異常狀態(tài)進行檢測,并基于遷移學習研究了網(wǎng)絡模型的跨頻段使用問題. 文獻[11]針對衛(wèi)星通信存在的異常頻譜狀態(tài),使用LSTM 實現(xiàn)了多變量異常狀態(tài)以及細微異常狀態(tài)的檢測. 文獻[12]使用卷積神經(jīng)網(wǎng)絡提取深度特征,實現(xiàn)了異常檢測. 文獻[13,14]將En?coder 與GAN 網(wǎng)絡相結合,提出了一種新的異常檢測思路,但該算法相比于常規(guī)模型增加了Encoder 以及鑒別器兩個模塊,網(wǎng)絡復雜度較高. 文獻[15]研究了多傳感器場景下無線通信頻譜異常檢測問題,通過深度學習將數(shù)據(jù)轉移到高維特征空間,解決了特定場景下的異常檢測問題. 可以看出,現(xiàn)有算法多是基于循環(huán)神經(jīng)網(wǎng)絡實現(xiàn),這是因為該網(wǎng)絡具有強大的序列處理能力,能夠提取頻譜數(shù)據(jù)間的關聯(lián)性實現(xiàn)頻譜數(shù)據(jù)的預測和生成. 但是頻譜數(shù)據(jù)包含頻點較多、時序較長,而循環(huán)神經(jīng)網(wǎng)絡需要一維序列作為輸入,弱化了數(shù)據(jù)之間的聯(lián)系.
針對上述基于深度學習的頻譜異常檢測算法存在的頻譜數(shù)據(jù)預測精度不高等問題,本文提出一種融合深度特征的電磁頻譜異常檢測方法. 首先構建深度特征提取網(wǎng)絡,該網(wǎng)絡包含一個能夠分級提取深度特征的兩路多層的CNN 以及一個LSTM;其次通過池化、合并等操作提取各級深度特征并進行融合,實現(xiàn)高精度的頻譜數(shù)據(jù)預測;最后,計算預測數(shù)據(jù)與真實數(shù)據(jù)的均方誤差,判別頻譜異常. 本算法能夠在無監(jiān)督學習的條件下實現(xiàn)多種類異常狀態(tài)檢測. 實驗中,通過仿真的方式對公開頻譜數(shù)據(jù)增加異常干擾,在多個頻段對算法性能進行驗證. 結果表明,相比于現(xiàn)有算法,本算法能夠顯著提高電磁頻譜數(shù)據(jù)預測精度,有效地實現(xiàn)電磁頻譜數(shù)據(jù)異常狀態(tài)檢測.
假設數(shù)據(jù)集XS可以認為是一個超集,其包含來自不同頻段的多種信號,XS=XS0∪XS1∪…∪XSn來源于時間序列信號,x?XS為來源于任意無線頻段基于頻率的功率譜密度(Power Spectral Density,PSD)向量. 此外,假設該源數(shù)據(jù)集XS包含的大部分無線電信號都是正常行為,異常行為出現(xiàn)的概率極低.
基于頻譜預測的異常檢測的目標是尋找一種能夠學習源數(shù)據(jù)分布p(XS)的模型,并且該模型能夠檢測目標向量是否偏離數(shù)據(jù)分布. 對于每一個屬于測試數(shù)據(jù)集的向量x?XS,網(wǎng)絡模型應該能夠判斷向量是正常行為H0還是異常Ha. 其中,H0為來源于p(XS)的數(shù)據(jù),Ha為不屬于p(XS)的數(shù)據(jù)[9]. 基于頻譜預測的異常檢測算法整體框架如圖1所示. 其中,m為歷史數(shù)據(jù)時間步長,k為預測數(shù)據(jù)時間步長,n代表頻點數(shù),s為歷史頻譜數(shù)據(jù)組數(shù),紅色模塊代表已完成訓練的預測模型,綠色模塊代表鑒別器,在本文中選用MSE 函數(shù)實現(xiàn)頻譜異常數(shù)據(jù)的鑒別,如式(1)所示,?為預測頻譜數(shù)據(jù)矩陣,P為實際接收頻譜數(shù)據(jù)矩陣.
圖1 基于頻譜預測的異常檢測算法框架
本文基于頻譜預測的異常檢測是基于以下2 個條件實現(xiàn)的:(1)源數(shù)據(jù)集中出現(xiàn)異常的概率非常低,不影響網(wǎng)絡模型的訓練;(2)訓練數(shù)據(jù)以及測試數(shù)據(jù)沒有進行異常標記,數(shù)據(jù)僅能支持模型進行無監(jiān)督學習.
目前的基于深度學習的異常檢測算法多是使用循環(huán)神經(jīng)網(wǎng)絡實現(xiàn),該網(wǎng)絡具有強大的序列處理能力. 但是頻譜數(shù)據(jù)包含頻點較多、時序較長,循環(huán)神經(jīng)網(wǎng)絡需要將頻譜數(shù)據(jù)轉化為列向量,弱化了同頻點之間數(shù)據(jù)的聯(lián)系. 為解決該問題,本文參考Unet[16]以及CNN+LSTM[17]模型構建了一種深度特征提取網(wǎng)絡. 該網(wǎng)絡使用多級雙層CNN 以及LSTM,分層提取深度特征,接著,通過池化、卷積以及合并等操作將提取的多層深度特征進行融合,實現(xiàn)高精度的頻譜數(shù)據(jù)預測,最后通過鑒別器,實現(xiàn)頻譜數(shù)據(jù)的異常檢測.
電磁頻譜的研究很難精確到具體數(shù)值,因此常見的頻譜測量數(shù)據(jù)是連續(xù)的功率譜密度值,其主要機理是根據(jù)功率譜密度的大小判斷該頻段的狀態(tài). 為方便進一步處理、分析,在本文對頻譜數(shù)據(jù)的預處理中,以原始數(shù)據(jù)的最大值為上界、最小值為下界,將頻譜數(shù)據(jù)進行歸一化處理. 數(shù)據(jù)的歸一化處理能夠提升模型精度以及收斂速度,并能夠防止模型出現(xiàn)梯度爆炸問題.
本文研究的異常檢測問題是基于高精度的頻譜預測實現(xiàn)的,由于一個頻段內包含多個信號,在頻譜數(shù)據(jù)上呈現(xiàn)出強弱不同的多個頻帶. 這些頻帶內數(shù)據(jù)較為穩(wěn)定,其可預測性強、預測難度?。活l帶邊緣以及頻帶交接頻點的數(shù)值變化較快,其可預測性弱、預測難度較大. 現(xiàn)有算法已經(jīng)能夠很好地實現(xiàn)強頻帶數(shù)值的計算,但僅使用原有歷史頻譜數(shù)據(jù)很難提升算法在變化數(shù)值預測方面的性能. 現(xiàn)有算法多是基于LSTM 及其改進網(wǎng)絡實現(xiàn)的,而該類網(wǎng)絡很難實現(xiàn)多維數(shù)據(jù)的并聯(lián)輸入,限制了數(shù)據(jù)預處理方式的進步. 因此,本文主要使用卷積層構建網(wǎng)絡,該類網(wǎng)絡能夠允許多維并聯(lián)數(shù)據(jù)的輸入并能夠通過卷積操作不斷提取深度特征,實現(xiàn)對變化數(shù)據(jù)的高效預測,增強異常檢測算法性能.
為提取頻譜數(shù)據(jù)的變化特征,分別從頻域、時域兩個領域去除均值并取絕對值,得到頻域數(shù)值變化特征以及時域變化特征. 假設每個樣本為m個時刻n個頻點的頻譜數(shù)據(jù)Dmn,則其頻域數(shù)值變化特征RFij以及時域數(shù)值變化特征RTij如式(2)~(5)所示:
其中,MTi為時域均值;MFj為頻域均值. 實驗中發(fā)現(xiàn)直接取數(shù)據(jù)與均值的差值會導致預測結果中出現(xiàn)負值,而對差值取絕對值能夠避免這種情況的出現(xiàn),取得更高的預測精度.
為提升網(wǎng)絡的深度特征提取能力,本文決定同時使用CNN 以及LSTM 兩種基礎網(wǎng)絡模型. CNN 是一類包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡,具有強大的表征學習能力. 通過卷積操作,CNN能夠實現(xiàn)數(shù)據(jù)維度的變化,提取的輸入信號的高維特征,相比于原始信號更能捕捉數(shù)據(jù)變化的潛在規(guī)律. 卷積核的尺寸決定了網(wǎng)絡提取特征的維度,卷積核的堆疊可以獲得更為豐富的深度數(shù)據(jù).
基礎卷積操作[18]如式(6)所示,激活函數(shù)使用線性整流(Rectified Linear Unit,ReLU)函數(shù),如式(7)所示:
式(6)中,f表示激活函數(shù);I表示輸入矩陣;K為卷積核矩陣. 式(7)中,x表示輸入. 當x>0 時,ReLU 函數(shù)輸出與輸入為線性關系;當x≤0時,ReLU函數(shù)輸出為0.
LSTM 網(wǎng)絡是一種特殊的循環(huán)神經(jīng)網(wǎng)絡,能夠有效地解決網(wǎng)絡訓練過程中的梯度爆炸問題,尤其對于長序列處理問題,相比于基礎的RNN有明顯的性能優(yōu)勢.LSTM 內包含輸入門、遺忘門以及輸出門3個控制單元,通過門控狀態(tài)來控制傳輸狀態(tài),記住需要長時間記憶的信息,忘記不重要的信息[19]. 單個LSTM模塊如圖2所示,其中紅色是遺忘門,綠色是輸入門,藍色是輸出門.
圖2 單個LSTM模塊示意圖
遺忘門中的遺忘因子ft決定了上一時刻的單元狀態(tài)Ct-1有多少信息保留到當前時刻的單元狀態(tài)Ct;輸入門決定了當前時刻網(wǎng)絡的輸入xt有多少保存到單元狀態(tài)Ct;輸出門決定了Ct有多少信息輸出到LSTM 的當前輸出值ht,如式(8)所示:
其中,Wf,Wi,Wc,Wo均為權重;bf,bi,bc,bo為偏置項;σ,tanh 為網(wǎng)絡的激活函數(shù);? 為暫時單元狀態(tài);Xt為當前的輸入;Ct-1為上一單元的單元狀態(tài);ht-1為上一單元的輸出.LSTM 能夠高效學習數(shù)據(jù)的內在規(guī)律,實現(xiàn)頻譜的預測.
在網(wǎng)絡的訓練過程中,選擇MSE 作為損失函數(shù),與圖1網(wǎng)絡框架中的鑒別器保持一致. 為優(yōu)化CNN 性能,使用Adam 優(yōu)化器代替隨機梯度下降(Stochastic Gradi?ent Descent,SGD)算法來最小化損失函數(shù). 相比于SGD算法,Adam 優(yōu)化算法能夠通過計算梯度的一階矩估計和二階矩估計為不同的參數(shù)設計自適應性學習率. 當網(wǎng)絡訓練結束后,能夠擬合出訓練數(shù)據(jù)中的模型各層權值和偏置,然后利用模型參數(shù)實現(xiàn)測試頻譜數(shù)據(jù)的預測及生成.CNN 以及LSTM 均具有強大的數(shù)據(jù)處理能力,能夠以不同的方式提取數(shù)據(jù)的特征. 因此,本文將兩種模塊組合使用構建深度學習網(wǎng)絡,實驗證明這種網(wǎng)絡比僅使用CNN或LSTM擁有更好的異常檢測性能.
本文同時使用CNN 以及LSTM 兩種基礎模型構成深度網(wǎng)絡,網(wǎng)絡模型整體結構如圖3 所示.CNN 特征提取網(wǎng)絡能夠有效提取頻譜數(shù)據(jù)的高維深度特征. 該網(wǎng)絡主要使用了卷積層、池化層(pooling layer)以及連接層(concatenate layer)作為基礎模塊,網(wǎng)絡共3 層,分為輸入層、并聯(lián)推斷層、融合推斷層.LSTM 特征提取網(wǎng)絡由LSTM 層以及全連接層(dense)構成,由于LSTM 對數(shù)據(jù)輸入的要求與CNN 網(wǎng)絡不同,需要對數(shù)據(jù)形狀進行改變(reshape),才能實現(xiàn)網(wǎng)絡的正常運行以及深度特征的融合.
圖3 網(wǎng)絡模型整體結構圖
圖3 中輸入數(shù)據(jù)為包含頻點數(shù)為n,已知時間長度為m,預測時長為k. 網(wǎng)絡的輸入為實際頻譜數(shù)據(jù),每個樣本為m×n矩陣.CNN 特征提取網(wǎng)絡輸入為經(jīng)過預處理后m×n×3 的三維矩陣. 其中,預處理首先提取量化后數(shù)據(jù)的時域、頻域變化特征;接著,將變化特征與量化頻域數(shù)據(jù)并聯(lián),并將數(shù)據(jù)歸一化.
并聯(lián)推斷層是CNN 特征提取網(wǎng)絡的核心,其結構如圖3 中黑色虛線框內所示. 該層輸入為輸入層輸出的m×n×3 的三維矩陣,輸出為k×n的矩陣,其中k為預測時長. 并聯(lián)推斷層的功能是學習輸入數(shù)據(jù)的多維度特征,并實現(xiàn)頻譜數(shù)據(jù)的預測及生成. 該層內含2 路3 層卷積模塊,相比于僅使用單路的卷積模塊,2 路3 層卷積模塊能夠提取各頻點數(shù)據(jù)間多種深度特征. 卷積層在卷積過程中對輸入邊界填充0,以控制卷積后特征矩陣的大小,即卷積操作后輸出數(shù)據(jù)的矩陣時域、頻域維度不變,實現(xiàn)下一步的融合推斷. 上下支路均使用卷積操作將輸入數(shù)據(jù)通道(channel)數(shù)提升至32 維,提取數(shù)據(jù)高維特征并增強網(wǎng)絡的擬合能力. 上支路與下支路分別提取特征,數(shù)據(jù)經(jīng)卷積操作后維度為m×n×32,為融合上下兩路的不同特征,還需通過池化層以及連接層,實現(xiàn)數(shù)據(jù)的維度變化以及合并. 最后,再次通過卷積操作推斷數(shù)據(jù)內容,并實現(xiàn)通道數(shù)的降低,改變數(shù)據(jù)維度為k×n. 上下兩路特征經(jīng)過池化層、連接層以及卷積層實現(xiàn)該層的特征提取. 在完成本層特征提取后,上下兩支路再次卷積獲取更深層特征. 隨著并聯(lián)推斷層的遞進,網(wǎng)絡能夠不斷提取深度特征,提升模型性能.
融合預測層結構如圖3中紅色虛線框內所示,其輸入為并聯(lián)推斷層各級以及LSTM 層輸出的深度特征,輸出為頻譜預測結果,作用是融合各級深度特征并生成預測數(shù)據(jù). 并聯(lián)推斷層各級輸出結果為k×n,使用連接層對各級輸出進行并聯(lián),則數(shù)據(jù)維度為k×n×4. 添加一個卷積核尺寸為1×1 的卷積層,降低數(shù)據(jù)規(guī)模并對融合結果進行再次選擇. 經(jīng)卷積操作后,輸出即為矩陣維度為k×n的預測頻譜數(shù)據(jù).
通過對網(wǎng)絡結構的分析可知,網(wǎng)絡使用CNN 以及LSTM 分別提取深度特征. 并聯(lián)推斷層中含有兩路多層的卷積模塊,能夠多次提取不同的深度特征. 由于結構上的差異,LSTM 模塊生成的特征不同于并聯(lián)推斷層提取的特征. 本文將并聯(lián)推斷層提取的不同層級的特征與LSTM 提取的特征融合,提升算法的性能. 總的來說,基于本文模型的異常檢測算法可以歸納為以下3個步驟:首先,使用兩路卷積模塊分別提取不同的深度特征并進行組合;接著,將多層CNN 提取的特征與LSTM網(wǎng)絡提取的特征并聯(lián);最后,通過卷積操作選擇特征并降維,實現(xiàn)頻譜數(shù)據(jù)的預測. 比較預測的頻譜數(shù)據(jù)與實際頻譜數(shù)據(jù)的差別,當差別超過預設閾值時,即認為頻譜數(shù)據(jù)中出現(xiàn)異常.
首先,對本次實驗使用的數(shù)據(jù)、仿真異常以及實驗條件進行簡要說明. 頻譜數(shù)據(jù)來源于亞琛工業(yè)大學的開源數(shù)據(jù),研究人員在德國亞琛的兩個監(jiān)測點和荷蘭馬斯特里赫特的一個監(jiān)測點進行了嚴格而全面的頻譜測量. 監(jiān)控頻段范圍為20 MHz 至6 GHz,包括4 個子帶,帶寬為1.5 GHz,頻點分辨率為200 kHz. 在測量中,掃頻間隔為1.8 s,即對于監(jiān)測的每個頻點,監(jiān)測系統(tǒng)每半小時可以獲得1 000 個頻點的功率譜密度值(PSD),連續(xù)監(jiān)測的最長時間跨度約為14 天[20]. 該數(shù)據(jù)包含多個常用頻帶,如GSM900 上行鏈路(Up Link,UL)頻段、GSM900 下行鏈路(Down Link,DL)頻段以及TV 頻段等,如圖4所示.
圖4 各頻段頻譜數(shù)據(jù)圖
在大多的異常檢測研究中很難獲得標準的異常數(shù)據(jù),這是因為異常情況往往是小概率且隨機出現(xiàn)的,這限制了對實驗效果的驗證. 為了解決這個問題,本文選擇人為地在純凈的電磁頻譜數(shù)據(jù)上增加異常. 本文參考文獻[9,13]生成了4 種頻譜異常,分別為單個強信號干擾異常、脈沖干擾異常、變頻信號干擾異常以及頻段阻斷干擾異常. 為了檢測算法的普適性,增加異常態(tài)勢的種類,除以上的4 種干擾異常之外,隨機任選2 種異常情況進行混合,使異常狀態(tài)的種類增加到10 種. 以TV 頻段(614~698 MHz)數(shù)據(jù)為例,仿真頻譜異常如圖5 所示,圖中橫坐標為頻率,縱坐標為頻譜采樣次數(shù). 本次實驗中設計的4 種原始干擾其插入位置、持續(xù)時間等因素都是隨機的,這提升了異常檢測難度. 實際中出現(xiàn)的異常干擾可能持續(xù)時間較短,可以通過減少預測頻譜時間長度的方法提升算法的檢測性能.
需要說明的是,電磁頻譜異常種類很多,本文僅對其中的一部分進行了仿真模擬. 本文算法是基于頻譜預測的異常檢測算法框架實現(xiàn)的,異常的檢測依靠的是實際頻譜與預測頻譜的差別. 因此,理論上不論是何種異常,無論這種異常是否在仿真模擬的異常情況內,只要實際頻譜與預測頻譜差別超過閾值,算法即判別這種頻譜狀態(tài)為異常狀態(tài).
本文構建網(wǎng)絡模型融合深度特征,實現(xiàn)了頻譜數(shù)據(jù)的高效預測,在此基礎上完成了頻譜異常數(shù)據(jù)的檢測. 在多個頻段進行實驗驗證,主要通過以下3 個實驗證明了算法性能的優(yōu)越性. 對比算法包括循環(huán)神經(jīng)網(wǎng)絡(RNN)、長短時記憶網(wǎng)絡(LSTM)[21]、卷積長短時記憶網(wǎng)絡(ConvLSTM)[22]、向量自回歸模型(VAR)、卷積神經(jīng)網(wǎng)絡(CNN)[23]. 其中,VAR 是AR 模型的一種變體,適用于多維數(shù)據(jù)的預測;RNN,LSTM,ConvLSTM 和CNN 均為深度學習中的經(jīng)典模型,并已被證明具有一定的異常檢測性能.
在實驗中,設置RNN,LSTM 和ConvLSTM 這3 種算法隱藏層數(shù)均為128層,CNN含有3個卷積核為32的卷積層. 計算機配置:CPU 為Inter(R)i7-8750H,GPU 為NVIDIA GeForce GTX 1660,使用Python作為編程語言,利用Keras深度學習框架實現(xiàn)各網(wǎng)絡.
4.2.1 在多個頻段研究算法異常檢測性能
由圖3 可知,各頻段數(shù)據(jù)數(shù)值范圍不同、隨時間變化不同,除基本的頻譜數(shù)據(jù)趨勢外還包含大量的周期變化點及雜波. 數(shù)據(jù)的分布會對預測模型的訓練以及頻譜異常的檢出率產(chǎn)生影響,本文旨在提出一種通用的有效的頻譜異常檢測算法,因此需要在多個頻段進行實驗,綜合評估算法性能. 本實驗在GSM900UL,GSM900DL,GSM1800UL 和TV 共4 個頻段對4 種模型進行實驗. 設已知時間步長為m=80,預測時間步長為k=40,包含頻點數(shù)為n=160,固定信號干擾功率比SIR=5 dB,共生成訓練樣本2 000 個,測試樣本1 000個. 其中包含仿真異常數(shù)據(jù)的測試樣本為400個.
由于降低判別門限提升預測精度會帶來虛警率上升的問題,本文主要使用接收者操作特征曲線(Re?ceiver Operating Characteristic Curve,ROC)及ROC 與坐標軸X圍成的面積(Area Under Curve,AUC)2種指標評價算法異常檢測性能. 各頻段異常檢測ROC 曲線如圖6~9所示,AUC如表1所示.
由圖6~9以及表1可知,在進行實驗的4個頻段中,本文提出的基于融合深度特征的異常檢測算法均取得了最優(yōu)性能,說明在本文模型適用于多個頻段,具有一定的通用性. 其中,在GSM1800 UL頻段AUC 面積為1,即可實現(xiàn)在無虛警情況下的異常頻譜的正確檢測. 這是因為該頻段數(shù)據(jù)較為純凈,預測模型精度較高,異常頻譜數(shù)據(jù)更容易檢測. 在TV 頻段各算法差別較小,這是因為該頻段數(shù)據(jù)含多個信號且頻譜數(shù)據(jù)波動性較強,此時預測頻譜與實際頻譜差別相對較大,部分正常頻譜更易被認為是異常頻譜,檢測難度變大,但本文算法依然有最優(yōu)的性能. 在GSM900 DL 頻段,本文算法相比于其他算法具有更大的性能優(yōu)勢,相比于LSTM 模型AUC 面積提升約4.5%. 通過對比可以發(fā)現(xiàn),除GSM900 DL 頻段CNN 網(wǎng)絡性能低于VAR 模型,其他深度學習模型在各頻段的異常檢測性能均優(yōu)于VAR 模型,說明了深度學習模型更適用于本文研究的問題. 此外,LSTM 也表現(xiàn)出了不錯的異常檢測性能,這是因為其擁有強大的數(shù)據(jù)處理能力,這也是選用該模塊構建本文算法的原因.
表1 各頻段異常檢測AUC表
圖6 GSM900UL頻段異常檢測ROC
圖7 GSM900DL頻段異常檢測ROC
圖8 GSM1800 UL頻段異常檢測ROC
為進一步研究算法性能,對模型的計算量進行分析,各模型參數(shù)量如表2所示. 由表2可以看出,在本文研究的5 種深度學習模型中,參數(shù)量最少的是CNN 模型,參數(shù)量最多的是ConvLSTM 模型. 由于本文算法的模型由LSTM及CNN組合而成,因此本文模型參數(shù)量略大于LSTM 模型及CNN 模型參數(shù)量的總和,但遠小于ConvLSTM模型的參數(shù)量.
圖9 TV頻段異常檢測ROC
表2 各模型參數(shù)量
上述對實驗結果的分析體現(xiàn)了本文模型的性能優(yōu)勢,相比于其他基于深度學習的算法模型,本文算法使用多層卷積模塊結合LSTM 模塊,能夠提取不同層次、結構的深度特征,擁有更好的特征提取能力,能夠更為有效地在不同頻段實現(xiàn)頻譜數(shù)據(jù)異常檢測.
4.2.2 不同信干比下的頻譜異常檢測性能
改變干擾異常數(shù)據(jù)的強度,研究不同信干比下的異常檢測性能. 在GSM900DL 頻段、GSM1800DL 頻段和TV 頻段對算法性能進行實驗,實驗中信干比分別取-10 dB,-5 dB,0 dB,5 dB 和10 dB. 本文算法在不同信干比下的ROC 曲線如圖10~12 所示,ROC 曲線對應AUC 如表3 所示. 對比算法為LSTM 網(wǎng)絡,其在不同信干比下的ROC 曲線如圖13~15 所示,ROC 曲線對應AUC如表4所示.
圖10 本文算法GSM900DL頻段異常檢測ROC曲線
圖11 本文算法GSM1800DL頻段異常檢測ROC曲線
圖12 本文算法TV頻段異常檢測ROC曲線
表3 本文算法不同信干比下AUC值
圖13 LSTM網(wǎng)絡GSM900 DL頻段異常檢測ROC曲線
圖14 LSTM網(wǎng)絡GSM1800 DL頻段異常檢測ROC曲線
圖15 LSTM網(wǎng)絡TV頻段異常檢測ROC曲線
表4 LSTM網(wǎng)絡不同信干比下AUC值
對圖10~15以及表3、表4進行分析可知,隨異常數(shù)據(jù)強度增大、即信干比不斷減小,算法異常檢測精度不斷提升. 異常干擾的存在的時間長短、帶寬以及出現(xiàn)的頻點位置都會對算法的異常檢測性能產(chǎn)生影響. 在低信干比的環(huán)境下,異常存在時間長、能量大,異常干擾對頻譜數(shù)據(jù)的改變明顯,檢測難度小. 隨信干比的增大,異常存在的時間變短、能量變弱,部分異常干擾可能會淹沒在強信號頻譜內. 短時間的異常以及窄帶寬的異常干擾使真實頻譜與預測頻譜差別很小,檢測難度較大,這是造成信干比增大時異常檢測性能下降的主要原因. 在GSM1800DL 頻段算法性能受信干比影響較大,相比于LSTM 網(wǎng)絡,本文算法檢測性能更加高效,AUC 提升均高于8%. 當信干比為-10 dB 時,此時干擾強度較大,頻譜異常狀態(tài)分辨難度較小,本文算法的AUC 值均達到了0.95 以上,能夠高效地實現(xiàn)異常狀態(tài)的正確檢測. 當信干比為10 dB時,此時異常信號的能量較小,異常狀態(tài)已經(jīng)很難通過觀察的形式分辨,但在TV 頻段本文算法AUC 仍高于0.75,具有一定的異常檢測性能. 總的來說,相比于LSTM 網(wǎng)絡,本文算法更為高效,性能受信干比強度影響相對較小.
4.2.3 模型參數(shù)對檢測性能的影響
為體現(xiàn)網(wǎng)絡結構的合理性,改變模型參數(shù),探索模型參數(shù)變化對異常檢測算法性能的影響. 在GSM900UL 頻段、GSM900DL 頻段進行實驗,實驗包括6個模型:圖3中的本文算法模型(卷積核尺寸為32,并聯(lián)推斷層包含3 層卷積模塊);更改原模型卷積核尺寸為64的模型;更改原模型卷積核尺寸為16的模型;去除原模型中LSTM 的模型;并聯(lián)推斷層包含4 層卷積模塊的模型;并聯(lián)卷積層包含2 層卷積模塊的模型. 固定信號干擾功率比SIR=5 dB,各模型異常檢測性能的ROC 和AUC如圖16、圖17和表5所示.
表5 各模型異常檢測AUC值
圖16 各模型GSM900UL頻段異常檢測ROC曲線
圖17 各模型GSM900DL頻段異常檢測ROC曲線
本文在仿真異常數(shù)據(jù)以及制作電磁頻譜異常檢測數(shù)據(jù)集的基礎上,通過以上3個實驗分別探究了算法性能. 首先,在多個頻段驗證了本文算法具有一定的通用性;接著,探究了信干比對算法性能的影響;最后,探索了模型參數(shù)對算法性能的影響,證明了本文算法網(wǎng)絡結構的合理性. 實驗結果表明,本文提出的融合深度特征的頻譜異常檢測算法性能良好,異常檢測精度高. 從網(wǎng)絡結構上分析,本文算法提取數(shù)據(jù)的多層深度特征相比于僅使用對比算法能夠獲得更多信息. 此外,本文網(wǎng)絡模型能夠不斷融合各層提取特征并進行選擇,提升了模型性能.
針對電磁頻譜異常檢測精度不高等問題,本文結合卷積神經(jīng)網(wǎng)絡以及長短時記憶神經(jīng)網(wǎng)絡,提出一種融合深度特征的電磁頻譜異常檢測方法. 本文算法本質上是一種基于預測的異常檢測算法,該算法主要分為頻譜預測以及判別檢測兩個部分. 為實現(xiàn)頻譜的高精度預測,首先構建了一個深度特征提取網(wǎng)絡. 該網(wǎng)絡包含一個能夠分級提取深度特征的多級雙層CNN 以及一個LSTM,能夠通過池化、合并等操作將網(wǎng)絡模型提取的各級深度特征進行融合,實現(xiàn)高精度頻譜數(shù)據(jù)預測. 最后,計算預測數(shù)據(jù)與真實數(shù)據(jù)的均方誤差,判別頻譜異常. 在公開頻譜數(shù)據(jù)的多個頻段對算法性能進行驗證,結果表明本文算法能夠有效地實現(xiàn)電磁頻譜數(shù)據(jù)異常檢測.