段可欣,閆文君,劉 凱,王藝卉,3,李春雷
(1.海軍航空大學(xué),山東 煙臺 264001;2.91422部隊,山東 萊陽 265200;3.31401部隊,山東 煙臺 264001;4.92038部隊,山東 青島 266109)
隨著現(xiàn)代軍事裝備技術(shù)的發(fā)展,大量新體制輻射源的出現(xiàn)使戰(zhàn)場電磁環(huán)境變得日益復(fù)雜。新型技術(shù)體制的雷達(dá)不斷裝備戰(zhàn)場,電子對抗環(huán)境日趨復(fù)雜與密集。信號參數(shù)不斷變化對雷達(dá)輻射源信號分選識別提出了更高的要求。輻射源個體識別(Specific Emitter Identification,SEI)對于雷達(dá)對抗信息處理和雷達(dá)對抗偵察系統(tǒng)都具有重要意義,其不僅能使雷達(dá)對抗、偵察、干擾等效能得到充分發(fā)揮,更重要的是,它還能由輻射源的性能、工作狀態(tài)等輻射源個體信息,分析得到關(guān)于輻射源載體的屬性、工作狀態(tài)和威脅等級等初始判斷信息。
在雷達(dá)輻射源識別領(lǐng)域,基于傳統(tǒng)特征的個體識別方法對于目前復(fù)雜的電磁環(huán)境適用性較差,尤其當(dāng)待識別信號數(shù)量少、提取累積特征困難時,識別能力有限。因此,不斷有專家學(xué)者提出新的特征提取方法。高階譜分析在分析信號特征時具有獨特的優(yōu)勢,與時間無關(guān)的特殊性使高階譜分析能夠提取信號的非高斯性特征和非線性特征。除此之外,還具有相位保持性和尺度不變性等優(yōu)良特性。信號雙譜分析[1-2]作為高階譜應(yīng)用中最廣泛的1 種方法,在信號處理中備受關(guān)注。
孟祥豪等提出用雙譜的對角線積分作為特征,對復(fù)合調(diào)制LPI 雷達(dá)信號進(jìn)行識別的方法,降低了計算量,但對信噪比有一定要求[3];張彥龍等融合了雙譜理論、奇異值分解和信息熵理論對不同調(diào)制類型的雷達(dá)輻射源信號用模糊C均值算法進(jìn)行聚類分析,但為降低計算量,僅對第一象限區(qū)域進(jìn)行取樣分析,整體特征獲取不夠全面[4];王世強(qiáng)等提出利用Bhattacharyya距離結(jié)合SVM對信號雙譜進(jìn)行分析處理的分類識別辦法,對雙譜特征加以優(yōu)化,算法結(jié)果較穩(wěn)定,但是該方法提取輻射源個體信息不夠充足[5];曹儒等先向量化信號雙譜的幅度,再利用層次極限學(xué)習(xí)機(jī)以圖像處理的辦法學(xué)習(xí)4 類有意調(diào)制類型的特征,進(jìn)而達(dá)到識別目的[6];為降低雙譜計算量,陳培博等提出取第一象限的雙譜幅度特征和相位特征,再使用對抗網(wǎng)絡(luò)對所提取的特征進(jìn)行識別[7-8];丁力達(dá)等采用卷積神經(jīng)網(wǎng)絡(luò)對二維壓縮后的雙譜特征進(jìn)行學(xué)習(xí),但圖像特征維數(shù)過高,聚集性不夠強(qiáng)[9]。綜上所述,在輻射源個體識別中,對所提取的雙譜特征挖掘不夠全面充分,導(dǎo)致輻射源識別效果受限。
本文通過對輻射源信號的雙譜進(jìn)行分析,根據(jù)香農(nóng)信息熵的概念定義雙譜奇異值全局熵和雙譜對角線的幅度分散熵。首先,將雙譜矩陣進(jìn)行奇異值分解,依據(jù)奇異值的分布規(guī)律提取雙譜的奇異值全局熵;然后,以雙譜對角線的幅值分散程度定義幅值分散熵;最后,聯(lián)合雙譜對角線及對角積分一起組成特征向量。該方法的特色之處在于在信號分析中融入了熵理論,它可以充分挖掘接收到的輻射源信號雙譜特征在分布上的特征,豐富了輻射源識別指紋特征,提高識別率。
雙譜分析可對信號幅度和相位的保持性顯現(xiàn)出信號的非線性特性。雙譜的概念如下所述[10]。
假定高階累積量ckx(τ1,τ2,…,τk-1)是絕對可和的,即:
則k 階譜定義為k 階累積量的k-1 階散Fourier變換,即:
那么,雙譜即三階譜可定義為:
可以求出接收機(jī)接收到的離散含相噪信號為:
式(4)中:w( n )是高斯噪聲信號;s( n )是發(fā)射機(jī)輸出的含有非高斯噪聲的信號,且w( n )和s( n )相互獨立。對x( n )求三階累積量,則有:
式(5)中,E()· 表示求期望。將式(5)展開,然后合并得到:
所以,只要信號和噪聲的均值為0,就有:
若w(n)是高斯有色噪聲,則c3ω(τ1,τ2)可以忽略不計??梢娦盘柕碾p譜可以消除高斯有色噪聲對信號的影響,其雙譜由c3s(τ1,τ2)確定,即:
由上述分析可知,雙譜分析可濾除高斯噪聲的影響,從而最大化保留輻射源信號個體特征。本文仿真了來自3幅射源信號的雙譜,如圖1所示。
圖1 不同輻射源雙譜圖Fig.1 Bispectrum of different radiation sources
由圖1 可以看出,不同輻射源信號雙譜的幅值和分布存在不同。
輻射源個體識別的實時性對輻射源個體特征計算量有一定的要求。如果將信號的雙譜全部納入個體識別中,計算量較大。因此,引入降維的方法,通過對雙譜進(jìn)行積分,可以將二維雙譜轉(zhuǎn)變成一維特征函數(shù),但積分雙譜仍有以下缺點:
1)積分雙譜是沿雙譜某一路徑上的積分,但雙譜具有對稱性,存在一些點位上的信息重復(fù)和冗余,這些雙譜點對于提取雷達(dá)輻射源個體特征的貢獻(xiàn)不大;
2)由于所接收的原始雷達(dá)輻射源信號中有可能存在交叉項,經(jīng)過高階譜多次相關(guān)函數(shù)計算和雙譜積分后,交叉項將更加嚴(yán)重。
為了克服上述缺點,考慮雙譜具有對稱性和周期性的特點,選擇合適的積分路徑既能最大化保留雙譜特征,也能有效避免交叉項惡化。在比較現(xiàn)有積分雙譜特征的基礎(chǔ)上,本文使用對角積分雙譜[11]。選用雙譜次對角線,避免插值的同時,包含了豐富的雷達(dá)輻射源信號幅度和相位信息,雙譜對角線積分表達(dá)式如下:
對3 個輻射源雙譜分別取對角切片,如圖2 所示??梢钥闯觯煌椛湓吹碾p譜對角線在幅值和分布規(guī)律上有明顯不同。
圖2 不同輻射源雙譜對角線切片F(xiàn)ig.2 Diagonal slices of bispectrum from different radiation sources
熵最初提出是為了表示熱力學(xué)中熱狀態(tài)的不平衡程度。香農(nóng)為描述信息量的大小,提出“信息熵”的概念。熵的值對照信息系統(tǒng)的有序程度:值越大,信息系統(tǒng)的信息量越小,信息系統(tǒng)越無序;反之,值越小,系統(tǒng)內(nèi)信息量越大,信息系統(tǒng)越有序。信息熵定義為[12]:設(shè)Pi表示集合中事件i()i=1,2,…,n 出現(xiàn)的概率,則各事件概率矢量的集合為P=(P1,P2,…,Pn),且滿足0 ≤Pi≤1 和=1 。 由此,信息熵H(P1,P2,…,Pn)的值為:
由于雷達(dá)信號是有用信號疊加了隨機(jī)噪聲,不同的雷達(dá)攜帶了一定程度的指紋特征,信號雙譜的能量集中情況和分布復(fù)雜程度也因各信號時頻分布存在不同而不同[13]。因此,為刻畫雷達(dá)輻射源信號的雙譜能量在全局的分布情況,引入雙譜奇異值全局熵的概念,對雙譜運用奇異值分解[14],提取雙譜矩陣的全局主要信息得到奇異值向量()σ1,σ2,…,σk。奇異值可以理解為“主特征值”,且有從大到小的排列順序。奇異值包含了矩陣的重要特征信息,且奇異值的大小還代表了該奇異值對原始矩陣的重要程度,有權(quán)重的含義在里面。1個矩陣可以表示成k 個秩為1,值為奇異值的小矩陣的“和”。k 的值決定了保留奇異值向量的個數(shù),既能保留大部分特征,又能減少計算量。由此引入奇異值的全局熵[15]概念;每個奇異值在整個奇異值向量中占的比重為Qi=,則奇異值的全局熵Eσ為:
雙譜奇異值全局熵包含被分析信號雙譜矩陣的代數(shù)特性和分布特征。
由圖2 可看出,雙譜對角線具有非常標(biāo)準(zhǔn)的對稱性,但每個輻射源雙譜對角線上的峰值和谷值的位置、大小各不相同。就本文而言,由于實驗中使用的是同廠家、同型號的發(fā)射機(jī),采用的是相同的調(diào)制方式,同一臺接收機(jī),在同樣的實驗條件下采集的數(shù)據(jù),在對收集的數(shù)據(jù)進(jìn)行雙譜分析取得的對角線特征中的不同,就是要提取的輻射源指紋特征。
根據(jù)對角線幅值分布情況,先對整條對角線均分成n 段,對每段取幅值均值ai,雙譜對角線可用1個幅值向量()a1,a2,…,an來表示,各幅值均值占幅值積分的比例記為Ai=,則雙譜對角線的幅度分散熵為:
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)[17-18]中1 個非常重要的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[15],多用于圖像,音、視頻等信息的處理。由于具有強(qiáng)大的前向反饋功能,CNN能夠自動學(xué)習(xí)并提取數(shù)據(jù)中的特征,進(jìn)而利用所獲取的特征信息進(jìn)行識別。CNN 主要包括卷積層、池化層、全連接層。卷積層目的是提取輸入數(shù)據(jù)的特征,并在迭代過程中提取越來越復(fù)雜的特征;池化層是對卷積層提取到的特征進(jìn)行亞采樣處理,以減少網(wǎng)絡(luò)中參數(shù)個數(shù),避免過擬合,提高神經(jīng)網(wǎng)絡(luò)識別的魯棒性;全連接層是把CNN學(xué)到的特征映射到樣本空間,完成最終的識別任務(wù)。
CNN利用卷積核作為“特征過濾器”,使用不同的卷積核以提取不同的特征。卷積層數(shù)和卷積核的個數(shù)決定提取特征的數(shù)量和復(fù)雜度,這也正是網(wǎng)絡(luò)設(shè)計需要平衡的網(wǎng)絡(luò)結(jié)構(gòu)的寬度和深度。更進(jìn)一步,在同一個CNN結(jié)構(gòu)中,迭代次數(shù)和訓(xùn)練的批樣本數(shù)量都會影響神經(jīng)網(wǎng)絡(luò)的識別率。這些參數(shù)都需要不斷調(diào)整尋優(yōu)實驗獲取,以期用最少的計算量得到最佳結(jié)果。本文中,設(shè)計的CNN模型使用2層網(wǎng)絡(luò)層用于一維特征向量的數(shù)據(jù)分析,CNN模型如圖3所示。
圖3 CNN網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 Network structure diagram of CNN
卷積核大小設(shè)為3×1。卷積層1(Conv1)由32個長度為3 的一維卷積核構(gòu)成,卷積運算后做最大池化;卷積層2(Conv2)由64 個長度為3 的一維卷積核作卷積運算,并做最大池化。全連接1(Dense1)有1 024 個結(jié)點,全連接2(Dense2,softmax 輸出)有3 個結(jié)點,輸出的3個節(jié)點代表3個不同的輻射源。
本文實驗平臺為Windows 10,雙譜算法平臺為MATLAB R2018b。深度學(xué)習(xí)模型架構(gòu)為Tensor-Flow,其中環(huán)境為Python3.7。本文采用基于GNU Radio 和USRP 的SDR 平臺模擬輻射源,用ADS-B 數(shù)據(jù)流盤軟件和USRP的組合模擬信號收集器。實驗過程中,搭建由裝有GNU Radio 軟件的計算機(jī)和3 臺USRP-B210組成的SDR平臺作為信號發(fā)射裝置,由裝有ADS-B 數(shù)據(jù)流盤軟件的計算機(jī)和1 臺USRP-B210 作為信號接收裝置,信號采集過程如圖4所示。
圖4 輻射源信號采集系統(tǒng)實物圖Fig.4 Physical diagram of radiation source signal acquisition system
在GNU Radio的GUI界面中,將發(fā)射信號的參數(shù)設(shè)置如下:信號的調(diào)制方式為16QAM,載波頻率為1.09 GHz,帶寬為2 MHz,發(fā)射增益為50,USRP 采樣率為2 MHz,通道選擇TX/RX 2 ∶0。在ADS-B數(shù)據(jù)流盤軟件操作界面配置B210 設(shè)備信息,工作頻率設(shè)為20 MHz,采樣頻率2 MHz,通道選擇RX 2 ∶0,接收增益為60。在發(fā)射機(jī)流圖與接收機(jī)裝置均連接好之后,進(jìn)行真實環(huán)境下的數(shù)據(jù)收集,實驗場景如圖4所示。
運行GNU Radio 的GRC 流圖,ADS-B 數(shù)據(jù)流盤軟件的DATA文件開始存儲接收到的.usrp文件,即原始數(shù)據(jù)集。相同環(huán)境下,用同一接收機(jī)接收一段噪聲信號,計算這段信號幅度的平均值M 和標(biāo)準(zhǔn)差S。由于這段信號僅包含噪聲信號,令平均值M 作為噪聲強(qiáng)度,即信號強(qiáng)度。假設(shè)信號和噪聲的功率比為K ,方差為標(biāo)準(zhǔn)差的平方,即M=,根據(jù)信噪比定義可知,SNR=20 lg 10()2,計算得出該環(huán)境下信噪比估計值為22.87 dB(取到小數(shù)點后2位)。接下來的實驗均在此信噪比條件下進(jìn)行。
用同一套接收裝置分別接收發(fā)射端使用3臺不同USRP-B210發(fā)射的信號,保證3臺USRP-B210設(shè)備調(diào)成一樣的參數(shù),接收來自3 臺不同發(fā)射機(jī)的.usrp 數(shù)據(jù)。將收集到的.usrp數(shù)據(jù)先轉(zhuǎn)換成.mat數(shù)據(jù),然后對.mat 數(shù)據(jù)進(jìn)行雙譜分析,得到3 個輻射源的雙譜對角線如圖5所示。
有效運用“四種形態(tài)”。緊扣“六大紀(jì)律”等規(guī)定,堅持正確執(zhí)紀(jì)導(dǎo)向,把握運用好“四種形態(tài)”。計提醒談話56人,黨紀(jì)輕處分3人,力求挺紀(jì)于前、防早防小、治病救人。
圖5 不同輻射源的雙譜對角線統(tǒng)計圖Fig.5 Bispectral diagonal statistics of different radiation sources
在雙譜分析的基礎(chǔ)上,求信號雙譜奇異值全局熵,對角線積分和對角線幅度分散熵。雙譜對角線取值個數(shù)設(shè)為300,由此得到長度為303 的特征向量,3個輻射源分別收集2 235、1 291、2 212條樣本,共得到5 738條長度為303的數(shù)據(jù)組成的數(shù)據(jù)集,訓(xùn)練集和測試集的劃分比為3 ∶1,將它們送入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試。
為降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度,提高模型的泛化能力,本文使用由2個卷積層構(gòu)成的CNN。采用3×1 的卷積核對輻射源信號進(jìn)行特征采集,2 個卷積層中卷積核的數(shù)目依次為32、64。為保留信號有效特征,池化層采用3×1 的池化核。最后,使用全連接層進(jìn)行特征組合及特征分類。為了避免模型產(chǎn)生過擬合,本文在CNN 的全連接層后加入dropout 正則項,在訓(xùn)練過程中隨機(jī)使一些神經(jīng)元失活,進(jìn)而濾除部分噪聲點。
由于不同參數(shù)對網(wǎng)絡(luò)性能影響較大,本文在對網(wǎng)絡(luò)進(jìn)行訓(xùn)練時,采取可變參數(shù)策略對網(wǎng)絡(luò)性能進(jìn)行優(yōu)化。所選取的參數(shù)主要有迭代次數(shù)(epoch),批樣本數(shù)量(batchsize),衡量網(wǎng)絡(luò)性能的指標(biāo)選取為識別率和訓(xùn)練時的損失函數(shù)。
對于神經(jīng)網(wǎng)絡(luò)而言,在模型訓(xùn)練的過程中,1次訓(xùn)練所選取的樣本數(shù)稱為批樣本數(shù)量,它的大小影響模型的優(yōu)化程度和速度,適當(dāng)批樣本數(shù)量使得梯度下降方向更加準(zhǔn)確。運行模型對全部數(shù)據(jù)完成1次前向傳播和反向傳播的完整過程叫做1 個單次迭代訓(xùn)練,合適的迭代次數(shù)能保證在不會過擬合的條件下得到比較優(yōu)秀的訓(xùn)練效果。
圖6、7分別為不同的迭代次數(shù)與批樣本數(shù)量對網(wǎng)絡(luò)性能影響的對比情況。從圖6 可以看出,神經(jīng)網(wǎng)絡(luò)迭代后期,損失函數(shù)變化很小。
圖6 不同迭代次數(shù)的識別率和損失函數(shù)Fig.6 Recognization accuracy and loss function of different iterations
為防止過擬合,在接下來的實驗中,迭代次數(shù)設(shè)置為1 個較大的數(shù)字100,同時使用回調(diào)函數(shù)callback中的EarlyStopping。在訓(xùn)練過程中,每訓(xùn)練一段時間,觀察一下模型在數(shù)據(jù)上的表現(xiàn),并在數(shù)據(jù)表現(xiàn)沒有明顯提升時自動終止迭代,輸出準(zhǔn)確率和損失函數(shù)的值,如圖7所示。
圖7 不同批樣本數(shù)量的識別率和損失值Fig.7 Recognization accuracy and loss values of different batch sample sizes
由圖7 a)可以看出,隨著批樣本數(shù)量從32增加到64時,識別率隨迭代次數(shù)增大而升高。當(dāng)?shù)螖?shù)大于25時,識別率達(dá)到了95%以上。但當(dāng)批樣本數(shù)量增加到128 和256 時,準(zhǔn)確率逐漸下降。這是因為過大的批樣本數(shù)量會使模型梯度下降加快,過早進(jìn)入收斂狀態(tài),訓(xùn)練完數(shù)據(jù)集所需的次數(shù)減少,使訓(xùn)練時間增加,參數(shù)修正較慢,導(dǎo)致準(zhǔn)確率下降。同時,由圖7 b)可以看出,批樣本數(shù)量為64 時,損失值也是最低。因此,對本文的模型來說,最佳的批樣本數(shù)量應(yīng)選64。
為客觀比較本文算法的性能,選用單獨使用雙譜對角線作為識別特征和使用SVM作為分類器進(jìn)行識別和對比。得到如圖8所示混淆矩陣。圖8 a)表示使用本文方法測試的結(jié)果;圖8 b)表示單獨使用雙譜對角線作為特征測試的結(jié)果;圖8 c)表示使用SVM測試的結(jié)果。
圖8 本文方法與其他識別方法的對比結(jié)果Fig.8 Comparison results of this method with other recognition methods
由圖8 可知,本文方法比單獨使用雙譜對角線所提取的特征信息有一定增強(qiáng),神經(jīng)網(wǎng)絡(luò)的特征提取能力也優(yōu)于SVM,準(zhǔn)確率更高。
對3 種方案的算法復(fù)雜度進(jìn)行比較,將空間復(fù)雜度和時間復(fù)雜度作為算法復(fù)雜度的衡量指標(biāo)??臻g復(fù)雜度指網(wǎng)絡(luò)中卷積核的系數(shù),時間復(fù)雜度從迭代耗時和平均識別時間方面進(jìn)行考慮。3類模型使用樣本數(shù)量均為5 738,訓(xùn)練測試比為3 ∶1。
SVM方法的識別率相比另外2種方法較低,且算法原理中不涉及算法復(fù)雜度中包括的2種時間統(tǒng)計內(nèi)容。表1給出了本文方法與雙譜對角線法的算法復(fù)雜度比較。其中,M 為判別網(wǎng)絡(luò)的卷積核系數(shù),迭代時間為模型訓(xùn)練迭代30次的時間,平均識別時間為模型在測試集上的預(yù)測時間。由表1 可知,本文方法和雙譜對角線法在空間復(fù)雜度相同的條件下,迭代耗時相差不大但平均識別時間要短19%,說明使用本文方法提取的特征對于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練更有效,對測試集的識別效果也更好。
表1 算法復(fù)雜度分析Tab.1 Algorithm complexity analysis
對訓(xùn)練集和驗證集在網(wǎng)絡(luò)中的識別率分析,得到結(jié)果如圖9所示。Train1、Validation1分別表示本文方法的訓(xùn)練集和驗證集;Train2、Validation2 分別表示雙譜對角線方法的訓(xùn)練集和驗證集。由圖9 可知,本文方法相比雙譜對角線方法識別率更高,且隨著迭代次數(shù)增多,本文方法條件下訓(xùn)練集和驗證集的正確率數(shù)值差距也逐漸減小,相比雙譜對角線方法識別效果也更穩(wěn)定。
圖9 不同訓(xùn)練集和驗證集的識別率對比Fig.9 Comparison of recognition accuracy between different training sets and validation sets
綜上所述,利用信號的雙譜及其在雙譜基礎(chǔ)上提取的二次特征組成的特征組合,在神經(jīng)網(wǎng)絡(luò)的加成下對同類型雷達(dá)輻射源的識別有較高的準(zhǔn)確率且實時性較好。
本文在信號雙譜分析的基礎(chǔ)上取對角線作為識別特征,并通過對角線上的雙譜信息求雙譜對角線幅度分散熵和對雙譜矩陣取奇異值全局熵,進(jìn)一步擴(kuò)充了輻射源個體的識別特征。這樣既減少了計算量,又通過二次特征進(jìn)一步豐富了雙譜特征信息量,提高了輻射源個體識別率。因此,利用雙譜包含的豐富輻射源個體特征信息配合熵理論對于不確定度的刻畫、對于輻射源個體的識別都有一定的工程意義。