王紅衛(wèi) 董鵬宇 陳 游 周一鵬 肖冰松
(空軍工程大學(xué)航空工程學(xué)院 西安 710038)
雷達信號識別是電子偵察系統(tǒng)的關(guān)鍵環(huán)節(jié),為后續(xù)的目標(biāo)識別、定位、威脅告警等提供重要的先驗信息[1,2]。當(dāng)接收機接收到信號時,提取雷達信號的脈沖描述字等參數(shù)[3],并通過與先驗知識庫進行比較來判斷輻射源信號樣式以及目標(biāo)類型。然而隨著電子戰(zhàn)環(huán)境的復(fù)雜度越來越高,這些經(jīng)典參數(shù)的識別效果越來越不適應(yīng)環(huán)境的變化,為了適應(yīng)現(xiàn)代新體制雷達輻射源信號識別的需要,脈內(nèi)特征參數(shù)成為研究的熱點,基于信號脈內(nèi)特征的輻射源信號識別自然成為研究的突破口[4]。
雷達信號識別技術(shù)可以分為3類:第1類是基于對系統(tǒng)參數(shù)的匹配分析,隨著電磁環(huán)境越來越復(fù)雜,該方法已經(jīng)無法適應(yīng)作戰(zhàn)需求;第2類是基于人工智能的識別分析,包括專家系統(tǒng)[5]、人工神經(jīng)網(wǎng)絡(luò)[6]和進化算法[7];第3類是脈內(nèi)特征參數(shù)分析,提取的特征諸如能量聚焦效率檢驗[8]、模糊函數(shù)多普勒切片[9]以及時頻特征[10,11],這些新特征的挖掘打破了雷達輻射源信號識別對于5大參數(shù)的依賴。另外,用于解決雷達信號識別問題的分類器主要包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。一些學(xué)者將K-means聚類[12]、K近鄰算法[13]等無監(jiān)督學(xué)習(xí)算法用于雷達輻射源信號識別過程,其操作簡單成本低。但是因為無標(biāo)簽,導(dǎo)致最終識別結(jié)果不理想;還有一些學(xué)者將模板匹配法[14]、支持向量機[15,16]等監(jiān)督學(xué)習(xí)算法用于信號識別過程,得到較好的識別效果,但是其學(xué)習(xí)過程需要大量先驗信息,而現(xiàn)今復(fù)雜電磁環(huán)境下偵察方對復(fù)雜體制雷達信號往往得不到充足的先驗信息,必然在非合作識別中存在缺陷,制約其對復(fù)雜體制雷達信號識別的推廣。對于非合作偵察來說,偵察方能夠得到的往往是少量的標(biāo)記樣本,大量的數(shù)據(jù)都是未標(biāo)記過的。如果只使用少量的標(biāo)記樣本進行訓(xùn)練,一方面使用它們所訓(xùn)練出的學(xué)習(xí)系統(tǒng)往往很難具有強泛化能力;另一方面,大量的未標(biāo)記樣本不被利用也是對數(shù)據(jù)資源的一種浪費。對此,研究人員提出了使用大量未標(biāo)記樣本來改善學(xué)習(xí)性能的半監(jiān)督算法,不僅較好地克服了監(jiān)督學(xué)習(xí)模型泛化能力不強的缺點,也對無監(jiān)督學(xué)習(xí)模型不精確的缺點進行了改善,使其成為機器學(xué)習(xí)領(lǐng)域研究的熱點方向[17]。
考慮到傳統(tǒng)方法在雷達信號非合作識別存在的不足,本文將樸素貝葉斯(Na?ve Bayes, NB)和半監(jiān)督學(xué)習(xí)結(jié)合,提出了改進的半監(jiān)督樸素貝葉斯(Improved Semi-supervised Na?ve Bayes, ISNB)學(xué)習(xí)算法并將其用于非合作雷達信號識別過程。在特征提取方面,考慮到低信噪比下的噪聲導(dǎo)致Choi-Williams時頻分布(Choi-Williams Distribution,CWD)圖像惡化嚴重,使得識別效果不佳,本文基于時頻變換得到一個在識別工作中有優(yōu)勢的特征—能量累積量,并將其定義為輸入特征向量;在分類器設(shè)計方面,利用ISNB算法在無標(biāo)記樣本集生成的置信度列表中選取置信度較高的樣本添加到有類標(biāo)號樣本集中,從而有效避免迭代失誤,進而實現(xiàn)對雷達信號的準確識別。
本文研究的雷達輻射源脈內(nèi)信號包括以下6種:線性調(diào)頻(Linear Frequency Modulated,LFM)、非線性調(diào)頻(Non-Linear Frequency Modulated,NLFM)、正弦調(diào)頻(Sine Frequency Modulated,SFM)、Frank編碼、相移鍵控(Quadrature Phase Shift Keying, QPSK)以及PSK/FSK混合編碼信號。
常用的時頻分析方法有:短時傅里葉變換(Short Time Fourier Transform, STFT), Wigner-Ville分布(Wigner-Ville Distribution, WVD),Choi-Williams分布(CWD)等。其中,CWD克服了STFT和WVD的缺點,不僅有較高的時頻分辨率,還能夠抑制和消除交叉項[18]。所以,本文選取CWD獲得調(diào)制信號的時頻分布圖像。其表達式為
圖1給出了信噪比在10 dB時上述6種信號的CWD 2維圖像。其中,F(xiàn).S.和T.S.分別為頻率序列長度和時間序列長度。
文獻[19]提出了基于CWD和CNN的雷達輻射源信號識別方法,在低信噪比條件下,噪聲對于信號的CWD圖像影響較大,造成了時頻圖像的嚴重失真,因此低信噪比條件下的識別效果較差。圖2給出了信噪比在–5 dB時6種信號的CWD2維時頻圖,從圖2可以清晰地看出,低信噪比條件下信號被噪聲淹沒得很嚴重,如果僅從CWD時頻圖進行信號識別,識別效果定然不理想。
在對高信噪比和低信噪比條件下調(diào)制信號CWD時頻2維圖進行對比分析后,可以看出雖然噪聲對時頻分布有較大的影響,但其大部分時頻能量仍保留。定義時頻分布能量點隨時間序列在每一個頻率點上的累積為能量累積量,定義式為
其中,m為時間序列,n為頻率序列,p為CWD時頻分布時間序列的長度,q為CWD時頻分布頻率序列的長度。
圖3給出了6種信號在信噪比為10 dB條件下的CWD能量累積量圖,從圖3中可以看出,不同調(diào)制模式信號的時頻圖像的能量累積量圖的形狀是不同的,為后續(xù)識別提供了良好的依據(jù)。
圖4給出了6種信號在信噪比為-5 dB條件下的CWD能量累積量圖,從圖4中可以看出,雖然不同調(diào)制模式信號的時頻圖像的能量累積量圖的形狀受到噪聲的污染比較嚴重,但是相比于信號CWD時頻圖像來說,其保留了足夠的峰值和寬度,其形狀的不同足夠使后續(xù)的識別系統(tǒng)識別不同的調(diào)制信號。
圖1 6種調(diào)制信號在信噪比為10 dB時的CWD時頻分布圖
圖2 6種調(diào)制信號在信噪比為–5 dB時的CWD時頻分布圖
復(fù)雜電磁環(huán)境中接收到的雷達信號由于噪聲的影響其CWD圖像會發(fā)生嚴重失真。本文在將特征參數(shù)輸入信號識別網(wǎng)絡(luò)之前,對時頻分布矩陣作如下處理,設(shè)時頻分布矩陣為Ap×q,為了更好地進行降噪處理,將矩陣Ap×q轉(zhuǎn)換為向量α=[α1, α2,···, αp]。其中,αi是矩陣Ap×q的行向量。
對于α,其0均值歸一化由式(3)求得
其中,mean(α)是向量α中所有元素值的均值,var(α)是向量中所有元素值的方差。
圖3 6種調(diào)制信號在信噪比為10 dB時的CWD時頻能量積累圖
圖4 6種調(diào)制信號在信噪比為–5 dB時的CWD時頻能量積累圖
然后對新的向量α*進行如式(4)的操作
由式(3)和式(4)去除噪聲點,顯然,進行1次式(4)的操作只能去除一部分噪聲。為了得到更好的降噪性能,需要重復(fù)式(3)、式(4)至少6次[20]。
然后,將處理后的向量α*轉(zhuǎn)化為矩陣A*p×q。由式(2)求得新的特征向量,經(jīng)過歸一化處理得
圖5展示了對NLFM信號去噪前后的CWD圖像、EC-CWD和EC-CWD振幅直方圖的對比。從CWD圖像可以看出,圖5(c)的大部分噪聲已經(jīng)消除了。另外,圖5(d)—圖5(f)顯示了經(jīng)過降噪預(yù)處理后,EC-CWD保留了脈沖信號的顯著特征,圖5(g)—圖5(i)的振幅直方圖表明了本文降噪方法是可行的。
樸素貝葉斯分類算法的基本思想是根據(jù)貝葉斯定理,首先計算出測試樣本數(shù)據(jù)特征的先驗概率,進而估計出其屬于某一類別的后驗概率,最后預(yù)測出該樣本數(shù)據(jù)的類別[21]。假設(shè)雷達信號特征分布為正態(tài)分布,通過提取訓(xùn)練樣本的特征向量對分類器進行學(xué)習(xí),得到訓(xùn)練后的分類器的參數(shù),即均值向量mi=(mi1, mi2, ···, min)和方差向量σi=(σi1, σi2,···, σin),則根據(jù)正態(tài)分布概率公式有
則NB模型為
半監(jiān)督樸素貝葉斯識別算法綜合了監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩者的優(yōu)點,能夠同時利用少量的有標(biāo)簽樣本數(shù)據(jù)和大量的無標(biāo)簽樣本數(shù)據(jù)來進行識別。設(shè)有標(biāo)簽的數(shù)據(jù)集為l,無標(biāo)簽的數(shù)據(jù)集為u。貝葉斯分類算法根據(jù)有標(biāo)簽的訓(xùn)練集來預(yù)測測試樣本集數(shù)據(jù)的類別,根據(jù)貝葉斯定理有
圖5 NLFM信號降噪前后的CWD, EC-CWD及振幅直方圖
其中,P(Xk/Ci)(l+u)和P(Ci)(l+u)的計算包含了無標(biāo)簽數(shù)據(jù)中的高置信度數(shù)據(jù)集[22,23]。
半監(jiān)督樸素貝葉斯分類算法在對雷達信號進行分類識別時,首先利用少量的有標(biāo)簽的樣本數(shù)據(jù)對分類器進行訓(xùn)練,然后利用訓(xùn)練好的分類對無標(biāo)簽數(shù)據(jù)進行識別,得到無標(biāo)簽數(shù)據(jù)的類標(biāo)簽,將識別到的無標(biāo)簽數(shù)據(jù)的類標(biāo)簽連同原始樣本數(shù)據(jù)一起加入有標(biāo)簽的樣本集中進一步訓(xùn)練分類器,提高對測試集數(shù)據(jù)預(yù)測的準確性。但是其存在一個問題,在對測試集進行預(yù)測的過程中,一旦預(yù)測錯誤,則會導(dǎo)致在迭代的過程中將大量的錯誤類標(biāo)簽的數(shù)據(jù)集添加到有標(biāo)簽的樣本訓(xùn)練集中,從而降低識別的正確率。
針對上述SNB算法存在的問題,本文提出了改進的半監(jiān)督樸素貝葉斯算法(ISNB)。改進的算法沒有將無標(biāo)簽數(shù)據(jù)全部加入到初始樣本中,而是選取其中置信度較高的樣本,這樣極大地提高了訓(xùn)練樣本的正確率。在對后續(xù)測試集進行分類識別時,將會得到更加準確的結(jié)果,再利用預(yù)測后的分類結(jié)果對分類器參數(shù)(即特征期望向量mi和方差向量σi)進行改進,從而提高分類準確率。
對于基本的SNB算法,在式(9)中,需要計算多個概率的連乘,可能會造成結(jié)果的偏差,對乘積取對數(shù),將連乘變成連加。改進后的SNB算法分類器表示為
步驟 3 將Ai中數(shù)值最大的Aimax返回并將其添加到置信度列表Clist中,令|U|=|U|–1,若|U|不為0,則返回步驟1;
步驟 4 將置信度列表中樣本xj根據(jù)Ai的數(shù)值從大到小進行排列,取出前M個Ai所對應(yīng)的樣本,將其添加至有標(biāo)簽數(shù)據(jù)集L中,完成對樣本集的更新。
本文提取雷達信號CWD時頻能量積累量作為特征,利用改進的半監(jiān)督樸素貝葉斯作為分類器,進而完成對輻射源信號的識別。具體流程為:首先對接收到的雷達輻射源信號進行參數(shù)提取和分選預(yù)處理;然后對輻射源信號求取CWD時頻圖像并進行降噪預(yù)處理,提取其能量累積量作為特征參數(shù),選取部分有標(biāo)簽樣本的特征參數(shù)對分類器進行訓(xùn)練;利用初始樣本訓(xùn)練完分類器之后,對沒有標(biāo)簽的數(shù)據(jù)進行特征提取,并利用初始分類器進行分類,每次更新迭代過程中,選取沒有標(biāo)簽樣本中預(yù)測準確度較高的樣本加入訓(xùn)練集,再次對分類器進行訓(xùn)練和修正,直到分類器參數(shù)滿足收斂性條件;最后利用訓(xùn)練好的分類器對接收到的雷達輻射源信號進行分類和識別。
具體識別流程如圖6所示。
仿真采用6種典型的雷達信號進行分類識別,分別為LFM, NLFM, SFM, BPSK, QPSK, PSK/FSK。載頻設(shè)置為10 MHz,采樣頻率設(shè)置為100 MHz,脈寬設(shè)置為10 μs; LFM和NLFM的帶寬設(shè)置為5 MHz,其中LFM信號的調(diào)頻斜率設(shè)為0.5 MHz/μs, NLFM信號采用的多項式為f(t) =Bt/τ + Bt2/τ2; BPSK信號采用的編碼方式為{1, 1,1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1}, QPSK信號采用弗蘭克編碼方式;PSK/FSK信號的跳頻設(shè)置為2 MHz。
圖6 輻射源信號識別流程
將本文提出的CWD能量積累特征作為圖6識別流程的輸入,6種雷達信號時域長度設(shè)為1000,能量累積量的長度為500,每種信號提取500組樣本數(shù)據(jù),在此基礎(chǔ)上完成半監(jiān)督分類器的訓(xùn)練和分類識別。
本文采用Micro-precision標(biāo)準[24]來計算識別率,具體公式為
設(shè)Clist.size為數(shù)據(jù)置信度列表的大小,將M值設(shè)為Clist.size×40%,且分類器參數(shù)收斂條件為α=0.05。對每一種雷達信號,隨機選取樣本的5%,10%, 15%, 20%, 25%作為有標(biāo)簽樣本,剩余的作為無標(biāo)簽數(shù)據(jù)樣本,將改進半監(jiān)督算法同傳統(tǒng)的半監(jiān)督算法進行對比,仿真結(jié)果如表1所示。
從表1實驗結(jié)果可看出,對于實驗的6種雷達信號,隨著有標(biāo)簽樣本比例的增加,改進半監(jiān)督樸素貝葉斯算法(ISNB)的識別率要高于傳統(tǒng)的半監(jiān)督樸素貝葉斯算法(SNB),說明改進后的SNB算法具有一定的優(yōu)勢。但是在實驗的過程中,也發(fā)現(xiàn)了存在SNB算法識別率高于ISNB算法的情況,這是因為原SNB算法會使更多的數(shù)據(jù)加入有標(biāo)簽樣本集,這樣就使得信號樣本集中大多數(shù)都是準確率較高的數(shù)據(jù);而改進后的SNB算法是靠M值調(diào)整后續(xù)加入的準確度的數(shù)據(jù)的,這樣就導(dǎo)致大量的高預(yù)測準確度的數(shù)據(jù)無法添加至有標(biāo)簽樣本集中,使得其識別率不如原SNB算法。這樣也可以得出這樣的結(jié)論,當(dāng)信號樣本集中預(yù)測結(jié)果準確率整體較高時,應(yīng)選取較大的M值,也就是將盡量多的高準確率的無標(biāo)簽樣本加入至訓(xùn)練集中;另一方面,若對無標(biāo)簽樣本的預(yù)測不是很準確,應(yīng)選取較小的M值,此時應(yīng)將盡可能少的那部分高置信度的樣本加入至訓(xùn)練集中,而避免添加大量預(yù)測程度不高的無標(biāo)簽樣本,進而對預(yù)測結(jié)果的正確性產(chǎn)生影響。
從圖7可看出,ISNB算法較SNB算法具有更好的分類性能。該方法通過提取高置信度的無標(biāo)簽樣本添加到訓(xùn)練集中,使得訓(xùn)練樣本集中始終保留的是高質(zhì)量的樣本,從而避免了傳統(tǒng)的SNB將預(yù)測的全部無標(biāo)簽樣本添加至有標(biāo)簽樣本集會產(chǎn)生迭代錯誤的缺陷,提高了對測試樣本集的分類準確率。
文獻[25]采用主成分分析法(Principal Component Analysis, PCA)對雙譜進行降維從而提取出特征向量,下面使用此特征提取方法提取4種信號的特征向量,將本文提出的算法與SNB算法、文獻[19]算法和PCA-SVM算法進行比較,當(dāng)有標(biāo)記樣本比例為25%時在不同信噪比下對4種LPI雷達信號進行識別,識別結(jié)果如表2所示。
從表2中可以看出,相比于SNB算法和PCA-SVM算法,本文ISNB算法在不同信噪比下的識別率較高,識別效果較好。由于SNB算法將預(yù)測到的所有特征樣本都添加至有標(biāo)記樣本,會產(chǎn)生迭代錯誤進而降低識別率;而采用PCA-SVM算法時,對信號進行雙譜對角切片提取后的維數(shù)依然很高,此時訓(xùn)練出的SVM分類器學(xué)習(xí)能力不強,識別效果不太理想;ISNB算法通過提取CWD時頻分布能量累積量作為特征,然后生成置信度列表進而選取預(yù)測準確度較高的特征樣本,極大地提高了識別率,因而對于6類LPI雷達信號的識別更有效。
本文針對先驗信息殘缺的非合作電子偵察背景下的雷達輻射源信號識別問題,提出了基于半監(jiān)督條件下樸素貝葉斯和Choi-Williams時頻分布能量積累的識別算法,具體完成了以下內(nèi)容:
表1 兩種方法在不同標(biāo)記樣本下的識別效果比較
圖7 兩種算法平均識別率對比
表2 不同信噪比下的識別正確率
(1) 在特征提取部分,本文針對低信噪比條件下雷達信號Choi-Williams時頻分布出現(xiàn)嚴重失真的問題,提出了時頻能量積累量這一新的特征用于后續(xù)分類器的輸入,在經(jīng)過降噪處理后,可以獲得更加清晰的新特征包絡(luò),不僅有助于為后續(xù)分類器的分類識別工作,而且拓寬了電子偵察中的信息維度;
(2) 針對傳統(tǒng)的半監(jiān)督樸素貝葉斯算法在更新訓(xùn)練樣本集過程中會產(chǎn)生迭代錯誤的不足,通過在無標(biāo)簽樣本集生成的置信度列表中選取置信度高的樣本添加到有標(biāo)簽樣本集中,再利用預(yù)測后的分類結(jié)果對分類器參數(shù)進行修正,進而構(gòu)建改進的SNB分類器,有效解決了傳統(tǒng)SNB算法分類精度低且分類性能不穩(wěn)定的缺點。
(3) 本文從理論論證了所提方法的可行性,并與經(jīng)典算法進行對比,通過仿真驗證了算法的有效性,為非合作偵察中輻射源信號的識別提供了新思路。