李曉雄,張淑寧,趙惠昌,陳思
(南京理工大學(xué) 電子工程與光電技術(shù)學(xué)院,江蘇 南京 210094)
無載波超寬帶引信是近年來發(fā)展起來的一種全新的無線電近炸引信,它具有距離分辨率高、抗截獲能力強(qiáng)、電磁穿透性好等特點[1-2]。
近年來,有很多學(xué)者對無載波超寬帶引信進(jìn)行了研究。其中,文獻(xiàn)[3]針對平坦地面建立無載波超寬帶引信回波模型,通過仿真和實測波形比較,驗證了建模的正確性。文獻(xiàn)[4]設(shè)計一種超寬帶與彈頭共型微帶天線,有效增加了天線帶寬。文獻(xiàn)[5]提出一種改進(jìn)變步長最小均方(LMS)自適應(yīng)濾波算法,提高了對無載波超寬帶引信信號的濾波效果。然而,與無載波超寬帶引信目標(biāo)識別相關(guān)的研究非常稀少。
引信接收機(jī)接收到的回波信號中包含噪聲和地面雜波,特別是在近炸引信工作過程中,地面雜波的影響尤為突出。不同地形條件下的地雜波功率譜分布不同,區(qū)分地形能更好地對雜波進(jìn)行抑制,也能夠減少雜波干擾導(dǎo)致的引信炸高散布[6-7]。此外,根據(jù)不同地形自適應(yīng)確定引信最佳炸高也要求準(zhǔn)確識別不同地形。
引信采集大量的地形回波信號需要耗費較大的人力物力,導(dǎo)致回波數(shù)據(jù)量不足,而樣本量的不足會造成神經(jīng)網(wǎng)絡(luò)過擬合,降低識別準(zhǔn)確率[8-9]。生成對抗網(wǎng)絡(luò)(GAN)能夠通過學(xué)習(xí)真實樣本分布生成逼真樣本,從而解決樣本量不足問題。文獻(xiàn)[10]針對新冠肺炎前期胸片數(shù)據(jù)量不足的問題,提出基于GAN和遷移學(xué)習(xí)的方法,顯著提高了診斷準(zhǔn)確率。文獻(xiàn)[11]提出了一種改進(jìn)條件生成對抗網(wǎng)絡(luò)(CGAN)用于激光雷達(dá)數(shù)據(jù)分類。文獻(xiàn)[12]通過GAN擴(kuò)充了合成孔徑雷達(dá)船艦數(shù)據(jù),將識別準(zhǔn)確率提高了4%以上。
本文針對無載波超寬帶引信小樣本地形識別問題,提出一種基于一維卷積CGAN(1DC-CGAN)和小波能量特征的識別框架,其中1DC-CGAN通過生成地形回波進(jìn)行數(shù)據(jù)增強(qiáng)解決樣本量不足的問題。1DC-CGAN引入了一維卷積和批標(biāo)準(zhǔn)化(BN)[13],提高了擬合真實信號分布的能力,減少了模式崩潰的發(fā)生,提高了生成信號質(zhì)量。數(shù)據(jù)增強(qiáng)解決了樣本量不足時分類模型無法得到充分訓(xùn)練的問題,提高了小樣本條件下地形識別的準(zhǔn)確率。
為驗證算法的有效性,整個實驗包括靜態(tài)實驗與動態(tài)實驗。靜態(tài)實驗中的地形回波由靜止的引信樣機(jī)采集,針對每種地形采集了在不同視角觀測的回波以驗證小波能量特征對觀測角變化的魯棒性。動態(tài)實驗中的地形回波為實際炮彈在飛向地面時由彈載數(shù)據(jù)采集器獲得,由于炮彈型號和環(huán)境等因素影響,引信落角具有一定隨機(jī)性。實驗結(jié)果表明,相比原始訓(xùn)練集,在使用1DC-CGAN擴(kuò)充的訓(xùn)練集上訓(xùn)練PSO-BP神經(jīng)網(wǎng)絡(luò)可以提高地形識別的準(zhǔn)確率,提高幅度超過4%。
超寬帶信號的相對帶寬μ大于25%,相對帶寬定義如下:
μ=2(fH-fL)/(fH+fL)
(1)
無載波超寬帶信號的基本波形為高斯脈沖:
(2)
式中:A為脈沖峰值幅度;σ為脈沖方差。由于路徑損耗、天線增益和雷達(dá)散射截面的影響,傳輸信號的強(qiáng)度會衰減。此外,由于引信與散射中心的距離不同而導(dǎo)致的時間延遲也反映在接收信號中。因此,接收信號[14]可以表示為
(3)
式中:P為散射中心的數(shù)目;s(t)和n0(t)分別表示發(fā)射的高斯脈沖信號和傳輸路徑噪聲;am和τm為第m個散射點引起的幅度衰減和時延。
動態(tài)實驗中,選取了平坦草地、中等濕度耕地、含碎石山地3種地形,其原始回波信號如圖1所示。可以看出地形回波包含一定噪聲且是多個不同脈沖相干疊加的結(jié)果,表明地形目標(biāo)包含多個散射點,不同散射點回波的時間延遲和幅度衰減有所不同。
原始地形回波的采樣點數(shù)和幅度范圍并不一致,同時還含有較多噪聲,不利于后續(xù)的識別處理。無載波超寬帶信號是寬帶信號,普通的低通濾波或者帶通濾波的方法并不適用。本文選用集合經(jīng)驗?zāi)B(tài)分解(EEMD)來去除高頻噪聲[15]。
集合經(jīng)驗?zāi)B(tài)分解是由經(jīng)驗?zāi)B(tài)分解(EMD)[16]改進(jìn)而來,相比后者EEMD可以減少模態(tài)混疊問題,二者的共同點都是把原始信號分解為一系列本征模態(tài)函數(shù)和余量。通過選取合適的分解層數(shù)和去除某些模態(tài)就可以達(dá)到自適應(yīng)去噪的目的。
EEMD的算法流程如下:
步驟1將高斯白噪聲ni(t)加入待分解信號xi(t)=x(t)+ni(t),i∈[1,N],代表第i次加入噪聲,初始i=1,N為樣本總數(shù)。
本文選用10層EEMD,即M=10,添加噪聲方差為0.2,噪聲添加次數(shù)N=70。以某一組草地回波為例,EEMD分解結(jié)果如圖2所示(只畫了前5個模態(tài)),可以看出高頻噪聲主要集中在第1個模態(tài)內(nèi),因此本文通過去除第一個模態(tài),將剩余模態(tài)和余量相加實現(xiàn)EEMD去噪。
去除噪聲后的不同回波仍然存在采樣點數(shù)不同,幅值范圍不同的問題,因此本文提出了一種滑動幀能量閾值截取的方法。取固定長度而位置可變的矩形窗,矩形窗從信號起始點滑動到信號結(jié)束點,計算每個窗內(nèi)信號的能量:
(4)
接著對截取后的回波信號進(jìn)行幅度歸一化,使其取值在[0,1]之間,計算公式如下:
(5)
式中:fstd(t)為歸一化信號;f(t)為截取后的信號;fmax(t)、fmin(t)分別為f(t)的最大值和最小值。
當(dāng)樣本量較少時,訓(xùn)練的神經(jīng)網(wǎng)絡(luò)極易發(fā)生過擬合,從而導(dǎo)致在測試集上的識別率偏低。數(shù)據(jù)增強(qiáng)能有效緩解樣本量不足帶來的不利影響。GAN能通過學(xué)習(xí)真實樣本分布生成足夠逼真的生成樣本,擴(kuò)充訓(xùn)練集,從而有效提高分類器的魯棒性[17-18]。
(6)
CGAN生成器和判別器的損失函數(shù)分別為
(7)
(8)
優(yōu)化器迭代更新判別器和生成器參數(shù)使得損失函數(shù)取得最小值,此時生成器能夠生成統(tǒng)計分布和真樣本一致的假樣本,判別器不能夠區(qū)分真假樣本,即判別真假樣本的概率均為50%,此時CGAN達(dá)到“納什均衡狀態(tài)”。標(biāo)簽信息的引入方式一般是通過嵌入層(Embedding)將維數(shù)擴(kuò)充后的標(biāo)簽信息融入生成器或判別器,相比于one-hot編碼,Embedding編碼后的向量不至于過于稀疏,可以引入更多的信息。
原始CGAN的網(wǎng)絡(luò)結(jié)構(gòu)一般是全連接層,由于采集的原始信號數(shù)據(jù)量少,但序列長度較長,所以全連接神經(jīng)網(wǎng)絡(luò)每一層的神經(jīng)元數(shù)目較多,很容易出現(xiàn)過擬合和模式崩潰問題,即同一類別的生成樣本高度相似,沒有多樣性。而一維卷積神經(jīng)網(wǎng)絡(luò)通過卷積運算極大地減少了網(wǎng)絡(luò)參數(shù)數(shù)量,減輕計算量的同時,降低了過擬合發(fā)生的機(jī)率,同時它還能利用序列點間的位置信息,對與充分提取序列信號的特征是有益的[20]。
本文提出了1DC-CGAN,生成器和判別器模型結(jié)構(gòu)如圖3和圖4所示。通過引入批量標(biāo)準(zhǔn)化調(diào)整神經(jīng)網(wǎng)絡(luò)輸出范圍,使其處于激活函數(shù)的活躍區(qū)間,從而減少梯度彌散,提升訓(xùn)練速度。生成器通過輸入標(biāo)簽和噪聲生成指定類別的假樣本,它含有兩個反卷積層,而每次反卷積都將信號維數(shù)擴(kuò)大一倍,因此第一個反卷積層需要輸入200維向量。輸入標(biāo)簽經(jīng)過嵌入層、全連接層后整型成單通道200維向量,高斯噪聲向量通過全連接層、激活層后整型成64通道200維向量。拼接層將這兩個向量按通道拼接,接著通過兩個反卷積層和一個卷積層后得到生成樣本,輸出層激活函數(shù)為雙曲正切。
判別器是將真假樣本及其標(biāo)簽作為輸入做出真假判別。標(biāo)簽信息經(jīng)過嵌入層、全連接層后整型成單通道800維向量,與單通道800維時間信號合并為兩個通道,接著通過兩個卷積層和全連接層后得到判別結(jié)果,生成回波和原始回波對比如圖5(a)~圖5(c)所示,橫軸為采樣點,可以看出1DC-CGAN可以生成較為逼真的生成樣本。
設(shè)原始樣本序列集為s={s1,s2,…,sN},生成樣本序列集為={1,2,…,M}。相關(guān)系數(shù)矩陣Z的矩陣元素zmn為sm和n兩個序列的互相關(guān)系數(shù)。固定一個閾值σ,對于矩陣Z的每一列,當(dāng)最大值超過閾值時,將該最大值設(shè)置為1,同列其余元素設(shè)置為0。當(dāng)全列元素均不超過閾值時,該列元素均設(shè)置為0,便得到一個維度為N×M的二值矩陣
(9)
式中:λ1、λ2為懲罰因子。
離散小波變換降低了連續(xù)小波變換的計算復(fù)雜度,使小波變換的應(yīng)用易于實現(xiàn)。離散小波變換的定義為
WX(j,k)=〈X(t),ψj,k(t)〉=
(10)
小波能量特征提取方法如下:
1)對s信號進(jìn)行3層小波分解,小波基選為db3,分別得到低頻小波系數(shù)c3和高頻小波系數(shù)d3、d2、d1。
2)對小波分解系數(shù)重構(gòu),記s0(t)、s1(t)、s2(t)、s3(t)分別表示c3、d3、d2、d1的重構(gòu)信號,則信號s(t)可表示為s(t)=s0(t)+s1(t)+s2(t)+s3(t)。
3)求各頻帶信號的總能量,設(shè)sj(t)對應(yīng)的能量為Ej(j=0,1,2,3),其中Ej可以表示為
(11)
4)以能量為元素,構(gòu)造特征向量X=(E0,E1,E2,E3),即為小波能量特征[22]。
提取動態(tài)實驗中預(yù)處理回波信號的小波能量特征,并選取后3個特征(E1,E2,E3)可視化,結(jié)果如圖7所示,可見3種地形的小波能量特征可分性較好。
粒子群優(yōu)化(PSO)算法的BP(PSO-BP)神經(jīng)網(wǎng)絡(luò)是BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)算法[23],利用PSO算法良好的全局搜尋能力,對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行了優(yōu)化,彌補(bǔ)了BP神經(jīng)網(wǎng)絡(luò)收斂速度慢,存在多個局部極值點的缺陷。PSO算法的主要思想是:粒子在空間中根據(jù)自身的經(jīng)驗和它臨近個體的經(jīng)驗不斷調(diào)整位置,從而找到最優(yōu)解。
PSO-BP神經(jīng)網(wǎng)絡(luò)算法的具體步驟如下:
步驟1BP神經(jīng)網(wǎng)絡(luò)和PSO算法初始化。
步驟2確定適應(yīng)度函數(shù),粒子位置為網(wǎng)絡(luò)權(quán)值和閾值。
步驟3根據(jù)適應(yīng)度確定粒子和種群最優(yōu)位置。
步驟4更新粒子的位置和速度、慣性權(quán)重及學(xué)習(xí)因子。
步驟5PSO算法找到最優(yōu)解則用其初始化神經(jīng)網(wǎng)絡(luò),訓(xùn)練網(wǎng)絡(luò)收斂,否則返回步驟3。
PSO-BP的參數(shù)設(shè)置如下:種群規(guī)模30,迭代次數(shù)100,學(xué)習(xí)率0.001,速度范圍-2~2,位置范圍-5~5,學(xué)習(xí)因子c1=c2=2,訓(xùn)練測試樣本比7∶3,目標(biāo)誤差0.001。BP神經(jīng)網(wǎng)絡(luò)輸入層、隱含層、輸出層神經(jīng)元的數(shù)目分別為4、6、3。
整個實驗分為靜態(tài)實驗與動態(tài)實驗。在靜態(tài)實驗中,引信樣機(jī)通過超寬帶天線發(fā)射無載波超寬帶信號,回波信號通過高速示波器采集存儲。在實驗過程中采集了30°、45°、60° 3種不同的入射角的回波,每種入射角下觀測獲得的回波數(shù)量大致相等。地形種類分別為平坦草地、低矮灌木、光滑瓷磚和粗糙大理石地板。靜態(tài)實驗場景如圖8所示。
在動態(tài)實驗中,彈目交會速度范圍98~238 m/s,炮彈飛向不同類型地面的過程中,由彈載數(shù)據(jù)采集器采集回波數(shù)據(jù)。不同口徑、不同型號的炮彈飛向地面時落角會有所不同,而同型號炮彈的落角有小幅度變化,因此動態(tài)實驗中的炮彈落角有一定隨機(jī)性。由于實驗場地的限制,動態(tài)實驗采集了三類地形,分別為干燥耕地、平坦草地、含碎石山地,樣本的采集數(shù)量分別為36、54和18。
無載波超寬帶引信信號頻率范圍為1~3 GHz,瞬時帶寬不小于1 GHz。在動態(tài)實驗和靜態(tài)實驗中獲取的回波信號情況如表1所示。
表1 不同類型地面的回波數(shù)據(jù)
本節(jié)分析在靜態(tài)場景下的實驗結(jié)果,重點分析小波能量特征對不同落角的敏感性、小波能量特征相比其他特征的有效性以及PSO-BP神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。
4種地形回波在經(jīng)過預(yù)處理后,分別計算其小波能量特征、時域特征、雙譜對角切片特征。其中時域特征是指均值、方差、波形因子、峰值因子、峭度、偏度、平均附加延遲、均方根時延擴(kuò)展、能量、裕度等10個時域特征[24],PCA降維成6個特征用于識別。雙譜對角切片特征是計算信號的雙譜對角切片后,分段取平均值的結(jié)果[25]。
分類器方面選取了PSO-BP神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)3種。靜態(tài)實驗下的識別結(jié)果如表2所示。由表2可以看出,通過小波能量特征和PSO-BP神經(jīng)網(wǎng)絡(luò)的方法可以對不同地形實現(xiàn)較好的分類。
表2 不同方法對比
4種地形在3種落角下的小波能量特征如圖9所示。由圖9可以看出,由于瓷磚表面較為光滑,接收到的回波信號主要是鏡面反射,特征點較為聚集,而低矮灌木在不同入射角下的散射點分布會有所不同,因此小波能量特征也呈現(xiàn)分散的特點。但是總體來看,不同地形的小波能量特征對入射角變化存在一定的魯棒性。
本節(jié)分析在動態(tài)場景下的實驗結(jié)果,重點分析本文提出的1DC-CGAN相比其他數(shù)據(jù)擴(kuò)充方法的優(yōu)越性,以及使用1DC-CGAN擴(kuò)充訓(xùn)練集對于提升PSO-BP神經(jīng)網(wǎng)絡(luò)識別性能的有益影響。
對動態(tài)實驗中的3種地形回波訓(xùn)練集采用多種方法進(jìn)行數(shù)據(jù)擴(kuò)充。數(shù)據(jù)擴(kuò)充的方式為每種地形生成相同數(shù)量的回波信號后,添加到原地形回波訓(xùn)練集中。每種地形擴(kuò)充數(shù)量為200時,3種生成式生成樣本的質(zhì)量對比如表3所示,擴(kuò)充后樣本的小波能量特征如圖10(a)~圖10(c)所示,可以看出本文提出的1DC-CGAN生成回波信號的質(zhì)量較高。
表3 生成回波信號質(zhì)量對比
由圖10可以看出,CGAN生成的回波信號在小波能量特征圖上出現(xiàn)了特征點聚集,山地和耕地的回波信號有大量的特征點重疊在一起,這是因為出現(xiàn)了模式崩潰問題,生成的信號高度相似。而且生成地形回波的特征數(shù)值相比原始信號差別較大,尤其是E3的數(shù)量級擴(kuò)大了10倍以上。采用隨機(jī)裁切和添加高斯噪聲同樣存在特征點重合和多樣性不足問題。而使用1DC-CGAN生成的回波的特征點分散在原始回波特征點周圍,不但生成回波質(zhì)量較高,還有效增加了回波的多樣性,因此采用1DC-CGAN生成回波可以有效實現(xiàn)數(shù)據(jù)增強(qiáng)。
將預(yù)處理后的原始地形回波按照7∶3的比例劃分為訓(xùn)練集和測試集,用在訓(xùn)練集上訓(xùn)練好的1DC-CGAN生成不同數(shù)量的回波信號擴(kuò)充原訓(xùn)練集,然后在擴(kuò)充訓(xùn)練集上訓(xùn)練PSO-BP神經(jīng)網(wǎng)絡(luò)對測試集分類。表4列出了每類地形不同樣本擴(kuò)充數(shù)量對PSO-BP神經(jīng)網(wǎng)絡(luò)識別率的影響。
由表4可以看出,數(shù)據(jù)擴(kuò)充減輕了神經(jīng)網(wǎng)絡(luò)的過擬合,提高了PSO-BP神經(jīng)網(wǎng)絡(luò)的識別率,在每類地形擴(kuò)充樣本為300時,相比不進(jìn)行數(shù)據(jù)擴(kuò)充,分類準(zhǔn)確率提高了4%以上。
表4 數(shù)據(jù)擴(kuò)充對分類器的影響
本文首次將無載波超寬帶引信用于地形識別。針對小樣本地形回波數(shù)據(jù),本文提出先通過1DC-CGAN進(jìn)行數(shù)據(jù)擴(kuò)充,再訓(xùn)練PSO-BP神經(jīng)網(wǎng)絡(luò)對回波信號的小波能量特征進(jìn)行識別。得到主要結(jié)論如下:
1)由于卷積相比全連接的優(yōu)越性,改進(jìn)的CGAN生成對抗網(wǎng)絡(luò)減少了模式崩潰問題的發(fā)生,提高了生成信號質(zhì)量。
2)神經(jīng)網(wǎng)絡(luò)在擴(kuò)充訓(xùn)練集上訓(xùn)練后,減輕了過擬合現(xiàn)象,在測試集上得到更好的識別效果。這種通過GAN擴(kuò)充數(shù)據(jù)的方式,減輕了數(shù)據(jù)獲取需要的高昂人力物力,提高了分類器的識別準(zhǔn)確率。