張星池, 胡 進(jìn)
(中國船舶重工集團(tuán)公司第七二四研究所,南京 211000)
隨著雷達(dá)信號波形設(shè)計不斷改進(jìn),常規(guī)脈沖雷達(dá)逐漸被脈內(nèi)調(diào)頻調(diào)相、頻率分集和頻率捷變等新體制雷達(dá)取代[1]。在雷達(dá)輻射源信號形式越來越復(fù)雜的今天,常規(guī)的5大參數(shù)已不能完整表述現(xiàn)代雷達(dá)信號,難以對雷達(dá)信號做出準(zhǔn)確描述[2]。
在雷達(dá)信號變化豐富的同時,脈內(nèi)特征參數(shù)由于具有一定的穩(wěn)定性而引起了學(xué)界的注意。許多學(xué)者嘗試提取多種脈內(nèi)特征參數(shù)用于聚類分選,如盒維數(shù)、稀疏性特征、雙譜熵特征和維格納熵特征等[3-4]。由于單個脈內(nèi)特征參數(shù)提供的特征信息有限,現(xiàn)有的借助脈內(nèi)特征的聚類分選方法通常會提取多個脈內(nèi)特征參數(shù),或聯(lián)合常規(guī)的載頻(CF)、脈寬(PW)和到達(dá)角(DOA)等參數(shù),從而形成特征向量進(jìn)行聚類分選。然而,已有的研究通常關(guān)注單個特征參數(shù)的復(fù)雜度和穩(wěn)定性等性能[5-6],而非分析如何在多種脈內(nèi)特征參數(shù)之間進(jìn)行選取,從而用于聚類分選。
因此,本文提出一種新的聯(lián)合預(yù)分選方法,不同于傳統(tǒng)方法的分多步完成常規(guī)參數(shù)和多種脈內(nèi)特征參數(shù)提取后再進(jìn)行聚類,本文方法首先將接收機(jī)前端處理后的脈沖波形轉(zhuǎn)換為時頻圖像,隨后借助自編碼器自動地提取時頻圖像中的特征,同時完成脈內(nèi)特征參數(shù)的提取、調(diào)制類型識別和聚類分選,直接從時頻圖像輸出預(yù)分選結(jié)果,因此稱為聯(lián)合預(yù)分選。
雷達(dá)信號需經(jīng)過Choi-Williams分布(Choi-Williams Distribution,CWD)[7]轉(zhuǎn)換為時頻圖后再由自編碼器提取特征參數(shù)。本文以CW,LFM,NLFM,BPSK,QPSK,FSK,LFM-BPSK和FSK-BPSK為例,其時頻圖像如圖1所示。
圖1 不同調(diào)制信號的時頻圖像
Choi-Williams分布屬于Cohen類時頻分布。Cohen類時頻分布的一般定義為
(1)
(2)
代入式(1)可得Choi-Williams分布的定義為
(3)
式中,α為可調(diào)參數(shù)。
設(shè)X={x1,…,xN}為空間RD中的所有待聚類脈沖,常規(guī)的聚類算法依賴于X中所有樣本之間的距離關(guān)系進(jìn)行聚類。然而當(dāng)維度D很高時,高維空間中的距離關(guān)系可能會失去參考價值[8],因此高維空間中的聚類相比低維空間會更加困難。而自編碼器能夠進(jìn)行降維和特征提取,從而降低聚類難度。
自編碼器[9-10]包含編碼器(Encoder)和解碼器(Decoder)兩部分。編碼器接收D維向量輸入,并輸出降維后的d維特征向量,即構(gòu)建了映射fθ:RD→Rd,θ為構(gòu)成編碼器的神經(jīng)網(wǎng)絡(luò)的參數(shù)。而解碼器接收來自編碼器的d維特征向量,嘗試將其還原回輸入的D維向量,即構(gòu)建映射gω:Rd→RD,ω為解碼器的網(wǎng)絡(luò)參數(shù)。自編碼器通過最小化從d維特征向量還原回的D維向量與輸入的原始向量之間的距離來確保編碼得到的d維特征向量能夠充分包含原始輸入中的特征信息,即
(4)
式中:Gω(Y)=[gω(y1) …gω(yN)];Y=Fθ(X),F(xiàn)θ(X)=[fθ(x1) …fθ(xN)];||·||F表示F范數(shù)。
自編碼器并未對其中編碼器、解碼器以及降維后的向量嚴(yán)格規(guī)定結(jié)構(gòu)。如圖2所示,本文編碼器和解碼器選取為兩層全連接層(Full-connected,Fc),每層4000個神經(jīng)元,并采用ReLU激活函數(shù)。將編碼器的輸出(同時也是解碼器的輸入)設(shè)置為兩個向量,分別為代表調(diào)制類型的類別向量C和代表調(diào)制特征的特征向量Y。
圖2 自編碼器結(jié)構(gòu)
編碼器接收經(jīng)標(biāo)準(zhǔn)化處理后的128×128尺寸的時頻圖像X,通過兩層全連接層輸出類別向量C和特征向量Y。編碼器的第2層全連接層輸出類別向量C時會使用Softmax函數(shù)進(jìn)行分類,即
(5)
由于引入了類別向量C,在式(4)之外還需對編碼器進(jìn)行有監(jiān)督訓(xùn)練使其能夠判斷脈沖信號的調(diào)制方式。本文方法使用交叉熵?fù)p失函數(shù),即
(6)
其中,R=[R1…RK],為真實的調(diào)制類別經(jīng)獨熱(One-hot)編碼后的真實類別向量。預(yù)訓(xùn)練階段將同時對式(4)和式(6)計算梯度并反向傳播。由于兩個優(yōu)化目標(biāo)并不沖突,因此不需要設(shè)置平衡系數(shù)。
在完成預(yù)訓(xùn)練后,自編碼器利用提取出的特征向量代表輸入的原始信號時頻圖。來自同一輻射源的雷達(dá)信號可以認(rèn)為具有較為相似的脈內(nèi)特征,因此其提取出的特征向量將會較為接近。也就是說,如果兩個脈沖信號經(jīng)時頻轉(zhuǎn)換后提取出的特征向量較為接近,則很有可能來自于同一個雷達(dá)輻射源。因此,多種基于自編碼器的聚類方法[10-12]可用于對特征空間進(jìn)行聚類從而實現(xiàn)預(yù)分選。
本文首先對測試集信號庫X={x1,…,xN}中的全部信號計算時頻圖并通過編碼器提取特征,得到特征空間Rd中的N個點Y={y1,…,yN}。另外,也可以額外增加更多人工測算的特征信息(如到達(dá)角(DOA))作為特征空間Rd的新增維度。新加入的特征信息需要進(jìn)行標(biāo)準(zhǔn)化來保證與原始的d維特征向量中的數(shù)據(jù)處于同一數(shù)量級,例如:
(7)
提取得到的所有信號的特征向量Y={y1,…,yN}之間的距離關(guān)系代表了信號之間的相似程度。特征向量相近的兩個信號有較大概率來自于同一個雷達(dá)輻射源。將每個點與距離最近的k個其他點相連,得到一張近鄰圖ε。編碼器將學(xué)習(xí)如何縮短圖中較短的邊,盡可能令來自相同輻射源的脈沖信號提取出的特征向量趨于相同。此外,當(dāng)近鄰圖ε中的一條邊連接的點來自兩個不同調(diào)制類型的信號,這條邊將被刪除。
在初始構(gòu)建的近鄰圖ε中,不同邊的長度差異極大。本文方法引入文獻(xiàn)[10]中的軟閾值函數(shù)作為損失函數(shù)處理邊長,從而避免極端值的影響。軟閾值函數(shù)形如
(8)
軟閾值函數(shù)能夠限制輸出,使其不超過閾值μ,同時保持函數(shù)可微,便于神經(jīng)網(wǎng)絡(luò)使用梯度下降法優(yōu)化。
(9)
損失函數(shù)分為兩項,前一項用于保持編碼器輸出的特征向量能夠被用于還原輸入的時頻圖像;后一項迫使較短的邊的長度縮短,從而使來自同一輻射源的相近信號輸出的特征向量趨同。訓(xùn)練過程中將同時對這兩個目標(biāo)進(jìn)行優(yōu)化,λ被用于平衡兩個目標(biāo)。λ選取為所有待分選特征向量的二范數(shù)和與初始的ε中所有邊的權(quán)重的和的比值。
相較于預(yù)訓(xùn)練階段完全通過時頻圖像訓(xùn)練特征提取,聚類階段引入了來自近鄰圖的反饋(即式(9)中的第2項)來修正噪聲對特征向量提取帶來的干擾。
算法流程見圖3。
圖3 算法流程圖
如圖3所示,算法分為預(yù)訓(xùn)練和聚類兩個步驟。預(yù)訓(xùn)練階段先將雷達(dá)數(shù)據(jù)庫中的大量已知信號波形作為訓(xùn)練集,將其經(jīng)Choi-Williams分布處理得到時頻圖像,最后使用得到的時頻圖像訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其能夠判斷輸入信號的調(diào)制類型并提取其中的特征參數(shù)。
在完成預(yù)訓(xùn)練后神經(jīng)網(wǎng)絡(luò)便可用于聚類分選。在聚類階段,首先將待分選信號作為測試集,經(jīng)CWD處理后得到其時頻圖像,并送入神經(jīng)網(wǎng)絡(luò)提取其特征參數(shù),同時判斷調(diào)制類型,隨后根據(jù)全體信號提取出特征向量的距離關(guān)系計算得到近鄰圖。神經(jīng)網(wǎng)絡(luò)將依據(jù)近鄰圖的收斂結(jié)果反復(fù)迭代,不斷修正從時頻圖像提取出的特征信息,從而盡量排除噪聲帶來的影響。最終在近鄰圖完成收斂后,算法將輸出聚類結(jié)果。
本文的仿真實驗包括3部分:神經(jīng)網(wǎng)絡(luò)預(yù)訓(xùn)練、對不同調(diào)制類型信號分選實驗和對相同調(diào)制類型信號分選實驗。
神經(jīng)網(wǎng)絡(luò)在預(yù)訓(xùn)練階段使用大量已知或仿真的雷達(dá)信號進(jìn)行訓(xùn)練。本文中隨機(jī)生成8種調(diào)制類型共計60 000個雷達(dá)信號,其中,50 000個作為訓(xùn)練集,10 000個作為測試集。調(diào)制類型包括CW,LFM,NLFM,BPSK,QPSK,F(xiàn)SK,LFM-BPSK和FSK-BPSK。所有信號脈寬范圍均為10~20 μs,采樣率均為100 MHz。FSK和FSK-BPSK信號的兩個調(diào)制頻率分別在10~20 MHz和30~40 MHz之間隨機(jī)選取。其余信號載頻在10~40 MHz之間隨機(jī)選取。LFM,NLFM和LFM-BPSK的調(diào)制信號帶寬隨機(jī)選取為10~20 MHz。BPSK,LFM-BPSK和FSK-BPSK信號的相位編碼隨機(jī)為3種巴克碼之一,即[1110010],[11100010010]和[1111100110101]。FSK和FSK-BPSK信號的頻率編碼規(guī)律與前者相同。QPSK信號的相位編碼隨機(jī)為法蘭克多項碼和泰勒四項碼之一,包括[000012302020321]和[0123030303210]。
訓(xùn)練時對上述信號隨機(jī)施加0~20 dB的噪聲,隨后將全體信號生成的時頻圖像作為訓(xùn)練集。訓(xùn)練方法采用隨機(jī)梯度下降法。批大小取為256,學(xué)習(xí)率取為0.000 1。損失函數(shù)和測試集上的調(diào)制類型識別準(zhǔn)確率隨迭代次數(shù)的變化如圖4所示,圖中損失函數(shù)為式(4)和式(6)的和。
圖4 損失函數(shù)和識別準(zhǔn)確率變化圖
相比重建時頻圖,調(diào)制類別識別更為簡單。因此,在損失函數(shù)還遠(yuǎn)未收斂時調(diào)制類別識別的準(zhǔn)確率就已達(dá)到最優(yōu)。損失函數(shù)停止下降后結(jié)束預(yù)訓(xùn)練階段。
仿真8種調(diào)制類別不同的雷達(dá)信號,調(diào)制類別分別為CW,LFM,NLFM,BPSK,QPSK,FSK,LFM-BPSK和FSK-BPSK。所有信號脈寬為10 μs,采樣率均為100 MHz。FSK和FSK-BPSK信號的兩個調(diào)制頻率分別在20 MHz和30 MHz,其余信號載頻為25 MHz。LFM,NLFM和LFM-BPSK信號帶寬為20 MHz。BPSK,LFM-BPSK,FSK和FSK-BPSK信號的頻率和相位編碼規(guī)律均為[1110010]。QPSK信號的相位編碼規(guī)律為[000012302020321]。每種信號生成2000個進(jìn)行仿真實驗。
分選準(zhǔn)確率定義為用匈牙利算法重排分類結(jié)果后計算得出的F1值。F1值由查準(zhǔn)率P(Precision)和查全率R(Recall)定義,即
(10)
式中:TP為正確分選信號數(shù);FP為誤分選信號數(shù);FN為漏分選信號數(shù)。
不同信噪比環(huán)境下的分選結(jié)果如表 1所示。
表1 不同調(diào)制類型信號分選準(zhǔn)確率(F1值)
不同調(diào)制類型信號的分選很大程度上依賴編碼器對信號調(diào)制類型的判斷??梢姡谛旁氡雀哂?5 dB的環(huán)境下依靠調(diào)制類型預(yù)測,分選準(zhǔn)確率較高。而在信噪比低至-10 dB后,QPSK和FSK以外的信號分選準(zhǔn)確率大幅下降。
為進(jìn)一步驗證本文方法對相同調(diào)制類型信號分選的適應(yīng)性,設(shè)計了對調(diào)制類型相同但調(diào)制參數(shù)不同的雷達(dá)信號的分選測試。設(shè)置調(diào)制類型分別為LFM,BPSK和LFM-BPSK的3組信號,其中,LFM和BPSK信號各設(shè)置2種,LFM-BPSK設(shè)置4種,共計8種信號。所有信號載頻均為25 MHz,脈寬為10 μs,采樣率為100 MHz。2種LFM信號帶寬均為20 MHz,區(qū)別為一種載頻從15 MHz線性提高至35 MHz,另一種則從35 MHz線性降低至15 MHz。2種BPSK信號的相位編碼規(guī)律分別為[1110010]和[11100010010]。在上述2種LFM信號基礎(chǔ)上分別施加與BPSK信號相同的2種相位編碼,構(gòu)成4種LFM-BPSK信號。全部8種信號依次標(biāo)記為1~8號,每種信號生成2000個進(jìn)行仿真實驗。不同信噪比環(huán)境下的分選準(zhǔn)確率如表 2所示。
表2 相同調(diào)制類型信號分選準(zhǔn)確率(F1值)
整體上分選準(zhǔn)確率低于前文中不同調(diào)制類型信號之間的分選結(jié)果??梢姡蕾嚸}內(nèi)調(diào)制參數(shù)區(qū)分相同調(diào)制類型的信號難度大于之前區(qū)分不同調(diào)制類型的信號。但在低信噪比環(huán)境下本文方法仍能依據(jù)相位編碼不同而良好地區(qū)分2種BPSK信號。
將-4 dB信噪比環(huán)境下的分選結(jié)果表示為混淆矩陣,如圖5所示,可見,主要的錯誤源自于將LFM-BPSK信號識別為相近的LFM信號。此外,被識別錯誤的5號和6號LFM-BPSK信號均被錯分為1號LFM信號,7號和8號信號僅有部分被錯分為2號信號。而相同調(diào)制類型的4種LFM-BPSK之間保持了良好的區(qū)分效果,未出現(xiàn)混淆,證明算法具備良好的在低信噪比環(huán)境下識別相同調(diào)制類型信號之間不同調(diào)制參數(shù)的能力。
圖5 -4 dB信噪比環(huán)境下分選結(jié)果的混淆矩陣
本文利用自編碼器聯(lián)合了脈內(nèi)特征提取和聚類過程,提出了一種新的預(yù)分選方法。仿真結(jié)果表明,該方法能在低信噪比環(huán)境下對雷達(dá)信號的脈內(nèi)特征進(jìn)行提取,并依靠脈內(nèi)特征參數(shù)進(jìn)行分選,具有一定的參考價值。