趙俊龍, 李 偉, 王泓霖, 黃 騰, 甘奕夫, 王 也
(1. 空軍工程大學(xué)信息與導(dǎo)航學(xué)院, 陜西 西安710077; 2. 中國人民解放軍95851部隊, 上海 201900; 3. 廣州大學(xué)計算機(jī)科學(xué)與網(wǎng)絡(luò)工程學(xué)院, 廣東 廣州 510006; 4. 中國人民解放軍95939部隊, 河北 滄州 061722)
作為一種有源探測設(shè)備,雷達(dá)是通過發(fā)射電磁波,接收目標(biāo)反射電磁波,并對回波內(nèi)容進(jìn)行分析來對目標(biāo)進(jìn)行檢測和識別的[1]。而目標(biāo)回波與雷達(dá)的發(fā)射波形有關(guān),因此發(fā)射波形對雷達(dá)性能有重要影響,根據(jù)環(huán)境信息設(shè)計雷達(dá)波形具有重要意義[2-3]。波形設(shè)計是一種改變雷達(dá)發(fā)射信號使之更適應(yīng)環(huán)境進(jìn)而提高雷達(dá)性能的過程,其本質(zhì)為準(zhǔn)則函數(shù)加約束的最優(yōu)求解問題,而準(zhǔn)則函數(shù)的選取與雷達(dá)任務(wù)有關(guān)[4-5]。針對參數(shù)估計問題,Bell[6]通過最大化目標(biāo)響應(yīng)與雷達(dá)回波間互信息(mutual information, MI)準(zhǔn)則來設(shè)計波形,可有效降低目標(biāo)不確定度,提高目標(biāo)識別性能。文獻(xiàn)[7]證明MI準(zhǔn)則和最小均方差(minimum mean square error, MMSE)準(zhǔn)則在參數(shù)估計問題上是等價的,文獻(xiàn)[8]將MI準(zhǔn)則和MMSE準(zhǔn)則擴(kuò)展到多輸入多輸出(multiple input multiple output, MIMO)雷達(dá)目標(biāo)識別和分類。針對高斯噪聲條件下特定目標(biāo)檢測問題,Guerci與Pillai等采用信噪比(signal to noise ratio, SNR)準(zhǔn)則,通過最大化雷達(dá)接收信號SNR來設(shè)計雷達(dá)信號,提高了雷達(dá)檢測性能[9-10]。但上述文獻(xiàn)都沒有考慮雜波對波形優(yōu)化的影響。文獻(xiàn)[11]針對確定目標(biāo)和擴(kuò)展目標(biāo)在噪聲和雜波兩種條件下,分別使用MI準(zhǔn)則和信雜噪比(signal to clutter and noise ratio, SCNR)準(zhǔn)則來設(shè)計最優(yōu)波形,為確定目標(biāo)和擴(kuò)展目標(biāo)的雷達(dá)波形設(shè)計提供了較為完整的理論。隨著數(shù)字信號處理技術(shù)的發(fā)展以及戰(zhàn)場電磁環(huán)境的日益復(fù)雜,雷達(dá)工作模式和任務(wù)趨于多樣化,這就要求雷達(dá)同時具有良好的目標(biāo)檢測、識別和參數(shù)估計性能[12-13]?;趩螠?zhǔn)則設(shè)計的雷達(dá)波形能夠提高雷達(dá)某一方面性能,但無法保證雷達(dá)綜合性能,而聯(lián)合不同準(zhǔn)則又難以建立目標(biāo)函數(shù)。
深度學(xué)習(xí)對數(shù)據(jù)之間非線性關(guān)系的刻畫能力以及對函數(shù)的擬合能力為聯(lián)合不同準(zhǔn)則提供了一個解決思路。近年來深度學(xué)習(xí)成為研究熱門,其可有效提取數(shù)據(jù)高維特征,學(xué)習(xí)數(shù)據(jù)內(nèi)在規(guī)律,在圖像處理[14]、機(jī)器翻譯[15]、自動駕駛[16]等領(lǐng)域幫助人類取得了前所未有的成就,同時在雷達(dá)領(lǐng)域也得到了廣泛應(yīng)用[17-19],如基于深度學(xué)習(xí)的合成孔徑雷達(dá)(synthetic aperture radar, SAR)圖像目標(biāo)檢測[20]和識別[21],基于深度學(xué)習(xí)的SAR地物分離以及深度學(xué)習(xí)在多普勒雷達(dá)姿態(tài)感知中的應(yīng)用[22]等。隨著技術(shù)的發(fā)展,學(xué)者們提出了各種網(wǎng)絡(luò)模型,其中長短時記憶(long short-term memory, LSTM)網(wǎng)絡(luò)是應(yīng)用最為廣泛的模型之一[23]。LSTM網(wǎng)絡(luò)利用大跨度先驗信息解決了梯度爆炸問題,適用于處理時間一維序列數(shù)據(jù),已廣泛應(yīng)用于語音識別[24]和自然語言處理[25]領(lǐng)域。
為解決單準(zhǔn)則信號難以滿足雷達(dá)多工作模式和多任務(wù)問題,本文提出一種基于LSTM網(wǎng)絡(luò)的雷達(dá)波形設(shè)計方法,利用LSTM網(wǎng)絡(luò)對數(shù)據(jù)內(nèi)在規(guī)律的學(xué)習(xí)能力,對MI準(zhǔn)則和SCNR準(zhǔn)則根據(jù)環(huán)境信息設(shè)計波形的方式進(jìn)行學(xué)習(xí),使LSTM模型同時具備MI準(zhǔn)則和SCNR準(zhǔn)則根據(jù)環(huán)境信息設(shè)計波形的優(yōu)點(diǎn),進(jìn)而達(dá)到聯(lián)合目的。
圖1為隨機(jī)擴(kuò)展目標(biāo)信號模型,其中x(t)為持續(xù)時間為T的雷達(dá)發(fā)射信號,n(t)為雷達(dá)接收機(jī)噪聲,h(t)為持續(xù)時間為Th的隨機(jī)目標(biāo)沖激響應(yīng),c(t)為高斯雜波沖激響應(yīng),y(t)是雷達(dá)接收機(jī)接收信號。r(t)為理想低通濾波器,其持續(xù)時間為Tf,且假設(shè)T?Th,T?Tf。x(t)的傅里葉變換為X(f),n(t)的功率譜密度(power spectral density, PSD)為Snn(f),h(t)的傅里葉變換為H(f),c(t)的PSD為Scc(f)。h(t)可看作平穩(wěn)隨機(jī)過程g(t)與持續(xù)時間為Th的窗函數(shù)的乘積。
圖1 隨機(jī)擴(kuò)展目標(biāo)信號模型Fig.1 Stochastic extended target signal model
由于隨機(jī)擴(kuò)展目標(biāo)為[0,Th]的局部平穩(wěn)隨機(jī)過程,不能使用PSD來描述。從而引入能量譜方差(energy spectral variance, ESV)和功率譜方差(power spectral variance, PSV)來描述有限時間、有限能量的隨機(jī)過程。定義ESV為
(1)
故PSV定義為
(2)
PSV可描述有限時間、有限能量隨機(jī)過程的平均功率。
推導(dǎo)隨機(jī)擴(kuò)展目標(biāo)與回波間互信息量可從目標(biāo)為平穩(wěn)隨機(jī)過程時入手,設(shè)平穩(wěn)隨機(jī)目標(biāo)為g(t),其PSD為Sgg(f)。由于r(t)持續(xù)時間遠(yuǎn)小于雷達(dá)發(fā)射波形持續(xù)時間,故可忽略低通濾波器影響,由圖1知雷達(dá)接收機(jī)接收信號為
y(t)=ys(t)+yn(t)=
x(t)*g(t)+x(t)*c(t)+n(t)
(3)
式中,ys(t)=x(t)*g(t)為信號分量,且ys(t)的PSD為SY。yn(t)=x(t)*c(t)+n(t)為噪聲分量,其PSD為SN。故在觀測時間T0內(nèi)目標(biāo)與回波間MI[11]為
(4)
若為有限時間隨機(jī)目標(biāo),應(yīng)將Sgg(f)替換為γh(f),且觀測時間為接收信號持續(xù)時間,故隨機(jī)擴(kuò)展目標(biāo)與回波之間MI為
MI=I(y(t);h(t)|x(t))=
(5)
|X(f)|2=max[0,B(f)(A-D(f))]
(6)
在求解有限時間隨機(jī)目標(biāo)回波的SCNR時,同樣是先求出平穩(wěn)隨機(jī)目標(biāo)的SCNR,再將PSD替換為PSV,故雷達(dá)接收信號的SCNR[11]為
(7)
|X(f)|2=max[0,B(f)(A-D(f))]
(8)
由MI準(zhǔn)則和SCNR準(zhǔn)則設(shè)計波形的過程可知,兩準(zhǔn)則設(shè)計波形時均從頻域出發(fā),得到最優(yōu)信號的幅度譜平方,忽略相位信息[26],兩準(zhǔn)則設(shè)計的信號均將能量分配在使得目標(biāo)函數(shù)最大化的頻點(diǎn)處。
根據(jù)統(tǒng)計判決理論,雷達(dá)檢測可視為假設(shè)檢驗問題解決該問題的基本方法為經(jīng)典NP(Neyman-Pearson)定理[27],根據(jù)NP定理構(gòu)建NP檢測器,則雷達(dá)檢測概率[28]為
(9)
LSTM網(wǎng)絡(luò)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),其在RNN基礎(chǔ)上增加了遺忘門、輸入門和輸出門[29],解決了長期依賴問題,適用于一維序列數(shù)據(jù)的處理,常用于預(yù)測和回歸任務(wù),其結(jié)構(gòu)如圖2所示。
圖2 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of LSTM network
圖2中大矩陣稱為元胞,每個元胞內(nèi)部包含遺忘門、輸入門、tanh層和輸出門4個門函數(shù)[30],由其結(jié)構(gòu)可知,遺忘門接收到前一元胞輸出ht-1和當(dāng)前輸入xt后有
ft=σ(Wf[ht-1,xt]+bf)
(10)
式中,Wf為遺忘門權(quán)重;bf為遺忘門偏置;σ(·)為sigmoid激活函數(shù)。
it=σ(Wi[ht-1,xt]+bi)
(11)
(12)
式中,Wi為輸入門權(quán)重;bi為輸入門偏置;Wc為候選值權(quán)重;bc為候選值偏置;tanh(·)是激活函數(shù)。
(13)
最后經(jīng)過一個包含sigmoid層的輸出門,此步驟決定要輸出的元胞狀態(tài)。再將元胞狀態(tài)經(jīng)過一個tanh層并與輸出門的輸出相乘,最終決定元胞輸出
ot=σ(Wo[ht-1,xt]+bo)
(14)
ht=ottanh(Ct)
(15)
得到當(dāng)前輸出ht和當(dāng)前元胞狀態(tài)Ct之后,便可進(jìn)行下一個循環(huán),且下個循環(huán)與上述說明的計算相同。
使用LSTM網(wǎng)絡(luò)設(shè)計雷達(dá)波形,即利用LSTM網(wǎng)絡(luò)高效的數(shù)據(jù)內(nèi)在規(guī)律學(xué)習(xí)能力,學(xué)習(xí)環(huán)境信息與該環(huán)境下基于MI準(zhǔn)則和SCNR準(zhǔn)則產(chǎn)生波形之間的非線性映射關(guān)系,調(diào)整LSTM網(wǎng)絡(luò)自身權(quán)值參數(shù),使得LSTM網(wǎng)絡(luò)權(quán)值兼具M(jìn)I準(zhǔn)則和SCNR準(zhǔn)則特性,達(dá)到聯(lián)合MI準(zhǔn)則和SCNR準(zhǔn)則設(shè)計波形的目的,從而提高雷達(dá)綜合性能。
MI準(zhǔn)則和SCNR準(zhǔn)則是根據(jù)目標(biāo)、雜波和噪聲等先驗信息設(shè)計和優(yōu)化波形的。利用LSTM網(wǎng)絡(luò)進(jìn)行波形設(shè)計,其影響因素同樣為環(huán)境中目標(biāo)、雜波和噪聲等因素。
圖3 基于LSTM網(wǎng)絡(luò)的雷達(dá)波形設(shè)計流程圖Fig.3 Radar waveform design flow chart based on LSTM network
3.2.1 數(shù)據(jù)預(yù)處理
(16)
式中,min=0;max=1;x與xnorm分別表示歸一化之前和歸一化之后的數(shù)據(jù)值;xmax與xmin分別表示歸一化之前數(shù)據(jù)中的最大值和最小值。
3.2.2 LSTM網(wǎng)絡(luò)設(shè)計與參數(shù)選擇
(17)
通過優(yōu)化器將損失函數(shù)最小化,縮小實際輸出與預(yù)測輸出間差距,常用優(yōu)化算法有梯度下降法、隨機(jī)梯度下降法等。為提高網(wǎng)絡(luò)運(yùn)行速度,本文使用Adam優(yōu)化算法。其中學(xué)習(xí)率α=0.01,迭代次數(shù)為50,每次迭代批次數(shù)為72。
假設(shè)某雷達(dá)中心頻率fc=35 GHz,帶寬W=100 MHz[28],發(fā)射信號時寬T=2.5 μs,功率Ps=20 dBW,工作頻帶為[34.95 GHz,35.05 GHz],采樣頻率fs=2W=200 MHz,工作頻帶內(nèi)采樣點(diǎn)為500。實驗中,設(shè)定4 000組不同的雜波以及噪聲條件,利用SCNR準(zhǔn)則和MI準(zhǔn)則分別產(chǎn)生4 000組發(fā)射波形。雷達(dá)實際工作場景中,雜波要遠(yuǎn)大于目標(biāo)回波[31],而噪聲遠(yuǎn)小于目標(biāo)回波,為盡可能體現(xiàn)雷達(dá)工作環(huán)境中目標(biāo)、雜波和噪聲的特性及它們之間的關(guān)系,本實驗采用的雜波PSD幅度為目標(biāo)ESV幅度的10倍,噪聲PSD幅度為目標(biāo)ESV幅度的千分之一。對于i∈[1,4 000],假設(shè)目標(biāo)響應(yīng)ESV為σ2g(f)=iB(exp(-α(f-fc)2));雜波PSD為Scc(f)=10iB·(exp(-0.8α(f-fc2)2));噪聲PSD為Snn(f)=0.001B·exp(-α(f-fc3)2);其中fc2=fc+W-500i為雜波中頻,fc3=fc-W+500i為噪聲中頻,B是由目標(biāo)雷達(dá)反射面積決定的常數(shù),取B=7.957 7×10-16,α表示譜方差隨頻率變化率,取α=1×10-13。
圖4 環(huán)境信息Fig.4 Environmental information
在雷達(dá)發(fā)射信號功率Ps=20 dBW條件下,將用于測試的環(huán)境信息輸入訓(xùn)練完成的LSTM網(wǎng)絡(luò)設(shè)計信號,并與同樣環(huán)境下經(jīng)MI準(zhǔn)則和SCNR準(zhǔn)則生成的信號進(jìn)行對比,得到3種波形頻域能量分布如圖5所示。
圖5 LSTM網(wǎng)絡(luò)、MI準(zhǔn)則和SCNR準(zhǔn)則生成信號頻域能量分布Fig.5 Signal frequency domain energy distribution generated by LSTM network, MI criterion, and SCNR criterion
圖5中,由MI準(zhǔn)則生成的信號頻帶較寬,能量分配在較多頻點(diǎn)上,SCNR準(zhǔn)則生成的信號將能量分配給較少頻點(diǎn),頻帶較窄。而LSTM網(wǎng)絡(luò)生成信號的頻帶寬度介于MI準(zhǔn)則和SCNR準(zhǔn)則之間,兼具兩種準(zhǔn)則生成信號的特征,故可實現(xiàn)MI準(zhǔn)則和SCNR準(zhǔn)則的平滑過渡,達(dá)到兩種準(zhǔn)則聯(lián)合的目的。
圖6展示了在不同雷達(dá)發(fā)射機(jī)功率情況下,3種信號回波與目標(biāo)間的MI。3種信號回波與目標(biāo)間MI都隨發(fā)射功率增大而增大,但本文方法生成信號對應(yīng)的MI要高于SCNR準(zhǔn)則生成信號對應(yīng)的MI,且平均高出68.2 nats。由文獻(xiàn)[6]可知,更高的MI意味著可獲取更多目標(biāo)信息,提升雷達(dá)目標(biāo)識別性能。
圖6 不同發(fā)射功率MIFig.6 MI for different transmit powers
圖7為3種信號回波的SCNR隨發(fā)射機(jī)功率變化情況。根據(jù)式(9),在虛警概率PFA=10-4時,計算得圖8所示雷達(dá)檢測概率隨發(fā)射機(jī)功率變化情況。
圖7 不同發(fā)射功率SCNRFig.7 SCNR for different transmit powers
由圖8可知,本文方法生成信號作為發(fā)射信號時,雷達(dá)檢測概率要比MI準(zhǔn)則信號作為發(fā)射信號時平均高1.01 %。
雷達(dá)工作機(jī)理是先進(jìn)行目標(biāo)檢測,然后在檢測到的目標(biāo)中進(jìn)行目標(biāo)識別。雷達(dá)的最終目標(biāo)識別率可定義為檢測概率與識別概率的乘積,而目標(biāo)最終識別率可視為雷達(dá)綜合性能,即
Pc=PdPr
(18)
式中,Pc是目標(biāo)最終識別率,可作為衡量雷達(dá)綜合性能的指標(biāo);Pd是雷達(dá)檢測概率;Pr為目標(biāo)識別率。雖然Pr隨MI的增加而增加,但兩者缺乏直接函數(shù)關(guān)系。為此,本文提出一種利用MI來衡量Pr的方法。定義目標(biāo)識別率為
(19)
式中,MIx(t)為雷達(dá)發(fā)射波形為x(t)時,目標(biāo)與回波之間的MI;MImax為目標(biāo)與回波之間的最大MI,即發(fā)射MI準(zhǔn)則信號對應(yīng)的MI。
圖8 不同發(fā)射功率雷達(dá)檢測概率Fig.8 Radar detection probability for different transmit powers
根據(jù)本文定義的目標(biāo)識別率和雷達(dá)最終目標(biāo)識別率,可得圖6和圖8中數(shù)據(jù)的平均檢測概率,平均識別率和雷達(dá)的平均綜合性能表現(xiàn),如表1所示。
表1 LSTM網(wǎng)絡(luò)、MI準(zhǔn)則和SCNR準(zhǔn)則生成信號平均綜合性能
由表1可知,LSTM信號的檢測概率與識別率均處于兩準(zhǔn)則信號之間,說明LSTM網(wǎng)絡(luò)兼具兩準(zhǔn)則的優(yōu)點(diǎn),實現(xiàn)了MI準(zhǔn)則和SCNR準(zhǔn)則的平滑過度。LSTM信號最終識別率為43.04%,比MI準(zhǔn)則信號高0.67%,比SCNR信號高1.47%,說明LSTM可聯(lián)合MI準(zhǔn)則和SCNR準(zhǔn)則,提高雷達(dá)綜合性能。且LSTM信號與MI準(zhǔn)則信號綜合性能差別較小,這與圖5中兩信號能量分布較為相似是一致的。
針對單準(zhǔn)則設(shè)計的雷達(dá)波形難以滿足雷達(dá)多任務(wù)與多工作狀態(tài)問題,本文提出了一種基于LSTM網(wǎng)絡(luò)的雷達(dá)波形設(shè)計方法,該方法利用LSTM網(wǎng)絡(luò)高效的對數(shù)據(jù)內(nèi)在規(guī)律的學(xué)習(xí)能力聯(lián)合MI準(zhǔn)則和SCNR準(zhǔn)則設(shè)計波形。為衡量雷達(dá)的綜合性能,本文提出了一種雷達(dá)綜合性能指標(biāo)和利用MI來衡量的目標(biāo)識別率。仿真結(jié)果表明,LSTM生成信號的檢測概率和目標(biāo)識別率均處于兩準(zhǔn)則之間,很好地實現(xiàn)了兩準(zhǔn)則的平滑過度。LSTM信號的綜合性能要比MI準(zhǔn)則高0.67%,比SCNR準(zhǔn)則信號高1.47%,證明了本方法的有效性,為雷達(dá)波形設(shè)計提供了一種新的設(shè)計思路。