甘奕夫, 李 偉, 趙俊龍
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院,西安,710077)
當(dāng)前制導(dǎo)雷達(dá)在復(fù)雜電磁環(huán)境中工作性能受到嚴(yán)重影響,尤其是當(dāng)敵方目標(biāo)對制導(dǎo)雷達(dá)實施壓制干擾和欺騙干擾時,雷達(dá)和干擾間存在二元零和非合作博弈現(xiàn)象。在博弈過程中,不僅制導(dǎo)雷達(dá)可自適應(yīng)優(yōu)化其發(fā)射信號,而且具有電子對抗能力的目標(biāo)也可實時捕獲和精準(zhǔn)干擾?,F(xiàn)有相關(guān)文獻大多圍繞制導(dǎo)雷達(dá)和非智能干擾間對抗展開研究,并未考慮雙方在獲取信息不完全條件下的博弈策略選取。因此,研究不完全信息條件下雷達(dá)和干擾間相互博弈如何進行,雷達(dá)如何優(yōu)化發(fā)射波形以應(yīng)對干擾并提升檢測性能是當(dāng)前極為重要的課題。
在雷達(dá)波形設(shè)計領(lǐng)域常用優(yōu)化準(zhǔn)則有MI、MMSE、SINR等。文獻[1]最早提出利用最大化目標(biāo)脈沖響應(yīng)和回波間互信息量(MI)準(zhǔn)則和信噪比(SNR)準(zhǔn)則在能量約束條件下設(shè)計雷達(dá)波形。文獻[2]給出了一種MI和MMSE之間的關(guān)系,指出在相同功率約束下采用這兩種準(zhǔn)則優(yōu)化波形可以得到相同效果。文獻[3]則進一步指出在非高斯噪聲環(huán)境中,基于MI和MMSE準(zhǔn)則設(shè)計的波形與目標(biāo)和噪聲特征向量相關(guān)。文獻[4]采用最大化雷達(dá)接收機端信干噪比(SINR)準(zhǔn)則對分布式MIMO雷達(dá)發(fā)射信號矩陣進行優(yōu)化,文獻[5]則在此基礎(chǔ)上推導(dǎo)得出SINR的頻域表達(dá)式。
近年來,國內(nèi)外學(xué)者對雷達(dá)和干擾間博弈現(xiàn)象廣泛關(guān)注,文獻[6]率先提出基于MI準(zhǔn)則的Stackelberg博弈波形設(shè)計,文獻[7]研究發(fā)現(xiàn)基于信息理論的MI準(zhǔn)則難以應(yīng)用于非高斯雜波環(huán)境下的雷達(dá)波形求解,可采用SINR準(zhǔn)則進行雜波條件下波形設(shè)計。文獻[8]基于SINR準(zhǔn)則研究了多目標(biāo)條件下的雷達(dá)資源分配方法,但未研究制導(dǎo)雷達(dá)波形設(shè)計,文獻[9]從信息獲取不完全角度出發(fā),研究了MIMO雷達(dá)博弈過程中的天線功率分配,但未考慮雜波影響,且不適用于制導(dǎo)雷達(dá)博弈。
針對上述問題,本文從不完全信息條件出發(fā),對制導(dǎo)雷達(dá)和干擾間非合作博弈展開研究,首先在雷達(dá)信號發(fā)射-接收模型基礎(chǔ)上,建立雷達(dá)和干擾Bayesian博弈模型,依據(jù)文獻[10]提出的海薩尼轉(zhuǎn)換方法,利用概率集合形式表示未知信息,將不完全信息博弈轉(zhuǎn)換為等價的完全信息博弈;而后,采用SINR準(zhǔn)則設(shè)計博弈優(yōu)化波形,在功率約束條件下,通過注水法分配信號頻域能量,最后通過仿真分析驗證波形效果,提升認(rèn)知制導(dǎo)雷達(dá)對目標(biāo)的檢測性能。
假設(shè)雷達(dá)發(fā)射與接收信號分別為x(t)與y(t),信號帶寬和功率約束為W與PS。目標(biāo)脈沖響應(yīng)h(t)為時間Th有限的隨機模型,r(t)為接收濾波器脈沖響應(yīng),令H(f)與R(f)分別為h(t)與r(t)的傅里葉變換。噪聲n(t)為零均值高斯信道過程,其功率譜密度PSD為Snn(f),在W內(nèi)不為零。雜波c(t)為非高斯隨機過程,功率譜密度Scc(f)在W內(nèi)不為常數(shù)。功率約束PJ的干擾機信號為j(t),其PSD為J(f)。圖1為制導(dǎo)雷達(dá)發(fā)射-接收信號模型。
圖1 制導(dǎo)雷達(dá)發(fā)射-接收信號模型
如圖1所示,接收濾波器輸出端信號y(t)表達(dá)式為:
y(t)=r(t)*(x(t)*h(t)+x(t)*c(t)+
n(t)+j(t))
(1)
式中:“*”為卷積運算。
令ys(t)=r(t)*(x(t)*h(t))和yj(t)=r(t)*(x(t)*c(t)+n(t)+j(t))分別為信號分量與干擾分量。則t0時刻SINR頻域表達(dá)式為:
(2)
目標(biāo)脈沖響應(yīng)為時間有限隨機模型,可用能量譜方差(ESV)表示[11]:
(3)
式中:μh(f)是H(f)的均值,假設(shè)為零。將式(3)代入式(2),根據(jù)施瓦茲不等式可得:
(4)
(5)
式中:K為頻率采樣數(shù):Δf為頻率采樣間隔;KΔf=W。
不完全信息博弈是指博弈參與者對于其他參與者的信息(目標(biāo)類型、行動策略、效益函數(shù)等)不了解或了解的不夠準(zhǔn)確,也稱為Bayesian博弈。針對這種情況,HARSANYI[10]提出在博弈中引入一個虛擬的參與者“自然”,通過“自然”賦予每個參與者各類型出現(xiàn)的概率或概率密度函數(shù),進行博弈,這種方法即稱為“海薩尼轉(zhuǎn)換”,目前已成為處理Bayesian博弈的標(biāo)準(zhǔn)方法。
制導(dǎo)雷達(dá)和干擾間不完全信息博弈過程,可分為2個階段:第1階段為自然的行動選擇,根據(jù)參與者類型的空間概率分布選擇目標(biāo)類型;第2階段為去除自然后其他參與者的完全信息博弈,即雷達(dá)和干擾根據(jù)自然選擇的目標(biāo)概率分布進行動態(tài)博弈。由文獻[10]可知,上述過程體現(xiàn)的是一個二元零和博弈,等價于雙方直接將未知目標(biāo)可能的概率集合作為目標(biāo)類型進行完全信息動態(tài)博弈,下面用目標(biāo)概率集合對目標(biāo)類型進行表示。
假設(shè)雷達(dá)方不清楚目標(biāo)散射特征、干擾方未知雷達(dá)接收機端噪聲,但雙方可通過未知變量可能的先驗分布對未知信息進行估計,其余信息雙方已知。下面構(gòu)建雷達(dá)與干擾Bayesian博弈模型,以概率集代替目標(biāo)信息,采用注水法對信號進行優(yōu)化設(shè)計。雷達(dá)和干擾Bayesian博弈模型可表示為:
G=〈P,T,A,θ,U〉
(6)
參與集:P={雷達(dá),干擾機}表示博弈參與者。
類型集:T=Tr×Tj,其中,Tr={σ1,σ2,…,σI}表示探測目標(biāo)可能具有的目標(biāo)散射系數(shù),Tj={n1,n2,…,nI}表示雷達(dá)接收端噪聲功率。在此模型中,雷達(dá)接收機的局部噪聲功率水平?jīng)Q定了雷達(dá)的類型,目標(biāo)散射系數(shù)決定了目標(biāo)的類型。
行動集:A=Ar×Aj,其中,Ar={S(f1),S(f2),…,S(fk)}為雷達(dá)行動策略,即雷達(dá)發(fā)射波形,Aj={J(f1),J(f2),…,J(fk)}為干擾機行動策略。
概率集:θ=θr×θj,其中,θr={Pσ1,Pσ2,…,PσI}表示不同類型的目標(biāo)可能出現(xiàn)的概率集合,θj={Pn1,Pn2,…,PnI}表示雷達(dá)接收端不同等級的噪聲概率。
效用集:U={Ur,Uj},其中,Ur=max{SINR}為雷達(dá)效用函數(shù),目的是最大化雷達(dá)發(fā)射波形在接收機端的SINR,Uj=min{SINR}為干擾機行動策略,旨在通過設(shè)計干擾信號,降低雷達(dá)接收SINR。
根據(jù)統(tǒng)計判決理論,文章中討論的雷達(dá)檢測問題可定性為假設(shè)檢驗問題,解決該問題的基本方法為經(jīng)典Neyman-Pearson(NP)定理[13]。根據(jù)NP定理,制導(dǎo)雷達(dá)對目標(biāo)的檢測問題可視為在2種假設(shè)中做出選擇的二元假設(shè)檢驗問題:
其中:H0為零假設(shè);H1為備選假設(shè)。根據(jù)NP準(zhǔn)則建立NP檢測器[4],則制導(dǎo)雷達(dá)對目標(biāo)檢測概率PD為:
(7)
假設(shè)制導(dǎo)雷達(dá)可根據(jù)環(huán)境與目標(biāo)的先驗知識,自適應(yīng)改變發(fā)射波形[16]。在單邊優(yōu)化過程中,假定干擾方僅在信號頻帶W內(nèi)以有限功率釋放高斯白噪聲干擾。以max{SINR}為雷達(dá)效用函數(shù)(簡稱為max策略),雷達(dá)發(fā)射信號優(yōu)化如下:
(8)
式中:PS與PJ為雷達(dá)與干擾信號能量限制。由于干擾波形功率譜在頻帶W內(nèi)均勻分布,目標(biāo)函數(shù)僅取決于|X(fk)|2。由式(8)可知,目標(biāo)函數(shù)是關(guān)于|X(fk)|2的凸函數(shù),功率約束為線性,因此可用拉格朗日乘子法求解式(8),得:
L(|X(fk)|2,λ)=
(9)
對式(9) 取|X(fk)|2的導(dǎo)數(shù)并令其為零,得到最大化SINR的|X(fk)|2,利用注水定理重新分配頻域能量:
|X(fk)|2=
(10)
同理,智能干擾機為降低雷達(dá)性能,盡可能減少雷達(dá)接收機端SINR,假設(shè)雷達(dá)信號頻譜在帶寬W內(nèi)均勻分布,可根據(jù)min{SINR}效用函數(shù)(min策略)對干擾信號進行設(shè)計:
(11)
式(11)中目標(biāo)函數(shù)為凹函數(shù),J(fk)的功率約束是線性的,以此求得干擾優(yōu)化波形為:
J(fk)=
(12)
2.2.1 雷達(dá)策略
不完全信息條件下,假設(shè)雷達(dá)可獲得雜波、噪聲等先驗信息,但不能準(zhǔn)確估計目標(biāo)類型,為了實現(xiàn)信號優(yōu)化,需通過前期獲得的先驗知識估計目標(biāo)類型。假設(shè)雷達(dá)端已知干擾方依據(jù)min策略對干擾信號進行設(shè)計,則雷達(dá)估計的干擾信號可表示為:
(13)
構(gòu)建拉格朗日乘數(shù)方程得:
(14)
解得雷達(dá)估計的干擾波形為:
Jr(fk)=
(15)
由此可以將雷達(dá)信號優(yōu)化策略表示為:
(16)
L(|X(fk)|2,λ2,λ3)=
(Scc(fk)|X(fk)|2+Snn(fk))
(17)
求解上述方程,得到經(jīng)過二次注水法重新分配頻域能量的雷達(dá)信號:
(18)
2.2.2 干擾策略
假設(shè)干擾機對雷達(dá)接收機端噪聲沒有準(zhǔn)確信息,但其對我方雷達(dá)可能噪聲功率水平有大致了解,因此可采用min策略對干擾信號進行優(yōu)化:
(19)
式中:ni(fk)為干擾機估算的噪聲功率譜;Pni代表ni(fk)為真實值的概率,構(gòu)建拉格朗日乘數(shù)方程得:
(20)
解得干擾波形為:
(21)
最終,不完全信息條件下雷達(dá)和干擾之間博弈的信號策略表示為:
(22)
假設(shè)雷達(dá)和干擾雙方雖不清楚對手信息,但能夠捕獲對手波形,進行實時動態(tài)博弈,此時可得Bayesian博弈模型下雷達(dá)迭代注水算法,算法流程如表1所示。
表1 Bayesian模型中迭代注水法
依據(jù)式(7)中雷達(dá)波形優(yōu)化準(zhǔn)則,求解雷達(dá)最優(yōu)波形,式(23)表示制導(dǎo)雷達(dá)和干擾機在迭代過程中優(yōu)化策略。
(23)
由于目前在雷達(dá)領(lǐng)域Bayesian納什均衡還未得到數(shù)學(xué)定義[17],難以通過數(shù)學(xué)推導(dǎo)方式驗證Bayesian納什均衡點的存在性,本文直接通過仿真測試迭代注水方法是否收斂,驗證制導(dǎo)雷達(dá)與干擾機Bayesian博弈中納什均衡解的存在性。
首先對等功率條件下制導(dǎo)雷達(dá)和干擾機不完全信息博弈展開分析,驗證Bayesian模型中迭代注水算法是否收斂。圖2中顯示在不完全信息博弈中雷達(dá)接收機端SINR隨迭代過程的收斂情況,可以看出雷達(dá)與干擾經(jīng)歷8次迭代后,SINR最終收斂于9.503 dB,證明在制導(dǎo)雷達(dá)與干擾Bayesian模型中存在著博弈納什均衡解,通過迭代注水算法可實現(xiàn)雷達(dá)不完全信息博弈的最優(yōu)策略。圖3中展示不完全信息博弈中的納什均衡現(xiàn)象。
圖3 Bayesian博弈各策略的SINR收益
圖2 Bayesian博弈中雷達(dá)SINR隨迭代周期變化關(guān)系
圖4 雷達(dá)和干擾在不同子頻帶中頻率分配策略
下面對不同功率下雷達(dá)波形性能展開分析。假設(shè)干擾機功率PJ=(10~30)dB,圖5中顯示了二次注水、迭代注水波形在不完全信息博弈過程中雷達(dá)功率分配策略隨干擾功率變化情況。
圖5 不同干擾下雷達(dá)功率分配策略
由圖5(a)可知,在二次注水法中,隨干擾功率上升,雷達(dá)會提高頻帶3、4中的功率分布,降低其余頻帶功率。由雷達(dá)對目標(biāo)特性的估計值可見,頻帶3、4的目標(biāo)沖激響應(yīng)最為強烈,同時頻帶4的TCR要高于頻帶3,所以雷達(dá)會增加頻帶3、4的功率且頻帶4要高于頻帶3;在其余子頻帶內(nèi),功率降低順序分別為頻帶1、2、5,這同在該頻帶的估計目標(biāo)沖激響應(yīng)值一致,表明在二次注水法中,雷達(dá)會依據(jù)所估計的目標(biāo)特性同干擾進行博弈對抗。
觀察圖5(b)可知,在迭代注水法中,隨干擾功率升高,雷達(dá)傾向于提高低TCR頻帶1、2、3中的功率,降低高TCR頻帶4、5的功率。這說明在迭代過程中,雷達(dá)更傾向于躲避干擾的影響,而非正面對抗。在雷達(dá)估計的目標(biāo)特性中,頻帶3中目標(biāo)沖激響應(yīng)的占比要遠(yuǎn)高于實際,僅次于頻帶4,但干擾卻在頻帶3內(nèi)釋放的干擾功率遠(yuǎn)低于頻帶4,所以雷達(dá)對頻帶3中的功率提升更為明顯。
圖6顯示了Bayesian博弈中雷達(dá)對擴展目標(biāo)的檢測概率,可見在不完全信息條件下通過博弈理論優(yōu)化的雷達(dá)波形仍可實現(xiàn)較高的性能提升,雷達(dá)對信息估計的準(zhǔn)確度會影響提升效果。
圖6 Bayesian博弈中雷達(dá)波形對目標(biāo)檢測概率
對比二次注水法和迭代注水法知,在干擾功率低于雷達(dá)時(PJ≤20 dBw),經(jīng)過動態(tài)博弈的迭代注水波形可進一步提升檢測性能;當(dāng)干擾功率高于雷達(dá)時(PJ>22 dBw),雖然在博弈過程中雷達(dá)迭代注水方法可進一步針對干擾設(shè)計優(yōu)化波形,但由于雷達(dá)對目標(biāo)的估計并不等同于實際值,雷達(dá)方會對戰(zhàn)場博弈形勢產(chǎn)生一定的誤判[20],而干擾方卻已知目標(biāo)信息,導(dǎo)致雷達(dá)在博弈中處于下風(fēng),對比二次注水法,雷達(dá)檢測性能并未提升,反而還有些許的下降。
綜上,基于Bayesian博弈的二次注水及迭代注水波形設(shè)計方法可應(yīng)用于提升不完全信息條件下的雷達(dá)目標(biāo)檢測性能,但對未知信息估計的準(zhǔn)確程度極大地影響雷達(dá)探測性能。
針對電子戰(zhàn)中我方制導(dǎo)雷達(dá)和敵方干擾機不能獲取對手完全信息的問題,本文研究了不完全信息條件下制導(dǎo)雷達(dá)與干擾機Bayesian博弈模型,利用目標(biāo)可能出現(xiàn)的概率集合對未知目標(biāo)進行表示,并以此為基礎(chǔ),將二次注水法及迭代注水法應(yīng)用于Bayesian博弈模型。仿真表明所設(shè)計的波形優(yōu)化算法在Bayesian博弈中具有收斂性,能夠達(dá)到納什均衡,對比線性調(diào)頻信號,迭代注水信號及二次注水信號檢測概率最高可分別提升15.41%,12.79%。證明了所設(shè)計波形優(yōu)化方法在制導(dǎo)雷達(dá)與干擾不完全信息博弈中的可行性。