陳美杉, 劉贏, 曾維貴, 錢坤
(海軍航空大學(xué), 山東 煙臺(tái) 264001)
微型空射誘餌(MALD)是美軍的一款具備射頻綜合功能的電子戰(zhàn)輔助突擊武器,可執(zhí)行集“偵干打”于一體的網(wǎng)絡(luò)集群作戰(zhàn),近年來受到各國普遍重視[1-3]。目前,國內(nèi)關(guān)于MALD的研究主要包括效能評(píng)估和掛載方案等[4-9],而對(duì)其協(xié)同干擾中資源分配策略研究較少,且研究中缺少對(duì)任務(wù)背景、裝備特點(diǎn)和載荷功能的考慮與分析。
一個(gè)完整的干擾資源分配過程涉及雷達(dá)威脅評(píng)估、干擾效能評(píng)估、資源分配模型構(gòu)建和求解等內(nèi)容。
目標(biāo)威脅評(píng)估是干擾資源分配的重要依據(jù),現(xiàn)有資源分配研究中涉及威脅評(píng)估部分僅僅將其作為定值分析,沒有考慮其隨戰(zhàn)場(chǎng)環(huán)境改變而動(dòng)態(tài)變化的特點(diǎn)。
資源分配中涉及到的干擾效能評(píng)估往往是通過分析對(duì)抗過程尋求效能矩陣。目前效能矩陣確定方法可總結(jié)為兩大類別:一是從干擾方出發(fā),通過分析干擾參量的匹配程度和隸屬程度研究干擾效能情況。文獻(xiàn)[10-12]通過時(shí)、空、頻、能和干擾樣式等指標(biāo),結(jié)合模糊評(píng)價(jià)、博弈論等理論方法構(gòu)建效能矩陣。二是從被干擾方的指標(biāo)變化出發(fā),反推干擾效能。文獻(xiàn)[13-14]著眼干擾效果,選取雷達(dá)定位精度、發(fā)現(xiàn)概率等評(píng)估指標(biāo),通過干擾過程分析,構(gòu)建效能矩陣。本文擬從匹配度入手,構(gòu)建MALD干擾效能矩陣。但目前該方法的研究背景多是以噪聲壓制干擾為主,不完全適用于MALD儲(chǔ)頻轉(zhuǎn)發(fā)有源多假目標(biāo)干擾作戰(zhàn)特點(diǎn)。因此,在具體理論研究中,需對(duì)效能評(píng)估模型適用性進(jìn)行改進(jìn)。
干擾資源分配模型構(gòu)建方面,目前主要是基于威脅評(píng)估與效能評(píng)估構(gòu)建符合科學(xué)實(shí)際的分配模型,并通過設(shè)置一定的約束條件,得到最終的尋優(yōu)函數(shù)[11-17]。
在模型求解方面,傳統(tǒng)方法包括模擬退火算法[18]、貼近度、0-1規(guī)劃[19]等,雖然相對(duì)容易實(shí)現(xiàn),但是僅適用于解決小規(guī)模分配問題。隨著戰(zhàn)場(chǎng)要素增多,啟發(fā)式智能算法逐步占據(jù)主流,目前較常用的有遺傳算法[20]、粒子群優(yōu)化(PSO)算法[21]、蟻群算法(ACA)等,通過改進(jìn)優(yōu)化能較好地解決干擾資源分配問題。但在動(dòng)態(tài)干擾資源分配時(shí),較少有研究關(guān)注如何提高算法的時(shí)效性,僅是將動(dòng)態(tài)對(duì)抗場(chǎng)景作為研究背景,實(shí)際上研究的仍然是單一時(shí)刻的資源分配問題。
針對(duì)上述研究現(xiàn)狀,本文針對(duì)MALD干擾資源分配問題做出以下改進(jìn):1)引入變權(quán)理論計(jì)算目標(biāo)動(dòng)態(tài)威脅值,解決由于目標(biāo)威脅值不變導(dǎo)致干擾資源分配不精確的問題;2)通過分析MALD載荷功能特點(diǎn),將基于壓制干擾時(shí)各因子的匹配度模型改進(jìn)為假目標(biāo)欺騙干擾模型,增強(qiáng)效能評(píng)估矩陣適用性與科學(xué)性;3)通過改進(jìn)PSO算法,使其具備更快收斂速度。
MALD在對(duì)敵進(jìn)行防空壓制時(shí),通常采用多彈協(xié)同抵近干擾戰(zhàn)術(shù)策略,而關(guān)于其所使用的干擾樣式和具體技術(shù)細(xì)節(jié),官方并未披露。通過機(jī)理性分析可知,傳統(tǒng)有源壓制干擾在彌補(bǔ)接收端各類增益基礎(chǔ)上仍需要有20 dB以上的冗余,而對(duì)于大型警戒雷達(dá)和相控陣?yán)走_(dá),實(shí)施有效壓制的信干比要求達(dá)到60 dB以上。MALD這類小型干擾設(shè)備由于彈載空間和供電限制,功率無法做大,若考慮用距離彌補(bǔ)功率不足,則MALD又面臨被強(qiáng)功率燒穿的風(fēng)險(xiǎn),因此其通常不會(huì)采用傳統(tǒng)的噪聲壓制干擾而是有源多假目標(biāo)欺騙干擾。圖1所示為MALD進(jìn)行有源多假目標(biāo)欺騙干擾原理示意圖。
圖1 空射有源誘餌原理結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the principle and structure of MALD
經(jīng)上述分析,初步判斷MALD可利用數(shù)字無線電頻率存儲(chǔ)器(DRFM)技術(shù),進(jìn)行間歇采樣轉(zhuǎn)發(fā)式干擾,通過對(duì)雷達(dá)脈沖前沿進(jìn)行復(fù)制并以小于脈沖寬度的時(shí)延轉(zhuǎn)發(fā)出去,從雷達(dá)旁瓣進(jìn)入,產(chǎn)生多假目標(biāo)(群),兼具數(shù)量壓制和欺騙干擾的雙重效果。
假設(shè)有Q個(gè)目標(biāo)執(zhí)行突防組網(wǎng)雷達(dá)的任務(wù),組網(wǎng)雷達(dá)系統(tǒng)由M部雷達(dá)組成,為提高突防概率,N發(fā)空射誘餌彈執(zhí)行先期干擾任務(wù)。協(xié)同干擾建立在已知組網(wǎng)雷達(dá)基本參數(shù)的前提下(MALD具備戰(zhàn)場(chǎng)偵察能力),如雷達(dá)位置、載頻、脈寬、重頻等。
(1)
(2)
式(2)表示每發(fā)MALD不能同時(shí)干擾兩部雷達(dá)。
為保證所有雷達(dá)均能被干擾,并且干擾資源被充分利用,設(shè)定分配給每部雷達(dá)的MALD個(gè)數(shù)不超過S,即
(3)
因此當(dāng)多發(fā)MALD干擾組網(wǎng)雷達(dá)時(shí),可以用三元變量來描述整個(gè)系統(tǒng)的干擾狀態(tài):
zk=f(Φk,Ek,Xk),k=1,2,…,T
(4)
(5)
式中:zk表示k時(shí)刻的綜合干擾效能值;Z表示綜合干擾效能值。動(dòng)態(tài)干擾資源分配就是在滿足約束條件的前提下,始終選擇使干擾效能值最優(yōu)的分配方案。
理論上,不同時(shí)刻各目標(biāo)相對(duì)于MALD的威脅程度是一個(gè)動(dòng)態(tài)變化的過程,本節(jié)基于變權(quán)理論求解各時(shí)刻不同雷達(dá)目標(biāo)的動(dòng)態(tài)威脅值。
對(duì)于誘餌彈j,定義組網(wǎng)雷達(dá)的威脅指標(biāo)分別為δu,u=1,2,…,4(分別為距離、載頻、脈寬、重頻4項(xiàng)指標(biāo)),參照文獻(xiàn)[23-24]的方法構(gòu)建威脅評(píng)估矩陣并標(biāo)準(zhǔn)化得到X=[xiu]M×P,xiu表示第i部雷達(dá)的指標(biāo)δu的標(biāo)準(zhǔn)化數(shù)值,P表示指標(biāo)數(shù)目。
定義單個(gè)指標(biāo)包含的信息量為
(6)
(7)
(8)
根據(jù)式(6)計(jì)算改進(jìn)CRITIC方法后的指標(biāo)常權(quán)向量ω=(ω1,ω2,…,ωu,…,ωP):
(9)
相應(yīng)的變權(quán)向量W(X)可以表示為
W(X)=[ω1(X),ω2(X),…,ωP(X)]=
W(x1,x2,…,xP)
(10)
變權(quán)方法[22]為構(gòu)造狀態(tài)變權(quán)向量實(shí)現(xiàn)對(duì)狀態(tài)的加權(quán)調(diào)整,避免狀態(tài)不均衡。狀態(tài)變權(quán)向量可以表示為映射關(guān)系:
Sx:[0,1]p→[0,1]p,X→Sx(X)=Sx·X=[S1(X),S2(X),…,SP(X)]·(x1,x2,…,xP)=[S1(X)·x1,S2(X)·x2,…,SP(X)·xP]
(11)
變權(quán)向量W(X)可以通過狀態(tài)變權(quán)向量Sx與常權(quán)向量ω的Hadamard乘積得到:
(12)
根據(jù)文獻(xiàn)[25],由于本文威脅指標(biāo)δu,u=1,2,…,4分別為距離、載頻、脈寬和重頻4項(xiàng),干擾過程中距離的變化最為顯著。假設(shè)其他3項(xiàng)指標(biāo)不會(huì)有大幅度變動(dòng),本文采用混合型變權(quán)模型,分別構(gòu)造均衡函數(shù)如下:
1)隨著雙方交戰(zhàn)距離靠近,當(dāng)MALD達(dá)到有效干擾作用距離后,距離指標(biāo)對(duì)威脅程度的影響越來越小。因此用非線性函數(shù)對(duì)距離指標(biāo)進(jìn)行懲罰性變權(quán),均衡函數(shù)表示為
Bu=x1+βulnx1,u=1
(13)
式中:βu為變權(quán)因子,βu>0為激勵(lì)變權(quán),βu<0為懲罰變權(quán)。
2)MALD在不斷抵近雷達(dá)網(wǎng)的過程中,彈上計(jì)算機(jī)會(huì)實(shí)時(shí)處理接收的雷達(dá)數(shù)據(jù),并作出策略調(diào)整,且越接近雷達(dá),MALD越需做出更加快速和敏捷的策略調(diào)整以保證被掩護(hù)目標(biāo)的安全。根據(jù)其工作原理可知,雷達(dá)脈寬影響對(duì)干擾延遲時(shí)間的把控,重頻的變化又直接影響干擾脈沖串的使用策略。因此距離越近,脈寬和重頻的細(xì)微變化對(duì)突防一方威脅程度的影響越大,用正相關(guān)非線性函數(shù)進(jìn)行激勵(lì)性變權(quán),均衡函數(shù)表示為
(14)
3)由于MALD采用儲(chǔ)頻轉(zhuǎn)發(fā)干擾體制,載頻對(duì)于MALD而言,在其干擾的各個(gè)階段重要性基本保持平穩(wěn),用1階線性函數(shù)表示為
Bu=x1,u=2
(15)
基于此分析,綜合均衡函數(shù)表示為
(16)
各指標(biāo)的狀態(tài)變權(quán)向量表示為
(17)
綜上所述,各指標(biāo)的變權(quán)重表示為
(18)
本節(jié)通過相對(duì)貼近度求解各目標(biāo)威脅程度。傳統(tǒng)相對(duì)貼近度[26]僅考慮目標(biāo)參數(shù)之間的歐氏距離,不能直接反映各目標(biāo)指標(biāo)序列的態(tài)勢(shì)變化情況,灰色關(guān)聯(lián)度通過指標(biāo)間整體趨勢(shì)的相似程度在一定程度上體現(xiàn)了指標(biāo)的相對(duì)重要性,因此本節(jié)引入灰色關(guān)聯(lián)分析改進(jìn)傳統(tǒng)相對(duì)貼近度進(jìn)行求解,具體步驟如下:
步驟1參照文獻(xiàn)[22]確定威脅評(píng)估矩陣X=[xiu]M×P的正負(fù)理想解X+和X-。
(19)
(20)
(21)
(22)
式中:ρ為分辨系數(shù),ρ∈[0,1],一般取0.5。
其次對(duì)灰色關(guān)聯(lián)系數(shù)加權(quán)求和,得到灰色關(guān)聯(lián)度:
(23)
(24)
(25)
(26)
(27)
(28)
式中:α、β分別表示兩種度量的權(quán)重,滿足α+β=1。
步驟6根據(jù)相對(duì)貼近度求解各目標(biāo)的威脅值:
(29)
實(shí)現(xiàn)最佳干擾效能的關(guān)鍵是保證干擾的有效性。文獻(xiàn)[15]中指出一般有效干擾需滿足的時(shí)空頻能等6項(xiàng)必要條件。MALD實(shí)施有源假目標(biāo)干擾時(shí)在時(shí)間、空間、頻率、能量和干擾樣式的匹配度方面有其自身的獨(dú)特性。
MALD干擾時(shí)機(jī)應(yīng)滿足下述要求:1)要對(duì)雷達(dá)脈沖前沿進(jìn)行復(fù)制以掌握準(zhǔn)確的干擾開始實(shí)施時(shí)機(jī);2)有源多假目標(biāo)一般要求信號(hào)轉(zhuǎn)發(fā)的延遲時(shí)間要小于雷達(dá)脈沖寬度以達(dá)到較佳干擾效果,但這是非嚴(yán)格的;3)為保證足夠的干擾能量和預(yù)期干擾效果,干擾要有一定的持續(xù)時(shí)間。另外,在一個(gè)脈沖間隔內(nèi)的假目標(biāo)數(shù)量應(yīng)適中,假目標(biāo)過少欺騙效果不佳,過多可能會(huì)被雷達(dá)處理端直接剔除,假目標(biāo)數(shù)量的控制視情而定。下面對(duì)前3個(gè)時(shí)機(jī)影響因素的匹配度進(jìn)行描述。
1)對(duì)于脈沖前沿采集時(shí)機(jī)匹配度,認(rèn)為干擾機(jī)可以概率1檢測(cè)到脈沖前沿:
et1ij=1
(30)
2)對(duì)于延遲時(shí)間匹配程度,若延遲時(shí)間Δt小于等于脈沖寬度ΔT,則匹配度取1;若延遲時(shí)間Δt大于脈沖寬度ΔT,則MALD會(huì)以一定概率實(shí)現(xiàn)假目標(biāo)干擾:
(31)
3)對(duì)于干擾持續(xù)時(shí)間,采用占比率描述匹配程度:
(32)
式中:t1表示雷達(dá)威脅開始時(shí)刻;t2表示雷達(dá)威脅結(jié)束時(shí)刻;ti表示開始實(shí)施干擾時(shí)刻。
最終,干擾時(shí)機(jī)的匹配度表示為
etij=et1ij·et2ij·et3ij
(33)
干擾空間要素主要包括波束對(duì)準(zhǔn)與覆蓋范圍、極化方式以及工作距離3個(gè)方面。
1)波束對(duì)準(zhǔn)與覆蓋范圍。在量化描述波束問題時(shí),需要明確空間“對(duì)準(zhǔn)”的本質(zhì)是保證足夠的干擾能量進(jìn)入到雷達(dá)接收機(jī)。因此將MALD方向上雷達(dá)增益的下降值作為方向上的對(duì)準(zhǔn)程度:
(34)
式中:Gt表示被干擾雷達(dá)主瓣增益;ΔG′t表示誘餌彈工作方向上雷達(dá)增益值的損失量。
2)極化方式。保持干擾信號(hào)與雷達(dá)接收機(jī)極化方向一致是有效干擾的必要條件之一,為了總是能有信號(hào)進(jìn)入雷達(dá)接收機(jī),干擾機(jī)通常會(huì)選擇圓極化方式,這樣便存在一個(gè)損失系數(shù),定義為epoij,取0.5。
3)工作距離。MALD在干擾過程中存在有效工作距離,與雷達(dá)相距過遠(yuǎn)時(shí)無法達(dá)到有效干擾距離,過近時(shí)一旦進(jìn)入燒穿距離同樣無法達(dá)到干擾目的。在有效作用距離范圍內(nèi),MALD距離雷達(dá)越近,干擾效果越好,因此距離指標(biāo)的匹配程度描述如下:
(35)
式中:Reff表示MALD有效作用距離;Rdis表示雷達(dá)與MALD之間的距離;Rbt表示燒穿距離。
對(duì)于MALD“偵察-轉(zhuǎn)發(fā)-干擾”類型的“瞄頻”模式而言,頻率存在天然對(duì)準(zhǔn)性,頻率的匹配程度主要與雷達(dá)抗干擾體制相關(guān)。因此,給出適用于MALD的頻率匹配模型如下:
(36)
通常用功率表征干擾設(shè)備的能量水平,而最終到達(dá)被干擾設(shè)備的功率大小與干擾樣式、雷達(dá)體制和空間位置等多種因素有關(guān)。但無論選擇何種方式,都要達(dá)到最基本的干信比需求,以保證干擾信號(hào)被檢測(cè)到。這里,借用“壓制系數(shù)”概念進(jìn)行宏觀效果描述,滿足有效干擾的最小干擾功率計(jì)算公式為
(37)
式中:Pri為第i部雷達(dá)接收到的干擾信號(hào)功率;Prs為目標(biāo)回波功率;Kj為第j發(fā)誘餌彈雷達(dá)正常工作所需最小干信比。
干擾設(shè)備采用的干擾樣式必須要與雷達(dá)體制相匹配,且匹配程度越高,干擾效果越好。對(duì)于MALD而言,預(yù)存的波形產(chǎn)生方式和干擾樣式?jīng)Q策庫決定了其戰(zhàn)場(chǎng)可用干擾樣式的靈活性。這里選擇有效干擾樣式數(shù)量與MALD具備的干擾樣式總數(shù)量的比值描述干擾樣式帶來的效能:
(38)
式中:Jeij表示第j發(fā)誘餌彈對(duì)第i部雷達(dá)的有效干擾樣式;Jj表示第j發(fā)誘餌彈所具備的誘餌彈所具備的干擾樣式總數(shù)量。
指標(biāo)權(quán)重根據(jù)各項(xiàng)指標(biāo)在干擾過程中的貢獻(xiàn)程度大小給出。根據(jù)MALD在上述指定背景下的作戰(zhàn)特點(diǎn),同時(shí)結(jié)合專家經(jīng)驗(yàn),認(rèn)為MALD在進(jìn)行有源假目標(biāo)轉(zhuǎn)發(fā)干擾時(shí),在干擾時(shí)機(jī)、干擾作用距離和干擾樣式三方面對(duì)干擾效果的影響較大,其余3項(xiàng)指標(biāo)影響相對(duì)較弱。現(xiàn)給出除極化方式匹配指標(biāo)外,其余6項(xiàng)指標(biāo)(干擾時(shí)間、波束對(duì)準(zhǔn)程度、干擾距離、干擾頻率、干擾功率、干擾樣式)的權(quán)重值:
WJ=[ωtωbωrωfωpωs]=[0.3 0.1 0.2 0.1 0.1 0.2]
(39)
干擾效能的產(chǎn)生是各指標(biāo)共同作用的結(jié)果,一旦其中一個(gè)指標(biāo)失效,則干擾失效。因此使用扎德算子取小計(jì)算,即
a∧b=min (a,b)
(40)
式中:a、b分別表示各項(xiàng)指標(biāo)。由此得到干擾效能模型為
(41)
式中:E=[etij,ebij,erij,efij,epij,esij]。進(jìn)而得到效益矩陣E=[eij]M×N。
根據(jù)第3節(jié)對(duì)動(dòng)態(tài)威脅評(píng)估和干擾效能匹配度矩陣生成的研究,給出最終資源分配方案生成思路框架如圖3所示。
圖3 干擾資源分配方案生成框架Fig.3 Frame diagram of jamming resource allocation scheme generation
當(dāng)干擾資源有限時(shí),資源的不合理配置會(huì)造成資源利用率低,甚至?xí)斐筛蓴_效果不理想。本文所提的面向組網(wǎng)雷達(dá)的分配思路為在干擾資源有限的條件下,通過整合目標(biāo)威脅值和干擾匹配度矩陣,最大化MALD對(duì)組網(wǎng)雷達(dá)的干擾效能,其優(yōu)化模型可建立為
(42)
從式(42)中可以看出,本文實(shí)際建立了一個(gè)帶干擾資源約束條件的數(shù)學(xué)優(yōu)化問題。約束1表示每部雷達(dá)均能被干擾,且最多受到S發(fā)MALD的干擾;約束2和約束3表示每發(fā)MALD同一時(shí)刻只能干擾一部雷達(dá)。
4.2.1 PSO算法
設(shè)搜索空間為n維,粒子p,p∈[1,M](M為種群規(guī)模)的當(dāng)前位置Xp、當(dāng)前速度vp及個(gè)體最優(yōu)位置Pbp分別為Xp=(Xp1,Xp2,…,Xpn),vp=(vp1,vp2,…,vpn),Pbp=(Pbp1,Pbp2,…,Pbpn)。
對(duì)于最大化目標(biāo)函數(shù),粒子p的個(gè)體最優(yōu)位置的計(jì)算公式如下:
(43)
式中:f(·)為目標(biāo)函數(shù);t為迭代次數(shù)。
每次迭代后,群體中所有粒子經(jīng)歷過的最好位置稱為全局最優(yōu)Pg(t),即
f(Pg(t))=max {f(Pb1(t)),f(Pb2(t)),…,f(PbM(t))}Pg(t)∈{Pb1(t),Pb2(t),…,PbM(t)}
(44)
則基本PSO算法的更新方程如下:
vpq(t+1)=ω(t)vpq(t)+c1r1q(t)(Pbpq(t)-Xpq(t))+c2r2q(t)(Pgq(t)-Xpq(t))
(45)
Xpq(t+1)=Xpq(t)+vpq(t+1)
(46)
式中:ω(t)為慣性權(quán)重;vpq(t)為粒子p第q維第t次迭代的速度;c1、c2為學(xué)習(xí)因子;Pbpq(t)為粒子p第q維第t次迭代所經(jīng)歷的最好位置;Xpq(t)為粒子p第q維第t次迭代的當(dāng)前位置;r1q(t)、r2q(t)分別為[0,1]內(nèi)的隨機(jī)數(shù);Pgq(t)為第q維第t次迭代的全局最好位置。
4.2.2 改進(jìn)PSO算法
改進(jìn)PSO算法主要體現(xiàn)在以下3個(gè)方面:
1)不同于其他優(yōu)化問題,MALD干擾資源分配求解的是各誘餌彈干擾的雷達(dá)目標(biāo)編號(hào),因此需要對(duì)粒子采用整數(shù)編碼的方式[27]。
2)標(biāo)準(zhǔn)PSO算法多采用如式(47)所示的線性慣性權(quán)重:
ω(t)=(tmax-t)(ωmax-ωmin)/tmax+ωmin
(47)
式中:ωmax、ωmin分別為慣性權(quán)重的最大值和最小值,一般取1.0和0.3;tmax為最大迭代次數(shù)。
其特性為初期慣性權(quán)重大,有利于進(jìn)行全局搜索;后期慣性權(quán)重小,有利于局部尋優(yōu),但容易導(dǎo)致粒子過快聚集,多樣性消失,導(dǎo)致不能收斂到全局最優(yōu)解,自適應(yīng)慣性權(quán)重策略可針對(duì)性改善其性能。由于目標(biāo)函數(shù)為非線性函數(shù),本文選用自適應(yīng)慣性權(quán)重[28]對(duì)PSO算法進(jìn)行改進(jìn)。
3)在動(dòng)態(tài)優(yōu)化問題中,由于綜合干擾效能只與當(dāng)前和未來干擾效能相關(guān),而與過去的信息無關(guān),因此干擾分配策略的確定符合馬爾可夫決策過程。文獻(xiàn)[29]提到,對(duì)于動(dòng)態(tài)優(yōu)化問題,能夠通過在后續(xù)分配中繼承初次分配的結(jié)果提高尋優(yōu)效率,而PSO算法需要由相同的初始狀態(tài)開始尋優(yōu),相比繼承前一時(shí)刻的最優(yōu)方案,PSO算法需要探索更多的動(dòng)作,耗時(shí)較長(zhǎng),效率較低。本節(jié)借鑒文獻(xiàn)[29]的思想,在動(dòng)態(tài)求解時(shí)通過繼承前一時(shí)刻的最優(yōu)方案對(duì)種群進(jìn)行初始化。
實(shí)際上,在動(dòng)態(tài)優(yōu)化問題中,無論是連續(xù)解空間還是離散解空間,最優(yōu)方案在時(shí)間這一維度上都具有連續(xù)性,即相鄰兩時(shí)刻的最優(yōu)方案在解空間中是相鄰的,因此本節(jié)通過繼承前一時(shí)刻的最優(yōu)方案,同時(shí)結(jié)合自適應(yīng)慣性權(quán)重,能夠在最大限度提高尋優(yōu)效率的同時(shí),避免陷入局部最優(yōu)。
算法具體步驟如下:
步驟1隨機(jī)初始化種群中各微粒的位置和速度。如微粒x=[3,4,1,6,5,2]位置表示誘餌彈3干擾雷達(dá)1,誘餌彈4干擾雷達(dá)2,誘餌彈1干擾雷達(dá)3,……以此類推。
步驟2計(jì)算各微粒的適應(yīng)度。將當(dāng)前粒子的位置和適應(yīng)度存儲(chǔ)于各微粒的個(gè)體最優(yōu)Pbp(t)中,將全部個(gè)體最優(yōu)中適應(yīng)度最優(yōu)的粒子位置和適應(yīng)度存儲(chǔ)于全局最優(yōu)Pg(t)中。
步驟3根據(jù)式(45)、式(46)更新粒子的速度與位置。
步驟4自適應(yīng)更新慣性權(quán)重
ω(t)=(ωmax-ωmin)Ps(t)+ωmin
(48)
式中:ωmax、ωmin一般取0.9,0.3;Ps(t)為移動(dòng)到更優(yōu)處粒子的占比,具體定義如下:
(49)
(50)
步驟5若達(dá)到一定的精度要求(通常為預(yù)設(shè)的精度閾值或迭代次數(shù)),則輸出結(jié)果;否則返回步驟3繼續(xù)搜索。
步驟6在后續(xù)各時(shí)刻中,將上一時(shí)刻的最優(yōu)分配結(jié)果所對(duì)應(yīng)的微粒隨機(jī)繼承給初始化種群中的任一粒子。
通過步驟6,使得PSO算法能夠迅速聚集到上一時(shí)刻的最優(yōu)粒子附近,同時(shí)自適應(yīng)慣性權(quán)重也保證了合適的搜索范圍,避免收斂到局部最優(yōu),因此在一定程度上提高了搜索效率。
但由于本文PSO算法的解空間是離散的,不同于連續(xù)性的解空間,容易產(chǎn)生一段時(shí)間內(nèi)最優(yōu)方案始終不變的情況。改進(jìn)PSO算法的流程如圖4所示。
圖4 改進(jìn)PSO算法流程圖Fig.4 IPSO algorithm flowchart
本節(jié)通過仿真實(shí)驗(yàn)求解資源分配方案,并將改進(jìn)PSO算法與傳統(tǒng)算法進(jìn)行比較,驗(yàn)證本文所提與算法的有效性。
考慮作戰(zhàn)場(chǎng)景中組網(wǎng)雷達(dá)系統(tǒng)由6部雷達(dá)組成,突防系統(tǒng)為8發(fā)MALD掩護(hù)目標(biāo),MALD實(shí)施抵近干擾以保護(hù)目標(biāo)突防。組網(wǎng)雷達(dá)與MALD的參數(shù)設(shè)置分別如表1和表2所示。選取30 s突防數(shù)據(jù)進(jìn)行算例分析,數(shù)據(jù)間隔為1 s,共30組數(shù)據(jù)。
表1 初始時(shí)刻雷達(dá)仿真參數(shù)
表2 初始時(shí)刻誘餌彈仿真參數(shù)
組網(wǎng)雷達(dá)參數(shù)設(shè)置中,給出6部雷達(dá)初始載頻、脈寬和重頻參數(shù)。載頻方面,設(shè)定雷達(dá)1、3、5、6為具備頻率捷變抗干擾功能體制雷達(dá),30 s內(nèi)分別取相應(yīng)頻段內(nèi)的若干頻點(diǎn)進(jìn)行跳變,雷達(dá)2、4不具備該功能,載頻保持不變;脈寬和重頻方面,給出6部雷達(dá)初始脈寬與重頻,30 s內(nèi)各參數(shù)隨時(shí)間呈線性變化趨勢(shì)。
MALD參數(shù)設(shè)置中,由于MALD一般采用0.7~0.8 Ma的飛行速度,30 s仿真時(shí)間內(nèi),MALD飛行距離大概在7~8 km,通過預(yù)置航路點(diǎn)方式規(guī)劃MALD大致飛行航線,結(jié)合雷達(dá)空間坐標(biāo),得到目標(biāo)突防組網(wǎng)雷達(dá)的空間位置關(guān)系如圖5所示。圖5中,R1、R2、R3、R4、R5、R6分別表示表1中對(duì)應(yīng)的6部雷達(dá)。
圖5 目標(biāo)突防組網(wǎng)雷達(dá)系統(tǒng)空間關(guān)系圖Fig.5 Scenario of target penetrating the NRS
改進(jìn)PSO算法參數(shù)設(shè)置如下:最大迭代次數(shù)為150;粒子群規(guī)模為50,ωmax取0.9,ωmin取0.3,Monte Carlo仿真次數(shù)為200。仿真平臺(tái)均為Intel(R) Core(TM) i5-8250U CPU 3.40 GHz,MATLAB R2015b,在Windows 10操作系統(tǒng)下進(jìn)行。
以其中1發(fā)MALD為例,對(duì)干擾資源優(yōu)化分配步驟進(jìn)行如下描述。
步驟1指標(biāo)變權(quán)重求解。根據(jù)改進(jìn)的CRITIC法,以該發(fā)MALD視角下的雷達(dá)6為例,確定其指標(biāo)初始權(quán)重為ω=(0.329,0.220,0.258,0.194),通過對(duì)指標(biāo)建立均衡函數(shù),結(jié)合變權(quán)理論確定各指標(biāo)權(quán)重的變化曲線如圖6所示。
圖6 雷達(dá)指標(biāo)權(quán)重變化曲線Fig.6 Curves of radar index weight change
由圖6可知,隨著距離的變化,距離權(quán)重逐漸減小,脈寬、重頻權(quán)重逐漸增大,載頻權(quán)重趨于穩(wěn)定,仿真結(jié)果與理論分析情況基本吻合,說明該變權(quán)方法與本文所研究?jī)?nèi)容具有較好適用性,其結(jié)果可用于后續(xù)分析。
步驟2組網(wǎng)雷達(dá)威脅值求解。分別計(jì)算該發(fā)MALD視角下組網(wǎng)雷達(dá)中各雷達(dá)的指標(biāo)動(dòng)態(tài)權(quán)重。通過各時(shí)刻下的指標(biāo)變權(quán)重,結(jié)合改進(jìn)相對(duì)貼近度的方法計(jì)算各時(shí)刻下組網(wǎng)雷達(dá)的威脅值,仿真結(jié)果如圖7所示。
圖7 各雷達(dá)威脅值變化曲線Fig.7 Curves of the threat value of each radar
由圖7可知,隨著時(shí)間推進(jìn)和工作參數(shù)的變化,雷達(dá)的威脅值發(fā)生動(dòng)態(tài)變化:0~13 s時(shí)刻,雷達(dá)威脅排序由高至低為[5,3,4,1,2,6];14~17 s時(shí)刻,雷達(dá)威脅排序由高至低為[5,4,3,1,2,6];18~30 s時(shí)刻,雷達(dá)威脅排序由高至低為[5,4,3,2,1,6]。從總體威脅等級(jí)看,雷達(dá)3、4、5為制導(dǎo)、火控和跟蹤雷達(dá),相較雷達(dá)1、2、6執(zhí)行的警戒和搜索任務(wù),對(duì)MALD的威脅程度始終較高。
步驟3優(yōu)化算法動(dòng)態(tài)資源分配方案。重復(fù)步驟1、步驟2,得到每發(fā)MALD視角下組網(wǎng)雷達(dá)的動(dòng)態(tài)威脅值,根據(jù)本文的改進(jìn)PSO算法對(duì)最優(yōu)分配方案進(jìn)行求解,表3為優(yōu)化算法的資源分配結(jié)果,其中數(shù)字表示對(duì)應(yīng)的雷達(dá)編號(hào)。
由表3可知,MALD群在干擾過程中的干擾策略大致分為3個(gè)階段,即1~16 s時(shí)刻、17~22 s時(shí)刻和23~30 s時(shí)刻,由MALD分配數(shù)量可以看出:干擾資源始終保持對(duì)最高威脅等級(jí)的雷達(dá)5采用2發(fā)MALD進(jìn)行持續(xù)干擾,過程中干擾資源由雷達(dá)3向雷達(dá)4側(cè)重,原因在于雷達(dá)4的威脅程度不斷增大,分配結(jié)果與圖7結(jié)論基本吻合。
5.3.1 動(dòng)態(tài)與傳統(tǒng)干擾效能值對(duì)比分析
分別計(jì)算各時(shí)刻的最優(yōu)干擾效能值,并與傳統(tǒng)方法計(jì)算結(jié)果對(duì)比。傳統(tǒng)算法通過2.1節(jié)的威脅評(píng)估方法確定固定權(quán)重,通過本文改進(jìn)相對(duì)貼近度計(jì)算威脅值,最后采用傳統(tǒng)PSO算法進(jìn)行資源優(yōu)化分配,實(shí)驗(yàn)結(jié)果如圖8所示。
圖8 最優(yōu)干擾效能變化曲線Fig.8 Curves of optimal jamming effectiveness change
由于不涉及動(dòng)態(tài)調(diào)整威脅值和資源分配,傳統(tǒng)算法實(shí)際上僅對(duì)初始時(shí)刻的戰(zhàn)場(chǎng)仿真數(shù)據(jù)進(jìn)行資源分配,由此得到與本文動(dòng)態(tài)分配方法初始時(shí)刻同樣的效能值。
由圖8可知,傳統(tǒng)方法得到的效能值始終為1.331 3,而本文算法中隨著時(shí)間的推移,MALD彈群的最優(yōu)干擾效能值總體上呈上升趨勢(shì),最終達(dá)到1.559 1,顯著高于傳統(tǒng)方法得到的效能值。分析原因可知,一方面,傳統(tǒng)分配方案為單一時(shí)刻的固定分配方案,新的分配方案是隨干擾方參數(shù)、被干擾方參數(shù)和空間位置實(shí)時(shí)變化的動(dòng)態(tài)分配方案;另一方面,由于改進(jìn)PSO算法是不斷優(yōu)化迭代的,隨著時(shí)間的推移,MALD執(zhí)行干擾時(shí)的匹配度不斷增強(qiáng),干擾效能不斷提高。
另外,動(dòng)態(tài)效能值在17 s和23 s時(shí)刻左右出現(xiàn)明顯下降拐點(diǎn),隨后效能值又穩(wěn)步提升。由此可見,當(dāng)干擾效能值出現(xiàn)下降時(shí),改進(jìn)后的算法可以迅速實(shí)現(xiàn)動(dòng)態(tài)分配方案調(diào)整,保證最佳干擾效果。對(duì)于曲線中出現(xiàn)的拐點(diǎn),分析是由于雷達(dá)威脅程度發(fā)生變化或是MALD抵近過程中被燒穿失效產(chǎn)生。
很顯然,動(dòng)態(tài)的干擾效能值更符合實(shí)際作戰(zhàn)情況,MALD可根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)實(shí)時(shí)調(diào)整干擾資源分配策略,始終保持最佳干擾效能。由此得到的干擾分配策略也更加具有針對(duì)性,在一定程度上提高了干擾資源的利用效率。
5.3.2 改進(jìn)PSO與傳統(tǒng)PSO算法、ACA性能對(duì)比
本節(jié)將改進(jìn)PSO算法分別與傳統(tǒng)PSO算法和ACA進(jìn)行對(duì)比。其中,PSO算法的迭代次數(shù)、粒子群規(guī)模、Monte Carlo仿真次數(shù)與本文改進(jìn)算法保持一致;ACA的螞蟻個(gè)數(shù)為50,信息素重要程度參數(shù)為1,啟發(fā)式因子重要程度參數(shù)為5,信息蒸發(fā)系數(shù)為0.01,最大迭代次數(shù)為150,信息素增加強(qiáng)度系數(shù)為100。分別從耗時(shí)性能、實(shí)時(shí)性和最優(yōu)解正確率3個(gè)方面衡量本文算法性能。仿真結(jié)果如下。
1)算法耗時(shí)性與實(shí)時(shí)性對(duì)比分析
在MALD飛行過程中,每間隔0.5 s,采用不同算法進(jìn)行干擾資源分配,選取若干時(shí)刻下3種方法的耗時(shí)與指標(biāo)結(jié)果如表4所示。
表4 算法耗時(shí)性能對(duì)比
由表4可知:3種算法均可實(shí)現(xiàn)干擾資源分配,最終的干擾效能值也完全相同;不同方法在計(jì)算耗時(shí)上存在一定差異,初次分配時(shí)改進(jìn)PSO算法耗時(shí)較長(zhǎng),而后續(xù)分配過程中PSO算法與ACA耗時(shí)較長(zhǎng)。對(duì)于初次分配,改進(jìn)PSO算法迭代過程中初始化參數(shù)更多,并探索更多的動(dòng)作,因此耗時(shí)較長(zhǎng)。在后續(xù)分配過程中,由于初始化種群中包含上一時(shí)刻的最優(yōu)分配方案的粒子,改進(jìn)PSO算法能夠繼承初次分配的結(jié)果,而PSO算法與ACA都需要由相同的初始狀態(tài)出發(fā)進(jìn)行尋優(yōu),因此改進(jìn)PSO算法耗時(shí)更短,效率更高。
2)算法最優(yōu)解正確率對(duì)比分析
分別計(jì)算3種算法200次Monte Carlo仿真中尋到最優(yōu)解的仿真曲線平均值(15 s時(shí)刻),得到仿真平均曲線如圖9所示;同時(shí)以1 000次Monte Carlo仿真為一輪實(shí)驗(yàn),重復(fù)10輪,得到各算法的最優(yōu)解正確率,并通過箱線圖進(jìn)行統(tǒng)計(jì)分析,對(duì)比結(jié)果如圖10所示。
圖9 算法迭代曲線對(duì)比Fig.9 Comparison of algorithm iteration curves
圖10 最優(yōu)解正確率對(duì)比分析Fig.10 Comparison of accuracy of optimal solution
分析圖9可知,相較于傳統(tǒng)PSO算法和ACA,本文的改進(jìn)PSO算法能夠以更快的收斂速度得到最優(yōu)解;同時(shí),分析圖10可知,在同樣的迭代次數(shù)下,本文改進(jìn)算法可以達(dá)到的最優(yōu)解正確率水平為95.6%,要優(yōu)于傳統(tǒng)PSO算法的93.2%和ACA的93.9%,且沒有奇異值,因此具有更好的尋優(yōu)穩(wěn)定性。
分析可知,主要原因在于采用自適應(yīng)慣性權(quán)重和變化學(xué)習(xí)因子后,改進(jìn)PSO算法更易收斂、不易陷入局部最優(yōu)解,在處理復(fù)雜函數(shù)問題過程中具有更強(qiáng)適應(yīng)性,更適合干擾資源分配的優(yōu)化問題。
本文針對(duì)動(dòng)態(tài)干擾資源分配中的一系列問題,提出了一種面向組網(wǎng)雷達(dá)的空射誘餌彈干擾資源動(dòng)態(tài)分配方法。充分考慮MALD有源假目標(biāo)干擾作戰(zhàn)特點(diǎn),通過引入匹配度概念,結(jié)合動(dòng)態(tài)威脅評(píng)估方法,以最大化干擾效能為目標(biāo),構(gòu)造了資源分配優(yōu)化函數(shù),之后采用改進(jìn)PSO算法對(duì)上述優(yōu)化問題進(jìn)行求解。得出主要結(jié)論如下:
1)基于ICRITIC和變權(quán)理論的動(dòng)態(tài)威脅評(píng)估方法可以得到敵方雷達(dá)威脅值的動(dòng)態(tài)變化過程,使得最終的干擾分配策略更為合理,戰(zhàn)場(chǎng)適用性更強(qiáng)。
2)充分考慮MALD干擾機(jī)理,引入并改進(jìn)匹配度模型用于分析影響干擾效能的相關(guān)指標(biāo),得到的干擾效能值用于指導(dǎo)干擾資源分配,使得分配結(jié)果更加科學(xué)合理。
3) 改進(jìn)PSO算法使得計(jì)算效率在非初次決策中相比傳統(tǒng)算法在實(shí)時(shí)性和準(zhǔn)確性方面具有更明顯的優(yōu)勢(shì)。