戴少懷,楊革文,李 旻,康傳華,鐘 昭
(上海機(jī)電工程研究所,上海201109)
隨著電子對(duì)抗技術(shù)的發(fā)展,組網(wǎng)雷達(dá)已經(jīng)對(duì)飛機(jī)編隊(duì)執(zhí)行突防和突擊任務(wù)構(gòu)成很大威脅,對(duì)突防方而言,為提高作戰(zhàn)飛機(jī)突防概率,降低己方力量的消耗,需要對(duì)組網(wǎng)雷達(dá)進(jìn)行有效干擾。在干擾資源有限的條件下,對(duì)組網(wǎng)雷達(dá)進(jìn)行協(xié)同干擾,合理分配干擾資源,才能達(dá)到最佳的干擾效果[1-3]。
文獻(xiàn)[4―6]分別對(duì)遺傳算法進(jìn)行改進(jìn),實(shí)現(xiàn)干擾資源的合理分配,一定程度上減小了算法的收斂誤差,提高了尋優(yōu)概率,但是增加了算法迭代時(shí)間,降低了干擾的實(shí)時(shí)性要求;文獻(xiàn)[7]利用博弈論的方法研究干擾資源的分配問題,綜合各干擾機(jī)的干擾效益,提出了迭代干擾策略選擇算法,在解決低復(fù)雜度問題時(shí)該算法具有較快的收斂速度,當(dāng)雷達(dá)數(shù)量結(jié)合干擾資源較多時(shí),算法性能就會(huì)出現(xiàn)嚴(yán)重衰減;文獻(xiàn)[8]將布谷鳥算法用于協(xié)同干擾問題,實(shí)現(xiàn)了干擾機(jī)自主分配和干擾樣式最優(yōu)決策,算法在提高了收斂穩(wěn)定性的同時(shí),犧牲了算法的收斂速度;文獻(xiàn)[9]圍繞組網(wǎng)雷達(dá)檢測(cè)概率和定位精度2 個(gè)指標(biāo),建立基于多目標(biāo)優(yōu)化的協(xié)同干擾決策任務(wù)模型,通過對(duì)人工蜂群算法增加自適應(yīng)交叉運(yùn)算,提高了該算法的尋優(yōu)速度,但未解決算法易陷入局部最優(yōu)問題。綜合以上分析,現(xiàn)有的組網(wǎng)雷達(dá)干擾資源分配方法普遍存在迭代次數(shù)多,尋優(yōu)概率不高等問題,難以滿足實(shí)際工程應(yīng)用的需求。
本文針對(duì)組網(wǎng)雷達(dá)干擾機(jī)分配問題,采用合理的組網(wǎng)雷達(dá)干擾效果評(píng)估指標(biāo),構(gòu)建協(xié)同干擾效益數(shù)學(xué)模型,提出一種改進(jìn)的二進(jìn)制粒子群(improved binary particle swarm optimization,IBPSO)算法實(shí)現(xiàn) 干 擾效益最大化。IBPSO 算法采用Logistic 混沌映射的方法均勻化初始粒子群,提高初始粒子群的平均適應(yīng)度,通過動(dòng)態(tài)調(diào)整學(xué)習(xí)因子和速度向量化更新的方式,提高算法的迭代效率和尋優(yōu)概率。
針對(duì)組網(wǎng)雷達(dá)干擾效果評(píng)估的方法有很多[10],這里選擇模糊綜合評(píng)判法衡量協(xié)同干擾資源分配的干擾效果,綜合文獻(xiàn)[11]和文獻(xiàn)[12]雷達(dá)干擾效果評(píng)估指標(biāo),選擇干擾功率、干擾頻率、干擾樣式和干擾時(shí)機(jī)等四個(gè)指標(biāo)構(gòu)建干擾效益評(píng)估矩陣E。根據(jù)文獻(xiàn)[10]可計(jì)算各指標(biāo)的隸屬度函數(shù),四個(gè)指標(biāo)分別用Ga、Gb、Gc、Gd表示。
假設(shè)當(dāng)前己方干擾機(jī)數(shù)量為m,對(duì)方雷達(dá)組網(wǎng)中待干擾雷達(dá)數(shù)量為n,計(jì)算各指標(biāo)的隸屬度函數(shù),可以得到第i 部干擾機(jī)對(duì)某雷達(dá)干擾效益隸屬度向量:
此時(shí),m 個(gè)干擾機(jī)對(duì)某一部雷達(dá)干擾效益矩陣可以表示為:
在實(shí)際衡量干擾效果時(shí),為保證評(píng)估結(jié)果的可靠性與合理性,不同指標(biāo)在評(píng)估過程中的權(quán)重是不一樣的,這里根據(jù)專家經(jīng)驗(yàn)設(shè)四個(gè)不同指標(biāo)的權(quán)重為:
此時(shí),m 個(gè)干擾機(jī)對(duì)某一部雷達(dá)的實(shí)際干擾效益矩陣為:
雷達(dá)組網(wǎng)中待干擾雷達(dá)數(shù)量為n,可以依次求得ej( j=1,2,…,n),則干擾波形對(duì)雷達(dá)干擾效益評(píng)估矩陣為E=[e′],可以展開為:
式中,E 表示對(duì)組網(wǎng)雷達(dá)協(xié)同干擾時(shí)獲得的干擾效益評(píng)估矩陣,eij代表綜合四個(gè)指標(biāo),干擾機(jī)i 對(duì)雷達(dá)j 的干擾效益值。
干擾效益評(píng)估矩陣E 表示的是協(xié)同干擾過程中,各干擾機(jī)對(duì)不同雷達(dá)的干擾效益值,組網(wǎng)中雷達(dá)威脅矩陣W =[w1,w2,…,wn],wj(1≤j ≤n)表示組網(wǎng)中雷達(dá)j 的威脅程度,主要根據(jù)雷達(dá)j 當(dāng)前工作狀態(tài)確定。為實(shí)現(xiàn)在某一干擾機(jī)分配方案下,干擾效益最大化,需要優(yōu)化分配矩陣,待優(yōu)化的目標(biāo)函數(shù):
式中,xij為分配矩陣元素,取值為0 或1,xij=1 表示分配干擾機(jī)i 對(duì)雷達(dá)j 進(jìn)行干擾,否則不進(jìn)行干擾;eij表示干擾機(jī)i 對(duì)雷達(dá)j 的綜合干擾效益。
在實(shí)際協(xié)同干擾作戰(zhàn)過程中,由于自身干擾資源的限制,每部干擾機(jī)在同一時(shí)段能干擾的雷達(dá)數(shù)量是有限的,設(shè)同一時(shí)段一部干擾機(jī)最多能對(duì)εi部雷達(dá)進(jìn)行干擾;每部目標(biāo)雷達(dá)至少分配一部干擾機(jī),此時(shí),對(duì)目標(biāo)函數(shù)(6)構(gòu)成的約束條件:
綜上分析,組網(wǎng)雷達(dá)協(xié)同干擾決策問題是一個(gè)多參數(shù)、多約束、非連續(xù)的整數(shù)規(guī)劃問題。隨著分配規(guī)模的增加,需要采用群體智能算法對(duì)分配過程進(jìn)行優(yōu)化求解。粒子群算法作為典型的啟發(fā)式算法,具有收斂能力強(qiáng)、易于實(shí)現(xiàn)等優(yōu)點(diǎn),但算法存在迭代次數(shù)多、尋優(yōu)概率不高等問題,這里對(duì)粒子群算法進(jìn)行改進(jìn),以克服算法本身的不足。
粒子群算法是一種受啟發(fā)于鳥群覓食的進(jìn)化算法。PSO 算法中每個(gè)粒子的位置代表一個(gè)D 維空間中的解,每個(gè)粒子存在自學(xué)習(xí)和社會(huì)學(xué)習(xí)的能力,并逐代更新自身速度和位置,根據(jù)粒子適應(yīng)度評(píng)價(jià)當(dāng)前位置的優(yōu)劣,使粒子群能夠在整個(gè)解空間中尋找到全局最優(yōu)解[13-15]。
在每次迭代過程中,粒子會(huì)根據(jù)由學(xué)習(xí)因子控制的個(gè)體極值pbest 和全局最優(yōu)值gbest 的引導(dǎo)逐次更新自身的速度和位置。粒子的速度和位置更新方式如式(8)―(9):
式中,vid和Xid代表粒子i 在d 維的速度和位置(1≤d ≤D,D 為 粒 子維度),k 表示當(dāng) 前迭代次數(shù),pbestid表示粒子i 在d 維的歷史最優(yōu)值,gbestid表示當(dāng)前粒子群中d 維的全局最優(yōu)值,ω 表示保留當(dāng)前速度的慣性權(quán)重,c1和c2分別表示自學(xué)習(xí)因子和社會(huì)學(xué)習(xí)因子,r1和r2為[0~1]區(qū)間的兩個(gè)隨機(jī)數(shù)。
粒子群算法只適用于連續(xù)空間的優(yōu)化問題,在離散空間無法實(shí)現(xiàn)搜索迭代,為采用粒子群算法解決離散空間的目標(biāo)優(yōu)化問題,文獻(xiàn)[13]設(shè)計(jì)一種BPSO 算法,其速度更新公式不變,位置信息被離散為二進(jìn)制0或1,相應(yīng)的更新迭代公式調(diào)整為:
式中,ξ 為區(qū)間[0~1] 服從均勻分布的隨機(jī)數(shù),S(vid(k+1))為將速度變量映射為(0~1)之間的sigmoid 函數(shù)。
傳統(tǒng)的BPSO 算法主要存在以下幾方面的問題:1)粒子群中粒子個(gè)體利用率不高。BPSO 算法缺乏有效的粒子群初始化方式,隨機(jī)初始化產(chǎn)生的粒子群無法保證在解空間分布的均勻性和多樣性,導(dǎo)致算法易陷入局部最優(yōu)。2)解出現(xiàn)趨同現(xiàn)象。隨著迭代次數(shù)遞增,在迭代后期,速度經(jīng)過sigmoid 函數(shù)映射后不斷趨近于1,使得位置取值為1 的概率趨近于100%,粒子取值趨于同向變化。3)速度更新過程中學(xué)習(xí)方向固化。在進(jìn)行速度更新時(shí),采用固定不變的自主學(xué)習(xí)因子和社會(huì)學(xué)習(xí)因子,對(duì)粒子個(gè)體極值和全局最優(yōu)值的學(xué)習(xí)偏重維持不變,易陷入局部最優(yōu)。
2.3.1 Logistic 混沌初始化
標(biāo)準(zhǔn)的BPSO 算法中采用隨機(jī)初始化的方式產(chǎn)生初始粒子,初始粒子群在解空間分布的均勻性對(duì)最終收斂精度有一定影響。這里引入Logistic 混沌映射的方法,利用其遍歷性和非周期性,初始化粒子種群,使得初始種群均勻分布于解空間。Logistic 混沌映射是一種產(chǎn)生混沌序列的非線性映射[16-17],可以表示為:
式中,yt為第t 次迭代粒子位置的混沌變量,其取值范圍為[0~1];T 為最大迭代次數(shù);μ 為控制參數(shù),若μ=4,則系統(tǒng)處于完全混沌狀態(tài),且產(chǎn)生的混沌變量均屬于區(qū)間[0~1]。
這里,在文獻(xiàn)[18]的基礎(chǔ)上,采用四舍五入的方式,對(duì)式(12)的混沌映射結(jié)果進(jìn)行二值化修正處理,修正公式為:
式中,round 為取整函數(shù);xn+1為修正后的粒子位置變量。
為比較Logistic 混沌映射初始化方式和隨機(jī)初始化方式產(chǎn)生二值序列的均勻性,對(duì)比在不同序列長(zhǎng)度下,2 種方法產(chǎn)生“0”和“1”的數(shù)目,實(shí)驗(yàn)數(shù)據(jù)如表1所示。
表1 2 種序列產(chǎn)生方法均勻性對(duì)比
實(shí)驗(yàn)結(jié)果表明,Logistic 混沌映射初始化方式比隨機(jī)初始化方式產(chǎn)生初始種群的均勻性更好?;贚ogistic 混沌映射豐富了算法初始種群的多樣性和均勻性,初始種群的平均適應(yīng)度更高,一定程度上能夠避免算法陷入局部最優(yōu),提高迭代效率。
2.3.2 異步變化的學(xué)習(xí)因子
粒子群算法在進(jìn)行速度更新時(shí),通過學(xué)習(xí)因子使粒子具備自學(xué)習(xí)和社會(huì)學(xué)習(xí)的能力。固定的自學(xué)習(xí)因子和社會(huì)學(xué)習(xí)因子容易使迭代過程緩慢,易陷入局部最優(yōu)[19]。為改善算法在迭代的不同階段,動(dòng)態(tài)調(diào)整自學(xué)習(xí)和社會(huì)學(xué)習(xí)的偏重,這里重新設(shè)計(jì)學(xué)習(xí)因子的變化公式,在算法迭代初期,使粒子具有較強(qiáng)的自學(xué)習(xí)能力,以增強(qiáng)算法開發(fā)性能和全局尋優(yōu)能力;在算法迭代后期,增強(qiáng)粒子的社會(huì)學(xué)習(xí)能力,提高算法開采性能。學(xué)習(xí)因子變化公式為:
式 中,ci1和ci2分 別 表 示c1和c2的初 始 值,cf1和cf2表 示c1和c2的 終值。
2.3.3 速度向量化更新
采用式(11)對(duì)粒子位置進(jìn)行更新時(shí),隨著速度不斷累加,粒子對(duì)自身和種群的歷史信息的利用率降低。粒子速度應(yīng)根據(jù)當(dāng)前粒子位置的取值情況進(jìn)行更新,粒子在任一維度的取值為0 或1。這里定義2 個(gè)速度向量和和分別表示粒子i 位置取值 為0 和1 的 分 量,記 作=(),=()。迭代過程中對(duì)2 個(gè)速度向量采用式(15)的公式進(jìn)行更新:
采用向量的形式根據(jù)不同維度位置參數(shù)的取值,對(duì)速度參數(shù)進(jìn)行更新。然后依據(jù)式(10)調(diào)整粒子位置,避免了由于較大的粒子速度,導(dǎo)致的解趨同現(xiàn)象,充分利用粒子的個(gè)體極值和全局最優(yōu)值,豐富粒子多樣性,促進(jìn)粒子向全局最優(yōu)狀態(tài)收斂。
在針對(duì)組網(wǎng)雷達(dá)進(jìn)行協(xié)同干擾時(shí),采用IBPSO 算法解決干擾資源的優(yōu)化分配,式(6)作為待優(yōu)化目標(biāo)函數(shù)和適應(yīng)度評(píng)價(jià)函數(shù),需要解決以下2 個(gè)問題。
1)粒子群初始化
一般粒子群個(gè)體數(shù)量在[20,100]范圍內(nèi),這里種群數(shù)量默認(rèn)選擇NP=20。干擾機(jī)協(xié)同分配屬于二值離散問題,設(shè)初始粒子群為X ={X1,X2,…,XNP},其中Xi(1≤i ≤NP)為粒子群中個(gè)體,代表一個(gè)可行解。
2)粒子個(gè)體編碼
對(duì)組網(wǎng)雷達(dá)進(jìn)行協(xié)同干擾,合理分配干擾機(jī)對(duì)不同雷達(dá)進(jìn)行干擾,最大化雷達(dá)組網(wǎng)的干擾效益。當(dāng)前干擾機(jī)數(shù)量為m,待干擾雷達(dá)數(shù)量為n,此時(shí),干擾機(jī)分配矩陣Xi為m×n 的矩陣,可以表示為:
式中,xij(1≤i ≤m ,1≤j ≤n)取值為1 或0。若xij=1,則表示分配干擾機(jī)i 對(duì)雷達(dá)j 進(jìn)行干擾;反之,不進(jìn)行干擾。
基于IBPSO 算法的組網(wǎng)雷達(dá)干擾資源分配流程描述如下:
1)初始化IBPSO 算法基本參數(shù)包括粒子群規(guī)模SN,最大迭代次數(shù)T,慣性權(quán)重ω,自主學(xué)習(xí)因子初始值ci1和終值cf1,社會(huì)學(xué)習(xí)因子初始值ci2和終值cf2。
2)根據(jù)2.3.1 的Logistic 初始化方法對(duì)粒子群進(jìn)行初始化,提高初始種群的多樣性和平均適應(yīng)度。
3)計(jì)算并選擇各粒子個(gè)體不同維度上的歷史最優(yōu)值pbest 和粒子群的全局最優(yōu)值gbest,保存初始粒子群中最大適應(yīng)度函數(shù)值,并記錄粒子位置取值和干擾分配方案。
4)根據(jù)式(15)更新粒子速度,并依據(jù)式(14)對(duì)自學(xué)習(xí)因子和社會(huì)學(xué)習(xí)因子進(jìn)行迭代更新,調(diào)整當(dāng)前粒子學(xué)習(xí)偏重。
5)根據(jù)式(10)―(11)更新每個(gè)粒子各維度的位置取值xij,形成干擾分配矩陣Xi。
6)更新pbest 和gbest,計(jì)算更新后分配矩陣的各粒子適應(yīng)度,若當(dāng)前適應(yīng)度大于個(gè)體最優(yōu)適應(yīng)度,則更新pbest;否則,不更新pbest。同理,若當(dāng)前粒子群中粒子最大適應(yīng)度大于全局最優(yōu)適應(yīng)度,則對(duì)gbest 進(jìn)行更新;反之,不更新。
7)更新迭代次數(shù)t=t+1,當(dāng)t ≥T,輸出最優(yōu)分配矩陣和干擾效益值,否則,返回3)。
干擾資源協(xié)同分配是針對(duì)組網(wǎng)雷達(dá)進(jìn)行有效干擾的關(guān)鍵技術(shù),針對(duì)不同雷達(dá)的威脅程度合理分配當(dāng)前干擾機(jī),使得干擾效益值最大。這里將IBPSO 算法應(yīng)用于協(xié)同干擾資源分配問題,并與文獻(xiàn)[18]中BPSO算法和文獻(xiàn)[6]中遺傳算法(genetic algorithm,GA)進(jìn)行比較。
本文算法參數(shù)描述如表2 所示,算法各參數(shù)為:T為算法最大迭代次數(shù),ci1、cf1分別為自學(xué)習(xí)因子的初值和終值,ci2、cf2分別為社會(huì)學(xué)習(xí)因子的初值和終值,ω為慣性權(quán)值,m 為當(dāng)前可分配干擾機(jī)數(shù)目,n 為待干擾雷達(dá)數(shù)目。
表2 算法參數(shù)設(shè)置
為保證算法公平性,IBPSO 算法、BPSO 算法和GA 算法在每次實(shí)驗(yàn)中,干擾機(jī)和組網(wǎng)雷達(dá)的各項(xiàng)工作參數(shù)和工作狀態(tài)不發(fā)生改變,保證具有相同的干擾效益值和威脅系數(shù)。
4.2.1 迭代次數(shù)分析
迭代次數(shù)是衡量收斂速度的一個(gè)重要標(biāo)準(zhǔn),算法優(yōu)化至最優(yōu)解時(shí)所需要的迭代次數(shù)越少,表現(xiàn)的收斂速度就越好。IBPSO 算法、BPSO 算法和GA 算法分別運(yùn)行30 次,以迭代次數(shù)為橫軸,干擾效益的平均值為縱軸,得到3 種算法的收斂曲線如圖1 所示。
圖1 迭代次數(shù)對(duì)比
由圖1 可以看出,IBPSO 算法通過Logistic 混沌映射的方式初始化種群,使得初代種群的平均適應(yīng)度要高于BPSO 和GA。在總體迭代次數(shù)上,IBPSO 算法迭代42 次后收斂至全局最優(yōu)解,GA 在迭代82 次后收斂至全局最優(yōu),而傳統(tǒng)的BPSO 算法迭代112 次后陷入局部最優(yōu)。由此可見,IBPSO 算法通過動(dòng)態(tài)改變自學(xué)習(xí)因子和社會(huì)學(xué)習(xí)因子的值,調(diào)整2 個(gè)學(xué)習(xí)方向的偏重程度;根據(jù)各粒子在不同維度的位置取值情況,分別對(duì)2 個(gè)速度向量進(jìn)行更新,一定程度上避免了算法陷入局部最優(yōu)。
4.2.2 多次試驗(yàn)性能比較
為對(duì)比IBPSO、BPSO 和GA 三種算法在處理離散優(yōu)化問題的性能,分別設(shè)置20 組不同的m、n、E、W組合參數(shù),3 種算法分別運(yùn)行40 次,獲取不同參數(shù)組合下3 種算法的平均干擾效益和所需迭代次數(shù),由圖2―3 可以看出,在不同組合參數(shù)下,IBPSO 算法相較與BPSO、GA,獲得的平均干擾效益最大且需要的迭代次數(shù)最少。
圖2 3 種算法平均干擾效益
圖3 3 種算法平均迭代次數(shù)
4.2.3 算法統(tǒng)計(jì)性能比較
設(shè)單次尋優(yōu)值與全局最優(yōu)值的差值在0.01 以內(nèi)則視為達(dá)到全局最優(yōu)。在不同運(yùn)算規(guī)模下分別將三種算法運(yùn)行100 次,表3 統(tǒng)計(jì)了各算法在不同運(yùn)算規(guī)模下的尋優(yōu)概率,由表3 可以看出,隨著m、n 增大,三種算法的尋優(yōu)概率均有所降低,易陷入局部最優(yōu)解,其中IBPSO 算法在同一運(yùn)算規(guī)模下,其尋優(yōu)概率均高于BPSO 和GA。
表3 三種算法獲得最優(yōu)決策概率 %
為更詳細(xì)地對(duì)比三種算法的收斂穩(wěn)定性,在同一組m、n 的取值條件下,這里取m=9、n=9,分別將三種算法運(yùn)行100 次并求得全局最優(yōu)值與每次運(yùn)算收斂值的差值,所得收斂誤差如圖4 所示。
由圖4 可以看出,運(yùn)行100 次,IBPSO 算法達(dá)到最優(yōu)解次數(shù)和最差收斂誤差分別為92 次和0.016,BPSO算法達(dá)到最優(yōu)解次數(shù)和最差收斂誤差分別為62 次和0.03,GA 達(dá)到最優(yōu)解次數(shù)和最差收斂誤差分別為79次和0.029。IBPSO 算法的尋優(yōu)概率和收斂性能均要優(yōu)于BPSO 和GA,具有較好的統(tǒng)計(jì)性能。
圖4 收斂誤差對(duì)比
本文提出一種IBPSO 算法,是PSO 算法針對(duì)離散優(yōu)化問題的延伸,主要從以下3 方面的措施保證了IBPSO 算法的優(yōu)化性能:1)采用Logistic 混沌序列初始化,提高初始種群多樣性和均勻性,在一定程度上避免了算法陷入局部最優(yōu),提高了迭代效率;2)采用異步變化的學(xué)習(xí)因子,在算法不同階段有偏重地發(fā)展算法自學(xué)習(xí)和社會(huì)學(xué)習(xí)能力,提高了算法全局搜索能力;3)將速度向量化,并采用不同更新方式,一定程度上優(yōu)化了算法尋優(yōu)概率,減小了收斂誤差。利用組網(wǎng)雷達(dá)干擾機(jī)協(xié)同分配問題進(jìn)行仿真驗(yàn)證,結(jié)果表明,IBPSO 算法在減少迭代次數(shù),提高收斂速度的同時(shí),能夠保證較高的尋優(yōu)概率,減小收斂誤差,取得了明顯優(yōu)于BPSO 算法和GA 算法的優(yōu)化性能?!?/p>