李 崢,蔡譯鋒,吳 軍
(西南電子設(shè)備研究所,四川 成都 610036)
反輻射無人機作為重要的硬殺傷武器,能夠自主完成尋的和制導,實現(xiàn)對威脅輻射源的動態(tài)打擊[1]。傳統(tǒng)運用反輻射無人機多為單機或雙機編組對單個目標進行預置參數(shù)式打擊。隨著戰(zhàn)場輻射源目標數(shù)量的增多、地理密度增加和戰(zhàn)技手段增強,預置模式的打擊效果明顯下降。同時使用多架無人機構(gòu)建無人機集群,對敵方的多部威脅輻射源進行集群式打擊[2]的作戰(zhàn)模式,集群式打擊應(yīng)運而生,。
多目標分配是集群作戰(zhàn)中有助于提升作戰(zhàn)效能的一項關(guān)鍵問題[3],學界的相關(guān)研究提供了不同的解決方式。最簡單的解決方式為遍歷法,通過對所有目標分配方案進行遍歷,選取作戰(zhàn)效能最大的方案,但是面臨計算量過大的問題。滿意決策法對遍歷法進行了改進,對每個無人機劃定可能的作戰(zhàn)目標范圍,在范圍內(nèi)進行搜索,從而提高計算效率[4-5]。當存在定性約束條件時,模糊推理法根據(jù)實際情況和專家經(jīng)驗給出不同目標定性條件重要度的相對隸屬度關(guān)系,從而實現(xiàn)無人機集群作戰(zhàn)中的目標分配[6]。博弈論方法考慮攻防雙方對目標分配的影響,能夠較逼真地反映作戰(zhàn)過程,使目標分配結(jié)果對作戰(zhàn)效能具有較大的提升作用[7]。隨著各種智能算法的發(fā)展,無人機作戰(zhàn)目標分配找到了新的發(fā)展方向[8],粒子群算法[9]和遺傳算法[10]將目標分配問題建模為數(shù)值問題進行計算,簡化分析過程,但普遍面臨局部最小化的問題;而聚類算法[11]將目標根據(jù)屬性相似性聚集成類,建模過程相對復雜。
現(xiàn)有無人機集群作戰(zhàn)目標分配算法普遍面臨計算量大、不能定量分析和局部最小化等問題,在實戰(zhàn)應(yīng)用中的可實現(xiàn)性較差。為探索更為貼近實戰(zhàn)使用的無人機作戰(zhàn)目標分配方法,本文以最大化作戰(zhàn)效能期望為目標,利用貪心法設(shè)計出一種作戰(zhàn)目標分配算法,該方法能夠得到全局最優(yōu)解,并且計算量較小,具備工程可實現(xiàn)性,能夠為實戰(zhàn)中的反輻射無人機自主作戰(zhàn)目標分配提供理論支撐。
不同輻射源威脅程度存在差異,集群式反輻射運用需要對無人機集群進行作戰(zhàn)目標分配,確定每個無人機的攻擊對象,提升整體作戰(zhàn)效能。同時,在執(zhí)行任務(wù)過程中,作戰(zhàn)進程會隨作戰(zhàn)過程不斷變化,造成戰(zhàn)前目標分配策略需要根據(jù)實時戰(zhàn)場情況快速、準確地完成目標重分配。在無人機集群式作戰(zhàn)模式下,不同無人機之間的協(xié)同通常通過構(gòu)建無中心的自組網(wǎng)絡(luò)并采用分布式控制算法完成,最大程度上減少無人機集群在任務(wù)執(zhí)行過程中對地面站以及空地通信鏈路的依賴。在機間自組網(wǎng)和分布式自主協(xié)同的架構(gòu)下,無人機的各類控制算法必須在自身的內(nèi)置計算芯片上實現(xiàn),這就要求面向任務(wù)執(zhí)行過程中的無人機動態(tài)作戰(zhàn)目標分配算法必須能適應(yīng)無人機芯片計算能力有限的現(xiàn)實情況。因此,反輻射無人機作戰(zhàn)目標分配方法不僅需要能夠最大化優(yōu)化集群作戰(zhàn)效能,還需要算法高效以滿足實時目標重分配的高時效性要求[12]。
在進行作戰(zhàn)目標分配時,假設(shè)當前目標輻射源數(shù)量m、各輻射源權(quán)重wi以及打擊成功率pi均已知。由于各無人機的性能完全相同,則由n架無人機組成的集群進行作戰(zhàn)目標分配的本質(zhì)為確定分配到各目標輻射源的無人機個數(shù)。因此,無人機集群的作戰(zhàn)目標分配策略可用包含m個元素的集合S={ci|i=1,2,…,m}來表示,其中,ci∈[0,n]是分配到第i個輻射源的無人機數(shù)量。
由于在進行作戰(zhàn)目標分配時,打擊任務(wù)還未完成,因此無法計算集群作戰(zhàn)效能Q,可通過計算集群作戰(zhàn)效能Q的數(shù)學期望作為對集群作戰(zhàn)效能的評估準則,并在此基礎(chǔ)上進行目標分配方案設(shè)計。對于一種給定的分配策略S,其對應(yīng)的集群作戰(zhàn)效能的數(shù)學期望為:
(1)
綜上,本論文需要解決的問題可描述為:在給定目標輻射源數(shù)量m、各輻射源權(quán)重wi、打擊成功率pi、無人機數(shù)量n的情況下,尋找一種目標分配策略S= {ci|i=1,2,…,m},使集群作戰(zhàn)效能的數(shù)學期望E(S)最大化。
Δ=k(m,n+1)-k(m,n)=
(2)
由式(2)可以看出,m≥2的情況下,k(m,n)的值隨著n的增加單調(diào)遞增,在m=2時保持線性增長,而在m≥3的情況下,k(m,n)的增速隨n的增大而增大。上述結(jié)論可理解為,隨著反輻射打擊場景規(guī)模的增大,目標分配方案的總數(shù)持續(xù)增多,若采用遍歷法對問題去進行求解,其所需的計算時間將隨著打擊場景規(guī)模的增大而快速增加。戰(zhàn)場態(tài)勢變化迅速,進行目標重分配計算必須盡快完成才能適應(yīng)作戰(zhàn)要求。因此,采用遍歷法難以適用上述動態(tài)目標分配的場景。
為解決上述問題,本文采用“貪心法”[16]實現(xiàn)一種高效的目標分配策略。
wi[(1-pi)di(j)-(1-pi)di(j)+1],
(3)
式中,di(j)是在第j輪分配之前,已經(jīng)分配到輻射源i上的無人機數(shù)量。在對所有的m個輻射源的分配增益都計算完畢后,選擇其中分配增益最大的輻射源,并將該輻射源分配給第j架無人機。重復上述過程直到給所有的無人機都完成作戰(zhàn)目標分配。
上述算法流程如圖1所示。
圖1 算法流程
對于問題1中任何一個分配策略S={ci|i=1,2,…,m},都可以通過依次為n架無人機分配其作戰(zhàn)目標的方式獲得。
(4)
式中,u(j)是在第j輪中為第j架無人機分配的目標輻射源編號。對于輻射源i,由S={ci|i=1,2,…,m}可知共ci架無人機分配了該目標。將式(4)中所有滿足u(j)=i的ci個分量提取出來,設(shè)上述ci個分量對應(yīng)的無人機編號由小到大依次為v(1),v(2),…,v(ci),則上述ci個分量的和為:
wi[(1-pi)di(v(1))-(1-pi)di(v(1))+1]+
wi[(1-pi)di(v(2))-(1-pi)di(v(2))+1]+…+
wi[(1-pi)di(v(ci))-(1-pi)di(v(ci)+1)]=
wi[(1-pi)0-(1-pi)1]+
wi[(1-pi)1-(1-pi)2]+…+
wi[(1-pi)ci-1-(1-pi)ci]=
wi[1-(1-pi)ci]。
(5)
綜合考慮所有的m個輻射源有:
(6)
即Fn與分配策略S對應(yīng)集群作戰(zhàn)效能相等。進而,問題1可等價于:
在給定目標輻射源數(shù)量m、各輻射源權(quán)重wi、打擊成功率pi、無人機數(shù)量n的情況下,尋找一種目標分配策略S= {ci|i=1,2,…,m},使Fn最大化。
對Φ(i,j)關(guān)于j求偏導可得:
(7)
Φ(i,j)≥Φ(i,j')。
(8)
也一定是所有可能當中最大的,由式(6)可知,采用本文算法得到策略的集群作戰(zhàn)效能的數(shù)學期望也是最大的。
為驗證所述目標分配方法的效能,首先通過仿真對該方法所對應(yīng)的作戰(zhàn)效能期望以及計算時間進行測試,然后設(shè)計反輻射無人機集群執(zhí)行反輻射任務(wù)的典型場景,驗證使用該方法進行戰(zhàn)前靜態(tài)目標分配以及臨機動態(tài)目標分配所對應(yīng)的作戰(zhàn)效果。
本節(jié)針對所述目標分配方法,利用Matlab進行仿真,分析對應(yīng)的作戰(zhàn)效能期望和計算時間情況。
仿真分為2組,分別分析在輻射源數(shù)量m和無人機數(shù)量n變化時,所述方法對應(yīng)的作戰(zhàn)效能期望和計算時間變化情況,并且在每組仿真中均同時選擇遍歷法和遺傳算法作為對照組。遺傳算法的終止進化代數(shù)設(shè)為50,種群大小設(shè)為200。
在第1組仿真當中,令m從2~10以1為步進進行變化。其他參數(shù),令n=10,各輻射源的權(quán)重wi隨機生成,并令打擊成功率pi與wi負相關(guān)。共進行100次重復獨立試驗,將所有重復獨立試驗的平均值作為最終結(jié)果。
圖2給出了當目標輻射源數(shù)量變化時,采用3種方法生成的策略所對應(yīng)的作戰(zhàn)效能期望情況??梢钥闯?,當目標輻射源數(shù)量變大時,作戰(zhàn)效能的期望呈現(xiàn)遞減趨勢。這是由于在無人機數(shù)量確定的情況下,當目標數(shù)增大時,由于平均分配到每個目標上的無人機數(shù)不斷減少,造成對每個目標打擊成功概率減小,從而導致整體作戰(zhàn)效能的持續(xù)降低。同時,由圖2還可以看出,采用本方法與采用遍歷法得到的全局最優(yōu)策略的效能相同,證明了本方法所得到解的全局最優(yōu)性。遺傳算法得到的解的效能在輻射源數(shù)量較少時十分接近最優(yōu)解,但隨著輻射源數(shù)量的增大,與最優(yōu)解之間開始出現(xiàn)差距。
圖2 m變化時對應(yīng)的作戰(zhàn)效能期望
圖3給出了當目標輻射源數(shù)量變化時,采用3種方法生成策略所需要的計算時間情況。在輻射源較少時,遺傳算法所需要的計算計算時間遠大于遍歷法和本方法。隨著輻射源數(shù)量的增多問題復雜度也隨之增大,3種方法所需的計算時間均呈增長趨勢。其中遍歷法的增長速度最快并且逐漸超過了遺傳算法,遺傳算法和本方法的增長速度相對緩慢??傮w而言,本文中的方法相較于其他2種方法的計算效率優(yōu)勢十分明顯。
圖3 m變化時對應(yīng)的計算時長
在第2組仿真當中,令n從10~18以1為步進進行變化。其他參數(shù),令m=10,各輻射源的權(quán)重wi隨機生成,并令打擊成功率pi與wi負相關(guān)。共進行100次重復獨立試驗,將所有重復獨立試驗的平均值作為最終結(jié)果。
圖4給出了當集群無人機數(shù)量變化時,采用3種方法生成的策略所對應(yīng)的作戰(zhàn)效能期望情況。可以看出,當無人機數(shù)量變大時,作戰(zhàn)效能的期望呈現(xiàn)遞增趨勢。這是由于在需要打擊的輻射源數(shù)量固定的情況下,所使用的無人機數(shù)越多,能分配到每個目標上的平均無人機數(shù)也越多,從而提升了對各目標的打擊成功概率,進而提升了整體的作戰(zhàn)效能期望。在參數(shù)變化過程中,采用遍歷法和本方法所得到的策略對應(yīng)的效能期望始終相同,采用遺傳算法得到的效能期望略低于其他2種方法,這說明采用遺傳算法并不能得到全局最優(yōu)解。
圖4 n變化時對應(yīng)的作戰(zhàn)效能期望
圖5給出了當集群無人機數(shù)量變化時,采用3種方法生成策略所需要的計算時間情況??梢钥闯鲭S著無人機數(shù)量的增多,3種方法所需的計算時長均呈增加趨勢,但遍歷法增長速度明顯高于其他2種方法。本文中的方法所需的計算時間在此次仿真中始終保持在1 ms以內(nèi),相較于2種對照方法中相對較優(yōu)的遺傳算法也有3個數(shù)量級以上的優(yōu)勢。
圖5 n變化時對應(yīng)的計算時長
通過上述2組仿真,可以看出本方法能夠得出無人機集群執(zhí)行反輻射打擊任務(wù)時的目標分配問題的全局最優(yōu)解,并且所需計算時間遠小于遍歷法以及遺傳算法,隨著場景規(guī)模的擴大,本方法在計算速度方面的優(yōu)勢變得越為明顯,適用于規(guī)模較大的集群式作戰(zhàn)場景。因此,本方法具備在無人機內(nèi)部計算芯片上進行集成實現(xiàn)的條件,從而能夠有效支撐無人機集群在任務(wù)執(zhí)行過程中的目標動態(tài)分配。
通過設(shè)計一種無人機集群執(zhí)行反輻射任務(wù)的典型場景,利用仿真對比采用本方法進行靜態(tài)和動態(tài)目標分配的效果。
仿真所選用的典型場景如圖6所示,由n架無人機組成的集群從起飛點出發(fā),經(jīng)過突防通道抵達任務(wù)區(qū)對任務(wù)區(qū)內(nèi)的敵方地面雷達進行反輻射打擊。在無人起飛前,已知掌握到信息的目標數(shù)量為m,但在作戰(zhàn)過程中又有L個新目標被發(fā)現(xiàn)。
圖6 典型反輻射打擊任務(wù)仿真場景
在仿真過程中,令L的取值從1~10以1為步進進行變化,其他參數(shù),m=10,n=20,各輻射源的權(quán)重wi隨機生成,并令打擊成功率pi與wi負相關(guān)。對于L的每一種取值,均進行1 000次重復獨立試驗。所有重復獨立試驗完成后,取所有作戰(zhàn)效能Q的均值作為最終結(jié)果。
為了進行對比,對同一場景分別使用靜態(tài)分配和動態(tài)分配2種策略。靜態(tài)分配策略是指在無人機起飛前完成對已知的m的作戰(zhàn)目標的分配,在任務(wù)執(zhí)行程中不再進行全局調(diào)整;動態(tài)分配策略是指在起飛前形成初始目標分配策略,在突防過程中若發(fā)現(xiàn)新的目標則重新進行全局目標分配。靜態(tài)和動態(tài)的目標分配算法均使用本論文中的方法。
圖7描繪了在戰(zhàn)場新發(fā)現(xiàn)雷達數(shù)變化時,采用動態(tài)和靜態(tài)目標分配策略所取得的作戰(zhàn)效能平均值變化情況。
圖7 動態(tài)/靜態(tài)策略作戰(zhàn)效能對比(絕對值)
可以看出,隨著戰(zhàn)場新發(fā)現(xiàn)雷達數(shù)的增加,無論是采用靜態(tài)分配還是動態(tài)分配策略,最終的集群作戰(zhàn)效能均呈下降趨勢。這是因為任務(wù)總目標變多時,無人機數(shù)量并未增大,平均到每個目標上的無人機數(shù)量降低,降低了將目標實際摧毀的概率,造成最終的任務(wù)完成情況不斷變差。在2種策略當中,由于動態(tài)分配能夠根據(jù)戰(zhàn)場雷達數(shù)量的變化,從全局優(yōu)化的角度重新分配各無人機的作戰(zhàn)目標,故而其實際作戰(zhàn)效能始終大于采用靜態(tài)分配方法的效能。
圖8描繪了在戰(zhàn)場新發(fā)現(xiàn)雷達數(shù)變化時,動態(tài)/靜態(tài)策略作戰(zhàn)效能對比??梢钥闯?,隨著戰(zhàn)場新發(fā)現(xiàn)雷達數(shù)的增加,采用動態(tài)策略的作戰(zhàn)效能與采用靜態(tài)策略的作戰(zhàn)效能之間的比值不斷增大,即動態(tài)策略的效能優(yōu)勢隨著戰(zhàn)場新發(fā)現(xiàn)雷達數(shù)的增大而增大。因為戰(zhàn)場新發(fā)現(xiàn)雷達數(shù)越多,最終的真實打擊場景與戰(zhàn)前預期的差異也越大,造成了靜態(tài)分配策略對最終真實打擊場景的適應(yīng)性不足,進而造成靜態(tài)分配策略的作戰(zhàn)效能快速下降。
圖8 動態(tài)/靜態(tài)策略作戰(zhàn)效能對比(相對值)
本文針對反輻射無人機集群在執(zhí)行對多個輻射源目標的打擊任務(wù)時的目標分配問題,建立了問題的數(shù)學模型,采用“貪心法”提出了一種可獲得全局最優(yōu)解的目標分配策略方法,并對該方法的全局最優(yōu)性進行了數(shù)學證明。通過計算機仿真,驗證了該方法與通過遍歷法獲得的全局最優(yōu)解的一致性,同時在計算效率上相較于經(jīng)典的次優(yōu)算法——遺傳算法有明顯的優(yōu)勢,從而使得該方法具有在計算資源有限的無人機內(nèi)部芯片上實現(xiàn)的可行性。仿真結(jié)果同時顯示了基于本方法對作戰(zhàn)目標進行動態(tài)分配能夠有效地提升集群作戰(zhàn)任務(wù)的效能,相較于靜態(tài)目標分配是一種更優(yōu)的目標分配策略。
本文進行問題建模時只考慮了反輻射打擊任務(wù)的完成情況,未考慮與之相對應(yīng)的無人機開銷。在后續(xù)的研究中,將考慮為實現(xiàn)給定作戰(zhàn)效能所應(yīng)使用的最少無人機數(shù)等問題,從而提供更為貼近實戰(zhàn)的理論成果。