司翠平,劉映泉
(1.南京機電職業(yè)技術(shù)學(xué)院電子工程系,江蘇 南京 211135) (2.南京大翼航空科技有限公司,江蘇 南京 211800)
無人機蜂群研究是近年來的熱點。隨著科技的進步,無人機蜂群已經(jīng)具有很強的環(huán)境信息采集能力,可以實現(xiàn)對目標的跟蹤監(jiān)視、自主探測,且具有定位功能。無人機蜂群在執(zhí)行任務(wù)時容易出現(xiàn)蜂群對抗,此時蜂群的任務(wù)執(zhí)行效率便是決定勝負的重要因素,而任務(wù)分配是決定任務(wù)執(zhí)行效率的重要一環(huán)[1]?,F(xiàn)有的無人機蜂群任務(wù)分配方法,對于無人機蜂數(shù)量超過20架的無人機蜂群控制效果已滿足不了實際需求,因此對于無人機蜂群任務(wù)分配方法的改進迫在眉睫。為獲得無人機蜂數(shù)量龐大的無人機蜂群任務(wù)分配的最優(yōu)解,本文首先對蜂群的任務(wù)分配過程進行分析[2],得到無人機蜂群任務(wù)分配目標函數(shù);再進行無人機蜂群任務(wù)分配策略分析[3],構(gòu)建無人機蜂群任務(wù)分配模型[4];接著基于多種群機制和帕累托分配理論對多目標灰狼優(yōu)化算法進行改進[5];最后通過仿真模擬[6]與其他常規(guī)算法進行仿真對比,得到性能分析結(jié)果。
由于無人機執(zhí)行任務(wù)時在三維環(huán)境下的自由度極高,因此在進行任務(wù)分配時需要多方面考慮以保證分配算法的計算速率和分配方案能得到最優(yōu)解。設(shè)定對抗雙方的無人機型號、數(shù)量、信號影響等條件完全相同,i表示己方無人機,(xi,yi,zi)為己方無人機的空間位置;j表示敵方無人機,(xj,yj,zj)為敵方無人機的空間位置,則雙方無人機的距離dij為:
(1)
設(shè)任務(wù)分配決策變量為sij,當無人機i分配的敵方無人機為j時,sij=1;否則sij=0。
無人機任務(wù)分配的所有可能性矩陣kmn為:
(2)
式中:m、n分別為己方無人機數(shù)量和敵方無人機數(shù)量。
無人機執(zhí)行任務(wù)的過程是一個三維動態(tài)過程,因此在進行任務(wù)分配時,需要考慮無人機調(diào)整姿態(tài)和狀態(tài)的耗時[7],在無人機執(zhí)行任務(wù)時還需要考慮無人機與目標之間的相對運動狀態(tài),以保證任務(wù)完成質(zhì)量。無人機和目標間的相對運動狀態(tài)可分為接近與遠離,在進行任務(wù)分配時優(yōu)先考慮相互接近的無人機配對,同時考慮追擊概率、消耗代價等因素,選擇最佳的分配任務(wù)。
在出現(xiàn)無人機蜂群對抗時,為增加己方無人機的獲勝概率,需要盡可能保證無人機的安全,并消滅敵方無人機。本文選擇無人機執(zhí)行某個目標任務(wù)時的成本、收益、時間耗費代價函數(shù),對無人機任務(wù)分配方案的優(yōu)劣進行分析。
查閱相關(guān)資料[8],任務(wù)執(zhí)行成本fthreat的計算表達式為:
(3)
式中:Valuei為己方無人機對于某一任務(wù)的執(zhí)行能力,Pth,j為敵方無人機j的威脅概率。
無人機執(zhí)行某任務(wù)的收益fattack,主要由己方無人機的攻擊能力和敵方無人機受到攻擊時的生存能力決定,其計算表達式為:
(4)
式中:Valuej為敵方無人機的防御能力,pa,i為己方無人機i攻擊時的優(yōu)勢概率。
在進行任務(wù)分配時,應(yīng)選擇成本較小、收益較大的無人機執(zhí)行目標任務(wù),基于式(3)和式(4),得到成本與收益的損失代價函數(shù)J1為:
J1=w1fthreat-w2fattack
(5)
式中:w1為任務(wù)執(zhí)行成本的權(quán)重系數(shù),w2為任務(wù)執(zhí)行收益的權(quán)重系數(shù)。一般根據(jù)決策經(jīng)驗獲取w1和w2的數(shù)值。
對相遇的雙方無人機,可通過雙方的距離和軸速度、離軸角確定相遇時間,其時間代價值J2表達式為:
(6)
式中:vi和vj分別為無人機i和j的軸速度,θi和θj分別為己方無人機i相對于敵方無人機j的離軸角和敵方無人機j相對于己方無人機i的離軸角。
通過上述分析,即可得到無人機蜂群的任務(wù)分配模型,即:
minJ(s)=(J1,J2)
(7)
(8)
(9)
(10)
J2≤J2max
(11)
式中:J(s)、J2、J2max分別為任務(wù)分配決策變量、時間代價值和最大時間代價值。
式(8)對任務(wù)數(shù)量進行約束,包括所有的攻擊目標,在實際對抗中,由于各種因素的限制,應(yīng)盡可能多地使敵方無人機被攻擊。式(9)和式(10)對無人機之間的協(xié)同關(guān)系進行約束,式(11)對任務(wù)執(zhí)行時間進行約束。
由于無人機蜂群任務(wù)分配模型中約束條件較多,且各約束條件間相互影響,各約束函數(shù)的權(quán)重難以界定,因此需通過多目標優(yōu)化算法進行任務(wù)分配方案最優(yōu)解的求解。為提高多目標優(yōu)化算法的計算速度,引入多種群機制對無人機和任務(wù)目標進行編碼。編碼內(nèi)容包括對抗雙方所有無人機的空間坐標、位姿、速度、攻擊概率、攻擊能力、威脅概率、防御能力、分配決策變量等,無人機編碼結(jié)構(gòu)如圖1所示。
圖1 無人機蜂群編碼結(jié)構(gòu)示意圖
由于傳統(tǒng)的二進制編碼不能體現(xiàn)無人機的多個變量,因此本文采用整數(shù)編碼方式。如在無人機對抗中有4個己方無人機對抗4個敵方無人機,己方無人機的的二進制分配決策矩陣為[0,0,1,0],那么表示己方無人機被分配的目標為3,對應(yīng)的整數(shù)編碼為3。
由于子群的最優(yōu)任務(wù)分配方案可能不止一個,因此為選擇出更為合適的最優(yōu)分配方案,設(shè)計圖2所示的匹配規(guī)則。規(guī)定1個無人機最多被3個無人機同時攻擊,在無人機對抗時,若執(zhí)行某個攻擊任務(wù)的無人機數(shù)量超過3個,則將優(yōu)劣順序排在3以后的無人機分配給其他候選目標,若無其他候選目標,則重新選擇與其相匹配未分配的任務(wù)目標,若不存在未分配的任務(wù)目標,無人機則原地待命。
圖2 匹配規(guī)則
選擇多目標灰狼優(yōu)化(multi-objective gray wolf optimizer,MOGWO)算法[11]作為核心算法。但傳統(tǒng)的MOGWO算法易陷入全局最優(yōu),因此引入帕累托分配理論(MP)和多種群機制對傳統(tǒng)多目標優(yōu)化算法進行改進[12-13],得到改進的MOGWO(IMOGWO)算法。該算法首先利用多種群機制對無人機和任務(wù)目標進行編碼,構(gòu)建無人機子群初始分配決策變量;然后通過MOGWO算法對抽象的任務(wù)分配模型進行求解,算出多個初始解;最后利用帕累托支配策略對初始解進行篩選,通過多次迭代更新,選出帕累托最優(yōu)前沿,即為任務(wù)分配的最優(yōu)解。其流程如圖3所示。
圖3 改進后算法求解流程圖
相較于傳統(tǒng)的任務(wù)分配算法,IMOGWO算法通過隨機搜索方法進行迭代,不會錯過對任一解的對比,且需要核定的參數(shù)較少,誤差較小,迭代過程的收斂速度較快,能夠更快地獲取分配結(jié)果,適用于多個維度的求解。
在10 km×10 km×1 km的任務(wù)區(qū)域內(nèi),考慮風(fēng)力對無人機飛行的影響[14-15],設(shè)無人機在順風(fēng)時的最大移動速度為60 m/s,逆風(fēng)時的最大移動速度為40 m/s,單次飛行的最大距離為7 km,Pa,i和Pth,j取值為0~1,無人機價值在(10,100)范圍內(nèi)。己方無人機數(shù)量為20,敵方無人機的數(shù)量為10,其位置初始分布如圖4所示。
圖4 對抗雙方無人機初始分布
3.2.1無人機蜂群任務(wù)分配結(jié)果
分別采用IMOGWO算法與傳統(tǒng)MOGWO算法進行無人機蜂群任務(wù)分配仿真模擬,得到仿真對比結(jié)果見表1。
表1 兩種算法的任務(wù)分配結(jié)果對比表
從表1中可知,IMOGWO算法中考慮了多個無人機共同執(zhí)行同一個任務(wù)的可能,且分配方案較多,可調(diào)節(jié)性更強。
通過匹配規(guī)則自動選出最為合適的任務(wù)分配方案,最終得到的任務(wù)分配結(jié)果如圖5所示。
圖5 IMOGWO算法的任務(wù)分配結(jié)果圖
由圖5可以看出,通過優(yōu)化求解,除敵方無人機6和己方無人機15、19之間的任務(wù)分配失敗,其余全部分配成功。說明IMOGWO算法在該場景下的任務(wù)分配效率高。
3.2.2算法有效性仿真驗證
表2 3種算法的平均代價值
由表2可知,在相同的迭代次數(shù)下,IMOGWO算法的損傷代價值和時間代價值較MOGWO有所降低,這是由于IMOGWO算法具有較強的隨機搜索能力,因此損傷代價在迭代過程中更容易收斂。IMOGWO算法求解過程中,多種群機制能夠為無人機分配多個任務(wù)目標,能夠獲得更多的分配解,灰狼算法的加入,讓最優(yōu)分配解的求解得到簡化,因此時間代價值得以減小。綜上,IMOGWO算法能夠明顯提高無人機蜂群執(zhí)行任務(wù)的能力。
3.2.3算法收斂性仿真驗證
通過時間代價函數(shù)和損傷代價函數(shù)驗證算法的收斂性。迭代次數(shù)越少,收斂速度越快,算法收斂性越好。經(jīng)過100次迭代,IMOGWO算法與傳統(tǒng)MOGWO算法的收斂曲線如圖6所示。
圖6 兩種算法的損失代價和時間代價曲線
從圖6可知,兩種算法的時間代價值和損傷代價值相差不大,但IMOGWO算法經(jīng)過55次迭代即可獲得代價最小值,比MOGWO算法少15次,因此IMOGWO算法的收斂性較好。這是由于多種群機制的加入,讓IMOGWO算法具有更多的任務(wù)方案,能夠擁有更多的執(zhí)行任務(wù)的機會。匹配規(guī)則的加入,使方案具有多樣性和有效性,且灰狼算法能夠跳出局部最優(yōu)解,能夠使無人機得到充分利用。
本文引入多種群機制和帕累托分配理論對無人機蜂群傳統(tǒng)的任務(wù)分配算法進行改進,得到IMOGWO算法。經(jīng)過仿真驗證可知,該算法得到的分配方案較多,具有較多的可選擇性。計算過程快速,具有普適性,且最終獲得的分配方案更優(yōu),使無人機蜂群執(zhí)行對抗任務(wù)時具有較大的優(yōu)勢。但本文僅對任務(wù)分配算法進行改進,未對任務(wù)分配進行優(yōu)化,需要約束的目標函數(shù)較多,且最終的任務(wù)分配方案中尚有無人機和任務(wù)未能夠成功匹配,因此還有較大的改進空間。