摘" 要:
面向復雜城市環(huán)境中的運動目標搜索與打擊任務,單域無人平臺受視野范圍和運動能力等限制,易出現目標遺漏和任務完成率低的問題。針對這些問題,提出一種面向動態(tài)目標搜索與打擊的空地協(xié)同自主任務分配方法,通過結合無人機視野范圍廣以及無人車機動性強的特點,提升空地無人系統(tǒng)的任務執(zhí)行效率和區(qū)域覆蓋率。一方面,針對未知運動目標,提出一種基于數字信息素的目標搜索模型,以平臺協(xié)同收益和區(qū)域覆蓋率為優(yōu)化指標,保證在盡可能短的時間周期內發(fā)現區(qū)域中的所有目標。另一方面,面向動態(tài)到達的打擊任務,構建基于可行路徑規(guī)劃的任務分配模型,以平臺能耗和任務完成時間為目標函數,在保證任務完成率的同時,提高空地協(xié)同系統(tǒng)的資源利用率。與現有方法相比,所提方法能夠在最短的時間內發(fā)現所有目標,區(qū)域覆蓋率達到55%以上,且資源利用率為84.4%。實驗結果表明,所提方法具備較好的目標搜索和任務執(zhí)行能力。
關鍵詞:
空地協(xié)同; 數字信息素; 目標搜索; 任務分配; 路徑規(guī)劃
中圖分類號:
TP 391.9
文獻標志碼: A""" DOI:10.12305/j.issn.1001-506X.2024.07.17
Air-ground cooperative autonomous task allocation method for
dynamic target search and strike
FEI Bowen, BAO Weidong*, LIU Daqian, ZHU Xiaomin
(College of Systems Engineering, National University of Defense Technology, Changsha 410073, China)
Abstract:
For the task of moving target search and strike in a complicated urban environment, the single-domain unmanned platform is limited by its field of vision and movement capability, which is easy to cause problems of the target omission and the low task completion rate. To solve these problems, an air-ground cooperative autonomous task allocation method for dynamic target search and strike is proposed. It aims to improve the efficiency of task execution and regional coverage of air-ground unmanned systems by combining the characteristics of the wide field of vision of unmanned aerial vehicles and the strong mobility of unmanned ground vehicles. For unknown moving targets, a target search model based on digital pheromones is proposed, which takes platform cooperation income and regional coverage as optimization metrics to ensure that all targets in the region can be found in the shortest possible time period. In addition, for the dynamic arrival strike task, a task allocation model based on feasible path planning is proposed, which takes the platform energy consumption and task completion time as the objective function to ensure the task completion rate and improve the resource utilization of the air-ground cooperative system. Compared with the existing methods, the proposed method can find all targets in the shortest time. The regional coverage rate can reach more than 55%. And the resource utilization rate is 84.4%. Experimental results show that the proposed method has excellent capabilities for target search and task execution.
Keywords:
air-ground cooperation; digital pheromone; target search; task allocation; path planning
0" 引" 言
隨著機器學習和人工智能技術的持續(xù)發(fā)展,自主性和智能性已經成為無人系統(tǒng)研發(fā)的重要趨勢,同時也是系統(tǒng)研究成果落地的重要指標[1]。由于在軍事和民用領域具有廣闊的應用前景,智能自主無人系統(tǒng)的研發(fā)受到世界各國的高度重視,特別是在軍事領域中,無人系統(tǒng)被視為未來智能化戰(zhàn)爭的主力軍[2]。在不確定環(huán)境下將多種異構、離散的無人資源高效組織、協(xié)同規(guī)劃構成一個有效的閉合環(huán)路,對于自主無人系統(tǒng)的構建至關重要,是推進無人系統(tǒng)自主能力發(fā)展的重要一環(huán)。因此,近年來基于多無人平臺協(xié)同優(yōu)化的任務分配、路徑規(guī)劃方法層出不窮,成為學者研究的熱點問題之一[34]。
在單域多平臺協(xié)同優(yōu)化方面,余婧等人[5]綜合考慮任務規(guī)劃的優(yōu)化需求,研究面向多無人機協(xié)同對地攻擊的雙層任務規(guī)劃方法。Yao等人[6]提出分布式任務規(guī)劃框架,以提高分布式多無人機應用中任務分配和路徑規(guī)劃的性能。各無人機能夠在路徑規(guī)劃的過程中評估與任務的匹配度,并對匹配度低的任務進行重規(guī)劃,在獲得更好規(guī)劃結果的同時,消耗更少的計算資源。Ye等人[7]研究異構無人機對地面目標進行防空壓制的協(xié)同多任務分配問題,提出一種改進的遺傳算法(genetic algorithm, GA)與多類型基因染色體編碼策略,提高了多機協(xié)同任務分配的效率。Chen等人[8]針對多無人機協(xié)同任務分配與航跡規(guī)劃問題,提出基于自適應參數調整和雙向搜索的蟻群優(yōu)化算法。同時,設計了一種預測交會點的方法解決運動點不能作為航跡規(guī)劃算法目標點的問題。該方法不僅能有效規(guī)劃無人機的航跡,還進一步提升了多無人機協(xié)同任務執(zhí)行能力。Wei等人[9]將機器人團隊的總成本和工作負載作為優(yōu)化函數,提出一種多目標粒子群優(yōu)化(particle swarm optimization, PSO)方法求解多機器人協(xié)同任務分配問題,保證了多機協(xié)同任務分配的時效性。Chen等人[10]針對無人機集群中的動態(tài)任務分配問題,提出基于競標拍賣的分配機制,在保證實時任務高效分配的前提下,改善了算法在不同參數條件下的適應性。Duan等人[11]提出了一種動態(tài)離散鴿群優(yōu)化算法規(guī)劃多無人機協(xié)同搜索、打擊目標的軌跡。該算法利用貝葉斯公式構造并更新概率圖來指導后續(xù)搜索運動,并在執(zhí)行打擊任務時采用響應閾值Sigmoid模型進行目標分配,提高了無人機編隊的搜索效率。李翰等人[12]針對城市區(qū)域多無人機協(xié)同物流任務分配問題,綜合考慮經濟成本、時間損失等指標,提出多無人機協(xié)同物流任務分配模型,并引入量子粒子群算法進行模型求解。然而,單域無人平臺受視野范圍、地形地貌等因素的影響,易導致區(qū)域不可達和目標遺漏問題。
在跨域異構多平臺協(xié)同優(yōu)化方面,考慮到異構無人機和無人車的不同動力學特性,Luo等人[13]提出一種改進的人工物理方法,針對不同任務類型協(xié)調無人機和無人車到達不同目標區(qū)域,提高了任務分配的完成率。Ni等人[14]圍繞無人機/無人車協(xié)同遂行多任務問題,提出一種階段集成的機制,將多無人平臺協(xié)同控制分為多個子階段,從而完成空地協(xié)同任務分配過程。在此基礎上,Ni等人[15]基于改進的蜻蜓算法(dragonfly algorithm, DA),建立多機器人三維動態(tài)運動模型,并根據仿生神經網絡中神經元的活動優(yōu)化機器人的運動,提出了面向異構多機器人的實時路徑規(guī)劃方法。面向指定區(qū)域覆蓋問題,Wu等人[16]提出基于空地協(xié)同的路徑規(guī)劃方法,將任務完成時間和行進距離作為目標函數,并設計基于分布估計算法(estimation of distribution algorithm, EDA)和GA的混合算法進行求解。仿真結果證明混合EDA-GA算法能夠極大地提高求解質量。梁星星等人[17]構建面向海上移動目標的空天協(xié)同連續(xù)觀測模型,并對衛(wèi)星規(guī)劃、無人機路徑規(guī)劃等多個子問題進行建模求解,該模型能夠有效降低目標的平均觀測周期。另一方面,Li等人[18]將執(zhí)行任務的總體時間作為優(yōu)化指標,提出一種兩級文化基因算法求解無人平臺的路徑規(guī)劃問題。該算法在非法城市建筑探測任務方面取得了較好的路徑規(guī)劃結果。為了提高空天觀測資源協(xié)同觀測能力,李夏苗等人[19]提出一種兩階段迭代優(yōu)化方法,并結合禁忌表策略對任務分配方案進行迭代調整和更新。該方法在任務收益率方面具有較大優(yōu)勢,能夠有效解決觀測資源協(xié)同任務規(guī)劃問題。
綜上所述,現有的研究方法在跨域異構多平臺組織協(xié)同方面均取得了較好的任務完成率。 然而,在現實城市環(huán)境中,仍然存在以下問題急需解決:① 當目標位置動態(tài)變化且運動狀態(tài)、軌跡未知時,如何組織異構無人平臺進行協(xié)同搜索,避免目標遺漏。② 由于跨域無人平臺的異構性,如何根據平臺的特點設置最優(yōu)分配方式,在保證任務完成率的同時,提升平臺之間的協(xié)同效率。針對上述問題,本文提出了面向動態(tài)目標搜索與打擊的空地協(xié)同自主任務分配(air-ground cooperative autonomous task allocation, AGENTS)方法。具體而言,考慮跨域無人平臺視野覆蓋優(yōu)勢和區(qū)域監(jiān)視能力,提出一種改進的基于數字信息素圖的目標搜索模型,提高多平臺協(xié)同目標搜索能力。在此基礎上,鑒于異構無人平臺的特點,建立面向系統(tǒng)能耗和任務時效雙重指標的空地協(xié)同任務分配模型,提升平臺協(xié)同任務執(zhí)行能力。同時,為了發(fā)揮空地無人系統(tǒng)的機動性,本文設定無人機和無人車均進行變速運動,以滿足未知目標的動態(tài)變化,保證各平臺能夠完成被分配的實時任務。
本文的創(chuàng)新之處如下:
(1) 針對無人平臺異構性、目標任務多樣性的問題,建立面向動態(tài)任務的空地協(xié)同組織架構,綜合考慮任務需求、平臺狀態(tài)等因素,旨在增強異構平臺與任務間的匹配度,從而提高多平臺協(xié)同遂行任務的效率。
(2) 面向未知環(huán)境中的動態(tài)目標,提出基于信息素圖的協(xié)同搜索模型,將多平臺的協(xié)同收益和區(qū)域覆蓋率作為優(yōu)化指標,提升空地協(xié)同編隊的目標搜索能力。
(3) 針對多無人平臺任務分配問題,提出面向動態(tài)任務的組織分配模型,以平臺能耗和最短任務完成時間為目標,在保證任務完成率的同時,提高各平臺的資源利用率。
1" 系統(tǒng)架構與模型基礎
在本節(jié)中,首先對建立的空地協(xié)同組織架構進行描述,然后分別對架構中的城市環(huán)境模型、運動目標模型以及無人平臺模型進行詳細說明。
1.1 "系統(tǒng)架構
面向指定區(qū)域的目標打擊任務,動態(tài)任務分配系統(tǒng)要求盡可能多地找出區(qū)域內的運動目標,并根據空地無人平臺的性能,組織編隊對目標進行合力打擊。針對單域平臺受視野范圍等因素的影響,提出基于空地協(xié)同的協(xié)同組織架構,以提高多平臺協(xié)同遂行任務的效率,該架構的組織結構如圖1所示。
該架構的主要功能模塊包括:
(1) 目標搜索模塊。未知城市區(qū)域中目標的位置和數量通常無法獲知,因此目標搜索是協(xié)同打擊的前提。本文利用數字信息素圖組織空地無人平臺進行目標搜索。為了在有效時間內發(fā)現區(qū)域內的所有目標,以基于信息素圖的平臺協(xié)同收益和基于多平臺檢測范圍的區(qū)域覆蓋率為優(yōu)化指標,提升空地無人系統(tǒng)的協(xié)同搜索能力。
(2) 任務分配模塊。當無人平臺發(fā)現目標后,收集目標位置及打擊目標載彈量需求等信息,以平臺能耗和最短任務完成時間為目標函數,建立面向動態(tài)任務的優(yōu)化模型。具體而言,首先計算各無打擊任務的平臺與目標間的可行路徑距離,然后以最大行進速度為依據計算平臺的最短到達時間,最后在滿足打擊任務約束的前提下選擇最優(yōu)數量的平臺參與打擊,提高各無人平臺的資源利用率。
1.2" 城市環(huán)境模型
本文以城市環(huán)境為背景,利用NUAV架無人機和NUGV輛無人車組成編隊對未知區(qū)域Ω執(zhí)行目標搜索和打擊任務。假定該區(qū)域中包含M個運動目標。為了更加貼近實際城市環(huán)境,本文在區(qū)域中設置了建筑物、城建區(qū)域以及街道等約束限制,增加對無人平臺的運動和感知約束。一方面,這些約束限制了無人平臺的運動范圍、減少了平臺的可行路徑,從而增加目標搜索和打擊任務的難度。另一方面,這些約束限制了平臺的感知能力,對于依靠視覺捕獲目標的無人平臺而言,當攝像頭與目標連線上出現障礙物時,平臺因目標部分特征消失而無法感知到目標。
為了便于描述目標搜索與打擊過程,對區(qū)域Ω進行柵格化等分處理,分割為NL×NW個柵格,柵格地圖如圖2所示。在圖2中,假設該區(qū)域的長和寬分別為L和W,每個柵格g的大小為Δl×Δw。藍色長方體表示城市建筑物,其占地面積為9個柵格,白色矩形框為城建區(qū)域,同樣占據9個柵格。與此同時,為了簡化目標識別過程,設定無人機編隊均等高飛行,且搭載的目標檢測攝像頭均垂直向下,其發(fā)現范圍為9個柵格(圖2中的淺藍色區(qū)域)。相應地,橘黃色柵格表示地面無人車的發(fā)現范圍,即僅有發(fā)現前方一個柵格內的目標。由柵格的可達性,每個柵格g(m,n)可賦值為
g(m,n)=0, g(m,n)∈可達區(qū)域
1, 其他(1)
式中:(m,n)為柵格g(m,n)在地圖中的編號索引(m∈[1,NL],n∈[1,NW])。
1.3" 運動目標模型
為了增加目標搜索和打擊任務的挑戰(zhàn)性,本文參考文獻[20]在區(qū)域Ω中設置了不同運動狀態(tài)的目標,并將目標模型的結構體定義為
Targeti={type,movingdirection,trackset(),
foundflag,strikeflag},i∈[1,M](2)
式中:type為目標類型;movingdirection表示目標的運動方向,在基于柵格化的路徑規(guī)劃過程中,目標只能在道路上運動,不能穿過建筑物和城建區(qū)域,將目標在相鄰時刻的行進方向表示如圖3所示。具體標號含義如下:“0”表示向前;“1”表示向右;“2”表示向后;“3”表示向左。 trackset()為目標運動軌跡,記錄目標走過的位置坐標;foundflag為被發(fā)現標志,記錄目標被發(fā)現的時間周期;strikeflag為被打擊標志,記錄目標被打擊的時間。
1.4" 無人平臺模型
假設每一時刻同一柵格最多只存在一個目標,每個無人平臺利用機載攝像頭對區(qū)域Ω中的各柵格執(zhí)行搜索與打擊任務,其行進軌跡由轉彎半徑和速度所決定[2122],即
UVi(t)=[xi(t),yi(t),di(t)](3)
式中:xi(t)、yi(t)表示第t時刻第i個平臺在區(qū)域Ω中的二維位置坐標;di(t)表示轉動方向。需要指出的是,無人機能夠穿過城建區(qū)域,但僅遇到建筑物則需要繞行,因此在相鄰時刻的航行方向設置為八鏈碼方向。而無人車則無論遇到城建區(qū)域還是建筑物均需要繞行,因此其在相鄰時刻的行進方向設置與目標相同,為4個方向,具體表示如圖3所示。無人平臺的運動狀態(tài)表達式為
xi(t+1)=xi(t)+vΔtsin θ
yi(t+1)=yi(t)+vΔtcos θ
d(t+1)=d(t)+Δd(4)
式中:v為無人平臺的行進速度;θ為轉向角,(無人機轉向角θUAV∈[-180°,-135°,-90°,45°,0°,45°,90°,135°],無人車轉向角θUGV∈[-180°,-90°,0°,90°])。因此,無人平臺的模型結構可表示為
UVi={type,movingdirection,sign,bombload,
trackset(),foundflag,strikenum},i∈[1,NUAV+NUGV](5)
式中:type為平臺類型,即無人機或無人車;movingdirection表示平臺的運動方向;sign表示平臺的任務類型,具體分為搜索任務、監(jiān)視任務和打擊任務;bombload為平臺載彈量, 若載彈量為0,則該平臺只能執(zhí)行搜索和監(jiān)視任務;trackset()為平臺運動軌跡,記錄走過的位置坐標;foundnum記錄該平臺進行搜索發(fā)現的目標編號序列;strikenum記錄該平臺進行打擊任務的目標編號序列。
2 "目標搜索建模
根據建立的柵格化地圖,本文通過賦予柵格各類數字信息素濃度引導無人平臺進行目標搜索任務。假設動態(tài)目標如果出現在無人平臺的視野覆蓋區(qū)域內,則認定該平臺發(fā)現了這個目標。因此,在目標搜索的過程中,算法旨在引導空地無人平臺在有限時間內盡可能多地找到運動目標,同時使平臺的柵格覆蓋率最大,以更好地掌握該城市區(qū)域的路況信息。
2.1" 數字信息素
基于數字信息素的搜索算法首先構造初始人工勢場,引導控制無人平臺的行進方向。然后,隨著搜索任務的深入,無人平臺會在地圖上釋放信息素,以不斷更新初始數字信息素圖。該算法的特點是能夠根據吸引信息素濃度,引導無人平臺快速覆蓋城市區(qū)域,且根據排斥信息素濃度促使各平臺的路徑盡可能不重復,“不走冤枉路”的特點。與此同時,根據設定的優(yōu)化指標引導無人平臺規(guī)劃航路和協(xié)同決策,高效地完成目標搜索過程。
(1) 吸引信息素
為降低任務區(qū)域Ω的不確定度,引入吸引信息素概念[2324]。假設Sa(k)=(sa(m,n,k))L×W為第k個預測周期的吸引信息素矩陣,其中sa(m,n,k)表示柵格g的吸引信息素濃度,其初始值為常數。吸引信息素的更新規(guī)則為
Sa(k)=(1-Ea)((1-Ga)[Sa(k-1)+
da(E-V)]+GPa(k))(6)
式中:Ea和Ga分別代表吸引信息素的揮發(fā)系數和傳播系數;da是吸引信息素釋放的常數;GPa(k)是吸引信息素的傳播矩陣;E為單位矩陣;V=(vmn)L×W是一個特殊的二值矩陣,其元素均等于0或1。 當且僅當上一個預測周期內至少任意一個無人機搜索g時,vmn=0。GPa(k)=(gpa(m,n,k))L×W是在(k-1,k]時段從相鄰柵格到g的信息濃度,gpa(m,n,k)的計算公式為
gpa(m,n,k)=Ga1Lmn∑gmn∈Usa(x,y,k-1)+da(7)
式中: U是g的相鄰柵格集合;gmn∈U是該柵格的相鄰柵格之一;Lmn是相鄰柵格的總數。吸引信息素僅在無人平臺未搜索的柵格中釋放。通過吸引信息素,平臺能夠被引導到未經搜索的柵格中。
(2) 排斥信息素
為避免平臺間重復搜索已搜索過的柵格, 引入排斥信息素,其更新規(guī)則與吸引信息素相對應,即設定Sr(k)=(sr(m,n,k))L×W為第k個預測周期的排斥信息素矩陣,其中sr(m,n,k)在第k個周期的排斥信息素濃度,其更新規(guī)則為
Sr(k)=(1-Er)((1-Gr)[Sr(k-1)+drV]+GPr(k))(8)
式中:Er和Gr代表排斥信息素的揮發(fā)系數和傳播系數;dr是吸引信息素釋放的常數;GPr(k)是傳播矩陣。GPr(k)=(gpr(m,n,k))L×W是在(k-1,k]時段從相鄰柵格到g的信息濃度,gpr(m,n,k)的計算公式為
gpr(m,n,k)=Gr1Lmn∑gmn∈Usr(x,y,k-1)+dr(9)
需要指出的是,排斥信息素只在上一個預測周期訪問的柵格中釋放,利用排斥信息素能夠避免重復搜索柵格。兩種信息素的傳播示例如圖4 所示,藍色框表示建筑物,其信息素值始終為0。 從圖4可以看出,兩種信息素互斥,在吸引信息素中無人平臺未走過的區(qū)域均為黃色,置信度最高(其值為1),而走過的區(qū)域則置信度較低,說明其信息素濃度低,對平臺的吸引力相對較低。相反地,在排斥信息素中未走過的區(qū)域均為淺綠色,置信度均在0.6左右,而平臺走過的區(qū)域呈黃色,即當前預測周期將不會考慮這些柵格。
2.2" 優(yōu)化指標
利用第2.1節(jié)建立的數字信息素,綜合考慮多平臺間的協(xié)同能力和區(qū)域覆蓋能力,建立基于平臺協(xié)同收益和區(qū)域覆蓋率的優(yōu)化指標,具體描述如下。
(1) 平臺協(xié)同收益
基于數字信息素圖中吸引信息素和排斥信息素的釋放與稀釋,平臺間的協(xié)同收益性能指標Jc(k)定義如下:
Jc(q)=∑Nk=1[e1-kN(sa(q+k)-sr(q+k))](10)
式中:N是預測總步長;sa(q+k)和sr(q+k)分別代表了q時刻各平臺在第k個預測周期下所處柵格的吸引信息素和排斥信息素值。Jc(q)中吸引信息素可引導平臺搜索未知柵格,排斥信息素可避免重復搜索歷史柵格,在這兩種信息素的作用下,多無人平臺可盡量不重復地搜索柵格,從而高效搜索任務區(qū)域。
(2) 區(qū)域覆蓋率
在限定的時間周期內,為了更好地掌握城市區(qū)域的結構信息,空地協(xié)同搜索應保證每一時刻平臺的整體區(qū)域覆蓋率最大化,即盡可能多地探測區(qū)域信息。平臺間的區(qū)域覆蓋率指標Jo(q)定義如下:
Jo(q)=∑Nk=1(N-k+1)2N·∑NUAVi=1R′i+∑NUGVj=1R′jNUAVRUAV+NUGVRUGV(11)
式中:(N-k+1)2/N為預測時間域的動態(tài)系數, 由于目標動態(tài)性,預測周期越長則區(qū)域覆蓋利用度越低,因此使用動態(tài)系數平衡計算覆蓋利用率受預測周期長度的影響。NUAV表示無人機總數量,NUGV表示無人車總數量,NUAV+NUGV=N;RUAV示理想情況下無人機的區(qū)域覆蓋面積,R′i表示在當前周期下第i個無人機UAVi去除建筑物遮擋后的實際區(qū)域覆蓋面積。相應地,RUGV理想情況下無人車的區(qū)域覆蓋面積,R′j表示在當前周期下第j個無人車UGVj去除與無人機發(fā)生重復覆蓋后的實際覆蓋面積。
max Js(q)=max[λ1Jc(q)+λ2Jo(q)](12)
式中:λ1和λ2分別是協(xié)同收益和覆蓋率的歸一化權重系數。Js體現了當前周期下多平臺的整體性能優(yōu)劣,基于加深迭代策略,每次迭代Js都會有不同程度的提高,待迭代結果穩(wěn)定后的取值即為當前預測周期的最優(yōu)解。
3" 任務分配建模
當無人平臺發(fā)現目標后,根據實時收集的目標信息,建立空地協(xié)同優(yōu)化模型進行任務分配。在任務分配的過程中,假設一旦目標被無人平臺發(fā)現,則該目標將不再運動,從而根據目標的位置和載彈量要求,以平臺能耗和最短任務完成時間為目標,建立面向動態(tài)任務的優(yōu)化模型,實現對目標的精準打擊。在此基礎上,利用A*算法[2526]動態(tài)規(guī)劃各無人平臺達到目標點的行進路徑,確保打擊路徑的可行性。
3.1" 目標函數
在任務分配的模型中,設定平臺能耗和最短任務完成時間為目標函數,具體定義如下。
(1) 平臺能耗
由于機載電池的限制,追求更低的行進成本是空地無人平臺遂行任務的首要目標,決定著精準打擊任務的成敗。平臺能耗是指面向動態(tài)到達的任務,無人平臺由起止點達到目的地的過程中產生的能量消耗,包括電池能耗、機電損耗等方面[27],平臺能耗的定義為
C1=∑NUAVi=1ηiDisigni+∑NUGVj=1ηjDjsignj(13)
式中:ηi表示UAVi在單位飛行距離的能量消耗;ηj表示UGVj的單位能耗;D為無人平臺的行進距離;sign為分配決策變量,其表達式為
signi=1, i∈搜索任務
2, i∈監(jiān)視任務
3, i∈打擊任務(14)
式中:“1”表示當前平臺在執(zhí)行搜索任務,能夠被分配打擊任務;“2”表示當前平臺由于機載彈量不滿足打擊要求,處于目標監(jiān)視狀態(tài),等待其他平臺輔助打擊,此時該平臺不能參與其他打擊任務;“3”表示當前平臺在執(zhí)行打擊任務,不能參與其他打擊任務。因此,只有當signi=1時,當前無人機才能夠參與任務分配, 作為優(yōu)化模型的輸入。
(2) 最短任務完成時間
執(zhí)行時效性是動態(tài)任務分配模型必須要考慮的因素,特別是面向動態(tài)目標的打擊任務,一旦錯失最佳打擊時間,后果將不堪設想。因此, 在本文的動態(tài)任務分配過程中,希望到達的實時任務能夠在盡可能短的時間內完成,從而保證任務的時效性要求。最短任務完成時間的定義為
C2=∑NUAVi=1DisignivmaxUAV+∑NUGVj=1DjsignjvmaxUGV(15)
式中:vmaxUAV和vmaxUGV分別表示無人機和無人車的最大行進速度。綜合考慮上述兩種優(yōu)化指標,動態(tài)任務分配的目標函數C可表示為
min C=min(α1C1+α2C2)(16)
式中:α1和α2為歸一化權重系數,α1+α2=1。
3.2" 約束條件
在空地協(xié)同執(zhí)行任務的過程中,應對平臺間的安全距離、載彈量以及區(qū)域環(huán)境進行約束判斷,避免發(fā)生路徑不可達、平臺損毀等問題。這3項約束的具體表達式如下。
(1) 安全距離約束
在空地協(xié)同執(zhí)行任務過程中,為了避免同域(空域或地域)平臺發(fā)生碰撞,對多機和多車之間的距離要求是十分必要的[2829]。為了簡化對無人平臺間的安全距離統(tǒng)計的描述,將所有無人機和無人車進行數字標號,并按升序依次計算兩平臺間的距離,具體計算公式如下:
UAVΔxi,k=(xi,t-xk,t)2
Δyi,k=(yi,t-yk,t)2
Δxi,k+Δyi,k≥dminUAVi=1,2,…,NUAV-1
k=i+1,i+2,…,NUAV(17)
UGVΔxj,k=(xj,t-xk,t)2
Δyj,k=(yj,t-yk,t)2
Δxj,k+Δyj,k≥dminUGVj=1,2,…,NUGV-1
k=j+1,j+2,…,NUGV(18)
式中:UAV和UGV分別表示針對無人機和無人車的安全距離統(tǒng)計;dminUAV和dminUGV均為常數,分別表示無人機和無人車編隊的最小安全距離。
(2) 不可達區(qū)域約束
在城市環(huán)境中,不可達區(qū)域是十分重要的問題,直接決定著優(yōu)化模型的實用性。在本文中, 無人機主要設定的不可達區(qū)域為建筑物,即無人機在執(zhí)行任務時必須繞過建筑物。而無人車的不可達區(qū)域為建筑物和城建區(qū)域,即僅能在街道上行進。因此,不可達區(qū)域的表達式為
(xUAVi,t,yUAVi,t)建筑物, i=1,2,…,NUAV
(xUGVj,t,yUGVj,t)∈街道, j=1,2,…,NUGV
(19)
(3) 載彈量約束
在動態(tài)任務分配過程中,本文主要面向打擊任務,因此平臺載彈量是十分必要的前提。若平臺的載彈量為0,則該平臺不能參與任務分配, 只能執(zhí)行目標搜索和監(jiān)視任務。在此基礎上,被安排執(zhí)行打擊任務的多平臺還應滿足以下約束條件:
∑NUAVi=1strikei,t+∑NUGVj=1strikej,t≥striketarget(20)
式中:strikei,t為無人平臺i在第t時刻的載彈量;striketarget為被發(fā)現目標所需的打擊量。
3.3 "協(xié)同優(yōu)化模型
基于上述對目標模型和約束條件的描述,整合得到面向動態(tài)任務的協(xié)同優(yōu)化模型如下:
min C=min(α1C1+α2C2)
s.t. Δxi,k+Δyi,k≥dminUAV
Δxj,k+Δyj,k≥dminUGV
(xUAVi,t,yUAVi,t)建筑物
(xUGVj,t,yUGVj,t)∈街道
∑NUAVi=1strikei,t+∑NUGVj=1strikej,t≥striketarget(21)
當動態(tài)打擊任務到達時,載彈量和任務類型是首要考慮的問題,若平臺載彈量為0或任務類型不為搜索任務,則不參與本次分配。求解上述優(yōu)化模型的關鍵是計算各無人平臺到達目標點的可行路徑,為了滿足任務分配的時效性,本文利用A*算法計算各平臺的可行路徑,通過平臺的當前位置(起點)、目標位置(終點)以及經過目標搜索建立的城市路障信息進行解算,從而得到各平臺的可行路徑。
4" 算法實現
在本節(jié)中,首先對城市環(huán)境中的動態(tài)目標搜索和任務分配算法進行介紹,并給出相應的算法步驟說明。
4.1" 目標搜索算法
本文引入數字信息素圖對未知城市區(qū)域進行動態(tài)目標搜索,具體實現流程如算法1所示。
算法 1" 目標搜索算法
1初始化信息素參數;
2初始化平臺和目標的運動狀態(tài)及屬性;
3foundt←0;
4while foundtlt;M do
5" for i=1 to NUAV+NUGV do
6" if UVi.tasktype==1 then
7""" all_path←get_path(UVi,N);
8""" Js←0;
9""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
10""" UVi.strackset()←(xi,t-1,yi,t-1);
11""" 判斷UVi檢測范圍內是否包含目標;
12""" if UVi.foundnum==1 then
13"""" foundt=foundt+1;
14""" end if
15""" 共享UVi檢測信息;
16" else
17""" 任務分配算法();
18" end if
19" end for
20" 利用式(6)和式(8)更新Sa和Sr;
21" for i=1 to NUAV+NUGV do
22" for k=1 to N do
23"""" 利用式(4)規(guī)劃下一時刻平臺UVi的可行位置點;
24"""" 利用式(12)計算Js(k);
25"""" get_path(UVi,N)←Js(k);
26" end for
27" (xi,t,yi,t)←max Js;
28" end for
29end while
在算法1中,首先初始化數字信息素參數以及無人平臺和目標的運動狀態(tài)。其次,設置初始發(fā)現目標數foundt為0,開始目標搜索任務。在初始搜索中, 將UVi在t-1時刻的位置進行賦值,并加入到運動軌跡序列UVi.strackset()中。根據無人機和無人車的不同檢測范圍(見圖2),判斷UVi檢測范圍內是否包含目標。若包含運動目標,則將UVi.foundnum的值賦為1,同時更新發(fā)現目標數,即foundt=foundt+1。然后,在全局數字地圖上共享UVi檢測信息。在此基礎上,利用所有平臺的位置信息通過式(6)和式(8)分別更新吸引信息素Sa和排斥信息素Sr。在平臺UVi的位置更新方面,利用基于平臺協(xié)同收益和區(qū)域覆蓋率的雙重指標進行優(yōu)化計算。設置平臺的位移步長為N,利用式(4)計算UVi的所有相鄰可行位置點組合(除去不可達區(qū)域),通過式(12)計算各個組合的指標值。最后,將具有最優(yōu)指標值的可行位置點賦值于UVi。反復上述過程,直至所有運動目標被找到,完成空地無人平臺的搜索任務。
4.2" 任務分配算法
當無人平臺發(fā)現目標后,任務分配算法被觸發(fā),整合無人資源對目標進行打擊操作,該算法的具體實現流程如算法2所示。
算法 2" 任務分配算法
1確定目標位置及打擊量;
2AP()←[];
3for i=1 to NUAV+NUGV do
4if UVi.bombloadlt;1 or UVi.tasktype!=1 do
5" continue;
6" else
7" 利用A*計算UVi到達目標點的可行路徑APi();
8" end if
9end for
10根據路徑的距離對AP()進行降序排列;
11計算滿足式(21)的最少平臺數量num;
12保存相應的type、ID、AP();
13for inum=1 to num do
14" if typeinum==UAV then
15"" tstrike(inum)=AP()/vmaxUAV;
16" else
17"" tstrike(inum)=AP()/vmaxUGV;
18" end if
19end for
20for i=1 to NUAV+NUGV do
21" if ID==i then
22" if UVi.taskflag==2 and UVi.bombloadlt;1 then
23"""" twait=min(tstrike);
24"""" if twaitgt;0 then
25""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
26""""" UVi.strackset()←(xi,t-1,yi,t-1);
27""""" twait=twait-1;
28"""" else
29""""" UVi.taskflag=1
30"""" end if
31" elif UVi.taskflag==2 and UVi.bombload≥1 then
32"""" twait=max(tstrike);
33"""" if twait≥1 then
34""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
35""""" UVi.strackset()←(xi,t-1,yi,t-1);
36""""" twait=twait-1;
37"""" else
38""""" UVi.taskflag=1
39"""" end if
40" else
41"""" twait=max(tstrike);
42"""" while twait≥1 do
43""""" if AP()==[] then
44""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
45"""""" UVi.strackset()←(xi,t-1,yi,t-1);
46""""" else
47""""" (xi,t,yi,t)←AP(1);
48"""""" AP(1)←AP(1+vmaxUV);
49""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
50"""""" UVi.strackset()←(xi,t-1,yi,t-1);
51""""" end if
52""""" twait=twait-1;
53"""" end while
54"""" UVi.taskflag=1;
55" end if
56" end if
57end for
在任務分配執(zhí)行前,利用搜索算法確定目標的實時位置和打擊量。在分配算法中,首先對所有平臺進行遍歷,若平臺的載彈量為0或已分配其他打擊任務(UVi.tasktype !=1),則在本次分配中刪去該平臺,增加任務的執(zhí)行效率。其次,利用A*算法對剩余的無人平臺進行路徑規(guī)劃,并記錄各平臺的可行軌跡點集AP()。將記錄的軌跡點集進行降序排列,利用建立的優(yōu)化函數進行優(yōu)化求解,得到滿足目標打擊量的平臺屬性。然后,根據選用無人平臺的type計算達到目標點所需要的時間。對于被選中的平臺UVi,若UVi.taskflag==2并且UVi.bombloadlt;1,這說明該平臺無法進行打擊任務,因此該平臺負責監(jiān)視目標,實時報告目標的位置,待其他平臺趕到目標點時(等待時間twait=min(tstrike)),該平臺將任務類型轉換為搜索任務,退出本次打擊任務。若該平臺的載彈量滿足UVi.bombload≥1時,仍需對目標的打擊量進行判斷。若twaitlt;1,說明該平臺能夠獨立完成打擊,則實施打擊操作,待完成后將平臺狀態(tài)轉換為搜索任務。若twait≥1, 說明該平臺的打擊力不夠,需要其他平臺支援打擊,則twait=max(tstrike)。此外,當任務狀態(tài)為3時,說明該平臺被選用為協(xié)助打擊平臺,待打擊任務完成后任務類型也將轉換為搜索任務,從而完成當前動態(tài)到達的目標打擊任務。
5" 實驗結果與分析
空地無人平臺和目標的初始參數以及數字信息素圖的初始參數是本文方法的重要組成部分,因此本節(jié)首先對這些參數進行描述。為了說明AGENTS的先進性,本節(jié)還設計了多組與現有方法的對比實驗,從定性和定量角度分析說明優(yōu)化模型的有效性。最后,為了體現算法的全面性,對所使用的無人平臺數量、城市區(qū)域面積進行了擴展性討論,分析AGENTS的實際可行性。
5.1" 實驗參數設置
本文利用柵格對城市區(qū)域Ω進行等比例劃分,共有82×82個柵格,每個柵格的實際邊長為10 m。為了增加目標搜索和路徑規(guī)劃的難度, 在區(qū)域Ω中共設置了59個建筑物和341個城建區(qū)域,每個建筑物或城建區(qū)域均占用9個柵格, 且十分密集,從而更好地模擬復雜城市壞境。本文實驗選用8架無人機和8輛無人車組成空地協(xié)同編隊進行搜索和打擊任務,這些無人機和無人車的基本參數分別如表1和表2所示。同時,參考文獻[20],在此區(qū)域中分別設置了9個3類運動狀態(tài)的目標,其初始運動狀態(tài)如表3所示。
同時,本文設定無人機編隊的最小安全距離dminUAV=20 m,無人車編隊的最小安全距離dminUGV=10 m;無人機和無人車在單位行進距離下的能耗分別為0.005 W和0.006 W。此外,數字信息素[20,24]是計算搜索模型的協(xié)同編隊收益的重要指標,直接決定著目標搜索及打擊任務的成敗。因此,本節(jié)對其主要參數設置進行說明。① 吸引信息素:揮發(fā)系數Ga=0.3,傳播系數Ea=0.4,釋放常數da=1;② 排斥信息素:揮發(fā)系數Gr=0.3,傳播系數Er=0.4,釋放常數dr=10;③ 系數常量:預測步長N=3,協(xié)同收益權重λ1=0.5,區(qū)域覆蓋率權重λ2=0.5。
5.2" 實驗對比分析
為了驗證本文提出的動態(tài)任務分配方法的先進性,選用文獻[24]分布式模型預測控制(distributed model predictive control, DMPC)和文獻[30]局部粒子群優(yōu)化(local particle swarm optimization, LPSO)兩種現有流行方法進行對比,考察打擊目標數、路徑覆蓋率、整體運行時間等主要指標,分析3種方法的優(yōu)越性。
DMPC方法是基于貝葉斯理論對目標的運動狀態(tài)進行估計,并在原有數字信息素的基礎上設計了調度信息素,從而保證了多平臺協(xié)同搜索目標的能力。由于此方法不包含任務分配功能,因此本文加入簡單的任務分配模式, 即到達任務及時處理的機制,采用空閑平臺執(zhí)行打擊任務。由于DMPC方法也采用數字信息素進行目標搜索,為了保證實驗的公平性,該方法的吸引和排斥信息素參數設置與AGENTS相同,而調度信息素的釋放常量dd=5。
LPSO方法將搜索區(qū)域分為大小相等的單元,每個單元與目標發(fā)生概率和無人機接收到的命中數相關聯?;诤献骱透偁嶱SO算法,構建分布式協(xié)同模型,從而提高多平臺的目標搜索能力。與DMPC方法相同,此方法同樣不包含任務分配功能,為了體現算法對比的公平性,將本文設計的任務分配機制加入到此方法中。LPSO方法的主要參數設置為:控制個體“認知”的c1和決定群體“社交”的c2均為2;個體和群體權重系數分別為0.5和0.5;目標識別閾值B=0.99。
3種方法的目標搜索與打擊結果分別如圖5~圖8所示。圖5顯示了空地無人平臺應用這3種方法的三維行進路線,本文假設無人機在等高平臺飛行,不同顏色的點表示各無人平臺的路徑點。圖6和圖7分別顯示了3種方法在空域和地域的平臺分布情況,其中無人機的行進方向為8個,無人車的則為4個。圖8顯示了各方法的目標發(fā)現數與區(qū)域覆蓋率的數據圖。
從圖5可以看出,3種方法均能較好地完成目標搜索與打擊任務,且各無人平臺均能分布在城市的各個角落,具有較強的目標搜索能力。AGENTS和LPSO的任務分配能力強于DMPC,各平臺的行進路徑更少,所執(zhí)行的時間周期更短。為了清晰地顯示各平臺的行進路線,圖6和圖7分別顯示了各域的行進軌跡。可以看出,AGENTS的協(xié)同能力更強,無人機與無人車的路徑覆蓋形成了互補,在無人機未涉及的區(qū)域,無人車能夠及時補充,協(xié)同完成目標搜索與打擊任務。與DMPC相比,AGENTS采用了相同的目標搜索機制,更好地實現了動態(tài)任務分配。AGENTS利用能耗和最短距離作為優(yōu)化指標,促使各平臺能夠在更短的時間內打擊目標,從而繼續(xù)進行區(qū)域搜索任務,既保證了任務的完成率,也提高了多平臺動態(tài)目標搜索效率。與LPSO相比,AGENTS利用信息素圖的方法進行區(qū)域搜索,有效避免路徑重復的問題。綜上所述,AGENTS使得無人機與無人車之間的重復路徑更少,無人機主要分布在城市區(qū)域的中央位置,無人車更多地分布在區(qū)域四周,因此相同周期下的區(qū)域覆蓋率更高,目標搜索能力更強。
為了更加清晰直觀地對比3種方法的性能, 圖8展示了3種方法在目標發(fā)現數量和區(qū)域覆蓋率方面的對比結果。從圖8可以看出,AGENTS的時間周期更短,在相同時間內目標發(fā)現數量最多,區(qū)域覆蓋率最高。具體而言,AGENTS在163個時間周期內完成目標搜索與打擊任務,而LPSO在259個周期內完成任務,DMPC耗時最長,在533個周期內才能發(fā)現并打擊目標。需要指出的是,AGENTS與DMPC的目標搜索能力較強,均能夠在60個周期內發(fā)現7個目標,而LPSO則需要120個周期才能發(fā)現同等數量的目標,這進一步證明了采用數字信息素圖的方式是行之有效的。另一方面,與DMPC相比,AGENTS的打擊任務分配效率更高,能夠在發(fā)現目標后及時分配平臺進行目標打擊,而DMPC則需要花費500個周期才能完成目標打擊任務,這也證明了本文提出的動態(tài)任務分配模型的有效性,采用最短任務完成時間作為優(yōu)化指標,對整個系統(tǒng)進行任務規(guī)劃,提升了任務執(zhí)行效率。
為了進一步定量分析3種方法的性能,本節(jié)對不同時間周期下的目標發(fā)現數、打擊數、區(qū)域覆蓋率以及運行時間進行了對比分析??紤]實驗的公平性,本文對3種方法分別進行10次獨立運行,并取平均結果作為最終的數據統(tǒng)計結果。3種方法在不同周期下的定量對比如表4所示。
在表4中,由于AGENTS和LPSO方法在300個時間周期內即可找出全部目標,因此本文僅統(tǒng)計了300個時間周期下的定量數據。從表4中的數據可以看出,本文提出的AGENTS具有協(xié)同優(yōu)勢。在100個時間周期內,3種方法的區(qū)域覆蓋率達到30%以上,AGENTS能夠發(fā)現7個目標,并成功打擊其中的6個。LPSO在此周期內僅能發(fā)現并打擊4個運動目標,DMPC的發(fā)現目標數為6,但也僅能打擊其中的4個目標。 隨著任務的不斷深入,AGENTS的優(yōu)勢愈發(fā)體現,例如在200個周期內能夠找出并打擊所有目標,而其他兩種方法僅能有效打擊6個目標。
與LPSO方法相比,AGENTS不僅在限定時間能夠打擊更多的目標,且運行時間也優(yōu)于其他兩種方法,在200個周期內將算法運行時間減少了25 s,這說明利用數字信息素對運動目標搜索是十分有效的,而粒子群優(yōu)化算法在復雜城市環(huán)境中易陷入局部最優(yōu),且周期較長。另一方面,DMPC方法在100個周期內的運行時間比AGENTS節(jié)約了1.5 s。但隨著時間持續(xù)進行,由于AGENTS能夠在170個周期內快速打擊所有目標, 其他時間僅進行搜索任務,因此在200個周期時,最終執(zhí)行時間比DMPC減少了15 s,這進一步證明了任務分配模型的有效性。本文以最小完成時間為指標,在提升了目標打擊效率的同時,縮短了算法的整體運行時間。
5.3" 模型擴展性評估
本節(jié)列舉并分析了平臺數量和平臺載彈量對任務分配模型的影響,進而體現AGENTS的實用性和模型可擴展性。
(1) 無人平臺數量對任務分配結果的影響
在空地協(xié)同任務分配模型中,無人平臺的數量直接影響了遂行任務的結果。本節(jié)僅對平臺的數量進行考核,假設平臺的其他參數(載彈量、速度區(qū)間)均不變,平臺數量由原來的16個依次增加到20、24個,評估提出模型的可擴展性。為了體現均衡性,增加的4個平臺中包含2架無人機和2輛無人車。圖9展示了不同平臺數量下的區(qū)域覆蓋率和運行時間結果。
圖9中的統(tǒng)計數據均為運行了10次后的平均統(tǒng)計結果。從圖9可以看出,隨著平臺數量的不斷增加,城市區(qū)域的覆蓋率也隨之增加,但算法的整體運行時間卻在不斷減小。這種現象的原因是:一方面由于平臺數量的增加,執(zhí)行目標搜索的平臺將不斷地在城市區(qū)域中穿梭,因此隨著平臺的增加,探測的區(qū)域將隨之擴大。另一方面,在任務分配的過程中,當平臺數量充足的情況下,模型僅需要找到離目標點最近的平臺完成打擊任務即可,且等待打擊時間也有所降低,因此計算時長將被縮短,當平臺數量達到24時, AGENTS的整體算法運行時間僅為109 s,且能夠在138個時間周期即可完成目標搜索和動態(tài)打擊任務。
(2) 平臺載彈量對任務分配結果的影響
平臺載彈量是另一個影響任務分配結果的重要指標,因此本節(jié)同樣對其進行實驗評估,設定平臺數量和速度區(qū)間均不變,由于本文設定的目標打擊量最大為4,即表明若無人平臺的載彈量能夠達到4時,該平臺能夠獨立完成對所有目標的打擊任務,因此平臺載彈量由原來的2個依次增加到3、4個,從而評估任務分配模型的可擴展性。圖10展示了不同載彈量下的區(qū)域覆蓋率和運行時間結果。
在圖10中,隨著平臺載彈量的增加,AGENTS的區(qū)域覆蓋率也隨之增加。這是因為在打擊目標時,大部分平臺能夠獨立完成打擊任務,而無需等待其他平臺輔助,其他平臺則能夠繼續(xù)執(zhí)行目標搜索任務,從而擴大空地協(xié)同搜索范圍,從而增加了城市區(qū)域的覆蓋率。在算法運行時間方面,平臺載彈量同樣有著重要的影響,當載彈量達到4時,AGENTS僅需120 s即可完成打擊任務,由于每個平臺均能獨立完成打擊任務,減少了平臺等待和其他無人平臺路徑規(guī)劃的時間,與載彈量為2時相比算法計算時間減少了13 s。
6" 結束語
針對復雜城市環(huán)境中的未知動態(tài)目標打擊問題,提出了面向動態(tài)目標搜索與打擊的空地協(xié)同自主任務分配方法,旨在提高目標打擊成功率和城市區(qū)域覆蓋率。具體而言,針對區(qū)域中的未知運動目標,提出一種改進的基于數字信息素的目標搜索方法,構建了面向多平臺協(xié)同收益和區(qū)域覆蓋率的雙重優(yōu)化指標,從而提升目標的發(fā)現率和城市區(qū)域的覆蓋率。在此基礎上,面向動態(tài)到達的目標打擊任務,以平臺能耗和最短任務完成時間為目標函數,提出多任務組織分配優(yōu)化模型,規(guī)劃出平臺的最優(yōu)可行路徑,從而保證任務的完成率。與當前流行的方法相比,本文提出的AGENTS在區(qū)域覆蓋率和發(fā)現目標數方面均具備較大優(yōu)勢,特別是在相同的時間周期內,AGENTS的目標打擊能力更強,且算法的運行時間最短。實驗結果表明,AGENTS在保證動態(tài)任務執(zhí)行率的同時,增強了對復雜城市環(huán)境的區(qū)域覆蓋能力。
目前,空地多平臺協(xié)同遂行任務所面臨的最大難題為通信鏈路不穩(wěn)定問題,特別是在復雜城市環(huán)境中,由于障礙物和建筑物的干擾易導致原有的通信鏈路不可達。未來的研究工作將從空中無人機和地面無人車的實際通信能力角度出發(fā),重點突破局部通信條件下的空地協(xié)同優(yōu)化問題,充分考慮地面與空中通信鏈路的動態(tài)連接與斷開問題,使得設計的空地協(xié)同優(yōu)化模型能夠在實際城市環(huán)境中發(fā)揮作用,更好地完成目標搜索與打擊任務。
參考文獻
[1] SANTOSO F, GARRATT M, ANAVATTI S. State-of-the-art integrated guidance and control systems in unmanned vehicles: a review[J]. IEEE Systems Journal, 2021, 15(3): 33123323.
[2] 張婷婷, 藍羽石, 宋愛國. 無人集群系統(tǒng)自主協(xié)同技術綜述[J]. 指揮與控制學報, 2021, 7(2): 127136.
ZHANG T T, LAN Y S, SONG A G. An overview of autonomous collaboration technologies for unmanned swarm systems[J]. Journal of Command and Control, 2021, 7(2): 127136.
[3] LIU D Q, BAO W D, ZHU X M, et al. Cooperative path optimization for multiple UAVs surveillance in uncertain environment[J]. IEEE Internet of Things Journal, 2022, 9(13): 1067610692.
[4] ZHU L H, WANG Y, WU Z Q. An adaptive priority allocation for formation UAVs in complex context[J]. IEEE Trans.on Aerospace and Electronic Systems, 2021, 57(2): 10021015.
[5] 余婧, 雍恩米, 陳漢洋, 等. 面向多無人機協(xié)同對地攻擊的雙層任務規(guī)劃方法[J]. 系統(tǒng)工程與電子技術, 2022, 44(9): 28492857.
YU J, YONG E M, CHEN H Y, et al. Bi-level mission planning framework for multi-cooperative UAV air-to-ground attack[J]. Systems Engineering and Electronics, 2022, 44(9): 28492857.
[6] YAO W R, QI N M, WAN N, et al. An iterative strategy for task assignment and path planning of distributed multiple unmanned aerial vehicles[J]. Aerospace Science and Technology, 2019, 86: 455464.
[7] YE F, CHEN J, TIAN Y, et al. Cooperative multiple task assignment of heterogeneous UAVs using a modified genetic algorithm with multi-type-gene chromosome encoding strategy[J]. Journal of Intelligent amp; Robotic Systems, 2020, 100(2): 615627.
[8] CHEN X, LIU Y T, YIN L Y, et al. Cooperative task assignment and track planning for multi-UAV attack mobile targets[J]. Journal of Intelligent amp; Robotic Systems, 2020, 100(3): 13831400.
[9] WEI C Y, JI Z, CAI B L. Particle swarm optimization for cooperative multi-robot task allocation: a multi-objective approach[J]. IEEE Robotics and Automation Letters, 2020, 5(2): 25302537.
[10] CHEN C, BAO W D, MEN T, et al. NECTAR-an agent-based dynamic task allocation algorithm in the UAV swarm[J]. Complexity, 2020: 6747985.
[11] DUAN H B, ZHAO J X, DENG Y M, et al. Dynamic discrete pigeon-inspired optimization for multi-UAV cooperative search-attack mission planning[J]. IEEE Trans.on Aerospace and Electronic Systems, 2021, 57(1): 706720.
[12] 李翰, 張洪海, 張連東, 等. 城市區(qū)域多物流無人機協(xié)同任務分配[J]. 系統(tǒng)工程與電子技術, 2021, 43(12): 35943602.
LI H, ZHANG H H, ZHANG L D, et al. Multiple logistics unmanned aerial vehicle collaborative task allocation in urban areas[J]. Systems Engineering and Electronics, 2021, 43(12): 35943602.
[13] LUO Q N, DUAN H B. An improved artificial physics approach to multiple UAVs/UGVs heterogeneous coordination[J]. Science China Technological Sciences, 2013, 56(10): 24732479.
[14] NI J J, TANG M, CHEN Y N, et al. An improved cooperative control method for hybrid unmanned aerial-ground system in multitasks[J]. International Journal of Aerospace Engineering, 2020, 2020: 114.
[15] NI J J, WANG X T, TANG M, et al. An improved real-time path planning method based on dragonfly algorithm for heterogeneous multi-robot system[J]. IEEE Access, 2020, 8: 140558140568.
[16] WU Y, WU S B, HU X T. Cooperative path planning of UAVs amp; UGVs for a persistent surveillance task in urban environments[J]. IEEE Internet of Things Journal, 2021, 8(6): 49064919.
[17] 梁星星, 修保新, 范長俊, 等. 面向海上移動目標的空天協(xié)同連續(xù)觀測模型[J]. 系統(tǒng)工程理論與實踐, 2018, 38(1): 229240.
LIANG X X, XIU B X, FAN C J, et al. The aerospace coope-rative planning model for maritime moving target continuation observation[J]. Systems Engineering-Theory amp; Practice, 2018, 38(1): 229240.
[18] LI J Q, SUN T, HUANG X P, et al. A memetic path planning algorithm for unmanned air/ground vehicle cooperative detection systems[J]. IEEE Trans.on Automation Science and Engineering, 2022, 19(4): 27242737.
[19] 李夏苗, 廖文昆, 伍國華, 等. 基于兩階段迭代優(yōu)化的空天觀測資源協(xié)同任務規(guī)劃方法[J]. 控制與決策, 2021, 36(5): 11471156.
LI X M, LIAO W K, WU G H, et al. A two-stage iterative optimazation method for the coordinated task planning of space and air observation resources[J]. Control and Decision, 2021, 36(5): 11471156.
[20] MEN T, LIU D Q, ZHU X M, et al. Cooperative target search for UAVs in urban environment[C]∥Proc.of the IEEE International Conference on Smart City and Informatization, 2021: 814.
[21] YAO P, WANG H L, JI H X. Multi-UAVs tracking target in urban environment by model predictive control and improved grey wolf optimizer[J]. Aerospace Science and Technology, 2016, 55: 131143.
[22] JUANG C F, YEH Y T. Multi-objective evolution of biped robot gaits using advanced continuous ant-colony optimized recurrent neural networks[J]. IEEE Trans.on Cybernetics, 2018, 48(6): 19101922.
[23] LIU Z, GAO X G, FU X W. A cooperative search and cove-rage algorithm with controllable revisit and connectivity maintenance for multiple unmanned aerial vehicles[J]. Sensors, 2018, 18(5): 1472.
[24] 肖東, 江駒, 周俊, 等. 通信受限下多無人機協(xié)同運動目標搜索[J]. 哈爾濱工程大學學報, 2018, 39(11): 18231829.
XIAO D, JIANG J, ZHOU J, et al. Multi-UAV cooperation search for moving targets under limited communication[J]. Journal of Harbin Engineering University, 2018, 39(11): 18231829.
[25] 基于A星算法求解路徑規(guī)劃問題[EB/OL]. [20211125].https:∥blog.csdn.net/qq_59747472/article/details/121547551.
Solving Path Planning Problems Based on A-Star Algorithm[EB/OL]. [20211125].https:∥blog.csdn.net/qq_59747472/article/details/121547551.
[26] A星算法(基于matlab)[EB/OL]. [20190410]. http:∥blog.csdn.net/lmq_zzz/article/details/88999480.
A-Star Algorithm (Based on matlab)[EB/OL]. [20190410]. http:∥blog.csdn.net/lmq_zzz/article/details/88999480.
[27] RAMIREZ-ATENCIA C, BELLO-ORGAZ G, R-MORENO M, et al. Solving complex multi-UAV mission planning problems using multi-objective genetic algorithms[J]. Soft Computing, 2017, 21: 48834900.
[28] ROBIN C, LACROIX S. Multi-robot target detection and tracking: taxonomy and survey[J]. Autonomous Robots, 2016, 40(4): 729760.
[29] FEI B W, BAO W D, ZHU X M, et al. Autonomous cooperative search model for multi-UAV with limited communication network[J]. IEEE Internet of Things Journal, 2022, 9(19): 1934619361.
[30] SAADAOUI H, BOUANANI F E. Information sharing based on local PSO for UAVs cooperative search of unmoved targets[C]∥Proc.of the International Conference on Advanced Communication Technologies and Networking, 2018.
作者簡介
費博雯(1991—),女,博士后,主要研究方向為無人系統(tǒng)資源組織協(xié)同與優(yōu)化。
包衛(wèi)東(1971—),男,教授,博士,主要研究方向為指揮信息系統(tǒng)、復雜網絡。
劉大千(1992—),男,博士后,主要研究方向為智能無人系統(tǒng)、目標檢測與跟蹤。
朱曉敏(1979—),男,教授,博士,主要研究方向為分布式協(xié)同與群體智能。