張 堃, 華 帥, 袁斌林, 杜睿怡
(1. 西北工業(yè)大學(xué)電子信息學(xué)院, 陜西 西安 710072; 2. 光電控制技術(shù)重點(diǎn)實(shí)驗(yàn)室, 河南 洛陽(yáng) 471000; 3. 國(guó)防科技大學(xué)空天科學(xué)學(xué)院, 湖南 長(zhǎng)沙 410073)
近年來(lái),利用大量低成本、輕量級(jí)[1]的中小型無(wú)人機(jī)構(gòu)建自主無(wú)人機(jī)作戰(zhàn)群成為現(xiàn)代無(wú)人集群的一個(gè)重要發(fā)展方向[2];其可搭載各種電子設(shè)備或武器單元,代替單一平臺(tái),通過(guò)個(gè)體間行為緊密耦合協(xié)同來(lái)突破對(duì)動(dòng)態(tài)復(fù)雜作戰(zhàn)環(huán)境適應(yīng)性的缺陷[3]。隨著信息化軍事變革越來(lái)越深入,以網(wǎng)絡(luò)中心戰(zhàn)[4]和分布式殺傷[5]為代表的各種作戰(zhàn)樣式不斷涌現(xiàn),這些基于信息柵格的網(wǎng)絡(luò)化作戰(zhàn)樣式為當(dāng)前傳統(tǒng)集群的指揮控制方式帶來(lái)了巨大沖擊,這使得對(duì)無(wú)人集群指揮控制的研究成為軍事領(lǐng)域的研究熱點(diǎn)。利用真實(shí)的戰(zhàn)爭(zhēng)對(duì)指揮控制領(lǐng)域的相關(guān)問(wèn)題進(jìn)行研究是最理想的,但其成本和代價(jià)可能是無(wú)法估量和不可承受的。那么,利用仿真對(duì)組織設(shè)計(jì)、任務(wù)規(guī)劃等指揮控制相關(guān)問(wèn)題進(jìn)行深入研究就成為解決上述難題的有效手段。對(duì)于任何系統(tǒng)仿真,都要先解決模型建立的問(wèn)題,指揮控制系統(tǒng)及其所屬的作戰(zhàn)環(huán)境是橫跨物理域、信息域和認(rèn)識(shí)域的復(fù)雜系統(tǒng),如何對(duì)這樣一個(gè)復(fù)雜系統(tǒng)進(jìn)行建模和仿真,已成為當(dāng)前急需解決的問(wèn)題。
以組織理論為代表的傳統(tǒng)指揮控制系統(tǒng)在設(shè)計(jì)上主要是基于效果的作戰(zhàn)思維[6],缺少對(duì)系統(tǒng)中各要素之間協(xié)同與對(duì)抗的動(dòng)態(tài)策略設(shè)計(jì),將作戰(zhàn)任務(wù)的劃分簡(jiǎn)化為資源匹配問(wèn)題,缺少與現(xiàn)實(shí)指揮控制權(quán)限和指揮流程的考慮[7]。以復(fù)雜網(wǎng)絡(luò)[8]和智能體[9]為代表的新型指揮控制系統(tǒng)雖然對(duì)系統(tǒng)的組織關(guān)系進(jìn)行了一定程度的網(wǎng)絡(luò)化描述,但是缺少對(duì)組織結(jié)構(gòu)中指揮體制、指揮流程以及智能體的組織規(guī)則的設(shè)計(jì)與描述。
因此,為實(shí)現(xiàn)無(wú)人集群的自主作戰(zhàn),需要分布式智能指揮控制系統(tǒng)進(jìn)行支撐,該作戰(zhàn)系統(tǒng)主要包括態(tài)勢(shì)感知、作戰(zhàn)規(guī)劃與決策、行動(dòng)控制、仿真推演與訓(xùn)練、人機(jī)交互等智能技術(shù)。本文從無(wú)人集群算法和軟件部署架構(gòu)的特殊性考慮,由于無(wú)人集群的分布式和無(wú)中心式特性[10],其特征與人工智能Agent的特點(diǎn)相符[11],最容易用Agent的思想對(duì)無(wú)人集群的分布式特性進(jìn)行建模,故本文通過(guò)對(duì)Agent仿真建模方法以及作戰(zhàn)空間中各實(shí)體特性的研究,提出適合仿真實(shí)體的Agent仿真建模方法,并對(duì)如何管理和調(diào)度Agent實(shí)體模型進(jìn)行探索和嘗試,然后搭建分布式Agent指揮控制仿真環(huán)境,對(duì)指揮控制領(lǐng)域的具體問(wèn)題進(jìn)行研究,通過(guò)構(gòu)建無(wú)人集群自主作戰(zhàn)系統(tǒng),驗(yàn)證仿真實(shí)體建模方法和管理調(diào)度技術(shù)的可行性。
計(jì)算機(jī)領(lǐng)域中Agent技術(shù)的研究和應(yīng)用源于美國(guó)麻省理工學(xué)院的分布式人工智能(distributed artificial intelligence, DAI)的研究項(xiàng)目,其不僅是一種解決復(fù)雜的學(xué)習(xí)、規(guī)劃和決策問(wèn)題的方法[12],而且也是解決新的分布式應(yīng)用問(wèn)題的有效途徑。DAI系統(tǒng)通常由具有自主學(xué)習(xí)能力的處理節(jié)點(diǎn)Agent組成,這些節(jié)點(diǎn)分散在很大的范圍內(nèi),能夠獨(dú)立運(yùn)作,也可通過(guò)部分節(jié)點(diǎn)間的通信來(lái)完成協(xié)作[13]。Multi-Agent系統(tǒng)(Multi-Agent system, MAS)[14]是一個(gè)有組織、有序的Agent群體,是對(duì)Agent的一種聚合。系統(tǒng)中各Agent能夠相互通信,并在通信的基礎(chǔ)上建立協(xié)作關(guān)系。Agent能夠根據(jù)用戶設(shè)定的規(guī)則以及相互之間的協(xié)議對(duì)沖突或自身需求進(jìn)行溝通,這樣就能產(chǎn)生合力,促進(jìn)整個(gè)系統(tǒng)的效能提升。
基于Agent建模是在系統(tǒng)抽象時(shí)利用Agent作為基本抽象單位,可賦予Agent一些決策能力,并預(yù)先設(shè)定好Agent間的溝通方式,這樣就得到一個(gè)系統(tǒng)的抽象模型[15]。整個(gè)建模過(guò)程既可以從總體體系架構(gòu)開(kāi)始,并延伸到個(gè)體,為每個(gè)系統(tǒng)單元設(shè)計(jì)適合的Agent,也可先設(shè)計(jì)好每個(gè)Agent,再按照MAS架構(gòu)設(shè)計(jì)Agent之間的交互方式。很多文獻(xiàn)都將Agent典型結(jié)構(gòu)描述成由3個(gè)基本單元組成,分別是傳感器[16]、處理器[17]和效應(yīng)器[18]。由于典型結(jié)構(gòu)將所有Agent自主能力和智能行為籠統(tǒng)地以一個(gè)處理器來(lái)體現(xiàn),這會(huì)給此處理器的設(shè)計(jì)帶來(lái)很大困難?;趯?duì)以上問(wèn)題的考慮,為了適配無(wú)人機(jī)集群協(xié)同自主作戰(zhàn)的需求,本文將采用多智能體體系設(shè)計(jì)基本作戰(zhàn)單元,其結(jié)構(gòu)示意圖如圖1所示。
圖1 作戰(zhàn)單元結(jié)構(gòu)示意圖Fig.1 Schematic diagram of combat unit’s structure
根據(jù)以上Agent類型結(jié)構(gòu),為進(jìn)一步研究Agent行為、關(guān)系、通信和交互,對(duì)Agent模型做以下定義:形式化狀態(tài)S和行為B共同構(gòu)成Agent,其表達(dá)式如下所示:
Agent=〈S,B〉
(1)
(1) 狀態(tài)相關(guān)描述
分別從事件、狀態(tài)、狀態(tài)空間等角度對(duì)Agent狀態(tài)進(jìn)行描述,具體描述及定義如下。
定義 1事件。在特定時(shí)間,系統(tǒng)的狀態(tài)變化稱為事件。
定義 2狀態(tài)。事物所有屬性的表達(dá)形式稱為狀態(tài)。對(duì)于對(duì)象在特定時(shí)間的狀態(tài),有如下所示:
S=(S1,S2,…,Sn)
(2)
定義 3狀態(tài)域。狀態(tài)域用于描述模型Agent中的某些特征屬性。在狀態(tài)S=(S1,S2,…,Sn)中,S1,S2,…,Sn表示狀態(tài)域。
定義 4狀態(tài)空間。如果系統(tǒng)有N個(gè)狀態(tài),則狀態(tài)域的域值構(gòu)成一個(gè)N維狀態(tài)空間,如下所示:
Si=(di1,di2,…,diN)
(3)
定義 5傳遞函數(shù)。系統(tǒng)的映射Q:f:S→S′即為傳遞函數(shù),具體如下所示:
Q=f(S)=f(S1,S2,…,Sn)
(4)
(2) 行為相關(guān)描述
分別從行為序列、動(dòng)作、活動(dòng)等角度對(duì)Agent行為進(jìn)行描述,具體描述及定義如下。
定義 6行為序列。行為序列是行為集合中所有元素的有序排列模式。假設(shè)p和q為集合中的兩個(gè)元素,p→q為順序執(zhí)行過(guò)程,即持續(xù)執(zhí)行p直到執(zhí)行q;p∨q為條件執(zhí)行過(guò)程,即執(zhí)行p或執(zhí)行q;p∧q為同時(shí)執(zhí)行過(guò)程,即同時(shí)執(zhí)行p和q。
定義 7動(dòng)作。動(dòng)作是引起個(gè)體或壞境變換的最小執(zhí)行單元,是行為的基本組成部分,如下所示:
Act=〈Ss,Qp,Se〉
(5)
式中:Ss為動(dòng)作的開(kāi)始狀態(tài);Qp為動(dòng)作函數(shù);Se為動(dòng)作的終止?fàn)顟B(tài)。
此外,對(duì)于有行為序列的多個(gè)動(dòng)作序列集合SA,可表示為:
SA=〈Acts,Q〉
(6)
如對(duì)于順序執(zhí)行SA1,可表示為
(7)
定義 8活動(dòng)。活動(dòng)是由事件觸發(fā)或者個(gè)體引起的有序動(dòng)作序列,可劃分為內(nèi)部活動(dòng)和外部活動(dòng),內(nèi)部活動(dòng)只會(huì)導(dǎo)致個(gè)體自身狀態(tài)變化,而外部活動(dòng)還會(huì)導(dǎo)致壞境狀態(tài)發(fā)生改變。用Atv表示活動(dòng),其可定義為
Atv=〈T,E,SA〉
(8)
式中:T表示活動(dòng)的目標(biāo)集合;E表示事件集合。
定義 9行為。行為用于描述個(gè)體對(duì)外部環(huán)境的反應(yīng),是一系列可觀察的活動(dòng)。行為處理由外部環(huán)境、內(nèi)部知識(shí)和當(dāng)前狀態(tài)強(qiáng)制執(zhí)行的約束,代表著個(gè)體的局部規(guī)則,具體表述為
B=〈Tall,Eall,Actall,Avtall〉
(9)
式中:B表示行為;Tall表示Agent的所有活動(dòng)目標(biāo)的集合;Eall表示Agent所能感知的事件集合;Actall表示Agent的所有動(dòng)作集合;Avtall表示Agent的所有活動(dòng)集合。
包含雙方裝備的Agent模型在接受指揮控制系統(tǒng)調(diào)度的同時(shí)應(yīng)具備作戰(zhàn)規(guī)則模型,并將其作為仿真推演的邊界約束條件。系統(tǒng)推演中各Agent規(guī)則是基于Multi-Agent的無(wú)人集群體系自主作戰(zhàn)仿真系統(tǒng)的核心,是該系統(tǒng)中各類實(shí)體屬性特征和實(shí)體間交互過(guò)程的描述依據(jù),影響著仿真模型的真實(shí)性和仿真結(jié)果的有效性,包含實(shí)體規(guī)則、行為規(guī)則、裁決規(guī)則[19]。實(shí)體規(guī)則是對(duì)仿真實(shí)體自身組織結(jié)構(gòu)、屬性特征、功能狀態(tài)等固有屬性的一種定量描述的仿真軍事規(guī)則。行為規(guī)則仿真實(shí)體是在執(zhí)行特定作戰(zhàn)任務(wù)時(shí),進(jìn)行合理決策并對(duì)其作戰(zhàn)行為狀態(tài)的遷移進(jìn)行約束限制的仿真軍事規(guī)則。裁決規(guī)則是對(duì)仿真實(shí)體的狀態(tài)變化以及其與其他作戰(zhàn)實(shí)體和環(huán)境交互行為產(chǎn)生的影響,所抽象出的關(guān)鍵規(guī)律化仿真軍事規(guī)則。
作戰(zhàn)規(guī)則作為仿真模型實(shí)現(xiàn)時(shí)的描述規(guī)范,需要使用形式統(tǒng)一的數(shù)據(jù)、算法等方式對(duì)模型內(nèi)容進(jìn)行描述,并能夠在計(jì)算機(jī)中存儲(chǔ)和運(yùn)行對(duì)應(yīng)的規(guī)范。因此,本文對(duì)Agent在其生命周期內(nèi)的行為規(guī)則進(jìn)行定義[20-21],如算法1所示。
算法 1 Agent生命周期內(nèi)行為規(guī)則定義偽代碼Agent生命周期內(nèi)行為規(guī)則: While alive doBegin Scan Process_i∥掃描所處理的第i個(gè)過(guò)程Process If Exist
異構(gòu)集群協(xié)同作戰(zhàn)推演系統(tǒng)應(yīng)包括各類型無(wú)人機(jī)、各類型目標(biāo)、調(diào)度系統(tǒng)和任務(wù)規(guī)劃系統(tǒng)等,每個(gè)節(jié)點(diǎn)還應(yīng)具有相應(yīng)的作戰(zhàn)規(guī)則。
由于戰(zhàn)場(chǎng)的復(fù)雜性和態(tài)勢(shì)需求的實(shí)時(shí)性,無(wú)人集群需要針對(duì)實(shí)時(shí)態(tài)勢(shì)做出快速相應(yīng),同時(shí)根據(jù)不同作戰(zhàn)模式和作戰(zhàn)場(chǎng)景,無(wú)人集群規(guī)模是不確定的,需要無(wú)人集群在協(xié)同作戰(zhàn)時(shí)能夠保證彈性和實(shí)時(shí)性。因此,無(wú)人集群必須能夠自主進(jìn)行目標(biāo)探測(cè)、識(shí)別、打擊、支援甚至毀傷評(píng)估,并能根據(jù)外界突發(fā)情況快速對(duì)原有任務(wù)規(guī)劃做出在線調(diào)整,使得新任務(wù)規(guī)劃能夠滿足當(dāng)前態(tài)勢(shì)壞境和任務(wù)的需求。所以,無(wú)人集群需具備自治性和社會(huì)性等特征,需要對(duì)無(wú)人機(jī)個(gè)體進(jìn)行獨(dú)立抽象建模,將每個(gè)無(wú)人機(jī)當(dāng)作獨(dú)立決策個(gè)體即Agent,各個(gè)Agent之間通過(guò)通信進(jìn)行對(duì)等協(xié)同,從而組成多智能體協(xié)同集群[22]。同時(shí),還需要抽象無(wú)人機(jī)載荷能力對(duì)應(yīng)每個(gè)個(gè)體的傳感器和控制組件。
本文將無(wú)人機(jī)Agent設(shè)計(jì)為一個(gè)多智能體系統(tǒng),如圖2所示。
圖2 無(wú)人機(jī)Agent結(jié)構(gòu)圖Fig.2 Structure diagram of unmanned aerial vehicle Agent
該系統(tǒng)由虛擬任務(wù)系統(tǒng)智能體、協(xié)同決策智能體和態(tài)勢(shì)感知智能體組成。態(tài)勢(shì)感知Agent作為無(wú)人機(jī)體系結(jié)構(gòu)最底層,負(fù)責(zé)從本系統(tǒng)傳感器、其他無(wú)人機(jī)和目標(biāo)處收集和篩選能夠生成信息的數(shù)據(jù),將其輸入虛擬任務(wù)系統(tǒng)Agent。虛擬任務(wù)系統(tǒng)Agent是體系結(jié)構(gòu)中最重要的一環(huán),負(fù)責(zé)根據(jù)態(tài)勢(shì)感知Agent輸出的數(shù)據(jù)計(jì)算相關(guān)作戰(zhàn)資源并生成作戰(zhàn)編隊(duì),同時(shí)得到各目標(biāo)單位相對(duì)距離、目標(biāo)單位附近火力數(shù)量等數(shù)據(jù)。輸出當(dāng)前無(wú)人機(jī)是否參加該目標(biāo)作戰(zhàn)和機(jī)動(dòng)路徑終點(diǎn)決策,在協(xié)同作戰(zhàn)過(guò)程中,還負(fù)責(zé)根據(jù)當(dāng)前態(tài)勢(shì)信息計(jì)算當(dāng)前任務(wù)階段、當(dāng)前作戰(zhàn)目標(biāo)以及載荷使用情況。這些決策信息不僅可作為本系統(tǒng)行為輸出的直接決定因素,同時(shí)通過(guò)態(tài)勢(shì)感知Agent傳播后還可作為其他無(wú)人機(jī)決策的間接影響因素。個(gè)體規(guī)劃Agent負(fù)責(zé)將虛擬任務(wù)系統(tǒng)Agent輸出的目標(biāo)路徑和作戰(zhàn)策略最終形成無(wú)人機(jī)的個(gè)體行為輸出。
結(jié)合Agent模型定義,偵察/攻擊/察打一體無(wú)人機(jī)Agent的狀態(tài)Suav主要可分為〈發(fā)現(xiàn)目標(biāo)、趕赴偵察區(qū)域、趕赴攻擊目標(biāo)、偵察中、攻擊、狀態(tài)反饋、偵察變更、被擊毀、返航〉,各個(gè)狀態(tài)之間的行為主要是通過(guò)條件或者消息進(jìn)行執(zhí)行轉(zhuǎn)換,如偵察中→偵察變更,即持續(xù)執(zhí)行“偵察中”直至滿足條件執(zhí)行“偵察變更”狀態(tài)。無(wú)人機(jī)Agent的具體狀態(tài)行為轉(zhuǎn)換圖如圖3所示。
圖3 無(wú)人機(jī)Agent狀態(tài)圖Fig.3 Status chart of unmanned aerial vehicle Agent
基地Agent的主要功能是在作戰(zhàn)中發(fā)揮情報(bào)支援和指揮引導(dǎo)作用,其由計(jì)算單元、存儲(chǔ)單元和通信單元構(gòu)成,并將自身計(jì)算、存儲(chǔ)、通信等多種資源進(jìn)行整合,在作戰(zhàn)過(guò)程中收集戰(zhàn)場(chǎng)態(tài)勢(shì)信息為作戰(zhàn)云提供指控決策,在必要時(shí)提供高效信息處理能力。
無(wú)人機(jī)各作戰(zhàn)節(jié)點(diǎn)將各種信息上傳至基地Agent,或者根據(jù)需要從基地Agent定向訂購(gòu)相關(guān)所需信息。即基地Agent中虛擬任務(wù)系統(tǒng)Agent負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行處理、分類、分發(fā)管理,以實(shí)現(xiàn)各無(wú)人機(jī)Agent作戰(zhàn)節(jié)點(diǎn)之間的高效信息共享;另一方面,各無(wú)人機(jī)Agent作戰(zhàn)節(jié)點(diǎn)可以將自身所能對(duì)外提供的能力信息傳送至基地Agent,或者根據(jù)需要從基地Agent定向訂購(gòu)所需服務(wù),基地Agent的虛擬任務(wù)系統(tǒng)Agent負(fù)責(zé)進(jìn)行功能組合與任務(wù)匹配,以最合適殺傷鏈、最大效能完成打擊任務(wù)?;谹gent的結(jié)構(gòu)圖如圖4所示。
圖4 基地Agent結(jié)構(gòu)圖Fig.4 Structure diagram of base Agent
目標(biāo)Agent主要用于模擬雷達(dá)、導(dǎo)彈車(chē)等作戰(zhàn)目標(biāo),根據(jù)一定的防御距離和每秒在防御圈內(nèi)的殺傷概率設(shè)計(jì)了防御事件。因此,本仿真模型中對(duì)于目標(biāo)的建模過(guò)程重點(diǎn)集中在雷達(dá)和火力打擊。其狀態(tài)Starget主要包括〈搜索,鎖定,打擊,被摧毀〉,其中打擊狀態(tài)還包括〈跟蹤,引導(dǎo),評(píng)估〉。目標(biāo)Agent通過(guò)雷達(dá)對(duì)當(dāng)前作戰(zhàn)空域進(jìn)行搜索,獲取當(dāng)前空域中無(wú)人機(jī)Agent態(tài)勢(shì)信息;在發(fā)現(xiàn)目標(biāo)后會(huì)進(jìn)一步對(duì)目標(biāo)真實(shí)性進(jìn)行確認(rèn),根據(jù)雷達(dá)鎖定條件對(duì)目標(biāo)進(jìn)行跟蹤和確認(rèn);在鎖定目標(biāo)后,根據(jù)導(dǎo)彈相關(guān)參數(shù)判斷是否滿足導(dǎo)彈發(fā)射條件,達(dá)到導(dǎo)彈發(fā)射條件后發(fā)射導(dǎo)彈。在制導(dǎo)過(guò)程中,導(dǎo)彈會(huì)根據(jù)戰(zhàn)斗機(jī)的當(dāng)前位置信息不斷進(jìn)行跟蹤引導(dǎo);當(dāng)導(dǎo)彈導(dǎo)引頭捕獲目標(biāo)時(shí),標(biāo)志此次攻擊結(jié)束,并根據(jù)導(dǎo)彈參數(shù)以一定概率摧毀無(wú)人機(jī);期間目標(biāo)Agent無(wú)打擊能力時(shí),目標(biāo)轉(zhuǎn)入搜索預(yù)警。若目標(biāo)被摧毀,移出戰(zhàn)場(chǎng)。目標(biāo)Agent狀態(tài)圖如圖5所示。
圖5 目標(biāo)Agent狀態(tài)圖Fig.5 Status chart of target Agent
評(píng)估Agent主要是在無(wú)人集群作戰(zhàn)結(jié)束后對(duì)作戰(zhàn)的打擊效果進(jìn)行評(píng)估。評(píng)估內(nèi)容主要包括戰(zhàn)場(chǎng)實(shí)時(shí)資源需求與消耗情況[23]、作戰(zhàn)完成情況、探測(cè)收益、攻擊收益[24]、使用維護(hù)成本、損失成本和壽命周期費(fèi)用[25],定義分別如下:
(10)
PI=a·DP+b·DC+c·DD
(11)
Gain=pn·Valuek
(12)
CUAM/h=CF/h+CM/h+CB,AC/h+CEG/h
(13)
(14)
(15)
體系調(diào)度Agent通過(guò)建立相關(guān)Agent行為規(guī)則(主要為狀態(tài)圖和事件)完成仿真過(guò)程組織、可視化顯示和參數(shù)控制[26]。體系調(diào)度流程圖如圖6所示。體系調(diào)度Agent通過(guò)在不同狀態(tài)間的切換完成初始化、啟動(dòng)無(wú)人機(jī)、全局任務(wù)規(guī)劃、支援、全部返航等事項(xiàng),狀態(tài)間切換由消息或條件觸發(fā)。通過(guò)系統(tǒng)初始化無(wú)人機(jī)、基地、目標(biāo)等數(shù)據(jù),并等待指令狀態(tài),隨后進(jìn)入任務(wù)分發(fā)階段狀態(tài),向非待命無(wú)人機(jī)發(fā)送起飛指令;之后,由系統(tǒng)(控制中心)進(jìn)行初始任務(wù)規(guī)劃,完畢后進(jìn)入等待消息狀態(tài);當(dāng)有無(wú)人機(jī)被攻擊時(shí),判斷戰(zhàn)場(chǎng)內(nèi)是否還存在存活無(wú)人機(jī)(若無(wú)存活無(wú)人機(jī),則不能接受戰(zhàn)場(chǎng)消息,此時(shí)需要指揮中心自行判斷);當(dāng)無(wú)存活無(wú)人機(jī),且有作戰(zhàn)需求和待命無(wú)人機(jī)時(shí),進(jìn)入支援處理環(huán)節(jié),出動(dòng)待命機(jī);當(dāng)有支援消息時(shí)(此支援消息一般來(lái)自集群),進(jìn)入支援任務(wù),出動(dòng)待命機(jī)并進(jìn)行重規(guī)劃;當(dāng)滿足任務(wù)結(jié)束條件時(shí),全部返航并結(jié)束所有狀態(tài)。
圖6 無(wú)人集群自主作戰(zhàn)總過(guò)程流程圖Fig.6 Overall process flowchart of autonomous combat unmanned cluster
虛擬任務(wù)規(guī)劃Agent的主要功能是完成任務(wù)規(guī)劃、信息統(tǒng)計(jì)、消息廣播以及完成集群組織[27]。虛擬任務(wù)規(guī)劃Agent作為體系調(diào)度Agent或無(wú)人機(jī)Agent的子成員,用于模擬控制中心任務(wù)系統(tǒng)和機(jī)載任務(wù)系統(tǒng)。體系調(diào)度Agent或各類型無(wú)人機(jī)Agent通過(guò)調(diào)用其函數(shù)實(shí)現(xiàn)各自的功能,其具體步驟如下。
步驟 1提出任務(wù)規(guī)劃需求,無(wú)人機(jī)Agent攻擊完一個(gè)目標(biāo)、一架無(wú)人機(jī)被擊毀或體系調(diào)度Agent處于某些狀態(tài)等條件下均可能產(chǎn)生任務(wù)規(guī)劃需求(當(dāng)能力冗余時(shí),不會(huì)產(chǎn)生需求),任務(wù)規(guī)劃需求以消息形式發(fā)出。
步驟 2規(guī)劃計(jì)算權(quán)限轉(zhuǎn)接,Agent計(jì)算權(quán)限通常由集群中計(jì)算能力中的最大者獲得,當(dāng)集群中當(dāng)前權(quán)限不足時(shí)進(jìn)行規(guī)劃轉(zhuǎn)接。
步驟 3接收到消息,并且獲得了計(jì)算權(quán)限的無(wú)人機(jī)Agent進(jìn)入執(zhí)行任務(wù)規(guī)劃算法狀態(tài),調(diào)用作為子成員的虛擬任務(wù)規(guī)劃Agent。
步驟 4資源-能力池刷新。
步驟 5執(zhí)行任務(wù)規(guī)劃算法,規(guī)劃結(jié)果,算法執(zhí)行過(guò)程中即為各架無(wú)人機(jī)指定了新的任務(wù)。
在此過(guò)程中,無(wú)人集群體系作戰(zhàn)單元Agent包括各個(gè)無(wú)人機(jī)Agent、各目標(biāo)Agent、基地Agent、虛擬任務(wù)系統(tǒng)Agent和體系調(diào)度Agent,Agent之間的交互關(guān)系如圖7所示。
圖7 各Agent類關(guān)系交互圖Fig.7 Interaction diagram of various Agent classes
為滿足仿真系統(tǒng)要求,在完成所有Agent模塊結(jié)構(gòu)的基礎(chǔ)上,需要明確其在數(shù)據(jù)庫(kù)中的存儲(chǔ)結(jié)構(gòu),設(shè)計(jì)數(shù)據(jù)表以及表之間的相互關(guān)聯(lián),因此需要開(kāi)展相應(yīng)接口設(shè)計(jì)以及與其他Agent的交互關(guān)系設(shè)計(jì)工作。
在無(wú)人集群體系自主作戰(zhàn)系統(tǒng)中,主要是無(wú)人機(jī)Agent、目標(biāo)Agent等實(shí)體單元進(jìn)行對(duì)抗交互,任務(wù)和過(guò)程控制分別作為各實(shí)體Agent內(nèi)部的規(guī)劃和控制過(guò)程,因此主要設(shè)計(jì)戰(zhàn)場(chǎng)作戰(zhàn)單元實(shí)體對(duì)應(yīng)的Agent接口和服務(wù)信息化接口,以及無(wú)人集群體系自主作戰(zhàn)系統(tǒng)中各Agent之間的交互關(guān)系和總的調(diào)度控制關(guān)系。
針對(duì)無(wú)人集群體系自主作戰(zhàn)系統(tǒng)架構(gòu),設(shè)計(jì)了互操作式信息交互接口,該類接口主要包括基于物理模型的數(shù)據(jù)交互接口[28]和基于分布式設(shè)計(jì)思想的仿真通用化信息接口[29]。
(1) 基于物理模型的實(shí)體Agent數(shù)據(jù)交互接口設(shè)計(jì)
針對(duì)無(wú)人集群系統(tǒng)中最小單元的物理模型,設(shè)計(jì)該信息接口。該接口繼承了無(wú)人集群系統(tǒng)的基礎(chǔ)物理模型,如無(wú)人機(jī)物理模型,武器物理模型。基于平臺(tái)模型框架的模型體系調(diào)用該接口,從而達(dá)到無(wú)人機(jī)模型、武器模型、傳感器模型甚至聯(lián)合作戰(zhàn)編隊(duì)模型在系統(tǒng)中的具體實(shí)現(xiàn)。例如,基于物理模型的數(shù)據(jù)信息交互接口中的作戰(zhàn)實(shí)體基類,其繼承于作戰(zhàn)平臺(tái)模型類,也稱飛機(jī)類;在此基礎(chǔ)上,可實(shí)現(xiàn)飛機(jī)實(shí)體單元在仿真體系中裝配任務(wù)單元,從而具備行為能力,也能夠設(shè)置指控和隸屬關(guān)系,能處理情報(bào)、產(chǎn)生和處理消息、發(fā)射武器等,其具體實(shí)現(xiàn)形式如圖8所示。
圖8 基于物理模型的實(shí)體Agent數(shù)據(jù)信息接口Fig.8 Entity Agent data information interface based on physical model
(2) 無(wú)人集群體系自主作戰(zhàn)系統(tǒng)通用化信息接口設(shè)計(jì)
通用化信息接口[30]模塊定義了各種管理器、服務(wù)接口以及模型基本框架包含的子模塊[31]。該模塊內(nèi)定義的各種接口和子模塊具有不可替換性,其他模塊直接依賴于該模塊,根據(jù)任務(wù)需求實(shí)現(xiàn)相應(yīng)服務(wù)。如:基于相關(guān)服務(wù)和管理接口,實(shí)現(xiàn)了分布式仿真相關(guān)的核心服務(wù)和管理器;基于分布式數(shù)據(jù)中繼和傳輸服務(wù)接口,實(shí)現(xiàn)了分布式數(shù)據(jù)中繼和數(shù)據(jù)傳輸功能,具體設(shè)計(jì)圖如圖9所示。
圖9 無(wú)人集群體系自主作戰(zhàn)系統(tǒng)通用化信息接口Fig.9 Universal information interface of autonomous combat system of unmanned cluster system
基于Multi-Agent的無(wú)人集群體系自主作戰(zhàn)系統(tǒng)能夠支撐典型的指揮控制研究,如協(xié)同探測(cè)、指揮控制組織設(shè)計(jì)、指揮決策、任務(wù)規(guī)劃、武器協(xié)同運(yùn)用等,并且將實(shí)際裝備組織在一起完成虛擬試驗(yàn)。其能夠根據(jù)指揮控制虛擬試驗(yàn)需求完成實(shí)驗(yàn)想定的設(shè)計(jì)、實(shí)驗(yàn)過(guò)程的控制和試驗(yàn)數(shù)據(jù)的采集分析。整個(gè)仿真系統(tǒng)由想定編輯、仿真控制、評(píng)估管理、數(shù)據(jù)采集管理等模塊組成,其中各個(gè)功能模塊的交互以及與人員的交互關(guān)系如圖10所示。想定制作模塊主要是在環(huán)境、模型和規(guī)則基礎(chǔ)上,編輯裝備數(shù)據(jù);設(shè)計(jì)作戰(zhàn)場(chǎng)景主要包括初始兵力編成、裝備配置、位置部署和各情報(bào)節(jié)點(diǎn)、指控節(jié)點(diǎn)和武器平臺(tái)初始參數(shù)的編輯、修改,以及想定文件的管理等功能。想定設(shè)計(jì)模塊輸出的結(jié)果是想定文件,是推演控制模塊的輸入。仿真控制模塊主要由仿真運(yùn)行支撐工具完成想定的加載和推演,主要包括想定的解析、初始參數(shù)的分發(fā)、推演控制等。推演控制模塊直接完成與仿真實(shí)體的交互。數(shù)據(jù)采集模塊與模型管理模塊負(fù)責(zé)完成兩項(xiàng)功能,一是對(duì)動(dòng)態(tài)數(shù)據(jù),即實(shí)驗(yàn)過(guò)程數(shù)據(jù)進(jìn)行采集,將數(shù)據(jù)保存在數(shù)據(jù)庫(kù)中為實(shí)驗(yàn)數(shù)據(jù)的分析和效能評(píng)估提供支持;二是對(duì)靜態(tài)數(shù)據(jù),即整個(gè)系統(tǒng)中的模型等進(jìn)行存儲(chǔ)、修改、查詢,并為其他模塊以及試驗(yàn)人員提供相應(yīng)的交互接口[32]。評(píng)估管理模塊主要負(fù)責(zé)完成體系效能評(píng)估和分析,為試驗(yàn)人員提供效果評(píng)估模型管理、評(píng)估數(shù)據(jù)采集與讀取等功能,能夠?yàn)樵囼?yàn)人員提供評(píng)估效果的可視化接口。效能評(píng)估模塊需要從數(shù)據(jù)采集管理模塊獲取實(shí)驗(yàn)的過(guò)程數(shù)據(jù)等。
圖10 無(wú)人集群體系自主作戰(zhàn)系統(tǒng)交互關(guān)系圖Fig.10 Interaction relationship diagram of autonomous combat system of unmanned cluster system
本節(jié)主要開(kāi)展基于Multi-Agent的無(wú)人集群體系自主作戰(zhàn)試驗(yàn)系統(tǒng)設(shè)計(jì)及開(kāi)展相關(guān)驗(yàn)證。
本節(jié)基于前文所述對(duì)無(wú)人集群體系自主作戰(zhàn)系統(tǒng)的設(shè)計(jì)方案,搭建仿真推演系統(tǒng),推演系統(tǒng)主要包括仿真參數(shù)設(shè)置界面、虛擬可視化界面和數(shù)據(jù)分析界面。軟件界面的顯示由體系調(diào)度Agent控制。仿真參數(shù)設(shè)置界面中的參數(shù)和虛擬可視化交互界面中各Agent的參數(shù)相關(guān)聯(lián)(具體機(jī)制依賴于建模工具的Agent框架)。仿真參數(shù)設(shè)置界面用于實(shí)現(xiàn)用戶輸入仿真系統(tǒng)的重要參數(shù)的設(shè)置,包括目標(biāo)陣地參數(shù)設(shè)置、基地資源參數(shù)設(shè)置、作戰(zhàn)平臺(tái)參數(shù)設(shè)置、評(píng)估參數(shù)設(shè)置和人工干預(yù)控制參數(shù)設(shè)置等操作。目標(biāo)陣地參數(shù)設(shè)置可實(shí)現(xiàn)目標(biāo)陣地單元增加、單元基本信息和重要屬性的輸入等;基地資源參數(shù)設(shè)置可實(shí)現(xiàn)無(wú)人機(jī)基地可用資源的設(shè)置,包括無(wú)人機(jī)屬性編輯及可用數(shù)目設(shè)置,任務(wù)載荷種類、屬性和數(shù)目設(shè)置等。
仿真環(huán)境虛擬可視化界面,用于較為直觀地展示仿真進(jìn)程,實(shí)現(xiàn)仿真重要信息的虛擬可視化顯示。該區(qū)域可實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)實(shí)時(shí)演示,包括作戰(zhàn)任務(wù)的重構(gòu)、資源調(diào)度分配等實(shí)時(shí)展示,以及作戰(zhàn)目標(biāo)等信息的可視化顯示。在推演過(guò)程中,異構(gòu)飛行器集群結(jié)合各個(gè)平臺(tái)的位置態(tài)勢(shì)和武器資源以及傳感器資源,采取網(wǎng)絡(luò)化制導(dǎo)打擊作戰(zhàn)手段,并實(shí)時(shí)更新平臺(tái)的武器資源、傳感器資源等戰(zhàn)場(chǎng)態(tài)勢(shì)信息;利用集群全局中的自身優(yōu)勢(shì),提高集群的協(xié)同作戰(zhàn)效能,降低作戰(zhàn)成本。仿真推演開(kāi)始后,異構(gòu)集群中的偵察編隊(duì)分別從各個(gè)基地出發(fā),對(duì)規(guī)劃的作戰(zhàn)目標(biāo)進(jìn)行戰(zhàn)場(chǎng)偵察,在確定目標(biāo)信息后,呼叫攻擊編隊(duì)前往作戰(zhàn)區(qū)域?qū)嵭写驌羧蝿?wù)。在整個(gè)推演過(guò)程中,通信無(wú)人機(jī)編隊(duì)提供戰(zhàn)場(chǎng)通信支援服務(wù),具體設(shè)計(jì)情況如圖11所示。其中,“W”表示武器載荷,“W4”表示該無(wú)人機(jī)還擁有4枚武器載荷。基地可以統(tǒng)計(jì)其自身無(wú)人機(jī)數(shù)目及使用情況,包括出動(dòng)數(shù)目、返航數(shù)目、待命數(shù)目等。目標(biāo)周?chē)摹癟”表示目標(biāo)編號(hào),如“T1”表示ID為1的目標(biāo);目標(biāo)周?chē)摹癉”表示摧毀所需的武器量,如“D2”表示摧毀該目標(biāo)需要2枚武器;目標(biāo)周?chē)淖霞t色虛線圈表示目標(biāo)的防御范圍。
圖11 無(wú)人集群協(xié)同偵察場(chǎng)景圖Fig.11 Scene diagram of unmanned cluster cooperative reconnaissance
攻擊編隊(duì)到達(dá)作戰(zhàn)區(qū)域后開(kāi)始根據(jù)作戰(zhàn)規(guī)劃對(duì)目標(biāo)實(shí)施協(xié)同打擊,當(dāng)前目標(biāo)被摧毀后,無(wú)彈藥的攻擊無(wú)人機(jī)返回基地,無(wú)彈藥的察打一體無(wú)人機(jī)可協(xié)同偵察無(wú)人機(jī),繼續(xù)對(duì)戰(zhàn)場(chǎng)進(jìn)行搜索。偵察編隊(duì)繼續(xù)執(zhí)行戰(zhàn)場(chǎng)搜索任務(wù),在發(fā)現(xiàn)新目標(biāo)后,將戰(zhàn)場(chǎng)態(tài)勢(shì)上傳給集群。集群根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì),對(duì)戰(zhàn)場(chǎng)資源進(jìn)行調(diào)整,對(duì)作戰(zhàn)編隊(duì)進(jìn)行重構(gòu),若火力不足,可以呼叫支援,若附近攻擊編隊(duì)存在多余火力,則調(diào)度無(wú)人機(jī)前往支援;若附近無(wú)可用資源,則呼叫基地支援。資源和任務(wù)重新調(diào)整完畢后,集群開(kāi)始自組織攻擊編隊(duì),進(jìn)行新的協(xié)同作戰(zhàn),具體場(chǎng)景如圖12和圖13所示。
圖12 無(wú)人集群協(xié)同打擊場(chǎng)景圖Fig.12 Scene diagram of unmanned cluster cooperative attack
圖13 無(wú)人集群協(xié)同作戰(zhàn)任務(wù)與資源重構(gòu)場(chǎng)景圖Fig.13 Scene diagram of unmanned cluster cooperative combat mission and resource reconstruction
在上述無(wú)人集群作戰(zhàn)過(guò)程中,基于時(shí)變戰(zhàn)場(chǎng)態(tài)勢(shì)信息與集群無(wú)人機(jī)作戰(zhàn)模式,完成了作戰(zhàn)方案的確定、作戰(zhàn)目標(biāo)子任務(wù)集合的生成、集群資源配置方案的分配、集群體系自組織、全域戰(zhàn)場(chǎng)目標(biāo)分配,確定了集群協(xié)同作戰(zhàn)目標(biāo)集結(jié)點(diǎn)、生成了集群航路引導(dǎo)信息。當(dāng)集群到達(dá)目標(biāo)集結(jié)點(diǎn)后,執(zhí)行預(yù)定作戰(zhàn)方案、完成了協(xié)同策略生成與控制,并為后續(xù)開(kāi)展集群無(wú)人機(jī)作戰(zhàn)模式與仿真的效能評(píng)估奠定了基礎(chǔ)。
根據(jù)仿真系統(tǒng)用戶流程設(shè)計(jì),考慮功能子系統(tǒng)中各個(gè)子模塊的定義,面向復(fù)雜任務(wù)的調(diào)度和管理的流程圖如圖14所示。
圖14 面向復(fù)雜任務(wù)的調(diào)度和管理流程Fig.14 Scheduling and management flow for complex tasks
異構(gòu)集群協(xié)同作戰(zhàn)完成作戰(zhàn)任務(wù),摧毀所有目標(biāo),或者所攜帶的所有武器彈藥消耗完畢,則認(rèn)為作戰(zhàn)任務(wù)結(jié)束,集群開(kāi)始返回基地。在所有無(wú)人機(jī)返回基地后,一次異構(gòu)集群協(xié)同作戰(zhàn)的仿真推演結(jié)束,系統(tǒng)可以根據(jù)推演數(shù)據(jù)進(jìn)行作戰(zhàn)效能評(píng)估,效能評(píng)估結(jié)果在數(shù)據(jù)分析界面內(nèi)展示。數(shù)據(jù)分析界面用于顯示仿真過(guò)程中的重要信息,包括平臺(tái)損失曲線、武器需求信息和效能評(píng)估。平臺(tái)損失曲線表示集群損失量隨時(shí)間的變化,損失數(shù)量單位為架;武器需求信息表示戰(zhàn)場(chǎng)全局實(shí)時(shí)武器需求與無(wú)人機(jī)所擁有的武器隨時(shí)間的變化關(guān)系;效能評(píng)估表示通過(guò)算法對(duì)戰(zhàn)場(chǎng)全局作戰(zhàn)的資源消耗成本、獲得收益等進(jìn)行綜合求解展示。
以一次仿真推演為例,平臺(tái)損失和武器需求實(shí)時(shí)情況如圖15所示。根據(jù)推演過(guò)程中產(chǎn)生的數(shù)據(jù),如集群出動(dòng)數(shù)目、摧毀目標(biāo)數(shù)目等指標(biāo)計(jì)算出的成本和收益的評(píng)估結(jié)果如圖16所示。
圖15 仿真推演實(shí)時(shí)評(píng)估曲線圖Fig.15 Curve of simulation deduction real-time evaluation
圖16 效能評(píng)估分析圖1Fig.16 Performance evaluation analysis figure 1
由圖16可以得到本次推演的探測(cè)收益為3.43,攻擊收益為4.69,由于評(píng)估過(guò)程中探測(cè)收益是由對(duì)目標(biāo)的探測(cè)概率、探測(cè)覆蓋率、持續(xù)時(shí)間等綜合求解,攻擊收益是由無(wú)人機(jī)突防概率、武器命中率、目標(biāo)重要度綜合求解,故收益結(jié)果是無(wú)量綱的。
本次推演對(duì)于裝備使用的維護(hù)成本為23.66萬(wàn)元,損失成本為257.00萬(wàn)元,裝備周期小時(shí)費(fèi)用為13.78萬(wàn)元,損失成本占主要成本主要部分。經(jīng)過(guò)綜合評(píng)估,此次作戰(zhàn)完成了預(yù)期作戰(zhàn)目標(biāo),該次推演的綜合收益為0.438,成本綜合評(píng)估為0.499 9,作戰(zhàn)效費(fèi)比為88%,推演數(shù)據(jù)如圖17所示。
圖17 效能評(píng)估分析圖2Fig.17 Performance evaluation analysis figure 2
一次仿真推演后,依據(jù)自動(dòng)生成該次推演的雙方的戰(zhàn)損和資源裝備使用情況,以及相應(yīng)的過(guò)程數(shù)據(jù),如偵察時(shí)間等,通過(guò)計(jì)算可以得出任務(wù)完成率、作戰(zhàn)效費(fèi)比等。通過(guò)蒙特卡羅仿真推演,可得到多次仿真推演過(guò)程中探測(cè)目標(biāo)、摧毀目標(biāo)等的情況,如圖18和圖19所示。
圖18 基于蒙特卡羅的推演資源和任務(wù)完成率統(tǒng)計(jì)圖Fig.18 Statistical chart of deduction resources and task completion rate based on Monte Carlo
圖19 基于蒙特卡羅的推演綜合評(píng)估圖Fig.19 Monte Carlo-based deduction comprehensive evaluation chart
從圖18可以得出,集群協(xié)同打擊過(guò)程幾乎探測(cè)到所有目標(biāo),并有接近一半的概率摧毀所有目標(biāo),即使沒(méi)有摧毀所有目標(biāo),任務(wù)完成率也保持在 82%以上,最高可達(dá)100%。在50次仿真推演過(guò)程中,綜合收益與綜合評(píng)估的堆疊圖如圖19所示。
通過(guò)圖19的每次推演綜合收益與綜合成本,可以得出相應(yīng)的作戰(zhàn)效費(fèi)比,并且發(fā)現(xiàn)異構(gòu)集群協(xié)同作戰(zhàn)的效費(fèi)比在80%以上,大多數(shù)情況下效費(fèi)比處于80%~83%之間,少數(shù)情況下效費(fèi)比可以達(dá)到100%,即通過(guò)對(duì)無(wú)人集群的仿真推演,可知在本文所提的模型和協(xié)同方式下,無(wú)人集群體系的自主作戰(zhàn)性價(jià)比較高,具有較好的指導(dǎo)意義。
本文所設(shè)計(jì)的無(wú)人集群自主作戰(zhàn)系統(tǒng)涉及作戰(zhàn)規(guī)劃、作戰(zhàn)執(zhí)行以及作戰(zhàn)評(píng)估全過(guò)程,能夠完成作戰(zhàn)想定編輯、集群資源規(guī)劃、任務(wù)規(guī)劃、武器協(xié)同運(yùn)用、行為協(xié)同、集群對(duì)抗、作戰(zhàn)效能評(píng)估分析等功能?;贛ulti-Agent機(jī)制,各Agent能夠在相互通信的基礎(chǔ)上建立協(xié)作關(guān)系,適配整個(gè)集群在對(duì)抗作戰(zhàn)過(guò)程中的自主性和協(xié)同性需求;除了離線資源、任務(wù)規(guī)劃設(shè)計(jì)和作戰(zhàn)策略設(shè)計(jì),本系統(tǒng)還引入了資源任務(wù)的動(dòng)態(tài)管理機(jī)制,能夠針對(duì)突發(fā)情況進(jìn)行戰(zhàn)場(chǎng)資源與任務(wù)重構(gòu),以及資源不足情況下的作戰(zhàn)支援,使集群作戰(zhàn)推演過(guò)程更加貼近現(xiàn)實(shí)。同時(shí),本系統(tǒng)開(kāi)放集群作戰(zhàn)裝備和目標(biāo)性能的數(shù)據(jù)接口,可引入實(shí)際武器裝備和目標(biāo)相關(guān)屬性參數(shù),提升無(wú)人集群作戰(zhàn)系統(tǒng)推演結(jié)果的真實(shí)性。
考慮到當(dāng)前無(wú)人集群協(xié)同作戰(zhàn)研究的不斷深入,而無(wú)人集群體系的自主作戰(zhàn)系統(tǒng)的設(shè)計(jì)工作剛剛起步,無(wú)人集群體系的自主作戰(zhàn)系統(tǒng)的設(shè)計(jì)能夠?qū)崿F(xiàn)無(wú)人集群的自主作戰(zhàn)網(wǎng)絡(luò)生成-結(jié)構(gòu)演化-任務(wù)分配-效能評(píng)估的全過(guò)程動(dòng)態(tài)仿真,為后續(xù)的深入研究和應(yīng)用奠定基礎(chǔ)。本文開(kāi)展了基于Multi-Agent的無(wú)人集群體系自主作戰(zhàn)系統(tǒng)設(shè)計(jì),通過(guò)分析Multi-Agent體系結(jié)構(gòu),在Agent模型基礎(chǔ)上開(kāi)展無(wú)人集群相關(guān)節(jié)點(diǎn)設(shè)計(jì);并根據(jù)Agent的規(guī)則設(shè)計(jì),開(kāi)展后續(xù)集群體系規(guī)則庫(kù)設(shè)計(jì)和無(wú)人集群體系作戰(zhàn)系統(tǒng)的算法庫(kù)設(shè)計(jì);并針對(duì)無(wú)人裝備實(shí)體設(shè)計(jì)信息化接口,以便無(wú)人集群作戰(zhàn)系統(tǒng)能夠更便捷地實(shí)現(xiàn)交互。通過(guò)對(duì)實(shí)際仿真系統(tǒng)的試驗(yàn)驗(yàn)證,表明基于Multi-Agent的無(wú)人集群體系自主作戰(zhàn)系統(tǒng)的設(shè)計(jì)對(duì)未來(lái)無(wú)人集群的深入研究和實(shí)際訓(xùn)練應(yīng)用有很好的指導(dǎo)和借鑒意義。