劉桂濤,李哲,張凱兵,張?zhí)旆玻?
(1.湖北工程學(xué)院a.計(jì)算機(jī)與信息科學(xué)學(xué)院;b.新技術(shù)學(xué)院,湖北 孝感 432000;2.西北工業(yè)大學(xué) 自動(dòng)化學(xué)院,陜西 西安 710072)
?
基于多Agent戰(zhàn)場仿真系統(tǒng)研究
劉桂濤1a,李哲1b,2,張凱兵1a,張?zhí)旆?a,2
(1.湖北工程學(xué)院a.計(jì)算機(jī)與信息科學(xué)學(xué)院;b.新技術(shù)學(xué)院,湖北 孝感432000;2.西北工業(yè)大學(xué) 自動(dòng)化學(xué)院,陜西 西安710072)
設(shè)計(jì)戰(zhàn)場虛擬仿真系統(tǒng),分別將戰(zhàn)場抽象為柵格化地圖、作戰(zhàn)單位抽象為智能體,將其映射到系統(tǒng)中,由此將戰(zhàn)場指揮轉(zhuǎn)換為多智能體協(xié)同控制及其決策問題。仿真系統(tǒng)中使用智能體進(jìn)行戰(zhàn)況推演,也可結(jié)合實(shí)際作戰(zhàn)單位進(jìn)行聯(lián)合分析,可模擬多種戰(zhàn)場情況,為決策提供參考。以戰(zhàn)場覆蓋性和特定目標(biāo)搜索作為重要驗(yàn)證方法,測試結(jié)果表明系統(tǒng)能夠有效仿真多Agent戰(zhàn)場環(huán)境,通過決策推演與表達(dá),為指揮人員提供重要決策參考。
仿真系統(tǒng);虛擬戰(zhàn)場;智能體;協(xié)同控制;agency服務(wù)器;決策推演
在未來信息化和無人化戰(zhàn)爭新發(fā)展趨勢下,使用虛擬化的Agent統(tǒng)一描述無人機(jī)系統(tǒng)及常規(guī)作戰(zhàn)單位,由此構(gòu)建虛擬戰(zhàn)場及其推演系統(tǒng)成為未來軍事指揮重要工具[1]。基于多Agent仿真平臺(tái)在各種軍事用途中均有呈現(xiàn),如文獻(xiàn)[2]主要針對(duì)多機(jī)空對(duì)空、空對(duì)地應(yīng)用仿真,文獻(xiàn)[3]側(cè)重于地面作戰(zhàn)單位的仿真研究,文獻(xiàn)[4]側(cè)重于水面艦艇協(xié)同仿真研究,在后勤保障領(lǐng)域也有相關(guān)研究如文獻(xiàn)[5]。國內(nèi)仿真系統(tǒng)大多依賴國外較為成熟的平臺(tái)如多智能體系統(tǒng)(multi-agent system,MAS)[4-5],認(rèn)知決策模型(recognition-primed decision,RPD)[6],Java智能體開發(fā)框架(Java agent development framework,JAD)[7],用戶駐地網(wǎng)(customer premises network,CPN)[8]和高層體系結(jié)構(gòu)(high level architecture,HLA)[9-10]等,因此國內(nèi)外的研究重點(diǎn)逐步向協(xié)同決策研究發(fā)展[11-12],信息融合與系統(tǒng)決策為主,而且將人類行為融入智能體決策也是一種趨勢[13-14]?,F(xiàn)有多Agent仿真系統(tǒng)能力強(qiáng),部分系統(tǒng)使用如UDK,UE4等優(yōu)秀引擎能夠高度真實(shí)模擬戰(zhàn)場環(huán)境如地形地貌、天氣、城市建筑模型,提供豐富的細(xì)節(jié)表現(xiàn)。
但該類系統(tǒng)開發(fā)成本高、周期長,對(duì)圖形運(yùn)算及硬件設(shè)備有較高要求,一般只能部署在擁有較高性能硬件設(shè)備的指揮中心,而作戰(zhàn)單位及前線指揮部高度依賴指揮中心的信息處理與決策,不利于信息與決策的快速交互,同時(shí)整體抗打擊與指揮重組能力被嚴(yán)重削弱。
以減少?zèng)Q策路徑長度、提高系統(tǒng)整體可靠性為設(shè)計(jì)目標(biāo),基于精簡化的框架設(shè)計(jì)思路,將系統(tǒng)分為基礎(chǔ)框架和業(yè)務(wù)組件2部分:其中基礎(chǔ)框架部分使用2D柵格化地圖對(duì)戰(zhàn)場環(huán)境以及Agent進(jìn)行表達(dá),而數(shù)據(jù)存儲(chǔ)及處理則使用壓縮矩陣存儲(chǔ);業(yè)務(wù)組件則可以根據(jù)需要(如計(jì)算性能)動(dòng)態(tài)增減。系統(tǒng)可對(duì)多種場景環(huán)境進(jìn)行模擬,支持自定義多Agent(包括地形環(huán)境對(duì)象);為對(duì)象設(shè)定行動(dòng)腳本可為對(duì)象賦予一定自主行為能力,如運(yùn)動(dòng)、防御、攻擊等;決策子系統(tǒng)會(huì)根據(jù)用戶設(shè)定的目標(biāo)自動(dòng)規(guī)劃行動(dòng)路徑,同時(shí)也支持人工路徑設(shè)定。
仿真系統(tǒng)雖表現(xiàn)細(xì)節(jié)比較粗糙,但對(duì)處理器要求很低,實(shí)驗(yàn)階段已移植于基于Cortex-A7/A8架構(gòu)嵌入式系統(tǒng)(Allwinner A10/A20),從而獲得更加可靠、便攜的優(yōu)點(diǎn),甚至可部署到基層指揮系統(tǒng)以及作戰(zhàn)裝備上,從而將集中式指揮系統(tǒng)變?yōu)榉植际叫畔⑻幚砑芭R場決策系統(tǒng),提高整體生存能力,適應(yīng)惡劣戰(zhàn)場環(huán)境下作戰(zhàn)指揮應(yīng)用需求。
本文第1部分介紹多Agent仿真系統(tǒng)及其國內(nèi)外發(fā)展趨勢;第2部分詳細(xì)闡述系統(tǒng)設(shè)計(jì)思路與實(shí)現(xiàn)過程;第3部分則使用典型的戰(zhàn)場覆蓋性搜索和指定目標(biāo)搜索作為系統(tǒng)驗(yàn)證與測試的方法,驗(yàn)證了系統(tǒng)的有效性和時(shí)效性,特別是驗(yàn)證了較少的計(jì)算運(yùn)算量和計(jì)算時(shí)間是系統(tǒng)能夠移植到嵌入式處理系統(tǒng)上的關(guān)鍵因素;最后對(duì)本文進(jìn)行了總結(jié),闡述了作者所研究的工作內(nèi)容,特別是在嵌入式并行計(jì)算系統(tǒng)、并行算法在軍事系統(tǒng)中的應(yīng)用部分。
仿真系統(tǒng)的目的是在虛擬系統(tǒng)中完成對(duì)現(xiàn)實(shí)世界的映射,便于決策者進(jìn)行宏觀分析決策,這種映射概念如圖1所示。
整個(gè)仿真系統(tǒng)分為4個(gè)基本步驟:
步驟1:Server通過實(shí)體對(duì)象的傳感器收集齊狀態(tài)信息;
步驟2:在仿真系統(tǒng)中構(gòu)建Agent實(shí)體(Entity)對(duì)象,完成現(xiàn)實(shí)世界對(duì)象Object向虛擬世界Agent映射關(guān)聯(lián);
步驟3:由決策者(可以是AI)作出決策,通過Server將決策同時(shí)反饋給Objects和Agents;
步驟4.1:Server首先更新各Agent狀態(tài)——以預(yù)期狀態(tài)表示決策者希望達(dá)到的效果進(jìn)行示意;
步驟4.2:Server隨后將決策信息發(fā)送給現(xiàn)實(shí)中各Object以期實(shí)際執(zhí)行其決策任務(wù);
重復(fù)以上步驟,從而形成“觀察——決策——行動(dòng)”閉合系統(tǒng)。
1.1系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
系統(tǒng)主體采用C/S結(jié)構(gòu):客戶端中,實(shí)際Object和虛擬Agent均抽象為封裝了基礎(chǔ)功能的Agent抽象類,無論Agent是否實(shí)際存在,系統(tǒng)都以統(tǒng)一的方式進(jìn)行管理,便于在仿真階段增加虛擬對(duì)象以模擬各種突發(fā)情況;服務(wù)器則由agency與leader服務(wù)器組成, 其中agency負(fù)責(zé)數(shù)據(jù)分配、 任務(wù)調(diào)度, leader服務(wù)器負(fù)責(zé)具體的數(shù)據(jù)處理與決策;通訊管理由“黑板(Assistant)”負(fù)責(zé),還承擔(dān)數(shù)據(jù)收集、反饋、數(shù)據(jù)預(yù)處理等功能。系統(tǒng)結(jié)構(gòu)如圖2所示。
圖1 仿真系統(tǒng)映射現(xiàn)實(shí)世界概念圖Fig.1 Conceptual mapping of real-world in simulation system
圖2 系統(tǒng)結(jié)構(gòu)框圖Fig.2 Block diagram of system
系統(tǒng)采用C#.net 配合VisualStudio2008進(jìn)行開發(fā),采用典型的MVC 3層結(jié)構(gòu)模式:頂層為UI層,負(fù)責(zé)顯示Agent與map以及基本的用戶交互操作;Agent Server則對(duì)應(yīng)BLL;底層為DB所在的Model層。通過對(duì)每層進(jìn)行分解可轉(zhuǎn)換為多層結(jié)構(gòu)以便應(yīng)對(duì)不同任務(wù)處理模型,特別是分布式任務(wù)處理模型。
1.2任務(wù)處理系統(tǒng)設(shè)計(jì)
(1) 集中式任務(wù)處理:傳統(tǒng)作戰(zhàn)系統(tǒng)中數(shù)據(jù)處理和決策集中于服務(wù)器端(上層指揮中心),可通過高性能計(jì)算系統(tǒng)提高數(shù)據(jù)融合與決策速度,但集中模式?jīng)Q策鏈較長,決策中心的失效將導(dǎo)致整個(gè)指揮系統(tǒng)癱瘓。
(2) 分布式任務(wù)處理:通過將任務(wù)分布到多個(gè)Agent Server或者Agent本身就地任務(wù)處理,可提高系統(tǒng)冗余度,降低指揮鏈長度,但其宏觀決策能力較弱。
路徑規(guī)劃系統(tǒng)核心功能之一,決策者制定預(yù)期目標(biāo)(Expect)與行動(dòng)路徑(Courses of Action),但在實(shí)際執(zhí)行時(shí)可能因某些因素如新障礙物(Obstacle)而發(fā)生變化,如圖3所示。
圖3 預(yù)期與實(shí)際執(zhí)行效果圖Fig.3 Expected and actual performance chart
Agent必然會(huì)根據(jù)基本壁障規(guī)則或其他決策[14-15](如目標(biāo)威脅程度)避開障礙物,重新規(guī)劃合適的路徑:對(duì)于集中式處理,Agent.Sensors獲得的信息提交給服務(wù)器并由其進(jìn)行決策;而分布式處理中,Agent可就地決策,僅將決策結(jié)果傳遞給服務(wù)器進(jìn)行宏觀控制。
對(duì)比2種任務(wù)處理方式,集中處理模型擁有較好的全局決策性,但其決策時(shí)效性與靈活性遠(yuǎn)不如分布式處理方式——過長的指揮鏈以及過多冗余信息的處理都會(huì)降低指揮中心的實(shí)際指揮效果,而基層指揮系統(tǒng)的臨機(jī)決斷更能適應(yīng)瞬息萬變的戰(zhàn)場環(huán)境。
1.3Agent對(duì)象設(shè)計(jì)
系統(tǒng)中所有作戰(zhàn)單位包括障礙物等都抽象為IVirtual_simulation,可表達(dá)基本的Agent狀態(tài)與運(yùn)動(dòng)情況,系統(tǒng)按照需求進(jìn)行實(shí)例化,其定義如下:
class Mov_agent:
public Virtual_simulation{
protected :
SVector2D m_vVelocity;//矢量速度
SVector2D m_vHeading;//姿態(tài)
SVector2D m_vSide;//主方位
Position m_Pos;//位置信息
AABB m_AABB;//AABB包圍盒結(jié)構(gòu)
double m_dMass;//質(zhì)量
double m_dMaxSpeed;//最大速率
double m_dMaxForce; //最大動(dòng)力
double m_dMaxTurnRate; }//轉(zhuǎn)動(dòng)速率
通過損失表達(dá)精度減少了運(yùn)算量,使用圓形軸對(duì)齊包圍盒(AABB)可較好地補(bǔ)償過于規(guī)則的對(duì)象外形和折線運(yùn)動(dòng)軌跡造成的精度損失,相比于有向包圍盒(oriented bounding box,OBB)AABB精度較低,但算法簡單且實(shí)時(shí)性強(qiáng)。
1.4UI表現(xiàn)層設(shè)計(jì)
諸多仿真系統(tǒng)使用3D引擎表達(dá)空間場景,但其開銷較大,本仿真系統(tǒng)中剔除了圖1中3D圖形部分,并使用2D柵格化地圖抽象表達(dá)戰(zhàn)場,能模擬多種基本容器如墻壁、障礙物和智能體,地圖數(shù)據(jù)存儲(chǔ)在Plane.map中,通過Ramove_map類存取map數(shù)據(jù),如圖4所示。
圖4 地圖編輯器與對(duì)象設(shè)置面板Fig.4 Map editor and object settings panel
柵格化地圖可以有效簡化系統(tǒng)、降低實(shí)現(xiàn)難度,且基于拓?fù)鋱D實(shí)現(xiàn)的底層結(jié)構(gòu)(map使用鄰接矩陣存儲(chǔ))可快速遷移到其他復(fù)雜的仿真系統(tǒng),具有較強(qiáng)通用性。通過對(duì)象設(shè)置面板可以設(shè)定多種不同的地形物件,包括其類型、標(biāo)識(shí)顏色等,通過為對(duì)象編寫行為模式腳本,如模擬防御工事的防御強(qiáng)度(不同顏色表示不同防御級(jí)別)以及對(duì)象攻擊模式,可以進(jìn)一步增強(qiáng)仿真系統(tǒng)真實(shí)性。
1.5通訊控制與數(shù)據(jù)調(diào)度解決方案
Assistant負(fù)責(zé)接收來傳感器數(shù)據(jù),轉(zhuǎn)發(fā)決策層的控制信息。設(shè)計(jì)了ICommunication和IDataProcess 2個(gè)接口,分別實(shí)現(xiàn)無依賴的通訊單元、數(shù)據(jù)調(diào)度單元和數(shù)據(jù)處理單元,其結(jié)構(gòu)如圖5所示。
ICommunication是抽象通訊接口,定義了Input,Output和Data Exchange等通用方法,任何實(shí)現(xiàn)了ICommunication的通訊單元都能直接接入系統(tǒng)。IData Process抽象接口則可兼容多種類型的傳感器,系統(tǒng)可以根據(jù)需要?jiǎng)討B(tài)加載對(duì)應(yīng)驅(qū)動(dòng)程序,調(diào)度程序通過適配器(Adapter)將數(shù)據(jù)發(fā)送給合適的傳感器數(shù)據(jù)解析對(duì)象——實(shí)際上系統(tǒng)中幾乎所有的數(shù)據(jù)包括GPS(GPS_Process)、日志(LogProcess)和地圖(MapContext_Porcess)都是由IDataProcess部分統(tǒng)一進(jìn)行處理的,為平臺(tái)擴(kuò)展能力提供了保障。
1.6Agent服務(wù)器設(shè)計(jì)
(1) 映射對(duì)象管理單元
服務(wù)器包含映射對(duì)象管理單元以支持多Agent互動(dòng),能夠?qū)Q策作用于現(xiàn)實(shí)世界。通過感知器獲取實(shí)體信息,而控制器則來將控制指令下發(fā)給作戰(zhàn)單位,如圖6所示。
感知Agent(特別是視覺感知Agent)負(fù)責(zé)環(huán)境數(shù)據(jù)的采集,同時(shí)Agent也會(huì)接收agency服務(wù)器傳來的控制命令以執(zhí)行任務(wù),leader服務(wù)器服務(wù)處理來自于agency的數(shù)據(jù)并作出決策。
(2) 數(shù)據(jù)服務(wù)與決策控制
服務(wù)器在驗(yàn)證數(shù)據(jù)是否有效后決定使用何種決策方案,如障礙規(guī)避、碰撞測試等, 生成的指令則放入輸出隊(duì)列。有效數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫,無效數(shù)據(jù)單獨(dú)保留以備系統(tǒng)驗(yàn)證分析與演化。服務(wù)器根據(jù)Agent的具體能力和任務(wù)不同選擇上層調(diào)度方案,再根據(jù)具體的要求如距離、時(shí)間、場合等分解成多個(gè)子任務(wù),再由智能體組根據(jù)其組內(nèi)因素如所攜帶的傳感器、速度和靈活程度、 通信能力和計(jì)算能力,以及當(dāng)前是否空閑,是否有相似的歷史行為等自行分配子任務(wù)。
圖5 通訊控制單元和適配器的數(shù)據(jù)調(diào)度單元流程圖Fig.5 Flowchart of communication control unit and data scheduling of adapter module
圖6 帶反饋的閉環(huán)控制系統(tǒng)Fig.6 Closed-loop control system with feedback
以地圖搜索決策流程為例,系統(tǒng)首先會(huì)根據(jù)問題規(guī)模并建立模型,根據(jù)是否存在已有的地圖模型而選擇不同的搜索算法,例如以BFS(breadth first search,廣度優(yōu)先搜索)/DFS(depth first search,深度優(yōu)化搜索)算法嘗試建立地圖,而使用啟發(fā)算法在已有模型中制定最優(yōu)路徑,行動(dòng)決策流程如圖7所示。
圖7 Agent行動(dòng)決策流程圖Fig.7 Flowchart of action decision for agents
系統(tǒng)驗(yàn)證主要包括以下4個(gè)部分:
(1) 仿真系統(tǒng)對(duì)現(xiàn)實(shí)環(huán)境的模擬能力:如圖4所示通過自定義對(duì)象特性及其屬性能夠?qū)Χ喾N對(duì)象進(jìn)行模擬。
(2) Agent對(duì)象在仿真系統(tǒng)中映射正確性:能夠有效對(duì)單個(gè)/多個(gè)Agent對(duì)象進(jìn)行映射,對(duì)象持有的AABB可確保對(duì)象之間不會(huì)與(1)中的環(huán)境對(duì)象出現(xiàn)碰撞。
(3) 系統(tǒng)決策層以及用戶決策是否能夠正確作用于Agent。
(4) 系統(tǒng)運(yùn)行效率。
其中(1),(2)可通過地圖搜索與建立的過程驗(yàn)證,而(3),(4)需驗(yàn)證算法進(jìn)行測試。
2.1系統(tǒng)驗(yàn)證算法
戰(zhàn)場覆蓋性搜索和指定目標(biāo)搜索是仿真系統(tǒng)重要的技術(shù)指標(biāo),因此將其作為系統(tǒng)驗(yàn)證與測試的方法,前者用于未知環(huán)境探索及地圖建模,后者側(cè)重考慮已知地圖下目標(biāo)可達(dá)性和最優(yōu)路徑?jīng)Q策問題。這2種方法的核心仍是路徑搜索,主要有DFS算法、BFS算法、Dijkstra算法(迪科斯徹算法)和a*算法[15]4類算法,其對(duì)比如表1所示。
其中啟發(fā)式算法通過合適的啟發(fā)函數(shù),計(jì)算當(dāng)前位置可達(dá)的所有節(jié)點(diǎn)的代價(jià),選擇代價(jià)最低的節(jié)點(diǎn)為擴(kuò)展節(jié)點(diǎn)從而提高搜索效率并使其路徑為最優(yōu)。到節(jié)點(diǎn)的開銷用于決定節(jié)點(diǎn)在優(yōu)先隊(duì)列中的位置,節(jié)點(diǎn)的累計(jì)開銷產(chǎn)生啟發(fā)因子,從而達(dá)到優(yōu)化算法目的,基于這種思想設(shè)計(jì)了基于Dijkstra的啟發(fā)式搜索算法,算法模型定義如表2所示。
算法偽代碼:
1:Create_IndexPriQueue(Q,n)//創(chuàng)建索引優(yōu)先級(jí)隊(duì)列
2:Mark(Q,A),Mark(Q,T)//在隊(duì)列中標(biāo)記A和T
3:WHILEQ.length!= 0 DO
4:Bi=GetMinCost(E)//查找最小開銷節(jié)點(diǎn)Bi
5:/*將Bi-1與Bi(B0=A,i>0)的邊E放入路徑樹SPT中,并標(biāo)記為路徑S*/
6:S=Path(SPT.Push(E))
7:IFQi==TTHEN
8:RETURNS
9:ELSE
10:C=GetAdjacentNode(Bi)// 獲取Bi的鄰接點(diǎn)
11:FOREACHKINCDO
12:/*計(jì)算與該節(jié)點(diǎn)相鄰的最小開銷*/
14:Gi=Gi-1+H//計(jì)算當(dāng)前累計(jì)開銷
15:Fi=Gi+H//當(dāng)前總開銷
16:IF SPTmin== NULL ORFi 17:Smin=Fi 18:END IF 19:END FOR 20:END IF 21:END WHILE 2.2系統(tǒng)測試 選用的測試環(huán)境為處理器Intel i5-3470 3.2 GHz,內(nèi)存8 GB,Win 7專業(yè)版,.net4.0。測試開始前準(zhǔn)備了一幅24×24尺寸柵格化地圖,設(shè)定固定的起點(diǎn)和目標(biāo)分別使用上述4種算法進(jìn)行測試,如圖8所示。 圖8a)對(duì)所有節(jié)點(diǎn)進(jìn)行無差別探索,適合Agent處于未知環(huán)境下的覆蓋性探索;圖8b)BFS能對(duì)各節(jié)點(diǎn)并行搜索,并能找出最短路徑。Dijkstra算法開銷比BFS低,如圖8c)所示;如圖8d)a*算法具有更少搜索次數(shù)、效率最高,且通過具有高級(jí)視覺功能的Agent作為啟發(fā)因子直接的計(jì)算節(jié)點(diǎn)之間的直線距離對(duì)算法進(jìn)行優(yōu)化,無論是檢索次數(shù)還是最優(yōu)化結(jié)果都是上述集中搜索算法中最少的。不同的地圖障礙物及其組成方式也會(huì)對(duì)算法產(chǎn)生影響,因此進(jìn)行了多組測試,如圖9所示。 表1 4類典型搜索算法比較 表2 啟發(fā)式搜索算法定義 圖8 4種搜索算法對(duì)比Fig.8 Comparison of four search algorithms 圖9 4種搜索算法在8組不同地圖中的執(zhí)行時(shí)間對(duì)比圖Fig.9 Runtime comparison of four types of search algorithms in eight different maps 啟發(fā)式算法優(yōu)于另外3種算法。但是在改變起始位置、目標(biāo)位置和地圖時(shí),不同算法消耗的時(shí)間也是不同的,圖9中第2、5組測試中DFS算法的時(shí)間遠(yuǎn)大于其他算法;第2、3組測試中Dijkstra比BFS耗時(shí)更多,如分支較多且地圖較大時(shí)Dijkstra算法性能會(huì)快速下降,啟發(fā)式算法也會(huì)因此降低性能。 以上4種算法在測試環(huán)境中的平均執(zhí)行時(shí)間僅為0.135 1 ms,最大執(zhí)行時(shí)間也僅為0.424 4 ms,足以保證系統(tǒng)的實(shí)時(shí)性,這種低開銷也是系統(tǒng)能夠移植到嵌入式系統(tǒng)的重要依據(jù)。 仿真系統(tǒng)以2D柵格化地圖模擬戰(zhàn)場環(huán)境及其對(duì)象,通過典型的覆蓋性搜索測試驗(yàn)證了系統(tǒng)業(yè)務(wù)組件的可靠性與性能,特別是其運(yùn)算量少、處理速度快,對(duì)硬件要求較低,與作者研究方向緊密相關(guān)。如在文獻(xiàn)[16]進(jìn)行了受限環(huán)境下的成像制導(dǎo)算法研究,在文獻(xiàn)[17]進(jìn)一步研究了嵌入式并行計(jì)算系統(tǒng)(受限環(huán)境)架構(gòu)及其并行算法調(diào)度研究,這些都為當(dāng)前仿真系統(tǒng)向受限的嵌入式系統(tǒng)環(huán)境進(jìn)行移植提供了必要基礎(chǔ)。 系統(tǒng)的通用兼容能力還不足,必須滿足硬件接口和通訊協(xié)議的前提下才能支持異構(gòu)Agent接入;為Agent編寫的行動(dòng)腳本在Agent數(shù)量較少且規(guī)則較少時(shí)運(yùn)作良好,當(dāng)數(shù)量增加時(shí)會(huì)出現(xiàn)較多沖突,從而極大地影響系統(tǒng)預(yù)演運(yùn)算速度;仿真系統(tǒng)目前僅與簡單的實(shí)體系統(tǒng)如智能小車、微型多旋翼飛行器進(jìn)行初步的聯(lián)合運(yùn)行,缺少進(jìn)一步的系統(tǒng)測試;此外系統(tǒng)在算法部分如多智能體協(xié)同控制算法、復(fù)雜環(huán)境下隨機(jī)性網(wǎng)絡(luò)時(shí)延下(同構(gòu)/異構(gòu))多智能體一致性控制算法等支持較弱,這都是未來進(jìn)一步研究的重點(diǎn)。 [1]鄒湘軍,孫健,何漢武,等. 虛擬現(xiàn)實(shí)技術(shù)的演變發(fā)展與展望[J].系統(tǒng)仿真學(xué)報(bào), 2004, 16(9): 1905-1909. ZOU Xiang-jun, SUN Jian, HE Han-wu, et al .The Development and Prospects of Virtual Reality[J]. Journal of System Simulation, 2004, 16(9): 1905-1909. [2]李小民,云超,鄭宗貴. 無人機(jī)飛行仿真系統(tǒng)多智能體建模分析與應(yīng)用研究[J]. 測控技術(shù), 2015, 34(6): 146-149, 153. LI Xiao-min,YUN Chao,ZHENG Zong-gui. Research and Application of UAV Flight Simulation System Modeling Based on Multi-Agent[J].Measurement & Control Technology,2015,34(6):146-153. [3]王潤崗,陳璐,花傳杰. 基于Multi-Agent的坦克分隊(duì)作戰(zhàn)仿真系統(tǒng)[J]. 火力與指揮控制, 2010, 35(8): 159-161, 172. WANG Run-gang,CHEN Lu,HUA Chuan-jie.Multi-Agent Based Fighting Simulation System for Tank Element[J].Fire Control & Command Control,2010,35(8):159-161,172. [4]呂超,黃炎焱,遲少紅,等. 基于MAS的海軍裝備協(xié)同作戰(zhàn)仿真模型[J]. 江蘇科技大學(xué)學(xué)報(bào):自然科學(xué)版, 2010, 24(3): 273-277. Lü Chao,HUANG Yan-yan,CHI Shao-hong, et al. Simulation Model of Naval Equipment Cooperative Combat Based on Multi-Agent System[J].Journal of Jiangsu University of Science and Technology:Natural Science ed,2010,24(3):273-277. [5]龐國鋒,鄭天舒,張磊. 基于MAS的作戰(zhàn)后勤一體化仿真體系結(jié)構(gòu)研究[J]. 系統(tǒng)仿真學(xué)報(bào), 2014, 26(11): 2709-2713, 2721. PANG Guo-feng,ZHENG Tian-shu,ZHANG Lei.Research on Architecture of MAS-Based Operation Logistic Integration Simulation[J].Journal of System Simulation,2014,26(11):2709-2721. [6]孟慶操,趙曉哲,姜偉.基于Recognition-Primed Decision模型的多智能體作戰(zhàn)仿真[J]. 系統(tǒng)仿真學(xué)報(bào), 2011, 23(2): 294-299. MENG Qing-cao,ZHAO Xiao-zhe,JIANG Wei.Multi-Agent System Combat Emulation Based on Recognition-Primed Decision[J].Journal of System Simulation,2011,23(2):294-299. [7]王珊珊. 基于JADE的多Agent系統(tǒng)仿真研究[D].武漢:華中科技大學(xué),2006. WANG Shan-shan. Research on Multi-Agent System Simulation Based on JADE[D].Wuhan: Huazhong University of Science and Technology, 2006. [8]李莉. 基于CPN的Multi-Agent調(diào)度系統(tǒng)建模與仿真[D].北京:北京工業(yè)大學(xué),2008. LI Li. Modeling and Simulation of Multi-Agent Scheduling System Based on CPN [D]. Beijing:Beijing University of Technology, 2008. [9]閆琦. 基于Agent的CBTC系統(tǒng)運(yùn)行仿真平臺(tái)的研究[D].北京:北京交通大學(xué),2008. YAN Qi. Research on Simulation Platform of CBTC System Based on Agent is Running[D].Beijing: Beijing Jiaotong University, 2008. [10]李云芳. 戰(zhàn)場環(huán)境下基于HLA的BDI Agent仿真研究與實(shí)現(xiàn)[D].南京:南京航空航天大學(xué),2012. LI Yun-fang. BDI Agent Simulation Based on HLA Battlefield Environment and Its Implementation [D].Nanjing: Nanjing University of Aeronautics and Astronautics,2012. [11]周昊,覃征,邢劍寬. 基于多Agent的多無人機(jī)協(xié)同決策算法仿真平臺(tái)設(shè)計(jì) [J]. 系統(tǒng)仿真學(xué)報(bào), 2012, 24(3): 587-593. ZHOU Hao,QIN Zheng,XING Jian-kuan.Simulation Platform of Cooperative Algorithm for UAVs Based on Multi-Agent System[J].Journal of System Simulation,2012,24(3):587-593. [12]柳玉,文家焱.基于多智能體的戰(zhàn)術(shù)仿真系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)方法[J]. 兵工自動(dòng)化, 2014, 33(6): 22-26, 35. LIU Yu,WEN Jia-yan. Architecture Design of Tactics Simulating System Based on Multi-Agents[J].Ordnance Industry Automation,2014,33(6):22-35. [13]Serkan Isci, Okan Topcu. Extending the Jadex Framework with Coherence Driven Adaptive Agent Decision-Making Model [J]. International Joint Conferences on Web Intelligence (WI) and Intelligent Agent Technologies (IAT),2014:8-55. [14]譚雁英,胡淼,祝小平,等.基于人機(jī)合作策略下SAS算法的多無人機(jī)路徑再規(guī)劃[J].西北工業(yè)大學(xué)學(xué)報(bào),2014,33(5):688-692. TAN Yan-ying, HU Miao,ZHU Xiao-ping, et al.Path Replanning Approach for Multiple UAVs Based on SAS Algorithm Under Human Automation Collaboration[J].Journal of Northwestern Polytechnical University, 2014,33(5): 688-692. [15]DONG Zhou-ning,CHEN Zong-ji,ZHOU Rui,et al.A Hybrid Approach of Virtual Force and A*Search Algorithm for UAV Path Re-Planning[C]∥Proc of IEEE Conference on Industurial Electronics and Applications,2011. [16]盧軍,怯新現(xiàn),張?zhí)旆?等. 成像制導(dǎo)中的多處理器并行及二值化算法研究[J]. 現(xiàn)代防御技術(shù), 2015, 43(2): 103-109, 164. LU Jun,KAI Xin-xian,ZHANG Tian-fan, et al. Multiprocessor in Missile Guidance Systems and Research of Binarization Algorithms of Parallel Algorithms[J].Modern Defence Technology, 2015, 43(2): 103-109, 164. [17]李哲,慕德俊,郭藍(lán)天,等. 嵌入式多處理器系統(tǒng)混合調(diào)度機(jī)制的研究[J]. 西北工業(yè)大學(xué)學(xué)報(bào),2015,33(1):50-56. LI Zhe,MU De-jun, GUO Lan-tian, et al. Hybrid Scheduling of Embedded Multi-Processor System[J]. Journal of Northwestern Polytechnical University, 2015, 33(1):50-56 Multi-Agent Simulation System for Battlefield LIU Gui-tao1a,LI Zhe1b,2,ZHANG Kai-bing1a,ZHANG Tian-fan1b,2 (1.Hubei Engineering University,a. Computer and Information Science College;b.Technology College, Hubei Xiaogan 432000,China;2. Northwestern Polytechnical University,Automation College,Shaanxi Xi′an 710072,China) A virtual battlefield simulation system is developed, which abstracts the battlefield as a rasterized map and fighting units as multi-agents. By mapping the multi-agents into the system, the battlefield command issues can be converted to a problem of collaborative control and decision making between multi-agents. In the proposed system, agents can not only be used to infer the situations on the battlefield, but also to make a joint analysis according to fighting units in practice. By mimicking different scenarios of battlefield, the system can offer a valuable reference for decision-making. In the system, the battlefield coverage and searching for specified targets are employed as metric to assess the effectiveness of the proposed system. The test results indicate that our proposed system can effectively simulate multi-agents battlefield situation. With the decision deduction and expression, it can provide important decision reference for commanders. simulation system; virtual battlefield; agents; collaborative control; agency Server; decision deduction 2015-07-13; 2015-10-16 國家自然科學(xué)基金(61471161);湖北省自然科學(xué)基金(2014CFB576);湖北工程學(xué)院自然科學(xué)基金(z2013016;z201515;Hgxky14) 劉桂濤(1972-),男,湖北云夢人。副教授,碩士,研究方向?yàn)榭刂婆c技能,分布式網(wǎng)絡(luò)協(xié)同控制。 通信地址:432000湖北省孝感市學(xué)院路158號(hào)E-mail:188477493@qq.com 10.3969/j.issn.1009-086x.2016.04.023 TP391.9 A 1009-086X(2016)-04-0144-093 結(jié)束語