黃其旺 王躍利 褚明偉 劉捷
1.軍事科學(xué)院評估論證研究中心北京100091
模擬體系對抗條件下的指揮控制過程,需對作戰(zhàn)兵力的組織結(jié)構(gòu)、指揮關(guān)系、作戰(zhàn)任務(wù)、戰(zhàn)術(shù)規(guī)則等指揮決策要素進行建模.體系對抗條件下作戰(zhàn)兵力涉及的軍兵種范圍廣,任務(wù)種類繁多,而且不同任務(wù)下的決策內(nèi)容多種多樣,如目標(biāo)識別、威脅判斷、攻擊、防御、機動、武器分配等.因此,建立一種通用化并且高效的指揮控制模型,是進行作戰(zhàn)指揮與控制仿真的重點和難點.
在作戰(zhàn)仿真領(lǐng)域,美軍一直非常重視對指揮控制的建模工作,美國國防部牽頭建設(shè)了面向不同軍種、各具特色的眾多仿真平臺和系統(tǒng),如CFOR(Command Forces)項目、ModSAF 系統(tǒng)、擴展防空仿真系統(tǒng)(EADSIM)、聯(lián)合作戰(zhàn)仿真系統(tǒng)(JWARS)等都開發(fā)了相應(yīng)的指揮控制模型[1?2].其中,CFOR 項目通過在已有的仿真系統(tǒng)中增加體系結(jié)構(gòu)描述、通訊語言以及靈活的開發(fā)策略來建模指揮控制.ModSAF 系統(tǒng)通過異步增量有限狀態(tài)機實現(xiàn)指揮控制的行為模型.JWARS 系統(tǒng)通過指揮員模型和指揮員行為模型的相互協(xié)調(diào)和配合,解決對地面作戰(zhàn)的指揮控制建模仿真問題[3].國內(nèi)指揮控制建模仿真技術(shù)重點用于作戰(zhàn)訓(xùn)練、裝備論證和效能評估以及作戰(zhàn)問題研究等方面,主要采用的建模仿真方法包括基于Petri 網(wǎng)、復(fù)雜網(wǎng)絡(luò)、超網(wǎng)絡(luò)、組件化仿真、多Agent 仿真等,在一定程度上解決了某些特定領(lǐng)域的指揮控制建模問題[4?10].隨著人工智能、大數(shù)據(jù)等高新技術(shù)的迅猛發(fā)展,戰(zhàn)爭形態(tài)和運行規(guī)律發(fā)生了質(zhì)的變化,對指揮控制建模提出了新的要求,需要更好的描述體系對抗過程中的不確定性、涌現(xiàn)性和分布性等特征.
基于Agent 的建模仿真(Agent Based Modeling and Simulation,ABMS)是分布式人工智能研究的熱點領(lǐng)域之一,單個Agent 本身具有自主性、智能性等優(yōu)良特性,而且多Agent 之間通過相互協(xié)調(diào)與合作可以很好地解決復(fù)雜決策任務(wù)的建模仿真問題.針對指揮控制建模的新特點,結(jié)合ABMS 和HFSM 各自的優(yōu)勢,提出了指揮控制建??蚣芎拖鄳?yīng)的行為描述規(guī)范.本文所提的指揮控制模型主要可以應(yīng)用于體系對抗條件下的戰(zhàn)役級仿真系統(tǒng)中,重點解決指揮控制組織結(jié)構(gòu)關(guān)系和指揮節(jié)點指揮控制行為描述兩個問題.
ABMS 也可以稱為基于Agent 建模(Agent Based Modeling,ABM)、基于Agent 仿真(Agent Based Simulation,ABS)或基于個體建模(Individual Based Modeling,IBM),是一種采用許多相互之間具有交互行為的自治Agent 對復(fù)雜系統(tǒng)進行描述和抽象的建模仿真方法[11].不同研究領(lǐng)域?qū)gent 的定義和理解存在一定的差異,本文借鑒Mark d’Inverno和Michael Luck 于2001年提出的Agent 定義及其開發(fā)形式化框架SMART(Structured and Modular Agent and Relationship Types)[12].
SMART 概念框架中采用實體(Entities)、對象(Objects)、主體(Agents)和自治主體(Autonomous Agents)4 個層次定義Agent,具體關(guān)系如圖1所示.基于這一定義,可以從基本的實體建模出發(fā),通過不斷地細化和精煉形成最終的高層Agent 描述.
SMART 概念框架的結(jié)構(gòu)組成如圖2所示,實體集合只具備最抽象的組件描述,通過屬性集合進行表示.具有與環(huán)境進行交互能力的實體定義為對象,通過活動來與外界進行交互,從而影響環(huán)境和改變自身狀態(tài).主體被定義為能夠按照目標(biāo)來產(chǎn)生相應(yīng)活動從而影響環(huán)境的對象,并且具有一定的感知能力.自治主體是主體的升級版本,具有更強的智能性,能夠通過內(nèi)部動機產(chǎn)生自身的目標(biāo),并具有相應(yīng)的推理能力.
有限狀態(tài)機(Finite State Machine,FSM)又稱有限狀態(tài)自動機,是用來表示有限個狀態(tài)以及這些狀態(tài)之間的轉(zhuǎn)移和動作等行為的特殊有向圖,它包含一些狀態(tài)(節(jié)點)和連接這些狀態(tài)的有向弧.通俗地講,有限狀態(tài)機可以解釋為一個設(shè)備或者是一個設(shè)備模型,具有有限數(shù)量的狀態(tài),它可以根據(jù)當(dāng)前的狀態(tài)和相應(yīng)的輸入(轉(zhuǎn)移條件)進行操作,使得從當(dāng)前狀態(tài)轉(zhuǎn)移到另一個狀態(tài),同時可能促使一個輸出或者一種行為的發(fā)生.FSM 可以表示為一個四元組G[13]:
G=<S X Y f>
S為狀態(tài)空間的非空有限集;
X為輸入空間的非空有限集;
Y為輸出空間的有限集;
f:S×X→S×Y為狀態(tài)轉(zhuǎn)移函數(shù).
圖2 SMART 框架結(jié)構(gòu)組成
分層有限狀態(tài)機(Hierarchical Finite State Machine,HFSM)是對FSM 模型的擴展,允許狀態(tài)空間中的狀態(tài)為一個HFSM 或FSM,從而簡化了對復(fù)雜適應(yīng)系統(tǒng)的描述.HFSM 在描述復(fù)雜系統(tǒng)尤其是系統(tǒng)行為方面,效果直觀、簡潔,而且能夠清晰地描述各狀態(tài)機之間的層次關(guān)系.
指揮控制系統(tǒng)是綜合電子信息系統(tǒng)的核心,它將預(yù)警探測、情報偵察、通信網(wǎng)絡(luò)、導(dǎo)航定位等系統(tǒng)融為一體,為指揮員提供完整的戰(zhàn)場態(tài)勢感知,支撐指揮員獲得信息優(yōu)勢和決策優(yōu)勢,為獲得最優(yōu)作戰(zhàn)效果奠定基礎(chǔ)[14].在美軍聯(lián)合出版物JP1-02 中,指揮控制被定義為:為完成指定的任務(wù),由正式任命的指揮官對隸屬和配屬的部隊行使職權(quán)和指導(dǎo)的活動.指揮控制的本質(zhì)特征可以被抽象為以下3 點[15?19]:
1)指揮控制系統(tǒng)具有一個共同的總目標(biāo),這個總目標(biāo)可能由一系列不同但又相互影響的子目標(biāo)構(gòu)成,因此,指揮控制系統(tǒng)是基于目標(biāo)的系統(tǒng).
2)目標(biāo)是由個體的獨自行動以及團隊的一致協(xié)作來具體實現(xiàn)的,因此,指揮控制系統(tǒng)必然需要良好的協(xié)同交互機制,加之各個實體在地理位置上是分散的,需要相互通信并共享態(tài)勢.
3)指揮控制系統(tǒng)中各個實體之間具有明顯的層級關(guān)系,各個層級通過任務(wù)的分解和下發(fā)共同完成總體的目標(biāo).
這3 個本質(zhì)特征與上面提到的SMART 概念框架中Agent 的內(nèi)涵基本上是一一對應(yīng)的,概念框架中定義的Agent 具有特定的目標(biāo),能夠在一定程度上根據(jù)自己的目標(biāo)來自主地選擇相應(yīng)行動,同時Agent 也劃分為對象、主體和自治主體等層級.
在信息化、智能化作戰(zhàn)條件下,指揮控制過程涉及信息域、物理域和認知域之間的復(fù)雜交互過程.針對指揮控制的特征規(guī)律,借鑒SMART 概念框架的建模思想和基于OODA 環(huán)的指揮控制流程,設(shè)計了以Agent 建模為核心的通用建??蚣?如圖3所示.
指揮控制系統(tǒng)在態(tài)勢感知的基礎(chǔ)上,綜合各方面情報信息,根據(jù)當(dāng)前的總體目標(biāo)規(guī)劃自身以及所屬實體的作戰(zhàn)行為,在整個過程中,需要同外部環(huán)境以及其他實體進行包括信息、探測、毀傷等方面的各種交互.其中,通信、信息處理過程表示信息域的主要活動,探測和毀傷過程以及機動等表示物理域主要活動,指揮決策則表示認知域的活動過程.
在軍事作戰(zhàn)模型的開發(fā)過程中,如何將軍事概念模型有效地轉(zhuǎn)化成程序設(shè)計模型,如何以一種簡單明了的方式描述邏輯復(fù)雜的作戰(zhàn)模型,并給軍事人員提供一種有效的業(yè)務(wù)模型設(shè)計規(guī)范,如何讓作戰(zhàn)模型框架更好地支撐AI 在智能指揮決策中發(fā)揮有效的作用等一系列問題,是行為建模發(fā)展所面臨的幾大關(guān)鍵問題.具體而言,指揮控制行為模型構(gòu)建的需求包括以下幾個方面:
一是行為規(guī)則描述和實現(xiàn)的簡便性.為提升指揮控制行為建模效率,行為的模型留給軍事人員的接口必須直觀易懂,方便對所有行為規(guī)則的建模與實現(xiàn).
二是行為規(guī)則的形式化建模.對指揮控制行為的形式化建模是指采用直觀和標(biāo)準(zhǔn)的表現(xiàn)方式對行為規(guī)則進行描述,可以使得行為建模有據(jù)可依,減少建模的隨意性,提升模型的開發(fā)、理解和維護效率.
三是行為建模方法易于仿真實現(xiàn).所選的建模方法要能夠嵌入到指揮實體建模的工程實踐全過程中去,行為建模方法能夠支撐指揮控制實體的具體構(gòu)建.
事件驅(qū)動的分層異步有限狀態(tài)機已在很多游戲AI 框架中有成熟的應(yīng)用,集合了狀態(tài)機設(shè)計結(jié)構(gòu)清晰、易讀好懂、層次分明、設(shè)計方法規(guī)范、易于工具支持等優(yōu)點,是智能對象行為建模中不可或缺的關(guān)鍵技術(shù)之一,能夠在很大程度上滿足以上需求.
有限狀態(tài)機(Finite State Machine,FSM)是表示有限個狀態(tài)以及這些狀態(tài)之間的轉(zhuǎn)移和動作等行為的數(shù)學(xué)模型.每個狀態(tài)存儲了描述模型的一系列信息,在某些事件發(fā)生時,且滿足一定條件時,系統(tǒng)從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài)[20].
圖3 指揮控制建??蚣?/p>
以察打一體無人機編隊為例,設(shè)計相應(yīng)的有限狀態(tài)機模型.無人機存在的可能狀態(tài)主要包括起飛、巡航、空中待戰(zhàn)、空中機動、編隊匯合、編隊分離以及降落等[21]在滿足某些特定條件或者遭遇相應(yīng)情景時,無人機可以在這些狀態(tài)之間相互轉(zhuǎn)換,具體情況如圖4所示,其中{Ci,i=1,2,3,4,5,6,7,8,9}表示不同的轉(zhuǎn)換條件.
圖4 有限狀態(tài)機示意圖
但是,在實踐中狀態(tài)機有個致命的缺點,當(dāng)狀態(tài)一旦多了之后,它的跳轉(zhuǎn)就會變得不可維護,假設(shè)有n個狀態(tài)的話,那就需要維護最多n?n的跳轉(zhuǎn)鏈接,而應(yīng)用到軍事復(fù)雜系統(tǒng)建模過程中,模型的狀態(tài)數(shù)量往往跟模型的復(fù)雜程度成正比.而層次化狀態(tài)機結(jié)構(gòu)(HFSM)就是為了減少跳轉(zhuǎn)而作出的努力,采用分層狀態(tài)機,在實際建模過程中,考量每一個狀態(tài)間的關(guān)系,定義所有的跳轉(zhuǎn)鏈接,然后將建模對象行為進行分類,把幾個小狀態(tài)歸并到一個狀態(tài)里,再定義高層狀態(tài)和高層狀態(tài)中內(nèi)部小狀態(tài)的跳轉(zhuǎn)鏈接.狀態(tài)內(nèi)的狀態(tài)是不需要關(guān)心外部狀態(tài)的跳轉(zhuǎn)的,這樣也就做到了無關(guān)狀態(tài)間的隔離,從而大大降低了狀態(tài)機的復(fù)雜度,另外,如果覺得兩層的狀態(tài)機還是狀態(tài)太多的話,可以定義更多的狀態(tài)層次以降低跳轉(zhuǎn)鏈接數(shù).
同樣以察打一體無人機編隊為例,無人機的空中機動狀態(tài)又可以細分為偵察機動、攻擊機動、低空突防等子狀態(tài),它們各自對應(yīng)著不同的戰(zhàn)場態(tài)勢和轉(zhuǎn)換條件,同理巡航、編隊匯合、編隊分離等狀態(tài)也可以細分為相應(yīng)的若干子狀態(tài).當(dāng)這些子狀態(tài)都要加入到狀態(tài)機中時,就會出現(xiàn)前面提到的問題,狀態(tài)機中的跳轉(zhuǎn)鏈接會隨著狀態(tài)數(shù)量的增加成倍增長,從而變得難以維護.此時,利用有限狀態(tài)機進行行為描述會帶來狀態(tài)與狀態(tài)之間的組合爆炸問題,混亂的跳轉(zhuǎn)鏈接會使得用戶和軍事人員無法理解和不好使用.
采用分層有限狀態(tài)機(HFSM)通過將幾個子狀態(tài)歸并到一個狀態(tài)里,可以很好地解決這一問題,具體描述方式如圖5所示,其中{Ci,i=1,2,3,4,5,6,7,8,9,10,11,12}表示不同的轉(zhuǎn)換條件.通過上面的例子可以看出,在處理狀態(tài)數(shù)量比較多,狀態(tài)之間跳轉(zhuǎn)鏈接復(fù)雜的行為建模問題時,采用分層有限狀態(tài)機進行建模可以達到簡潔、清晰、便于理解的效果.
圖5 分層有限狀態(tài)機示意圖
基于分層有限狀態(tài)機(HFSM)進行行為建模時,首先要對實體行為進行劃分,即梳理實體行為的狀態(tài)集以及這些狀態(tài)之間的轉(zhuǎn)換規(guī)則,從而實現(xiàn)對實體行為的形式化描述.在進行實體行為劃分時,需要遵循兩個基本原則,一是實體行為的狀態(tài)集要包含仿真對象在相應(yīng)邊界內(nèi)的所有行為狀態(tài);二是劃分的每一個狀態(tài)和相應(yīng)的轉(zhuǎn)換規(guī)則要有具體的軍事含義,便于軍事人員理解和進行使用[18].
采用組件化的建模思想,基于前面提出的建??蚣?指揮控制體系模型組件構(gòu)成如圖6所示.利用層次化Agent 建立指揮控制體系結(jié)構(gòu),作戰(zhàn)體系包含不同的作戰(zhàn)單元,作戰(zhàn)單元又包含不同的作戰(zhàn)實體,各個層級都可以構(gòu)建相應(yīng)層級的指揮實體.作戰(zhàn)實體通過自身搭載的導(dǎo)航系統(tǒng)、武器系統(tǒng)、通信設(shè)備和傳感器,與外部環(huán)境和實體進行交互,實現(xiàn)機動、交火、通信以及探測交互行為.
在指揮控制體系模型組件中,作戰(zhàn)體系由不同的可以指揮的作戰(zhàn)單元組成,同時指揮控制可以包含多個層級,所以作戰(zhàn)單元也可以是由多個子作戰(zhàn)單元所構(gòu)成,可以進行相應(yīng)的嵌套表示.在開發(fā)不同的指揮控制實體時,可以給這些實體配置不同的屬性值,從而表示特定類型的指揮控制實體.而基于HFSM 的行為描述可以訪問和設(shè)置這些屬性,并且操作實體所配備的各種裝備對象,從而實現(xiàn)指揮控制實體、作戰(zhàn)體系在戰(zhàn)場環(huán)境中的仿真對抗.
事件驅(qū)動的分層有限狀態(tài)機解決了傳統(tǒng)狀態(tài)機的缺點,具備支撐復(fù)雜軍事系統(tǒng)指揮控制行為建模能力,是一套完善的行為交互體系,在梳理清楚實體行為狀態(tài)集以及這些狀態(tài)之間的轉(zhuǎn)換規(guī)則的前提下,具體實現(xiàn)時主要涉及狀態(tài)機組件、狀態(tài)機上下文、狀態(tài)機要素及黑板等幾部分.各模塊之間的體系結(jié)構(gòu)關(guān)系及主要接口如圖7所示.
4.2.1 狀態(tài)機組件
狀態(tài)機組件依附于具有行為能力的實體模型,且每個實體可添加多個狀態(tài)機組件,來完成不同的行為活動.狀態(tài)機以事件為驅(qū)動,包括初始化事件、周期性事件及仿真運行中實體收到的各種主題事件.當(dāng)這些事件產(chǎn)生時,實體便會調(diào)度狀態(tài)機的執(zhí)行處理接口,按組織好的順序調(diào)度各個狀態(tài)內(nèi)動作的邏輯執(zhí)行,并更新狀態(tài),執(zhí)行觸發(fā)的跳轉(zhuǎn)事件等.
4.2.2 狀態(tài)機上下文
狀態(tài)機上下文負責(zé)狀態(tài)、狀態(tài)機對象、關(guān)聯(lián)的仿真要素、事件的管理維護工作.同時,狀態(tài)機上下文中記錄了當(dāng)前所在的仿真元素、狀態(tài)機組件、當(dāng)前狀態(tài)及當(dāng)前仿真事件等信息,包裝了常用的功能方法,如態(tài)勢記錄、獲取仿真對象等.
4.2.3 狀態(tài)機要素
狀態(tài)機要素分以下4 大類型:條件(Condition)、動作(Action)、狀態(tài)(State)、轉(zhuǎn)移(Transition),其內(nèi)部示意圖如圖8所示.
狀態(tài)(State)是指模型在仿真過程中的一種狀況,模型處于某個特定狀態(tài)時必然會滿足某些條件、執(zhí)行某些動作或等待某些事件.狀態(tài)是由若干個動作組成的.組成狀態(tài)的這些動作是否執(zhí)行的條件只取決于上一個動作是否執(zhí)行成功,即這些動作是按照順序逐一執(zhí)行的.
圖7 狀態(tài)機體系結(jié)構(gòu)
圖8 狀態(tài)機內(nèi)部示意圖
動作(Action)是指狀態(tài)中可以執(zhí)行的原子操作,是不可再拆解或不準(zhǔn)備進一步進行仿真的最小邏輯單元.所謂原子操作是指它們在運行過程中不能被其他事件中斷,必須一直執(zhí)行下去.
事件(Event)是指在時間和空間上占有一定位置,并且對狀態(tài)機來講具有意義的那些事情.事件通常會引起狀態(tài)的轉(zhuǎn)移,促使?fàn)顟B(tài)機從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài).
轉(zhuǎn)移(Transition)是指狀態(tài)之間轉(zhuǎn)移時需要進行的活動,與轉(zhuǎn)移綁定的就是條件,只有某個事件發(fā)生或滿足特定條件才能從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài).
條件(Condition)可以分組,同一組內(nèi)的各個條件是“與”的關(guān)系,不同組之間是“或”的關(guān)系.
4.2.4 黑板
黑板是用于運行期數(shù)據(jù)交互的,非運行期產(chǎn)生的數(shù)據(jù)不需要定義為黑板.在定義黑板數(shù)據(jù)時,需要考慮黑板數(shù)據(jù)的輸入、輸出以及使用者.同一實體的所有狀態(tài)機共用一塊黑板,即同一實體的狀態(tài)機之間可以通過黑板交互數(shù)據(jù),同一狀態(tài)機內(nèi)部的各個動作之間也可以通過黑板交互數(shù)據(jù).動作可以讀/寫黑板;條件只能讀黑板,不能寫黑板.
圖9 狀態(tài)機交互序列
實體與狀態(tài)機之間的交互關(guān)系如圖9所示.用戶可以根據(jù)指揮控制實體的實際情況,對其配屬的狀態(tài)機組件進行編輯,設(shè)計相應(yīng)的狀態(tài)(State)、動作(Action)、轉(zhuǎn)移(Transition)和條件(Condition).在實際運行時,狀態(tài)機組件首先進行初始化,包括設(shè)置黑板和初始化狀態(tài)機要素,初始化后狀態(tài)機進入開始狀態(tài),根據(jù)接收到的態(tài)勢、消息以及周期事件對狀態(tài)機進行更新,更新完后檢查所有轉(zhuǎn)移條件,滿足轉(zhuǎn)移條件時就執(zhí)行相應(yīng)的動作,轉(zhuǎn)移失敗就退出相應(yīng)狀態(tài),轉(zhuǎn)移成功則進入下一狀態(tài),隨后又根據(jù)接收到的態(tài)勢、消息以及周期事件對狀態(tài)機進行更新,從而周而復(fù)始地循環(huán)下去,直到退出.
本文在深入研究信息化、智能化時代指揮控制基本特征的基礎(chǔ)上,分析了指揮控制模型構(gòu)建的新特點,建立了基于ABMS 的通用指揮控制建模框架,并針對建??蚣艿姆抡鎸崿F(xiàn),設(shè)計了模型組件構(gòu)成、組件之間的交互關(guān)系以及指揮控制體系結(jié)構(gòu)組成.在此基礎(chǔ)上,對指揮控制行為建模的需求進行了梳理,提出了基于HFSM 的行為建模方法,以察打一體無人機編隊為例,對HFSM 方法進行了詳細介紹,并從狀態(tài)機組件、狀態(tài)機上下文、狀態(tài)機要素、黑板系統(tǒng),以及實體與狀態(tài)機之間的交互關(guān)系等方面對HFSM 行為建模方法進行了詳細的仿真設(shè)計.本文設(shè)計了一種指揮控制建模的通用建模框架,并為指揮控制行為建模的格式化描述和形式化表達提供具體的方法,實現(xiàn)了行為模型與物理模型的完全分離.下一步重點研究內(nèi)容主要針對在建??蚣芎托袨槊枋鲆?guī)范下的實例分析.