韓月敏,李衛(wèi)平,劉玉濤,劉永鋒
(石家莊陸軍指揮學(xué)院,河北 石家莊 050084)
陸軍作戰(zhàn)是典型的復(fù)雜系統(tǒng)[1]。陸戰(zhàn) Agent是陸軍作戰(zhàn)復(fù)雜系統(tǒng) ABMS核心的基礎(chǔ)要素。友方陸戰(zhàn)Agent之間的協(xié)作機(jī)制是陸軍作戰(zhàn)復(fù)雜系統(tǒng)演化運(yùn)行的關(guān)鍵支撐之一。陸戰(zhàn)Agent之間的協(xié)作可歸納為自主協(xié)作和上級(jí)統(tǒng)一組織協(xié)作兩種模式。文獻(xiàn)[2]對(duì)上級(jí)統(tǒng)一組織的協(xié)作機(jī)制模型進(jìn)行了研究,而對(duì)陸戰(zhàn)Agent自主協(xié)作機(jī)制模型的專門研究還很鮮見。陸戰(zhàn)Agent自主協(xié)作,雖與一般 Agent系統(tǒng)中的協(xié)作模式相同,但由于陸軍作戰(zhàn)的特殊性,必須研究符合陸軍作戰(zhàn)特點(diǎn)的陸戰(zhàn)Agent自主協(xié)作機(jī)制模型。
陸戰(zhàn)Agent自主協(xié)作是同級(jí)的陸戰(zhàn)Agent在自身沒有能力完成任務(wù)時(shí),發(fā)出臨時(shí)協(xié)作請(qǐng)求,再根據(jù)對(duì)方陸戰(zhàn)Agent的回應(yīng)情況,進(jìn)行協(xié)作任務(wù)的分配。其自主協(xié)作過程可抽象簡(jiǎn)化為“分析作戰(zhàn)任務(wù)—形成協(xié)作團(tuán)隊(duì)—生成任務(wù)計(jì)劃—執(zhí)行監(jiān)控任務(wù)”等四個(gè)階段。其中,形成協(xié)作團(tuán)隊(duì)是關(guān)鍵環(huán)節(jié),并且陸戰(zhàn)Agent自主協(xié)作的雙方是一種對(duì)等關(guān)系。因此,其協(xié)作方法應(yīng)該采用合同網(wǎng)協(xié)議[3]。
合同網(wǎng)協(xié)議作為一個(gè)基于市場(chǎng)運(yùn)行機(jī)制的協(xié)作方法,可以成功地解決一個(gè)任務(wù)在多個(gè)Agent之間的分配問題,但將其應(yīng)用于陸戰(zhàn)Agent自主協(xié)作,還存在以下5個(gè)問題:
1)合同網(wǎng)協(xié)議不符合陸戰(zhàn)高時(shí)效、近實(shí)時(shí)的作戰(zhàn)特點(diǎn)。合同網(wǎng)協(xié)議采用廣播通信方式進(jìn)行任務(wù)招標(biāo),一方面會(huì)造成系統(tǒng)的通信量過大,另一方面會(huì)加重管理Agent對(duì)每個(gè)投標(biāo)評(píng)價(jià)擇優(yōu)的決策負(fù)擔(dān)。因此,難以滿足陸軍作戰(zhàn)高時(shí)效、近實(shí)時(shí)的要求。
2)合同網(wǎng)協(xié)議不能完全反映陸戰(zhàn)Agent協(xié)作配合的主動(dòng)性。合同網(wǎng)協(xié)議中的合同Agent只能被動(dòng)地接受管理 Agent發(fā)布的任務(wù)信息,不能完全反映陸戰(zhàn)Agent協(xié)作配合的主動(dòng)性。
3)合同網(wǎng)協(xié)議基于市場(chǎng)協(xié)作的描述方式及運(yùn)行機(jī)制不適用于作戰(zhàn)領(lǐng)域。合同網(wǎng)協(xié)議的任務(wù)分配過程是運(yùn)用經(jīng)濟(jì)行為中的“招標(biāo)-投標(biāo)-中標(biāo)-簽約”機(jī)制,以標(biāo)值為紐帶的Agent之間的協(xié)商過程。這種基于市場(chǎng)協(xié)作的描述方式及運(yùn)行機(jī)制,不符合作戰(zhàn)領(lǐng)域的實(shí)際。
4)合同網(wǎng)協(xié)議缺乏對(duì)陸戰(zhàn)Agent作戰(zhàn)能力動(dòng)態(tài)變化的考慮。合同網(wǎng)協(xié)議只考慮了Agent的靜態(tài)能力,很難反映作戰(zhàn)過程中陸戰(zhàn) Agent作戰(zhàn)能力的動(dòng)態(tài)變化。
5)合同網(wǎng)協(xié)議對(duì)協(xié)作任務(wù)失效的處置不符合戰(zhàn)場(chǎng)實(shí)際。合同網(wǎng)協(xié)議對(duì)任務(wù)失效情況的處置方法是重新發(fā)布任務(wù),以尋求新的合作者。這種方法不符合陸戰(zhàn)場(chǎng)作戰(zhàn)任務(wù)不可重復(fù)及高時(shí)效性的實(shí)際。
針對(duì)以上問題,本文提出以下5條改進(jìn)思路:
1)針對(duì)合同網(wǎng)協(xié)議信息交互量大的問題,用黑板代替廣播的通信模式,作戰(zhàn)任務(wù)信息由協(xié)作請(qǐng)求者發(fā)布到黑板上,系統(tǒng)中的協(xié)作參與者自行感知相關(guān)任務(wù)信息。
2)針對(duì)合同網(wǎng)協(xié)議不能反映陸戰(zhàn)Agent協(xié)作配合主動(dòng)性的問題,引入陸戰(zhàn)Agent主動(dòng)感知特性,用能力參數(shù)值來衡量協(xié)作參與者當(dāng)前的負(fù)載和資源狀況。協(xié)作參與者通過計(jì)算自身的感知系數(shù)來確定是否響應(yīng)協(xié)作請(qǐng)求者的作戰(zhàn)任務(wù)信息。
3)針對(duì)合同網(wǎng)協(xié)議基于市場(chǎng)協(xié)作的描述方式及運(yùn)行機(jī)制不適用于作戰(zhàn)領(lǐng)域的問題,對(duì)合同網(wǎng)協(xié)議進(jìn)行重新描述,使其符合作戰(zhàn)領(lǐng)域的特殊要求,具體描述如表1和表2所示。
表1 合同網(wǎng)協(xié)議作戰(zhàn)應(yīng)用階段描述
表2 合同網(wǎng)協(xié)議作戰(zhàn)應(yīng)用角色描述
4)針對(duì)合同網(wǎng)協(xié)議缺乏對(duì)陸戰(zhàn)Agent作戰(zhàn)能力動(dòng)態(tài)變化考慮的問題,引入評(píng)估模型,定期對(duì)各陸戰(zhàn)Agent進(jìn)行評(píng)估,及時(shí)更新其作戰(zhàn)能力狀況,以作為參與作戰(zhàn)協(xié)作的依據(jù)。
5)針對(duì)合同網(wǎng)協(xié)議對(duì)協(xié)作任務(wù)失效處置不符合戰(zhàn)場(chǎng)實(shí)際的問題,為防止作戰(zhàn)任務(wù)分配過程中出現(xiàn)任務(wù)失效情況,在陸戰(zhàn)Agent執(zhí)行作戰(zhàn)任務(wù)過程中,如果出現(xiàn)突發(fā)情況需要調(diào)整甚至放棄協(xié)作任務(wù)時(shí),不能簡(jiǎn)單地中止或調(diào)整其正在執(zhí)行的作戰(zhàn)任務(wù),必須制定相應(yīng)的規(guī)則,指導(dǎo)陸戰(zhàn)Agent處置突發(fā)情況。
根據(jù)合同網(wǎng)協(xié)議的改進(jìn)思路,引入心智參數(shù)的概念,對(duì)其協(xié)作準(zhǔn)備、協(xié)作請(qǐng)求、發(fā)送任務(wù)承諾、協(xié)作成員優(yōu)選等各個(gè)階段進(jìn)行改進(jìn)。
1.3.1陸戰(zhàn)Agent心智參數(shù)
1)感知度
定義1 感知度:協(xié)作參與陸戰(zhàn)Agentj對(duì)于協(xié)作請(qǐng)求者發(fā)布作戰(zhàn)任務(wù)的響應(yīng)程度,稱為陸戰(zhàn)Agentj的感知度,記為Prej。
協(xié)作參與者的感知度由其自身可用資源狀況,以及其當(dāng)前的忙閑程度決定:
其中,Resj表示陸戰(zhàn)Agentj本身所具有的可用資源量;Idlej表示陸戰(zhàn)Agentj的忙閑度,以衡量自身任務(wù)量的繁重程度。P1、P2是資源和忙閑度的權(quán)值,可根據(jù)實(shí)際情況設(shè)置。
定義2 感知閾:允許協(xié)作參與者陸戰(zhàn)Agentj獲取作戰(zhàn)任務(wù)感知度的最小值,稱為陸戰(zhàn)Agentj的感知閾,記為PreThj。
當(dāng)Prej≤PreThj時(shí),則禁止協(xié)作陸戰(zhàn)Agentj響應(yīng)任何作戰(zhàn)任務(wù)信息。
2)能力度
定義3 能力度:協(xié)作參與陸戰(zhàn)Agentj能夠順利完成任務(wù)的作戰(zhàn)能力,稱為陸戰(zhàn)Agentj的能力度,記為Capj。
協(xié)作參與陸戰(zhàn)Agentj的能力度主要由主觀能力度R1和客觀能力度R2兩部分組成。
主觀能力度R1是依據(jù)協(xié)作參與陸戰(zhàn)Agentj主觀條件所建立的能力度,主要取決于對(duì)協(xié)作參與陸戰(zhàn)Agentj的指揮控制能力 C、訓(xùn)練水平 L、士氣狀態(tài) S的分析和評(píng)價(jià)。
客觀能力度R2是依據(jù)協(xié)作參與陸戰(zhàn)Agentj客觀條件所建立的能力度,主要取決于對(duì)協(xié)作參與陸戰(zhàn)Agentj的武器裝備性能W、綜合能力F及作戰(zhàn)環(huán)境條件 E(表示作戰(zhàn)環(huán)境對(duì)于作戰(zhàn)效能的影響)的分析和評(píng)估。
能力度Capj可表示如下:
其中,Capj、R1、R2、C、L、S、、W、F、α、β、ω1、ω2、ω3、μ1、μ2、μ3的取值范圍均為[0,1]之間的實(shí)數(shù),表示權(quán)重系數(shù),并且α+β=1,ω1+ω2+ω3=1,μ1+μ2+μ3=1 。
陸戰(zhàn)Agent的能力度是協(xié)作請(qǐng)求者選擇協(xié)作伙伴的主要指標(biāo)之一,是一個(gè)動(dòng)態(tài)變量,受多個(gè)因素影響。在協(xié)作參與者完成一個(gè)任務(wù)后,需要對(duì)其能力度重新進(jìn)行評(píng)估。
3)能力度修正值ξ
為了體現(xiàn)陸戰(zhàn)Agent執(zhí)行不同任務(wù)時(shí)所表現(xiàn)出的不同作戰(zhàn)能力,可依據(jù)任務(wù)類型,定義相應(yīng)的修正值,以保證能力度較好地刻畫其相應(yīng)的作戰(zhàn)能力。ξ的值域范圍為[0,1]。
4)熟悉度
定義4 陸戰(zhàn)Agentj成功完成陸戰(zhàn)Agenti交給作戰(zhàn)任務(wù)的次數(shù)與陸戰(zhàn)Agenti委托作戰(zhàn)任務(wù)的總次數(shù)之比,稱為陸戰(zhàn)Agenti對(duì)陸戰(zhàn)Agentj的熟悉度,記為Fri(i,j)。
其中,Nij表示陸戰(zhàn) Agentj成功完成陸戰(zhàn) Agenti交給任務(wù)的次數(shù);Ni表示陸戰(zhàn)Agenti委托任務(wù)的總次數(shù)。
熟悉度也是協(xié)作請(qǐng)求者選擇協(xié)作伙伴的重要指標(biāo)之一。對(duì)于同一作戰(zhàn)任務(wù),在能力度相當(dāng)?shù)那闆r下,協(xié)作請(qǐng)求陸戰(zhàn)Agent更傾向于選擇熟悉度較高的協(xié)作參與陸戰(zhàn)Agent。
5)協(xié)作承諾閾
定義5 協(xié)作參與陸戰(zhàn)Agentj在同一時(shí)刻能夠發(fā)送的最多作戰(zhàn)任務(wù)承諾數(shù),稱為陸戰(zhàn)Agentj的協(xié)作承諾閾,記為Thdj。
設(shè)置協(xié)作承諾閾的目的是為了限制協(xié)作參與者對(duì)作戰(zhàn)任務(wù)的盲目參與,保證協(xié)作參與者的每個(gè)承諾都是有效的。承諾閾的大小與協(xié)作參與者的感知度相關(guān),并隨著感知度的變化而變化。
6)協(xié)作承諾數(shù)
定義6 協(xié)作參與陸戰(zhàn)Agentj當(dāng)前發(fā)送的所有作戰(zhàn)任務(wù)承諾總數(shù),稱為協(xié)作承諾數(shù),記為Tamj。
當(dāng)Tamj<Thdj時(shí),協(xié)作參與者可響應(yīng)黑板上的協(xié)作任務(wù)信息。
1.3.2協(xié)作準(zhǔn)備
協(xié)作準(zhǔn)備包括對(duì)待分配任務(wù)的分析與分解、制定作戰(zhàn)任務(wù)信息表等工作。作戰(zhàn)任務(wù)信息表主要包括協(xié)作請(qǐng)求者、作戰(zhàn)任務(wù)描述、作戰(zhàn)任務(wù)約束條件以及作戰(zhàn)任務(wù)參與、完成時(shí)限等信息。
1.3.3協(xié)作請(qǐng)求
協(xié)作請(qǐng)求的方法是協(xié)作請(qǐng)求者將作戰(zhàn)任務(wù)信息發(fā)布到黑板上,并且在作戰(zhàn)任務(wù)信息中設(shè)置截止時(shí)間參數(shù)。當(dāng)?shù)竭_(dá)截止時(shí)間時(shí),任務(wù)信息失效,黑板系統(tǒng)自動(dòng)刪除作戰(zhàn)任務(wù)信息。同時(shí)協(xié)作參與陸戰(zhàn)Agent根據(jù)自身感知度的大小,判斷能否從黑板獲取作戰(zhàn)任務(wù)信息,從而參與協(xié)作。
協(xié)作請(qǐng)求的工作流程如圖1所示。
圖1 協(xié)作請(qǐng)求工作流程
1.3.4任務(wù)承諾
協(xié)作參與陸戰(zhàn)Agent接收到黑板上的作戰(zhàn)任務(wù)信息后,即進(jìn)入了任務(wù)承諾階段。任務(wù)承諾的主要工作包括協(xié)作參與陸戰(zhàn)Agent對(duì)協(xié)作子任務(wù)的評(píng)估及向協(xié)作請(qǐng)求者發(fā)出任務(wù)承諾。
為了限制陸戰(zhàn)Agent象傳統(tǒng)合同網(wǎng)協(xié)議中的合同者那樣盲目參與,避免由于協(xié)作參與者自身能力不足,而造成承諾失敗的問題,從節(jié)約系統(tǒng)資源,減輕陸戰(zhàn)Agent負(fù)擔(dān),加快系統(tǒng)執(zhí)行效率的角度出發(fā),對(duì)合同網(wǎng)協(xié)議作如下改進(jìn):
1)為每個(gè)協(xié)作參與者設(shè)置一個(gè)協(xié)作參與閾值,即每個(gè)協(xié)作參與者能夠進(jìn)行任務(wù)承諾的最大值,其大小與陸戰(zhàn)Agent的感知度相關(guān)聯(lián)。當(dāng)感知度降低時(shí),協(xié)作參與閾值也同時(shí)降低,表示陸戰(zhàn)Agent并行執(zhí)行任務(wù)的能力降低,反之亦然。
2)當(dāng)協(xié)作參與者有能力執(zhí)行作戰(zhàn)任務(wù)時(shí),設(shè)置評(píng)估函數(shù)對(duì)作戰(zhàn)任務(wù)進(jìn)行排序,從中選出自己最有把握的作戰(zhàn)任務(wù),按照一定的規(guī)則形成任務(wù)承諾信息發(fā)送給協(xié)作請(qǐng)求者。
1.3.5優(yōu)選最佳協(xié)作參與者
優(yōu)選最佳協(xié)作參與者就是按照某種策略,從眾多參與者中選擇合適的協(xié)作伙伴??偟脑瓌t是能更好地完成作戰(zhàn)任務(wù)的各個(gè)子目標(biāo),在對(duì)協(xié)作參與陸戰(zhàn)Agent優(yōu)選時(shí),需要考察其綜合能力,如完成作戰(zhàn)任務(wù)的質(zhì)量、能力度、熟悉度、感知度等,以保證作戰(zhàn)任務(wù)總體效果能達(dá)到最佳。這些因素有些是無法準(zhǔn)確量化的,因此,應(yīng)該采用基于模糊綜合評(píng)判的優(yōu)選策略。
根據(jù)陸戰(zhàn)Agent的內(nèi)部結(jié)構(gòu)[4]和合同網(wǎng)協(xié)議的改進(jìn)思路,可得到陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu),主要由任務(wù)處理器、知識(shí)庫(kù)、協(xié)作處理器和通信處理器等組成,如圖2所示。
圖2 陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu)
在改進(jìn)的合同網(wǎng)協(xié)議中,協(xié)作請(qǐng)求陸戰(zhàn)Agent和協(xié)作參與陸戰(zhàn)Agent分別承擔(dān)合同網(wǎng)協(xié)議中管理者和合同者的角色。在陸軍作戰(zhàn)過程中,上級(jí)陸戰(zhàn) Agent主要負(fù)責(zé)管理所有陸戰(zhàn)Agent的相關(guān)信息,并在作戰(zhàn)的不同階段向陸戰(zhàn)Agent分配作戰(zhàn)任務(wù)或打擊目標(biāo),其所關(guān)注的重點(diǎn)是對(duì)戰(zhàn)場(chǎng)的整體協(xié)調(diào)和控制,不參與具體的自主協(xié)作控制;而協(xié)作請(qǐng)求陸戰(zhàn)Agent依據(jù)上級(jí)陸戰(zhàn)Agent下達(dá)的作戰(zhàn)任務(wù)或戰(zhàn)場(chǎng)空間臨時(shí)出現(xiàn)的突發(fā)情況,利用改進(jìn)合同網(wǎng)協(xié)議,自主向其他陸戰(zhàn)Agent發(fā)出作戰(zhàn)任務(wù)協(xié)作請(qǐng)求,尋求協(xié)作伙伴;協(xié)作參與陸戰(zhàn)Agent則負(fù)責(zé)響應(yīng)作戰(zhàn)任務(wù)請(qǐng)求信息,以及作戰(zhàn)任務(wù)的協(xié)作執(zhí)行。
因此,陸戰(zhàn)Agent自主協(xié)作框架可由兩個(gè)層次構(gòu)成。第一個(gè)層次是從上級(jí)陸戰(zhàn)Agent獲取本級(jí)任務(wù),如果陸戰(zhàn)Agent不能獨(dú)立完成則轉(zhuǎn)到第二個(gè)層次。在第二個(gè)層次上,本級(jí)陸戰(zhàn)Agent是任務(wù)的分配方,并自動(dòng)成為協(xié)作請(qǐng)求者,通過黑板向其他陸戰(zhàn)Agent發(fā)出協(xié)作請(qǐng)求。得到協(xié)作請(qǐng)求信息的其他陸戰(zhàn)Agent都可成為作戰(zhàn)任務(wù)的接受方,并自動(dòng)成為協(xié)作參與者,如圖3所示。
圖3 陸戰(zhàn)Agent自主協(xié)作框架
陸戰(zhàn)Agent自主協(xié)作請(qǐng)求策略是以黑板作為中間媒介,協(xié)作參與者根據(jù)自身類型、資源及負(fù)載狀況而參與作戰(zhàn)任務(wù)的協(xié)作。通過設(shè)置感知度Pre與感知閾值PreTh兩個(gè)參數(shù)來限制協(xié)作參與者的協(xié)作參與,即當(dāng)Pre>PreTh時(shí),允許協(xié)作參與者從黑板獲取請(qǐng)求協(xié)作任務(wù)信息,以此減少任務(wù)的發(fā)送范圍,提高效率。
陸戰(zhàn)Agent的自主協(xié)作承諾策略,依據(jù)其自身的負(fù)載和資源狀況,為每個(gè)協(xié)作參與陸戰(zhàn)Agent設(shè)置一個(gè)協(xié)作參與閾值Thd,表示每個(gè)陸戰(zhàn)Agent能同時(shí)參與協(xié)作任務(wù)的個(gè)數(shù),以保證協(xié)作參與者每次的任務(wù)承諾都有效。而參與協(xié)作閾值與陸戰(zhàn)Agent自身感知度相關(guān)。
1)當(dāng)協(xié)作參與陸戰(zhàn)Agent接到協(xié)作任務(wù)后,將此時(shí)協(xié)作參與陸戰(zhàn)Agent已經(jīng)發(fā)送的任務(wù)承諾值TAm與其當(dāng)前感知度下的協(xié)作參與閾值Thd進(jìn)行比較,如果TAm<Thd,則禁止響應(yīng)協(xié)作請(qǐng)求。
2)協(xié)作承諾值的調(diào)整
①向協(xié)作請(qǐng)求者發(fā)送任務(wù)承諾后:TAm=TAm+1
②承諾被拒絕時(shí):TAm=TAm-1
③承諾被選中的陸戰(zhàn)Agent成為子任務(wù)的執(zhí)行者時(shí):TAm=TAm-1,Pre=Pre-Δpre,Thd=Thd-ΔThd;
④任務(wù)完成時(shí):Pre=Pre+Δpre,Thd=Thd+ΔThd。
基于模糊綜合評(píng)判的評(píng)估策略,協(xié)作請(qǐng)求者根據(jù)作戰(zhàn)任務(wù)分配的特征和協(xié)商目標(biāo)確定影響協(xié)作團(tuán)隊(duì)優(yōu)選的因素評(píng)價(jià)集,利用模糊綜合評(píng)判的結(jié)果對(duì)潛在的協(xié)作參與者做出評(píng)價(jià),進(jìn)而挑選出最佳的協(xié)作任務(wù)執(zhí)行者。
模糊綜合評(píng)判是應(yīng)用模糊關(guān)系合成的原理,由多個(gè)因素來綜合評(píng)判事物隸屬等級(jí)的方法。通常包含確定因素集、確定評(píng)價(jià)集、確定各因素的權(quán)重、單因素模糊評(píng)判和模糊綜合評(píng)判等5個(gè)基本步驟。
各因素的權(quán)重用來反映其對(duì)評(píng)判對(duì)象影響的重要程度,因素ui的權(quán)重記為iη,且有
單因素模糊評(píng)判旨在建立因素集與評(píng)價(jià)集之間的一種模糊關(guān)系,如第i個(gè)因素的評(píng)價(jià)結(jié)果可記為:
其中,rij為因素iu產(chǎn)生結(jié)果vj的隸屬度。
陸戰(zhàn)Agent自主協(xié)作流程如圖4所示。
圖4 陸戰(zhàn)Agent自主協(xié)作流程
作戰(zhàn)任務(wù)識(shí)別的主要工作是對(duì)上級(jí)陸戰(zhàn)Agent授予的作戰(zhàn)任務(wù)按一定的規(guī)則或需求,分解成多個(gè)協(xié)作子任務(wù),并將這些協(xié)作子任務(wù)按照一定的格式生成作戰(zhàn)任務(wù)信息表,發(fā)送到黑板上,以尋求協(xié)作。
其協(xié)作子任務(wù)信息表中每個(gè)子任務(wù)的內(nèi)容為:
其中:
AgentID表示協(xié)作請(qǐng)求陸戰(zhàn)Agent標(biāo)識(shí)。
TaskID表示子任務(wù)標(biāo)識(shí)。
TaskType表示協(xié)作子任務(wù)類型,參與者按任務(wù)類型修正自身能力度,用于對(duì)任務(wù)的期望評(píng)估。
Priority表示任務(wù)優(yōu)先度,用于標(biāo)識(shí)當(dāng)前任務(wù)的重要程度。
TaskDescription表示對(duì)子任務(wù)的簡(jiǎn)要描述。
ExpireTime表示協(xié)作請(qǐng)求者接收協(xié)作參與者發(fā)出任務(wù)承諾的截止時(shí)限。
Address表示協(xié)作請(qǐng)求陸戰(zhàn)Agent物理地址,用以實(shí)現(xiàn)與協(xié)作陸戰(zhàn)Agent之間的通信交互。
TaskRestriction表示協(xié)作請(qǐng)求陸戰(zhàn) Agent提出完成任務(wù)的約束條件,包括對(duì)協(xié)作參與者完成任務(wù)的代價(jià)約束、資源約束和質(zhì)量約束等。TaskRestriction={Cost、ξCap、Quality、Pre},其中 Cost表示完成任務(wù)的代價(jià);ξCap表示協(xié)作參與陸戰(zhàn)Agent依據(jù)作戰(zhàn)任務(wù)類型修正后的作戰(zhàn)能力參數(shù);Quality表示任務(wù)預(yù)計(jì)能達(dá)到的效果;Pre表示協(xié)作參與陸戰(zhàn)Agent的感知度。
形成協(xié)作團(tuán)隊(duì)的過程是基于改進(jìn)合同網(wǎng)協(xié)議,陸戰(zhàn)Agent之間進(jìn)行交互協(xié)商的過程,其工作流程如下:
1)協(xié)作參與者從黑板感知協(xié)作任務(wù)信息
當(dāng)滿足以下條件時(shí),允許陸戰(zhàn)Agent參與協(xié)作:
① 感知度大于感知閾值:Pre>PreTh
② 已發(fā)出的任務(wù)承諾數(shù)小于協(xié)作參與閾值:TAm<Thd。
這兩種情況表示陸戰(zhàn)Agent當(dāng)前有能力參與到作戰(zhàn)任務(wù)的協(xié)作之中,允許其感知黑板的協(xié)作任務(wù)信息。
2)協(xié)作期望評(píng)估
為保證陸戰(zhàn)Agent所承諾的任務(wù)都是最有把握完成的作戰(zhàn)任務(wù),設(shè)置一個(gè)協(xié)作參與評(píng)估函數(shù)Par(i,j,t),表示協(xié)作參與陸戰(zhàn)Agentj對(duì)于協(xié)作請(qǐng)求陸戰(zhàn)Agenti發(fā)布的任務(wù)t進(jìn)行的協(xié)作期望評(píng)估。期望值越高,表示完成的可能性就越大。
其中,1λ、2λ和3λ是能力度、感知度、熟悉度在協(xié)作參與評(píng)估函數(shù)中所占的權(quán)值,并且λ1+λ2+λ3= 1 。
同時(shí),根據(jù)任務(wù)t的類型參數(shù)及其對(duì)應(yīng)的能力修正參數(shù) ξ,修正陸戰(zhàn) Agent的作戰(zhàn)能力,用于對(duì)每個(gè)子任務(wù)的評(píng)估。多個(gè)子任務(wù)按照評(píng)估值進(jìn)行排序,陸戰(zhàn)Agent依據(jù)排序后任務(wù)序列,選擇最能勝任的任務(wù)。
最后協(xié)作參與陸戰(zhàn)Agent根據(jù)協(xié)作任務(wù)信息,結(jié)合知識(shí)庫(kù)中的戰(zhàn)斗規(guī)則、戰(zhàn)斗范例以及各種評(píng)估方法模型,對(duì)協(xié)作任務(wù)進(jìn)行解算,按TaskRestriction規(guī)定的格式,生成任務(wù)承諾信息,在截止時(shí)限前提交給協(xié)作請(qǐng)求者。
3)協(xié)作團(tuán)隊(duì)優(yōu)選
在基于改進(jìn)合同網(wǎng)協(xié)議的自主協(xié)作中,最佳協(xié)作參與陸戰(zhàn)Agent的選擇,依賴于對(duì)其完成協(xié)作任務(wù)質(zhì)量的承諾、所付出的代價(jià)、自身能力、感知度及其他陸戰(zhàn)Agent的信任度等因素的評(píng)估。
利用模糊綜合評(píng)判法選擇協(xié)作參與陸戰(zhàn)Agent的影響因素集為{承諾值,完成代價(jià),能力度,感知度},這些因素對(duì)應(yīng)的權(quán)重可依據(jù)經(jīng)驗(yàn)數(shù)據(jù)設(shè)定,例如可設(shè)為{0.4,0.2,0.2,0.2},評(píng)價(jià)值集為[0,1]。
由此可對(duì)所有協(xié)作參與陸戰(zhàn)Agent進(jìn)行評(píng)判,通過對(duì)評(píng)判結(jié)果排序,選出最大值所對(duì)應(yīng)的陸戰(zhàn)Agent,作為協(xié)作伙伴。
4)形成協(xié)作團(tuán)隊(duì)
協(xié)作請(qǐng)求陸戰(zhàn)Agent在達(dá)到任務(wù)截止時(shí)限后,確定所有子任務(wù)的協(xié)作伙伴,形成協(xié)作團(tuán)隊(duì)。并且將協(xié)作團(tuán)隊(duì)所有陸戰(zhàn)Agent的相關(guān)信息,按照一定的格式,發(fā)送給協(xié)作團(tuán)隊(duì)中的每個(gè)成員,以方便協(xié)作參與陸戰(zhàn)Agent之間的通信交互,以及在出現(xiàn)突發(fā)事件時(shí),能及時(shí)通知其他成員。其協(xié)作團(tuán)隊(duì)成員信息的格式如表3所示。
表3 協(xié)作團(tuán)隊(duì)成員信息表
協(xié)作團(tuán)隊(duì)生成后,可采用一種節(jié)點(diǎn)規(guī)劃和通用部分全局規(guī)劃(GPGP:Generalized Partial Global Planning)[5]的方法形成一個(gè)全局決心方案。協(xié)作團(tuán)隊(duì)中的所有成員均按照此決心方案,執(zhí)行相關(guān)的作戰(zhàn)任務(wù)。
節(jié)點(diǎn)規(guī)劃是協(xié)作問題求解的重要思想,可以看作是多個(gè)規(guī)劃問題的復(fù)合。首先,各陸戰(zhàn)Agent建立其內(nèi)部規(guī)劃和決策模塊共同作用,形成各自任務(wù)計(jì)劃。然后,陸戰(zhàn) Agent相互交換各自的本地規(guī)劃,利用GPGP協(xié)調(diào)機(jī)理建立全局的具有時(shí)間、空間等約束關(guān)系的決心方案。
在形成作戰(zhàn)任務(wù)計(jì)劃后,各陸戰(zhàn)Agent按總體計(jì)劃執(zhí)行任務(wù)。在協(xié)作任務(wù)執(zhí)行過程中,一方面,由于戰(zhàn)場(chǎng)態(tài)勢(shì)瞬息萬(wàn)變,如果出現(xiàn)突發(fā)情況,導(dǎo)致必須中止當(dāng)前的作戰(zhàn)任務(wù);另一方面,由于陸戰(zhàn)Agent權(quán)威性和受控性的特點(diǎn),如果陸戰(zhàn)Agent接到上級(jí)命令,要求其立刻執(zhí)行某項(xiàng)任務(wù),則陸戰(zhàn)Agent會(huì)立即放棄正在進(jìn)行的所有任務(wù),而去執(zhí)行上級(jí)新的命令。這兩種情況都會(huì)造成協(xié)作關(guān)系的失效。因此,需要定義相應(yīng)的規(guī)則,以方便團(tuán)隊(duì)內(nèi)的所有協(xié)作伙伴能及時(shí)處理,避免不必要的損失。
表4中列舉了一些簡(jiǎn)單的事件規(guī)則,由于戰(zhàn)場(chǎng)的復(fù)雜性,需要對(duì)規(guī)則進(jìn)行不斷的補(bǔ)充和修改。
任務(wù)執(zhí)行完成后,需要綜合考慮陸戰(zhàn)Agent在作戰(zhàn)任務(wù)執(zhí)行期間的戰(zhàn)損情況、士氣、指揮等因素,從而實(shí)現(xiàn)對(duì)所有協(xié)作成員能力的動(dòng)態(tài)評(píng)估,具體可根據(jù)實(shí)際能力情況更新模型。
首先假設(shè):
陸戰(zhàn)Agentq:為協(xié)作請(qǐng)求者;
P:為所有協(xié)作參與者的集合,P={陸戰(zhàn)Agent1,陸戰(zhàn)Agent2,…,陸戰(zhàn)Agentm};
T:為協(xié)作請(qǐng)求者陸戰(zhàn) Agentq提交的所有協(xié)作任務(wù)集,T={T1,T2,…,Tn};
表4 陸戰(zhàn)Agent事件處理規(guī)則
TIDk:為協(xié)作任務(wù)Tk的標(biāo)識(shí);
PIDj:為協(xié)作參與者陸戰(zhàn)Agentj的標(biāo)識(shí);
Prej:為協(xié)作參與者陸戰(zhàn)Agentj的感知度;
PreThj:為協(xié)作參與者陸戰(zhàn)Agentj的感知閾值;
Tamj:為協(xié)作參與者陸戰(zhàn)Agentj當(dāng)前發(fā)送參與協(xié)作任務(wù)承諾數(shù);
Thdj:為協(xié)作參與者陸戰(zhàn)Agentj的參與閾值;
Parjk:為協(xié)作參與者陸戰(zhàn)Agentj關(guān)于協(xié)作任務(wù)Tk的協(xié)作期望值;
Qjk:為協(xié)作參與者陸戰(zhàn)Agentj承諾完成協(xié)作任務(wù)Tk的效果;
Costjk:為協(xié)作參與者陸戰(zhàn) Agentj完成協(xié)作任務(wù)Tk的戰(zhàn)損和消耗;
Resjk:為協(xié)作參與者陸戰(zhàn)Agentj完成協(xié)作任務(wù)Tk的可用資源;
Capjk:為協(xié)作參與者陸戰(zhàn)Agentj完成協(xié)作任務(wù)Tk的作戰(zhàn)能力度;
CadTIDk:為協(xié)作任務(wù)Tk的候選參與協(xié)作者集,CadTIDk={ cadk1,cadk2,…,cadkv};
Bestk:為協(xié)作任務(wù)Tk的最佳協(xié)作者;
BestTeam:為最后形成的協(xié)作團(tuán)隊(duì);
ExpireTime:為協(xié)作請(qǐng)求者陸戰(zhàn)Agentq接收協(xié)作任務(wù)承諾的截止時(shí)刻;
SendPromises:為協(xié)作參與者陸戰(zhàn) Agentj向協(xié)作請(qǐng)求者陸戰(zhàn)Agentq發(fā)送關(guān)于協(xié)作任務(wù)Tk的承諾函數(shù),SendPromises(Qjk,Costjk,Resjk,Capjk,TIDk,PIDj);
ReceivePromises:為協(xié)作請(qǐng)求者陸戰(zhàn)Agentq接收協(xié)作任務(wù)承諾函數(shù),ReceivePromises(Qjk,Costjk,Resjk,Capjk,TIDk,PIDj);
Selectbest(CadTIDk):根據(jù)模糊綜合評(píng)判法為協(xié)作任務(wù)Tk選擇最優(yōu)協(xié)作參與者函數(shù);
SendMember:為協(xié)作請(qǐng)求者陸戰(zhàn) Agentq向協(xié)作參與者陸戰(zhàn)Agentj發(fā)送關(guān)于其成為Tk的協(xié)作成員信息函數(shù),SendMember(PIDj,TIDk)。
那么,陸戰(zhàn)Agent自主協(xié)作實(shí)施步驟如下:
1)陸戰(zhàn) Agentq向黑板提交任務(wù)集合 T={T1,T2,…,Tn}
2)所有協(xié)作參與者陸戰(zhàn) Agentjj=1,2,…,m 同時(shí)對(duì)協(xié)作任務(wù)進(jìn)行評(píng)估,對(duì)自身最能勝任的協(xié)作任務(wù)進(jìn)行承諾:
①判斷感知度和協(xié)作參與閾值是否滿足任務(wù)讀取條件:
3)陸戰(zhàn)Agentq為每一個(gè)協(xié)作任務(wù)接收承諾信息,形成候選參與協(xié)作者集:
4)根據(jù)模糊綜合評(píng)判法為每個(gè)協(xié)作任務(wù)優(yōu)選協(xié)作者,形成團(tuán)隊(duì):
5)發(fā)布協(xié)作團(tuán)隊(duì)成員信息:
6)協(xié)作團(tuán)隊(duì)修正感知度,協(xié)作成員按照內(nèi)部規(guī)劃,形成協(xié)作任務(wù)計(jì)劃。
7)按GPGP方法生成任務(wù)總體計(jì)劃。
8)按任務(wù)總體計(jì)劃執(zhí)行,任務(wù)執(zhí)行中按事件規(guī)則處理突發(fā)事件。
9)如果 異常執(zhí)行步驟(10),否則執(zhí)行步驟11)。
10)按異常處理規(guī)則處理。
11)任務(wù)結(jié)束,修正能力度、感知度。
12)結(jié)束。
本文通過對(duì)合同網(wǎng)協(xié)議應(yīng)用于陸戰(zhàn)Agent自主協(xié)作所存在問題的分析,提出了改進(jìn)合同網(wǎng)協(xié)議的思路和方法,在此基礎(chǔ)上,探討了陸戰(zhàn)Agent自主協(xié)作機(jī)制模型的功能結(jié)構(gòu)、框架、策略、流程和實(shí)施步驟,為陸軍作戰(zhàn)復(fù)雜系統(tǒng)的ABMS奠定了基礎(chǔ)。
[1]Andrew Ilachinski.Land Warfare and Complexity.Part I:MathematicalBackgorundandTechnicalSourcebook[DB/OL].CenterforNavalAnalyses,1996[2009-03-10].http://w ww.cna.org.
[2]韓月敏,劉非平,劉麗巧,等. 陸戰(zhàn)Agent協(xié)作機(jī)制模型研究[J].指揮控制與仿真, 2009,31(6):6-10.
[3]Smith R.G. The Contract Net Protocol: High-Level Conation Communication and Control in distributed problem solver [J]. IEEE Transactions on Computer, 1980,29(12):1104-1113.
[4]韓月敏,彭海,張金榮,等. 陸軍作戰(zhàn)復(fù)雜系統(tǒng) ABMS機(jī)理研究[J].指揮控制與仿真, 2011,33(2):1-4.
[5]韓祥蘭,張剛,劉仰光.通用模糊綜合評(píng)判工具的研究與應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(2):187-190.