尤 岳,陳 科,黃昱申,常 鵬,于昌榮
(1. 海軍研究院,北京 100161;2. 中國(guó)船舶重工集團(tuán)有限公司第七一六研究所,江蘇 連云港 222061)
無(wú)人平臺(tái)具有低成本、高自主、靈活機(jī)動(dòng)、隱蔽、綜合作戰(zhàn)效能高、無(wú)人員傷亡等特征,是應(yīng)對(duì)未來“非對(duì)稱”、“非接觸”對(duì)抗的新型裝備。受限于當(dāng)前無(wú)人平臺(tái)的智能水平,在未來相當(dāng)長(zhǎng)時(shí)期內(nèi),需要有人與無(wú)人系統(tǒng)的深度融合,發(fā)揮各自優(yōu)勢(shì)。強(qiáng)敵憑借其強(qiáng)大的技術(shù)優(yōu)勢(shì),強(qiáng)化對(duì)作戰(zhàn)資源的融合運(yùn)用,注重有人/無(wú)人協(xié)同,在決策中心戰(zhàn)、馬賽克戰(zhàn)等作戰(zhàn)樣式運(yùn)用下,逐步形成了有人/無(wú)人裝備體系[1],有人/無(wú)人平臺(tái)協(xié)同也必將成為未來對(duì)抗的重要樣式。目前,我國(guó)在有人/無(wú)人協(xié)同能力與強(qiáng)敵存在較大差距,面對(duì)現(xiàn)實(shí)威脅,我國(guó)需要加強(qiáng)“非對(duì)稱”、“非接觸”樣式下的能力建設(shè),突破有人/無(wú)人協(xié)同關(guān)鍵技術(shù),對(duì)于提升我國(guó)裝備智能化程度和體系對(duì)抗能力具有重要意義[2]。
本文分析了馬賽克戰(zhàn)作戰(zhàn)概念的內(nèi)涵與主要特征,并聚焦有人/無(wú)人指揮架構(gòu)如何與決策機(jī)制相結(jié)合的問題,提出一種基于 DFCM 的有人/無(wú)人決策技術(shù)方案,該方案具有信息交互簡(jiǎn)單、決策干預(yù)內(nèi)容簡(jiǎn)練、支持對(duì)無(wú)人集群自主決策傾向的調(diào)整等特點(diǎn),對(duì)有人/無(wú)人協(xié)同決策具有一定的參考意義。
美國(guó)戰(zhàn)略與預(yù)算評(píng)估中心在發(fā)布的報(bào)告中稱,僅僅依靠未來可見的技術(shù)進(jìn)步獲得的優(yōu)勢(shì)是有限且短暫的,無(wú)法維持對(duì)大國(guó)競(jìng)爭(zhēng)對(duì)手的優(yōu)勢(shì),應(yīng)當(dāng)考慮通過戰(zhàn)爭(zhēng)模式的創(chuàng)新來獲得長(zhǎng)期的競(jìng)爭(zhēng)優(yōu)勢(shì)。雖然美國(guó)提出了諸如“分布式海上作戰(zhàn)”、“多域作戰(zhàn)”等強(qiáng)調(diào)分散部署的戰(zhàn)爭(zhēng)新概念,但其內(nèi)容缺少?zèng)Q策支持工具和對(duì)分布式作戰(zhàn)的支持。從力量組合的角度,美軍也更傾向于將多個(gè)兵力集合在一起以形成規(guī)模優(yōu)勢(shì),而不是多平臺(tái)分布式部署。為此,美軍提出了馬賽克戰(zhàn)作戰(zhàn)概念,其中心思想是人工指揮和機(jī)器控制相結(jié)合,通過對(duì)分散部署的部隊(duì)進(jìn)行快速分配與重組,提高美軍的適應(yīng)能力并為對(duì)手制造不確定性[3]。
美軍擬通過將多功能兵力分解為大量規(guī)格較小、功能相對(duì)簡(jiǎn)單且更易于相互組合的單元,以獲取信息和決策優(yōu)勢(shì)[3]。不同于以往作戰(zhàn)概念中預(yù)定義的殺傷鏈,馬賽克化的兵力可以形成殺傷網(wǎng),其中多個(gè)獨(dú)立傳感器、對(duì)抗措施、武器和決策要素的配置能夠在行動(dòng)前進(jìn)行組合,以達(dá)成指定的作戰(zhàn)效能。此外,殺傷網(wǎng)中的兵力元素可在任務(wù)前和任務(wù)中動(dòng)態(tài)地組合或重組,包括改變一些兵力的任務(wù)角色。
隨著技術(shù)的進(jìn)步,馬賽克化兵力能夠逐步演進(jìn),但無(wú)法完全代替?zhèn)鹘y(tǒng)的多功能平臺(tái)。由于尺寸較小、功能更加受限,馬賽克化兵力元素一般不需要具備與所有平臺(tái)通信、長(zhǎng)距離航行和長(zhǎng)時(shí)間駐留的能力[4]。在遠(yuǎn)離交戰(zhàn)區(qū)的區(qū)域,傳統(tǒng)的有人平臺(tái)需要作為指揮節(jié)點(diǎn)或?qū)︸R賽克化節(jié)點(diǎn)提供運(yùn)輸和后勤支持;在交戰(zhàn)區(qū),或在廣闊海域分散部署的行動(dòng)中,馬賽克化單元是性價(jià)比更高的選擇。
目前國(guó)內(nèi)學(xué)界開展了大量研究工作,既對(duì)編隊(duì)控制、協(xié)同導(dǎo)航、任務(wù)分配、水下通信等主要問題開展了研究,又在各類著述中提出了新式作戰(zhàn)指揮構(gòu)想,但絕大部分研究未將兩方面結(jié)合形成一個(gè)完整的功能體系。本文旨在提出一種指揮架構(gòu)與決策機(jī)制相融合的有人/無(wú)人決策技術(shù),為智能協(xié)同決策提供支持。
DFCM 模型將動(dòng)態(tài)模糊化和動(dòng)態(tài)因果關(guān)系綜合引入FCM模型,其輸出結(jié)果能夠較好地反映外部環(huán)境變量的作用。本文參考馬賽克戰(zhàn)概念中有人平臺(tái)與無(wú)人平臺(tái)之間集中與分布結(jié)合的指揮關(guān)系,設(shè)計(jì)了融合DFCM方法的有人/無(wú)人決策架構(gòu),用以解決對(duì)分散部署的無(wú)人集群指揮過程中短時(shí)間內(nèi)接受信息多、決策壓力大的問題。
有人/無(wú)人指揮信息交互方式如圖 1所示,無(wú)人平臺(tái)自主形成分布式無(wú)人集群,編組內(nèi)個(gè)體之間進(jìn)行信息交互。當(dāng)需要對(duì)無(wú)人集群發(fā)送任務(wù)信息時(shí),有人平臺(tái)僅需與編組中的任意單元通信,編組內(nèi)的平臺(tái)間可通過信息交互完成任務(wù)指令的傳達(dá)。該方法既可以賦予無(wú)人集群的分布式行為能力,又能使有人平臺(tái)與分布式無(wú)人集群快捷通信[5]。當(dāng)通信受限時(shí),各有人或無(wú)人平臺(tái)可利用任務(wù)信息預(yù)測(cè)其他部隊(duì)的位置和行動(dòng),以避免在執(zhí)行任務(wù)的過程中和其他單位的行動(dòng)產(chǎn)生沖突。
圖1 有人/無(wú)人指揮信息交互示意圖Fig.1 Schematic diagram of informative interaction of human/unmanned command
無(wú)人集群具備一定的自主完成任務(wù)的能力,但是由于無(wú)人平臺(tái)載荷限制,無(wú)人集群的自主決策能力有限,需要人為進(jìn)行干預(yù)。對(duì)無(wú)人集群決策進(jìn)行直接人工干預(yù)可以精確地解決當(dāng)前問題,但未使得自主決策機(jī)制對(duì)應(yīng)環(huán)境作出改變,即無(wú)法賦予無(wú)人集群解決同樣問題的能力[6]。為此,本文針對(duì)無(wú)人集群對(duì)環(huán)境適應(yīng)性的需求,設(shè)計(jì)了有限干預(yù)式?jīng)Q策機(jī)制,通過調(diào)整節(jié)點(diǎn)狀態(tài)或決策門限對(duì)無(wú)人集群的決策進(jìn)行人工干預(yù),從而使無(wú)人集群在類似條件下自主做出適應(yīng)環(huán)境的決策。
如圖2所示,有人/無(wú)人指揮決策架構(gòu)分為感知層、推理層、交互層 3個(gè)層次。在感知層,狀態(tài)控制智能體接收有人平臺(tái)提供任務(wù)信息,并將節(jié)點(diǎn)狀態(tài)輸出給推理層[7];外部信息處理智能體負(fù)責(zé)處理外部環(huán)境信息、有人平臺(tái)的感知信息以及其他無(wú)人平臺(tái)提供的感知與任務(wù)信息,并將處理結(jié)果輸出至DFCM智能體。在推理層,模糊化模塊對(duì)節(jié)點(diǎn)狀態(tài)數(shù)據(jù)進(jìn)行模糊化處理,并將其輸出至DFCM智能體;DFCM智能體[8]處理外部信息和模糊化的節(jié)點(diǎn)狀態(tài)數(shù)據(jù),推理獲得決策結(jié)果,并將其輸出至解模糊模塊和有限干預(yù)式?jīng)Q策智能體;解模糊模塊將模糊化結(jié)果轉(zhuǎn)換為精確的數(shù)值解,并將其輸出至交互層的決策輸出智能體。在交互層,有限干預(yù)式?jīng)Q策智能體、人工決策干預(yù)和DFCM智能體形成一個(gè)反饋回路,動(dòng)態(tài)地調(diào)整決策結(jié)果;決策輸出智能體負(fù)責(zé)接收決策結(jié)果,用于與其他有人或無(wú)人平臺(tái)交互。
圖2 有人/無(wú)人決策架構(gòu)Fig.2 Human/unmanned decision-making frame
決策機(jī)制包括無(wú)人平臺(tái)自主決策和有人平臺(tái)有限干預(yù)式?jīng)Q策2種模式。當(dāng)無(wú)人平臺(tái)由于決策所需信息不全,出現(xiàn)無(wú)法決策或決策不確定性較大的情況時(shí),則啟動(dòng)有限干預(yù)式?jīng)Q策機(jī)制,通過與有人平臺(tái)通信,獲得有人平臺(tái)的干預(yù)信息和支援信息,從而修改狀態(tài)信息或決策目標(biāo)約束,協(xié)同完成決策推理過程[9]。在有限干預(yù)過程中,對(duì)推理規(guī)則等模型細(xì)節(jié)進(jìn)行修改耗時(shí)較長(zhǎng)、結(jié)果不可控。本文選取節(jié)點(diǎn)狀態(tài)與決策門限2類關(guān)鍵量作為調(diào)整對(duì)象,既能夠方便快捷地改變決策模型以適應(yīng)任務(wù)與環(huán)境,又容易預(yù)測(cè)大致的調(diào)整結(jié)果。
如圖3所示,有人平臺(tái)的有限干預(yù)式?jīng)Q策模型框架包含2種有限干預(yù)方式:決策節(jié)點(diǎn)狀態(tài)控制和決策門限調(diào)整。首先用戶需要根據(jù)客觀條件在節(jié)點(diǎn)狀態(tài)控制和決策門限調(diào)整2種方式中進(jìn)行選擇,用戶對(duì)狀態(tài)量進(jìn)行主觀調(diào)整時(shí),一般選擇節(jié)點(diǎn)狀態(tài)控制;當(dāng)用戶需要無(wú)人集群的自主決策適應(yīng)環(huán)境做出變化時(shí),應(yīng)選擇決策門限調(diào)整,改變決策環(huán)節(jié)對(duì)輸入信息的評(píng)價(jià)指標(biāo),賦予無(wú)人集群解決同樣問題的能力。當(dāng)節(jié)點(diǎn)狀態(tài)控制方法不能獲得確定的決策結(jié)果時(shí),轉(zhuǎn)入決策門限調(diào)整方法。首先根據(jù)實(shí)際需求對(duì)決策門限進(jìn)行調(diào)整,再次判斷是否能夠獲得確定的結(jié)果,若不能決定則再次進(jìn)行門限調(diào)整,并循環(huán)這一過程。當(dāng)調(diào)整次數(shù)K大于預(yù)設(shè)閾值Kmax時(shí),系統(tǒng)等待人工直接干預(yù),結(jié)束干預(yù)過程。
圖3 有限干預(yù)機(jī)制框圖Fig.3 Limited intervention method
本例主要實(shí)現(xiàn)決策門限調(diào)整,即通過補(bǔ)充信息,調(diào)節(jié)其自主決策的門限,干預(yù)其完成決策。不同種類的無(wú)人平臺(tái)具備不同的功能和載荷,因而也具備不同的FCM模型,此處以是否告警的決策為例,決策的FCM模型如圖4所示,每個(gè)節(jié)點(diǎn)具備信息處理能力,并能通過接口與其他節(jié)點(diǎn)進(jìn)行交互,模擬實(shí)際系統(tǒng)的動(dòng)態(tài)行為。決策輸入包含 C1和C2兩個(gè)節(jié)點(diǎn),C1表示無(wú)人平臺(tái)執(zhí)行任務(wù)的獎(jiǎng)勵(lì)因子,C2表示風(fēng)險(xiǎn)因子,w13與w23分別為節(jié)點(diǎn)C1與C2狀態(tài)對(duì)決策節(jié)點(diǎn)C3輸入的動(dòng)態(tài)權(quán)值,決策節(jié)點(diǎn)根據(jù)這2個(gè)節(jié)點(diǎn)的狀態(tài)動(dòng)態(tài)輸出決策結(jié)果。無(wú)人平臺(tái)發(fā)現(xiàn)目標(biāo)后,根據(jù)當(dāng)前本平臺(tái)狀態(tài)和態(tài)勢(shì)信息計(jì)算獎(jiǎng)勵(lì)因子和風(fēng)險(xiǎn)因子,作為C1與C2節(jié)點(diǎn)的狀態(tài)量輸入決策節(jié)點(diǎn)。根據(jù)輸入,決策節(jié)點(diǎn)需在“告警”與“繼續(xù)當(dāng)前任務(wù)”2項(xiàng)結(jié)果中進(jìn)行選擇,決策門限參數(shù)與決策結(jié)果關(guān)系如圖5所示。
圖4 決策FCM模型Fig.4 FCM model of decision-making
決策節(jié)點(diǎn)的決策函數(shù)為
式中:
式中,δ和ε為決策結(jié)果的門限參數(shù),其直觀含義如圖5所示。圖5展示了決策門限參數(shù)與決策結(jié)果的關(guān)系,δmax和 δmin、εmax和 εmin分別為 δ和 ε的上下限。當(dāng)決策函數(shù)結(jié)果為–1或 1時(shí)獲得確定的決策結(jié)果;當(dāng)決策函數(shù)變量落在“未確定”區(qū)域,即δ和ε之間時(shí),決策結(jié)果未確定,觸發(fā)有限干預(yù)式?jīng)Q策機(jī)制。
圖5 決策門限參數(shù)與決策結(jié)果關(guān)系Fig.5 Relation between decision threshold values and results
無(wú)人集群決策出現(xiàn)困難時(shí)發(fā)出有限干預(yù)請(qǐng)求,同時(shí)也為有人平臺(tái)的有限干預(yù)提供輔助信息[10]。有人平臺(tái)可利用輔助決策FCM模型對(duì)C1與C2節(jié)點(diǎn)的狀態(tài)進(jìn)行控制,改變無(wú)人集群的自主決策結(jié)果,實(shí)現(xiàn)有限干預(yù)式?jīng)Q策。C2節(jié)點(diǎn)所代表的風(fēng)險(xiǎn)因子是相對(duì)客觀的結(jié)果,一般不作調(diào)整;C1節(jié)點(diǎn)計(jì)算的獎(jiǎng)勵(lì)因子是主觀因素,可調(diào)整 C1節(jié)點(diǎn)狀態(tài)以干預(yù)決策結(jié)果,例如人為地提高獎(jiǎng)勵(lì)因子,從而使無(wú)人集群更傾向于執(zhí)行任務(wù)。
若經(jīng)過決策節(jié)點(diǎn)狀態(tài)控制后,無(wú)人集群仍無(wú)法獲得確定的決策結(jié)果,則對(duì)決策門限進(jìn)行調(diào)整。若希望無(wú)人集群再次決策時(shí)傾向于繼續(xù)當(dāng)前任務(wù),則可以降低ε的值,增大S(x)=1的區(qū)間,反之則提高ε的值;若希望無(wú)人集群能夠更多地進(jìn)行自主決策、減少人為干預(yù),則應(yīng)減小決策結(jié)果不確定的區(qū)間,即增大δ值并減小ε。
本文結(jié)合馬賽克戰(zhàn)概念和 DFCM 方法,提出了一種有限干預(yù)式有人/無(wú)人決策技術(shù),借鑒了馬賽克戰(zhàn)集中與分布相結(jié)合的單元組織模式與賦能方式,設(shè)計(jì)了有人平臺(tái)對(duì)分布式無(wú)人集群有限干預(yù)式?jīng)Q策架構(gòu),利用DFCM在動(dòng)態(tài)環(huán)境下推理決策的優(yōu)勢(shì),結(jié)合上述架構(gòu)構(gòu)建了有限干預(yù)式?jīng)Q策模型,并舉例說明了決策流程與方法。本文對(duì)指揮架構(gòu)與決策機(jī)制進(jìn)行聯(lián)合設(shè)計(jì),為有人/無(wú)人智能協(xié)同決策提供了一種總體方案,該方案能夠動(dòng)態(tài)地調(diào)整決策結(jié)果,同時(shí)能夠調(diào)整無(wú)人集群的自主決策傾向,賦予其適應(yīng)環(huán)境的能力,為有人/無(wú)人智能決策提供支持。