金華剛,楊新民,殷 明
(1.中國(guó)電子科技集團(tuán)第二十八研究所,江蘇 南京 210007;2.南京航空航天大學(xué),江蘇 南京 210016)
?
無人作戰(zhàn)系統(tǒng)決策調(diào)度模型設(shè)計(jì)與仿真*
金華剛1,楊新民1,殷明2
(1.中國(guó)電子科技集團(tuán)第二十八研究所,江蘇 南京 210007;2.南京航空航天大學(xué),江蘇 南京 210016)
隨著現(xiàn)代軍事技術(shù)的發(fā)展,無人作戰(zhàn)飛行器作為戰(zhàn)爭(zhēng)中的重要工具,在空中作戰(zhàn)中發(fā)揮著日益突出的作用。可以預(yù)見,在未來戰(zhàn)爭(zhēng)中,無人作戰(zhàn)飛行器將發(fā)揮重要的作用。從空戰(zhàn)無人作戰(zhàn)系統(tǒng)模型入手,設(shè)計(jì)了三層結(jié)構(gòu)的無人作戰(zhàn)系統(tǒng)決策調(diào)度模型,進(jìn)而基于Agent設(shè)計(jì)了實(shí)驗(yàn)仿真模型,利用引入?yún)f(xié)商機(jī)制的改進(jìn)型遺傳算法進(jìn)行了實(shí)例仿真。實(shí)驗(yàn)表明,所設(shè)計(jì)的無人作戰(zhàn)系統(tǒng)具有比較好的適應(yīng)性,并具有一定的實(shí)用價(jià)值。
無人作戰(zhàn);決策調(diào)度;Agent;遺傳算法
在現(xiàn)代戰(zhàn)爭(zhēng)環(huán)境下,無人作戰(zhàn)飛行器作為未來空中力量的重要一環(huán),正在向集群化、網(wǎng)絡(luò)化和智能化的方向發(fā)展。以無人作戰(zhàn)飛行器為任務(wù)終端的無人作戰(zhàn)系統(tǒng)是未來戰(zhàn)爭(zhēng)最重要的發(fā)展趨勢(shì)之一。目前,世界上相對(duì)成熟的無人作戰(zhàn)系統(tǒng)有美國(guó)的協(xié)同作戰(zhàn)系統(tǒng)(CooperativeEngagementCapability,CEC)和美國(guó)陸軍的未來戰(zhàn)斗系統(tǒng)(FutureCombatSystems,F(xiàn)CS)等,“平臺(tái)無人,系統(tǒng)有人”、“人在環(huán)內(nèi),不在機(jī)(彈)上”成為無人作戰(zhàn)系統(tǒng)最基本的設(shè)計(jì)思想和決策控制特征[1]。對(duì)于無人作戰(zhàn)系統(tǒng)而言,人在環(huán)內(nèi)最高層,通過信息網(wǎng)絡(luò)實(shí)施不進(jìn)行任何具體操作的指令控制。本文所設(shè)計(jì)的無人作戰(zhàn)系統(tǒng)決策調(diào)度模型就是一個(gè)指揮、控制、通信和情報(bào)的統(tǒng)一體。
本文以空中無人作戰(zhàn)平臺(tái)為例(智能導(dǎo)彈或攻擊型無人機(jī))進(jìn)行分析研究。一般情況下,一個(gè)基本的無人作戰(zhàn)系統(tǒng)包括多個(gè)無人作戰(zhàn)平臺(tái)(導(dǎo)彈集群或無人機(jī)編隊(duì)等)、任務(wù)規(guī)劃和控制節(jié)點(diǎn)(以無人機(jī)為平臺(tái)的空中指揮中心)、地面指控中心、無人作戰(zhàn)平臺(tái)的通信數(shù)據(jù)鏈路系統(tǒng)以及空天地一體化的作戰(zhàn)指揮系統(tǒng)。
無人作戰(zhàn)系統(tǒng)典型構(gòu)成如圖1所示。以無人機(jī)為載體的空中指揮平臺(tái),與以導(dǎo)彈、無人機(jī)為代表的無人作戰(zhàn)平臺(tái)組成編隊(duì),形成最小的戰(zhàn)術(shù)系統(tǒng),加上預(yù)警機(jī)和地面指揮系統(tǒng),可構(gòu)成戰(zhàn)役系統(tǒng)。對(duì)于戰(zhàn)略系統(tǒng),必須包含衛(wèi)星和多個(gè)地面指揮系統(tǒng)。其中,無人作戰(zhàn)平臺(tái)任務(wù)規(guī)劃和控制站配置在空中指揮平臺(tái)上。空中指揮平臺(tái)與無人作戰(zhàn)平臺(tái)之間的通信構(gòu)成無人作戰(zhàn)平臺(tái)的通信鏈路系統(tǒng),空中指揮平臺(tái)與預(yù)警機(jī)、地面指揮控制中心等之間的通信包含在空天地一體化的作戰(zhàn)指揮系統(tǒng)中。
圖1 無人作戰(zhàn)系統(tǒng)典型構(gòu)成圖
多個(gè)無人作戰(zhàn)平臺(tái)組成系統(tǒng)中的作戰(zhàn)集群,在作戰(zhàn)環(huán)境下,由地面指揮控制中心或預(yù)警機(jī)通過聯(lián)合戰(zhàn)術(shù)分發(fā)系統(tǒng),實(shí)現(xiàn)對(duì)作戰(zhàn)集群的遠(yuǎn)程指揮,由空中指揮平臺(tái)完成集群編隊(duì)?wèi)?zhàn)術(shù)決策和任務(wù)調(diào)度,由無人作戰(zhàn)平臺(tái)完成作戰(zhàn)任務(wù),充分實(shí)現(xiàn)空中指揮平臺(tái)與無人作戰(zhàn)平臺(tái)集群聯(lián)合編隊(duì)之間的信息共享、可用資源的統(tǒng)一調(diào)度和作戰(zhàn)任務(wù)的綜合管理[2]。
無人作戰(zhàn)系統(tǒng)的決策調(diào)度系統(tǒng)應(yīng)該具有面向多無人作戰(zhàn)平臺(tái)協(xié)同作戰(zhàn)的控制層階結(jié)構(gòu),以及多無人作戰(zhàn)平臺(tái)之間任務(wù)調(diào)度的邏輯結(jié)構(gòu)。本文設(shè)計(jì)的模型如圖2所示。該模型自上而下劃分為協(xié)調(diào)控制層、規(guī)劃調(diào)度層和執(zhí)行層,執(zhí)行層又包括戰(zhàn)術(shù)層和調(diào)節(jié)控制層。其中,協(xié)調(diào)控制層可位于地面站或預(yù)警機(jī)中,規(guī)劃調(diào)度層位于空中指揮平臺(tái)中,執(zhí)行層駐留在無人作戰(zhàn)平臺(tái)上。
圖2 無人作戰(zhàn)系統(tǒng)控制層階與邏輯結(jié)構(gòu)圖
高層決策調(diào)度包括協(xié)調(diào)控制層和規(guī)劃調(diào)度層。協(xié)調(diào)控制層將整個(gè)作戰(zhàn)任務(wù)(攻擊等)分解成每個(gè)無人作戰(zhàn)平臺(tái)編隊(duì)的作戰(zhàn)目標(biāo),實(shí)現(xiàn)無人作戰(zhàn)平臺(tái)編隊(duì)之間的協(xié)同任務(wù)控制,通過預(yù)定協(xié)議與各無人作戰(zhàn)平臺(tái)編隊(duì)進(jìn)行協(xié)商,實(shí)現(xiàn)相互之間的任務(wù)分配和任務(wù)協(xié)調(diào),使系統(tǒng)內(nèi)的所有無人作戰(zhàn)平臺(tái)及其編隊(duì)形成一個(gè)作戰(zhàn)整體。規(guī)劃調(diào)度層實(shí)現(xiàn)無人作戰(zhàn)平臺(tái)編隊(duì)的內(nèi)部任務(wù)控制,包括任務(wù)規(guī)劃、航路規(guī)劃和軌跡規(guī)劃等3個(gè)內(nèi)控層次和任務(wù)分配、計(jì)劃協(xié)調(diào)和沖突消解等3個(gè)外協(xié)層次[3],其由各種規(guī)劃算法和管理軟件組成,實(shí)現(xiàn)無人作戰(zhàn)平臺(tái)的任務(wù)調(diào)度、任務(wù)管理、任務(wù)規(guī)劃和航路規(guī)劃等,并為協(xié)調(diào)控制層提供用于與其他無人作戰(zhàn)平臺(tái)協(xié)商的信息。
底層控制指的是無人作戰(zhàn)系統(tǒng)執(zhí)行層控制,是無人作戰(zhàn)平臺(tái)自身運(yùn)動(dòng)控制部分,包括戰(zhàn)術(shù)層和調(diào)節(jié)控制層,為規(guī)劃調(diào)度層提供系統(tǒng)的狀態(tài)參數(shù)等基礎(chǔ)數(shù)據(jù)支持,從而為系統(tǒng)決策控制提供支撐。
3.1仿真模型的建立
基于上述無人作戰(zhàn)系統(tǒng)模型的決策調(diào)度仿真,應(yīng)在實(shí)驗(yàn)設(shè)計(jì)上重點(diǎn)體現(xiàn)以下幾個(gè)要素:1)反映無人作戰(zhàn)系統(tǒng)整體(包含衛(wèi)星、預(yù)警機(jī)、地面陣地、控制指揮平臺(tái)和無人作戰(zhàn)平臺(tái))、無人作戰(zhàn)編隊(duì)(1個(gè)控制指揮平臺(tái)與多個(gè)無人作戰(zhàn)平臺(tái))和獨(dú)立的無人作戰(zhàn)平臺(tái)(特定型號(hào)的智能導(dǎo)彈或無人機(jī))3層運(yùn)行主體;2)能夠進(jìn)行基于決策規(guī)則和協(xié)商機(jī)制的自主控制決策與任務(wù)調(diào)度;3)通過算法實(shí)現(xiàn)的決策規(guī)則和協(xié)商機(jī)制能夠獲得優(yōu)化的作戰(zhàn)調(diào)度方案。
對(duì)于無人作戰(zhàn)系統(tǒng)而言,一旦投入戰(zhàn)斗狀態(tài),系統(tǒng)所有任務(wù)都必然受到有限資源環(huán)境(如油料資源、通信資源、火力資源和位置資源等)的約束,自主決策控制與任務(wù)調(diào)度的過程就必須在這些約束下尋求最佳狀態(tài)完成任務(wù)。本文的仿真實(shí)驗(yàn)盡量簡(jiǎn)化戰(zhàn)場(chǎng)環(huán)境,考慮在有限資源約束下,仿真決策過程獲得自主決策控制的調(diào)度結(jié)果。
在仿真實(shí)驗(yàn)中,將總資源設(shè)定為一個(gè)常數(shù),對(duì)于每個(gè)無人作戰(zhàn)平臺(tái)而言,執(zhí)行一個(gè)最底層的任務(wù)的代價(jià)可以用完成時(shí)間和資源消耗這2個(gè)參數(shù)來描述,自主決策調(diào)度以最充分利用資源,最短時(shí)間完成作戰(zhàn)任務(wù)為優(yōu)化目標(biāo)。
無人作戰(zhàn)系統(tǒng)的任務(wù)是由多個(gè)無人作戰(zhàn)編隊(duì)組成的,每個(gè)編隊(duì)的任務(wù)又可以分解成若干個(gè)無人作戰(zhàn)平臺(tái)的任務(wù),因此可以用一個(gè)多Agent系統(tǒng)來模擬無人作戰(zhàn)系統(tǒng),每個(gè)Agent代理一個(gè)由1個(gè)空中指揮平臺(tái)和多個(gè)無人作戰(zhàn)平臺(tái)組成的作戰(zhàn)編隊(duì),每個(gè)Agent任務(wù)代表一個(gè)無人作戰(zhàn)編隊(duì)的任務(wù),且可以分解成若干個(gè)Agent子任務(wù),即每個(gè)作戰(zhàn)平臺(tái)的任務(wù)。
假定單個(gè)無人作戰(zhàn)平臺(tái)的作戰(zhàn)功能各不相同,對(duì)于同一個(gè)Agent任務(wù),其分解成的Agent子任務(wù)之間存在著優(yōu)先級(jí)制約,比如對(duì)于協(xié)同偵查與監(jiān)視任務(wù),敵區(qū)域感知子任務(wù)的優(yōu)先級(jí)高于敵區(qū)關(guān)鍵設(shè)施搜索子任務(wù),敵區(qū)關(guān)鍵設(shè)施搜索子任務(wù)的優(yōu)先級(jí)又高于目標(biāo)設(shè)施定位與特征采集子任務(wù);對(duì)于不同的Agent任務(wù),各自分解出來的Agent子任務(wù)之間又存在資源競(jìng)爭(zhēng)問題。
多Agent系統(tǒng)自主決策調(diào)度的目標(biāo)是在滿足實(shí)時(shí)性要求的時(shí)間內(nèi),給出應(yīng)對(duì)當(dāng)前整體作戰(zhàn)任務(wù)的最佳解決方案。具體的講,就是在最短時(shí)間內(nèi)完成一個(gè)滿足任務(wù)時(shí)間要求和Agent子任務(wù)優(yōu)先級(jí)排列,且系統(tǒng)資源允許的作戰(zhàn)任務(wù)調(diào)度方案。
3.2仿真算法的選取
可用于任務(wù)決策調(diào)度的算法很多,本文選擇引入?yún)f(xié)商機(jī)制的改進(jìn)型遺傳算法[4],通過1個(gè)染色體代表一個(gè)整體的作戰(zhàn)任務(wù)方案;通過染色體的矩陣化結(jié)構(gòu)設(shè)計(jì),體現(xiàn)各任務(wù)編隊(duì)(Agent任務(wù))及各無人作戰(zhàn)平臺(tái)任務(wù)(Agent子任務(wù))的任務(wù)序列及資源消耗關(guān)系;通過Agent協(xié)商模擬系統(tǒng)內(nèi)各編隊(duì)之間的溝通機(jī)制;通過適應(yīng)度函數(shù)的設(shè)計(jì),實(shí)現(xiàn)總資源約束和最優(yōu)作戰(zhàn)調(diào)度方案比選。
3.3仿真實(shí)例
實(shí)驗(yàn)假設(shè)完成某一作戰(zhàn)任務(wù)時(shí),需要協(xié)同偵查與監(jiān)視、對(duì)敵防空壓制、協(xié)同攻擊關(guān)鍵設(shè)施和協(xié)同攻擊防空系統(tǒng)等4個(gè)無人作戰(zhàn)任務(wù)編隊(duì)組合完成任務(wù)。假設(shè)4個(gè)任務(wù)編隊(duì)中都只有3個(gè)無人作戰(zhàn)平臺(tái),即都可以分解為3個(gè)子任務(wù),各個(gè)子任務(wù)耗費(fèi)資源和占用時(shí)間的情況量化為數(shù)字指標(biāo)(見表1),同一個(gè)Agent任務(wù)所分解出的子任務(wù)按優(yōu)先級(jí)從高到低排列。
表1 自主決策控制算法指標(biāo)值
選擇6個(gè)任務(wù)結(jié)點(diǎn),其總體作戰(zhàn)方案矩陣,即染色體結(jié)構(gòu)矩陣為:
與總體作戰(zhàn)方案矩陣對(duì)應(yīng)的是時(shí)間消耗矩陣A和資源占用矩陣B,用于輔助計(jì)算適應(yīng)度。
當(dāng)TN矩陣中某一個(gè)基因值為1時(shí),A、B矩陣與之對(duì)應(yīng)位置的值為某一特定Agent子任務(wù)完成任務(wù)所消耗的時(shí)間和占用的資源。
假設(shè)系統(tǒng)總資源為50,取隨機(jī)生成的作戰(zhàn)調(diào)度方案?jìng)€(gè)數(shù)即初始種群大小為6,交叉概率取為0.5,變異概率取為0.05,遺傳算法執(zhí)行次數(shù)取為15,為便于計(jì)算,將總耗時(shí)的倒數(shù)擴(kuò)大100倍作為適應(yīng)度值。運(yùn)行程序,程序截圖如圖3所示。
圖3 基于改進(jìn)型遺傳算法的決策調(diào)度運(yùn)行程序截圖
從圖3可以看出,初始狀態(tài)隨機(jī)生成的調(diào)度方案適應(yīng)度值參差不齊,隨著程序迭代,調(diào)度方案的適應(yīng)度值不斷提高,當(dāng)程序迭代到第12次時(shí),生成了適應(yīng)度值為3.225 806的最優(yōu)任務(wù)調(diào)度方案,此方案的耗時(shí)最短為31,資源利用率最高。此方案對(duì)應(yīng)的結(jié)構(gòu)矩陣如下:
此方案對(duì)應(yīng)的時(shí)間消耗矩陣A和資源占用矩陣B分別如下:
按照此決策調(diào)度方案(見表2),12個(gè)Agent子任務(wù)組合成6個(gè)啟動(dòng)批次,當(dāng)前一批次中有Agent子任務(wù)完成,且騰出有足夠下一批次Agent子任務(wù)的資源時(shí),下一批次Agent子任務(wù)組合便啟動(dòng)任務(wù)。
表2 最優(yōu)決策調(diào)度方案任務(wù)組合表
本文主要研究了無人作戰(zhàn)系統(tǒng)的決策調(diào)度模型的基本組成,并通過算法模型進(jìn)行了仿真驗(yàn)證。后續(xù)可以逐步增加約束條件,完善決策機(jī)制和決策規(guī)則,形成完整的設(shè)計(jì)和仿真體系。
[1] 石章松, 左丹. 無人作戰(zhàn)平臺(tái)智能指揮控制系統(tǒng)結(jié)構(gòu)[J]. 指揮信息系統(tǒng)與技術(shù), 2012(4):12-15.
[2] 陳瑛, 劉麗, 曾勇虎. 美軍未來無人系統(tǒng)發(fā)展的關(guān)鍵技術(shù)[J]. 飛航導(dǎo)彈, 2010(7):33-37.
[3] 龍濤. 多UCAV協(xié)同任務(wù)控制中分布式任務(wù)分配與任務(wù)協(xié)調(diào)技術(shù)研究[D]. 長(zhǎng)沙:國(guó)防科技大學(xué),2006.
[4] 趙敏,姚敏,劉兼唐.基于遺傳算法的小衛(wèi)星多Agent任務(wù)調(diào)度優(yōu)化設(shè)計(jì)[J].儀器儀表學(xué)報(bào),2008(7):1475-1479.
* 中國(guó)電子科技集團(tuán)重大電子支撐項(xiàng)目子課題資助項(xiàng)目(PU52150237)
責(zé)任編輯鄭練
UnmannedCombatSystemDesignandSimulationofDecision-makingSchedulingModel
JINHuagang1,YANGXinmin1,YINMing2
(1.ChinaElectronicsTechnologyGroupCorporation28thResearchInstitute,Nanjing210007,China;2.NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China)
Withthedevelopmentofmodernmilitarytechnology,theunmannedcombatflightasavitaltoolinthewar,inaircombatisplayinganincreasinglyprominentrole.Itisforeseeablethatinfuturewars,unmannedcombatflightchesswillplayanimportantrole.Fromtheunmannedcombatairsystemmodel,designunmannedcombatsystemdecisionsschedulingmodelwiththree-layerstructure,andthendesignexperimentsimulationmodelbasedonAgent,usingtheintroductionofconsultativemechanismsimprovinggeneticalgorithmissimulated.Unmannedcombatsystemprovedhereinhasabetteradaptability,andhassomepracticalvalue.
unmannedcombat,decisionscheduling,Agent,geneticalgorithm
2016-01-20
TP 273;V 271.4
A
金華剛(1978-),男,大學(xué)本科,高級(jí)工程師,主要從事指揮信息系統(tǒng)總體等方面的研究。