王丹妮 徐麗 李思照
摘要:軍事智能推演在復(fù)雜、大規(guī)模、多裝備軍事推演領(lǐng)域扮演著重要的角色,通過模擬戰(zhàn)場環(huán)境,不僅能夠?qū)σ呀?jīng)制定好但還未實行的作戰(zhàn)計劃進行演練與改進,還能復(fù)現(xiàn)已經(jīng)完成的作戰(zhàn)任務(wù),對作戰(zhàn)過程進行客觀評價和理性總結(jié)。從智能推演的發(fā)展、軍事仿真推演系統(tǒng)的成果、軍事推演的關(guān)鍵技術(shù)及其研究現(xiàn)狀,以及推演方案評估等幾個方面對當前軍事智能推演發(fā)展情況進行梳理與展望。
關(guān)鍵詞:智能推演;仿真推演;人工智能;深度強化學(xué)習(xí)
中圖分類號:E91文獻標志碼:A文章編號:1008-1739(2022)09-43-9
現(xiàn)代戰(zhàn)爭的范圍正向陸、海、空、天、電、網(wǎng)一體化拓展,具有復(fù)雜多變、戰(zhàn)場迷霧、立體對抗和數(shù)據(jù)量劇增等特點[1]。與此同時,人工智能的第3次浪潮推動軍事活動朝著計算智能到智能感知再到智能認知發(fā)展。兵棋是當前最常用的輔助和決策工具,算法支持下的計算機兵棋推演能夠?qū)崿F(xiàn)軍事智能化的探索,形成綜合不同兵種的大規(guī)模兵棋系統(tǒng)。
軍事推演主要包括2個方面的內(nèi)容[2]:一是對已經(jīng)制定好但還未實行的作戰(zhàn)計劃,通過推演行動模擬和評估過程中存在的不確定性,為計劃的修改完善提供科學(xué)依據(jù);二是對已經(jīng)完成的作戰(zhàn)行動復(fù)現(xiàn),對其作戰(zhàn)決策進行客觀評價,對作戰(zhàn)經(jīng)驗進行理性總結(jié)。運用人工智能技術(shù)開發(fā)基于多維信息的戰(zhàn)場態(tài)勢感知和決策智能化,并將其應(yīng)用到軍事活動的對抗推演或輔助指揮控制智能決策中,一直是軍事智能化領(lǐng)域的研究熱點,同時能削減軍費開支、節(jié)約人力和時間、降低戰(zhàn)場傷亡。實現(xiàn)軍事推演智能化要從數(shù)據(jù)、態(tài)勢分析和智能算法三大要素出發(fā),解決聯(lián)合作戰(zhàn)不確定性系統(tǒng)的智能博弈與決策問題,建立對抗策略與學(xué)習(xí)技術(shù),使軍事推演過程能夠模擬人的行為,正確判斷戰(zhàn)場態(tài)勢,選擇最優(yōu)的決策進行下一步行動。
以深度學(xué)習(xí)和強化學(xué)習(xí)為代表的人工智能技術(shù)已經(jīng)在圖像識別、語音識別和自然語言處理等領(lǐng)域逼近或超越人類感知。能夠在規(guī)則不完備、信息不完全的情況下與環(huán)境交互,具有強大的決策能力,在軍事推演領(lǐng)域有著廣泛的應(yīng)用前景?;谝陨媳尘?,本文主要從兵棋推演、仿真推演系統(tǒng)、軍事推演的關(guān)鍵技術(shù)和研究現(xiàn)狀以及方案評估方面對當前軍事推演發(fā)展現(xiàn)狀進行梳理。
1.1兵棋推演
兵棋于1811年由普魯士的宮廷文職戰(zhàn)爭顧問馮·萊斯維茨發(fā)明,在國外已有200多年的歷史,是現(xiàn)代戰(zhàn)爭模擬和分析的重要手段。兵棋推演則是利用兵棋模擬戰(zhàn)爭活動的工具,通過多種科學(xué)方法實現(xiàn)戰(zhàn)爭過程的仿真及推演,采用人在回路的方式按照兵棋規(guī)則掌控局勢,完成對抗作戰(zhàn)的過程,被古今兵家視作有效的作戰(zhàn)推演和訓(xùn)練手段之一。人在回路的推演方式如圖1所示。
兵棋的棋子由代表作戰(zhàn)單位的“單位算子”和代表戰(zhàn)場事件的“事件算子”構(gòu)成。單位算子上顯示軍兵種、主要裝備、攻擊力值和防御力值等信息,事件算子則用于記錄傷亡、損耗和突發(fā)事件等動態(tài)情況,受裁決者控制[4]。
兵棋規(guī)則是兵棋推演的核心準則。按照勝負裁決規(guī)則可將兵棋分為嚴格依據(jù)兵棋規(guī)則手冊進行結(jié)果裁決的“嚴格式兵棋”和由裁決者靈活實施裁決規(guī)則的“自由式兵棋”,現(xiàn)多以“嚴格式兵棋”研究為主。然而,兵棋推演勝負裁決規(guī)則建立困難,針對此問題,薛輝等人[5]運用運籌分析方法建立基礎(chǔ)作戰(zhàn)模型,通過Bayes方法及混合Beta分布實現(xiàn)基礎(chǔ)模型與歷史經(jīng)驗規(guī)律的合理融合,調(diào)整勝負裁決概率達成有效提高勝負裁決概率準確度的目標,完成了對兵棋推演的勝負裁決規(guī)則建模的首次探索。此外,蘭徹斯特模型和模糊Petir網(wǎng)的知識表示與推理方法在兵棋規(guī)則和推理決策的設(shè)計中也受
學(xué)者青睞[6-7]。
兵棋隨著計算機的出現(xiàn)而快速推廣,20世紀60年代計算機兵棋出現(xiàn),于80年代后期隨著計算機的普及被廣泛應(yīng)用[8]。計算機兵棋使用戶能夠定義自己的能力,而不受預(yù)定義能力集的限制[9],在油庫火災(zāi)的構(gòu)想和應(yīng)用[10]、高校國防教育課程[11]、城市危機應(yīng)急管理[12-13]和后勤物資儲備計算[14-15]等方面,特別是在公共衛(wèi)生防疫領(lǐng)域[16]被屢次采用。2020年新冠肺炎疫情對世界格局產(chǎn)生極大影響,著名的矩陣式兵棋專家Tim Price就此設(shè)計了一個矩陣式兵棋———抹平曲線(Flattening the Curve)推演新冠肺炎疫情。
由于計算機在存儲、計算和繪圖方面具有獨特優(yōu)勢受到軍方重視,遂各國開發(fā)多種兵棋推演系統(tǒng)助力軍事仿真推演。兵棋推演系統(tǒng)在大規(guī)模聯(lián)合作戰(zhàn)理論和戰(zhàn)法研究方面發(fā)揮著重要作用[17]。目前為止,推演系統(tǒng)的研發(fā)成果以美國為主,美國雖非兵棋發(fā)源地,卻是兵棋的集大成者[18],在作戰(zhàn)技術(shù)路線繪制[19]、自動生成防空任務(wù)航路規(guī)劃[20]、復(fù)制大規(guī)模演習(xí)[21]等多領(lǐng)域均使用計算機兵棋技術(shù),而且開發(fā)出眾多被投入使用的計算機兵棋仿真推演系統(tǒng)。對于兵棋系統(tǒng)在實戰(zhàn)化軍事訓(xùn)練中的應(yīng)用[22],我國仍處于探索發(fā)展階段,能夠完整投入軍事訓(xùn)練的推演系統(tǒng)較少,其中,由國防科技大學(xué)楊峰教授團隊開發(fā)的OCEAN仿真兵棋推演平臺被用于驗證對象過程方法論(Object-Process Methodology,OPM)作為輔助高層決策作戰(zhàn)行動方案建模方法的有效性[23]。
事實上,兵棋推演作為一種對抗活動并非按照“下棋”的方式雙方輪流每次執(zhí)行一步策略,而是依照實際作戰(zhàn)環(huán)境,逼真展現(xiàn)陸、海、空、天、電、網(wǎng)聯(lián)合作戰(zhàn)環(huán)境,根據(jù)態(tài)勢進行決策,完成推演過程的持續(xù)推進。因此,兵棋推演需要打破回合制的推演過程向?qū)崟r模擬對抗轉(zhuǎn)變。大型的兵棋推演與棋類對抗推演方法不同,主要涵蓋以下3點:①各級指揮員和指揮機關(guān)為主的參演人員;②兵棋系統(tǒng)模擬的戰(zhàn)場環(huán)境和作戰(zhàn)部隊及相關(guān)數(shù)據(jù)、規(guī)則和約束等;③組織兵棋推演的導(dǎo)演及導(dǎo)調(diào)機構(gòu)。由于戰(zhàn)爭中存在各種不確定性,同樣的策略應(yīng)用于不同的戰(zhàn)場可能會造成截然相反的結(jié)果,這就明確了兵棋推演的目標是過程重于結(jié)果,發(fā)現(xiàn)問題重于區(qū)別勝負。
然而,兵棋不是解決戰(zhàn)爭問題的萬能工具。美國著名兵棋專家Peter.Perla在文獻[24]中指出,兵棋推演必須與實兵演習(xí)、運籌分析、軍事歷史研究結(jié)合在一起,形成一個連續(xù)的研究循環(huán),使每一種工具都能在其中發(fā)揮最大的功用。如今兵棋推演與人工智能技術(shù)的融合成為研究熱點,這將逐步實現(xiàn)從現(xiàn)代計算機兵棋到智能兵棋的飛躍,智能兵棋推演能夠?qū)崿F(xiàn)訓(xùn)練、對抗、評估的一體化,是未來對抗作戰(zhàn)的關(guān)鍵樞紐,美國已投入近20億美元用于人工智能應(yīng)用兵棋推演的研究[25]。
1.2仿真推演
隨著智能化技術(shù)的迅猛發(fā)展,新型科學(xué)技術(shù)在信息化戰(zhàn)爭中得到廣泛應(yīng)用,特別是仿真技術(shù)在軍事科學(xué)領(lǐng)域扮演著重要角色。仿真推演系統(tǒng)綜合多種武器裝備和戰(zhàn)術(shù),能夠模擬復(fù)雜戰(zhàn)場環(huán)境下武器裝備對抗場景,是研究戰(zhàn)爭的重要手段。
1.2.1仿真推演
仿真技術(shù)集成計算機、網(wǎng)絡(luò)、軟件、信息和控制等多個技術(shù)領(lǐng)域的知識,然后利用這種綜合性知識建立模型實現(xiàn)科學(xué)實驗,能有效完成系統(tǒng)分析、設(shè)計、試驗和評估,具有經(jīng)濟可靠、安全實用、靈活有效的優(yōu)勢,在軍事領(lǐng)域具備廣闊的發(fā)展前景。軍事仿真是指對武器技術(shù)、系統(tǒng)及作戰(zhàn)的仿真,在軍隊訓(xùn)練、武器研制、作戰(zhàn)計劃制定等發(fā)面發(fā)揮著重要作用,是國防領(lǐng)域重點發(fā)展的關(guān)鍵技術(shù)[26]。美國在軍事建模與仿真領(lǐng)域領(lǐng)跑全球,其在仿真推演系統(tǒng)研究過程中產(chǎn)生的標準已成為世界各國開發(fā)作戰(zhàn)仿真系統(tǒng)的藍本和基礎(chǔ)[27]。目前,美國已經(jīng)將仿真推演系統(tǒng)作為軍事研究的首選工具,對縮短作戰(zhàn)概念更新周期、減少實際演習(xí)次數(shù)、節(jié)省經(jīng)費、提升武器裝備性能、強化軍隊訓(xùn)練等方面十分有效,這也是美國在軍事領(lǐng)域始終保持強國地位的關(guān)鍵點之一。
美國的軍事建模與仿真技術(shù)的發(fā)展主要經(jīng)歷了3個階段:一是以傳統(tǒng)建模理論為代表的分析模型,將作戰(zhàn)裝備及其性能經(jīng)相關(guān)算法處理后,結(jié)合概率論對武器裝備的效能進行分析預(yù)測;二是分布式交互技術(shù)為代表的多層次聯(lián)邦模型,以1996年8月美國國防部頒布的通用高層體系結(jié)構(gòu)(High Level Architecture,HLA)為核心創(chuàng)建起的分布式仿真聯(lián)邦,仿真成員可以自由地加入聯(lián)邦,使用RTI完成成員間的對抗和交互。21世紀數(shù)據(jù)分發(fā)服務(wù)(Data Distribution Service,DDS)與HLA聯(lián)合的運行模式在作戰(zhàn)仿真推演系統(tǒng)中興起,成為當前軍事仿真推演領(lǐng)域的標準規(guī)范,對仿真需求中存在的問題有較強的處理能力;三是C4ISR建模為核心的集成建模與仿真技術(shù)。體系效能分析仿真系統(tǒng)(System Effectiveness Analysis Simulation,SEAS)是蘭德公司以C4ISR為核心開發(fā)的仿真系統(tǒng),采用集中服務(wù)式的體系結(jié)構(gòu)和閉環(huán)蒙特卡洛隨機仿真分析作戰(zhàn)效能。美軍的典型仿真推演系統(tǒng)有兵力結(jié)構(gòu)效能仿真系統(tǒng)(4ACES)、擴展放空仿真系統(tǒng)(EADSIM)、戰(zhàn)區(qū)聯(lián)合作戰(zhàn)模擬系統(tǒng)(JTLS)、美軍聯(lián)合作戰(zhàn)仿真系統(tǒng)(JWARS)、半自動兵力仿真系統(tǒng)(OneSAF)、現(xiàn)代空海作戰(zhàn)兵棋推演系統(tǒng)(CMANO)和SEAS。
1.2.2在軍事訓(xùn)練中的應(yīng)用價值
戰(zhàn)爭的勝利涉及到各種各樣的因素。根據(jù)軍事理論,這些要素通常涉及部署、偵察、機動、突破、節(jié)奏、突襲、利用和沖擊等,目的是造成敵方組織的瓦解[28]。實戰(zhàn)化訓(xùn)練需要復(fù)刻實際戰(zhàn)場環(huán)境,在軍事訓(xùn)練中無法長期廣泛使用,因此,仿真推演系統(tǒng)成為軍事訓(xùn)練中為達成信息化戰(zhàn)場態(tài)勢模擬、數(shù)字化作戰(zhàn)行動決策、科學(xué)性方案分析目的首選的形式,同時能夠?qū)崿F(xiàn)實戰(zhàn)化訓(xùn)練的對抗需求。黃其旺等人[27]以仿真推演的作用為立足點,從分析類仿真、訓(xùn)練類仿真和采辦類仿真3個方面分別論述了仿真推演系統(tǒng)對現(xiàn)代戰(zhàn)爭的主要影響。本文將從以下3點分析仿真推演系統(tǒng)在軍事訓(xùn)練中的應(yīng)用價值:
①仿真推演系統(tǒng)為實戰(zhàn)化軍事訓(xùn)練提供先進的訓(xùn)練工具。仿真推演系統(tǒng)集成了兵棋推演技術(shù),是一種存在缺陷但十分有用的工具[29],能夠運用兵棋系統(tǒng)實時觀測戰(zhàn)場地理環(huán)境、即時掌握全方位戰(zhàn)場數(shù)據(jù)、分析受控變量與觀測結(jié)果的因果關(guān)系、訓(xùn)練作戰(zhàn)人員對動態(tài)戰(zhàn)場形勢定量分析思維及支持作戰(zhàn)決策的量化分析。實現(xiàn)新技術(shù)和新理念與現(xiàn)有策略快速有效融合來增強軍事實戰(zhàn)能力,向沉浸式的聯(lián)合作戰(zhàn)方向推進是仿真推演系統(tǒng)的重要發(fā)展趨勢之一。
②仿真推演系統(tǒng)為實戰(zhàn)化軍事訓(xùn)練提供科學(xué)的方法論指導(dǎo)。與傳統(tǒng)手工兵棋相比,仿真推演系統(tǒng)具備應(yīng)對矛盾的哲學(xué)思維,面對奇正虛實、進攻防御、打擊抵抗等狀況能客觀地反映戰(zhàn)爭規(guī)律。對于實戰(zhàn)化戰(zhàn)場中存在的不確定性,通過兵棋規(guī)則和隨機數(shù)發(fā)生器的設(shè)計實現(xiàn)不可復(fù)制的作戰(zhàn)結(jié)果。仿真推演活動能夠在不斷地推演和復(fù)盤中培養(yǎng)推演人員的思維,積累作戰(zhàn)經(jīng)驗,從而不斷提高謀略水平和應(yīng)對重、難、新問題的能力。
③仿真推演系統(tǒng)為新型武器裝備的發(fā)展提供優(yōu)化思路。仿真技術(shù)被美國國防部貫穿于裝備建設(shè)從發(fā)展規(guī)劃、設(shè)計定型、研制生產(chǎn)到部署使用、維修保障的整個生命周期,通過仿真推演系統(tǒng)分析不同裝備體系在探測、通信、毀傷和決策能力上的差別,為武器裝備體系的發(fā)展進行定量分析,提高工作效率。
1.3關(guān)鍵技術(shù)
1.3.1理論基礎(chǔ)
理論指導(dǎo)科學(xué)研究的具體進程,研究結(jié)果促進新理論的生成,二者相互促進,互相成就。軍事推演與人工智能技術(shù)的融合同樣建立在理論基礎(chǔ)與科學(xué)研究相輔相成的基礎(chǔ)上。軍事推演的目的是通過推演尋找和判斷決策是否可行,是對決策路徑的搜索行為,故將基礎(chǔ)理論分為以下3點[3]:
(1)無信息搜索
無信息搜索以博弈論為代表,也稱其為對策論,是一種主要研究存在對抗現(xiàn)象和競爭行為的數(shù)學(xué)方法。博弈論中對抗雙方的目的不同,通過思考對方可能的行動方案制定己方方案,并選擇對自己最有利的方案。博弈模型是博弈問題的數(shù)學(xué)模型,由局中人、策略和贏得函數(shù)構(gòu)成。局中人是指理智的、有權(quán)決定自身行動策略的參與者,策略是博弈過程中待局中人選擇的行動方案,將每位局中人制定的策略集成為一個局勢,然后由初始狀態(tài)、后繼函數(shù)、終止測試以及贏得函數(shù)定義一顆博弈樹,博弈樹的節(jié)點分別存放紅方和藍方的選擇,紅方通過遍歷博弈樹,可以按照節(jié)點的擴展順序選擇深度優(yōu)先、寬度優(yōu)先或一致耗費搜索方式得到最佳策略,找出符合條件的一個終止節(jié)點。
(2)有信息搜索
由于博弈樹節(jié)點會因大事件導(dǎo)致節(jié)點過多造成計算機存儲能力無法滿足遍歷需求,且時間太長,因此有信息搜索策略被提出。有信息搜索策略使用截斷函數(shù)實現(xiàn)由非終止節(jié)點到葉子終止節(jié)點的轉(zhuǎn)變,通過評價函數(shù)選擇接下來進行擴展的節(jié)點,即便存在最優(yōu)決策無法處理的情況,也能找到與取勝密切相關(guān)的決策。評價函數(shù)的質(zhì)量決定了搜索的性能表現(xiàn),關(guān)鍵在于根據(jù)問題的額外信息找到合理的啟發(fā)函數(shù)。
(3)局部搜索算法
評價函數(shù)設(shè)計的重點在于特征權(quán)重的賦值,然而特征數(shù)組中每個狀態(tài)都對應(yīng)一種啟發(fā)函數(shù),這就要求在全部狀態(tài)中找到最優(yōu)狀態(tài),將這種尋找最優(yōu)狀態(tài)的問題稱為最優(yōu)化問題,局部搜索算法就是用于解決優(yōu)化問題的方法。應(yīng)對最優(yōu)化問題有2種策略:一是根據(jù)經(jīng)驗人工調(diào)整;二是通過計算機搜索最優(yōu)狀態(tài)。局部搜索算法按照相鄰狀態(tài)選擇方式的區(qū)別,可以分為爬山算法、模擬退火算法、局部剪枝算法和遺傳算法。
1.3.2軍事推演中的關(guān)鍵技術(shù)
人工智能技術(shù)形成了以神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、強化學(xué)習(xí)為代表的關(guān)鍵技術(shù),并且在軍事推演中得到認可。縱觀智能化軍事推演的發(fā)展,深度強化學(xué)習(xí)、樣本生成、小樣本學(xué)習(xí)、遷移學(xué)習(xí)是當下軍事推演研究中的熱門技術(shù)。
①深度強化學(xué)習(xí)是深度學(xué)習(xí)與強化學(xué)習(xí)相結(jié)合形成的具有感知決策能力的技術(shù)。深度學(xué)習(xí)具有感知能力,使用神經(jīng)網(wǎng)絡(luò)模擬人腦機制,對大量有效樣本無監(jiān)督的預(yù)訓(xùn)練和有監(jiān)督的逐層訓(xùn)練實現(xiàn)特征提取和分類,不斷調(diào)整訓(xùn)練參數(shù)獲得內(nèi)在關(guān)系和邏輯。強化學(xué)習(xí)具有決策能力,融入試錯機制,采取與環(huán)境信息交互的方式積累獎賞以達到最優(yōu)策略,強化學(xué)習(xí)原理示意如圖2所示,是一種適用于所有生物適應(yīng)環(huán)境的途徑。二者結(jié)合,優(yōu)勢互補,為軍事仿真推演復(fù)雜系統(tǒng)提高感知決策能力提供了新思路。
②樣本生成技術(shù)能夠有效解決樣本稀缺問題。生成對抗網(wǎng)絡(luò)是一種典型的、可用于數(shù)據(jù)擴增的樣本生成技術(shù),生成對抗網(wǎng)絡(luò)進行樣本數(shù)據(jù)擴增示意如圖3所示。由于軍事作戰(zhàn)屬于保密活動,嚴禁數(shù)據(jù)泄露,能夠得到的只有國內(nèi)軍事領(lǐng)域的樣本,難以獲得國外軍隊作戰(zhàn)數(shù)據(jù),這就限制了軍事推演仿真數(shù)據(jù)的來源。為了解決作戰(zhàn)態(tài)勢數(shù)據(jù)樣本少這一問題,樣本生成技術(shù)利用少量隨機樣本的自我博弈生成更多樣本,能夠隨機或按需以由少生多的方式獲取樣本,如圖像旋轉(zhuǎn)[30-31]、局部空間分解和動態(tài)隨機推演等。
③小樣本學(xué)習(xí)具有抓住事物主要特征即可識別該事物的學(xué)習(xí)能力,部分小樣本學(xué)習(xí)方法優(yōu)缺點對比如表1所示。然而,機器想要具備這種能力卻需要花費大量時間,因此文獻[32]提出概率規(guī)劃歸納計算方法,并采用圖靈測試驗證了可行性。小樣本學(xué)習(xí)對戰(zhàn)場態(tài)勢中存在復(fù)雜抽象現(xiàn)象具備很好的識別和認知能力,對于軍事作戰(zhàn)推演的理解具備重要意義。
④遷移學(xué)習(xí)是一種典型的小樣本學(xué)習(xí),能夠在相似性領(lǐng)域利用訓(xùn)練好的模型獲得新模型[33]。只需要給定遷移學(xué)習(xí)源問題域中的數(shù)據(jù)和任務(wù),再增加小部分新領(lǐng)域數(shù)據(jù)和學(xué)習(xí)任務(wù)就能很快遷移到新領(lǐng)域投入使用,遷移學(xué)習(xí)的一般過程如圖4所示。只需要教機器學(xué)會“直升機”就能在很短時間內(nèi)學(xué)會“戰(zhàn)斗機”,高效地實現(xiàn)相似場景遷移,合理地完成不同形式數(shù)據(jù)的遷移,提高模型的泛化能力,解決數(shù)據(jù)分布不滿足獨立同分布時訓(xùn)練高精度分離器的問題。深度學(xué)習(xí)與遷移學(xué)習(xí)的結(jié)合是接下來的研究方向之一,深度遷移學(xué)習(xí)不僅能夠提高模型的通用性,而且能將其推廣到一般作戰(zhàn)領(lǐng)域用于對抗策略的生成??梢詫⑸疃冗w移學(xué)習(xí)分為基于實例的、基于映射的、基于網(wǎng)絡(luò)的、基于規(guī)則的4類[34],這對于軍事戰(zhàn)場態(tài)勢認知很有價值。
1.4軍事推演研究現(xiàn)狀
當前軍事推演與仿真的研究重心在數(shù)據(jù)的獲取及驗證、戰(zhàn)場態(tài)勢感知和智能認知、智能決策方法與博弈對抗技術(shù)。若能將這些成果辯證性地集成在仿真推演系統(tǒng)中將會為軍事推演研究帶來質(zhì)的飛躍。
1.4.1數(shù)據(jù)的獲取及驗證
兵棋作為軍事應(yīng)用中實現(xiàn)智能決策研究的推演平臺,面臨著信息不完全的難點,數(shù)據(jù)的獲取及數(shù)據(jù)質(zhì)量控制問題尤為重要。因此有學(xué)者提出通過挖掘、聚類和特征提取等操作來解決數(shù)據(jù)非完全的困難,然而文獻[35-37]皆以理論探討為主,未能在兵棋智能決策模型中驗證可行性。文獻[38]基于該思想設(shè)計了一款戰(zhàn)術(shù)級兵棋智能引擎,通過數(shù)據(jù)挖掘和融合獲得棋子的歷史位置概率、奪控熱度和觀察度等評價屬性,使用多屬性綜合評價軟優(yōu)選算法和兵棋規(guī)則解決行動多方案選優(yōu)的問題,并通過實驗證實該兵棋智能引擎具有靈活性高和可移植性好的特點。數(shù)據(jù)耕耘理論通過對結(jié)果的學(xué)習(xí)來循環(huán)探索不確定要素,從而探討非線性因素對復(fù)雜體系結(jié)果影響的過程。人在回路的兵棋推演所需要的時間成本和經(jīng)濟成本都很高,人不在回路的仿真無法體現(xiàn)體系的復(fù)雜性,故借鑒數(shù)據(jù)耕耘的思想將2種方式結(jié)合起來,生成評估大數(shù)據(jù),創(chuàng)造體系能力評估的數(shù)據(jù)基礎(chǔ)[39]。隨著各類數(shù)據(jù)資源體量的擴大,為了避免數(shù)據(jù)源中存在的部分不符合規(guī)律的異常數(shù)據(jù)對象對模型的影響,數(shù)據(jù)的可信度驗證愈加重要。軍事推演系統(tǒng)中的數(shù)據(jù)主要以2種方式存在:一是符合或近似正態(tài)分布的數(shù)據(jù);二是非正態(tài)分布的數(shù)據(jù)。胡艮勝等針對這2種數(shù)據(jù)形式分別提出基于準則和高次查分的異常數(shù)據(jù)挖掘方法,符合在剔除異常數(shù)據(jù)前進行樣本分布驗證的要求,且不會在數(shù)據(jù)清洗時產(chǎn)生系
統(tǒng)額外運行負擔[40]。
1.4.2戰(zhàn)場態(tài)勢感知和智能認知
美軍于2017年提出的“算法戰(zhàn)”及相關(guān)機構(gòu)的建立,標志著認知智能正式應(yīng)用在軍事領(lǐng)域。戰(zhàn)場態(tài)勢描述在軍事推演流程中扮演決策的輸入角色,是對抗生成策略的前提。態(tài)勢感知則是伴隨OODA環(huán)的研究生出的概念,是對作戰(zhàn)態(tài)勢要素的察覺、理解和預(yù)測的歸納[41],對應(yīng)環(huán)路中的觀察和判斷階段。在軍事推演中指揮員根據(jù)戰(zhàn)場態(tài)勢進行部署和決策,通常采用態(tài)勢圖、統(tǒng)計數(shù)據(jù)和戰(zhàn)場情況報告對戰(zhàn)場態(tài)勢歸一化處理,然而由于信息來源不同其統(tǒng)一方式是一個難點??紤]到指揮員角色在軍事推演中至關(guān)重要的地位,胡曉峰等[8]就態(tài)勢理解與自主決策問題分析了戰(zhàn)場態(tài)勢智能認知的基本思路、難點、解決途徑和研究意義。朱豐等[42]從指揮員角度出發(fā)圍繞作戰(zhàn)任務(wù)提出嵌套在OODA環(huán)中的態(tài)勢智能認知技術(shù),其核心在于理解“整體關(guān)系”,據(jù)此進行智能化行動策略選擇。同時剖析了5個需要解決的關(guān)鍵問題,列出了前沿智能技術(shù),態(tài)勢認知關(guān)鍵問題及相關(guān)技術(shù)如圖5所示。
1.4.3智能決策方法與博弈對抗技術(shù)
2020年,美國戰(zhàn)略與預(yù)算評估中心發(fā)布的研究報告明確了人工智能技術(shù)作為協(xié)助指揮員管理作戰(zhàn)行動,提升決策優(yōu)勢的輔助工具。蘭德公司展開人工智能結(jié)合兵棋推演任務(wù)規(guī)劃研究,推動兵棋推演與人工智能走向深度融合。在軍事推演仿真中應(yīng)用智能決策技術(shù)的關(guān)鍵問題之一在于智能學(xué)習(xí)方法的選擇[43]。深度強化學(xué)習(xí)有助于軍事推演實現(xiàn)軍事決策的智能化。崔文華等[44]利用深度強化學(xué)習(xí)方法支持兵棋內(nèi)置AI算法進行自主博弈對抗泛化推演系統(tǒng)功能,對接聯(lián)合作戰(zhàn)系統(tǒng)輔助指揮員快速評估作戰(zhàn)方案,給出決策建議。傳統(tǒng)的軍事推演系統(tǒng)通常過多地關(guān)注局部信息,未能從整體態(tài)勢出發(fā)進行分析,采取將棋子運動趨勢編碼到動態(tài)影響力地圖中的方式,有助于AI主體的決策[45]。面對戰(zhàn)術(shù)級兵棋機動動作與地圖位置的選擇密切相關(guān)問題時,多屬性綜合評價軟優(yōu)選算法有效地解決了決策涉及多屬性的問題。智能體是一個具有良好自治能力的實體,能夠運行于動態(tài)環(huán)境,通過感知器對外界環(huán)境做出解釋并產(chǎn)生推理和決定,為其他實體的委托提供服務(wù)。鑒于其優(yōu)質(zhì)特性在軍事推演的智能決策方面得到眾多研究者的青睞,成曉鵬等[46]針對電子對抗作戰(zhàn)中暴露出的對抗性和靈活性不足的缺點,提出基于智能體的智能決策行為仿真方法。彭希璐等[47]采用單智能體聯(lián)合殘差神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹對匯合作戰(zhàn)進行決策。多智能體則采用強化學(xué)習(xí)的方式分析多個智能體的行動,聯(lián)合產(chǎn)生式規(guī)則規(guī)劃作戰(zhàn)決策。劉轉(zhuǎn)[48]研究了基于多智能體系統(tǒng)的兵棋推演模型。李琛等[49]構(gòu)建了Actor-Critic框架下的多智能體決策模型,多智能體之間以合作關(guān)系共存,根據(jù)自身信息實現(xiàn)分布式執(zhí)行,依據(jù)全部信息更新完成集中式訓(xùn)練。鑒于單純的深度強化學(xué)習(xí)在大地圖和稀疏獎勵的兵棋推演中存在收斂速度慢、智能體勝率低的缺點,張振等[50]使用監(jiān)督學(xué)習(xí)進行智能體的訓(xùn)練,使用深度強化學(xué)習(xí)改進額外獎勵設(shè)置,提出基于近端策略優(yōu)化的對抗算法。作戰(zhàn)推演仿真引入過程中的動態(tài)決策也是軍事推演研究方向之一。
兵棋推演屬于非完全信息博弈,對于規(guī)模龐大、體系復(fù)雜的博弈對抗問題,單智能體方法呈現(xiàn)斷崖式缺陷,故采取多智能體深度強化學(xué)習(xí)算法提高決策能力,并提出基于深度逆向強化學(xué)習(xí)、多智能體強化學(xué)習(xí)、分層強化學(xué)習(xí)和元深度強化學(xué)習(xí)等方法[51]。雖然當前多智能體深度強化學(xué)習(xí)面臨環(huán)境的非平穩(wěn)性、維度災(zāi)難、信度分配三大難題,但深度強化學(xué)習(xí)算法在作戰(zhàn)行動指定和優(yōu)化以及輔助決策行為環(huán)節(jié)仍起到極大作用。與傳統(tǒng)的計算機兵棋推演系統(tǒng)相比,軍事智能博弈對抗系統(tǒng)最大的特點是能夠?qū)崿F(xiàn)與AI智能體無縫對接,這與AI智能體的泛化能力及算法和模型訓(xùn)練緊密相關(guān)。現(xiàn)被應(yīng)用的AI智能體主要包括:知識驅(qū)動型AI、深度學(xué)習(xí)驅(qū)動型AI以及強化學(xué)習(xí)自適應(yīng)型AI。新技術(shù)有效地促進智能博弈對抗技術(shù)向軍事應(yīng)用快速轉(zhuǎn)化[1]。
除此之外,現(xiàn)階段已經(jīng)在人與軍事推演仿真系統(tǒng)的交互[52-53]、智能博弈對抗系統(tǒng)框架設(shè)計[54]、航空兵力規(guī)模需求[55]、軍事推演與信息安全[56]和推演進程關(guān)鍵點[57]等方面形成研究成果。
1.5推演方案評估
仿真推演系統(tǒng)經(jīng)過推演—復(fù)盤—評估—總結(jié)的全過程驗證推演方案的可行性。推演方案是在預(yù)判敵方作戰(zhàn)策略的基礎(chǔ)上,形成以首長為中心的戰(zhàn)法制定,戰(zhàn)法要綜合考慮多種情況,想定部隊的編成,配置武器裝備,明確部隊在各階段任務(wù)以及應(yīng)對突發(fā)情況的措施等。
推演方案評估是形成最佳決策的必要環(huán)節(jié),評估內(nèi)容主要包括基本戰(zhàn)法、主要目標和關(guān)鍵行動等。傳統(tǒng)的軍事運籌分析法包括模糊綜合評判法和BP神經(jīng)網(wǎng)絡(luò)法等,關(guān)注解析模型的“定量”,存在評估上的局限性,而探索性分析法[58]采用仿真實驗形成推演作戰(zhàn)的數(shù)據(jù),對推演方案進行分層抽象并建立層次化指標,最后對多層指標聚合生成評估結(jié)果。文獻[59]在此基礎(chǔ)上提出了導(dǎo)彈部隊作戰(zhàn)方案評估方法。劉海洋等[60]提出評估態(tài)勢圖和任務(wù)探針的概念分別對綜合評估指標的度量結(jié)果進行描述與獲取。評估態(tài)勢圖對聯(lián)合作戰(zhàn)實現(xiàn)時間和空間多角度認知的實時判斷,任務(wù)探針則在不改變環(huán)境和進程的復(fù)盤推演中,在一定時空范圍內(nèi)開展特定行動。
相對于單兵種作戰(zhàn)的限制性,圖6是聯(lián)合作戰(zhàn)推演方案呈現(xiàn)金字塔結(jié)構(gòu),文獻[61-65]證實了這種結(jié)構(gòu)的存在。傳統(tǒng)的聯(lián)合作戰(zhàn)采用人工評分的方法,由于帶有主觀性且評分人員缺乏推演評估手段,文獻[66]對多種作戰(zhàn)方案評估方法進行歸納總結(jié)。層次分析法在聯(lián)合作戰(zhàn)方案級評估問題中應(yīng)用廣泛[67-69]?;谏鲜鼋?jīng)驗,李云龍等[70]提出了一種基于蒙特卡洛,算法的推演評估框架,該框架采用計算機兵棋推演生成方案推演數(shù)據(jù)樣本,應(yīng)用數(shù)理統(tǒng)計對推演方案進行分析和評估。
作戰(zhàn)決策是軍事智能仿真推演中的關(guān)鍵環(huán)節(jié),決定作戰(zhàn)態(tài)勢,針對推演系統(tǒng)中仿真實體決策推理的復(fù)雜性和時效性[71],在深度學(xué)習(xí)的堆棧自編碼器模型基礎(chǔ)上加入噪聲訓(xùn)練,并引入稀疏限制,形成堆棧稀疏降噪自編碼神經(jīng)網(wǎng)絡(luò)模型擬合復(fù)雜作戰(zhàn)規(guī)律,模擬人類決策思維和經(jīng)驗,實現(xiàn)作戰(zhàn)決策的準確評估。
軍事推演不僅可以指導(dǎo)實際作戰(zhàn),還能在軍事訓(xùn)練中形成從推演方案設(shè)計到仿真再到評估的閉環(huán),協(xié)同各軍委總部及軍兵種用戶完成作戰(zhàn)全過程。兵棋作為軍事智能化研究的推演平臺,是今后軍事推演研究的重點,但兵棋推演還面臨有效樣本獲取難、規(guī)則制定繁瑣、戰(zhàn)場態(tài)勢靈活多變、智能化形式有限等研究難點。
2.1軍事推演系統(tǒng)的細節(jié)設(shè)計
創(chuàng)造的復(fù)雜系統(tǒng)既能反映作戰(zhàn)行動,又能展現(xiàn)客觀規(guī)律,嵌入多種保障機制,融合人文環(huán)境,納入國家政策、社會輿論反饋、動態(tài)更新國際現(xiàn)狀等。探索棋子的內(nèi)部聯(lián)系獲取有效樣本,尋找棋子內(nèi)部聚合與外部耦合關(guān)系建立多重關(guān)系網(wǎng),面向全局考察棋子間的關(guān)聯(lián),實現(xiàn)棋子聯(lián)動,對棋子進行數(shù)據(jù)挖掘。由于實際戰(zhàn)場的態(tài)勢多種多樣,態(tài)勢信息的獲取取決于各方的情報偵察能力,因此,建立符合情報偵察能力的態(tài)勢數(shù)據(jù)對于戰(zhàn)場信息感知十分重要。美軍的第三代兵棋系統(tǒng)研究旨在實現(xiàn)多維環(huán)境下的復(fù)雜聯(lián)合作戰(zhàn)行動,為軍事推演技術(shù)的發(fā)展指明方向,實時更新數(shù)據(jù)、細化態(tài)勢判斷、驅(qū)動數(shù)據(jù)與規(guī)則同步執(zhí)行、動態(tài)調(diào)整勝負裁決規(guī)則、完善多屬性綜合評價軟優(yōu)選算法、打造高復(fù)現(xiàn)度的博弈對抗環(huán)境。
2.2仿真推演系統(tǒng)的創(chuàng)新及應(yīng)用
現(xiàn)有的仿真推演系統(tǒng)體系和模型都基于美國的仿真系統(tǒng),為開發(fā)符合我軍作戰(zhàn)特點的仿真推演系統(tǒng),需要在信息化戰(zhàn)場下加快探索,在世界軍事推演仿真系統(tǒng)上留下中國足跡,并不斷進行新技術(shù)標準的深入研究。與新型仿真推演系統(tǒng)開發(fā)同步進行的應(yīng)該是與目標用戶不斷進行需求溝通,對開發(fā)人員及相關(guān)用戶進行應(yīng)用技能培訓(xùn)。
2.3軍事推演系統(tǒng)的虛擬化、組裝化、智能化發(fā)展
人機聯(lián)合的智能策略為軍事推演的發(fā)展帶來了新機遇,加強智能推演方法的研究是引導(dǎo)軍事推演系統(tǒng)向前邁進一大步的關(guān)鍵環(huán)節(jié)。不斷更新對現(xiàn)有作戰(zhàn)理論的認知并創(chuàng)建新理論,采取虛擬化與組裝化技術(shù)對軍事推演中的各級元素多層次建模,聯(lián)合各部門構(gòu)建細粒度智能仿真試驗體系,結(jié)合實際軍事作戰(zhàn)的特點設(shè)計更為真實的對抗算法,引入紫綠軍,從智能藍軍模擬出發(fā)引入智能化引擎,將引擎技術(shù)與訓(xùn)練需求充分結(jié)合,創(chuàng)建虛實結(jié)合、虛虛對抗、實實交戰(zhàn)等多種對抗演練方式,把對智能體在多維時空環(huán)境中進化規(guī)律的研究貫穿整個過程。
軍事智能推演在現(xiàn)代復(fù)雜、大規(guī)模軍事推演領(lǐng)域扮演至關(guān)重要的角色。如今,美國的軍事推演技術(shù)處于世界領(lǐng)先地位,我軍可以借鑒美方軍事仿真推演系統(tǒng)的設(shè)計思想,探索具有我軍作戰(zhàn)特點的智能推演系統(tǒng),推進戰(zhàn)術(shù)模擬和戰(zhàn)略決策。傳統(tǒng)的軍事作戰(zhàn)方式無法滿足不確定性戰(zhàn)場的要求,人工智能技術(shù)在推動信息化環(huán)境下的軍事作戰(zhàn),消除人在戰(zhàn)爭指揮中所產(chǎn)生的認知偏差大有裨益,人機結(jié)合的模式為軍事推演領(lǐng)域的發(fā)展指明道路。
參考文獻
[1]李航,譚聯(lián)群,曾雋芳,等.面向人工智能的兵棋推演系統(tǒng)設(shè)計[C]//第三十九屆中國控制會議論文集.沈陽:[出版社不詳],2020:999-1003.
[2]李歡,馬伯寧,孔龍星.軍事任務(wù)推演的時空模型與驅(qū)動機制[J].國防科技大學(xué)學(xué)報,2013,35(3):138-143.
[3]鐘劍輝,傅調(diào)平,鄧超.基于人工智能的兵棋推演作戰(zhàn)分析研究與設(shè)計[J].艦船電子工程,2015,35(1):30-36.
[4]彭春光,趙鑫業(yè),劉寶宏,等.兵棋推演技術(shù)綜述[C]//2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集.合肥:中國科學(xué)技術(shù)大學(xué)出版社,2009:381-385.
[5]薛輝,劉鐵林,蘇小波.基于Bayes混合先驗分布的兵棋推演規(guī)則建模方法[J].火力與指揮控制,2019,44(6):106-110.
[6] FAN J S, REN H, TIAN C X. An Analysis of Wargame Rules Simulation Based on Stochastic Lanchester Models[C]// 6th International Conference on Network, Communication and Computing, Association for Computing Machinery.Dubai: NCWC,2017:135-139.
[7] SHANG T F, DONG H Y, HAN K, et al. Research on Evaluation Method of Wargame Strategy Based on Fuzzy Petri net[C]//2nd International Conference on Information Systems and Computer Aided Education.Jilin:ICISCAE,2019: 626-629.
[8]胡曉峰,賀筱媛,陶九陽.AlphaGo的突破與兵棋推演的挑戰(zhàn)[J].科技導(dǎo)報,2017,35(21):49-60.
[9] HODICKY J, PROCHáZKA D, BAXA F,et al. Computer Assisted Wargame for Military Capability-Based Planning[J]. Entropy(Basel), 2020, 22(8):861.
[10]何鋒,阿里木·馬那甫,高建新.兵棋推演技術(shù)在油庫火災(zāi)中的構(gòu)想和應(yīng)用[J].今日消防,2021,6(3):4-5.
[11]楊白雪,葛宏冰.兵棋推演在高校國防教育課程中的應(yīng)用價值及對策探討[J].邯鄲學(xué)院學(xué)報,2019,29(1):121-125.
[12]李歡.基于兵棋推演的城市危機應(yīng)急管理評價方法研究[D].濟南:山東大學(xué),2014.
[13] LI XL,LI H, CHENG M G, et al. Framework for Emergency Decision Exercise System of Urban Crisis Based on Wargaming[J]. Applied Mechanics and Materials, 2013,373-375: 1139-1143.
[14]賀德富,蘇喜生.基于兵棋推演的后勤物資儲備精確計算[J].兵器裝備工程學(xué)報, 2019, 40(7): 176-179.
[15]李永哲,蘇喜生,賀德富,等.基于AAR評估模式的后勤兵棋推演平臺設(shè)計與研究[J].重慶理工大學(xué)學(xué)報(自然科學(xué)), 2019,33(10):142-148.
[16]宋玉豪.兵棋推演在公共衛(wèi)生防疫領(lǐng)域的應(yīng)用[J].艦船電子工程,2020,40(10):13-17.
[17] ZHANG M Z, HU X F. Cyberspace Warfare and Its Influence on Simulation Modeling of War[J]. Military Operations Research and Systems Engineering, 2012, 26(4): 10-14.
[18]任雙堂,曹亞鉑,趙林.戰(zhàn)爭的再現(xiàn)———兵棋推演的發(fā)展脈絡(luò)[J].軍事文摘,2020(19):7-11.
[19] MITTAL V,DAVIDSON A.Combining Wargaming with Modeling and Simulation to Project Future Military Technology Requirements[J]. IEEE Transactions on Engineering Management, 2021, 68(4): 1195-1207.
[20] TEFEK A,ASAR J, STARy V. Flight Route Generator for Simulation-supported Wargaming[C]//19th International Conference on Mechatronics-Mechatronika (ME). Guangzhou: MCTE,2020: 1-5.
[21] DORN A W,WEBB S,PQUET S. From Wargaming to Peacegaming: Digital Simulations with Peacekeeper Roles Needed[J].International Peacekeeping, 2020, 27(2): 289-310.
[22]郭振江.兵棋系統(tǒng)在實戰(zhàn)化軍事訓(xùn)練中的應(yīng)用[J].軍事交通學(xué)院學(xué)報,2019,21(5):78-81.
[23]紀夢琪,董倩,秦茂森,等.基于OPM的兵棋推演行動方案建模方法研究[J].指揮控制與仿真,2018,40(5):79-85.
[24] PERLA P.The Art of Wargaming[M].Annapolis:Naval Institute Press, 1990.
[25]彭露露,刑棟,茍星.兵棋推演在美軍作戰(zhàn)中的運用[J].軍事文摘,2020(19):17-21.
[26] KJAER S B.Valuation of the Hill Climbing and the Incremental Conductance Maximum Power Point Trackers for Photovoltaic Power Systems[J].IEEE Transactions on Energy Conversion, 2012, 7(4): 922-929.
[27]黃其旺,朱旭.美軍主要仿真系統(tǒng)及其對現(xiàn)代戰(zhàn)爭的影響[J].計算機仿真,2021,38(3):1-4.
[28] HEN KER L. Exploring Military Victory in Battle:A Qualitative Study on Contemporary Tactics[J].Defence Studies,2020,20(2):163-181.
[29] CURRY J.Professional Wargaming: A Flawed but Useful Tool[J]. Simulation & Gaming, 2020,51(5):612-631.
[30] JI S, XU W, YANG M, et al. 3D Convolution Neural Networks for Human Action Recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(1): 221-231.
[31] KOUSHIK J. Understanding Convolutional Neural Networks[J/OL].[2016-05-30].https://arxiv.org/abs/1605.09081v1.
[32] LAKE B M, SALAKHUTDINOW R, TENENBAUM J B. Human-level Concept Learning through Probabilistic Program Induction[J]. Science, 2015, 350(6266): 1332-1338.
[33] PAN S, YANG Q. A Survey on Transfer Learning[J].IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10): 1345-1359.
[34]蘇麗娟.基于遷移學(xué)習(xí)的腦機融合系統(tǒng)的研究[D].浙江:浙江大學(xué),2017.
[35]鄭書奎,吳琳,賀筱媛.基于深度學(xué)習(xí)的兵棋演習(xí)數(shù)據(jù)特征提取方法研究[J].指揮與控制學(xué)報,2016,2(3):194-201.
[36]石崇林.基于數(shù)據(jù)挖掘的兵棋推演數(shù)據(jù)分析方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2012.
[37]劉長亮,鮑傳美,包化,等.可拓數(shù)據(jù)挖掘在高性能兵棋推演系統(tǒng)中的應(yīng)用[J].指揮信息系統(tǒng)與技術(shù),2018,9(1):62-67.
[38]劉滿,張宏軍,郝文寧,等.戰(zhàn)術(shù)級兵棋實體作戰(zhàn)行動智能決策方法[J].控制與決策,2020,35(12):2977-2985.
[39]司光亞,王飛.基于仿真大數(shù)據(jù)的體系能力評估方法研究[J].軍事運籌與系統(tǒng)工程,2020, 34(3):5-10.
[40]胡艮勝,張倩倩,馬朝忠.兵棋推演系統(tǒng)中的異常數(shù)據(jù)挖掘方法[J].信息工程大學(xué)學(xué)報,2020,21(3):373-377.
[41] ENDSLEY M R. Toward a Theory of Situation Awareness in Dynamic Systems[J]. Human Factors,1995, 37(1): 32-64.
[42]朱豐,胡曉峰,吳琳,等.從態(tài)勢認知走向態(tài)勢智能認知[J].系統(tǒng)仿真學(xué)報,2018,30(3):761-771.
[43]廖馨,孫崢皓.作戰(zhàn)推演仿真中的智能決策技術(shù)應(yīng)用探索[C]//第二十屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會.烏魯木齊:[出版社不詳],2019:368-374.
[44]崔文華,李東,唐宇波,等.基于深度強化學(xué)習(xí)的兵棋推演決策方法框架[J].國防科技,2020,41(2):113-121.
[45]王曉明.面向計算機兵棋推演的決策支持系統(tǒng)的研究[D].北京:北京郵電大學(xué),2019.
[46]成曉鵬,齊鋒.電子對抗作戰(zhàn)方案推演智能決策行為模擬[J].電子信息對抗技術(shù),2016, 31(1):55-60.
[47]彭希璐,王記坤,張昶,等.面向智能決策的兵棋推演技術(shù)[C]//第七屆中國指揮控制大會論.北京:中國指揮與控制學(xué)會,2019:135-139.
[48]劉轉(zhuǎn).基于多智能體系統(tǒng)的兵棋推演模型研究[D].武漢:華中科技大學(xué),2016.
[49]李琛,黃炎焱,張永亮,等.Actor-Critic框架下的多智能體決策方法及其在兵棋上的應(yīng)用[J].系統(tǒng)工程與電子技術(shù), 2021,43(3):755-762.
[50]張振,黃炎焱,張永亮,等.基于近端策略優(yōu)化的作戰(zhàn)實體博弈對抗算法[J].南京理工大學(xué)學(xué)報,2021,45(1):77-83.
[51]曹雷.基于深度強化學(xué)習(xí)的智能博弈對抗關(guān)鍵技術(shù)[J].指揮信息系統(tǒng)與技術(shù),2019,10(5):1-7.
[52]孫澤健,司光亞,劉洋.基于AIML的兵棋演習(xí)智能問答系統(tǒng)研究與實現(xiàn)[J].系統(tǒng)仿真學(xué)報,2017,29(10):2489-2495.
[53]孫澤健,司光亞,劉洋.面向兵棋演習(xí)的問答系統(tǒng)問句分類模型研究[J].計算機與數(shù)字工程,2019,47(2):308-313.
[54]李航,劉代金,劉禹.軍事智能博弈對抗系統(tǒng)設(shè)計框架研究[J].火力與指揮控制,2020,45(9):116-121.
[55]周璽,嚴宗睿,鄭震山.基于作戰(zhàn)推演的航空兵力規(guī)模需求分析方法[J].指揮控制與仿真,2021,43(1):35-39.
[56]賀劼,練曉謙,齊權(quán),等.大規(guī)模網(wǎng)絡(luò)對抗兵棋推演系統(tǒng)關(guān)鍵技術(shù)探討[J].通信技術(shù),2018,51(2):450-456.
[57]張可,郝文寧,余曉晗,等.基于遺傳模糊系統(tǒng)的兵棋推演關(guān)鍵點推理方法[J].系統(tǒng)工程與電子技術(shù),2020,42(10): 2303-2311.
[58] SHLAPAK D A. Dire Strait Military Aspects of the China-Taiwan Confrontation and Options for U.S. Policy[R]. MR-1217-SRF/AF, RAND, CA U.S., 2000.
[59]秦園麗,張訓(xùn)立,高桂清,等.基于兵棋推演系統(tǒng)的作戰(zhàn)方案評估方法研究[J].兵器裝備工程學(xué)報,2019,40(6):92-95.
[60]劉海洋,唐宇波,胡曉峰,等.基于兵棋推演實驗的綜合評估指標度量方法[J].軍事運籌與系統(tǒng)工程,2019,33(3):5-12.
[61]孫光明,楊光,馬政偉,等.聯(lián)合作戰(zhàn)方案信息交換模型[J].系統(tǒng)仿真技術(shù), 2018, 14(3): 204-210.
[62]吳航海.兩棲登陸作戰(zhàn)方案的規(guī)劃與評估分析[D].南京:南京理工大學(xué),2017.
[63]劉兆鵬,柳少軍,司光亞,等.面向推演分析的聯(lián)合作戰(zhàn)方案概念建模研究[J].系統(tǒng)仿真學(xué)報,2018,30(12):4563-4573.
[64]朱旋,秦永剛.聯(lián)合作戰(zhàn)方案計劃“三視圖”方法研究[J].軍事運籌與系統(tǒng)工程, 2017, 31(3): 9-14.
[65]王相生.聯(lián)合作戰(zhàn)籌劃與方案推演研究[J].艦船電子工程, 2014,34(6):14-18.
[66]劉翔宇,趙洪利,楊海濤.作戰(zhàn)方案評估方法綜述[J].兵器裝備工程學(xué)報,2018,39(8):79-84.
[67]畢東旭,林家駿.復(fù)雜信息系統(tǒng)風(fēng)險評估框架與流程[J].計算機工程, 2015, 41(4): 156-160,165.
[68]王豐,顧佼佼,林瑜,等.3級優(yōu)度評估的聯(lián)合作戰(zhàn)方案優(yōu)選方法研究[J].現(xiàn)代防御技術(shù),2019,47(2):116-121.
[69]張民磊,李星.顧及灰色層次分析法的多維信息安全指標體系[J].信息技術(shù), 2019(3):149-152.
[70]李云龍,張艷偉,王增臣.聯(lián)合作戰(zhàn)方案推演評估技術(shù)框架[J].指揮信息系統(tǒng)與技術(shù), 2020, 11(4):78-83.
[71]歐微,李衛(wèi)軍,廖鷹.基于深度學(xué)習(xí)的兵棋實體決策效果智能評估模型[J].軍事運籌與系統(tǒng)工程,2018,32(4):29-34.