胡曉峰 榮明
作戰(zhàn)決策輔助是指揮控制領(lǐng)域難點(diǎn)問題,也是世界主要軍事強(qiáng)國的關(guān)注點(diǎn).隨著新一代人工智能的興起,作戰(zhàn)決策輔助再次引起世人關(guān)注.美軍進(jìn)行了多項(xiàng)輔助決策研究計(jì)劃,比如從2004年到2008年美軍開展了一項(xiàng)叫實(shí)時(shí)作戰(zhàn)智能決策制定(Real-time Adversarial Intelligence and Decisionmaking,RAID)的計(jì)劃,能夠?yàn)閼?zhàn)術(shù)指揮員提供行動(dòng)方案路線.2009年開展的戰(zhàn)術(shù)推演生成器計(jì)劃(Tactical Inference GenE Rator,TIGER),該計(jì)劃試圖讓決策系統(tǒng)像軍事專家那樣分析戰(zhàn)場情況并將其分類.但是其中最有代表性的當(dāng)屬“深綠”計(jì)劃(Deep Green,DG)[1?2].
“深綠”是美國國防部高級研究計(jì)劃局(Defense Advanced Research Projects Agency,DARPA)從2007年起開始支持的一項(xiàng)指揮控制領(lǐng)域的研究項(xiàng)目.它是能夠嵌入到美國陸軍現(xiàn)有旅級C4ISR之上的戰(zhàn)時(shí)指揮決策支持系統(tǒng).通過預(yù)測戰(zhàn)場中未來可能發(fā)生的各種分支和可能情況,從而為指揮員作戰(zhàn)決策提供輔助支持.“深綠”計(jì)劃的名稱,源于IBM的“深藍(lán)”.在2007年的人機(jī)國際象棋大賽中,“深藍(lán)”一舉擊敗人類棋手卡斯帕羅夫,在全世界引起轟動(dòng),也引起了美國軍方的高度關(guān)注.“深藍(lán)”能根據(jù)對手走的每一步棋,計(jì)算出下一步對手所有可能的走法.“深綠”計(jì)劃的核心思想就是借鑒“深藍(lán)”,預(yù)判敵人的可能行動(dòng),從而提前做出決策.但作戰(zhàn)輔助決策與棋類的對弈完全不同,因而結(jié)果也就大相徑庭.本文將以“深綠”計(jì)劃為例,分析作戰(zhàn)輔助決策中遇到的難題,并探討未來可能的解決途徑.
“深綠”的目標(biāo)是將人工智能引入作戰(zhàn)輔助決策,預(yù)測戰(zhàn)場上的瞬息變化,幫助指揮員提前進(jìn)行思考,判斷是否需要調(diào)整計(jì)劃,并協(xié)助指揮員生成新的替代方案.通過將“OODA”中的“OO”部分即觀察、判斷進(jìn)行多次計(jì)算機(jī)模擬,演示出不同作戰(zhàn)方案可能產(chǎn)生的分支結(jié)果,對敵方行動(dòng)進(jìn)行預(yù)判,協(xié)助指揮員做出正確決策.將指揮員的注意力集中在決策選擇上,而非方案細(xì)節(jié)制定上.它由4部分組成,分別是“指揮官助理”、“閃電戰(zhàn)”、“水晶球”以及系統(tǒng)集成等[3?4].
DARPA于2007年7月發(fā)布“深綠”技術(shù)競標(biāo)書,計(jì)劃3年完成,但是實(shí)際上到2014年該項(xiàng)目仍未完全結(jié)束,共投入經(jīng)費(fèi)6537.5萬美元(根據(jù)DARPA2012年度預(yù)算公布).該項(xiàng)目主要有兩家一級承包商BAE公司和SAIC公司承建.大致分工如下,SAIC負(fù)責(zé)系統(tǒng)總體開發(fā),Adapx公司負(fù)責(zé)語音及手寫輸入,南加州大學(xué)負(fù)責(zé)水晶球,Charles River公司負(fù)責(zé)未來視圖可視化,BAE公司負(fù)責(zé)測試驗(yàn)證.驗(yàn)收方部門,主要有海軍水面武器研究中心印第安霍德分部、通信電子研發(fā)中心、裝備研發(fā)和工程中心、美國陸軍空間和導(dǎo)彈防御司令部、美國陸軍研究、開發(fā)與工程司令部仿真訓(xùn)練中心等.
一是采用基于草圖交互,最大限度地符合指揮員的決策分析與操作習(xí)慣.這個(gè)模塊“深綠”稱之為“指揮官助手”,由計(jì)劃草圖和決策草圖組成.從戰(zhàn)場態(tài)勢感知、目標(biāo)價(jià)值分析、作戰(zhàn)方案制定、指揮員決策,一直到作戰(zhàn)行動(dòng)執(zhí)行、作戰(zhàn)效果評估,都遵循這樣一條“基于草圖決策”之路.
二是通過模型求解與態(tài)勢預(yù)測,最大限度實(shí)現(xiàn)自動(dòng)決策優(yōu)化.“草圖到計(jì)劃”將草圖和語音輸入到計(jì)劃中,“閃電戰(zhàn)”對未來的多種可能進(jìn)行快速多軌仿真,“水晶球”利用戰(zhàn)場實(shí)時(shí)信息不斷更新所做的估計(jì),“草圖到?jīng)Q策”向指揮員提供未來可能的選擇和更新;盡量多地提供自動(dòng)化工具支持.例如,自動(dòng)地進(jìn)行推演和命令下達(dá),提升指揮決策的速度和質(zhì)量,使得指揮命令的下達(dá)更加有效;更小、更機(jī)動(dòng)、更靈巧的指揮結(jié)構(gòu)等.
自動(dòng)決策優(yōu)化的核心是“閃電戰(zhàn)”和“水晶球”.“閃電戰(zhàn)”是分析引擎,通過利用定性與定量分析工具,可以迅速地對指揮官提出的各種決策計(jì)劃進(jìn)行模擬,從而生成一系列未來可能的結(jié)果.它可以識別各個(gè)決策分支點(diǎn),從而預(yù)測可能結(jié)果的范圍和可能性,然后沿著各個(gè)決策路徑(即軌跡)進(jìn)行模擬.“水晶球”是決策總控,負(fù)責(zé)收集各種計(jì)劃方案、更新戰(zhàn)場當(dāng)前態(tài)勢、控制快速模擬、向指揮員提供可能的選擇,并提醒指揮員決策點(diǎn)的出現(xiàn).它能辨識未來態(tài)勢發(fā)展的潛在關(guān)鍵臨界點(diǎn),并能對未來作戰(zhàn)方案選項(xiàng)進(jìn)行排序,從而實(shí)現(xiàn)對未來可能態(tài)勢的生成、評估和監(jiān)視.還可以根據(jù)戰(zhàn)場實(shí)際情況,不斷進(jìn)行調(diào)整修正;通過不斷修正推演,來預(yù)測未來的變化.
三是與指揮系統(tǒng)集成,即將決策輔助系統(tǒng)集成進(jìn)未來指揮所中.“深綠”項(xiàng)目的負(fù)責(zé)人蘇杜爾說:“我猜想,深綠就是未來指揮所屏幕上的一個(gè)圖標(biāo)或工具.”未來指揮所(Command Post of Future,CPoF),是DARPA推出的先進(jìn)指揮控制系統(tǒng).始于1997年,至今仍在進(jìn)行,作為子系統(tǒng)已融入美國陸軍戰(zhàn)斗指揮系統(tǒng)ABCS 6.4+,該系統(tǒng)在伊拉克戰(zhàn)爭中反響良好.它的主要技術(shù)包括:人-機(jī)交互技術(shù)、協(xié)作和工作流程管理技術(shù)、決策支持和情報(bào)應(yīng)用技術(shù)、戰(zhàn)場信息空間管理技術(shù)、網(wǎng)絡(luò)管理技術(shù).目標(biāo)是縮短指揮員的決策周期,確保能在敵人之前快速做出反應(yīng).
“深綠”通過對決策各要素的匯聚 (Convergence)和綜合集成,從而提高指揮員的快速?zèng)Q策能力.第一,“信息匯聚”,通過獲取我軍、友軍、敵軍、中立方和非戰(zhàn)斗地點(diǎn)的準(zhǔn)確信息,向指揮員提供有價(jià)值的態(tài)勢信息;第二,“職能匯聚”,將原先由軍事和技術(shù)人員擔(dān)負(fù)的大量職能,轉(zhuǎn)化為自動(dòng)化的、以指揮員為中心的作戰(zhàn)決策過程;第三,“過程匯聚”,通過“預(yù)見性計(jì)劃”和“適應(yīng)性執(zhí)行”兩大概念,對OODA的時(shí)間維和空間維進(jìn)行大幅度壓縮.綜合集成技術(shù)采用“軍事想定描述語言”(Military Scenario Def i nition Language,MSDL)、“聯(lián)合指揮控制與咨詢交換數(shù)據(jù)模型”(Joint Command Control Communications Information Exchange Data Model,JC3IEDM)、“美軍陸軍通用任務(wù)清單”(Army Universal Task List,AUTL),與外部系統(tǒng)互操作則采用“應(yīng)用程序接口”(Application Program Interface,API)等.
“深綠”所追求的理想效果是,只要能提供我方、友方和敵方的兵力數(shù)據(jù)和可預(yù)期的計(jì)劃,“深綠”的推演就會(huì)很精確,可以輔助指揮員做出正確決定;將這個(gè)系統(tǒng)嵌入到指揮系統(tǒng)之中,可以大大提高指揮效率;不僅要在連級試驗(yàn),而且還要推廣到旅級,甚至更高層.結(jié)果是:“理想很豐滿,但現(xiàn)實(shí)很骨感”.到2014年,在“深綠”驗(yàn)收時(shí),最后只保留了最成熟的“草圖到計(jì)劃”(Sketch to Plan,STP),其他都不見了.事實(shí)上,我們也曾試圖做類似這樣的事情,但往往事與愿違.“深綠”面臨的困難和挑戰(zhàn)主要有以下幾個(gè)方面:
戰(zhàn)場“態(tài)勢”計(jì)算機(jī)能否理解?戰(zhàn)場態(tài)勢與棋類態(tài)勢的理解有著本質(zhì)區(qū)別,棋類規(guī)則、棋盤、行動(dòng)全開放,而戰(zhàn)場態(tài)勢則是單方認(rèn)知下的理解.部署、狀態(tài)、趨勢、優(yōu)劣如何判斷?層次越高,對態(tài)勢的認(rèn)知越具主觀性,可量化的程度越低.另外,在不完全信息條件下如何判斷態(tài)勢?如果態(tài)勢信息有真有假有缺,怎么辦?往往是低層的分隊(duì)?wèi)?zhàn)術(shù)態(tài)勢理解相對容易,而越是高層的戰(zhàn)場態(tài)勢計(jì)算機(jī)越難理解.計(jì)算機(jī)對態(tài)勢的理解能力還遠(yuǎn)遠(yuǎn)達(dá)不到人的水平.
決策“想法”的輸入是分析評估的前提,對態(tài)勢的判斷表達(dá)和輸入,需要一組標(biāo)準(zhǔn)化的圖形符號.面臨一系列難題,比如,行動(dòng)決心的描述,是細(xì)好還是粗好?采用哪種圖表方式表達(dá)?不同的決策分支反映的決策周期多長,決策點(diǎn)多少?簡單分支、短周期行動(dòng)決策相對可行,但隨著時(shí)間的推移是否會(huì)產(chǎn)生組合指數(shù)爆炸?最困難之處還是對敵方的決策如何假定.
“閃電戰(zhàn)”的功能是對未來多種可能進(jìn)行仿真,推演出可能的結(jié)果,供指揮員決策時(shí)參考.這個(gè)“未來”時(shí)間有多遠(yuǎn)?過于長程的推演,會(huì)由于復(fù)雜性傳遞導(dǎo)致偏離過大;推演多長時(shí)間(或多少個(gè)關(guān)鍵“節(jié)點(diǎn)”)合適.越復(fù)雜的行動(dòng)推演,涉及要素和變化越多,如何處理.對敵方?jīng)Q策的判定也很有挑戰(zhàn)性,任何推演都是對抗的,敵方都是不合作的,如何取舍.敵方的決策應(yīng)由誰做出,指揮員假定還是系統(tǒng)得出.是否需要跟進(jìn)一個(gè)推演系統(tǒng)與決策輔助系統(tǒng)掛鉤?修正模型需要在不完全信息條件下不平衡地推演.涉及的核心問題是誰來對戰(zhàn)場實(shí)體建模,并且如何修正.
人們總是認(rèn)為,系統(tǒng)之所以做不出正確決策,是因?yàn)樗峁┑臄?shù)據(jù)不夠或不準(zhǔn)確.這是片面的和不正確的,也是典型的“決定論”觀點(diǎn):初始條件足夠,就可以預(yù)測一切.但戰(zhàn)爭是典型復(fù)雜系統(tǒng),敵人也不是合作者;永遠(yuǎn)也不會(huì)有“足夠的”條件,不完全信息條件下決策是作戰(zhàn)指揮的本質(zhì)特點(diǎn).決策需要根據(jù)情況不斷變化,數(shù)據(jù)要求會(huì)不斷發(fā)生改變.復(fù)雜性會(huì)導(dǎo)致“決策”本身不唯一,也就無法確定哪個(gè)“正確”.層次越低,決策越接近簡單系統(tǒng),數(shù)據(jù)才越具有決定性.能否采集到足夠的數(shù)據(jù),往往就成為關(guān)鍵,這也是“深綠”為什么要集成進(jìn)指揮系統(tǒng)的原因.“數(shù)據(jù)是否具有決定性”在不同層次,會(huì)有不同回答.這也許就是“深綠”最大的困惑.
計(jì)算機(jī)做出的決策是不是一定優(yōu)于“人”?米勒定律[3]認(rèn)為大多數(shù)人同時(shí)只能考慮7至9個(gè)因素.如果計(jì)算機(jī)能夠同時(shí)考慮10個(gè)以上,在分析能力上就肯定超過人.RAID系統(tǒng)中步兵連與叛亂分子對抗實(shí)驗(yàn)表明,步兵連分為30~35個(gè)小組,由斯特瑞克裝甲車和武裝直升機(jī)加強(qiáng)火力.叛亂分子由30個(gè)規(guī)模不一的小組組成.用OneSAF實(shí)驗(yàn)36次.結(jié)果RAID表現(xiàn)像人類的有16次,占44%;決策超過人的在18組中有16組,占78%.但如果放到營級甚至旅級,這個(gè)結(jié)論就很難說了.因?yàn)閷哟卧礁?藝術(shù)成分越高,技術(shù)成分越弱;反之亦然.在人機(jī)協(xié)同中,人做什么,計(jì)算機(jī)做什么,人與計(jì)算機(jī)應(yīng)該如何分工顯得尤為重要.
“深綠”主要是針對陸軍部隊(duì)的,但是陸軍指揮決策比海、空軍更困難,因?yàn)殛戃娮鲬?zhàn)行動(dòng)中每個(gè)人更自由,陸軍的作戰(zhàn)規(guī)劃也缺乏更多規(guī)范.只有將部隊(duì)行動(dòng)規(guī)范化,才能適合使用“深綠”.“深綠”方法更合適的可能應(yīng)用領(lǐng)域包括:陸軍車載的戰(zhàn)術(shù)級作戰(zhàn)指揮輔助系統(tǒng);海、空軍部隊(duì)的戰(zhàn)術(shù)級輔助決策作戰(zhàn)規(guī)劃系統(tǒng);二炮部隊(duì)的戰(zhàn)役戰(zhàn)術(shù)級作戰(zhàn)規(guī)劃及指揮系統(tǒng).網(wǎng)絡(luò)作戰(zhàn)可能更適合于“事先規(guī)劃”的方式;戰(zhàn)前依托系統(tǒng)輔助制定決策,戰(zhàn)時(shí)依托數(shù)據(jù)自動(dòng)決策.
“深綠”計(jì)劃的悖論在于,它只能用在分隊(duì)?wèi)?zhàn)術(shù)層,而最應(yīng)該得到輔助的是高層指揮官,而非連長.這是因?yàn)椤吧罹G”的智能問題沒解決,層次越高,作戰(zhàn)決策越復(fù)雜,越難以描述和處理,如態(tài)勢理解、決策描述、模型仿真、數(shù)據(jù)獲取等;在更高層次會(huì)帶來很多的困難和問題,不僅僅是部隊(duì)多少、數(shù)據(jù)多少、運(yùn)算多少的問題,而是復(fù)雜性帶來的問題質(zhì)變,如不確定性、指數(shù)爆炸等;對“對手”意圖的把握等對抗博弈問題是非純理性的.
作戰(zhàn)決策輔助未來發(fā)展進(jìn)步的關(guān)鍵在于,必須在智能輔助方面有所突破,才能真正解決問題,這也是指揮信息系統(tǒng)未來上升一個(gè)新臺階的重要條件.
“深藍(lán)”、“更深的藍(lán)”連續(xù)戰(zhàn)勝卡斯帕羅夫,是通過輸入前人積累的無數(shù)棋譜,通過自學(xué)習(xí)發(fā)展自身的能力.但作戰(zhàn)方案分析卻沒有標(biāo)準(zhǔn)化的“棋譜”,歷史的參考也不大.新一代人工智能系統(tǒng)“沃森”戰(zhàn)勝人類,使得人工智能面臨重大拐點(diǎn).“沃森”的秘籍就是“機(jī)器學(xué)習(xí)”,即從過去的經(jīng)驗(yàn)中總結(jié)規(guī)律、提高水平能力.研究人員對“沃森”進(jìn)行了題海戰(zhàn)術(shù)訓(xùn)練,以成批的方式對“沃森”進(jìn)行大規(guī)模測試,使其參透各類問題模式并不斷更新算法.正是大數(shù)據(jù)的支撐和機(jī)器學(xué)習(xí),使得“沃森”采用了更接近人類的思考方式.但人工智能要用于理解作戰(zhàn)文書還缺乏實(shí)際作戰(zhàn)文書大數(shù)據(jù)的支撐.
深度學(xué)習(xí)建立能模擬人腦進(jìn)行分析學(xué)習(xí)的機(jī)制,理解概念.通過多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)來解釋獲得的數(shù)據(jù).人腦的認(rèn)知具有深度結(jié)構(gòu),需要逐層訓(xùn)練,逐步抽象得到認(rèn)知.Google X從Youtube 1000萬幅圖片中得到“貓”的概念.通過多層神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法來理解和解釋作戰(zhàn)態(tài)勢,應(yīng)該是一個(gè)可以嘗試的途徑.事實(shí)上,理解作戰(zhàn)態(tài)勢更為困難.需要通過對歷次演習(xí)的數(shù)據(jù)進(jìn)行逐層訓(xùn)練,逐步抽象得到認(rèn)知.首先確認(rèn)若干標(biāo)準(zhǔn)概念模板,然后逐層訓(xùn)練,最終識別戰(zhàn)場態(tài)勢.對態(tài)勢可以借用已有的數(shù)據(jù)進(jìn)行綜合分析,對各個(gè)實(shí)體的數(shù)據(jù)進(jìn)行采集和計(jì)算,得出統(tǒng)計(jì)結(jié)果;采用實(shí)時(shí)數(shù)據(jù)庫進(jìn)行時(shí)間趨勢判別,形成勢圖.但是,越高層的態(tài)勢往往主觀性越強(qiáng)、越難理解,因而在不同層次會(huì)有不同的方法.
美軍空軍上將A德普圖拉提出作戰(zhàn)云的新概念,即作戰(zhàn)云—基于大數(shù)據(jù)作戰(zhàn),采用信息時(shí)代技術(shù)的情報(bào)、監(jiān)視與偵察、打擊、機(jī)動(dòng)和維持的復(fù)合體,以使高度互聯(lián)的分布式作戰(zhàn)行動(dòng)可行.類似云計(jì)算的概念,通過所有可能得到的數(shù)據(jù),整合各個(gè)作戰(zhàn)力量,從而達(dá)到增強(qiáng)作戰(zhàn)效能且獲得規(guī)模效益.“從數(shù)據(jù)到?jīng)Q策”使得決策走向自動(dòng)化、自主化.“深綠”只能為指揮員“輔助決策”起作戰(zhàn)伴侶作用.利用大數(shù)據(jù)及網(wǎng)絡(luò)可以實(shí)現(xiàn)“從數(shù)據(jù)到?jīng)Q策”,使得作戰(zhàn)加快!特別適合未來多類無人化作戰(zhàn)的趨勢.例如美軍網(wǎng)絡(luò)作戰(zhàn)的“X Plan”、網(wǎng)絡(luò)戰(zhàn)的“秒殺”,以及戰(zhàn)術(shù)行動(dòng)決策,如導(dǎo)彈突襲攔截決策、無人機(jī)自動(dòng)決策等.
“深綠”及其他計(jì)劃的嘗試具有參考價(jià)值.嘗試總比不試好,有的取得進(jìn)展,有的尚未突破.很多問題在全世界都是共同的難題.不能急功近利,關(guān)鍵是要搞好基礎(chǔ)性研究.要真正實(shí)現(xiàn)有效的作戰(zhàn)輔助決策取決于兩點(diǎn),一是未來的進(jìn)步取決于人工智能技術(shù)的突破,尤其是深度學(xué)習(xí)技術(shù)值得探究,其核心在態(tài)勢理解、行為模擬、決策選擇和結(jié)果反饋等;二是對不同類型和層次的決策輔助找到不同方法,如火力戰(zhàn)、平臺戰(zhàn)、網(wǎng)絡(luò)戰(zhàn)等不同類型,戰(zhàn)術(shù)、戰(zhàn)役、戰(zhàn)略等不同層次.