徐曉晗,古華棟
人工智能輔助決策系統(tǒng)是將人工智能引入作戰(zhàn)輔助決策,分析判斷戰(zhàn)場態(tài)勢變化,對比敵我可能行動方案,經(jīng)過模擬推演和自動評估高效更新作戰(zhàn)方案。對傳統(tǒng)的OODA環(huán)路進(jìn)行改進(jìn),將“OO”部分即觀察、判斷進(jìn)行快速推演,展現(xiàn)出多分支作戰(zhàn)方案可能產(chǎn)生的不同結(jié)果,預(yù)測敵方意圖和行為,形成作戰(zhàn)方案動態(tài)規(guī)劃。
其重要意義在于建立多維作戰(zhàn)效能估計標(biāo)準(zhǔn),實現(xiàn)作戰(zhàn)方案自動枚舉、優(yōu)化搜索和面向博弈論的序貫規(guī)劃滾動更新,使作戰(zhàn)任務(wù)規(guī)劃活動能主動適應(yīng)作戰(zhàn)任務(wù)和戰(zhàn)場環(huán)境,有效應(yīng)對戰(zhàn)爭迷霧和多種臨機(jī)不確定性。使指揮員注意力集中于宏觀判斷決策,而非細(xì)節(jié)制定上。同時基于知識數(shù)據(jù)混合驅(qū)動的決策能力,即利用大樣本推演數(shù)據(jù)歸納知識,經(jīng)過學(xué)習(xí)構(gòu)建態(tài)勢分析和策略決策的直覺映射,從而使決策走向自主進(jìn)化的高度智能化,大幅提高決策效率和質(zhì)量。
20世紀(jì)70年代,決策支持系統(tǒng)(Decision Support System)被提出,希望借助計算機(jī),為決策人員提供幫助。典型代表為美軍戰(zhàn)術(shù)級任務(wù)規(guī)劃系統(tǒng)JMPS和戰(zhàn)區(qū)戰(zhàn)役級任務(wù)規(guī)劃系統(tǒng)聯(lián)合作戰(zhàn)規(guī)劃與執(zhí)行系統(tǒng)JOPES,用以解決諸如態(tài)勢研判、方案評估、計劃生成、綜合保障等一系列具體問題。
DARPA于2007年啟動了“深綠(Deep Green)”計劃[1],目的是大大縮短臨機(jī)決策時間,計劃嵌入旅級指揮控制系統(tǒng),使得作戰(zhàn)計劃制定縮短到25%,大大提高指揮員臨機(jī)決策的速度。其核心技術(shù)是通過人機(jī)交互獲取指揮員意圖,形成作戰(zhàn)方案備選集合,通過紅藍(lán)雙方高速模擬對抗和結(jié)果分析,形成對未來作戰(zhàn)空間的深入了解,提供關(guān)鍵事件和決策點的概率模型,并通過人機(jī)交互可視化方式給與呈現(xiàn)?!吧罹G”代表了人工智能輔助決策的發(fā)展方向。
2009年至2014年間,DARPA先后啟動了洞察力、指南針、X數(shù)據(jù)、大機(jī)制、深度學(xué)習(xí)等基礎(chǔ)研究項目[2],探索發(fā)展從視頻、圖片、文本、語音等跨媒體數(shù)據(jù)中提取關(guān)聯(lián)關(guān)系、提取高價值深度情報信息。同時,近幾年DARPA布局了一系列面向?qū)嶋H作戰(zhàn)任務(wù)背景的項目。洞察力項目開發(fā)新人工程序來幫助增強(qiáng)情報分析人員對海量信息分析處理的能力,大大提高分析效率,同時有利于對時間敏感作戰(zhàn)行動提供及時情報支持。指南針項目——“通過規(guī)劃主動的情景想定進(jìn)行情報收集和監(jiān)視”(Collection and Monitoring via Planning for Active Situational Scenarios),旨在開發(fā)一款高級軟件來幫助作戰(zhàn)人員通過衡量對手對各種刺激手段的反應(yīng)來弄清對手的意圖。該項目將利用先進(jìn)的人工智能技術(shù)、博弈論以及建模和評估方法來甄別盡可能暴露對手意圖的刺激手段,并為決策者制定相應(yīng)措施提供高保真情報,為每種行動方案提供正負(fù)兩面的權(quán)衡。
2015年12月,美國防部提出了第三次抵消戰(zhàn)略[3],重點強(qiáng)調(diào)了人工智能技術(shù),并提出了五大關(guān)鍵技術(shù):自主學(xué)習(xí)機(jī)器、人機(jī)行動協(xié)作、作戰(zhàn)輔助系統(tǒng)、有人/無人混合編組、網(wǎng)絡(luò)賦能自主武器等。其中三項就與人機(jī)協(xié)同混合作戰(zhàn)相關(guān),代表了人工智能輔助決策技術(shù)將成為未來世界軍事強(qiáng)國的發(fā)展重點。
2016年6月,美國辛辛那提大學(xué)研制了空戰(zhàn)人工智能程序——阿爾法,在模擬空戰(zhàn)中擊敗了美軍空軍王牌訓(xùn)練教官李上校。李上校表示:阿爾法可以快速判斷對手動機(jī),具有超乎尋常的觀察能力和反應(yīng)能力,即時對飛機(jī)機(jī)動和導(dǎo)彈威脅進(jìn)行反應(yīng),可以有效進(jìn)行導(dǎo)彈規(guī)避,在攻防轉(zhuǎn)換方面靈活機(jī)動。據(jù)稱,阿爾法在空中格斗中快速協(xié)調(diào)戰(zhàn)術(shù)計劃比人類快了250倍,可以在1ms內(nèi)完成多機(jī)作戰(zhàn)計劃更新,并通過自我學(xué)習(xí)完善決策能力。該技術(shù)是AI在交戰(zhàn)控制領(lǐng)域應(yīng)用的重大突破,未來可用于訓(xùn)練人類飛行員。為AI輔助決策提供了新的發(fā)展方向。
2016年底,美軍啟動指揮官虛擬參謀(Commander’s Virtual Staff)項目[4],旨在通過綜合應(yīng)用認(rèn)知計算,高效處理實時戰(zhàn)場數(shù)據(jù),自動確定任務(wù)清單,可靈活介入軍事決策流程,行動方案動態(tài)評估,進(jìn)行態(tài)勢預(yù)判,給方案建議,在復(fù)雜環(huán)境下提供有用的決策信息,協(xié)助營級指揮員完成臨機(jī)戰(zhàn)術(shù)決策。
對抗態(tài)勢是指對抗各方通過作戰(zhàn)力量對比、部署和行動等形成的狀態(tài)和趨勢,態(tài)勢的評估為后續(xù)對抗策略生成與優(yōu)化提供了依據(jù)。主要技術(shù)挑戰(zhàn):1)存在戰(zhàn)爭迷霧,有些敵方信息無法獲得;2)高層態(tài)勢比較抽象,難以獲取;3)態(tài)勢評估的信息眾多,有效融合多維信息困難。
針對上述挑戰(zhàn),根據(jù)任務(wù),對地形、敵情、我情進(jìn)行詳細(xì)分析,態(tài)勢評估包括3個層面靜態(tài)特性、演進(jìn)特性、動態(tài)特性。態(tài)勢評估技術(shù)是輔助決策的重要環(huán)節(jié),最重要和復(fù)雜的是敵情分析。需要的計算包括:敵方位置估計:不完全信息條件下的敵方位置估計;敵方威脅評估:敵方火力覆蓋區(qū)域分析;敵方行為企圖估計:敵方行為和企圖的預(yù)測;過程預(yù)測:戰(zhàn)局走向預(yù)判。
決策計劃技術(shù)主要涉及多兵種協(xié)同的任務(wù)規(guī)劃,解決編隊與單體的機(jī)動火力計劃問題。主要挑戰(zhàn)在于:1)宏觀決策收益需要長時間才能顯現(xiàn),決策行為與效益難以直接映射;2)多兵種戰(zhàn)術(shù)組合空間巨大,尋找優(yōu)化方案困難;3)分布式群體行為協(xié)同規(guī)劃容易出現(xiàn)任務(wù)沖突,分層任務(wù)分解缺乏有效手段。
針對上述挑戰(zhàn),構(gòu)建決策計劃的實施方案:作戰(zhàn)構(gòu)想自動枚舉,完成作戰(zhàn)意圖、作戰(zhàn)目標(biāo)、主要作戰(zhàn)方向、兵力分配、主要戰(zhàn)法自動枚舉;作戰(zhàn)方案自動推演;建立多維度分層方案評價準(zhǔn)則,完成多種方案比較評估;根據(jù)優(yōu)化準(zhǔn)則形成決心建議;構(gòu)建分層任務(wù)分解與任務(wù)協(xié)同機(jī)制,實現(xiàn)作戰(zhàn)方案到作戰(zhàn)計劃的自動生成;針對策略能力需要自主提升的問題,構(gòu)建博弈策略的評價機(jī)制和學(xué)習(xí)型策略演進(jìn)機(jī)制,實現(xiàn)博弈策略的自主進(jìn)化與能力提升。
人機(jī)交互技術(shù)是實現(xiàn)輔助決策的重要環(huán)境,不僅要指揮員意圖有效導(dǎo)入,同時也要將態(tài)勢預(yù)測和方案計劃有效呈現(xiàn),并接受指揮員的修改完善。主要挑戰(zhàn):1)基于多通道人機(jī)交互手段的指揮員意圖高效導(dǎo)入;2)態(tài)勢、方案、計劃的可視化有效表達(dá);3)人機(jī)融合的有效介入,決策計劃的高效修改。
針對上述挑戰(zhàn),構(gòu)建人機(jī)交互的實施方案:基于語音和手寫平板的作戰(zhàn)草圖導(dǎo)入方案;基于分層態(tài)勢和多維語義態(tài)勢圖的可視化通用態(tài)勢表達(dá)模型;基于分層任務(wù)網(wǎng)絡(luò)的方案計劃可視化表達(dá);基于自然語言和手寫草圖的方案計劃修正模式。
隨著人工智能技術(shù)的迅猛發(fā)展,未來輔助決策系統(tǒng)主要發(fā)展趨勢如下:
1)人機(jī)融合下的輔助決策。人類由于感知與決策能力的生理局限性而無法駕馭未來戰(zhàn)爭,由人來控制整個戰(zhàn)場因素的傳統(tǒng)做法已經(jīng)無法應(yīng)對瞬息萬變的高強(qiáng)度未來戰(zhàn)場環(huán)境。人類戰(zhàn)士將不得不逐漸跳出作戰(zhàn)鏈,在多數(shù)情況下作為計劃員、管理員和指揮員的角色配合機(jī)器智能以把控整個戰(zhàn)爭的進(jìn)程,從而推動戰(zhàn)爭從人類之間的戰(zhàn)爭轉(zhuǎn)變?yōu)槿藱C(jī)協(xié)同作戰(zhàn)的全新形態(tài),包括精準(zhǔn)感知、臨境自然交互、人機(jī)協(xié)同感知、人機(jī)融合計算。
2)輔助決策的人機(jī)智能演進(jìn)。機(jī)器智能可能會顛覆傳統(tǒng)人類戰(zhàn)爭決策邏輯。以深度強(qiáng)化學(xué)習(xí)、大數(shù)據(jù)、超級計算為基礎(chǔ)的新型博弈對抗策略,展示了全新的數(shù)據(jù)驅(qū)動最優(yōu)博弈策略生成方式,表現(xiàn)了強(qiáng)大的博弈對抗能力和自學(xué)習(xí)進(jìn)化能力。未來以知識數(shù)據(jù)混合驅(qū)動的學(xué)習(xí)進(jìn)化型戰(zhàn)爭決策邏輯,將全面取代傳統(tǒng)單純以運(yùn)籌學(xué)基礎(chǔ)軍事博弈決策邏輯。不斷演進(jìn)的新型人工智能技術(shù)成為未來軍事博弈決策的顛覆性力量。機(jī)械化戰(zhàn)爭思維將被全新智能化戰(zhàn)爭思維取代,非人類傳統(tǒng)戰(zhàn)法的機(jī)器智慧大大延伸了人類智慧,這是人類對戰(zhàn)爭規(guī)律探索與人機(jī)混合增強(qiáng)智能的最新認(rèn)知。