周 盼 程健慶 初 陽
(江蘇自動(dòng)化研究所 連云港 222006)
智能博弈是指在仿真條件下?lián)碛兄悄芩季S的博弈雙方根據(jù)戰(zhàn)場(chǎng)實(shí)時(shí)態(tài)勢(shì)數(shù)據(jù),自主做出決策判斷,并反饋于戰(zhàn)場(chǎng),進(jìn)而控制戰(zhàn)場(chǎng)的兵力、裝備等形成智能對(duì)抗行為的過程。目前智能博弈技術(shù)在很多領(lǐng)域都取得了顯著突破。在民用領(lǐng)域,智能AI已經(jīng)在人機(jī)對(duì)抗賽中戰(zhàn)勝人類頂尖選手。如AlphaGo/AlphaZero(圍棋AI)[1]、AlphaStar(星際爭(zhēng)霸AI)[2]和絕悟(王者榮耀AI)[3]等。在軍事領(lǐng)域,作戰(zhàn)與指揮智能博弈問題也得到了積極研究,美國一直推進(jìn)智能博弈技術(shù)的發(fā)展,希冀借此提高作戰(zhàn)指揮的效能,縮短籌劃時(shí)間,先后啟動(dòng)了“深綠”[4]、指揮官虛擬參謀[5]、“指南針”(COMPASS)等一系列項(xiàng)目。
智能博弈中智能體輸出的自主決策主要分為微觀決策和宏觀策略兩種。微觀決策是指決策智能體根據(jù)當(dāng)前時(shí)間點(diǎn)的博弈態(tài)勢(shì)輸出對(duì)戰(zhàn)場(chǎng)兵力進(jìn)行控制的決策指令,如控制兵力進(jìn)行轉(zhuǎn)向、移動(dòng)或發(fā)射武器等;宏觀策略指智能體根據(jù)一段時(shí)間內(nèi)整體博弈態(tài)勢(shì)輸出的更高層次的策略方案,如全面進(jìn)攻敵方目標(biāo)、撤退防守我方陣地等。目前,通過基于微觀決策的深度強(qiáng)化學(xué)習(xí)算法可以做到讓計(jì)算機(jī)在博弈對(duì)抗時(shí)獲得近似于人類表現(xiàn)的決策[6],但無法直接滿足當(dāng)前作戰(zhàn)指揮中日趨復(fù)雜的宏觀策略需要。鑒于現(xiàn)實(shí)中復(fù)雜決策問題通常為宏觀策略問題,智能博弈中宏觀策略生成技術(shù)亟需研究。
在宏觀策略研究領(lǐng)域,Synnaeve 等[9]對(duì)收集到的回放數(shù)據(jù)進(jìn)行預(yù)處理,提出了將星際爭(zhēng)霸玩家的開放決策模式從有限的決策模式中集中分類的識(shí)別方法。Justesen、Rsis 等[8]提出一種基于DNN 方法的來學(xué)習(xí)博弈對(duì)抗中的宏觀全局狀態(tài)策略評(píng)估。Gabriel S 等[7]提出基于貝葉斯網(wǎng)絡(luò)的模型,專門應(yīng)對(duì)態(tài)勢(shì)信息中的不確定性和不完全性進(jìn)行宏觀策略。
總體來說,目前關(guān)于宏觀策略的研究主要集中在數(shù)據(jù)預(yù)處理、決策識(shí)別分類以及決策效果評(píng)估等領(lǐng)域,而且大部分研究是面向固定領(lǐng)域任務(wù)的宏觀策略,在海上作戰(zhàn)方向,結(jié)合智能博弈生成宏觀策略的方法研究不多。鑒于智能博弈具有巨復(fù)雜、高動(dòng)態(tài)、強(qiáng)對(duì)抗等特點(diǎn),為解決宏觀策略生成問題,本文在以微觀決策為主的智能博弈中收集特征數(shù)據(jù),對(duì)TICC 聚類算法進(jìn)行改進(jìn),提出一種基于FS-TICC 分割聚類算法的智能博弈宏觀策略生成框架,并使用該算法對(duì)某博弈中高維特征時(shí)間序列數(shù)據(jù)進(jìn)行了分割聚類,驗(yàn)證了算法的有效性。本研究能夠清晰地展示智能博弈中的宏觀策略生成過程,使智能體的自主決策較直觀、可信,且在某種程度上具有一定的可解釋性,為使用人工智能技術(shù)生成作戰(zhàn)方案奠定基礎(chǔ)。
針對(duì)智能博弈決策過程獲取的博弈態(tài)勢(shì)S 和微觀決策時(shí)間序列D,為了對(duì)其時(shí)變相關(guān)性結(jié)構(gòu)進(jìn)行建模和聚類,本文提出一種智能博弈宏觀策略生成框架,將由博弈態(tài)勢(shì)S 和微觀決策D 組成的智能博弈特征變量時(shí)間序列Xorig進(jìn)行了階段分割,并對(duì)不同階段的宏觀策略進(jìn)行了聚類,最后對(duì)聚類結(jié)果進(jìn)行分析,生成框架如圖1所示。
圖1 智能博弈宏觀策略生成框架
具體步驟如下:
1)智能博弈特征數(shù)據(jù)采集
對(duì)智能博弈過程中實(shí)時(shí)產(chǎn)生的微觀決策指令和對(duì)應(yīng)時(shí)間點(diǎn)的博弈態(tài)勢(shì)進(jìn)行記錄,可以得到的博弈態(tài)勢(shì)時(shí)間序列和微觀決策時(shí)間序列。
博弈態(tài)勢(shì)時(shí)間序列:
微觀決策時(shí)間序列:
這兩個(gè)序列將作為聚類算法輸入的智能博弈特征數(shù)據(jù),其中T 為智能博弈過程在時(shí)間維度上的長度,博弈態(tài)勢(shì)si表示時(shí)間點(diǎn)為i 時(shí)智能體已知的環(huán)境態(tài)勢(shì)和敵我雙方的狀態(tài)的n1元變量。微觀決策di表示時(shí)間點(diǎn)為i 時(shí)智能體直接控制兵力、武器單元執(zhí)行的相關(guān)動(dòng)作指令的n2元變量。
2)分割聚類
為了獲取時(shí)間序列數(shù)據(jù)在特征維度之間和連續(xù)時(shí)間段之間的時(shí)間上相互依賴關(guān)系,通過特征選擇輸入、階段分割和策略聚類三個(gè)步驟對(duì)獲取的博弈數(shù)據(jù)進(jìn)行分割聚類,具體方法見第4節(jié)介紹。
3)宏觀策略生成
使用算法聚類結(jié)果對(duì)智能博弈特征變量時(shí)間序列Xorig進(jìn)行階段分割和宏觀策略聚類。Xorig由智能博弈的博弈態(tài)勢(shì)S 時(shí)間序列和微觀決策D 時(shí)間序列共同組成:
其中n=n1+n2,xi表示時(shí)間點(diǎn)為i時(shí)的智能博弈聯(lián)合特征的n 元變量。智能體在階段i 的時(shí)間段中,會(huì)遵循一個(gè)宏觀策略li,當(dāng)智能博弈轉(zhuǎn)換為下一個(gè)階段i+1 時(shí),智能體會(huì)更新當(dāng)前的宏觀策略為li+1。其中,階段是使用聚類結(jié)果將Xorig中的博弈態(tài)勢(shì)進(jìn)行分割的q 個(gè)區(qū)間段落。而宏觀策略為通過算法對(duì)不同階段的特征數(shù)據(jù)進(jìn)行聚類,從而提取不同階段下的宏觀策略模式。
4)聚類結(jié)果分析
對(duì)智能博弈特征變量Xorig進(jìn)行分割聚類后,可以獲取分割后各個(gè)階段的宏觀策略標(biāo)簽和聚類特征。通過宏觀策略聚類的特征數(shù)據(jù)隨時(shí)間變化的特點(diǎn),對(duì)聚類結(jié)果進(jìn)行分析解釋。通常可以選擇決策人員主要關(guān)注的部分態(tài)勢(shì)特征變量,繪制一組分割聚類后的時(shí)間序列數(shù)據(jù),由此將分割聚類的結(jié)果進(jìn)行可視化,在此基礎(chǔ)上對(duì)聚類結(jié)果進(jìn)行分析。
綜上所述,智能博弈宏觀策略生成的總體框架是首先將智能博弈中采集的高維時(shí)間序列特征數(shù)據(jù)博弈態(tài)勢(shì)S 和微觀決策D 分割為q 個(gè)階段,然后將這q 個(gè)階段中的宏觀策略聚類為K 個(gè)類,最后對(duì)結(jié)果作出分析解釋。其中最關(guān)鍵的步驟是對(duì)特征數(shù)據(jù)進(jìn)行分割聚類,這是本文的一大挑戰(zhàn),不但需要在分割階段后對(duì)重復(fù)出現(xiàn)的宏觀策略模式進(jìn)行識(shí)別和合并,還不同于單獨(dú)的子序列聚類,需要盡可能地將相鄰時(shí)間戳聚為一類。傳統(tǒng)聚類方法通常依賴于基于距離的指標(biāo),在時(shí)間維度上的考量并不深入,很難適用于高維時(shí)間序列數(shù)據(jù)的分割聚類。本研究將智能博弈中的宏觀策略生成過程轉(zhuǎn)換為一種特殊的對(duì)多元時(shí)間序列進(jìn)行無監(jiān)督分割和聚類的過程,對(duì)Hallac 等提出的TICC 算法[10]進(jìn)行改進(jìn),提出FS-TICC 算法,實(shí)現(xiàn)基于特征選擇和時(shí)變相關(guān)性結(jié)構(gòu)的分割聚類。
托普利茲逆協(xié)方差聚類算法(Toeplitz Inverse Covariance-based Clustering,TICC)是一種基于模型的聚類方法,考慮了數(shù)據(jù)之間的時(shí)變相關(guān)性,在時(shí)間序列聚類上可以獲得較為理想的聚類結(jié)果。智能博弈過程特征變量的多元時(shí)間序列Xorig由博弈態(tài)勢(shì)時(shí)間序列S 和微觀決策時(shí)間序列D 共同組成,博弈過程中階段的劃分標(biāo)準(zhǔn)取決于博弈態(tài)勢(shì)在時(shí)間上的變化特征,與微觀決策沒有直接相關(guān)性。TICC 算法直接將特征變量Xorig作為特征輸入時(shí),多余的特征會(huì)增加復(fù)雜度以及可能過擬合。為了降低數(shù)據(jù)的冗雜度和計(jì)算復(fù)雜度,提高算法的計(jì)算速度以及增強(qiáng)聚類結(jié)果的可理解性,本文將基于特征輸入選擇(Feature Selection)來改進(jìn)TICC。
在TICC 算法中,為了便于考察智能博弈特征變量Xorig時(shí)變相關(guān)性,定義大小為w<< T 的時(shí)間窗口,并將xi之前相鄰的w 個(gè)時(shí)間點(diǎn)拼接成一個(gè)向量Xi=[xi-w+1,…,xi]T作為算法的輸入。算法還定義了能夠描述各特征變量之間時(shí)變相關(guān)性的K 個(gè)對(duì)稱分塊Toeplitz 矩陣的逆協(xié)方差Θi,Θi可以捕獲特征變量之間時(shí)變結(jié)構(gòu)模式,并根據(jù)不同階段的特征變量的逆協(xié)方差Θ與Θi的相似度將階段下的宏觀策略模式進(jìn)行聚類。
TICC 算法最終求解目標(biāo)為K 個(gè)逆協(xié)方差Θ={Θ1,Θ2,…,ΘK},及其分割集合P={Pk|k=1,…,K},其中Pk?{1,…,T},求解該上述多元時(shí)間序列分割聚類問題的整體目標(biāo)函數(shù)數(shù)學(xué)表達(dá)式如下:
其中,λ為正則化參數(shù);??(Xt,Θi)為Xt于聚類i的對(duì)數(shù)似然函數(shù)值;β1{Xt-1?Pi}為確保使相鄰時(shí)間向量Xi-1和Xi盡可能聚為一類,保持時(shí)間一致性的參數(shù)。
本文提出的FS-TICC算法的核心是求解式(1)中分割集合P 和簇參數(shù)逆協(xié)方差Θ兩組變量參數(shù)時(shí)各自選擇特征變量輸入,該求解過程是一個(gè)混合組合和連續(xù)優(yōu)化的高度非凸問題,通過對(duì)期望最大化算法[11](EM算法)進(jìn)行改進(jìn)來解決該問題。主要思路是在更新分割集合參數(shù)P 以及更新簇參數(shù)Θ之間選擇各自的輸入特征變量,并交替進(jìn)行迭代最小化。
改進(jìn)后的TICC算法迭代過程主要分為兩步:
1)更新分割集合P:初始化各個(gè)簇即各個(gè)逆協(xié)方差參數(shù)Θ,并且固定這些參數(shù),以更新分割集合參數(shù)P,這一步的目的是得到智能博弈過程中的特征時(shí)間序列數(shù)據(jù)的階段劃分,故只需要輸入特征變量中博弈態(tài)勢(shì)部分。因此,現(xiàn)階段子問題轉(zhuǎn)化為如下目標(biāo)函數(shù):
2)更新逆協(xié)方差Θ:在更新完分割集合參數(shù)P之后,固定P,以交替更新逆協(xié)方差Θ。該步驟是為了提取博弈過程中的宏觀策略模式,故需要輸入特征變量中博弈態(tài)勢(shì)和微觀決策兩個(gè)部分,在該步驟中整體目標(biāo)函數(shù)中的β1{Xt-1?Pi}將變成不影響最小化目標(biāo)函數(shù)的常數(shù)C。這樣,該階段的子問題目標(biāo)函數(shù)將定義如下:
其中Ci為Xi的博弈態(tài)勢(shì)和微觀決策特征參數(shù)計(jì)算得到的當(dāng)前協(xié)方差陣。式(7)只有對(duì)數(shù)似然項(xiàng)和稀疏項(xiàng),可以采用交替方向乘子法[13](Alternating Direction Method of Multipliers,ADMM)來求解該參數(shù)優(yōu)化問題,由此得到每個(gè)簇的逆協(xié)方差矩陣Θi。
重復(fù)1),2)兩步,直到分割聚類結(jié)果收斂或者達(dá)到迭代次數(shù)的上限時(shí)終止,并輸出分割集合參數(shù)P和逆協(xié)方差矩陣參數(shù)Θ。
在本文提出的FS-TICC算法求解步驟中,需要對(duì)時(shí)間窗大小w、聚類簇?cái)?shù)K 兩個(gè)參數(shù)進(jìn)行選擇或設(shè)置。
時(shí)間窗大小w 表示算法中最小的數(shù)據(jù)粒度,該值越大,輸入的時(shí)間序列數(shù)據(jù)越長。w 不宜太大,因?yàn)槿绻罂赡芎茈y正確地分割時(shí)間段邊界上的點(diǎn),在邊界上的關(guān)于時(shí)不變結(jié)構(gòu)的假設(shè)可能不成立。因此,w 的取值一般相對(duì)較小,選取時(shí)應(yīng)該綜合考慮在智能博弈領(lǐng)域的以往經(jīng)驗(yàn)、觀察數(shù)據(jù)的粒度和平均期望長度,或者針對(duì)具體的博弈場(chǎng)景進(jìn)行多次預(yù)先實(shí)驗(yàn)來確認(rèn)。
聚類簇?cái)?shù)K表示提取的宏觀策略類的數(shù)量,有多種方法可以確定K 的具體數(shù)值,一般可以基于相應(yīng)領(lǐng)域的專業(yè)先驗(yàn)知識(shí)來確定一個(gè)理論上的聚類數(shù),或者結(jié)合BIC 分?jǐn)?shù)、輪廓系數(shù)或交叉驗(yàn)證等方法綜合考慮K 的具體數(shù)值。在本研究中聚類簇?cái)?shù)的確定值往往主要取決于智能博弈場(chǎng)景本身,其主要因?yàn)槌司垲悳?zhǔn)確性之外,還需要給予結(jié)果的可解釋性。
為了驗(yàn)證提出算法的有效性,采用某智能藍(lán)軍項(xiàng)目構(gòu)建的決策智能體和仿真系統(tǒng)開展研究。仿真想定為藍(lán)方某大型海上編隊(duì)起飛戰(zhàn)斗機(jī),突破紅方防空攔截線,對(duì)紅方重要水面目標(biāo)進(jìn)行打擊。運(yùn)行仿真系統(tǒng),開展100 組紅藍(lán)博弈對(duì)抗,博弈對(duì)抗中藍(lán)方某架戰(zhàn)斗機(jī)飛行軌跡如圖2所示。
圖2 藍(lán)方某架戰(zhàn)斗機(jī)飛行軌跡
選取博弈對(duì)抗數(shù)據(jù)中的總得分、起飛飛機(jī)數(shù)量、發(fā)射武器數(shù)量、己方兵力信息、探測(cè)到的敵方兵力信息、摧毀敵方飛機(jī)數(shù)量、摧毀敵方重要目標(biāo)數(shù)量和己方被摧毀的單位價(jià)值等作為博弈態(tài)勢(shì)時(shí)間序列S 以及智能體控制兵力執(zhí)行的動(dòng)作等作為微觀決策時(shí)間序列D 作為分割聚類算法的輸入。本次實(shí)驗(yàn)為了使聚類結(jié)果更加合理準(zhǔn)確,對(duì)獲取的數(shù)據(jù)進(jìn)行了歸一化預(yù)處理,并以博弈中藍(lán)方智能體視角獲取的數(shù)據(jù)來進(jìn)行實(shí)驗(yàn)。
在進(jìn)行分割聚類之前,首先要對(duì)算法的參數(shù)進(jìn)行選擇,以選擇合適的窗口大小w 和聚類簇?cái)?shù)K。主要思路是結(jié)合智能博弈場(chǎng)景和輪廓系數(shù)法,設(shè)計(jì)了9 組不同參數(shù)求解輪廓系數(shù)s。不同參數(shù)選擇下計(jì)算得到的輪廓系數(shù)如表1所示。
表1 不同參數(shù)選擇下的聚類結(jié)果的輪廓系數(shù)
經(jīng)過對(duì)比分析,第4 組的輪廓系數(shù)得分最高,所以本次實(shí)驗(yàn)選擇的參數(shù)為窗口大小為4,聚類簇?cái)?shù)為4。
利用本文提出的FS-TICC 算法對(duì)數(shù)據(jù)進(jìn)行分割聚類,將分割聚類后的一部分時(shí)間序列數(shù)據(jù)(總分?jǐn)?shù)、起飛飛機(jī)數(shù)量、己方單位總價(jià)值、發(fā)現(xiàn)敵方單位數(shù)量、發(fā)射武器數(shù)量、摧毀敵方單位的價(jià)值、摧毀敵方重要目標(biāo)的總價(jià)值、被摧毀飛機(jī)數(shù)量)的聚類結(jié)果繪于圖3 中。其中時(shí)間序列的橫軸統(tǒng)一為時(shí)間刻度,分割結(jié)果為各個(gè)階段的簇標(biāo)簽,不同階段用線劃分,并將其用A~D字母進(jìn)行標(biāo)記。
圖3 宏觀策略FS-TICC分割聚類結(jié)果
下面對(duì)聚類結(jié)果及其標(biāo)簽做出分析解釋。
階段一的宏觀策略聚類標(biāo)簽為A,博弈對(duì)抗過程剛開始,己方逐步起飛飛機(jī),但是尚未發(fā)現(xiàn)敵方單位,可以解釋當(dāng)前宏觀策略為進(jìn)行兵力部署;
階段二的宏觀策略聚類標(biāo)簽為B,總分?jǐn)?shù)、起飛飛機(jī)數(shù)量繼續(xù)上升,開始發(fā)現(xiàn)大量敵方單位,但發(fā)射武器數(shù)量和摧毀敵方單位數(shù)量一直處于低位,沒有發(fā)生大規(guī)模沖突,可以解釋當(dāng)前宏觀策略為偵查敵情;
階段三的宏觀策略聚類標(biāo)簽為C,起飛飛機(jī)數(shù)量上升趨勢(shì)減緩,發(fā)現(xiàn)敵方單位數(shù)量和發(fā)射武器數(shù)量迅速上升,敵我雙方開始交戰(zhàn),雙方均出現(xiàn)戰(zhàn)損,可以解釋當(dāng)前宏觀策略為主動(dòng)進(jìn)攻敵方目標(biāo);
階段四的宏觀策略聚類標(biāo)簽為D,己方被摧毀飛機(jī)數(shù)量開始出現(xiàn)大規(guī)模上升的情況,但同時(shí)起飛更多飛機(jī)加入戰(zhàn)斗,同時(shí)摧毀的敵方單位數(shù)量上升,可以解釋當(dāng)前宏觀策略為防守待援;
階段五的宏觀策略聚類標(biāo)簽為C,總分?jǐn)?shù)迅速上升,且己方在迅速摧毀敵方重要目標(biāo)和敵方單位,可以解釋當(dāng)前宏觀策略為主動(dòng)進(jìn)攻敵方目標(biāo)。
最終宏觀策略聚類結(jié)果分析解釋見表2。通過上述分析,可以定性的認(rèn)為本文提出的FS-TICC算法分割聚類的結(jié)果與智能博弈宏觀策略生成過程的特征一致,證明了該算法的有效性。
表2 宏觀策略聚類結(jié)果分析解釋
本小節(jié)將實(shí)驗(yàn)中獲取的數(shù)據(jù)取平均值,將FS-TICC 算法與TICC 算法、FCM 算法和K-means算法進(jìn)行比較研究。所有算法的輸入數(shù)據(jù)集相同,聚類簇?cái)?shù)均設(shè)置為4,聚類后不同結(jié)果轉(zhuǎn)化為二維的生產(chǎn)資源數(shù)量-己方單位總價(jià)值散點(diǎn)圖形式,其中聚類效果的展示如圖4~7 所示。FS-TICC 算法與TICC算法平均計(jì)算時(shí)長如表3所示。
表3 FS-TICC 算法與TICC算法平均計(jì)算時(shí)長
圖5 TICC 算法聚類效果
圖6 FCM算法聚類效果
1)FS-TICC算法與FCM等傳統(tǒng)聚類算法比較
由圖7可以明顯看出,傳統(tǒng)聚類算法只是對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行了分割,并沒有發(fā)現(xiàn)博弈過程中的階段五的宏觀策略聚類標(biāo)簽,得到的結(jié)果與智能博弈宏觀策略模型并不相符。分析其中原因是傳統(tǒng)聚類分析算法只是基于數(shù)據(jù)的結(jié)構(gòu)在邊界閾值上進(jìn)行分段劃分,無法反映出不同參數(shù)時(shí)域上的變化關(guān)系,而智能博弈中高維時(shí)序數(shù)據(jù)的維度之間以及連續(xù)時(shí)間段的數(shù)據(jù)是有著一定的關(guān)系,所以傳統(tǒng)的時(shí)序數(shù)據(jù)聚類算法對(duì)智能博弈中高維數(shù)據(jù)進(jìn)行準(zhǔn)確的聚類。
圖7 K-means算法聚類效果
2)改進(jìn)的TICC算法與改進(jìn)前算法比較
由表3可以看出,由于FS-TICC算法在特征變量選擇針對(duì)TICC 算法做出了改進(jìn),減小了一部分輸入特征變量的維度,大大提高了計(jì)算效率。
對(duì)比圖3 和圖4 可以看出,由于TICC 算法在分割階段時(shí)的特征變量輸入較為冗雜,分割成了較為繁復(fù)的六個(gè)階段,而且在階段一和階段二之間,階段三和階段四之間的均出現(xiàn)分界不清晰的情況,給聚類結(jié)果的分析帶來了困難。
綜上可知,F(xiàn)S-TICC 算法對(duì)智能博弈中的高維時(shí)間序列數(shù)據(jù)進(jìn)行時(shí)間序列分割聚類的效果要優(yōu)于其他幾種算法,結(jié)果更加符合智能博弈中宏觀策略模型。
目前,智能博弈對(duì)抗中的高維時(shí)間序列數(shù)據(jù)的日趨繁多,然而傳統(tǒng)聚類分析算法忽略了高維時(shí)間序列數(shù)據(jù)中特征參數(shù)在時(shí)間域上的關(guān)系,從而限制了傳統(tǒng)聚類算法對(duì)宏觀策略聚類的性能。本文提出了一種智能博弈宏觀策略生成框架,并對(duì)TICC算法進(jìn)行改進(jìn),實(shí)現(xiàn)對(duì)高維時(shí)間序列數(shù)據(jù)分割聚類,采用某智能博弈實(shí)驗(yàn)收集到的數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)驗(yàn)證,通過對(duì)比分析可以看出,針對(duì)高維時(shí)間序列分割聚類問題,改進(jìn)的TICC 算法比傳統(tǒng)算法具有更好的聚類效果,能夠表現(xiàn)一定程度的可解釋性,聚類結(jié)果可作為利用智能博弈技術(shù)生成作戰(zhàn)方案的基礎(chǔ)。