吳 蕾,司光亞,柳少軍,伍文峰
(1. 國防大學(xué)聯(lián)合作戰(zhàn)學(xué)院,北京100091;2. 陸軍航空兵研究所,北京 101121)
兵棋演習(xí)時,模擬回路中的指揮員,根據(jù)實(shí)時戰(zhàn)場態(tài)勢作出指揮決策,將人的判斷以指令的形式輸入兵棋系統(tǒng),指令成功執(zhí)行后轉(zhuǎn)化為作戰(zhàn)行動,進(jìn)而系統(tǒng)將新的戰(zhàn)場態(tài)勢呈現(xiàn)給指揮員,指揮員實(shí)時調(diào)整方案,下達(dá)新的指令,使戰(zhàn)場態(tài)勢向有利于己的方向發(fā)展。在此過程中,人與系統(tǒng)相互作用產(chǎn)生海量的仿真數(shù)據(jù),這些數(shù)據(jù)不僅記錄了對抗推演的過程及結(jié)果數(shù)據(jù),而且包含了由參演人員在作戰(zhàn)指揮中產(chǎn)生的指揮行為數(shù)據(jù)以及對抗推演中實(shí)體之間的行動交互及狀態(tài)的動態(tài)變化[1],蘊(yùn)含了大量作戰(zhàn)行動之間的關(guān)系,其多樣性和復(fù)雜性給指揮員帶來了巨大的認(rèn)知壓力,因此,亟需對這些關(guān)聯(lián)關(guān)系進(jìn)行分析和挖掘,從而幫助指揮員從這些海量信息中快速、準(zhǔn)確地篩選出較為關(guān)鍵的信息,更好地描述作戰(zhàn)過程,為導(dǎo)演部進(jìn)行演習(xí)復(fù)盤評估提供支撐。
近些年,國內(nèi)外研究人員對數(shù)據(jù)關(guān)聯(lián)分析展開了很多相關(guān)研究。Fukui等[2]提出從時間序列數(shù)據(jù)中提取具有相關(guān)性的聚類對的挖掘算法,從而獲得多個事件之間的對應(yīng)關(guān)系。Zhang等[3]構(gòu)建了交互式學(xué)習(xí)的聯(lián)合模型,學(xué)習(xí)事件用于關(guān)系提取的同時,學(xué)習(xí)關(guān)系用于事件提取,通過反復(fù)迭代,提升聯(lián)合提取的效果。付劍鋒等[4]提出層疊條件隨機(jī)場模型,采用層疊條件隨機(jī)場方法標(biāo)注出事件的因果關(guān)系,實(shí)現(xiàn)事件間因果關(guān)系的提取。Kuo等[5]提出一種多目標(biāo)粒子群算法,用于數(shù)值關(guān)聯(lián)規(guī)則挖掘以發(fā)現(xiàn)用戶行為之間的關(guān)聯(lián)關(guān)系。
在軍事數(shù)據(jù)關(guān)聯(lián)分析方面,研究人員也進(jìn)行了不少探索性研究。羅樂等[6]運(yùn)用Apriori算法對裝備數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,挖掘裝備使用中影響因素和裝備效能之間的關(guān)聯(lián)關(guān)系。王峰山等[7]針對傳統(tǒng)事后分析方法難以進(jìn)行因果關(guān)系追溯等問題,將大數(shù)據(jù)關(guān)聯(lián)挖掘方法應(yīng)用到作戰(zhàn)實(shí)驗(yàn)的事后分析中。曹冠平等[8]在構(gòu)建關(guān)聯(lián)規(guī)則挖掘框架的基礎(chǔ)上,對作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,并通過案例得出行動和效果之間的關(guān)聯(lián)關(guān)系。賈珺等[9]構(gòu)建了作戰(zhàn)協(xié)同關(guān)系超圖模型,通過頂點(diǎn)度和關(guān)聯(lián)系數(shù)等特征參數(shù)的分析,對作戰(zhàn)協(xié)同關(guān)系進(jìn)行挖掘研究。李政等[10]采用關(guān)聯(lián)規(guī)則挖掘算法對電子對抗目標(biāo)之間及電子對抗目標(biāo)與其它武器系統(tǒng)、作戰(zhàn)行動之間的關(guān)聯(lián)關(guān)系進(jìn)行挖掘,從而發(fā)現(xiàn)相關(guān)數(shù)據(jù)中蘊(yùn)含的關(guān)聯(lián)規(guī)則。
早期研究大多針對事件之間特定的某類關(guān)系進(jìn)行挖掘,其中因果關(guān)系是傳統(tǒng)數(shù)據(jù)關(guān)聯(lián)分析的焦點(diǎn)。隨著“關(guān)聯(lián)而非因果”理念[8]逐漸引起關(guān)注,研究方法開始傾向于通過關(guān)聯(lián)規(guī)則挖掘來查找各要素之間的關(guān)系。對于作戰(zhàn)數(shù)據(jù)或者作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)來說,很多研究是利用實(shí)體、時間、狀態(tài)等多元組元素形式化表示作戰(zhàn)行動以分析實(shí)體與實(shí)體、實(shí)體與行動或者行動與效果之間的關(guān)系。針對海量兵棋推演數(shù)據(jù)中蘊(yùn)含的眾多作戰(zhàn)行動,如何面向演習(xí)評估階段指揮員對關(guān)鍵行動的關(guān)注焦點(diǎn),對作戰(zhàn)行動進(jìn)行關(guān)聯(lián)規(guī)則分析,輔助描述作戰(zhàn)過程,優(yōu)化演習(xí)復(fù)盤評估效果,成為一個亟待解決的問題。
本文面向兵棋演習(xí)復(fù)盤評估工作,從分析作戰(zhàn)過程描述需求入手,通過構(gòu)建行動共現(xiàn)網(wǎng)絡(luò)模型,研究關(guān)聯(lián)行動關(guān)系,進(jìn)而開展行動重要度排序,提取關(guān)鍵行動,為演習(xí)復(fù)盤評估階段描述作戰(zhàn)過程提供支持。
大型計(jì)算機(jī)兵棋演習(xí)涵蓋陸、海、空、天、電、網(wǎng)多維戰(zhàn)場空間,其模擬層次高、仿真規(guī)模大、覆蓋范圍廣、演習(xí)要素全。演習(xí)數(shù)據(jù)除了包括目標(biāo)數(shù)據(jù)、裝備數(shù)據(jù)、戰(zhàn)場環(huán)境數(shù)據(jù)等基礎(chǔ)數(shù)據(jù)和部隊(duì)編成、兵力部署、后勤保障等想定數(shù)據(jù),以及演習(xí)系統(tǒng)配置數(shù)據(jù),還有“人”(導(dǎo)演部、參演人員)與兵棋演習(xí)系統(tǒng)交互中產(chǎn)生的計(jì)劃與干預(yù)指令數(shù)據(jù),以及對抗推演過程中產(chǎn)生的戰(zhàn)場態(tài)勢、實(shí)體狀態(tài)、行動效果、事件報(bào)告等推演數(shù)據(jù),具有數(shù)據(jù)規(guī)模巨大、類型結(jié)構(gòu)多樣、蘊(yùn)含關(guān)系復(fù)雜等特點(diǎn),包含著作戰(zhàn)全過程的態(tài)勢演變和行動變化,將其迅速、高效并且重點(diǎn)突出地描述出來將有助于導(dǎo)演部評估演習(xí)過程,也有利于指揮員掌握戰(zhàn)場情況,總結(jié)經(jīng)驗(yàn)教訓(xùn)。
由于兵棋系統(tǒng)是一個涉及到人、計(jì)算機(jī)和環(huán)境等諸多因素的復(fù)雜大系統(tǒng),參演要素眾多,相互間關(guān)系復(fù)雜,交互結(jié)果具有涌現(xiàn)性且充滿不確定性,因此作戰(zhàn)過程描述十分復(fù)雜,是一個或者多個實(shí)體在系統(tǒng)中經(jīng)歷的完整過程,包括任務(wù)與行動之間的邏輯關(guān)系,以及行動與行動之間的各種關(guān)系,通過對行動關(guān)聯(lián)關(guān)系進(jìn)行分析和挖掘,將有助于提取關(guān)鍵行動,減少零散、冗余信息的干擾,使作戰(zhàn)過程描述更加清晰明了。圖1為作戰(zhàn)過程描述輔助生成過程。
圖1 作戰(zhàn)過程描述輔助生成過程
共現(xiàn)(Co-occurrence),指事件或情形共同出現(xiàn),共現(xiàn)方法可以用來挖掘事件之間的相關(guān)性[11]。作戰(zhàn)行動作為事件的一種類型,是實(shí)體根據(jù)自身決策或上級指控,進(jìn)行的攻擊、偵察、躲避等具體作戰(zhàn)行動[12]。作戰(zhàn)行動間的聯(lián)系是共現(xiàn)發(fā)生的原因,通過分析行動共現(xiàn)現(xiàn)象可以從演習(xí)事后分析的角度了解作戰(zhàn)行動之間關(guān)聯(lián)關(guān)系的強(qiáng)弱。
具體來說,可以將共現(xiàn)行動定義如下:將一個數(shù)據(jù)集劃分為若干個共現(xiàn)窗口(Co-occurrence Windows),同一個窗口下共同出現(xiàn)的行動,就可以稱為共現(xiàn)行動(Co-occurrence Action)。由于作戰(zhàn)行動屬于時序數(shù)據(jù),因而一般情況下可以選取一定時間段作為共現(xiàn)行動的窗口單元。也就是說,若某些作戰(zhàn)行動在一個時間窗口單元(Time Window Unit,簡稱TWU)內(nèi)共同出現(xiàn),就認(rèn)為這些作戰(zhàn)行動之間存在共現(xiàn)關(guān)系,是共現(xiàn)行動。兵棋演習(xí)中的作戰(zhàn)行動由于是指揮員成功下達(dá)且系統(tǒng)成功執(zhí)行的指令,其紛繁復(fù)雜,數(shù)量龐大,重復(fù)性高,需要根據(jù)行動的時間、地域、動作等進(jìn)行行動聚合,形成新的行動數(shù)據(jù)集,在此基礎(chǔ)上開展行動關(guān)聯(lián)關(guān)系分析。下文主要是以聚合后的作戰(zhàn)行動為基本單元進(jìn)行研究。
共現(xiàn)分析指的是通過計(jì)算兩個事件(或元素)共同出現(xiàn)的頻率,來分析兩者之間潛在關(guān)聯(lián)度的方法[13-15]。行動共現(xiàn)分析,就是根據(jù)作戰(zhàn)行動的特征項(xiàng)共同出現(xiàn)在同一窗口單元的頻率來分析作戰(zhàn)行動中規(guī)律的一種方法,用來揭示作戰(zhàn)行動之間的關(guān)聯(lián)關(guān)系。一般來說,若某個數(shù)據(jù)集中,兩種行動頻繁地一起出現(xiàn)在時間窗口中,則認(rèn)為這兩種行動是相關(guān)聯(lián)的,若兩種行動共同出現(xiàn)得越頻繁,則這兩種行動關(guān)聯(lián)度越高,表示兩種行動之間的關(guān)系就越密切。
本文分析行動關(guān)系的主要目的是面向兵棋演習(xí)復(fù)盤評估階段對關(guān)鍵行動及其關(guān)系進(jìn)行描述,從而輔助導(dǎo)演部實(shí)施總結(jié)講評。利用行動之間的共現(xiàn)現(xiàn)象可以分析作戰(zhàn)行動之間關(guān)聯(lián)的緊密程度,從而挖掘重要的行動關(guān)系,在此基礎(chǔ)上進(jìn)行行動重要度排序,獲取某作戰(zhàn)階段的關(guān)鍵行動。
行動共現(xiàn)網(wǎng)絡(luò)(Action Co-occurrence Network,ACN)是一種描述作戰(zhàn)行動及其關(guān)系的復(fù)雜網(wǎng)絡(luò),由節(jié)點(diǎn)與無向邊構(gòu)成的圖結(jié)構(gòu)來表示。在這種復(fù)雜網(wǎng)絡(luò)中,任意兩個節(jié)點(diǎn)之間至多只有一條邊。一個行動共現(xiàn)網(wǎng)絡(luò)可以用一個三元組表示,即ACN=(N,E,W),其中:
N:節(jié)點(diǎn)集合N={n1,n2,…,nk},每個節(jié)點(diǎn)ni(i=1,2,…,k)對應(yīng)一個行動特征項(xiàng)ai,它是由具有相同動作要素的行動映射過來的,k為整個圖結(jié)構(gòu)的節(jié)點(diǎn)個數(shù);
E:無向邊的集合E={…,eij,…},每條無向邊eij(i,j=1,2,…,k,且i≠j)代表兩個鄰接節(jié)點(diǎn)ni和nj對應(yīng)的行動特征項(xiàng)ai和aj在行動共現(xiàn)窗口中存在的共現(xiàn)關(guān)系;
W:無向邊的權(quán)重集合W={…,wij,…},wij為無向邊eij對應(yīng)的權(quán)重,即行動特征項(xiàng)ai和aj在行動共現(xiàn)窗口共同出現(xiàn)的頻率。
構(gòu)建行動共現(xiàn)網(wǎng)絡(luò),主要包含以下幾個步驟:
1)初始化節(jié)點(diǎn)集合ND={},無向邊集合ED={}和無向邊權(quán)重集合WD={};
2)提取行動數(shù)據(jù)集D中行動特征項(xiàng)集合AVD={a1,a2,…,ak},每個行動特征項(xiàng)映射為行動共現(xiàn)網(wǎng)絡(luò)圖結(jié)構(gòu)中的一個節(jié)點(diǎn),得到節(jié)點(diǎn)集合ND={n1,n2,…,nk};
3)確定數(shù)據(jù)集D中窗口單元的跨度大小及數(shù)量;
4)從ND中任取兩個節(jié)點(diǎn)ni和nj,如果它們對應(yīng)的行動特征項(xiàng)同時出現(xiàn)在數(shù)據(jù)集D的任意窗口單元中,則兩個節(jié)點(diǎn)ni和nj之間添加一條無向邊eij,得到無向邊集合ED={…,eij,…};
5)計(jì)算行動共現(xiàn)網(wǎng)絡(luò)中各無向邊的權(quán)重,得到無向邊權(quán)重的集合WD={…,wij,…};
按照上述步驟,就可以得到由節(jié)點(diǎn)集ND={n1,n2,…,nk}、無向邊集ED={…,eij,…}和無向邊權(quán)重集WD={…,wij,…}所構(gòu)成的關(guān)于數(shù)據(jù)集D的行動共現(xiàn)網(wǎng)絡(luò)模型。
行動由若干單一子行動構(gòu)成,每個子行動包括多個要素{時間,行動發(fā)出地點(diǎn),行動作用地點(diǎn),動作,行動發(fā)出方,行動作用方,…}。行動數(shù)據(jù)集是若干個行動的有機(jī)結(jié)合,用以表達(dá)相應(yīng)的一個或者多個主題。這里分析行動關(guān)系時,以行動為基本單元。
行動數(shù)據(jù)集當(dāng)中會有與行動主題相關(guān)的大量行動,且與主題相關(guān)的行動會有較高的出現(xiàn)概率。假設(shè)行動數(shù)據(jù)集D上有主題集合T={t1,t2,…,tm}和與主題相關(guān)的行動集合A={a1,a2,…,ak},則在行動主題tm出現(xiàn)的情況下,行動ak出現(xiàn)的條件概率可表示為P(ak|tm)。當(dāng)P(ak|tm)>θ時(θ為主題相關(guān)度閾值),行動ak為行動類主題tm的相關(guān)行動。通常一個行動主題是與多個行動相關(guān)的,則有Am={ai|P(ai|tm)>θ,1≤i≤k},其中Am為行動主題tm相關(guān)的行動集合。
考慮到在實(shí)際行動建模過程中,很難準(zhǔn)確地界定數(shù)據(jù)集中所包含的行動主題及其涵蓋的窗口,因此,用一個窗口單元代替一個行動主題,一個行動數(shù)據(jù)集可以劃分為n個窗口單元,則行動主題t的先驗(yàn)概率為:P(t)=1/n。如果行動ai在該窗口單元出現(xiàn),則其后驗(yàn)概率為P(ai|t)=1。
行動共現(xiàn)率(Action Co-occurrence Rate)則是指兩個行動在同一窗口單元中共同出現(xiàn)的概率,行動ai和aj的行動共現(xiàn)率記為P(ai,aj),計(jì)算方法如式(1)所示。
(1)
其中,S(ai,aj)表示數(shù)據(jù)集中同時包含行動ai和aj的窗口單元數(shù),n(S)表示數(shù)據(jù)集中的窗口單元總數(shù)。式(1)也就是行動間關(guān)系權(quán)重的計(jì)算公式。
作戰(zhàn)行動之間的關(guān)系主要有層次關(guān)系、時序關(guān)系、因果關(guān)系、協(xié)同關(guān)系、跟隨關(guān)系、條件關(guān)系六類邏輯關(guān)系,這些關(guān)系通常交叉重疊,如協(xié)同關(guān)系、跟隨關(guān)系中隱含著時序關(guān)系。兩個行動之間可能存在多種關(guān)系。
1)層次關(guān)系(Hierarchical Relationship)
行動間普遍存在著層次關(guān)系,一個主題行動可以分解為若干個行動,一個行動又由若干個子行動構(gòu)成。若A代表主題行動,ai代表行動,行動A、ai之間的層次關(guān)系就可以表示為RG(A,ai)。例如,一次島嶼進(jìn)攻行動可能包含火力打擊行動、兵力突擊行動和信息作戰(zhàn)等主題行動,而主題行動火力打擊又包含空對地突擊、炮火準(zhǔn)備等具體行動,主題行動信息作戰(zhàn)又可以細(xì)分為電子戰(zhàn)、網(wǎng)絡(luò)戰(zhàn)等具體行動。
2)時序關(guān)系(Temporal Relationship)
一次兵棋演習(xí)通常模擬的是一次戰(zhàn)役過程,而一次戰(zhàn)役過程由一系列作戰(zhàn)行動組成。因而,作戰(zhàn)行動作為戰(zhàn)役的重要組成部分,往往不是孤立存在的,一定是圍繞作戰(zhàn)企圖或者作戰(zhàn)任務(wù)以一定順序關(guān)聯(lián)在一起。時序關(guān)系作為最主要的一種行動間的關(guān)系,表示作戰(zhàn)行動發(fā)生的先后順序,其串聯(lián)了戰(zhàn)役中行動的發(fā)展演變,描述了戰(zhàn)役開始、發(fā)展和結(jié)束的過程。時序關(guān)系一般依據(jù)時間線來識別,這樣有助于梳理行動過程和行動脈絡(luò)。行動ai、aj之間的時序關(guān)系可表示為RTS(ai,aj)。
3)協(xié)同關(guān)系(Coordinative Relationship)
協(xié)同關(guān)系指的是無隸屬關(guān)系的兩個以上部隊(duì)在共同遂行作戰(zhàn)任務(wù)時所構(gòu)成的相互協(xié)助、配合的關(guān)系[16],作戰(zhàn)協(xié)同表現(xiàn)為戰(zhàn)場上的多個力量為了達(dá)成同一作戰(zhàn)目的,相互之間協(xié)調(diào)一致的行動[9],目的是為了發(fā)揮整體作戰(zhàn)效能。因此,作戰(zhàn)行動之間也存在著協(xié)同關(guān)系,且通常會存在協(xié)同的主次關(guān)系,比如行動ai發(fā)生的同時,需要行動aj,甚至行動ak等配合行動,可以表示為RC(ai,aj)或者RC(ai,aj,ak,…)。如不同火力打擊行動之間經(jīng)常存在協(xié)同關(guān)系,海上作戰(zhàn)行動經(jīng)常需要空中作戰(zhàn)行動的配合等等。
4)跟隨關(guān)系(Follow Relationship)
在一定時間段內(nèi),行動ai發(fā)生后,行動aj可能跟隨行動ai之后發(fā)生,若行動aj跟隨行動ai發(fā)生的概率大于設(shè)定的閾值,則行動之間具有跟隨關(guān)系,行動ai可以稱為行動aj的前行動,行動aj為行動ai的后行動,兩者之間的關(guān)系可以表示為RF(ai,aj)。例如空中預(yù)警行動發(fā)生后大概率跟隨空中巡邏行動,防空攔截行動發(fā)生后大概率跟隨導(dǎo)彈發(fā)射或者空對地突擊行動。
5)因果關(guān)系(Causal Relationship)
兩個行動ai和aj,在一定時間和空間限制條件下,ai行動導(dǎo)致aj行動的發(fā)生,這種情況的概率大于給定的閾值,就稱行動ai和aj存在因果關(guān)系,表示為RCE(ai,aj)。行動的因果關(guān)系描述了兩個行動之間存在的因果聯(lián)系,有助于指揮員評估行動的后果以及預(yù)測戰(zhàn)役發(fā)展趨勢。因果關(guān)系中隱含著時序關(guān)系,先有原因,后有結(jié)果。一般情況下,因果關(guān)系大多存在對抗方作戰(zhàn)行動之間,比如一方開展進(jìn)攻行動,導(dǎo)致另一方相應(yīng)采取防御行動。
6)條件關(guān)系(Conditional Relation)
條件關(guān)系是指一個行動發(fā)生與否對另一行動的發(fā)生與否存在制約或依賴的關(guān)系。若行動ai發(fā)生,行動aj也必定發(fā)生,或者若行動ai不發(fā)生,行動aj也必定不會發(fā)生,則行動ai、aj之間的這種依賴關(guān)系,就是條件關(guān)系。比如取消導(dǎo)彈發(fā)射(或取消艦炮火力支援)行動的前提條件為前期有導(dǎo)彈發(fā)射行動或有艦炮火力支援行動。通常,條件關(guān)系可以分為充分條件、必要條件、充分必要條件三種,研究行動關(guān)系時不對條件關(guān)系詳細(xì)區(qū)分。
由于作戰(zhàn)行動處于一個復(fù)雜的戰(zhàn)爭網(wǎng)絡(luò)中,行動之間關(guān)系無法簡單用語義相似度、語言表現(xiàn)相似度等自然語言特征來表示,且行動之間的關(guān)系與時間聯(lián)系非常緊密,因此關(guān)聯(lián)行動的提取過程可以看成是行動之間關(guān)聯(lián)規(guī)則的提取過程,也就是通過利用關(guān)聯(lián)規(guī)則挖掘方法,在海量行動數(shù)據(jù)中發(fā)現(xiàn)重要的行動關(guān)系。
目前關(guān)聯(lián)規(guī)則挖掘算法有很多,Apriori算法是其中的經(jīng)典算法,但是該算法需要發(fā)現(xiàn)所有的頻繁項(xiàng)集,由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,從而找到數(shù)據(jù)間的相關(guān)性,所以會頻繁掃描數(shù)據(jù)庫,產(chǎn)生很高的I/O負(fù)載。本文主要是通過兩兩關(guān)聯(lián)行動的提取來實(shí)現(xiàn)行動關(guān)聯(lián)關(guān)系的挖掘,在計(jì)算過程中只考慮兩個作戰(zhàn)行動之間的二階關(guān)系,因此采用一個簡單高效的行動關(guān)系挖掘算法,通過減少數(shù)據(jù)庫掃描次數(shù)以壓縮掃描數(shù)據(jù)的規(guī)模,從而獲得更高的運(yùn)行效率。
給定行動關(guān)系挖掘空間S=(T,A,R,Res),具體含義如下:
1)S為一個作戰(zhàn)行動數(shù)據(jù)空間,即所選定的作戰(zhàn)行動數(shù)據(jù)集中包含的所有信息以及隱藏的信息;
2)T={t1,t2,…,tm}為S上的事務(wù)集合(Transaction Set),其中tm∈T為S上的一個事務(wù),按時間窗口劃分,tm即S上的一個時間窗口單元;
3)A={a1,a2,…,ai,…,aj,…,an}為S上行動特征項(xiàng)的集合,ai∈A為行動數(shù)據(jù)集中的一個行動特征項(xiàng),即候選行動的特征項(xiàng);
4)R={r11,r12,…,rij,…}為S中蘊(yùn)含的規(guī)則,也就是行動之間的關(guān)系,其中,rij=r(ai,aj);
5)Res={α,β}為S上的約束條件,α和β分別為設(shè)定的支持度與置信度。
則在行動空間S上的“時間窗口單元-行動特征項(xiàng)”矩陣可以表示為m×n的布爾矩陣TS。其中,行向量代表時間窗口單元,列向量代表行動特征項(xiàng)。行動關(guān)系挖掘算法如下:
1)生成A上的所有二階行動特征項(xiàng)組合(ai,aj), 其中,ai,aj∈A,i≠j;
2)輸入行動數(shù)據(jù)庫,構(gòu)造m×n的“時間窗口單元-行動特征項(xiàng)”矩陣,矩陣表示形式如下:
其中:
3)依次計(jì)算行動特征項(xiàng)組合(ai,aj)的支持度與置信度,當(dāng)該項(xiàng)組合的支持度與置信度分別大于給定閾值,則將該項(xiàng)組合加入R。其中,支持度指的是兩行動共同出現(xiàn)的概率,置信度則是指其中一個行動發(fā)生的條件下,兩行動共同出現(xiàn)的概率,取最低值。支持度Sup(ai,aj)、置信度Con(ai,aj)的計(jì)算方法分別如式(2)、式(3)所示。
Sup(ai,aj)=P(ai,aj)
(2)
(3)
4)得到行動關(guān)系集R,算法結(jié)束。
該行動關(guān)系挖掘算法不需要頻繁讀取數(shù)據(jù)庫,只需將所有行動數(shù)據(jù)讀取到內(nèi)存后,通過對布爾矩陣進(jìn)行運(yùn)算得到行動特征項(xiàng)組合的支持度與置信度并根據(jù)閾值進(jìn)行篩選,因此算法的時間復(fù)雜度大大降低。
由行動共現(xiàn)網(wǎng)絡(luò)模型的構(gòu)建可知,節(jié)點(diǎn)代表行動特征項(xiàng),邊代表行動特征項(xiàng)之間的關(guān)系。行動網(wǎng)絡(luò)無向圖則可表示為A=(aij)k×k的鄰接矩陣:
其中通過行動關(guān)聯(lián)分析,已經(jīng)可以獲取節(jié)點(diǎn)之間的關(guān)系及權(quán)重。PageRank算法的基本思想是,網(wǎng)絡(luò)中一個節(jié)點(diǎn)的重要性取決于指向它的其它節(jié)點(diǎn)的數(shù)量和重要性,也就是說,一個行動特征項(xiàng)的重要程度由與它有關(guān)的行動特征項(xiàng)數(shù)目和行動特征項(xiàng)對應(yīng)的重要程度決定。實(shí)際上,一個行動與其它行動關(guān)聯(lián)的緊密程度對其自身重要度也有影響。因此,將行動特征項(xiàng)與其它行動特征項(xiàng)之間關(guān)系權(quán)重考慮進(jìn)來改進(jìn)算法,改進(jìn)的迭代方程見式(4)。
(4)
式中:
PR(ni)為節(jié)點(diǎn)ni的PageRank值,表示行動特征項(xiàng)ai的權(quán)重;
k為網(wǎng)絡(luò)中的所有節(jié)點(diǎn)數(shù),即行動特征項(xiàng)數(shù)量;
α為阻尼系數(shù),通常選取經(jīng)驗(yàn)值0.85;
wij為節(jié)點(diǎn)ni和nj之間關(guān)系的權(quán)重;
M(ni)為節(jié)點(diǎn)ni的鏈入集合。
由于行動共現(xiàn)網(wǎng)絡(luò)是無向圖形式的,需要將無向圖轉(zhuǎn)換成有向圖,也就是具有行動共現(xiàn)關(guān)系的行動特征項(xiàng)之間的無向邊可以用兩個相反方向的有向邊替換。一般來說,每個節(jié)點(diǎn)在初始階段賦予相等的權(quán)值,通過算法多次迭代,直至權(quán)值收斂,最終可以確定每一個行動特征項(xiàng)的重要程度。最后設(shè)定PR閾值,大于閾值的節(jié)點(diǎn)對應(yīng)的行動特征項(xiàng)為關(guān)鍵行動。
以某次兵棋演習(xí)數(shù)據(jù)為基礎(chǔ),具體說明行動共現(xiàn)網(wǎng)絡(luò)的構(gòu)建過程。在兵棋演習(xí)數(shù)據(jù)基礎(chǔ)上選取經(jīng)行動聚合后的某一參演方的行動數(shù)據(jù)集作為實(shí)驗(yàn)數(shù)據(jù),該數(shù)據(jù)集時間跨度為12h,為了對比不同時間窗口單元對行動共現(xiàn)關(guān)系的影響,本文將窗口單元分別設(shè)定為2.0h、1.5h和1.0h,行動數(shù)據(jù)集在這三種情況下分別被劃分為6/8/12個時間窗口單元,分別構(gòu)建行動共現(xiàn)網(wǎng)絡(luò),發(fā)現(xiàn)三種窗口單元時該數(shù)據(jù)集中包含的行動特征項(xiàng)數(shù)量相同,共現(xiàn)行動出現(xiàn)頻次不同,具體如表1所示。
表1 行動特征項(xiàng)數(shù)量及行動特征項(xiàng)共現(xiàn)頻次
根據(jù)行動共現(xiàn)網(wǎng)絡(luò)構(gòu)建方法,可以得到節(jié)點(diǎn)數(shù)量和無向邊數(shù)量,發(fā)現(xiàn)它們分別對應(yīng)行動特征項(xiàng)數(shù)目和行動特征項(xiàng)共現(xiàn)的頻次。行動之間無向邊的權(quán)重也就是行動特征項(xiàng)的共現(xiàn)率。窗口單元不同時兵棋演習(xí)某階段行動共現(xiàn)網(wǎng)絡(luò)分別表示如圖2-4所示。
圖2 某階段的行動共現(xiàn)網(wǎng)絡(luò)(TWU=2.0h)
圖3 某階段的行動共現(xiàn)網(wǎng)絡(luò)(TWU=1.5h)
圖4 某階段的行動共現(xiàn)網(wǎng)絡(luò)(TWU=1.0h)
通過行動共現(xiàn)網(wǎng)絡(luò)構(gòu)建過程,可知行動共現(xiàn)網(wǎng)絡(luò)中無向邊的權(quán)重越大,說明對應(yīng)行動特征項(xiàng)之間的關(guān)系越密切??梢钥闯?處于行動共現(xiàn)網(wǎng)絡(luò)相對中心位置的行動與其它行動關(guān)聯(lián)較多,且關(guān)系權(quán)重較高(無向邊較粗),可以推測這些行動相對更為重要,后面重要度排序時對該推測進(jìn)行驗(yàn)證。
通過行動關(guān)系挖掘算法可以得到三種窗口單元行動共現(xiàn)網(wǎng)絡(luò)中關(guān)聯(lián)行動的支持度、置信度和其平均值,分別如圖5、如圖6所示。
圖5 關(guān)聯(lián)行動的支持度和置信度對比
圖6 行動共現(xiàn)網(wǎng)絡(luò)平均支持度和置信度
可以看出,當(dāng)時間窗口單元從2h縮小至1h,平均支持度和平均置信度先顯著下降,后趨勢減緩。平均置信度下降趨勢顯然沒有平均支持度下降趨勢明顯,說明時間窗口單元較小時,行動之間關(guān)系也相對更加緊密。因此,下文選取窗口單元為1h進(jìn)行關(guān)鍵行動提取。
通過行動重要度排序算法,可以得到行動網(wǎng)絡(luò)中各個節(jié)點(diǎn)權(quán)重,將節(jié)點(diǎn)權(quán)重值≥0.05的作戰(zhàn)行動作為關(guān)鍵行動,0.03≤節(jié)點(diǎn)權(quán)重值<0.05的作戰(zhàn)行動作為重要行動,其余為一般行動。行動重要度由高至低的排序(部分)如表2所示,其中,行動21和行動2為關(guān)鍵行動。
表2 TWU=1.0h的關(guān)鍵行動和重要行動
如圖7所示,將關(guān)鍵行動和重要行動篩選出來并可視化,節(jié)點(diǎn)的大小與節(jié)點(diǎn)的權(quán)重值成正比,且可以發(fā)現(xiàn)關(guān)鍵行動處于行動網(wǎng)絡(luò)圖相對中心的位置。
圖7 關(guān)鍵行動和重要行動網(wǎng)絡(luò)圖
本文通過構(gòu)建作戰(zhàn)行動共現(xiàn)網(wǎng)絡(luò)模型、研究行動關(guān)系提取方法,進(jìn)行行動關(guān)系的分析,并在此基礎(chǔ)上進(jìn)行關(guān)鍵作戰(zhàn)行動的提取研究。實(shí)驗(yàn)結(jié)果表明,針對兵棋演習(xí)作戰(zhàn)行動數(shù)據(jù)集,通過行動關(guān)系挖掘算法以及行動重要度排序算法,可以有效挖掘行動間的關(guān)系,實(shí)現(xiàn)關(guān)鍵行動的提取,為輔助作戰(zhàn)過程描述生成以及演習(xí)復(fù)盤評估提供支持。