李 聰, 李俊杰, 關(guān)愛杰
(中國人民解放軍96901部隊,北京 100000)
作戰(zhàn)方案是圍繞特定作戰(zhàn)目標(biāo),關(guān)于兵力部署、裝備配置、作戰(zhàn)階段和行動協(xié)同等要素的一種形式化、規(guī)范化描述,完善可行的作戰(zhàn)方案必須依賴于指揮人員和參謀人員對于戰(zhàn)場態(tài)勢和作戰(zhàn)進程的精準(zhǔn)把握、預(yù)期與設(shè)計,這直接決定了軍事行動的最終結(jié)果。作戰(zhàn)方案評估則是一種可衡量方案合理性、有效性,即方案潛在作戰(zhàn)效能的定量化技術(shù),它能夠科學(xué)評估作戰(zhàn)行動與打贏戰(zhàn)爭的總目標(biāo)之間的系統(tǒng)性差距,對量化考核、方案優(yōu)選、指揮決策和作戰(zhàn)設(shè)計等現(xiàn)實問題具有重要的指導(dǎo)價值。
作戰(zhàn)方案評估理論經(jīng)過長期發(fā)展,已形成了一套龐大的方法體系[1],具體門類上,包括傳統(tǒng)的專家評估法、數(shù)據(jù)解析法,以及新近出現(xiàn)的作戰(zhàn)仿真法、智能分析法等。然而,除了專家評估法外,其余方法在數(shù)據(jù)采集、系統(tǒng)建模、存儲計算、適用領(lǐng)域等方面均有不同程度的限制,應(yīng)用面較窄,專家評估法由于在原理和實現(xiàn)上的有效性和便捷性,目前得到了廣泛應(yīng)用。專家評估法中,經(jīng)典的層次分析法[2]、模糊綜合評價法[3]和灰色白化權(quán)聚類法[4]等仍是當(dāng)前作戰(zhàn)方案評估的主流方法,這些方法均屬于多屬性決策理論[5]框架,關(guān)鍵步驟包括:構(gòu)建與量化評估指標(biāo);為評估指標(biāo)賦權(quán)重;利用指標(biāo)值與權(quán)重綜合計算評估值。其中,為評估指標(biāo)賦權(quán)重作為核心步驟,所賦權(quán)重直接反映了指標(biāo)間的相對重要關(guān)系,能顯著影響評估結(jié)果及結(jié)果的可信度?,F(xiàn)階段廣泛使用的賦權(quán)法包括主觀賦權(quán)法和客觀賦權(quán)法[6]。
然而,這些賦權(quán)法都存在固有的局限。首先,主觀賦權(quán)法主要依賴評估者的主觀判斷與知識經(jīng)驗,雖然能夠很好地反映評估者的個性化決策傾向與意圖偏好,但隨意性較大,具有模糊性的主觀經(jīng)驗最多可決定指標(biāo)的大致重要性排序,卻無法滿足指標(biāo)重要性的精確量化需求,且隨著指標(biāo)數(shù)量增多,評估者賦權(quán)成本將顯著增加;其次,客觀賦權(quán)法基于給定樣本集中指標(biāo)的內(nèi)在統(tǒng)計特征,權(quán)重信息完全來自于樣本數(shù)據(jù)的客觀貢獻,本質(zhì)上規(guī)避了主觀賦權(quán)法的隨意性和模糊性,卻無法反映評估者的個性化意圖,導(dǎo)致無法融入合理的經(jīng)驗知識規(guī)則,而且樣本集通常較為有限,指標(biāo)統(tǒng)計特征難以避免各種抽樣偏差。因此,需要一種能夠恰當(dāng)融合主客觀兩方面信息、進行主客觀綜合賦權(quán)的評估模型,以便在保有上述兩種賦權(quán)法優(yōu)點的同時,克服采用單一方法的局限,即本文的研究動機。
近年來,貝葉斯網(wǎng)絡(luò)[7-8]這一技術(shù)在評估領(lǐng)域取得了廣泛應(yīng)用,如效能評估[9]、威脅評估[10]、風(fēng)險評估[11]和毀傷評估[12]等。貝葉斯網(wǎng)絡(luò)能夠定量描述隨機事件之間的因果關(guān)聯(lián)關(guān)系,在處理小樣本數(shù)據(jù)和不確定數(shù)據(jù)時具有顯著優(yōu)勢。本文就是基于貝葉斯網(wǎng)絡(luò)構(gòu)建作戰(zhàn)方案評估模型。
本文模型工作于有監(jiān)督模式,需要一定量滿足特定規(guī)則的樣本集與樣本標(biāo)簽,以驅(qū)動模型的潛在權(quán)重自適應(yīng)分配過程,從而以加權(quán)和的方式推斷出新方案的評估結(jié)果。
首先,根據(jù)作戰(zhàn)目標(biāo)和評估目的,通過文獻綜合或?qū)<易稍兊确绞浇⒁惶紫到y(tǒng)的、完備的、可量化的作戰(zhàn)方案評估指標(biāo)集合,設(shè)集合中指標(biāo)數(shù)為D。其次,針對特定作戰(zhàn)方案,利用一次或多次作戰(zhàn)演練或作戰(zhàn)仿真的結(jié)果數(shù)據(jù)量化指標(biāo)集合,綜合形成一個D維的指標(biāo)樣本向量x。之后,針對M(M>1)套不同的作戰(zhàn)方案獨立重復(fù)前述量化過程可獲得一個M×D維的樣本集矩陣X。樣本集中任意指標(biāo)值x*需經(jīng)過規(guī)范化處理,統(tǒng)一為效益型指標(biāo),并映射至相同的取值區(qū)間,即?x*∈[L,U]。最后,作戰(zhàn)專家依據(jù)實際戰(zhàn)果并結(jié)合個人作戰(zhàn)知識經(jīng)驗,將樣本集X中每個樣本標(biāo)注為“達(dá)標(biāo)”或“未達(dá)標(biāo)”,表示樣本作戰(zhàn)方案所對應(yīng)的軍事行動達(dá)成或未達(dá)成預(yù)定作戰(zhàn)目標(biāo),且“達(dá)標(biāo)”和“未達(dá)標(biāo)”各自對應(yīng)的樣本數(shù)不能小于1。根據(jù)樣本標(biāo)簽,將樣本集X劃分為達(dá)標(biāo)樣本子集XP和未達(dá)標(biāo)樣本子集XN。
本文模型在概率語義層面描述了評估指標(biāo)權(quán)重以及評估結(jié)果等產(chǎn)生過程,包含4個步驟。
1) 建立指標(biāo)潛在權(quán)重的先驗分布。權(quán)重向量p的先驗分布指定為
p~Dirichlet(kα)
(1)
式中:Dirichlet(kα)是參數(shù)為kα的狄利克萊分布,可保證p的分量非負(fù),且和為1,符合權(quán)重的定義;參數(shù)α為一個D維向量,每個分量代表權(quán)重的相對重要程度,由評估人員根據(jù)主觀經(jīng)驗確定,若無額外參考信息,一般可設(shè)α的每個分量相同;實數(shù)k代表先驗約束的強度因子,k值越大,權(quán)重受先驗分布的影響也越大,適當(dāng)調(diào)整k值可平抑小樣本時抽樣偏差的影響。
2) 建立達(dá)標(biāo)樣本子集XP和未達(dá)標(biāo)樣本子集XN的評估結(jié)果產(chǎn)生過程。對?xp∈XP,?xn∈XN,令
(2)
式中:yp和yn分別為樣本xp和xn的評估值;符號⊙代表向量內(nèi)積運算。這樣,樣本評估值實際由指標(biāo)加權(quán)和給出。
3) 建立新樣本xpre(對應(yīng)新作戰(zhàn)方案的指標(biāo)向量)的評估結(jié)果產(chǎn)生過程,其評估值計算遵循相同的加權(quán)和過程,即
ypre=xpre⊙p
(3)
式中,ypre代表新樣本xpre的評估值。新樣本一般也通過作戰(zhàn)演練或作戰(zhàn)仿真的方式獲取。
4) 建立樣本特征優(yōu)化過程,需要基于XP和XN兩類評估結(jié)果數(shù)據(jù),建立類間距特征優(yōu)化過程和類內(nèi)聚特征優(yōu)化過程。設(shè)XP和XN中樣本數(shù)分別為P和N,定義類間距特征Ssep和類內(nèi)聚特征Ccoh為
Ssep=median({ypi|i=1,…,P})-
median({ynj|j=1,…,N})
(4)
Ccoh=max(mad({ypi|i=1,…,P}),
mad({ynj|j=1,…,N}))
(5)
式中:median為中位數(shù)函數(shù);mad為中位數(shù)絕對偏差函數(shù),定義為
mad({z})=median({|z-median({z})|})。
(6)
類間距特征衡量兩類樣本子集中心位置的距離,類內(nèi)聚特征衡量兩類樣本的集中程度。而median和mad作為樣本中心位置和集中度的魯棒統(tǒng)計量,可以起到抑制樣本異常點的作用。
建立樣本特征優(yōu)化過程的目的在于給出潛在權(quán)重應(yīng)滿足的約束條件,因為對于加權(quán)和方法,一旦給定方案樣本,則其評估結(jié)果由權(quán)重唯一決定,而樣本標(biāo)簽其實隱含了權(quán)重信息,最優(yōu)的權(quán)重應(yīng)該使兩類樣本最大程度分離,且樣本內(nèi)最大程度集中?;谶@種思想,樣本特征優(yōu)化過程描述為
(7)
式中:Laplace為拉普拉斯分布,即雙指數(shù)分布;O1和O2分別是以類間距特征Ssep和類內(nèi)聚特征Ccoh為位置參數(shù)、以δ1和δ2為尺度參數(shù)的兩個拉普拉斯分布的抽樣值,分別代表Ssep和Ccoh的優(yōu)化目標(biāo)。通過設(shè)置合理的O1和O2值,可同時使類間距特征Ssep最大化、類內(nèi)聚特征Ccoh最小化。一般地,可設(shè)置O1=U-L,O2=0,這樣,從最大似然的觀點來看,類間距將向最大值U-L逼近,同時,類內(nèi)聚將向最小值0逼近,導(dǎo)致達(dá)標(biāo)樣本子集XP和未達(dá)標(biāo)樣本子集XN分別向高評估值和低評估值處聚攏,從而使兩類樣本盡量分離且樣本內(nèi)盡量集中,這是通過權(quán)重p的自適應(yīng)分配過程實現(xiàn)的。
圖1為本文模型的貝葉斯網(wǎng)絡(luò)形式,圓形節(jié)點代表隨機變量,節(jié)點間有向邊代表變量間的概率依賴關(guān)系,模型參數(shù)也通過有向邊與隨機變量相連,方框表示網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)制。
圖1 模型的貝葉斯網(wǎng)絡(luò)形式Fig.1 Bayesian network form of the model
模型推斷的目的是解算新樣本評估值ypre的后驗分布,即p(ypre|XP,XN,O1,O2),這需要將樣本X、樣本標(biāo)簽和新樣本xpre,以及必要的模型參數(shù)與隨機變量O1和O2的觀測值代入作戰(zhàn)方案評估模型,啟動對模型的推斷過程。不過,由于隨機變量ypre的后驗分布不存在閉式解,所以采取隨機抽樣的方式,通過足量的樣本來逼近真實的后驗分布。隨著抽樣過程趨近收斂,潛在權(quán)重也將根據(jù)模型的輸入信息自適應(yīng)收斂至恰當(dāng)?shù)暮篁灨怕史植?,基于此,得到新樣本評估結(jié)果在區(qū)間[L,U]上的數(shù)值分布,此分布的期望值就表征新方案評估結(jié)果,而分布的標(biāo)準(zhǔn)差揭示評估結(jié)果的不確定性,即結(jié)果置信度的高低,標(biāo)準(zhǔn)差越大,代表評估結(jié)果越分散,結(jié)果置信度越低。單方案評估時,期望值越高、標(biāo)準(zhǔn)差越小,方案效能越高;多方案優(yōu)選時,在期望結(jié)果類似的情況下,優(yōu)選標(biāo)準(zhǔn)差最小的方案。
本文實驗以紅藍(lán)對抗作戰(zhàn)方案評估為例,簡要起見,從作戰(zhàn)力量、作戰(zhàn)保障、指揮控制和作戰(zhàn)效果等方面梳理出圖2所示的指標(biāo)集合,共8項,即D=8。之后,通過調(diào)整力量編成、指揮協(xié)同、打擊目標(biāo)、行動流程和保障方式等因素,擬制7套不同的作戰(zhàn)方案,將這些方案作為某作戰(zhàn)仿真系統(tǒng)的想定輸入,從仿真結(jié)果中采集數(shù)據(jù)并量化指標(biāo)集合,形成一個7×8維的樣本集矩陣X,包括表1中方案1~7的所有指標(biāo)數(shù)據(jù),且新方案的指標(biāo)數(shù)據(jù)也通過仿真獲得。X中任意指標(biāo)值均經(jīng)過規(guī)范化處理,統(tǒng)一為效益型指標(biāo),且映射至相同的取值區(qū)間[0,100],即L=0,U=100。同時,表1中也包含了樣本標(biāo)注結(jié)果,根據(jù)樣本標(biāo)簽,達(dá)標(biāo)樣本子集XP包括方案1~3的指標(biāo)數(shù)據(jù),未達(dá)標(biāo)樣本子集XN包括方案4~7的指標(biāo)數(shù)據(jù)。
后續(xù)實驗中,將表1的方案1~7樣本和新方案樣本代入模型,并設(shè)置模型參數(shù)k=2,α=[1,1,1,1,1,1,1,1],δ1=1,δ2=2,以及變量觀測值O1=U-L=100,O2=0。本文使用Stan概率建模工具實現(xiàn)模型的概率語義,借助其內(nèi)置的NUTS(no-U-turn sampler)方法[13]實現(xiàn)對模型的抽樣過程。
圖2 評估指標(biāo)體系Fig.2 Evaluation index system for operation scheme
表 1 樣本數(shù)據(jù)Table 1 The sample data
新作戰(zhàn)方案評估值ypre的后驗分布樣本在區(qū)間[0,100]上的概率分布情況見圖3。通過進一步計算得出,方案評估值期望為77.2,處于中等偏上區(qū)間,表明方案總體上具備可行性,且標(biāo)準(zhǔn)差為3.2,值較小,從而分布較為集中,表示方案評估結(jié)果的置信度較高,可確切地作為軍事行動的決策依據(jù)。同時,對權(quán)重向量p也進行后驗抽樣,將每個分量的后驗分布樣本,即每項評估指標(biāo)的權(quán)重分布,以盒圖形式繪制為圖4。從圖中易見,指標(biāo)A1~A6的權(quán)重較小,而指標(biāo)A7和A8的權(quán)重明顯偏高,表明方案評估結(jié)果很大程度上由指標(biāo)A7和A8決定,其余指標(biāo)的作用較弱。從表1中也可以發(fā)現(xiàn),達(dá)標(biāo)樣本的這兩項指標(biāo)總體上優(yōu)于未達(dá)標(biāo)樣本,而其他指標(biāo)值在兩類樣本中分布相對混雜,無明顯規(guī)律,這從側(cè)面揭示出本文模型潛在權(quán)重自適應(yīng)分配過程的有效性與合理性。
圖3 新方案評估值的分布Fig.3 Distribution of evaluation value of the new scheme
圖4 指標(biāo)權(quán)重的分布Fig.4 Distribution of the index weights
本文提出了一種基于潛在權(quán)重自適應(yīng)分配的作戰(zhàn)方案評估模型,其潛在權(quán)重自適應(yīng)分配過程根源于主觀的樣本標(biāo)簽和客觀的樣本指標(biāo),本質(zhì)是一種基于主客觀綜合賦權(quán)的評估方法,可克服單一采用主觀或客觀賦權(quán)法的固有局限。同時,給出的方案評估結(jié)果不是固定值,而是一個隨機變量,這樣,除了期望值可直接作為評估結(jié)果外,其分布標(biāo)準(zhǔn)差還能揭示評估結(jié)果的分散程度,間接表明結(jié)果的置信度。特別地,本文模型基于貝葉斯網(wǎng)絡(luò)構(gòu)建,故具有貝葉斯方法在小樣本上的使用優(yōu)勢,即在給定恰當(dāng)?shù)南闰炐畔⒑?,用少量樣本就可有效?xùn)練模型,顯著降低了數(shù)據(jù)采集成本,符合實際運用需求。模型為作戰(zhàn)方案評估提供了新的思路與方法,未來工作將致力于研究模型的變分推斷方法。