劉嘉迪,郝建國,黃 健
(國防科技大學(xué) 智能科學(xué)學(xué)院,長沙 410073)
現(xiàn)代條件作戰(zhàn),面臨的將是高精度、遠(yuǎn)距離、高毀傷的火力戰(zhàn),裝備的受損將成倍增加,如何保持部隊持續(xù)作戰(zhàn)能力是取得勝利的關(guān)鍵.在第4 次中東戰(zhàn)爭中,以色列軍隊在開戰(zhàn)之初有過半的坦克受到損傷,但憑借其高效的戰(zhàn)場搶修能力,損傷的坦克在基本在一天內(nèi)就能恢復(fù)戰(zhàn)斗力,進(jìn)而獲得了戰(zhàn)爭主動權(quán).在海灣戰(zhàn)爭中,伊軍雖有近萬輛坦克和裝甲裝備,但無法進(jìn)行有效的戰(zhàn)場搶修,使其損壞率高達(dá)到66%,最終潰不成軍.因此,戰(zhàn)場已經(jīng)變成了交戰(zhàn)雙方戰(zhàn)場搶修能力的競爭場,而裝備戰(zhàn)場損傷等級評定又是戰(zhàn)場搶修的前提與基礎(chǔ)[1].
目前對裝備戰(zhàn)場損傷等級評估的研究方法包括貝葉斯推理[2-4]、案例推理[5]、神經(jīng)網(wǎng)絡(luò)[6,7]以及模糊集合理論[8,9]等.傳統(tǒng)的方法如貝葉斯推理、案例推理不能有效處理不確定性信息.而置信規(guī)則推理方法能有效地處理各種類型的數(shù)據(jù)信息,建立輸入和輸出之間的非線性模型.相比于神經(jīng)網(wǎng)絡(luò)、模糊理論等方法,置信規(guī)則庫是一個“白盒系統(tǒng)”,其推理過程與人類思考問題的方式類似,具有良好的可解釋性.此外,專家信息可參與也是此方法所特有的優(yōu)勢.
鑒于以上分析,本文建立一種BRB-ER 戰(zhàn)損等級評定模型,采用BRB 表示裝備戰(zhàn)損等級評定過程中所需專家知識和相關(guān)信息,利用局部粒子群算法對初始BRB 進(jìn)行優(yōu)化學(xué)習(xí),得到更新后的BRB 進(jìn)行推理的過程.最后,通過實例驗證了所提方法的有效性.
分析實際情況下的裝備戰(zhàn)場受損因素,主要包括:威脅因素、裝備因素、防護(hù)因素.對裝備戰(zhàn)損影響因素進(jìn)行細(xì)致分析,是設(shè)計置信規(guī)則庫前提屬性的重要基礎(chǔ).考慮到實際可以將3 種影響因素細(xì)化為[10]:
(1)威脅因素
①威脅程度(X1):威脅對目標(biāo)裝備的損傷均是通過損傷機(jī)理與目標(biāo)之間的相互作用實現(xiàn)的.戰(zhàn)場上威脅種類繁多,損傷機(jī)理各異,威脅的參數(shù)和指標(biāo)往往是不為人知的,可以通過專家主觀判斷,將威脅分為高、中、低3 級.
②炸點與裝備中心之間的距離(X2):炸點到裝備的距離是影響戰(zhàn)損結(jié)果的重要因素,距離越近,裝備受到的損傷越大,反之越小.
③炸點到裝備中心連線與地水平線夾角(X3):該參數(shù)與炸點到裝備中心的直線距離X2共同反映了裝備和炸點之間的地形環(huán)境,不同的X2、X3值則表示了不同的地形環(huán)境.
④彈著點相對于目標(biāo)裝備的位置(X4):以裝備中心線為軸,從裝備方向線順時針旋轉(zhuǎn)到裝備中心到炸點的方向線之間的夾角表示彈著點相對于目標(biāo)裝備的位置.
(2)裝備因素(X5)
裝備因素主要是指裝備的類型和名稱,不同種類和類型裝備的損傷機(jī)理往往是不同的,例如:坦克、履帶式步兵戰(zhàn)車等裝甲裝備,其自身防護(hù)能力較強(qiáng),戰(zhàn)時受到破片、沖擊波等損害威脅較低;而牽引火炮等輪式裝備,其防護(hù)能力較差,戰(zhàn)時易受到破片、沖擊波等威脅機(jī)理的作用發(fā)生破孔損傷;此外,電子類裝備諸如雷達(dá)、通信設(shè)備等除了會受到破片、沖擊波等傳統(tǒng)威脅機(jī)理的破壞外,還易受到電磁脈沖的影響.在此,我們可以通過編碼的方式來表示不同類型的裝備.
(3)防護(hù)因素(X6)
合理設(shè)置掩體對于降低裝備損傷程度具有重要作用,掩體防護(hù)主要包括半掩體、簡易掩體和永固掩體3 種.不同掩體的防護(hù)能力是不同的,可對其進(jìn)行歸一化.
根據(jù)戰(zhàn)損裝備的功能喪失程度和可修復(fù)性,結(jié)合維修保障資源配置情況,以及修復(fù)損傷裝備所需時間,我軍習(xí)慣上將裝備戰(zhàn)場損傷等級劃分為4 等6 級,如表1所示.
表1 戰(zhàn)場損傷等級劃分表
置信規(guī)則庫[11]是一類模型的總稱,這類模型在傳統(tǒng)IF-THEN 規(guī)則的基礎(chǔ)上引入了置信度和權(quán)重參數(shù),克服了傳統(tǒng)規(guī)則庫過于簡單絕對的問題.一個基本的BRB 模型描述如下,即:
其中,Rk(k=1,2,···,L)表示BRB 模型的第k條規(guī)則,L表示規(guī)則的數(shù)量,公式的第一部分為規(guī)則的前件,表達(dá)推理所用到的先驗知識,xi(i=1,2···,M)表示第i個前提屬性值,表示第k條規(guī)則的第i個前提屬性的參考值;公式的第二部分為規(guī)則的后件,表達(dá)推理的最終結(jié)論,Dj(j=1,2,···,N)表示第j個評價結(jié)果等級,βj,k表示在第k條規(guī)則中第j個評價等級的置信度;θk為第k條規(guī)則的權(quán)重,為第i個屬性的屬性權(quán)重.
BRB 中規(guī)則的推理包括兩步,首先是計算每條規(guī)則的激活權(quán)重,然后根據(jù)激活權(quán)重將規(guī)則進(jìn)行融合.
(1)激活權(quán)重計算
一般而言,當(dāng)輸入xi(i=1,2,···,M)為定量信息且為數(shù)值形式時,可以采用基于效用的方法計算其對應(yīng)的前提屬性參考值相似度即:
然后通過式(2)計算第k條規(guī)則的激活權(quán)重:
(2)ER 算法融合
通過ER 算法對BRB 中所有激活的規(guī)則進(jìn)行融合推理,ER 算法的解析公式如下:
選擇最高置信度對應(yīng)的輸出等級作為最終的戰(zhàn)損等級評估結(jié)果:
顯然,裝備發(fā)生戰(zhàn)斗損傷的3 種影響因素與裝備的受損程度(裝備的損傷等級)之間存在一種非線性映射關(guān)系.為此,建立如圖1所示的BRB-ER 戰(zhàn)損等級評定模型進(jìn)行推理.該模型主要包含兩個部分:第1 部分是置信規(guī)則專家系統(tǒng),主要進(jìn)行裝備戰(zhàn)損等級評定規(guī)則的建立;第2 部分是ER 算法,主要進(jìn)行規(guī)則的推理合成.當(dāng)通過對裝備戰(zhàn)損數(shù)據(jù)進(jìn)行預(yù)處理后,利用BRB-ER 模型的進(jìn)行推理融合,就能得到裝備戰(zhàn)損等級評估結(jié)果.
圖1 BRB-ER 戰(zhàn)損等級評定模型結(jié)構(gòu)
現(xiàn)有BRB 的構(gòu)建大多采用遍歷組合的方式,當(dāng)前提屬性個數(shù)較多時,就容易造成“組合爆炸”問題.如果構(gòu)建的置信規(guī)則庫共有M個前提屬性,并且第m個前提屬性有mi個參考值時,總共需要構(gòu)建條規(guī)則.例如,在裝備戰(zhàn)損等級評估問題中,共有6 個前提屬性信息,若每個前提屬性均有4 個參考值時,就有46=4096 條規(guī)則需要構(gòu)造.若再增加BRB 中前提屬性數(shù)量或參考值數(shù)量,則BRB 中的規(guī)則數(shù)會呈指數(shù)遞增的趨勢,系統(tǒng)的復(fù)雜度會大大增加,嚴(yán)重影響推理的效率和精度.鑒于此,本文在構(gòu)建裝備戰(zhàn)損等級評定置信規(guī)則庫時,并非使用傳統(tǒng)的遍歷組合的方式,而是利用Chang 等[12]提出的線性組合的方式,如圖2所示,線性組合的方式可以克服傳統(tǒng)置信規(guī)則庫“組合爆炸”的問題.
圖2 構(gòu)建規(guī)則庫的不同組合方式
在構(gòu)造初始BRB 時,系統(tǒng)的參數(shù)通常由人為隨機(jī)給定,造成主觀性過大,其戰(zhàn)損評估的準(zhǔn)確度可能會被降低.因此,本文提出了一種基于局部粒子群的BRB參數(shù)優(yōu)化算法來提高戰(zhàn)損等級評定精度.
為了選取置信規(guī)則庫的最優(yōu)參數(shù),Yang 提出了對置信規(guī)則庫參數(shù)優(yōu)化的基本思想[11].其優(yōu)化學(xué)習(xí)模型具體結(jié)構(gòu)見圖3.
圖3 BRB 系統(tǒng)參數(shù)優(yōu)化模型
對于BRB 的參數(shù)優(yōu)化模型,其符號表達(dá)式如下:
其中,V表示由組成的參數(shù)向量,ξ(V)表示推理誤差;A(V)表示等式約束條件;B(P)表示不等式約束條件.
圖3 中,xm為輸入信息,ym為實際系統(tǒng)的輸出,為由置信規(guī)則庫得到的模擬輸出,V為由構(gòu)成的參數(shù)向量,ξ(V)為推理誤差,A(V)表示等式約束條件,B(V)表示不等式約束條件.其次,優(yōu)化目標(biāo)為使模擬輸出與真實輸出之間的誤差盡可能小,則對于第i組輸入數(shù)據(jù),若評定結(jié)果與實際相同,誤差計為“0”;若不相同,則誤差為“1”,即:
則系統(tǒng)的推理誤差可用均方誤差(mean square error,MSE)表示,即:
BRB 優(yōu)化模型中各參數(shù)需滿足如下約束條件:
(1)標(biāo)準(zhǔn)化前提屬性參考值,對于第i個屬性的第k個參考值必須滿足如下約束:
其中,lbi和ubi分別表示訓(xùn)練數(shù)據(jù)中第i個屬性的最小值和最大值.
(2)任意一條規(guī)則中每個評價結(jié)果上的置信度需滿足:
(3)規(guī)則權(quán)重的取值需要歸一化,即:
在優(yōu)化過程中,首先給定初始參數(shù),根據(jù)優(yōu)化模型,利用訓(xùn)練數(shù)據(jù)對模型進(jìn)行訓(xùn)練.目前已有不少優(yōu)化方法被提出,諸如Matlab 中的FMINCON 函數(shù)[13]以及群智能算法,包括差分進(jìn)化算法[14]、布谷鳥算法[15]、粒子群算法[16]等.粒子群算法需要調(diào)整的參數(shù)少,原理簡單,容易實現(xiàn),本文通過局部粒子群算法求解BRB參數(shù)的最優(yōu)值.
粒子群算法(particle swarm optimization,PSO)的基本概念源于對鳥群覓食行為的研究.PSO 是一種基于迭代的優(yōu)化算法,每個粒子都有一個由被目標(biāo)函數(shù)決定的適應(yīng)度值.在搜索開始前,在解集范圍內(nèi)隨機(jī)初始化每個粒子的速度和位置,然后在每次迭代搜索中,粒子根據(jù)個體極值pbest和全局極值gbest來不斷更新自身速度和位置,最后通過不斷迭代找到問題的最優(yōu)解.粒子群的運(yùn)動函數(shù)如下所示[17]:
其中,ω是保持原來速度的系數(shù),稱為慣性權(quán)重,c1和c2為學(xué)習(xí)因子,r1和r2為[0,1]之間的服從隨機(jī)分布的兩個變量.
為克服粒子群算法易早熟收斂和陷入局部最優(yōu)解等問題,改變粒子速度更新公式,即將影響粒子速度更新的全局極值gbest改為鄰域內(nèi)粒子的最優(yōu)值lbest,這樣就得到了局部粒子群算法(local particle swarm optimization,LPSO).LPSO 有多種鄰域選擇方式,本文按照環(huán)形編號的方式取粒子的領(lǐng)域,如圖4所示,每個粒子的領(lǐng)域?qū)㈦S著迭代次數(shù)的增加而擴(kuò)大,最終擴(kuò)展到整個粒子群.LPSO 的優(yōu)化流程如圖5所示,其算法步驟如下.
圖4 按環(huán)形編號取粒子鄰域
圖5 局部粒子群算法優(yōu)化流程圖
步驟1.設(shè)置算法參數(shù).對BRB 需要優(yōu)化的參數(shù)V=[θk,δi,βj,k]T進(jìn)行編碼并設(shè)置約束條件,設(shè)置算法種群數(shù)量n、最大迭代次數(shù)Gmax、學(xué)習(xí)因子c1和c2.
步驟2.初始化粒子群.在式(9)-式(11)的約束條件范圍內(nèi),隨機(jī)初始化種群中各粒子的速度和位置.
步驟3.計算適應(yīng)度值.對于每個粒子,通過適應(yīng)度函數(shù)來計算適應(yīng)度值,并記錄個體最優(yōu)解pbest和其鄰域所記錄的最優(yōu)解lbest.
步驟4.更新粒子速度和位置.將標(biāo)準(zhǔn)PSO 更新速度和位置的公式中的gbest改為LPSO 的lbest.
步驟5.判斷終止條件.當(dāng)達(dá)到了預(yù)設(shè)的最大迭代次數(shù)Gmax,則終止迭代,輸出此時的領(lǐng)域最優(yōu)解lbest,即可得到優(yōu)化后的BRB 參數(shù);否則返回步驟3 繼續(xù)搜索.
如上文所述,裝備戰(zhàn)損等級評估的過程受6 個因素的影響,所以本文建立的BRB-ER 評估模型只考慮此6 類因素.由于目前的裝備戰(zhàn)損數(shù)據(jù)有限,僅以122 榴彈炮、152 加農(nóng)榴彈炮和130 加農(nóng)炮為例,建立戰(zhàn)損等級評定置信規(guī)則庫.對戰(zhàn)場損傷模擬試驗數(shù)據(jù)進(jìn)行整理,篩選出120 組訓(xùn)練樣本,根據(jù)各威脅對裝備的毀傷作用效果,組織有關(guān)專家對裝備的損傷情況進(jìn)行了評分,具體評分標(biāo)準(zhǔn)如表2 所列.
表2 裝備損傷程度評分表
根據(jù)戰(zhàn)場損傷等級劃分標(biāo)準(zhǔn),可采用有向無環(huán)圖來構(gòu)建裝備戰(zhàn)損等級評定的眾倉決策模型,如圖6所示.可以看出,需要建立5 個BRB 對裝備戰(zhàn)損數(shù)據(jù)進(jìn)行分類,每條規(guī)則僅設(shè)計兩個評價等級,其推理結(jié)果只做出是與否的置信決策.每個BRB 在訓(xùn)練的過程中互不影響,可以采用并行的策略同時進(jìn)行訓(xùn)練.實驗環(huán)境為:Intel(R)Core(TM)UHD i7-8550U CPU @ 1.80 GHz處理器、8 GB 內(nèi)存,Windows 10 操作系統(tǒng).程序均在Matlab 2020a 中實現(xiàn).
圖6 裝備戰(zhàn)損等級評定眾倉決策模型圖
隨機(jī)選擇100 組樣本作為訓(xùn)練數(shù)據(jù),設(shè)每個BRB的規(guī)則數(shù)均為4 條,在初始權(quán)重都相同的情況下,等間隔輸入規(guī)則參考值,評價結(jié)果對應(yīng)的置信度由專家給定,得到初始置信規(guī)則庫規(guī)則.因篇幅原因,初始置信規(guī)則庫在此不羅列.利用本文提到的基于LPSO 優(yōu)化方法,選擇粒子群種群個數(shù)為100,最大迭代次數(shù)為50,對參數(shù)進(jìn)行訓(xùn)練后,得到優(yōu)化后5 個BRB 為表3 至表7所示.
表3 置信規(guī)則庫1
表4 置信規(guī)則庫2
表5 置信規(guī)則庫3
表6 置信規(guī)則庫4
表7 置信規(guī)則庫5
將剩余的20 組戰(zhàn)損試驗數(shù)據(jù)作為測試集,利用本文提到的基于LPSO 優(yōu)化方法,在相同的約束條件下與基于標(biāo)準(zhǔn)PSO 參數(shù)優(yōu)化方法作為比較對象,分別對初始BRB 進(jìn)行參數(shù)優(yōu)化訓(xùn)練,得到測試結(jié)果如表8.
表8 評估結(jié)果對比(%)
根據(jù)結(jié)果可知,初始BRB 模型的評定準(zhǔn)確度有所欠缺,經(jīng)過PSO 優(yōu)化后的BRB 模型將評定結(jié)果的總體準(zhǔn)確度提高到了90%.LPSO-BRB 模型則是經(jīng)過LPSO 算法優(yōu)化,得到了準(zhǔn)確度非常高的結(jié)果,達(dá)到了96.7%,充分說明了所提戰(zhàn)損評定模型的有效性.
為體現(xiàn)本文方法有效性,同樣針對戰(zhàn)損評定問題,利用相同的裝備戰(zhàn)損數(shù)據(jù)將本文方法和BP 神經(jīng)網(wǎng)絡(luò)方法以及支持向量機(jī)方法進(jìn)行對比.首先建立3 層BP 神經(jīng)網(wǎng)絡(luò),輸入層包含6 個節(jié)點,每個節(jié)點表示一種戰(zhàn)損影響因素,隱含層節(jié)點數(shù)則根據(jù)經(jīng)驗公式選取為13,輸出層則為1 個節(jié)點,表示裝備損傷程度的評估值,根據(jù)評估值進(jìn)而確定戰(zhàn)損等級,如圖7所示.將支持向量機(jī)應(yīng)用于多分類問題,一般使用LibSVM 工具包[18]進(jìn)行解決,本文設(shè)置核函數(shù)為徑向基函數(shù)(RBF 核函數(shù)),使用網(wǎng)格搜索法確定參數(shù)c=11.3137 和g=0.125.
圖7 裝備戰(zhàn)損等級評定神經(jīng)網(wǎng)絡(luò)模型
3 種方法針對測試集的戰(zhàn)損評定結(jié)果如圖8-圖10所示,從圖中可以看出BP 神經(jīng)網(wǎng)絡(luò)方法有3 個測試數(shù)據(jù)分類錯誤,評定準(zhǔn)確率為85%;本文方法與支持向量機(jī)均只有一個測試數(shù)據(jù)分類錯誤,評定準(zhǔn)確率為95%.
圖8 優(yōu)化的BRB 的評定結(jié)果
圖9 BP 神經(jīng)網(wǎng)絡(luò)的評定結(jié)果
圖10 SVM的評定結(jié)果
記錄3 種方法對測試數(shù)據(jù)的累積誤差和MSE,分別見圖11 和圖12.從圖中可以看出,優(yōu)化后的BRB 評定的誤差要明顯低于BP 神經(jīng)網(wǎng)絡(luò)和SVM,可見在樣本較少的情況下,本文所提方法的戰(zhàn)損等級評定性能更好,具有更高的推理精度.
圖11 不同方法的累積誤差對比
圖12 不同方法的MSE 對比
本文基于多源信息處理過程中的數(shù)據(jù)融合以及不確定性推理方法,提出了一種新的裝備戰(zhàn)損等級評定方法.該方法綜合利用裝備戰(zhàn)損數(shù)據(jù)和專家知識建立置信規(guī)則庫,再通過證據(jù)推理算法對裝備戰(zhàn)損等級進(jìn)行分類評估.針對初始置信規(guī)則庫推理精度差的問題,利用局部粒子群算法對模型參數(shù)進(jìn)行優(yōu)化,并建立二擇眾倉決策模型,以此改進(jìn)置信規(guī)則庫推理性能.最后,根據(jù)某戰(zhàn)損試驗對該方法的有效性進(jìn)行驗證.研究結(jié)果表明,本文方法能夠有效融合戰(zhàn)損數(shù)據(jù)的定量信息和專家經(jīng)驗的定性知識,且無需大量統(tǒng)計數(shù)據(jù)也能夠?qū)ρb備戰(zhàn)損等級進(jìn)行準(zhǔn)確評估.因此,本文方法是一種有效的裝備戰(zhàn)損等級評定方法,具有較大的應(yīng)用價值和較強(qiáng)的適用性,進(jìn)而為戰(zhàn)場態(tài)勢分析和指揮決策提供可靠依據(jù).