張 佳,劉清平,辛 斌
(北京理工大學,北京 100081)
態(tài)勢理解在指揮控制與決策、智慧交通、網(wǎng)絡安全等諸多領域具有廣泛用途,最早用于研究飛行員對當前飛行狀態(tài)的認知和理解,被定義為飛行員對某一關(guān)注區(qū)域的理解和認識。美國國防部實驗室聯(lián)席理事會將態(tài)勢評估描述為:態(tài)勢評估是基于戰(zhàn)場初級數(shù)據(jù)的融合,將觀測到的敵方兵力構(gòu)成、分布及戰(zhàn)斗活動等與戰(zhàn)場環(huán)境、敵作戰(zhàn)意圖和動機等有效聯(lián)系在一起,估算敵軍作戰(zhàn)模式,預測作戰(zhàn)意圖,在關(guān)鍵作戰(zhàn)時刻作出有效預測,最終形成一張反映敵我雙方作戰(zhàn)情形的綜合態(tài)勢圖,為指揮員高效決策提供強有力的支持。
指揮決策的基本過程是OODA 循環(huán)模型,其中,觀察態(tài)勢和判斷理解即態(tài)勢理解。全面、高水平的態(tài)勢理解是幫助決策者實現(xiàn)高效決策的前提。在有人/無人平臺協(xié)同作戰(zhàn)過程中,快速準確的態(tài)勢理解能為提升指揮決策的速度和精準度提供智能輔助決策支持,實現(xiàn)人機高效協(xié)同作戰(zhàn)。同時,在無人系統(tǒng)集群作戰(zhàn)過程中,態(tài)勢理解能大幅提高無人系統(tǒng)的自主性和智能化水平,為指揮信息系統(tǒng)的設計、作戰(zhàn)計劃的制定提供參考依據(jù)。
早期的態(tài)勢理解應用產(chǎn)生式規(guī)則,但無法解決診斷性推理問題。文獻[9]用貝葉斯網(wǎng)絡建立態(tài)勢理解的計算推理模型,利用變量之間的條件獨立關(guān)系,減少了表示一組隨機變量的聯(lián)合概率分布所需的參數(shù)。文獻[10]利用模糊推理方法建立態(tài)勢理解計算模型,建立和設計規(guī)則庫和模糊推理方法。文獻[11]基于案例推理方法,將多個軍事實體在不同層次上與案例庫進行比對,構(gòu)造對戰(zhàn)場態(tài)勢分析、推理的模型。文獻[12]利用D-S 合成法則將態(tài)勢的影響進行綜合,得到態(tài)勢理解的結(jié)果,但該方法需保證態(tài)勢要素獨立。文獻[13]用神經(jīng)網(wǎng)絡建立態(tài)勢理解計算模型,解決了模糊推理方法中知識表示和推理方法不一致、時空推理能力不足等問題,適用于具有高度非線性、不確定性、涌現(xiàn)性等復雜性特征的聯(lián)合作戰(zhàn)體系。
無人系統(tǒng)作戰(zhàn)具有實時對抗、非完全信息博弈、不確定性大、群體協(xié)作、高動態(tài)等特點。傳統(tǒng)基于專家經(jīng)驗或認知的指揮模式無法有效應對瞬息萬變的戰(zhàn)場態(tài)勢和海量數(shù)據(jù),準確快速地把握戰(zhàn)略、戰(zhàn)役層面的戰(zhàn)場態(tài)勢是當前的難題。本文以無人系統(tǒng)集群為研究對象,針對作戰(zhàn)對抗過程中的態(tài)勢理解開展研究,設計了一種層次型態(tài)勢理解框架以提高態(tài)勢理解的效率和準確性,針對每層信息的數(shù)據(jù)特點,分別應用極限學習機算法和K 均值聚類算法,實現(xiàn)對戰(zhàn)場態(tài)勢的深入挖掘。
本文構(gòu)建的針對無人系統(tǒng)集群作戰(zhàn)的多層態(tài)勢理解框架如圖1 所示。戰(zhàn)場作戰(zhàn)對抗的態(tài)勢分為個體、群組和整體3 個層次,各層信息分別表示個體威脅信息、群組態(tài)勢信息以及整體態(tài)勢信息。個體威脅信息是針對敵方個體信息進行的威脅評估;群組態(tài)勢信息是在動態(tài)劃分敵方群組的基礎上,考慮各個群組成員的威脅信息和其他群組特征信息,得到敵方各作戰(zhàn)群組的態(tài)勢信息;總體態(tài)勢信息由所有的群組態(tài)勢信息組成,體現(xiàn)為總體態(tài)勢圖的形式。群組層次比個體層次涉及的敵方單位數(shù)量更多,需要處理的數(shù)據(jù)量大幅增加,數(shù)據(jù)具有復雜且高度耦合的特點。因此,層次型態(tài)勢理解框架是對復雜戰(zhàn)場數(shù)據(jù)進行不同層次的融合,低層級的融合數(shù)據(jù)作為高層級數(shù)據(jù)融合的輸入,最終得到多層次的戰(zhàn)場態(tài)勢信息。
圖1 層次型態(tài)勢理解框架
1.2.1 個體威脅評估
個體威脅評估利用各平臺傳感器采集的數(shù)據(jù)對敵方個體單位進行威脅評估,以獲取敵方的威脅信息。無人系統(tǒng)集群作戰(zhàn)平臺的個體威脅評估具有多源輸入的特點,本文采用基于神經(jīng)網(wǎng)絡的方法進行實時威脅評估。個體威脅評估輸入信息包括敵方信息和我方信息,其中,敵方信息包括反映敵方作戰(zhàn)能力和敵方作戰(zhàn)意圖的信息,如圖2 所示。輸出為敵方單位的威脅程度,分為無威脅、威脅低、威脅中和威脅大4 個等級。
圖2 個體威脅評估的輸入模型
黃廣斌教授提出的非迭代訓練方法減少了單隱層神經(jīng)網(wǎng)絡的訓練時間,并提升了網(wǎng)絡泛化能力。極限學習機可從訓練樣本中擬合出復雜的映射關(guān)系,具有學習速度快、泛化能力好、數(shù)據(jù)擬合效果好、能直接構(gòu)建單隱藏層反饋神經(jīng)網(wǎng)絡的優(yōu)點。因此,本文采用極限學習機作為個體威脅評估的推理算法。
極限學習機的學習目標是通過最小化預測誤差損失函數(shù)之和求解輸出權(quán)重β,目標函數(shù)為:
式(1)第1 項是防止參數(shù)過擬合的正則項,C 為預測誤差項的懲罰系數(shù)。求解該目標函數(shù)可視為最小二乘優(yōu)化問題,令目標函數(shù)對于β 的梯度為零:
根據(jù)Moore-Penrose 廣義逆矩陣,可求β 的最優(yōu)解。當訓練樣本數(shù)量n 和隱含層神經(jīng)元個數(shù)L 大小不同時,求解存在兩種情況:
其中,I和I分別表示L 維和n 維的單位矩陣。當計算出β時,完成對極限學習機網(wǎng)絡的訓練。對于一個標簽未知的測試樣本x,可用式(4)預測其標簽y。
其次,線路傳輸方面減少損耗。在線路傳輸中,導線的長度、材質(zhì)、粗細度等都會對傳輸功率產(chǎn)生直接的影響。因此在線路的設計上,要盡量避免線路過長的現(xiàn)象,以免造成電力資源的浪費;在線路的選擇上,宜選擇電阻低、性質(zhì)穩(wěn)定的導線,來節(jié)省電力資源。
構(gòu)建如圖3 所示的網(wǎng)絡結(jié)構(gòu)。輸入層節(jié)點個數(shù)為6,隱含層節(jié)點個數(shù)選取訓練結(jié)果的最佳值,輸出層節(jié)點個數(shù)為1,隱含層神經(jīng)元閾值為a,輸出神經(jīng)元閾值為b,輸入層到隱含層的輸入權(quán)重為W,隱含層到輸出層的輸入權(quán)重為β。激活函數(shù)選用Sigmoid 函數(shù)。
圖3 個體威脅評估的極限學習機網(wǎng)絡結(jié)構(gòu)
個體威脅評估的流程如圖4 所示。
圖4 個體威脅評估流程圖
1.2.2 群組態(tài)勢理解
在戰(zhàn)場環(huán)境中,敵方目標往往集群協(xié)同作戰(zhàn)。在獲得敵方每個單位的威脅信息后,需對多智能體系統(tǒng)探測到的戰(zhàn)場數(shù)據(jù)進行處理,進而劃分敵方群組,最終得到全局態(tài)勢分析。
基于敵方單位的位置和朝向角信息,應用K 均值聚類算法對敵方進行群組劃分。位置信息用經(jīng)緯度坐標表示,記為(x,y),朝向角記作α。敵方第i 個單位和第j 個單位的相似性距離表示為d。
1)在樣本中隨機選取K 個樣本點,構(gòu)建K 個初始群組和聚類中心;
3)重復步驟2),直至新的質(zhì)心與原質(zhì)心相等或小于指定閾值,完成分類。
在該聚類準則的指引下,距離和朝向相近的敵方單位被劃分到同一群組中??紤]群組成員的分布密度、朝向一致性、威脅度以及到我方作戰(zhàn)群的距離等指標,對每個群組對象進行態(tài)勢分析。第i 組群組成員的分布密度D定義為該群組內(nèi)的成員數(shù)量N/敵方總成員數(shù)量N 的比值,則
得到群組的各參數(shù)后,對各參數(shù)值進行歸一化處理,作為最終輸入到極限學習機中的參數(shù)值。群組態(tài)勢理解的輸入包括分布密度、朝向一致性、威脅度和距離;輸出分為敵方正在進行偵察任務和敵方意圖進攻我方兩類,是一個二分類問題,網(wǎng)絡結(jié)構(gòu)如圖5 所示。輸入層的輸入節(jié)點個數(shù)為4,輸出層的節(jié)點個數(shù)為1,激活函數(shù)為Sigmoid 函數(shù)。
圖5 群組態(tài)勢理解的極限學習機網(wǎng)絡結(jié)構(gòu)
在AnyLogic 軟件中半自動生成樣本,搭建敵我交火場景。記錄每個場景的模型輸入和輸出信息,將上述數(shù)據(jù)做歸一化處理后,把生成的樣本隨機分成訓練樣本和測試樣本。群組態(tài)勢理解的過程如圖6 所示。
圖6 群組態(tài)勢理解流程圖
為驗證個體威脅評估算法的有效性,本文隨機選定作戰(zhàn)情形并用定性分析方法進行驗證。戰(zhàn)場大小為10 km×6 km,考慮河流等障礙物。我方在戰(zhàn)場中用紅色表示,由15 輛坦克組成,每個成員都具有偵察和打擊能力,但探測打擊范圍和打擊能力各不相同。敵方在戰(zhàn)場中用藍色表示,由坦克、無人機、偵察車和反坦克導彈車組成,共計12 個。偵察車不具備打擊能力,無人機和反坦克導彈車對我方坦克形成克制關(guān)系。
在作戰(zhàn)場景中采集戰(zhàn)場數(shù)據(jù),計算得到個體威脅評估的結(jié)果如下頁圖7 所示。
圖7 威脅度值
圖7 中,敵導彈車0、敵坦克2、敵坦克4 的威脅度都較高。對應在場景圖圖8 中,敵方坦克2 離我方坦克7 的距離相對較近,且朝向角指向我方單位;敵方坦克4 距離我方坦克較近,但朝向角偏離我方單位,計算可知此時坦克2 比坦克4 的威脅度高。導彈車雖然距離我方單位相對較遠,但其打擊能力相對坦克車強,所以導彈車的威脅值也較高。
圖8 個體威脅評估仿真場景圖
如此經(jīng)過100 次實驗證明,個體威脅評估算法能有效對各敵方個體進行快速、實時的威脅評估,為準確進行態(tài)勢理解提供基礎。
在隨機生成的作戰(zhàn)場景中驗證聚類劃分效果。任務場景如圖9 所示,敵方單位被劃分為3 個作戰(zhàn)群(藍色圈),分布在戰(zhàn)場的左、中和右部,劃分結(jié)果符合作戰(zhàn)情形。實驗證明,聚類算法可以有效對敵方各單位進行戰(zhàn)斗群組劃分。
圖9 群組劃分仿真場景
本文將BP 神經(jīng)網(wǎng)絡與極限學習機算法進行對比,采用相同的訓練樣本和測試樣本訓練并測試算法模型,訓練樣本量N為1 000 個,測試樣本數(shù)量N為200 個。極限學習機的隱層神經(jīng)元個數(shù)經(jīng)多次實驗設定為500;依據(jù)Kolmogorov 經(jīng)驗公式和多次實驗,BP 神經(jīng)網(wǎng)絡的隱層神經(jīng)元個數(shù)設定為10,學習率為0.2,訓練目標為均方誤差mse≤0.01。
表1 兩種態(tài)勢理解算法樣本訓練和測試結(jié)果
群組態(tài)勢理解的仿真任務場景如圖10 所示,敵方單位被劃分為3 個作戰(zhàn)群(藍色圈)。左起第1個作戰(zhàn)群有6 個作戰(zhàn)單元,包括坦克和無人機,對我方作戰(zhàn)單元形成包圍局勢。群組態(tài)勢理解輸出結(jié)果為該群組意圖進攻我方。左起第2 個和第3 個作戰(zhàn)群距我方作戰(zhàn)群較遠,輸出結(jié)果為進行偵察活動。群組態(tài)勢理解結(jié)果均符合作戰(zhàn)情形。
圖10 群組態(tài)勢理解仿真場景
實驗證明,群組態(tài)勢理解能有效識別敵方作戰(zhàn)群的動態(tài),所有群組態(tài)勢動態(tài)可組成整體態(tài)勢情況,從而輔助指揮員更好地理解戰(zhàn)場態(tài)勢,進行高效準確決策。
本文以戰(zhàn)場指揮決策的智能化為目標,針對無人系統(tǒng)集群作戰(zhàn)對抗過程中的戰(zhàn)場態(tài)勢理解開展研究。構(gòu)建了層次型態(tài)勢理解框架,并按照不同的態(tài)勢層次,對戰(zhàn)場數(shù)據(jù)進行不同層次的融合,分層次處理動態(tài)的戰(zhàn)場信息,最終得到多層次的戰(zhàn)場態(tài)勢信息。通過仿真實驗,驗證了該態(tài)勢理解框架可有效地處理復雜的戰(zhàn)場信息,幫助指揮員更好地把握戰(zhàn)場態(tài)勢并作出決策。