張?zhí)旌?,彭紹雄,鄒強,王棟
(海軍航空工程學院,山東 煙臺 264001)
在戰(zhàn)場態(tài)勢分析中,敵方的戰(zhàn)術(shù)意圖[1]是指揮員決策的重要依據(jù)之一,對敵方戰(zhàn)術(shù)意圖判斷的準確性和及時性將直接影響我方作戰(zhàn)指揮決策的正確性和有效性。傳統(tǒng)作戰(zhàn)中,主要依靠人為判斷的戰(zhàn)術(shù)意圖[2]識別過程已經(jīng)不能適應(yīng)現(xiàn)代戰(zhàn)場上的信息化作戰(zhàn)需要,迫切需要智能化手段來實現(xiàn)戰(zhàn)術(shù)意圖的識別。
在美國國防部JDL實驗室2004年發(fā)布的最新數(shù)據(jù)融合層次模型[3-4]中,意圖識別作為高層數(shù)據(jù)融合過程成為戰(zhàn)場態(tài)勢評估和威脅評估中的重要組成部分。21世紀以來,隨著數(shù)據(jù)融合技術(shù)的發(fā)展,該技術(shù)已經(jīng)成為國內(nèi)外軍事決策領(lǐng)域研究的焦點。
軍事中的戰(zhàn)術(shù)意圖識別領(lǐng)域[5],也就是依據(jù)從各種信息源得到的信息,結(jié)合敵方兵力的部署、戰(zhàn)場環(huán)境的分析、敵方戰(zhàn)斗編隊和戰(zhàn)場警戒程度、我方所承擔的作戰(zhàn)任務(wù),來識別敵方戰(zhàn)術(shù)意圖和作戰(zhàn)計劃的過程。
現(xiàn)有的各種方法難以對軍事目標的戰(zhàn)術(shù)意圖的進行有效的識別和推理。為此,本文研究提出了基于無監(jiān)督學習神經(jīng)網(wǎng)絡(luò)模型[6],嘗試對潛艇對空戰(zhàn)術(shù)意圖識別問題給出另一種解決思路。
競爭神經(jīng)網(wǎng)絡(luò)[7]是一種典型的、應(yīng)用非常廣泛的無監(jiān)督學習神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)如圖1所示。競爭神經(jīng)網(wǎng)絡(luò)由輸入層和競爭層組成。與RBF等神經(jīng)網(wǎng)絡(luò)類似,輸入層僅實現(xiàn)輸入模式的傳遞,并不參與實際的運算。競爭層的各個神經(jīng)元以相互競爭的形式來贏得對輸入模式的響應(yīng),最終只有一個神經(jīng)元贏得勝利,并使與該獲勝神經(jīng)元相關(guān)的各連接權(quán)值和閥值向著更有利于其競爭的方向發(fā)展,而其他神經(jīng)元對應(yīng)的權(quán)值和閾值保持不變。
自組織特征映射(self-organizing feature mapping,SOFM)神經(jīng)網(wǎng)絡(luò)[8]是Kohonen于1981年提出的。其主要思想是在學習過程中逐步縮小神經(jīng)元之間的作用鄰域,并根據(jù)相關(guān)的學習規(guī)則增強中心神經(jīng)元的激活程度,從而去掉各神經(jīng)元[9]之間的側(cè)向連接,以達到模擬真實大腦神經(jīng)系統(tǒng)“近興奮遠抑制”的效果。
如圖2所示,SOFM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與競爭神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)類似,是一個由輸入層和自組織特征映射層(競爭層)組成的兩層網(wǎng)絡(luò)。在SOFM神經(jīng)網(wǎng)絡(luò)中,不僅與獲勝神經(jīng)元對應(yīng)的權(quán)值和閾值得到調(diào)整,其鄰近范圍內(nèi)的其他神經(jīng)元也有機會進行權(quán)值和閥值調(diào)整,這在很大程度上改善了網(wǎng)絡(luò)的學習能力和泛化能力。
(1) 網(wǎng)絡(luò)初始化[10]
如圖1所示,輸入層由R個神經(jīng)元構(gòu)成,競爭層由S1個神經(jīng)元構(gòu)成。為不失一般性,設(shè)訓練樣本的輸入矩陣為
式中:pij為第j個訓練樣本的第i個輸入變量;Q為訓練集樣本數(shù),并記
pi=(pi1,pi2,…,piQ),i=1,2,…,R.
則網(wǎng)絡(luò)的初始連接權(quán)值為
IW1,1=(ω1,ω2,…,ωR)S1×R,
式中:
網(wǎng)絡(luò)的初始閾值為
同時,在學習之前需初始化相關(guān)參數(shù)。設(shè)權(quán)值的學習速率為α,閾值的學習速率為β,最大迭代次數(shù)為T,迭代次數(shù)初始值N=1。
(2) 計算獲勝神經(jīng)元
隨機選取一個訓練樣本p,根據(jù)
(1)
設(shè)競爭層第k個神經(jīng)元為獲勝神經(jīng)元,則應(yīng)滿足
(2)
(3) 權(quán)值、閾值更新
神經(jīng)元k對應(yīng)的權(quán)值和閾值分別按照
(3)
b1=e1-ln[(1-β)e1-ln b1+β×a1]
(4)
(5)
(4) 迭代結(jié)束判斷
若樣本還沒有學習完,則再另外隨機選取一個樣本,返回步驟(2)。若N SOFM神經(jīng)網(wǎng)絡(luò)與競爭神經(jīng)網(wǎng)絡(luò)的算法相似,僅在權(quán)值調(diào)整部分有較大差異。 (1) 網(wǎng)絡(luò)初始化 (2) 計算獲勝神經(jīng)元 與競爭神經(jīng)網(wǎng)絡(luò)采取相同的方式。 (3) 權(quán)值更新 根據(jù) (6) 獲勝神經(jīng)元k及其鄰域Nc(t)內(nèi)的所有神經(jīng)元進行權(quán)值更新。 (4) 學習速率及鄰域更新 獲勝神經(jīng)元及其鄰域內(nèi)的神經(jīng)元權(quán)值更新完成后,在進入下一次迭代前,需要更新學習速率及鄰域,即 (7) (8) 式中:「x?表示對x向上取整。 (5) 迭代結(jié)束判斷 與競爭神經(jīng)網(wǎng)絡(luò)采取相同的方式。 本文給出了一種結(jié)合特征參數(shù)識別和事件檢測的潛艇對空戰(zhàn)術(shù)意圖識別方法[11],由于潛艇在執(zhí)行任務(wù)過程中,空中目標的意圖識別意義重大,直接決定了其是否發(fā)現(xiàn)我方潛艇,進而知曉是否對我方采取行動。而利用目標特征參數(shù)(如目標編隊組成(聲納信息)、區(qū)域警戒程度、距離、運動角度)[12]與作戰(zhàn)態(tài)勢及目標的戰(zhàn)術(shù)意圖息息相關(guān)。本文選取了攻擊、搜潛、驅(qū)離、巡邏4種戰(zhàn)術(shù)意圖[13]作為輸出變量。其中基本目標信息和作戰(zhàn)區(qū)域警戒程度如表1,2所示。 表1 基本目標信息 表2 編隊目標信息 當雙方在某區(qū)域相遇時,區(qū)域的警戒程度對作戰(zhàn)雙方是否會采取更加激烈的應(yīng)對手段起到重要的作用,其區(qū)域警戒程度與戰(zhàn)術(shù)意圖之間的模擬關(guān)系[14]如表3,4所示。 表3 作戰(zhàn)區(qū)域警戒程度 表4 警戒程度與戰(zhàn)術(shù)意圖間的關(guān)系 編隊的構(gòu)成越復(fù)雜則其戰(zhàn)術(shù)意圖越具有攻擊性,表5選取了典型的編隊構(gòu)成情況,其對應(yīng)關(guān)系[15]如表5所示。 表5 目標類型與目標戰(zhàn)術(shù)意圖之間的關(guān)系Table 5 Relationship between target type and target tactical intention 目標對潛艇的威脅程度隨著距離的減下而越來越大,表6設(shè)定了雙方距離閾值[16]及其對應(yīng)的戰(zhàn)術(shù)意圖。當反潛直升機與反潛巡邏機和潛艇作用距離在2 000 km以上時,潛艇較難探測到目標,且目標對潛艇不構(gòu)成威脅,因此不進行討論。 表6 目標距離與目標戰(zhàn)術(shù)意圖之間的關(guān)系Table 6 Relationship between target distance and target tactical intention 目標運動角度越小,其威脅越大,表7設(shè)定了目標運動角度的閾值及其對應(yīng)的戰(zhàn)術(shù)意圖。 由上述表格,專家評估給出每組數(shù)據(jù)對應(yīng)的目標戰(zhàn)術(shù)意圖,目標戰(zhàn)術(shù)意圖由數(shù)字1,2,3,4分別表示攻擊、搜潛、驅(qū)離及巡邏?,F(xiàn)采集到某類型數(shù)據(jù)樣本39組,由于獲取的樣本數(shù)量較少,為保證建立的模型具有較好的泛化能力,這里從每個戰(zhàn)術(shù)意圖組內(nèi)選出4個樣本作為測試集,余下的35個樣本作為訓練集。其中部分樣本數(shù)據(jù)由表8給出。 表7 目標運動角度與目標戰(zhàn)術(shù)意圖間的關(guān)系Table 7 Relationship between target motion angle and target tactical intention 表8 部分系統(tǒng)訓練樣本 為了減少輸入變量間的變化較大(不屬于同一數(shù)量級)對模型性能的影響,在模型建立之前對輸入變量進行歸一化處理。下面將系統(tǒng)訓練樣本進行歸一化處理[17],歸一化使用Matlab自帶的歸一化函數(shù)mapminmax進行歸一化處理,歸一化后的部分訓練樣本數(shù)據(jù)見表9。 實際的戰(zhàn)術(shù)意圖[18]用y來表示,獲勝神經(jīng)元編號(競爭神經(jīng)網(wǎng)絡(luò))用x1來表示,獲勝神經(jīng)元編號(SOFM神經(jīng)網(wǎng)絡(luò))用x2來表示,由于網(wǎng)絡(luò)在訓練的過程中采取的是隨機抽取訓練樣本的方法,因此每次運行的結(jié)果都會有所不同。某次的運行結(jié)果如表10所示。從表10中不難發(fā)現(xiàn)以下幾點: (1) 對于競爭神經(jīng)網(wǎng)絡(luò),第1種目標戰(zhàn)術(shù)意圖與競爭層第2個神經(jīng)元相對應(yīng);第2種戰(zhàn)術(shù)目標與競爭層第2個神經(jīng)元相對應(yīng)(僅有第18號樣本對應(yīng)的是競爭層的第4個神經(jīng)元);第3種軍事目標與競爭層第4神經(jīng)元相對應(yīng);第4種軍事目標與競爭層的第1個神經(jīng)元相對應(yīng)(僅有第28號樣本對應(yīng)的是競爭層的第4個神經(jīng)元)。因此對于第1,2,3,4種軍事目標依次對應(yīng)的獲勝神經(jīng)元是第2,2,4,1神經(jīng)元,據(jù)此對應(yīng)關(guān)系推斷,可以發(fā)現(xiàn)測試集中36,37,38,39號樣本分類正確。 表9 部分歸一化后的系統(tǒng)訓練樣本 表10 競爭神經(jīng)網(wǎng)絡(luò)與SOFM神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果對比 (2) 對于SOFM神經(jīng)網(wǎng)絡(luò)[19],第1種目標戰(zhàn)術(shù)意圖對應(yīng)的獲勝神經(jīng)元編號為4,7,8;第2種目標戰(zhàn)術(shù)意圖對應(yīng)的獲勝神經(jīng)元編號為3,6,7,11,12,14,15;第3種目標戰(zhàn)術(shù)意圖對應(yīng)的獲勝神經(jīng)元編號為2,9,10,13,14,16;第4種目標戰(zhàn)術(shù)意圖對應(yīng)的獲勝神經(jīng)元編號為1,2,5。據(jù)此對應(yīng)關(guān)系可以發(fā)現(xiàn)測試集中除了第38號樣本,其余3個樣本對應(yīng)的獲勝神經(jīng)元編號在訓練集中對應(yīng)的獲勝神經(jīng)元編號集合內(nèi),因此,可以判定其正確率為75%。 注意到,若測試集中某個樣本的預(yù)測獲勝神經(jīng)元編號為7,則難以斷定其屬于第1種目標戰(zhàn)術(shù)意圖或是第2種目標戰(zhàn)術(shù)意圖。同理,若測試集中某個樣本的預(yù)測獲勝神經(jīng)元編號為14,則同樣難以預(yù)測其屬于第2種目標戰(zhàn)術(shù)意圖或是第3種目標戰(zhàn)術(shù)意圖。圖3為神經(jīng)元網(wǎng)絡(luò)拓撲學結(jié)構(gòu)圖,代表本次仿真生成神經(jīng)元的結(jié)構(gòu)。 這里需要強調(diào),若測試集中的某個樣本的預(yù)測獲勝神經(jīng)元編號從未出現(xiàn)過訓練次數(shù)(本文未出現(xiàn)該情況),則難以圈定其屬于哪一類樣本。因為在訓練的過程中,其神經(jīng)元從未贏得獲勝機會,一直處于抑制狀態(tài),即成為所謂的“死”神經(jīng)元。 圖4中神經(jīng)元的編號方式是從左至右,從上至下,神經(jīng)元編號逐漸增加,即左下角的神經(jīng)元編號為1,右上角的神經(jīng)元編號為16,而神經(jīng)元編號與其獲勝次數(shù)間的具體映射關(guān)系如表11所示。 圖5表示競爭層鄰近神經(jīng)元的連接情況,灰色的表示神經(jīng)元節(jié)點,紅線表示神經(jīng)元之間有連接。 圖6為競爭層各個神經(jīng)元與其周圍鄰近神經(jīng)元間的距離分布圖,相鄰神經(jīng)元間填充區(qū)域的顏色表示2個神經(jīng)元間的距離遠近程度。顏色越深(越接近黑色),表明神經(jīng)元間的距離越遠。從圖中可以看出5號與6號神經(jīng)元之間的距離較遠。同時,從表9可以看出5,6號獲勝的神經(jīng)元分別對應(yīng)第4,2種目標戰(zhàn)術(shù)意圖,這表明不同類別的神經(jīng)元之間距離較遠。同理可以觀察到,同一類別對應(yīng)的獲勝神經(jīng)元之間的距離較近,例如在第1種目標戰(zhàn)術(shù)意圖所對應(yīng)的4,7,8神經(jīng)元間的距離就較近,其余類別的目標戰(zhàn)術(shù)意圖分析方法類似,此處不再贅述。 圖7表示每個輸入向量和競爭層神經(jīng)元之間的權(quán)重連接情況。權(quán)值最小的顏色塊為藍色,權(quán)值為0的顏色塊為黑色,權(quán)值最大的顏色塊為紅色。 神經(jīng)元編號12345678獲勝次數(shù)22115133神經(jīng)元編號910111213141516獲勝次數(shù)21523211 圖8為輸入數(shù)據(jù)與權(quán)重圖,其將輸入的向量用綠色的圓點標注,并通過每個神經(jīng)元的權(quán)重向量和用紅線連接的相鄰神經(jīng)元顯示出SOM如何分類輸入空間[20]。 從表10及分析結(jié)果可以看出,與競爭神經(jīng)網(wǎng)絡(luò)相比,SOFM神經(jīng)網(wǎng)絡(luò)的性能更好,泛化能力更強。這是因為,競爭神經(jīng)網(wǎng)絡(luò)在學習時,每次僅有一個神經(jīng)元贏得獲勝機會,只有獲勝神經(jīng)元的權(quán)值得到調(diào)整,而SOFM神經(jīng)網(wǎng)絡(luò)雖然每次亦只有一個神經(jīng)元贏得獲勝機會,但其及其鄰近范圍內(nèi)的神經(jīng)元對應(yīng)的權(quán)值同時進行修正,朝著更有利于其獲勝的方向調(diào)整。同時,SOFM神經(jīng)網(wǎng)絡(luò)逐漸縮小其鄰域范圍,逐漸“排斥”鄰近的神經(jīng)元。這種“協(xié)作”與“競爭”相結(jié)合的模式使得其性能更加優(yōu)越。 潛艇在水下面對復(fù)雜多變的戰(zhàn)場環(huán)境,尤其受到來自空中目標的威脅,及時準確的判斷空中目標的意圖,對我方?jīng)Q策者采取合理應(yīng)對措施,提高潛艇的生存概率都具有重要意義。下一步,將增加競爭層中“死”神經(jīng)元,增加其閾值的調(diào)整幅度,進一步提升模型的準確性。 參考文獻: [1] 秦富童,岳麗華,萬壽紅.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的目標識別效果評估[J].計算機工程與應(yīng)用,2010,46(5):148-156. QIN Fu-tong,YUE Li-hua,WAN Shou-hong.Performance Evaluation in Automatic Target Tecognition Using BP Neural Network[J].Computer Engineering and Applications,2010,46(5):148-156. [2] 葛順,夏學知.用于戰(zhàn)術(shù)意圖識別的動態(tài)序列貝葉斯網(wǎng)絡(luò)[J].系統(tǒng)工程與電子技術(shù),2014,36(1):76-83. GE Shun,XIA Xue-zhi.DSBN Used for Recognition of Tactical Intention[J].Systems Engineering and Electronics,2014,36(1):76-83. [3] JOHANSSON F,FALKMAN G.Implementation and Integration of a Bayesian Network for Prediction of Tactical Intention into Ground Target Simulator[C]∥Proc.of the 9th International Conference on Information Fusion,2006:1-7. [4] TIAN Yu,ZHANG Ai-qun.Simulation Environment and Guidance System for AUV Tracing Chemical Plume in 3-Dimensions [C]∥2010 2nd International Asia Conference on Informatics in Control,Automation and Robotics,2010:407-411. [5] 蘇琦,于敬人,金國棟.一種潛艇對水面艦艇編隊攻擊意圖建模方法[J].四川兵工學報,2014,35(9):147-149. SU Qi,YU Jing-ren,JIN Guo-dong.A Modeling Method of Attack Intention of Submarine for Vessel Formation[J].Sichuan Ordnance Journal,2014,35(9):147-149. [6] 錢江,許江湖.基于BP神經(jīng)網(wǎng)絡(luò)的空中目標威脅排序[J].現(xiàn)代防御技術(shù),2001,29(6):56-58. QIAN Jiang,XU Jiang-hu.Threat Sequencing for Aerial Target Based on BP Neural Network[J].Modern Defence Technology,2001,29(6):56-58. [7] 何隆玲,胡桂明,李維維,等.基于PSO-RBF神經(jīng)網(wǎng)絡(luò)的雷達目標識別[J].現(xiàn)代防御技術(shù),2014,42(5):115-120. HE Long-ling,HU Gui-ming,LI Wei-wei,et al.Rader Target Recognition Based on PSO-RBF Neural Network[J].Modern Defence Technology,2014,42(5):115-120. [8] KANG Hai-yan,LI Chen.Research and Design on Personalized DL Based on J2EE[C]∥2008 IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application.Wuhan,China:IEEE,2008:527-531. [9] 劉偉偉,胡興平,盧曉敏,等.基于SOFM神經(jīng)網(wǎng)絡(luò)的SAR圖像目標識別[J].現(xiàn)代防御技術(shù),2016,44(4):56-60. LIU Wei-wei,HU Xing-ping,LU Xiao-min,et al.SAR Image Target Recognition Method Based on SOFM Neural Network[J].Modern Defence Technology,2016,44(4):56-60. [10] 朱波,方立恭,張小東.基于貝葉斯網(wǎng)絡(luò)的空中目標意圖識別方法[J].現(xiàn)代防御技術(shù),2012,40(2):109-113. ZHU Bo,FANG Li-gong,ZHANG Xiao-dong.Intention Assessment to Aerial Target Based on Bayesian Network[J].Modern Defence Technology,2012,40(2):109-113. [11] DONG Y K,KWAE H Y,JU H K,et al.Prediction of Leak Flow Rate Using Fuzzy Neural Networks in Severe Post-LOCA Circumstances[J].IEEE Trans.on Nuclear Science,2014,61(6):3644-3652. [12] WAI R J,MUTHUSAMY R.Fuzzy Neural Network Inherited Sliding-Mode Control for Rodot Manipulator Including Actuator Dynamics[J].IEEE Trans.on Neural Networks and Learning Systems,2013,24(2):274-287. [13] 陳紹順,王君.基于前向型神經(jīng)網(wǎng)絡(luò)的空襲目標類型識別模型[J].現(xiàn)代防御技術(shù),2002,30(2):57-60. CHEN Shao-shun,WANG Jun.Model of Air Striking Targets Type Recognition Based on Forward Neural Network[J].Modern Defence Technology,2002,30(2):57-60. [14] WU G D,HUANG P H.A Vectorization Optimization Method Based Type-2 Fuzzy Neural Network for Noisy Data Classification[J].IEEE Trans.on Fuzzy Systems,2013,21(1):1-15. [15] 吳文龍,黃文斌,劉劍.潛艇對水面艦艇編隊攻擊意圖推理研究[J].火力與指揮控制,2010,35(9):101-105. WU Wen-long,HUANG Wen-bin,LIU Jian.The Researching on the Inference about Fleet’s Attack Intention by the Submarine[J].Fire Control&Command Control,2010,35(9):101-105. [16] 陳浩,任卿龍,滑藝,等.基于模糊神經(jīng)網(wǎng)絡(luò)的海面目標戰(zhàn)術(shù)意圖識別[J].系統(tǒng)工程與電子技術(shù),2016,38(8):1847-1853. CHEN Hao,REN Qing-long,HUA Yi,et al.Fuzzy Neural Network Based Tactical Intention Recognition for Sea Targets[J].Systems Engineering and Electronics,2016,38(8):1847-1853. [17] HATAKEYA N,FURUTA K.Bayesian Network Modeling of Operator’s Intent Inference[C]∥IEEE 7th Human Factors Meeting,2002:55-60. [18] 陸光宇,丁迎迎.水下平臺對敵意圖識別技術(shù)研究[J].指揮控制與仿真,2012,34(6):100-102. LU Guang-yu,DING Ying-ying.Study on Intention Recognition to Foe of Underwater Platform[J].Command Control &Simulation,2012,34(6):100-102. [19] CARVALHO R N,COSTA P C G,LASKEY K B,et al.PROGNOS:Predictive Situational Awareness with Probabilistic Ontologies[C]∥Proceedings of the 13th International Conference on Information Fusion,Edin-Burgh,UJ,Jul.,2010:214-218. [20] CARVALHO R N.PO:Represention and Modeling Methodology[D].Virginia:George Mason University,2011.2.2 SOFM學習算法
3 實驗分析
4 結(jié)束語