滕飛 劉曙 宋亞飛
摘 要:傳統(tǒng)空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別過程中僅依據(jù)單一時(shí)刻進(jìn)行推理分析, 而實(shí)際戰(zhàn)場中目標(biāo)戰(zhàn)術(shù)意圖是由一系列動(dòng)作實(shí)現(xiàn)的, 因此目標(biāo)狀態(tài)呈現(xiàn)動(dòng)態(tài)、 時(shí)序變化特征。 針對此問題在長短期記憶網(wǎng)絡(luò)(LSTM)的基礎(chǔ)上引入雙向(Bidirectional)傳播機(jī)制和注意力(Attention)機(jī)制, 提出基于BiLSTM-Attention的空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別模型。 采用分層的方法構(gòu)建空戰(zhàn)意圖特征集, 并將其編碼成時(shí)序特征, 將決策人員經(jīng)驗(yàn)封裝成標(biāo)簽, 通過BiLSTM神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)空戰(zhàn)意圖特征向量中的深層次信息, 并利用注意力機(jī)制自適應(yīng)分配網(wǎng)絡(luò)權(quán)重, 將不同權(quán)重的空戰(zhàn)特征信息放入Softmax函數(shù)層進(jìn)行意圖識(shí)別。 通過與傳統(tǒng)空中戰(zhàn)術(shù)目標(biāo)意圖識(shí)別模型對比及消融實(shí)驗(yàn)分析表明, 所提模型有效提升了空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別效率, 對輔助作戰(zhàn)系統(tǒng)具有重要的理論意義和參考價(jià)值。
關(guān)鍵詞: 意圖識(shí)別; 注意力機(jī)制; 雙向長短時(shí)記憶網(wǎng)絡(luò); 空中目標(biāo); 時(shí)序特征
中圖分類號(hào): TJ760; E824? 文獻(xiàn)標(biāo)識(shí)碼:??? A? 文章編號(hào): 1673-5048(2021)05-0024-09
0 引? 言
在現(xiàn)代信息化空戰(zhàn)中, 航空科學(xué)和軍事技術(shù)的蓬勃發(fā)展導(dǎo)致空中目標(biāo)受到越來越嚴(yán)重的威脅。 同時(shí), 高科技的不斷應(yīng)用導(dǎo)致戰(zhàn)場環(huán)境的復(fù)雜性和信息不對稱等特征不斷涌現(xiàn), 僅依靠專家經(jīng)驗(yàn)很難從復(fù)雜空戰(zhàn)環(huán)境中實(shí)時(shí)、 準(zhǔn)確地識(shí)別敵方目標(biāo)意圖。 因此, 迫切需要智能化推理方法來突破傳統(tǒng)人工方式的弊端, 幫助己方奪取制空權(quán)甚至戰(zhàn)爭的勝利[1-2]。
近年來, 為滿足作戰(zhàn)決策系統(tǒng)的需求, 在軍事領(lǐng)域開展了大量的意圖識(shí)別研究。 現(xiàn)有的用于復(fù)雜戰(zhàn)場環(huán)境下對敵目標(biāo)意圖識(shí)別研究主要有證據(jù)理論[3]、 模板匹配[4]、 專家系統(tǒng)[5]、 貝葉斯網(wǎng)絡(luò)[6-7]和神經(jīng)網(wǎng)絡(luò)[8-9]等方法。 文獻(xiàn)[3]利用艦船的傳感器測得空中目標(biāo)的特征信息, 建立置信規(guī)則庫, 用證據(jù)推理融合多源信息對目標(biāo)意圖進(jìn)行識(shí)別。 文獻(xiàn)[4]在以態(tài)勢數(shù)據(jù)庫為基礎(chǔ)構(gòu)成的模板上, 設(shè)計(jì)了意圖識(shí)別推理模型, 并提出基于D-S證據(jù)理論的意圖識(shí)別模板匹配方法。 文獻(xiàn)[5]使用領(lǐng)域?qū)<抑R(shí)構(gòu)建知識(shí)庫, 而后將戰(zhàn)場態(tài)勢與作戰(zhàn)意圖的對應(yīng)關(guān)系用規(guī)則的形式進(jìn)行表達(dá), 最后使用推理機(jī)得出推理結(jié)果。 文獻(xiàn)[6-7]依據(jù)軍事專家知識(shí)確定貝葉斯網(wǎng)絡(luò)參數(shù), 通過節(jié)點(diǎn)表示特征, 有向弧表示轉(zhuǎn)移關(guān)系, 條件概率表示關(guān)系強(qiáng)度, 利用新事件影響后向傳播從而對網(wǎng)絡(luò)參數(shù)進(jìn)行更新, 一直到某個(gè)意圖超越閾值, 該意圖即為識(shí)別意圖。 文獻(xiàn)[8]將實(shí)際戰(zhàn)場中的信息進(jìn)行收集, 從中選擇合適的特征并進(jìn)行數(shù)據(jù)預(yù)處理得到數(shù)據(jù)集, 然后將數(shù)據(jù)集輸入神經(jīng)網(wǎng)絡(luò), 利用神經(jīng)網(wǎng)絡(luò)的自適應(yīng)和自學(xué)習(xí)能力得到作戰(zhàn)意圖識(shí)別規(guī)則, 之后使用空戰(zhàn)意圖識(shí)別規(guī)則來推理出敵目標(biāo)作戰(zhàn)意圖。
上述方法通過依靠單一時(shí)刻的特征信息進(jìn)行分析和推理, 很難有效從時(shí)序變化的目標(biāo)狀態(tài)特征中尋找出隱含的深層信息。 而實(shí)際上, 目標(biāo)意圖在戰(zhàn)場中是通過一系列戰(zhàn)術(shù)動(dòng)作實(shí)施的, 所以目標(biāo)的動(dòng)態(tài)屬性和戰(zhàn)場環(huán)境會(huì)呈現(xiàn)出動(dòng)態(tài)、 時(shí)序變化特征, 并且敵方目標(biāo)的作戰(zhàn)行動(dòng)會(huì)具有一定的欺騙性和隱蔽性, 故依據(jù)單一時(shí)刻的特征信息來推理敵目標(biāo)意圖是不夠科學(xué)的[9]。? 文獻(xiàn)[10]針
對時(shí)序變化特征提出基于長短期記憶(long-term and??? short-term? memory, LSTM)網(wǎng)絡(luò)的戰(zhàn)術(shù)意圖智能識(shí)別模
型, 該模型對識(shí)別目標(biāo)作戰(zhàn)意圖有良好的效果, 并且符合戰(zhàn)場態(tài)勢信息中的時(shí)序特征和前后邏輯關(guān)系, 但其只能利用歷史時(shí)刻信息來對當(dāng)前信息作出判斷, 無法利用未來時(shí)刻信息, 且其準(zhǔn)確率還有較大提升空間。
綜上, 本文提出一種基于BiLSTM-Attention空中目標(biāo)戰(zhàn)術(shù)意圖智能識(shí)別模型, 在基于LSTM網(wǎng)絡(luò)的基礎(chǔ)上引入雙向(Bidirectional)循環(huán)機(jī)制和注意力(Attention)機(jī)制, 從而模擬決策人員對于空戰(zhàn)情況的推理過程。 將編碼化的空戰(zhàn)特征向量輸入BiLSTM層, 相比放入LSTM層能充分利用歷史時(shí)刻和未來時(shí)刻信息綜合作出判斷; 把BiLSTM層的輸出向量放入Attention機(jī)制層能進(jìn)一步突出影響意圖的關(guān)鍵信息, 提高意圖識(shí)別的準(zhǔn)確率。 將多種模型與本文提出模型進(jìn)行對比實(shí)驗(yàn), 以準(zhǔn)確率、 損失值、 召回率、 精確率、 F1-分?jǐn)?shù)作為評價(jià)指標(biāo), 證明了本文提出模型在空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別方面的有效性。
1 空中目標(biāo)意圖識(shí)別問題描述
空中目標(biāo)戰(zhàn)術(shù)意圖是從實(shí)時(shí)、 對抗性環(huán)境中, 通過提取相應(yīng)時(shí)空域內(nèi)的戰(zhàn)場環(huán)境信息、 空戰(zhàn)敵我目標(biāo)的靜態(tài)屬性和實(shí)時(shí)動(dòng)態(tài)信息進(jìn)行分析, 并結(jié)合相應(yīng)軍事領(lǐng)域知識(shí), 來推理敵方目標(biāo)作戰(zhàn)意圖的過程[11], 如圖1所示。
空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別是一種典型的模式識(shí)別問題, 可以描述為空戰(zhàn)意圖識(shí)別特征到空戰(zhàn)意圖類型的映射。 定義 I=(i1, i2, …, in) 為空中目標(biāo)戰(zhàn)術(shù)意圖空間, 定義 Vt 為 t 時(shí)刻戰(zhàn)場實(shí)時(shí)特征信息。 由于空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別是在復(fù)雜、 高對抗戰(zhàn)場條件下進(jìn)行的, 被識(shí)別目標(biāo)會(huì)盡可能欺騙我方?jīng)Q策人員, 迫使我方作出錯(cuò)誤判斷, 故用單一時(shí)刻特征來識(shí)別敵方作戰(zhàn)意圖與實(shí)際情況會(huì)有較大差異。 因此, 從被識(shí)別目標(biāo)多個(gè)連續(xù)時(shí)刻的特征信息中推測其作戰(zhàn)意圖更具有科學(xué)性。 定義 VT 為 t1 到 tT 連續(xù) T 個(gè)時(shí)刻的特征集構(gòu)成的時(shí)序特征集, 從而確定戰(zhàn)術(shù)意圖空間 I 到時(shí)序特征集 VT 的映射函數(shù):
I=f(VT)=f(V(t1), V(t2), …, V(tT)) (1)
由于空戰(zhàn)本身存在的高對抗性、 不確定性、 復(fù)雜性等, 很難通過數(shù)學(xué)公式歸納推導(dǎo)出戰(zhàn)術(shù)意圖類型到時(shí)序特征集的映射關(guān)系[1]。 本文通過使用空戰(zhàn)數(shù)據(jù)集來訓(xùn)練BiLSTM-Attention網(wǎng)絡(luò)結(jié)構(gòu), 從而隱式地建立戰(zhàn)術(shù)意圖類型到時(shí)序特征集的映射關(guān)系。 整個(gè)空戰(zhàn)意圖識(shí)別過程如圖2所示。
在進(jìn)行空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別時(shí), 首先通過空戰(zhàn)領(lǐng)域?qū)<覍v史數(shù)據(jù)進(jìn)行意圖類型標(biāo)定得到完整訓(xùn)練數(shù)據(jù)集, 之后將預(yù)處理后的數(shù)據(jù)集輸入BiLSTM-Attention網(wǎng)絡(luò)訓(xùn)練得到空戰(zhàn)意圖類型與時(shí)序特征集之間的映射關(guān)系; 在實(shí)際空戰(zhàn)時(shí), 通過傳感器實(shí)時(shí)采集連續(xù) N 個(gè)時(shí)刻( Tn~Tn+N )目標(biāo)的狀態(tài)信息, 最后將采集的目標(biāo)狀態(tài)信息整合編碼后輸入到訓(xùn)練好的目標(biāo)意圖識(shí)別模型, 得到目標(biāo)意圖識(shí)別結(jié)果。
為準(zhǔn)確描述空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別模型, 做如下假設(shè): (1)敵我雙方所處的空戰(zhàn)地形、 大氣層、 氣候等戰(zhàn)場環(huán)境條件大致相同; (2)敵方空中目標(biāo)戰(zhàn)術(shù)意圖在所提取的時(shí)間序列中不發(fā)生改變[2]。
1.1 目標(biāo)戰(zhàn)術(shù)意圖空間描述
目標(biāo)戰(zhàn)術(shù)意圖空間對于不同的作戰(zhàn)形式、 不同的場景、 不同的敵方實(shí)體有不同的意圖空間。 因此, 需要根據(jù)相應(yīng)的作戰(zhàn)情況定義適合的戰(zhàn)術(shù)意圖空間。 如文獻(xiàn)[3]中定義敵方空中目標(biāo)對我方水面艦艇的戰(zhàn)術(shù)意圖空間為{偵察、 監(jiān)視、 攻擊、 掩護(hù)}; 文獻(xiàn)[12]對于敵方單組海上艦船編隊(duì)建立戰(zhàn)術(shù)意圖空間為{攻擊、 偵察、 撤退、 掩護(hù)}; 文獻(xiàn)[13]定義敵方空中目標(biāo)對我方潛艇的戰(zhàn)術(shù)意圖空間為{攻擊、 搜潛、 驅(qū)離、 巡邏}; 文獻(xiàn)[14]對于水下威脅目標(biāo)建立戰(zhàn)術(shù)意圖空間為{攻擊、 規(guī)避、 巡邏}。
本文針對某空域無人機(jī)交戰(zhàn)為研究對象, 建立敵方目標(biāo)的戰(zhàn)術(shù)意圖空間包括: 突防、 佯攻、 攻擊、 偵察、 撤退、 監(jiān)視、 電子干擾7種意圖類型。
在確立意圖空間后, 如何將人的認(rèn)知模式轉(zhuǎn)換成智能模型訓(xùn)練的標(biāo)簽, 并與戰(zhàn)術(shù)意圖空間中意圖類型相對應(yīng), 是將BiLSTM-Attention模型應(yīng)用于戰(zhàn)術(shù)意圖識(shí)別的關(guān)鍵。 分析目標(biāo)戰(zhàn)術(shù)意圖推理過程可知, 決策人員得到戰(zhàn)場態(tài)勢信息后, 結(jié)合自身經(jīng)驗(yàn)作出敵方目標(biāo)意圖判斷是很難顯式表達(dá)出來的, 但是人的認(rèn)知經(jīng)驗(yàn)往往隱含在對敵方目標(biāo)作戰(zhàn)意圖的推理過程中。 因此, 可以將決策人員的認(rèn)知經(jīng)驗(yàn)封裝成標(biāo)簽來訓(xùn)練BiLSTM-Attention模型。 針對本文中確立的7種敵方目標(biāo)作戰(zhàn)意圖類型, 相應(yīng)的作戰(zhàn)意圖類型編碼與模式解析機(jī)制如圖3所示。? 例如, 若BiLSTM-Attention模型輸出的意圖識(shí)別結(jié)果為3, 則可認(rèn)為敵方目標(biāo)的作戰(zhàn)意圖為監(jiān)視意圖,? 故通過將敵方作戰(zhàn)意圖編碼的方式能簡單清楚地表達(dá)出決策者的認(rèn)知經(jīng)驗(yàn), 并且更加容易訓(xùn)練模型。
1.2 空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別特征描述
敵方目標(biāo)戰(zhàn)術(shù)意圖與敵我雙方的威脅程度和作戰(zhàn)任務(wù)高度相關(guān)。? 例如,? 我方對敵方威脅程度遠(yuǎn)大于敵方對我方的威脅程度時(shí), 敵方目標(biāo)的戰(zhàn)術(shù)意圖為“攻擊”的可能性就會(huì)大大降低。 因此,? 為識(shí)別不同的敵我雙方威脅
程度和作戰(zhàn)任務(wù), 需要提取不同的空戰(zhàn)特征。
從威脅程度角度, 影響目標(biāo)威脅程度大小的因素有
很多, 本文主要考慮敵我雙方距離、 速度、 角度以及飛行加速度。 空戰(zhàn)能力因子也是決定目標(biāo)威脅程度大小的重要因素, 對于戰(zhàn)機(jī)的空戰(zhàn)能力, 借鑒文獻(xiàn)[15]構(gòu)建單機(jī)空戰(zhàn)能力威脅函數(shù):
C=[ ln ε1+ ln (ε2+1)+ ln (∑ε3+1)]ε4ε5ε6ε7 (2)
其中, ?ε1~ε7 分別表示戰(zhàn)機(jī)機(jī)動(dòng)性能、 機(jī)載武器性能、 機(jī)載設(shè)備探測能力、 戰(zhàn)機(jī)的基本飛行性能、 戰(zhàn)機(jī)的操作性能、 戰(zhàn)機(jī)的作戰(zhàn)生存性能以及電子信息對抗性能。 空戰(zhàn)能力威脅是戰(zhàn)機(jī)的固有性能, 因此可根據(jù)公式計(jì)算出一定時(shí)期內(nèi)敵我雙方各式戰(zhàn)機(jī)的空戰(zhàn)能力因子, 保存在數(shù)據(jù)庫中, 并根據(jù)我方掌握的裝備發(fā)展情況實(shí)時(shí)更新數(shù)據(jù)庫數(shù)據(jù)。
從作戰(zhàn)任務(wù)角度, 當(dāng)敵方戰(zhàn)機(jī)執(zhí)行某項(xiàng)作戰(zhàn)任務(wù)時(shí), 其戰(zhàn)機(jī)的某些特征信息必須滿足一定的條件。 例如, 殲擊機(jī)在空戰(zhàn)攻擊時(shí)通常采用高速接近敵方目標(biāo), 戰(zhàn)機(jī)飛行速度一般是735~1 470 km/h; 執(zhí)行突防任務(wù)時(shí)分為低空突防和高空突防, 對應(yīng)高度為50~200 m和10 000~11 000 m[16]。 目標(biāo)雷達(dá)信號(hào)狀態(tài)與作戰(zhàn)任務(wù)也存在一定聯(lián)系。 例如, 空戰(zhàn)格斗時(shí)通常保持對空雷達(dá)開啟, 執(zhí)行偵察任務(wù)時(shí)保持對空雷達(dá)和對海雷達(dá)的開啟[2]。 不同類型的戰(zhàn)機(jī)具備不同的應(yīng)用價(jià)值和戰(zhàn)術(shù)意義, 殲擊機(jī)攻擊性較強(qiáng), 偵察機(jī)偵察能力強(qiáng), 因此敵機(jī)類型也可作為戰(zhàn)術(shù)意圖識(shí)別特征。
此外, 空中目標(biāo)戰(zhàn)術(shù)意圖的實(shí)現(xiàn)與戰(zhàn)機(jī)機(jī)動(dòng)動(dòng)作密切相關(guān)。 常見的機(jī)動(dòng)動(dòng)作庫有兩種設(shè)計(jì)類型: 一類是以典型空戰(zhàn)戰(zhàn)術(shù)飛機(jī)動(dòng)作作為依據(jù)設(shè)計(jì)的“典型戰(zhàn)術(shù)動(dòng)作庫”, 另一類以空戰(zhàn)基本操縱動(dòng)作為設(shè)計(jì)依據(jù)的“基本操縱動(dòng)作庫”。 由于本文研究的是時(shí)序特征, 通過采集12幀的目標(biāo)特征信息進(jìn)行戰(zhàn)術(shù)意圖識(shí)別, 而“典型戰(zhàn)術(shù)動(dòng)作庫”的控制算法求解復(fù)雜, 動(dòng)作的退出和轉(zhuǎn)換時(shí)間點(diǎn)難以確定, 故本文采用“基本操縱動(dòng)作庫”[17]。 該庫是由美國國家航空咨詢委員會(huì)(NASA)學(xué)者根據(jù)空戰(zhàn)中最常用的機(jī)動(dòng)方式提出的, 主要包括7種機(jī)動(dòng)動(dòng)作: 最大加速、 最大減速、 最大過載爬升、 最大過載俯沖、 最大過載右轉(zhuǎn)、 最大過載左轉(zhuǎn)、 穩(wěn)定分型, 但是由這7種機(jī)動(dòng)方式組合的機(jī)動(dòng)動(dòng)作還不夠多, 并且都采取極限操縱, 顯然不符合空戰(zhàn)實(shí)際。 本文選用改進(jìn)后的基本操縱動(dòng)作11種[18], 包括:勻速前飛、 減速前飛、 加速前飛、 爬升、 右爬升、 左爬升、 俯沖、 右俯沖、 左俯沖、 右轉(zhuǎn)、 左轉(zhuǎn)。
綜上所述, 本文的空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別特征集為{對空雷達(dá)狀態(tài)、 對海雷達(dá)狀態(tài)、 干擾狀態(tài)、 受干擾狀態(tài)、 機(jī)動(dòng)類型、 敵機(jī)類型、 敵機(jī)加速度、 敵機(jī)高度、 敵機(jī)速度、 敵機(jī)空戰(zhàn)能力因子、 航向角、 方位角、 我機(jī)加速度、 我機(jī)高度、 我機(jī)速度、 我機(jī)空戰(zhàn)能力因子、 雙方距離}17維特征向量,? 并且可分為數(shù)值型特征和非數(shù)值型特征。 特征描述圖如圖4所示。
2 基于BiLSTM-Attention空戰(zhàn)意圖識(shí)別模型
BiLSTM-Attention模型共分為三部分: 空戰(zhàn)特征向量輸入層、 隱含層和輸出層。 其中, 隱含層由BiLSTM層、 Attention層和Dense層三部分組成。 網(wǎng)絡(luò)的輸入節(jié)點(diǎn)input=(12, 17), 輸出節(jié)點(diǎn)output=7, 其中, 12表示步長; 17表示特征維數(shù); 7表示意圖類別數(shù)。 其BiLSTM-Attention模型結(jié)構(gòu)如圖5所示。
2.1 輸入層
本文的輸入層主要是對采集的空戰(zhàn)特征數(shù)據(jù)集進(jìn)行預(yù)處理, 即將這些數(shù)據(jù)集處理成BiLSTM層能夠直接接受并能處理的特征向量形式。 空戰(zhàn)特征向量化具體操作步驟如下:
(1) 讀取采集數(shù)據(jù)并進(jìn)行數(shù)據(jù)清洗。
(2) 將數(shù)值型空戰(zhàn)特征數(shù)據(jù)進(jìn)行歸一化處理。? 數(shù)據(jù)歸一化能夠消除數(shù)據(jù)量綱影響, 提高網(wǎng)絡(luò)收斂效率, 本文對敵機(jī)加速度、 敵機(jī)高度、 敵機(jī)速度、 敵機(jī)空戰(zhàn)能力因子、 航向角、 方位角、 我機(jī)加速度、 我機(jī)高度、 我機(jī)速度、 我機(jī)空戰(zhàn)能力因子、 雙方距離共11種數(shù)值型空戰(zhàn)特征數(shù)據(jù)進(jìn)行歸一化處理。 對于第x種數(shù)值型數(shù)據(jù) Fx=[fx1, fx2, …fxi, …, fxn](x=1, 2, …, 11) ; n為數(shù)據(jù)總數(shù)。 將第x種中第i個(gè)原始數(shù)據(jù)值 fxi 映射到區(qū)間[0, 1]的結(jié)果為 fxi′ , 其公式為
fxi′=fxi- min Fx max Fx- min Fx (3)
式中: ??minFx 為第x維特征Fx 的最小值; ??maxFx 為第x維特征Fx 的最大值。
(3) 將非數(shù)值型空戰(zhàn)特征數(shù)據(jù)編碼。 對于對空雷達(dá)狀態(tài)、 對海雷達(dá)狀態(tài)、 干擾狀態(tài)、 受干擾狀態(tài)4種屬性數(shù)據(jù)編碼表示為0和1。 例如, 對空雷達(dá)狀態(tài)中0表示雷達(dá)處于關(guān)閉狀態(tài), 1表示雷達(dá)處于打開狀態(tài)。 對于機(jī)動(dòng)類型和敵機(jī)類型兩種屬性數(shù)據(jù)應(yīng)用Mllier的9級量化理論[19], 獲得各非數(shù)值型特征的編碼化數(shù)據(jù), 而后進(jìn)行歸一化處理。
(4) 將7種敵方目標(biāo)作戰(zhàn)意圖類型按圖3所示編碼成類別標(biāo)簽。
(5) 隨機(jī)初始化數(shù)據(jù), 按8∶2劃分訓(xùn)練集和測試集。
經(jīng)過上面的五步操作之后, 采集到的空戰(zhàn)特征數(shù)據(jù)就變成隱含層能夠直接接受并處理的特征向量形式。
2.2 隱含層
2.2.1 BiLSTM層
長短期記憶網(wǎng)絡(luò)作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN), 也具有同RNN相類似的遞歸結(jié)構(gòu), 但LSTM通過引入門控開關(guān)的思想來模擬人腦的遺忘機(jī)制和記憶機(jī)制, 從而克服長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題[20]。
在LSTM體系結(jié)構(gòu)中通過遺忘門、 更新門、 輸出門以及記憶單元實(shí)現(xiàn)信息的輸入和輸出, LSTM的單個(gè)神經(jīng)元體系結(jié)構(gòu)如圖6所示。 圖中Xt為時(shí)間t時(shí)刻的輸入特征;ct-1為更新前的神經(jīng)元;Ct為更新后的神經(jīng)元;ht-1和ht分別為上一時(shí)刻和當(dāng)前時(shí)刻的輸出特征;Γf,Γu和Γo分別為遺忘門、 更新門和輸出門;t 為候選神經(jīng)元; ?σ 為Sigmoid函數(shù)。 其運(yùn)算過程如下:
Γf =σ(Wf [ht-1, Xt]+b f)(4)
Γu =σ(Wu [ht-1, Xt]+b u)(5)
C~t= tanh (Wc [ht-1, Xt]+bc ) (6)
ct=Γu *C~t+Γf *Ct-1 ?(7)
Γo =σ(Wo [ht-1, xt+b o]) (8)
ht=Γo*tanhct(9)
其中,Wf,W u,W c,Wo以及b f,b u,b c,b o為各相應(yīng)部分的權(quán)重系數(shù)矩陣和偏移向量。
傳統(tǒng)的LSTM網(wǎng)絡(luò)為單向的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu), 所獲取的信息都是當(dāng)前時(shí)刻之前的歷史信息, 導(dǎo)致忽略了未來的信息, 而BiLSTM網(wǎng)絡(luò)是由前向的LSTM網(wǎng)絡(luò)與后向的LSTM網(wǎng)絡(luò)組成, 具有能夠捕獲前后信息特征的作用, 其模型結(jié)構(gòu)如圖7所示。
從圖7可以看出, BiLSTM在t時(shí)刻隱層狀態(tài)Ot 可通過前向隱層狀態(tài) ht 和后向隱層狀態(tài) ht 兩部分求得, 前向隱層狀態(tài) ht 由當(dāng)前輸入的xt和(t-1)時(shí)刻前向的隱層狀態(tài) ht-1 決定, 后向隱層狀態(tài) ht 由當(dāng)前輸入的xt和(t+1)時(shí)刻后向的隱層狀態(tài) ht+1 決定[21]。 計(jì)算公式如式(10)~(12)所示, 其中wi(i=1, 2, …, 6)表示一個(gè)單元層到另一個(gè)單元層的權(quán)重。
ht=f(w1xt+w2ht-1) (10)
ht=f(w3xt+w5ht+1) (11)
Ot=g(w4ht+w6ht) (12)
2.2.2 Attention層
Attention機(jī)制與人類的視覺所特有的大腦信號(hào)處理機(jī)制相似, 其通過計(jì)算不同時(shí)刻BiLSTM網(wǎng)絡(luò)中輸出的特征向量的權(quán)重, 突出對預(yù)測結(jié)果占比更大的特征, 從而使整個(gè)神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)出更優(yōu)的性能。 Attention機(jī)制在機(jī)器翻譯、 語音識(shí)別等時(shí)序數(shù)據(jù)中表現(xiàn)優(yōu)異, 在分類預(yù)測中也有較為不錯(cuò)的效果, 可以單獨(dú)使用, 也可以在其他混合模型中作為其他混合模型的層使用[22]。 在本文空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別中, 神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中通過Attention機(jī)制來重點(diǎn)關(guān)注一些關(guān)鍵的特征, 其核心是權(quán)重系數(shù)。 首先學(xué)習(xí)每個(gè)特征的重要程度, 而后根據(jù)重要程度為每個(gè)特征分配相應(yīng)的權(quán)重。 例如, 敵機(jī)是攻擊意圖時(shí), 其中航向角、 機(jī)動(dòng)類型等特征會(huì)被Attention機(jī)制分配更多的權(quán)重來加深模型記憶。 Attention機(jī)制模型基本結(jié)構(gòu)如圖8所示。Ot 為BiLSTM網(wǎng)絡(luò)輸出的第t個(gè)特征向量, 將其輸入注意力機(jī)制隱藏層得到初始狀態(tài)向量st , 而后與權(quán)重系數(shù)αt對應(yīng)相乘并累加求和, 得到最終輸出的狀態(tài)向量Y。 計(jì)算公式如下:
et= tanh (wtst+bt) (13)
αt= exp (et)/∑ti=1ei (14)
Y=∑nt=1αtst (15)
式中: et為第t個(gè)特征向量的狀態(tài)向量st所確定的能量值;wt為第t個(gè)特征向量的權(quán)重系數(shù)矩陣;bt為第t個(gè)特征向量相對應(yīng)的偏移量。 根據(jù)式(14)可以實(shí)現(xiàn)由輸入初始狀態(tài)到新的注意力狀態(tài)的轉(zhuǎn)換, 之后通過式(15)得到最終輸出的狀態(tài)向量Y, 最后將Y與Dense層整合在一起作為一個(gè)輸出值輸入到最后的輸出層。
2.3 輸出層
輸出層的輸入為隱含層中Attention機(jī)制層的輸出。 利用多分類Softmax函數(shù)對輸出層的輸入進(jìn)行相應(yīng)計(jì)算, 從而得出空中目標(biāo)戰(zhàn)術(shù)意圖分類:
yk=softmax(w1Y+b1)(16)
其中:w1為Attention機(jī)制層到輸出層需要訓(xùn)練的權(quán)重系數(shù)矩陣;b1為需要訓(xùn)練的對應(yīng)偏置; yk 為輸出層的輸出預(yù)測標(biāo)簽。
3 實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)數(shù)據(jù)集
實(shí)驗(yàn)以某空域無人機(jī)交戰(zhàn)為研究背景, 實(shí)驗(yàn)數(shù)據(jù)來源于某作戰(zhàn)仿真系統(tǒng)中。 通過多次運(yùn)行仿真系統(tǒng), 得到多種空戰(zhàn)意圖模式, 從中隨機(jī)抽取10 000個(gè)空戰(zhàn)意圖樣本, 針對每個(gè)樣本采集連續(xù)12幀信息(每幀信息包括航向角、 飛行高度、 干擾狀態(tài)、 雷達(dá)狀態(tài)等17個(gè)維度特征信息)。 由于樣本集數(shù)據(jù)量過大,? 選擇由空戰(zhàn)領(lǐng)域?qū)<彝ㄟ^空戰(zhàn)經(jīng)驗(yàn)編寫意圖識(shí)別規(guī)則來生成意圖標(biāo)簽, 之后通過計(jì)算機(jī)對空戰(zhàn)意圖樣本進(jìn)行模式分類, 最后由空戰(zhàn)領(lǐng)域?qū)<腋鶕?jù)空戰(zhàn)經(jīng)驗(yàn)對存在意圖分類歧義的樣本數(shù)據(jù)進(jìn)行修訂。 其中數(shù)據(jù)集包括 7 種目標(biāo)戰(zhàn)術(shù)意圖, 各戰(zhàn)術(shù)意圖數(shù)據(jù)占比情況為攻擊意圖 21.6%、 突防意圖20.0%、 偵察意圖19.8%、 監(jiān)視意圖12.9%、 佯攻意圖10.0%、 電子干擾意圖9.25%、 撤退意圖6.45%。 樣本規(guī)模為10 000, 其中按8∶2劃分訓(xùn)練集與測試集, 故訓(xùn)練集樣本規(guī)模為8 000, 測試集樣本規(guī)模為2 000。
3.2 實(shí)驗(yàn)設(shè)置
本實(shí)驗(yàn)以準(zhǔn)確率、 損失值作為實(shí)驗(yàn)的評價(jià)指標(biāo)。
實(shí)驗(yàn)使用Python語言, 在GPU加速環(huán)境下進(jìn)行, 采用Keras深度學(xué)習(xí)框架, 電腦配置為Win10t系統(tǒng)、? GTX960M顯卡、 8GB內(nèi)存。
實(shí)驗(yàn)中有很多超參數(shù)需要設(shè)置, 依據(jù)準(zhǔn)確率進(jìn)行調(diào)整。 記隱藏層層數(shù)為HL, 各隱藏層節(jié)點(diǎn)數(shù)為HS。 (1)保持隱藏層層數(shù)不變, 分別設(shè)置不同的隱藏層節(jié)點(diǎn)數(shù), 分析隱藏層節(jié)點(diǎn)數(shù)對模型性能的影響, 設(shè)HL=1, HS=[64], [128], [256], [512], 得出最優(yōu)隱藏層節(jié)點(diǎn)數(shù), 結(jié)果如圖9所示。 (2)依據(jù)得出的最優(yōu)隱藏層節(jié)點(diǎn)數(shù), 在總體數(shù)目保持不變的情況下, 分別設(shè)置不同的隱藏層層數(shù), 分析隱藏層層數(shù)對模型性能的影響, 設(shè)HL=1, HS=[256]; HL=2, HS=[128, 128]; HL=3, HS=[128, 64, 64]; HL=4, HS=[128, 64, 32, 32], 結(jié)果如圖10所示。
由圖9可見, HS=64, 128, 256, 512的模型識(shí)別準(zhǔn)確分別在93%, 94%, 96%, 95%左右, 說明隱藏層節(jié)點(diǎn)數(shù)并不是越多越好, 而是存在一個(gè)合適的隱藏層節(jié)點(diǎn)數(shù), 隱藏層節(jié)點(diǎn)數(shù)過多還會(huì)容易發(fā)生“過擬合”現(xiàn)象。 由圖10可見, 隨著隱藏層層數(shù)的增加, 模型的識(shí)別準(zhǔn)確率逐漸提升, 具有三隱藏層的BiLSTM-Attention模型的性能明顯優(yōu)于單隱藏層和雙隱藏層模型。 當(dāng)隱藏層層數(shù)增加到4層時(shí), 模型的收斂速度稍有下降, 并且穩(wěn)定后的準(zhǔn)確率也低于三隱藏層模型。 故在隱藏層節(jié)點(diǎn)數(shù)不變的情況下, 適當(dāng)增加網(wǎng)絡(luò)深度會(huì)有效提升模型識(shí)別準(zhǔn)確率, 但當(dāng)達(dá)到一定層數(shù)后, 再增加隱藏層層數(shù)效果會(huì)變差。 其他關(guān)鍵超參數(shù)設(shè)置如下表1所示。
3.3 實(shí)驗(yàn)結(jié)果分析
3.3.1 BiLSTM-Attention模型識(shí)別結(jié)果分析
BiLSTM-Attention模型經(jīng)訓(xùn)練后對20%的樣本測試, 實(shí)驗(yàn)表明本文提出的網(wǎng)絡(luò)模型準(zhǔn)確率達(dá)到97.3%, 為進(jìn)一步觀測各識(shí)別意圖之間的關(guān)系, 制作數(shù)據(jù)集的混淆矩陣, 對角線表示識(shí)別正確的樣本個(gè)數(shù), 如表2所示。
可以看出, 模型對于7種意圖識(shí)別皆具有較高識(shí)別準(zhǔn)確率, 特別是撤退意圖的識(shí)別準(zhǔn)確率可達(dá)到100%。 對于攻擊意圖有較少部分錯(cuò)誤識(shí)別為佯攻意圖, 偵察意圖和監(jiān)視意圖也有少部分相互識(shí)別錯(cuò)誤, 經(jīng)分析應(yīng)是兩種意圖對應(yīng)的空戰(zhàn)特征相似性較高、 意圖欺騙性更強(qiáng), BiLSTM神經(jīng)網(wǎng)絡(luò)無法確保訓(xùn)練的模型權(quán)重在識(shí)別此類戰(zhàn)術(shù)意圖之間有明顯差別, 故最后的注意力機(jī)制層無法準(zhǔn)確地感知到兩者之間的權(quán)重差異, 從而導(dǎo)致有少部分意圖相互識(shí)別錯(cuò)誤情況出現(xiàn), 符合實(shí)際情況。
3.3.2 模型的對比實(shí)驗(yàn)
本實(shí)驗(yàn)選取100次迭代過程中, 測試集上最高的準(zhǔn)確率作為該模型的準(zhǔn)確率, 相對應(yīng)的損失值即為該模型的損失值。 使用本文所提模型BiLSTM-Attention分別與文獻(xiàn)[9]提出的棧式自編碼器(SAE)戰(zhàn)術(shù)意圖智能識(shí)別模型、 文獻(xiàn)[10]提出的基于LSTM的戰(zhàn)場對敵目標(biāo)戰(zhàn)術(shù)意圖識(shí)別模型、 文獻(xiàn)[16]提出的使用ReLU函數(shù)和Adam算法優(yōu)化的DBP神經(jīng)網(wǎng)絡(luò)空中目標(biāo)作戰(zhàn)意圖識(shí)別模型、 傳統(tǒng)的多分類模型支持向量機(jī)(SVM)和多層感知機(jī)(MLP)進(jìn)行對比實(shí)驗(yàn)。 對比實(shí)驗(yàn)參數(shù)設(shè)置如表3所示, 實(shí)驗(yàn)具體結(jié)果如表4所示。
從表4可看出, 本文所提出的模型BiLSTM-Attention較其他五種模型在準(zhǔn)確度和損失值兩方面都表現(xiàn)得更加優(yōu)異, 較兩種傳統(tǒng)機(jī)器學(xué)習(xí)方法SVM和MLP準(zhǔn)確率可提高約30%, 較傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法準(zhǔn)確率可提高約20%, 較基礎(chǔ)LSTM模型準(zhǔn)確率提高2.8%, 從而驗(yàn)證本文所提模型對于空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別的有效性。 進(jìn)一步分析, LSTM與BiLSTM-Attention作為以RNN為基礎(chǔ)的時(shí)序特征網(wǎng)絡(luò)模型較其他模型更加適用空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別, 進(jìn)一步說明依據(jù)時(shí)序特征變化來判斷空中目標(biāo)意圖更加具有科學(xué)性。
3.3.3 模型消融實(shí)驗(yàn)
雖然BiLSTM-Attention模型與LSTM, SAE, DBP, MLP, SVM模型的對比實(shí)驗(yàn)已經(jīng)充分說明BiLSTM-Attention模型具有高準(zhǔn)確率和低損失率的特點(diǎn), 能準(zhǔn)確識(shí)別空中目標(biāo)戰(zhàn)術(shù)意圖, 但其畢竟不屬于同種類型混合實(shí)驗(yàn)?zāi)P偷膶Ρ龋?缺少一定實(shí)驗(yàn)說服力。 因此, 在同一數(shù)據(jù)集上做模型消融實(shí)驗(yàn), 其實(shí)驗(yàn)結(jié)果如表5、 圖11~12所示。
從表5中可以看出, 本文所提模型準(zhǔn)確率可高達(dá)97.3%, 對比LSTM, LSTM-Attention, BiLSTM模型使準(zhǔn)確率分別提升了2.8%, 1.5%, 和1.1%。 所提模型損失值對比其他三種模型也更低。 從圖11~12的消融實(shí)驗(yàn)準(zhǔn)確率與損失值變化情況分析, 四種模型中從左往右看隨訓(xùn)練輪次的增加總體上準(zhǔn)確率不斷提高, 損失值不斷降低, 其中BiLSTM-Attention模型始終優(yōu)于其余三種模型, BiLSTM-Attention與BiLSTM在最初訓(xùn)練不久后, 其準(zhǔn)確率和損失值就明顯優(yōu)于其余兩種模型, 經(jīng)分析認(rèn)為雙向傳播機(jī)制能有效提高訓(xùn)練效果, 使神經(jīng)網(wǎng)絡(luò)模型在相同批量大小、 學(xué)習(xí)率、 訓(xùn)練輪次的情況下能更快地學(xué)習(xí)。 BiLSTM與LSTM-Attention兩種模型曲線較為接近, 且都明顯優(yōu)于LSTM模型, 可見通過引入雙向傳播機(jī)制和注意力機(jī)制對于LSTM模型有明顯提升。
引入精確率(意圖識(shí)別正確的正樣本個(gè)數(shù)占意圖識(shí)別器判定為正樣本個(gè)數(shù)的比例)、 召回率(意圖識(shí)別正確的正樣本個(gè)數(shù)占實(shí)際的正樣本個(gè)數(shù)的比例)、 F1-分?jǐn)?shù)(精確率和召回率的調(diào)和平均值)三種模型評估指標(biāo), 進(jìn)一步驗(yàn)證模型優(yōu)越性。 結(jié)果見表6。
表5中①、 ②、 ③、 ④分別表示BiLSTM-Attention、 BiLSTM、 LSTM-Attention、 LSTM空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別模型。 可以得出四種模型對于佯攻和監(jiān)視意圖識(shí)別率相對較低, 經(jīng)分析, 應(yīng)是這兩種意圖與攻擊意圖和偵察意圖空戰(zhàn)特征相似性較高, 對于撤退意圖識(shí)別率較高。 BiLSTM與LSTM-Attention模型三種評估指標(biāo)結(jié)果相差較小, 但都明顯高于LSTM, BiLSTM-Attention模型在各項(xiàng)評估指標(biāo)中全面占優(yōu), 證明了本文所提模型能夠以高準(zhǔn)確度對空中目標(biāo)戰(zhàn)術(shù)意圖進(jìn)行識(shí)別。
4 結(jié)? 論
本文針對在復(fù)雜戰(zhàn)場環(huán)境下僅依靠專家經(jīng)驗(yàn)很難高效識(shí)別敵方目標(biāo)意圖, 且傳統(tǒng)空中目標(biāo)戰(zhàn)術(shù)意圖識(shí)別僅依據(jù)單一時(shí)刻分析, 缺乏科學(xué)性, 準(zhǔn)確率較低的問題, 分析了空戰(zhàn)目標(biāo)戰(zhàn)術(shù)意圖識(shí)別問題特點(diǎn)。 采用分層策略從威脅程度和作戰(zhàn)任務(wù)兩方面選取共17維空戰(zhàn)特征, 將決策人員的認(rèn)知經(jīng)驗(yàn)封裝作為標(biāo)簽, 提出一種利用空中目標(biāo)時(shí)序特征變化的BiLSTM-Attention空戰(zhàn)目標(biāo)戰(zhàn)術(shù)意圖識(shí)別模型。 該模型利用BiLSTM神經(jīng)網(wǎng)絡(luò)充分學(xué)習(xí)連續(xù)12幀空戰(zhàn)特征信息, 提取更為深層次特征, 而后利用注意力機(jī)制對特征分配不同權(quán)重, 以達(dá)到更加精確識(shí)別意圖的目的。 通過與其他模型對比實(shí)驗(yàn)顯示, 本文所提模型學(xué)習(xí)速度較快且識(shí)別準(zhǔn)確率更高。 本文模型對于空戰(zhàn)特征相似性高、 欺騙性強(qiáng)的意圖識(shí)別還存在不足, 以及在所檢測的時(shí)間序列中意圖若發(fā)生改變應(yīng)如何識(shí)別, 這將是下一步研究的重點(diǎn)。
參考文獻(xiàn):
[1] 樊會(huì)濤, 閆俊.? 自主化——機(jī)載導(dǎo)彈重要的發(fā)展方向[J]. 航空兵器, 2019, 26(1): 1-10.
Fan Huitao, Yan Jun.? The Important Development Direction of Airborne Missile:?? Autonomization[J].? Aero Weaponry, 2019, 26(1): 1-10. (in Chinese)
[2] 劉鉆東,? 陳謀,? 吳慶憲,? 等. 非完備信息下無人機(jī)空戰(zhàn)目標(biāo)意圖預(yù)測[J]. 中國科學(xué): 信息科學(xué),? 2020,? 50(5): 704-717.
Liu Zuandong,? Chen Mou,? Wu Qingxian,? et al. Prediction of Unmanned Aerial Vehicle Target Intention under Incomplete Information[J]. Scientia Sinica Informationis,? 2020,? 50(5): 704-717.(in Chinese)
[3] 趙福均,? 周志杰,? 胡昌華,? 等. 基于置信規(guī)則庫和證據(jù)推理的空中目標(biāo)意圖識(shí)別方法[J]. 電光與控制,? 2017,? 24(8): 15-19.
Zhao Fujun,? Zhou Zhijie,? Hu Changhua,? et al. Aerial Target Intention Recognition Approach Based on Belief-Rule-Base and Evidential Reasoning[J]. Electronics Optics & Control,? 2017,? 24(8): 15-19.(in Chinese)
[4] 李香亭. 態(tài)勢估計(jì)中目標(biāo)意圖識(shí)別的研究與實(shí)現(xiàn)[D]. 太原: 中北大學(xué),? 2012.
Li Xiangting. The Research and Implementation of Situation Assessment in the Target Intention Recognition[D]. Taiyuan: North University of China,? 2012. (in Chinese)
[5] 尹翔,? 張萌,? 陳夢喬. 基于判別分析的空中目標(biāo)作戰(zhàn)意圖識(shí)別[J]. 彈箭與制導(dǎo)學(xué)報(bào),? 2018,? 38(3): 46-50.
Yin Xiang,? Zhang Meng,? Chen Mengqiao. Combat Intention Re-cognition of the Target in the Air Based on Discriminant Analysis[J]. Journal of Projectiles, Rockets, Missiles and Guidance,? 2018,? 38(3): 46-50.(in Chinese)
[6] Jin Q,? Gou X T,? Jin W D,? et al. Intention Recognition of Aerial Targets Based on Bayesian Optimization Algorithm[C]∥ 2nd IEEE International Conference on Intelligent Transportation Engineering,? 2017: 356-359.
[7] Song Y,? Zhang X H,? Wang Z K. Target Intention Inference Model Based on Variable Structure Bayesian Network[C]∥ International Conference on Computational Intelligence and Software Engineering,? 2009: 1-4.
[8] 吳南方. 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的集群意圖識(shí)別方法研究[D]. 成都: 西南交通大學(xué),? 2019.
Wu Nanfang. Research on Cluster Intention Recognition Method Based on Recurrent Neural Network[D]. Chengdu: Southwest Jiaotong University,? 2019. (in Chinese)
[9] 歐微,? 柳少軍,? 賀筱媛,? 等. 基于時(shí)序特征編碼的目標(biāo)戰(zhàn)術(shù)意圖識(shí)別算法[J]. 指揮控制與仿真,? 2016, ?38(6): 36-41.
Ou Wei,? Liu Shaojun,? He Xiaoyuan,? et al. Tactical Intention Re-cognition Algorithm Based on Encoded Temporal Features[J]. Command Control & Simulation,? 2016,? 38(6): 36-41.(in Chinese)
[10] 歐微,? 柳少軍,? 賀筱媛,? 等. 戰(zhàn)場對敵目標(biāo)戰(zhàn)術(shù)意圖智能識(shí)別模型研究[J]. 計(jì)算機(jī)仿真,? 2017,? 34(9): 10-14.
Ou Wei,? Liu Shaojun,? He Xiaoyuan,? et al. Study on the Intelligent Recognition Model of Enemy Targets Tactical Intention on Battlefield[J]. Computer Simulation,? 2017,? 34(9): 10-14.(in Chinese)
[11] Zhou T L,? Chen M,? Wang Y H,? et al. Information Entropy-Based Intention Prediction of Aerial Targets under Uncertain and Incomplete Information[J]. Entropy,? 2020, 22(3): 279.
[12] 陳浩,? 任卿龍,? 滑藝,? 等. 基于模糊神經(jīng)網(wǎng)絡(luò)的海面目標(biāo)戰(zhàn)術(shù)意圖識(shí)別[J]. 系統(tǒng)工程與電子技術(shù), ?2016,? 38(8): 1847-1853.
Chen Hao,? Ren Qinglong,? Hua Yi,? et al. Fuzzy Neural Network Based Tactical Intention Recognition for Sea Targets[J]. Systems Engineering and Electronics,? 2016,? 38(8): 1847-1853.(in Chinese)
[13] 張?zhí)旌眨? 彭紹雄,? 鄒強(qiáng),? 等. 無監(jiān)督神經(jīng)網(wǎng)絡(luò)的潛艇對空戰(zhàn)術(shù)意圖識(shí)別[J]. 現(xiàn)代防御技術(shù),? 2018,? 46(2): 122-129.
Zhang Tianhe,? Peng Shaoxiong,? Zou Qiang,? et al. Unsupervised Learning Neural Network Based Submarine Recognize Tactical Intention for Air Target[J]. Modern Defence Technology,? 2018,? 46(2): 122-129.(in Chinese)
[14] 陸光宇,? 丁迎迎. 水下平臺(tái)對敵意圖識(shí)別技術(shù)研究[J]. 指揮控制與仿真,? 2012,? 34(6): 100-102.
Lu Guangyu,? Ding Yingying. Study on Intention Recognition to? Foe of Underwater Platform[J]. Command Control & Simulation,? 2012,? 34(6): 100-102.(in Chinese)
[15] 奚之飛,? 徐安,? 寇英信,? 等. 基于PCA-MPSO-ELM的空戰(zhàn)目標(biāo)威脅評估[J]. 航空學(xué)報(bào),? 2020,? 41(9): 216-231.
Xi Zhifei,? Xu An,? Kou Yingxin,? et al. Target Threat Assessment in Air Combat Based on PCA-MPSO-ELM Algorithm[J]. Acta Aeronautica et Astronautica Sinica, ?2020,? 41(9): 216-231.(in Chinese)
[16] 周旺旺,? 姚佩陽,? 張杰勇,? 等. 基于深度神經(jīng)網(wǎng)絡(luò)的空中目標(biāo)作戰(zhàn)意圖識(shí)別[J]. 航空學(xué)報(bào),? 2018,? 39(11): 200-208.
Zhou Wangwang,? Yao Peiyang,? Zhang Jieyong,? et al. Combat Intention Recognition for Aerial Targets Based on Deep Neural Network[J]. Acta Aeronautica et Astronautica Sinica,? 2018,? 39(11): 200-208.(in Chinese)
[17] 朱可欽,? 董彥非. 空戰(zhàn)機(jī)動(dòng)動(dòng)作庫設(shè)計(jì)方式研究[J]. 航空計(jì)算技術(shù),? 2001,? 31(4): 50-52.
Zhu Keqin,? Dong Yanfei. Study on the Design of Air Combat Maneuver Library[J]. Aeronautical Computer Technique,? 2001,? 31(4): 50-52.(in Chinese)
[18] 周思羽,? 吳文海,? 李翔,? 等. 空戰(zhàn)機(jī)動(dòng)決策集模型分析[J]. 飛機(jī)設(shè)計(jì),? 2012,? 32(3): 42-45.
Zhou Siyu,? Wu Wenhai,? Li Xiang,? et al. Analysis of Air Combat Maneuver Decision Set Model[J]. Aircraft Design,? 2012,? 32(3): 42-45.(in Chinese)
[19] 李俊生,? 梁偉,? 劉雪梅,? 等. 基于離差最大化的導(dǎo)彈中段目標(biāo)威脅度評估[J]. 系統(tǒng)工程理論與實(shí)踐,? 2007,? 27(5): 164-167.
Li Junsheng,? Liang Wei,? Liu Xuemei,? et al. The Multi-Attribute Evaluation of Menace of Targets in Midcourse of Ballistic Missile Based on Maximal Windage Method[J]. Systems Engineering-Theory & Practice,? 2007,? 27(5): 164-167.(in Chinese)
[20] Qiao Y C,? Zhang B,? Zhang W Z,? et al. DGA Domain Name Classification Method Based on Long Short-Term Memory with Attention Mechanism[J]. Applied Sciences,? 2019,? 9(20): 4205.
[21] Chen J X,? Jiang D M,? Zhang Y N. A Hierarchical Bidirectional GRU Model with Attention for EEG-Based Emotion Classification[J]. IEEE Access,? 2019,? 7: 118530-118540.
[22] 朱銘康,? 盧先領(lǐng). 基于Bi-LSTM-Attention模型的人體行為識(shí)別算法[J]. 激光與光電子學(xué)進(jìn)展,? 2019,? 56(15): 153-161.
Zhu Mingkang,? Lu Xianling. Human Action Recognition Algorithm Based on Bi-LSTM-Attention Model[J]. Laser & Optoelectronics Progress,? 2019,? 56(15): 153-161.(in Chinese)
BiLSTM-Attention: An Air Target Tactical
Intention Recognition Model
Teng Fei, Liu Shu, Song Yafei*
(Air and Missile Defense College,? Air Force Engineering University,? Xian 710051,? China)
Abstract: ?In the traditional air target tactical intention recognition process,? reasoning analysis is only based on a single moment,? but in the actual battlefield,? the target tactical intention is realized by a series of actions,? so the target state presents the characteristics of dynamic and temporal changes. In order to solve this problem,? the bi-directional(Bidirectional) propagation mechanism and attention(Attention) mechanism are introduced on the basis of long-term and short-term memory network (LSTM),? and a target tactical intention recognition model based on BiLSTM-Attention is proposed. The hierarchical method is used to construct the feature set of air combat intention and encode it into time series feature. The decision makers experience is encapsulated into a label. The deep information in the feature vector of air combat intention is learned by BiLSTM neural network,? and the network weight is adaptively assigned by attention mechanism. Finally,? the air combat feature information with different weights is put into Softmax function layer for intention recognition. Through the comparison with the traditional air tactical target intention recognition model and the analysis of? ablation experimental,? the proposed model effectively improves the recognition efficiency of air target tactical intention. It has important theoretical significance and reference value for auxiliary combat system.
Key words: ?intention recognition; attention mechanism; bi-directional long-term and? short-term memory network; air target; temporal feature