王因翰,范世鵬,*,吳廣,王江,何紹溟
1.北京理工大學(xué) 宇航學(xué)院,北京 100081
2.北京航天自動(dòng)控制研究所,北京 100854
近幾十年來(lái),防御體系不斷完善,我方飛行器在飛行過(guò)程中所面臨的生存壓力不斷增大,如何有效避開(kāi)敵方攔截彈的攻擊是飛行器研發(fā)過(guò)程中的一項(xiàng)重要課題。目前飛行器規(guī)避攔截的主要策略有基于微分對(duì)策的規(guī)避策略和隨機(jī)機(jī)動(dòng)規(guī)避策略。無(wú)論采用哪種博弈策略,為更好地規(guī)避攔截,都需要利用我方飛行器探測(cè)到的與敵方攔截彈相對(duì)運(yùn)動(dòng)信息,對(duì)其所用制導(dǎo)律及制導(dǎo)參數(shù)進(jìn)行在線辨識(shí)。與單純基于運(yùn)動(dòng)學(xué)的傳統(tǒng)軌跡預(yù)測(cè)及規(guī)避策略相比,基于制導(dǎo)律辨識(shí)的規(guī)避策略能夠更準(zhǔn)確地預(yù)測(cè)敵方攔截彈飛行路線,制定針對(duì)性更強(qiáng)的規(guī)避方案。
然而,研究制導(dǎo)律辨識(shí)的文獻(xiàn)數(shù)量較少。攔截彈制導(dǎo)律辨識(shí)是一個(gè)復(fù)雜動(dòng)態(tài)問(wèn)題,若對(duì)攔截彈制導(dǎo)律辨識(shí)僅依靠某一時(shí)刻運(yùn)動(dòng)學(xué)信息,則辨識(shí)結(jié)果具有片面性。傳統(tǒng)辨識(shí)方法以卡爾曼濾波器為基礎(chǔ),通過(guò)將所測(cè)到的敵方導(dǎo)彈運(yùn)動(dòng)信息與卡爾曼濾波器的預(yù)測(cè)信息進(jìn)行對(duì)比,不斷調(diào)整卡爾曼濾波器輸出數(shù)值直至測(cè)量值與真實(shí)值相近。文獻(xiàn)[13-14]設(shè)計(jì)了基于非線性多模自適應(yīng)卡爾曼濾波器的制導(dǎo)律辨識(shí)方法,設(shè)置多個(gè)卡爾曼濾波器并行運(yùn)行,每個(gè)濾波器代表一種可能的敵方攔截彈制導(dǎo)律;文獻(xiàn)[15]在海戰(zhàn)防空攔截背景下對(duì)交互卡爾曼濾波進(jìn)行了改進(jìn),利用改進(jìn)交互卡爾曼濾波器對(duì)敵方反艦導(dǎo)彈所用制導(dǎo)律進(jìn)行辨識(shí)。基于卡爾曼濾波器的制導(dǎo)律辨識(shí)方法通常通過(guò)與其他方法相結(jié)合來(lái)增強(qiáng)模型的適應(yīng)性和準(zhǔn)確度,這類(lèi)辨識(shí)方法存在以下問(wèn)題:對(duì)獲取信息的連續(xù)性要求高,使工程應(yīng)用價(jià)值大打折扣,同時(shí),也限制了我方飛行器的機(jī)動(dòng)性;辨識(shí)過(guò)渡過(guò)程較長(zhǎng),在1 s以上,不能滿足強(qiáng)對(duì)抗條件下的快速性要求。
神經(jīng)網(wǎng)絡(luò)因其強(qiáng)大的自主學(xué)習(xí)能力,可從大量數(shù)據(jù)中提煉基本規(guī)律,在諸多問(wèn)題上都得到了廣泛的應(yīng)用。其中,長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)因其可模擬人類(lèi)長(zhǎng)期和短期記憶篩選能力,在解決動(dòng)態(tài)問(wèn)題上大放異彩。文獻(xiàn)[24]使用LSTM 網(wǎng)絡(luò)提出了一種時(shí)變結(jié)構(gòu)振動(dòng)觀測(cè)模型,建立了時(shí)變結(jié)構(gòu)動(dòng)力特性與振動(dòng)間關(guān)系,能夠?qū)崿F(xiàn)對(duì)時(shí)變結(jié)構(gòu)模型的在線分析。文獻(xiàn)[25]針對(duì)空間機(jī)器人系統(tǒng)慣性張量測(cè)量問(wèn)題,利用LSTM 神經(jīng)網(wǎng)絡(luò)建立了慣性張量在軌辨識(shí)模型。文獻(xiàn)[26]建立了基于LSTM 的戰(zhàn)場(chǎng)意圖識(shí)別模型,通過(guò)綜合分析戰(zhàn)場(chǎng)傳感器獲得的多源信息,實(shí)現(xiàn)對(duì)敵方目標(biāo)粗粒度戰(zhàn)術(shù)意圖的識(shí)別。文獻(xiàn)[27]應(yīng)用門(mén)循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)對(duì)航空發(fā)動(dòng)機(jī)的剩余壽命進(jìn)行預(yù)測(cè),辨識(shí)依據(jù)為航空發(fā)動(dòng)機(jī)內(nèi)部多個(gè)位置處的速度、維度和壓力。LSTM 網(wǎng)絡(luò)初步實(shí)現(xiàn)了動(dòng)態(tài)問(wèn)題數(shù)據(jù)快速分析,然而,由于其規(guī)模龐大,導(dǎo)致訓(xùn)練時(shí)間過(guò)長(zhǎng),為此,GRU 網(wǎng)絡(luò)在LSTM 網(wǎng)絡(luò)結(jié)構(gòu)上進(jìn)行了簡(jiǎn)化,在幾乎不影響網(wǎng)絡(luò)性能的條件下,有效地提升了網(wǎng)絡(luò)的訓(xùn)練速度。
針對(duì)強(qiáng)對(duì)抗條件下的敵方攔截彈制導(dǎo)律辨識(shí)問(wèn)題,考慮到GRU 網(wǎng)絡(luò)的優(yōu)勢(shì),本文提出了一種基于GRU 網(wǎng)絡(luò)的制導(dǎo)律快速辨識(shí)方法。建立相對(duì)運(yùn)動(dòng)學(xué)模型,以一段時(shí)間內(nèi)的敵我運(yùn)動(dòng)學(xué)信息作為樣本輸入,將所使用的攔截彈制導(dǎo)律參數(shù)作為類(lèi)型標(biāo)簽,為該網(wǎng)絡(luò)構(gòu)建大量的多樣化樣本庫(kù);其次,給定損失參數(shù),采用Adam 算法對(duì)GRU 網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使網(wǎng)絡(luò)參數(shù)達(dá)到最優(yōu),利用完成訓(xùn)練的GRU 網(wǎng)絡(luò),即可實(shí)現(xiàn)對(duì)敵方攔截彈制導(dǎo)律的在線快速辨識(shí),在噪聲較大的條件下,辨識(shí)準(zhǔn)確度仍保持較高的水準(zhǔn)。
在慣性坐標(biāo)系下建立我方飛行器與敵方攔截彈(導(dǎo)彈)的運(yùn)動(dòng)學(xué)模型。導(dǎo)彈初始位置位于坐標(biāo)系原點(diǎn),豎直向上,垂直于指向目標(biāo),按照右手定則確定,如圖1所示。
圖1 敵方攔截彈攔截我方飛行器示意圖Fig.1 Schematic view of an aircraft intercepted by an enemy missile
敵方攔截彈運(yùn)動(dòng)學(xué)可描述為
式中:、、為攔截彈在慣性系中的坐標(biāo);、為攔截彈速度傾角和速度偏角;()為攔截彈質(zhì)量;()為導(dǎo)彈推力;為攔截彈所受阻力;n 、n 分別為的攔截彈俯仰和偏航加速度。
比例導(dǎo)引(PN)制導(dǎo)律是目前應(yīng)用最為廣泛的制導(dǎo)律,在攻擊目標(biāo)過(guò)程中,導(dǎo)彈需用過(guò)載與相對(duì)速度和彈目視線角的乘積成正比;增強(qiáng)比例導(dǎo)引(APN)在PN 基礎(chǔ)上增加了目標(biāo)機(jī)動(dòng)補(bǔ)償項(xiàng),從而降低在命中點(diǎn)附近的彈道需用法向過(guò)載。2種制導(dǎo)律生成的加速度指令分別為
式中:為制導(dǎo)參數(shù);為目標(biāo)加速度。
在我方飛行器攻擊末段,可近似認(rèn)為敵方攔截彈速度大小是不變的,即
我方飛行器在三維空間中按照一定規(guī)律進(jìn)行機(jī)動(dòng),敵方可精確制導(dǎo)的攔截彈對(duì)我方飛行器進(jìn)行攔截。在飛行過(guò)程中,我方飛行器可通過(guò)機(jī)載或彈載雷達(dá)實(shí)時(shí)獲取敵方攔截彈運(yùn)動(dòng)學(xué)信息,包括相對(duì)距離、彈目視線傾角q 和彈目視線偏角q 。在敵我相對(duì)運(yùn)動(dòng)模型中,其各自計(jì)算表達(dá)式為
敵方攔截彈以我方飛行器為目標(biāo),采用不同的制導(dǎo)律或制導(dǎo)參數(shù),都會(huì)控制攔截彈產(chǎn)生不同的加速度,進(jìn)而使其沿著不同運(yùn)動(dòng)路線飛行,如圖2所示。
圖2 使用不同制導(dǎo)律導(dǎo)彈沿不同軌跡接近飛行器Fig.2 Missiles with different guidance laws approaching aircraft along different trajectories
圖3 信息獲取及辨識(shí)過(guò)程Fig.3 Process of information acquisition and guidance law identification
LSTM網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種,其通過(guò)“門(mén)”的設(shè)計(jì)實(shí)現(xiàn)對(duì)長(zhǎng)期記憶的保留,解決了原始RNN 網(wǎng)絡(luò)在模型訓(xùn)練過(guò)程中存在的“梯度爆炸”或“梯度消失”問(wèn)題。GRU 網(wǎng)絡(luò)將LSTM 神經(jīng)元結(jié)構(gòu)合并簡(jiǎn)化,在保證準(zhǔn)確率的同時(shí),加快訓(xùn)練速度,并減少存儲(chǔ)空間。
神經(jīng)網(wǎng)絡(luò)由大量神經(jīng)元組成,GRU 神經(jīng)元內(nèi)部結(jié)構(gòu)如圖4所示。
圖4 GRU 神經(jīng)元內(nèi)部結(jié)構(gòu)Fig.4 Inner structure of GRU
GRU 神經(jīng)元由以下幾部分組成:
1)兩個(gè)輸入:上一時(shí)刻的神經(jīng)元輸出h 和上一層的神經(jīng)元輸出x ,用來(lái)傳承上一時(shí)刻神經(jīng)元的輸出和接收上一層神經(jīng)元的輸出。
2)兩個(gè)門(mén):重置門(mén)r ,用于計(jì)算之前的記憶需要保留多少;更新門(mén)z ,用于計(jì)算當(dāng)前時(shí)刻的更新內(nèi)容,計(jì)算方法為
4)一個(gè)輸出:最終輸出h ,根據(jù)當(dāng)前的輸入和內(nèi)部狀態(tài)計(jì)算輸出,計(jì)算方法為
式(5)~式(7)中:表 示sigmoid函 數(shù);表 示 權(quán)重矩陣;表示偏置量;計(jì)算符號(hào)·表示矩陣乘,計(jì)算符號(hào)⊙表示按元素乘。
GRU 網(wǎng)絡(luò)輸入端為
式中:size(input)表示輸入端矩陣大??;表示輸入維度;表示輸入步長(zhǎng)。輸入數(shù)據(jù)為二維矩陣形式,相比于一維輸入的BP 網(wǎng)絡(luò),GRU 網(wǎng)絡(luò)可快速識(shí)別發(fā)現(xiàn)不同特征量在不同時(shí)間點(diǎn)變化。
使用GRU 網(wǎng)絡(luò)建立制導(dǎo)律辨識(shí)模型如圖5所示,包含輸入層、3個(gè)隱含層、輸出層,其中為隱含層神經(jīng)元數(shù)量。
圖5 基于GRU 制導(dǎo)律辨識(shí)模型Fig.5 Guidance law identification model based on GRU
輸入層輸入數(shù)據(jù)為敵我雙方運(yùn)動(dòng)學(xué)信息,采用tanh函數(shù)作為激活函數(shù),將時(shí)刻的輸入加權(quán)并壓縮到[-1,1]區(qū)間內(nèi),計(jì)算公式為
式中:h 為輸入層傳遞到隱含層的信息;w 為權(quán)重矩陣;x 為時(shí)刻輸入信息。
假設(shè)制導(dǎo)律及制導(dǎo)參數(shù)屬于給定集合,輸出層輸出為不同制導(dǎo)律的概率,輸出層計(jì)算公式為
輸出層激活函數(shù)為softmax,使GRU 網(wǎng)絡(luò)的輸出結(jié)果滿足:
本文采用監(jiān)督學(xué)習(xí)的方式對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,基于前述運(yùn)動(dòng)學(xué)模型進(jìn)行數(shù)學(xué)仿真提取數(shù)據(jù)建立樣本庫(kù),對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
網(wǎng)絡(luò)訓(xùn)練是指網(wǎng)絡(luò)不斷調(diào)整各參數(shù)值以適應(yīng)訓(xùn)練樣本輸入輸出的過(guò)程,用于訓(xùn)練的樣本對(duì)網(wǎng)絡(luò)的優(yōu)化效果至關(guān)重要。為了盡可能覆蓋樣本空間,本文通過(guò)不同的敵我雙方初始狀態(tài)、我方目標(biāo)運(yùn)動(dòng)軌跡等方式使訓(xùn)練樣本多樣化。
樣本輸入形式為
式中:a 表示第時(shí)刻的輸入向量,上標(biāo)T 表示我方飛行器運(yùn)動(dòng)學(xué)信息,上標(biāo)M 表示敵方攔截彈運(yùn)動(dòng)學(xué)信息,上標(biāo)TM 表示敵我雙方相對(duì)運(yùn)動(dòng)學(xué)信息;為輸入步數(shù)。
為加快模型收斂,在輸入數(shù)據(jù)前需將原始數(shù)據(jù)轉(zhuǎn)化為區(qū)間相同的、無(wú)量綱的數(shù)值,即對(duì)其進(jìn)行標(biāo)準(zhǔn)化和歸一化處理,消除不同指標(biāo)之間因?qū)傩圆煌鴰?lái)的影響。當(dāng)前廣泛應(yīng)用的處理方法有最大最小線性變化、Logistics/Softmax 變化、反正切函數(shù)變化、Z-score規(guī)范化和對(duì)數(shù)變換等。本文采用的是最大最小線性變化,將數(shù)據(jù)縮放到[0,1]區(qū)間內(nèi),計(jì)算公式為
采用one-hot方法為樣本添加標(biāo)簽,標(biāo)簽與制導(dǎo)律映射關(guān)系如圖6所示。
圖6 標(biāo)簽與制導(dǎo)律映射關(guān)系Fig.6 Mapping relationship between tags and guidance laws
采用滑動(dòng)時(shí)窗方式生成樣本以最大限度利用數(shù)據(jù),如圖7所示。為保證網(wǎng)絡(luò)適應(yīng)性及廣泛性,在從敵我雙方相對(duì)運(yùn)動(dòng)模型提取數(shù)據(jù)過(guò)程中。
圖7 樣本生成方法Fig.7 Method of sample generation
基于Adam 算法對(duì)GRU 網(wǎng)絡(luò)進(jìn)行訓(xùn)練,該算法將Momentum 算法與RMSprop算法相結(jié)合,加入動(dòng)量并使參數(shù)自適應(yīng)訓(xùn)練。與BP 算法相比,Adam 算法能夠有效避免網(wǎng)絡(luò)陷入局部最優(yōu)點(diǎn),加速網(wǎng)絡(luò)收斂,提高算法魯棒性。
選取交叉熵函數(shù)作為損失函數(shù),其計(jì)算公式為
首先,計(jì)算各參數(shù)對(duì)目標(biāo)函數(shù)的梯度:
式中:為損失函數(shù);為所需訓(xùn)練參數(shù),包括權(quán)重和偏置。權(quán)重與偏置訓(xùn)練方式相同,下面推導(dǎo)以權(quán)重w 為例進(jìn)行。
根據(jù)GRU 基本神經(jīng)元內(nèi)部結(jié)構(gòu),式(15)可化為
對(duì)于其他層之前時(shí)刻神經(jīng)元,其神經(jīng)元內(nèi)部誤差傳遞項(xiàng)均為
1)沿時(shí)間反向傳播
2)沿層反向傳播
由此式(21)可化為
由式(16)、式(18)、式(20)、式(23),可計(jì)算得要訓(xùn)練的參數(shù),∈{,}目標(biāo)函數(shù)的梯度g 。
對(duì)于和中的某一具體元素,基于Adam算法的參數(shù)更新公式為
式中:θ為更新前參數(shù);θ為更新后參數(shù);k為所訓(xùn)練參數(shù)在梯度矩陣g 中對(duì)應(yīng)梯度元素;為學(xué)習(xí)率;為平滑項(xiàng),防止被零除;m'為一階矩估計(jì),v'為二階矩估計(jì);m為梯度一階矩;v 為梯度二階矩。
網(wǎng)絡(luò)流程如圖8 所示。建立好樣本庫(kù)及GRU 網(wǎng)絡(luò)后,分批次從訓(xùn)練樣本庫(kù)中抽取樣本輸入GRU 網(wǎng)絡(luò)中,計(jì)算訓(xùn)練集準(zhǔn)確度、損失函數(shù)值及訓(xùn)練時(shí)間;而后對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練完成后將測(cè)試樣本集輸入網(wǎng)絡(luò)進(jìn)行測(cè)試,得到測(cè)試集準(zhǔn)確度和損失函數(shù)值;不斷重復(fù)直至訓(xùn)練次數(shù)或損失函數(shù)達(dá)到預(yù)設(shè)值。
圖8 神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程Fig.8 Training process of neural network
為驗(yàn)證所提方法準(zhǔn)確度和有效性,進(jìn)行了三部分對(duì)比實(shí)驗(yàn)。神經(jīng)網(wǎng)絡(luò)類(lèi)型直接影響模型辨識(shí)準(zhǔn)確度,為了驗(yàn)證GRU 神經(jīng)網(wǎng)絡(luò)相較其他網(wǎng)絡(luò)的優(yōu)勢(shì),首先進(jìn)行噪聲影響下不同類(lèi)型網(wǎng)絡(luò)辨識(shí)準(zhǔn)確度對(duì)比仿真驗(yàn)證;采用不同輸入步長(zhǎng)對(duì)制導(dǎo)律辨識(shí)的效果不同,第2部分實(shí)驗(yàn)對(duì)比輸入步長(zhǎng)對(duì)模型的影響;神經(jīng)網(wǎng)絡(luò)通過(guò)隱含層來(lái)學(xué)習(xí)數(shù)據(jù)中信息,第3部分實(shí)驗(yàn)探究隱含層神經(jīng)元數(shù)量對(duì)最終結(jié)果的影響。
設(shè)置相對(duì)運(yùn)動(dòng)學(xué)模型仿真步長(zhǎng)為0.001 s,我方飛行器對(duì)攔截彈運(yùn)動(dòng)學(xué)信息測(cè)量更新頻率為50 Hz,輸入步長(zhǎng)包括10、15、20、25、30五種情況,對(duì)應(yīng)的時(shí)間跨度分別為0.2 s、0.3 s、0.4 s、0.5 s、0.6 s。最終提取到訓(xùn)練樣本160 000個(gè),每種時(shí)間跨度樣本各占20%,10種不同制導(dǎo)律各所占比例均為10%,提取到的樣本中隨機(jī)抽取10%用于測(cè)試,其余用于訓(xùn)練。在網(wǎng)絡(luò)訓(xùn)練參數(shù)中,dropout失效率為5%,批處理數(shù)量為3 000,每次實(shí)驗(yàn)迭代次數(shù)為2 000次,網(wǎng)絡(luò)初始學(xué)習(xí)率為0.000 25,每100次迭代學(xué)習(xí)率衰減率為0.85。
選取輸入步長(zhǎng)為15,隱含層數(shù)為3,每個(gè)隱含層神經(jīng)元數(shù)量=81時(shí)不同類(lèi)型神經(jīng)網(wǎng)絡(luò)作為對(duì)比,不同類(lèi)型網(wǎng)絡(luò)的訓(xùn)練效果、辨識(shí)準(zhǔn)確率如圖9和圖10所示。
圖9 不同類(lèi)型神經(jīng)網(wǎng)絡(luò)類(lèi)型損失函數(shù)Fig.9 Loss of different types of neural network
圖10 不同類(lèi)型神經(jīng)網(wǎng)絡(luò)類(lèi)型準(zhǔn)確度Fig.10 Accuracy of different types of neural network
LSTM 網(wǎng)絡(luò)與GRU 網(wǎng)絡(luò)識(shí)別準(zhǔn)確率分別為92.78%和95.88%,較RNN 網(wǎng)絡(luò)89.33%提升3.45%和6.55%,較BP 網(wǎng)絡(luò)提升1.44%和4.547 2%。證明LSTM 與GRU 與BP 相比,在處理與時(shí)序有關(guān)問(wèn)題時(shí)具有較大優(yōu)勢(shì)。
我方飛行器在對(duì)敵方攔截彈運(yùn)動(dòng)學(xué)信息進(jìn)行測(cè)量時(shí)會(huì)存在誤差,相對(duì)運(yùn)動(dòng)模型構(gòu)建與真實(shí)模型之間也會(huì)存在偏差,這兩者對(duì)模型輸入量的影響均可視為高斯白噪聲。設(shè)定各輸入?yún)?shù)噪聲標(biāo)準(zhǔn)差如表1所示,其中,噪聲水平一表示我方飛行器上傳感器正常工作且構(gòu)建模型與實(shí)際情況偏差較小,噪聲水平二表示傳感器因環(huán)境或構(gòu)建模型與實(shí)際情形而存在較大測(cè)量偏差,辨識(shí)準(zhǔn)確率變化如圖11所示。
表1 輸入?yún)?shù)高斯白噪聲標(biāo)準(zhǔn)差Table 1 Standard deviation of white Gaussian noise of input parameters
圖11 噪聲對(duì)不同類(lèi)型網(wǎng)絡(luò)影響Fig.11 Influence of noise on different types of neural network
各類(lèi)型網(wǎng)絡(luò)受噪聲水平一影響后準(zhǔn)確度變?yōu)?8.15% (BP)、85.26% (RNN)、92.37%(LSTM)和95.44% (GRU),分別下降3.19%(BP)、4.06% (RNN)、0.41% (LSTM)和0.44%(GRU),證明較低噪聲水平對(duì)除RNN 網(wǎng)絡(luò)外網(wǎng)絡(luò)的影響都較小。隨著噪聲的增大,各類(lèi)型網(wǎng)絡(luò)準(zhǔn)確度都有所下降,BP網(wǎng)絡(luò)準(zhǔn)確率受噪聲影響最大,準(zhǔn)確度從無(wú)噪聲時(shí)91.34%下降到76.57%,GRU 網(wǎng)絡(luò)受噪聲影響最小,準(zhǔn)確度從無(wú)噪聲時(shí)95.88%下降到86.32%。
輸入片段時(shí)間跨度影響辨識(shí)效果。圖12和圖13對(duì)比了隱含層數(shù)量為3、每個(gè)隱含層神經(jīng)元數(shù)量=81和=100兩種情況下采用不同時(shí)間跨度對(duì)制導(dǎo)律進(jìn)行辨識(shí)時(shí)網(wǎng)絡(luò)訓(xùn)練效果及辨識(shí)準(zhǔn)確度。
圖12 不同輸入步長(zhǎng)下神經(jīng)網(wǎng)絡(luò)的損失函數(shù)Fig.12 Loss of neural network with different input steps
圖13 不同輸入步長(zhǎng)下神經(jīng)網(wǎng)絡(luò)的辨識(shí)準(zhǔn)確度Fig.13 Accuracy of neural network with different input steps
由圖12和圖13中可得,網(wǎng)絡(luò)損失度隨迭代次數(shù)增加不斷下降,最終損失度最大值為0.330 9,所有模型最后均能夠收斂。時(shí)間跨度為0.3 s和0.5 s時(shí)識(shí)別效果較好,但時(shí)間跨度為0.3 s時(shí)輸入步長(zhǎng)更少,所需計(jì)算量更小。
傳統(tǒng)基于濾波器的制導(dǎo)律辨識(shí)方法辨識(shí)所用時(shí)間在1 s以上,而基于GRU 網(wǎng)絡(luò)的制導(dǎo)律辨識(shí)網(wǎng)絡(luò)在完成訓(xùn)練后,實(shí)際使用中僅需將設(shè)定時(shí)間跨度內(nèi)的運(yùn)動(dòng)學(xué)信息片段輸入到網(wǎng)絡(luò)中即可,辨識(shí)所用時(shí)間在0.5 s內(nèi),相比于前者所用時(shí)間縮短50%以上。且前者要求我方飛行器滿足實(shí)時(shí)對(duì)攔截彈進(jìn)行測(cè)量,限制了飛行器機(jī)動(dòng)行,后者對(duì)測(cè)量連續(xù)性要求更低,在整個(gè)飛行過(guò)程中只需有一段時(shí)間片段滿足時(shí)間跨度要求即可。
每個(gè)隱含層都是在上一隱含層學(xué)習(xí)到特征基礎(chǔ)上繼續(xù)進(jìn)行學(xué)習(xí),隱含層神經(jīng)元數(shù)量越多,該隱含層所能提取到的信息越充分。但神經(jīng)元數(shù)量增多會(huì)使訓(xùn)練參數(shù)數(shù)量增多,導(dǎo)致訓(xùn)練速度下降。圖14和圖15為時(shí)間跨度為0.3 s時(shí),不同隱含層神經(jīng)元數(shù)量的GRU 網(wǎng)絡(luò)訓(xùn)練及辨識(shí)效果。
圖14 不同神經(jīng)元數(shù)量下神經(jīng)網(wǎng)絡(luò)的損失函數(shù)Fig.14 Loss of neural network with different number of neurons
圖15 不同神經(jīng)元數(shù)量下神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度Fig.15 Accuracy of neural network with different number of neurons
當(dāng)神經(jīng)元數(shù)量較少時(shí),網(wǎng)絡(luò)對(duì)樣本學(xué)習(xí)不充分,辨識(shí)準(zhǔn)確率較低;隨著神經(jīng)元數(shù)量增加,網(wǎng)絡(luò)辨識(shí)準(zhǔn)確度整體呈現(xiàn)上升趨勢(shì)。但神經(jīng)元數(shù)量越多,對(duì)我方飛行器上計(jì)算機(jī)計(jì)算能力要求越高。當(dāng)神經(jīng)元數(shù)量=81時(shí),準(zhǔn)確度為95.88%,能夠較好地平衡辨識(shí)準(zhǔn)確率和計(jì)算量。
與對(duì)意圖進(jìn)行識(shí)別相比,對(duì)制導(dǎo)律進(jìn)行辨識(shí)所需神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)更復(fù)雜。前者偏向定性計(jì)算,不同意圖間輸入差異性強(qiáng);后者偏向定量計(jì)算,不同制導(dǎo)律對(duì)應(yīng)各輸入?yún)?shù)間差異性不明顯,對(duì)網(wǎng)絡(luò)的數(shù)據(jù)挖掘能力要求更高。
1)本文將神經(jīng)網(wǎng)絡(luò)應(yīng)用到制導(dǎo)律辨識(shí)上,提出了一種基于GRU 的導(dǎo)彈制導(dǎo)律辨識(shí)方法。首先建立導(dǎo)彈-目標(biāo)運(yùn)動(dòng)學(xué)模型,從中提取數(shù)據(jù)建立訓(xùn)練樣本集和測(cè)試樣本集,對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和測(cè)試。
2)對(duì)比了不同條件下不同隱含層神經(jīng)元數(shù)量、不同類(lèi)型模型的制導(dǎo)律辨識(shí)效果。結(jié)果表明,本文所提方法相比于其他方法具有更快的辨識(shí)速度和更高的準(zhǔn)確度。
3)探究了噪聲對(duì)神經(jīng)網(wǎng)絡(luò)辨識(shí)效果的影響。仿真顯示,噪聲較小時(shí)對(duì)網(wǎng)絡(luò)辨識(shí)準(zhǔn)確度影響不大,噪聲較高時(shí),網(wǎng)絡(luò)辨識(shí)準(zhǔn)確度有所下降,但GRU 網(wǎng)絡(luò)模型相對(duì)于其他類(lèi)型模型具有更好的抗干擾能力。
然而,由于未考慮敵我飛行器的動(dòng)力學(xué),將影響本文所提出方法辨識(shí)的準(zhǔn)確性,后續(xù)將開(kāi)展敵方攔截彈制導(dǎo)律與動(dòng)力學(xué)環(huán)節(jié)一體化辨識(shí)方面的理論研究。