劉暢,王江,范世鵬,李伶,林德福
(1.北京理工大學(xué) 宇航學(xué)院,北京100081;2.北京理工大學(xué) 中國(guó)- 阿聯(lián)酋智能無(wú)人系統(tǒng)“一帶一路”聯(lián)合實(shí)驗(yàn)室,北京100081;3.北京航天自動(dòng)控制研究所,北京 100854)
隨著現(xiàn)代戰(zhàn)場(chǎng)環(huán)境的日益復(fù)雜,作戰(zhàn)需求給制導(dǎo)問(wèn)題帶來(lái)了一些特殊的限制。在對(duì)地目標(biāo)攻擊等制導(dǎo)問(wèn)題中,為保證殺傷效果、提高戰(zhàn)斗部效能,需要以特定角度攻擊目標(biāo)薄弱部位[1-3]。
目前,一些最優(yōu)制導(dǎo)律由于無(wú)法得到解析解而在工程中難以應(yīng)用,傳統(tǒng)比例導(dǎo)引律[4](PNG)具有所需信息量少、結(jié)構(gòu)簡(jiǎn)單等優(yōu)點(diǎn),工程上得到廣泛應(yīng)用。傳統(tǒng)PNG無(wú)法對(duì)終端交會(huì)角進(jìn)行約束,有學(xué)者在此基礎(chǔ)上提出了偏置比例導(dǎo)引律[5](BPNG)。Kim[6]最先將BPNG引入解決終端交會(huì)角約束問(wèn)題上,設(shè)計(jì)的時(shí)變偏置項(xiàng)與剩余飛行距離相關(guān)。文獻(xiàn)[7]設(shè)計(jì)了一種不含線(xiàn)性近似項(xiàng)并將PNG與終端交會(huì)角誤差進(jìn)行反饋的BPNG,所設(shè)計(jì)的制導(dǎo)律中包含剩余飛行時(shí)間。文獻(xiàn)[8]為提高反坦克導(dǎo)彈的毀傷效果,設(shè)計(jì)了一種BPNG并研究對(duì)法向過(guò)載的影響,所設(shè)計(jì)的BPNG同樣需對(duì)剩余時(shí)間進(jìn)行估計(jì)。文獻(xiàn)[9]為解決前置角變化較大的問(wèn)題,設(shè)計(jì)了一種可滿(mǎn)足初始前置角及終端交會(huì)角的BPNG,并給出應(yīng)用該制導(dǎo)律時(shí)所需剩余飛行時(shí)間估計(jì)的方法。以上文獻(xiàn)所設(shè)計(jì)的BPNG均需對(duì)剩余飛行時(shí)間進(jìn)行估計(jì),準(zhǔn)確性直接影響終端交會(huì)角的精度,且推導(dǎo)時(shí)采用小角假設(shè)等條件,在大范圍機(jī)動(dòng)時(shí)并不能成立。若采用紅外制導(dǎo)彈藥,則在硬件需求上會(huì)產(chǎn)生額外的問(wèn)題[10]。因此,無(wú)需估算飛行剩余時(shí)間的BPNG[11-12]優(yōu)勢(shì)更加明顯。
常值偏置比例導(dǎo)引(CBPNG)即在BPN基礎(chǔ)上擴(kuò)展帶有常數(shù)值的偏置項(xiàng),CBPNG可分為兩部分,一部分是傳統(tǒng)PN,實(shí)現(xiàn)零控脫靶量(ZEM);另一部分為帶有常數(shù)項(xiàng)的偏置項(xiàng),實(shí)現(xiàn)對(duì)終端交會(huì)角的約束。CBPNG結(jié)構(gòu)簡(jiǎn)單、無(wú)需復(fù)雜的計(jì)算,尤其是無(wú)需估算飛行剩余時(shí)間,在工程上較有優(yōu)勢(shì)。偏置項(xiàng)精確程度直接影響制導(dǎo)精度,應(yīng)用全程CBPNG時(shí),仍需對(duì)飛行總時(shí)間進(jìn)行估計(jì)。通過(guò)公式不難發(fā)現(xiàn),常數(shù)值與前置角、終端交會(huì)角、比例系數(shù)、飛行距離、速度等存在映射關(guān)系。神經(jīng)網(wǎng)絡(luò)[13](NNs)在擬合逼近復(fù)雜映射關(guān)系方面擁有顯著的優(yōu)勢(shì)。因此,對(duì)于上述映射關(guān)系,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行擬合,無(wú)需對(duì)飛行時(shí)間進(jìn)行估計(jì),從而提高終端角度與位置的精度。
隨著人工智能技術(shù)的不斷發(fā)展,很多學(xué)者將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用在制導(dǎo)問(wèn)題上。文獻(xiàn)[14]利用BP神經(jīng)網(wǎng)絡(luò)逼近變系數(shù)非齊次彈道微分方程解算,實(shí)現(xiàn)了潛地導(dǎo)彈落點(diǎn)的快速計(jì)算。文獻(xiàn)[15]應(yīng)用神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)估計(jì)目標(biāo)運(yùn)動(dòng)信息,使制導(dǎo)律自適應(yīng)調(diào)整參數(shù),減少三維運(yùn)動(dòng)模型中的耦合干擾,從而提高制導(dǎo)律的魯棒性。文獻(xiàn)[16]應(yīng)用門(mén)循環(huán)單元神經(jīng)網(wǎng)絡(luò),將敵我雙方運(yùn)動(dòng)信息作為輸入進(jìn)行訓(xùn)練,解決了敵方攔截彈制導(dǎo)律辨識(shí)問(wèn)題。文獻(xiàn)[17]設(shè)計(jì)了一種考慮擾動(dòng)隨機(jī)性的神經(jīng)網(wǎng)絡(luò)制導(dǎo)律,神經(jīng)網(wǎng)絡(luò)可對(duì)出現(xiàn)的擾動(dòng)進(jìn)行在線(xiàn)補(bǔ)償。文獻(xiàn)[18]應(yīng)用神經(jīng)網(wǎng)絡(luò)提出一種預(yù)測(cè)校正容錯(cuò)制導(dǎo)算法,解決了故障條件下高超聲速飛行器的容錯(cuò)制導(dǎo)問(wèn)題。將升力系數(shù)、阻力系數(shù)的變化量作為輸入量,通過(guò)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)落點(diǎn),可避免傳統(tǒng)算法中需大量進(jìn)行積分運(yùn)算的問(wèn)題。文獻(xiàn)[19]通過(guò)飛行仿真得到的當(dāng)前、未來(lái)態(tài)勢(shì)及控制量作為樣本,經(jīng)深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練完畢的模型可根據(jù)當(dāng)前信息快速預(yù)測(cè)未來(lái)態(tài)勢(shì),并能對(duì)空戰(zhàn)態(tài)勢(shì)進(jìn)行評(píng)估。
本文針對(duì)以設(shè)定的終端交會(huì)角精確打擊目標(biāo)的實(shí)際需求,提出一種基于BP神經(jīng)網(wǎng)絡(luò)的偏置比例導(dǎo)引(NNCBPNG)方法,利用BP神經(jīng)網(wǎng)絡(luò)擬合包括期望終端交會(huì)角θf(wàn)在內(nèi)的多元參數(shù)與偏置項(xiàng)之間的映射關(guān)系,從而實(shí)現(xiàn)在線(xiàn)求解偏置項(xiàng)。首先,建立相對(duì)運(yùn)動(dòng)學(xué)數(shù)學(xué)模型,證明了常值偏置項(xiàng)與期望終端交會(huì)角之間存在一一映射關(guān)系;然后,針對(duì)前置角、終端交會(huì)角等參量對(duì)偏置項(xiàng)的影響,進(jìn)行靈敏度分析,得到針對(duì)不同參數(shù)的樣本采樣策略。以初始條件與期望終端交會(huì)角作為輸入,以偏置項(xiàng)作為標(biāo)簽,采用上述采樣策略,構(gòu)建參數(shù)均衡的樣本庫(kù)。隨后,采用Adam學(xué)習(xí)律,對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。最后,將訓(xùn)練完畢的網(wǎng)絡(luò)與傳統(tǒng)的解析求解進(jìn)行對(duì)比,驗(yàn)證了本文方法可快速得到偏置項(xiàng)常數(shù),制導(dǎo)精度更高。
考慮帶落角約束的精確制導(dǎo)場(chǎng)景,圖1為導(dǎo)彈M與目標(biāo)T之間的相對(duì)運(yùn)動(dòng)幾何關(guān)系。圖1中,v為導(dǎo)彈速度,假設(shè)速度為常值;θ為彈道傾角,q為彈目視線(xiàn)角,η為導(dǎo)彈速度與彈目視線(xiàn)(LOS)的夾角,aM為導(dǎo)彈的加速度指令。
圖1 彈目之間角度關(guān)系
彈目相對(duì)運(yùn)動(dòng)方程為
(1)
(2)
(3)
(4)
式中:
aMq=aMcos(θ-q)
(5)
存在角度關(guān)系為
η=θ-q
(6)
為達(dá)到期望的終端交會(huì)角,BPNG理論引入一個(gè)常值偏置,其大小與初始條件和終端條件均有關(guān)。
可將彈道傾角角速度表示為
(7)
式中:b為角度控制的偏置項(xiàng),在CBPNG中為常數(shù),N為比例系數(shù)。此時(shí)aM為
(8)
對(duì)于(8)式可理解為
aM=aN+ab
(9)
式中:aN為PNG部分,用以減小零效脫靶量;ab為偏置項(xiàng)部分,可將終端交會(huì)角收斂于期望值。
對(duì)(7)式進(jìn)行積分,得
(10)
式中:θ0為初始彈道傾角,當(dāng)t為終端時(shí)間tf時(shí),(10)式變?yōu)椋?/p>
(11)
θf(wàn)為終端交會(huì)角,qf為終端彈目視線(xiàn)角。對(duì)于地面固定目標(biāo),終端速度方向指向彈目視線(xiàn)方向,有θf(wàn)=qf,代入(11)式可得終端交會(huì)角:
(12)
由(12)式可知,通過(guò)調(diào)整偏置比例導(dǎo)引中的偏置項(xiàng)b大小,即可實(shí)現(xiàn)終端交會(huì)角θf(wàn)的控制。
若采用CBPNG,則偏置項(xiàng)常數(shù)與終端角之間的關(guān)系為
(13)
若采用全程偏置比例導(dǎo)引,則公式中tf-t0為飛行總時(shí)間。文獻(xiàn)[6]提出求飛行總時(shí)間的傳統(tǒng)方式:
t=tf-t0=r/v
(14)
應(yīng)用(14)式計(jì)算時(shí)需對(duì)速度、彈目距離進(jìn)行精準(zhǔn)測(cè)量,其精度直接影響常數(shù)選取的誤差。且(13)式的推導(dǎo)過(guò)程中應(yīng)用小角假設(shè)等假設(shè)條件,同樣會(huì)對(duì)常數(shù)的選取產(chǎn)生誤差。
下面討論當(dāng)qf(或θf(wàn))、q0及距離r變化時(shí)對(duì)偏置項(xiàng)常數(shù)b的影響。為減少與偏置項(xiàng)相關(guān)的自變量,這里僅關(guān)注qf、q0的相對(duì)變化量,即qrqf-q0。
(15)
對(duì)于qr的靈敏度分析,設(shè)置的仿真參數(shù)見(jiàn)表1。
表1 仿真參數(shù)
圖2 視線(xiàn)角變化量對(duì)的影響
對(duì)于初始距離r0,仿真參數(shù)見(jiàn)表2。
表2 仿真參數(shù)
圖3 r0對(duì)的影響
由上述分析可知,(13)式存在誤差,尤其是當(dāng)qr相差較大時(shí)。初始彈目距離較遠(yuǎn)時(shí),公式存在的誤差同樣不可忽視。目前對(duì)于飛行總時(shí)間的求解方式均存在一定的誤差。由(13)式可知,偏置項(xiàng)常數(shù)b與N、q0、θ0、θf(wàn)、r0等存在非線(xiàn)性映射關(guān)系。神經(jīng)網(wǎng)絡(luò)在擬合非線(xiàn)性映射問(wèn)題上有較大優(yōu)勢(shì)。因此,本文在不估計(jì)或求解飛行總時(shí)間的情況下,采用神經(jīng)網(wǎng)絡(luò)表征N、q0、θ0、θf(wàn)、r0與偏置項(xiàng)b的映射關(guān)系。
若應(yīng)用神經(jīng)網(wǎng)絡(luò)解決上述問(wèn)題,需要證明偏置項(xiàng)常數(shù)b與θf(wàn)等存在映射關(guān)系。下面將給出映射關(guān)系的證明。(13)式可轉(zhuǎn)化為
(16)
上述公式存在誤差是由于小角度假設(shè)及對(duì)飛行總時(shí)間估算不準(zhǔn)確產(chǎn)生的。對(duì)于實(shí)際對(duì)應(yīng)關(guān)系,可加入角度、時(shí)間的偏差項(xiàng)Δη及Δt進(jìn)行補(bǔ)償。將(14)式及Δη、Δt代入(16)式,得:
(17)
式中:N、q0、θ0、r0、v等初始參數(shù)均已知,可看作是常數(shù)。θf(wàn)在通常情況下取負(fù)值,則(17)式變?yōu)?/p>
(18)
θf(wàn)=f(r0,N,q0,θ0,b)
(19)
定理1設(shè)y=f(x),x∈D嚴(yán)格增(減),則f必有反函數(shù)f-1,且f-1在其定義域內(nèi)f(D)上也是嚴(yán)格單調(diào)函數(shù)。
定理1證明:f在D上嚴(yán)格增,因此任一y∈f(D),有x∈D使f(x)=y。
若x1∈D有,且x1≠x,使f(x1)=y;則y=f(x)非嚴(yán)格增;所以對(duì)每一個(gè)y∈f(D),有唯一的一個(gè)x∈D,使f(x)=y;從而函數(shù)f存在反函數(shù)x=f-1(y),y∈f(D)。
對(duì)于任意的y1、y2∈f(D),y1
由定理1可知,式(19)的反函數(shù)同樣是嚴(yán)格遞增函數(shù),則同樣有|θf(wàn)|與b存在一一映射關(guān)系,如(20)式所示:
b=f-1(f0,N,θ0,qr)
(20)
對(duì)于(19)式、(20)式可近似為逆變換,在理想情況下,反演是精確的。但由于近似變換或參數(shù)的發(fā)生變化,導(dǎo)致逆過(guò)程出現(xiàn)反演誤差。神經(jīng)網(wǎng)絡(luò)可用于表示該非線(xiàn)性逆變換,在離線(xiàn)訓(xùn)練時(shí)使用精確的數(shù)學(xué)模型進(jìn)行訓(xùn)練,該模型可提供適應(yīng)總飛行包絡(luò)線(xiàn)的近似反演,從而使神經(jīng)網(wǎng)絡(luò)在線(xiàn)補(bǔ)償該反演誤差。
若將輸入中每個(gè)維度的所有數(shù)據(jù)作為樣本,會(huì)導(dǎo)致樣本量過(guò)多,使計(jì)算量大大增加。每個(gè)維度對(duì)b的影響并不相同,因此可對(duì)每個(gè)維度進(jìn)行靈敏度分析,選擇合適的樣本間隔,采用不同的樣本策略,可在保證精度的情況下減少計(jì)算量。
在優(yōu)化理論中,常常利用靈敏度分析研究原始數(shù)據(jù)不準(zhǔn)確或發(fā)生變化時(shí)最優(yōu)解的穩(wěn)定性[20]。通過(guò)靈敏度分析可得出參數(shù)對(duì)系統(tǒng)或模型的影響程度。
本節(jié)主要分析r0、N、θ0、qr等參數(shù)變化對(duì)偏置項(xiàng)常數(shù)敏感程度的影響。對(duì)(20)式進(jìn)行求導(dǎo),得
(21)
根據(jù)2.1節(jié)的分析可知,b與r0、N、θ0、qr存在映射關(guān)系,即存在函數(shù)關(guān)系,因此,(21)式可展開(kāi)為
(22)
根據(jù)(13)式和(16)式,可將(22)式進(jìn)行展開(kāi),得
(23)
由于(23)式中Δη、Δt是未知參數(shù),無(wú)法得到此方程的解析解。但可通過(guò)仿真驗(yàn)證的方式判斷每個(gè)參數(shù)的變化對(duì)偏置項(xiàng)常數(shù)b的影響程度。
建立數(shù)據(jù)庫(kù),給出(20)式中每個(gè)維度的邊界。4個(gè)維度的邊界分別為r0∈(5,10)km,N∈(2,4),θ0∈(10,20)deg,qr∈(-40,-70)deg。
分析r0的靈敏程度。將其它3個(gè)維度(N,θ0,qr)分為3個(gè)層次,標(biāo)記為f-1(r1)、f-1(r2)、f-1(r3),參數(shù)分別為(3,10°,-40°);(3,15°,-55°);(3,20°,-70°),3個(gè)參數(shù)代表下限、中值、上限。將3種情況分別進(jìn)行仿真,結(jié)果如圖4所示。
圖4 r0對(duì)b的影響
從圖4中可以看出,無(wú)論下限值、中值還是上限值,r0變化對(duì)b值的影響相對(duì)較小,即靈敏度較低。但整體呈下降趨勢(shì),因此r0取值較小時(shí),樣本選取間隔應(yīng)較小。r0取值較大時(shí),樣本選取間隔應(yīng)較大。
下面分析b的靈敏程度。將其他3個(gè)維度(r0,N,qr)分為3個(gè)層次,標(biāo)記為f-1(θ1)、f-1(θ2)、f-1(θ3),參數(shù)分別為(5 000 m,3,-40°);(7 500 m,3,-55°);(10 000 m,3,-70°),3個(gè)參數(shù)代表下限、中值、上限。將三種情況分別進(jìn)行仿真,得到的結(jié)果如圖5所示。
圖5 θ0對(duì)b的影響
從圖5可以看出,無(wú)論是下限值、中值還是上限值,θ0變化對(duì)b值的影響相對(duì)較小,即靈敏度較低。且整體呈平緩趨勢(shì),因此選取樣本θ0時(shí)間隔可較大。
下面分析qr的靈敏程度。將其他3個(gè)維度(r0,N,qr)分為3個(gè)層次,標(biāo)記為f-1(qr1)、f-1(qr2)、f-1(qr3),參數(shù)分別為(5 000 m,3,10°);(7 500 m,3,15°);(10 000 m,3,20°),3個(gè)參數(shù)代表下限、中值、上限。將3種情況分別進(jìn)行仿真,得到的結(jié)果如圖6所示。
圖6 qr對(duì)b的影響
從圖6中可以看出,無(wú)論是下限值、中值還是上限值,qr變化對(duì)b值的影響相對(duì)較大。尤其是下限值,隨著qr逐漸增大,誤差越來(lái)越大。由此可知qr變化對(duì)b影響程度大,即對(duì)應(yīng)的靈敏度較高。整體呈上升趨勢(shì),因此qr越大時(shí),需要更小的間隔保證精度。
綜上所述,θ0的靈敏度最小,r0的靈敏度次之,qr的靈敏度最大。以上分析為樣本建立提供了均衡分布采樣的策略依據(jù)。
網(wǎng)絡(luò)的訓(xùn)練是指調(diào)整權(quán)重和偏移,以獲得所需輸入輸出關(guān)系的過(guò)程。反向傳播調(diào)整網(wǎng)絡(luò)的權(quán)值和偏差,使神經(jīng)網(wǎng)絡(luò)在輸出層的和平方和誤差最小。通過(guò)為神經(jīng)網(wǎng)絡(luò)提供一個(gè)輸入向量,并根據(jù)當(dāng)前的權(quán)重和偏差值計(jì)算輸出,然后在神經(jīng)網(wǎng)絡(luò)輸出與輸入對(duì)應(yīng)的實(shí)際輸出之間誤差的最大梯度方向上不斷改變權(quán)值和偏差的值,直到滿(mǎn)足指定的誤差[21]。根據(jù)式(20),本文將不同的初始距離r0,導(dǎo)引系數(shù)N,初始彈目視線(xiàn)角q0,初始彈道傾角θ0,期望終端交會(huì)角θf(wàn)作為樣本輸入,經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到此狀態(tài)下的偏置比例常數(shù)b。樣本輸入形式為:
(24)
式中:ni表示第i時(shí)刻的輸入向量,上標(biāo)分別代表上述的輸入量,n為輸入步數(shù)。
當(dāng)神經(jīng)網(wǎng)絡(luò)完成訓(xùn)練后,利用測(cè)試樣本對(duì)網(wǎng)絡(luò)的泛化能力進(jìn)行檢驗(yàn)[22]。這種泛化特性使得網(wǎng)絡(luò)可以在具有代表性的訓(xùn)練樣本集上進(jìn)行訓(xùn)練,而若測(cè)試樣本集的測(cè)試誤差越小,則認(rèn)為此時(shí)神經(jīng)網(wǎng)絡(luò)魯棒性越強(qiáng)。
根據(jù)上節(jié)分析結(jié)果,在保證精度的同時(shí),減少訓(xùn)練樣本量,節(jié)約訓(xùn)練時(shí)間。因此,本文對(duì)r0在 5 000~7 500 m范圍內(nèi)采樣步長(zhǎng)為100 m,在7 500~10 000 m范圍內(nèi)采樣步長(zhǎng)為50 m;θ0采樣步長(zhǎng)為1°;qr采樣步長(zhǎng)為0.5°。
神經(jīng)網(wǎng)絡(luò)[23]是一種具有很強(qiáng)的非線(xiàn)性擬合能力的數(shù)學(xué)方法,可以解決一些應(yīng)用傳統(tǒng)推理模型無(wú)法解決的問(wèn)題。通過(guò)對(duì)訓(xùn)練數(shù)據(jù)中隱含模式的提取,學(xué)習(xí)和訓(xùn)練,調(diào)節(jié)各節(jié)點(diǎn)的權(quán)重,神經(jīng)網(wǎng)絡(luò)的輸出值趨近于期望輸出。其中,BP神經(jīng)網(wǎng)絡(luò)[24]結(jié)構(gòu)簡(jiǎn)單、具有較強(qiáng)的抗噪和泛化能力而用于擬合各類(lèi)復(fù)雜映射。其主體通常包括輸入層、隱藏層、輸出層,相鄰兩層間的數(shù)據(jù)傳輸通過(guò)權(quán)值傳遞的形式進(jìn)行。每個(gè)神經(jīng)元的輸入數(shù)據(jù)通過(guò)激活函數(shù)進(jìn)行處理,因而每個(gè)神經(jīng)元都需有適用的激活函數(shù)。神經(jīng)元的結(jié)構(gòu)模型如圖7所示。
圖7 神經(jīng)元結(jié)構(gòu)
其數(shù)學(xué)模型如(25)式所示。
(25)
式中:xi為神經(jīng)元第i個(gè)輸入;ωi為對(duì)應(yīng)權(quán)值;b為閾值;f(·)表示激活函數(shù);y為神經(jīng)元的輸出。其中,Sigmoid函數(shù)具有平滑、易于求導(dǎo)等優(yōu)點(diǎn)得到廣泛應(yīng)用,表達(dá)式為
(26)
其導(dǎo)數(shù)為
f′(x)=f(x)(1-x)
(27)
由(27)式可以看出,Sigmoid函數(shù)可將一個(gè)函數(shù)映射到(0,1)區(qū)間且具有良好的對(duì)稱(chēng)性,因此本文將sigmoid作為激活函數(shù)。對(duì)隱藏層和輸出層的每一個(gè)節(jié)點(diǎn)都按照(25)式計(jì)算輸出值,即完成前向傳播的過(guò)程。
對(duì)于反向傳播的具體流程為:本文選取最小均方誤差作為損失函數(shù)(Loss Function),即估計(jì)值與實(shí)際值誤差平方的均值,表達(dá)如(28)式所示。
(28)
式中:n為樣本個(gè)數(shù);y為輸出值,(25)由式得到;為期望輸出值。輸出值與期望輸出值相減后得到誤差后,在網(wǎng)絡(luò)中進(jìn)行傳播。以求解ωhj為例,設(shè)該誤差為Ek,給定學(xué)習(xí)率η,有
(29)
式中:ωhj為第h個(gè)神經(jīng)元與第j個(gè)神經(jīng)元的權(quán)值。根據(jù)鏈?zhǔn)椒▌t,有
(30)
(31)
根據(jù)(25)式、(27)式、(28)式,有
(32)
式中:θj為輸出層第j個(gè)神經(jīng)元的閾值。將(32)式和(31)式代入(30)式,再代入(29)式,就得到了BP算法關(guān)于ωhj的更新公式:
Δωhj=ηgjch
(33)
BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程,就是通過(guò)上述反向傳播,利用梯度下降等算法不斷優(yōu)化網(wǎng)絡(luò)參數(shù),使上述網(wǎng)絡(luò)的誤差平方和最小。(33)式中的學(xué)習(xí)率恒定,致使收斂較慢。本文采用的Adam學(xué)習(xí)方法,結(jié)合了Momentum及RMSprop算法各自的優(yōu)點(diǎn),實(shí)現(xiàn)了學(xué)習(xí)率自適應(yīng)調(diào)節(jié),從而加速網(wǎng)絡(luò)收斂[25]。當(dāng)更新方向發(fā)生變化時(shí),減少權(quán)重變化量,反之則增大權(quán)重變化。因此,本文采用Adam算法對(duì)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。
基于Adam算法的網(wǎng)絡(luò)參數(shù)α更新公式為
(34)
(35)
式中:αt為更新前參數(shù);αt+1為更新后參數(shù);η為學(xué)習(xí)率;mt為梯度1階力矩,vt為梯度2階力矩,通過(guò)計(jì)算偏差修正1階和2階力矩估計(jì)減小偏差;m′t為1階力矩估計(jì),v′t為2階力矩估計(jì),β1、β2為超參數(shù),用于修正1階和2階力矩估計(jì),本文分別取0.9和0.99;ε為平滑項(xiàng),防止被零除,⊙為按元素乘運(yùn)算符。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、規(guī)模與計(jì)算量、求解精度密切相關(guān)。本文待擬合的映射關(guān)系具有單調(diào)性,復(fù)雜度相對(duì)較小,設(shè)定隱含層為3層,每層神經(jīng)元個(gè)數(shù)為15個(gè),各層之間采用全連接方式,計(jì)算代價(jià)較小。根據(jù)3.1節(jié)基于靈敏度分析的樣本采樣策略,利用數(shù)學(xué)仿真批量生成樣本,完成BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后即可在線(xiàn)使用。基于TensorFlow-1.13.0-GPU版構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,顯卡型號(hào)為RTX 2060 6G,訓(xùn)練算法為Adam算法,學(xué)習(xí)率為0.001。本文的技術(shù)架構(gòu)如圖8所示。
圖8 樣本構(gòu)建與模型訓(xùn)練
下面討論b的有界性。對(duì)于神經(jīng)網(wǎng)絡(luò)的最后一層,有
h=f(ω·x+c)
y=ω·h+c
(36)
式中:ω、c分別為神經(jīng)元的權(quán)值和閾值。(36)式可寫(xiě)成范數(shù)形式為
‖y‖=‖ω·h+c‖
(37)
等式右邊由范數(shù)三角不等式有:
‖ω·h+c‖≤‖ω·h‖+‖c‖
(38)
對(duì)于神經(jīng)網(wǎng)絡(luò)最后一層的輸入h,即為前一層的輸出。本文的激活函數(shù)為sigmoid函數(shù),因此其值域?yàn)閇0,1)。因此有‖ω·h‖≤‖ω‖,因此(38)式可變?yōu)?/p>
‖ω·h+c‖≤‖ω‖+‖c‖
(39)
由神經(jīng)網(wǎng)絡(luò)的性質(zhì)可知,ω、c中的值為網(wǎng)絡(luò)參數(shù),只要訓(xùn)練后的網(wǎng)絡(luò)參數(shù)有界,根據(jù)(39)式,神經(jīng)網(wǎng)絡(luò)的輸出,即偏置項(xiàng)b,就是有界的,則該制導(dǎo)律即為穩(wěn)定的。因此,當(dāng)神經(jīng)網(wǎng)絡(luò)完成訓(xùn)練后,必須對(duì)網(wǎng)絡(luò)參數(shù)要進(jìn)行穩(wěn)定性檢驗(yàn),本文要求最后一層權(quán)值滿(mǎn)足‖ω‖≤10,‖c‖≤10。
為驗(yàn)證提出方法的有效果,仿真驗(yàn)證分三部分。第一部分為當(dāng)打擊靜止目標(biāo)時(shí),與CBPNG的對(duì)比驗(yàn)證;第二部分為當(dāng)打擊低勻速目標(biāo)時(shí)與CBPNG的對(duì)比驗(yàn)證;第三部分進(jìn)行蒙特卡洛仿真實(shí)驗(yàn),對(duì)比當(dāng)考慮導(dǎo)引頭不確定性時(shí),所設(shè)計(jì)的制導(dǎo)律相較于CBPNG優(yōu)勢(shì)明顯。
為驗(yàn)證本文提出的制導(dǎo)律相較于原始CBPNG方法精度更高,本節(jié)將進(jìn)行對(duì)比驗(yàn)證。仿真相關(guān)參數(shù)如表3所示。
表3 仿真參數(shù)
期望終端交會(huì)角分別為-40°、-60°、-80°,圖9為傳統(tǒng)偏置比例導(dǎo)引與本文所提出的基于神經(jīng)網(wǎng)絡(luò)偏置比例導(dǎo)引對(duì)比仿真的結(jié)果。
圖9 兩種制導(dǎo)律對(duì)比驗(yàn)證
終端交會(huì)角對(duì)比如表4所示,脫靶量對(duì)比如表5所示。
表4 終端交會(huì)角
表5 脫靶量
由表4和表5可以看出,雖然兩種制導(dǎo)律均可精確命中目標(biāo),但在終端交會(huì)角上,本文設(shè)計(jì)的制導(dǎo)律相較于CBPNG精度有明顯優(yōu)勢(shì)。尤其是大角度范圍機(jī)動(dòng)時(shí),NNCBPNG相較于CBPNG的優(yōu)勢(shì)更為明顯。
由于在模型建立與樣本生成時(shí),并未考慮目標(biāo)的運(yùn)動(dòng)速度,因此訓(xùn)練完畢的神經(jīng)網(wǎng)絡(luò)模型僅能適用于靜止或低速運(yùn)動(dòng)目標(biāo),為驗(yàn)證基于神經(jīng)網(wǎng)絡(luò)的偏置比例導(dǎo)引的魯棒性,本節(jié)仿真條件考察對(duì)低速運(yùn)動(dòng)目標(biāo)的打擊精度。同樣期望終端交會(huì)角θf(wàn)分別設(shè)為-40°、-60°、-80°,當(dāng)目標(biāo)水平勻速運(yùn)動(dòng)或垂直勻速運(yùn)動(dòng)時(shí),仿真參數(shù)如表6和表7所示。
表6 水平運(yùn)動(dòng)仿真參數(shù)
表7 垂直運(yùn)動(dòng)目標(biāo)仿真參數(shù)
圖10為目標(biāo)勻速水平勻速運(yùn)動(dòng)時(shí)的仿真結(jié)果,圖11為目標(biāo)垂直勻速水平運(yùn)動(dòng)時(shí)的仿真結(jié)果。
由圖10和圖11可以看出,雖然兩種制導(dǎo)律均可精確命中目標(biāo),但在終端交會(huì)角上,本文設(shè)計(jì)的制導(dǎo)律相較于CBPNG精度有明顯優(yōu)勢(shì)。與目標(biāo)靜止對(duì)比驗(yàn)證相似,尤其是大角度范圍機(jī)動(dòng)時(shí),NNCBPNG相較于CBPNG精度優(yōu)勢(shì)更加明顯。由此可見(jiàn)該制導(dǎo)律可憑借其魯棒性,實(shí)現(xiàn)對(duì)低速運(yùn)動(dòng)目標(biāo)的精確打擊,從而表明該制導(dǎo)律適用于精確打擊裝甲車(chē)、坦克和直升機(jī)等一類(lèi)目標(biāo)。
圖10 目標(biāo)勻速水平運(yùn)動(dòng)時(shí)實(shí)驗(yàn)驗(yàn)證
圖11 目標(biāo)勻速垂直運(yùn)動(dòng)時(shí)仿真驗(yàn)證
為驗(yàn)證不同場(chǎng)景下的制導(dǎo)性能,采用蒙特卡洛仿真方法進(jìn)行驗(yàn)證。導(dǎo)彈坐標(biāo)為(0,0),其他初始條件相關(guān)參數(shù)分布均勻,速度為300 m/s,導(dǎo)航系數(shù)設(shè)為3,其余參數(shù)從表8的范圍中隨機(jī)選取。
表8 仿真參數(shù)
從表8的參數(shù)范圍中,隨機(jī)抽取300組不同的目標(biāo)位置,用以驗(yàn)證訓(xùn)練模型的準(zhǔn)確性。實(shí)際終端交會(huì)角誤差如圖13所示。
圖12 蒙特卡洛仿真結(jié)果
由圖13可知,訓(xùn)練完畢的模型精度較高。其中,最大誤差為0.115°,最小誤差為0.001 7°。誤差平均值為0.030 58°,標(biāo)準(zhǔn)誤差為0.047 2°,由此可見(jiàn)誤差離散程度小,制導(dǎo)精度較高。
圖13 高斯白噪聲
考慮到導(dǎo)引頭的不確定性,以典型的雷達(dá)導(dǎo)引頭為例,導(dǎo)引頭不確定性主要包括閃爍噪聲、接收機(jī)噪聲。通常情況下可視為高斯白噪聲[26]。在4.2節(jié)的仿真參數(shù)基礎(chǔ)上,在導(dǎo)引頭測(cè)量信息中引入均值為0,方差為0.6°/s的白噪聲,其值如圖14所示。
圖14 兩種制導(dǎo)律對(duì)比驗(yàn)證
與4.2節(jié)中參數(shù)相同,期望終端交會(huì)角分別設(shè)為-40°、-60°、-80°,進(jìn)行數(shù)學(xué)仿真。圖15為CBPNG與本文所提出的NNCBPNG對(duì)比仿真的結(jié)果。
采用CBPNG得出的終端交會(huì)角為-42.53°、-67.20°、-89.11°,采用本文方法得到的終端交會(huì)角為-40.36°、-60.85°、-81.16°。由此可見(jiàn),在終端交會(huì)角控制精度方面,相較于傳統(tǒng)CBPNG,本文提出的NNCBPNG優(yōu)勢(shì)顯著。
根據(jù)上述仿真分析可知,無(wú)論是打擊靜止、勻速目標(biāo)或存在系統(tǒng)不確定性的蒙特卡洛仿真,本文基于BP神經(jīng)網(wǎng)絡(luò)所設(shè)計(jì)的制導(dǎo)律相較于傳統(tǒng)CBPNG在終端角度的控制精度方面有明顯優(yōu)勢(shì),尤其是在前置角較大的大范圍機(jī)動(dòng)情況下更為顯著,因而可有效地增強(qiáng)導(dǎo)彈的侵徹深度和毀傷效果。另一方面,由于神經(jīng)網(wǎng)絡(luò)參數(shù)不可避免地占用存儲(chǔ)空間,同時(shí)還需要一定計(jì)算量。本文所使用的BP神經(jīng)網(wǎng)絡(luò)規(guī)模,存儲(chǔ)量在2K以?xún)?nèi),在Core i5 PC平臺(tái)上的計(jì)算平均時(shí)間(500次)在0.3 ms以?xún)?nèi)。
本研究將神經(jīng)網(wǎng)絡(luò)應(yīng)用在求解CBPNG常數(shù)項(xiàng)的問(wèn)題上。首先,說(shuō)明公式求解常數(shù)項(xiàng)時(shí),存在控制精度較差的問(wèn)題;其次,通過(guò)數(shù)學(xué)推導(dǎo)證明了b與N、q0、θ0、θf(wàn)、r0等參數(shù)間存在映射關(guān)系,并通過(guò)靈敏度分析,得到各參數(shù)與b的相關(guān)性,以此保證所構(gòu)建樣本的均衡性;再次,通過(guò)樣本策略進(jìn)行樣本建立,得到訓(xùn)練完畢的模型;最后,通過(guò)仿真驗(yàn)證說(shuō)明訓(xùn)練完畢的模型與公式相比精度更高。CBPNG由于模型簡(jiǎn)單,對(duì)工程應(yīng)用提供了參考,若將訓(xùn)練完畢的模型應(yīng)用其中,可大大降低計(jì)算成本。
然而,本文僅針對(duì)縱向平面運(yùn)動(dòng)學(xué)進(jìn)行建模與分析,并沒(méi)有考慮導(dǎo)彈的彈體動(dòng)力學(xué),這將會(huì)使模型在工程應(yīng)用中的制導(dǎo)精度受到一定的影響,同時(shí),本文僅針對(duì)靜止目標(biāo)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,僅適用于靜止或緩慢運(yùn)動(dòng)的目標(biāo)。因此,在后續(xù)研究中將考慮彈體動(dòng)力學(xué)和目標(biāo)運(yùn)動(dòng)等因素。