• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于LSTM-PPO算法的無人作戰(zhàn)飛機(jī)近距空戰(zhàn)機(jī)動(dòng)決策

    2022-07-13 06:04:30丁達(dá)理譚目來呂丞輝
    關(guān)鍵詞:敵機(jī)空戰(zhàn)機(jī)動(dòng)

    丁 維, 王 淵, 丁達(dá)理, 謝 磊, 周 歡, 譚目來, 呂丞輝

    (空軍工程大學(xué)航空工程學(xué)院,西安,710038)

    隨著無人作戰(zhàn)飛機(jī)(unmanned combat aerial vehicles,UCAV)的自主化、智能化水平不斷提高,由其自主完成空戰(zhàn)任務(wù)獲取制空權(quán)已成為未來戰(zhàn)場(chǎng)發(fā)展的必然趨勢(shì)。其中,空戰(zhàn)機(jī)動(dòng)決策方法一直是自主空戰(zhàn)領(lǐng)域研究的重要一環(huán)[1-2]。目前無人機(jī)空戰(zhàn)機(jī)動(dòng)決策常用方法主要分為兩類,一類是基于對(duì)策理論的方法,另一類是基于數(shù)據(jù)驅(qū)動(dòng)的方法?;趯?duì)策理論的方法應(yīng)用在近距空戰(zhàn)機(jī)動(dòng)決策上主要有微分對(duì)策法[3]、矩陣對(duì)策法和影響圖法[4],基于數(shù)據(jù)驅(qū)動(dòng)的近距空戰(zhàn)機(jī)動(dòng)決策方法主要有神經(jīng)網(wǎng)絡(luò)及強(qiáng)化學(xué)習(xí)方法。

    文獻(xiàn)[5]將微分對(duì)策法應(yīng)用于空戰(zhàn)追逃問題,構(gòu)建了微分對(duì)策模型,現(xiàn)階段雖然應(yīng)用較為廣泛,但其計(jì)算量太大、實(shí)時(shí)性差,且其目標(biāo)函數(shù)設(shè)定非常困難,因此不適用于復(fù)雜的空戰(zhàn)環(huán)境;文獻(xiàn)[6]應(yīng)用矩陣對(duì)策法獲得我機(jī)最優(yōu)選擇策略的大致范圍,雖然算法容易理解,但是其結(jié)果精度不高且實(shí)時(shí)性較差,因此較難應(yīng)用于無人機(jī)自主空戰(zhàn)中;文獻(xiàn)[7]將影響圖法應(yīng)用于機(jī)動(dòng)決策,雖然能有效引導(dǎo)UCAV戰(zhàn)斗,但是模型結(jié)構(gòu)復(fù)雜,計(jì)算繁瑣且實(shí)時(shí)性較差,很難求解出較復(fù)雜的決策問題。對(duì)于基于數(shù)據(jù)驅(qū)動(dòng)空戰(zhàn)機(jī)動(dòng)決策方法而言,文獻(xiàn)[8]應(yīng)用神經(jīng)網(wǎng)絡(luò)方法,雖然魯棒性強(qiáng)、實(shí)時(shí)性好,但是需要大量樣本進(jìn)行訓(xùn)練且產(chǎn)生的數(shù)據(jù)不真實(shí);文獻(xiàn)[9]運(yùn)用強(qiáng)化學(xué)習(xí)方法由環(huán)境反饋出的信息來展開學(xué)習(xí),雖然無需提供訓(xùn)練樣本,但是卻存在訓(xùn)練時(shí)間長、執(zhí)行效率低的缺點(diǎn)。

    針對(duì)UCAV近距空戰(zhàn)機(jī)動(dòng)決策問題,本文首先在UCAV三自由度模型的基礎(chǔ)上構(gòu)建飛行驅(qū)動(dòng)模塊,以此來實(shí)現(xiàn)深度強(qiáng)化學(xué)習(xí)過程中與環(huán)境的不斷交互,并形成一種狀態(tài)轉(zhuǎn)移更新機(jī)制。在算法層面,針對(duì)現(xiàn)有常用方法存在的無法滿足實(shí)時(shí)性、收斂速度慢、容易陷入局部最優(yōu)等不足,本文以近端策略優(yōu)化(proximal policy optimization,PPO)算法[10]為基礎(chǔ),充分發(fā)揮神經(jīng)網(wǎng)絡(luò)離線訓(xùn)練的可塑性和在線使用的實(shí)時(shí)性,通過引入OU隨機(jī)噪聲進(jìn)一步提升算法在訓(xùn)練過程中的探索性能,引入長短時(shí)記憶網(wǎng)絡(luò)(long short term memory,LSTM)[11]將空戰(zhàn)狀態(tài)轉(zhuǎn)化為高維感知態(tài)勢(shì),加強(qiáng)網(wǎng)絡(luò)對(duì)時(shí)序性空戰(zhàn)數(shù)據(jù)的學(xué)習(xí)能力,從而提出基于長短時(shí)記憶-近端策略優(yōu)化(long short term memory-proximal policy optimization, LSTM-PPO)算法的UCAV近距空戰(zhàn)機(jī)動(dòng)決策方法。通過設(shè)計(jì)不同的近距空戰(zhàn)仿真實(shí)驗(yàn),并與PPO算法作性能對(duì)比,驗(yàn)證該方法的有效性和優(yōu)越性。

    1 空戰(zhàn)環(huán)境設(shè)計(jì)

    1.1 UCAV三自由度模型設(shè)計(jì)

    UCAV三自由度模型是對(duì)UCAV運(yùn)動(dòng)狀態(tài)的具體描述,為了降低控制量之間的耦合關(guān)系,并充分考慮平臺(tái)氣動(dòng)特性對(duì)飛行狀態(tài)的影響,使模型更加貼近實(shí)際,飛行軌跡更為真實(shí),增加其工程利用價(jià)值,其三自由度質(zhì)點(diǎn)運(yùn)動(dòng)、動(dòng)力學(xué)模型如下:

    (1)

    式中:(x,y,z)分別代表速度v在坐標(biāo)系各個(gè)軸上的分量;γ為航跡傾角;ψ為偏航角;m為UCAV總體質(zhì)量;g為重力加速度;(α,μ,T)為模型的控制量,分別表示當(dāng)前時(shí)刻UCAV的攻角、滾轉(zhuǎn)角及推力;L和D分別表示升力參量和阻力參量,具體可以表示為:

    (2)

    1.2 狀態(tài)轉(zhuǎn)移更新機(jī)制設(shè)計(jì)

    為實(shí)現(xiàn)算法與空戰(zhàn)環(huán)境不斷交互,從而輸出控制量對(duì)UCAV的運(yùn)動(dòng)進(jìn)行控制,將上述三自由度模型設(shè)置成飛行驅(qū)動(dòng)模塊。假設(shè)UCAV與敵機(jī)使用相同的平臺(tái)模型,通過飛行驅(qū)動(dòng)模塊實(shí)現(xiàn)敵我雙方空戰(zhàn)狀態(tài)的更新,即通過當(dāng)前時(shí)刻狀態(tài)與控制量實(shí)時(shí)計(jì)算出下一時(shí)刻UCAV與敵機(jī)所處的新狀態(tài),以此形成一種狀態(tài)轉(zhuǎn)移更新機(jī)制,見圖1。

    圖1 狀態(tài)轉(zhuǎn)移更新機(jī)制

    1.3 獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)

    基于強(qiáng)化學(xué)習(xí)的近距空戰(zhàn)機(jī)動(dòng)決策的目標(biāo)是找到一個(gè)最優(yōu)機(jī)動(dòng)策略使UCAV完成攻擊占位,從而使完成當(dāng)前任務(wù)的累計(jì)獎(jiǎng)勵(lì)最大。獎(jiǎng)勵(lì)是評(píng)價(jià)策略的唯一量化指標(biāo),決定智能體最終學(xué)到策略的優(yōu)劣,并直接影響算法的收斂性和學(xué)習(xí)速度。UCAV通過深度強(qiáng)化學(xué)習(xí)進(jìn)行空戰(zhàn)決策時(shí),除完成任務(wù)的獎(jiǎng)勵(lì)外,中間過程無法獲得獎(jiǎng)勵(lì),存在著稀疏獎(jiǎng)勵(lì)[12]的問題,因此在復(fù)雜的空戰(zhàn)任務(wù)中不僅需要設(shè)計(jì)完成任務(wù)的勝負(fù)獎(jiǎng)勵(lì),對(duì)于每一回合中每一步的輔助獎(jiǎng)勵(lì)設(shè)計(jì)也至關(guān)重要。為了有助于驗(yàn)證算法的有效性,本文以機(jī)動(dòng)決策難度較大的使用近距空空導(dǎo)彈后半球攻擊策略為例,分別設(shè)計(jì)角度、高度、距離獎(jiǎng)勵(lì)函數(shù)。

    1.3.1 角度獎(jiǎng)勵(lì)函數(shù)

    (3)

    1.3.2 距離獎(jiǎng)勵(lì)函數(shù)

    (4)

    式中:相對(duì)距離

    1.3.3 高度獎(jiǎng)勵(lì)函數(shù)

    高度獎(jiǎng)勵(lì)的設(shè)置應(yīng)充分考慮不同武器的作戰(zhàn)性能,主要體現(xiàn)為通過高度獎(jiǎng)勵(lì)使UCAV與敵機(jī)的高度差保持在理想范圍內(nèi),充分發(fā)揮武器性能。設(shè)計(jì)高度獎(jiǎng)勵(lì)函數(shù)rH如下:

    (5)

    式中:ΔH代表UCAV與目標(biāo)的相對(duì)高度;ΔHup和ΔHdown分別表示理想高度差的上下限。

    1.3.4 勝負(fù)獎(jiǎng)勵(lì)函數(shù)

    空戰(zhàn)勝負(fù)判定主要分為3種情況:①飛行高度過低導(dǎo)致墜毀;②態(tài)勢(shì)占據(jù)劣勢(shì)被敵機(jī)擊中回合失??;③占據(jù)態(tài)勢(shì)優(yōu)勢(shì)滿足導(dǎo)彈發(fā)射條件,空戰(zhàn)勝利。

    勝負(fù)回報(bào)獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)如下:

    (6)

    其中end為UCAV勝負(fù)判定結(jié)果,可以表示為:

    (7)

    1.3.5 單步綜合獎(jiǎng)勵(lì)設(shè)計(jì)

    空戰(zhàn)中需要綜合考慮角度、距離、高度對(duì)空戰(zhàn)態(tài)勢(shì)的影響,即在空戰(zhàn)中設(shè)置每一步的綜合獎(jiǎng)勵(lì)。綜合獎(jiǎng)勵(lì)的設(shè)計(jì)是將角度、距離、高度等因素設(shè)置權(quán)重值,并與勝負(fù)獎(jiǎng)勵(lì)函數(shù)相加計(jì)算單步綜合獎(jiǎng)勵(lì)。具體設(shè)計(jì)如下:

    rtotal=W1rA+W2rR+W3rH+rend

    (8)

    式中:W1、W2、W3分別表示角度、距離、高度獎(jiǎng)勵(lì)對(duì)應(yīng)的權(quán)重,在近距空空導(dǎo)彈后半球攻擊策略中由于對(duì)角度獎(jiǎng)勵(lì)要求較高,因此設(shè)置W1=0.5,W2+W3=0.5。

    2 LSTM-PPO算法

    2.1 PPO算法

    PPO算法是由學(xué)者Schulman提出的一種新型的深度強(qiáng)化學(xué)習(xí)算法,在策略梯度算法的基礎(chǔ)上以演員-評(píng)論家(actor-critic,AC)算法為架構(gòu)演化而來,可以應(yīng)用在連續(xù)的狀態(tài)和動(dòng)作空間中[14]。它和其他基于深度強(qiáng)化學(xué)習(xí)算法相比優(yōu)勢(shì)如下:①將新舊策略的更新步長限制在一個(gè)合理區(qū)間上,讓其策略變化不要太劇烈,這樣就解決了策略梯度算法無法解決的步長難以選擇的問題;②PPO算法的參數(shù)更新方式能夠保證其策略一直上升即在訓(xùn)練過程中值函數(shù)單調(diào)不減;③利用重要性采樣原理來離線更新策略,避免浪費(fèi)更新完的數(shù)據(jù)。

    PPO算法的目標(biāo)函數(shù)為:

    (9)

    其中:

    (10)

    2.2 LSTM網(wǎng)絡(luò)

    LSTM網(wǎng)絡(luò)的每個(gè)單元可以被劃分為遺忘門ft、輸入門it、以及輸出門ot[15]見圖2所示。

    鄉(xiāng)土樹種具有適應(yīng)當(dāng)?shù)貧夂驐l件,成活率高、生長快,充分代表了當(dāng)?shù)氐奈幕厣偷赜蛱厣?,且鄉(xiāng)土樹種是經(jīng)過長時(shí)間沉淀積累下來的適宜本土生長的植物種類;鄉(xiāng)土樹種運(yùn)輸費(fèi)用以及種植費(fèi)用低,維護(hù)管理成本也低。為此在綠化樹種選擇上,要堅(jiān)持以鄉(xiāng)土樹種為主,實(shí)踐得知,美麗鄉(xiāng)村綠化綠化鄉(xiāng)土樹種占綠化苗總量應(yīng)把握在65%左右。除此之外,為增加生物多樣性及觀賞性,適當(dāng)引進(jìn)一些優(yōu)良適生樹種,豐富植物種類。

    圖2 LSTM單元結(jié)構(gòu)圖

    其中,遺忘門主要利用sigmoid函數(shù),決定上一時(shí)刻網(wǎng)絡(luò)的輸出ht-1和上一時(shí)刻網(wǎng)絡(luò)的單元狀態(tài)Ct-1是否繼續(xù)存在于當(dāng)前時(shí)刻網(wǎng)絡(luò)的單元狀態(tài)Ct中。遺忘門計(jì)算公式如下:

    ft=σ(Wf·g[ht-1,xt]+bf)

    (11)

    式中:Wf為權(quán)值矩陣;bf為偏置量;xt為當(dāng)前網(wǎng)絡(luò)的輸入;g表示向量拼接。

    輸入門利用sigmoid函數(shù)輸出的信息與tach函數(shù)輸出的信息相乘,決定當(dāng)前時(shí)刻的輸入xt有多少要傳到單元狀態(tài)Ct中。輸入門計(jì)算公式如下:

    it=σ(Wi·g[ht-1,x1]+bi)tach(Wc·g[ht-1,xt]+bc)

    (12)

    輸出門也是利用sigmoid函數(shù)與tach函數(shù)輸出的信息相乘,決定單元狀態(tài)Ct中有多少可以傳到當(dāng)前輸出ht中。輸出門的計(jì)算公式如下:

    ht=σ(W0·g[ht-1,xt]+b0)·tach(Ct)

    (13)

    2.3 OU隨機(jī)噪聲

    在訓(xùn)練過程中,平衡算法的探索能力和開發(fā)能力至關(guān)重要,探索的目的在于尋找到更優(yōu)的策略。作為引入的隨機(jī)噪聲,OU噪聲在時(shí)序上具備較高斯噪聲更好的相關(guān)性,能夠較好地探索具備動(dòng)量屬性的環(huán)境,在進(jìn)一步提升動(dòng)作決策隨機(jī)性的同時(shí)可以更好地約束探索的區(qū)間,減少超出閾值機(jī)動(dòng)的產(chǎn)生。圖3為基于OU隨機(jī)噪聲探索策略示意圖。OU噪聲的微分方程形式如下:

    圖3 基于OU噪聲探索策略

    dxt=-θ(xt-μ)dt+σdWt

    (14)

    式中:xt表示狀態(tài);Wt代表維納過程;θ、μ、σ均為參數(shù)。

    2.4 LSTM-PPO算法

    為了增強(qiáng)PPO算法的探索性,本文通過在輸出動(dòng)作上加入OU隨機(jī)噪聲來提升UCAV對(duì)未知狀態(tài)空間的探索能力。又因?yàn)榭諔?zhàn)環(huán)境具有高動(dòng)態(tài)、高維度的博弈性和復(fù)雜性,因此單純采用PPO算法中的全連接神經(jīng)網(wǎng)絡(luò)來逼近策略函數(shù)和價(jià)值函數(shù)已無法滿足其復(fù)雜性的需求。本文的策略網(wǎng)絡(luò)及價(jià)值網(wǎng)絡(luò)使用LSTM網(wǎng)絡(luò)架構(gòu),首先引入LSTM網(wǎng)絡(luò)從高維空戰(zhàn)態(tài)勢(shì)中提取特征,輸出有用的感知信息,增強(qiáng)對(duì)序列樣本數(shù)據(jù)的學(xué)習(xí)能力,再通過全連接神經(jīng)網(wǎng)絡(luò)來逼近策略函數(shù)及價(jià)值函數(shù)。LSTM-PPO算法的架構(gòu)見圖4。

    圖4 LSTM-PPO算法架構(gòu)圖

    2.4.1 策略網(wǎng)絡(luò)設(shè)計(jì)

    針對(duì)策略網(wǎng)絡(luò)部分,輸入層設(shè)置12個(gè)節(jié)點(diǎn),對(duì)應(yīng)著UCAV和敵機(jī)的12個(gè)狀態(tài)量s=[x,y,z,v,γ,ψ,xe,ye,ze,ve,γe,ψe],其中(x,y,z)表示UCAV的坐標(biāo),v為UCAV的速度,γ、ψ分別代表UCAV的航跡傾角及偏航角,(xe,ye,ze)表示敵機(jī)的坐標(biāo),ve為敵機(jī)的速度,γe、ψe分別表示敵機(jī)的航跡傾角及偏航角;隱藏層分別設(shè)置LSTM網(wǎng)絡(luò)層及全連接層,LSTM網(wǎng)絡(luò)層設(shè)置3個(gè)網(wǎng)絡(luò)單元,全連接層設(shè)計(jì)為3層,均采用tach為激活函數(shù);輸出層有3個(gè)節(jié)點(diǎn),分別對(duì)應(yīng)著UCAV滾轉(zhuǎn)角變化量Δμt、攻角變化量Δαt及推力變化量ΔTt,采用softmax為激活函數(shù)。策略網(wǎng)絡(luò)結(jié)構(gòu)圖見圖5。

    圖5 策略網(wǎng)絡(luò)結(jié)構(gòu)圖

    2.4.2 價(jià)值網(wǎng)絡(luò)設(shè)計(jì)

    針對(duì)價(jià)值網(wǎng)絡(luò)部分,輸入層設(shè)置了15個(gè)節(jié)點(diǎn),對(duì)應(yīng)著UCAV和敵機(jī)的12個(gè)狀態(tài)量s=[x,y,z,v,γ,ψ,xe,ye,ze,ve,γe,ψe]及當(dāng)前策略網(wǎng)絡(luò)生成的控制量變化量at=[Δμ,Δα,ΔTt]的合并;隱藏層中的LSTM網(wǎng)絡(luò)層設(shè)置3個(gè)網(wǎng)絡(luò)單元,全連接層設(shè)計(jì)為3層,均采用tach為激活函數(shù);輸出層設(shè)置一個(gè)節(jié)點(diǎn),對(duì)應(yīng)著狀態(tài)值函數(shù),采用Linear為激活函數(shù)。價(jià)值網(wǎng)絡(luò)結(jié)構(gòu)圖見圖6。

    圖6 價(jià)值網(wǎng)絡(luò)結(jié)構(gòu)圖

    3 仿真實(shí)驗(yàn)

    3.1 場(chǎng)景設(shè)計(jì)

    本文以UCAV與敵機(jī)一對(duì)一近距空戰(zhàn)為背景進(jìn)行仿真分析,設(shè)置3組仿真實(shí)驗(yàn),分別為敵機(jī)采取隨機(jī)機(jī)動(dòng)策略,基于專家規(guī)則庫的機(jī)動(dòng)策略和基于優(yōu)化算法的機(jī)動(dòng)策略。設(shè)每個(gè)epoch包含200個(gè)訓(xùn)練回合,每回合的仿真步長設(shè)為30步,每一步的決策時(shí)間為0.05 s,UCAV與敵機(jī)對(duì)抗900個(gè)epoch后停止學(xué)習(xí)。UCAV的速度為300 m/s,航跡傾角和航跡偏角均為0°,敵機(jī)的速度為250 m/s,航跡傾角為0°,航跡偏角為180°。參數(shù)設(shè)置如表1所示,利用表1中的參數(shù)結(jié)合LSTM-PPO算法對(duì)所設(shè)計(jì)的空戰(zhàn)場(chǎng)景進(jìn)行仿真。

    表1 參數(shù)設(shè)置

    3.2 仿真結(jié)果

    3.2.1實(shí)驗(yàn)1:敵機(jī)采取隨機(jī)機(jī)動(dòng)策略

    該策略下,針對(duì)敵機(jī)選擇緩慢向上爬升的隨機(jī)機(jī)動(dòng)動(dòng)作,UCAV首先平飛再通過緩慢爬升接近敵機(jī),形成后半球攻擊態(tài)勢(shì)并使敵機(jī)進(jìn)入我機(jī)導(dǎo)彈攻擊區(qū),進(jìn)而取得空戰(zhàn)勝利。圖7為UCAV與敵機(jī)空戰(zhàn)對(duì)抗軌跡圖。

    圖7 空戰(zhàn)對(duì)抗軌跡圖(實(shí)驗(yàn)1)

    圖8為反映兩機(jī)對(duì)抗相對(duì)優(yōu)勢(shì)的累計(jì)獎(jiǎng)勵(lì)曲線,橫坐標(biāo)每個(gè)epoch包含了200個(gè)訓(xùn)練回合,縱坐標(biāo)為200個(gè)訓(xùn)練回合所獲得累計(jì)獎(jiǎng)勵(lì)的平均值。從圖中可以看出,訓(xùn)練初期由于UCAV學(xué)習(xí)不到任何有效策略導(dǎo)致墜毀或被敵機(jī)擊落,使得累計(jì)獎(jiǎng)勵(lì)不斷減小,到了訓(xùn)練中期由于我機(jī)能夠保持平飛,避免了訓(xùn)練前期墜毀的情況,因此累計(jì)獎(jiǎng)勵(lì)值逐步增大,最終在約400個(gè)epoch的訓(xùn)練下能夠?qū)W習(xí)到有效的機(jī)動(dòng)動(dòng)作,形成后半球攻擊態(tài)勢(shì),此時(shí)累計(jì)獎(jiǎng)勵(lì)值收斂。

    圖8 累計(jì)獎(jiǎng)勵(lì)曲線(實(shí)驗(yàn)1)

    3.2.2實(shí)驗(yàn)2:敵機(jī)采取基于專家規(guī)則庫的機(jī)動(dòng)策略

    該策略下,針對(duì)敵機(jī)采取迂回盤旋機(jī)動(dòng)動(dòng)作[16],我方UCAV首先通過緩慢爬升接近敵機(jī),再采取突然俯沖機(jī)動(dòng)跟隨敵機(jī),當(dāng)敵機(jī)采取左轉(zhuǎn)緩慢俯沖動(dòng)作欲完成逃逸時(shí),UCAV通過小過載爬升機(jī)動(dòng)形成后半球攻擊態(tài)勢(shì),并使敵機(jī)進(jìn)入我機(jī)導(dǎo)彈攻擊區(qū)進(jìn)而取得空戰(zhàn)勝利。圖9為該場(chǎng)景下的空戰(zhàn)對(duì)抗軌跡圖。

    圖9 空戰(zhàn)對(duì)抗軌跡圖(實(shí)驗(yàn)2)

    從圖10的累計(jì)獎(jiǎng)勵(lì)曲線中可以看出,初始階段由于我機(jī)對(duì)環(huán)境認(rèn)知不足,學(xué)習(xí)不到較好策略導(dǎo)致出現(xiàn)高懲罰值行為,之后通過訓(xùn)練逐步掌握了能夠尾隨敵機(jī)的策略,最終在約600個(gè)epoch的訓(xùn)練下策略不再大幅變化,此時(shí)獎(jiǎng)勵(lì)值收斂。

    圖10 累計(jì)獎(jiǎng)勵(lì)曲線

    3.2.3實(shí)驗(yàn)3:敵機(jī)采取基于優(yōu)化算法的機(jī)動(dòng)策略

    由于敵機(jī)具有一定的策略[17],因此對(duì)抗博弈程度較實(shí)驗(yàn)1劇烈很多。開始由于UCAV高度處于劣勢(shì),因此敵機(jī)欲采取筋斗機(jī)動(dòng)完成逃逸,此時(shí)UCAV交替執(zhí)行平飛與爬升機(jī)動(dòng)接近敵機(jī)并與敵機(jī)搶占高度優(yōu)勢(shì)。當(dāng)敵機(jī)抵達(dá)最高點(diǎn)開始向下俯沖,UCAV完成爬升獲得高度優(yōu)勢(shì)后,UCAV跟隨敵機(jī)進(jìn)行俯沖,從而在獲得后半球角度優(yōu)勢(shì)的情況下達(dá)到武器發(fā)射條件,最終取得空戰(zhàn)勝利。圖11為該場(chǎng)景下的空戰(zhàn)對(duì)抗軌跡圖。

    圖11 空戰(zhàn)對(duì)抗軌跡圖(實(shí)驗(yàn)3)

    從圖12的曲線變化趨勢(shì)可以看出由于敵機(jī)飛行具有一定的策略,因此收斂速度比較慢且獎(jiǎng)勵(lì)值曲線波動(dòng)較為劇烈,體現(xiàn)出了空戰(zhàn)任務(wù)的復(fù)雜性,在大約720個(gè)epoch的訓(xùn)練下累計(jì)獎(jiǎng)勵(lì)值收斂,完成學(xué)習(xí)。

    圖12 累計(jì)獎(jiǎng)勵(lì)曲線(實(shí)驗(yàn)3)

    3.3 算法對(duì)比分析

    將PPO算法和LSTM-PPO算法設(shè)置相同的超參數(shù),并使用相同的空戰(zhàn)環(huán)境,經(jīng)過900個(gè)epoch訓(xùn)練后選取前800個(gè)epoch進(jìn)行測(cè)試。以平均獎(jiǎng)勵(lì)值、收斂時(shí)間、空戰(zhàn)獲勝概率作為衡量兩種算法性能的重要指標(biāo),進(jìn)行兩種算法在實(shí)驗(yàn)1和實(shí)驗(yàn)2下的性能對(duì)比分析,見表2~3??梢钥闯?,LSTM-PPO算法平均獎(jiǎng)勵(lì)值和獲勝概率均大于PPO算法,收斂速度LSTM-PPO算法快于PPO算法。

    表2 實(shí)驗(yàn)1算法性能的對(duì)比

    表3 實(shí)驗(yàn)2算法性能的對(duì)比

    4 結(jié)語

    由于空戰(zhàn)環(huán)境復(fù)雜、格斗態(tài)勢(shì)高速變化,因此本文針對(duì)UCAV與敵機(jī)一對(duì)一近距空戰(zhàn)引入了基于LSTM-PPO算法的UCAV機(jī)動(dòng)決策方法,設(shè)計(jì)了敵機(jī)采取隨機(jī)機(jī)動(dòng)策略、基于專家規(guī)則庫的機(jī)動(dòng)策略和基于優(yōu)化算法的機(jī)動(dòng)策略3組仿真實(shí)驗(yàn)。3組實(shí)驗(yàn)下的結(jié)果表明,不論敵機(jī)采取何種機(jī)動(dòng)策略,UCAV均可以很好地感知空戰(zhàn)態(tài)勢(shì),做出合理的機(jī)動(dòng)動(dòng)作,進(jìn)而取得空戰(zhàn)勝利。與PPO算法作性能對(duì)比也可以發(fā)現(xiàn),基于LSTM-PPO算法的UCAV空戰(zhàn)機(jī)動(dòng)決策方法具有獲得平均獎(jiǎng)勵(lì)值大、收斂速度快、獲勝概率高的優(yōu)點(diǎn)。

    猜你喜歡
    敵機(jī)空戰(zhàn)機(jī)動(dòng)
    最強(qiáng)空戰(zhàn)王
    沖著敵機(jī),開炮!——M1939式37毫米高射炮
    裝載機(jī)動(dòng)臂的疲勞壽命計(jì)算
    12萬畝機(jī)動(dòng)地不再“流浪”
    機(jī)動(dòng)三輪車的昨天、今天和明天
    新中國建國后擊落入侵?jǐn)硻C(jī)大盤點(diǎn)
    空戰(zhàn)之城
    “85:0”的敘以空戰(zhàn)
    海上機(jī)動(dòng)之師
    偷架敵機(jī)開回家
    如日韩欧美国产精品一区二区三区| 美女中出高潮动态图| 久久久久久久精品精品| 一级毛片黄色毛片免费观看视频| 一级毛片我不卡| av播播在线观看一区| 久久精品国产a三级三级三级| 精品少妇久久久久久888优播| 日韩av在线免费看完整版不卡| 亚洲人与动物交配视频| 一级毛片 在线播放| 亚洲精品久久成人aⅴ小说| 大香蕉97超碰在线| 欧美激情国产日韩精品一区| 成人无遮挡网站| 亚洲成国产人片在线观看| 热99久久久久精品小说推荐| 中文字幕精品免费在线观看视频 | 亚洲国产日韩一区二区| 欧美日韩av久久| 亚洲国产精品一区二区三区在线| 黄色 视频免费看| 激情五月婷婷亚洲| 高清黄色对白视频在线免费看| 国产亚洲精品第一综合不卡 | 精品国产国语对白av| 国产精品久久久久久久电影| 亚洲三级黄色毛片| 丰满饥渴人妻一区二区三| 日韩伦理黄色片| 巨乳人妻的诱惑在线观看| 免费日韩欧美在线观看| 欧美日韩精品成人综合77777| 91精品三级在线观看| 成年人午夜在线观看视频| 久久99热这里只频精品6学生| 七月丁香在线播放| av播播在线观看一区| av在线老鸭窝| 夜夜骑夜夜射夜夜干| 又大又黄又爽视频免费| 大香蕉久久成人网| 精品国产一区二区三区四区第35| 亚洲av电影在线观看一区二区三区| 亚洲av日韩在线播放| 亚洲欧美色中文字幕在线| 成人国产av品久久久| 精品久久久精品久久久| 亚洲国产av新网站| 国产高清不卡午夜福利| 九九爱精品视频在线观看| 久久国产亚洲av麻豆专区| 中文精品一卡2卡3卡4更新| 一级毛片黄色毛片免费观看视频| h视频一区二区三区| 老司机亚洲免费影院| 亚洲婷婷狠狠爱综合网| 久久99精品国语久久久| 丝袜喷水一区| 97人妻天天添夜夜摸| 国产激情久久老熟女| 熟女电影av网| 在线观看人妻少妇| 最近手机中文字幕大全| 亚洲精品乱久久久久久| 国产精品不卡视频一区二区| 在线观看www视频免费| 18禁在线无遮挡免费观看视频| 91久久精品国产一区二区三区| 日本与韩国留学比较| 国产一区二区激情短视频 | 国产精品一二三区在线看| 免费高清在线观看日韩| 一二三四中文在线观看免费高清| av在线观看视频网站免费| 日韩一区二区视频免费看| 精品久久久精品久久久| 中国三级夫妇交换| videosex国产| 在线亚洲精品国产二区图片欧美| 自拍欧美九色日韩亚洲蝌蚪91| 最近最新中文字幕大全免费视频 | 国产1区2区3区精品| 亚洲精品乱久久久久久| av福利片在线| 亚洲伊人色综图| 大香蕉97超碰在线| 最黄视频免费看| 性高湖久久久久久久久免费观看| 久久精品久久久久久久性| 国产1区2区3区精品| 两性夫妻黄色片 | 日本wwww免费看| 99国产综合亚洲精品| 在线观看人妻少妇| 久久国内精品自在自线图片| xxx大片免费视频| 丝袜人妻中文字幕| 成人综合一区亚洲| av线在线观看网站| 在线观看www视频免费| 亚洲国产精品一区三区| av网站免费在线观看视频| 日韩,欧美,国产一区二区三区| 狂野欧美激情性bbbbbb| a 毛片基地| 97人妻天天添夜夜摸| 伦理电影免费视频| 亚洲色图 男人天堂 中文字幕 | 亚洲av综合色区一区| 久久影院123| 2022亚洲国产成人精品| 伦精品一区二区三区| 老熟女久久久| 人人妻人人爽人人添夜夜欢视频| 欧美精品人与动牲交sv欧美| 中文字幕免费在线视频6| 欧美 亚洲 国产 日韩一| 国产成人av激情在线播放| 2018国产大陆天天弄谢| 亚洲av.av天堂| 日韩伦理黄色片| 精品国产一区二区久久| 亚洲伊人久久精品综合| av福利片在线| 亚洲精品色激情综合| 青青草视频在线视频观看| 成人无遮挡网站| 国产一级毛片在线| 亚洲欧美中文字幕日韩二区| 我要看黄色一级片免费的| 午夜福利视频精品| www.熟女人妻精品国产 | 国产精品熟女久久久久浪| 18禁在线无遮挡免费观看视频| 免费观看性生交大片5| 两个人看的免费小视频| 国产精品一区二区在线不卡| 亚洲精品国产色婷婷电影| 亚洲av男天堂| 草草在线视频免费看| 少妇被粗大猛烈的视频| 亚洲天堂av无毛| 日本与韩国留学比较| 亚洲精品,欧美精品| 午夜日本视频在线| 伊人亚洲综合成人网| 欧美日本中文国产一区发布| 亚洲,欧美,日韩| 亚洲国产日韩一区二区| 国产探花极品一区二区| 中国美白少妇内射xxxbb| 99re6热这里在线精品视频| 精品国产露脸久久av麻豆| 欧美日本中文国产一区发布| 国产又爽黄色视频| 亚洲国产看品久久| 欧美人与善性xxx| 国产av码专区亚洲av| 熟女电影av网| 最近中文字幕2019免费版| 国产精品久久久久久久电影| 90打野战视频偷拍视频| 老司机影院毛片| 人成视频在线观看免费观看| 男人操女人黄网站| av播播在线观看一区| 欧美精品一区二区大全| 永久免费av网站大全| 男女免费视频国产| 亚洲国产精品一区二区三区在线| 在线天堂中文资源库| 黄色一级大片看看| videosex国产| 99国产精品免费福利视频| 国产xxxxx性猛交| 久热这里只有精品99| 精品视频人人做人人爽| av视频免费观看在线观看| 亚洲精品一二三| 亚洲性久久影院| 免费大片黄手机在线观看| 久久鲁丝午夜福利片| 免费观看av网站的网址| 日韩制服骚丝袜av| 亚洲一级一片aⅴ在线观看| 日韩伦理黄色片| 成人国产麻豆网| 国精品久久久久久国模美| 999精品在线视频| 亚洲欧美成人精品一区二区| 免费高清在线观看日韩| 大陆偷拍与自拍| 国产av码专区亚洲av| 在线天堂最新版资源| 内地一区二区视频在线| 三上悠亚av全集在线观看| 十八禁高潮呻吟视频| 国产高清三级在线| 一区二区日韩欧美中文字幕 | av视频免费观看在线观看| 热99久久久久精品小说推荐| 国产毛片在线视频| 亚洲国产日韩一区二区| 久久久久久久久久人人人人人人| 一级毛片黄色毛片免费观看视频| 中文字幕另类日韩欧美亚洲嫩草| 香蕉丝袜av| 男女啪啪激烈高潮av片| 亚洲精品视频女| 亚洲精品久久久久久婷婷小说| 国产男女超爽视频在线观看| 日韩一本色道免费dvd| 国产麻豆69| 色吧在线观看| www.熟女人妻精品国产 | 女的被弄到高潮叫床怎么办| 精品一区二区三卡| 成人亚洲精品一区在线观看| 波野结衣二区三区在线| 欧美xxⅹ黑人| 午夜av观看不卡| 亚洲国产精品专区欧美| 青春草亚洲视频在线观看| 一本久久精品| 女的被弄到高潮叫床怎么办| 国产精品人妻久久久久久| 国产精品国产av在线观看| 亚洲精品一二三| 人人妻人人澡人人爽人人夜夜| 国产免费福利视频在线观看| 一区二区三区精品91| 亚洲国产av新网站| 自拍欧美九色日韩亚洲蝌蚪91| 久久影院123| 毛片一级片免费看久久久久| 精品国产国语对白av| 欧美精品亚洲一区二区| 欧美 日韩 精品 国产| 国产精品麻豆人妻色哟哟久久| kizo精华| 国产白丝娇喘喷水9色精品| 国产有黄有色有爽视频| 亚洲一码二码三码区别大吗| 日产精品乱码卡一卡2卡三| 亚洲欧美成人综合另类久久久| 一级片'在线观看视频| 久久久久久久精品精品| 午夜激情av网站| 最近2019中文字幕mv第一页| 高清欧美精品videossex| 国产精品久久久久成人av| 熟妇人妻不卡中文字幕| 欧美激情国产日韩精品一区| 欧美变态另类bdsm刘玥| 伦精品一区二区三区| 99国产精品免费福利视频| 精品酒店卫生间| 成人亚洲精品一区在线观看| 日本黄大片高清| 大话2 男鬼变身卡| 人成视频在线观看免费观看| 中文欧美无线码| 精品久久蜜臀av无| 国产精品一区二区在线不卡| 午夜91福利影院| 美女国产高潮福利片在线看| 18禁动态无遮挡网站| 亚洲第一av免费看| 99re6热这里在线精品视频| 亚洲成色77777| 母亲3免费完整高清在线观看 | 国产日韩欧美在线精品| 人人妻人人爽人人添夜夜欢视频| 国产在线免费精品| 亚洲精品aⅴ在线观看| 免费在线观看黄色视频的| 日韩av免费高清视频| 午夜福利视频精品| 国产亚洲一区二区精品| 免费黄网站久久成人精品| 午夜福利乱码中文字幕| 久久久久久久久久久免费av| 日本与韩国留学比较| 精品久久国产蜜桃| 国产免费视频播放在线视频| 亚洲精品国产av成人精品| 精品国产国语对白av| 香蕉精品网在线| 日韩欧美一区视频在线观看| 精品人妻熟女毛片av久久网站| 欧美日本中文国产一区发布| 日产精品乱码卡一卡2卡三| 69精品国产乱码久久久| xxx大片免费视频| 久久韩国三级中文字幕| 亚洲国产精品成人久久小说| 三上悠亚av全集在线观看| 亚洲久久久国产精品| 蜜臀久久99精品久久宅男| 国产激情久久老熟女| 黄色毛片三级朝国网站| 亚洲欧美色中文字幕在线| 国产精品人妻久久久久久| 波野结衣二区三区在线| 亚洲精品,欧美精品| 亚洲国产欧美在线一区| 9色porny在线观看| 亚洲av免费高清在线观看| 婷婷成人精品国产| 国产免费又黄又爽又色| 免费大片黄手机在线观看| 日韩av在线免费看完整版不卡| 亚洲欧美成人综合另类久久久| 成人影院久久| 欧美 亚洲 国产 日韩一| 丝袜在线中文字幕| 亚洲人成网站在线观看播放| 中文字幕另类日韩欧美亚洲嫩草| 免费观看在线日韩| 男女啪啪激烈高潮av片| 香蕉国产在线看| 亚洲av男天堂| 国产成人a∨麻豆精品| 国产精品久久久久久精品古装| 精品人妻在线不人妻| 看十八女毛片水多多多| 亚洲精品久久久久久婷婷小说| 国产国拍精品亚洲av在线观看| 老司机影院成人| 一个人免费看片子| 免费大片黄手机在线观看| 中文天堂在线官网| 波多野结衣一区麻豆| 精品一区二区三区四区五区乱码 | 国产伦理片在线播放av一区| 国产男女超爽视频在线观看| 国产精品一国产av| 国产精品欧美亚洲77777| 国语对白做爰xxxⅹ性视频网站| 精品99又大又爽又粗少妇毛片| 色5月婷婷丁香| 这个男人来自地球电影免费观看 | 丝袜喷水一区| 香蕉丝袜av| 69精品国产乱码久久久| 成人影院久久| 亚洲欧美一区二区三区国产| 成人综合一区亚洲| 久久女婷五月综合色啪小说| 一区二区av电影网| 深夜精品福利| 永久网站在线| 国产男人的电影天堂91| 2021少妇久久久久久久久久久| 熟妇人妻不卡中文字幕| 男人添女人高潮全过程视频| 黑丝袜美女国产一区| 国产欧美日韩综合在线一区二区| 视频中文字幕在线观看| 亚洲av免费高清在线观看| 极品少妇高潮喷水抽搐| 国产白丝娇喘喷水9色精品| 欧美bdsm另类| 啦啦啦视频在线资源免费观看| 欧美 日韩 精品 国产| 不卡视频在线观看欧美| 国产黄频视频在线观看| 美女xxoo啪啪120秒动态图| 亚洲精品成人av观看孕妇| 午夜免费男女啪啪视频观看| 中文天堂在线官网| 国产视频首页在线观看| 少妇熟女欧美另类| 国产成人精品福利久久| 亚洲综合色惰| 亚洲精品日本国产第一区| 男女无遮挡免费网站观看| av网站免费在线观看视频| 亚洲综合色网址| 啦啦啦中文免费视频观看日本| 国产亚洲一区二区精品| 性高湖久久久久久久久免费观看| 一本—道久久a久久精品蜜桃钙片| 丝袜美足系列| 午夜福利视频在线观看免费| 九九在线视频观看精品| 美女主播在线视频| 日韩成人av中文字幕在线观看| 国产成人欧美| 女性生殖器流出的白浆| 免费在线观看黄色视频的| 精品少妇久久久久久888优播| 国产黄色视频一区二区在线观看| 国产午夜精品一二区理论片| 国产精品 国内视频| 狂野欧美激情性xxxx在线观看| 亚洲精品第二区| 免费在线观看完整版高清| 国产黄频视频在线观看| 亚洲精品久久午夜乱码| 18禁观看日本| 欧美日韩综合久久久久久| 日韩三级伦理在线观看| 一级黄片播放器| 十八禁网站网址无遮挡| 日韩三级伦理在线观看| a级毛色黄片| 久久亚洲国产成人精品v| 一区在线观看完整版| 丝袜美足系列| 国产高清三级在线| av网站免费在线观看视频| 成人影院久久| 高清视频免费观看一区二区| 街头女战士在线观看网站| 国精品久久久久久国模美| 巨乳人妻的诱惑在线观看| 国产黄色免费在线视频| 欧美精品av麻豆av| 18禁观看日本| 日本黄大片高清| 天堂8中文在线网| 国产乱人偷精品视频| 男女边摸边吃奶| 色视频在线一区二区三区| 18禁观看日本| 最近最新中文字幕大全免费视频 | 久久精品久久久久久噜噜老黄| 在线观看免费高清a一片| 97在线人人人人妻| 午夜日本视频在线| 少妇猛男粗大的猛烈进出视频| a级毛色黄片| 美女中出高潮动态图| av网站免费在线观看视频| 99久久中文字幕三级久久日本| 五月天丁香电影| 精品少妇黑人巨大在线播放| 日日撸夜夜添| 久久精品国产综合久久久 | 国产欧美日韩综合在线一区二区| 美国免费a级毛片| 成年动漫av网址| 免费人妻精品一区二区三区视频| 91在线精品国自产拍蜜月| 国产日韩欧美亚洲二区| 一级片免费观看大全| 久久综合国产亚洲精品| 亚洲在久久综合| 成人综合一区亚洲| 人成视频在线观看免费观看| 久久综合国产亚洲精品| 亚洲伊人色综图| 纵有疾风起免费观看全集完整版| 青青草视频在线视频观看| 精品亚洲乱码少妇综合久久| 国产精品 国内视频| 国产av国产精品国产| 精品一区二区三卡| 精品国产乱码久久久久久小说| 春色校园在线视频观看| 欧美老熟妇乱子伦牲交| 大香蕉久久成人网| 一本久久精品| 欧美老熟妇乱子伦牲交| 亚洲成国产人片在线观看| 国产精品一区www在线观看| 成年人免费黄色播放视频| 亚洲内射少妇av| 婷婷成人精品国产| 亚洲欧美一区二区三区黑人 | 国产男人的电影天堂91| 久热久热在线精品观看| 亚洲成色77777| av片东京热男人的天堂| 免费黄色在线免费观看| 成人亚洲欧美一区二区av| 亚洲成国产人片在线观看| 人妻系列 视频| 肉色欧美久久久久久久蜜桃| 日韩成人av中文字幕在线观看| 国产一区有黄有色的免费视频| 欧美人与性动交α欧美精品济南到 | 亚洲成人一二三区av| 久久久久久人人人人人| 亚洲国产精品一区二区三区在线| 一本—道久久a久久精品蜜桃钙片| 水蜜桃什么品种好| 大香蕉久久网| 亚洲综合色网址| 中文字幕亚洲精品专区| 老司机影院毛片| 丰满乱子伦码专区| av线在线观看网站| 亚洲精品久久久久久婷婷小说| 精品第一国产精品| 男女午夜视频在线观看 | 国产精品一区二区在线不卡| 国产爽快片一区二区三区| 久久免费观看电影| 日韩欧美精品免费久久| 色5月婷婷丁香| av又黄又爽大尺度在线免费看| 久热久热在线精品观看| 满18在线观看网站| 亚洲色图综合在线观看| 国产xxxxx性猛交| 视频区图区小说| 三级国产精品片| 在线看a的网站| 嫩草影院入口| 伦精品一区二区三区| 一级片'在线观看视频| 日韩制服丝袜自拍偷拍| 美女大奶头黄色视频| 99九九在线精品视频| 99re6热这里在线精品视频| 美女xxoo啪啪120秒动态图| 80岁老熟妇乱子伦牲交| 中国三级夫妇交换| 久久精品国产亚洲av天美| 久久精品久久久久久噜噜老黄| 美女国产高潮福利片在线看| 亚洲av电影在线进入| 黄片播放在线免费| 午夜福利乱码中文字幕| 在线观看免费视频网站a站| 中文字幕另类日韩欧美亚洲嫩草| 黄片播放在线免费| 成年动漫av网址| 一本—道久久a久久精品蜜桃钙片| 国产精品蜜桃在线观看| 美女大奶头黄色视频| 毛片一级片免费看久久久久| 久久精品国产亚洲av涩爱| 亚洲国产精品一区三区| 成年动漫av网址| 少妇人妻久久综合中文| 黄色视频在线播放观看不卡| 久久久a久久爽久久v久久| 国产精品一国产av| 国产精品99久久99久久久不卡 | xxx大片免费视频| 亚洲五月色婷婷综合| 国产不卡av网站在线观看| 这个男人来自地球电影免费观看 | 日韩视频在线欧美| 26uuu在线亚洲综合色| 亚洲五月色婷婷综合| 男女边摸边吃奶| 国产精品99久久99久久久不卡 | 人妻人人澡人人爽人人| 午夜福利,免费看| 成人国产av品久久久| 桃花免费在线播放| 18禁观看日本| 欧美日韩视频精品一区| 韩国av在线不卡| 国产免费一级a男人的天堂| 一本久久精品| 看十八女毛片水多多多| 国产综合精华液| 另类亚洲欧美激情| 午夜久久久在线观看| 国产精品麻豆人妻色哟哟久久| 少妇人妻久久综合中文| 18禁观看日本| 哪个播放器可以免费观看大片| 国产黄色视频一区二区在线观看| 亚洲精品aⅴ在线观看| 久久 成人 亚洲| 免费看光身美女| 亚洲国产精品一区三区| 成年女人在线观看亚洲视频| 日韩三级伦理在线观看| 伊人久久国产一区二区| 亚洲美女视频黄频| 久久精品国产a三级三级三级| 免费在线观看黄色视频的| 飞空精品影院首页| 欧美人与性动交α欧美精品济南到 | 卡戴珊不雅视频在线播放| 久久国产精品男人的天堂亚洲 | 欧美亚洲日本最大视频资源| 在线观看免费日韩欧美大片| 久久精品夜色国产| 天天操日日干夜夜撸| av不卡在线播放| 永久网站在线| 春色校园在线视频观看| 中文字幕人妻丝袜制服| 国产免费一区二区三区四区乱码| 90打野战视频偷拍视频| 中文字幕av电影在线播放| 不卡视频在线观看欧美| 免费大片18禁| 深夜精品福利| 人人妻人人添人人爽欧美一区卜| 国产成人一区二区在线| 国产精品女同一区二区软件| 亚洲性久久影院| 天美传媒精品一区二区| 国产一区二区三区综合在线观看 | 成年女人在线观看亚洲视频| 国产激情久久老熟女| 久热这里只有精品99| 有码 亚洲区| av视频免费观看在线观看| 一级毛片电影观看| 日韩在线高清观看一区二区三区| 成人影院久久| 99国产精品免费福利视频| 高清不卡的av网站| 久久女婷五月综合色啪小说|