• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于強(qiáng)化學(xué)習(xí)的帶落角約束的制導(dǎo)律研究

    2023-02-24 08:50:40康冰冰魏曉晴
    航空兵器 2023年6期
    關(guān)鍵詞:動(dòng)作策略

    康冰冰, 姜 濤, 曹 建, 魏曉晴

    (海軍航空大學(xué), 山東 煙臺(tái) 264001)

    0 引 言

    毀傷目標(biāo)首先考慮的因素是武器彈藥能否命中目標(biāo)或者脫靶量是否在一定的毀傷范圍內(nèi)。 與非制導(dǎo)武器相比, 制導(dǎo)武器極大的提高了命中目標(biāo)的精度, 保證了毀傷效果。 制導(dǎo)律是制導(dǎo)武器提高命中精度的核心之一, 制導(dǎo)律一般通過(guò)最優(yōu)控制、 李雅普諾夫穩(wěn)定性理論、 滑??刂频人惴╗1]設(shè)計(jì), 最常用的制導(dǎo)律是比例導(dǎo)引律及其偏置形式[2]。

    在實(shí)際作戰(zhàn)中, 彈目交會(huì)情形和目標(biāo)易損特性等也極大的影響作戰(zhàn)使用效率, 如攻擊混凝土結(jié)構(gòu)、 鋼制結(jié)構(gòu)等堅(jiān)硬目標(biāo)時(shí), 彈著角過(guò)小容易發(fā)生跳彈; 攻擊艦船、 建筑物等目標(biāo)時(shí), 導(dǎo)彈以一定的方向攻擊目標(biāo)的易損部位, 可以增加毀傷效果。 因此, 針對(duì)特定目標(biāo), 尤其是地面、 海面目標(biāo), 制導(dǎo)武器以一定的角度攻擊目標(biāo), 可以達(dá)到更好毀傷效果。

    針對(duì)固定目標(biāo), 文獻(xiàn)[3]利用計(jì)算幾何學(xué)設(shè)計(jì)了制導(dǎo)律, 調(diào)整終點(diǎn)碰撞線, 導(dǎo)彈能以指定落角攻擊目標(biāo), 通過(guò)調(diào)整軌跡長(zhǎng)度控制導(dǎo)彈飛行時(shí)間; 文獻(xiàn)[4]利用直線飛行的虛擬領(lǐng)彈建立幾何關(guān)系, 采用最優(yōu)控制使跟蹤彈飛行軌跡與虛擬領(lǐng)彈同步, 實(shí)現(xiàn)了特定落角攻擊目標(biāo); 文獻(xiàn)[5]利用最優(yōu)控制推導(dǎo)帶落角約束的偏置比例制導(dǎo)律; 文獻(xiàn)[6]推導(dǎo)了三維協(xié)同制導(dǎo)律, 制導(dǎo)過(guò)程分為協(xié)同、 比例導(dǎo)引兩個(gè)階段, 基于此研究了導(dǎo)彈以不同的落角攻擊目標(biāo)的協(xié)同制導(dǎo)律[7]; 文獻(xiàn)[8]利用李雅普諾夫穩(wěn)定性定理, 設(shè)計(jì)制導(dǎo)誤差并進(jìn)行收斂設(shè)計(jì), 實(shí)現(xiàn)了具有固定落角的協(xié)同制導(dǎo); 文獻(xiàn)[9]以比例制導(dǎo)律為基礎(chǔ)設(shè)計(jì)了具有固定落角約束的制導(dǎo)律, 且收斂時(shí)間固定。

    針對(duì)具有約束的制導(dǎo)問(wèn)題, 傳統(tǒng)的設(shè)計(jì)方法一般計(jì)算比較復(fù)雜, 有的還需要做一些近似處理。 近年來(lái), 隨著人工智能的發(fā)展, 智能算法開(kāi)始進(jìn)入武器領(lǐng)域, 文獻(xiàn)[10]綜述了智能航跡規(guī)劃算法, 對(duì)強(qiáng)化學(xué)習(xí)、 神經(jīng)網(wǎng)絡(luò)、 深度學(xué)習(xí)等算法進(jìn)行了分析; 文獻(xiàn)[11]利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)導(dǎo)彈撞擊目標(biāo)的時(shí)間, 實(shí)現(xiàn)導(dǎo)彈協(xié)同攻擊固定目標(biāo); 文獻(xiàn)[12]針對(duì)機(jī)動(dòng)目標(biāo)采用DDPG設(shè)計(jì)了制導(dǎo)律, 與比例制導(dǎo)律、 改進(jìn)的比例制導(dǎo)律相比, 脫靶量更小, 攔截效果更好; 文獻(xiàn)[13]采用Q-learning、 EBDQN設(shè)計(jì)了導(dǎo)航比具有自適應(yīng)特性的末制導(dǎo)律, 與傳統(tǒng)方法相比, 脫靶量更小, 更加穩(wěn)定; 文獻(xiàn)[14]設(shè)計(jì)了DQN與神經(jīng)網(wǎng)絡(luò)結(jié)合的制導(dǎo)律, 與DQN制導(dǎo)律相比, 脫靶量更小; 文獻(xiàn)[15]設(shè)計(jì)了基于TD3算法的制導(dǎo)律, 制導(dǎo)律的泛化特性較好; 文獻(xiàn)[16]設(shè)計(jì)了基于TRPO的強(qiáng)化學(xué)習(xí)制導(dǎo)律, 與比例制導(dǎo)律相比, 具有更好的攔截效果; 文獻(xiàn)[17]設(shè)計(jì)了基于蒙特卡洛和Q-learning的兩種強(qiáng)化學(xué)習(xí)的導(dǎo)航比, 與傳統(tǒng)比例制導(dǎo)律相比, 具有更好的攔截效果; 文獻(xiàn)[18]基于分層強(qiáng)化學(xué)習(xí)算法研究了空戰(zhàn)決策, 結(jié)果表明訓(xùn)練的模型能有效提高輔助決策效率; 文獻(xiàn)[19]利用DDPG算法構(gòu)建了制導(dǎo)、 控制一體化框架, 算法直接輸出舵偏量, 該算法的能耗更低。

    比例制導(dǎo)律及其變型是應(yīng)用廣泛的制導(dǎo)律, 當(dāng)彈目交會(huì)狀態(tài)有一定約束時(shí), 尤其是目標(biāo)存在一定的速度時(shí), 傳統(tǒng)制導(dǎo)律能否適應(yīng)復(fù)雜的戰(zhàn)場(chǎng)環(huán)境值得分析。 由于強(qiáng)化學(xué)習(xí)在制導(dǎo)律設(shè)計(jì)上展現(xiàn)出了獨(dú)特的優(yōu)勢(shì), 受此啟發(fā), 本文采用強(qiáng)化學(xué)習(xí)算法, 針對(duì)具有落角約束的制導(dǎo)問(wèn)題展開(kāi)研究, 并與傳統(tǒng)的最優(yōu)制導(dǎo)律(擴(kuò)展比例制導(dǎo)律)對(duì)比分析, 驗(yàn)證了強(qiáng)化學(xué)習(xí)制導(dǎo)律的有效性和對(duì)戰(zhàn)場(chǎng)環(huán)境的適應(yīng)性。

    1 問(wèn)題描述

    圖1 彈目幾何關(guān)系Fig.1 The geometry of the missile and its target

    彈目幾何關(guān)系可以用下式表示:

    (1)

    (2)

    (3)

    ζ=η-θ

    (4)

    整理式(2)~(4)得

    (5)

    2 最優(yōu)制導(dǎo)律

    最優(yōu)制導(dǎo)律(Optimal Guidance Law, OPL)是傳統(tǒng)成熟的制導(dǎo)律, 設(shè)初始彈目距離l=l0, 終端彈目交會(huì)時(shí)彈目距離接近0, 令lF=0, 終端落角約束為θF。

    在以上約束條件下, 性能指標(biāo)函數(shù)設(shè)定為

    (6)

    式中:n≥0。

    根據(jù)最優(yōu)制導(dǎo)律的求解方法得到加速度[2]:

    (7)

    式(7)是擴(kuò)展比例制導(dǎo)律的形式, 考慮到空面導(dǎo)彈的過(guò)載限制, 本文令加速度滿足-90≤aM≤90。

    3 強(qiáng)化學(xué)習(xí)制導(dǎo)律

    3.1 強(qiáng)化學(xué)習(xí)

    在機(jī)器學(xué)習(xí)中, 各種學(xué)習(xí)算法通常需要批量的輸入數(shù)據(jù)和對(duì)應(yīng)的輸出數(shù)據(jù)或標(biāo)簽數(shù)據(jù), 這些數(shù)據(jù)集還應(yīng)滿足獨(dú)立同分布。 通過(guò)對(duì)數(shù)據(jù)的訓(xùn)練, 機(jī)器學(xué)習(xí)尋得數(shù)據(jù)的內(nèi)在規(guī)律, 訓(xùn)練好的模型可以對(duì)一個(gè)輸入數(shù)據(jù)進(jìn)行輸出預(yù)測(cè), 并且預(yù)測(cè)值與觀測(cè)值一致或預(yù)測(cè)誤差很小。 但是在一些情況下, 數(shù)據(jù)是序列的, 不滿足獨(dú)立同分布。 例如導(dǎo)彈制導(dǎo)問(wèn)題, 前一時(shí)刻與后一時(shí)刻的制導(dǎo)飛行數(shù)據(jù)間有強(qiáng)相關(guān)關(guān)系, 需要連續(xù)的制導(dǎo)飛行數(shù)據(jù)才能確定制導(dǎo)律的好壞, 一個(gè)特定時(shí)刻的加速度值無(wú)法做出正確的判斷。 這就是強(qiáng)化學(xué)習(xí)要解決的問(wèn)題。

    強(qiáng)化學(xué)習(xí)基本原理如圖2所示, 智能體是做出決策的機(jī)器, 智能體感知環(huán)境狀態(tài)st計(jì)算出相應(yīng)決策動(dòng)作at, 動(dòng)作at作用于環(huán)境產(chǎn)生了獎(jiǎng)勵(lì)r, 環(huán)境進(jìn)入下一個(gè)狀態(tài)st+1, 智能體根據(jù)新的狀態(tài)做下一個(gè)決策。 依照一定的算法, 可以計(jì)算出使累計(jì)獎(jiǎng)勵(lì)最大的決策動(dòng)作序列, 這就是強(qiáng)化學(xué)習(xí)的思想。

    圖2 強(qiáng)化學(xué)習(xí)Fig.2 Reinforcement learning

    強(qiáng)化學(xué)習(xí)的核心是馬爾科夫決策過(guò)程, 馬爾科夫決策過(guò)程可由一個(gè)五元組[S,A,P,r,γ]表示。S為由狀態(tài)構(gòu)成的集合, 狀態(tài)可以是離散的, 也可以是連續(xù)的;A為由動(dòng)作構(gòu)成的集合, 動(dòng)作集合可以是有限的, 也可以是無(wú)限的;r為獎(jiǎng)勵(lì)函數(shù), 通常表示為r(s,a),r的值由狀態(tài)s及動(dòng)作a共同確定, 考慮到動(dòng)作a影響狀態(tài)s, 在某些情況下r也可表示為r(s);P(s′|s,a)為狀態(tài)轉(zhuǎn)移的概率函數(shù), 即在狀態(tài)s下采取動(dòng)作a進(jìn)入下一個(gè)狀態(tài)s′的概率;γ為折扣參數(shù), 通常是介于0到1之間的數(shù)。

    為了判斷智能體決策的優(yōu)劣, 將t時(shí)刻以后的獎(jiǎng)勵(lì)相加得到Gt, 并稱(chēng)為回報(bào):

    (8)

    考慮到馬爾科夫決策過(guò)程可能處于無(wú)限循環(huán), 折扣參數(shù)γ<1可以避免回報(bào)無(wú)限的大。rt是現(xiàn)時(shí)刻得到的獎(jiǎng)勵(lì)值, 而t+1時(shí)刻以后的獎(jiǎng)勵(lì)rt+i是對(duì)未來(lái)的估計(jì)值, 存在一定的不確定性。 降低折扣參數(shù)可以提高現(xiàn)時(shí)刻獎(jiǎng)勵(lì)的重要程度, 同時(shí)降低未來(lái)時(shí)刻的不確定性。

    這樣智能體以最大化回報(bào)的期望為目標(biāo), 以當(dāng)前狀態(tài)為輸入, 輸出一個(gè)動(dòng)作。 智能體選擇動(dòng)作的規(guī)則或者函數(shù)稱(chēng)為策略π, 可表示為

    π(a|s)=P(At=a|St=s)

    (9)

    式中:P為概率函數(shù), 表示智能體根據(jù)輸入狀態(tài)s輸出動(dòng)作a的概率。 如果P是在輸入狀態(tài)s輸出動(dòng)作集A的概率分布, 則這個(gè)策略是隨機(jī)性策略, 策略根據(jù)概率采樣輸出一個(gè)動(dòng)作a; 如果在輸入狀態(tài)s下輸出一個(gè)確定的動(dòng)作, 即輸出該動(dòng)作的概率,P=1, 則這個(gè)策略就是確定性策略。

    判斷策略的好壞是通過(guò)貝爾曼期望方程實(shí)現(xiàn)的:

    Qπ(s,a)=γ∑P(s′|s,a)∑π(a′|s′)·

    Qπ(s′,a′)+r(s,a)

    (10)

    Vπ(s)=∑π(a|s)r(s,a)+∑π(a|s)·

    (γ∑P(s′|s,a)Vπ(s′))

    (11)

    式中:Qπ(s,a)為策略π下的動(dòng)作價(jià)值函數(shù);Vπ(s)為策略π下的狀態(tài)價(jià)值函數(shù)。

    3.2 深度確定性策略梯度(DDPG)算法

    DDPG算法是可以處理連續(xù)動(dòng)作空間的離線學(xué)習(xí)策略。 DDPG算法框架如圖3所示, 策略網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò)均使用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。 策略網(wǎng)絡(luò)用于擬合狀態(tài)s與動(dòng)作a的函數(shù)關(guān)系a(s), 策略網(wǎng)絡(luò)在動(dòng)作價(jià)值的評(píng)判下, 通過(guò)訓(xùn)練尋找最優(yōu)策略。 估計(jì)網(wǎng)絡(luò)用來(lái)擬合狀態(tài)s、 動(dòng)作a與獎(jiǎng)勵(lì)r的函數(shù)關(guān)系r(s,a), 通過(guò)離線的數(shù)據(jù)進(jìn)行訓(xùn)練。 策略網(wǎng)絡(luò)、 評(píng)價(jià)網(wǎng)絡(luò)和環(huán)境構(gòu)成了一個(gè)完整的馬爾可夫決策過(guò)程。 估計(jì)策略網(wǎng)絡(luò)和目標(biāo)策略網(wǎng)絡(luò)具有相同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu), 神經(jīng)網(wǎng)絡(luò)參數(shù)分別為σ和σ′。 估計(jì)評(píng)價(jià)網(wǎng)絡(luò)和目標(biāo)評(píng)價(jià)網(wǎng)絡(luò)具有相同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu), 神經(jīng)網(wǎng)絡(luò)參數(shù)分別為ω和ω′。 采用兩套相同評(píng)價(jià)網(wǎng)絡(luò)和策略網(wǎng)絡(luò)是為了防止神經(jīng)網(wǎng)絡(luò)參數(shù)變化過(guò)于劇烈, 解決神經(jīng)網(wǎng)絡(luò)訓(xùn)練不穩(wěn)定的問(wèn)題。 估計(jì)網(wǎng)絡(luò)實(shí)時(shí)更新參數(shù)ω和σ, 目標(biāo)網(wǎng)絡(luò)按照下式軟更新參數(shù)ω′和σ′:

    圖3 DDPG算法Fig.3 DDPG algorithm

    ω′=τω+(1-τ)ω′

    (12)

    σ′=τσ+(1-τ)σ′

    (13)

    式中: 0<τ≤1。

    估計(jì)評(píng)價(jià)網(wǎng)絡(luò)按照下式, 最小化目標(biāo)損失更新網(wǎng)絡(luò)參數(shù)ω:

    (14)

    估計(jì)策略網(wǎng)絡(luò)采用鏈?zhǔn)椒▌t最大化Qw梯度策略更新估計(jì)策略網(wǎng)絡(luò)參數(shù)σ:

    (15)

    式中:ai=μσ(si)。

    DDPG算法具體流程如下:

    (1) 用隨機(jī)參數(shù)初始化估計(jì)策略網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò);

    (2) 復(fù)制估計(jì)網(wǎng)絡(luò)參數(shù)至目標(biāo)網(wǎng)絡(luò)并初始化;

    (3) 隨機(jī)初始狀態(tài)s1和噪聲, 利用估計(jì)網(wǎng)絡(luò)循環(huán)計(jì)算并與環(huán)境交互, 保存得到的st,at,rt,st+1至經(jīng)驗(yàn)池;

    (4) 獲得足夠的樣本后, 采樣N個(gè)數(shù)據(jù)組si,ai,ri,si+1;

    (5) 采用式(14)最小化目標(biāo)函數(shù)L, 并更新估計(jì)策略網(wǎng)絡(luò)的參數(shù)σ;

    (6) 采用式(15), 通過(guò)梯度上升方法最大化Qw, 并更新估計(jì)評(píng)價(jià)網(wǎng)絡(luò)的參數(shù)ω;

    (7) 采用式(12)~(13)軟更新目標(biāo)策略網(wǎng)絡(luò)參數(shù)σ′和目標(biāo)評(píng)價(jià)網(wǎng)絡(luò)參數(shù)ω′;

    (8) 用更新后的估計(jì)網(wǎng)絡(luò)繼續(xù)采樣、 保存, 重復(fù)步驟4~7。 訓(xùn)練過(guò)程中, 按照一定的規(guī)則逐漸降低噪聲直至為0。

    3.3 制導(dǎo)律訓(xùn)練模型

    (16)

    以上獎(jiǎng)勵(lì)函數(shù)的目的是將彈目視線角θ收斂到θF, 并使導(dǎo)彈沿彈目視線(彈目視線θF)飛行。 此時(shí), 導(dǎo)彈可能飛向目標(biāo), 也可能遠(yuǎn)離目標(biāo), 因此當(dāng)導(dǎo)彈遠(yuǎn)離目標(biāo)時(shí)進(jìn)行懲罰。 只要能保證導(dǎo)彈沿彈目視線角為θF的彈目視線飛向目標(biāo), 導(dǎo)彈能夠命中目標(biāo)。

    式(1)~(4)構(gòu)成環(huán)境, 在初始條件下DDPG算法與環(huán)境交互。

    動(dòng)作a是加速度, 考慮空面導(dǎo)彈的過(guò)載限制, 令動(dòng)作滿足-90≤a≤90。

    為了保證訓(xùn)練模型的泛化能力, 末制導(dǎo)初始時(shí)刻導(dǎo)彈M在服從中心為(-5 000 m, 5 000 m), 方差為500的正態(tài)分布的隨機(jī)位置; 導(dǎo)彈速度vM=300 m/s; 終端落角θF為服從均勻分布[-1.4,-0.3]的隨機(jī)位置; 彈道傾角η為服從以0為中心, 方差為0.2的正態(tài)分布的隨機(jī)位置。 在不同初始條件下對(duì)模型訓(xùn)練, 得到穩(wěn)定的強(qiáng)化學(xué)習(xí)制導(dǎo)律。

    4 仿真分析

    為分析強(qiáng)化學(xué)習(xí)制導(dǎo)律的特性, 設(shè)置3種不同初始條件進(jìn)行分析, 如圖4~8所示。

    圖4 加速度變化情況Fig.4 Acceleration changes

    圖5 彈目距離變化情況Fig.5 Change in distance of missile and target

    圖6 導(dǎo)彈位置變化情況Fig.6 Change in missile position

    初始條件1: 導(dǎo)彈位置(-5 000 m, 5 000 m), 終端落角為-1.1, 彈道傾為0, 最優(yōu)制導(dǎo)律式(7)中n=1。

    初始條件2: 導(dǎo)彈位置(-5 000 m, 4 500 m), 終端落角為-0.8, 彈道傾為0.1, 最優(yōu)制導(dǎo)律式(7)中n=0。

    初始條件3: 導(dǎo)彈位置(-4 000 m, 4 500 m), 終端落角為-1.0, 彈道傾為0.2, 最優(yōu)制導(dǎo)律式(7)中n=2。

    從圖中可以看出, 在3種不同初始條件下, 強(qiáng)化學(xué)習(xí)制導(dǎo)律均能以期望的落角命中目標(biāo), 且加速度在允許范圍內(nèi), 彈道平滑。 本文訓(xùn)練的模型泛化能力較好, 能夠滿足制導(dǎo)要求。

    通過(guò)對(duì)比可以發(fā)現(xiàn): 最優(yōu)制導(dǎo)律在末制導(dǎo)初始時(shí)刻加速度值較大, 尤其是圖4(c)中以最大過(guò)載飛行時(shí)間較長(zhǎng); 在制導(dǎo)末時(shí)刻加速度的絕對(duì)值會(huì)有一個(gè)增大, 尤其是圖4(a)中加速度的絕對(duì)值急劇增加。 強(qiáng)化學(xué)習(xí)制導(dǎo)律在末制導(dǎo)初始時(shí)刻所需的加速度較小, 在制導(dǎo)末時(shí)刻加速度接近0, 加速度變化比較平緩。 從圖7中可以看出, 與最優(yōu)制導(dǎo)律相比, 強(qiáng)化學(xué)習(xí)制導(dǎo)律收斂到固定攻擊角度的速度更快。 從圖8中可以看出, 與最優(yōu)制導(dǎo)律相比, 強(qiáng)化學(xué)習(xí)制導(dǎo)律能夠使速度更快的指向LOS方向。

    圖7 彈目視線角變化情況Fig.7 Change in line of sight angle of missile and target

    圖8 導(dǎo)彈方向誤差角變化情況Fig.8 Change in missile direction error angle

    為分析目標(biāo)為低速面目標(biāo)時(shí)的制導(dǎo)律特性, 令動(dòng)目標(biāo)勻速直線運(yùn)動(dòng), 以目標(biāo)速度為15 m/s, 速度方向服從均勻分布[-π,π]為條件, 在訓(xùn)練好的固定目標(biāo)強(qiáng)化學(xué)習(xí)制導(dǎo)律的基礎(chǔ)上繼續(xù)進(jìn)行訓(xùn)練, 得到了穩(wěn)定的強(qiáng)化學(xué)習(xí)制導(dǎo)律。

    設(shè)定初始條件4: 導(dǎo)彈位置(-5 000 m,5 000 m), 終端落角為-1.0, 彈道傾為0.2, 目標(biāo)速度方向?yàn)?, 最優(yōu)制導(dǎo)律式(7)中n=2。

    強(qiáng)化學(xué)習(xí)制導(dǎo)律和最優(yōu)制導(dǎo)律均能命中目標(biāo), 如圖9所示。 運(yùn)動(dòng)的目標(biāo)使彈目視線一直在變化, 這致使制導(dǎo)律需要不斷的調(diào)整導(dǎo)彈的飛行方向, 修正制導(dǎo)誤差有一定的滯后性。 從仿真結(jié)果圖9(c)中可以看出, 最優(yōu)制導(dǎo)律的終端落角為-0.92, 終端落角的誤差為0.08; 強(qiáng)化學(xué)習(xí)制導(dǎo)律的終端落角為-0.97, 終端落角的誤差為0.03。 強(qiáng)化學(xué)習(xí)制導(dǎo)律在應(yīng)對(duì)運(yùn)動(dòng)目標(biāo)的多約束制導(dǎo)問(wèn)題上具有更好的效果, 能更好適應(yīng)變化的戰(zhàn)場(chǎng)環(huán)境。

    圖9 初始條件4Fig.9 Condition 4

    5 結(jié) 論

    針對(duì)空面導(dǎo)彈以一定的落角攻擊面目標(biāo)的問(wèn)題, 本文采用DDPG算法進(jìn)行了制導(dǎo)律設(shè)計(jì)并進(jìn)行訓(xùn)練。 DDPG制導(dǎo)律仿真結(jié)果表明: 模型的泛化能力較好, 能以期望的落角命中目標(biāo), 且加速度在允許范圍內(nèi), 彈道平滑, 在不同初始條件下均能夠滿足制導(dǎo)要求。 DDPG制導(dǎo)律比最優(yōu)制導(dǎo)律有更快的收斂速度、 更好的加速度特性。 針對(duì)低速移動(dòng)目標(biāo), DDPG制導(dǎo)律的終端落角誤差比最優(yōu)制導(dǎo)律小, 能更好的適應(yīng)制導(dǎo)過(guò)程中的變化的戰(zhàn)場(chǎng)環(huán)境。

    猜你喜歡
    動(dòng)作策略
    基于“選—練—評(píng)”一體化的二輪復(fù)習(xí)策略
    下一個(gè)動(dòng)作
    求初相φ的常見(jiàn)策略
    例談未知角三角函數(shù)值的求解策略
    我說(shuō)你做講策略
    動(dòng)作描寫(xiě)要具體
    高中數(shù)學(xué)復(fù)習(xí)的具體策略
    畫(huà)動(dòng)作
    讓動(dòng)作“活”起來(lái)
    動(dòng)作描寫(xiě)不可少
    首页视频小说图片口味搜索| 最新美女视频免费是黄的| 一级毛片精品| 中文资源天堂在线| 又黄又爽又免费观看的视频| 免费观看精品视频网站| 国产成人av激情在线播放| 老司机深夜福利视频在线观看| 黑人巨大精品欧美一区二区mp4| 日韩精品青青久久久久久| 神马国产精品三级电影在线观看 | 琪琪午夜伦伦电影理论片6080| 一级片免费观看大全| 亚洲成av人片免费观看| 亚洲欧美精品综合久久99| 中文字幕最新亚洲高清| 日韩欧美在线乱码| 日韩国内少妇激情av| 国产午夜福利久久久久久| 欧美又色又爽又黄视频| 一a级毛片在线观看| 两人在一起打扑克的视频| 啪啪无遮挡十八禁网站| 十八禁人妻一区二区| 男人的好看免费观看在线视频 | 国产精品亚洲一级av第二区| 999精品在线视频| 欧美+亚洲+日韩+国产| 欧美一区二区精品小视频在线| 男女午夜视频在线观看| 亚洲片人在线观看| 老汉色av国产亚洲站长工具| 听说在线观看完整版免费高清| 最近最新免费中文字幕在线| 精品一区二区三区四区五区乱码| 欧美极品一区二区三区四区| 精品一区二区三区四区五区乱码| 亚洲精品一卡2卡三卡4卡5卡| 麻豆久久精品国产亚洲av| 人妻夜夜爽99麻豆av| 亚洲精品中文字幕在线视频| 两个人免费观看高清视频| 亚洲精品国产精品久久久不卡| 麻豆av在线久日| 又爽又黄无遮挡网站| 欧美另类亚洲清纯唯美| 97超级碰碰碰精品色视频在线观看| aaaaa片日本免费| 国产激情偷乱视频一区二区| 亚洲av五月六月丁香网| 亚洲乱码一区二区免费版| 亚洲18禁久久av| 色播亚洲综合网| 欧美日韩一级在线毛片| 国产成人欧美在线观看| 91麻豆av在线| 中文资源天堂在线| 亚洲中文字幕一区二区三区有码在线看 | 免费看十八禁软件| bbb黄色大片| 观看免费一级毛片| 久热爱精品视频在线9| 亚洲国产精品sss在线观看| 久久久久久大精品| 国模一区二区三区四区视频 | 中出人妻视频一区二区| 91在线观看av| 97碰自拍视频| 男女午夜视频在线观看| 国产黄a三级三级三级人| 18禁美女被吸乳视频| 亚洲国产欧美一区二区综合| 欧美一级毛片孕妇| 国产亚洲精品一区二区www| 一级黄色大片毛片| 欧美+亚洲+日韩+国产| 中文字幕人妻丝袜一区二区| 欧美成人性av电影在线观看| 麻豆成人午夜福利视频| 淫妇啪啪啪对白视频| 少妇熟女aⅴ在线视频| 午夜福利高清视频| 国产又色又爽无遮挡免费看| 国产精品爽爽va在线观看网站| av超薄肉色丝袜交足视频| 99在线视频只有这里精品首页| 桃色一区二区三区在线观看| 真人做人爱边吃奶动态| 老熟妇乱子伦视频在线观看| 嫩草影视91久久| 美女高潮喷水抽搐中文字幕| 这个男人来自地球电影免费观看| 日本在线视频免费播放| 欧美日韩瑟瑟在线播放| 2021天堂中文幕一二区在线观| 欧美黄色片欧美黄色片| 麻豆国产97在线/欧美 | 岛国在线免费视频观看| 久久久久久久精品吃奶| 麻豆成人午夜福利视频| 欧美3d第一页| 熟女少妇亚洲综合色aaa.| 一级毛片女人18水好多| 两性午夜刺激爽爽歪歪视频在线观看 | 草草在线视频免费看| 琪琪午夜伦伦电影理论片6080| 又大又爽又粗| 在线观看免费午夜福利视频| 日本在线视频免费播放| 欧美日韩国产亚洲二区| 在线观看www视频免费| 美女大奶头视频| 视频区欧美日本亚洲| 99riav亚洲国产免费| 国产成人欧美在线观看| 真人做人爱边吃奶动态| 精品国产超薄肉色丝袜足j| 国产主播在线观看一区二区| 99国产精品一区二区蜜桃av| 欧美黄色淫秽网站| 中文字幕av在线有码专区| 亚洲中文字幕一区二区三区有码在线看 | 国产亚洲精品综合一区在线观看 | a在线观看视频网站| 成年女人毛片免费观看观看9| 国产亚洲精品综合一区在线观看 | 成人手机av| 亚洲精品在线美女| 日韩成人在线观看一区二区三区| 99在线人妻在线中文字幕| 亚洲五月天丁香| 国产成人欧美在线观看| 免费在线观看日本一区| 天天躁狠狠躁夜夜躁狠狠躁| 高清毛片免费观看视频网站| 一本综合久久免费| 岛国视频午夜一区免费看| bbb黄色大片| 国产伦在线观看视频一区| av欧美777| 国产成人影院久久av| 日韩大尺度精品在线看网址| 国产精品久久久av美女十八| 后天国语完整版免费观看| 中文字幕av在线有码专区| 国产在线观看jvid| 麻豆国产av国片精品| 91九色精品人成在线观看| www日本黄色视频网| 日韩高清综合在线| 国产熟女xx| 国产又色又爽无遮挡免费看| 国产麻豆成人av免费视频| 香蕉久久夜色| 天堂动漫精品| 91麻豆av在线| 大型黄色视频在线免费观看| 精品久久久久久久末码| 亚洲av成人一区二区三| 久久精品国产清高在天天线| 欧美3d第一页| 悠悠久久av| 一个人免费在线观看电影 | av免费在线观看网站| 亚洲熟妇中文字幕五十中出| 美女扒开内裤让男人捅视频| 老司机靠b影院| 我要搜黄色片| 看免费av毛片| 久久精品夜夜夜夜夜久久蜜豆 | 日本成人三级电影网站| 亚洲狠狠婷婷综合久久图片| 午夜福利成人在线免费观看| 老汉色∧v一级毛片| av在线天堂中文字幕| 日本三级黄在线观看| 每晚都被弄得嗷嗷叫到高潮| 精品国产乱码久久久久久男人| 丰满人妻熟妇乱又伦精品不卡| 国产精品综合久久久久久久免费| 亚洲av第一区精品v没综合| 精品久久久久久久久久久久久| 身体一侧抽搐| 夜夜爽天天搞| 一级毛片精品| 日韩欧美一区二区三区在线观看| 99久久精品国产亚洲精品| 亚洲专区国产一区二区| 99国产综合亚洲精品| 丰满人妻熟妇乱又伦精品不卡| 999久久久国产精品视频| 大型av网站在线播放| 精品国产乱子伦一区二区三区| 国产野战对白在线观看| 麻豆国产av国片精品| 欧美性长视频在线观看| 欧美性猛交黑人性爽| 久久久久性生活片| 亚洲天堂国产精品一区在线| 国产精品精品国产色婷婷| 欧美黄色淫秽网站| 国产熟女xx| 国产精品久久久久久亚洲av鲁大| 国产精品精品国产色婷婷| 国产麻豆成人av免费视频| 看免费av毛片| 精品国产超薄肉色丝袜足j| 亚洲av美国av| 青草久久国产| 怎么达到女性高潮| 每晚都被弄得嗷嗷叫到高潮| 国产av不卡久久| 可以在线观看的亚洲视频| 国内精品久久久久精免费| 久久婷婷成人综合色麻豆| 日韩欧美一区二区三区在线观看| 国产精品久久视频播放| 国内久久婷婷六月综合欲色啪| 国产精品一区二区精品视频观看| 黄色女人牲交| 中亚洲国语对白在线视频| 亚洲国产精品久久男人天堂| 精品国产超薄肉色丝袜足j| 变态另类丝袜制服| 伦理电影免费视频| 丁香欧美五月| 亚洲人成伊人成综合网2020| 人妻夜夜爽99麻豆av| 欧美成人性av电影在线观看| 亚洲成av人片在线播放无| 久久天堂一区二区三区四区| 91麻豆av在线| 免费看a级黄色片| 给我免费播放毛片高清在线观看| 亚洲欧美日韩东京热| 亚洲精品美女久久久久99蜜臀| 久久草成人影院| 久久婷婷成人综合色麻豆| cao死你这个sao货| 欧美日本视频| 国产av不卡久久| 国产成人啪精品午夜网站| 男人舔女人的私密视频| 精品欧美国产一区二区三| 激情在线观看视频在线高清| 免费看美女性在线毛片视频| 波多野结衣巨乳人妻| 他把我摸到了高潮在线观看| 成人三级做爰电影| 最好的美女福利视频网| 亚洲人成电影免费在线| 精品国产亚洲在线| 久久精品91无色码中文字幕| 日本熟妇午夜| 国产精品精品国产色婷婷| 夜夜躁狠狠躁天天躁| 国产又色又爽无遮挡免费看| 国产成人欧美在线观看| 国产男靠女视频免费网站| 久久性视频一级片| 久热爱精品视频在线9| 精品国产乱码久久久久久男人| 免费观看精品视频网站| 久久婷婷人人爽人人干人人爱| 99久久精品国产亚洲精品| 国产亚洲精品久久久久久毛片| 亚洲av成人av| 无人区码免费观看不卡| 精品福利观看| 国产黄a三级三级三级人| 国产麻豆成人av免费视频| 国产伦一二天堂av在线观看| 欧美日本亚洲视频在线播放| 男女之事视频高清在线观看| 91麻豆av在线| 在线观看66精品国产| 美女黄网站色视频| 美女扒开内裤让男人捅视频| 91九色精品人成在线观看| 美女大奶头视频| 99国产精品一区二区蜜桃av| 级片在线观看| 12—13女人毛片做爰片一| 亚洲av日韩精品久久久久久密| 91麻豆av在线| 久久精品91蜜桃| 国产午夜精品久久久久久| 久久久久性生活片| 色综合婷婷激情| 精品国内亚洲2022精品成人| 亚洲成人久久性| 舔av片在线| 国产视频内射| 色老头精品视频在线观看| 国产精品一及| 99在线视频只有这里精品首页| 天堂av国产一区二区熟女人妻 | 国产私拍福利视频在线观看| 午夜精品久久久久久毛片777| 成人永久免费在线观看视频| 亚洲美女视频黄频| 欧美成人一区二区免费高清观看 | 搞女人的毛片| 两个人免费观看高清视频| 高清毛片免费观看视频网站| 一区二区三区国产精品乱码| 亚洲成人中文字幕在线播放| 日韩高清综合在线| 欧美高清成人免费视频www| 午夜a级毛片| bbb黄色大片| 亚洲一区二区三区色噜噜| 午夜福利在线观看吧| 两性午夜刺激爽爽歪歪视频在线观看 | 久久伊人香网站| 亚洲美女黄片视频| 国产精品亚洲av一区麻豆| 久久精品人妻少妇| 中文字幕精品亚洲无线码一区| 不卡一级毛片| tocl精华| 久久婷婷成人综合色麻豆| 男人的好看免费观看在线视频 | 成人av在线播放网站| 国产亚洲精品久久久久久毛片| 国产精品 国内视频| 免费在线观看视频国产中文字幕亚洲| 精品国产乱码久久久久久男人| 亚洲午夜理论影院| 90打野战视频偷拍视频| 亚洲国产日韩欧美精品在线观看 | 日韩国内少妇激情av| 宅男免费午夜| 国产97色在线日韩免费| 日本黄色视频三级网站网址| 视频区欧美日本亚洲| 亚洲国产精品久久男人天堂| 日韩欧美 国产精品| 一夜夜www| 久久久精品大字幕| www.自偷自拍.com| 日日干狠狠操夜夜爽| 欧美国产日韩亚洲一区| ponron亚洲| 亚洲一码二码三码区别大吗| 久久热在线av| 女人高潮潮喷娇喘18禁视频| 男人的好看免费观看在线视频 | 19禁男女啪啪无遮挡网站| 欧美3d第一页| 身体一侧抽搐| 极品教师在线免费播放| 高清在线国产一区| 神马国产精品三级电影在线观看 | 久久香蕉精品热| 免费搜索国产男女视频| 又黄又爽又免费观看的视频| 亚洲国产欧美一区二区综合| 黑人巨大精品欧美一区二区mp4| 国模一区二区三区四区视频 | 精品国产美女av久久久久小说| 日本三级黄在线观看| 久久这里只有精品中国| 国产av一区在线观看免费| 日本 av在线| 校园春色视频在线观看| avwww免费| 美女扒开内裤让男人捅视频| 免费av毛片视频| 国产高清videossex| 99久久精品热视频| 成人18禁高潮啪啪吃奶动态图| 一进一出好大好爽视频| 黑人欧美特级aaaaaa片| www.999成人在线观看| 国产探花在线观看一区二区| 国产午夜精品久久久久久| 丁香六月欧美| 99国产综合亚洲精品| 一本综合久久免费| 欧美zozozo另类| 日韩精品中文字幕看吧| 日本 欧美在线| 日本成人三级电影网站| 亚洲色图 男人天堂 中文字幕| 妹子高潮喷水视频| bbb黄色大片| 神马国产精品三级电影在线观看 | 日韩欧美一区二区三区在线观看| 男女那种视频在线观看| 哪里可以看免费的av片| 中文字幕高清在线视频| 一个人免费在线观看电影 | 一区福利在线观看| 91大片在线观看| 黄片小视频在线播放| 久久人妻av系列| 深夜精品福利| 国产精品野战在线观看| 国产一区二区三区在线臀色熟女| 两性午夜刺激爽爽歪歪视频在线观看 | 一级毛片精品| 丝袜美腿诱惑在线| 亚洲av五月六月丁香网| 午夜福利视频1000在线观看| 12—13女人毛片做爰片一| 黄色片一级片一级黄色片| 日韩精品青青久久久久久| 两人在一起打扑克的视频| 久久久国产欧美日韩av| 一卡2卡三卡四卡精品乱码亚洲| 一a级毛片在线观看| 在线播放国产精品三级| 天堂√8在线中文| 免费一级毛片在线播放高清视频| 香蕉丝袜av| 亚洲一区中文字幕在线| www.www免费av| 国产视频一区二区在线看| 国产亚洲av嫩草精品影院| 久久久久久人人人人人| 欧美3d第一页| 国产免费av片在线观看野外av| 久久热在线av| videosex国产| 老司机深夜福利视频在线观看| 母亲3免费完整高清在线观看| 麻豆成人av在线观看| 在线观看免费日韩欧美大片| 久久久久久人人人人人| 国产97色在线日韩免费| 国产主播在线观看一区二区| 亚洲人成网站高清观看| 午夜福利免费观看在线| 在线十欧美十亚洲十日本专区| 免费搜索国产男女视频| 动漫黄色视频在线观看| 亚洲欧美日韩高清专用| 此物有八面人人有两片| 欧美成人免费av一区二区三区| 男人舔女人下体高潮全视频| 精品第一国产精品| 琪琪午夜伦伦电影理论片6080| 精品熟女少妇八av免费久了| 人人妻人人看人人澡| 国产一区二区三区在线臀色熟女| 欧美乱码精品一区二区三区| 国内毛片毛片毛片毛片毛片| 成人国产综合亚洲| 丝袜人妻中文字幕| 悠悠久久av| av片东京热男人的天堂| av在线播放免费不卡| 国产av一区在线观看免费| 国产高清视频在线观看网站| 日韩欧美在线乱码| 欧美zozozo另类| 日韩中文字幕欧美一区二区| 亚洲成人久久爱视频| 2021天堂中文幕一二区在线观| 熟女少妇亚洲综合色aaa.| 黄片小视频在线播放| 真人做人爱边吃奶动态| 亚洲欧美一区二区三区黑人| 日韩精品中文字幕看吧| 禁无遮挡网站| 日本五十路高清| 欧美另类亚洲清纯唯美| 亚洲男人天堂网一区| 人人妻人人看人人澡| 亚洲精品中文字幕一二三四区| 女同久久另类99精品国产91| 日本一区二区免费在线视频| 国产成人系列免费观看| 欧美大码av| 久久久国产精品麻豆| 国内精品一区二区在线观看| 毛片女人毛片| 欧美又色又爽又黄视频| 欧美中文综合在线视频| 九色成人免费人妻av| 好看av亚洲va欧美ⅴa在| av超薄肉色丝袜交足视频| 色哟哟哟哟哟哟| 最新在线观看一区二区三区| 色综合亚洲欧美另类图片| 日日摸夜夜添夜夜添小说| 我要搜黄色片| 全区人妻精品视频| 99热6这里只有精品| 欧美在线黄色| 国产成人av激情在线播放| 99国产综合亚洲精品| 久热爱精品视频在线9| 在线观看免费午夜福利视频| 中文字幕人成人乱码亚洲影| 欧美久久黑人一区二区| 中文字幕熟女人妻在线| 国产精品一区二区精品视频观看| 午夜精品久久久久久毛片777| 亚洲国产精品sss在线观看| 最新美女视频免费是黄的| 亚洲av电影在线进入| 婷婷亚洲欧美| 99在线视频只有这里精品首页| 亚洲欧美日韩无卡精品| 亚洲天堂国产精品一区在线| 亚洲狠狠婷婷综合久久图片| 久热爱精品视频在线9| 久久久久国内视频| 精品国产超薄肉色丝袜足j| 好男人在线观看高清免费视频| 精品国产亚洲在线| 又大又爽又粗| 女同久久另类99精品国产91| 又大又爽又粗| 精品国产超薄肉色丝袜足j| 1024手机看黄色片| 一进一出抽搐gif免费好疼| 久久香蕉激情| 日韩欧美 国产精品| 在线观看日韩欧美| ponron亚洲| 99精品久久久久人妻精品| 午夜视频精品福利| 国产精品美女特级片免费视频播放器 | 久久久久国产一级毛片高清牌| 亚洲美女黄片视频| 亚洲人与动物交配视频| 91字幕亚洲| 亚洲人与动物交配视频| 97碰自拍视频| 97超级碰碰碰精品色视频在线观看| 午夜福利18| 色av中文字幕| 日韩欧美一区二区三区在线观看| 一本精品99久久精品77| 男女床上黄色一级片免费看| 人妻丰满熟妇av一区二区三区| 女生性感内裤真人,穿戴方法视频| 波多野结衣巨乳人妻| 一个人免费在线观看的高清视频| 久久精品亚洲精品国产色婷小说| а√天堂www在线а√下载| 在线十欧美十亚洲十日本专区| 亚洲精华国产精华精| 精品国产超薄肉色丝袜足j| 99在线视频只有这里精品首页| 国产爱豆传媒在线观看 | 岛国视频午夜一区免费看| 无限看片的www在线观看| 国模一区二区三区四区视频 | 亚洲美女黄片视频| 精品久久久久久成人av| 国产91精品成人一区二区三区| 一级毛片女人18水好多| 露出奶头的视频| 亚洲国产日韩欧美精品在线观看 | 欧美一区二区精品小视频在线| 两人在一起打扑克的视频| 中文字幕人成人乱码亚洲影| 在线播放国产精品三级| 国产欧美日韩精品亚洲av| 看黄色毛片网站| 国产精品爽爽va在线观看网站| 国产成+人综合+亚洲专区| 久久久久久大精品| 色老头精品视频在线观看| 国产精品美女特级片免费视频播放器 | 亚洲精品色激情综合| 成人高潮视频无遮挡免费网站| 久久久国产成人免费| 男人舔女人下体高潮全视频| 国产成人精品久久二区二区免费| 俺也久久电影网| 97人妻精品一区二区三区麻豆| 看免费av毛片| 免费搜索国产男女视频| 婷婷精品国产亚洲av在线| 最近最新中文字幕大全电影3| 国产黄色小视频在线观看| 久久久久久人人人人人| 伦理电影免费视频| 在线观看美女被高潮喷水网站 | 日韩大码丰满熟妇| 我的老师免费观看完整版| 国产日本99.免费观看| 男人舔女人下体高潮全视频| 淫妇啪啪啪对白视频| 成在线人永久免费视频| 国语自产精品视频在线第100页| 久久午夜亚洲精品久久| 国产在线观看jvid| 精品久久久久久久人妻蜜臀av| 丝袜人妻中文字幕| 丁香欧美五月| 麻豆一二三区av精品| 俺也久久电影网| 99re在线观看精品视频| 亚洲av成人一区二区三| 国产精华一区二区三区| 欧美在线黄色| 黑人操中国人逼视频| 麻豆国产av国片精品| 国产精品av视频在线免费观看| 国产伦在线观看视频一区| 久久九九热精品免费| 久久精品aⅴ一区二区三区四区| 99久久99久久久精品蜜桃| 欧美在线一区亚洲| 我的老师免费观看完整版| 国产精品亚洲av一区麻豆| 在线免费观看的www视频| 天天一区二区日本电影三级| 亚洲人成电影免费在线|