• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于改進(jìn)DQN方法的滑翔制導(dǎo)炮彈彈道規(guī)劃

    2024-01-05 00:31:50謝蕃葳王旭剛
    彈道學(xué)報(bào) 2023年4期
    關(guān)鍵詞:滑翔彈道約束

    謝蕃葳,王旭剛

    (南京理工大學(xué) 能源與動(dòng)力工程學(xué)院,江蘇 南京 210094)

    超遠(yuǎn)程滑翔制導(dǎo)炮彈滑翔段的彈道規(guī)劃一直以來都是研究的重點(diǎn)和難點(diǎn),其既要滿足寬空域?qū)捤儆蝻w行過程中的強(qiáng)耦合、快時(shí)變以及強(qiáng)非線性的運(yùn)動(dòng)約束關(guān)系,還需要在被限制的控制空間內(nèi)尋求最大作戰(zhàn)射程[1,2]?;瓒蔚膹椀酪?guī)劃的實(shí)質(zhì)是求解非線性帶約束最優(yōu)控制問題,對(duì)應(yīng)的動(dòng)力學(xué)模型是時(shí)變非線性微分方程組。隨著非線性條件和約束條件的增多,目前該方程組難以通過解析的方式求得目標(biāo)解。因此,現(xiàn)在的彈道規(guī)劃方法主要?dú)w納為三類:間接方法[3,4]、直接方法[5,6]和智能啟發(fā)式方法[7-9]。

    深度強(qiáng)化學(xué)習(xí)是采用深度神經(jīng)網(wǎng)絡(luò)做函數(shù)擬合的一類新興強(qiáng)化學(xué)習(xí)算法,它不同于依靠大量最優(yōu)彈道數(shù)據(jù)樣本進(jìn)行彈道規(guī)劃訓(xùn)練的深度學(xué)習(xí)方法[10],而是通過與環(huán)境的自主交互尋求最優(yōu)規(guī)劃網(wǎng)絡(luò)參數(shù)。目前,強(qiáng)化學(xué)習(xí)的相關(guān)應(yīng)用已經(jīng)在圍棋[11]、電子競(jìng)技[12]等場(chǎng)合中展示了在復(fù)雜環(huán)境下處理各種信息,并將信息轉(zhuǎn)換為規(guī)劃決策的能力。目前,基于深度強(qiáng)化學(xué)習(xí)的飛行器彈道規(guī)劃研究仍處于起步階段。文獻(xiàn)[13]在設(shè)定初速度與出射角的情況下,在彈丸的外彈道飛行過程利用Q-learning算法輸出控制指令,通過強(qiáng)化學(xué)習(xí)迭代計(jì)算實(shí)現(xiàn)彈道優(yōu)化目標(biāo),導(dǎo)彈射程比無控時(shí)明顯增加。文獻(xiàn)[14]提出了一種基于網(wǎng)絡(luò)優(yōu)選雙深度Q網(wǎng)絡(luò)的深度強(qiáng)化學(xué)習(xí)方法,保存了訓(xùn)練過程當(dāng)中的最佳網(wǎng)絡(luò),突出了算法優(yōu)越的性能表現(xiàn)。但文中對(duì)獎(jiǎng)勵(lì)函數(shù)的落速懲罰沒有指明,沒有明確的約束限制指向。文獻(xiàn)[15]提出了一種無模型的強(qiáng)化學(xué)習(xí)和交叉熵方法相結(jié)合的在線航跡規(guī)劃算法,利用近端策略優(yōu)化算法離線訓(xùn)練智能體,可以在復(fù)雜多變的飛行空域中生成曲率平滑的航跡,擁有較高的突防成功率。文獻(xiàn)[16]利用深度確定性策略梯度算法訓(xùn)練得到巡飛彈突防控制策略網(wǎng)絡(luò),在1 000次飛行仿真下?lián)碛?2.1%的任務(wù)成功率,平均決策時(shí)間僅有1.48 ms。

    然而,以上深度強(qiáng)化學(xué)習(xí)算法研究的重點(diǎn)主要集中在算法的應(yīng)用性能上,算法本身的穩(wěn)定性研究方面稍有欠缺。強(qiáng)化學(xué)習(xí)的相關(guān)研究領(lǐng)域普遍存在著訓(xùn)練不穩(wěn)定的問題。所以,為了建立穩(wěn)定的深度強(qiáng)化學(xué)習(xí)訓(xùn)練過程,本文以超遠(yuǎn)程滑翔制導(dǎo)炮彈滑翔段作為研究對(duì)象進(jìn)行彈道規(guī)劃,創(chuàng)新性提出了一種IM-DQN算法,采用無效經(jīng)驗(yàn)剔除的經(jīng)驗(yàn)池管理方法,將訓(xùn)練過程中整體表現(xiàn)低效的回合樣本點(diǎn)全部剔除以保證提取樣本時(shí)避開這些低效環(huán)節(jié),并且添加探索限制策略進(jìn)行更新,保證訓(xùn)練網(wǎng)絡(luò)效果不會(huì)大幅度跌塌,使得訓(xùn)練效果更加穩(wěn)定。

    1 問題描述

    滑翔制導(dǎo)炮彈在彈道頂點(diǎn)展開鴨舵進(jìn)行滑翔,本文聚焦智能規(guī)劃方法在滑翔段的適用性問題,為了突出研究問題的重點(diǎn),給出了典型滑翔運(yùn)動(dòng)模型,攻角為控制參數(shù),其三自由度運(yùn)動(dòng)模型為[17]:

    (1)

    式中:x、y是慣性坐標(biāo)系下的位置,v、θ、m分別是炮彈飛行速度、彈道傾角、炮彈質(zhì)量。阻力Fx和升力Fy計(jì)算公式如下:

    (2)

    超遠(yuǎn)程滑翔制導(dǎo)炮彈的彈道規(guī)劃往往期望在有限制條件下實(shí)現(xiàn)最大射程,因此將連續(xù)問題離散化,建立目標(biāo)優(yōu)化函數(shù)。

    (3)

    式中:vf表示落速,vc為落速限制,tf表示終止時(shí)間。xa表示離散后一個(gè)步長(zhǎng)ts內(nèi)通過執(zhí)行a動(dòng)作得到的航程距離。

    針對(duì)滑翔段軌跡優(yōu)化問題,提出用深度強(qiáng)化學(xué)習(xí)方法訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),將非線性規(guī)劃問題離散化,轉(zhuǎn)化為序列決策問題。它根據(jù)此時(shí)的狀態(tài)和內(nèi)置深度神經(jīng)網(wǎng)絡(luò)可以在毫秒級(jí)快速輸出對(duì)應(yīng)的控制動(dòng)作,然后迭代狀態(tài)和控制指令得到一條最優(yōu)規(guī)劃曲線,避免了在飛行過程中求解復(fù)雜的非線性規(guī)劃問題,通過地面訓(xùn)練的方式減少了空間飛行過程中的計(jì)算量,規(guī)劃流程如圖1。

    圖1 基于神經(jīng)網(wǎng)絡(luò)的彈道規(guī)劃Fig.1 Trajectory planning based on neural network

    滑翔初始數(shù)據(jù)參數(shù)設(shè)定見表1。

    表1 滑翔初始參數(shù)設(shè)定Table 1 Initial glide parameter setting

    本文研究的是滑翔段無動(dòng)力滑翔,為保證飛行過程中的穩(wěn)定性,飛行過程中的控制量具有嚴(yán)格限制,設(shè)置攻角幅值的約束為α∈[0,12°],綜合考慮尋優(yōu)空間的大小與尋優(yōu)時(shí)間的長(zhǎng)短,將控制攻角離散化,控制攻角取值為0~12°之間的整數(shù)。

    2 基于強(qiáng)化學(xué)習(xí)方法的彈道規(guī)劃

    2.1 DQN方法

    DQN方法起源于Q-learning方法,采用一個(gè)價(jià)值表格記錄下每個(gè)狀態(tài)下的動(dòng)作,并且賦予每個(gè)動(dòng)作相應(yīng)的值,以表明此狀態(tài)下各動(dòng)作的優(yōu)劣。但隨著狀態(tài)空間和動(dòng)作空間的變大,整個(gè)價(jià)值表格的容量空間也會(huì)隨之變大,如果狀態(tài)空間是連續(xù)的,則無法使用Q-learning方法。因此,Q-learning方法可以解決離散狀態(tài)空間問題,而無法解決連續(xù)狀態(tài)空間問題。面對(duì)此類連續(xù)空間問題,DQN采用一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)代替價(jià)值表格,即動(dòng)作價(jià)值網(wǎng)絡(luò)Q(st,at,μi),輸入當(dāng)前的狀態(tài)和動(dòng)作即可得到相應(yīng)的動(dòng)作價(jià)值Q值,解決了連續(xù)空間狀態(tài)維度爆炸的問題。

    為了使訓(xùn)練過程更加穩(wěn)定,DQN算法采用了相同神經(jīng)元個(gè)數(shù)和參數(shù)配置的雙網(wǎng)絡(luò)結(jié)構(gòu),分別是當(dāng)前評(píng)估價(jià)值網(wǎng)絡(luò)μ和目標(biāo)價(jià)值網(wǎng)絡(luò)ω。在每次訓(xùn)練開始前,在給定的參數(shù)范圍內(nèi)初始化狀態(tài)參數(shù);在訓(xùn)練過程中,動(dòng)作的選擇遵循貪心策略,即在開始訓(xùn)練的一段時(shí)間內(nèi),網(wǎng)絡(luò)模型會(huì)在動(dòng)作空間內(nèi)隨機(jī)選擇動(dòng)作,但隨著訓(xùn)練的不斷推進(jìn),一段時(shí)間后會(huì)逐步根據(jù)當(dāng)前的動(dòng)作價(jià)值網(wǎng)絡(luò)的最大值選擇最優(yōu)動(dòng)作。

    根據(jù)當(dāng)前狀態(tài)和動(dòng)作輸出下一階段的狀態(tài)參數(shù),輸入當(dāng)前經(jīng)驗(yàn)樣本et=(statrtst+1)到記憶經(jīng)驗(yàn)池容積De=(e1e2…et)當(dāng)中,記憶經(jīng)驗(yàn)池方法有效打破了樣本之間的關(guān)聯(lián)關(guān)系,提高了數(shù)據(jù)利用率,每一次在固定時(shí)間步長(zhǎng)之后從經(jīng)驗(yàn)池容積當(dāng)中提取小批量樣本重新計(jì)算其動(dòng)作價(jià)值,DQN算法誤差更新如下式[18]:

    (4)

    2.2 IM-DQN算法

    傳統(tǒng)DQN方法在前期訓(xùn)練的時(shí)候,參數(shù)通過經(jīng)驗(yàn)池樣本中隨機(jī)抽取一批樣本進(jìn)行更新,里面包含的低性能數(shù)據(jù)樣本,不利于網(wǎng)絡(luò)模型的最優(yōu)解。本文提出IM-DQN算法,在傳統(tǒng)DQN的原先經(jīng)驗(yàn)池方法[19]基礎(chǔ)上添加優(yōu)秀經(jīng)驗(yàn)保存,在更替網(wǎng)絡(luò)方面添加了限制探索率的策略模式,具體實(shí)現(xiàn)過程如下:

    ①優(yōu)秀經(jīng)驗(yàn)保存會(huì)剔除表現(xiàn)低效的整個(gè)回合樣本點(diǎn),只保留優(yōu)秀回合樣本,網(wǎng)絡(luò)模型在隨機(jī)抽取樣本的時(shí)候不再?gòu)牡托Щ睾蠘颖局袑W(xué)習(xí)經(jīng)驗(yàn)。

    ②傳統(tǒng)DQN方法在每固定回合后,無條件將目標(biāo)價(jià)值網(wǎng)絡(luò)參數(shù)替換為評(píng)估價(jià)值網(wǎng)絡(luò)參數(shù)。限制探索率方法與之相比增加了一個(gè)限制探索率,如果多次訓(xùn)練出來的評(píng)估價(jià)值網(wǎng)絡(luò)的一個(gè)回合獎(jiǎng)勵(lì)值低于目標(biāo)價(jià)值網(wǎng)絡(luò)的一個(gè)回合獎(jiǎng)勵(lì)值乘以限制探索率的值,則這次更新停止反而將評(píng)估價(jià)值網(wǎng)絡(luò)重新替換為目標(biāo)價(jià)值網(wǎng)絡(luò),否定了網(wǎng)絡(luò)模型這一輪回合的探索工作。IM-DQN算法流程[20]如圖2所示。

    圖2 IM-DQN算法流程框圖Fig.2 Flowchart of Improved DQN algorithm

    2.3 基于IM-DQN算法的彈道規(guī)劃

    本文將IM-DQN算法思想移入到彈道規(guī)劃當(dāng)中。算法采用了3步式的設(shè)計(jì)思路:狀態(tài)空間設(shè)計(jì)、狀態(tài)轉(zhuǎn)移方式設(shè)計(jì)以及獎(jiǎng)勵(lì)值函數(shù)設(shè)計(jì)。

    狀態(tài)空間設(shè)計(jì):針對(duì)滑翔段飛行場(chǎng)景,滑翔制導(dǎo)炮彈滑翔橫向距離x、當(dāng)前高度y、飛行速度v、彈道傾角θ及動(dòng)作值作為狀態(tài)空間,定義為S=(xyvθα)。

    狀態(tài)轉(zhuǎn)移方式設(shè)計(jì):在IM-DQN算法當(dāng)中,確定當(dāng)前狀態(tài)參數(shù)之后,動(dòng)作價(jià)值網(wǎng)絡(luò)本身就是策略網(wǎng)絡(luò),在有限的動(dòng)作空間內(nèi)選取最大動(dòng)作,相當(dāng)于一個(gè)非線性函數(shù)映射當(dāng)前狀態(tài)下最佳動(dòng)作。確定了當(dāng)前狀態(tài)、動(dòng)作選取以及運(yùn)動(dòng)學(xué)模型,再通過數(shù)值方法求解相關(guān)非線性方程確定下一狀態(tài)參數(shù)。

    獎(jiǎng)勵(lì)值函數(shù)設(shè)計(jì):為提高樣本效率和完成約束限制條件,本文采取連續(xù)獎(jiǎng)勵(lì)項(xiàng)和懲罰項(xiàng)相結(jié)合的獎(jiǎng)勵(lì)函數(shù)設(shè)置,設(shè)計(jì)如下式所示:

    r(s)=rx+rp

    (5)

    式中:rx為每一步的航程獎(jiǎng)勵(lì)函數(shù),只與當(dāng)前點(diǎn)到初始點(diǎn)的距離有關(guān)。rp為約束懲罰項(xiàng)。綜合以上兩點(diǎn),現(xiàn)對(duì)獎(jiǎng)勵(lì)函數(shù)具體設(shè)計(jì)如下式:

    (6)

    (7)

    設(shè)置rx的目的是壓縮每一步的獎(jiǎng)勵(lì),促使著滑翔制導(dǎo)炮彈朝著更遠(yuǎn)的方向飛行。設(shè)置rp的作用是在炮彈落速低于約束限制之后給予一個(gè)懲罰措施。需要注意的是,相比于最優(yōu)控制求解過程的強(qiáng)制約束,DQN的約束往往呈現(xiàn)的是一種弱約束限制,它只是促使著彈道規(guī)劃落速朝著限制點(diǎn)運(yùn)動(dòng),結(jié)果不一定嚴(yán)格滿足約束,而是在約束附近搖擺不定。

    IM-DQN在訓(xùn)練過程中的步驟如下:

    ①初始化記憶經(jīng)驗(yàn)池De,設(shè)置神經(jīng)網(wǎng)絡(luò)的超參數(shù),初始化評(píng)估價(jià)值網(wǎng)絡(luò)μ和目標(biāo)價(jià)值網(wǎng)絡(luò)ω。

    ②外循環(huán):初始滑翔制導(dǎo)炮彈的滑翔起點(diǎn)狀態(tài)參數(shù)s0,然后進(jìn)入到內(nèi)循環(huán)當(dāng)中。

    ③內(nèi)循環(huán):內(nèi)循環(huán)是一個(gè)訓(xùn)練回合里面的工作循環(huán)。首先在每一步由貪心策略選取動(dòng)作a,執(zhí)行動(dòng)作a即可得到下一狀態(tài)st+1,采用優(yōu)秀經(jīng)驗(yàn)保存機(jī)制存放(starst+1)到經(jīng)驗(yàn)池De當(dāng)中;在隔了N個(gè)步長(zhǎng)后將經(jīng)驗(yàn)池De中隨機(jī)采樣一批樣本(si,a,r,si+1)進(jìn)行價(jià)值判定,當(dāng)提取的樣本滿足終止條件時(shí):yj=rj,而在其它情況下,其價(jià)值均為:yj=rj+γmaxa′Q(st+1,a′,ω),再進(jìn)行梯度計(jì)算loss=[yj-Q(st,at,μt)]2,以此更新評(píng)估網(wǎng)絡(luò)μ。傳統(tǒng)DQN算法是在一定步數(shù)后無條件更換目標(biāo)價(jià)值網(wǎng)絡(luò),而IM-DQN算法會(huì)根據(jù)限制探索率進(jìn)行更新,若滿足更新限制率,則ω=μ,反之則μ=ω。

    3 仿真實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析

    3.1 實(shí)驗(yàn)仿真流程及參數(shù)設(shè)置

    本文以滑翔制導(dǎo)炮彈為研究對(duì)象開展彈道規(guī)劃,為了更大程度模擬真實(shí)作戰(zhàn)情況以及探索更多狀態(tài)空間,訓(xùn)練過程中在表1的滑翔參數(shù)基礎(chǔ)上添加隨機(jī)擾動(dòng):滑翔初始高度為57.5~58.5 km,初始速度為1 250~1 300 m/s,初始彈道傾角為-3°~0°。網(wǎng)絡(luò)學(xué)習(xí)率設(shè)置為η=0.01,折扣因子γ=0.99,經(jīng)驗(yàn)池容量ND=20 000,采樣規(guī)模ba=64,訓(xùn)練時(shí)間步長(zhǎng)設(shè)置為5 s。仿真實(shí)驗(yàn)全部網(wǎng)絡(luò)采用同一種結(jié)構(gòu),設(shè)置兩個(gè)隱藏層,每層64個(gè)神經(jīng)元,中間全部采用tanh激活函數(shù)進(jìn)行連接。具體網(wǎng)絡(luò)結(jié)構(gòu)及激活函數(shù)設(shè)置設(shè)計(jì)見表2。為更直觀的顯示規(guī)劃算法性能表現(xiàn),設(shè)置參照組最大升阻比方法、GPM方法與強(qiáng)化學(xué)習(xí)算法進(jìn)行橫向性能比較。

    表2 網(wǎng)絡(luò)結(jié)構(gòu)Table 2 Network structure

    考慮到最大升阻比方法無法對(duì)落速進(jìn)行約束,本文設(shè)計(jì)了兩種實(shí)驗(yàn),最大升阻比方法、DQN方法、IM-DQN方法3種實(shí)驗(yàn)在無落速約束條件下進(jìn)行仿真對(duì)比;GPM、IM-DQN方法2種實(shí)驗(yàn)在有約束條件下進(jìn)行仿真對(duì)比。

    3.2 無落速約束仿真

    無落速仿真實(shí)驗(yàn)選擇rx作為獎(jiǎng)勵(lì)函數(shù),不再考慮懲罰約束項(xiàng)。為更方便觀察獎(jiǎng)勵(lì)值的變化趨勢(shì),本文設(shè)計(jì)每100個(gè)值取一次平均值作為平均獎(jiǎng)勵(lì)值點(diǎn)。分別設(shè)計(jì)DQN和IM-DQN算法在10 000、30 000和50 000這三組不同訓(xùn)練回合下的對(duì)比實(shí)驗(yàn),為盡可能減少訓(xùn)練過程的偶然性對(duì)實(shí)驗(yàn)的影響,每種回合分別訓(xùn)練10次取其中最優(yōu)網(wǎng)絡(luò)參數(shù)。兩種方法的具體獎(jiǎng)勵(lì)趨勢(shì)如圖3和圖4所示。

    圖3 無約束下的DQN算法獎(jiǎng)勵(lì)趨勢(shì)圖Fig.3 Unconstrained DQN algorithm reward trend graph

    圖4 無約束下的IM-DQN算法獎(jiǎng)勵(lì)趨勢(shì)圖Fig.4 Unconstrained IM-DQN algorithm reward trend graph

    從上面獎(jiǎng)勵(lì)趨勢(shì)圖可以得出,傳統(tǒng)DQN算法的訓(xùn)練過程呈現(xiàn)出一種強(qiáng)隨機(jī)性,它的最終序列動(dòng)作很難尋求到航程最優(yōu)值。反觀IM-DQN方法,在不同回合下它們的獎(jiǎng)勵(lì)值全部呈現(xiàn)一個(gè)逐步上升的趨勢(shì)。表3為兩種方法的最終訓(xùn)練結(jié)果。

    表3 無約束下兩種算法的最優(yōu)訓(xùn)練結(jié)果Table 3 The optimal training results of the two algorithms without constraints

    根據(jù)對(duì)比結(jié)果看出IM-DQN方法訓(xùn)練結(jié)果更加穩(wěn)定。兩種算法皆在30 000訓(xùn)練回合數(shù)達(dá)到航程最大值,故選取30 000回合數(shù)作為最終訓(xùn)練回合數(shù)。本小節(jié)對(duì)比了IM-DQN方法、DQN方法和最大升阻比方法,3種算法的性能表現(xiàn)如圖5所示。

    圖5 3種算法下的性能效果Fig.5 Performance effects of the three algorithms

    對(duì)比圖5的仿真結(jié)果可以得出,IM-DQN方法相較于DQN方法和最大升阻比方法的射程都有所提升,其中相較于DQN方法和最大升阻比方法分別提升了9.8 km和19.5 km,說明IM-DQN方法在無約束條件下具有較好的優(yōu)化性能。飛行過程中該方法對(duì)應(yīng)的速度曲線相較于其它兩種方法更加平滑。3種方法的具體性能如表4所示。

    表4 無約束下的三種方法性能比較Table 4 Performance comparison of three methods without constraints

    3.3 有落速約束仿真

    有落速約束下的獎(jiǎng)勵(lì)函數(shù)選用公式(5),完整考慮連續(xù)獎(jiǎng)勵(lì)項(xiàng)和約束懲罰項(xiàng)。在有落速約束下選取合適的訓(xùn)練回合次數(shù),同樣設(shè)置10 000、30 000和50 000共3組不同訓(xùn)練回合,每組重復(fù)訓(xùn)練10次,各選其中性能表現(xiàn)最好的一組作為實(shí)驗(yàn)參照組。為觀察獎(jiǎng)勵(lì)值點(diǎn)的位置情況,3種訓(xùn)練回合下皆以等差的形式取400個(gè)點(diǎn)作為觀察對(duì)象。獎(jiǎng)勵(lì)值點(diǎn)及其相關(guān)表現(xiàn)如圖6和圖7所示。

    圖6 有約束下的DQN算法獎(jiǎng)勵(lì)值點(diǎn)圖Fig.6 Constrained DQN algorithm rewards value point plot

    圖7 有約束下的IM-DQN算法獎(jiǎng)勵(lì)值點(diǎn)圖Fig.7 Constrained IM-DQN algorithm rewards value point plot

    由圖6和圖7可以得出,兩種方法的獎(jiǎng)勵(lì)值點(diǎn)在不同訓(xùn)練回合的末端皆落于零值以上,說明兩種訓(xùn)練方法都可以良好的滿足落速約束限制。但從性能表現(xiàn)來看,IM-DQN方法訓(xùn)練結(jié)果的獎(jiǎng)勵(lì)值點(diǎn)最后在150附近起伏,而DQN方法的3種訓(xùn)練回合的結(jié)果獎(jiǎng)勵(lì)值僅有15,在圖6中基本與右零刻度線重合,說明了航程性能上的差異。兩種方法的具體性能如表5所示。

    表5 有約束下兩種算法的最優(yōu)訓(xùn)練結(jié)果Table 5 Optimal training results of two algorithms under constraints

    根據(jù)上述仿真實(shí)驗(yàn)結(jié)果可知,在有限次數(shù)訓(xùn)練下,傳統(tǒng)DQN方法的性能效果完全無法跟相同訓(xùn)練回合下的IM-DQN方法相比。在有約束條件下,DQN方法難以尋求到最優(yōu)動(dòng)作價(jià)值網(wǎng)絡(luò),它僅僅滿足了約束限制,但不能在有約束下尋求最優(yōu)。從不同訓(xùn)練回合可以看出DQN方法隨著訓(xùn)練回合數(shù)增加,網(wǎng)絡(luò)性能逐漸發(fā)生變化,這種情況說明要想通過DQN方法完全體現(xiàn)出其最優(yōu)性能網(wǎng)絡(luò)可能還需要更多的訓(xùn)練回合數(shù),這同時(shí)也延長(zhǎng)了前期訓(xùn)練的準(zhǔn)備時(shí)間,不利于實(shí)際作戰(zhàn)的應(yīng)用。從圖7及表5可以得出,不同于于無約束情況下,當(dāng)問題復(fù)雜之后,隨著訓(xùn)練回合的增多,網(wǎng)絡(luò)所呈現(xiàn)的效果也就越好,綜合考慮下選取50 000訓(xùn)練回合數(shù)的神經(jīng)網(wǎng)絡(luò)作為有約束下的動(dòng)作價(jià)值網(wǎng)絡(luò)。為觀察IM-DQN具體性能表現(xiàn)情況,本小節(jié)設(shè)計(jì)基于最優(yōu)控制理論的高斯偽譜法作為仿真對(duì)比參照組,通過GPOPS工具箱可以得到最優(yōu)控制規(guī)劃曲線。IM-DQN方法與GPM的具體性能效果對(duì)比仿真如圖8所示。

    圖8 兩種算法下的性能對(duì)比效果Fig.8 Performance comparison between the two algorithms

    圖8和表6是IM-DQN和GPM算法的性能結(jié)果對(duì)比,由圖可以得出IM-DQN方法規(guī)劃曲線與GPM十分相似,甚至結(jié)果值還略高于GPM,這也展示了強(qiáng)化學(xué)習(xí)在與環(huán)境交互過程中的優(yōu)越性能,它擁有著在約束條件下尋求最優(yōu)性能網(wǎng)絡(luò)參數(shù)的能力。強(qiáng)化學(xué)習(xí)之所以可以在有約束條件下尋求到了最優(yōu)性航程網(wǎng)絡(luò)參數(shù),是因?yàn)樯疃葟?qiáng)化學(xué)習(xí)在探索過程中帶有記憶性,并且賦予這種記憶價(jià)值,這種價(jià)值不同于深度學(xué)習(xí)限制于數(shù)據(jù)樣本自身的局限性,強(qiáng)化學(xué)習(xí)的記憶基于與環(huán)境的交互過程,在環(huán)境交互中評(píng)定動(dòng)作的優(yōu)劣程度,使得深度強(qiáng)化學(xué)習(xí)可以突破單純深度學(xué)習(xí)的局部樣本最優(yōu)解。但在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中有許多因素會(huì)導(dǎo)致網(wǎng)絡(luò)性能崩塌,本文IM-DQN方法添加了低效經(jīng)驗(yàn)池剔除和探索限制率的組合策略,使得網(wǎng)絡(luò)的魯棒性更高,不容易在訓(xùn)練過程中發(fā)生崩塌。隨著學(xué)習(xí)過程的逐漸增加,網(wǎng)絡(luò)也積累著更多的知識(shí)從而做出更優(yōu)的指令。

    表6 有約束下的兩種方法性能比較Table 6 Performance comparison of two methods under constraints

    4 結(jié)論

    本文利用強(qiáng)化學(xué)習(xí)與環(huán)境交互的特點(diǎn),提出了一種基于IM-DQN的滑翔制導(dǎo)炮彈彈道規(guī)劃方法,在傳統(tǒng)DQN算法的基礎(chǔ)上,利用低效經(jīng)驗(yàn)池剔除加限制探索率策略,有效解決了傳統(tǒng)DQN學(xué)習(xí)效率低,獎(jiǎng)勵(lì)曲線方向不明確的問題。仿真結(jié)果證明,IM-DQN方法很好地解決了傳統(tǒng)強(qiáng)化學(xué)習(xí)方法在尋求最優(yōu)控制過程中網(wǎng)絡(luò)崩塌現(xiàn)象無法尋求到最優(yōu)解的問題,為智能彈道規(guī)劃提供一種新的選擇。

    猜你喜歡
    滑翔彈道約束
    蘭花螳螂會(huì)滑翔
    彈道——打勝仗的奧秘
    攻天掠地的先鋒武器——滑翔導(dǎo)彈
    “碳中和”約束下的路徑選擇
    約束離散KP方程族的完全Virasoro對(duì)稱
    一維彈道修正彈無線通信系統(tǒng)研制
    電子制作(2019年7期)2019-04-25 13:17:48
    讓你心跳加速的“滑翔飛板”
    基于PID控制的二維彈道修正彈仿真
    空中滑翔大比拼(下)——滑翔傘
    消除彈道跟蹤數(shù)據(jù)中伺服系統(tǒng)的振顫干擾
    欧美精品一区二区大全| 精品久久久久久电影网| 日韩,欧美,国产一区二区三区| 成人手机av| 精品亚洲成国产av| 国产深夜福利视频在线观看| 免费看av在线观看网站| 九色亚洲精品在线播放| 国语对白做爰xxxⅹ性视频网站| av在线播放精品| 黄色怎么调成土黄色| 亚洲精品国产色婷婷电影| 国产片内射在线| 成人三级做爰电影| 最近最新中文字幕免费大全7| 中文精品一卡2卡3卡4更新| 日韩伦理黄色片| 菩萨蛮人人尽说江南好唐韦庄| 国产 一区精品| 别揉我奶头~嗯~啊~动态视频 | 2018国产大陆天天弄谢| 久久久久精品国产欧美久久久 | 国产av一区二区精品久久| 高清视频免费观看一区二区| 久久精品国产亚洲av涩爱| 国产av精品麻豆| 美女大奶头黄色视频| 观看av在线不卡| 各种免费的搞黄视频| 激情五月婷婷亚洲| 我要看黄色一级片免费的| 中文乱码字字幕精品一区二区三区| 中文字幕制服av| 深夜精品福利| 免费高清在线观看视频在线观看| 午夜免费鲁丝| 在线亚洲精品国产二区图片欧美| 日韩熟女老妇一区二区性免费视频| 日本色播在线视频| 亚洲精品久久午夜乱码| 国产爽快片一区二区三区| 国产在线视频一区二区| 国产精品秋霞免费鲁丝片| 卡戴珊不雅视频在线播放| 晚上一个人看的免费电影| 久久av网站| 视频在线观看一区二区三区| 伦理电影免费视频| 日韩一区二区三区影片| 熟女av电影| 一区二区三区精品91| 国产视频首页在线观看| 天堂俺去俺来也www色官网| 成人午夜精彩视频在线观看| 国产精品国产三级专区第一集| 欧美另类一区| 性色av一级| 久久亚洲国产成人精品v| 日韩大码丰满熟妇| 亚洲欧洲精品一区二区精品久久久 | 嫩草影院入口| tube8黄色片| 免费女性裸体啪啪无遮挡网站| 18禁裸乳无遮挡动漫免费视频| 欧美日韩国产mv在线观看视频| 日日啪夜夜爽| 人成视频在线观看免费观看| 精品第一国产精品| 欧美 日韩 精品 国产| 99国产精品免费福利视频| 日韩一本色道免费dvd| 国产精品 欧美亚洲| 国产 精品1| 在线观看免费视频网站a站| 国产福利在线免费观看视频| 久久久久精品国产欧美久久久 | 久久久久人妻精品一区果冻| 美女视频免费永久观看网站| 免费高清在线观看日韩| 国产精品人妻久久久影院| 一本大道久久a久久精品| 无遮挡黄片免费观看| 精品少妇黑人巨大在线播放| 精品人妻熟女毛片av久久网站| av在线播放精品| 中文字幕高清在线视频| av在线播放精品| 亚洲国产最新在线播放| 国产精品熟女久久久久浪| 久久人人爽人人片av| 亚洲美女搞黄在线观看| 免费黄频网站在线观看国产| 99国产精品免费福利视频| 国产成人午夜福利电影在线观看| 久久ye,这里只有精品| 黑人猛操日本美女一级片| 最近中文字幕高清免费大全6| 久久国产亚洲av麻豆专区| 国产老妇伦熟女老妇高清| 久久久久久人人人人人| 一区二区日韩欧美中文字幕| 19禁男女啪啪无遮挡网站| 满18在线观看网站| 18在线观看网站| 久久久精品国产亚洲av高清涩受| 青青草视频在线视频观看| 热99国产精品久久久久久7| 亚洲成人一二三区av| 久久久久久久国产电影| 久久精品国产a三级三级三级| 亚洲精品第二区| 成年av动漫网址| 在线精品无人区一区二区三| 狠狠婷婷综合久久久久久88av| 国产麻豆69| 校园人妻丝袜中文字幕| 2021少妇久久久久久久久久久| 国产乱人偷精品视频| 看免费成人av毛片| 国产精品一国产av| 大片电影免费在线观看免费| 美国免费a级毛片| 国产黄色视频一区二区在线观看| 十八禁高潮呻吟视频| 午夜福利,免费看| 日韩一本色道免费dvd| 女人精品久久久久毛片| 日日摸夜夜添夜夜爱| 九色亚洲精品在线播放| 日本欧美视频一区| 精品酒店卫生间| av在线观看视频网站免费| 日韩中文字幕视频在线看片| 国产1区2区3区精品| 久久久精品区二区三区| h视频一区二区三区| 久久鲁丝午夜福利片| 国产黄色免费在线视频| 日本猛色少妇xxxxx猛交久久| 亚洲欧美清纯卡通| 亚洲少妇的诱惑av| 亚洲久久久国产精品| 亚洲av中文av极速乱| 午夜免费鲁丝| av在线app专区| 国产女主播在线喷水免费视频网站| 欧美少妇被猛烈插入视频| 免费看av在线观看网站| 亚洲欧美精品自产自拍| 国产人伦9x9x在线观看| 亚洲色图综合在线观看| 亚洲成人一二三区av| 欧美在线黄色| av.在线天堂| 欧美日韩一级在线毛片| 国产精品亚洲av一区麻豆 | 三上悠亚av全集在线观看| 1024香蕉在线观看| 永久免费av网站大全| 日本vs欧美在线观看视频| 天美传媒精品一区二区| 国产黄色视频一区二区在线观看| 日本91视频免费播放| 久久久久精品人妻al黑| 免费人妻精品一区二区三区视频| 国产精品免费大片| 久久精品亚洲熟妇少妇任你| 亚洲国产精品国产精品| 国产精品久久久人人做人人爽| 欧美日韩视频精品一区| 超碰成人久久| 精品人妻熟女毛片av久久网站| 99热网站在线观看| 少妇人妻精品综合一区二区| 久久女婷五月综合色啪小说| 成人漫画全彩无遮挡| 丝瓜视频免费看黄片| 亚洲七黄色美女视频| 国产精品三级大全| 亚洲精品一区蜜桃| 欧美日韩成人在线一区二区| 99九九在线精品视频| h视频一区二区三区| 亚洲天堂av无毛| 国产在视频线精品| 亚洲成av片中文字幕在线观看| 亚洲av男天堂| 另类精品久久| 天天操日日干夜夜撸| 两个人看的免费小视频| 青春草视频在线免费观看| 欧美日韩视频精品一区| 在现免费观看毛片| 久久女婷五月综合色啪小说| 青青草视频在线视频观看| 国产亚洲精品第一综合不卡| 在线观看免费日韩欧美大片| 久久精品国产综合久久久| 国产精品国产av在线观看| 一区二区av电影网| 国产精品一二三区在线看| 夫妻性生交免费视频一级片| 亚洲av电影在线观看一区二区三区| 人人妻,人人澡人人爽秒播 | 日韩精品有码人妻一区| 亚洲欧美激情在线| 久久99一区二区三区| 日韩成人av中文字幕在线观看| 精品亚洲成国产av| 在线观看免费午夜福利视频| 一级黄片播放器| 免费高清在线观看日韩| 午夜免费鲁丝| 国产午夜精品一二区理论片| 各种免费的搞黄视频| 另类精品久久| 1024视频免费在线观看| 国产精品嫩草影院av在线观看| 蜜桃在线观看..| 久久这里只有精品19| 国产精品免费视频内射| 免费观看av网站的网址| 亚洲成人手机| 精品少妇黑人巨大在线播放| 国产亚洲最大av| 99久久人妻综合| 亚洲精品日韩在线中文字幕| 国产精品熟女久久久久浪| 国产一区二区三区综合在线观看| av一本久久久久| 黑人巨大精品欧美一区二区蜜桃| 午夜av观看不卡| 在现免费观看毛片| 午夜福利免费观看在线| 免费观看性生交大片5| 国产又爽黄色视频| 亚洲一卡2卡3卡4卡5卡精品中文| 在线免费观看不下载黄p国产| 最近中文字幕2019免费版| 国产片内射在线| 涩涩av久久男人的天堂| 国产 一区精品| 久久久久网色| av有码第一页| 日本av手机在线免费观看| 国产日韩欧美亚洲二区| 制服诱惑二区| 久久人人爽人人片av| av.在线天堂| 亚洲 欧美一区二区三区| 日韩视频在线欧美| 菩萨蛮人人尽说江南好唐韦庄| 国产乱来视频区| 久久人妻熟女aⅴ| 啦啦啦在线免费观看视频4| 欧美变态另类bdsm刘玥| 一边亲一边摸免费视频| 99久久人妻综合| 汤姆久久久久久久影院中文字幕| 一区二区三区乱码不卡18| 亚洲久久久国产精品| 又粗又硬又长又爽又黄的视频| 狠狠精品人妻久久久久久综合| 久久免费观看电影| 曰老女人黄片| 精品国产一区二区三区久久久樱花| 日韩一本色道免费dvd| 伦理电影免费视频| 日韩一区二区视频免费看| 午夜老司机福利片| 国产日韩欧美视频二区| 成人毛片60女人毛片免费| 美女福利国产在线| 不卡视频在线观看欧美| 国产一区二区 视频在线| 国产免费又黄又爽又色| 日本一区二区免费在线视频| 日韩中文字幕欧美一区二区 | 一本—道久久a久久精品蜜桃钙片| 亚洲精品国产区一区二| 亚洲国产欧美一区二区综合| 一本大道久久a久久精品| 亚洲,欧美,日韩| 久久国产亚洲av麻豆专区| 91成人精品电影| 91精品三级在线观看| 欧美日韩一级在线毛片| 王馨瑶露胸无遮挡在线观看| 一级黄片播放器| 亚洲第一青青草原| 色精品久久人妻99蜜桃| 国产精品免费大片| 狂野欧美激情性bbbbbb| 80岁老熟妇乱子伦牲交| 汤姆久久久久久久影院中文字幕| 精品一区二区三区av网在线观看 | 一二三四在线观看免费中文在| 国产毛片在线视频| 观看av在线不卡| 中文字幕高清在线视频| 亚洲成人免费av在线播放| 国产精品久久久久久人妻精品电影 | 久久久久精品久久久久真实原创| 日韩欧美精品免费久久| 日韩精品免费视频一区二区三区| 久久99精品国语久久久| 美女福利国产在线| 在线观看免费视频网站a站| 美女主播在线视频| 色婷婷久久久亚洲欧美| 久久久欧美国产精品| 中文欧美无线码| 精品卡一卡二卡四卡免费| 巨乳人妻的诱惑在线观看| 欧美亚洲 丝袜 人妻 在线| 国精品久久久久久国模美| 久久国产精品男人的天堂亚洲| 大香蕉久久成人网| 男男h啪啪无遮挡| 国产精品麻豆人妻色哟哟久久| 色精品久久人妻99蜜桃| 国产99久久九九免费精品| 亚洲国产毛片av蜜桃av| 这个男人来自地球电影免费观看 | 亚洲成人国产一区在线观看 | 日本猛色少妇xxxxx猛交久久| 免费看av在线观看网站| 欧美最新免费一区二区三区| 精品人妻熟女毛片av久久网站| 99精国产麻豆久久婷婷| www.精华液| 婷婷成人精品国产| 欧美最新免费一区二区三区| 久久久国产一区二区| 蜜桃国产av成人99| 男女床上黄色一级片免费看| 熟妇人妻不卡中文字幕| 午夜免费男女啪啪视频观看| 免费观看a级毛片全部| 国产精品三级大全| 久久久久久久国产电影| 久久人妻熟女aⅴ| 可以免费在线观看a视频的电影网站 | 精品一区二区三区av网在线观看 | 91老司机精品| 国产精品久久久久久精品古装| 国产成人一区二区在线| 久久久亚洲精品成人影院| 制服人妻中文乱码| 伊人久久大香线蕉亚洲五| 国产男女超爽视频在线观看| 色综合欧美亚洲国产小说| 欧美日韩亚洲高清精品| 男女边摸边吃奶| 观看美女的网站| 飞空精品影院首页| 香蕉丝袜av| 成人漫画全彩无遮挡| av线在线观看网站| 一级,二级,三级黄色视频| 美女福利国产在线| 80岁老熟妇乱子伦牲交| 国产熟女午夜一区二区三区| 午夜91福利影院| 一个人免费看片子| 国产黄频视频在线观看| 国产在视频线精品| 成年动漫av网址| 免费在线观看黄色视频的| 国产老妇伦熟女老妇高清| 欧美日本中文国产一区发布| 大码成人一级视频| 婷婷色av中文字幕| 精品国产一区二区三区久久久樱花| 制服人妻中文乱码| av在线老鸭窝| 欧美日韩视频精品一区| 国产片特级美女逼逼视频| av有码第一页| 黑人猛操日本美女一级片| 99久久人妻综合| 免费高清在线观看视频在线观看| 9191精品国产免费久久| 免费在线观看完整版高清| 亚洲国产av新网站| 国产在线一区二区三区精| 国产麻豆69| 涩涩av久久男人的天堂| 一级片'在线观看视频| 在线观看免费视频网站a站| 免费av中文字幕在线| 热99久久久久精品小说推荐| 黑人欧美特级aaaaaa片| 国产欧美亚洲国产| netflix在线观看网站| 老司机影院毛片| netflix在线观看网站| 日韩熟女老妇一区二区性免费视频| 夫妻午夜视频| 97在线人人人人妻| 波多野结衣一区麻豆| 亚洲精品日本国产第一区| 五月开心婷婷网| 黄片播放在线免费| 国产免费又黄又爽又色| 精品一区二区三区四区五区乱码 | 一边亲一边摸免费视频| 九九爱精品视频在线观看| 视频在线观看一区二区三区| 婷婷色综合www| 亚洲国产日韩一区二区| av又黄又爽大尺度在线免费看| 三上悠亚av全集在线观看| 视频在线观看一区二区三区| 欧美 亚洲 国产 日韩一| 女性生殖器流出的白浆| 国产日韩一区二区三区精品不卡| 免费少妇av软件| 极品人妻少妇av视频| 婷婷成人精品国产| 男女边摸边吃奶| 欧美国产精品va在线观看不卡| 国产精品.久久久| 久久午夜综合久久蜜桃| 日本欧美视频一区| 免费不卡黄色视频| 婷婷色av中文字幕| 久久天躁狠狠躁夜夜2o2o | www日本在线高清视频| 久久久国产精品麻豆| 国产亚洲最大av| 免费少妇av软件| 亚洲伊人久久精品综合| 18禁观看日本| 亚洲一卡2卡3卡4卡5卡精品中文| 国产亚洲av高清不卡| 国产成人精品久久二区二区91 | 日本欧美视频一区| 亚洲美女视频黄频| 久久人人爽人人片av| 国产成人精品久久久久久| 精品少妇内射三级| 日韩,欧美,国产一区二区三区| 中文字幕最新亚洲高清| 新久久久久国产一级毛片| 日本一区二区免费在线视频| 国产精品一二三区在线看| 久久鲁丝午夜福利片| 青春草亚洲视频在线观看| 成年动漫av网址| 成人国产麻豆网| 久久久久国产精品人妻一区二区| 亚洲第一区二区三区不卡| 午夜免费鲁丝| 熟女av电影| 国产男人的电影天堂91| 国产在线一区二区三区精| 一区二区三区精品91| 男人爽女人下面视频在线观看| 99国产综合亚洲精品| 国产成人a∨麻豆精品| 国产精品二区激情视频| 男女边吃奶边做爰视频| 国产成人系列免费观看| 操美女的视频在线观看| www.自偷自拍.com| 少妇被粗大猛烈的视频| 免费看av在线观看网站| 久久天躁狠狠躁夜夜2o2o | 国产精品国产三级国产专区5o| 母亲3免费完整高清在线观看| 老司机深夜福利视频在线观看 | 欧美亚洲日本最大视频资源| 国产精品久久久人人做人人爽| 成人影院久久| 国产一区二区激情短视频 | 午夜日韩欧美国产| 男的添女的下面高潮视频| 啦啦啦啦在线视频资源| 国产成人91sexporn| 日韩一区二区视频免费看| 人人妻人人添人人爽欧美一区卜| 黑丝袜美女国产一区| 老司机影院成人| 91国产中文字幕| 伊人久久国产一区二区| av一本久久久久| av有码第一页| 国产精品久久久久久精品电影小说| 亚洲美女黄色视频免费看| 极品少妇高潮喷水抽搐| 精品一区在线观看国产| 大香蕉久久网| 9热在线视频观看99| 午夜av观看不卡| 久久久国产欧美日韩av| 国产日韩一区二区三区精品不卡| 黑丝袜美女国产一区| 亚洲欧美精品综合一区二区三区| 亚洲一卡2卡3卡4卡5卡精品中文| 一级爰片在线观看| 午夜免费鲁丝| 亚洲欧美一区二区三区黑人| 国产亚洲一区二区精品| 成人国产av品久久久| 亚洲综合色网址| 亚洲视频免费观看视频| av国产久精品久网站免费入址| 国产精品久久久久久人妻精品电影 | 你懂的网址亚洲精品在线观看| 亚洲五月色婷婷综合| 看非洲黑人一级黄片| 搡老岳熟女国产| 精品一区二区三区av网在线观看 | 少妇猛男粗大的猛烈进出视频| 国产成人精品久久二区二区91 | 这个男人来自地球电影免费观看 | 欧美国产精品一级二级三级| 大香蕉久久网| 国产 精品1| 久久精品久久久久久噜噜老黄| 日韩电影二区| 国产成人免费无遮挡视频| 亚洲七黄色美女视频| 999精品在线视频| 日韩中文字幕视频在线看片| 91精品三级在线观看| 亚洲四区av| 亚洲熟女精品中文字幕| 美女午夜性视频免费| 日本av手机在线免费观看| 制服丝袜香蕉在线| 一边摸一边做爽爽视频免费| 街头女战士在线观看网站| 18禁动态无遮挡网站| 人人妻人人澡人人看| 涩涩av久久男人的天堂| 又粗又硬又长又爽又黄的视频| h视频一区二区三区| 黑人猛操日本美女一级片| 午夜免费男女啪啪视频观看| 成人影院久久| 深夜精品福利| 国产99久久九九免费精品| 女人久久www免费人成看片| 中文字幕高清在线视频| 免费高清在线观看日韩| 日韩免费高清中文字幕av| 免费女性裸体啪啪无遮挡网站| 99久国产av精品国产电影| 满18在线观看网站| 午夜激情av网站| av在线观看视频网站免费| 国产无遮挡羞羞视频在线观看| 香蕉国产在线看| 午夜精品国产一区二区电影| 观看av在线不卡| 国产爽快片一区二区三区| 色婷婷av一区二区三区视频| 免费少妇av软件| 男女国产视频网站| 中文字幕人妻丝袜一区二区 | 精品国产露脸久久av麻豆| 美国免费a级毛片| 天堂中文最新版在线下载| a级毛片黄视频| 麻豆av在线久日| 亚洲精品在线美女| 最黄视频免费看| av线在线观看网站| 日本vs欧美在线观看视频| 久久国产精品男人的天堂亚洲| 午夜久久久在线观看| 国产成人午夜福利电影在线观看| 精品第一国产精品| 欧美激情极品国产一区二区三区| 99久久综合免费| 中文字幕另类日韩欧美亚洲嫩草| 五月天丁香电影| 婷婷色麻豆天堂久久| 黄色 视频免费看| 久久久精品国产亚洲av高清涩受| av在线老鸭窝| 多毛熟女@视频| 中文字幕人妻丝袜一区二区 | 人人妻人人澡人人爽人人夜夜| 国语对白做爰xxxⅹ性视频网站| 亚洲七黄色美女视频| 麻豆乱淫一区二区| 欧美日韩福利视频一区二区| 青春草视频在线免费观看| 嫩草影院入口| 中文欧美无线码| 日韩精品免费视频一区二区三区| 亚洲国产欧美网| 婷婷色麻豆天堂久久| 韩国精品一区二区三区| 亚洲av福利一区| 熟女av电影| 亚洲成人手机| 交换朋友夫妻互换小说| 国产成人欧美| 99久久精品国产亚洲精品| 秋霞伦理黄片| 久久青草综合色| 欧美日韩一区二区视频在线观看视频在线| 日韩 亚洲 欧美在线| 国产熟女午夜一区二区三区| 免费黄频网站在线观看国产| 丰满乱子伦码专区| 赤兔流量卡办理| 一区二区三区四区激情视频| 国产高清不卡午夜福利| a级毛片黄视频| 国产 一区精品|