• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    再入滑翔飛行器俯沖段智能博弈機(jī)動策略

    2023-07-24 13:18:06蔣慶吉王小剛白瑜亮
    宇航學(xué)報(bào) 2023年6期
    關(guān)鍵詞:攔截器滑翔機(jī)動

    蔣慶吉,王小剛,白瑜亮,李 瑜

    (1. 哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱 150001;2. 北京空天技術(shù)研究所,北京 100074)

    0 引 言

    再入滑翔飛行器(Reentry glide vehicle,RGV)憑借其特殊的飛行速域和空域正成為當(dāng)前航空航天領(lǐng)域的研究熱點(diǎn)[1-4]。與此同時,以愛國者-3為代表的各類典型防空反導(dǎo)攔截系統(tǒng)正在升級換代以應(yīng)對高超聲速武器的威脅,應(yīng)對再入滑翔飛行器的攔截方法也在不斷更新[5-8]。高超聲速武器打擊的戰(zhàn)略價值目標(biāo)周圍通常布有嚴(yán)密的防空攔截系統(tǒng),如何在規(guī)避攔截器的前提下仍能精確命中既定目標(biāo)成為當(dāng)前亟待解決的問題。

    再入滑翔飛行器的機(jī)動策略一般包括程序式機(jī)動[9-10]、基于最優(yōu)控制理論等的解析機(jī)動[11-12]與彈道優(yōu)化[13]等方法。近年來,許多學(xué)者針對再入滑翔飛行器俯沖段的機(jī)動策略進(jìn)行了廣泛研究。Shen等[3]將考慮終端目標(biāo)的軌跡優(yōu)化問題依次轉(zhuǎn)化為非凸最優(yōu)控制問題和二階錐規(guī)劃問題,提出一種可變信賴域的連續(xù)二階錐優(yōu)化方法,在時間消耗和最優(yōu)性之間取得平衡。王洋等[11]通過制導(dǎo)誤差與法向機(jī)動速度構(gòu)造滑模面,提出了一種新型機(jī)動制導(dǎo)律,在保證導(dǎo)彈末段打擊精度的同時提高了機(jī)動能力。Sun等[12]基于微分博弈理論研究了包含攻擊者、目標(biāo)和防御者的最優(yōu)制導(dǎo)律。朱建文等[14]在俯沖平面及轉(zhuǎn)彎平面內(nèi)分別設(shè)計(jì)了正弦形式的視線角參考運(yùn)動,以落速最大為性能指標(biāo),利用最優(yōu)控制對其進(jìn)行跟蹤,機(jī)動突防最優(yōu)制導(dǎo)方法,能夠?qū)崿F(xiàn)機(jī)動飛行,且能夠高精度地滿足終端落角及落點(diǎn)約束。李靜琳等[15]針對再入滑翔飛行器再入末段機(jī)動與精確打擊問題,從最優(yōu)控制角度出發(fā),提出了一種考慮攔截彈動力學(xué)特性的最優(yōu)機(jī)動突防彈道優(yōu)化方法,獲得了再入滑翔飛行器的最大機(jī)動能力。再入滑翔飛行器在俯沖段面臨各種攔截器威脅從而無法精確命中目標(biāo),因此有必要開展俯沖段博弈機(jī)動研究以規(guī)避攔截并完成打擊任務(wù)。

    現(xiàn)有文獻(xiàn)通常假定攔截器模型已知,在特定場景條件下進(jìn)行突防制導(dǎo)律推導(dǎo),所得結(jié)果往往具有一定局限性。在實(shí)際博弈機(jī)動中面臨的問題有:1)攔截器發(fā)射窗口未知,再入滑翔飛行器完成對攔截器的機(jī)動之后不一定具備修正落點(diǎn)偏差至零的能力;2)由于探測設(shè)備約束,再入滑翔飛行器較難連續(xù)不間斷獲取攔截器信息,信息更新具有一定周期性;3)攔截器未建模動態(tài)和實(shí)際飛行差異帶來的不確定性問題:在解析方法中通常假設(shè)攔截器以固定導(dǎo)引系數(shù)對再入滑翔飛行器進(jìn)行攔截,然而在真實(shí)戰(zhàn)場環(huán)境下,往往難以獲取對方制導(dǎo)律參數(shù),這將使解析方法存在建模偏差,造成實(shí)際飛行的反攔截任務(wù)失敗;4)計(jì)算效率問題,作戰(zhàn)環(huán)境瞬息萬變,需要再入滑翔飛行器在較短時間內(nèi)即給出機(jī)動參數(shù),傳統(tǒng)優(yōu)化方法難以完成在線實(shí)時輸出最優(yōu)解。

    深度強(qiáng)化學(xué)習(xí)算法是近年來發(fā)展迅速的一類人工智能算法,其在處理序貫決策問題方面具備天然優(yōu)勢。深度強(qiáng)化學(xué)習(xí)算法在機(jī)械臂控制[16-17]、導(dǎo)彈攔截制導(dǎo)設(shè)計(jì)[18-19]、無人機(jī)航跡規(guī)劃[20-21]、航天器姿態(tài)控制[22]等領(lǐng)域得到廣泛應(yīng)用,對解決傳統(tǒng)優(yōu)化算法計(jì)算耗時長、局部收斂等問題上取得較好效果。深度強(qiáng)化學(xué)習(xí)算法將決策問題描述為馬爾科夫決策過程,智能體根據(jù)觀測到的環(huán)境狀態(tài)輸出決策動作,動作作用于環(huán)境模型產(chǎn)生獎勵和狀態(tài)更新[23]。其中,應(yīng)用于連續(xù)狀態(tài)空間、離散動作空間的經(jīng)典算法是深度Q學(xué)習(xí)(Deep Q-learning,DQN)算法[24],應(yīng)用于連續(xù)狀態(tài)空間、連續(xù)動作空間的是深度確定性策略梯度(Deep deterministic policy gradient,DDPG)算法[25-26]。為解決稀疏獎勵問題,Schaul等[27]基于DQN算法提出優(yōu)先經(jīng)驗(yàn)回放(Prioritized experie-nce replay,PER)方法。PER大大改善了樣本利用效率,在自動駕駛[28]、船舶避障[29]、無人機(jī)空投決策[30]等問題上取得較好效果。

    為借助深度神經(jīng)網(wǎng)絡(luò)解決復(fù)雜狀態(tài)空間序貫決策問題,將再入滑翔飛行器在俯沖段的機(jī)動飛行過程建模為馬爾科夫過程,對狀態(tài)、動作、獎勵等基本要素進(jìn)行適應(yīng)性設(shè)計(jì)。針對連續(xù)狀態(tài)空間和動作空間的特點(diǎn),選取DDPG算法對飛行器的智能機(jī)動參數(shù)進(jìn)行訓(xùn)練。由于再入滑翔飛行器在被攔截或命中目標(biāo)點(diǎn)之前缺乏獎勵信號,深度強(qiáng)化學(xué)習(xí)算法的訓(xùn)練面臨稀疏獎勵問題。在傳統(tǒng)DDPG算法的基礎(chǔ)上進(jìn)行多項(xiàng)改進(jìn),結(jié)合優(yōu)先經(jīng)驗(yàn)回放方法對時序差分絕對值較高的樣本經(jīng)驗(yàn)進(jìn)行優(yōu)先回放,對高價值樣本進(jìn)行多次利用,從而提高樣本利用效率,實(shí)現(xiàn)決策網(wǎng)絡(luò)的快速收斂。仿真表明,收斂后的機(jī)動決策網(wǎng)絡(luò)能夠輸出穩(wěn)定有效的機(jī)動參數(shù),在典型場景完成對攔截器規(guī)避后精確到達(dá)目標(biāo)點(diǎn),并且調(diào)用決策網(wǎng)絡(luò)時間較短,能滿足彈載計(jì)算機(jī)實(shí)時要求。

    1 再入滑翔飛行器俯沖段博弈機(jī)動仿真數(shù)學(xué)模型

    1.1 再入滑翔飛行器數(shù)學(xué)模型

    不考慮地球自轉(zhuǎn),再入滑翔飛行器在俯沖段的動力學(xué)方程如下:

    (1)

    式中:V為速度;D為阻力;m為質(zhì)量;g為引力加速度;γ為路徑角;L為升力;σ為傾側(cè)角;r為地心距離;ψ為航向角;θ為經(jīng)度;φ為地心緯度。在速度、高度確定的情況下,D,L的大小取決于當(dāng)前時刻攻角α。

    飛行器的剩余航程RL計(jì)算為

    RL=Rearccos(sinφsinφtar+cosθcosθtarcos(θ-θtar))

    (2)

    式中:θtar和φtar為目標(biāo)經(jīng)度和緯度;Re為地球半徑。

    1.2 攔截器數(shù)學(xué)模型

    在發(fā)射坐標(biāo)系(慣性系)和彈道坐標(biāo)系下,攔截飛行器運(yùn)動學(xué)與動力學(xué)方程如下:

    (3)

    式中:XI,YI,ZI為攔截器的位置在發(fā)射系下的直角坐標(biāo)分量;VI為速度大小;θI為彈道傾角;ψI為彈道偏角;ny,nz為彈道系下的過載分量。

    攔截器采用比例導(dǎo)引律對再入滑翔飛行器進(jìn)行攔截,制導(dǎo)律的形式為

    (4)

    在碰撞時刻,攔截器的零控脫靶量計(jì)算如下:

    (5)

    式中:Rrel,Vrel為相對位置和相對速度矢量。

    約束模型:考慮攔截器的單通道最大過載約束為NImax,實(shí)際過載應(yīng)滿足

    (6)

    式中:ny為彈道系下法向過載,nz為彈道系下橫向過載,滿足aI=[ny,nz]T;NImax取為20。

    1.3 博弈機(jī)動場景隨機(jī)模型

    首先對再入滑翔飛行器與攔截器的博弈機(jī)動飛行場景作如下假設(shè):

    1)再入滑翔飛行器航向角偏差為0,在不機(jī)動飛行且無攔截器時可在射面內(nèi)導(dǎo)引命中目標(biāo)點(diǎn);

    2)攔截器發(fā)射位置分布在再入滑翔飛行器目標(biāo)點(diǎn)周邊,且第一次被再入滑翔飛行器探測到時已完成主動段飛行,位于一定高度位置;

    3)再入滑翔飛行器在碰撞前10 s開始進(jìn)行機(jī)動飛行,且獲取攔截器準(zhǔn)確探測數(shù)據(jù)周期為1 s。

    建立如圖1所示的博弈機(jī)動飛行場景模型。

    圖1 對抗作戰(zhàn)場景示意圖

    如圖1所示,任務(wù)場景可以描述為再入滑翔飛行器自M點(diǎn)出發(fā),朝向目標(biāo)點(diǎn)O進(jìn)行俯沖段導(dǎo)引飛行。在無攔截器攔截情況下,其將沿M,M1,M2,O到達(dá)目標(biāo);在有攔截且自身不進(jìn)行機(jī)動的情況下,其飛行經(jīng)歷時間tzk后至M1點(diǎn),首次探測到位于T點(diǎn)的攔截器,之后攔截器經(jīng)T1,T2,C1點(diǎn)命中目標(biāo),其中M2和T2點(diǎn)為兩飛行器在碰撞前10 s的位置。為模擬并簡化攔截器的指控系統(tǒng),對攔截器的發(fā)射時間和初始位置、速度進(jìn)行隨機(jī)化建模。設(shè)M點(diǎn)在地面的投影點(diǎn)為M′。以O(shè)點(diǎn)為原點(diǎn),OM′為X軸,垂直于X軸指向上為Y軸建立攔截器的發(fā)射坐標(biāo)系。設(shè)T1點(diǎn)的坐標(biāo)(XI0,YI0,ZI0)隨機(jī)產(chǎn)生區(qū)域如圖2所示,滿足:

    圖2 攔截器初始位置分布

    (7)

    設(shè)攔截器在T1點(diǎn)時的速度大小為VI0,此時再入滑翔飛行器位于M1點(diǎn)的坐標(biāo)為(XH0,YH0,ZH0),二者距離為r0。假設(shè)攔截器的速度指向?yàn)樵偃牖栾w行器-攔截器連線方向,則可得攔截器速度方向?yàn)?/p>

    (8)

    式中:θI0和ψI0為初始彈道傾角和彈道偏角。

    在機(jī)動飛行場景中,再入滑翔飛行器在M2點(diǎn)通過獲取的態(tài)勢信息進(jìn)行首次機(jī)動,飛行一個決策步長時間后到達(dá)M3點(diǎn),此時攔截器的導(dǎo)引彈道改變到達(dá)T3點(diǎn)。然后再入滑翔飛行器繼續(xù)根據(jù)新的態(tài)勢信息進(jìn)行機(jī)動參數(shù)解算,依次飛過M4,M5等點(diǎn)。攔截器經(jīng)過T4,T5等點(diǎn)后在C2點(diǎn)脫靶自毀,再入滑翔飛行器繼續(xù)對目標(biāo)點(diǎn)O導(dǎo)引。

    考慮到再入滑翔飛行器在每個決策時刻對機(jī)動參數(shù)進(jìn)行計(jì)算,則俯沖段機(jī)動問題可以被轉(zhuǎn)化為一個序列決策問題:在一定的初始態(tài)勢下,飛行器如何在連續(xù)的多個決策時間點(diǎn)輸出機(jī)動參數(shù)。

    其中,再入滑翔飛行器的場景(M點(diǎn))隨機(jī)變量有初始速度V0、初始路徑角γ0、初始高度H0、射程RL;攔截器的場景(T1點(diǎn))隨機(jī)變量有首次被探測時間tzk、初始速度大小VI0、發(fā)射系下初始位置坐標(biāo)(XI0,YI0,ZI0)和導(dǎo)引系數(shù)K。

    2 俯沖段博弈機(jī)動問題的MDP模型轉(zhuǎn)化

    強(qiáng)化學(xué)習(xí)問題是建立在馬爾科夫決策過程(Markov decision process,MDP)上的,MDP是一種通過交互式學(xué)習(xí)來實(shí)現(xiàn)目標(biāo)的理論框架。實(shí)施決策及進(jìn)行學(xué)習(xí)的主體(再入滑翔飛行器)被稱為智能體,智能體之外所有與其相互作用的事物(攔截器、既定目標(biāo)等)都被稱為環(huán)境。這些事物持續(xù)進(jìn)行交互,智能體選擇動作,環(huán)境對動作做出相應(yīng)響應(yīng),并向智能體呈現(xiàn)新的狀態(tài)。環(huán)境也會產(chǎn)生一個獎勵信號,即是智能體在動作選擇過程中想要累積最大化的目標(biāo),交互過程如圖3所示。

    圖3 馬爾科夫決策過程中的交互

    在每個離散時刻(再入滑翔飛行器俯沖段的決策步)t=0,1,2,3,…,智能體觀測到所在環(huán)境狀態(tài)的特征表達(dá)(或特征)St∈S,并且在此基礎(chǔ)上選擇一個動作At∈A(S)。下一時刻,作為其動作的結(jié)果,智能體接收到一個數(shù)值化的收益Rt∈R?R,并進(jìn)入一個新的狀態(tài)St+1。從而,智能體所處的MDP會給出如下序列:S0,A0,R1,S1,R2,S2,A2,R3,…,直到仿真交互結(jié)束。智能體的優(yōu)化目標(biāo)是最大化所獲取的累積獎勵G0:

    (9)

    式中:λ為折扣因子;Ri為第i步的獎勵。

    基于深度強(qiáng)化學(xué)習(xí)算法研究俯沖段博弈機(jī)動問題,首先需要對其馬爾科夫決策過程進(jìn)行建模,即選取和設(shè)計(jì)刻畫俯沖段博弈機(jī)動決策過程的狀態(tài)、動作和獎勵規(guī)范。

    1) 狀態(tài)空間:強(qiáng)化學(xué)習(xí)的策略學(xué)習(xí)依賴于“狀態(tài)”的概念,因?yàn)樗茸鳛椴呗院蛢r值函數(shù)的輸入,同時又作為仿真模型的輸入與輸出。對于再入滑翔飛行器,狀態(tài)變量應(yīng)反映出其飛行狀態(tài)與機(jī)動飛行任務(wù),并盡可能降低數(shù)據(jù)維度、減少信息冗余。假設(shè)攔截器運(yùn)動信息被有效探測,狀態(tài)變量定義為

    St=[Ht,RLt,Vt,σt,Δψt,HIt,RIt,VIt,σIt,ΔψIt]

    (10)

    式中:前5項(xiàng)依次代表再入滑翔飛行器在t時刻的高度、剩余航程、速度、路徑角、航向角偏差,后5項(xiàng)依次為攔截器在t時刻的高度、已飛航程(相對O點(diǎn))、速度、路徑角、航向角偏差(相對O點(diǎn))。

    2) 動作空間:動作反映了控制變量對于模型狀態(tài)的改變能力,是決策網(wǎng)絡(luò)的輸出值。

    根據(jù)再入滑翔飛行器動力學(xué)方程,在飛行過程中,能夠控制其每一時刻受力情況的是攻角和傾側(cè)角。然而,直接將攻角、傾側(cè)角的大小作為決策量有可能出現(xiàn)控制量突變的情況,將無法滿足控制系統(tǒng)要求。因此選取攻角變化率和傾側(cè)角變化率作為決策的動作變量,其大小范圍可通過動作變量的歸一化進(jìn)行限幅控制。因此動作變量定義如下:

    (11)

    3) 獎勵規(guī)范:實(shí)時獎勵函數(shù)(收益信號)定義了強(qiáng)化學(xué)習(xí)問題中的目標(biāo),其設(shè)計(jì)準(zhǔn)則應(yīng)與俯沖段博弈機(jī)動目的(規(guī)避攔截器與到達(dá)目標(biāo)點(diǎn))對應(yīng)。再入滑翔飛行器終止時刻落點(diǎn)偏差記為Lf,滿足:

    (12)

    式中:RLf為仿真終止時刻的剩余航程;Hf為仿真終止時刻的高度。

    設(shè)計(jì)連續(xù)的分段線性獎勵函數(shù)如下:

    RL=

    (13)

    (14)

    式中:R為實(shí)際設(shè)計(jì)的總獎勵函數(shù);RL為與落點(diǎn)相關(guān)的獎勵函數(shù);L0為攔截器殺傷距離,根據(jù)經(jīng)驗(yàn)取為10 m。當(dāng)LZEM>L0時認(rèn)為規(guī)避成功,此時總獎勵由落點(diǎn)偏差決定。

    由于規(guī)避威脅是一個需首先滿足的強(qiáng)約束,故和脫靶量相關(guān)的獎勵項(xiàng)呈現(xiàn)出如式(14)所示的二元形式。而由于落點(diǎn)偏差變化范圍大,采取式(13)所示的連續(xù)形式獎勵則利于策略根據(jù)梯度收斂。

    3 基于改進(jìn)PER-DDPG的博弈機(jī)動決策算法

    如圖4所示,首先給出傳統(tǒng)DDPG算法的架構(gòu),然后基于優(yōu)先經(jīng)驗(yàn)回放(Prioritized experience replay,PER)[27]方法給出DDPG算法的改進(jìn)項(xiàng),最后給出基于改進(jìn)的PER-DDPG算法對博弈機(jī)動策略網(wǎng)絡(luò)進(jìn)行訓(xùn)練的流程。

    圖4 算法實(shí)現(xiàn)框架

    3.1 傳統(tǒng)DDPG的算法架構(gòu)

    考慮到本文研究的再入滑翔飛行器俯沖段機(jī)動決策過程中,狀態(tài)空間和動作空間連續(xù)變化,使用DDPG算法對機(jī)動參數(shù)決策求解具備天然優(yōu)勢。DDPG算法基于Actor-Critic(AC)架構(gòu),其核心是4個神經(jīng)網(wǎng)絡(luò),分別是:在線決策(Actor)網(wǎng)絡(luò)π(s|θπ),負(fù)責(zé)根據(jù)狀態(tài)變量輸出決策動作;在線評價(Critic)網(wǎng)絡(luò)Q(s,a|θQ),負(fù)責(zé)對狀態(tài)-動作值函數(shù)進(jìn)行估計(jì);目標(biāo)決策網(wǎng)絡(luò)π(s|θπ′),作為在線策略網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo);目標(biāo)評價網(wǎng)絡(luò)Q(s,a|θQ′),作為在線評價網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)。DDPG算法策略提升的本質(zhì)是根據(jù)時序差分(TD)進(jìn)行策略的學(xué)習(xí)訓(xùn)練。

    在AC框架下,算法通過對“狀態(tài)-動作”值函數(shù)Q(s,a)的估計(jì)優(yōu)化實(shí)現(xiàn)對策略π的迭代更新。其中,Q(s,a)表征的是策略在當(dāng)前狀態(tài)s下采取動作a后能夠獲取的累積回報(bào)的期望值:

    (15)

    對于最優(yōu)的Q(s,a),其滿足如下貝爾曼方程:

    (16)

    相應(yīng)地,狀態(tài)值函數(shù)V(s)表征在當(dāng)前狀態(tài)s下按照策略π繼續(xù)決策能獲取的累積回報(bào)期望值:

    V(st)=E[Gt|st]

    (17)

    依據(jù)確定性策略梯度,可對參數(shù)θπ更新如下:

    (18)

    3.2 基于優(yōu)先經(jīng)驗(yàn)回放方法的算法改進(jìn)項(xiàng)

    考慮到再入滑翔飛行器面臨探索空間大、有效樣本少的困難,基于PER方法對DDPG進(jìn)行改進(jìn):

    1)建立自適應(yīng)動作噪聲方法

    傳統(tǒng)DDPG算法在訓(xùn)練過程中使用一個OU噪聲[25]對策略進(jìn)行探索,但在實(shí)際應(yīng)用中噪聲參數(shù)需要根據(jù)訓(xùn)練效果進(jìn)行調(diào)節(jié),否則容易出現(xiàn)訓(xùn)練低收益階段探索不足、高收益階段利用不足的問題。為解決此問題,采取自適應(yīng)方差的高斯噪聲設(shè)計(jì)。定義最近任務(wù)成功率Srate為其在最近100個仿真回合中飛行任務(wù)成功的比率。建立均值為0的自適應(yīng)高斯噪聲Na~N(0,δ),方差δ隨最近任務(wù)成功率變化:

    δ=10-2×(1-Srate)

    (19)

    2)使用時序差分誤差優(yōu)先經(jīng)驗(yàn)回放方法

    在標(biāo)準(zhǔn)DDPG算法中,算法采用無差別采樣方法對數(shù)據(jù)進(jìn)行訓(xùn)練,這對于獎勵信號豐富的任務(wù)能夠較快收斂,但對于可行解稀少、獎勵稀疏的任務(wù),有效樣本利用效率非常低而難以獲取策略梯度,因此根據(jù)TD誤差進(jìn)行優(yōu)先經(jīng)驗(yàn)回放。對每個樣本,計(jì)算TD誤差如下:

    ei=Ri+λQ′(Si+1,π′(Si+1|θπ′)|θQ′)-Q(Si,Ai|θQ)

    (20)

    當(dāng)基礎(chǔ)經(jīng)驗(yàn)回放池填滿之后,按照TD誤差的絕對值對所有樣本進(jìn)行優(yōu)先級計(jì)算:

    pi=|ei|+ε

    (21)

    式中:pi為優(yōu)先級;ε為一極小正值。

    對基礎(chǔ)經(jīng)驗(yàn)池中的每條樣本計(jì)算采樣概率:

    (22)

    式中:υ表示使用優(yōu)先級的程度,取為0.7[27]。

    然而,若按照上述概率對回放池中的樣本進(jìn)行采樣,將造成采樣數(shù)據(jù)分布與實(shí)際仿真交互數(shù)據(jù)分布不一致,使得神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的刻畫具有一定偏差,從而無法完成最終的收斂任務(wù)。因此,需要采取重要性采樣方法對不同采樣概率的樣本進(jìn)行采樣,第i個樣本的重要性采樣權(quán)重定義為

    (23)

    式中:N為經(jīng)驗(yàn)池中的數(shù)據(jù)樣本數(shù)量;β是調(diào)節(jié)權(quán)重的因子,取值范圍為0~1,當(dāng)其取1時表示對優(yōu)先級采樣概率進(jìn)行完全修正,仿真中取為0.5[27]。

    考慮重要性采樣權(quán)重后,則Critic網(wǎng)絡(luò)的損失函數(shù)的計(jì)算如下:

    (24)

    式中:NS為批量樣本個數(shù)。

    3)使用成功樣本優(yōu)先經(jīng)驗(yàn)回放方法

    除了采用TD優(yōu)先經(jīng)驗(yàn)回放方法外,考慮到策略探索前期成功樣本極少、策略網(wǎng)絡(luò)梯度難以產(chǎn)生有效梯度對策略進(jìn)行改善,使用成功樣本優(yōu)先經(jīng)驗(yàn)回放方法。即在策略網(wǎng)絡(luò)訓(xùn)練的前期,構(gòu)造一個成功樣本經(jīng)驗(yàn)庫,維護(hù)100組成功樣本。在對DDPG算法進(jìn)行一步參數(shù)更新前,從成功樣本庫隨機(jī)取出若干樣本放到經(jīng)驗(yàn)回放池。

    4)對終端收斂性能進(jìn)行局部調(diào)整。為保證DDPG算法在進(jìn)行到任務(wù)較高成功率的訓(xùn)練后期仍具備較好的參數(shù)更新性能,使用修正的單輪訓(xùn)練方法。在訓(xùn)練前期,每回合對Actor網(wǎng)絡(luò)進(jìn)行更新的次數(shù)為Nupdate,在Srate>90%時調(diào)整為N′update=0.2Nupdate。

    3.3 基于改進(jìn)PER-DDPG的博弈機(jī)動算法步驟

    基于改進(jìn)PER-DDPG的算法步驟為

    1) 使用隨機(jī)參數(shù)θπ初始化Actor網(wǎng)絡(luò)π(s|θπ),使用隨機(jī)參數(shù)θQ初始化Critic網(wǎng)絡(luò)Q(s,a|θQ);

    2) 將在線網(wǎng)絡(luò)參數(shù)拷貝給對應(yīng)的目標(biāo)網(wǎng)絡(luò),即θπ′←θπ,θQ′←θQ;

    3) 初始化基礎(chǔ)經(jīng)驗(yàn)回放池RB(容量3000)和成功樣本經(jīng)驗(yàn)回放池RS(容量100);確定批量采樣容量大小BS;

    4) 對于每一次俯沖段博弈機(jī)動飛行仿真:

    a. 初始化自適應(yīng)探索噪聲N的方差δ;

    b. 初始化仿真交互環(huán)境,即對再入滑翔飛行器的初始射程、飛行高度、速度大小、飛行路徑角進(jìn)行隨機(jī),攔截器的首次被探測時間、初始位置、速度等進(jìn)行隨機(jī),確定模型積分仿真時間步長tstep1=0.01 s和決策時間步長tstep2=2 s,獲取到再入滑翔飛行器智能體的初始觀測S0;

    c. 對于每一個決策步長(t=0,1,2,…):

    i)將觀測的狀態(tài)量輸入策略網(wǎng)絡(luò)再加上探索噪聲得到當(dāng)前決策動作輸出:At=π(St|θπ)+Na;

    ii)決策動作傳遞到仿真交互環(huán)境中,再入滑翔飛行器在當(dāng)前飛行時刻tsim對決策動作At進(jìn)行解析,得到每個積分步長下的當(dāng)前攻角和當(dāng)前傾側(cè)角:

    (25)

    式中:αi和σi分別為當(dāng)前積分步長的攻角和傾側(cè)角,αi-1和σi-1為上一積分步長的攻角和傾側(cè)角。

    攔截器對再入滑翔飛行器進(jìn)行導(dǎo)引飛行直至?xí)r刻tsim+tstep2或到達(dá)脫靶時刻(命中或脫靶);

    智能體通過一個決策步長的仿真過程獲取到新的狀態(tài)St+1和即時獎勵Rt;

    iii)將元組存儲到RB中。對每個經(jīng)驗(yàn)樣本,依據(jù)式(20)計(jì)算其TD誤差。當(dāng)基礎(chǔ)經(jīng)驗(yàn)回放池填滿之后,依據(jù)式(21)計(jì)算樣本優(yōu)先級,依據(jù)式(22)計(jì)算采樣概率,依據(jù)式(23)計(jì)算重要性權(quán)重。

    d. 從經(jīng)驗(yàn)池中采樣學(xué)習(xí)(執(zhí)行Nupdate次)

    采取SumTree的形式對基礎(chǔ)經(jīng)驗(yàn)池中的樣本進(jìn)行BS次數(shù)據(jù)采樣,獲取到BS條訓(xùn)練數(shù)據(jù)。

    采用均勻隨機(jī)方法,從成功樣本經(jīng)驗(yàn)池中獲取到SS條訓(xùn)練數(shù)據(jù)。令NS=BS+SS,則以上共得到NS個樣本作為策略學(xué)習(xí)的數(shù)據(jù)。

    ii)對NS個樣本分別計(jì)算

    yi=Ri+λQ′(Si+1,π′(Si+1|θπ′)|θQ′)

    (26)

    iii)計(jì)算NS個樣本的平均損失函數(shù)

    (27)

    使用Adam優(yōu)化器進(jìn)行參數(shù)θQ的更新;

    vii)計(jì)算Actor網(wǎng)絡(luò)的平均策略梯度

    (28)

    使用Adam優(yōu)化器進(jìn)行參數(shù)θπ的更新;

    viii)使用如下公式對目標(biāo)網(wǎng)絡(luò)參數(shù)軟更新:

    (29)

    式中:τ為神經(jīng)網(wǎng)絡(luò)軟更新系數(shù),取為0.005;

    e. 若再入滑翔飛行器完成對攔截器的機(jī)動且落點(diǎn)精度滿足指標(biāo),此回合樣本序列為成功樣本,則將整回合狀態(tài)轉(zhuǎn)移元組存儲到RS中;

    f. 計(jì)算連續(xù)成功概率,根據(jù)式(19)更新δ。

    4 仿真校驗(yàn)及結(jié)果分析

    4.1 決策算法訓(xùn)練

    仿真初始條件設(shè)置如下:

    1)對抗場景初始運(yùn)動參數(shù)范圍。

    2)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以及超參數(shù)設(shè)置。參考經(jīng)典DDPG確定兩類神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)和超參數(shù)。

    使用DDPG算法和改進(jìn)PER-DDPG算法分別對俯沖段機(jī)動決策模型進(jìn)行訓(xùn)練,訓(xùn)練過程的相關(guān)結(jié)果如圖5和圖6所示。

    圖5 平均累積回報(bào)值隨回合數(shù)變化曲線

    圖6 最近100回合成功次數(shù)

    從圖5和圖6可以看出,改進(jìn)的PER-DDPG算法在訓(xùn)練到達(dá)2 631個仿真回合后收斂,在訓(xùn)練末期任務(wù)成功率穩(wěn)定達(dá)到95%以上水平;相比而言,傳統(tǒng)DDPG算法的收斂性較差,最高任務(wù)成功率不足70%。算法訓(xùn)練過程中,兩個神經(jīng)網(wǎng)絡(luò)的損失函數(shù)變化曲線如圖7和圖8所示。

    圖7 Actor網(wǎng)絡(luò)的損失函數(shù)

    圖8 Critic網(wǎng)絡(luò)的損失函數(shù)

    隨著訓(xùn)練進(jìn)行,Critic網(wǎng)絡(luò)的損失函數(shù)逐漸降低,Actor網(wǎng)絡(luò)的損失函數(shù)逐漸逼近最大期望回報(bào)的負(fù)值。在本文提出的動態(tài)噪聲方差下,近100回合平均累積回報(bào)不斷上升,策略的確得到了持續(xù)提升。直至訓(xùn)練收斂,近100回合成功次數(shù)由訓(xùn)練前的不足30躍升為95以上,說明算法實(shí)現(xiàn)了既定效果。

    4.2 典型場景仿真校驗(yàn)

    為了校驗(yàn)決策神經(jīng)網(wǎng)絡(luò)在典型場景中的有效性,根據(jù)表1范圍進(jìn)行參數(shù)隨機(jī)生成如表3所示。表4給出了4種仿真場景下的統(tǒng)計(jì)結(jié)果。

    表1 場景設(shè)置參數(shù)

    表2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)

    表3 4種場景下的初始參數(shù)

    表4 不同場景的校驗(yàn)結(jié)果

    從圖9~圖12可以看出,決策網(wǎng)絡(luò)訓(xùn)練完成后,其輸出的再入滑翔飛行器俯沖段博弈機(jī)動軌跡均可規(guī)避攔截器的攔截,且能夠準(zhǔn)確到達(dá)目標(biāo)點(diǎn);飛行路徑角、攻角、傾側(cè)角變化較為平滑,能夠滿足控制系統(tǒng)要求;飛行過程中的最大總過載也在其能力范圍內(nèi)(<20),這表明剖面機(jī)動軌跡設(shè)計(jì)能夠滿足飛行能力要求。從圖13和圖14可以看出,攔截器在飛行前期能夠依據(jù)導(dǎo)引飛行鎖定再入滑翔飛行器,但經(jīng)過后者的多次機(jī)動后,攔截需用過載均在飛行末段達(dá)到可用過載閾值(20),導(dǎo)引彈道無法完成對再入滑翔飛行器的攔截。

    圖9 攔截器發(fā)射系X-Z平面對抗彈道

    圖10 攔截器發(fā)射系X-Y平面對抗彈道

    圖11 再入滑翔飛行器的法向過載隨時間變化曲線

    圖12 再入滑翔飛行器的橫向過載隨時間變化曲線

    圖13 攔截器的法向過載隨時間變化曲線

    圖14 攔截器的橫向過載隨時間變化曲線

    綜上,在校驗(yàn)的4個場景中,決策網(wǎng)絡(luò)可以完成機(jī)動飛行任務(wù)。

    4.3 統(tǒng)計(jì)校驗(yàn)與泛化性評估

    使用深度強(qiáng)化學(xué)習(xí)方法進(jìn)行智能在線決策的優(yōu)勢在于將在線計(jì)算壓力轉(zhuǎn)移到離線訓(xùn)練中。在線使用時,彈載計(jì)算機(jī)只需在每個制導(dǎo)決策周期將觀測的狀態(tài)量數(shù)組輸入給決策神經(jīng)網(wǎng)絡(luò),即可得到機(jī)動參數(shù),從而實(shí)現(xiàn)智能博弈機(jī)動,完成既定任務(wù)。

    為對決策網(wǎng)絡(luò)有效性進(jìn)行評估,開展統(tǒng)計(jì)校驗(yàn)。使用表1所示范圍的場景參數(shù)進(jìn)行1000次仿真校驗(yàn)。計(jì)算平臺CPU為Intel(R) Core(TM) i7-8700U,內(nèi)存8 GB,決策網(wǎng)絡(luò)每1 000次的調(diào)用時間為0.361~0.403 s,平均單次調(diào)用時間小于0.5 ms,具備較好的實(shí)時性。經(jīng)統(tǒng)計(jì),同時滿足再入滑翔飛行器落點(diǎn)偏差小于10 m且攔截器脫靶量大于10 m的樣本個數(shù)為927,即說明決策網(wǎng)絡(luò)輸出的策略成功率大于90%。仿真校驗(yàn)的脫靶量分布結(jié)果如圖15所示。

    圖15 攔截器脫靶量樣本分布

    仿真校驗(yàn)的落點(diǎn)偏差分布結(jié)果如圖16所示。

    圖16 落點(diǎn)偏差樣本分布

    針對攔截器的未知特性,對場景初始參數(shù)進(jìn)行調(diào)整,得到?jīng)Q策網(wǎng)絡(luò)在攔截器不同未知特性下的結(jié)果如表5所示。

    表5 攔截器未知特性下的校驗(yàn)結(jié)果

    從校驗(yàn)結(jié)果可知,決策神經(jīng)網(wǎng)絡(luò)具備較好的泛化能力,在攔截器不同未知特性下仍能保持較高的任務(wù)成功率,相較于訓(xùn)練過程末期的任務(wù)成功率最高降低不到5%,表明所提出的智能博弈機(jī)動策略對未知參數(shù)的抗干擾能力較強(qiáng)。

    5 結(jié) 論

    面向再入滑翔飛行器,針對其俯沖段博弈機(jī)動問題進(jìn)行深入研究,取得以下成果:首先,將俯沖段博弈機(jī)動問題建模為馬爾科夫決策過程,定義了狀態(tài)、動作與獎勵函數(shù);然后,針對傳統(tǒng)DDPG算法進(jìn)行改進(jìn),對經(jīng)驗(yàn)回放機(jī)制和探索噪聲設(shè)計(jì)進(jìn)行優(yōu)化,提出了基于改進(jìn)PER-DDPG的俯沖段博弈機(jī)動決策算法,提高了訓(xùn)練初期的尋優(yōu)能力和后期的收斂性能。最后,在多場景飛行仿真校驗(yàn)和大規(guī)模泛化能力校驗(yàn)中,統(tǒng)計(jì)數(shù)據(jù)驗(yàn)證了決策算法在進(jìn)行機(jī)動決策上的有效性。針對不同場景,算法具備較強(qiáng)的泛化性,可為再入滑翔飛行器的俯沖段智能博弈機(jī)動飛行提供參考。

    猜你喜歡
    攔截器滑翔機(jī)動
    蘭花螳螂會滑翔
    多動能攔截器協(xié)同制導(dǎo)規(guī)律的研究及仿真
    英國MARSS公司推出新型反無人機(jī)攔截器
    無人機(jī)(2022年2期)2022-05-20 06:43:32
    以色列“天鎖”公司展出新式反無人機(jī)攔截器
    輕兵器(2022年5期)2022-05-19 00:56:24
    攻天掠地的先鋒武器——滑翔導(dǎo)彈
    裝載機(jī)動臂的疲勞壽命計(jì)算
    12萬畝機(jī)動地不再“流浪”
    機(jī)動三輪車的昨天、今天和明天
    讓你心跳加速的“滑翔飛板”
    空中滑翔大比拼(下)——滑翔傘
    精品福利观看| 黑人巨大精品欧美一区二区mp4| 电影成人av| 两个人免费观看高清视频| 午夜影院日韩av| 国产精品99久久99久久久不卡| 老司机深夜福利视频在线观看| 黑人欧美特级aaaaaa片| 老司机福利观看| 色婷婷av一区二区三区视频| 免费看十八禁软件| 国产精品av久久久久免费| av视频免费观看在线观看| 成人国产一区最新在线观看| 女同久久另类99精品国产91| 亚洲欧洲精品一区二区精品久久久| 操出白浆在线播放| 亚洲精品一二三| 国产又色又爽无遮挡免费看| av免费在线观看网站| 制服人妻中文乱码| 国产极品粉嫩免费观看在线| 久久性视频一级片| 黑丝袜美女国产一区| 变态另类成人亚洲欧美熟女 | 免费高清视频大片| 天天躁夜夜躁狠狠躁躁| 亚洲专区国产一区二区| 91精品国产国语对白视频| 一级片'在线观看视频| 成人黄色视频免费在线看| 国产免费现黄频在线看| a级片在线免费高清观看视频| 亚洲精品一区av在线观看| 妹子高潮喷水视频| 国产熟女xx| 久久热在线av| 丰满人妻熟妇乱又伦精品不卡| 性欧美人与动物交配| 无人区码免费观看不卡| 亚洲国产欧美一区二区综合| 国产亚洲精品久久久久5区| 欧美激情 高清一区二区三区| 亚洲av片天天在线观看| 一区在线观看完整版| 久久久久久人人人人人| 正在播放国产对白刺激| 91麻豆av在线| 欧美色视频一区免费| 欧美在线一区亚洲| 99国产精品一区二区蜜桃av| 俄罗斯特黄特色一大片| 啦啦啦 在线观看视频| 久久精品国产亚洲av香蕉五月| 日韩欧美国产一区二区入口| 亚洲色图av天堂| 一本大道久久a久久精品| 日日摸夜夜添夜夜添小说| 一级毛片女人18水好多| 国产单亲对白刺激| 精品国产一区二区久久| 亚洲免费av在线视频| 日本vs欧美在线观看视频| 别揉我奶头~嗯~啊~动态视频| 操美女的视频在线观看| 中亚洲国语对白在线视频| 欧美精品一区二区免费开放| 亚洲aⅴ乱码一区二区在线播放 | 国产区一区二久久| tocl精华| 这个男人来自地球电影免费观看| 中文字幕另类日韩欧美亚洲嫩草| 国产一卡二卡三卡精品| 日韩免费av在线播放| av天堂在线播放| 亚洲全国av大片| 岛国在线观看网站| 免费在线观看日本一区| 高清av免费在线| 在线观看免费午夜福利视频| 成年人黄色毛片网站| 日日干狠狠操夜夜爽| 少妇被粗大的猛进出69影院| 天天影视国产精品| 欧美一区二区精品小视频在线| 女同久久另类99精品国产91| 国产熟女xx| 夫妻午夜视频| 国产精品偷伦视频观看了| 国产成人影院久久av| av在线天堂中文字幕 | 成人免费观看视频高清| 91麻豆精品激情在线观看国产 | 亚洲五月天丁香| 亚洲国产精品sss在线观看 | 日韩 欧美 亚洲 中文字幕| av天堂在线播放| 亚洲 国产 在线| 国产视频一区二区在线看| 99久久99久久久精品蜜桃| 国产1区2区3区精品| 怎么达到女性高潮| 亚洲色图综合在线观看| 99精品在免费线老司机午夜| 看免费av毛片| 精品国产乱子伦一区二区三区| 国产精品一区二区免费欧美| 午夜免费鲁丝| 国产精品野战在线观看 | 日韩精品青青久久久久久| 999久久久精品免费观看国产| 午夜成年电影在线免费观看| 电影成人av| 国内毛片毛片毛片毛片毛片| 精品人妻1区二区| 国产熟女xx| 可以在线观看毛片的网站| bbb黄色大片| 欧美日韩中文字幕国产精品一区二区三区 | 动漫黄色视频在线观看| 激情视频va一区二区三区| 在线观看免费视频日本深夜| 亚洲国产看品久久| 亚洲精品一区av在线观看| 身体一侧抽搐| 欧美精品亚洲一区二区| 免费日韩欧美在线观看| 精品久久久久久久久久免费视频 | www.www免费av| 久久中文字幕人妻熟女| 日本精品一区二区三区蜜桃| 久久精品aⅴ一区二区三区四区| 亚洲精品一区av在线观看| 三上悠亚av全集在线观看| 少妇 在线观看| 丝袜美足系列| 无限看片的www在线观看| 亚洲中文字幕日韩| 天天躁狠狠躁夜夜躁狠狠躁| 国产又色又爽无遮挡免费看| 热99国产精品久久久久久7| 亚洲精品成人av观看孕妇| 一进一出抽搐gif免费好疼 | 妹子高潮喷水视频| 亚洲 国产 在线| 久久亚洲精品不卡| 19禁男女啪啪无遮挡网站| 母亲3免费完整高清在线观看| 老司机午夜十八禁免费视频| 久久青草综合色| 亚洲专区国产一区二区| 亚洲,欧美精品.| 桃红色精品国产亚洲av| 99久久99久久久精品蜜桃| 天天躁狠狠躁夜夜躁狠狠躁| 国产色视频综合| 脱女人内裤的视频| 亚洲一区二区三区色噜噜 | 校园春色视频在线观看| 在线观看www视频免费| 黄色视频不卡| 精品午夜福利视频在线观看一区| 国产精品亚洲一级av第二区| 久久久国产精品麻豆| 国产97色在线日韩免费| 黄网站色视频无遮挡免费观看| 国产欧美日韩精品亚洲av| 视频区图区小说| 亚洲一区二区三区不卡视频| a级片在线免费高清观看视频| 一级作爱视频免费观看| 免费在线观看视频国产中文字幕亚洲| a级片在线免费高清观看视频| 69精品国产乱码久久久| 欧美 亚洲 国产 日韩一| 国产xxxxx性猛交| 18美女黄网站色大片免费观看| 黄色a级毛片大全视频| 亚洲全国av大片| 91av网站免费观看| 我的亚洲天堂| 丁香欧美五月| 午夜精品久久久久久毛片777| 在线观看舔阴道视频| 亚洲成人精品中文字幕电影 | 9191精品国产免费久久| 日韩精品免费视频一区二区三区| 欧美日韩一级在线毛片| 成年版毛片免费区| 欧美日韩中文字幕国产精品一区二区三区 | 久久久久久久精品吃奶| 中文字幕av电影在线播放| 亚洲自拍偷在线| 色精品久久人妻99蜜桃| 丝袜美足系列| a级片在线免费高清观看视频| 日本一区二区免费在线视频| 一级a爱视频在线免费观看| 成年人免费黄色播放视频| 久久久久久亚洲精品国产蜜桃av| 欧美成人午夜精品| 免费观看人在逋| 多毛熟女@视频| 悠悠久久av| 午夜亚洲福利在线播放| 精品国内亚洲2022精品成人| 一区福利在线观看| 日本撒尿小便嘘嘘汇集6| 精品福利观看| 日韩三级视频一区二区三区| 日本三级黄在线观看| 久久婷婷成人综合色麻豆| 俄罗斯特黄特色一大片| 精品国产乱子伦一区二区三区| 最好的美女福利视频网| 欧美成狂野欧美在线观看| 咕卡用的链子| 99热只有精品国产| 无人区码免费观看不卡| 亚洲熟女毛片儿| 国产精品爽爽va在线观看网站 | 午夜亚洲福利在线播放| 啦啦啦在线免费观看视频4| 亚洲成人精品中文字幕电影 | 两性午夜刺激爽爽歪歪视频在线观看 | 女警被强在线播放| 又紧又爽又黄一区二区| 国产有黄有色有爽视频| 亚洲精品av麻豆狂野| 巨乳人妻的诱惑在线观看| 如日韩欧美国产精品一区二区三区| 黑人操中国人逼视频| 午夜福利一区二区在线看| 99热国产这里只有精品6| 美女国产高潮福利片在线看| 国产午夜精品久久久久久| www国产在线视频色| 亚洲三区欧美一区| 满18在线观看网站| 亚洲av成人一区二区三| 午夜福利,免费看| 女人被狂操c到高潮| 亚洲熟女毛片儿| 国产精品av久久久久免费| 黄色丝袜av网址大全| 黑人巨大精品欧美一区二区蜜桃| 在线观看免费日韩欧美大片| 老熟妇乱子伦视频在线观看| 黄色视频,在线免费观看| 成人18禁在线播放| 在线观看一区二区三区激情| 18禁黄网站禁片午夜丰满| 亚洲av五月六月丁香网| 国产av精品麻豆| 中文字幕最新亚洲高清| 久久狼人影院| 两人在一起打扑克的视频| 日本黄色视频三级网站网址| 大型av网站在线播放| 日日摸夜夜添夜夜添小说| 国产高清激情床上av| 真人一进一出gif抽搐免费| 亚洲国产精品合色在线| 露出奶头的视频| 搡老乐熟女国产| 无遮挡黄片免费观看| 欧美精品一区二区免费开放| 亚洲精品一卡2卡三卡4卡5卡| 午夜福利在线免费观看网站| 日韩大尺度精品在线看网址 | 久久精品国产亚洲av高清一级| 黄色怎么调成土黄色| 午夜a级毛片| 视频区图区小说| 在线观看免费视频日本深夜| 精品福利永久在线观看| 一级毛片高清免费大全| 免费高清视频大片| 国产日韩一区二区三区精品不卡| 国产真人三级小视频在线观看| 国产欧美日韩综合在线一区二区| 麻豆成人av在线观看| 99精国产麻豆久久婷婷| 麻豆一二三区av精品| av欧美777| 日本vs欧美在线观看视频| 久久精品91蜜桃| 久久99一区二区三区| 99国产精品一区二区三区| 成年人免费黄色播放视频| 免费av中文字幕在线| 亚洲少妇的诱惑av| 99热国产这里只有精品6| 麻豆成人av在线观看| 国产亚洲精品久久久久5区| 黄色怎么调成土黄色| 欧美黑人精品巨大| 自拍欧美九色日韩亚洲蝌蚪91| 久久久久久人人人人人| 又大又爽又粗| 亚洲精品一卡2卡三卡4卡5卡| 国产精品av久久久久免费| 久久青草综合色| 国产精品国产av在线观看| 狂野欧美激情性xxxx| 午夜精品国产一区二区电影| 两性夫妻黄色片| 又黄又爽又免费观看的视频| 欧美日韩乱码在线| 在线观看免费高清a一片| 宅男免费午夜| 男女高潮啪啪啪动态图| 一a级毛片在线观看| 色婷婷av一区二区三区视频| 嫩草影视91久久| 超色免费av| 久久久久国产精品人妻aⅴ院| 午夜福利在线免费观看网站| 一级毛片高清免费大全| 在线天堂中文资源库| 午夜久久久在线观看| 91字幕亚洲| 成年人黄色毛片网站| 黄色成人免费大全| 免费搜索国产男女视频| 美女国产高潮福利片在线看| 最近最新中文字幕大全免费视频| 无限看片的www在线观看| 久久久国产精品麻豆| 人人妻人人添人人爽欧美一区卜| 亚洲av美国av| 久久影院123| 国产不卡一卡二| 女人精品久久久久毛片| 新久久久久国产一级毛片| 中文字幕人妻熟女乱码| 麻豆久久精品国产亚洲av | 精品电影一区二区在线| 99在线视频只有这里精品首页| 久热爱精品视频在线9| 亚洲av熟女| 久久精品亚洲精品国产色婷小说| videosex国产| 丝袜美足系列| 国产一区二区三区在线臀色熟女 | 国产亚洲精品久久久久5区| 看黄色毛片网站| 99在线人妻在线中文字幕| 丰满迷人的少妇在线观看| 婷婷六月久久综合丁香| 成人18禁在线播放| 另类亚洲欧美激情| 国产精品 欧美亚洲| 啦啦啦免费观看视频1| 亚洲一区高清亚洲精品| 亚洲成人免费av在线播放| 日本一区二区免费在线视频| 好男人电影高清在线观看| 99在线视频只有这里精品首页| 天堂俺去俺来也www色官网| 夜夜爽天天搞| 亚洲专区国产一区二区| 又大又爽又粗| 成人特级黄色片久久久久久久| 国产精品久久视频播放| 精品福利观看| 久久亚洲真实| 久热爱精品视频在线9| 亚洲黑人精品在线| 黄色成人免费大全| 日韩大码丰满熟妇| 日韩中文字幕欧美一区二区| 欧美精品一区二区免费开放| 欧美亚洲日本最大视频资源| 别揉我奶头~嗯~啊~动态视频| 国产一区二区三区视频了| 亚洲人成电影观看| 动漫黄色视频在线观看| 后天国语完整版免费观看| 黄网站色视频无遮挡免费观看| 视频在线观看一区二区三区| 一边摸一边做爽爽视频免费| 青草久久国产| 国产一区二区三区视频了| 青草久久国产| 99久久久亚洲精品蜜臀av| 两性夫妻黄色片| 动漫黄色视频在线观看| 国产欧美日韩一区二区精品| ponron亚洲| 在线观看日韩欧美| 999久久久国产精品视频| 欧美日韩一级在线毛片| 韩国精品一区二区三区| 色婷婷av一区二区三区视频| 精品久久久久久,| 久久久国产成人精品二区 | 成人18禁在线播放| 亚洲成人国产一区在线观看| 午夜免费鲁丝| 亚洲中文av在线| 亚洲精品av麻豆狂野| 国产一区二区在线av高清观看| xxxhd国产人妻xxx| videosex国产| 国产成+人综合+亚洲专区| 国产有黄有色有爽视频| 日韩精品中文字幕看吧| 麻豆av在线久日| 久久香蕉精品热| 日韩大码丰满熟妇| 麻豆久久精品国产亚洲av | 波多野结衣av一区二区av| 首页视频小说图片口味搜索| 久久国产精品男人的天堂亚洲| 99久久综合精品五月天人人| 在线观看一区二区三区| 亚洲国产精品999在线| 在线看a的网站| 亚洲人成伊人成综合网2020| 首页视频小说图片口味搜索| 亚洲人成网站在线播放欧美日韩| 深夜精品福利| 99久久精品国产亚洲精品| 亚洲 欧美一区二区三区| 在线观看一区二区三区激情| 桃红色精品国产亚洲av| 久久久久久久久中文| 日本 av在线| 一进一出抽搐动态| 成年版毛片免费区| 亚洲av电影在线进入| 黑人欧美特级aaaaaa片| 成人三级黄色视频| 三级毛片av免费| 亚洲欧美激情在线| 狠狠狠狠99中文字幕| 亚洲午夜理论影院| 丰满的人妻完整版| 欧美一级毛片孕妇| 自线自在国产av| 久久午夜亚洲精品久久| 在线观看免费高清a一片| 亚洲一区二区三区不卡视频| 成年人免费黄色播放视频| 亚洲欧美日韩高清在线视频| 黄片小视频在线播放| 人妻久久中文字幕网| 亚洲国产精品999在线| 最新在线观看一区二区三区| 国产精品综合久久久久久久免费 | 亚洲熟妇熟女久久| 脱女人内裤的视频| 长腿黑丝高跟| 亚洲 欧美一区二区三区| 99精品欧美一区二区三区四区| 丰满人妻熟妇乱又伦精品不卡| 一区福利在线观看| 国产精品美女特级片免费视频播放器 | 一进一出抽搐动态| 欧美成人午夜精品| 一级片免费观看大全| 别揉我奶头~嗯~啊~动态视频| 在线观看舔阴道视频| 成在线人永久免费视频| 黄色毛片三级朝国网站| 国产极品粉嫩免费观看在线| 亚洲欧美日韩高清在线视频| 国产精品99久久99久久久不卡| 日本欧美视频一区| 国产成人精品无人区| 国产人伦9x9x在线观看| 欧美+亚洲+日韩+国产| a级毛片在线看网站| 看免费av毛片| 成人三级黄色视频| 国产熟女午夜一区二区三区| 日韩国内少妇激情av| 国产av一区二区精品久久| 99精品久久久久人妻精品| 欧美不卡视频在线免费观看 | 国产成人免费无遮挡视频| 国产男靠女视频免费网站| 桃红色精品国产亚洲av| 国产熟女xx| 欧美黑人欧美精品刺激| 久久久国产一区二区| 亚洲全国av大片| 日日干狠狠操夜夜爽| 脱女人内裤的视频| 国产真人三级小视频在线观看| tocl精华| 老司机亚洲免费影院| 99国产精品免费福利视频| 亚洲成a人片在线一区二区| 午夜激情av网站| 人人妻人人爽人人添夜夜欢视频| 中出人妻视频一区二区| 久久人人97超碰香蕉20202| 国产精品久久久久久人妻精品电影| 人妻丰满熟妇av一区二区三区| 涩涩av久久男人的天堂| 男人的好看免费观看在线视频 | 欧洲精品卡2卡3卡4卡5卡区| 999久久久国产精品视频| av超薄肉色丝袜交足视频| 91九色精品人成在线观看| 99精品欧美一区二区三区四区| 国内久久婷婷六月综合欲色啪| av天堂在线播放| 亚洲五月婷婷丁香| 欧美乱色亚洲激情| 91精品三级在线观看| 欧美成人免费av一区二区三区| 午夜免费成人在线视频| 久久久久九九精品影院| 国产伦一二天堂av在线观看| 亚洲精品国产精品久久久不卡| 日韩精品中文字幕看吧| 91精品三级在线观看| 亚洲国产中文字幕在线视频| 精品人妻1区二区| 久久人妻熟女aⅴ| 黑人猛操日本美女一级片| 亚洲美女黄片视频| 后天国语完整版免费观看| 欧美不卡视频在线免费观看 | 激情在线观看视频在线高清| 免费av毛片视频| 中文字幕人妻熟女乱码| 亚洲一区二区三区色噜噜 | 日韩大尺度精品在线看网址 | 精品一品国产午夜福利视频| 夜夜夜夜夜久久久久| 天天躁狠狠躁夜夜躁狠狠躁| 欧美中文综合在线视频| 两个人免费观看高清视频| 桃色一区二区三区在线观看| 韩国精品一区二区三区| 少妇的丰满在线观看| 国产在线观看jvid| 欧美成人免费av一区二区三区| av天堂在线播放| 免费不卡黄色视频| 新久久久久国产一级毛片| 日本一区二区免费在线视频| 嫩草影视91久久| 超色免费av| 在线观看www视频免费| 免费在线观看黄色视频的| 亚洲精品在线观看二区| 色婷婷av一区二区三区视频| 日本免费一区二区三区高清不卡 | 少妇的丰满在线观看| 亚洲欧美日韩无卡精品| 在线av久久热| 男女午夜视频在线观看| 日本wwww免费看| 亚洲国产精品999在线| 欧美中文综合在线视频| 另类亚洲欧美激情| av天堂久久9| 欧美黑人欧美精品刺激| 欧美最黄视频在线播放免费 | 午夜精品久久久久久毛片777| 成人特级黄色片久久久久久久| 午夜精品在线福利| 亚洲午夜精品一区,二区,三区| 每晚都被弄得嗷嗷叫到高潮| 国产精品久久久久久人妻精品电影| 亚洲专区字幕在线| 91av网站免费观看| 又黄又粗又硬又大视频| 久久久久久久午夜电影 | 黑人巨大精品欧美一区二区蜜桃| bbb黄色大片| 波多野结衣高清无吗| 热99re8久久精品国产| 男人舔女人的私密视频| 日韩有码中文字幕| ponron亚洲| 99热国产这里只有精品6| 99久久久亚洲精品蜜臀av| 国产欧美日韩一区二区精品| 欧美日韩黄片免| 成年人黄色毛片网站| 丝袜在线中文字幕| 中文字幕人妻熟女乱码| 亚洲av成人不卡在线观看播放网| 女警被强在线播放| av天堂在线播放| 日本vs欧美在线观看视频| 亚洲精品一区av在线观看| 两人在一起打扑克的视频| 99国产极品粉嫩在线观看| 色婷婷av一区二区三区视频| 国产野战对白在线观看| 两人在一起打扑克的视频| 午夜影院日韩av| 97超级碰碰碰精品色视频在线观看| 亚洲伊人色综图| av片东京热男人的天堂| 国产成人系列免费观看| 久久草成人影院| 日本欧美视频一区| 校园春色视频在线观看| 丰满的人妻完整版| 我的亚洲天堂| videosex国产| 国产成+人综合+亚洲专区| 久久精品国产亚洲av高清一级| 欧美日韩精品网址| 亚洲av熟女| 国产亚洲av高清不卡| 桃红色精品国产亚洲av|