• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于DE-MADDPG的多無人機(jī)協(xié)同追捕策略

    2022-07-04 02:27:56符小衛(wèi)王輝徐哲
    航空學(xué)報 2022年5期
    關(guān)鍵詞:協(xié)同函數(shù)智能

    符小衛(wèi),王輝,徐哲

    西北工業(yè)大學(xué) 電子信息學(xué)院,西安 710129

    未來空戰(zhàn)對抗的主要模式之一是無人機(jī)集群體系對抗,集群中的多無人機(jī)如何通過協(xié)同決策對單一逃逸無人機(jī)進(jìn)行協(xié)作追捕,力求在最短的時間內(nèi)捕獲逃逸無人機(jī),對于增強(qiáng)多無人機(jī)協(xié)同空戰(zhàn)對抗能力具有關(guān)鍵作用,因此無人機(jī)集群空戰(zhàn)對抗中多無人機(jī)追捕對抗問題研究具有非常重要的實踐意義。

    文獻(xiàn)[2-7]分別研究了多機(jī)器人追逃對抗中追捕策略與逃逸策略的機(jī)動建模,包括基于微分對策、最優(yōu)控制等方法的求解模型和基于雙方對抗條件和運(yùn)動機(jī)制分析的追捕任務(wù)和逃逸任務(wù)成功必要條件、不同速度約束下的雙方機(jī)動策略、連續(xù)系統(tǒng)模型和棋盤環(huán)境柵格離散模型下的機(jī)動決策。但是目前圍捕問題場景中大多都是設(shè)定追捕無人機(jī)速度優(yōu)于逃逸無人機(jī),而針對追捕無人機(jī)速度相對于逃逸無人機(jī)處于劣勢的場景還是研究比較少。需要研究更為復(fù)雜和精確的模型,能夠基于集群智能的優(yōu)勢,處理這種非同等運(yùn)動參數(shù)條件下的追捕問題,即就是追捕無人機(jī)的速度相比逃逸無人機(jī)處于劣勢時,如何通過多無人機(jī)數(shù)量的優(yōu)勢和相互有效合作完成對高速目標(biāo)的追捕任務(wù)。

    在傳統(tǒng)的方法中,基于數(shù)學(xué)模型的方法設(shè)計的無人機(jī)控制策略,對敵方運(yùn)動往往作了假定約束或者需要知道對方的控制策略,但是在戰(zhàn)場環(huán)境下己方很難獲知敵方的控制策略,同時基于數(shù)學(xué)模型設(shè)置的控制器參數(shù)往往是人工設(shè)定或者需要借助其他算法進(jìn)行優(yōu)化,一旦環(huán)境模型發(fā)生改變,原來舊的控制器參數(shù)可能就不是最優(yōu)的,具有一定的局限性。基于無模型的強(qiáng)化學(xué)習(xí)則可以讓無人機(jī)在環(huán)境中自主學(xué)習(xí)控制策略,而不用完全獲取敵方的控制策略。

    多無人機(jī)協(xié)同智能追捕可以驗證多無人機(jī)的學(xué)習(xí)策略能力優(yōu)劣。多智能體強(qiáng)化學(xué)習(xí)(Multi Agent Reinforcement Learning, MARL)結(jié)合了對策論和馬爾可夫決策過程,研究隨機(jī)框架下的對抗、合作和非完全合作系統(tǒng)中的學(xué)習(xí),提供了一種可行的多無人機(jī)協(xié)同追捕對抗機(jī)動決策求解模型和方法。本文基于多智能體強(qiáng)化學(xué)習(xí)方法針對現(xiàn)有研究存在的問題設(shè)計多無人機(jī)的協(xié)同追捕策略。

    本文研究作戰(zhàn)空域存在4個追捕無人機(jī)與一個逃逸無人機(jī),逃逸無人機(jī)的速度上限和追捕無人機(jī)不同,追捕無人機(jī)與逃逸者的移動范圍不可超出作戰(zhàn)空域(為了簡化問題研究難度,設(shè)定對戰(zhàn)空域),基于解耦多智能體深度確定性策略梯度算法DE-MADDPG設(shè)計了多無人機(jī)的協(xié)同追捕對抗策略。

    1 問題描述與建模

    1.1 多無人機(jī)追逃對抗問題

    多對一追捕對抗場景中,不僅雙方無人機(jī)之間要對抗,而且多無人機(jī)之間需要任務(wù)協(xié)同,場景更加復(fù)雜、對抗性更強(qiáng)。多無人機(jī)的追捕對抗場景研究作戰(zhàn)空域內(nèi)無人機(jī)多對一空戰(zhàn)的情況,對抗場景可以描述如下:作戰(zhàn)空域內(nèi)存在多個追捕無人機(jī)和逃逸無人機(jī),兩方無人機(jī)具有相反的戰(zhàn)術(shù)目的,追捕無人機(jī)要追擊捕獲逃逸無人機(jī),而逃逸無人機(jī)要躲避遠(yuǎn)離追捕無人機(jī)。多無人機(jī)的追逃對抗場景如圖1所示。

    圖1 多無人機(jī)追捕對抗場景Fig.1 Pursuit-evasion game of multi pursuit-UAVs and single evasion-UAV

    考慮二維平面區(qū)域的追逃博弈,構(gòu)造笛卡爾直角坐標(biāo)系,表示追捕無人機(jī)和逃逸無人機(jī)運(yùn)動狀態(tài),數(shù)學(xué)幾何模型如圖2所示。

    圖2 二維平面追逃博弈幾何模型Fig.2 Geometric model of two-dimensional plane pursuit-evasion game

    追捕無人機(jī)的目標(biāo)是以最短的時間捕獲目標(biāo),逃逸無人機(jī)的目標(biāo)是遠(yuǎn)離追捕無人機(jī),避免在預(yù)設(shè)的作戰(zhàn)時間段被捕獲或者最大化延遲被追捕無人機(jī)捕獲的時間,追逃博弈標(biāo)準(zhǔn)微分博弈數(shù)學(xué)描述為。

    追捕無人機(jī)的最優(yōu)化控制目標(biāo)為

    (1)

    逃逸無人機(jī)的最優(yōu)化控制目標(biāo)為

    (2)

    式中:(=1,2,…,)為追捕無人機(jī)到逃逸無人機(jī)的距離;為追捕無人機(jī)捕獲逃逸無人機(jī)的時刻。

    1.2 無人機(jī)運(yùn)動學(xué)模型

    無人機(jī)的運(yùn)動學(xué)方程為

    (3)

    式中:=p,e;為追捕無人機(jī)或逃逸無人機(jī)的角速度的大?。?span id="j5i0abt0b" class="subscript">為追捕無人機(jī)或逃逸無人機(jī)的速度大小,是一個固定的值,即在飛行過程中不改變。

    無人機(jī)的運(yùn)動控制變量約束為

    (4)

    式中:、分別為追捕無人機(jī)和逃逸無人機(jī)的最大角速度,其計算方程為

    (5)

    式中:=p,e;Δ為仿真的時間步長;為轉(zhuǎn)彎半徑;min為最小轉(zhuǎn)彎半徑;Δ為Δ時間內(nèi)的航向角最大轉(zhuǎn)彎角;max為無人機(jī)的最大側(cè)向過載。因此,由式(5)可得最大角速度的確定公式為

    max=arcsin(Δmax(2))Δ

    (6)

    捕獲條件為式(7),即敵我距離在追捕無人機(jī)的捕獲半徑范圍內(nèi),捕獲半徑可以是無人機(jī)的載荷作用范圍或者武器攻擊范圍。

    (7)

    由于本文假定追捕問題是在有限的二維平面內(nèi)進(jìn)行的,因此無人機(jī)在設(shè)定的環(huán)境邊界內(nèi)運(yùn)動需要滿足式(8):

    (8)

    式中:=1,2,3,4;、分別為環(huán)境邊界的最小橫坐標(biāo)和最大橫坐標(biāo);、分別為環(huán)境邊界的最小縱坐標(biāo)和最大縱坐標(biāo)。

    在研究中,定義速度比為追捕無人機(jī)的最大速度和逃逸無人機(jī)最大速度之比:

    =

    (9)

    雙方無人機(jī)各占優(yōu)勢,追捕無人機(jī)數(shù)量多于逃逸無人機(jī),逃逸無人機(jī)的最大速度大于追捕無人機(jī)。文獻(xiàn)[3]基于阿波羅奧尼斯圓(Apollonius Circle)和幾何規(guī)律研究了多追捕者-單逃跑者追逃問題實現(xiàn)成功捕獲的約束條件,即速度比

    ∈[sin(π),1)

    (10)

    2 DE-MADDPG算法

    2.1 多智能體強(qiáng)化學(xué)習(xí)算法

    多智能體強(qiáng)化學(xué)習(xí)是多無人機(jī)協(xié)同控制優(yōu)化的一種求解模型框架,每個環(huán)境實體的策略輸出都有各自的神經(jīng)網(wǎng)絡(luò)控制。它是一種多智能體系統(tǒng)研究領(lǐng)域的分布式計算技術(shù),結(jié)合了強(qiáng)化學(xué)習(xí)技術(shù)與博弈論技術(shù),可以使多個智能體在高維、動態(tài)的真實環(huán)境下通過通信交互和協(xié)同決策完成錯綜復(fù)雜的任務(wù),具有自主性、分布性、協(xié)調(diào)性的特點,具備學(xué)習(xí)能力、推理能力、自組織能力,是分布式人工智能的演變。

    多智能體強(qiáng)化學(xué)習(xí)算法是以馬爾可夫決策過程為基礎(chǔ)的隨機(jī)博弈框架,可以表示為式(11)的高維度元組。

    (11)

    式中:為馬爾可夫決策過程模型的狀態(tài)集;為智能體的數(shù)量;=××…×,為所有智能體聯(lián)合動作集;為每個智能體的獎勵回報,××→;狀態(tài)轉(zhuǎn)移函數(shù):××→[0,1];為累計折扣獎勵的衰減系數(shù)。

    多智能體系統(tǒng)中,狀態(tài)轉(zhuǎn)移是所有智能體共同執(zhí)行行動的結(jié)果,獲得的獎勵取決于聯(lián)合策略,聯(lián)合策略:(|)=∏(|)為所有智能體的聯(lián)合決策策略和,×→,每個智能體的獎勵為

    (12)

    狀態(tài)值函數(shù)和狀態(tài)-動作值函數(shù)在多智能體下的貝爾曼方程如式(13)和式(14)所示:

    (13)

    =]

    (14)

    一般來說,根據(jù)多智能體強(qiáng)化學(xué)習(xí)要完成的任務(wù)類型,可分為完全合作、完全競爭和混合類型,本文的多追捕無人機(jī)協(xié)同決策屬于完全合作類型。完全合作類型各智能體的目標(biāo)就是最大化共同回報,所有智能體的獎勵函數(shù)都是相同的。其他類型情況下,獎勵函數(shù)通常不同且相關(guān),獨立最大化的難度比較大。因此完全合作類型智能體的獎勵函數(shù),很適合做MARL的目標(biāo),此時學(xué)習(xí)目標(biāo)可以表述為

    +1(,)=(,)+[+1+

    (15)

    式中:為學(xué)習(xí)率參數(shù)。

    2.2 MADDPG算法

    MADDPG是DDPG(Deep Deterministic Policy Gradient)在MARL的擴(kuò)展,各智能體都采用DDPG框架,各智能體策略參數(shù)為=(,,…,),聯(lián)合策略為:=((),(),…,())。它的核心思想是通過集中訓(xùn)練、分布執(zhí)行的框架來尋找最優(yōu)聯(lián)合策略,可以解決MARL環(huán)境的非平穩(wěn)性及經(jīng)驗回放(Experience Replay, ER)方法失效的問題。MADDPG能解決環(huán)境不穩(wěn)定性的原因在于如果已知所有智能體策略,即使智能體的策略發(fā)生變化了,環(huán)境的穩(wěn)定性不受影響。多智能體系統(tǒng)動力學(xué)模型為

    (′|,,,…,,,,…,)=(′|,

    ,,…,)=(′|,,,…,,′,

    ′,…,′)

    (16)

    因為≠′時,式(16)仍然成立,所以環(huán)境仍然是穩(wěn)定的。

    MADDPG的經(jīng)驗池設(shè)計為

    (17)

    所謂“集中訓(xùn)練,分散執(zhí)行”,指的是中心化訓(xùn)練、去中心化執(zhí)行,即通過訓(xùn)練學(xué)習(xí)得到的最優(yōu)策略,應(yīng)用的時候僅需要利用智能體的觀測信息-局部信息就能輸出最優(yōu)動作。集中訓(xùn)練時,在基礎(chǔ)DDPG算法上疊加一些額外的信息得到更準(zhǔn)確的Q值計算,反饋Actor網(wǎng)絡(luò),這些值可以是其他智能體的狀態(tài)、動作,每個智能體不僅根據(jù)自己的觀測值、動作,還根據(jù)其他智能體的動作來評估當(dāng)前Actor輸出動作的價值。值計算為

    =(,,,…,,)

    (18)

    式中:為Critic網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)。

    每個智能體的Critic網(wǎng)絡(luò)輸入相同,損失函數(shù)計算為

    (19)

    相當(dāng)于建立了一個中心化的Critic網(wǎng)絡(luò),并給出對應(yīng)的值函數(shù),也一定程度緩解環(huán)境不穩(wěn)定的問題。但是Actor僅需要局部信息,實現(xiàn)了分布式控制。

    Actor網(wǎng)絡(luò)的參數(shù)更新為

    (20)

    分散執(zhí)行指訓(xùn)練完成后,每個Actor可以根據(jù)自己的觀測值采取合適動作,不需要其他智能體的動作。MADDPG算法中的Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)協(xié)同配合如圖3所示,每個智能體使用獨自的Actor,輸出確定的動作,但是Critic網(wǎng)絡(luò)輸入除過自身的觀測狀態(tài)信息、動作信息外,還包括其他智能體的動作信息。每個智能體對應(yīng)一個中心化Critic網(wǎng)絡(luò),該網(wǎng)絡(luò)同時接受所有智能體Actor網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)。

    圖3 MADDPG的中心化訓(xùn)練和去中心化執(zhí)行Fig.3 Centralized training and decentralized execution of MADDPG

    基礎(chǔ)的MADDPG算法框架圖如圖4所示。訓(xùn)練過程中,每個智能體依靠自身策略得到當(dāng)前時刻狀態(tài)對應(yīng)的動作,然后執(zhí)行動作與環(huán)境進(jìn)行交互,獲得經(jīng)驗后存入公眾經(jīng)驗池。當(dāng)所有智能體都和環(huán)境進(jìn)行交互后,每個智能體從公眾經(jīng)驗池中隨機(jī)抽取批數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。MADDPG通過全局的值更新局部的策略,但是需要全局的狀態(tài)信息和所有智能體的動作信息。OpenAI將MADDPG算法放在游戲場景中進(jìn)行驗證,游戲決策中狀態(tài)和動作是離散的,實際的問題一般狀態(tài)和動作是連續(xù)的,本文研究將MADDPG應(yīng)用于較為接近真實的多無人機(jī)追逃對抗場景中,所用環(huán)境模型充分考慮了無人機(jī)的動力學(xué)特性和物理特性,相比較理想的游戲環(huán)境更為復(fù)雜。

    圖4 MADPPG基本框架示意圖Fig.4 Basic framework of MADDPG

    2.3 DE-MADDPG算法

    DE-MADDPG算法是一種MADDPG的改進(jìn)算法,能夠同時以解耦的方式最大化全局獎勵和局部獎勵,而不用在每個智能體的獎勵設(shè)計中考慮全局獎勵和局部獎勵。從MADDPG算法的介紹可以看出,MADDPG是通過全局的中心化Critic網(wǎng)絡(luò)實現(xiàn)集中訓(xùn)練,DE-MADDPG算法則改進(jìn)了網(wǎng)絡(luò)架構(gòu),除了一個全局的Critic網(wǎng)絡(luò),還同時為每個智能體構(gòu)建了一個局部的Critic網(wǎng)絡(luò),如圖5所示。全局Critic網(wǎng)絡(luò)的作用是最大化全局獎勵,局部Critic網(wǎng)絡(luò)的作用是最大化局部獎勵。

    圖5 DE-MADDPG的中心化訓(xùn)練和去中心化執(zhí)行[21]Fig.5 Centralized training and decentralized execution of DE-MADDPG[21]

    DE-MADDPG算法的創(chuàng)新之處在于結(jié)合了MADDPG算法和DDPG算法,同時也是一個“集中訓(xùn)練,分散執(zhí)行”的架構(gòu),僅在訓(xùn)練階段需要額外的其他智能體狀態(tài)和動作信息,應(yīng)用執(zhí)行時只需要智能體自身的狀態(tài)就可以輸出策略動作。MADDPG算法中,智能體的策略梯度為

    )|=()]

    (21)

    DE-MADDPG引進(jìn)了局部的critic網(wǎng)絡(luò),智能體的策略梯度計算會變?yōu)?/p>

    (22)

    (23)

    式中:的定義為

    (24)

    式中:′={′,′,…,′}為網(wǎng)絡(luò)參數(shù)′={′,′,…,′}定義的目標(biāo)策略。

    (25)

    式中:的定義為

    (26)

    3 多無人機(jī)協(xié)同追捕策略設(shè)計

    多無人機(jī)協(xié)同追捕問題是控制每個無人機(jī)協(xié)同去完成同一個任務(wù),所以存在無人機(jī)的整體目標(biāo)與個體目標(biāo),很適合用DE-MADDPG算法來進(jìn)行多無人機(jī)的協(xié)同追捕策略訓(xùn)練。本文從多無人機(jī)的具體追捕任務(wù)出發(fā),設(shè)置了解耦型獎勵回報函數(shù),然后基于DE-MADDPG算法對多無人機(jī)進(jìn)行了訓(xùn)練。

    3.1 解耦型獎勵回報函數(shù)設(shè)計

    獎勵函數(shù)設(shè)計采用引導(dǎo)性獎勵和稀疏獎勵相結(jié)合的方式,主要考慮無人機(jī)的協(xié)同要求和目標(biāo)任務(wù)要求,具體來說就是2個要求,一是各無人機(jī)之間要考慮避碰,即無人機(jī)之間不能互相碰撞,二是要協(xié)同以最快時間追捕逃逸無人機(jī)。多追捕無人機(jī)的任務(wù)目標(biāo),是追求任一架追捕無人機(jī)成功捕獲逃逸無人機(jī),因此獎勵函數(shù)的設(shè)計中,主要考慮距離因素。

    解耦性獎勵函數(shù)需要設(shè)計全局獎勵函數(shù)和局部獎勵函數(shù)。對于多追捕無人機(jī)的協(xié)同追捕對抗策略訓(xùn)練,全局獎勵考慮多無人機(jī)的任務(wù)目標(biāo),即追求最快讓多無人機(jī)中某一架無人機(jī)完成追捕捕獲任務(wù);局部獎勵中完成對每個無人機(jī)的避碰控制和任務(wù)目標(biāo)控制。這樣的全局獎勵函數(shù)和局部獎勵函數(shù)相結(jié)合的方式,會很快引導(dǎo)無人機(jī)的決策網(wǎng)絡(luò)更新到較優(yōu)參數(shù)。

    3.1.1 全局獎勵函數(shù)設(shè)計

    追捕無人機(jī)的整體獎勵設(shè)計為

    =-

    (27)

    式中:和為控制獎勵幅度的系數(shù);為與逃逸無人機(jī)位置(,)距離最近的追捕無人機(jī)到逃逸無人機(jī)的距離;的確定方式為

    (28)

    3.1.2 局部獎勵函數(shù)設(shè)計

    無人機(jī)的局部獎勵函數(shù)設(shè)計,分為以下3個模塊。

    1) 定義無人機(jī)互相碰撞的懲罰回報獎勵為

    c=

    (29)

    式中:為無人機(jī)之間的最近安全距離;為第架追捕無人機(jī)與第架追捕無人機(jī)之間的距離。

    2) 當(dāng)追捕無人機(jī)編隊成功捕獲逃逸無人機(jī)時,給予正獎勵回報。

    (30)

    式中:(=1,2,…,)為追捕無人機(jī)到逃逸無人機(jī)的距離;為獎賞值。

    3) 定義任務(wù)引導(dǎo)獎勵為

    p=-

    (31)

    所以,每個無人機(jī)的獎勵為上述3個獎勵函數(shù)的加權(quán)和:

    =p+c+f

    (32)

    式中:、、為加權(quán)系數(shù),并且滿足++=1。

    3.2 訓(xùn)練算法流程

    基于DE-MADDPG的多無人機(jī)協(xié)同追捕對抗策略訓(xùn)練算法流程如算法1所示。

    算法1 基于DE-MADDPG的多追捕無人機(jī)協(xié)同追捕策略訓(xùn)練算法Algorithm 1 Multi-UAVs cooperative pursuit strategy using DE-MADDPG

    為了方便算法的實現(xiàn)和使用,這里將訓(xùn)練算法中間用到的超參數(shù)及其物理意義做下介紹,訓(xùn)練算法參數(shù)表如表1所示。

    表1 訓(xùn)練算法參數(shù)Table 1 Training algorithm parameter

    4 仿真驗證

    4.1 實驗設(shè)置

    實驗采用圖1場景想定,同時采用常見的紅藍(lán)對抗作戰(zhàn)法,設(shè)定紅方為追捕無人機(jī),藍(lán)方為逃逸無人機(jī)。仿真環(huán)境全部基于Python語言編寫,利用Pycharm Community 2020.2和Anaconda3平臺,深度學(xué)習(xí)環(huán)境采用Tensorflow 1.14.0,計算機(jī)配置為CPU Inter i7-9700F@3.00 GHz,內(nèi)存16 GB。

    無人機(jī)通過觀察環(huán)境狀態(tài),根據(jù)設(shè)定的控制策略得到控制量,再利用環(huán)境的反饋調(diào)整控制策略,形成一個閉環(huán)訓(xùn)練過程。實驗設(shè)定的訓(xùn)練參數(shù)表如表2所示。

    表2 訓(xùn)練超參Table 2 Training hyperparameters

    對多追捕無人機(jī)單逃逸無人機(jī)追逃對抗仿真實驗設(shè)置作以下說明:

    1) 所有的追捕無人機(jī)為同構(gòu)無人機(jī),即追捕無人機(jī)的性能參數(shù)完全相同,并且追捕無人機(jī)之間采用全連通通信網(wǎng)絡(luò)。

    2) 為了增加研究的難度,設(shè)定追捕無人機(jī)和逃逸無人機(jī)的運(yùn)動性能不同,即研究多低速追捕無人機(jī)和高速逃逸無人機(jī)的追逃對抗。

    3) 這種場景下追逃博弈的結(jié)果與初始時追捕無人機(jī)的初始陣位、逃逸無人機(jī)的位置緊密相關(guān),同時考慮深度強(qiáng)化學(xué)習(xí)算法的應(yīng)用特點,設(shè)置多無人機(jī)協(xié)同追逃對抗實驗處在二維有限的正方形區(qū)域內(nèi),即[-700,700] m×[-700,700] m,該環(huán)境包括4個追捕無人機(jī)和1個逃逸無人機(jī)。

    4) 為了進(jìn)行有效的高速訓(xùn)練,設(shè)定逃逸無人機(jī)的初始位置為原點(0,0),4個追捕無人機(jī)的位置分別位于[-200,200] m×[-200,200] m的4個象限,如圖6所示,其中紅色的是追捕無人機(jī),藍(lán)色的是逃逸無人機(jī)。

    圖6 多追捕無人機(jī)單逃逸無人機(jī)追逃對抗初始狀態(tài)Fig.6 Initial state of pursuit-evasion game with multi pursuit-UAVs and single evasion-UAV

    5) 實驗中環(huán)境參數(shù)設(shè)置如表3所示。

    表3 多無人機(jī)追逃對抗環(huán)境實驗參數(shù)Table 3 Initial parameters of simulation experiment of multi-UAVs pursuit-evasion game

    4.2 方法有效性實驗

    為了驗證DE-MADDPG的訓(xùn)練效果,將DE-MADDPG算法同MADDPG算法、IL-DDPG(Independent Learning-DDPG, IL-DDPG)算法進(jìn)行對比,同時應(yīng)用3種算法于多追捕無人機(jī)的協(xié)同追捕對抗策略,觀察對比3種算法的訓(xùn)練效果。其中,IL-DDPG指各追捕無人機(jī)的訓(xùn)練學(xué)習(xí)和控制過程都用獨自的DDPG網(wǎng)絡(luò),每個無人機(jī)僅能獲得自己的信息和逃逸無人機(jī)的信息,擁有一套Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò),使用基本的DDPG網(wǎng)絡(luò)訓(xùn)練。MADDPG算法的網(wǎng)絡(luò)結(jié)構(gòu)如圖7(a)所示,DE-MADDPG算法的網(wǎng)絡(luò)結(jié)構(gòu)如圖7(b) 所示。

    圖7 MADDPG和DE-MADDPG網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 Network architecture of MADDPG and DE-MADDPG

    訓(xùn)練時逃逸無人機(jī)的運(yùn)動控制策略根據(jù)具體對抗場景而定。設(shè)定敵機(jī)運(yùn)動控制策略為隨機(jī)運(yùn)動策略控制方式時,4架無人機(jī)在3種算法下的平均獎勵曲線如圖8所示。

    圖8 無人機(jī)的平均獎勵曲線Fig.8 Average reward curves of UAVs

    根據(jù)實驗數(shù)據(jù)觀測,所有無人機(jī)的平均獎勵都取得收斂效果,訓(xùn)練之初無人機(jī)的總獎勵比較小且是負(fù)獎勵,這說明訓(xùn)練之初無人機(jī)采取的策略是不合法的,隨后的訓(xùn)練學(xué)習(xí)中無人機(jī)逐漸學(xué)到了提高總獎勵的策略。對比DE-MADDPG、MADDPG、IL-DDPG算法的訓(xùn)練效果,可以得到2個結(jié)論,一個是基于多智能體強(qiáng)化學(xué)習(xí)(DE-MADDPG、MADDPG)算法相比單智能體強(qiáng)化學(xué)習(xí)(IL-DDPG)算法取得了更好的收斂效果;另外一個是DE-MADDPG算法相比MADDPG算法取得了更快的收斂效果,從訓(xùn)練曲線證明了DE-MADDPG算法的優(yōu)勢。另外一方面,部分無人機(jī)的DE-MADDPG算法收斂穩(wěn)定性比MA-DDPG算法差,這是由于DE-MADDPG算法同時要兼顧整體目標(biāo)與個體目標(biāo),而MADDPG算法只考慮個體目標(biāo),導(dǎo)致的DE-MADDPG算法收斂穩(wěn)定性相對較差。

    為了驗證基于DE-MADDPG算法的追捕無人機(jī)協(xié)同追捕策略的優(yōu)劣,設(shè)置3種對抗場景來驗證設(shè)計的協(xié)同追捕策略訓(xùn)練算法。

    多追捕無人機(jī)圍捕隨機(jī)運(yùn)動逃逸無人機(jī)

    設(shè)置逃逸無人機(jī)采用隨機(jī)運(yùn)動策略控制方式。對應(yīng)的仿真實驗結(jié)果如圖9所示。

    圖9 場景1:DE-MADDPG vs隨機(jī)運(yùn)動策略Fig.9 Scene 1: DE-MADDPG vs random strategy

    場景1仿真結(jié)果表明,這是一個典型的成功實驗樣本,逃逸無人機(jī)并不具備對抗策略,只是隨機(jī)選擇運(yùn)動方向,逃逸無人機(jī)在14.78 s時被4號追捕無人機(jī)所抓捕,由于采用隨機(jī)運(yùn)動策略的逃逸無人機(jī)具有隨機(jī)機(jī)動性并且不可預(yù)測,所以花費(fèi)的時間還是相對較多。通過第一種場景的訓(xùn)練測試表明了所設(shè)計算法的有效性。

    多追捕無人機(jī)圍捕靈活逃逸策略的逃逸無人機(jī)

    逃逸無人機(jī)采用如下的靈活逃逸對抗策略,即將對戰(zhàn)態(tài)勢綜合簡單考慮,當(dāng)被追捕無人機(jī)包圍的時候,逃逸無人機(jī)向著追捕無人機(jī)構(gòu)成的多邊形所有邊長中點中最遠(yuǎn)距離的中點逃逸,如圖10(a)所示方向,為、、、中距離最遠(yuǎn)的點;當(dāng)沒被逃逸無人機(jī)包圍時,采取人工勢場法的思想,向所有追捕無人機(jī)給予的斥力矢量綜合后的斥力方向逃逸,即圖10(b) 所示,其中綜合斥力矢量的方向計算如式(33)所示

    圖10 逃逸策略示意圖Fig.10 Schematic of escape strategy

    方向,為斥力、、和的矢量合力方向。

    (33)

    圖11 場景2:DE-MADDPG vs靈活逃逸策略Fig.11 Scene2: DE-MADDPG vs flexible escape strategy

    場景2仿真結(jié)果表明,逃逸無人機(jī)采用圖10中的逃逸方向進(jìn)行逃跑,先機(jī)動變化航向至3號和4號追捕無人機(jī)的中心,但面臨圍堵后進(jìn)行快速機(jī)動,再快速逃逸,最后在21.66 s被1號無人機(jī)抓捕。通過第2種場景的訓(xùn)練測試表明了所設(shè)計算法的有效性。

    多追捕無人機(jī)圍捕轉(zhuǎn)義策略的逃逸無人機(jī)設(shè)置逃逸無人機(jī)采用訓(xùn)練出來的逃逸策略,也稱為轉(zhuǎn)義逃逸策略,逃逸策略的訓(xùn)練算法參考文獻(xiàn)[27]。對應(yīng)的仿真實驗結(jié)果如圖12所示。

    圖12 場景3:DE-MADDPG vs轉(zhuǎn)義逃逸策略Fig.12 Scene 3: DE-MADDPG vs learned strategy

    場景3仿真結(jié)果表明,訓(xùn)練出來的轉(zhuǎn)義策略通過初始的狀態(tài)和條件判斷,右上方應(yīng)該為自己的首先逃逸方向,但是追捕無人機(jī)也通過自己的態(tài)勢感知快速地進(jìn)行圍堵,隊形收縮,在逃逸無人機(jī)連續(xù)逃脫3號、4號、1號無人機(jī)的圍堵后,1號無人機(jī)和2號無人機(jī)的相互協(xié)作,成功在29.10 s圍堵抓捕逃逸無人機(jī)。通過場景3的訓(xùn)練測試表明了所設(shè)計算法的有效性。

    從以上仿真可以得出結(jié)論,訓(xùn)練出來的協(xié)同追捕策略具有明顯的合作行為,追捕無人機(jī)不僅簡單地跟蹤逃逸無人機(jī),而且表現(xiàn)出一些高級的協(xié)同行為,極大地提高了追捕任務(wù)的執(zhí)行效率,同時所設(shè)計訓(xùn)練算法對于不同逃逸策略的快速逃逸無人機(jī)也能夠較好地適用。為了驗證所設(shè)計訓(xùn)練算法得到的多無人機(jī)協(xié)同追捕策略實際使用時的穩(wěn)定性和魯棒性,將DE-MADDPG、MADDPG、IL-DDPG算法訓(xùn)練得到的多無人機(jī)協(xié)同追捕策略分別在3種逃逸無人機(jī)智能程度不同的場景中進(jìn)行10 000次的蒙特卡洛仿真,統(tǒng)計最終的成功率,如圖13所示(場景1、場景2、場景3)。蒙特卡洛仿真中每次追捕無人機(jī)的初始位置和初始航向、逃逸無人機(jī)的初始位置和初始航向都采用隨機(jī)生成方式。

    圖13 多無人機(jī)協(xié)同追捕逃逸訓(xùn)練效果成功率Fig.13 Success rate of training result of multi-UAVs cooperative pursuit-evasion strategy

    從圖13可以看出,隨著敵機(jī)逃逸無人機(jī)智能程度的提高,對戰(zhàn)場景的復(fù)雜程度提高,無論是基于哪種強(qiáng)化學(xué)習(xí)算法,訓(xùn)練效果的成功率都會隨之降低;DE-MADDPG訓(xùn)練算法相比MADDPG、ILDDPG能得到更高的追捕對抗任務(wù)成功率,IL-DDPG由于是無人機(jī)獨立地進(jìn)行學(xué)習(xí),學(xué)習(xí)訓(xùn)練階段沒有多無人機(jī)的協(xié)同,取得的追捕任務(wù)成功率最低。對戰(zhàn)是否成功不僅取決于訓(xùn)練效果的好壞,同時取決于追捕無人機(jī)和逃逸無人機(jī)的初始態(tài)勢,有些態(tài)勢下再好的訓(xùn)練效果也無法讓多追捕無人機(jī)成功完成追捕任務(wù)。本文所設(shè)計的多追捕無人機(jī)協(xié)同追捕策略是針對固定數(shù)量的4架追捕無人機(jī),如果對抗場景中有更多的追捕無人機(jī)或者速度比設(shè)定更大,則取得的任務(wù)成功率會更高。

    綜上所述,仿真實驗驗證了所提出的方法在多追捕無人機(jī)對快速的單逃逸無人機(jī)追逃對抗中的有效性和計算效率。不同于其他微分對策或者基于幾何的控制律方法,不需要針對對戰(zhàn)過程進(jìn)行精確的物理建模和推導(dǎo),只需要對多無人機(jī)的作戰(zhàn)任務(wù)進(jìn)行獎勵函數(shù)設(shè)計,在多智能體深度強(qiáng)化學(xué)習(xí)框架下進(jìn)行足夠的訓(xùn)練,就可以得到接近于傳統(tǒng)控制方法的控制效果,同時神經(jīng)網(wǎng)絡(luò)的參數(shù)可以提前訓(xùn)練學(xué)習(xí),運(yùn)行時直接端到端執(zhí)行就可以,算法的運(yùn)行時間也有所提高。本文所用DE-MADDPG算法具有廣泛的使用場景,針對其他多無人機(jī)協(xié)同控制任務(wù),稍微修改后就可以進(jìn)行實際的使用。

    5 結(jié) 論

    本文圍繞面向快速目標(biāo)的多無人機(jī)協(xié)同追捕問題,提出了一種基于解耦型的多智能體強(qiáng)化學(xué)習(xí)算法,使得多無人機(jī)具有較強(qiáng)的協(xié)同圍捕能力,主要結(jié)論如下:

    1) 提出了多無人機(jī)任務(wù)學(xué)習(xí)的局部獎勵函數(shù)和全局獎勵函數(shù)設(shè)計方法,使得無人機(jī)將個體和總體的獎勵目標(biāo)得以解耦,從而讓無人機(jī)向更明確的任務(wù)進(jìn)行訓(xùn)練學(xué)習(xí)。

    2) 提出了基于DE-MADDPG算法的多無人機(jī)協(xié)同追捕策略,能夠通過協(xié)同決策完成對快速目標(biāo)的捕獲。

    3) 設(shè)計逃逸無人機(jī)的多種逃逸控制策略并進(jìn)行算法測試,實驗結(jié)果表明本文提出基于DE-MADDPG的多無人機(jī)協(xié)同追捕策略有著不錯的應(yīng)用效果,相比IL-DDPG、MADDPG算法的應(yīng)用效果有著更好的訓(xùn)練表現(xiàn)。

    在進(jìn)一步的研究工作中,可以將本文的算法拓展到三維環(huán)境的多無人機(jī)追逃博弈問題中,能夠更接近真實空戰(zhàn)狀況。

    猜你喜歡
    協(xié)同函數(shù)智能
    二次函數(shù)
    第3講 “函數(shù)”復(fù)習(xí)精講
    蜀道難:車與路的協(xié)同進(jìn)化
    二次函數(shù)
    函數(shù)備考精講
    “四化”協(xié)同才有出路
    汽車觀察(2019年2期)2019-03-15 06:00:50
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    免费久久久久久久精品成人欧美视频| 免费观看a级毛片全部| 考比视频在线观看| 亚洲伊人色综图| 婷婷色av中文字幕| 2021少妇久久久久久久久久久| 好男人视频免费观看在线| 精品一区二区三区av网在线观看 | 中文字幕色久视频| 国产精品免费视频内射| 一本综合久久免费| 五月天丁香电影| 侵犯人妻中文字幕一二三四区| 欧美性长视频在线观看| 亚洲 欧美一区二区三区| 日本vs欧美在线观看视频| 亚洲精品久久久久久婷婷小说| 亚洲九九香蕉| 国产亚洲精品久久久久5区| 国产精品久久久久久人妻精品电影 | 欧美精品一区二区大全| 精品少妇黑人巨大在线播放| 成人国产一区最新在线观看 | 亚洲国产精品一区二区三区在线| 欧美日韩综合久久久久久| 99国产综合亚洲精品| 亚洲九九香蕉| 国产精品秋霞免费鲁丝片| 国产黄频视频在线观看| 国产成人欧美在线观看 | 脱女人内裤的视频| 最近手机中文字幕大全| 99久久精品国产亚洲精品| 91成人精品电影| 亚洲欧美日韩另类电影网站| 国产免费视频播放在线视频| 久久ye,这里只有精品| 国产精品av久久久久免费| 日本欧美视频一区| 波多野结衣av一区二区av| 精品一区二区三卡| videos熟女内射| 天天影视国产精品| 人妻 亚洲 视频| 国产91精品成人一区二区三区 | www.熟女人妻精品国产| av视频免费观看在线观看| 久久久久视频综合| 久久这里只有精品19| 国产91精品成人一区二区三区 | 亚洲午夜精品一区,二区,三区| 五月开心婷婷网| 免费看av在线观看网站| 夜夜骑夜夜射夜夜干| 色视频在线一区二区三区| 久久久久国产一级毛片高清牌| 视频在线观看一区二区三区| 少妇裸体淫交视频免费看高清 | 一级毛片我不卡| 女人被躁到高潮嗷嗷叫费观| 蜜桃在线观看..| 精品免费久久久久久久清纯 | 国产老妇伦熟女老妇高清| 女人高潮潮喷娇喘18禁视频| 成人亚洲精品一区在线观看| 亚洲av成人精品一二三区| 久久国产亚洲av麻豆专区| 午夜两性在线视频| 18禁国产床啪视频网站| 久久鲁丝午夜福利片| 国产精品国产三级专区第一集| 国产男人的电影天堂91| 亚洲国产最新在线播放| 成年动漫av网址| 亚洲九九香蕉| 久久精品久久久久久噜噜老黄| av国产精品久久久久影院| 亚洲中文字幕日韩| 美女午夜性视频免费| 国产成人精品无人区| 菩萨蛮人人尽说江南好唐韦庄| 国产免费视频播放在线视频| 婷婷成人精品国产| 国产欧美日韩精品亚洲av| 国产黄色免费在线视频| av在线播放精品| 又紧又爽又黄一区二区| 国产在线免费精品| 女人精品久久久久毛片| 人人妻人人添人人爽欧美一区卜| 国产无遮挡羞羞视频在线观看| 午夜福利,免费看| 男女边摸边吃奶| 国产亚洲午夜精品一区二区久久| 黄色视频在线播放观看不卡| 精品人妻1区二区| 精品国产乱码久久久久久男人| 日韩伦理黄色片| 人人澡人人妻人| 国产精品99久久99久久久不卡| 久久久欧美国产精品| 最近最新中文字幕大全免费视频 | 国产男人的电影天堂91| 国产精品国产三级国产专区5o| 日本91视频免费播放| 欧美激情极品国产一区二区三区| 婷婷色综合大香蕉| 久久ye,这里只有精品| 国产精品99久久99久久久不卡| tube8黄色片| 黑丝袜美女国产一区| 国产成人av教育| 欧美日韩国产mv在线观看视频| 晚上一个人看的免费电影| videos熟女内射| 免费观看av网站的网址| 少妇的丰满在线观看| 99九九在线精品视频| 久久人人97超碰香蕉20202| 欧美老熟妇乱子伦牲交| 香蕉国产在线看| 制服人妻中文乱码| 999精品在线视频| a级片在线免费高清观看视频| 最新的欧美精品一区二区| 一本色道久久久久久精品综合| 91精品伊人久久大香线蕉| 久久久久久免费高清国产稀缺| 久久精品国产亚洲av涩爱| 亚洲色图 男人天堂 中文字幕| 在线观看国产h片| 97精品久久久久久久久久精品| 日本91视频免费播放| 亚洲七黄色美女视频| 操美女的视频在线观看| 免费日韩欧美在线观看| 两个人免费观看高清视频| cao死你这个sao货| 精品少妇久久久久久888优播| 妹子高潮喷水视频| 中文字幕人妻丝袜制服| 一区二区三区精品91| 黑人欧美特级aaaaaa片| 悠悠久久av| 国产欧美日韩精品亚洲av| 欧美成狂野欧美在线观看| 脱女人内裤的视频| 欧美乱码精品一区二区三区| 超碰成人久久| a 毛片基地| 国产亚洲一区二区精品| 久久国产精品大桥未久av| 亚洲伊人久久精品综合| 欧美乱码精品一区二区三区| 久久av网站| 国产精品偷伦视频观看了| 久久 成人 亚洲| 18禁观看日本| 高清视频免费观看一区二区| av福利片在线| 午夜激情久久久久久久| 一级片'在线观看视频| 午夜福利免费观看在线| 一级片免费观看大全| 日韩伦理黄色片| 欧美黄色淫秽网站| 丰满人妻熟妇乱又伦精品不卡| 高潮久久久久久久久久久不卡| 亚洲成人手机| 国产精品99久久99久久久不卡| 自线自在国产av| 国产精品国产av在线观看| 免费高清在线观看日韩| 精品国产一区二区久久| 亚洲,一卡二卡三卡| 97人妻天天添夜夜摸| 欧美黑人欧美精品刺激| 99精品久久久久人妻精品| 国产免费视频播放在线视频| 国产午夜精品一二区理论片| 亚洲精品日韩在线中文字幕| 国产成人av激情在线播放| 在线观看www视频免费| av视频免费观看在线观看| 只有这里有精品99| 99久久综合免费| 丝瓜视频免费看黄片| 永久免费av网站大全| 欧美国产精品一级二级三级| 黄色 视频免费看| 一级毛片黄色毛片免费观看视频| 国产精品三级大全| 亚洲精品在线美女| 纵有疾风起免费观看全集完整版| 久久影院123| 精品国产超薄肉色丝袜足j| 国产成人精品在线电影| 亚洲综合色网址| 在线 av 中文字幕| 尾随美女入室| 精品一区二区三区四区五区乱码 | 亚洲av美国av| 人成视频在线观看免费观看| 成人三级做爰电影| 妹子高潮喷水视频| 国产91精品成人一区二区三区 | 人成视频在线观看免费观看| 国产av精品麻豆| 欧美变态另类bdsm刘玥| 欧美97在线视频| 国产91精品成人一区二区三区 | 亚洲人成77777在线视频| 成人亚洲欧美一区二区av| 人体艺术视频欧美日本| 免费女性裸体啪啪无遮挡网站| videos熟女内射| 久久人妻福利社区极品人妻图片 | 免费观看av网站的网址| 秋霞在线观看毛片| 中文字幕av电影在线播放| 精品国产一区二区三区四区第35| 亚洲欧洲国产日韩| 国产成人影院久久av| 久久亚洲国产成人精品v| 嫩草影视91久久| 亚洲成人免费电影在线观看 | 国产xxxxx性猛交| 久久国产精品男人的天堂亚洲| 日韩 欧美 亚洲 中文字幕| 国产又爽黄色视频| 午夜福利一区二区在线看| av在线老鸭窝| 考比视频在线观看| 欧美老熟妇乱子伦牲交| www.999成人在线观看| 亚洲精品一二三| 两个人免费观看高清视频| 国产99久久九九免费精品| 搡老乐熟女国产| 看免费av毛片| 丁香六月欧美| 国产成人精品久久二区二区免费| 久久久久久亚洲精品国产蜜桃av| 欧美在线黄色| 亚洲精品中文字幕在线视频| 超碰成人久久| 夜夜骑夜夜射夜夜干| 亚洲色图综合在线观看| 高清av免费在线| 免费观看a级毛片全部| 成人亚洲精品一区在线观看| 亚洲国产精品999| 久久天堂一区二区三区四区| 91麻豆精品激情在线观看国产 | 人妻 亚洲 视频| 宅男免费午夜| 久久精品国产亚洲av涩爱| 在线天堂中文资源库| 国产精品av久久久久免费| 少妇裸体淫交视频免费看高清 | 男女边摸边吃奶| 在线看a的网站| 国产黄频视频在线观看| 少妇人妻久久综合中文| 国产一区有黄有色的免费视频| 国产又爽黄色视频| 极品少妇高潮喷水抽搐| videos熟女内射| 伊人久久大香线蕉亚洲五| 婷婷色av中文字幕| 另类精品久久| 亚洲午夜精品一区,二区,三区| 日本欧美国产在线视频| 亚洲国产精品成人久久小说| 黄网站色视频无遮挡免费观看| 婷婷成人精品国产| 成年av动漫网址| 一个人免费看片子| 人妻 亚洲 视频| 色94色欧美一区二区| 欧美日韩综合久久久久久| 91字幕亚洲| 男女午夜视频在线观看| 久久久精品免费免费高清| 欧美老熟妇乱子伦牲交| 香蕉丝袜av| 亚洲一区二区三区欧美精品| 久久免费观看电影| 久久综合国产亚洲精品| 嫩草影视91久久| 国产免费福利视频在线观看| 黄片播放在线免费| 国产日韩欧美亚洲二区| 欧美亚洲 丝袜 人妻 在线| 午夜久久久在线观看| 一级黄片播放器| 亚洲中文av在线| 在线av久久热| 亚洲精品一卡2卡三卡4卡5卡 | 波多野结衣av一区二区av| 美女大奶头黄色视频| 久久久久精品国产欧美久久久 | 国产视频首页在线观看| 手机成人av网站| 欧美av亚洲av综合av国产av| 亚洲欧美精品自产自拍| 亚洲av男天堂| 久久99热这里只频精品6学生| 午夜91福利影院| 久久久久久久国产电影| 欧美日本中文国产一区发布| 亚洲美女黄色视频免费看| 青春草亚洲视频在线观看| 久久久久国产精品人妻一区二区| 欧美激情 高清一区二区三区| 男女边摸边吃奶| 成年女人毛片免费观看观看9 | 久久国产精品男人的天堂亚洲| 国产精品国产三级专区第一集| 亚洲成人手机| 丁香六月天网| 久久99精品国语久久久| 国产精品久久久久成人av| 亚洲男人天堂网一区| 国产精品亚洲av一区麻豆| 丰满饥渴人妻一区二区三| 一二三四社区在线视频社区8| 女警被强在线播放| 国产精品一二三区在线看| 黑丝袜美女国产一区| 久久久久精品国产欧美久久久 | 18禁裸乳无遮挡动漫免费视频| 蜜桃国产av成人99| 日韩av不卡免费在线播放| www日本在线高清视频| 国产男女超爽视频在线观看| 大片免费播放器 马上看| 久久精品国产亚洲av涩爱| 青春草亚洲视频在线观看| 人妻 亚洲 视频| 一级片'在线观看视频| 国产亚洲精品第一综合不卡| 桃花免费在线播放| 精品人妻一区二区三区麻豆| 七月丁香在线播放| 18禁观看日本| 国产精品一国产av| 另类精品久久| 国产精品久久久久久人妻精品电影 | 巨乳人妻的诱惑在线观看| 国产在线视频一区二区| 中国美女看黄片| 国产成人免费观看mmmm| 9色porny在线观看| a 毛片基地| 国产精品久久久av美女十八| www.av在线官网国产| 大香蕉久久成人网| 国产精品一区二区在线不卡| 丝袜脚勾引网站| 午夜精品国产一区二区电影| kizo精华| 大型av网站在线播放| 在线av久久热| 美女福利国产在线| 一边摸一边抽搐一进一出视频| 亚洲国产精品一区三区| 久久这里只有精品19| 99国产精品一区二区蜜桃av | www.av在线官网国产| 久久鲁丝午夜福利片| 欧美黄色片欧美黄色片| 欧美激情 高清一区二区三区| 午夜福利,免费看| 久久av网站| 欧美黑人欧美精品刺激| 亚洲国产av新网站| 男人舔女人的私密视频| 99国产精品一区二区蜜桃av | 一级,二级,三级黄色视频| 色视频在线一区二区三区| 国产一级毛片在线| 欧美激情高清一区二区三区| 国产男女内射视频| 国产精品久久久久久精品古装| 性高湖久久久久久久久免费观看| www.精华液| 亚洲av在线观看美女高潮| 中文欧美无线码| 精品少妇一区二区三区视频日本电影| 国产精品久久久久久人妻精品电影 | 性高湖久久久久久久久免费观看| 成人影院久久| 亚洲国产精品999| 黑人猛操日本美女一级片| 巨乳人妻的诱惑在线观看| 色婷婷av一区二区三区视频| 国产精品久久久久久精品古装| 国产精品一国产av| 欧美精品亚洲一区二区| 日韩人妻精品一区2区三区| 又黄又粗又硬又大视频| 人体艺术视频欧美日本| 色播在线永久视频| 美女脱内裤让男人舔精品视频| 日日夜夜操网爽| 久久亚洲国产成人精品v| svipshipincom国产片| 少妇精品久久久久久久| 国产成人免费观看mmmm| 国产xxxxx性猛交| 各种免费的搞黄视频| 国产深夜福利视频在线观看| 亚洲人成电影免费在线| 国产日韩欧美视频二区| 成年美女黄网站色视频大全免费| 亚洲国产最新在线播放| 国产免费现黄频在线看| 黄色毛片三级朝国网站| 老司机影院毛片| 精品少妇内射三级| 美女高潮到喷水免费观看| 久久99热这里只频精品6学生| 宅男免费午夜| 久久午夜综合久久蜜桃| 久久天堂一区二区三区四区| 国产片内射在线| 久久狼人影院| 婷婷丁香在线五月| 国产亚洲精品第一综合不卡| 爱豆传媒免费全集在线观看| 波多野结衣av一区二区av| 国产成人免费观看mmmm| 亚洲国产精品国产精品| 亚洲国产av新网站| 亚洲第一av免费看| 2018国产大陆天天弄谢| 午夜免费观看性视频| 国产成人欧美在线观看 | 亚洲av电影在线进入| 黄色怎么调成土黄色| 深夜精品福利| 黄片播放在线免费| www.999成人在线观看| 久久久久久久久免费视频了| 久久av网站| 丰满迷人的少妇在线观看| a级片在线免费高清观看视频| 亚洲国产中文字幕在线视频| 天天躁夜夜躁狠狠躁躁| 少妇人妻 视频| 成人国产一区最新在线观看 | 成年av动漫网址| 波多野结衣一区麻豆| 久久精品久久久久久久性| 免费高清在线观看视频在线观看| 日韩 亚洲 欧美在线| 九草在线视频观看| 免费在线观看日本一区| 国产一区二区三区综合在线观看| 黄片播放在线免费| 国产欧美日韩精品亚洲av| 亚洲国产精品一区三区| 亚洲,欧美精品.| 制服人妻中文乱码| 91麻豆精品激情在线观看国产 | 一本—道久久a久久精品蜜桃钙片| 亚洲人成77777在线视频| 国产国语露脸激情在线看| 咕卡用的链子| 亚洲精品美女久久久久99蜜臀 | 在线观看www视频免费| 亚洲av日韩在线播放| 国产精品亚洲av一区麻豆| 欧美 日韩 精品 国产| 亚洲人成77777在线视频| xxxhd国产人妻xxx| 午夜福利乱码中文字幕| 欧美黄色淫秽网站| 纯流量卡能插随身wifi吗| 人成视频在线观看免费观看| 热re99久久国产66热| 国产成人一区二区在线| 国产亚洲午夜精品一区二区久久| videos熟女内射| 亚洲一卡2卡3卡4卡5卡精品中文| 97精品久久久久久久久久精品| 国产亚洲精品久久久久5区| 黄色a级毛片大全视频| 一区福利在线观看| 亚洲精品乱久久久久久| 午夜精品国产一区二区电影| 欧美日韩一级在线毛片| 女人高潮潮喷娇喘18禁视频| 国产一区亚洲一区在线观看| 国产伦理片在线播放av一区| 国产成人精品久久二区二区免费| 母亲3免费完整高清在线观看| 国产一区二区 视频在线| tube8黄色片| 99热网站在线观看| 午夜免费成人在线视频| 久久精品久久久久久噜噜老黄| 成年av动漫网址| 久久久久久亚洲精品国产蜜桃av| 亚洲精品一卡2卡三卡4卡5卡 | 久久狼人影院| 国产一区二区 视频在线| 精品国产一区二区三区四区第35| 9色porny在线观看| 老司机影院毛片| 亚洲午夜精品一区,二区,三区| 成年人黄色毛片网站| 中文字幕亚洲精品专区| av又黄又爽大尺度在线免费看| 国产主播在线观看一区二区 | 99国产综合亚洲精品| 一级a爱视频在线免费观看| 制服诱惑二区| 日本91视频免费播放| 男女边吃奶边做爰视频| 国产精品九九99| 丰满少妇做爰视频| 亚洲人成77777在线视频| 国精品久久久久久国模美| 日韩电影二区| 日本vs欧美在线观看视频| 黄色 视频免费看| 日韩伦理黄色片| 国产精品香港三级国产av潘金莲 | 你懂的网址亚洲精品在线观看| 狂野欧美激情性bbbbbb| 在线观看免费午夜福利视频| 成年动漫av网址| av国产精品久久久久影院| 久久99一区二区三区| 老汉色∧v一级毛片| 亚洲免费av在线视频| 黄片小视频在线播放| 丰满少妇做爰视频| 一区二区三区精品91| videos熟女内射| 成人影院久久| 最近中文字幕2019免费版| 久久国产精品影院| 精品一区二区三区四区五区乱码 | 首页视频小说图片口味搜索 | 欧美日韩国产mv在线观看视频| 丝袜人妻中文字幕| 日韩制服丝袜自拍偷拍| 亚洲精品国产一区二区精华液| 久久久久精品人妻al黑| 99国产精品一区二区三区| 成年人黄色毛片网站| 国产又爽黄色视频| 啦啦啦中文免费视频观看日本| 国产福利在线免费观看视频| 欧美日韩亚洲高清精品| 国产成人啪精品午夜网站| videosex国产| 久热爱精品视频在线9| 日本wwww免费看| 国产一卡二卡三卡精品| 一级毛片我不卡| 成年人黄色毛片网站| 国产真人三级小视频在线观看| 看免费av毛片| 国产福利在线免费观看视频| 999久久久国产精品视频| 欧美中文综合在线视频| 女性生殖器流出的白浆| 香蕉国产在线看| 丁香六月天网| 91老司机精品| 国产免费福利视频在线观看| 午夜视频精品福利| 丰满人妻熟妇乱又伦精品不卡| 90打野战视频偷拍视频| 少妇 在线观看| 性少妇av在线| 亚洲国产精品999| 热99国产精品久久久久久7| 男人操女人黄网站| 精品一区二区三卡| 真人做人爱边吃奶动态| 日韩av不卡免费在线播放| 99久久人妻综合| 青春草亚洲视频在线观看| 大陆偷拍与自拍| 亚洲精品国产区一区二| 中文精品一卡2卡3卡4更新| 日韩熟女老妇一区二区性免费视频| 国产精品免费视频内射| 成人国产av品久久久| 亚洲欧美一区二区三区黑人| 亚洲精品中文字幕在线视频| 国产激情久久老熟女| 成人免费观看视频高清| 国产亚洲av高清不卡| 大码成人一级视频| 国产一区二区激情短视频 | 国产一卡二卡三卡精品| 欧美 亚洲 国产 日韩一| 免费观看a级毛片全部| 成年动漫av网址| 天天躁日日躁夜夜躁夜夜| 香蕉国产在线看| 一区二区日韩欧美中文字幕| 美国免费a级毛片| 最黄视频免费看| 国产91精品成人一区二区三区 | av国产久精品久网站免费入址| 亚洲五月婷婷丁香| 精品国产一区二区三区四区第35| 亚洲国产欧美网|