• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于EPF-MADDPG算法的多導(dǎo)彈機(jī)動(dòng)策略研究

    2024-02-29 04:33:06聶文川樊志強(qiáng)
    關(guān)鍵詞:攔截導(dǎo)彈導(dǎo)彈協(xié)同

    聶文川,樊志強(qiáng)

    (中國(guó)電科智能科技研究院,北京 100083)

    0 引言

    隨著我軍不斷地信息化改革,研究人員探索了眾多的人工智能技術(shù)[1-5]。強(qiáng)化學(xué)習(xí)技術(shù)近年來(lái)逐漸火熱,強(qiáng)化學(xué)習(xí)是可以自學(xué)習(xí)的,它適用于決策,已經(jīng)應(yīng)用于許多領(lǐng)域,如流量控制、無(wú)人機(jī)控制、網(wǎng)絡(luò)構(gòu)建等[6-9]。博弈是指一個(gè)理性的人或團(tuán)隊(duì)從選擇行為或策略,到最終獲取相應(yīng)的利益。強(qiáng)化學(xué)習(xí)算法通過(guò)博弈對(duì)抗中產(chǎn)生的回報(bào)來(lái)優(yōu)化策略選擇。強(qiáng)化學(xué)習(xí)的最主流應(yīng)用仍在游戲領(lǐng)域中,近年來(lái),強(qiáng)化學(xué)習(xí)征服了象棋、圍棋等完全信息游戲,以及撲克等不完全信息游戲,在電子游戲競(jìng)賽中的戰(zhàn)爭(zhēng)迷霧和復(fù)雜狀態(tài)空間以及動(dòng)作空間的游戲,如Dota、星際爭(zhēng)霸等[10-12],人類(lèi)玩家也逐漸被強(qiáng)化學(xué)習(xí)算法超越,而這就是算法有效性最強(qiáng)有力的體現(xiàn)。

    本文基于現(xiàn)實(shí)海上反艦場(chǎng)景中導(dǎo)彈機(jī)動(dòng)的強(qiáng)化學(xué)習(xí)進(jìn)行了研究,將他們遷移到仿真的場(chǎng)景中,尤其是導(dǎo)彈集群反艦任務(wù)。針對(duì)異構(gòu)多智能體博弈對(duì)抗的情況,本文將MADDPG(multi-agent deep deterministic strategy gradient)算法應(yīng)用到多智能體彈群反艦任務(wù)的場(chǎng)景中,通過(guò)分析在巨大狀態(tài)空間和動(dòng)作空間的收斂速度,聚焦真實(shí)報(bào)酬稀疏的問(wèn)題。同時(shí),通過(guò)設(shè)計(jì)仿真實(shí)驗(yàn)來(lái)驗(yàn)證算法的有效性。

    1 場(chǎng)景分析與數(shù)學(xué)模型

    復(fù)雜對(duì)抗場(chǎng)景一直是強(qiáng)化學(xué)習(xí)的熱點(diǎn)和難點(diǎn)之一。隨著深度強(qiáng)化學(xué)習(xí)的發(fā)展,該算法應(yīng)用到了各種場(chǎng)景。然而目前的主流應(yīng)用是在圍棋等游戲領(lǐng)域[13-15],一個(gè)重要的原因就是游戲場(chǎng)景具有現(xiàn)成的游戲環(huán)境和自洽的規(guī)則以及獎(jiǎng)懲機(jī)制,便于強(qiáng)化學(xué)習(xí)的應(yīng)用。但在自動(dòng)駕駛等真實(shí)場(chǎng)景中,由于仿真環(huán)境的仿真完成度和獎(jiǎng)懲機(jī)制的不確定性,無(wú)法實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)算法。因此在仿真系統(tǒng)中,仍需大量的工作來(lái)促進(jìn)強(qiáng)化學(xué)習(xí)算法的進(jìn)步,同時(shí)在類(lèi)似的仿真系統(tǒng)中,強(qiáng)化學(xué)習(xí)算法本身也有很大的發(fā)展?jié)摿ΑT跉v史上,計(jì)算機(jī)的發(fā)展首先運(yùn)用于軍事領(lǐng)域,用來(lái)協(xié)助人類(lèi)計(jì)算以及密碼破譯,在現(xiàn)代,人工智能依舊可以運(yùn)用在軍事領(lǐng)域。基于強(qiáng)化學(xué)習(xí)的博弈對(duì)抗推理是維持軍隊(duì)?wèi)?zhàn)斗力的重要手段之一。近年來(lái),軍事象棋推演成為人們普遍關(guān)注的熱點(diǎn),人工智能在推理和分析的過(guò)程中起到重要的作用。本文將強(qiáng)化學(xué)習(xí)應(yīng)用于多智能體博弈對(duì)抗仿真系統(tǒng)中,選取了紅藍(lán)兩面異構(gòu)的博弈對(duì)抗場(chǎng)景,即近海反艦作戰(zhàn)場(chǎng)景,紅色攻擊和藍(lán)色防御,實(shí)現(xiàn)仿真作戰(zhàn)。本文將多智能體強(qiáng)化學(xué)習(xí)算法應(yīng)用于異構(gòu)多智能體系統(tǒng),增強(qiáng)了智能體之間的協(xié)作性,提高了算法的能力。

    1.1 彈群協(xié)作的特點(diǎn)

    導(dǎo)彈集群協(xié)作智能化具有以下4個(gè)重要特點(diǎn):

    1)去中心化:任何一枚導(dǎo)彈的消失或者功能喪失,彈群的目標(biāo)依然可以有序?qū)崿F(xiàn)[16]。同時(shí)每一顆導(dǎo)彈都可以協(xié)作其他導(dǎo)彈實(shí)現(xiàn)戰(zhàn)術(shù)目標(biāo)。

    2)自主性:戰(zhàn)場(chǎng)態(tài)勢(shì)瞬息萬(wàn)變,依賴指揮官根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)進(jìn)行決斷勢(shì)必會(huì)浪費(fèi)寶貴的作戰(zhàn)時(shí)間,甚至可能錯(cuò)過(guò)稍縱即逝的機(jī)會(huì)。因此為了節(jié)省人為決策消耗的時(shí)間,飛行期間導(dǎo)彈采取的一切機(jī)動(dòng)操作均可進(jìn)行自主判斷并及時(shí)決策,且彈群內(nèi)的所有導(dǎo)彈只控制自身飛行,但可以觀察其他導(dǎo)彈位置,不對(duì)其他導(dǎo)彈產(chǎn)生影響。

    3)高動(dòng)態(tài):導(dǎo)彈需要根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)變化做出快速響應(yīng)。傳統(tǒng)預(yù)先規(guī)劃的形式已經(jīng)無(wú)法滿足現(xiàn)在瞬息萬(wàn)變的戰(zhàn)場(chǎng)環(huán)境,而導(dǎo)彈的作戰(zhàn)時(shí)間非常短暫,因此要求彈群在收集到戰(zhàn)場(chǎng)態(tài)勢(shì)信息后迅速做出決策。

    4)自治化:所有的導(dǎo)彈形成一個(gè)穩(wěn)定的集群,并且各自承擔(dān)相應(yīng)的功能,當(dāng)某一導(dǎo)彈喪失功能造成集群結(jié)構(gòu)的缺失后,其他導(dǎo)彈應(yīng)及時(shí)調(diào)整并重新構(gòu)成穩(wěn)定的集群結(jié)構(gòu)[17-18]。

    綜合來(lái)看,目前多彈頭集群協(xié)同突防技術(shù)的研究仍處于初級(jí)階段,因?yàn)樵摷夹g(shù)要求各個(gè)彈頭具有高度自主性,面臨復(fù)雜任務(wù)可以快速響應(yīng),因此對(duì)于彈載計(jì)算機(jī)的要求較高[19]。

    1.2 導(dǎo)彈運(yùn)動(dòng)學(xué)模型

    導(dǎo)彈的運(yùn)動(dòng)學(xué)方程為 :

    (1)

    式(1)中,i=p,e;ωi為攔截導(dǎo)彈或突防導(dǎo)彈的角速度大??;vi為攔截導(dǎo)彈或突防導(dǎo)彈的速度,其為一個(gè)固定值,即導(dǎo)彈在飛行過(guò)程中的速度不改變。

    導(dǎo)彈的運(yùn)動(dòng)控制變量約束為:

    (2)

    式(2)中,ωpmax,ωemax分別為攔截導(dǎo)彈和突防導(dǎo)彈的最大角速度,其計(jì)算方程為:

    (3)

    式(3)中,i=p,e;ΔT為方針的時(shí)間步長(zhǎng);ri為導(dǎo)彈的機(jī)動(dòng)半徑;rimin為導(dǎo)彈的最小機(jī)動(dòng)半徑;Δψi為ΔT時(shí)間內(nèi)的航向最大轉(zhuǎn)彎角;nimax為導(dǎo)彈的最大側(cè)向過(guò)載。因此,由式(4)可得最大角速度的確定公式為:

    (4)

    攔截捕獲條件為式(5),在攔截半徑范圍內(nèi),即我方導(dǎo)彈進(jìn)入敵方攔截導(dǎo)彈的作用范圍,便會(huì)被攔截捕獲。

    (5)

    由于本文假定的突防問(wèn)題是在有限的二維平面內(nèi)進(jìn)行的,因此導(dǎo)彈在設(shè)定的環(huán)境邊界內(nèi)運(yùn)動(dòng)需要滿足式(6):

    (6)

    式(6)中,n=[1,...,4];xmin、xmax分別為環(huán)境邊界,本文的邊界為-250~250;ymin、ymax分別為環(huán)境邊界,本文的邊界為-250~250。

    在研究中,定義速度比為攔截導(dǎo)彈的最大速度與突防導(dǎo)彈的最大速度之比:

    (7)

    (8)

    2 約束與算法設(shè)計(jì)實(shí)現(xiàn)

    2.1 導(dǎo)彈突防場(chǎng)景下的約束

    在彈群攻防對(duì)抗的場(chǎng)景中,除了雙方彈群之間的對(duì)抗,彈群內(nèi)部的導(dǎo)彈也需要協(xié)同完成任務(wù),使得場(chǎng)景要素更加復(fù)雜,且對(duì)抗雙方的對(duì)抗性更強(qiáng)。針對(duì)在作戰(zhàn)空域內(nèi)的多導(dǎo)彈協(xié)同攻防對(duì)抗場(chǎng)景,本文將對(duì)抗場(chǎng)景的預(yù)設(shè)為:作戰(zhàn)空域內(nèi)同時(shí)存在多顆攔截導(dǎo)彈和突防導(dǎo)彈,雙方具有相反的戰(zhàn)術(shù)目標(biāo)。攔截導(dǎo)彈的目標(biāo)是追擊并攔截突防導(dǎo)彈,而突防導(dǎo)彈的目標(biāo)是盡可能地突破攔截導(dǎo)彈的封鎖,或者盡可能地保護(hù)其他導(dǎo)彈進(jìn)行突防。彈群突防的對(duì)抗場(chǎng)景如圖1所示。

    圖1 導(dǎo)彈追捕場(chǎng)景

    圖1中,E為進(jìn)攻方導(dǎo)彈,P1P2為攔截方導(dǎo)彈,P0為進(jìn)攻方目標(biāo)(攔截方保護(hù)目標(biāo);ve為進(jìn)攻方導(dǎo)彈的速度大小及方向,vp1vp2為攔截方導(dǎo)彈的速度大小及方向;φe為進(jìn)攻方的導(dǎo)彈的速度航向角,φp1φp2為攔截防導(dǎo)彈的速度航向角。針對(duì)以上導(dǎo)彈集群攻防問(wèn)題描述構(gòu)造彈群攻防博弈數(shù)學(xué)模型[25],建立了有控制約束的多無(wú)人機(jī)追捕對(duì)抗零和微分博弈模型。

    考慮到我們簡(jiǎn)化的二維平面區(qū)域的追逃博弈,可以使用直角坐標(biāo)系來(lái)表示對(duì)抗雙方導(dǎo)彈的實(shí)時(shí)運(yùn)動(dòng)狀態(tài)。圖2展示了數(shù)學(xué)幾何模型。

    圖2 導(dǎo)彈運(yùn)動(dòng)模型

    圖2中,δ為目標(biāo)視線(LOS,line of sight)的夾角-視線角,目標(biāo)視線指攻防導(dǎo)彈Ε的射線,(xpn,ypn)(n=1,2,…,N)、(xe,ye)分別為攻擊方導(dǎo)彈和攔截方導(dǎo)彈的位置坐標(biāo)。

    攔截方導(dǎo)彈的目標(biāo)是通過(guò)最短時(shí)間內(nèi)攔截目標(biāo)。而突防導(dǎo)彈的目標(biāo)是躲避攔截導(dǎo)彈,以避免在作戰(zhàn)時(shí)間段內(nèi)被導(dǎo)彈攔截捕獲?;蛘弑M可能延遲其他突防導(dǎo)彈被攔截的時(shí)間。攻防雙方博弈標(biāo)準(zhǔn)微分博弈數(shù)學(xué)描述為:

    Tc=f[vp1,ψp1,L1,…,vpn,ψpn,Ln,…,

    vpN,ψpN,LN,ve,ψe]

    (9)

    式(9)中,Ln(n=1,2,…,N)為攔截導(dǎo)彈n到突防導(dǎo)彈的距離;Tc為攔截導(dǎo)彈P攔截突防導(dǎo)彈E的時(shí)刻。其中導(dǎo)彈攔截的最優(yōu)時(shí)刻是Tcmin,導(dǎo)彈突防的最優(yōu)時(shí)刻是Tcmax。

    2.2 獎(jiǎng)勵(lì)設(shè)計(jì)

    獎(jiǎng)勵(lì)設(shè)計(jì)是指導(dǎo)增強(qiáng)學(xué)習(xí)算法性能改進(jìn)的重要組成部分。攻防雙方之間的對(duì)抗最終結(jié)果只有一個(gè)真正的獎(jiǎng)賞。在引導(dǎo)智能體產(chǎn)生足夠智能的策略中,人工設(shè)計(jì)的內(nèi)在回報(bào)是關(guān)鍵。 本文設(shè)計(jì)了攻擊方導(dǎo)彈、攔截方導(dǎo)彈的獎(jiǎng)勵(lì),以指導(dǎo)其各自的策略。 突防導(dǎo)彈根據(jù)爆炸時(shí)距離目標(biāo)位置扣10分到加10分不等,給予隨距離變化的負(fù)獎(jiǎng)勵(lì),系數(shù)為 0.001,并引導(dǎo)突防方導(dǎo)彈盡快獲得正獎(jiǎng)勵(lì);當(dāng)攔截導(dǎo)彈處于攔截任務(wù)時(shí),攔截成功的目標(biāo)越多,得到的獎(jiǎng)勵(lì)越多,以引導(dǎo)攔截導(dǎo)彈盡可能同時(shí)攔截多個(gè)突防導(dǎo)彈。同時(shí),為了防止進(jìn)攻方導(dǎo)彈耗盡燃料,將給予隨著時(shí)間變化的負(fù)獎(jiǎng)勵(lì)。 攻擊上,殲敵航母加50分,引爆多個(gè)攔截導(dǎo)彈加5到20分,自身?yè)p壞扣5分。這種設(shè)置是鼓勵(lì)進(jìn)攻方導(dǎo)彈重視協(xié)作的重要性,引導(dǎo)導(dǎo)彈進(jìn)行掩護(hù)任務(wù)。同時(shí),為鼓勵(lì)導(dǎo)彈進(jìn)攻敵方航母,將距敵航母的距離設(shè)為正獎(jiǎng)勵(lì),系數(shù)為 0.000 000 1。 防御方面,攔截方將敵導(dǎo)彈和航空母艦的距離作為負(fù)獎(jiǎng)勵(lì),系數(shù)為 0.000 000 1,可防止導(dǎo)彈太近。

    2.3 EPF-MADDPG算法結(jié)構(gòu)及優(yōu)化

    2.3.1 MADDPG算法

    MADDPG算法是一種針對(duì)多智能體協(xié)同決策的強(qiáng)化學(xué)習(xí)算法,在導(dǎo)彈協(xié)同領(lǐng)域具有以下優(yōu)勢(shì):1)基于策略梯度的方法,能夠有效地處理非線性、高維、連續(xù)的動(dòng)作空間,更適合于導(dǎo)彈協(xié)同問(wèn)題;2)可以學(xué)習(xí)合作策略,MADDPG算法可以學(xué)習(xí)到智能體之間的合作策略,從而在導(dǎo)彈協(xié)同中實(shí)現(xiàn)協(xié)同作戰(zhàn)和任務(wù)分配,提高協(xié)同效率和任務(wù)完成率[21-23]。而其他單智能體算法往往只能處理獨(dú)立策略的問(wèn)題;3)具有策略共享機(jī)制,MADDPG算法具有策略共享機(jī)制,能夠讓智能體之間共享策略信息,提高學(xué)習(xí)效率并減少訓(xùn)練時(shí)間;4)具有經(jīng)驗(yàn)回放機(jī)制:MADDPG算法還具有經(jīng)驗(yàn)回放機(jī)制,能夠利用過(guò)去的經(jīng)驗(yàn)進(jìn)行學(xué)習(xí),減小樣本相關(guān)性,提高算法的穩(wěn)定性和收斂性。 綜上所述,MADDPG算法在導(dǎo)彈協(xié)同相比其他方法具有更好的學(xué)習(xí)效果、更高的協(xié)同效率和任務(wù)完成率。

    “集中訓(xùn)練,分散執(zhí)行”是一種方法,它在訓(xùn)練階段集中資源進(jìn)行模型學(xué)習(xí)和優(yōu)化,然后在執(zhí)行階段將訓(xùn)練好的模型分散到不同計(jì)算節(jié)點(diǎn)或設(shè)備上進(jìn)行并行計(jì)算和推理。這樣做可以通過(guò)訓(xùn)練學(xué)習(xí)得到最優(yōu)的訓(xùn)練策略,使算法得到高效靈活地執(zhí)行。在運(yùn)行該算法時(shí),利用智能體的觀測(cè)信息可以求出最優(yōu)解,從而得出想要的最優(yōu)策略。

    在“集中訓(xùn)練”階段,為了計(jì)算出更精確的Q值反饋給“表演者”網(wǎng)絡(luò),可以根據(jù)DDPG算法平臺(tái)添加額外數(shù)據(jù),包括其他智能體的運(yùn)動(dòng)狀態(tài)、觀察值或動(dòng)作。智能體還可以根據(jù)其他智能體的動(dòng)作價(jià)值以及自身的觀察值和動(dòng)作來(lái)判斷當(dāng)前輸出動(dòng)作的價(jià)值。

    “分散執(zhí)行”是指在訓(xùn)練完成后,每個(gè)Actor根據(jù)自身的觀測(cè)值選擇適當(dāng)?shù)膭?dòng)作,無(wú)需其他智能體的動(dòng)作信息。在MADDPG算法中,“表演者”網(wǎng)絡(luò)和“評(píng)論家”網(wǎng)絡(luò)協(xié)同工作。每個(gè)智能體都有自己的“表演者”網(wǎng)絡(luò),用于輸出確定的動(dòng)作。然而,“評(píng)論家”網(wǎng)絡(luò)不僅考慮自身的觀測(cè)狀態(tài)和動(dòng)作,同時(shí)也要考慮其他智能體的動(dòng)作信息。每個(gè)智能體都有一個(gè)中心化的“評(píng)論家”網(wǎng)絡(luò),該網(wǎng)絡(luò)同時(shí)接收所有智能體的“表演者”網(wǎng)絡(luò)生成的數(shù)據(jù)。[24]。

    2.3.2 基于經(jīng)驗(yàn)池篩選機(jī)制的算法策略改進(jìn)

    采取原始MADDPG算法時(shí),每一個(gè)評(píng)論家都需要觀察到所有agent的狀態(tài),而對(duì)于本文中涉及的大量不確定agent的場(chǎng)景,不是特別適用,而且當(dāng)按agent數(shù)量特別多時(shí),狀態(tài)空間太過(guò)于巨大,導(dǎo)致難以收斂。同時(shí)每一個(gè)agent都對(duì)應(yīng)了一個(gè)評(píng)論家和表演者網(wǎng)絡(luò),數(shù)量多時(shí),存在大量的模型,增加算法的計(jì)算時(shí)間。

    針對(duì)上述問(wèn)題,設(shè)計(jì)基于經(jīng)驗(yàn)池篩選的EPF-MADDPG算法。從兩個(gè)方面對(duì)算法進(jìn)行改進(jìn):1)引入長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)保存過(guò)往訓(xùn)練信息;2)加入閾值篩選機(jī)制對(duì)算法經(jīng)驗(yàn)回放策略做出調(diào)整。

    MADDPG算法的經(jīng)驗(yàn)回放策略沒(méi)有考慮到動(dòng)作前后的相關(guān)性,在遇到從未見(jiàn)過(guò)的情況時(shí),往往需要大量的嘗試才能學(xué)習(xí)到最優(yōu)動(dòng)作。LSTM網(wǎng)絡(luò)主要用于處理環(huán)境狀態(tài)信息的輸入,基于“門(mén)”來(lái)控制信息的丟棄或增加,從而實(shí)現(xiàn)遺忘或者記憶的功能,達(dá)到緩解梯度消失的作用。

    LSTM網(wǎng)絡(luò)中的遺忘門(mén)、記憶門(mén)以及輸出門(mén)是LSTM神經(jīng)網(wǎng)絡(luò)中的3種門(mén)控機(jī)制,用于控制輸入、輸出和忘記之前的信息。其中,遺忘門(mén)用于決定之前輸入的信息被遺忘的程度;輸入門(mén)用于控制新輸入信息的加入程度;輸出門(mén)用于控制當(dāng)前狀態(tài)的輸出程度。網(wǎng)絡(luò)的整體結(jié)構(gòu)如圖3所示。

    圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)

    遺忘門(mén):控制歷史狀態(tài)流經(jīng)當(dāng)前狀態(tài)后允許多少進(jìn)入當(dāng)前狀態(tài)的門(mén)控設(shè)備。

    記憶門(mén):控制從當(dāng)前狀態(tài)向長(zhǎng)期記憶中存儲(chǔ)哪些信息的門(mén)控設(shè)備。

    輸出門(mén):控制從長(zhǎng)期記憶中向當(dāng)前狀態(tài)輸出哪些信息的門(mén)控設(shè)備。

    經(jīng)驗(yàn)池閾值的設(shè)置由預(yù)訓(xùn)練決定,將預(yù)訓(xùn)練的樣本數(shù)據(jù)按照從大到小依次排列為一序列,序列樣本總數(shù)為n,設(shè)定參數(shù)α代表正式訓(xùn)練時(shí)使用序列樣本的比例,選取α×n位置的樣本所對(duì)應(yīng)的值作為預(yù)值。為設(shè)立合理的閾值進(jìn)行預(yù)訓(xùn)練,按優(yōu)先級(jí)從高到低的順序?qū)?shù)據(jù)列表進(jìn)行排序,然后從高斯隨機(jī)數(shù)值生成器中獲取一個(gè)0~1之間的隨機(jī)數(shù)α,其中α在0~1之間取值的概率呈正態(tài)分布,這樣就可以盡可能取到中間的數(shù)值,避免出現(xiàn)接近0或接近1的極端情況。

    對(duì)于正式訓(xùn)練的樣本數(shù)據(jù),只有大于預(yù)設(shè)閾值的樣本才會(huì)放入經(jīng)驗(yàn)池中。在基于經(jīng)驗(yàn)池篩選的MADDPG算法中,采用純粹貪婪優(yōu)先方法對(duì)樣本進(jìn)行排序,確保被采樣的頻率在繼承優(yōu)先級(jí)上是單調(diào)的。同時(shí)在排序好的樣本隊(duì)列中加入均勻隨機(jī)采樣,避免了高優(yōu)先級(jí)產(chǎn)生的過(guò)擬合問(wèn)題。

    2.3.3 算法框架實(shí)現(xiàn)

    本文采用的MADDPG算法框架如圖4所示。在訓(xùn)練過(guò)程中,首先初始化整體的狀態(tài)和策略網(wǎng)絡(luò)。智能體根據(jù)當(dāng)前時(shí)刻的狀態(tài)輸入Actor網(wǎng)絡(luò),生成對(duì)應(yīng)的動(dòng)作。環(huán)境返回智能體執(zhí)行當(dāng)前動(dòng)作時(shí)所獲得的獎(jiǎng)勵(lì)和轉(zhuǎn)移到的下一狀態(tài)。智能體將生成的四元組數(shù)據(jù)存儲(chǔ)到經(jīng)驗(yàn)回放緩存中,以備后續(xù)的“表演者”網(wǎng)絡(luò)和“評(píng)論家”網(wǎng)絡(luò)更新時(shí)使用。然后智能體從緩存池中采樣多個(gè)批次的機(jī)動(dòng)軌跡,每一條機(jī)動(dòng)軌跡是智能體與環(huán)境進(jìn)一步交互得的。輸入 Actor 網(wǎng)絡(luò)進(jìn)行訓(xùn)練的數(shù)據(jù)是智能體當(dāng)前時(shí)刻的狀態(tài)。智能體利用已更新的模型與環(huán)境進(jìn)行下一步的交互,然后利用生成的數(shù)據(jù)更新經(jīng)驗(yàn)回放緩存池。當(dāng)然,每個(gè)智能體都有自己的 “表演者”網(wǎng)絡(luò)和 “評(píng)論家”網(wǎng)絡(luò),還有一個(gè)所有智能體共有的 “評(píng)論家”網(wǎng)絡(luò),每個(gè)智能體自身的 “評(píng)論家”網(wǎng)絡(luò)學(xué)習(xí)單個(gè)智能體每輪訓(xùn)練的期望收益,所有智能體共有的 “評(píng)論家”網(wǎng)絡(luò)學(xué)習(xí)團(tuán)隊(duì)的期望收益。

    圖4 MADDPG算法框架

    下面是本文的整體算法設(shè)計(jì)。

    Forepisode = 1 to MaxEpisode do

    在設(shè)定的范圍內(nèi)隨機(jī)初始化突防導(dǎo)彈、 攔截導(dǎo)彈的初始狀態(tài)

    Fort = 1 to MaxStep do

    獲得仿真環(huán)境初始狀態(tài)st

    /*全局Critic網(wǎng)絡(luò)更新*/

    /*Actor網(wǎng)絡(luò)和局部Critic網(wǎng)絡(luò)更新*/

    For Agenti=1 toNdo

    End For

    End For

    End For

    3 實(shí)驗(yàn)結(jié)果

    為了驗(yàn)證所提方法的優(yōu)越性,本實(shí)驗(yàn)的硬件配置為,CPU:Intel○RCoreTMi7-13700KF CPU @4.20 GHz;內(nèi)存:32 G;顯卡:Geforce RTX4070Ti(12 G內(nèi)存)上,基于Windows10平臺(tái),顯存位寬為64位DDRM。

    圖5為在不同范圍的仿真場(chǎng)景下的所有智能體的算法回報(bào),圖中隨著場(chǎng)景的一步步擴(kuò)大,算法收斂得到的回報(bào)也逐漸提高,說(shuō)明在更大的作戰(zhàn)范圍中突防導(dǎo)彈可以更好地達(dá)到任務(wù)目標(biāo),攔截方導(dǎo)彈在更小的作戰(zhàn)范圍內(nèi),攔截的成功率就越高。同時(shí)在1 000*1 000(km)以后,場(chǎng)景得到的回報(bào)提升就不再顯著。

    圖5 范圍-回報(bào)變化

    本文實(shí)驗(yàn)針對(duì)海域上的導(dǎo)彈集群攻防博弈情形進(jìn)行了設(shè)計(jì)。假設(shè)在某海域中,我方發(fā)射兩枚導(dǎo)彈對(duì)敵方航母發(fā)起打擊,在相對(duì)坐標(biāo)1 000*1 000(km)的區(qū)域內(nèi)敵方發(fā)射三枚攔截導(dǎo)彈,實(shí)施突防策略。為了使實(shí)驗(yàn)具有可操作性,設(shè)定突防導(dǎo)彈的機(jī)動(dòng)能力比攔截導(dǎo)彈的機(jī)動(dòng)能力大,同時(shí)規(guī)定為距離的安全約束,當(dāng)其中有一個(gè)攔截導(dǎo)彈靠近了突防導(dǎo)彈該距離約束值內(nèi),追捕成功,博弈結(jié)束。為加速收斂,忽略z軸的動(dòng)力學(xué)模型,得到一個(gè)平面內(nèi)二維的博弈場(chǎng)景[26-27]。實(shí)驗(yàn)設(shè)計(jì)的訓(xùn)練參數(shù)如表1所示。

    表1 算法訓(xùn)練超參

    首先,實(shí)驗(yàn)分析了該場(chǎng)景下MADDPG算法的收斂性。圖6為MADDPG與DQN算法的回報(bào)獎(jiǎng)勵(lì),其中DQN的學(xué)習(xí)率設(shè)置為0.001,采用批量梯度下降的方式進(jìn)行學(xué)習(xí),經(jīng)驗(yàn)池大小與批樣本數(shù)與EPF-MADDPG算法保持一致。經(jīng)過(guò) 14 000 輪的訓(xùn)練后,網(wǎng)絡(luò)的loss值逐漸降低,且趨于穩(wěn)定,說(shuō)明網(wǎng)絡(luò)收斂,各個(gè)智能體都能產(chǎn)生更合適的動(dòng)作。 從圖5、6中可以看出,MADDPG算法相較于DQN算法具有更快的收斂速度,以及更優(yōu)秀的回報(bào)獎(jiǎng)勵(lì)。同時(shí),各單元參與者網(wǎng)絡(luò)的下降趨勢(shì)相似,關(guān)鍵網(wǎng)絡(luò)的下降趨勢(shì)也相似。

    同時(shí),根據(jù)圖6所示,基于經(jīng)驗(yàn)池篩選策略的MADDPG算法耗時(shí)明顯低于傳統(tǒng)的MADDPG算法,其最大時(shí)延為320 ms,而DQN算法需要400 ms。EPF-MADDPG相較于DQN算法提升了8%左右,滿足實(shí)際場(chǎng)景中的實(shí)時(shí)性需求。

    隨著不斷地訓(xùn)練,敵方智能體也會(huì)學(xué)習(xí)到一些策略,這就會(huì)導(dǎo)致回報(bào)的下降,但這也會(huì)促進(jìn)我方智能體的學(xué)習(xí),最后收斂到一個(gè)穩(wěn)定的回報(bào)。

    隨著不斷地學(xué)習(xí),智能體會(huì)逐漸學(xué)習(xí)到一些策略,用來(lái)欺騙敵方。圖7中是智能體的行動(dòng)軌跡,我們可以看到智能體會(huì)做出“假動(dòng)作”誘使敵方智能體做出錯(cuò)誤的判斷,并加速通過(guò)速度優(yōu)勢(shì)越過(guò)攔截導(dǎo)彈的攔截。

    圖7 智能體機(jī)動(dòng)行為

    并且經(jīng)過(guò)訓(xùn)練的智能體也表現(xiàn)出協(xié)作的特征,圖8中顏色較深的智能體作為誘餌,吸引了敵方3枚導(dǎo)彈的圍追堵截,通過(guò)消滅攔截方的3枚導(dǎo)彈,為己方的突防導(dǎo)彈創(chuàng)造了條件,另一枚導(dǎo)彈最后順利完成任務(wù)目標(biāo)。

    圖8 智能體協(xié)同行為

    實(shí)驗(yàn)經(jīng)過(guò)100次仿真模擬,如表2所示,經(jīng)過(guò)EPF-MADDPG算法訓(xùn)練的突防方導(dǎo)彈勝率可以達(dá)到73%,實(shí)驗(yàn)結(jié)果表明,訓(xùn)練出來(lái)的協(xié)同突防策略具有明顯合作以及欺騙對(duì)手的行為,突防導(dǎo)彈不僅簡(jiǎn)單的依靠速度進(jìn)行突防,同時(shí)表現(xiàn)出一些高級(jí)的協(xié)同行為,極大提高了突防策略的訓(xùn)練效率。

    表2 各個(gè)算法突防成功率

    4 結(jié)束語(yǔ)

    為了在仿真環(huán)境中實(shí)現(xiàn)多智能體對(duì)抗的智能決策,提出了一種基于 MADDPG 的異構(gòu)多智能體對(duì)抗決策算法,輔助決策者進(jìn)行導(dǎo)彈集群突防方案的制訂,并且在方案執(zhí)行的過(guò)程中具有一定的自主決策能力。為了進(jìn)一步地驗(yàn)證MADDPG算法對(duì)于導(dǎo)彈突防場(chǎng)景的可行性,本文還從仿真的角度進(jìn)行驗(yàn)證,經(jīng)過(guò)基于經(jīng)驗(yàn)池篩選策略的MADDPG算法計(jì)算的突防策略成功率達(dá)到73%。

    本文還存在待改進(jìn)的方面:首先,對(duì)于導(dǎo)彈突防任務(wù)來(lái)講,不僅有同波次導(dǎo)彈間的協(xié)同配合,同時(shí)還應(yīng)有多波次導(dǎo)彈的協(xié)同配合,對(duì)于任務(wù)分解規(guī)劃,以及戰(zhàn)場(chǎng)態(tài)勢(shì)的偵察獲取,還需要進(jìn)行深入的研究改進(jìn),得到一個(gè)簡(jiǎn)單易行的方法;其次,本算法的仿真業(yè)務(wù)場(chǎng)景具有特殊性,仍需進(jìn)行改進(jìn)學(xué)習(xí),在不同環(huán)境不同維度進(jìn)行推演驗(yàn)證。

    猜你喜歡
    攔截導(dǎo)彈導(dǎo)彈協(xié)同
    蜀道難:車(chē)與路的協(xié)同進(jìn)化
    導(dǎo)彈燃料知多少
    軍事文摘(2020年14期)2020-12-17 06:27:16
    “四化”協(xié)同才有出路
    正在發(fā)射的岸艦導(dǎo)彈
    攔截那枚導(dǎo)彈
    導(dǎo)彈轉(zhuǎn)運(yùn)
    三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
    協(xié)同進(jìn)化
    亚洲一区二区三区欧美精品| 亚洲av成人一区二区三| 久久午夜亚洲精品久久| 国产午夜精品久久久久久| 男女午夜视频在线观看| 欧美精品啪啪一区二区三区| 午夜激情久久久久久久| 国产精品美女特级片免费视频播放器 | 99久久国产精品久久久| 精品国产亚洲在线| 日本vs欧美在线观看视频| 在线观看免费视频网站a站| 老司机福利观看| 久久久精品免费免费高清| 人人妻人人添人人爽欧美一区卜| 亚洲人成77777在线视频| 亚洲欧美精品综合一区二区三区| 久9热在线精品视频| 美女高潮喷水抽搐中文字幕| 欧美亚洲日本最大视频资源| 日韩大片免费观看网站| 老熟妇乱子伦视频在线观看| 50天的宝宝边吃奶边哭怎么回事| 国产97色在线日韩免费| 国产福利在线免费观看视频| 日韩欧美三级三区| 99re在线观看精品视频| 丝瓜视频免费看黄片| 精品一区二区三区视频在线观看免费 | 又大又爽又粗| 18禁美女被吸乳视频| 久久av网站| 在线观看一区二区三区激情| 国产高清视频在线播放一区| 精品国产超薄肉色丝袜足j| 色婷婷久久久亚洲欧美| 在线观看舔阴道视频| 50天的宝宝边吃奶边哭怎么回事| 正在播放国产对白刺激| 国产高清国产精品国产三级| 午夜老司机福利片| 69精品国产乱码久久久| 国产精品成人在线| 国产成人精品无人区| videosex国产| 他把我摸到了高潮在线观看 | 十八禁网站免费在线| 国产淫语在线视频| 亚洲第一av免费看| 天天躁狠狠躁夜夜躁狠狠躁| 精品亚洲乱码少妇综合久久| 久久人人97超碰香蕉20202| 久久久久久久国产电影| 三上悠亚av全集在线观看| 侵犯人妻中文字幕一二三四区| 国产精品国产高清国产av | 丝袜美足系列| 国产精品一区二区免费欧美| 日韩中文字幕视频在线看片| 一本色道久久久久久精品综合| 99久久精品国产亚洲精品| 免费不卡黄色视频| 国产av又大| 如日韩欧美国产精品一区二区三区| 视频在线观看一区二区三区| 最近最新中文字幕大全免费视频| 欧美在线一区亚洲| 男女之事视频高清在线观看| 欧美日韩中文字幕国产精品一区二区三区 | 69av精品久久久久久 | 高潮久久久久久久久久久不卡| av天堂久久9| 亚洲欧洲日产国产| av又黄又爽大尺度在线免费看| 婷婷丁香在线五月| 一本—道久久a久久精品蜜桃钙片| 极品人妻少妇av视频| 最新在线观看一区二区三区| 91麻豆av在线| 成人国语在线视频| 视频区图区小说| e午夜精品久久久久久久| 精品国产一区二区久久| 黄色片一级片一级黄色片| 国产精品秋霞免费鲁丝片| 69精品国产乱码久久久| 久久这里只有精品19| 18禁黄网站禁片午夜丰满| 一级片免费观看大全| 69av精品久久久久久 | 久久精品国产综合久久久| 啦啦啦中文免费视频观看日本| 日日爽夜夜爽网站| 国产av国产精品国产| 久久午夜亚洲精品久久| 欧美 亚洲 国产 日韩一| 好男人电影高清在线观看| 啦啦啦免费观看视频1| 久久99一区二区三区| 老汉色av国产亚洲站长工具| 黄色视频不卡| 国产在线视频一区二区| 精品少妇黑人巨大在线播放| 国产在线免费精品| 午夜福利免费观看在线| 俄罗斯特黄特色一大片| 久久人妻熟女aⅴ| a级毛片在线看网站| 汤姆久久久久久久影院中文字幕| 欧美乱妇无乱码| 亚洲天堂av无毛| 精品国产一区二区久久| 在线av久久热| 美女扒开内裤让男人捅视频| 黑人猛操日本美女一级片| 国产高清国产精品国产三级| 久久人人爽av亚洲精品天堂| 91精品国产国语对白视频| 天天躁日日躁夜夜躁夜夜| 在线 av 中文字幕| 亚洲自偷自拍图片 自拍| 热99国产精品久久久久久7| 久久精品亚洲熟妇少妇任你| 精品久久久精品久久久| 一级a爱视频在线免费观看| 激情在线观看视频在线高清 | 国产精品熟女久久久久浪| 国产精品99久久99久久久不卡| 亚洲精品一卡2卡三卡4卡5卡| 婷婷成人精品国产| 亚洲国产欧美日韩在线播放| 纯流量卡能插随身wifi吗| 老司机靠b影院| 成人国产一区最新在线观看| 伊人久久大香线蕉亚洲五| 嫩草影视91久久| 在线观看一区二区三区激情| 国产91精品成人一区二区三区 | 黄色丝袜av网址大全| 亚洲 欧美一区二区三区| 无限看片的www在线观看| 热99国产精品久久久久久7| 亚洲熟女毛片儿| 久久人人97超碰香蕉20202| 亚洲欧美色中文字幕在线| 日韩欧美一区二区三区在线观看 | 777久久人妻少妇嫩草av网站| 欧美精品啪啪一区二区三区| 精品福利观看| 蜜桃国产av成人99| 天天躁狠狠躁夜夜躁狠狠躁| 精品一品国产午夜福利视频| 超色免费av| 夜夜爽天天搞| 两性夫妻黄色片| 女警被强在线播放| 一进一出抽搐动态| 最新在线观看一区二区三区| 一级毛片电影观看| 人人妻人人添人人爽欧美一区卜| 老司机深夜福利视频在线观看| 欧美成人午夜精品| 亚洲全国av大片| 新久久久久国产一级毛片| 日韩 欧美 亚洲 中文字幕| 国产欧美日韩一区二区三| 亚洲中文av在线| 少妇裸体淫交视频免费看高清 | 国产精品自产拍在线观看55亚洲 | 成人亚洲精品一区在线观看| 狠狠婷婷综合久久久久久88av| 俄罗斯特黄特色一大片| cao死你这个sao货| 国产精品偷伦视频观看了| 日本av免费视频播放| 18禁黄网站禁片午夜丰满| 日韩一卡2卡3卡4卡2021年| 精品一区二区三区四区五区乱码| 色综合欧美亚洲国产小说| 久久人人爽av亚洲精品天堂| 亚洲av片天天在线观看| 欧美日韩av久久| 丝袜在线中文字幕| 国产xxxxx性猛交| 99国产精品免费福利视频| 国产精品.久久久| 人成视频在线观看免费观看| 最黄视频免费看| 中文字幕色久视频| 精品一区二区三区av网在线观看 | 免费看a级黄色片| 久久精品国产亚洲av香蕉五月 | 深夜精品福利| 女人久久www免费人成看片| 免费观看av网站的网址| 成人手机av| 大码成人一级视频| 中文字幕高清在线视频| 国产精品99久久99久久久不卡| 动漫黄色视频在线观看| 亚洲伊人色综图| 99精品欧美一区二区三区四区| 亚洲av第一区精品v没综合| 香蕉国产在线看| 成人国语在线视频| 我的亚洲天堂| 欧美乱码精品一区二区三区| 麻豆乱淫一区二区| 国产亚洲精品第一综合不卡| 日韩欧美一区二区三区在线观看 | 悠悠久久av| 日韩 欧美 亚洲 中文字幕| 国产午夜精品久久久久久| 天天操日日干夜夜撸| 日本wwww免费看| 久久影院123| 国产老妇伦熟女老妇高清| 国产高清视频在线播放一区| 美女午夜性视频免费| 啦啦啦 在线观看视频| 99国产精品一区二区蜜桃av | 一个人免费在线观看的高清视频| a级毛片在线看网站| bbb黄色大片| 久久ye,这里只有精品| 国产精品久久久久成人av| 999久久久精品免费观看国产| 老熟女久久久| 高清视频免费观看一区二区| 国产精品一区二区在线观看99| 久久人妻熟女aⅴ| 99精品久久久久人妻精品| 美女扒开内裤让男人捅视频| 国产成人免费无遮挡视频| 国产精品1区2区在线观看. | 亚洲av片天天在线观看| 老司机在亚洲福利影院| 在线观看人妻少妇| videosex国产| 午夜福利在线观看吧| 在线av久久热| 99精品在免费线老司机午夜| 欧美 亚洲 国产 日韩一| 美女视频免费永久观看网站| 国产亚洲精品第一综合不卡| 久久久水蜜桃国产精品网| 亚洲七黄色美女视频| 国产成人av教育| 丰满人妻熟妇乱又伦精品不卡| 中文字幕av电影在线播放| 老司机亚洲免费影院| 久久久久久久国产电影| 久热这里只有精品99| 亚洲人成伊人成综合网2020| 老司机福利观看| 精品高清国产在线一区| 一区二区三区激情视频| 在线观看一区二区三区激情| 欧美日韩中文字幕国产精品一区二区三区 | 亚洲人成电影观看| 69精品国产乱码久久久| 久久久久久亚洲精品国产蜜桃av| 制服人妻中文乱码| 大片免费播放器 马上看| 欧美成人午夜精品| 在线观看一区二区三区激情| videosex国产| 桃红色精品国产亚洲av| 在线av久久热| 亚洲av片天天在线观看| 精品国产超薄肉色丝袜足j| 午夜福利视频在线观看免费| 欧美老熟妇乱子伦牲交| 国产亚洲精品久久久久5区| 男人操女人黄网站| 777米奇影视久久| 丝袜美足系列| 超碰97精品在线观看| h视频一区二区三区| 国产成人精品在线电影| 亚洲天堂av无毛| 国产成人啪精品午夜网站| 午夜福利影视在线免费观看| 悠悠久久av| 1024香蕉在线观看| 久久免费观看电影| 国产区一区二久久| 日日夜夜操网爽| 建设人人有责人人尽责人人享有的| 精品一区二区三卡| 欧美激情高清一区二区三区| 视频区图区小说| 久久国产亚洲av麻豆专区| 久久久久久久大尺度免费视频| 国产精品国产av在线观看| 亚洲黑人精品在线| 两人在一起打扑克的视频| 中文字幕av电影在线播放| 精品一区二区三区视频在线观看免费 | 一二三四在线观看免费中文在| 在线亚洲精品国产二区图片欧美| 深夜精品福利| 亚洲精品自拍成人| 亚洲成国产人片在线观看| 精品少妇内射三级| 国产成人欧美| 国产一区二区激情短视频| 亚洲人成电影观看| 老司机福利观看| 色综合婷婷激情| 日韩免费av在线播放| 久热这里只有精品99| 国产精品av久久久久免费| 国产精品秋霞免费鲁丝片| 久久 成人 亚洲| 在线观看免费视频日本深夜| 精品视频人人做人人爽| 一二三四社区在线视频社区8| 亚洲国产精品一区二区三区在线| 亚洲精品乱久久久久久| 亚洲av成人一区二区三| 国产欧美日韩一区二区三区在线| 男女床上黄色一级片免费看| 国产黄色免费在线视频| 夫妻午夜视频| 欧美国产精品va在线观看不卡| 97在线人人人人妻| 人人妻人人澡人人爽人人夜夜| 精品国产一区二区久久| av国产精品久久久久影院| 在线观看免费视频日本深夜| 欧美黑人精品巨大| 亚洲av第一区精品v没综合| 久久精品国产99精品国产亚洲性色 | 男人舔女人的私密视频| 国产成人欧美| 国产三级黄色录像| 亚洲熟女精品中文字幕| av天堂久久9| 怎么达到女性高潮| 国产精品99久久99久久久不卡| 久久久久久人人人人人| 国产一区有黄有色的免费视频| av有码第一页| 最黄视频免费看| 亚洲欧美日韩高清在线视频 | 天天操日日干夜夜撸| 亚洲综合色网址| 757午夜福利合集在线观看| 免费黄频网站在线观看国产| 99国产综合亚洲精品| 国产国语露脸激情在线看| 亚洲中文日韩欧美视频| 精品国产亚洲在线| 美女高潮喷水抽搐中文字幕| 国产成人精品久久二区二区91| av网站在线播放免费| 无限看片的www在线观看| 久久久国产欧美日韩av| 香蕉丝袜av| 成人国产av品久久久| 纯流量卡能插随身wifi吗| 亚洲av美国av| 99香蕉大伊视频| 怎么达到女性高潮| 欧美日韩亚洲高清精品| 伊人久久大香线蕉亚洲五| 天堂动漫精品| 亚洲天堂av无毛| 99精品在免费线老司机午夜| 韩国精品一区二区三区| 午夜福利免费观看在线| 菩萨蛮人人尽说江南好唐韦庄| 久久 成人 亚洲| 嫩草影视91久久| 亚洲av日韩精品久久久久久密| 免费在线观看黄色视频的| 国产1区2区3区精品| 少妇粗大呻吟视频| 国产在线免费精品| 国产精品美女特级片免费视频播放器 | 窝窝影院91人妻| 国产精品99久久99久久久不卡| 一区二区日韩欧美中文字幕| 麻豆av在线久日| 黄色丝袜av网址大全| 在线观看66精品国产| 在线永久观看黄色视频| 国产黄色免费在线视频| 国产99久久九九免费精品| 国产亚洲av高清不卡| 久久精品熟女亚洲av麻豆精品| 国产成人精品无人区| 成年女人毛片免费观看观看9 | 精品久久久久久电影网| 中文字幕高清在线视频| 极品少妇高潮喷水抽搐| 黑丝袜美女国产一区| 777米奇影视久久| av不卡在线播放| 国产精品亚洲一级av第二区| 免费看a级黄色片| 91精品三级在线观看| 欧美日韩中文字幕国产精品一区二区三区 | videos熟女内射| 国产精品麻豆人妻色哟哟久久| 亚洲美女黄片视频| 另类亚洲欧美激情| 老司机影院毛片| 中文欧美无线码| 一级片'在线观看视频| 日日爽夜夜爽网站| 欧美日韩精品网址| 韩国精品一区二区三区| 人妻 亚洲 视频| 午夜福利在线免费观看网站| 91国产中文字幕| 熟女少妇亚洲综合色aaa.| 侵犯人妻中文字幕一二三四区| 精品人妻熟女毛片av久久网站| 国产国语露脸激情在线看| 亚洲欧美一区二区三区久久| 一个人免费看片子| 国产精品 国内视频| 多毛熟女@视频| 国产一区二区三区视频了| 纯流量卡能插随身wifi吗| 久久人妻熟女aⅴ| 夫妻午夜视频| 飞空精品影院首页| 久久中文字幕人妻熟女| 久久久久久亚洲精品国产蜜桃av| 成年人午夜在线观看视频| 他把我摸到了高潮在线观看 | 午夜福利影视在线免费观看| 日韩成人在线观看一区二区三区| 大型av网站在线播放| 狂野欧美激情性xxxx| 午夜两性在线视频| videosex国产| 精品午夜福利视频在线观看一区 | 精品亚洲成a人片在线观看| 69av精品久久久久久 | 日韩视频在线欧美| 成人手机av| 无限看片的www在线观看| 另类亚洲欧美激情| 两性夫妻黄色片| 在线观看免费高清a一片| tube8黄色片| 免费人妻精品一区二区三区视频| 一区二区三区国产精品乱码| 亚洲第一av免费看| 汤姆久久久久久久影院中文字幕| 亚洲国产中文字幕在线视频| 亚洲精品国产一区二区精华液| 另类精品久久| 大香蕉久久网| 91大片在线观看| 极品少妇高潮喷水抽搐| 亚洲人成电影观看| 色播在线永久视频| 日本精品一区二区三区蜜桃| 99久久精品国产亚洲精品| 在线观看66精品国产| 亚洲成人国产一区在线观看| 91国产中文字幕| 一本—道久久a久久精品蜜桃钙片| 国产日韩一区二区三区精品不卡| 交换朋友夫妻互换小说| 成年人黄色毛片网站| 99香蕉大伊视频| 国产成人免费无遮挡视频| 91精品三级在线观看| 国产高清videossex| 丁香欧美五月| 老司机午夜十八禁免费视频| 飞空精品影院首页| 制服诱惑二区| 女人爽到高潮嗷嗷叫在线视频| 国产精品麻豆人妻色哟哟久久| 亚洲av第一区精品v没综合| 国产aⅴ精品一区二区三区波| 极品少妇高潮喷水抽搐| 亚洲黑人精品在线| 国精品久久久久久国模美| 一本一本久久a久久精品综合妖精| 午夜激情久久久久久久| 好男人电影高清在线观看| 久9热在线精品视频| 9热在线视频观看99| 日韩欧美免费精品| 国产在线精品亚洲第一网站| 欧美黄色片欧美黄色片| 亚洲国产欧美在线一区| 久久久久久人人人人人| 91av网站免费观看| 啦啦啦中文免费视频观看日本| 蜜桃在线观看..| 一区二区av电影网| 建设人人有责人人尽责人人享有的| 欧美老熟妇乱子伦牲交| 老司机福利观看| 中文字幕高清在线视频| 久久中文看片网| 狂野欧美激情性xxxx| 自线自在国产av| 满18在线观看网站| 国产成人免费无遮挡视频| 国产午夜精品久久久久久| 国产aⅴ精品一区二区三区波| 午夜福利乱码中文字幕| 99香蕉大伊视频| 国产精品98久久久久久宅男小说| 中文字幕另类日韩欧美亚洲嫩草| 窝窝影院91人妻| 宅男免费午夜| 法律面前人人平等表现在哪些方面| 精品人妻1区二区| av福利片在线| 亚洲精品成人av观看孕妇| 精品国产一区二区三区久久久樱花| 久久人妻av系列| 成人国产一区最新在线观看| 日本a在线网址| 一本综合久久免费| 欧美日韩中文字幕国产精品一区二区三区 | 国产极品粉嫩免费观看在线| 中文亚洲av片在线观看爽 | 亚洲九九香蕉| 热re99久久国产66热| 日本黄色日本黄色录像| 久久久国产一区二区| av线在线观看网站| 国产精品秋霞免费鲁丝片| 成人特级黄色片久久久久久久 | 91麻豆av在线| 日韩制服丝袜自拍偷拍| 在线观看免费日韩欧美大片| 一级a爱视频在线免费观看| 久久99一区二区三区| 亚洲专区字幕在线| 亚洲av日韩精品久久久久久密| 91大片在线观看| 国产精品久久久人人做人人爽| 2018国产大陆天天弄谢| 国产精品麻豆人妻色哟哟久久| 性少妇av在线| 精品亚洲乱码少妇综合久久| 波多野结衣一区麻豆| 成人特级黄色片久久久久久久 | 免费久久久久久久精品成人欧美视频| 午夜福利视频在线观看免费| 如日韩欧美国产精品一区二区三区| 成年版毛片免费区| 香蕉丝袜av| 丰满少妇做爰视频| 90打野战视频偷拍视频| 午夜免费鲁丝| 国产精品免费一区二区三区在线 | 人成视频在线观看免费观看| 欧美精品啪啪一区二区三区| 国产亚洲精品久久久久5区| 一区二区三区乱码不卡18| videosex国产| 欧美乱码精品一区二区三区| 国产午夜精品久久久久久| 久久 成人 亚洲| 国产欧美亚洲国产| 精品高清国产在线一区| 在线天堂中文资源库| 啦啦啦在线免费观看视频4| 欧美黑人欧美精品刺激| 最近最新中文字幕大全电影3 | av福利片在线| 纯流量卡能插随身wifi吗| 如日韩欧美国产精品一区二区三区| 丰满饥渴人妻一区二区三| 这个男人来自地球电影免费观看| 国产精品久久久久成人av| 国产亚洲欧美在线一区二区| 黄色毛片三级朝国网站| 啦啦啦 在线观看视频| 91老司机精品| 中文字幕人妻丝袜一区二区| 国产精品一区二区在线不卡| 久久精品aⅴ一区二区三区四区| 国产精品久久电影中文字幕 | 香蕉久久夜色| 视频区欧美日本亚洲| 国产精品电影一区二区三区 | 免费在线观看完整版高清| 黄色a级毛片大全视频| 亚洲成人国产一区在线观看| 9色porny在线观看| 日韩欧美三级三区| 午夜成年电影在线免费观看| 精品一品国产午夜福利视频| 2018国产大陆天天弄谢| av欧美777| 熟女少妇亚洲综合色aaa.| 日韩欧美一区视频在线观看| av网站在线播放免费| 国产精品久久久人人做人人爽| 免费av中文字幕在线| 国产不卡av网站在线观看| 欧美大码av| 亚洲男人天堂网一区| 啦啦啦在线免费观看视频4| 亚洲精品粉嫩美女一区| 久久 成人 亚洲| 91成年电影在线观看| 在线观看舔阴道视频| 日韩视频一区二区在线观看| 夜夜骑夜夜射夜夜干|