• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于生成對(duì)抗網(wǎng)絡(luò)的多智能體對(duì)抗仿真建模方法*

    2022-03-23 09:06:18孫旭朋黃文錚
    火力與指揮控制 2022年2期
    關(guān)鍵詞:藍(lán)方紅方表演者

    白 樺,孫旭朋,黃文錚

    (北京圣濤平試驗(yàn)工程技術(shù)研究院有限責(zé)任公司,北京 100089)

    0 引言

    無(wú)人化與智能化是當(dāng)今武器裝備體系發(fā)展的一個(gè)重大技術(shù)趨勢(shì),各種無(wú)人裝備如無(wú)人飛機(jī)、無(wú)人車輛、無(wú)人艦船等陸續(xù)投入戰(zhàn)場(chǎng),以更好地建立未來(lái)的海底、海洋、陸地、空間優(yōu)勢(shì)[1-4]。無(wú)人化與智能化武器裝備通常以集群的方式參與軍事行動(dòng),通過(guò)裝備間的協(xié)同合作,發(fā)揮“倍增”的作戰(zhàn)效能。在武器裝備無(wú)人化與智能化發(fā)展過(guò)程中,人工智能相關(guān)的研究成果也不斷地應(yīng)用于體系仿真建模中。國(guó)內(nèi)外研究表明,傳統(tǒng)的建模方法(諸如還原論方法、歸納推理方法等)已經(jīng)不能很好地刻畫復(fù)雜系統(tǒng),而基于多智能體的建模則是最具活力、最有影響的方法之一。其基本思想是通過(guò)模擬現(xiàn)實(shí)世界,將復(fù)雜系統(tǒng)劃分為與之相應(yīng)的智能體,從研究個(gè)體微觀行為著手,進(jìn)而獲得系統(tǒng)宏觀行為[5]。

    在人工智能領(lǐng)域,強(qiáng)化學(xué)習(xí)為一類特定的機(jī)器學(xué)習(xí)框架,已在電動(dòng)游戲、棋盤游戲、自動(dòng)駕駛等領(lǐng)域進(jìn)行應(yīng)用[6-7],與深度神經(jīng)網(wǎng)絡(luò)結(jié)合的DQN 是其中經(jīng)常采用的建模方法。在一個(gè)強(qiáng)化學(xué)習(xí)系統(tǒng)中,決策者通過(guò)與環(huán)境的交互來(lái)學(xué)習(xí)如何得到最大化回報(bào)。強(qiáng)化學(xué)習(xí)的特點(diǎn)是在學(xué)習(xí)過(guò)程中沒(méi)有正確答案,而是通過(guò)回報(bào)信號(hào)來(lái)激勵(lì)學(xué)習(xí)。因此,在特定領(lǐng)域內(nèi),一個(gè)設(shè)計(jì)良好的強(qiáng)化學(xué)習(xí)模型經(jīng)過(guò)訓(xùn)練可以超過(guò)人類的水平,在Deepmind 的AI AlphaGo和星際爭(zhēng)霸II 的人機(jī)對(duì)抗中得到體現(xiàn)。這一特性也意味著強(qiáng)化學(xué)習(xí)具有極大的軍事應(yīng)用價(jià)值,引起美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(簡(jiǎn)稱DARPA)的高度關(guān)注,設(shè)置了多個(gè)項(xiàng)目進(jìn)行技術(shù)攻關(guān),近期“Alpha dog fight”競(jìng)賽中,深度強(qiáng)化學(xué)習(xí)模型擊敗了人類戰(zhàn)斗機(jī)駕駛員。

    GAN[8]由Ian Goodfellow 等人在2014 年提出。GAN 的核心思想是對(duì)抗性學(xué)習(xí),即同時(shí)訓(xùn)練兩個(gè)互相對(duì)抗的模型,其中,生成器G 從一個(gè)指定的隨機(jī)分布中生成樣本,而判別器D 用來(lái)分辨樣本的真實(shí)性。對(duì)抗指的是生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的互相對(duì)抗。生成網(wǎng)絡(luò)盡可能生成逼真樣本,判別網(wǎng)絡(luò)則盡可能去判別該樣本是真實(shí)樣本,還是生成的假樣本?;谶@種學(xué)習(xí)框架,GAN 不需要馬爾可夫鏈或其他復(fù)雜的概率近似推理,這對(duì)提高訓(xùn)練學(xué)習(xí)效率具有顯著作用。它使得在多智能體對(duì)抗仿真建模技術(shù)領(lǐng)域,GAN 可以在不依賴于任何關(guān)于分布假設(shè)的情況下,以一種簡(jiǎn)單的方式學(xué)習(xí)高維、復(fù)雜的真實(shí)數(shù)據(jù)分布。

    現(xiàn)代軍事對(duì)抗仿真需要模擬越來(lái)越復(fù)雜的對(duì)抗場(chǎng)景,通常需要經(jīng)過(guò)極為復(fù)雜的對(duì)抗動(dòng)作序列之后才能得出一個(gè)對(duì)抗結(jié)果。而以DQN 為代表的強(qiáng)化學(xué)習(xí)技術(shù)依賴回報(bào)信號(hào)作為反饋進(jìn)行模型訓(xùn)練。這意味著一個(gè)極高維度的神經(jīng)網(wǎng)絡(luò)模型只能依賴于極度稀疏的反饋進(jìn)行訓(xùn)練。這一特點(diǎn)與現(xiàn)代軍事對(duì)抗仿真本身具有的極高維度的狀態(tài)空間和動(dòng)作,以及動(dòng)作參數(shù)空間的疊加使得模型的訓(xùn)練效率和收斂速度成為一個(gè)極大的挑戰(zhàn)。

    在GAN 框架下,針對(duì)強(qiáng)化學(xué)習(xí)取得了進(jìn)一步發(fā)展[9-10],考慮從專家行為數(shù)據(jù)中學(xué)習(xí)策略,提出了一種新的生成對(duì)抗模仿學(xué)習(xí)通用框架,用于直接從數(shù)據(jù)中提取策略,并證明了該框架的某些實(shí)例化將模仿學(xué)習(xí)與GAN 進(jìn)行了類比,由此導(dǎo)出了一種無(wú)模型的模仿學(xué)習(xí)算法,該算法在模擬大型、高維環(huán)境中的復(fù)雜行為方面比現(xiàn)有的無(wú)模型方法獲得了顯著的性能提升。

    借鑒這一思路,可以采用GAN 作為通用框架,結(jié)合DQN 強(qiáng)化學(xué)習(xí)模型,對(duì)多智能體軍事對(duì)抗仿真模型進(jìn)行初始模仿訓(xùn)練,從專家行為回放數(shù)據(jù)中直接學(xué)習(xí)智能體行動(dòng)策略。其中,GAN 作為通用框架,其判別器網(wǎng)絡(luò)對(duì)多智能體仿真模型以及專家回放產(chǎn)生的行動(dòng)策略相似性進(jìn)行判別,這一判別結(jié)果作為多智能體強(qiáng)化學(xué)習(xí)模型的反饋信號(hào)對(duì)其進(jìn)行訓(xùn)練。由于GAN 的對(duì)抗訓(xùn)練技術(shù),且解決了強(qiáng)化學(xué)習(xí)的稀疏回報(bào)問(wèn)題,仿真模型的訓(xùn)練效率可以得到顯著提升。此外,采用這種方法得到的多智能體模型可以進(jìn)一步使用強(qiáng)化學(xué)習(xí)技術(shù),利用更高水平的人機(jī)對(duì)抗或自對(duì)弈等方式得到的數(shù)據(jù)進(jìn)行優(yōu)化訓(xùn)練,達(dá)到更高的智能水平。

    本文探討采用GAN 通用框架,構(gòu)建紅軍事對(duì)抗的多智能體模型,并進(jìn)行了仿真計(jì)算,驗(yàn)證了GAN 方法在多智能體軍事對(duì)抗仿真建模的可行性。

    1 多智能體GAN 建模方法

    1.1 總體技術(shù)框架

    為了快速建立具有高度智能的神經(jīng)網(wǎng)絡(luò)對(duì)抗策略,首先采用生成對(duì)抗網(wǎng)絡(luò)技術(shù),利用已有的高水平對(duì)抗回放數(shù)據(jù),對(duì)策略神經(jīng)網(wǎng)絡(luò)進(jìn)行快速優(yōu)化,使其能夠模仿這些回放中采用的對(duì)抗策略,達(dá)到同等智能水平。所需回放數(shù)據(jù)可以由高水平人類玩家手動(dòng)操作產(chǎn)生,或由專業(yè)技術(shù)人員編寫的已經(jīng)經(jīng)過(guò)高度優(yōu)化的自動(dòng)化對(duì)抗規(guī)則程序產(chǎn)生,只需要通過(guò)仿真引擎保存對(duì)抗回放記錄即可,無(wú)需額外的人工標(biāo)記處理。所產(chǎn)生的表演者神經(jīng)網(wǎng)絡(luò)可以直接用于智能對(duì)抗仿真,也可以通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行進(jìn)一步優(yōu)化改進(jìn)達(dá)到更高的智能水平,多智能體GAN 建??傮w技術(shù)框架如下頁(yè)圖1 所示。

    圖1 多智能體GAN 建模總體框架

    1.2 GAN 鑒別網(wǎng)絡(luò)和表演者網(wǎng)絡(luò)構(gòu)成

    生成對(duì)抗網(wǎng)絡(luò)由判別網(wǎng)絡(luò)D和表演者網(wǎng)絡(luò)A組成。其中,判別網(wǎng)絡(luò)D對(duì)輸入對(duì)抗數(shù)據(jù)進(jìn)行分類,輸出0~1 之間的標(biāo)量值判定輸入數(shù)據(jù)是否符合演示對(duì)抗策略,0 為完全符合,1 為完全不符合,因此,判別網(wǎng)絡(luò)D的優(yōu)化目標(biāo)是盡可能對(duì)所有數(shù)據(jù)進(jìn)行準(zhǔn)確判別。表演者網(wǎng)絡(luò)A讀取對(duì)抗態(tài)勢(shì)(環(huán)境)數(shù)據(jù),產(chǎn)生在這種態(tài)勢(shì)下應(yīng)采取的對(duì)抗命令,表演者網(wǎng)絡(luò)A的目標(biāo)是盡可能準(zhǔn)確地模仿演示對(duì)抗策略,也意味著盡可能欺騙判別網(wǎng)絡(luò)D使其無(wú)法區(qū)分對(duì)抗數(shù)據(jù)是來(lái)由演示玩家產(chǎn)生還是由表演者網(wǎng)絡(luò)產(chǎn)生。因此,判別網(wǎng)絡(luò)D和表演者網(wǎng)絡(luò)A形成對(duì)抗關(guān)系,對(duì)這兩個(gè)網(wǎng)絡(luò)的交替訓(xùn)練,當(dāng)這兩個(gè)網(wǎng)絡(luò)達(dá)到平衡時(shí),判別網(wǎng)絡(luò)D以接近同等概率對(duì)演示對(duì)抗數(shù)據(jù)和表演者網(wǎng)絡(luò)產(chǎn)生的對(duì)抗數(shù)據(jù)進(jìn)行判別(即無(wú)法有效分辨二者的差別,理想情況下期望該值為0.5,意味著判別網(wǎng)絡(luò)完全無(wú)法分辨),此時(shí)表演者網(wǎng)絡(luò)A學(xué)到了接近于演示玩家的對(duì)抗策略。

    首先需要從仿真引擎獲取多輪演示對(duì)抗回放數(shù)據(jù)保存在回放緩存中。回放緩存中的每個(gè)樣本點(diǎn)為一個(gè)對(duì)抗步驟數(shù)據(jù),包括聯(lián)合對(duì)抗態(tài)勢(shì)S和演示者對(duì)抗命令列表a,演示對(duì)抗回放采集及數(shù)據(jù)結(jié)構(gòu)如圖2 所示。

    圖2 演示對(duì)抗回放采集及數(shù)據(jù)結(jié)構(gòu)

    1.3 損失函數(shù)的構(gòu)造

    采集到回放數(shù)據(jù)以后即可采用生成對(duì)抗網(wǎng)絡(luò)技術(shù)對(duì)判別網(wǎng)絡(luò)D和表演者網(wǎng)絡(luò)A進(jìn)行對(duì)輪交替訓(xùn)練,使表演者網(wǎng)絡(luò)A學(xué)習(xí)到演示者采用的對(duì)抗策略。訓(xùn)練過(guò)程如下頁(yè)圖3 所示。

    圖3 GAN 對(duì)抗訓(xùn)練算法流程

    其中,判別網(wǎng)絡(luò)D的損失為演示樣本與模仿樣本的判別損失總和:

    演示樣本判別損失Dloss-expert和Dloss-learner分別為判別網(wǎng)絡(luò)D對(duì)演示樣本和模仿樣本的實(shí)際輸出與預(yù)期輸出的交叉熵。演示樣本應(yīng)被判別為完全符合演示對(duì)抗策略,因此,預(yù)期輸出應(yīng)為0;模仿樣本應(yīng)被判別為完全不符合演示對(duì)抗策略,因此,預(yù)期輸出應(yīng)為1。

    交叉熵BCELoss[10]計(jì)算公式如下:

    因此,判別網(wǎng)絡(luò)D損失計(jì)算函數(shù)為:

    其中,∏E為演示樣本,∏L為模仿樣本。

    判別網(wǎng)絡(luò)D的優(yōu)化目標(biāo)是最小化總體判別損失。判別網(wǎng)絡(luò)D是典型的二元分類神經(jīng)網(wǎng)絡(luò),輸入為聯(lián)合對(duì)抗態(tài)勢(shì)+對(duì)抗命令列表的張量編碼,輸出為0~1 二元分類標(biāo)量,其網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)規(guī)??梢钥紤]輸入數(shù)據(jù)特點(diǎn)進(jìn)行選擇,通??梢圆捎美缇矸e網(wǎng)絡(luò)CNN 或多層感知機(jī)MLP 等,參數(shù)維度和網(wǎng)絡(luò)深度可以根據(jù)輸入數(shù)據(jù)屬性的數(shù)目和關(guān)聯(lián)關(guān)系復(fù)雜性進(jìn)行調(diào)整選擇。

    表演者網(wǎng)絡(luò)A的結(jié)構(gòu)設(shè)計(jì)與強(qiáng)化學(xué)習(xí)中表演者網(wǎng)絡(luò)設(shè)計(jì)類似,可以根據(jù)輸入輸出特點(diǎn)選擇卷積網(wǎng)絡(luò)CNN 或多層感知機(jī)MLP 等進(jìn)行構(gòu)造,輸入輸出維度以及網(wǎng)絡(luò)深度等參數(shù)需要考慮仿真數(shù)據(jù)特點(diǎn)進(jìn)行選擇調(diào)整。不同種類的Agent,以下標(biāo)i表示,同一種類的Agent 有不同的數(shù)量,以下標(biāo)j表示。

    表演者網(wǎng)絡(luò)A的回報(bào)計(jì)算公式:

    表演者網(wǎng)絡(luò)A的優(yōu)化目標(biāo)是最大化回報(bào)。

    表演者網(wǎng)絡(luò)A的損失計(jì)算函數(shù):

    其中,pd為由表演者網(wǎng)絡(luò)A輸出的參數(shù)構(gòu)造的對(duì)抗命令參數(shù)概率分布,pd采用的概率分布類型可以根據(jù)參數(shù)特點(diǎn)進(jìn)行選擇,對(duì)離散參數(shù)例如命令類型可以采用Categorical[11]分布等,對(duì)連續(xù)參數(shù)例如坐標(biāo)點(diǎn)x,y可以采用Normal 分布等。action 為從構(gòu)造的概率分布取樣獲得的命令參數(shù)取值。log_prob 為概率分布在action 取值的樣本點(diǎn)的log 概率密度,entropy[11]為概率分布的熵。β為超參數(shù),控制最大熵目標(biāo)在表演者網(wǎng)絡(luò)損失中的占比,在訓(xùn)練時(shí)根據(jù)訓(xùn)練狀況進(jìn)行調(diào)整。

    表演者網(wǎng)絡(luò)A類似強(qiáng)化學(xué)習(xí)中的表演者網(wǎng)絡(luò),其輸入為聯(lián)合對(duì)抗態(tài)勢(shì)的張量編碼,輸出為可用于構(gòu)造對(duì)抗命令列表的概率分布參數(shù)。自動(dòng)化對(duì)抗程序?qū)⒏鶕?jù)表演者網(wǎng)絡(luò)A的輸出構(gòu)造對(duì)抗命令參數(shù)概率分布pd,從pd取樣獲取對(duì)抗命令參數(shù),最后按照對(duì)抗仿真引擎所需的接口格式,轉(zhuǎn)換為對(duì)抗命令列表輸入到對(duì)抗仿真引擎。

    2 仿真平臺(tái)設(shè)置

    本文以中央軍委裝備發(fā)展部主辦的2020 全國(guó)“謀略方寸,聯(lián)合智勝”聯(lián)合作戰(zhàn)智能博弈挑戰(zhàn)賽[12]提供的仿真環(huán)境為應(yīng)用場(chǎng)景,在此基礎(chǔ)上,基于生成對(duì)抗網(wǎng)絡(luò)建立多智能體對(duì)抗仿真模型,并對(duì)模型進(jìn)行訓(xùn)練和測(cè)試。

    2.1 對(duì)抗場(chǎng)景

    藍(lán)方目標(biāo)(防守方):依托地面、海面和空中立體防空火力,守衛(wèi)己方島嶼2 個(gè)指揮所重點(diǎn)目標(biāo)。紅方目標(biāo)(進(jìn)攻方):綜合運(yùn)用海空突擊和支援保障力量,突破藍(lán)方防空體系,摧毀藍(lán)方2 個(gè)指揮所重點(diǎn)目標(biāo)。雙方對(duì)抗單局仿真時(shí)間為2.5 h,實(shí)現(xiàn)目標(biāo)的一方得分。如果紅方在仿真時(shí)長(zhǎng)內(nèi)僅摧毀藍(lán)方的1 個(gè)指揮所,則有相應(yīng)的計(jì)分方法計(jì)算各自的剩余兵力,多者勝。

    2.2 仿真環(huán)境

    仿真引擎以容器的形式運(yùn)行,通過(guò)容器的虛擬端口進(jìn)行調(diào)用。各裝備底層控制律由仿真引擎操作,仿真環(huán)境接口僅提供高級(jí)命令語(yǔ)法包括命令種類和命令參數(shù)。例如戰(zhàn)斗機(jī)的攻擊指令,包括攻擊戰(zhàn)斗機(jī)的ID和被攻擊空中目標(biāo)的ID;轟炸機(jī)的定點(diǎn)攻擊指令包括攻擊轟炸機(jī)的ID、被攻擊地面目標(biāo)的ID、攻擊角度的攻擊距離。各Agent 的控制律、攻擊毀傷概率等為黑盒。

    仿真環(huán)境的對(duì)戰(zhàn)調(diào)度程序[11]如下頁(yè)圖4 所示,仿真環(huán)境提供Python 語(yǔ)言開(kāi)發(fā)的對(duì)戰(zhàn)流程控制,參與者負(fù)責(zé)開(kāi)發(fā)的程序?yàn)閳D中“決策并下發(fā)指令”,而作為制定決策的輸入為“獲取態(tài)勢(shì)”。獲取的態(tài)勢(shì)主要包括3 個(gè)方面的信息,一為己方信息,包括各agent 的種類、空間位置和速度信息、載彈量和燃油量信息、毀傷狀態(tài)信息等;二為對(duì)方信息,僅提供戰(zhàn)爭(zhēng)迷霧可視范圍內(nèi)的敵方Agent 種類、空間位置和速度等信息;三為導(dǎo)彈信息,包括雙方發(fā)射導(dǎo)彈的種類、發(fā)射裝備、攻擊目標(biāo)、速度等信息。

    圖4 仿真環(huán)境對(duì)戰(zhàn)調(diào)度程序

    2.3 仿真模型

    本文以仿真平臺(tái)提供的Python 語(yǔ)言開(kāi)發(fā)框架為基礎(chǔ)開(kāi)發(fā)仿真模型。仿真模型中戰(zhàn)場(chǎng)環(huán)境模型,對(duì)戰(zhàn)參與方數(shù)量,每個(gè)參與方的Agent 組成,每個(gè)Agent 的行為能力,Agent 的探測(cè)、通信、攻擊和毀傷效果計(jì)算均由仿真引擎控制,并通過(guò)Python 語(yǔ)言仿真調(diào)度框架進(jìn)行調(diào)度,調(diào)度框架在每個(gè)時(shí)間步驟向參與者提供的智能體決策程序提供態(tài)勢(shì)數(shù)據(jù)并獲取決策程序返回的對(duì)戰(zhàn)指令列表作為輸入。

    仿真模型的戰(zhàn)場(chǎng)環(huán)境為350 km×350 km 的對(duì)抗空間。戰(zhàn)場(chǎng)中心為坐標(biāo)原點(diǎn),向右為x軸正軸,向上為y軸正軸,紅方島嶼機(jī)場(chǎng)坐標(biāo)為(146 700 m,-3 000 m),藍(lán)方北部島嶼指揮所坐標(biāo)為(-129 532m,87 667m),藍(lán)方南部島嶼指揮所坐標(biāo)為(-131 154m,-87 888m),對(duì)抗地圖[12]如圖5 所示。

    圖5 紅藍(lán)雙方對(duì)抗地圖

    仿真模型中對(duì)抗雙方的Agent 組成即雙方對(duì)抗兵力組成如表1 所示。

    表1 紅藍(lán)雙方對(duì)抗兵力

    對(duì)抗雙方相同類型的Agent 具有完全相同的行為模型。每種類型的Agent 能夠接受的指令及每個(gè)指令的參數(shù)可以參考仿真平臺(tái)提供的開(kāi)發(fā)白皮書。

    探測(cè)模型采用戰(zhàn)爭(zhēng)迷霧設(shè)置,即每種類型的Agent 具有一定的發(fā)現(xiàn)和識(shí)別范圍,只有進(jìn)入Agent發(fā)現(xiàn)范圍的敵方Agent 才會(huì)出現(xiàn)在己方情報(bào)信息列表中,標(biāo)記為“未知”狀態(tài);只有進(jìn)入Agent 識(shí)別范圍的敵方Agent 才會(huì)在己方情報(bào)列表中具有明確識(shí)別的軍別和詳細(xì)狀態(tài)信息。其中,電子戰(zhàn)飛機(jī)對(duì)探測(cè)模型具有特殊影響,仿真模型中的電子戰(zhàn)飛機(jī)設(shè)定為阻塞模式,即當(dāng)電子戰(zhàn)飛機(jī)開(kāi)啟干擾時(shí)其干擾范圍內(nèi)的Agent 對(duì)對(duì)抗雙方均處于不可見(jiàn)狀態(tài)。探測(cè)狀態(tài)由仿真引擎根據(jù)Agent 狀態(tài)進(jìn)行自動(dòng)計(jì)算,決策程序不需要顯示發(fā)送探測(cè)或識(shí)別指令。

    仿真模型中Agent 之間的通信為己方完全通信模式,即己方所有Agent 之間的信息完全自動(dòng)共享。

    雙方的攻擊手段為發(fā)射導(dǎo)彈,其中的戰(zhàn)斗機(jī)發(fā)射空空導(dǎo)彈、轟炸機(jī)發(fā)射空地導(dǎo)彈、驅(qū)逐艦發(fā)射艦空導(dǎo)彈、地導(dǎo)營(yíng)發(fā)射地空導(dǎo)彈。仿真模型中每個(gè)Agent 的攻擊指令發(fā)出后攻擊成功的概率由仿真引擎控制,對(duì)參與者不可見(jiàn),參與者無(wú)法干預(yù)。每種類型的Agent 攜帶的攻擊武器類型,武器數(shù)量和攻擊能力各不相同,其模型由仿真引擎控制。每種類型的Agent 受到攻擊后的毀傷程度,對(duì)Agent 作戰(zhàn)能力的影響各不相同,由仿真引擎控制。

    3 實(shí)例仿真建模與分析

    3.1 GAN 模型構(gòu)建

    為簡(jiǎn)單起見(jiàn),主要介紹紅方模型的構(gòu)建,編程語(yǔ)言框架為Pytorch。首先構(gòu)建判別器D神經(jīng)網(wǎng)絡(luò)模型,采用全連接線性模型,輸入量為聯(lián)合態(tài)勢(shì)與聯(lián)合動(dòng)作拼接成的向量,輸出為0~1 之間的標(biāo)量,表示Agent 行為符合演示對(duì)戰(zhàn)策略的概率,0 表示完全符合,1 表示完全不符合,中間層由全連接線性網(wǎng)絡(luò)和雙線性網(wǎng)絡(luò)組合后構(gòu)成。聯(lián)合態(tài)勢(shì)由己方態(tài)勢(shì)、敵方態(tài)勢(shì)以及導(dǎo)彈態(tài)勢(shì)構(gòu)成,判別器網(wǎng)絡(luò)的輸入數(shù)據(jù)結(jié)構(gòu)如表2 所示,表中的Nb為批樣本數(shù)量、Ns為己方Agent 數(shù)量、Nt為敵方Agent 數(shù)量、Nm為發(fā)射的導(dǎo)彈數(shù)量、Nc為己方Agent 動(dòng)作命令數(shù)量。為了確保神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)不發(fā)生崩潰,對(duì)于所有的網(wǎng)絡(luò)輸入數(shù)據(jù)均進(jìn)行歸一化處理,并且對(duì)于取值為0 的數(shù)據(jù)填充為ε小量。

    表2 判別器網(wǎng)絡(luò)輸入數(shù)據(jù)結(jié)構(gòu)

    判別器網(wǎng)絡(luò)主要有兩路通道,其中一路是將多Agent 的己方態(tài)勢(shì)和導(dǎo)彈態(tài)勢(shì)數(shù)據(jù)拼接后輸入一個(gè)雙線性網(wǎng)絡(luò),敵方態(tài)勢(shì)數(shù)據(jù)輸入另一個(gè)雙線性網(wǎng)絡(luò),兩者的輸出經(jīng)過(guò)拼接后再經(jīng)過(guò)一個(gè)雙線性網(wǎng)絡(luò);另一路是動(dòng)作命令信息經(jīng)過(guò)全連接線性網(wǎng)絡(luò)輸出后與第1 路輸出拼接,在經(jīng)過(guò)一個(gè)全連接線性網(wǎng)絡(luò)最后輸出為1 維。判別器網(wǎng)絡(luò)結(jié)構(gòu)如圖6 所示。網(wǎng)絡(luò)損失函數(shù)的設(shè)置參照式(4),優(yōu)化方法為Adam。

    圖6 判別器網(wǎng)絡(luò)結(jié)構(gòu)

    在表演者網(wǎng)絡(luò)的構(gòu)造中,同一類型的Agent 共享相同的神經(jīng)網(wǎng)絡(luò)參數(shù),采用全連接線性網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)輸入為聯(lián)合態(tài)勢(shì),網(wǎng)絡(luò)輸出為動(dòng)作命令,表演者網(wǎng)絡(luò)結(jié)構(gòu)如圖7 所示。網(wǎng)絡(luò)輸出根據(jù)動(dòng)作命令類型進(jìn)行隨機(jī)采樣,其中,分類指令參數(shù)如攻擊ID號(hào)等的采樣器為Categorical,連續(xù)指令參數(shù)如攻擊距離等的采樣器為Normal。表演者網(wǎng)絡(luò)的損失函數(shù)如式(6)所示,優(yōu)化方法為Adam。

    圖7 表演者網(wǎng)絡(luò)結(jié)構(gòu)

    3.2 演示者數(shù)據(jù)的產(chǎn)生

    為進(jìn)行GAN 訓(xùn)練,需要輸入演示者數(shù)據(jù)。在仿真平臺(tái)未提供相關(guān)對(duì)抗的歷史數(shù)據(jù)的情況下,通過(guò)編寫紅藍(lán)雙方的規(guī)則對(duì)抗模型,并進(jìn)行多局對(duì)抗的方式來(lái)記錄數(shù)據(jù),記錄的數(shù)據(jù)即包括紅方聯(lián)合態(tài)勢(shì)數(shù)據(jù)也包括紅方動(dòng)作命令數(shù)據(jù)。共選取紅藍(lán)對(duì)抗的50 輪次對(duì)戰(zhàn)樣本,平均輪次約300 個(gè)采樣點(diǎn)數(shù)據(jù)。統(tǒng)計(jì)規(guī)則模型紅方勝率為0.84。規(guī)則對(duì)抗模型的主要設(shè)計(jì)規(guī)則為:

    紅方Agent 規(guī)則:

    1)兩艘防空驅(qū)逐艦分別初始化在紅方島嶼與藍(lán)方兩個(gè)島連線與中軸線交點(diǎn)處,對(duì)進(jìn)入艦載防空導(dǎo)彈射程(100 km)內(nèi)的藍(lán)方目標(biāo)進(jìn)行無(wú)差別攻擊;

    2)戰(zhàn)斗機(jī)以密集隊(duì)形在初始3 min 內(nèi)起飛,在藍(lán)方島嶼附近對(duì)空中目標(biāo)進(jìn)行跟蹤,并派遣距離最近的戰(zhàn)斗機(jī)進(jìn)行一對(duì)一攔截;

    3)預(yù)警機(jī)以自我保全為優(yōu)先任務(wù),在敵方射程之外前提下并盡可能靠近敵方島嶼偵查;

    4)轟炸機(jī)編隊(duì)以南島指揮所至北島指揮所的順序進(jìn)行攻擊,攻擊距離80 km,根據(jù)與目標(biāo)相對(duì)位置計(jì)算攻擊角度;

    5)電子戰(zhàn)飛機(jī)跟隨轟炸機(jī)編隊(duì)進(jìn)行干擾;

    6)一旦探測(cè)到攻擊的導(dǎo)彈后,被攻擊飛機(jī)暫時(shí)中斷任務(wù)進(jìn)行規(guī)避操作直到威脅解除,規(guī)避方向?yàn)榫嚯x最近的攻擊導(dǎo)彈的反方向。

    藍(lán)方Agent 規(guī)則:

    1)防空驅(qū)逐艦隨機(jī)初始化在己方兩個(gè)島附近,對(duì)進(jìn)入艦載防空導(dǎo)彈射程(100 km)內(nèi)的藍(lán)方目標(biāo)進(jìn)行無(wú)差別攻擊;

    2)戰(zhàn)斗機(jī)以密集隊(duì)形在初始3 min 內(nèi)起飛,在南島和北島之間的預(yù)設(shè)空域進(jìn)行巡航,對(duì)發(fā)現(xiàn)的空中目標(biāo)派遣距離最近的戰(zhàn)斗機(jī)進(jìn)行一對(duì)一攔截;

    3)預(yù)警機(jī)以自我保全為優(yōu)先任務(wù),在敵方射程之外前提下擴(kuò)大偵查范圍;

    4)轟炸機(jī)編隊(duì)以最近的紅方驅(qū)逐艦為目標(biāo)進(jìn)行攻擊,攻擊距離80 km,根據(jù)與目標(biāo)相對(duì)位置計(jì)算攻擊角度;

    5)飛機(jī)的導(dǎo)彈規(guī)避算法與紅方相同。

    3.3 模型的訓(xùn)練

    按上節(jié)的規(guī)則模型,產(chǎn)生演示者數(shù)據(jù)。考慮到規(guī)則模型中通常一個(gè)動(dòng)作命令會(huì)控制Agent 多步驟的行為直到Agent 接受另一個(gè)動(dòng)作命令,對(duì)命令轉(zhuǎn)換前的空白動(dòng)作命令進(jìn)行了填充。將處理好的演示者數(shù)據(jù)存入回放數(shù)據(jù)文件供GAN 模型訓(xùn)練。

    表演者網(wǎng)絡(luò)模型訓(xùn)練的時(shí)候,按照批樣本數(shù)量為500 從回放數(shù)據(jù)文件中進(jìn)行隨機(jī)取樣。根據(jù)采樣得到的聯(lián)合態(tài)勢(shì)數(shù)據(jù),運(yùn)行表演者網(wǎng)絡(luò),根據(jù)網(wǎng)絡(luò)輸出進(jìn)行隨機(jī)采樣后,生成表演者動(dòng)作列表,將該動(dòng)作列表與輸入的聯(lián)合態(tài)勢(shì)進(jìn)行組合,生成模仿樣本數(shù)據(jù),同時(shí)記錄抽樣概率log_prob和entropy。

    判別器網(wǎng)絡(luò)模型訓(xùn)練時(shí),回放數(shù)據(jù)文件中的聯(lián)合態(tài)勢(shì)和相應(yīng)的動(dòng)作命令,組合成為演示樣本數(shù)據(jù)輸入到判別器網(wǎng)絡(luò),計(jì)算演示樣本的損失函數(shù);模仿樣本數(shù)據(jù)輸入到判別器網(wǎng)絡(luò),計(jì)算模仿樣本的損失函數(shù),總損失函數(shù)如式(4)所示。訓(xùn)練進(jìn)行了256 輪次,得到的網(wǎng)絡(luò)性能統(tǒng)計(jì)曲線如圖8 所示。從圖中可以看出,在80 輪次左右,回報(bào)值達(dá)到極值,此時(shí)表演者網(wǎng)絡(luò)的損失函數(shù)達(dá)到極小值,而演示樣本和模仿樣本的鑒別率達(dá)到穩(wěn)定值。訓(xùn)練過(guò)了80 輪次之后,回報(bào)值開(kāi)始下降而表演者網(wǎng)絡(luò)的損失函數(shù)進(jìn)入震蕩區(qū)間,顯示網(wǎng)絡(luò)進(jìn)入了過(guò)擬合階段,分析原因主要是用于訓(xùn)練的回放數(shù)據(jù)只選用固定的一組規(guī)則模型進(jìn)行對(duì)抗的原因,在對(duì)抗模式上缺少多樣性。

    圖8 網(wǎng)絡(luò)訓(xùn)練性能統(tǒng)計(jì)曲線

    3.4 模型的測(cè)試

    選取80 輪次訓(xùn)練量得到的表演者網(wǎng)絡(luò)模型與產(chǎn)生回放數(shù)據(jù)的藍(lán)方規(guī)則模型進(jìn)行對(duì)局,得到紅方勝率為0.86,表演者網(wǎng)絡(luò)的作戰(zhàn)效能達(dá)到了所模仿的紅方規(guī)則模型。

    另外,為了測(cè)試GAN 建模學(xué)習(xí)效率,紅方建立圖7 所示的神經(jīng)模型,并隨機(jī)初始化網(wǎng)絡(luò)參數(shù),按照DQN 的框架與藍(lán)方的規(guī)則模型進(jìn)行訓(xùn)練。由于狀態(tài)空間和動(dòng)作空間數(shù)量巨大,模型難以快速收斂,在5 000 輪次學(xué)習(xí)后,紅方DQN 模型的勝率約為0.5,學(xué)習(xí)速率已變得平緩。主要表現(xiàn)在紅方轟炸機(jī)的攻擊距離和攻擊角度等參數(shù)未得到好的優(yōu)化,攻擊效率較差。

    4 結(jié)論

    本文借鑒GAN 建模方法,在2020 全國(guó)“謀略方寸,聯(lián)合智勝”聯(lián)合作戰(zhàn)仿真環(huán)境上進(jìn)行了多智能體強(qiáng)對(duì)抗神經(jīng)網(wǎng)絡(luò)建模。利用規(guī)則模型產(chǎn)生的回放數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)模型的訓(xùn)練,對(duì)網(wǎng)絡(luò)模型的學(xué)習(xí)特性進(jìn)行了分析。通過(guò)模型的測(cè)試,顯示出基于生成對(duì)抗網(wǎng)絡(luò)的多智能體對(duì)抗仿真建模方法具有較高的學(xué)習(xí)效率,未來(lái)在體系對(duì)抗快速建模和建立假想敵仿真模型方面具有實(shí)用價(jià)值。

    猜你喜歡
    藍(lán)方紅方表演者
    如何在方格紙上確定位置
    精彩的足球比賽
    暗號(hào)
    妙猜兩數(shù)
    暗號(hào)
    暗號(hào)
    試論棋例裁決難點(diǎn)
    棋藝(2014年3期)2014-05-29 14:27:14
    2012年龍年網(wǎng)絡(luò)春晚節(jié)目單
    小品文選刊(2012年6期)2012-05-08 04:43:11
    論表演者權(quán)體系*
    聰明的表演者
    2018国产大陆天天弄谢| 亚洲伊人久久精品综合| 午夜福利网站1000一区二区三区| 另类亚洲欧美激情| 天天躁夜夜躁狠狠躁躁| 午夜91福利影院| 午夜久久久在线观看| freevideosex欧美| 国产成人精品在线电影| 国产一区有黄有色的免费视频| 久久精品夜色国产| 一二三四中文在线观看免费高清| xxx大片免费视频| 国产精品无大码| 波野结衣二区三区在线| 久久婷婷青草| 亚洲精品国产av蜜桃| 男人爽女人下面视频在线观看| 黑人欧美特级aaaaaa片| 中文字幕色久视频| 国产精品成人在线| 亚洲第一区二区三区不卡| 亚洲精品一二三| 亚洲av在线观看美女高潮| 美女国产高潮福利片在线看| 黄色怎么调成土黄色| 成年女人毛片免费观看观看9 | 啦啦啦在线观看免费高清www| 亚洲熟女精品中文字幕| 久久人妻熟女aⅴ| 国产欧美亚洲国产| 一区福利在线观看| 精品99又大又爽又粗少妇毛片| 曰老女人黄片| 国精品久久久久久国模美| 一边亲一边摸免费视频| 人人妻人人澡人人看| 边亲边吃奶的免费视频| 伦理电影大哥的女人| 成年动漫av网址| 日韩制服丝袜自拍偷拍| 丝袜脚勾引网站| 免费观看性生交大片5| 高清av免费在线| 五月伊人婷婷丁香| 亚洲av男天堂| 欧美国产精品一级二级三级| 少妇被粗大猛烈的视频| 一级片免费观看大全| 国产有黄有色有爽视频| 99re6热这里在线精品视频| 国产免费又黄又爽又色| 久热久热在线精品观看| 男人爽女人下面视频在线观看| 午夜福利视频精品| 国产亚洲最大av| 一级毛片 在线播放| 日本午夜av视频| 亚洲激情五月婷婷啪啪| 国产免费福利视频在线观看| 亚洲经典国产精华液单| a级片在线免费高清观看视频| 亚洲欧美色中文字幕在线| 狠狠精品人妻久久久久久综合| 在线免费观看不下载黄p国产| 婷婷色综合www| 亚洲精品av麻豆狂野| 国产高清国产精品国产三级| 日韩大片免费观看网站| 欧美bdsm另类| 大香蕉久久成人网| 美女大奶头黄色视频| 国产av精品麻豆| 亚洲精品美女久久av网站| 久热这里只有精品99| 精品亚洲成a人片在线观看| 丝袜在线中文字幕| 久久久久国产精品人妻一区二区| 婷婷色综合www| 男男h啪啪无遮挡| 国产精品女同一区二区软件| www.熟女人妻精品国产| 亚洲精品乱久久久久久| 久久精品国产自在天天线| 1024视频免费在线观看| 狠狠婷婷综合久久久久久88av| 久久久久国产网址| a级片在线免费高清观看视频| 精品一品国产午夜福利视频| 涩涩av久久男人的天堂| 18禁观看日本| 亚洲精品中文字幕在线视频| 少妇熟女欧美另类| 色婷婷久久久亚洲欧美| 午夜福利影视在线免费观看| 美女福利国产在线| 久久人人爽av亚洲精品天堂| 男女国产视频网站| 亚洲国产欧美在线一区| 久久久久久伊人网av| 26uuu在线亚洲综合色| 久久精品亚洲av国产电影网| 日韩一本色道免费dvd| av网站免费在线观看视频| 亚洲一码二码三码区别大吗| 欧美日韩一区二区视频在线观看视频在线| 国产在线免费精品| 亚洲成av片中文字幕在线观看 | 高清黄色对白视频在线免费看| 国产有黄有色有爽视频| 国产高清不卡午夜福利| 看十八女毛片水多多多| 在线精品无人区一区二区三| 亚洲视频免费观看视频| 18+在线观看网站| 国产精品国产av在线观看| 久久精品熟女亚洲av麻豆精品| 老女人水多毛片| 国产亚洲精品第一综合不卡| 丰满饥渴人妻一区二区三| 男男h啪啪无遮挡| 国产精品久久久久久av不卡| 最近中文字幕高清免费大全6| 在线观看美女被高潮喷水网站| 9色porny在线观看| 精品第一国产精品| 国产精品一区二区在线不卡| 国产视频首页在线观看| 欧美精品av麻豆av| 国产精品一区二区在线不卡| 在线观看国产h片| 成人18禁高潮啪啪吃奶动态图| 国产精品一区二区在线不卡| 91久久精品国产一区二区三区| 欧美中文综合在线视频| www.熟女人妻精品国产| 激情五月婷婷亚洲| 免费av中文字幕在线| 多毛熟女@视频| 大片电影免费在线观看免费| 日韩中文字幕视频在线看片| 精品久久蜜臀av无| 欧美精品国产亚洲| 男女边吃奶边做爰视频| 久久久精品94久久精品| 国产精品一区二区在线不卡| 两个人看的免费小视频| 一区二区三区四区激情视频| 久久青草综合色| 啦啦啦中文免费视频观看日本| av在线播放精品| 美女福利国产在线| 久久精品国产综合久久久| av国产久精品久网站免费入址| 人妻人人澡人人爽人人| 2021少妇久久久久久久久久久| 在现免费观看毛片| 日本欧美国产在线视频| 女性被躁到高潮视频| 久久久久国产精品人妻一区二区| 秋霞在线观看毛片| 久久久久久免费高清国产稀缺| 飞空精品影院首页| 亚洲少妇的诱惑av| 国产成人精品一,二区| 久久这里有精品视频免费| 欧美+日韩+精品| 欧美激情极品国产一区二区三区| 伦理电影大哥的女人| 国产av码专区亚洲av| 国产成人精品无人区| 国产精品成人在线| 免费播放大片免费观看视频在线观看| 日韩一卡2卡3卡4卡2021年| 久久久久视频综合| 大片电影免费在线观看免费| 丰满乱子伦码专区| 久久午夜综合久久蜜桃| 亚洲 欧美一区二区三区| 91精品国产国语对白视频| av电影中文网址| 老司机影院成人| 久久人人爽人人片av| 国产一级毛片在线| 亚洲少妇的诱惑av| 一区福利在线观看| 高清视频免费观看一区二区| 久久精品人人爽人人爽视色| 欧美xxⅹ黑人| 亚洲av中文av极速乱| 波多野结衣一区麻豆| 久久久精品国产亚洲av高清涩受| 日韩中文字幕视频在线看片| 欧美少妇被猛烈插入视频| 天堂8中文在线网| 亚洲国产欧美网| 久久精品夜色国产| 欧美成人精品欧美一级黄| 亚洲国产精品国产精品| 男女无遮挡免费网站观看| 欧美激情 高清一区二区三区| 欧美激情极品国产一区二区三区| 大陆偷拍与自拍| 亚洲av欧美aⅴ国产| 大香蕉久久成人网| 亚洲国产av影院在线观看| 精品久久蜜臀av无| 成人影院久久| 日日爽夜夜爽网站| 男人爽女人下面视频在线观看| 成人二区视频| 国产亚洲精品第一综合不卡| 精品人妻在线不人妻| 精品人妻熟女毛片av久久网站| 老司机影院毛片| 人成视频在线观看免费观看| 免费人妻精品一区二区三区视频| 亚洲av成人精品一二三区| 一级片'在线观看视频| 成人漫画全彩无遮挡| 啦啦啦视频在线资源免费观看| 欧美国产精品va在线观看不卡| 亚洲精品中文字幕在线视频| 久久久国产一区二区| 国产精品嫩草影院av在线观看| 天堂俺去俺来也www色官网| 伊人久久大香线蕉亚洲五| 欧美在线黄色| 亚洲在久久综合| 亚洲欧美精品自产自拍| freevideosex欧美| 一区二区av电影网| 有码 亚洲区| 久久97久久精品| 男人爽女人下面视频在线观看| 18禁动态无遮挡网站| 久久精品aⅴ一区二区三区四区 | 午夜日本视频在线| 久久精品国产自在天天线| 国产亚洲欧美精品永久| 国产av国产精品国产| a级毛片黄视频| 男人舔女人的私密视频| 久久精品aⅴ一区二区三区四区 | 中文字幕人妻熟女乱码| 中文精品一卡2卡3卡4更新| 日本av手机在线免费观看| www日本在线高清视频| 在线亚洲精品国产二区图片欧美| 成年女人在线观看亚洲视频| 在线精品无人区一区二区三| 大话2 男鬼变身卡| 日韩中字成人| 777米奇影视久久| av在线播放精品| 国产精品99久久99久久久不卡 | 香蕉精品网在线| 日韩电影二区| 五月开心婷婷网| 一级,二级,三级黄色视频| 桃花免费在线播放| 国产亚洲最大av| 丰满少妇做爰视频| 精品少妇一区二区三区视频日本电影 | 人体艺术视频欧美日本| 这个男人来自地球电影免费观看 | 久久久精品国产亚洲av高清涩受| 亚洲欧洲精品一区二区精品久久久 | 免费高清在线观看日韩| 亚洲精品,欧美精品| 大码成人一级视频| 91精品国产国语对白视频| 久久久久国产精品人妻一区二区| 极品少妇高潮喷水抽搐| 亚洲久久久国产精品| 人成视频在线观看免费观看| 极品人妻少妇av视频| 亚洲国产精品一区三区| 色婷婷久久久亚洲欧美| 国产深夜福利视频在线观看| 久久av网站| 日本-黄色视频高清免费观看| 国产欧美日韩综合在线一区二区| 一级毛片电影观看| 高清欧美精品videossex| 久久久久久久国产电影| 宅男免费午夜| 永久网站在线| 性少妇av在线| 国产av国产精品国产| 欧美成人午夜精品| 男人添女人高潮全过程视频| 久久久国产精品麻豆| 一区二区三区精品91| 夫妻午夜视频| 高清欧美精品videossex| 99久久人妻综合| 捣出白浆h1v1| 91国产中文字幕| 一级毛片电影观看| 老司机影院成人| 91成人精品电影| 国产成人精品在线电影| 亚洲熟女精品中文字幕| 国产视频首页在线观看| a级毛片黄视频| 免费少妇av软件| 国产有黄有色有爽视频| 一区二区av电影网| 啦啦啦中文免费视频观看日本| 国产日韩欧美视频二区| 亚洲欧美成人精品一区二区| 永久免费av网站大全| 18禁裸乳无遮挡动漫免费视频| 美女福利国产在线| 久热久热在线精品观看| 国产成人一区二区在线| 国产精品 国内视频| av网站在线播放免费| 亚洲欧美清纯卡通| 亚洲少妇的诱惑av| 亚洲经典国产精华液单| av福利片在线| 久久青草综合色| 婷婷色av中文字幕| 熟女av电影| 在线观看免费日韩欧美大片| 久久午夜综合久久蜜桃| 少妇 在线观看| 人妻 亚洲 视频| 成人毛片60女人毛片免费| 亚洲综合色惰| 亚洲国产欧美网| 乱人伦中国视频| 色94色欧美一区二区| 婷婷色综合大香蕉| 久久人人爽av亚洲精品天堂| 亚洲av成人精品一二三区| 精品午夜福利在线看| 人妻人人澡人人爽人人| 极品少妇高潮喷水抽搐| 99精国产麻豆久久婷婷| 精品久久久久久电影网| 卡戴珊不雅视频在线播放| 欧美成人精品欧美一级黄| 日本黄色日本黄色录像| 日本av免费视频播放| 亚洲av电影在线观看一区二区三区| 久久精品夜色国产| 午夜免费观看性视频| 亚洲av欧美aⅴ国产| 国产精品三级大全| 美女国产高潮福利片在线看| 国产一区有黄有色的免费视频| 日本免费在线观看一区| 亚洲成国产人片在线观看| 在现免费观看毛片| 美女中出高潮动态图| 亚洲一码二码三码区别大吗| 国产一区亚洲一区在线观看| 国产在视频线精品| 国产精品久久久av美女十八| 日韩av在线免费看完整版不卡| 日产精品乱码卡一卡2卡三| 熟女少妇亚洲综合色aaa.| 国产成人aa在线观看| 男女无遮挡免费网站观看| 亚洲av欧美aⅴ国产| 多毛熟女@视频| 秋霞在线观看毛片| 国产成人一区二区在线| 亚洲色图 男人天堂 中文字幕| 日本av手机在线免费观看| 女人被躁到高潮嗷嗷叫费观| 成人免费观看视频高清| 桃花免费在线播放| 不卡av一区二区三区| h视频一区二区三区| 亚洲一区二区三区欧美精品| 午夜久久久在线观看| 亚洲精品日本国产第一区| 国产欧美日韩一区二区三区在线| 亚洲成av片中文字幕在线观看 | av网站在线播放免费| 国产黄色视频一区二区在线观看| 亚洲欧美成人精品一区二区| 成人黄色视频免费在线看| 国产成人a∨麻豆精品| 91成人精品电影| 国产女主播在线喷水免费视频网站| 黑人猛操日本美女一级片| 一级黄片播放器| 岛国毛片在线播放| 日日撸夜夜添| a级毛片黄视频| 亚洲精品一二三| 美女主播在线视频| 99九九在线精品视频| 巨乳人妻的诱惑在线观看| 亚洲精品自拍成人| 日本av手机在线免费观看| 丝瓜视频免费看黄片| 亚洲欧美精品自产自拍| 97在线视频观看| 免费看av在线观看网站| 久久久国产精品麻豆| 精品久久蜜臀av无| 97精品久久久久久久久久精品| 深夜精品福利| av片东京热男人的天堂| 久久久久精品性色| 欧美人与善性xxx| 少妇人妻久久综合中文| 色婷婷久久久亚洲欧美| 亚洲欧美成人精品一区二区| 99热国产这里只有精品6| 亚洲欧美清纯卡通| 日韩欧美一区视频在线观看| 国产一区二区三区av在线| 亚洲国产欧美网| 日韩一区二区视频免费看| 91aial.com中文字幕在线观看| 亚洲,一卡二卡三卡| av在线老鸭窝| 日产精品乱码卡一卡2卡三| 国产1区2区3区精品| 美女午夜性视频免费| 91aial.com中文字幕在线观看| 9191精品国产免费久久| 日韩一区二区视频免费看| 免费观看a级毛片全部| 亚洲欧美清纯卡通| 蜜桃在线观看..| 国产欧美日韩综合在线一区二区| 中文字幕精品免费在线观看视频| 免费看不卡的av| 视频区图区小说| 国产片特级美女逼逼视频| 欧美激情 高清一区二区三区| 国产国语露脸激情在线看| 成年人午夜在线观看视频| 中文字幕人妻丝袜一区二区 | 久久精品人人爽人人爽视色| 亚洲内射少妇av| 午夜精品国产一区二区电影| 在线看a的网站| 成人18禁高潮啪啪吃奶动态图| 久久精品国产a三级三级三级| 91午夜精品亚洲一区二区三区| 久久 成人 亚洲| 男女无遮挡免费网站观看| 观看av在线不卡| 热99国产精品久久久久久7| 人人妻人人爽人人添夜夜欢视频| 99久久中文字幕三级久久日本| 国产日韩欧美视频二区| 午夜福利在线免费观看网站| av福利片在线| 咕卡用的链子| 成年女人在线观看亚洲视频| 制服丝袜香蕉在线| 久久人人爽av亚洲精品天堂| 国产精品久久久av美女十八| 国产 一区精品| 老司机影院成人| 精品酒店卫生间| 高清av免费在线| 亚洲精品国产av成人精品| 亚洲男人天堂网一区| 欧美精品国产亚洲| 中文字幕制服av| 麻豆av在线久日| 人妻人人澡人人爽人人| 亚洲国产精品999| 日韩三级伦理在线观看| 999精品在线视频| 久久99一区二区三区| 久久 成人 亚洲| av视频免费观看在线观看| 日本vs欧美在线观看视频| 久久久精品区二区三区| 国产成人精品久久久久久| 一区二区三区四区激情视频| 久久久精品免费免费高清| 极品人妻少妇av视频| 在线观看www视频免费| 亚洲av日韩在线播放| 啦啦啦视频在线资源免费观看| 国产午夜精品一二区理论片| 女人精品久久久久毛片| 999精品在线视频| 久久久久久久久久久久大奶| videossex国产| 中文字幕人妻丝袜一区二区 | 欧美精品国产亚洲| 国产爽快片一区二区三区| 亚洲一区二区三区欧美精品| 中文字幕精品免费在线观看视频| 久久久久国产网址| 精品一区在线观看国产| 欧美av亚洲av综合av国产av | 婷婷色综合大香蕉| 久久久久国产精品人妻一区二区| 制服丝袜香蕉在线| 嫩草影院入口| 91精品三级在线观看| 夫妻午夜视频| 欧美av亚洲av综合av国产av | 99热国产这里只有精品6| 韩国av在线不卡| 永久免费av网站大全| 最近手机中文字幕大全| 国产成人精品福利久久| 亚洲情色 制服丝袜| 秋霞伦理黄片| 爱豆传媒免费全集在线观看| 国产爽快片一区二区三区| 中文欧美无线码| 在线免费观看不下载黄p国产| 天堂中文最新版在线下载| 嫩草影院入口| 看免费成人av毛片| 天堂8中文在线网| 国产成人午夜福利电影在线观看| 国产精品人妻久久久影院| 久久精品国产鲁丝片午夜精品| 香蕉国产在线看| 亚洲五月色婷婷综合| 交换朋友夫妻互换小说| 不卡av一区二区三区| 亚洲成人av在线免费| 91精品国产国语对白视频| 欧美人与善性xxx| 成人影院久久| 两个人免费观看高清视频| 久久久国产一区二区| tube8黄色片| 七月丁香在线播放| 老熟女久久久| 人人妻人人澡人人看| 如何舔出高潮| 国产一区二区三区av在线| 麻豆精品久久久久久蜜桃| 久久免费观看电影| 亚洲一区中文字幕在线| 成年美女黄网站色视频大全免费| 国产免费一区二区三区四区乱码| av有码第一页| 一二三四中文在线观看免费高清| 十八禁网站网址无遮挡| 人人澡人人妻人| 尾随美女入室| 久久久久人妻精品一区果冻| 午夜免费男女啪啪视频观看| 国产精品三级大全| 一区福利在线观看| 熟女少妇亚洲综合色aaa.| 国产色婷婷99| 亚洲综合色网址| 精品一区二区三卡| 午夜激情久久久久久久| 国产xxxxx性猛交| 亚洲国产欧美在线一区| 国产日韩欧美在线精品| 大片电影免费在线观看免费| 美女午夜性视频免费| 国产成人精品婷婷| 男人添女人高潮全过程视频| 又粗又硬又长又爽又黄的视频| 在线观看人妻少妇| 国产精品亚洲av一区麻豆 | 丁香六月天网| 日韩大片免费观看网站| 久久久a久久爽久久v久久| 亚洲成国产人片在线观看| 国产一区有黄有色的免费视频| 一本—道久久a久久精品蜜桃钙片| 精品亚洲成国产av| 日韩大片免费观看网站| 欧美精品高潮呻吟av久久| 久久久久国产一级毛片高清牌| 免费少妇av软件| av又黄又爽大尺度在线免费看| 精品国产一区二区三区四区第35| 午夜久久久在线观看| 国产精品国产av在线观看| 亚洲av电影在线观看一区二区三区| 尾随美女入室| xxxhd国产人妻xxx| 国产一区二区激情短视频 | www日本在线高清视频| 交换朋友夫妻互换小说| 国产精品免费视频内射| 亚洲人成电影观看| 丰满饥渴人妻一区二区三| 亚洲色图 男人天堂 中文字幕| 久久久久久久大尺度免费视频| 男女啪啪激烈高潮av片| 亚洲欧美日韩另类电影网站| 免费人妻精品一区二区三区视频| 亚洲精品在线美女| 欧美日韩一级在线毛片| 亚洲图色成人| 亚洲成国产人片在线观看| 国产精品香港三级国产av潘金莲 | 欧美黄色片欧美黄色片| 91在线精品国自产拍蜜月| 人人妻人人澡人人爽人人夜夜| 精品国产国语对白av| 成年美女黄网站色视频大全免费| 丝袜脚勾引网站| 超色免费av| 中文字幕亚洲精品专区| 日本vs欧美在线观看视频| 午夜影院在线不卡|