• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于靜態(tài)博弈和遺傳算法的多智能體博弈策略生成方法

    2024-09-19 00:00:00劉東輝鄭贏營(yíng)暢鑫李艷斌
    無線電工程 2024年6期
    關(guān)鍵詞:遺傳算法

    摘 要:在多智能體協(xié)同對(duì)抗策略生成的過程中,獎(jiǎng)勵(lì)稀疏和神經(jīng)網(wǎng)絡(luò)參數(shù)多易導(dǎo)致策略生成速度慢。針對(duì)特定場(chǎng)景如何快速產(chǎn)生對(duì)抗策略這一問題,提出了一種基于靜態(tài)博弈和遺傳算法的多智能體博弈策略生成方法?;陟o態(tài)博弈理念,對(duì)馬爾科夫決策過程演化,將策略映射為一串動(dòng)作組成,簡(jiǎn)化策略映射原理;對(duì)策略優(yōu)化問題數(shù)學(xué)建模。以對(duì)抗結(jié)果作為目標(biāo)函數(shù),基于動(dòng)作集合優(yōu)化目標(biāo)函數(shù),通過優(yōu)化的方法能夠獲得對(duì)抗結(jié)果最優(yōu)的策略;給出策略優(yōu)化框架,并改進(jìn)遺傳算法實(shí)現(xiàn)對(duì)于多智能體博弈策略的快速并行尋優(yōu)。實(shí)驗(yàn)結(jié)果表明,相比于經(jīng)典多智能體強(qiáng)化學(xué)習(xí)方法,所提方法能夠高效產(chǎn)生多智能體博弈策略。

    關(guān)鍵詞:靜態(tài)博弈;遺傳算法;策略生成

    中圖分類號(hào):TN929. 5 文獻(xiàn)標(biāo)志碼:A 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

    文章編號(hào):1003-3106(2024)06-1355-06

    0 引言

    隨著人工智能技術(shù)的發(fā)展,近年來在各控制領(lǐng)域不斷取得亮眼表現(xiàn),如人機(jī)博弈[1]、無人駕駛[2]和智慧醫(yī)療[3-4]等。特別是對(duì)于多智能體協(xié)同管控的現(xiàn)實(shí)客觀需求,使得智能策略生成和優(yōu)化技術(shù)快速發(fā)展,多智能體博弈策略生成方法成為當(dāng)前的研究熱點(diǎn)。

    在實(shí)踐過程中,面臨的典型問題為:對(duì)手策略或者環(huán)境較為固定的情況下,如何快速生成對(duì)抗策略。傳統(tǒng)方法采用強(qiáng)化學(xué)習(xí)方法通過估計(jì)當(dāng)前狀態(tài)的狀態(tài)轉(zhuǎn)移過程和動(dòng)作分布從而估計(jì)出得到最大值獎(jiǎng)賞值的策略[5-10],如深度Q 網(wǎng)絡(luò)(Deep Qnetwork,DQN)、Soft ActorCritic (SAC)。但是,隨著實(shí)體個(gè)數(shù)的增加導(dǎo)致部分可觀測(cè)信息和狀態(tài)信息的維度增加,神經(jīng)網(wǎng)絡(luò)維度增加,進(jìn)一步引起神經(jīng)元參數(shù)收斂困難,從而導(dǎo)致神經(jīng)網(wǎng)絡(luò)難訓(xùn)練引起策略生成和優(yōu)化失敗。多智能深度強(qiáng)化學(xué)習(xí)方法被提出用以解決該問題,具有代表性的方法是QMIX[11]和Qtran[12]等。除此之外,強(qiáng)化學(xué)習(xí)需要?jiǎng)幼骶哂辛己玫姆答?,但是在工程落地過程中,存在中間態(tài)指標(biāo)多維度高難以最終結(jié)果作為目標(biāo)進(jìn)行擬合,從而引起在強(qiáng)化學(xué)習(xí)領(lǐng)域中較難處理的“回報(bào)稀疏”問題[13-14],但是從對(duì)抗結(jié)果衡量策略效果較易實(shí)現(xiàn)。如在文獻(xiàn)[15]中,任務(wù)是否成功可以直接通過判斷無人機(jī)是否達(dá)到指定位置,但是僅依靠終局結(jié)果很難對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,所以基于課程學(xué)習(xí)思路引入了遷移性評(píng)估指標(biāo)對(duì)獎(jiǎng)賞空間在數(shù)學(xué)表征上進(jìn)行稠密化[16]。但是該方法并不通用,原因在于需要對(duì)領(lǐng)域知識(shí)的深刻理解形成專家知識(shí)牽引智能模型進(jìn)行訓(xùn)練。故針對(duì)特定策略產(chǎn)生對(duì)抗策略的關(guān)鍵問題在于如何在稀疏獎(jiǎng)賞的引導(dǎo)下生成對(duì)抗策略。文獻(xiàn)[17]在雷達(dá)探測(cè)策略假定的情況下,梳理出智能干擾設(shè)備可調(diào)整的干擾參數(shù)?;谌蝿?wù)目標(biāo)構(gòu)建目標(biāo)函數(shù)和約束函數(shù),采用元啟發(fā)算法對(duì)參數(shù)進(jìn)行優(yōu)化,從而產(chǎn)生最優(yōu)對(duì)抗策略。該方法對(duì)博弈過程采用靜態(tài)建模,在整個(gè)過程中,雷達(dá)在特定模式下初始參數(shù)和行為模型固定,所以干擾參數(shù)數(shù)值求解,并形成靜態(tài)對(duì)抗策略。但是,在動(dòng)態(tài)博弈過程中,需要通過動(dòng)作組成策略。策略內(nèi)的動(dòng)作間會(huì)變化,需要針對(duì)動(dòng)態(tài)場(chǎng)景進(jìn)行改進(jìn)[18]。

    針對(duì)該不足,基于靜態(tài)博弈理論[19],提出面向動(dòng)態(tài)場(chǎng)景的多智能體博弈策略生成方法。對(duì)馬爾科夫決策過程演化,將策略映射為一串動(dòng)作組成,簡(jiǎn)化策略映射原理。將策略優(yōu)化問題轉(zhuǎn)化為數(shù)學(xué)尋優(yōu)問題。以對(duì)抗結(jié)果作為目標(biāo)函數(shù),基于動(dòng)作集合優(yōu)化目標(biāo)函數(shù),獲得對(duì)抗結(jié)果最優(yōu)的策略。除此之外,構(gòu)建并行優(yōu)化框架,改進(jìn)遺傳算法實(shí)現(xiàn)對(duì)于多智能體博弈策略的快速并行尋優(yōu)[20]。實(shí)驗(yàn)結(jié)果表明,相比于經(jīng)典多智能體強(qiáng)化學(xué)習(xí)方法,本方法能夠高效產(chǎn)生多智能體博弈策略。

    本文余下內(nèi)容結(jié)構(gòu)組織如下:第1 節(jié)詳細(xì)推導(dǎo)并闡述基于靜態(tài)博弈理論的策略優(yōu)化模型,為后續(xù)第2 節(jié)提出的方法奠定了基礎(chǔ),并在第3 節(jié)通過實(shí)驗(yàn)驗(yàn)證本方法的有效性,最后總結(jié)全文。

    1 基于靜態(tài)博弈理論的策略優(yōu)化模型

    基于博弈論,策略π 是由一系列動(dòng)作a 構(gòu)成的。

    馬爾科夫決策過程的本質(zhì)也是在數(shù)學(xué)上尋找到由狀態(tài)st 到at 的映射過程,其中st ∈S,S 為狀態(tài)空間;at∈A,A 為動(dòng)作空間。在針對(duì)特定策略這一假設(shè)前提下,對(duì)手策略的狀態(tài)動(dòng)作映射較為固定。對(duì)手策略的狀態(tài)動(dòng)作映射可以弱化為策略標(biāo)簽,用于區(qū)分不同對(duì)手策略。進(jìn)一步,可以弱化對(duì)于對(duì)手狀態(tài)st 的特征提取過程,使策略π 直接施加于對(duì)手策略上,通過對(duì)抗結(jié)果進(jìn)行反饋。上述演進(jìn)過程如圖1 所示。

    從最優(yōu)化角度分析可知,對(duì)手策略和博弈環(huán)境可以固定為博弈函數(shù)f,策略博弈產(chǎn)生結(jié)果的過程可以表述為:

    Rtotal = f(π), (1)

    式中:Rtotal 為總獎(jiǎng)賞。

    Rtotal = ΣTt = 1rt。(2)

    在典型對(duì)抗環(huán)境中,中間獎(jiǎng)賞較難獲得,需要通過獎(jiǎng)賞塑形等大量的專業(yè)領(lǐng)域才能構(gòu)成,所以最直觀為采用最終結(jié)果作為獎(jiǎng)賞:

    Rtotal = rT 。(3)

    最優(yōu)策略即為使得博弈函數(shù)最大的策略,即優(yōu)化目標(biāo)為:

    π* = argmax π f(π), (4)

    式中:π 為由一系列動(dòng)作構(gòu)成的策略,π 為所有可能的動(dòng)作組合成的策略集合,π 為最優(yōu)策略。

    該模型的優(yōu)勢(shì)在于能夠有效地解決獎(jiǎng)賞稀疏的問題。在智能決策應(yīng)用場(chǎng)景中,通過結(jié)果設(shè)計(jì)獎(jiǎng)賞函數(shù)較為容易,如將目標(biāo)擊毀個(gè)數(shù)轉(zhuǎn)化為獎(jiǎng)賞分值[15]。但是,在博弈過程中,通過結(jié)果設(shè)計(jì)獎(jiǎng)賞會(huì)使得大部分時(shí)間沒有獎(jiǎng)賞值,無法預(yù)測(cè)獎(jiǎng)賞值出現(xiàn)時(shí)間,無法準(zhǔn)確評(píng)估動(dòng)作的有效性,指引策略的收斂方向。而采用領(lǐng)域知識(shí)可以使得獎(jiǎng)賞稠密,如將智能體與目標(biāo)之間的距離或者將抗干擾跳頻時(shí)選擇的信道間隔轉(zhuǎn)化為獎(jiǎng)賞值[15,18],有助于策略加速收斂。但是,需要領(lǐng)域?qū)<腋鶕?jù)場(chǎng)景需求設(shè)計(jì),容易引入主觀因素導(dǎo)致收斂在局部最優(yōu)策略。所以,針對(duì)上述矛盾,依據(jù)靜態(tài)博弈理論,在獎(jiǎng)賞稀疏的假設(shè)前提條件下,將馬爾科夫決策過程演化為靜態(tài)優(yōu)化問題,明確目標(biāo)函數(shù),將策略優(yōu)化問題完全數(shù)學(xué)化表征,使得策略可以通過數(shù)學(xué)優(yōu)化方法進(jìn)行求解,規(guī)避了馬爾科夫決策過程在獎(jiǎng)賞稀疏條件下策略生成困難的弊端。

    2 基于遺傳算法的策略生成方法

    得益于在理論層面將動(dòng)態(tài)博弈問題簡(jiǎn)化為了優(yōu)化問題,使得采用遺傳算法能夠快速找出博弈過程中的最優(yōu)動(dòng)作排序,并將其映射為策略,從而實(shí)現(xiàn)針對(duì)特定策略的快速生成。但是,對(duì)于遺傳算法而言,其計(jì)算量大且耗時(shí)的部分在于需要計(jì)算種群中每個(gè)個(gè)體的適應(yīng)度,故提出并行優(yōu)化框架對(duì)方法進(jìn)行加速。后續(xù)本節(jié)分為兩部分,詳細(xì)闡述基于遺傳算法的策略生成方法,分別為并行求解框架和優(yōu)化方法。

    2. 1 并行優(yōu)化框架

    并行優(yōu)化框架如圖2 所示。整個(gè)并行優(yōu)化過程闡述如下:首先,構(gòu)建由一系列動(dòng)作作為基因組成策略個(gè)體,再將多個(gè)策略個(gè)體組成策略種群。在該階段,需要根據(jù)對(duì)抗時(shí)長(zhǎng)和受控體的個(gè)數(shù)相乘得到策略個(gè)體中包含的動(dòng)作基因個(gè)數(shù)。然后,每一個(gè)策略個(gè)體在博弈場(chǎng)景中與對(duì)手策略對(duì)抗,將獎(jiǎng)賞作為每個(gè)策略個(gè)體的適應(yīng)值返回。在此過程中,利用并行進(jìn)行多個(gè)策略個(gè)體的對(duì)抗,能夠快速獲得。最后,將策略種群和個(gè)體依次對(duì)應(yīng)的獎(jiǎng)賞適應(yīng)值傳入優(yōu)化方法。優(yōu)化方法過濾并生成新的策略種群,并進(jìn)入下一次策略優(yōu)化環(huán)路。由基于靜態(tài)博弈理論的策略生成數(shù)學(xué)優(yōu)化模型一節(jié)的數(shù)學(xué)分析過程可以看出,作為核心理論,其在實(shí)施層面具有良好的并行化能力,從而使得并行化框架的構(gòu)建成為可能,并將結(jié)合硬件算力大幅度提升策略優(yōu)化的性能。

    2. 2 優(yōu)化方法

    在優(yōu)化過程中,需要完成策略的數(shù)學(xué)化表達(dá)。假設(shè)在多智能體對(duì)抗環(huán)境中,智能體個(gè)數(shù)為N,在博弈期間需要執(zhí)行動(dòng)作次數(shù)為T,每次執(zhí)行離散動(dòng)作。故策略個(gè)體π 由N×T 個(gè)動(dòng)作基因組成,即:

    π = [a1 ,a2 ,…,aT ]NT 。(5)

    當(dāng)策略種群由M 個(gè)策略個(gè)體組成時(shí),策略種群π 可以表示為:

    π = [π1 ,π2 ,…,πM ]M ×NT 。(6)

    構(gòu)建多個(gè)線程L,線程之間相互獨(dú)立。針對(duì)不同策略個(gè)體的開展K 次博弈對(duì)抗,得到與個(gè)體相對(duì)應(yīng)的獎(jiǎng)賞適應(yīng)值:

    當(dāng)所有策略個(gè)體對(duì)應(yīng)的獎(jiǎng)賞適應(yīng)值計(jì)算運(yùn)行完成后,按照獎(jiǎng)賞適應(yīng)度由高到低,對(duì)策略種群π 中的策略個(gè)體π 排序。

    根據(jù)策略種群π 獎(jiǎng)賞適應(yīng)值進(jìn)行個(gè)體獎(jiǎng)賞適應(yīng)值的歸一化,對(duì)于第m 個(gè)策略個(gè)體π,其種群選擇概率為:

    根據(jù)個(gè)體策略的獎(jiǎng)賞適應(yīng)值對(duì)種群進(jìn)行過濾,保留指定數(shù)量M′個(gè)獎(jiǎng)賞適應(yīng)值排名靠前的策略個(gè)體。除此之外,在剩余策略個(gè)體中,隨機(jī)抽取2 個(gè)策略個(gè)體進(jìn)行拼接形成新策略個(gè)體并放回種群中,該過程可以通過數(shù)學(xué)表達(dá)為:

    π′1 = [π1 [1:t′],π2 [t′ + 1:T]], (9)

    π′2 = [π2 [1:t′],π1 [t′ + 1:T]], (10)

    式中:π1 和 π2 為隨機(jī)抽取出的策略個(gè)體,π1′和 π2′為拼接后的策略個(gè)體,t′為隨機(jī)生成的拼接位置,t′∈NT,隨機(jī)概率門限為ε1 。

    為了進(jìn)一步提高策略種群的搜索能力,對(duì)種群中的個(gè)體進(jìn)行動(dòng)作基因突變操作。遍歷新生成策略種群中每個(gè)動(dòng)作基因,以概率門限為ε2 為基礎(chǔ)進(jìn)行隨機(jī)變異。當(dāng)超過變異門限時(shí),從可選動(dòng)作范圍內(nèi)隨機(jī)選擇一個(gè)離散動(dòng)作進(jìn)行替換。

    經(jīng)過上述過程的迭代,最終即可獲得最優(yōu)策略個(gè)體和其對(duì)應(yīng)的最優(yōu)獎(jiǎng)賞適應(yīng)值。

    3 實(shí)驗(yàn)驗(yàn)證

    實(shí)驗(yàn)驗(yàn)證由實(shí)驗(yàn)場(chǎng)景、實(shí)驗(yàn)設(shè)計(jì)、參數(shù)設(shè)置和結(jié)果分析四部分組成。

    3. 1 實(shí)驗(yàn)場(chǎng)景

    為了能夠有效驗(yàn)證本方法的有效性,采用DeepMind 和暴雪公司開發(fā)的基于“星際爭(zhēng)霸2”的多智能體對(duì)抗環(huán)境(StarCraft MultiAgent Challenge,SMAC)進(jìn)行實(shí)驗(yàn)[21]。SMAC 內(nèi)置基線對(duì)抗策略,用于驗(yàn)證策略效果。除此之外,由于典型用于多智能體策略對(duì)抗的深度強(qiáng)化學(xué)習(xí)需要對(duì)應(yīng)場(chǎng)景進(jìn)行超參數(shù)調(diào)整,該典型場(chǎng)景公認(rèn)性較高,故均基于此環(huán)境進(jìn)行開發(fā)和調(diào)試,其對(duì)照算法的超參數(shù)可以直接獲得。采用SMAC 環(huán)境中名稱為“3m”的多智能體同構(gòu)場(chǎng)景進(jìn)行驗(yàn)證。

    3. 2 實(shí)驗(yàn)設(shè)計(jì)

    實(shí)驗(yàn)過程共設(shè)置步長(zhǎng)為106 ,分為訓(xùn)練階段和評(píng)估階段,以5 000 步為周期循環(huán)。在訓(xùn)練階段,設(shè)置種群訓(xùn)練門限為5 000 步。在該階段內(nèi),對(duì)種群內(nèi)個(gè)體進(jìn)行適應(yīng)度并行計(jì)算和交叉變異。當(dāng)每種群運(yùn)行步數(shù)超過5 000 步進(jìn)行一次性能評(píng)估。在性能評(píng)估階段,與基線策略對(duì)抗24 回合。衡量對(duì)抗策略的有效性,最根本在于評(píng)估勝率,故在實(shí)驗(yàn)中用勝率作為評(píng)估指標(biāo)。對(duì)于勝率而言,計(jì)算24 回合內(nèi)與“3m”場(chǎng)景的基線策略對(duì)抗獲勝的次數(shù),再除以總回合數(shù)得到勝率。除此之外,在實(shí)驗(yàn)過程中,將QMIX和ValueDecomposition Networks (VDN )方法在“3m”場(chǎng)景中的勝率和平均獎(jiǎng)賞作為對(duì)照組,驗(yàn)證本方法的性能。除此之外,VDN 和QMIX 方法分別使用以結(jié)果作為獎(jiǎng)賞的非獎(jiǎng)賞塑形和SMAC 環(huán)境提供的獎(jiǎng)賞塑形。在判斷勝負(fù)的基礎(chǔ)上,SMAC 環(huán)境提供的塑形獎(jiǎng)賞通過受控體之間的位置關(guān)系和生命值等特征構(gòu)建了獎(jiǎng)賞函數(shù)。通過設(shè)置對(duì)照實(shí)驗(yàn),用于展示獎(jiǎng)賞稀疏對(duì)于典型算法的影響,突出該問題解決的必要性,并驗(yàn)證了本方法在解決該問題上的有效性。

    3. 3 參數(shù)設(shè)置

    本文實(shí)驗(yàn)所用到的算法參數(shù)如下表1 所示。

    3. 4 結(jié)果分析

    策略效果如圖3 所示,展示了本方法、VDN 和QMIX 隨訓(xùn)練步長(zhǎng)增加的勝率變化趨勢(shì)。在圖3中,“VDN-獎(jiǎng)賞塑形”和“QMIX-獎(jiǎng)賞塑形”表示采用SMAC 提供的獎(jiǎng)賞塑形進(jìn)行訓(xùn)練得到的博弈策略,而VDN 和QMIX 表示僅通過勝負(fù)關(guān)系構(gòu)建獎(jiǎng)賞得到的博弈策略。從對(duì)比采用獎(jiǎng)賞塑形和非獎(jiǎng)賞塑形的2 種方法可以看出,采用獎(jiǎng)賞塑形的方法勝率提升趨勢(shì)較為穩(wěn)定,而采用非獎(jiǎng)賞塑形的由于獎(jiǎng)賞反饋稀疏,在實(shí)驗(yàn)初期勝率提升較慢,且在實(shí)驗(yàn)中后期出現(xiàn)明顯的勝率衰退現(xiàn)象。雖然通過保存最大勝率對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)參數(shù)的方法使其不至于出現(xiàn)嚴(yán)重衰退,但是勝率無法與塑形獎(jiǎng)賞相比。相比之下,雖然本文方法、“VDN -獎(jiǎng)賞塑形”和“QMIX -獎(jiǎng)賞塑形”都能夠達(dá)到最大勝率,但是本文方法速度快且穩(wěn)定,且能夠有效避免由于獎(jiǎng)賞稀疏導(dǎo)致的性能衰退。

    為了進(jìn)一步量化對(duì)比方法性能,對(duì)5 種方法的勝率求取均值和最大值,如表2 所示。5 種方法均能夠達(dá)到最大勝率,但是通過勝率均值可以發(fā)現(xiàn),本文方法相比于其他方法的勝率均值最大,表明本文方法相對(duì)穩(wěn)定。

    綜合圖3 和表2 的勝率趨勢(shì)和量化勝率,可見本文方法在針對(duì)特定對(duì)手策略時(shí),在獎(jiǎng)賞稀疏的情況下,能夠快速且穩(wěn)定地生成對(duì)抗策略。

    4 結(jié)束語

    針對(duì)特定策略如何快速產(chǎn)生對(duì)抗策略這一問題,結(jié)合博弈論中的靜態(tài)博弈理論和遺傳算法,提出了一種改進(jìn)的多智能體博弈策略生成方法。在理論層面,基于靜態(tài)博弈理念,對(duì)馬爾科夫決策過程演化,將策略映射為一串動(dòng)作組成,簡(jiǎn)化策略映射原理。在理論基礎(chǔ)上,對(duì)策略優(yōu)化問題數(shù)學(xué)建模。以對(duì)抗結(jié)果作為目標(biāo)函數(shù),基于動(dòng)作集合優(yōu)化目標(biāo)函數(shù),通過優(yōu)化的方法能夠獲得對(duì)抗結(jié)果最優(yōu)的策略。在實(shí)現(xiàn)層面,設(shè)計(jì)策略優(yōu)化框架,并改進(jìn)遺傳算法實(shí)現(xiàn)對(duì)于多智能體博弈策略的快速并行尋優(yōu)。在實(shí)驗(yàn)中,將典型多智能體強(qiáng)化學(xué)習(xí)方法作為基線,通過與基線方法對(duì)比,表明了本方法產(chǎn)生策略的高效性,并且展現(xiàn)了本文方法基于并行方法能夠有效提高策略生成與優(yōu)化速度。

    參考文獻(xiàn)

    [1] MNIH V,KAVUKCUOGLU K,SILVER D,et al. HumanLevel Control through Deep Reinforcement Learning[J].Nature,2015,518:529-533.

    [2] FENG S,SUN H W,YAN X T,et al. Dense ReinforcementLearning for Safety Validation of Autonomous Vehicles[J]. Nature,2023,615:620-627.

    [3] ZHU Y,LIANG X F,WANG T T,et al. MultiinformationFusion Fault Diagnosis of Bogie Bearing under Small Samples via Unsupervised Representation Alignment Deep Qlearning [J]. IEEE Transactions on Instrumentation andMeasurement,2022,72:3503315.

    [4] ZHU M X,ZHU H G. Learning a Diagnostic Strategy onMedical Data with Deep Reinforcement Learning [J ].IEEE Access,2021,9:84122-84133.

    [5] MNIH V,KAVUKCUOGLU K,SILVER D,et al. PlayingAtari with Deep ReinforcementLearning [EB / OL ].(2013-12-19)[2024-03-06]. https:∥arxiv. org / abs /1312. 5602.

    [6] HASSELT H V,GUEZ A,SILVER D. Deep ReinforcementLearning with Double Qlearning [C]∥ Proceding of theThirtieth AAAI Conference on Artifical Intelligence. Phoenix:AAAI Press,2016:2094-2100.

    [7] SCHAUL T,QUAN J,ANTONOGLOU I,et al. PrioritizedExperience Replay[EB / OL]. (2015 - 11 - 18 )[2024 -03-06]. https:∥arxiv. org / abs / 1511. 05952.

    [8] HAARNOJA T,ZHOU A,ABBEEl P,et al. Soft Actorcritic:Offpolicy Maximum Entropy Deep ReinforcementLearning with a Stochastic Actor[EB / OL]. (2018 - 01 -04)[2024-03-06]. https:∥arXiv:1801. 01290v2.

    [9] HAARNOJA T,ZHOU A,HARTIKAINEN K,et al. SoftActorcritic Algorithms and Applications[EB/ OL]. (2018-12-13)[2023-09-06]. https:∥ arXiv:1707. 06347v2.

    [10] WANG Z Y,SCHAUL T,HESSEL M,et al. Dueling NetworkArchitectures for Deep Reinforcement Learning [C]∥Proceeding of the 33rd International Conference on MachineLearning. New York:JMLR. org,2016:1995-2003.

    [11]RASHID T,SAMVELYAN M,WITT C S D,et al. MonotonicValue Function Factorisation for Deep Multiagent Reinforcement Learning [J]. Journal of Machine Learning Research,2020,21(1):7234-7284.

    [12]SON K,KIM D,KANG W J,et al. QTRAN:Learning to Factorize with Transformation for Cooperative Multiagent Reinforcement Learning [EB/ OL]. (2019 -05 -14)[2024 -03 -06]. http:∥arXiv. org/ abs/ 1905. 05408.

    [13]WANG X,CHEN Y D,ZHU W W. A Survey on CurriculumLearning [J]. IEEE Transactions on Pattern Analysis andMachine Intelligence,2022,44(9):4555-4576.

    [14] OKUDO T,YAMADA S. Learning Potential in Subgoalbased Reward Shaping [J ]. IEEE Access,2023,11:17116-17137.

    [15] 暢鑫,李艷斌,趙研,等. 基于MA2IDDPG 算法的異構(gòu)多無人機(jī)協(xié)同突防方法[J]. 河北工業(yè)科技,2022,39(4):328-334.

    [16] YIN H,GUO S X,LI A,et al. A Deep ReinforcementLearningbased Decentralized Hierarchical Motion ControlStrategy for Multiple Amphibious Spherical Robot Systemswith Tilting Thrusters [J]. IEEE Sensors Journal,2024,24(1):769-779.

    [17] CHANG X,LI Y B,ZHAO Y,et al. A MultiplejammerDeceptive Jamming Method Based on Particle Swarm Optimization against Threechannel SAR GMTI [J]. IEEEAccess,2021,9:138385-138393.

    [18] LIU S Y,XU Y F,CHEN X Q,et al. Patternaware Intelligent Antijamming Communication:A Sequential DeepReinforcement Learning Approach [J ]. IEEE Access,2019,7:169204-169216.

    [19] 阿維亞德·海菲茲. 博弈論[M]. 劉勇,譯. 上海:上海人民出版社,2015.

    [20] ENGELBRECHTA P. Computational Intelligence:An Introduction[M]. New Jersey:Wiley,2007.

    [21] SAMVELYAN M,RASHID T,WITT C S D,et al. TheStarCraft Multiagent Challenge[C]∥ Proceedings of the18th International Conference on Autonomous Agents andMulti Agent Systems. Montreal:International Foundutionfor Autonomous Agents and Multiagent Systems,2019:2186-2188.

    作者簡(jiǎn)介

    劉東輝 女,(1990—),博士,講師。主要研究方向:復(fù)雜系統(tǒng)管理、策略優(yōu)化等。

    鄭贏營(yíng) 女,(1998—),碩士研究生。主要研究方向:復(fù)雜系統(tǒng)管理。

    暢 鑫 男,(1990—),博士,高級(jí)工程師。

    基金項(xiàng)目:國(guó)家自然科學(xué)基金(71991485,71991481,71991480);中國(guó)博士后科學(xué)基金(2021M693002)

    猜你喜歡
    遺傳算法
    遺傳算法對(duì)CMAC與PID并行勵(lì)磁控制的優(yōu)化
    基于自適應(yīng)遺傳算法的CSAMT一維反演
    基于遺傳算法的建筑物沉降回歸分析
    一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用
    基于遺傳算法和LS-SVM的財(cái)務(wù)危機(jī)預(yù)測(cè)
    遺傳算法識(shí)別模型在水污染源辨識(shí)中的應(yīng)用
    協(xié)同進(jìn)化在遺傳算法中的應(yīng)用研究
    軟件發(fā)布規(guī)劃的遺傳算法實(shí)現(xiàn)與解釋
    基于遺傳算法的三體船快速性仿真分析
    基于改進(jìn)的遺傳算法的模糊聚類算法
    国产精品爽爽va在线观看网站| 国产精华一区二区三区| svipshipincom国产片| 亚洲国产欧美网| av在线蜜桃| 黄片小视频在线播放| 亚洲aⅴ乱码一区二区在线播放| 国产69精品久久久久777片| 国内精品久久久久精免费| 国产精品亚洲一级av第二区| 色吧在线观看| 最后的刺客免费高清国语| 91麻豆av在线| 欧美绝顶高潮抽搐喷水| 无遮挡黄片免费观看| 露出奶头的视频| 欧美日韩一级在线毛片| 成人一区二区视频在线观看| 亚洲中文字幕日韩| 精品国产美女av久久久久小说| 欧美在线一区亚洲| svipshipincom国产片| 亚洲av五月六月丁香网| 久久久久久久久大av| 免费搜索国产男女视频| 日本三级黄在线观看| 久久久久国产精品人妻aⅴ院| 男女午夜视频在线观看| 高清日韩中文字幕在线| 一夜夜www| 久久久久性生活片| 丁香六月欧美| 成人国产综合亚洲| 又粗又爽又猛毛片免费看| 亚洲片人在线观看| 亚洲av日韩精品久久久久久密| 麻豆国产av国片精品| 久久国产精品人妻蜜桃| 悠悠久久av| 国产成年人精品一区二区| 日韩欧美精品免费久久 | 日日夜夜操网爽| 国产极品精品免费视频能看的| 免费av毛片视频| 夜夜爽天天搞| 尤物成人国产欧美一区二区三区| 夜夜看夜夜爽夜夜摸| 91麻豆精品激情在线观看国产| 亚洲精品影视一区二区三区av| 午夜福利成人在线免费观看| 精品不卡国产一区二区三区| 在线免费观看的www视频| 欧美成人一区二区免费高清观看| 黑人欧美特级aaaaaa片| 日本黄大片高清| 美女黄网站色视频| 久9热在线精品视频| 天堂网av新在线| 久久久久性生活片| 无限看片的www在线观看| 男女午夜视频在线观看| 免费人成视频x8x8入口观看| 日本在线视频免费播放| 欧美最新免费一区二区三区 | 天堂动漫精品| 黄色片一级片一级黄色片| 成人欧美大片| 亚洲乱码一区二区免费版| 久久久精品欧美日韩精品| 一级作爱视频免费观看| 韩国av一区二区三区四区| 2021天堂中文幕一二区在线观| 亚洲av电影在线进入| 很黄的视频免费| 99久久99久久久精品蜜桃| 婷婷精品国产亚洲av在线| 19禁男女啪啪无遮挡网站| 国产真实乱freesex| 啦啦啦韩国在线观看视频| 悠悠久久av| 麻豆国产97在线/欧美| 成人av在线播放网站| 脱女人内裤的视频| 欧美日本亚洲视频在线播放| 亚洲欧美日韩卡通动漫| av片东京热男人的天堂| 欧美大码av| 99久久精品一区二区三区| 18+在线观看网站| 精品国产亚洲在线| 国产黄a三级三级三级人| 亚洲人成电影免费在线| 国产精品99久久久久久久久| 日本 av在线| 嫩草影院入口| 欧美一级a爱片免费观看看| 国产免费一级a男人的天堂| 少妇的逼好多水| 麻豆成人午夜福利视频| 香蕉久久夜色| 婷婷六月久久综合丁香| a在线观看视频网站| 亚洲天堂国产精品一区在线| 成人特级黄色片久久久久久久| 亚洲av免费在线观看| 亚洲av免费高清在线观看| 精品国内亚洲2022精品成人| 午夜影院日韩av| 51午夜福利影视在线观看| 特大巨黑吊av在线直播| 在线观看66精品国产| 国产私拍福利视频在线观看| 欧美日韩一级在线毛片| 久久精品国产亚洲av涩爱 | 精品免费久久久久久久清纯| 亚洲第一电影网av| 日韩欧美 国产精品| 长腿黑丝高跟| x7x7x7水蜜桃| 国产精品99久久99久久久不卡| 一进一出好大好爽视频| 亚洲人与动物交配视频| 亚洲va日本ⅴa欧美va伊人久久| 欧美bdsm另类| tocl精华| 国产亚洲精品一区二区www| 日韩欧美精品v在线| 91久久精品国产一区二区成人 | 亚洲精品成人久久久久久| 亚洲黑人精品在线| 啦啦啦观看免费观看视频高清| 国产爱豆传媒在线观看| 久久6这里有精品| 级片在线观看| 老汉色∧v一级毛片| 女生性感内裤真人,穿戴方法视频| 老司机午夜十八禁免费视频| 国产精品乱码一区二三区的特点| 亚洲av免费在线观看| 欧美日韩福利视频一区二区| 一个人看视频在线观看www免费 | 一级毛片高清免费大全| 午夜a级毛片| 禁无遮挡网站| 欧美+日韩+精品| 国产精品香港三级国产av潘金莲| 给我免费播放毛片高清在线观看| 中文字幕高清在线视频| 99国产极品粉嫩在线观看| 日本a在线网址| 午夜精品久久久久久毛片777| 淫妇啪啪啪对白视频| 久久欧美精品欧美久久欧美| 日本 欧美在线| 一级毛片女人18水好多| 18禁黄网站禁片免费观看直播| 精品久久久久久久末码| 欧美高清成人免费视频www| 少妇丰满av| 国产亚洲精品久久久com| 午夜免费男女啪啪视频观看 | 怎么达到女性高潮| av国产免费在线观看| 男人的好看免费观看在线视频| 少妇的逼水好多| 少妇丰满av| 亚洲av免费高清在线观看| 中文资源天堂在线| 宅男免费午夜| www国产在线视频色| 中文亚洲av片在线观看爽| 久久精品综合一区二区三区| av黄色大香蕉| 日韩成人在线观看一区二区三区| 日韩亚洲欧美综合| 欧美日韩瑟瑟在线播放| 亚洲精品美女久久久久99蜜臀| 非洲黑人性xxxx精品又粗又长| 伊人久久精品亚洲午夜| 亚洲精品国产精品久久久不卡| 国产精品久久久久久久久免 | 好男人电影高清在线观看| 亚洲七黄色美女视频| 久久久久久久亚洲中文字幕 | 我要搜黄色片| 免费在线观看日本一区| 国产主播在线观看一区二区| 99久久精品国产亚洲精品| 黄色日韩在线| av在线天堂中文字幕| av黄色大香蕉| 啦啦啦免费观看视频1| 两人在一起打扑克的视频| 欧美激情久久久久久爽电影| or卡值多少钱| 亚洲欧美日韩高清在线视频| 久久精品国产亚洲av香蕉五月| 亚洲最大成人手机在线| 国产毛片a区久久久久| 国产高清视频在线观看网站| 国产v大片淫在线免费观看| 成人特级黄色片久久久久久久| 亚洲性夜色夜夜综合| 国产成人啪精品午夜网站| 91久久精品电影网| 国模一区二区三区四区视频| 在线十欧美十亚洲十日本专区| 99热只有精品国产| 亚洲欧美精品综合久久99| 国产一区二区三区视频了| 69人妻影院| 人妻丰满熟妇av一区二区三区| 欧美日本亚洲视频在线播放| 男人的好看免费观看在线视频| 好看av亚洲va欧美ⅴa在| 精品乱码久久久久久99久播| 亚洲男人的天堂狠狠| ponron亚洲| 一个人免费在线观看电影| 少妇人妻精品综合一区二区 | 免费大片18禁| av片东京热男人的天堂| 特级一级黄色大片| 热99在线观看视频| av视频在线观看入口| 丰满人妻熟妇乱又伦精品不卡| 中文亚洲av片在线观看爽| 综合色av麻豆| 亚洲avbb在线观看| 精品不卡国产一区二区三区| 97超视频在线观看视频| 三级毛片av免费| 免费看光身美女| 久久精品国产清高在天天线| 别揉我奶头~嗯~啊~动态视频| 9191精品国产免费久久| av国产免费在线观看| 十八禁人妻一区二区| 窝窝影院91人妻| 国产精品综合久久久久久久免费| 波多野结衣高清作品| 午夜老司机福利剧场| 怎么达到女性高潮| 婷婷精品国产亚洲av在线| 搡老妇女老女人老熟妇| 国产精品永久免费网站| 欧美最新免费一区二区三区 | 精品人妻1区二区| 在线观看美女被高潮喷水网站 | 中文亚洲av片在线观看爽| 亚洲,欧美精品.| 操出白浆在线播放| 亚洲中文日韩欧美视频| 12—13女人毛片做爰片一| 午夜福利免费观看在线| 欧美3d第一页| 国产伦一二天堂av在线观看| 欧美日韩一级在线毛片| 在线国产一区二区在线| 国产男靠女视频免费网站| 国产伦人伦偷精品视频| 免费观看的影片在线观看| 亚洲精品乱码久久久v下载方式 | 嫩草影院入口| av黄色大香蕉| 成人av一区二区三区在线看| 一二三四社区在线视频社区8| 国产探花在线观看一区二区| 亚洲电影在线观看av| 国产私拍福利视频在线观看| 一本一本综合久久| 国产 一区 欧美 日韩| 精品乱码久久久久久99久播| 午夜精品久久久久久毛片777| 真人做人爱边吃奶动态| 免费在线观看影片大全网站| 97超视频在线观看视频| 女人十人毛片免费观看3o分钟| 色综合欧美亚洲国产小说| 久久久久国产精品人妻aⅴ院| 久久国产精品人妻蜜桃| 熟妇人妻久久中文字幕3abv| 久久亚洲精品不卡| 性色avwww在线观看| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 国产 一区 欧美 日韩| 国产精品影院久久| 欧美成人a在线观看| 啦啦啦观看免费观看视频高清| 精品久久久久久,| 99久久无色码亚洲精品果冻| 精品一区二区三区av网在线观看| 国产一区二区三区视频了| 五月玫瑰六月丁香| 国产中年淑女户外野战色| 真人做人爱边吃奶动态| 亚洲专区国产一区二区| 亚洲熟妇熟女久久| 少妇人妻精品综合一区二区 | 免费搜索国产男女视频| 我的老师免费观看完整版| 男女床上黄色一级片免费看| 在线观看免费午夜福利视频| 日日夜夜操网爽| 成人国产一区最新在线观看| 性色av乱码一区二区三区2| 欧美日韩亚洲国产一区二区在线观看| 色老头精品视频在线观看| 黄片小视频在线播放| www.999成人在线观看| 欧美乱妇无乱码| 免费av观看视频| 欧美最新免费一区二区三区 | 国产精品一区二区三区四区免费观看 | 日日干狠狠操夜夜爽| 99久国产av精品| 欧美最新免费一区二区三区 | 国产免费一级a男人的天堂| 亚洲 欧美 日韩 在线 免费| 国产精品一及| 日韩欧美精品免费久久 | 亚洲精品久久国产高清桃花| 观看免费一级毛片| 国产精品一区二区免费欧美| 日本黄色视频三级网站网址| 久久久久久国产a免费观看| xxxwww97欧美| 老司机在亚洲福利影院| 深夜精品福利| 午夜激情欧美在线| 亚洲一区二区三区不卡视频| 亚洲国产精品999在线| 国产亚洲精品一区二区www| 久久精品国产自在天天线| av黄色大香蕉| 免费av不卡在线播放| 精品国产美女av久久久久小说| 成年人黄色毛片网站| 国产精品亚洲美女久久久| 久久99热这里只有精品18| 成年版毛片免费区| 日韩欧美一区二区三区在线观看| 精品熟女少妇八av免费久了| 天堂av国产一区二区熟女人妻| 黄色片一级片一级黄色片| 欧美+亚洲+日韩+国产| 18禁美女被吸乳视频| 夜夜躁狠狠躁天天躁| 午夜福利18| 久久午夜亚洲精品久久| 两性午夜刺激爽爽歪歪视频在线观看| 天堂动漫精品| 国产精品久久久久久久久免 | 一级黄片播放器| av福利片在线观看| 亚洲无线在线观看| 高清在线国产一区| 男女午夜视频在线观看| 国产亚洲av嫩草精品影院| www日本在线高清视频| 亚洲熟妇中文字幕五十中出| 精品午夜福利视频在线观看一区| 不卡一级毛片| 欧美激情在线99| 麻豆一二三区av精品| 麻豆成人av在线观看| 国产一区二区亚洲精品在线观看| 真实男女啪啪啪动态图| av欧美777| 蜜桃亚洲精品一区二区三区| 97碰自拍视频| 国产成人影院久久av| 在线观看舔阴道视频| 国产精品一及| 成年女人毛片免费观看观看9| 国产免费一级a男人的天堂| 欧美在线一区亚洲| 9191精品国产免费久久| 亚洲熟妇中文字幕五十中出| 国内久久婷婷六月综合欲色啪| 亚洲av成人不卡在线观看播放网| 日本a在线网址| 精品一区二区三区av网在线观看| 最新中文字幕久久久久| 女警被强在线播放| 老司机在亚洲福利影院| 国产精品女同一区二区软件 | АⅤ资源中文在线天堂| 91麻豆av在线| 成人国产一区最新在线观看| 高清毛片免费观看视频网站| 两性午夜刺激爽爽歪歪视频在线观看| 国产黄a三级三级三级人| 国产精品 欧美亚洲| 久久国产乱子伦精品免费另类| 精品欧美国产一区二区三| 日本熟妇午夜| 久久久国产精品麻豆| 中文字幕人妻熟人妻熟丝袜美 | 狂野欧美激情性xxxx| 老熟妇仑乱视频hdxx| 一本久久中文字幕| 久久久久国产精品人妻aⅴ院| 噜噜噜噜噜久久久久久91| 人妻丰满熟妇av一区二区三区| 久久婷婷人人爽人人干人人爱| 国产精品亚洲av一区麻豆| 在线观看av片永久免费下载| 99久久无色码亚洲精品果冻| 在线观看舔阴道视频| 国产精品免费一区二区三区在线| 国产在线精品亚洲第一网站| 97超视频在线观看视频| 麻豆一二三区av精品| 听说在线观看完整版免费高清| 国产精品99久久久久久久久| 嫩草影院入口| 我的老师免费观看完整版| bbb黄色大片| 又粗又爽又猛毛片免费看| e午夜精品久久久久久久| 精华霜和精华液先用哪个| 久久草成人影院| 男女下面进入的视频免费午夜| 成人18禁在线播放| 国产成年人精品一区二区| 丁香六月欧美| 性色av乱码一区二区三区2| 国产精品99久久久久久久久| 国产精品日韩av在线免费观看| av黄色大香蕉| 国产主播在线观看一区二区| 特大巨黑吊av在线直播| 黄色日韩在线| 神马国产精品三级电影在线观看| 国产精品久久视频播放| 国产伦一二天堂av在线观看| 久久精品综合一区二区三区| av专区在线播放| 97超视频在线观看视频| 日韩欧美国产在线观看| 国产精品久久久久久精品电影| 国产单亲对白刺激| 亚洲av成人不卡在线观看播放网| 亚洲av第一区精品v没综合| 真人做人爱边吃奶动态| 国产免费男女视频| 天堂√8在线中文| 中文在线观看免费www的网站| 搡女人真爽免费视频火全软件 | 国产美女午夜福利| 日韩成人在线观看一区二区三区| 国产精品永久免费网站| 国产黄a三级三级三级人| 搡老熟女国产l中国老女人| 亚洲欧美日韩卡通动漫| 午夜福利在线观看免费完整高清在 | 狠狠狠狠99中文字幕| 国产亚洲精品av在线| 亚洲国产欧美人成| 免费在线观看日本一区| 亚洲美女视频黄频| 精品午夜福利视频在线观看一区| 国产野战对白在线观看| 很黄的视频免费| 国产午夜福利久久久久久| 天天躁日日操中文字幕| 级片在线观看| 热99在线观看视频| 精品久久久久久成人av| 男人舔女人下体高潮全视频| 亚洲一区高清亚洲精品| av天堂在线播放| av女优亚洲男人天堂| 不卡一级毛片| 亚洲成av人片免费观看| 熟女电影av网| 18禁裸乳无遮挡免费网站照片| 亚洲专区国产一区二区| 啪啪无遮挡十八禁网站| 成人国产综合亚洲| 免费人成视频x8x8入口观看| 又黄又爽又免费观看的视频| 亚洲欧美日韩卡通动漫| 欧美精品啪啪一区二区三区| 久久久久久大精品| 91在线观看av| 亚洲性夜色夜夜综合| 亚洲成av人片在线播放无| 亚洲av电影在线进入| 99久久99久久久精品蜜桃| 天天添夜夜摸| 一本综合久久免费| 搡老妇女老女人老熟妇| 欧美精品啪啪一区二区三区| 女人十人毛片免费观看3o分钟| 在线十欧美十亚洲十日本专区| 中文字幕熟女人妻在线| 国产午夜精品论理片| 亚洲av一区综合| 又黄又粗又硬又大视频| 一个人免费在线观看电影| 内射极品少妇av片p| 亚洲欧美日韩卡通动漫| 网址你懂的国产日韩在线| 嫩草影院入口| 变态另类成人亚洲欧美熟女| 国产成人影院久久av| 熟女电影av网| 成年人黄色毛片网站| 我的老师免费观看完整版| 别揉我奶头~嗯~啊~动态视频| 麻豆久久精品国产亚洲av| 久9热在线精品视频| 精品人妻偷拍中文字幕| 亚洲欧美激情综合另类| 在线天堂最新版资源| 少妇丰满av| 内地一区二区视频在线| 久久精品国产清高在天天线| 蜜桃久久精品国产亚洲av| 国产高清激情床上av| 99久久久亚洲精品蜜臀av| 欧美激情在线99| 欧美日韩精品网址| 老鸭窝网址在线观看| 久久国产精品影院| 欧美xxxx黑人xx丫x性爽| 久久久久性生活片| 欧美三级亚洲精品| 啦啦啦观看免费观看视频高清| 国产一区二区在线av高清观看| netflix在线观看网站| 观看美女的网站| 在线a可以看的网站| 久久久久国内视频| 国产极品精品免费视频能看的| 成人性生交大片免费视频hd| 国产三级中文精品| 日本黄色片子视频| 色噜噜av男人的天堂激情| 亚洲最大成人手机在线| 日日夜夜操网爽| av中文乱码字幕在线| 欧美日韩亚洲国产一区二区在线观看| 日韩欧美精品v在线| 亚洲av不卡在线观看| 日本 av在线| 真实男女啪啪啪动态图| 久久久久久大精品| 成人高潮视频无遮挡免费网站| 搡老妇女老女人老熟妇| 国产老妇女一区| 男人和女人高潮做爰伦理| 日本黄色视频三级网站网址| 无人区码免费观看不卡| 午夜免费成人在线视频| 国产v大片淫在线免费观看| 少妇丰满av| 亚洲人成网站高清观看| 一个人免费在线观看的高清视频| 国内精品一区二区在线观看| 青草久久国产| 亚洲av成人不卡在线观看播放网| 成人亚洲精品av一区二区| 男女床上黄色一级片免费看| 看黄色毛片网站| 99国产精品一区二区蜜桃av| 国产极品精品免费视频能看的| 国产视频内射| 久久精品国产亚洲av香蕉五月| 99热这里只有是精品50| 国产精品日韩av在线免费观看| 亚洲国产欧美网| 国产高清有码在线观看视频| av天堂中文字幕网| 1024手机看黄色片| 99国产极品粉嫩在线观看| 精品日产1卡2卡| 亚洲精品色激情综合| 香蕉久久夜色| 色精品久久人妻99蜜桃| 久久久久久人人人人人| 色综合欧美亚洲国产小说| 88av欧美| netflix在线观看网站| 欧美成人a在线观看| 午夜福利高清视频| 桃色一区二区三区在线观看| 一区福利在线观看| 99热精品在线国产| 在线观看美女被高潮喷水网站 | 国产精品 欧美亚洲| 国产一区二区亚洲精品在线观看| 成人高潮视频无遮挡免费网站| 日本一二三区视频观看| av天堂在线播放| 久久久久精品国产欧美久久久| 女生性感内裤真人,穿戴方法视频| 成人高潮视频无遮挡免费网站| 亚洲成av人片免费观看| 欧美日本亚洲视频在线播放| 一本精品99久久精品77| 欧美性猛交黑人性爽| 老熟妇乱子伦视频在线观看| 久99久视频精品免费| 亚洲成人中文字幕在线播放| 国产高清三级在线| 观看美女的网站| 99视频精品全部免费 在线| 国产成人影院久久av| 午夜免费成人在线视频| 尤物成人国产欧美一区二区三区| 女生性感内裤真人,穿戴方法视频| 又黄又爽又免费观看的视频|