• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃方法研究

    2019-08-14 10:02:30王毅然經(jīng)小川孫運(yùn)乾從帥軍
    關(guān)鍵詞:規(guī)劃動(dòng)作智能

    王毅然 經(jīng)小川 田 濤 孫運(yùn)乾 從帥軍

    (中國(guó)航天系統(tǒng)科學(xué)與工程研究院 北京 100048)

    0 引 言

    隨著科學(xué)技術(shù)的不斷發(fā)展,路徑規(guī)劃技術(shù)的研究成果已經(jīng)廣泛應(yīng)用人類生產(chǎn)和生活的各個(gè)方面。如在地震救災(zāi)中,無(wú)人機(jī)能夠自主躲避障礙物,規(guī)劃一組較優(yōu)的路徑到達(dá)指定災(zāi)區(qū),完成災(zāi)情獲取任務(wù);在軍事領(lǐng)域中,無(wú)人機(jī)和機(jī)器人在完成情報(bào)偵察以及作戰(zhàn)打擊任務(wù)過程中,要躲避敵方威脅和避免相撞,規(guī)劃一條較優(yōu)路徑完成任務(wù)[1-4]。隨著工作任務(wù)變得越來(lái)越復(fù)雜,往往需要多個(gè)智能體協(xié)同完成任務(wù),每個(gè)智能體均是環(huán)境中的一部分,個(gè)體采取行動(dòng)均會(huì)造成環(huán)境的改變,此時(shí)在動(dòng)態(tài)環(huán)境中,單個(gè)智能體和其他智能體之間的協(xié)調(diào)與避障是多個(gè)智能體路徑規(guī)劃亟需解決的問題。路徑規(guī)劃的目標(biāo)是尋找一條從給定的起始點(diǎn)到終止點(diǎn)的較優(yōu)的運(yùn)動(dòng)路徑。單智能體的路徑規(guī)劃在一個(gè)環(huán)境中的狀態(tài)是有限的,目前解決的方法主要有Dijkstra算法[5]、粒子群算法[6]、A*算法[7]、遺傳算法、模擬退火算法、蟻群算法[8]等。多智能體系統(tǒng)與單個(gè)智能體相比,往往能夠完成復(fù)雜艱巨任務(wù),且通常能夠付出更小的代價(jià)收獲更大的整體效益,因此多個(gè)智能體的路徑規(guī)劃研究具有十分重要的意義。

    多智能體系統(tǒng)是由具有一定自主性、能夠在共同目標(biāo)窗口內(nèi)協(xié)作、競(jìng)爭(zhēng)和通信的協(xié)作智能Agent組成的[9]。單個(gè)Agent解決問題的能力是有限的,復(fù)雜任務(wù)需要多個(gè)Agent協(xié)同合作,共同完成整體或局部目標(biāo)。如果在同一環(huán)境中存在多個(gè)Agent同時(shí)移動(dòng),對(duì)其進(jìn)行路徑規(guī)劃將會(huì)變得十分困難。目前解決多智能體的路徑規(guī)劃問題取得了一些進(jìn)展,文獻(xiàn)[10]提出了免疫協(xié)同進(jìn)化算法并仿真實(shí)現(xiàn)靜態(tài)障礙物環(huán)境中多個(gè)機(jī)器人避障、避碰的最短路徑;文獻(xiàn)[11]提出了一種主從結(jié)構(gòu)的并行多水下機(jī)器人協(xié)同路徑規(guī)劃算法,子層結(jié)構(gòu)應(yīng)用粒子群并行算法,生成各個(gè)機(jī)器人當(dāng)前的最優(yōu)路徑,同時(shí)主層結(jié)構(gòu)應(yīng)用微分進(jìn)化算法實(shí)時(shí)給出當(dāng)前考慮機(jī)器人與障礙物、機(jī)器人與機(jī)器人之間避碰情況下,總系統(tǒng)運(yùn)行時(shí)間最短的路徑組合方案;文獻(xiàn)[12]提出了一種基于分層強(qiáng)化學(xué)習(xí)及人工勢(shì)場(chǎng)的多Agent路徑規(guī)劃算法,首先將多Agent的運(yùn)行環(huán)境虛擬為一個(gè)人工勢(shì)能場(chǎng),根據(jù)先驗(yàn)知識(shí)確定每點(diǎn)的勢(shì)能值,它代表最優(yōu)策略可獲得的最大回報(bào),其次利用分層強(qiáng)化學(xué)習(xí)方法的無(wú)環(huán)境模型學(xué)習(xí)進(jìn)行策略更新;文獻(xiàn)[13]提出了首先利用A-Star算法啟發(fā)式地得到多個(gè)智能體到達(dá)目標(biāo)點(diǎn)的臨時(shí)最短路徑,同時(shí)計(jì)算訪問節(jié)點(diǎn)的時(shí)間,通過動(dòng)態(tài)地對(duì)時(shí)間窗進(jìn)行精確計(jì)算和加鎖來(lái)重置路線以避免沖突。

    為解決未知環(huán)境下多個(gè)Agent路徑規(guī)劃問題,上述算法隨著Agent的數(shù)量以及環(huán)境規(guī)模變大時(shí),算法的效率會(huì)變得很低。本文提出了一種基于強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃方法(Multi-agent path planning based on reinforcement learning,MAPP-RL),該方法中的多個(gè)Agent不斷地與環(huán)境交互,當(dāng)采取一個(gè)動(dòng)作后,Agent會(huì)從環(huán)境中得到一個(gè)反饋,用來(lái)評(píng)估該動(dòng)作的好壞,然后把評(píng)估結(jié)果作為歷史經(jīng)驗(yàn),不斷地進(jìn)行優(yōu)化決策,最后找到一個(gè)可以得到最大獎(jiǎng)勵(lì)的動(dòng)作序列,完成復(fù)雜未知環(huán)境下的多Agent路徑規(guī)劃任務(wù)。

    1 整體框架

    多智能體的路徑規(guī)劃整體框架主要包括四個(gè)層次:環(huán)境建模層、算法層、任務(wù)分配層、多Agent系統(tǒng)層,如圖1所示。

    圖1 整體框架圖

    在圖1中,首先對(duì)環(huán)境進(jìn)行建模,包括對(duì)環(huán)境中障礙、目標(biāo)點(diǎn)等信息設(shè)置,其次通過任務(wù)分配層主要根據(jù)實(shí)際任務(wù)劃分多個(gè)子任務(wù),然后算法層接收環(huán)境信息以及多個(gè)Agent信息和任務(wù)分配情況,并進(jìn)行計(jì)算,將結(jié)果返回給Agent。多Agent系統(tǒng)層與環(huán)境建模層、任務(wù)分配層、算法層進(jìn)行交互,每個(gè)Agent均能執(zhí)行動(dòng)作與環(huán)境交互,同時(shí)也和任務(wù)分配模塊的任務(wù)進(jìn)行匹配,通過執(zhí)行算法層,不斷地更新策略,最后得到一組較優(yōu)策略完成多個(gè)Agent的路徑規(guī)劃任務(wù)。

    1.1 環(huán)境建模

    對(duì)環(huán)境地圖的建模常用的方法主要有三種:柵欄地圖建模、拓?fù)涞貓D建模和可視地圖建模。本文采用的是柵欄建模法,如圖2所示將環(huán)境分成n2個(gè)面積相同的方格,每個(gè)方格均攜帶不同0~3的參數(shù)信息,當(dāng)格子參數(shù)為0時(shí)表示該區(qū)域無(wú)障礙物,當(dāng)格子參數(shù)為1時(shí)表示該區(qū)域含有障礙物,當(dāng)格子參數(shù)為2時(shí)表示智能體的位置信息,當(dāng)格子參數(shù)為3時(shí)表示目標(biāo)點(diǎn)的位置信息。通過構(gòu)建柵欄地圖,能夠很好地獲取環(huán)境的信息。

    圖2 柵欄環(huán)境圖

    1.2 任務(wù)分配

    任務(wù)分配是多智能體協(xié)同合作中的一個(gè)重要研究?jī)?nèi)容。多Agent的路徑規(guī)劃的任務(wù)分配問題為:現(xiàn)假設(shè)系統(tǒng)環(huán)境中存在m個(gè)目標(biāo)點(diǎn),每個(gè)目標(biāo)點(diǎn)至少一個(gè)Agent到達(dá),所有目標(biāo)點(diǎn)都有Agent到達(dá)時(shí)任務(wù)完成。該任務(wù)分配的目標(biāo)是將多個(gè)目標(biāo)點(diǎn)分別分配給Agent,以實(shí)現(xiàn)整體Agent到達(dá)目標(biāo)點(diǎn)的路徑總和最短。

    1.3 多Agent路徑規(guī)劃算法

    多Agent路徑規(guī)劃算法主要解決的問題是多個(gè)Agent的路徑規(guī)劃問題。本文采用的是基于強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃方法,多個(gè)Agent在同一環(huán)境中,不斷與環(huán)境交互,根據(jù)環(huán)境的反饋進(jìn)一步優(yōu)化動(dòng)作,完成整體的路徑規(guī)劃。對(duì)多個(gè)Agent進(jìn)行路徑規(guī)劃主要有三個(gè)目標(biāo):一是對(duì)多個(gè)Agent進(jìn)行路線規(guī)劃時(shí)要考慮Agent間的路徑?jīng)_突問題,避免多個(gè)Agent相撞;二是多個(gè)Agent進(jìn)行路線選擇時(shí)要避開障礙物;三是多個(gè)Agent到達(dá)目標(biāo)點(diǎn)的路徑總和盡可能的短。

    2 基于強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

    2.1 強(qiáng)化學(xué)習(xí)相關(guān)理論

    強(qiáng)化學(xué)習(xí)是一種無(wú)監(jiān)督學(xué)習(xí)方法,Agent通過與動(dòng)態(tài)環(huán)境的反復(fù)交互,學(xué)會(huì)選擇最優(yōu)或近最優(yōu)的行為以實(shí)現(xiàn)其長(zhǎng)期目標(biāo)[14]。Sutton和Barto定義了強(qiáng)化學(xué)習(xí)方法的四個(gè)關(guān)鍵要素:策略、獎(jiǎng)賞函數(shù)、價(jià)值函數(shù)、環(huán)境模型[15]。強(qiáng)化學(xué)習(xí)的基本模型主要包括環(huán)境和智能體兩部分,如圖3所示。

    圖3 強(qiáng)化學(xué)習(xí)基本模型

    在圖3中,Agent根據(jù)當(dāng)前所處的環(huán)境狀態(tài),執(zhí)行一個(gè)動(dòng)作與環(huán)境交互,從環(huán)境中得到一個(gè)獎(jiǎng)勵(lì),同時(shí)到達(dá)新的狀態(tài),進(jìn)行學(xué)習(xí)更新策略,接著再執(zhí)行一個(gè)動(dòng)作作用于環(huán)境,不斷重復(fù)此過程,優(yōu)化策略完成任務(wù)。

    很多強(qiáng)化學(xué)習(xí)問題可以形式化為馬爾可夫決策過程(Markov decision process,MDP)。MDP是由〈S,A,P,R,γ〉構(gòu)成的一個(gè)元組,其中:

    S是一個(gè)有限狀態(tài)集;

    A是一個(gè)有限行為集;

    P是集合中基于行為的狀態(tài)轉(zhuǎn)移概率矩陣:

    R是基于狀態(tài)和行為的獎(jiǎng)勵(lì)函數(shù):

    γ是一個(gè)衰減因子:γ∈[0,1]。

    2.2 多Agent路徑規(guī)劃

    在多Agent的強(qiáng)化學(xué)習(xí)過程中,每個(gè)Agent獲得的獎(jiǎng)勵(lì)不僅僅取決于Agent自身的動(dòng)作,同時(shí)還依賴于其他Agent的動(dòng)作。因此本文將強(qiáng)化學(xué)習(xí)的MDP模型擴(kuò)展為多馬爾科夫決策過程(MDPs)?,F(xiàn)假設(shè)有n個(gè)智能體,每個(gè)Agent可以選擇的動(dòng)作m個(gè)(即ai,i=1,2,…,m),每個(gè)Agent的狀態(tài)個(gè)數(shù)為k個(gè)(即sj,j=1,2,…,m),則多個(gè)Agent采取的聯(lián)合動(dòng)作可以表示為Ai,多個(gè)Agent的聯(lián)合狀態(tài)可以表示為Si。基于強(qiáng)化學(xué)習(xí)的基本模型,結(jié)合本文的任務(wù)目標(biāo),本文定義了多Agent的路徑規(guī)劃學(xué)習(xí)框架,具體情況如圖4所示。

    圖4 多Agent路徑規(guī)劃學(xué)習(xí)框架

    在圖4中,為了提高Agent的學(xué)習(xí)速度,本文中我們首先對(duì)多Agent所處的環(huán)境進(jìn)行了預(yù)處理操作,剔除了一些無(wú)關(guān)的環(huán)境狀態(tài),同時(shí)將先驗(yàn)信息更新到知識(shí)庫(kù),提高了多Agent的學(xué)習(xí)效率。在該模型中,多個(gè)Agent基于當(dāng)前所處的狀態(tài)St,每個(gè)Agent根據(jù)知識(shí)庫(kù)的歷史經(jīng)驗(yàn),按照一定的策略規(guī)則采取動(dòng)作集中的一個(gè)動(dòng)作at,所有的Agent的動(dòng)作組合成一次聯(lián)合動(dòng)作At作用于環(huán)境。當(dāng)聯(lián)合動(dòng)作At執(zhí)行完畢后,環(huán)境將轉(zhuǎn)化為一個(gè)新的狀態(tài)St+1,并且得到一個(gè)新的獎(jiǎng)勵(lì)值Rt+1。然后進(jìn)行學(xué)習(xí),更新歷史經(jīng)驗(yàn),進(jìn)一步完善知識(shí)庫(kù)。接著根據(jù)Agen所處的新狀態(tài)St+1和Rt+1選擇新的聯(lián)合動(dòng)作At+1。多個(gè)Agent與環(huán)境進(jìn)行周期性交互,不斷重復(fù)“探索-學(xué)習(xí)-決策-利用”過程,從歷史動(dòng)作中進(jìn)行學(xué)習(xí)更新自己的知識(shí)庫(kù),作為歷史經(jīng)驗(yàn)指導(dǎo)下次動(dòng)作選擇。

    2.3 多Agent路徑規(guī)劃學(xué)習(xí)算法實(shí)現(xiàn)

    2.3.1聯(lián)合狀態(tài)設(shè)定準(zhǔn)則

    2.3.2聯(lián)合動(dòng)作

    2.3.3獎(jiǎng)勵(lì)函數(shù)

    獎(jiǎng)勵(lì)函數(shù)定義了Agent的學(xué)習(xí)目標(biāo),并確定了Agent基于環(huán)境的感知狀態(tài)即時(shí)行動(dòng)的價(jià)值。由于Agent試圖最大限度地獲得總報(bào)酬,因此獎(jiǎng)勵(lì)函數(shù)本質(zhì)上是用來(lái)指導(dǎo)Agent實(shí)現(xiàn)其目標(biāo)的。獎(jiǎng)勵(lì)函數(shù)的設(shè)置會(huì)決定強(qiáng)化學(xué)習(xí)算法的收斂速度和程度。常用的獎(jiǎng)勵(lì)函數(shù)設(shè)置方法有:稀疏獎(jiǎng)勵(lì)、形式化獎(jiǎng)勵(lì)、獎(jiǎng)勵(lì)系數(shù)變化獎(jiǎng)勵(lì)等。本文采用的是稀疏獎(jiǎng)勵(lì)的形式定義獎(jiǎng)勵(lì)函數(shù),設(shè)置情況如下式所示:

    式中:a,b,c>0。

    如式(1)所示,多Agent的路徑規(guī)劃目標(biāo)是讓多個(gè)Agent采取一組可以獲得最大獎(jiǎng)勵(lì)的動(dòng)作序列,到達(dá)指定的目標(biāo)點(diǎn)。當(dāng)Agent完成目標(biāo)時(shí),賦予一個(gè)正的獎(jiǎng)勵(lì);當(dāng)Agent碰到靜態(tài)障礙物時(shí),賦予一個(gè)負(fù)的獎(jiǎng)勵(lì);當(dāng)有兩個(gè)或以上的Agent相互碰撞時(shí),賦予一個(gè)負(fù)的獎(jiǎng)勵(lì);其他情況的獎(jiǎng)勵(lì)值為0。

    2.3.4價(jià)值更新函數(shù)

    多Agent的路徑規(guī)劃采用的是Q-learning算法,在確定所有聯(lián)合環(huán)境狀態(tài)S和聯(lián)合動(dòng)作A后,要生成一個(gè)nm×km維的矩陣Q,矩陣中的元素Q(S,A)表示為多個(gè)Agent在環(huán)境狀態(tài)St下選擇動(dòng)作At的價(jià)值。

    更新的過程:當(dāng)多個(gè)Agent在環(huán)境狀態(tài)St下,按照既定的動(dòng)作選擇策略,選擇一個(gè)聯(lián)合動(dòng)作At,執(zhí)行完動(dòng)作后Agent到達(dá)一個(gè)新的環(huán)境狀態(tài)St+1,這時(shí)我們開始更新矩陣Q中的Q(S,A)值。Agent在狀態(tài)St+1時(shí)選擇Q矩陣對(duì)應(yīng)Q值最大的Q(St+1,At+1),然后把Q(St+1,At+1)乘上一個(gè)衰減值γ并加上到達(dá)St+1時(shí)所獲取的獎(jiǎng)勵(lì)R作為現(xiàn)實(shí)中Q(S,A)的值,然后減去之前的Q(S,A),接著乘以一個(gè)學(xué)習(xí)效率α累加上最初的Q(S,A)的值則更新為新的Q(S,A)。具體Q(S,A)值的更新公式如下式所示:

    Q(St,At)←Q(St,At)+α[R+

    γmaxAt+1Q(St+1,At+1)-Q(St,At)]

    (2)

    2.3.5動(dòng)作選擇策略

    在強(qiáng)化學(xué)習(xí)問題中,探索和利用是一對(duì)矛盾:探索意味著Agent必須嘗試不同的行為繼而收集更多的信息,利用則是Agent做出當(dāng)前信息下的最佳決定[15]。探索可能會(huì)犧牲一些短期利益,通過搜集更多信息而獲得較為長(zhǎng)期準(zhǔn)確的利益估計(jì);利用則側(cè)重于根據(jù)已掌握的信息而做到短期利益最大化。探索不能無(wú)止境地進(jìn)行,否則就犧牲了太多的短期利益進(jìn)而導(dǎo)致整體利益受損;同時(shí)也不能太看重短期利益而忽視一些未探索的可能會(huì)帶來(lái)巨大利益的行為。

    目前,常用的探索方法有:ε-貪婪探索、不確定優(yōu)先探索以及利用信息價(jià)值進(jìn)行探索等。本文采用的是ε-貪婪探索,這里的ε是Agent隨機(jī)選擇的概率(0≤ε≤1),在概率為1-ε的情況下,Agent使用貪婪的Q值方法選擇Q值最大所對(duì)應(yīng)的一個(gè)動(dòng)作,當(dāng)存在多個(gè)Q值相同的動(dòng)作時(shí)隨機(jī)選擇一個(gè);在概率為ε的情況下,Agent從動(dòng)作集合中隨機(jī)選擇動(dòng)作。

    2.3.6多Agent路徑規(guī)劃算法步驟

    在多Agent的路徑規(guī)劃中,多個(gè)Agent根據(jù)當(dāng)前所處的環(huán)境狀態(tài),不斷地與環(huán)境進(jìn)行交互,在學(xué)習(xí)過程中對(duì)學(xué)習(xí)結(jié)果進(jìn)行更新修正,用于指導(dǎo)Agent的動(dòng)作選擇,最終通過不斷的學(xué)習(xí),找到一組可以最大化獎(jiǎng)勵(lì)的動(dòng)作序列,完成多Agent路徑規(guī)劃任務(wù)。該方法的偽代碼如算法1所示。

    算法1多Agent路徑規(guī)劃算法

    Initialize:St,Q(s,a)

    Repeat(for each episode): InitializeS

    WhileStis notST

    If (Probability<ε)

    chooseAt=maxQ(St)

    Else

    Random chooseAt

    Take actionAt,returnR和S’

    UpdateQ(s,a)

    S←S’

    IfStisST

    Break

    該算法的具體學(xué)習(xí)過程的形式化描述如下:

    (1) 初始化設(shè)置:地圖生成,設(shè)置Agent和目標(biāo)點(diǎn)的數(shù)量及初始位置,獎(jiǎng)勵(lì)函數(shù)設(shè)置,Q表初始化。

    (2) 參數(shù)設(shè)置:終止學(xué)習(xí)周期Tmax,學(xué)習(xí)效率α、衰減度γ和探索度ε。

    (3) 根據(jù)ε-貪婪策略選擇動(dòng)作At。

    (4) 執(zhí)行At,返回獎(jiǎng)勵(lì)值R和下一個(gè)狀態(tài)St+1。

    (5) 按式(2)更新Q值。

    (6) 判斷是否滿足終止條件:若滿足終止條件,執(zhí)行(7);否則,執(zhí)行(3)。

    (7)T:=T+1,判斷T>Tmax:若成立,則學(xué)習(xí)結(jié)束;否則轉(zhuǎn)(3)。

    3 實(shí)驗(yàn)仿真與分析

    3.1 實(shí)驗(yàn)設(shè)置

    為了驗(yàn)證該方法的有效性,本文多個(gè)Agent的路徑規(guī)劃設(shè)置了一個(gè)虛擬的環(huán)境。與文獻(xiàn)[16]一樣,本文創(chuàng)造了不同大小的柵欄地圖環(huán)境,其中障礙和目標(biāo)點(diǎn)是隨機(jī)生成的。如圖5所示,我們?cè)O(shè)置了包含7個(gè)障礙、兩個(gè)智能體、兩個(gè)目標(biāo)點(diǎn)的7×7大小的原始環(huán)境地圖。

    圖5 實(shí)驗(yàn)環(huán)境

    針對(duì)同一任務(wù)目標(biāo),將文獻(xiàn)[16]的方法與本文方法進(jìn)行實(shí)驗(yàn)對(duì)比。其中文獻(xiàn)[16]智能體的動(dòng)作集合為{U,D,L,R,S},其中U代表向上,D代表向下,L代表向左,R代表向右,S代表靜止不動(dòng)。本文方法的兩個(gè)Agent的聯(lián)合動(dòng)作集為:

    其中文獻(xiàn)[16]的獎(jiǎng)勵(lì)函數(shù)R′設(shè)置如式(3)所示,本文方法的獎(jiǎng)勵(lì)函數(shù)R具體設(shè)置如式(4)所示。

    文獻(xiàn)[16]和本文方法采用同一的學(xué)習(xí)更新函數(shù)的參數(shù)設(shè)置,如表1所示。

    表1 更新函數(shù)的參數(shù)設(shè)置

    本次實(shí)驗(yàn)假設(shè)兩個(gè)智能體在環(huán)境中同時(shí)運(yùn)動(dòng),不會(huì)出現(xiàn)故障情況,每次只能選擇動(dòng)作集合中的一個(gè),環(huán)境是有邊界的,當(dāng)Agent選擇超出邊界的動(dòng)作時(shí),強(qiáng)制Agent留在環(huán)境內(nèi)。任務(wù)目標(biāo)是第2行第2列的Agent1到達(dá)第5行第6列的目標(biāo)點(diǎn),同時(shí)第2行第4列的Agent2到達(dá)第6行第4列的目標(biāo)點(diǎn),在Agent移動(dòng)期間要避免相撞和避開障礙物。

    3.2 實(shí)驗(yàn)結(jié)果與分析

    為了驗(yàn)證本文方法的有效性,針對(duì)上述同一任務(wù)目標(biāo),進(jìn)行兩組實(shí)驗(yàn),將本文方法與文獻(xiàn)[16]方法進(jìn)行對(duì)比,兩組實(shí)驗(yàn)均訓(xùn)練4 000次。

    本文運(yùn)用文獻(xiàn)[16]方法進(jìn)行仿真實(shí)驗(yàn),該方法分為兩個(gè)階段,首先分別對(duì)每個(gè)智能體進(jìn)行路徑規(guī)劃,其次對(duì)發(fā)生碰撞的Agent進(jìn)行動(dòng)態(tài)調(diào)整。實(shí)驗(yàn)環(huán)境在圖5基礎(chǔ)上,分別進(jìn)行單個(gè)智能體和目標(biāo)點(diǎn)實(shí)驗(yàn)。首次實(shí)驗(yàn)時(shí)其中第2行第2列的Agent1運(yùn)動(dòng)軌跡如圖6(a)所示。在圖6(a)中,Agent1在第5個(gè)步長(zhǎng)時(shí)與靜態(tài)障礙物發(fā)生碰撞,Agent1的動(dòng)作序列分別為:{D→R→R→D→D},這是由于首次實(shí)驗(yàn),Agent并沒有歷史經(jīng)驗(yàn)作為決策依據(jù),而是隨機(jī)的選擇動(dòng)作,不斷“試錯(cuò)”。經(jīng)過Agent不斷與環(huán)境交互,更新Q表,進(jìn)行動(dòng)作選擇,Agent的最終路徑規(guī)劃路線結(jié)果如圖6(b)所示,Agent1到達(dá)目標(biāo)點(diǎn)的總步長(zhǎng)為7。

    (a) 首次實(shí)驗(yàn)軌跡 (b) 最終運(yùn)動(dòng)軌跡圖6 Agent1實(shí)驗(yàn)結(jié)果圖

    類似地,第2行第4列的Agent2運(yùn)動(dòng)軌跡如圖7(a)所示,Agent2在第4個(gè)步長(zhǎng)時(shí)與靜態(tài)障礙物發(fā)生碰撞,Agent2的動(dòng)作序列為{L→U→R→R},經(jīng)過4 000次學(xué)習(xí),得到的最終路徑規(guī)劃結(jié)果如圖7(b)所示,Agent2到達(dá)目標(biāo)點(diǎn)的總步長(zhǎng)為6。

    (a) 首次實(shí)驗(yàn)軌跡(b) 最終運(yùn)動(dòng)軌跡圖7 Agent2首次實(shí)驗(yàn)運(yùn)動(dòng)軌跡

    從圖6(b)和圖7(b)可以看出,當(dāng)兩個(gè)Agent在同一環(huán)境同時(shí)移動(dòng)時(shí),會(huì)在第2行第3列的位置相撞,運(yùn)用動(dòng)態(tài)規(guī)劃思想對(duì)Agent的路徑重新調(diào)整,最終的路徑規(guī)劃如圖8所示。在圖8中兩個(gè)Agent在同一環(huán)境中同時(shí)移動(dòng),且能夠躲避障礙物,兩個(gè)Agent不會(huì)發(fā)生相撞,到達(dá)目標(biāo)點(diǎn)路徑最短。

    圖8 最終路徑規(guī)劃結(jié)果

    運(yùn)用本文的方法,在圖5所示的環(huán)境中進(jìn)行實(shí)驗(yàn)。首次實(shí)驗(yàn)時(shí),兩個(gè)Agent經(jīng)過18個(gè)步長(zhǎng)發(fā)生了相撞。這是由于本文的方法加入了先驗(yàn)信息,有歷史經(jīng)驗(yàn)作為決策支持,首次實(shí)驗(yàn)時(shí)避免了對(duì)障礙的學(xué)習(xí),使Agent進(jìn)行試錯(cuò)時(shí)避開了障礙。經(jīng)過499次回合訓(xùn)練后,兩個(gè)Agent第一次到達(dá)目標(biāo)點(diǎn),完成任務(wù)的總步長(zhǎng)為50。訓(xùn)練4 000次后最終的路徑規(guī)劃結(jié)果如圖9所示,總步長(zhǎng)為14,其中聯(lián)合動(dòng)作序列為:

    {DL→RS→DD→RD→RD→RD→DR}

    圖9 回合訓(xùn)練結(jié)果

    為了驗(yàn)證本文的有效性,本文從總探索步數(shù)、完成任務(wù)的平均步數(shù)做了對(duì)比,具體情況如圖10、圖11所示。在圖10中,文獻(xiàn)[16]的總探索步數(shù)是65 810步,本文方法的總探索步數(shù)是54 375步,由于本文方法兩個(gè)Agent采取動(dòng)作時(shí)要考慮雙方的位置信息,引入聯(lián)合動(dòng)作,避免了對(duì)單個(gè)Agent相撞后的路徑重新規(guī)劃,減少了17.4%的總探索步數(shù)。從圖11得出,本文完成任務(wù)的平均步數(shù)與文獻(xiàn)[16]相比減少了5步。

    圖10 總探索步數(shù)

    4 結(jié) 語(yǔ)

    為解決復(fù)雜任務(wù)下多個(gè)Agent路徑規(guī)劃問題,本文提出一種基于強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃方法。首先建立了多Agent路徑強(qiáng)化學(xué)習(xí)模型,并詳細(xì)描述了各個(gè)基本要素,以及多個(gè)Agent如何從歷史數(shù)據(jù)中積累經(jīng)驗(yàn)優(yōu)化決策。通過仿真實(shí)驗(yàn)表明,該方法是可行、有效的。為了提高該方法的學(xué)習(xí)效率,本文提出了2種解決方案:(1) 環(huán)境預(yù)處理,根據(jù)實(shí)際任務(wù)以及多Agent的信息,剔除一些無(wú)關(guān)的環(huán)境狀態(tài);(2) 加入先驗(yàn)信息的Agent決策Q表,基于先驗(yàn)信息更新Q表,作為歷史經(jīng)驗(yàn)提供給Agent,大大提高了Agent的學(xué)習(xí)效率,與文獻(xiàn)[16]方法相比,減少了17.4%的總探索步數(shù)。下一步將研究多Agent動(dòng)態(tài)目標(biāo)的路徑規(guī)劃問題,實(shí)現(xiàn)多Agent在復(fù)雜任務(wù)下的自主路徑?jīng)Q策。

    猜你喜歡
    規(guī)劃動(dòng)作智能
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    動(dòng)作描寫要具體
    規(guī)劃引領(lǐng)把握未來(lái)
    快遞業(yè)十三五規(guī)劃發(fā)布
    商周刊(2017年5期)2017-08-22 03:35:26
    畫動(dòng)作
    動(dòng)作描寫不可少
    多管齊下落實(shí)規(guī)劃
    中文资源天堂在线| 国产女主播在线喷水免费视频网站 | 久久久欧美国产精品| av天堂中文字幕网| 亚洲成人精品中文字幕电影| 亚洲熟妇中文字幕五十中出| 午夜免费激情av| 三级国产精品片| 大又大粗又爽又黄少妇毛片口| 国产精品国产高清国产av| 波多野结衣高清无吗| 亚洲内射少妇av| 国产精品久久久久久av不卡| 日日干狠狠操夜夜爽| 国产午夜福利久久久久久| 成年版毛片免费区| 国产av码专区亚洲av| 国产三级中文精品| 夫妻性生交免费视频一级片| 免费无遮挡裸体视频| 美女大奶头视频| 亚洲最大成人av| 国产人妻一区二区三区在| 亚洲在线自拍视频| 夜夜看夜夜爽夜夜摸| 九九久久精品国产亚洲av麻豆| 两个人视频免费观看高清| 久久99热6这里只有精品| 免费人成在线观看视频色| 亚洲电影在线观看av| 搡女人真爽免费视频火全软件| 亚洲av一区综合| 韩国高清视频一区二区三区| 中国美白少妇内射xxxbb| 婷婷色麻豆天堂久久 | 国产 一区 欧美 日韩| .国产精品久久| 男女下面进入的视频免费午夜| 日韩成人av中文字幕在线观看| 精品人妻熟女av久视频| 国产伦精品一区二区三区四那| 国产免费福利视频在线观看| 亚洲国产欧洲综合997久久,| 国产精品熟女久久久久浪| av黄色大香蕉| 国产老妇女一区| 最新中文字幕久久久久| 亚洲欧美日韩卡通动漫| 国产91av在线免费观看| 99久久九九国产精品国产免费| 亚洲成人中文字幕在线播放| av在线播放精品| 久久草成人影院| 国产免费男女视频| 亚洲精品日韩av片在线观看| 久久精品久久精品一区二区三区| 中文字幕制服av| 亚洲最大成人中文| 日韩精品有码人妻一区| 六月丁香七月| 亚洲欧美精品综合久久99| 精品一区二区三区视频在线| 国产精品久久电影中文字幕| 国产精品一区二区在线观看99 | 搡女人真爽免费视频火全软件| 国产精品久久久久久av不卡| 乱码一卡2卡4卡精品| 人体艺术视频欧美日本| 国产精品,欧美在线| 18禁裸乳无遮挡免费网站照片| 国产91av在线免费观看| 亚洲av二区三区四区| 亚洲欧美成人综合另类久久久 | 亚洲精品aⅴ在线观看| 久久久久久国产a免费观看| 日韩亚洲欧美综合| 可以在线观看毛片的网站| 午夜福利网站1000一区二区三区| 亚洲欧洲日产国产| 99热6这里只有精品| 国产伦精品一区二区三区四那| 亚洲精品自拍成人| 偷拍熟女少妇极品色| 又爽又黄无遮挡网站| 日韩国内少妇激情av| 色噜噜av男人的天堂激情| 久久韩国三级中文字幕| 午夜久久久久精精品| 欧美日韩一区二区视频在线观看视频在线 | 国产一区有黄有色的免费视频 | 亚洲成人精品中文字幕电影| 91久久精品国产一区二区成人| 亚洲精品乱码久久久v下载方式| 亚洲成色77777| 国产精品久久久久久精品电影| 一本久久精品| 中文字幕久久专区| 欧美又色又爽又黄视频| 一个人免费在线观看电影| 亚洲精品456在线播放app| 国内精品一区二区在线观看| 久久99热这里只有精品18| 精品久久久久久久末码| 国产日韩欧美在线精品| 日韩人妻高清精品专区| 免费大片18禁| 亚洲av电影不卡..在线观看| 人体艺术视频欧美日本| 亚洲国产欧美人成| 国产精品伦人一区二区| 亚洲经典国产精华液单| 亚洲精品色激情综合| 99久久精品国产国产毛片| 最近最新中文字幕大全电影3| 精品一区二区三区人妻视频| 中文字幕熟女人妻在线| 老司机福利观看| 亚洲经典国产精华液单| 亚洲av福利一区| 最近2019中文字幕mv第一页| 亚洲,欧美,日韩| 久久精品国产自在天天线| videossex国产| 国产一区有黄有色的免费视频 | 欧美bdsm另类| 成人无遮挡网站| 亚洲人成网站高清观看| 日韩av不卡免费在线播放| 综合色丁香网| 久久久久久久久久久丰满| 午夜福利在线观看免费完整高清在| 日本猛色少妇xxxxx猛交久久| 国产中年淑女户外野战色| 亚洲在久久综合| 久久婷婷人人爽人人干人人爱| 日本一二三区视频观看| 国产午夜精品一二区理论片| 亚洲国产精品sss在线观看| 亚洲五月天丁香| 国产精品麻豆人妻色哟哟久久 | 淫秽高清视频在线观看| 如何舔出高潮| 永久网站在线| 欧美一区二区亚洲| av黄色大香蕉| 在线观看av片永久免费下载| 亚洲欧美日韩卡通动漫| 日韩视频在线欧美| 91aial.com中文字幕在线观看| 99国产精品一区二区蜜桃av| 99热这里只有是精品50| 国产亚洲5aaaaa淫片| 岛国在线免费视频观看| 精品人妻一区二区三区麻豆| 日韩人妻高清精品专区| 免费搜索国产男女视频| 欧美97在线视频| 神马国产精品三级电影在线观看| 男女视频在线观看网站免费| 精品国内亚洲2022精品成人| 91av网一区二区| 欧美成人一区二区免费高清观看| 可以在线观看毛片的网站| 国产真实伦视频高清在线观看| 精品久久久久久久末码| 午夜视频国产福利| 美女大奶头视频| 97热精品久久久久久| 可以在线观看毛片的网站| 日产精品乱码卡一卡2卡三| 日日摸夜夜添夜夜爱| 真实男女啪啪啪动态图| av在线观看视频网站免费| 精品久久久久久久末码| 午夜免费男女啪啪视频观看| 久久久久精品久久久久真实原创| 毛片女人毛片| 国产免费男女视频| 国产精品一区二区三区四区久久| 人妻系列 视频| h日本视频在线播放| 国产亚洲91精品色在线| 欧美成人精品欧美一级黄| 国产精品久久久久久久电影| 嫩草影院精品99| 麻豆精品久久久久久蜜桃| 干丝袜人妻中文字幕| 一夜夜www| 久久久色成人| 国产在线一区二区三区精 | 亚洲精品自拍成人| 亚洲欧洲日产国产| 亚洲av免费高清在线观看| 99久久成人亚洲精品观看| 国内精品一区二区在线观看| 中文欧美无线码| 国产人妻一区二区三区在| 欧美高清性xxxxhd video| 伦精品一区二区三区| 日韩av在线免费看完整版不卡| 亚洲av免费在线观看| 国产亚洲精品久久久com| 蜜桃久久精品国产亚洲av| 日韩,欧美,国产一区二区三区 | 精品无人区乱码1区二区| 国产成人一区二区在线| 久久国产乱子免费精品| av视频在线观看入口| 特大巨黑吊av在线直播| .国产精品久久| 日韩大片免费观看网站 | 国产午夜福利久久久久久| 青青草视频在线视频观看| 国产又黄又爽又无遮挡在线| 久久精品91蜜桃| 菩萨蛮人人尽说江南好唐韦庄 | 亚洲婷婷狠狠爱综合网| 久久精品夜色国产| 尤物成人国产欧美一区二区三区| 看免费成人av毛片| 精品人妻视频免费看| 中国国产av一级| 国产中年淑女户外野战色| 久久这里有精品视频免费| 欧美精品一区二区大全| АⅤ资源中文在线天堂| 国产精品久久久久久精品电影小说 | a级毛色黄片| 秋霞伦理黄片| 深夜a级毛片| 久久久色成人| 白带黄色成豆腐渣| 激情 狠狠 欧美| 又爽又黄a免费视频| 欧美又色又爽又黄视频| 国产精品熟女久久久久浪| 成人高潮视频无遮挡免费网站| 长腿黑丝高跟| 日本三级黄在线观看| 2022亚洲国产成人精品| 日本欧美国产在线视频| 伦理电影大哥的女人| 国产一区二区亚洲精品在线观看| 久久精品国产鲁丝片午夜精品| 波多野结衣高清无吗| 男人的好看免费观看在线视频| av在线亚洲专区| 国产一区亚洲一区在线观看| 亚洲不卡免费看| 亚洲精品日韩在线中文字幕| 午夜精品在线福利| 老司机影院毛片| 免费观看人在逋| 亚洲丝袜综合中文字幕| 久久久久久久久大av| 亚洲精品456在线播放app| ponron亚洲| 亚洲高清免费不卡视频| 特级一级黄色大片| 国国产精品蜜臀av免费| 十八禁国产超污无遮挡网站| 免费播放大片免费观看视频在线观看 | 国产日韩欧美在线精品| 午夜a级毛片| 热99re8久久精品国产| 精品国产一区二区三区久久久樱花 | 国产精品一二三区在线看| 三级国产精品欧美在线观看| 好男人视频免费观看在线| 久久亚洲国产成人精品v| 五月玫瑰六月丁香| 99久久人妻综合| 国产 一区精品| 51国产日韩欧美| 中文亚洲av片在线观看爽| 一夜夜www| 久久久久久久久中文| 国产一区亚洲一区在线观看| 亚洲国产精品国产精品| 看非洲黑人一级黄片| 一级黄片播放器| 麻豆久久精品国产亚洲av| 国产精品久久视频播放| 久久鲁丝午夜福利片| 久久久久久大精品| 国产色婷婷99| 国产精品一及| 亚洲久久久久久中文字幕| 国产亚洲5aaaaa淫片| 国产精品久久久久久精品电影小说 | 免费观看性生交大片5| 精品久久久久久久人妻蜜臀av| 亚洲精品色激情综合| 国产久久久一区二区三区| 国产真实伦视频高清在线观看| 亚洲成人久久爱视频| 在线天堂最新版资源| 99久久无色码亚洲精品果冻| 亚洲在久久综合| 中文字幕熟女人妻在线| 国产午夜精品一二区理论片| 国国产精品蜜臀av免费| 久久精品熟女亚洲av麻豆精品 | 中文字幕熟女人妻在线| 小蜜桃在线观看免费完整版高清| 色哟哟·www| 丝袜喷水一区| 最近最新中文字幕免费大全7| 成人亚洲精品av一区二区| 国产精品国产三级专区第一集| 老司机影院成人| 在线天堂最新版资源| 六月丁香七月| 亚洲av二区三区四区| 久久精品久久精品一区二区三区| 久久精品国产亚洲av涩爱| 国产视频首页在线观看| 国产伦精品一区二区三区四那| 精品午夜福利在线看| 尤物成人国产欧美一区二区三区| 久久99热这里只有精品18| 成人亚洲精品av一区二区| 亚洲国产精品sss在线观看| 久久久久性生活片| 午夜福利在线在线| 免费在线观看成人毛片| 日日啪夜夜撸| 少妇熟女欧美另类| 波多野结衣高清无吗| 能在线免费观看的黄片| 天天躁夜夜躁狠狠久久av| 中文乱码字字幕精品一区二区三区 | 国产成人精品久久久久久| 日韩欧美精品免费久久| 国产熟女欧美一区二区| 日韩高清综合在线| 美女脱内裤让男人舔精品视频| 欧美成人a在线观看| www.av在线官网国产| 免费观看人在逋| av在线亚洲专区| 最近视频中文字幕2019在线8| 免费一级毛片在线播放高清视频| 少妇的逼好多水| 啦啦啦观看免费观看视频高清| 黄片wwwwww| 成人鲁丝片一二三区免费| 2022亚洲国产成人精品| 国产乱来视频区| 汤姆久久久久久久影院中文字幕 | 精品99又大又爽又粗少妇毛片| 亚洲精品成人久久久久久| 韩国高清视频一区二区三区| 国产真实伦视频高清在线观看| 久久精品久久久久久久性| ponron亚洲| av女优亚洲男人天堂| 永久网站在线| 午夜爱爱视频在线播放| 91午夜精品亚洲一区二区三区| 国产精品美女特级片免费视频播放器| 男的添女的下面高潮视频| 99在线视频只有这里精品首页| 日本-黄色视频高清免费观看| 亚洲综合精品二区| 亚洲中文字幕日韩| 国产老妇伦熟女老妇高清| 免费观看在线日韩| 99在线视频只有这里精品首页| 午夜福利网站1000一区二区三区| 欧美色视频一区免费| 成人毛片60女人毛片免费| av女优亚洲男人天堂| 成人毛片a级毛片在线播放| 中文乱码字字幕精品一区二区三区 | av在线观看视频网站免费| 国产视频内射| 深夜a级毛片| 亚洲欧美精品综合久久99| 3wmmmm亚洲av在线观看| 亚洲国产精品久久男人天堂| 亚洲国产精品专区欧美| 国产高清三级在线| 麻豆国产97在线/欧美| 午夜视频国产福利| 久久综合国产亚洲精品| 国产精品国产高清国产av| 卡戴珊不雅视频在线播放| 看十八女毛片水多多多| 一区二区三区乱码不卡18| 久久精品91蜜桃| 老司机影院成人| 国产精品综合久久久久久久免费| 午夜激情福利司机影院| 国产午夜精品久久久久久一区二区三区| 波野结衣二区三区在线| 亚洲欧美日韩卡通动漫| 亚洲成人av在线免费| 最后的刺客免费高清国语| 精品国产露脸久久av麻豆 | 青春草国产在线视频| 日本五十路高清| 三级国产精品片| 国产真实伦视频高清在线观看| 特大巨黑吊av在线直播| 亚洲综合色惰| 国产淫语在线视频| 淫秽高清视频在线观看| 日本熟妇午夜| 18禁在线无遮挡免费观看视频| 欧美最新免费一区二区三区| 日本一二三区视频观看| 天天躁夜夜躁狠狠久久av| 麻豆乱淫一区二区| eeuss影院久久| 亚洲国产精品久久男人天堂| 国产成年人精品一区二区| 久久精品熟女亚洲av麻豆精品 | 天天躁日日操中文字幕| 亚洲电影在线观看av| 国产淫片久久久久久久久| 久久热精品热| 男人狂女人下面高潮的视频| 精品国产三级普通话版| 国产 一区 欧美 日韩| 中文精品一卡2卡3卡4更新| 99久久精品一区二区三区| 九九热线精品视视频播放| 国产伦在线观看视频一区| 搡老妇女老女人老熟妇| av福利片在线观看| 国产精品熟女久久久久浪| 日本免费一区二区三区高清不卡| 久久精品久久久久久久性| 国产一区二区在线观看日韩| 久久人妻av系列| 日本猛色少妇xxxxx猛交久久| 免费av观看视频| 免费观看性生交大片5| .国产精品久久| 久久国内精品自在自线图片| 亚洲激情五月婷婷啪啪| 成人二区视频| 亚洲国产精品专区欧美| 可以在线观看毛片的网站| 成人漫画全彩无遮挡| 伊人久久精品亚洲午夜| 插阴视频在线观看视频| 国产精品综合久久久久久久免费| 免费看av在线观看网站| 成人特级av手机在线观看| 久久久久久久久中文| 午夜亚洲福利在线播放| 美女脱内裤让男人舔精品视频| 欧美色视频一区免费| 午夜福利在线在线| 蜜桃久久精品国产亚洲av| 久久久久久久久久黄片| 天堂av国产一区二区熟女人妻| 一级二级三级毛片免费看| 国产精品.久久久| 亚洲精品国产av成人精品| 午夜福利高清视频| 免费看日本二区| 色综合亚洲欧美另类图片| 午夜精品一区二区三区免费看| 国产高清国产精品国产三级 | 好男人在线观看高清免费视频| 久久欧美精品欧美久久欧美| 欧美极品一区二区三区四区| 国产精品人妻久久久影院| 波多野结衣巨乳人妻| 久久精品久久精品一区二区三区| 日本免费在线观看一区| 人妻系列 视频| 亚洲欧洲国产日韩| 成人一区二区视频在线观看| 嫩草影院新地址| 在线天堂最新版资源| 最近的中文字幕免费完整| 欧美日韩精品成人综合77777| 最近最新中文字幕大全电影3| 色综合站精品国产| 大香蕉久久网| 久久久久网色| 97人妻精品一区二区三区麻豆| 中文字幕人妻熟人妻熟丝袜美| 高清av免费在线| 精品少妇黑人巨大在线播放 | 日日啪夜夜撸| 99久久人妻综合| 国产一区二区在线av高清观看| 日韩国内少妇激情av| 亚洲综合精品二区| 日本五十路高清| 色尼玛亚洲综合影院| 国产一区二区在线av高清观看| 不卡视频在线观看欧美| 亚洲欧美清纯卡通| 神马国产精品三级电影在线观看| 亚洲图色成人| 国产一区二区亚洲精品在线观看| 少妇高潮的动态图| 简卡轻食公司| 26uuu在线亚洲综合色| 午夜精品一区二区三区免费看| 18禁在线播放成人免费| 国产熟女欧美一区二区| a级毛色黄片| 亚洲综合色惰| 在线播放无遮挡| av国产久精品久网站免费入址| 日韩av不卡免费在线播放| 欧美另类亚洲清纯唯美| 国产成人福利小说| 免费看光身美女| 美女cb高潮喷水在线观看| 人人妻人人澡欧美一区二区| 99久久成人亚洲精品观看| 欧美性猛交黑人性爽| 网址你懂的国产日韩在线| 国产精品久久久久久精品电影小说 | 欧美xxxx性猛交bbbb| av国产免费在线观看| 国产一区有黄有色的免费视频 | 国语对白做爰xxxⅹ性视频网站| 日韩人妻高清精品专区| 亚洲国产精品久久男人天堂| 九九热线精品视视频播放| .国产精品久久| 午夜激情福利司机影院| 国产精品久久久久久精品电影| 看黄色毛片网站| 好男人视频免费观看在线| 亚洲精品乱码久久久久久按摩| 欧美另类亚洲清纯唯美| 国国产精品蜜臀av免费| 波野结衣二区三区在线| 久久精品国产亚洲网站| 激情 狠狠 欧美| 三级男女做爰猛烈吃奶摸视频| 非洲黑人性xxxx精品又粗又长| 婷婷六月久久综合丁香| 日韩欧美在线乱码| 欧美xxxx黑人xx丫x性爽| 91午夜精品亚洲一区二区三区| 日本三级黄在线观看| 国产亚洲最大av| 国产精品1区2区在线观看.| 午夜激情福利司机影院| 日日撸夜夜添| 特级一级黄色大片| 精品一区二区三区视频在线| 国内揄拍国产精品人妻在线| 午夜免费男女啪啪视频观看| 日韩欧美精品免费久久| 91aial.com中文字幕在线观看| 亚洲在线观看片| 成人午夜高清在线视频| 中文字幕av成人在线电影| 久久精品国产鲁丝片午夜精品| 高清av免费在线| 午夜免费男女啪啪视频观看| 免费看美女性在线毛片视频| 九草在线视频观看| 成人无遮挡网站| 寂寞人妻少妇视频99o| 水蜜桃什么品种好| av播播在线观看一区| 欧美高清性xxxxhd video| 国产精品国产三级国产av玫瑰| 联通29元200g的流量卡| 九九热线精品视视频播放| 精品少妇黑人巨大在线播放 | 伦理电影大哥的女人| 亚洲精品国产av成人精品| 欧美一区二区精品小视频在线| 国产精品一二三区在线看| 久久精品夜夜夜夜夜久久蜜豆| 丝袜喷水一区| 一级毛片电影观看 | 少妇丰满av| 观看免费一级毛片| 九色成人免费人妻av| 国产成人一区二区在线| 国产成人a∨麻豆精品| 天堂中文最新版在线下载 | 欧美一区二区精品小视频在线| 亚洲图色成人| 超碰av人人做人人爽久久| 国产免费福利视频在线观看| 亚洲久久久久久中文字幕| 中国国产av一级| 身体一侧抽搐| 精品99又大又爽又粗少妇毛片| 激情 狠狠 欧美| 身体一侧抽搐| 99久久人妻综合| 综合色丁香网| 中文字幕av成人在线电影| 国产亚洲av片在线观看秒播厂 | 国产精品嫩草影院av在线观看| 最新中文字幕久久久久| 国产亚洲精品av在线| 国产老妇伦熟女老妇高清| 日韩制服骚丝袜av| av在线亚洲专区| 简卡轻食公司| 99久久中文字幕三级久久日本| 人妻制服诱惑在线中文字幕| 99热6这里只有精品| 亚洲国产欧美在线一区| 欧美不卡视频在线免费观看| 建设人人有责人人尽责人人享有的 | 欧美色视频一区免费|