• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于請求與應答通信機制和局部注意力機制的多機器人強化學習路徑規(guī)劃方法

    2024-03-21 02:24:32鄧輔秦官檜鋒譚朝恩付蘭慧王宏民林天麟張建民
    計算機應用 2024年2期
    關鍵詞:機制規(guī)劃動作

    鄧輔秦,官檜鋒,譚朝恩,付蘭慧,王宏民,林天麟,張建民*

    (1.五邑大學 智能制造學部,廣東 江門 529000;2.香港中文大學(深圳)深圳市人工智能與機器人研究院,廣東 深圳 518000;3.深圳市杉川機器人有限公司,廣東 深圳 518000)

    0 引言

    隨著時代的進步,電商、物流、戶外搜索等行業(yè)的大力發(fā)展越來越離不開多機器人系統(tǒng),而多機器人路徑規(guī)劃(Multi-Agent Path Finding,MAPF)是多機器人系統(tǒng)的重要組成部分[1]。MAPF 旨在為全部機器人規(guī)劃出少阻塞甚至無阻塞的一組路徑,一些基于圖節(jié)點結構的搜索方法如A*、基于碰撞的搜索(Conflict Based Search,CBS)、D*Lite 在簡單、擁擠程度低的非動態(tài)環(huán)境具有較高的求解效率[2-6]。然而,在一些特定的場景(如過道擁擠的動態(tài)倉儲環(huán)境、災后搜索等障礙物無規(guī)則分布的復雜環(huán)境),上述方法存在兩個主要問題:1)機器人難以對周圍的動態(tài)環(huán)境建模;2)機器人因為缺少信息交互而規(guī)劃出不協(xié)調(diào)的動作策略。

    隨著深度學習在圖像領域的快速發(fā)展,結合深度學習的深度強化學習方法能夠使用卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)等圖像處理技術對動態(tài)環(huán)境進行圖像化建模,此外,基于神經(jīng)網(wǎng)絡支持多維信息輸入的特性,設計進行信息交互的神經(jīng)網(wǎng)絡架構,故而在一系列決策任務中獲得顯著的成功,如游戲領域和多機器人路徑規(guī)劃領域[7-9]。雖然每個機器人能夠利用CNN 對其視野進行特征提取,但是該網(wǎng)絡缺乏高效的信息傳遞功能。

    有效的溝通是合作成功的關鍵,近年來,一些方法如VDN(Value-Decomposition Network)[10]、QMIX[11-12]、QTRAN[13]學習每個機器人的獨立Q 函數(shù),并使用混合網(wǎng)絡將這些局部狀態(tài)行動值(Q 值)組合成全局狀態(tài)行動值,進行一定的信息傳遞實現(xiàn)對動作策略的優(yōu)化。上述方法屬于集中式的方法,能融合所有機器人的信息參與決策,但也會帶來冗余的信息,增加方法計算量。因此,如何為每個機器人提供本身所需的精準信息并降低網(wǎng)絡計算量,成為重要研究方向。

    為了降低多機器人路徑規(guī)劃的阻塞率,本文基于Actor-Critic 架構提出一種分布式請求與應答通信機制與局部注意力機制的多機器人深度強化學習路徑規(guī)劃方法(Distributed Communication and local Attention based Multi-Agent Path Finding,DCAMAPF)。針對機器人間信息傳遞效率不高、難以精確獲得所需信息的問題,本文設計一種基于請求與應答機制的Actor 網(wǎng)絡。如圖1 所示,以3 號機器人為例,3 號機器人請求視野范圍(灰色)其他機器人的局部觀測和動作信息,并主動獲取動態(tài)障礙物的相對位置信息,其中2、8、9 號機器人及時反饋信息。5 號機器人由于距離較遠、傳輸遲延等導致信息傳輸超時,而本文的Actor 網(wǎng)絡能自動屏蔽傳輸超時帶給CNN 的影響。與此同時,3 號機器人也會主動感知視野內(nèi)的動態(tài)障礙物,獲得其動態(tài)障礙物的相對位置,作為本機器人局部觀測信息的一部分。最終,將應答的信息和本機信息一起輸入Actor 網(wǎng)絡,進而規(guī)劃出3 號機器人的動作策略。針對全局注意力機制帶來的冗余信息的問題,本文提出基于局部注意力機制的Critic 網(wǎng)絡,該網(wǎng)絡能將注意力權重動態(tài)分配給視野內(nèi)的其他機器人,降低計算量。

    圖1 請求與應答機制(以3號機器人為例)Fig.1 Request-response mechanism(taking robot No.3 as example)

    相較于最新的路徑規(guī)劃方法如基于進化方法與強化學習的多機器人路徑規(guī)劃(Multi-Agent Path Planning with Evolutionary Reinforcement learning,MAPPER)[14]、動態(tài)環(huán)境下基于注意力機制與BicNet 通信模塊的多機器人路徑規(guī)劃方法(Attention and BicNet based MAPPER,AB-MAPPER)[15],本文的主要工作為:

    1)設計一種基于請求與應答通信機制的Actor 網(wǎng)絡,機器人請求視野內(nèi)其他機器人的狀態(tài)信息與最新的動作信息,使機器人能獲得精確的局部觀測-動作信息,規(guī)劃出協(xié)調(diào)的動作,提高機器人的避障能力。

    2)設計一種基于局部注意力機制的Critic網(wǎng)絡,機器人能夠?qū)⒆⒁饬嘀貏討B(tài)分配給視野內(nèi)的其他機器人,相較于全局注意力網(wǎng)絡,本文的Critic 網(wǎng)絡縮小注意力權重的分配范圍,降低注意力權重的計算量,將權重分配給更該注意的周圍機器人,提高策略優(yōu)化的效率,減少顯卡緩存的占用量。

    3)與傳統(tǒng)動態(tài)路徑規(guī)劃方法D*Lite、最新的分布式強化學習方法MAPPER 和最新的集中式強化學習方法AB-MAPPER 相比:DCAMAPF 在離散初始化環(huán)境,阻塞率均值約減小了6.91、4.97 和3.56 個百分點。在集中區(qū)域初始化環(huán)境下能更高效地避免發(fā)生阻塞,阻塞率均值約減小了15.86、11.71、5.54 個百分點,并降低占用的計算緩存。

    1 相關工作

    1.1 通信類強化學習方法

    溝通有助于學習他人的經(jīng)驗并傳遞知識,以更好地在團隊中工作,是形成智能的一個基本要素。在多機器人強化學習中,機間通信允許多個機器人通過合作完成共同目標。在部分可觀察的環(huán)境中,多機器人能夠通過通信分享它們從觀察視野中獲得的信息,規(guī)劃出更優(yōu)的策略。

    近年來的深度強化學習方法普遍基于Actor-Critic 架構,該架構由兩部分組成:Actor 網(wǎng)絡負責規(guī)劃動作策略;Critic網(wǎng)絡負責以Q 值的形式評估Actor 規(guī)劃出的動作策略,機器人每執(zhí)行完一次動作策略,都會進行一次策略的優(yōu)化,因此能快速提高方法收斂的速度。

    Liu等[14]提出了MAPPER,每個機器人用圖像化建模的方式對視野內(nèi)的環(huán)境信息進行表征?;谶M化方法在迭代一定次數(shù)后將挑選一個最大獎勵值的機器人所屬的網(wǎng)絡模型替換一些獎勵值低的機器人網(wǎng)絡模型,在一定程度上進行了信息傳遞,該機制使該方法在動態(tài)擁擠環(huán)境下的路徑規(guī)劃效率比近年較為經(jīng)典的方法基于強化學習與模仿學習的路徑規(guī)劃方法(Pathfinding via Reinforcement and Imitation Multi-Agent Learning-Lifelong,PRIMAL2)方法[9]更高,因此,MAPPER 成為最新的多機器人強化學習路徑規(guī)劃方法,也是本文的對比方法之一。

    通過替換網(wǎng)絡模型屬于一種規(guī)劃后信息交互的模式,這雖然能提高方法的收斂速度,但卻不能使機器人在規(guī)劃動作策略前獲得更精確的信息,不能為機器人規(guī)劃出阻塞率更低的動作策略。

    1.2 集中式的信息傳遞強化學習方法

    多機器人強化學習中大多數(shù)現(xiàn)有的通信工作都集中于廣播式通信,即將每個機器人的信息廣播到所有其他或預定義的機器人 。Sukhbaatar 等[16]提出了 CommNet(Communication Neural Net),每個機器人需要在一個公共的通道傳播一個通信向量,通過這個通道各自接收其他機器人匯總的通信向量。在合作任務中,該網(wǎng)絡提高了機器人的協(xié)作能力。然而,CommNet 對所有機器人的通信向量做算術平均操作,這意味著它將不同機器人的信息看作等價。由于CommNet 的公共通道將所有機器人的信息傳達給每一個機器人,每個機器人被動接收大量冗余信息,因此不適用于解決局部路徑?jīng)_突的路徑規(guī)劃任務。類似地,Peng 等[17]提出了基于雙向長短期記憶(Bi-directional Long Short-Term Memory,Bi-LSTM)神經(jīng)網(wǎng)絡的 BicNet(Multiagent Bidirectionally-coordinated Nets)通信網(wǎng)絡,與CommNet 要進行信息聚合不同,BicNet 是一種集中式的網(wǎng)絡,信息只在Actor 和Critic 網(wǎng)絡內(nèi)流通,不會聚合,所有接入BicNet 的機器人都能接收其他機器人的信息。此外,LSTM 的門控機制使它能自主決定是否接收傳遞的信息以規(guī)劃動作,提高了通信的效率。Kim 等[18]提出了SchedNet 方法,該方法在Actor網(wǎng)絡上搭建了一個調(diào)度器模塊,該調(diào)度器模塊學習如何對機器人的局部觀測賦予權重進而在有限的通信帶寬下挑選最有利的局部觀測信息規(guī)劃動作。

    1.3 分布式信息傳遞強化學習在Actor網(wǎng)絡的優(yōu)化

    上述隸屬于集中式的網(wǎng)絡模型雖然在一定程度上解決了機器人的通信問題,但普遍需要所有機器人的局部觀測信息作為輸入,導致方法難以在較多的冗余信息中甄別強相關信息,缺乏靈活性。隨著機器人數(shù)的增加,集中式方法難以從全局共享的信息中區(qū)分有助于合作決策的有價值信息[19]。

    為了提高通信的靈活性,更精準地獲取其他機器人的相關信息,Jiang 等[19]提出了ATOC(ATtentional Communication)方法,該方法的Actor 網(wǎng)絡部分通過一個注意力模塊對視野內(nèi)的其他機器人賦予權重,決定該機器人是否允許通信,從而選擇相應的協(xié)作者。在選擇協(xié)作者時,通信發(fā)起者依據(jù)距離依次在沒有被選擇過的機器人、別的發(fā)起者的協(xié)作者、別的發(fā)起者三個類別的機器人中選擇一個作為協(xié)作者,獲得了較為精準的信息,提高了通信的效率。類似地,有針對性的通信是提高通信效率的關鍵,Das 等[20]提出了TarMAC(Targeted Multi-Agent Communication)方法,該方法的Actor 網(wǎng)絡使用了注意力機制,信息發(fā)送方發(fā)送通信向量,在接收端的每個機器人會預測一個詢問向量,詢問向量將與所有通信向量進行點乘操作,其結果用歸一化處理之后采用Softmax函數(shù)得到每個通信向量的注意力權重,當通信向量與詢問向量相似時,注意力權重則比較高,實現(xiàn)有針對性的通信。Ding 等[21]提出了I2C(Individually Inferred Communication)方法,該方法的Actor 部分包含一個輸出置信度的優(yōu)先級網(wǎng)絡,該優(yōu)先級網(wǎng)絡決定視野內(nèi)哪些機器人需要進行通信,隨后,通信發(fā)起者請求獲取被賦予置信度機器人的局部觀測信息,通信接收方應答發(fā)起者,實現(xiàn)點對點的通信,進一步提高通信效率。受I2C 網(wǎng)絡啟發(fā),本文的Actor 網(wǎng)絡雖基于請求與應答機制,但與上述方法不同,本文的Actor 網(wǎng)絡不僅基于請求與應答機制獲取局部觀測信息,還會獲取其他機器人最新的動作信息,并在規(guī)劃動作策略前參考其他機器人的動作信息,因此能降低機器人的阻塞率,提高路徑規(guī)劃的效率。

    1.4 強化學習方法在Critic網(wǎng)絡的優(yōu)化

    策略的評估和優(yōu)化是提高機器人學習能力的關鍵,在Actor-Critic 架構中,Critic 網(wǎng)絡用于策略的評價。Parnika等[22]設計的基于注意力機制的Critic 網(wǎng)絡將注意力權重分配到所有機器人的局部觀測和動作信息上,并學習如何將較大的權重分配給需要關注的機器人。在AB-MAPPER 中,也使用基于注意力機制的Critic 網(wǎng)絡學習如何對機器人的局部觀測信息和動作信息賦予權重[15]。然而上述方法使用的是集中式的方法架構,每個機器人基于Critic 網(wǎng)絡進行策略評判時,需要其余所有機器人的局部觀測和動作信息,在機器人數(shù)較少時,注意力權重的分配范圍較小,注意力權重不會被稀釋;然而,隨著機器人數(shù)的增加,集中式網(wǎng)絡被輸入更多信息,注意力權重的分配范圍也會逐漸擴大,導致注意力權重被稀釋得越來越小,網(wǎng)絡難以區(qū)分哪些信息更需關注,不利于策略的優(yōu)化。

    事實上,只有周圍其他機器人的動作才會影響到當前機器人的決策,其他距離較遠的機器人的局部觀測信息和動作信息不僅對當前機器人的決策沒有幫助,反而會帶來冗余信息,干擾當前機器人的決策和策略優(yōu)化。

    為了降低冗余信息的干擾,Liu 等[23]在池化層與卷積層之間引入局部注意力網(wǎng)絡,有效增強了抑制無用特征的能力。類似地,本文為了降低冗余信息的干擾,基于請求與應答機制通信機制與局部注意力機制,將注意力權重只分配給應答成功的機器人,縮小Critic 網(wǎng)絡中注意力權重的分配范圍,不僅避免了冗余信息的干擾,還利用具有較強相關性機器人的信息參與策略優(yōu)化,減少了顯卡緩存的占用量,提高了路徑規(guī)劃的效率。

    2 本文方法

    本文將機器人與環(huán)境的交互過程建模為部分可觀測馬爾可夫決策過程(S,A,P,R,O,M,γ),其中S是狀態(tài)空間,A是動作空間,P:S×A×S→[0,1]表示狀態(tài)轉移概率,R:S×A→R為獎勵函數(shù),O代表局部觀測,M代表狀態(tài)轉移概率矩陣,γ是獎勵折扣因子[24-25]。類似PRIMAL2和MAPPER 中的環(huán)境建模方法,本文將環(huán)境的局部觀測由3 個有限視野(15×15 網(wǎng)格大小,如圖1 淺灰色區(qū)域)的觀測圖像組成,分別對應圖2(a)中每個機器人的局部觀測(Observation)Oi由3 個矩陣構成。第1 個矩陣存儲當前觀察到的靜態(tài)障礙物、周圍其他機器人和動態(tài)障礙物的相對位置,這些位置由不同的值表示;第2 個矩陣記錄了周圍其他機器人和動態(tài)障礙物的軌跡,對時間序列信息進行了編碼;第3 個矩陣記錄了當前機器人基于靜態(tài)環(huán)境圖通過A*方法規(guī)劃的局部參考路徑。Maxpool為最大池化層,F(xiàn)CN(Fully Convolutional Network)為全連接網(wǎng)絡,MLP(Multilayer Perceptron)為多層感知機,Dummy 為反饋動作信息失敗的機器人設置的無效動作向量,以保證網(wǎng)絡能夠正常運算。由于Actor-Critic 框架可以幫助強化學習方法通過當前策略的梯度有效地更新策略,適用于路徑規(guī)劃中的實時決策任務[26],因此本文使用Actor-Critic 架構。

    圖2 DCAMAPF網(wǎng)絡架構Fig.2 Network architecture of DCAMAPF

    基于集中式網(wǎng)絡架構的方法在獲取所有接入該網(wǎng)絡的機器人信息后,才能統(tǒng)一為所有機器人進行信息的數(shù)值計算,該類方法在通信時延小、機器人數(shù)較少的情況下具有能與其他機器人充分傳遞信息的優(yōu)勢;然而,隨著機器人數(shù)的增多,信息流通存在計算量大、冗余信息多、無法為每個機器人精準獲取所需信息等問題。分布式網(wǎng)絡無須基于所有機器人的信息參與決策,每個機器人都有獨屬自己的方法網(wǎng)絡,能靈活地進行決策和優(yōu)化,因此,將方法網(wǎng)絡模型進行分布式設計是一個可行方向。

    本文方法主要分為三步:首先,基于請求與應答機制,機器人對視野內(nèi)的其他機器人發(fā)送請求,請求它們的局部觀測以及最新動作信息,其他機器人在限定的時間內(nèi)回應;其次,該機器人的Actor 網(wǎng)絡分別用兩種不同維度的CNN 對反饋的局部觀測信息和動作信息進行特征提取,進而規(guī)劃動作;最后,對于每一個機器人,基于局部注意力機制的Critic 網(wǎng)絡在請求與應答機制下將注意力權重動態(tài)分配到視野內(nèi)成功應答本機器人的其他機器人局部觀測-動作信息上。

    本文將Actor 網(wǎng)絡進行分布式設計,機器人之間的信息傳遞采用請求與應答機制,如圖2(a)所示,具體在Actor 網(wǎng)絡的改進如下:1)每個機器人在規(guī)劃動作前先獲取在本機器人視野里其他機器人的編號,并向它發(fā)送請求,期望獲取它的局部觀測信息(三維矩陣)和動作信息(a)i。2)視野內(nèi)的機器人接收請求,并作出應答,反饋自己的局部觀測信息和動作信息。3)在規(guī)定時間內(nèi),機器人接收應答成功的機器人的局部觀測信息和動作信息,結合本身的局部觀測信息一并輸入到卷積神經(jīng)網(wǎng)絡,最終規(guī)劃出本機器人的動作策略?;谡埱笈c應答機制的通信機制,既能捕獲周圍機器人的局部觀測信息以及動作信息、又不需要像集中式網(wǎng)絡匯集所有信息才能規(guī)劃策略,因此能提高信息傳遞的效率、利用更加精準的信息規(guī)劃出更優(yōu)的動作策略。

    在MAPPER 方法的Critic 網(wǎng)絡中,每個機器人只基于自己的局部觀測信息和動作信息進行評判,缺少與其他機器人進行信息傳遞,難以對機器人的策略進行充分的評判。在AB-MAPPER 中,每個機器人使用基于注意力機制的Critic 網(wǎng)絡將注意力權重分配到所有機器人的局部觀測信息和動作信息中,評判出Q 值,意味著注意力機制的分配范圍是全部機器人,換言之,該方法容易增加一些冗余信息,不利于策略的優(yōu)化。此外,為了對局部觀測信息和動作信息進行編碼,也需要更多的編碼網(wǎng)絡,這導致Critic 網(wǎng)絡承擔更大的計算量以及需要更多的緩存。

    注意力機制可以被描述成可查詢的鍵-值記憶模型,如圖3 所示,有3 個要素query(q)、key(k)、value(v)[22],這3 個要素實質(zhì)上都是矩陣,通過式(1)計算出注意力權重矩陣ω:

    圖3 注意力機制Fig.3 Attention mechanism

    其中dk是k的維度。

    本文設計了更加靈活的局部注意力網(wǎng)絡,如圖2(b)所示,本文以3 號機器人為例,3 號機器人只請求在其視野范圍內(nèi)的其他機器人(2、5、8、9)最新的局部觀測信息和動作信息;隨后,在指定時間間隔內(nèi),其他機器人反饋回來的局部觀測信息和動作信息會將輸入單獨的多層感知機(MultiLayer Perceptron,MLP)進行編碼,得到狀態(tài)動作編碼(e2,e8,e9)。在本文中,k和v是狀態(tài)動作編碼即本文的e,q是狀態(tài)編碼即本文的F。每個注意力頭都是自注意力網(wǎng)絡,X3是vj的權重乘積和,j是成功應答3 號機器人的其他機器人編號集合,如式(2)所示:

    ω3是3 號機器人分配給2、8、9 號機器人的注意力權重,如式(3)所示:

    其中:F3是3 號機器人的狀態(tài)編碼。f是一層全連接網(wǎng)絡,h是多層感知機,最終,Critic 網(wǎng)絡對3 號機器人的評判值如式(4)所示:

    與MAPPER 相同,本文使用Actor-Critic 架構下最新的優(yōu)勢Actor-Critic 方法A2C(Advantage Actor-Critic),相較于原始的Actor-Critic 方法新增了一項優(yōu)勢函數(shù)Advantage,在本文中,具體如式(5)所示,該函數(shù)作為衡量所規(guī)劃出動作策略的優(yōu)劣,如果函數(shù)值大于零,則策略優(yōu):

    R3是3 號機器人執(zhí)行a3后環(huán)境反饋的獎懲值,γ是獎勵折扣因子。3 號機器人的Actor 網(wǎng)絡損失函數(shù)如式(6)所示:

    Critic 網(wǎng)絡的損失函數(shù)如式(7)所示:

    3 實驗仿真與結果分析

    3.1 實驗設置

    為驗證本文方法DCAMAPF 求解多機器人路徑規(guī)劃問題的性能,本文將傳統(tǒng)的基于圖節(jié)點搜索方法D*Lite、深度強化學習方法MAPPER 和集中式強化學習方法AB-MAPPER作為對比方法。實驗環(huán)境如圖4 所示,圖4(a)、(b)為20×20維度,35 個機器人(藍色紅字)30 個動態(tài)障礙物(人形),分別模擬機器人在災后搜索時集中初始化并向四周散開的場景和機器人災后搜索場景散開后遇到無規(guī)則障礙物分布的場景;(c)、(d)為24×30 維度,35 個機器人15 個動態(tài)障礙物,分別模擬機器人在倉儲環(huán)境集中初始化的并向四周散開的場景和機器人散開后遇到規(guī)則障礙物分布的倉儲場景。形狀較大的灰色方塊為靜態(tài)障礙物,黑色方塊為目標點,此外,本文在圖4(a)做了消融實驗,對比方法主要為最新的深度強化學習方法 MAPPER、MAPPER+local Attention、ABMAPPER。所有實驗在操作系統(tǒng)為Linux、編程語言為Python、深度學習依賴庫為PyTorch 的環(huán)境下進行。

    圖4 實驗環(huán)境Fig.4 Experimental environments

    為了公平比較,將在指定步數(shù)內(nèi)成功抵達目標點的機器人數(shù)占機器人總數(shù)的比例定義為成功率,將路徑規(guī)劃途中為避免發(fā)送碰撞而選擇自主阻塞的機器人占機器人總數(shù)的比例定義為阻塞率。本文設置訓練迭代次數(shù)8 000,在方法收斂后,每個環(huán)境進行100 次路徑規(guī)劃任務測試,以獲得成功率和阻塞率均值。此外,本文統(tǒng)計了每個機器人占用GPU的緩存。

    3.2 實驗參數(shù)

    本文使用與MAPPER 相同的獎勵機制,總的獎勵值為R=rs+rc+rο+τrf+rg,其中rs、rc、rο分別是執(zhí)行動作、發(fā)生阻塞、發(fā)生震蕩的獎懲值,類似MAPPER,本文也用全局規(guī)劃方法A*在忽略動態(tài)障礙物的情況下生成局部參考路徑S,rf用于懲罰機器人當前位置pa偏離參考路徑S中的路徑點p,τ是偏離獎懲因子設置為0.3,rg是抵達目標點的獎懲值。獎勵折扣因子γ被設置為0.99,對比方法以及本文方法的獎勵機制如表1 所示。DCAMAPF 方法Actor 網(wǎng)絡的學習率設置為0.000 3,Critic 網(wǎng)絡學習率設置為0.000 03,進化方法迭代次數(shù)為100,Critic 網(wǎng)絡的軟更新參數(shù)設置為0.001。

    表1 獎勵機制Tab.1 Reward mechanism

    3.3 實驗分析

    實驗結果如表2 所示,在圖4 的4 種環(huán)境中,DCAMAPF的阻塞率均值比AB-MAPPER、MAPPER 與D*Lite 低,成功率均值比其他三種方法高。這是因為D*Lite 不能對周圍動態(tài)障礙物建模;MAPPER 雖然能對動態(tài)環(huán)境進行建模,但無法進行有效的信息傳遞;而AB-MAPPER 兩者都考慮,但所需處理的信息量過大,無法精準、高效地傳遞信息,此外,上述方法均沒有利用其他機器人的動作信息規(guī)劃動作策略,而DCAMAPF 不僅能對動態(tài)環(huán)境進行圖像化建模,也能基于請求與應答機制、局部注意力機制高效傳遞信息。

    表2 四種方法在圖4不同環(huán)境阻塞率均值和成功率均值比較 單位:%Tab.2 Comparison of mean blocking rate and mean success rate among four methods in different environments in Fig.4 unit:%

    D*Lite 在擴展的節(jié)點時如果新的障礙物占據(jù)路徑擴展節(jié)點,則更新啟發(fā)式值,然后執(zhí)行新的動作策略避開新障礙物。然而,在執(zhí)行動作之前更新的啟發(fā)式值不能有效引導機器人避開實時移動的障礙物,這是因為占據(jù)其擴展節(jié)點的障礙物是動態(tài)移動的,D*Lite 更新的節(jié)點信息只能確保規(guī)劃出的動作不會碰撞原占據(jù)拓展節(jié)點的障礙物,也無法利用動態(tài)障礙物、其他機器人的信息規(guī)劃動作,這是D*Lite 碰撞率高的原因。

    MAPPER 的阻塞率低于D*Lite,這是因為MAPPER 的局部觀測信息中的第二維、第三維矩陣包含周圍動態(tài)障礙物的軌跡信息和當前機器人的局部參考路徑信息,利用到了其他機器人的局部觀測信息規(guī)劃動作策略,一定程度上協(xié)助了機器人避開障礙物。

    AB-MAPPER 阻塞率均值皆比MAPPER 小,這是因為AB-MAPPER 在執(zhí)行動作之前,所有機器人的局部觀測信息會在Bi-LSTM 神經(jīng)網(wǎng)絡內(nèi)部流通,傳遞信息。在執(zhí)行完動作后,結合全局注意力機制的Critic 網(wǎng)絡分配注意力權重給所有機器人的局部觀測信息和動作信息,評判動作策略。雖然AB-MAPPER 解決了通信的問題,但是集中式架構需要處理更多的信息,所有機器人的局部觀測信息需要在網(wǎng)絡內(nèi)部流通,信息量大,AB-MAPPER 的Bi-LSTM 也難以精確地甄別哪些機器人的信息是當前機器人所需要的。此外,集中式網(wǎng)絡在同一時刻為所有機器人規(guī)劃動作,這導致每個機器人占用的方法網(wǎng)絡資源、顯卡內(nèi)存大。

    DCAMAPF 方法是分布式架構,每個機器人都有自己的方法網(wǎng)絡,Actor 網(wǎng)絡能基于請求與應答通信機制獲取視野內(nèi)其他機器人的局部觀測和動作信息,規(guī)劃出協(xié)調(diào)的動作策略。在進行策略優(yōu)化時,Critic 網(wǎng)絡基于局部注意力機制,只將注意力權重分配給應答成功的機器人,將注意力應用于具有較強相關性的機器人,降低了信息冗余,利用了更精準的信息,更有利于策略的優(yōu)化。機器人集中區(qū)域初始化會使環(huán)境變得擁擠,信息傳遞的重要性逐漸凸顯。如表2 所示,相較于D*Lite、MAPPER、AB-MAPPER 方法,DCAMAPF 在離散區(qū)域初始化環(huán)境(圖4(b)和圖4(d)),阻塞率均值約減小6.91、4.97、3.56 個百分點;在集中區(qū)域初始化環(huán)境(圖4(a)和圖4(c)),阻塞率均值約縮小了15.86、11.71、5.54 個百分點??梢?,本文方法在集中區(qū)域初始化環(huán)境的阻塞率均值比在離散區(qū)域初始化的大,能更高效地避免發(fā)生阻塞。

    為了凸顯本文方法的優(yōu)勢,本文在圖4(a)環(huán)境進行消融實驗,如圖5 所示,DCAMAPF 在視野范圍內(nèi)基于請求與應答機制獲取必要的局部觀測信息和動作信息,能精確且有效地傳遞信息,基于較強相關性的信息規(guī)劃出協(xié)調(diào)的動作策略,有效避免阻塞。

    圖5 消融實驗方法訓練曲線Fig.5 Training curves of ablation experiment methods

    如圖5 中MAPPER+local Attention 曲線所示,局部注意力機制將注意力權重分配給視野內(nèi)成功應答機器人的局部觀測信息和動作信息,避免了其他冗余信息的干擾,能更有效優(yōu)化策略。此外,本文還統(tǒng)計了每個機器人基于以上深度強化學習方法所占用的顯卡緩存,如表3 所示,基于DCAMAPF的每個機器人占用的緩存也比集中式方法AB-MAPPER 低,因此DCAMAPF 適用于求解不同動態(tài)環(huán)境下的多機器人路徑規(guī)劃任務。

    表3 三種深度強化學習方法每個機器人所需顯卡緩存 單位:MBTab.3 Graphic card cache required by each robot for three deep reinforcement learning methods unit:MB

    4 結語

    針對已有路徑規(guī)劃方法面對動態(tài)環(huán)境中的MAPF 問題阻塞率高的問題,本文采用Actor-Critic 強化學習框架進行解決。同時,為了更加靈活地獲取精準的信息、規(guī)劃出協(xié)調(diào)的動作策略,本文提出DCAMAPF。首先機器人請求獲取視野內(nèi)其他機器人的局部觀測信息和動作信息,接著將應答成功的機器人信息以及本身的局部觀測信息和動作信息輸入多通道CNN 的Actor 網(wǎng)絡,從而規(guī)劃出協(xié)調(diào)的動作策略。同樣地,在Critic 網(wǎng)絡,將注意力權重動態(tài)地分配給應答成功的機器人的局部觀測信息和動作信息。分布式的DCAMAPF 方法不僅使用了更少、更精準的信息規(guī)劃更協(xié)調(diào)的動作,而且占用的顯卡內(nèi)存比集中式方法更少,相較于D* Lite、Mapper、AB-MAPPER 方法,DCAMAPF 在離散初始化環(huán)境,阻塞率均值約縮小了6.91、4.97、3.56 個百分點。在集中初始化環(huán)境下能更高效地避免發(fā)生阻塞,阻塞率均值約減小了15.86、11.71、5.54 個百分點。因此,所提方法確保了路徑規(guī)劃的效率,適用于求解不同動態(tài)環(huán)境下的多機器人路徑規(guī)劃任務。目前存在每個機器人都需要頻繁地獲取其他機器人的信息的問題,后續(xù)工作可以考慮設計出可以接受任意輸入維數(shù)的信息處理網(wǎng)絡以及信息共享機制,以進一步提高系統(tǒng)的運行效率。

    猜你喜歡
    機制規(guī)劃動作
    自制力是一種很好的篩選機制
    文苑(2018年21期)2018-11-09 01:23:06
    動作描寫要具體
    規(guī)劃引領把握未來
    快遞業(yè)十三五規(guī)劃發(fā)布
    商周刊(2017年5期)2017-08-22 03:35:26
    畫動作
    動作描寫不可少
    多管齊下落實規(guī)劃
    迎接“十三五”規(guī)劃
    破除舊機制要分步推進
    非同一般的吃飯動作
    99香蕉大伊视频| 大陆偷拍与自拍| 午夜免费观看网址| 1024香蕉在线观看| 成人国语在线视频| av有码第一页| 俄罗斯特黄特色一大片| 黄频高清免费视频| 一级片免费观看大全| 国产精品乱码一区二三区的特点 | 视频区图区小说| 叶爱在线成人免费视频播放| 一级,二级,三级黄色视频| 国产精品成人在线| 亚洲av日韩在线播放| 男女之事视频高清在线观看| 午夜福利在线免费观看网站| 在线观看舔阴道视频| 人人澡人人妻人| av国产精品久久久久影院| 黄色a级毛片大全视频| 亚洲中文日韩欧美视频| 国产精品乱码一区二三区的特点 | 伊人久久大香线蕉亚洲五| 手机成人av网站| 建设人人有责人人尽责人人享有的| 亚洲国产欧美日韩在线播放| 婷婷精品国产亚洲av在线 | 久久久国产成人精品二区 | 下体分泌物呈黄色| 国产不卡av网站在线观看| 大型av网站在线播放| 国产区一区二久久| 真人做人爱边吃奶动态| 国产日韩欧美亚洲二区| 国产又色又爽无遮挡免费看| 亚洲,欧美精品.| tube8黄色片| 99国产极品粉嫩在线观看| 丁香欧美五月| 国产一卡二卡三卡精品| 亚洲人成77777在线视频| 欧美在线一区亚洲| 国产成人精品无人区| 一夜夜www| 欧美日本中文国产一区发布| 亚洲精品美女久久久久99蜜臀| 日韩熟女老妇一区二区性免费视频| 黄频高清免费视频| 国产成人影院久久av| 一级作爱视频免费观看| 性少妇av在线| 高清在线国产一区| 亚洲 欧美一区二区三区| 丝袜美足系列| 欧美日韩瑟瑟在线播放| 日韩中文字幕欧美一区二区| 国产日韩欧美亚洲二区| 高清视频免费观看一区二区| 日韩欧美免费精品| 亚洲人成伊人成综合网2020| 真人做人爱边吃奶动态| 波多野结衣av一区二区av| 亚洲人成77777在线视频| 精品一区二区三区四区五区乱码| 看片在线看免费视频| 成人av一区二区三区在线看| 国产av精品麻豆| 午夜老司机福利片| 好看av亚洲va欧美ⅴa在| 新久久久久国产一级毛片| 老司机影院毛片| 99热网站在线观看| 99国产精品一区二区三区| 亚洲国产精品sss在线观看 | 国产av又大| 免费在线观看日本一区| 国产男靠女视频免费网站| 大陆偷拍与自拍| 亚洲精品乱久久久久久| 久热爱精品视频在线9| 国产欧美日韩一区二区三| 这个男人来自地球电影免费观看| 精品久久久久久久久久免费视频 | 精品亚洲成国产av| 精品福利永久在线观看| 人妻丰满熟妇av一区二区三区 | av超薄肉色丝袜交足视频| 亚洲国产中文字幕在线视频| 精品一区二区三区视频在线观看免费 | 久久香蕉精品热| 日韩欧美三级三区| 国产成人av教育| 韩国av一区二区三区四区| 国产亚洲精品第一综合不卡| 中亚洲国语对白在线视频| 国产高清videossex| 国产精品1区2区在线观看. | av天堂久久9| 不卡一级毛片| 亚洲九九香蕉| 国产人伦9x9x在线观看| 精品一区二区三区视频在线观看免费 | 成年动漫av网址| 国产精品久久久久久人妻精品电影| 国产成人啪精品午夜网站| 侵犯人妻中文字幕一二三四区| 日韩欧美一区视频在线观看| 欧美精品人与动牲交sv欧美| 黄色a级毛片大全视频| 国产精品一区二区在线观看99| 亚洲五月婷婷丁香| 亚洲av成人一区二区三| 欧美黑人精品巨大| 一级作爱视频免费观看| 精品卡一卡二卡四卡免费| 亚洲国产毛片av蜜桃av| 在线观看免费日韩欧美大片| 韩国av一区二区三区四区| 精品一区二区三卡| 国产色视频综合| 99国产精品99久久久久| 久久国产精品男人的天堂亚洲| 亚洲一码二码三码区别大吗| 欧美国产精品一级二级三级| 亚洲精品一卡2卡三卡4卡5卡| 午夜福利,免费看| 99精品久久久久人妻精品| 亚洲中文日韩欧美视频| 黄色女人牲交| 精品久久久久久电影网| 国产精品国产高清国产av | 人妻丰满熟妇av一区二区三区 | 久久久国产成人免费| av国产精品久久久久影院| 亚洲少妇的诱惑av| 一边摸一边抽搐一进一小说 | 国内毛片毛片毛片毛片毛片| 国产精品永久免费网站| 久久久久久人人人人人| 啪啪无遮挡十八禁网站| 91大片在线观看| 亚洲专区中文字幕在线| 国产精品久久久久久人妻精品电影| 国产aⅴ精品一区二区三区波| 悠悠久久av| 99国产综合亚洲精品| 精品午夜福利视频在线观看一区| 国产一区二区三区视频了| 日韩视频一区二区在线观看| av天堂久久9| 大型黄色视频在线免费观看| 精品免费久久久久久久清纯 | 国产一区二区三区综合在线观看| 女人被狂操c到高潮| 97人妻天天添夜夜摸| 亚洲av成人av| 高清av免费在线| 亚洲熟女毛片儿| 亚洲精品一二三| 男女下面插进去视频免费观看| 欧美成狂野欧美在线观看| 国产成人欧美在线观看 | 国产三级黄色录像| 女人高潮潮喷娇喘18禁视频| 激情在线观看视频在线高清 | 精品国产乱码久久久久久男人| 中国美女看黄片| 久久久国产成人精品二区 | 国产精品乱码一区二三区的特点 | 久久草成人影院| 色综合婷婷激情| 亚洲中文字幕日韩| av视频免费观看在线观看| 久久人妻熟女aⅴ| 亚洲七黄色美女视频| 精品久久蜜臀av无| 国产免费男女视频| 国产亚洲精品第一综合不卡| 亚洲中文av在线| 久久久国产成人精品二区 | 国产精品二区激情视频| 色综合欧美亚洲国产小说| 建设人人有责人人尽责人人享有的| 午夜福利在线免费观看网站| 最新美女视频免费是黄的| 大型黄色视频在线免费观看| 国产精品久久视频播放| 天天躁日日躁夜夜躁夜夜| 人妻 亚洲 视频| 国产极品粉嫩免费观看在线| 亚洲精品成人av观看孕妇| 国产精品九九99| 777米奇影视久久| 妹子高潮喷水视频| 人成视频在线观看免费观看| 日日爽夜夜爽网站| 久久精品熟女亚洲av麻豆精品| 国产熟女午夜一区二区三区| www日本在线高清视频| 亚洲,欧美精品.| 日本vs欧美在线观看视频| 一级a爱视频在线免费观看| 久久香蕉国产精品| 久久ye,这里只有精品| 人人妻,人人澡人人爽秒播| 最近最新免费中文字幕在线| 好看av亚洲va欧美ⅴa在| 18禁国产床啪视频网站| 国产精品亚洲av一区麻豆| 国产亚洲精品久久久久久毛片 | 黄色成人免费大全| 老司机影院毛片| 中文字幕最新亚洲高清| 国产又色又爽无遮挡免费看| 国产亚洲欧美98| 亚洲欧美激情在线| 大型av网站在线播放| 啦啦啦在线免费观看视频4| 一区福利在线观看| e午夜精品久久久久久久| 黑人巨大精品欧美一区二区mp4| 久久国产精品大桥未久av| 高清在线国产一区| 精品国产一区二区三区四区第35| 日本wwww免费看| 久久国产精品影院| 欧美日韩乱码在线| 美女福利国产在线| 捣出白浆h1v1| 欧美久久黑人一区二区| 亚洲第一av免费看| 国产区一区二久久| 日韩制服丝袜自拍偷拍| 中文欧美无线码| 无限看片的www在线观看| 一二三四社区在线视频社区8| 亚洲一区高清亚洲精品| 亚洲精品中文字幕在线视频| 黄频高清免费视频| 久久精品国产综合久久久| 在线永久观看黄色视频| av网站在线播放免费| 纯流量卡能插随身wifi吗| 免费人成视频x8x8入口观看| 精品久久久精品久久久| 色94色欧美一区二区| 国产高清videossex| 波多野结衣av一区二区av| 午夜精品久久久久久毛片777| 日韩视频一区二区在线观看| 精品少妇久久久久久888优播| 美女午夜性视频免费| 热99re8久久精品国产| 麻豆乱淫一区二区| 久久精品91无色码中文字幕| 欧美日韩瑟瑟在线播放| 天天添夜夜摸| xxx96com| 久久天堂一区二区三区四区| 中出人妻视频一区二区| 十八禁高潮呻吟视频| 18禁裸乳无遮挡免费网站照片 | 大陆偷拍与自拍| 怎么达到女性高潮| 亚洲av美国av| 欧美精品av麻豆av| 一区福利在线观看| 久久久国产一区二区| 99久久人妻综合| 国产精品偷伦视频观看了| 欧美精品啪啪一区二区三区| 香蕉丝袜av| 欧美最黄视频在线播放免费 | 亚洲精品美女久久av网站| 国产成人啪精品午夜网站| 国产野战对白在线观看| 免费在线观看亚洲国产| 丝瓜视频免费看黄片| 国产精华一区二区三区| 曰老女人黄片| 高清黄色对白视频在线免费看| 亚洲国产欧美网| 天堂√8在线中文| 欧美国产精品一级二级三级| 成年动漫av网址| 女人精品久久久久毛片| 亚洲少妇的诱惑av| 日韩一卡2卡3卡4卡2021年| 999精品在线视频| a级毛片在线看网站| 欧美 亚洲 国产 日韩一| 国产成人精品在线电影| 热re99久久国产66热| 久热这里只有精品99| 中国美女看黄片| 一本大道久久a久久精品| 亚洲视频免费观看视频| 亚洲人成电影免费在线| 日本黄色视频三级网站网址 | 纯流量卡能插随身wifi吗| 在线观看免费日韩欧美大片| 亚洲中文字幕日韩| 亚洲五月天丁香| 欧美国产精品va在线观看不卡| 国产精品一区二区在线观看99| 一级毛片女人18水好多| 天堂√8在线中文| 精品第一国产精品| 亚洲伊人色综图| 欧美精品人与动牲交sv欧美| 免费观看精品视频网站| 美国免费a级毛片| 一级毛片高清免费大全| 日韩制服丝袜自拍偷拍| 成年动漫av网址| 波多野结衣av一区二区av| 欧美在线一区亚洲| 国产精品一区二区在线不卡| 三上悠亚av全集在线观看| 国产av精品麻豆| 美女扒开内裤让男人捅视频| 麻豆乱淫一区二区| 国产精品.久久久| 一级片'在线观看视频| 亚洲中文字幕日韩| 人人妻人人澡人人爽人人夜夜| 亚洲精品乱久久久久久| 麻豆乱淫一区二区| 国产精品九九99| 亚洲国产中文字幕在线视频| 国产欧美日韩一区二区三区在线| 国产一区二区激情短视频| 国产高清国产精品国产三级| 欧美午夜高清在线| 国产日韩一区二区三区精品不卡| 在线永久观看黄色视频| 久久午夜综合久久蜜桃| 美女高潮喷水抽搐中文字幕| 黄色丝袜av网址大全| 日韩欧美一区视频在线观看| av一本久久久久| 日韩 欧美 亚洲 中文字幕| 成年女人毛片免费观看观看9 | 亚洲精品国产精品久久久不卡| 丰满迷人的少妇在线观看| 国产不卡av网站在线观看| 亚洲国产中文字幕在线视频| 日韩欧美一区二区三区在线观看 | 午夜福利视频在线观看免费| 亚洲免费av在线视频| 国产深夜福利视频在线观看| e午夜精品久久久久久久| 婷婷精品国产亚洲av在线 | 国产av一区二区精品久久| 大码成人一级视频| 在线观看免费视频网站a站| 美女扒开内裤让男人捅视频| 在线永久观看黄色视频| 两个人看的免费小视频| 亚洲av成人av| 看片在线看免费视频| 五月开心婷婷网| 欧美最黄视频在线播放免费 | 久久99一区二区三区| 99国产精品一区二区三区| 性色av乱码一区二区三区2| 亚洲自偷自拍图片 自拍| 中文字幕另类日韩欧美亚洲嫩草| 国产精品久久久久成人av| 国产亚洲精品久久久久5区| 香蕉久久夜色| 亚洲一码二码三码区别大吗| 一二三四在线观看免费中文在| 久久天躁狠狠躁夜夜2o2o| 亚洲欧美精品综合一区二区三区| 又大又爽又粗| 999久久久精品免费观看国产| 香蕉国产在线看| 国产亚洲精品久久久久久毛片 | 日本五十路高清| 久久这里只有精品19| 人人妻,人人澡人人爽秒播| 亚洲成a人片在线一区二区| 91成人精品电影| 在线观看免费午夜福利视频| 国产在线一区二区三区精| 老司机午夜十八禁免费视频| 精品久久久久久,| 老司机午夜福利在线观看视频| 国产深夜福利视频在线观看| 性少妇av在线| 国产真人三级小视频在线观看| 欧美另类亚洲清纯唯美| 黄色女人牲交| 夜夜躁狠狠躁天天躁| 午夜福利,免费看| 精品少妇久久久久久888优播| 国产午夜精品久久久久久| 丁香六月欧美| 俄罗斯特黄特色一大片| 欧美 亚洲 国产 日韩一| 满18在线观看网站| 国产精品亚洲一级av第二区| 久久久国产成人免费| 亚洲专区中文字幕在线| 欧美丝袜亚洲另类 | www.自偷自拍.com| 日本撒尿小便嘘嘘汇集6| 亚洲成人免费av在线播放| 18禁裸乳无遮挡动漫免费视频| 伊人久久大香线蕉亚洲五| 日本撒尿小便嘘嘘汇集6| 欧美av亚洲av综合av国产av| svipshipincom国产片| a级片在线免费高清观看视频| 制服人妻中文乱码| 亚洲中文av在线| 欧美日韩国产mv在线观看视频| 满18在线观看网站| 亚洲欧美激情在线| 久99久视频精品免费| 午夜精品国产一区二区电影| 国产精品秋霞免费鲁丝片| 色在线成人网| 欧美日韩亚洲国产一区二区在线观看 | 18禁美女被吸乳视频| 中文字幕精品免费在线观看视频| 夜夜爽天天搞| 天堂俺去俺来也www色官网| 午夜精品久久久久久毛片777| 黑人巨大精品欧美一区二区蜜桃| 久久久国产成人精品二区 | 9色porny在线观看| 美女视频免费永久观看网站| 操美女的视频在线观看| 自线自在国产av| 欧美丝袜亚洲另类 | 每晚都被弄得嗷嗷叫到高潮| 99精品久久久久人妻精品| av线在线观看网站| 中出人妻视频一区二区| 1024香蕉在线观看| 看片在线看免费视频| 国内毛片毛片毛片毛片毛片| 黄色成人免费大全| 在线观看日韩欧美| 欧美日韩福利视频一区二区| 中文字幕制服av| 国产区一区二久久| 久久精品国产亚洲av香蕉五月 | 精品久久久久久久毛片微露脸| 免费在线观看视频国产中文字幕亚洲| 久久久久久久久久久久大奶| 黄色 视频免费看| 国产精品秋霞免费鲁丝片| 欧美精品高潮呻吟av久久| 国内久久婷婷六月综合欲色啪| 一本一本久久a久久精品综合妖精| 日日爽夜夜爽网站| 国内毛片毛片毛片毛片毛片| 欧美日韩国产mv在线观看视频| 欧美日韩中文字幕国产精品一区二区三区 | 19禁男女啪啪无遮挡网站| 成人三级做爰电影| 婷婷精品国产亚洲av在线 | 乱人伦中国视频| 18禁黄网站禁片午夜丰满| 王馨瑶露胸无遮挡在线观看| 亚洲精品在线美女| 亚洲国产欧美一区二区综合| 9191精品国产免费久久| 亚洲,欧美精品.| 欧美精品av麻豆av| 黄色女人牲交| 国产男女内射视频| 国产又爽黄色视频| 老司机午夜福利在线观看视频| videos熟女内射| 99热网站在线观看| 亚洲精品在线观看二区| 国产欧美日韩综合在线一区二区| 亚洲精品在线美女| 18禁裸乳无遮挡免费网站照片 | 91在线观看av| 日韩视频一区二区在线观看| 在线国产一区二区在线| 天堂√8在线中文| 欧美最黄视频在线播放免费 | 天天影视国产精品| 十分钟在线观看高清视频www| 无遮挡黄片免费观看| 久久草成人影院| 日韩欧美一区视频在线观看| www.熟女人妻精品国产| 久久狼人影院| 人人澡人人妻人| 国产精品av久久久久免费| 国产精品1区2区在线观看. | 亚洲午夜精品一区,二区,三区| 亚洲人成电影观看| 国产日韩欧美亚洲二区| 久久ye,这里只有精品| 久久久国产精品麻豆| 欧美不卡视频在线免费观看 | 国产亚洲精品综合一区在线观看| 欧美成人a在线观看| 老熟妇仑乱视频hdxx| 欧美3d第一页| www.色视频.com| 少妇的逼水好多| 99久久无色码亚洲精品果冻| 精品人妻偷拍中文字幕| 欧美中文综合在线视频| 久久久久久久午夜电影| 老熟妇乱子伦视频在线观看| 久99久视频精品免费| www日本黄色视频网| 两个人看的免费小视频| 亚洲av一区综合| 九九在线视频观看精品| 国产视频内射| 丰满人妻一区二区三区视频av | 女生性感内裤真人,穿戴方法视频| 又黄又粗又硬又大视频| 亚洲成av人片免费观看| 搡老岳熟女国产| 日本一本二区三区精品| 制服丝袜大香蕉在线| 亚洲电影在线观看av| 亚洲成a人片在线一区二区| 国产私拍福利视频在线观看| 亚洲无线观看免费| 久久久久九九精品影院| 婷婷精品国产亚洲av在线| av黄色大香蕉| 偷拍熟女少妇极品色| 午夜两性在线视频| 国产精品亚洲av一区麻豆| 美女高潮喷水抽搐中文字幕| 国产免费男女视频| 欧美色视频一区免费| 美女大奶头视频| 看免费av毛片| 欧美zozozo另类| 国产爱豆传媒在线观看| 亚洲人成网站在线播| 欧美日韩中文字幕国产精品一区二区三区| 国语自产精品视频在线第100页| 别揉我奶头~嗯~啊~动态视频| 美女免费视频网站| 美女被艹到高潮喷水动态| 女人十人毛片免费观看3o分钟| 我的老师免费观看完整版| 亚洲av电影不卡..在线观看| 欧美一区二区国产精品久久精品| 一个人看的www免费观看视频| 午夜激情福利司机影院| 亚洲成人中文字幕在线播放| www.熟女人妻精品国产| 亚洲精品美女久久久久99蜜臀| 亚洲欧美日韩东京热| 在线观看日韩欧美| 无遮挡黄片免费观看| 法律面前人人平等表现在哪些方面| 国产91精品成人一区二区三区| 国产精品99久久久久久久久| 99在线视频只有这里精品首页| 3wmmmm亚洲av在线观看| 少妇的逼水好多| 俺也久久电影网| 97人妻精品一区二区三区麻豆| 人妻丰满熟妇av一区二区三区| 色播亚洲综合网| 99国产极品粉嫩在线观看| 九色国产91popny在线| 亚洲欧美一区二区三区黑人| 午夜福利高清视频| 日韩欧美国产在线观看| 国产黄色小视频在线观看| 久久精品91蜜桃| 可以在线观看的亚洲视频| 神马国产精品三级电影在线观看| 免费人成视频x8x8入口观看| 久久人妻av系列| 91麻豆精品激情在线观看国产| 亚洲人成网站高清观看| 国产欧美日韩精品亚洲av| 麻豆一二三区av精品| 香蕉丝袜av| 欧美日韩综合久久久久久 | 少妇人妻一区二区三区视频| 丰满人妻熟妇乱又伦精品不卡| 哪里可以看免费的av片| 人人妻人人看人人澡| 岛国在线免费视频观看| 全区人妻精品视频| 18禁黄网站禁片午夜丰满| 村上凉子中文字幕在线| 精品日产1卡2卡| 国产91精品成人一区二区三区| 成人一区二区视频在线观看| 床上黄色一级片| 国产精品亚洲美女久久久| 日本a在线网址| 精品不卡国产一区二区三区| 在线观看免费午夜福利视频| 欧美日本亚洲视频在线播放| 特大巨黑吊av在线直播| 国产午夜福利久久久久久| 免费在线观看成人毛片| av欧美777| 国产精品久久电影中文字幕| 久久久久久久久久黄片| 国产久久久一区二区三区|