• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強(qiáng)化學(xué)習(xí)和人工勢場法的移動機(jī)器人導(dǎo)航

    2021-12-04 07:40:12李茂軍李宜偉賴志強(qiáng)
    關(guān)鍵詞:狀態(tài)值勢場行人

    陳 滿,李茂軍,李宜偉,賴志強(qiáng)

    (長沙理工大學(xué) 電氣與信息工程學(xué)院,湖南 長沙 410114)

    移動機(jī)器人導(dǎo)航任務(wù)可以描述為移動機(jī)器人依據(jù)自身和周圍的環(huán)境信息,安全自主地避開障礙物并實(shí)現(xiàn)朝向目標(biāo)位置的運(yùn)動[1]. 隨著移動機(jī)器人導(dǎo)航技術(shù)的迅速發(fā)展,其應(yīng)用場景已經(jīng)逐漸從工廠等結(jié)構(gòu)化場景走向公共服務(wù)領(lǐng)域.該領(lǐng)域的場景通常存在眾多行人,并且行人的運(yùn)動隨機(jī)性較大,因此機(jī)器人需要與行人頻繁地交互并合理預(yù)測行人的運(yùn)動軌跡,這給導(dǎo)航任務(wù)帶來了難度.

    目前行人環(huán)境中的導(dǎo)航方法通??梢苑譃榛谀P偷姆椒ê蛿?shù)據(jù)驅(qū)動方法.基于模型的方法使用數(shù)學(xué)或物理模型來描述機(jī)器人與行人的交互,并預(yù)測行人的運(yùn)動軌跡,然后結(jié)合傳統(tǒng)的路徑規(guī)劃算法如滾動窗口法完成導(dǎo)航任務(wù).Chik等[2]使用高斯過程模型對行人的運(yùn)動進(jìn)行建模,并進(jìn)行機(jī)器人與行人的交互,在行人環(huán)境中實(shí)現(xiàn)了導(dǎo)航任務(wù);Takanashi等[3]提出了行人隨機(jī)建模方法,通過大量行人軌跡獲取隨機(jī)模型,獲得更精確的交互效果.這類基于模型的方法需要根據(jù)不同的實(shí)驗(yàn)場景設(shè)置不同參數(shù),對于陌生的導(dǎo)航場景泛化能力有限,且導(dǎo)航效果欠佳.

    隨著機(jī)器學(xué)習(xí)的發(fā)展,無模型的數(shù)據(jù)驅(qū)動方法成為行人環(huán)境下機(jī)器人導(dǎo)航的熱門研究方向. 趙英男[4]將導(dǎo)航任務(wù)抽象為“格子游戲”,使用Sarsa算法進(jìn)行移動機(jī)器人導(dǎo)航,實(shí)現(xiàn)了初步導(dǎo)航功能;Chen等[5]使用深度強(qiáng)化學(xué)習(xí)解決行人狀態(tài)下多機(jī)器人協(xié)同導(dǎo)航問題,使導(dǎo)航更高效;Chen等[6]提出了社會注意力深度強(qiáng)化學(xué)習(xí)算法,采用社會注意力網(wǎng)絡(luò)作為狀態(tài)值函數(shù),使機(jī)器人與行人的交互更充分.以上數(shù)據(jù)驅(qū)動的方法使機(jī)器人具有“學(xué)習(xí)能力”,極大地提升了場景適應(yīng)性,但也面臨著學(xué)習(xí)效率低下、收斂困難等問題.

    針對上述現(xiàn)有導(dǎo)航技術(shù)中存在的不足,本文將傳統(tǒng)物理模型和數(shù)據(jù)驅(qū)動方法融合,提出勢場增強(qiáng)注意力深度強(qiáng)化學(xué)習(xí)PARL算法.主要工作有:①提出勢場注意力網(wǎng)絡(luò),有效地?cái)U(kuò)充了機(jī)器人和行人的狀態(tài)信息,促進(jìn)狀態(tài)信息的交互;②建立勢場獎勵函數(shù),并設(shè)置不同空間平衡各部分獎勵,完善了獎勵回饋機(jī)制;③提出反向近似模型,并結(jié)合綜合獎勵函數(shù)的空間劃分方式改進(jìn)動作空間,減少機(jī)器人的無效探索.

    1 相關(guān)算法

    1.1 人工勢場法人工勢場法是一種虛擬力法,常用于機(jī)器人導(dǎo)航任務(wù)中[7].該方法假設(shè)機(jī)器人在目標(biāo)位置的引力勢場中受到引力作用,在障礙物的斥力勢場中受到斥力作用.引力勢場函數(shù)和斥力勢場函數(shù)分別表示為:

    其中,ξ為引力勢場常數(shù),η 為斥力勢場常量,αgra為機(jī)器人當(dāng)前位置與目標(biāo)位置之間的歐氏距離,αrep為機(jī)器人當(dāng)前位置與障礙物之間的歐氏距離,α0代表障礙物的最大影響距離.引力為引力勢場的負(fù)梯度,斥力為斥力勢場的負(fù)梯度,表示為:

    因此,機(jī)器人在其工作空間受到的合力為所受引力與斥力的矢量和(圖1),該合力決定機(jī)器人在該位置的運(yùn)動情況.

    圖1 人工勢場受力分析Fig.1 Force analysis of artificial potential field

    1.2 深度強(qiáng)化學(xué)習(xí)基本的強(qiáng)化學(xué)習(xí)以馬爾科夫決策過程(Markov Decision Process,MDP)為理論框架[8],具體過程如下:在t時(shí)刻,智能體獲取狀態(tài)st,根據(jù)給定的策略π, 選擇并執(zhí)行相應(yīng)的動作at,然后過渡到新的狀態(tài)st+1并獲取獎勵rt.智能體強(qiáng)化學(xué)習(xí)的最終目的是找到一個最優(yōu)策略π?,該策略可以最大化未來獎勵之和:

    其中,γ∈[0,1)是未來獎勵的折扣系數(shù).狀態(tài)值函數(shù)V(st)可以定義為t時(shí)刻狀態(tài)st的期望獎勵,拆分成即時(shí)獎勵和后續(xù)折扣獎勵,表示為:

    其中,E為數(shù)學(xué)期望.最優(yōu)策略π?可以執(zhí)行最高累計(jì)獎勵的控制動作,從而得到最佳狀態(tài)值函數(shù)V*(st),用貝爾曼最優(yōu)方程表示為[9]:

    其中,為在狀態(tài)st下執(zhí)行動作at過渡到st+1的狀態(tài)轉(zhuǎn)移函數(shù).

    深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)算法[10]使用深度神經(jīng)網(wǎng)絡(luò)作為非線性函數(shù)近似器來近似V值,并且引入經(jīng)驗(yàn)重播方法[11]和目標(biāo)值網(wǎng)絡(luò).經(jīng)驗(yàn)重播方法將智能體與環(huán)境交互獲得的經(jīng)驗(yàn)集儲存在記憶池中,訓(xùn)練時(shí)采樣經(jīng)驗(yàn)集,打破經(jīng)驗(yàn)之間的關(guān)聯(lián)性,增加學(xué)習(xí)的效率與穩(wěn)定性.目標(biāo)值網(wǎng)絡(luò)用于更新狀態(tài)值網(wǎng)絡(luò)參數(shù),提升算法的收斂能力.

    2 勢場增強(qiáng)注意力深度強(qiáng)化學(xué)習(xí)算法

    2.1 狀態(tài)空間狀態(tài)空間包括機(jī)器人狀態(tài)和行人狀態(tài)兩個方面,將機(jī)器人和行人均抽象為2D平面中的圓,目標(biāo)位置g抽象為平面中的點(diǎn),以機(jī)器人為原點(diǎn),機(jī)器人到目標(biāo)位置的方向?yàn)閤軸正方向建立坐標(biāo)系.則機(jī)器人自身的狀態(tài)B表示為:

    其中,p、v、r和vo分別表示機(jī)器人的位置、速度、半徑和預(yù)設(shè)速度,dg表示機(jī)器人與目標(biāo)位置的距離.行人的狀態(tài)Hi為:

    其中,n為行人的數(shù)量,pi、vi和ri分別表示行人的位置、速度和半徑,di表示機(jī)器人與行人的距離,dm和ds分別表示行人的最大影響距離和機(jī)器人與行人的安全距離.綜合(8)、(9),得到狀態(tài)s為:

    2.2 勢場注意力網(wǎng)絡(luò)對于行人環(huán)境中的機(jī)器人導(dǎo)航任務(wù),需要機(jī)器人與行人充分交互,并對狀態(tài)信息進(jìn)行編碼,預(yù)測行人運(yùn)動軌跡.勢場注意力網(wǎng)絡(luò)(圖2)將人工勢場模型和注意力機(jī)制[12]融合,主要由3個模塊組成:勢能模塊、交互池化模塊、整合模塊.

    圖2 勢場注意力網(wǎng)絡(luò)Fig.2 Potential field attention network

    2.2.1 勢能模塊勢能模塊將行人和機(jī)器人的部分狀態(tài)用人工勢場法抽象,再合并到原有狀態(tài)中,擴(kuò)充狀態(tài)信息.首先,依據(jù)公式(1)、(2)構(gòu)建機(jī)器人勢能因素U和行人勢能因素Ui,表示為:

    其中, ξ1為引力勢能因子, η1為斥力勢能因子.則融合勢能因素的機(jī)器人狀態(tài)B′和行人的狀態(tài)分別為:

    經(jīng)過勢場模塊擴(kuò)充后的狀態(tài)s′為:

    2.2.2 交互池化模塊交互池化模塊使用多個多層感知器(Multi-Layer Perceptron,MLP)[13]構(gòu)建,將擴(kuò)充后的狀態(tài)信息編碼為長度固定的向量,獲取機(jī)器人與行人的交互特征,然后使用注意力機(jī)制構(gòu)建行人對機(jī)器人的影響力,最后得到人群特征.首先將狀態(tài)s′編碼到固定長度的向量ei中:

    其中,We為 φe的權(quán)重, φe使用ReLU激活. 再將ei輸入到后續(xù)的MLPρf中,獲得機(jī)器人與行人的交互特征:

    其中, ρf表示全連接層,使用ReLU激活,W f為fi的權(quán)重.然后使用MLPφψ獲取行人注意力分?jǐn)?shù)ψi,用于表征行人對機(jī)器人的影響力,表示為:

    其中,φψ使用ReLU激活,Wψ為 φψ的權(quán)重.最后將交互特征fi和行人注意力分?jǐn)?shù)ψi加權(quán)線性組合,得人群特征:

    2.2.3 整合模塊整合模塊用于計(jì)算狀態(tài)值網(wǎng)絡(luò)輸出結(jié)果.將B′和人群特征N輸入到整合模塊的MLPzv中,則輸出狀態(tài)值函數(shù)的輸出結(jié)果V(s)為:

    其中,zv使用ReLU激活,Wv為zv的權(quán)重.

    2.3 勢場獎勵函數(shù)對于行人導(dǎo)航環(huán)境,需要機(jī)器人準(zhǔn)確避開行人,并盡量以最短的時(shí)間到達(dá)目標(biāo)位置,因此需要設(shè)置一種合理的獎勵策略.受人工勢場理論的啟發(fā),構(gòu)建勢場獎勵函數(shù),該獎勵函數(shù)由位置獎勵函數(shù)和方向獎勵函數(shù)構(gòu)成,并設(shè)計(jì)勢場獎勵函數(shù)空間平衡各部分獎勵.

    2.3.1 位置獎勵函數(shù)位置獎勵函數(shù)由目標(biāo)引導(dǎo)獎勵函數(shù)和避障獎勵函數(shù)組成,目標(biāo)引導(dǎo)獎勵使機(jī)器人快速到達(dá)目標(biāo)點(diǎn),避障獎勵使機(jī)器人與行人保持一定距離.首先,使用引力勢場函數(shù)構(gòu)建目標(biāo)引導(dǎo)獎勵函數(shù):

    其中, ξ2為引力獎勵因子.使用斥力勢場函數(shù)構(gòu)建避障獎勵函數(shù)部分,設(shè)置該獎勵為負(fù)數(shù),隨著機(jī)器人與行人相對距離di的減小而減?。?/p>

    其中, η2為斥力獎勵因子.

    2.3.2 方向獎勵函數(shù)機(jī)器人導(dǎo)航任務(wù)中,機(jī)器人的當(dāng)前方向?qū)τ诤侠韺?dǎo)航起到了重要的影響.考慮到人工勢場法中機(jī)器人受到的合力方向可以良好地契合機(jī)器人的運(yùn)動方向,故依此設(shè)計(jì)方向獎勵函數(shù),對當(dāng)前機(jī)器人的方向做出評價(jià).由公式(3)可知,機(jī)器人所受目標(biāo)位置的引力大小Fg為:

    引力方向?yàn)闄C(jī)器人指向目標(biāo)位置.由公式(4)可知,機(jī)器人所受行人的斥力大小Fi為:

    斥力方向?yàn)樾腥酥赶驒C(jī)器人.合力表示為全體引力和斥力的矢量相加:

    使用合力Fj的方向表示預(yù)期方向.機(jī)器人預(yù)期方向和實(shí)際方向之間的契合程度表示為:

    其中Fa表示機(jī)器人實(shí)際運(yùn)動向量,φ為預(yù)期方向與實(shí)際方向Fa的夾角.考慮公式(26),設(shè)計(jì)方向獎勵函數(shù)rori(φ),表示為:

    其中,τ為角度因子.

    2.3.3 勢場獎勵函數(shù)空間如圖3所示,以行人為中心構(gòu)建勢場獎勵函數(shù)空間,依次將行人周圍空間劃分為方向引導(dǎo)空間、綜合空間和目標(biāo)引導(dǎo)空間.其中方向引導(dǎo)空間和綜合空間使用半徑為ds的圓區(qū)分,綜合空間和目標(biāo)引導(dǎo)空間使用半徑為dm的圓區(qū)分,如公式(9),ds為行人的最大影響距離,dm為機(jī)器人與行人的安全距離.勢場獎勵函數(shù)空間使用權(quán)重向量表示:

    圖3 勢場獎勵函數(shù)空間Fig.3 Potential field reward function space

    綜合公式(21)、(22)、(27)、(28),得到勢場獎勵函數(shù)為:

    2.4 動作空間

    2.4.1 反向近似模型受基于近似動作模型策略選擇的Q-學(xué)習(xí)算法[14]啟發(fā),提出反向近似模型,用于在新的環(huán)境狀態(tài)下刪減部分動作選項(xiàng),減少不必要的探索.假設(shè)機(jī)器人的原始動作空間為Mmax,新環(huán)境狀態(tài)為O,定義反向近似動作空間Mrev為:

    其中,J表示反向近似函數(shù).

    2.4.2 動作空間假設(shè)移動機(jī)器人可以朝任何方向移動,其動作at主要包括速度v、速度偏差vdev、 方向ω和方向偏差ωdev4個要素,其中vdev和 ωdev用于表征機(jī)器人內(nèi)部故障或外部環(huán)境因素對速度和方向造成的偏差.則at表示為:

    其中,v可取5個值,分別在( 0,vo] 呈指數(shù)間隔分布,ω可取16個值,分別在[0,2π)均勻分布,vdev和ωdev與機(jī)器人內(nèi)部狀態(tài)和實(shí)際導(dǎo)航場景有關(guān),為了簡化動作空間,實(shí)驗(yàn)中均設(shè)置為0,因此原始動作空間A為80種離散動作的集合.

    依據(jù)綜合獎勵函數(shù)空間劃分方式將狀態(tài)分為Sa、Sb和Sc3類,結(jié)合反向近似模型,將動作空間重新改進(jìn)(圖4).其中,Sa表示環(huán)境中存在機(jī)器人位于行人的方向引導(dǎo)空間中,此時(shí)機(jī)器人的動作空間為A;Sb表示機(jī)器人位于所有行人的目標(biāo)引導(dǎo)空間中,采用動作空間Ab,由公式(30)得:

    圖4 反向近似模型Fig.4 Reverse approximation model

    該動作空間的方向ω可取11個值,有55種離散動作;Sc表示機(jī)器人同時(shí)位于綜合空間和目標(biāo)引導(dǎo)空間(或均位于綜合空間)中,采用動作空間Ac,該動作空間的ω 有13種取值,有65種離散動作.

    2.5 訓(xùn)練過程當(dāng)機(jī)器人從零開始學(xué)習(xí)時(shí),獲得的獎勵具有稀疏性,收斂速度較慢,因此使用ORCA算法[15]收集3 000個經(jīng)驗(yàn)集并預(yù)訓(xùn)練50輪,目的是初始化狀態(tài)值網(wǎng)絡(luò)V和目標(biāo)值網(wǎng)絡(luò)V′的權(quán)重,讓機(jī)器人具有一般的導(dǎo)航能力,即保證機(jī)器人總體上能夠朝向目標(biāo)點(diǎn)運(yùn)動,但是不能保證機(jī)器人不發(fā)生碰撞,也不能保證其導(dǎo)航時(shí)間最短.

    強(qiáng)化學(xué)習(xí)訓(xùn)練過程使用ε-貪婪策略選擇最優(yōu)動作或隨機(jī)動作,最優(yōu)動作由最優(yōu)策略π?決定.引入記憶池D,采用隨機(jī)經(jīng)驗(yàn)重播方法[16]選擇經(jīng)驗(yàn)集.其中π?表示為:

    其中,Δt為相鄰兩個動作決策之間的時(shí)間間隔,V*(st)為最佳狀態(tài)值函數(shù).由于相鄰兩個動作決策之間的時(shí)間間隔 Δt較小,因此可使用等速模型近似[17],則π?簡化為:

    最終,得到勢場增強(qiáng)注意力深度強(qiáng)化學(xué)習(xí)(potential field enhanced attention deep reinforcement learning,PARL)算法,用該算法進(jìn)行訓(xùn)練,算法訓(xùn)練過程如圖5所示.

    圖5 PARL算法訓(xùn)練過程示意圖Fig.5 Schematic diagram of the training process of PARL algorithm

    算法1勢場增強(qiáng)注意力深度強(qiáng)化學(xué)習(xí)

    輸入未來獎勵折扣γ、預(yù)訓(xùn)練學(xué)習(xí)率αP、強(qiáng)化學(xué)習(xí)學(xué)習(xí)率αR、 目標(biāo)網(wǎng)絡(luò)權(quán)重更新周期C、貪婪因子ε、記憶池容量L、最大運(yùn)行時(shí)間tmax;

    輸出狀態(tài)值網(wǎng)絡(luò)V的權(quán)重參數(shù)θ,目標(biāo)值網(wǎng)絡(luò)V′的權(quán)重 θ′;

    步驟1預(yù)訓(xùn)練狀態(tài)值網(wǎng)絡(luò)V并獲得權(quán)重θ,初始化目標(biāo)值網(wǎng)絡(luò)V′和權(quán)重θ′,使θ′=θ;

    步驟2初始化機(jī)器人導(dǎo)航場景,獲取初始狀態(tài)s0;

    步驟3判斷當(dāng)前狀態(tài)類別并選擇動作空間;

    步驟4使用ε-貪婪策略選擇動作at:在當(dāng)前動作空間內(nèi)隨機(jī)選擇動作或選擇最優(yōu)動作at=(Vθ表示狀態(tài)值網(wǎng)絡(luò)V的狀態(tài)值函數(shù));

    步驟5執(zhí)行動作at,過渡到新狀態(tài)空間st+Δt,并獲得獎勵r(st,at);

    步驟6若記憶池D中經(jīng)驗(yàn)集的數(shù)量為L,則刪除最早的經(jīng)驗(yàn)集,并將新的經(jīng)驗(yàn)集存入D中,并使用隨機(jī)經(jīng)驗(yàn)重播方法從記憶池D中抽取經(jīng)驗(yàn)集;

    步驟7依據(jù)經(jīng)驗(yàn)集和目標(biāo)值網(wǎng)絡(luò)V′計(jì)算目標(biāo)值表示目標(biāo)值網(wǎng)絡(luò)V′的狀態(tài)值函數(shù));

    步驟8根據(jù)目標(biāo)值y,使用梯度下降方法更新狀態(tài)值網(wǎng)絡(luò)V的權(quán)重參數(shù)θ;

    步驟9目標(biāo)值網(wǎng)絡(luò)權(quán)重更新,即在一輪中,若機(jī)器人導(dǎo)航到當(dāng)前位置所用的總時(shí)間小于tmax,則每隔C步動作決策更新一次目標(biāo)值網(wǎng)絡(luò)V′的權(quán)重θ′,使θ′=θ;

    步驟10更新貪婪因子ε;

    步驟11判斷是否滿足終止條件,即機(jī)器人到達(dá)目標(biāo)點(diǎn)或?qū)Ш綍r(shí)間大于tmax,若滿足則終止本輪循環(huán);否則,轉(zhuǎn)到步驟3;

    步驟12判斷是否達(dá)到設(shè)定的輪次,若滿足則結(jié)束訓(xùn)練;否則,轉(zhuǎn)到步驟2.

    3 實(shí)驗(yàn)和結(jié)果分析

    3.1 實(shí)驗(yàn)環(huán)境和參數(shù)如圖6所示,使用V-REP仿真軟件建立仿真環(huán)境.機(jī)器人的導(dǎo)航空間S為10 m×10 m 正方形區(qū)域,為了防止訓(xùn)練過程中移動機(jī)器人運(yùn)動到工作空間S之外,在其邊緣設(shè)置墻壁.機(jī)器人的起始位置p 和目標(biāo)位置g均在圖6中表示,預(yù)設(shè)最大速度vo為1 m /s,半徑r取值為0.3 m,相鄰兩個動作決策之間的時(shí)間間隔Δt為0.25s,最大運(yùn)行時(shí)間tmax設(shè)置為25 s.行人數(shù)量n取值為5,行人的運(yùn)動使用隨機(jī)模型控制[3].

    圖6 移動機(jī)器人V-REP仿真環(huán)境Fig.6 V-REP simulation environment for mobile robot

    使用PyTorch框架建立PARL算法模型控制機(jī)器人,其中預(yù)訓(xùn)練學(xué)習(xí)率為0.01,強(qiáng)化學(xué)習(xí)學(xué)習(xí)率為0.001,未來獎勵的折扣系數(shù)γ為0.9,貪婪因子ε 在5 000輪訓(xùn)練中從0.5線性衰減到0.1.

    3.2 訓(xùn)練實(shí)驗(yàn)本實(shí)驗(yàn)將一輪定義為一次完整的機(jī)器人導(dǎo)航過程,按照導(dǎo)航結(jié)果的不同,可將每次導(dǎo)航分為以下3種情況:①導(dǎo)航成功,即機(jī)器人在最大運(yùn)行時(shí)間tmax內(nèi)成功到達(dá)目標(biāo)位置;②超出導(dǎo)航時(shí)間,即機(jī)器人運(yùn)行時(shí)間超過tmax,且未發(fā)生碰撞;③發(fā)生碰撞,即機(jī)器人在tmax內(nèi)碰到行人或墻壁.在每輪導(dǎo)航過程中,機(jī)器人每隔Δt進(jìn)行一次迭代,直到完成此輪導(dǎo)航為止.

    使用PARL算法對移動機(jī)器人進(jìn)行5 000輪訓(xùn)練,使用SARL算法[6]和CADRL算法[5]作為對比實(shí)驗(yàn).如圖7、8所示,分別繪制機(jī)器人平均導(dǎo)航成功率和平均導(dǎo)航時(shí)間曲線,其中橫坐標(biāo)表示訓(xùn)練輪數(shù),縱坐標(biāo)分別表示未來200輪訓(xùn)練的平均導(dǎo)航時(shí)間和平均導(dǎo)航成功率,發(fā)生情況②和③時(shí)導(dǎo)航時(shí)間均視為tmax.

    圖7 不同算法機(jī)器人平均導(dǎo)航成功率Fig.7 Average navigation success rate of robots with different algorithms

    圖8 不同算法機(jī)器人平均導(dǎo)航時(shí)間Fig.8 Average navigation time of robots

    由圖7、8可知,隨著訓(xùn)練輪數(shù)的增加,機(jī)器人導(dǎo)航時(shí)間減少,導(dǎo)航成功率提高,說明機(jī)器人在行人環(huán)境下具有自主學(xué)習(xí)能力,導(dǎo)航效果隨著自主學(xué)習(xí)逐漸變好. 訓(xùn)練過程中,PARL和SARL的導(dǎo)航時(shí)間和導(dǎo)航成功率均顯著優(yōu)于CADRL,這是因?yàn)镃ADRL的狀態(tài)值函數(shù)只能考慮機(jī)器人與最近行人的關(guān)系,交互不充分,導(dǎo)致訓(xùn)練效果較差.相比于SARL,PARL在訓(xùn)練過程中的導(dǎo)航時(shí)間更少,成功率更高,并且訓(xùn)練曲線的收斂速度更快,這說明PARL將物理模型和數(shù)據(jù)驅(qū)動結(jié)合的方式,可以提升機(jī)器人訓(xùn)練過程中的自主學(xué)習(xí)效率.值得注意的是,PARL在前期對平均導(dǎo)航時(shí)間的改善尤為明顯,而且SARL的平均導(dǎo)航時(shí)間在700輪左右出現(xiàn)大幅度下跌,且曲線整體平滑程度較差,這是說明SARL在訓(xùn)練前期的探索效果較差,而融合了APFM的PARL改善了這一情況,使前期的訓(xùn)練更具有合理性.

    3.3 測試實(shí)驗(yàn)分別對訓(xùn)練5 000輪的PARL、SARL和CADRL進(jìn)行500次測試,計(jì)算平均結(jié)果.除了訓(xùn)練過程所采用的3種強(qiáng)化學(xué)習(xí)算法之外,添加ORCA算法作為對比實(shí)驗(yàn),用于反映基于模型的算法和強(qiáng)化學(xué)習(xí)算法的性能差異,同樣進(jìn)行500次測試實(shí)驗(yàn),計(jì)算平均結(jié)果.

    對于每組測試實(shí)驗(yàn)設(shè)置5個實(shí)驗(yàn)指標(biāo):①平均成功率;②平均碰撞率;③平均導(dǎo)航時(shí)間,即機(jī)器人完成情況①所需的平均時(shí)間;④平均安全率,用于表征發(fā)生情況①時(shí)機(jī)器人和行人距離大于行人安全距離ds的概率,表示為:

    其中W為測試實(shí)驗(yàn)導(dǎo)航成功總次數(shù),ta為機(jī)器人第a次成功導(dǎo)航過程中相對于所有行人均處于安全距離的時(shí)間,T a為機(jī)器人第a次成功導(dǎo)航所用的總時(shí)間;⑤平均導(dǎo)航時(shí)間標(biāo)準(zhǔn)差,用于表征導(dǎo)航動作魯棒性,發(fā)生情況②和③的測試實(shí)驗(yàn)不參與計(jì)算,表示為:

    由表1可知,測試實(shí)驗(yàn)中的PARL的平均成功率和平均安全率達(dá)到100%和98.2%,PAPL和SARL的導(dǎo)航成功率均大幅度高于CADRL,這是因?yàn)樽⒁饬C(jī)制可以充分考慮機(jī)器人與導(dǎo)航場景中各行人的位置關(guān)系,而CADRL只能考慮最近行人的位置,對導(dǎo)航場景存在短視現(xiàn)象,從而引起較多碰撞.ORCA的導(dǎo)航成功率分別低于PARL和SARL58.2%和56.6%,這是因?yàn)镺RCA這類基于模型的方法僅考慮當(dāng)前一定范圍的導(dǎo)航場景,對于較遠(yuǎn)距離行人運(yùn)動的預(yù)測不夠充分.PARL的導(dǎo)航成功率不僅遠(yuǎn)高于CADRL和ORCA,也比同樣擁有注意力機(jī)制SARL高出1.6%,表明PARL這種將數(shù)據(jù)驅(qū)動和物理模型融合的方法,對機(jī)器人導(dǎo)航任務(wù)具有積極作用.

    表1 測試實(shí)驗(yàn)各指標(biāo)數(shù)據(jù)對比Tab.1 Comparison of various index data of test experiment

    平均導(dǎo)航時(shí)間方面,PAPL比其他3種算法縮短0.14~1.11 s,CADRL的平均導(dǎo)航時(shí)間不僅遠(yuǎn)高于PARL和SARL,也比基于模型的ORCA高,這是因?yàn)镃ADRL驅(qū)動的機(jī)器人沒有系統(tǒng)的規(guī)劃路徑能力,不會快速靠近目標(biāo)位置,因此也出現(xiàn)了超出最大導(dǎo)航時(shí)間(情況②)的現(xiàn)象,同為短視算法的ORCA可以更快地靠近目標(biāo)位置,但是更容易發(fā)生碰撞.另外,PARL和SARL的機(jī)器人平均導(dǎo)航時(shí)間分別比ORCA低,說明PARL和SARL在快速接近目標(biāo)位置的能力上優(yōu)于ORCA.PARL算法的平均導(dǎo)航時(shí)間相比于SARL下降了1.3%,說明在導(dǎo)航過程中,PARL驅(qū)動的機(jī)器人運(yùn)動路徑更加合理,能夠更快到達(dá)目標(biāo)位置.

    平均安全率方面,PARL分別高于SARL和CADRL3.3%和17.5%,這表明PARL在導(dǎo)航過程中對行人安全距離ds的控制較為精確,在快速到達(dá)目標(biāo)位置的同時(shí),又保證了導(dǎo)航的安全性.

    平均導(dǎo)航時(shí)間標(biāo)準(zhǔn)差方面,使用CADRL驅(qū)動的機(jī)器人,其魯棒性不僅遠(yuǎn)低于PARL和SARL,也低于ORCA,這同樣是因?yàn)樵撍惴ǖ娜狈ο到y(tǒng)的規(guī)劃路徑能力,因此平均導(dǎo)航時(shí)間的波動幅度較大,魯棒性較差.PARL的平均導(dǎo)航時(shí)間標(biāo)準(zhǔn)差相對于SARL降低了55.9%,這說明PARL可以提升機(jī)器人導(dǎo)航的魯棒性,使機(jī)器人的導(dǎo)航動作更加穩(wěn)定.

    由上述實(shí)驗(yàn)結(jié)果和分析可知,本文提出的PARL對移動行人導(dǎo)航場景具有較好的效果,在導(dǎo)航成功率、導(dǎo)航時(shí)間、導(dǎo)航安全性和導(dǎo)航動作魯棒性等方面均優(yōu)于對比實(shí)驗(yàn).

    4 總結(jié)

    根據(jù)公共服務(wù)領(lǐng)域行人場景中的機(jī)器人導(dǎo)航任務(wù),本文提出了PARL算法.該算法將物理模型和數(shù)據(jù)驅(qū)動從狀態(tài)值函數(shù)、獎勵函數(shù)和動作空間3個方面融合,分別以勢場注意力網(wǎng)絡(luò)作為狀態(tài)值網(wǎng)絡(luò),使用人工勢場思想設(shè)計(jì)獎勵函數(shù),使用反向近似模型改進(jìn)動作空間.實(shí)驗(yàn)結(jié)果表示,PARL可以使移動機(jī)器人的自主學(xué)習(xí)效率得到提高,且平均導(dǎo)航成功率和安全率分別為100%和98.2%,與SARL、CADRL、ORCA算法相比,平均導(dǎo)航時(shí)間縮短0.14~1.11s,且導(dǎo)航動作魯棒性更強(qiáng).在未來的工作中,將集成更多的功能到深度強(qiáng)化學(xué)習(xí)框架中,使移動機(jī)器人更加適應(yīng)真實(shí)的行人環(huán)境.同時(shí),拓展該算法到具體的移動行人場景中,也是未來研究工作的重要課題.

    猜你喜歡
    狀態(tài)值勢場行人
    基于Frenet和改進(jìn)人工勢場的在軌規(guī)避路徑自主規(guī)劃
    基于改進(jìn)人工勢場方法的多無人機(jī)編隊(duì)避障算法
    毒舌出沒,行人避讓
    意林(2021年5期)2021-04-18 12:21:17
    研究降雨事件對交通流時(shí)空特性的影響
    一種基于切換拓?fù)涞碾x散時(shí)間一致性協(xié)議
    路不為尋找者而設(shè)
    庫車坳陷南斜坡古流體勢場對陸相油氣運(yùn)聚的控制
    我是行人
    基于偶極勢場的自主水下航行器回塢導(dǎo)引算法
    基于短文本的突發(fā)事件發(fā)展過程表示方法
    一级a爱片免费观看的视频| 一夜夜www| 亚洲成av人片免费观看| 精品第一国产精品| 动漫黄色视频在线观看| 岛国视频午夜一区免费看| а√天堂www在线а√下载| 美女 人体艺术 gogo| 高清在线国产一区| 亚洲三区欧美一区| 丰满的人妻完整版| 久久久久国内视频| 九色国产91popny在线| av免费在线观看网站| 一级a爱片免费观看的视频| 极品教师在线免费播放| 亚洲成国产人片在线观看| 午夜日韩欧美国产| 亚洲美女黄片视频| 亚洲av第一区精品v没综合| e午夜精品久久久久久久| 麻豆一二三区av精品| 亚洲国产欧美日韩在线播放| 亚洲中文av在线| 真人一进一出gif抽搐免费| 久久热在线av| 12—13女人毛片做爰片一| 在线免费观看的www视频| 亚洲精品久久国产高清桃花| 久久影院123| 一级黄色大片毛片| 国产精品,欧美在线| 亚洲国产欧美一区二区综合| 国产精品一区二区在线不卡| 国产一区二区三区视频了| 日韩欧美三级三区| 操出白浆在线播放| 国产熟女xx| 久久欧美精品欧美久久欧美| 香蕉丝袜av| e午夜精品久久久久久久| 在线观看舔阴道视频| 好男人电影高清在线观看| 国产黄a三级三级三级人| 精品欧美国产一区二区三| 两个人看的免费小视频| 一进一出抽搐gif免费好疼| 长腿黑丝高跟| 日本撒尿小便嘘嘘汇集6| 国产成人精品久久二区二区免费| 91成人精品电影| 亚洲九九香蕉| 亚洲男人的天堂狠狠| 亚洲午夜精品一区,二区,三区| 国产av在哪里看| 色综合亚洲欧美另类图片| 国产一区二区三区综合在线观看| 亚洲av日韩精品久久久久久密| 国产三级黄色录像| 极品教师在线免费播放| 男女下面插进去视频免费观看| 久久精品91无色码中文字幕| 欧美日韩福利视频一区二区| 亚洲国产中文字幕在线视频| 精品国内亚洲2022精品成人| 欧美日韩瑟瑟在线播放| ponron亚洲| 国产xxxxx性猛交| 欧美日本中文国产一区发布| 两个人视频免费观看高清| 后天国语完整版免费观看| 精品欧美一区二区三区在线| 夜夜躁狠狠躁天天躁| 国产精品国产高清国产av| 国产男靠女视频免费网站| 成人免费观看视频高清| 中文字幕色久视频| 欧美日韩精品网址| 亚洲精品美女久久av网站| 久久香蕉激情| 一本综合久久免费| 男女做爰动态图高潮gif福利片 | 夜夜夜夜夜久久久久| 女人爽到高潮嗷嗷叫在线视频| 免费看a级黄色片| 亚洲九九香蕉| 级片在线观看| 亚洲三区欧美一区| 露出奶头的视频| 操美女的视频在线观看| 亚洲色图av天堂| av视频免费观看在线观看| 免费看十八禁软件| 黄色毛片三级朝国网站| 在线视频色国产色| 69av精品久久久久久| 久久伊人香网站| 国产亚洲av高清不卡| 亚洲自拍偷在线| 国产av精品麻豆| 精品久久蜜臀av无| 欧美成人午夜精品| 嫩草影院精品99| 成人国语在线视频| 又紧又爽又黄一区二区| 国产亚洲欧美在线一区二区| aaaaa片日本免费| 又黄又粗又硬又大视频| 亚洲成人国产一区在线观看| 精品国产一区二区久久| 亚洲色图av天堂| 18禁国产床啪视频网站| 如日韩欧美国产精品一区二区三区| 99精品在免费线老司机午夜| 国产三级在线视频| 日本 欧美在线| 国产日韩一区二区三区精品不卡| 韩国精品一区二区三区| 啪啪无遮挡十八禁网站| 成人欧美大片| 国产真人三级小视频在线观看| 亚洲国产欧美一区二区综合| 波多野结衣巨乳人妻| 久久国产乱子伦精品免费另类| 国产成人精品无人区| 久久久久精品国产欧美久久久| 亚洲五月色婷婷综合| 精品乱码久久久久久99久播| 女人被狂操c到高潮| 免费无遮挡裸体视频| 久久精品国产清高在天天线| 国产麻豆69| 99国产精品一区二区三区| 婷婷六月久久综合丁香| bbb黄色大片| 亚洲专区字幕在线| 久久精品aⅴ一区二区三区四区| 青草久久国产| 91精品国产国语对白视频| 久久人人精品亚洲av| 一个人观看的视频www高清免费观看 | 国产精品一区二区在线不卡| 婷婷精品国产亚洲av在线| 狠狠狠狠99中文字幕| 亚洲国产精品久久男人天堂| 欧美+亚洲+日韩+国产| 免费女性裸体啪啪无遮挡网站| 免费久久久久久久精品成人欧美视频| 日韩免费av在线播放| 久久久久久久午夜电影| 国内久久婷婷六月综合欲色啪| 不卡一级毛片| 亚洲一码二码三码区别大吗| 日日摸夜夜添夜夜添小说| 91成人精品电影| 1024视频免费在线观看| 亚洲国产欧美网| 男人舔女人下体高潮全视频| 欧美日韩一级在线毛片| 一边摸一边抽搐一进一出视频| 日韩欧美三级三区| 亚洲欧美激情综合另类| 变态另类成人亚洲欧美熟女 | 又黄又粗又硬又大视频| 亚洲熟妇中文字幕五十中出| e午夜精品久久久久久久| 国产伦一二天堂av在线观看| 亚洲午夜精品一区,二区,三区| 国产区一区二久久| 欧美大码av| 一级毛片女人18水好多| 欧美日韩瑟瑟在线播放| 涩涩av久久男人的天堂| 成人亚洲精品一区在线观看| 一级作爱视频免费观看| 黄色a级毛片大全视频| 一区二区三区激情视频| 免费av毛片视频| 夜夜爽天天搞| 亚洲avbb在线观看| 亚洲一区二区三区不卡视频| 97碰自拍视频| 日韩三级视频一区二区三区| 给我免费播放毛片高清在线观看| 日韩欧美在线二视频| 久久精品亚洲熟妇少妇任你| 国产一区二区三区综合在线观看| 久久草成人影院| 亚洲三区欧美一区| 性色av乱码一区二区三区2| 级片在线观看| 精品久久久久久,| 高清毛片免费观看视频网站| 搞女人的毛片| 女生性感内裤真人,穿戴方法视频| 中出人妻视频一区二区| 少妇粗大呻吟视频| 免费看十八禁软件| 91老司机精品| av电影中文网址| 中文字幕色久视频| 级片在线观看| 欧美国产精品va在线观看不卡| 日韩免费av在线播放| 中文字幕人妻丝袜一区二区| av网站免费在线观看视频| 亚洲人成伊人成综合网2020| 在线国产一区二区在线| 免费在线观看影片大全网站| 亚洲精品美女久久久久99蜜臀| a在线观看视频网站| 伦理电影免费视频| 亚洲欧美激情在线| 国产精品,欧美在线| 男人的好看免费观看在线视频 | av视频免费观看在线观看| 久久天躁狠狠躁夜夜2o2o| 最新美女视频免费是黄的| 一二三四在线观看免费中文在| 亚洲精品粉嫩美女一区| 亚洲精品国产色婷婷电影| 日本五十路高清| 桃红色精品国产亚洲av| 免费无遮挡裸体视频| 色综合站精品国产| 熟女少妇亚洲综合色aaa.| 国产精品综合久久久久久久免费 | 久久精品国产综合久久久| 少妇被粗大的猛进出69影院| 女人精品久久久久毛片| 精品电影一区二区在线| 久久性视频一级片| 午夜激情av网站| 成人国产综合亚洲| 午夜福利免费观看在线| 精品一区二区三区av网在线观看| 日本欧美视频一区| aaaaa片日本免费| 亚洲电影在线观看av| 日本a在线网址| 国产激情欧美一区二区| 欧美激情 高清一区二区三区| 国产精品亚洲av一区麻豆| 国产午夜福利久久久久久| 两个人视频免费观看高清| 国产精品野战在线观看| 99国产精品免费福利视频| 精品日产1卡2卡| 999久久久国产精品视频| 1024视频免费在线观看| 亚洲午夜精品一区,二区,三区| videosex国产| 久久青草综合色| 欧美黑人精品巨大| 精品日产1卡2卡| 此物有八面人人有两片| 这个男人来自地球电影免费观看| 亚洲va日本ⅴa欧美va伊人久久| 天堂√8在线中文| 欧美中文综合在线视频| 国产精品久久久av美女十八| 热99re8久久精品国产| 一区二区三区激情视频| 视频在线观看一区二区三区| 岛国在线观看网站| 男女之事视频高清在线观看| 亚洲午夜理论影院| 国产一区二区激情短视频| 中文字幕最新亚洲高清| 国产蜜桃级精品一区二区三区| 两人在一起打扑克的视频| 亚洲精品国产区一区二| 最近最新免费中文字幕在线| 手机成人av网站| 亚洲狠狠婷婷综合久久图片| 国产1区2区3区精品| 国产91精品成人一区二区三区| 中文字幕色久视频| 午夜福利18| 女警被强在线播放| 欧美一区二区精品小视频在线| www.www免费av| 欧美国产精品va在线观看不卡| 久久精品人人爽人人爽视色| 中文字幕av电影在线播放| 欧美老熟妇乱子伦牲交| 日本在线视频免费播放| 搡老岳熟女国产| 非洲黑人性xxxx精品又粗又长| 激情视频va一区二区三区| 一个人观看的视频www高清免费观看 | 涩涩av久久男人的天堂| 极品人妻少妇av视频| 每晚都被弄得嗷嗷叫到高潮| 男人操女人黄网站| 亚洲精品国产区一区二| 久久性视频一级片| 动漫黄色视频在线观看| 久久性视频一级片| 动漫黄色视频在线观看| 麻豆av在线久日| 欧美 亚洲 国产 日韩一| 久久久久久大精品| 久久久久久久久中文| 91精品三级在线观看| www.熟女人妻精品国产| 两个人免费观看高清视频| 久久久久国产一级毛片高清牌| 国产精品影院久久| 老司机午夜十八禁免费视频| 亚洲精品在线观看二区| 国产成人一区二区三区免费视频网站| 国产欧美日韩一区二区三区在线| 99香蕉大伊视频| 精品国产亚洲在线| 亚洲五月婷婷丁香| 精品国产亚洲在线| 成年人黄色毛片网站| 麻豆成人av在线观看| 大型av网站在线播放| 熟妇人妻久久中文字幕3abv| 极品教师在线免费播放| 亚洲一区二区三区不卡视频| 中文字幕另类日韩欧美亚洲嫩草| 午夜福利影视在线免费观看| av在线天堂中文字幕| 国产成人免费无遮挡视频| 国产精品一区二区三区四区久久 | 久久久久久久久中文| 欧美日本中文国产一区发布| 日日夜夜操网爽| 欧美黄色片欧美黄色片| 久久久久久久久免费视频了| 亚洲熟妇中文字幕五十中出| 亚洲 欧美一区二区三区| 亚洲第一青青草原| 久久国产精品人妻蜜桃| 免费av毛片视频| 日本三级黄在线观看| 免费少妇av软件| 在线av久久热| 欧美av亚洲av综合av国产av| 亚洲第一欧美日韩一区二区三区| 97人妻精品一区二区三区麻豆 | 日韩欧美国产在线观看| 免费在线观看完整版高清| 久久久久精品国产欧美久久久| 一区二区日韩欧美中文字幕| 国内久久婷婷六月综合欲色啪| av在线播放免费不卡| 老司机午夜福利在线观看视频| 日本五十路高清| 很黄的视频免费| 黑人巨大精品欧美一区二区蜜桃| 99久久精品国产亚洲精品| 久久人人97超碰香蕉20202| 69精品国产乱码久久久| 好男人电影高清在线观看| 亚洲人成电影免费在线| 伊人久久大香线蕉亚洲五| 操出白浆在线播放| 亚洲精品在线观看二区| 亚洲成国产人片在线观看| 久久久国产欧美日韩av| 亚洲免费av在线视频| 国产亚洲精品第一综合不卡| 成年女人毛片免费观看观看9| 午夜福利18| 久久久国产成人精品二区| 亚洲成人精品中文字幕电影| 首页视频小说图片口味搜索| 美女大奶头视频| 久久草成人影院| 97人妻精品一区二区三区麻豆 | 午夜免费鲁丝| 久久久久久国产a免费观看| 久久国产亚洲av麻豆专区| 成人免费观看视频高清| 美国免费a级毛片| 美女高潮到喷水免费观看| 国产精品永久免费网站| 男人舔女人的私密视频| 日本免费a在线| 精品国内亚洲2022精品成人| 99re在线观看精品视频| 18禁黄网站禁片午夜丰满| 女性被躁到高潮视频| 国产精品二区激情视频| www.精华液| 国产一区二区三区视频了| 欧美日韩乱码在线| 怎么达到女性高潮| 亚洲自拍偷在线| 久久午夜亚洲精品久久| 欧美日韩瑟瑟在线播放| 国产午夜精品久久久久久| 亚洲avbb在线观看| av天堂在线播放| 91国产中文字幕| 亚洲国产精品合色在线| 久久久久久久午夜电影| 91大片在线观看| 国产一区在线观看成人免费| 中文字幕人妻熟女乱码| 777久久人妻少妇嫩草av网站| 视频区欧美日本亚洲| 久久影院123| 久久国产精品男人的天堂亚洲| 久久香蕉激情| av电影中文网址| 精品久久久久久久毛片微露脸| 91九色精品人成在线观看| 俄罗斯特黄特色一大片| 激情在线观看视频在线高清| 亚洲精品久久国产高清桃花| 老司机靠b影院| 国产精品美女特级片免费视频播放器 | 精品国产乱码久久久久久男人| 精品国产国语对白av| 欧美黑人欧美精品刺激| 两人在一起打扑克的视频| 国产成人av教育| 日日摸夜夜添夜夜添小说| 日韩欧美一区二区三区在线观看| 国产国语露脸激情在线看| 亚洲精品一卡2卡三卡4卡5卡| 欧美日韩亚洲综合一区二区三区_| 国产在线精品亚洲第一网站| 在线观看一区二区三区| e午夜精品久久久久久久| 国产精品综合久久久久久久免费 | 中出人妻视频一区二区| 日韩欧美国产一区二区入口| 欧美乱妇无乱码| 欧美精品亚洲一区二区| 欧美激情高清一区二区三区| 久久久久久久久中文| АⅤ资源中文在线天堂| 亚洲天堂国产精品一区在线| 国产不卡一卡二| 首页视频小说图片口味搜索| 亚洲av成人不卡在线观看播放网| 午夜福利视频1000在线观看 | 久久九九热精品免费| 国产精品综合久久久久久久免费 | 老熟妇仑乱视频hdxx| 极品人妻少妇av视频| 啦啦啦免费观看视频1| 亚洲国产精品久久男人天堂| 亚洲av成人av| 亚洲一区二区三区不卡视频| 久久精品91无色码中文字幕| 久久久久久人人人人人| 欧美日本视频| 香蕉丝袜av| 免费在线观看视频国产中文字幕亚洲| 欧美成人一区二区免费高清观看 | 中出人妻视频一区二区| 18禁国产床啪视频网站| 亚洲中文日韩欧美视频| av视频在线观看入口| 久久香蕉精品热| 精品熟女少妇八av免费久了| 亚洲第一av免费看| 黑人欧美特级aaaaaa片| 亚洲av电影在线进入| 少妇熟女aⅴ在线视频| 亚洲精品久久国产高清桃花| 大型黄色视频在线免费观看| 成熟少妇高潮喷水视频| 亚洲熟妇中文字幕五十中出| 国产成+人综合+亚洲专区| 一级,二级,三级黄色视频| 亚洲三区欧美一区| 性少妇av在线| 国产精品久久久人人做人人爽| 免费在线观看日本一区| 91av网站免费观看| 中文亚洲av片在线观看爽| 免费在线观看黄色视频的| 亚洲国产精品999在线| 天堂影院成人在线观看| 成人免费观看视频高清| 免费无遮挡裸体视频| 男人操女人黄网站| 国产精品久久久av美女十八| xxx96com| 黄色视频,在线免费观看| av免费在线观看网站| 久久香蕉激情| 国产一区在线观看成人免费| 亚洲欧美日韩高清在线视频| 午夜亚洲福利在线播放| 亚洲精品在线美女| 在线av久久热| 在线免费观看的www视频| 9191精品国产免费久久| 中亚洲国语对白在线视频| 纯流量卡能插随身wifi吗| 大码成人一级视频| 91精品三级在线观看| 午夜福利影视在线免费观看| 午夜免费激情av| 韩国精品一区二区三区| 色尼玛亚洲综合影院| 国产三级黄色录像| 女性被躁到高潮视频| 亚洲色图 男人天堂 中文字幕| 亚洲伊人色综图| 成人18禁在线播放| 午夜福利免费观看在线| 变态另类成人亚洲欧美熟女 | 一区二区三区激情视频| 人人妻人人爽人人添夜夜欢视频| 色播亚洲综合网| 成年版毛片免费区| 色精品久久人妻99蜜桃| 一边摸一边做爽爽视频免费| 亚洲人成电影观看| 国产99白浆流出| 可以在线观看的亚洲视频| 亚洲 国产 在线| 性少妇av在线| 亚洲自拍偷在线| 97超级碰碰碰精品色视频在线观看| 黄色 视频免费看| 国产精品久久视频播放| www日本在线高清视频| 51午夜福利影视在线观看| 一本综合久久免费| 日韩欧美免费精品| 又黄又粗又硬又大视频| 一夜夜www| 欧美激情久久久久久爽电影 | 精品国内亚洲2022精品成人| 日韩三级视频一区二区三区| 一级毛片精品| 色综合站精品国产| 色综合婷婷激情| 久久中文字幕人妻熟女| 成人永久免费在线观看视频| 精品免费久久久久久久清纯| 天天一区二区日本电影三级 | 一边摸一边抽搐一进一出视频| 亚洲黑人精品在线| 777久久人妻少妇嫩草av网站| 国产精品久久视频播放| 亚洲成人免费电影在线观看| 男人操女人黄网站| 成人国产一区最新在线观看| 国产av一区在线观看免费| 视频区欧美日本亚洲| 一级黄色大片毛片| 夜夜夜夜夜久久久久| 人人妻人人爽人人添夜夜欢视频| 99国产精品一区二区三区| 国产熟女午夜一区二区三区| 在线观看一区二区三区| 亚洲中文日韩欧美视频| 高清毛片免费观看视频网站| 国产成人系列免费观看| 日日夜夜操网爽| 亚洲精华国产精华精| av中文乱码字幕在线| 黄片播放在线免费| 国产成人精品无人区| 久久人人97超碰香蕉20202| 久久久久精品国产欧美久久久| 叶爱在线成人免费视频播放| 身体一侧抽搐| www.精华液| 久久久精品欧美日韩精品| 日本黄色视频三级网站网址| 精品午夜福利视频在线观看一区| 国产黄a三级三级三级人| 国产精品1区2区在线观看.| 欧美色欧美亚洲另类二区 | 国产亚洲精品一区二区www| 桃红色精品国产亚洲av| 日本欧美视频一区| 91精品国产国语对白视频| 又大又爽又粗| 久久久国产欧美日韩av| 脱女人内裤的视频| av超薄肉色丝袜交足视频| 欧美日本亚洲视频在线播放| 50天的宝宝边吃奶边哭怎么回事| 色播亚洲综合网| av中文乱码字幕在线| 高潮久久久久久久久久久不卡| 黄频高清免费视频| 亚洲全国av大片| 午夜久久久久精精品| 亚洲av第一区精品v没综合| 亚洲专区中文字幕在线| 国产成人啪精品午夜网站| 国产精品二区激情视频| 国产片内射在线| 超碰成人久久| 色精品久久人妻99蜜桃| 九色亚洲精品在线播放| a在线观看视频网站| 999久久久国产精品视频| 免费在线观看日本一区| 成在线人永久免费视频| 又黄又爽又免费观看的视频| 18禁裸乳无遮挡免费网站照片 | 青草久久国产| 又紧又爽又黄一区二区| 99精品久久久久人妻精品| 免费看a级黄色片| 亚洲第一欧美日韩一区二区三区| 午夜福利一区二区在线看| 日韩大尺度精品在线看网址 | 久久国产亚洲av麻豆专区|