• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    移動機(jī)器人行人避讓策略強(qiáng)化學(xué)習(xí)研究

    2023-09-25 09:04:24王唯鑒呂宗喆吳宗毅
    關(guān)鍵詞:行人機(jī)器人狀態(tài)

    王唯鑒,王 勇,楊 驍,呂宗喆,吳宗毅

    1.北京機(jī)械工業(yè)自動化研究所,北京100120

    2.北自所(北京)科技發(fā)展股份有限公司,北京100120

    移動機(jī)器人近年來快速發(fā)展,其應(yīng)用場景也在不斷擴(kuò)展[1]。傳統(tǒng)移動機(jī)器人主要從事物料搬運(yùn)等簡單工作,由于工作場景相對固定,機(jī)器人移動過程中只需考慮對固定障礙的避讓。服務(wù)機(jī)器人近年來快速興起,其中具備自主移動能力的服務(wù)機(jī)器人需要適應(yīng)復(fù)雜多樣的工作場景,例如行人眾多的車站、餐廳等。這些人員密集的應(yīng)用場景對移動機(jī)器人對動態(tài)障礙的避讓能力提出了新的要求。移動機(jī)器人需要在時刻與行人保持安全距離的前提下,盡可能高效地到達(dá)目標(biāo)點(diǎn)?;跓o碰撞假設(shè)提出的動態(tài)避障方法,比如RVO或者ORCA[2],采用被動躲避的方式避讓動態(tài)障礙,由于相對固定的避讓方法只依賴于機(jī)器人當(dāng)前與障礙的交互,因此機(jī)器人難以做出長遠(yuǎn)的決策。另外,在面對多行人場景帶來的復(fù)雜限制時,這類算法無法給出有效動作,導(dǎo)致機(jī)器人面臨“凍結(jié)”問題。

    移動機(jī)器人如果能夠像人一樣分析判斷行人未來的行動,就可以據(jù)此做出更加符合人類行為邏輯的動作。依照這種想法,部分學(xué)者提出了通過預(yù)測行人軌跡指導(dǎo)移動機(jī)器人進(jìn)行避障的方法,包括一系列人工設(shè)計(jì)的模型[3]和數(shù)據(jù)驅(qū)動的模型[4-5]。前者由于準(zhǔn)確建模的難度過大,對行人動作的預(yù)測準(zhǔn)確度較低;后者(例如長短期記憶細(xì)胞模型,生成對抗網(wǎng)絡(luò)模型)高度依賴大量真實(shí)數(shù)據(jù)作為訓(xùn)練樣本。另外,這類在完成軌跡預(yù)測后再進(jìn)行移動策略規(guī)劃的方法在具體實(shí)施上也存在很多困難。

    強(qiáng)化學(xué)習(xí)適用于智能體在環(huán)境中連續(xù)或者離散動作的選擇,因此近年來被很多學(xué)者采用。深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning,DRL)關(guān)心智能體如何從環(huán)境中提取有助于決策的關(guān)鍵信息,在機(jī)器人對人群的避讓問題中,如何對復(fù)雜的行人數(shù)據(jù)進(jìn)行編碼,以有效捕捉數(shù)據(jù)的潛在特征(比如行人之間的避讓關(guān)系,行人與機(jī)器人間的關(guān)聯(lián))顯得尤為重要。CADRL 是早期利用強(qiáng)化學(xué)習(xí)解決這一問題的方法[6],但其只是通過簡單聚合行人之間的關(guān)聯(lián)特征來建模人群。LSTM-RL[7]采用長短期記憶細(xì)胞分析行人的行為規(guī)律以指導(dǎo)機(jī)器人移動,SARL[8]通過引入自注意力機(jī)制生成機(jī)器人-行人交互的特征向量,可以有效捕捉機(jī)器人與不同距離的行人之間的交互關(guān)系,但這些方法并沒有充分利用行人之間的交互信息,也只能單純地通過線性近似模擬行人的下一步動作,因此在多行人的場景下表現(xiàn)尚待提高。

    針對當(dāng)前研究中存在的不足,本文提出了GCN-RL模型,采用圖卷積網(wǎng)絡(luò)(GCN)對包含行人和機(jī)器人在內(nèi)的整個環(huán)境進(jìn)行特征提取。得益于GCN處理圖結(jié)構(gòu)數(shù)據(jù)的優(yōu)勢,該模型不僅可以準(zhǔn)確捕捉機(jī)器人與行人之間的潛在關(guān)聯(lián),同時也可以提取行人之間的關(guān)聯(lián)特征,模型中的動作價值估計(jì)模塊用于準(zhǔn)確估計(jì)當(dāng)前的動作-價值函數(shù),行人預(yù)測模塊配合前向推演策略幫助機(jī)器人通過與環(huán)境模擬交互更新對當(dāng)前狀態(tài)下不同動作價值的評估,能夠有效指導(dǎo)移動機(jī)器人的下一步動作,在密集行人場景中選擇更優(yōu)的避障路徑。

    1 問題建模

    假設(shè)移動機(jī)器人需要在存在N名行人的固定環(huán)境中完成導(dǎo)航任務(wù),其目標(biāo)是盡快到達(dá)地圖中的固定位置并在導(dǎo)航過程中避讓所有行人。該問題可以看作一個典型的順序決策問題[9],即可以通過深度強(qiáng)化學(xué)習(xí)框架進(jìn)行建模。具備環(huán)境感知能力的自主移動機(jī)器人作為強(qiáng)化學(xué)習(xí)智能體,在每個離散的時間節(jié)點(diǎn)選擇動作;環(huán)境信息包括機(jī)器人自身信息和周圍行人信息;機(jī)器人在離散的時刻讀取環(huán)境的狀態(tài)特征,并評估當(dāng)前狀態(tài)下自身的動作-狀態(tài)價值,從而選取最優(yōu)動作直至到達(dá)目標(biāo)點(diǎn)。

    1.1 狀態(tài)編碼

    在機(jī)器人導(dǎo)航問題中,環(huán)境信息包括場景中所有行人的信息以及機(jī)器人自身信息。由于實(shí)際場景下,行人的實(shí)時位置和實(shí)時速度可以通過固定攝像頭或者移動機(jī)器人搭載的攝像頭獲取,而機(jī)器人自身的狀態(tài)除去實(shí)時位置速度外,還有目標(biāo)點(diǎn)坐標(biāo)(gx,gy),以及當(dāng)前時刻機(jī)器人的首選速度(vpref,φ),包含速度大小和偏航角。因此,在任意時刻對于機(jī)器人自身以及每個行人的狀態(tài)序列建模如下:

    其中,px和py代表當(dāng)前世界坐標(biāo)系下行人和機(jī)器人的坐標(biāo),vx、vy代表世界坐標(biāo)系下的速度,r表示機(jī)器人和行人的碰撞半徑。

    1.2 動作選擇

    基于值函數(shù)估計(jì)的強(qiáng)化學(xué)習(xí)問題中,智能體通過與環(huán)境交互更新對自身所處狀態(tài)價值的估計(jì)和當(dāng)前行為策略。移動機(jī)器人與人群環(huán)境在每個離散的決策時刻通過執(zhí)行動作進(jìn)行交互,決策時刻的時間間隔設(shè)置為Δt=0.25 s。假設(shè)機(jī)器人在二維空間上的所有自由度均可控,由于強(qiáng)化學(xué)習(xí)范式的約束以及實(shí)際應(yīng)用的限制,機(jī)器人需要從離散的動作空間中選擇要執(zhí)行的動作。具體來說,機(jī)器人在每個決策時刻選擇自身移動速度及移動方向。設(shè)置了[0,2π]之間的16個方向和[0,Vmax]之間的五檔速度,組合成共包含80個動作的離散動作空間。

    1.3 獎勵計(jì)算

    機(jī)器人在虛擬環(huán)境中從起始位置出發(fā),行走至目標(biāo)點(diǎn)則獲得最高獎勵,為訓(xùn)練機(jī)器人在到達(dá)目標(biāo)點(diǎn)的過程中盡量避讓行人,設(shè)立獎勵函數(shù)如下:

    其中,引入了dt=0.2 m 作為行人舒適距離,以保證機(jī)器人在選擇路徑時既不會撞到行人,也不會因距離過近而引起行人不適。同時,引入舒適距離dt計(jì)算獎勵有效避免獎勵過于稀疏,從而提升訓(xùn)練效果。

    2 GCN-RL算法模型

    通過將行人避障問題劃歸為強(qiáng)化學(xué)習(xí)范式,可以采用值函數(shù)更新的方式指導(dǎo)機(jī)器人動態(tài)避障。GCN-RL模型利用圖卷積網(wǎng)絡(luò)高效提取機(jī)器人和行人的深度交互特征,隨后將這些特征用于估計(jì)狀態(tài)-動作價值。同時,模型針對環(huán)境中全部行人信息提取行人之間的深度交互特征,用于預(yù)測行人下一時刻狀態(tài)。模型在實(shí)時運(yùn)行過程中通過模擬執(zhí)行動作和預(yù)測行人狀態(tài)來與未來環(huán)境模擬交互,根據(jù)交互結(jié)果更新對當(dāng)前動作價值的估計(jì),并依據(jù)更新后動作價值的估計(jì)值從離散動作空間中選擇動作,指導(dǎo)機(jī)器人做出更加長遠(yuǎn)的避障決策,使其在導(dǎo)航至目標(biāo)點(diǎn)的過程中自主避讓環(huán)境中的行人。

    2.1 強(qiáng)化學(xué)習(xí)建模

    GCN-RL 模型的主要工作原理如圖1 所示,環(huán)境信息包括機(jī)器人的狀態(tài)以及全部行人的狀態(tài),為充分表征機(jī)器人和行人之間、行人與行人之間的關(guān)聯(lián)信息,環(huán)境信息作為圖結(jié)構(gòu)數(shù)據(jù)輸入GCN-RL模型,其中機(jī)器人和行人的潛特征作為圖的節(jié)點(diǎn),機(jī)器人與行人、行人與行人之間的潛在關(guān)聯(lián)信息則作為圖的邊。模型中的價值估計(jì)模塊接收來自全部節(jié)點(diǎn)的狀態(tài)編碼,并對當(dāng)前環(huán)境加以評估。同時,狀態(tài)預(yù)測模塊接收全部行人的狀態(tài)編碼,通過預(yù)測模型輸出對環(huán)境未來狀態(tài)的預(yù)估。隨后,GCN-RL采用了一種多步推演的方式與環(huán)境模擬交互,從而評估機(jī)器人在當(dāng)前狀態(tài)下采用不同動作會產(chǎn)生的預(yù)期收益,并根據(jù)預(yù)期收益指導(dǎo)機(jī)器人選擇要執(zhí)行的動作。在動作執(zhí)行完畢的下一個離散決策時刻,環(huán)境信息得以更新,機(jī)器人重新獲取環(huán)境信息,進(jìn)入下一個決策周期。

    圖1 GCN-RL工作原理Fig.1 Principle of GCN-RL

    2.2 動作價值估計(jì)

    強(qiáng)化學(xué)習(xí)中最重要的環(huán)節(jié)是如何通過環(huán)境的信息評估當(dāng)前智能體所處狀態(tài)的價值[10]。GCN-RL 模型采用了一個由圖卷積網(wǎng)絡(luò)和多層感知機(jī)組合而成的動作價值估計(jì)模塊,用于學(xué)習(xí)機(jī)器人和行人之間關(guān)聯(lián)狀態(tài)的深度交互信息,并以此估計(jì)當(dāng)前狀態(tài)下的動作價值。動作價值估計(jì)模塊的組成如圖2所示。

    圖2 動作價值估計(jì)模塊Fig.2 Value predict module

    圖卷積網(wǎng)絡(luò)能夠充分利用圖結(jié)構(gòu)信息[11],提取圖數(shù)據(jù)的深度特征,但需要各節(jié)點(diǎn)數(shù)據(jù)具備相同的結(jié)構(gòu)。在機(jī)器人行人避讓問題模型中,行人狀態(tài)與機(jī)器人狀態(tài)具有不同的維度,因此首先通過一個多層感知機(jī)(multilayer perceptron,MLP)將不同狀態(tài)編碼為潛空間中固定長度的向量,所有這些向量組成了矩陣X=[xr,xp1,xp2,…,xpn]T,其中xr為機(jī)器人的潛在特征,xp1,xp2,…,xpn為行人的潛在特征。通過成對近似函數(shù)計(jì)算該特征矩陣的關(guān)聯(lián)特征矩陣,模型采用嵌入式高斯函數(shù)作為近似函數(shù)[12],計(jì)算得到的A=softmax(XWaXT)矩陣記錄了節(jié)點(diǎn)之間的潛在關(guān)聯(lián)特征,其中xi=X[i,:],θ(xi)=Wθ xi,?(xi)=W?xi,Wa=WθWT?。

    以上方式分別提取了環(huán)境中每個節(jié)點(diǎn)的潛在特征以及任意兩個節(jié)點(diǎn)之間的直接關(guān)聯(lián)特征,然而對于在人群中導(dǎo)航的機(jī)器人而言,單純獲取每一時刻其他行人的特征和行人與自身、行人之間的關(guān)聯(lián)特征并不能充分指導(dǎo)自身動作。比如,在某一時刻距離機(jī)器人很近的行人A由于附近并沒有其他行人,因此會傾向于維持原速度繼續(xù)前進(jìn);而同一時刻距離機(jī)器人相對較遠(yuǎn)的行人B行進(jìn)前方有其他行人,因此可能會向機(jī)器人方向做出避讓動作。在這種情況下,簡單整合節(jié)點(diǎn)特征和關(guān)聯(lián)特征難以完成對環(huán)境當(dāng)前信息的充分提取。

    正因如此,GCN-RL采用圖卷積網(wǎng)絡(luò)處理節(jié)點(diǎn)特征和關(guān)聯(lián)特征,由于圖卷積網(wǎng)絡(luò)可以利用圖的連通結(jié)構(gòu)通過邊傳遞特征,并在節(jié)點(diǎn)聚合特征,經(jīng)由圖卷積網(wǎng)絡(luò)正向傳播后的節(jié)點(diǎn)特征包含了更多機(jī)器人與人群環(huán)境的深層特征(比如行人之間的躲避導(dǎo)致的潛在障礙),其中第i行的數(shù)據(jù)代表了節(jié)點(diǎn)i對其自身與整個環(huán)境交互所產(chǎn)生的深度關(guān)聯(lián)特征的編碼。節(jié)點(diǎn)信息按照H(l+1)=σ(AH(l)W(l))+H(l)進(jìn)行傳遞,其中W(l)代表了網(wǎng)絡(luò)第l層可訓(xùn)練的參數(shù),σ為激活函數(shù)Relu。GCN 通過節(jié)點(diǎn)原始特征X和節(jié)點(diǎn)關(guān)聯(lián)特征A完成節(jié)點(diǎn)特征的更新。本文采用了一個2 層的GCN 以保證每個節(jié)點(diǎn)能夠充分從圖的關(guān)聯(lián)中學(xué)習(xí)到環(huán)境中潛藏的深度交互特征,GCN輸出當(dāng)前包含這些特征的全部節(jié)點(diǎn)狀態(tài)Sextracted,輸入一個MLP以計(jì)算動作-狀態(tài)價值。

    2.3 行人狀態(tài)預(yù)測

    行人狀態(tài)預(yù)測模塊通過當(dāng)前時刻全部行人的行為狀態(tài)預(yù)測他們下一時刻的狀態(tài)。一些其他的機(jī)器人導(dǎo)航模型[6,8]使用傳統(tǒng)算法預(yù)測人群在下一時刻的動作狀態(tài)(比如對行人動作做線性近似其下一時刻位置),這種方法并沒有利用端到端的學(xué)習(xí)模型,無法準(zhǔn)確估計(jì)下一時刻行人的行為策略。另外一些關(guān)于行人軌跡預(yù)測的研究將行人軌跡看作序列數(shù)據(jù),采用長短期記憶細(xì)胞等方式對未來數(shù)據(jù)進(jìn)行預(yù)測[13],盡管從歷史數(shù)據(jù)中學(xué)習(xí)提升了對行人移動預(yù)測的準(zhǔn)確率,但在預(yù)測過程中忽略了行人之間的關(guān)聯(lián),且往往需要大量真實(shí)數(shù)據(jù)對模型進(jìn)行預(yù)訓(xùn)練。

    本研究采用的行人狀態(tài)預(yù)測模塊由兩個部分組成,第一部分用于提取當(dāng)前人機(jī)交互環(huán)境狀態(tài)特征,其具體組成方式與價值估計(jì)模塊中的狀態(tài)估計(jì)模塊類似:使用多層感知機(jī)對環(huán)境編碼得到各節(jié)點(diǎn)特征潛向量,之后利用近似函數(shù)計(jì)算關(guān)聯(lián)矩陣,再根據(jù)圖卷積網(wǎng)絡(luò)正向傳播,得到全部行人和機(jī)器人當(dāng)前深層交互狀態(tài)的特征表達(dá);模塊的第二部分通過另一個多層感知機(jī)接收行人當(dāng)前時刻深度交互特征并預(yù)測下一時刻行人狀態(tài)。即GCN-RL 并不會顯式地預(yù)測行人在下一時刻的行動軌跡,而是直接預(yù)測行人未來狀態(tài)。由于這些特征本身包含了行人與環(huán)境交互的深度信息,而本研究中,機(jī)器人正是通過環(huán)境的狀態(tài)特征計(jì)算狀態(tài)-動作價值,因此對行人狀態(tài)的預(yù)測能夠幫助機(jī)器人更準(zhǔn)確地評估當(dāng)前時刻執(zhí)行不同動作的收益。

    2.4 機(jī)器人動作選擇

    在具體的行人避讓過程中,機(jī)器人每隔0.25 s 就需要從80 個離散動作中做出選擇,解空間非常龐大。本研究借鑒了N步自舉法[14]和蒙特卡洛樹搜索[15]的思想,將學(xué)習(xí)到的深度價值估計(jì)模型與前向推演相結(jié)合,采用一種在當(dāng)前狀態(tài)模擬執(zhí)行最優(yōu)動作并與預(yù)測的環(huán)境狀態(tài)交互以取得回報(bào)的方式更新當(dāng)前狀態(tài)下不同動作的價值估計(jì),其推演流程如圖3所示。機(jī)器人根據(jù)推演結(jié)果更新當(dāng)前狀態(tài)下的動作價值,并以此為依據(jù)選擇動作。動作價值按照以下公式更新:

    圖3 K 步推演更新動作價值Fig.3 K-step rollout update action value

    實(shí)驗(yàn)中前向推演的步數(shù)為K,推演的廣度設(shè)置為W。當(dāng)K取1時,機(jī)器人只能根據(jù)當(dāng)前環(huán)境已知信息計(jì)算動作預(yù)期收益,不能利用到行人狀態(tài)預(yù)測模塊對未來狀態(tài)的預(yù)估。更大的K值則意味著機(jī)器人能夠在動作選擇時考慮的更加長遠(yuǎn)。機(jī)器人探索環(huán)境的過程中,獎勵非常稀疏,因此采用更大的K值也可以提高一次推演中到達(dá)目標(biāo)點(diǎn)的概率,從而提升模型的學(xué)習(xí)效果。然而,增加的K會大幅增加計(jì)算成本。因此設(shè)置W對推演的動作空間進(jìn)行剪枝,即每次前向推演僅考慮嘗試預(yù)期收益排名前W的動作。這種在線推演的方式兼顧了避障模型的性能與效率,可以在相對低的采樣次數(shù)中對任意狀態(tài)下的動作價值有較為準(zhǔn)確的估計(jì)。

    3 模型訓(xùn)練

    3.1 模型初始化

    機(jī)器人在移動過程中獲得的獎勵較為稀疏,因此從零開始訓(xùn)練會導(dǎo)致模型無法收斂。為加快模型收斂,采用模仿學(xué)習(xí)[16]對模型進(jìn)行初始化。在模仿學(xué)習(xí)過程中,機(jī)器人依照ORCA 避障算法實(shí)現(xiàn)CrowdNav 下的導(dǎo)航。經(jīng)過模仿學(xué)習(xí)對網(wǎng)絡(luò)參數(shù)的初始化,機(jī)器人初步具備了對障礙的避讓能力,可以在后續(xù)訓(xùn)練過程中側(cè)重于導(dǎo)航路徑的優(yōu)化,避免大量無意義的動作嘗試。

    3.2 訓(xùn)練流程

    算法1展示了模型的訓(xùn)練流程。

    算法1 模型訓(xùn)練流程

    輸入:模仿學(xué)習(xí)經(jīng)驗(yàn)池D

    輸出:訓(xùn)練后的價值估計(jì)模型Mv和動作預(yù)測模型Mp

    經(jīng)過模仿學(xué)習(xí)后,經(jīng)驗(yàn)池E中保存了一系列元組(St,at,rt,St+1),對于每一次從起點(diǎn)出發(fā)的訓(xùn)練,隨機(jī)初始化行人與機(jī)器人的狀態(tài),隨后,機(jī)器人采用ε-greedy策略選擇動作獲得收益,并將探索獲取的經(jīng)驗(yàn)存入經(jīng)驗(yàn)池。隨后采用經(jīng)驗(yàn)回放機(jī)制從E中隨機(jī)選取一批(St,at,rt,St+1)用于更新價值估計(jì)模塊以及狀態(tài)估計(jì)模塊的參數(shù)。一次完整訓(xùn)練流程模擬了機(jī)器人從起點(diǎn)到目標(biāo)點(diǎn)(產(chǎn)生碰撞或超時)的整個流程。通過利用經(jīng)驗(yàn)回放機(jī)制[17]訓(xùn)練模型,機(jī)器人記憶池中的數(shù)據(jù)被高效利用,同時避免了相鄰數(shù)據(jù)的強(qiáng)關(guān)聯(lián)性對訓(xùn)練效果的負(fù)面影響。在每次訓(xùn)練達(dá)到終點(diǎn)狀態(tài)后,價值估計(jì)模塊和狀態(tài)預(yù)測模塊同步更新。

    4 實(shí)驗(yàn)驗(yàn)證

    4.1 實(shí)驗(yàn)設(shè)置

    實(shí)驗(yàn)采用的場景基于開源框架CrowdNav 構(gòu)建,場景設(shè)置為circle-crossing,即環(huán)境中有五名行人隨機(jī)分布在半徑為4 m的圓上,他們的終點(diǎn)位置為起點(diǎn)在圓周上的對應(yīng)位置,所有行人按照ORCA 避障策略移動,機(jī)器人的最大速度設(shè)置為1 m/s。為保證行為策略的差異化,算法參數(shù)按照高斯分布采樣得到。機(jī)器人的起始位置和終點(diǎn)位置也在圓周上并關(guān)于圓心對稱。在沒有行人干擾的情況下,機(jī)器人需要花費(fèi)8 s 行駛到目標(biāo)點(diǎn)。仿真實(shí)驗(yàn)中,機(jī)器人被設(shè)置為對所有的行人而言不可見,即行人不會主動躲避機(jī)器人。這樣設(shè)置有助于充分體現(xiàn)機(jī)器人自主躲避行人的效果。用于編碼機(jī)器人和行人狀態(tài)的MLP維度為(64,32),用于價值估計(jì)的MLP維度為(150,100,100),用于行人狀態(tài)預(yù)測的MLP維度為(64,32),Wa的輸出維度設(shè)置為32。模型的所有參數(shù)通過強(qiáng)化學(xué)習(xí)流程進(jìn)行訓(xùn)練,并使用引入權(quán)重機(jī)制的AdamW[18]算法更新參數(shù),AdamW 的權(quán)重衰減率為0.1。在ε-greedy 策略中,探索率ε最初設(shè)置為0.5,在初始的5 000 次迭代訓(xùn)練后線性降低至0.1,并在后5 000 次迭代中保持在0.1。模仿學(xué)習(xí)次數(shù)設(shè)置為2 000,訓(xùn)練周期總數(shù)設(shè)置為10 000。使用Adam 以及AdamW 算法更新模型,在K步推演階段,K設(shè)置為2,W設(shè)置為2。實(shí)驗(yàn)平臺為搭載i7-11850H的手提電腦,訓(xùn)練時長約為16 h。

    4.2 模型訓(xùn)練結(jié)果

    模型在10 000 次訓(xùn)練過程中的累計(jì)折扣獎勵曲線如圖4 所示。Adam 作為當(dāng)前主流的優(yōu)化算法,在很多模型中廣泛應(yīng)用,然而面對過擬合問題時,Adam算法因其權(quán)重更新機(jī)制,不適合像隨機(jī)梯度下降方法一樣使用L2 正則化權(quán)重懲罰項(xiàng)進(jìn)行權(quán)重更新。AdamW 優(yōu)化算法在Adam 算法的基礎(chǔ)上設(shè)置了權(quán)重衰減方法[18],能有效避免模型過擬合。實(shí)驗(yàn)分別采用Adam和AdamW對GCN-RL 模型進(jìn)行訓(xùn)練,從圖4 的訓(xùn)練累計(jì)折扣獎勵中可以看出,使用Adam 訓(xùn)練的模型在6 000 個訓(xùn)練周期后達(dá)到最佳性能,但隨后模型的性能由于過擬合而出現(xiàn)了一定程度的下降。在使用AdamW 對模型進(jìn)行訓(xùn)練時,雖然權(quán)重衰減導(dǎo)致模型在前4 000 個訓(xùn)練周期的收斂的速度相對于使用Adam 算法較慢,但在6 000 個訓(xùn)練周期后AdamW 算法的訓(xùn)練效果已經(jīng)與Adam 相當(dāng),且在之后的訓(xùn)練過程中,AdamW 能夠幫助模型收斂到更優(yōu)性能,且并未遭遇因模型過擬合而導(dǎo)致的性能下降。因此選用AdamW算法以保證GCN-RL模型的訓(xùn)練效果。

    圖4 訓(xùn)練累計(jì)折扣獎勵Fig.4 Cumulative discounted reward

    4.3 模型性能對比

    不同避障方法在Crowd-Nav 仿真場景下的性能表現(xiàn)如表1 所示。由于GCN-RL 首先基于ORCA 進(jìn)行有監(jiān)督的預(yù)訓(xùn)練,因此引入ORCA用于模型性能對比。可以看出,盡管ORCA采用線性規(guī)劃計(jì)算機(jī)器人動作的方式使其運(yùn)行速度很快,但由于其不具備從環(huán)境中學(xué)習(xí)的能力,導(dǎo)航過程中的避障成功率和平均導(dǎo)航時間都不理想。SARL使用注意力機(jī)制提取環(huán)境特征,是當(dāng)前表現(xiàn)最佳的模型,然而注意力機(jī)制的應(yīng)用增加了模型的復(fù)雜程度,導(dǎo)致特征計(jì)算需要更大的開銷。而GCN-RL采用圖網(wǎng)絡(luò)進(jìn)行順序交互特征提取,計(jì)算方式相當(dāng)于矩陣乘法,所需的開銷更小,模型的運(yùn)行時間也明顯更少。為證明GCN-RL 模型中采用的狀態(tài)預(yù)測模塊為模型帶來的性能提升,設(shè)計(jì)了線性預(yù)測對比模型GCN-RL-Linear,其中行人下一時刻的狀態(tài)由線性擬合函數(shù)近似,即默認(rèn)行人在0.25 s的時間間隔后會延續(xù)上一時刻的動作。從表1 可以看出其性能低于GCN-RL,這說明通過狀態(tài)預(yù)估模塊的使用讓機(jī)器人能更準(zhǔn)確地預(yù)測行人狀態(tài),從而幫助機(jī)器人更好地在導(dǎo)航過程中實(shí)現(xiàn)對行人的避讓。

    表1 不同避障策略性能比較Table 1 Comparison of different strategy

    4.4 K 步推演對模型性能的影響

    為驗(yàn)證GCN-RL 模型中采用的動作選擇策略對模型性能的提升作用,設(shè)計(jì)了多組對比實(shí)驗(yàn)以測試不同推演深度K和不同剪枝數(shù)W的模型在500個不同場景下的實(shí)際運(yùn)行表現(xiàn),測試結(jié)果如表2 所示。從中可以看出,更多的前向推演步數(shù)縮短了機(jī)器人的導(dǎo)航時間,同時降低了機(jī)器人與行人距離過近的概率。然而,當(dāng)K=3時,繼續(xù)增加的前向推演步數(shù)對于模型性能的提升相對有限。同時,增加預(yù)剪枝的寬度也對模型性能有提升,但會伴隨著顯著增加的算法運(yùn)行時間,因此模型采用W=2 以平衡性能和運(yùn)行成本。值得注意的是,任何一組參數(shù)下的實(shí)驗(yàn)其導(dǎo)航成功率都未達(dá)到100%,這是因?yàn)闄C(jī)器人被設(shè)置為對行人不可見,部分極端場景下行人會“包圍”機(jī)器人,導(dǎo)致無法躲避的碰撞。另外,K和W的增加都會增加導(dǎo)致機(jī)器人導(dǎo)航過程中的計(jì)算負(fù)荷,在真實(shí)場景中需要根據(jù)硬件性能限制設(shè)置能平衡模型性能和計(jì)算開銷的推演參數(shù)。

    表2 不同參數(shù)下模型性能Table 2 Model performance with different parameters

    如圖5 中所示,在環(huán)境相同,行人移動軌跡一致的情況下,不同的推演參數(shù)使機(jī)器人選擇了不同的導(dǎo)航路徑。從圖5中可以看出,t=4 s 時行人位置較為集中,當(dāng)K=1 時,機(jī)器人短視地向右轉(zhuǎn)向以躲避路徑上的紅色行人,從而選擇了從行人密集處穿行的路線,導(dǎo)航時間為10.5 s。當(dāng)K=2 時,機(jī)器人初步具備了預(yù)估行人動作的能力,做出了從紅色行人身后繞行的嘗試。然而由于其只進(jìn)行了單步前向推演,對行人未來動作的預(yù)測不夠準(zhǔn)確,最后還是選擇了從行人密集處穿過,導(dǎo)航時間也因此增加了0.3 s。而當(dāng)K=3 時,機(jī)器人通過前向推演有效預(yù)測了行人的未來動作,選擇了從紅色行人身后繞行的路線,有效規(guī)避了行走路徑上的人群密集區(qū)域。雖然選擇的路徑相對遠(yuǎn),但由于做出的避讓動作更少,機(jī)器人只用了10.2 s即到達(dá)目標(biāo)。實(shí)驗(yàn)結(jié)果表明前向推演策略幫助機(jī)器人選擇了更優(yōu)的行駛路徑,導(dǎo)航時間更短,對行人的避讓效果更好。

    5 結(jié)束語

    本文提出了一種利用圖卷積網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)避障方法GCN-RL,用于解決仿真環(huán)境中機(jī)器人對行人的避讓問題。GCN-RL 模型相較于傳統(tǒng)避障模型有更好的表現(xiàn),基本達(dá)到了當(dāng)前同一問題下最優(yōu)模型的性能,同時運(yùn)行時間更短。模型采用GCN架構(gòu)提取環(huán)境的深層關(guān)聯(lián)特征,并利用提取到的特征同時對動作價值和行人狀態(tài)進(jìn)行估計(jì)以指導(dǎo)避障,從而使得算法的復(fù)雜度降低,運(yùn)行時間更短。在模型的訓(xùn)練階段,實(shí)驗(yàn)應(yīng)用了AdamW 算法使得價值估計(jì)模塊能夠收斂到更好的性能。另外,模型通過采用K步推演實(shí)現(xiàn)了對動作價值的更精準(zhǔn)評估。通過實(shí)驗(yàn)分析了不同參數(shù)下的模型表現(xiàn),體現(xiàn)了該方法對機(jī)器人行人避讓性能的提升。

    猜你喜歡
    行人機(jī)器人狀態(tài)
    毒舌出沒,行人避讓
    意林(2021年5期)2021-04-18 12:21:17
    狀態(tài)聯(lián)想
    路不為尋找者而設(shè)
    生命的另一種狀態(tài)
    我是行人
    熱圖
    家庭百事通(2016年3期)2016-03-14 08:07:17
    堅(jiān)持是成功前的狀態(tài)
    山東青年(2016年3期)2016-02-28 14:25:52
    機(jī)器人來幫你
    認(rèn)識機(jī)器人
    機(jī)器人來啦
    18禁国产床啪视频网站| 国产99久久九九免费精品| 亚洲精品国产精品久久久不卡| 成人av一区二区三区在线看| 夜夜骑夜夜射夜夜干| 午夜免费鲁丝| 亚洲avbb在线观看| 欧美乱妇无乱码| 国产在线视频一区二区| 国产在线一区二区三区精| 国产精品久久久久成人av| 亚洲综合色网址| 99riav亚洲国产免费| 国产精品一区二区在线观看99| 精品国产一区二区三区四区第35| 手机成人av网站| 精品国产乱子伦一区二区三区| 精品一区二区三区四区五区乱码| 51午夜福利影视在线观看| 他把我摸到了高潮在线观看 | a级毛片黄视频| 午夜久久久在线观看| 男人操女人黄网站| 国产精品九九99| 久久精品aⅴ一区二区三区四区| 一区二区三区激情视频| 久久婷婷成人综合色麻豆| 最新美女视频免费是黄的| 国产成人av教育| 久久精品91无色码中文字幕| 久久国产精品大桥未久av| 亚洲人成77777在线视频| 日韩 欧美 亚洲 中文字幕| 蜜桃国产av成人99| av不卡在线播放| 国产日韩一区二区三区精品不卡| 久久久久久亚洲精品国产蜜桃av| 男女下面插进去视频免费观看| 深夜精品福利| 国产欧美日韩一区二区三| 国产在线观看jvid| 国产成人欧美| 大片免费播放器 马上看| 法律面前人人平等表现在哪些方面| 国产一区二区在线观看av| 国产av又大| 亚洲人成电影观看| 免费人妻精品一区二区三区视频| 交换朋友夫妻互换小说| 午夜福利在线免费观看网站| 久久久久精品人妻al黑| 美女高潮喷水抽搐中文字幕| 久久精品熟女亚洲av麻豆精品| 精品人妻1区二区| 日本五十路高清| 大型黄色视频在线免费观看| 国产亚洲一区二区精品| 亚洲午夜精品一区,二区,三区| 欧美激情久久久久久爽电影 | 99香蕉大伊视频| 99国产精品免费福利视频| 在线观看一区二区三区激情| 国产成人欧美| 999精品在线视频| 国产精品98久久久久久宅男小说| 欧美人与性动交α欧美软件| 中文字幕高清在线视频| 国产一区二区 视频在线| 熟女少妇亚洲综合色aaa.| 人人妻人人澡人人看| 亚洲精品自拍成人| 亚洲av电影在线进入| 久久久久精品人妻al黑| 另类亚洲欧美激情| tube8黄色片| 丝瓜视频免费看黄片| 女人被躁到高潮嗷嗷叫费观| 欧美精品啪啪一区二区三区| 色综合婷婷激情| 两个人看的免费小视频| 人妻久久中文字幕网| 黄色片一级片一级黄色片| 欧美日韩福利视频一区二区| 国产成人影院久久av| 黄频高清免费视频| 国产精品九九99| 欧美老熟妇乱子伦牲交| 免费黄频网站在线观看国产| 精品人妻1区二区| 欧美亚洲日本最大视频资源| 丰满饥渴人妻一区二区三| 777久久人妻少妇嫩草av网站| 中文字幕高清在线视频| 黄色怎么调成土黄色| 在线播放国产精品三级| 国产精品久久电影中文字幕 | 丁香六月天网| 亚洲全国av大片| 人人妻,人人澡人人爽秒播| 大型黄色视频在线免费观看| 精品国产超薄肉色丝袜足j| 欧美精品啪啪一区二区三区| 亚洲欧美一区二区三区久久| 中文字幕av电影在线播放| 亚洲国产中文字幕在线视频| 久久九九热精品免费| 亚洲精品自拍成人| 最近最新免费中文字幕在线| 最近最新免费中文字幕在线| 母亲3免费完整高清在线观看| 女性生殖器流出的白浆| 女人爽到高潮嗷嗷叫在线视频| 夜夜夜夜夜久久久久| 黄色视频不卡| 51午夜福利影视在线观看| 老熟女久久久| 午夜精品国产一区二区电影| 久久久国产欧美日韩av| 18禁国产床啪视频网站| 日本欧美视频一区| 日韩视频在线欧美| 成年动漫av网址| 精品一区二区三卡| 久久精品aⅴ一区二区三区四区| 国产精品免费一区二区三区在线 | 久久婷婷成人综合色麻豆| 婷婷成人精品国产| 亚洲全国av大片| 免费少妇av软件| 久久av网站| 在线看a的网站| 国产一区二区三区在线臀色熟女 | 欧美乱妇无乱码| 99香蕉大伊视频| 十分钟在线观看高清视频www| www.熟女人妻精品国产| 亚洲精品久久午夜乱码| 亚洲 欧美一区二区三区| 99九九在线精品视频| 黄色视频在线播放观看不卡| 婷婷成人精品国产| 国产精品麻豆人妻色哟哟久久| 丁香欧美五月| 久久中文看片网| videosex国产| 91成年电影在线观看| 久久久久久久精品吃奶| 免费看十八禁软件| 别揉我奶头~嗯~啊~动态视频| 亚洲成a人片在线一区二区| 黑人猛操日本美女一级片| 亚洲 欧美一区二区三区| 久久精品亚洲精品国产色婷小说| 手机成人av网站| 在线亚洲精品国产二区图片欧美| 99国产极品粉嫩在线观看| 久久狼人影院| 亚洲精品粉嫩美女一区| 欧美精品人与动牲交sv欧美| 69精品国产乱码久久久| 国产麻豆69| 高清av免费在线| 9色porny在线观看| 啦啦啦在线免费观看视频4| 国产在视频线精品| 日韩中文字幕欧美一区二区| 精品人妻1区二区| 亚洲精品久久成人aⅴ小说| 啦啦啦 在线观看视频| 欧美激情高清一区二区三区| 男女下面插进去视频免费观看| 最黄视频免费看| 成人三级做爰电影| 久久午夜综合久久蜜桃| 一区二区三区国产精品乱码| a级毛片黄视频| 欧美日韩黄片免| 国产在线观看jvid| 19禁男女啪啪无遮挡网站| 久久人妻熟女aⅴ| 又大又爽又粗| 人人妻人人澡人人看| 多毛熟女@视频| 少妇猛男粗大的猛烈进出视频| 两性午夜刺激爽爽歪歪视频在线观看 | 久久狼人影院| 国产在线视频一区二区| 香蕉丝袜av| 别揉我奶头~嗯~啊~动态视频| 亚洲第一欧美日韩一区二区三区 | 99久久99久久久精品蜜桃| 欧美精品亚洲一区二区| av线在线观看网站| 日韩视频在线欧美| 久久久水蜜桃国产精品网| 又大又爽又粗| 老司机午夜十八禁免费视频| 国产精品欧美亚洲77777| 国产成人啪精品午夜网站| 久久久久久久久免费视频了| 午夜日韩欧美国产| 黑人巨大精品欧美一区二区mp4| 丝瓜视频免费看黄片| 国产不卡av网站在线观看| av网站免费在线观看视频| 日韩人妻精品一区2区三区| 日本一区二区免费在线视频| 国产成人免费观看mmmm| 黑人猛操日本美女一级片| 色播在线永久视频| 妹子高潮喷水视频| 美女午夜性视频免费| 啦啦啦 在线观看视频| a级毛片在线看网站| 国产精品亚洲av一区麻豆| 国产99久久九九免费精品| 一本大道久久a久久精品| 国产亚洲一区二区精品| 天天躁狠狠躁夜夜躁狠狠躁| 人人妻人人澡人人爽人人夜夜| 久久精品91无色码中文字幕| 成人国语在线视频| 9色porny在线观看| 97人妻天天添夜夜摸| 久久久国产欧美日韩av| 岛国毛片在线播放| 久久久久久久精品吃奶| 热99re8久久精品国产| 国产精品 欧美亚洲| 午夜91福利影院| 亚洲精品国产区一区二| 一区福利在线观看| 叶爱在线成人免费视频播放| 精品熟女少妇八av免费久了| 亚洲精品国产一区二区精华液| 女人爽到高潮嗷嗷叫在线视频| 欧美日韩黄片免| 国产91精品成人一区二区三区 | 中文字幕高清在线视频| 亚洲三区欧美一区| 免费少妇av软件| 午夜福利在线免费观看网站| 中文字幕人妻熟女乱码| 久久久久久久久免费视频了| 少妇 在线观看| tube8黄色片| 露出奶头的视频| 麻豆国产av国片精品| 久久热在线av| 9热在线视频观看99| 波多野结衣av一区二区av| 国产在线免费精品| 久久久国产成人免费| 色视频在线一区二区三区| 日韩一区二区三区影片| 精品人妻在线不人妻| 一个人免费在线观看的高清视频| 久久免费观看电影| 熟女少妇亚洲综合色aaa.| 欧美精品啪啪一区二区三区| 国产精品麻豆人妻色哟哟久久| 大陆偷拍与自拍| 无人区码免费观看不卡 | 亚洲第一青青草原| 久久天躁狠狠躁夜夜2o2o| 色尼玛亚洲综合影院| 热99国产精品久久久久久7| 亚洲专区中文字幕在线| 99在线人妻在线中文字幕 | 一区二区三区精品91| 高清在线国产一区| 亚洲精品一卡2卡三卡4卡5卡| 亚洲精品久久成人aⅴ小说| 纵有疾风起免费观看全集完整版| 色婷婷av一区二区三区视频| 欧美乱码精品一区二区三区| 免费看a级黄色片| 在线天堂中文资源库| 欧美日韩成人在线一区二区| 18禁裸乳无遮挡动漫免费视频| 真人做人爱边吃奶动态| 老汉色∧v一级毛片| 99国产精品免费福利视频| 欧美亚洲 丝袜 人妻 在线| 多毛熟女@视频| 97人妻天天添夜夜摸| av欧美777| 男女之事视频高清在线观看| 日本vs欧美在线观看视频| 国精品久久久久久国模美| 久久久久久免费高清国产稀缺| 国产91精品成人一区二区三区 | 激情在线观看视频在线高清 | 亚洲国产欧美日韩在线播放| 国产精品二区激情视频| 丝袜人妻中文字幕| 国产高清videossex| 黄色视频在线播放观看不卡| h视频一区二区三区| 肉色欧美久久久久久久蜜桃| 99久久精品国产亚洲精品| 亚洲av片天天在线观看| av线在线观看网站| 中文字幕人妻丝袜制服| 国产单亲对白刺激| 一边摸一边抽搐一进一出视频| 亚洲精品久久成人aⅴ小说| 人成视频在线观看免费观看| 亚洲欧洲精品一区二区精品久久久| 亚洲熟女毛片儿| 他把我摸到了高潮在线观看 | 国产精品免费视频内射| 18禁国产床啪视频网站| 亚洲人成电影观看| 黄色丝袜av网址大全| 亚洲午夜精品一区,二区,三区| 国产免费av片在线观看野外av| 亚洲国产毛片av蜜桃av| 男女之事视频高清在线观看| 亚洲国产中文字幕在线视频| 一级黄色大片毛片| av在线播放免费不卡| 啪啪无遮挡十八禁网站| 一级毛片电影观看| 日韩中文字幕欧美一区二区| 午夜福利在线免费观看网站| 中文欧美无线码| 亚洲精品久久午夜乱码| 动漫黄色视频在线观看| 99re6热这里在线精品视频| 久9热在线精品视频| 最新美女视频免费是黄的| 麻豆乱淫一区二区| 日韩三级视频一区二区三区| 午夜老司机福利片| 欧美 亚洲 国产 日韩一| 在线观看一区二区三区激情| cao死你这个sao货| 中文字幕最新亚洲高清| 999精品在线视频| 成年人免费黄色播放视频| 中文字幕人妻熟女乱码| 国产在视频线精品| 国产xxxxx性猛交| 久久久久久久久久久久大奶| √禁漫天堂资源中文www| 久久婷婷成人综合色麻豆| 午夜福利在线免费观看网站| 日韩中文字幕视频在线看片| 少妇 在线观看| 十八禁网站免费在线| 别揉我奶头~嗯~啊~动态视频| 美国免费a级毛片| 在线观看免费视频网站a站| 一边摸一边抽搐一进一小说 | 久久久国产一区二区| 亚洲欧美精品综合一区二区三区| 久久精品熟女亚洲av麻豆精品| 免费人妻精品一区二区三区视频| 人人妻人人添人人爽欧美一区卜| 不卡一级毛片| 亚洲av电影在线进入| aaaaa片日本免费| 成年人午夜在线观看视频| 国产一卡二卡三卡精品| 大香蕉久久成人网| 日本av手机在线免费观看| 色老头精品视频在线观看| 国产精品国产av在线观看| 丝袜美腿诱惑在线| 久久久精品国产亚洲av高清涩受| 精品国产国语对白av| 精品一品国产午夜福利视频| 最新的欧美精品一区二区| 国产成人免费无遮挡视频| 日韩成人在线观看一区二区三区| 欧美在线一区亚洲| 人人澡人人妻人| 18禁观看日本| 亚洲国产精品一区二区三区在线| 欧美大码av| 亚洲全国av大片| 亚洲av欧美aⅴ国产| 青青草视频在线视频观看| tube8黄色片| 18在线观看网站| 精品少妇久久久久久888优播| 午夜免费成人在线视频| av网站免费在线观看视频| 日本av手机在线免费观看| 丁香欧美五月| 亚洲色图 男人天堂 中文字幕| 色播在线永久视频| 久久亚洲精品不卡| 最黄视频免费看| 老司机亚洲免费影院| 一二三四社区在线视频社区8| 亚洲精品乱久久久久久| 国产一区二区三区视频了| 久久人妻熟女aⅴ| 91老司机精品| 日本五十路高清| 超色免费av| av电影中文网址| 亚洲av美国av| 久久久久视频综合| 999久久久精品免费观看国产| 免费观看人在逋| 久久久久久久久免费视频了| 免费看a级黄色片| 欧美乱妇无乱码| 岛国在线观看网站| 欧美黑人欧美精品刺激| 狂野欧美激情性xxxx| 妹子高潮喷水视频| 免费观看av网站的网址| 黄色a级毛片大全视频| 国产又色又爽无遮挡免费看| 亚洲天堂av无毛| 亚洲色图av天堂| 亚洲成av片中文字幕在线观看| 亚洲免费av在线视频| 老司机靠b影院| 母亲3免费完整高清在线观看| 大片免费播放器 马上看| 欧美午夜高清在线| 狂野欧美激情性xxxx| 国产成人欧美| 国产精品 国内视频| 亚洲av成人一区二区三| 1024香蕉在线观看| 久久久久视频综合| 欧美亚洲日本最大视频资源| 久久精品国产亚洲av高清一级| 50天的宝宝边吃奶边哭怎么回事| h视频一区二区三区| aaaaa片日本免费| 国产无遮挡羞羞视频在线观看| 日本a在线网址| 亚洲成人手机| 美女高潮喷水抽搐中文字幕| 欧美日韩亚洲国产一区二区在线观看 | 日韩熟女老妇一区二区性免费视频| 欧美精品av麻豆av| 国产日韩欧美在线精品| 女警被强在线播放| 激情视频va一区二区三区| 在线看a的网站| 亚洲午夜理论影院| 欧美黄色片欧美黄色片| 2018国产大陆天天弄谢| 国产精品影院久久| tocl精华| 黄色成人免费大全| 亚洲国产精品一区二区三区在线| 热re99久久国产66热| 欧美黄色片欧美黄色片| 90打野战视频偷拍视频| 中文欧美无线码| 五月天丁香电影| 俄罗斯特黄特色一大片| 黄色毛片三级朝国网站| 久久精品aⅴ一区二区三区四区| av福利片在线| 中文亚洲av片在线观看爽 | 夜夜爽天天搞| 国产亚洲精品一区二区www | 成在线人永久免费视频| 国产精品 欧美亚洲| 亚洲欧美色中文字幕在线| 久久这里只有精品19| 老汉色∧v一级毛片| 亚洲av国产av综合av卡| 两性午夜刺激爽爽歪歪视频在线观看 | 免费高清在线观看日韩| 91老司机精品| 国产高清激情床上av| 女人精品久久久久毛片| 少妇粗大呻吟视频| 亚洲精华国产精华精| 王馨瑶露胸无遮挡在线观看| 亚洲精品美女久久久久99蜜臀| 美女扒开内裤让男人捅视频| 国产亚洲精品第一综合不卡| 国产极品粉嫩免费观看在线| 国产精品久久久久久精品古装| 亚洲av国产av综合av卡| 成年版毛片免费区| 男女免费视频国产| 国产成+人综合+亚洲专区| 91成年电影在线观看| 精品国内亚洲2022精品成人 | 国产日韩欧美视频二区| 久久久久久久精品吃奶| 国产亚洲精品一区二区www | 久久精品国产亚洲av高清一级| 在线观看舔阴道视频| 午夜福利在线免费观看网站| 丁香六月欧美| 亚洲精品美女久久av网站| 亚洲欧美日韩高清在线视频 | 久久热在线av| 久久久欧美国产精品| 亚洲国产中文字幕在线视频| 在线观看一区二区三区激情| 久久久久久亚洲精品国产蜜桃av| 少妇粗大呻吟视频| 国产熟女午夜一区二区三区| 亚洲精品中文字幕在线视频| 国产色视频综合| 丰满饥渴人妻一区二区三| 最新的欧美精品一区二区| 亚洲专区国产一区二区| 夜夜爽天天搞| 水蜜桃什么品种好| 人成视频在线观看免费观看| 久久精品亚洲熟妇少妇任你| 国产有黄有色有爽视频| 真人做人爱边吃奶动态| 国产精品.久久久| 国产1区2区3区精品| 国产三级黄色录像| 国产1区2区3区精品| 亚洲中文av在线| 久久 成人 亚洲| 亚洲熟妇熟女久久| 中文字幕av电影在线播放| 亚洲精品美女久久av网站| 亚洲欧美日韩高清在线视频 | 老司机福利观看| 欧美 日韩 精品 国产| 男女边摸边吃奶| 热re99久久国产66热| 国产日韩欧美亚洲二区| 国产福利在线免费观看视频| 欧美日韩亚洲国产一区二区在线观看 | 又黄又粗又硬又大视频| 一区福利在线观看| 大码成人一级视频| 免费少妇av软件| 首页视频小说图片口味搜索| 亚洲国产欧美日韩在线播放| 大香蕉久久成人网| 亚洲精品成人av观看孕妇| 视频在线观看一区二区三区| 一边摸一边做爽爽视频免费| 亚洲人成电影观看| 一区二区三区激情视频| 欧美乱妇无乱码| 免费在线观看影片大全网站| 后天国语完整版免费观看| 久久久精品区二区三区| 国产精品成人在线| 精品国产超薄肉色丝袜足j| 欧美成狂野欧美在线观看| 精品国产亚洲在线| 中文欧美无线码| 悠悠久久av| 久久午夜亚洲精品久久| 天堂俺去俺来也www色官网| 在线观看免费日韩欧美大片| 国产成人欧美| 无人区码免费观看不卡 | tocl精华| 国产高清视频在线播放一区| bbb黄色大片| 国产日韩欧美亚洲二区| e午夜精品久久久久久久| 精品人妻1区二区| 一本色道久久久久久精品综合| 巨乳人妻的诱惑在线观看| 欧美成人免费av一区二区三区 | 一边摸一边抽搐一进一出视频| 大型av网站在线播放| 免费在线观看视频国产中文字幕亚洲| 少妇裸体淫交视频免费看高清 | 亚洲va日本ⅴa欧美va伊人久久| 日韩视频一区二区在线观看| 9191精品国产免费久久| 黑丝袜美女国产一区| 超碰成人久久| 夜夜爽天天搞| 久热爱精品视频在线9| 一区二区三区精品91| 老汉色∧v一级毛片| 波多野结衣一区麻豆| 少妇粗大呻吟视频| 日本vs欧美在线观看视频| 国产精品麻豆人妻色哟哟久久| 亚洲综合色网址| 考比视频在线观看| 久久热在线av| 欧美激情极品国产一区二区三区| 色播在线永久视频| 国产伦人伦偷精品视频| 亚洲一区中文字幕在线| 丝袜人妻中文字幕| 999精品在线视频| 国产国语露脸激情在线看| 亚洲美女黄片视频| 亚洲精品国产一区二区精华液| 18禁国产床啪视频网站| 一级毛片精品| 久久中文字幕一级| 午夜激情av网站| 国产黄频视频在线观看| 亚洲全国av大片| 日韩大片免费观看网站| 一区福利在线观看| 精品第一国产精品| 成人免费观看视频高清| 一本综合久久免费| cao死你这个sao货| 国产无遮挡羞羞视频在线观看| 国产一区二区激情短视频|