• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    結(jié)合APF和改進(jìn)DDQN的動(dòng)態(tài)環(huán)境機(jī)器人路徑規(guī)劃方法

    2023-09-06 04:29:56孫傳禹
    關(guān)鍵詞:勢場勢能移動(dòng)機(jī)器人

    孫傳禹,張 雷,辛 山,劉 悅

    (北京建筑大學(xué) 電氣與信息工程學(xué)院,北京 100044)

    1 引 言

    目前機(jī)器人開始被廣泛應(yīng)用于醫(yī)療、救援、軍事、太空等領(lǐng)域.在這些領(lǐng)域中,機(jī)器人所處的工作環(huán)境是復(fù)雜、動(dòng)態(tài)和非結(jié)構(gòu)化的場景.現(xiàn)有經(jīng)典全局路徑規(guī)劃算法如人工勢場法、快速探索隨機(jī)樹法等,需要已知環(huán)境的先驗(yàn)信息.并存在計(jì)算量大、通用性差及無法適應(yīng)動(dòng)態(tài)應(yīng)用場景等難題.基于反應(yīng)式的局部導(dǎo)航方法,如神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)算法等,則不需要已知環(huán)境的先驗(yàn)信息,可以自主學(xué)習(xí)提升規(guī)劃策略,與經(jīng)典算法相比具有優(yōu)越性[1],可以應(yīng)用于復(fù)雜的、動(dòng)態(tài)的、地圖殘缺的場景中,但存在缺乏隨機(jī)探索能力,學(xué)習(xí)效率較低,收斂速度較慢等問題.

    為了改善上述方法,人們采用先由全局規(guī)劃算法獲取初始環(huán)境信息,再由局部路徑規(guī)劃算法實(shí)時(shí)獲取復(fù)雜場景的障礙物信息的方法,以增強(qiáng)算法的穩(wěn)定性.Van Hasselt等人[2]提出一種深度雙重Q網(wǎng)絡(luò)的算法以解決DQN算法存在的過估計(jì)問題.董永峰等人[3]提出動(dòng)態(tài)目標(biāo)雙深Q網(wǎng)絡(luò)算法,將DDQN與平均DQN結(jié)合,緩解DDQN在路徑規(guī)劃中價(jià)值低估的問題.Oscar等人[4]提出改進(jìn)人工勢場法并應(yīng)用于動(dòng)態(tài)環(huán)境下的有源濾波器避障分析.U Orozco等人[5]將Bacterial-Potential field技術(shù)引入人工勢場法,提高了人工勢場法路徑規(guī)劃器的性能.但基于人工勢場的改進(jìn)算法在實(shí)時(shí)環(huán)境中移動(dòng)避障依然存在性能相對較差和較容易陷入局部最優(yōu)陷阱的問題.深度強(qiáng)化學(xué)習(xí)算法(Deep Reinforcement Learning,DRL)的提出使得強(qiáng)化學(xué)習(xí)技術(shù)在現(xiàn)實(shí)場景中的復(fù)雜問題中具有良好的性能和魯棒性[6].Oualid等人[7]提出一種DRL改進(jìn)算法,使配備激光測距儀的微型飛行器系統(tǒng)能夠在沒有GPS的環(huán)境中自主導(dǎo)航,緩解了DRL路徑規(guī)劃算法計(jì)算消耗大的問題.Huang R等人[8]提出了一種改進(jìn)DQN算法,解決了動(dòng)態(tài)障礙物與移動(dòng)機(jī)器人之間因?yàn)橄鄬\(yùn)動(dòng)引起異常獎(jiǎng)勵(lì),導(dǎo)致移動(dòng)機(jī)器人與動(dòng)態(tài)障礙物之間的碰撞的問題,但算法的收斂速率較慢.Yao Q等人[9]將改進(jìn)人工勢場法與DQN結(jié)合緩解了環(huán)境中存在多個(gè)目標(biāo)位置造成的勢場重疊,機(jī)器人易陷入局部最優(yōu)陷阱的問題,但實(shí)驗(yàn)在動(dòng)態(tài)環(huán)境中效果沒有得到驗(yàn)證.Chiang H等人[10]通過結(jié)合基于抽樣的規(guī)劃、快速探索的隨機(jī)樹和DRL,提出了一種動(dòng)態(tài)運(yùn)動(dòng)規(guī)劃的有效解決方案,但存在復(fù)雜環(huán)境中效率較低的問題.

    DRL方法中基于DQN路徑規(guī)劃算法是利用不同的狀態(tài)-動(dòng)作對作為神經(jīng)網(wǎng)絡(luò)的輸入,以Q函數(shù)值作為輸出.神經(jīng)網(wǎng)絡(luò)每一次更新,目標(biāo)Q網(wǎng)絡(luò)都會(huì)采取最大化操作,這樣的操作會(huì)導(dǎo)致動(dòng)作值偏高,出現(xiàn)過估計(jì)的問題,移動(dòng)機(jī)器人可能會(huì)陷入局部最優(yōu)陷阱,收斂速度較慢.DDQN通過改進(jìn)DQN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以有效解決DQN過估計(jì)問題[11],但它在選擇動(dòng)作時(shí),是利用當(dāng)前估計(jì)網(wǎng)絡(luò)參數(shù),而不是利用不斷更新的先驗(yàn)知識(shí),所以會(huì)造成價(jià)值低估的問題.在傳統(tǒng)DQN路徑規(guī)劃算法中,移動(dòng)機(jī)器人的狀態(tài)集為當(dāng)前位置相鄰的四個(gè)狀態(tài),這使得算法規(guī)劃的每一個(gè)步長路徑之間存在直角夾角,平滑度較差.

    傳統(tǒng)人工勢場方法可以快速獲取路徑,但存在以下3個(gè)不足之處[12]:1)當(dāng)機(jī)器人距離目標(biāo)位置較遠(yuǎn)時(shí),機(jī)器人所受引力較大,斥力相對較小,容易撞上環(huán)境中的障礙物;2)當(dāng)目標(biāo)位置附近存在障礙物時(shí),機(jī)器人移動(dòng)至目標(biāo)位置附近時(shí),所受引力較小而斥力相對較大,容易導(dǎo)致機(jī)器人無法到達(dá)目標(biāo)位置;3)當(dāng)機(jī)器人在環(huán)境中某一位置所受引力和斥力恰好相等,例如機(jī)器人當(dāng)前位置、障礙物位置與目標(biāo)位置處于一條直線時(shí),容易導(dǎo)致局部震蕩或者陷入局部最優(yōu)陷阱.

    針對上述傳統(tǒng)DQN和人工勢場路徑規(guī)劃算法的問題,本文將DRL強(qiáng)大的學(xué)習(xí)能力和對未知環(huán)境的處理能力與人工勢場快速獲得路徑的特點(diǎn)結(jié)合,提出了一種基于人工勢場法和改進(jìn)深度雙重Q網(wǎng)絡(luò)路徑規(guī)劃算法PF-IDDQN.將人工勢場法中的勢能引入到DDQN獎(jiǎng)勵(lì)模塊中,緩解DDQN中獎(jiǎng)勵(lì)稀疏問題,使得學(xué)習(xí)器的探索更具目的性,減少盲目探索,降低DDQN因動(dòng)態(tài)障礙物移動(dòng)陷入局部最優(yōu)陷阱的概率.同時(shí)人工勢場法中由于引力與斥力合力為零導(dǎo)致局部最優(yōu)陷阱時(shí),DDQN算法的隨機(jī)探索策略可以讓學(xué)習(xí)器嘗試不同的路徑,有效緩解人工勢場的不足.

    本文主要工作如下:首先,對移動(dòng)機(jī)器人所在環(huán)境中的靜態(tài)障礙物和動(dòng)態(tài)障礙物人工勢場進(jìn)行建模,構(gòu)建勢能地圖.其次,將勢能地圖引入DDQN算法中,將不同狀態(tài)的勢能差作為DDQN算法的密集獎(jiǎng)勵(lì),同時(shí)對移動(dòng)機(jī)器人的狀態(tài)集進(jìn)行了優(yōu)化,增加了4個(gè)狀態(tài);最后,移動(dòng)機(jī)器人在動(dòng)態(tài)環(huán)境中進(jìn)行訓(xùn)練仿真,對比傳統(tǒng)DRL算法,驗(yàn)證提出算法的性能.實(shí)驗(yàn)結(jié)果表明,該算法不僅可以在具有動(dòng)態(tài)障礙物的環(huán)境中快速推導(dǎo)出路徑提升算法成功率,緩解了DDQN算法收斂緩慢的問題,而且可以解決人工勢場方法中存在的局部最優(yōu)解的問題.

    2 方法描述

    2.1 人工勢場法

    人工勢場(APF)方法是一種全局路徑規(guī)劃算法,通過在環(huán)境中構(gòu)建虛擬勢場的路徑規(guī)劃方法[13].勢場由兩種位場組成:重力場和斥力場.目標(biāo)物對主體施加重力,形成重力勢場,引導(dǎo)機(jī)器人向目標(biāo)位置移動(dòng).同時(shí),障礙物產(chǎn)生脈沖力,形成排斥勢場,引導(dǎo)機(jī)器人躲避障礙物[14].在人工勢場中,勢能受重力場和排斥場的影響.障礙物附近位置的勢能較高,而目標(biāo)附近位置的勢能較低,如圖1所示.因此,在排斥勢場和引力勢場合力的驅(qū)動(dòng)下,移動(dòng)機(jī)器人從高勢能位置移動(dòng)到低勢能位置,同時(shí)找到一條能夠到達(dá)目標(biāo)位置的無碰撞路徑.地圖上目標(biāo)位置的引力(即重力)覆蓋了整個(gè)環(huán)境地圖,因此移動(dòng)機(jī)器人可以從地圖上的任何位置向目標(biāo)位置移動(dòng)[15].

    圖1 人工勢場中機(jī)器人受力分析Fig.1 Force analysis of robot in artificial potential field

    人工勢場法機(jī)器人受力分析如圖1所示.2D空間的引力場示意圖如圖2所示.

    圖2 2D空間引力場[16]Fig.2 Gravitational field in 2D space[16]

    傳統(tǒng)的引力場函數(shù)如下:

    (1)

    其中η是尺度因子,d(q,qgoal)是機(jī)器人當(dāng)前位置與目標(biāo)位置的距離.目標(biāo)位置對機(jī)器人的引力為引力場對距離的導(dǎo)數(shù):

    Fatt(q)=-Uatt(q)=ζ(qgoat-q)

    (2)

    傳統(tǒng)的斥力場函數(shù)如公式(3)所示:

    (3)

    其中η是斥力因子,d(q,qobs)是機(jī)器人到距離機(jī)器人最近的障礙物的歐幾里得距離,d0是每個(gè)障礙物的影響半徑.當(dāng)機(jī)器人和障礙物的距離大于障礙物影響半徑時(shí),機(jī)器人不受障礙物影響.

    斥力場產(chǎn)生的斥力為:

    Frep(q)=

    (4)

    總勢場為斥力場與引力場的疊加,機(jī)器人所受合力為對應(yīng)分力的疊加.

    U(q)=Uatt(q)+Urep(q)

    (5)

    F(q)=-U(q)

    (6)

    2.2 強(qiáng)化學(xué)習(xí)

    在強(qiáng)化學(xué)習(xí)中,學(xué)習(xí)器在不同時(shí)間步中將與實(shí)驗(yàn)環(huán)境交互.在實(shí)驗(yàn)中,每一個(gè)時(shí)間步內(nèi)學(xué)習(xí)器都將接收一個(gè)狀態(tài)st,同時(shí)根據(jù)實(shí)驗(yàn)中的策略π如隨機(jī)策略等,從動(dòng)作集合A中選擇一個(gè)動(dòng)作at.策略π是學(xué)習(xí)器從當(dāng)前狀態(tài)到選擇的動(dòng)作的影射.學(xué)習(xí)器執(zhí)行動(dòng)作at并進(jìn)入到下一個(gè)狀態(tài)st′,得到一個(gè)獎(jiǎng)勵(lì)rt作為st的反饋.Rt是從當(dāng)前位置開始到一次訓(xùn)練或測試結(jié)束所得到的獎(jiǎng)勵(lì)的折扣累積,Rt計(jì)算公式如公式(7)所示:

    (7)

    其中γ是折扣因子,設(shè)置折扣因子的目的是弱化遠(yuǎn)期狀態(tài)對現(xiàn)在狀態(tài)的影響,越近的狀態(tài)對當(dāng)前狀態(tài)影響越大.學(xué)習(xí)器的最終目標(biāo)是最大化每個(gè)狀態(tài)的期望累積獎(jiǎng)勵(lì).

    動(dòng)作值函數(shù)是描述學(xué)習(xí)器在不同狀態(tài)一直根據(jù)策略π選擇動(dòng)作a,直到一次訓(xùn)練或測試結(jié)束得到期望獎(jiǎng)勵(lì),如公式(8)所示:

    Qπ(s,a)=E[Rt|st=s,at=a,π]

    (8)

    值函數(shù)定義為:

    Vπ(s)=E[Rt|st]

    (9)

    對于環(huán)境中所有狀態(tài)的集合S,如果一個(gè)策略π的期望回報(bào)大于或等于其他策略的期望回報(bào),那么該策略為最優(yōu)策略π*,定義為:

    (10)

    如果當(dāng)前狀態(tài)的下一個(gè)狀態(tài)st′已知所有動(dòng)作的Q值函數(shù),那么π*可以選擇最大化期望回報(bào)的動(dòng)作.

    (11)

    2.3 DQN算法及DDQN算法

    Mnih等人[17]將卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的Q-learning算法結(jié)合,提出了DQN算法模型,該模型的提出開創(chuàng)了深度強(qiáng)化學(xué)習(xí)新的研究領(lǐng)域.DQN的訓(xùn)練更新流程如圖3所示.

    圖3 DQN訓(xùn)練更新流程Fig.3 DQN training update process

    DQN算法使用了固定Q目標(biāo)的方法,即采用了兩個(gè)網(wǎng)絡(luò),在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時(shí)通過網(wǎng)絡(luò)來估算Q的真實(shí)值,通過網(wǎng)絡(luò)W對參數(shù)進(jìn)行優(yōu)化,當(dāng)滿足規(guī)定迭代次數(shù)后用網(wǎng)絡(luò)W來更新網(wǎng)絡(luò)W-,這樣將Q的真實(shí)值和預(yù)測值區(qū)分開,減少實(shí)驗(yàn)結(jié)果振蕩.

    針對非線性神經(jīng)網(wǎng)絡(luò)表示值函數(shù)的穩(wěn)定性較差等問題,DQN算法主要對傳統(tǒng)的Q-learning算法做了2處改進(jìn)[6].

    1)DQN算法引入兩個(gè)卷積神經(jīng)網(wǎng)絡(luò)分別用來近似表示當(dāng)前的狀態(tài)值函數(shù)和產(chǎn)生目標(biāo)值函數(shù)Q值.DQN在每次迭代i中優(yōu)化損失函數(shù)如公式(12)所示:

    Li(θi)=Es,a,r,s′[(Yt-Q(s,a|θi))2]

    (12)

    (13)

    當(dāng)前狀態(tài)值函數(shù)網(wǎng)絡(luò)的權(quán)值θ是實(shí)時(shí)更新的,每經(jīng)過N輪迭代,算法將當(dāng)前狀態(tài)值函數(shù)網(wǎng)絡(luò)的參數(shù)復(fù)制傳遞給目標(biāo)值函數(shù)網(wǎng)絡(luò).初始化時(shí),θ=θ-.DQN通過最小化當(dāng)前狀態(tài)Q值和目標(biāo)狀態(tài)Q值之間的均方誤差來更新神經(jīng)網(wǎng)絡(luò)參數(shù).如公式(14)所示:

    L(θt)=Es,a,r,s′[Yt-q(s,a|θt))2]

    (14)

    DQN算法引入了目標(biāo)函數(shù)值網(wǎng)絡(luò),目標(biāo)Q值在N次迭代時(shí)間內(nèi)是保持不變的,有效降低了當(dāng)前狀態(tài)Q值和目標(biāo)狀態(tài)Q值之間的關(guān)聯(lián)性,相較于傳統(tǒng)Q-learning算法提升了算法的穩(wěn)定性.

    Li(θi)E(s,a,r,s′)~U(D)[(Yt-Q(s,a|θi))2]

    (15)

    深度學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),通常要求訓(xùn)練樣本相互獨(dú)立.DQN算法通過隨機(jī)采樣的方式,顯著降低了訓(xùn)練樣本之間的關(guān)聯(lián)性,從而提升了算法的穩(wěn)定性.

    DDQN算法與DQN算法相同,具有兩個(gè)Q網(wǎng)絡(luò)結(jié)構(gòu),同時(shí)也具備經(jīng)驗(yàn)回放機(jī)制.不同點(diǎn)在于DDQN在傳統(tǒng)DQN算法的基礎(chǔ)上,通過當(dāng)前正在更新的Q網(wǎng)絡(luò)的參數(shù)選擇最優(yōu)動(dòng)作,來緩解傳統(tǒng)DQN算法過度估計(jì)的問題.DDQN計(jì)算目標(biāo)Q值的方法如公式(16)所示:

    (16)

    3 基于人工勢場法和改進(jìn)深度Q網(wǎng)絡(luò)路徑規(guī)劃算法

    本文假設(shè)移動(dòng)機(jī)器人在[0,90],[0,60]的長方形實(shí)驗(yàn)空間中,空間中有4個(gè)邊長為10的靜態(tài)障礙物,6個(gè)邊長為1的動(dòng)態(tài)隨機(jī)障礙物.人工勢場法是全局路徑規(guī)劃算法,本文首先對實(shí)驗(yàn)環(huán)境中的障礙物、目標(biāo)位置勢場進(jìn)行建模構(gòu)建勢場地圖;然后基于勢場地圖定義強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)模塊;最后訓(xùn)練Agent在動(dòng)態(tài)環(huán)境中躲避障礙物并移動(dòng)到目標(biāo)位置.

    3.1 環(huán)境勢場建模

    基于傳統(tǒng)人工勢場方法對移動(dòng)機(jī)器人實(shí)驗(yàn)空間中的引力勢場和斥力勢場進(jìn)行了建模.目標(biāo)位置的引力勢場計(jì)算方法如公式(1)所示.

    建立所有靜態(tài)和動(dòng)態(tài)障礙物位置的斥力勢場模型,障礙物的斥力勢場計(jì)算方法如公式(3)所示.

    在機(jī)器人的環(huán)境中,目標(biāo)位置處的勢場值最小,距離目標(biāo)位置較遠(yuǎn)的勢場值較大.在障礙物附近的勢場中,越靠近障礙物,勢場值越大.

    3.2 基于勢場的強(qiáng)化學(xué)習(xí)定義

    本文提出的算法根據(jù)上述勢場模型定義了強(qiáng)化學(xué)習(xí)中的動(dòng)作空間、狀態(tài)空間和獎(jiǎng)勵(lì)函數(shù).本文將強(qiáng)化學(xué)習(xí)中的動(dòng)作定義為機(jī)器人的當(dāng)前位置與下一個(gè)位置之間的距離差值.這個(gè)動(dòng)作是一個(gè)二維連續(xù)矢量,其中二維分別表示機(jī)器人沿x軸和y軸的位移.針對傳統(tǒng)DDQN算法中規(guī)劃的路徑平滑度較差的問題,本文將機(jī)器人的動(dòng)作空間,增加左前、右前、左后及右后方向4個(gè)方向[12],機(jī)器人可以向8個(gè)方向移動(dòng).動(dòng)作空間改進(jìn)后,機(jī)器人可移動(dòng)方向示意圖如圖4所示.

    圖4 改進(jìn)DQN算法動(dòng)作集示意圖Fig.4 Schematic diagram of the action set of the improved DQN algorithm

    勢能地圖中每一個(gè)已知點(diǎn)都有其對應(yīng)的二維坐標(biāo),所以實(shí)驗(yàn)?zāi)P偷臓顟B(tài)空間S可以表示為:

    S={(x,y)|0≤x≤W,0≤y≤H}

    (17)

    其中W為勢能地圖的寬度,H為勢能地圖的高度.

    在路徑規(guī)劃問題中,本文希望機(jī)器人每一次移動(dòng)都盡可能接近目標(biāo)位置,并且盡可能遠(yuǎn)離障礙物影響范圍.因此,本文將算法獎(jiǎng)勵(lì)進(jìn)行如下定義:根據(jù)勢能地圖中每個(gè)狀態(tài)的勢能值,計(jì)算當(dāng)前狀態(tài)與下一狀態(tài)的勢能差值即為該動(dòng)作的獎(jiǎng)勵(lì)值;目標(biāo)位置的獎(jiǎng)勵(lì)應(yīng)為較大值.當(dāng)出現(xiàn)如下情況時(shí)機(jī)器人結(jié)束一次訓(xùn)練或測試:

    1)機(jī)器人移動(dòng)100個(gè)步長未到達(dá)目標(biāo)位置;

    2)機(jī)器人觸碰障礙物或者地圖邊界;

    3)機(jī)器人移動(dòng)到目標(biāo)位置

    將相鄰兩個(gè)狀態(tài)的勢能差值作為RL的密集獎(jiǎng)勵(lì),可以有效緩解DDQN算法獎(jiǎng)勵(lì)稀疏的問題,加快算法收斂的速度,減少Agent的無效探索.本文設(shè)置100個(gè)步長內(nèi)到達(dá)目標(biāo)位置作為算法的一個(gè)性能指標(biāo),傳統(tǒng)離散RL算法采用隨機(jī)策略探索環(huán)境空間,算法往往需要付出大量的步長去探索未知空間和移動(dòng)到目標(biāo)位置,本文算法在訓(xùn)練和測試過程中可以使用較少的步長到達(dá)目標(biāo)位置,性能相比傳統(tǒng)DRL算法有很大的提升.RL是一種試錯(cuò)的算法,但在實(shí)際生活中,機(jī)器人試錯(cuò)的成本非常高,在本文仿真中,本文設(shè)計(jì)機(jī)器人如果與障礙物或環(huán)境空間邊界發(fā)生碰撞,該輪訓(xùn)練或測試結(jié)束,盡可能避免機(jī)器人在訓(xùn)練或現(xiàn)實(shí)測試時(shí)與障礙物發(fā)生碰撞.

    3.3 算法流程

    根據(jù)DDQN算法中神經(jīng)網(wǎng)絡(luò)的訓(xùn)練流程,本文設(shè)計(jì)了基于人工勢場法和改進(jìn)DDQN算法神經(jīng)網(wǎng)絡(luò)一次更新流程圖,如圖5所示,其中Batchsize為算法進(jìn)行一次訓(xùn)練所需的樣本數(shù)量.本文提出算法中,使用ε-greedy作為探索策略,為了算法更好更快的收斂,同時(shí)提升Agent實(shí)驗(yàn)后期探索效率,探索率ε初始值較大,但隨著迭代次數(shù)的增加而逐漸變小.

    圖5 算法一次訓(xùn)練更新流程圖Fig.5 Algorithm for one-time training update flowchart

    本文提出改進(jìn)算法框架圖如圖6所示,首先,對環(huán)境地圖進(jìn)行采集獲取State,將采集的地圖轉(zhuǎn)化為勢能地圖;其次,將獲取的勢能地圖引入DDQN網(wǎng)絡(luò)中;最后,通過得到的價(jià)值函數(shù)Q進(jìn)行動(dòng)作選擇,將動(dòng)作反饋給環(huán)境,得到獎(jiǎng)勵(lì)R,將R反饋給DDQN網(wǎng)絡(luò)進(jìn)行迭代更新.

    圖6 本文提出算法網(wǎng)絡(luò)框架圖Fig.6 This paper proposes the algorithm network framework diagram

    本文提出的算法流程如算法所示:

    算法.基于人工勢場和DDQN路徑規(guī)劃算法

    輸入:環(huán)境信息及算法參數(shù)

    輸出:Q網(wǎng)絡(luò)參數(shù)信息

    a)初始化經(jīng)驗(yàn)池D,初始化Q目標(biāo)網(wǎng)絡(luò)參數(shù)和當(dāng)前網(wǎng)絡(luò)參數(shù)容量為N,初始化所有狀態(tài)及動(dòng)作的值

    b)for episode=1 M T

    c)初始化實(shí)驗(yàn)環(huán)境狀態(tài),根據(jù)環(huán)境中的機(jī)器人位置、目標(biāo)位置和障礙物位置,計(jì)算環(huán)境位置勢能,根據(jù)計(jì)算的勢能得出總的勢能地圖

    d)通過總的勢能地圖,機(jī)器人根據(jù)當(dāng)前位置周圍5X5的環(huán)境勢能,選擇勢能最小的最優(yōu)動(dòng)作

    e)得到機(jī)器人執(zhí)行動(dòng)作 后的獎(jiǎng)勵(lì) 和下一個(gè)網(wǎng)絡(luò)的輸入s′,同時(shí)將機(jī)器人獲取的環(huán)境特征信息(s,a,r,s′)保存到經(jīng)驗(yàn)池D中(經(jīng)驗(yàn)池中的記憶矩陣保存著前N個(gè)時(shí)刻的狀態(tài))

    f)隨機(jī)從經(jīng)驗(yàn)池D 中取出n個(gè)樣本,按照公式(9)對Q值進(jìn)行更新,并將更新后的Q值作為目標(biāo)值,計(jì)算樣本中每一個(gè)狀態(tài)的目標(biāo)值

    g)使用均方差損失函數(shù),通過神經(jīng)網(wǎng)絡(luò)的梯度反向傳播來更新Q網(wǎng)絡(luò)的所有參數(shù)

    h)每C次迭代后更新目標(biāo)網(wǎng)絡(luò)參數(shù)

    i)如果下一狀態(tài)是障礙物、地圖邊界或目標(biāo)位置,當(dāng)前輪迭代完畢,否則轉(zhuǎn)到步驟d)

    j)end for.

    4 仿真實(shí)驗(yàn)及結(jié)果分析

    本文實(shí)驗(yàn)環(huán)境為CPU AMD 銳龍5 5600X,Pytorch 1.10對DDQN網(wǎng)絡(luò)進(jìn)行訓(xùn)練.本文移動(dòng)機(jī)器人仿真實(shí)驗(yàn)采用全局路徑規(guī)劃算法與局部路徑規(guī)劃算法結(jié)合的方式.實(shí)驗(yàn)中,首先構(gòu)建全局勢場地圖,構(gòu)建的勢場地圖如圖7所示,Agent每移動(dòng)一個(gè)步長,勢能地圖將更新一次,定位動(dòng)態(tài)障礙物的位置.

    圖7 實(shí)驗(yàn)環(huán)境勢場地圖Fig.7 Potential field map of the experimental environment

    其中4個(gè)大正方形為靜態(tài)障礙物,6個(gè)小正方形為動(dòng)態(tài)障礙物,動(dòng)態(tài)障礙物在20×20范圍內(nèi)隨機(jī)移動(dòng).起始位置在地圖右下角,目標(biāo)位置在地圖左上角,右下角黑色點(diǎn)為機(jī)器人當(dāng)前位置,地圖顏色越深勢能越高.本文中勢場公式參數(shù)的設(shè)定為ζ=1,η=20,d0=3.

    本文中獎(jiǎng)勵(lì)模塊設(shè)置參數(shù)如表1所示.

    在實(shí)際實(shí)驗(yàn)中,可以使用激光雷達(dá)獲取實(shí)驗(yàn)場景地圖如圖8所示,再將地圖轉(zhuǎn)化為勢能地圖,在像素地圖中,每一個(gè)黑色像素點(diǎn)可視為障礙物,Agent每移動(dòng)兩個(gè)像素點(diǎn),更新一次局部勢能地圖,本文實(shí)驗(yàn)中實(shí)時(shí)更新Agent前方60×60的勢能地圖,該大小的地圖更新造成的延遲對Agent的實(shí)際移動(dòng)的影響可以忽略不計(jì).

    圖8 激光雷達(dá)獲取實(shí)際環(huán)境地圖Fig.8 Lidar obtains actual environment map

    為驗(yàn)證算法在動(dòng)態(tài)環(huán)境中的性能、探索效率以及收斂速度,本文限制移動(dòng)機(jī)器人每次訓(xùn)練最多移動(dòng)100個(gè)步長.實(shí)驗(yàn)參數(shù)如表2所示.

    表2 實(shí)驗(yàn)參數(shù)Table 2 Experimental parameters

    將本文提出的算法與基于改進(jìn)DQN算法的DDQN算法在相同實(shí)驗(yàn)環(huán)境中進(jìn)行實(shí)驗(yàn)對比,兩種算法每輪訓(xùn)練的獎(jiǎng)勵(lì)值如圖9~圖10所示.

    圖9 本文提出算法訓(xùn)練中獎(jiǎng)勵(lì)值曲線圖Fig.9 In this paper,the curve of reward values in algorithm training is proposed

    圖10 傳統(tǒng)DDQN算法訓(xùn)練中獎(jiǎng)勵(lì)值曲線圖Fig.10 Reward value curve graph in the training of traditional DDQN algorithms

    由圖9可以看出本文提出的算法在迭代150次以上得到了170左右的較高的獎(jiǎng)勵(lì)值,算法獎(jiǎng)勵(lì)值集中在150~200區(qū)間;而基于傳統(tǒng)DDQN算法在限制的探索次數(shù)下無法探索到目標(biāo)位置,在迭代約40次后陷入了局部最優(yōu)陷阱或無法越過動(dòng)態(tài)障礙物,由圖10可以看出該算法在陷入局部最優(yōu)陷阱后的獎(jiǎng)勵(lì)值趨于相似值,故實(shí)驗(yàn)只進(jìn)行了500次迭代.

    本文實(shí)驗(yàn)中,有3條結(jié)束本次訓(xùn)練或測試的條件,由圖11~圖12可知,當(dāng)移動(dòng)次數(shù)小于60時(shí)機(jī)器人可能與障礙物或地圖邊界發(fā)生碰撞;當(dāng)移動(dòng)次數(shù)大于60小于100時(shí),可認(rèn)為機(jī)器人有較高概率成功到達(dá)目標(biāo)位置;當(dāng)移動(dòng)次數(shù)為100時(shí),可認(rèn)為機(jī)器人有較高概率受到動(dòng)態(tài)障礙物影響未能在規(guī)定移動(dòng)次數(shù)內(nèi)到達(dá)目標(biāo)位置.本文提出的算法在機(jī)器人移動(dòng)60~70個(gè)步長收斂.

    圖11 基于人工勢場和改進(jìn)DQN算法收斂回合Fig.11 Convergence round based on artificial potential field and improved DQN algorithm

    圖12 訓(xùn)練中機(jī)器人成功到達(dá)目標(biāo)位置Fig.12 Robot successfully reached the target position during training

    如圖11所示,基于人工勢場和改進(jìn)DDQN算法在3000次訓(xùn)練迭代中,移動(dòng)機(jī)器人在約150次迭代后路徑規(guī)劃成功率在89%以上,基于傳統(tǒng)DDQN算法無法規(guī)劃出到達(dá)目標(biāo)位置的路徑.

    移動(dòng)機(jī)器人在實(shí)驗(yàn)環(huán)境中測試的效果如圖13所示.可以看出,實(shí)驗(yàn)中移動(dòng)機(jī)器人在遇到左下角靜態(tài)障礙物時(shí),出現(xiàn)了呈Z字型移動(dòng),這是由于獎(jiǎng)勵(lì)模塊總是驅(qū)動(dòng)移動(dòng)機(jī)器人向目標(biāo)位置移動(dòng),即總是相左上方移動(dòng),但在實(shí)驗(yàn)中,為降低移動(dòng)機(jī)器人與障礙物的碰撞,本文設(shè)計(jì)移動(dòng)機(jī)器人與障礙物保持一定距離,所以出現(xiàn)上述現(xiàn)象;雖然在實(shí)驗(yàn)中移動(dòng)機(jī)器人在遇到動(dòng)態(tài)障礙物時(shí),會(huì)額外付出一定步長尋找通行路徑,但本文提出算法依舊可以規(guī)劃出通往目標(biāo)位置的路徑.在實(shí)驗(yàn)300次測試中,移動(dòng)機(jī)器人在規(guī)定移動(dòng)次數(shù)內(nèi)路徑規(guī)劃成功率在97%以上.

    圖13 機(jī)器人在靜態(tài)及動(dòng)態(tài)障礙物環(huán)境中測試結(jié)果Fig.13 Test results of the robot in static and dynamic obstacle environments

    5 結(jié) 語

    本文提出的基于人工勢場法和改進(jìn)DDQN算法可以應(yīng)用于動(dòng)態(tài)實(shí)驗(yàn)環(huán)境,算法中值函數(shù)的估計(jì)更加準(zhǔn)確,移動(dòng)機(jī)器人可以在有限移動(dòng)次數(shù)下快速地識(shí)別出相對最優(yōu)的動(dòng)作,收斂速度更快.本文采用DDQN算法更新Q值,緩解了Q值估計(jì)過高的問題.引入人工勢場緩解了DQN算法獎(jiǎng)勵(lì)稀疏的問題,加快了算法網(wǎng)絡(luò)收斂的速度,提高了移動(dòng)機(jī)器人在動(dòng)態(tài)環(huán)境路徑規(guī)劃的成功率.綜上所述,本文提出的算法可以利用更少的移動(dòng)次數(shù)在較少迭代次數(shù)內(nèi)得到更大的獎(jiǎng)勵(lì)值,從而使得移動(dòng)機(jī)器人可以在更短時(shí)間內(nèi)更準(zhǔn)確的獲得最優(yōu)路徑.

    猜你喜歡
    勢場勢能移動(dòng)機(jī)器人
    “動(dòng)能和勢能”知識(shí)鞏固
    作 品:景觀設(shè)計(jì)
    ——《勢能》
    文化縱橫(2022年3期)2022-09-07 11:43:18
    移動(dòng)機(jī)器人自主動(dòng)態(tài)避障方法
    “動(dòng)能和勢能”知識(shí)鞏固
    基于Frenet和改進(jìn)人工勢場的在軌規(guī)避路徑自主規(guī)劃
    “動(dòng)能和勢能”隨堂練
    基于改進(jìn)人工勢場方法的多無人機(jī)編隊(duì)避障算法
    庫車坳陷南斜坡古流體勢場對陸相油氣運(yùn)聚的控制
    基于Twincat的移動(dòng)機(jī)器人制孔系統(tǒng)
    基于偶極勢場的自主水下航行器回塢導(dǎo)引算法
    三上悠亚av全集在线观看 | 高清黄色对白视频在线免费看 | 国产成人免费无遮挡视频| 91久久精品电影网| 黄色视频在线播放观看不卡| 日韩制服骚丝袜av| 欧美亚洲 丝袜 人妻 在线| 中文天堂在线官网| 国产午夜精品久久久久久一区二区三区| 精品国产一区二区久久| 少妇被粗大猛烈的视频| 中文字幕制服av| 成人漫画全彩无遮挡| 伦理电影免费视频| 噜噜噜噜噜久久久久久91| 国产视频首页在线观看| 中国国产av一级| 91久久精品国产一区二区成人| 亚洲va在线va天堂va国产| 国产美女午夜福利| 狂野欧美白嫩少妇大欣赏| 午夜精品国产一区二区电影| 久久婷婷青草| 中国美白少妇内射xxxbb| 伊人久久精品亚洲午夜| av福利片在线观看| 80岁老熟妇乱子伦牲交| 乱码一卡2卡4卡精品| tube8黄色片| 人妻 亚洲 视频| 高清视频免费观看一区二区| 国产白丝娇喘喷水9色精品| 一级毛片黄色毛片免费观看视频| 美女大奶头黄色视频| 成人亚洲欧美一区二区av| 成年人免费黄色播放视频 | 大码成人一级视频| 亚洲天堂av无毛| 亚洲欧美成人综合另类久久久| 久久ye,这里只有精品| av国产久精品久网站免费入址| 另类精品久久| 国产成人精品福利久久| 日产精品乱码卡一卡2卡三| 有码 亚洲区| 在线 av 中文字幕| 久久精品国产a三级三级三级| 成年人免费黄色播放视频 | 国内揄拍国产精品人妻在线| 丰满乱子伦码专区| 欧美变态另类bdsm刘玥| 亚洲av男天堂| 大陆偷拍与自拍| 精品亚洲乱码少妇综合久久| 午夜91福利影院| 日韩伦理黄色片| 99re6热这里在线精品视频| 少妇 在线观看| 天美传媒精品一区二区| 日韩av在线免费看完整版不卡| 亚洲国产成人一精品久久久| 国国产精品蜜臀av免费| 天天操日日干夜夜撸| 亚洲精华国产精华液的使用体验| 乱人伦中国视频| 国产精品国产三级专区第一集| 午夜福利,免费看| videos熟女内射| 国产黄色视频一区二区在线观看| 欧美另类一区| 69精品国产乱码久久久| 亚洲欧美精品自产自拍| 十八禁网站网址无遮挡 | 三级国产精品欧美在线观看| 亚洲,欧美,日韩| 亚洲精品国产av蜜桃| 久久久久网色| 国精品久久久久久国模美| 精品一区二区免费观看| 在线观看av片永久免费下载| 色94色欧美一区二区| 亚洲人成网站在线观看播放| 又黄又爽又刺激的免费视频.| 国产美女午夜福利| 亚洲精品国产av成人精品| 99热网站在线观看| 亚洲电影在线观看av| 久久亚洲国产成人精品v| 成人综合一区亚洲| 中文字幕亚洲精品专区| 亚洲欧美一区二区三区国产| 久久精品久久精品一区二区三区| 国产成人免费观看mmmm| 国内少妇人妻偷人精品xxx网站| 久久女婷五月综合色啪小说| 免费看不卡的av| 国产伦理片在线播放av一区| 男女边吃奶边做爰视频| 国产有黄有色有爽视频| 在线观看免费视频网站a站| 国产精品久久久久久精品电影小说| 国产国拍精品亚洲av在线观看| 成人国产麻豆网| 婷婷色综合大香蕉| 免费高清在线观看视频在线观看| 中文字幕精品免费在线观看视频 | 99视频精品全部免费 在线| 成人午夜精彩视频在线观看| 下体分泌物呈黄色| 国产伦精品一区二区三区视频9| 蜜臀久久99精品久久宅男| 亚洲成色77777| 久久精品国产亚洲av涩爱| 日本91视频免费播放| 女的被弄到高潮叫床怎么办| 国产精品一二三区在线看| 久久国内精品自在自线图片| 色视频在线一区二区三区| 国产成人精品婷婷| 日本午夜av视频| 夜夜看夜夜爽夜夜摸| 国产探花极品一区二区| 国产日韩欧美亚洲二区| 美女视频免费永久观看网站| 老司机影院成人| 黄色毛片三级朝国网站 | 国产日韩欧美亚洲二区| 丝袜喷水一区| 丝瓜视频免费看黄片| 国产乱来视频区| 韩国高清视频一区二区三区| 欧美精品亚洲一区二区| 亚洲av免费高清在线观看| 丰满少妇做爰视频| 国产精品女同一区二区软件| 亚州av有码| 一级a做视频免费观看| 18禁在线播放成人免费| 国模一区二区三区四区视频| a 毛片基地| 国产成人aa在线观看| 欧美丝袜亚洲另类| 国产精品久久久久久久久免| 一个人免费看片子| 欧美97在线视频| 久热这里只有精品99| 免费看不卡的av| 亚洲,欧美,日韩| 岛国毛片在线播放| 色5月婷婷丁香| 女性生殖器流出的白浆| 夫妻性生交免费视频一级片| 永久免费av网站大全| 久久久久久久久久久久大奶| 在线观看av片永久免费下载| 免费高清在线观看视频在线观看| 日韩不卡一区二区三区视频在线| 成人国产av品久久久| 亚洲精品日韩av片在线观看| 亚洲av国产av综合av卡| 91久久精品电影网| 少妇被粗大猛烈的视频| 黑人猛操日本美女一级片| 毛片一级片免费看久久久久| 国产精品久久久久久av不卡| 亚洲欧美中文字幕日韩二区| 91精品国产九色| 丁香六月天网| 国产毛片在线视频| 永久网站在线| 少妇人妻 视频| 精品久久久久久久久av| 黄色毛片三级朝国网站 | 久热这里只有精品99| 99re6热这里在线精品视频| 欧美精品一区二区大全| 免费人妻精品一区二区三区视频| 中文欧美无线码| 日本vs欧美在线观看视频 | 精品亚洲成国产av| 欧美97在线视频| 国产精品.久久久| 婷婷色麻豆天堂久久| 少妇人妻 视频| 大片电影免费在线观看免费| 日韩强制内射视频| 丰满少妇做爰视频| 亚洲美女搞黄在线观看| 亚洲三级黄色毛片| 成人免费观看视频高清| 91久久精品电影网| 少妇丰满av| 免费久久久久久久精品成人欧美视频 | 久久久久久久久久人人人人人人| 久久久午夜欧美精品| 人人妻人人澡人人看| 亚洲av电影在线观看一区二区三区| 国产成人a∨麻豆精品| 亚洲国产色片| 中文字幕人妻熟人妻熟丝袜美| 亚洲,欧美,日韩| 日韩人妻高清精品专区| 深夜a级毛片| 亚洲精品色激情综合| 噜噜噜噜噜久久久久久91| 国产黄片视频在线免费观看| 韩国av在线不卡| 亚洲精品乱码久久久v下载方式| 欧美+日韩+精品| 色网站视频免费| 午夜福利网站1000一区二区三区| 国产精品偷伦视频观看了| 精品午夜福利在线看| 日韩成人av中文字幕在线观看| 高清欧美精品videossex| 香蕉精品网在线| 国产午夜精品一二区理论片| 亚洲成人av在线免费| 中文天堂在线官网| 九九久久精品国产亚洲av麻豆| 久久久精品94久久精品| 99九九线精品视频在线观看视频| 我要看黄色一级片免费的| 欧美3d第一页| 高清在线视频一区二区三区| 97超碰精品成人国产| av.在线天堂| 亚洲美女视频黄频| 激情五月婷婷亚洲| 老司机影院成人| 黑人巨大精品欧美一区二区蜜桃 | 各种免费的搞黄视频| 美女福利国产在线| 日本黄色片子视频| 日韩一区二区视频免费看| 成人免费观看视频高清| 菩萨蛮人人尽说江南好唐韦庄| 在线观看美女被高潮喷水网站| 简卡轻食公司| 国产日韩欧美亚洲二区| 久久久久国产网址| 国产午夜精品久久久久久一区二区三区| 亚洲精品色激情综合| 午夜福利影视在线免费观看| 国产日韩欧美在线精品| 中文字幕人妻丝袜制服| 一本色道久久久久久精品综合| 久久久久久久精品精品| 性色av一级| 在线精品无人区一区二区三| 伊人亚洲综合成人网| 成人国产麻豆网| 毛片一级片免费看久久久久| 国产视频内射| 午夜免费观看性视频| 国产熟女欧美一区二区| 97超视频在线观看视频| 中文字幕精品免费在线观看视频 | 欧美bdsm另类| 观看美女的网站| 久久精品夜色国产| 黄色欧美视频在线观看| 三级国产精品欧美在线观看| 七月丁香在线播放| 欧美日韩国产mv在线观看视频| 特大巨黑吊av在线直播| 十八禁网站网址无遮挡 | 狂野欧美激情性bbbbbb| 80岁老熟妇乱子伦牲交| 老司机影院毛片| 精华霜和精华液先用哪个| 一级毛片久久久久久久久女| 欧美 亚洲 国产 日韩一| 九九爱精品视频在线观看| av福利片在线观看| 亚洲综合色惰| 插阴视频在线观看视频| 国产欧美日韩一区二区三区在线 | 99热这里只有精品一区| 精品亚洲成国产av| av有码第一页| 丝袜喷水一区| 国产亚洲午夜精品一区二区久久| 国产成人精品福利久久| 亚洲成人一二三区av| 永久免费av网站大全| 男女国产视频网站| 久久av网站| 欧美 亚洲 国产 日韩一| 日日啪夜夜撸| 一级毛片黄色毛片免费观看视频| 老女人水多毛片| 99热这里只有是精品50| 99久久人妻综合| 欧美成人精品欧美一级黄| a级毛色黄片| 极品教师在线视频| 嘟嘟电影网在线观看| 精品久久久久久电影网| 熟女电影av网| 欧美变态另类bdsm刘玥| 国产爽快片一区二区三区| 国产免费一区二区三区四区乱码| 又粗又硬又长又爽又黄的视频| 只有这里有精品99| 国产有黄有色有爽视频| 欧美变态另类bdsm刘玥| 欧美精品高潮呻吟av久久| 国产综合精华液| 国国产精品蜜臀av免费| 国产亚洲最大av| 王馨瑶露胸无遮挡在线观看| 国产精品国产三级国产专区5o| 国产精品久久久久久精品电影小说| 青青草视频在线视频观看| 日本爱情动作片www.在线观看| 王馨瑶露胸无遮挡在线观看| 精品少妇久久久久久888优播| 国产极品粉嫩免费观看在线 | 成人美女网站在线观看视频| 久久鲁丝午夜福利片| 国产在线免费精品| 亚洲,欧美,日韩| 人体艺术视频欧美日本| 高清黄色对白视频在线免费看 | 国产乱来视频区| 午夜免费男女啪啪视频观看| 少妇猛男粗大的猛烈进出视频| 在线观看av片永久免费下载| 日日啪夜夜爽| av女优亚洲男人天堂| 日韩大片免费观看网站| 人人妻人人澡人人爽人人夜夜| 国产深夜福利视频在线观看| 久久6这里有精品| 欧美日韩一区二区视频在线观看视频在线| 搡老乐熟女国产| 国产成人一区二区在线| 少妇猛男粗大的猛烈进出视频| 中文字幕人妻熟人妻熟丝袜美| 国产伦精品一区二区三区视频9| 久久婷婷青草| 久久精品久久久久久久性| 女人精品久久久久毛片| 免费观看的影片在线观看| 成人亚洲欧美一区二区av| 秋霞伦理黄片| av一本久久久久| 免费av不卡在线播放| 麻豆乱淫一区二区| 国产成人免费观看mmmm| 男人添女人高潮全过程视频| 亚洲一级一片aⅴ在线观看| 亚洲欧美成人精品一区二区| 国产成人aa在线观看| 国产精品免费大片| 免费观看在线日韩| 色视频www国产| 丰满人妻一区二区三区视频av| 亚洲经典国产精华液单| 黑人巨大精品欧美一区二区蜜桃 | 人妻夜夜爽99麻豆av| 久久久久久久久久久丰满| 欧美少妇被猛烈插入视频| 伊人亚洲综合成人网| 极品教师在线视频| 啦啦啦中文免费视频观看日本| 2021少妇久久久久久久久久久| 日本黄色片子视频| 青春草国产在线视频| 国产亚洲av片在线观看秒播厂| 午夜福利,免费看| 日本黄大片高清| 自拍偷自拍亚洲精品老妇| 又粗又硬又长又爽又黄的视频| 免费观看a级毛片全部| 精品久久久噜噜| 国产乱来视频区| 成人综合一区亚洲| 国产熟女欧美一区二区| 国产精品国产三级国产av玫瑰| 美女福利国产在线| 欧美xxxx性猛交bbbb| 日本91视频免费播放| 插逼视频在线观看| 日日啪夜夜撸| 亚洲欧美成人综合另类久久久| 日韩人妻高清精品专区| 亚洲精品,欧美精品| 九九久久精品国产亚洲av麻豆| 久久久久精品久久久久真实原创| 久久久精品94久久精品| 欧美日韩视频高清一区二区三区二| 毛片一级片免费看久久久久| 亚洲婷婷狠狠爱综合网| 简卡轻食公司| 建设人人有责人人尽责人人享有的| 99久久人妻综合| 中文字幕久久专区| 日韩在线高清观看一区二区三区| 高清午夜精品一区二区三区| 欧美亚洲 丝袜 人妻 在线| 日本猛色少妇xxxxx猛交久久| 日韩一区二区三区影片| 熟女av电影| 精品国产乱码久久久久久小说| 日韩三级伦理在线观看| 少妇 在线观看| 日韩精品免费视频一区二区三区 | 99久久精品一区二区三区| 天堂中文最新版在线下载| 高清黄色对白视频在线免费看 | 国产精品久久久久久精品古装| 精品一品国产午夜福利视频| 国产免费一级a男人的天堂| 亚洲综合色惰| 亚洲,一卡二卡三卡| 中文字幕亚洲精品专区| 高清视频免费观看一区二区| 亚洲激情五月婷婷啪啪| 久久久国产一区二区| 在线观看免费高清a一片| 妹子高潮喷水视频| tube8黄色片| 欧美高清成人免费视频www| av在线观看视频网站免费| 最近中文字幕高清免费大全6| 大片免费播放器 马上看| 精品99又大又爽又粗少妇毛片| 亚洲国产日韩一区二区| 亚洲熟女精品中文字幕| 少妇猛男粗大的猛烈进出视频| 欧美 日韩 精品 国产| 欧美+日韩+精品| 国产精品福利在线免费观看| 亚洲情色 制服丝袜| 久久精品久久久久久久性| 亚洲精品一二三| freevideosex欧美| 日韩强制内射视频| 最近2019中文字幕mv第一页| 尾随美女入室| 街头女战士在线观看网站| 国产精品欧美亚洲77777| 亚洲av免费高清在线观看| 超碰97精品在线观看| 成年人免费黄色播放视频 | 精品人妻熟女毛片av久久网站| av网站免费在线观看视频| 国产成人精品无人区| 久久久国产一区二区| 亚洲va在线va天堂va国产| 亚洲内射少妇av| 五月天丁香电影| 国产亚洲av片在线观看秒播厂| 精品熟女少妇av免费看| 中文字幕亚洲精品专区| av线在线观看网站| 欧美日韩一区二区视频在线观看视频在线| 日韩人妻高清精品专区| av一本久久久久| 婷婷色av中文字幕| 国产在线视频一区二区| 最新中文字幕久久久久| 一区二区三区乱码不卡18| 男女无遮挡免费网站观看| 波野结衣二区三区在线| 大码成人一级视频| 成年人午夜在线观看视频| 久久av网站| freevideosex欧美| 一区二区三区四区激情视频| av黄色大香蕉| 亚洲精品aⅴ在线观看| 国产精品一区二区在线不卡| 乱人伦中国视频| 国产精品久久久久久久电影| 蜜臀久久99精品久久宅男| 一区二区av电影网| 一区二区三区乱码不卡18| 午夜免费观看性视频| 亚洲精品,欧美精品| 日本av手机在线免费观看| 韩国av在线不卡| 一个人看视频在线观看www免费| 一区二区三区精品91| 国产综合精华液| 国产精品蜜桃在线观看| 97在线人人人人妻| 亚洲欧美精品自产自拍| 亚洲国产欧美在线一区| 午夜激情福利司机影院| kizo精华| 国产 一区精品| 久久久久人妻精品一区果冻| 国产亚洲一区二区精品| 欧美日本中文国产一区发布| 亚洲欧美成人综合另类久久久| 久久国产亚洲av麻豆专区| 99热全是精品| 99re6热这里在线精品视频| 美女主播在线视频| av一本久久久久| 在线观看www视频免费| 日韩熟女老妇一区二区性免费视频| 又大又黄又爽视频免费| 有码 亚洲区| 国产精品嫩草影院av在线观看| 性色av一级| 久久女婷五月综合色啪小说| 国产男人的电影天堂91| 韩国av在线不卡| 欧美激情极品国产一区二区三区 | 国精品久久久久久国模美| 老女人水多毛片| 在线观看免费日韩欧美大片 | av专区在线播放| 如日韩欧美国产精品一区二区三区 | 国产色婷婷99| 深夜a级毛片| 久久ye,这里只有精品| 97在线人人人人妻| 深夜a级毛片| 人妻系列 视频| 欧美xxⅹ黑人| 美女xxoo啪啪120秒动态图| 一级av片app| 天堂中文最新版在线下载| 国产综合精华液| 乱码一卡2卡4卡精品| 美女大奶头黄色视频| 在线观看美女被高潮喷水网站| 国产乱人偷精品视频| av网站免费在线观看视频| 91精品国产国语对白视频| 欧美人与善性xxx| 国产 一区精品| 一级毛片我不卡| 午夜福利,免费看| 男女国产视频网站| 蜜桃久久精品国产亚洲av| 边亲边吃奶的免费视频| 哪个播放器可以免费观看大片| 国模一区二区三区四区视频| 一本久久精品| 亚洲精品中文字幕在线视频 | 80岁老熟妇乱子伦牲交| 美女大奶头黄色视频| 校园人妻丝袜中文字幕| 欧美老熟妇乱子伦牲交| 亚洲国产欧美在线一区| 欧美97在线视频| 成人国产麻豆网| 狂野欧美白嫩少妇大欣赏| 亚洲真实伦在线观看| 丝袜脚勾引网站| 午夜日本视频在线| 最近2019中文字幕mv第一页| 国产精品国产三级专区第一集| 亚洲国产色片| 国产女主播在线喷水免费视频网站| 久久人人爽av亚洲精品天堂| 国产色爽女视频免费观看| 精品一区二区免费观看| 97精品久久久久久久久久精品| 人妻 亚洲 视频| 人人妻人人澡人人看| 欧美日韩av久久| 国产免费又黄又爽又色| 亚洲av中文av极速乱| 下体分泌物呈黄色| 免费av不卡在线播放| 日韩av免费高清视频| 日本欧美视频一区| 观看av在线不卡| av女优亚洲男人天堂| 亚洲欧美一区二区三区黑人 | 久久久久视频综合| 韩国av在线不卡| 久久免费观看电影| 欧美日韩av久久| 亚洲精品aⅴ在线观看| 一区二区三区免费毛片| 国产成人一区二区在线| 久久久久视频综合| 成年女人在线观看亚洲视频| 亚洲欧洲日产国产| 欧美精品高潮呻吟av久久| 亚洲精品色激情综合| 久久精品国产亚洲av天美| 少妇人妻久久综合中文| 特大巨黑吊av在线直播| 欧美日韩在线观看h| 久久久久国产精品人妻一区二区| a级片在线免费高清观看视频| 国国产精品蜜臀av免费| 国产色爽女视频免费观看| 黑人高潮一二区| 国产91av在线免费观看| 久久久午夜欧美精品| 精品少妇内射三级| kizo精华| 看非洲黑人一级黄片| 最近2019中文字幕mv第一页| 91久久精品电影网| 国产精品嫩草影院av在线观看| 纵有疾风起免费观看全集完整版| 成人无遮挡网站| 欧美xxⅹ黑人| 亚洲va在线va天堂va国产| 天堂中文最新版在线下载| 热re99久久国产66热| 国产伦在线观看视频一区| 热re99久久国产66热| 国产精品一区二区在线观看99|