• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    改進(jìn)深度強(qiáng)化學(xué)習(xí)的室內(nèi)移動(dòng)機(jī)器人路徑規(guī)劃

    2021-11-12 15:18:50郝密密
    關(guān)鍵詞:障礙物深度機(jī)器人

    成 怡,郝密密

    天津工業(yè)大學(xué) 控制科學(xué)與工程學(xué)院,天津300387

    路徑規(guī)劃是移動(dòng)機(jī)器人研究的重要方向,是實(shí)現(xiàn)導(dǎo)航任務(wù)的關(guān)鍵[1],即移動(dòng)機(jī)器人從起始位置到目標(biāo)位置能夠自主探索出一條平滑且無碰撞的路徑軌跡[2]。傳統(tǒng)的路徑規(guī)劃算法有A*算法[3]、人工勢場法[4]以及快速擴(kuò)展隨機(jī)樹法[5]等,這些算法用于解決已知環(huán)境下的路徑規(guī)劃,且容易實(shí)現(xiàn),但機(jī)器人在規(guī)劃路徑時(shí)存在探索能力差的問題。針對傳統(tǒng)算法存在的問題,許多研究者引入了深度強(qiáng)化學(xué)習(xí)算法[6-8],讓機(jī)器人在環(huán)境狀態(tài)中能做出更準(zhǔn)確的運(yùn)動(dòng)方向。深度強(qiáng)化學(xué)習(xí)由深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合,深度學(xué)習(xí)通過感知環(huán)境來獲得目標(biāo)狀態(tài)觀測信息。強(qiáng)化學(xué)習(xí)通過獲取的信息給予動(dòng)作,再結(jié)合獎(jiǎng)勵(lì)判斷動(dòng)作價(jià)值,是智能體與環(huán)境不斷交互試錯(cuò),再利用獎(jiǎng)懲函數(shù)指導(dǎo)動(dòng)作好壞的過程。

    Mnih等[9]提出第一個(gè)深度強(qiáng)化學(xué)習(xí)模型,即深度Q網(wǎng)絡(luò)(DQN),該網(wǎng)絡(luò)模型是將神經(jīng)網(wǎng)絡(luò)和Q-learning相結(jié)合,利用神經(jīng)網(wǎng)絡(luò)代替Q值表解決了Q-learning中的維數(shù)災(zāi)難問題,但在網(wǎng)絡(luò)訓(xùn)練時(shí)收斂速度較慢。Tai等[10]把DQN應(yīng)用到了無模型避障的路徑規(guī)劃中,但存在狀態(tài)-動(dòng)作值過估計(jì)問題,造成移動(dòng)機(jī)器人獲得的獎(jiǎng)勵(lì)稀疏,且規(guī)劃出的路徑并非最優(yōu)。Yu等[11]提出一種基于深度強(qiáng)化學(xué)習(xí)的安全約束月球車端到端的路徑規(guī)劃算法,通過利用課程學(xué)習(xí)的思想,針對不同地形特征的月面環(huán)境對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提高了月球車對月面不同地形的適應(yīng)性。根據(jù)地形的坡度角和當(dāng)前狀態(tài)來預(yù)測月球車的行駛率,設(shè)計(jì)安全獎(jiǎng)勵(lì)函數(shù)作為當(dāng)前狀態(tài)的獎(jiǎng)勵(lì)反饋。徐曉蘇等[12]在Q值初始化的過程中引入了人工勢場,便加快了網(wǎng)絡(luò)的收斂速度,增加了動(dòng)作步長和調(diào)整了機(jī)器人的動(dòng)作方向提高了機(jī)器人規(guī)劃路線的精度,該方法在機(jī)器人進(jìn)行局部路徑規(guī)劃時(shí)效果較好,但在全局路徑規(guī)劃上實(shí)施性不好。

    因此,為了有效解決機(jī)器人探索能力差和獎(jiǎng)勵(lì)稀疏的問題,本文提出一種基于深度圖像信息的改進(jìn)深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃算法,利用Kinect視覺傳感器感知自身周圍的環(huán)境信息,并結(jié)合自身的位置信息和將到達(dá)的目標(biāo)點(diǎn)組成一個(gè)狀態(tài)空間作為網(wǎng)絡(luò)的輸入,以實(shí)際的線速度和角速度作為機(jī)器人下一步動(dòng)作的輸出,且設(shè)計(jì)合理的獎(jiǎng)懲函數(shù),提高了算法的獎(jiǎng)勵(lì)值,改善了環(huán)境狀態(tài)空間的獎(jiǎng)勵(lì)稀疏性。

    1 深度強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)是智能體與環(huán)境交互時(shí),通過“試錯(cuò)”方式得到不同獎(jiǎng)勵(lì)值的過程。如圖1所示為強(qiáng)化學(xué)習(xí)交互過程。Q-learning[13]是一個(gè)值迭代過程,它會(huì)計(jì)算出每個(gè)Q值,在執(zhí)行動(dòng)作時(shí),根據(jù)機(jī)器人所學(xué)的先驗(yàn)知識(shí)更新Q值表。然而,當(dāng)機(jī)器人所處的環(huán)境狀態(tài)變得復(fù)雜,則狀態(tài)-動(dòng)作空間會(huì)變得很大,便帶來了“維數(shù)災(zāi)難”問題,導(dǎo)致模型很難形成或不能計(jì)算,而深度強(qiáng)化學(xué)習(xí)能有效解決此問題。

    圖1 強(qiáng)化學(xué)習(xí)流程圖Fig.1 Reinforcement learning flow chart

    深度強(qiáng)化學(xué)習(xí)(DRL)[14]由深度學(xué)習(xí)(DL)和強(qiáng)化學(xué)習(xí)(RL)兩者相結(jié)合來實(shí)現(xiàn)端到端的學(xué)習(xí),深度學(xué)習(xí)[15]負(fù)責(zé)通過傳感器掃描周圍的環(huán)境信息來感知機(jī)器人當(dāng)前的狀態(tài)信息,而強(qiáng)化學(xué)習(xí)[16]負(fù)責(zé)機(jī)器人對獲取的環(huán)境信息進(jìn)行探索,做出決策,從而實(shí)現(xiàn)機(jī)器人路徑規(guī)劃的智能化需求。

    DQN算法[17]結(jié)合神經(jīng)網(wǎng)絡(luò)和Q-learning,神經(jīng)網(wǎng)絡(luò)以RGB圖像作為輸入,實(shí)現(xiàn)對Q值表的建模,表示所有的狀態(tài)-動(dòng)作值,Q-learning以馬爾科夫決策建模[18],以當(dāng)前狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)、策略、下一步動(dòng)作來表示。DQN通過引入經(jīng)驗(yàn)回放來提高機(jī)器人的樣本關(guān)聯(lián)性和效率利用問題,并通過固定目標(biāo)Q值提高更新的不平穩(wěn)性。DQN包括建立目標(biāo)函數(shù)、目標(biāo)網(wǎng)絡(luò)和引入經(jīng)驗(yàn)回放[19]這三個(gè)步驟:

    (1)目標(biāo)函數(shù)。DQN的目標(biāo)函數(shù)通過Q-learning構(gòu)建,公式如下所示:

    其中,(s,a)表示當(dāng)前的狀態(tài)和動(dòng)作,(s′,a′)表示下一步的狀態(tài)和動(dòng)作,Q′(s,a)表示更新后的狀態(tài)-動(dòng)作值,在狀態(tài)s下,得到動(dòng)作獎(jiǎng)勵(lì)r,并對其進(jìn)行評估。

    目標(biāo)狀態(tài)-動(dòng)作值函數(shù)用貝爾曼方程可表示為:

    其中,y′表示目標(biāo)Q值。

    損失函數(shù)為均方誤差損失函數(shù),公式如下所示:

    其中,θ為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型中訓(xùn)練的權(quán)值參數(shù)。

    (2)目標(biāo)網(wǎng)絡(luò)。DQN通過目標(biāo)網(wǎng)絡(luò)和預(yù)測網(wǎng)絡(luò)來評估當(dāng)前的狀態(tài)-動(dòng)作值函數(shù)。目標(biāo)網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)得到目標(biāo)Q值,利用目標(biāo)Q值來估計(jì)下一時(shí)刻的Q值,以解決Q-learning中Q值表的“維數(shù)災(zāi)難”問題。預(yù)測網(wǎng)絡(luò)使用隨機(jī)梯度下降法更新網(wǎng)絡(luò)權(quán)重△θ,梯度下降算法的公式如下所示:

    (3)經(jīng)驗(yàn)回放。經(jīng)驗(yàn)回放解決了數(shù)據(jù)的樣本關(guān)聯(lián)性和效率利用問題。在機(jī)器人和環(huán)境交互時(shí),可獲得樣本數(shù)據(jù)庫,把樣本數(shù)據(jù)庫存儲(chǔ)到建立的經(jīng)驗(yàn)池中,從經(jīng)驗(yàn)池中隨機(jī)抽取一小部分?jǐn)?shù)據(jù)用于訓(xùn)練樣本,再將訓(xùn)練樣本送入神經(jīng)網(wǎng)絡(luò)中訓(xùn)練。經(jīng)驗(yàn)回放主要起到樣本本身可重復(fù)利用來提高學(xué)習(xí)效率。

    2 改進(jìn)的深度強(qiáng)化學(xué)習(xí)算法

    本文提出了一種基于深度圖像的深度強(qiáng)化學(xué)習(xí)的改進(jìn)算法,該算法是移動(dòng)機(jī)器人通過Kinect傳感器感知周圍環(huán)境狀態(tài)獲取深度圖像信息和目標(biāo)位置信息作為網(wǎng)絡(luò)的輸入,以機(jī)器人的線速度和角速度作為下一步動(dòng)作的輸出,實(shí)現(xiàn)在有障礙物環(huán)境下朝向目標(biāo)點(diǎn)運(yùn)行的過程,從而完成移動(dòng)機(jī)器人的導(dǎo)航任務(wù)。機(jī)器人的主要目標(biāo)是在室內(nèi)未知環(huán)境下能夠自主到達(dá)目標(biāo)點(diǎn)并規(guī)劃出更短的路徑。

    2.1 改進(jìn)算法

    改進(jìn)DQN算法主要分為仿真和訓(xùn)練兩部分,如圖2所示,上面仿真部分說明了強(qiáng)化學(xué)習(xí)過程如何使用深度Q網(wǎng)絡(luò)選擇決策獲得狀態(tài)s和獎(jiǎng)勵(lì)r,下面網(wǎng)絡(luò)訓(xùn)練部分說明了改進(jìn)DQN網(wǎng)絡(luò)優(yōu)化參數(shù)的前向和反向傳播過程。

    圖2 改進(jìn)DQN算法的主要組成部分Fig.2 Main components of improved DQN algorithm

    在仿真環(huán)境中,機(jī)器人把直接采集的深度圖像信息作為訓(xùn)練樣本,再結(jié)合自身所處的環(huán)境狀態(tài)特征和要到達(dá)的目標(biāo)點(diǎn)作為網(wǎng)絡(luò)的輸入,并將當(dāng)前位置下的Q值作為網(wǎng)絡(luò)模型輸出,且利用ε-greedy策略進(jìn)行動(dòng)作選擇,來到達(dá)下一步狀態(tài)。當(dāng)?shù)竭_(dá)下一步狀態(tài)時(shí),計(jì)算出相應(yīng)獎(jiǎng)勵(lì)值r,便可得到一個(gè)完整的數(shù)據(jù)元組(s,a,r,s′),于是將該系列的數(shù)據(jù)存儲(chǔ)到經(jīng)驗(yàn)回放池D中,再從經(jīng)驗(yàn)回放池D中抽取小批量樣本放入神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。其中,機(jī)器人在探索最優(yōu)路徑過程中,從經(jīng)驗(yàn)回放池D中選取獎(jiǎng)勵(lì)值r非常關(guān)鍵,獎(jiǎng)勵(lì)值r決定了機(jī)器人路徑規(guī)劃的好壞程度。機(jī)器人把得到的獎(jiǎng)勵(lì)值r送到優(yōu)化目標(biāo)函數(shù)中進(jìn)行網(wǎng)絡(luò)參數(shù)的更新,一直循環(huán)迭代直到訓(xùn)練完成。如圖3所示為本文算法的模型。

    圖3 改進(jìn)的DQN算法模型Fig.3 Improved DQN algorithm model

    在網(wǎng)絡(luò)訓(xùn)練過程中,若機(jī)器人利用Kinect傳感器識(shí)別出障礙物,則通過改進(jìn)深度強(qiáng)化學(xué)習(xí)算法使機(jī)器人能有效的避開障礙物。否則,機(jī)器人將會(huì)繼續(xù)導(dǎo)航,直到到達(dá)目標(biāo)點(diǎn)。改進(jìn)的深度強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)如下所示。

    算法1基于移動(dòng)機(jī)器人改進(jìn)的深度強(qiáng)化學(xué)習(xí)算法

    2.2 設(shè)計(jì)改進(jìn)的獎(jiǎng)懲函數(shù)

    獎(jiǎng)懲函數(shù)是移動(dòng)機(jī)器人在當(dāng)前狀態(tài)采取某一動(dòng)作并到達(dá)下一狀態(tài)獲得的獎(jiǎng)勵(lì)值,表示當(dāng)前狀態(tài)采取某一動(dòng)作的好壞。在強(qiáng)化學(xué)習(xí)中起到關(guān)鍵作用,決定了智能體的學(xué)習(xí)效率和效果。

    移動(dòng)機(jī)器人在執(zhí)行導(dǎo)航任務(wù)時(shí),要使訓(xùn)練網(wǎng)絡(luò)產(chǎn)生可行的控制策略,給予機(jī)器人正確動(dòng)作。在這一過程中,機(jī)器人與環(huán)境不斷交互來得到反饋信息(獎(jiǎng)勵(lì)值),機(jī)器人接收到反饋信息繼續(xù)與環(huán)境交互,同時(shí)評估將要執(zhí)行的動(dòng)作,從而使機(jī)器人更快地學(xué)習(xí)得到最優(yōu)動(dòng)作策略,根據(jù)動(dòng)作選擇策略設(shè)置合理的獎(jiǎng)懲函數(shù)。機(jī)器人在運(yùn)行過程中碰撞到障礙物會(huì)返回到起始點(diǎn),重新開始探索路徑,若到達(dá)目標(biāo)點(diǎn)則會(huì)停止訓(xùn)練。

    DQN算法的獎(jiǎng)懲函數(shù)定義為:

    其中,v表示線速度,ω表示角速度,dt表示每隔0.2 s循環(huán)訓(xùn)練一圈。

    在運(yùn)行過程中,速度是機(jī)器人行駛的關(guān)鍵因素,速度決定了機(jī)器人獲得獎(jiǎng)勵(lì)值的正負(fù)。在機(jī)器人和環(huán)境交互時(shí),通過設(shè)置獎(jiǎng)勵(lì)函數(shù)獲得獎(jiǎng)勵(lì)值,根據(jù)獎(jiǎng)勵(lì)值評價(jià)機(jī)器人的動(dòng)作好壞,然后機(jī)器人會(huì)積累自身的學(xué)習(xí)經(jīng)驗(yàn),再一一評價(jià)從環(huán)境中獲得的動(dòng)作,進(jìn)而改變動(dòng)作行為使產(chǎn)生的下一步動(dòng)作更準(zhǔn)確。為了使機(jī)器人快速準(zhǔn)確地獲取下一步動(dòng)作,由機(jī)器人的轉(zhuǎn)向角度cos(2vω)和線速度平方的2倍來共同決定獎(jiǎng)勵(lì)值的大小。其中,轉(zhuǎn)向角度設(shè)為cos(2vω)是為了使機(jī)器人得到的轉(zhuǎn)向角度更小,選擇下一步動(dòng)作更準(zhǔn)確,所獲得的獎(jiǎng)勵(lì)值更高。線速度平方的2倍是為了提高機(jī)器人在無障礙的情況下能加快運(yùn)行速度。

    改進(jìn)DQN算法的獎(jiǎng)懲函數(shù)定義為:

    其中,v表示線速度,ω表示角速度。

    由式(6)可知,機(jī)器人獲得的獎(jiǎng)勵(lì)值是由線速度和角速度共同控制的。如表1為機(jī)器人的動(dòng)作值和速度的對應(yīng)關(guān)系。

    表1 機(jī)器人動(dòng)作值和速度指令對應(yīng)表Table 1 Correspondence table of robot action value and speed command

    機(jī)器人依靠自身的經(jīng)驗(yàn)探索學(xué)習(xí),從記憶的動(dòng)作中選擇適應(yīng)環(huán)境的行為。機(jī)器人在運(yùn)行時(shí),根據(jù)不同的情況設(shè)置相應(yīng)的獎(jiǎng)勵(lì)值r,rtarget表示每個(gè)片段(episode)完成之后所有瞬時(shí)獎(jiǎng)勵(lì)值的累加,即到達(dá)目標(biāo)點(diǎn)的總獎(jiǎng)勵(lì)值;rcollision表示機(jī)器人原地旋轉(zhuǎn)或與障礙物發(fā)生碰撞時(shí),會(huì)受到懲罰,獎(jiǎng)勵(lì)值為?10。因此,在訓(xùn)練過程中,每個(gè)學(xué)習(xí)片段(episode)將每隔500步更新一下目標(biāo)網(wǎng)絡(luò)的獎(jiǎng)勵(lì)值。

    3 實(shí)驗(yàn)分析及結(jié)果

    3.1 實(shí)驗(yàn)環(huán)境和參數(shù)配置

    為了實(shí)現(xiàn)移動(dòng)機(jī)器人避障實(shí)驗(yàn),驗(yàn)證本文算法在路徑規(guī)劃中的有效性,并與DQN做了對比實(shí)驗(yàn)。實(shí)驗(yàn)環(huán)境為NVIDIA GTX 2080Ti GPU服務(wù)器,機(jī)器人的操作系統(tǒng)(ROS)[20]和Gazebo[21]完成的。機(jī)器人訓(xùn)練過程是在Gazebo中搭建的仿真平臺(tái)上完成的,且機(jī)器人使用帶有Kinect視覺傳感器的Turtlebot。如圖4所示,圖中的“S”代表機(jī)器人的起始點(diǎn),綠色的圓柱體“G”代表到達(dá)的目標(biāo)點(diǎn)以及各種形狀不同的障礙物組成的仿真環(huán)境。

    圖4 仿真平臺(tái)Fig.4 Simulation platform

    移動(dòng)機(jī)器人利用Kinect視覺傳感器獲取的深度圖像信息和目標(biāo)位置信息作為網(wǎng)絡(luò)的輸入,通過采集的深度圖像提取數(shù)據(jù)信息,即物體與傳感器的距離,再結(jié)合要到達(dá)的目標(biāo)點(diǎn)形成一個(gè)狀態(tài)空間,并以機(jī)器人實(shí)際的動(dòng)作方向作為輸出,機(jī)器人便可實(shí)現(xiàn)導(dǎo)航任務(wù)。在訓(xùn)練過程中,機(jī)器人避開障礙物是關(guān)鍵問題之一,它從起始點(diǎn)開始探索運(yùn)行到達(dá)目標(biāo)點(diǎn)結(jié)束。若檢測不到障礙物,則機(jī)器人就會(huì)繼續(xù)運(yùn)行;若檢測到障礙物,則會(huì)利用改進(jìn)深度強(qiáng)化學(xué)習(xí)算法避開障礙物。當(dāng)機(jī)器人碰撞到障礙物時(shí),機(jī)器人將會(huì)回到起始點(diǎn),重新開始探索。隨著探索次數(shù)的增多,機(jī)器人記憶的動(dòng)作會(huì)逐漸增加,則下一步動(dòng)作的選擇會(huì)更精準(zhǔn)。圖5代表機(jī)器人避開障礙物的過程,圖中的黑色箭頭表示機(jī)器人下一步要做的動(dòng)作方向。圖6為機(jī)器人在行駛的過程中遇到障礙物的深度圖像信息。

    圖5 避開障礙物的過程Fig.5 Process of avoiding obstacles

    圖6 遇到障礙物的深度信息Fig.6 Depth information of obstacles encountered

    機(jī)器人以狀態(tài)Q值作為輸入,動(dòng)作Q值為輸出,便形成了狀態(tài)-動(dòng)作對。若機(jī)器人在運(yùn)行時(shí)碰撞到障礙物,則會(huì)得到負(fù)獎(jiǎng)勵(lì);若機(jī)器人到達(dá)目標(biāo)點(diǎn),則會(huì)得到正獎(jiǎng)勵(lì)。通過獎(jiǎng)懲機(jī)制的方法使機(jī)器人在學(xué)習(xí)過程中避開障礙物而不斷接近目標(biāo)點(diǎn)完成路徑規(guī)劃這一過程。改進(jìn)深度強(qiáng)化學(xué)習(xí)算法的參數(shù)設(shè)置如表2所示。

    表2 參數(shù)設(shè)置Table 2 Parameter settings

    3.2 實(shí)驗(yàn)結(jié)果分析

    本文對DQN算法和改進(jìn)算法利用平均獎(jiǎng)勵(lì)值和損失函數(shù)值做了分析和實(shí)驗(yàn)結(jié)果的對比。如表3列出了DQN、改進(jìn)DQN算法平均獎(jiǎng)勵(lì)值和平均損失函數(shù)值的對比,改進(jìn)DQN的平均獎(jiǎng)勵(lì)值比DQN提高了51.2%,改進(jìn)DQN算法的平均損失函數(shù)值比DQN降低了15.3%。利用平均獎(jiǎng)勵(lì)值評估算法的性能。如圖7所示,黑色線代表DQN算法運(yùn)行得到的平均獎(jiǎng)勵(lì)值變化曲線,紅色線代表改進(jìn)DQN算法運(yùn)行得到的變化曲線,藍(lán)色線代表對改進(jìn)算法進(jìn)行測試得到的變化曲線。當(dāng)獎(jiǎng)勵(lì)值為(?10~0)階段時(shí),在訓(xùn)練初期,機(jī)器人剛開始探索學(xué)習(xí)避障運(yùn)行的過程,且未能對障礙物做出正確的判斷,得到的是負(fù)獎(jiǎng)勵(lì)值。當(dāng)獎(jiǎng)勵(lì)值為(0~20)階段時(shí),訓(xùn)練次數(shù)達(dá)到500,機(jī)器人處于探索學(xué)習(xí)階段,表示機(jī)器人開始識(shí)別并能夠避開部分障礙物,但它仍在和環(huán)境不斷地交互學(xué)習(xí)進(jìn)一步調(diào)整動(dòng)作選擇策略,來獲得相應(yīng)的正獎(jiǎng)勵(lì)值。當(dāng)獎(jiǎng)勵(lì)值為(20~40)階段時(shí),訓(xùn)練次數(shù)在500~2 100時(shí),機(jī)器人在DQN算法和改進(jìn)DQN算法中獲得獎(jiǎng)勵(lì)值都不穩(wěn)定,訓(xùn)練次數(shù)達(dá)到2 100左右,DQN算法獲得的獎(jiǎng)勵(lì)值趨于平衡。當(dāng)獎(jiǎng)勵(lì)值為(40~60)階段時(shí),改進(jìn)算法和測試階段的訓(xùn)練次數(shù)達(dá)到1 500左右平均獎(jiǎng)勵(lì)值趨于穩(wěn)定。測試階段是利用訓(xùn)練的結(jié)果模型在相同環(huán)境中做測試進(jìn)一步驗(yàn)證網(wǎng)絡(luò)的有效性。測試和訓(xùn)練的平均獎(jiǎng)勵(lì)值的遞增趨勢一致。因此,改進(jìn)算法可以縮短網(wǎng)絡(luò)訓(xùn)練時(shí)間,提高平均獎(jiǎng)勵(lì)值,改善了獎(jiǎng)勵(lì)稀疏性,使機(jī)器人規(guī)劃出更短的路徑。

    表3 平均獎(jiǎng)勵(lì)值和平均損失函數(shù)值對比Table 3 Comparison of average reward and average loss function value

    圖7 平均獎(jiǎng)勵(lì)值對比圖Fig.7 Comparison chart of average reward value

    利用損失函數(shù)值評估算法的性能。如圖8所示,黑色線代表DQN算法運(yùn)行得到的損失函數(shù)值變化曲線,紅色線代表改進(jìn)DQN算法運(yùn)行得到的變化曲線,藍(lán)色線代表對改進(jìn)算法進(jìn)行測試得到的變化曲線。在訓(xùn)練初期,Q值的初始化為0,機(jī)器人的學(xué)習(xí)經(jīng)驗(yàn)不足,只能隨機(jī)選取動(dòng)作,導(dǎo)致算法的收斂速度較慢。DQN算法得到的損失函數(shù)值波動(dòng)較大,訓(xùn)練次數(shù)達(dá)到2 500左右,損失函數(shù)值趨于穩(wěn)定。而改進(jìn)算法的損失函數(shù)值波動(dòng)性較小,訓(xùn)練次數(shù)達(dá)到1 000左右,損失函數(shù)值便能很快趨于穩(wěn)定。測試階段的訓(xùn)練次數(shù)達(dá)到1 200左右時(shí),損失函數(shù)值趨于穩(wěn)定。測試和訓(xùn)練的損失函數(shù)值的衰減趨勢一致。因此,改進(jìn)算法具有一定的優(yōu)越性,加快了網(wǎng)絡(luò)的收斂速度。

    圖8 損失函數(shù)值對比圖Fig.8 Comparison chart of loss function value

    3.3 對比分析簡單環(huán)境下的路徑長度

    為了驗(yàn)證改進(jìn)算法的有效性,在簡單環(huán)境中對路徑規(guī)劃做了對比分析。如圖9的(a)和(b)所示,簡單環(huán)境下機(jī)器人運(yùn)行得到的路徑軌跡。圖中,由機(jī)器人的起始點(diǎn)(白色S),機(jī)器人的目標(biāo)點(diǎn)(黑色G)以及障礙物組成。表4列出了機(jī)器人在簡單環(huán)境下利用每種算法運(yùn)行15次取得的平均路徑長度和規(guī)劃的路徑軌跡上避開障礙物的個(gè)數(shù)。改進(jìn)DQN算法的路徑長度比DQN縮短了21.4%。且避開障礙物個(gè)數(shù)比原來增加了一個(gè)。

    圖9 簡單環(huán)境下的路徑軌跡長度比較Fig.9 Comparison of path length in simple environment

    表4 簡單環(huán)境下路徑規(guī)劃算法比較Table 4 Comparison of path planning algorithms in simple environment

    通過對比分析圖9的(a)和(b),可以看出(b)規(guī)劃的路徑軌跡更短,且避開這條路徑軌跡上的障礙物多。圖(a)避開了3個(gè)障礙物,而圖(b)能避開4個(gè)障礙物。因此,改進(jìn)算法的機(jī)器人避障能力更強(qiáng),機(jī)器人有更好的適應(yīng)和學(xué)習(xí)能力,不僅提升了其探索能力,且可以得到更短的路徑。

    3.4 對比分析復(fù)雜環(huán)境下的路徑長度

    復(fù)雜環(huán)境下對路徑規(guī)劃做了兩組對比實(shí)驗(yàn),驗(yàn)證了改進(jìn)算法的可行性。如圖10的(a)和(b)所示,復(fù)雜環(huán)境下機(jī)器人運(yùn)行得到的路徑軌跡。在一個(gè)密閉的環(huán)境中,設(shè)定起始點(diǎn)和目標(biāo)點(diǎn)以及相應(yīng)的障礙物,機(jī)器人從起始點(diǎn)出發(fā)到達(dá)目標(biāo)點(diǎn)結(jié)束,獲得了一條較短的路徑軌跡。通過調(diào)整機(jī)器人的速度設(shè)計(jì)改進(jìn)的獎(jiǎng)勵(lì)函數(shù),獎(jiǎng)勵(lì)函數(shù)主要用于判斷機(jī)器人的動(dòng)作好壞,機(jī)器人根據(jù)獎(jiǎng)勵(lì)函數(shù)和環(huán)境的交互得到獎(jiǎng)勵(lì)值來調(diào)節(jié)其動(dòng)作選擇策略。機(jī)器人會(huì)在訓(xùn)練一圈之后得到狀態(tài)-動(dòng)作對的Q值,動(dòng)作被ε-greedy策略選擇后狀態(tài)會(huì)被固定,機(jī)器人則會(huì)根據(jù)記憶的狀態(tài)-動(dòng)作值運(yùn)行。因此,當(dāng)機(jī)器人探索出一條路徑時(shí),它會(huì)選擇相似的軌跡行駛。表5列出了機(jī)器人在復(fù)雜環(huán)境下利用每種算法運(yùn)行20次取得的平均路徑長度和規(guī)劃的路徑軌跡上避開障礙物的個(gè)數(shù)。改進(jìn)DQN算法的路徑長度比DQN縮短了11.3%。且避開障礙物個(gè)數(shù)比原來增加了兩個(gè)。

    圖10 復(fù)雜環(huán)境下的路徑軌跡長度比較Fig.10 Comparison of path length in complex environment

    表5 復(fù)雜環(huán)境下路徑規(guī)劃算法比較Table 5 Comparison of path planning algorithms in complex environment

    通過比較分析圖10的(a)和(b),DQN、改進(jìn)DQN算法都規(guī)劃出了一條無碰撞的路徑,可以看出圖(b)規(guī)劃的路徑軌跡上避開障礙物較多,圖(a)避開了4個(gè)障礙物,而圖(b)能避開6個(gè)障礙物。圖(b)規(guī)劃的路徑類似一條兩點(diǎn)之間距離最短的軌跡。由此得出,改進(jìn)DQN算法的運(yùn)行軌跡更短,避障能力更強(qiáng),通過對比說明了改進(jìn)DQN算法能夠規(guī)劃出一條更優(yōu)更短的路線。

    如圖11的(a)和(b)所示,調(diào)整了機(jī)器人的起始點(diǎn)和目標(biāo)點(diǎn),機(jī)器人在該復(fù)雜環(huán)境下,利用DQN算法和改進(jìn)算法運(yùn)行得到了不同的路徑軌跡,改進(jìn)算法的路徑明顯比DQN算法運(yùn)行得到的路徑短。進(jìn)一步驗(yàn)證了改進(jìn)算法的可行性。

    圖11 復(fù)雜環(huán)境下運(yùn)行路徑的情況比較Fig.11 Comparison of running paths in complex environment

    4 結(jié)束語

    針對移動(dòng)機(jī)器人在室內(nèi)未知環(huán)境下路徑規(guī)劃時(shí)探索能力差的問題,提出了基于深度圖像信息的深度強(qiáng)化學(xué)習(xí)的改進(jìn)算法。利用Kinect視覺傳感器獲取障礙物的深度圖像信息,再把信息直接輸入到網(wǎng)絡(luò)中,提高了網(wǎng)絡(luò)訓(xùn)練的收斂速度。設(shè)置獎(jiǎng)懲函數(shù)提高了機(jī)器人的獎(jiǎng)勵(lì)值,優(yōu)化了狀態(tài)-動(dòng)作空間解決了環(huán)境狀態(tài)空間獎(jiǎng)勵(lì)稀疏的問題,使機(jī)器人的動(dòng)作選擇更精準(zhǔn)。仿真和實(shí)驗(yàn)結(jié)果表明,通過對比實(shí)驗(yàn)分析了DQN算法和改進(jìn)DQN算法的平均獎(jiǎng)勵(lì)值和損失函數(shù)值,并利用測試階段進(jìn)一步驗(yàn)證了改進(jìn)算法的有效實(shí)施性。改進(jìn)算法不僅提高了機(jī)器人的探索能力,加強(qiáng)了避障能力,且規(guī)劃出的路徑長度更短,驗(yàn)證了其在路徑規(guī)劃上的可行性。

    猜你喜歡
    障礙物深度機(jī)器人
    深度理解一元一次方程
    高低翻越
    SelTrac?CBTC系統(tǒng)中非通信障礙物的設(shè)計(jì)和處理
    深度觀察
    深度觀察
    深度觀察
    機(jī)器人來幫你
    認(rèn)識(shí)機(jī)器人
    機(jī)器人來啦
    認(rèn)識(shí)機(jī)器人
    久久九九热精品免费| 国产精品国产高清国产av| 国产精品久久电影中文字幕| 国产成人aa在线观看| 欧美性感艳星| 免费电影在线观看免费观看| 无遮挡黄片免费观看| 两个人的视频大全免费| 天天一区二区日本电影三级| 免费人成在线观看视频色| 色尼玛亚洲综合影院| 日本撒尿小便嘘嘘汇集6| 两个人视频免费观看高清| 国产精品久久久久久精品电影| av在线蜜桃| 国产黄片美女视频| 一级毛片高清免费大全| 精品久久久久久久久久久久久| 国产成人av教育| 桃红色精品国产亚洲av| 一个人免费在线观看电影| 床上黄色一级片| 日韩欧美一区二区三区在线观看| 日韩成人在线观看一区二区三区| 成人av一区二区三区在线看| 国产免费男女视频| 国产精品野战在线观看| 黑人欧美特级aaaaaa片| 国产精品 欧美亚洲| 欧美中文日本在线观看视频| 狂野欧美白嫩少妇大欣赏| 性色avwww在线观看| 制服丝袜大香蕉在线| 久久久久久国产a免费观看| 国产午夜精品久久久久久一区二区三区 | 久久久久久久午夜电影| 国产私拍福利视频在线观看| 亚洲国产精品sss在线观看| 国产三级中文精品| 国产高潮美女av| 全区人妻精品视频| 免费av不卡在线播放| 欧美日韩瑟瑟在线播放| 国产伦一二天堂av在线观看| 人人妻人人看人人澡| 午夜精品一区二区三区免费看| 国产av一区在线观看免费| 老司机午夜福利在线观看视频| 狂野欧美白嫩少妇大欣赏| 国产欧美日韩一区二区精品| 一边摸一边抽搐一进一小说| 一个人免费在线观看电影| 一个人免费在线观看的高清视频| 十八禁网站免费在线| 免费电影在线观看免费观看| 99精品欧美一区二区三区四区| 日本精品一区二区三区蜜桃| 精品人妻1区二区| 麻豆成人av在线观看| 一个人看视频在线观看www免费 | 国产精品av视频在线免费观看| 2021天堂中文幕一二区在线观| 欧美日韩黄片免| 99视频精品全部免费 在线| 国产精品99久久99久久久不卡| 欧美日韩瑟瑟在线播放| 免费看光身美女| 欧美乱码精品一区二区三区| 天堂av国产一区二区熟女人妻| 99热精品在线国产| 看免费av毛片| 国产色爽女视频免费观看| 天堂影院成人在线观看| 蜜桃久久精品国产亚洲av| 精品午夜福利视频在线观看一区| 国产单亲对白刺激| xxxwww97欧美| 桃色一区二区三区在线观看| 久99久视频精品免费| 给我免费播放毛片高清在线观看| 亚洲五月婷婷丁香| 性色avwww在线观看| 国产精品 国内视频| 观看美女的网站| 亚洲av第一区精品v没综合| 久久久久久久午夜电影| 十八禁网站免费在线| 久久久久久久久久黄片| 亚洲激情在线av| 国产主播在线观看一区二区| 在线观看一区二区三区| 中文字幕人成人乱码亚洲影| 少妇丰满av| eeuss影院久久| 草草在线视频免费看| 国产免费av片在线观看野外av| 91麻豆精品激情在线观看国产| 久久婷婷人人爽人人干人人爱| 久久亚洲精品不卡| 婷婷六月久久综合丁香| 国产精品久久久人人做人人爽| 国产高清激情床上av| 香蕉av资源在线| 91麻豆精品激情在线观看国产| 久久精品国产亚洲av香蕉五月| 99久久精品热视频| 国产私拍福利视频在线观看| 久久中文看片网| 岛国视频午夜一区免费看| 欧美黄色片欧美黄色片| 国产私拍福利视频在线观看| 高清日韩中文字幕在线| 国产私拍福利视频在线观看| 美女高潮喷水抽搐中文字幕| 九色成人免费人妻av| 19禁男女啪啪无遮挡网站| av天堂在线播放| 成人特级黄色片久久久久久久| 岛国在线观看网站| 蜜桃久久精品国产亚洲av| 美女高潮的动态| 97超级碰碰碰精品色视频在线观看| 午夜精品在线福利| 免费人成视频x8x8入口观看| 狠狠狠狠99中文字幕| www.999成人在线观看| 在线免费观看的www视频| 丁香欧美五月| 日韩成人在线观看一区二区三区| 久久欧美精品欧美久久欧美| 色哟哟哟哟哟哟| 亚洲精品一卡2卡三卡4卡5卡| 伊人久久精品亚洲午夜| 久久精品国产综合久久久| 99精品在免费线老司机午夜| 国产色婷婷99| 天堂影院成人在线观看| 亚洲人成网站在线播| 狂野欧美激情性xxxx| 亚洲av电影不卡..在线观看| 欧美日韩亚洲国产一区二区在线观看| 精品99又大又爽又粗少妇毛片 | 身体一侧抽搐| av中文乱码字幕在线| 日韩精品青青久久久久久| 老熟妇仑乱视频hdxx| 欧美一区二区精品小视频在线| 欧美日韩黄片免| 麻豆久久精品国产亚洲av| 国产99白浆流出| 一进一出抽搐gif免费好疼| 老熟妇仑乱视频hdxx| 午夜影院日韩av| av欧美777| 免费av毛片视频| 香蕉av资源在线| 亚洲国产欧洲综合997久久,| 天堂√8在线中文| 国产精品日韩av在线免费观看| 久久久久久国产a免费观看| 免费看美女性在线毛片视频| 在线观看午夜福利视频| 午夜精品在线福利| 两人在一起打扑克的视频| 特大巨黑吊av在线直播| 高清在线国产一区| 精品久久久久久久久久免费视频| 美女被艹到高潮喷水动态| 好看av亚洲va欧美ⅴa在| 欧美乱码精品一区二区三区| 网址你懂的国产日韩在线| 国产视频一区二区在线看| 一区二区三区高清视频在线| 亚洲自拍偷在线| 久久这里只有精品中国| 免费高清视频大片| 中文字幕熟女人妻在线| 国产精品自产拍在线观看55亚洲| av视频在线观看入口| 日韩高清综合在线| 国产真实乱freesex| 美女高潮的动态| 日本在线视频免费播放| 午夜精品一区二区三区免费看| 国产亚洲精品一区二区www| 少妇高潮的动态图| 两个人的视频大全免费| 婷婷精品国产亚洲av在线| 一区福利在线观看| 成年女人永久免费观看视频| 嫩草影院精品99| 亚洲五月天丁香| 一级作爱视频免费观看| 精品久久久久久成人av| 中文字幕久久专区| 成人永久免费在线观看视频| 全区人妻精品视频| 国产成人系列免费观看| 久久中文看片网| 免费看美女性在线毛片视频| 高清毛片免费观看视频网站| 非洲黑人性xxxx精品又粗又长| 精品久久久久久久久久久久久| 久久精品国产综合久久久| 精品不卡国产一区二区三区| 午夜福利在线在线| 午夜免费观看网址| 久久精品综合一区二区三区| 亚洲黑人精品在线| 黄色女人牲交| av在线蜜桃| 51午夜福利影视在线观看| 国产熟女xx| 欧美激情久久久久久爽电影| 天堂av国产一区二区熟女人妻| 欧美日韩亚洲国产一区二区在线观看| 国产淫片久久久久久久久 | 精品福利观看| 动漫黄色视频在线观看| 午夜两性在线视频| 国产高清视频在线播放一区| 午夜免费成人在线视频| 日本免费一区二区三区高清不卡| 一进一出抽搐gif免费好疼| 国产爱豆传媒在线观看| 欧美+亚洲+日韩+国产| 日韩欧美精品v在线| 一a级毛片在线观看| 国产蜜桃级精品一区二区三区| 色吧在线观看| 黄色女人牲交| 在线免费观看的www视频| 成人特级av手机在线观看| 国产精品自产拍在线观看55亚洲| 一个人免费在线观看电影| 99国产精品一区二区蜜桃av| 天天躁日日操中文字幕| 男插女下体视频免费在线播放| 亚洲国产色片| 国产日本99.免费观看| 亚洲人成网站在线播| 久久人妻av系列| 欧美最黄视频在线播放免费| 久久久久国产精品人妻aⅴ院| 波野结衣二区三区在线 | 国产精品国产高清国产av| 欧美日韩瑟瑟在线播放| 欧美最新免费一区二区三区 | bbb黄色大片| 午夜激情福利司机影院| 夜夜夜夜夜久久久久| 男女那种视频在线观看| 无限看片的www在线观看| 99国产精品一区二区三区| av专区在线播放| 午夜视频国产福利| 亚洲av中文字字幕乱码综合| 精品久久久久久久久久免费视频| 黑人欧美特级aaaaaa片| 国产伦精品一区二区三区四那| 日本三级黄在线观看| 亚洲一区高清亚洲精品| 国产又黄又爽又无遮挡在线| 国内精品久久久久精免费| 成人精品一区二区免费| 久久久久免费精品人妻一区二区| 久久精品亚洲精品国产色婷小说| 亚洲美女视频黄频| 欧美+亚洲+日韩+国产| 波多野结衣高清作品| 亚洲av第一区精品v没综合| 欧美色视频一区免费| 精品久久久久久久久久久久久| 91在线观看av| 好男人电影高清在线观看| 高清日韩中文字幕在线| 香蕉丝袜av| 国产美女午夜福利| 日韩大尺度精品在线看网址| 精品福利观看| 老熟妇仑乱视频hdxx| 亚洲欧美日韩无卡精品| 88av欧美| 日本a在线网址| 国产亚洲精品久久久com| 国产中年淑女户外野战色| 国产久久久一区二区三区| 精品国内亚洲2022精品成人| 久久久久国产精品人妻aⅴ院| 午夜福利在线观看免费完整高清在 | 性欧美人与动物交配| 成人18禁在线播放| a级一级毛片免费在线观看| 老熟妇乱子伦视频在线观看| 久99久视频精品免费| 亚洲久久久久久中文字幕| 国产av麻豆久久久久久久| 一区二区三区国产精品乱码| 色老头精品视频在线观看| 三级国产精品欧美在线观看| 色吧在线观看| 国产成人影院久久av| 很黄的视频免费| 两个人看的免费小视频| 国产探花极品一区二区| 神马国产精品三级电影在线观看| 91av网一区二区| 一个人免费在线观看电影| 午夜精品久久久久久毛片777| 亚洲男人的天堂狠狠| 中文字幕高清在线视频| 老熟妇乱子伦视频在线观看| 欧美一区二区精品小视频在线| 亚洲真实伦在线观看| 色吧在线观看| 天天躁日日操中文字幕| e午夜精品久久久久久久| 中文在线观看免费www的网站| 国产午夜精品论理片| 又紧又爽又黄一区二区| 国内揄拍国产精品人妻在线| 叶爱在线成人免费视频播放| 色精品久久人妻99蜜桃| 18禁黄网站禁片午夜丰满| 男女那种视频在线观看| 久久久久久人人人人人| 亚洲熟妇熟女久久| 免费看日本二区| 中文亚洲av片在线观看爽| 十八禁网站免费在线| 黄色片一级片一级黄色片| 日韩欧美在线乱码| av天堂在线播放| 岛国在线免费视频观看| 精品99又大又爽又粗少妇毛片 | 国内毛片毛片毛片毛片毛片| 国产亚洲欧美98| 三级男女做爰猛烈吃奶摸视频| 午夜免费观看网址| 国产精品美女特级片免费视频播放器| 18+在线观看网站| 97碰自拍视频| 国产高清视频在线观看网站| 午夜福利在线观看吧| 久久久久精品国产欧美久久久| 色老头精品视频在线观看| 男女午夜视频在线观看| 日韩欧美一区二区三区在线观看| 一个人观看的视频www高清免费观看| 99久国产av精品| 中文亚洲av片在线观看爽| 亚洲av成人av| 中国美女看黄片| 国产精品永久免费网站| 欧美日韩黄片免| 久久精品国产自在天天线| 狠狠狠狠99中文字幕| 久久久国产成人精品二区| 国产亚洲精品综合一区在线观看| 欧美一区二区精品小视频在线| 中文字幕熟女人妻在线| 久99久视频精品免费| 国产精品一区二区免费欧美| 女同久久另类99精品国产91| 91av网一区二区| 天天躁日日操中文字幕| 少妇人妻精品综合一区二区 | 亚洲av五月六月丁香网| 国产成人系列免费观看| 一夜夜www| 国产精品亚洲av一区麻豆| 欧美日韩精品网址| 国产真人三级小视频在线观看| а√天堂www在线а√下载| av片东京热男人的天堂| 国产亚洲精品av在线| 亚洲美女黄片视频| 免费观看人在逋| 久久草成人影院| 国产成+人综合+亚洲专区| 亚洲美女黄片视频| 欧美一区二区亚洲| 又爽又黄无遮挡网站| 欧美乱色亚洲激情| 人人妻,人人澡人人爽秒播| 精品久久久久久久毛片微露脸| 无人区码免费观看不卡| 亚洲国产欧美网| 欧美bdsm另类| 最近最新中文字幕大全免费视频| 狂野欧美白嫩少妇大欣赏| 99精品在免费线老司机午夜| 亚洲国产高清在线一区二区三| 日韩欧美一区二区三区在线观看| 国产精品久久视频播放| 最近最新中文字幕大全电影3| 人妻夜夜爽99麻豆av| 欧美黄色片欧美黄色片| 中国美女看黄片| 亚洲在线自拍视频| 国产免费一级a男人的天堂| 国产一区二区亚洲精品在线观看| 欧美乱妇无乱码| 亚洲av成人精品一区久久| 日本黄色视频三级网站网址| 五月玫瑰六月丁香| 亚洲人与动物交配视频| 日本熟妇午夜| 一进一出好大好爽视频| 成人性生交大片免费视频hd| 亚洲一区二区三区不卡视频| 一区福利在线观看| 免费观看的影片在线观看| 18+在线观看网站| 久久精品夜夜夜夜夜久久蜜豆| 一区二区三区免费毛片| 国产精品永久免费网站| 国产免费一级a男人的天堂| 18禁在线播放成人免费| 在线国产一区二区在线| 午夜福利18| 久久久色成人| 香蕉久久夜色| 丰满人妻一区二区三区视频av | 欧美丝袜亚洲另类 | 超碰av人人做人人爽久久 | 国产精品99久久99久久久不卡| 国产成年人精品一区二区| 国产淫片久久久久久久久 | 熟女人妻精品中文字幕| 特级一级黄色大片| 国产精品三级大全| 午夜福利成人在线免费观看| 国产99白浆流出| 最近最新中文字幕大全免费视频| 中出人妻视频一区二区| 成人欧美大片| 久久精品夜夜夜夜夜久久蜜豆| 日韩亚洲欧美综合| 国产成+人综合+亚洲专区| 国产精品免费一区二区三区在线| 老司机午夜十八禁免费视频| 国产精品久久久久久久电影 | 久久精品国产亚洲av涩爱 | 亚洲乱码一区二区免费版| 青草久久国产| 国产精品99久久99久久久不卡| 免费大片18禁| 国产伦精品一区二区三区四那| 岛国视频午夜一区免费看| 国产精品久久久久久久久免 | 亚洲无线观看免费| 免费电影在线观看免费观看| 亚洲人成网站在线播| 神马国产精品三级电影在线观看| 青草久久国产| 免费av不卡在线播放| 天天添夜夜摸| 国产高清三级在线| 精品国产美女av久久久久小说| 亚洲一区高清亚洲精品| 好男人电影高清在线观看| 高清毛片免费观看视频网站| 成人高潮视频无遮挡免费网站| 久久久国产精品麻豆| 国产高清三级在线| 久久精品国产自在天天线| 免费在线观看亚洲国产| 精品一区二区三区视频在线观看免费| 久久久久久久精品吃奶| 亚洲国产日韩欧美精品在线观看 | 国产av一区在线观看免费| 一级a爱片免费观看的视频| 别揉我奶头~嗯~啊~动态视频| 国产精品99久久99久久久不卡| 在线观看美女被高潮喷水网站 | 无人区码免费观看不卡| 亚洲中文字幕一区二区三区有码在线看| 久久久久久久精品吃奶| 香蕉久久夜色| 综合色av麻豆| 夜夜躁狠狠躁天天躁| 婷婷六月久久综合丁香| 99热这里只有精品一区| 久久精品国产自在天天线| 欧美一级毛片孕妇| 99国产极品粉嫩在线观看| 成人性生交大片免费视频hd| 亚洲 欧美 日韩 在线 免费| 女人十人毛片免费观看3o分钟| 中文资源天堂在线| 国产高清视频在线观看网站| 欧美日韩亚洲国产一区二区在线观看| 村上凉子中文字幕在线| 毛片女人毛片| 国产视频一区二区在线看| 少妇裸体淫交视频免费看高清| 亚洲在线观看片| 欧美午夜高清在线| 国产精品久久久久久久久免 | 香蕉久久夜色| 老汉色av国产亚洲站长工具| 亚洲天堂国产精品一区在线| 色综合亚洲欧美另类图片| 99久久成人亚洲精品观看| 国产蜜桃级精品一区二区三区| 高清在线国产一区| 免费av毛片视频| 老司机福利观看| 人人妻,人人澡人人爽秒播| 日韩有码中文字幕| 久久精品91蜜桃| 久久亚洲真实| 国产精品99久久99久久久不卡| 亚洲av一区综合| 看黄色毛片网站| 色吧在线观看| 久久伊人香网站| 啦啦啦免费观看视频1| 中出人妻视频一区二区| 91字幕亚洲| 真人一进一出gif抽搐免费| 亚洲人成网站在线播放欧美日韩| 亚洲精品久久国产高清桃花| 激情在线观看视频在线高清| 观看美女的网站| 国产伦精品一区二区三区四那| 精品国产美女av久久久久小说| av片东京热男人的天堂| 91久久精品电影网| 一本一本综合久久| 婷婷精品国产亚洲av| 19禁男女啪啪无遮挡网站| 日本在线视频免费播放| 亚洲自拍偷在线| 99热6这里只有精品| 嫩草影视91久久| 青草久久国产| 国产黄片美女视频| 极品教师在线免费播放| 天堂网av新在线| 91麻豆精品激情在线观看国产| 国产v大片淫在线免费观看| 国内精品美女久久久久久| 91久久精品国产一区二区成人 | 在线十欧美十亚洲十日本专区| 天堂动漫精品| 日韩欧美在线二视频| 欧美日本亚洲视频在线播放| 国内精品久久久久久久电影| 亚洲一区二区三区色噜噜| 欧美色视频一区免费| 亚洲专区中文字幕在线| 中文字幕精品亚洲无线码一区| av天堂在线播放| www国产在线视频色| 国内揄拍国产精品人妻在线| 国产精品久久电影中文字幕| 亚洲成人精品中文字幕电影| 少妇人妻精品综合一区二区 | 一a级毛片在线观看| 国产亚洲欧美98| 久久欧美精品欧美久久欧美| 99精品久久久久人妻精品| 麻豆成人av在线观看| 搡老妇女老女人老熟妇| 免费av观看视频| 99在线人妻在线中文字幕| 国产 一区 欧美 日韩| 五月伊人婷婷丁香| 很黄的视频免费| 久久精品人妻少妇| 欧美色视频一区免费| 国产一区二区三区视频了| 在线观看午夜福利视频| 亚洲色图av天堂| 制服丝袜大香蕉在线| 9191精品国产免费久久| 有码 亚洲区| 午夜精品一区二区三区免费看| 免费av毛片视频| 国产精品永久免费网站| eeuss影院久久| 欧美丝袜亚洲另类 | 午夜亚洲福利在线播放| 在线播放无遮挡| 精品久久久久久久毛片微露脸| 日日摸夜夜添夜夜添小说| 国产成人福利小说| 免费在线观看日本一区| 99精品欧美一区二区三区四区| 国产综合懂色| 色吧在线观看| 最近最新中文字幕大全电影3| 黄色女人牲交| 亚洲精品乱码久久久v下载方式 | 久久九九热精品免费| 午夜两性在线视频| 欧美乱妇无乱码| 成人av一区二区三区在线看| 久久性视频一级片| 国产极品精品免费视频能看的| 国产亚洲av嫩草精品影院| 国产亚洲精品久久久久久毛片| a在线观看视频网站| 中文亚洲av片在线观看爽| 黄片大片在线免费观看| 女同久久另类99精品国产91| 成人无遮挡网站| 在线观看66精品国产| 一个人观看的视频www高清免费观看| 757午夜福利合集在线观看| 亚洲av第一区精品v没综合| 国产探花极品一区二区| 男女之事视频高清在线观看|