• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于啟發(fā)式強化學(xué)習(xí)的AGV路徑規(guī)劃

    2021-08-05 07:47:26唐恒亮唐滋芳董晨剛尹棋正海秋茹
    關(guān)鍵詞:規(guī)劃動作智能

    唐恒亮,唐滋芳,董晨剛,尹棋正,海秋茹

    (北京物資學(xué)院信息學(xué)院,北京 101149)

    隨著智能化與無人化科技的快速發(fā)展,自動引導(dǎo)小車(automated guided vehicle,AGV)在智能倉儲中的應(yīng)用愈加廣泛.AGV路徑規(guī)劃是指在最短時間、最短路徑和最小能耗的指標(biāo)下,為AGV規(guī)劃出一條從任務(wù)起點到任務(wù)終點的無障礙最優(yōu)路徑.目前,常用于AGV路徑規(guī)劃的算法有人工勢場法、A*算法、遺傳算法、蟻群算法、神經(jīng)網(wǎng)絡(luò)算法和強化學(xué)習(xí)算法等,這些算法都存在各自的優(yōu)勢,但在目前的復(fù)雜環(huán)境下也存在靈活性不高、收斂速度慢、易陷入局部最優(yōu)解等問題.為優(yōu)化這些問題,相關(guān)的學(xué)者一直在科研的道路上前赴后繼.

    用于AGV路徑規(guī)劃的傳統(tǒng)算法主要有A*算法、Dijkstra算法、人工勢場法和模擬退火法等.趙曉等[1]結(jié)合跳點搜索算法改進A*算法,讓跳點替換Openlist和Closelist中的不必要節(jié)點,簡化了計算,縮短了尋徑時間;針對A*算法逐個檢查相鄰節(jié)點從而增加處理時間的問題,Guruji等[2]改進了A*算法,在碰撞階段和碰撞過程之前計算目標(biāo)函數(shù),減少了處理時間.賀麗娜等[3]將Dijkstra算法和時間窗原理結(jié)合起來順序規(guī)劃每個AGV的路徑,能夠有效避免死鎖與碰撞.人工勢場法結(jié)構(gòu)簡單,但對周圍環(huán)境感知較弱,易陷入局部最優(yōu)解且目標(biāo)不可達.因此,Lazarowska[4]提出了離散化人工勢場算法,修改無沖突路徑以獲得更平滑和更短的路徑;Zhang[5]針對傳統(tǒng)人工勢場法,將智能體的運動方向作為控制變量,解決了路徑搖擺的問題.模擬退火算法存在收斂速度慢,全局搜索能力弱的問題.Issam等[6]結(jié)合模擬退火與禁忌搜索算法,加快了收斂速度且獲得了更精確的規(guī)劃路徑;鞏敦衛(wèi)等[7]在模擬退火算法的基礎(chǔ)上引入了脫障算子和一致尋優(yōu)算子,提高了全局搜索能力.傳統(tǒng)算法雖然能規(guī)劃出完整路徑,但全局搜索與學(xué)習(xí)能力確實不及智能算法.

    用于AGV路徑規(guī)劃的智能算法主要有人工神經(jīng)網(wǎng)絡(luò)算法、遺傳算法、蟻群算法和粒子群算法等.人工神經(jīng)網(wǎng)絡(luò)算法能夠自學(xué)習(xí)、自組織、自適應(yīng),靈活性很強.Singh等[8]設(shè)計了4層神經(jīng)網(wǎng)絡(luò)且通過反向傳播算法來訓(xùn)練網(wǎng)絡(luò)使得機器人在避開靜態(tài)障礙物方面取得明顯成效;Oscar等[9]為完善規(guī)劃路徑多項指標(biāo),設(shè)計了多目標(biāo)遺傳算法(multiple objective genetic algorithms,MOGA);王功亮等[10]在適應(yīng)度函數(shù)中添加轉(zhuǎn)彎角度控制因子,將路徑最短和轉(zhuǎn)彎角度作為適應(yīng)度函數(shù)的影響因子,并證明了改進結(jié)果的有效性.蟻群算法在路徑規(guī)劃中存在前期路徑有效性差且易陷入局部極小值的問題.Stutzle等[11]提出了最大最小螞蟻系統(tǒng)(max-min ant system,MMAS),限制了路徑上信息素的最大和最小值,可在一定程度上避免陷入局部最優(yōu)解;楊洋等[12]提出了基于彈性時間窗和改進蟻群算法的多AGV避碰路徑優(yōu)化策略,改進了傳統(tǒng)蟻群算法的啟發(fā)式信息和信息素更新策略,提出了AGV任務(wù)優(yōu)先級排序并改進沖突解決策略.粒子群算法在路徑規(guī)劃中易陷入局部極小點,收斂速度慢.Tang等[13]提出一種隨機擾動自適應(yīng)粒子群算法,通過微小擾動幫助粒子跳出局部極小點;Li等[14]將路徑規(guī)劃問題轉(zhuǎn)化為考慮路徑長度、碰撞風(fēng)險程度和平滑度的多目標(biāo)優(yōu)化問題,在算法中引入自適應(yīng)機制來選擇最合適的搜索策略.智能搜索算法易陷入局部最小值且避障困難、學(xué)習(xí)效率低,在實際應(yīng)用中效果不及強化學(xué)習(xí)算法.

    用于AGV路徑規(guī)劃的強化學(xué)習(xí)算法主要包括值函數(shù)法和直接策略搜索法[15].Q-learning算法是典型的、最受研究者青睞的基于值函數(shù)的強化學(xué)習(xí)算法,它使AGV具有自學(xué)習(xí)的能力[16],但在動態(tài)連續(xù)環(huán)境中,由于數(shù)據(jù)量較大導(dǎo)致Q值表存儲空間不足,存在維數(shù)災(zāi)難問題,并且在沒有先驗知識的情況下,算法的學(xué)習(xí)效率較低.Zhang等[17]在訓(xùn)練網(wǎng)絡(luò)中引入貪婪搜索因子,彌補了沒有先驗知識的不足,提高了Q-learning算法的學(xué)習(xí)效率.Fakoor等[18]將模糊邏輯引入到強化學(xué)習(xí)算法中求解路徑規(guī)劃問題.于乃功等[19]提出了一種Q值表設(shè)計方法,并設(shè)計了適用于連續(xù)環(huán)境的R值和動作,實現(xiàn)了Q-learning算法的動態(tài)避障.張福海等[20]通過將障礙物與方位信息離散成有限個狀態(tài),從而設(shè)計環(huán)境模型與狀態(tài)空間數(shù)目,同時使用連續(xù)報酬函數(shù)使算法的訓(xùn)練效率提高.為解決強化學(xué)習(xí)在路徑規(guī)劃中存在路徑平滑度差和收斂速度慢的問題,徐曉蘇等[21]提出在Q值初始化中加入人工勢場來加快收斂速度,同時在狀態(tài)集中增加方向因素使路徑更加平滑,但沒有涉及AGV如何處理障礙的問題.對此衛(wèi)玉梁等[22]用徑向基函數(shù)網(wǎng)絡(luò)(radial basis function,RBF)逼近Q-learning算法的動作值函數(shù),實現(xiàn)了AGV在行駛環(huán)境中的路障規(guī)避.強化學(xué)習(xí)算法的全局搜索與學(xué)習(xí)能力比傳統(tǒng)算法與智能算法強,但也存在收斂速度慢、引導(dǎo)不足導(dǎo)致學(xué)習(xí)效率低等問題.

    針對上述傳統(tǒng)算法、智能算法與強化學(xué)習(xí)算法在AGV路徑規(guī)劃中收斂速度慢、學(xué)習(xí)效率低等問題,本文基于強化學(xué)習(xí)中的多步Q-learning算法,即Q(λ)算法,引入了啟發(fā)式獎勵函數(shù)與動作選擇策略,以提升傳統(tǒng)強化學(xué)習(xí)算法學(xué)習(xí)效率和收斂速度.利用啟發(fā)式強化學(xué)習(xí)算法結(jié)合障礙地圖環(huán)境,使智能體在不需要任何先驗知識的前提下,通過訓(xùn)練不斷調(diào)整自身行為,從而實現(xiàn)高效的路徑規(guī)劃.

    1 強化學(xué)習(xí)路徑規(guī)劃算法總體思路

    首先,采用柵格法對地圖環(huán)境進行建模,用二維坐標(biāo)表示地圖中各個點的位置,并在地圖中設(shè)置障礙物.其次,分別利用傳統(tǒng)Q(λ)算法和改進的Q(λ)算法在地圖環(huán)境中進行訓(xùn)練學(xué)習(xí),通過不斷試錯與行為調(diào)整后,得出各算法的訓(xùn)練模型.然后,根據(jù)模型,分別再用傳統(tǒng)的與改進的Q(λ)算法在相同的地圖環(huán)境中進行自主學(xué)習(xí),得出最終的規(guī)劃路徑.重復(fù)實驗20次,同時記錄每個算法的探索次數(shù)、路徑總長度、路徑規(guī)劃完成時間以及路徑總轉(zhuǎn)角,以這些數(shù)據(jù)指標(biāo)來判斷改進后的Q(λ)算法是否比傳統(tǒng)的Q(λ)算法存在一定的優(yōu)勢.

    改進的啟發(fā)式Q(λ)算法在路徑規(guī)劃時,先設(shè)置初始參數(shù),通過啟發(fā)式獎勵函數(shù)實現(xiàn)對智能體每一步動作的持續(xù)性即時獎勵,讓智能體能夠在即時的持續(xù)獎勵中快速學(xué)習(xí)好的動作,提升算法收斂效率.其次,根據(jù)啟發(fā)式獎勵函數(shù)設(shè)計得到連續(xù)的Q值表后,針對ε-greedy探索策略,引入調(diào)和函數(shù)實現(xiàn)啟發(fā)式動作選擇策略,使得智能體能夠弱化無價值的行為,強化高收益的行為,智慧地選擇并執(zhí)行高回報的動作,從而減少不必要的探索行為,加快尋徑速度.本文強化學(xué)習(xí)路徑規(guī)劃問題的總體思路見圖1.

    圖1 強化學(xué)習(xí)路徑規(guī)劃總體思路Fig.1 General idea of the reinforcement learning path planning

    2 傳統(tǒng)Q(λ)算法

    強化學(xué)習(xí)算法中,智能體經(jīng)過不斷的更新迭代,與周圍環(huán)境信息進行交互和作用,并依據(jù)環(huán)境信息進行自主的適應(yīng)和調(diào)整,實現(xiàn)最大化獎勵.獲得累積最大化獎勵所對應(yīng)的動作選擇策略構(gòu)成智能體的最佳動作策略集.在實際的強化學(xué)習(xí)進程中,因為環(huán)境給予的信息畢竟有限,所以智能體必須在利用已有經(jīng)驗和知識的基礎(chǔ)上,通過自身和環(huán)境的持續(xù)交互以及試錯來進行學(xué)習(xí),傳統(tǒng)的強化學(xué)習(xí)框架如圖2所示.

    圖2 強化學(xué)習(xí)基本框圖Fig.2 Basic diagram of reinforcement learning

    2.1 算法簡介

    由Watkins[23]提出的Q-learning算法實施步驟較為簡便,具有較強的擴展性和適應(yīng)性,同時不會受模型的干擾和影響,一直備受諸多學(xué)者的青睞.但在傳統(tǒng)的Q-learning算法中,由于其數(shù)據(jù)的傳輸過程會有所滯后,算法每一次更新迭代都要進行整個過程的備份,相對來說比較繁復(fù),收斂速度慢.針對此問題,在參考時間差分[24](TD(λ))思想的基礎(chǔ)上,Q(λ)算法是在Q學(xué)習(xí)基礎(chǔ)上提出的多步Q學(xué)習(xí)算法.

    Q(λ)算法的思想主要來源于TD(λ)算法,核心與TD(λ)算法相類似,在原先的Q(λ)算法中首次應(yīng)用了資格跡機制[25],使系統(tǒng)會自動對智能體訪問的狀態(tài)進行標(biāo)識.Q(λ)算法在狀態(tài)s執(zhí)行動作a的價值函數(shù)迭代公式為

    Q(s,a)=Q(s,a)+αδe(s,a)

    (1)

    式中:α為學(xué)習(xí)率;δ為Q值增量,即

    (2)

    式中:γ為折扣因子,一般取值為0.9;r為在不同情況下狀態(tài)s采取動作a對應(yīng)的獎勵,即

    (3)

    式中m、n為正數(shù).

    (4)

    式中:e(s,a)為資格跡;λ為學(xué)習(xí)步長.

    最終輸出使價值函數(shù)最大化的最優(yōu)策略為

    (5)

    2.2 算法優(yōu)缺點

    Q(λ)算法結(jié)合了Q-learning和TD(λ)回報思想,利用將來無限多步的信息更新當(dāng)前Q函數(shù),并給出了基于資格跡的實現(xiàn)算法.Q(λ)算法主要依據(jù)狀態(tài)對應(yīng)的回報值選取相應(yīng)動作,該查詢二維表的方式存在以下不足:

    1)Q(λ)算法要對狀態(tài)及動作的Q值和相應(yīng)的資格跡矩陣進行更新,當(dāng)狀態(tài)及動作空間規(guī)模很大時,計算量也很大,使得算法學(xué)習(xí)效率不高.

    2)智能體在最初開始學(xué)習(xí)的過程中,對環(huán)境的認(rèn)知是一片空白,不清楚什么動作是最佳策略.這時,如果獎勵反饋是離散的,那么勢必會使智能體在很長一段時間里處于任意狀態(tài),會浪費大量時間.

    3 Q(λ)算法改進

    針對Q(λ)算法存在學(xué)習(xí)效率不高、收斂速度慢、動作選擇不穩(wěn)定的問題,本文結(jié)合啟發(fā)式強化學(xué)習(xí)算法,做了如下2個改進:

    1)設(shè)計啟發(fā)式獎勵函數(shù),引入啟發(fā)因子D和E,根據(jù)不同狀態(tài)與目標(biāo)狀態(tài)距離遠(yuǎn)近設(shè)計不同獎勵值,為每一步動作計算生成不同獎勵,得到持續(xù)獎勵反饋,降低智能體的無效探索.

    2)在傳統(tǒng)動作選擇策略的基礎(chǔ)上增設(shè)調(diào)和函數(shù)G(st)以強化引導(dǎo)智能體的動作選擇方式,使智能體更趨向于選擇優(yōu)質(zhì)行為,進而提高其學(xué)習(xí)效率.

    3.1 啟發(fā)式獎勵函數(shù)設(shè)計

    一般的求解路徑規(guī)劃問題的傳統(tǒng)強化學(xué)習(xí)方法,通常都會運用離散性獎勵函數(shù)進行計算和模擬,具體的學(xué)習(xí)方式為:使智能體不斷根據(jù)狀態(tài)選擇行為去執(zhí)行,監(jiān)測并掌握智能體相應(yīng)獲得的獎勵信息,再通過獎勵的反饋機制來對原有的行為進行改進和調(diào)整.由于智能體在最初開始學(xué)習(xí)的過程中,對環(huán)境的認(rèn)知是一片空白,不清楚什么動作是最佳策略,這時,如果獎勵函數(shù)是離散的,勢必會使智能體在很長一段時間里處于任意的盲目狀態(tài),造成大量時間浪費.因此,應(yīng)借助合理的途徑和渠道把啟發(fā)式思想與智能體的學(xué)習(xí)相結(jié)合,提升強化學(xué)習(xí)的效率和質(zhì)量.針對這一問題,本文設(shè)計啟發(fā)式獎勵函數(shù)為智能體提供持續(xù)性的獎懲信息,使智能體能夠更加高效地學(xué)習(xí)知識和經(jīng)驗.

    在進行AGV路徑規(guī)劃時,從起點到終點移動智能體會經(jīng)歷許多不同的狀態(tài),這些狀態(tài)的評價應(yīng)該是不盡相同的.例如,通過一些先驗領(lǐng)域的知識可以知道,當(dāng)AGV所處的狀態(tài)越接近終點狀態(tài),其獲得的獎勵值越大;反之,其獲得的獎勵值越小.因此,本文參考文獻[26-27]的獎勵參數(shù)設(shè)置并結(jié)合本文實驗設(shè)計模式,將幾種不同狀態(tài)下的獎勵情況定義為

    (6)

    同時,本文對地圖環(huán)境信息進行特征提取,計算任意的當(dāng)前狀態(tài)所在位置的坐標(biāo)與終點所在位置坐標(biāo)的歐氏距離,計算公式為

    (7)

    距離D刻畫了AGV當(dāng)前狀態(tài)與目標(biāo)狀態(tài)的差距大小,為獎勵函數(shù)引入了啟發(fā)因子.E代表了當(dāng)前狀態(tài)與地圖邊界及地圖中障礙物的歐氏距離總和,反映了當(dāng)前狀態(tài)與懲罰狀態(tài)的接近程度.D、E為獎勵函數(shù)R的啟發(fā)因子,啟發(fā)式獎勵函數(shù)R為

    習(xí)近平總書記在中國共產(chǎn)黨第十九次全國代表大會報告中指出:“要建立現(xiàn)代金融體系”;“健全金融監(jiān)管體系,守住不發(fā)生系統(tǒng)性金融風(fēng)險的底線”。 “校園貸”作為現(xiàn)代金融體系中不可忽視的一部分,在現(xiàn)實中卻是一把雙刃劍。進入校園后,一方面為在校大學(xué)生提供了便利的同時,另一方面也不斷爆出各種負(fù)面新聞。根據(jù)媒體報道,因各種原因落入“校園貸”圈套的被騙學(xué)生已不在少數(shù)。及時發(fā)現(xiàn)高職院校“校園貸”中存在的問題,增強高職院校學(xué)生相關(guān)的法律觀念和意識,抵制不良“校園貸”,防患于未然,對于高等職業(yè)人才的培養(yǎng)具有很強的現(xiàn)實性和迫切性。

    (8)

    為保證不對已有的獎勵r產(chǎn)生較大的影響,不影響算法隨機探索的特性,通過反復(fù)實驗測試后,將c取值為0.6,d取值為0.4.

    3.2 啟發(fā)式動作選擇策略

    通常情況下,在同一環(huán)境的不斷交互過程中,智能體可以通過持續(xù)的學(xué)習(xí)結(jié)果來修正Q值表的相應(yīng)值,并查找、選擇最佳策略以獲取最大的回報函數(shù).從另一個方面來說,智能體還須進行不同的嘗試,探索開發(fā)新的路徑和方法,對具體的搜索范圍進行擴展,對陷入局部最優(yōu)的情況進行有效的規(guī)避和應(yīng)對.Q-learning算法大多采用ε-greedy探索策略來進行動作選擇.ε-greedy是在貪心策略前提下進行完善和改進的探索策略,其主要意圖是使智能體能夠依據(jù)一定的概率來選擇并執(zhí)行相應(yīng)的動作策略.當(dāng)智能體進行具體的動作策略選擇時,用概率ε選擇隨機動作策略,使智能體搜索到更多的狀態(tài)空間;利用概率1-ε選取使得獎勵函數(shù)取得最大值所對應(yīng)的動作策略,從而實現(xiàn)周邊環(huán)境信息和數(shù)據(jù)的最大化探索.具體的表達式為

    (9)

    式中p為(0,1)內(nèi)的任意一個隨機數(shù),當(dāng)這個隨機數(shù)小于1-ε時,選擇狀態(tài)s對應(yīng)獎勵值最大的動作a,反之將隨機選擇下一個動作.

    本文采用改進ε-greedy探索策略并結(jié)合啟發(fā)式思想來共同決定智能體在學(xué)習(xí)過程中的動作選擇策略,即在ε-greedy探索策略基礎(chǔ)上新增了調(diào)和函數(shù)G(st).調(diào)和函數(shù)的主要作用為:在智能體進行動作選擇的決策過程中,結(jié)合調(diào)和函數(shù)來分析動作策略,智能地調(diào)整每次決策對整體過程的影響,通過不斷的嘗試和實驗,強化好的決策,弱化壞的決策,減少不必要的探索和行為,加快整個算法的收斂速度.改進后的搜索策略的探索分布式為

    (10)

    式中:Q(st,at)代表了某一狀態(tài)st下的Q值;G(st)代表了該狀態(tài)下的調(diào)和函數(shù),其形式為

    (11)

    式中:xi為當(dāng)前AGV所處位置狀態(tài)的橫坐標(biāo);xi-1為前一個狀態(tài)下的AGV位置的橫坐標(biāo);xend為AGV終點目標(biāo)的橫坐標(biāo);η為一個較小的正常數(shù).本文實驗設(shè)計中,AGV運行的起點和終點的橫坐標(biāo)是不相同的,故利用式(11)可以較好地度量AGV從初始狀態(tài)到當(dāng)前狀態(tài)與終點狀態(tài)的橫坐標(biāo)的距離接近程度.當(dāng)G(st)的值為正數(shù)時,表明當(dāng)前所執(zhí)行的動作序列在橫坐標(biāo)方向上接近目標(biāo)狀態(tài);當(dāng)G(st)的值為負(fù)數(shù)時,表明當(dāng)前的動作選擇在橫坐標(biāo)方向上遠(yuǎn)離目標(biāo)狀態(tài).

    通過引入啟發(fā)因子D、E和調(diào)和函數(shù)G(st),對傳統(tǒng)Q(λ)算法在獎勵函數(shù)設(shè)計與動作選擇策略兩方面分別進行改進,使得算法在整體學(xué)習(xí)效率上有了很大的提高,有效地減少了探索無效狀態(tài)的次數(shù),也減少了探索低收益動作的次數(shù),從而加速了算法的收斂過程.啟發(fā)式Q(λ)算法學(xué)習(xí)框架如圖3所示.

    圖3 啟發(fā)式Q(λ)算法學(xué)習(xí)框架Fig.3 Learning frame of heuristic Q(λ)algorithm

    改進后的Q(λ)算法流程如算法1所示.

    算法1改進Q(λ)算法流程

    1)將Q初始化為0,同時給定α、γ、λ、ε、m、n的初始值.

    2)隨機選擇初始狀態(tài)s0.

    3)根據(jù)啟發(fā)式動作選擇策略選擇當(dāng)前狀態(tài)st對應(yīng)的動作at,并由式(8)反饋得到這一動作的立即回報R(st).

    4)結(jié)合式(1)~(3),計算價值函數(shù)Q(st,at),并從當(dāng)前狀態(tài)st過渡到下一個狀態(tài)st+1.

    5)不斷重復(fù)執(zhí)行3)和4),直到s狀態(tài)為終止?fàn)顟B(tài)或達到最大迭代次數(shù).

    6)輸出最優(yōu)策略π(s).

    4 仿真實驗

    為了驗證啟發(fā)式強化學(xué)習(xí)算法相比于傳統(tǒng)強化學(xué)習(xí)算法在單AGV路徑規(guī)劃中具有一定的優(yōu)越性,本文結(jié)合傳統(tǒng)Q(λ)算法與改進的Q(λ)算法,基于MATLAB設(shè)計了AGV路徑規(guī)劃仿真實驗,以驗證本文提出的啟發(fā)式改進策略的有效性.

    目前,對地圖環(huán)境建模的方法主要有可視圖法[28]、幾何法[29]和柵格法[30]等,其中柵格法應(yīng)用簡單,便于更新維護.實驗采用的AGV運行地圖環(huán)境為柵格化之后100 m×60 m的虛擬地圖,AGV的尺寸為1 m2,每次所能執(zhí)行的動作為上下左右每次移動一個單位長度,以柵格中心的坐標(biāo)state(i,j)作為其位置信息(i、j分別為柵格中心的橫、縱坐標(biāo)),見圖4.

    圖4 柵格坐標(biāo)示意圖Fig.4 Diagram of grid coordinates

    參考文獻[31-32]的相關(guān)實驗參數(shù)設(shè)置,本文所采用的強化學(xué)習(xí)算法中的相關(guān)參數(shù)設(shè)置如表1所示.

    表1 Q(λ)算法初始參數(shù)設(shè)置Table 1 Initial parameters of Q(λ)algorithm

    4.1 實驗結(jié)果

    假設(shè)在柵格化的虛擬地圖中,AGV分別以state(5,95)、state(5,45)及state(5,5)作為起始點,終點狀態(tài)分別為state(95,5)、state(95,45)和state(95,95),并且在地圖中設(shè)置3種障礙環(huán)境,命名為障礙1、障礙2和障礙3.首先,對傳統(tǒng)Q(λ)算法與啟發(fā)式Q(λ)算法在設(shè)有相同障礙的地圖環(huán)境中分別進行學(xué)習(xí)訓(xùn)練,得到離散性Q值表與連續(xù)性Q值表,圖5為在障礙1地圖環(huán)境中訓(xùn)練得到的Q值表;然后,根據(jù)訓(xùn)練所得的模型,利用2個算法分別在障礙1、障礙2和障礙3的地圖環(huán)境中進行20組全局路徑規(guī)劃實驗,具有代表性的規(guī)劃路徑結(jié)果見圖6~8,圖中紅色線表示障礙體.

    圖5 2種算法的Q值表對比Fig.5 Comparison of Q table between two algorithms

    圖6 障礙1環(huán)境下的2種算法路徑規(guī)劃結(jié)果對比Fig.6 Comparison of planned path between two algorithms in obstacle 1

    圖7 障礙2環(huán)境下的2種算法路徑規(guī)劃結(jié)果對比Fig.7 Comparison of planned path between two algorithms in obstacle 2

    圖8 障礙3環(huán)境下的2種算法路徑規(guī)劃結(jié)果對比Fig.8 Comparison of planned path between two algorithms in obstacle 3

    傳統(tǒng)Q(λ)算法與啟發(fā)式Q(λ)算法分別在3種障礙環(huán)境中進行20組實驗,得到4個主要性能指標(biāo)數(shù)據(jù)均值,如表2所示.由表2可見,啟發(fā)式Q(λ)算法比傳統(tǒng)Q(λ)算法在探索次數(shù)、路徑規(guī)劃時間、路徑長度、路徑轉(zhuǎn)角方面分別提升20.53%、16.31%、30.77%、50.00%.

    表2 傳統(tǒng)Q(λ)算法與啟發(fā)式Q(λ)算法實驗數(shù)據(jù)對比Table 2 Comparison of results between traditional Q(λ)algorithm and heuristic Q(λ)algorithm

    此外,為進一步驗證本文啟發(fā)式強化學(xué)習(xí)算法的性能,結(jié)合本文實驗環(huán)境,將本文算法與基于成功率搜索[33]的Q(λ)算法在障礙1環(huán)境下進行路徑規(guī)劃實驗對比,此對比實驗結(jié)果作為考量本文算法可行性的一個參考.具有代表性的基于成功率搜索的Q(λ)算法路徑規(guī)劃結(jié)果見圖9.

    圖9 障礙1環(huán)境中基于成功率搜索的Q(λ)算法AGV路線Fig.9 AGV path of Q(λ)algorithm based on success rate search in obstacle 1

    通過在障礙1環(huán)境下進行20次反復(fù)實驗,得出基于成功率搜索的Q(λ)算法與啟發(fā)式Q(λ)算法的主要性能指標(biāo)均值,見表3.

    表3 基于成功率搜索的Q(λ)算法與啟發(fā)式Q(λ)算法實驗數(shù)據(jù)對比Table 3 Comparison of results between Q(λ)algorithm based on success rate search and heuristic Q(λ)algorithm

    4.2 實驗結(jié)果分析

    通過分析實驗結(jié)果,可知:

    1)通過設(shè)計啟發(fā)性的持續(xù)獎勵,使得AGV在每一個動作中都能獲得不同程度的反饋.由圖5(a)可知,離散性的獎勵分布使AGV在很多時刻都是盲目且無序的狀態(tài),浪費了大量的尋徑時間,而圖5(b)中不同的持續(xù)獎勵值可使AGV能更準(zhǔn)確地判斷哪些動作是有價值的且能判斷每個動作的價值程度,便于提高AGV的學(xué)習(xí)效率.

    2)結(jié)合圖6~8和表2可知,通過設(shè)計啟發(fā)式動作選擇策略,使得Q(λ)算法規(guī)劃出的AGV路徑更加簡短.相比于傳統(tǒng)Q(λ)算法,啟發(fā)式Q(λ)算法規(guī)劃的路徑長度減少了30.77%,路徑轉(zhuǎn)角減少了50%;結(jié)合圖6(b)、圖9與表3可知,與基于成功率搜索的Q(λ)算法相比,本文啟發(fā)式動作選擇策略在減少路徑轉(zhuǎn)角、簡化規(guī)劃路徑方面具有一定的優(yōu)勢.可見,本文改進后的算法在很大程度上節(jié)約了AGV的能耗.

    3)通過表2分析可知,在相同的障礙地圖環(huán)境中,啟發(fā)式Q(λ)算法的探索次數(shù)更少,提升了20.53%,減少的探索次數(shù)說明改進后的Q(λ)算法收斂速度更快,有效探索的比率更高.此外,相比于傳統(tǒng)的Q(λ)算法,同等條件下,啟發(fā)式Q(λ)算法能夠節(jié)省16.31%的路徑規(guī)劃時間.假如將問題規(guī)模擴大,那么將會節(jié)約較大程度的時間成本.

    5 結(jié)論

    1)本文針對傳統(tǒng)強化學(xué)習(xí)算法存在學(xué)習(xí)效率低、收斂速度慢的問題,在傳統(tǒng)Q(λ)算法中引入啟發(fā)式思想,設(shè)計啟發(fā)式獎勵函數(shù),實現(xiàn)對智能體連續(xù)性動作的實時獎勵反饋,從而優(yōu)化獎勵反饋機制,提升智能體學(xué)習(xí)能力與效率.

    2)本文提出了基于ε-greedy探索策略和調(diào)和函數(shù)的啟發(fā)式動作選擇策略,使智能體能夠在一定程度中和不佳策略,強化其有效探索,明顯縮短智能體尋徑時間.

    3)本文引入并融合啟發(fā)式思想以提升傳統(tǒng)強化學(xué)習(xí)算法的學(xué)習(xí)效率與收斂時間,后續(xù)可進一步探討多AGV動態(tài)障礙環(huán)境中啟發(fā)式強化學(xué)習(xí)方法的可行性.

    猜你喜歡
    規(guī)劃動作智能
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    動作描寫要具體
    規(guī)劃引領(lǐng)把握未來
    快遞業(yè)十三五規(guī)劃發(fā)布
    商周刊(2017年5期)2017-08-22 03:35:26
    畫動作
    動作描寫不可少
    多管齊下落實規(guī)劃
    九九在线视频观看精品| 丰满迷人的少妇在线观看| 免费播放大片免费观看视频在线观看| 日韩制服骚丝袜av| 激情五月婷婷亚洲| 美女内射精品一级片tv| 精品少妇内射三级| 大片免费播放器 马上看| 久久国产亚洲av麻豆专区| 亚洲高清免费不卡视频| 女性被躁到高潮视频| 国产成人aa在线观看| 色视频www国产| 亚洲成人一二三区av| 国产免费视频播放在线视频| 亚洲国产av新网站| 一个人看视频在线观看www免费| 纯流量卡能插随身wifi吗| 少妇熟女欧美另类| 国产精品久久久久久av不卡| 爱豆传媒免费全集在线观看| 久久久久人妻精品一区果冻| 激情五月婷婷亚洲| 日日摸夜夜添夜夜爱| 中文精品一卡2卡3卡4更新| 国产成人免费观看mmmm| 亚洲精品日韩在线中文字幕| 免费高清在线观看视频在线观看| freevideosex欧美| 国产成人一区二区在线| 高清在线视频一区二区三区| 国产精品国产三级国产专区5o| 欧美另类一区| 国产精品欧美亚洲77777| 国产精品三级大全| 国产一区二区在线观看日韩| 男女啪啪激烈高潮av片| 人妻夜夜爽99麻豆av| 国产女主播在线喷水免费视频网站| 久久人妻熟女aⅴ| 国产精品一区二区性色av| 国产熟女欧美一区二区| 免费大片黄手机在线观看| 国产毛片在线视频| 成年美女黄网站色视频大全免费 | tube8黄色片| 赤兔流量卡办理| 女人久久www免费人成看片| 你懂的网址亚洲精品在线观看| 国产白丝娇喘喷水9色精品| 成人亚洲精品一区在线观看| 午夜福利网站1000一区二区三区| 在线天堂最新版资源| 免费观看a级毛片全部| 搡女人真爽免费视频火全软件| 成人特级av手机在线观看| videossex国产| 99热6这里只有精品| 久久久久久久久久久丰满| 色5月婷婷丁香| 午夜福利在线观看免费完整高清在| 亚洲真实伦在线观看| 少妇被粗大猛烈的视频| 久久国产亚洲av麻豆专区| 国产爽快片一区二区三区| 九草在线视频观看| 亚洲av男天堂| 一本大道久久a久久精品| 久久久国产欧美日韩av| 天天操日日干夜夜撸| 免费久久久久久久精品成人欧美视频 | 一级毛片aaaaaa免费看小| 高清黄色对白视频在线免费看 | 国产伦在线观看视频一区| 国产亚洲5aaaaa淫片| 亚洲精品国产色婷婷电影| 亚洲欧美中文字幕日韩二区| a级一级毛片免费在线观看| 91午夜精品亚洲一区二区三区| 一级毛片电影观看| 女的被弄到高潮叫床怎么办| 免费观看av网站的网址| 成人影院久久| 三上悠亚av全集在线观看 | 成年人午夜在线观看视频| 国产淫语在线视频| 91午夜精品亚洲一区二区三区| 国产视频首页在线观看| 亚洲国产欧美日韩在线播放 | 大香蕉97超碰在线| 91精品一卡2卡3卡4卡| 国产亚洲最大av| 18禁在线无遮挡免费观看视频| 99久久人妻综合| 国产有黄有色有爽视频| 十分钟在线观看高清视频www | 色94色欧美一区二区| 看非洲黑人一级黄片| 丰满迷人的少妇在线观看| 亚洲av免费高清在线观看| 久久韩国三级中文字幕| 国产免费一区二区三区四区乱码| 91久久精品国产一区二区成人| 国产美女午夜福利| 国产无遮挡羞羞视频在线观看| 国产又色又爽无遮挡免| 国产精品久久久久久久电影| 国产午夜精品久久久久久一区二区三区| 一级毛片 在线播放| 最近中文字幕高清免费大全6| 亚洲精品日本国产第一区| 免费看av在线观看网站| 99热这里只有是精品50| 欧美激情国产日韩精品一区| 在线天堂最新版资源| 91aial.com中文字幕在线观看| 又粗又硬又长又爽又黄的视频| 国产av国产精品国产| 国产淫片久久久久久久久| 黑人巨大精品欧美一区二区蜜桃 | 免费黄频网站在线观看国产| 久久久午夜欧美精品| 午夜免费鲁丝| 99热这里只有是精品50| 国产一区二区三区av在线| 中文字幕av电影在线播放| 乱人伦中国视频| 国产免费福利视频在线观看| 成人18禁高潮啪啪吃奶动态图 | 黄色欧美视频在线观看| 男人舔奶头视频| 黄色怎么调成土黄色| 老熟女久久久| 国产精品国产三级专区第一集| 在线观看美女被高潮喷水网站| 国产欧美日韩一区二区三区在线 | 97超视频在线观看视频| 国产视频内射| 岛国毛片在线播放| 国产亚洲午夜精品一区二区久久| 男人狂女人下面高潮的视频| 性高湖久久久久久久久免费观看| 国产精品欧美亚洲77777| 亚洲av综合色区一区| av天堂中文字幕网| 噜噜噜噜噜久久久久久91| 丝袜在线中文字幕| 插逼视频在线观看| 久久久精品94久久精品| 国产深夜福利视频在线观看| 欧美最新免费一区二区三区| 国产亚洲5aaaaa淫片| 啦啦啦在线观看免费高清www| 噜噜噜噜噜久久久久久91| av国产久精品久网站免费入址| 国产亚洲一区二区精品| 熟妇人妻不卡中文字幕| h视频一区二区三区| av有码第一页| 日韩av不卡免费在线播放| 婷婷色综合大香蕉| 26uuu在线亚洲综合色| 少妇人妻 视频| 性高湖久久久久久久久免费观看| 国产有黄有色有爽视频| 能在线免费看毛片的网站| 综合色丁香网| 一级av片app| 亚洲av成人精品一区久久| 亚洲欧美日韩东京热| 蜜臀久久99精品久久宅男| 免费黄频网站在线观看国产| videossex国产| 亚洲国产色片| 新久久久久国产一级毛片| 看免费成人av毛片| 欧美日韩在线观看h| 99九九线精品视频在线观看视频| 国产美女午夜福利| 午夜影院在线不卡| 国产精品一区二区性色av| 日韩中文字幕视频在线看片| 亚洲精品日本国产第一区| 国产色爽女视频免费观看| 日日摸夜夜添夜夜添av毛片| 夜夜看夜夜爽夜夜摸| 亚洲天堂av无毛| 欧美少妇被猛烈插入视频| av不卡在线播放| 97在线人人人人妻| 老司机影院毛片| 我的老师免费观看完整版| 免费播放大片免费观看视频在线观看| 中国国产av一级| 最后的刺客免费高清国语| 国产成人a∨麻豆精品| 极品教师在线视频| 精品视频人人做人人爽| 亚洲成人av在线免费| 一区在线观看完整版| 免费黄频网站在线观看国产| 亚洲真实伦在线观看| 欧美日韩综合久久久久久| 交换朋友夫妻互换小说| 美女国产视频在线观看| 久久精品久久精品一区二区三区| 简卡轻食公司| 少妇精品久久久久久久| 波野结衣二区三区在线| 欧美bdsm另类| 在线观看国产h片| 国产淫片久久久久久久久| 中文字幕制服av| 色5月婷婷丁香| 国产极品天堂在线| 一级毛片 在线播放| 99久久综合免费| 在线观看www视频免费| 国产av一区二区精品久久| 亚洲精品久久久久久婷婷小说| 久久久久久伊人网av| 国产免费一区二区三区四区乱码| 韩国高清视频一区二区三区| 极品教师在线视频| 国产无遮挡羞羞视频在线观看| 亚洲美女搞黄在线观看| av不卡在线播放| 亚洲欧美一区二区三区国产| 中文字幕精品免费在线观看视频 | 免费看光身美女| 欧美激情国产日韩精品一区| 久久久国产精品麻豆| 亚洲精品视频女| 我的老师免费观看完整版| 蜜臀久久99精品久久宅男| 久久国产乱子免费精品| 激情五月婷婷亚洲| 毛片一级片免费看久久久久| 精品人妻熟女av久视频| 国产日韩欧美在线精品| 久久久久久久久久人人人人人人| 亚洲激情五月婷婷啪啪| 中文欧美无线码| 国产欧美另类精品又又久久亚洲欧美| www.av在线官网国产| 日韩av在线免费看完整版不卡| 国产高清三级在线| 99热这里只有是精品在线观看| 卡戴珊不雅视频在线播放| 亚洲精品第二区| 视频中文字幕在线观看| 啦啦啦中文免费视频观看日本| 狂野欧美白嫩少妇大欣赏| 午夜福利视频精品| 国产极品粉嫩免费观看在线 | 美女视频免费永久观看网站| 又黄又爽又刺激的免费视频.| 伦理电影大哥的女人| 如日韩欧美国产精品一区二区三区 | 色视频在线一区二区三区| 王馨瑶露胸无遮挡在线观看| 国产日韩欧美视频二区| 免费看不卡的av| 女性生殖器流出的白浆| 免费人妻精品一区二区三区视频| 十分钟在线观看高清视频www | 亚洲精品中文字幕在线视频 | 欧美亚洲 丝袜 人妻 在线| √禁漫天堂资源中文www| 中文字幕av电影在线播放| 国产精品99久久99久久久不卡 | 精品午夜福利在线看| 欧美 亚洲 国产 日韩一| 国产深夜福利视频在线观看| 制服丝袜香蕉在线| 亚洲美女视频黄频| 综合色丁香网| 国产精品99久久99久久久不卡 | 18禁在线无遮挡免费观看视频| 如何舔出高潮| 中文资源天堂在线| 成人黄色视频免费在线看| 亚洲国产精品一区三区| 最近2019中文字幕mv第一页| 少妇精品久久久久久久| .国产精品久久| 搡女人真爽免费视频火全软件| 在线观看免费高清a一片| 国产精品国产三级国产专区5o| 中文在线观看免费www的网站| 中文字幕人妻熟人妻熟丝袜美| 岛国毛片在线播放| 免费观看a级毛片全部| 我要看日韩黄色一级片| 中文字幕精品免费在线观看视频 | 精品一区二区免费观看| 亚洲国产最新在线播放| 老熟女久久久| 久久女婷五月综合色啪小说| 黄片无遮挡物在线观看| 国产综合精华液| 极品教师在线视频| 久久女婷五月综合色啪小说| 又大又黄又爽视频免费| 日日摸夜夜添夜夜爱| 久热久热在线精品观看| a级片在线免费高清观看视频| 三级国产精品欧美在线观看| 一本色道久久久久久精品综合| 久久99热这里只频精品6学生| 久久久久久伊人网av| 精品卡一卡二卡四卡免费| 女的被弄到高潮叫床怎么办| 欧美高清成人免费视频www| 午夜日本视频在线| 噜噜噜噜噜久久久久久91| 国产精品国产三级国产专区5o| 男女无遮挡免费网站观看| 国产色爽女视频免费观看| 在线天堂最新版资源| 国产成人免费观看mmmm| 一区二区三区乱码不卡18| 乱码一卡2卡4卡精品| av.在线天堂| 亚洲av男天堂| 久久国内精品自在自线图片| 亚洲国产精品国产精品| 国产有黄有色有爽视频| av播播在线观看一区| 亚洲伊人久久精品综合| 亚洲成人手机| 国产免费又黄又爽又色| 永久免费av网站大全| 伦理电影免费视频| 狂野欧美激情性bbbbbb| 久久久欧美国产精品| 电影成人av| bbb黄色大片| 91麻豆av在线| 99国产精品99久久久久| 天天影视国产精品| tocl精华| 搡老乐熟女国产| 国产欧美日韩一区二区三区在线| 亚洲第一青青草原| 1024视频免费在线观看| 亚洲国产中文字幕在线视频| 九色亚洲精品在线播放| 国产精品久久久av美女十八| 精品免费久久久久久久清纯 | 美女中出高潮动态图| 中亚洲国语对白在线视频| 久久99热这里只频精品6学生| 丝瓜视频免费看黄片| 性高湖久久久久久久久免费观看| 亚洲免费av在线视频| 五月天丁香电影| 精品乱码久久久久久99久播| 亚洲色图 男人天堂 中文字幕| 久久 成人 亚洲| 十八禁高潮呻吟视频| 后天国语完整版免费观看| 夜夜骑夜夜射夜夜干| 久久毛片免费看一区二区三区| 国产av又大| 免费在线观看日本一区| 丰满饥渴人妻一区二区三| 亚洲成av片中文字幕在线观看| 久9热在线精品视频| 99久久99久久久精品蜜桃| 亚洲国产看品久久| a级毛片在线看网站| 国产99久久九九免费精品| 亚洲欧美色中文字幕在线| 日本av免费视频播放| 亚洲中文日韩欧美视频| 日韩 欧美 亚洲 中文字幕| 69精品国产乱码久久久| 天天躁日日躁夜夜躁夜夜| 久久亚洲精品不卡| 最黄视频免费看| 亚洲精品在线美女| www.999成人在线观看| e午夜精品久久久久久久| 在线十欧美十亚洲十日本专区| 在线精品无人区一区二区三| 两人在一起打扑克的视频| 亚洲午夜精品一区,二区,三区| 精品久久久久久久毛片微露脸 | 亚洲 欧美一区二区三区| 精品亚洲成国产av| 国产黄频视频在线观看| 精品卡一卡二卡四卡免费| 久热这里只有精品99| 老司机午夜十八禁免费视频| 一本综合久久免费| 久久久欧美国产精品| 午夜激情久久久久久久| 亚洲精品中文字幕在线视频| 黄色视频,在线免费观看| 伦理电影免费视频| 国产亚洲精品第一综合不卡| 精品福利永久在线观看| 久久国产精品人妻蜜桃| 国产在线观看jvid| 国产黄频视频在线观看| 丰满少妇做爰视频| 日本精品一区二区三区蜜桃| 日韩大片免费观看网站| 99热全是精品| 久久女婷五月综合色啪小说| 男女高潮啪啪啪动态图| 91成人精品电影| 黄色片一级片一级黄色片| 亚洲精品国产av成人精品| 1024香蕉在线观看| 免费不卡黄色视频| 一级a爱视频在线免费观看| 久久久水蜜桃国产精品网| 国产精品亚洲av一区麻豆| 亚洲国产成人一精品久久久| 又大又爽又粗| 国产成+人综合+亚洲专区| 国产精品国产av在线观看| 久久久精品国产亚洲av高清涩受| 黄网站色视频无遮挡免费观看| 俄罗斯特黄特色一大片| xxxhd国产人妻xxx| 国产精品香港三级国产av潘金莲| 欧美日韩成人在线一区二区| 亚洲国产欧美网| 日韩欧美一区二区三区在线观看 | 亚洲va日本ⅴa欧美va伊人久久 | 久久天躁狠狠躁夜夜2o2o| 国产av国产精品国产| 午夜福利,免费看| 老司机午夜十八禁免费视频| 美女视频免费永久观看网站| av网站免费在线观看视频| 美国免费a级毛片| 捣出白浆h1v1| 国产成人啪精品午夜网站| 亚洲av成人不卡在线观看播放网 | 蜜桃国产av成人99| tube8黄色片| 久久香蕉激情| 久热爱精品视频在线9| 五月开心婷婷网| 天堂8中文在线网| 午夜福利乱码中文字幕| 夜夜夜夜夜久久久久| 悠悠久久av| 麻豆国产av国片精品| 亚洲成人免费电影在线观看| 亚洲国产日韩一区二区| 亚洲精品乱久久久久久| 999精品在线视频| 免费人妻精品一区二区三区视频| www日本在线高清视频| 91成年电影在线观看| 欧美另类一区| 亚洲欧美色中文字幕在线| 色婷婷av一区二区三区视频| 国产精品一区二区精品视频观看| 久久精品人人爽人人爽视色| 久久人人爽av亚洲精品天堂| 国产91精品成人一区二区三区 | 国产一区二区在线观看av| 亚洲熟女毛片儿| 99国产精品一区二区蜜桃av | 亚洲国产欧美一区二区综合| 亚洲av成人一区二区三| 国产淫语在线视频| 亚洲人成电影免费在线| 亚洲精品成人av观看孕妇| 老司机影院毛片| 国产免费视频播放在线视频| 日韩视频在线欧美| 如日韩欧美国产精品一区二区三区| 国产精品99久久99久久久不卡| 天堂中文最新版在线下载| 丰满少妇做爰视频| 性高湖久久久久久久久免费观看| 久久ye,这里只有精品| 两个人免费观看高清视频| 爱豆传媒免费全集在线观看| 国产日韩欧美在线精品| 三级毛片av免费| 不卡一级毛片| 久久久国产成人免费| 亚洲精品国产区一区二| 69av精品久久久久久 | av又黄又爽大尺度在线免费看| 不卡一级毛片| 国产伦人伦偷精品视频| 淫妇啪啪啪对白视频 | 91精品三级在线观看| 婷婷丁香在线五月| 91成人精品电影| 精品国产一区二区久久| 动漫黄色视频在线观看| 男女之事视频高清在线观看| 我的亚洲天堂| 欧美午夜高清在线| www.熟女人妻精品国产| h视频一区二区三区| 18禁裸乳无遮挡动漫免费视频| 啦啦啦啦在线视频资源| 中国美女看黄片| 久久久久网色| 大陆偷拍与自拍| 国产免费视频播放在线视频| 久久久久精品人妻al黑| 午夜成年电影在线免费观看| 精品国产一区二区三区四区第35| 各种免费的搞黄视频| 十八禁高潮呻吟视频| 精品熟女少妇八av免费久了| 国产高清视频在线播放一区 | 欧美乱码精品一区二区三区| 久久久国产精品麻豆| av电影中文网址| 免费观看人在逋| 91九色精品人成在线观看| 黄频高清免费视频| 男人爽女人下面视频在线观看| 亚洲欧美精品自产自拍| 老司机影院成人| 免费女性裸体啪啪无遮挡网站| 五月天丁香电影| 美女大奶头黄色视频| av免费在线观看网站| av超薄肉色丝袜交足视频| 亚洲五月色婷婷综合| 久久精品亚洲av国产电影网| 亚洲国产欧美日韩在线播放| 亚洲天堂av无毛| 纯流量卡能插随身wifi吗| 制服诱惑二区| 婷婷成人精品国产| 在线观看免费午夜福利视频| 男人舔女人的私密视频| 日本撒尿小便嘘嘘汇集6| 精品亚洲成国产av| 国产男人的电影天堂91| 在线观看免费视频网站a站| 多毛熟女@视频| 18禁国产床啪视频网站| 淫妇啪啪啪对白视频 | 精品国产一区二区久久| 极品少妇高潮喷水抽搐| 国产成人欧美在线观看 | 一本综合久久免费| 亚洲国产精品一区二区三区在线| 国产精品一区二区精品视频观看| a在线观看视频网站| 国产无遮挡羞羞视频在线观看| 操出白浆在线播放| 国产在线一区二区三区精| 免费av中文字幕在线| 老司机影院毛片| 亚洲中文字幕日韩| 日韩大片免费观看网站| 老汉色av国产亚洲站长工具| 97人妻天天添夜夜摸| 极品人妻少妇av视频| 亚洲,欧美精品.| 老司机深夜福利视频在线观看 | 国产日韩欧美在线精品| 日日摸夜夜添夜夜添小说| 麻豆av在线久日| 十八禁高潮呻吟视频| 青青草视频在线视频观看| 久久99一区二区三区| 成人国产一区最新在线观看| 制服人妻中文乱码| 国产免费福利视频在线观看| 91字幕亚洲| 制服人妻中文乱码| 日本a在线网址| 亚洲全国av大片| 国产精品一区二区在线不卡| 叶爱在线成人免费视频播放| 国产一级毛片在线| 夫妻午夜视频| 久久人妻福利社区极品人妻图片| 亚洲国产欧美日韩在线播放| 欧美少妇被猛烈插入视频| 欧美日韩亚洲综合一区二区三区_| 国产无遮挡羞羞视频在线观看| 日韩中文字幕视频在线看片| 五月开心婷婷网| 侵犯人妻中文字幕一二三四区| 一本—道久久a久久精品蜜桃钙片| 成年人免费黄色播放视频| 97精品久久久久久久久久精品| 一本—道久久a久久精品蜜桃钙片| 国产欧美亚洲国产| 久久人人爽人人片av| 亚洲国产av影院在线观看| 亚洲国产精品999| a级毛片黄视频| 日本wwww免费看| 亚洲男人天堂网一区| 亚洲午夜精品一区,二区,三区| 1024视频免费在线观看| 男女午夜视频在线观看| 日日夜夜操网爽| 欧美精品一区二区大全| 涩涩av久久男人的天堂| 一区二区三区四区激情视频| 最近最新免费中文字幕在线| 亚洲国产毛片av蜜桃av| 免费一级毛片在线播放高清视频 | 中亚洲国语对白在线视频|