• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多智能體強(qiáng)化學(xué)習(xí)的空間機(jī)械臂軌跡規(guī)劃

    2021-03-28 02:34:26趙毓管公順郭繼峰于曉強(qiáng)顏鵬
    航空學(xué)報(bào) 2021年1期
    關(guān)鍵詞:軌跡決策機(jī)械

    趙毓,管公順,郭繼峰,于曉強(qiáng),顏鵬

    哈爾濱工業(yè)大學(xué) 航天學(xué)院,哈爾濱 150001

    近年來,人類對(duì)太空探索和開發(fā)活動(dòng)愈發(fā)頻繁,對(duì)空間機(jī)械臂的能力提出了更高要求[1]??臻g飛行器在軌運(yùn)行過程中,易發(fā)生空間碎片近距離碰撞或表面結(jié)構(gòu)脫離等突發(fā)情況,可以通過空間機(jī)械臂的有效抓捕動(dòng)作使得飛行器避免主體結(jié)構(gòu)受到損壞[2]。受限于任務(wù)場(chǎng)景的動(dòng)態(tài)性和偶發(fā)性,傳統(tǒng)空間機(jī)械臂軌跡規(guī)劃方法難以滿足實(shí)時(shí)性需求,為了保證能夠高效完成相關(guān)動(dòng)作,亟需開展空間機(jī)械臂快速自主在軌捕捉操作的軌跡規(guī)劃算法研究[3]。

    本文研究的空間自由漂浮機(jī)械臂系統(tǒng)軌跡規(guī)劃問題與地面機(jī)械臂相比,有很大不同:① 空間機(jī)器人基座不固定,系統(tǒng)存在非完整約束,無法使用地面機(jī)械臂路徑規(guī)劃方法求解;② 空間機(jī)械臂Jacobi矩陣受載具平臺(tái)動(dòng)力學(xué)影響,其動(dòng)力學(xué)奇異比地面機(jī)械臂復(fù)雜很多;③ 當(dāng)前通訊條件下很難實(shí)現(xiàn)對(duì)空間機(jī)械臂的地面實(shí)時(shí)遙操作,因此對(duì)其軌跡規(guī)劃自主性要求遠(yuǎn)高于地面系統(tǒng)。

    空間機(jī)械臂軌跡規(guī)劃目的是,在動(dòng)力學(xué)和運(yùn)動(dòng)學(xué)約束條件下設(shè)計(jì)一條以時(shí)間為參數(shù)的連續(xù)曲線,使機(jī)械臂末端執(zhí)行機(jī)構(gòu)在一定時(shí)間內(nèi)達(dá)到特定姿態(tài)和位置[4]??紤]到空間機(jī)械臂在運(yùn)動(dòng)過程中會(huì)對(duì)基座狀態(tài)產(chǎn)生擾動(dòng),其軌跡規(guī)劃問題需要在動(dòng)量守恒前提下求解,整個(gè)系統(tǒng)存在非完整性約束[5]。針對(duì)以上特性,傳統(tǒng)方法采用Jacobi矩陣和Lyapunov函數(shù)等算法進(jìn)行系統(tǒng)動(dòng)力學(xué)耦合分析,并以此為基礎(chǔ)進(jìn)行軌跡規(guī)劃。Yoshida等采用廣義Jacobi逆矩陣方式求取可執(zhí)行軌跡[6]。徐文福采用求解參數(shù)方程方法進(jìn)行軌跡規(guī)劃,其中將關(guān)節(jié)角函數(shù)進(jìn)行參數(shù)分解,然后通過牛頓迭代法取得最優(yōu)解[7]。崔浩和戈新生使用多項(xiàng)式插值結(jié)合序列二次規(guī)劃方法改進(jìn)了參數(shù)方程求解算法[8]。劉宏等應(yīng)用控制理論,基于Lyapunov函數(shù)對(duì)機(jī)械臂軌跡進(jìn)行設(shè)計(jì),該方法充分考慮了空間機(jī)械臂非完整約束特點(diǎn)[9]。隨著群體智能算法興起,王明等提出了基于群智能粒子群算法的機(jī)械臂軌跡規(guī)劃方法,并以此實(shí)現(xiàn)了最小擾動(dòng)規(guī)劃軌跡[10]。上述基于數(shù)值求解和優(yōu)化的空間機(jī)械臂軌跡規(guī)劃算法雖然能夠得到較為準(zhǔn)確和理想的結(jié)果,但始終限制于計(jì)算量龐大和局部最優(yōu)難以跳出的困境,無法應(yīng)用在實(shí)時(shí)捕捉系統(tǒng)中。

    隨后機(jī)械臂運(yùn)動(dòng)規(guī)劃算法逐漸向全局規(guī)劃方向發(fā)展,常見機(jī)械臂全局軌跡規(guī)劃方法包括人工勢(shì)場(chǎng)法[11]、隨機(jī)采樣法[12]和智能優(yōu)化方法[13]。早期有學(xué)者提出適用于不確定動(dòng)態(tài)環(huán)境的基于隨機(jī)采樣機(jī)械臂運(yùn)動(dòng)規(guī)劃算法,研究主要圍繞快速擴(kuò)展隨機(jī)樹(Rapidly-exploring Random Trees, RRT)方法開展[14-15]?;赗RT的算法雖然在一定程度上解決了奇點(diǎn)問題和不確定環(huán)境問題,但運(yùn)算效率仍然是其瓶頸。本文采用文獻(xiàn)[16]中改進(jìn)RRT算法作為對(duì)比方法,應(yīng)用在所研究場(chǎng)景中。

    伴隨人工智能技術(shù)研究的熱潮[17-18],以強(qiáng)化學(xué)習(xí)[19-20]和深度學(xué)習(xí)[21-22]為代表的自學(xué)習(xí)算法被廣泛應(yīng)用于機(jī)械臂運(yùn)動(dòng)規(guī)劃工程問題中。基于機(jī)器學(xué)習(xí)算法進(jìn)行空間機(jī)械臂軌跡規(guī)劃的優(yōu)點(diǎn)為其適用性較強(qiáng),對(duì)非完整約束可以進(jìn)行有效求解,也可以在無模型的條件下進(jìn)行訓(xùn)練仿真,甚至可以實(shí)現(xiàn)規(guī)劃行為的預(yù)測(cè)和提前分解。2017年OpenAI研究組發(fā)表了一種基于多智能體的Actor-Critic研究方法,該方法用于訓(xùn)練智能體在特定環(huán)境中進(jìn)行協(xié)同決策[23]。本文提出的自學(xué)習(xí)訓(xùn)練方法靈感即來源于此文,空間機(jī)械臂系統(tǒng)可以視為由多個(gè)獨(dú)立的機(jī)械剛體關(guān)節(jié)桿件組成,其中每個(gè)關(guān)節(jié)桿件都可以看成一個(gè)智能體。由此,空間機(jī)械臂對(duì)運(yùn)動(dòng)目標(biāo)捕捉的規(guī)劃問題,可以看作是多個(gè)智能體連續(xù)動(dòng)作協(xié)同決策問題。

    本文針對(duì)某型六自由度空間機(jī)械臂建立了多關(guān)節(jié)桿件的標(biāo)準(zhǔn)DH(Denavit-Hartenberg)參數(shù)模型。對(duì)空間機(jī)械臂系統(tǒng)的一般運(yùn)動(dòng)方程進(jìn)行研究,引入多剛體力學(xué)耦合特性分析,進(jìn)一步推導(dǎo)出機(jī)械臂與基座的組合體運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)模型。結(jié)合多智能體深度確定性策略梯度學(xué)習(xí)理論,建立空間機(jī)械臂對(duì)勻速直線運(yùn)動(dòng)目標(biāo)捕捉的強(qiáng)化學(xué)習(xí)訓(xùn)練系統(tǒng)。通過集中訓(xùn)練與分布式執(zhí)行方式,對(duì)捕捉問題進(jìn)行智能化自主軌跡規(guī)劃。將每個(gè)機(jī)械臂關(guān)節(jié)視為一個(gè)決策智能體,訓(xùn)練過程中使用觀察全局的Critic指導(dǎo)訓(xùn)練,進(jìn)而實(shí)現(xiàn)多智能體的協(xié)作行為,提升強(qiáng)化學(xué)習(xí)穩(wěn)定性。使用深度強(qiáng)化學(xué)習(xí)方法進(jìn)行空間機(jī)械臂軌跡規(guī)劃的優(yōu)點(diǎn)在于:避免了復(fù)雜系統(tǒng)無法精確建模問題;解決了陷入局部最優(yōu)解問題;有效降低了實(shí)時(shí)計(jì)算復(fù)雜度,提高規(guī)劃效率;實(shí)現(xiàn)了在線自主軌跡規(guī)劃。

    本文所述方法是一種即時(shí)決策方法,可以進(jìn)行快速連續(xù)決策,不像傳統(tǒng)控制方法需要對(duì)控制律進(jìn)行求解。隨著“數(shù)字孿生”等技術(shù)的發(fā)展,通過計(jì)算機(jī)仿真模擬即可實(shí)現(xiàn)規(guī)劃決策神經(jīng)網(wǎng)絡(luò)訓(xùn)練,離線訓(xùn)練好的規(guī)劃系統(tǒng)移植到實(shí)物系統(tǒng)中經(jīng)過少量在線訓(xùn)練就能夠達(dá)到應(yīng)用要求。國(guó)內(nèi)很多機(jī)構(gòu)已經(jīng)實(shí)現(xiàn)了地面模擬空間機(jī)械臂的實(shí)物實(shí)驗(yàn)系統(tǒng),可以進(jìn)行地面模擬訓(xùn)練[24]?;谝陨戏治觯绻磥碛袘?yīng)用需求,本文算法可應(yīng)用于實(shí)物驗(yàn)證和使用環(huán)境。

    本文所述自學(xué)習(xí)訓(xùn)練方法采用Python的TensorFlow工具包進(jìn)行開發(fā),為了直觀展示所得仿真結(jié)果,使用MATLAB的Robotics工具箱進(jìn)行驗(yàn)證和繪圖。用于對(duì)比分析的改進(jìn)型RRT算法在MATLAB環(huán)境下實(shí)現(xiàn)。將兩種方法的仿真結(jié)果進(jìn)行對(duì)比分析,可得本文提出的算法得到軌跡規(guī)劃時(shí)間更短,所得軌跡平滑度更高,對(duì)環(huán)境參數(shù)不確定情況具有較好的魯棒性。

    1 問題描述與系統(tǒng)建模

    1.1 空間捕捉問題簡(jiǎn)化

    本文研究對(duì)象為在軌運(yùn)行的自由漂浮小型六自由度機(jī)械臂系統(tǒng),機(jī)械臂基座安裝在自由漂浮平臺(tái)一端,展開結(jié)構(gòu)如圖1所示。由于空間環(huán)境特殊性,僅通過仿真分析驗(yàn)證算法,并未進(jìn)行實(shí)物實(shí)驗(yàn)。

    為了關(guān)注軌跡規(guī)劃問題本身,對(duì)研究環(huán)境進(jìn)行如下假設(shè):

    1) 將目標(biāo)物體理想化為均質(zhì)小球,球體在機(jī)械臂近距離空間內(nèi)做勻速直線運(yùn)動(dòng),仿真初始時(shí)刻一定時(shí)間內(nèi)不會(huì)飛出機(jī)械臂工作空間。

    2) 不考慮末端執(zhí)行機(jī)構(gòu)對(duì)小球的抓捕動(dòng)作,為機(jī)械臂末端位置與球體質(zhì)心位置重合即為捕捉成功。

    3) 將機(jī)械臂基座平臺(tái)抽象為零控均質(zhì)剛體,在目標(biāo)捕捉過程中忽略平臺(tái)-機(jī)械臂系統(tǒng)整體受到的一切外力和外力矩。

    仿真所用機(jī)械臂對(duì)象的DH參數(shù)如表1所示。

    表1 空間機(jī)械臂DH參數(shù)Table 1 DH parameters of space manipulator

    機(jī)械臂在非工作狀態(tài)下采取收攏姿態(tài),本文研究以此姿態(tài)作為空間機(jī)械臂初始狀態(tài),如圖2所示。由圖2可以看出,除了關(guān)節(jié)2有硬性幅度限制外,其余關(guān)節(jié)均無幅度限制。不失一般性地,設(shè)定關(guān)節(jié)2轉(zhuǎn)角取值范圍為[0,π],其余關(guān)節(jié)轉(zhuǎn)角范圍均為[-π,π]。機(jī)械臂動(dòng)力學(xué)參數(shù)如表2所示,表中Ix、Iy、Iz分別為轉(zhuǎn)動(dòng)慣量在各軸的分量,Tc為關(guān)節(jié)轉(zhuǎn)矩。

    表2 空間機(jī)械臂動(dòng)力學(xué)參數(shù)Table 2 Dynamic parameters of space manipulator

    1.2 空間機(jī)械臂運(yùn)動(dòng)學(xué)模型

    對(duì)本文研究的空間自由漂浮機(jī)械臂系統(tǒng)建立運(yùn)動(dòng)學(xué)模型,因?yàn)闄C(jī)械臂基座固定連接在航天器平臺(tái)上,其在捕捉操作期間無控且不受重力影響,所以在機(jī)械臂執(zhí)行動(dòng)作期間會(huì)與平臺(tái)產(chǎn)生動(dòng)力學(xué)耦合情況。

    由于推導(dǎo)過程較為基礎(chǔ),在此僅給出重要環(huán)節(jié)公式,具體的推導(dǎo)過程可參考文獻(xiàn)[25]。針對(duì)文中機(jī)械臂,根據(jù)一般力學(xué)原理可得機(jī)械臂末端在慣性坐標(biāo)系下的位置矢量re、速度矢量ve和角速度矢量ωe,具體表達(dá)式為

    (1)

    式中:r0為空間飛行器質(zhì)心在慣性系中的位置矢量;b0為關(guān)節(jié)1相對(duì)于平臺(tái)質(zhì)心的位置矢量;ai為桿件i相對(duì)于關(guān)節(jié)i的位置矢量;bi為關(guān)節(jié)i+1相對(duì)于桿件i的位置矢量;v0、ω0分別為平臺(tái)在慣性系中的速度矢量和角速度矢量;ki為關(guān)節(jié)i旋轉(zhuǎn)單位矢量;ri為連桿i的位置矢量;qi為關(guān)節(jié)i的旋轉(zhuǎn)角度;“·”表示求導(dǎo)。由于本文研究的機(jī)械臂末端關(guān)節(jié)有位置偏移,所以不能將關(guān)節(jié)質(zhì)心作為末端位置進(jìn)行捕捉結(jié)果判斷。

    對(duì)自由漂浮機(jī)械臂應(yīng)用動(dòng)量守恒分析,設(shè)定初始時(shí)刻線動(dòng)量和角動(dòng)量均為0,則得到以下多剛體系統(tǒng)約束:

    (2)

    式中:m0為平臺(tái)質(zhì)量;mLi和mJi分別為連桿i和關(guān)節(jié)i的質(zhì)量;pi為關(guān)節(jié)i的位置矢量;I0、ILi、IJi分別為平臺(tái)、連桿i和關(guān)節(jié)i的轉(zhuǎn)動(dòng)慣量矩陣;ωLi、ωJi分別為連桿i和關(guān)節(jié)i的角速度矢量。

    本文為小型機(jī)械臂系統(tǒng),關(guān)節(jié)質(zhì)量較輕,在學(xué)習(xí)訓(xùn)練過程中可以將同一序號(hào)的關(guān)節(jié)和連桿視為整體,進(jìn)而降低計(jì)算復(fù)雜度。由此得到自由漂浮機(jī)器人的動(dòng)量守恒方程為

    (3)

    (4)

    式中:rL0i表示桿件i指向平臺(tái)質(zhì)心的位置矢量;JTLi、JRLi分別為機(jī)械臂切向和徑向轉(zhuǎn)動(dòng)慣量。

    由式(3)和式(4)進(jìn)一步推導(dǎo)求解,可得自由漂浮空間機(jī)械臂系統(tǒng)的運(yùn)動(dòng)學(xué)方程為

    (5)

    式中:Js為平臺(tái)Jacobi矩陣;Jm為定基座機(jī)械臂Jacobi矩陣,此處不予贅述;re0為末端相對(duì)平臺(tái)的位置矢量。

    1.3 空間機(jī)械臂系統(tǒng)動(dòng)力學(xué)模型

    本文以拉格朗日法為基礎(chǔ)推導(dǎo)動(dòng)力學(xué)模型。機(jī)械臂系統(tǒng)的總動(dòng)能為各部件動(dòng)能之和,每個(gè)桿件和關(guān)節(jié)動(dòng)能可由其質(zhì)心線速度動(dòng)能和轉(zhuǎn)動(dòng)角速度動(dòng)能組成,則自由漂浮空間機(jī)械臂系統(tǒng)的總動(dòng)能為

    (6)

    式中:mi為部件質(zhì)量;vi為部件慣性系下速度矢量;Ii為部件轉(zhuǎn)動(dòng)慣量;ωi為部件角速度矢量。將1.2節(jié)中運(yùn)動(dòng)學(xué)方程代入可得:

    (7)

    其中:Hφ為定基座機(jī)械臂慣性張量矩陣,其表達(dá)式為

    (8)

    則有整個(gè)系統(tǒng)的拉格朗日動(dòng)力學(xué)方程為

    (9)

    式中:cb為平臺(tái)本體牽連速度的非線性項(xiàng),本研究中設(shè)定為常值;cm為機(jī)械臂牽連速度的非線性項(xiàng),本研究中設(shè)為常值;Fb為基體所受外力及外力矩,前文中已假設(shè)為0;τm為機(jī)械臂關(guān)節(jié)力矩。

    2 多智能體深度強(qiáng)化學(xué)習(xí)軌跡規(guī)劃

    2.1 改進(jìn)深度確定性策略梯度算法分析

    因?yàn)檩d具平臺(tái)處于自由漂浮狀態(tài),數(shù)學(xué)模型無法完全描述系統(tǒng)的非完整性約束。機(jī)械臂從收攏狀姿態(tài)到捕捉姿態(tài)的軌跡規(guī)劃可以看作其運(yùn)動(dòng)過程中一系列的動(dòng)作決策行為,每個(gè)關(guān)節(jié)可視為一個(gè)決策智能體,最終的軌跡即為所有關(guān)節(jié)序列決策的集合。為了解決機(jī)械臂與環(huán)境交互無法精確建模和決策序列集合生成的問題,本文采用深度神經(jīng)網(wǎng)絡(luò)對(duì)捕捉軌跡規(guī)劃策略進(jìn)行逼近。

    由于機(jī)械臂展開抓捕動(dòng)作為連續(xù)動(dòng)作,其用于評(píng)價(jià)的Q值函數(shù)不易精確設(shè)計(jì),因此采用了策略梯度方法解決該問題。策略梯度算法可以通過最大化期望累積獎(jiǎng)勵(lì)來直接優(yōu)化策略[26]??紤]到目標(biāo)移動(dòng)和環(huán)境的隨機(jī)性,使用評(píng)價(jià)器擬合累積獎(jiǎng)勵(lì),此評(píng)價(jià)器被稱為Critic。針對(duì)機(jī)械臂關(guān)節(jié)運(yùn)動(dòng)取值連續(xù),搜索空間較大的問題,為了縮小隨機(jī)策略訓(xùn)練過程的樣本空間,本文采用了確定性策略梯度方法。確定性策略梯度算法訓(xùn)練過程中同時(shí)學(xué)習(xí)Q函數(shù)和策略,對(duì)Q函數(shù)的學(xué)習(xí)是為了實(shí)現(xiàn)對(duì)環(huán)境適度探索。本文算法中執(zhí)行器(Actor)和評(píng)價(jià)器(Critic)均采用雙網(wǎng)絡(luò)結(jié)構(gòu),分別稱為決策網(wǎng)絡(luò)和估計(jì)網(wǎng)絡(luò)。在訓(xùn)練過程中直接對(duì)各自估計(jì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。決策網(wǎng)絡(luò)由對(duì)應(yīng)估計(jì)網(wǎng)絡(luò)每隔一段時(shí)間進(jìn)行優(yōu)選后保存;評(píng)價(jià)器的決策網(wǎng)絡(luò)同時(shí)輸入所有智能體的聯(lián)合動(dòng)作和外部觀測(cè)值,對(duì)自身某一動(dòng)作對(duì)環(huán)境產(chǎn)生的影響進(jìn)行評(píng)價(jià)。

    下面將給出本文所用多智能體深度強(qiáng)化學(xué)習(xí)理論公式。深度強(qiáng)化學(xué)習(xí)過程中,智能體與環(huán)境進(jìn)行交互,期間智能體的決策過程可以用馬爾科夫決策過程(Markov Decision Process, MDP)進(jìn)行描述。MDP模型是一個(gè)五元組(S,A,Ptrans,R,γ),分別對(duì)應(yīng)于狀態(tài)空間、動(dòng)作空間、轉(zhuǎn)移函數(shù)、獎(jiǎng)勵(lì)函數(shù)和折扣因子。對(duì)于第i個(gè)智能體的執(zhí)行器Pi和評(píng)價(jià)器Qi的定義分別為

    (10)

    訓(xùn)練過程評(píng)價(jià)器策略優(yōu)化的目標(biāo)函數(shù)為

    (11)

    式中:E為貝爾曼方程;y代表當(dāng)前累計(jì)獎(jiǎng)勵(lì),由迭代而來,為區(qū)別于當(dāng)前動(dòng)作,累計(jì)獎(jiǎng)勵(lì)相關(guān)變量使用“′”表示。然后通過梯度下降法更新網(wǎng)絡(luò)參數(shù),對(duì)應(yīng)的梯度計(jì)算函數(shù)為

    (12)

    從式(12)可以看出策略損失的梯度即為策略函數(shù)梯度與評(píng)價(jià)函數(shù)梯度的近似數(shù)學(xué)期望。

    為了提高訓(xùn)練效率,學(xué)習(xí)過程中設(shè)置了經(jīng)驗(yàn)池機(jī)制,決策網(wǎng)絡(luò)定期抽取經(jīng)驗(yàn)池信息進(jìn)行訓(xùn)練,考慮到經(jīng)驗(yàn)池中案例質(zhì)量分布不均,本文設(shè)計(jì)了一種優(yōu)先抽取高質(zhì)量經(jīng)驗(yàn)的方法。設(shè)計(jì)如下經(jīng)驗(yàn)案例抽取優(yōu)先級(jí)Pr(k)公式:

    (13)

    2.2 在線捕捉自學(xué)習(xí)系統(tǒng)設(shè)計(jì)

    本文的主要工作聚焦于建立自學(xué)習(xí)系統(tǒng),通過訓(xùn)練使漂浮機(jī)械臂具備自主捕捉軌跡規(guī)劃能力。在2.1節(jié)中已經(jīng)提到,對(duì)于每個(gè)智能體都將建立4個(gè)雙隱層全連接神經(jīng)網(wǎng)絡(luò):執(zhí)行器的估計(jì)網(wǎng)絡(luò)(ActorE)用于策略迭代更新;執(zhí)行器決策網(wǎng)絡(luò)(ActorD)用于經(jīng)驗(yàn)池采樣交互,其網(wǎng)絡(luò)參數(shù)定期從ActorE處更新;評(píng)價(jià)器估計(jì)網(wǎng)絡(luò)(CriticE)負(fù)責(zé)價(jià)值函數(shù)迭代更新,為當(dāng)前ActorE的行為更新Q值;評(píng)價(jià)器決策網(wǎng)絡(luò)(CriticD)負(fù)責(zé)計(jì)算全局獎(jiǎng)勵(lì),其網(wǎng)絡(luò)參數(shù)定期從CriticE處更新。訓(xùn)練系統(tǒng)架構(gòu)示意圖如圖3所示,其中r1,r2,…,rn為各智能體的回報(bào)值。

    本文采用集中訓(xùn)練分布執(zhí)行的方式進(jìn)行仿真,由于訓(xùn)練過程中評(píng)價(jià)器決策網(wǎng)絡(luò)的輸入為環(huán)境狀態(tài)和所有智能體的聯(lián)合動(dòng)作,所以其輸出的評(píng)價(jià)值函數(shù)已經(jīng)包含了對(duì)多智能體協(xié)同的指導(dǎo)信息。分布式執(zhí)行過程中各智能體執(zhí)行器決策網(wǎng)絡(luò)無需溝通,在訓(xùn)練回合數(shù)足夠大的情況下,完全可以通過訓(xùn)練實(shí)現(xiàn)全部協(xié)同,而不需要再單獨(dú)建立相關(guān)機(jī)制。但在未來算法改進(jìn)中可以加入智能體交流機(jī)制,使得協(xié)同性進(jìn)一步提升。

    為了進(jìn)一步提高算法執(zhí)行效率,本文設(shè)計(jì)了以機(jī)械臂末端位置與目標(biāo)相對(duì)距離dT和總操作時(shí)間t為參數(shù)的獎(jiǎng)勵(lì)函數(shù):

    (14)

    式中:ep為動(dòng)力學(xué)參數(shù)評(píng)價(jià)項(xiàng)。由式(14)可以看出,當(dāng)目標(biāo)距離越遠(yuǎn)則回報(bào)值越小,當(dāng)操作用時(shí)越長(zhǎng)則回報(bào)值越小,如果捕捉成功則獲得固定回報(bào)值。對(duì)于任意智能體,環(huán)境交互得到的獎(jiǎng)勵(lì)值是相同的。評(píng)價(jià)器輸入了聯(lián)合動(dòng)作信息,得到評(píng)價(jià)值不是只受單獨(dú)關(guān)節(jié)動(dòng)作影響。為了提高算法速度,超過關(guān)節(jié)運(yùn)動(dòng)限制的問題在運(yùn)動(dòng)學(xué)中處理,不計(jì)入獎(jiǎng)勵(lì)函數(shù)。

    本文所述多智能體深度強(qiáng)化學(xué)習(xí)軌跡規(guī)劃訓(xùn)練算法流程如算法1所示。

    算法1 改進(jìn)確定性策略梯度算法1.初始化各Agent的ActorE網(wǎng)絡(luò)參數(shù)θpe、ActorD網(wǎng)絡(luò)參數(shù)θpd、CriticE網(wǎng)絡(luò)參數(shù)θQe、CriticD網(wǎng)絡(luò)參數(shù)θQd2.初始化經(jīng)驗(yàn)池ψ,設(shè)定各超參數(shù)3.for episode = 1 to Max_epi do4. 初始化環(huán)境S和各智能體網(wǎng)絡(luò)參數(shù)5. 設(shè)定仿真步長(zhǎng)step和最長(zhǎng)仿真總時(shí)間Tsim6. 隨機(jī)生成初始聯(lián)合動(dòng)作集合a=[a1 a2 … an]7. 更新狀態(tài)S',得到初始獎(jiǎng)勵(lì)R0,將案例存儲(chǔ)到經(jīng)驗(yàn)池8. do while time i

    從以上步驟可以看出,在每個(gè)回合中,評(píng)價(jià)器的決策網(wǎng)絡(luò)能夠接收全局信息,進(jìn)而指導(dǎo)執(zhí)行器更新網(wǎng)絡(luò),集中訓(xùn)練的協(xié)同性由此體現(xiàn)。規(guī)劃算法通過環(huán)境、智能體執(zhí)行器、智能體評(píng)價(jià)器三者交互來迭代訓(xùn)練策略網(wǎng)絡(luò)。最終形成的智能體執(zhí)行器決策網(wǎng)絡(luò)θpd即為空間漂浮機(jī)械臂捕捉行為軌跡規(guī)劃器。

    3 仿真數(shù)據(jù)與分析

    3.1 仿真條件

    操作系統(tǒng)環(huán)境為Windows10 x64,使用軟件工具包版本為TensorFlow 2.1.0。硬件信息為Intel i5-9600K、GTX1060、DDR4 16 GB、240 GB SSD。網(wǎng)絡(luò)訓(xùn)練環(huán)境是基于Python 3.7修改Open AI開源代碼搭建的。仿真驗(yàn)證和數(shù)據(jù)處理均在MATLAB 2018b環(huán)境下實(shí)現(xiàn)。

    在訓(xùn)練過程中,動(dòng)力學(xué)模型計(jì)算后如果機(jī)械臂達(dá)到平臺(tái)邊界,則案例會(huì)被直接放棄,重新選擇動(dòng)作??臻g勻速直線運(yùn)動(dòng)小球的初始位置隨機(jī)選擇在以基座質(zhì)心為球心,半徑為5 m的半球形包絡(luò)內(nèi),速度vtar取值不超過0.4 m/s,速度方向矢量與小球位置矢量ptar有如下關(guān)系:

    (15)

    式中:dtar為球心與基座間距離;p0為基座位置矢量。

    仿真中每個(gè)智能體4個(gè)神經(jīng)網(wǎng)絡(luò)均采用雙隱層32節(jié)點(diǎn)全連接網(wǎng)絡(luò)。各神經(jīng)網(wǎng)絡(luò)的輸入輸出信息參見表3,其中關(guān)節(jié)末端位置由機(jī)械臂正運(yùn)動(dòng)學(xué)解算得出。

    表中的聯(lián)合動(dòng)作指所有智能體的動(dòng)作合集,聯(lián)合動(dòng)作獎(jiǎng)勵(lì)值即為環(huán)境反饋的動(dòng)作獎(jiǎng)勵(lì)值,僅是為了區(qū)分輸入給對(duì)應(yīng)網(wǎng)絡(luò)。從表3中可以看出,執(zhí)行器和評(píng)價(jià)器的神經(jīng)網(wǎng)絡(luò)均為高維輸入低維輸出。執(zhí)行器神經(jīng)網(wǎng)絡(luò)要完成空間坐標(biāo)向角度映射,所以激活函數(shù)采用tanh函數(shù)。評(píng)價(jià)器網(wǎng)絡(luò)僅為數(shù)值求解,本文采用常見的sigmoid函數(shù)作為激活函數(shù)。

    本文采用文獻(xiàn)[16]中滾動(dòng)RRT+比例導(dǎo)引算法作為對(duì)比算法,該算法將目標(biāo)捕捉過程分為2個(gè)多約束階段,在初始階段使用滾動(dòng)RRT算法提高搜索能力,在捕捉階段使用比例導(dǎo)引算法提高接近速度。該方法技術(shù)細(xì)節(jié)可參照文獻(xiàn)[16],不予贅述。

    表3 各神經(jīng)網(wǎng)絡(luò)輸入輸出參數(shù)Table 3 Input and output parameters of neural networks

    3.2 仿真結(jié)果與數(shù)據(jù)分析

    由于本文中算法沒有完整數(shù)據(jù)集可以用作對(duì)比分析,評(píng)價(jià)算法優(yōu)劣的方法主要有2個(gè)方面:① 獎(jiǎng)勵(lì)值曲線變化趨勢(shì),最終獎(jiǎng)勵(lì)值越高則算法越好,獎(jiǎng)勵(lì)值曲線收斂速度越快則算法收斂性越好;② 算法所得決策網(wǎng)絡(luò)在環(huán)境下的表現(xiàn),動(dòng)作執(zhí)行情況越好,則算法性能越好。因?yàn)闆]有類似自學(xué)習(xí)規(guī)劃算法可以進(jìn)行比較,所以在后文仿真中,重點(diǎn)對(duì)比了決策網(wǎng)絡(luò)在實(shí)際場(chǎng)景中的表現(xiàn)情況,作為算法主要評(píng)價(jià)依據(jù)。

    本文算法可以用平均回報(bào)值方差或結(jié)果誤差值方差判斷作為終止條件。但設(shè)定此條件后,總訓(xùn)練回合數(shù)隨機(jī)性過大,無法進(jìn)行對(duì)比展示。所以采用人為確定回合數(shù)。仿真實(shí)驗(yàn)首先對(duì)經(jīng)驗(yàn)案例有無優(yōu)先抽取機(jī)制進(jìn)行了仿真,經(jīng)過20萬回合訓(xùn)練后,得到平均獎(jiǎng)勵(lì)隨訓(xùn)練回合數(shù)增長(zhǎng)曲線如圖4所示。圖中綠色曲線訓(xùn)練時(shí)采用了優(yōu)先級(jí)抽取機(jī)制,藍(lán)色曲線訓(xùn)練過程中未使用優(yōu)先級(jí)機(jī)制。由圖可知當(dāng)采取案例優(yōu)先抽取機(jī)制時(shí),平均獎(jiǎng)勵(lì)曲線收斂速度得到了較大提高。

    通過增大仿真回合數(shù)檢驗(yàn)算法收斂趨勢(shì)。經(jīng)過25萬回合的仿真訓(xùn)練后,得到如圖5所示的平均獎(jiǎng)勵(lì)曲線,圖中藍(lán)色曲線為15萬回合自學(xué)習(xí)訓(xùn)練過程平均獎(jiǎng)勵(lì)值曲線,紅色曲線為25萬回合訓(xùn)練平均獎(jiǎng)勵(lì)值曲線。

    因?yàn)槭褂昧讼嗤亩嘀悄荏w強(qiáng)化學(xué)習(xí)算法,可以看到兩個(gè)曲線趨勢(shì)大體相似。但紅色曲線在21萬回合附近訓(xùn)練后期,出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象。分析該現(xiàn)象產(chǎn)生原因,因?yàn)闄C(jī)械臂系統(tǒng)具有完整的約束模型,且訓(xùn)練過程中不存在外部擾動(dòng)或噪聲,所以分析認(rèn)為是空間小球目標(biāo)的初始位置隨機(jī)性波動(dòng)也被學(xué)習(xí)系統(tǒng)訓(xùn)練學(xué)習(xí)了。

    多智能體強(qiáng)化學(xué)習(xí)系統(tǒng)訓(xùn)練結(jié)束后,執(zhí)行器的決策網(wǎng)絡(luò)訓(xùn)練成型。設(shè)定空間小球的初始位置為ptar=[-1,-0.5,5.8] m,運(yùn)動(dòng)目標(biāo)的初始速度為vtar=[-0.082,-0.037,0.042] m/s,分別使用該規(guī)劃決策器和滾動(dòng)RRT算法對(duì)該場(chǎng)景進(jìn)行機(jī)械臂軌跡規(guī)劃仿真,得到仿真曲線。圖6為多智能體規(guī)劃決策器規(guī)劃生成的捕捉過程各關(guān)節(jié)轉(zhuǎn)角曲線,圖7為對(duì)比算法生成的關(guān)節(jié)轉(zhuǎn)角曲線。

    對(duì)比圖6和圖7可以看出:在同一場(chǎng)景下,本文提出的算法用時(shí)約為5.6 s,而對(duì)比算法規(guī)劃耗時(shí)約為7.4 s,可見本文算法規(guī)劃效率更高。文中所提出的算法規(guī)劃所得曲線較為平滑,而對(duì)比算法規(guī)劃所得關(guān)節(jié)轉(zhuǎn)角曲線相對(duì)較粗糙。相比之下,本文算法魯棒性更強(qiáng)。

    2種算法在規(guī)劃前期曲線都存在抖動(dòng)。本文所述算法前期抖動(dòng)的原因是無法直接跟蹤移動(dòng)目標(biāo),且機(jī)械臂展開初始階段存在多種可能構(gòu)型,所以產(chǎn)生了曲線抖動(dòng)現(xiàn)象,隨著捕捉過程的推進(jìn),曲線逐漸變得平滑。而對(duì)比算法前期抖動(dòng)較為明顯,因?yàn)樵撍惴ㄒ?guī)劃前期使用RRT方法,該方法具有隨機(jī)搜索特性,在初始階段就產(chǎn)生了非必要的探索行為,中期算法交替時(shí)又耗費(fèi)時(shí)間進(jìn)行軌跡誤差補(bǔ)償,這是影響算法效率的因素之一。對(duì)比算法規(guī)劃后期因?yàn)槭褂帽壤龑?dǎo)引方法,規(guī)劃效率明顯提高,且關(guān)節(jié)角曲線趨于平滑。

    圖8為本文算法在該仿真場(chǎng)景中規(guī)劃所得軌跡對(duì)應(yīng)的平臺(tái)姿態(tài)擾動(dòng)角曲線圖,擾動(dòng)角曲線并非在決策器規(guī)劃過程中決定,而是規(guī)劃軌跡生成后由動(dòng)力學(xué)模型解算得到。從圖8中可以看出,機(jī)械臂捕捉動(dòng)作對(duì)漂浮平臺(tái)的擾動(dòng)較小,各向擾動(dòng)角度均不超過10°,由此也可看出本文算法的有效性和可行性。

    為了進(jìn)一步揭示空間目標(biāo)與機(jī)械臂基座距離和捕捉軌跡規(guī)劃耗時(shí)的關(guān)系,分別對(duì)2種算法進(jìn)行了1 000組不同初始狀態(tài)的規(guī)劃仿真,對(duì)仿真結(jié)果進(jìn)行統(tǒng)計(jì)分析,在1.5 m≤dtar<2.5 m時(shí)本文算法捕捉規(guī)劃平均耗時(shí)4.2 s,對(duì)比算法平均耗時(shí)3.6 s;在2.5 m≤dtar<3.5 m時(shí)本文算法平均耗時(shí)5.2 s,對(duì)比算法平均耗時(shí)5.7 s;在3.5 m≤dtar<4.5 m時(shí)本文算法平均耗時(shí)5.7 s,對(duì)比算法平均耗時(shí)7.4 s。于是得到如圖9所示柱狀圖。從圖中可以看出,在目標(biāo)距離較近時(shí)本文算法規(guī)劃軌跡較慢,此時(shí)RRT+比例導(dǎo)引方法規(guī)劃效率更高。隨著距離增加,本文方法規(guī)劃效率有所提高。分析其中原因,RRT的隨機(jī)搜索方法在短距離規(guī)劃中具有一定優(yōu)勢(shì),其在長(zhǎng)距離規(guī)劃中必然會(huì)消耗更多時(shí)間來探索執(zhí)行空間,所以長(zhǎng)距離規(guī)劃中效率不如本文算法。

    對(duì)上述1 000次仿真中2種算法耗時(shí)情況進(jìn)行統(tǒng)計(jì),本文所述算法得到平均捕捉完成耗時(shí)為5.4 s,對(duì)比算法平均耗時(shí)為6.3 s,由此可見本文算法規(guī)劃效率更高。

    4 結(jié) 論

    1) 本文在機(jī)械臂運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)分析基礎(chǔ)上,提出了基于多智能體系統(tǒng)的強(qiáng)化學(xué)習(xí)機(jī)械臂軌跡規(guī)劃方法。

    2) 應(yīng)用本文算法可以快速對(duì)空間捕捉問題進(jìn)行規(guī)劃和處理,平均捕捉動(dòng)作完成耗時(shí)5.4 s,相比前人算法規(guī)劃效率更高。

    3) 仿真結(jié)果表明,本文算法規(guī)劃所得軌跡曲線更平滑,相比前人算法魯棒性更強(qiáng),具有很強(qiáng)的實(shí)際工程應(yīng)用價(jià)值。

    猜你喜歡
    軌跡決策機(jī)械
    為可持續(xù)決策提供依據(jù)
    軌跡
    軌跡
    調(diào)試機(jī)械臂
    決策為什么失誤了
    軌跡
    簡(jiǎn)單機(jī)械
    進(jìn)化的軌跡(一)——進(jìn)化,無盡的適應(yīng)
    機(jī)械班長(zhǎng)
    按摩機(jī)械臂
    大片免费播放器 马上看| 男女无遮挡免费网站观看| 精品一区二区三卡| 日韩熟女老妇一区二区性免费视频| 午夜福利在线观看吧| 精品国产乱码久久久久久小说| 高清在线国产一区| 国产精品久久久久久精品电影小说| 热re99久久精品国产66热6| 巨乳人妻的诱惑在线观看| 午夜福利免费观看在线| 中文欧美无线码| 日本一区二区免费在线视频| 国产精品 欧美亚洲| 亚洲国产欧美网| 一边摸一边做爽爽视频免费| 日本欧美视频一区| 国产精品自产拍在线观看55亚洲 | 午夜福利,免费看| 亚洲一码二码三码区别大吗| 亚洲国产av影院在线观看| 正在播放国产对白刺激| 我要看黄色一级片免费的| 蜜桃国产av成人99| 99精品欧美一区二区三区四区| 电影成人av| 极品人妻少妇av视频| 亚洲色图综合在线观看| 狂野欧美激情性bbbbbb| 亚洲国产看品久久| 天天躁狠狠躁夜夜躁狠狠躁| 无限看片的www在线观看| 成年动漫av网址| videos熟女内射| 飞空精品影院首页| avwww免费| 精品国产乱码久久久久久男人| 99精品久久久久人妻精品| 制服人妻中文乱码| 国产亚洲一区二区精品| 久久亚洲国产成人精品v| 中亚洲国语对白在线视频| av片东京热男人的天堂| 亚洲 欧美一区二区三区| 一边摸一边做爽爽视频免费| 欧美黑人欧美精品刺激| 99精品久久久久人妻精品| 精品国内亚洲2022精品成人 | 亚洲精品久久久久久婷婷小说| 欧美一级毛片孕妇| 老司机影院成人| 少妇精品久久久久久久| 国产成人精品久久二区二区91| 国产成人欧美在线观看 | www.精华液| 无限看片的www在线观看| 十八禁高潮呻吟视频| 性高湖久久久久久久久免费观看| av福利片在线| 黑人操中国人逼视频| 中文字幕制服av| 国产一区二区三区综合在线观看| 久久精品亚洲av国产电影网| xxxhd国产人妻xxx| 亚洲国产成人一精品久久久| 久久久水蜜桃国产精品网| a级毛片在线看网站| 大码成人一级视频| 欧美性长视频在线观看| 热99久久久久精品小说推荐| 成年人黄色毛片网站| 色视频在线一区二区三区| 亚洲精品成人av观看孕妇| 久久久精品免费免费高清| a级片在线免费高清观看视频| 国产日韩欧美在线精品| 99国产精品一区二区蜜桃av | 男女下面插进去视频免费观看| 日本黄色日本黄色录像| 欧美精品高潮呻吟av久久| 午夜福利乱码中文字幕| 午夜影院在线不卡| 欧美黑人精品巨大| 精品亚洲成a人片在线观看| 97在线人人人人妻| 久久精品熟女亚洲av麻豆精品| 亚洲国产看品久久| 国产高清视频在线播放一区 | 亚洲国产欧美一区二区综合| 久久性视频一级片| 亚洲人成电影免费在线| 亚洲国产欧美在线一区| 欧美大码av| 午夜福利视频精品| 日韩 亚洲 欧美在线| 精品国产超薄肉色丝袜足j| 国产亚洲精品第一综合不卡| 国产91精品成人一区二区三区 | 国产精品久久久av美女十八| 蜜桃国产av成人99| 黄色视频,在线免费观看| 在线永久观看黄色视频| 午夜精品国产一区二区电影| 十八禁高潮呻吟视频| kizo精华| 欧美xxⅹ黑人| 久久香蕉激情| 高清av免费在线| 丁香六月欧美| 侵犯人妻中文字幕一二三四区| 乱人伦中国视频| 久久精品国产亚洲av香蕉五月 | 啦啦啦视频在线资源免费观看| 搡老熟女国产l中国老女人| 久久久久久免费高清国产稀缺| 乱人伦中国视频| 亚洲情色 制服丝袜| 欧美激情极品国产一区二区三区| 青春草视频在线免费观看| 久久精品人人爽人人爽视色| www.av在线官网国产| 99国产精品免费福利视频| 久久九九热精品免费| 色视频在线一区二区三区| 老熟妇仑乱视频hdxx| 女性生殖器流出的白浆| 国产97色在线日韩免费| 麻豆乱淫一区二区| 日韩三级视频一区二区三区| 日本撒尿小便嘘嘘汇集6| 欧美乱码精品一区二区三区| 97在线人人人人妻| 久久免费观看电影| 国产99久久九九免费精品| 午夜视频精品福利| 精品人妻熟女毛片av久久网站| 日本av免费视频播放| 亚洲欧美日韩高清在线视频 | 每晚都被弄得嗷嗷叫到高潮| 中文字幕人妻熟女乱码| 亚洲国产精品999| 欧美精品高潮呻吟av久久| 国产亚洲精品第一综合不卡| 久久精品国产a三级三级三级| 亚洲av成人不卡在线观看播放网 | 99久久99久久久精品蜜桃| 国产极品粉嫩免费观看在线| 亚洲av电影在线进入| 久久亚洲精品不卡| 久久久精品免费免费高清| 考比视频在线观看| 国产成人精品久久二区二区91| 狠狠婷婷综合久久久久久88av| 国产精品久久久久久人妻精品电影 | 亚洲成人国产一区在线观看| 岛国在线观看网站| 又黄又粗又硬又大视频| 午夜激情av网站| 美女午夜性视频免费| 国产又色又爽无遮挡免| 国产欧美日韩精品亚洲av| 国内毛片毛片毛片毛片毛片| 国产成人精品无人区| 国产黄色免费在线视频| 亚洲国产精品成人久久小说| 美国免费a级毛片| 亚洲欧美日韩另类电影网站| 国产淫语在线视频| 久久女婷五月综合色啪小说| 老司机午夜十八禁免费视频| 欧美 亚洲 国产 日韩一| 精品亚洲成a人片在线观看| 亚洲欧美一区二区三区黑人| av又黄又爽大尺度在线免费看| 亚洲精品国产av成人精品| av天堂在线播放| 国产成人精品在线电影| 成人国语在线视频| a级毛片黄视频| 国产淫语在线视频| 免费人妻精品一区二区三区视频| 国产成人av激情在线播放| 日韩中文字幕欧美一区二区| 久久久水蜜桃国产精品网| 99香蕉大伊视频| 久久 成人 亚洲| 午夜两性在线视频| 99国产精品免费福利视频| 午夜老司机福利片| www日本在线高清视频| 免费少妇av软件| 51午夜福利影视在线观看| 在线av久久热| 手机成人av网站| 1024香蕉在线观看| 亚洲欧美成人综合另类久久久| 精品少妇内射三级| 午夜视频精品福利| 天堂中文最新版在线下载| 99香蕉大伊视频| 日韩免费高清中文字幕av| 免费黄频网站在线观看国产| 亚洲av欧美aⅴ国产| www.精华液| 97人妻天天添夜夜摸| 精品一品国产午夜福利视频| 亚洲人成电影观看| 黄色怎么调成土黄色| 国产在线一区二区三区精| 国产男女超爽视频在线观看| 少妇的丰满在线观看| 免费日韩欧美在线观看| 久久久精品免费免费高清| 久久久久久久久久久久大奶| 日韩制服骚丝袜av| 精品少妇内射三级| 在线观看免费视频网站a站| 久久久久久久久久久久大奶| 天堂8中文在线网| 韩国高清视频一区二区三区| 欧美日本中文国产一区发布| 午夜久久久在线观看| av免费在线观看网站| 亚洲精品一二三| 嫁个100分男人电影在线观看| 黄片播放在线免费| 精品人妻1区二区| 日韩人妻精品一区2区三区| 男女高潮啪啪啪动态图| 99热全是精品| 中文字幕制服av| 高清在线国产一区| 国产av精品麻豆| 1024视频免费在线观看| 国产av又大| av一本久久久久| 水蜜桃什么品种好| 日韩视频在线欧美| 久热这里只有精品99| 国产一区二区激情短视频 | 精品一区二区三区四区五区乱码| 桃花免费在线播放| 亚洲伊人久久精品综合| 制服诱惑二区| 精品久久蜜臀av无| 国产1区2区3区精品| 精品福利观看| 少妇精品久久久久久久| 精品人妻熟女毛片av久久网站| 51午夜福利影视在线观看| 电影成人av| 中文字幕色久视频| 看免费av毛片| 侵犯人妻中文字幕一二三四区| 日韩视频在线欧美| 亚洲精华国产精华精| 亚洲天堂av无毛| 啦啦啦在线免费观看视频4| 另类精品久久| 亚洲精品久久久久久婷婷小说| 亚洲精品av麻豆狂野| 国产又爽黄色视频| 欧美黄色淫秽网站| 一二三四在线观看免费中文在| 国产在线视频一区二区| 午夜激情久久久久久久| 好男人电影高清在线观看| 国产黄色免费在线视频| 一级毛片精品| 久久精品国产亚洲av香蕉五月 | 91精品三级在线观看| 性少妇av在线| 欧美亚洲日本最大视频资源| 丝袜美腿诱惑在线| 日日夜夜操网爽| 美女午夜性视频免费| 一区二区av电影网| 国产精品1区2区在线观看. | 国产精品一二三区在线看| 国产精品九九99| 精品欧美一区二区三区在线| 亚洲精品在线美女| av超薄肉色丝袜交足视频| 免费一级毛片在线播放高清视频 | 日韩欧美国产一区二区入口| 纵有疾风起免费观看全集完整版| 老司机亚洲免费影院| 午夜福利,免费看| 日韩一卡2卡3卡4卡2021年| 水蜜桃什么品种好| 人妻一区二区av| 黑人猛操日本美女一级片| 亚洲精品国产区一区二| 女人久久www免费人成看片| 青草久久国产| 日韩有码中文字幕| 免费在线观看视频国产中文字幕亚洲 | 18禁观看日本| 免费在线观看完整版高清| 一区在线观看完整版| 欧美国产精品一级二级三级| 日本五十路高清| 岛国毛片在线播放| 成在线人永久免费视频| www.熟女人妻精品国产| 亚洲精品成人av观看孕妇| 国产免费av片在线观看野外av| 99久久国产精品久久久| 亚洲一区中文字幕在线| 91成人精品电影| 亚洲九九香蕉| 日本a在线网址| 搡老熟女国产l中国老女人| 午夜福利乱码中文字幕| 亚洲成人国产一区在线观看| 菩萨蛮人人尽说江南好唐韦庄| 超碰成人久久| 一区福利在线观看| 在线观看免费日韩欧美大片| 中文精品一卡2卡3卡4更新| 秋霞在线观看毛片| 1024香蕉在线观看| 18禁裸乳无遮挡动漫免费视频| 欧美国产精品va在线观看不卡| 一区福利在线观看| 午夜影院在线不卡| 国产成人精品无人区| 一区二区三区四区激情视频| 国产精品国产av在线观看| 黄频高清免费视频| 亚洲情色 制服丝袜| 一个人免费看片子| 黄片小视频在线播放| 午夜成年电影在线免费观看| av天堂在线播放| 亚洲国产精品一区二区三区在线| 高清在线国产一区| 久久人人97超碰香蕉20202| 黄色视频,在线免费观看| 丰满迷人的少妇在线观看| 国产野战对白在线观看| 香蕉国产在线看| 国产亚洲一区二区精品| 永久免费av网站大全| 亚洲中文日韩欧美视频| 日韩制服丝袜自拍偷拍| 母亲3免费完整高清在线观看| 热re99久久国产66热| 少妇被粗大的猛进出69影院| 1024视频免费在线观看| 国产精品一区二区精品视频观看| 亚洲av日韩精品久久久久久密| 日韩有码中文字幕| 午夜免费鲁丝| 超碰成人久久| 桃红色精品国产亚洲av| 各种免费的搞黄视频| 夫妻午夜视频| 黄网站色视频无遮挡免费观看| 在线观看免费视频网站a站| 69精品国产乱码久久久| 一边摸一边抽搐一进一出视频| 日本91视频免费播放| 精品一区二区三区四区五区乱码| 亚洲国产精品成人久久小说| 啦啦啦 在线观看视频| 午夜老司机福利片| 激情视频va一区二区三区| 精品国产一区二区三区久久久樱花| 欧美另类一区| 又紧又爽又黄一区二区| 香蕉丝袜av| av又黄又爽大尺度在线免费看| 热re99久久精品国产66热6| 精品国产乱码久久久久久男人| 亚洲精品乱久久久久久| 91字幕亚洲| 免费观看人在逋| netflix在线观看网站| 亚洲久久久国产精品| a级毛片在线看网站| 免费av中文字幕在线| 99久久人妻综合| 亚洲精华国产精华精| 少妇 在线观看| 国产伦人伦偷精品视频| 黑人操中国人逼视频| 日韩视频一区二区在线观看| 青春草亚洲视频在线观看| 欧美+亚洲+日韩+国产| 黄色视频,在线免费观看| 正在播放国产对白刺激| 黑人巨大精品欧美一区二区蜜桃| 久久精品成人免费网站| 亚洲精品久久午夜乱码| 丁香六月天网| 亚洲国产欧美一区二区综合| 午夜久久久在线观看| 久久久久视频综合| 又大又爽又粗| 国产精品 欧美亚洲| 老司机亚洲免费影院| 黄色怎么调成土黄色| 午夜福利视频精品| 悠悠久久av| 日韩欧美一区二区三区在线观看 | av电影中文网址| 老司机影院成人| 久久久久久人人人人人| 欧美变态另类bdsm刘玥| 亚洲av日韩在线播放| 老司机午夜福利在线观看视频 | 亚洲av男天堂| 欧美国产精品va在线观看不卡| 亚洲欧洲日产国产| 免费日韩欧美在线观看| 大陆偷拍与自拍| 亚洲国产av新网站| 一区二区日韩欧美中文字幕| 久久久国产成人免费| 久久久久国产精品人妻一区二区| 久久久精品免费免费高清| 老司机午夜福利在线观看视频 | 国产男女超爽视频在线观看| 国产男女内射视频| 十八禁高潮呻吟视频| 纵有疾风起免费观看全集完整版| 在线十欧美十亚洲十日本专区| 国产精品国产av在线观看| 十分钟在线观看高清视频www| a 毛片基地| 69av精品久久久久久 | 一级毛片女人18水好多| 少妇 在线观看| 日本五十路高清| 日韩熟女老妇一区二区性免费视频| 每晚都被弄得嗷嗷叫到高潮| 国产高清国产精品国产三级| 一本—道久久a久久精品蜜桃钙片| 午夜精品久久久久久毛片777| 国产成+人综合+亚洲专区| 12—13女人毛片做爰片一| 欧美精品亚洲一区二区| 91老司机精品| 少妇的丰满在线观看| 人人妻人人添人人爽欧美一区卜| 又黄又粗又硬又大视频| 国产精品久久久久久精品古装| 在线观看免费视频网站a站| 亚洲国产欧美日韩在线播放| 日韩熟女老妇一区二区性免费视频| 精品人妻1区二区| 老司机靠b影院| 国产亚洲一区二区精品| 建设人人有责人人尽责人人享有的| 亚洲成人免费电影在线观看| 精品一区二区三卡| 肉色欧美久久久久久久蜜桃| 日本vs欧美在线观看视频| 亚洲av日韩在线播放| videosex国产| 亚洲国产精品一区二区三区在线| 免费在线观看日本一区| 国产av一区二区精品久久| 一本色道久久久久久精品综合| 国产精品免费视频内射| 99国产综合亚洲精品| 免费在线观看视频国产中文字幕亚洲 | 亚洲国产精品999| 高清在线国产一区| 久久中文看片网| 老司机福利观看| 新久久久久国产一级毛片| 精品久久久久久电影网| 老熟女久久久| 中文字幕人妻丝袜一区二区| 啦啦啦在线免费观看视频4| 人人妻人人爽人人添夜夜欢视频| 看免费av毛片| 黄色视频不卡| 欧美日韩亚洲国产一区二区在线观看 | 亚洲av美国av| 国产一区二区三区av在线| 国产免费一区二区三区四区乱码| 久久久久视频综合| 汤姆久久久久久久影院中文字幕| 一级片'在线观看视频| 中文字幕精品免费在线观看视频| videos熟女内射| 男女下面插进去视频免费观看| 成年女人毛片免费观看观看9 | 国产高清国产精品国产三级| 国产一级毛片在线| 大陆偷拍与自拍| e午夜精品久久久久久久| 脱女人内裤的视频| 欧美激情 高清一区二区三区| 美女主播在线视频| 婷婷成人精品国产| 一级片免费观看大全| 激情视频va一区二区三区| 十八禁人妻一区二区| 亚洲伊人久久精品综合| 国产日韩欧美亚洲二区| 国产国语露脸激情在线看| 又紧又爽又黄一区二区| 免费看十八禁软件| 777久久人妻少妇嫩草av网站| 久久精品人人爽人人爽视色| 亚洲精华国产精华精| 精品福利观看| 久久人妻福利社区极品人妻图片| 九色亚洲精品在线播放| 久久免费观看电影| 淫妇啪啪啪对白视频 | 日本欧美视频一区| 久久中文字幕一级| 女人爽到高潮嗷嗷叫在线视频| 一区二区三区激情视频| 午夜影院在线不卡| 99热国产这里只有精品6| 亚洲精品一区蜜桃| 可以免费在线观看a视频的电影网站| 久久中文看片网| 婷婷丁香在线五月| 日韩精品免费视频一区二区三区| 国产激情久久老熟女| 两性午夜刺激爽爽歪歪视频在线观看 | 黄片播放在线免费| 精品人妻1区二区| 欧美精品一区二区大全| 老熟妇乱子伦视频在线观看 | 少妇粗大呻吟视频| 爱豆传媒免费全集在线观看| 天天影视国产精品| 亚洲av国产av综合av卡| 中文字幕精品免费在线观看视频| 人妻一区二区av| av一本久久久久| 国产91精品成人一区二区三区 | 欧美激情久久久久久爽电影 | 51午夜福利影视在线观看| 中文欧美无线码| 国产亚洲欧美精品永久| 我要看黄色一级片免费的| 黄色 视频免费看| avwww免费| 性少妇av在线| 又黄又粗又硬又大视频| 韩国精品一区二区三区| 欧美日韩成人在线一区二区| 国产成+人综合+亚洲专区| 搡老岳熟女国产| 一进一出抽搐动态| 国产亚洲av高清不卡| 国产一区二区三区在线臀色熟女 | 我要看黄色一级片免费的| 啦啦啦啦在线视频资源| 国产欧美亚洲国产| 夜夜夜夜夜久久久久| 色婷婷久久久亚洲欧美| 啦啦啦免费观看视频1| 一区二区三区精品91| 亚洲avbb在线观看| 一边摸一边做爽爽视频免费| 在线永久观看黄色视频| 免费观看人在逋| 精品高清国产在线一区| 宅男免费午夜| 日韩一卡2卡3卡4卡2021年| 美女国产高潮福利片在线看| 俄罗斯特黄特色一大片| 国产极品粉嫩免费观看在线| 黑人欧美特级aaaaaa片| 亚洲精品一二三| 18禁黄网站禁片午夜丰满| 老司机影院成人| 午夜精品国产一区二区电影| 日韩视频一区二区在线观看| 黑人猛操日本美女一级片| 无限看片的www在线观看| 午夜两性在线视频| 91av网站免费观看| 精品欧美一区二区三区在线| 国产亚洲av高清不卡| 19禁男女啪啪无遮挡网站| a在线观看视频网站| av在线播放精品| 无遮挡黄片免费观看| 99热网站在线观看| 黑人巨大精品欧美一区二区mp4| 搡老岳熟女国产| 国产日韩一区二区三区精品不卡| 久久久水蜜桃国产精品网| 中文字幕色久视频| 狠狠精品人妻久久久久久综合| 欧美日韩视频精品一区| h视频一区二区三区| 99九九在线精品视频| 成年人黄色毛片网站| 啦啦啦免费观看视频1| 久久综合国产亚洲精品| 国产野战对白在线观看| 国产亚洲午夜精品一区二区久久| 国产成人欧美| 18禁黄网站禁片午夜丰满| 一边摸一边做爽爽视频免费| 黄色片一级片一级黄色片| av一本久久久久| 国产精品二区激情视频| 一区二区三区精品91| 一本久久精品| 高清黄色对白视频在线免费看| 日韩中文字幕欧美一区二区| 久久精品国产亚洲av香蕉五月 |