• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Sarsa(λ)強(qiáng)化學(xué)習(xí)的空間機(jī)械臂路徑規(guī)劃研究

    2019-05-09 10:02:08帷,盧
    宇航學(xué)報(bào) 2019年4期
    關(guān)鍵詞:離線機(jī)械狀態(tài)

    徐 帷,盧 山

    (1. 上海航天控制技術(shù)研究所,上海 201109;2. 上海市空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 201109)

    0 引 言

    近年來(lái),航天任務(wù)的日益發(fā)展對(duì)航天器的結(jié)構(gòu)和功能提出了大型化和復(fù)雜化等要求,這使得在軌服務(wù)與操作技術(shù)在諸如航天器在軌維修、模塊更換甚至大型航天器在軌建造等方向具有極大的應(yīng)用前景,但同時(shí)也存在操作的安全性和穩(wěn)定性方面的較大挑戰(zhàn)。傳統(tǒng)的研究思路是借助于操作航天器上的多源相對(duì)狀態(tài)敏感器,由航天員或地面人員遙操作決策,對(duì)捕獲機(jī)構(gòu)、飛網(wǎng)或艙外機(jī)械臂等執(zhí)行機(jī)構(gòu)輸出相應(yīng)指令以實(shí)現(xiàn)對(duì)相對(duì)狀態(tài)的控制[1]。由于存在信號(hào)傳輸?shù)奶斓卮蠡芈窌r(shí)延、不同人決策經(jīng)驗(yàn)的相異性等因素,這種完全由人參與的在軌操作都有局限性。因此,國(guó)外最新研究主要是針對(duì)在軌操作的自主、智能化任務(wù)規(guī)劃和決策等方向開(kāi)展的[2]。

    空間機(jī)械臂由于可利用冗余自由度來(lái)同時(shí)實(shí)現(xiàn)對(duì)目標(biāo)的捕獲和障礙物回避等復(fù)雜操作,從而易于實(shí)現(xiàn)在軌的精細(xì)化操作,因此和其他執(zhí)行機(jī)構(gòu)相比具有較大的應(yīng)用前景。為實(shí)現(xiàn)對(duì)其的平穩(wěn)控制,相關(guān)學(xué)者在其路徑規(guī)劃方面進(jìn)行了深入研究。陳鋼等[3]利用一種主任務(wù)零空間的重復(fù)運(yùn)動(dòng)規(guī)劃方法對(duì)關(guān)節(jié)角速度進(jìn)行規(guī)劃,減小了關(guān)節(jié)角與基座位姿在運(yùn)動(dòng)過(guò)程中的漂移。黃興宏等[4]將軌跡規(guī)劃問(wèn)題轉(zhuǎn)換為最優(yōu)控制問(wèn)題,設(shè)計(jì)了一種全程恒定基座姿態(tài)零擾動(dòng)的末端位姿軌跡規(guī)劃方法。以上文獻(xiàn)[3-4]均未涉及障礙物避碰問(wèn)題。王悅等[5]提出一種試探性規(guī)劃算法,通過(guò)碰撞檢測(cè)、無(wú)碰撞目標(biāo)構(gòu)型求解、無(wú)碰撞路徑搜索算法和路徑平滑等步驟,在C空間中搜索出一條能使機(jī)械臂不與障礙發(fā)生碰撞且末端到達(dá)目標(biāo)點(diǎn)的路徑,但該方法只適用于靜態(tài)障礙物環(huán)境,且在平滑曲線時(shí)需要人工干預(yù)以合理地劃分運(yùn)動(dòng)段。文獻(xiàn)[6]基于非線性模型預(yù)測(cè)理論提出了一種避障方法,但臂桿到障礙距離的約束構(gòu)造存在一定困難。Montiel等[7]采用一種人工勢(shì)場(chǎng)法,實(shí)現(xiàn)了復(fù)雜動(dòng)態(tài)環(huán)境下的避障路徑規(guī)劃,但是此方法是根據(jù)局部信息計(jì)算獲得規(guī)劃結(jié)果,容易產(chǎn)生局部極小值而使得機(jī)械臂在障礙物附近反復(fù)運(yùn)動(dòng)造成任務(wù)失敗。羊帆等[8]基于障礙物偽距離技術(shù),采用逆幾何模型求解期望末端位姿下的連桿偽距離估計(jì)值構(gòu)造避障約束條件,進(jìn)而通過(guò)求解非線性優(yōu)化問(wèn)題,獲得避障期望軌跡。

    上述傳統(tǒng)思路大部分可總結(jié)為在特定的本體動(dòng)力學(xué)、目標(biāo)及障礙特性情況下對(duì)最優(yōu)規(guī)劃策略的研究。當(dāng)存在更復(fù)雜的環(huán)境未知且不確定情況時(shí),這些方法的魯棒性和可行性都面臨一定疑問(wèn)。強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要分支,智能體通過(guò)與環(huán)境的交互,在多次試錯(cuò)過(guò)程中接收從環(huán)境獲得的評(píng)價(jià)反饋,逐漸學(xué)習(xí)得到不同環(huán)境狀態(tài)下的最優(yōu)行為策略[9-10]。由于滿足馬爾科夫過(guò)程的強(qiáng)化學(xué)習(xí)無(wú)需環(huán)境精確模型和先驗(yàn)知識(shí),而僅需感知環(huán)境狀態(tài),就能完成從環(huán)境狀態(tài)到動(dòng)作映射的學(xué)習(xí),且其在線運(yùn)行時(shí)還能針對(duì)動(dòng)態(tài)變化的環(huán)境進(jìn)行策略的實(shí)時(shí)修正,因此能夠克服傳統(tǒng)決策方法的不足,在機(jī)器人決策與控制領(lǐng)域已經(jīng)得到一定應(yīng)用[11-13]。

    借鑒上述相關(guān)研究成果,本文以空間機(jī)械臂末端目標(biāo)跟蹤捕獲及全臂的避障任務(wù)為研究背景,在對(duì)機(jī)械臂-目標(biāo)-障礙進(jìn)行三維空間運(yùn)動(dòng)學(xué)關(guān)系分析的基礎(chǔ)上,設(shè)計(jì)符合強(qiáng)化學(xué)習(xí)應(yīng)用要求的二維狀態(tài)變量和擬合獎(jiǎng)賞函數(shù),利用結(jié)合資格跡的Sarsa(λ)強(qiáng)化學(xué)習(xí)算法進(jìn)行各臂轉(zhuǎn)動(dòng)動(dòng)作的強(qiáng)化訓(xùn)練,仿真結(jié)果表明由本算法得到的各臂的最終狀態(tài)-動(dòng)作值函數(shù)表可作為機(jī)械臂在線路徑規(guī)劃的決策依據(jù),該表后期在線自主調(diào)整能力亦較強(qiáng),因而驗(yàn)證了本算法較強(qiáng)的魯棒性和智能性。

    1 Sarsa(λ)強(qiáng)化學(xué)習(xí)

    圖1 強(qiáng)化學(xué)習(xí)基本框架Fig.1 Basic frame of reinforcement learning

    強(qiáng)化學(xué)習(xí)一般需要對(duì)隨機(jī)與離散狀態(tài)這一類問(wèn)題進(jìn)行建模。在實(shí)際應(yīng)用中,最常采用的是馬爾可夫決策過(guò)程(MDP)。現(xiàn)實(shí)中MDP四元組E=S,A,P,R往往很難得知,該情形下的強(qiáng)化學(xué)習(xí)稱為免模型學(xué)習(xí)[14]。與批處理式的、通過(guò)多次采樣求取平均積累獎(jiǎng)賞來(lái)作為期望積累獎(jiǎng)賞的Monte Carlo方法相比,時(shí)序差分方法在每次試探后都利用即時(shí)獲得的獎(jiǎng)賞信號(hào)對(duì)狀態(tài)-動(dòng)作值函數(shù)Q(s,a)進(jìn)行增量式更新,因此具有較強(qiáng)的實(shí)時(shí)性和在線學(xué)習(xí)能力。

    (1)

    Agent的動(dòng)作選擇通常采用ε-貪心策略或者Softmax算法。這兩種算法的基本思想都是確定狀態(tài)動(dòng)作值函數(shù)Q(si,ai)到動(dòng)作ai在狀態(tài)si下被選擇概率的映射。這兩種策略表示如下:

    πε-greedy(s,a)=

    (2)

    (3)

    式中:A為動(dòng)作集中包含的基本動(dòng)作數(shù)量。

    由式(2)可見(jiàn),ε-貪心策略中最大的Q值對(duì)應(yīng)的動(dòng)作被選擇的概率最大,其他動(dòng)作的概率相等;而Softmax策略中各動(dòng)作的概率依據(jù)其對(duì)應(yīng)Q值不同形成Boltzmann分布,同時(shí)通過(guò)溫度參數(shù)T可進(jìn)一步調(diào)節(jié)各動(dòng)作被“探索”和“利用”的隨機(jī)水平。由于Softmax策略的靈活性,本文選擇其作為空間機(jī)械臂規(guī)劃訓(xùn)練時(shí)的動(dòng)作選擇策略。

    式(1)表示的基本Sarsa算法與有效跡結(jié)合可獲得學(xué)習(xí)收斂速度更快的Sarsa(λ)算法[15]。有效跡et可按下式進(jìn)行遞推表示:

    et+1(s,a)=

    (4)

    式中:γ是折扣因子,而λ是衰減系數(shù)。由式(4)可見(jiàn),某狀態(tài)被訪問(wèn)且其下某動(dòng)作被選擇得越頻繁,對(duì)應(yīng)的資格跡衰減得越慢,因此有效跡可看做是狀態(tài)-動(dòng)作對(duì)(s,a)被訪問(wèn)的頻次的一種體現(xiàn)。

    Sarsa(λ)算法即是將有效跡加入基本Sarsa算法的值函數(shù)增量式更新部分:

    (5)

    2 空間機(jī)械臂運(yùn)動(dòng)學(xué)分析

    工程中常見(jiàn)的空間機(jī)械臂具有六或七個(gè)自由度結(jié)構(gòu)。圖2所示為典型六自由度靈巧操作機(jī)械臂,分別由2個(gè)肩關(guān)節(jié)(A和B)、一個(gè)肘關(guān)節(jié)(C)以及三個(gè)腕關(guān)節(jié)(D、E和F)組成。

    圖2 空間多自由度機(jī)械臂分解結(jié)構(gòu)Fig.2 Breakdown structure of multi DOF space manipulator

    2.1 路徑規(guī)劃問(wèn)題描述

    由圖2可見(jiàn),機(jī)械臂末端在工作空間中所能到達(dá)的位置由六個(gè)關(guān)節(jié)所轉(zhuǎn)動(dòng)的角度共同決定。但是,最末的兩個(gè)關(guān)節(jié)E和F主要決定機(jī)械臂末端安裝的操作器在本體系下的姿態(tài);對(duì)于大范圍運(yùn)動(dòng)目標(biāo)跟蹤這種粗捕獲任務(wù)而言,對(duì)末端定位起主要作用的還是A~D四個(gè)關(guān)節(jié)自由度。因此,對(duì)于本文研究的路徑規(guī)劃和決策問(wèn)題,可以將六自由度結(jié)構(gòu)進(jìn)行合理簡(jiǎn)化,用圖3所示的模型進(jìn)行描述。

    圖3中Oxyz為機(jī)械臂在平臺(tái)上的安裝基準(zhǔn)坐標(biāo)系。θ1~θ4分別為兩個(gè)肩關(guān)節(jié)、一個(gè)肘關(guān)節(jié)a和一個(gè)腕關(guān)節(jié)b相對(duì)于其零位的轉(zhuǎn)角,當(dāng)這4個(gè)轉(zhuǎn)角均為零時(shí),機(jī)械臂初始零位沿x軸方向伸展。W為機(jī)械臂的工作平面(圖3中虛線框所示),由肩關(guān)節(jié)一的實(shí)時(shí)轉(zhuǎn)動(dòng)角度θ1確定,而其后的各關(guān)節(jié)及對(duì)應(yīng)三節(jié)臂桿(長(zhǎng)度分別為l1、l2及l(fā)3)、末端點(diǎn)c均在W平面內(nèi)運(yùn)動(dòng)。T為末端點(diǎn)c期望跟蹤的目標(biāo)點(diǎn),M為障礙物,其在W面內(nèi)的旋轉(zhuǎn)投影點(diǎn)(即T繞z軸旋轉(zhuǎn)至到達(dá)W平面內(nèi)的點(diǎn))分別為T′和M′。

    2.2 空間點(diǎn)的幾何關(guān)系

    在作仿真分析時(shí),圖3所示的各點(diǎn)在運(yùn)動(dòng)過(guò)程中的空間坐標(biāo)按如下方法計(jì)算:

    (6)

    點(diǎn)T′和T(xT,yT,zT)、點(diǎn)M′和M(xM,yM,zM)的關(guān)系為:

    (7)

    3 Sarsa(λ)強(qiáng)化學(xué)習(xí)路徑規(guī)劃

    3.1 環(huán)境狀態(tài)設(shè)計(jì)

    根據(jù)2.1節(jié)描述,環(huán)境狀態(tài)s的設(shè)計(jì)需要能夠體現(xiàn)末端點(diǎn)c對(duì)目標(biāo)T的偏離以及各agent相對(duì)障礙M的距離。因此,這里設(shè)計(jì)由目標(biāo)偏差和障礙距離組成的二維狀態(tài)。設(shè)決策θ1~θ4轉(zhuǎn)角變化量a1~a4的智能體編號(hào)為AG1~AG4。

    對(duì)于AG1而言,其主要作用是讓AG2~AG4所在的工作平面W能夠到達(dá)T(即T=T′)。在該過(guò)程中,W有可能會(huì)多次經(jīng)過(guò)M(即M=M′),但這往往是無(wú)法避免的,對(duì)M的回避主要由AG2~AG4的轉(zhuǎn)動(dòng)來(lái)實(shí)現(xiàn)。因此,AG1對(duì)應(yīng)的目標(biāo)偏差ΔT1和障礙距離ΔM1可分別定義為點(diǎn)T和T′以及M和M′相對(duì)于z軸的張角,即:

    (8)

    對(duì)于AG2~AG4而言,各關(guān)節(jié)轉(zhuǎn)動(dòng)只會(huì)對(duì)c在W面內(nèi)的位置產(chǎn)生影響,當(dāng)c到達(dá)T′時(shí),才算完成面內(nèi)目標(biāo)跟蹤的任務(wù)。因此,ΔT2~ΔT4表示為:

    (9)

    由式(9)可見(jiàn),ΔTi(i=2,3,4)主要體現(xiàn)了c和T′對(duì)各關(guān)節(jié)的張角;在實(shí)際工程應(yīng)用中,通過(guò)傳感器感知該張角是容易實(shí)現(xiàn)的。

    同時(shí)M與特定AGi(i=2,3,4)的距離只需考慮該臂桿線段范圍而不是整條直線,因此可考慮采用橢圓形狀的障礙距離程度評(píng)價(jià),此時(shí)臂桿兩端點(diǎn)為橢圓焦點(diǎn),當(dāng)M在運(yùn)動(dòng)過(guò)程中位于同一個(gè)橢圓上時(shí),可認(rèn)為其與臂桿的距離程度相等,發(fā)生碰撞的危險(xiǎn)性相同。以AG2為例,上述障礙距離程度如圖4所示,ΔM2-ΔM4按照式(10)進(jìn)行計(jì)算。

    圖4 橢圓形障礙距離程度判據(jù)Fig.4 Elliptic criterion for degree of obstacle distance

    (10)

    需要說(shuō)明的是,機(jī)械臂在實(shí)際工作環(huán)境中可能有多個(gè)障礙,實(shí)際應(yīng)用中AGi只需選取感知到實(shí)時(shí)距離程度最近的障礙進(jìn)行后續(xù)環(huán)境狀態(tài)的判斷。

    將上述分析的目標(biāo)偏差ΔTi和障礙距離ΔMi組成二維狀態(tài)向量Si=ΔTi,ΔMi,Si即可作為AGi對(duì)自身所處完整環(huán)境的感知依據(jù)。由式(1)可知,Sarsa算法的實(shí)施需要對(duì)不同狀態(tài)及動(dòng)作分配存儲(chǔ)空間,以記錄值函數(shù)Q(sj,ak),因此為避免數(shù)據(jù)處理過(guò)程中的“維數(shù)災(zāi)”問(wèn)題,這里首先對(duì)連續(xù)二維狀態(tài)Si進(jìn)行離散化劃分。如圖5所示,對(duì)于AG2~AG4,將ΔTi和ΔMi各分為6段(QS=Quite Small,S=Small,M=Middle,B=Big,VB=Very Big,QB=Quite Big;NB=Negative Big,NM=Negative Middle,NS=Negative Small,PS=Positive Small,PM=Positive Middle,PB=Positive Big),則二維狀態(tài)空間被劃分為36個(gè)區(qū)間(對(duì)每個(gè)區(qū)間對(duì)應(yīng)的二維狀態(tài)分別用兩位數(shù)字進(jìn)行編號(hào))。如圖6所示,AG1的狀態(tài)劃分類似,但ΔMi可為正負(fù),所以原點(diǎn)位置有所不同。

    圖5 AG2~AG4二維狀態(tài)空間S2~S4離散劃分Fig.5 Discrete division of two-dimensional state space S2~S4 for AG2~AG4

    圖6 AG1二維狀態(tài)空間S1離散劃分Fig.6 Discrete division of two-dimensional state space S1 for AG1

    3.2 獎(jiǎng)賞函數(shù)設(shè)計(jì)

    3.3 路徑規(guī)劃算法流程

    基于上述分析,基于Sarsa(λ)強(qiáng)化學(xué)習(xí)的路徑規(guī)劃算法流程如下。

    1)初始化:AGi下,對(duì)?si∈Si,ai∈Ai,令Q(si,ai)=0,e(si,ai)=0,其中Q(si,ai)和e(si,ai)分別代表si所位于的離散狀態(tài)區(qū)間下動(dòng)作ai的值函數(shù)和有效跡;設(shè)定初始溫度參數(shù)T0、試探次數(shù)Pi=0、學(xué)習(xí)周期數(shù)Ei=0;

    2)AGi感知二維狀態(tài)si(0),并依據(jù)式(3)按一定概率選擇一個(gè)動(dòng)作ai(0);

    3)AGi執(zhí)行所選擇的動(dòng)作ai(0);

    4)AGi感知下一時(shí)刻狀態(tài)si(1);Pi++,Ti=T0/Pi;并依據(jù)式(3)按一定概率選擇動(dòng)作ai(1);

    5)根據(jù)環(huán)境轉(zhuǎn)移狀態(tài)si(1)從擬合獎(jiǎng)賞函數(shù)反饋獎(jiǎng)賞值Ri[ΔTi(1),ΔMi(1)];用式(5)更新Q[si(0),ai(0)]、e[si(0),ai(0)];

    6)判斷:若至少滿足以下兩條件之一,則轉(zhuǎn)7);否則轉(zhuǎn)8);

    條件①:AGi與障礙物相碰;

    條件②:末端點(diǎn)c到達(dá)目標(biāo)附近;

    7)Ei++,Pi=0;判斷:若Ei達(dá)到設(shè)定上限值,則結(jié)束學(xué)習(xí),否則依據(jù)式(3)重新選擇動(dòng)作ai(1),并轉(zhuǎn)8)。

    8)狀態(tài)及動(dòng)作更新:si(0)←si(1),ai(0)←ai(1),轉(zhuǎn)3)。

    4 仿真校驗(yàn)

    本部分通過(guò)在Matlab R2014a環(huán)境下建立的模型進(jìn)行仿真,驗(yàn)證上述路徑規(guī)劃各設(shè)計(jì)步驟的有效性和工程實(shí)用性。

    4.1 仿真參數(shù)

    機(jī)械臂結(jié)構(gòu)及初始構(gòu)型參數(shù)、障礙與目標(biāo)相對(duì)于基準(zhǔn)坐標(biāo)系的運(yùn)動(dòng)情況及強(qiáng)化學(xué)習(xí)算法參數(shù)如表1~3所示,設(shè)ω1=0.03 rad/s、ω2=0.015 rad/s。用于擬合獎(jiǎng)賞函數(shù)的離散二維狀態(tài)點(diǎn)及對(duì)應(yīng)的獎(jiǎng)賞值如表4~5所示。

    由表4可見(jiàn),ΔMi愈大,ΔTi的絕對(duì)值愈小,則

    表1 仿真初始參數(shù)Table 1 Simulation parameter

    表2 目標(biāo)運(yùn)動(dòng)參數(shù)Table 2 Target moving parameter

    表4 AG2~AG4獎(jiǎng)賞函數(shù)擬合數(shù)據(jù)Table 4 Data used for reward function fitting of AG2~AG4

    表5 AG1獎(jiǎng)賞函數(shù)擬合數(shù)據(jù)Table 5 Data used for reward function fitting of AG1

    從環(huán)境反饋的獎(jiǎng)賞值愈大,表示對(duì)實(shí)現(xiàn)目標(biāo)跟蹤及避障的獎(jiǎng)勵(lì);反之,ΔMi愈小,ΔTi的絕對(duì)值愈大,則從環(huán)境反饋的獎(jiǎng)賞值愈小,表示對(duì)狀態(tài)背離任務(wù)目標(biāo)的懲罰。表5亦可作類似的解讀。

    將表4和表5數(shù)據(jù)用雙立方插值方法進(jìn)行曲面擬合,可得到如圖7和圖8所示的連續(xù)二維狀態(tài)空間上的光滑獎(jiǎng)賞函數(shù)曲面。

    圖7 AG2~AG4擬合獎(jiǎng)賞函數(shù)Fig.7 Fitted reward function for AG2~AG4

    圖8 AG1擬合獎(jiǎng)賞函數(shù)Fig.8 Fitted reward function for AG1

    圖7和圖8分別為ΔMi和ΔTi在最小到最大數(shù)據(jù)點(diǎn)范圍內(nèi)的擬合曲面,為保證算法能平穩(wěn)收斂,二維狀態(tài)空間所有區(qū)域上的獎(jiǎng)賞值必須有界,這只需對(duì)圖中ΔMi、ΔTi范圍邊界上的擬合值進(jìn)行水平延展即可,此時(shí)拓展二維狀態(tài)空間上的最大、最小值和圖中的最大、最小值相等。

    4.2 仿真結(jié)果及分析

    根據(jù)上述條件開(kāi)展仿真分析,步長(zhǎng)0.1 s,即每0.1 s執(zhí)行一次Sarsa(λ)路徑規(guī)劃學(xué)習(xí)算法,仿真主要分為兩階段。第一階段為離線訓(xùn)練階段,即0~50 s內(nèi)目標(biāo)靜止于初始位置,各臂桿智能體通過(guò)Sarsa(λ)強(qiáng)化學(xué)習(xí)算法尋找機(jī)械臂末端點(diǎn)c能夠跟蹤目標(biāo)T的無(wú)碰撞聯(lián)合構(gòu)型。如圖9所示,經(jīng)反復(fù)探索,機(jī)械臂從初始沿x軸平行伸展的構(gòu)型逐漸變換到末端點(diǎn)c穩(wěn)定位于T附近且與障礙物無(wú)碰撞的構(gòu)型,這主要是通過(guò)動(dòng)作集A中大范圍搜索動(dòng)作(±5°、±2°)配合小范圍調(diào)整動(dòng)作(±0.88°、±0.31°)以及靜止動(dòng)作(0°)實(shí)現(xiàn)的。第二階段為在線應(yīng)用階段,即50 s之后目標(biāo)開(kāi)始作表1所示的三軸空間運(yùn)動(dòng),該階段主要考察離線訓(xùn)練階段對(duì)環(huán)境狀態(tài)和相應(yīng)動(dòng)作策略學(xué)習(xí)的效果,模擬空間機(jī)械臂執(zhí)行捕獲連續(xù)運(yùn)動(dòng)目標(biāo)同時(shí)避障的任務(wù)情況。如圖10所示,機(jī)械臂隨目標(biāo)T的運(yùn)動(dòng)作相應(yīng)構(gòu)型調(diào)整,使得末端點(diǎn)c始終跟隨T的運(yùn)動(dòng)。在機(jī)械臂工作平面W將要到達(dá)障礙M時(shí),臂桿Oa及ab及時(shí)調(diào)整構(gòu)型做了避讓動(dòng)作,同時(shí)c依然對(duì)T實(shí)現(xiàn)了穩(wěn)定跟蹤。

    圖9 離線訓(xùn)練過(guò)程Fig.9 Off line training process

    圖10 在線應(yīng)用過(guò)程Fig.10 On line application process

    圖11 全過(guò)程ΔMi、ΔTi及cT′變化情況Fig.11 Curves of ΔMi, ΔTi and cT′ during entire process

    如圖11所示,各agent在兩個(gè)仿真階段都實(shí)現(xiàn)了任務(wù)目標(biāo)。在離線訓(xùn)練階段(0~50 s),ΔT1逐漸收斂到零附近,表示工作平面W及時(shí)到達(dá)了目標(biāo)T。同時(shí)由于此時(shí)障礙M也恰好位于W內(nèi),所以ΔM1同期也減小到零。此時(shí)AG2~AG4各臂桿開(kāi)始調(diào)整構(gòu)型并做出避讓動(dòng)作,在50 s時(shí)基本實(shí)現(xiàn)避障及目標(biāo)跟蹤。在線應(yīng)用階段,ΔT1除了在ΔM1過(guò)零時(shí)間段附近有少量抖動(dòng)外,其他時(shí)間都為零,表示工作平面W能跟蹤運(yùn)動(dòng)目標(biāo)T,以及W到達(dá)障礙M時(shí)需要根據(jù)實(shí)際環(huán)境作進(jìn)一步學(xué)習(xí)判斷;AG2~AG4的聯(lián)合動(dòng)作能夠保證對(duì)M的避讓同時(shí)末端點(diǎn)c穩(wěn)定跟蹤T′,在穩(wěn)定跟蹤階段,規(guī)劃精度達(dá)到ΔT1優(yōu)于1°、cT′優(yōu)于10(由于強(qiáng)化學(xué)習(xí)的特性,在線應(yīng)用階段在達(dá)到目的后仍然要在T附近進(jìn)行試探,所以仿真曲線上體現(xiàn)出微幅振蕩性,實(shí)際工程應(yīng)用中可用平滑濾波方法進(jìn)行處理。)

    圖12 全過(guò)程Pi及Ei變化情況Fig.12 Curves of Piand Ei during entire process

    如圖12所示,離線訓(xùn)練階段由于要探索并形成初始策略,故第一個(gè)Ei下Pi增長(zhǎng)較大,在初始策略形成后,以后只需根據(jù)環(huán)境的變化做少量的探索就可以保證對(duì)T的跟蹤和M的避讓。

    離線訓(xùn)練階段最終的二維狀態(tài)-動(dòng)作值函數(shù)如表6所示(以AG1為例)。

    由表6可知,50 s離線訓(xùn)練結(jié)束時(shí)的狀態(tài)-動(dòng)作值函數(shù)表體現(xiàn)了經(jīng)過(guò)探索試錯(cuò)形成的狀態(tài)-動(dòng)作映射策略。例如在狀態(tài)S22下,動(dòng)作-2°的值函數(shù)最大,即AG1選擇讓?duì)?轉(zhuǎn)動(dòng)-2°的概率最大。對(duì)照?qǐng)D6可知,狀態(tài)S22對(duì)應(yīng)于ΔM1和ΔT1均為Negative Middle,此時(shí)轉(zhuǎn)角θ1確實(shí)需要中等程度地減小,才能使得工作平面盡快達(dá)到目標(biāo)T,而選擇動(dòng)作-2°則恰好符合這種要求,其他狀態(tài)下的動(dòng)作值函數(shù)亦可作類似解讀。以上分析驗(yàn)證了訓(xùn)練所得策略的正確性,因而可作為機(jī)械臂在線路徑規(guī)劃的決策依據(jù)。

    表6 AG1部分狀態(tài)-動(dòng)作值離線訓(xùn)練結(jié)果Table 6 Off line training result of partial state-action value for AG1

    5 結(jié) 論

    針對(duì)自主化、智能化在軌精細(xì)操作的任務(wù)需求,本文將機(jī)器學(xué)習(xí)領(lǐng)域的強(qiáng)化學(xué)習(xí)思想應(yīng)用于對(duì)空間多自由度機(jī)械臂的路徑規(guī)劃技術(shù)研究,設(shè)計(jì)了一種基于Sarsa(λ)算法的機(jī)械臂運(yùn)動(dòng)目標(biāo)跟蹤與避障方法,通過(guò)離線訓(xùn)練與在線應(yīng)用全過(guò)程的數(shù)學(xué)仿真驗(yàn)證了算法的合理性。本方法應(yīng)用過(guò)程不顯含系統(tǒng)的動(dòng)力學(xué)和運(yùn)動(dòng)學(xué)模型,也不像傳統(tǒng)方法那樣會(huì)因?yàn)檠趴杀染仃嚽竽娑菀壮霈F(xiàn)奇異問(wèn)題,因而具備一定的智能性與魯棒性,以及工程化應(yīng)用的可能性。實(shí)際工程中為便于在軌應(yīng)用,可根據(jù)空間機(jī)械臂構(gòu)型先期在地面進(jìn)行如本文仿真校驗(yàn)部分所述的離線學(xué)習(xí)訓(xùn)練,利用所得的狀態(tài)-動(dòng)作值函數(shù)表作為執(zhí)行在軌任務(wù)的初始策略依據(jù),即可進(jìn)行如本文仿真校驗(yàn)中在線應(yīng)用階段的直接運(yùn)用,同時(shí)根據(jù)在軌環(huán)境特性的變化可實(shí)現(xiàn)策略的自主在線調(diào)整。另一方面,即使不進(jìn)行地面先期離線訓(xùn)練,本文所述的方法也較適用于大型航天器的在軌制造/裝配等任務(wù)。這些任務(wù)的共同特點(diǎn)是:環(huán)境特性未知,無(wú)法完全由人參與決策制定,但是環(huán)境在較長(zhǎng)時(shí)間內(nèi)具有慢變特性,同時(shí)留給機(jī)械臂進(jìn)行精細(xì)操作的時(shí)間較充裕。這種情況下可充分進(jìn)行在線強(qiáng)化學(xué)習(xí)訓(xùn)練,發(fā)揮本方法可實(shí)現(xiàn)自主、智能化任務(wù)規(guī)劃和決策的優(yōu)勢(shì)。

    本文后續(xù)進(jìn)一步的研究方向包括提升動(dòng)作輸出平滑度的連續(xù)狀態(tài)/動(dòng)作空間的機(jī)械臂路徑規(guī)劃強(qiáng)化學(xué)習(xí)方法研究。

    猜你喜歡
    離線機(jī)械狀態(tài)
    異步電機(jī)離線參數(shù)辨識(shí)方法
    呼吸閥離線檢驗(yàn)工藝與評(píng)定探討
    淺談ATC離線基礎(chǔ)數(shù)據(jù)的準(zhǔn)備
    調(diào)試機(jī)械臂
    狀態(tài)聯(lián)想
    離線富集-HPLC法同時(shí)測(cè)定氨咖黃敏膠囊中5種合成色素
    中成藥(2018年2期)2018-05-09 07:20:09
    生命的另一種狀態(tài)
    簡(jiǎn)單機(jī)械
    機(jī)械班長(zhǎng)
    熱圖
    家庭百事通(2016年3期)2016-03-14 08:07:17
    中文字幕久久专区| av福利片在线观看| 最近最新中文字幕大全电影3| 干丝袜人妻中文字幕| 美女 人体艺术 gogo| 日本黄色片子视频| 国产中年淑女户外野战色| 精品无人区乱码1区二区| 可以在线观看的亚洲视频| 亚洲精品久久国产高清桃花| 在线观看午夜福利视频| 欧美成人一区二区免费高清观看| 18禁裸乳无遮挡免费网站照片| 午夜福利在线观看吧| 夜夜爽天天搞| 高清毛片免费观看视频网站| 99久久精品国产国产毛片| 久久久国产成人免费| 午夜精品在线福利| av女优亚洲男人天堂| 天天躁日日操中文字幕| 一区二区三区四区激情视频 | 免费av观看视频| 亚洲av中文字字幕乱码综合| 中文资源天堂在线| 伊人久久精品亚洲午夜| 在线观看舔阴道视频| 色av中文字幕| 国产在视频线在精品| 日本一本二区三区精品| 欧美潮喷喷水| 日日摸夜夜添夜夜添av毛片 | 五月玫瑰六月丁香| 亚洲综合色惰| 成年版毛片免费区| 看黄色毛片网站| 亚洲av不卡在线观看| 欧美日韩亚洲国产一区二区在线观看| 久久久国产成人精品二区| 亚洲精品乱码久久久v下载方式| 日本一本二区三区精品| 日韩一区二区视频免费看| 日韩在线高清观看一区二区三区 | 欧美日韩精品成人综合77777| 无遮挡黄片免费观看| 日本 av在线| 少妇的逼好多水| 中文字幕熟女人妻在线| 国产高清有码在线观看视频| 18禁裸乳无遮挡免费网站照片| 一级黄片播放器| 欧美另类亚洲清纯唯美| 国产又黄又爽又无遮挡在线| 午夜精品一区二区三区免费看| 天堂av国产一区二区熟女人妻| 成人精品一区二区免费| 国产精品人妻久久久久久| 特级一级黄色大片| 国产黄片美女视频| 熟女电影av网| 国内精品美女久久久久久| 国产女主播在线喷水免费视频网站 | 亚洲色图av天堂| 国产乱人伦免费视频| 日本成人三级电影网站| 欧美日韩黄片免| 久久久午夜欧美精品| 一a级毛片在线观看| 亚洲美女视频黄频| 久久精品久久久久久噜噜老黄 | 九色成人免费人妻av| 欧美性猛交黑人性爽| 狠狠狠狠99中文字幕| 午夜福利视频1000在线观看| 国产精品一区www在线观看 | 国产 一区精品| 乱人视频在线观看| 最近最新免费中文字幕在线| 一进一出抽搐动态| 国产精品久久久久久久久免| 老女人水多毛片| 亚洲中文日韩欧美视频| 亚洲va日本ⅴa欧美va伊人久久| 欧美最新免费一区二区三区| 午夜福利在线观看免费完整高清在 | 国产私拍福利视频在线观看| 女生性感内裤真人,穿戴方法视频| 99九九线精品视频在线观看视频| 少妇猛男粗大的猛烈进出视频 | 亚洲av中文字字幕乱码综合| 日韩国内少妇激情av| 久久精品91蜜桃| 国产男靠女视频免费网站| avwww免费| 免费高清视频大片| 听说在线观看完整版免费高清| 欧美成人a在线观看| 久久久色成人| 亚洲一区高清亚洲精品| 欧美日韩亚洲国产一区二区在线观看| 小蜜桃在线观看免费完整版高清| 亚洲最大成人中文| 亚洲电影在线观看av| 大型黄色视频在线免费观看| 一a级毛片在线观看| 国产一区二区激情短视频| 天天躁日日操中文字幕| 热99re8久久精品国产| 又爽又黄a免费视频| 日日摸夜夜添夜夜添av毛片 | 99riav亚洲国产免费| 成人二区视频| 中文字幕av在线有码专区| 精品福利观看| 2021天堂中文幕一二区在线观| 99热只有精品国产| 狂野欧美激情性xxxx在线观看| 男女视频在线观看网站免费| 在线免费观看不下载黄p国产 | 一a级毛片在线观看| 麻豆国产97在线/欧美| 岛国在线免费视频观看| 国产中年淑女户外野战色| 九九爱精品视频在线观看| 国产激情偷乱视频一区二区| 欧美激情久久久久久爽电影| 中文字幕av在线有码专区| 亚洲经典国产精华液单| 欧美日本亚洲视频在线播放| 婷婷六月久久综合丁香| 床上黄色一级片| 国产av不卡久久| 性插视频无遮挡在线免费观看| 麻豆国产av国片精品| 亚洲图色成人| 在线国产一区二区在线| 老熟妇乱子伦视频在线观看| 亚洲av中文av极速乱 | 精品久久久久久成人av| 色综合婷婷激情| 99视频精品全部免费 在线| 久久热精品热| 一进一出好大好爽视频| av在线天堂中文字幕| 美女cb高潮喷水在线观看| 久久草成人影院| 亚洲三级黄色毛片| 不卡视频在线观看欧美| 精品一区二区三区人妻视频| 美女免费视频网站| a级毛片a级免费在线| videossex国产| 又爽又黄无遮挡网站| 联通29元200g的流量卡| 伦理电影大哥的女人| 日本五十路高清| 亚洲精品色激情综合| 免费看美女性在线毛片视频| 亚洲欧美日韩高清专用| 极品教师在线视频| 成人欧美大片| 国产老妇女一区| 精华霜和精华液先用哪个| 嫩草影院精品99| 久9热在线精品视频| 久久草成人影院| 成人精品一区二区免费| 1000部很黄的大片| 色综合亚洲欧美另类图片| 男女之事视频高清在线观看| 免费观看的影片在线观看| 国产久久久一区二区三区| 国产精品一区二区免费欧美| netflix在线观看网站| 日韩一本色道免费dvd| 欧美精品国产亚洲| 69人妻影院| 久久久久性生活片| 99精品在免费线老司机午夜| 小说图片视频综合网站| 成人三级黄色视频| 日本精品一区二区三区蜜桃| 精品久久久久久久末码| 午夜亚洲福利在线播放| 亚洲av一区综合| 非洲黑人性xxxx精品又粗又长| 久久久精品大字幕| 一区二区三区激情视频| 精品国产三级普通话版| 乱人视频在线观看| 真人一进一出gif抽搐免费| 亚洲精品乱码久久久v下载方式| 色5月婷婷丁香| 国内精品美女久久久久久| 久久亚洲精品不卡| 深爱激情五月婷婷| 欧美xxxx性猛交bbbb| 成人欧美大片| 日韩欧美国产一区二区入口| 国产一区二区激情短视频| 给我免费播放毛片高清在线观看| 中文在线观看免费www的网站| 又黄又爽又免费观看的视频| 午夜福利18| 日韩欧美免费精品| 亚洲欧美激情综合另类| 高清在线国产一区| 麻豆成人av在线观看| 国产高清激情床上av| 偷拍熟女少妇极品色| 成年免费大片在线观看| 国产精品亚洲美女久久久| 亚洲精品一区av在线观看| 国产一区二区在线av高清观看| 成人性生交大片免费视频hd| 亚洲av成人精品一区久久| 国产午夜福利久久久久久| 国产私拍福利视频在线观看| 一区二区三区免费毛片| 日本三级黄在线观看| 国产精品99久久久久久久久| 99国产极品粉嫩在线观看| 狂野欧美激情性xxxx在线观看| 国产美女午夜福利| 午夜日韩欧美国产| 久久热精品热| 琪琪午夜伦伦电影理论片6080| 熟女人妻精品中文字幕| 国产激情偷乱视频一区二区| 中文字幕av成人在线电影| 国产精品三级大全| 99久久精品国产国产毛片| 国产在视频线在精品| 波野结衣二区三区在线| 国产免费av片在线观看野外av| av视频在线观看入口| 极品教师在线视频| 国产亚洲精品av在线| 精品人妻1区二区| 免费大片18禁| 欧美丝袜亚洲另类 | 久久中文看片网| 禁无遮挡网站| 国产在线精品亚洲第一网站| 日韩中文字幕欧美一区二区| 久久婷婷人人爽人人干人人爱| 亚洲黑人精品在线| 欧美国产日韩亚洲一区| 网址你懂的国产日韩在线| 搡女人真爽免费视频火全软件 | 久久精品影院6| a在线观看视频网站| 高清在线国产一区| 国内精品一区二区在线观看| 最新中文字幕久久久久| 中亚洲国语对白在线视频| 九九爱精品视频在线观看| 亚洲精品一卡2卡三卡4卡5卡| www.色视频.com| 97热精品久久久久久| 国产av一区在线观看免费| 小说图片视频综合网站| 99久久中文字幕三级久久日本| 国产精品久久久久久av不卡| 如何舔出高潮| 老司机深夜福利视频在线观看| 亚洲自拍偷在线| 在线观看美女被高潮喷水网站| 成年女人毛片免费观看观看9| 亚洲欧美日韩东京热| 亚洲国产精品sss在线观看| 国产高清有码在线观看视频| 很黄的视频免费| 搡老熟女国产l中国老女人| 国产三级在线视频| 欧美日韩乱码在线| 人妻久久中文字幕网| 又黄又爽又免费观看的视频| 日本色播在线视频| 国产高潮美女av| 哪里可以看免费的av片| 热99re8久久精品国产| 欧美日韩瑟瑟在线播放| 日韩欧美一区二区三区在线观看| 99久久精品国产国产毛片| 国产伦精品一区二区三区四那| 日本与韩国留学比较| 一边摸一边抽搐一进一小说| 成人美女网站在线观看视频| 嫩草影视91久久| 18禁在线播放成人免费| 一卡2卡三卡四卡精品乱码亚洲| 国产熟女欧美一区二区| 精品乱码久久久久久99久播| 别揉我奶头~嗯~啊~动态视频| 尾随美女入室| 亚洲欧美日韩无卡精品| 99在线人妻在线中文字幕| 久99久视频精品免费| av在线老鸭窝| 久久精品91蜜桃| 色综合站精品国产| 精品午夜福利视频在线观看一区| 亚洲国产高清在线一区二区三| 亚洲精品粉嫩美女一区| 亚洲人成伊人成综合网2020| 日韩国内少妇激情av| 精品一区二区免费观看| 国产欧美日韩一区二区精品| 亚洲国产日韩欧美精品在线观看| 热99在线观看视频| 亚洲黑人精品在线| 午夜精品一区二区三区免费看| 久久精品91蜜桃| 免费看美女性在线毛片视频| 国内久久婷婷六月综合欲色啪| 久久香蕉精品热| 九九热线精品视视频播放| 91麻豆av在线| 国产一级毛片七仙女欲春2| 九色成人免费人妻av| 麻豆精品久久久久久蜜桃| 成年版毛片免费区| 亚洲一级一片aⅴ在线观看| 日本黄色片子视频| h日本视频在线播放| 国产欧美日韩精品亚洲av| 麻豆精品久久久久久蜜桃| 看十八女毛片水多多多| 亚洲18禁久久av| 啦啦啦啦在线视频资源| 中文亚洲av片在线观看爽| 亚洲av日韩精品久久久久久密| 精品日产1卡2卡| ponron亚洲| 欧美成人性av电影在线观看| 99热这里只有是精品50| 国产三级中文精品| 精品免费久久久久久久清纯| 亚洲不卡免费看| 国内精品美女久久久久久| 国产精品精品国产色婷婷| 欧洲精品卡2卡3卡4卡5卡区| 日本黄大片高清| 最近视频中文字幕2019在线8| 欧美国产日韩亚洲一区| 国产精品综合久久久久久久免费| 亚洲狠狠婷婷综合久久图片| 中文字幕免费在线视频6| 动漫黄色视频在线观看| 亚洲精品国产成人久久av| 亚洲欧美精品综合久久99| 国产高清不卡午夜福利| 国产成人福利小说| 成人二区视频| 欧美区成人在线视频| 欧美性猛交黑人性爽| 精品午夜福利视频在线观看一区| 亚洲电影在线观看av| 露出奶头的视频| 老司机福利观看| 不卡一级毛片| 欧美日韩乱码在线| av在线老鸭窝| 人人妻,人人澡人人爽秒播| 毛片一级片免费看久久久久 | 国产极品精品免费视频能看的| 嫩草影院精品99| 直男gayav资源| ponron亚洲| 91在线精品国自产拍蜜月| 久久久精品大字幕| 国产午夜精品久久久久久一区二区三区 | 亚洲av中文字字幕乱码综合| 国产精品av视频在线免费观看| 亚洲成人久久爱视频| 日韩,欧美,国产一区二区三区 | 国产精品嫩草影院av在线观看 | 色噜噜av男人的天堂激情| 国产淫片久久久久久久久| 精品福利观看| 成人特级av手机在线观看| 内地一区二区视频在线| 午夜免费成人在线视频| 久久亚洲真实| 免费av观看视频| 国产亚洲91精品色在线| 亚洲av电影不卡..在线观看| av在线蜜桃| 欧美在线一区亚洲| 午夜日韩欧美国产| 91麻豆精品激情在线观看国产| 亚洲一区高清亚洲精品| 三级国产精品欧美在线观看| 美女xxoo啪啪120秒动态图| 级片在线观看| 午夜影院日韩av| 久久久国产成人免费| 中文资源天堂在线| 人人妻,人人澡人人爽秒播| 嫩草影院入口| 午夜视频国产福利| 久久久久久伊人网av| 国产精品嫩草影院av在线观看 | 国产爱豆传媒在线观看| 精品久久国产蜜桃| 欧美色欧美亚洲另类二区| 99久久久亚洲精品蜜臀av| 中国美女看黄片| 欧美人与善性xxx| 色哟哟·www| 天堂影院成人在线观看| 最好的美女福利视频网| 日韩亚洲欧美综合| 色综合色国产| 欧美日韩中文字幕国产精品一区二区三区| 中文字幕免费在线视频6| 欧美+亚洲+日韩+国产| www.www免费av| 搞女人的毛片| 色哟哟·www| 一本精品99久久精品77| 村上凉子中文字幕在线| 午夜精品在线福利| 国语自产精品视频在线第100页| 哪里可以看免费的av片| 尤物成人国产欧美一区二区三区| av在线观看视频网站免费| 午夜免费激情av| 少妇熟女aⅴ在线视频| 综合色av麻豆| 淫妇啪啪啪对白视频| 亚洲国产精品sss在线观看| 欧美xxxx性猛交bbbb| 永久网站在线| 啪啪无遮挡十八禁网站| 国产高清三级在线| 男女做爰动态图高潮gif福利片| 国产麻豆成人av免费视频| 亚洲第一区二区三区不卡| 色播亚洲综合网| 国产成人一区二区在线| 天堂动漫精品| 久久久久精品国产欧美久久久| 久久精品人妻少妇| 日日干狠狠操夜夜爽| 欧美高清成人免费视频www| 亚洲熟妇中文字幕五十中出| 99久久成人亚洲精品观看| 欧美日韩精品成人综合77777| aaaaa片日本免费| 老熟妇仑乱视频hdxx| 国产亚洲精品久久久com| 伦理电影大哥的女人| 国产一区二区三区在线臀色熟女| av专区在线播放| 国产精品,欧美在线| 国产精品人妻久久久久久| 成年免费大片在线观看| 我的老师免费观看完整版| a在线观看视频网站| 久久精品国产亚洲av涩爱 | 两性午夜刺激爽爽歪歪视频在线观看| 国产精品免费一区二区三区在线| 成人亚洲精品av一区二区| 国产午夜精品久久久久久一区二区三区 | 精品人妻偷拍中文字幕| 欧美xxxx黑人xx丫x性爽| 国产精品一区二区三区四区免费观看 | 一a级毛片在线观看| 欧美3d第一页| av天堂在线播放| 欧美xxxx性猛交bbbb| 99久久久亚洲精品蜜臀av| videossex国产| 又黄又爽又免费观看的视频| 国产精品女同一区二区软件 | 麻豆国产97在线/欧美| 亚洲人成网站高清观看| 色综合亚洲欧美另类图片| 人妻久久中文字幕网| 亚洲美女黄片视频| 精品无人区乱码1区二区| 91久久精品电影网| 国产精品嫩草影院av在线观看 | 亚洲精品色激情综合| 欧美高清性xxxxhd video| 国产精品无大码| 能在线免费观看的黄片| 亚洲中文字幕一区二区三区有码在线看| 嫩草影院入口| 少妇高潮的动态图| 嫩草影院新地址| 日本三级黄在线观看| 色在线成人网| 国内精品久久久久久久电影| 不卡一级毛片| 国产亚洲av嫩草精品影院| 波野结衣二区三区在线| 日本a在线网址| 欧美日韩国产亚洲二区| 中文字幕熟女人妻在线| 中文字幕高清在线视频| 精品久久久久久久久av| 欧美最黄视频在线播放免费| 88av欧美| 老师上课跳d突然被开到最大视频| 国产精品av视频在线免费观看| 色av中文字幕| 精品一区二区三区人妻视频| 欧美xxxx黑人xx丫x性爽| 精品福利观看| 91久久精品国产一区二区成人| 国产探花极品一区二区| 欧美一区二区亚洲| 尾随美女入室| 黄色视频,在线免费观看| 欧美潮喷喷水| 国产国拍精品亚洲av在线观看| 欧美一级a爱片免费观看看| 国内揄拍国产精品人妻在线| 成人av在线播放网站| 欧美日韩综合久久久久久 | 老女人水多毛片| 国产精品国产三级国产av玫瑰| 级片在线观看| 99热网站在线观看| 精品人妻一区二区三区麻豆 | 日韩精品青青久久久久久| 国产美女午夜福利| 国产爱豆传媒在线观看| 国产精品美女特级片免费视频播放器| 91久久精品电影网| bbb黄色大片| 久久欧美精品欧美久久欧美| 非洲黑人性xxxx精品又粗又长| 自拍偷自拍亚洲精品老妇| 女人被狂操c到高潮| 3wmmmm亚洲av在线观看| 九九爱精品视频在线观看| 亚洲av.av天堂| 精品久久久噜噜| 国产一区二区亚洲精品在线观看| 国产在线男女| 我要看日韩黄色一级片| 搞女人的毛片| 成人午夜高清在线视频| 亚洲av五月六月丁香网| 午夜福利在线观看吧| 麻豆成人av在线观看| 给我免费播放毛片高清在线观看| 国产一级毛片七仙女欲春2| 国产真实乱freesex| 国产三级中文精品| 很黄的视频免费| 久久人人精品亚洲av| 亚洲av不卡在线观看| 日韩欧美一区二区三区在线观看| 一本精品99久久精品77| 亚洲av成人av| 免费av观看视频| 一区二区三区四区激情视频 | 久9热在线精品视频| 此物有八面人人有两片| 久久久国产成人精品二区| 国产蜜桃级精品一区二区三区| 老师上课跳d突然被开到最大视频| 美女高潮喷水抽搐中文字幕| 日韩大尺度精品在线看网址| 十八禁网站免费在线| 麻豆一二三区av精品| 极品教师在线免费播放| 内射极品少妇av片p| 天天躁日日操中文字幕| 亚洲av二区三区四区| 一本久久中文字幕| 两个人的视频大全免费| 少妇人妻精品综合一区二区 | 久久久久国内视频| 麻豆久久精品国产亚洲av| 少妇人妻精品综合一区二区 | 亚洲国产色片| 在线观看av片永久免费下载| 两人在一起打扑克的视频| 97人妻精品一区二区三区麻豆| 极品教师在线视频| 国产蜜桃级精品一区二区三区| 国产高清三级在线| 国产精品三级大全| 尾随美女入室| 色哟哟·www| 韩国av一区二区三区四区| 99九九线精品视频在线观看视频| 中文资源天堂在线| 亚洲欧美日韩卡通动漫| 国产熟女欧美一区二区| 午夜爱爱视频在线播放| 2021天堂中文幕一二区在线观| 精品久久久久久成人av| 国产精品一及| 成人综合一区亚洲| 亚洲性夜色夜夜综合| 欧美日韩瑟瑟在线播放| 午夜老司机福利剧场| 91久久精品电影网| 性欧美人与动物交配| 国产高清激情床上av| 日韩大尺度精品在线看网址| 乱人视频在线观看| 免费无遮挡裸体视频| 在现免费观看毛片| av在线观看视频网站免费| 国产一区二区激情短视频| 伦精品一区二区三区| 久久天躁狠狠躁夜夜2o2o|