• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    二自由度飛行姿態(tài)模擬器的模糊強(qiáng)化學(xué)習(xí)控制

    2019-01-22 04:39:46任立偉班曉軍吳奮黃顯林
    電機(jī)與控制學(xué)報(bào) 2019年11期
    關(guān)鍵詞:強(qiáng)化學(xué)習(xí)

    任立偉 班曉軍 吳奮 黃顯林

    摘?要:針對(duì)二自由度飛行姿態(tài)模擬器的姿態(tài)穩(wěn)定問(wèn)題,依據(jù)強(qiáng)化學(xué)習(xí)中的策略迭代算法設(shè)計(jì)姿態(tài)穩(wěn)定控制器。將策略迭代學(xué)習(xí)算法與多項(xiàng)式TS模糊系統(tǒng)相結(jié)合,對(duì)控制器參數(shù)進(jìn)行學(xué)習(xí)調(diào)整,實(shí)現(xiàn)對(duì)二自由度飛行姿態(tài)模擬器姿態(tài)穩(wěn)定控制性能的優(yōu)化。通過(guò)多項(xiàng)式TS模糊模型對(duì)執(zhí)行器的策略函數(shù)以及評(píng)價(jià)器的值函數(shù)進(jìn)行逼近,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu),經(jīng)過(guò)策略迭代過(guò)程,學(xué)習(xí)得到最優(yōu)控制器參數(shù),使得值函數(shù)最小。通過(guò)仿真驗(yàn)證,證明了基于多項(xiàng)式TS模糊模型的執(zhí)行器—評(píng)價(jià)器結(jié)構(gòu)的策略迭代算法在飛行器姿態(tài)穩(wěn)定控制方面的有效性。

    關(guān)鍵詞:飛行器控制;姿態(tài)穩(wěn)定;強(qiáng)化學(xué)習(xí);策略迭代算法;多項(xiàng)式TS模糊系統(tǒng)

    DOI:10.15938/j.emc.2019.11.016

    中圖分類(lèi)號(hào):TP?273

    文獻(xiàn)標(biāo)志碼:A

    文章編號(hào):1007-449X(2019)11-0127-08

    收稿日期:?2019-03-15

    基金項(xiàng)目:國(guó)家自然科學(xué)基金(61304006,61273095)

    作者簡(jiǎn)介:任立偉(1989—),女,博士研究生,研究方向?yàn)槟:到y(tǒng)理論;

    班曉軍(1978—),男,博士,教授,博士生導(dǎo)師,研究方向?yàn)槟:刂评碚?、魯棒增益調(diào)度控制理論、機(jī)電伺服控制系統(tǒng)等;

    吳?奮(1964—),男,博士,教授,研究方向?yàn)轸敯糇儏?shù)控制、切換和混雜控制、非線(xiàn)性控制、先進(jìn)控制技術(shù)的工程應(yīng)用;

    黃顯林(1956—),男,博士,教授,博士生導(dǎo)師,研究方向?yàn)檠芯糠较驗(yàn)轱w行器制導(dǎo)、導(dǎo)航與控制、復(fù)雜系統(tǒng)非線(xiàn)性魯棒與自適應(yīng)控制等。

    通信作者:班曉軍

    Fuzzy?learning?controller?design?of?2DOF?flight?attitude?simulator

    REN?Liwei1,?BAN?Xiaojun1,?WU?Fen2,?HUANG?Xianlin1

    (1.?Center?for?Control?Theory?and?Guidance?Technology,?Harbin?Institute?of?Technology,?Harbin?150001,?China;

    2.Department?of?Mechanical?and?Aerospace?Engineering,?North?Carolina?State?University,Raleigh?27695-7910,USA)

    Abstract:

    Aiming?at?the?attitude?stabilization?problem?of?twodegreesoffreedom?flight?attitude?simulator,?an?attitude?stabilization?controller?was?designed?based?on?the?policy?iteration?algorithm?in?the?reinforcement?learning.The?policyiteration?learning?algorithm?and?the?polynomial?TS?fuzzy?systems?were?combined?together,?conducting?parameters′?adjustment?of?the?controller,?and?achievingthe?optimization?of?the?attitude?stability?control?performance?of?the?twodegreesoffreedom?flight?attitude?simulator.By?approximating?the?policy?function?of?the?actor?and?the?value?function?of?the?critic?with?the?polynomial?TS?fuzzy?models,?the?actorcritic?structure?based?on?the?polynomial?TS?fuzzy?models?was?established.?Through?the?policy?iteration?process,?the?optimal?parameters?of?the?controller?were?learned?to?minimize?the?value?function.The?simulation?results?show?that?the?policy?iteration?algorithm?based?on?polynomial?TS?fuzzy?models?is?effective?in?controlling?aircraft?attitude?stabilization.

    Keywords:aircraft?control;?attitude?stabilization;?reinforcement?learning;?policy?iteration?algorithm;?polynomial?TS?fuzzy?system

    0?引?言

    旋翼式飛行器因其結(jié)構(gòu)簡(jiǎn)單、成本低廉、使用便利等特點(diǎn),被廣泛應(yīng)用于諸多領(lǐng)域,因此對(duì)其姿態(tài)控制方法的研究是很有必要的。為了有效提高旋翼式飛行器姿態(tài)控制系統(tǒng)的研發(fā)效率并降低研發(fā)成本,旋翼式飛行姿態(tài)模擬器應(yīng)運(yùn)而生。

    文獻(xiàn)[1-2]提出了一種適合在實(shí)驗(yàn)室環(huán)境下研究旋翼式微小型飛行器姿態(tài)控制的小型二自由度飛行姿態(tài)模擬器。此套設(shè)備可以方便地改變整個(gè)系統(tǒng)的質(zhì)心位置,從而改變被控對(duì)象動(dòng)力學(xué)方程中的參數(shù),為研究強(qiáng)魯棒性、自適應(yīng)姿態(tài)穩(wěn)定以及大角度姿態(tài)調(diào)整控制問(wèn)題提供了一個(gè)良好的實(shí)驗(yàn)平臺(tái)。該二自由度飛行姿態(tài)模擬器具有自身不穩(wěn)定性、非線(xiàn)性等特性,采用可行又有效的控制策略才能保證其運(yùn)行的穩(wěn)定性。

    強(qiáng)化學(xué)習(xí)(reinforcement?learning,RL)是計(jì)算智能領(lǐng)域發(fā)展起來(lái)的一種機(jī)器學(xué)習(xí)方法[3-4],它通過(guò)智能體與環(huán)境的交互進(jìn)行探索,在采取動(dòng)作和環(huán)境的評(píng)價(jià)信息中獲得所需知識(shí),進(jìn)一步指導(dǎo)后續(xù)動(dòng)作,最終得到最優(yōu)的動(dòng)作策略,以適應(yīng)環(huán)境達(dá)到預(yù)期目的。強(qiáng)化學(xué)習(xí)與最優(yōu)控制和自適應(yīng)控制有著密切的聯(lián)系,F(xiàn)rank?L.?Lewis及其團(tuán)隊(duì)在把RL應(yīng)用到控制領(lǐng)域的過(guò)程中做出了大量重要的工作,得到了很多有價(jià)值的理論成果[5-8]。強(qiáng)化學(xué)習(xí)具有對(duì)環(huán)境先驗(yàn)知識(shí)要求低的優(yōu)點(diǎn),其主要學(xué)習(xí)任務(wù)是獲得“狀態(tài)—?jiǎng)幼鳌敝g的映射關(guān)系。函數(shù)逼近的本質(zhì)就是利用某一函數(shù)來(lái)逼近這一映射關(guān)系。對(duì)于控制領(lǐng)域,即強(qiáng)化學(xué)習(xí)不需要對(duì)象模型信息,主要目的是獲取控制策略,上述函數(shù)實(shí)際上就是控制器,對(duì)于參數(shù)化控制器而言,就是在交互過(guò)程中通過(guò)環(huán)境的評(píng)價(jià)信息對(duì)這個(gè)控制器的參數(shù)進(jìn)行優(yōu)化,從而達(dá)到改善控制效果的目的。強(qiáng)化學(xué)習(xí)控制方法目前作為一種基于人工智能的優(yōu)化控制方法,在求解復(fù)雜控制決策問(wèn)題過(guò)程中,極具潛力和優(yōu)勢(shì)[9-13]。

    一般所研究的強(qiáng)化學(xué)習(xí)系統(tǒng),其狀態(tài)和動(dòng)作空間都是離散且有限的,值函數(shù)可以用表格表示。而對(duì)于大的狀態(tài)、動(dòng)作空間甚至連續(xù)狀態(tài)、動(dòng)作空間,值函數(shù)的存儲(chǔ)將面臨“維數(shù)災(zāi)難”問(wèn)題。為了解決這個(gè)問(wèn)題,值函數(shù)逼近方法被引入到強(qiáng)化學(xué)習(xí)中,已經(jīng)成為一種有效方法。模糊邏輯推理作為控制理論中的一種重要方法,由于其具有萬(wàn)能逼近的特點(diǎn)而被用于強(qiáng)化學(xué)習(xí)中,用于逼近狀態(tài)值函數(shù)或狀態(tài)動(dòng)作值函數(shù),其中包括因逼近能力以及簡(jiǎn)單結(jié)構(gòu)而被廣泛研究的TakagiSugeno(TS)模糊模型[14-15]。

    近些年來(lái),多項(xiàng)式TS模糊模型受到越來(lái)越多的關(guān)注。實(shí)質(zhì)上,多項(xiàng)式TS模糊模型可看作是TS模糊模型的一種推廣。這兩種模型主要區(qū)別在于模糊規(guī)則的后件部分:TS模糊模型后件部分是線(xiàn)性模型,而多項(xiàng)式TS模糊模型后件部分是多項(xiàng)式模型。因此,相比于傳統(tǒng)的TS模糊模型,多項(xiàng)式TS模糊模型可以更好地描述非線(xiàn)性系統(tǒng)。具體來(lái)說(shuō),針對(duì)同一非線(xiàn)性動(dòng)態(tài)系統(tǒng)進(jìn)行描述,前件變量相同的前提下,多項(xiàng)式TS模糊模型能夠顯著減少模糊規(guī)則條數(shù),并且隨著模型前件變量的增加,優(yōu)勢(shì)會(huì)更為突出;或是在相同模糊規(guī)則條數(shù)下,多項(xiàng)式TS模糊模型可以更多地表征非線(xiàn)性系統(tǒng)工作點(diǎn)附近的信息。目前,已有一系列研究針對(duì)多項(xiàng)式TS模糊系統(tǒng)的系統(tǒng)分析與控制展開(kāi)[16-24],取得了很多研究成果。

    本文嘗試將強(qiáng)化學(xué)習(xí)中的策略迭代算法與一類(lèi)多項(xiàng)式TS模糊系統(tǒng)[24]相結(jié)合,利用多項(xiàng)式TS模糊模型分別對(duì)執(zhí)行器的策略函數(shù)以及評(píng)價(jià)器的值函數(shù)進(jìn)行逼近,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu),對(duì)控制器參數(shù)進(jìn)行迭代優(yōu)化。此外,本文將所設(shè)計(jì)的強(qiáng)化學(xué)習(xí)控制方法應(yīng)用于二自由度飛行模擬器的控制系統(tǒng)設(shè)計(jì),優(yōu)化其控制器參數(shù),成功實(shí)現(xiàn)對(duì)二自由度飛行模擬器俯仰角姿態(tài)穩(wěn)定控制性能的優(yōu)化。

    1?飛行姿態(tài)模擬器動(dòng)力學(xué)模型

    1.1?非線(xiàn)性系統(tǒng)模型

    二自由度飛行姿態(tài)模擬器[1-2]的機(jī)械結(jié)構(gòu)主要有基座、U型架、擺動(dòng)臂和螺旋槳等部分,其簡(jiǎn)化結(jié)構(gòu)示意如圖1所示。擺動(dòng)臂兩端各有一個(gè)電機(jī),2個(gè)電機(jī)方向垂直,各裝有一個(gè)螺旋槳,用于驅(qū)動(dòng)擺動(dòng)臂,使其可以繞著基座進(jìn)行俯仰和偏航運(yùn)動(dòng)。F1為俯仰方向螺旋槳升力,垂直擺桿向上;F2為偏航方向螺旋槳升力,垂直指向紙面外。若只考慮俯仰方向運(yùn)動(dòng),則需保持偏航方向靜止。選豎直桿與擺動(dòng)臂的重合位置為運(yùn)動(dòng)坐標(biāo)系原點(diǎn)O,x軸方向?yàn)樗?,z軸方向?yàn)樨Q直,y軸方向通過(guò)右手定則來(lái)確定,并且將y軸方向定為俯仰方向的零位,俯仰角φ逆時(shí)針旋轉(zhuǎn)(圖中向上)為正方向。

    依據(jù)機(jī)械結(jié)構(gòu)圖上的受力分析,可以建立飛行姿態(tài)模擬器俯仰方向動(dòng)力學(xué)模型如下:

    Jφ··=-kφ·-Mglcosφ+F1L,(1)

    式中各變量的物理意義及其具體參數(shù)值如表1所示。

    選擇狀態(tài)變量x1=φ,x2=φ·及控制輸入變量u=F1L,即可得到飛行模擬器的仿射非線(xiàn)性模型如下:

    x·=f(x)+g(x)u,(2)

    其中:x=[x1,x2]T,f(x)=x21J(-kx2-Mglcos(x1)),

    g(x)=01J。

    1.2?連續(xù)系統(tǒng)的離散化

    針對(duì)非線(xiàn)性系統(tǒng)(2),時(shí)間軸上連續(xù)取相同時(shí)間間隔T=tk+1-tk>0,[tk,tk+1)=[kT,(k+1)T)稱(chēng)為采樣間隔,T為采樣周期。本文中每個(gè)采樣間隔內(nèi),輸入信號(hào)被零階保持,即

    u(t)≡u(píng)(kT)=u(k),kT≤t<(k+1)T。(3)

    采用四階龍格-庫(kù)塔法對(duì)系統(tǒng)(2)進(jìn)行近似離散化,其遞推方程如下(步長(zhǎng)h=T):

    x(k+1)=x(k)+h6(K1+2K2+2K3+K4),(4)

    其中,

    K1=f(x(k))+g(x(k))u(k),

    K2=fx(k)+h2K1+gx(k)+h2K1u(k),

    K3=fx(k)+h2K2+gx(k)+h2K2u(k),

    K4=f(x(k)+hK3)+g(x(k)+hK3)u(k)。

    2?強(qiáng)化學(xué)習(xí)策略迭代算法

    考慮如下單輸入離散時(shí)間非線(xiàn)性動(dòng)態(tài)系統(tǒng)[7]:

    x(k+1)=F(x(k))+G(x(k))u(k),(5)

    其中x(k)∈瘙 綆

    n表示系統(tǒng)k時(shí)刻的狀態(tài),u(k)∈瘙 綆

    表示系統(tǒng)k時(shí)刻的控制輸入。F(x(k))和G(x(k))均為光滑的非線(xiàn)性函數(shù)。

    定義回報(bào)函數(shù)r(x(k),u(k))如下:

    r(x(k),u(k))=Q(x(k))+uT(k)Ru(k),(6)

    其中Q(x(k))和R是正定的。特別地,二次型回報(bào)函數(shù)為

    r(x(k),u(k))=xT(k)Qx(k)+uT(k)Ru(k)。(7)

    控制目標(biāo)是尋求一個(gè)狀態(tài)空間到控制輸入空間的映射關(guān)系h(·)∶瘙 綆

    n→瘙 綆

    ,即策略

    u(k)=h(x(k))。(8)

    使得未來(lái)的累積回報(bào)最小,有

    Vh(x(k))=∑SymboleB@

    i=kγi-kr(x(i),u(i))。(9)

    其中,Vh(x(k))表示評(píng)價(jià)策略u(píng)(k)=h(x(k))的值函數(shù);x(i)(k≤i≤∞)表示滿(mǎn)足式(5)和式(8)的狀態(tài);γ∈[0,1]表示折扣因子,如果為0,則價(jià)值只由當(dāng)前回報(bào)決定;如果是1,則所有的后續(xù)回報(bào)和當(dāng)前回報(bào)一視同仁;如果是0到1之間的數(shù)字,即當(dāng)前回報(bào)的權(quán)重比后續(xù)回報(bào)的權(quán)重大。

    本文研究的前提在于系統(tǒng)是可鎮(zhèn)定的[7],且存在一個(gè)可行的控制策略u(píng)(k)=h(x(k))使得閉環(huán)系統(tǒng)是漸近穩(wěn)定的。此處,可行的控制策略是指該策略可以使系統(tǒng)鎮(zhèn)定并且產(chǎn)生有界代價(jià)函數(shù)的策略。只有對(duì)于可行的控制策略,值函數(shù)Vh(x(k))的值才有意義。

    最優(yōu)策略u(píng)(k)=h*(x(k))使得值函數(shù)(9)最小化,得到最優(yōu)價(jià)值

    V*(x(k))=minh(·)(∑SymboleB@

    i=kγi-kr(x(i),h(x(i)))),(10)

    然而這一優(yōu)化問(wèn)題很難求解。Bellman最優(yōu)原理,作為最優(yōu)控制的一個(gè)奠基石,由其可以得到如下離散時(shí)間HamiltonJacobiBellman(HJB)方程:

    V*(x(k))=minh(·)(r(x(k),h(x(k)))+

    γV*(x(k+1))),(11)

    進(jìn)一步,可得到最優(yōu)策略:

    h*(x(k))=argminh(·)(r(x(k),h(x(k)))+

    γV*(x(k+1)))。(12)

    上述連續(xù)狀態(tài)、動(dòng)作空間下的離散時(shí)間非線(xiàn)性動(dòng)態(tài)系統(tǒng)最優(yōu)控制問(wèn)題可以用強(qiáng)化學(xué)習(xí)方法求解,基本思路分為兩步:首先根據(jù)當(dāng)前的策略u(píng)(k)=h(x(k))估計(jì)值函數(shù)Vh(x(k));然后根據(jù)當(dāng)前估計(jì)的值函數(shù)改進(jìn)策略。基于上述機(jī)制,研究者們提出了很多強(qiáng)化學(xué)習(xí)算法,本文主要基于比較經(jīng)典的策略迭代算法展開(kāi)研究,其具體步驟如下:

    1)初始化:選擇任意容許控制策略h0(x(k));

    2)策略評(píng)估:利用Bellman方程確定當(dāng)前策略的價(jià)值,即

    Vj+1(x(k))=r(x(k),hj(x(k)))+

    γVj+1(x(k+1))。(13)

    3)策略更新:通過(guò)下式對(duì)策略進(jìn)行更新

    hj+1(x(k))=argminh(·)(r(x(k),h(x(k)))+

    γVj+1(x(k+1)))。(14)

    實(shí)現(xiàn)上述策略迭代算法的經(jīng)典強(qiáng)化學(xué)習(xí)結(jié)構(gòu)為執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)[7],如圖2所示。其中,評(píng)價(jià)器的任務(wù)是采用Bellman方程(13)對(duì)值函數(shù)進(jìn)行更新,執(zhí)行器的任務(wù)是采用式(14)對(duì)策略進(jìn)行更新。

    針對(duì)有限狀態(tài)和動(dòng)作空間,策略迭代可通過(guò)存儲(chǔ)和更新查找表實(shí)現(xiàn)。然而對(duì)于非線(xiàn)性系統(tǒng)(5),狀態(tài)空間和控制輸入空間是連續(xù)及無(wú)限的,此時(shí)使用Bellman方程(13)對(duì)當(dāng)前策略的價(jià)值評(píng)估意味著需要對(duì)所有狀態(tài)x(k)計(jì)算策略hj(x(k))的價(jià)值,即求解該Bellman方程是很困難的。解決該問(wèn)題的關(guān)鍵是通過(guò)函數(shù)逼近器對(duì)值函數(shù)進(jìn)行近似。

    3?基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)

    本節(jié)將通過(guò)多項(xiàng)式TS模糊模型[24]對(duì)執(zhí)行器的策略函數(shù)以及評(píng)價(jià)器的值函數(shù)進(jìn)行逼近,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器—評(píng)價(jià)器結(jié)構(gòu)。

    3.1?評(píng)價(jià)器實(shí)現(xiàn)—多項(xiàng)式TS模糊模型近似值函數(shù)

    由第2節(jié)可知道,實(shí)現(xiàn)具有無(wú)限狀態(tài)空間動(dòng)態(tài)系統(tǒng)的策略迭代的關(guān)鍵是近似值函數(shù)。本節(jié)將通過(guò)如下式所示的多項(xiàng)式TS模糊模型對(duì)值函數(shù)進(jìn)行近似,其第條規(guī)則如下:

    R:?IF?x1(k)?is?M1?AND?x2(k)?is?M2?AND?…?AND?xn(k)?is?Mn,THEN

    Vh(x(k))=∑ni=1alixi(k)+∑ni=1∑nj=ibli,jxi(k)xj(k)。(15)

    其中:xi(k),i=1,2,…,n為系統(tǒng)在k時(shí)刻的狀態(tài);n為輸入變量的個(gè)數(shù);Mi是前件變量xi(k)的模糊集,μMi(xi(k))表示其隸屬函數(shù);Vh(x(k))為第條模糊規(guī)則輸出;ali和bli,j分別表示后件參數(shù),經(jīng)強(qiáng)化學(xué)習(xí)可得到。此外,

    x(k)=[x1(k),x2(k),…,xn(k)]T。

    模糊規(guī)則中邏輯“與”運(yùn)算符選擇常用的“代數(shù)乘積”,得到第條規(guī)則的激活度為

    μ(x(k))=∏ni=1μMi(xi(k))。(16)

    采用一般化的解模糊方法得到解模糊化后的模型輸出,如下:

    Vh(x(k))=∑Ωl=1ξ(x(k))Vh(x(k)),(17)

    其中:Ω為模糊規(guī)則數(shù)量;ξ(x(k))為模糊權(quán)函數(shù);Vh(x(k))由第條模糊規(guī)則的后件方程式(15)計(jì)算,且

    ξ(x(k))=μ(x(k))∑Ωl=1μ(x(k))≥0,(18)

    以及

    ∑Ωl=1ξ(x(k))=1。(19)

    此外,在執(zhí)行器—評(píng)價(jià)器結(jié)構(gòu)中,評(píng)價(jià)器接收系統(tǒng)的狀態(tài)變量和式(6)定義的回報(bào)函數(shù),對(duì)強(qiáng)化學(xué)習(xí)的每次學(xué)習(xí)產(chǎn)生評(píng)判,產(chǎn)生如下時(shí)序差分誤差(Temporal?Difference?(TD)?Error):

    e(k)=r(x(k),h(x(k)))+

    γVh(x(k+1))-Vh(x(k))(20)

    以及值函數(shù)估計(jì)。因此,針對(duì)值函數(shù)近似方法,一般可將式(20)作為近似性能指標(biāo)。

    3.2?執(zhí)行器實(shí)現(xiàn)—多項(xiàng)式TS模糊控制器

    本節(jié)將通過(guò)如下式所示的多項(xiàng)式TS模糊模型[24]對(duì)執(zhí)行器的策略函數(shù)進(jìn)行近似,其第w條規(guī)則如下:

    Rw:IF?x1(k)?is?Nw1?AND?x2(k)?is?Nw2?AND?…?AND?xn(k)?is?Nwn,?THEN

    uw(x(k))=cw+∑ni=1qwixi(k)+

    ∑ni=1∑nj=iswi,jxi(k)xj(k),(21)

    其中:Nwi是前件變量xi(k)的模糊集;ηNwi(xi(k))表示其隸屬函數(shù);uw(x(k))為第w條模糊規(guī)則輸出;cw、qwi和swi,j分別表示后件參數(shù),經(jīng)強(qiáng)化學(xué)習(xí)可得到。

    模糊規(guī)則中邏輯“與”運(yùn)算符選擇常用的“代數(shù)乘積”,得到第w條規(guī)則的激活度為

    ηw(x(k))=∏ni=1ηNwi(xi(k))。(22)

    采用一般化的解模糊方法得到解模糊化后的模型輸出,如下:

    u(x(k))=∑ψw=1ζw(x(k))uw(x(k)),(23)

    其中,ψ為模糊規(guī)則數(shù)量,ζw(x(k))為模糊權(quán)函數(shù),uw(x(k))由第w條模糊規(guī)則的后件方程式(21)計(jì)算,且

    ζw(x(k))=ηw(x(k))∑ψw=1ηw(x(k))≥0,(24)

    以及

    ∑ψw=1ζw(x(k))=1。(25)

    4?仿真研究

    利用第3節(jié)中所提出的基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)的策略迭代算法,?針對(duì)第1節(jié)中的飛行姿態(tài)模擬器俯仰方向動(dòng)力學(xué)模型進(jìn)行數(shù)值仿真研究。本文的強(qiáng)化學(xué)習(xí)控制算法并不需要對(duì)象模型,仿真中的模型只是用來(lái)模擬學(xué)習(xí)過(guò)程中與智能體進(jìn)行交互的外部環(huán)境,而不直接向智能體提供任何信息??刂颇繕?biāo)為設(shè)計(jì)多項(xiàng)式TS模糊控制器(23),使得給定系統(tǒng)一個(gè)初始角度,在控制器作用下最終可穩(wěn)定到0度,同時(shí)實(shí)現(xiàn)策略最優(yōu)化及值函數(shù)最優(yōu)化。具體為經(jīng)過(guò)策略迭代過(guò)程,學(xué)習(xí)得到最優(yōu)控制器參數(shù),使得值函數(shù)最小。

    針對(duì)飛行姿態(tài)模擬器俯仰方向連續(xù)狀態(tài)空間模型(2),選擇離散采樣時(shí)間T=0.005?s,經(jīng)四階龍格-庫(kù)塔法離散化得到其離散狀態(tài)空間模型。

    由式(1)和式(2)知,系統(tǒng)穩(wěn)定到0度時(shí),有

    u(k)=Mgl,(26)

    所以選擇回報(bào)函數(shù)如下:

    r(x(k),u(k))=xT(k)Qx(k)+

    (u(k)-Mgl)TR(u(k)-Mgl)。(27)

    其中,Q=1001,R=1。

    選定多項(xiàng)式TS模糊模型(17)對(duì)值函數(shù)進(jìn)行近似,模糊規(guī)則數(shù)為Ω=2,前件變量為x1(k),其第條規(guī)則如下:

    R:?IF?x1(k)?is?M1,THEN

    Vlh(x(k))=bl1,1x21(k)+bl1,2x1(k)x2(k)+

    bl2,2x22(k)。(28)

    模糊權(quán)函數(shù)分別選為如下式所示的高斯型(其形狀見(jiàn)圖3)。

    ξ1(x1(k))=e-x21(k)0.5,

    ξ2(x1(k))=1-ξ1(x1(k))。(29)

    選定多項(xiàng)式TS模糊控制器(23)模糊規(guī)則數(shù)ψ=2,前件變量為x1(k),其第w條規(guī)則如下:

    Rw:IF?x1(k)?is?Nw1,THEN

    uw(x(k))=cw+qw1x1(k)+qw2x2(k)+

    sw1,1x21(k)+sw1,2x1(k)x2(k)+

    sw2,2x22(k)。(30)

    模糊權(quán)函數(shù)分別選為如下高斯型(其形狀同圖3):

    ζ1(x1(k))=e-x21(k)0.360?7,

    ζ2(x1(k))=1-ζ1(x1(k))。(31)

    策略迭代算法中評(píng)價(jià)器和執(zhí)行器的參數(shù)初始值分別如表2和3所示。

    初始狀態(tài)為x(0)=[-0.990?20]T,折扣因子γ=1。經(jīng)過(guò)15步迭代得到的收斂策略迭代結(jié)果(即評(píng)價(jià)器和執(zhí)行器參數(shù)收斂值)分別如表4和表5所示。

    最優(yōu)策略(其參數(shù)如表5所示)下,系統(tǒng)在初始值為x(0)=[-0.990?20]T時(shí)的狀態(tài)響應(yīng)以及控制輸入分別如圖4和圖5所示。

    由式(26)可知,當(dāng)系統(tǒng)穩(wěn)定在0度時(shí),經(jīng)計(jì)算可得控制量u(k)=0.149?9,圖5所得控制量終值結(jié)果與該理論計(jì)算結(jié)果一致。

    進(jìn)一步,依據(jù)所得最優(yōu)策略(其參數(shù)如表5所示),改變系統(tǒng)初值為x(0)=[0.710?70]T,可得到該初始狀態(tài)下系統(tǒng)的狀態(tài)響應(yīng)以及控制輸入分別如圖6和圖7所示。

    評(píng)價(jià)器參數(shù)收斂過(guò)程以及多項(xiàng)式TS模糊模型近似值函數(shù)所得到的最優(yōu)策略對(duì)應(yīng)的TD誤差分別如下圖8和圖9所示。

    從圖4~圖7中可看出,經(jīng)過(guò)迭代學(xué)習(xí)過(guò)程,得到的具有最優(yōu)控制策略參數(shù)的控制器,能夠使得二自由度飛行模擬器的俯仰角和角速度均穩(wěn)定在0度。從圖8和圖9中,可以看到評(píng)價(jià)器參數(shù)收速度較快,且所得到的TD誤差為零,即實(shí)現(xiàn)了值函數(shù)最小化的性能指標(biāo)。該仿真結(jié)果不僅說(shuō)明多項(xiàng)式TS模糊模型近似值函數(shù)是可行的,此外,基于多項(xiàng)式T-S模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)的強(qiáng)化學(xué)習(xí)策略迭代算法在二自由度飛行模擬器上的應(yīng)用是成功且有效的。

    5?結(jié)?論

    本文基于強(qiáng)化學(xué)習(xí)中的策略迭代算法對(duì)一個(gè)自主研制的二自由度飛行姿態(tài)模擬器的姿態(tài)穩(wěn)定問(wèn)題進(jìn)行研究,該模擬器為實(shí)驗(yàn)室環(huán)境下研究旋翼式微小型飛行器姿態(tài)控制提供了一個(gè)很好的平臺(tái)。首次將策略迭代學(xué)習(xí)算法與多項(xiàng)式TS模糊系統(tǒng)相結(jié)合,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu),對(duì)控制器參數(shù)進(jìn)行學(xué)習(xí)調(diào)整,實(shí)現(xiàn)對(duì)二自由度飛行姿態(tài)模擬器姿態(tài)穩(wěn)定控制性能的優(yōu)化,具有一定的應(yīng)用價(jià)值。實(shí)際上,該算法并不局限于某一策略形式,能夠參數(shù)化表達(dá)的控制策略形式都可以通過(guò)該算法進(jìn)行策略參數(shù)優(yōu)化,實(shí)際應(yīng)用中,可以根據(jù)需要進(jìn)行策略形式選擇。

    參?考?文?獻(xiàn):

    [1]?趙巖.?二自由度直升機(jī)模擬器控制系統(tǒng)設(shè)計(jì)[D].?哈爾濱:哈爾濱工業(yè)大學(xué),?2013.

    [2]?尹航,?楊燁峰,?趙巖,等.?二自由度飛行姿態(tài)模擬器自整定控制器設(shè)計(jì)[J].電機(jī)與控制學(xué)報(bào),2018,22(4):109-116.

    YIN?Hang,?YANG?Yefeng,?ZHAO?Yan,?et?al.?Selftuning?controller?design?for?a?2DOF?flight?attitude?simulator?[J].?Electric?Machines?and?Control,?2018,?22(4):109-116.

    [3]?SUTTON?R?S,?BARTO?A?G.?Reinforcement?LearningAn?Introduction[M].?Cambridge,?MT:?MIT?Press,?1998.

    [4]?Jerry?M.MENDEL.?Adaptive?learning?and?pattern?recognition?systems:?theory?and?applications[M].?Academic?Press,?1970.

    [5]?WEI?Q,?LEWIS?F?L,?LIU?D,?et?al.?Discretetime?local?value?iteration?adaptive?dynamic?programming:?Convergence?analysis[J].?IEEE?Transactions?on?Systems?Man?and?Cybernetics:?Systems,?2018,?48(6):?875-891.

    [6]?KIUMARSI?B,?LEWIS?F?L,?JIANG?Z?P.?H∞?control?of?linear?discretetime?systems:?Offpolicy?reinforcement?learning[J].?Automatica,?2017,?78(1):?144-152.

    [7]?LEWIS?F?L,?VRABIE?D.?Reinforcement?learning?and?adaptive?dynamic?programming?for?feedback?control[J].?IEEE?Circuits?and?Systems?Magazine,?2009,?9(3):?32-50.

    [8]?ZHAO?D,?LIU?D,?LEWIS?F?L,?et?al.?Special?issue?on?deep?reinforcement?learning?and?adaptive?dynamic?programming[J].?IEEE?Transactions?on?Neural?Networks?and?Learning?Systems,?2018,?29(6):?2038-2041.

    [9]?KHATERAA,?ELNAGAR?A?M,?ELBARDINIM,?et?al.?Adaptive?T–S?fuzzy?controller?using?reinforcement?learning?based?on?Lyapunov?stability[J].?Journal?of?the?Franklin?Institute,?2018,?355(14):?6390-6415.

    [10]?XIONG?Y,?HAIBO?H,?QINGLAI?W,?et?al.?Reinforcement?learning?for?robust?adaptive?control?of?partially?unknown?nonlinear?systems?subject?to?unmatched?uncertainties[J].?Information?Sciences,?2018,?463(1):307-322.

    [11]?ZHANG?C,?ZOU?W,?CHENG?N,?et?al.?Trajectory?tracking?control?for?rotary?steerable?systems?using?interval?type2?fuzzy?logic?and?reinforcement?learning[J].?Journal?of?the?Franklin?Institute,?2018,?355(2):?803-826.

    [12]?ZHU?Y,?ZHAO?D,?YANG?X,et?al.?Policy?iteration?for?H∞?optimal?control?of?polynomial?nonlinear?systems?via?sum?of?squares?programming[J].?IEEE?Transactions?on?Cybernetics,?2018,?48(2):?500-509.

    [13]?趙冬斌,?邵坤,?朱圓恒,等.深度強(qiáng)化學(xué)習(xí)綜述:兼論計(jì)算機(jī)圍棋的發(fā)展[J].?控制理論與應(yīng)用,?2016,?33(6):701-717.

    ZHAO?Dongbin,?SHAO?Kun,?ZHU?Yuanheng,?et?al.?Review?of?deep?reinforcement?learning?and?discussions?on?the?development?of?computer?go[J].?Control?Theory?&?Applications,?2016,?33(6):701-717.

    猜你喜歡
    強(qiáng)化學(xué)習(xí)
    基于強(qiáng)化學(xué)習(xí)的無(wú)線(xiàn)網(wǎng)絡(luò)智能接入控制技術(shù)
    機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究
    未來(lái)人工智能自主學(xué)習(xí)網(wǎng)絡(luò)的構(gòu)建
    轉(zhuǎn)觀(guān)念 強(qiáng)服務(wù) 樹(shù)立用電檢查新價(jià)值
    智能車(chē)自主避障路徑規(guī)劃研究綜述
    一種記憶可修剪型仿生機(jī)器人的速度跟蹤算法研究
    基于強(qiáng)化學(xué)習(xí)的在線(xiàn)訂單配送時(shí)隙運(yùn)能分配
    論“以讀促寫(xiě)”在初中英語(yǔ)寫(xiě)作教學(xué)中的應(yīng)用
    智能交通車(chē)流自動(dòng)導(dǎo)引系統(tǒng)
    分布式系統(tǒng)中基于非合作博弈的調(diào)度算法
    别揉我奶头 嗯啊视频| 亚洲综合色惰| 最近中文字幕2019免费版| 国产精品一区二区性色av| 成年女人看的毛片在线观看| 午夜福利高清视频| 看非洲黑人一级黄片| 国产男人的电影天堂91| 免费大片18禁| 51国产日韩欧美| 久热久热在线精品观看| 秋霞伦理黄片| 国产午夜精品一二区理论片| 制服丝袜香蕉在线| 久久99精品国语久久久| 国产黄色免费在线视频| 纵有疾风起免费观看全集完整版| 国产熟女欧美一区二区| www.av在线官网国产| 国产探花极品一区二区| 日本-黄色视频高清免费观看| 久久久午夜欧美精品| 国产一区二区在线观看日韩| 2018国产大陆天天弄谢| 国产免费一区二区三区四区乱码| 成人二区视频| 人妻 亚洲 视频| 国产一区二区三区综合在线观看 | 国产精品久久久久久久久免| 99久久精品一区二区三区| 亚洲av二区三区四区| 免费高清在线观看视频在线观看| 国产国拍精品亚洲av在线观看| 亚洲精品国产成人久久av| 欧美日韩视频高清一区二区三区二| 天美传媒精品一区二区| 秋霞在线观看毛片| 欧美高清性xxxxhd video| 国产高清三级在线| 国产一区二区三区综合在线观看 | 爱豆传媒免费全集在线观看| 色播亚洲综合网| 精品一区二区三区视频在线| 中文字幕免费在线视频6| 久久久精品免费免费高清| 国产毛片a区久久久久| 中文字幕av成人在线电影| 亚洲欧洲国产日韩| 久久6这里有精品| 麻豆乱淫一区二区| 国产淫语在线视频| 美女脱内裤让男人舔精品视频| 久久国产乱子免费精品| 国产成人福利小说| 五月天丁香电影| 精品人妻一区二区三区麻豆| 伊人久久精品亚洲午夜| av在线观看视频网站免费| 久久人人爽人人爽人人片va| 老司机影院成人| 香蕉精品网在线| 熟女av电影| 我的老师免费观看完整版| 街头女战士在线观看网站| 成人国产av品久久久| 国产精品蜜桃在线观看| 性色av一级| 狂野欧美激情性bbbbbb| 欧美3d第一页| 成人二区视频| 特大巨黑吊av在线直播| 99久久人妻综合| 亚洲图色成人| tube8黄色片| tube8黄色片| 午夜免费观看性视频| 精品少妇黑人巨大在线播放| av.在线天堂| 国产精品秋霞免费鲁丝片| 欧美zozozo另类| 免费看av在线观看网站| 搞女人的毛片| 看非洲黑人一级黄片| 校园人妻丝袜中文字幕| 天堂俺去俺来也www色官网| 国产伦精品一区二区三区四那| 肉色欧美久久久久久久蜜桃 | 久久精品熟女亚洲av麻豆精品| 肉色欧美久久久久久久蜜桃 | 免费看不卡的av| 91久久精品电影网| 国产高清国产精品国产三级 | 97超碰精品成人国产| 91久久精品电影网| 搡老乐熟女国产| 老司机影院成人| 女人被狂操c到高潮| 国产在线男女| 日韩欧美精品v在线| 在线观看国产h片| 最近2019中文字幕mv第一页| 精品久久久久久久人妻蜜臀av| 人体艺术视频欧美日本| 国产成年人精品一区二区| 亚洲最大成人av| 卡戴珊不雅视频在线播放| 国产成人aa在线观看| 欧美日韩亚洲高清精品| 久热这里只有精品99| 成人二区视频| 99久久精品一区二区三区| 18+在线观看网站| 日本黄大片高清| 欧美日韩在线观看h| 精品一区在线观看国产| 婷婷色综合www| 国产在视频线精品| 精品一区二区免费观看| 久久久成人免费电影| 亚洲av男天堂| 老司机影院成人| 九九久久精品国产亚洲av麻豆| 自拍欧美九色日韩亚洲蝌蚪91 | 亚洲,欧美,日韩| 国产欧美亚洲国产| 中文字幕av成人在线电影| 菩萨蛮人人尽说江南好唐韦庄| 有码 亚洲区| 午夜免费鲁丝| 偷拍熟女少妇极品色| 狂野欧美激情性xxxx在线观看| 日本爱情动作片www.在线观看| 久久久久九九精品影院| 蜜桃亚洲精品一区二区三区| 欧美日本视频| 国产毛片a区久久久久| 91狼人影院| 伊人久久国产一区二区| 五月天丁香电影| 男人狂女人下面高潮的视频| 久久精品熟女亚洲av麻豆精品| 国产成人精品福利久久| 伊人久久精品亚洲午夜| 一个人看的www免费观看视频| 国产老妇女一区| 亚洲欧美日韩东京热| 在线天堂最新版资源| 国产极品天堂在线| 久久久久精品久久久久真实原创| 青青草视频在线视频观看| 一区二区三区免费毛片| 国产综合懂色| 国产成人一区二区在线| 成人亚洲欧美一区二区av| av在线蜜桃| 国产一区二区三区av在线| 中文精品一卡2卡3卡4更新| 深爱激情五月婷婷| 久久久久网色| 亚洲在线观看片| 国产成人freesex在线| 成人高潮视频无遮挡免费网站| 黄片wwwwww| 国国产精品蜜臀av免费| 一区二区三区免费毛片| 日韩视频在线欧美| 我的老师免费观看完整版| 久久久久精品久久久久真实原创| 高清欧美精品videossex| 色视频www国产| 亚洲国产精品国产精品| 黄色视频在线播放观看不卡| 日韩成人av中文字幕在线观看| 中文精品一卡2卡3卡4更新| 国产伦精品一区二区三区视频9| 亚洲精品aⅴ在线观看| 久久久久久九九精品二区国产| 一个人看视频在线观看www免费| 亚洲av成人精品一区久久| 别揉我奶头 嗯啊视频| 亚洲人成网站在线播| 春色校园在线视频观看| 欧美成人午夜免费资源| 欧美变态另类bdsm刘玥| 内射极品少妇av片p| 亚洲精品,欧美精品| 黑人高潮一二区| 91久久精品国产一区二区成人| 男人爽女人下面视频在线观看| 欧美3d第一页| 午夜免费男女啪啪视频观看| 三级男女做爰猛烈吃奶摸视频| 高清在线视频一区二区三区| 久久久欧美国产精品| 直男gayav资源| 中文字幕人妻熟人妻熟丝袜美| 亚洲,欧美,日韩| 日本黄大片高清| 成人黄色视频免费在线看| xxx大片免费视频| 久久午夜福利片| 国产精品国产三级国产专区5o| 国产91av在线免费观看| 精品久久久久久久人妻蜜臀av| 97人妻精品一区二区三区麻豆| a级毛片免费高清观看在线播放| 欧美xxxx黑人xx丫x性爽| 麻豆精品久久久久久蜜桃| tube8黄色片| 伦理电影大哥的女人| 成人国产麻豆网| 午夜免费鲁丝| 国产精品久久久久久精品古装| 成年女人在线观看亚洲视频 | 国精品久久久久久国模美| 国产美女午夜福利| 网址你懂的国产日韩在线| 亚洲精品,欧美精品| 久久久久久国产a免费观看| 一区二区三区四区激情视频| 下体分泌物呈黄色| 精品亚洲乱码少妇综合久久| 成人免费观看视频高清| 亚洲成人中文字幕在线播放| av卡一久久| 午夜激情福利司机影院| 波多野结衣巨乳人妻| av福利片在线观看| 3wmmmm亚洲av在线观看| 搡老乐熟女国产| 嫩草影院新地址| 国产淫语在线视频| 成人亚洲精品一区在线观看 | 波多野结衣巨乳人妻| 国产黄片美女视频| 日本wwww免费看| 久久精品久久精品一区二区三区| 亚洲成人一二三区av| 亚洲三级黄色毛片| 亚洲色图av天堂| 亚洲一区二区三区欧美精品 | 人妻少妇偷人精品九色| 麻豆成人av视频| 亚洲av日韩在线播放| 一级毛片黄色毛片免费观看视频| 久久久亚洲精品成人影院| 1000部很黄的大片| 三级男女做爰猛烈吃奶摸视频| av在线蜜桃| 亚洲av国产av综合av卡| 永久网站在线| 肉色欧美久久久久久久蜜桃 | av播播在线观看一区| 欧美精品一区二区大全| freevideosex欧美| 日产精品乱码卡一卡2卡三| 欧美日韩在线观看h| 亚洲经典国产精华液单| av福利片在线观看| 成人免费观看视频高清| 两个人的视频大全免费| 日韩三级伦理在线观看| 丝袜脚勾引网站| 老女人水多毛片| 亚洲,欧美,日韩| 日本黄大片高清| 色吧在线观看| 插阴视频在线观看视频| 麻豆精品久久久久久蜜桃| 看免费成人av毛片| 免费观看a级毛片全部| 激情五月婷婷亚洲| 狂野欧美白嫩少妇大欣赏| 日本熟妇午夜| 国产伦精品一区二区三区视频9| 免费电影在线观看免费观看| 91久久精品国产一区二区成人| 最近手机中文字幕大全| 日韩在线高清观看一区二区三区| 一区二区三区精品91| 18禁在线播放成人免费| 久久人人爽人人片av| 男女无遮挡免费网站观看| 秋霞伦理黄片| 国产精品不卡视频一区二区| 久久精品熟女亚洲av麻豆精品| 日本熟妇午夜| 久久久久国产网址| 天天一区二区日本电影三级| 日本免费在线观看一区| 寂寞人妻少妇视频99o| 久久99蜜桃精品久久| 全区人妻精品视频| 国产毛片在线视频| 亚洲久久久久久中文字幕| 国模一区二区三区四区视频| 国产一区二区在线观看日韩| 丰满乱子伦码专区| 在线免费观看不下载黄p国产| a级一级毛片免费在线观看| 波野结衣二区三区在线| 爱豆传媒免费全集在线观看| 久久人人爽人人片av| 久久精品国产a三级三级三级| 白带黄色成豆腐渣| 久久久久久久久大av| 国产精品99久久99久久久不卡 | 中文字幕人妻熟人妻熟丝袜美| 女人久久www免费人成看片| 一区二区av电影网| 国产精品一区www在线观看| 国产一级毛片在线| 夜夜爽夜夜爽视频| 中文天堂在线官网| 日韩成人av中文字幕在线观看| 极品教师在线视频| 人人妻人人澡人人爽人人夜夜| 又大又黄又爽视频免费| 一区二区三区免费毛片| 亚洲精品乱码久久久v下载方式| 免费av不卡在线播放| 一级毛片 在线播放| 少妇猛男粗大的猛烈进出视频 | 亚洲欧美一区二区三区黑人 | 国产精品人妻久久久影院| 2021少妇久久久久久久久久久| 亚洲精品乱码久久久v下载方式| 亚洲经典国产精华液单| 亚洲自拍偷在线| 精品一区在线观看国产| 乱系列少妇在线播放| av专区在线播放| 国产永久视频网站| 免费电影在线观看免费观看| 2021少妇久久久久久久久久久| 久久精品国产a三级三级三级| 99久久精品国产国产毛片| videos熟女内射| 国产精品偷伦视频观看了| 国产高清有码在线观看视频| 特级一级黄色大片| 成人黄色视频免费在线看| 一级毛片久久久久久久久女| 亚洲久久久久久中文字幕| 免费看光身美女| 欧美精品一区二区大全| a级毛片免费高清观看在线播放| 舔av片在线| av国产久精品久网站免费入址| 能在线免费看毛片的网站| 亚洲最大成人手机在线| 亚洲三级黄色毛片| 精品国产露脸久久av麻豆| 国产成人91sexporn| 插阴视频在线观看视频| 国产淫语在线视频| 亚洲精品自拍成人| 啦啦啦中文免费视频观看日本| 久久精品国产鲁丝片午夜精品| 国产精品久久久久久久电影| eeuss影院久久| 亚洲精品国产av成人精品| 久久精品国产亚洲av天美| 亚洲欧美日韩东京热| 在线观看一区二区三区| 午夜福利视频精品| 极品少妇高潮喷水抽搐| 看免费成人av毛片| 国内揄拍国产精品人妻在线| 丰满少妇做爰视频| 99热这里只有是精品50| 最近中文字幕2019免费版| 一区二区av电影网| 亚洲综合精品二区| 日本一本二区三区精品| 欧美xxⅹ黑人| 色哟哟·www| 国产淫片久久久久久久久| 国产伦精品一区二区三区四那| 在线看a的网站| 又粗又硬又长又爽又黄的视频| 丝袜脚勾引网站| 国产精品不卡视频一区二区| 亚洲精品久久久久久婷婷小说| 搡老乐熟女国产| 欧美丝袜亚洲另类| 国产伦在线观看视频一区| 婷婷色综合大香蕉| 一个人观看的视频www高清免费观看| 亚洲人成网站高清观看| 成人毛片a级毛片在线播放| 亚洲精品国产成人久久av| 三级国产精品片| 亚洲经典国产精华液单| 777米奇影视久久| 简卡轻食公司| 大香蕉久久网| 精品久久久久久久久av| 麻豆精品久久久久久蜜桃| 最近最新中文字幕大全电影3| 国产精品99久久久久久久久| 国产精品国产三级专区第一集| 日日撸夜夜添| 国产黄片视频在线免费观看| 国产久久久一区二区三区| 日韩视频在线欧美| av天堂中文字幕网| 全区人妻精品视频| 下体分泌物呈黄色| 久久久精品94久久精品| 午夜老司机福利剧场| 18禁在线播放成人免费| 我要看日韩黄色一级片| 嫩草影院新地址| 黄色视频在线播放观看不卡| 97在线人人人人妻| av福利片在线观看| 精华霜和精华液先用哪个| 狂野欧美激情性xxxx在线观看| 在线免费观看不下载黄p国产| 一个人看视频在线观看www免费| 永久免费av网站大全| 国产男人的电影天堂91| 最后的刺客免费高清国语| 欧美 日韩 精品 国产| 亚洲av成人精品一区久久| 日韩一区二区三区影片| 久久6这里有精品| 在线观看美女被高潮喷水网站| 天美传媒精品一区二区| 国产精品久久久久久av不卡| 国产黄片美女视频| 免费看光身美女| 永久免费av网站大全| 国产成人精品久久久久久| 亚洲经典国产精华液单| 女人十人毛片免费观看3o分钟| 国产欧美另类精品又又久久亚洲欧美| 亚洲自偷自拍三级| 久久久久久久精品精品| 免费黄网站久久成人精品| 精品少妇黑人巨大在线播放| 中文欧美无线码| 综合色av麻豆| 最后的刺客免费高清国语| 国产91av在线免费观看| 伊人久久精品亚洲午夜| 纵有疾风起免费观看全集完整版| 免费观看在线日韩| 大又大粗又爽又黄少妇毛片口| 在线观看人妻少妇| 美女高潮的动态| av在线老鸭窝| 大香蕉久久网| 亚洲精品亚洲一区二区| 乱码一卡2卡4卡精品| 国产精品99久久久久久久久| 国产 一区精品| 日韩av免费高清视频| 日韩伦理黄色片| 午夜亚洲福利在线播放| 日本一二三区视频观看| 毛片一级片免费看久久久久| 午夜福利视频1000在线观看| 18禁在线无遮挡免费观看视频| 国产在视频线精品| 免费黄网站久久成人精品| 日韩制服骚丝袜av| 久久亚洲国产成人精品v| 国产精品一区二区在线观看99| 免费电影在线观看免费观看| 久久综合国产亚洲精品| 亚洲精品影视一区二区三区av| 嫩草影院精品99| 麻豆精品久久久久久蜜桃| 大香蕉97超碰在线| 欧美成人精品欧美一级黄| kizo精华| 亚洲丝袜综合中文字幕| 高清视频免费观看一区二区| 中国美白少妇内射xxxbb| 免费观看av网站的网址| 3wmmmm亚洲av在线观看| 久久韩国三级中文字幕| 国产成人a区在线观看| 1000部很黄的大片| 麻豆国产97在线/欧美| 亚洲va在线va天堂va国产| 亚洲国产精品国产精品| 久久久久国产网址| 精品熟女少妇av免费看| 国产欧美另类精品又又久久亚洲欧美| 久久久久九九精品影院| 91精品国产九色| 99久久九九国产精品国产免费| 久久久久精品久久久久真实原创| 深爱激情五月婷婷| 熟女人妻精品中文字幕| 免费少妇av软件| 久久女婷五月综合色啪小说 | 校园人妻丝袜中文字幕| 久久精品国产亚洲网站| 久久亚洲国产成人精品v| 亚洲成色77777| 少妇人妻 视频| 久久久久久伊人网av| 五月玫瑰六月丁香| 亚洲四区av| 乱系列少妇在线播放| 免费av观看视频| 欧美老熟妇乱子伦牲交| 夫妻性生交免费视频一级片| 一区二区av电影网| 人妻少妇偷人精品九色| 亚洲成人av在线免费| 日本与韩国留学比较| 久久久国产一区二区| 国产综合精华液| 丝袜喷水一区| 网址你懂的国产日韩在线| 我要看日韩黄色一级片| 尤物成人国产欧美一区二区三区| 永久免费av网站大全| 午夜亚洲福利在线播放| 又黄又爽又刺激的免费视频.| 成人毛片60女人毛片免费| 18禁在线播放成人免费| 成人一区二区视频在线观看| av免费观看日本| 最近手机中文字幕大全| 免费看日本二区| 精品人妻视频免费看| 亚洲国产最新在线播放| 亚洲精华国产精华液的使用体验| 全区人妻精品视频| 国产一区二区亚洲精品在线观看| 成年免费大片在线观看| 欧美最新免费一区二区三区| 中文乱码字字幕精品一区二区三区| 欧美日韩综合久久久久久| 免费大片18禁| 天堂网av新在线| 一级a做视频免费观看| 亚洲天堂国产精品一区在线| 在线观看av片永久免费下载| 国产亚洲午夜精品一区二区久久 | 我要看日韩黄色一级片| 日日摸夜夜添夜夜添av毛片| 性插视频无遮挡在线免费观看| 三级国产精品欧美在线观看| 热99国产精品久久久久久7| 在线a可以看的网站| 一个人观看的视频www高清免费观看| 日韩,欧美,国产一区二区三区| 男男h啪啪无遮挡| 成人毛片60女人毛片免费| 干丝袜人妻中文字幕| 日韩精品有码人妻一区| 99热这里只有是精品50| 欧美性猛交╳xxx乱大交人| .国产精品久久| 国产精品一区www在线观看| 亚洲天堂av无毛| 精品人妻一区二区三区麻豆| 久久精品综合一区二区三区| 大香蕉久久网| 在线 av 中文字幕| 成人毛片a级毛片在线播放| 亚洲欧美一区二区三区国产| 精品人妻视频免费看| 国产成人aa在线观看| 欧美 日韩 精品 国产| 亚洲自偷自拍三级| 国产伦在线观看视频一区| av国产久精品久网站免费入址| av网站免费在线观看视频| 国产精品蜜桃在线观看| 亚洲国产欧美在线一区| 日日摸夜夜添夜夜添av毛片| 久久午夜福利片| 亚洲精品亚洲一区二区| 亚洲不卡免费看| 欧美国产精品一级二级三级 | 男人添女人高潮全过程视频| 一级毛片电影观看| 精品少妇黑人巨大在线播放| 高清欧美精品videossex| 人体艺术视频欧美日本| 韩国av在线不卡| 交换朋友夫妻互换小说| 亚洲精品456在线播放app| 蜜臀久久99精品久久宅男| 国产人妻一区二区三区在| 国产精品偷伦视频观看了| 国内精品宾馆在线| 亚洲成人av在线免费| 一级黄片播放器| 国产亚洲5aaaaa淫片| 嫩草影院入口| 你懂的网址亚洲精品在线观看| 国精品久久久久久国模美| 国产伦在线观看视频一区| 一级毛片 在线播放| 熟妇人妻不卡中文字幕| 亚洲国产av新网站| 99久久精品一区二区三区| 高清日韩中文字幕在线| 国产淫片久久久久久久久| 少妇人妻一区二区三区视频| a级毛色黄片| 久久久久久九九精品二区国产| 91精品国产九色| 欧美bdsm另类| 99热全是精品| 男女啪啪激烈高潮av片|