• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    深度學習在飛行器動力學與控制中的應用研究綜述

    2020-07-02 13:47:18蔣方華李俊峰
    力學與實踐 2020年3期
    關鍵詞:最優(yōu)控制飛行器動力學

    程 林 蔣方華 李俊峰

    (清華大學航天航空學院,北京100084)

    中國航空航天經(jīng)過60余載的奮力發(fā)展,在幾代雙航人的努力拼搏下,通過打造長征、神州、嫦娥等系列工程,躋身于世界強國行列。然而,我國航空航天也面臨著總體布局大而不強,部分技術與歐美強國存在巨大差距的現(xiàn)狀。飛行器控制系統(tǒng)是航空航天飛行器調度各分系統(tǒng)的“大腦”,直接決定了整個飛行任務的形式和質量。提高飛行控制的自主性、魯棒性和智能化水平是飛行器動力學與控制技術研究的主題。

    傳統(tǒng)上,受到機載計算機軟硬件技術限制,飛行器控制系統(tǒng)難以實現(xiàn)飛行剖面的實時規(guī)劃。工程上,多以離線標稱軌跡設計和在線標稱軌跡跟蹤相結合的跟蹤制導方式實現(xiàn)飛行任務。以經(jīng)典控制理論為基礎發(fā)展起來的PID(proportion-integralderivative)控制技術和以極點配置、滑??刂芠1]、自適應控制[2]、魯棒控制為代表的現(xiàn)代反饋技術能夠基于當前狀態(tài)解析計算控制指令,具有算法簡單易實現(xiàn)、實時性好、穩(wěn)定可靠的優(yōu)勢,至今被絕大多數(shù)飛行任務所采用。然而,此類方法基于當前狀態(tài)(非全局)生成指令,導致其對全局約束和性能指標的考量不足。當飛行任務包含復雜約束和最優(yōu)指標時,飛行控制系統(tǒng)往往需要離線設計好的標稱軌跡作為飛行參考,PID 技術和現(xiàn)代反饋控制技術用于標稱的軌跡跟蹤和姿態(tài)調整。由于標稱軌跡離線設計所得,此類標稱軌跡跟蹤制導方式的自主性和魯棒性較差,尤其是當飛行環(huán)境存在較大的不確定性時。隨著任務需求的不斷發(fā)展,未來飛行任務的控制復雜性也日益提高。例如,高超聲速飛行器再入飛行軌跡實時規(guī)劃的需求、末制導中多個終端約束的嚴格限制、以太陽帆為代表的欠驅動控制模式、小行星著陸任務中的遠程通訊限制等都對未來飛行控制系統(tǒng)全局自主決策能力和智能化水平提出更高的要求。從技術的發(fā)展趨勢來看,為滿足未來強不確定性、欠驅動、多約束、通訊限制等任務特點,需要發(fā)展新型動力學與控制技術,以實現(xiàn)控制任務自主性、魯棒性、多約束滿足和實時智能決策等性能的全面提升。

    近年來,人工智能技術的飛速發(fā)展為飛行器自主智能飛行的實現(xiàn)提供了新的可能[3]。人工智能是計算機科學的一個分支領域,主要研究人類智能活動的規(guī)律,構造具有一定智能的人工系統(tǒng),也就是研究如何應用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術[4]。人工智能屬于應用范疇,在算法層面主要依賴機器學習算法。機器學習又可分為監(jiān)督學習、非監(jiān)督學習和強化學習[4]。其中,深度神經(jīng)網(wǎng)絡飛躍式發(fā)展促進了近年來機器學習研究的再次活躍,引領了第三次人工智能的浪潮。深度神經(jīng)網(wǎng)絡映射能力好、學習能力強、適應性廣、純數(shù)據(jù)驅動的優(yōu)點使其在圖像識別、自然語言處理、健康醫(yī)療等任務中具有超過人類的表現(xiàn)[5]。深度學習主要實現(xiàn)數(shù)據(jù)的函數(shù)映射功能,可用來解決智能中的辨識問題。不同的是,強化學習針對Markov決策問題,通過與被控對象的不斷交互和迭代學習,生成可供全局決策的最優(yōu)策略,可解決智能中的決策問題[6]。深度神經(jīng)網(wǎng)絡為強化學習的智能存儲提供了強大記憶載體。應運而生的深度強化學習技術適合于解決復雜且難以建模的應用場景問題,其有效性在圍棋AlphaZero算法中得到驗證[7]。深度強化學習技術已經(jīng)在工業(yè)自動化、數(shù)據(jù)科學、神經(jīng)網(wǎng)絡優(yōu)化、醫(yī)學等方面逐漸開展應用[8]。總而言之,人工智能基于存儲、記憶、預訓練的應用模式為傳統(tǒng)學科難題的解決提供了新途徑。近年來,人工智能技術應用于飛行器動力學與控制,用以提升飛行控制的自主性和智能化水平,尤其備受關注。

    本文基于課題組前期研究成果和參閱國內外知名學者的部分研究,以提升飛行器控制自主性和智能化水平為研究主題,總結和梳理了深度學習應用于動力學、最優(yōu)控制和任務設計中的研究思路,并針對研究思路的總體實現(xiàn)方案、優(yōu)缺點和部分代表性成果進行綜述,希望對相關研究同行提供一定的參考。深度學習應用于航空航天的研究方興未艾,新的成果更是層出不窮,論文未能提及之處,敬請諒解。

    1 深度學習在動力學中的應用

    為提高飛行器自主飛行控制質量,可以從以下兩方面入手。第一,提高飛行在線智能決策能力;第二,建立更加精確的飛行器動力學模型。精確的動力學模型是實現(xiàn)飛行器運動規(guī)律推演的基礎,也是控制器智能決策的重要依據(jù)。傳統(tǒng)動力學以牛頓力學和分析力學為基礎,結合一定力學經(jīng)驗和工程要求,建立飛行器飛行動力學模型。然而,受到模型不匹配、測量手段不足、精確建模成本過高、模型遷移等諸多因素影響,實際工程中難以獲得飛行器精確動力學模型。例如,小行星著陸過程中,小行星參數(shù)不確定會導致引力場計算模型的不準確;基于理論分析和風洞試驗獲取的臨近空間飛行器氣動模型也存在較大不準確,以及風干擾因素也難以建模;軟體機器人目前還沒有系統(tǒng)的動力學建模方法等。飛行器動力學模型的一般形式為

    其中,模型分為確定性部分(deterministic)和不確定性(undeterministic)部分。確定性部分表示在相同的狀態(tài)下具有確定的動力學特性,具有可復現(xiàn)性,例如推力或者重力等影響因素。不確定性部分表示在相同狀態(tài)下動力學呈現(xiàn)不確定特征,例如飛行器的風干擾等。表達式Fdk(x,u)表示動力學模型中確定且已知(known)部分,F(xiàn)du(x,u)表示動力學模型中確定但未知(unknown)部分,F(xiàn)ud(x,u)則表示不確定性部分。

    目前深度學習在動力學建模的應用主要包括:(1)提升計算效率;(2)構造智能動力學模型;(3)動力學反問題的學習。

    1.1 提升計算效率

    在某些控制問題中,動力學部分Fdk(x,u)盡管已知,但是計算量龐大。在這種情況下,機器學習算法可用于擬合動力學Fdk(x,u) 部分,在保證精度的前提下實現(xiàn)計算效率的提升。例如,F(xiàn)urfaro等[9]采用極限學習機(extreme learning machines)學習不規(guī)則小行星的引力場,在確保一定擬合精度的同時大幅提高了引力場計算效率。Song 等[10]采用深度神經(jīng)網(wǎng)絡擬合不規(guī)則引力場,并將其應用于小行星著陸軌跡規(guī)劃中,取得了良好的效果。Cheng等[11-12]進一步將神經(jīng)網(wǎng)絡引力場模型應用于小行星著陸軌跡的快速同倫和智能著陸控制器學習中。此外,Wei等[13]采用Serendipity(偶然)插值技術來擬合小行星引力場的起伏,從而獲得高計算效率、高精度的小行星引力場模型。

    1.2 構造智能動力學模型

    為了進一步提升飛行器動力學建模的精度,深度神經(jīng)網(wǎng)絡也可用來學習動力學的未知部分Fdu(x,u)。文獻[3]中提出一種智能動力學模型

    其中,深度神經(jīng)網(wǎng)絡模塊Netdu(x)用來表征動力學中的Fdu(x,u)部分,?f表示擬合誤差。為了實現(xiàn)模型的自我學習,文獻[3] 基于擴張觀測技術提出了一種模型迭代學習算法,并給出了詳細的算法穩(wěn)定性證明。值得說明的是,文獻[3]為了保證后續(xù)間接法的求解需要,只考慮動力學Fdu(x,u)與控制變量u無關的情況。式(2)也被嘗試應用于小行星繞飛過程中的引力場在線學習。小行星探測器前期繞飛中,通過一定的反演算法,推算出當前位置下的引力場修正值。觀測的引力場修正值與地面雷達或者光學估算值(例如多面體算法[14])進行數(shù)據(jù)融合,從而實現(xiàn)智能動力學模型的在線調整與學習?;谝龅膶W習效果,研究者還可以進一步對探測器繞飛軌道進行優(yōu)化。當前,針對反演算法、數(shù)據(jù)融合算法、繞飛軌道的優(yōu)化還在技術攻關中。

    與此同時,相關學者也在設想更加一般性的智能動力學模型。例如,考慮Fdu(x,u)與控制變量u相關,且也可應用于間接法的動力學模型

    其中,i=0,1,2;Fdu(x,u)的擬合為一元三次表達式,三個網(wǎng)絡Neti(x)分別表征一元三次表達式的三個擬合系數(shù)。考慮到動力學中可能存在不確定項,也可考慮含正態(tài)分布隨機項的動力學模型

    其中,函數(shù)N(μ,σ)表示正態(tài)分布函數(shù),μ=Netμ(x,u) 表示正態(tài)分布的期望,σ=Netσ(x,u)表示正態(tài)分布的方差。

    作者認為,精確動力學建模是實現(xiàn)飛行器智能飛行不可缺少的關鍵技術之一。目前,計算機領域崇尚Model-free 的學習策略,即在不需要對被控對象精確建模的前提下,通過智能體與被控對象的不斷交互和經(jīng)驗積累,最終實現(xiàn)智能體最佳控制策略的學習。近年來,深度強化學習領域出現(xiàn)的代表性算法也多為Model-free算法,例如DDPG (deterministic policy gradient algorithms)[15],A3C (actorcritic)[8],區(qū)域信賴策略優(yōu)化(trust region policy optimization, TRPO)[16],PPO (proximal policy optimization)[17]等。盡管Model-free的學習策略在實踐中簡單易執(zhí)行且具有良好的收斂性,但是Modelfree 強化學習算法也存在明顯的缺點,包括隨機動作探索引發(fā)的學習效率低下、約束無法嚴格保障、以及訓練樣本的海量需求。在不解決以上難題的情況下,作者認為Model-free 強化學習算法難以直接應用于飛行控制器的設計任務中。

    另一方面,基于模型的策略學習在飛行控制任務中具有以下優(yōu)勢。第一,基于牛頓力學或分析力學可獲取動力學模型的基本形式和解析表達式,這些先驗信息的充分利用可有效降低問題的復雜性和學習樣本的需求量。例如,速度和位置的關系是明確的、解析的。第二,精確構建被控對象的動力學模型,可有效降低智能控制器與實物的交互需求,從而降低學習成本。當然,被控對象動力學模型越準確,與實物交互的需求降低效果越明顯。這也間接說明了打造具有自學習能力的智能動力學模型的必要性。在最新ANYmal 四足復雜機器人智能控制系統(tǒng)構造中,數(shù)字動力學模型就被用于訓練控制策略,并取得非常好的實際控制效果[18]。近五年,Model-based 深度強化學習的研究也備受學者關注,其中構建精確的表征模型也是其關鍵技術之一[13,19]。文獻[20]基于高斯處理技術打造貝葉斯神經(jīng)網(wǎng)絡模型(Bayesian neural network dynamics model)跟本文式(4)具有相同的研究思路。區(qū)別在于,式(4)包含傳統(tǒng)動力學模塊Fdk(x,u),是一種復合模型,具有繼承動力學理論分析結果的優(yōu)勢。

    1.3 動力學反問題的學習

    飛行器控制的主要目的是根據(jù)任務需求調整控制指令實現(xiàn)預定的控制規(guī)律。從具體實現(xiàn)途徑來看,主要有反饋控制(基于李雅普諾夫穩(wěn)定性定理)、最優(yōu)控制(基于極小值原理)和深度強化學習(基于貝爾曼最優(yōu)性原理)三種實現(xiàn)途徑。其中基于當前狀態(tài)解析生成控制指令的反饋控制具有易于實現(xiàn)、實時性好、穩(wěn)定可靠的優(yōu)點。反饋控制又可細分為Error-based 方法(誤差反饋方法,包括PID 和增益調度PID等)和Model-based方法(模型反饋方法,包括動態(tài)逆、滑模、自適應控制等)[21]。Error-based方法不依賴被控對象的精確模型,方法簡單易于實現(xiàn),是目前工程中應用最為廣泛的控制手段。與此同時,基于現(xiàn)代控制理論發(fā)展起來的Model-based控制方法能夠根據(jù)被控對象動力學特點,精確控制被控對象狀態(tài)的微分變化過程,從而能夠充分發(fā)揮被動對象的動力學特性,實現(xiàn)更快、更穩(wěn)的控制效果。圖1 給出了Model-based 反饋控制方法的示意圖。Model-based 反饋控制的實現(xiàn)可分為兩個操作:第一,算法根據(jù)反饋回來的狀態(tài)和想要的控制目標設計出想要的狀態(tài)微分變化,其中狀態(tài)微分變化的不同設計策略也是動態(tài)逆、滑模等方法的主要區(qū)別;第二,算法根據(jù)微分動力學模型和想要的狀態(tài)微分變化值反向計算需要的控制指令。然而,由于實際飛行控制中被控對象的動力學模型難以精確獲得,這極大限制了Model-based 方法在工程中的應用。為了解決此類問題,Model-based 方法主要朝著兩個方向改進,一個是提高算法的自適應性,即通過在線觀測理想模型和實際模型的偏差?F,并在反饋控制中實時補償;二是提高算法的魯棒性。

    圖1 Model-based 方法示意圖

    Model-based 反饋控制方法依賴精確動力學模型反向計算控制指令,而工程上又難以實現(xiàn)。深度學習有望解決這一難題。圖2給出了一套解決方案。方案主要包括三部分。第一,采用擴張觀測器對未知狀態(tài)和狀態(tài)微分在線辨識,獲取精確狀態(tài)是對狀態(tài)進行精確控制的前提;第二,基于極點配置方法配置穩(wěn)定可控的狀態(tài)微分變化規(guī)律,此部分主要繼承于傳統(tǒng)Model-based 方法;第三,神經(jīng)網(wǎng)絡根據(jù)狀態(tài)微分變化規(guī)律預測具體的控制指令??紤]到在沒有任何先驗信息的情況下,神經(jīng)網(wǎng)絡一開始的輸出是隨機的、錯誤的,因此可加入一個PI反饋控制器進行神經(jīng)網(wǎng)絡的引導學習。具體過程為:被控對象的指令u由神經(jīng)網(wǎng)絡的預測指令unet和PI 控制器的?u復合而成。初始,由于神經(jīng)網(wǎng)絡的輸出不準確,被控對象的實際狀態(tài)微分˙x和理想狀態(tài)微分˙xd存在差距。在這種情況下,PI控制器會根據(jù)差距產(chǎn)生補償指令?u,縮小神經(jīng)網(wǎng)絡指令unet的誤差。與此同時,神經(jīng)網(wǎng)絡會根據(jù)補償指令?u的大小對自身參數(shù)進行調整,使其輸出unet盡可能趨向于修正后的u。當算法穩(wěn)定后,unet→u,?u →0。在這種情況下,盡管Fdu(x,u)不知,狀態(tài)微分以及unet→L?1(Fdk(x,u)+Fdu(x,u)) (L?1表示反求u,即動力學問題的逆)。詳細的方法設計和穩(wěn)定性證明會在后續(xù)的文章中給出。

    圖2 智能控制器示意圖

    2 深度學習在最優(yōu)控制中的應用

    飛行控制的技術實現(xiàn)途徑主要包括反饋控制、最優(yōu)控制和強化學習。反饋控制基于當前狀態(tài)解析計算控制指令,具有良好的實時性和算法收斂性,但是算法沒有全局規(guī)劃能力,對過程約束、終端約束和優(yōu)化指標難以考量。飛行控制問題本質是最優(yōu)控制問題,常見的最優(yōu)控制數(shù)值求解方法包括間接法和直接法[22]。間接法利用Pontryagin 極小值原理推導出最優(yōu)控制的一階必要條件,進而得到求解最優(yōu)軌跡的兩邊邊值問題[23]。從優(yōu)點來看,間接法求解的結果精度比較高,且解滿足一階最優(yōu)性。但是,在實際中,兩邊邊值問題求解難度比較大,尤其是當控制量和狀態(tài)量均存在約束時。除此之外,它還具有推導過程繁瑣、通用性差、初始值難以估計、收斂域小等缺點。近年來,包括同倫技術[24]、協(xié)態(tài)歸一[25]、啟發(fā)式初始值搜索[25]等策略用來改進間接法的性能,并取得良好的效果。得益于計算機性能的提升和數(shù)值仿真技術發(fā)展,自20 世紀70 年代以來,最優(yōu)控制數(shù)值求解的另一重要分支——直接法得到興起并被普遍采用[26]。直接法采用剖面參數(shù)化的方法將最優(yōu)控制問題轉化為參數(shù)優(yōu)化問題,并采用非線性規(guī)劃方法進行求解。根據(jù)對控制量和狀態(tài)量是否參數(shù)化,直接法又可細分為只離散控制剖面的直接打靶法、同時離散控制剖面和狀態(tài)剖面的配點法,以及只離散狀態(tài)剖面的微分包含法[27]。直接打靶法是軌跡設計中常用的一種形式,大量方法(包括依賴梯度的最優(yōu)化算法和隨機啟發(fā)式算法)都曾結合直接打靶法用來解決最優(yōu)控制問題[28]。然而,由于直接打靶法中狀態(tài)剖面只能靠彈道積分得到,整個算法的實時性比較差。近年來,以偽譜法[29-30]和凸優(yōu)化[31-33]為代表的配點法憑借收斂速度和可靠性等優(yōu)勢而備受學者關注。然而,配點法面臨維度爆炸、收斂域小、求解時間和精度嚴重依賴于初始猜測值等難題??偠灾?,最優(yōu)控制數(shù)值求解方法是目前最優(yōu)控制問題的主流求解方法,求解穩(wěn)定性和速度上也在逐年完善。然而,由于仍然不能滿足飛行器在線控制的實時性要求,最優(yōu)控制數(shù)值求解方法目前主要應用于離線的標稱軌跡設計以及在線的標稱軌跡緊急重構。

    強化學習作為當今人工智能研究的一個重要研究方向,在解決連續(xù)動作空間的最優(yōu)控制問題上優(yōu)勢不斷凸顯,并在機器人控制、自動駕駛等方面展現(xiàn)出很好的應用前景[34]。強化學習算法是機器學習算法的三大分支之一,它主要研究在交互環(huán)境下,智能體根據(jù)當前狀態(tài)不斷嘗試動作并總結得失,最終實現(xiàn)累計效益最大化的控制策略(如圖3所示)。

    圖3 強化學習交互過程

    強化學習基于動態(tài)規(guī)劃方法的貝爾曼最優(yōu)性原理,它與傳統(tǒng)最優(yōu)控制數(shù)值求解方法(間接法和直接法)的區(qū)別主要體現(xiàn)在:

    (1) 最優(yōu)控制數(shù)值求解方法:前期不需要訓練,每次求解都試圖得到整個動作序列(離散問題)或者控制剖面(連續(xù)動作問題),由于求解維度很大,求解實時性普遍不足;

    (2) 強化學習方法:強化學習基于最優(yōu)性原理將多級決策問題轉化為一系列單級決策問題,具體公式為:當前狀態(tài)的好壞=當前動作的獎勵+下一個狀態(tài)的好壞[6]。強化學習以離線反復學習為代價,根據(jù)狀態(tài)和動作對應的價值函數(shù)來優(yōu)化動作指令,經(jīng)過反復訓練得到最優(yōu)控制策略;在在線應用階段,訓練得到的最優(yōu)控制策略無需求解最優(yōu)控制問題,能夠根據(jù)狀態(tài)查詢得到最優(yōu)指令,因此具有顯著的實時性優(yōu)勢。

    深度強化學習是采用深度神經(jīng)網(wǎng)絡做函數(shù)擬合的一類新興強化學習算法,特別適合解決復雜大維度應用場景問題,并已經(jīng)在圍棋AlphaZero 算法中得到技術驗證[7]。在連續(xù)動作空間最優(yōu)控制問題上,2014年,Deepmind團隊在總結DQN[35]和Actor-Critic 方法基礎上,提出了DDPG 方法[15],實驗表明,DDPG 算法在連續(xù)動作空間任務中表現(xiàn)穩(wěn)定,且計算量遠遠低于同水平DQN。Schulman等[16]于2015 年提出了TRPO方法,此方法通過強制限制同一批次數(shù)據(jù)新舊兩種策略預測分布的KL差距,避免參數(shù)更新中策略發(fā)生太大改變,從而提高了算法的收斂性能。2016年,Deepmind團隊提出了A3C異步強化學習架構,其在采用深度強化學習Actor-Critic 框架基礎上,利用多個智能體共同探索,并行計算策略梯度,維持一個總的更新量[8]。針對TRPO 標準解法計算量過大的問題,OpenAI 于2016 年提出了利用一階梯度的PPO算法,并用隨機梯度下降的方法更新參數(shù)[17]。Google 在此啟發(fā)下,基于PPO 算法提出了分布式的DPPO (distributed proximal policy optimization),并取得了優(yōu)異的結果[36]。鑒于PPO 算法依舊沿著策略梯度方向進行參數(shù)更新,2017 年8 月,多倫多大學和紐約大學聯(lián)合提出ACKTR 算法,其通過引入計算參數(shù)的自然策略梯度來加速PPO算法的收斂速度[37]。

    強化學習起源于離散多級最優(yōu)決策問題,將其推廣到連續(xù)飛行控制問題中,現(xiàn)有強化學習算法主要面臨著以下三個挑戰(zhàn):(1)策略學習效率問題:現(xiàn)有強化學習動作選擇大多采用隨機探索策略,雖然一定程度上保證了算法的探索能力,但是同樣導致算法計算效率低下和復雜問題難以收斂等不足。(2)收益函數(shù)設計:現(xiàn)有強化學習的價值函數(shù)難以考量約束滿足情況,單純以懲罰函數(shù)的形式來評價策略的實現(xiàn)情況,很容易導致問題的病態(tài),此難題導致強化學習難以在約束較強的最優(yōu)控制問題上應用;(3)學習成本問題:無模型依賴引發(fā)海量樣本訓練需求。

    從目前技術途徑來看,無論是最優(yōu)控制數(shù)值方法還是深度強化學習在飛行器實時自主控制中都存在著不足。作者認為傳統(tǒng)學科與新興人工智能的關系并非取代關系,而應該相輔相成。實現(xiàn)傳統(tǒng)飛行控制與人工智能技術的創(chuàng)新性結合,是實現(xiàn)智能控制發(fā)展的重要方向。目前深度學習與傳統(tǒng)控制方法相結合的研究可概括為以下三個方面:(1)深度學習擬合控制指令;(2)智能初值生成策略;(3)交互強化學習。

    2.1 深度學習擬合控制指令

    雖然最優(yōu)控制數(shù)值求解方法在在線飛行控制中實時性不足,但是其求解效率高、算法收斂性好。在動力學模型已知的情況下,可以通過收集最優(yōu)控制數(shù)值方法生成的飛行控制樣本,離線訓練深度神經(jīng)網(wǎng)絡,并應用于在線飛行控制中。這是人工智能應用于飛行控制中最為直接的方案之一。針對著陸控制問題,Sanchez-Sanchez 等[38-39]基于間接法生成的求解數(shù)據(jù),采用監(jiān)督學習的方式訓練深度神經(jīng)網(wǎng)絡,仿真表明,訓練得到的智能控制器能夠實時驅動被控對象完成比較精確的著陸。在月球著陸控制任務中,F(xiàn)urfaro 等[40]采用GPOPS 產(chǎn)生訓練數(shù)據(jù)訓練卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN) 和循環(huán)神經(jīng)網(wǎng)絡(recurrent neural networks,RNN),訓練得到的智能控制器能夠基于圖像數(shù)據(jù)自主決策控制指令。文獻[41-44]將類似方案應用于小行星著陸、火星著陸以及小推力多圈軌跡轉移、四旋翼無人機機動中,都取得不錯的仿真效果。Izzo等[45]討論了深度學習對控制指令、價值函數(shù)、協(xié)態(tài)(價值函數(shù)梯度)的三種擬合策略,并得出對控制指令和協(xié)態(tài)進行擬合的策略表現(xiàn)更好的結論。在文獻[46] 中,訓練好的神經(jīng)網(wǎng)絡被用來實時決策飛行器姿態(tài)脈沖發(fā)動機的開關,驗證了此方案在離散控制決策問題上的可能性。

    為實現(xiàn)智能控制器任意狀態(tài)的擬合,神經(jīng)網(wǎng)絡的訓練往往需要大量數(shù)據(jù)支持。如何快速產(chǎn)生大量數(shù)據(jù)需要一定的技巧。在間接法生成訓練數(shù)據(jù)中,文獻[39]采用如下策略:首先,在上一個狀態(tài)周圍隨機產(chǎn)生下一個樣本狀態(tài);然后,以上一個狀態(tài)的協(xié)態(tài)值作為下一個狀態(tài)協(xié)態(tài)求解的初始猜測。周而復始逐步生成樣本集。在此基礎上,文獻[47]采用了一種遍歷狀態(tài)空間的樣本生成策略,在保證樣本快速生成的前提下,確保了樣本集對搜索空間的覆蓋性。同樣,同倫技術也可用來提升樣本的生成效率[41]。Izzo 等[45]基于極小值原理,提出了基于反向積分快速獲取樣本的思路。雖然該套方法在樣本覆蓋性、搜索空間邊界上還需要進一步開展研究,但是通過單次軌跡反向積分即可獲取最優(yōu)軌跡的策略在算法效率上表現(xiàn)出無與倫比的優(yōu)勢。

    神經(jīng)網(wǎng)絡應用于飛行控制中最受詬病的一點是,神經(jīng)網(wǎng)絡是一個黑盒子,其控制效果難以解析分析。為了提升智能控制器的可靠性,文獻[48]在太陽帆軌跡轉移中,采用多個尺度的神經(jīng)網(wǎng)絡相互配合,從而保證神經(jīng)網(wǎng)絡能夠識別10?7量級的狀態(tài)誤差,最終實現(xiàn)飛行器高精度入軌。在月球著陸任務中,文獻[49]提出智能控制和反饋控制復合的控制策略,從而保證飛行器在大范圍機動中呈現(xiàn)最優(yōu)性而在最后著陸階段又兼具高可靠性。

    總體來看,最優(yōu)控制數(shù)值方法產(chǎn)生訓練樣本,深度學習離線訓練智能控制器并應用于在線控制的方案,既利用了最優(yōu)控制方法在求解質量和效率上的優(yōu)勢,又解決了傳統(tǒng)最優(yōu)控制方法在線控制中實時性不足的難題。然而,該套方案依賴精確動力學建模,這極大限制了這一方案的通用性。動力學建模的不準確或者動力學的遷移都將導致訓練好的控制器作廢。為了解決此問題,該方案可以結合本文動力學部分中的智能動力學模型進行復合應用。

    2.2 智能初值生成策略

    在以上深度學習擬合控制指令的策略中,傳統(tǒng)最優(yōu)控制方法產(chǎn)生訓練樣本,神經(jīng)網(wǎng)絡學習樣本并被應用于在線控制。整個策略中,最優(yōu)控制方法是“輔助”角色,而人工智能算法是“主要”角色。然而,當動力學模型存在不確定時,深度學習擬合控制指令的策略會失效。針對此問題,更加保守但可靠的思路是人工智能算法退居“輔助”角色。一種切實可行的方案是離線訓練好的神經(jīng)網(wǎng)絡為最優(yōu)控制數(shù)值方法提供求解初值,促進其求解效率和速度。在離線狀態(tài)下,當動力學模型(1)中存在未知項時,可以基于動力學模型

    產(chǎn)生樣本并訓練網(wǎng)絡。在線狀態(tài)下,且未知動力學項已經(jīng)探明后,原問題(1)的解可由問題(5)的解延拓得到。文獻[47]針對小行星著陸問題給出了一套解決方案。在此論文中,通過模型簡化和線性轉換,小行星著陸問題可被簡化為一個二維空間轉移問題。間接法離線求解二維空間轉移問題,產(chǎn)生的控制樣本用來訓練神經(jīng)網(wǎng)絡。仿真表明,神經(jīng)網(wǎng)絡可為二維轉移問題提供100%收斂的初始解。在此基礎上,原小行星著陸問題可基于反向模型延拓技術而快速求解。此外,論文還設計了初值生成備用策略,進一步提升求解的可靠性。

    由于未知動力學部分可以在神經(jīng)網(wǎng)絡離線訓練中臨時舍棄,等動力學探明之后再補充進來,所以算法的適應性比較好。例如文獻[47],由于忽略了小行星的自轉和引力場,因此訓練好的神經(jīng)網(wǎng)絡適用于在任何小行星任意地點的著陸任務。與此同時,由于神經(jīng)網(wǎng)絡只是為最優(yōu)控制方法提供初值,單純起輔助作用,因此整套方案的可靠性也有所保障,這一點在工程中尤為重視。

    2.3 交互強化學習

    Model-free 強化學習算法不依賴被控對象的數(shù)學模型,智能體通過不斷與被控對象的交互,總結動作的收益情況最終形成最優(yōu)控制策略。Model-free強化學習算法在通用性和易用性上具有誘人的應用前景。然而,正如前文提到,Model-free 強化學習算法在飛行控制中應用,存在收斂效率、約束管理和學習成本三個難題。在不解決以上難題的情況下,作者認為Model-free 強化學習算法難以直接應用于飛行控制器的設計任務中。要想降低飛行控制中強化學習算法的學習成本,一種可行的方案是構建被控對象的數(shù)學模型(model),通過Model-free強化學習算法與數(shù)學模型的交互完成智能控制器的訓練。例如,文獻[50] 將Model-free 強化學習算法應用于火星著陸任務中。仿真試驗表明,學習的智能控制器能夠在六自由度控制中自主決策控制指令,并具有一定的控制魯棒性。然而,終端等式約束和飛行最優(yōu)性指標是以罰函數(shù)的形式添加到強化學習的Reward 函數(shù)設計中,導致訓練好的控制器只能實現(xiàn)約束和最優(yōu)性的折衷。在已知動力學模型情況下,Model-based強化學習的研究也備受關注[19]。

    鑒于最優(yōu)控制數(shù)值方法相比Model-free 強化學習算法在求解效率和約束滿足情況都有顯著的優(yōu)勢,文獻[48]提出一種Actor–Indirect method 交互式策略學習架構。在此架構中,間接法(indirect method)求解飛行控制問題,提供樣本訓練神經(jīng)網(wǎng)絡Actor(神經(jīng)網(wǎng)絡既學習控制指令又學習協(xié)態(tài)),而神經(jīng)網(wǎng)絡Actor 反過來為間接法提供良好的協(xié)態(tài)初值從而促進間接法的打靶效率。在交互式策略學習架構中,隨著學習的深入,神經(jīng)網(wǎng)絡Actor 輔助間接法求解的作用不斷強化。仿真表明,在太陽帆軌跡轉移、小行星著陸任務中,神經(jīng)網(wǎng)絡Actor 后期可為間接法提供收斂率接近100%的良好初值。雖然此交互式學習策略能不能算作Model-based 強化學習算法尚待學術界商榷,但是最優(yōu)控制數(shù)值方法和神經(jīng)網(wǎng)絡之間的相互強化作用卻是明確的。

    為了進一步解決動力學模型中可能存在的未知部分,文獻[3]進一步構建智能動力學Identifier 模塊。借助于算法與實物的交互,不斷提升數(shù)字模型的準確性。從而在減少與實物交互的情況下盡可能提升策略的學習效果。文獻[3]最終提出新型Identifier–Actor–Optimizer 交互式策略學習架構,如圖4所示。新型架構在模型依賴、算法學習效率、應用靈活性上都具有一定優(yōu)勢。

    圖4 Identifier–Actor–Optimizer 架構

    3 深度學習在任務設計中的應用

    人工智能算法在飛行任務設計方面同樣具有出色的應用前景。傳統(tǒng)上,需要對整個飛行問題進行確定性的求解,才能評估任務執(zhí)行的總體性能。雖然預估精度可以保證,但是整個過程往往耗時耗力。機器學習基于歷史經(jīng)驗數(shù)據(jù),能夠近似擬合狀態(tài)和總體性能之間的非線性函數(shù)關系?;跈C器學習算法的總體性能快速預估對于整個任務優(yōu)化效率的提升具有顯著效果。機器學習算法尤其適用于對飛行性能預估精度有一定容忍、但是對預估快速性具有較高要求的任務設計場景。由于飛行任務優(yōu)化問題的各式各樣,深度學習在任務設計中的具體應用形式也呈現(xiàn)多樣性。文獻[51-53]運用深度神經(jīng)網(wǎng)絡擬合小推力軌跡轉移中的質量消耗,實現(xiàn)了良好精度的燃料消耗快速預估。Song 等[54]利用深度神經(jīng)網(wǎng)絡擬合太陽帆轉移中的最小時間,為太陽帆的小行星探測序列快速規(guī)劃提供依據(jù)。在文獻[55]中,深度學習被用來支持飛機防碰撞預警系統(tǒng)的決策?;跉v史觀測數(shù)據(jù),深度學習可用來提升衛(wèi)星軌道的預測精度[56]。此外,深度學習還被用于小推力探測器軌道轉移可達性的預測任務中[53]。深度學習在飛行器射程的預測、小行星軌道的穩(wěn)定性分析、衛(wèi)星可達域的預測、衛(wèi)星的碎片預警等任務中也呈現(xiàn)出色的應用潛力。

    4 總結與展望

    深度學習是目前人工智能領域最受關注的研究方向之一,也是飛行器智能飛行控制系統(tǒng)中最有可能用到的機器學習算法之一。深度學習用以解決飛行器飛行動力學與控制難題具有顯著的學術和應用前景,同時也衍生出一系列需要進一步解決的難題。基于前期研究經(jīng)歷,在此分享四點建議。

    (1) 經(jīng)典動力學與控制技術、新興人工智能技術各自具有優(yōu)勢和不足,他們之間不應是取代關系,而應是通過雙方的交叉融合實現(xiàn)優(yōu)勢的互補。經(jīng)典動力學與控制技術發(fā)展到今天,存在一定的技術瓶頸。百尺竿頭更進一步,動力學與控制技術應當充分認識和吸收人工智能的優(yōu)勢,尤其是深度學習的存儲、記憶、預訓練的應用模式。與此同時,圍繞飛行控制設計任務,純人工智能算法忽視被控對象自身動力學和控制規(guī)律、信奉純數(shù)據(jù)驅動的“懶漢”策略也注定是低效的、無用的。圍繞經(jīng)典動力學、控制技術與新興人工智能技術創(chuàng)新性結合的研究將是飛行器智能控制領域重要研究方向。

    (2) 深度學習為傳統(tǒng)學科難題的解決提供新的工具,但它也僅僅是工具而已。從應用上看,深度學習為傳統(tǒng)學科提供了存儲、記憶、預訓練的新應用模式,解決了傳統(tǒng)技術目前遇到的一些難題,尤其是實時性難題。然而從數(shù)學上來看,神經(jīng)網(wǎng)絡也僅僅是承擔了數(shù)據(jù)間的函數(shù)擬合功能。在飛行智能控制器的設計中,人工智能算法的實現(xiàn)往往并非最大的技術瓶頸,而真正的關鍵技術往往在于,如何通過一系列建模和簡化手段,將原飛行控制問題轉換成一個人工智能算法可以解決和善于解決的問題。實踐表明,轉換后的問題越明確、越簡單,就越有助于智能策略學習效率和收斂性的提升。

    (3) 人工智能當前仍處于計算智能階段,訓練好的神經(jīng)網(wǎng)絡只是在訓練集范圍內具有可靠的表現(xiàn),目前無范圍外的推演能力??紤]到飛行控制問題大多是非線性控制問題,因此訓練好的神經(jīng)網(wǎng)絡在數(shù)據(jù)集范圍外的效果并不能保證。如何構建問題及確定訓練集的邊界,保證訓練數(shù)據(jù)的覆蓋性也是未來研究的重要議題。

    (4) 智能動力學模型是未來智能飛行控制實現(xiàn)的關鍵之一。目前人工智能與飛行控制的結合更多關注的是控制本身,而對動力學部分關注比較少。以Model-free 強化學習為代表的方法甚至試圖直接忽略被控對象的動力學特征,單純靠數(shù)據(jù)驅動來實現(xiàn)最優(yōu)控制策略的學習。不可否認,此類方法在某些特殊問題上是適用的,例如沒有交互成本的虛擬游戲、難以動力學建模的互聯(lián)網(wǎng)交互活動。但是在飛行控制中,考慮到學習效率和交互成本,動力學模型依然無可替代。與此同時,比起不同控制器不同參數(shù)對控制規(guī)律的影響的復雜性,動力學模型是推演未來飛行規(guī)律的基礎,更加易于人工智能算法學習的實現(xiàn)。

    本文以提升飛行器飛行控制自主性和智能化水平為研究主題,在總結動力學與控制技術當前存在難題的基礎上,梳理了深度學習應用在飛行器動力學、控制和任務設計的研究思路,并針對研究思路的總體實現(xiàn)方案、優(yōu)缺點和部分代表性成果進行了綜述。最后,論文給出了深度學習在飛行器動力學與控制中應用的四點建議。

    猜你喜歡
    最優(yōu)控制飛行器動力學
    《空氣動力學學報》征稿簡則
    高超聲速飛行器
    條件平均場隨機微分方程的最優(yōu)控制問題
    帶跳躍平均場倒向隨機微分方程的線性二次最優(yōu)控制
    Timoshenko梁的邊界最優(yōu)控制
    復雜飛行器的容錯控制
    電子制作(2018年2期)2018-04-18 07:13:25
    采用最優(yōu)控制無功STATCOM 功率流的解決方案
    神秘的飛行器
    基于隨機-動力學模型的非均勻推移質擴散
    TNAE的合成和熱分解動力學
    火炸藥學報(2014年1期)2014-03-20 13:17:22
    人人妻人人澡欧美一区二区| 最后的刺客免费高清国语| 日韩欧美 国产精品| 日日啪夜夜爽| 亚洲自偷自拍三级| 日韩欧美 国产精品| 在线播放无遮挡| 99热6这里只有精品| 嫩草影院精品99| 街头女战士在线观看网站| 波野结衣二区三区在线| 久久鲁丝午夜福利片| 中文字幕久久专区| 国产视频内射| 激情五月婷婷亚洲| av免费在线看不卡| 2021天堂中文幕一二区在线观| 女人久久www免费人成看片| 高清毛片免费看| 国产黄色视频一区二区在线观看| 欧美激情在线99| or卡值多少钱| 99热网站在线观看| freevideosex欧美| 最近中文字幕2019免费版| 亚洲丝袜综合中文字幕| 成人鲁丝片一二三区免费| 啦啦啦中文免费视频观看日本| 最近视频中文字幕2019在线8| 亚洲伊人久久精品综合| 久久99蜜桃精品久久| 中文天堂在线官网| 国产 一区 欧美 日韩| 亚洲欧美清纯卡通| 亚洲欧洲日产国产| 国产黄色免费在线视频| 黄色日韩在线| 成人欧美大片| 国产黄色视频一区二区在线观看| 国产精品熟女久久久久浪| 精品一区在线观看国产| 99热网站在线观看| 日产精品乱码卡一卡2卡三| 国产免费福利视频在线观看| 99视频精品全部免费 在线| 中文字幕久久专区| 人妻系列 视频| 久久久久九九精品影院| 国产高清国产精品国产三级 | 777米奇影视久久| 看非洲黑人一级黄片| 男人舔奶头视频| 插逼视频在线观看| 九草在线视频观看| 日韩国内少妇激情av| 中文字幕久久专区| 一级爰片在线观看| 亚洲一区高清亚洲精品| 美女黄网站色视频| 精品一区二区免费观看| 日本wwww免费看| 欧美另类一区| 五月天丁香电影| 久久久久久久大尺度免费视频| 男女那种视频在线观看| 天堂网av新在线| 啦啦啦韩国在线观看视频| 久久精品熟女亚洲av麻豆精品 | 国产精品一区二区在线观看99 | 亚洲av男天堂| 亚洲怡红院男人天堂| 欧美另类一区| 欧美激情在线99| 成年人午夜在线观看视频 | 人人妻人人看人人澡| 大又大粗又爽又黄少妇毛片口| 亚洲人成网站在线播| 毛片女人毛片| 亚洲精品影视一区二区三区av| 国产亚洲精品久久久com| 少妇人妻精品综合一区二区| 久久精品夜色国产| 国产69精品久久久久777片| 欧美3d第一页| 99热这里只有精品一区| 久久精品国产鲁丝片午夜精品| 国产成人精品一,二区| 国产精品99久久久久久久久| 在线天堂最新版资源| 亚洲第一区二区三区不卡| 你懂的网址亚洲精品在线观看| 永久网站在线| 汤姆久久久久久久影院中文字幕 | 十八禁网站网址无遮挡 | 亚洲久久久久久中文字幕| 国产精品一二三区在线看| 国产美女午夜福利| 国产精品蜜桃在线观看| 嘟嘟电影网在线观看| 国产精品久久久久久久久免| 女的被弄到高潮叫床怎么办| 久久久久久久国产电影| 狠狠精品人妻久久久久久综合| 高清欧美精品videossex| 少妇裸体淫交视频免费看高清| 丰满乱子伦码专区| 精品一区二区免费观看| 日韩欧美精品v在线| 国产精品综合久久久久久久免费| 国产永久视频网站| 国产熟女欧美一区二区| 成人一区二区视频在线观看| 成年av动漫网址| 亚洲av电影不卡..在线观看| 在线观看人妻少妇| 精品欧美国产一区二区三| 成人无遮挡网站| 午夜激情欧美在线| 在线免费观看不下载黄p国产| 能在线免费观看的黄片| 99久国产av精品国产电影| 日本欧美国产在线视频| 久久国内精品自在自线图片| 国产一区亚洲一区在线观看| 亚州av有码| 亚洲国产av新网站| freevideosex欧美| 你懂的网址亚洲精品在线观看| 成年女人看的毛片在线观看| 少妇高潮的动态图| 久久久午夜欧美精品| 久久久久久伊人网av| 2018国产大陆天天弄谢| 嫩草影院入口| 美女内射精品一级片tv| 国产淫片久久久久久久久| 高清在线视频一区二区三区| 国产成人一区二区在线| 男的添女的下面高潮视频| 亚洲精品成人久久久久久| 又大又黄又爽视频免费| 国产精品一区二区三区四区久久| 一边亲一边摸免费视频| 嫩草影院新地址| 青春草亚洲视频在线观看| 国产国拍精品亚洲av在线观看| 国产av不卡久久| 丰满人妻一区二区三区视频av| 热99在线观看视频| 亚洲av国产av综合av卡| 日韩一本色道免费dvd| 久久精品人妻少妇| 成人国产麻豆网| 国产一区亚洲一区在线观看| 综合色av麻豆| 日韩成人av中文字幕在线观看| 国产黄片视频在线免费观看| 精品一区二区三区视频在线| 最后的刺客免费高清国语| 色视频www国产| 天堂网av新在线| 联通29元200g的流量卡| 亚洲人成网站高清观看| 亚洲美女搞黄在线观看| 美女高潮的动态| 欧美成人午夜免费资源| 亚洲av成人精品一区久久| 成人一区二区视频在线观看| a级一级毛片免费在线观看| 国产探花极品一区二区| 欧美人与善性xxx| 精品酒店卫生间| 欧美日韩综合久久久久久| 国产熟女欧美一区二区| 久久国产乱子免费精品| 久久久久久国产a免费观看| 午夜福利视频1000在线观看| 久久精品久久久久久久性| 晚上一个人看的免费电影| 久久人人爽人人片av| 女人被狂操c到高潮| 欧美丝袜亚洲另类| 禁无遮挡网站| 亚洲四区av| 一个人免费在线观看电影| 色播亚洲综合网| 插阴视频在线观看视频| 简卡轻食公司| 欧美极品一区二区三区四区| 免费观看av网站的网址| 久久精品熟女亚洲av麻豆精品 | 蜜桃久久精品国产亚洲av| 亚洲人成网站在线播| 天堂影院成人在线观看| 免费黄网站久久成人精品| 如何舔出高潮| 亚洲国产成人一精品久久久| 天堂影院成人在线观看| 国产亚洲av片在线观看秒播厂 | 精品少妇黑人巨大在线播放| 天堂中文最新版在线下载 | 午夜精品国产一区二区电影 | 又粗又硬又长又爽又黄的视频| 欧美bdsm另类| 亚洲欧洲国产日韩| 久久99精品国语久久久| 精品国产一区二区三区久久久樱花 | 午夜福利视频精品| 成人无遮挡网站| 欧美日韩亚洲高清精品| 亚洲丝袜综合中文字幕| 日韩在线高清观看一区二区三区| 国产伦一二天堂av在线观看| 欧美人与善性xxx| 内射极品少妇av片p| 十八禁网站网址无遮挡 | 欧美潮喷喷水| 欧美人与善性xxx| 国产精品99久久久久久久久| 欧美日本视频| 亚洲欧美一区二区三区黑人 | 免费观看的影片在线观看| 最近手机中文字幕大全| 日韩一区二区三区影片| 晚上一个人看的免费电影| 夜夜爽夜夜爽视频| 岛国毛片在线播放| 亚洲欧美一区二区三区黑人 | 一区二区三区免费毛片| 欧美成人a在线观看| 亚洲综合精品二区| 中文乱码字字幕精品一区二区三区 | 亚洲精品日本国产第一区| 午夜福利在线观看吧| 免费观看性生交大片5| 一级毛片久久久久久久久女| 欧美日韩国产mv在线观看视频 | 国产女主播在线喷水免费视频网站 | 舔av片在线| 一个人免费在线观看电影| 午夜福利视频精品| 国产片特级美女逼逼视频| 99热全是精品| 亚洲久久久久久中文字幕| 天堂av国产一区二区熟女人妻| 日韩国内少妇激情av| 男人舔奶头视频| 丰满人妻一区二区三区视频av| 国产一区亚洲一区在线观看| 一级毛片久久久久久久久女| 少妇猛男粗大的猛烈进出视频 | 日本欧美国产在线视频| 欧美3d第一页| 中国美白少妇内射xxxbb| 亚洲欧美一区二区三区黑人 | 久久精品国产亚洲av天美| 久久这里有精品视频免费| 免费av不卡在线播放| 亚洲精品aⅴ在线观看| 国产精品av视频在线免费观看| 国产一区二区在线观看日韩| 久久久久久久久久黄片| 色播亚洲综合网| 久久精品国产亚洲网站| 国产一区有黄有色的免费视频 | 91av网一区二区| 国产成人免费观看mmmm| 激情五月婷婷亚洲| 美女内射精品一级片tv| 亚洲精品自拍成人| 麻豆久久精品国产亚洲av| 国产黄频视频在线观看| 一级二级三级毛片免费看| 日韩欧美精品免费久久| 建设人人有责人人尽责人人享有的 | 亚洲成人久久爱视频| 女的被弄到高潮叫床怎么办| 亚洲不卡免费看| 亚洲丝袜综合中文字幕| .国产精品久久| 国产高潮美女av| 亚洲成人精品中文字幕电影| 亚洲av成人av| 成人午夜高清在线视频| 男人狂女人下面高潮的视频| 国产伦精品一区二区三区四那| 精品一区二区三区人妻视频| 免费电影在线观看免费观看| 男人和女人高潮做爰伦理| 国产乱人偷精品视频| 80岁老熟妇乱子伦牲交| 国产av码专区亚洲av| 婷婷色综合大香蕉| 日本av手机在线免费观看| 久久久久九九精品影院| 亚洲人与动物交配视频| 美女被艹到高潮喷水动态| 色网站视频免费| 国产极品天堂在线| 亚洲av福利一区| 卡戴珊不雅视频在线播放| 91在线精品国自产拍蜜月| 国产精品蜜桃在线观看| 亚洲最大成人中文| 精品人妻视频免费看| 亚洲aⅴ乱码一区二区在线播放| 日韩视频在线欧美| 亚洲av国产av综合av卡| 日本猛色少妇xxxxx猛交久久| 亚洲国产色片| 一级爰片在线观看| 成人亚洲精品一区在线观看 | 成人午夜高清在线视频| 亚洲精品成人av观看孕妇| 久久亚洲国产成人精品v| 在线观看一区二区三区| 一级毛片久久久久久久久女| 国产精品伦人一区二区| 国产午夜福利久久久久久| 男人舔女人下体高潮全视频| 97精品久久久久久久久久精品| 免费看光身美女| 精品一区二区免费观看| 欧美xxxx黑人xx丫x性爽| 成人鲁丝片一二三区免费| 内射极品少妇av片p| 男人舔奶头视频| 亚洲精品久久午夜乱码| 秋霞在线观看毛片| 特级一级黄色大片| 日日啪夜夜撸| 成人漫画全彩无遮挡| 国产精品一二三区在线看| 高清视频免费观看一区二区 | 亚洲国产欧美人成| 大香蕉97超碰在线| 免费黄频网站在线观看国产| 人体艺术视频欧美日本| 高清日韩中文字幕在线| 国产精品熟女久久久久浪| 欧美变态另类bdsm刘玥| 国产 一区精品| 欧美激情在线99| 国产免费又黄又爽又色| ponron亚洲| 国产一区二区亚洲精品在线观看| 中文乱码字字幕精品一区二区三区 | 国产色婷婷99| 亚洲最大成人中文| 久久精品国产自在天天线| 日本爱情动作片www.在线观看| 精品99又大又爽又粗少妇毛片| 少妇高潮的动态图| 国内揄拍国产精品人妻在线| 97热精品久久久久久| 精品久久久久久久人妻蜜臀av| 蜜臀久久99精品久久宅男| 国产在视频线精品| 亚洲精华国产精华液的使用体验| 久久热精品热| 校园人妻丝袜中文字幕| 99热6这里只有精品| 久久久欧美国产精品| 国产黄色免费在线视频| 69av精品久久久久久| 久久久久久久国产电影| 欧美日韩综合久久久久久| 国产精品一区二区三区四区久久| 高清欧美精品videossex| 欧美变态另类bdsm刘玥| 精品人妻视频免费看| 卡戴珊不雅视频在线播放| 午夜精品一区二区三区免费看| 免费看a级黄色片| 激情 狠狠 欧美| 国产精品嫩草影院av在线观看| 夜夜爽夜夜爽视频| 国内精品美女久久久久久| 久久久久久久午夜电影| 少妇熟女欧美另类| 亚洲最大成人中文| 久久久久久伊人网av| 国产人妻一区二区三区在| 欧美日本视频| 日韩人妻高清精品专区| 激情 狠狠 欧美| 成人鲁丝片一二三区免费| 成年版毛片免费区| 久久久成人免费电影| 亚洲欧美清纯卡通| 日韩视频在线欧美| 免费看a级黄色片| 久久6这里有精品| 极品少妇高潮喷水抽搐| 最近中文字幕高清免费大全6| 欧美 日韩 精品 国产| 身体一侧抽搐| 91久久精品国产一区二区三区| 免费看av在线观看网站| 波野结衣二区三区在线| 免费电影在线观看免费观看| 国产精品美女特级片免费视频播放器| 天堂av国产一区二区熟女人妻| 少妇人妻一区二区三区视频| 毛片女人毛片| 中文资源天堂在线| 久久久成人免费电影| 男人和女人高潮做爰伦理| 国产伦理片在线播放av一区| 久久精品夜夜夜夜夜久久蜜豆| 五月天丁香电影| 日韩,欧美,国产一区二区三区| 亚洲熟女精品中文字幕| 美女内射精品一级片tv| 免费少妇av软件| 日日啪夜夜撸| 国产免费视频播放在线视频 | 久久国产乱子免费精品| 91精品伊人久久大香线蕉| 欧美潮喷喷水| 少妇被粗大猛烈的视频| 国产亚洲精品久久久com| 91精品一卡2卡3卡4卡| av免费在线看不卡| 最近的中文字幕免费完整| 亚洲国产日韩欧美精品在线观看| 国产不卡一卡二| 亚洲国产最新在线播放| 日韩一区二区视频免费看| 街头女战士在线观看网站| 国产黄片视频在线免费观看| 国产精品麻豆人妻色哟哟久久 | 一本久久精品| 国产伦理片在线播放av一区| 爱豆传媒免费全集在线观看| 毛片女人毛片| 亚洲在久久综合| 亚洲av免费在线观看| 色视频www国产| 精品熟女少妇av免费看| 我要看日韩黄色一级片| 狠狠精品人妻久久久久久综合| 精品熟女少妇av免费看| 淫秽高清视频在线观看| 久热久热在线精品观看| 精品国产一区二区三区久久久樱花 | 日韩中字成人| 精品一区二区三区视频在线| 91狼人影院| 亚洲熟女精品中文字幕| 成人av在线播放网站| 久久久久久久久久人人人人人人| 美女黄网站色视频| 超碰97精品在线观看| 大话2 男鬼变身卡| 午夜福利视频精品| 亚洲丝袜综合中文字幕| 最新中文字幕久久久久| 国产成人aa在线观看| 麻豆av噜噜一区二区三区| 久久久久精品性色| 国产精品一区二区三区四区免费观看| 激情五月婷婷亚洲| 国产乱人偷精品视频| 国产极品天堂在线| 国产在视频线精品| 麻豆成人av视频| 久久人人爽人人爽人人片va| 国产91av在线免费观看| av在线蜜桃| 最近手机中文字幕大全| 亚洲国产日韩欧美精品在线观看| 我的女老师完整版在线观看| 国产单亲对白刺激| 精品一区二区三区人妻视频| 亚洲国产最新在线播放| 久久久精品免费免费高清| 精品一区二区免费观看| 免费看日本二区| 久久热精品热| 欧美成人a在线观看| 91狼人影院| 日本猛色少妇xxxxx猛交久久| 欧美日韩亚洲高清精品| 亚洲欧美精品自产自拍| 一级毛片电影观看| 蜜桃久久精品国产亚洲av| 欧美日韩一区二区视频在线观看视频在线 | 嘟嘟电影网在线观看| 22中文网久久字幕| 毛片一级片免费看久久久久| 国产亚洲精品av在线| 2018国产大陆天天弄谢| 高清在线视频一区二区三区| 日韩中字成人| 免费看av在线观看网站| 只有这里有精品99| 五月天丁香电影| 看十八女毛片水多多多| 国产高清国产精品国产三级 | 日韩伦理黄色片| 非洲黑人性xxxx精品又粗又长| 精品熟女少妇av免费看| 少妇裸体淫交视频免费看高清| 午夜视频国产福利| 亚洲18禁久久av| 国产久久久一区二区三区| 2021天堂中文幕一二区在线观| 精品欧美国产一区二区三| 大陆偷拍与自拍| av在线播放精品| 欧美+日韩+精品| 亚洲av电影在线观看一区二区三区 | 亚洲四区av| 国产成人精品久久久久久| 午夜福利视频1000在线观看| 美女脱内裤让男人舔精品视频| 午夜福利视频精品| 国产精品.久久久| 成人午夜高清在线视频| 看黄色毛片网站| 九九久久精品国产亚洲av麻豆| 好男人在线观看高清免费视频| 99视频精品全部免费 在线| 性色avwww在线观看| 欧美日韩综合久久久久久| 国产av国产精品国产| 人人妻人人看人人澡| 一边亲一边摸免费视频| 在线观看人妻少妇| 搡女人真爽免费视频火全软件| 青春草国产在线视频| 一区二区三区高清视频在线| 午夜老司机福利剧场| 亚洲成人av在线免费| 在线观看免费高清a一片| 十八禁网站网址无遮挡 | 一级毛片电影观看| 美女被艹到高潮喷水动态| 国产一区亚洲一区在线观看| 亚洲精品乱码久久久v下载方式| 亚洲欧美日韩无卡精品| 天堂俺去俺来也www色官网 | 精品久久久久久电影网| 如何舔出高潮| 深夜a级毛片| 国产一级毛片在线| 亚洲国产精品sss在线观看| 最近2019中文字幕mv第一页| 成人毛片a级毛片在线播放| 男插女下体视频免费在线播放| 九草在线视频观看| 激情五月婷婷亚洲| 成人综合一区亚洲| 国产伦精品一区二区三区视频9| 女人被狂操c到高潮| freevideosex欧美| 国产黄色视频一区二区在线观看| 国产精品一区二区性色av| 亚洲va在线va天堂va国产| 女人久久www免费人成看片| 日韩成人av中文字幕在线观看| 人妻一区二区av| 一级a做视频免费观看| 亚洲av中文字字幕乱码综合| 久久久久久国产a免费观看| 小蜜桃在线观看免费完整版高清| 国产亚洲最大av| 青春草视频在线免费观看| 亚洲内射少妇av| 久久精品熟女亚洲av麻豆精品 | av一本久久久久| 国产午夜精品论理片| 一级二级三级毛片免费看| 亚洲性久久影院| 久久久精品94久久精品| 大又大粗又爽又黄少妇毛片口| 97超视频在线观看视频| 国产乱人偷精品视频| 亚洲国产精品专区欧美| 中文字幕人妻熟人妻熟丝袜美| 久久99热这里只有精品18| 熟妇人妻不卡中文字幕| 日本色播在线视频| 91精品国产九色| 五月伊人婷婷丁香| 成年av动漫网址| 看非洲黑人一级黄片| 欧美成人精品欧美一级黄| 国产午夜精品久久久久久一区二区三区| 人妻系列 视频| 国产高潮美女av| 亚洲综合精品二区| 亚洲色图av天堂| 男女视频在线观看网站免费| 国产精品一区二区在线观看99 | 嘟嘟电影网在线观看| 五月伊人婷婷丁香| 精品久久久久久久久久久久久| 亚洲国产av新网站| 免费黄频网站在线观看国产| 亚洲自偷自拍三级| 中文字幕久久专区| av一本久久久久| 国产成人一区二区在线| 亚洲精品久久午夜乱码| 波野结衣二区三区在线| 日本欧美国产在线视频| 边亲边吃奶的免费视频| 非洲黑人性xxxx精品又粗又长| 国产三级在线视频| 99久国产av精品| 看非洲黑人一级黄片| 国产乱人偷精品视频| 在线免费观看的www视频|