• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強(qiáng)化學(xué)習(xí)的智能船舶航跡跟蹤控制

    2021-03-08 02:58:40???/span>黃珍王緒明
    中國艦船研究 2021年1期
    關(guān)鍵詞:船舶動作

    ???,黃珍*,王緒明

    1 武漢理工大學(xué) 自動化學(xué)院,湖北 武漢 430070

    2 武漢理工大學(xué) 智能交通系統(tǒng)研究中心,湖北 武漢 430063

    0 引 言

    目前,國內(nèi)外對運(yùn)載工具的研究正朝著智能化、無人化方向發(fā)展,智能船舶技術(shù)受到全球造船界與航運(yùn)界的廣泛關(guān)注。其以實(shí)現(xiàn)船舶航行環(huán)境的智能化、自主化發(fā)展為目標(biāo),深度融合傳統(tǒng)船舶設(shè)計(jì)與制造技術(shù)以及現(xiàn)代信息通信與人工智能技術(shù),包含智能航行、智能船用設(shè)備、智能船舶測試等多方面的研究[1]。其中,智能航行技術(shù)一直是保障船舶順利完成貨物運(yùn)輸、通信救助等任務(wù)的重要基礎(chǔ)。要使船舶在面對多種復(fù)雜水域干擾的情況下也能遵守正常的通航秩序,安全地執(zhí)行任務(wù)且保證完成效果,采取有效的控制手段精確進(jìn)行航跡跟蹤就顯得尤為重要。

    針對航跡跟蹤的研究任務(wù)可以分為制導(dǎo)和控制2 個方面。在制導(dǎo)方面,常由視線(line-of-sight,LOS)算法將路徑跟蹤問題轉(zhuǎn)換為方便處理的動態(tài)誤差控制問題;在控制方面,基于船舶的復(fù)雜非線性系統(tǒng),??紤]使用PID 等無模型控制方法,或采用模型線性化的方法來解決非線性模型在計(jì)算速率方面存在的問題。但對于復(fù)雜的環(huán)境,傳統(tǒng)PID 控制器不僅參數(shù)復(fù)雜,還不具備自適應(yīng)學(xué)習(xí)能力。而最優(yōu)控制、反饋線性化一類的控制算法通常需要建立精確的模型才能獲得較高的控制精度?;?刂齐m然對模型精度要求不高,但其抖振問題難以消除[2]。即使存在一些自適應(yīng)參數(shù)調(diào)節(jié)方法,如通過估計(jì)系統(tǒng)輸出實(shí)現(xiàn)PID 參數(shù)自整定的自適應(yīng)PID 控制方法,也會由于模型的不確定性和外界擾動,存在系統(tǒng)輸出與真實(shí)輸出的偏差[3],又或者存在參數(shù)尋優(yōu)時間過長的問題而影響控制的實(shí)時性。對于與模糊邏輯相結(jié)合的響應(yīng)速度快、實(shí)時性好的PID 自適應(yīng)控制器[4],其控制精度依賴于復(fù)雜的模糊規(guī)則庫,致使整體計(jì)算復(fù)雜。

    考慮到船舶的復(fù)雜非線性系統(tǒng)模型,和保障航跡跟蹤控制的實(shí)時性時產(chǎn)生的大量參數(shù)整定和復(fù)雜計(jì)算等問題,本文將采用深度強(qiáng)化學(xué)習(xí)算法來研究智能船舶的軌跡跟蹤問題。深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning,DRL)是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合,其通過強(qiáng)化學(xué)習(xí)與環(huán)境探索得到優(yōu)化的目標(biāo),而深度學(xué)習(xí)則給出運(yùn)行的機(jī)制用于表征問題和解決問題。深度強(qiáng)化學(xué)習(xí)算法不依賴動力學(xué)模型和環(huán)境模型,不需要進(jìn)行大量的算法計(jì)算,還具備自學(xué)習(xí)能力。Magalh?es 等[5]基于強(qiáng)化學(xué)習(xí)算法,使用Q-learning 設(shè)計(jì)了一種監(jiān)督開關(guān)器并應(yīng)用到了無人水面艇,它能智能地切換控制器從而使無人艇的行駛狀態(tài)符合多種環(huán)境與機(jī)動要求。2015 年,Mnih 等[6]為解決復(fù)雜強(qiáng)化學(xué)習(xí)的穩(wěn)定性問題,將強(qiáng)化學(xué)習(xí)與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了深度Q 學(xué)習(xí)(deep Q network,DQN)算法,該算法的提出代表了深度強(qiáng)化學(xué)習(xí)時代的到來。之后,在欠驅(qū)動無人駕駛船舶的航行避碰中也進(jìn)行了相關(guān)應(yīng)用[7]。

    面對存在的大量參數(shù)整定、復(fù)雜算法計(jì)算等問題,為實(shí)現(xiàn)船舶航跡跟蹤的精準(zhǔn)控制,本文擬設(shè)計(jì)一種基于深度確定性策略梯度算法(deep deterministic policy gradient,DDPG)的深度強(qiáng)化學(xué)習(xí)航跡跟蹤控制器,在LOS 算法制導(dǎo)的基礎(chǔ)上,對船舶航向進(jìn)行控制以達(dá)到航跡跟蹤效果。然后,根據(jù)實(shí)際船舶的操縱特性以及控制要求,將船舶路徑跟蹤問題建模成馬爾可夫決策過程,設(shè)計(jì)相應(yīng)的狀態(tài)空間、動作空間與獎勵函數(shù),并采用離線學(xué)習(xí)方法對控制器進(jìn)行學(xué)習(xí)訓(xùn)練。最后,通過仿真實(shí)驗(yàn)驗(yàn)證深度強(qiáng)化學(xué)習(xí)航跡控制器算法的有效性,并與BP-PID 控制器算法的控制效果進(jìn)行對比分析。

    1 智能船舶航跡跟蹤控制系統(tǒng)總體設(shè)計(jì)

    1.1 LOS 算法制導(dǎo)

    航跡跟蹤控制系統(tǒng)包括制導(dǎo)和控制2 個部分,其中制導(dǎo)部分一般是根據(jù)航跡信息和船舶當(dāng)前狀態(tài)確定所需的設(shè)定航向角值來進(jìn)行工作。本文使用的LOS 算法已被廣泛運(yùn)用于路徑控制。LOS算法可以在模型參數(shù)不確定的情況下,以及在復(fù)雜的操縱環(huán)境中與控制器結(jié)合,從而實(shí)現(xiàn)對模型的跟蹤控制。視線法的導(dǎo)航原理是基于可變的半徑與路徑點(diǎn)附近生成的最小圓來產(chǎn)生期望航向,即LOS 角。經(jīng)過適當(dāng)?shù)目刂?,使?dāng)前船舶的航向與LOS 角一致,即能達(dá)到航跡跟蹤的效果[8]。

    LOS 算法示意圖如圖1 所示。假設(shè)當(dāng)前跟蹤路徑點(diǎn)為Pk+1(xk+1,yk+1), 上一路徑點(diǎn)為Pk(xk,yk),以船舶所在位置Ps(xs,ys)為 圓心,選擇半徑RLos與 路徑PkPk+1相交,選取與Pk+1相 近的點(diǎn)PLos(xLos,yLos)作為LOS點(diǎn),當(dāng)前船舶坐標(biāo)到LOS 點(diǎn)的方向矢量與x0的夾角 ψLos則 為需要跟蹤的LOS 角。圖中:d為當(dāng)前船舶至跟蹤路徑的最短距離; ψ為當(dāng)前航向角。

    其中,半徑RLos的計(jì)算公式如式(1)和式(2)所示,為避免Rmin的計(jì)算出現(xiàn)零值,在最終的計(jì)算中加入了2 倍的船長Lpp來進(jìn)行處理[9]。

    式中,所計(jì)算的Rmin即為當(dāng)前時刻t的航跡誤差ε,也即圖1 中的d。

    圖1 LOS 導(dǎo)航原理圖Fig. 1 Schematic diagram of LOS algorithm

    船舶在沿著路徑進(jìn)行跟蹤時,若進(jìn)入下一個航向點(diǎn)的一定范圍內(nèi),即以Pk+2(xk+2,yk+2)為圓心、RAC為半徑的接受圓內(nèi),則更新當(dāng)前航向點(diǎn)為下一航向點(diǎn),半徑RAC一般選取為2 倍船長。

    1.2 基于強(qiáng)化學(xué)習(xí)的控制過程設(shè)計(jì)

    強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)與深度學(xué)習(xí)同屬機(jī)器學(xué)習(xí)范疇,是機(jī)器學(xué)習(xí)的一個重要分支,主要用來解決連續(xù)決策的問題,是馬爾可夫決策過程(Markov decision processes,MDP)問題[10]的一類重要解決方法。

    此類問題均可模型化為MDP 問題,簡單表示為四元組 <S,A,P,R>。 其中,S為所有狀態(tài)值的集合,即狀態(tài)空間;A為動作值集合的動作空間;P為狀態(tài)轉(zhuǎn)移概率矩陣,即在t時刻狀態(tài)為St=s的情況下選擇動作值為At=a, 則t+1時刻產(chǎn)生狀態(tài)為s1的 概 率Pass1=P[St+1=s1|St=s,At=a];R=r(s,a)為回報獎勵函數(shù),用于評價在s狀態(tài)下選取動作值a的好壞。航跡跟蹤控制系統(tǒng)中的控制部分用MDP 模型表示如圖2 所示。

    圖2 船舶控制的MDP 模型Fig. 2 MDP model of ship control

    如圖2 所示,船舶智能體直接與當(dāng)前控制環(huán)境進(jìn)行交互而且不需要提前獲取任何信息。在訓(xùn)練過程中,船舶采取動作值at與環(huán)境進(jìn)行交互更新自己的狀態(tài)st→st+1, 并獲得相應(yīng)的獎勵rt+1,之后,繼續(xù)采取下一動作與環(huán)境交互。在此過程中,會產(chǎn)生大量的數(shù)據(jù),利用這些數(shù)據(jù)學(xué)習(xí)優(yōu)化自身選擇動作的策略policy π。簡單而言,這是一個循環(huán)迭代的過程。在強(qiáng)化學(xué)習(xí)中,訓(xùn)練的目標(biāo)是找到一個最佳的控制策略 policy π?,以使累積回報值Rt達(dá) 到最大[11]。在下面的公式中, γ為折扣系數(shù),用來衡量未來回報在當(dāng)前時期的價值比例,設(shè)定 γ ∈[0,1]。

    根據(jù)值函數(shù)和上述最佳控制策略policy π?的定義,最佳policy π?總是滿足以下條件:

    1.3 航跡跟蹤問題馬爾可夫建模

    從以上描述可以看出,在基于強(qiáng)化學(xué)習(xí)的控制設(shè)計(jì)中,馬爾可夫建模過程的組件設(shè)計(jì)是最為關(guān)鍵的過程,狀態(tài)空間、動作空間和獎勵的正確性對算法性能和收斂速度的影響很大。所以針對智能船舶的軌跡跟蹤問題,對其進(jìn)行馬爾可夫建模設(shè)計(jì)。

    1) 狀態(tài)空間設(shè)計(jì)。

    根據(jù)制導(dǎo)采用的LOS 算法,要求當(dāng)前航向角根據(jù)LOS 角進(jìn)行調(diào)節(jié)以達(dá)到跟蹤效果。所以在選取狀態(tài)時,需考慮LOS 算法中的輸出參數(shù),包括目標(biāo)航向 ψLOS與實(shí)際航向 ψ 的差值e、航跡誤差ε,以及與航跡點(diǎn)距離誤差 εd。

    對于船舶模型,每個時刻都可以獲得當(dāng)前船舶的縱蕩速度u、 橫蕩速度v、艏轉(zhuǎn)向速度r和舵角δ。為使強(qiáng)化學(xué)習(xí)能實(shí)現(xiàn)高精度跟蹤效果,快速適應(yīng)多種環(huán)境的變換,除了選取當(dāng)前時刻的狀態(tài)值外,還加入了上一時刻的狀態(tài)值進(jìn)行比較,以及當(dāng)前航向誤差與上一時刻航向誤差的差值e(k?1),使當(dāng)前狀態(tài)能夠更好地表示船舶是否在往誤差變小的方向運(yùn)行。最終,當(dāng)前時刻t的狀態(tài)空間可設(shè)計(jì)為

    2) 動作空間設(shè)計(jì)。

    針對航跡跟蹤任務(wù)特點(diǎn),以及LOS 制導(dǎo)算法的原理,本文將重點(diǎn)研究對船舶航向,即舵角的控制,不考慮對船速與槳速的控制。動作空間只有舵令一個動作值,即δ,其值的選取需要根據(jù)實(shí)際船舶的控制要求進(jìn)行約束,設(shè)定為在(?35°,35°)以內(nèi),最大舵速為15.8 (°)/s。

    3) 獎勵函數(shù)設(shè)計(jì)。

    本文期望航向角越靠近LOS 角獎勵值越高,與目標(biāo)航跡的誤差越小獎勵值越高。因此,設(shè)計(jì)的獎勵函數(shù)為普遍形式,即分段函數(shù):

    式中,e(k?1)為當(dāng)前航向誤差與上一時刻航向誤差的差值。當(dāng)差值大于 0.1 rad時選擇負(fù)值獎勵,也可稱之為懲罰值,是希望訓(xùn)練網(wǎng)絡(luò)能盡快改變當(dāng)前不佳的狀態(tài)。將負(fù)值的選取與另一分段的0獎勵值做明顯對比,使其訓(xùn)練學(xué)習(xí)后可以更加快速地選擇獎勵值高的動作,從而達(dá)到最優(yōu)效果。

    1.4 控制系統(tǒng)總體方案

    基于強(qiáng)化學(xué)習(xí)的智能船舶航跡控制系統(tǒng)總體框架如圖3 所示。LOS 算法根據(jù)船舶當(dāng)前位置計(jì)算得到需要的航向以及航跡誤差,在與船舶的狀態(tài)信息整合成上述所示狀態(tài)向量st后輸入進(jìn)航跡控制器中,然后根據(jù)強(qiáng)化學(xué)習(xí)算法輸出當(dāng)前最優(yōu)動作值at給船舶執(zhí)行,同時通過獎勵函數(shù)rt計(jì)算獲得相應(yīng)的獎勵來進(jìn)行自身參數(shù)迭代,以使航跡控制器具備自學(xué)習(xí)能力。

    在將控制器投入實(shí)時控制之前,首先需要對控制器進(jìn)行離線訓(xùn)練。設(shè)定規(guī)定次數(shù)的訓(xùn)練后,將獲得的使累計(jì)回報值達(dá)到最大的網(wǎng)絡(luò)參數(shù)進(jìn)行存儲整合,由此得到強(qiáng)化學(xué)習(xí)控制器,并應(yīng)用于航跡跟蹤的實(shí)時控制系統(tǒng)。

    圖3 基于強(qiáng)化學(xué)習(xí)的智能船舶軌跡跟蹤控制框圖Fig. 3 Block diagram of intelligent ship tracking control based on RL

    要解決強(qiáng)化學(xué)習(xí)問題,目前有許多的算法、機(jī)制和網(wǎng)絡(luò)結(jié)構(gòu)可供選擇,但這些方法都缺少可擴(kuò)展的能力,并且僅限于處理低維問題。為此,Mnih 等[6]提出了一種可在強(qiáng)化學(xué)習(xí)問題中使用大規(guī)模神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法——DQN 算法,該算法成功結(jié)合了深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí),使強(qiáng)化學(xué)習(xí)也可以擴(kuò)展處理一些高維狀態(tài)、動作空間下的決策問題[12]。DQN 算法可解決因強(qiáng)化學(xué)習(xí)過程與神經(jīng)網(wǎng)絡(luò)逼近器對值函數(shù)逼近的訓(xùn)練相互干擾,而導(dǎo)致學(xué)習(xí)結(jié)果不穩(wěn)定甚至是產(chǎn)生分歧的問題[13],是深度強(qiáng)化學(xué)習(xí)領(lǐng)域的開創(chuàng)者。

    DQN 算法顯著提高了復(fù)雜強(qiáng)化學(xué)習(xí)問題的穩(wěn)定性和性能,但因其使用的是離散的動作空間,故需要對輸出的動作進(jìn)行離散化,且只能從有限的動作值中選擇最佳動作。對于船舶的軌跡跟蹤問題,如果候選動作數(shù)量太少,就很難對智能體進(jìn)行精確控制。為使算法滿足船舶的操縱特性與要求,本文選擇了一種適用于連續(xù)動作空間的深度強(qiáng)化學(xué)習(xí)算法,即基于DDPG 的算法[14]來對智能船舶航跡跟蹤控制器進(jìn)行設(shè)計(jì),該算法不僅可以在連續(xù)動作空間上進(jìn)行操作,還可以高效精準(zhǔn)地處理大量數(shù)據(jù)。

    2 基于DDPG 算法的控制器設(shè)計(jì)

    2.1 DDPG 算法原理

    DDPG 是Lillicrap 等[14]將DQN 算法應(yīng)用于連續(xù)動作中而提出的一種基于確定性策略梯度的Actor-Critic 框架無模型算法。DDPG 的基本框架如圖4 所示。

    圖4 DDPG 基本框架Fig. 4 Block diagram of DDPG

    所謂經(jīng)驗(yàn)池回放機(jī)制,即在每個時間點(diǎn)都存儲當(dāng)前狀態(tài)、動作等信息作為智能體的經(jīng)驗(yàn)et=(st,at,rt,st+1), 以此形成回放記憶序列D={e1,···,eN}。在訓(xùn)練網(wǎng)絡(luò)時,從中隨機(jī)提取mini batch 數(shù)量的經(jīng)驗(yàn)數(shù)據(jù)作為訓(xùn)練樣本,但重復(fù)使用歷史數(shù)據(jù)的操作會增加數(shù)據(jù)的使用率,也打亂了原始數(shù)據(jù)的順序,會降低數(shù)據(jù)之間的關(guān)聯(lián)性。而目標(biāo)網(wǎng)絡(luò)則建立了2 個結(jié)構(gòu)一樣的神經(jīng)網(wǎng)絡(luò)——用于更新神經(jīng)網(wǎng)絡(luò)參數(shù)的主網(wǎng)絡(luò)和用于產(chǎn)生優(yōu)化目標(biāo)值的目標(biāo)網(wǎng)絡(luò),初始時,將主網(wǎng)絡(luò)參數(shù)賦予給目標(biāo)網(wǎng)絡(luò),然后主網(wǎng)絡(luò)參數(shù)不斷更新,目標(biāo)網(wǎng)絡(luò)不變,經(jīng)過一段時間后,再將主網(wǎng)絡(luò)的參數(shù)賦予給目標(biāo)網(wǎng)絡(luò)。此循環(huán)操作可使優(yōu)化目標(biāo)值在一段時間內(nèi)穩(wěn)定不變,從而使得算法性能更加穩(wěn)定。

    式中, θπ′和 θQ′分別為目標(biāo)策略網(wǎng)絡(luò)和目標(biāo)值函數(shù)網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)。其中,目標(biāo)網(wǎng)絡(luò)的更新方法與DQN 算法中的不同,在DDPG 算法中,Actor-Critic網(wǎng)絡(luò)各自的目標(biāo)網(wǎng)絡(luò)參數(shù)是通過緩慢的變換方式更新,也叫軟更新。以此方式進(jìn)一步增加學(xué)習(xí)過程的穩(wěn)定性:

    式中, τ為學(xué)習(xí)率。

    定義最小化損失函數(shù)來更新Critic 網(wǎng)絡(luò)參數(shù),其中,yi為當(dāng)前時刻狀態(tài)動作估計(jì)值函數(shù)與目標(biāo)網(wǎng)絡(luò)得到的目標(biāo)期望值間的誤差:

    2.2 算法實(shí)現(xiàn)步驟

    初始化Actor-Critic 網(wǎng)絡(luò)的參數(shù),將當(dāng)前網(wǎng)絡(luò)的參數(shù)賦予對應(yīng)的目標(biāo)網(wǎng)絡(luò);設(shè)置經(jīng)驗(yàn)池容量為30 000 個,軟更新學(xué)習(xí)率為0.01,累計(jì)折扣系數(shù)設(shè)定為0.9,初始化經(jīng)驗(yàn)池。訓(xùn)練的每回合步驟如下:

    1) 初始化船舶環(huán)境;

    2) 重復(fù)以下步驟直至到達(dá)設(shè)置的最大步長;

    3) 在主網(wǎng)絡(luò)中,Actor 網(wǎng)絡(luò)獲取此刻船舶的狀態(tài)信息st,并根據(jù)當(dāng)前的策略選取動作舵令δt給船舶執(zhí)行,即 δt=π(st|θπ);

    4) 船舶執(zhí)行當(dāng)前舵令后輸出獎勵rt和下一個狀態(tài)st+1,Actor 網(wǎng)絡(luò)再次獲取該狀態(tài)信息并選取下一舵令 δt+1;

    5) 將此過程中產(chǎn)生的數(shù)據(jù) (st,δt,rt,st+1)存儲在經(jīng)驗(yàn)池中,以作為網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)的數(shù)據(jù)集。當(dāng)經(jīng)驗(yàn)池存儲滿后,再從第1 個位置循環(huán)存儲;

    6) 從經(jīng)驗(yàn)池中隨機(jī)采樣N個樣本(st,δt,rt,st+1),作為當(dāng)前Actor 網(wǎng)絡(luò)和Critic 網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù);

    7) 通過損失函數(shù)更新Critic 網(wǎng)絡(luò),根據(jù)Actor網(wǎng)絡(luò)的策略梯度更新當(dāng)前Actor 網(wǎng)絡(luò),然后再對目標(biāo)網(wǎng)絡(luò)進(jìn)行相應(yīng)的軟更新。

    3 系統(tǒng)仿真與算法對比分析

    3.1 仿真環(huán)境構(gòu)建

    為驗(yàn)證上述方法的有效性,基于Python 環(huán)境進(jìn)行了船舶航跡跟蹤仿真實(shí)現(xiàn)。控制研究對象模型選用文獻(xiàn)[16-17]中的單槳單舵7 m KVLCC2船模,建模采用三自由度模型(即縱蕩、橫蕩和艏搖),具體建模過程參考文獻(xiàn)[16]。表1 列出了船舶的一些主要參數(shù)。

    表1 KVLCC2 船舶參數(shù)Table 1 Parameters of a KVLCC2 tanker

    在所選用的DDPG 控制器中,Crtic 網(wǎng)絡(luò)和Actor網(wǎng)絡(luò)的實(shí)現(xiàn)參數(shù)設(shè)置分別如表2 和表3 所示。

    表2 Critic 網(wǎng)絡(luò)參數(shù)Table 2 Critic network parameters

    表3 Actor 網(wǎng)絡(luò)參數(shù)Table 3 Actor network parameters

    3.2 控制器離線學(xué)習(xí)

    基于DDPG 算法進(jìn)行的離線訓(xùn)練學(xué)習(xí)設(shè)置如下:初始化網(wǎng)絡(luò)參數(shù)以及經(jīng)驗(yàn)緩存池,設(shè)計(jì)最大的訓(xùn)練回合為2 000,每回合最大步長為500,采樣時間為1 s。在規(guī)劃訓(xùn)練期間所需跟蹤的航跡時,為使控制器適應(yīng)多種環(huán)境,以及考慮到LOS 制導(dǎo)算法中對于航向控制的要求,依據(jù)文獻(xiàn)[18]中的設(shè)計(jì)思想,根據(jù)拐角的變換,設(shè)計(jì)了多條三航跡點(diǎn)航線,每回合訓(xùn)練時隨機(jī)選取一條進(jìn)行航跡跟蹤。

    訓(xùn)練時,將數(shù)據(jù)存入經(jīng)驗(yàn)池中,然后再從中隨機(jī)采樣一組數(shù)據(jù)進(jìn)行訓(xùn)練,狀態(tài)值及動作值均進(jìn)行歸一化處理,當(dāng)達(dá)到最大步長或最終航跡點(diǎn)輸出完成時,便停止這一回合,并計(jì)算當(dāng)前回合的總回報獎勵。當(dāng)訓(xùn)練進(jìn)行到200,300 和500 回合時,其航向誤差如圖5 所示。由圖中可以看出,在訓(xùn)練時隨著回合的增加,航向誤差顯著減小,控制算法不斷收斂;當(dāng)訓(xùn)練達(dá)到最大回合結(jié)束后,總獎勵值是不斷增加的。為使圖像顯示得更加清晰,截取了200~500 回合的總回報獎勵如圖6 所示。從中可以看出,在約270 回合時算法基本收斂,展現(xiàn)了快速學(xué)習(xí)的過程。

    圖5 航向誤差曲線Fig. 5 Course error curves

    圖6 總回報獎勵曲線Fig. 6 Total reward curve

    3.3 仿真實(shí)驗(yàn)設(shè)計(jì)及對比分析

    上述訓(xùn)練完成后,DDPG 控制器保存回報獎勵函數(shù)最大的網(wǎng)絡(luò)參數(shù),并將其應(yīng)用于航跡跟蹤仿真。為了驗(yàn)證DDPG 控制器的可行性,本文選用BP-PID 控制器進(jìn)行對比分析。

    用于對比的BP-PID 控制器選擇使用輸入層節(jié)點(diǎn)數(shù)為4、隱含層節(jié)點(diǎn)數(shù)為5、輸出層節(jié)點(diǎn)數(shù)為3的BP 神經(jīng)網(wǎng)絡(luò)對PID 的3 種參數(shù)進(jìn)行選擇,其中學(xué)習(xí)率為0.546,動量因子為0.79,并參考文獻(xiàn)[19],利用附加慣性項(xiàng)對神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化。在相同的環(huán)境下,將DDPG 控制器與BP-PID控制器進(jìn)行仿真對比分析。仿真時,船舶的初始狀態(tài)為從原點(diǎn)(0,0)出發(fā),初始航向?yàn)?5°,初始航速也即縱蕩速度u= 1.179 m/s,螺旋槳初始速度r=10.4 r/s。

    仿真實(shí)驗(yàn)1:分別設(shè)計(jì)直線軌跡和鋸齒狀軌跡,用以觀察2 種控制器對直線的跟蹤效果和面對劇烈轉(zhuǎn)角變化時的跟蹤效果(圖7),軌跡點(diǎn)坐標(biāo)分別為(0,50),(400,50)和(0,0),(100,250),(200,0),(300,250),(400,0),(500,250),(600,0),單位均為m。

    圖7 航跡跟蹤效果(實(shí)驗(yàn)1)Fig. 7 Tracking control result (experiment 1)

    通過對2 種類型軌跡跟蹤的對比可以看出,對于直線軌跡,DDPG 控制器能夠更加快速地進(jìn)行穩(wěn)定跟蹤,在鋸齒狀軌跡轉(zhuǎn)角跟蹤時其效果也明顯優(yōu)于BP-PID 控制器。對仿真過程中航向角的均方根誤差(圖7(b))進(jìn)行計(jì)算,顯示BP-PID控制器的數(shù)值達(dá)61.017 8,而DDPG 控制器的僅為10.018,后者具有更加優(yōu)秀的控制性能。

    仿真實(shí)驗(yàn)2:為模擬傳統(tǒng)船舶的航行軌跡,設(shè)計(jì)軌跡點(diǎn)為(0,0),(100,50),(150,250),(400,250),(450,50),(550,0)的航跡進(jìn)行跟蹤。跟蹤效果曲線和航向均方根誤差(RMSE)的對比分別如圖8和表4 所示。

    圖8 航跡跟蹤結(jié)果(實(shí)驗(yàn)2)Fig. 8 Tracking control result (experiment 2)

    表4 控制性能指標(biāo)Table 4 Control performance

    在此次仿真過程中,進(jìn)一步對比了2 種控制器對于LOS 角跟蹤的效果以及舵角的變化頻率,結(jié)果分別如圖9 和圖10 所示。PID 經(jīng)過BP 神經(jīng)網(wǎng)絡(luò)參數(shù)整定后整體巡航時間約為1 000 s,而DDPG 控制器的巡航時間則在此基礎(chǔ)上縮短了4%;在轉(zhuǎn)角處的航向跟蹤中,DDPG 控制器在20 s內(nèi)達(dá)到期望值,而BP-PID 的調(diào)節(jié)時間則約為60 s,且控制效果并不穩(wěn)定,舵角振動頻率高。由此可見,深度強(qiáng)化學(xué)習(xí)控制器可以很快地根據(jù)航跡變化做出調(diào)整,減少了不必要的控制環(huán)節(jié),調(diào)節(jié)時間短,控制效果穩(wěn)定,舵角變化頻率小,具有良好的控制性能。

    圖9 BP-PID 控制器控制效果Fig. 9 Control result of BP-PID

    圖10 DDPG 控制器控制效果Fig. 10 Control result of DDPG

    4 結(jié) 語

    本文針對船舶的航跡跟蹤問題,提出了一種基于深度強(qiáng)化學(xué)習(xí)的航跡跟蹤控制器設(shè)計(jì)思路。首先根據(jù)LOS 算法制導(dǎo),建立了航跡跟蹤控制的馬爾可夫模型,給出了基于DDPG 控制器算法的程序?qū)崿F(xiàn);然后在Python 環(huán)境中完成了船舶航跡跟蹤控制系統(tǒng)仿真實(shí)驗(yàn),并與BP-PID 控制器進(jìn)行了性能對比分析。

    將航跡跟蹤問題進(jìn)行馬爾可夫建模設(shè)計(jì)后,將控制器投入離線學(xué)習(xí)。通過對此過程的分析發(fā)現(xiàn),DDPG 控制器在訓(xùn)練中能快速收斂達(dá)到控制要求,證明了設(shè)計(jì)的狀態(tài)、動作空間以及獎勵函數(shù)的可行性。并且航跡跟蹤仿真對比結(jié)果也顯示,DDPG 控制器能較快地應(yīng)對航跡變化,控制效果穩(wěn)定且舵角變化少,對于不同的軌跡要求適應(yīng)性均相對良好。整體而言,基于深度強(qiáng)化學(xué)習(xí)的控制方法可以應(yīng)用到船舶的航跡跟蹤控制之中,在具有自適應(yīng)穩(wěn)定控制能力的情況下,不僅免去了復(fù)雜的控制計(jì)算,也保證了實(shí)時性,對船舶的智能控制具有一定的參考價值。

    猜你喜歡
    船舶動作
    計(jì)算流體力學(xué)在船舶操縱運(yùn)動仿真中的應(yīng)用
    基于改進(jìn)譜分析法的船舶疲勞強(qiáng)度直接計(jì)算
    下一個動作
    船舶!請加速
    BOG壓縮機(jī)在小型LNG船舶上的應(yīng)用
    動作描寫要具體
    畫動作
    讓動作“活”起來
    船舶壓載水管理系統(tǒng)
    中國船檢(2017年3期)2017-05-18 11:33:09
    動作描寫不可少
    亚洲国产精品国产精品| 久久久精品区二区三区| 七月丁香在线播放| 亚洲av中文av极速乱| 国产精品一区二区在线观看99| 久久精品aⅴ一区二区三区四区 | 亚洲伊人色综图| 亚洲av免费高清在线观看| 久久国产亚洲av麻豆专区| 亚洲国产av新网站| 中文欧美无线码| 中文字幕另类日韩欧美亚洲嫩草| 尾随美女入室| 一区二区日韩欧美中文字幕| 少妇精品久久久久久久| 在线免费观看不下载黄p国产| 亚洲成人手机| 我的亚洲天堂| 在现免费观看毛片| 国产精品一国产av| 亚洲欧美精品自产自拍| 美女高潮到喷水免费观看| 精品人妻在线不人妻| 伊人久久大香线蕉亚洲五| 黄色视频在线播放观看不卡| 亚洲综合精品二区| 日韩成人av中文字幕在线观看| 男女边吃奶边做爰视频| 国产片内射在线| 搡女人真爽免费视频火全软件| 久久99蜜桃精品久久| 亚洲欧美一区二区三区黑人 | 欧美中文综合在线视频| 久久久国产一区二区| 成人国产av品久久久| 丰满少妇做爰视频| 久久 成人 亚洲| 国产成人a∨麻豆精品| av在线播放精品| 免费观看性生交大片5| 黑人猛操日本美女一级片| 美女国产视频在线观看| 午夜av观看不卡| 只有这里有精品99| 最新的欧美精品一区二区| 高清黄色对白视频在线免费看| 女性生殖器流出的白浆| 国产一区二区激情短视频 | 国产在线视频一区二区| 久久精品国产亚洲av涩爱| 久久精品国产亚洲av涩爱| 国产毛片在线视频| 人妻一区二区av| 欧美人与善性xxx| 伦精品一区二区三区| 人人妻人人爽人人添夜夜欢视频| 国产精品国产av在线观看| kizo精华| 国产精品国产av在线观看| 亚洲人成网站在线观看播放| 亚洲第一青青草原| 国产成人一区二区在线| 国产成人午夜福利电影在线观看| 80岁老熟妇乱子伦牲交| 91精品三级在线观看| 99国产精品免费福利视频| 成年人免费黄色播放视频| 亚洲经典国产精华液单| 黑丝袜美女国产一区| 亚洲成人av在线免费| 国产精品av久久久久免费| 精品国产一区二区三区久久久樱花| 黑丝袜美女国产一区| 男女下面插进去视频免费观看| 亚洲av中文av极速乱| 观看av在线不卡| 国产精品秋霞免费鲁丝片| 26uuu在线亚洲综合色| freevideosex欧美| 免费人妻精品一区二区三区视频| 哪个播放器可以免费观看大片| 久久精品国产自在天天线| 99热网站在线观看| 欧美精品国产亚洲| 制服人妻中文乱码| 久久综合国产亚洲精品| 高清不卡的av网站| av电影中文网址| 免费黄色在线免费观看| 日韩一区二区三区影片| 国产精品久久久久久精品古装| 免费黄网站久久成人精品| 极品少妇高潮喷水抽搐| 精品视频人人做人人爽| 亚洲欧美成人精品一区二区| 成年人免费黄色播放视频| 欧美日韩一区二区视频在线观看视频在线| 一级毛片黄色毛片免费观看视频| 男的添女的下面高潮视频| 亚洲一区二区三区欧美精品| 99香蕉大伊视频| 日韩中文字幕视频在线看片| 午夜久久久在线观看| 黄片播放在线免费| 久久国产亚洲av麻豆专区| 一本久久精品| 午夜日韩欧美国产| 男人爽女人下面视频在线观看| 国产精品99久久99久久久不卡 | 水蜜桃什么品种好| 蜜桃国产av成人99| 国产精品久久久av美女十八| 亚洲视频免费观看视频| 9热在线视频观看99| 亚洲国产最新在线播放| a 毛片基地| 精品国产超薄肉色丝袜足j| 99久久人妻综合| 亚洲三级黄色毛片| 久久毛片免费看一区二区三区| 亚洲经典国产精华液单| 精品福利永久在线观看| 国产精品偷伦视频观看了| 视频区图区小说| 搡老乐熟女国产| 高清不卡的av网站| 一区二区三区乱码不卡18| 777久久人妻少妇嫩草av网站| 亚洲国产欧美日韩在线播放| 18禁观看日本| 一区福利在线观看| 欧美激情极品国产一区二区三区| 国产福利在线免费观看视频| 91国产中文字幕| av免费在线看不卡| 欧美精品国产亚洲| 国产精品女同一区二区软件| 久久精品国产综合久久久| 欧美日韩精品网址| 中文字幕亚洲精品专区| 自线自在国产av| 免费黄频网站在线观看国产| 一区二区日韩欧美中文字幕| 老汉色av国产亚洲站长工具| 国产av码专区亚洲av| 欧美精品一区二区大全| 免费观看a级毛片全部| 国产一区二区在线观看av| 国产亚洲最大av| 久久精品久久精品一区二区三区| 超碰成人久久| 一级a爱视频在线免费观看| 美女视频免费永久观看网站| 国产精品麻豆人妻色哟哟久久| 少妇的逼水好多| 老司机影院毛片| 亚洲激情五月婷婷啪啪| 美女主播在线视频| 大码成人一级视频| 成人影院久久| 日本av手机在线免费观看| 久久精品国产综合久久久| 国产老妇伦熟女老妇高清| 香蕉精品网在线| 久久精品aⅴ一区二区三区四区 | 亚洲精品久久久久久婷婷小说| 99久久中文字幕三级久久日本| 丰满迷人的少妇在线观看| 亚洲婷婷狠狠爱综合网| 国产精品99久久99久久久不卡 | 婷婷成人精品国产| 日韩制服丝袜自拍偷拍| 亚洲国产看品久久| 中文字幕人妻丝袜一区二区 | 国产成人精品在线电影| 日韩av不卡免费在线播放| 婷婷色综合大香蕉| 精品久久蜜臀av无| 中国国产av一级| 男男h啪啪无遮挡| 久久久久国产精品人妻一区二区| 国产在线一区二区三区精| 免费少妇av软件| 久久久久精品人妻al黑| 久久人妻熟女aⅴ| 亚洲天堂av无毛| 又粗又硬又长又爽又黄的视频| 亚洲精品久久午夜乱码| 美女国产高潮福利片在线看| 亚洲国产成人一精品久久久| 男人添女人高潮全过程视频| 日本黄色日本黄色录像| av网站免费在线观看视频| 视频在线观看一区二区三区| 婷婷色综合大香蕉| 亚洲熟女精品中文字幕| 亚洲欧洲国产日韩| 波多野结衣一区麻豆| 久久久国产一区二区| 午夜日韩欧美国产| 国产精品国产三级国产专区5o| 久久精品国产鲁丝片午夜精品| 国产又爽黄色视频| 久久久欧美国产精品| 久久久久久久久久久免费av| 最新的欧美精品一区二区| 亚洲精品乱久久久久久| 在线观看美女被高潮喷水网站| 水蜜桃什么品种好| 极品少妇高潮喷水抽搐| 国产探花极品一区二区| 亚洲一码二码三码区别大吗| 色婷婷av一区二区三区视频| 男女国产视频网站| 午夜老司机福利剧场| 国产精品久久久久久久久免| 另类亚洲欧美激情| 亚洲国产精品一区二区三区在线| 日韩不卡一区二区三区视频在线| 欧美精品av麻豆av| 美女国产高潮福利片在线看| 涩涩av久久男人的天堂| 国产成人精品一,二区| 精品人妻一区二区三区麻豆| 亚洲精华国产精华液的使用体验| 在线看a的网站| 亚洲伊人久久精品综合| 黄色怎么调成土黄色| 亚洲精品日本国产第一区| 十八禁高潮呻吟视频| 国产成人一区二区在线| 亚洲欧美一区二区三区黑人 | 成人二区视频| 两个人免费观看高清视频| 永久免费av网站大全| 国产精品无大码| 有码 亚洲区| 国产精品久久久久成人av| 天天躁夜夜躁狠狠躁躁| 欧美日本中文国产一区发布| 91午夜精品亚洲一区二区三区| 国产成人精品婷婷| 午夜老司机福利剧场| 狠狠精品人妻久久久久久综合| 91精品三级在线观看| a级毛片在线看网站| 亚洲av福利一区| 亚洲综合精品二区| 亚洲国产精品国产精品| 国产精品.久久久| 国产熟女午夜一区二区三区| √禁漫天堂资源中文www| 免费日韩欧美在线观看| videos熟女内射| 国产精品.久久久| 99热国产这里只有精品6| 久久精品久久精品一区二区三区| 黄网站色视频无遮挡免费观看| 在线观看一区二区三区激情| 久久久久久久久久人人人人人人| 色婷婷av一区二区三区视频| 久久韩国三级中文字幕| 欧美成人午夜免费资源| 欧美人与善性xxx| 这个男人来自地球电影免费观看 | 国产精品亚洲av一区麻豆 | 国产av国产精品国产| 一区二区三区激情视频| 国产又爽黄色视频| 成年美女黄网站色视频大全免费| 69精品国产乱码久久久| 久久青草综合色| 国产精品久久久久久久久免| 日韩,欧美,国产一区二区三区| 精品国产乱码久久久久久小说| av在线播放精品| 啦啦啦啦在线视频资源| 宅男免费午夜| 麻豆av在线久日| 亚洲精品国产色婷婷电影| 免费在线观看视频国产中文字幕亚洲 | www.精华液| 黄色视频在线播放观看不卡| 男人添女人高潮全过程视频| 亚洲欧美一区二区三区黑人 | 高清在线视频一区二区三区| 精品国产露脸久久av麻豆| 最黄视频免费看| 久久久久久久精品精品| 成人二区视频| 亚洲国产日韩一区二区| 精品一区二区三区四区五区乱码 | 日韩制服丝袜自拍偷拍| 亚洲成av片中文字幕在线观看 | 国产人伦9x9x在线观看 | 免费观看av网站的网址| 性少妇av在线| 日韩免费高清中文字幕av| 新久久久久国产一级毛片| 色网站视频免费| 亚洲综合色惰| 啦啦啦视频在线资源免费观看| 国产欧美日韩一区二区三区在线| 欧美人与善性xxx| 人人妻人人澡人人看| 国产av国产精品国产| 欧美日韩亚洲高清精品| 亚洲国产日韩一区二区| 男的添女的下面高潮视频| 日韩三级伦理在线观看| 亚洲精品日本国产第一区| 日韩视频在线欧美| 精品国产露脸久久av麻豆| 精品一区二区免费观看| 王馨瑶露胸无遮挡在线观看| 精品亚洲乱码少妇综合久久| 亚洲人成77777在线视频| 亚洲欧洲国产日韩| av国产精品久久久久影院| 啦啦啦啦在线视频资源| 捣出白浆h1v1| 亚洲成色77777| 永久免费av网站大全| 十分钟在线观看高清视频www| 丝袜美足系列| 丝袜喷水一区| 国产av精品麻豆| 男人操女人黄网站| av在线播放精品| 国产深夜福利视频在线观看| 人体艺术视频欧美日本| 精品午夜福利在线看| 97人妻天天添夜夜摸| 国产不卡av网站在线观看| 免费人妻精品一区二区三区视频| 国产精品欧美亚洲77777| av天堂久久9| 久久久亚洲精品成人影院| 久久毛片免费看一区二区三区| 久久精品国产亚洲av天美| 女性被躁到高潮视频| 哪个播放器可以免费观看大片| 亚洲av免费高清在线观看| 人妻 亚洲 视频| 久久99蜜桃精品久久| 久久国产亚洲av麻豆专区| 免费少妇av软件| 国产精品国产三级专区第一集| 黄色怎么调成土黄色| 久久久久久人妻| 男女免费视频国产| 久久热在线av| 成年av动漫网址| 高清黄色对白视频在线免费看| 制服人妻中文乱码| 精品99又大又爽又粗少妇毛片| 中文字幕人妻丝袜制服| 亚洲欧洲日产国产| 欧美亚洲日本最大视频资源| 国产在线免费精品| 成人国产av品久久久| 中文字幕另类日韩欧美亚洲嫩草| 午夜久久久在线观看| 国产精品一二三区在线看| 免费大片黄手机在线观看| 可以免费在线观看a视频的电影网站 | 久久久久视频综合| 久久久久网色| 亚洲国产精品999| 亚洲av男天堂| 亚洲五月色婷婷综合| 九草在线视频观看| 欧美日韩亚洲国产一区二区在线观看 | 欧美日韩亚洲国产一区二区在线观看 | av片东京热男人的天堂| 美女国产高潮福利片在线看| 免费在线观看完整版高清| 99香蕉大伊视频| 久久久久网色| 精品人妻熟女毛片av久久网站| 亚洲av成人精品一二三区| 免费日韩欧美在线观看| 国产毛片在线视频| 99热网站在线观看| 国产精品99久久99久久久不卡 | 黄色一级大片看看| 亚洲精品乱久久久久久| 九色亚洲精品在线播放| 精品酒店卫生间| 国产精品三级大全| 婷婷色av中文字幕| 夫妻性生交免费视频一级片| 一边亲一边摸免费视频| 欧美日韩亚洲高清精品| 久久99一区二区三区| 91在线精品国自产拍蜜月| av在线老鸭窝| 欧美亚洲 丝袜 人妻 在线| 午夜老司机福利剧场| 亚洲精品一二三| 中国三级夫妇交换| 亚洲精品中文字幕在线视频| 精品国产一区二区三区久久久樱花| 成年女人毛片免费观看观看9 | 亚洲欧美日韩另类电影网站| 人人妻人人澡人人爽人人夜夜| 亚洲欧洲精品一区二区精品久久久 | 日韩精品有码人妻一区| 亚洲国产精品成人久久小说| 亚洲久久久国产精品| 国产成人精品婷婷| 青春草国产在线视频| 国产精品av久久久久免费| 午夜久久久在线观看| 久热久热在线精品观看| 在线看a的网站| 91在线精品国自产拍蜜月| 亚洲第一av免费看| 久久久久精品久久久久真实原创| 亚洲国产精品成人久久小说| 99re6热这里在线精品视频| 自拍欧美九色日韩亚洲蝌蚪91| 韩国av在线不卡| 国产精品av久久久久免费| 国产精品国产av在线观看| 制服丝袜香蕉在线| 国产一区二区 视频在线| 日日啪夜夜爽| 汤姆久久久久久久影院中文字幕| 性色avwww在线观看| 欧美激情 高清一区二区三区| 国产极品粉嫩免费观看在线| 欧美精品亚洲一区二区| 国产伦理片在线播放av一区| 又大又黄又爽视频免费| 欧美国产精品va在线观看不卡| av有码第一页| 成人影院久久| 精品99又大又爽又粗少妇毛片| 纵有疾风起免费观看全集完整版| 啦啦啦中文免费视频观看日本| 男人添女人高潮全过程视频| 男人操女人黄网站| 欧美日韩综合久久久久久| 日韩精品有码人妻一区| 亚洲精品成人av观看孕妇| 国产av码专区亚洲av| 国产综合精华液| 一级爰片在线观看| 亚洲美女视频黄频| 韩国av在线不卡| 男女免费视频国产| 久久午夜福利片| 国产在线视频一区二区| 欧美中文综合在线视频| 亚洲国产精品国产精品| 国产精品无大码| 美女国产高潮福利片在线看| 国产高清不卡午夜福利| 在线观看美女被高潮喷水网站| 亚洲精品久久成人aⅴ小说| 成人国产av品久久久| 青草久久国产| 高清不卡的av网站| 18+在线观看网站| 一级片'在线观看视频| 午夜精品国产一区二区电影| 婷婷色麻豆天堂久久| 欧美国产精品va在线观看不卡| 成人亚洲精品一区在线观看| 丰满迷人的少妇在线观看| 国产亚洲av片在线观看秒播厂| 最新中文字幕久久久久| 热re99久久精品国产66热6| 国产成人精品无人区| 9191精品国产免费久久| 日本黄色日本黄色录像| 成人影院久久| 在线观看免费视频网站a站| 国产精品亚洲av一区麻豆 | 熟妇人妻不卡中文字幕| 中文欧美无线码| 侵犯人妻中文字幕一二三四区| 色94色欧美一区二区| 观看美女的网站| 熟女av电影| 黑人猛操日本美女一级片| 国产xxxxx性猛交| 一级毛片 在线播放| 韩国精品一区二区三区| 免费观看a级毛片全部| 欧美成人午夜精品| 国产成人精品无人区| 我要看黄色一级片免费的| 成年人免费黄色播放视频| 国产精品女同一区二区软件| 青春草视频在线免费观看| 日日撸夜夜添| 亚洲图色成人| av免费观看日本| 丰满饥渴人妻一区二区三| 国产精品 国内视频| 不卡av一区二区三区| 午夜福利在线免费观看网站| 国产av国产精品国产| 亚洲,欧美,日韩| 国产人伦9x9x在线观看 | 桃花免费在线播放| 中文字幕亚洲精品专区| 久久99蜜桃精品久久| 最近的中文字幕免费完整| 午夜日本视频在线| 久久久久精品性色| 中文字幕另类日韩欧美亚洲嫩草| 久久精品国产综合久久久| 久久女婷五月综合色啪小说| 国产1区2区3区精品| 黄色配什么色好看| 久久99热这里只频精品6学生| 国产精品国产av在线观看| 夫妻午夜视频| 男人添女人高潮全过程视频| 免费不卡的大黄色大毛片视频在线观看| 97在线人人人人妻| 女人精品久久久久毛片| 久久精品国产a三级三级三级| 少妇人妻 视频| 亚洲精品国产av蜜桃| 日韩伦理黄色片| 纯流量卡能插随身wifi吗| 亚洲天堂av无毛| 亚洲精品成人av观看孕妇| 一级,二级,三级黄色视频| 久久国产亚洲av麻豆专区| 久久久久久久亚洲中文字幕| 99久久中文字幕三级久久日本| 飞空精品影院首页| 午夜福利在线观看免费完整高清在| 啦啦啦在线免费观看视频4| 精品人妻熟女毛片av久久网站| 久久综合国产亚洲精品| 亚洲第一青青草原| 国产精品女同一区二区软件| 亚洲视频免费观看视频| 久久影院123| 1024香蕉在线观看| 精品第一国产精品| 18+在线观看网站| 搡老乐熟女国产| 亚洲,欧美精品.| 综合色丁香网| 亚洲国产日韩一区二区| 毛片一级片免费看久久久久| 国产成人精品在线电影| 天天躁日日躁夜夜躁夜夜| 丝袜美腿诱惑在线| 国产精品熟女久久久久浪| 免费观看在线日韩| 在线 av 中文字幕| 人成视频在线观看免费观看| 97人妻天天添夜夜摸| 日韩av不卡免费在线播放| 一级黄片播放器| 亚洲一区二区三区欧美精品| 一级黄片播放器| 久久精品亚洲av国产电影网| 三级国产精品片| 国产黄频视频在线观看| 丰满饥渴人妻一区二区三| 亚洲色图 男人天堂 中文字幕| 久久精品久久久久久久性| 欧美精品一区二区免费开放| 久热久热在线精品观看| 日韩不卡一区二区三区视频在线| 亚洲图色成人| 国产极品粉嫩免费观看在线| 国产在线一区二区三区精| 亚洲伊人久久精品综合| 一个人免费看片子| 精品99又大又爽又粗少妇毛片| 一区在线观看完整版| 中文字幕制服av| 日本vs欧美在线观看视频| 国产野战对白在线观看| 熟女少妇亚洲综合色aaa.| 亚洲精华国产精华液的使用体验| 制服人妻中文乱码| 国产探花极品一区二区| 男男h啪啪无遮挡| 国产av精品麻豆| 成年人午夜在线观看视频| 男的添女的下面高潮视频| 免费黄色在线免费观看| 黄片无遮挡物在线观看| 女人被躁到高潮嗷嗷叫费观| 亚洲美女视频黄频| 一个人免费看片子| 国产激情久久老熟女| 宅男免费午夜| 日日摸夜夜添夜夜爱| 人体艺术视频欧美日本| 美女国产高潮福利片在线看| 最新的欧美精品一区二区| 中文字幕制服av| 精品久久久久久电影网| 在线亚洲精品国产二区图片欧美| 精品国产乱码久久久久久小说| 亚洲图色成人| 欧美精品国产亚洲| 另类亚洲欧美激情| 中文字幕av电影在线播放| 国产熟女欧美一区二区| 国产精品久久久久久精品电影小说| 国产黄色免费在线视频| 国产精品蜜桃在线观看|