• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于強(qiáng)化學(xué)習(xí)的海洋移動(dòng)觀測(cè)網(wǎng)絡(luò)觀測(cè)路徑規(guī)劃方法

    2022-02-18 08:12:50趙玉新杜登輝成小會(huì)周迪鄧雄劉延龍
    智能系統(tǒng)學(xué)報(bào) 2022年1期
    關(guān)鍵詞:觀測(cè)神經(jīng)網(wǎng)絡(luò)動(dòng)作

    趙玉新,杜登輝,成小會(huì),周迪,鄧雄,劉延龍

    (1.哈爾濱工程大學(xué) 智能科學(xué)與工程學(xué)院, 黑龍江 哈爾濱 150001; 2.中國(guó)艦船研究設(shè)計(jì)中心, 湖北 武漢430064)

    海洋環(huán)境觀測(cè)在海洋學(xué)中有著至關(guān)重要的作用,對(duì)海洋環(huán)境的觀測(cè)是人類認(rèn)識(shí)和開(kāi)發(fā)海洋的基礎(chǔ)[1]。區(qū)域海洋環(huán)境觀測(cè)系統(tǒng)作為全球海洋觀測(cè)系統(tǒng)中的重要組成部分,為海洋科學(xué)研究、海洋資源探測(cè)以及海洋環(huán)境狀況以及變化趨勢(shì)等方面提供了有效的觀測(cè)數(shù)據(jù)資料。盡管海洋環(huán)境觀測(cè)對(duì)人類生活有著重要的科學(xué)意義和和社會(huì)經(jīng)濟(jì)價(jià)值,但是其依然面臨著巨大的挑戰(zhàn)[2],如何基于有限的海洋環(huán)境觀測(cè)平臺(tái),構(gòu)建海洋環(huán)境移動(dòng)觀測(cè)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)區(qū)域海洋環(huán)境的最優(yōu)化觀測(cè),以及如何基于海洋移動(dòng)觀測(cè)平臺(tái)獲取的實(shí)時(shí)的海洋環(huán)境觀測(cè)數(shù)據(jù),實(shí)現(xiàn)海洋環(huán)境觀測(cè)平臺(tái)的自適應(yīng)路徑優(yōu)化成為當(dāng)前區(qū)域海洋環(huán)境觀測(cè)技術(shù)發(fā)展的重要課題[3-4]。

    本文將深度強(qiáng)化學(xué)習(xí)算法用于區(qū)域海洋環(huán)境觀測(cè)網(wǎng)絡(luò)的觀測(cè)方案設(shè)計(jì)。強(qiáng)化學(xué)習(xí)算法是一類學(xué)習(xí)、預(yù)測(cè)、決策的方法,通過(guò)智能體與環(huán)境的交互,利用試錯(cuò)的方式學(xué)習(xí)最優(yōu)策略[5]。強(qiáng)化學(xué)習(xí)算法已經(jīng)被廣泛應(yīng)用到路徑規(guī)劃中[6-14],以往的這些工作或?qū)?yōu)化算法結(jié)合強(qiáng)化學(xué)習(xí),或直接采用和改進(jìn)強(qiáng)化學(xué)習(xí)方法,解決了傳統(tǒng)的針對(duì)避障的路徑規(guī)劃問(wèn)題。但是區(qū)域海洋觀測(cè)網(wǎng)絡(luò)的路徑規(guī)劃不只是針對(duì)避障,其主要目的是通過(guò)獲取海洋環(huán)境預(yù)報(bào)數(shù)據(jù),智能地選擇觀測(cè)價(jià)值較大的區(qū)域,針對(duì)這個(gè)問(wèn)題尚未被提出有效的方法。本文吸收了深度強(qiáng)化學(xué)習(xí)解決路徑規(guī)劃問(wèn)題的經(jīng)驗(yàn)[15-21],考慮海洋環(huán)境預(yù)報(bào)數(shù)據(jù),將海洋環(huán)境自適應(yīng)觀測(cè)看成一類序列決策優(yōu)化問(wèn)題,海洋環(huán)境移動(dòng)觀測(cè)平臺(tái)接到指令,通過(guò)獲取當(dāng)前復(fù)雜的海洋環(huán)境背景場(chǎng)信息做出下一步?jīng)Q策,實(shí)現(xiàn)復(fù)雜海洋環(huán)境下的最優(yōu)觀測(cè)。

    1 問(wèn)題描述

    1.1 數(shù)學(xué)模型

    區(qū)域海洋環(huán)境移動(dòng)觀測(cè)網(wǎng)絡(luò)由移動(dòng)觀測(cè)平臺(tái)如無(wú)人測(cè)量船(unmanned survey vessel,USV)、水下滑翔器(underwater glider)、自主水下航行器(autonomous underwater vehicle, AUV)等組成,觀測(cè)的對(duì)象是海洋中一定時(shí)間梯度下溫差變化較大的區(qū)域。本文主要討論無(wú)人測(cè)量船在海洋中的采樣點(diǎn)觀測(cè)路徑規(guī)劃。如圖1所示,USV要從選定的起始點(diǎn)(x1,y1)出發(fā),對(duì)海洋中的溫差改變較大的區(qū)域進(jìn)行測(cè)量,并根據(jù)未知的障礙物實(shí)時(shí)對(duì)USV進(jìn)行操控,避免其碰撞,目標(biāo)就是在約束條件下最大化對(duì)該區(qū)域范圍內(nèi)溫度變化梯度較大的點(diǎn)進(jìn)行采樣。

    第i個(gè) U SVi從一個(gè)點(diǎn) (xi,yi)到另一個(gè)點(diǎn)(xi+1,yi+1)的路徑可表示為

    式中:θ為USV在第i個(gè)路徑點(diǎn)的航向;vi為USV在第i個(gè)路徑點(diǎn)的速度;t為時(shí)間步長(zhǎng)。

    USV的海洋環(huán)境探測(cè)示意圖如圖1所示。USV在一定方向范圍內(nèi)對(duì)周邊的海洋環(huán)境進(jìn)行探測(cè),探測(cè)角度為 αi,探測(cè)半徑為R,在該點(diǎn)探測(cè)到的采樣點(diǎn)的溫度差為 (ΔTi1,ΔTi2,···,ΔTim),對(duì)探測(cè)到的溫度差進(jìn)行比較,選取溫度差最大的 ΔTij為下一點(diǎn)的采樣點(diǎn)。

    圖1 路徑規(guī)劃采樣示意Fig.1 Path planning sampling diagram

    所以,對(duì)于該問(wèn)題,其目標(biāo)函數(shù)為

    式中:d為續(xù)航里程約束函數(shù);vi為速度約束;θ為探測(cè)方向角約束;t為時(shí)間步長(zhǎng)。

    1.2 區(qū)域耦合環(huán)境數(shù)值分析預(yù)報(bào)

    在本文中,主要是將海洋環(huán)境要素?cái)?shù)值預(yù)報(bào)信息作為重要參考,對(duì)海洋移動(dòng)觀測(cè)網(wǎng)絡(luò)設(shè)計(jì)觀測(cè)方案。因此首先需要構(gòu)建一個(gè)海洋環(huán)境數(shù)值預(yù)報(bào)系統(tǒng),以獲取區(qū)域的海洋環(huán)境數(shù)值預(yù)報(bào)信息。本文選擇在一個(gè)中等復(fù)雜程度的耦合環(huán)流模式(intermediate complex coupled model, ICCM)的基礎(chǔ)上進(jìn)行優(yōu)化調(diào)整,從而獲取更加符合區(qū)域海洋移動(dòng)觀測(cè)網(wǎng)絡(luò)路徑規(guī)劃的數(shù)值預(yù)報(bào)信息。由于ICCM本身的水平分辨率較大,這樣大粒度的數(shù)據(jù)很難作為區(qū)域性移動(dòng)觀測(cè)網(wǎng)絡(luò)路徑規(guī)劃的參照,因此本文采用一種多層嵌套的方式將耦合模式系統(tǒng)的分辨率由3.75°變?yōu)?.1°,并且采用一種最優(yōu)觀測(cè)時(shí)間窗口的耦合數(shù)據(jù)同化方法,構(gòu)建區(qū)域耦合環(huán)境分析預(yù)報(bào)系統(tǒng)。在該系統(tǒng)中,本文選取經(jīng)度為 124.0°~129.0°E、緯度為 16.0°~21.0°N 的范圍獲取時(shí)長(zhǎng)為5 d的海表溫度預(yù)報(bào)信息作為海洋移動(dòng)觀測(cè)網(wǎng)絡(luò)路徑規(guī)劃依據(jù)。

    1.3 深度強(qiáng)化學(xué)習(xí)

    深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning,DRL)是近年來(lái)人工智能領(lǐng)域一個(gè)蓬勃發(fā)展的方向,目的是解決計(jì)算機(jī)從感知到?jīng)Q策控制的問(wèn)題,從而實(shí)現(xiàn)通用人工智能[22]。圖2展示了強(qiáng)化學(xué)習(xí)模型中涉及的基本思想和要素。深度強(qiáng)化學(xué)習(xí)本質(zhì)上是使用深度神經(jīng)網(wǎng)絡(luò)來(lái)代替表格作為強(qiáng)化學(xué)習(xí)算法的策略函數(shù)。傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法(例如Q-learning)采用表格作為策略函數(shù),表格中的數(shù)值代表每個(gè)狀態(tài)下采取某個(gè)動(dòng)作時(shí)的價(jià)值,智能體通過(guò)比較同一個(gè)狀態(tài)下價(jià)值的大小從而選擇合適的動(dòng)作。但是當(dāng)環(huán)境越來(lái)越復(fù)雜,狀態(tài)越來(lái)越多甚至是連續(xù)的時(shí)候,采用表格的方法實(shí)現(xiàn)決策就越來(lái)越困難,而深度神經(jīng)網(wǎng)絡(luò)正好具有強(qiáng)大的擬合能力,所以可以將這個(gè)決策函數(shù)用深度神經(jīng)網(wǎng)絡(luò)來(lái)代替,這樣就形成了深度強(qiáng)化學(xué)習(xí)。目前,絕大多數(shù)強(qiáng)化學(xué)習(xí)算法都是使用深度神經(jīng)網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)強(qiáng)化學(xué)習(xí)算法中的表格作為策略表示。

    圖2 強(qiáng)化學(xué)習(xí)示意Fig.2 Schematic diagram of reinforcement learning

    對(duì)于強(qiáng)化學(xué)習(xí)算法的研究,也在不斷地發(fā)展,如圖3所示。Mnih等[23]等將神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)強(qiáng)化學(xué)習(xí)(RL)中的Q-Learning算法相結(jié)合,提出了深度Q網(wǎng)絡(luò)(deep Q-network, DQN)模型,該模型用于處理基于視覺(jué)感知的控制任務(wù),開(kāi)創(chuàng)了深度強(qiáng)化學(xué)習(xí)領(lǐng)域新局面[24]。

    圖3 DQN算法圖解Fig.3 DQN algorithm diagram

    DQN算法使用均方差更新網(wǎng)絡(luò)權(quán)重來(lái)定義目標(biāo)函數(shù):

    DQN有兩個(gè)特質(zhì):1) 經(jīng)驗(yàn)回收,DQN有一個(gè)經(jīng)驗(yàn)池用來(lái)存儲(chǔ)學(xué)習(xí)數(shù)據(jù),由于DQN是一種離線學(xué)習(xí)方法,所以每次DQN更新的時(shí)候,都可以從記憶庫(kù)中隨機(jī)抽取數(shù)據(jù);2) 目標(biāo)神經(jīng)網(wǎng)絡(luò),它是一個(gè)結(jié)構(gòu)與Q網(wǎng)絡(luò)完全相同但參數(shù)不同的神經(jīng)網(wǎng)絡(luò),用于產(chǎn)生目標(biāo)值[25]。

    2 設(shè)計(jì)方案

    2.1 數(shù)據(jù)預(yù)處理

    在本文中,數(shù)據(jù)預(yù)處理主要是指將數(shù)值模式預(yù)報(bào)出的海洋環(huán)境數(shù)據(jù)處理成可被讀取、易于訓(xùn)練的形式。本文針對(duì)的是區(qū)域海洋環(huán)境數(shù)據(jù),因此主要獲取的是區(qū)域海洋環(huán)境要素場(chǎng)隨時(shí)間變化的數(shù)據(jù)和該區(qū)域的障礙物信息,然后對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)變形、數(shù)據(jù)插值、構(gòu)建時(shí)間梯度場(chǎng)、裁切局部環(huán)境場(chǎng)、構(gòu)建障礙物場(chǎng)等。

    首先對(duì)原始數(shù)據(jù)進(jìn)行變形,原始數(shù)據(jù)無(wú)法體現(xiàn)出各點(diǎn)之間的相對(duì)位置關(guān)系,對(duì)于路徑規(guī)劃任務(wù)基本沒(méi)有意義。因此本文根據(jù)數(shù)據(jù)的坐標(biāo)信息將原始數(shù)據(jù)重整成均勻分布的海洋環(huán)境場(chǎng)數(shù)據(jù)。輸入數(shù)據(jù)不僅要能表征全局的絕對(duì)數(shù)據(jù),還要能表征海洋環(huán)境要素的時(shí)間梯度和觀測(cè)平臺(tái)周圍的局部數(shù)據(jù),因此分別求取海洋環(huán)境要素場(chǎng)的時(shí)間梯度場(chǎng)和對(duì)全局?jǐn)?shù)據(jù)場(chǎng)進(jìn)行裁切獲得局部海洋環(huán)境要素場(chǎng);另外,避障約束是路徑規(guī)劃的基本要求,因此輸入數(shù)據(jù)也要能體現(xiàn)該區(qū)域障礙物的位置信息,將障礙物進(jìn)行環(huán)境建模,構(gòu)建區(qū)域障礙物場(chǎng)。其中局部環(huán)境場(chǎng)的裁切如圖4所示。

    圖4 局部環(huán)境場(chǎng)的裁切Fig.4 Trimming of local environmental fields

    此外,在對(duì)深度強(qiáng)化學(xué)習(xí)算法中的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的過(guò)程中,通常不直接使用源數(shù)據(jù),而是將數(shù)據(jù)進(jìn)行歸一化處理,由于經(jīng)過(guò)上述處理后的數(shù)據(jù)為二維柵格數(shù)據(jù),因此采用二維數(shù)據(jù)歸一化。在本文中,采用了RankGaussion數(shù)據(jù)標(biāo)準(zhǔn)化方法。在RankGaussion方法中是先將數(shù)據(jù)按照大小進(jìn)行排序,然后再將數(shù)據(jù)標(biāo)準(zhǔn)化為高斯分布,在訓(xùn)練基于梯度的模型(如神經(jīng)網(wǎng)絡(luò))時(shí)使用這種方法能夠加快收斂速度。

    2.2 環(huán)境狀態(tài)和動(dòng)作設(shè)計(jì)

    強(qiáng)化學(xué)習(xí)的環(huán)境指的是對(duì)現(xiàn)實(shí)環(huán)境反映模式的模擬,或者更一般地說(shuō),它允許對(duì)外部環(huán)境的行為進(jìn)行推斷。例如給定一個(gè)狀態(tài)和動(dòng)作,模型就可以預(yù)測(cè)下一個(gè)狀態(tài)和收益。除此之外,環(huán)境還能模擬整個(gè)規(guī)劃過(guò)程,包括環(huán)境狀態(tài)的重置,環(huán)境數(shù)據(jù)的調(diào)度,環(huán)境的可視化等。環(huán)境對(duì)應(yīng)著我們所要解決的問(wèn)題的場(chǎng)景,它通過(guò)模擬現(xiàn)實(shí)情況進(jìn)行算法的訓(xùn)練??傊h(huán)境就是提供給強(qiáng)化學(xué)習(xí)算法一個(gè)運(yùn)行平臺(tái),強(qiáng)化學(xué)習(xí)代理通過(guò)與環(huán)境進(jìn)行交互獲取狀態(tài)、動(dòng)作、獎(jiǎng)賞等數(shù)據(jù)進(jìn)行訓(xùn)練,環(huán)境則是通過(guò)強(qiáng)化學(xué)習(xí)代理產(chǎn)生的策略根據(jù)狀態(tài)得到動(dòng)作,進(jìn)行完整的狀態(tài)迭代過(guò)程。

    強(qiáng)化學(xué)習(xí)算法中環(huán)境的搭建首先要明確狀態(tài)和動(dòng)作,動(dòng)作即為路徑規(guī)劃過(guò)程中的決策,想要通過(guò)訓(xùn)練得到期望的動(dòng)作,那么神經(jīng)網(wǎng)絡(luò)的輸入即狀態(tài)必須包含足夠且精準(zhǔn)的環(huán)境信息??紤]到海洋環(huán)境觀測(cè)路徑規(guī)劃的目的,于是取狀態(tài)為全局海洋環(huán)境場(chǎng)、局部海洋環(huán)境場(chǎng)和觀測(cè)平臺(tái)的位置,如圖5所示。

    圖5 環(huán)境狀態(tài)設(shè)計(jì)Fig.5 Environmental state design

    環(huán)境動(dòng)作空間的設(shè)計(jì)指定了智能體所能采取的動(dòng)作的范圍,也決定了其所能探索的狀態(tài)空間的最大范圍。一個(gè)好的動(dòng)作空間的設(shè)計(jì)是在探索范圍和訓(xùn)練效率之間的權(quán)衡,既不能將動(dòng)作空間設(shè)計(jì)過(guò)于保守,壓縮探索空間范圍造成局部最優(yōu);同時(shí)又不能將動(dòng)作空間設(shè)計(jì)得過(guò)于繁瑣,導(dǎo)致訓(xùn)練過(guò)程難以收斂;另外,動(dòng)作空間的設(shè)計(jì)還要考慮動(dòng)作的“合法性”,即需要考慮設(shè)計(jì)的動(dòng)作是否能夠達(dá)到或者會(huì)不會(huì)造成嚴(yán)重的后果,在設(shè)計(jì)動(dòng)作空間的過(guò)程中要拋棄不合法的動(dòng)作。

    本文中的動(dòng)作空間主要指能夠?qū)σ苿?dòng)觀測(cè)平臺(tái)的移動(dòng)造成影響的變量,對(duì)于宏觀的路徑點(diǎn)規(guī)劃來(lái)說(shuō),將運(yùn)動(dòng)變量歸納為航向和航速。如圖6所示,航向和航速兩個(gè)變量都對(duì)移動(dòng)觀測(cè)平臺(tái)的空間探索范圍有所影響,因此為了權(quán)衡探索范圍和訓(xùn)練效率,分別將兩個(gè)變量限制在一定的范圍內(nèi)。

    圖6 動(dòng)作空間設(shè)計(jì)Fig.6 Action space design

    2.3 獎(jiǎng)賞函數(shù)設(shè)計(jì)

    獎(jiǎng)賞函數(shù)的設(shè)計(jì)對(duì)強(qiáng)化學(xué)習(xí)算法來(lái)說(shuō)至關(guān)重要。強(qiáng)化學(xué)習(xí)的最終目標(biāo)就是使得累計(jì)期望獎(jiǎng)賞最大化,因此獎(jiǎng)賞函數(shù)的設(shè)計(jì)決定了訓(xùn)練的方向,獎(jiǎng)賞函數(shù)的設(shè)計(jì)在一定程度上也就決定了訓(xùn)練效果的上限。本文獎(jiǎng)賞函數(shù)涉及多個(gè)目標(biāo),對(duì)多目標(biāo)優(yōu)化的處理是通過(guò)線性加權(quán)的方式轉(zhuǎn)化為單目標(biāo)優(yōu)化。獎(jiǎng)賞函數(shù)應(yīng)該體現(xiàn)所規(guī)劃路徑的目標(biāo)以及約束,即應(yīng)包含海洋環(huán)境待測(cè)要素的信息梯度、移動(dòng)觀測(cè)平臺(tái)的測(cè)量屬性約束、多個(gè)移動(dòng)觀測(cè)平臺(tái)之間的避障和重疊約束等。

    1) 海洋環(huán)境待測(cè)要素的信息梯度

    在本文中,移動(dòng)觀測(cè)平臺(tái)執(zhí)行海洋觀測(cè)任務(wù)主要的目的就是捕捉海洋環(huán)境要素的變化特性,所以當(dāng)觀測(cè)資源有限時(shí),觀測(cè)應(yīng)該集中在變化劇烈的區(qū)域。待觀測(cè)要素分析預(yù)報(bào)場(chǎng)的標(biāo)準(zhǔn)差和水平梯度能有效表征待測(cè)要素在時(shí)間和空間上的變化特性,所以分別采用基于待測(cè)海域海洋要素的時(shí)間梯度和空間梯度作為獎(jiǎng)賞函數(shù):

    2) 移動(dòng)觀測(cè)平臺(tái)的測(cè)量屬性約束

    本文針對(duì)觀測(cè)平臺(tái)自身的測(cè)量屬性,包括時(shí)間間隔、測(cè)量范圍、續(xù)航里程,構(gòu)建了相應(yīng)的約束。移動(dòng)觀測(cè)平臺(tái)續(xù)航里程則對(duì)應(yīng)整個(gè)觀測(cè)平臺(tái)的觀測(cè)軌跡總長(zhǎng)度。

    3) 觀測(cè)平臺(tái)的避障約束

    對(duì)移動(dòng)觀測(cè)平臺(tái)進(jìn)行路徑規(guī)劃,避障是一個(gè)不可能回避的問(wèn)題,任何觀測(cè)任務(wù)如果不能保證其安全性那么將失去意義。本文針對(duì)的是相對(duì)全局的路徑規(guī)劃,因此只需考慮海面存在的島嶼等固定障礙元素,這些障礙信息也是執(zhí)行路徑規(guī)劃的重要信息考量。在本文中,為了完成避障任務(wù)需要對(duì)智能體施加一個(gè)避障約束,當(dāng)智能體遇到障礙時(shí)對(duì)其施加一個(gè)負(fù)的獎(jiǎng)賞值,訓(xùn)練智能體避免再碰到障礙。

    2.4 智能體設(shè)計(jì)

    對(duì)智能體的設(shè)計(jì)首先是選擇深度強(qiáng)化學(xué)習(xí)算法,它決定了智能體的結(jié)構(gòu)以及參數(shù)更新方式,本文選擇了DQN和深度確定性策略梯度(deep deterministic policy gradient, DDPG)算法。另外就是神經(jīng)網(wǎng)絡(luò)的搭建。

    神經(jīng)網(wǎng)絡(luò)是強(qiáng)化學(xué)習(xí)算法中策略的表征,它是狀態(tài)空間到動(dòng)作空間的映射。深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)環(huán)境的精確感知,以及強(qiáng)化學(xué)習(xí)算法從環(huán)境狀態(tài)到?jīng)Q策動(dòng)作映射的決策能力,實(shí)現(xiàn)海洋環(huán)境觀測(cè)路徑規(guī)劃結(jié)果最優(yōu)。神經(jīng)網(wǎng)絡(luò)的架構(gòu)應(yīng)與狀態(tài)以及動(dòng)作相符合,如圖7所示。由于本文的狀態(tài)包括全局海洋環(huán)境場(chǎng)、局部海洋環(huán)境場(chǎng),以及移動(dòng)海洋環(huán)境觀測(cè)平臺(tái)的X、Y坐標(biāo),因此神經(jīng)網(wǎng)絡(luò)的輸入為混合輸入,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)海洋環(huán)境場(chǎng)數(shù)據(jù)進(jìn)行處理,再與觀測(cè)平臺(tái)坐標(biāo)進(jìn)行融合作為整個(gè)神經(jīng)網(wǎng)絡(luò)的輸入。神經(jīng)網(wǎng)絡(luò)的輸出為各離散動(dòng)作Q值,輸出的維度為離散動(dòng)作的個(gè)數(shù)。

    圖7 神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.7 Neural network architecture

    以上設(shè)計(jì)主要是針對(duì)單個(gè)智能體的情況,對(duì)于多智能體的設(shè)計(jì)主要是對(duì)多個(gè)單智能體進(jìn)行組合,以達(dá)到整體最優(yōu)結(jié)果。本文所采用的多智能體是完全合作的關(guān)系,所有智能體的目標(biāo)一致,均是改善觀測(cè)效果,只需要調(diào)整智能體訓(xùn)練時(shí)的獎(jiǎng)賞即可。因此將單個(gè)智能體獎(jiǎng)賞函數(shù)中海洋環(huán)境待測(cè)要素的信息梯度部分進(jìn)行求和,作為整體獎(jiǎng)賞函數(shù)替換單個(gè)智能體的梯度獎(jiǎng)賞。

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 實(shí)驗(yàn)參數(shù)設(shè)置

    在第2節(jié)中,搭建了采用強(qiáng)化學(xué)習(xí)訓(xùn)練移動(dòng)觀測(cè)平臺(tái)進(jìn)行路徑規(guī)劃的框架,分別設(shè)計(jì)了環(huán)境的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)函數(shù)以及智能體的神經(jīng)網(wǎng)絡(luò)架構(gòu),本節(jié)主要是進(jìn)行實(shí)驗(yàn)以及對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。采用DQN及DDPG算法進(jìn)行訓(xùn)練的偽代碼分別算法1和算法2所示。

    算法1使用DQN算法生成路徑

    1)創(chuàng)建環(huán)境,生成并初始化智能體

    2) for episode=1,Mdo

    3)初始化環(huán)境狀態(tài)s1

    4) fort=1,Tdo

    5)以 ?的概率隨機(jī)選擇一個(gè)動(dòng)作at否則選擇at=maxaQ?(st,a;θ)

    6)在環(huán)境中執(zhí)行at得到獎(jiǎng)賞rt和st+1

    7)在記憶池中存儲(chǔ)樣本(st,at,rt,st+1)

    8)從記憶池抽取樣本(sj,aj,rj,sj+1)

    9)當(dāng)sj+1為回合終止?fàn)顟B(tài)時(shí),yj=rj,否則

    10)根據(jù)式 (yj?Q(sj,aj;θ))執(zhí)行梯度下降;

    11) end for

    12) end for

    算法2使用DDPG算法生成路徑

    1)創(chuàng)建環(huán)境,生成并初始化智能體;

    2)初始化critic網(wǎng)絡(luò)Q(s,a|θQ), actor網(wǎng)絡(luò) μ (s|θμ);

    3) for episode=1,Mdo

    4)初始化環(huán)境狀態(tài)s1;

    5) fort=1,Tdo

    6)根據(jù)策略和噪音選取at= μ(st|θμ)+Nt;

    7)在環(huán)境中執(zhí)行at得到獎(jiǎng)賞rt和st+1;

    8)在記憶池中存儲(chǔ)樣本 (st,at,rt,st+1);

    9)從記憶池抽取N個(gè)樣本 (sj,aj,rj,sj+1);

    10)設(shè)置yi=ri+ γQ′(si+1,μ′(si+1|θμ′)θQ′);

    11)更新critic網(wǎng)絡(luò):

    12)更新actor網(wǎng)絡(luò):

    13)更新目標(biāo)網(wǎng)絡(luò):

    14) end for

    15) end for

    為驗(yàn)證本文所提出方案的有效性,分別在有障礙和無(wú)障礙、單平臺(tái)和多平臺(tái)的情況下對(duì)實(shí)驗(yàn)方案進(jìn)行測(cè)試,在單平臺(tái)無(wú)障礙情況下對(duì)DQN和DDPG算法進(jìn)行對(duì)比。實(shí)驗(yàn)場(chǎng)景設(shè)置為經(jīng)度124.0~129.0°E,緯度 16.0~21.0°N,分辨率為 0.1°的海區(qū),模擬移動(dòng)觀測(cè)平臺(tái)從西向東進(jìn)行海洋環(huán)境要素觀測(cè)。

    實(shí)驗(yàn)中的參數(shù)設(shè)置如表1所示。

    表1 智能體參數(shù)設(shè)置Table 1 Agent parameter setting

    單平臺(tái)的環(huán)境參數(shù)設(shè)置如表2所示。

    表2 環(huán)境參數(shù)設(shè)置(單平臺(tái))Table 2 Environmental parameter setting(single platform)

    多平臺(tái)的環(huán)境參數(shù)設(shè)置如表3所示。

    表3 環(huán)境參數(shù)設(shè)置(多平臺(tái))Table 3 Environmental parameter setting(multi-platform)

    3.2 單平臺(tái)實(shí)驗(yàn)結(jié)果

    在單平臺(tái)實(shí)驗(yàn)中,選定移動(dòng)平臺(tái)運(yùn)動(dòng)初始位置,分別進(jìn)行有障礙和無(wú)障礙的實(shí)驗(yàn)。最終得到獎(jiǎng)賞函數(shù)曲線和損失函數(shù)曲線,并畫(huà)出單平臺(tái)采樣路徑,如圖8所示。

    圖8 單平臺(tái)實(shí)驗(yàn)Fig.8 Single platform experiment

    3.3 多平臺(tái)實(shí)驗(yàn)結(jié)果

    多平臺(tái)實(shí)驗(yàn)是選取5個(gè)移動(dòng)觀測(cè)平臺(tái),設(shè)置5個(gè)起始點(diǎn),分別使用DQN算法和DDPG算法進(jìn)行有障礙和無(wú)障礙采樣實(shí)驗(yàn)。多平臺(tái)進(jìn)行1 000次迭代。實(shí)驗(yàn)結(jié)果得到獎(jiǎng)賞函數(shù)曲線、損失函數(shù)曲線和多平臺(tái)采樣路徑,如圖9所示。

    圖9 多平臺(tái)實(shí)驗(yàn)Fig.9 Multi-platform experiment

    3.4 實(shí)驗(yàn)結(jié)果分析

    對(duì)單平臺(tái)和多平臺(tái)通過(guò)DQN算法得到的采樣結(jié)果與背景場(chǎng)平均溫度進(jìn)行對(duì)比。結(jié)果如圖10所示。

    圖10 采樣結(jié)果對(duì)比Fig.10 Comparison of sampling results

    對(duì)于單平臺(tái)實(shí)驗(yàn),如圖8,分別采用DQN和DDPG算法在有障礙和無(wú)障礙的情況下進(jìn)行了實(shí)驗(yàn),在進(jìn)行500次的實(shí)驗(yàn)迭代后,實(shí)驗(yàn)結(jié)果表明,采用離散動(dòng)作空間的DQN算法能夠得到較好的獎(jiǎng)賞曲線,并且其損失函數(shù)值相對(duì)較小。實(shí)驗(yàn)表明,在本觀測(cè)平臺(tái)采樣任務(wù)中,采取離散的動(dòng)作空間更有利于找到較高的獎(jiǎng)賞值,即可以采集到更多的觀測(cè)信息。

    對(duì)于多平臺(tái)實(shí)驗(yàn),如圖9,可明顯看出總的獎(jiǎng)賞函數(shù)的上升趨勢(shì)。當(dāng)進(jìn)行有障礙實(shí)驗(yàn)時(shí),由于當(dāng)路徑碰撞障礙物或出界時(shí)環(huán)境會(huì)自動(dòng)給出負(fù)的獎(jiǎng)賞值來(lái)“警告”智能體,因此可以看到前期獎(jiǎng)賞曲線會(huì)有比較稠密的負(fù)值。隨著訓(xùn)練的不斷進(jìn)行,可以觀察到負(fù)值明顯減少,并且獎(jiǎng)賞值有比較明顯的提高。

    在單平臺(tái)和多平臺(tái)實(shí)驗(yàn)中,觀測(cè)平臺(tái)在有障礙的環(huán)境下,基于離散動(dòng)作的DQN算法都能有效地避開(kāi)障礙,對(duì)海洋環(huán)境信息進(jìn)行有效采集。

    通過(guò)對(duì)單平臺(tái)和多平臺(tái)得到的采樣結(jié)果與背景場(chǎng)平均溫度對(duì)比分析,如圖10,單平臺(tái)和多平臺(tái)的采樣結(jié)果都要高于背景場(chǎng)的平均溫度,說(shuō)明基于離散動(dòng)作的深度強(qiáng)化學(xué)習(xí)的海洋移動(dòng)觀測(cè)平臺(tái)可以在有限資源條件下采集更多的海洋環(huán)境信息,進(jìn)一步說(shuō)明DQN算法在海洋移動(dòng)觀測(cè)網(wǎng)絡(luò)觀測(cè)路徑規(guī)劃中的可行性和有效性。

    4 結(jié)束語(yǔ)

    本文主要研究在有限資源條件下如何對(duì)移動(dòng)海洋觀測(cè)平臺(tái)進(jìn)行合理有效的設(shè)計(jì),使得觀測(cè)平臺(tái)可以對(duì)龐大海洋環(huán)境中采集更多的有效信息。本文分別設(shè)計(jì)了基于離散動(dòng)作的DQN算法和基于連續(xù)動(dòng)作的DDPG算法對(duì)海洋環(huán)境移動(dòng)觀測(cè)網(wǎng)絡(luò)進(jìn)行規(guī)劃,并對(duì)通過(guò)算法得到的采樣結(jié)果的有效性進(jìn)行了分析。

    首先通過(guò)獲取海洋環(huán)境數(shù)值預(yù)報(bào)信息,基于RankGaussion對(duì)預(yù)報(bào)信息進(jìn)行數(shù)據(jù)預(yù)處理,在此基礎(chǔ)上結(jié)合海洋環(huán)境信息和移動(dòng)觀測(cè)平臺(tái)的碰撞及能量約束設(shè)置獎(jiǎng)賞函數(shù),采用DQN和DDPG算法最終從與環(huán)境的交互信息中學(xué)習(xí)路徑規(guī)劃策略完成單智能體路徑規(guī)劃任務(wù)。在此基礎(chǔ)上,構(gòu)建基于行為分析的多平臺(tái)觀測(cè)網(wǎng)絡(luò),通過(guò)將具有完全合作關(guān)系的移動(dòng)觀測(cè)平臺(tái)獎(jiǎng)賞進(jìn)行結(jié)合,指導(dǎo)多個(gè)移動(dòng)觀測(cè)平臺(tái)各自的采樣路徑規(guī)劃。實(shí)驗(yàn)結(jié)果表明,采用基于離散動(dòng)作的深度強(qiáng)化學(xué)習(xí)算法能夠有效提高觀測(cè)效率。

    本文將在以下幾個(gè)方面展開(kāi)更深入的研究:

    1) 針對(duì)多觀測(cè)平臺(tái),設(shè)計(jì)基于協(xié)作的多智能體強(qiáng)化學(xué)習(xí)算法,對(duì)移動(dòng)海洋觀測(cè)網(wǎng)絡(luò)進(jìn)行規(guī)劃,以期獲得更多有效的觀測(cè)信息;

    2) 海洋環(huán)境信息復(fù)雜,不同的獎(jiǎng)賞函數(shù)設(shè)計(jì)都會(huì)影響觀測(cè)效果,下一步將考慮更多的環(huán)境因素,研究設(shè)計(jì)更合理有效的獎(jiǎng)賞函數(shù);

    3) 將觀測(cè)方案結(jié)果與海洋環(huán)境數(shù)值預(yù)報(bào)系統(tǒng)進(jìn)行深度結(jié)合,使得觀測(cè)數(shù)據(jù)更好服務(wù)于海洋環(huán)境數(shù)值預(yù)報(bào)系統(tǒng)。

    猜你喜歡
    觀測(cè)神經(jīng)網(wǎng)絡(luò)動(dòng)作
    觀測(cè)到恒星死亡瞬間
    軍事文摘(2023年18期)2023-11-03 09:45:42
    神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    動(dòng)作描寫(xiě)要具體
    畫(huà)動(dòng)作
    天測(cè)與測(cè)地VLBI 測(cè)地站周圍地形觀測(cè)遮掩的討論
    動(dòng)作描寫(xiě)不可少
    可觀測(cè)宇宙
    太空探索(2016年7期)2016-07-10 12:10:15
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
    高分辨率對(duì)地觀測(cè)系統(tǒng)
    太空探索(2015年8期)2015-07-18 11:04:44
    18禁黄网站禁片午夜丰满| 国产高清有码在线观看视频| 国产三级中文精品| 成人精品一区二区免费| 99久久国产精品久久久| 99国产综合亚洲精品| avwww免费| 国产精品1区2区在线观看.| 欧美大码av| 国产精品 国内视频| 久久亚洲精品不卡| 午夜两性在线视频| 啦啦啦韩国在线观看视频| 精品熟女少妇八av免费久了| 亚洲av电影在线进入| 99re在线观看精品视频| 黄色成人免费大全| 窝窝影院91人妻| 99久国产av精品| 禁无遮挡网站| 黄色视频,在线免费观看| 国产精品影院久久| 国产精品乱码一区二三区的特点| 色尼玛亚洲综合影院| 最近在线观看免费完整版| 亚洲精品粉嫩美女一区| 久久久久久九九精品二区国产| 成人永久免费在线观看视频| 欧洲精品卡2卡3卡4卡5卡区| 99在线视频只有这里精品首页| 少妇裸体淫交视频免费看高清| 99久久精品热视频| 好男人电影高清在线观看| 国产伦一二天堂av在线观看| 国产精品永久免费网站| 黄色片一级片一级黄色片| 日日干狠狠操夜夜爽| 黄片小视频在线播放| 男女午夜视频在线观看| 亚洲欧美日韩无卡精品| 深夜精品福利| 听说在线观看完整版免费高清| 亚洲av第一区精品v没综合| tocl精华| 99久久综合精品五月天人人| 看片在线看免费视频| 亚洲午夜精品一区,二区,三区| 日韩精品青青久久久久久| 免费电影在线观看免费观看| 99国产综合亚洲精品| av中文乱码字幕在线| 91老司机精品| 特大巨黑吊av在线直播| 国产淫片久久久久久久久 | 日韩欧美国产在线观看| 久久久国产成人免费| 最近最新中文字幕大全免费视频| 岛国视频午夜一区免费看| 97人妻精品一区二区三区麻豆| 黄色 视频免费看| 757午夜福利合集在线观看| 国产高清三级在线| 99热6这里只有精品| 亚洲精华国产精华精| 桃红色精品国产亚洲av| 国产成人影院久久av| 久久久久久国产a免费观看| 国产主播在线观看一区二区| 12—13女人毛片做爰片一| 精品不卡国产一区二区三区| 欧美绝顶高潮抽搐喷水| 99热精品在线国产| 色尼玛亚洲综合影院| 夜夜夜夜夜久久久久| 俺也久久电影网| 天天躁日日操中文字幕| 亚洲av电影在线进入| 88av欧美| 黄色女人牲交| 亚洲欧美日韩无卡精品| 老熟妇仑乱视频hdxx| 婷婷精品国产亚洲av| 国产亚洲精品av在线| 精品国产乱子伦一区二区三区| 日本在线视频免费播放| www国产在线视频色| 一级作爱视频免费观看| 青草久久国产| 两性夫妻黄色片| 久久久久久久精品吃奶| 偷拍熟女少妇极品色| 久久精品影院6| 黄片小视频在线播放| 草草在线视频免费看| 2021天堂中文幕一二区在线观| 国产一区二区三区视频了| 手机成人av网站| 两性午夜刺激爽爽歪歪视频在线观看| 99热精品在线国产| 99久久成人亚洲精品观看| 国产精品亚洲av一区麻豆| 国产精华一区二区三区| 久久亚洲真实| 亚洲七黄色美女视频| 精品久久久久久久毛片微露脸| АⅤ资源中文在线天堂| 他把我摸到了高潮在线观看| 中文字幕人成人乱码亚洲影| 久久欧美精品欧美久久欧美| 999精品在线视频| 日本成人三级电影网站| 99国产精品一区二区三区| 亚洲一区二区三区不卡视频| 亚洲中文日韩欧美视频| 国产伦一二天堂av在线观看| 99热精品在线国产| 天堂网av新在线| 国产 一区 欧美 日韩| 高清在线国产一区| 亚洲av电影不卡..在线观看| 狂野欧美激情性xxxx| 国产亚洲欧美98| 在线看三级毛片| 麻豆成人午夜福利视频| 两性夫妻黄色片| a在线观看视频网站| 嫩草影院入口| 国产成人精品久久二区二区91| 男女之事视频高清在线观看| av在线天堂中文字幕| 国产精品爽爽va在线观看网站| 国产一区二区在线av高清观看| АⅤ资源中文在线天堂| 免费高清视频大片| 久久中文看片网| 国产欧美日韩一区二区三| 久久精品夜夜夜夜夜久久蜜豆| 日韩 欧美 亚洲 中文字幕| 天天躁狠狠躁夜夜躁狠狠躁| 日本免费一区二区三区高清不卡| 国产一区二区三区视频了| 亚洲中文字幕一区二区三区有码在线看 | 欧美高清成人免费视频www| 小蜜桃在线观看免费完整版高清| 日日夜夜操网爽| 亚洲 欧美一区二区三区| 国产av麻豆久久久久久久| 国产精品久久久久久精品电影| 欧美在线黄色| 无遮挡黄片免费观看| 色在线成人网| 美女免费视频网站| 午夜福利欧美成人| 一区福利在线观看| 在线永久观看黄色视频| 国产91精品成人一区二区三区| 99热只有精品国产| 亚洲国产欧洲综合997久久,| 男女床上黄色一级片免费看| 亚洲精品美女久久av网站| 国模一区二区三区四区视频 | 免费一级毛片在线播放高清视频| 精品国内亚洲2022精品成人| 国产av麻豆久久久久久久| 人人妻人人看人人澡| netflix在线观看网站| 搞女人的毛片| 亚洲色图av天堂| 女同久久另类99精品国产91| 成人特级黄色片久久久久久久| 不卡一级毛片| 成人国产一区最新在线观看| 精品人妻1区二区| 啦啦啦免费观看视频1| 搡老岳熟女国产| 少妇丰满av| а√天堂www在线а√下载| 俺也久久电影网| 搡老岳熟女国产| 亚洲真实伦在线观看| 亚洲精品一区av在线观看| 久久久久亚洲av毛片大全| 日本免费一区二区三区高清不卡| 999久久久国产精品视频| 伊人久久大香线蕉亚洲五| 午夜福利高清视频| 又粗又爽又猛毛片免费看| 午夜视频精品福利| 日韩人妻高清精品专区| 国产男靠女视频免费网站| www日本黄色视频网| 亚洲美女视频黄频| 午夜免费观看网址| 国产黄a三级三级三级人| 综合色av麻豆| 香蕉丝袜av| 最近最新免费中文字幕在线| 久久久久国内视频| 1024手机看黄色片| 很黄的视频免费| 99久国产av精品| 亚洲第一电影网av| 一级毛片女人18水好多| 国产精品野战在线观看| 国产亚洲精品av在线| 成人国产综合亚洲| 亚洲人成网站在线播放欧美日韩| 老汉色∧v一级毛片| 日韩欧美国产一区二区入口| 亚洲自拍偷在线| 午夜免费观看网址| 亚洲国产欧美人成| 51午夜福利影视在线观看| 欧美黑人巨大hd| 国产亚洲精品久久久com| 操出白浆在线播放| 国产精品亚洲av一区麻豆| 日韩欧美国产在线观看| 看黄色毛片网站| 亚洲国产精品合色在线| 亚洲熟女毛片儿| 午夜视频精品福利| 日韩欧美精品v在线| 国产免费av片在线观看野外av| 国产精品一区二区三区四区久久| 90打野战视频偷拍视频| 国产成人精品久久二区二区91| 99久久无色码亚洲精品果冻| 女生性感内裤真人,穿戴方法视频| 亚洲熟妇中文字幕五十中出| 国产蜜桃级精品一区二区三区| 久久久水蜜桃国产精品网| 午夜亚洲福利在线播放| 一边摸一边抽搐一进一小说| 在线观看日韩欧美| 亚洲第一欧美日韩一区二区三区| 黄色丝袜av网址大全| 欧美一级a爱片免费观看看| 国产亚洲精品综合一区在线观看| 超碰成人久久| 国产精品久久久久久久电影 | 国产伦一二天堂av在线观看| 午夜两性在线视频| 波多野结衣高清无吗| 少妇丰满av| 亚洲中文av在线| 亚洲欧美日韩卡通动漫| 欧美成狂野欧美在线观看| 国产单亲对白刺激| 日韩欧美在线二视频| 国产探花在线观看一区二区| 欧美在线一区亚洲| 一个人观看的视频www高清免费观看 | 亚洲精品国产精品久久久不卡| 亚洲精品中文字幕一二三四区| 亚洲五月天丁香| 午夜激情福利司机影院| 亚洲第一电影网av| 黑人操中国人逼视频| 99国产精品一区二区三区| 免费在线观看影片大全网站| 美女大奶头视频| 亚洲国产欧洲综合997久久,| 天天躁日日操中文字幕| 国产亚洲精品久久久com| 午夜激情福利司机影院| 亚洲第一电影网av| 欧美高清成人免费视频www| 国产精品亚洲一级av第二区| 亚洲精品在线观看二区| 精品国产美女av久久久久小说| 亚洲av电影在线进入| 嫁个100分男人电影在线观看| 亚洲成a人片在线一区二区| 国内久久婷婷六月综合欲色啪| 亚洲中文日韩欧美视频| 变态另类成人亚洲欧美熟女| 很黄的视频免费| 色av中文字幕| 国产欧美日韩精品一区二区| 黄色日韩在线| 国产野战对白在线观看| 男女床上黄色一级片免费看| 亚洲欧美日韩卡通动漫| 精品无人区乱码1区二区| 亚洲欧洲精品一区二区精品久久久| 亚洲无线观看免费| 午夜福利在线观看免费完整高清在 | 免费电影在线观看免费观看| 2021天堂中文幕一二区在线观| 亚洲18禁久久av| а√天堂www在线а√下载| 无人区码免费观看不卡| 看免费av毛片| 亚洲av五月六月丁香网| 2021天堂中文幕一二区在线观| 亚洲av成人av| 国产成人影院久久av| 美女扒开内裤让男人捅视频| 曰老女人黄片| 人人妻人人澡欧美一区二区| 美女高潮喷水抽搐中文字幕| 日日干狠狠操夜夜爽| 欧美日韩一级在线毛片| 国产精品永久免费网站| 欧美乱码精品一区二区三区| 亚洲 欧美 日韩 在线 免费| 中文字幕人成人乱码亚洲影| 久久久久久大精品| 久久九九热精品免费| 亚洲国产中文字幕在线视频| 亚洲av片天天在线观看| 国产午夜福利久久久久久| 日韩 欧美 亚洲 中文字幕| 欧美性猛交黑人性爽| 国产精华一区二区三区| 亚洲av电影不卡..在线观看| 亚洲午夜理论影院| 不卡一级毛片| 在线永久观看黄色视频| 一夜夜www| 最新在线观看一区二区三区| 国产欧美日韩精品一区二区| 日韩中文字幕欧美一区二区| 亚洲国产看品久久| 偷拍熟女少妇极品色| 18禁黄网站禁片午夜丰满| 91老司机精品| 一级黄色大片毛片| av欧美777| 精品免费久久久久久久清纯| 美女 人体艺术 gogo| 天堂网av新在线| 国产精品亚洲一级av第二区| 五月伊人婷婷丁香| 午夜亚洲福利在线播放| 精品一区二区三区四区五区乱码| 亚洲在线观看片| 亚洲成人免费电影在线观看| 精品国产三级普通话版| 日本a在线网址| 桃色一区二区三区在线观看| av片东京热男人的天堂| 别揉我奶头~嗯~啊~动态视频| 成年免费大片在线观看| 麻豆一二三区av精品| 三级国产精品欧美在线观看 | 无人区码免费观看不卡| 看免费av毛片| 国内精品美女久久久久久| 亚洲国产欧洲综合997久久,| 好男人在线观看高清免费视频| 久久国产精品人妻蜜桃| av福利片在线观看| 草草在线视频免费看| 久久久久久久精品吃奶| 婷婷丁香在线五月| 国产免费男女视频| 久久婷婷人人爽人人干人人爱| 精品久久久久久久末码| 丁香六月欧美| 精品电影一区二区在线| 亚洲精品色激情综合| 18美女黄网站色大片免费观看| 99久国产av精品| 香蕉久久夜色| 男人舔奶头视频| 麻豆国产97在线/欧美| 黄片大片在线免费观看| 国产精品久久电影中文字幕| 国产免费男女视频| 精品久久久久久,| 黄色视频,在线免费观看| 在线观看免费午夜福利视频| 国产高清三级在线| 日本成人三级电影网站| 国产精品香港三级国产av潘金莲| 观看美女的网站| 99久久精品国产亚洲精品| 一级毛片高清免费大全| 一进一出抽搐gif免费好疼| 岛国视频午夜一区免费看| 成人无遮挡网站| 国产成人啪精品午夜网站| 色老头精品视频在线观看| 在线观看一区二区三区| 久久精品91无色码中文字幕| 亚洲国产精品久久男人天堂| 在线观看66精品国产| 国产主播在线观看一区二区| 亚洲国产欧美一区二区综合| 亚洲第一电影网av| 三级男女做爰猛烈吃奶摸视频| 一区福利在线观看| 色播亚洲综合网| 丰满人妻熟妇乱又伦精品不卡| 在线a可以看的网站| 久久中文看片网| 嫁个100分男人电影在线观看| 国产高清videossex| 三级男女做爰猛烈吃奶摸视频| 久久精品国产清高在天天线| 禁无遮挡网站| 国产激情欧美一区二区| 国产三级中文精品| 我要搜黄色片| 亚洲男人的天堂狠狠| 日本成人三级电影网站| 久久久久久久久久黄片| 亚洲国产色片| 亚洲国产日韩欧美精品在线观看 | 精品一区二区三区视频在线观看免费| 哪里可以看免费的av片| 在线免费观看不下载黄p国产 | 看黄色毛片网站| 国产男靠女视频免费网站| 男女之事视频高清在线观看| 美女扒开内裤让男人捅视频| 亚洲人成网站在线播放欧美日韩| 天堂动漫精品| 国产成人av教育| 无限看片的www在线观看| 最新中文字幕久久久久 | 免费看日本二区| 国产精品1区2区在线观看.| 免费电影在线观看免费观看| 久9热在线精品视频| 小蜜桃在线观看免费完整版高清| 色在线成人网| 免费搜索国产男女视频| 日本一本二区三区精品| 精品电影一区二区在线| 精品国产乱码久久久久久男人| 午夜福利成人在线免费观看| 精品一区二区三区视频在线观看免费| 床上黄色一级片| 国产单亲对白刺激| av天堂中文字幕网| 久久久水蜜桃国产精品网| 国产日本99.免费观看| 成人高潮视频无遮挡免费网站| 国产精品久久久久久精品电影| 久9热在线精品视频| 在线观看舔阴道视频| 国产蜜桃级精品一区二区三区| 亚洲色图 男人天堂 中文字幕| 欧美高清成人免费视频www| 丁香欧美五月| 男插女下体视频免费在线播放| 日日摸夜夜添夜夜添小说| 久久国产乱子伦精品免费另类| 97超视频在线观看视频| 成人特级av手机在线观看| 91麻豆av在线| 国产精品久久久久久久电影 | 久久婷婷人人爽人人干人人爱| 久久久色成人| 国产亚洲精品一区二区www| 色综合亚洲欧美另类图片| 亚洲av成人不卡在线观看播放网| 久久久国产精品麻豆| 精品午夜福利视频在线观看一区| 夜夜看夜夜爽夜夜摸| a级毛片a级免费在线| 亚洲男人的天堂狠狠| 老汉色∧v一级毛片| 我要搜黄色片| 国产aⅴ精品一区二区三区波| 日韩人妻高清精品专区| 国产成人精品久久二区二区91| 91老司机精品| 亚洲国产精品sss在线观看| 黄片大片在线免费观看| 亚洲av成人一区二区三| 久久这里只有精品中国| 久久久国产成人免费| 日韩国内少妇激情av| 亚洲av美国av| 国内久久婷婷六月综合欲色啪| 99国产极品粉嫩在线观看| 成年人黄色毛片网站| 亚洲va日本ⅴa欧美va伊人久久| 丰满人妻一区二区三区视频av | 欧美黄色片欧美黄色片| 两人在一起打扑克的视频| 欧美日韩综合久久久久久 | 人妻夜夜爽99麻豆av| а√天堂www在线а√下载| 久久久久久久久免费视频了| 免费看a级黄色片| 午夜福利视频1000在线观看| 搡老熟女国产l中国老女人| 亚洲激情在线av| 亚洲成a人片在线一区二区| 国产视频一区二区在线看| 欧美性猛交╳xxx乱大交人| 日韩欧美国产在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 毛片女人毛片| 免费看光身美女| 亚洲精品美女久久久久99蜜臀| 少妇的丰满在线观看| 国产高清视频在线播放一区| 色播亚洲综合网| 人人妻人人看人人澡| 国产精品一及| 国产成人欧美在线观看| 老汉色∧v一级毛片| 亚洲aⅴ乱码一区二区在线播放| 中文字幕av在线有码专区| 免费电影在线观看免费观看| 首页视频小说图片口味搜索| 免费在线观看影片大全网站| 亚洲黑人精品在线| 亚洲中文日韩欧美视频| 久久中文看片网| 亚洲第一欧美日韩一区二区三区| 麻豆久久精品国产亚洲av| 69av精品久久久久久| 国产亚洲精品综合一区在线观看| 精品国产美女av久久久久小说| 老司机午夜福利在线观看视频| 一区二区三区高清视频在线| 欧美xxxx黑人xx丫x性爽| 一本综合久久免费| 国产av不卡久久| svipshipincom国产片| 精品久久久久久,| 国产精品美女特级片免费视频播放器 | 国产亚洲精品久久久久久毛片| 日本a在线网址| 国产成人精品久久二区二区免费| 黄片小视频在线播放| 校园春色视频在线观看| 国产av在哪里看| 在线观看日韩欧美| 女同久久另类99精品国产91| 亚洲欧美一区二区三区黑人| 99久久99久久久精品蜜桃| 国产精品一区二区三区四区久久| 国产精品久久电影中文字幕| 2021天堂中文幕一二区在线观| 操出白浆在线播放| 欧美日韩黄片免| 一边摸一边抽搐一进一小说| 少妇熟女aⅴ在线视频| 亚洲狠狠婷婷综合久久图片| 国产欧美日韩精品一区二区| 精品乱码久久久久久99久播| 美女扒开内裤让男人捅视频| 久久国产乱子伦精品免费另类| 热99re8久久精品国产| 每晚都被弄得嗷嗷叫到高潮| 俺也久久电影网| 一个人看的www免费观看视频| 亚洲欧美一区二区三区黑人| 欧美乱码精品一区二区三区| 琪琪午夜伦伦电影理论片6080| 久久热在线av| 在线永久观看黄色视频| 精品99又大又爽又粗少妇毛片 | 91字幕亚洲| 亚洲国产色片| 国产欧美日韩精品亚洲av| 国产av一区在线观看免费| 在线观看一区二区三区| 久久久久国产一级毛片高清牌| 久久久久亚洲av毛片大全| av女优亚洲男人天堂 | 国产黄色小视频在线观看| 天堂av国产一区二区熟女人妻| 色尼玛亚洲综合影院| 精品一区二区三区视频在线观看免费| 男女之事视频高清在线观看| 国产亚洲精品av在线| or卡值多少钱| 看黄色毛片网站| 色综合站精品国产| 99精品在免费线老司机午夜| 亚洲av成人av| 精品国内亚洲2022精品成人| 亚洲18禁久久av| 久久久久久久久免费视频了| 丰满人妻一区二区三区视频av | 黄频高清免费视频| 欧美乱码精品一区二区三区| 国产一区二区三区在线臀色熟女| 波多野结衣巨乳人妻| 国产精品日韩av在线免费观看| 国产1区2区3区精品| 亚洲中文av在线| 国产av麻豆久久久久久久| 国产黄a三级三级三级人| 免费观看精品视频网站| 国产高清视频在线观看网站| 淫妇啪啪啪对白视频| 亚洲熟妇中文字幕五十中出| 精品久久久久久久久久免费视频| 亚洲av免费在线观看| 久久久久久久久免费视频了| 88av欧美| 日韩大尺度精品在线看网址| 亚洲精品美女久久久久99蜜臀| 亚洲在线自拍视频| 久久久久久久久久黄片| 日本一本二区三区精品| 亚洲精品色激情综合| 高潮久久久久久久久久久不卡| 五月玫瑰六月丁香| 精品国内亚洲2022精品成人| 真实男女啪啪啪动态图| 日韩欧美一区二区三区在线观看| 亚洲国产精品久久男人天堂| 丰满的人妻完整版| 久久热在线av|