• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度確定性梯度算法的端到端自動(dòng)駕駛策略

    2023-02-27 07:26:32賴晨光楊小青龐玉涵
    關(guān)鍵詞:動(dòng)作智能環(huán)境

    賴晨光,楊小青,胡 博, 龐玉涵, 鄒 宏

    (1.重慶理工大學(xué) 汽車零部件制造及檢測(cè)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室, 重慶 400054; 2.重慶理工大學(xué) 車輛工程學(xué)院, 重慶 400054)

    0 引言

    近年來(lái),汽車領(lǐng)域迎來(lái)了重大變革,由原始的機(jī)械制造朝著智能化方向發(fā)展,全球許多知名汽車生產(chǎn)制造企業(yè)大量投資到智能駕駛技術(shù)領(lǐng)域。而大多數(shù)的智能駕駛系統(tǒng)采用高度模塊化的設(shè)計(jì)方法,其優(yōu)點(diǎn)是擁有很強(qiáng)的可解釋性,不過(guò),對(duì)于復(fù)雜的城市道路,控制器的參數(shù)數(shù)目龐大,即使采取自適應(yīng)的參數(shù)調(diào)節(jié),通常也受限于模型的表達(dá)能力,魯棒性難以得到保證。

    2016年,Nvidia團(tuán)隊(duì)通過(guò)監(jiān)督學(xué)習(xí)首次實(shí)現(xiàn)了智能駕駛的端到端控制輸出,該算法以RGB視頻圖像作為輸入,省略了中間感知、決策、控制等環(huán)節(jié),直接輸出方向、油門、制動(dòng)等動(dòng)作[1]。雖然使用監(jiān)督學(xué)習(xí)訓(xùn)練的模型在大部分的環(huán)境下有良好的行駛表現(xiàn),但需要體量龐大的人工標(biāo)注的數(shù)據(jù)。

    本文同樣針對(duì)智能駕駛提出了一個(gè)端到端的控制方法,不同的是,采取深度強(qiáng)化學(xué)習(xí)算法,避免了大量的人工標(biāo)注數(shù)據(jù)的工作。除此之外,鑒于強(qiáng)化學(xué)習(xí)算法在訓(xùn)練的過(guò)程中會(huì)采取大量的隨機(jī)動(dòng)作來(lái)探索環(huán)境,從而導(dǎo)致小車時(shí)常處于比較危險(xiǎn)的狀態(tài)[2]。因此,本文在深度強(qiáng)化學(xué)習(xí)算法的基礎(chǔ)上添加了一個(gè)干預(yù)智能體危險(xiǎn)動(dòng)作的監(jiān)督器,從而減少?gòu)?qiáng)化學(xué)習(xí)危險(xiǎn)的試錯(cuò)行為,同時(shí)提升訓(xùn)練效率。

    1 深度強(qiáng)化學(xué)習(xí)理論及算法

    1.1 強(qiáng)化學(xué)習(xí)

    基本的強(qiáng)化學(xué)習(xí)過(guò)程如圖1所示,不同于監(jiān)督學(xué)習(xí),它通過(guò)試錯(cuò)的機(jī)制,使智能體與外界環(huán)境進(jìn)行交互獲得獎(jiǎng)勵(lì)來(lái)指導(dǎo)每一步行為動(dòng)作,從而最大化累積獎(jiǎng)勵(lì)[3]。

    圖1 強(qiáng)化學(xué)習(xí)過(guò)程示意圖

    根據(jù)優(yōu)化的目標(biāo)分類,強(qiáng)化學(xué)習(xí)可以分為基于值函數(shù)的優(yōu)化算法和基于策略的優(yōu)化算法[4]?;谥岛瘮?shù)的算法以最大化狀態(tài)值函數(shù)或動(dòng)作值函數(shù)為優(yōu)化目標(biāo),最終找到最優(yōu)策略;基于策略搜索的強(qiáng)化學(xué)習(xí)算法直接將策略參數(shù)化,并對(duì)策略函數(shù)求導(dǎo),利用梯度法最大化累積回報(bào)[5]?;谥岛瘮?shù)的強(qiáng)化學(xué)習(xí)難以處理輸出為連續(xù)值的問(wèn)題,而優(yōu)點(diǎn)是能找到全局最優(yōu);基于策略搜索的強(qiáng)化學(xué)習(xí)盡管可以解決連續(xù)動(dòng)作輸出問(wèn)題,但容易陷入局部最優(yōu)[6]。

    1.1.1馬爾可夫決策過(guò)程概述

    馬爾可夫性是指在知道過(guò)去和現(xiàn)在一切狀態(tài)的條件下,對(duì)將來(lái)的狀況僅僅決定于當(dāng)前的狀態(tài)。若存在一個(gè)狀態(tài)序列,該序列中的每個(gè)狀態(tài)都滿足了馬爾可夫性質(zhì),則該狀態(tài)序列被稱為馬爾可夫過(guò)程[7]。綜上所述,馬爾科夫決策過(guò)程(markov decision process,MDP)便可以用元組(S,A,P,R,γ)來(lái)描述,其中:S代表有限狀態(tài)序列集;A代表有限動(dòng)作序列集;P為狀態(tài)轉(zhuǎn)移概率;R為獎(jiǎng)勵(lì)函數(shù);γ為折扣系數(shù)。

    在與環(huán)境交互的過(guò)程中,智能體從時(shí)刻t開始到未來(lái)執(zhí)行的所有動(dòng)作之后,能獲得的累積獎(jiǎng)勵(lì)Gt為:

    (1)

    1.1.2基于值函數(shù)的優(yōu)化算法

    值函數(shù)分為狀態(tài)值函數(shù)vπ(s)和動(dòng)作值函數(shù)

    Qπ(s),在遵循策略π,狀態(tài)值函數(shù)的定義為:

    vπ(s)=Επ[Gt|St=s]

    (2)

    動(dòng)作值函數(shù)的定義為:

    Qπ(s,a)=Επ[Gt|St=s,At=a]

    (3)

    根據(jù)狀態(tài)的馬爾可夫性,最優(yōu)狀態(tài)值函數(shù)和最優(yōu)動(dòng)作值函數(shù)分別為:

    (4)

    (5)

    在已知最優(yōu)狀態(tài)值函數(shù)或者最優(yōu)動(dòng)作值函數(shù)之后,可以通過(guò)最大化最優(yōu)狀態(tài)值函數(shù)或最優(yōu)動(dòng)作值函數(shù)獲得最優(yōu)策略。

    1.1.3基于策略的優(yōu)化算法

    基于策略的優(yōu)化算法廣泛應(yīng)用于連續(xù)空間的強(qiáng)化學(xué)習(xí)問(wèn)題中。其主要思想是將策略π參數(shù)化,計(jì)算出關(guān)于動(dòng)作的策略梯度,然后沿著梯度的方向,反復(fù)以小幅度調(diào)整動(dòng)作,經(jīng)過(guò)多次訓(xùn)練,最終得到最優(yōu)策略[8]。

    策略分為隨機(jī)性策略和確定性策略。隨機(jī)性策略是指:在狀態(tài)s下,動(dòng)作a是一個(gè)概率分布函數(shù)。因此,即使是在相同的狀態(tài)下,也可能會(huì)有不同的動(dòng)作;而確定性策略則是每個(gè)狀態(tài)只對(duì)應(yīng)唯一的動(dòng)作[9]。

    同樣地,策略梯度也分為隨機(jī)性策略梯度和確定性策略梯度。Sutton等[10]推導(dǎo)出了隨機(jī)性策略梯度的公式:

    ▽?duì)萀(πθ)=Εs~ρπ,a~πθ[▽?duì)萳ogπθ(a|s)Qπ(s,a)]

    (6)

    而后,Silver等[11]提出并證明了確定性策略梯度的公式:

    ▽?duì)萀(μθ)=Εs~ρμ[▽?duì)圈苔?s)▽aQμ(s,a)|a=μθ(s)]

    (7)

    此后,確定性策略梯度方法得以流行。

    1.1.4深度確定性策略梯度算法

    深度確定性策略梯度算法(deep deterministic policy gradient,DDPG)結(jié)合了強(qiáng)化學(xué)習(xí)中基于值函數(shù)和基于策略的求解方法,是深度Q網(wǎng)絡(luò)(deep Q network,DQN)的延伸[12],其包含了actor網(wǎng)絡(luò)和critic網(wǎng)絡(luò),兩者都是深度神經(jīng)網(wǎng)絡(luò),actor網(wǎng)絡(luò)的作用是生成動(dòng)作,將狀態(tài)s映射為動(dòng)作a[13];critic網(wǎng)絡(luò)的作用是評(píng)價(jià)動(dòng)作的好壞,其輸入有狀態(tài)s和動(dòng)作a,輸出的是動(dòng)作值函數(shù)Q,其功能類似于DQN網(wǎng)絡(luò)[14]。與DQN一樣,DDPG同樣采用了經(jīng)驗(yàn)回放打破樣本之間的相關(guān)性,也復(fù)制了一個(gè)目標(biāo)網(wǎng)絡(luò)作為原網(wǎng)絡(luò)的逼近對(duì)象[15],其算法偽代碼如下:

    Algorithm DDPG

    1 初始化actor網(wǎng)絡(luò)參數(shù)θμ和critic網(wǎng)絡(luò)θQ;

    2 初始化目標(biāo)網(wǎng)絡(luò)θμ′、θQ′;

    3 初始化經(jīng)驗(yàn)回放池R,初始化狀態(tài)s0;

    4 For episode=1,…,Mdo:

    5 Fort=0,…,T:

    6 Fort=0,…,Tdo:

    (1) 選擇動(dòng)作at,執(zhí)行動(dòng)作at,獲取rt、at+1;

    (2) 將經(jīng)驗(yàn)〈st,at,rt,st+1〉存到經(jīng)驗(yàn)池R;

    (3) 從R中采樣大小為N的經(jīng)驗(yàn)數(shù)據(jù)transition:〈st,at,rt,st+1〉;

    (4) 根據(jù)transition計(jì)算TD target:

    yi=ri+γQ′(si+1,μ′(si+1|θμ′)|θQ′)

    (6) 計(jì)算策略梯度:

    ▽?duì)圈苔?s|θμ)|s=si)

    (7) 更新actor網(wǎng)絡(luò);

    (8) 更新目標(biāo)網(wǎng)絡(luò);

    7 End for

    8 End for

    2 基于DDPG的自動(dòng)駕駛控制策略

    2.1 研究對(duì)象和研究方案

    本文以Carla模擬器作為實(shí)驗(yàn)的仿真環(huán)境,并通過(guò)DDPG算法對(duì)虛擬無(wú)人車的控制策略展開了研究,不同于傳統(tǒng)感知-決策-控制的方案,本文提供了一種端到端的無(wú)人車控制方法[16]。

    2.1.1仿真環(huán)境介紹

    Carla是一款城市環(huán)境的無(wú)人駕駛仿真器,由Intel Labs、Toyota Research Institute和UBA Computer Vision Center聯(lián)合開發(fā),支持無(wú)人駕駛系統(tǒng)的開發(fā)、訓(xùn)練和驗(yàn)證[17]。

    Carla添加了各種天氣特征到仿真環(huán)境中,并且考慮了真實(shí)的光照情況,最大限度還原真實(shí)駕駛過(guò)程。另外,開發(fā)者還能夠按照自己的實(shí)際需要靈活選擇地圖、汽車、行人、交通標(biāo)志等。除此之外,Carla還提供了許多常見(jiàn)的傳感器,如廣角攝像機(jī)、激光雷達(dá)、GPS等,且開放了Python接口供開發(fā)者完成各項(xiàng)配置。

    Carla系統(tǒng)為評(píng)價(jià)算法提供了一個(gè)標(biāo)準(zhǔn)的評(píng)估框架,便于開發(fā)者對(duì)各種算法進(jìn)行統(tǒng)一評(píng)測(cè)。評(píng)估標(biāo)準(zhǔn)(driving benchmark)包括算法(Agent)和實(shí)驗(yàn)包(experiment suite)組成。該算法由研究者自我封裝,然后在實(shí)驗(yàn)包的環(huán)境上進(jìn)行測(cè)試實(shí)驗(yàn),測(cè)試過(guò)程中可以根據(jù)需要記錄待評(píng)估選項(xiàng)的分?jǐn)?shù)(recording)以及進(jìn)行性能計(jì)算(metrics)。

    性能計(jì)算包括任務(wù)完成的分?jǐn)?shù)、任務(wù)平均完成度以及違反駕駛行為的分?jǐn)?shù)。成功完成任務(wù)的分?jǐn)?shù)根據(jù)指定了任務(wù)回合的數(shù)量計(jì)算;任務(wù)平均完成度根據(jù)每一個(gè)回合已經(jīng)行駛的距離計(jì)算;違規(guī)駕駛考慮了偏離道路(offroad)、偏離車道(otherlane)、碰撞(collision)等情況。

    2.1.2研究方案設(shè)計(jì)

    本文通過(guò)DDPG算法在Carla仿真器中完成虛擬無(wú)人車自動(dòng)駕駛的車道保持決策控制任務(wù),車道保持是指虛擬無(wú)人車沿著一條車道駕駛,在交叉路口時(shí),隨機(jī)選擇行駛方向。該任務(wù)的要求是:保證無(wú)人車在本車道內(nèi)行駛,并最低限度地發(fā)生違規(guī)駕駛。仿真訓(xùn)練的地圖Town01如圖2。

    圖2 Carla環(huán)境Town01地圖

    訓(xùn)練過(guò)程中,每一個(gè)新回合,小車都被放置在Town01中的一個(gè)隨機(jī)的開始位置,其他車輛和行人也位于新的隨機(jī)位置。環(huán)境中的車輛數(shù)目為20,行人數(shù)量為40,天氣為晴朗(weather TD=1)。

    DDPG算法中一共包含4個(gè)神經(jīng)網(wǎng)絡(luò),與DQN一樣,分為在線網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò),且2種網(wǎng)絡(luò)結(jié)構(gòu)一致;同時(shí),DDPG采用的是actor-critic架構(gòu),因此,在線網(wǎng)絡(luò)包含actor在線網(wǎng)絡(luò)和critic在線網(wǎng)絡(luò),目標(biāo)網(wǎng)絡(luò)同樣如此。其中,actor在線網(wǎng)絡(luò)和critic在線網(wǎng)絡(luò)模型如圖3、4所示。

    圖3 actor在線網(wǎng)絡(luò)示意圖

    圖4 critic在線網(wǎng)絡(luò)示意圖

    Actor在線網(wǎng)絡(luò)的輸入狀態(tài)包含圖像信息和測(cè)量信息,圖像信息來(lái)自無(wú)人車正前方的廣角攝像機(jī),測(cè)量信息包括轉(zhuǎn)向值steer∈[-1,1]、加速值/制動(dòng)值throttle/brake∈[-1,1]、當(dāng)前車速、偏離車道線值otherlane∈[0,1]、偏離道路值offroad∈[0,1];輸出為二維動(dòng)作控制向量[action_0, action_1],action∈[-1,1],其中,action_0時(shí),表示轉(zhuǎn)向;action_1>0時(shí),表示油門;action_1<0時(shí),表示剎車。

    Critic在線網(wǎng)絡(luò)除了輸入狀態(tài)外,還包含由actor網(wǎng)絡(luò)輸出的動(dòng)作;輸出為該狀態(tài)下采取某一動(dòng)作的Q值,即動(dòng)作值函數(shù)。

    由于強(qiáng)化學(xué)習(xí)通過(guò)試錯(cuò)機(jī)制探索環(huán)境,因此,智能體在前期的訓(xùn)練中,時(shí)常會(huì)在已經(jīng)偏離車道線或道路的情況下,依然采取與上一時(shí)刻相同的轉(zhuǎn)向值,這樣的無(wú)效訓(xùn)練使智能體在訓(xùn)練前期花更多時(shí)間去探索。為了提高智能體前期的訓(xùn)練效率,盡可能減少?gòu)?qiáng)化學(xué)習(xí)的試錯(cuò)成本,在原DDPG算法的基礎(chǔ)上,對(duì)其進(jìn)行改進(jìn),其中,仿真環(huán)境、網(wǎng)絡(luò)結(jié)構(gòu)與原DDPG算法保持一致,如圖5所示。

    圖5 監(jiān)督式DDPG示意圖

    智能體的actor網(wǎng)絡(luò)輸出控制動(dòng)作,監(jiān)督器會(huì)根據(jù)前一時(shí)刻的狀態(tài)來(lái)判斷是否對(duì)智能體輸出的動(dòng)作進(jìn)行強(qiáng)制干預(yù),其具體規(guī)則為:

    1) 若上一時(shí)刻狀態(tài)測(cè)量信息中的偏離車道線值或偏離道路值大于0,則轉(zhuǎn)向值將變?yōu)椋?/p>

    action_0′=action_0-0.5×prev_action[′steer′]

    (8)

    其中,pre_action[′steer′]為上一時(shí)刻的轉(zhuǎn)向值。

    2) 若上一時(shí)刻狀態(tài)測(cè)量信息中的速度小于0,則加速值和制動(dòng)值分別為:

    throttle′=throttle+0.5

    (9)

    brake′=0

    (10)

    2.2 仿真過(guò)程

    2.2.1超參數(shù)設(shè)置

    實(shí)驗(yàn)中的超參數(shù)設(shè)置如表1所示。

    表1 超參數(shù)設(shè)置

    MAX_EPISODES為訓(xùn)練的總回合數(shù);MAX_STEPS_EPISODE 為一回合訓(xùn)練的最大步數(shù);WARMUP_STEPS為熱身的步數(shù),即在這之前為數(shù)據(jù)收集階段,熱身步數(shù)之后開始訓(xùn)練網(wǎng)絡(luò)的參數(shù);GAMMA為計(jì)算累積回報(bào)值時(shí)的折扣系數(shù);TAU為target 網(wǎng)絡(luò)更新時(shí)的參數(shù);BUFFER_SIZE為回放經(jīng)驗(yàn)池的尺寸大??;OU_THETA、OU_MU、OU_SIGMA為OU噪聲的參數(shù);MINI_BATCH_SIZE為批訓(xùn)練的數(shù)據(jù)量;EVAL_PERIODS為算法評(píng)估的頻率,即每隔100個(gè)回合評(píng)估一次算法;EVAL_EPISODES為評(píng)估持續(xù)的時(shí)間,即每次評(píng)估持續(xù)10個(gè)回合。EXPLORATION_EPISODES為探索階段,即在這之前會(huì)在actor網(wǎng)絡(luò)輸出的動(dòng)作上加入OU噪聲,以增加動(dòng)作輸出的多樣性。

    2.2.2圖像預(yù)處理

    圖像來(lái)自于安裝在車輛正前方的廣角攝像機(jī),本文選擇的圖像類型是Carla中的Scene Final圖像。本小節(jié)首先將圖像剪裁為800×280,去掉了圖像中的無(wú)關(guān)要素,然后進(jìn)行像素重采樣,重采樣后的大小為88×200。

    2.2.3獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì)

    在強(qiáng)化學(xué)習(xí)中,獎(jiǎng)勵(lì)函數(shù)的作用不言而喻,不僅影響著算法的收斂速度,也是該算法能否成功的關(guān)鍵一環(huán)。獎(jiǎng)勵(lì)函數(shù)引導(dǎo)著智能體做出正確的決定,直接決定了智能體能否學(xué)習(xí)到正確策略。自動(dòng)駕駛中的獎(jiǎng)勵(lì)函數(shù)應(yīng)該根據(jù)各種駕駛狀況的優(yōu)劣來(lái)定義獎(jiǎng)勵(lì)函數(shù),從而使智能體能更快更好地學(xué)習(xí)到好的駕駛策略。針對(duì)本次駕駛?cè)蝿?wù),本文獎(jiǎng)勵(lì)函數(shù)設(shè)置如下:

    1) 碰撞項(xiàng)Rc。包括碰撞車、行人、建筑物等其他物體,都會(huì)給予一個(gè)大的負(fù)向獎(jiǎng)勵(lì):

    Rc=-100Ct

    (11)

    式中:Ct=0代表沒(méi)有碰撞情況發(fā)生,Ct=1代表有碰撞情況發(fā)生。

    2) 車速項(xiàng)Rv。該項(xiàng)因素是為了獎(jiǎng)勵(lì)能在限制速度以內(nèi)向前行駛,同時(shí)對(duì)負(fù)向速度和超速的行為給予一個(gè)負(fù)向獎(jiǎng)勵(lì):

    (12)

    式中:Vt代表無(wú)人車的當(dāng)前速度;此實(shí)驗(yàn)中設(shè)置了一個(gè)限速的變量Vlimit,當(dāng)無(wú)人車的行駛速度小于當(dāng)前道路的限速時(shí),會(huì)得到一個(gè)正向的獎(jiǎng)勵(lì)值,該獎(jiǎng)勵(lì)值與當(dāng)前的速度一致;當(dāng)然,若該速度值為負(fù)時(shí),則獎(jiǎng)勵(lì)值相應(yīng)也會(huì)變成負(fù)向的獎(jiǎng)勵(lì)值;當(dāng)無(wú)人車的行駛速度大于當(dāng)前道路的限制速度時(shí),則會(huì)給予一個(gè)負(fù)向值的獎(jiǎng)勵(lì),該值等于行駛速度與限速之差。

    3) 偏離當(dāng)前道路項(xiàng)Rs。該項(xiàng)因素是為了對(duì)超出道路這一狀況給予負(fù)向的獎(jiǎng)勵(lì)值,同時(shí),對(duì)于完全行駛出道路之外的情況,會(huì)強(qiáng)制終止這一回合的訓(xùn)練:

    (13)

    式中:St代表無(wú)人車偏離道路的量,St∈[0,1],當(dāng)該值小于1時(shí),會(huì)給予一個(gè)負(fù)向的獎(jiǎng)勵(lì),該獎(jiǎng)勵(lì)值與偏移的量成正比;當(dāng)該值等于1時(shí),即無(wú)人車已經(jīng)完全開出道路以外,會(huì)給予一個(gè)大的負(fù)向獎(jiǎng)勵(lì),并且強(qiáng)制結(jié)束這一回合的訓(xùn)練。

    4) 偏離車道線Ro。該項(xiàng)因素是考慮到無(wú)人車行駛過(guò)程中偏離車道線的情況:

    Ro=-5Ot

    (14)

    式中:Ot代表無(wú)人車偏離車道線的量,Ot∈[0,1],其獎(jiǎng)勵(lì)值與偏移車道線的量成正比。

    5) 當(dāng)前時(shí)刻與上一時(shí)刻行駛距離差項(xiàng)Rd。該項(xiàng)因素是為了防止無(wú)人車停滯不前,鼓勵(lì)小車向前行駛:

    Rd=-5dt

    (15)

    式中:dt=1代表距離當(dāng)前時(shí)刻與上一時(shí)刻之間行駛的距離差小于0.1 m,dt=0代表距離差大于 0.1 m。

    6) 轉(zhuǎn)向項(xiàng)Rsteer。此向獎(jiǎng)勵(lì)函數(shù)則是出于舒適性的考量:

    Rsteer=-10abs(steer)2

    (16)

    式中:steer代表無(wú)人車的轉(zhuǎn)向值,steer∈[-1,1],由于大的轉(zhuǎn)向值會(huì)造成較低的舒適性,因此該項(xiàng)獎(jiǎng)勵(lì)值為一個(gè)負(fù)向獎(jiǎng)勵(lì),其值與轉(zhuǎn)向值的平方成正比。

    綜上所述,實(shí)驗(yàn)中的獎(jiǎng)勵(lì)函數(shù)一共包含6項(xiàng),具體為:

    R=Rc+Rt+Rs+Ro+Rd+Rsteer

    (17)

    2.2.4回合終止的條件設(shè)置

    回合終止的條件設(shè)置主要考慮2種情況:① 發(fā)生了實(shí)際行車中難以承受的錯(cuò)誤和完成了指定任務(wù)。如無(wú)人車撞上了建筑物而停滯不前,使得智能體一直存儲(chǔ)一些無(wú)用的狀態(tài)轉(zhuǎn)移(transition)數(shù)據(jù),且難以探索新的環(huán)境,導(dǎo)致后續(xù)的訓(xùn)練難以進(jìn)行。② 達(dá)到了訓(xùn)練的回合數(shù)也會(huì)停止訓(xùn)練。具體終止條件設(shè)置如下:

    1) 車輛發(fā)生碰撞情況。

    2) 整個(gè)車處于非行駛區(qū)域(道路以外)。

    3) 當(dāng)reward_time≥100。每一次新的回合會(huì)初始化reward_time=0,當(dāng)前進(jìn)速度小于0時(shí),會(huì)增加值為5的reward_time,當(dāng)上一時(shí)間步與當(dāng)前時(shí)間步距離之差小于0.1 m時(shí),會(huì)增加值為1的reward_time。當(dāng)該值大于等于100時(shí),會(huì)終止該回合的訓(xùn)練,這樣的設(shè)置是為了防止小車長(zhǎng)時(shí)間無(wú)明顯的位移變化。

    4) 達(dá)到一回合訓(xùn)練的最大步數(shù)MAX_STEPS_EPISODE=5 000。

    2.3 仿真結(jié)果與分析

    DDPG智能體以及監(jiān)督式DDPG智能體在地圖Town01中分別訓(xùn)練了70 000個(gè)回合,其實(shí)驗(yàn)條件與實(shí)驗(yàn)設(shè)置均保持一致,最終訓(xùn)練結(jié)果如圖6、7所示。

    圖6 平均獎(jiǎng)勵(lì)變化曲線

    圖6中的2條曲線分別表示2種算法每一回合平均回報(bào)的變化。從圖中可以看出,在訓(xùn)練的初始階段,監(jiān)督式DDPG算法的平均回報(bào)明顯高于原始DDPG算法,而隨著訓(xùn)練次數(shù)的增加,兩者逐漸靠近,最后均收斂于同一平均值。圖7的2條曲線為2種算法每一回合的累積回報(bào)的變化,其中,監(jiān)督式DDPG算法在30 000回合以前,累積回報(bào)值均在0以下,表明這時(shí)的獎(jiǎng)勵(lì)值以負(fù)向獎(jiǎng)勵(lì)居多, 而原DDPG算法的負(fù)向獎(jiǎng)勵(lì)持續(xù)到了 38 000回合。在訓(xùn)練初期,小車還處于環(huán)境摸索中,時(shí)常發(fā)生碰撞、越線、原地不動(dòng)等情況,這些不好的狀態(tài)都會(huì)使小車得到比較大的負(fù)向獎(jiǎng)勵(lì)。不過(guò),一旦小車開始得到正向獎(jiǎng)勵(lì),其訓(xùn)練效果便會(huì)發(fā)生質(zhì)的提升。

    圖7 累積獎(jiǎng)勵(lì)變化曲線

    根據(jù)訓(xùn)練得到的網(wǎng)絡(luò)模型,分別在地圖Town01和地圖Town02中制定了不同駕駛?cè)蝿?wù)的測(cè)試實(shí)驗(yàn)來(lái)對(duì)該模型進(jìn)行測(cè)評(píng),如圖8所示。

    圖8 任務(wù)位置點(diǎn)示意圖

    測(cè)試場(chǎng)景包含地圖Town01和地圖Town02,從地圖上的A點(diǎn)行駛到B點(diǎn),駕駛?cè)蝿?wù)的變量有天氣和環(huán)境中的汽車和行人數(shù)量。2個(gè)地圖測(cè)試路線均包含了2個(gè)直角拐彎。由于第1個(gè)地圖也是訓(xùn)練場(chǎng)景,因此,測(cè)試實(shí)驗(yàn)中的行駛路線比第2個(gè)地圖的行駛路線更為苛刻一些,根據(jù)圖8(a)所示,除了兩者都包含的2個(gè)直角拐彎之外,中間還包括了3個(gè)岔路口。考慮到未在Town02中進(jìn)行訓(xùn)練,因此,其行駛路線只有2個(gè)直角拐彎。

    在地圖Town01中,天氣為晴朗(weather ID=1)和雨后(weather ID=3),DDPG和監(jiān)督式 DDPG的測(cè)試結(jié)果如表2、3所示。

    表2 DDPG Town01測(cè)試結(jié)果

    表3 監(jiān)督式 DDPG Town01測(cè)試結(jié)果

    根據(jù)表2、3,監(jiān)督式 DDPG與DDPG在地圖Town01中的總體表現(xiàn)相差不大,均能在靜態(tài)的環(huán)境中出色地完成駕駛?cè)蝿?wù)。即使天氣有所改變,駕駛效果也沒(méi)有明顯變化;然而,當(dāng)環(huán)境中出現(xiàn)行人和車輛這樣的動(dòng)態(tài)因素時(shí),兩者的表現(xiàn)均有明顯下降,尤其在增加車輛行人且改變天氣之后,2種算法的駕駛表現(xiàn)均出現(xiàn)了顯著下滑,可以看出,相比于天氣,智能體對(duì)環(huán)境中的動(dòng)態(tài)因素變化更敏感。

    而在地圖Town02中,天氣為晴朗(weather ID=1)和雨后(weather ID=3),DDPG和監(jiān)督式 DDPG的測(cè)試結(jié)果如表4、5所示。

    表4 DDPG Town02測(cè)試結(jié)果

    表5 監(jiān)督式DDPG Town02測(cè)試結(jié)果

    根據(jù)表4、5所示,同樣地,監(jiān)督式 DDPG和DDPG算法在Town02中總體表現(xiàn)無(wú)明顯優(yōu)劣。不過(guò),在面對(duì)新的環(huán)境時(shí),2種算法的智能體均未能得到適應(yīng),在新環(huán)境中幾乎無(wú)法正常駕駛,駕駛違規(guī)頻頻發(fā)生,危險(xiǎn)的碰撞行為也層出不窮。其原因可歸結(jié)為神經(jīng)網(wǎng)絡(luò)表征能力不夠,算法泛化能力不足,導(dǎo)致無(wú)法有效地遷移到陌生的駕駛環(huán)境中。

    3 結(jié)論

    采用深度強(qiáng)化學(xué)習(xí)算法,以端到端的方式實(shí)現(xiàn)了對(duì)虛擬無(wú)人車的控制。訓(xùn)練結(jié)果表明,原始DDPG算法以及監(jiān)督式DDPG算法最終均能達(dá)到一致的效果,能夠有效避開障礙,在沒(méi)有違規(guī)駕駛的條件下保持在車道內(nèi)行駛。并且監(jiān)督式DDPG算法能有效提升前期訓(xùn)練效果,降低初期試錯(cuò)風(fēng)險(xiǎn),能更早地收斂。測(cè)評(píng)結(jié)果表明,環(huán)境中動(dòng)態(tài)因素對(duì)無(wú)人車駕駛效果的影響遠(yuǎn)遠(yuǎn)大于天氣因素。其次,當(dāng)將該模型遷移到新的環(huán)境中進(jìn)行駕駛仿真時(shí),小車幾乎不能正常行駛,因此,模型的遷移能力不足。

    本文改進(jìn)的基于監(jiān)督式的DDPG算法只提供了粗略的動(dòng)作矯正,意在改善提升其前期的訓(xùn)練效率,而并非最終的效果。

    由于強(qiáng)化學(xué)習(xí)是通過(guò)不斷試錯(cuò)尋找最優(yōu)解,所以在游戲等虛擬場(chǎng)景中能大放異彩,然而,在實(shí)際環(huán)境中,讓車采取隨機(jī)策略、通過(guò)試錯(cuò)得到正確的控制策略顯然不可能。因此,智能駕駛中使用強(qiáng)化學(xué)習(xí)技術(shù)一般情況下會(huì)事先在仿真環(huán)境下進(jìn)行模擬訓(xùn)練。本文完成了在仿真環(huán)境下的自動(dòng)駕駛實(shí)驗(yàn), 而通過(guò)加入監(jiān)督器干預(yù)智能體的危險(xiǎn)動(dòng)作這一方法,可為端到端的智能駕駛控制提供一些參考價(jià)值,以及對(duì)強(qiáng)化學(xué)習(xí)從虛擬到現(xiàn)實(shí)提供一定的借鑒意義。

    同時(shí),本文的研究還存在一些不足之處:首先,小車感知力不足,模糊了障礙物和陰影的區(qū)別,會(huì)出現(xiàn)將陰影錯(cuò)當(dāng)成障礙物規(guī)避的現(xiàn)象;其次,控制效果比較生硬,導(dǎo)致舒適性一般。最后,模型遷移到新環(huán)境中時(shí)難以正常行駛。因此,進(jìn)一步提高小車的感知能力與舒適性,以及提高算法的泛化能力將是以后的研究方向。

    猜你喜歡
    動(dòng)作智能環(huán)境
    長(zhǎng)期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
    一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
    孕期遠(yuǎn)離容易致畸的環(huán)境
    環(huán)境
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    動(dòng)作描寫要具體
    畫動(dòng)作
    新久久久久国产一级毛片| 久久久午夜欧美精品| 色吧在线观看| 成人无遮挡网站| 女的被弄到高潮叫床怎么办| 久久鲁丝午夜福利片| 亚洲激情五月婷婷啪啪| 国产精品三级大全| 简卡轻食公司| 国产日韩欧美亚洲二区| 亚洲av中文av极速乱| 亚洲综合色惰| 丰满少妇做爰视频| 最近最新中文字幕大全电影3| 国产白丝娇喘喷水9色精品| 一区二区三区精品91| 麻豆国产97在线/欧美| 国产亚洲精品久久久com| 中文在线观看免费www的网站| 欧美人与善性xxx| 夫妻性生交免费视频一级片| 日韩一区二区三区影片| 97在线视频观看| 美女xxoo啪啪120秒动态图| 成人无遮挡网站| 亚洲,一卡二卡三卡| 少妇猛男粗大的猛烈进出视频| av卡一久久| 亚洲av免费高清在线观看| 久久国内精品自在自线图片| 中文乱码字字幕精品一区二区三区| 在线免费观看不下载黄p国产| 韩国高清视频一区二区三区| 女的被弄到高潮叫床怎么办| 国产精品久久久久久精品古装| 少妇人妻精品综合一区二区| 精品一区二区三区视频在线| 国产91av在线免费观看| kizo精华| 亚洲无线观看免费| 免费av不卡在线播放| 日韩国内少妇激情av| 网址你懂的国产日韩在线| 亚洲欧美日韩东京热| .国产精品久久| 成年美女黄网站色视频大全免费 | 国产视频首页在线观看| 青春草亚洲视频在线观看| 欧美zozozo另类| 日韩免费高清中文字幕av| 毛片女人毛片| 水蜜桃什么品种好| 国产乱人偷精品视频| 亚洲经典国产精华液单| 免费不卡的大黄色大毛片视频在线观看| av国产久精品久网站免费入址| 99热这里只有精品一区| 肉色欧美久久久久久久蜜桃| 九色成人免费人妻av| 在线免费十八禁| 精品久久久噜噜| 成人亚洲精品一区在线观看 | 人妻系列 视频| 国产成人午夜福利电影在线观看| 少妇人妻一区二区三区视频| 亚洲高清免费不卡视频| 老师上课跳d突然被开到最大视频| 亚洲成色77777| 99久久精品热视频| 国内精品宾馆在线| av视频免费观看在线观看| 亚洲精品乱码久久久久久按摩| 夫妻午夜视频| 国产精品一二三区在线看| 熟女av电影| 自拍偷自拍亚洲精品老妇| 欧美性感艳星| 内地一区二区视频在线| 久久人妻熟女aⅴ| 亚洲精品乱久久久久久| 国产人妻一区二区三区在| 成年女人在线观看亚洲视频| 亚洲av欧美aⅴ国产| 精品久久久久久久久av| 超碰97精品在线观看| 一个人看视频在线观看www免费| 五月伊人婷婷丁香| 在线观看免费高清a一片| 内地一区二区视频在线| 日本-黄色视频高清免费观看| 18禁裸乳无遮挡动漫免费视频| 日本欧美国产在线视频| kizo精华| 99久久精品热视频| 毛片女人毛片| 中国美白少妇内射xxxbb| 自拍偷自拍亚洲精品老妇| 欧美日韩视频高清一区二区三区二| 干丝袜人妻中文字幕| 久久精品国产亚洲av涩爱| 国产一区二区在线观看日韩| 日韩欧美精品免费久久| 大又大粗又爽又黄少妇毛片口| 午夜福利高清视频| 久久青草综合色| 内地一区二区视频在线| 夜夜看夜夜爽夜夜摸| xxx大片免费视频| 久久久久精品性色| 久久久久久久久久成人| 久久久久久伊人网av| 国内精品宾馆在线| 人人妻人人爽人人添夜夜欢视频 | 免费不卡的大黄色大毛片视频在线观看| 亚洲精品日本国产第一区| 日韩电影二区| av免费观看日本| 美女福利国产在线 | 久久精品国产自在天天线| 美女内射精品一级片tv| 亚洲av中文字字幕乱码综合| 黄片无遮挡物在线观看| 亚洲欧美清纯卡通| 在线播放无遮挡| 欧美日韩精品成人综合77777| 午夜福利视频精品| 精品视频人人做人人爽| 亚洲成人中文字幕在线播放| 免费观看的影片在线观看| 青春草视频在线免费观看| 亚洲激情五月婷婷啪啪| 王馨瑶露胸无遮挡在线观看| 成人一区二区视频在线观看| 日韩中字成人| 亚洲色图综合在线观看| videos熟女内射| av.在线天堂| 中文精品一卡2卡3卡4更新| 久久久久国产精品人妻一区二区| 人妻一区二区av| 免费观看av网站的网址| 91午夜精品亚洲一区二区三区| 少妇人妻一区二区三区视频| 久久久国产一区二区| 国产视频首页在线观看| 性色avwww在线观看| 国产亚洲一区二区精品| 一级毛片aaaaaa免费看小| 黄色一级大片看看| 两个人的视频大全免费| 婷婷色综合大香蕉| 中国三级夫妇交换| 超碰av人人做人人爽久久| 天天躁日日操中文字幕| 乱系列少妇在线播放| 久热久热在线精品观看| 日日啪夜夜爽| 亚洲三级黄色毛片| 黑丝袜美女国产一区| 精华霜和精华液先用哪个| 久久久精品94久久精品| 亚洲国产色片| 亚洲国产精品国产精品| www.av在线官网国产| 高清视频免费观看一区二区| 欧美zozozo另类| 狂野欧美白嫩少妇大欣赏| 亚洲人成网站在线观看播放| 亚洲成人av在线免费| 国产精品一及| 欧美zozozo另类| 亚洲精品成人av观看孕妇| 乱码一卡2卡4卡精品| 欧美人与善性xxx| 九九在线视频观看精品| 91aial.com中文字幕在线观看| 成人漫画全彩无遮挡| 好男人视频免费观看在线| 性色av一级| 久久久精品免费免费高清| 久久人妻熟女aⅴ| 亚洲av男天堂| 国产成人a∨麻豆精品| 热re99久久精品国产66热6| 国产探花极品一区二区| 最新中文字幕久久久久| 嫩草影院入口| 中文在线观看免费www的网站| 免费观看无遮挡的男女| 美女视频免费永久观看网站| 女人十人毛片免费观看3o分钟| 亚州av有码| 国产日韩欧美亚洲二区| 国产爽快片一区二区三区| 亚洲,一卡二卡三卡| 亚洲,一卡二卡三卡| 一本一本综合久久| 18禁裸乳无遮挡免费网站照片| 精品一区二区三区视频在线| 99热6这里只有精品| 欧美极品一区二区三区四区| kizo精华| 中文字幕人妻熟人妻熟丝袜美| 少妇丰满av| 亚洲av中文av极速乱| 精华霜和精华液先用哪个| av又黄又爽大尺度在线免费看| 成人特级av手机在线观看| 我要看黄色一级片免费的| 少妇熟女欧美另类| 欧美成人午夜免费资源| 联通29元200g的流量卡| 免费看光身美女| 亚洲第一区二区三区不卡| 国产精品偷伦视频观看了| 欧美bdsm另类| 国产亚洲最大av| 校园人妻丝袜中文字幕| 亚洲精品日本国产第一区| 中文字幕制服av| 99久久精品一区二区三区| 亚洲成色77777| 国产精品成人在线| av又黄又爽大尺度在线免费看| 一区二区三区免费毛片| 成人二区视频| 人妻 亚洲 视频| 黑丝袜美女国产一区| av网站免费在线观看视频| 婷婷色综合大香蕉| 亚洲国产欧美在线一区| 高清不卡的av网站| 国产乱来视频区| 中文字幕久久专区| 国产成人freesex在线| 91午夜精品亚洲一区二区三区| 菩萨蛮人人尽说江南好唐韦庄| 又粗又硬又长又爽又黄的视频| 高清不卡的av网站| 水蜜桃什么品种好| 国产深夜福利视频在线观看| 国产伦理片在线播放av一区| 高清黄色对白视频在线免费看 | 少妇的逼水好多| 亚洲成色77777| 最近最新中文字幕免费大全7| 午夜免费鲁丝| 熟女人妻精品中文字幕| 国产欧美日韩精品一区二区| 亚洲av日韩在线播放| 日韩制服骚丝袜av| 日本爱情动作片www.在线观看| 国产亚洲精品久久久com| 日日啪夜夜爽| 亚洲中文av在线| 亚洲欧美精品专区久久| 久久久精品94久久精品| 97热精品久久久久久| 欧美3d第一页| 亚洲精品一二三| 国产高潮美女av| 国产成人精品婷婷| 国产精品久久久久久av不卡| 麻豆精品久久久久久蜜桃| 日韩一区二区视频免费看| 夫妻性生交免费视频一级片| 久久久久精品久久久久真实原创| 综合色丁香网| 大香蕉97超碰在线| 中文字幕免费在线视频6| 日韩在线高清观看一区二区三区| 永久免费av网站大全| 各种免费的搞黄视频| 热99国产精品久久久久久7| 91精品国产九色| 久久鲁丝午夜福利片| 中文欧美无线码| 久久6这里有精品| 在线亚洲精品国产二区图片欧美 | 在线观看免费高清a一片| 欧美丝袜亚洲另类| 国产91av在线免费观看| 久久国产精品大桥未久av | 日日撸夜夜添| 大香蕉97超碰在线| h视频一区二区三区| 三级国产精品欧美在线观看| 亚州av有码| 色婷婷久久久亚洲欧美| 日本欧美视频一区| 亚洲成人av在线免费| 国产成人免费观看mmmm| 久久影院123| 欧美成人精品欧美一级黄| www.av在线官网国产| av在线观看视频网站免费| 欧美性感艳星| 亚洲国产精品成人久久小说| 国产日韩欧美在线精品| 亚洲性久久影院| 国产永久视频网站| 亚州av有码| 一区二区三区乱码不卡18| 亚洲av综合色区一区| 18+在线观看网站| 婷婷色麻豆天堂久久| 国产伦精品一区二区三区视频9| 欧美性感艳星| 亚洲成人一二三区av| 老熟女久久久| 亚洲国产高清在线一区二区三| 一级a做视频免费观看| 美女高潮的动态| 精品酒店卫生间| 99久久精品热视频| 国精品久久久久久国模美| 国语对白做爰xxxⅹ性视频网站| 午夜免费鲁丝| 久久精品国产鲁丝片午夜精品| 插逼视频在线观看| 亚州av有码| 一区二区三区免费毛片| 久久久久久久亚洲中文字幕| 中文天堂在线官网| 久久综合国产亚洲精品| 97精品久久久久久久久久精品| 丝瓜视频免费看黄片| 极品教师在线视频| 午夜免费观看性视频| 亚洲美女黄色视频免费看| 日本一二三区视频观看| 欧美一级a爱片免费观看看| 国产免费一级a男人的天堂| 天堂8中文在线网| 精品人妻一区二区三区麻豆| 亚洲国产精品999| 老女人水多毛片| 亚洲av二区三区四区| 亚洲综合色惰| 国产淫片久久久久久久久| 久久久精品免费免费高清| 亚洲激情五月婷婷啪啪| 在线观看三级黄色| 在线免费观看不下载黄p国产| 国产伦在线观看视频一区| 欧美日韩精品成人综合77777| 午夜免费鲁丝| 亚洲成人一二三区av| 亚洲av二区三区四区| 欧美少妇被猛烈插入视频| 亚洲av综合色区一区| 国产白丝娇喘喷水9色精品| 国产伦精品一区二区三区视频9| 国内精品宾馆在线| 日韩一区二区视频免费看| 亚洲欧美日韩无卡精品| 久久99热这里只频精品6学生| 晚上一个人看的免费电影| 亚洲国产日韩一区二区| 日韩精品有码人妻一区| 老司机影院成人| 国产 一区 欧美 日韩| 亚洲精品aⅴ在线观看| 免费大片18禁| 久久精品国产亚洲av天美| 人妻夜夜爽99麻豆av| 午夜免费鲁丝| 男人狂女人下面高潮的视频| 亚洲成人av在线免费| 亚洲伊人久久精品综合| 中文乱码字字幕精品一区二区三区| 国产在线男女| 黄片无遮挡物在线观看| 日日摸夜夜添夜夜爱| 亚洲图色成人| 91久久精品电影网| 一区二区三区四区激情视频| 国产一级毛片在线| 国产男女超爽视频在线观看| 亚洲欧洲日产国产| 美女视频免费永久观看网站| 高清午夜精品一区二区三区| 欧美另类一区| 国产片特级美女逼逼视频| 色5月婷婷丁香| 亚洲综合色惰| 国产人妻一区二区三区在| 久久亚洲国产成人精品v| 少妇被粗大猛烈的视频| 嫩草影院新地址| 99热这里只有是精品50| 免费人妻精品一区二区三区视频| 欧美日韩视频高清一区二区三区二| 蜜桃亚洲精品一区二区三区| 亚洲av二区三区四区| 男女边吃奶边做爰视频| 国产v大片淫在线免费观看| 日本-黄色视频高清免费观看| 日韩强制内射视频| 精品亚洲成a人片在线观看 | 少妇丰满av| 少妇熟女欧美另类| 九九在线视频观看精品| 深爱激情五月婷婷| 日日啪夜夜爽| 午夜福利在线在线| 日日摸夜夜添夜夜爱| 亚洲三级黄色毛片| 日本午夜av视频| 女性被躁到高潮视频| 国产成人一区二区在线| 亚洲美女视频黄频| 丰满少妇做爰视频| 国产在线男女| 丰满人妻一区二区三区视频av| 性色av一级| 亚洲欧美精品自产自拍| 亚洲av.av天堂| 久久影院123| 国产成人免费观看mmmm| 观看av在线不卡| 亚洲国产精品专区欧美| 亚洲精品亚洲一区二区| 内射极品少妇av片p| 日韩欧美一区视频在线观看 | 美女脱内裤让男人舔精品视频| 我的老师免费观看完整版| 欧美国产精品一级二级三级 | 国产亚洲av片在线观看秒播厂| 蜜臀久久99精品久久宅男| 亚洲欧美日韩卡通动漫| 成人综合一区亚洲| 精华霜和精华液先用哪个| a 毛片基地| 久久女婷五月综合色啪小说| 国产视频首页在线观看| 免费黄频网站在线观看国产| 国产极品天堂在线| 最近手机中文字幕大全| 亚洲,欧美,日韩| 多毛熟女@视频| 成人美女网站在线观看视频| 自拍偷自拍亚洲精品老妇| 丝袜脚勾引网站| 黄色配什么色好看| a级毛片免费高清观看在线播放| 久久久久久久久久久丰满| 亚洲精品,欧美精品| 在线 av 中文字幕| 女性生殖器流出的白浆| 日韩强制内射视频| 久久久久久久国产电影| 小蜜桃在线观看免费完整版高清| 制服丝袜香蕉在线| 亚洲欧美日韩卡通动漫| 91精品一卡2卡3卡4卡| 亚洲精品色激情综合| 热re99久久精品国产66热6| 插逼视频在线观看| 国精品久久久久久国模美| 亚洲av中文字字幕乱码综合| 日韩制服骚丝袜av| 男人狂女人下面高潮的视频| 亚洲av国产av综合av卡| 中文乱码字字幕精品一区二区三区| 国产精品一区二区三区四区免费观看| 男女边吃奶边做爰视频| 久久久a久久爽久久v久久| 精品国产乱码久久久久久小说| 美女高潮的动态| 国内少妇人妻偷人精品xxx网站| 多毛熟女@视频| 国产成人91sexporn| 麻豆精品久久久久久蜜桃| 免费观看在线日韩| 插阴视频在线观看视频| 亚洲国产日韩一区二区| 欧美国产精品一级二级三级 | tube8黄色片| 五月伊人婷婷丁香| 久久精品夜色国产| 国产高清不卡午夜福利| 亚洲aⅴ乱码一区二区在线播放| 欧美高清成人免费视频www| 免费播放大片免费观看视频在线观看| 欧美精品亚洲一区二区| 看十八女毛片水多多多| 在线观看国产h片| 少妇精品久久久久久久| 一区在线观看完整版| 建设人人有责人人尽责人人享有的 | 美女高潮的动态| 国产精品国产三级专区第一集| 日本一二三区视频观看| 人人妻人人澡人人爽人人夜夜| 在线观看美女被高潮喷水网站| 18+在线观看网站| 亚洲欧洲日产国产| 精品一区二区三卡| 一本—道久久a久久精品蜜桃钙片| 国产v大片淫在线免费观看| 久久久午夜欧美精品| 51国产日韩欧美| 成人毛片a级毛片在线播放| 亚洲欧美清纯卡通| 夫妻性生交免费视频一级片| 久久国产亚洲av麻豆专区| 久久精品国产亚洲av涩爱| 久久久国产一区二区| 新久久久久国产一级毛片| 日韩精品有码人妻一区| 如何舔出高潮| 国产精品福利在线免费观看| 97精品久久久久久久久久精品| 亚洲第一区二区三区不卡| 天天躁日日操中文字幕| 久久精品国产亚洲av涩爱| 天堂8中文在线网| 亚洲国产精品999| 18禁在线播放成人免费| 免费人成在线观看视频色| 国产精品免费大片| 亚洲av成人精品一区久久| 十分钟在线观看高清视频www | 精品久久久久久久末码| 精品酒店卫生间| 国产高清有码在线观看视频| 国产成人午夜福利电影在线观看| 有码 亚洲区| 国产欧美日韩精品一区二区| 亚洲一级一片aⅴ在线观看| 又爽又黄a免费视频| 99热国产这里只有精品6| 狠狠精品人妻久久久久久综合| 日韩中字成人| 欧美极品一区二区三区四区| 日韩精品有码人妻一区| 免费黄网站久久成人精品| 少妇人妻久久综合中文| 久久精品国产亚洲av天美| 国产成人免费观看mmmm| 最近最新中文字幕大全电影3| 自拍偷自拍亚洲精品老妇| a 毛片基地| 日韩av在线免费看完整版不卡| 国产在视频线精品| 波野结衣二区三区在线| av国产久精品久网站免费入址| 日本免费在线观看一区| 麻豆成人午夜福利视频| 亚洲精品aⅴ在线观看| 水蜜桃什么品种好| 日日啪夜夜撸| 日韩一区二区三区影片| 汤姆久久久久久久影院中文字幕| 日本黄色片子视频| 久久99蜜桃精品久久| 国产无遮挡羞羞视频在线观看| 久久精品国产自在天天线| 在线免费观看不下载黄p国产| 午夜福利在线在线| 干丝袜人妻中文字幕| 成人黄色视频免费在线看| 纯流量卡能插随身wifi吗| 国内揄拍国产精品人妻在线| 极品少妇高潮喷水抽搐| 亚州av有码| 久热这里只有精品99| 亚洲精品国产成人久久av| 91狼人影院| 啦啦啦视频在线资源免费观看| 国产成人精品福利久久| 91久久精品国产一区二区成人| 国产高清不卡午夜福利| 免费观看的影片在线观看| 亚洲精品aⅴ在线观看| 久久人人爽人人片av| 亚洲真实伦在线观看| 18禁动态无遮挡网站| 日韩制服骚丝袜av| 免费少妇av软件| 大片电影免费在线观看免费| a级一级毛片免费在线观看| 青春草亚洲视频在线观看| 不卡视频在线观看欧美| 久久久欧美国产精品| 人人妻人人看人人澡| 亚洲av福利一区| videos熟女内射| 国产亚洲91精品色在线| 欧美变态另类bdsm刘玥| 美女xxoo啪啪120秒动态图| 国产精品99久久久久久久久| 午夜福利视频精品| 日本免费在线观看一区| 久久久久精品性色| av网站免费在线观看视频| 久久精品久久久久久久性| 五月伊人婷婷丁香| 亚洲图色成人| 大码成人一级视频| 久久久欧美国产精品| av国产精品久久久久影院| 色综合色国产| 久久国产亚洲av麻豆专区| 久久人妻熟女aⅴ| 少妇人妻精品综合一区二区| 国产一区二区三区av在线| 中文字幕免费在线视频6| 精品一区二区免费观看| 成人一区二区视频在线观看| 国产亚洲最大av| 国产在线免费精品| 丰满少妇做爰视频| 国产女主播在线喷水免费视频网站|