• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    不確定性環(huán)境下基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛運(yùn)動(dòng)規(guī)劃研究

    2023-12-12 04:25:18張?zhí)K男劉博程
    關(guān)鍵詞:不確定性軌跡加速度

    胡 博,江 磊,宋 潔,袁 春,張?zhí)K男,劉博程

    (重慶理工大學(xué) 車(chē)輛工程學(xué)院 汽車(chē)零部件先進(jìn)制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室, 重慶 400054)

    0 引言

    自動(dòng)駕駛汽車(chē)技術(shù)的開(kāi)發(fā)是一項(xiàng)重要工作,可以提高交通運(yùn)輸?shù)陌踩院蜋C(jī)動(dòng)性。目前,有許多商用的高級(jí)駕駛輔助系統(tǒng),如自適應(yīng)巡航、車(chē)道保持輔助等。現(xiàn)在研究者逐步轉(zhuǎn)向開(kāi)發(fā)更加高級(jí)別的自動(dòng)駕駛車(chē)輛,這些車(chē)輛可以在更加復(fù)雜的環(huán)境中執(zhí)行駕駛?cè)蝿?wù),如并線、十字路口、匝道合并和環(huán)島等。此類(lèi)場(chǎng)景都有一個(gè)典型的特征:強(qiáng)交互性,更具體來(lái)說(shuō),由于不同支路上的多個(gè)交通參與者帶來(lái)了無(wú)數(shù)的交通狀況和復(fù)雜的交互,使得在此類(lèi)場(chǎng)景中的研究具有一定的挑戰(zhàn)性。環(huán)島是交互場(chǎng)景中一個(gè)很好的例子[1],因此,在此場(chǎng)景中的自動(dòng)駕駛技術(shù)研究顯得尤為重要。

    目前,研究人員在自動(dòng)駕駛汽車(chē)技術(shù)上的開(kāi)發(fā)大體分為3個(gè)模塊,包括感知、規(guī)劃和控制模塊[2]。本文中主要研究運(yùn)動(dòng)規(guī)劃層,在運(yùn)動(dòng)規(guī)劃領(lǐng)域,通常采用的方法大體上分為基于圖[3-4](例如A*算法、Dijkstra算法和快速隨機(jī)搜索樹(shù)算法[5-9])、基于優(yōu)化[10](例如模型預(yù)測(cè)控制、EM Planner)和基于學(xué)習(xí)算法[11](例如深度強(qiáng)化學(xué)習(xí)方法)。目前,許多研究者基于以上方法對(duì)運(yùn)動(dòng)規(guī)劃進(jìn)行了大量的研究,產(chǎn)生了許多投入產(chǎn)業(yè)化應(yīng)用的案例,并且取得了良好的效果。運(yùn)動(dòng)規(guī)劃模塊主要負(fù)責(zé)為智能車(chē)輛生成局部運(yùn)動(dòng)軌跡,是自動(dòng)駕駛技術(shù)中至關(guān)重要的一環(huán)。圖搜索的算法通常是將自動(dòng)駕駛車(chē)輛所處的環(huán)境通過(guò)離散化的方法轉(zhuǎn)化為一個(gè)圖,并通過(guò)一些啟發(fā)式的算法生成一條滿足條件的路徑曲線[12]。Dijkstra算法就是一種非常經(jīng)典的基于圖搜索的算法。Dijkstra的主要特點(diǎn)是以起始點(diǎn)為中心向外層層擴(kuò)散,直至擴(kuò)散到目標(biāo)點(diǎn)為止。它的優(yōu)點(diǎn)是每次總能找到最優(yōu)解,缺點(diǎn)是隨著圖的范圍的擴(kuò)大,計(jì)算效率發(fā)生顯著地下降。A*算法則是一種啟發(fā)式的算法,它改善了Dijkstra的缺點(diǎn),提高了算法的搜索效率。Hybrid A*因其考慮了運(yùn)動(dòng)學(xué)的約束問(wèn)題,可以直接生成可行駛的路徑,在智能車(chē)輛中被廣泛應(yīng)用。其他的圖搜索算法大多是以上算法的改進(jìn)或者變種[13-14]?;趦?yōu)化方法的核心問(wèn)題在于構(gòu)建目標(biāo)函數(shù)和約束,函數(shù)的優(yōu)化在每個(gè)運(yùn)動(dòng)狀態(tài)都需要花費(fèi)算力資源[15]。基于優(yōu)化的方法需要在線優(yōu)化,在考慮障礙物過(guò)多的情況下,使求解空間呈現(xiàn)高度的非凸性,在考慮成本的情況下,這可能會(huì)成為實(shí)時(shí)應(yīng)用的巨大障礙[16]。近年來(lái),基于學(xué)習(xí)的智能車(chē)輛運(yùn)動(dòng)規(guī)劃方法(如深度強(qiáng)化學(xué)習(xí))已被廣泛采用[17]。與上述基于優(yōu)化的方法相比,深度強(qiáng)化學(xué)習(xí)方法控制動(dòng)作的輸出只需少量的神經(jīng)網(wǎng)絡(luò)傳播時(shí)間,顯著地提高了計(jì)算效率[18]。一些研究試圖通過(guò)經(jīng)典強(qiáng)化學(xué)習(xí)來(lái)解決自動(dòng)駕駛問(wèn)題,目前,強(qiáng)化學(xué)習(xí)大多應(yīng)用在從感知到控制或者規(guī)劃到控制這樣的端對(duì)端自動(dòng)駕駛?cè)蝿?wù)中。由于端對(duì)端的自動(dòng)駕駛不需要人為指定規(guī)則,且智能體通過(guò)和環(huán)境進(jìn)行交互學(xué)習(xí)駕駛策略與人類(lèi)學(xué)習(xí)駕駛的方式十分相似,所以端對(duì)端的方法成為自動(dòng)駕駛領(lǐng)域的一個(gè)重要研究方向。

    在復(fù)雜環(huán)境中,車(chē)輛對(duì)動(dòng)態(tài)障礙物行為意圖的理解是十分重要的。在簡(jiǎn)單環(huán)境或模擬環(huán)境中,自動(dòng)駕駛系統(tǒng)可以對(duì)其行為進(jìn)行簡(jiǎn)單建模,對(duì)障礙物的未來(lái)軌跡進(jìn)行預(yù)測(cè),通過(guò)預(yù)測(cè)軌跡對(duì)運(yùn)動(dòng)規(guī)劃系統(tǒng)生成的軌跡進(jìn)行評(píng)估,防止其與之發(fā)生碰撞。但是在自動(dòng)駕駛這樣的復(fù)雜環(huán)境中,交通參與者行為意圖的模型不能簡(jiǎn)單的進(jìn)行建模,簡(jiǎn)單模型無(wú)法準(zhǔn)確表達(dá)環(huán)境中的不確定性。因此,如何表達(dá)駕駛環(huán)境中的不確定性以及如何處理這些不確定性是目前自動(dòng)駕駛運(yùn)動(dòng)規(guī)劃研究中亟待解決的問(wèn)題。百度Apollo公司提出的EM Planner規(guī)劃方法采用了三維解耦的的運(yùn)動(dòng)規(guī)劃思想證明了在存在動(dòng)態(tài)障礙物的場(chǎng)景中進(jìn)行橫向的路徑規(guī)劃和縱向規(guī)劃可以代替同時(shí)處理多個(gè)維度的軌跡規(guī)劃。在這種思想下,縱向的速度規(guī)劃成為了動(dòng)態(tài)障礙物不確定性環(huán)境中需要解決的重要問(wèn)題之一。例如使用深度強(qiáng)化學(xué)習(xí)在十字路口[19-20]、高速路口匝道合流[21-26]和環(huán)島[27]等場(chǎng)景。目前,基于深度強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)規(guī)劃方法由于其較高的計(jì)算效率已被廣泛應(yīng)用到自動(dòng)駕駛行業(yè)。然而,當(dāng)前的方法大多是基于仿真模型來(lái)學(xué)習(xí)其駕駛策略,基于神經(jīng)網(wǎng)絡(luò)的駕駛策略往往對(duì)未知場(chǎng)景的預(yù)測(cè)過(guò)于自信,這就導(dǎo)致了不安全等問(wèn)題。為了避免這一問(wèn)題,需要結(jié)合基于規(guī)則的方法對(duì)駕駛策略的規(guī)劃結(jié)果進(jìn)行進(jìn)一步修正。許多研究人員設(shè)計(jì)了安全規(guī)則對(duì)運(yùn)動(dòng)規(guī)劃系統(tǒng)的安全性進(jìn)行冗余。Yang等[19-20]通過(guò)設(shè)置基于規(guī)則的過(guò)濾層對(duì)策略的不安全動(dòng)作進(jìn)行修正,最終在安全性指標(biāo)上取得了不錯(cuò)的效果。Lubars等[28]通過(guò)結(jié)合模型預(yù)測(cè)控制和強(qiáng)化學(xué)習(xí)的方法顯著地提高了運(yùn)動(dòng)規(guī)劃系統(tǒng)的安全性。

    綜上所述,目前自動(dòng)駕駛汽車(chē)的運(yùn)動(dòng)規(guī)劃研究方法也面臨著一些問(wèn)題:1)在有限成本下,基于優(yōu)化的方法在強(qiáng)交互場(chǎng)景中存在計(jì)算效率低的問(wèn)題;2)在復(fù)雜環(huán)境中,如何表達(dá)駕駛環(huán)境中的不確定性以及如何處理這些不確定性以及基于深度強(qiáng)化學(xué)習(xí)方法基于不確定性模型訓(xùn)練而得的駕駛策略不能?chē)?yán)格滿足安全性的問(wèn)題。本文中提出一種基于深度強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)規(guī)劃方法,通過(guò)考慮周車(chē)的不確定性區(qū)域生成未來(lái)時(shí)域內(nèi)的車(chē)輛可達(dá)到狀態(tài)集,并通過(guò)設(shè)計(jì)基于規(guī)則的安全層,生成滿足給定動(dòng)力學(xué)約束、障礙物空間約束和強(qiáng)化學(xué)習(xí)優(yōu)化輸出約束下的修正軌跡,與傳統(tǒng)基于優(yōu)化的規(guī)劃方法相比,軌跡生成策略可以進(jìn)行離線訓(xùn)練和在線部署,解決了基線方法在線計(jì)算效率低的問(wèn)題。同時(shí),通過(guò)構(gòu)建考慮不確定性的馬爾科夫決策過(guò)程表征不確定環(huán)境模型,隨后結(jié)合基于規(guī)則的方法作為考慮安全性的冗余操作,提高運(yùn)動(dòng)規(guī)劃系統(tǒng)的安全性。最后,通過(guò)搭建仿真平臺(tái)訓(xùn)練智能體,從安全性、通行效率、舒適性和計(jì)算效率等多個(gè)方面分析了方法的有效性。

    1 不確定環(huán)境下運(yùn)動(dòng)過(guò)程的構(gòu)建

    馬爾科夫決策過(guò)程(markov decision process,MDP)是1個(gè)典型的表示決策過(guò)程的模型[29],如圖1所示。其決策過(guò)程可以表示為〈S,A,T,R〉,其中S和A分別為狀態(tài)和動(dòng)作的集合,T為狀態(tài)轉(zhuǎn)移模型,R為構(gòu)建的獎(jiǎng)勵(lì)函數(shù)。整個(gè)決策過(guò)程就是t時(shí)刻狀態(tài)為St的智能體執(zhí)行動(dòng)作At,進(jìn)入下一時(shí)刻的狀態(tài),下一時(shí)刻的狀態(tài)由當(dāng)前狀態(tài)以及當(dāng)前采取的動(dòng)作決定,是一個(gè)隨機(jī)變量。

    圖1 馬爾科夫決策過(guò)程MDP示意圖

    對(duì)于自動(dòng)駕駛系統(tǒng),MDP中的狀態(tài)可以表示為智能車(chē)輛所處駕駛環(huán)境中每個(gè)時(shí)刻的表示,動(dòng)作為車(chē)輛中可被賦予的1個(gè)屬性,狀態(tài)轉(zhuǎn)移模型為環(huán)境中自我車(chē)輛與周?chē)?chē)輛的運(yùn)動(dòng)模型,回報(bào)為針對(duì)駕駛環(huán)境而構(gòu)建的獎(jiǎng)勵(lì)函數(shù)。在自動(dòng)駕駛環(huán)境中,由于環(huán)境和傳感器誤差的限制,系統(tǒng)無(wú)法準(zhǔn)確知道周?chē)h(huán)境的狀態(tài),因此無(wú)法構(gòu)建一個(gè)精確的狀態(tài)轉(zhuǎn)移模型,此時(shí)構(gòu)建的狀態(tài)轉(zhuǎn)移模型需要考慮傳感器誤差的不確定性帶來(lái)的問(wèn)題,在實(shí)際駕駛中,傳感器的狀態(tài)感知總是存在一定的誤差的,這造成了獲得的策略輸出可能不是最優(yōu)的,甚至是不安全的。為彌補(bǔ)這一差異,必須考慮這一不確定性。由于明確知道駕駛車(chē)輛的模型信息,因此自車(chē)的模型是1個(gè)確定性的模型。為了規(guī)劃自車(chē)在預(yù)測(cè)時(shí)域內(nèi)的軌跡,使用了如式(1)的確定性車(chē)輛縱向運(yùn)動(dòng)學(xué)模型,推出給定的強(qiáng)化學(xué)習(xí)策略的規(guī)劃解。值得注意的是,與預(yù)測(cè)周車(chē)的交通行為不同,通過(guò)結(jié)合運(yùn)動(dòng)學(xué)模型以及基于深度強(qiáng)化學(xué)習(xí)的方案,可以得到一個(gè)合理且確定的規(guī)劃結(jié)果。由于周?chē)?chē)輛的不確定性有著來(lái)自駕駛?cè)藛T意圖的不確定性和自車(chē)傳感器誤差帶來(lái)的不確定性。因此,建立了考慮不確定性的交通流預(yù)測(cè)模型。智能駕駛員模型(IDM)被廣泛應(yīng)用于周車(chē)智能駕駛預(yù)測(cè)模型,并且能用統(tǒng)一的模型描述從自由流到完全擁堵流的不同狀態(tài)。使用智能駕駛員模型(IDM)作為交通流車(chē)輛的狀態(tài)轉(zhuǎn)移模型。為使所建模型能夠在微觀水平上與IDM盡量保持一致,使用IDM模型的運(yùn)動(dòng)表達(dá)式:

    (1)

    式中:dt為采樣周期;si、vi、ai和ji分別為在預(yù)測(cè)時(shí)域內(nèi)第i點(diǎn)車(chē)輛的縱向位移、速度、加速度和加加速度。

    (2)

    (3)

    為考慮傳感器帶來(lái)的數(shù)據(jù)誤差,我們考慮了加速度噪聲,不同車(chē)用測(cè)速雷達(dá)的測(cè)速誤差會(huì)影響策略性能,如式(4)所示。

    v′=v+σvel

    (4)

    式中:σvel為傳感器的測(cè)速誤差。

    2 深度強(qiáng)化學(xué)習(xí)

    2.1 強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)是一類(lèi)機(jī)器學(xué)習(xí)方法,借鑒于行為主義心理學(xué),強(qiáng)化學(xué)習(xí)算法要解決的問(wèn)題是智能體在環(huán)境中如何執(zhí)行動(dòng)作以獲得最大的累計(jì)獎(jiǎng)勵(lì)。

    強(qiáng)化學(xué)習(xí)問(wèn)題可以抽象成馬爾科夫決策過(guò)程(Markov Decision Process),馬爾科夫決策過(guò)程可以表示為

    {S,A,P,R,γ}

    (5)

    式中:S和A分別為狀態(tài)和動(dòng)作的集合;R為獎(jiǎng)勵(lì)函數(shù);γ為折扣因子。強(qiáng)化學(xué)習(xí)示意圖如圖2所示。假設(shè)t時(shí)刻狀態(tài)為st,智能體執(zhí)行動(dòng)作at,進(jìn)入下一時(shí)刻的狀態(tài)st+1,下一時(shí)刻的狀態(tài)由當(dāng)前狀態(tài)以及當(dāng)前采取的動(dòng)作決定,是一個(gè)隨機(jī)變量,狀態(tài)轉(zhuǎn)移概率如下:

    pa(s,s′)=p(st+1=s|st=s,at=a)

    (6)

    式中:pa為當(dāng)前狀態(tài)s下執(zhí)行動(dòng)作a,下一時(shí)刻進(jìn)入狀態(tài)s′的條件概率,強(qiáng)化學(xué)習(xí)問(wèn)題的核心是執(zhí)行動(dòng)作a的策略,它可以抽象成一個(gè)函數(shù)π,定義了每種狀態(tài)時(shí)選擇的動(dòng)作。這個(gè)函數(shù)定義了在狀態(tài)s所選擇的動(dòng)作為:

    π(a|s)=p(a|s)

    (7)

    圖2 強(qiáng)化學(xué)習(xí)示意圖

    2.2 深度強(qiáng)化學(xué)習(xí)

    深度強(qiáng)化學(xué)習(xí)方法是在強(qiáng)化學(xué)習(xí)的基礎(chǔ)上結(jié)合深度學(xué)習(xí)而生成的一種更貼近人類(lèi)思維方式的方法。DDPG (deep deterministic policy gradient)是應(yīng)用最為廣泛的深度強(qiáng)化學(xué)習(xí)算法之一。如圖3所示,基于Actor-Critic(AC)框架的DDPG算法,通過(guò)神經(jīng)網(wǎng)絡(luò)逼近價(jià)值函數(shù)和策略函數(shù),網(wǎng)絡(luò)通過(guò)梯度下降的方式進(jìn)行更新。θQ、θμ分別是策略網(wǎng)絡(luò)和評(píng)估網(wǎng)絡(luò)的權(quán)重。同時(shí)DDPG在DQN(deep Q-learning)的基礎(chǔ)上進(jìn)行了改進(jìn),結(jié)合了DQN以及DPG(deterministic polic gradient)的優(yōu)點(diǎn),包括雙網(wǎng)絡(luò)、構(gòu)建經(jīng)驗(yàn)回放池等。DDPG有2個(gè)網(wǎng)絡(luò),即演員網(wǎng)絡(luò)和評(píng)論家網(wǎng)絡(luò),2個(gè)網(wǎng)絡(luò)分別負(fù)責(zé)策略網(wǎng)絡(luò)參數(shù)的迭代更新和價(jià)值網(wǎng)絡(luò)參數(shù)的迭代更新[30]。由于自動(dòng)駕駛車(chē)輛通常有一個(gè)連續(xù)的狀態(tài)空間和動(dòng)作空間,而DDPG算法在連續(xù)空間中擁有一個(gè)良好的表現(xiàn)。因此,本文中使用DDPG算法作為基礎(chǔ)的強(qiáng)化學(xué)習(xí)模型。

    圖3 DDPG算法框圖

    3 基于DDPG算法的運(yùn)動(dòng)規(guī)劃策略框架

    為解決基于深度強(qiáng)化學(xué)習(xí)的方法在復(fù)雜環(huán)境中如何表達(dá)駕駛環(huán)境中的不確定性以及如何處理這些不確定性問(wèn)題,提出了一種基于DDPG的運(yùn)動(dòng)規(guī)劃方法。

    圖4首先展示了這項(xiàng)工作的基礎(chǔ)深度強(qiáng)化學(xué)習(xí)框架,并在圖5所示的場(chǎng)景中完成駕駛策略的訓(xùn)練。通過(guò)結(jié)合本文中提出的車(chē)輛運(yùn)動(dòng)學(xué)模型推導(dǎo)軌跡規(guī)劃結(jié)果,得出規(guī)劃軌跡在未來(lái)一定時(shí)間段內(nèi)的可視化結(jié)果。其次,考慮由于真實(shí)信息和傳感器信息的差異,采用不確定性區(qū)間預(yù)測(cè)進(jìn)行近似最優(yōu)控制,在此基礎(chǔ)上,設(shè)計(jì)了一個(gè)基于規(guī)則的安全層,該安全層旨在保證不確定區(qū)域內(nèi)的交通信息的最壞情況下的安全性。安全層考慮了車(chē)輛的動(dòng)力性、安全性和最優(yōu)性約束。最后,通過(guò)搭建環(huán)島場(chǎng)景中不同密度下的交通流模型來(lái)評(píng)估駕駛策略的各種性能指標(biāo)。

    圖4 單車(chē)道環(huán)島場(chǎng)景示意圖

    圖5 基于強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)規(guī)劃算法場(chǎng)景示意圖

    3.1 強(qiáng)化學(xué)習(xí)要素定義

    狀態(tài):所構(gòu)建的強(qiáng)化學(xué)習(xí)框架的環(huán)境狀態(tài)包括2種車(chē)輛的狀態(tài):完成環(huán)島任務(wù)的目標(biāo)車(chē)輛(e)及其由完美傳感器輸出的2個(gè)前方(f1,f2)和2個(gè)后方(b1,b2)的車(chē)輛信息。目標(biāo)車(chē)輛的狀態(tài)信息包括位置、速度和加速度。前車(chē)和后車(chē)的狀態(tài)包括位置(sf1,sf2,sb1,sb2)以及速度(vf1,vf2,vb1,vb2),所以,環(huán)境狀態(tài)空間可以表示為

    s=(se,ve,ae,sf1,sf2,sb1,sb2,

    vf1,vf2,vb1,vb2)

    動(dòng)作:強(qiáng)化學(xué)習(xí)框架的動(dòng)作是完成環(huán)島任務(wù)車(chē)輛的加加速度值,加加速度值是加速度的導(dǎo)數(shù),通常用來(lái)表示車(chē)輛的舒適性指標(biāo)。目標(biāo)車(chē)輛的加加速度值輸出在[-3.0,3.0]m/s3,這與道路車(chē)輛正常加加速度范圍值相同[27]。

    獎(jiǎng)勵(lì)函數(shù):在離線訓(xùn)練的過(guò)程中,訓(xùn)練神經(jīng)網(wǎng)絡(luò)是將駕駛經(jīng)驗(yàn)從一種形式轉(zhuǎn)移到另一種形式的過(guò)程,即把預(yù)期的行為轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置,強(qiáng)化學(xué)習(xí)算法使智能體獲得的累計(jì)回報(bào)最大化。因此,設(shè)計(jì)的獎(jiǎng)勵(lì)函數(shù)必須能很好地代表預(yù)期行為。此次獎(jiǎng)勵(lì)函數(shù)分為3個(gè)部分:碰撞、任務(wù)完成、任務(wù)進(jìn)行中。對(duì)于環(huán)島任務(wù),智能體的第一目標(biāo)就是能夠無(wú)碰撞地到達(dá)目標(biāo)點(diǎn),此時(shí)給予智能體一個(gè)較大的獎(jiǎng)勵(lì),保證獎(jiǎng)勵(lì)數(shù)值不會(huì)被其他部分所覆蓋,同時(shí)給智能體在發(fā)生碰撞時(shí)一個(gè)較大的負(fù)獎(jiǎng)勵(lì),防止智能體與其他動(dòng)態(tài)障礙物發(fā)生碰撞,確保安全性。在智能體的運(yùn)行過(guò)程中,設(shè)置舒適性獎(jiǎng)勵(lì)、時(shí)間花費(fèi)獎(jiǎng)勵(lì)等,針對(duì)當(dāng)前環(huán)島場(chǎng)景所設(shè)計(jì)的獎(jiǎng)勵(lì)函數(shù)方程具體的實(shí)現(xiàn)方式可表示為

    r(x,u)=ω1s(x,u)-ω2-ω3u2

    (8)

    式中:ω1、ω2、ω3為智能體在探索過(guò)程中回合成功/失敗、通行效率和舒適性指標(biāo)加加速度指數(shù)的可調(diào)權(quán)重,s(x,u)表示該回合的成功,回合成功時(shí)取值20,回合失敗時(shí)取值-20。動(dòng)作u是目標(biāo)車(chē)輛在每一個(gè)仿真步長(zhǎng)中加加速度值。在滿足無(wú)碰撞到達(dá)目標(biāo)點(diǎn)的前提下,通過(guò)給予智能體加加速度的獎(jiǎng)勵(lì),盡可能滿足車(chē)輛的舒適性指標(biāo)。約束速度盡可能在期望速度之間,同時(shí)使加速度和加加速度的值盡可能地小。在測(cè)試過(guò)程中,發(fā)現(xiàn)智能體存在停止不動(dòng)的情況,來(lái)獲取更多的累計(jì)回報(bào),為防止此類(lèi)情況的發(fā)生,通過(guò)設(shè)置可調(diào)整的時(shí)間花費(fèi)懲罰權(quán)重ω2來(lái)懲罰此類(lèi)行為。

    3.2 安全層修正框架

    在學(xué)習(xí)過(guò)程中,我們期望能夠?qū)W到最優(yōu)策略,最優(yōu)策略能夠在當(dāng)前狀態(tài)下的動(dòng)作空間輸出最優(yōu)動(dòng)作,生成最優(yōu)軌跡。不幸的是,在理論和實(shí)踐過(guò)程中,我們發(fā)現(xiàn)很難獲得這樣的最優(yōu)策略。因?yàn)轳{駛場(chǎng)景的狀態(tài)空間是連續(xù)的,自動(dòng)駕駛問(wèn)題轉(zhuǎn)換為強(qiáng)化學(xué)習(xí)過(guò)程中,通過(guò)構(gòu)建等效問(wèn)題來(lái)求解策略,這就意味著無(wú)法考慮到無(wú)限的狀態(tài)和約束;其次,模型的精確性也會(huì)直接影響規(guī)劃結(jié)果,從而導(dǎo)致了無(wú)法在全局保證安全性。本文所提出的解耦端對(duì)端的方法,能夠輸出規(guī)劃軌跡,為了確保規(guī)劃結(jié)果的安全性能,我們?cè)O(shè)計(jì)了一種安全規(guī)則軌跡優(yōu)化方法。

    1) 優(yōu)化規(guī)則:該優(yōu)化方法的目標(biāo)是在安全性行駛空間中找到與滿足效率和舒適性的強(qiáng)化學(xué)習(xí)方法目標(biāo)點(diǎn)最近的目標(biāo)位置。

    (9)

    ssafety={s′f∣s∩sf}∩{s′a∣s∩sa}

    (10)

    式中:s′f為滿足與他車(chē)保持安全距離的可行駛空間;s′a為滿足車(chē)輛動(dòng)力學(xué)約束下的可行駛空間。

    2) 算法的在線部署:得到離線訓(xùn)練的策略后,結(jié)合車(chē)輛縱向運(yùn)動(dòng)學(xué)模型,生成車(chē)輛未來(lái)時(shí)域下的軌跡點(diǎn),發(fā)現(xiàn)不安全的軌跡點(diǎn)后,使用上述優(yōu)化規(guī)則對(duì)前面5個(gè)時(shí)間步長(zhǎng)的軌跡點(diǎn)進(jìn)行規(guī)則矯正,提高軌跡輸出的安全性,如算法1所示。

    算法1:在線部署-矯正不安全軌跡

    輸入:未來(lái)5 s的規(guī)劃軌跡。

    輸出:未來(lái)5 s的安全規(guī)劃軌跡。

    fori=1,50 do

    ui-1=π(xi-1,xj-1)

    ui=π(xi,xj)

    for eachsi∣t?ssafety

    end

    4 實(shí)驗(yàn)結(jié)果和分析

    4.1 DDPG算法訓(xùn)練結(jié)果分析

    使用自動(dòng)駕駛仿真模擬器SUMO模擬真實(shí)環(huán)島工況,使用DDPG算法對(duì)駕駛行為進(jìn)行訓(xùn)練,同時(shí)搭建如表1所示的不同密度下的交通流模型,并在不同模型中完成訓(xùn)練和測(cè)試(中等密度訓(xùn)練)。

    表1 不同密度的交通流模型

    通過(guò)離線訓(xùn)練的方式學(xué)習(xí)當(dāng)前設(shè)置的獎(jiǎng)勵(lì)函數(shù)下的行駛策略,為驗(yàn)證離線訓(xùn)練算法的有效性,以本文搭建的仿真環(huán)境為實(shí)驗(yàn)平臺(tái)對(duì)離線訓(xùn)練算法進(jìn)行訓(xùn)練,選擇智能體在一個(gè)訓(xùn)練周期內(nèi)獲得的平均獎(jiǎng)勵(lì)值作為評(píng)估指標(biāo)。通過(guò)圖6可以看出,整個(gè)訓(xùn)練過(guò)程中,當(dāng)前任務(wù)的獎(jiǎng)勵(lì)累積都呈上升的趨勢(shì)且在后面都趨于一個(gè)定值,證明了所提出的基于深度強(qiáng)化學(xué)習(xí)方法的有效性。此外收斂速度、不同隨機(jī)種子之間的差異以及最終性能隨交通工況的不同而不同,原因在于,在不同交通任務(wù)中與自車(chē)具有潛在沖突的動(dòng)態(tài)障礙物是不同的,從而導(dǎo)致了訓(xùn)練難度之間的差異。本文所有仿真任務(wù)均在2.5 GHz 英特爾i7-8700處理器進(jìn)行離線訓(xùn)練及在線部署仿真。DDPG算法的參數(shù)設(shè)置如表2所示。

    表2 DDPG算法的參數(shù)設(shè)置

    圖6 DDPG算法學(xué)習(xí)曲線

    4.2 基于深度強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)規(guī)劃結(jié)果

    在中等密度場(chǎng)景中,完成基于DDPG算法的駕駛策略的訓(xùn)練,獲得離線策略。通過(guò)將離線策略在線部署,生成高密度和中等密度下的運(yùn)動(dòng)規(guī)劃軌跡。圖7顯示了使用增加傳感器帶來(lái)的速度噪聲的不確定性感知模型的自車(chē)和交通流車(chē)輛在預(yù)測(cè)時(shí)域內(nèi)的可視化軌跡,圖中的陰影區(qū)域表示通過(guò)設(shè)置傳感器測(cè)速誤差帶來(lái)的模型不確定性得到的車(chē)輛可能的行駛軌跡。本文中考慮了雷達(dá)所帶來(lái)的測(cè)速誤差,測(cè)速精度為±1.5 km/h,此精度為型號(hào)BGT24ATR12D的測(cè)速雷達(dá),此型號(hào)的雷達(dá)廣泛應(yīng)用在自動(dòng)駕駛解決方案中,不同傳感器的測(cè)速精度有所不同,本文的解決方案是一種考慮誤差下的通用解決方案。

    圖7 目標(biāo)車(chē)輛和周?chē)煌鬈?chē)輛的預(yù)測(cè)軌跡可視化曲線

    在高等和低等密度下的交通流模型的訓(xùn)練測(cè)試中,圖7(a)和(b)顯示在一個(gè)任務(wù)回合過(guò)程中的5 s和10 s的規(guī)劃軌跡可視化結(jié)果,所學(xué)習(xí)到的策略并沒(méi)有表現(xiàn)出不安全的行為,這證明了DDPG算法所訓(xùn)練的駕駛策略的有效性,并表明了深度強(qiáng)化學(xué)習(xí)在一定程度上能夠獲得預(yù)期安全駕駛行為。圖7(c)和(d)顯示在一個(gè)任務(wù)回合過(guò)程中的15 s和20 s的規(guī)劃軌跡可視化結(jié)果??梢钥闯?自車(chē)和交通參與者在預(yù)測(cè)時(shí)域內(nèi),可能發(fā)生不安全的駕駛行為。這不代表在實(shí)際中一定會(huì)發(fā)生碰撞,而是所訓(xùn)練的駕駛策略和車(chē)輛的運(yùn)動(dòng)學(xué)的規(guī)劃結(jié)果,通過(guò)對(duì)未來(lái)結(jié)果的可視化,我們可以結(jié)合基于規(guī)則的安全層,對(duì)不安全的行為進(jìn)行在線優(yōu)化,來(lái)彌補(bǔ)傳感器誤差等帶來(lái)的策略性能的下降。本文中的安全層主要考慮了3個(gè)方面的性能考慮,即車(chē)輛動(dòng)力學(xué)限制、安全性和強(qiáng)化學(xué)習(xí)優(yōu)化結(jié)果(盡可能貼近訓(xùn)練結(jié)果)。從圖7(c)和(d)可以看出,通過(guò)考慮安全層的在線優(yōu)化后,原有軌跡大部分保持不變,不安全的區(qū)域被修改。

    4.3 不同方法結(jié)果對(duì)比分析

    將本文所提出的方法與今經(jīng)典基于優(yōu)化(動(dòng)態(tài)規(guī)劃+二次規(guī)劃)和端對(duì)端的強(qiáng)化學(xué)習(xí)方法(DDPG)進(jìn)行比較,主要衡量以下4個(gè)指標(biāo):

    1) 舒適性。通過(guò)計(jì)算所有評(píng)估回合合并車(chē)輛(控制車(chē)輛)的加速度的導(dǎo)數(shù)(加加速度)平均值來(lái)衡量舒適性, 加加速度通常用來(lái)衡量車(chē)輛舒適性,加加速度值越大,舒適性越差,加加速度值越小,舒適性越好。

    2) 安全性。安全性通常由任務(wù)過(guò)程中的碰撞率來(lái)衡量,碰撞率越高則代表安全性越差。

    3) 通行效率。通行效率是指合并車(chē)輛完成合并任務(wù)的平均通行時(shí)間。

    4) 在線計(jì)算效率。在線計(jì)算效率是指算法1個(gè)周期所花費(fèi)的計(jì)算時(shí)間。

    表3顯示了經(jīng)典基于優(yōu)化的動(dòng)態(tài)規(guī)劃加二次規(guī)劃的方法(DP+QP)、基于強(qiáng)化學(xué)習(xí)的端對(duì)端方法(DDPG)和本文所提出的方法在低密度的交通流模型中進(jìn)行測(cè)試的結(jié)果。可以看出,DDPG的方法的合并時(shí)間最短且加加速度值最小,這是由于DDPG方法設(shè)置的獎(jiǎng)勵(lì)函數(shù)考慮了車(chē)輛的通行效率和舒適性。但是其安全性卻是3種方法中最低的。這是由于,通過(guò)設(shè)置考慮多種性能指標(biāo)的獎(jiǎng)勵(lì)函數(shù)無(wú)法設(shè)置硬約束來(lái)滿足安全性能,這是使用基于強(qiáng)化學(xué)習(xí)的方法應(yīng)用在自動(dòng)駕駛技術(shù)的開(kāi)發(fā)上的一個(gè)普遍存在的問(wèn)題,此類(lèi)端對(duì)端的研究方法不能?chē)?yán)格滿足安全性。我們所提出的方法通過(guò)結(jié)合基于規(guī)則的方法著重考慮了安全性問(wèn)題,由仿真結(jié)果可以得知,我們的方法在通行效率和舒適性指標(biāo)上能夠達(dá)到基于優(yōu)化方法的表現(xiàn),且也能夠獲得一個(gè)零碰撞率,從而嚴(yán)格保證安全性。

    表3 3種方法在低密度下的性能參數(shù)

    表4和表5顯示了3種方法在中等和高等密度下的具體表現(xiàn),總體趨勢(shì)與表3相似,但是由于交通密度的增加,3種方法的性能均有所下降,這是一個(gè)正常的表現(xiàn)。我們的方法在不同交通密度下均能保持一個(gè)零碰撞率,這是我們提出基于規(guī)則的安全層修正的結(jié)果。所提出的方法能夠在嚴(yán)格滿足安全性的同時(shí),在舒適性和通行效率上具有一個(gè)良好的表現(xiàn)。

    表4 3種方法在中等密度下的性能參數(shù)

    表5 3種方法在高密度下的性能參數(shù)

    如圖8所示,傳統(tǒng)基于優(yōu)化的動(dòng)態(tài)規(guī)劃和二次規(guī)劃的方法1個(gè)規(guī)劃周期的在線計(jì)算時(shí)間大概在100 ms,而本文所提出的方法在線計(jì)算時(shí)間能夠在10 ms以內(nèi),降低了1個(gè)數(shù)量級(jí)。這是因?yàn)楸疚闹兴岢龅姆椒▽⒋蟛糠衷诰€計(jì)算的壓力轉(zhuǎn)移到了離線端。在工業(yè)應(yīng)用中,當(dāng)車(chē)端算力有限時(shí),本文所提出的方法可能會(huì)成為一個(gè)比較理想的解決方法。

    圖8 2種方法的在線計(jì)算時(shí)間曲線

    5 結(jié)論

    1) 所提出的方法基于深度強(qiáng)化學(xué)習(xí)解決了含有大量約束的自動(dòng)駕駛運(yùn)動(dòng)規(guī)劃問(wèn)題。所提出的方法與基于在線優(yōu)化的傳統(tǒng)算法相比,降低了車(chē)輛與環(huán)境大量交互而產(chǎn)生的對(duì)車(chē)端硬件設(shè)備的算力需求。

    2) 該方法明確考慮了智能車(chē)輛傳感器誤差帶來(lái)的不確定性,建立了基于學(xué)習(xí)方法的運(yùn)動(dòng)規(guī)劃系統(tǒng)基本框架,并基于馬爾科夫決策過(guò)程構(gòu)建了一個(gè)模型來(lái)表征具有不確定性的駕駛環(huán)境。

    3) 結(jié)合基于規(guī)則的方法設(shè)置安全層,對(duì)軌跡結(jié)果進(jìn)行評(píng)估的同時(shí)能夠進(jìn)行在線動(dòng)作修正。增加1層安全防護(hù),使結(jié)果更加魯棒可靠。

    4) 通過(guò)構(gòu)建仿真框架對(duì)所提出的方法在不同交通密度下進(jìn)行了廣泛的評(píng)估,驗(yàn)證該方法在安全性、舒適性和在線計(jì)算效率等方面的性能。

    5) 本文提出的基于深度強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)規(guī)劃方法在自動(dòng)駕駛運(yùn)動(dòng)規(guī)劃領(lǐng)域中具有應(yīng)用價(jià)值。目前的研究?jī)H集中在車(chē)輛的縱向規(guī)劃中,后續(xù)研究可以考慮車(chē)輛的橫縱向運(yùn)動(dòng)規(guī)劃,考慮更加優(yōu)秀的區(qū)間預(yù)測(cè)器,使不確定性預(yù)測(cè)區(qū)間不至于過(guò)度保守。

    猜你喜歡
    不確定性軌跡加速度
    法律的兩種不確定性
    法律方法(2022年2期)2022-10-20 06:41:56
    “鱉”不住了!從26元/斤飆至38元/斤,2022年甲魚(yú)能否再跑出“加速度”?
    軌跡
    軌跡
    英鎊或繼續(xù)面臨不確定性風(fēng)險(xiǎn)
    天際加速度
    創(chuàng)新,動(dòng)能轉(zhuǎn)換的“加速度”
    金橋(2018年4期)2018-09-26 02:24:46
    死亡加速度
    軌跡
    進(jìn)化的軌跡(一)——進(jìn)化,無(wú)盡的適應(yīng)
    亚洲七黄色美女视频| 国产成人精品在线电影| a 毛片基地| 黄色毛片三级朝国网站| 黑人猛操日本美女一级片| 一本色道久久久久久精品综合| 亚洲国产毛片av蜜桃av| av天堂久久9| 日韩有码中文字幕| 午夜福利在线免费观看网站| 日韩欧美国产一区二区入口| 女人爽到高潮嗷嗷叫在线视频| 亚洲av电影在线观看一区二区三区| 伊人亚洲综合成人网| 国产在线免费精品| 久久久精品免费免费高清| 男女午夜视频在线观看| 国产欧美日韩一区二区三区在线| 久久人人爽人人片av| 91九色精品人成在线观看| 亚洲情色 制服丝袜| 欧美黄色淫秽网站| 久久精品亚洲av国产电影网| 免费观看人在逋| 亚洲成av片中文字幕在线观看| 999久久久国产精品视频| 999精品在线视频| 九色亚洲精品在线播放| 亚洲午夜精品一区,二区,三区| 91精品国产国语对白视频| 国产精品一区二区免费欧美 | 免费久久久久久久精品成人欧美视频| 一区二区av电影网| 精品一区二区三区四区五区乱码| bbb黄色大片| 免费观看a级毛片全部| 热99re8久久精品国产| a在线观看视频网站| a级毛片在线看网站| 黄频高清免费视频| 悠悠久久av| 美女扒开内裤让男人捅视频| 在线观看免费午夜福利视频| 极品人妻少妇av视频| 电影成人av| cao死你这个sao货| 天天添夜夜摸| 黑丝袜美女国产一区| 国产精品九九99| 国产在线免费精品| 日韩三级视频一区二区三区| 国产91精品成人一区二区三区 | 国产精品1区2区在线观看. | 免费在线观看完整版高清| 无遮挡黄片免费观看| 久久久久久久国产电影| 亚洲三区欧美一区| 丁香六月欧美| 欧美97在线视频| 动漫黄色视频在线观看| 久久精品国产综合久久久| 精品一区二区三区四区五区乱码| 又大又爽又粗| 最近中文字幕2019免费版| 欧美在线黄色| 亚洲精品中文字幕在线视频| 麻豆乱淫一区二区| 在线观看舔阴道视频| 黄色毛片三级朝国网站| 丝袜美足系列| 午夜福利视频精品| 久久国产亚洲av麻豆专区| 亚洲av片天天在线观看| 色老头精品视频在线观看| 又黄又粗又硬又大视频| 国产精品久久久久成人av| 在线十欧美十亚洲十日本专区| 亚洲av片天天在线观看| 午夜日韩欧美国产| 久久国产亚洲av麻豆专区| 少妇猛男粗大的猛烈进出视频| 国产成人免费无遮挡视频| 啦啦啦中文免费视频观看日本| 午夜免费鲁丝| 国产精品一区二区在线不卡| 伦理电影免费视频| 欧美少妇被猛烈插入视频| 久久久精品94久久精品| 欧美黄色淫秽网站| 大码成人一级视频| 亚洲精品乱久久久久久| 国产亚洲欧美精品永久| 中文精品一卡2卡3卡4更新| 亚洲免费av在线视频| 成年女人毛片免费观看观看9 | 国产成人a∨麻豆精品| 国产成人精品久久二区二区免费| 黑人操中国人逼视频| 9191精品国产免费久久| 女人爽到高潮嗷嗷叫在线视频| 欧美 亚洲 国产 日韩一| 曰老女人黄片| 婷婷成人精品国产| 亚洲专区中文字幕在线| av线在线观看网站| 亚洲少妇的诱惑av| 国产日韩欧美在线精品| 婷婷丁香在线五月| 人人妻人人澡人人看| 亚洲精品国产一区二区精华液| 熟女少妇亚洲综合色aaa.| 中国国产av一级| 看免费av毛片| 天天躁日日躁夜夜躁夜夜| 啪啪无遮挡十八禁网站| 久久免费观看电影| bbb黄色大片| 91麻豆av在线| 久久中文看片网| 少妇被粗大的猛进出69影院| 久久中文看片网| 久久精品人人爽人人爽视色| 午夜福利在线免费观看网站| 久久人妻福利社区极品人妻图片| 亚洲欧美精品自产自拍| 中文字幕另类日韩欧美亚洲嫩草| 亚洲精品日韩在线中文字幕| 最黄视频免费看| 自拍欧美九色日韩亚洲蝌蚪91| 中文字幕av电影在线播放| 精品久久久精品久久久| 欧美精品亚洲一区二区| 欧美成人午夜精品| 午夜两性在线视频| 三上悠亚av全集在线观看| 在线观看人妻少妇| 午夜影院在线不卡| 国产不卡av网站在线观看| 深夜精品福利| 亚洲国产精品一区二区三区在线| 啪啪无遮挡十八禁网站| 亚洲黑人精品在线| a在线观看视频网站| 国产极品粉嫩免费观看在线| 中文精品一卡2卡3卡4更新| 制服人妻中文乱码| 午夜福利视频精品| 手机成人av网站| av不卡在线播放| 亚洲一区中文字幕在线| 欧美 日韩 精品 国产| 少妇精品久久久久久久| 一区福利在线观看| 欧美激情 高清一区二区三区| 久久av网站| www.av在线官网国产| 欧美黄色片欧美黄色片| 欧美av亚洲av综合av国产av| 亚洲欧美激情在线| 久久人人爽人人片av| 麻豆乱淫一区二区| 18禁观看日本| 午夜福利,免费看| 99精国产麻豆久久婷婷| 一二三四社区在线视频社区8| 高清视频免费观看一区二区| 亚洲成av片中文字幕在线观看| 69av精品久久久久久 | 日本欧美视频一区| 成年动漫av网址| 黄片小视频在线播放| 一个人免费在线观看的高清视频 | 日韩中文字幕视频在线看片| 欧美午夜高清在线| 国产又色又爽无遮挡免| 美女高潮到喷水免费观看| 女性生殖器流出的白浆| 免费观看人在逋| 人成视频在线观看免费观看| 欧美日韩福利视频一区二区| av片东京热男人的天堂| 免费av中文字幕在线| 99久久综合免费| 亚洲成人免费电影在线观看| 新久久久久国产一级毛片| 热99久久久久精品小说推荐| 少妇裸体淫交视频免费看高清 | 免费av中文字幕在线| 亚洲中文日韩欧美视频| www日本在线高清视频| 婷婷色av中文字幕| 999久久久精品免费观看国产| 国产一级毛片在线| 男人舔女人的私密视频| 精品亚洲成国产av| 老熟女久久久| 一个人免费看片子| 国产精品麻豆人妻色哟哟久久| 另类亚洲欧美激情| 老熟女久久久| av视频免费观看在线观看| 天天添夜夜摸| 国产成人影院久久av| 国产一区二区在线观看av| 男女高潮啪啪啪动态图| 午夜福利影视在线免费观看| 女性被躁到高潮视频| 丝袜在线中文字幕| 亚洲伊人色综图| 91麻豆精品激情在线观看国产 | 97在线人人人人妻| 成人国产一区最新在线观看| 少妇精品久久久久久久| 日韩 欧美 亚洲 中文字幕| av视频免费观看在线观看| 国产成人精品在线电影| 黄色视频,在线免费观看| 午夜福利在线免费观看网站| 亚洲性夜色夜夜综合| 18禁黄网站禁片午夜丰满| 亚洲av电影在线观看一区二区三区| 丰满饥渴人妻一区二区三| 1024香蕉在线观看| 国产精品偷伦视频观看了| 欧美一级毛片孕妇| 在线十欧美十亚洲十日本专区| 一区福利在线观看| 人成视频在线观看免费观看| 一级毛片电影观看| 亚洲自偷自拍图片 自拍| 精品亚洲乱码少妇综合久久| 巨乳人妻的诱惑在线观看| 久久久精品免费免费高清| 色94色欧美一区二区| 香蕉丝袜av| 亚洲精品自拍成人| 午夜精品久久久久久毛片777| 欧美大码av| 亚洲午夜精品一区,二区,三区| 亚洲全国av大片| 美女高潮喷水抽搐中文字幕| 性色av乱码一区二区三区2| 最新的欧美精品一区二区| 精品久久蜜臀av无| 91九色精品人成在线观看| 婷婷色av中文字幕| avwww免费| 国产一区二区三区在线臀色熟女 | 亚洲欧美精品自产自拍| 日本vs欧美在线观看视频| 99久久综合免费| 久久久久国产精品人妻一区二区| 亚洲精品国产区一区二| 嫩草影视91久久| 亚洲第一av免费看| 高清视频免费观看一区二区| 少妇裸体淫交视频免费看高清 | 丁香六月天网| 人人妻人人澡人人爽人人夜夜| 国产国语露脸激情在线看| 一级毛片精品| 狠狠精品人妻久久久久久综合| 久久久水蜜桃国产精品网| bbb黄色大片| 青青草视频在线视频观看| 欧美激情久久久久久爽电影 | 欧美国产精品va在线观看不卡| 国产真人三级小视频在线观看| 天堂中文最新版在线下载| 正在播放国产对白刺激| 欧美日韩亚洲高清精品| 日本精品一区二区三区蜜桃| 日韩大码丰满熟妇| 久久久久久久精品精品| 丝袜喷水一区| 亚洲一码二码三码区别大吗| 高清在线国产一区| 九色亚洲精品在线播放| 啦啦啦免费观看视频1| 欧美黑人欧美精品刺激| 成年美女黄网站色视频大全免费| 亚洲av男天堂| 色老头精品视频在线观看| 久久国产精品男人的天堂亚洲| 99国产综合亚洲精品| av福利片在线| 一级毛片电影观看| a 毛片基地| 欧美97在线视频| 交换朋友夫妻互换小说| 亚洲avbb在线观看| 色老头精品视频在线观看| 精品一品国产午夜福利视频| 欧美精品人与动牲交sv欧美| 国产成人欧美在线观看 | tube8黄色片| 亚洲av美国av| 永久免费av网站大全| 操出白浆在线播放| www.熟女人妻精品国产| 人妻人人澡人人爽人人| 丰满饥渴人妻一区二区三| 亚洲国产毛片av蜜桃av| 欧美日本中文国产一区发布| 亚洲七黄色美女视频| 视频区图区小说| 久久午夜综合久久蜜桃| 国产精品久久久久成人av| 久久精品aⅴ一区二区三区四区| 亚洲精品中文字幕一二三四区 | 久久久久国产一级毛片高清牌| 夜夜骑夜夜射夜夜干| 一个人免费看片子| 国内毛片毛片毛片毛片毛片| 国产97色在线日韩免费| 超碰成人久久| 另类精品久久| 捣出白浆h1v1| 香蕉国产在线看| 久久综合国产亚洲精品| 亚洲欧美激情在线| 日韩欧美一区二区三区在线观看 | 久久久精品94久久精品| 久久久久国产精品人妻一区二区| 精品人妻熟女毛片av久久网站| 人人妻人人澡人人看| 精品卡一卡二卡四卡免费| 午夜影院在线不卡| 国产福利在线免费观看视频| 亚洲精品久久午夜乱码| 久久久国产欧美日韩av| 日韩视频一区二区在线观看| 一本色道久久久久久精品综合| 亚洲熟女毛片儿| 欧美激情 高清一区二区三区| 日本wwww免费看| 一本大道久久a久久精品| 巨乳人妻的诱惑在线观看| 啪啪无遮挡十八禁网站| 成人18禁高潮啪啪吃奶动态图| 国产亚洲一区二区精品| 午夜福利,免费看| 三级毛片av免费| 99久久综合免费| 午夜福利视频在线观看免费| 国产男女超爽视频在线观看| 亚洲国产av新网站| 五月天丁香电影| 99国产精品免费福利视频| 人人妻人人澡人人看| 看免费av毛片| 热re99久久精品国产66热6| 欧美变态另类bdsm刘玥| 男女免费视频国产| 国产区一区二久久| 亚洲中文日韩欧美视频| 飞空精品影院首页| 久久中文看片网| 国产欧美日韩一区二区精品| 少妇猛男粗大的猛烈进出视频| 伊人久久大香线蕉亚洲五| 在线精品无人区一区二区三| 久久精品久久久久久噜噜老黄| 中文字幕高清在线视频| 久久久国产欧美日韩av| 天堂中文最新版在线下载| 亚洲欧洲日产国产| 另类精品久久| 久久女婷五月综合色啪小说| 色婷婷av一区二区三区视频| 日韩免费高清中文字幕av| 日韩 欧美 亚洲 中文字幕| 最新的欧美精品一区二区| 99久久综合免费| 一区二区日韩欧美中文字幕| av片东京热男人的天堂| 国产精品久久久久久精品古装| 日韩欧美免费精品| 欧美少妇被猛烈插入视频| 亚洲成人免费av在线播放| 久久久久国内视频| 欧美乱码精品一区二区三区| 热99久久久久精品小说推荐| 香蕉国产在线看| 国产av国产精品国产| 日本欧美视频一区| 国产黄频视频在线观看| 人妻人人澡人人爽人人| 欧美变态另类bdsm刘玥| 久久久精品国产亚洲av高清涩受| 国产精品熟女久久久久浪| 久久天堂一区二区三区四区| 亚洲伊人久久精品综合| 精品福利观看| 成人免费观看视频高清| 女人精品久久久久毛片| 国产免费一区二区三区四区乱码| 亚洲精品中文字幕在线视频| 老汉色av国产亚洲站长工具| 欧美日韩一级在线毛片| 99国产精品99久久久久| videos熟女内射| 中文字幕另类日韩欧美亚洲嫩草| 十分钟在线观看高清视频www| 欧美日韩国产mv在线观看视频| 男女午夜视频在线观看| 亚洲av日韩在线播放| 久久久精品94久久精品| 女人被躁到高潮嗷嗷叫费观| 老司机影院毛片| svipshipincom国产片| 美女视频免费永久观看网站| 日韩视频一区二区在线观看| 国产成人啪精品午夜网站| 999久久久精品免费观看国产| 免费女性裸体啪啪无遮挡网站| 正在播放国产对白刺激| 亚洲精品一卡2卡三卡4卡5卡 | 国产精品九九99| 欧美黄色淫秽网站| 91大片在线观看| 国产老妇伦熟女老妇高清| 他把我摸到了高潮在线观看 | 电影成人av| 日本av手机在线免费观看| 午夜福利视频在线观看免费| 狠狠狠狠99中文字幕| 中文精品一卡2卡3卡4更新| 五月天丁香电影| h视频一区二区三区| 一区二区三区精品91| 一级毛片精品| 97在线人人人人妻| 免费观看av网站的网址| 成人三级做爰电影| 秋霞在线观看毛片| 成年人免费黄色播放视频| 亚洲国产av影院在线观看| 亚洲熟女毛片儿| 久久人妻福利社区极品人妻图片| 欧美大码av| 精品亚洲成国产av| 久久久国产成人免费| 亚洲自偷自拍图片 自拍| 十八禁网站网址无遮挡| 亚洲成国产人片在线观看| 黑人巨大精品欧美一区二区mp4| 黑丝袜美女国产一区| 亚洲国产欧美一区二区综合| 精品第一国产精品| 91成人精品电影| 大香蕉久久成人网| 99九九在线精品视频| 精品视频人人做人人爽| 国产一区二区三区av在线| 高清欧美精品videossex| 性高湖久久久久久久久免费观看| 成人影院久久| 国产精品国产av在线观看| 91麻豆av在线| 涩涩av久久男人的天堂| 大香蕉久久成人网| 国产亚洲精品一区二区www | 极品人妻少妇av视频| 亚洲精品成人av观看孕妇| 三级毛片av免费| 国产亚洲欧美精品永久| 天堂俺去俺来也www色官网| 亚洲人成77777在线视频| 亚洲avbb在线观看| 在线观看人妻少妇| 男人操女人黄网站| 午夜激情av网站| 国产精品自产拍在线观看55亚洲 | 午夜福利,免费看| 久久久精品94久久精品| 新久久久久国产一级毛片| 最黄视频免费看| 国产精品一区二区精品视频观看| 精品人妻熟女毛片av久久网站| 欧美另类亚洲清纯唯美| 丁香六月天网| 亚洲欧美成人综合另类久久久| 国产精品一二三区在线看| 日本a在线网址| 日本av手机在线免费观看| 亚洲第一av免费看| 午夜精品久久久久久毛片777| 一边摸一边做爽爽视频免费| 一个人免费在线观看的高清视频 | 丰满少妇做爰视频| 国产不卡av网站在线观看| 亚洲综合色网址| 日韩欧美国产一区二区入口| 久久性视频一级片| 不卡av一区二区三区| 老汉色av国产亚洲站长工具| 日本猛色少妇xxxxx猛交久久| 丁香六月天网| 别揉我奶头~嗯~啊~动态视频 | 国产精品av久久久久免费| 国产精品一区二区免费欧美 | 99久久精品国产亚洲精品| 动漫黄色视频在线观看| 欧美精品人与动牲交sv欧美| 两性午夜刺激爽爽歪歪视频在线观看 | 成人免费观看视频高清| av一本久久久久| 老熟女久久久| 精品熟女少妇八av免费久了| 亚洲精品国产av蜜桃| 性少妇av在线| 久久精品国产a三级三级三级| 国产精品秋霞免费鲁丝片| 精品国产超薄肉色丝袜足j| 汤姆久久久久久久影院中文字幕| 欧美 亚洲 国产 日韩一| 国产av精品麻豆| 久久精品国产综合久久久| 亚洲久久久国产精品| 高清在线国产一区| 欧美午夜高清在线| 欧美日韩亚洲国产一区二区在线观看 | 午夜免费成人在线视频| 久久久国产成人免费| 久久久久久久大尺度免费视频| 成人手机av| 动漫黄色视频在线观看| 亚洲一区二区三区欧美精品| 午夜激情av网站| 男女下面插进去视频免费观看| 国产免费视频播放在线视频| 1024香蕉在线观看| 大片电影免费在线观看免费| 人人妻,人人澡人人爽秒播| 日本av免费视频播放| 国产精品一区二区精品视频观看| 香蕉丝袜av| 国精品久久久久久国模美| 午夜免费观看性视频| 国产成人免费观看mmmm| 悠悠久久av| 黄片大片在线免费观看| 亚洲欧美日韩另类电影网站| 国产成人精品久久二区二区91| 欧美性长视频在线观看| 俄罗斯特黄特色一大片| 男男h啪啪无遮挡| 国产精品.久久久| 50天的宝宝边吃奶边哭怎么回事| 蜜桃在线观看..| 亚洲精品国产一区二区精华液| tube8黄色片| 国产成人欧美在线观看 | 18禁黄网站禁片午夜丰满| 丝袜在线中文字幕| 十八禁人妻一区二区| 亚洲国产精品成人久久小说| 免费女性裸体啪啪无遮挡网站| 色播在线永久视频| 女人久久www免费人成看片| 久久99热这里只频精品6学生| 欧美午夜高清在线| √禁漫天堂资源中文www| 国产xxxxx性猛交| 色婷婷av一区二区三区视频| 久久人人97超碰香蕉20202| 亚洲人成电影免费在线| 老汉色∧v一级毛片| 国产黄频视频在线观看| 欧美成人午夜精品| 亚洲精品日韩在线中文字幕| 亚洲精品成人av观看孕妇| 亚洲精品日韩在线中文字幕| 亚洲熟女毛片儿| 69精品国产乱码久久久| 国产欧美日韩一区二区三区在线| 亚洲国产av新网站| 亚洲成人免费av在线播放| 少妇的丰满在线观看| tube8黄色片| 亚洲美女黄色视频免费看| 欧美性长视频在线观看| 亚洲一码二码三码区别大吗| 女性被躁到高潮视频| 国产精品久久久久久人妻精品电影 | 在线观看免费日韩欧美大片| 蜜桃国产av成人99| 两性夫妻黄色片| 国产一级毛片在线| 午夜精品久久久久久毛片777| 国产欧美日韩一区二区三区在线| 亚洲国产av新网站| 啦啦啦免费观看视频1| 一级毛片电影观看| 在线永久观看黄色视频| 亚洲av电影在线观看一区二区三区| 久久天堂一区二区三区四区| 国产高清国产精品国产三级| 美女高潮喷水抽搐中文字幕| 国产成人av激情在线播放| 91精品三级在线观看| 啦啦啦在线免费观看视频4| 国产精品九九99| 精品国产国语对白av| 免费高清在线观看日韩| 王馨瑶露胸无遮挡在线观看| videosex国产| 夜夜骑夜夜射夜夜干| 最近最新免费中文字幕在线| 啦啦啦在线免费观看视频4| 99精国产麻豆久久婷婷| 在线 av 中文字幕| 纵有疾风起免费观看全集完整版| 777久久人妻少妇嫩草av网站|