• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的智能車輛換道行為決策*

    2021-02-02 08:13:32宋曉琳曹昊天李明俊易濱林
    汽車工程 2021年1期
    關(guān)鍵詞:車道駕駛員決策

    宋曉琳,盛 鑫,曹昊天,李明俊,易濱林,黃 智

    (湖南大學(xué),汽車車身先進(jìn)設(shè)計(jì)與制造國(guó)家重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)沙 410082)

    前言

    近年來(lái),智能車輛已成為車輛工程領(lǐng)域的研究熱點(diǎn)之一,具備自動(dòng)駕駛系統(tǒng)的智能車輛相比傳統(tǒng)車輛不僅更加安全、舒適,且有助于節(jié)約能源和降低污染物排放[1]。智能車輛自動(dòng)駕駛系統(tǒng)通常由感知模塊、行為決策模塊、規(guī)劃模塊和控制模塊等構(gòu)成,其中行為決策模塊是上層感知模塊和下層規(guī)劃控制模塊間的重要橋梁,基于感知信息決策車輛應(yīng)采取的行為,從而為下層規(guī)劃控制提供目標(biāo)引導(dǎo),起著承上啟下的關(guān)鍵作用,智能汽車換道行為決策是其中很重要的一種。

    現(xiàn)有智能車輛換道行為決策方法按照決策機(jī)理,可以分為非數(shù)據(jù)驅(qū)動(dòng)方法和數(shù)據(jù)驅(qū)動(dòng)方法兩大類。其中有限狀態(tài)機(jī)(finite state machine,F(xiàn)SM)、動(dòng)態(tài)博弈(dynamic game)等方法屬于非數(shù)據(jù)驅(qū)動(dòng)方法。例如冀杰等[2]將車輛行駛過(guò)程劃分為車道保持、跟馳、變道和緊急制動(dòng)4 種狀態(tài),構(gòu)建有限狀態(tài)機(jī)進(jìn)行換道行為決策。Kurt 等[3]將決策過(guò)程進(jìn)行層次劃分,構(gòu)造分層有限狀態(tài)機(jī)用于決策,以此簡(jiǎn)化狀態(tài)轉(zhuǎn)移規(guī)則來(lái)提高決策時(shí)的規(guī)則查詢效率。各類有限狀態(tài)機(jī)方法均需要人為劃分狀態(tài)并制定狀態(tài)轉(zhuǎn)移規(guī)則,因而存在規(guī)則完備性的固有問(wèn)題。有學(xué)者提出動(dòng)態(tài)博弈方法,在換道行為決策時(shí)考慮車輛間的持續(xù)交互作用。Wang 等[4]將換道行為決策問(wèn)題表述為微分博弈(differential game),假定自車和周邊車輛進(jìn)行非合作博弈,自車根據(jù)其他車輛的預(yù)期行為進(jìn)行換道行為決策。Yu等[5]將自車及周邊車輛視作斯塔克伯格博弈(Stackelberg game)參與者,估計(jì)周邊車輛的駕駛激進(jìn)度以確定其收益函數(shù),通過(guò)在線求解動(dòng)態(tài)博弈問(wèn)題來(lái)確定自車換道行為。動(dòng)態(tài)博弈方法求解平衡點(diǎn)的計(jì)算復(fù)雜度較高,在車載嵌入式計(jì)算平臺(tái)上的實(shí)時(shí)性往往難以滿足要求。

    數(shù)據(jù)驅(qū)動(dòng)方法主要包括模仿學(xué)習(xí)方法和強(qiáng)化學(xué)習(xí)方法等。模仿學(xué)習(xí)方法基于數(shù)據(jù)驅(qū)動(dòng),模仿專家駕駛員策略進(jìn)行決策。例如Bojarski 等[6]使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)基于車載視覺(jué)傳感器原始圖像信息進(jìn)行模仿學(xué)習(xí)決策控制,并在結(jié)構(gòu)化道路場(chǎng)景和非結(jié)構(gòu)化道路場(chǎng)景中進(jìn)行了測(cè)試。Codevilla 等[7]在此基礎(chǔ)上提出條件模仿學(xué)習(xí)方法,通過(guò)引入駕駛員指令來(lái)加速模仿學(xué)習(xí)并使駕駛員可在一定程度上干預(yù)決策以保障行車安全。Kuefler 等[8]則使用生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks,GAN)模仿專家駕駛員進(jìn)行決策,實(shí)驗(yàn)表明該方法能學(xué)習(xí)到諸如緊急狀況處置等高階策略。但模仿學(xué)習(xí)方法需要海量數(shù)據(jù)支持,存在模型訓(xùn)練成本較高、工作時(shí)無(wú)法根據(jù)環(huán)境變化在線調(diào)整優(yōu)化策略、難以適應(yīng)復(fù)雜多變的真實(shí)道路環(huán)境等不足。而強(qiáng)化學(xué)習(xí)可在與環(huán)境在線交互過(guò)程中學(xué)習(xí)得到優(yōu)化策略,因此,近幾年來(lái)強(qiáng)化學(xué)習(xí)在電子游戲[9]、機(jī)器人控制[10]和高級(jí)輔助駕駛系統(tǒng)[11]等領(lǐng)域取得一系列顯著成果,因而有學(xué)者將其應(yīng)用于智能車輛換道行為決策中。Mirchevska 等[12]使用深度Q 網(wǎng)絡(luò)(deep Q network,DQN)深度強(qiáng)化學(xué)習(xí)方法進(jìn)行智能車輛高速公路場(chǎng)景換道行為決策,仿真實(shí)驗(yàn)表明該方法決策性能優(yōu)于傳統(tǒng)基于復(fù)雜規(guī)則的方法。 Wang 等[13]采用連續(xù)的狀態(tài)空間和動(dòng)作空間,設(shè)計(jì)具有閉式貪婪策略的Q函數(shù)逼近器來(lái)提高深度Q 網(wǎng)絡(luò)的計(jì)算效率,從而更快地學(xué)習(xí)得到了平穩(wěn)有效的換道策略。然而,由于強(qiáng)化學(xué)習(xí)方法未利用先驗(yàn)知識(shí),僅通過(guò)主動(dòng)策略探索尋找優(yōu)化策略,因而策略學(xué)習(xí)效率偏低,處理復(fù)雜問(wèn)題顯得能力不足,制約了其在智能車輛換道行為決策領(lǐng)域的應(yīng)用。

    針對(duì)強(qiáng)化學(xué)習(xí)方法策略學(xué)習(xí)效率偏低的問(wèn)題,本文中將模仿學(xué)習(xí)引入強(qiáng)化學(xué)習(xí),采用模仿學(xué)習(xí)從專家駕駛員示范數(shù)據(jù)中學(xué)習(xí)其宏觀決策經(jīng)驗(yàn),換道行為決策時(shí)依據(jù)學(xué)習(xí)得到的專家駕駛員經(jīng)驗(yàn)確定所需求解的換道行為決策子問(wèn)題,構(gòu)造多個(gè)強(qiáng)化學(xué)習(xí)模塊分治處理不同的換道行為決策子問(wèn)題,以此縮減強(qiáng)化學(xué)習(xí)所需求解問(wèn)題的規(guī)模,降低優(yōu)化策略學(xué)習(xí)難度,提高策略學(xué)習(xí)速度,從而使其比單純強(qiáng)化學(xué)習(xí)方法能夠處理更為復(fù)雜的智能車輛換道行為決策問(wèn)題。

    1 整體框架

    本文中設(shè)計(jì)的智能車輛換道行為決策方法分為宏觀決策和細(xì)化決策兩層,如圖1 所示。其中,每一換道行為決策周期t 所需輸入信息It包括通過(guò)車輛總線獲取的自車信息、通過(guò)感知融合獲取的周邊車輛信息和通過(guò)高精地圖獲取的道路信息。宏觀決策模塊使用模仿學(xué)習(xí)構(gòu)建的極端梯度提升(extreme gradient boosting,XGBoost)模型,將It輸入XGBoost模型的K 個(gè)基學(xué)習(xí)器CART 中,求和各基學(xué)習(xí)器輸出s并通過(guò)Softmax變換得到宏觀決策指令概率向量St,再依據(jù)St從車道保持、左換道、右換道中選擇宏觀決策指令Ct,縮減所需求解的換道行為決策問(wèn)題規(guī)模。細(xì)化決策模塊的3 個(gè)確定性策略梯度(deep deterministic policy gradient,DDPG)深度強(qiáng)化學(xué)習(xí)子模塊DDPG_LK、DDPG_LLC 和DDPG_RLC 分別負(fù)責(zé)求解車道保持、左換道和右換道行為決策子問(wèn)題,根據(jù)宏觀決策指令Ct調(diào)用相應(yīng)子模塊,利用強(qiáng)化學(xué)習(xí)得到的優(yōu)化換道行為決策策略,確定自車運(yùn)動(dòng)目標(biāo)位置Pt,輸出給下層模塊后進(jìn)入下一行為決策周期。

    圖1 行為決策方法整體框架

    2 輸入信息

    由于車輛行駛時(shí)與周邊車輛及道路均存在交互作用,因而換道行為決策時(shí)需要綜合考慮自車運(yùn)動(dòng)狀態(tài)、周邊車輛運(yùn)動(dòng)狀態(tài)及車道可通行性。圖2 中carh 表示自車,自車的前方、后方、左前方、左后方、右前方、右后方6 個(gè)區(qū)域中最鄰近周邊車輛按順時(shí)針?lè)较驑?biāo)記為car1~car6。

    圖2 自車與周邊車輛標(biāo)識(shí)

    換道行為決策輸入信息如下。

    (1)自車當(dāng)前時(shí)刻t運(yùn)動(dòng)狀態(tài)信息Sh,t:包括自車車速vh,t和縱向加速度ah,t。

    (2)周邊車輛當(dāng)前時(shí)刻t 運(yùn)動(dòng)狀態(tài)信息Si,t(i =1,2,…,6):包括與自車間縱向距離dyi,t、橫向距離dxi,t和相對(duì)車速rvi,t。若某區(qū)域無(wú)周邊車輛(如圖2 中左前區(qū)域),則將距離設(shè)為∞,相對(duì)車速設(shè)為0。

    (3)車道通行性信息Ir,t:由左側(cè)車道標(biāo)記和右側(cè)車道標(biāo)記flagl,t和flagr,t組成,記錄自車相鄰車道可通行狀況,可供通行標(biāo)記為1,不可供通行(如對(duì)向車道、非機(jī)動(dòng)車道、路沿)標(biāo)記為0。

    最終,輸入信息可用It表示為

    3 宏觀決策模塊

    本文中基于專家駕駛員宏觀決策示范樣本,構(gòu)造XGBoost模型[14]模仿專家駕駛員選擇宏觀決策指令,選用分類回歸樹(classification and regression tree,CART)作為基學(xué)習(xí)器。模仿學(xué)習(xí)目標(biāo)函數(shù)O(θ)定義為

    單個(gè)基學(xué)習(xí)器Tk的模型復(fù)雜度定義為

    式中:m 為基學(xué)習(xí)器Tk的葉子節(jié)點(diǎn)數(shù)為節(jié)點(diǎn)權(quán)值的L2范數(shù);權(quán)重系數(shù)γ、λ均取1。

    圖3 XGBoost模型構(gòu)建過(guò)程

    XGBoost 通過(guò)集成一系列學(xué)習(xí)能力較弱的基學(xué)習(xí)器來(lái)獲得較好的性能,模型構(gòu)建過(guò)程如圖3 所示?;趯<荫{駛員宏觀決策示范樣本,不斷訓(xùn)練CART基學(xué)習(xí)器擬合先前模型殘差并集成入XGBoost 模型中,不斷迭代直到訓(xùn)練預(yù)設(shè)數(shù)量基學(xué)習(xí)器或模型殘差小于設(shè)定閾值。訓(xùn)練第k 個(gè)基學(xué)習(xí)器Tk時(shí)的學(xué)習(xí)目標(biāo)函數(shù)為

    式中:θk為Tk的參數(shù);Ω(Tk)為Tk的模型復(fù)雜度;yi-為前一輪迭代的模型殘差為Tk的輸出;學(xué)習(xí)率ε取值范圍(0,1)。

    如圖1所示,換道行為決策時(shí)輸入信息It傳入宏觀決策模塊XGBoost 模型各基學(xué)習(xí)器,將各基學(xué)習(xí)器的輸出向量s 求和后,利用Softmax 函數(shù)即可得到宏 觀 決 策 指 令 概 率 向 量St=(p1,p2,p3),其 中p1,p2和p3分別是宏觀決策指令應(yīng)為車道保持、左換道和右換道的概率。選擇概率向量St中最大概率值對(duì)應(yīng)的宏觀決策指令Ct輸出,據(jù)此確定所需求解的換道行為決策子問(wèn)題是車道保持、左換道還是右換道。

    4 細(xì)化決策模塊

    4.1 馬爾可夫決策過(guò)程定義

    假定各換道行為決策子問(wèn)題均滿足馬爾可夫性,將其構(gòu)造為無(wú)模型馬爾可夫決策過(guò)程(Markov decision process,MDP),表示為MDP(S,A,R,γ)。S為觀測(cè)狀態(tài)空間;s ∈S 為觀測(cè)狀態(tài)即輸入信息It;決策動(dòng)作空間A 為圖4 所示目標(biāo)車道中心線上的運(yùn)動(dòng)可達(dá)域,即自車本決策周期在車輛運(yùn)動(dòng)學(xué)約束下所能到達(dá)位置的集合;決策動(dòng)作a ∈A,即自車本決策周期運(yùn)動(dòng)目標(biāo)位置Pt;獎(jiǎng)勵(lì)R 表征環(huán)境對(duì)自車換道行為決策的反饋;γ ∈(0,1]為折扣系數(shù),體現(xiàn)對(duì)短期獎(jiǎng)勵(lì)相比長(zhǎng)期獎(jiǎng)勵(lì)的重視程度。

    圖4 運(yùn)動(dòng)可達(dá)域及運(yùn)動(dòng)目標(biāo)位置

    求解換道行為決策子問(wèn)題即是尋找使該馬爾可夫決策過(guò)程在無(wú)窮時(shí)域期望獎(jiǎng)勵(lì)值最大化的優(yōu)化策略πopt:S →A

    式中:t為決策時(shí)刻;k為決策時(shí)間步;Rt+k為第k時(shí)間步的獎(jiǎng)勵(lì)值;E[]為求數(shù)學(xué)期望。

    4.2 DDPG深度強(qiáng)化學(xué)習(xí)

    各子模塊使用DDPG 深度強(qiáng)化學(xué)習(xí)方法[15]學(xué)習(xí)換道行為決策子問(wèn)題的優(yōu)化策略。利用具備強(qiáng)大非線性擬合能力的深度神經(jīng)網(wǎng)絡(luò)構(gòu)造表征策略函數(shù)μ(s|θμ)的演員網(wǎng)絡(luò)和表征動(dòng)作價(jià)值評(píng)估函數(shù)Q(s,a|θQ)的評(píng)論家網(wǎng)絡(luò)。通過(guò)經(jīng)驗(yàn)回放[16]打破經(jīng)歷樣本間時(shí)序相關(guān)性,同時(shí)采用類似DQN 的獨(dú)立目標(biāo)網(wǎng)絡(luò)機(jī)制[17]來(lái)提高策略學(xué)習(xí)收斂性,DDPG 由主演員網(wǎng)絡(luò)θμ、目標(biāo)演員網(wǎng)絡(luò)θμ,ta、主評(píng)論家網(wǎng)絡(luò)θQ和目標(biāo)評(píng)論家網(wǎng)絡(luò)θQ,ta4部分構(gòu)成。

    如圖1 所示,換道行為決策時(shí)細(xì)化決策模塊根據(jù)宏觀決策模塊輸出的宏觀決策指令Ct,調(diào)用相應(yīng)DDPG子模塊的主演員網(wǎng)絡(luò),根據(jù)輸入信息It確定自車本決策周期運(yùn)動(dòng)目標(biāo)位置Pt,下發(fā)執(zhí)行后將經(jīng)歷(It,Pt,It+1,Rt,Et)存入經(jīng)驗(yàn)回放庫(kù)中,其中It對(duì)應(yīng)觀測(cè)狀態(tài)s,Pt對(duì)應(yīng)決策動(dòng)作a,It+1對(duì)應(yīng)決策動(dòng)作執(zhí)行后更新的觀測(cè)狀態(tài)s",Rt為獎(jiǎng)勵(lì)值,Et記錄是否滿足終止條件。定期從經(jīng)驗(yàn)回放庫(kù)中隨機(jī)采樣經(jīng)歷樣本,訓(xùn)練DDPG的主評(píng)論家網(wǎng)絡(luò)和主演員網(wǎng)絡(luò)。

    訓(xùn)練主評(píng)論家網(wǎng)絡(luò)以更加準(zhǔn)確地評(píng)估動(dòng)作價(jià)值,主評(píng)論家網(wǎng)絡(luò)學(xué)習(xí)損失函數(shù)定義為

    其中

    式中:n 為批采樣經(jīng)歷樣本數(shù);Ri為經(jīng)歷樣本i 獎(jiǎng)勵(lì)值;Q(si,ai|θQ)為使用主評(píng)論家網(wǎng)絡(luò)估計(jì)的動(dòng)作價(jià)值;Qta(s"i,μta(s"i|θμ,ta)|θQ,ta)為使用目標(biāo)演員網(wǎng)絡(luò)和目標(biāo)評(píng)論家網(wǎng)絡(luò)估計(jì)的未來(lái)動(dòng)作價(jià)值。根據(jù)式(6)計(jì)算損失值,使用Adam 優(yōu)化器按設(shè)定的學(xué)習(xí)率αQ更新網(wǎng)絡(luò)參數(shù)。

    訓(xùn)練主演員網(wǎng)絡(luò)以優(yōu)化換道行為決策策略,根據(jù)式(8)計(jì)算采樣策略梯度值,使用Adam 優(yōu)化器按設(shè)定的學(xué)習(xí)率αμ更新網(wǎng)絡(luò)參數(shù):

    式中μ(s|θμ)為確定性策略。

    目標(biāo)演員網(wǎng)絡(luò)和目標(biāo)評(píng)論家網(wǎng)絡(luò)無(wú)需訓(xùn)練,通過(guò)式(9)和式(10)所示更新方式使其網(wǎng)絡(luò)參數(shù)緩慢逼近對(duì)應(yīng)主網(wǎng)絡(luò):

    式中τ為目標(biāo)網(wǎng)絡(luò)參數(shù)更新率,0 <τ ?1。

    4.3 獎(jiǎng)勵(lì)函數(shù)設(shè)置

    強(qiáng)化學(xué)習(xí)在獎(jiǎng)勵(lì)值引導(dǎo)下進(jìn)行優(yōu)化策略探索學(xué)習(xí),因而獎(jiǎng)勵(lì)函數(shù)設(shè)置十分關(guān)鍵。為使換道行為決策策略兼顧安全性、通行效率及乘坐舒適性,各子模塊獎(jiǎng)勵(lì)函數(shù)需包含如下3部分內(nèi)容。

    (1)安全性獎(jiǎng)勵(lì)函數(shù):車輛行駛過(guò)程中,需與前后車輛間保持安全車距,安全性獎(jiǎng)勵(lì)函數(shù)可表示為

    式中:Thf為自車與最近前車間的車頭時(shí)距值;Thr為自車與最近后車間的車頭時(shí)距值;Thb為車頭時(shí)距閾值,Thb設(shè)定為4 s[18]。

    (2)通行效率獎(jiǎng)勵(lì)函數(shù):車輛在保證安全前提下,應(yīng)盡可能以較高車速行駛,設(shè)置通行效率獎(jiǎng)勵(lì)函數(shù)為

    式中:vh,t為自車當(dāng)前車速;vl為當(dāng)前路段限速;vf為當(dāng)前路段車流速度。

    (3)乘坐舒適性懲罰函數(shù):車輛行駛過(guò)程中應(yīng)避免頻繁變速換道,以保證乘客乘坐舒適性,乘坐舒適性懲罰函數(shù)表示為

    其中

    式中:pa為急加減速懲罰項(xiàng);plc為換道懲罰項(xiàng)。

    則各子模塊的復(fù)合獎(jiǎng)勵(lì)函數(shù)表示為

    式中:ws、wv和wc為各項(xiàng)權(quán)重系數(shù),調(diào)參確定的最佳權(quán)重系數(shù)取值為(0.9,0.8,0.4),歸一化操作Normal用來(lái)將復(fù)合獎(jiǎng)勵(lì)函數(shù)取值范圍變換到[0,1]區(qū)間。

    5 實(shí)驗(yàn)與分析

    5.1 專家駕駛員宏觀決策示范樣本采集

    本文中使用圖5 所示駕駛模擬器采集專家駕駛員宏觀決策示范樣本。其中虛擬駕駛環(huán)境為4.2 km 長(zhǎng)的環(huán)形三車道高速公路,設(shè)置一輛可控自車和若干輛由自動(dòng)駕駛模型[19]控制的環(huán)境車輛,各車輛均基于簡(jiǎn)化車輛運(yùn)動(dòng)學(xué)模型[20],道路全段限速90 km/h。

    圖5 駕駛模擬器及虛擬駕駛環(huán)境

    由于不同駕駛員駕駛經(jīng)驗(yàn)不同,因而宏觀決策行為傾向性不同,為避免決策二義性問(wèn)題,僅采集1名專家駕駛員的宏觀決策示范樣本。共進(jìn)行10 輪模擬駕駛實(shí)驗(yàn),每輪需駕駛自車在虛擬駕駛環(huán)境道路上行駛5 圈,以5 Hz 采樣頻率同步記錄自車與環(huán)境車輛的狀態(tài)、道路信息和駕駛員操縱輸入。為避免疲勞駕駛,兩輪實(shí)驗(yàn)間隔時(shí)間均大于15 min。

    剔除駕駛員出現(xiàn)失誤或違規(guī)的數(shù)據(jù)后獲得約2.5 h 的原始數(shù)據(jù)。使用寬度為5 s、重疊量為2 s 的移動(dòng)窗口從原始數(shù)據(jù)中提取樣本:提取窗口起點(diǎn)時(shí)刻自車與周邊車輛的運(yùn)動(dòng)狀態(tài)信息和道路通行性信息,作為樣本特征值;通過(guò)窗口范圍內(nèi)自車橫向位置的極差判斷駕駛員是否采取換道,將此宏觀決策行為作為樣本對(duì)應(yīng)標(biāo)簽值。提取得到3 020 組專家駕駛員宏觀決策示范樣本,其中車道保持1 328 組,左換道873組,右換道819組。

    5.2 宏觀決策模塊訓(xùn)練

    為保障專家駕駛員宏觀決策示范樣本類別平衡,對(duì)車道保持類別樣本進(jìn)行下采樣隨機(jī)保留850組。網(wǎng)格調(diào)參確定的最佳XGBoost 模型訓(xùn)練參數(shù)設(shè)置如表1 所示。通過(guò)十折交叉驗(yàn)證評(píng)估模型性能,XGBoost 模型平均測(cè)試集分類準(zhǔn)確率為91.46%,歸一化混淆矩陣如圖6 所示,算得kappa 系數(shù)值為0.87,表明構(gòu)建的XGBoost 模型可以較好模仿專家駕駛員進(jìn)行宏觀行為決策。

    使用專家駕駛員所有宏觀決策示范樣本訓(xùn)練得到最終XGBoost 模型。XGBoost 模型相比神經(jīng)網(wǎng)絡(luò)等黑箱模型的顯著優(yōu)勢(shì)是其內(nèi)在決策機(jī)理可知,因而安全性更高且易于迭代優(yōu)化??梢酝ㄟ^(guò)統(tǒng)計(jì)XGBoost 模型中基于各學(xué)習(xí)特征組分裂的節(jié)點(diǎn)數(shù)目占比來(lái)獲知其內(nèi)在決策機(jī)理,如圖7所示。由圖7可看出,基于主車前方周邊車輛car1~car3 的運(yùn)動(dòng)狀態(tài)S1,t、S2,t、S3,t以及道路通行性信息Ir,t分裂的節(jié)點(diǎn)占比較高,對(duì)模型輸出影響較顯著,表明XGBoost 模型主要基于主車前方車輛的運(yùn)動(dòng)狀態(tài)及道路通行性狀況進(jìn)行宏觀決策。

    表1 XGBoost訓(xùn)練參數(shù)設(shè)置

    圖6 歸一化混淆矩陣

    圖7 分裂節(jié)點(diǎn)數(shù)目占比統(tǒng)計(jì)

    5.3 細(xì)化決策模塊訓(xùn)練

    由于本文中著重研究換道行為決策,因而對(duì)下層模塊進(jìn)行簡(jiǎn)化處理:采用基于五次多項(xiàng)式的軌跡規(guī)劃方法[21],并假定控制模塊能使自車?yán)硐氲馗櫮繕?biāo)軌跡行駛。

    細(xì)化決策模塊各DDPG 子模塊網(wǎng)絡(luò)結(jié)構(gòu)如表2所示,訓(xùn)練參數(shù)設(shè)置如表3所示。通過(guò)與圖5虛擬駕駛環(huán)境在線交互來(lái)訓(xùn)練各DDPG 子模塊,每當(dāng)自車行駛一圈或與環(huán)境車輛發(fā)生碰撞時(shí)終止當(dāng)前訓(xùn)練輪次,重新隨機(jī)初始化虛擬駕駛環(huán)境后開始新的訓(xùn)練輪次,直到完成設(shè)定輪次訓(xùn)練。

    平滑處理后的訓(xùn)練過(guò)程中單步平均獎(jiǎng)勵(lì)值變化曲線如圖8 所示,可看出經(jīng)過(guò)約1 600 輪次訓(xùn)練后獎(jiǎng)勵(lì)值逐漸穩(wěn)定在高位,策略學(xué)習(xí)收斂。由式(16)可知單步獎(jiǎng)勵(lì)理論最大值為1,但由于多數(shù)情況下自車需要在安全、通行效率和乘坐舒適性間平衡取舍,因而平均值必然小于1,圖8中終端單步平均獎(jiǎng)勵(lì)值約為0.85,已較為逼近實(shí)際可達(dá)最優(yōu)值。

    表2 DDPG網(wǎng)絡(luò)結(jié)構(gòu)

    表3 DDPG訓(xùn)練參數(shù)設(shè)置

    圖8 單步平均獎(jiǎng)勵(lì)值變化曲線

    5.4 測(cè)試比對(duì)

    參與測(cè)試比對(duì)的換道行為決策方法如下。

    (1)D_FSM:文獻(xiàn)[19]提出的有限狀態(tài)機(jī)方法。

    (2)D_IL:基于多層感知機(jī)(multi?layer percep?tron,MLP)的行為克隆模仿學(xué)習(xí)方法,使用模擬駕駛實(shí)驗(yàn)采集的數(shù)據(jù)訓(xùn)練。

    (3)D_RL:?jiǎn)渭儚?qiáng)化學(xué)習(xí)方法,網(wǎng)絡(luò)結(jié)構(gòu)及獎(jiǎng)勵(lì)函數(shù)設(shè)置與本文細(xì)化決策子模塊相同。

    (4)D_IRL:本文中設(shè)計(jì)的模仿強(qiáng)化學(xué)習(xí)方法。

    首先比對(duì)D_IRL 與D_RL 的策略學(xué)習(xí)速度。為消除隨機(jī)因素影響,兩者使用相同訓(xùn)練參數(shù)設(shè)置分別進(jìn)行5 次訓(xùn)練,結(jié)果如圖9 所示。由圖9 可知,D_IRL 的平均終端獎(jiǎng)勵(lì)值相比D_RL 占優(yōu),且D_IRL平均策略學(xué)習(xí)收斂所需訓(xùn)練輪次數(shù)比D_RL 降低約32%,表明本文基于宏觀決策指令縮減待求解換道行為決策問(wèn)題規(guī)模的機(jī)制,有效降低了優(yōu)化策略求解難度,顯著提升了策略學(xué)習(xí)速度。

    圖9 策略學(xué)習(xí)速度對(duì)比

    采用上述4 種方法分別控制虛擬駕駛環(huán)境中自車進(jìn)行100 輪隨機(jī)初始化的自動(dòng)駕駛測(cè)試,以評(píng)估本文方法與各基線方法的換道行為決策策略綜合性能,每輪行駛里程為1圈,結(jié)果如表4所示。

    表4 自動(dòng)駕駛測(cè)試統(tǒng)計(jì)結(jié)果

    由表4可知如下結(jié)果。

    (1)在安全性方面,D_IRL、D_RL和D_FSM 方法在測(cè)試中主車均未發(fā)生碰撞事件,而D_IL 有3 次碰撞記錄,這可能是由于行為克隆模仿學(xué)習(xí)方法無(wú)法依據(jù)環(huán)境變化在線調(diào)整策略,遇到訓(xùn)練樣本覆蓋范圍外的情形策略失效造成的,由此可見(jiàn)D_IRL 策略的安全性優(yōu)于D_IL。

    (2)在通行效率方面,D_IRL 策略的表現(xiàn)較優(yōu),測(cè)試中主車平均車速相比D_FSM 提升5.7%,相比D_RL提升0.6%,與D_IL基本持平。

    (3)在乘坐舒適性方面,D_IRL 方法測(cè)試中主車車速標(biāo)準(zhǔn)差相比D_FSM 降低45.6%,相比D_IL降低3.4%,相比D_RL 降低13.8%,表明D_IRL 策略較少采取急加減速動(dòng)作,乘坐舒適性較優(yōu)。D_IRL 方法測(cè)試中主車平均單輪換道次數(shù)少于D_IL 和D_RL,減少了換道時(shí)橫向加速度變化對(duì)乘坐舒適性的影響;D_IRL 方法測(cè)試中主車平均單輪換道次數(shù)高于D_FSM,這是因?yàn)镈_FSM 基于規(guī)則的策略偏于保守,謹(jǐn)慎采取換道而比較容易引發(fā)緊急制動(dòng),而D_IRL 的策略則更加積極主動(dòng),通過(guò)更主動(dòng)采取安全換道行為來(lái)提升通行效率,并通過(guò)規(guī)避部分不必要的緊急制動(dòng)來(lái)提高乘坐舒適性,這一點(diǎn)在兩者平均車速及車速標(biāo)準(zhǔn)差的對(duì)比中也可以得到體現(xiàn)。

    綜上所述,本文中設(shè)計(jì)的D_IRL 方法學(xué)習(xí)得到的換道行為決策策略的綜合性能優(yōu)于其他3 種基線方法,在安全性、通行效率和乘坐舒適性間取得了良好平衡。

    5.5 場(chǎng)景測(cè)試

    為了更直觀地展現(xiàn)本文方法換道行為決策策略的性能,基于自動(dòng)駕駛仿真軟件Prescan 搭建兩個(gè)典型場(chǎng)景進(jìn)行換道行為決策測(cè)試。場(chǎng)景中主車的換道行為決策模塊采用本文方法,環(huán)境車輛的運(yùn)動(dòng)由文獻(xiàn)[19]的自動(dòng)駕駛模型控制。兩場(chǎng)景測(cè)試過(guò)程中的鳥瞰視角關(guān)鍵幀如圖10 所示,圖中主車為用紅框標(biāo)記的綠色車,各關(guān)鍵幀車輛實(shí)時(shí)速度也標(biāo)注在圖中,測(cè)試道路長(zhǎng)度均為200 m。

    由圖10(a)可見(jiàn):場(chǎng)景1中主車前后及兩側(cè)相鄰車道均有環(huán)境車輛,且主車通行嚴(yán)重受制于前方白色車輛,主車換道行為決策模塊根據(jù)輸入信息,判定應(yīng)采取左換道以獲得更好的通行效率;主車安全換到左側(cè)車道后,前向運(yùn)動(dòng)空間充足,平緩加速至目標(biāo)車速行駛。

    由圖10(b)可見(jiàn):場(chǎng)景2中位于主車同車道前方的紅色車輛在開始階段忽然制動(dòng)減速,由于主車兩側(cè)相鄰車道均有環(huán)境車輛且距離較近,主車換道行為決策模塊根據(jù)輸入信息,判定應(yīng)采取減速?gòu)亩苊馀c前車發(fā)生碰撞;待前車開始提速后,主車調(diào)整車速繼續(xù)車道保持,以安全距離跟馳前車行駛。

    由以上兩個(gè)典型場(chǎng)景的測(cè)試結(jié)果可看出,采用本文方法學(xué)習(xí)得到的換道策略可以較好地應(yīng)對(duì)主動(dòng)換道、前方車輛急減速等情況,具備良好的工程應(yīng)用前景。

    圖10 典型場(chǎng)景換道行為決策測(cè)試

    6 結(jié)論

    本文中設(shè)計(jì)了一種基于模仿強(qiáng)化學(xué)習(xí)的智能車輛換道行為決策方法,其中宏觀決策模塊XGBoost模型模仿專家駕駛員選擇宏觀決策指令,確定所需求解的行為決策子問(wèn)題,在此基礎(chǔ)上,使用細(xì)化決策模塊對(duì)應(yīng)DDPG 子模塊強(qiáng)化學(xué)習(xí)得到的優(yōu)化策略,確定車輛運(yùn)動(dòng)目標(biāo)位置并作為行為決策結(jié)果下發(fā)執(zhí)行。仿真結(jié)果表明,本文方法相比單純強(qiáng)化學(xué)習(xí)方法在策略學(xué)習(xí)速度上有顯著提升,且換道行為決策策略的綜合性能優(yōu)于有限狀態(tài)機(jī)等現(xiàn)有方法。

    本文研究中假定換道行為決策輸入信息是準(zhǔn)確無(wú)誤的,實(shí)際情況中受車載傳感器等因素影響,輸入信息可能是不準(zhǔn)確或不完整的。后續(xù)研究將考慮輸入信息的缺失及噪聲問(wèn)題,以提高換道行為決策方法的魯棒性。另外,如何在實(shí)車平臺(tái)上應(yīng)用本文中設(shè)計(jì)的換道行為決策方法也將是后續(xù)研究的重點(diǎn)內(nèi)容。

    猜你喜歡
    車道駕駛員決策
    基于高速公路的駕駛員換道意圖識(shí)別
    駕駛員安全帶識(shí)別方法綜述
    北斗+手機(jī)實(shí)現(xiàn)車道級(jí)導(dǎo)航應(yīng)用
    為可持續(xù)決策提供依據(jù)
    避免跟車闖紅燈的地面車道線
    淺談MTC車道改造
    決策為什么失誤了
    起步前環(huán)顧四周是車輛駕駛員的義務(wù)
    公民與法治(2016年4期)2016-05-17 04:09:26
    低速ETC/MTC混合式收費(fèi)車道的設(shè)計(jì)與實(shí)現(xiàn)
    關(guān)于抗美援朝出兵決策的幾點(diǎn)認(rèn)識(shí)
    軍事歷史(1997年5期)1997-08-21 02:36:06
    桃花免费在线播放| 国产亚洲精品久久久com| 熟女人妻精品中文字幕| 极品教师在线视频| 人妻一区二区av| 日本黄大片高清| 国产一区二区在线观看av| 亚洲av电影在线观看一区二区三区| 女性被躁到高潮视频| 国产91av在线免费观看| 另类亚洲欧美激情| 国产黄色免费在线视频| 又粗又硬又长又爽又黄的视频| 精品国产国语对白av| 亚洲精品中文字幕在线视频 | 午夜免费观看性视频| 国产伦理片在线播放av一区| 日本免费在线观看一区| 久久99蜜桃精品久久| xxx大片免费视频| 中文字幕av电影在线播放| 日韩一区二区三区影片| 国产成人一区二区在线| 日本av免费视频播放| 多毛熟女@视频| 精品久久久精品久久久| 国产精品麻豆人妻色哟哟久久| 性高湖久久久久久久久免费观看| 日韩不卡一区二区三区视频在线| 精品少妇内射三级| 97在线人人人人妻| 99精国产麻豆久久婷婷| 爱豆传媒免费全集在线观看| 下体分泌物呈黄色| 80岁老熟妇乱子伦牲交| 日产精品乱码卡一卡2卡三| √禁漫天堂资源中文www| 亚洲四区av| 新久久久久国产一级毛片| 一个人看视频在线观看www免费| 亚洲av国产av综合av卡| 国产精品女同一区二区软件| 欧美3d第一页| 免费大片黄手机在线观看| 亚洲熟女精品中文字幕| 久久国产亚洲av麻豆专区| 美女视频免费永久观看网站| 大香蕉久久网| 日本vs欧美在线观看视频 | 久久人妻熟女aⅴ| 亚洲伊人久久精品综合| 高清欧美精品videossex| 十八禁高潮呻吟视频 | 色婷婷久久久亚洲欧美| 精品一品国产午夜福利视频| 亚洲精品日韩在线中文字幕| 国产精品欧美亚洲77777| 老司机影院成人| 久久久a久久爽久久v久久| 黑丝袜美女国产一区| 亚洲美女视频黄频| 卡戴珊不雅视频在线播放| 国产精品久久久久久久久免| 国产黄片美女视频| 18禁裸乳无遮挡动漫免费视频| 亚洲精品国产av成人精品| 亚洲精品一区蜜桃| 99视频精品全部免费 在线| 亚洲怡红院男人天堂| 在线观看免费高清a一片| 欧美3d第一页| 色94色欧美一区二区| 亚洲av成人精品一二三区| 99久久综合免费| 亚洲精品国产av蜜桃| 人妻制服诱惑在线中文字幕| 美女国产视频在线观看| 国产老妇伦熟女老妇高清| 亚洲av成人精品一区久久| 你懂的网址亚洲精品在线观看| 成人国产av品久久久| 99久久精品国产国产毛片| 在线观看一区二区三区激情| 天天操日日干夜夜撸| 国产成人精品婷婷| 久久精品国产亚洲网站| 日韩,欧美,国产一区二区三区| 成人黄色视频免费在线看| 校园人妻丝袜中文字幕| 亚洲国产欧美日韩在线播放 | 午夜福利影视在线免费观看| 一级毛片aaaaaa免费看小| 纵有疾风起免费观看全集完整版| 久久ye,这里只有精品| 99热全是精品| 大香蕉久久网| 欧美精品国产亚洲| 国产乱来视频区| 日日摸夜夜添夜夜添av毛片| 国产欧美日韩综合在线一区二区 | kizo精华| 欧美bdsm另类| 国产亚洲精品久久久com| 大又大粗又爽又黄少妇毛片口| 两个人的视频大全免费| 天美传媒精品一区二区| 新久久久久国产一级毛片| 精品熟女少妇av免费看| 国产视频首页在线观看| 欧美日韩亚洲高清精品| 你懂的网址亚洲精品在线观看| 国产精品人妻久久久影院| 色婷婷久久久亚洲欧美| 国产毛片在线视频| 日日撸夜夜添| 国产精品99久久99久久久不卡 | 天天躁夜夜躁狠狠久久av| 久久久精品94久久精品| 亚洲精品国产av蜜桃| 久久久久久久久久人人人人人人| 大码成人一级视频| 在线免费观看不下载黄p国产| 18+在线观看网站| 在线观看免费日韩欧美大片 | 国产一级毛片在线| 五月开心婷婷网| 极品人妻少妇av视频| 最后的刺客免费高清国语| 亚洲国产毛片av蜜桃av| 日韩av在线免费看完整版不卡| 偷拍熟女少妇极品色| 国产精品久久久久久精品古装| 成年人免费黄色播放视频 | 国产亚洲一区二区精品| 免费av不卡在线播放| 中国三级夫妇交换| 国产乱来视频区| 亚洲国产日韩一区二区| 久久久久视频综合| 麻豆乱淫一区二区| 久久久国产精品麻豆| 日日撸夜夜添| 国产精品一二三区在线看| 国产成人精品福利久久| 自拍欧美九色日韩亚洲蝌蚪91 | 少妇被粗大猛烈的视频| 成年人午夜在线观看视频| 日韩一区二区视频免费看| av不卡在线播放| 国产精品麻豆人妻色哟哟久久| 久久久亚洲精品成人影院| 成人漫画全彩无遮挡| 香蕉精品网在线| 欧美最新免费一区二区三区| 多毛熟女@视频| 一级av片app| 国产精品一区二区三区四区免费观看| xxx大片免费视频| 久久人人爽人人片av| 精品人妻熟女毛片av久久网站| 精品一区二区免费观看| 国产视频内射| 在线天堂最新版资源| 精品久久国产蜜桃| 国产91av在线免费观看| 男女啪啪激烈高潮av片| av卡一久久| 在线观看一区二区三区激情| 欧美日韩精品成人综合77777| 成人无遮挡网站| 成人综合一区亚洲| 少妇丰满av| 免费观看的影片在线观看| a级一级毛片免费在线观看| 中文欧美无线码| 亚洲高清免费不卡视频| 国产又色又爽无遮挡免| 女人精品久久久久毛片| 色视频www国产| 女人久久www免费人成看片| 精品午夜福利在线看| 丰满饥渴人妻一区二区三| 黄色日韩在线| 欧美国产精品一级二级三级 | av又黄又爽大尺度在线免费看| 狂野欧美激情性bbbbbb| 女人久久www免费人成看片| 国产男人的电影天堂91| 特大巨黑吊av在线直播| 91午夜精品亚洲一区二区三区| 一级毛片久久久久久久久女| 99热这里只有是精品50| 久久久久精品久久久久真实原创| 国产成人aa在线观看| 人妻制服诱惑在线中文字幕| 男女国产视频网站| 精品亚洲成a人片在线观看| 久久热精品热| 一级a做视频免费观看| 国产精品99久久99久久久不卡 | 精品国产一区二区久久| 最近中文字幕高清免费大全6| 久久99热6这里只有精品| 在线观看人妻少妇| 亚洲国产日韩一区二区| 亚洲真实伦在线观看| 亚洲内射少妇av| 精品卡一卡二卡四卡免费| 亚洲av综合色区一区| 成人午夜精彩视频在线观看| 永久网站在线| 国产成人免费观看mmmm| av在线播放精品| 丰满饥渴人妻一区二区三| 欧美高清成人免费视频www| 亚洲精品乱码久久久久久按摩| 激情五月婷婷亚洲| 最近2019中文字幕mv第一页| 大陆偷拍与自拍| 欧美少妇被猛烈插入视频| 熟妇人妻不卡中文字幕| 亚洲美女黄色视频免费看| 18禁在线无遮挡免费观看视频| 亚洲人成网站在线观看播放| xxx大片免费视频| 亚洲精品中文字幕在线视频 | 在线观看免费高清a一片| 日韩欧美一区视频在线观看 | 在线观看一区二区三区激情| av福利片在线| 99热全是精品| 永久免费av网站大全| 日日摸夜夜添夜夜爱| 人妻 亚洲 视频| 26uuu在线亚洲综合色| 国产老妇伦熟女老妇高清| 岛国毛片在线播放| 国产精品免费大片| 欧美成人午夜免费资源| 亚洲天堂av无毛| 女性被躁到高潮视频| 黄色配什么色好看| 久久综合国产亚洲精品| 观看免费一级毛片| 深夜a级毛片| 热99国产精品久久久久久7| 99re6热这里在线精品视频| 久久久久视频综合| 精品亚洲乱码少妇综合久久| 在线观看免费日韩欧美大片 | 国产精品麻豆人妻色哟哟久久| 国产 一区精品| 国产精品久久久久久精品电影小说| 国产精品.久久久| 国产精品三级大全| 久久国产精品男人的天堂亚洲 | 在线观看av片永久免费下载| 男人和女人高潮做爰伦理| 伊人久久精品亚洲午夜| 成人18禁高潮啪啪吃奶动态图 | 亚洲精品一二三| 久久久久视频综合| 97在线人人人人妻| 亚洲欧洲国产日韩| 成人二区视频| 一区二区三区精品91| 热99国产精品久久久久久7| 黄色配什么色好看| 成人18禁高潮啪啪吃奶动态图 | 97超碰精品成人国产| 国产一区亚洲一区在线观看| 99久久人妻综合| 免费人妻精品一区二区三区视频| 国产精品久久久久久精品电影小说| 欧美最新免费一区二区三区| 少妇裸体淫交视频免费看高清| 国产淫语在线视频| 国产精品国产三级国产av玫瑰| 一级av片app| 一级,二级,三级黄色视频| 亚洲综合精品二区| 久久久久久久久久人人人人人人| 少妇猛男粗大的猛烈进出视频| 久久亚洲国产成人精品v| 丰满人妻一区二区三区视频av| 免费看日本二区| 男女啪啪激烈高潮av片| 一本大道久久a久久精品| 国产在线视频一区二区| 青春草亚洲视频在线观看| 欧美精品高潮呻吟av久久| 又大又黄又爽视频免费| 在线亚洲精品国产二区图片欧美 | 亚洲精品国产成人久久av| 国产亚洲av片在线观看秒播厂| 欧美精品一区二区免费开放| 51国产日韩欧美| 国产熟女欧美一区二区| 精品卡一卡二卡四卡免费| 99国产精品免费福利视频| 亚洲内射少妇av| 老女人水多毛片| 日韩精品有码人妻一区| 美女视频免费永久观看网站| 久久99蜜桃精品久久| 黄色视频在线播放观看不卡| 国产精品一区二区在线观看99| 视频中文字幕在线观看| 亚洲精品一二三| 少妇的逼好多水| 免费黄频网站在线观看国产| 少妇人妻 视频| 嘟嘟电影网在线观看| 男女啪啪激烈高潮av片| 亚洲欧美一区二区三区国产| 伊人亚洲综合成人网| 插阴视频在线观看视频| 99精国产麻豆久久婷婷| 亚洲国产最新在线播放| 精品酒店卫生间| 国产日韩一区二区三区精品不卡 | 内射极品少妇av片p| 国产视频首页在线观看| 国产成人午夜福利电影在线观看| 国产亚洲最大av| 精品一品国产午夜福利视频| 一级a做视频免费观看| 欧美精品高潮呻吟av久久| www.色视频.com| 亚洲人成网站在线播| 亚洲精品日韩av片在线观看| 久热久热在线精品观看| 3wmmmm亚洲av在线观看| 中文字幕制服av| 国产黄频视频在线观看| a级毛色黄片| 亚洲一区二区三区欧美精品| 日韩 亚洲 欧美在线| 久久99一区二区三区| 夜夜骑夜夜射夜夜干| 99精国产麻豆久久婷婷| 国产在视频线精品| 久久人妻熟女aⅴ| 最后的刺客免费高清国语| 国产黄片美女视频| av国产久精品久网站免费入址| 欧美日本中文国产一区发布| 高清不卡的av网站| 三级经典国产精品| 99九九在线精品视频 | 男人和女人高潮做爰伦理| 高清午夜精品一区二区三区| 国产黄片视频在线免费观看| 亚洲av成人精品一区久久| av播播在线观看一区| 性色avwww在线观看| 国产伦精品一区二区三区四那| 一区在线观看完整版| 国产熟女欧美一区二区| 免费看光身美女| 久久久久精品久久久久真实原创| 亚洲av免费高清在线观看| 久久久国产欧美日韩av| av福利片在线观看| 少妇被粗大猛烈的视频| 性色avwww在线观看| 亚洲国产精品国产精品| 亚洲欧美日韩东京热| 亚洲av福利一区| 曰老女人黄片| 少妇被粗大的猛进出69影院 | 五月伊人婷婷丁香| 国产黄片视频在线免费观看| videos熟女内射| 国产免费福利视频在线观看| 18禁在线播放成人免费| 亚洲av综合色区一区| 你懂的网址亚洲精品在线观看| 国国产精品蜜臀av免费| 久久国内精品自在自线图片| 亚洲久久久国产精品| 97超视频在线观看视频| 建设人人有责人人尽责人人享有的| 国产探花极品一区二区| 多毛熟女@视频| 午夜视频国产福利| 久久ye,这里只有精品| 蜜桃在线观看..| 久久影院123| 国产伦在线观看视频一区| 观看美女的网站| 国产一区二区三区综合在线观看 | xxx大片免费视频| 欧美一级a爱片免费观看看| 亚州av有码| 成人综合一区亚洲| 91久久精品国产一区二区三区| 午夜视频国产福利| 国产综合精华液| 精品少妇黑人巨大在线播放| 国产成人a∨麻豆精品| av有码第一页| 一区二区三区免费毛片| 久久人妻熟女aⅴ| 日韩亚洲欧美综合| 亚洲av中文av极速乱| 人妻系列 视频| 中文欧美无线码| 香蕉精品网在线| 免费播放大片免费观看视频在线观看| 乱码一卡2卡4卡精品| 黑人高潮一二区| 免费人成在线观看视频色| 97在线视频观看| a级片在线免费高清观看视频| 人人澡人人妻人| 内射极品少妇av片p| 日日爽夜夜爽网站| 国产男女超爽视频在线观看| 夜夜骑夜夜射夜夜干| 我的老师免费观看完整版| 亚洲国产精品成人久久小说| 午夜日本视频在线| 人妻系列 视频| 亚洲精品日韩av片在线观看| 国产在线一区二区三区精| 国产精品国产三级国产av玫瑰| 日韩视频在线欧美| 激情五月婷婷亚洲| 精品人妻熟女毛片av久久网站| 国产免费视频播放在线视频| 国产av精品麻豆| 中文字幕精品免费在线观看视频 | 久久女婷五月综合色啪小说| 亚洲四区av| 纵有疾风起免费观看全集完整版| 国产精品99久久99久久久不卡 | 国产精品免费大片| 午夜福利,免费看| 久久精品久久精品一区二区三区| 大陆偷拍与自拍| 色婷婷久久久亚洲欧美| 2022亚洲国产成人精品| 三上悠亚av全集在线观看 | 国产在线男女| 国产综合精华液| 国产精品.久久久| 日韩免费高清中文字幕av| 日韩欧美 国产精品| 中文字幕制服av| 少妇被粗大猛烈的视频| tube8黄色片| 午夜久久久在线观看| 午夜免费男女啪啪视频观看| 国产综合精华液| 人人妻人人爽人人添夜夜欢视频 | 尾随美女入室| 午夜福利视频精品| 人妻夜夜爽99麻豆av| av天堂中文字幕网| 久久国内精品自在自线图片| 成人毛片a级毛片在线播放| 国产视频内射| 99久久精品热视频| 久久婷婷青草| 最近中文字幕高清免费大全6| 波野结衣二区三区在线| 日本欧美国产在线视频| 男人舔奶头视频| 另类精品久久| 菩萨蛮人人尽说江南好唐韦庄| 国产色婷婷99| 成人18禁高潮啪啪吃奶动态图 | 午夜福利在线观看免费完整高清在| 欧美xxxx性猛交bbbb| 成人黄色视频免费在线看| 国产在线一区二区三区精| 又粗又硬又长又爽又黄的视频| 久久亚洲国产成人精品v| 久久 成人 亚洲| 亚洲第一区二区三区不卡| 国产淫片久久久久久久久| 久久久午夜欧美精品| 午夜精品国产一区二区电影| 一本—道久久a久久精品蜜桃钙片| 久久久精品免费免费高清| 人人妻人人添人人爽欧美一区卜| 熟女电影av网| 免费在线观看成人毛片| 国产伦精品一区二区三区视频9| 日韩视频在线欧美| 观看美女的网站| 最近中文字幕2019免费版| 国产成人aa在线观看| 亚洲精品日韩av片在线观看| 丝袜喷水一区| 亚洲av电影在线观看一区二区三区| 性高湖久久久久久久久免费观看| av女优亚洲男人天堂| 国产真实伦视频高清在线观看| 亚洲图色成人| 免费av中文字幕在线| 国产探花极品一区二区| 2021少妇久久久久久久久久久| 亚洲精品自拍成人| 纯流量卡能插随身wifi吗| av又黄又爽大尺度在线免费看| 日韩精品免费视频一区二区三区 | 中文欧美无线码| 精品人妻一区二区三区麻豆| 多毛熟女@视频| 岛国毛片在线播放| av女优亚洲男人天堂| 免费观看a级毛片全部| 少妇精品久久久久久久| 久久人人爽av亚洲精品天堂| 国产av码专区亚洲av| 狂野欧美激情性bbbbbb| 成人国产麻豆网| 国产欧美日韩精品一区二区| 免费观看无遮挡的男女| 天天操日日干夜夜撸| 丝袜在线中文字幕| 97超视频在线观看视频| 亚洲,欧美,日韩| 午夜老司机福利剧场| freevideosex欧美| 十八禁高潮呻吟视频 | 三级经典国产精品| 国产美女午夜福利| 国产欧美日韩综合在线一区二区 | 一区二区av电影网| av视频免费观看在线观看| 国产成人a∨麻豆精品| av网站免费在线观看视频| 在线亚洲精品国产二区图片欧美 | 国产精品久久久久久精品电影小说| 一区在线观看完整版| 久久国产精品男人的天堂亚洲 | 国产精品三级大全| 内射极品少妇av片p| 亚洲四区av| 欧美日韩视频精品一区| 日韩视频在线欧美| 国产av国产精品国产| 91久久精品电影网| 国产精品蜜桃在线观看| 九色成人免费人妻av| 国产成人精品福利久久| 国产成人aa在线观看| 一区二区av电影网| 18+在线观看网站| 成人无遮挡网站| 国产亚洲5aaaaa淫片| 91成人精品电影| 久久久久人妻精品一区果冻| 国产高清不卡午夜福利| 久久久久国产精品人妻一区二区| 亚洲欧洲国产日韩| 国产成人午夜福利电影在线观看| 精品久久久精品久久久| 国产午夜精品久久久久久一区二区三区| 丝袜喷水一区| 国产黄片视频在线免费观看| 日韩欧美 国产精品| 高清毛片免费看| 国产高清国产精品国产三级| 一级毛片黄色毛片免费观看视频| 亚洲成人一二三区av| 自拍欧美九色日韩亚洲蝌蚪91 | 国内精品宾馆在线| 婷婷色综合大香蕉| 青春草视频在线免费观看| 久久国产亚洲av麻豆专区| 亚洲精品乱码久久久久久按摩| 国产乱人偷精品视频| 亚洲av电影在线观看一区二区三区| 夜夜看夜夜爽夜夜摸| 欧美3d第一页| 在线观看三级黄色| 伦理电影大哥的女人| 亚洲精品第二区| 日韩大片免费观看网站| 免费看光身美女| 水蜜桃什么品种好| 亚洲国产av新网站| 中国美白少妇内射xxxbb| 亚洲精品国产av成人精品| 免费观看a级毛片全部| 日韩欧美一区视频在线观看 | 一级,二级,三级黄色视频| av在线app专区| 久久久久久久精品精品| 22中文网久久字幕| 精品亚洲成a人片在线观看| 日韩成人av中文字幕在线观看| 日本黄大片高清| 欧美成人午夜免费资源| 亚洲国产精品一区三区| 亚洲国产精品一区二区三区在线| 亚洲人成网站在线播| 国产精品一区二区在线不卡| 国产精品久久久久久久电影| 久久久久久久大尺度免费视频| 午夜久久久在线观看| 99精国产麻豆久久婷婷| 美女视频免费永久观看网站| 欧美少妇被猛烈插入视频| 日本免费在线观看一区| 午夜精品国产一区二区电影| 狂野欧美激情性xxxx在线观看| 精品熟女少妇av免费看| 国产爽快片一区二区三区| 中国国产av一级| 纵有疾风起免费观看全集完整版|