• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Dueling DDQN的無人車換道決策模型

    2022-03-26 07:05:08張?chǎng)纬?/span>劉元盛謝龍洋
    關(guān)鍵詞:無人成功率決策

    張?chǎng)纬?,?軍,劉元盛,謝龍洋

    (1.北京聯(lián)合大學(xué)北京市信息服務(wù)工程重點(diǎn)實(shí)驗(yàn)室,北京 100101;2.北京聯(lián)合大學(xué)機(jī)器人學(xué)院,北京 100101)

    0 引言

    無人駕駛可以提高汽車的利用效率以及通行能力,同時(shí)也可以減少因駕駛員疲勞而導(dǎo)致的交通事故[1].而無人車的換道決策問題是無人駕駛中復(fù)雜且最具挑戰(zhàn)性的問題之一[2-3].無人車的換道決策方法主要分為基于規(guī)則型和基于學(xué)習(xí)型的方法.

    基于規(guī)則型的方法有Gipps[4]、CORSIM[5]模型等,這些模型的最終輸出一般為換道或不換道的二元結(jié)果,而基于規(guī)則型換道決策方法的局限性在于難以覆蓋所有工況,難以處理復(fù)雜道路場(chǎng)景.

    隨著無人駕駛決策技術(shù)的不斷發(fā)展,對(duì)于無人車換道決策技術(shù)的研究逐漸由基于規(guī)則型的方法向?qū)W習(xí)型的方法轉(zhuǎn)化.其中,學(xué)習(xí)型的決策方法分為基于機(jī)器學(xué)習(xí)和基于強(qiáng)化學(xué)習(xí)的方法.基于機(jī)器學(xué)習(xí)的常用方法有深度神經(jīng)網(wǎng)絡(luò)[6-7]、高斯和隱馬爾可夫混合模型[8]、貝葉斯決策[9-10]、隨機(jī)森林[11]、支持向量機(jī)[12]等,雖然這些方法與基于規(guī)則的模型相比可以在更多的道路場(chǎng)景中使用,但往往需要較為龐大的先驗(yàn)數(shù)據(jù)集作為訓(xùn)練集進(jìn)行模型訓(xùn)練,同時(shí)這些模型在較復(fù)雜的道路駕駛場(chǎng)景中對(duì)突發(fā)情況的處理有所欠缺.

    在基于強(qiáng)化學(xué)習(xí)的換道決策研究中,文獻(xiàn)[13-15]提出了基于DQN(Deep Q Network)的換道決策模型,在高速公路場(chǎng)景下進(jìn)行了建模.該方法與基于機(jī)器學(xué)習(xí)和基于規(guī)則換道模型相比,在面對(duì)道路突發(fā)情況的處理上有了較大的提升.但是基于DQN的換道模型中的目標(biāo)網(wǎng)絡(luò)存在著過估計(jì)的問題,這種問題的存在使得模型在選擇動(dòng)作時(shí)往往會(huì)得到次優(yōu)的結(jié)果,同時(shí)模型會(huì)收斂到局部最優(yōu)值,導(dǎo)致最終無法得到最優(yōu)的換道決策策略.因此,本文建立基于競(jìng)爭(zhēng)結(jié)構(gòu)(Dueling Architecture)的雙深度Q網(wǎng)絡(luò)(Dueling Double Deep Q Network)算法的無人車換道決策模型,首先將無人車動(dòng)作的選擇和評(píng)估分別用不同的網(wǎng)絡(luò)來實(shí)現(xiàn),并將Q網(wǎng)絡(luò)分為僅與狀態(tài)S相關(guān)的價(jià)值函數(shù)(Value Function)部分和同時(shí)與狀態(tài)S和動(dòng)作A相關(guān)的優(yōu)勢(shì)函數(shù)(Advantage Function)部分.通過實(shí)驗(yàn)結(jié)果表明,該模型可以使無人車在較復(fù)雜的道路上以更高的速度行駛,通過與DQN以及DDQN模型對(duì)比,驗(yàn)證了提出模型的魯棒性和合理性.

    1 換道決策模型的構(gòu)建

    1.1 Dueling DDQN模型

    Dueling DDQN算法在DDQN算法[16-17]的基礎(chǔ)上加入競(jìng)爭(zhēng)結(jié)構(gòu),將Q網(wǎng)絡(luò)分為兩部分,分別為價(jià)值函數(shù)和優(yōu)勢(shì)函數(shù),即

    (1)

    其中:s為狀態(tài)值,a為動(dòng)作值,V(s;θ,β)為價(jià)值函數(shù),A(s,a;θ,α)為優(yōu)勢(shì)函數(shù),|A|為動(dòng)作的個(gè)數(shù),a′為所有可以采取的動(dòng)作,θ為公共部分的網(wǎng)絡(luò)參數(shù),α和β分別為價(jià)值函數(shù)和優(yōu)勢(shì)函數(shù)各自的網(wǎng)絡(luò)參數(shù).

    Dueling DDQN由兩個(gè)結(jié)構(gòu)相同網(wǎng)絡(luò)參數(shù)不同的神經(jīng)網(wǎng)絡(luò)組成,分別為評(píng)估網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò).評(píng)估網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò)的參數(shù)分別用θ和θ-表示,評(píng)估網(wǎng)絡(luò)被用作估計(jì)無人車最佳動(dòng)作價(jià)值函數(shù)的函數(shù)逼近器,即

    Q(s,a;θ)≈Q*(s,a).

    (2)

    其中:Q*(s,a)為最佳動(dòng)作價(jià)值函數(shù).它定義當(dāng)無人車處于狀態(tài)s,采取某種動(dòng)作a并遵循最佳策略π*時(shí)的最大期望值.將t時(shí)刻無人車的狀態(tài)值st,采取的動(dòng)作值at,從環(huán)境返回的獎(jiǎng)勵(lì)值rt,以及下一個(gè)t+1時(shí)刻的狀態(tài)值st+1作為經(jīng)驗(yàn)值et存儲(chǔ)在記憶庫Dt中用于訓(xùn)練評(píng)估網(wǎng)絡(luò),即:

    et=(st,at,rt,st+1);

    (3)

    Dt={e1,e2,…,et}.

    (4)

    在第i次迭代時(shí),評(píng)估網(wǎng)絡(luò)首先從記憶庫中抽取批量大小為M的序列,使用隨機(jī)梯度下降的方法通過調(diào)整網(wǎng)絡(luò)參數(shù)θi來最小化貝爾曼方程的誤差,定義Li(θi)為第i次迭代的損失函數(shù):

    (5)

    結(jié)合實(shí)驗(yàn)中采用的換道決策模型,整體的網(wǎng)絡(luò)架構(gòu)如圖1所示.

    圖1 整體網(wǎng)絡(luò)框架

    1.2 基于Dueling DDQN的無人車換道決策模型構(gòu)建

    本文采用圖1所示的網(wǎng)絡(luò)框架構(gòu)建無人車換道決策模型.無人車在行駛過程中的換道決策問題可以描述為馬爾可夫決策過程(Markov Decision Process),該過程可由一組狀態(tài)空間S,一組動(dòng)作空間A,以及獎(jiǎng)勵(lì)函數(shù)R來具體描述.圖2描述了無人車在行駛的過程中與環(huán)境進(jìn)行交互的過程.

    圖2 無人車與環(huán)境交互過程

    無人車在行駛過程中首先獲取當(dāng)前環(huán)境下的觀測(cè)狀態(tài)sp,然后無人車采取動(dòng)作ap,獲得獎(jiǎng)勵(lì)rp,經(jīng)過1 s后,無人車進(jìn)入下一個(gè)狀態(tài)sp+1,其中p為當(dāng)前回合的執(zhí)行步數(shù).重復(fù)上述迭代過程,直至一個(gè)回合結(jié)束.定義具體的狀態(tài)空間、動(dòng)作空間以及獎(jiǎng)勵(lì)函數(shù)如下:

    狀態(tài)空間定義:以無人車感知范圍內(nèi)最近的6輛環(huán)境車相對(duì)于無人車的距離和速度,以及無人車自身的速度作為狀態(tài)空間,即

    S={vego,s1,s2,…,s6}.

    (6)

    式中vego表示無人車的速度值,s1~s6表示環(huán)境車輛的狀態(tài)值.其中s={exist,x,y,vx,vy},exist表示是否存在該車輛,若存在,exist=1,反之,exist=0.x表示環(huán)境車輛相對(duì)于無人車的橫向位置,y表示環(huán)境車輛相對(duì)于無人車的縱向位置,vx表示環(huán)境車輛相對(duì)于無人車的橫向速度,vy表示環(huán)境車輛相對(duì)于無人車的縱向速度.

    動(dòng)作空間定義為

    A={left,right,keep,lower,faster}.

    (7)

    式中:left表示無人車向左換道,right表示無人車向右換道,keep表示無人車保持原車道行駛并保持速度不變,lower表示無人車保持原車道并以-1.25 m/s2的加速度減速行駛,faster表示無人車保持原車道同時(shí)以1.25 m/s2的加速度加速行駛.

    獎(jiǎng)勵(lì)函數(shù)定義:為了避免強(qiáng)化學(xué)習(xí)中的稀疏獎(jiǎng)勵(lì)問題,同時(shí)使無人車可以學(xué)習(xí)到最佳的駕駛策略,設(shè)置獎(jiǎng)勵(lì)函數(shù).

    為使無人車避免碰撞,設(shè)置碰撞懲罰函數(shù)為

    rp-collision=-1.

    (8)

    為防止無人車因避免碰撞而過于保守的行駛,設(shè)置速度獎(jiǎng)勵(lì)函數(shù)為

    (9)

    其中rhigh-velocity為速度獎(jiǎng)勵(lì)因子,設(shè)為0.25,vmax和vmin分別為無人車行駛時(shí)可達(dá)到的最高速度(30 m/s)和最低速度(20 m/s),vego為無人車的當(dāng)前速度.

    為避免無人車頻繁的改變車道(無人車為避免碰撞而換道除外),設(shè)置換道懲罰函數(shù)為

    rp-lanechange=-0.01.

    (10)

    若無人車在一個(gè)步長(zhǎng)內(nèi)未發(fā)生碰撞,設(shè)置單步獎(jiǎng)勵(lì)函數(shù)為

    rp-step=0.01.

    (11)

    若無人車在整個(gè)回合行駛過程中未發(fā)生碰撞,設(shè)置成功獎(jiǎng)勵(lì)函數(shù)為

    rsuccess=0.5.

    (12)

    故總獎(jiǎng)勵(lì)函數(shù)為

    (13)

    式中T為本回合執(zhí)行總步數(shù).

    2 仿真環(huán)境搭建

    2.1 仿真道路環(huán)境搭建

    實(shí)驗(yàn)中選用高速場(chǎng)景為仿真實(shí)驗(yàn)場(chǎng)景.共分為4個(gè)主車道,仿真道路總長(zhǎng)為800 m,高速公路仿真實(shí)驗(yàn)場(chǎng)景如圖3所示,其他道路環(huán)境參數(shù)設(shè)定如表1所示.

    圖3 實(shí)驗(yàn)場(chǎng)景示意圖

    表1 道路環(huán)境參數(shù)設(shè)定

    2.2 仿真車輛環(huán)境搭建

    采用IDM(Intelligent Driver Model)[18]對(duì)環(huán)境車輛縱向動(dòng)力學(xué)進(jìn)行仿真,環(huán)境車輛之間的狀態(tài)關(guān)系滿足:

    (14)

    (15)

    其中:amax表示最大加速度,v表示車輛當(dāng)前速度,vd表示期望速度,δ表示加速指數(shù),Δv表示同車道當(dāng)前車輛與前車的速度差,d*(v,Δv)為期望最小間距,d0表示最短車輛間距,T表示期望車頭時(shí)距,b表示期望減速度.該模型可以模擬車輛的跟隨行為,同時(shí)在高速公路上為車輛產(chǎn)生所需的加速度.

    采用MOBIL(Minimizing Overall Braking Induced By Lane Change)[18]對(duì)環(huán)境車輛橫向動(dòng)力學(xué)進(jìn)行仿真,環(huán)境車輛的加速度關(guān)系滿足:

    (16)

    (17)

    Δa>Δath.

    (18)

    實(shí)驗(yàn)中采用的主車道環(huán)境車輛最高速度為40 m/s,環(huán)境中車輛數(shù)為10輛,在車道1至車道4隨機(jī)分配每輛環(huán)境車的位置,且車輛縱向初始間距為30 m.無人車的長(zhǎng)度和寬度與環(huán)境車輛一致.假設(shè)無人車的感知范圍為車輛前后距離各150 m,左右距離各8 m.其他仿真車輛環(huán)境參數(shù)如表2所示.

    表2 仿真車輛環(huán)境參數(shù)設(shè)定

    3 結(jié)果與分析

    本文采用Python3.7搭建道路仿真環(huán)境,使用PyTorch搭建神經(jīng)網(wǎng)絡(luò)框架.仿真實(shí)驗(yàn)中訓(xùn)練和測(cè)試使用的計(jì)算機(jī)配置為Ubuntu16.04LTS系統(tǒng),i7-8750H處理器,16 GB內(nèi)存.設(shè)置訓(xùn)練最大回合數(shù)為20 000,單回合最大執(zhí)行步數(shù)為20.假設(shè)車輛在實(shí)驗(yàn)過程中均保持在可行使區(qū)域內(nèi)行駛.回合終止條件為無人車單回合執(zhí)行步數(shù)達(dá)到最大或無人車在行駛過程中與環(huán)境車輛發(fā)生碰撞.實(shí)驗(yàn)中采用的網(wǎng)絡(luò)參數(shù)如表3所示.

    表3 Dueling DDQN網(wǎng)絡(luò)參數(shù)設(shè)定

    3.1 模型訓(xùn)練及結(jié)果分析

    訓(xùn)練過程中主要研究在無人車進(jìn)行換道決策時(shí),是否可以根據(jù)周圍車輛環(huán)境的變化做出應(yīng)對(duì)的策略.定義若無人車在一個(gè)回合內(nèi)未與環(huán)境車輛發(fā)生碰撞,即為一次成功.無人車在前i個(gè)回合獲得的平均獎(jiǎng)勵(lì)定義為

    (19)

    其中Rt為在無人車第t個(gè)回合內(nèi)獲得的獎(jiǎng)勵(lì)值.

    無人車在前i個(gè)回合獲得的平均速度定義為

    (20)

    其中vt為在無人車第t個(gè)回合內(nèi)獲得的平均速度.

    分別使用Dueling DDQN、 DDQN、DQN模型進(jìn)行訓(xùn)練,且3種算法的網(wǎng)絡(luò)參數(shù)、狀態(tài)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)均保持一致.通過分析換道決策成功率、模型得到的平均獎(jiǎng)勵(lì)以及無人車平均速度來描述模型訓(xùn)練的結(jié)果如圖4—6所示.

    圖4 訓(xùn)練過程中換道決策成功率對(duì)比 圖5 訓(xùn)練過程中平均獎(jiǎng)勵(lì)值對(duì)比

    圖6 訓(xùn)練過程中平均速度對(duì)比

    由圖4可知,在訓(xùn)練開始階段,3種模型的換道決策成功率均由0開始不斷增加,隨著訓(xùn)練回合數(shù)的增長(zhǎng),基于Dueling DDQN的換道模型成功率在訓(xùn)練5 000回合左右達(dá)到基本穩(wěn)定,而DDQN和DQN算法在10 000回合左右達(dá)到基本穩(wěn)定.在訓(xùn)練回合結(jié)束時(shí),Dueling DDQN換道模型成功率最高,為84.39%,DDQN次之,為 83.59%,DQN最低,為 81.40%.

    由圖5—6,可知,在平均獎(jiǎng)勵(lì)方面,Dueling DDQN、DDQN、DQN分別在訓(xùn)練回合結(jié)束后獲得4.47,4.37,4.28的平均獎(jiǎng)勵(lì)值.而在無人車平均速度方面,Dueling DDQN、 DDQN、 DQN分別在訓(xùn)練回合結(jié)束后可達(dá)到29.05,28.79以及28.77 m/s的平均速度.

    綜上所述,在模型的訓(xùn)練過程中,Dueling DDQN模型較DDQN和DQN相比可獲得更高的平均獎(jiǎng)勵(lì)值,且在保持更高的換道成功率的前提下,提升了無人車的行駛速度.

    3.2 模型測(cè)試及結(jié)果分析

    在模型測(cè)試過程中,針對(duì)不同條件下的道路環(huán)境,通過改變環(huán)境車輛的橫向模型(MOBIL)中的禮貌系數(shù)p、環(huán)境車輛初始間距以及環(huán)境車輛的數(shù)目來模擬不同車輛環(huán)境的道路場(chǎng)景,其他道路與車輛環(huán)境參數(shù)保持不變.其中禮貌系數(shù)p∈[0,1],p越小,說明環(huán)境車輛的駕駛風(fēng)格越激進(jìn),環(huán)境車輛初始間距以及環(huán)境車輛的數(shù)目的變化用來模擬不同道路環(huán)境的車流密度.通過改變上述3個(gè)參數(shù)值來設(shè)置3個(gè)不同車輛環(huán)境的道路場(chǎng)景,分別使用Dueling DDQN、DDQN、DQN算法訓(xùn)練的模型在3個(gè)不同的道路場(chǎng)景中測(cè)試.設(shè)定每個(gè)場(chǎng)景的測(cè)試回合數(shù)為1 000,場(chǎng)景設(shè)置及測(cè)試過程的具體描述如下.

    3.2.1 模型測(cè)試場(chǎng)景(1)

    測(cè)試場(chǎng)景(1)采用與模型訓(xùn)練時(shí)相同的道路場(chǎng)景,即3個(gè)參數(shù)分別為:禮貌系數(shù)p=1,環(huán)境車輛初始間距為30 m,環(huán)境車輛數(shù)為10輛.分別從換道決策成功率、模型得到的平均獎(jiǎng)勵(lì)、無人車平均速度來描述在此場(chǎng)景中模型測(cè)試的結(jié)果.Dueling DDQN、DDQN、 DQN模型的換道決策成功率隨回合數(shù)變化趨勢(shì)如圖7所示,前1 000個(gè)測(cè)試回合的成功率、平均獎(jiǎng)勵(lì)以及平均速度如表4所示.

    您說像他這樣,我怎么敢把大事兒交給他辦?他自己也挺苦惱:“國家的事兒不歸我想,家里的事兒全被你想了,我還能想點(diǎn)兒啥?”

    圖7 場(chǎng)景(1)換道決策成功率對(duì)比

    表4 場(chǎng)景(1)模型測(cè)試對(duì)比結(jié)果

    由圖7和表4可知,Dueling DDQN的換道決策成功率較DDQN和DQN分別高出1.7%和3.9%,同時(shí)在平均獎(jiǎng)勵(lì)和平均速度方面,Dueling DDQN模型均高于DDQN和DQN.3種模型在1 000次測(cè)試回合中成功的回合次數(shù)分別為Dueling DDQN成功936次,DDQN成功919次,DQN成功897次.在這些未發(fā)生碰撞的回合中,Dueling DDQN一個(gè)回合獲得的獎(jiǎng)勵(lì)值小于5.0的有4次,DDQN有19次,DQN有25次,這些回合獲得獎(jiǎng)勵(lì)值較低的原因是由于無人車為避免碰撞而采取了過于保守的駕駛動(dòng)作,使得無人車在一定的步長(zhǎng)內(nèi)均保持較低的速度行駛,進(jìn)而導(dǎo)致在一個(gè)回合內(nèi)獲得的速度獎(jiǎng)勵(lì)值較低,由此可見,Dueling DDQN成功但保守駕駛的回合次數(shù)較少,說明此模型可以通過狀態(tài)空間的變化和獎(jiǎng)勵(lì)函數(shù)反饋過程更好的理解道路環(huán)境的變化,采取更優(yōu)的動(dòng)作值.由此可見,在場(chǎng)景(1)的測(cè)試過程中,Dueling DDQN模型的表現(xiàn)更好.

    3.2.2 模型測(cè)試場(chǎng)景(2)

    測(cè)試場(chǎng)景(2)采用比場(chǎng)景(1)更復(fù)雜的道路場(chǎng)景,即3個(gè)參數(shù)分別為:禮貌系數(shù)p=0.5,環(huán)境車輛初始間距為20 m,環(huán)境車輛數(shù)為15輛.分別從換道決策成功率、模型得到的平均獎(jiǎng)勵(lì)、無人車平均速度來描述在此場(chǎng)景中模型測(cè)試的結(jié)果.3種模型的換道決策成功率隨回合數(shù)變化趨勢(shì)如圖8所示,前1 000個(gè)測(cè)試回合的成功率、平均獎(jiǎng)勵(lì)以及平均速度如表5所示.

    表5 場(chǎng)景(2)模型測(cè)試對(duì)比結(jié)果

    由圖8和表5可知,Dueling DDQN的換道決策成功率較DDQN和DQN分別高出3.4%和5.1%,同時(shí)在平均獎(jiǎng)勵(lì)和平均速度方面,Dueling DDQN模型均高于DDQN和DQN.在此場(chǎng)景中模型測(cè)試結(jié)果與場(chǎng)景(1)相比,每個(gè)算法的測(cè)試成功率、平均獎(jiǎng)勵(lì)、平均速度均有所下降,但Dueling DDQN成功率的下降幅度最小,說明Dueling DDQN對(duì)復(fù)雜場(chǎng)景的適應(yīng)性更強(qiáng).場(chǎng)景(2)中3種模型平均獎(jiǎng)勵(lì)下降的原因是因?yàn)殡S著換道成功率的下降,無人車發(fā)生碰撞的次數(shù)增多,導(dǎo)致獲得碰撞懲罰函數(shù)的次數(shù)增加,同時(shí)獲得的單步獎(jiǎng)勵(lì)函數(shù)也隨之減少,平均速度的下降也使得無人車獲得速度獎(jiǎng)勵(lì)函數(shù)減少,最終導(dǎo)致平均獎(jiǎng)勵(lì)下降.

    圖8 場(chǎng)景(2)換道決策成功率對(duì)比

    3.2.3 模型測(cè)試場(chǎng)景(3)

    測(cè)試場(chǎng)景(3)采用最復(fù)雜的道路場(chǎng)景,即3個(gè)參數(shù)分別為:禮貌系數(shù)p=0,環(huán)境車輛初始間距為10 m,環(huán)境車輛數(shù)為20輛.分別從換道決策成功率、模型得到的平均獎(jiǎng)勵(lì)、無人車平均速度來描述在此場(chǎng)景中模型測(cè)試的結(jié)果.3種模型的換道決策成功率隨回合數(shù)變化趨勢(shì)如圖9所示,前1 000個(gè)測(cè)試回合的成功率、平均獎(jiǎng)勵(lì)以及平均速度如表6所示.

    圖9 場(chǎng)景(3)換道決策成功率對(duì)比

    表6 場(chǎng)景(3)模型測(cè)試對(duì)比結(jié)果

    由圖9和表6可知,Dueling DDQN的換道決策成功率較DDQN和DQN分別高出9.7%和23.8%,同時(shí)在平均獎(jiǎng)勵(lì)方面,Dueling DDQN模型高于DDQN和DQN.雖然在平均速度方面DQN模型較Dueling DDQN高0.18 m/s,但是由于換道成功率較低,所以DQN模型無法保證在換道成功率較高的前提下提高無人車的速度.且在無人車發(fā)生碰撞的回合中,每個(gè)算法的單回合步數(shù)比例(單回合步數(shù)最大為20)分布如表7所示.

    表7 場(chǎng)景(3)無人車碰撞單回合步數(shù)比例分布對(duì)比結(jié)果

    由表7可知,DQN和DDQN在發(fā)生碰撞的回合中,分別有48.87%和45.70%的碰撞發(fā)生在前10個(gè)步長(zhǎng)內(nèi),而Dueling DDQN有16.98%的碰撞發(fā)生在前10個(gè)步長(zhǎng)內(nèi),說明在每個(gè)測(cè)試回合的開始階段,DQN和DDQN對(duì)復(fù)雜的道路場(chǎng)景的適應(yīng)性較低,無法準(zhǔn)確地根據(jù)無人車當(dāng)前所處環(huán)境進(jìn)行合理的決策,DQN和DDQN算法的碰撞分布在前10個(gè)步長(zhǎng)內(nèi)的百分比分別是Dueling DDQN的2.88倍和2.69倍,說明Dueling DDQN算法在測(cè)試回合的開始階段,可以根據(jù)當(dāng)前所處環(huán)境使無人車做出合理的動(dòng)作,且Dueling DDQN在復(fù)雜的道路場(chǎng)景中仍然可以保持較高的換道成功率.

    3.2.4 不同場(chǎng)景之間的對(duì)比

    場(chǎng)景(3)和場(chǎng)景(1)的測(cè)試結(jié)果相比,Dueling DDQN算法成功率下降9.5%,而DDQN和DQN算法分別下降17.5%和29.4%,Dueling DDQN算法無人車換道決策成功率的下降幅度最低,說明Dueling DDQN換道模型與DDQN和DQN模型相比,更適合在復(fù)雜的道路場(chǎng)景中使用.

    綜上所述,在3種車輛環(huán)境不同的測(cè)試場(chǎng)景中,Dueling DDQN在保證換道成功率的情況下,平均獎(jiǎng)勵(lì)和平均速度方面均高于DDQN和DQN,可見Dueling DDQN的模型性能更好.因?yàn)镈DQN模型在增加了競(jìng)爭(zhēng)結(jié)構(gòu)后,在評(píng)估網(wǎng)絡(luò)更新的時(shí)候,由于存在一個(gè)狀態(tài)下的優(yōu)勢(shì)函數(shù)之和為0的限制,所以網(wǎng)絡(luò)在更新時(shí)會(huì)優(yōu)先更新價(jià)值函數(shù),導(dǎo)致當(dāng)每次模型的價(jià)值函數(shù)被更新時(shí),在一個(gè)狀態(tài)下所有的Q值均被更新,進(jìn)而使得Dueling DDQN模型可以更好地理解外部的狀態(tài)環(huán)境,同時(shí)提高了模型的魯棒性和適用性.

    4 結(jié)論

    本文針對(duì)高速公路下無人駕駛車的換道決策問題,提出了基于Dueling DDQN的無人車換道決策模型,同時(shí)與DQN和DDQN模型進(jìn)行了對(duì)比.實(shí)驗(yàn)結(jié)果表明,Dueling DDQN模型在無人車換道決策成功率上均高于DQN與DDQN,同時(shí)可以在保證成功率的前提下,更大幅度的提高無人車的行駛速度,進(jìn)而提高通行效率.通過在不同車輛環(huán)境的道路場(chǎng)景下進(jìn)行測(cè)試,Dueling DDQN模型在3種道路場(chǎng)景下可保持較高的換道決策成功率,表明此模型的魯棒性更好,且在更復(fù)雜的道路場(chǎng)景下的適用性更強(qiáng).

    猜你喜歡
    無人成功率決策
    成功率超70%!一張冬棚賺40萬~50萬元,羅氏沼蝦今年將有多火?
    為可持續(xù)決策提供依據(jù)
    如何提高試管嬰兒成功率
    決策為什么失誤了
    無人戰(zhàn)士無人車
    反擊無人機(jī)
    如何提高試管嬰兒成功率
    詩到無人愛處工
    岷峨詩稿(2017年4期)2017-04-20 06:26:43
    無人超市會(huì)流行起來嗎?
    研究發(fā)現(xiàn):面試排第四,成功率最高等4則
    海峽姐妹(2015年5期)2015-02-27 15:11:00
    亚洲aⅴ乱码一区二区在线播放 | 一级片'在线观看视频| 国内毛片毛片毛片毛片毛片| 亚洲av美国av| 激情视频va一区二区三区| 欧美日韩国产mv在线观看视频| 国产精品美女特级片免费视频播放器 | 亚洲精品中文字幕一二三四区| 男女床上黄色一级片免费看| 一a级毛片在线观看| 黄色女人牲交| 婷婷六月久久综合丁香| 欧美日本亚洲视频在线播放| 好男人电影高清在线观看| 亚洲熟女毛片儿| 亚洲五月色婷婷综合| 又紧又爽又黄一区二区| 成年版毛片免费区| 欧美激情久久久久久爽电影 | 久久青草综合色| 国内久久婷婷六月综合欲色啪| 成人影院久久| 黑人猛操日本美女一级片| 国产av一区在线观看免费| 黑人猛操日本美女一级片| 搡老乐熟女国产| 亚洲精品久久午夜乱码| 免费一级毛片在线播放高清视频 | 欧美日韩亚洲国产一区二区在线观看| aaaaa片日本免费| 美女 人体艺术 gogo| 首页视频小说图片口味搜索| 国产区一区二久久| 精品无人区乱码1区二区| 日本vs欧美在线观看视频| 精品熟女少妇八av免费久了| 一个人观看的视频www高清免费观看 | 伊人久久大香线蕉亚洲五| 日韩精品中文字幕看吧| 日韩国内少妇激情av| 亚洲av成人一区二区三| 久久国产亚洲av麻豆专区| 麻豆一二三区av精品| 日本三级黄在线观看| 欧美另类亚洲清纯唯美| 女人精品久久久久毛片| 日本一区二区免费在线视频| 日本一区二区免费在线视频| 久久这里只有精品19| 极品人妻少妇av视频| 日本撒尿小便嘘嘘汇集6| 欧美乱妇无乱码| 久久天躁狠狠躁夜夜2o2o| 免费搜索国产男女视频| 久久精品国产亚洲av高清一级| 黄频高清免费视频| 国产精品av久久久久免费| 日韩欧美一区视频在线观看| 久久亚洲精品不卡| 亚洲国产毛片av蜜桃av| 嫩草影视91久久| 久久久久亚洲av毛片大全| 自线自在国产av| 波多野结衣高清无吗| 欧美+亚洲+日韩+国产| 少妇粗大呻吟视频| 在线观看www视频免费| 亚洲专区国产一区二区| 高清欧美精品videossex| av国产精品久久久久影院| www.熟女人妻精品国产| 久久人人爽av亚洲精品天堂| 丰满迷人的少妇在线观看| 级片在线观看| 黄片播放在线免费| 免费av中文字幕在线| 久久国产精品人妻蜜桃| 自拍欧美九色日韩亚洲蝌蚪91| 桃色一区二区三区在线观看| 国产亚洲欧美98| 可以免费在线观看a视频的电影网站| 色尼玛亚洲综合影院| 国产精品亚洲av一区麻豆| 亚洲精品国产一区二区精华液| 可以免费在线观看a视频的电影网站| 亚洲色图 男人天堂 中文字幕| 国产精品 国内视频| 丁香欧美五月| 韩国精品一区二区三区| 天天躁夜夜躁狠狠躁躁| 亚洲专区中文字幕在线| 久久久久久免费高清国产稀缺| 午夜两性在线视频| www.自偷自拍.com| 色在线成人网| 国产成人系列免费观看| 国产不卡一卡二| 中文字幕人妻丝袜一区二区| 国产一卡二卡三卡精品| 国产成年人精品一区二区 | 两人在一起打扑克的视频| 精品一区二区三区四区五区乱码| 午夜精品在线福利| 极品人妻少妇av视频| 亚洲一区高清亚洲精品| 国产精品亚洲av一区麻豆| 亚洲一区高清亚洲精品| 免费不卡黄色视频| av片东京热男人的天堂| 成人亚洲精品av一区二区 | 亚洲 国产 在线| 国产在线观看jvid| 丰满的人妻完整版| 国产又爽黄色视频| 亚洲,欧美精品.| 女生性感内裤真人,穿戴方法视频| 欧美激情极品国产一区二区三区| 亚洲av日韩精品久久久久久密| 国产伦人伦偷精品视频| 亚洲精华国产精华精| 两性夫妻黄色片| av片东京热男人的天堂| 高清av免费在线| 成人18禁在线播放| 亚洲色图综合在线观看| 99久久99久久久精品蜜桃| 不卡av一区二区三区| 日韩中文字幕欧美一区二区| 波多野结衣高清无吗| 亚洲激情在线av| 精品免费久久久久久久清纯| 青草久久国产| 国产成人欧美在线观看| 精品一区二区三卡| 一本大道久久a久久精品| 777久久人妻少妇嫩草av网站| 亚洲人成网站在线播放欧美日韩| 在线观看www视频免费| av中文乱码字幕在线| av在线播放免费不卡| 在线观看一区二区三区| 欧美日本中文国产一区发布| 欧美日本中文国产一区发布| 精品久久久久久成人av| 视频区图区小说| 午夜久久久在线观看| 免费一级毛片在线播放高清视频 | 国产精品久久久久成人av| 97人妻天天添夜夜摸| 日韩欧美国产一区二区入口| 男女做爰动态图高潮gif福利片 | 欧美一区二区精品小视频在线| 久久久国产欧美日韩av| 欧美老熟妇乱子伦牲交| 免费高清在线观看日韩| 免费搜索国产男女视频| 久久久精品国产亚洲av高清涩受| 欧洲精品卡2卡3卡4卡5卡区| 国产在线精品亚洲第一网站| 超碰成人久久| 男人舔女人的私密视频| 日韩成人在线观看一区二区三区| 日韩精品免费视频一区二区三区| 亚洲精品国产精品久久久不卡| 中文字幕另类日韩欧美亚洲嫩草| av福利片在线| 男女高潮啪啪啪动态图| 一级毛片高清免费大全| 欧美日韩黄片免| 他把我摸到了高潮在线观看| 免费高清在线观看日韩| 久久亚洲真实| 国产欧美日韩综合在线一区二区| 亚洲男人的天堂狠狠| xxxhd国产人妻xxx| 久久精品亚洲熟妇少妇任你| 亚洲午夜精品一区,二区,三区| 亚洲成人免费电影在线观看| 啦啦啦免费观看视频1| 黄片小视频在线播放| 香蕉丝袜av| 波多野结衣一区麻豆| 亚洲片人在线观看| 国产成人系列免费观看| 天堂√8在线中文| 一边摸一边抽搐一进一小说| 国产区一区二久久| 亚洲欧美日韩高清在线视频| 9热在线视频观看99| 丰满饥渴人妻一区二区三| 久久人人97超碰香蕉20202| 国产精品国产av在线观看| 露出奶头的视频| 夜夜爽天天搞| 美女 人体艺术 gogo| 9色porny在线观看| 无限看片的www在线观看| 少妇 在线观看| 纯流量卡能插随身wifi吗| 一进一出好大好爽视频| 免费观看人在逋| 人人妻人人澡人人看| 国产aⅴ精品一区二区三区波| 高清欧美精品videossex| 天天躁夜夜躁狠狠躁躁| 少妇被粗大的猛进出69影院| 大陆偷拍与自拍| 久久性视频一级片| 大码成人一级视频| 亚洲欧洲精品一区二区精品久久久| 老司机亚洲免费影院| 黑人巨大精品欧美一区二区mp4| 日本五十路高清| 成人免费观看视频高清| a级毛片在线看网站| 如日韩欧美国产精品一区二区三区| 成人国语在线视频| 黄片播放在线免费| 中文亚洲av片在线观看爽| 日本欧美视频一区| 99国产综合亚洲精品| 国产精品秋霞免费鲁丝片| 久久久久久亚洲精品国产蜜桃av| 黄片播放在线免费| 777久久人妻少妇嫩草av网站| 一级a爱片免费观看的视频| 黑丝袜美女国产一区| 后天国语完整版免费观看| 婷婷丁香在线五月| 午夜日韩欧美国产| 自线自在国产av| 十八禁网站免费在线| 又大又爽又粗| 欧洲精品卡2卡3卡4卡5卡区| 国产99久久九九免费精品| 手机成人av网站| 亚洲 国产 在线| 色综合站精品国产| 欧美日韩一级在线毛片| xxxhd国产人妻xxx| 亚洲中文字幕日韩| 日韩欧美一区二区三区在线观看| 最近最新中文字幕大全免费视频| 最新在线观看一区二区三区| 国产精品电影一区二区三区| 超碰97精品在线观看| 亚洲第一青青草原| 久久亚洲真实| 欧洲精品卡2卡3卡4卡5卡区| 国产成+人综合+亚洲专区| 亚洲 国产 在线| 日韩三级视频一区二区三区| 操出白浆在线播放| 亚洲中文日韩欧美视频| av免费在线观看网站| 一区福利在线观看| 久久99一区二区三区| 美女扒开内裤让男人捅视频| 变态另类成人亚洲欧美熟女 | 女人高潮潮喷娇喘18禁视频| 精品久久久久久久毛片微露脸| 亚洲成a人片在线一区二区| 精品国产国语对白av| 久久欧美精品欧美久久欧美| 女生性感内裤真人,穿戴方法视频| 久久久国产成人免费| 亚洲精品av麻豆狂野| 国产精品综合久久久久久久免费 | 亚洲av五月六月丁香网| 亚洲国产精品sss在线观看 | x7x7x7水蜜桃| 国产成人av激情在线播放| 变态另类成人亚洲欧美熟女 | 91麻豆精品激情在线观看国产 | 777久久人妻少妇嫩草av网站| 在线观看一区二区三区| 高清黄色对白视频在线免费看| 高清av免费在线| 又黄又爽又免费观看的视频| 精品国产一区二区三区四区第35| 国产精品自产拍在线观看55亚洲| 人人妻人人澡人人看| 窝窝影院91人妻| 纯流量卡能插随身wifi吗| 欧美激情 高清一区二区三区| 啪啪无遮挡十八禁网站| 法律面前人人平等表现在哪些方面| 国产精品99久久99久久久不卡| 国产av一区二区精品久久| 亚洲aⅴ乱码一区二区在线播放 | 亚洲一区中文字幕在线| 久久国产乱子伦精品免费另类| av在线天堂中文字幕 | 精品国内亚洲2022精品成人| 欧美日韩亚洲高清精品| 天堂√8在线中文| 男人操女人黄网站| 亚洲在线自拍视频| 日本免费一区二区三区高清不卡 | 精品一区二区三区视频在线观看免费 | 欧美不卡视频在线免费观看 | 他把我摸到了高潮在线观看| 电影成人av| 国产熟女午夜一区二区三区| 在线播放国产精品三级| 中文字幕最新亚洲高清| 岛国在线观看网站| 国产精品香港三级国产av潘金莲| 久久精品国产亚洲av高清一级| 熟女少妇亚洲综合色aaa.| 亚洲精品成人av观看孕妇| 一进一出好大好爽视频| 在线观看免费日韩欧美大片| 在线播放国产精品三级| 国产欧美日韩一区二区三区在线| 国产免费现黄频在线看| 免费不卡黄色视频| www日本在线高清视频| 搡老岳熟女国产| 国产精品久久久久久人妻精品电影| 亚洲国产中文字幕在线视频| a级毛片黄视频| 精品人妻在线不人妻| 中文欧美无线码| 窝窝影院91人妻| 久久欧美精品欧美久久欧美| 国产av精品麻豆| 成人国语在线视频| 免费在线观看视频国产中文字幕亚洲| 日韩成人在线观看一区二区三区| 中文字幕人妻丝袜制服| av网站在线播放免费| 国产视频一区二区在线看| 久久精品国产清高在天天线| 亚洲五月婷婷丁香| 中文字幕av电影在线播放| 国产野战对白在线观看| 在线看a的网站| www.熟女人妻精品国产| 色哟哟哟哟哟哟| 十八禁网站免费在线| 午夜精品久久久久久毛片777| 啦啦啦在线免费观看视频4| 久久欧美精品欧美久久欧美| 久久人妻福利社区极品人妻图片| 成年女人毛片免费观看观看9| 国产视频一区二区在线看| 亚洲成人国产一区在线观看| 国产欧美日韩综合在线一区二区| 亚洲专区字幕在线| avwww免费| 中国美女看黄片| 91精品国产国语对白视频| 天天躁夜夜躁狠狠躁躁| 精品福利永久在线观看| 亚洲欧美日韩高清在线视频| 伊人久久大香线蕉亚洲五| 国产成人精品久久二区二区91| svipshipincom国产片| 亚洲一区二区三区色噜噜 | 在线观看日韩欧美| 亚洲va日本ⅴa欧美va伊人久久| 午夜a级毛片| 欧美乱妇无乱码| 国产成+人综合+亚洲专区| 日韩成人在线观看一区二区三区| 麻豆av在线久日| 午夜日韩欧美国产| 欧美黑人精品巨大| 久久久国产成人免费| 岛国在线观看网站| 日本黄色日本黄色录像| 91麻豆av在线| 久久久久久免费高清国产稀缺| 精品久久久久久久毛片微露脸| 最新在线观看一区二区三区| 国产精品免费视频内射| www.999成人在线观看| av片东京热男人的天堂| 国产精品一区二区精品视频观看| 99在线人妻在线中文字幕| 亚洲avbb在线观看| 久久婷婷成人综合色麻豆| а√天堂www在线а√下载| 黄片播放在线免费| 免费少妇av软件| 国产欧美日韩一区二区精品| 亚洲国产精品合色在线| 长腿黑丝高跟| 亚洲欧美精品综合久久99| 在线观看66精品国产| 国产成人精品在线电影| √禁漫天堂资源中文www| www.自偷自拍.com| 最近最新中文字幕大全免费视频| 午夜免费鲁丝| 亚洲欧美日韩无卡精品| 久久精品亚洲av国产电影网| 精品国产国语对白av| 一进一出好大好爽视频| 日本wwww免费看| 久久国产精品影院| 国产一区二区激情短视频| 欧美成人免费av一区二区三区| 亚洲成人久久性| 18美女黄网站色大片免费观看| 热re99久久国产66热| 男女午夜视频在线观看| 十八禁人妻一区二区| 好看av亚洲va欧美ⅴa在| 国产一卡二卡三卡精品| 国产精品秋霞免费鲁丝片| 国产精品一区二区精品视频观看| 五月开心婷婷网| 伦理电影免费视频| 国产亚洲精品第一综合不卡| 中文欧美无线码| 色老头精品视频在线观看| 黄色视频不卡| 欧洲精品卡2卡3卡4卡5卡区| 12—13女人毛片做爰片一| 亚洲国产欧美一区二区综合| 午夜福利影视在线免费观看| 午夜福利欧美成人| 免费人成视频x8x8入口观看| 人人妻人人澡人人看| 国产高清激情床上av| 日韩精品免费视频一区二区三区| 伊人久久大香线蕉亚洲五| 老司机亚洲免费影院| 黄色丝袜av网址大全| 激情在线观看视频在线高清| 久久中文看片网| 可以免费在线观看a视频的电影网站| 999久久久国产精品视频| 中文欧美无线码| 亚洲欧美精品综合一区二区三区| 香蕉丝袜av| 看片在线看免费视频| 亚洲,欧美精品.| 深夜精品福利| 少妇被粗大的猛进出69影院| 免费在线观看亚洲国产| 热re99久久精品国产66热6| 久久99一区二区三区| 亚洲午夜理论影院| 十八禁网站免费在线| 成人18禁高潮啪啪吃奶动态图| 国产又色又爽无遮挡免费看| 日韩一卡2卡3卡4卡2021年| 老熟妇仑乱视频hdxx| 嫁个100分男人电影在线观看| 老司机深夜福利视频在线观看| 亚洲精品国产精品久久久不卡| 天堂影院成人在线观看| 久久亚洲精品不卡| 久久久久久亚洲精品国产蜜桃av| 欧美亚洲日本最大视频资源| av超薄肉色丝袜交足视频| 成人永久免费在线观看视频| 五月开心婷婷网| 免费在线观看日本一区| 欧美老熟妇乱子伦牲交| 熟女少妇亚洲综合色aaa.| 天天躁狠狠躁夜夜躁狠狠躁| 国产成人一区二区三区免费视频网站| 亚洲三区欧美一区| 精品福利永久在线观看| 午夜福利影视在线免费观看| 天堂√8在线中文| 制服人妻中文乱码| 亚洲国产看品久久| 国产97色在线日韩免费| www.自偷自拍.com| 久久香蕉激情| 天堂俺去俺来也www色官网| 精品福利永久在线观看| 国产精品久久久久成人av| 色综合站精品国产| 免费观看精品视频网站| 免费av毛片视频| 老司机福利观看| 无遮挡黄片免费观看| 无人区码免费观看不卡| 动漫黄色视频在线观看| 亚洲国产欧美一区二区综合| 美国免费a级毛片| 嫩草影院精品99| 一级毛片高清免费大全| 亚洲精品美女久久av网站| 在线播放国产精品三级| 美女午夜性视频免费| av片东京热男人的天堂| 99国产极品粉嫩在线观看| 女警被强在线播放| 悠悠久久av| 久久香蕉激情| 每晚都被弄得嗷嗷叫到高潮| 欧美成狂野欧美在线观看| 日韩中文字幕欧美一区二区| 18美女黄网站色大片免费观看| 日韩国内少妇激情av| 国产精品自产拍在线观看55亚洲| 亚洲中文日韩欧美视频| 色综合站精品国产| 可以在线观看毛片的网站| 亚洲成av片中文字幕在线观看| 丰满迷人的少妇在线观看| 国产蜜桃级精品一区二区三区| 欧美另类亚洲清纯唯美| 日韩精品免费视频一区二区三区| 大码成人一级视频| av在线播放免费不卡| 亚洲国产中文字幕在线视频| 日韩精品免费视频一区二区三区| 亚洲一区高清亚洲精品| 久久人人精品亚洲av| 亚洲欧美激情综合另类| 波多野结衣高清无吗| 18禁黄网站禁片午夜丰满| 纯流量卡能插随身wifi吗| tocl精华| 激情视频va一区二区三区| 超色免费av| 久热爱精品视频在线9| 电影成人av| 九色亚洲精品在线播放| 一个人观看的视频www高清免费观看 | 亚洲 欧美一区二区三区| 88av欧美| 91老司机精品| 日韩欧美三级三区| 国产日韩一区二区三区精品不卡| 在线观看免费视频网站a站| 久久草成人影院| 亚洲欧美日韩无卡精品| 最新在线观看一区二区三区| 亚洲精品在线观看二区| 日韩一卡2卡3卡4卡2021年| 婷婷精品国产亚洲av在线| 亚洲人成伊人成综合网2020| 神马国产精品三级电影在线观看 | 欧美黄色淫秽网站| 新久久久久国产一级毛片| 免费不卡黄色视频| 波多野结衣高清无吗| 热99re8久久精品国产| 韩国精品一区二区三区| 欧美日韩福利视频一区二区| 一进一出抽搐gif免费好疼 | 欧美日韩黄片免| 久久九九热精品免费| 成人av一区二区三区在线看| 精品熟女少妇八av免费久了| 欧美日韩亚洲高清精品| 在线观看免费午夜福利视频| 男人舔女人的私密视频| 国产精品秋霞免费鲁丝片| 婷婷精品国产亚洲av在线| 性少妇av在线| 国产成人系列免费观看| 欧美一级毛片孕妇| 国产不卡一卡二| svipshipincom国产片| 久久天堂一区二区三区四区| 国产av一区在线观看免费| 宅男免费午夜| 国产精品一区二区免费欧美| 一进一出好大好爽视频| 最近最新中文字幕大全电影3 | 操出白浆在线播放| 亚洲专区中文字幕在线| 国产国语露脸激情在线看| 精品人妻1区二区| 女人被狂操c到高潮| 人妻丰满熟妇av一区二区三区| 久久久久国产精品人妻aⅴ院| а√天堂www在线а√下载| 激情在线观看视频在线高清| av超薄肉色丝袜交足视频| 亚洲 欧美 日韩 在线 免费| 国产av又大| 国产深夜福利视频在线观看| 十分钟在线观看高清视频www| 国产在线观看jvid| 法律面前人人平等表现在哪些方面| 国产精品影院久久| 欧美丝袜亚洲另类 | 五月开心婷婷网| 中文字幕精品免费在线观看视频| 99国产精品一区二区蜜桃av| 亚洲熟女毛片儿| 一进一出抽搐动态| 神马国产精品三级电影在线观看 | 久久 成人 亚洲| 极品教师在线免费播放| a级毛片黄视频| 超色免费av| 老熟妇仑乱视频hdxx| 两人在一起打扑克的视频| avwww免费| 国产在线精品亚洲第一网站| 五月开心婷婷网| 免费在线观看视频国产中文字幕亚洲| 老鸭窝网址在线观看| 国产99白浆流出| 日本wwww免费看| 精品国产一区二区三区四区第35| 中文字幕最新亚洲高清| 欧美激情极品国产一区二区三区| av电影中文网址| 国产精品久久视频播放| 每晚都被弄得嗷嗷叫到高潮| 最新在线观看一区二区三区| 午夜a级毛片|