• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    交通場景下基于深度強(qiáng)化學(xué)習(xí)的感知型路徑分配算法

    2022-07-13 01:04:38
    關(guān)鍵詞:分配信息模型

    曹 歡

    (中國科學(xué)技術(shù)大學(xué) 信息科學(xué)技術(shù)學(xué)院,安徽 合肥230026)

    0 引言

    目前我國交通環(huán)境日益復(fù)雜,現(xiàn)有交通體系的服務(wù)能力難以滿足城市居民的出行期望,城市面臨日益嚴(yán)峻的交通管理挑戰(zhàn)。研究者們希望借助交通數(shù)字孿生技術(shù),通過數(shù)據(jù)驅(qū)動(dòng)、精準(zhǔn)建模,實(shí)現(xiàn)交通的模擬、預(yù)測診斷和優(yōu)化[1]。然而在交通仿真模擬層次,現(xiàn)有的路徑分配模塊不能反映出現(xiàn)實(shí)交通的多變狀況。在人-車-路的核心體系中,天氣氣候、交通管制、突發(fā)事故等影響因子將時(shí)刻影響駕駛員的判斷以及路網(wǎng)的狀態(tài)[2]。

    在當(dāng)前的交通數(shù)字孿生系統(tǒng)中,現(xiàn)有的路徑分配方法主要分為兩類,第一類為用于實(shí)現(xiàn)靜態(tài)全局路徑最優(yōu)的傳統(tǒng)算法,如經(jīng)典的蟻群算法、Floyd 算法、A-Star、粒子群算法、Dijkstra 及其改進(jìn)算法等,本質(zhì)為基于圖論中重要的最短路徑問題所提出的各種方案,也即在一個(gè)加權(quán)有向圖中,按一定要求尋找一條權(quán)重總和最短的路徑[3]。如Xu[4]等基于二叉樹結(jié)構(gòu),通過雙向搜索方法加快搜索效率,作為A-Star 改進(jìn)算法;Lee[5]等基于遺傳算法實(shí)現(xiàn)蟻群算法中的參數(shù)調(diào)節(jié)優(yōu)化。在路網(wǎng)信息發(fā)生變化時(shí),該類算法難以做出及時(shí)反饋。如果需要滿足動(dòng)態(tài)路徑規(guī)劃的需求,則需要施加額外的更新優(yōu)化和重規(guī)劃機(jī)制。第二類指的是通過機(jī)器學(xué)習(xí)、時(shí)空神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等技術(shù)來實(shí)現(xiàn)路徑分配。這一類更加強(qiáng)調(diào)數(shù)據(jù)的搜集、分析和處理,通過提取海量歷史數(shù)據(jù)的價(jià)值信息,為解決路徑規(guī)劃問題提供了一個(gè)新的思路[6]。

    本文的中心工作是研究了一種基于傳統(tǒng)路徑算法與深度強(qiáng)化學(xué)習(xí)的感知型路徑分配算法,首先通過改進(jìn)版Dijkstra 算法為所有車輛分配初始路徑,路網(wǎng)中的車輛在不斷感知當(dāng)前位置、行駛軌跡以及目標(biāo)路網(wǎng)中各路段的車流等信息后,通過DDQN(Double DQN)將自動(dòng)選擇是否重新進(jìn)行全局的路徑規(guī)劃,實(shí)現(xiàn)路徑更新。與現(xiàn)有的經(jīng)典路徑規(guī)劃方法相比,本文提出的規(guī)劃方案填補(bǔ)了傳統(tǒng)模型在路況變化下的泛化性、拓展性不足,優(yōu)化了深度學(xué)習(xí)型方法的資源損耗,同時(shí)基于強(qiáng)化學(xué)習(xí)模型在長期收益方面的優(yōu)越性,本文模型更加滿足路徑分配模型對當(dāng)今城市路網(wǎng)交通出行的各種需求。

    1 理論基礎(chǔ)

    1.1 動(dòng)態(tài)交通路網(wǎng)下的路徑分配問題

    交通路網(wǎng)可以看作一個(gè)有著時(shí)序變化的有向圖網(wǎng)絡(luò),將其作為一段時(shí)間內(nèi)的狀態(tài)集合,即為:

    其中,T 指的是時(shí)間周期,在規(guī)定的T 內(nèi),可以將動(dòng)態(tài)交通路網(wǎng)拆成靜態(tài)的網(wǎng)絡(luò)即G。網(wǎng)絡(luò)G 由路段集合以及路網(wǎng)節(jié)點(diǎn)集合構(gòu)成:

    其中,vi∈V 指的是路網(wǎng)節(jié)點(diǎn),i 為節(jié)點(diǎn)編號,ej∈E指的是有向邊路,j 為邊路編號??梢钥吹剑煌臅r(shí)間周期T 下,路網(wǎng)也會(huì)動(dòng)態(tài)變化得到隨時(shí)間更新的網(wǎng)絡(luò)G1,G2,…,Gi,表征不同T 下的路網(wǎng)狀態(tài)。同時(shí),路徑L 正是由路網(wǎng)節(jié)點(diǎn)中的多個(gè)節(jié)點(diǎn)組成的聯(lián)通路徑構(gòu)成的,而重要的兩個(gè)節(jié)點(diǎn)——起終點(diǎn)(Origin-Destination,OD)同樣來源于集合V。因此,L 可視為(v0,v1,v2,…,vd)這一相鄰節(jié)點(diǎn)集[7]。

    為衡量路徑選擇的優(yōu)劣,可通過定義道路代價(jià)函數(shù)的具體表達(dá)式來實(shí)現(xiàn),假設(shè)(va,vb)是取自路徑L 中的任一鄰接節(jié)點(diǎn)集,則該集對應(yīng)的代價(jià)函數(shù)為:

    不同于常見的距離度量如歐式距離、馬氏距離,上式中的δ 是與時(shí)間相關(guān)的時(shí)序函數(shù)即δt,因此路徑L 經(jīng)過相鄰節(jié)點(diǎn)集(v0,v1,v2,…,vd)的總代價(jià)為:

    上式中的n 為時(shí)間步,因此動(dòng)態(tài)路徑分配的問題可以理解為在路徑連續(xù)鄰接邊的集合上的代碼函數(shù)min(WL1,WL2,…,WLn),優(yōu)化目標(biāo)為總代價(jià)最小。進(jìn)一步沿著時(shí)間步展開,即基于時(shí)間t 的OD 路徑分配優(yōu)化問題如下:

    上式指明行駛個(gè)體在每一個(gè)特定周期T 中,都將以最小化代價(jià)函數(shù)的策略原則移動(dòng)。其中的[·]表示T 時(shí)刻內(nèi)的出行路線,l 指的是路徑中的各相鄰路段[3]。

    1.2 強(qiáng)化學(xué)習(xí)在動(dòng)態(tài)路徑分配中的應(yīng)用

    為提升動(dòng)態(tài)路徑分配的拓展性和真實(shí)性,目前的一些動(dòng)態(tài)模型大多以路網(wǎng)中的重要交叉口為決策點(diǎn),不斷更新全局路徑分配結(jié)果,同時(shí)與車輛行駛線路進(jìn)行比較,判定是否需要路徑更新。亦或是通過對路段設(shè)置閾值參數(shù)比如擁堵系數(shù)、排隊(duì)時(shí)長等,如果感知到車輛即將面臨嚴(yán)重?fù)矶?,系統(tǒng)將更新路線。以上的解決方案具備一定的感知性和動(dòng)態(tài)拓展能力,但有著難以忽略的缺陷。前者由于大量冗余的復(fù)雜運(yùn)算造成資源損耗,后者往往只依據(jù)相鄰路段的擁堵狀況來決策,未能考量到路網(wǎng)中路徑分配是一個(gè)需要最大化長期收益的問題[8]。

    車輛在前進(jìn)過程中,到達(dá)靠近路口前的一段區(qū)域時(shí),就需要重新進(jìn)行線路規(guī)劃,然后決定行駛方向。當(dāng)前時(shí)刻的車輛狀態(tài)以及選擇的工作決策會(huì)影響下一時(shí)刻行駛車輛的狀態(tài),故上述問題是一種較為典型的馬爾可夫決策過程(MDP),具備引入強(qiáng)化學(xué)習(xí)的潛在優(yōu)勢[9]:一方面可以提升全局路徑分配的長期收益,另一方面可以高效地開展分析和決策,實(shí)現(xiàn)動(dòng)態(tài)路線更新。

    考慮到本次任務(wù)較為離散的動(dòng)作空間以及動(dòng)態(tài)路網(wǎng)環(huán)境下狀態(tài)空間的連續(xù)性,本文最終采用了DQN 的優(yōu)化模型DDQN,后文會(huì)詳細(xì)介紹。

    2 基于深度強(qiáng)化學(xué)習(xí)的路徑分配模型建模

    2.1 模塊設(shè)計(jì)

    圖1 展示的是整體的模塊設(shè)計(jì),主要分為兩個(gè)階段:階段一是通過改進(jìn)版Dijkstra 實(shí)現(xiàn)初始路徑分配決策,階段二則是在階段一的基礎(chǔ)上實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)訓(xùn)練,完成決策更新。具體如下:

    (1)路網(wǎng)靜態(tài)信息獲取模塊需要獲取相應(yīng)路網(wǎng)結(jié)構(gòu)信息、路網(wǎng)中路段信息以及連接關(guān)系等。

    (2)路網(wǎng)動(dòng)態(tài)信息獲取模塊需要獲取建模區(qū)域內(nèi)各路段的車流數(shù)據(jù),包括平均車流密度等。

    (3)行駛車輛信息集成模塊的任務(wù)是確定車輛行駛中的具體信息,包括起終點(diǎn)路段ID、當(dāng)前路段ID 以及鄰接路段ID。

    (4)State Space(狀態(tài)空間)模塊整合路網(wǎng)信息和車輛自身行駛信息,并對其進(jìn)行數(shù)值化轉(zhuǎn)化,將編碼后的向量作為車輛狀態(tài)。

    (5)Action Space(動(dòng)作空間)模塊負(fù)責(zé)明確Agent(智能體,在本任務(wù)中指的是路網(wǎng)中的車輛)和環(huán)境交互過程中所有潛在行為的Action 集合。同時(shí),在這一部分需要制定馬爾可夫決策過程中Agent 選用不同Action 的策略規(guī)則,較為常見的包括Q 值最大化策略以及貪心策略(ζ-greedy 或UCB)等。

    (6)Reward 反饋模塊則主要定義了強(qiáng)化學(xué)習(xí)問題中的學(xué)習(xí)目標(biāo),在每個(gè)時(shí)間步,環(huán)境向Agent 發(fā)送一個(gè)稱為Reward 的反饋,進(jìn)而實(shí)現(xiàn)訓(xùn)練。Agent 的唯一目標(biāo)是最大化其長期收到的總收益。

    (7)Agent 設(shè)計(jì)/動(dòng)態(tài)路徑分配模塊便是具體的學(xué)習(xí)、訓(xùn)練、預(yù)測部分。

    2.2 算法設(shè)計(jì)

    2.2.1 Dijkstra 算法及改進(jìn)

    區(qū)別于僅使用深度學(xué)習(xí)等技術(shù)的復(fù)雜動(dòng)態(tài)分配算法,本文算法以Dijkstra 改良算法為基礎(chǔ)進(jìn)行強(qiáng)化學(xué)習(xí)決策前的初始化路徑分配工作。

    Dijkstra 算法基于貪心的思想,以當(dāng)前點(diǎn)為圓心不斷向四周擴(kuò)展進(jìn)行路徑搜索,搜索尋優(yōu)過程沒有考量目標(biāo)點(diǎn)的位置以及方向,因此在這一尋優(yōu)過程中所有點(diǎn)被搜索的概率一致。而交通路網(wǎng)中,往往會(huì)有起終點(diǎn)過遠(yuǎn)、可選點(diǎn)眾多這一問題,因此,將Dijkstra 直接用于動(dòng)態(tài)交通條件下的路徑分配問題時(shí),會(huì)出現(xiàn)效率低下、資源損耗嚴(yán)重的挑戰(zhàn)。這種計(jì)算延遲也同樣不符合實(shí)時(shí)性的要求。

    因此本文希望提升Dijkstra 算法在路徑分配方面的運(yùn)算效率,減少計(jì)算時(shí)長。Dijkstra 算法時(shí)間復(fù)雜度是O(n2),以城市交通路網(wǎng)為例,將其視為若干帶權(quán)有向圖,其中大多數(shù)城市交叉口數(shù)目遠(yuǎn)大于1 000,在此數(shù)量級上,資源損耗時(shí)長將呈現(xiàn)指數(shù)增長,產(chǎn)生大量冗余運(yùn)算。

    在此本文設(shè)定優(yōu)先目標(biāo)區(qū)域,在優(yōu)先區(qū)域內(nèi)路徑尋優(yōu),假設(shè)起終點(diǎn)a,b 坐標(biāo)依次為(x0,y0),(x1,y1),以a,b 為圓心繪制圓形區(qū)域,再對上述兩圓形區(qū)域分別做外切線,形成優(yōu)先搜索區(qū)域矩形,如圖2 所示。如未能搜索到最優(yōu)結(jié)果,將在此基礎(chǔ)上拓展圓形區(qū)域半徑,在新的優(yōu)先區(qū)域上實(shí)現(xiàn)搜索。

    圖1 基于深度強(qiáng)化學(xué)習(xí)的路徑分配模塊設(shè)計(jì)

    2.2.2 狀態(tài)空間

    在基于DDQN 的模型中,智能體進(jìn)行判斷的主要依據(jù)為車輛自身信息和感知區(qū)域內(nèi)路網(wǎng)中各路段的車輛密度數(shù)據(jù),在對單個(gè)路段進(jìn)行編號后,需要通過信息整合實(shí)現(xiàn)狀態(tài)描述。本文最終選取一維向量進(jìn)行狀態(tài)s 的表達(dá),這種表示方式有利于提升模型訓(xùn)練效率和表示的準(zhǔn)確性。

    Agent 在t 時(shí)刻的狀態(tài)定義為:

    其中cart表示前面提到的車輛當(dāng)前時(shí)刻t 的自身信息變量,包括出發(fā)點(diǎn)、當(dāng)前點(diǎn)、當(dāng)前路線預(yù)計(jì)的下一到達(dá)點(diǎn)以及目標(biāo)點(diǎn)對應(yīng)的路段ID,即:

    同時(shí),roadt指的是路網(wǎng)中各路段的交通流密度數(shù)據(jù)變量,表達(dá)式如下:

    其中n 為路段總數(shù)目,ρi表示第i 條路段對應(yīng)的平均車流密度。在上述基礎(chǔ)上繼續(xù)開展動(dòng)作空間設(shè)計(jì)。

    2.2.3 動(dòng)作空間

    鑒于本文中的DDQN 模型是在改良版本的Dijkstra上進(jìn)行路徑優(yōu)化,即車輛依據(jù)當(dāng)前狀態(tài)判定是否需要更新路徑分配結(jié)果,因此這里的動(dòng)作空間得以極大簡化,可以定義為:A=[a0,a1]。a0表示無需進(jìn)行路徑更新,當(dāng)前路線即為最優(yōu);a1表示當(dāng)前路線需要優(yōu)化,需重新調(diào)用路徑分配模型實(shí)現(xiàn)更新。

    值得強(qiáng)調(diào)的是,為了防止系統(tǒng)回溯這一冗余操作,減少歷史選擇路線對現(xiàn)有模型的噪聲干擾,必須記錄歷史途徑信息,防止Agent 趨于過度判斷。同時(shí)考慮到強(qiáng)化學(xué)習(xí)的Exploration & Exploitation(探索與利用機(jī)制),模型選用的動(dòng)作選擇策略如下:

    該策略既能以較大概率選擇Q 值大的動(dòng)作,也保留了較小概率的探索能力。

    2.2.4 獎(jiǎng)勵(lì)函數(shù)

    強(qiáng)化學(xué)習(xí)的標(biāo)準(zhǔn)交互過程如下:每個(gè)時(shí)刻,智能體根據(jù)其策略(Policy),在當(dāng)前所處狀態(tài)(State)選擇一個(gè)動(dòng)作(Action),環(huán)境(Environment)對這些動(dòng)作做出響應(yīng),轉(zhuǎn)移到新狀態(tài),同時(shí)產(chǎn)生一個(gè)獎(jiǎng)勵(lì)信號(Reward),這通常是一個(gè)數(shù)值,獎(jiǎng)勵(lì)的折扣累加和稱為收益/回報(bào)(Return),這是智能體在動(dòng)作選擇過程中想要最大化的目標(biāo)[10]。

    圖2 優(yōu)先搜索區(qū)域示意圖

    本模型的優(yōu)化目標(biāo)著眼于最小化車輛到達(dá)目標(biāo)點(diǎn)的行駛總時(shí)長。Agent 采取動(dòng)作后,狀態(tài)開始轉(zhuǎn)移,即在當(dāng)前決策點(diǎn)/區(qū)域進(jìn)行路徑重分配判斷后,將花費(fèi)一定時(shí)間到達(dá)下一個(gè)決策點(diǎn)/區(qū)域,因此Agent的行駛總時(shí)長可以視為每相鄰決策點(diǎn)的時(shí)間間隔總和,再加上額外的路口等待時(shí)長、擁堵排隊(duì)時(shí)長等。因此定義獎(jiǎng)勵(lì)函數(shù)為:

    其中ti為從第i-1 個(gè)決策點(diǎn)到達(dá)第i 個(gè)決策點(diǎn)的時(shí)間間隔,tdelay為對應(yīng)時(shí)期的各種等待時(shí)長,琢為自定義等待權(quán)重系數(shù),可根據(jù)實(shí)際需要調(diào)節(jié)。該獎(jiǎng)勵(lì)函數(shù)能夠保證模型會(huì)趨于行駛時(shí)間短的鄰接路線,獲得短期激勵(lì)。通過取相反數(shù)也能夠綜合考量等待時(shí)長對決策的影響,符合長期收益原則。

    2.2.5 DDQN 訓(xùn)練模型

    DDQN 是Double DQN 的縮寫,是在DQN 的基礎(chǔ)上改進(jìn)而來的。DDQN 的模型結(jié)構(gòu)基本與DQN 的模型結(jié)構(gòu)一樣,唯一不同的就是它們的目標(biāo)函數(shù):

    DDQN 與DQN 結(jié)構(gòu)類似,其模型結(jié)構(gòu)如圖3 所示。DDQN 包含兩個(gè)結(jié)構(gòu)完全相同但是參數(shù)存在差異的網(wǎng)絡(luò),預(yù)測Q 估計(jì)的主網(wǎng)絡(luò)MainNet 使用的是最新的參數(shù),而預(yù)測Q 現(xiàn)實(shí)的目標(biāo)網(wǎng)絡(luò)TargetNet 使用的是較早前的參數(shù)。主網(wǎng)絡(luò)MainNet 的輸出Q(s,a;茲i)用來評估當(dāng)前狀態(tài)-動(dòng)作對的值函數(shù)。目標(biāo)網(wǎng)絡(luò)TargetNet 的輸出Q(s,a;)可以用來求解目標(biāo)Q值。當(dāng)智能體對環(huán)境采取動(dòng)作a 時(shí)就可以根據(jù)上述式 (12) 計(jì)算出Q 值并根據(jù)損失函數(shù)更新主網(wǎng)絡(luò)MainNet 的參數(shù),每經(jīng)過一定次數(shù)的迭代,將主網(wǎng)絡(luò)MainNet 的參數(shù)復(fù)制給目標(biāo)網(wǎng)絡(luò)TargetNet。這樣就完成了一次學(xué)習(xí)過程[9]。

    基于模型狀態(tài)空間設(shè)計(jì),本文通過一維多元向量描述智能體狀態(tài),同時(shí)采用了多層感知機(jī)(Multilayer Perceptron,MLP)作為Q_value 網(wǎng)絡(luò),MLP 中隱藏層數(shù)目為3,每一層包含2×(N+3)個(gè)神經(jīng)元。最終的訓(xùn)練模型包括輸入層、3 層全連接隱藏層以及輸出層等結(jié)構(gòu)?;趫D3 所示神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)進(jìn)行訓(xùn)練,Loss 函數(shù)見式(12),模型可輸出兩個(gè)Q 值。當(dāng)前值網(wǎng)絡(luò)用于更新現(xiàn)有參數(shù),再經(jīng)過時(shí)間間隔N 后將參數(shù)復(fù)制給目標(biāo)值網(wǎng)絡(luò)進(jìn)行參數(shù)更新。

    3 實(shí)驗(yàn)結(jié)果及分析

    3.1 仿真場景

    從開源網(wǎng)站Open Street Map 官網(wǎng)下載北京市部分路網(wǎng),包括13 020 個(gè)路段以及9 873 個(gè)節(jié)點(diǎn)。在ArcGIS 軟件中對獲取的osm 地圖文件進(jìn)行讀取修改,鑒于直接下載的路網(wǎng)文件存在大量低質(zhì)量路段,因此將其編碼成可讀取的矢量地圖文件(.shp),然后進(jìn)行數(shù)據(jù)清洗和分析,最終的路網(wǎng)呈現(xiàn)效果如圖4 所示。同時(shí),為進(jìn)一步進(jìn)行實(shí)驗(yàn),提取了所在區(qū)域的所有路段編號ID、長度位置信息以及對應(yīng)拓?fù)潢P(guān)系等。此外另采集了一天內(nèi)該區(qū)域近3 000 輛浮動(dòng)車的行駛數(shù)據(jù)。實(shí)驗(yàn)環(huán)境為Intel?I7-8750H CPU@2.20 GHz,64 GB 內(nèi)存,Windows10 64 位操作系統(tǒng)。

    圖4 北京市路網(wǎng)文件

    3.2 實(shí)驗(yàn)方案

    將本文提出的路徑動(dòng)態(tài)分配方法分別與Dijkstra、A*、動(dòng)態(tài)A*算法進(jìn)行實(shí)驗(yàn)對比。其中DDQN的訓(xùn)練參數(shù)如表1 所示。

    表1 DDQN 訓(xùn)練參數(shù)

    為了捕捉路網(wǎng)動(dòng)態(tài)信息對路徑規(guī)劃造成的影響,本文針對北京市路網(wǎng)開展兩個(gè)時(shí)間點(diǎn)下的對比試驗(yàn),選取的時(shí)間點(diǎn)依次為8:00 以及13:00。實(shí)驗(yàn)首先確定待觀察的OD 點(diǎn)對,接著針對OD 點(diǎn)對分別在兩個(gè)時(shí)間點(diǎn)上開展路徑請求,各模型平均訪問遍歷節(jié)點(diǎn)數(shù)目如表2 所示。

    表2 OD 點(diǎn)對訪問節(jié)點(diǎn)數(shù)

    從表2 可以看出,在算法搜索效率上,傳統(tǒng)Dijkstra 算法效率最低,依據(jù)貪心策略展開搜索的Dijkstra 由于其復(fù)雜度為o(n2),導(dǎo)致需要遍歷的節(jié)點(diǎn)數(shù)最多,達(dá)到4 728 和4 435。A*以及動(dòng)態(tài)A*算法相較于傳統(tǒng)的Dijkstra 遍歷節(jié)點(diǎn)數(shù)目分別下降32%以及61% ,這是基于這兩個(gè)算法啟發(fā)式的搜索策略[12]。本文模型的遍歷訪問節(jié)點(diǎn)數(shù)分別為1 430和1 230,相較最差的Dijkstra 分別有70%和72%的明顯提升,均為最優(yōu),符合實(shí)驗(yàn)預(yù)期。另外由于8:00處于上班高峰期,因此擁堵現(xiàn)象會(huì)加重,模型感知到的信息更加復(fù)雜,會(huì)趨于做出更多嘗試性的路徑分配。

    為進(jìn)一步驗(yàn)證模型中深度強(qiáng)化學(xué)習(xí)在路徑分配性能上的作用,實(shí)驗(yàn)綜合納入行駛時(shí)間、行駛距離以及延遲等待時(shí)間(車速小于1 m/s 的時(shí)長)作為具體的指標(biāo)因子[13]。在這里本文額外加入了依據(jù)分層理論的CH 路徑算法,指標(biāo)記錄如表3 所示。

    表3 性能對比表

    從表3 可知,本文提出的結(jié)合深度強(qiáng)化學(xué)習(xí)和傳統(tǒng)靜態(tài)路徑分配算法的優(yōu)化模型在行駛耗費(fèi)時(shí)間以及等待延誤時(shí)間上表現(xiàn)突出,其中行駛時(shí)間相較A*縮短14.91%,等待時(shí)間更是較于A*大幅減少35.93%。值得注意的是,在行駛距離這一指標(biāo)上,本文模型表現(xiàn)略差于其他對比模型,這是由于在強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)設(shè)計(jì)階段,延誤等待時(shí)間權(quán)重較高的影響,這也從另外一方面驗(yàn)證了本文模型出色的動(dòng)態(tài)路徑分配性能和深度強(qiáng)化學(xué)習(xí)在長期收益方面的優(yōu)越性[14]。

    4 結(jié)論

    針對復(fù)雜多變的動(dòng)態(tài)交通路網(wǎng),本文提出了一種結(jié)合傳統(tǒng)路徑算法與深度強(qiáng)化學(xué)習(xí)的感知型路徑分配算法,模型依據(jù)改進(jìn)的靜態(tài)路徑分配算法生成路徑分配的初始化結(jié)果,之后Agent 感知路網(wǎng)變化,包括當(dāng)前位置、行駛軌跡以及目標(biāo)路網(wǎng)中各路段的車流等信息后,通過DDQN 網(wǎng)絡(luò)模型進(jìn)行動(dòng)作選擇,完成狀態(tài)轉(zhuǎn)移,實(shí)現(xiàn)路徑分配再更新。

    經(jīng)過大量仿真實(shí)驗(yàn)表明,相較于經(jīng)典的路徑分配模型,本文模型無論是在搜索尋優(yōu)效率上,還是在最終的性能指標(biāo)(行駛時(shí)間以及等待時(shí)間)上都表現(xiàn)出色,這一方面是由于對動(dòng)態(tài)信息的搜集和感知學(xué)習(xí),另一方面是基于深度強(qiáng)化學(xué)習(xí)獨(dú)有的提升系統(tǒng)長期收益能力。

    猜你喜歡
    分配信息模型
    一半模型
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    應(yīng)答器THR和TFFR分配及SIL等級探討
    遺產(chǎn)的分配
    一種分配十分不均的財(cái)富
    績效考核分配的實(shí)踐與思考
    訂閱信息
    中華手工(2017年2期)2017-06-06 23:00:31
    3D打印中的模型分割與打包
    展會(huì)信息
    伊人久久国产一区二区| 亚洲,欧美精品.| 亚洲成av片中文字幕在线观看| 亚洲第一区二区三区不卡| 欧美人与性动交α欧美精品济南到| 高清av免费在线| 99久久综合免费| 啦啦啦啦在线视频资源| 男女床上黄色一级片免费看| 18在线观看网站| 高清av免费在线| 亚洲自偷自拍图片 自拍| 自线自在国产av| 宅男免费午夜| 香蕉国产在线看| 欧美国产精品一级二级三级| 国产老妇伦熟女老妇高清| 国产野战对白在线观看| 男女之事视频高清在线观看 | 久久久久国产一级毛片高清牌| 91精品伊人久久大香线蕉| 美女视频免费永久观看网站| 中文字幕人妻丝袜一区二区 | 久久国产精品大桥未久av| 在线观看免费午夜福利视频| xxxhd国产人妻xxx| 精品国产超薄肉色丝袜足j| 另类亚洲欧美激情| 国产极品天堂在线| 亚洲精品国产色婷婷电影| 亚洲一区中文字幕在线| 80岁老熟妇乱子伦牲交| 欧美日韩成人在线一区二区| 亚洲av电影在线观看一区二区三区| 人妻人人澡人人爽人人| 久久久久久久国产电影| 午夜福利一区二区在线看| 精品视频人人做人人爽| 欧美人与善性xxx| 日日啪夜夜爽| 性色av一级| 国产 精品1| 丰满少妇做爰视频| 天堂俺去俺来也www色官网| 伊人久久国产一区二区| 欧美日本中文国产一区发布| 日韩一本色道免费dvd| 久久久国产精品麻豆| 交换朋友夫妻互换小说| 日韩伦理黄色片| 久久久精品94久久精品| 丰满迷人的少妇在线观看| 精品少妇内射三级| 一边摸一边抽搐一进一出视频| 欧美久久黑人一区二区| 91精品伊人久久大香线蕉| 777久久人妻少妇嫩草av网站| 三上悠亚av全集在线观看| h视频一区二区三区| 巨乳人妻的诱惑在线观看| 美女午夜性视频免费| 18禁观看日本| 国产精品香港三级国产av潘金莲 | 久久久久久人妻| 国产日韩欧美在线精品| 欧美老熟妇乱子伦牲交| 不卡视频在线观看欧美| 欧美xxⅹ黑人| 成人国产麻豆网| 日日撸夜夜添| 久久99热这里只频精品6学生| av国产精品久久久久影院| 大片免费播放器 马上看| 国产精品免费视频内射| 美女视频免费永久观看网站| 精品人妻一区二区三区麻豆| 国产免费又黄又爽又色| 久热这里只有精品99| 国产淫语在线视频| 亚洲第一青青草原| 免费在线观看完整版高清| 老汉色av国产亚洲站长工具| 人体艺术视频欧美日本| 国产精品久久久久久人妻精品电影 | 亚洲成人手机| 色婷婷久久久亚洲欧美| 精品国产超薄肉色丝袜足j| 成年av动漫网址| av在线app专区| 18禁国产床啪视频网站| 久久人妻熟女aⅴ| 日韩av在线免费看完整版不卡| 亚洲精品乱久久久久久| 日韩欧美精品免费久久| 国产深夜福利视频在线观看| 久久久国产精品麻豆| 少妇人妻 视频| 两个人看的免费小视频| 日韩一区二区三区影片| 国产成人午夜福利电影在线观看| 日韩av不卡免费在线播放| √禁漫天堂资源中文www| 国产精品99久久99久久久不卡 | 午夜久久久在线观看| 丝袜脚勾引网站| 精品视频人人做人人爽| av.在线天堂| 国产熟女午夜一区二区三区| 精品午夜福利在线看| 啦啦啦在线免费观看视频4| 人人妻人人添人人爽欧美一区卜| av不卡在线播放| 亚洲av综合色区一区| 在线观看www视频免费| 午夜福利视频在线观看免费| 亚洲精品美女久久久久99蜜臀 | 五月开心婷婷网| 一级片免费观看大全| 免费av中文字幕在线| 午夜激情av网站| 另类亚洲欧美激情| 欧美亚洲 丝袜 人妻 在线| 搡老乐熟女国产| 麻豆精品久久久久久蜜桃| 久久亚洲国产成人精品v| 十八禁人妻一区二区| 制服人妻中文乱码| 亚洲av综合色区一区| 日韩,欧美,国产一区二区三区| 哪个播放器可以免费观看大片| 看免费av毛片| 亚洲精品国产av蜜桃| 你懂的网址亚洲精品在线观看| 最近中文字幕2019免费版| 成人黄色视频免费在线看| 777米奇影视久久| 亚洲色图综合在线观看| 国产一级毛片在线| 国产一区二区三区综合在线观看| 免费高清在线观看视频在线观看| 欧美少妇被猛烈插入视频| netflix在线观看网站| 丝袜在线中文字幕| 精品人妻熟女毛片av久久网站| 老鸭窝网址在线观看| 国产成人免费观看mmmm| 又黄又粗又硬又大视频| 亚洲国产成人一精品久久久| 两个人免费观看高清视频| 亚洲成色77777| 人成视频在线观看免费观看| 视频在线观看一区二区三区| 女人精品久久久久毛片| 久久ye,这里只有精品| 高清不卡的av网站| 一级a爱视频在线免费观看| 亚洲精品久久成人aⅴ小说| 久久久国产精品麻豆| 精品免费久久久久久久清纯 | 亚洲av日韩精品久久久久久密 | 99国产综合亚洲精品| 成人国语在线视频| 黄色毛片三级朝国网站| 午夜激情av网站| 午夜福利一区二区在线看| 制服丝袜香蕉在线| 天天躁夜夜躁狠狠久久av| 99香蕉大伊视频| 国产精品欧美亚洲77777| 亚洲情色 制服丝袜| 另类精品久久| 亚洲第一av免费看| 人妻一区二区av| 国产熟女欧美一区二区| 这个男人来自地球电影免费观看 | 在线观看人妻少妇| 欧美日韩一区二区视频在线观看视频在线| 国产一区亚洲一区在线观看| 老司机深夜福利视频在线观看 | 少妇的丰满在线观看| 精品一区二区三区av网在线观看 | 欧美乱码精品一区二区三区| 超碰97精品在线观看| 国产在线一区二区三区精| 久久婷婷青草| 亚洲成人av在线免费| 十八禁人妻一区二区| 各种免费的搞黄视频| 国产免费视频播放在线视频| 天天躁夜夜躁狠狠躁躁| 黄片小视频在线播放| 日韩av不卡免费在线播放| 啦啦啦在线观看免费高清www| 高清不卡的av网站| 老司机亚洲免费影院| 精品国产一区二区三区四区第35| 欧美日韩综合久久久久久| 久久这里只有精品19| 看免费av毛片| 国产片特级美女逼逼视频| tube8黄色片| 亚洲av日韩在线播放| av福利片在线| 亚洲精品乱久久久久久| xxxhd国产人妻xxx| 欧美成人午夜精品| 国产免费又黄又爽又色| 纵有疾风起免费观看全集完整版| 日本猛色少妇xxxxx猛交久久| 女人爽到高潮嗷嗷叫在线视频| 在线亚洲精品国产二区图片欧美| 一区二区日韩欧美中文字幕| av.在线天堂| 18禁裸乳无遮挡动漫免费视频| netflix在线观看网站| 一级爰片在线观看| 国产成人精品久久二区二区91 | 亚洲婷婷狠狠爱综合网| 999精品在线视频| 尾随美女入室| 国产精品国产三级专区第一集| 精品一区二区三区av网在线观看 | 无限看片的www在线观看| 国产亚洲av片在线观看秒播厂| 亚洲,欧美精品.| 欧美激情高清一区二区三区 | 韩国精品一区二区三区| 成年人免费黄色播放视频| 欧美xxⅹ黑人| 国产亚洲午夜精品一区二区久久| 女性被躁到高潮视频| 极品少妇高潮喷水抽搐| 亚洲第一区二区三区不卡| 国产成人欧美在线观看 | e午夜精品久久久久久久| 精品一区二区三区av网在线观看 | 国精品久久久久久国模美| 国产精品久久久久久精品电影小说| 老熟女久久久| 久久精品熟女亚洲av麻豆精品| 不卡视频在线观看欧美| 大陆偷拍与自拍| 一区在线观看完整版| 中文字幕色久视频| 欧美日韩国产mv在线观看视频| 免费黄色在线免费观看| 黄片小视频在线播放| 男女下面插进去视频免费观看| 男女高潮啪啪啪动态图| 久久久久久人人人人人| 尾随美女入室| 大香蕉久久成人网| 观看美女的网站| 97精品久久久久久久久久精品| 午夜免费男女啪啪视频观看| 亚洲精品自拍成人| 亚洲国产欧美在线一区| 老司机深夜福利视频在线观看 | 亚洲欧洲日产国产| 色婷婷久久久亚洲欧美| 美女中出高潮动态图| 岛国毛片在线播放| 美女大奶头黄色视频| 男女边吃奶边做爰视频| 国产片特级美女逼逼视频| 精品人妻在线不人妻| 十八禁人妻一区二区| 中国国产av一级| 一区二区三区激情视频| 免费高清在线观看日韩| 高清av免费在线| 亚洲精品成人av观看孕妇| 两个人免费观看高清视频| 久久99一区二区三区| 色吧在线观看| 老司机亚洲免费影院| 伊人久久国产一区二区| 欧美xxⅹ黑人| 成人影院久久| 午夜精品国产一区二区电影| 欧美最新免费一区二区三区| 精品国产一区二区久久| 免费在线观看视频国产中文字幕亚洲 | 国产毛片在线视频| 男女下面插进去视频免费观看| 精品一区在线观看国产| 青春草国产在线视频| 久久鲁丝午夜福利片| 日韩av不卡免费在线播放| 久久影院123| 如何舔出高潮| 国产一区二区三区综合在线观看| 国产高清不卡午夜福利| 菩萨蛮人人尽说江南好唐韦庄| av卡一久久| 黄网站色视频无遮挡免费观看| 国产精品国产av在线观看| 亚洲av日韩在线播放| 亚洲精品国产一区二区精华液| 国产精品嫩草影院av在线观看| 人妻 亚洲 视频| 日韩大码丰满熟妇| 日本爱情动作片www.在线观看| 日本91视频免费播放| 欧美在线一区亚洲| 成人国产av品久久久| 欧美精品av麻豆av| 女的被弄到高潮叫床怎么办| 国产熟女欧美一区二区| 精品一区在线观看国产| 亚洲熟女毛片儿| 国产一区二区三区综合在线观看| 久久久久国产一级毛片高清牌| 欧美成人午夜精品| 成人免费观看视频高清| 各种免费的搞黄视频| a 毛片基地| videosex国产| 亚洲国产中文字幕在线视频| 免费看av在线观看网站| 99国产精品免费福利视频| 亚洲精品,欧美精品| 国精品久久久久久国模美| 一区二区日韩欧美中文字幕| 成人黄色视频免费在线看| av国产精品久久久久影院| 亚洲少妇的诱惑av| 日韩人妻精品一区2区三区| 观看美女的网站| 狠狠精品人妻久久久久久综合| 国产精品.久久久| av片东京热男人的天堂| 成年人午夜在线观看视频| 亚洲少妇的诱惑av| 大话2 男鬼变身卡| 亚洲,一卡二卡三卡| 午夜精品国产一区二区电影| 国产熟女欧美一区二区| 观看美女的网站| 国产亚洲精品第一综合不卡| 汤姆久久久久久久影院中文字幕| 两个人看的免费小视频| 欧美成人精品欧美一级黄| 国产成人精品无人区| 免费观看性生交大片5| 精品一品国产午夜福利视频| 日本一区二区免费在线视频| 美女国产高潮福利片在线看| 在线天堂中文资源库| 一边亲一边摸免费视频| 狂野欧美激情性bbbbbb| 老汉色av国产亚洲站长工具| 观看av在线不卡| 日韩免费高清中文字幕av| 男女无遮挡免费网站观看| 欧美精品一区二区免费开放| 国产1区2区3区精品| 男女无遮挡免费网站观看| 操出白浆在线播放| 一级毛片我不卡| 国产一卡二卡三卡精品 | 国精品久久久久久国模美| 天天躁狠狠躁夜夜躁狠狠躁| 又大又黄又爽视频免费| 午夜激情av网站| 成人免费观看视频高清| 欧美日韩成人在线一区二区| 不卡av一区二区三区| av.在线天堂| 99精国产麻豆久久婷婷| 一级毛片我不卡| 最近中文字幕2019免费版| 9191精品国产免费久久| 久久国产精品大桥未久av| 国产免费一区二区三区四区乱码| 99精国产麻豆久久婷婷| 99久国产av精品国产电影| 国产av精品麻豆| 国产免费一区二区三区四区乱码| 中文字幕另类日韩欧美亚洲嫩草| 在现免费观看毛片| 伊人亚洲综合成人网| 国产精品99久久99久久久不卡 | 秋霞在线观看毛片| 汤姆久久久久久久影院中文字幕| 亚洲av综合色区一区| 哪个播放器可以免费观看大片| 飞空精品影院首页| 亚洲欧洲国产日韩| 日日啪夜夜爽| 爱豆传媒免费全集在线观看| 一区福利在线观看| 亚洲欧洲精品一区二区精品久久久 | 满18在线观看网站| 亚洲婷婷狠狠爱综合网| 久久人妻熟女aⅴ| www日本在线高清视频| 永久免费av网站大全| 一边摸一边抽搐一进一出视频| 亚洲av欧美aⅴ国产| 亚洲欧美一区二区三区国产| 只有这里有精品99| 午夜精品国产一区二区电影| 亚洲伊人久久精品综合| 少妇精品久久久久久久| 熟女少妇亚洲综合色aaa.| avwww免费| 国产激情久久老熟女| 国产av一区二区精品久久| 国产高清国产精品国产三级| 99re6热这里在线精品视频| 久久97久久精品| 久久女婷五月综合色啪小说| 最近手机中文字幕大全| 伊人亚洲综合成人网| 久久人人爽人人片av| 国产精品偷伦视频观看了| 久久久久久免费高清国产稀缺| 美女主播在线视频| 精品人妻一区二区三区麻豆| 一级片'在线观看视频| 亚洲人成网站在线观看播放| xxxhd国产人妻xxx| 欧美日韩综合久久久久久| 久久精品亚洲熟妇少妇任你| 亚洲av中文av极速乱| 丰满饥渴人妻一区二区三| 免费观看a级毛片全部| 男人舔女人的私密视频| 亚洲精品乱久久久久久| 少妇被粗大的猛进出69影院| 看免费av毛片| 在线天堂最新版资源| 亚洲精品日本国产第一区| 日韩av不卡免费在线播放| 丰满饥渴人妻一区二区三| 最黄视频免费看| 老熟女久久久| 大片电影免费在线观看免费| 免费在线观看完整版高清| 日日摸夜夜添夜夜爱| 人体艺术视频欧美日本| 777久久人妻少妇嫩草av网站| 大香蕉久久成人网| 老熟女久久久| 2018国产大陆天天弄谢| 高清视频免费观看一区二区| 99久久综合免费| 免费观看av网站的网址| 亚洲精品成人av观看孕妇| 哪个播放器可以免费观看大片| 久久精品国产a三级三级三级| 男女之事视频高清在线观看 | 麻豆精品久久久久久蜜桃| 99精品久久久久人妻精品| 丝瓜视频免费看黄片| 爱豆传媒免费全集在线观看| 久久天堂一区二区三区四区| 国产免费视频播放在线视频| 久久精品国产亚洲av高清一级| 免费黄色在线免费观看| 免费在线观看黄色视频的| 免费黄频网站在线观看国产| 男女国产视频网站| 久久鲁丝午夜福利片| 精品久久久精品久久久| 男女边摸边吃奶| 蜜桃国产av成人99| 99久久精品国产亚洲精品| 久久精品熟女亚洲av麻豆精品| 久久热在线av| 黑丝袜美女国产一区| 女性被躁到高潮视频| 一区二区三区精品91| 九九爱精品视频在线观看| 少妇的丰满在线观看| 国产成人午夜福利电影在线观看| 日日爽夜夜爽网站| 亚洲国产精品一区二区三区在线| 在线观看www视频免费| 亚洲国产av影院在线观看| 男人添女人高潮全过程视频| 日韩成人av中文字幕在线观看| 成人亚洲欧美一区二区av| 欧美日韩av久久| 欧美日韩视频精品一区| 无遮挡黄片免费观看| 精品一区在线观看国产| 久久精品人人爽人人爽视色| 欧美日韩av久久| 波多野结衣一区麻豆| 男女午夜视频在线观看| svipshipincom国产片| 啦啦啦 在线观看视频| 无限看片的www在线观看| 又大又爽又粗| 人人妻,人人澡人人爽秒播 | 啦啦啦在线免费观看视频4| 国产av码专区亚洲av| 亚洲五月色婷婷综合| 成人国产麻豆网| 国产日韩欧美在线精品| 欧美日韩视频高清一区二区三区二| 亚洲成人av在线免费| 久热爱精品视频在线9| 日本一区二区免费在线视频| 男女无遮挡免费网站观看| 日本av手机在线免费观看| 一级毛片黄色毛片免费观看视频| 亚洲欧美激情在线| 精品一区二区免费观看| 久久久欧美国产精品| 亚洲成人手机| 亚洲激情五月婷婷啪啪| 亚洲av成人不卡在线观看播放网 | 18禁裸乳无遮挡动漫免费视频| 国产不卡av网站在线观看| 国产成人a∨麻豆精品| 亚洲av欧美aⅴ国产| 女的被弄到高潮叫床怎么办| av网站在线播放免费| 老汉色av国产亚洲站长工具| 国产精品嫩草影院av在线观看| 国产一区二区三区av在线| 精品亚洲成国产av| av天堂久久9| 色网站视频免费| 一二三四在线观看免费中文在| 成人国产麻豆网| 精品人妻在线不人妻| 美女福利国产在线| 麻豆av在线久日| 99久久人妻综合| 国产片内射在线| 国产男女超爽视频在线观看| 麻豆乱淫一区二区| 日韩一卡2卡3卡4卡2021年| 人妻 亚洲 视频| 精品少妇内射三级| 日韩av不卡免费在线播放| 韩国精品一区二区三区| 国产视频首页在线观看| 人体艺术视频欧美日本| 啦啦啦啦在线视频资源| 777米奇影视久久| 看免费成人av毛片| 久久久久精品性色| 亚洲av成人精品一二三区| 考比视频在线观看| netflix在线观看网站| 亚洲精品久久久久久婷婷小说| 男女午夜视频在线观看| 91老司机精品| 在线看a的网站| 中文字幕亚洲精品专区| 午夜久久久在线观看| 性高湖久久久久久久久免费观看| 一二三四在线观看免费中文在| 日韩制服骚丝袜av| a级片在线免费高清观看视频| 午夜日韩欧美国产| 欧美精品人与动牲交sv欧美| 久久精品国产a三级三级三级| 搡老乐熟女国产| 国产av精品麻豆| 亚洲精品在线美女| 一级片'在线观看视频| 亚洲中文av在线| 狂野欧美激情性bbbbbb| 日日撸夜夜添| 1024香蕉在线观看| 欧美人与性动交α欧美软件| 亚洲一卡2卡3卡4卡5卡精品中文| 精品人妻在线不人妻| 亚洲欧美一区二区三区久久| 成人手机av| 日韩 欧美 亚洲 中文字幕| 卡戴珊不雅视频在线播放| 日韩人妻精品一区2区三区| 伊人久久国产一区二区| 人人澡人人妻人| 高清黄色对白视频在线免费看| 国产爽快片一区二区三区| av一本久久久久| 中文字幕人妻丝袜制服| 女的被弄到高潮叫床怎么办| av一本久久久久| 你懂的网址亚洲精品在线观看| 婷婷色av中文字幕| 午夜激情久久久久久久| 色94色欧美一区二区| 久久久精品区二区三区| 久久久国产一区二区| 亚洲av电影在线进入| 久久久久久免费高清国产稀缺| 一边亲一边摸免费视频| 亚洲人成77777在线视频| 性色av一级| 2018国产大陆天天弄谢| 免费高清在线观看日韩| 国产无遮挡羞羞视频在线观看| 美女扒开内裤让男人捅视频| 国产男女超爽视频在线观看| 国产精品久久久久久精品古装| 亚洲欧洲日产国产| 国产av码专区亚洲av| 欧美成人精品欧美一级黄| www.熟女人妻精品国产| 肉色欧美久久久久久久蜜桃| 晚上一个人看的免费电影| 久久久久精品国产欧美久久久 | 少妇精品久久久久久久| 国产成人免费无遮挡视频| 欧美日韩成人在线一区二区| 久久狼人影院|