• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    深度強化學(xué)習(xí)解決動態(tài)旅行商問題

    2022-05-07 07:07:56陳浩杰范江亭
    計算機應(yīng)用 2022年4期

    陳浩杰,范江亭,劉 勇

    (黑龍江大學(xué)計算機科學(xué)與技術(shù)學(xué)院,哈爾濱 150006)

    0 引言

    生活中的運輸路線的設(shè)計、配送快遞等旅行商問題往往會涉及選擇動作的過程,即節(jié)點序列順序的預(yù)測問題,例如對于運輸路線的設(shè)計決定以什么順序設(shè)計運輸路線,快遞配送問題是決定在下一個時間選擇哪個客戶節(jié)點作為配送點等,這些決策問題都屬于組合優(yōu)化問題中的旅行商問題,并且很多情況下屬于NP-hard 問題,加入動態(tài)網(wǎng)絡(luò)信息后,問題所映射到圖的規(guī)模非常大,解決這些問題的資源消耗隨著圖的節(jié)點增多呈指數(shù)倍數(shù)增長,所以有必要針對這些問題研究出更加貼合實際的求解方法。

    近些年,利用強化學(xué)習(xí)自動學(xué)習(xí)不斷變化的節(jié)點信息的算法成為機器學(xué)習(xí)的一大新的探索,本文提出一個結(jié)合變體Transformer機制和分布式強化學(xué)習(xí)的統(tǒng)一模型Dy4TSP(Dynamic model for Traveling Salesman Problems),來求解動態(tài)旅行商問題中涉及到圖的動態(tài)節(jié)點的情況。為了更高效地處理動態(tài)圖信息,在輸出節(jié)點序列時,使用Transformer 的變體通過某種方式得到與每個輸入序列相關(guān)聯(lián)的權(quán)值,用此權(quán)值來指導(dǎo)模型輸出。整個模型只需要輸入動態(tài)圖信息,選擇要處理的旅行商問題類型,就可以預(yù)測出對應(yīng)問題的幾種最優(yōu)決策的節(jié)點解序列。不同于以往貪心產(chǎn)生唯一解的方式,該模型會預(yù)測出多個擁有最優(yōu)獎勵值的路線,減少漏掉整條條件概率最大的路線的可能性;并且與大多數(shù)經(jīng)典啟發(fā)式不同,當(dāng)輸入圖的節(jié)點或者邊信息和訓(xùn)練時的變化不同時,模型依舊保持魯棒性。為解決圖規(guī)模的動態(tài)組合優(yōu)化問題,特別是那些難以設(shè)計啟發(fā)式的旅行商問題提供了新的方向。

    本文的主要工作如下:

    1)提出一個將多頭注意力機制與分層強化學(xué)習(xí)結(jié)合來求解動態(tài)圖上的旅行商問題的輕量級模型Dy4TSP;

    2)本文模型加入了節(jié)點動態(tài)變化的元素,隨著配送車輛對節(jié)點的遍歷,車輛剩余負(fù)載和客戶節(jié)點的需求量發(fā)生變化,更加接近于實際生活中的旅行商問題;

    3)本文模型采用分布式強化學(xué)習(xí)算法融合參數(shù)量更少的圖卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)和預(yù)測網(wǎng)絡(luò)部分,并行地訓(xùn)練模型,所需的訓(xùn)練時間更少,在更短的時間內(nèi)獲得更好的訓(xùn)練效果;

    4)本文模型是可擴展的,針對不同的維度都可以選擇相應(yīng)的旅行商問題并輸入到模型中進(jìn)行預(yù)測與訓(xùn)練,為不同維度的旅行商問題提供了統(tǒng)一的模型。

    本文模型可以在沒有標(biāo)簽的情況下,經(jīng)過分布式強化學(xué)習(xí)算法的訓(xùn)練為動態(tài)旅行商問題的學(xué)習(xí)提供比以往模型準(zhǔn)確率更高的方法。

    1 相關(guān)工作

    最近人們對用深度學(xué)習(xí)和強化學(xué)習(xí)來解決圖的組合優(yōu)化問題產(chǎn)生了興趣。最初將深度強化學(xué)習(xí)用于組合優(yōu)化問題是Vinyals 等引入了指針網(wǎng)絡(luò)(Point Network,PN),對輸入序列按照注意力機制得到的概率值重新排列作為模型的輸出,缺陷是該模型基于有監(jiān)督學(xué)習(xí),嚴(yán)重依賴于標(biāo)簽數(shù)據(jù)。

    Bello 等第一次嘗試用強化學(xué)習(xí)算法解決組合優(yōu)化問題,解決了強化學(xué)習(xí)需要標(biāo)簽的問題,但模型的設(shè)計過程沒有針對處理圖結(jié)構(gòu)的輸入問題,沒有得到很好的擴展應(yīng)用。

    Sutskever 等通過將圖變換為一個序列,然后再基于序列到序列模型來生成節(jié)點決策順序。這種方法存在的問題非常明顯,在將圖變換為序列的過程中會丟失大量的結(jié)構(gòu)信息。

    Khalil 等使用基于圖網(wǎng)絡(luò)表征的單一模型,通過擬合Q-learning訓(xùn)練模型輸出節(jié)點插入到局部路線中的順序,每一步為智能體提供增量獎勵有效地學(xué)習(xí)貪心算法來依次構(gòu)造最優(yōu)解。缺點是模型需要人為的設(shè)計輔助函數(shù),泛化能力差。

    Kulkarni 等介紹了一個分層強化學(xué)習(xí)模型,這是強化學(xué)習(xí)領(lǐng)域最經(jīng)典的并行分布式工作,可以結(jié)合不同層次的動作價值函數(shù),多個時間尺度的抽象來幫助智能體的優(yōu)化策略,為本模型的訓(xùn)練模型的分布式學(xué)習(xí)提供了新的思路。

    Nazari 等將指針網(wǎng)絡(luò)的編碼器替換為一維卷積層直接進(jìn)行節(jié)點序列的表征過程,從而可以有效更新狀態(tài)變化后節(jié)點表征向量,他們將該模型應(yīng)用于車輛路徑問題中,減少了很多動態(tài)節(jié)點變化上的不必要的計算。

    Gao 等利用圖注意力神經(jīng)網(wǎng)絡(luò)以及循環(huán)神經(jīng)網(wǎng)絡(luò)對組合優(yōu)化問題的排序策略進(jìn)行學(xué)習(xí),采用PPO(Proximal Policy Optimization)強化學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練,但是在優(yōu)化能力上未達(dá)到或極度靠近最優(yōu)解。

    本文不同于以上模型,本文結(jié)合多頭注意力機制和分布式強化學(xué)習(xí)方法,以一種自動學(xué)習(xí)的方式,實時地生成問題的解,不但擁有高效的收斂性,而且得到的結(jié)果更加接近最優(yōu)解。

    2 問題定義

    經(jīng)典旅行商問題(Traveling Salesman Problem,TSP):配送車輛從圖中配送中心節(jié)點出發(fā),經(jīng)過所有城市一次且僅一次并回到配送中心,目標(biāo)是配送客戶節(jié)點需求數(shù)多,且配送路徑最短。

    配送收集旅行商問題(Distribution Collection Traveling Salesman Problem,DCTSP):配送車輛從圖中配送中心節(jié)點出發(fā),由一限定負(fù)載容量的配送車輛負(fù)責(zé)配送需求大于零的客戶,目標(biāo)是配送客戶節(jié)點需求數(shù)多,且配送路徑最短。

    拆分交付旅行商問題(Split Delivery Traveling Salesman Problem,SDTSP):在配送收集旅行商問題的基礎(chǔ)上,將每個客戶的需求量拆分成多部分,允許配送車輛對客戶節(jié)點的需求量大于車輛剩余負(fù)載的客戶節(jié)點進(jìn)行配送,該解決方案可以將給定客戶節(jié)點的需求量分配到多條路線以減少空載率。

    3 神經(jīng)網(wǎng)絡(luò)構(gòu)建

    將對動態(tài)旅行商問題求取最優(yōu)解的過程看成序列決策問題,整體用馬爾可夫決策過程建模,通過設(shè)計一個最優(yōu)策略的概率分布函數(shù),來達(dá)到建立實時輸出可行解序列的參數(shù)化模型的目標(biāo),模型的訓(xùn)練通過分布式強化學(xué)習(xí)訓(xùn)練產(chǎn)生近似最優(yōu)解來修正預(yù)測模型輸出的節(jié)點序列順序。

    神經(jīng)網(wǎng)絡(luò)構(gòu)建階段包括網(wǎng)絡(luò)模型創(chuàng)建和模型訓(xùn)練兩階段,主要分為3 個步驟,如圖1 所示。

    1)Graph2Vec 圖卷積神經(jīng)網(wǎng)絡(luò),以整個

    T

    時刻的圖

    G

    和到目前為止輸出的節(jié)點集

    S

    依次作為輸入,由前饋網(wǎng)絡(luò)結(jié)合鄰居及節(jié)點信息進(jìn)行聚合操作,輸出某個時刻每個節(jié)點的向量序列,如圖1(a)所示;2)Vec2Seq 預(yù)測網(wǎng)絡(luò),將Graph2Vec 網(wǎng)絡(luò)的輸出中取

    t

    時刻預(yù)測網(wǎng)絡(luò)未輸出節(jié)點的表征向量,連接上一時刻預(yù)測網(wǎng)絡(luò)已輸出的節(jié)點,依次輸入到多頭上下文注意力機制和Softmax 層,得到

    t

    時刻節(jié)點的概率分布,依據(jù)概率分布等信息輸出前

    b

    個節(jié)點作為Vec2Seq 預(yù)測網(wǎng)絡(luò)預(yù)測得到的

    t

    +1時刻將要遍歷的節(jié)點,如圖1(b)所示,第1)~2)部分作為本文的主體模型進(jìn)行實時輸出可行解序列的工作;3)n2Drl 訓(xùn)練網(wǎng)絡(luò),對以上創(chuàng)建的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,將Graph2Vec 網(wǎng)絡(luò)的節(jié)點表征向量與Vec2Seq 網(wǎng)絡(luò)的預(yù)測節(jié)點部分輸入到

    n

    個線程的Actor 中,多個線程分布式探索環(huán)境,積累狀態(tài)過度量(狀態(tài),動作,獎勵)等信息,一個批次結(jié)束后更新狀態(tài)過渡向量的優(yōu)先級并存入經(jīng)驗緩存機制中,使用多個線程并行運行的方式更加高效地收集大規(guī)模圖數(shù)據(jù),如圖1(c)所示。

    圖1 神經(jīng)網(wǎng)絡(luò)構(gòu)建框架Fig.1 Neural network construction framework

    綜上,通過Graph2Vec 生成網(wǎng)絡(luò)表征,將每個時刻的節(jié)點表征向量提供給Vec2Seq 預(yù)測網(wǎng)絡(luò)進(jìn)行節(jié)點序列預(yù)測,與此同時Vec2Seq 預(yù)測網(wǎng)絡(luò)同步更新網(wǎng)絡(luò)參數(shù),使得對于圖中的每個節(jié)點,可以更準(zhǔn)確地判斷出該節(jié)點是否是最優(yōu)解的一部分。

    3.1 Graph2Vec圖卷積網(wǎng)絡(luò)

    Trivedi 等使用了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)框架,使得某一時刻的節(jié)點計算依賴于上一時刻的計算結(jié)果,很難具備高效的并行計算能力,并且RNN 的網(wǎng)絡(luò)結(jié)構(gòu)對于長距離和層級化的依賴關(guān)系難以建立,尤其是在本文所研究的動態(tài)旅行商問題中,這樣導(dǎo)致求解問題隨著輸入順序動態(tài)改變,網(wǎng)絡(luò)預(yù)測的性能有一定的差異。同時在時間序列中對圖神經(jīng)網(wǎng)絡(luò)截取快照是一種粗糙的方法,基于此Graph2Vec 網(wǎng)絡(luò)使用連續(xù)時間的節(jié)點表征,通過聚合鄰居節(jié)點的信息,直接在圖中進(jìn)行卷積操作,產(chǎn)生整個時間序列的向量作為節(jié)點表示。

    3.2 Vec2Seq預(yù)測網(wǎng)絡(luò)

    在這部分網(wǎng)絡(luò)中,延用了NLP(Natural Language Processing)中廣為應(yīng)用的成熟技術(shù)Transformer 模型,由于Transformer 使用自注意力機制和前饋神經(jīng)網(wǎng)絡(luò)等結(jié)構(gòu)搭建網(wǎng)絡(luò),解決了RNN 模型的長期依賴問題,并且相對于卷積神經(jīng)網(wǎng)絡(luò)可以更好地進(jìn)行并行計算,可以有效地處理動態(tài)網(wǎng)絡(luò)結(jié)構(gòu),所以Vec2Seq 預(yù)測網(wǎng)絡(luò)僅基于多頭上下文注意力機制從多個角度計算Graph2Vec 的節(jié)點表征序列對預(yù)測模型輸出序列的注意力權(quán)重,來指示當(dāng)前輸出的節(jié)點,提高了整個模型的預(yù)測準(zhǔn)確度。

    最后Vec2Seq 預(yù)測網(wǎng)絡(luò)通過Softmax 傳遞結(jié)果,如式(6)利用Softmax 函數(shù)使所有未輸出節(jié)點的相似性量歸一化,把相似性

    C

    映射成0 到1 之間的實數(shù),將此數(shù)值作為節(jié)點

    u

    和鄰居節(jié)點

    v

    的概率值,此后在預(yù)測節(jié)點時可以選取相應(yīng)概率的節(jié)點作為Vec2Seq 預(yù)測網(wǎng)絡(luò)的目標(biāo)輸出。

    輸出節(jié)點前首先判斷目標(biāo)節(jié)點的需求值是否大于0,滿足條件后開始進(jìn)行節(jié)點序列輸出,輸出的過程中使用集束搜索算法取代貪心算法,每次深度擴展解時只保留概率值最大的前

    b

    個節(jié)點加入集合

    S

    ,其中

    S

    表示屬于已輸出的節(jié)點集。

    3.3 n2Drl訓(xùn)練網(wǎng)絡(luò)

    本文考慮使用一種自我驅(qū)動性的深度強化學(xué)習(xí)算法n2Drl 來訓(xùn)練模型,該算法的理論模型基于馬爾可夫決策過程,該理論讓智能體在所給的環(huán)境狀態(tài)中通過獎勵值的反饋自主學(xué)習(xí)做動作,以使累積獎勵最大化。由于動態(tài)旅行商問題中模型需要訓(xùn)練的樣本的數(shù)量相較于之前會有成倍數(shù)增長的趨勢,在這種情況下,引入分布式強化學(xué)習(xí),采用并行智能體策略,把任務(wù)分配到不同的智能體上,復(fù)制

    n

    個線程,在每個線程運行一個智能體同所給的環(huán)境進(jìn)行交互來并行縮短收集數(shù)據(jù)的時間。在第二部分Vec2Seq 預(yù)測網(wǎng)絡(luò)輸出可行解序列后,訓(xùn)練過程中需要計算出輸出這

    b

    個節(jié)點后所帶來的獎勵值,通過獎勵值來衡量當(dāng)前節(jié)點動作的優(yōu)劣,更新函數(shù)如式(9):

    其中:

    Q

    表示

    t

    時刻狀態(tài)行為值函數(shù),表示配送車輛在策略

    P

    (

    a

    |

    s

    ,

    a

    )和當(dāng)前狀態(tài)

    s

    下,采取動作

    a

    作為解的優(yōu)劣程度,如式(9)所示為當(dāng)前輸出的節(jié)點

    v

    和其所有鄰居節(jié)點的拼接,

    J

    表示

    t

    時刻的路徑長度,為遍歷前后客戶節(jié)點的二維坐標(biāo)位置

    F

    的平方差,其中

    θ

    是每一個部分的權(quán)重參數(shù),決定了每個部分對動作獎勵值的貢獻(xiàn)度。本文將截止到

    t

    時刻為止智能體探索環(huán)境所反饋回的總獎勵值定義為

    R

    ,如式(10)所示,計算多步獎勵的過程中引入衰減因子

    γ

    ,作為下一時刻獎勵值的系數(shù),令未來狀態(tài)所反饋回的獎勵值以不同程度的衰減度遞歸地指導(dǎo)智能體做決策,來同時關(guān)注決策后的眼前利益和未來獎勵。

    之后將這些數(shù)據(jù),壓入緩存中并隨機抽取批量數(shù)據(jù)利用式(11)對帶有模型參數(shù)的損失函數(shù)

    L

    (

    W

    )進(jìn)行訓(xùn)練,訓(xùn)練模型的網(wǎng)絡(luò)參數(shù)

    W

    由Xavier初始化器初始化,來保持各層梯度的比例大致相同,后期使用Adam優(yōu)化器對損失函數(shù)式(11)進(jìn)行隨機梯度下降優(yōu)化更新參數(shù)

    W

    ,使得總獎勵值

    R

    與模型輸出的

    t

    時刻狀態(tài)行為值函數(shù)

    Q

    越來越接近,并將優(yōu)化后的網(wǎng)絡(luò)參數(shù)

    W

    進(jìn)行輸出作為n2Drl 訓(xùn)練網(wǎng)絡(luò)的訓(xùn)練結(jié)果。

    4 實驗與結(jié)果分析

    4.1 Vec2Seq預(yù)測網(wǎng)絡(luò)參數(shù)設(shè)置

    圖2 多頭注意力機制Fig.2 Multi-head attention mechanism

    圖3 Softmax函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Softmax function network structure

    4.2 實驗參數(shù)設(shè)置

    對于任意時刻

    t

    (

    t

    =0,1,…,

    T

    (

    T

    ≥0)),考慮到現(xiàn)實中旅行商問題的節(jié)點分布隨機性,本文隨機生成有著不同需求量的客戶節(jié)點來模擬現(xiàn)實世界,實驗過程中隨機生成1 000 個圖,圖中客戶節(jié)點數(shù)目設(shè)置皆為20、50 和100 個,將這些圖

    G

    (

    V

    ,

    E

    )輸入到本文的模型Dy4TSP 中。本文對所提出的模型進(jìn)行實驗,設(shè)置每個epoch 處理256 個批次,迭代次數(shù)皆為30 次,設(shè)置時間最大為

    T

    =100,在訓(xùn)練模型的過程中,學(xué)習(xí)率設(shè)為0.000 1,從Replay Memory 中采樣的訓(xùn)練樣例為16,訓(xùn)練模型的網(wǎng)絡(luò)參數(shù)

    W

    使用Adam優(yōu)化器對損失函數(shù)式(11)進(jìn)行隨機梯度下降來更新,其中梯度下降的參數(shù)設(shè)置

    β

    =0.9,

    β

    =0.99,

    ε

    =10。與此同時,發(fā)現(xiàn)本文模型在配送收集旅行商問題、拆分交付旅行商問題的圖訓(xùn)練時的超參數(shù)和旅行商問題的超參數(shù)一致,這樣可以在不同的問題上節(jié)省調(diào)整參數(shù)的時間。為了減少訓(xùn)練時間,使得模型更快地收斂到預(yù)計的效果,加入預(yù)訓(xùn)練過程,使用已訓(xùn)練好的模型訓(xùn)練新的網(wǎng)絡(luò),由經(jīng)過預(yù)訓(xùn)練的模型來解決不同節(jié)點數(shù)目的同類型旅行商問題,本文模型(

    T

    ≥0)比沒有在相同實例大小問題上訓(xùn)練表現(xiàn)好,這表明本文加入預(yù)訓(xùn)練過程的模型可以很好地泛化到不同節(jié)點的實例問題中。

    4.3 對比實驗

    由于旅行商問題亦屬于組合優(yōu)化問題,所以針對所研究的旅行商系列問題,本文將選取處理組合優(yōu)化問題的模型PN、S2V(Structure2Vector)、注意力模型(Attention Model,AM)、帶有邊嵌入的圖注意網(wǎng)絡(luò)(Graph Attention Network with Edge Embedding,EGATE)和動態(tài)強化學(xué)習(xí)網(wǎng)絡(luò)(Dynamic Reinforcement Learning network,DyRL)與本文模型Dy4TSP 作對比,以啟發(fā)式算法優(yōu)化器LKH3(Lin-Kernighan-Helsgaun3)得到的路徑長度為最優(yōu)性能基準(zhǔn)。圖4(a)、(b)展示了在固定客戶節(jié)點數(shù)目的TSP、DCTSP 上使用不同的模型,所得到的和開源求解器LKH3 的最優(yōu)性能差距,即最優(yōu)路徑的差距對比,圖4(c)表示不同的模型對于不同節(jié)點數(shù)的SDTSP 問題的最優(yōu)路徑長度。圖4(a)、(b)中的TSP100 表示該旅行商問題由100 個客戶組成,對于TSP100而言,本文模型在最優(yōu)路徑上的優(yōu)化性能超越了其他對比模型大約0.15 到0.37 個單位,比較接近于EGATE 模型,并且在20 個節(jié)點時可以達(dá)到LKH3 的最優(yōu)路徑長度。

    圖4(b)加入動態(tài)元素后所有的對比模型皆與最優(yōu)路徑差距較大,與此同時本文模型也可以取得比對比算法較優(yōu)的結(jié)果,尤其是Dy4TSP.b5 時,本文模型使用集束搜索寬度5,所有情況下,不同的節(jié)點數(shù)目皆可以達(dá)到0.1 到1.05 的最優(yōu)路徑差距;由于SDTSP 沒有網(wǎng)絡(luò)上的算法求解器,本文將圖4(c)的縱坐標(biāo)設(shè)置為最優(yōu)路徑長度,將DyRL AM 模型和EGATE 模型應(yīng)用于此問題,不同的模型之間有著0.01 到1.01 的差距,Dy4TSP 以不到0.1 的差距優(yōu)于EGATE?;趫D4 實驗結(jié)果,可以發(fā)現(xiàn)本文模型能夠比對比模型獲得更優(yōu)的結(jié)果,在節(jié)點數(shù)目規(guī)模達(dá)到100 個后,本文模型在不同的問題上皆明顯優(yōu)于對比模型,在限制時間內(nèi)輸出最接近最優(yōu)解決方案的路線。

    同時還對比了不同搜索算法對于選擇節(jié)點后生成總遍歷長度的影響,在測試過程中選取貪心算法和不同集束參數(shù)的集束搜索算法。理論上取樣數(shù)目越多,則更容易得到理想的節(jié)點路線,然而考慮到時間復(fù)雜度會隨著選取節(jié)點數(shù)目的增多成指數(shù)增長這一弊端,如何找到一個理想的臨界值是加入搜索算法對比實驗的目標(biāo)。圖4 比較了本文模型在不同搜索算法下與當(dāng)前最優(yōu)的開源求解器LKH3 的距離差距,其中g(shù)r 表示貪心算法,s 表示隨機取樣,b 表示集束搜索算法,右側(cè)的數(shù)字表示集束寬度參數(shù)。本文發(fā)現(xiàn),在使用貪心算法時的最優(yōu)路徑差距普遍比集束搜索算法要更長,集束寬度為5 時達(dá)到最優(yōu)路徑差距。

    圖4 不同模型的最優(yōu)路徑差距和最優(yōu)路徑長度比較Fig.4 Comparison of optimal path gap and optimal path length between different models

    圖5 比較了不同節(jié)點數(shù)目的SDTSP 在訓(xùn)練過程中隨著epoch 的增加,學(xué)習(xí)網(wǎng)絡(luò)的損失值的變化。由于學(xué)習(xí)網(wǎng)絡(luò)隨著訓(xùn)練時間的增多,經(jīng)過反向傳播、梯度優(yōu)化等過程對本模型進(jìn)行學(xué)習(xí)優(yōu)化以及學(xué)習(xí)過程中權(quán)重矩陣的調(diào)整后,控制學(xué)習(xí)網(wǎng)絡(luò)整體的學(xué)習(xí)幅度朝著預(yù)測更加準(zhǔn)確的方向進(jìn)行,模型的損失值在開始時快速下降,最后損失值趨于平穩(wěn),在一定范圍內(nèi)震蕩,所以損失值后期呈現(xiàn)逐漸收斂于0 的狀態(tài)。

    圖5 不同節(jié)點數(shù)目訓(xùn)練損失值比較Fig.5 Comparision of training loss values for different numbers of nodes

    5 結(jié)語

    本文提出了一種基于強化學(xué)習(xí)模型Dy4TSP 來計算NPhard 問題中的動態(tài)旅行商問題。本文模型結(jié)合了深度學(xué)習(xí)技術(shù)和分布式強化學(xué)習(xí)方法從而得到了一種可以自動學(xué)習(xí)預(yù)測節(jié)點序列的模型。核心部分是一個Vec2Seq 預(yù)測網(wǎng)絡(luò),通過后期n2Drl 分布式訓(xùn)練網(wǎng)絡(luò)的訓(xùn)練實時地生成解決方案,可以精準(zhǔn)地預(yù)測組合優(yōu)化問題中涉及序列決策問題中節(jié)點序列預(yù)測的概率,多頭上下文注意力機制網(wǎng)絡(luò)的設(shè)計和分布式強化學(xué)習(xí)訓(xùn)練的目的是盡可能從多個特征角度探索環(huán)境,也在盡可能少的時間合成多種解決方案,從而可以通過集束搜索算法對解決空間進(jìn)行快速探索,通過大量不同節(jié)點數(shù)目的實驗結(jié)果表明,Dy4TSP 顯著地比現(xiàn)有文獻(xiàn)中解決動態(tài)旅行商問題的技術(shù)速度更快、質(zhì)量更高,可以很好地處理動態(tài)旅行商問題。

    av免费在线观看网站| 日日干狠狠操夜夜爽| 波多野结衣巨乳人妻| 国产精品一区二区三区四区久久 | 亚洲av日韩精品久久久久久密| 操出白浆在线播放| 国产亚洲精品一区二区www| 久久精品91蜜桃| 久久久久久大精品| 欧美中文日本在线观看视频| 欧美精品亚洲一区二区| 男女下面进入的视频免费午夜 | 午夜a级毛片| 51午夜福利影视在线观看| 成熟少妇高潮喷水视频| 国产成人欧美| 久久久国产成人免费| 久久中文看片网| 国产精品99久久99久久久不卡| 国产av一区在线观看免费| 俄罗斯特黄特色一大片| 好男人电影高清在线观看| 精品一区二区三区av网在线观看| 国产av又大| 国产三级黄色录像| 日韩精品青青久久久久久| av电影中文网址| 可以在线观看的亚洲视频| 欧美黑人欧美精品刺激| 欧美精品亚洲一区二区| 首页视频小说图片口味搜索| 啦啦啦 在线观看视频| 黄网站色视频无遮挡免费观看| 在线观看免费视频网站a站| 日日爽夜夜爽网站| 99精品久久久久人妻精品| www.999成人在线观看| 美女国产高潮福利片在线看| 精品久久久久久成人av| 99国产精品一区二区蜜桃av| 国产高清视频在线播放一区| 最新美女视频免费是黄的| 两个人视频免费观看高清| av天堂在线播放| 精品高清国产在线一区| 精品一区二区三区四区五区乱码| 久久精品国产清高在天天线| 亚洲成人久久性| 一区二区三区国产精品乱码| 97超级碰碰碰精品色视频在线观看| 日韩视频一区二区在线观看| 一级a爱片免费观看的视频| 亚洲精品一卡2卡三卡4卡5卡| 伦理电影免费视频| 欧美日韩一级在线毛片| 91av网站免费观看| 天天躁狠狠躁夜夜躁狠狠躁| 国产av一区在线观看免费| 长腿黑丝高跟| 精品久久久精品久久久| av视频在线观看入口| 精品福利观看| 99香蕉大伊视频| 97碰自拍视频| 好看av亚洲va欧美ⅴa在| 免费不卡黄色视频| 涩涩av久久男人的天堂| 国产亚洲欧美98| avwww免费| 久久人人爽av亚洲精品天堂| 满18在线观看网站| 免费少妇av软件| 正在播放国产对白刺激| 桃色一区二区三区在线观看| 国产主播在线观看一区二区| 悠悠久久av| 校园春色视频在线观看| 久久性视频一级片| 变态另类丝袜制服| 欧美av亚洲av综合av国产av| 亚洲精品中文字幕在线视频| 国产精品国产高清国产av| 国产aⅴ精品一区二区三区波| 亚洲欧美激情综合另类| 免费人成视频x8x8入口观看| 国产精品二区激情视频| www.自偷自拍.com| 在线观看免费视频日本深夜| 91九色精品人成在线观看| 亚洲情色 制服丝袜| 人妻久久中文字幕网| 欧美日韩一级在线毛片| 国产伦人伦偷精品视频| АⅤ资源中文在线天堂| 国产一区在线观看成人免费| 老汉色∧v一级毛片| 亚洲午夜理论影院| 国产成人欧美在线观看| 麻豆av在线久日| 精品人妻在线不人妻| 欧美成人午夜精品| 精品高清国产在线一区| 亚洲精品国产一区二区精华液| 亚洲人成电影免费在线| 男女下面插进去视频免费观看| 99精品欧美一区二区三区四区| 成人国产一区最新在线观看| 亚洲人成网站在线播放欧美日韩| 免费在线观看视频国产中文字幕亚洲| av天堂久久9| 在线av久久热| 制服诱惑二区| 一区二区日韩欧美中文字幕| 亚洲精品一卡2卡三卡4卡5卡| 韩国av一区二区三区四区| 国内精品久久久久精免费| 成人亚洲精品av一区二区| 免费不卡黄色视频| 久99久视频精品免费| 久久精品成人免费网站| or卡值多少钱| 欧美激情 高清一区二区三区| 国产又爽黄色视频| 欧美一区二区精品小视频在线| 国语自产精品视频在线第100页| 美国免费a级毛片| 看免费av毛片| 欧美国产日韩亚洲一区| 人妻久久中文字幕网| 欧美色欧美亚洲另类二区 | 精品国内亚洲2022精品成人| 9色porny在线观看| 女人精品久久久久毛片| tocl精华| 男人的好看免费观看在线视频 | 久久久精品国产亚洲av高清涩受| 亚洲精华国产精华精| 制服丝袜大香蕉在线| 久久久水蜜桃国产精品网| 男人舔女人下体高潮全视频| 韩国精品一区二区三区| 日韩免费av在线播放| 天天躁夜夜躁狠狠躁躁| 又紧又爽又黄一区二区| 久久精品亚洲熟妇少妇任你| 日日夜夜操网爽| 精品第一国产精品| 亚洲午夜理论影院| 一级a爱视频在线免费观看| 精品久久久久久久人妻蜜臀av | 日韩大尺度精品在线看网址 | 日韩中文字幕欧美一区二区| 日韩精品中文字幕看吧| 成人精品一区二区免费| 亚洲欧美日韩高清在线视频| 两个人看的免费小视频| 少妇的丰满在线观看| 精品欧美国产一区二区三| 久久久久久久精品吃奶| 国产三级黄色录像| 亚洲片人在线观看| 婷婷精品国产亚洲av在线| 变态另类成人亚洲欧美熟女 | 天天躁狠狠躁夜夜躁狠狠躁| 身体一侧抽搐| 国产精品1区2区在线观看.| 好看av亚洲va欧美ⅴa在| 最近最新中文字幕大全电影3 | www.自偷自拍.com| 欧美国产精品va在线观看不卡| 免费观看精品视频网站| 一卡2卡三卡四卡精品乱码亚洲| 性欧美人与动物交配| 欧美日韩福利视频一区二区| 最近最新免费中文字幕在线| 少妇裸体淫交视频免费看高清 | 人人妻人人爽人人添夜夜欢视频| 国产在线观看jvid| 精品人妻1区二区| 大型黄色视频在线免费观看| 美女免费视频网站| 97人妻精品一区二区三区麻豆 | 亚洲情色 制服丝袜| 免费在线观看日本一区| 国产99久久九九免费精品| 成人欧美大片| 91精品国产国语对白视频| 99国产精品99久久久久| 中文字幕av电影在线播放| 色播在线永久视频| 亚洲一区二区三区不卡视频| 9191精品国产免费久久| 国产成+人综合+亚洲专区| 午夜日韩欧美国产| 9191精品国产免费久久| 成人永久免费在线观看视频| 无限看片的www在线观看| 天天一区二区日本电影三级 | 最好的美女福利视频网| 午夜免费成人在线视频| 天天躁狠狠躁夜夜躁狠狠躁| 精品国产一区二区三区四区第35| 男女做爰动态图高潮gif福利片 | 国产精品九九99| 亚洲久久久国产精品| 亚洲无线在线观看| 亚洲精品中文字幕一二三四区| 午夜亚洲福利在线播放| 国产亚洲精品久久久久5区| 久久久水蜜桃国产精品网| 变态另类丝袜制服| 19禁男女啪啪无遮挡网站| av有码第一页| 国产精品爽爽va在线观看网站 | 亚洲第一电影网av| 久久午夜综合久久蜜桃| 啦啦啦韩国在线观看视频| 9191精品国产免费久久| 免费在线观看视频国产中文字幕亚洲| 成人国产综合亚洲| 午夜两性在线视频| 久热爱精品视频在线9| 久久精品91蜜桃| 99久久精品国产亚洲精品| 曰老女人黄片| 欧美不卡视频在线免费观看 | 精品一品国产午夜福利视频| 午夜福利18| 巨乳人妻的诱惑在线观看| 精品人妻在线不人妻| 亚洲av成人av| 亚洲熟妇熟女久久| 俄罗斯特黄特色一大片| 最近最新中文字幕大全免费视频| 久久久久九九精品影院| 欧美色视频一区免费| 两人在一起打扑克的视频| 人妻久久中文字幕网| 正在播放国产对白刺激| 真人做人爱边吃奶动态| 欧美绝顶高潮抽搐喷水| 9热在线视频观看99| 亚洲精品国产区一区二| 波多野结衣高清无吗| 免费少妇av软件| 国产精品,欧美在线| 久久久久久国产a免费观看| 久久精品国产亚洲av高清一级| 高清毛片免费观看视频网站| 午夜精品久久久久久毛片777| 国产成人欧美在线观看| 最近最新中文字幕大全电影3 | 两性夫妻黄色片| 久久这里只有精品19| 法律面前人人平等表现在哪些方面| 精品国内亚洲2022精品成人| 在线观看舔阴道视频| 国产亚洲精品第一综合不卡| 欧美日韩一级在线毛片| 久99久视频精品免费| 首页视频小说图片口味搜索| 国产aⅴ精品一区二区三区波| 久久中文看片网| 嫩草影院精品99| 日本a在线网址| 亚洲欧美一区二区三区黑人| 精品一品国产午夜福利视频| 欧美乱码精品一区二区三区| 人成视频在线观看免费观看| 日韩精品免费视频一区二区三区| 91精品国产国语对白视频| 国产精品电影一区二区三区| 九色国产91popny在线| 免费一级毛片在线播放高清视频 | 一区二区日韩欧美中文字幕| 天堂动漫精品| 俄罗斯特黄特色一大片| 丝袜人妻中文字幕| 国产国语露脸激情在线看| 精品久久久久久成人av| 91精品国产国语对白视频| 变态另类成人亚洲欧美熟女 | 丝袜美腿诱惑在线| 亚洲精品久久国产高清桃花| 很黄的视频免费| 级片在线观看| 亚洲国产欧美网| 国产精品亚洲一级av第二区| 日韩免费av在线播放| 丰满的人妻完整版| 午夜福利免费观看在线| 如日韩欧美国产精品一区二区三区| 女人被狂操c到高潮| 九色国产91popny在线| 91九色精品人成在线观看| 久久精品91蜜桃| 男人舔女人下体高潮全视频| 久久香蕉国产精品| 51午夜福利影视在线观看| 女警被强在线播放| 亚洲在线自拍视频| 岛国在线观看网站| 波多野结衣高清无吗| 变态另类丝袜制服| 免费在线观看黄色视频的| 亚洲一区高清亚洲精品| 日韩欧美国产在线观看| 欧美日韩亚洲国产一区二区在线观看| 在线国产一区二区在线| 亚洲精品在线美女| 精品人妻在线不人妻| 99国产综合亚洲精品| 久9热在线精品视频| 国产亚洲欧美精品永久| 黄色毛片三级朝国网站| 成年版毛片免费区| 国产av在哪里看| 亚洲久久久国产精品| 电影成人av| 老司机午夜十八禁免费视频| 精品一区二区三区av网在线观看| 日韩国内少妇激情av| 国产亚洲av高清不卡| 亚洲美女黄片视频| www.999成人在线观看| 老鸭窝网址在线观看| 国产单亲对白刺激| 啦啦啦韩国在线观看视频| 变态另类成人亚洲欧美熟女 | 免费看十八禁软件| 中出人妻视频一区二区| 热re99久久国产66热| 999精品在线视频| 宅男免费午夜| 大型av网站在线播放| 国产国语露脸激情在线看| 制服人妻中文乱码| 亚洲av五月六月丁香网| 亚洲欧美日韩无卡精品| 美女高潮到喷水免费观看| www.www免费av| 国产精品久久电影中文字幕| 搞女人的毛片| 黑人巨大精品欧美一区二区蜜桃| 亚洲男人天堂网一区| 大型av网站在线播放| 亚洲成国产人片在线观看| 国产99久久九九免费精品| 夜夜看夜夜爽夜夜摸| 国产免费av片在线观看野外av| 91av网站免费观看| av片东京热男人的天堂| 国产亚洲精品综合一区在线观看 | 久久久精品欧美日韩精品| 麻豆国产av国片精品| 亚洲情色 制服丝袜| 成人特级黄色片久久久久久久| 久久精品国产亚洲av香蕉五月| 国产高清有码在线观看视频 | 成人18禁在线播放| 免费无遮挡裸体视频| 国产真人三级小视频在线观看| 午夜亚洲福利在线播放| e午夜精品久久久久久久| 国产成人精品久久二区二区免费| 亚洲精品国产区一区二| 国产精品免费一区二区三区在线| 一级,二级,三级黄色视频| 校园春色视频在线观看| 香蕉久久夜色| 免费看a级黄色片| 99国产精品一区二区蜜桃av| 国产精品综合久久久久久久免费 | 欧美黑人精品巨大| 天天添夜夜摸| 亚洲国产精品sss在线观看| 国产黄a三级三级三级人| 91国产中文字幕| 人人澡人人妻人| 国产精品一区二区精品视频观看| 啦啦啦免费观看视频1| 国产伦人伦偷精品视频| 少妇的丰满在线观看| 国产精品亚洲美女久久久| 久久人人精品亚洲av| 中文字幕另类日韩欧美亚洲嫩草| 欧美黄色淫秽网站| 女人爽到高潮嗷嗷叫在线视频| 亚洲 国产 在线| 琪琪午夜伦伦电影理论片6080| 黄色片一级片一级黄色片| 看片在线看免费视频| 国产精品久久久久久亚洲av鲁大| 国产三级黄色录像| 极品人妻少妇av视频| 国产亚洲精品一区二区www| 日韩精品青青久久久久久| 91成年电影在线观看| 老司机午夜十八禁免费视频| 99久久99久久久精品蜜桃| 女人高潮潮喷娇喘18禁视频| 91av网站免费观看| 人妻久久中文字幕网| 天天一区二区日本电影三级 | 色播亚洲综合网| 精品久久久久久成人av| 日韩精品中文字幕看吧| 久热这里只有精品99| av视频在线观看入口| 色av中文字幕| 97人妻天天添夜夜摸| 91麻豆精品激情在线观看国产| av福利片在线| 国产精品乱码一区二三区的特点 | 欧美乱妇无乱码| 9色porny在线观看| 999精品在线视频| 成人亚洲精品一区在线观看| av片东京热男人的天堂| 欧美 亚洲 国产 日韩一| 两个人免费观看高清视频| 久久久久九九精品影院| 最近最新中文字幕大全电影3 | 国产成人av教育| 韩国av一区二区三区四区| 亚洲第一av免费看| 人成视频在线观看免费观看| 成人18禁在线播放| 亚洲电影在线观看av| 亚洲精品粉嫩美女一区| 99久久精品国产亚洲精品| 亚洲最大成人中文| 色综合亚洲欧美另类图片| tocl精华| 亚洲国产精品合色在线| 日韩欧美三级三区| 操出白浆在线播放| 香蕉久久夜色| av在线播放免费不卡| 午夜福利视频1000在线观看 | 男人舔女人下体高潮全视频| 国产精品久久视频播放| 免费观看精品视频网站| 99国产极品粉嫩在线观看| 欧美成人性av电影在线观看| 国产精品 欧美亚洲| 日本一区二区免费在线视频| 国产成人精品无人区| 国产单亲对白刺激| 免费无遮挡裸体视频| 国产精品一区二区三区四区久久 | 色在线成人网| 亚洲七黄色美女视频| 亚洲国产精品久久男人天堂| 精品国产亚洲在线| 露出奶头的视频| 成年女人毛片免费观看观看9| 天天一区二区日本电影三级 | 美女 人体艺术 gogo| 无限看片的www在线观看| 男女做爰动态图高潮gif福利片 | 真人一进一出gif抽搐免费| 成年女人毛片免费观看观看9| 老熟妇乱子伦视频在线观看| 亚洲视频免费观看视频| 在线观看日韩欧美| 看黄色毛片网站| 久久国产精品男人的天堂亚洲| av网站免费在线观看视频| 久久影院123| 好男人电影高清在线观看| 51午夜福利影视在线观看| 在线播放国产精品三级| 免费在线观看影片大全网站| or卡值多少钱| 国产亚洲欧美精品永久| 亚洲成人免费电影在线观看| 欧美日韩中文字幕国产精品一区二区三区 | 午夜福利一区二区在线看| 男人的好看免费观看在线视频 | 国产精品二区激情视频| 桃色一区二区三区在线观看| 少妇 在线观看| 亚洲狠狠婷婷综合久久图片| 亚洲天堂国产精品一区在线| 精品人妻1区二区| 国产精华一区二区三区| netflix在线观看网站| 国产精品久久久久久精品电影 | 禁无遮挡网站| 熟妇人妻久久中文字幕3abv| 亚洲熟妇中文字幕五十中出| 国产亚洲欧美精品永久| 大型黄色视频在线免费观看| 欧美成人一区二区免费高清观看 | 怎么达到女性高潮| 国产真人三级小视频在线观看| 在线观看日韩欧美| 国产精品免费视频内射| 极品教师在线免费播放| 伦理电影免费视频| 亚洲第一av免费看| 日本一区二区免费在线视频| 国产精品一区二区精品视频观看| av在线天堂中文字幕| 中文字幕久久专区| 国产高清激情床上av| 国产成人一区二区三区免费视频网站| 亚洲欧美日韩另类电影网站| 国产亚洲精品久久久久5区| 国产精品电影一区二区三区| 丰满的人妻完整版| 国产单亲对白刺激| 成人国产一区最新在线观看| 午夜免费激情av| 午夜福利影视在线免费观看| 国产精品二区激情视频| 午夜久久久久精精品| 精品国产美女av久久久久小说| 午夜精品久久久久久毛片777| 久久青草综合色| 日韩 欧美 亚洲 中文字幕| 午夜免费激情av| 精品久久久久久久久久免费视频| 国产午夜福利久久久久久| 亚洲欧美日韩无卡精品| 久久中文字幕一级| 午夜精品久久久久久毛片777| 欧美大码av| 成年版毛片免费区| 伊人久久大香线蕉亚洲五| 久久久久久久久久久久大奶| 在线国产一区二区在线| 亚洲男人天堂网一区| 亚洲avbb在线观看| 国产亚洲精品第一综合不卡| 别揉我奶头~嗯~啊~动态视频| 又紧又爽又黄一区二区| 日日干狠狠操夜夜爽| 一区二区三区国产精品乱码| 欧美黄色片欧美黄色片| 日本在线视频免费播放| 亚洲第一av免费看| 国产精品秋霞免费鲁丝片| 黄色 视频免费看| 十八禁人妻一区二区| 色婷婷久久久亚洲欧美| 亚洲性夜色夜夜综合| 看片在线看免费视频| 国产精品一区二区三区四区久久 | 国产一区二区三区在线臀色熟女| 久久国产精品人妻蜜桃| 亚洲国产看品久久| 国产精品秋霞免费鲁丝片| 国产高清视频在线播放一区| 国产亚洲av嫩草精品影院| 国产乱人伦免费视频| 久久精品国产亚洲av高清一级| 午夜日韩欧美国产| 欧美激情极品国产一区二区三区| 国产精品一区二区免费欧美| 国产高清激情床上av| 欧美成人免费av一区二区三区| 亚洲少妇的诱惑av| 国产麻豆成人av免费视频| 每晚都被弄得嗷嗷叫到高潮| 成人手机av| 亚洲欧美激情在线| 一边摸一边抽搐一进一小说| 国产精品99久久99久久久不卡| 国产成人精品无人区| 超碰成人久久| 91av网站免费观看| 国产精品亚洲美女久久久| 99国产综合亚洲精品| 久久精品国产综合久久久| 女生性感内裤真人,穿戴方法视频| 亚洲欧美日韩高清在线视频| 黄片小视频在线播放| 亚洲天堂国产精品一区在线| 两个人免费观看高清视频| 一卡2卡三卡四卡精品乱码亚洲| 欧美av亚洲av综合av国产av| 最新在线观看一区二区三区| 婷婷精品国产亚洲av在线| 国产成人一区二区三区免费视频网站| 神马国产精品三级电影在线观看 | 欧美一区二区精品小视频在线| 亚洲色图 男人天堂 中文字幕| 不卡一级毛片| 真人一进一出gif抽搐免费| 亚洲电影在线观看av| 午夜免费激情av| 国产一级毛片七仙女欲春2 | 亚洲人成电影观看| 一区二区三区激情视频| 香蕉国产在线看| 欧美日韩黄片免| 在线观看日韩欧美| www.自偷自拍.com| 亚洲人成伊人成综合网2020| 好男人电影高清在线观看| 亚洲人成伊人成综合网2020| 国产亚洲精品第一综合不卡| 中文字幕色久视频| 一区福利在线观看| 高清在线国产一区| 日韩欧美三级三区| 精品久久久久久久久久免费视频| 老汉色av国产亚洲站长工具| 成人欧美大片| 天天添夜夜摸| 在线十欧美十亚洲十日本专区| 色播亚洲综合网| 久久香蕉精品热|