• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    離散制造智能工廠場(chǎng)景的AGV路徑規(guī)劃方法

    2021-12-09 08:29:12郭心德丁宏強(qiáng)
    關(guān)鍵詞:移動(dòng)機(jī)器人規(guī)劃動(dòng)作

    郭心德,丁宏強(qiáng)

    (1. 廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣東 廣州 510006;2. 物聯(lián)網(wǎng)智能信息處理與系統(tǒng)集成教育部重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006;3. 香港中文大學(xué),廣東 深圳 518172)

    機(jī)器人技術(shù)的飛速發(fā)展見證了現(xiàn)代機(jī)器人的出現(xiàn)。越來(lái)越多的機(jī)器人被用以協(xié)助或取代人類在大量領(lǐng)域執(zhí)行復(fù)雜控制操作和規(guī)劃任務(wù)。然而,為移動(dòng)機(jī)器人設(shè)計(jì)可靠的路徑規(guī)劃通常是一個(gè)復(fù)雜的過(guò)程,即使是專門為移動(dòng)機(jī)器人進(jìn)行路徑規(guī)劃的專家也需要花費(fèi)大量的時(shí)間進(jìn)行設(shè)計(jì)和試驗(yàn)[1]。移動(dòng)機(jī)器人面臨的不確定環(huán)境的復(fù)雜性使得機(jī)器人的路徑規(guī)劃相當(dāng)困難,手動(dòng)路徑規(guī)劃通常是一個(gè)昂貴且非常耗時(shí)的過(guò)程。因此,與其為機(jī)器人預(yù)先編寫路徑規(guī)劃程序,不如讓機(jī)器人自己學(xué)習(xí)路徑規(guī)劃[2]。

    路徑規(guī)劃技術(shù)已被廣泛應(yīng)用于移動(dòng)機(jī)器人、機(jī)械臂、無(wú)人機(jī)的導(dǎo)航中。路徑規(guī)劃是指機(jī)器人在復(fù)雜的環(huán)境中規(guī)劃出一條從初始位置到目標(biāo)位置的合適路徑,是移動(dòng)機(jī)器人導(dǎo)航最基本的部分[3]。配備多種傳感器的移動(dòng)機(jī)器人可以通過(guò)路徑規(guī)劃技術(shù)進(jìn)行定位、控制運(yùn)動(dòng)器、檢測(cè)障礙物并避開障礙物。自主智能的路徑規(guī)劃可以使得移動(dòng)機(jī)器人根據(jù)環(huán)境信息進(jìn)行綜合判斷和智能決策[4]。

    近年來(lái),許多經(jīng)典的路徑規(guī)劃方法已經(jīng)被深入研究,常見的有A*算法[5]、D*算法[6]、人工勢(shì)場(chǎng)法[7-8]和蟻群算法[9]。然而,這些方法仍然存在一些缺點(diǎn),例如無(wú)法或難以處理復(fù)雜的高維環(huán)境信息(如圖像)或在復(fù)雜環(huán)境中容易陷入局部最優(yōu)。相比之下,強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)是近年來(lái)構(gòu)建自適應(yīng)和智能系統(tǒng)的強(qiáng)大方法。在強(qiáng)化學(xué)習(xí)的框架中,智能體是決策者,它可以在環(huán)境中采取行動(dòng),并在與環(huán)境進(jìn)行交互的過(guò)程中獲得強(qiáng)化信號(hào),該信號(hào)通常稱為獎(jiǎng)勵(lì)(或懲罰),是評(píng)估一個(gè)動(dòng)作的結(jié)果。智能體不斷進(jìn)行環(huán)境交互與訓(xùn)練,以最大化一段時(shí)間內(nèi)的總累積獎(jiǎng)勵(lì)[10]。此外,深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning, DRL)具有深度學(xué)習(xí)的強(qiáng)大感知能力和強(qiáng)化學(xué)習(xí)的智能決策能力,在面對(duì)復(fù)雜的環(huán)境和任務(wù)時(shí)表現(xiàn)突出[11]。例如,文獻(xiàn)[12]中應(yīng)用了深度強(qiáng)化學(xué)習(xí)的AlphaGo打敗了人類。文獻(xiàn)[13]將深度強(qiáng)化學(xué)習(xí)成功應(yīng)用于復(fù)雜的交通燈周期控制。近年來(lái),在將DRL應(yīng)用于移動(dòng)機(jī)器人路徑規(guī)劃方面也有突破性的工作。例如,在文獻(xiàn)[14]中,應(yīng)用DRL的行星車可以成功避開碎石和巖石。在文獻(xiàn)[15]中,基于DRL的智能體可以在復(fù)雜3D迷宮中實(shí)現(xiàn)端到端的導(dǎo)航,即使在開始/目標(biāo)位置頻繁變化時(shí),其表現(xiàn)也與人類水平相似。在文獻(xiàn)[16]中,一種基于DRL的方法用于移動(dòng)機(jī)器人的軌跡跟蹤和動(dòng)態(tài)避障,實(shí)現(xiàn)了視覺感知到動(dòng)作決策的端到端學(xué)習(xí)方式。在文獻(xiàn)[17]中,應(yīng)用DRL的水面艦艇(USV)實(shí)現(xiàn)了在復(fù)雜未知的環(huán)境中最優(yōu)的跟蹤控制方案。

    本文研究了離散制造智能工廠中AGV (Automated Guided Vehicle)的自主路徑規(guī)劃問(wèn)題。為了提高AGV的自主路徑規(guī)劃能力和導(dǎo)航自由度,首先將AGV路徑規(guī)劃問(wèn)題表述為馬爾可夫決策過(guò)程模型,該模型包含3個(gè)主要元素:狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)[18]。AGV上多個(gè)傳感器感知到的多模態(tài)環(huán)境信息被作為狀態(tài)空間,由此產(chǎn)生的馬爾科夫決策過(guò)程模型是一個(gè)高維模型,它包含由多模態(tài)環(huán)境信息組成的高維狀態(tài)空間和二維動(dòng)作空間。融合了DQN[19-20]3種經(jīng)典改進(jìn)(Double Deep Q Network[21]、Dueling DQN[22]、Prioritized Experience Replay[23])的Dueling Double DQN with Prioritized Experience Replay (Dueling DDQN-PER)深度強(qiáng)化學(xué)習(xí)方法,進(jìn)行AGV在復(fù)雜環(huán)境中最優(yōu)控制策略訓(xùn)練。

    本文的主要工作如下:

    (1) 基于機(jī)器人操作系統(tǒng)(Robot Operating System, ROS)和機(jī)器人仿真工具箱Gazebo對(duì)物理仿真環(huán)境進(jìn)行建模。這2項(xiàng)工作能夠?yàn)橹悄荏w和環(huán)境建立一個(gè)交互平臺(tái),并為基于深度強(qiáng)化學(xué)習(xí)的AGV路徑規(guī)劃提供一個(gè)實(shí)驗(yàn)平臺(tái)。

    (2) 在實(shí)際的離散制造智能工廠的智能物流系統(tǒng)中,除了貨架和工作區(qū)的位置固定外,其他AGV的位置是在不斷變化的。為了解決復(fù)雜智能物流系統(tǒng)中AGV的路徑規(guī)劃問(wèn)題,本文在AGV路徑規(guī)劃方法中應(yīng)用了基于深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法提高規(guī)劃成功率。同時(shí),本文重新設(shè)計(jì)了一種可以處理多模態(tài)傳感器信息的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其可以同時(shí)處理來(lái)自AGV傳感器的位置、速度、圖像和激光雷達(dá)點(diǎn)云信息。

    (3) 本文首先在無(wú)障礙環(huán)境中對(duì)AGV進(jìn)行全局路徑規(guī)劃訓(xùn)練,該仿真實(shí)驗(yàn)比較了幾種不同DQN算法的訓(xùn)練性能,并為復(fù)雜環(huán)境下的路徑規(guī)劃訓(xùn)練提供預(yù)訓(xùn)練策略。隨后,在復(fù)雜的智能物流仿真環(huán)境中驗(yàn)證所提出的基于深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法。

    1 AGV路徑規(guī)劃問(wèn)題描述

    在離散制造智能工廠的智能物流系統(tǒng)中,AGV常用以運(yùn)輸原材料,對(duì)于進(jìn)行路徑規(guī)劃的AGV來(lái)說(shuō),貨架、工作區(qū)、其他AGV和邊界圍欄都是障礙。因此,需要控制AGV的速度和角速度來(lái)進(jìn)行最優(yōu)路徑規(guī)劃。AGV可以利用全局信息進(jìn)行全局路徑規(guī)劃,找到一條從起始位置到目標(biāo)位置的相對(duì)較短且接近直線的路徑,并利用局部信息進(jìn)行局部路徑規(guī)劃以避開障礙物。主要目標(biāo)是在不遇到障礙的情況下使路徑長(zhǎng)度最短。

    本文應(yīng)用ROS和Gazebo構(gòu)建了離散制造智能工廠仿真環(huán)境。整個(gè)環(huán)境為一個(gè)被圍墻包圍的30 m×30 m的正方形區(qū)域,內(nèi)有6個(gè)2 m×2 m的工作區(qū)、8個(gè)貨架、10個(gè)其他AGV和一個(gè)主體AGV-Agent。本文中智能物流仿真環(huán)境如圖1所示。

    圖1 離散制造智能工廠仿真環(huán)境Fig.1 Discrete manufacturing smart factory simulation environment

    圖2 RGB圖像Fig.2 RGB image

    圖3 激光點(diǎn)云信息可視化圖Fig.3 Visualization of laser point cloud information

    AGV-Agent可以通過(guò)自身位置和目標(biāo)位置信息識(shí)別圖像信息前方是否有障礙物,并不斷接近目標(biāo)位置。為了讓智能體更有效地學(xué)習(xí),對(duì)AGV狀態(tài)信息進(jìn)行預(yù)處理。將768×1 024×3的圖像轉(zhuǎn)換為80×80×3的RGB圖像,并記為simg,位置與速度信息融合成一個(gè)四維向量[d,θ,v,ω],其中d表示AGV與目標(biāo)位置的距離, θ表示與目標(biāo)位置的角度。

    本文的AGV-Agent控制量是速度和角速度,將速度為0 m/s、0.5 m/s、1 m/s和角速度為0 rad/s、0.5 rad/s、?0.5 rad/s、1 rad/s、?1 rad/s組合成10種動(dòng)作選擇。雖然動(dòng)作總數(shù)是任意的,但其中有一種選擇不應(yīng)該組合,即速度為0 m/s,角速度為0 rad/s,原因是當(dāng)最優(yōu)策略選擇此動(dòng)作組合時(shí),AGV-Agent獲取到的環(huán)境信息是沒(méi)有變化的,因此很容易造成AGVAgent長(zhǎng)時(shí)間停留在固定位置上。

    在強(qiáng)化學(xué)習(xí)的框架中,AGV的獎(jiǎng)勵(lì)設(shè)置對(duì)于策略網(wǎng)絡(luò)的收斂速度和訓(xùn)練效果至關(guān)重要。合適的獎(jiǎng)勵(lì)設(shè)計(jì)有利于策略的快速收斂,相反,不適合的獎(jiǎng)勵(lì)設(shè)計(jì)可能會(huì)降低收斂速度甚至?xí)?dǎo)致無(wú)法收斂,進(jìn)而造成智能體訓(xùn)練失敗。本文在考慮實(shí)際的離散制造智能工廠環(huán)境下,提出了一種有利于智能體進(jìn)行學(xué)習(xí)的獎(jiǎng)勵(lì)和懲罰的設(shè)計(jì)。

    2 本文方法

    2.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)

    本文重新設(shè)計(jì)的處理多模態(tài)傳感器信息的神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖4所示。AGV-Agent在每次交互過(guò)程中接收一張來(lái)自前置攝像頭的768×1 024×3的RGB圖像、來(lái)自激光雷達(dá)的360維激光點(diǎn)云信息和一個(gè)包含速度、角速度、目標(biāo)位置距離和目標(biāo)位置角度的四維向量。因此,重新設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)使用3個(gè)卷積層來(lái)提取RGB圖像的特征信息,并使用一個(gè)全連接層來(lái)提取更遠(yuǎn)的環(huán)境信息。長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)用于提取激光雷達(dá)點(diǎn)云特征信息,全連接層用于提取四維向量特征信息。最后,使用CONCAT層進(jìn)行特征信息融合。綜合的特征信息作為Dueling網(wǎng)絡(luò)結(jié)構(gòu)的輸入。

    圖4 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Neural network structure

    Dueling網(wǎng)絡(luò)結(jié)構(gòu)分別對(duì)動(dòng)作值函數(shù)A(s,a;θ,β)和狀態(tài)值函數(shù)V(s;θ,α)進(jìn)行評(píng)估,最后形成Dueling網(wǎng)絡(luò)結(jié)構(gòu)的最終輸出Q值,即為

    式中:s為當(dāng)前狀態(tài),a為當(dāng)前狀態(tài)下的動(dòng)作, θ為共享層的神經(jīng)網(wǎng)絡(luò)參數(shù), α為狀態(tài)值函數(shù)的神經(jīng)網(wǎng)絡(luò)參數(shù), β為動(dòng)作值函數(shù)的網(wǎng)絡(luò)參數(shù)。

    Dueling網(wǎng)絡(luò)結(jié)構(gòu)的應(yīng)用可以提高最終Q值評(píng)估的準(zhǔn)確性,最終提高學(xué)習(xí)效率和學(xué)習(xí)性能。最終網(wǎng)絡(luò)會(huì)輸出某個(gè)狀態(tài)輸入下的10個(gè)動(dòng)作Q值,進(jìn)而實(shí)現(xiàn)狀態(tài)空間到動(dòng)作空間的映射。最終選擇Q值最大的動(dòng)作作為AGV-Agent與環(huán)境交互的動(dòng)作。

    卷積網(wǎng)絡(luò)本質(zhì)上是一種輸入到輸出的映射。它可以學(xué)習(xí)到大量輸入和輸出之間的映射關(guān)系,而不需要輸入和輸出之間的任何精確的數(shù)學(xué)表達(dá)式,只要已知模型訓(xùn)練卷積網(wǎng)絡(luò),并且網(wǎng)絡(luò)具有輸入和輸出對(duì)之間的映射能力。因此,使用3個(gè)卷積層來(lái)提取AGV-Agent的前視攝像頭獲得的預(yù)處理圖像信息。3個(gè)卷積核的大小分別為8×8×3×32、4×4×32×64、3×3×64×64。

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。與一般的神經(jīng)網(wǎng)絡(luò)相比,它可以處理時(shí)空序列變化的數(shù)據(jù)。LSTM是一種特殊的RNN,主要解決長(zhǎng)序列訓(xùn)練過(guò)程中梯度消失和梯度爆炸的問(wèn)題。LSTM在更長(zhǎng)的序列中比普通RNN表現(xiàn)更好。因此,將LSTM單元的單位設(shè)置為256來(lái)提取360維激光點(diǎn)云信息。

    全連接層(Fully Connected Layers, FC)在神經(jīng)網(wǎng)絡(luò)中扮演“分類器”的角色。如果卷積層、LSTM等網(wǎng)絡(luò)結(jié)構(gòu)將原始數(shù)據(jù)映射到隱藏層特征空間,則全連接層起到將學(xué)習(xí)到的分布式特征表示映射到樣本標(biāo)簽空間的作用。全連接層在本文的網(wǎng)絡(luò)結(jié)構(gòu)中有2個(gè)功能,一是提取AGV-Agent的速度和地理位置信息的特征,二是將信息融合后的特征映射到動(dòng)作空間中。

    2.2 基于深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法

    RGB圖像simg、四維向量作[d,θ,v,ω]和360維激光點(diǎn)云信息[x1,x2,x3,···,x360]為預(yù)處理后的環(huán)境信息s,它們被作為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的輸入,神經(jīng)網(wǎng)絡(luò)最終輸出為在該狀態(tài)下的10種動(dòng)作Q值,Q值為動(dòng)作?價(jià)值函數(shù)的值,表示未來(lái)獎(jiǎng)勵(lì)的期望回報(bào)。

    式中:St為狀態(tài)空間S中t時(shí)刻的狀態(tài),At為動(dòng)作空間A中t時(shí)刻的動(dòng)作。在DRL中,利用神經(jīng)網(wǎng)絡(luò)作為函數(shù)近似器來(lái)估計(jì)動(dòng)作?價(jià)值函數(shù)Q(s,a)。

    選取神經(jīng)網(wǎng)絡(luò)輸出的最大Q值對(duì)應(yīng)的動(dòng)作作為AGV-Agent的當(dāng)前動(dòng)作a,并以該動(dòng)作與環(huán)境交互得到獎(jiǎng)勵(lì)r、下一狀態(tài)s′和回合結(jié)束標(biāo)記Fterminal,由此形成五元組〈s,a,r,s′,Fterminal〉,將該五元組存入經(jīng)驗(yàn)池D中。使用Double DQN和Dueling DQN來(lái)避免過(guò)估計(jì)并提高訓(xùn)練性能。因此存在2個(gè)網(wǎng)絡(luò):當(dāng)前網(wǎng)絡(luò)Q,目標(biāo)網(wǎng)絡(luò)Q︿。通過(guò)經(jīng)驗(yàn)優(yōu)先回放方法在重放記憶D中選擇固定數(shù)量的〈s,a,r,s′,Fterminal〉片段,形成一個(gè)Bminibatch并用于更新當(dāng)前網(wǎng)絡(luò)的參數(shù)θ。目標(biāo)Q值yj可以通過(guò)式(4)計(jì)算。

    在訓(xùn)練過(guò)程中,AGV-Agent的位置初始化對(duì)網(wǎng)絡(luò)的收斂性有關(guān)鍵影響。AGV-Agent的初始位置位于整個(gè)軌跡的開頭,這會(huì)導(dǎo)致在初始位置一定范圍內(nèi)過(guò)度學(xué)習(xí),從而導(dǎo)致網(wǎng)絡(luò)對(duì)該狀態(tài)下環(huán)境信息形成過(guò)估計(jì),而靠近目標(biāo)位置的狀態(tài)序列會(huì)缺乏學(xué)習(xí),從而造成AGV-Agent無(wú)法更快地到達(dá)目標(biāo)位置。為了克服這個(gè)問(wèn)題,本文使用的起始位置初始化方案為:貨架前面的位置和目標(biāo)位置8 m內(nèi)的位置的初始化各占50%的概率。

    然后,根據(jù)一定的概率從該策略中生成一定的樣本放入記憶池中。

    3 仿真結(jié)果

    3.1 預(yù)訓(xùn)練策略仿真結(jié)果

    在無(wú)障礙環(huán)境中,AGV-Agent在每個(gè)回合開始時(shí)隨機(jī)初始化起始位置和目標(biāo)位置,初始化需要滿足這兩個(gè)位置的距離在20~25 m之間。當(dāng)AGVAgent到達(dá)目標(biāo)位置或當(dāng)前回合達(dá)到最大300步時(shí),該回合結(jié)束,并進(jìn)入下一回合的訓(xùn)練。

    本實(shí)驗(yàn)評(píng)估了基于DQN算法的3種不同關(guān)鍵改進(jìn)(Double Deep Q Network[21]、Dueling DQN[22]、Prioritized Experience Replay[23])的3種組合算法,分別為Double Deep Q Network(DDQN)、Dueling Double Deep Q Network(Dueling DDQN)和Dueling DDQNPER。圖5顯示了預(yù)訓(xùn)練策略學(xué)習(xí)曲線,可以注意到Dueling DDQN-PER具有稍快的收斂速度和更好的穩(wěn)定性,而其他兩種算法在收斂后保持一定程度的振動(dòng)。分別應(yīng)用3種不同改進(jìn)組合的DQN算法進(jìn)行測(cè)試評(píng)估,其中前10個(gè)測(cè)試回合的路徑長(zhǎng)度統(tǒng)計(jì)在表1。從表1可以看出,Dueling DDQN-PER在10個(gè)回合內(nèi)的平均路徑長(zhǎng)度為23.61 m,略優(yōu)于DDQN的23.68 m和Dueling DDQN的23.87 m。

    圖5 預(yù)訓(xùn)練策略學(xué)習(xí)曲線Fig.5 Pre-training policy learning curve

    表1 測(cè)試回合路徑長(zhǎng)度Table 1 Path length of test episodem

    Dueling DDQN-PER是結(jié)合DQN算法的3個(gè)關(guān)鍵改進(jìn)而衍生出來(lái)的,這意味著它具有Dueling網(wǎng)絡(luò)結(jié)構(gòu)對(duì)每個(gè)動(dòng)作的Q值的相對(duì)準(zhǔn)確的評(píng)估。Double DQN可以更好地避免過(guò)估計(jì),經(jīng)驗(yàn)優(yōu)先回放機(jī)制可以為模型更快的收斂提供高效有益的數(shù)據(jù)。

    本實(shí)驗(yàn)的對(duì)比結(jié)果可為復(fù)雜離散制造智能工廠環(huán)境下的路徑規(guī)劃選用最優(yōu)的算法,且該預(yù)訓(xùn)練策略可用于復(fù)雜環(huán)境下AGV的環(huán)境交互,從而獲得更優(yōu)的訓(xùn)練回合數(shù)據(jù)供AGV進(jìn)行訓(xùn)練。

    3.2 離散制造智能工廠環(huán)境仿真結(jié)果

    在無(wú)其他AGV的離散制造智能工廠環(huán)境中,經(jīng)過(guò)本文方法訓(xùn)練后的AGV可以在保證規(guī)劃成功率的前提下,使得規(guī)劃長(zhǎng)度較短。規(guī)劃成功率從預(yù)訓(xùn)練策略的全局路徑規(guī)劃的34%提升至96%;在8個(gè)測(cè)試回合里,該方法的平均規(guī)劃路徑長(zhǎng)度為22.11 m,優(yōu)于快速擴(kuò)展隨機(jī)樹算法(Rapidly-exploring Random Tree,RRT)的23.87 m。規(guī)劃的路徑軌跡對(duì)比如圖6所示。

    圖6 路徑規(guī)劃軌跡對(duì)比圖Fig.6 Comparison chart of path planning trajectory

    離散智能制造工廠下的智能物流仿真環(huán)境中,不僅有一臺(tái)主體AGV-Agent完成物料配送任務(wù),環(huán)境中還包括多臺(tái)AGV正在進(jìn)行物料配送任務(wù)。在這種情況下,多臺(tái)AGV會(huì)成為彼此的障礙,在避開工作區(qū)和貨架的同時(shí),也需要避開其他AGV。

    在復(fù)雜環(huán)境的路徑規(guī)劃實(shí)驗(yàn)中,AGV-Agent經(jīng)過(guò)70 000次連續(xù)的環(huán)境交互與迭代訓(xùn)練,策略神經(jīng)網(wǎng)絡(luò)的參數(shù)收斂到最優(yōu)值。訓(xùn)練過(guò)程的代價(jià)曲線如圖7所示。經(jīng)過(guò)訓(xùn)練后的AGV-Agent學(xué)會(huì)了如何在未知復(fù)雜的環(huán)境中面對(duì)障礙物做出規(guī)避的動(dòng)作選擇。神經(jīng)網(wǎng)絡(luò)可以將AGV-Agent配備傳感器獲得的環(huán)境信息映射到最優(yōu)動(dòng)作選擇。圖8展示了6個(gè)測(cè)試回合的路徑規(guī)劃結(jié)果??梢杂^察到,AGV-Agent在面對(duì)障礙物時(shí),不僅可以作出規(guī)避的動(dòng)作選擇,而且規(guī)劃的軌跡也較為平滑。從圖中的6條軌跡圖也可以明顯看出,當(dāng)其他AGV出現(xiàn)在AGV-Agent前面時(shí),其可以及時(shí)作出合適的動(dòng)作選擇,并改變當(dāng)前的前進(jìn)方向,從而避開障礙物。

    圖7 復(fù)雜環(huán)境訓(xùn)練曲線Fig.7 Training curve of complex environment

    圖8 測(cè)試回合軌跡圖Fig.8 Trajectory graph of test episode

    在實(shí)驗(yàn)中,隨著路徑規(guī)劃環(huán)境變得越來(lái)越復(fù)雜,障礙物的數(shù)量和類型也越來(lái)越多,AGV-Agent的規(guī)劃決策也變得越來(lái)越困難。盡管如此,在大多數(shù)情況下,AGV-Agent可以成功規(guī)劃路徑軌跡。因此,本文設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以實(shí)現(xiàn)多模態(tài)傳感器信息的融合感知,基于DRL的方法可以有效進(jìn)行AGV路徑規(guī)劃的訓(xùn)練。實(shí)驗(yàn)證明了所提出的Dueling DDQNPER算法在不同路徑規(guī)劃環(huán)境下的可行性和穩(wěn)定性。

    4 結(jié)論

    本文提出了一種基于RL的面向離散制造智能工廠路徑規(guī)劃方法。該方法主要基于Dueling DDQNPER實(shí)現(xiàn),具有優(yōu)先經(jīng)驗(yàn)回放和全局路徑規(guī)劃策略的優(yōu)勢(shì),提高了RL的收斂速度。此外,提出了一種新的神經(jīng)網(wǎng)絡(luò),可以處理RGB圖像、地理位置信息、速度信息和激光信息等多模式傳感器信息。這可以讓AGV-Agent獲得足夠的環(huán)境信息特征,以便更好地進(jìn)行自主路徑規(guī)劃。實(shí)驗(yàn)結(jié)果證明了所提出的AGV路徑規(guī)劃方法的可行性,AGV-Agent可以在包含多臺(tái)AGV且不可預(yù)測(cè)的離散制造智能工廠動(dòng)態(tài)環(huán)境下安全地完成自主路徑規(guī)劃。本文提出的方法可以利用深度學(xué)習(xí)強(qiáng)大的感知能力和強(qiáng)化學(xué)習(xí)強(qiáng)大的決策能力,使AGV具有探索和避開障礙物的能力,從而可以更快地接近目標(biāo)位置,并具有更短的路徑軌跡長(zhǎng)度。

    在未來(lái)的工作中,繼續(xù)加強(qiáng)學(xué)習(xí)的研究,嘗試使用多智能體RL方法同時(shí)進(jìn)行多臺(tái)AGV的路徑規(guī)劃來(lái)完成某項(xiàng)任務(wù)。此外,將嘗試使用RL方法進(jìn)行連續(xù)動(dòng)作控制,例如使用DDPG進(jìn)行路徑規(guī)劃,可以更有效地模擬AGV的連續(xù)速度控制。

    猜你喜歡
    移動(dòng)機(jī)器人規(guī)劃動(dòng)作
    移動(dòng)機(jī)器人自主動(dòng)態(tài)避障方法
    動(dòng)作描寫要具體
    規(guī)劃引領(lǐng)把握未來(lái)
    快遞業(yè)十三五規(guī)劃發(fā)布
    商周刊(2017年5期)2017-08-22 03:35:26
    基于Twincat的移動(dòng)機(jī)器人制孔系統(tǒng)
    畫動(dòng)作
    動(dòng)作描寫不可少
    多管齊下落實(shí)規(guī)劃
    迎接“十三五”規(guī)劃
    非同一般的吃飯動(dòng)作
    一级毛片 在线播放| 校园人妻丝袜中文字幕| 国产 精品1| 高清毛片免费看| 一个人免费看片子| 精品人妻熟女毛片av久久网站| 全区人妻精品视频| 成人黄色视频免费在线看| 国产亚洲午夜精品一区二区久久| 久久久久网色| 精品人妻熟女av久视频| 亚洲丝袜综合中文字幕| 欧美人与善性xxx| a级毛片在线看网站| 各种免费的搞黄视频| 久久 成人 亚洲| 免费黄色在线免费观看| 99热这里只有精品一区| 老熟女久久久| 欧美激情极品国产一区二区三区 | 又粗又硬又长又爽又黄的视频| 在线观看国产h片| 国产片特级美女逼逼视频| 婷婷色av中文字幕| 欧美97在线视频| 在线播放无遮挡| 交换朋友夫妻互换小说| 亚洲欧洲日产国产| 一本大道久久a久久精品| 亚洲人成网站在线播| 色5月婷婷丁香| 婷婷色麻豆天堂久久| 精品国产乱码久久久久久小说| 亚洲av电影在线观看一区二区三区| 熟女人妻精品中文字幕| 国产色爽女视频免费观看| 成年人免费黄色播放视频| 日韩av在线免费看完整版不卡| 人人妻人人澡人人看| 日本av手机在线免费观看| xxxhd国产人妻xxx| 国产老妇伦熟女老妇高清| 亚洲精品久久午夜乱码| 精品国产国语对白av| 精品卡一卡二卡四卡免费| 黄色视频在线播放观看不卡| 欧美日韩亚洲高清精品| 亚洲av在线观看美女高潮| 国产爽快片一区二区三区| 国产乱人偷精品视频| 国产日韩欧美亚洲二区| 精品久久久噜噜| 国产高清三级在线| 乱人伦中国视频| 免费少妇av软件| 国产色婷婷99| 精品亚洲乱码少妇综合久久| 国产成人aa在线观看| 中文字幕亚洲精品专区| av在线老鸭窝| 久久人妻熟女aⅴ| 亚洲国产精品专区欧美| 精品一区在线观看国产| a级毛片黄视频| 国产免费又黄又爽又色| 国产在线视频一区二区| 日韩精品有码人妻一区| 插阴视频在线观看视频| 欧美3d第一页| 伦理电影大哥的女人| 日本午夜av视频| 色哟哟·www| 黄色视频在线播放观看不卡| 亚洲,欧美,日韩| 汤姆久久久久久久影院中文字幕| 在线观看美女被高潮喷水网站| 免费看av在线观看网站| 国产成人精品在线电影| 一本—道久久a久久精品蜜桃钙片| 国语对白做爰xxxⅹ性视频网站| 麻豆精品久久久久久蜜桃| 日韩在线高清观看一区二区三区| 天天操日日干夜夜撸| 欧美精品国产亚洲| 一边摸一边做爽爽视频免费| 亚洲国产精品999| 欧美亚洲 丝袜 人妻 在线| 欧美性感艳星| 亚洲精品456在线播放app| 乱码一卡2卡4卡精品| 免费高清在线观看日韩| 少妇的逼好多水| 人妻少妇偷人精品九色| 亚洲久久久国产精品| 中文欧美无线码| 99热网站在线观看| 国产精品久久久久久精品电影小说| 精品久久久噜噜| 男的添女的下面高潮视频| 女人精品久久久久毛片| 2021少妇久久久久久久久久久| 女的被弄到高潮叫床怎么办| 精品一品国产午夜福利视频| 免费高清在线观看视频在线观看| 中国三级夫妇交换| 青春草国产在线视频| 亚洲第一av免费看| 国产免费一级a男人的天堂| 国产成人精品婷婷| 一区二区三区乱码不卡18| 国产乱来视频区| 国产精品久久久久久久久免| 99国产综合亚洲精品| 中国三级夫妇交换| 韩国高清视频一区二区三区| 黄色欧美视频在线观看| 街头女战士在线观看网站| 亚洲av福利一区| 亚洲国产精品一区三区| 国产乱人偷精品视频| 日本黄色日本黄色录像| 亚洲精品乱久久久久久| 午夜福利视频精品| 欧美成人午夜免费资源| 五月开心婷婷网| 精品一区二区免费观看| 亚洲国产精品成人久久小说| 乱人伦中国视频| 欧美三级亚洲精品| 一边亲一边摸免费视频| 午夜福利影视在线免费观看| 欧美老熟妇乱子伦牲交| 国产一区二区在线观看日韩| 久久国内精品自在自线图片| 中国美白少妇内射xxxbb| 欧美日韩视频精品一区| 插阴视频在线观看视频| 久久精品国产a三级三级三级| 美女脱内裤让男人舔精品视频| 人人妻人人澡人人看| 亚洲综合精品二区| 亚洲av在线观看美女高潮| 亚洲国产日韩一区二区| 成人国语在线视频| 亚洲精品第二区| 久久久久久久久久久丰满| 午夜福利,免费看| 久久精品久久久久久噜噜老黄| 青青草视频在线视频观看| 欧美xxxx性猛交bbbb| 日日摸夜夜添夜夜添av毛片| 交换朋友夫妻互换小说| 高清不卡的av网站| 欧美97在线视频| 国产成人精品福利久久| 成人手机av| 免费大片18禁| 乱人伦中国视频| 日本黄大片高清| 国产精品欧美亚洲77777| 青春草国产在线视频| 亚洲欧美色中文字幕在线| 亚洲av欧美aⅴ国产| 亚洲av电影在线观看一区二区三区| 亚洲av不卡在线观看| 人体艺术视频欧美日本| 爱豆传媒免费全集在线观看| 春色校园在线视频观看| 尾随美女入室| 亚洲av福利一区| 亚洲欧美清纯卡通| 熟女av电影| 久久精品久久久久久噜噜老黄| 久久精品久久精品一区二区三区| 狂野欧美白嫩少妇大欣赏| 不卡视频在线观看欧美| 国产成人免费观看mmmm| 亚洲四区av| 欧美老熟妇乱子伦牲交| 最近最新中文字幕免费大全7| av卡一久久| 亚洲国产成人一精品久久久| 91精品三级在线观看| 国产伦精品一区二区三区视频9| 国产亚洲精品久久久com| 成人午夜精彩视频在线观看| 国产成人精品无人区| 成人漫画全彩无遮挡| 熟女人妻精品中文字幕| 国产成人精品在线电影| 亚洲综合色网址| 韩国av在线不卡| 女性生殖器流出的白浆| 男女边吃奶边做爰视频| 99热这里只有精品一区| freevideosex欧美| 丰满迷人的少妇在线观看| 亚洲精品中文字幕在线视频| 亚洲国产精品一区二区三区在线| 一区二区三区四区激情视频| 亚洲精品中文字幕在线视频| 交换朋友夫妻互换小说| 午夜91福利影院| 久久这里有精品视频免费| 免费高清在线观看日韩| 青青草视频在线视频观看| 欧美xxxx性猛交bbbb| 日韩,欧美,国产一区二区三区| 亚洲激情五月婷婷啪啪| 色哟哟·www| 亚洲av不卡在线观看| 大话2 男鬼变身卡| 18禁裸乳无遮挡动漫免费视频| 亚洲欧美一区二区三区国产| 伦精品一区二区三区| 日韩制服骚丝袜av| 一本久久精品| 久热这里只有精品99| 国产精品一国产av| 下体分泌物呈黄色| 国产成人精品在线电影| 青青草视频在线视频观看| 蜜桃国产av成人99| 一级,二级,三级黄色视频| 久久韩国三级中文字幕| 日日啪夜夜爽| 亚洲欧美一区二区三区黑人 | 国产午夜精品久久久久久一区二区三区| 亚洲精品国产色婷婷电影| 亚洲精品国产av蜜桃| 日日摸夜夜添夜夜添av毛片| 亚洲美女视频黄频| 国产视频内射| 国产成人精品久久久久久| 99热国产这里只有精品6| 亚洲精品日本国产第一区| 国产淫语在线视频| 天堂中文最新版在线下载| 亚洲情色 制服丝袜| 精品亚洲成a人片在线观看| 亚洲激情五月婷婷啪啪| 丰满迷人的少妇在线观看| 丝袜喷水一区| 少妇高潮的动态图| 国产高清国产精品国产三级| 国产色婷婷99| 日本wwww免费看| 91精品国产国语对白视频| 国产日韩欧美在线精品| 在线看a的网站| av国产精品久久久久影院| 成年女人在线观看亚洲视频| 亚洲av.av天堂| 国产亚洲一区二区精品| 黄色配什么色好看| 国产日韩一区二区三区精品不卡 | 久久精品国产自在天天线| 在线 av 中文字幕| 91精品一卡2卡3卡4卡| 亚洲色图 男人天堂 中文字幕 | 三级国产精品片| 麻豆成人av视频| av播播在线观看一区| 日韩成人av中文字幕在线观看| 国产欧美日韩一区二区三区在线 | 中文字幕亚洲精品专区| 性高湖久久久久久久久免费观看| 伦理电影免费视频| 午夜免费鲁丝| 一级毛片aaaaaa免费看小| 免费高清在线观看视频在线观看| 日日摸夜夜添夜夜爱| 老熟女久久久| 国产一区二区在线观看日韩| 亚洲精品中文字幕在线视频| 久久99蜜桃精品久久| 综合色丁香网| 亚洲少妇的诱惑av| 日韩伦理黄色片| 我要看黄色一级片免费的| 国产精品99久久久久久久久| 男女国产视频网站| 亚洲av不卡在线观看| 这个男人来自地球电影免费观看 | 你懂的网址亚洲精品在线观看| 国产一区二区在线观看av| 韩国高清视频一区二区三区| 五月开心婷婷网| 欧美性感艳星| 日韩在线高清观看一区二区三区| 九九久久精品国产亚洲av麻豆| 久久99热6这里只有精品| 久久99一区二区三区| 久久韩国三级中文字幕| 成人综合一区亚洲| 最近最新中文字幕免费大全7| 中文乱码字字幕精品一区二区三区| 亚洲成色77777| 久久久久视频综合| 国产亚洲av片在线观看秒播厂| 欧美日韩视频精品一区| 天堂俺去俺来也www色官网| 亚洲精品aⅴ在线观看| 成人漫画全彩无遮挡| 嘟嘟电影网在线观看| 精品国产一区二区三区久久久樱花| av在线播放精品| 国产精品麻豆人妻色哟哟久久| 一区二区三区精品91| 最近手机中文字幕大全| 考比视频在线观看| 国产精品三级大全| 99久久精品一区二区三区| 一本色道久久久久久精品综合| 高清毛片免费看| 国产av码专区亚洲av| 亚洲精品色激情综合| 久久精品国产亚洲av天美| 午夜av观看不卡| 九色亚洲精品在线播放| 欧美精品人与动牲交sv欧美| 精品一区二区三区视频在线| 制服丝袜香蕉在线| 美女cb高潮喷水在线观看| 女性生殖器流出的白浆| 国产成人免费无遮挡视频| 欧美人与善性xxx| 国产亚洲最大av| 欧美日韩亚洲高清精品| 亚洲国产精品一区二区三区在线| 高清欧美精品videossex| kizo精华| 国产伦精品一区二区三区视频9| 999精品在线视频| 18在线观看网站| 欧美日韩av久久| 高清黄色对白视频在线免费看| av国产久精品久网站免费入址| 一个人免费看片子| www.色视频.com| 91精品国产九色| 成人18禁高潮啪啪吃奶动态图 | 欧美bdsm另类| 国产精品国产三级国产专区5o| 亚洲国产精品999| 夫妻午夜视频| 国产视频内射| 久久久亚洲精品成人影院| 国产成人av激情在线播放 | 日韩三级伦理在线观看| 国产乱来视频区| 人妻制服诱惑在线中文字幕| 视频中文字幕在线观看| 午夜免费观看性视频| 午夜av观看不卡| 久久99热6这里只有精品| 在线天堂最新版资源| 狂野欧美激情性xxxx在线观看| 黑人欧美特级aaaaaa片| 丰满迷人的少妇在线观看| 高清在线视频一区二区三区| kizo精华| 亚洲精品乱码久久久久久按摩| 一边亲一边摸免费视频| 国产亚洲精品久久久com| 国产精品99久久久久久久久| 精品国产一区二区久久| 日韩免费高清中文字幕av| 国产一区二区三区综合在线观看 | 亚洲欧美清纯卡通| 午夜福利在线观看免费完整高清在| 亚洲精品av麻豆狂野| 岛国毛片在线播放| av在线播放精品| 尾随美女入室| 亚洲情色 制服丝袜| 欧美+日韩+精品| 久久人人爽av亚洲精品天堂| 久久av网站| 观看美女的网站| 免费看光身美女| 久久97久久精品| 亚洲,欧美,日韩| 最近中文字幕高清免费大全6| 国产成人一区二区在线| 高清不卡的av网站| 欧美日韩综合久久久久久| 91久久精品国产一区二区成人| 日本黄色日本黄色录像| 亚洲精品av麻豆狂野| 国产在线免费精品| 一本久久精品| .国产精品久久| 美女内射精品一级片tv| 日韩熟女老妇一区二区性免费视频| 丝袜美足系列| 波野结衣二区三区在线| 春色校园在线视频观看| 久久99一区二区三区| 精品人妻熟女av久视频| 蜜臀久久99精品久久宅男| 少妇人妻精品综合一区二区| 交换朋友夫妻互换小说| 建设人人有责人人尽责人人享有的| 黄片无遮挡物在线观看| 婷婷色av中文字幕| 3wmmmm亚洲av在线观看| videos熟女内射| 亚洲国产精品专区欧美| 久久久a久久爽久久v久久| 国产精品国产三级国产av玫瑰| 在线观看人妻少妇| 18禁裸乳无遮挡动漫免费视频| 欧美精品高潮呻吟av久久| 亚洲精品乱久久久久久| 丁香六月天网| 极品人妻少妇av视频| 纯流量卡能插随身wifi吗| 日本色播在线视频| 99九九在线精品视频| 在线观看免费视频网站a站| 你懂的网址亚洲精品在线观看| 一边亲一边摸免费视频| 大香蕉97超碰在线| 99热这里只有精品一区| 成人毛片a级毛片在线播放| 美女福利国产在线| av在线app专区| 亚洲精品aⅴ在线观看| 久久久精品94久久精品| 亚洲国产精品成人久久小说| 欧美人与善性xxx| 国产欧美另类精品又又久久亚洲欧美| 久久 成人 亚洲| 一级爰片在线观看| 少妇高潮的动态图| 一级a做视频免费观看| 国产精品一区www在线观看| 两个人免费观看高清视频| 亚洲色图 男人天堂 中文字幕 | 日本色播在线视频| 在线 av 中文字幕| 尾随美女入室| 成年美女黄网站色视频大全免费 | 欧美3d第一页| 午夜日本视频在线| 久久人妻熟女aⅴ| 免费av中文字幕在线| 久热久热在线精品观看| 少妇的逼水好多| 在线观看免费日韩欧美大片 | 亚洲国产精品999| 视频区图区小说| 最近手机中文字幕大全| 99热这里只有精品一区| 夫妻性生交免费视频一级片| 制服诱惑二区| 精品卡一卡二卡四卡免费| 涩涩av久久男人的天堂| 国产成人精品无人区| 日日摸夜夜添夜夜爱| 国产精品蜜桃在线观看| av又黄又爽大尺度在线免费看| 日韩中文字幕视频在线看片| 美女cb高潮喷水在线观看| 中文字幕人妻熟人妻熟丝袜美| 老司机影院毛片| 亚洲精品,欧美精品| 九色成人免费人妻av| 下体分泌物呈黄色| 赤兔流量卡办理| 亚洲精品亚洲一区二区| 黑人欧美特级aaaaaa片| 亚洲人与动物交配视频| av有码第一页| av免费在线看不卡| 亚洲国产精品一区三区| 国产一级毛片在线| 秋霞伦理黄片| 欧美最新免费一区二区三区| 少妇人妻久久综合中文| 热99国产精品久久久久久7| 久久久精品免费免费高清| 色网站视频免费| 精品久久久久久久久亚洲| 制服人妻中文乱码| 青春草国产在线视频| 国产精品不卡视频一区二区| 亚洲精品日韩在线中文字幕| 九色成人免费人妻av| 在线观看www视频免费| 九草在线视频观看| 国产成人精品无人区| 久久影院123| 成年av动漫网址| 麻豆成人av视频| 午夜福利网站1000一区二区三区| 日韩不卡一区二区三区视频在线| 亚洲精品国产色婷婷电影| 欧美成人精品欧美一级黄| 人妻一区二区av| 欧美精品人与动牲交sv欧美| 亚洲精品乱久久久久久| 综合色丁香网| av卡一久久| 亚洲欧美中文字幕日韩二区| 在线亚洲精品国产二区图片欧美 | 男人操女人黄网站| 美女国产高潮福利片在线看| 尾随美女入室| 日本vs欧美在线观看视频| 午夜激情av网站| 久久精品国产亚洲av涩爱| 免费观看a级毛片全部| 又大又黄又爽视频免费| 免费观看性生交大片5| 嘟嘟电影网在线观看| a级片在线免费高清观看视频| 美女主播在线视频| 亚洲欧美日韩卡通动漫| 蜜桃国产av成人99| 久久国产精品大桥未久av| 国产成人精品婷婷| 18禁在线无遮挡免费观看视频| 建设人人有责人人尽责人人享有的| 成人免费观看视频高清| 精品午夜福利在线看| 国产无遮挡羞羞视频在线观看| 美女脱内裤让男人舔精品视频| 69精品国产乱码久久久| 美女cb高潮喷水在线观看| 精品视频人人做人人爽| 汤姆久久久久久久影院中文字幕| 国产精品久久久久久av不卡| 国产色婷婷99| 观看av在线不卡| videossex国产| 国产又色又爽无遮挡免| 国产永久视频网站| 亚洲欧洲日产国产| av国产久精品久网站免费入址| 色婷婷久久久亚洲欧美| 91精品一卡2卡3卡4卡| 日本-黄色视频高清免费观看| 97在线视频观看| 国产视频内射| 成人亚洲欧美一区二区av| 国产精品秋霞免费鲁丝片| 国产老妇伦熟女老妇高清| 久久国产精品男人的天堂亚洲 | 在线观看一区二区三区激情| 哪个播放器可以免费观看大片| 免费观看无遮挡的男女| 国产日韩欧美亚洲二区| 国产精品成人在线| 婷婷色综合www| 大又大粗又爽又黄少妇毛片口| 蜜臀久久99精品久久宅男| 91久久精品国产一区二区三区| 亚洲精品乱码久久久v下载方式| 亚洲美女搞黄在线观看| 五月开心婷婷网| 国产精品国产三级国产av玫瑰| 91精品国产九色| 日本-黄色视频高清免费观看| 色视频在线一区二区三区| 久久狼人影院| 国产一区二区在线观看av| 狂野欧美白嫩少妇大欣赏| 国产女主播在线喷水免费视频网站| 国产日韩一区二区三区精品不卡 | 日韩一区二区三区影片| 在线精品无人区一区二区三| av免费观看日本| 亚洲欧美日韩卡通动漫| 亚洲人成网站在线观看播放| 久久99蜜桃精品久久| 在线观看免费高清a一片| 飞空精品影院首页| 视频在线观看一区二区三区| 我要看黄色一级片免费的| 欧美日韩综合久久久久久| 中国三级夫妇交换| 亚洲欧美日韩另类电影网站| 日本-黄色视频高清免费观看| 精品少妇久久久久久888优播| 一级毛片aaaaaa免费看小| 亚洲色图 男人天堂 中文字幕 | 亚洲av中文av极速乱| 亚洲情色 制服丝袜| 亚洲少妇的诱惑av| 美女主播在线视频| 亚洲av免费高清在线观看| 色网站视频免费| 亚洲av福利一区| 久久精品夜色国产| 精品酒店卫生间| 午夜日本视频在线| av国产精品久久久久影院| 赤兔流量卡办理| 啦啦啦在线观看免费高清www| 天天影视国产精品| 亚洲综合色惰| 欧美3d第一页| 蜜臀久久99精品久久宅男| 少妇猛男粗大的猛烈进出视频| av在线老鸭窝| 国产极品天堂在线| 在线观看免费高清a一片| 亚洲欧美日韩另类电影网站| 尾随美女入室| 大片电影免费在线观看免费| 亚洲少妇的诱惑av| 国产午夜精品久久久久久一区二区三区| 亚洲欧美清纯卡通|