• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于分步遷移策略的蘋果采摘機械臂軌跡規(guī)劃方法

    2020-02-02 04:07:28鄭嫦娥GANHao趙燕東
    農(nóng)業(yè)機械學報 2020年12期
    關(guān)鍵詞:機械規(guī)劃策略

    鄭嫦娥 高 坡 GAN Hao 田 野 趙燕東

    (1.北京林業(yè)大學工學院, 北京 100083; 2.田納西大學生物系統(tǒng)工程及土壤科學系, 諾克斯維爾 TN37996)

    0 引言

    在果園果實采摘中,以多自由度機械臂作為采摘裝置、通過果實識別與軌跡規(guī)劃進行的果實自動采摘是農(nóng)業(yè)現(xiàn)代化的需求。不同于工業(yè)機械臂的結(jié)構(gòu)化工作環(huán)境,果實采摘是在非結(jié)構(gòu)化的自然環(huán)境中進行,自然生長的枝干以及未成熟果實等障礙物都給機械臂的采摘帶來了困難。因此,非結(jié)構(gòu)化自然環(huán)境下的采摘軌跡動態(tài)規(guī)劃是果實采摘機械臂的重要研究內(nèi)容[1-3]。

    多自由度機械臂采摘軌跡規(guī)劃在多維狀態(tài)空間中進行,以采摘果實為目標,在避障的前提下規(guī)劃出一條最佳的采摘軌跡。關(guān)于軌跡規(guī)劃研究人員已經(jīng)提出了多種規(guī)劃算法,如A*算法[4-5]、蟻群算法[6-8]、柵格法[9]、人工勢場法[10-11]等。這些算法大多依賴于機械臂和環(huán)境的實時建模,其計算復雜度隨機械臂自由度的增加呈指數(shù)增加,由于采摘環(huán)境多變,很難對環(huán)境進行精確建模。深度強化學習是在與環(huán)境發(fā)生交互的過程中通過獎懲函數(shù)進行自我學習推理、最終在自我探索的過程中解決問題的一種方法[12]。由于深度強化學習不需要進行環(huán)境建模,因此在復雜的采摘環(huán)境中,利用深度強化學習求解多自由度采摘機械臂的軌跡具有更好的魯棒性[13-15]。

    在采摘過程中,采摘機械臂的運動可以描述為高維空間中連續(xù)的狀態(tài)-動作模型,而深度強化學習中的深度確定性策略梯度算法(Deep deterministic policy gradient,DDPG)可以用于連續(xù)行為的控制。但是,非結(jié)構(gòu)化自然環(huán)境中采摘目標位置的復雜性和無序性使得DDPG算法在訓練過程中網(wǎng)絡收斂難度大,存在較多無效搜索,樣本采樣效率低,有效獎勵稀疏,使得訓練時間過長。為了提高基于深度強化學習(Deep reinforcement learning,DRL)的機器人軌跡規(guī)劃方法在有障礙物的非結(jié)構(gòu)化工作環(huán)境中的網(wǎng)絡訓練效率,XIE等[16]基于獎勵塑形的思想,提出了一種新的密集獎勵函數(shù),該函數(shù)包括方位獎勵函數(shù)和子任務級的獎勵函數(shù),方位獎勵函數(shù)提高了局部軌跡規(guī)劃效率,子任務級的獎勵函數(shù)減少了全局上的無效搜索。

    DDPG算法在訓練時,算法初始參數(shù)是隨機的,且智能體的行為沒有先驗知識的指導,非結(jié)構(gòu)化自然環(huán)境中障礙的復雜性使得隨機初始化參數(shù)帶來的訓練速度低、收斂難的問題更為突出。針對此問題,遷移學習顯示出巨大的優(yōu)勢,該方法可以從過去學習的相關(guān)任務中獲得知識,從而加速訓練過程[17]。胡曉東等[18]在利用深度強化學習算法求解動態(tài)環(huán)境下空間機器人的路徑規(guī)劃問題時,設(shè)計了一種適應動態(tài)環(huán)境的快速路徑規(guī)劃器,首先在靜態(tài)環(huán)境下對網(wǎng)絡模型進行預訓練,然后將靜態(tài)模型的網(wǎng)絡參數(shù)遷移到動態(tài)模型中,再經(jīng)過動態(tài)環(huán)境下的訓練進行參數(shù)微調(diào),實驗表明,該方法在保證規(guī)劃路徑準確率的前提下顯著提高了訓練速度。為了解決DDPG算法在訓練機器人任務規(guī)劃中存在時間長、收斂慢的問題,陳建華[19]基于遷移學習思想將NAO機器人右臂位姿規(guī)劃策略在實際NAO機器人上進行了不同目標物體在不同位姿下的規(guī)劃抓取實驗。

    本文以果園喬砧大冠稀植蘋果為研究對象,基于深度強化學習方法進行多自由度采摘機械臂的軌跡規(guī)劃研究。針對深度強化學習在非結(jié)構(gòu)化自然環(huán)境中訓練效率低的問題,提出兩種解決方法:針對采摘目標位置無序性引起收斂困難的問題,提出一種漸進空間約束的分步訓練策略;針對果實障礙和枝干障礙的復雜性引起收斂困難的問題,提出基于遷移學習的DDPG算法(TL+DDPG)。通過仿真實驗驗證兩種方法的有效性。

    1 原理

    1.1 采摘軌跡規(guī)劃

    1.1.1DDPG算法

    DDPG算法是基于AC策略梯度架構(gòu)的深度強化學習算法,既有策略網(wǎng)絡也有價值網(wǎng)絡[20]。圖1為DDPG算法的網(wǎng)絡結(jié)構(gòu)圖,它借鑒了Double DQN的思想,包含4個神經(jīng)網(wǎng)絡,分別為:actor網(wǎng)絡、actor target網(wǎng)絡、critic網(wǎng)絡和critic target網(wǎng)絡。

    圖1 DDPG算法網(wǎng)絡結(jié)構(gòu)圖Fig.1 Network diagram of DDPG algorithm

    網(wǎng)絡以采摘機械臂的當前狀態(tài)si為輸入,其中si包括機械臂各關(guān)節(jié)角度、角速度等信息,以采摘機械臂關(guān)節(jié)動作值ai為輸出,環(huán)境根據(jù)機械臂末端當前位置e與目標位置y的相對距離反饋即時獎勵ri。機械臂通過不斷地與環(huán)境進行交互,執(zhí)行相應動作,從而完成對采摘機械臂的軌跡規(guī)劃。當前動作在以下情況會終止:①采摘機械臂末端到達目標點。②機械臂碰到障礙或者與環(huán)境交互的步數(shù)到達上限。

    采摘機械臂的軌跡規(guī)劃算法如下:

    (1)初始化機械臂姿態(tài)、記憶庫R、仿真環(huán)境。

    (2)初始化critic和actor網(wǎng)絡參數(shù)θQ、θμ。

    (3)循環(huán)執(zhí)行以下步驟:

    ①獲取采摘機械臂的當前狀態(tài)si。

    ②網(wǎng)絡輸入當前狀態(tài)si,輸出機械臂的關(guān)節(jié)動作值ai=μ(si|θμ)。

    ③機械臂執(zhí)行動作ai,返回獎勵ri,并獲取采摘機械臂的新狀態(tài)si+1。

    ④將樣本(si,ai,ri,si+1)存入記憶庫R中。

    ⑤從記憶庫R中隨機采樣64個訓練樣本(si,ai,ri,si+1),分別更新actor、critic網(wǎng)絡參數(shù)θμ和θQ。

    ⑥每隔100步,更新actor target、critic target網(wǎng)絡參數(shù)

    θ′μ′←τθμ+(1-τ)θ′μ′
    θ′Q′←τθQ+(1-τ)θ′Q′

    τ為更新系數(shù)。

    ⑦如果si+1為終止狀態(tài),則當前迭代結(jié)束,否則轉(zhuǎn)到步驟②,結(jié)束循環(huán)。

    1.1.2基于DDPG算法的漸進空間約束分步訓練策略

    基于DDPG算法的果實采摘軌跡規(guī)劃中存在的主要問題是,采摘目標位置的復雜性和無序性,使得訓練過程中網(wǎng)絡收斂難度大,導致訓練效率低。通過引入平面約束,降低環(huán)境復雜度,可以有效減小網(wǎng)絡維度,加快模型學習速度。引入平面約束前后,DDPG算法的網(wǎng)絡模型結(jié)構(gòu)保持一致,使得基于平面約束的模型訓練參數(shù)可以為不引入平面約束的采摘軌跡規(guī)劃模型提供有效的初始化參數(shù),在縮短訓練時間的同時增加模型的有效性。因此,為了加速訓練過程,提高訓練效率,本文提出一種基于DDPG算法的漸進空間約束分步訓練策略。

    分步訓練策略是:與直接求解軌跡規(guī)劃不同,該方法通過引入空間約束,如圖2a所示,簡化求解過程,漸進獲得最終規(guī)劃軌跡,其實現(xiàn)過程如圖3所示。首先通過施加平面約束,將軌跡規(guī)劃限定在采摘平面上[21],通過對網(wǎng)絡進行訓練,得到該平面約束下的最優(yōu)模型參數(shù)。圖2a中的紅色平面設(shè)定為目標果實所在的采摘平面;其次,在實際采摘環(huán)境中,進一步對平面約束下獲得的網(wǎng)絡進行訓練,對網(wǎng)絡參數(shù)進行微調(diào),從而加速實際采摘場景的訓練速度。圖2b中綠框為采摘機械臂的實際采摘空間,目標果實可以出現(xiàn)在綠框中的任意位置。

    圖2 漸進空間約束分步訓練場景Fig.2 Progressive spatially constrained stepwise training scene

    圖3 漸進空間約束分步訓練策略流程圖Fig.3 Flow chart of progressive spatially constrained stepwise training strategy

    1.1.3基于遷移學習的DDPG算法

    在采摘環(huán)境有障礙場景中,不僅需要考慮目標的位置,還要避開障礙,以保護果實和機械臂的安全[11]。因此,本節(jié)針對非結(jié)構(gòu)化自然環(huán)境中的復雜障礙所帶來的訓練時間長的問題,利用遷移學習思想將無障礙場景下學習到的最優(yōu)策略向單一障礙場景進行遷移,并將單一障礙場景學習到的策略遷移用于指導混雜障礙場景下的軌跡規(guī)劃任務,流程圖如圖4所示。在本文所研究的采摘場景下,以無障礙和單一障礙場景下采摘機械臂的軌跡規(guī)劃為源域,將它的軌跡規(guī)劃策略遷移到目標域,目標域分別為單一和混雜障礙場景下采摘機械臂的軌跡規(guī)劃。

    圖4 策略遷移流程圖Fig.4 Flow chart of strategy migration

    進行策略遷移首先需要完成狀態(tài)和動作信息從源域到目標域的映射,即完成ssource=η(starget)和atarget=φ(asource)的過程,其中η和φ分別為狀態(tài)和動作信息的映射函數(shù),ssource表示源域中的狀態(tài)信息,asource表示源域中的動作信息,starget表示目標域中的狀態(tài)信息,atarget表示目標域中的動作信息。具體狀態(tài)和動作信息如表1所示。

    目標域中的狀態(tài)信息與源域中的狀態(tài)信息的映射關(guān)系為

    (1)

    式中wij——狀態(tài)與動作轉(zhuǎn)換系數(shù)

    J——目標域中狀態(tài)信息的個數(shù)

    其中,當目標域中的狀態(tài)信息與源域中的狀態(tài)信息相互對應時,wij取1;當目標域中的狀態(tài)信息與源域中的狀態(tài)信息不一致時,則wij取0。源域中的動作向目標域中的動作映射時同理。這樣就解決了源域中的狀態(tài)和動作到目標域中的狀態(tài)和動作的映射問題。

    在完成狀態(tài)和動作信息之間的映射后,還需要解決狀態(tài)值函數(shù)的遷移,因為狀態(tài)值函數(shù)在網(wǎng)絡參數(shù)更新中起到?jīng)Q定誤差的作用。策略遷移后的整體狀態(tài)值函數(shù)為

    Q(s,a)=Qsource(η(starget),asource)+

    Qtarget(starget,φ(asource))

    (2)

    式中Q(s,a)——整體狀態(tài)值函數(shù)

    Qsource——源域的狀態(tài)值函數(shù)

    Qtarget——目標域的狀態(tài)值函數(shù)

    模型網(wǎng)絡參數(shù)更新時,對于源域的狀態(tài)值函數(shù)Qsource(η(starget),asource)的神經(jīng)網(wǎng)絡參數(shù)不需要更新,需要更新的是目標域中的狀態(tài)值函數(shù)Qtarget(starget,φ(asource))的神經(jīng)網(wǎng)絡參數(shù)。圖5為基于遷移學習的DDPG算法的參數(shù)更新示意圖。

    圖5 基于遷移學習的DDPG算法參數(shù)更新示意圖Fig.5 Parameter update diagram of DDPG algorithm based on transfer learning

    2 實驗與分析

    利用Cinema 4D和CoppeliaSim軟件搭建仿真采摘環(huán)境,進行多自由度采摘機械臂的運動仿真測試,如圖6所示。本實驗在Ubuntu16.04操作系統(tǒng)平臺上完成,其硬件配置為Intel Core i7處理器、NVidia GTX 1060顯卡、16 GB內(nèi)存。編程語言為Python、Matlab。

    圖6 采摘環(huán)景仿真圖Fig.6 Picking scene simulation diagram

    2.1 機械臂運動學模型與障礙模型

    2.1.1機械臂運動學模型

    仿真實驗使用的是Franka 7-DOF機械臂,圖7為機械臂的整體結(jié)構(gòu)示意圖。所有關(guān)節(jié)都是轉(zhuǎn)動關(guān)節(jié),關(guān)節(jié)7連接末端執(zhí)行手爪以抓取目標。機械臂關(guān)節(jié)角信息如表2所示。

    圖7 采摘機械臂整體結(jié)構(gòu)示意圖Fig.7 Schematic of picking manipulator structure

    2.1.2障礙模型簡化

    在蘋果采摘過程中,不同栽培方式下所遇到的障礙主要是枝干、樹葉以及非目標果實,由于樹葉柔曲,對機械臂采摘作業(yè)的影響很小,可以忽略不計,所以主要考慮枝干障礙和非目標果實障礙。

    針對本文障礙的外形特點,使用包絡法對障礙進行近似描述[22-24]。如圖8所示,用球體表示非目標果實障礙,圓柱體表示枝干障礙。

    圖8 障礙模型Fig.8 Obstacle models

    由圖可得,使用包絡法進行建模雖然擴大了障礙區(qū)域,但簡化了計算,提高了可靠性,有效地提高了軌跡規(guī)劃效率,同時也保證了機械臂和果樹的安全性。

    2.2 分步訓練策略實驗與分析

    DDPG算法的網(wǎng)絡參數(shù)如表3所示。

    表3 DDPG算法的網(wǎng)絡參數(shù)Tab.3 Parameters for DDPG algorithm

    圖10 獎勵值變化曲線Fig.10 Reward value change curves

    仿真環(huán)境中設(shè)定的采摘空間以(0.25 m,0 m, 1.002 m)為中心,尺寸為0.5 m×0.8 m×0.5 m,如圖9所示。蘋果生長期間果農(nóng)通常以間距0.2、0.25、0.3 m進行疏花疏果操作[25],以保證蘋果品質(zhì)與產(chǎn)量??紤]到蘋果結(jié)果間距以及采摘空間,本文以0.2 m為間距沿y方向在0~0.4 m范圍內(nèi)均勻引入3個約束平面(平面1、平面2、平面3)作為采摘平面進行對照實驗,以觀察不同約束平面對空間范圍內(nèi)軌跡規(guī)劃的影響。3個平面具體位置為:平面1(藍色)方程為y=0(0≤x≤0.5 m,0.752 m≤z≤1.252 m),平面2(綠色)方程為y=0.2 m(0≤x≤0.5 m,0.752 m≤z≤1.252 m),平面3(紅色)方程為y=0.4 m(0≤x≤0.5 m,0.752 m≤z≤1.252 m)。

    圖9 采摘空間示意圖Fig.9 Simulation scene

    按照漸進空間約束分步訓練策略,分別在3個采摘平面上進行訓練,得到3組網(wǎng)絡模型,并在這3組網(wǎng)絡模型的基礎(chǔ)上,進一步在實際采摘環(huán)境下進行軌跡規(guī)劃網(wǎng)絡的訓練,觀察不同位置的采摘平面對實際環(huán)境的泛化性。共進行5 000次迭代訓練,圖10為訓練期間獎勵值的變化情況。

    由圖10a可知,隨著迭代次數(shù)的增加,采摘機械臂所獲獎勵逐漸變大,最終達到收斂狀態(tài)。由圖10b可知,隨著迭代次數(shù)的增加,采摘機械臂所獲獎勵逐漸變大,最終達到收斂狀態(tài)。訓練開始時基準模型的曲線獎勵值起點在-1.30附近,而經(jīng)過預訓練的獎勵曲線起點在-1.00附近,這表明經(jīng)過預訓練,采摘機械臂的動作策略獲得了一些先驗知識,具有較好的初始假設(shè),減少了無效探索,相對于隨機初始化性能有較為明顯的提升。表4統(tǒng)計了迭代中4 000~5 000次的獎勵值均值以及訓練期間收斂所用迭代次數(shù),其中基準模型為直接在三維空間中訓練所得模型。

    表4 訓練結(jié)果對比Tab.4 Comparison of training results

    由表4可知,在收斂速度方面,基于約束平面的模型收斂所需迭代次數(shù)分別為1 100、1 800、2 000,而基準模型經(jīng)過3 000次迭代達到收斂,基于約束平面1、2、3的分步訓練網(wǎng)絡收斂速度分別比基準模型提升了63.33%、40%和33.33%。這表明引入約束平面后,由于網(wǎng)絡初始參數(shù)是通過預訓練得到,訓練初期策略的盲目性大大減少,使基于約束平面的模型減少了學習時間,在三維采摘空間上訓練的收斂速度明顯加快。

    同時,由表4可知,基于約束平面1的分步訓練策略在提升模型性能方面最為顯著:獎勵值初值為-0.70,收斂后其獎勵值均值穩(wěn)定在-0.25,相比于基準模型,獎勵值初值和均值分別提升了46.15%和45.65%,表明基于約束平面1的訓練策略在網(wǎng)絡性能上提升效果明顯。由于約束平面1位于采摘空間的中心位置,因此,基于約束平面1得到的模型相比于其他約束平面得到的模型,在后續(xù)訓練上其動作策略的空間泛化性和空間適應性更強。

    為了測試模型的效果,本文分別統(tǒng)計得出基準模型和基于約束平面1的訓練模型成功采摘100次所需時間為320、260 s。

    由以上實驗結(jié)果可知,基于分步訓練策略模型在收斂速度和性能上都得到了大幅度提升,說明采摘機械臂利用漸進空間約束分步訓練策略進行軌跡規(guī)劃能顯著加速訓練過程和提升模型性能。

    2.3 基于遷移學習的DDPG算法實驗與分析

    根據(jù)真實的采摘場景,本文設(shè)計了3種有障礙場景,如圖11所示,分別是模擬非目標果實障礙場景 (場景A)、枝干障礙場景 (場景B)、混雜障礙場景 (場景C)。場景中紅色蘋果為目標果實,綠色蘋果為非目標果實障礙,藍色枝干為障礙。場景A和場景B分別針對的是單一障礙場景,場景C為混雜障礙場景。圖12為不同場景下訓練時的獎勵值變化曲線。

    圖11 3種場景示意圖Fig.11 Simulation scenes

    圖12 不同場景下訓練時的獎勵值變化曲線Fig.12 Reward value changing curves of training in different scenarios

    實驗共執(zhí)行了10 000次迭代訓練,由圖12可以看出,隨著迭代次數(shù)的增加,在各場景下采摘機械臂所獲獎勵逐漸變大,并最終達到收斂狀態(tài)。

    表5為場景A和場景B訓練迭代8 000~10 000次的獎勵值均值以及訓練期間收斂所用迭代次數(shù)。

    表5 實驗結(jié)果對比Tab.5 Comparison of experimental results

    由圖12和表5可以看出,與DDPG算法訓練相比,在場景A和場景B中基于遷移學習的DDPG算法訓練收斂所需迭代次數(shù)從3 500和3 900分別縮短到2 000和2 600,收斂速度分別提升了42.86%和33.33%。說明機械臂在無障礙場景下的軌跡規(guī)劃策略能夠為單一障礙場景的軌跡規(guī)劃提供指導,可以有效縮短訓練時間。

    同時,由表5可知,在場景A和場景B中基于遷移學習的DDPG算法在開始階段獎勵值初值分別為-0.62和-1.35,比DDPG算法訓練分別提升了32.61%和15.63%。并且,在場景A中該方法收斂后獎勵值均值穩(wěn)定在-0.15,相較于直接訓練提升了44.44%。而在場景B中兩種方法的獎勵值均值相差不大,TL+DDPG算法的獎勵值均值略低于DDPG算法,說明從無障礙場景向單一障礙場景進行遷移時,源任務策略在訓練前期能夠指導機械臂快速接近目標,該策略向較為簡單的場景A進行避障遷移適應性強于較為復雜的場景B。

    實際采摘環(huán)境通常存在多種障礙,為了觀察采摘機械臂在面對混雜障礙時,單一障礙場景下獲得的策略能否為采摘任務提供合適的指導,將場景C設(shè)計成混雜障礙場景,并分別遷移場景A和場景B的策略來指導采摘機械臂在場景C下進行軌跡規(guī)劃任務。表6為場景C下應用不同策略訓練迭代8 000~10 000次的獎勵值均值以及訓練期間收斂所用迭代次數(shù)。圖13為混雜障礙場景下的收斂所需迭代次數(shù)。

    由表6可知,遷移場景A和場景B的策略來指導采摘機械臂在場景C下進行軌跡規(guī)劃任務,其收斂所需迭代次數(shù)分別為3 600和2 200,相比較DDPG算法訓練,收斂速度分別提升了43.75%和65.63%。以上結(jié)果表明基于單一障礙場景下的遷移訓練相較于基于DDPG算法的直接訓練,任務收斂速度有大幅度提升。如圖13所示,當考慮源策略訓練次數(shù)時,遷移場景A和場景B策略的總收斂迭代次數(shù)分別為7 100和6 100,表明在混雜障礙場景中遷移場景B的策略更有助于提升訓練速度。

    表6 混雜場景下不同策略訓練結(jié)果對比Tab.6 Comparison of training results in complex scenarios

    圖13 混雜障礙場景下收斂所需迭代次數(shù)Fig.13 Number of converging rounds

    同時,由表6可知,遷移場景A策略和遷移場景B策略模型的獎勵值初值分別為-1.00和-1.30,比DDPG算法分別提升了34.21%和14.47%;其在模型收斂后獎勵值均值分別穩(wěn)定在-0.45和-0.35,與DDPG算法相比,遷移場景B策略的獎勵值均值略大。這表明在蘋果采摘中,從場景A和場景B向混雜障礙場景遷移時,均可以提供較好的模型初始化參數(shù);同時,在面對混雜障礙場景時,源任務中障礙環(huán)境較為復雜,更利于提高混雜障礙場景下的模型性能。

    圖14是在不同場景下采摘機械臂的避障軌跡。紅色蘋果為目標位置,藍色樹枝為障礙,綠色未成熟蘋果為果實障礙。黃線為DDPG算法為采摘機械臂規(guī)劃出的軌跡,紅線為基于遷移學習的DDPG算法為采摘機械臂規(guī)劃出的軌跡??梢钥吹?,DDPG算法在進行避障軌跡規(guī)劃時得到的軌跡比基于遷移學習的DDPG算法得到的軌跡更長一些。

    3 結(jié)束語

    基于深度強化學習方法進行了采摘機械臂軌跡規(guī)劃,為提高無障礙環(huán)境下模型的網(wǎng)絡收斂速度和性能,提出了漸進空間約束的分步訓練策略。對分步訓練策略進行了仿真實驗驗證,與直接訓練相比,利用漸進空間約束的分步訓練策略對獎勵值初值最大提升幅度為46.15%,對網(wǎng)絡收斂速度最大提升幅度為63.33%。針對復雜障礙環(huán)境,提出了基于遷移學習的DDPG算法,將軌跡規(guī)劃的最優(yōu)策略由無障礙場景遷移到單一障礙場景、由單一障礙場景遷移到混雜障礙場景中。仿真實驗表明,將無障礙場景策略遷移到單一障礙場景中時,獎勵值初值提升幅度為32.61%,網(wǎng)絡收斂速度最大提升幅度為42.86%;將單一障礙場景策略遷移到混雜障礙場景中時,獎勵值初值最大提升幅度為34.21%,網(wǎng)絡收斂速度最大提升幅度為65.63%。

    猜你喜歡
    機械規(guī)劃策略
    調(diào)試機械臂
    當代工人(2020年8期)2020-05-25 09:07:38
    例談未知角三角函數(shù)值的求解策略
    我說你做講策略
    高中數(shù)學復習的具體策略
    規(guī)劃引領(lǐng)把握未來
    簡單機械
    快遞業(yè)十三五規(guī)劃發(fā)布
    商周刊(2017年5期)2017-08-22 03:35:26
    多管齊下落實規(guī)劃
    機械班長
    迎接“十三五”規(guī)劃
    新久久久久国产一级毛片| 午夜福利影视在线免费观看| 欧美区成人在线视频| av免费在线看不卡| 欧美亚洲 丝袜 人妻 在线| 3wmmmm亚洲av在线观看| 欧美精品人与动牲交sv欧美| 汤姆久久久久久久影院中文字幕| 国产在线免费精品| 在线亚洲精品国产二区图片欧美 | 亚洲精品中文字幕在线视频 | 晚上一个人看的免费电影| 黄色怎么调成土黄色| 最黄视频免费看| 97超视频在线观看视频| 色视频在线一区二区三区| 亚洲高清免费不卡视频| 免费大片18禁| 日韩免费高清中文字幕av| 狂野欧美激情性bbbbbb| 亚洲精品国产av蜜桃| 国产片特级美女逼逼视频| 久久人人爽人人片av| 国产精品蜜桃在线观看| 久久精品久久久久久久性| 久久精品国产鲁丝片午夜精品| 国产欧美日韩精品一区二区| 内射极品少妇av片p| 老司机影院毛片| 免费观看av网站的网址| 街头女战士在线观看网站| 最近最新中文字幕免费大全7| 午夜免费鲁丝| 日韩亚洲欧美综合| 亚洲精品国产av蜜桃| 秋霞伦理黄片| 少妇精品久久久久久久| 中文字幕人妻熟人妻熟丝袜美| 国产精品久久久久久精品古装| 少妇熟女欧美另类| 国产亚洲精品久久久com| 亚洲国产精品成人久久小说| 欧美日韩av久久| 中文乱码字字幕精品一区二区三区| 99九九在线精品视频 | 免费看光身美女| 老司机影院毛片| 我的老师免费观看完整版| 交换朋友夫妻互换小说| 亚洲精品久久久久久婷婷小说| 日本与韩国留学比较| 只有这里有精品99| 亚洲精品久久久久久婷婷小说| 99热国产这里只有精品6| 成人黄色视频免费在线看| 只有这里有精品99| 日日啪夜夜撸| 久久国产乱子免费精品| 精品久久久久久久久亚洲| 午夜日本视频在线| 亚洲精品日韩在线中文字幕| 天天操日日干夜夜撸| 汤姆久久久久久久影院中文字幕| 大话2 男鬼变身卡| 国产男女超爽视频在线观看| a级片在线免费高清观看视频| 男女无遮挡免费网站观看| 涩涩av久久男人的天堂| 日本91视频免费播放| 亚洲av成人精品一区久久| 成人二区视频| 国产乱来视频区| 国精品久久久久久国模美| 国产成人精品婷婷| 国产一区二区在线观看日韩| 午夜日本视频在线| 91久久精品电影网| 久久久国产精品麻豆| 日韩视频在线欧美| 少妇猛男粗大的猛烈进出视频| 久久免费观看电影| 久久久久久久久久成人| 一级毛片aaaaaa免费看小| 久久精品国产鲁丝片午夜精品| 丰满饥渴人妻一区二区三| 一本大道久久a久久精品| 插阴视频在线观看视频| 国产高清有码在线观看视频| 激情五月婷婷亚洲| 免费久久久久久久精品成人欧美视频 | 成年人免费黄色播放视频 | 一级,二级,三级黄色视频| 国产亚洲5aaaaa淫片| 一区在线观看完整版| 天天躁夜夜躁狠狠久久av| 国产av码专区亚洲av| 人人妻人人澡人人爽人人夜夜| 国产av码专区亚洲av| 男人舔奶头视频| 一区在线观看完整版| 哪个播放器可以免费观看大片| 哪个播放器可以免费观看大片| 五月伊人婷婷丁香| 美女内射精品一级片tv| 国产日韩一区二区三区精品不卡 | 99视频精品全部免费 在线| 国产在线男女| 涩涩av久久男人的天堂| 国产日韩欧美在线精品| 免费少妇av软件| 欧美人与善性xxx| 国产白丝娇喘喷水9色精品| 你懂的网址亚洲精品在线观看| 纵有疾风起免费观看全集完整版| 午夜福利网站1000一区二区三区| 日本免费在线观看一区| 纵有疾风起免费观看全集完整版| 欧美bdsm另类| 一级毛片电影观看| 2021少妇久久久久久久久久久| 99热全是精品| 亚洲国产欧美日韩在线播放 | 久久国产乱子免费精品| 国产一区亚洲一区在线观看| 亚洲综合色惰| 色婷婷av一区二区三区视频| 有码 亚洲区| av一本久久久久| 日韩三级伦理在线观看| 亚洲国产精品一区三区| 好男人视频免费观看在线| 最近的中文字幕免费完整| 亚洲精品乱码久久久v下载方式| 日韩电影二区| 欧美一级a爱片免费观看看| 国产淫语在线视频| 国产色爽女视频免费观看| 精品亚洲成国产av| 麻豆成人av视频| 肉色欧美久久久久久久蜜桃| 日韩人妻高清精品专区| 午夜福利网站1000一区二区三区| 男女免费视频国产| 国产有黄有色有爽视频| 成人免费观看视频高清| 亚洲av二区三区四区| 国产高清不卡午夜福利| 高清午夜精品一区二区三区| 亚洲欧美精品自产自拍| 插逼视频在线观看| 你懂的网址亚洲精品在线观看| 亚洲美女黄色视频免费看| 日产精品乱码卡一卡2卡三| 天天躁夜夜躁狠狠久久av| 日韩av不卡免费在线播放| 91午夜精品亚洲一区二区三区| 亚洲激情五月婷婷啪啪| 亚洲精品自拍成人| 亚洲精品视频女| 一区二区三区精品91| 日本av免费视频播放| 26uuu在线亚洲综合色| 欧美日韩在线观看h| 视频区图区小说| 夫妻午夜视频| 丰满少妇做爰视频| 久久久久精品性色| 国内精品宾馆在线| 国产精品久久久久成人av| 简卡轻食公司| 成年av动漫网址| 两个人免费观看高清视频 | 久久久精品94久久精品| 黑人猛操日本美女一级片| 美女福利国产在线| 亚洲欧美日韩另类电影网站| 免费黄频网站在线观看国产| 国产成人freesex在线| 伦精品一区二区三区| 欧美激情极品国产一区二区三区 | 免费不卡的大黄色大毛片视频在线观看| 91久久精品国产一区二区三区| av国产久精品久网站免费入址| 国产亚洲一区二区精品| 国语对白做爰xxxⅹ性视频网站| 成人无遮挡网站| 在线 av 中文字幕| 内地一区二区视频在线| 久久精品国产亚洲av天美| 国产欧美日韩精品一区二区| 国产黄片美女视频| 欧美日韩在线观看h| 高清av免费在线| 国产综合精华液| 我要看黄色一级片免费的| 亚洲av不卡在线观看| 在线观看人妻少妇| 18+在线观看网站| 一级毛片黄色毛片免费观看视频| 观看av在线不卡| 我要看日韩黄色一级片| 精品久久久精品久久久| 国产精品久久久久成人av| 啦啦啦视频在线资源免费观看| 乱系列少妇在线播放| 免费观看在线日韩| 亚洲av国产av综合av卡| 五月伊人婷婷丁香| 国产亚洲最大av| 久久青草综合色| 一本久久精品| a级毛色黄片| 亚洲不卡免费看| a级一级毛片免费在线观看| 不卡视频在线观看欧美| 国产av码专区亚洲av| 国产极品天堂在线| 少妇被粗大猛烈的视频| 97超视频在线观看视频| 91精品伊人久久大香线蕉| 人妻人人澡人人爽人人| a 毛片基地| 性色av一级| 自线自在国产av| 欧美一级a爱片免费观看看| 亚洲三级黄色毛片| 国产伦在线观看视频一区| 国产精品一区二区在线观看99| 亚洲av二区三区四区| 国产免费福利视频在线观看| 日韩一本色道免费dvd| av免费观看日本| 一本色道久久久久久精品综合| 多毛熟女@视频| 天美传媒精品一区二区| 男男h啪啪无遮挡| 老司机亚洲免费影院| 亚洲欧美中文字幕日韩二区| 久久人人爽人人片av| 国产免费又黄又爽又色| 成人亚洲欧美一区二区av| 国产精品福利在线免费观看| 七月丁香在线播放| 丰满乱子伦码专区| 卡戴珊不雅视频在线播放| 久久人人爽人人片av| 日韩欧美一区视频在线观看 | 最近中文字幕高清免费大全6| 国产精品一二三区在线看| 欧美97在线视频| 岛国毛片在线播放| 自拍偷自拍亚洲精品老妇| 免费av中文字幕在线| 夜夜骑夜夜射夜夜干| 涩涩av久久男人的天堂| 国产男女超爽视频在线观看| 一区二区三区精品91| 亚洲国产欧美在线一区| 男女国产视频网站| 精品国产国语对白av| 亚洲精品第二区| 久久这里有精品视频免费| 天天操日日干夜夜撸| 一级毛片电影观看| 国产一级毛片在线| 免费看光身美女| 大话2 男鬼变身卡| 婷婷色综合大香蕉| 精品久久国产蜜桃| 性色avwww在线观看| 妹子高潮喷水视频| 亚洲人成网站在线观看播放| 久久免费观看电影| 成人影院久久| 丰满饥渴人妻一区二区三| 欧美高清成人免费视频www| 日本黄大片高清| 久久久久久伊人网av| 少妇猛男粗大的猛烈进出视频| 熟妇人妻不卡中文字幕| 日韩成人伦理影院| 亚洲激情五月婷婷啪啪| 九色成人免费人妻av| 国产精品久久久久久精品电影小说| 中文字幕久久专区| 美女大奶头黄色视频| 爱豆传媒免费全集在线观看| 亚洲成人手机| 黄色视频在线播放观看不卡| 精品一区二区三卡| 伊人亚洲综合成人网| 国产精品欧美亚洲77777| 国产69精品久久久久777片| 国产精品99久久久久久久久| 日本色播在线视频| 亚洲内射少妇av| 亚洲综合精品二区| 国产欧美日韩一区二区三区在线 | 中文字幕人妻熟人妻熟丝袜美| 免费大片黄手机在线观看| 免费人妻精品一区二区三区视频| 免费不卡的大黄色大毛片视频在线观看| 久久 成人 亚洲| 少妇 在线观看| 色5月婷婷丁香| 亚洲欧美成人综合另类久久久| 偷拍熟女少妇极品色| 精品人妻熟女av久视频| 91成人精品电影| 国产精品.久久久| 久久99蜜桃精品久久| 日韩av免费高清视频| 能在线免费看毛片的网站| 极品教师在线视频| 少妇被粗大的猛进出69影院 | 亚洲av.av天堂| 日日爽夜夜爽网站| 韩国高清视频一区二区三区| 国产淫语在线视频| 日韩av不卡免费在线播放| 少妇的逼好多水| 日本91视频免费播放| 男人舔奶头视频| 欧美日韩国产mv在线观看视频| 18+在线观看网站| 国产欧美日韩一区二区三区在线 | 日韩电影二区| 国产永久视频网站| av卡一久久| 又爽又黄a免费视频| 午夜福利网站1000一区二区三区| 夫妻午夜视频| 在线亚洲精品国产二区图片欧美 | 日韩中字成人| 精品一区二区三区视频在线| 国产色爽女视频免费观看| 久久人人爽人人片av| 欧美精品高潮呻吟av久久| 九草在线视频观看| 91aial.com中文字幕在线观看| 久久ye,这里只有精品| 国产成人aa在线观看| 大又大粗又爽又黄少妇毛片口| 国产精品久久久久久久电影| 久久久国产一区二区| 国产片特级美女逼逼视频| 赤兔流量卡办理| 这个男人来自地球电影免费观看 | 另类亚洲欧美激情| 国产精品国产三级专区第一集| 丰满迷人的少妇在线观看| 嘟嘟电影网在线观看| 国产成人精品久久久久久| 久久人人爽av亚洲精品天堂| 国产国拍精品亚洲av在线观看| 亚洲欧美中文字幕日韩二区| 99国产精品免费福利视频| 一本—道久久a久久精品蜜桃钙片| 少妇熟女欧美另类| 九九在线视频观看精品| 亚洲国产av新网站| 亚洲av中文av极速乱| 国产精品欧美亚洲77777| 狂野欧美白嫩少妇大欣赏| 内射极品少妇av片p| 日韩制服骚丝袜av| 老司机影院成人| 国产伦在线观看视频一区| 99久久精品热视频| 乱系列少妇在线播放| 国产探花极品一区二区| 亚洲熟女精品中文字幕| 卡戴珊不雅视频在线播放| av在线老鸭窝| 久久久亚洲精品成人影院| av国产精品久久久久影院| videos熟女内射| 亚洲av中文av极速乱| 天堂8中文在线网| 内地一区二区视频在线| 国产有黄有色有爽视频| 日韩三级伦理在线观看| 久久久久精品性色| 欧美老熟妇乱子伦牲交| 九九久久精品国产亚洲av麻豆| 简卡轻食公司| 五月开心婷婷网| 亚洲内射少妇av| 超碰97精品在线观看| 老司机影院毛片| 国产国拍精品亚洲av在线观看| 久久久久国产精品人妻一区二区| 日韩在线高清观看一区二区三区| 国产熟女午夜一区二区三区 | 大码成人一级视频| 麻豆乱淫一区二区| 性高湖久久久久久久久免费观看| 777米奇影视久久| 免费看av在线观看网站| 全区人妻精品视频| 国产精品欧美亚洲77777| 欧美丝袜亚洲另类| 波野结衣二区三区在线| 亚洲欧洲日产国产| 国产精品久久久久久久久免| 欧美日韩综合久久久久久| 日本猛色少妇xxxxx猛交久久| 久久久久久久大尺度免费视频| 成人毛片60女人毛片免费| 啦啦啦中文免费视频观看日本| 黄色欧美视频在线观看| 日韩中字成人| 精品人妻熟女av久视频| 国产毛片在线视频| 亚洲美女视频黄频| 一本大道久久a久久精品| h视频一区二区三区| 少妇被粗大猛烈的视频| 国产黄色视频一区二区在线观看| 成年人免费黄色播放视频 | 性色avwww在线观看| kizo精华| 少妇丰满av| 国产精品久久久久成人av| 久久久欧美国产精品| 国产精品国产三级专区第一集| 国产成人免费观看mmmm| 国产在视频线精品| 国产精品国产av在线观看| 亚洲精品亚洲一区二区| 丰满人妻一区二区三区视频av| 一区二区三区乱码不卡18| 国产乱人偷精品视频| 免费大片黄手机在线观看| 黑人高潮一二区| 青春草国产在线视频| 九草在线视频观看| 午夜久久久在线观看| 老熟女久久久| 69精品国产乱码久久久| 亚洲四区av| 欧美老熟妇乱子伦牲交| 成人国产麻豆网| 中文乱码字字幕精品一区二区三区| 亚洲精华国产精华液的使用体验| 欧美日韩精品成人综合77777| 能在线免费看毛片的网站| 久久这里有精品视频免费| 亚洲美女黄色视频免费看| 一区二区三区免费毛片| 精品一品国产午夜福利视频| 亚洲美女黄色视频免费看| 午夜91福利影院| 午夜视频国产福利| 少妇被粗大猛烈的视频| 欧美日韩av久久| 国产精品无大码| 色哟哟·www| 91精品国产九色| 中文字幕人妻丝袜制服| 国产精品一区二区在线不卡| 乱人伦中国视频| 亚洲一区二区三区欧美精品| 亚洲成人手机| 人妻 亚洲 视频| 菩萨蛮人人尽说江南好唐韦庄| 亚洲精品成人av观看孕妇| 日本免费在线观看一区| av天堂久久9| 国产精品嫩草影院av在线观看| www.av在线官网国产| 国产男人的电影天堂91| av线在线观看网站| 欧美日韩精品成人综合77777| av女优亚洲男人天堂| 三级经典国产精品| 久久久久人妻精品一区果冻| 亚洲图色成人| 日韩av不卡免费在线播放| 高清不卡的av网站| 欧美变态另类bdsm刘玥| 国产亚洲91精品色在线| 十八禁高潮呻吟视频 | 国产在视频线精品| 大香蕉久久网| 欧美性感艳星| 在线观看一区二区三区激情| 日本午夜av视频| av女优亚洲男人天堂| 日韩熟女老妇一区二区性免费视频| 激情五月婷婷亚洲| 久久久国产欧美日韩av| 观看av在线不卡| 久久人人爽人人片av| 国产免费一级a男人的天堂| 午夜91福利影院| 国产精品一区二区三区四区免费观看| 9色porny在线观看| 久久毛片免费看一区二区三区| 国产精品人妻久久久影院| 亚洲国产精品国产精品| 3wmmmm亚洲av在线观看| 国产成人aa在线观看| 全区人妻精品视频| 国精品久久久久久国模美| 日韩成人伦理影院| 国产精品免费大片| 十八禁高潮呻吟视频 | 色婷婷久久久亚洲欧美| 大陆偷拍与自拍| 一二三四中文在线观看免费高清| 十八禁网站网址无遮挡 | 亚洲人成网站在线观看播放| 少妇的逼好多水| 免费黄频网站在线观看国产| 国产欧美日韩综合在线一区二区 | tube8黄色片| 国产一区二区在线观看av| 狠狠精品人妻久久久久久综合| 免费观看a级毛片全部| 丝袜在线中文字幕| 自拍偷自拍亚洲精品老妇| 狂野欧美激情性bbbbbb| 国产女主播在线喷水免费视频网站| 亚洲va在线va天堂va国产| 欧美激情极品国产一区二区三区 | 中文字幕久久专区| 久久久久久久久大av| 久久久久久久国产电影| 黄片无遮挡物在线观看| 久久久久国产精品人妻一区二区| 精品熟女少妇av免费看| 国产免费一区二区三区四区乱码| 内射极品少妇av片p| 久久ye,这里只有精品| 国产免费又黄又爽又色| 各种免费的搞黄视频| 又爽又黄a免费视频| 国产伦精品一区二区三区视频9| 女的被弄到高潮叫床怎么办| 男女啪啪激烈高潮av片| 国产精品熟女久久久久浪| 成人免费观看视频高清| 色视频在线一区二区三区| 人妻 亚洲 视频| 亚洲av福利一区| 精品亚洲成a人片在线观看| 国产极品粉嫩免费观看在线 | 夫妻午夜视频| 亚洲丝袜综合中文字幕| 国产国拍精品亚洲av在线观看| 成人美女网站在线观看视频| 久久久久视频综合| 免费少妇av软件| 桃花免费在线播放| 99热这里只有精品一区| 如日韩欧美国产精品一区二区三区 | 黄色配什么色好看| av国产精品久久久久影院| 九草在线视频观看| 毛片一级片免费看久久久久| 成人免费观看视频高清| 午夜老司机福利剧场| 欧美日韩综合久久久久久| 国产成人a∨麻豆精品| 人妻制服诱惑在线中文字幕| 日本爱情动作片www.在线观看| 伊人久久精品亚洲午夜| 啦啦啦视频在线资源免费观看| h日本视频在线播放| videossex国产| 99视频精品全部免费 在线| 国产亚洲精品久久久com| 寂寞人妻少妇视频99o| 成年人午夜在线观看视频| 亚洲欧美精品自产自拍| 亚洲精品国产av成人精品| 欧美日韩综合久久久久久| 在线观看免费高清a一片| 成年人免费黄色播放视频 | 水蜜桃什么品种好| 日韩av在线免费看完整版不卡| 少妇 在线观看| 蜜臀久久99精品久久宅男| 性色av一级| 最黄视频免费看| 亚洲av在线观看美女高潮| 久久久久久久久大av| 中文字幕人妻熟人妻熟丝袜美| 菩萨蛮人人尽说江南好唐韦庄| 亚洲美女搞黄在线观看| 精品久久久久久电影网| 丁香六月天网| 中文精品一卡2卡3卡4更新| 欧美97在线视频| 国产精品欧美亚洲77777| 久久久欧美国产精品| 国产高清国产精品国产三级| 人妻一区二区av| 最近中文字幕高清免费大全6| 日韩熟女老妇一区二区性免费视频| 男男h啪啪无遮挡| 欧美xxⅹ黑人| 亚洲欧美日韩另类电影网站| av免费观看日本| 蜜桃久久精品国产亚洲av| 精品久久久久久电影网| 欧美精品高潮呻吟av久久| 男女国产视频网站| 日韩,欧美,国产一区二区三区| av线在线观看网站| 日韩三级伦理在线观看| 欧美变态另类bdsm刘玥| 久久精品久久精品一区二区三区| 人人妻人人澡人人爽人人夜夜|