• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    動態(tài)環(huán)境中的多機(jī)器人協(xié)同搬運(yùn)

    2013-07-22 03:04:50朱寧寧
    關(guān)鍵詞:障礙物意圖權(quán)重

    曹 潔,朱寧寧

    蘭州理工大學(xué) 計(jì)算機(jī)與通信學(xué)院,蘭州 730050

    動態(tài)環(huán)境中的多機(jī)器人協(xié)同搬運(yùn)

    曹 潔,朱寧寧

    蘭州理工大學(xué) 計(jì)算機(jī)與通信學(xué)院,蘭州 730050

    1 引言

    多機(jī)器人系統(tǒng)是一個(gè)集環(huán)境感知、動態(tài)決策、行為執(zhí)行等多功能的復(fù)雜系統(tǒng)。隨著多機(jī)器人在工業(yè)生產(chǎn)、醫(yī)療服務(wù)、航空航天等方面的應(yīng)用,多機(jī)器人協(xié)作成為機(jī)器人學(xué)研究的熱點(diǎn)。而多機(jī)器人協(xié)同搬運(yùn)問題無論是在理論層面還是在應(yīng)用上都有著非常廣闊的研究價(jià)值,一方面在真實(shí)的物理世界中,單個(gè)機(jī)器人通常無法完成很多任務(wù),另一方面,它也是研究多機(jī)器人協(xié)同任務(wù)的一個(gè)重要平臺[1]。

    針對多機(jī)器人的避障問題,已經(jīng)提出了很多的方法,如模擬市場法、柵格法和基于行為的控制方法等?;谛袨榈目刂品椒ㄓ芍斯ぶ悄軐<襌.Brooks首先提出來,較于傳統(tǒng)方法,具有魯棒性好、快速性[2]等優(yōu)點(diǎn)而得到廣泛關(guān)注。由于多機(jī)器人工作環(huán)境的易變性和不可預(yù)見性,需要多機(jī)器人盡可能的適應(yīng)環(huán)境,以提高學(xué)習(xí)和決策能力。Q學(xué)習(xí)[3-4]無需建立環(huán)境模型,且可在線學(xué)習(xí),被用于多機(jī)器人避障問題中,但是,并不十分理想。這是因?yàn)殡S著多機(jī)器人數(shù)量增加,學(xué)習(xí)空間也快速增大,造成了學(xué)習(xí)速度非常緩慢,且環(huán)境信息不完備時(shí),聯(lián)合學(xué)習(xí)模型也難以適用。有學(xué)者將Q學(xué)習(xí)中的“狀態(tài)-動作對”替換為“條件-行為對”,雖具有一定的有效性,但還是無法克服此問題;分布式兩層強(qiáng)化學(xué)習(xí)算法也被用于多機(jī)器人協(xié)作中,實(shí)驗(yàn)驗(yàn)證了其實(shí)際功能,但仍無法較大地減小存儲空間;將基于動作預(yù)測的強(qiáng)化學(xué)習(xí)算法用于多機(jī)器人協(xié)同搬運(yùn)問題會大大促進(jìn)協(xié)作性能,缺點(diǎn)是在環(huán)境信息較少或者機(jī)器人存在自私目標(biāo)的情況下難以適用。Q學(xué)習(xí)是通過獎勵(lì)值來強(qiáng)化正確的行為,它是一種數(shù)值分析方法,此方法忽略了多機(jī)器人的推理能力,而引入BDI模型能夠有效解決Q學(xué)習(xí)推理能力較弱的弊端[5-6],因此本文中的多機(jī)器人采用基于BDI模型的獨(dú)立強(qiáng)化學(xué)習(xí),使得多機(jī)器人學(xué)習(xí)過程不僅擁有強(qiáng)化學(xué)習(xí)的自適應(yīng)性和高度反應(yīng)性,而且擁有了推理功能。

    本論文的創(chuàng)新點(diǎn)有:(1)本文將強(qiáng)化學(xué)習(xí)算法、BDI模型、基于行為的協(xié)同方法三者結(jié)合運(yùn)用于多機(jī)器人協(xié)同搬運(yùn)問題,并從仿真實(shí)驗(yàn)看,取得了較好的效果。(2)本文采用強(qiáng)化學(xué)習(xí)的評價(jià)函數(shù)是隨多機(jī)器人系統(tǒng)位置及離最近障礙物距離而變化的,評價(jià)函數(shù)可實(shí)時(shí)更新,并將其與基于強(qiáng)化學(xué)習(xí)的行為權(quán)重相結(jié)合,都使得本實(shí)驗(yàn)取得良好仿真效果。

    2 Q(λ)學(xué)習(xí)算法

    馬爾可夫決策過程[7]中,多機(jī)器人所處的環(huán)境狀態(tài)表示為狀態(tài)集合動作集合描述為多機(jī)器人在狀態(tài)st下,選擇動作at并且執(zhí)行。同時(shí),狀態(tài)轉(zhuǎn)換為st+1,然后從環(huán)境中得到了強(qiáng)化信號rt。

    Q學(xué)習(xí)是一類被廣泛應(yīng)用的強(qiáng)化學(xué)習(xí)算法[8],它用函數(shù)Q(x,a )表達(dá)與各個(gè)狀態(tài)相對應(yīng)的動作的評估。其表達(dá)式為:

    由于強(qiáng)化學(xué)習(xí)系統(tǒng)的目的是使得總的獎勵(lì)值達(dá)到最大,因此,用可得:

    在時(shí)刻t,多機(jī)器人根據(jù)當(dāng)前的狀態(tài)選擇一個(gè)動作a,然后,根據(jù)以下表達(dá)式更新Q值:

    3 基于強(qiáng)化學(xué)習(xí)的BDI協(xié)作模型

    “信念-愿望-意向”(BDI)多機(jī)器人系統(tǒng)根據(jù)內(nèi)部的心智狀態(tài)產(chǎn)生動作進(jìn)而影響周圍環(huán)境。BDI多機(jī)器人系統(tǒng)有3個(gè)主要心智狀態(tài):信念(belief),愿望(desire)和意向(intention),分別代表多機(jī)器人所具有的信息、動機(jī)和決策。而在多機(jī)器人BDI模型中,信念代表多機(jī)器人對當(dāng)前的環(huán)境與自身可能要采取的行為估計(jì);愿望代表多機(jī)器人對未來環(huán)境與自身可能要采取行為的喜好;意向代表多機(jī)器人為了達(dá)到某個(gè)目的做出的承諾。

    BDI Robot的求解意見過程驅(qū)動手段-目的的推理,同時(shí)還需要滿足幾個(gè)其他的約束:產(chǎn)生的意見必須和Robot當(dāng)前的信念及意圖一致;其次,應(yīng)能識別環(huán)境變化的趨勢,提供Robot獲得意圖的新方法或者新的可能性。一個(gè)BDI Robot慎思過程用過濾函數(shù)表示,過濾函數(shù)根據(jù)Robot當(dāng)前的意圖、信念和愿望來刷新Robot的意圖。它需要丟棄無法完成的或者已經(jīng)無意義的意圖,為不能實(shí)現(xiàn)的意圖選擇新的實(shí)現(xiàn)方法及意圖。

    在多機(jī)器人系統(tǒng)體系結(jié)構(gòu)中可由E(環(huán)境)引起最初的變化。當(dāng)環(huán)境變化時(shí),機(jī)器人將收到新的信息來更新自身的bel(信念)。通過環(huán)境感知函數(shù)sence,機(jī)器人可感知到環(huán)境的變化。每當(dāng)環(huán)境發(fā)生變化,機(jī)器人將及時(shí)更新自身的bel(信念)以滿足新的變化的要求。機(jī)器人的bel是在開放的環(huán)境下,處于動態(tài)變化之中。Bel變化將引起des(愿望)變動,des變動會影響int(意向)的選擇及要采取的行為,最終影響整個(gè)環(huán)境發(fā)生變化。機(jī)器人的變動為一種鏈?zhǔn)椒磻?yīng),E變化引起bel、des和int變化,最終又影響到E。

    此動態(tài)模型的具體定義:

    (4)感知函數(shù)sence:ρ(bel)×e→ρ(bel),該函數(shù)跟據(jù)當(dāng)前對環(huán)境的感知和信念確定新的信念集合。

    (5)意見函數(shù)opinion:ρ(bel)×ρ(int)→ρ(des),該函數(shù)跟據(jù)當(dāng)前環(huán)境的感知和意圖的執(zhí)行確定一個(gè)新目標(biāo)。

    (6)過濾函數(shù)filter:ρ(bel)×ρ(des)×ρ(int)→ρ(int),該函數(shù)依據(jù)Robot當(dāng)前的意圖、信念及愿望更新Robot的意圖。

    (7)行為函數(shù)action:Roti×ρ(int)→Roti×E,若i=j為內(nèi)部行為,若i≠j,則為外部行為。

    {S,G,R,B,D,I,λ}中,S為離散的狀態(tài)空間,G為協(xié)同求解的目標(biāo),R為多機(jī)器人的集合,B為多機(jī)器人的信念集合,D為多機(jī)器人的愿望集合,I為多機(jī)器人的意圖集合,λ={λ1,λ2,…,λn}為多機(jī)器人問題求解時(shí)的價(jià)值系數(shù)集合,λ∈(0,1)。通常情況下,由于每個(gè)Robot都是依據(jù)自身的局部規(guī)劃來進(jìn)行局部求解,卻不考慮其他Robot的動作規(guī)劃,因此Robot之間必然會存在意圖沖突,從而使式(8)成立:

    意圖是多機(jī)器人系統(tǒng)的內(nèi)部動力,而不穩(wěn)定性主要源于意圖沖突。由動力學(xué)理論,系統(tǒng)的運(yùn)動總趨向穩(wěn)定平衡態(tài)而遠(yuǎn)離不穩(wěn)定平衡態(tài)。針對多機(jī)器人系統(tǒng),不管是協(xié)作還是沖突,最終總要達(dá)到某個(gè)穩(wěn)定點(diǎn)或平衡點(diǎn)。如果將系統(tǒng)內(nèi)的多機(jī)器人分為兩部分:意圖有沖突的Robot與意圖無沖突的Robot,則可把系統(tǒng)看作雙矩陣對策系統(tǒng)。依據(jù)Nash定理,它必然存在混合策略平衡。若假定所有Robot學(xué)習(xí)同一個(gè)Nash平衡,這將使得每一個(gè)Robot的選擇能夠最優(yōu)地響應(yīng)其他Robot的選擇,因此式(9)得以成立:

    這樣在系統(tǒng)中,所有Robot能夠追求共同最優(yōu)解,即追求最大限度地實(shí)現(xiàn)整體聯(lián)合意圖。

    信息完備時(shí),聯(lián)合學(xué)習(xí)模型能有效實(shí)現(xiàn)多機(jī)器人協(xié)作,但當(dāng)機(jī)器人得不到完整信息時(shí),此方法難以使用。在信息不完備的情況下,多機(jī)器人采用獨(dú)立學(xué)習(xí)的方式。機(jī)器人不知道其他機(jī)器人的行為策略,每個(gè)機(jī)器人進(jìn)行獨(dú)立學(xué)習(xí),它依據(jù)自身得到的獎勵(lì)維護(hù)狀態(tài)動作對的Q值表,每一Q值表示某個(gè)優(yōu)化策略在此狀態(tài)動作對的獎勵(lì)值。已有文獻(xiàn)[9]證明了信息不完備時(shí)采用此規(guī)則進(jìn)行獨(dú)立強(qiáng)化學(xué)習(xí)能使得多機(jī)器人協(xié)作決策過程得以收斂。多機(jī)器人之間不能交互行為策略時(shí),某一狀態(tài),多機(jī)器人依據(jù)Q值表執(zhí)行動作,且根據(jù)反饋得到的獎勵(lì)值更新Q值表。

    BDI模型通過形式化心智成分和邏輯推理實(shí)現(xiàn)多機(jī)器人行為的自主性和理性,強(qiáng)化學(xué)習(xí)通過感知環(huán)境狀態(tài)和得到的獎勵(lì)值學(xué)習(xí)系統(tǒng)的最優(yōu)行為策略。單獨(dú)使用符號推理的邏輯方法無法使得效用最佳,而數(shù)值分析的強(qiáng)化學(xué)習(xí)也忽略了推理的環(huán)節(jié),對于多機(jī)器人系統(tǒng)來說,既需要對于環(huán)境信息推理,又要經(jīng)過學(xué)習(xí)不斷地強(qiáng)化正確行為使之得到最大的收益,因此,將強(qiáng)化學(xué)習(xí)和BDI模型結(jié)合起來研究多機(jī)器人協(xié)作問題。

    3.1 基于權(quán)重的行為機(jī)制

    搬運(yùn)物體分為兩個(gè)部分:(1)躲避障礙物;(2)向目標(biāo)區(qū)域前進(jìn)。在整個(gè)多機(jī)器人的協(xié)同搬運(yùn)中,都是由這兩個(gè)行為組成,但是,每個(gè)行為重要性是不同的。描述為:

    其中,Weightavoid和Weightbin是躲避障礙物和向目標(biāo)區(qū)域前進(jìn)的權(quán)重。MS-AVOID-OBSTACLES、MS-MOVE-TO-OBJECTBIN分別代表躲避障礙物、向目標(biāo)區(qū)域前進(jìn)兩個(gè)行為。

    3.2 基于強(qiáng)化學(xué)習(xí)的行為權(quán)重

    多機(jī)器人協(xié)同搬運(yùn)過程中,不同的行為具有各自的權(quán)重,且在不相同的環(huán)境中各行為的重要性也有區(qū)別,為了能夠使得行為權(quán)重依據(jù)環(huán)境自動進(jìn)行調(diào)整,采取了強(qiáng)化學(xué)習(xí)自動學(xué)習(xí)理想的權(quán)重組合,以使得機(jī)器人能夠像人類一樣的學(xué)習(xí),完成協(xié)同搬運(yùn)過程。

    學(xué)習(xí)初期,各行為權(quán)重都設(shè)有初始值,學(xué)習(xí)過程中,根據(jù)環(huán)境反饋的信息,運(yùn)用評價(jià)函數(shù)r對權(quán)重評價(jià),當(dāng)完成一次協(xié)同搬運(yùn)后,此權(quán)重就會被重新進(jìn)行計(jì)算:

    若完成協(xié)同搬運(yùn)過程,則r為正,就使得當(dāng)前權(quán)重值增大;當(dāng)未完成時(shí),r為負(fù)值,使得當(dāng)前權(quán)重值減小。評價(jià)函數(shù)定義為:

    式中,xavg表示在tmin時(shí)間間隔內(nèi),多機(jī)器人系統(tǒng)的位置;xt表示最近障礙物的位置;a是安全閾值。

    3.3 距離最近原則的多機(jī)器人協(xié)同搬運(yùn)

    距離最近原則即為在全部協(xié)同搬運(yùn)的多機(jī)器人中,選擇距離障礙物最近的機(jī)器人作為主機(jī)器人,由其發(fā)出指令進(jìn)而控制其他的機(jī)器人執(zhí)行動作。如式(12)。在搬運(yùn)過程中,設(shè)離障礙物最近的作為主機(jī)器人,指揮其他從機(jī)器人行動。

    其中,Rmain為主機(jī)器人,Rn為n號機(jī)器人,DistanceRmin為機(jī)器人距離障礙物最近的距離,DistanceRn為機(jī)器人N到障礙物的距離。

    4 仿真實(shí)驗(yàn)

    4.1 實(shí)驗(yàn)場景

    為了驗(yàn)證將BDI模型和強(qiáng)化學(xué)習(xí)相結(jié)合引入多機(jī)器人協(xié)同搬運(yùn)過程的有效性,在仿真環(huán)境下對其進(jìn)行驗(yàn)證。四個(gè)機(jī)器人站在兩兩互成90°角的等分點(diǎn)上抬著圓桶在如圖所示的障礙物環(huán)境中,將圓桶搬運(yùn)至目的地,本次實(shí)驗(yàn)任務(wù)假定該物體是密度分布均勻的,實(shí)驗(yàn)環(huán)境如圖1所示,實(shí)心物體代表障礙物,空心圓代表整個(gè)多機(jī)器人系統(tǒng)及圓桶的出發(fā)地。

    圖1 障礙物、目標(biāo)區(qū)域位置設(shè)置

    其中,出發(fā)地內(nèi)圓桶與四個(gè)機(jī)器人的位置分布放大圖如圖2所示,虛線代表出發(fā)地,空心圓代表圓桶,四個(gè)實(shí)心圓分別代表四個(gè)機(jī)器人。

    圖2 出發(fā)地內(nèi)四個(gè)機(jī)器人與圓桶的位置放大圖

    4.2 強(qiáng)化學(xué)習(xí)單元

    (1)評價(jià)函數(shù)的表示

    在多機(jī)器人協(xié)同搬運(yùn)過程中,各子行為初始權(quán)重分別設(shè)置為Weightavoid=1,Weightbin=1,各權(quán)重相應(yīng)的強(qiáng)化學(xué)習(xí)評價(jià)函數(shù)如下:

    (2)狀態(tài)空間的表示

    多機(jī)器人系統(tǒng)的狀態(tài)空間S:

    其中,dl是多機(jī)器人系統(tǒng)左側(cè)距障礙物的距離,df是多機(jī)器人系統(tǒng)前方距障礙物的距離,dr是多機(jī)器人系統(tǒng)右側(cè)距障礙物的距離,dg是多機(jī)器人系統(tǒng)與目標(biāo)點(diǎn)之間的距離,

    θ是多機(jī)器人系統(tǒng)當(dāng)前方向與目標(biāo)點(diǎn)的夾角。用這5個(gè)量作為狀態(tài)空間的5個(gè)維度,多機(jī)器人系統(tǒng)和障礙物的距離定義

    (3)動作空間的表示

    多機(jī)器人系統(tǒng)的動作空間A:

    其中,a1為機(jī)器人轉(zhuǎn)動+15°同時(shí)前進(jìn);a2為機(jī)器人轉(zhuǎn)動-15°同時(shí)前進(jìn);a3為機(jī)器人轉(zhuǎn)動+10°同時(shí)前進(jìn);a4為機(jī)器人轉(zhuǎn)動-10°同時(shí)前進(jìn);a5為機(jī)器人前進(jìn)。

    t時(shí)刻多機(jī)器人系統(tǒng)的狀態(tài)St為一個(gè)五維向量:

    4.3 動作選擇策略

    學(xué)習(xí)的初始階段,因其Q值是隨機(jī)初始化,所以不具任何意義。為了探索到全部可能的動作,引入Boltzmann分布實(shí)現(xiàn)初始階段動作的隨機(jī)選擇,某個(gè)動作被選擇的概率為:

    圖3 機(jī)器人、障礙物和目標(biāo)點(diǎn)的位置圖

    式中,T為虛擬溫度,隨著溫度增加,選擇的隨機(jī)性也加強(qiáng)。

    隨著學(xué)習(xí)的進(jìn)程,Q值慢慢趨向于所期望的狀態(tài)-動作值,此時(shí),根據(jù)貪婪策略選擇動作,即選擇最大的Q值對應(yīng)著的動作。

    為了顯示出強(qiáng)化學(xué)習(xí)算法與BDI模型結(jié)合的有效性及優(yōu)越性,共進(jìn)行了三次實(shí)驗(yàn):

    (1)原始強(qiáng)化學(xué)習(xí)算法用于多機(jī)器人協(xié)同搬運(yùn),如圖4所示。

    圖4 原始強(qiáng)化學(xué)習(xí)算法用于多機(jī)器人協(xié)同搬運(yùn)軌跡圖(多次學(xué)習(xí)后)

    (2)強(qiáng)化學(xué)習(xí)與BDI模型用于多機(jī)器人搬運(yùn)(學(xué)習(xí)初期),如圖5所示。

    圖5 強(qiáng)化學(xué)習(xí)與BDI模型用于多機(jī)器人搬運(yùn)軌跡圖(學(xué)習(xí)初期)

    (3)強(qiáng)化學(xué)習(xí)與BDI模型用于多機(jī)器人協(xié)同搬運(yùn),如圖6所示。

    圖6 強(qiáng)化學(xué)習(xí)與BDI模型用于多機(jī)器人協(xié)同搬運(yùn)軌跡圖

    并且,比較了強(qiáng)化學(xué)習(xí)-BDI模型結(jié)合與原始強(qiáng)化學(xué)習(xí)算法的循環(huán)次數(shù)與成功次數(shù)的效果,如圖7所示。

    圖7 循環(huán)次數(shù)與成功次數(shù)的仿真結(jié)果

    4.4 實(shí)驗(yàn)結(jié)果與分析

    由圖4和圖7可以看出,原始強(qiáng)化學(xué)習(xí)算法在多機(jī)器人協(xié)同搬運(yùn)過程中,經(jīng)過較多次學(xué)習(xí),機(jī)器人還是總與障礙物相撞,這是因?yàn)閺?qiáng)化學(xué)習(xí)算法存儲空間很大,學(xué)習(xí)速度很慢,并且不具備推理能力,在環(huán)境信息不完備的情況下,聯(lián)合學(xué)習(xí)模型難以適用;將BDI模型與強(qiáng)化學(xué)習(xí)結(jié)合起來用于多機(jī)器人協(xié)同搬運(yùn)時(shí),多機(jī)器人系統(tǒng)在一個(gè)存在隨機(jī)設(shè)置障礙物的環(huán)境中運(yùn)行,在初始階段,由于多機(jī)器人處于隨機(jī)選擇動作的階段,因此運(yùn)行中路線不平滑;但是經(jīng)過多次學(xué)習(xí)后,多機(jī)器人能夠?qū)崿F(xiàn)在躲避障礙物的條件下順利到達(dá)目標(biāo)區(qū)域,并且運(yùn)行軌跡比較平滑。隨著學(xué)習(xí)的持續(xù),運(yùn)行效果也越來越好。這是因?yàn)锽DI模型的引入能夠有效解決強(qiáng)化學(xué)習(xí)推理能力弱的問題。

    5 結(jié)束語

    將多機(jī)器人系統(tǒng)的獨(dú)立強(qiáng)化學(xué)習(xí)與BDI模型相結(jié)合,使得多機(jī)器人系統(tǒng)不僅具有強(qiáng)化學(xué)習(xí)的自適應(yīng)性和高度反應(yīng)性,而且也擁有了BDI模型的推理能力,這就使只用數(shù)值分析卻忽略推理環(huán)節(jié)的強(qiáng)化學(xué)習(xí)方法結(jié)合了邏輯推理方法。在使用此方法后,有效地減少了多機(jī)器人系統(tǒng)與障礙物發(fā)生碰撞的次數(shù),增大了實(shí)現(xiàn)協(xié)同搬運(yùn)的成功率,具有良好的學(xué)習(xí)效果。仿真結(jié)果也表明了此方法的有效性,可以滿足多機(jī)器人系統(tǒng)的要求。本文主要是把此方法用在靜障礙物的情形下,今后的工作是把此方法應(yīng)用到更為復(fù)雜的環(huán)境中,實(shí)現(xiàn)更多的功能。

    [1]Bauer A,Wollherr D,Buss M.Human-robot collaboration:a survey[J].International Journal of Humanoid Robotics,2008,5(1):47-66.

    [2]Jan G E,Chang K Y,Parberry I.Optimal path planning for mobile robotnavigation[J].IEEE-ASME Transactionson Mechatronics,2008,13(4):451-460.

    [3]Busoniu L,Babuska R,De Schutter B.A comprehensive survey ofmultiagentreinforcementlearning[J].IEEE Transactions on Systems,Man and Cybernetics,2008,38(2):156-172.

    [4]Hwang K S,Ko Y C,Alouini M S.Performance analysis of incremental opportunistic relaying over identically and nonidentically distributed cooperative paths[J].IEEE Trans on Wireless Commun,2009,8(4):1953-1961.

    [5]樸松昊,孫立寧,鐘秋波.動態(tài)環(huán)境下的多智能體機(jī)器人協(xié)作模型[J].華中科技大學(xué)學(xué)報(bào),2008,36(10):39-52.

    [6]樊建,鄭昌陸,費(fèi)敏銳.基于角色變換和強(qiáng)化學(xué)習(xí)的多機(jī)器人協(xié)同仿真[J].系統(tǒng)仿真學(xué)報(bào),2009,21(21):6964-6967.

    [7]顏振亞,鄭寶玉,林志偉.無線傳感器網(wǎng)絡(luò)中機(jī)會協(xié)作傳輸及其性能研究[J].電子與信息學(xué)報(bào),2009,31(1):215-218.

    [8]Gosavi A.Reinforcement learning:a tutorial survey and recent advances[J].INFORMS Journal on Computing,2009,21(2):178-192.

    [9]Juang C F,Hsu C H.Reinforcement interval type-2 fuzzy controller design by online rule generation and Q-value-aided antcolony optimization[J].IEEE Transon Systems,Man and Cybernetics Part B,2009,39(6):1528-1542.

    CAO Jie,ZHU Ningning

    College of Computer and Communication,Lanzhou University of Technology,Lanzhou 730050,China

    In the multi-robot cooperative carrying process,traditional reinforcement learning only uses numerical analysis and ignored reasoning approach.To solve this problem,independence reinforcement learning for multi-robot combines with Belief-Desire-Intention(BDI)model,which makes reinforcement learning link logical reasoning capabilities.And the distance nearest principle is employed which means that the nearest robot ranged from obstacles is the leader robot to control other robots move.Evaluation function which changes with the location of multi-robot and the barriers is proposed,and it combines with the behavior weight based on reinforcement learning which becomes more and more optimized through constantly interacting with the environment.Simulation results show that this method is feasible,and the cooperative carrying process can be successfully achieved. Key words:multi-robot;reinforcement learning;cooperative carrying;obstacle avoidance

    在多機(jī)器人協(xié)同搬運(yùn)過程中,針對傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法僅使用數(shù)值分析卻忽略了推理環(huán)節(jié)的問題,將多機(jī)器人的獨(dú)立強(qiáng)化學(xué)習(xí)與“信念-愿望-意向”(BDI)模型相結(jié)合,使得多機(jī)器人系統(tǒng)擁有了邏輯推理能力,并且,采用距離最近原則將離障礙物最近的機(jī)器人作為主機(jī)器人,并指揮從機(jī)器人運(yùn)動,提出隨多機(jī)器人系統(tǒng)位置及最近障礙物位置變化的評價(jià)函數(shù),同時(shí)將其與基于強(qiáng)化學(xué)習(xí)的行為權(quán)重結(jié)合運(yùn)用,在多機(jī)器人通過與環(huán)境不斷交互中,使行為權(quán)重逐漸趨向最佳。仿真實(shí)驗(yàn)表明,該方法可行,能夠成功實(shí)現(xiàn)協(xié)同搬運(yùn)過程。

    多機(jī)器人;強(qiáng)化學(xué)習(xí);協(xié)同搬運(yùn);避障

    A

    TP242

    10.3778/j.issn.1002-8331.1202-0215

    CAO Jie,ZHU Ningning.Multi-robot cooperative carrying in dynamic environment.Computer Engineering and Applications,2013,49(23):252-256.

    曹潔(1966—),女,博士生導(dǎo)師,教授,主要研究領(lǐng)域?yàn)橹悄芙煌ㄏ到y(tǒng)、信息融合理論及應(yīng)用;朱寧寧(1986—),女,碩士。E-mail:307516638@qq.com

    2012-02-13

    2012-03-23

    1002-8331(2013)23-0252-05

    CNKI出版日期:2012-06-15 http://www.cnki.net/kcms/detail/11.2127.TP.20120615.1726.038.html

    猜你喜歡
    障礙物意圖權(quán)重
    原始意圖、對抗主義和非解釋主義
    法律方法(2022年2期)2022-10-20 06:42:20
    陸游詩寫意圖(國畫)
    制定法解釋與立法意圖的反事實(shí)檢驗(yàn)
    法律方法(2021年3期)2021-03-16 05:56:58
    權(quán)重常思“浮名輕”
    高低翻越
    SelTrac?CBTC系統(tǒng)中非通信障礙物的設(shè)計(jì)和處理
    為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
    基于公約式權(quán)重的截短線性分組碼盲識別方法
    燕山秋意圖
    層次分析法權(quán)重的計(jì)算:基于Lingo的數(shù)學(xué)模型
    河南科技(2014年15期)2014-02-27 14:12:51
    只有这里有精品99| 国产黄色免费在线视频| 国产野战对白在线观看| 亚洲婷婷狠狠爱综合网| 熟女少妇亚洲综合色aaa.| 成人国语在线视频| av一本久久久久| 色哟哟·www| 亚洲av电影在线观看一区二区三区| 精品国产一区二区久久| av福利片在线| 欧美日韩一级在线毛片| 日韩中字成人| 亚洲熟女精品中文字幕| 男人操女人黄网站| 男人操女人黄网站| 国产国语露脸激情在线看| 看非洲黑人一级黄片| 人人妻人人澡人人看| 日本wwww免费看| 久久精品久久久久久噜噜老黄| 亚洲国产av影院在线观看| 国产成人91sexporn| 国产高清国产精品国产三级| 美女福利国产在线| 丝瓜视频免费看黄片| 中文字幕人妻丝袜一区二区 | 少妇的丰满在线观看| 在线观看免费高清a一片| 亚洲精品在线美女| 黄色配什么色好看| 日本wwww免费看| 91精品伊人久久大香线蕉| 蜜桃国产av成人99| 久久鲁丝午夜福利片| 日本色播在线视频| 亚洲,一卡二卡三卡| 国产亚洲一区二区精品| 中文字幕人妻丝袜一区二区 | 午夜免费鲁丝| 晚上一个人看的免费电影| 亚洲国产精品999| 亚洲精品日韩在线中文字幕| 欧美精品av麻豆av| 少妇人妻精品综合一区二区| 日韩在线高清观看一区二区三区| 国产精品 国内视频| 久久午夜福利片| 亚洲av综合色区一区| 亚洲欧美成人精品一区二区| 91aial.com中文字幕在线观看| 青春草亚洲视频在线观看| 9热在线视频观看99| 日本欧美视频一区| 交换朋友夫妻互换小说| 91久久精品国产一区二区三区| a 毛片基地| 日韩电影二区| 这个男人来自地球电影免费观看 | 国产精品久久久久成人av| 国产乱人偷精品视频| 国产免费现黄频在线看| 国产97色在线日韩免费| 99久国产av精品国产电影| 国产亚洲av片在线观看秒播厂| 亚洲av电影在线进入| 日韩中字成人| 美国免费a级毛片| 涩涩av久久男人的天堂| 男的添女的下面高潮视频| 欧美日韩亚洲国产一区二区在线观看 | 看十八女毛片水多多多| 日本vs欧美在线观看视频| 国产免费一区二区三区四区乱码| 国产亚洲精品第一综合不卡| 满18在线观看网站| 一级片'在线观看视频| 亚洲精品日本国产第一区| 日韩精品免费视频一区二区三区| 日韩av在线免费看完整版不卡| 激情五月婷婷亚洲| 成人二区视频| 九草在线视频观看| 亚洲美女视频黄频| 久久国内精品自在自线图片| 午夜免费观看性视频| 美女大奶头黄色视频| 国产精品三级大全| 一区二区三区激情视频| 亚洲久久久国产精品| 国产 一区精品| 亚洲 欧美一区二区三区| 天天躁夜夜躁狠狠躁躁| 男女免费视频国产| 久久ye,这里只有精品| 欧美成人午夜精品| 十八禁高潮呻吟视频| 一区二区日韩欧美中文字幕| 天天躁夜夜躁狠狠躁躁| 极品少妇高潮喷水抽搐| 亚洲第一青青草原| 大陆偷拍与自拍| 亚洲av日韩在线播放| 青草久久国产| 各种免费的搞黄视频| 黑人欧美特级aaaaaa片| 精品国产国语对白av| 97人妻天天添夜夜摸| 亚洲伊人色综图| 国产淫语在线视频| 欧美激情 高清一区二区三区| 在线天堂最新版资源| 日本色播在线视频| 久久ye,这里只有精品| 国产无遮挡羞羞视频在线观看| 老汉色av国产亚洲站长工具| 久久久久久伊人网av| 在线 av 中文字幕| av视频免费观看在线观看| 国产黄色免费在线视频| av卡一久久| videos熟女内射| 狠狠婷婷综合久久久久久88av| 精品久久蜜臀av无| 国产乱来视频区| 欧美日本中文国产一区发布| 亚洲精品乱久久久久久| 一边摸一边做爽爽视频免费| videosex国产| 一边亲一边摸免费视频| 久热久热在线精品观看| 欧美激情高清一区二区三区 | 美女国产高潮福利片在线看| kizo精华| 精品一区二区三区四区五区乱码 | 可以免费在线观看a视频的电影网站 | 美女视频免费永久观看网站| 伦理电影大哥的女人| 性少妇av在线| 777久久人妻少妇嫩草av网站| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 日本欧美国产在线视频| 伦精品一区二区三区| 26uuu在线亚洲综合色| 欧美日韩国产mv在线观看视频| 国产日韩欧美在线精品| 街头女战士在线观看网站| 啦啦啦在线免费观看视频4| 久久精品国产鲁丝片午夜精品| 亚洲第一区二区三区不卡| 国产男女内射视频| 三上悠亚av全集在线观看| 亚洲av电影在线进入| 2018国产大陆天天弄谢| 晚上一个人看的免费电影| 在线天堂最新版资源| 免费av中文字幕在线| 香蕉精品网在线| 老司机影院毛片| 大码成人一级视频| 一区二区三区激情视频| 人人妻人人澡人人爽人人夜夜| 爱豆传媒免费全集在线观看| 少妇人妻精品综合一区二区| 亚洲中文av在线| 一本—道久久a久久精品蜜桃钙片| 国产精品免费视频内射| 美女高潮到喷水免费观看| 成人国产av品久久久| 十八禁高潮呻吟视频| 男的添女的下面高潮视频| 综合色丁香网| 亚洲少妇的诱惑av| 亚洲激情五月婷婷啪啪| 免费观看无遮挡的男女| 在线观看免费视频网站a站| 亚洲色图 男人天堂 中文字幕| av国产久精品久网站免费入址| 美女中出高潮动态图| 亚洲一区二区三区欧美精品| av国产久精品久网站免费入址| 一区福利在线观看| 久久久久精品久久久久真实原创| 欧美日韩精品网址| videosex国产| 免费av中文字幕在线| 在线亚洲精品国产二区图片欧美| 国产女主播在线喷水免费视频网站| 成人漫画全彩无遮挡| 自线自在国产av| 满18在线观看网站| 丝袜美足系列| 亚洲成av片中文字幕在线观看 | 成人二区视频| 老鸭窝网址在线观看| 亚洲色图综合在线观看| 午夜免费男女啪啪视频观看| 99热网站在线观看| 国产精品久久久久久精品古装| 黑丝袜美女国产一区| 欧美中文综合在线视频| 精品亚洲成a人片在线观看| 母亲3免费完整高清在线观看 | 亚洲精品一二三| 人人妻人人澡人人看| 97人妻天天添夜夜摸| 女人久久www免费人成看片| 欧美精品国产亚洲| 久久人人97超碰香蕉20202| 大话2 男鬼变身卡| 午夜日韩欧美国产| 精品人妻熟女毛片av久久网站| 国产97色在线日韩免费| 久久久久久久国产电影| 欧美日韩成人在线一区二区| 亚洲国产精品成人久久小说| 久久国产精品大桥未久av| 在线观看三级黄色| 欧美 亚洲 国产 日韩一| 曰老女人黄片| 在线观看美女被高潮喷水网站| 人妻少妇偷人精品九色| 亚洲精品一区蜜桃| 亚洲国产日韩一区二区| 亚洲国产av新网站| 亚洲四区av| 宅男免费午夜| av免费观看日本| 两个人看的免费小视频| 丝袜脚勾引网站| 女人高潮潮喷娇喘18禁视频| www.av在线官网国产| 日本色播在线视频| 啦啦啦中文免费视频观看日本| 久久久久久久大尺度免费视频| 欧美人与善性xxx| 亚洲精品久久久久久婷婷小说| 在线观看国产h片| 韩国av在线不卡| 亚洲精华国产精华液的使用体验| 1024视频免费在线观看| 久久ye,这里只有精品| 国产亚洲一区二区精品| 免费在线观看完整版高清| 成人手机av| 日韩成人av中文字幕在线观看| 晚上一个人看的免费电影| 亚洲av电影在线进入| 极品人妻少妇av视频| 综合色丁香网| av片东京热男人的天堂| 免费观看无遮挡的男女| 久久久久久人人人人人| 国产一区二区激情短视频 | 国产激情久久老熟女| 丝袜脚勾引网站| 久久毛片免费看一区二区三区| 汤姆久久久久久久影院中文字幕| 欧美精品av麻豆av| 激情视频va一区二区三区| 在线精品无人区一区二区三| 国产熟女午夜一区二区三区| av卡一久久| av在线老鸭窝| 欧美精品一区二区大全| 国产精品一区二区在线不卡| 国产精品蜜桃在线观看| 人人妻人人澡人人爽人人夜夜| 中文字幕最新亚洲高清| 久久婷婷青草| 国产成人精品婷婷| 亚洲欧美色中文字幕在线| 日韩伦理黄色片| 一级黄片播放器| 肉色欧美久久久久久久蜜桃| 亚洲国产欧美网| 欧美黄色片欧美黄色片| av一本久久久久| 天天影视国产精品| 菩萨蛮人人尽说江南好唐韦庄| 国产精品一二三区在线看| 亚洲第一区二区三区不卡| 毛片一级片免费看久久久久| 精品酒店卫生间| 久久久久人妻精品一区果冻| 热99久久久久精品小说推荐| 激情五月婷婷亚洲| 日韩精品免费视频一区二区三区| 国产成人精品婷婷| 国产野战对白在线观看| 七月丁香在线播放| 国产爽快片一区二区三区| 免费人妻精品一区二区三区视频| 欧美日韩av久久| 狠狠婷婷综合久久久久久88av| 毛片一级片免费看久久久久| 不卡视频在线观看欧美| 久久久久久久久免费视频了| 久久av网站| 有码 亚洲区| 国产成人精品一,二区| 国产国语露脸激情在线看| 另类精品久久| 久久99蜜桃精品久久| 亚洲欧美一区二区三区国产| 永久免费av网站大全| 午夜91福利影院| 日韩,欧美,国产一区二区三区| 亚洲欧洲精品一区二区精品久久久 | 一级黄片播放器| 亚洲精品aⅴ在线观看| 咕卡用的链子| 国产精品av久久久久免费| 卡戴珊不雅视频在线播放| 亚洲精品美女久久久久99蜜臀 | www.精华液| 丝袜喷水一区| 日韩一卡2卡3卡4卡2021年| 久久久久久人人人人人| 国产极品粉嫩免费观看在线| 亚洲精品久久久久久婷婷小说| 女性被躁到高潮视频| 精品国产露脸久久av麻豆| 国产免费视频播放在线视频| videosex国产| videossex国产| 日韩熟女老妇一区二区性免费视频| 黄片播放在线免费| 精品少妇黑人巨大在线播放| 激情五月婷婷亚洲| 午夜福利一区二区在线看| 高清av免费在线| 欧美精品高潮呻吟av久久| 桃花免费在线播放| 少妇精品久久久久久久| 久久久久国产一级毛片高清牌| 久久精品国产鲁丝片午夜精品| 国产欧美日韩综合在线一区二区| 黄色 视频免费看| 亚洲人成电影观看| 国产乱来视频区| 午夜日本视频在线| 亚洲五月色婷婷综合| 国产精品 国内视频| 美女国产高潮福利片在线看| 国产精品 国内视频| 一区二区三区乱码不卡18| 久久av网站| 看非洲黑人一级黄片| 久久久久精品人妻al黑| 日韩av免费高清视频| 激情视频va一区二区三区| 女性生殖器流出的白浆| 大码成人一级视频| 老司机影院成人| 日韩熟女老妇一区二区性免费视频| 午夜久久久在线观看| 婷婷成人精品国产| 免费大片黄手机在线观看| 777米奇影视久久| 亚洲三区欧美一区| 五月开心婷婷网| 大码成人一级视频| 久久精品久久久久久久性| 成人亚洲精品一区在线观看| 久久久精品94久久精品| 丝袜在线中文字幕| 寂寞人妻少妇视频99o| 亚洲情色 制服丝袜| 波多野结衣av一区二区av| 亚洲精品自拍成人| 久久午夜福利片| 1024香蕉在线观看| 成人国语在线视频| 亚洲三区欧美一区| 国产熟女欧美一区二区| 综合色丁香网| 久久婷婷青草| 国产一区二区在线观看av| 韩国高清视频一区二区三区| 麻豆av在线久日| 久久人人爽人人片av| 91午夜精品亚洲一区二区三区| 下体分泌物呈黄色| 亚洲精品自拍成人| 亚洲av综合色区一区| 成人黄色视频免费在线看| 晚上一个人看的免费电影| 26uuu在线亚洲综合色| 国产黄色视频一区二区在线观看| 国产在线免费精品| 精品人妻偷拍中文字幕| 亚洲欧美一区二区三区黑人 | 久久精品久久久久久久性| 99国产综合亚洲精品| 久久ye,这里只有精品| 伊人久久大香线蕉亚洲五| 亚洲av国产av综合av卡| 国产成人免费无遮挡视频| 精品一区二区三卡| 最新中文字幕久久久久| 亚洲五月色婷婷综合| 在线天堂最新版资源| 久久97久久精品| av视频免费观看在线观看| 久久久久久伊人网av| 超碰97精品在线观看| 亚洲av欧美aⅴ国产| 毛片一级片免费看久久久久| 久久毛片免费看一区二区三区| 一本—道久久a久久精品蜜桃钙片| 黄色 视频免费看| 91午夜精品亚洲一区二区三区| 夜夜骑夜夜射夜夜干| 91精品三级在线观看| 日本av手机在线免费观看| 美女高潮到喷水免费观看| 9191精品国产免费久久| 亚洲一码二码三码区别大吗| 一边摸一边做爽爽视频免费| 中文字幕人妻熟女乱码| 在线观看人妻少妇| 多毛熟女@视频| 蜜桃在线观看..| 在线观看国产h片| 亚洲精品美女久久av网站| 99久久综合免费| 中文字幕人妻丝袜制服| 最近2019中文字幕mv第一页| 男人操女人黄网站| av在线app专区| 一级片'在线观看视频| 国产成人午夜福利电影在线观看| 久久青草综合色| 午夜福利在线免费观看网站| 中文乱码字字幕精品一区二区三区| 亚洲激情五月婷婷啪啪| 女人被躁到高潮嗷嗷叫费观| 性少妇av在线| 午夜免费观看性视频| 9色porny在线观看| 国产精品一区二区在线观看99| 2021少妇久久久久久久久久久| 成人毛片60女人毛片免费| 日韩 亚洲 欧美在线| 亚洲美女黄色视频免费看| 亚洲国产成人一精品久久久| 一本色道久久久久久精品综合| 精品一区二区三卡| 人人澡人人妻人| 国产精品.久久久| 精品久久久精品久久久| 男女啪啪激烈高潮av片| 女的被弄到高潮叫床怎么办| 免费不卡的大黄色大毛片视频在线观看| 秋霞伦理黄片| 天堂8中文在线网| videosex国产| 亚洲国产精品成人久久小说| 国产 一区精品| 国产乱人偷精品视频| av网站在线播放免费| 久久亚洲国产成人精品v| 一二三四中文在线观看免费高清| 你懂的网址亚洲精品在线观看| 欧美精品亚洲一区二区| 最黄视频免费看| 丝袜喷水一区| 制服人妻中文乱码| 女人久久www免费人成看片| 老司机影院毛片| 美女福利国产在线| 亚洲一码二码三码区别大吗| 亚洲精品在线美女| 七月丁香在线播放| 国产精品国产av在线观看| 久久青草综合色| 日本免费在线观看一区| 国产乱来视频区| 少妇人妻 视频| 在线观看人妻少妇| 国产精品一区二区在线不卡| 成人免费观看视频高清| av女优亚洲男人天堂| 国产精品一国产av| 天天躁狠狠躁夜夜躁狠狠躁| 久久久久人妻精品一区果冻| 老司机影院毛片| 水蜜桃什么品种好| 久久久久精品久久久久真实原创| 青春草视频在线免费观看| 欧美日韩视频高清一区二区三区二| 亚洲成人av在线免费| 曰老女人黄片| 美女主播在线视频| 日韩视频在线欧美| 亚洲精品久久午夜乱码| 亚洲第一区二区三区不卡| 日韩中文字幕欧美一区二区 | 伊人亚洲综合成人网| 在线观看www视频免费| 久久久精品国产亚洲av高清涩受| 亚洲三级黄色毛片| 色视频在线一区二区三区| 在线天堂最新版资源| 韩国av在线不卡| 国产精品秋霞免费鲁丝片| 在线观看一区二区三区激情| 青春草亚洲视频在线观看| 久久国产精品大桥未久av| 一二三四在线观看免费中文在| 一区在线观看完整版| 国产成人精品一,二区| 青青草视频在线视频观看| 黑丝袜美女国产一区| 亚洲欧美日韩另类电影网站| 菩萨蛮人人尽说江南好唐韦庄| 成人午夜精彩视频在线观看| av卡一久久| 久久免费观看电影| 亚洲图色成人| 亚洲精品国产色婷婷电影| 国产探花极品一区二区| 国产精品熟女久久久久浪| 91午夜精品亚洲一区二区三区| 伊人久久大香线蕉亚洲五| 国产精品三级大全| 九草在线视频观看| 人妻少妇偷人精品九色| 少妇人妻 视频| 成人午夜精彩视频在线观看| 午夜日韩欧美国产| 视频在线观看一区二区三区| 国产深夜福利视频在线观看| 伦理电影免费视频| 精品国产露脸久久av麻豆| 国产精品一二三区在线看| 色吧在线观看| 午夜福利一区二区在线看| 国产精品久久久久久av不卡| 日韩一本色道免费dvd| av线在线观看网站| av天堂久久9| 国产有黄有色有爽视频| 超碰97精品在线观看| 久久久久国产一级毛片高清牌| 不卡视频在线观看欧美| 曰老女人黄片| 一区二区av电影网| 在线观看免费视频网站a站| 少妇猛男粗大的猛烈进出视频| 国产成人精品久久二区二区91 | 国产免费又黄又爽又色| 美女xxoo啪啪120秒动态图| 狠狠婷婷综合久久久久久88av| 亚洲成人一二三区av| 777米奇影视久久| 黄色配什么色好看| a 毛片基地| 国产麻豆69| 熟女av电影| 日本欧美国产在线视频| 日韩伦理黄色片| 赤兔流量卡办理| av电影中文网址| 免费人妻精品一区二区三区视频| 欧美av亚洲av综合av国产av | 日韩制服丝袜自拍偷拍| 中文字幕最新亚洲高清| 免费观看av网站的网址| 免费看av在线观看网站| 熟女少妇亚洲综合色aaa.| 成人免费观看视频高清| 国产乱来视频区| 国产一区亚洲一区在线观看| 精品人妻熟女毛片av久久网站| 国产精品久久久久久精品电影小说| 亚洲av成人精品一二三区| 18禁国产床啪视频网站| 99久国产av精品国产电影| 99热国产这里只有精品6| 热99久久久久精品小说推荐| 又黄又粗又硬又大视频| 成人黄色视频免费在线看| h视频一区二区三区| 亚洲欧美一区二区三区久久| 久久99蜜桃精品久久| 亚洲国产看品久久| 91精品国产国语对白视频| 亚洲精品久久久久久婷婷小说| 国产一区有黄有色的免费视频| 亚洲,一卡二卡三卡| 午夜日本视频在线| 欧美精品高潮呻吟av久久| 日日摸夜夜添夜夜爱| 国产精品国产三级专区第一集| 国产日韩欧美在线精品| 国产精品久久久久久av不卡| 国产黄频视频在线观看| 精品亚洲成a人片在线观看| 黑人猛操日本美女一级片| 日韩,欧美,国产一区二区三区| 美国免费a级毛片| 电影成人av| 人妻系列 视频| 街头女战士在线观看网站| 日韩制服丝袜自拍偷拍| xxx大片免费视频| 亚洲国产精品999| 卡戴珊不雅视频在线播放| 欧美xxⅹ黑人| 少妇人妻精品综合一区二区| 看非洲黑人一级黄片| 国产精品久久久av美女十八| 中国国产av一级|