• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于遷移學(xué)習(xí)的多任務(wù)分配算法

    2020-07-06 13:35:08王夢(mèng)嬌黃寧馨
    關(guān)鍵詞:搜索算法智能目標(biāo)

    王夢(mèng)嬌,尹 翔,黃寧馨

    揚(yáng)州大學(xué) 信息工程學(xué)院,江蘇 揚(yáng)州 225009

    1 引言

    隨著現(xiàn)代社會(huì)與科學(xué)技術(shù)的飛速發(fā)展,人們面臨的問(wèn)題變得日趨復(fù)雜。分布式系統(tǒng)成為解決復(fù)雜問(wèn)題的有效手段和方法。通過(guò)將復(fù)雜任務(wù)分解為相對(duì)簡(jiǎn)單的子任務(wù),再將子任務(wù)分配給各智能體(agent),可以有效提高任務(wù)求解效率[1-2]。因此,任務(wù)分配問(wèn)題已經(jīng)引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。

    任務(wù)分配的目的是找到一種合理的子任務(wù)分配方式,使得子任務(wù)能夠被高效、合理地分配給各智能體。已有眾多學(xué)者對(duì)該問(wèn)題展開(kāi)深入研究。Smith 等人[3]提出了合同網(wǎng)協(xié)議,通過(guò)在多個(gè)智能體間訂立合同,以協(xié)商的方式實(shí)現(xiàn)任務(wù)的分配。以合同網(wǎng)協(xié)議為基礎(chǔ),劉海龍等人[4]基于集合覆蓋理論提出了一種在合同網(wǎng)框架下解決子任務(wù)分配的嚴(yán)格啟發(fā)式搜索算法,并分析了算法的收斂性及時(shí)間復(fù)雜度。Cano 等人[5]研究了如何將軟件分配給硬件處理器的問(wèn)題,將該問(wèn)題建模為一個(gè)多目標(biāo)優(yōu)化問(wèn)題,并給出了一個(gè)基于約束優(yōu)化的算法。

    近年來(lái),隨著人工智能技術(shù)的飛速發(fā)展,已有學(xué)者將強(qiáng)化學(xué)習(xí)的相關(guān)理論和方法用于求解任務(wù)分配問(wèn)題。Liu 等人[6]給出了一種基于強(qiáng)化學(xué)習(xí)的云資源分配機(jī)制,該策略通過(guò)在線學(xué)習(xí)實(shí)現(xiàn)了云資源的自動(dòng)管理和分配,提高了系統(tǒng)效益。廖曉閩等人[7]針對(duì)移動(dòng)通信中的蜂窩網(wǎng)資源分配多目標(biāo)優(yōu)化問(wèn)題,提出了一種基于深度強(qiáng)化學(xué)習(xí)的網(wǎng)絡(luò)資源分配算法。這類方法將任務(wù)分配問(wèn)題建模為一個(gè)馬爾科夫決策過(guò)程,通過(guò)最大化回報(bào)函數(shù)來(lái)獲得最優(yōu)策略。

    現(xiàn)有的大部分研究都是將任務(wù)分配問(wèn)題建模為多目標(biāo)優(yōu)化問(wèn)題,通過(guò)求解最優(yōu)解來(lái)獲得最優(yōu)分配策略。然而,作為一類NP-complete問(wèn)題,計(jì)算最優(yōu)解將耗費(fèi)大量資源,在問(wèn)題規(guī)模較大時(shí),甚至是不可能的。另一方面,對(duì)一個(gè)系統(tǒng)而言,其所面對(duì)的任務(wù)通常具有一定的相似性,如果能夠利用這種相似性來(lái)指導(dǎo)任務(wù)的分配,可以提高新任務(wù)分配的效率,獲得更多收益。

    遷移學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)重要分支,已在任務(wù)規(guī)劃[8-9]、圖像處理[10-11]以及眾包[12-13]等領(lǐng)域有廣泛應(yīng)用。遷移學(xué)習(xí)的核心思想是找到源任務(wù)與目標(biāo)任務(wù)之間的相似度,從而將一個(gè)或多個(gè)與目標(biāo)任務(wù)相似的源任務(wù)的知識(shí)或策略進(jìn)行遷移[14-15]??梢?jiàn),通過(guò)遷移學(xué)習(xí),可以使agent 在面對(duì)新任務(wù)時(shí)充分利用已有的經(jīng)驗(yàn)和知識(shí),在一個(gè)較高的起點(diǎn)上對(duì)問(wèn)題進(jìn)行求解,提高任務(wù)求解的效率。

    基于此,本文討論了多智能體環(huán)境下的任務(wù)分配問(wèn)題。所提出的算法利用遷移學(xué)習(xí)找到與目標(biāo)任務(wù)最匹配的源任務(wù),將其任務(wù)分配方案遷移到目標(biāo)任務(wù)中,加速任務(wù)的分配。同時(shí),在智能體尋找最優(yōu)路徑的過(guò)程中利用遷移學(xué)習(xí),通過(guò)歷史經(jīng)驗(yàn)加速學(xué)習(xí)過(guò)程。實(shí)驗(yàn)表明,相比于傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法,本文算法運(yùn)行時(shí)間大幅度降低且性能明顯提升。

    2 問(wèn)題描述

    本文算法解決的是在一個(gè)目標(biāo)任務(wù)中,有多個(gè)子任務(wù)需要由多個(gè)智能體來(lái)完成的問(wèn)題。本文算法將遷移學(xué)習(xí)的思想引入多任務(wù)分配的問(wèn)題中,目的是為了在保證任務(wù)分配質(zhì)量的情況下,提高任務(wù)分配的效率。如圖1所示,在本文的模型中,有多個(gè)智能體(數(shù)字表示)和多個(gè)子任務(wù)(Δ 表示),中央控制器將子任務(wù)分配給智能體,智能體需要找到一條到子任務(wù)位置的最優(yōu)路徑。智能體的狀態(tài)集合用S表示,包含智能體能到達(dá)的任意位置。智能體的動(dòng)作集合用A表示,包含上、下、左、右四個(gè)動(dòng)作。每次智能體只能移動(dòng)一步。在這里,子任務(wù)的坐標(biāo)或智能體的狀態(tài)由離散坐標(biāo)表示,黑色實(shí)心部分表示障礙,智能體無(wú)法到達(dá)或穿過(guò)。

    圖1 多智能體完成多子任務(wù)

    下面是對(duì)本文所解決的問(wèn)題的形式化描述:假設(shè)系統(tǒng)中有一定數(shù)量的智能體,其集合記為Agent,即Agent=,其中,n表示智能體的數(shù)量,源任務(wù)的子任務(wù)集合為SourceTask,即有其中,m表示源任務(wù)中子任務(wù)的數(shù)量,目標(biāo)任務(wù)的子任務(wù)集合為T(mén)argetTask,即有其中,g表示目標(biāo)任務(wù)子任務(wù)的數(shù)量。智能體數(shù)量與子任務(wù)數(shù)量的關(guān)系是n≥m,且一個(gè)智能體最多只能完成一項(xiàng)子任務(wù)。算法的目標(biāo)是最大化平均帶折扣回報(bào),即,其中,k表示片段數(shù),H表示一個(gè)片段結(jié)束所用的步數(shù)或所允許的最大步數(shù),γ表示折扣因子,ri,h表示第i個(gè)片段的第h步得到的立即回報(bào)。

    3 算法設(shè)計(jì)

    本章闡述本文提出算法的基本思想,算法中遷移的知識(shí)是策略。首先,將一定數(shù)量的源任務(wù)對(duì)應(yīng)的策略構(gòu)成一個(gè)策略庫(kù)表示策略庫(kù)中策略的數(shù)量,即源任務(wù)的數(shù)量;接著,在解決目標(biāo)任務(wù)時(shí),中央控制器要根據(jù)相似性度量找到與目標(biāo)任務(wù)相似程度最高的源任務(wù),將該源任務(wù)的智能體分配策略遷移到目標(biāo)任務(wù)中;得到目標(biāo)任務(wù)分配策略之后智能體將該源子任務(wù)的知識(shí)進(jìn)行遷移來(lái)學(xué)習(xí)一條到達(dá)目標(biāo)子任務(wù)狀態(tài)的最優(yōu)路徑,提高了學(xué)習(xí)效率并減少損耗。

    3.1 算法介紹

    本文算法分為兩步:首先找到與目標(biāo)任務(wù)最相近的源任務(wù),將源任務(wù)的任務(wù)分配方式遷移到目標(biāo)任務(wù)中,再使用遷移學(xué)習(xí)來(lái)學(xué)習(xí)并獲得各智能體到其對(duì)應(yīng)的目標(biāo)狀態(tài)的最優(yōu)策略。具體算法如下:

    首先,讓智能體學(xué)習(xí)一組具有代表性的、可以充分表示各種類型任務(wù)的源任務(wù)。源任務(wù)的作用是與目標(biāo)任務(wù)相匹配,進(jìn)行子任務(wù)分配策略的遷移。源任務(wù)庫(kù)的構(gòu)造方法:計(jì)算當(dāng)前源任務(wù)與源任務(wù)庫(kù)中已有的任務(wù)的相似性,若相似性較差,將當(dāng)前源任務(wù)加入源任務(wù)庫(kù)中,并將已學(xué)習(xí)的策略存入策略庫(kù)StrategyLibrary中。當(dāng)目標(biāo)任務(wù)到來(lái)時(shí),中央控制器要分別計(jì)算目標(biāo)任務(wù)中各個(gè)子任務(wù)與源任務(wù)中的子任務(wù)的考慮障礙的最小哈夫曼距離和,距離和最小的源任務(wù)判定為與目標(biāo)任務(wù)最相似的源任務(wù),記為most_matched。將策略庫(kù)中該源任務(wù)的策略πmost_matched(即子任務(wù)的分配策略)遷移到目標(biāo)任務(wù)中,其中,距離和的計(jì)算還考慮到了目標(biāo)子任務(wù)與源子任務(wù)和障礙的相對(duì)位置。最后,中央控制器根據(jù)目標(biāo)任務(wù)中子任務(wù)的坐標(biāo)和對(duì)應(yīng)智能體之前處理過(guò)的子任務(wù)的坐標(biāo)之間的哈夫曼距離判定源子任務(wù)與目標(biāo)子任務(wù)之間的相似度,將相似度最高的源子任務(wù)的策略遷移到目標(biāo)子任務(wù)中。算法的整體思路如算法1所示。

    算法1 帶遷移的多智能體多任務(wù)分配算法

    輸入:

    1.源任務(wù)庫(kù)對(duì)應(yīng)的策略庫(kù)StrategyLibrary

    2.一組目標(biāo)任務(wù)的集合Ω

    初始化:

    forj=1 togdo

    1.分別計(jì)算目標(biāo)任務(wù)中的子任務(wù)與各源任務(wù)的子任務(wù)的(考慮障礙的)距離,再求和得到distance

    2.most_matched=arg minsource_taskdistance即選取距離和最短的源任務(wù)作為被遷移的任務(wù)

    3.πtarget←πmost_matched將選定的源任務(wù)對(duì)應(yīng)的策略遷移給目標(biāo)任務(wù)的智能體

    4.利用遷移學(xué)習(xí)算法找到智能體到其對(duì)應(yīng)子任務(wù)的目標(biāo)位置的最優(yōu)路徑

    end for

    算法2的重點(diǎn)是如何比較任務(wù)之間的相似度,通過(guò)子任務(wù)之間的相似性度量找到與目標(biāo)任務(wù)最相似的源任務(wù)。若將與目標(biāo)任務(wù)相似度不高的源任務(wù)的策略進(jìn)行遷移,則很有可能會(huì)產(chǎn)生負(fù)遷移,即進(jìn)行遷移之后的策略反而比從頭學(xué)習(xí)策略效果更差。為了減少負(fù)遷移的產(chǎn)生,計(jì)算距離的公式如(1)所示,其中,distanceij表示目標(biāo)任務(wù)中第j個(gè)子任務(wù)與源任務(wù)中第i個(gè)子任務(wù)之間的距離。

    如圖2所示,當(dāng)兩個(gè)子任務(wù)之間存在障礙,則distanceij會(huì)被賦予很大的值,表示源任務(wù)中的子任務(wù)i與目標(biāo)任務(wù)中的子任務(wù)j相似度不高。若只考慮哈夫曼距離,那么這兩個(gè)子任務(wù)的哈夫曼距離是比較小的,但實(shí)際上因?yàn)橹悄荏w不能穿過(guò)障礙,故要繞開(kāi)障礙,說(shuō)明這兩個(gè)任務(wù)的相似度不高。比較源任務(wù)與目標(biāo)任務(wù)的相似度的偽代碼見(jiàn)算法2。

    圖2 任務(wù)相似性度量

    算法2 計(jì)算源任務(wù)與目標(biāo)任務(wù)的相似度

    找到包含所有best_agent的源任務(wù)

    目標(biāo)任務(wù)中的各個(gè)子任務(wù)分配好之后,進(jìn)入算法的第二階段,即利用遷移學(xué)習(xí)計(jì)算各智能體到目標(biāo)子任務(wù)的最優(yōu)路徑。這里,各智能體之前處理過(guò)的源子任務(wù)與其對(duì)應(yīng)的目標(biāo)子任務(wù)的相似度的計(jì)算方法與算法2 類似,不做贅述。算法3表示的是利用遷移學(xué)習(xí)找到一條從智能體到目標(biāo)子任務(wù)的最優(yōu)路徑的偽代碼。其中,Episodes表示尋找最優(yōu)路徑的最大片段數(shù)。

    在算法3 中,源任務(wù)的子任務(wù)的策略被保存在pai中。為了平衡“利用”和“探索”,使用了pt和p_t兩個(gè)變量進(jìn)行控制。pt表示片段的第一步“利用”歷史經(jīng)驗(yàn)的概率,其隨片段數(shù)的增加不斷減小,即隨著片段數(shù)的增加,智能體越少地“利用”歷史經(jīng)驗(yàn),也就是智能體更多地“利用”自身學(xué)習(xí)的知識(shí)。原因在于使用遷移學(xué)習(xí)的目的是在前期給智能體一個(gè)較好的指導(dǎo),但由于源任務(wù)和目標(biāo)任務(wù)是不完全相同的,故不能一直“利用”源任務(wù)中的策略。pt的更新公式如式(2),分母中的參數(shù)500是針對(duì)本實(shí)驗(yàn)嘗試不同參數(shù)值之后效果最好的參數(shù)值。不同參數(shù)值的性能比較見(jiàn)實(shí)驗(yàn)部分。

    算法3 學(xué)習(xí)智能體到目標(biāo)子任務(wù)的最優(yōu)路徑

    輸入:

    與目標(biāo)子任務(wù)最相似的源子任務(wù)most_match_source

    初始化:

    1.每個(gè)片段的第一步利用歷史經(jīng)驗(yàn)的概率p_t=1

    2.帶折扣的獎(jiǎng)勵(lì)之和sum_rewards_transfer=0

    在一個(gè)片段中,“利用”歷史經(jīng)驗(yàn)的概率p_t也是隨步數(shù)的增長(zhǎng)下降的。該變量的意義在于在一個(gè)片段中“利用”歷史經(jīng)驗(yàn)的頻率逐漸降低。兩個(gè)變量共同作用下,使得智能體隨著片段數(shù)、步數(shù)的逐漸增加,“利用”歷史經(jīng)驗(yàn)的頻率逐漸下降。

    3.2 算法分析

    本節(jié)對(duì)本文提出的算法與基于Q 學(xué)習(xí)的基本搜索算法從時(shí)間復(fù)雜度方面進(jìn)行比較和分析。

    假設(shè)源任務(wù)有m個(gè),每個(gè)源任務(wù)中平均有s個(gè)子任務(wù),目標(biāo)任務(wù)中有g(shù)個(gè)子任務(wù),系統(tǒng)中有n個(gè)智能體,k表示學(xué)習(xí)最優(yōu)路徑過(guò)程中的迭代次數(shù)。那么在帶遷移學(xué)習(xí)的情況下,第一步將子任務(wù)分配給合適的智能體所需要的時(shí)間復(fù)雜度為,第二步學(xué)習(xí)智能體到對(duì)應(yīng)子任務(wù)位置的最優(yōu)路徑所需要的時(shí)間復(fù)雜度為,故總的時(shí)間復(fù)雜度為。而用基于Q學(xué)習(xí)的基本搜索算法進(jìn)行迭代求解,那么時(shí)間復(fù)雜度為,這里有m?k,故相比較而言,本文提出的算法的時(shí)間復(fù)雜度要遠(yuǎn)低于基于Q 學(xué)習(xí)的基本搜索算法。

    4 實(shí)驗(yàn)與結(jié)果

    為了驗(yàn)證算法的性能,本文實(shí)驗(yàn)的環(huán)境建立在“格子世界”模型之上。從算法運(yùn)行時(shí)間、平均帶折扣回報(bào)等方面將文中的算法與基于Q 學(xué)習(xí)的基本搜索算法進(jìn)行對(duì)比。本章首先介紹了實(shí)驗(yàn)?zāi)P?,接著展示了兩種算法的性能并進(jìn)行分析。

    4.1 實(shí)驗(yàn)?zāi)P图皡?shù)設(shè)置

    實(shí)驗(yàn)?zāi)P腿鐖D1所示,環(huán)境被分為18×27個(gè)小格,黑色部分表示障礙,若智能體執(zhí)行某動(dòng)作之后遇到障礙則停在原地。智能體每走一步只要不到達(dá)終點(diǎn)所獲得的立即回報(bào)為?1,智能體碰到障礙得到?10 的懲罰,到達(dá)終點(diǎn)得到+10 的立即回報(bào)。圖中數(shù)字部分表示智能體的位置,本實(shí)驗(yàn)中一共有14 個(gè)智能體且智能體的位置固定,圖中Δ 表示子任務(wù)的位置,子任務(wù)的位置是不斷變動(dòng)的,每個(gè)任務(wù)中子任務(wù)的位置不同,且子任務(wù)的數(shù)量也不一定相同。此處假設(shè)智能體最多只能完成一個(gè)子任務(wù),故子任務(wù)總數(shù)小于智能體總數(shù),并且本實(shí)驗(yàn)考慮子任務(wù)數(shù)較多的情況,因?yàn)樽尤蝿?wù)少的情況下,可選擇的智能體較多,不科學(xué)的選擇對(duì)結(jié)果的影響較小,故子任務(wù)數(shù)最小為10,若表示子任務(wù)的數(shù)量,設(shè)。為了表示實(shí)驗(yàn)的一般性,目標(biāo)任務(wù)的子任務(wù)位置是隨機(jī)產(chǎn)生的。在實(shí)驗(yàn)中,源任務(wù)中各子任務(wù)位置是隨機(jī)生成的,均勻分布在圖1 所示的各子區(qū)域中。

    傳統(tǒng)Q學(xué)習(xí)算法中使用的是ε-greedy策略,參數(shù)的設(shè)置考慮到實(shí)際情況和Fernando[16]文中的參數(shù),具體如下:ε=0.01 表示Q 學(xué)習(xí)算法有1%的概率進(jìn)行“探索”,99%的概率進(jìn)行“利用”;γ=0.9 表示折扣因子為0.9;α=0.05 表示學(xué)習(xí)速率為0.05,Episodes=2 000 表示智能體最多迭代2 000 次學(xué)習(xí)最優(yōu)路徑,該迭代次數(shù)可以保證算法收斂到最優(yōu)路徑。在實(shí)驗(yàn)中,由于本文提出的算法解決的是多智能體環(huán)境下的多任務(wù)分配問(wèn)題,其本質(zhì)是一個(gè)序列決策問(wèn)題,而Q學(xué)習(xí)是解決這類問(wèn)題的經(jīng)典算法,故此處與基于傳統(tǒng)Q 學(xué)習(xí)的任務(wù)分配方法進(jìn)行比較,以驗(yàn)證本文算法的性能。相較于其他路徑規(guī)劃算法,如A*算法,基于遷移學(xué)習(xí)的算法的優(yōu)勢(shì)在于其不需要知道環(huán)境的準(zhǔn)確模型,而通過(guò)不斷試錯(cuò)得到最優(yōu)路徑。實(shí)驗(yàn)環(huán)境:Intel i5 CPU,4 GB RAM 以及Python 3.5。

    4.2 實(shí)驗(yàn)結(jié)果與分析

    第一組實(shí)驗(yàn)的目的是比較基于Q 學(xué)習(xí)的基本搜索算法與本文提出的算法之間的算法運(yùn)行時(shí)間和準(zhǔn)確度。本組實(shí)驗(yàn)共有21 個(gè)目標(biāo)任務(wù),每個(gè)目標(biāo)任務(wù)中的子任務(wù)個(gè)數(shù)是隨機(jī)的,表1展示了21組目標(biāo)任務(wù)找到對(duì)應(yīng)的智能體所需要的平均時(shí)間。

    表1 算法運(yùn)行時(shí)間比較

    從該組實(shí)驗(yàn)可以得出,利用基于Q學(xué)習(xí)的基本搜索算法所消耗的時(shí)間遠(yuǎn)高于本文提出的算法,其原因在于利用歷史經(jīng)驗(yàn),目標(biāo)任務(wù)的解決無(wú)需窮舉每種情況,而基于Q 學(xué)習(xí)的基本搜索算法由于每次獲得最優(yōu)路徑的消耗時(shí)間較多,再加上該過(guò)程要迭代多次,故時(shí)間較長(zhǎng)。本文提出算法的最大優(yōu)勢(shì)是大大降低了算法的運(yùn)行時(shí)間,對(duì)于實(shí)時(shí)性要求較高的任務(wù),其性能比基于Q學(xué)習(xí)的基本搜索算法好。

    第二組實(shí)驗(yàn)分析了不同子任務(wù)數(shù)對(duì)任務(wù)分配算法的運(yùn)行時(shí)間的影響。圖3 展示了兩種算法的運(yùn)行時(shí)間的對(duì)比。從圖中可以看出,當(dāng)目標(biāo)任務(wù)的子任務(wù)數(shù)為10時(shí),基于Q 學(xué)習(xí)的基本搜索算法的運(yùn)行時(shí)間為800 s 左右,子任務(wù)數(shù)為11 時(shí),運(yùn)行時(shí)間波動(dòng)不是很大,子任務(wù)數(shù)為12時(shí),運(yùn)行時(shí)間接近950 s,當(dāng)任務(wù)數(shù)為13時(shí),運(yùn)行時(shí)間接近1 200 s,而本文提出的算法在運(yùn)行時(shí)間上花費(fèi)較少且波動(dòng)不大。原因在于基于Q 學(xué)習(xí)的基本搜索算法在計(jì)算每個(gè)智能體到目標(biāo)任務(wù)的最短路徑之后再選出可以到子目標(biāo)任務(wù)最快的智能體,從而找到能解決目標(biāo)任務(wù)最優(yōu)的智能體集合,故受子任務(wù)數(shù)的影響較大。而本文提出的算法利用了歷史經(jīng)驗(yàn)進(jìn)行任務(wù)分配,僅通過(guò)比對(duì)任務(wù)之間的相似度,將最相似的源任務(wù)的分配方案遷移到目標(biāo)任務(wù)中,故任務(wù)分配的耗時(shí)較少且?guī)缀醪皇茏尤蝿?wù)數(shù)的影響。

    圖3 不同任務(wù)數(shù)的運(yùn)行時(shí)間

    第三組實(shí)驗(yàn)顯示了pt更新公式中不同參數(shù)值的性能比較,結(jié)果如圖4 所示。其中,參數(shù)的范圍值為50 至1 000。

    圖4 不同參數(shù)值的性能比較

    第四組實(shí)驗(yàn)顯示了在學(xué)習(xí)最優(yōu)路徑中,使用遷移學(xué)習(xí)和不使用遷移學(xué)習(xí)的對(duì)比,從第一個(gè)片段和最后一個(gè)片段的平均帶折扣回報(bào)方面進(jìn)行對(duì)比與分析。圖5 顯示了某個(gè)隨機(jī)產(chǎn)生的目標(biāo)子任務(wù)的最優(yōu)路徑學(xué)習(xí)過(guò)程中,使用不帶遷移學(xué)習(xí)和帶遷移學(xué)習(xí)的平均帶折扣回報(bào)的對(duì)比。從圖中可以看出,帶遷移學(xué)習(xí)的算法在初始時(shí)就有比較好的平均帶折扣回報(bào),且在執(zhí)行過(guò)程中,該值都比不使用遷移學(xué)習(xí)要高,這表明本文提出的算法縮短了智能體找到最優(yōu)路徑所需的時(shí)間。

    圖5 子任務(wù)帶遷移與不帶遷移的平均帶折扣回報(bào)

    表2 顯示了一個(gè)目標(biāo)任務(wù)中各子任務(wù)在帶遷移學(xué)習(xí)和不帶遷移學(xué)習(xí)上平均帶折扣回報(bào)的對(duì)比。從表中可以看出,使用遷移學(xué)習(xí)可以在初期給智能體較好的行為指導(dǎo)。其中,[9,6]這個(gè)子任務(wù)在第2 000個(gè)片段的帶遷移平均帶折扣回報(bào)比不帶遷移的低,這是由于在分配任務(wù)階段,分配給的智能體不同而導(dǎo)致的。對(duì)于任務(wù)分配的準(zhǔn)確度問(wèn)題也是以后需要進(jìn)一步研究、改進(jìn)之處。

    表2 帶遷移與不帶遷移的平均帶折扣回報(bào)對(duì)比

    5 總結(jié)與未來(lái)工作

    本文主要研究了多智能體系統(tǒng)中的多任務(wù)分配問(wèn)題。提出了一種基于遷移學(xué)習(xí)的任務(wù)分配機(jī)制。首先將目標(biāo)任務(wù)與源任務(wù)庫(kù)中的任務(wù)進(jìn)行比較,找到與目標(biāo)任務(wù)最相似的源任務(wù),將策略庫(kù)中對(duì)應(yīng)的智能體的分配方案遷移到目標(biāo)任務(wù)中,給目標(biāo)任務(wù)較好的初始化,加速目標(biāo)任務(wù)的分配。本文還利用遷移學(xué)習(xí)加快智能體學(xué)習(xí)最優(yōu)路徑的速度,即將智能體之前處理過(guò)的子任務(wù)的策略遷移到目標(biāo)子任務(wù)的完成上。通過(guò)實(shí)驗(yàn)可以看出,本文提出的算法在運(yùn)行時(shí)間和平均帶折扣回報(bào)上均優(yōu)于基于Q學(xué)習(xí)的任務(wù)分配算法。

    未來(lái)的研究方向包括:首先是要解決魯棒性不夠的問(wèn)題,可從相似度的比較方法方面進(jìn)行改進(jìn);其次,若目標(biāo)任務(wù)的狀態(tài)空間和行為空間產(chǎn)生變化,要如何將源任務(wù)的策略進(jìn)行遷移,如何防止因狀態(tài)空間或行為空間的變化而帶來(lái)的負(fù)遷移情況。

    猜你喜歡
    搜索算法智能目標(biāo)
    改進(jìn)的和聲搜索算法求解凸二次規(guī)劃及線性規(guī)劃
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    我們的目標(biāo)
    基于汽車接力的潮流轉(zhuǎn)移快速搜索算法
    基于逐維改進(jìn)的自適應(yīng)步長(zhǎng)布谷鳥(niǎo)搜索算法
    基于跳點(diǎn)搜索算法的網(wǎng)格地圖尋路
    新目標(biāo)七年級(jí)(下)Unit?。尘毩?xí)(一)
    亚洲欧美日韩高清在线视频| 在线看三级毛片| а√天堂www在线а√下载| 51国产日韩欧美| 国产精品一区二区三区四区免费观看 | 国产高清视频在线观看网站| 99久久无色码亚洲精品果冻| 男女下面进入的视频免费午夜| 亚洲va日本ⅴa欧美va伊人久久| 亚洲人成伊人成综合网2020| 他把我摸到了高潮在线观看| 搞女人的毛片| 女人被狂操c到高潮| 亚洲国产精品sss在线观看| 人人妻人人看人人澡| 嫩草影院新地址| 国产av在哪里看| 欧美日韩瑟瑟在线播放| 在线播放无遮挡| 亚洲电影在线观看av| 草草在线视频免费看| 90打野战视频偷拍视频| 精品无人区乱码1区二区| av在线老鸭窝| 全区人妻精品视频| 丰满人妻一区二区三区视频av| 91久久精品国产一区二区成人| 日本撒尿小便嘘嘘汇集6| 可以在线观看毛片的网站| 在线观看免费视频日本深夜| 久久中文看片网| 女人十人毛片免费观看3o分钟| 国内精品久久久久久久电影| 国产亚洲精品综合一区在线观看| 国产三级中文精品| or卡值多少钱| 99热这里只有是精品在线观看 | 哪里可以看免费的av片| 国产精品一区二区三区四区久久| 久久久久国产精品人妻aⅴ院| 午夜激情福利司机影院| 变态另类丝袜制服| 日韩成人在线观看一区二区三区| 亚洲色图av天堂| 99热精品在线国产| 亚洲天堂国产精品一区在线| 国产单亲对白刺激| 久久草成人影院| 欧美黄色淫秽网站| 91麻豆av在线| 别揉我奶头 嗯啊视频| 免费黄网站久久成人精品 | 亚洲最大成人中文| 亚洲av二区三区四区| 亚洲一区二区三区色噜噜| 免费看a级黄色片| 国产蜜桃级精品一区二区三区| 床上黄色一级片| 免费看美女性在线毛片视频| 色精品久久人妻99蜜桃| 在线免费观看不下载黄p国产 | 中文亚洲av片在线观看爽| 久久中文看片网| 国产精华一区二区三区| 亚洲人成网站高清观看| 神马国产精品三级电影在线观看| 在线观看美女被高潮喷水网站 | 国产高清视频在线播放一区| 我要看日韩黄色一级片| 欧美日韩亚洲国产一区二区在线观看| 欧美激情久久久久久爽电影| 九九久久精品国产亚洲av麻豆| 久久亚洲真实| 久久人妻av系列| 亚洲成人免费电影在线观看| 亚洲内射少妇av| 日韩 亚洲 欧美在线| 波多野结衣巨乳人妻| 91午夜精品亚洲一区二区三区 | 午夜激情福利司机影院| 亚洲无线观看免费| 久久精品国产亚洲av香蕉五月| 免费人成视频x8x8入口观看| 又黄又爽又刺激的免费视频.| 成年女人看的毛片在线观看| 国产精品三级大全| 久久99热6这里只有精品| 日日摸夜夜添夜夜添av毛片 | 国内毛片毛片毛片毛片毛片| 色综合欧美亚洲国产小说| 国语自产精品视频在线第100页| 久久精品国产亚洲av香蕉五月| 中国美女看黄片| 久久国产精品人妻蜜桃| 国产乱人视频| 国产黄色小视频在线观看| 亚洲精品456在线播放app | 久久精品久久久久久噜噜老黄 | 欧美国产日韩亚洲一区| 亚洲 欧美 日韩 在线 免费| 精品久久久久久久久av| 国产单亲对白刺激| 九九在线视频观看精品| 亚洲精品粉嫩美女一区| 蜜桃亚洲精品一区二区三区| 全区人妻精品视频| 国产一区二区在线av高清观看| 久久久久国内视频| 国产大屁股一区二区在线视频| 欧美三级亚洲精品| 丰满乱子伦码专区| 欧美极品一区二区三区四区| 午夜福利在线观看免费完整高清在 | 国产精品精品国产色婷婷| 夜夜夜夜夜久久久久| 好看av亚洲va欧美ⅴa在| 深夜a级毛片| 岛国在线免费视频观看| 精品一区二区三区av网在线观看| 国产精品影院久久| 性色av乱码一区二区三区2| 色综合欧美亚洲国产小说| 日日摸夜夜添夜夜添av毛片 | 18禁黄网站禁片免费观看直播| a级毛片免费高清观看在线播放| 亚洲人与动物交配视频| 9191精品国产免费久久| 亚洲国产精品999在线| 精品免费久久久久久久清纯| 尤物成人国产欧美一区二区三区| 免费在线观看影片大全网站| 88av欧美| 天堂√8在线中文| 亚洲av.av天堂| 婷婷色综合大香蕉| 性色avwww在线观看| 国产精品久久视频播放| 十八禁人妻一区二区| 日韩欧美在线二视频| 两性午夜刺激爽爽歪歪视频在线观看| 亚洲专区中文字幕在线| 男女下面进入的视频免费午夜| 日韩免费av在线播放| 日韩欧美 国产精品| 三级国产精品欧美在线观看| 小说图片视频综合网站| 两性午夜刺激爽爽歪歪视频在线观看| 韩国av一区二区三区四区| 欧美激情国产日韩精品一区| 成人精品一区二区免费| 亚洲av成人精品一区久久| 精品日产1卡2卡| 深爱激情五月婷婷| 岛国在线免费视频观看| 淫秽高清视频在线观看| 一区二区三区免费毛片| 亚洲一区高清亚洲精品| 亚洲在线观看片| 少妇熟女aⅴ在线视频| 日韩人妻高清精品专区| 国产精品,欧美在线| 极品教师在线免费播放| 可以在线观看的亚洲视频| 亚洲三级黄色毛片| 精品一区二区三区人妻视频| 99热只有精品国产| 美女 人体艺术 gogo| 国产探花极品一区二区| 欧美精品国产亚洲| 国产精品久久电影中文字幕| 大型黄色视频在线免费观看| 亚洲五月天丁香| 国产色婷婷99| 午夜福利欧美成人| 国产麻豆成人av免费视频| 天天一区二区日本电影三级| 国产av不卡久久| 性欧美人与动物交配| 一级黄色大片毛片| 日本免费a在线| 国产aⅴ精品一区二区三区波| 中文字幕av成人在线电影| 岛国在线免费视频观看| 看免费av毛片| 久久这里只有精品中国| 一进一出抽搐动态| 欧美日韩综合久久久久久 | 色吧在线观看| 一级av片app| 99视频精品全部免费 在线| 琪琪午夜伦伦电影理论片6080| 亚洲av电影不卡..在线观看| 国产一区二区三区视频了| 欧美性感艳星| 别揉我奶头 嗯啊视频| 在线观看av片永久免费下载| 一区二区三区四区激情视频 | 偷拍熟女少妇极品色| 尤物成人国产欧美一区二区三区| 日韩成人在线观看一区二区三区| 亚洲成人久久爱视频| 国产精品国产高清国产av| 天堂√8在线中文| 中出人妻视频一区二区| 亚洲专区中文字幕在线| 日本一二三区视频观看| 亚洲va日本ⅴa欧美va伊人久久| 88av欧美| 日韩欧美在线二视频| 久久久久久九九精品二区国产| 性色av乱码一区二区三区2| 精品一区二区三区av网在线观看| 国产高清激情床上av| 别揉我奶头~嗯~啊~动态视频| 国产免费男女视频| 九九热线精品视视频播放| 直男gayav资源| 久久欧美精品欧美久久欧美| 精品久久久久久久末码| 亚洲,欧美,日韩| 97超视频在线观看视频| 久久久国产成人精品二区| 国产精品久久久久久久电影| 成人午夜高清在线视频| 欧美高清成人免费视频www| 丰满的人妻完整版| 午夜福利成人在线免费观看| 神马国产精品三级电影在线观看| 给我免费播放毛片高清在线观看| 国产精品野战在线观看| 自拍偷自拍亚洲精品老妇| 亚洲av免费在线观看| 亚洲国产日韩欧美精品在线观看| 精品久久久久久,| 一个人观看的视频www高清免费观看| 97人妻精品一区二区三区麻豆| 一区二区三区激情视频| 国产成年人精品一区二区| 99在线视频只有这里精品首页| 久久久精品大字幕| 又黄又爽又免费观看的视频| 婷婷色综合大香蕉| av视频在线观看入口| 日本三级黄在线观看| 两个人视频免费观看高清| 成人特级黄色片久久久久久久| 日韩欧美 国产精品| 草草在线视频免费看| 一边摸一边抽搐一进一小说| 日韩欧美国产在线观看| 成年女人看的毛片在线观看| 国产一区二区在线av高清观看| 亚洲人成伊人成综合网2020| 熟妇人妻久久中文字幕3abv| 亚洲欧美日韩无卡精品| 岛国在线免费视频观看| 日本在线视频免费播放| 亚洲 欧美 日韩 在线 免费| 亚洲熟妇中文字幕五十中出| 亚洲人成电影免费在线| 色综合婷婷激情| 亚洲电影在线观看av| 一个人免费在线观看的高清视频| 国产精品电影一区二区三区| 欧美黄色片欧美黄色片| 黄色丝袜av网址大全| 亚洲自拍偷在线| 精品一区二区三区视频在线| 全区人妻精品视频| 日本 欧美在线| 欧美+日韩+精品| 亚洲内射少妇av| 级片在线观看| 久久久成人免费电影| 国产亚洲欧美98| 老熟妇仑乱视频hdxx| 中亚洲国语对白在线视频| 日日摸夜夜添夜夜添av毛片 | 亚洲av第一区精品v没综合| 丁香六月欧美| 久久精品影院6| 天堂影院成人在线观看| 久久亚洲精品不卡| 校园春色视频在线观看| 丁香欧美五月| 成人鲁丝片一二三区免费| 亚洲专区中文字幕在线| 国产人妻一区二区三区在| 一级黄色大片毛片| 久久天躁狠狠躁夜夜2o2o| 日本熟妇午夜| 最近中文字幕高清免费大全6 | 激情在线观看视频在线高清| 午夜亚洲福利在线播放| 亚洲国产日韩欧美精品在线观看| or卡值多少钱| 免费人成在线观看视频色| 91麻豆精品激情在线观看国产| 成年女人毛片免费观看观看9| 嫩草影视91久久| 最近在线观看免费完整版| 国产老妇女一区| 欧美成人性av电影在线观看| 天天一区二区日本电影三级| 搡老妇女老女人老熟妇| 两性午夜刺激爽爽歪歪视频在线观看| 免费观看人在逋| 日韩欧美在线乱码| 麻豆国产97在线/欧美| 中文在线观看免费www的网站| 最新中文字幕久久久久| 一卡2卡三卡四卡精品乱码亚洲| 国产野战对白在线观看| 久久99热6这里只有精品| 中文字幕av成人在线电影| 久久久色成人| 亚洲人成网站在线播放欧美日韩| 少妇的逼好多水| 亚洲精品在线美女| 亚洲精品在线美女| 夜夜看夜夜爽夜夜摸| 久久久久久国产a免费观看| 校园春色视频在线观看| 一区二区三区高清视频在线| 超碰av人人做人人爽久久| 国产在线精品亚洲第一网站| 久久精品91蜜桃| 国产免费av片在线观看野外av| 好男人在线观看高清免费视频| 欧美+日韩+精品| 日本免费一区二区三区高清不卡| 欧美成人性av电影在线观看| 校园春色视频在线观看| 国产白丝娇喘喷水9色精品| 一级a爱片免费观看的视频| 天堂动漫精品| 毛片一级片免费看久久久久 | 久久欧美精品欧美久久欧美| 精品久久国产蜜桃| 国产精品美女特级片免费视频播放器| 一本综合久久免费| 嫩草影视91久久| 亚洲最大成人av| 好男人在线观看高清免费视频| 午夜视频国产福利| 国内揄拍国产精品人妻在线| 成人午夜高清在线视频| 亚洲av电影不卡..在线观看| av福利片在线观看| 国产精品爽爽va在线观看网站| 国产精品久久电影中文字幕| 精品国产亚洲在线| 亚洲综合色惰| 免费大片18禁| 欧美黄色淫秽网站| 欧美乱色亚洲激情| 国产午夜精品久久久久久一区二区三区 | 看免费av毛片| 亚洲成人免费电影在线观看| 丰满的人妻完整版| 日韩亚洲欧美综合| 国产午夜精品论理片| 少妇被粗大猛烈的视频| 99riav亚洲国产免费| 国产探花在线观看一区二区| 国产高清视频在线播放一区| 91在线精品国自产拍蜜月| 直男gayav资源| 国产精品乱码一区二三区的特点| 欧美bdsm另类| 婷婷精品国产亚洲av| 日韩欧美国产一区二区入口| 99国产精品一区二区蜜桃av| a级一级毛片免费在线观看| 婷婷色综合大香蕉| 最近在线观看免费完整版| 午夜免费男女啪啪视频观看 | 亚洲国产精品成人综合色| 免费看日本二区| 全区人妻精品视频| 国产精品女同一区二区软件 | 国产精品亚洲av一区麻豆| 精品一区二区三区视频在线观看免费| 男女之事视频高清在线观看| 国内精品久久久久精免费| 一a级毛片在线观看| 无人区码免费观看不卡| 在线a可以看的网站| 美女xxoo啪啪120秒动态图 | 国产高清视频在线观看网站| 人妻久久中文字幕网| ponron亚洲| www.www免费av| 欧美绝顶高潮抽搐喷水| 哪里可以看免费的av片| www.熟女人妻精品国产| 日韩欧美精品v在线| 简卡轻食公司| 激情在线观看视频在线高清| 麻豆国产97在线/欧美| 97超级碰碰碰精品色视频在线观看| 一本综合久久免费| 精品午夜福利在线看| 能在线免费观看的黄片| 成年免费大片在线观看| 亚洲 欧美 日韩 在线 免费| 啪啪无遮挡十八禁网站| 久久久久久久久久成人| 亚洲自偷自拍三级| 午夜久久久久精精品| 一区福利在线观看| 成人鲁丝片一二三区免费| 大型黄色视频在线免费观看| 日本a在线网址| 国产精品不卡视频一区二区 | 精品人妻熟女av久视频| 亚洲电影在线观看av| 在线观看午夜福利视频| 黄色配什么色好看| 黄色视频,在线免费观看| 看片在线看免费视频| 亚洲美女视频黄频| 国产亚洲欧美98| 又黄又爽又免费观看的视频| 五月玫瑰六月丁香| 色综合欧美亚洲国产小说| 国产三级中文精品| a在线观看视频网站| 欧美乱色亚洲激情| 少妇的逼好多水| 中文在线观看免费www的网站| 五月伊人婷婷丁香| 18禁黄网站禁片午夜丰满| 久久香蕉精品热| 亚洲欧美日韩卡通动漫| 日日摸夜夜添夜夜添av毛片 | 琪琪午夜伦伦电影理论片6080| 国产精品久久久久久久久免 | 亚洲欧美日韩高清专用| 国产精品影院久久| 亚洲avbb在线观看| 五月玫瑰六月丁香| 在线播放无遮挡| av视频在线观看入口| 一级黄色大片毛片| 简卡轻食公司| 成人三级黄色视频| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 久久亚洲真实| 亚洲国产高清在线一区二区三| 麻豆国产av国片精品| 久久久久亚洲av毛片大全| 特大巨黑吊av在线直播| 亚洲激情在线av| 可以在线观看毛片的网站| 18禁在线播放成人免费| 欧美最新免费一区二区三区 | av福利片在线观看| 成人av在线播放网站| 午夜影院日韩av| 欧美高清性xxxxhd video| 久久久久久久久久黄片| 免费av观看视频| 99国产精品一区二区蜜桃av| 国产一级毛片七仙女欲春2| 热99re8久久精品国产| 精品人妻视频免费看| 丰满人妻熟妇乱又伦精品不卡| 深夜精品福利| 亚洲国产日韩欧美精品在线观看| 免费搜索国产男女视频| 亚洲中文字幕一区二区三区有码在线看| 国产成人av教育| av国产免费在线观看| 亚洲天堂国产精品一区在线| 久久久久久久午夜电影| 日韩精品中文字幕看吧| 日韩亚洲欧美综合| 日韩成人在线观看一区二区三区| 天堂影院成人在线观看| 90打野战视频偷拍视频| 国产乱人伦免费视频| 亚洲成av人片免费观看| av天堂在线播放| 免费黄网站久久成人精品 | 亚洲,欧美,日韩| 精品久久久久久久末码| 大型黄色视频在线免费观看| 一卡2卡三卡四卡精品乱码亚洲| 美女高潮喷水抽搐中文字幕| 久久久久免费精品人妻一区二区| 亚洲精品影视一区二区三区av| 每晚都被弄得嗷嗷叫到高潮| 中出人妻视频一区二区| 日本精品一区二区三区蜜桃| 欧美+日韩+精品| 国产成人影院久久av| 97碰自拍视频| 久久伊人香网站| 少妇的逼好多水| 欧美绝顶高潮抽搐喷水| 给我免费播放毛片高清在线观看| 日本与韩国留学比较| 黄色丝袜av网址大全| 国产一区二区亚洲精品在线观看| 天天一区二区日本电影三级| 在现免费观看毛片| 深夜a级毛片| av在线老鸭窝| 免费大片18禁| 久久精品91蜜桃| 日本黄色片子视频| 丰满人妻一区二区三区视频av| 99久久99久久久精品蜜桃| 毛片一级片免费看久久久久 | 91av网一区二区| 又黄又爽又刺激的免费视频.| 乱人视频在线观看| 小说图片视频综合网站| 久久久久性生活片| 国产欧美日韩一区二区三| 国产伦精品一区二区三区四那| 两个人视频免费观看高清| 日本黄大片高清| 国产精品伦人一区二区| 亚洲18禁久久av| 一本综合久久免费| 久久九九热精品免费| 亚洲经典国产精华液单 | 美女免费视频网站| 十八禁国产超污无遮挡网站| 国内毛片毛片毛片毛片毛片| 久久精品91蜜桃| 亚洲一区高清亚洲精品| 深夜精品福利| 两性午夜刺激爽爽歪歪视频在线观看| 国产亚洲av嫩草精品影院| 亚洲自拍偷在线| 亚洲人成网站高清观看| 亚洲av第一区精品v没综合| 不卡一级毛片| 色综合欧美亚洲国产小说| 少妇的逼好多水| 日韩精品中文字幕看吧| 可以在线观看的亚洲视频| 亚洲片人在线观看| 久久久久久久久中文| 国模一区二区三区四区视频| 波多野结衣高清无吗| 精品久久久久久久久久久久久| 欧美黑人欧美精品刺激| 成人一区二区视频在线观看| 一个人免费在线观看的高清视频| 欧美绝顶高潮抽搐喷水| 精品一区二区三区视频在线观看免费| 欧美乱妇无乱码| 久久精品人妻少妇| 亚洲第一欧美日韩一区二区三区| 97人妻精品一区二区三区麻豆| 精品99又大又爽又粗少妇毛片 | av国产免费在线观看| 精品日产1卡2卡| 宅男免费午夜| 亚洲av成人精品一区久久| 精品午夜福利在线看| 成人一区二区视频在线观看| 嫩草影院精品99| 亚洲欧美日韩东京热| 免费搜索国产男女视频| 在线观看66精品国产| 1024手机看黄色片| 成人国产一区最新在线观看| 欧美丝袜亚洲另类 | 无遮挡黄片免费观看| 亚洲欧美精品综合久久99| 精品一区二区免费观看| 欧美一级a爱片免费观看看| 色综合站精品国产| 成人永久免费在线观看视频| 毛片一级片免费看久久久久 | 亚洲,欧美,日韩| 欧美黑人巨大hd| 亚洲第一区二区三区不卡| 51国产日韩欧美| 亚洲真实伦在线观看| 91麻豆av在线| 久久久成人免费电影| 日韩大尺度精品在线看网址| 欧美一区二区国产精品久久精品| 日日摸夜夜添夜夜添av毛片 | 国产亚洲精品久久久com| 国产爱豆传媒在线观看| 首页视频小说图片口味搜索| 国产高清激情床上av| 欧美一级a爱片免费观看看| 露出奶头的视频| 又黄又爽又免费观看的视频| 嫁个100分男人电影在线观看| 一进一出抽搐gif免费好疼| 国产69精品久久久久777片| 国产高清激情床上av| 怎么达到女性高潮| 一级毛片久久久久久久久女| 欧美最新免费一区二区三区 | 在线播放无遮挡| 性插视频无遮挡在线免费观看| 国产午夜福利久久久久久| 国产日本99.免费观看| 国产精品av视频在线免费观看| 午夜精品一区二区三区免费看| h日本视频在线播放| av视频在线观看入口| 亚洲国产高清在线一区二区三| 亚洲人成电影免费在线| 18禁黄网站禁片免费观看直播|