• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多智能體強(qiáng)化學(xué)習(xí)的多無人機(jī)邊緣計算任務(wù)卸載

    2023-12-15 08:35:22
    無線電工程 2023年12期
    關(guān)鍵詞:動作智能優(yōu)化

    李 斌

    (1.南京信息工程大學(xué) 計算機(jī)學(xué)院,江蘇 南京 210044;2.南京信息工程大學(xué) 江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044)

    0 引言

    移動邊緣計算(Mobile Edge Computing,MEC)技術(shù)能有效緩解資源受限設(shè)備執(zhí)行密集型應(yīng)用的壓力,可提高網(wǎng)絡(luò)的應(yīng)用體驗[1-2]。在臨時部署通信服務(wù)的偏遠(yuǎn)地區(qū)或聚集活動熱點地區(qū)等通信條件較差的場景,地面固定式通信設(shè)施難以提供較好的服務(wù)。利用無人機(jī)(UAV)高機(jī)動性、易部署和立體式增強(qiáng)覆蓋等優(yōu)勢,將UAV與MEC相融合可以提供泛在的接入服務(wù)和高質(zhì)量的計算服務(wù)[3-4]。

    如今,UAV輔助MEC網(wǎng)絡(luò)成為了學(xué)術(shù)界和工業(yè)界的研究熱點,然而各類參數(shù)及用戶服務(wù)需求時刻發(fā)生著變化[5]。深度強(qiáng)化學(xué)習(xí)(Deep-Reinforcement Learning,DRL)作為人工智能的一種新興技術(shù),通過與環(huán)境不斷交互學(xué)習(xí)、積累經(jīng)驗,從而尋求最優(yōu)策略[6]。相較于離線求解及迭代算法,采用經(jīng)過訓(xùn)練的DRL策略能實時地求解系統(tǒng)的能耗與時延等優(yōu)化問題[7]。為了適應(yīng)動態(tài)變化的網(wǎng)絡(luò)狀態(tài)與環(huán)境,結(jié)合DRL方法能夠?qū)崟r進(jìn)行決策的優(yōu)勢,研究人員提出了一系列高效的資源管控優(yōu)化算法。針對兩層UAV網(wǎng)絡(luò)架構(gòu),文獻(xiàn)[8]結(jié)合深度Q網(wǎng)絡(luò)(Deep Q Network,DQN)與深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG),設(shè)計了一種DRL訓(xùn)練框架,以優(yōu)化UAV軌跡與虛擬機(jī)配置,進(jìn)而有效地降低系統(tǒng)時延。文獻(xiàn)[9]利用智能反射面的通信輔助能力,使用DDPG與雙深度Q網(wǎng)絡(luò)(Double Deep Q Network,DDQN)協(xié)同優(yōu)化網(wǎng)絡(luò)資源以提高UAV邊緣計算的能效。為提升移動用戶群組的服務(wù)體驗,文 獻(xiàn)[10]通過聚類算法設(shè)計UAV動態(tài)部署,并采用DDPG方法優(yōu)化服務(wù)關(guān)聯(lián),從而降低了系統(tǒng)能耗。文獻(xiàn)[11]考慮了多任務(wù)調(diào)度問題,根據(jù)信道狀態(tài)、任務(wù)請求等信息以最小化加權(quán)信息年齡,設(shè)計了一種基于近端策略優(yōu)化(Proximal Policy Optimization,PPO)的DRL算法。然而,DDQN、DDPG和PPO等單智能體DRL算法不能很好地應(yīng)對當(dāng)網(wǎng)絡(luò)規(guī)模較大時所帶來的狀態(tài)空間及動作空間維數(shù)過高的問題。

    在實際場景中,多個移動用戶(Mobile User,MU)和多個邊緣服務(wù)器通常部署在不同的位置,易于利用分布式算法進(jìn)行訓(xùn)練與決策。同時,多智能體強(qiáng)化學(xué)習(xí)(Multi-Agent Reinforcement Learning,MARL)方法能較好地適應(yīng)MEC的分布式結(jié)構(gòu)。相比于單智能體DRL,MARL能夠減小狀態(tài)空間與動作空間,并可高效地做出決策。鑒于此,文獻(xiàn)[12]面向多UAV邊緣計算,利用MARL方法較好地解決了負(fù)載均衡問題。文獻(xiàn)[13]利用多智能體確定性深度策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)方法實時優(yōu)化多UAV軌跡,最大化計算服務(wù)的公平性。文獻(xiàn)[14]面向多UAV網(wǎng)絡(luò)中的隱私問題,利用多智能體聯(lián)邦學(xué)習(xí)進(jìn)行分布式訓(xùn)練,達(dá)到了與MARL接近的效果。雖然上述工作應(yīng)用了MARL的分布式結(jié)構(gòu),但尚未充分利用不同設(shè)備的功能,缺乏多類型設(shè)備、異構(gòu)智能體協(xié)作優(yōu)化MEC服務(wù)的研究。同時,上述工作存在服務(wù)質(zhì)量不穩(wěn)定、算法訓(xùn)練速度慢和UAV軌跡曲折難以實現(xiàn)等問題。

    基于此,本文考慮到任務(wù)分布式卸載的特點,采用多智能體近端策略優(yōu)化(Multi-Agent Proximal Policy Optimization,MAPPO)方法,并在MARL算法引入了Beta分布以及注意力機(jī)制以提升算法的性能,加快算法的收斂速度,從而有效降低MEC服務(wù)的開銷。本文的主要工作有如下三方面:

    ① 研究了多架UAV輔助MEC的系統(tǒng)模型,綜合考慮MU的移動性、任務(wù)生成的隨機(jī)性和多UAV之間的安全距離,建立了MU和UAV的加權(quán)能耗最小化問題。該問題具有高動態(tài)特征,對優(yōu)化實時性和規(guī)模擴(kuò)展性提出了更高的要求。

    ② 設(shè)計了一種異構(gòu)MARL方法,通過構(gòu)建含有3種智能體的系統(tǒng),基于MAPPO算法訓(xùn)練MU和UAV協(xié)同完成卸載決策與資源分配。該分布式?jīng)Q策方法能分解較大的環(huán)境狀態(tài)與動作空間,并將決策能力下沉到各類設(shè)備,提高算法的可擴(kuò)展性。

    ③ 在Actor網(wǎng)絡(luò)輸出層使用Beta分布以提高動作的探索效率和采樣性能,并向Critic網(wǎng)絡(luò)中引入注意力機(jī)制以提高M(jìn)ARL方法的值函數(shù)擬合性能。提出了基于MAPPO的能耗最小化任務(wù)卸載方法(Energy-efficient-Attention-Beta-MAPPO,E-ABMAPPO),該方法具有較快的收斂性,且系統(tǒng)性能優(yōu)于基準(zhǔn)方法。

    1 系統(tǒng)模型及問題描述

    本文考慮一種多UAV輔助的MEC系統(tǒng)模型,如圖1所示。在該系統(tǒng)中,MU需要將產(chǎn)生的計算任務(wù)卸載到UAV邊緣服務(wù)器進(jìn)行計算。此系統(tǒng)模型有 1個地面控制中心,M架搭載邊緣服務(wù)器的UAV為K個MU提供任務(wù)卸載服務(wù)。為便于表達(dá)和分析,定義MU的集合為?{1,2,…,K},UAV集合為?{1,2,…,M}。此外,地面控制中心需要借助UAV收集通信鏈路信道信息、MU的服務(wù)需求等系統(tǒng)狀態(tài),進(jìn)而對邊緣網(wǎng)絡(luò)進(jìn)行即時管控。

    (1)

    式中:amax為UAV的最大加速度,vmax為UAV最大飛行速度,dmin為UAV之間的最小安全距離。

    假設(shè)MU初始隨機(jī)分布,且按照Gauss-Markov模型隨機(jī)移動[15]。在時隙n內(nèi),MUk的速度大小vk[n]和移動的方向角度θk[n]可表示為:

    (2)

    (3)

    (4)

    (5)

    1.1 計算模型

    (6)

    ① 本地計算:為了充分利用MU有限的計算資源并最小化能耗開銷,本地計算將采用動態(tài)電壓頻率縮放技術(shù)以給出計算頻率。在最大計算頻率限制下,本地計算頻率可表示為:

    (7)

    (8)

    ② 邊緣計算:MU可以將自身計算任務(wù)卸載至所關(guān)聯(lián)UAV邊緣服務(wù)器進(jìn)行處理,具體過程如下:

    首先,UAV需要分配通信信道的帶寬資源以接收來自MU的任務(wù)數(shù)據(jù)??紤]到大尺度衰落和小尺度衰落,則在時隙n內(nèi)UAVm和MUk之間的信道增益可表示為:

    (9)

    (10)

    (11)

    當(dāng)MU請求將任務(wù)卸載至UAV之后,UAV需分配其計算資源,完成任務(wù)的處理。記UAVm可用的計算頻率為fm,UAVm在時隙n內(nèi)為MUk分配的計算資源為fm,k[n]。由此,其滿足約束:

    (12)

    (13)

    綜上所述,MUk的任務(wù)計算時延需滿足的約束可以表示為:

    (14)

    式中:bk,m為帶寬分配系數(shù),B為帶寬,σ2為噪聲功率。

    1.2 能耗模型

    定義MU和UAV服務(wù)器上CPU的有效電容系數(shù)為κ,則MUk的計算能耗和傳輸能耗分別為:

    (15)

    (16)

    由上述分析可知,在時隙n內(nèi),MUk的總能耗為:

    (17)

    根據(jù)文獻(xiàn)[17],UAVm在時隙n內(nèi)的飛行能耗可表示為:

    (18)

    式中:P0為UAVm懸停狀態(tài)下型阻功率,Pi為UAV懸停狀態(tài)下的誘導(dǎo)功率,v0為UAV懸停下的平均旋翼誘導(dǎo)速度,d0為機(jī)身阻力比,s為總?cè)~片面積與葉片掃過面積之比,ρ0為空氣密度,A為UAV葉片掃過的面積。UAVm的計算能耗為:

    (19)

    2 優(yōu)化問題描述

    (20)

    式中:?1、?2、η為能耗權(quán)重因子,∏(·)為指示函數(shù),當(dāng)條件(·)為真時值為1,否則值為0;約束條件C1~C4表示UAV的飛行軌跡,約束條件C5表示卸載關(guān)聯(lián)因子取值,約束條件C6表示每個MU至多選擇一個UAV卸載,約束條件C7~C8表示UAV帶寬資源與計算資源分配限制,約束條件C9為任務(wù)的時延約束,約束條件C10限制了任務(wù)劃分系數(shù)的范圍,約束條件C11~C12限制了UAV劃分給MU的資源,C13保證了資源分配的有效性,避免不進(jìn)行任務(wù)卸載的用戶空占計算資源。

    由于MU的隨機(jī)移動性、卸載關(guān)聯(lián)的離散性以及非凸約束,上述問題不僅僅是一個多變量耦合的非凸組合優(yōu)化問題,更是一個需要實時決策的優(yōu)化問題。DRL作為一種自適應(yīng)的機(jī)器學(xué)習(xí)方法,可以從環(huán)境中不斷采樣學(xué)習(xí),并訓(xùn)練得到能部署在設(shè)備上的深度策略模型,從而根據(jù)當(dāng)前狀態(tài),做出符合長期效益的實時決策,因此適應(yīng)于所研究的MEC任務(wù)卸載場景。

    3 基于MAPPO的優(yōu)化問題求解

    3.1 MDP模型

    問題(20)需要聯(lián)合優(yōu)化多個MU以及多個UAV的決策信息,并且MU以及UAV在服務(wù)過程上存在協(xié)作關(guān)系,在計算和通信資源上存在競爭關(guān)系??紤]到該問題具有分布式特征,可將其建模為由多個智能體構(gòu)成的MDP模型。根據(jù)決策變量與目標(biāo)函數(shù)的相關(guān)性以及部署位置的差異,將MU作為一種智能體,將UAV分解為2種智能體:UAV資源分配智能體與UAV軌跡優(yōu)化智能體,因此所提出的MDP模型共有3種智能體參與。

    ① MU智能體:MU的基本要素包括觀測ok(t)、動作ak(t)和獎勵rk(t),具體如下:

    (21)

    動作:MU的決策涉及卸載關(guān)聯(lián)α和任務(wù)劃分系數(shù)ρ,每個MU需要選擇關(guān)聯(lián)的UAV,決定其任務(wù)劃分系數(shù)。因此MU智能體k的動作由下式給出:

    (22)

    獎勵:從協(xié)作性角度,UAV的能耗負(fù)擔(dān)需要為所有關(guān)聯(lián)的MU所知。從針對性角度,需要考慮每個MU自身能耗開銷對總加權(quán)能耗的貢獻(xiàn),以及自身不滿足時延要求的懲罰。因此,每個MU的獎勵應(yīng)該綜合考慮MU本身和所關(guān)聯(lián)UAV的能耗,每個MU的獎勵由下式給出:

    (23)

    式中:mk為MUk所關(guān)聯(lián)的UAV。

    MUk不滿足時延要求時的懲罰函數(shù)為:

    (24)

    式中:χt為懲罰系數(shù)。

    ② UAV資源分配智能體:每個UAV需要在MU給出卸載關(guān)聯(lián)因子及卸載量后做出決策。因此,其MDP基本要素表述如下

    oK+m(t)?{qm[n],q-m[n],Ωk[n],wk[n],ρk[n],?k∈}。

    (25)

    動作:UAV收到MU請求后,需要根據(jù)用戶任務(wù)請求、位置等信息分配帶寬和計算資源。因此,UAV資源分配智能體m的動作為:

    aK+m(t)?{bm,k[n],fm,k[n]/fm,?k∈}。

    (26)

    獎勵:接收MU的計算任務(wù)后,UAV從環(huán)境中獲得獎勵。作為服務(wù)提供者,每個UAV的獎勵需要考慮自身開銷和所服務(wù)的MU的能耗,在未滿足用戶時延需求時需要給出一定的懲罰,可以設(shè)計得到UAV獎勵函數(shù)如下:

    (27)

    ③ UAV軌跡優(yōu)化智能體:UAV已經(jīng)獲取了有價值的狀態(tài)信息,UAV軌跡優(yōu)化智能體與UAV資源分配智能體可以共享觀測,即oK+M+m(t)=oK+m(t)。其動作與獎勵如下:

    動作:UAV軌跡優(yōu)化智能體m需要給出UAVm的移動狀態(tài),通過水平加速度變量控制軌跡變化,其動作為:

    aK+M+m(t)?{am[n]}。

    (28)

    獎勵:為獲得優(yōu)化效果更好的軌跡,可通過設(shè)計更加具有反饋意義的獎勵函數(shù),進(jìn)而提高動作與目標(biāo)函數(shù)的相關(guān)性。當(dāng)無人機(jī)嘗試飛出服務(wù)范圍時,需要給出一定懲罰,因此該種智能體的獎勵可設(shè)置為:

    Po(qm[n+1]),

    (29)

    式中:dk,m[n′]表示MUk與UAVm在時隙n′的水平距離。上式反映了各個UAV與所服務(wù)MU的當(dāng)前移動平均距離的最大值,以盡可能兼顧到所服務(wù)的MU,并促使UAV共同協(xié)作,且UAV試圖飛出寬度為W的正方形服務(wù)區(qū)域時給出的懲罰函數(shù)為:

    (30)

    式中:χo為懲罰系數(shù)。假設(shè)當(dāng)UAV智能體輸出的動作會導(dǎo)致UAV飛出邊界或發(fā)生碰撞時,該動作無效,UAV將會保持在當(dāng)前位置。

    3.2 基于MAPPO的任務(wù)卸載算法

    與基于值的DRL方法不同,MAPPO是一種基于策略的方法[18],每個智能體由Actor網(wǎng)絡(luò)、Critic網(wǎng)絡(luò)和經(jīng)驗緩存區(qū)組成,能通過作為策略的Actor網(wǎng)絡(luò)直接輸出動作得到?jīng)Q策變量,因此MU和UAV可以將預(yù)訓(xùn)練的Actor網(wǎng)絡(luò)部署到本地,并行地進(jìn)行分布式?jīng)Q策。

    (32)

    (33)

    式中:ξi為Critic網(wǎng)絡(luò)i的參數(shù)。因此,Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)分別根據(jù)式(31)和式(33)更新。

    3.3 E-ABMAPPO訓(xùn)練框架

    本文所提出的E-ABMAPPO訓(xùn)練框架如圖2所示,MU和UAV根據(jù)其智能體的Actor網(wǎng)絡(luò)所給出的動作執(zhí)行任務(wù)卸載,UAV與地面控制中心同步收集狀態(tài)、動作等經(jīng)驗組成部分以及系統(tǒng)狀態(tài)。隨后,地面控制中心通過各智能體的觀測獲得全局環(huán)境狀態(tài),計算獎勵值,將經(jīng)驗存入智能體的緩沖區(qū),并獲得預(yù)測值。在更新Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)后,Actor網(wǎng)絡(luò)的參數(shù)被下載到UAV和MU。

    圖2 E-ABMAPPO算法訓(xùn)練框架Fig.2 Training framework of E-ABMAPPO algorithm

    為了充分挖掘MAPPO的性能,并加速其收斂,本文在訓(xùn)練中引入了Beta分布和注意力機(jī)制,具體方式如下:

    ① 基于Beta分布策略的Actor網(wǎng)絡(luò):MEC場景中的決策變量通常是連續(xù)且有界的,因此智能體輸出的動作應(yīng)盡可能滿足此條件。由于Gaussian分布無界,通過強(qiáng)制截斷輸出動作的越界值將會導(dǎo)致邊界效應(yīng),將不可避免地引入策略梯度的估計偏差[19]。為了緩解Gaussian分布策略的邊界效應(yīng)影響,本文在策略網(wǎng)絡(luò)的輸出層使用Beta分布替換Gaussian分布。Beta概率分布密度由下式給出:

    (34)

    式中:Γ(·)為Gamma函數(shù),α和β為Beta分布的參數(shù)。式(34)有界,可以減小截斷Gaussian分布帶來的策略梯度估計誤差,因此適合對有界動作進(jìn)行采樣。

    ② 具有注意力機(jī)制的Critic網(wǎng)絡(luò):對于簡單全連接層的Critic網(wǎng)絡(luò)而言,大量的狀態(tài)輸入會導(dǎo)致所需的模型復(fù)雜度快速升高,從而導(dǎo)致Critic網(wǎng)絡(luò)的收斂緩慢或者難以收斂,對Actor網(wǎng)絡(luò)的動作造成消極影響。本文在Critic網(wǎng)絡(luò)的多層感知器(Multilayer Perceptron,MLP)之前引入了多頭注意力單元,以提高模型訓(xùn)練的收斂性能。對于同種類型智能體的Critic網(wǎng)絡(luò),首先接受所有智能體的觀測向量,將每種智能體的觀測向量分別通過MU和UAV的MLP狀態(tài)編碼器,獲得特征值ei。然后將所有智能體的特征值ei作為qi、ki、vi輸入其多頭注意力單元,以獲得各注意力值xi,具體計算如下:

    (35)

    (36)

    基于上述討論,本文建立了E-ABMAPPO的訓(xùn)練框架,其算法實現(xiàn)過程如算法1所示。

    算法1 基于E-ABMAPPO訓(xùn)練框架的聯(lián)合優(yōu)化算法輸入:最大回合數(shù)Epmax,回合長度epl,PPO更新次數(shù)PE,折扣因子γ,PPO截斷因子,GAE參數(shù)λ輸出:訓(xùn)練后各智能體的Actor網(wǎng)絡(luò)與Critic網(wǎng)絡(luò)1. 初始化各類神經(jīng)網(wǎng)絡(luò)模型參數(shù),設(shè)置n=1,構(gòu)建訓(xùn)練環(huán)境; 2. FOR Episode,1≤Episode≤Epmax DO3. FOR t,1≤t≤epl DO4. MU智能體從環(huán)境中獲得觀測ok(t),?k∈;5. 執(zhí)行動作ak(t),?k∈;6. UAV資源分配智能體和UAV軌跡優(yōu)化智能體從環(huán)境中獲得觀測oK+m(t),oK+M+m(t),?m∈;7. 地面控制中心收集系統(tǒng)狀態(tài)與經(jīng)驗信息,評估獎勵ri(t),?i∈;8. 將經(jīng)驗 Tri(t)={oi(t),ai(t),ri(t),s(t)},?i∈放入地面控制中心經(jīng)驗緩存區(qū)Bi中;9. IF n=N THEN10. 重置訓(xùn)練環(huán)境;

    11. END IF12. n←n mod N+1;13. END FOR14. FOR epoch,1≤epoch≤PE DO15. FOR agents i∈DO16. 根據(jù)式(31)更新Actor網(wǎng)絡(luò)參數(shù)θi17. 根據(jù)式(33)更新Critic網(wǎng)絡(luò)參數(shù)ξi;18. END FOR19. END FOR20. END FOR

    4 仿真結(jié)果與分析

    本節(jié)首先對實驗平臺及實驗參數(shù)進(jìn)行簡單說明,然后驗證了所提算法的收斂性。在此基礎(chǔ)上,針對不同的網(wǎng)絡(luò)資源狀況與場景進(jìn)行了詳細(xì)的性能實驗與評估,并與基線算法進(jìn)行了對比分析。

    4.1 參數(shù)設(shè)置

    本實驗的仿真環(huán)境使用Python 3.7與PyTorch 1.11.0進(jìn)行編寫。本實驗中設(shè)置的默認(rèn)用戶數(shù)量K為30,無人機(jī)數(shù)量M為5,總帶寬B為15 MHz,任務(wù)量大小Dk[n]∈[0.5,1.5]Mb,單位比特平均計算量大小Ck[n]∈[800,1 200] cycles/b,時延約束tk[n]∈[0.7,1.0]s,權(quán)重因子設(shè)置為η=1,?1=0.001,?2=0.1?1。對于所提算法,各種智能體的策略共享Actor網(wǎng)絡(luò)參數(shù),使用GAE計算優(yōu)勢函數(shù);考慮到獎勵值有界,不使用值歸一化方法。其余實驗參數(shù)與算法參數(shù)結(jié)合文獻(xiàn)[12,20]進(jìn)行設(shè)置,如表1所示。

    表1 相關(guān)參數(shù)設(shè)置Tab.1 Parameter setting

    為評價E-ABMAPPO方法中各智能體獎勵的收斂性,2種基準(zhǔn)MARL算法描述如下:

    ① MAPPO:該方法為不使用Beta分布-注意力機(jī)制改進(jìn)方法的原始MAPPO算法,其獎勵函數(shù)、動作和狀態(tài)空間與所提算法相同[21]。

    ② MADDPG(Multi-Agent Deep Deterministic Policy Gradient):該方法與MAPPO都是目前較為主流和可靠的MARL算法[7]。它由雙Actor網(wǎng)絡(luò)與雙Critic網(wǎng)絡(luò)構(gòu)成,其中Actor網(wǎng)絡(luò)的輸出即為動作值,之后加以一定探索噪聲,Critic用于擬合動作值函數(shù)。

    4.2 數(shù)值分析

    本文對比了MU智能體和UAV資源分配智能體如圖3和圖4所示。從圖3可以看出,對于MU智能體,所提E-ABMAPPO方法于4×104步左右收斂,收斂速度最快;MAPPO方法于8×104步左右收斂,而MADDPG方法收斂最慢,過程較為曲折,且所提算法獲得的獎勵最高,MAPPO次之,MADDPG最低。由此可以推斷出,注意力機(jī)制能使MU在評價狀態(tài)時關(guān)注更利于自身卸載的UAV,加速了算法的收斂性。此外,MADDPG探索策略的不足導(dǎo)致其收斂較慢或局部最優(yōu)收斂。從圖4可以觀察到,所提算法在初期探索階段前25×103步的獎勵上升速度略快,在5×104步出現(xiàn)收斂,最后得到的獎勵在-0.30左右。此外,可以看出在UAV資源分配智能體的訓(xùn)練上,所提方法與MAPPO方法訓(xùn)練速度仍然高于MADDPG。由此可見,基于MAPPO的方法探索環(huán)境的效率更高,且Beta分布能依據(jù)自身特性進(jìn)一步提升探索—學(xué)習(xí)這一過程的速度與性能。

    圖3 MU智能體獎勵值收斂性Fig.3 Convergence of MU agent reward

    圖4 UAV資源分配智能體獎勵值收斂性Fig.4 Convergence of UAV resource allocation agent reward

    圖5展示了UAV的飛行軌跡情況??梢杂^察到,當(dāng)UAV起點隨機(jī)分布在區(qū)域內(nèi)時,UAV能夠保持在用戶密集區(qū)提供服務(wù),通過快速移動以盡可能顧及到更多的用戶,當(dāng)所服務(wù)用戶在某一區(qū)域內(nèi)時,通過盤旋以保持速率。為此,采用加速度作為決策變量能使軌跡平滑,更能應(yīng)用于實際場景,UAV軌跡優(yōu)化智能體學(xué)習(xí)到了一定的相互協(xié)作能力,通過部署到各個區(qū)域在空間上分配計算資源,提高M(jìn)U的服務(wù)質(zhì)量。

    圖5 UAV飛行軌跡情況Fig.5 Trajectories of UAVs

    圖6對比了4種算法在不同任務(wù)量大小下的性能。任務(wù)量大小從1 Mb 增大至2 Mb 時,所提方法的MU平均加權(quán)能耗最低,在0.13~0.24 J,隨機(jī)算法最高,在0.27~0.53 J。相比于MAPPO和MADDPG,所提算法用戶平均加權(quán)能耗分別降低了 22.5%~31.6%和33.5%~45.8%,相對于隨機(jī)算法降低了43.7%以上。由此可見,MAPPO搜索到的策略優(yōu)于MADDPG。這驗證了Beta分布與注意力機(jī)制的使用能夠提升MAPPO算法搜索到的策略質(zhì)量,從而進(jìn)一步提升MU的服務(wù)質(zhì)量。

    圖6 不同任務(wù)量下算法性能對比Fig.6 Performance comparison under different tasks

    5 結(jié)束語

    本文提出了一種CTDE的無人機(jī)輔助MEC任務(wù)卸載方法,以降低移動用戶與無人機(jī)的總能耗,提高邊緣計算網(wǎng)絡(luò)的可靠性。特別地,利用MARL方法解決了集中式執(zhí)行的DRI算法不適于應(yīng)對分布式、具有連續(xù)變量和離散變量的混合動作空間的難點,提出了針對不同智能體的特性進(jìn)行獎勵值設(shè)計,并將Beta分布與注意力機(jī)制引入MAPPO方法以提升探索能力與收斂性能。進(jìn)行了仿真實驗,將E-ABMAPPO與其他基準(zhǔn)方法進(jìn)行了對比,并分析了所提方法的性能。實驗結(jié)果表明,E-ABMAPPO方法能夠有效降低移動用戶與無人機(jī)的加權(quán)能耗,驗證了本文方法的有效性。未來工作將考慮多無人機(jī)協(xié)作與地面基站相結(jié)合的多層次邊緣計算網(wǎng)絡(luò),設(shè)計無人機(jī)的飛行軌跡和協(xié)同計算卸載策略,以取得更好的系統(tǒng)性能。

    猜你喜歡
    動作智能優(yōu)化
    超限高層建筑結(jié)構(gòu)設(shè)計與優(yōu)化思考
    民用建筑防煙排煙設(shè)計優(yōu)化探討
    關(guān)于優(yōu)化消防安全告知承諾的一些思考
    一道優(yōu)化題的幾何解法
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    動作描寫要具體
    畫動作
    18禁黄网站禁片免费观看直播| 一进一出抽搐动态| 十八禁国产超污无遮挡网站| 在线天堂最新版资源| av国产免费在线观看| 欧美性猛交黑人性爽| 禁无遮挡网站| 又爽又黄a免费视频| 不卡视频在线观看欧美| 男女啪啪激烈高潮av片| a级毛片a级免费在线| 午夜精品久久久久久毛片777| 老师上课跳d突然被开到最大视频| 欧美激情久久久久久爽电影| www日本黄色视频网| av在线天堂中文字幕| 99精品久久久久人妻精品| 日本三级黄在线观看| 欧美高清成人免费视频www| 伊人久久精品亚洲午夜| 亚洲第一区二区三区不卡| 亚洲 国产 在线| 色在线成人网| 长腿黑丝高跟| 好男人在线观看高清免费视频| 乱码一卡2卡4卡精品| 免费无遮挡裸体视频| 97人妻精品一区二区三区麻豆| av在线天堂中文字幕| 99热6这里只有精品| 美女被艹到高潮喷水动态| 国产视频一区二区在线看| 国产 一区精品| 免费看美女性在线毛片视频| 国产精品伦人一区二区| 成年版毛片免费区| 男人舔女人下体高潮全视频| 久久午夜福利片| 人妻久久中文字幕网| 看黄色毛片网站| 日韩人妻高清精品专区| 乱人视频在线观看| 亚洲欧美精品综合久久99| 国产精品99久久久久久久久| 国产不卡一卡二| 日本a在线网址| 又爽又黄无遮挡网站| 欧美日本视频| 搡老岳熟女国产| 欧美日韩乱码在线| 亚洲国产精品久久男人天堂| 国产精品久久久久久久电影| 国产一区二区在线av高清观看| 99在线视频只有这里精品首页| 午夜精品一区二区三区免费看| 日韩中文字幕欧美一区二区| 久久精品综合一区二区三区| 狂野欧美白嫩少妇大欣赏| 欧美最黄视频在线播放免费| 午夜免费成人在线视频| 久久6这里有精品| 一级av片app| 国产午夜精品论理片| 成人国产一区最新在线观看| 亚洲国产欧美人成| 国产麻豆成人av免费视频| 久久久精品大字幕| 精品一区二区三区人妻视频| 精品久久国产蜜桃| 麻豆av噜噜一区二区三区| 国产激情偷乱视频一区二区| 久久久午夜欧美精品| 亚洲精品粉嫩美女一区| 狂野欧美白嫩少妇大欣赏| 啦啦啦韩国在线观看视频| 免费观看在线日韩| 国产成人福利小说| 精品无人区乱码1区二区| 联通29元200g的流量卡| 在线观看av片永久免费下载| 中文字幕熟女人妻在线| 99热这里只有是精品在线观看| 少妇的逼水好多| 成人毛片a级毛片在线播放| 丰满人妻一区二区三区视频av| 亚洲自偷自拍三级| 91久久精品国产一区二区成人| 蜜桃久久精品国产亚洲av| 少妇熟女aⅴ在线视频| 国产精品福利在线免费观看| 校园人妻丝袜中文字幕| 女的被弄到高潮叫床怎么办 | 国产真实伦视频高清在线观看 | 国产精品不卡视频一区二区| 亚洲真实伦在线观看| 欧美性猛交黑人性爽| 亚洲人与动物交配视频| 国产精品人妻久久久久久| 大型黄色视频在线免费观看| 日韩欧美免费精品| 一卡2卡三卡四卡精品乱码亚洲| 日本熟妇午夜| 日韩欧美精品v在线| 欧美性猛交╳xxx乱大交人| 亚洲人与动物交配视频| 国产午夜精品论理片| 亚洲乱码一区二区免费版| 深爱激情五月婷婷| 精品久久久久久成人av| 99视频精品全部免费 在线| 丰满的人妻完整版| 99riav亚洲国产免费| 久久久久精品国产欧美久久久| 一个人看的www免费观看视频| 男女下面进入的视频免费午夜| 欧美激情在线99| 欧美成人免费av一区二区三区| 日本熟妇午夜| 丰满的人妻完整版| av女优亚洲男人天堂| 国产av麻豆久久久久久久| 一区二区三区高清视频在线| 乱人视频在线观看| 欧美中文日本在线观看视频| 国产乱人伦免费视频| 一区福利在线观看| 久久亚洲真实| 99热这里只有是精品50| 亚洲精品亚洲一区二区| 中文字幕熟女人妻在线| 久久久国产成人精品二区| 成人永久免费在线观看视频| 在线观看一区二区三区| 毛片女人毛片| 18+在线观看网站| 亚洲精品一区av在线观看| 极品教师在线免费播放| 国产精品久久电影中文字幕| 色哟哟哟哟哟哟| 有码 亚洲区| 少妇人妻精品综合一区二区 | 99在线人妻在线中文字幕| 免费在线观看成人毛片| av天堂中文字幕网| a级毛片a级免费在线| 精品午夜福利视频在线观看一区| 国产午夜福利久久久久久| 有码 亚洲区| 97超级碰碰碰精品色视频在线观看| 不卡视频在线观看欧美| 国产欧美日韩精品亚洲av| 桃色一区二区三区在线观看| 中文亚洲av片在线观看爽| 床上黄色一级片| 成年免费大片在线观看| 成人特级黄色片久久久久久久| 女生性感内裤真人,穿戴方法视频| 色视频www国产| 99久久九九国产精品国产免费| 久久中文看片网| 国产美女午夜福利| .国产精品久久| 九色成人免费人妻av| 国产69精品久久久久777片| 精品福利观看| 九色成人免费人妻av| 一级av片app| 国产熟女欧美一区二区| 嫩草影院精品99| 亚洲男人的天堂狠狠| 精品一区二区三区人妻视频| 99久久无色码亚洲精品果冻| 黄色欧美视频在线观看| 无遮挡黄片免费观看| 日本 欧美在线| av专区在线播放| 深夜a级毛片| a在线观看视频网站| 波多野结衣巨乳人妻| 日本与韩国留学比较| 欧美日韩中文字幕国产精品一区二区三区| 国产精品无大码| 十八禁国产超污无遮挡网站| 人妻久久中文字幕网| 啦啦啦韩国在线观看视频| 中文亚洲av片在线观看爽| 少妇被粗大猛烈的视频| 淫秽高清视频在线观看| 一区二区三区免费毛片| 欧美色欧美亚洲另类二区| 级片在线观看| 亚洲专区国产一区二区| 免费看a级黄色片| 亚洲精品粉嫩美女一区| 好男人在线观看高清免费视频| 亚洲avbb在线观看| 国产毛片a区久久久久| 精品人妻视频免费看| 亚洲熟妇熟女久久| 亚洲精品456在线播放app | 免费人成视频x8x8入口观看| 亚洲精华国产精华液的使用体验 | 国产 一区精品| 国产亚洲精品久久久com| 国产成人一区二区在线| 色哟哟·www| 精品久久久久久成人av| 午夜影院日韩av| 日韩高清综合在线| 伊人久久精品亚洲午夜| 噜噜噜噜噜久久久久久91| 日本三级黄在线观看| 亚洲精品亚洲一区二区| 男人和女人高潮做爰伦理| 国产探花极品一区二区| 天堂动漫精品| 日韩欧美在线二视频| 国产三级中文精品| 毛片女人毛片| 在线a可以看的网站| 亚洲最大成人av| 成人特级黄色片久久久久久久| 91久久精品国产一区二区三区| 欧美国产日韩亚洲一区| 国产午夜精品久久久久久一区二区三区 | 五月伊人婷婷丁香| 韩国av在线不卡| 亚洲成人免费电影在线观看| 欧美在线一区亚洲| a级一级毛片免费在线观看| 在线观看一区二区三区| 久久久国产成人精品二区| 欧美三级亚洲精品| 国产精品久久视频播放| 看免费成人av毛片| 一级毛片久久久久久久久女| 看黄色毛片网站| 91麻豆精品激情在线观看国产| 女人被狂操c到高潮| 永久网站在线| 99国产精品一区二区蜜桃av| 尾随美女入室| 精品久久国产蜜桃| 欧美一级a爱片免费观看看| 美女免费视频网站| 国产视频内射| 国产乱人视频| 真人一进一出gif抽搐免费| 亚洲国产精品合色在线| 狂野欧美激情性xxxx在线观看| 又爽又黄a免费视频| 无遮挡黄片免费观看| 好男人在线观看高清免费视频| 人妻制服诱惑在线中文字幕| 亚洲精品国产成人久久av| 别揉我奶头 嗯啊视频| 亚洲精品在线观看二区| 国产真实乱freesex| 亚洲色图av天堂| 日韩强制内射视频| 精品久久久久久久久久免费视频| 色综合亚洲欧美另类图片| 桃色一区二区三区在线观看| 亚洲av中文av极速乱 | 久久香蕉精品热| 搡老妇女老女人老熟妇| 亚洲午夜理论影院| 欧美一区二区国产精品久久精品| 久久久久精品国产欧美久久久| 成人三级黄色视频| 午夜激情欧美在线| 成人av一区二区三区在线看| 桃红色精品国产亚洲av| .国产精品久久| 日本免费a在线| 窝窝影院91人妻| 黄色女人牲交| 中文字幕免费在线视频6| 日韩精品青青久久久久久| a在线观看视频网站| 老司机深夜福利视频在线观看| 国产欧美日韩精品亚洲av| 欧美高清性xxxxhd video| 国产精品福利在线免费观看| 在线看三级毛片| 欧美三级亚洲精品| 日本 欧美在线| av在线亚洲专区| 日本精品一区二区三区蜜桃| 亚洲天堂国产精品一区在线| 色综合亚洲欧美另类图片| 如何舔出高潮| 五月伊人婷婷丁香| 如何舔出高潮| 亚洲成人中文字幕在线播放| 欧美中文日本在线观看视频| 日日啪夜夜撸| 乱系列少妇在线播放| 日本黄色视频三级网站网址| 最近最新免费中文字幕在线| 亚洲色图av天堂| 国产黄色小视频在线观看| a级一级毛片免费在线观看| 国产精品人妻久久久影院| 欧美成人免费av一区二区三区| 日本五十路高清| 简卡轻食公司| 两个人的视频大全免费| 免费观看的影片在线观看| 色综合色国产| 精品免费久久久久久久清纯| 韩国av一区二区三区四区| 床上黄色一级片| 国产又黄又爽又无遮挡在线| 国产蜜桃级精品一区二区三区| 久久精品国产99精品国产亚洲性色| 22中文网久久字幕| 亚洲成人久久爱视频| 三级国产精品欧美在线观看| 在线观看午夜福利视频| 看十八女毛片水多多多| 亚洲七黄色美女视频| 中文字幕高清在线视频| 国产成人福利小说| 亚洲图色成人| 97碰自拍视频| 真人一进一出gif抽搐免费| 九九在线视频观看精品| 国产成人影院久久av| 国语自产精品视频在线第100页| 亚洲18禁久久av| 麻豆精品久久久久久蜜桃| 麻豆久久精品国产亚洲av| 免费看美女性在线毛片视频| 精品一区二区三区av网在线观看| 国产精品免费一区二区三区在线| 一本精品99久久精品77| 久久精品国产清高在天天线| 日韩欧美国产在线观看| 97超视频在线观看视频| 十八禁国产超污无遮挡网站| 国产高清视频在线观看网站| 精品久久久噜噜| 亚州av有码| 一本精品99久久精品77| 深夜精品福利| 午夜精品一区二区三区免费看| 日韩欧美三级三区| 黄色欧美视频在线观看| 亚洲精品粉嫩美女一区| 国产精品电影一区二区三区| 国产一区二区亚洲精品在线观看| 联通29元200g的流量卡| 亚洲av成人av| 亚洲国产精品久久男人天堂| 九九久久精品国产亚洲av麻豆| 免费看日本二区| 无遮挡黄片免费观看| 日本黄色片子视频| 亚洲成人中文字幕在线播放| 国产精品久久电影中文字幕| 99热网站在线观看| 九色国产91popny在线| 99久久中文字幕三级久久日本| 亚洲国产精品久久男人天堂| 国产精品一及| 黄色欧美视频在线观看| 国产一区二区激情短视频| 中文字幕久久专区| 国产黄a三级三级三级人| 日韩大尺度精品在线看网址| 亚洲熟妇熟女久久| 在线国产一区二区在线| 美女xxoo啪啪120秒动态图| 日日摸夜夜添夜夜添av毛片 | 黄色一级大片看看| 亚洲欧美日韩卡通动漫| 国产黄片美女视频| 嫁个100分男人电影在线观看| 小说图片视频综合网站| 一本一本综合久久| 欧美一区二区精品小视频在线| 99在线视频只有这里精品首页| 国产免费一级a男人的天堂| 久久久国产成人免费| 我的老师免费观看完整版| 国产精品嫩草影院av在线观看 | 国产精品久久视频播放| 免费观看在线日韩| 乱系列少妇在线播放| 成人国产一区最新在线观看| 啦啦啦啦在线视频资源| 久久精品久久久久久噜噜老黄 | 国产亚洲91精品色在线| 波多野结衣巨乳人妻| or卡值多少钱| 欧美人与善性xxx| 我要搜黄色片| 国产乱人伦免费视频| 精品久久久久久久末码| av在线蜜桃| 久久午夜亚洲精品久久| 国产精品综合久久久久久久免费| 少妇人妻精品综合一区二区 | 日日摸夜夜添夜夜添av毛片 | 久久香蕉精品热| 毛片女人毛片| 亚洲 国产 在线| 在线看三级毛片| 精品久久久久久,| 成年女人毛片免费观看观看9| 日韩中字成人| 久久精品国产鲁丝片午夜精品 | 国产亚洲精品综合一区在线观看| 精品免费久久久久久久清纯| 免费av不卡在线播放| 久久午夜福利片| 亚洲电影在线观看av| 国内精品宾馆在线| 国内精品美女久久久久久| 可以在线观看的亚洲视频| 嫩草影视91久久| 国内精品久久久久久久电影| 欧美日本亚洲视频在线播放| 日韩欧美在线二视频| 他把我摸到了高潮在线观看| 国内精品久久久久精免费| 天堂动漫精品| 国产精品不卡视频一区二区| 国产一区二区三区在线臀色熟女| 不卡视频在线观看欧美| 日本a在线网址| 99久久九九国产精品国产免费| 国模一区二区三区四区视频| 亚洲国产高清在线一区二区三| 亚洲av免费高清在线观看| 亚洲成人久久性| 成人性生交大片免费视频hd| 国产高清视频在线播放一区| 非洲黑人性xxxx精品又粗又长| 九九在线视频观看精品| 国产淫片久久久久久久久| 亚洲专区中文字幕在线| 啦啦啦啦在线视频资源| 九九久久精品国产亚洲av麻豆| 又黄又爽又刺激的免费视频.| 麻豆国产97在线/欧美| 尾随美女入室| 色精品久久人妻99蜜桃| 国产高潮美女av| 国产视频内射| 婷婷六月久久综合丁香| 日韩大尺度精品在线看网址| 99九九线精品视频在线观看视频| 三级国产精品欧美在线观看| 乱系列少妇在线播放| 亚洲乱码一区二区免费版| 亚洲欧美精品综合久久99| 国产伦精品一区二区三区视频9| av在线老鸭窝| 精品久久国产蜜桃| 国产精品亚洲美女久久久| 最近中文字幕高清免费大全6 | 国产精品日韩av在线免费观看| 国产成人一区二区在线| 成人无遮挡网站| 我的老师免费观看完整版| 久久久久性生活片| 日本与韩国留学比较| 久久草成人影院| 男女做爰动态图高潮gif福利片| 亚洲天堂国产精品一区在线| 欧美日韩中文字幕国产精品一区二区三区| 伊人久久精品亚洲午夜| 美女cb高潮喷水在线观看| ponron亚洲| 成年免费大片在线观看| 国产精品久久久久久精品电影| 日韩大尺度精品在线看网址| 免费观看人在逋| 国产高清不卡午夜福利| bbb黄色大片| 国产真实伦视频高清在线观看 | 国产一区二区在线av高清观看| 亚洲性久久影院| 亚洲精品影视一区二区三区av| 国产一区二区三区视频了| 欧美色欧美亚洲另类二区| 久久精品夜夜夜夜夜久久蜜豆| 国产综合懂色| 国产精品爽爽va在线观看网站| 亚洲欧美日韩东京热| 高清毛片免费观看视频网站| 日日啪夜夜撸| 久久精品国产鲁丝片午夜精品 | 欧美人与善性xxx| 中国美女看黄片| 国产高潮美女av| 成年女人毛片免费观看观看9| 国产精品一及| 十八禁国产超污无遮挡网站| 亚洲成人精品中文字幕电影| 热99re8久久精品国产| 黄色欧美视频在线观看| 国产一区二区三区视频了| 男插女下体视频免费在线播放| 国产极品精品免费视频能看的| 欧美成人性av电影在线观看| 国产亚洲精品综合一区在线观看| 有码 亚洲区| 国产综合懂色| 一区福利在线观看| 亚洲图色成人| 久久婷婷人人爽人人干人人爱| 国产精品久久电影中文字幕| 男女下面进入的视频免费午夜| 亚洲avbb在线观看| 国产伦精品一区二区三区视频9| 色尼玛亚洲综合影院| 热99在线观看视频| 中文字幕免费在线视频6| 国产主播在线观看一区二区| 欧美极品一区二区三区四区| 午夜福利欧美成人| 亚洲男人的天堂狠狠| 九九久久精品国产亚洲av麻豆| 久久精品国产鲁丝片午夜精品 | 三级毛片av免费| 嫩草影视91久久| xxxwww97欧美| 少妇人妻一区二区三区视频| 如何舔出高潮| 草草在线视频免费看| av黄色大香蕉| 91久久精品国产一区二区三区| 亚洲经典国产精华液单| 国产成人av教育| 一区福利在线观看| 中文字幕av在线有码专区| 日本 欧美在线| 亚洲av中文av极速乱 | 成人特级av手机在线观看| 亚洲经典国产精华液单| 欧美xxxx性猛交bbbb| 最新中文字幕久久久久| 99精品在免费线老司机午夜| 日日干狠狠操夜夜爽| 99久久久亚洲精品蜜臀av| 欧美另类亚洲清纯唯美| 亚洲av日韩精品久久久久久密| 国产精品1区2区在线观看.| av女优亚洲男人天堂| 少妇人妻一区二区三区视频| 亚洲国产精品久久男人天堂| 国产精品免费一区二区三区在线| 国产一区二区激情短视频| 国产精品一区二区免费欧美| 免费电影在线观看免费观看| 精品久久久久久久久久久久久| 他把我摸到了高潮在线观看| 亚洲男人的天堂狠狠| 久久中文看片网| 国产精品野战在线观看| 淫秽高清视频在线观看| 亚洲,欧美,日韩| 欧美zozozo另类| 欧美三级亚洲精品| 日本欧美国产在线视频| 国产一区二区三区视频了| 日韩 亚洲 欧美在线| 亚洲真实伦在线观看| 最新在线观看一区二区三区| av中文乱码字幕在线| 极品教师在线视频| www.色视频.com| 精品人妻一区二区三区麻豆 | 中国美白少妇内射xxxbb| 亚洲狠狠婷婷综合久久图片| 天天一区二区日本电影三级| 免费人成视频x8x8入口观看| 又紧又爽又黄一区二区| 真人一进一出gif抽搐免费| 亚洲专区中文字幕在线| 久久99热6这里只有精品| 久久国产乱子免费精品| 亚洲美女搞黄在线观看 | 久久久久久国产a免费观看| 亚洲中文日韩欧美视频| 日本a在线网址| av福利片在线观看| 麻豆国产av国片精品| 神马国产精品三级电影在线观看| 亚洲成人精品中文字幕电影| 久久久国产成人精品二区| 日本 av在线| 直男gayav资源| 我要搜黄色片| 一进一出抽搐gif免费好疼| 日本在线视频免费播放| 嫩草影院精品99| 三级国产精品欧美在线观看| 内地一区二区视频在线| 乱人视频在线观看| 两个人的视频大全免费| 一卡2卡三卡四卡精品乱码亚洲| a级毛片a级免费在线| 麻豆成人av在线观看| 国内精品久久久久久久电影| 99热只有精品国产| 99久久九九国产精品国产免费| 三级毛片av免费| eeuss影院久久| 亚洲成av人片在线播放无| 久久久久九九精品影院| 91av网一区二区|