• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于強化學習的無人機網(wǎng)絡資源分配研究

    2024-02-04 04:34:32范文帝王俊芳杜龍海
    計算機測量與控制 2024年1期
    關鍵詞:分配

    范文帝,王俊芳,黨 甜,杜龍海,陳 叢

    (中國電子科技集團公司 第54研究所,石家莊 050081)

    0 引言

    隨著近幾年無人機在關鍵技術上的突破,在軍用和民用領域具有高機動性和低成本特性的無人機用途十分廣泛。在人們的日常生活生產(chǎn)活動中,無人機越來越多地出現(xiàn),在精準農業(yè)、應急救援、交通管制、貨物遞送等領域發(fā)揮著重要作用[1-3]。

    然而隨著無人化進程的加深,單無人機能力不足、資源有限、任務執(zhí)行低效,如同自然界中動物通過成群結伴來彌補個體能力的有限[4],無人機集群執(zhí)行復雜任務成為無人機應用的重要模式,無人機集群信息實現(xiàn)實時傳遞的關鍵是無人機通信網(wǎng)絡。

    但無人機通信網(wǎng)絡在實際操作中存在著眾多問題,比如,電力資源、功率資源等等都存在著資源利用率不高的問題。資源分配問題是智能場景下研究的一個熱點,一些啟發(fā)式算法被提出以解決資源分配問題,文獻[5]運用禁忌搜索算法解決火力資源分配;文獻[6]在資源分配問題上應用模擬退火算法,模擬退火算法容易實現(xiàn),魯棒性強、質量高,但優(yōu)化過程所需時間較長;文獻[7]提出武器動態(tài)資源分配問題,用動態(tài)規(guī)劃的方法來解決,但是遞歸的使用在編碼過程中使得效率非常低;文獻[8]完善標準灰狼算法,提出解決資源分配難題的離散灰狼算法。群體智能算法的速度雖然與傳統(tǒng)算法相比有所提升,但僅僅針對一個問題進行解決,很難擴展到其他問題的應用,在解決動態(tài)資源分配問題上效果不佳。

    在無人機通信網(wǎng)絡中,由于有限的頻譜資源和動態(tài)的無人機用戶需求,時隙分配最常被用來解決資源競爭和協(xié)調的問題。然而,時隙分配是一個經(jīng)典的NP難題,困擾著眾多研究者。其中一些傳統(tǒng)的求解方式,如枚舉法、分支定界法、動態(tài)規(guī)劃法,這些都是很容易實現(xiàn)但又很緩慢的搜索方式;對于傳統(tǒng)的智能算法,如遺傳算法、差分進化算法,要想擴展有一定難度。巨大的狀態(tài)空間和不斷變化的環(huán)境使得傳統(tǒng)的決策方法在這方面的效果并不理想。

    隨著各個研究領域深度強化學習技術的不斷發(fā)展,強化學習被重新應用到此項問題。更多基于深度強化學習技術解決資源分配問題的方法被提出[9-12],強化學習算法訓練出的模型不僅決策速度快,而且擴展性強,能夠在各種場景中廣泛應用,能夠有效應對動態(tài)變化的環(huán)境,非常適用于動態(tài)資源分配問題。強化學習是一種基于經(jīng)驗學習和探索的智能算法,可以通過對實時環(huán)境的反饋以及循環(huán)性訓練,不斷優(yōu)化決策結果。

    文獻[13]對無人機網(wǎng)絡輔助移動邊緣計算執(zhí)行任務卸載策略這個領域做了一系列的研究探索,說明了基于強化學習的無人機網(wǎng)絡的資源分配和路徑規(guī)劃可以在當前相關研究中達到不錯性能;文獻[14]集中探討了無人機群網(wǎng)絡頻譜分配方面的研究,研究了使用強化學習的動態(tài)信道分配和動態(tài)時隙分配算法;文獻[15]主要探討了無人機集群中的資源分配和虛擬網(wǎng)絡映射問題,該文獻對現(xiàn)有的資源分配算法進行了分析,總結了其優(yōu)劣之處,同時提出了一種全新的資源分配算法;文獻[16]是以深度強化學習算法為基礎的資源分配問題研究,結合專家經(jīng)驗與深度強化學習算法,探索引入專家數(shù)據(jù)對資源分配算法性能的影響。

    為了對資源分配問題進行更好的研究,本文將在深度強化學習技術的幫助下,研究無人機通信網(wǎng)絡中如何更好地解決時隙分配問題。

    本文基于近端策略優(yōu)化算法[17-18],設計了一個更高效的方法求解時隙分配問題。設計方法中的PPO算法使用Kullback-Leibler(KL)散度來限制更新前后的策略變化,解決了傳統(tǒng)梯度下降優(yōu)化算法[19-20]只能用最小步長進行更新的限制,PPO算法通常能優(yōu)效地訓練智能體執(zhí)行復雜的控制任務。

    1 無人機網(wǎng)絡時隙資源分配方案

    1.1 問題描述

    無人機通信網(wǎng)絡由M無人平臺節(jié)點組成,由集合M={1,2,…,M}表示,m∈M表示無人平臺節(jié)點的編號。其中,各無人平臺節(jié)點之間構成多跳場景,節(jié)點維護自身的一跳和兩跳鄰居表,分別用N1(m)和N2(m)表示第m無人節(jié)點的一跳和兩跳鄰居集合。為了便于表示,利用矩陣C表示所有節(jié)點的一跳鄰接矩陣:

    (1)

    其中:cm,n∈{0,1}表示第m節(jié)點和第n節(jié)點間是否存在鏈路,cm,n=1表示兩個節(jié)點之間存在鏈路,第m節(jié)點和第n節(jié)點互為一跳鄰居,即m∈N1(n),否則,兩個節(jié)點之間不存在鏈路。

    無人機通信網(wǎng)絡因其拓撲結構的動態(tài)性導致難以預先設定中心節(jié)點作為集中控制設備,進行全局的時隙資源動態(tài)分配。為了在無人機通信網(wǎng)絡中優(yōu)化調度時隙資源,需設計以節(jié)點為中心的時隙分配算法。在一個時隙調度周期中,假設共有K空閑數(shù)據(jù)時隙可分配給M個無人平臺節(jié)點用于發(fā)送數(shù)據(jù),k表示時隙的編號。時隙的帶寬被表示為B。利用二元變量tm,k∈{0,1}表示第k時隙到第m無人節(jié)點的分配情況,其中,tm,k=1表示第k時隙被分配到第m無人節(jié)點用于傳輸數(shù)據(jù),否則tm,k=0。

    此時,網(wǎng)絡的信道利用率被定義為:

    (2)

    代表的是網(wǎng)絡分配的時隙數(shù)和所有能夠分配的時隙數(shù)的比值。

    時隙分配問題可以構建為以提高信道利用率為目標的優(yōu)化問題。

    另外,無人節(jié)點在請求時隙時,同時上傳自身網(wǎng)絡狀態(tài)信息,包括節(jié)點吞吐量、節(jié)點負載、時延等??紤]到不同無人平臺節(jié)點上通信性能的差異性,將同一時隙分配給不同節(jié)點所帶來的網(wǎng)絡性能增益不同,因此為分配到節(jié)點的時隙設置效用函數(shù)。效用函數(shù)由每個時隙調度周期內節(jié)點上報的吞吐量、負載、時延等構成。為了消除不同性能指標間的量綱差異,對其進行歸一化,下面以負載為例:

    負載:假設節(jié)點的負載狀態(tài)為Qm,每個節(jié)點可允許的最大負載和出現(xiàn)的最小負載分別是Qm,max、Qm,min,負載的歸一化指標為:

    (3)

    每個節(jié)點的效用函數(shù)利用Um表示,指該節(jié)點負載的歸一化指標的加權和,其表達式為:

    (4)

    其中:w的取值為1。

    因此,為節(jié)點分配時隙的時候需要同時考慮網(wǎng)絡的信道利用率以及節(jié)點本身的網(wǎng)絡狀態(tài)。

    在廣播調度問題中,存在兩個限制條件:一是非傳輸限制,即在一個調度周期內,網(wǎng)絡中的每個節(jié)點至少有一個時隙被調度;二是非沖突限制,即調度過程中要避免兩類沖突,第一類沖突是節(jié)點不能同時發(fā)送和接收數(shù)據(jù),第二類沖突是一個節(jié)點不能同時接收超過一個傳輸[21]。

    此時,時隙分配問題被構建為:

    (5)

    (6)

    其中:公式(5)為加權信道利用率,式(6)中C1保障了在一個時隙調度周期內所有無人平臺節(jié)點至少存在1次時隙調度。假設兩跳以上的節(jié)點可以利用空間復用的方式避免干擾,C2約束同一個時隙不會分配給相鄰2個節(jié)點,C3約束分配到同一個時隙的節(jié)點間最多存在1條鏈路。

    1)當存在中心控制節(jié)點時:

    在無人機通信網(wǎng)絡中,當存在一個無人平臺節(jié)點是中心控制節(jié)點時,所有節(jié)點維護的鄰居表和網(wǎng)絡狀態(tài)等信息可以被收集到集中控制節(jié)點處,并基于這些數(shù)據(jù)對上述優(yōu)化問題進行全局求解。上述時隙分配問題是以二元時隙分配變量為優(yōu)化對象的整數(shù)線性規(guī)劃,可以利用混合整數(shù)線性規(guī)劃(MILP)求解器或者深度強化學習算法進行求解。

    MILP求解器是一種計算機程序,可以解決包含整數(shù)變量的線性規(guī)劃問題。這些求解器使用分支定界法等算法來解決整數(shù)規(guī)劃問題,但它們通常比手動實現(xiàn)更高效。

    2)當不存在中心控制節(jié)點時:

    然而,由于無人機通信網(wǎng)絡中難以設定集中控制節(jié)點,求解上述以優(yōu)化全局網(wǎng)絡性能為目標的時隙分配問題時難以獲取所有節(jié)點的網(wǎng)絡狀態(tài)信息。為了進行時隙調度,假設節(jié)點要維護的鄰居表包括一跳和兩跳,同時還會維護一跳和兩跳鄰居的時隙分配表,可以將上述優(yōu)化問題拆分為以節(jié)點m為中心的時隙分配問題:

    (7)

    (8)

    此時,優(yōu)化對象是所有時隙到節(jié)點m的調度情況。對于節(jié)點m而言,其一跳鄰居、兩跳鄰居、以及一跳鄰居和兩跳鄰居的時隙占用情況都是已知的。上述以節(jié)點m為中心的時隙分配問題是整數(shù)線性規(guī)劃問題,公式(8)中C1保障了在一個時隙調度周期內所有無人平臺節(jié)點至少存在1次時隙調度,C2和C3約束了變量tm,k的上界,C2約束同一個時隙不會分配給相鄰2個節(jié)點,C3約束分配到同一個時隙的節(jié)點間最多存在1條鏈路。另外,分析該優(yōu)化問題可知,對于無人平臺節(jié)點m,所分配到的時隙數(shù)量越多,其優(yōu)化目標函數(shù)越大,其變化是隨著其占用的時隙數(shù)量增加而單調遞增的。此時,節(jié)點m的時隙分配結果可以直接以貪婪的思路最終確定。

    上文將全網(wǎng)的時隙分配問題拆分為以節(jié)點m為中心的時隙分配子問題進行求解,不再需要將所有節(jié)點的網(wǎng)絡狀態(tài)信息收集到集中控制設備,但是這種求解方式難以獲取全局最優(yōu)的結果。并且,值得注意的是,時隙調度的最終目標是為所有節(jié)點分配數(shù)據(jù)時隙。在以節(jié)點m為中心的時隙分配問題中,將同一時隙分配給不同節(jié)點所帶來的網(wǎng)絡性能增益不同,這說明節(jié)點時隙分配的順序對節(jié)點調度的公平性和穩(wěn)定性具有重要影響,為此,需要提出基于優(yōu)先級的節(jié)點時隙分配。

    由于節(jié)點負載過高會導致時延提高和丟包率增加,當節(jié)點監(jiān)測到自身負載Qm超過一定閾值αm時,就需要請求更多數(shù)據(jù)時隙盡快傳輸緩存隊列的流量,此時該節(jié)點將臨時提高自身優(yōu)先級并將更新后的優(yōu)先級信息廣播給鄰居節(jié)點,這時節(jié)點的時隙分配順序也會相應的提前,有利于節(jié)點獲取占用更多時隙進行數(shù)據(jù)傳輸。當節(jié)點監(jiān)測到自身負載Qm低于一定閾值βm時,可恢復為初始優(yōu)先級,并將其更新消息廣播給其他節(jié)點。為了避免節(jié)點優(yōu)先級的頻繁變更導致時隙分配無法收斂,設置負載閾值αm和βm的取值滿足αm>βm。

    當Qm≥αm時,更新節(jié)點優(yōu)先級的表達式可以定義為:

    (9)

    當βm

    基于優(yōu)先級的節(jié)點時隙分配允許優(yōu)先級較高的節(jié)點獲得優(yōu)先進行時隙劃分的機會,通過調整時隙請求期間的參數(shù),優(yōu)先解決高優(yōu)先級節(jié)點的時隙分配優(yōu)化問題,使得重要緊急的消息可以高效傳輸。基于優(yōu)先級的節(jié)點時隙分配流程如圖1所示。

    圖1 基于優(yōu)先級的節(jié)點時隙分配流程

    1.2 模型描述

    為了提高多無人機網(wǎng)絡的通信效率和整體系統(tǒng)性能協(xié)作,本文將運用深度強化學習的研究成果,設計一種用于解決時隙資源分配問題的方案。

    在2017年,OpenAI提出了PPO算法,這是一種深度強化學習算法,旨在通過使用PPO算法來讓智能體解決問題。為此,需要先建立一個MDP模型,這個模型由狀態(tài)空間(S)、動作空間(A)和獎勵函數(shù)(R)組成[22]。在t時刻,環(huán)境處于狀態(tài)St,智能體根據(jù)當前狀態(tài)選擇策略At,環(huán)境轉移到下一狀態(tài)St+1,同時智能體獲得相應的反饋獎勵Rt。

    假設存在一個多無人機網(wǎng)絡,其中包含一組環(huán)境狀態(tài)S、動作集合A以及回報獎賞R。該網(wǎng)絡中共有N架無人機,并且每個周期需要分配T個時隙。具體的動態(tài)時隙分配環(huán)境映射如下所述。

    環(huán)境狀態(tài)S:為了評估無人機在執(zhí)行動作后對環(huán)境狀態(tài)的影響,環(huán)境狀態(tài)主要用于描述這些影響的程度。這種程度可以包含積極的和負面的影響。根據(jù)環(huán)境狀態(tài)的變化,可以更方便地設計后續(xù)的獎勵函數(shù)[14]。環(huán)境狀態(tài)可以被定義如下:

    S={s1,s2,…,sN}

    在動態(tài)時隙分配的背景下,環(huán)境狀態(tài)可由多個方面來描述,即無人機節(jié)點的負載和無人機節(jié)點的鏈接拓撲等。

    動作集合A:強化學習的另一個重要組成部分是動作。動作是無人機與環(huán)境交互的必備因素。通過不斷嘗試各種動作或策略,無人機可以獲取環(huán)境反饋的信息和獎勵值,以便快速了解采取何種動作或策略,以最大化環(huán)境收益[14]。動作集合可以定義如下:

    A={a1,a2,…,aN×T},ai∈{0,1}

    式中,αi表示第i÷T時隙下的第imodT架無人機所采取的動作,也就是說該時隙下,無人機可以選擇兩種不同的動作再每個時隙中進行數(shù)據(jù)傳輸操作,ai=0表示無人機在該時隙中不進行數(shù)據(jù)傳輸;ai=1表示無人機在該時隙中試圖進行數(shù)據(jù)傳輸。

    獎賞函數(shù)R:獎勵函數(shù)的作用是教導智能體向對環(huán)境有好處的方向前進,并且限制其行動范圍。一般來說,獎勵函數(shù)會根據(jù)環(huán)境的特點進行制定。在動態(tài)分配的情況下,通過狀態(tài)反饋來衡量環(huán)境的優(yōu)劣[14]。

    為了實現(xiàn)讓智能體快速學習最優(yōu)時隙分配策略的優(yōu)化目標,本文設計了兩部分獎勵。第一部分是滿足三個約束條件下的評估情況,第二部分是計算網(wǎng)絡中通信的總負載量。

    圖2展示了模型的決策流程。

    圖2 決策流程圖

    為了找到最佳的時隙分配策略,使得初始化狀態(tài)S的預期獎勵最大化,需要通過智能體與環(huán)境的交互來生成所有可能的時隙分配策略π*,以最大化系統(tǒng)整體的長期期望折扣獎勵:

    (10)

    最佳時隙分配策略可被表述為:

    (11)

    本文使用時隙分配系統(tǒng)時,不必考慮長遠回報。為此,我們引入衰減因子作為衰弱機制γ∈[0,1]。公式(11)中st+1描述無人機網(wǎng)絡環(huán)境在t+1時刻的狀態(tài);at+1記錄智能體在t+1時刻的時隙分配行為;Rt+1(at+1,st+1)記錄t+1時刻的即時獎勵;γRt+1(at+1,st+1)表示長時間的衰減獎勵。

    至此,我們已成功完成了強化學習中MDP建模的重要步驟。我們已經(jīng)設計了模型中的狀態(tài)、動作和獎勵函數(shù)的三個關鍵要素。

    2 基于近端策略優(yōu)化算法的時隙分配算法框架

    2.1 算法框架

    如圖3所示,本文所使用的PPO強化學習算法可以分為交互階段和學習階段兩個關鍵階段。

    圖3 基于PPO算法的時隙分配系統(tǒng)體系結構

    交互階段:智能體與環(huán)境互動,利用環(huán)境傳遞的狀態(tài)信息做出決策,環(huán)境再返回智能體下一時刻的狀態(tài)和基于該策略的獎勵。PPO算法采用經(jīng)驗回放技術,運用經(jīng)驗數(shù)據(jù)池D,幫助智能體更好地學習到最佳決策。該算法是一種在線學習策略,需要大量的樣本數(shù)據(jù)用于重新訓練模型。但是,數(shù)據(jù)集過大會導致訓練時間過長,收斂性較弱;而數(shù)據(jù)集過小則會影響模型的訓練效果[22]。PPO算法利用重要性采樣技術,通過創(chuàng)建一個固定大小的經(jīng)驗池D,在解決上述問題時能夠重復使用樣本。

    學習階段:每次進行迭代時,智能體會利用新生成的Actor網(wǎng)絡所提供的策略來選取動作,并與無人機網(wǎng)絡環(huán)境進行互動,以獲取樣本數(shù)據(jù)。當一個完整的經(jīng)驗池D中的數(shù)據(jù)樣本被收集完畢后,Actor和Critic網(wǎng)絡會對其中的數(shù)據(jù)進行學習。策略更新的流程如圖3所示。

    在每次迭代時,智能體使用新Actor網(wǎng)絡生成的策略選取動作與無人機網(wǎng)絡環(huán)境交互,得到一個(st,at,rt,st+1,πθ)樣本數(shù)據(jù),當收集完一個完整的經(jīng)驗池D的數(shù)據(jù)樣本后,Actor、Critic網(wǎng)絡會對經(jīng)驗池D中的數(shù)據(jù)進行學習。

    根據(jù)公式(10)可以計算出每個時刻的值函數(shù):

    γT-t+1rT-1+γT-tV(sT)

    (12)

    此時可以計算得到Critic網(wǎng)絡的損失函數(shù):

    (13)

    進行反向傳播,以更新Critic網(wǎng)絡。

    對于經(jīng)驗池D中的每個狀態(tài),我們將其輸入到兩個Actor網(wǎng)絡中,以獲得相應的正態(tài)分布。同時,我們輸入D中的每個動作以計算其在分布中的概率。通過將這些概率相除,我們得到了PPO算法的重要性采樣權重:

    (14)

    可以計算Actor網(wǎng)絡的誤差函數(shù):

    (15)

    其中:ε是一個超參數(shù),它用于限制策略更新幅度的clip函數(shù)。然后,通過反向傳播更新Actor新網(wǎng)絡,最終PPO的整體損失函數(shù)如下:

    Lp=0.5×Lc+La

    (16)

    2.2 算法流程

    如算法1所示是一種改進的無人機網(wǎng)絡時隙資源分配算法。

    算法1:基于PPO算法的時隙資源分配算法

    輸入: 馬爾可夫決策過程模型

    輸出: 智能決策模型

    1)設置模型超參數(shù)、訓練總回合數(shù)、批大小、學習率、衰減率γ,每次更新次數(shù)、最大步長、更新頻率

    2)初始化經(jīng)驗回放池D

    3)初始化無人機網(wǎng)絡環(huán)境,生成網(wǎng)絡拓撲

    4)初始化算法模型,策略網(wǎng)絡參數(shù)θ

    5)Actor網(wǎng)絡參數(shù)設置采樣環(huán)境參數(shù)θold←θnew

    6)fori= 1,2,…do

    7) 重置環(huán)境

    8) for each steptdo

    9) 觀察無人機網(wǎng)絡初始狀態(tài)st

    10) 將狀態(tài)st輸入到Actor new網(wǎng)絡得到動作at;

    11) 在環(huán)境中執(zhí)行操作和下一個狀態(tài)st+1后得到獎勵rt,是否終止d

    12) 將(st,at,rt,st+1,πθ)存入經(jīng)驗回訪池D中

    13) 最終狀態(tài)輸入Critic網(wǎng)絡中,根據(jù)公式(10)計算衰減后的獎勵

    14) if 更新步驟等于經(jīng)驗池D容量 then

    15) 將記錄的狀態(tài)組合輸入到Critic網(wǎng)絡根據(jù)公式(12)估計優(yōu)勢函數(shù)

    16) 使用梯度下降法優(yōu)化目標函數(shù)并更新網(wǎng)絡參數(shù)θnew

    17) end

    18) end

    19) 更新舊策略模型參數(shù)θold←θnew

    20)end

    21)保存模型,繪制獎勵曲線和網(wǎng)絡損失曲線

    3 仿真與分析

    3.1 仿真原理及參數(shù)

    仿真環(huán)境為OpenAI Gym框架,在Anoconda平臺使用Python語言實現(xiàn)。

    在無人機網(wǎng)絡場景下,網(wǎng)絡的拓撲結構多種多樣,圖4中為典型的網(wǎng)絡拓撲,其中,鏈狀拓撲結構下,節(jié)點時隙復用的方式更多,三種拓撲結構同樣數(shù)量的節(jié)點下鏈狀拓撲結構運算復雜度最高,因此選取鏈狀拓撲結構進行仿真。

    圖4 三種網(wǎng)絡拓撲圖

    在仿真中設定節(jié)點數(shù)為4,5,時隙數(shù)為8,網(wǎng)絡拓撲為線性拓撲。下面以5節(jié)點舉例,網(wǎng)絡的鄰接矩陣為:

    其中:Cij代表節(jié)點i、j的聯(lián)通情況,計算得到允許同時開通的矩陣:

    Bij代表節(jié)點i、j是否能夠同時分配時隙。

    隨機生成節(jié)點當前負載為Q=[10,12,4,4]。

    對載荷進行歸一化后,U=[0.416 67,0.833 33,1,0.333 33,0.333 33]。

    算法中獎勵的衰減率為0.99,PPO算法中clip參數(shù)為0.2。

    3.2 仿真結果與分析

    實驗的損失函數(shù)如圖5所示。

    圖5 損失函數(shù)

    可以看出模型的損失函數(shù)整體趨勢隨著訓練步數(shù)的增加而降低,說明模型朝預計的目標方向學習,算法收斂。

    圖6為PPO算法的平均獎勵曲線,縱軸代表每輪中所有步數(shù)的獎勵之和,獎勵隨著訓練步數(shù)的增加而增大,在前150 000步的訓練中,提升幅度較大,快速得到局部最優(yōu)值,后250 000步的訓練獎勵值提升幅度較小,花銷大量時間尋找最優(yōu)獎勵。與5節(jié)點相比,4節(jié)點獎勵曲線增幅大致相同,比5節(jié)點快100 000步達到收斂得到最優(yōu)解。

    圖6 獎勵函數(shù)

    最終算法輸出如下時隙分配矩陣:

    將負載代入公式(2)中計算加權信道利用率可得結果為21.875%。

    其中200 000步時的局部最優(yōu)解的時隙分配矩陣為:

    計算加權信道利用率為21.458%。使用貪心算法進行對比,優(yōu)先遍歷分配時隙,滿足一個周期至少開通一次的約束,再選擇載荷最大的節(jié)點分配時隙,得出如下時隙分配矩陣:

    可知加權信道利用率為14.791%。

    圖7為三種時隙分配矩陣的數(shù)據(jù)對比,其中PPO局部最優(yōu)為200 000步時的時隙分配情況,由此可見PPO算法在前200 000步即可得到局部最優(yōu)解,但尋找到最優(yōu)解需要花費翻倍的時間,以5節(jié)點網(wǎng)絡為例,最優(yōu)解比局部最優(yōu)解提高了1.94%,訓練步數(shù)多出200 000步,因此PPO算法最優(yōu)解與局部最優(yōu)解存在折中關系,可以根據(jù)實際需求適當縮短訓練時間得到加權信道利用率略微低于最優(yōu)解的時隙分配方案。

    圖7 貪心算法、PPO算法局部最優(yōu)、最優(yōu)解加權信道利用率對比

    與貪心算法對比可以看出PPO算法的局部最優(yōu)解和最優(yōu)解都顯著優(yōu)于貪心算法,與貪心算法相比,PPO算法局部最優(yōu)解加權信道利用率提高了45.07%,最優(yōu)解集權信道利用率提高了47.89%。

    圖8為節(jié)點數(shù)為4、5,需分配的時隙數(shù)為5~30的PPO算法與貪心算法的加權信道利用率對比。當節(jié)點數(shù)固定時,PPO算法得到的加權信道利用率隨時隙的增加而增大;相比于5節(jié)點,4節(jié)點網(wǎng)絡下PPO算法得到的加權信道利用率更高;PPO算法比貪心算法加權信道利用率提高了45%左右。

    圖8 貪心算法、PPO算法加權信道利用率對比

    通過仿真結果對PPO算法在時隙分配優(yōu)化方面的有效性進行分析,該算法能夠收斂到最優(yōu),最優(yōu)解與局部最優(yōu)解間存在折中關系,可以根據(jù)實際需求來選取,對比貪心算法,PPO算法有巨大優(yōu)勢。

    4 結束語

    近些年來隨著多無人機網(wǎng)絡的研究與應用的不斷深入,多無人機網(wǎng)絡資源分配問題具有很重要的研究意義。本文根據(jù)多無人機網(wǎng)絡差異化節(jié)點負載的特點,為了適配網(wǎng)絡業(yè)務流量,針對多無人機網(wǎng)絡動態(tài)時隙分配問題,將網(wǎng)絡拓撲結構納入考慮,提出了基于PPO算法的時隙分配方案。仿真結果表明,相比于貪心算法,提出的深度強化學習方案,有效提高了信道利用率。

    猜你喜歡
    分配
    分配正義:以弱勢群體為棱鏡
    基于可行方向法的水下機器人推力分配
    應答器THR和TFFR分配及SIL等級探討
    Crying Foul
    遺產(chǎn)的分配
    一種分配十分不均的財富
    你知道電壓的分配規(guī)律嗎
    績效考核分配的實踐與思考
    收入分配視閾下的共享發(fā)展思考
    浙江績效分配改革觀察
    中文字幕制服av| 纵有疾风起免费观看全集完整版| 国产又色又爽无遮挡免| 97在线人人人人妻| 久热久热在线精品观看| 韩国高清视频一区二区三区| 欧美xxxx性猛交bbbb| 少妇熟女欧美另类| 狂野欧美激情性bbbbbb| 亚洲国产精品成人久久小说| 男人和女人高潮做爰伦理| 午夜福利影视在线免费观看| 日韩亚洲欧美综合| 日韩强制内射视频| 亚洲av中文av极速乱| 在线看a的网站| 国产精品一区二区性色av| 男的添女的下面高潮视频| 男人舔奶头视频| 天天躁夜夜躁狠狠久久av| 成人毛片60女人毛片免费| 两个人的视频大全免费| 久久热精品热| 国产免费一级a男人的天堂| 亚洲精品视频女| 天天躁夜夜躁狠狠久久av| 亚洲精品视频女| 国产乱人视频| 日产精品乱码卡一卡2卡三| 2022亚洲国产成人精品| 午夜福利网站1000一区二区三区| 日韩人妻高清精品专区| 亚洲欧美精品专区久久| 国产精品偷伦视频观看了| 五月伊人婷婷丁香| 久久99热这里只有精品18| 亚洲国产av新网站| 亚洲av男天堂| 高清av免费在线| 久久久国产一区二区| 一边亲一边摸免费视频| 777米奇影视久久| 国产国拍精品亚洲av在线观看| 精品久久久久久久久av| 国产国拍精品亚洲av在线观看| 美女xxoo啪啪120秒动态图| 青春草亚洲视频在线观看| 人人妻人人添人人爽欧美一区卜 | 777米奇影视久久| 日本猛色少妇xxxxx猛交久久| 欧美一区二区亚洲| 美女福利国产在线 | 新久久久久国产一级毛片| 国产日韩欧美亚洲二区| 中文字幕久久专区| 精品久久久噜噜| 欧美高清成人免费视频www| 国产探花极品一区二区| 国产在线免费精品| .国产精品久久| 国产精品一区二区性色av| 亚洲精品亚洲一区二区| 欧美日韩在线观看h| 精品国产三级普通话版| 18禁裸乳无遮挡动漫免费视频| 啦啦啦在线观看免费高清www| 搡老乐熟女国产| 久久青草综合色| 高清欧美精品videossex| 亚洲人与动物交配视频| 亚洲精品成人av观看孕妇| 国产黄色视频一区二区在线观看| 少妇熟女欧美另类| 亚洲精品中文字幕在线视频 | 天堂8中文在线网| 啦啦啦视频在线资源免费观看| 一区二区三区乱码不卡18| 人妻少妇偷人精品九色| 热re99久久精品国产66热6| 国产91av在线免费观看| 国产深夜福利视频在线观看| 精品久久久噜噜| 国产成人freesex在线| 日本免费在线观看一区| 国产精品一区二区在线观看99| 亚洲三级黄色毛片| 一级毛片aaaaaa免费看小| 人人妻人人看人人澡| 免费大片黄手机在线观看| 人体艺术视频欧美日本| 欧美精品一区二区大全| 亚洲美女黄色视频免费看| 高清日韩中文字幕在线| 97在线视频观看| 国产综合精华液| 能在线免费看毛片的网站| 少妇人妻精品综合一区二区| 欧美日韩亚洲高清精品| 又黄又爽又刺激的免费视频.| 99久久精品一区二区三区| 波野结衣二区三区在线| 亚洲国产高清在线一区二区三| 中文天堂在线官网| 欧美日韩视频精品一区| av免费在线看不卡| 中文天堂在线官网| av免费观看日本| 最近最新中文字幕免费大全7| 97在线视频观看| 国产高清有码在线观看视频| 夜夜骑夜夜射夜夜干| 亚洲人与动物交配视频| 日日啪夜夜爽| 国产午夜精品一二区理论片| 成人高潮视频无遮挡免费网站| 永久网站在线| 深夜a级毛片| 七月丁香在线播放| 丰满乱子伦码专区| 日本爱情动作片www.在线观看| 国产精品久久久久成人av| 一级黄片播放器| 国产深夜福利视频在线观看| 欧美97在线视频| 免费看光身美女| 寂寞人妻少妇视频99o| 黄片无遮挡物在线观看| 国产精品国产三级国产av玫瑰| 成人漫画全彩无遮挡| 亚洲综合精品二区| 免费看日本二区| 中文字幕久久专区| 亚洲欧美日韩东京热| 1000部很黄的大片| 3wmmmm亚洲av在线观看| 亚洲国产欧美人成| 国产成人a∨麻豆精品| 国产黄色视频一区二区在线观看| 九九爱精品视频在线观看| h视频一区二区三区| 成人亚洲精品一区在线观看 | 成人国产麻豆网| 多毛熟女@视频| 亚洲国产精品一区三区| 久久国内精品自在自线图片| a级毛色黄片| 精品久久久噜噜| 黄色日韩在线| 自拍偷自拍亚洲精品老妇| 一本—道久久a久久精品蜜桃钙片| 在线观看国产h片| 最近手机中文字幕大全| 欧美 日韩 精品 国产| 男人添女人高潮全过程视频| 波野结衣二区三区在线| freevideosex欧美| 久久久久久久久大av| 超碰av人人做人人爽久久| 中文乱码字字幕精品一区二区三区| 三级国产精品片| 国产日韩欧美在线精品| 少妇高潮的动态图| 亚洲精品乱码久久久久久按摩| 精品久久久久久电影网| 舔av片在线| 亚洲国产最新在线播放| 超碰97精品在线观看| 99久久精品一区二区三区| 黑丝袜美女国产一区| 亚洲成人中文字幕在线播放| 国产精品免费大片| 欧美xxxx黑人xx丫x性爽| 水蜜桃什么品种好| 乱码一卡2卡4卡精品| 在线精品无人区一区二区三 | 夜夜骑夜夜射夜夜干| 成人二区视频| 日韩视频在线欧美| 久久女婷五月综合色啪小说| 91aial.com中文字幕在线观看| 国产成人精品婷婷| 天天躁日日操中文字幕| 免费黄色在线免费观看| 内地一区二区视频在线| 国产亚洲精品久久久com| 成人无遮挡网站| 亚洲精品成人av观看孕妇| 欧美一级a爱片免费观看看| 亚洲经典国产精华液单| 午夜福利在线在线| www.色视频.com| 亚洲精品久久午夜乱码| 国产成人aa在线观看| 国产亚洲av片在线观看秒播厂| 国模一区二区三区四区视频| 校园人妻丝袜中文字幕| 日韩亚洲欧美综合| 丝瓜视频免费看黄片| 99re6热这里在线精品视频| 亚洲激情五月婷婷啪啪| 国产一区亚洲一区在线观看| 啦啦啦视频在线资源免费观看| 最近的中文字幕免费完整| 成人美女网站在线观看视频| 黄色日韩在线| 美女主播在线视频| 日韩强制内射视频| 国产精品99久久99久久久不卡 | 亚洲久久久国产精品| 国产精品一区二区性色av| 最新中文字幕久久久久| 国产黄片视频在线免费观看| 最近的中文字幕免费完整| videos熟女内射| 女性生殖器流出的白浆| 纵有疾风起免费观看全集完整版| 99久久精品热视频| 毛片一级片免费看久久久久| 免费看av在线观看网站| 97超碰精品成人国产| av在线蜜桃| 99久久中文字幕三级久久日本| 啦啦啦视频在线资源免费观看| 51国产日韩欧美| 亚洲三级黄色毛片| 欧美三级亚洲精品| 日韩制服骚丝袜av| 一区二区三区四区激情视频| 51国产日韩欧美| 国产伦精品一区二区三区四那| 国产精品久久久久久久电影| 成人国产麻豆网| 91精品伊人久久大香线蕉| 特大巨黑吊av在线直播| 伦精品一区二区三区| 亚洲激情五月婷婷啪啪| 国产亚洲欧美精品永久| 一二三四中文在线观看免费高清| 韩国高清视频一区二区三区| 赤兔流量卡办理| 成人毛片60女人毛片免费| 我的女老师完整版在线观看| 欧美xxxx黑人xx丫x性爽| 久久久久久人妻| 伦理电影大哥的女人| 一区在线观看完整版| 啦啦啦中文免费视频观看日本| 国产精品久久久久久久久免| 伊人久久精品亚洲午夜| 街头女战士在线观看网站| 一级a做视频免费观看| 97精品久久久久久久久久精品| av视频免费观看在线观看| 亚洲精品亚洲一区二区| 免费久久久久久久精品成人欧美视频 | 成年女人在线观看亚洲视频| 久久国产精品大桥未久av | 三级经典国产精品| 午夜福利网站1000一区二区三区| 精品一区二区免费观看| 美女福利国产在线 | 黄色一级大片看看| 久久精品久久久久久噜噜老黄| 一二三四中文在线观看免费高清| 国产v大片淫在线免费观看| 亚洲欧美日韩东京热| 亚洲av成人精品一二三区| 国精品久久久久久国模美| 欧美 日韩 精品 国产| 久久久久国产网址| 五月伊人婷婷丁香| 亚洲精品久久午夜乱码| 亚洲精品456在线播放app| 国产伦在线观看视频一区| 亚洲美女黄色视频免费看| 国产黄片视频在线免费观看| 久热久热在线精品观看| 少妇高潮的动态图| 亚洲欧美成人综合另类久久久| 在线观看免费高清a一片| 在线亚洲精品国产二区图片欧美 | 一级毛片我不卡| 国产色爽女视频免费观看| 永久网站在线| 国产男女内射视频| 亚洲欧美日韩另类电影网站 | 欧美精品一区二区大全| 五月玫瑰六月丁香| 五月天丁香电影| 午夜视频国产福利| 免费高清在线观看视频在线观看| 色哟哟·www| 一级黄片播放器| 在线精品无人区一区二区三 | 国产精品蜜桃在线观看| 国产一区二区三区综合在线观看 | 日韩精品有码人妻一区| 精品午夜福利在线看| 亚洲美女黄色视频免费看| 亚洲国产毛片av蜜桃av| 久久久久久久精品精品| 人人妻人人添人人爽欧美一区卜 | 亚洲无线观看免费| 中文字幕亚洲精品专区| 一级av片app| 国产精品久久久久久精品电影小说 | 精品久久久噜噜| 亚洲第一区二区三区不卡| 国产精品三级大全| 99热6这里只有精品| 国产精品国产av在线观看| 蜜臀久久99精品久久宅男| 国产高清有码在线观看视频| 欧美成人午夜免费资源| 在线天堂最新版资源| 午夜激情久久久久久久| 午夜激情福利司机影院| 尾随美女入室| 亚洲av成人精品一二三区| 毛片女人毛片| 久久国产精品男人的天堂亚洲 | 欧美xxⅹ黑人| 久久久久人妻精品一区果冻| 91精品国产九色| 精品国产一区二区三区久久久樱花 | 中文欧美无线码| av国产精品久久久久影院| 极品教师在线视频| 精品酒店卫生间| 久久久久视频综合| 黄色视频在线播放观看不卡| 中文资源天堂在线| 久久精品久久久久久噜噜老黄| 午夜福利影视在线免费观看| 国产成人a区在线观看| 在线观看免费日韩欧美大片 | 免费观看av网站的网址| 午夜激情久久久久久久| 青春草国产在线视频| 看十八女毛片水多多多| 国产一区亚洲一区在线观看| 亚洲人与动物交配视频| 伊人久久精品亚洲午夜| 亚洲国产精品专区欧美| av女优亚洲男人天堂| 麻豆成人av视频| 国产成人91sexporn| 精品人妻熟女av久视频| 不卡视频在线观看欧美| 十分钟在线观看高清视频www | 色视频在线一区二区三区| 久久精品国产a三级三级三级| 国产高潮美女av| 国产综合精华液| 老熟女久久久| 日韩欧美 国产精品| 日本av手机在线免费观看| 国产色爽女视频免费观看| 亚洲美女黄色视频免费看| 一区二区三区乱码不卡18| 国产在线男女| 黄片wwwwww| 麻豆成人午夜福利视频| 免费大片黄手机在线观看| 高清av免费在线| 久久99热6这里只有精品| 国产男女超爽视频在线观看| 色哟哟·www| 亚洲国产成人一精品久久久| 国产成人精品久久久久久| 久久99热这里只频精品6学生| 最近最新中文字幕大全电影3| 这个男人来自地球电影免费观看 | 老熟女久久久| 交换朋友夫妻互换小说| 亚洲精品久久午夜乱码| 亚洲精品一区蜜桃| 日产精品乱码卡一卡2卡三| 国产免费一区二区三区四区乱码| 在线观看免费视频网站a站| 日本色播在线视频| 日本欧美国产在线视频| 亚洲久久久国产精品| 爱豆传媒免费全集在线观看| 最近的中文字幕免费完整| 色网站视频免费| 偷拍熟女少妇极品色| av线在线观看网站| 国产乱人视频| 一区二区三区四区激情视频| 在线观看一区二区三区激情| 国产午夜精品久久久久久一区二区三区| 一级毛片我不卡| 97超碰精品成人国产| 久久久成人免费电影| 国产美女午夜福利| 一个人看的www免费观看视频| 日本猛色少妇xxxxx猛交久久| 久久综合国产亚洲精品| 狠狠精品人妻久久久久久综合| 永久免费av网站大全| 亚洲色图综合在线观看| 成年女人在线观看亚洲视频| 美女主播在线视频| 精品一区二区三区视频在线| 国产一区二区三区综合在线观看 | 2018国产大陆天天弄谢| 国产精品伦人一区二区| 成年美女黄网站色视频大全免费 | 熟女电影av网| 国产视频首页在线观看| 国产亚洲av片在线观看秒播厂| 国产乱人视频| videossex国产| 尾随美女入室| 午夜激情久久久久久久| 狠狠精品人妻久久久久久综合| 天天躁夜夜躁狠狠久久av| 日日摸夜夜添夜夜爱| 欧美老熟妇乱子伦牲交| a级毛片免费高清观看在线播放| 成年女人在线观看亚洲视频| 久久久国产一区二区| 精品一区二区三卡| 五月玫瑰六月丁香| 久久久久久久亚洲中文字幕| 最近最新中文字幕免费大全7| 中文在线观看免费www的网站| 亚洲综合色惰| 极品少妇高潮喷水抽搐| 精品一区二区免费观看| 久久精品国产鲁丝片午夜精品| 草草在线视频免费看| 欧美成人午夜免费资源| 少妇人妻 视频| 亚洲精品乱码久久久v下载方式| 亚洲精品国产av蜜桃| 欧美精品人与动牲交sv欧美| 我要看黄色一级片免费的| 夫妻性生交免费视频一级片| av国产精品久久久久影院| 色5月婷婷丁香| 免费不卡的大黄色大毛片视频在线观看| 中文字幕亚洲精品专区| freevideosex欧美| av不卡在线播放| 亚洲色图av天堂| 日韩av免费高清视频| 久久精品夜色国产| 国产男女超爽视频在线观看| 在线观看美女被高潮喷水网站| 亚洲第一av免费看| 亚洲精品日韩av片在线观看| 国精品久久久久久国模美| tube8黄色片| 欧美亚洲 丝袜 人妻 在线| 欧美一区二区亚洲| 亚洲精品乱码久久久v下载方式| 亚洲av成人精品一区久久| av国产免费在线观看| 久久精品夜色国产| 日本-黄色视频高清免费观看| 嫩草影院新地址| 日韩在线高清观看一区二区三区| av又黄又爽大尺度在线免费看| 韩国高清视频一区二区三区| 亚洲第一区二区三区不卡| 国产av国产精品国产| 亚洲无线观看免费| 亚洲欧洲日产国产| 97在线人人人人妻| 欧美bdsm另类| 三级国产精品片| 国内少妇人妻偷人精品xxx网站| 亚洲精品国产av成人精品| 大香蕉久久网| 一级二级三级毛片免费看| h视频一区二区三区| 精品午夜福利在线看| 国产亚洲av片在线观看秒播厂| 日韩中字成人| 免费黄色在线免费观看| 日韩欧美 国产精品| 我要看黄色一级片免费的| 久久久久久久久久久免费av| 一级毛片久久久久久久久女| 久久久欧美国产精品| 有码 亚洲区| 日本欧美视频一区| 菩萨蛮人人尽说江南好唐韦庄| 欧美极品一区二区三区四区| 亚洲一区二区三区欧美精品| av不卡在线播放| 精品国产露脸久久av麻豆| 久久国产亚洲av麻豆专区| 伊人久久精品亚洲午夜| 亚洲精品国产色婷婷电影| 日韩视频在线欧美| 七月丁香在线播放| 日日啪夜夜爽| 日韩不卡一区二区三区视频在线| 香蕉精品网在线| 国产 一区精品| 麻豆精品久久久久久蜜桃| 久久久午夜欧美精品| 黄色视频在线播放观看不卡| 永久网站在线| 春色校园在线视频观看| 久久久久久久久久人人人人人人| 男男h啪啪无遮挡| 亚洲国产日韩一区二区| 深爱激情五月婷婷| 亚洲,欧美,日韩| 我要看日韩黄色一级片| 欧美高清成人免费视频www| 精品久久国产蜜桃| 国产日韩欧美在线精品| 丰满人妻一区二区三区视频av| 精品亚洲乱码少妇综合久久| 日韩伦理黄色片| 国产精品蜜桃在线观看| 男的添女的下面高潮视频| 老司机影院成人| 我的老师免费观看完整版| 久久久色成人| 日本免费在线观看一区| 男人和女人高潮做爰伦理| 国产有黄有色有爽视频| 嫩草影院入口| 亚洲经典国产精华液单| 欧美zozozo另类| 久久久久久久久久久免费av| 亚洲,一卡二卡三卡| 看免费成人av毛片| av国产精品久久久久影院| 精品少妇黑人巨大在线播放| 久久人人爽av亚洲精品天堂 | 一本—道久久a久久精品蜜桃钙片| 尤物成人国产欧美一区二区三区| 日韩制服骚丝袜av| av在线app专区| 日韩精品有码人妻一区| 老熟女久久久| www.色视频.com| 在线观看人妻少妇| 大码成人一级视频| 中文字幕久久专区| 欧美精品国产亚洲| 夜夜爽夜夜爽视频| 亚洲内射少妇av| 80岁老熟妇乱子伦牲交| 国产高清国产精品国产三级 | 欧美国产精品一级二级三级 | 国产又色又爽无遮挡免| 91久久精品国产一区二区三区| 欧美变态另类bdsm刘玥| 亚洲精品国产色婷婷电影| 91精品一卡2卡3卡4卡| 一级毛片电影观看| 在线播放无遮挡| 成人漫画全彩无遮挡| 亚洲精品一二三| 舔av片在线| 久久av网站| 久久青草综合色| 国产精品.久久久| 一区二区三区免费毛片| 大陆偷拍与自拍| 国产在视频线精品| 国产成人精品久久久久久| 男人爽女人下面视频在线观看| 交换朋友夫妻互换小说| 国产成人aa在线观看| 只有这里有精品99| 男人狂女人下面高潮的视频| 欧美bdsm另类| 欧美成人午夜免费资源| 七月丁香在线播放| 国产 一区 欧美 日韩| 啦啦啦在线观看免费高清www| 国产色婷婷99| 日本猛色少妇xxxxx猛交久久| 久热这里只有精品99| 中国国产av一级| 国产一区二区三区综合在线观看 | 亚洲国产色片| 国产黄色免费在线视频| 男人狂女人下面高潮的视频| 久久久久精品久久久久真实原创| 精品亚洲乱码少妇综合久久| 日韩中文字幕视频在线看片 | 五月玫瑰六月丁香| 国产欧美日韩精品一区二区| 久久久精品94久久精品| 久久久久久久久大av| 国产深夜福利视频在线观看| 九九久久精品国产亚洲av麻豆| 一个人免费看片子| 国产亚洲欧美精品永久| 精品一品国产午夜福利视频| 日韩强制内射视频| 国产精品99久久久久久久久| 91精品伊人久久大香线蕉| 国产高清不卡午夜福利| 色婷婷久久久亚洲欧美| 日产精品乱码卡一卡2卡三| 一级av片app| 久久99热这里只有精品18| 国产亚洲av片在线观看秒播厂| 又粗又硬又长又爽又黄的视频| 少妇的逼水好多| 日本av手机在线免费观看| 久久女婷五月综合色啪小说| 国产精品嫩草影院av在线观看| 久久久亚洲精品成人影院|