• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強化學習的電力物聯(lián)網動態(tài)切片策略研究

    2024-09-19 00:00:00辛銳吳軍英薛冰張鵬飛李艷軍柴守亮王佳楠
    無線電工程 2024年6期
    關鍵詞:深度強化學習切片路由

    摘 要:軟件定義電力物聯(lián)網支持構建承載不同業(yè)務的網絡切片(Network Slice,NS),通過部署NS 為具有業(yè)務需求的物聯(lián)網設備提供端到端服務。業(yè)務NS 的部署涉及2 個互相耦合的問題,即虛擬網絡功能(Virtual Network Function,VNF) 部署和業(yè)務傳輸路由確定。在海量業(yè)務需求與動態(tài)網絡場景中,NS 部署方案需要根據(jù)網絡狀態(tài),實現(xiàn)智能的動態(tài)靈活部署。針對上述問題,研究動態(tài)網絡場景下的切片策略,基于深度強化學習算法求解VNF 部署和業(yè)務傳輸路由確定這一復雜聯(lián)合優(yōu)化問題,實驗證明所提策略能根據(jù)目前的網絡狀態(tài)靈活地改變部署方案,控制業(yè)務路由平均能量損耗、平均可靠性和平均剩余帶寬占有率,提高了網絡整體傳輸性能。

    關鍵詞:軟件定義電力物聯(lián)網;切片;虛擬網絡功能;路由;深度強化學習

    中圖分類號:TM73 文獻標志碼:A 開放科學(資源服務)標識碼(OSID):

    文章編號:1003-3106(2024)06-1380-08

    0 引言

    電力物聯(lián)網[1]是物聯(lián)網技術在智能電網中應用的產物。近年來,電力物聯(lián)網規(guī)模不斷增大,承載的業(yè)務種類也日益繁多,導致業(yè)務數(shù)據(jù)量呈指數(shù)級增長。在這種情況下,為給眾多物聯(lián)網設備提供服務,供應商需要頻繁更換硬件設備、分配帶寬資源等。然而事實上,更換硬件設備的成本高,而且軟硬件耦合[2]、網絡封閉化,使得服務成本高昂、服務效率低下,給電力物聯(lián)網的發(fā)展帶來了巨大挑戰(zhàn)。隨著軟件定義網絡(Software Defined Network,SDN)和網絡功能虛擬化(Network Function Virtualization,NFV)[3]的出現(xiàn),網絡切片(Network Slice,NS)[4]應運而生,研究者們提出了軟件定義電力物聯(lián)網[5],為解決上述問題提供了新的思路。

    新思路的關鍵是:依據(jù)不同電力業(yè)務需求的特點,將軟件定義電力物聯(lián)網抽象為多個獨立的虛擬化邏輯網絡,即業(yè)務NS,NS 承載具有對應業(yè)務需求的物聯(lián)網設備;利用NFV 實現(xiàn)軟硬件解耦,通過Docker 容器在物聯(lián)網網關部署多個虛擬網絡功能(Virtual Network Function,VNF)[6],物聯(lián)網設備按需激活網關上的VNF,并傳輸業(yè)務數(shù)據(jù)。借此,軟件定義電力物聯(lián)網可以通過軟件編程部署業(yè)務NS,實現(xiàn)為物聯(lián)網設備靈活提供端到端服務的目標。然而,在NS 部署過程中,面臨以下問題:一是網絡中存在多個網關,業(yè)務NS 承載的物聯(lián)網設備難以選擇合適的網關進行部署并激活所需的VNF;二是物聯(lián)網設備在向網關傳輸業(yè)務數(shù)據(jù)時,使用的路由是基于最短路徑的固定路由,無法根據(jù)網絡狀態(tài)動態(tài)改變。當業(yè)務數(shù)據(jù)量增大時,可能會導致鏈路擁塞,降低路由質量,從而影響服務的可靠性。

    針對上述問題,學術界已經開展了面向NS 部署的相關研究。Guan 等[7]采用復雜網絡理論獲取網絡拓撲信息,并通過定義節(jié)點重要性對設備節(jié)點進行排序。然后選擇重要性高的設備來部署VNF,并使用KSP 算法計算多個VNF 之間的傳輸路由,以完成NS 部署。然而,這項研究不屬于電力物聯(lián)網領域,并且使用基于最短路徑的傳輸路由,無法根據(jù)網絡狀態(tài)進行動態(tài)調整。另一方面,王雅倩等[8]研究了電力物聯(lián)網NS 的VNF 部署問題,并提出了基于升價匹配的多階段多對一部署算法。該算法能夠獲得更小的業(yè)務服務總時延,并滿足時延敏感業(yè)務的需求。然而,這項工作并未考慮如何確定業(yè)務的傳輸路由,因此在實際應用中,NS 無法提供端到端的服務。此外,楊爽等[9]針對電力物聯(lián)網提出了一種基于模擬退火-粒子群算法的NS 部署方案。通過優(yōu)化節(jié)點映射和鏈路映射,該方案能夠得到較好的傳輸路由。然而,在節(jié)點映射過程中,忽略了節(jié)點種類不同和VNF 部署位置等因素,與實際網絡特點不符。綜上所述,盡管已有關于電力物聯(lián)網NS部署的研究,但大多數(shù)工作只關注單個問題,如VNF 部署或傳輸路由確定,而忽略了這兩方面是相互耦合的,且現(xiàn)有的傳輸路由也缺乏智能性。

    人工智能是當前學術界研究的熱點問題之一,其中最具代表性的是深度學習[10]、強化學習[11]及深度強化學習[12]。在物聯(lián)網領域,Zhou 等[13]提出了一種基于Qlearning 的路由算法,通過計算設備節(jié)點的剩余能量和深度信息來選擇Q 值較大的路由,以減少數(shù)據(jù)傳輸時延。然而,由于實際網絡的復雜性,該算法的計算量較大,難以實現(xiàn)。在電力通信網絡領域,向敏等[14]提出了基于深度學習的路由策略,通過建立鏈路帶寬占用率預測模型,計算不同路由的選擇度,實驗證明選擇的路由能有效減少傳輸時延。葉萬余等[15]建立了面向電力物聯(lián)網業(yè)務的管理模型,使用深度強化學習算法,將電力業(yè)務傳輸路由的時延和可靠性作為優(yōu)化目標,為業(yè)務NS 按需分配鏈路帶寬資源。然而,以上研究都集中在智能方法如何確定路由或分配資源上,而忽略了NS部署涉及的VNF 部署問題。因此,在軟件定義電力物聯(lián)網領域,還缺乏一種能夠系統(tǒng)地、智能地完成VNF 部署、傳輸路由確定和資源分配的工作。

    本文研究了基于深度強化學習的電力物聯(lián)網動態(tài)切片策略,實現(xiàn)在動態(tài)網絡環(huán)境下靈活部署NS,為物聯(lián)網設備提供端到端服務。首先,簡要描述了軟件定義電力物聯(lián)網的架構和切片部署過程,通過SDN 控制器管理網絡,提高業(yè)務服務的靈活性和高效性;然后,建立了動態(tài)切片策略的數(shù)學模型,并以平均能量損耗、平均可靠性和平均剩余帶寬占有率為優(yōu)化目標,提出深度強化學習動態(tài)切片算法(DRL-DSA)求解切片策略,該策略能夠根據(jù)網絡狀態(tài)動態(tài)調整NS 部署方案,以滿足不同業(yè)務數(shù)據(jù)量的需求;最后,通過仿真實驗,驗證了所提策略在解決VNF 部署和業(yè)務傳輸路由確定這一聯(lián)合優(yōu)化問題的同時,保障了平均能量損耗、平均可靠性和平均剩余帶寬占有率等性能,實現(xiàn)了NS 的動態(tài)優(yōu)化部署。

    1 系統(tǒng)架構及數(shù)學模型

    1. 1 系統(tǒng)架構

    軟件定義電力物聯(lián)網的架構如圖1 所示,包括3 層:物聯(lián)網設備層、網關層和控制器層。在物聯(lián)網設備層,多個物聯(lián)網設備互相連接構成Mesh 網絡,這些設備是支持SDN 功能,并能夠采集壓力、溫度和聲音等信息的無線傳感器。網關層包含一些支持SDN 功能的物聯(lián)網網關,支持使用輕量級虛擬化技術如Docker 來部署VNF。物聯(lián)網設備采集的數(shù)據(jù)需要傳輸?shù)骄W關進行邊緣計算??刂破鲗佑桑樱模慰刂破鹘M成,例如Ryu、NOX、OpenDayLight 等,控制器負責觀測網絡的實際狀態(tài),確定網關和傳輸路由,并為相關物聯(lián)網設備和網關安裝流表,通過管理網絡并控制業(yè)務數(shù)據(jù)的轉發(fā),提高業(yè)務服務的靈活性和高效性。此外,從圖中可以看出,軟件定義電力物聯(lián)網中可以存在多個業(yè)務NS。每個業(yè)務NS 承載著具有各自業(yè)務需求的物聯(lián)網設備,包含若干個業(yè)務流,通過部署業(yè)務NS,能夠有效地提供業(yè)務服務,提高電力物聯(lián)網的并發(fā)性。當部署業(yè)務NS 時,需要從網關層中為物聯(lián)網設備選擇合適的網關來激活所需的VNF,并確定傳輸路由以傳輸業(yè)務數(shù)據(jù)。通過這種方式,軟件定義電力物聯(lián)網實現(xiàn)了為具有業(yè)務需求的物聯(lián)網設備提供端到端服務的目標。

    所提動態(tài)切片策略能根據(jù)網絡狀態(tài)調整NS 部署方案,支持同時確定VNF 部署和傳輸路由;在數(shù)學模型中,給出了計算NS 所需鏈路帶寬資源的方法。通過優(yōu)化動態(tài)NS 部署方案,能提高網絡性能,為物聯(lián)網設備提高服務質量。

    1. 2 數(shù)學模型

    軟件定義電力物聯(lián)網的節(jié)點集合N 由物聯(lián)網設備集合D、網關集合I、控制器集合B 組成,即N =D∪I∪B;鏈路集合E 由物聯(lián)網設備之間的鏈路集合ED 、物聯(lián)網設備與網關之間的鏈路集合EI、網關與控制器之間的鏈路集合EB 組成,即E = ED ∪EI∪EB 。

    假設業(yè)務NS 內,具有業(yè)務需求的物聯(lián)網設備集合為U,顯然U-D,物聯(lián)網設備節(jié)點nd ∈U;可被選擇部署VNF 的候選網關集合為G,顯然G-I,網關節(jié)點ni∈G;物聯(lián)網設備nd 到網關ni 的候選路由集合為Pdi,第k 條路徑pdik ∈Pdi。在不失一般性的情況下,不指定節(jié)點類型而使用節(jié)點時,用符號nu或nv 表示,符號euv 表示nu 與nv 之間的鏈路,符號Cuv 表示鏈路euv 的剩余帶寬大小。

    本文數(shù)學模型將選擇合適網關部署VNF 和確定物聯(lián)網設備到網關的傳輸路由這2 個問題互相耦合。

    在部署NS 時,若網關ni 被某具有業(yè)務需求的物聯(lián)網設備nd 選擇以部署VNF,則變量xi = 1,否則xi = 0。當xi = 1 時,若路由pdik ∈Pdi 被選擇,則變量ydik = 1,否則ydik = 0;當xi = 0 時,變量ydik = 0。滿足:

    NS 所服務的業(yè)務的帶寬需求為z,任意鏈路euv所需帶寬資源為buv:

    buv = αuv z, (8)

    buv ≤ Cuv 。(9)

    傳輸路由的能量損耗、可靠性和剩余帶寬占有率是大多數(shù)網絡研究中的主要問題。在軟件定義電力物聯(lián)網業(yè)務NS 部署中,保障這3 個方面的性能,對提升端到端服務質量具有重大意義。故本文聯(lián)合上述3 個性能構建優(yōu)化目標。

    能量損耗的計算采用經典的二維功耗模型[16]。規(guī)定任意鏈路euv 的實際距離為luv m,任意設備接收t bit 數(shù)據(jù)將消耗式(10)所示能量,發(fā)送和傳輸t bit數(shù)據(jù)將消耗式(11)所示能量:

    聯(lián)合優(yōu)化目標方程如式(17)所示,令該優(yōu)化目標的值越大性能越好。

    maxy e-Eave + rel + wr 。 (17)

    2 動態(tài)切片策略

    2. 1 馬爾科夫決策過程

    馬爾科夫決策過程是對完全可觀測環(huán)境進行的描述。在使用深度強化學習求解前,要把待求解問題建模為馬爾科夫決策過程。馬爾科夫決策過程包含獎勵、決策,可用四元組(S,a,r,S′)表示,具體如下:

    ① S表示所有狀態(tài)的集合。

    ② a 表示選擇的動作,從動作空間選擇表示。

    ③ r(S,a,S′)表示在狀態(tài)S 下執(zhí)行動作a,狀態(tài)轉移至新狀態(tài)S′時獲得的獎勵。

    ④ S′表示執(zhí)行動作之后,新狀態(tài)的集合。

    智能體通過觀察當前環(huán)境狀態(tài)來選擇動作,并將所選動作應用于環(huán)境中,接著環(huán)境會給予智能體反饋,包括執(zhí)行動作所獲得的獎勵和新的狀態(tài)。根據(jù)環(huán)境反饋的獎勵和新狀態(tài),智能體做出新的動作決策。通過不斷重復上述過程,智能體進行訓練直到收斂,以達到理想的結果。在這個過程中,獎勵的反饋過程體現(xiàn)了馬爾科夫決策過程的特點。

    2. 2 雙深度Q 網絡算法

    常見的深度強化學習方法有兩大類[17]:基于值函數(shù)的學習方法和基于策略的學習方法。其中,深度Q 網絡(Deep Q-network,DQN)[18]算法和雙深度Q 網絡(Double Deep Q-network,DDQN)[19]算法是經典的基于值函數(shù)的學習方法,適用于具有離散動作空間的任務,符合本場景需求。

    傳統(tǒng)DQN 算法會高估某些動作的Q 值,導致智能體選擇的動作不穩(wěn)定,于是,研究者提出DDQN算法對其優(yōu)化。DDQN 算法與DQN 算法的網絡構造一致,均由一個訓練網絡和一個目標網絡組成。DDQN 算法在選擇下一個動作時使用訓練網絡來估計Q 值,但在評估下一個狀態(tài)的最佳動作時使用目標網絡來估計Q 值。計算如下:

    Qt(S,a) = r + γQt(S′,argmax a′(Q(S′,a′)))。(18)

    目標網絡是一個與訓練網絡結構相同但參數(shù)不同的網絡,用于計算目標Q 值。訓練網絡的參數(shù)實時更新,目標網絡的參數(shù)每經過固定步數(shù)后更新。參數(shù)更新的依據(jù)是,目標網絡和訓練網絡之間的Q值平方差反向傳播,計算如下:

    Loss = (Qt(S,a)- Q(S,a)) 2 。(19)

    逐步優(yōu)化2 個網絡的參數(shù),直至訓練出穩(wěn)定的動作價值函數(shù),能輸出最優(yōu)計算方案。

    另一方面,DDQN 算法需要大量的數(shù)據(jù)來訓練神經網絡參數(shù)。故要先構造經驗回放池,將智能體隨機探索的數(shù)據(jù)以四元組的形式存放其中,當存放數(shù)量達一定值后,智能體才能從池中隨機抽取樣本輸入網絡進行訓練。從經驗回放池中隨機抽取樣本的操作,可以減小所抽樣本之間的相關性。

    2. 3 深度強化學習動態(tài)切片算法

    為求解動態(tài)切片策略中的VNF 部署和傳輸路由確定這一聯(lián)合優(yōu)化問題,在DDQN 算法的基礎上,結合軟件定義電力物聯(lián)網場景,提出DRL-DSA。算法的整體框架如圖2 所示。

    狀態(tài)空間S 表示軟件定義電力物聯(lián)網的當前狀態(tài)。狀態(tài)通過網絡鏈路描述,包括鏈路的節(jié)點信息、剩余帶寬資源等,計算如下:

    式中:nj1 和nj2 分別表示第j 條鏈路兩端點,cj 表示第j 條鏈路的剩余帶寬資源,| E| 表示軟件定義電力物聯(lián)網中所有鏈路總數(shù)。

    動作空間a 表示切片部署方案,包含網關選擇部署VNF 結果和傳輸路由結果。本文欲縮減動作空間來降低計算復雜度,遂使用k-shortest paths 算法,為物聯(lián)網設備逐一選擇M 條到某個網關的傳輸路由,并構造候選路由集合,計算如下:

    式中: |U| 表示NS 內具有業(yè)務需求的物聯(lián)網設備總數(shù), |G |表示可能被選擇部署VNF 的網關總數(shù),d 和i 分別表示設備序號和網關序號,pdik 表示候選路由集合中第k 條路徑。

    獎勵函數(shù)r 由聯(lián)合優(yōu)化目標確定,如式(22)所示。隨著業(yè)務數(shù)據(jù)量增大,若當前所選的傳輸路由帶寬充足,將會獲得該獎勵,并繼續(xù)訓練;否則停止訓練。

    r = e-Eave + rel + w。(22)

    智能體為了處理盡可能多的多業(yè)務數(shù)據(jù),使每輪迭代的累計獎勵值最大化,將靈活地選擇其他剩余帶寬充足的傳輸路由,這樣同時保障了平均能量損耗、平均可靠性和平均剩余帶寬占有率。DRL-DSA 實現(xiàn)流程如算法1 所示。

    3 仿真分析

    3. 1 仿真環(huán)境及參數(shù)設計

    仿真環(huán)境使用Gym 框架編寫,仿真計算平臺為英特爾酷睿i7-10700 CPU,內存為16 GB,GPU 為NVIDIA GeForce GTX 1660 SUPER,操作系統(tǒng)為Windows 10。

    實驗模擬構建一個包含30 個物聯(lián)網設備,5 個物聯(lián)網網關的軟件定義電力物聯(lián)網拓撲。其中業(yè)務NS 承載5 個具有業(yè)務需求的物聯(lián)網設備,候選3 個可被部署VNF 的物聯(lián)網網關。網絡拓撲分布在300 m×300 m 范圍內,鏈路帶寬為1 000 ~ 2 500 B / s,各鏈路的故障率大小為0. 02 ~ 0. 09。

    本實驗對比基于最短傳輸路由的SP 切片算法和基于DQN 的Baseline 切片算法,通過設置不同業(yè)務數(shù)據(jù)量進行實驗,分析各個策略在平均能量損耗、平均可靠性、平均剩余帶寬占有率三方面的性能表現(xiàn),證明了本文求解出的動態(tài)切片策略具有有效性和優(yōu)越性。其中,業(yè)務數(shù)據(jù)量大小在512 ~ 1 024 B / s。

    設定模型訓練所需的其他參數(shù)值如表1 所示。

    3. 2 仿真結果分析

    所提DRL-DSA 切片算法和基于DQN 的Baseline 切片算法同屬于深度強化學習算法,故模型需要若干次重復訓練,直至收斂,才能得到最優(yōu)的動態(tài)切片策略,模型累積的獎勵值將在一個小范圍內波動,基本保持穩(wěn)定。圖3 展示了二者的獎勵值變化,當均達到收斂狀態(tài)時,DRL-DSA 獲得的累積獎勵值優(yōu)于Baseline 算法的累積獎勵值。根據(jù)式(22),證明DRL-DSA 算法在上述三方面的性能表現(xiàn)更好。

    展開分析各算法在平均能量損耗、平均可靠性和平均剩余帶寬占有率三方面的表現(xiàn)。

    在平均能量損耗方面,各算法求得的切片策略性能如圖4 所示。由式(13)可知,平均能量損耗僅和物聯(lián)網設備到所選網關之間的實際距離相關。隨著業(yè)務數(shù)據(jù)量增大,平均能量損耗必然增加。其中,由于SP 算法的切片策略是基于最短傳輸路由的策略,故其平均能量損耗必然是最小的。Baseline 算法和DRL-DSA 所求的是隨著網絡狀態(tài)變換的動態(tài)切片策略,為保障網絡整體的性能,某些狀態(tài)下所選的傳輸路由不是最短的,故其平均能量損耗略高,是正常表現(xiàn)。相比較Baseline 算法而言,DRL-DSA 接近SP 算法,平均能量損耗更小,性能更好。

    在平均可靠性方面,各算法求得的切片策略性能如圖5 所示。根據(jù)式(15),平均可靠性與物聯(lián)網設備選取的傳輸路由中各鏈路可靠性的乘積相關。顯然,SP 算法的切片策略不能根據(jù)網絡狀態(tài)改變,其平均可靠性保持不變,且僅依據(jù)傳輸路由的最短距離做決策,未考慮保障可靠性,因此表現(xiàn)最差。在某些業(yè)務數(shù)據(jù)量下,Baseline 算法和DRL-DSA 的策略一致,但后者在平均可靠性方面表現(xiàn)的上限更高,性能更好。

    在平均剩余帶寬占有率方面,各算法求得的切片策略性能如圖6 所示??梢钥闯觯驗椋樱?算法的切片策略一直選擇的是同一條傳輸路由,故隨著業(yè)務數(shù)據(jù)量增大,其平均剩余帶寬占有率呈線性下降。相反,DRL-DSA 和Baseline 算法改變了切片策略,選擇其他剩余帶寬容量大的傳輸路由,顯著限制了平均剩余帶寬占有率下降的速度,且隨著業(yè)務數(shù)據(jù)量增大,二者算法的優(yōu)勢愈發(fā)明顯。但由于DRL-DSA 的動作更加穩(wěn)定,所以探索的切片策略的平均剩余帶寬占有率要高于Baseline 算法探索的切片策略。

    4 結束語

    軟件定義電力物聯(lián)網通過部署業(yè)務NS 滿足海量物聯(lián)網設備的電力業(yè)務需求,但傳統(tǒng)的切片策略是基于最短傳輸路由的策略。當業(yè)務數(shù)據(jù)量激增時,傳統(tǒng)的切片策略由于不能根據(jù)當前網絡狀態(tài)靈活改變,將出現(xiàn)可靠性低下、鏈路擁塞等問題。針對上述問題,本文提出了基于深度強化學習的電力物聯(lián)網動態(tài)切片策略,并引入了DRLDSA 來求解該策略。所提策略能夠同時確定VNF 的部署和傳輸路由,并保證傳輸路由在平均能量損耗、平均可靠性和平均剩余帶寬占有率三方面的性能,實驗證明了該策略的有效性。本策略通過加入智能體實現(xiàn)切片的動態(tài)部署,為軟件定義電力物聯(lián)網的后續(xù)研究奠定了基礎。

    參考文獻

    [1] 何奉祿,陳佳琦,李欽豪,等. 智能電網中的物聯(lián)網技術應用與發(fā)展[J]. 電力系統(tǒng)保護與控制,2020,48(3):58-69.

    [2] 賀金紅,張港紅,高建. 5G 切片技術在電力物聯(lián)網應用的智能化管理[J]. 電力信息與通信技術,2020,18(5):19-25.

    [3] 趙慧玲,史凡. SDN / NFV 的發(fā)展與挑戰(zhàn)[J]. 電信科學,2014,30(8):13-18.

    [4] 臧玉華,鄭煥坤,尹世豪. 面向新型電力系統(tǒng)的5G 網絡切片資源分配策略[J]. 河北電力技術,2023,42(1):26-31.

    [5] RAFIQUE W,QI L Y,YAQOOB I,et al. ComplementingIoT Services Through Software Defined Networking andEdge Computing:A Comprehensive Survey[J]. IEEE Communications Surveys & Tutorials,2020,22(3):1761-1804.

    [6] 李航,溫向明,孔紫璇,等. 面向多樣化需求的網絡切片業(yè)務鏈部署[J]. 北京郵電大學學報,2022,45(2):9-15.

    [7] GUAN W Q,WEN X M,WANG L H,et al. A Serviceoriented Deployment Policy of EndtoEnd Network SlicingBased on Complex Network Theory [J]. IEEE Access,2018,6:19691-19701.

    [8] 王雅倩,陳心怡,曲睿,等. 基于SDN / NFV 的電力物聯(lián)網時延敏感業(yè)務編排方法[J]. 華北電力大學學報(自然科學版),2023,50(1):84-91.

    [9] 楊爽,龔亮亮,胡陽,等. 一種網絡切片編排算法在電力物聯(lián)網中的應用[J]. 電力信息與通信技術,2020,18(12):29-35.

    [10] 張菊,郭永峰. 深度學習研究綜述[J]. 教學研究,2021,44(3):6-11.

    [11] 劉全,翟建偉,章宗長,等. 深度強化學習綜述[J]. 計算機學報,2018,41(1):1-27.

    [12] ZHANG Z D,ZHANG D X,QIU R C. Deep ReinforcementLearning for Power System Applications:An Overview[J].CSEE Journal of Power and Energy Systems,2020,6(1):213-225.

    [13] ZHOU Y,CAO T,XIANG W. Anypath Routing ProtocolDesign via QLearning for Underwater Sensor Networks[J].IEEE Internet of Thing Journal,2021,8(10):8173-8190.

    [14] 向敏,饒華陽,張進進,等. 基于圖卷積神經網絡的軟件定義電力通信網絡路由控制策略[J]. 電子與信息學報,2021,43(2):388-395.

    [15] 葉萬余. 面向電力物聯(lián)網URLLC 業(yè)務的智能網絡切片管理方法[J]. 工業(yè)工程,2022,25(1):129-135.

    [16] 李鑫,劉楊,劉立業(yè). WSNs 中一種基于強化學習的跟蹤調度算法[J]. 無線電工程,2023,53(5):1221-1227.

    [17] LUONG N C,HOANG D T,GONG S M,et al. Applicationsof Deep Reinforcement Learning in Communications andNetworking:A Survey[J]. IEEE Communications Surveys& Tutorials,2019,21(4):3133-3174.

    [18] MNIH V,KAVUKCUOGLU K,SILVER D,et al. Humanlevel Control Through Deep Reinforcement Learning[J].Nature,2015,518(7540):529-533.

    [19] VAN HASSELT H,GUEZ A,SILVER D. Deep Reinforcement Learning with Double QLearning[C]∥Proceedingsof the AAAI Conference on Artificial Intelligence.Phoenix:AAAI Press,2016:2094-2100.

    作者簡介

    辛 銳 男,(1983—),碩士,高級工程師。主要研究方向:大數(shù)據(jù)、人工智能及網絡安全。

    (*通信作者)吳軍英 男,(1982—),碩士,高級工程師。主要研究方向:人工智能、物聯(lián)網、邊緣計算。

    薛 冰 女,(1999—),碩士研究生。主要研究方向:物聯(lián)網、人工智能。

    張鵬飛 男,(1985—),碩士,高級工程師。主要研究方向:物聯(lián)網、自然語言處理。

    李艷軍 男,(1977—),碩士,正高級會計師。主要研究方向:財務、技經及大數(shù)據(jù)。

    柴守亮 男,(1981—),碩士,正高級工程師。主要研究方向:信息通信和網絡安全。

    王佳楠 男,(1974—),碩士,工程師。主要研究方向:物聯(lián)網、大數(shù)據(jù)及人工智能。

    基金項目:河北省省級科技計劃資助(22310302D)

    猜你喜歡
    深度強化學習切片路由
    關于人工智能阿法元綜述
    商情(2019年14期)2019-06-15 10:20:13
    深度強化學習研究進展
    關于人工智能阿法元綜述
    西部論叢(2019年9期)2019-03-20 05:18:04
    探究路由與環(huán)路的問題
    基于深度強化學習的陸軍分隊戰(zhàn)術決策問題研究
    科學與財富(2018年7期)2018-05-21 08:46:30
    基于SDN與NFV的網絡切片架構
    電信科學(2016年11期)2016-11-23 05:07:58
    腎穿刺組織冷凍切片技術的改進方法
    冰凍切片、快速石蠟切片在中樞神經系統(tǒng)腫瘤診斷中的應用價值比較
    PRIME和G3-PLC路由機制對比
    WSN中基于等高度路由的源位置隱私保護
    計算機工程(2014年6期)2014-02-28 01:25:54
    精品熟女少妇av免费看| a级毛片免费高清观看在线播放| 日本色播在线视频| 亚洲乱码一区二区免费版| 深夜a级毛片| 少妇人妻一区二区三区视频| 国产高清激情床上av| 国产私拍福利视频在线观看| 变态另类丝袜制服| 精品久久久久久久久av| 嫩草影院精品99| 久久九九热精品免费| 久久久久精品国产欧美久久久| 熟妇人妻久久中文字幕3abv| 色在线成人网| 精品免费久久久久久久清纯| 久久久久性生活片| 国产日本99.免费观看| 国产中年淑女户外野战色| 亚洲国产色片| 女的被弄到高潮叫床怎么办| 午夜激情欧美在线| 美女cb高潮喷水在线观看| 欧美中文日本在线观看视频| 少妇熟女aⅴ在线视频| 99国产极品粉嫩在线观看| 国产一区二区在线av高清观看| 成人无遮挡网站| 九九爱精品视频在线观看| 伊人久久精品亚洲午夜| 18禁黄网站禁片免费观看直播| 亚洲性夜色夜夜综合| 亚洲成人久久爱视频| 成人午夜高清在线视频| 熟女人妻精品中文字幕| 国产亚洲精品综合一区在线观看| 精品人妻偷拍中文字幕| 欧美性猛交黑人性爽| 最近在线观看免费完整版| 男女那种视频在线观看| 中文字幕av成人在线电影| 变态另类丝袜制服| 国产视频内射| 婷婷亚洲欧美| 色吧在线观看| 午夜爱爱视频在线播放| 国产精品野战在线观看| 精品一区二区三区人妻视频| 精品久久久久久久久亚洲| 嫩草影院精品99| 岛国在线免费视频观看| 亚洲精品456在线播放app| 国产精品亚洲美女久久久| av天堂在线播放| 久久久久久大精品| 成年女人毛片免费观看观看9| av在线亚洲专区| 99国产极品粉嫩在线观看| 97在线视频观看| 一区二区三区四区激情视频 | 亚洲精品成人久久久久久| 亚洲欧美成人综合另类久久久 | 美女被艹到高潮喷水动态| 亚洲欧美日韩东京热| 伦理电影大哥的女人| 国产毛片a区久久久久| 小说图片视频综合网站| 日本免费一区二区三区高清不卡| 午夜福利在线在线| 久久99热这里只有精品18| 欧美精品国产亚洲| 免费观看人在逋| 97热精品久久久久久| 可以在线观看的亚洲视频| 别揉我奶头 嗯啊视频| 欧美高清成人免费视频www| 精品熟女少妇av免费看| eeuss影院久久| 午夜亚洲福利在线播放| 亚洲精品乱码久久久v下载方式| 亚洲色图av天堂| 国内揄拍国产精品人妻在线| 亚洲自偷自拍三级| 男女视频在线观看网站免费| 极品教师在线视频| 久久久a久久爽久久v久久| 国产精品乱码一区二三区的特点| 熟女电影av网| av天堂在线播放| 美女黄网站色视频| 欧美激情在线99| 人妻少妇偷人精品九色| 亚洲av电影不卡..在线观看| 99精品在免费线老司机午夜| 国产精品1区2区在线观看.| 91午夜精品亚洲一区二区三区| 日本色播在线视频| 国产av不卡久久| 一个人观看的视频www高清免费观看| 好男人在线观看高清免费视频| 欧美成人免费av一区二区三区| 成人美女网站在线观看视频| 亚洲av五月六月丁香网| 久久精品91蜜桃| 国产精品人妻久久久影院| 99在线视频只有这里精品首页| 欧美潮喷喷水| 亚洲精品日韩在线中文字幕 | 国产中年淑女户外野战色| 国产伦一二天堂av在线观看| 国产精品久久久久久精品电影| 亚洲欧美清纯卡通| 黄色欧美视频在线观看| 国产精品无大码| av卡一久久| 尤物成人国产欧美一区二区三区| 在线观看av片永久免费下载| 一个人观看的视频www高清免费观看| 级片在线观看| 91午夜精品亚洲一区二区三区| 深爱激情五月婷婷| 亚洲美女搞黄在线观看 | 精品人妻熟女av久视频| 日韩国内少妇激情av| 久久亚洲精品不卡| 99riav亚洲国产免费| 成人美女网站在线观看视频| 少妇人妻一区二区三区视频| 一级毛片我不卡| 国产色婷婷99| 亚洲美女黄片视频| 嫩草影院入口| 免费一级毛片在线播放高清视频| 91av网一区二区| 嫩草影院入口| 看黄色毛片网站| 日本与韩国留学比较| av在线播放精品| av黄色大香蕉| 97碰自拍视频| 美女内射精品一级片tv| 成人精品一区二区免费| 搡老岳熟女国产| 性插视频无遮挡在线免费观看| 亚洲av成人精品一区久久| 22中文网久久字幕| 国产精品久久久久久av不卡| 精品久久久久久久人妻蜜臀av| 99国产极品粉嫩在线观看| 久久6这里有精品| 亚洲天堂国产精品一区在线| 亚洲精品在线观看二区| 国产成人a∨麻豆精品| 国产大屁股一区二区在线视频| 成人av一区二区三区在线看| 免费人成视频x8x8入口观看| 欧美潮喷喷水| 国产精品av视频在线免费观看| 禁无遮挡网站| 九色成人免费人妻av| 人妻少妇偷人精品九色| 成年版毛片免费区| 亚洲18禁久久av| 美女 人体艺术 gogo| 又黄又爽又免费观看的视频| 亚洲内射少妇av| 免费看av在线观看网站| 夜夜看夜夜爽夜夜摸| 97在线视频观看| 欧美成人精品欧美一级黄| 国产精品亚洲一级av第二区| 精品久久国产蜜桃| 午夜精品国产一区二区电影 | 亚洲美女黄片视频| 一本一本综合久久| 国产成人freesex在线 | 久久鲁丝午夜福利片| 国产蜜桃级精品一区二区三区| 国产真实乱freesex| 内射极品少妇av片p| 我的女老师完整版在线观看| 成年免费大片在线观看| 日本-黄色视频高清免费观看| 我要看日韩黄色一级片| 淫妇啪啪啪对白视频| 婷婷精品国产亚洲av在线| 卡戴珊不雅视频在线播放| 久久久久精品国产欧美久久久| h日本视频在线播放| 色噜噜av男人的天堂激情| 日本免费a在线| 在现免费观看毛片| 美女 人体艺术 gogo| 免费观看精品视频网站| 精品少妇黑人巨大在线播放 | 99久久九九国产精品国产免费| 村上凉子中文字幕在线| 嫩草影院精品99| 午夜激情福利司机影院| 午夜精品一区二区三区免费看| 亚洲欧美精品自产自拍| 99久久精品热视频| 一级毛片久久久久久久久女| 最近的中文字幕免费完整| 成人一区二区视频在线观看| 日本黄大片高清| 99在线人妻在线中文字幕| 简卡轻食公司| 麻豆一二三区av精品| 久久热精品热| 国产av不卡久久| 国产片特级美女逼逼视频| 欧美一级a爱片免费观看看| 22中文网久久字幕| 久久久成人免费电影| 亚洲精品国产av成人精品 | 久久精品夜夜夜夜夜久久蜜豆| 亚洲七黄色美女视频| 啦啦啦啦在线视频资源| 亚洲欧美日韩东京热| 一a级毛片在线观看| 欧美在线一区亚洲| 一本精品99久久精品77| 两个人的视频大全免费| 男女边吃奶边做爰视频| 午夜激情欧美在线| 亚洲人成网站在线观看播放| 久久99热这里只有精品18| 国产日本99.免费观看| 插逼视频在线观看| 狠狠狠狠99中文字幕| 成人综合一区亚洲| 久久久成人免费电影| 桃色一区二区三区在线观看| 国产高清视频在线播放一区| 午夜老司机福利剧场| 小蜜桃在线观看免费完整版高清| 九九久久精品国产亚洲av麻豆| 亚洲成人久久爱视频| 网址你懂的国产日韩在线| 女生性感内裤真人,穿戴方法视频| 亚洲精品乱码久久久v下载方式| 久久久午夜欧美精品| 日韩欧美精品免费久久| 一个人看视频在线观看www免费| 国产av不卡久久| 亚洲美女搞黄在线观看 | 久久精品国产亚洲av天美| 97碰自拍视频| 久99久视频精品免费| h日本视频在线播放| 嫩草影院精品99| 淫妇啪啪啪对白视频| 少妇丰满av| 久久久久性生活片| 又粗又爽又猛毛片免费看| 国模一区二区三区四区视频| 欧美不卡视频在线免费观看| 校园人妻丝袜中文字幕| 可以在线观看毛片的网站| 亚洲欧美成人综合另类久久久 | 麻豆成人午夜福利视频| 欧美日韩一区二区视频在线观看视频在线 | 国产精品一区二区性色av| 日韩av在线大香蕉| 免费看光身美女| 亚洲熟妇熟女久久| 最近最新中文字幕大全电影3| 亚洲国产精品sss在线观看| 国产成人影院久久av| 国产探花在线观看一区二区| 中文在线观看免费www的网站| 高清毛片免费看| 色综合色国产| 国产午夜精品久久久久久一区二区三区 | 亚洲自拍偷在线| 一区二区三区四区激情视频 | 国产91av在线免费观看| 国产白丝娇喘喷水9色精品| 九九久久精品国产亚洲av麻豆| 国产亚洲av嫩草精品影院| 天堂av国产一区二区熟女人妻| 国产男靠女视频免费网站| 日日摸夜夜添夜夜爱| 99精品在免费线老司机午夜| www日本黄色视频网| 97热精品久久久久久| 国产色婷婷99| 日产精品乱码卡一卡2卡三| 69人妻影院| 在线播放国产精品三级| 国产成人精品久久久久久| 欧美成人免费av一区二区三区| 国产精品国产高清国产av| 97超视频在线观看视频| 亚洲人成网站在线播| 久久欧美精品欧美久久欧美| 99久久精品国产国产毛片| 国产白丝娇喘喷水9色精品| 国产精品爽爽va在线观看网站| 久久久国产成人精品二区| 中文亚洲av片在线观看爽| 日韩欧美免费精品| 国产大屁股一区二区在线视频| 日产精品乱码卡一卡2卡三| 午夜爱爱视频在线播放| 91久久精品电影网| 久久久色成人| 寂寞人妻少妇视频99o| 久久久久国内视频| av福利片在线观看| av卡一久久| 久久鲁丝午夜福利片| 深爱激情五月婷婷| 国产色爽女视频免费观看| 国产高清视频在线播放一区| 搡女人真爽免费视频火全软件 | 中文字幕精品亚洲无线码一区| 精品久久久久久久人妻蜜臀av| 欧美日韩在线观看h| 性色avwww在线观看| 成人欧美大片| 国产午夜精品久久久久久一区二区三区 | 免费在线观看成人毛片| 亚洲第一区二区三区不卡| 黄色视频,在线免费观看| 免费在线观看成人毛片| 两性午夜刺激爽爽歪歪视频在线观看| 日韩制服骚丝袜av| 在线免费十八禁| 亚洲欧美日韩东京热| 国产一区亚洲一区在线观看| 99热全是精品| 变态另类成人亚洲欧美熟女| 日韩欧美三级三区| 欧美色欧美亚洲另类二区| 国产白丝娇喘喷水9色精品| 国产成人福利小说| 欧美极品一区二区三区四区| 国产免费一级a男人的天堂| 最近中文字幕高清免费大全6| 亚洲人成网站高清观看| 亚洲自拍偷在线| 免费观看的影片在线观看| 啦啦啦观看免费观看视频高清| 五月伊人婷婷丁香| 国产精华一区二区三区| .国产精品久久| 免费搜索国产男女视频| 免费av不卡在线播放| 欧美zozozo另类| 看免费成人av毛片| 99久久无色码亚洲精品果冻| 熟妇人妻久久中文字幕3abv| av视频在线观看入口| 日本熟妇午夜| 久久久久久大精品| 国产成人一区二区在线| 男女之事视频高清在线观看| 看免费成人av毛片| 亚洲五月天丁香| 黄色一级大片看看| 久久午夜福利片| 国语自产精品视频在线第100页| 丝袜美腿在线中文| 一个人看的www免费观看视频| 免费搜索国产男女视频| 亚洲成人av在线免费| 久久天躁狠狠躁夜夜2o2o| 看免费成人av毛片| 国产一区二区三区在线臀色熟女| 成熟少妇高潮喷水视频| 此物有八面人人有两片| 午夜福利高清视频| 一区二区三区高清视频在线| 一级毛片我不卡| 日韩国内少妇激情av| 国产一区二区亚洲精品在线观看| 国产av一区在线观看免费| 日韩中字成人| 色视频www国产| 亚洲av中文av极速乱| 亚洲精品影视一区二区三区av| 久久久久久久久久成人| 丰满的人妻完整版| 国产精品嫩草影院av在线观看| 国产精品国产高清国产av| 波多野结衣高清作品| 欧美成人免费av一区二区三区| 亚洲国产高清在线一区二区三| 激情 狠狠 欧美| 亚洲人成网站高清观看| 国产一区二区在线观看日韩| 简卡轻食公司| 国产视频一区二区在线看| 露出奶头的视频| 亚洲在线观看片| 久久精品久久久久久噜噜老黄 | 悠悠久久av| 免费人成视频x8x8入口观看| 日韩在线高清观看一区二区三区| 国产不卡一卡二| 一进一出抽搐动态| 女同久久另类99精品国产91| 美女xxoo啪啪120秒动态图| 久久久a久久爽久久v久久| 国内揄拍国产精品人妻在线| 又爽又黄无遮挡网站| 成人毛片a级毛片在线播放| 亚洲va在线va天堂va国产| 国产精品一区二区三区四区免费观看 | 99热这里只有是精品在线观看| 日本与韩国留学比较| 久久久国产成人精品二区| 欧美日韩精品成人综合77777| 亚洲不卡免费看| av免费在线看不卡| 国产精品电影一区二区三区| 久久久久久久久大av| 国产精品一二三区在线看| 久久午夜亚洲精品久久| 麻豆精品久久久久久蜜桃| 国产精品国产高清国产av| 国产精品三级大全| 丝袜喷水一区| 男女下面进入的视频免费午夜| 精品人妻熟女av久视频| av在线亚洲专区| 欧美激情国产日韩精品一区| 国产一区二区在线av高清观看| 国产精品久久电影中文字幕| 日韩欧美 国产精品| 一边摸一边抽搐一进一小说| 国产探花极品一区二区| 国产精品日韩av在线免费观看| 亚洲欧美日韩高清在线视频| 色吧在线观看| 乱码一卡2卡4卡精品| 国产精品一及| 午夜久久久久精精品| 精品久久久久久久久亚洲| 麻豆精品久久久久久蜜桃| 成年女人看的毛片在线观看| 男女之事视频高清在线观看| 麻豆一二三区av精品| 亚洲精品色激情综合| 特大巨黑吊av在线直播| 神马国产精品三级电影在线观看| 久久韩国三级中文字幕| 久久精品夜色国产| ponron亚洲| 禁无遮挡网站| 高清午夜精品一区二区三区 | 中文字幕熟女人妻在线| 欧美潮喷喷水| 长腿黑丝高跟| 国产色爽女视频免费观看| 久久精品国产清高在天天线| 国产69精品久久久久777片| 亚洲精品在线观看二区| 国产人妻一区二区三区在| 成人亚洲欧美一区二区av| av视频在线观看入口| 欧美日本视频| 久久精品综合一区二区三区| 中文在线观看免费www的网站| 国产 一区精品| 1024手机看黄色片| 国产精品国产高清国产av| 国产精品日韩av在线免费观看| 校园春色视频在线观看| 12—13女人毛片做爰片一| 欧美zozozo另类| 久久久欧美国产精品| 日日撸夜夜添| 久久草成人影院| 身体一侧抽搐| 91久久精品国产一区二区成人| 赤兔流量卡办理| 色综合亚洲欧美另类图片| 乱系列少妇在线播放| h日本视频在线播放| 久久综合国产亚洲精品| 日本三级黄在线观看| 亚洲乱码一区二区免费版| 最近在线观看免费完整版| 成年版毛片免费区| 一本久久中文字幕| 国产精品综合久久久久久久免费| 美女 人体艺术 gogo| 美女免费视频网站| 色尼玛亚洲综合影院| 国产成人91sexporn| 观看免费一级毛片| 国产私拍福利视频在线观看| 亚洲丝袜综合中文字幕| 偷拍熟女少妇极品色| 大香蕉久久网| 春色校园在线视频观看| 成人毛片a级毛片在线播放| 51国产日韩欧美| 亚洲国产精品sss在线观看| 成人亚洲精品av一区二区| 精品国产三级普通话版| 国产aⅴ精品一区二区三区波| 国产亚洲91精品色在线| 国产亚洲精品av在线| av在线播放精品| 女同久久另类99精品国产91| 久久国内精品自在自线图片| 此物有八面人人有两片| 亚洲美女搞黄在线观看 | 尤物成人国产欧美一区二区三区| 久久久久久久久久黄片| 麻豆一二三区av精品| 亚洲七黄色美女视频| 亚洲av五月六月丁香网| 欧美成人一区二区免费高清观看| 波野结衣二区三区在线| 日日摸夜夜添夜夜爱| 久久久久久久久久成人| 亚洲精品粉嫩美女一区| 国内精品久久久久精免费| 黄片wwwwww| 欧美3d第一页| 又粗又爽又猛毛片免费看| 麻豆国产av国片精品| 午夜爱爱视频在线播放| ponron亚洲| 桃色一区二区三区在线观看| 男人舔女人下体高潮全视频| 久久久久久久久久久丰满| av免费在线看不卡| 国产色婷婷99| 亚洲性夜色夜夜综合| 伦精品一区二区三区| 丝袜美腿在线中文| 你懂的网址亚洲精品在线观看 | 在线观看66精品国产| 两个人视频免费观看高清| 精品一区二区三区av网在线观看| 在线免费观看的www视频| 99精品在免费线老司机午夜| or卡值多少钱| 免费av观看视频| 偷拍熟女少妇极品色| 婷婷亚洲欧美| 中国美女看黄片| 99视频精品全部免费 在线| 成人av在线播放网站| 自拍偷自拍亚洲精品老妇| 午夜精品国产一区二区电影 | 免费在线观看成人毛片| 一区二区三区高清视频在线| 国产真实乱freesex| 成人av一区二区三区在线看| 最近在线观看免费完整版| 你懂的网址亚洲精品在线观看 | 国产精品无大码| 免费看日本二区| 亚洲美女黄片视频| 午夜激情福利司机影院| 嫩草影视91久久| 日本黄色片子视频| 99国产极品粉嫩在线观看| 午夜爱爱视频在线播放| 人人妻,人人澡人人爽秒播| 女人被狂操c到高潮| 亚洲精品日韩av片在线观看| 欧洲精品卡2卡3卡4卡5卡区| 国产精品久久久久久精品电影| 亚洲人成网站高清观看| 国产av不卡久久| 波多野结衣巨乳人妻| 嫩草影院精品99| 国产成人freesex在线 | 婷婷精品国产亚洲av| av卡一久久| 日本黄色视频三级网站网址| 美女cb高潮喷水在线观看| 亚洲欧美精品自产自拍| 午夜爱爱视频在线播放| av中文乱码字幕在线| 97超级碰碰碰精品色视频在线观看| 日韩欧美精品v在线| 九九爱精品视频在线观看| 91麻豆精品激情在线观看国产| 变态另类成人亚洲欧美熟女| 高清毛片免费观看视频网站| 悠悠久久av| 日本撒尿小便嘘嘘汇集6| 一a级毛片在线观看| 老女人水多毛片| 亚洲国产欧洲综合997久久,| 看黄色毛片网站| 国产高清有码在线观看视频| 欧美区成人在线视频| 男插女下体视频免费在线播放| 国产免费一级a男人的天堂| 桃色一区二区三区在线观看| avwww免费| 人妻丰满熟妇av一区二区三区| 最近视频中文字幕2019在线8| 亚洲最大成人中文| 99久国产av精品国产电影| 久久欧美精品欧美久久欧美| 免费黄网站久久成人精品| 12—13女人毛片做爰片一| 日韩成人av中文字幕在线观看 | or卡值多少钱| .国产精品久久| 国产精品嫩草影院av在线观看| 神马国产精品三级电影在线观看| 欧美极品一区二区三区四区| 国产一区亚洲一区在线观看|