章廣梅,王均春,胡金龍,董守玲,徐寅鑫
(1.中國電子科技集團公司第七研究所, 廣東 廣州 510310 2.國防科技大學(xué) 信息通信學(xué)院,湖北 武漢 430010 3.華南理工大學(xué) 計算機科學(xué)與工程學(xué)院, 廣東 廣州 510640)
5G 網(wǎng)絡(luò)使得網(wǎng)絡(luò)應(yīng)用類型變得更加多樣,未來必將涌現(xiàn)各種具有差異化性能需求的新型應(yīng)用,比如,有些應(yīng)用需要低時延,有些應(yīng)用需要高帶寬,而有些應(yīng)用則需要更高的可靠性要求。 然而,當(dāng)前網(wǎng)絡(luò)一方面還不夠靈活,無法充分利用網(wǎng)絡(luò)資源進行業(yè)務(wù)服務(wù),導(dǎo)致每引入一種新業(yè)務(wù)就要單獨配備一套獨立的網(wǎng)絡(luò)結(jié)構(gòu)和資源,對網(wǎng)絡(luò)管理和運營帶來了較大不便且資源利用率低,而另一方面則是無法實現(xiàn)業(yè)務(wù)定制化的數(shù)據(jù)傳輸需求,僅能滿足已有常見的業(yè)務(wù)性能。
現(xiàn)有的網(wǎng)絡(luò)切片調(diào)度算法主要包括啟發(fā)式算法和基于軟件定義網(wǎng)絡(luò)(SDN)架構(gòu)的調(diào)度算法。 傳統(tǒng)的調(diào)度方式,比如利用遺傳算法[1]解決服務(wù)功能鏈(SFC)的部署,以此達到鏈路之間的公平分配,但是這種方法僅僅是解決單一調(diào)度周期的問題,并且現(xiàn)有的網(wǎng)絡(luò)環(huán)境是復(fù)雜多變的,傳統(tǒng)算法選擇的鏈路很有可能在某一時刻發(fā)生堵塞而無法進行流量傳輸,而其他鏈路又是處于空閑狀態(tài),這就造成了資源的不必要浪費,因此傳統(tǒng)算法具有一定的局限性。SDN 的出現(xiàn)為數(shù)據(jù)中心網(wǎng)絡(luò)的發(fā)展提供了契機[2],其中,基于SDN 與網(wǎng)絡(luò)功能虛擬化(NFV)融合的網(wǎng)絡(luò)切片資源分配優(yōu)化算法[3],對不同的業(yè)務(wù)需求劃分對應(yīng)的虛擬子網(wǎng)節(jié)點集合,再根據(jù)不同SFC 的要求,對每一類網(wǎng)絡(luò)切片建模;基于最大最小蟻群的NFV 部署方法[4],利用SFC 保留歷史隊列信息以預(yù)測網(wǎng)絡(luò)的未來狀態(tài),根據(jù)預(yù)測結(jié)果進行NFV 的調(diào)度;基于改進式貪婪算法的5G 網(wǎng)絡(luò)切片動態(tài)資源調(diào)度策略[5],將用戶和切片按優(yōu)先級和服務(wù)權(quán)重從大到小排列,依次組合起來,完成用戶服務(wù);基于GA?PSO 優(yōu)化的網(wǎng)絡(luò)切片編排算法[6],通過遺傳算法中的雜交變異思想,進行快速隨機搜索,更新并優(yōu)化網(wǎng)絡(luò)切片,然后利用粒子群追逐局部最優(yōu)解與全局最優(yōu)解,從而得到最優(yōu)的網(wǎng)絡(luò)切片。 這些方法雖然改變了切換業(yè)務(wù)與新業(yè)務(wù)的被動接受的優(yōu)先級[7],但是使用固定的調(diào)度閾值,一旦網(wǎng)絡(luò)環(huán)境發(fā)生變化,上述方法一般需要重新進行搜索求解,且當(dāng)網(wǎng)絡(luò)環(huán)境復(fù)雜時算法收斂速度較慢,難以適應(yīng)在線或?qū)崟r的網(wǎng)絡(luò)切片調(diào)度需求。
為了動態(tài)調(diào)整切片的調(diào)度閾值以適應(yīng)網(wǎng)絡(luò)環(huán)境的變化,本文在預(yù)路徑規(guī)劃的切片構(gòu)造算法[8]的基礎(chǔ)上,提出一種基于深度強化學(xué)習(xí)的切片調(diào)度算法,為不同的業(yè)務(wù)靈活提供定制化服務(wù),在適應(yīng)多變復(fù)雜的網(wǎng)絡(luò)環(huán)境的前提下,盡可能減少切片構(gòu)造的時間開銷,將切片構(gòu)造和切片調(diào)度算法相結(jié)合,快速高效地實現(xiàn)業(yè)務(wù)數(shù)據(jù)定制化傳輸和通信網(wǎng)絡(luò)高效靈活的可管可控。
當(dāng)今網(wǎng)絡(luò)足夠復(fù)雜,網(wǎng)絡(luò)中存在多個用戶,并且每個用戶可以訪問不同類型的應(yīng)用服務(wù)器,網(wǎng)絡(luò)拓撲圖也十分龐大。 如果使用復(fù)雜的路由算法[9],將會耗費很多時間來計算路由,增加了計算的時間開銷,因此本文根據(jù)業(yè)務(wù)QoS 需求表、網(wǎng)絡(luò)拓撲信息和業(yè)務(wù)流量信息預(yù)先構(gòu)造切片路徑,按照業(yè)務(wù)的優(yōu)先級從高到低依次執(zhí)行QoS 切片構(gòu)造算法,為每一種業(yè)務(wù)類型構(gòu)造出專屬的網(wǎng)絡(luò)鏈路并保留網(wǎng)絡(luò)切片資源,主要分為信息搜集和切片構(gòu)造的路徑劃分兩部分。
主要負責(zé)搜集3 類信息,分別是業(yè)務(wù)的QoS 需求表、網(wǎng)絡(luò)拓撲信息以及網(wǎng)絡(luò)流量信息,其中:
(1) 業(yè)務(wù)的QoS 需求表包括業(yè)務(wù)的類型、優(yōu)先級、帶寬需求、時延要求、可靠性要求、頻率需求等信息。
(2) 網(wǎng)絡(luò)拓撲信息即網(wǎng)絡(luò)拓撲有向圖,可以從實際的網(wǎng)絡(luò)拓撲轉(zhuǎn)換而來,有向圖中的邊代表節(jié)點之間的鏈路,邊權(quán)重代表鏈路的帶寬大小。
(3) 網(wǎng)絡(luò)流量信息即根據(jù)歷史信息得到的每種業(yè)務(wù)的帶寬需求的閾值、各個業(yè)務(wù)的發(fā)送端節(jié)點和接收端節(jié)點構(gòu)成的業(yè)務(wù)矩陣以及網(wǎng)絡(luò)中分配的頻率資源池。
QoS 切片構(gòu)造的過程可以描述為:給定網(wǎng)絡(luò)的整體拓撲結(jié)構(gòu),將業(yè)務(wù)的QoS 需求、業(yè)務(wù)矩陣和頻率資源池作為輸入,根據(jù)QoS 切片的構(gòu)造方法為該業(yè)務(wù)劃分出一組切片資源,將該切片資源分出一部分用于滿足該業(yè)務(wù)的QoS 需求,修改資源池中的有效可用資源,并從頻率資源池中選出與業(yè)務(wù)需求最貼近的頻率分配給業(yè)務(wù),修改資源池中的剩余頻率資源,最后使用貪婪算法將所有的業(yè)務(wù)全部處理完畢。
單個的QoS 切片構(gòu)造的目標(biāo)函數(shù)及約束條件如下。
式中:E 表示邊集合;b(u,v)表示邊(u,v)是否用于傳輸流量;jQ表示業(yè)務(wù)的頻率需求;kQ表示網(wǎng)絡(luò)分配的頻率;g(u,v)表示某一流量在邊(u,v)上傳輸?shù)牧?;a(u,v)表示鏈路的總?cè)萘浚籪Q表示業(yè)務(wù)的帶寬需求。
該算法的目標(biāo)是在滿足業(yè)務(wù)QoS 需求的前提下,業(yè)務(wù)傳輸使用的鏈路條數(shù)最少,以此保證時延,并且把網(wǎng)絡(luò)中的頻率資源最貼合地分配給對應(yīng)的業(yè)務(wù)。 約束條件則依次表示某一條鏈路只能選擇傳輸或者不傳輸業(yè)務(wù)流量;業(yè)務(wù)傳輸?shù)牧髁考炔荒艹^鏈路的總?cè)萘?,也必須要滿足業(yè)務(wù)的帶寬需求;鏈路的傳輸總流量不能超過其總?cè)萘?;中間節(jié)點輸入輸出的流量需要保持一致,發(fā)送端和接收端節(jié)點的流量也要和業(yè)務(wù)流量保持一致。
使用貪婪算法完成所有QoS 切片的構(gòu)造:按優(yōu)先級高低依次處理各類業(yè)務(wù),對每一類業(yè)務(wù),選擇對應(yīng)的網(wǎng)絡(luò)頻率進行分配,求得切片路徑,保留路徑上的節(jié)點所要傳輸?shù)臉I(yè)務(wù)流量,修改各節(jié)點上剩余資源數(shù)量以及修改網(wǎng)絡(luò)可用頻率信息,然后處理下一個業(yè)務(wù),直到優(yōu)先級最低的業(yè)務(wù)也被處理。
現(xiàn)有的網(wǎng)絡(luò)切片調(diào)度算法主要采用的是啟發(fā)式算法,或者是基于精確數(shù)學(xué)模型的優(yōu)化算法,然而這些算法并沒有考慮到無線網(wǎng)絡(luò)環(huán)境的時變性,目前采用的算法規(guī)則大多是固定的、不可變化的,并不具有自我演進的功能。 此外,由于寬窄融合網(wǎng)絡(luò)拓撲十分復(fù)雜,很難在拓撲和切片的選擇以及實際效果之間推導(dǎo)出精確的關(guān)系表達式即啟發(fā)式算法的固定規(guī)則很難在復(fù)雜的網(wǎng)絡(luò)拓撲環(huán)境中推導(dǎo)出來,因此本文以切片構(gòu)造的結(jié)果為基礎(chǔ),采用基于深度強化學(xué)習(xí)的方法,學(xué)習(xí)在不同的網(wǎng)絡(luò)環(huán)境下切片調(diào)度的最優(yōu)調(diào)度策略,即每個切片的可用帶寬閾值,切片調(diào)度時,切片可用帶寬高于閾值則繼續(xù)選擇該切片進行調(diào)度,低于閾值則選擇優(yōu)先級更高的切片進行調(diào)度,以此達到業(yè)務(wù)定制化數(shù)據(jù)傳輸?shù)男枨蟆?/p>
圖1 表示在每個調(diào)度周期,切片調(diào)度器根據(jù)觀測到的網(wǎng)絡(luò)狀態(tài)以及感知到的業(yè)務(wù)信息,將其作為策略神經(jīng)網(wǎng)絡(luò)的輸入,并輸出此時選擇各個切片的概率向量,然后調(diào)度器選擇概率最大的切片來執(zhí)行選擇動作,并觀察獎勵函數(shù)的反饋,不斷迭代,直到在每一個調(diào)度周期,調(diào)度器都能執(zhí)行最優(yōu)的調(diào)度策略,達到定制化服務(wù)的要求。
圖1 調(diào)度周期流程圖
2.2.2 深度確定性策略梯度(DDPG)網(wǎng)絡(luò)模型
采用的DDPG 網(wǎng)絡(luò)模型有4 個網(wǎng)絡(luò),分別是Actor 當(dāng)前網(wǎng)絡(luò)、Actor 目標(biāo)網(wǎng)絡(luò)、Critic 當(dāng)前網(wǎng)絡(luò)、Critic 目標(biāo)網(wǎng)絡(luò),它們的功能分別如下。
Actor 當(dāng)前網(wǎng)絡(luò):實現(xiàn)策略神經(jīng)網(wǎng)絡(luò)參數(shù)ω的更新,其根據(jù)當(dāng)前狀態(tài)st選擇動作at, 與環(huán)境交互后得到下一個狀態(tài)st+1和環(huán)境反饋的獎勵值rt;
Actor 目標(biāo)網(wǎng)絡(luò):從經(jīng)驗回收池中采樣下一個狀態(tài)st+1, 選擇下一個最優(yōu)動作at+1, 并且定期將Actor 當(dāng)前網(wǎng)絡(luò)參數(shù)ω復(fù)制給ω′;
Critic 當(dāng)前網(wǎng)絡(luò):實現(xiàn)價值網(wǎng)絡(luò)參數(shù)θ的更新,計算當(dāng)前Q值和目標(biāo)Q值;
Critic 目標(biāo)網(wǎng)絡(luò):負責(zé)協(xié)助計算目標(biāo)Q值,并且定期將Critic 當(dāng)前網(wǎng)絡(luò)參數(shù)θ復(fù)制給θ′。
狀態(tài):假設(shè)在第t個調(diào)度周期時,系統(tǒng)的狀態(tài)表示為st=(st,1,st,2,…,st,n),其中st,i(1 ≤i≤n)表示第i個切片在第t個周期的網(wǎng)絡(luò)狀態(tài)。st,i有多個狀態(tài)參數(shù)構(gòu)成,其定義為st,i=(xt,i,wt,i,dt,i,ut,i,vt,i,ct,i),其中
xt,i:在第t個調(diào)度周期,第i個切片的可用帶寬;
wt,i:在第t個調(diào)度周期,業(yè)務(wù)請求的帶寬需求;
dt,i:在第t個調(diào)度周期,第i個切片的平均往返時延;ut,j:在第t個調(diào)度周期,業(yè)務(wù)請求的時延要求;vt,i:在第t個調(diào)度周期,第i個切片的丟包率;ct,i:在第t個調(diào)度周期,業(yè)務(wù)請求的丟包率要求;
動作:智能體觀測環(huán)境狀態(tài)后,經(jīng)過確定性策略返回一組概率向量,表示將該業(yè)務(wù)調(diào)度到某個切片的概率值,切片調(diào)度器選擇最大概率值的切片進行業(yè)務(wù)分配,此即為強化學(xué)習(xí)算法的動作at。
獎勵:智能體根據(jù)策略選擇動作后,在下一個調(diào)度周期切片調(diào)度器執(zhí)行該動作選擇業(yè)務(wù)對應(yīng)的切片,該周期結(jié)束時狀態(tài)更新為下一個狀態(tài),同時將本次調(diào)度的獎勵值rt交給智能體。
策略:本文采用深度強化學(xué)習(xí)的DDPG 算法,是確定性策略,執(zhí)行該策略時,得到一個狀態(tài)st, 智能體就會執(zhí)行對應(yīng)的動作at=μ(st)。 具體來說,切片調(diào)度器的調(diào)度策略的執(zhí)行過程可表示為根據(jù)當(dāng)前環(huán)境狀態(tài)的序列選擇一系列對應(yīng)的動作來執(zhí)行切片調(diào)度。 在DDPG 算法中使用人工神經(jīng)網(wǎng)絡(luò)來表示策略,網(wǎng)絡(luò)的輸入是狀態(tài)信息和業(yè)務(wù)信息,網(wǎng)絡(luò)的輸出則是調(diào)度動作。
2.2.3 獎勵函數(shù)
本文設(shè)計的獎勵函數(shù)如下
式中:0<λ <1,0<α <1,0<β <1 表示權(quán)重,獎勵函數(shù)的第一項代表切片可用帶寬與業(yè)務(wù)的帶寬需求的貼合程度,因為本文設(shè)計的獎勵函數(shù)側(cè)重于帶寬需求,因此將二者的差值作為分母以提高其權(quán)重;獎勵函數(shù)的第二項代表業(yè)務(wù)的時延要求與切片當(dāng)前時延的貼合程度;獎勵函數(shù)的第三項代表業(yè)務(wù)的丟包要求和切片當(dāng)前丟包率的貼合程度。
2.3.1 基于深度強化學(xué)習(xí)的切片調(diào)度框架
本文采用人工神經(jīng)網(wǎng)絡(luò)表示調(diào)度的確定性策略和值函數(shù)的估值,將觀測到的網(wǎng)絡(luò)環(huán)境狀態(tài)和業(yè)務(wù)感知端感知到的業(yè)務(wù)信息作為神經(jīng)網(wǎng)絡(luò)的輸入,輸出則是值函數(shù)的估值信息和一個概率向量,切片調(diào)度器選擇概率最大的切片進行調(diào)度,視為調(diào)度動作。
具體的實現(xiàn)過程為:(1) 首先進行網(wǎng)絡(luò)訓(xùn)練,感知端感知業(yè)務(wù)類型,得到業(yè)務(wù)對應(yīng)的QoS 需求,切片調(diào)度器實時監(jiān)測所有切片的網(wǎng)絡(luò)狀態(tài),將業(yè)務(wù)和切片的信息作為DDPG 神經(jīng)網(wǎng)絡(luò)的初始狀態(tài),利用貪心策略選擇概率值最大的切片進行調(diào)度,得到當(dāng)前獎勵值并更新下一個時刻的神經(jīng)網(wǎng)絡(luò)狀態(tài),不斷訓(xùn)練直到模型收斂,學(xué)出較好的調(diào)度策略即根據(jù)獎勵函數(shù)的反饋學(xué)到每個切片的帶寬利用閾值,切片可用帶寬高于閾值,則繼續(xù)選擇該切片傳輸業(yè)務(wù),切片帶寬低于閾值,則選擇更高優(yōu)先級的切片傳輸業(yè)務(wù)。 (2) 然后進行切片調(diào)度,使用訓(xùn)練得到的調(diào)度策略進行切片調(diào)度,并把每次調(diào)度的信息以(st,at,rt,st+1,t) 的形式存入經(jīng)驗回收池,經(jīng)過一定調(diào)度周期后將經(jīng)驗回收池中儲存的數(shù)據(jù)按批次取出,繼續(xù)訓(xùn)練網(wǎng)絡(luò),得到更好的調(diào)度策略,如此反復(fù)迭代,直到獎勵函數(shù)值不再提升為止,得到最好的調(diào)度策略,整體框架如圖2 所示。
圖2 基于深度強化學(xué)習(xí)的網(wǎng)絡(luò)切片調(diào)度算法框架
圖2 的控制層實現(xiàn)切片的在線調(diào)度,切片調(diào)度器將觀測到的網(wǎng)絡(luò)狀態(tài)和業(yè)務(wù)感知端感知到的業(yè)務(wù)信息st作為神經(jīng)網(wǎng)絡(luò)的輸入,輸出層使用softmax 函數(shù),輸出一組切片選擇的概率向量,調(diào)度器選擇最大概率的切片進行調(diào)度,輸出動作at; 然后回報函數(shù)會反饋切片調(diào)度器本次調(diào)度的獎勵值rt,同時環(huán)境狀態(tài)轉(zhuǎn)移到調(diào)度后的狀態(tài)st+1, 這些交互信息會被經(jīng)驗采集器以(st,at,rt,st+1,t) 的形式保存在經(jīng)驗回收池中,供訓(xùn)練層使用。
圖2 的訓(xùn)練層實現(xiàn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,經(jīng)驗采集器按照規(guī)定好的批次大小將經(jīng)驗回收池中的調(diào)度信息取出,進行網(wǎng)絡(luò)訓(xùn)練,更新網(wǎng)絡(luò)的訓(xùn)練參數(shù)。
寬窄融合網(wǎng)絡(luò)的狀態(tài)變化時,訓(xùn)練得到的最優(yōu)調(diào)度策略也需要不斷變化。 在線調(diào)度部分將網(wǎng)絡(luò)環(huán)境的動態(tài)變化信息存入經(jīng)驗回收池,訓(xùn)練層中由于網(wǎng)絡(luò)環(huán)境的動態(tài)變化導(dǎo)致獎勵函數(shù)降低或較大波動,DDPG 網(wǎng)絡(luò)將根據(jù)最新的網(wǎng)絡(luò)狀態(tài)參數(shù)繼續(xù)訓(xùn)練,直到獎勵函數(shù)穩(wěn)定,得到新網(wǎng)絡(luò)狀態(tài)下的最優(yōu)調(diào)度策略。
2.3.2 深度強化學(xué)習(xí)算法
基于深度強化學(xué)習(xí)算法的DDPG 神經(jīng)網(wǎng)絡(luò)的輸出有3 項:一個動作a=α(s |θα),一個值函數(shù)項V(s | θV) 和一個優(yōu)勢函數(shù)項A(s,a | θA), 其中α(s |θα) 表示狀態(tài)s下的策略網(wǎng)絡(luò),θ表示網(wǎng)絡(luò)參數(shù)。 因此神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到的當(dāng)前Q值可由值函數(shù)項和優(yōu)勢函數(shù)項相加得到,優(yōu)勢函數(shù)可以參數(shù)化為一個非線性狀態(tài)特征的二次函數(shù)[10],表達式如下
其中U(s |θU) 是關(guān)于狀態(tài)的正定矩陣,可進行楚列斯基分解為
其中τ是學(xué)習(xí)速率(τ?1),這種小幅度的“軟更新”使得Critic 網(wǎng)絡(luò)的訓(xùn)練更加穩(wěn)定。
具體的DDPG 網(wǎng)絡(luò)訓(xùn)練過程如圖3 所示。
圖3 DDPG 網(wǎng)絡(luò)訓(xùn)練流程圖
本文的深度強化學(xué)習(xí)算法的實驗環(huán)境是Python 3.6,Pytorch 1.5 配置;寬窄融合網(wǎng)絡(luò)仿真環(huán)境主要由路由器、交換機、寬帶移動鏈路、短波鏈路等組成,包括8 Mb/s、2 Mb/s、800 kb/s 和500 kp/s 等不同的寬窄無線鏈路,并在丟包率為0.5%以內(nèi)隨機丟棄報文。 實驗共分為兩步進行,第一步是切片構(gòu)造實驗,網(wǎng)絡(luò)信息搜集組件得到切片構(gòu)造所需要的基本信息,如:業(yè)務(wù)的QoS 需求信息、由實際網(wǎng)絡(luò)拓撲圖轉(zhuǎn)化的網(wǎng)絡(luò)拓撲有向圖矩陣以及業(yè)務(wù)流量矩陣。 然后通過構(gòu)造算法預(yù)劃分路徑,輸出一個切片庫,降低了實時構(gòu)造切片的時間開銷。 第二步是切片調(diào)度實驗,針對復(fù)雜多變的網(wǎng)絡(luò)環(huán)境,將業(yè)務(wù)感知端得到的業(yè)務(wù)信息和實時檢測得到的切片狀態(tài)信息作為神經(jīng)網(wǎng)絡(luò)的輸入,利用深度強化學(xué)習(xí)算法訓(xùn)練得到在不同環(huán)境狀態(tài)下的最佳調(diào)度策略,均衡網(wǎng)絡(luò)負載,提高資源利用率的同時滿足業(yè)務(wù)定制化傳輸?shù)囊蟆?/p>
業(yè)務(wù)QoS 需求表包括本文研究的7 種業(yè)務(wù)的優(yōu)先級、帶寬要求、時延要求、丟包要求等,如表1 所示,其中H 表示要求較高,M 表示要求中等,L 表示要求較低。
表1 業(yè)務(wù)QoS 需求表
實施QoS 切片構(gòu)造算法后形成的切片拓撲如圖4 所示。
圖4 QoS 切片拓撲圖
根據(jù)構(gòu)造算法,可以將網(wǎng)絡(luò)拓撲圖大致劃分成4 個切片鏈路,其中第一類鏈路適用于網(wǎng)絡(luò)協(xié)議類和短信息業(yè)務(wù),第二類鏈路適用于緊急信息業(yè)務(wù),第三類鏈路適用于長信息業(yè)務(wù),第四類鏈路適用于視頻文件、管理信息和郵件業(yè)務(wù)。
本文設(shè)計如下實驗,分別從QoS 滿足率即業(yè)務(wù)是否進行定制化傳輸且沒有時間浪費、調(diào)度業(yè)務(wù)傳輸完成時間、切片帶寬平均利用率3 個方面比較本文采用的切片調(diào)度算法與對照算法的效果差異。 本文采用3 種對照算法:第一種算法是“盡力而為”調(diào)度算法,即先把業(yè)務(wù)全部調(diào)度到一個切片上去,切片負載過大后再調(diào)往另一條切片,以此類推;第二種算法是“專路專調(diào)”調(diào)度算法[8],即每類業(yè)務(wù)一開始只能調(diào)度到其對應(yīng)的切片鏈路,鏈路堵塞則業(yè)務(wù)進行等待;第三種算法是對業(yè)務(wù)采用動態(tài)重路由[12]的方式進行調(diào)度。
首先模擬網(wǎng)絡(luò)低負載的情況,8 種業(yè)務(wù)每隔2 s傳輸3 輪,持續(xù)傳輸30 s。 然后模擬網(wǎng)絡(luò)高負載的情況,8 種業(yè)務(wù)每隔2 s 傳輸6 輪,持續(xù)傳輸30 s。最終得到的QoS 業(yè)務(wù)滿足率、切片帶寬平均利用率、業(yè)務(wù)調(diào)度完成時間分別如圖5、6、7 所示。
圖5 QoS 業(yè)務(wù)滿足率
圖6 切片帶寬平均利用率
由實驗可以得出如下結(jié)論:(1) 4 種方法除了算法一,其余的QoS 業(yè)務(wù)滿足率都很高,這是因為算法一總是盡力而為,并沒有考慮到業(yè)務(wù)的定制化傳輸需求,算法二雖然專路專調(diào),但是鏈路堵塞時就會浪費時間資源,沒有很好地利用網(wǎng)絡(luò)資源,算法三雖然能夠動態(tài)重路由,但是低優(yōu)先級的業(yè)務(wù)必須等待高優(yōu)先級的業(yè)務(wù)探索路由后才能進行路由,因此這3 種方法的QoS 業(yè)務(wù)滿足率低于本文方法。(2) 本文設(shè)計的網(wǎng)絡(luò)切片調(diào)度算法可以使得切片間負載更加均衡,因為算法一和算法三都是先選擇一條鏈路進行業(yè)務(wù)傳輸,鏈路堵塞時才會重新選擇鏈路,因此并不能很好地均衡鏈路間的負載,算法二也是因為堵塞,造成了時間的浪費,影響了負載均衡的效果。 (3) 因為算法三需要動態(tài)劃分業(yè)務(wù)路由,而本文的網(wǎng)絡(luò)拓撲較為復(fù)雜,因此花費了更多時間在劃分路由上;算法一和算法二因為一開始只選擇一條鏈路,因此有鏈路擁塞造成的額外時間開銷,由此可見本文設(shè)計的算法可以使得業(yè)務(wù)的調(diào)度完成時間更短。
圖7 業(yè)務(wù)調(diào)度完成時間
本文通過對異構(gòu)網(wǎng)絡(luò)切片技術(shù)的研究,根據(jù)差異化的業(yè)務(wù)需求構(gòu)造基于人工智能構(gòu)建的網(wǎng)絡(luò)切片,結(jié)合寬窄融合無線實時網(wǎng)絡(luò)環(huán)境的狀態(tài),提供定制的網(wǎng)絡(luò)資源對業(yè)務(wù)進行服務(wù),實現(xiàn)了切片實例化。實驗表明,本文設(shè)計的網(wǎng)絡(luò)切片構(gòu)造和調(diào)度算法在QoS 滿足率、切片帶寬平均利用率和業(yè)務(wù)調(diào)度完成時間上均有較大提升,均衡網(wǎng)絡(luò)負載的同時提高了網(wǎng)絡(luò)資源利用率。