馮楠,劉賀林,周泉,楊???,付蜜能,鐘大平
(1.中國(guó)移動(dòng)通信有限公司研究院,北京 100053;2.中國(guó)移動(dòng)通信集團(tuán)有限公司,北京 100032)
當(dāng)前,5G商用部署持續(xù)推進(jìn),5G將步入商業(yè)化應(yīng)用的快車道。具有“大帶寬、廣連接、低時(shí)延”技術(shù)特性的5G催生5G終端和新應(yīng)用、新場(chǎng)景的涌現(xiàn),促進(jìn)超高清視頻、云游戲、VR/AR、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域快速發(fā)展,從而導(dǎo)致來(lái)自各行各業(yè)不同領(lǐng)域的移動(dòng)智能通信設(shè)備數(shù)量以及移動(dòng)數(shù)據(jù)流量呈現(xiàn)爆炸式增長(zhǎng)[1]。據(jù)統(tǒng)計(jì),2021年前7個(gè)月國(guó)內(nèi)移動(dòng)互聯(lián)網(wǎng)累計(jì)使用數(shù)據(jù)流量1 228億GB,同比增長(zhǎng)38.1%[2]。在這種環(huán)境下,數(shù)據(jù)通信以及多媒體業(yè)務(wù)已遠(yuǎn)超傳統(tǒng)業(yè)務(wù),成為 5G移動(dòng)通信網(wǎng)中最主要的承載業(yè)務(wù)。為了承載激增的數(shù)據(jù)流量,滿足數(shù)據(jù)密集型服務(wù)擴(kuò)張的需求,5G網(wǎng)絡(luò)中用以承載數(shù)據(jù)業(yè)務(wù)的分組域核心網(wǎng)設(shè)備數(shù)量急劇增加,新一輪5G核心網(wǎng)建設(shè)將迎來(lái)高潮。
在核心網(wǎng)建設(shè)過(guò)程中,分組業(yè)務(wù)模型的研究是非常必要的。一方面,業(yè)務(wù)模型是形成網(wǎng)絡(luò)建設(shè)規(guī)模的基礎(chǔ)。5G核心網(wǎng)建設(shè)部署需要依賴國(guó)內(nèi)運(yùn)營(yíng)商擬定的5G網(wǎng)絡(luò)業(yè)務(wù)模型。運(yùn)營(yíng)商通過(guò)建立行之有效的業(yè)務(wù)模型,統(tǒng)計(jì)并預(yù)測(cè)業(yè)務(wù)量的現(xiàn)狀和未來(lái)發(fā)展方向,為后期網(wǎng)絡(luò)建設(shè)提供更好的容量規(guī)劃以及延展性,進(jìn)而提升運(yùn)營(yíng)商的網(wǎng)絡(luò)智能化核心能力;另一方面,業(yè)務(wù)模型是影響設(shè)備硬件處理能力的重要因素之一。網(wǎng)絡(luò)功能虛擬化(network functions virtualization,NFV)是未來(lái)網(wǎng)絡(luò)發(fā)展的重要趨勢(shì),進(jìn)行NFV后,相同配置條件下的硬件處理能力主要取決于業(yè)務(wù)模型,不同的業(yè)務(wù)模型往往會(huì)導(dǎo)致相同配置條件下的硬件處理能力擁有較大差別[3-6]。因此,隨著5G核心網(wǎng)建設(shè)部署節(jié)奏的加快,關(guān)于5G核心網(wǎng)業(yè)務(wù)模型的研究也成為當(dāng)下重中之重的課題。
針對(duì)現(xiàn)有核心網(wǎng)業(yè)務(wù)模型的建模與規(guī)劃問(wèn)題,工業(yè)界主要基于國(guó)內(nèi)運(yùn)營(yíng)商網(wǎng)絡(luò)建設(shè)經(jīng)驗(yàn)結(jié)合實(shí)驗(yàn)室數(shù)據(jù)確定業(yè)務(wù)模型的關(guān)鍵參數(shù),參數(shù)主要包括附著激活比、尋呼次數(shù)、鑒權(quán)服務(wù)器功能(authentication server function,AUSF)鑒權(quán)次數(shù)等[7-9];學(xué)術(shù)界則通過(guò)曲線擬合法分析和預(yù)測(cè)分組域業(yè)務(wù)模型,該方法基于歷史數(shù)據(jù),根據(jù)其發(fā)展規(guī)律構(gòu)建線性曲線、二次曲線、指數(shù)曲線以及冪乘曲線等數(shù)學(xué)擬合曲線,尋求某兩個(gè)變量或多個(gè)變量之間的合理關(guān)系,進(jìn)而對(duì)未來(lái)的業(yè)務(wù)趨勢(shì)和數(shù)據(jù)進(jìn)行預(yù)測(cè)[10-12]。
本文認(rèn)為業(yè)務(wù)模型參數(shù)的取定需要依賴于5G SA各網(wǎng)元側(cè)業(yè)務(wù)量的統(tǒng)計(jì)結(jié)果,且會(huì)根據(jù)現(xiàn)網(wǎng)業(yè)務(wù)的波動(dòng)情況實(shí)時(shí)調(diào)整。這是由于業(yè)務(wù)模型各參數(shù)取值由每小時(shí)對(duì)應(yīng)參數(shù)的業(yè)務(wù)量總和/注冊(cè)用戶數(shù)/3 600所得,故現(xiàn)網(wǎng)業(yè)務(wù)波動(dòng)使業(yè)務(wù)模型各參數(shù)的取值不同。通過(guò)現(xiàn)有方法得到的理論業(yè)務(wù)模型是靜態(tài)不可變的,且缺乏符合各地市網(wǎng)絡(luò)特征(由于地區(qū)經(jīng)濟(jì)發(fā)展,用戶人口結(jié)構(gòu)、定制功能要求、組網(wǎng)等差異造成的與移動(dòng)性管理及會(huì)話管理相關(guān)的業(yè)務(wù)模型參數(shù)特征)的業(yè)務(wù)分析與預(yù)測(cè)手段,理論業(yè)務(wù)模型與實(shí)際網(wǎng)絡(luò)存在偏離,從而使5G網(wǎng)絡(luò)容量規(guī)劃與實(shí)際業(yè)務(wù)發(fā)展不匹配、規(guī)劃設(shè)備不能滿足或遠(yuǎn)大于用戶實(shí)際業(yè)務(wù)需求,造成網(wǎng)絡(luò)負(fù)載過(guò)大或資源利用率過(guò)低。
為了克服現(xiàn)有5G網(wǎng)絡(luò)業(yè)務(wù)模型與現(xiàn)網(wǎng)模型適配性較差以及規(guī)劃設(shè)備無(wú)法滿足用戶實(shí)際業(yè)務(wù)需求的痛點(diǎn),及時(shí)制定網(wǎng)絡(luò)預(yù)優(yōu)化策略,確保網(wǎng)絡(luò)覆蓋以及滿足容量需求,本文提出了一種基于“AI+大數(shù)據(jù)”的5G核心網(wǎng)業(yè)務(wù)模型的動(dòng)態(tài)預(yù)測(cè)方法。該方法通過(guò)現(xiàn)網(wǎng)網(wǎng)管大數(shù)據(jù)采集、數(shù)據(jù)分析、構(gòu)建長(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)與卷積LSTM(convolution LSTM,ConvLSTM)網(wǎng)絡(luò)雙通道數(shù)據(jù)特征提取融合學(xué)習(xí)網(wǎng)絡(luò),對(duì)未來(lái)網(wǎng)絡(luò)的運(yùn)行參數(shù)和容量進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果進(jìn)行決策反饋,以優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)網(wǎng)絡(luò)自動(dòng)部署,使能5G網(wǎng)絡(luò)智能化。經(jīng)驗(yàn)證,本文提出的LSTM與ConvLSTM的融合預(yù)測(cè)模型可用于15 min、1 h、1天多維度時(shí)間粒度指標(biāo)數(shù)據(jù)的多步預(yù)測(cè),且預(yù)測(cè)精度較高。
當(dāng)前,5G核心網(wǎng)業(yè)務(wù)模型主要由網(wǎng)元配置要求、用戶面(吞吐量)、用戶數(shù)以及控制面(信令)4類參數(shù)組成。
(1)網(wǎng)元配置要求
網(wǎng)元配置要求主要包括接入和移動(dòng)性管理功能(access and mobility management function,AMF)接入的5G節(jié)點(diǎn)(5G node,gNode)數(shù)、每定時(shí)提前量(timing advance,TA)下的gNode數(shù)、每用戶協(xié)議數(shù)據(jù)單元(protocol data unit,PDU)會(huì)話數(shù)、每會(huì)話支持服務(wù)質(zhì)量(quality of service,QoS)流等。
(2)用戶面(吞吐量)
吞吐量參數(shù)主要包括 5G PDU會(huì)話數(shù)、N3/N6/N9接口流量等。
(3)用戶數(shù)
用戶數(shù)參數(shù)主要包括注冊(cè)用戶數(shù)、5G接入用戶數(shù)、5G手機(jī)長(zhǎng)期演進(jìn)語(yǔ)音(voice over long-term evolution,VoLTE)用戶簽約比等。
(4)控制面(信令)
信令參數(shù)可進(jìn)一步細(xì)分為業(yè)務(wù)信令參數(shù)和移動(dòng)性管理信令參數(shù)。
業(yè)務(wù)信令參數(shù)與用戶使用業(yè)務(wù)行為相關(guān),主要包括忙時(shí)平均每用戶初始注冊(cè)/去注冊(cè)次數(shù)、鑒權(quán)次數(shù)、忙時(shí)平均每用戶PDU會(huì)話建立/修改/釋放次數(shù)、周期性注冊(cè)更新次數(shù)、忙時(shí)平均每用戶接入網(wǎng)(access network,AN)釋放/業(yè)務(wù)請(qǐng)求/尋呼次數(shù)等。
移動(dòng)性管理信令參數(shù)與用戶移動(dòng)性相關(guān),主要包括忙時(shí)平均每用戶 AMF內(nèi)/間移動(dòng)引起的注冊(cè)更新、忙時(shí)平均每用戶系統(tǒng)內(nèi)Xn接口/N2接口切換次數(shù)、忙時(shí)平均每用戶 4G/5G系統(tǒng)間基于N26接口的切換次數(shù)、忙時(shí)平均每用戶4G/5G空閑態(tài)移動(dòng)切換次數(shù)。
隨著5G網(wǎng)絡(luò)建設(shè)的加速,未來(lái)5G用戶數(shù)普遍以當(dāng)前LTE用戶升級(jí)而來(lái)。故而未來(lái)一段時(shí)間內(nèi),5G用戶數(shù)呈現(xiàn)穩(wěn)步增長(zhǎng)的趨勢(shì)。現(xiàn)網(wǎng)中A省與B省5G注冊(cè)用戶數(shù)如圖1所示。A省、B省10月5G注冊(cè)用戶數(shù)比2月分別增長(zhǎng)242%、976%。當(dāng)前工程建設(shè)和基于此開(kāi)展的性能測(cè)試中,均采用單一業(yè)務(wù)模型。而核心網(wǎng)中信令參數(shù)以及吞吐量參數(shù)的產(chǎn)生,主要成因在于用戶使用業(yè)務(wù)行為、用戶移動(dòng)性行為,除此之外還與網(wǎng)絡(luò)規(guī)劃組織以及簽約業(yè)務(wù)等相關(guān),而用戶行為普遍受不同省市經(jīng)濟(jì)發(fā)展差異、用戶人口結(jié)構(gòu)差異、地區(qū)組網(wǎng)差異等因素的影響。故單一業(yè)務(wù)模型難以覆蓋現(xiàn)網(wǎng)多樣差異化場(chǎng)景。A、B兩省部分話務(wù)模型參數(shù)對(duì)比見(jiàn)表1。以A、B兩省為例,B省忙時(shí)平均每用戶AMF內(nèi)N2接口切換次數(shù)比A省低60.5%,B省忙時(shí)平均每用戶AN釋放次數(shù)比A省高16.21%。結(jié)果表明各省市業(yè)務(wù)模型會(huì)呈現(xiàn)多元化差異。
表1 A、B兩省部分話務(wù)模型參數(shù)對(duì)比
圖1 現(xiàn)網(wǎng)中A省與B省5G注冊(cè)用戶數(shù)
由于用戶在一段時(shí)間內(nèi)的行程或使用移動(dòng)網(wǎng)絡(luò)上網(wǎng)的行為相對(duì)規(guī)律,個(gè)人用戶行為在一段時(shí)間內(nèi)是存在規(guī)律性和延續(xù)性的,例如,一個(gè)外賣送餐小哥每日在11:00—20:00的行為可以概括為“送餐-接單-送餐-接單-……”,該行為循環(huán)往復(fù),對(duì)網(wǎng)絡(luò)層面的觸發(fā)也存在一定的規(guī)律,即“AN釋放-業(yè)務(wù)請(qǐng)求-AN釋放-業(yè)務(wù)請(qǐng)求-……”。類似地,以上班族為例,大部分上班族在工作日的7:00—9:00、17:00—20:00(上下班路上)會(huì)打開(kāi)手機(jī)流量開(kāi)關(guān)瀏覽網(wǎng)頁(yè)或追劇,故而工作日該時(shí)間段用戶面吞吐量相對(duì)其他時(shí)間段偏高。所以可以認(rèn)為核心網(wǎng)中的控制面信令和用戶面吞吐量也是存在同樣的規(guī)律性和延續(xù)性。而業(yè)務(wù)模型預(yù)測(cè)的前提是一段時(shí)間內(nèi)數(shù)據(jù)之間是存在時(shí)間相關(guān)性的。所以本文認(rèn)為可以通過(guò)用戶行為的歷史數(shù)據(jù)分析、疊加從而對(duì)網(wǎng)絡(luò)中的業(yè)務(wù)模型參數(shù)進(jìn)行一定的周期預(yù)測(cè)分析。A省單資源池7—8月忙時(shí)平均每用戶業(yè)務(wù)請(qǐng)求次數(shù)如圖2所示,該信令參數(shù)在時(shí)間上呈周期震蕩趨勢(shì),具有統(tǒng)計(jì)規(guī)律。因此,業(yè)務(wù)模型預(yù)測(cè)可以看作時(shí)間序列預(yù)測(cè)任務(wù)。
圖2 A省單資源池7—8月忙時(shí)平均每用戶業(yè)務(wù)請(qǐng)求次數(shù)
由于核心網(wǎng)業(yè)務(wù)模型對(duì)應(yīng)各參數(shù)在時(shí)間上具有統(tǒng)計(jì)規(guī)律,因此,核心網(wǎng)業(yè)務(wù)模型預(yù)測(cè)可以看作時(shí)間序列預(yù)測(cè)任務(wù)。在時(shí)間序列預(yù)測(cè)任務(wù)中,LSTM 擅長(zhǎng)提取長(zhǎng)時(shí)序特征,而卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)在短時(shí)序特征提取上更有優(yōu)勢(shì)[13-16]。本文提出使用LSTM與基于CNN的卷積LSTM模型ConvLSTM雙通道融合預(yù)測(cè)模型來(lái)對(duì)業(yè)務(wù)模型指標(biāo)進(jìn)行預(yù)測(cè),通過(guò)該雙通道融合預(yù)測(cè)模型,可以盡可能挖掘時(shí)間序列中隱藏的特征信息,這些特征同時(shí)包含了長(zhǎng)時(shí)序和短時(shí)序兩類特征。
2.1.1 LSTM網(wǎng)絡(luò)模型
早期,時(shí)間序列建模主要采用回歸模型、自回歸滑動(dòng)平均模型(auto-regressive moving average model,ARMA)、差分自回歸滑動(dòng)平均模型(auto-regressive integrated moving average model,ARIMA)。ARMA和ARIMA常用于周期性平穩(wěn)序列預(yù)測(cè),對(duì)歷史數(shù)據(jù)要求較高[17-19]。隨著深度學(xué)習(xí)的發(fā)展,大部分研究人員通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)對(duì)時(shí)間序列建模,以提高在數(shù)據(jù)趨勢(shì)預(yù)測(cè)中的準(zhǔn)確性。RNN在許多領(lǐng)域都有較好的表現(xiàn)[20]。但RNN每一個(gè)輸入值均只與其自身的路線建立權(quán)連接,不會(huì)與其他的神經(jīng)元連接,這樣的結(jié)構(gòu)缺陷會(huì)導(dǎo)致歷史信息在反向傳播中丟失,導(dǎo)致梯度消失和梯度爆炸現(xiàn)象的出現(xiàn)。為了解決 RNN的弊端,LSTM 被提出。LSTM和RNN的不同之處在于,LSTM在隱藏層中使用了3個(gè)門控單元,分別為輸入門、遺忘門和輸出門,用來(lái)更新或丟棄歷史信息,以控制歷史信息的流動(dòng),這也使LSTM更擅長(zhǎng)應(yīng)對(duì)時(shí)間序列預(yù)測(cè)任務(wù)[21-22]。LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。其中,σ、?、⊕分別表示sigmoid函數(shù)、兩個(gè)相同維度對(duì)應(yīng)元素的乘積組成新的向量、兩個(gè)相同維度對(duì)應(yīng)元素求和組成新的向量,對(duì)數(shù)據(jù)信息進(jìn)行過(guò)濾運(yùn)算和疊加運(yùn)算。
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)一個(gè)時(shí)間序列X= {x1,x2,x3,…,xn},x1,x2,x3,… ,xn表示每一個(gè)時(shí)間點(diǎn),其中包含該時(shí)間點(diǎn)的特征信息。
對(duì)于LSTM塊中遺忘門ft,通過(guò)Sigmoid函數(shù)激活上一層隱狀態(tài)ht?1和當(dāng)前輸入狀態(tài)xt,該激活值在[0,1]。遺忘門計(jì)算式如式(1)所示。
對(duì)于 LSTM 塊中的輸入門it,則是控制當(dāng)前層哪些信息作為新增記憶C~加入當(dāng)前記憶狀態(tài)Ct,it同樣由Sigmoid函數(shù)激活上一層隱狀態(tài)ht?1和當(dāng)前輸入狀態(tài)xt生成,但權(quán)重與ft的權(quán)重不同。輸入門計(jì)算式如式(2)、式(3)所示。
記憶狀態(tài)更新是通過(guò)ft控制的上一層歷史記憶狀態(tài)Ct?1與it控制的新增記憶C~共同生成當(dāng)前記憶狀態(tài)Ct,如式(4)所示。
對(duì)于LSTM塊中輸出門οt,則是輸出當(dāng)前層的隱狀態(tài)ht,該隱狀態(tài)由tanh函數(shù)激活記憶狀態(tài)Ct生成。輸出門計(jì)算式如式(5)、式(6)所示。
在模型訓(xùn)練結(jié)束后,除了隱藏狀態(tài)會(huì)記憶一部分歷史信息,記憶狀態(tài)還會(huì)記憶整個(gè)序列的高維隱信息,如序列的變化率、衰減率等信息。
2.1.2 ConvLSTM網(wǎng)絡(luò)模型
ConvLSTM 網(wǎng)絡(luò)可以較好地提取時(shí)間序列任務(wù)中的短時(shí)序特征。ConvLSTM 網(wǎng)絡(luò)模型主要通過(guò)卷積層對(duì)時(shí)序中的權(quán)值進(jìn)行計(jì)算,將時(shí)序圖中的特征提取出來(lái),并且通過(guò)將上一層的輸出當(dāng)作下一層LSTM層的輸入提取靜態(tài)時(shí)序圖的短時(shí)序特征。ConvLSTM網(wǎng)絡(luò)的主要計(jì)算式如式(7)~式(11)所示。
其中,?表示卷積運(yùn)算,?表示Hadamard乘積。
2.1.3 雙通道融合
針對(duì)LSTM以及ConvLSTM模型在時(shí)間序列提取方面的特點(diǎn),本文提出了使用 LSTM 與ConvLSTM 雙通道融合預(yù)測(cè)模型來(lái)對(duì)業(yè)務(wù)模型指標(biāo)進(jìn)行預(yù)測(cè)。ConvLSTM與LSTM雙通道融合網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。LSTM與ConvLSTM輸入相同的數(shù)據(jù)源,但LSTM通道提取時(shí)間序列的長(zhǎng)時(shí)序特征,輸出長(zhǎng)時(shí)序特征張量P1={h1,h2,… ,hk};ConvLSTM 通道提取時(shí)間序列的短時(shí)序特征,輸出短時(shí)序特征張量P2= {h1′ ,h2′ ,… ,hk′}。其中,為了平衡兩通道所提取特征對(duì)最終測(cè)試結(jié)果的影響,需要保證P1與P2的維度相同,均為k,最后將兩通道經(jīng)提取的時(shí)間特征張量拼接,得到一個(gè)維度為2k的張量P,如式(12)所示。
圖4 ConvLSTM與LSTM雙通道融合網(wǎng)絡(luò)結(jié)構(gòu)
最后將張量P輸入全連接網(wǎng)絡(luò)層(Dense),將張量進(jìn)行維度變換,從而得到預(yù)測(cè)結(jié)果。
與上述提到的LSTM與ConvLSTM神經(jīng)網(wǎng)絡(luò)不同的是,LSTM與ConvLSTM雙通道融合預(yù)測(cè)模型分別通過(guò)LSTM模型提取時(shí)間序列的長(zhǎng)時(shí)序特征,通過(guò)ConvLSTM提供時(shí)間序列的短時(shí)序特征,將兩通道提取的特征進(jìn)行向量拼接融合作為一個(gè)整體再輸入全連接網(wǎng)絡(luò)層中,而 LSTM 或ConvLSTM均通過(guò)對(duì)應(yīng)模型提取時(shí)間序列特征,隨后將特征直接輸入全連接網(wǎng)絡(luò)層進(jìn)行輸出。
2.2.1 數(shù)據(jù)集
通過(guò)采集現(xiàn)網(wǎng)業(yè)務(wù)統(tǒng)計(jì)數(shù)據(jù)得到原始性能數(shù)據(jù),包含5G SA網(wǎng)元(AMF、SMF、PCF、UDM、NRF、UPF、CHF等)各項(xiàng)性能統(tǒng)計(jì)指標(biāo)及虛擬池位置信息,單網(wǎng)元相關(guān)性能統(tǒng)計(jì)存為單個(gè)數(shù)據(jù)表,數(shù)據(jù)周期為2021年1月—8月的8個(gè)月,采樣的時(shí)間間隔為15 s,其中,前80%的數(shù)據(jù)序列用于訓(xùn)練數(shù)據(jù),后20%的數(shù)據(jù)用于測(cè)試數(shù)據(jù)。本文使用平均絕對(duì)百分比誤差(mean absolute percent error,MAPE)衡量模型的優(yōu)劣[23]。MAPE用來(lái)衡量評(píng)估預(yù)測(cè)值的準(zhǔn)確程度,MAPE是相對(duì)值,不是絕對(duì)值,MAPE越小,說(shuō)明模型預(yù)測(cè)準(zhǔn)確度越高。
2.2.2 實(shí)驗(yàn)配置
本文提出的LSTM與ConvLSTM融合預(yù)測(cè)模型經(jīng)多次實(shí)驗(yàn)驗(yàn)證,LSTM與ConvLSTM融合預(yù)測(cè)模型配置見(jiàn)表2。LSTM通道與ConvLSTM通道中的LSTM層互相獨(dú)立,且兩通道的輸出維度相同,以平衡兩通道所提取特征對(duì)最終測(cè)試結(jié)果的影響。
表2 LSTM與ConvLSTM融合預(yù)測(cè)模型配置
2.2.3 實(shí)驗(yàn)結(jié)果
基準(zhǔn)算法結(jié)果對(duì)比如圖5所示,對(duì)比了15 min粒度下,傳統(tǒng)時(shí)間序列模型S-ARIMA、LSTM與本文提出的LSTM與ConvLSTM融合預(yù)測(cè)模型的初始注冊(cè)(amf_attinitreg)、尋呼(amf_pagatt)、鑒權(quán)(amf_auth)、周期性注冊(cè)更新(amf_regupdreq)、服務(wù)請(qǐng)求(amf_attservicereq)多個(gè)業(yè)務(wù)指標(biāo)單步預(yù)測(cè)的MAPE值。一般而言,本文認(rèn)為當(dāng)MAPE<10%時(shí),該預(yù)測(cè)模型質(zhì)量較高,可利用該模型進(jìn)行具體應(yīng)用場(chǎng)景和具體數(shù)據(jù)集的后續(xù)預(yù)測(cè)。由圖5可知,針對(duì)15 min小顆粒度業(yè)務(wù)指標(biāo),3種模型均可達(dá)到較好的業(yè)務(wù)模型指標(biāo)預(yù)測(cè)效果,但融合預(yù)測(cè)模型由于LSTM通道與 ConvLSTM 通道在數(shù)據(jù)特征提取方面的優(yōu)勢(shì)互補(bǔ),因此,融合預(yù)測(cè)模型在整體業(yè)務(wù)指標(biāo)的預(yù)測(cè)上更穩(wěn)定、更準(zhǔn)確,多指標(biāo)的MAPE值均保持在5%以下。
圖5 基準(zhǔn)算法結(jié)果對(duì)比
1 h粒度各指標(biāo)預(yù)測(cè)值所屬區(qū)間統(tǒng)計(jì)見(jiàn)表2,其為1 h粒度下,5G SA網(wǎng)元的共計(jì)22個(gè)業(yè)務(wù)模型對(duì)應(yīng)信令指標(biāo)單步預(yù)測(cè)的MAPE值所屬范圍區(qū)間個(gè)數(shù)統(tǒng)計(jì)。22個(gè)指標(biāo)通過(guò)使用融合預(yù)測(cè)模型進(jìn)行預(yù)測(cè),可達(dá)到100%數(shù)量的6%以下精度的預(yù)測(cè)。1 h粒度數(shù)據(jù)由4個(gè)15 min粒度疊加生成,所以1 h粒度的數(shù)據(jù)對(duì)應(yīng)波動(dòng)性更大,S-ARIMA適用于周期性明顯的數(shù)據(jù),對(duì)數(shù)據(jù)本身周期性特征要求較高,因此,S-ARIMA僅適用于小顆粒度業(yè)務(wù)模型指標(biāo)預(yù)測(cè);而LSTM擅長(zhǎng)提取長(zhǎng)時(shí)序特征,對(duì)短期波動(dòng)劇烈的業(yè)務(wù)指標(biāo)預(yù)測(cè)精度較差,因此,S-ARIMA、LSTM模型在預(yù)測(cè)時(shí),分別有68.18%、45.45%數(shù)量的指標(biāo)預(yù)測(cè)精度大于10%。
表2 1 h粒度各指標(biāo)預(yù)測(cè)值所屬區(qū)間統(tǒng)計(jì)
兩模型多時(shí)間粒度下的對(duì)比如圖6所示,對(duì)比了15 min、1 h、1天3種時(shí)間粒度下LSTM與LSTM& ConvLSTM 模型基于 Xn接口的切換(amf_attintraamfxn)指標(biāo)多步預(yù)測(cè)的MAPE值,與LSTM相比,LSTM & ConvLSTM可實(shí)現(xiàn)多時(shí)間粒度下該指標(biāo)的高精度預(yù)測(cè),且預(yù)測(cè)準(zhǔn)確度更高。在1 h粒度下,LSTM&ConvLSTM 模型的預(yù)測(cè)精度可達(dá)4.8%,相較于LSTM,該融合模型將預(yù)測(cè)準(zhǔn)確率提高了55%。
圖6 兩模型多時(shí)間粒度下的對(duì)比
1 h粒度下兩模型不同輸出步長(zhǎng)的MAPE對(duì)比如圖7所示,1 h粒度下,對(duì)于多步預(yù)測(cè),相較于LSTM,LSTM&ConvLSTM的平均MAPE更小,預(yù)測(cè)結(jié)果更好,當(dāng)輸出步長(zhǎng)大于 6時(shí),對(duì)應(yīng)LSTM&ConvLSTM預(yù)測(cè)精度明顯下降,故在1 h粒度下,LSTM&ConvLSTM可用于預(yù)測(cè)未來(lái)最多6個(gè)顆粒度輸出的預(yù)測(cè)。
圖7 1 h粒度下兩模型不同輸出步長(zhǎng)的MAPE對(duì)比
不同時(shí)間顆粒度下 LSTM&ConvLSTM 輸出步長(zhǎng)結(jié)果見(jiàn)表3,LSTM&ConvLSTM模型可實(shí)現(xiàn)未來(lái)4天指標(biāo)容量的高精度預(yù)測(cè)。可根據(jù)輸出的預(yù)測(cè)值,及時(shí)制定網(wǎng)絡(luò)預(yù)優(yōu)化策略,確保網(wǎng)絡(luò)覆蓋以及容量需求。
表3 不同時(shí)間顆粒度下LSTM&ConvLSTM輸出步長(zhǎng)結(jié)果
當(dāng)前,5G、NFV迎來(lái)大規(guī)模部署期,網(wǎng)絡(luò)云化重構(gòu)、網(wǎng)絡(luò)切片等技術(shù)創(chuàng)新的加速發(fā)展促使一張網(wǎng)絡(luò)賦能千行百業(yè),網(wǎng)絡(luò)帶寬、連接規(guī)模、傳輸時(shí)延等關(guān)鍵性能指標(biāo)大幅度提升,網(wǎng)絡(luò)性能和靈活性發(fā)生了根本性改變[24-25]。與此同時(shí),5G網(wǎng)絡(luò)的靈活性和復(fù)雜性給網(wǎng)絡(luò)的運(yùn)營(yíng)、運(yùn)維帶來(lái)了前所未有的挑戰(zhàn),傳統(tǒng)運(yùn)維模式已無(wú)法滿足成本和效率的需求,采用人工智能技術(shù)實(shí)現(xiàn)網(wǎng)絡(luò)智能化成為必然趨勢(shì)。
核心網(wǎng)業(yè)務(wù)模型是5G網(wǎng)絡(luò)容量規(guī)劃和網(wǎng)絡(luò)建設(shè)的基礎(chǔ)。業(yè)務(wù)模型各參數(shù)的預(yù)測(cè)結(jié)果可使維護(hù)人員迅速掌握網(wǎng)絡(luò)流量的規(guī)律、趨勢(shì)以便及時(shí)調(diào)控網(wǎng)絡(luò)資源。具體而言,業(yè)務(wù)模型智能化預(yù)測(cè)可考慮應(yīng)用于網(wǎng)管監(jiān)測(cè)系統(tǒng)中。利用長(zhǎng)期(季度、年度)業(yè)務(wù)模型智能化預(yù)測(cè),對(duì)網(wǎng)絡(luò)建設(shè)方案進(jìn)行精準(zhǔn)規(guī)劃,利用短期(分、時(shí))業(yè)務(wù)模型智能化預(yù)測(cè),實(shí)現(xiàn)網(wǎng)絡(luò)的自動(dòng)化彈性擴(kuò)縮容。具體實(shí)現(xiàn)方法為:通過(guò)采集北向網(wǎng)管各網(wǎng)元側(cè)的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行異常識(shí)別、丟棄、異常處理,生成訓(xùn)練數(shù)據(jù),根據(jù)需求將數(shù)據(jù)進(jìn)行拆分,將數(shù)據(jù)進(jìn)行資源池維度、省份維度、單網(wǎng)元維度、時(shí)間粒度/維度進(jìn)行劃分,訓(xùn)練對(duì)應(yīng)維度數(shù)據(jù),構(gòu)建基于AI的多時(shí)間維度預(yù)測(cè)模型,將預(yù)測(cè)值上報(bào)給網(wǎng)管系統(tǒng),基于預(yù)測(cè)值,網(wǎng)絡(luò)進(jìn)行決策判定,將實(shí)際業(yè)務(wù)與5G網(wǎng)絡(luò)容量規(guī)劃匹配,執(zhí)行彈性擴(kuò)縮容操作,實(shí)現(xiàn)網(wǎng)絡(luò)自動(dòng)部署,以避免網(wǎng)絡(luò)負(fù)載過(guò)大或資源利用率過(guò)低情況的發(fā)生,保證系統(tǒng)運(yùn)行效率。
5G時(shí)代需要一個(gè)高度智能化的網(wǎng)絡(luò),將 AI引入通信網(wǎng)絡(luò)將是5G網(wǎng)絡(luò)規(guī)劃、建設(shè)、維護(hù)、優(yōu)化、運(yùn)營(yíng)的必然選擇。本文提出使用 LSTM 與ConvLSTM 雙通道融合預(yù)測(cè)模型來(lái)對(duì)業(yè)務(wù)模型指標(biāo)進(jìn)行預(yù)測(cè)。該方法通過(guò)現(xiàn)網(wǎng)網(wǎng)管大數(shù)據(jù)采集、數(shù)據(jù)分析、構(gòu)建LSTM與ConvLSTM雙通道數(shù)據(jù)特征提取融合學(xué)習(xí)網(wǎng)絡(luò),對(duì)未來(lái)網(wǎng)絡(luò)的運(yùn)行參數(shù)和容量進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果提供更加智慧、靈活的網(wǎng)絡(luò)策略,進(jìn)而實(shí)現(xiàn)人工智能賦能通信網(wǎng)絡(luò),推動(dòng)網(wǎng)絡(luò)智能化持續(xù)演進(jìn)。結(jié)果表明,本文提出的LSTM與ConvLSTM的融合預(yù)測(cè)模型可用于15 min、1 h、1天多維度時(shí)間粒度指標(biāo)數(shù)據(jù)的多步預(yù)測(cè),預(yù)測(cè)精度可達(dá)4.8%。相較于傳統(tǒng)時(shí)間序列S-ARIMA模型以及LSTM模型,該模型的預(yù)測(cè)準(zhǔn)確度更高。