吳 蕾,曾慧平,王海威
(南昌航空大學(xué)科技學(xué)院,江西 共青城 332020)
為提高網(wǎng)絡(luò)用戶體驗(yàn)感,流量管理工作尤為關(guān)鍵。通過對(duì)流量時(shí)間序列的預(yù)測(cè),不但可以使人們對(duì)網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)監(jiān)測(cè),為運(yùn)營(yíng)商流量管理提供數(shù)據(jù)依據(jù),還能對(duì)帶寬分配、故障管理起到積極作用。在過載現(xiàn)象發(fā)生之前,采取有效措施進(jìn)行防范,確保網(wǎng)絡(luò)正常服務(wù)。因此,流量預(yù)測(cè)在網(wǎng)絡(luò)穩(wěn)定性方面扮演重要角色。
然而有效的流量預(yù)測(cè)離不開預(yù)測(cè)模型的支持,文獻(xiàn)[1]提出基于全注意力機(jī)制的網(wǎng)絡(luò)流量預(yù)測(cè)。將面向自然語言處理的全注意力理論引入到時(shí)間序列預(yù)測(cè)中,預(yù)測(cè)未來時(shí)間窗內(nèi)流量情況;對(duì)所記錄的流量數(shù)據(jù)集進(jìn)行訓(xùn)練與測(cè)試,并與其它方法進(jìn)行比較,得出該方法計(jì)算復(fù)雜度低,但在預(yù)測(cè)精度方面優(yōu)勢(shì)不夠明顯。文獻(xiàn)[2]構(gòu)建了基于POS-Elman的網(wǎng)絡(luò)流量預(yù)測(cè)模型。首先完成時(shí)間序列的相空間重構(gòu),將重構(gòu)后的流量序列當(dāng)做模型輸入;其次使用粒子群優(yōu)化方法優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)的初始參數(shù);最后利用訓(xùn)練好的模型對(duì)網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè)。
上述兩種方法構(gòu)建的模型屬于單一模型,很難達(dá)到高精度預(yù)測(cè)要求,而組合預(yù)測(cè)模型能夠擬合多個(gè)單項(xiàng)模型優(yōu)勢(shì),更加準(zhǔn)確的描述流量特征。為此,本文將小波分解與支持向量機(jī)方法相結(jié)合,構(gòu)建網(wǎng)絡(luò)非平穩(wěn)流量多尺度時(shí)間序列組合預(yù)測(cè)模型。小波分解具有多分辨率等優(yōu)勢(shì),可以實(shí)現(xiàn)信號(hào)的由粗到細(xì)的分解。復(fù)雜度較高的信號(hào)經(jīng)過小波分解后,劃分成不相關(guān)的信號(hào),是一種流量特征分析的有力工具。然后利用支持向量機(jī)方法對(duì)各特征進(jìn)行預(yù)測(cè),構(gòu)建預(yù)測(cè)模型。仿真結(jié)果證明,該方法提高預(yù)測(cè)精度,可以在某個(gè)周期內(nèi)利用以前信息即可實(shí)現(xiàn)對(duì)后續(xù)時(shí)刻流量狀況的預(yù)測(cè),實(shí)時(shí)性較好。
1)自相似性
自相似流量模型[3]已經(jīng)成為預(yù)測(cè)網(wǎng)絡(luò)流量的重要模型,自相似性表示多種時(shí)間尺度上統(tǒng)計(jì)的自相似特征。對(duì)其進(jìn)行放大或縮小處理時(shí),其統(tǒng)計(jì)特征不變,所以又稱作隨機(jī)分形。
2)多分形性
分形指非常不規(guī)則,該特性能夠體現(xiàn)出對(duì)時(shí)間變換的依賴規(guī)律,某些不規(guī)律情況能夠在局部時(shí)間中被生動(dòng)的表示出來。網(wǎng)絡(luò)流量的此種性質(zhì)還被廣泛應(yīng)用在各種工程問題中。
3)周期性與混沌性
周期性可表示為,隨著時(shí)間變化,流量的時(shí)間序列所表現(xiàn)出的季節(jié)性變換規(guī)律。則對(duì)應(yīng)的混沌性為在某一確定性系統(tǒng)內(nèi),流量表現(xiàn)出的看似毫無規(guī)律的現(xiàn)象?;煦缧缘拇嬖诜秶^為廣發(fā),在自然界中也隨處可見?;煦缧詫儆跓o序與有序的有機(jī)統(tǒng)一,流量的時(shí)間序列一般會(huì)發(fā)生低維混沌情況,對(duì)其進(jìn)行去長(zhǎng)相關(guān)性處理后,流量數(shù)據(jù)具有隨機(jī)性。因此流量的此性質(zhì)充分表現(xiàn)了長(zhǎng)相關(guān)性和混沌性具有密切關(guān)聯(lián)。
1)相關(guān)性
相關(guān)性是時(shí)間序列的最常見特性,也是建立模型的依據(jù)。相關(guān)性包含靜態(tài)相關(guān)與動(dòng)態(tài)相關(guān)兩種。針對(duì)流量時(shí)間序列,要分析其動(dòng)態(tài)相關(guān)。因?yàn)槎喑叨葧r(shí)間序列屬于隨機(jī)過程的一種,大部分時(shí)間序列都具有前后依存的關(guān)系,也就是自相關(guān)性。該性質(zhì)可通過相關(guān)函數(shù)進(jìn)行描述。此外,時(shí)間序列的記憶可分為多種情況,可能是對(duì)過去某個(gè)時(shí)間段的記憶,也可能是對(duì)此序列外部造成沖擊的某種記憶[4]。假設(shè)序列正依賴于某過去沖擊影響,此時(shí)可通過滑動(dòng)平均模型來表示這一動(dòng)態(tài)特性,其結(jié)構(gòu)為將序列的當(dāng)前值記做過去隨機(jī)擾動(dòng)的加權(quán)和。
2)平穩(wěn)性
平穩(wěn)性指隨機(jī)變量的特征隨時(shí)間變化而發(fā)生改變。平穩(wěn)過程包括寬平穩(wěn)與嚴(yán)平穩(wěn)。
除上述特征外,時(shí)間序列還有如下特點(diǎn):時(shí)間序列是在不同時(shí)間段上通過觀測(cè)數(shù)據(jù)獲得的結(jié)果[5],由于影它的指標(biāo)較多,因此每個(gè)時(shí)間點(diǎn)上的數(shù)據(jù)值都具有一定隨機(jī)性;從整體上講,時(shí)間序列具有周期變化規(guī)律,或表現(xiàn)出某種趨勢(shì)。
按照觀察時(shí)間是否連續(xù)可將其分為離散與連續(xù)時(shí)間序列;根據(jù)觀察對(duì)象類型可分為一元與多元時(shí)間序列;結(jié)合統(tǒng)計(jì)特征可分為平穩(wěn)和非平穩(wěn)兩種。
假設(shè)φ(t)代表平方可積函數(shù)[6],且滿足φ(t)∈L2(R),則此函數(shù)的傅里葉變換φ(w)符合下述條件
(1)
因此,稱φ(t)為小波母函數(shù)。對(duì)其進(jìn)行伸縮與平行操作能夠獲得
(2)
式中,τ代表平移因子,τ∈R,α為伸縮因子,α>0。則φα,τ稱為α與τ的小波基函數(shù)。
網(wǎng)絡(luò)流量屬于離散時(shí)間序列數(shù)據(jù),所以本文利用離散小波變換算法對(duì)其做分解。假設(shè)網(wǎng)絡(luò)非平穩(wěn)流量的時(shí)間序列表示為:X(t),t=0,1…,N-1,利用離散低通濾波器h(k)能夠確定流量分解系數(shù)
(3)
結(jié)合離散小波自身性質(zhì),則流量不同尺度下細(xì)節(jié)系數(shù)dj能夠表示成
dj+1(l)=cj(t)-cj+1(t)
(4)
因此時(shí)間序列為L(zhǎng)的小波變換表示為
D={d1,d2,…,dL,cL}
(5)
式中,{d1,d2,…,dL}代表不同流量尺度下的細(xì)節(jié)信息,cL是網(wǎng)絡(luò)流量近似信號(hào)。
假設(shè)高通濾波器表示為g(k),小波分解級(jí)數(shù)設(shè)定為L(zhǎng),則流量的小波分解過程如下:
步驟一:網(wǎng)絡(luò)流量初始化處理
c0=X(t),h1(k)=h(k),g1(k)=g(k),j=1
(6)
步驟二:流量小波分解
cj[k]=cj-1[k]*hj[-k]
(7)
dj[k]=dj-1[k]*gj[-k]
(8)
式中,*代表卷積運(yùn)算。
步驟三:對(duì)濾波器做插零處理。
(9)
(10)
步驟四:j=j+1,若j 綜上所述,離散小波分解方法能夠很好實(shí)現(xiàn)非平穩(wěn)流量不同成分分解,為后續(xù)支持向量機(jī)預(yù)測(cè)建模提供基礎(chǔ)。 利用支持向量機(jī)實(shí)現(xiàn)回歸與預(yù)測(cè)的基本思路為,利用一個(gè)非線性映射φ將數(shù)據(jù)Xi映射在某個(gè)高維特性空間F中,在該空間內(nèi)做線性回歸,將低維空間非線性回歸問題變換為高維空間線性回歸問題進(jìn)行處理。結(jié)合統(tǒng)計(jì)學(xué)思想設(shè)置下述回歸函數(shù) f(X)=(ω,φ(X))+b;φ:Rn→F,ω∈F (11) 式中,(·)代表內(nèi)積,φ代表Rm空間到F空間的非線性映射操作,X∈Rm,ω代表權(quán)矢量,ω∈F,b表示偏置。 上述公式中φ(x)為已知,通過樣本數(shù)據(jù)(Xi,Yi)使下述泛函數(shù)最小化,因此能夠獲取上述公式的ω與b的估計(jì)值。 (12) 針對(duì)已知的損失函數(shù),此問題能夠當(dāng)做二次規(guī)劃問題進(jìn)行解決,本文利用ε不敏感損失函數(shù)[7] (13) (14) 式中,C=1/λ≥0,為方便求解,將二次規(guī)劃問題變換成對(duì)偶問題。 (15) (16) 將高維空間中內(nèi)積運(yùn)算看作支持向量機(jī)的內(nèi)核函數(shù)[8] K(Xi,Xj)=(φ(Xi)+φ(X)) (17) 僅需要對(duì)變量在初始低維空間進(jìn)行核函數(shù)計(jì)算就可以得到在高維空間中的內(nèi)積,則求解此凸二次規(guī)劃問題[9]獲得的非線性映射表示為 (18) 所有符合Mercer條件的計(jì)算都能夠看作是高維空間的內(nèi)積,本文利用下述雙曲核函數(shù)完成支持向量機(jī)流量預(yù)測(cè)模型構(gòu)建 K(X,Xi)=tanh(a′(X,Xi)+t′) (19) 式中,a′與t′均表示常數(shù)。確定時(shí)間序列X(t),將嵌入維數(shù)當(dāng)作滑動(dòng)窗口,獲得N-m個(gè)Rm內(nèi)的點(diǎn)Xt={xt-m,xt-m+1,…,xt-1}與其映射值Yt=xt構(gòu)成的樣本對(duì)(Xi,Yi)。前Ntr-m個(gè)數(shù)據(jù)代表訓(xùn)練樣本,它能對(duì)映射f:Rm→R進(jìn)行預(yù)測(cè);后N-Ntr個(gè)數(shù)據(jù)屬于測(cè)試樣本,用以評(píng)判預(yù)測(cè)效果。通過訓(xùn)練樣本對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,獲取的回歸函數(shù)表示為 (20) 則一步預(yù)測(cè)模型表示為 (21) 式中XNtr+1={XNtr-m+1,XMtr-m+2,…,XNtr}。 因此χ步預(yù)測(cè)模型表示為 (22) 對(duì)網(wǎng)絡(luò)流量各層的時(shí)間序列進(jìn)行預(yù)測(cè)后,對(duì)小波分解后的時(shí)間序列重構(gòu),能夠得到 X(ti)=Aj(ti)+D1(ti)+D2(ti)+…+Dj(ti) (23) 式中,Aj(ti)表示近似序列,(D1(ti)+D2(ti)+…+Dj(ti))則代表不同尺度細(xì)節(jié)序列[10]。針對(duì)近似序列Aj(ti)與不同尺度細(xì)節(jié)序列都適用確定的嵌入維m構(gòu)建訓(xùn)練樣本集合(Xi,Yi)(i=1,2,…,Ntr-m-1)。通過上述預(yù)測(cè)模型獲得回歸函數(shù)fAj與fD1,fD2,…,fDj,則最終輸出的預(yù)測(cè)值為: (24) 基于小波分解與支持向量機(jī)的網(wǎng)絡(luò)流量時(shí)間序列預(yù)測(cè)模型如圖1所示。 圖1 基于小波分解與支持向量機(jī)的流量預(yù)測(cè)模型 為證明本文預(yù)測(cè)方法性能,仿真采集了http:∥news-peer.nctu.edu.tw/~news/2019網(wǎng)址的有關(guān)數(shù)據(jù)。這些數(shù)據(jù)包括2019年所有入口與出口信息,挑選其中入口數(shù)據(jù)400個(gè),觀測(cè)值為24小時(shí)的總流量。因?yàn)檫@些數(shù)據(jù)計(jì)數(shù)序列變動(dòng)幅度較大,所以如果直接對(duì)其進(jìn)行預(yù)測(cè)會(huì)導(dǎo)致預(yù)測(cè)精度產(chǎn)生較大波動(dòng),因此需要對(duì)其進(jìn)行歸一化處理,歸一化表達(dá)式如下 (25) 式中,X′與X″分別代表初始數(shù)據(jù)和經(jīng)過處理后的數(shù)據(jù)。 為更好地對(duì)流量預(yù)測(cè)精度進(jìn)行評(píng)價(jià),實(shí)驗(yàn)中定義了不同種類誤差參數(shù):平均絕對(duì)參數(shù)(MAE,Mean Relative Error)與平均相對(duì)誤差(MRE,Mean Relative Error)。 (26) (27) 通過上述公式可知,平均絕對(duì)誤差能夠體現(xiàn)一系列預(yù)測(cè)值與真實(shí)值之間偏離的距離大??;而平均相對(duì)誤差則反映一系列預(yù)測(cè)值偏離真實(shí)值的平均比例。 對(duì)于不同分解層數(shù)L=1,2,3,4,5利用本文方法、文獻(xiàn)[1]與文獻(xiàn)[2]方法對(duì)流量數(shù)據(jù)進(jìn)行預(yù)測(cè),獲取經(jīng)過第1步與4步預(yù)測(cè)后獲得預(yù)測(cè)結(jié)果如表1、2、3所示。 表1 本文方法預(yù)測(cè)結(jié)果 表2 文獻(xiàn)[1]方法預(yù)測(cè)結(jié)果 表3 文獻(xiàn)[2]方法預(yù)測(cè)結(jié)果 由表1、2、3可知,本文方法隨著分解層數(shù)的擴(kuò)大預(yù)測(cè)誤差逐漸變小,而其它方法變化趨勢(shì)不固定,這表現(xiàn)出所提小波分解方法性能較好,在流量預(yù)測(cè)中起到很大作用。此外,從整體的平均誤差與平均相對(duì)誤差情況來看,本文方法誤差較小,預(yù)測(cè)精度高。在對(duì)比完三種方法預(yù)測(cè)精度后,又對(duì)預(yù)測(cè)實(shí)時(shí)性進(jìn)行對(duì)比,對(duì)比結(jié)果如圖2所示。 圖2 不同方法預(yù)測(cè)實(shí)時(shí)性對(duì)比圖 由圖2能夠看出,本文方法在相同流量規(guī)模下,預(yù)測(cè)延時(shí)最小。主要因?yàn)楸疚臉?gòu)建的組合模型能夠?qū)γ總€(gè)分量保持實(shí)時(shí)更新處理,這樣在同一個(gè)周期內(nèi)通過任意時(shí)刻和其之前的信息,即可實(shí)現(xiàn)對(duì)后續(xù)流量狀況的動(dòng)態(tài)多步預(yù)報(bào)。 由于網(wǎng)絡(luò)流量自身存在的特殊性質(zhì),導(dǎo)致單一的網(wǎng)絡(luò)流量模型已經(jīng)不能對(duì)其進(jìn)行準(zhǔn)確預(yù)測(cè)。而小波變換能夠?qū)Ψ瞧椒€(wěn)流量起到去相關(guān)作用,因此本文將其與支持向量機(jī)相結(jié)合,構(gòu)建組合型預(yù)測(cè)模型。仿真結(jié)果表明,該方法的平均絕對(duì)誤差與平均相對(duì)誤差都低于其它方法,且能夠?qū)崿F(xiàn)網(wǎng)絡(luò)流量的實(shí)時(shí)預(yù)測(cè)。雖然該方法表現(xiàn)出較好性能,但是將一些新技術(shù)引入到流量模型中來,不斷提高預(yù)測(cè)結(jié)果仍然是今后演技熱點(diǎn)。3.2 基于支持向量機(jī)的流量預(yù)測(cè)模型建立
4 仿真數(shù)據(jù)分析與研究
5 結(jié)論