摘要:現(xiàn)有Web服務(wù)器仿真流量預(yù)測(cè)由于對(duì)突發(fā)流量變化的適應(yīng)性不足,存在相對(duì)偏差較大、置信水平較低等問(wèn)題。文章提出基于改進(jìn)Prophet模型的Web服務(wù)器訪問(wèn)流量預(yù)測(cè)方法。首先對(duì)Web服務(wù)器歷史訪問(wèn)流量數(shù)據(jù)進(jìn)行預(yù)處理,然后基于經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)對(duì)數(shù)據(jù)進(jìn)一步分解,提取頻率特征明顯的訪問(wèn)流量時(shí)間序列,最后應(yīng)用改進(jìn)Prophet模型分解訪問(wèn)流量時(shí)間序列,通過(guò)分量求和實(shí)現(xiàn)Web服務(wù)器訪問(wèn)流量預(yù)測(cè)。實(shí)驗(yàn)結(jié)果證明,應(yīng)用該設(shè)計(jì)方法,相對(duì)偏差不超過(guò)0.1,置信水平不低于96%,可實(shí)現(xiàn)對(duì)Web服務(wù)器訪問(wèn)流量的精準(zhǔn)預(yù)測(cè)。
關(guān)鍵詞:改進(jìn)Prophet模型;Web服務(wù)器;訪問(wèn)流量預(yù)測(cè);經(jīng)驗(yàn)?zāi)B(tài)分解
中圖分類號(hào):TP391.9" 文獻(xiàn)標(biāo)志碼:A
0 引言
隨著互聯(lián)網(wǎng)的逐漸普及和廣泛應(yīng)用,萬(wàn)維網(wǎng)(World Wide Web,Web)服務(wù)器訪問(wèn)流量預(yù)測(cè)問(wèn)題受到研究領(lǐng)域的重視與關(guān)注,眾多學(xué)者開(kāi)展研究并已經(jīng)取得一定研究成果。如孟智慧等[1]提出基于堆疊的長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)方法。該方法利用堆疊長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)流量數(shù)據(jù)學(xué)習(xí),提取流量特征,根據(jù)特征預(yù)測(cè)未來(lái)某一時(shí)刻的流量值。田愛(ài)寶等[2]提出基于Transformer的預(yù)測(cè)方法。該方法利用Transformer模型通過(guò)自注意力機(jī)制自動(dòng)提取輸入流量序列中的特征,捕捉不同時(shí)間點(diǎn)之間的長(zhǎng)期依賴關(guān)系,從而預(yù)測(cè)訪問(wèn)流量。以上方法在實(shí)際應(yīng)用中存在相對(duì)偏差較大且置信水平較低等問(wèn)題。針對(duì)上述研究的不足,本文開(kāi)展基于改進(jìn)Prophet模型的Web服務(wù)器訪問(wèn)流量預(yù)測(cè)方法研究。
1 Web服務(wù)器歷史訪問(wèn)流量數(shù)據(jù)預(yù)處理與分解設(shè)計(jì)
在Web服務(wù)器日志文件中,每一條記錄都包含有關(guān)訪問(wèn)活動(dòng)的詳細(xì)信息。為便于后續(xù)處理,在完成流量數(shù)據(jù)采集后,對(duì)其進(jìn)行預(yù)處理,使其表示為x=(T,N,main)的形式。其中,x為預(yù)處理后的Web服務(wù)器歷史日志數(shù)據(jù);T為訪問(wèn)時(shí)間;N為Web服務(wù)器訪問(wèn)請(qǐng)求數(shù);main為訪問(wèn)用戶所在的區(qū)域。雖然經(jīng)過(guò)預(yù)處理的數(shù)據(jù)已經(jīng)較為干凈和規(guī)整,但直接對(duì)其進(jìn)行建模可能仍然面臨挑戰(zhàn),現(xiàn)有線性模型難以準(zhǔn)確捕捉其變化特征。因此,本文采用經(jīng)驗(yàn)?zāi)B(tài)分解法完成流量數(shù)據(jù)分解。設(shè)Web服務(wù)器歷史訪問(wèn)流量序列x存在局部極值特征,通過(guò)3次樣條插值法構(gòu)建Web服務(wù)器歷史訪問(wèn)流量序列上包絡(luò)線和下包絡(luò)線,計(jì)算2條包絡(luò)線均值,其表達(dá)式如下:
v(x)=[xmax(t)+xmin(t)]/2(1)
其中,v(x)為Web服務(wù)器歷史訪問(wèn)流量序列上下包絡(luò)線的均值;xmax(t)為流量序列上包絡(luò)線;xmin(t)為流量序列下包絡(luò)線[3]。然后,將均值從原始Web服務(wù)器歷史訪問(wèn)流量序列中刪除,得到一個(gè)分量f(t),其可表示為:
f(t)=x(t)-v(x)(2)
完成式(2)計(jì)算后,檢查分量f(t)是否滿足本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)分量的2個(gè)特定條件:第一,極端點(diǎn)數(shù)與過(guò)零點(diǎn)數(shù)相同或差一,過(guò)零點(diǎn)是曲線與縱坐標(biāo)軸交點(diǎn);第二,局部最大值與最小值包絡(luò)線的均值在任意時(shí)刻為0[4-5]。如果滿足,判斷f(t)為一個(gè)IMF分量,從Web服務(wù)器歷史訪問(wèn)流量序列中減去IMF分量,得到函數(shù)殘差項(xiàng)r,以其為新流量序列。重復(fù)以上操作,得到最終Web服務(wù)器歷史訪問(wèn)流量序列,可表示為:
x(t)=∑i=1f(t)i+ri(3)
其中,i為分解次數(shù)[6]。綜上,完成Web服務(wù)器歷史訪問(wèn)流量數(shù)據(jù)的預(yù)處理與分解,為后續(xù)流量預(yù)測(cè)奠定基礎(chǔ)。
2 基于改進(jìn)Prophet模型的流量預(yù)測(cè)
在得到Web服務(wù)器歷史訪問(wèn)流量序列后,為解決傳統(tǒng)Prophet模型對(duì)突發(fā)流量變化的適應(yīng)性不足的問(wèn)題,引入相關(guān)因素?cái)?shù)據(jù)、歷史相似數(shù)據(jù)進(jìn)行改進(jìn),實(shí)現(xiàn)流量預(yù)測(cè)。將訪問(wèn)流量IMF分量輸入改進(jìn)Prophet模型,采用指數(shù)增長(zhǎng)函數(shù)形式計(jì)算趨勢(shì)項(xiàng),可表示為:
y(t)=E1+exp[ef(t)-bf(t)](4)
其中,y(t)為Web服務(wù)器訪問(wèn)流量趨勢(shì)項(xiàng);E為改進(jìn)Prophet模型容量;ef(t)為IMF分量中Web服務(wù)器訪問(wèn)流量增長(zhǎng)率;bf(t)為IMF分量中Web服務(wù)器訪問(wèn)流量偏移率[7]。然后,通過(guò)傅里葉級(jí)數(shù)計(jì)算Web服務(wù)器訪問(wèn)流量季節(jié)項(xiàng),可表示為:
c(t)=∑i=1R·f(t)/K(5)
其中,c(t)為Web服務(wù)器訪問(wèn)流量季節(jié)項(xiàng);R為IMF分量中季節(jié)序列的周期;K為改進(jìn)Prophet模型估計(jì)的系數(shù)參數(shù)。最后,通過(guò)指示函數(shù)計(jì)算Web服務(wù)器訪問(wèn)流量節(jié)假日項(xiàng),可表示為:
h(t)=∑i=1Wf(t)k(6)
其中,h(t)為Web服務(wù)器訪問(wèn)流量節(jié)假日項(xiàng);Wf(t)為節(jié)假日時(shí)間序列對(duì)應(yīng)的IMF分量;k為節(jié)假日對(duì)訪問(wèn)流量的影響程度系數(shù)。將以上3個(gè)項(xiàng)相加,得到未來(lái)某一時(shí)間的Web服務(wù)器訪問(wèn)流量預(yù)測(cè)結(jié)果,可表示為:
p(t+j)=y(t+j)+c(t+j)+h(t+j)(7)
其中,p(t+j)為未來(lái)t+j時(shí)間Web服務(wù)器訪問(wèn)流量;j為預(yù)測(cè)時(shí)間量。通過(guò)以上步驟,完成基于改進(jìn)Prophet模型的Web服務(wù)器訪問(wèn)流量預(yù)測(cè)。
3 實(shí)驗(yàn)論證
為驗(yàn)證所提基于改進(jìn)Prophet模型預(yù)測(cè)方法的先進(jìn)性,本文以某大學(xué)圖書館Web服務(wù)器為實(shí)驗(yàn)對(duì)象,收集服務(wù)器近1年內(nèi)歷史訪問(wèn)日志文件信息并將其作為數(shù)據(jù)樣本,選取孟智慧等[1]提出的基于堆疊的長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)方法、田愛(ài)寶等[2]提出的基于Transformer的預(yù)測(cè)方法,設(shè)置對(duì)比實(shí)驗(yàn)。應(yīng)用3種方法進(jìn)行未來(lái)1~8天Web服務(wù)器訪問(wèn)流量預(yù)測(cè)并與實(shí)際相比,計(jì)算其相對(duì)偏差及置信水平,多次測(cè)試取均值,得到統(tǒng)計(jì)結(jié)果如表1所示。
分析表1數(shù)據(jù)可知,本文設(shè)計(jì)的基于改進(jìn)Prophet模型預(yù)測(cè)方法相對(duì)偏差不超過(guò)0.10,數(shù)值非常接近0,遠(yuǎn)低于孟智慧等[1]提出的基于堆疊的長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)方法、田愛(ài)寶等[2]提出的基于Transformer的預(yù)測(cè)方法。應(yīng)用本文設(shè)計(jì)的基于改進(jìn)Prophet模型的預(yù)測(cè)方法,置信水平不低于96%,遠(yuǎn)高于孟智慧等[1]提出的基于堆疊的長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)方法、田愛(ài)寶等[2]提出的基于Transformer的預(yù)測(cè)方法。由此可證明,本文設(shè)計(jì)的基于改進(jìn)Prophet模型預(yù)測(cè)方法在預(yù)測(cè)精度方面具有優(yōu)勢(shì),應(yīng)用效果較好。
4 結(jié)語(yǔ)
為提高Web服務(wù)器訪問(wèn)流量預(yù)測(cè)精度,本文開(kāi)展基于改進(jìn)Prophet模型的Web服務(wù)器訪問(wèn)流量預(yù)測(cè)方法研究。通過(guò)本次研究可發(fā)現(xiàn),這一方法在提升預(yù)測(cè)精度和穩(wěn)定性方面取得了顯著成效。該方法通過(guò)引入新的算法和技術(shù)手段對(duì)Prophet模型進(jìn)行優(yōu)化和改進(jìn),克服了原有模型在某些特定場(chǎng)景下的不足,使其更加適用于Web服務(wù)器訪問(wèn)流量預(yù)測(cè)任務(wù),應(yīng)用效果更優(yōu)。
參考文獻(xiàn)
[1]孟智慧,劉輝,劉偉信,等.基于堆疊長(zhǎng)短期記憶網(wǎng)絡(luò)的互聯(lián)網(wǎng)流量預(yù)測(cè)[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2024(6):80-85.
[2]田愛(ài)寶,魏嬌嬌,肖軍弼,等.基于Transformer的網(wǎng)絡(luò)流量預(yù)測(cè)研究[J].信息技術(shù),2024(4):156-160.
[3]鄭佳芳,游貴榮.基于XGBoost和LSTM模型的高校招生網(wǎng)站流量預(yù)測(cè)研究[J].重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2023(5):45-50.
[4]陸勤政,朱曉娟.基于并行多尺度卷積記憶殘差網(wǎng)絡(luò)的物聯(lián)網(wǎng)流量預(yù)測(cè)[J].廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2024(1):33-41.
[5]蔣東浩,趙洪華,王真.基于EWT和Neural Prophet-MLP的蜂窩網(wǎng)絡(luò)流量長(zhǎng)期預(yù)測(cè)方法[J].現(xiàn)代信息科技,2024(6):52-57.
[6]馬攀.基于ResNet-LSTM組合模型的網(wǎng)絡(luò)流量預(yù)測(cè)研究[J].蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2024(2):45-50.
[7]劉洋,廉咪咪.基于深度學(xué)習(xí)的移動(dòng)通信網(wǎng)絡(luò)流量預(yù)測(cè)方法研究[J].長(zhǎng)江信息通信,2024(2):90-92.
(編輯 王雪芬編輯)
Traffic prediction method of Web server access based on the improved Prophet model
LIU" Sujun, YANG" Guoying, DING" Jiayu, LI" Changsheng
(Lanzhou Petrochemical University of Vocational Technology, Lanzhou 730060, China)
Abstract:" Due to insufficient adaptability to sudden traffic changes, the existing Web server simulation traffic prediction has problems of relatively large deviation and low confidence level. Therefore, a Web server access traffic prediction method based on an improved Prophet model is proposed. The article first preprocesses the historical access traffic data of the Web server, and then further decomposes the data based on empirical mode decomposition technology to extract the time series of access traffic with obvious frequency characteristics. Finally, the improved Prophet model is applied to decompose the time series of access traffic, and the prediction of Web server access traffic is achieved through component summation. The experimental results demonstrate that the application design method can achieve accurate prediction of web server access traffic with a relative deviation of no more than 0.1 and a confidence level of no less than 96%.
Key words: improved Prophet model; Web server; access traffic prediction; empirical mode decomposition