摘? 要: 分析計算機網(wǎng)絡(luò)安全態(tài)勢問題時,由于計算機網(wǎng)絡(luò)存在混沌性、非線性等特征,致使計算機網(wǎng)絡(luò)安全態(tài)勢分析誤差較大,未能保障計算機網(wǎng)絡(luò)安全。由此,構(gòu)建一種基于小波支持向量機的計算機網(wǎng)絡(luò)安全態(tài)勢分析模型,獲取計算機網(wǎng)絡(luò)流量的原始變動軌跡,保障支持向量機的和為0;對預(yù)處理后的計算機網(wǎng)絡(luò)流量,采用基于小波分解和支持向量機的網(wǎng)絡(luò)流量預(yù)測模型,實現(xiàn)計算機網(wǎng)絡(luò)安全態(tài)勢分析。以某學(xué)校計算機網(wǎng)絡(luò)為例,將該模型的最優(yōu)時延值與最小嵌入維數(shù)依次設(shè)成4與7,基于該設(shè)定,使用該模型對其安全態(tài)勢分析后可知,該模型的分析結(jié)果和實際情況十分吻合,分析精度較高,且應(yīng)用該模型后,計算機網(wǎng)絡(luò)安全性大大提升。
關(guān)鍵詞: 安全態(tài)勢分析; 計算機網(wǎng)絡(luò); 網(wǎng)絡(luò)流量預(yù)處理; 模型構(gòu)建; 支持向量機; 時延設(shè)定
中圖分類號: TN915.08?34; TP391? ? ? ? ? ? ? ? ? 文獻標(biāo)識碼: A? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)21?0068?04
Computer network security situation analysis based on wavelet
support vector machine
SHANG Yongqiang
(Xinyang Agriculture and Forestry University, Xinyang 464000, China)
Abstract: When the security situation of computer network is analyzed, there is a large error existing in security situation analysis of computer network because of the chaos and non?linearity of computer network, which may reduce the security of computer network. Therefore, a computer network security situation analysis model based on wavelet support vector machine is constructed. The original change trajectory of the computer network traffic is obtained to guarantee the sum of support vector machine to be 0. For the pretreated computer network traffic, the network traffic prediction model based on wavelet decomposition and support vector machine is adopted to realize the computer network security situation analysis. Taking a school′s computer network as an example, the optimal delay value and the minimum embedding dimension of the model are set as 4 and 7 respectively. According to the setting values, after security situation of the model is analyzed with the model, it can be seen that the analysis results of the model are very consistent with the actual situation, and its analysis accuracy is high. Moreover, the computer network security is greatly improved after the application of the model.
Keywords: security situation analysis; computer network; network traffic pretreatment; model construction; support vector machine; time delay setup
0? 引? 言
伴隨信息技術(shù)的逐漸發(fā)展,互聯(lián)網(wǎng)技術(shù)與計算機技術(shù)也得以優(yōu)化。此時,用戶需求量出現(xiàn)爆發(fā)性增長,在此環(huán)境中,計算機網(wǎng)絡(luò)安全態(tài)勢的準(zhǔn)確分析愈發(fā)重要。當(dāng)下計算機網(wǎng)絡(luò)安全事件出現(xiàn)數(shù)目逐漸增多,這對網(wǎng)絡(luò)多元化發(fā)展存在較大影響[1]。所以,想要高效處理網(wǎng)絡(luò)安全問題,確保計算機網(wǎng)絡(luò)系統(tǒng)可以安全正常工作,必須實現(xiàn)高精度、高效率的計算機網(wǎng)絡(luò)安全態(tài)勢分析[2]。
計算機網(wǎng)絡(luò)系統(tǒng)不屬于線性系統(tǒng),存在較高的混沌性與非線性,不能直接使用指定函數(shù)模式描述計算機網(wǎng)絡(luò)安全態(tài)勢,為了高精度分析計算機網(wǎng)絡(luò)安全態(tài)勢,國內(nèi)外專家使用神經(jīng)網(wǎng)絡(luò)、時間序列模型對其實施分析。而此類模型的預(yù)測精度不能滿足逐漸發(fā)展的計算機網(wǎng)絡(luò)系統(tǒng)的安全需求[3]。這是因為計算機網(wǎng)絡(luò)流量易遭到網(wǎng)絡(luò)用戶行為、經(jīng)濟等因素干擾,存在周期性、非線性變動等屬性,以往的預(yù)測模型不能全方位掌握網(wǎng)絡(luò)流量變動屬性,未能全方位分析網(wǎng)絡(luò)安全態(tài)勢,所以預(yù)測精度較低。為了實現(xiàn)高精度的計算機網(wǎng)絡(luò)安全態(tài)勢分析,本文構(gòu)建一種基于小波支持向量機的計算機網(wǎng)絡(luò)安全態(tài)勢分析模型,對復(fù)雜的計算機網(wǎng)絡(luò)實現(xiàn)準(zhǔn)確分析[4]。
1? 基于小波支持向量機的計算機網(wǎng)絡(luò)安全態(tài)勢分析模型
1.1? 計算機網(wǎng)絡(luò)流量的預(yù)處理
計算機網(wǎng)絡(luò)流量存在混沌性,所以必須對其實施相空間重構(gòu),將計算機網(wǎng)絡(luò)流量的原始變動軌跡描述出來,使用虛假最近臨點法獲取計算機網(wǎng)絡(luò)流量的最優(yōu)嵌入維[n],使用互信息法獲取時延[r],以此實現(xiàn)計算機網(wǎng)絡(luò)流量重構(gòu):
[Y0Y(1)?Y(M-1)=y1-ry1-2r…y1-nry2-ry2-2r…y2-nr????yM-ryM-2r…yM-nr] (1)
式中:重構(gòu)后的計算機網(wǎng)絡(luò)流量集為[Y0Y(1)?Y(M-1)];[M]描述數(shù)量。為保障支持向量機的和是0,將計算機網(wǎng)絡(luò)流量數(shù)據(jù)實施下述預(yù)處理:
[Yn,r=yn,r-mean yjstd yjXn=xn-mean xstd x] (2)
式中:[mean yj],[std yj]依次描述輸入向量[Y]的第[j]列的算術(shù)均值與標(biāo)準(zhǔn)方差;[mean x],[std x]依次描述輸入向量[X]的算術(shù)均值與標(biāo)準(zhǔn)方差。
1.2? 基于小波分解和支持向量機的網(wǎng)絡(luò)流量預(yù)測模型
1.2.1? 計算機網(wǎng)絡(luò)流量的小波分析
1) 小波設(shè)定
假定一平方可積函數(shù)是[φh],則[φh∈K2S],則此函數(shù)的傅里葉變換[φ?]符合:
[Aφ=φ?2?d?<∞] (3)
式中:小波母函數(shù)是[φ?];[Aφ]描述變換條件;[?]描述權(quán)指數(shù)。
將[φh]實施伸縮與平移能夠得到:
[φβ,δh=1βφh-δββ] (4)
式中:平移因子與伸縮因子依次設(shè)成[δ],[β],[δ∈S],[β>0];[δ],[β]的小波基函數(shù)為[φβ,δh];[h]描述時刻。
2) 小波轉(zhuǎn)換的[α] Trous算法
計算機網(wǎng)絡(luò)流量屬于一個離散時間序列數(shù)據(jù),所以本文使用小波轉(zhuǎn)換的[α] Trous算法將它實施分解與重構(gòu)[5?6]。假定得到的計算機網(wǎng)絡(luò)時間序列是[Y(h)],使用離散低通濾波器[t]能夠獲取計算機網(wǎng)絡(luò)流量分解尺度系數(shù)[ai+1h]:
[ai+1h=k=-∞+∞taih+2ik] (5)
按照[α] Trous算法離散小波轉(zhuǎn)換的屬性,計算機網(wǎng)絡(luò)流量每個尺度中的細節(jié)系數(shù)能夠描述為:
[bi+1k=aik-ai+1k] (6)
則網(wǎng)絡(luò)流量時間序列的分辨率[k]的小波轉(zhuǎn)換如下:
[B=b1,b2,…,bk,ak] (7)
式中:網(wǎng)絡(luò)流量每個尺度中的細節(jié)信號設(shè)成[b1,b2,…,bk];計算機網(wǎng)絡(luò)流量近似信號設(shè)成[ak]。
網(wǎng)絡(luò)流量時間序列[Yh]能夠通過細節(jié)信號與近似信號實施重構(gòu),則:
[Yh=a0h=akh+i=1kbih] (8)
3) 計算機網(wǎng)絡(luò)流量的小波分解流程
假定計算機網(wǎng)絡(luò)流量輸入信號是[Yh],[t(s)]描述小波轉(zhuǎn)換低通濾波器,將小波轉(zhuǎn)換高通濾波器設(shè)成[f(s)],[K]描述小波分解級數(shù)。則計算機網(wǎng)絡(luò)流量的小波分解流程如下:
第一步:計算機網(wǎng)絡(luò)流量初始化
[a0=Yh,? ?t1s=ts,? ?f1s=fs,? ?s=1] (9)
第二步:計算機網(wǎng)絡(luò)流量小波分解
[ais=ai-1s*ti-s] (10)
[bis=bi-1s*fi-s] (11)
式中“*”描述卷積計算。
第三步:將濾波實施插零操作
[ti+1s=tis2,? ? m是偶數(shù)0,? ? m是奇數(shù)] (12)
[fi+1s=fis2,? ? m是偶數(shù)0,? ? m是奇數(shù)] (13)
其中[m]代表不同的變量。
第四步:[i=i+1],若[i 基于上述設(shè)定可知,計算機網(wǎng)絡(luò)流量的小波分解步驟如圖1所示。 1.2.2? 計算機網(wǎng)絡(luò)流量的支持向量機建模 支持向量機屬于一個基于結(jié)構(gòu)安全最大化原則的新型機器學(xué)習(xí)方法,能夠克服以往機器學(xué)習(xí)方法具有的弊端,非線性學(xué)習(xí)性能較好,泛化性能優(yōu),十分適用于存在時變性、非線性變動的復(fù)雜網(wǎng)絡(luò)安全態(tài)勢分析中[7]。計算機網(wǎng)絡(luò)流量通過小波分解,已有網(wǎng)絡(luò)流量序列里的低頻信息被分解,便得到網(wǎng)絡(luò)流量的周期性與長時間的趨勢規(guī)律,完美地去除已有網(wǎng)絡(luò)流量里的突變部分[8?9];高頻分量較好地表達了計算機網(wǎng)絡(luò)流量存在的隨機性,支持向量機選取十分合理的核函數(shù),之后將每個分量實施預(yù)測,最終將每個分量預(yù)測結(jié)果實施重構(gòu),獲取網(wǎng)絡(luò)流量的安全態(tài)勢分析結(jié)果[10]。假定得到的計算機網(wǎng)絡(luò)流量分量是[{yh}],[n]描述計算機網(wǎng)絡(luò)流量的嵌入維數(shù),則基于支持向量機的網(wǎng)絡(luò)流量一步預(yù)測模型是: [ak-1=akt+bif,? ?i=0,1,2,…,K]? ? ? ? ? (14) 式中,[t],[f]描述[t],[f]的對偶算子。 1.2.3? 計算機網(wǎng)絡(luò)流量建模預(yù)測步驟 1) 采集計算機網(wǎng)絡(luò)流量數(shù)據(jù),獲取原始計算機網(wǎng)絡(luò)流量時間序列[Y(h)]。 2) 將計算機網(wǎng)絡(luò)流量實施小波分解,設(shè)定小波分解尺度,把已有的計算機網(wǎng)絡(luò)流量分解為差異成分的網(wǎng)絡(luò)流量分量[11]。 3) 將計算機網(wǎng)絡(luò)流量分量實施歸一化,因為計算機網(wǎng)絡(luò)流量的每個分量變動區(qū)間不小,為了提升支持向量機學(xué)習(xí)效率與分析準(zhǔn)確度,將它實施歸一化,則: [y′j=yj-yminymax-ymin] (15) 式中:[yj]描述原始網(wǎng)絡(luò)流量;歸一化后的計算機網(wǎng)絡(luò)流量是[y′j];計算機網(wǎng)絡(luò)流量的最大值與最小值依次是[ymax],[ymin]。 4) 模型初始化。把數(shù)據(jù)分為訓(xùn)練樣本集與測試樣本集,設(shè)定各個分量嵌入維數(shù),之后按照嵌入維數(shù)設(shè)置支持向量機的輸入向量與輸出向量[12]。 5) 支持向量機核函數(shù)和參數(shù)設(shè)置。針對計算機網(wǎng)絡(luò)流量的高頻部分不出現(xiàn)突變,支持向量機核函數(shù)選取線性核函數(shù);針對計算機網(wǎng)絡(luò)流量的低頻部分而言,它存在明顯不平穩(wěn)性與非線性,支持向量機核函數(shù)選取高斯核函數(shù),其參數(shù)都使用粒子群算法優(yōu)化獲取[13]。 6) 支持向量機訓(xùn)練與預(yù)測。使用以上方法獲取的參數(shù)對訓(xùn)練集實施學(xué)習(xí),構(gòu)建預(yù)測模型,之后對測試集實施測試[14]。 7) 將每個分量預(yù)測結(jié)果實施反歸一化,反歸一化方法是: [yj=y′j?ymax-ymin+ymin] (16) 8) 將反歸一化后的計算機網(wǎng)絡(luò)分量使用小波轉(zhuǎn)換技術(shù)實施重構(gòu),獲取計算機網(wǎng)絡(luò)流量最終預(yù)測結(jié)果,完成計算機網(wǎng)絡(luò)安全態(tài)勢分析[15]。 2? 實驗結(jié)果與分析 使用計算機網(wǎng)絡(luò)流量監(jiān)測軟件獲取某校園網(wǎng)流量,共獲取了2 000個校園計算機網(wǎng)絡(luò)流量數(shù)據(jù),把前1 800個數(shù)據(jù)設(shè)成本文模型的訓(xùn)練樣本,剩下200個數(shù)據(jù)設(shè)成測試樣本,將訓(xùn)練完畢的數(shù)據(jù)實施測試,詳細見圖2。 實驗使用Matlab 7.1完成校園計算機網(wǎng)絡(luò)安全態(tài)勢分析。為了測試本文模型對校園計算機網(wǎng)絡(luò)安全態(tài)勢的分析結(jié)果,設(shè)定兩個對比模型:一是BP神經(jīng)網(wǎng)絡(luò)模型;二是小波神經(jīng)網(wǎng)絡(luò)模型。通過絕對誤差均值、絕對百分比誤差均值以及模型訓(xùn)練時間等幾個評估指標(biāo)測試三種模型的分析性能。在使用本文模型時,通過互信息法運算最優(yōu)時延,實驗結(jié)果如圖3所示。 通過虛假最近鄰點法獲取最小嵌入維數(shù),結(jié)果如圖4所示。由圖3,圖4可知,此校園計算機網(wǎng)絡(luò)流量數(shù)據(jù)的最優(yōu)時延值是4,最小嵌入維數(shù)是7。在此設(shè)定下實施校園網(wǎng)絡(luò)數(shù)據(jù)重構(gòu)。 對重構(gòu)后的訓(xùn)練樣本實施學(xué)習(xí)。三種模型對該校園計算機網(wǎng)絡(luò)安全態(tài)勢分析結(jié)果依次如圖5~圖7所示。分析圖5~圖7可知,本文模型對該學(xué)校計算機網(wǎng)絡(luò)安全態(tài)勢分析后,其分析結(jié)果的絕對誤差均值最低,絕對百分比誤差均值最低,分析結(jié)果可信度最高,說明本文模型分析精度顯著優(yōu)于對比模型。 為了更直觀地分析本文模型對該學(xué)校計算機網(wǎng)絡(luò)安全態(tài)勢的分析精度,以圖2為例,本文模型對其分析結(jié)果如圖8所示。圖8中,斜線部分是本文模型分析結(jié)果,黑色部分屬于該學(xué)校計算機網(wǎng)絡(luò)安全態(tài)勢實際波動。由此可知,本文模型分析結(jié)果和實際情況十分吻合,證明本文模型分析精度較高。 為分析本文模型實際應(yīng)用效果,測試該學(xué)校使用本文模型后,學(xué)校計算機網(wǎng)絡(luò)故障率。設(shè)定該學(xué)校計算機網(wǎng)絡(luò)易出現(xiàn)的入侵模式依次是拒絕服務(wù)攻擊(DoS)、遠程用戶沒有授權(quán)訪問攻擊(U2R)、沒有授權(quán)應(yīng)用本地超級權(quán)限訪問攻擊(U2L)、掃描攻擊(Probe),分析該學(xué)校使用本文模型后,四種入侵模式的出現(xiàn)情況,結(jié)果如表1所示。分析表1可知,該學(xué)校計算機網(wǎng)絡(luò)使用本文模型前,四種入侵模式中DoS模式的出現(xiàn)率高達32.23%,使用本文模型后,該入侵模式的降低率高達31.00%,由此說明,本文模型能夠大大提升該學(xué)校計算機網(wǎng)絡(luò)的安全性。 3? 結(jié)? 語 計算機網(wǎng)絡(luò)安全自身存在多元化、壁壘化致使其存在大量的安全干擾因素,不但遭到計算機入侵病毒、網(wǎng)絡(luò)系統(tǒng)設(shè)計以及網(wǎng)絡(luò)結(jié)構(gòu)等因素所影響,網(wǎng)絡(luò)機制的缺失以及黑客的侵襲均對其存在一定影響。目前,中國核心的網(wǎng)絡(luò)安全管理技術(shù)包含網(wǎng)絡(luò)數(shù)據(jù)加密方法、防火墻、數(shù)據(jù)備份恢復(fù)方法和入侵檢測方法。即使此類方法可以在一定程度中保護計算機不出現(xiàn)危險,而它在實際使用時具有的弊端也不可能忽視。 本文構(gòu)建一種基于小波支持向量機的計算機網(wǎng)絡(luò)安全態(tài)勢分析模型,經(jīng)驗證,該模型不但分析精度高,而且應(yīng)用性能好,該學(xué)校計算機網(wǎng)絡(luò)使用本文模型前,四種入侵模式中DoS模式的出現(xiàn)率高達32.23%,使用本文模型后,該入侵模式的降低率高達31.00%。由此可知,本文模型屬于一種高精度、可提升計算機網(wǎng)絡(luò)安全性的分析模型。 參考文獻 [1] 張金剛,陳永強,雷霞,等.基于小波分析的并行膜混合核支持向量機月度負(fù)荷預(yù)測[J].水電能源科學(xué),2018,36(6):210?213. [2] 劉強,蔡志平,殷建平,等.網(wǎng)絡(luò)安全檢測框架與方法研究[J].計算機工程與科學(xué),2017,39(12):2224?2229. [3] 王佳欣,馮毅,由睿.基于依賴關(guān)系圖和通用漏洞評分系統(tǒng)的網(wǎng)絡(luò)安全度量[J].計算機應(yīng)用,2019,39(6):1719?1727. [4] 張杰,傅文博.網(wǎng)絡(luò)安全數(shù)據(jù)可視化融合的分析方法[J].微電子學(xué)與計算機,2019,36(6):101?104. [5] 潘鋒.海上艦船通信網(wǎng)絡(luò)防攻擊中的支持向量機模型分析[J].艦船科學(xué)技術(shù),2017,39(18):183?185. [6] 和敬涵,羅易萍,羅國敏,等.基于小波多分辨分析和支持向量機的柔性直流系統(tǒng)單端保護方案[J].電網(wǎng)技術(shù),2018,42(12):4022?4030. [7] 黃林生,劉文靜,黃文江,等.小波分析與支持向量機結(jié)合的冬小麥白粉病遙感監(jiān)測[J].農(nóng)業(yè)工程學(xué)報,2017,33(14):188?195. [8] 杜臻,馬立鵬,孫國梓.一種基于小波分析的網(wǎng)絡(luò)流量異常檢測方法[J].計算機科學(xué),2019,46(8):178?182. [9] 洪翠,付宇澤,郭謀發(fā),等.改進多分類支持向量機的配電網(wǎng)故障識別方法[J].電子測量與儀器學(xué)報,2019,33(1):7?15. [10] 劉玉敏,趙哲耘.基于特征選擇與SVM的質(zhì)量異常模式識別[J].統(tǒng)計與決策,2018,34(10):47?51. [11] 華志穎,吳蒙,楊立君.基于四分之一超球SVM的WSN異常檢測[J].南京郵電大學(xué)學(xué)報(自然科學(xué)版),2019,39(4):47?54. [12] 程家根,祁正華,陳天賦.基于RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全態(tài)勢感知[J].南京郵電大學(xué)學(xué)報(自然科學(xué)版),2019,39(4):88?95. [13] 唐贊玉,劉宏.多階段大規(guī)模網(wǎng)絡(luò)攻擊下的網(wǎng)絡(luò)安全態(tài)勢評估方法研究[J].計算機科學(xué),2018,45(1):245?248. [14] 錢斌,蔡梓文,肖勇,等.基于模糊推理的計量自動化系統(tǒng)網(wǎng)絡(luò)安全態(tài)勢感知[J].南方電網(wǎng)技術(shù),2019,13(2):51?58. [15] 朱江,明月,王森.基于深度自編碼網(wǎng)絡(luò)的安全態(tài)勢要素獲取機制[J].計算機應(yīng)用,2017,37(3):771?776. 作者簡介:尚永強(1982—),男,河南信陽人,碩士,講師,主要研究方向為信息技術(shù)、網(wǎng)絡(luò)信息安全。