曾國(guó)斌+冉兆春
摘要:雖然互聯(lián)網(wǎng)應(yīng)用已經(jīng)普及,但是經(jīng)常發(fā)生入侵事件,為了保證上網(wǎng)的安全性,開始對(duì)改進(jìn)樸素貝葉斯算法入侵檢測(cè)系統(tǒng)進(jìn)行研究。在試驗(yàn)中也證明這一方法有效,完全可以使用,下面就進(jìn)行深入的分析。
關(guān)鍵詞:樸素貝葉斯;算法入侵;檢測(cè)系統(tǒng)
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)28-0028-02
網(wǎng)絡(luò)攻擊事件增多,對(duì)網(wǎng)絡(luò)安全產(chǎn)生重要影響,很多用戶的文件丟失,為了控制惡意攻擊事件,技術(shù)人員引入了改進(jìn)樸素貝葉斯算法入侵檢測(cè)系統(tǒng),那么就分析該算法的原理,分析具體的檢測(cè)過程,希望得到認(rèn)可。
1 對(duì)樸素貝葉斯算法的分析
對(duì)于樸素貝葉斯算法而言,具體應(yīng)用中先要進(jìn)行一個(gè)簡(jiǎn)單的假設(shè),然后構(gòu)建貝葉斯方法,NB需要假定樣本特征、屬性,這兩點(diǎn)不會(huì)對(duì)樣本的歸類產(chǎn)生影響,因此相互之間都是沒有關(guān)聯(lián)的,是相互獨(dú)立存在的。對(duì)于樸素貝葉斯分類器而言,建立在貝葉斯定理基礎(chǔ)上的一種應(yīng)用,當(dāng)前在過濾垃圾郵件、信息領(lǐng)域、識(shí)別模式中應(yīng)用,除此之外,還可以進(jìn)行入侵檢測(cè)。相關(guān)技術(shù)人員選用樸素貝葉斯分類器原因非常簡(jiǎn)單,其在使用中進(jìn)行數(shù)據(jù)訓(xùn)練數(shù)量有限,不需要進(jìn)行大量數(shù)據(jù)的運(yùn)算,就可以得到必要的參數(shù),同時(shí)不會(huì)對(duì)已經(jīng)缺失的數(shù)據(jù)敏感,也就是運(yùn)算中不會(huì)被缺失的數(shù)據(jù)所影響,保證最終結(jié)果的準(zhǔn)確性,對(duì)變量都是進(jìn)行獨(dú)立假設(shè)的,變量相互之間沒有太多的聯(lián)系,對(duì)變量進(jìn)行估算即可,因此優(yōu)勢(shì)明顯,得到很多一線計(jì)算人員的認(rèn)可[1]。
2 研究改進(jìn)樸素貝葉斯算法入侵檢測(cè)系統(tǒng)
2.1 分析改進(jìn)NB分類模型
對(duì)于分析中應(yīng)用的貝葉斯決策理論而言,相關(guān)人員要清楚其核心思想就是通過先驗(yàn)概率估計(jì)之后再驗(yàn)概率。對(duì)于其分類模型而言,主要是以貝葉斯決策理論作為基礎(chǔ),該模型屬于被簡(jiǎn)化之后的貝葉斯概率模型,應(yīng)用這種分類模型優(yōu)勢(shì)十分明顯,例如分類準(zhǔn)確性很高、操作速度快、整個(gè)工作比較簡(jiǎn)單。當(dāng)前該模式的應(yīng)用非常廣泛,而且得到了相關(guān)人員的一致好評(píng)。
2.2 具體分析原理
設(shè)定樣本A=(a1,a2,…,an)是n維布爾向量,可以表示在 網(wǎng)絡(luò)事件中A的具體中特征ai是否出現(xiàn)過。具體判斷是C∈(C1,C2,…,Cm,f),屬于m個(gè)問題,映射函數(shù)f:Ai→ Cj,未確定事件實(shí)例Ai,屬于m個(gè)類別中的一個(gè)。訓(xùn)練樣本:X1,X2,…,XN,X=(x1,x2,…,xt)是t維布爾向量,屬于c1,c2,…,ck,是k個(gè)事件標(biāo)簽。網(wǎng)絡(luò)樣本沒有分類,需要進(jìn)行分類,Yi=(y1,y2,…,yn)∈(Y1,Y2,…,YN,Cj), 屬于每個(gè)類別的概率情況。對(duì)訓(xùn)練樣本中類別c j的概率P(c,j) 進(jìn)行估計(jì),通過模型建立NBM 結(jié)構(gòu),要注意所有待分類節(jié)點(diǎn)Ai都隸屬于共有類別節(jié)點(diǎn)C,在此基礎(chǔ)上,每一個(gè)待分類節(jié)點(diǎn)之間的關(guān)系也是相互獨(dú)立的,可以根據(jù)下圖進(jìn)行細(xì)致分析。在這一關(guān)系模型中可以發(fā)現(xiàn),每一個(gè)節(jié)點(diǎn)之間的聯(lián)系都可以反映出貝葉斯決策的核心理論,一就是先驗(yàn)概率估計(jì)之后再驗(yàn)概率。在此之后,利用后驗(yàn)概率對(duì)新的樣本進(jìn)行更新,在這一模型中進(jìn)行集合節(jié)點(diǎn)的訓(xùn)練和學(xué)習(xí),最終就可以計(jì)算出最大可能性的分類情況。由此可見,之前進(jìn)行的獨(dú)立假設(shè)很多情況下都是錯(cuò)誤的,但是通過結(jié)論得知可以得到很好的分類效果,這就說明這一分類模型的作用和優(yōu)勢(shì),以及計(jì)算的準(zhǔn)確性。下圖就是NBC的結(jié)構(gòu)示意圖,相關(guān)人員可以參考進(jìn)行分析[2]。
在此基礎(chǔ)上,還有一種屬性加值算法NBC,單純從理論方面分析,利用計(jì)算出待分類節(jié)點(diǎn)所屬類別的最大后驗(yàn)概率MAP,用其確定最后的節(jié)點(diǎn)cj。具體落實(shí)中存在很多問題,受到不同因素的影響,特征樣本節(jié)點(diǎn)不同,屬性樣本節(jié)點(diǎn)不同,得到的訓(xùn)練樣本集合不同,導(dǎo)致分類精度下降,為了彌補(bǔ)這一算法的缺陷,相關(guān)人員必須在原有的算法基礎(chǔ)上,繼續(xù)引入一種新的模式,也就是屬性加值算法,通過實(shí)踐操作得知,結(jié)合這一算法就可以很好的保證NBC分類準(zhǔn)確度,還可以降低分類誤差,以此得到了廣泛的應(yīng)用。
2.3 分析NBC入侵檢測(cè)流程
對(duì)于傳統(tǒng)的入侵檢測(cè)而言,先設(shè)計(jì)一種事件分類器,有效區(qū)分?jǐn)?shù)據(jù)中的異常數(shù)據(jù)和正常數(shù)據(jù),這樣就可以對(duì)攻擊問題進(jìn)行報(bào)警。IDS可以對(duì)入侵事件進(jìn)行檢測(cè),屬于一種不確定性的行為,針對(duì)這一情況,非常適合使用樸素貝葉斯理論,可以很好地對(duì)不確定的概率事件精細(xì)分析,結(jié)合這一情況,研究IDS時(shí)就可以直接引入NBC的入侵檢測(cè)技,可以達(dá)到理想的作用效果。根據(jù)這一問題,在研究中工作人員把NBC技術(shù)在入侵檢測(cè)模型的分類模塊中進(jìn)行了使用,按照相關(guān)的流程進(jìn)行一步步的處理,最終得到數(shù)據(jù)的歸類集合,其具體的入侵流程可以參考下圖。
3 結(jié)果分析
3.1 數(shù)據(jù)集分析
數(shù)據(jù)分析中使用了KDD Cup1999入侵檢測(cè)數(shù)據(jù)集,在這一數(shù)據(jù)集中主要涵蓋兩個(gè)部分,第一部分,有5000000個(gè)網(wǎng)絡(luò)記錄下的七周內(nèi)的訓(xùn)練數(shù)據(jù),第二部分,2000000個(gè)網(wǎng)絡(luò)記錄下兩周的數(shù)據(jù),對(duì)于以此類型進(jìn)行了細(xì)致劃分,共分為了39種攻擊類型, 可以參考表1和表2進(jìn)行分析[3]。
3.2 實(shí)驗(yàn)結(jié)果分析
進(jìn)行實(shí)驗(yàn)時(shí)監(jiān)理環(huán)境平臺(tái),變成工具是MATLAB8.0,進(jìn)行入侵?jǐn)?shù)據(jù)檢查過程中,使用的數(shù)據(jù)是10%入侵檢測(cè)數(shù)據(jù)集TrS、TeS,通過模擬試驗(yàn)就可以得到具體的結(jié)果,可以參考下表分析。分析中得知改進(jìn)后的NB算法較傳統(tǒng)的NB算法在對(duì)針網(wǎng)絡(luò)入侵事件、分類的準(zhǔn)確率、誤檢率都具有明顯的提高。
4 總結(jié)
通過上述的分析可以發(fā)現(xiàn),針對(duì)復(fù)雜的網(wǎng)絡(luò)攻擊,進(jìn)行入侵測(cè)試屬于不確定行為過程的組合,在檢測(cè)中引入樸素貝葉斯決策理論分類器,達(dá)到了理想的效果,這一舉措完全可行。在以后的發(fā)展中,還可以對(duì)這一檢測(cè)技術(shù)進(jìn)行改善。
參考文獻(xiàn):
[1] 王輝,陳泓予,劉淑芬.基于改進(jìn)樸素貝葉斯算法的入侵檢測(cè)系統(tǒng)[J].計(jì)算機(jī)科學(xué),2014,41(04):111-115.
[2] 周文剛,金鑫.基于樹擴(kuò)展樸素貝葉斯的高效網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)[J].北京師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007,43(1):53-56.
[3] 姚濰,王娟,張勝利.基于決策樹與樸素貝葉斯分類的入侵檢測(cè)模型[J].計(jì)算機(jī)應(yīng)用,2015,35(10):2883-2885.endprint