• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于SDN的智能入侵檢測系統(tǒng)模型與算法①

      2020-06-09 05:09:06張莎莎宋姝雨
      高技術(shù)通訊 2020年5期
      關(guān)鍵詞:代價(jià)決策樹分類器

      馬 琳 張莎莎 宋姝雨 王 磊*

      (*空軍杭州特勤療養(yǎng)中心信息科 杭州 310012)(**浙江大學(xué)信息與電子工程學(xué)院 杭州 310027)(***國家廣播電視總局廣播電視科學(xué)研究院 北京 100866)

      0 引 言

      入侵檢測常用的檢測方法有異常檢測和誤用檢測[1]。對于異常檢測,其假設(shè)入侵行為與正常行為明顯不同。典型的異常檢測方法包括專家系統(tǒng)、統(tǒng)計(jì)分析和定量分析。而誤用檢測假設(shè)所有入侵都可以表示為模式或特征,系統(tǒng)基于這些模式或特征來檢測入侵行為[2]。異常檢測的優(yōu)勢在于對新型攻擊敏感,但誤報(bào)率較高。誤用檢測的優(yōu)勢在于其對已知攻擊具有優(yōu)越性能,但很難檢測到未知的攻擊。如何提高入侵檢測系統(tǒng)的檢測準(zhǔn)確率、降低誤報(bào)率和漏報(bào)率一直是研究的重點(diǎn)和熱點(diǎn)。

      軟件定義網(wǎng)絡(luò)(software defined networking,SDN)作為一種新型網(wǎng)絡(luò)架構(gòu),其控制面與轉(zhuǎn)發(fā)面分離、控制器北向接口開放、可實(shí)現(xiàn)集中控制等特性為網(wǎng)絡(luò)技術(shù)創(chuàng)新提供了良好的平臺(tái)。SDN控制器具有全局網(wǎng)絡(luò)的信息,可以根據(jù)需要監(jiān)控網(wǎng)絡(luò)中任意位置的流量,這為集中進(jìn)行入侵流監(jiān)測提供了便利。在SDN控制器中,可以非常方便地集成各種先進(jìn)的人工智能算法[3-5],突破了傳統(tǒng)特征匹配等方法的局限性,能夠顯著提升入侵檢測的性能。

      本文設(shè)計(jì)了一種基于SDN的智能入侵檢測系統(tǒng)模型,使用改進(jìn)的隨機(jī)森林算法進(jìn)行智能流分類,以獲得更高的檢測率和更低的檢測代價(jià)。本文使用KDD CUP99數(shù)據(jù)集作為訓(xùn)練集和測試集,對改進(jìn)算法進(jìn)行了性能仿真和對比分析。

      1 相關(guān)研究

      文獻(xiàn)[6,7]研究了傳統(tǒng)的流量異常檢測方法在SDN網(wǎng)絡(luò)中的應(yīng)用。然而這些方法采用的流量特征數(shù)據(jù)較為單一, 僅能針對某種特定的異常。文獻(xiàn)[8]提出了基于改進(jìn)非廣延熵特征提取的雙隨機(jī)森林實(shí)時(shí)入侵檢測方法,實(shí)現(xiàn)對少量異常的有效實(shí)時(shí)檢測,但該方法只適合對骨干鏈路進(jìn)行檢測。文獻(xiàn)[9]融合OpenFlow和sFlow提出了一種可進(jìn)行異常檢測并可減輕網(wǎng)絡(luò)異常的機(jī)制。Jankowski等人[10]提出了一種基于SDN的入侵檢測架構(gòu),該架構(gòu)從細(xì)粒度數(shù)據(jù)流中提取流量統(tǒng)計(jì)信息,并通過分類器對數(shù)據(jù)進(jìn)行分類并判斷是否有入侵。文獻(xiàn)[11]提出了一種稱為AD-ICMP-SDN的異常檢測機(jī)制。其中的異常檢測組件由因特網(wǎng)控制報(bào)文協(xié)議(internet control message protocol, ICMP)流量采集、數(shù)據(jù)訓(xùn)練、支持向量機(jī)(support vector machine, SVM)分類3個(gè)模塊組成并對異常檢測。但這些研究都缺少統(tǒng)一的系統(tǒng)模型,也缺乏對人工智能算法的靈活集成和應(yīng)用,無法實(shí)現(xiàn)持續(xù)的檢測性能提升。

      2 基于SDN的智能入侵檢測模型

      本文提出一種基于SDN的智能入侵檢測系統(tǒng)模型,如圖1所示。該系統(tǒng)模型被分為3個(gè)平面:轉(zhuǎn)發(fā)平面、控制平面、應(yīng)用和分類平面。

      圖1 基于SDN的智能入侵檢測系統(tǒng)模型

      轉(zhuǎn)發(fā)平面由網(wǎng)絡(luò)中的OpenFlow交換機(jī)構(gòu)成,它們通過安全通道與控制器進(jìn)行通信。該平面負(fù)責(zé)在交換機(jī)之間轉(zhuǎn)發(fā)數(shù)據(jù)包。通過收集和上傳交換機(jī)的流量信息,為控制平面提供實(shí)時(shí)的網(wǎng)絡(luò)狀態(tài)和可疑數(shù)據(jù)流。另外,交換機(jī)也可以根據(jù)控制器的指令通過丟棄攻擊流的報(bào)文來阻止入侵行為。

      控制平面對采集的數(shù)據(jù)流進(jìn)行初步分析。狀態(tài)監(jiān)測模塊監(jiān)視網(wǎng)絡(luò)狀態(tài),并周期性地請求交換機(jī)上報(bào)流量信息。流劃分模塊處理和分析流量統(tǒng)計(jì)信息,將數(shù)據(jù)包聚類成流,并生成如下的6元組流標(biāo)識(shí):

      {srcip,dstip,srcport,dstport,duration,protocol}

      數(shù)據(jù)包的收集和檢查按照一定的時(shí)間間隔執(zhí)行,合適的時(shí)間間隔能夠避免降低異常識(shí)別的實(shí)時(shí)性,同時(shí)不會(huì)大幅增加開銷。

      應(yīng)用和分類平面包括特征選擇模塊和流分類器模塊。特征選擇模塊提取可疑流的有關(guān)特征并找到特征的最佳子集,可以高效地處理高維數(shù)據(jù)。流分類器模塊通過標(biāo)記是否屬于特定類型的攻擊或正常流量來分類網(wǎng)絡(luò)流量?;谠撓到y(tǒng)模型,可以靈活地選擇不同的機(jī)器學(xué)習(xí)算法來測量特征的相關(guān)性和冗余度,從而找到特征的最佳子集。

      3 改進(jìn)隨機(jī)森林算法進(jìn)行流分類

      隨機(jī)森林算法[12-14]具有較高的預(yù)測準(zhǔn)確率,對異常值和噪聲具有很好的容忍度,目前已經(jīng)在很多領(lǐng)域得到應(yīng)用。但是,它在噪音較大的分類或回歸問題上會(huì)出現(xiàn)過擬合,尤其當(dāng)特征取值劃分較多時(shí),對算法性能的影響更大。針對隨機(jī)森林在對多特征、數(shù)據(jù)不平衡等特點(diǎn)的網(wǎng)絡(luò)流數(shù)據(jù)進(jìn)行分類時(shí)存在的問題,本文提出了改進(jìn)方法,步驟如下。

      (1)初始化樣本權(quán)重。

      對每一個(gè)樣本賦予權(quán)重1/N,其中N為樣本總數(shù)。樣本權(quán)重的初始值可以根據(jù)需要調(diào)整,但樣本權(quán)重之和為1。為了提高少數(shù)類樣本的分類精確度,從而提高總體分類性能,改進(jìn)方法增大了少數(shù)類樣本的權(quán)重。樣本權(quán)重集為

      D1=(ω1,1,ω1,2, …ω1,i, …,ω1,N)

      (1)

      (2)構(gòu)建決策樹,更新權(quán)重抽樣,并進(jìn)行多輪迭代。

      依據(jù)樣本分布,對樣本進(jìn)行有權(quán)重的隨機(jī)抽樣,生成訓(xùn)練集,并用生成的訓(xùn)練集構(gòu)造一棵樹。用原始數(shù)據(jù)集對生成的樹進(jìn)行分類,計(jì)算分類誤差率em,對樣本權(quán)重進(jìn)行更新。這里的em使用袋外數(shù)據(jù)(即在樣本抽樣時(shí)沒有被抽中的數(shù)據(jù))作為測試集進(jìn)行計(jì)算,也就是用生成的決策樹沒有學(xué)習(xí)到的樣本數(shù)據(jù)進(jìn)行計(jì)算。更新后的樣本權(quán)重集為

      Dm+1=(ωm+1,1,ωm+1,2,…,ωm+1,i,…,ωm+1,N)

      (2)

      樣本權(quán)重更新公式為

      (3)

      (4)

      其中,Zm是規(guī)范化因子。

      (5)

      e±a取決于分類結(jié)果,分類正確為e-a,分類錯(cuò)誤則為ea。

      依據(jù)上式可知,對于分類正確的樣本,其權(quán)重更新后會(huì)變小,下一次生成分類器的過程中,被抽中的概率也就變小,可以理解為被學(xué)到的可能性減小。相反,對于分類錯(cuò)誤的樣本,若要求之后生成的分類器能夠分類正確,就需要加大對這些樣本的學(xué)習(xí),所以這里更新權(quán)重時(shí)增大了其權(quán)重。式中的Zm為規(guī)范化因子,保證每次更新權(quán)重后所有樣本權(quán)重之和恒等于1。參數(shù)β用來區(qū)別少數(shù)類與多數(shù)類,因?yàn)樯贁?shù)類樣本占比較少,這樣分類器學(xué)到的“知識(shí)”也較少。另外,少數(shù)類樣本分類錯(cuò)誤的代價(jià)相對更高,所以算法通過β提高少數(shù)類樣本的分類精度,從而提升總體性能。β的取值由表1決定。其中,m為多數(shù)類樣本(標(biāo)簽為0,1,2)的總數(shù),n為少數(shù)類樣本(標(biāo)簽為3,4)總數(shù)。

      表1 β取值

      樣本更新完畢后,對新的樣本依據(jù)權(quán)重抽樣,得到新的訓(xùn)練集,生成新的一棵樹。

      (3)所有決策樹生成完成,計(jì)算每棵樹的分類器權(quán)重wi。

      (6)

      其中,Ai為第i棵樹正確分類的個(gè)數(shù)與所有樹正確分類個(gè)數(shù)平均值的比值,Bi為代價(jià)的平均值與第i棵樹的代價(jià)的比值。

      wi的計(jì)算公式權(quán)衡了檢測精度和代價(jià)的值。由公式可知,若某棵決策樹分類精度高,則其正確分類個(gè)數(shù)越多,Ai也就越大;同時(shí)其代價(jià)低,則Bi也越大,這樣wi就較大。訓(xùn)練生成的隨機(jī)森林中每棵決策樹的生成是帶有隨機(jī)性的,所以每個(gè)決策樹的性能不盡相同。如果一棵決策樹的分類精度高,代價(jià)低,那么它的性能應(yīng)該是較好的,所以它的分類器權(quán)重應(yīng)該較大。

      4 仿真分析

      針對前文提出的模型和算法,利用KDD CUP99數(shù)據(jù)集[15]作為測試數(shù)據(jù),在其提供的訓(xùn)練集和測試集的基礎(chǔ)上,利用抽樣得到訓(xùn)練子集(樣本數(shù)為57 114)和測試子集(樣本數(shù)為37 464),對改進(jìn)算法進(jìn)行訓(xùn)練和測試,模擬入侵檢測過程,以對比改進(jìn)前后算法的性能。

      其中,樣本類別分布如表2所示。采用的評價(jià)指標(biāo)包括精度(P)、召回率(R)、F_score(F)、準(zhǔn)確度(AC)和誤報(bào)率(FPR)[12]。

      表2 訓(xùn)練子集和測試子集樣本分布

      由于不同的攻擊類型未被系統(tǒng)檢測到而產(chǎn)生的后果不盡相同,同時(shí)一個(gè)正常的數(shù)據(jù)流被誤分類為攻擊也會(huì)產(chǎn)生不同的代價(jià)。定義另一個(gè)比較指標(biāo)(Cost)來度量每個(gè)樣本被錯(cuò)誤分類的成本損失,計(jì)算公式如下。

      (7)

      其中,Mij表示實(shí)際為類別i、分類結(jié)果為類別j的樣本數(shù)量。Cij表示從KDD CUP99數(shù)據(jù)集獲得的每個(gè)樣本的代價(jià)值,Cij的具體取值如表3所示。N是用于測試的樣本總數(shù)。從Cost的定義可知,它是一個(gè)介于0~4之間的數(shù),對于分類算法來說,其Cost的值越小越好。

      表3 代價(jià)矩陣(Cij)

      改進(jìn)前后算法的入侵檢測性能如表4所示。

      表4 改進(jìn)前后算法入侵檢測性能比較

      由表4可以看出,改進(jìn)算法相對于原算法在AC、P、R、F_score性能上都有明顯的提升,F(xiàn)PR明顯降低。改進(jìn)算法的代價(jià)為0.1445,而原算法為0.1735,改進(jìn)算法明顯降低了代價(jià),說明改進(jìn)隨機(jī)森林算法優(yōu)于原算法。

      為了進(jìn)一步分析實(shí)驗(yàn)結(jié)果,在入侵檢測過程中分別計(jì)算了各個(gè)類別的檢測精度,得到結(jié)果如表5所示。

      從表5可見,改進(jìn)算法在Normal、Probing、R2L攻擊類上檢測精度有所提升,而在U2L攻擊類上檢測精度大幅度提高,符合預(yù)期設(shè)想。因?yàn)楦倪M(jìn)算法的基本思路是增加少數(shù)類樣本(U2R、R2L)的學(xué)習(xí)度,從而提高檢測精度。

      為了驗(yàn)證以上結(jié)果的普遍性,進(jìn)行了如下實(shí)驗(yàn)。在不同的測試集樣本數(shù)下,觀察對比檢測結(jié)果的Cost值,結(jié)果如圖2所示。

      表5 算法改進(jìn)前后各類別檢測精度比較

      圖2 Cost隨測試集樣本數(shù)變化曲線圖

      由圖2看出,隨著測試子集樣本數(shù)的改變,Cost的值基本不變,而且改進(jìn)隨機(jī)森林算法的Cost的值低于原算法的Cost值,說明此結(jié)果具有普遍性,也進(jìn)一步驗(yàn)證了本文所提出的改進(jìn)的隨機(jī)森林算法在入侵檢測中與原算法相比性能更好。

      5 結(jié) 論

      本文提出了一種基于SDN的智能入侵檢測系統(tǒng)模型,該模型能夠充分發(fā)揮軟件定義網(wǎng)絡(luò)的集中管理、全局控制等優(yōu)勢。同時(shí),可以靈活使用各種機(jī)器學(xué)習(xí)算法進(jìn)行流分類,提高檢測效率。針對隨機(jī)森林算法存在的不足,尤其針對需要分類的入侵流具有多特征、數(shù)據(jù)不平衡等特點(diǎn),提出了一種改進(jìn)的隨機(jī)森林算法,使用KDD CUP99數(shù)據(jù)集進(jìn)行性能仿真和對比分析。從實(shí)驗(yàn)結(jié)果來看,相對于原算法,改進(jìn)的隨機(jī)森林算法在檢測精度、代價(jià)等指標(biāo)上都明顯得到了提升,證明了該改進(jìn)算法在智能入侵檢測系統(tǒng)中的有效性。

      猜你喜歡
      代價(jià)決策樹分類器
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      愛的代價(jià)
      海峽姐妹(2017年12期)2018-01-31 02:12:22
      代價(jià)
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      基于決策樹的出租車乘客出行目的識(shí)別
      成熟的代價(jià)
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      长寿区| 日土县| 杭锦旗| 普陀区| 平远县| 新干县| 孝昌县| 江油市| 花垣县| 日喀则市| 北流市| 黄梅县| 深泽县| 兴山县| 名山县| 禹城市| 临汾市| 荣成市| 托克逊县| 视频| 桐柏县| 五河县| 延津县| 故城县| 阜宁县| 得荣县| 邹平县| 文水县| 吉木萨尔县| 福安市| 太康县| 滦南县| 鄂伦春自治旗| 廉江市| 灵石县| 安陆市| 招远市| 青川县| 左贡县| 宝坻区| 大田县|