龍穎 袁明蘭 胡雪
摘要:針對正常上網(wǎng)所產(chǎn)生的網(wǎng)絡(luò)流量遠(yuǎn)遠(yuǎn)大于攻擊、入侵等非正常手段產(chǎn)生的異常流量的特點(diǎn),通過對傳統(tǒng)FCM算法進(jìn)行改進(jìn),引入新的聚類中心矩陣計(jì)算方法來計(jì)算落入平均半徑范圍內(nèi)的流量數(shù)據(jù)的對象數(shù)量,根據(jù)該數(shù)量更新聚類中心矩陣,對流量數(shù)據(jù)進(jìn)行聚類,并識別出網(wǎng)絡(luò)異常流量。對改進(jìn)FCM算法、傳統(tǒng)FCM、HCM的效果進(jìn)行比較分析發(fā)現(xiàn),改進(jìn)FCM雖然處理時間較HCM長,但對噪聲抑制較好,錯分率較低。
關(guān)鍵詞:FCM;流量檢測;聚類
隨著網(wǎng)絡(luò)帶寬逐漸增加、存儲介質(zhì)的容量逐漸增大、服務(wù)器計(jì)算能力逐漸增強(qiáng),促使了數(shù)據(jù)產(chǎn)生的成本越來越低,從而造成網(wǎng)絡(luò)數(shù)據(jù)急劇膨脹。如何快速、準(zhǔn)確對網(wǎng)絡(luò)流量進(jìn)行識別和分類是網(wǎng)絡(luò)入侵檢測中亟待解決的問題。基于模糊集的FCM算法作為一種無監(jiān)督的分類方法,表現(xiàn)了樣本與樣本之間的聯(lián)系,建立了數(shù)據(jù)樣本對類別的不確定性描述,已廣泛應(yīng)用于機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、圖像分割、海量數(shù)據(jù)分析等領(lǐng)域。在網(wǎng)絡(luò)流量檢測中,往往基于以下假設(shè),即網(wǎng)絡(luò)正常流量的數(shù)量遠(yuǎn)遠(yuǎn)大于異常流量,異常流量在數(shù)據(jù)中將會呈現(xiàn)出比較特殊的性質(zhì),F(xiàn)CM能通過識別正常類別比例來確定異常的類別。
因傳統(tǒng)FCM對初始數(shù)據(jù)敏感,對于含噪數(shù)據(jù)的識別效果不佳,迭代次數(shù)增加后算法處理時間迅速增加,錯分率有所上升。HCM算法運(yùn)行速度快,但錯分率較高。本文算法聚類中心矩陣是通過多次迭代生成的,在對噪聲的抑制上比傳統(tǒng)FCM和HCM表現(xiàn)好。
通過理論分析和實(shí)驗(yàn)發(fā)現(xiàn),在模擬實(shí)驗(yàn)環(huán)境下,基于改進(jìn)FCM算法的網(wǎng)絡(luò)異常流量檢測具有聚類速度較快,分類好的特點(diǎn),算法魯棒性較好,能正確、及時發(fā)現(xiàn)網(wǎng)絡(luò)異常流量,為網(wǎng)絡(luò)異常流量實(shí)時檢測提供技術(shù)支持。
參考文獻(xiàn):
[1]劉麗珍,宋瀚濤,陸玉昌.無標(biāo)記訓(xùn)練樣本的Web文本分類方法[J].計(jì)算機(jī)科學(xué),2006(03):200-201+211.
[2]宋國權(quán),李金鋒.基于聚類算法的腦部MR圖像分割[J].中國醫(yī)療設(shè)備,2017,32(01):26-29.
(作者單位:1.重慶應(yīng)用技術(shù)職業(yè)學(xué)院,2.重慶商務(wù)職業(yè)學(xué)院,3.山東省醫(yī)學(xué)科學(xué)院附屬醫(yī)院)