◆李永紅
(河南省外貿(mào)學(xué)校 河南 450002)
大數(shù)據(jù)在互聯(lián)網(wǎng)安全防御中的應(yīng)用與研究
◆李永紅
(河南省外貿(mào)學(xué)校 河南 450002)
隨著互聯(lián)網(wǎng)的普及和發(fā)展,其已經(jīng)在很多行業(yè)得到廣泛使用,取得了顯著的應(yīng)用成效?;ヂ?lián)網(wǎng)即為人們的工作、學(xué)習(xí)、生活提供了便捷支撐,同時也帶來了潛在的安全威脅,造成互聯(lián)網(wǎng)應(yīng)用系統(tǒng)的安全風(fēng)險非常大,非常容易產(chǎn)生不可估量的經(jīng)濟損失。同時,互聯(lián)網(wǎng)運行項目的增多,數(shù)據(jù)量也急劇上升,因此傳統(tǒng)的安全防御技術(shù)已經(jīng)無法支撐當(dāng)前互聯(lián)網(wǎng)應(yīng)用和操作需求,亟需采用先進的大數(shù)據(jù)技術(shù),利用數(shù)據(jù)挖掘、模式識別從海量的網(wǎng)絡(luò)數(shù)據(jù)中發(fā)掘潛在的病毒和木馬信息,從而可以識別網(wǎng)絡(luò)中的安全威脅造成的后果嚴(yán)重程度,進而啟動深層次的防御系統(tǒng),及時將安全威脅清除掉,保證網(wǎng)絡(luò)正常運行。
大數(shù)據(jù);互聯(lián)網(wǎng);BP神經(jīng)網(wǎng)絡(luò);支持向量機;K均值
互聯(lián)網(wǎng)技術(shù)的快速發(fā)展促進了政企單位普及和使用電子政務(wù)、電子商務(wù)、智能旅游、在線學(xué)習(xí)、物流倉儲、智能家居、金融證券等領(lǐng)域的快速發(fā)展,各行各業(yè)已經(jīng)積累了海量的應(yīng)用數(shù)據(jù)資源,并且持續(xù)呈現(xiàn)幾何級數(shù)增長,已經(jīng)使人們從信息資源匱乏的時代過渡到信息豐富時代,有力提升了人們的生活質(zhì)量和水平[1]。大數(shù)據(jù)分析技術(shù)主要包括兩個關(guān)鍵類別,分別是有監(jiān)督分析技術(shù)和無監(jiān)督分析技術(shù)。有監(jiān)督分析技術(shù)包括貝葉斯理論、支持向量機、BP神經(jīng)網(wǎng)絡(luò);無監(jiān)督分析技術(shù)包括密度聚類、信息論、K均值、譜聚類等[3]。
有監(jiān)督分析方法需要充分利用人們的經(jīng)驗知識,構(gòu)建一個大數(shù)據(jù)分析模型,同時針對這個學(xué)習(xí)模型進行訓(xùn)練,以便能夠保證大數(shù)據(jù)分析的精確度;無監(jiān)督學(xué)習(xí)方法不需要利用任何的經(jīng)驗知識,系統(tǒng)可以自動的利用統(tǒng)計理論從海量數(shù)據(jù)中挖掘潛在的有價值信息,自動生成一個個學(xué)習(xí)模式[4]。BP神經(jīng)網(wǎng)絡(luò)能夠按照統(tǒng)計學(xué)規(guī)則,實現(xiàn)誤差逆?zhèn)鞑?,是一種多層次的前饋神經(jīng)網(wǎng)絡(luò),目前已經(jīng)在多個機器學(xué)習(xí)和模式識別領(lǐng)域得到廣泛普及。BP神經(jīng)網(wǎng)絡(luò)通過自學(xué)習(xí)形成一個強大的支持網(wǎng)絡(luò)結(jié)構(gòu),并且利用當(dāng)前最為流行的梯度下降方法,不斷地調(diào)整網(wǎng)絡(luò)的結(jié)構(gòu)、權(quán)值和閾值,降低網(wǎng)絡(luò)的誤差平方和,準(zhǔn)確的提取相關(guān)的數(shù)據(jù)隱含模式信息。數(shù)據(jù)處理過程中,輸入層可以接收所有數(shù)據(jù),并且將這些數(shù)據(jù)傳輸給中間層的神經(jīng)元,神經(jīng)元可以負(fù)責(zé)數(shù)據(jù)信息處理、變換,并且能夠根據(jù)信息變化能力的需求,改變和整合中間層結(jié)構(gòu)數(shù)據(jù)流經(jīng)過識別和處理之后,就可以從中間層分發(fā)到輸出層,這樣就可以完成一次學(xué)習(xí)過程,將BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練成為一個準(zhǔn)確度非常高的模型,還可以通過誤差梯度下降等修正各個層次的權(quán)值,向隱藏層逐級反饋,實現(xiàn)反向傳播和修正,提高數(shù)據(jù)識別精確度[5]。支持向量機是一種性能強大的數(shù)據(jù)分析技術(shù),其可以解決樣本數(shù)量較少、非線性或高維模式數(shù)據(jù)分析,比如能夠推廣到函數(shù)擬合的其他類型數(shù)據(jù)分析問題中,可以更好地分析數(shù)據(jù)、識別模式,用于分類和回歸分析。
目前,互聯(lián)網(wǎng)安全威脅經(jīng)過多年的增長,已經(jīng)呈現(xiàn)出爆發(fā)式增長模式,經(jīng)過我國互聯(lián)網(wǎng)部門的統(tǒng)計和分析,黑客每年發(fā)起的互聯(lián)網(wǎng)病毒、木馬攻擊數(shù)以萬億次,截止到2016年底,我國互聯(lián)網(wǎng)應(yīng)用系統(tǒng)由于安全威脅攻擊產(chǎn)生的損失多達4000億人民幣,金融銀行、證券投資、政府機構(gòu)等均是互聯(lián)網(wǎng)攻擊的重點,并且互聯(lián)網(wǎng)攻擊呈現(xiàn)出了新型特點,比如安全威脅攻擊更加隱蔽、攻擊渠道更多、病毒木馬潛藏周期更長、攻擊速度也更快。目前,由于金融銀行、政府機構(gòu)均開始普及信息化系統(tǒng),并且為了提供給更高、更快和更實時的信息系統(tǒng)服務(wù),人們已經(jīng)開始引入更加先進的光纖接入設(shè)備,包括光纖接入終端 ONT、光纖分發(fā)單元ONU、光纖陣列服務(wù)器、光纖交換機,同時接入的用戶端設(shè)備也包括臺式機、筆記本、智能手機、平板電腦、傳感器、家用電器等,形成了強大的物聯(lián)網(wǎng)、車聯(lián)網(wǎng)等,因此這些軟硬件資源集成在一起時,由于不同的開發(fā)框架和實現(xiàn)技術(shù)融合在一起形成了各類型的漏洞,導(dǎo)致互聯(lián)網(wǎng)遭受攻擊的渠道更多。許多互聯(lián)網(wǎng)病毒、木馬采用先進的面向?qū)ο?、面向過程等技術(shù),這些技術(shù)開發(fā)的攻擊威脅更加智能,并且采用了更加正常的偽裝嵌入到正常應(yīng)用程序和軟件中,因此埋伏的更加隱蔽,不易被殺毒軟件發(fā)現(xiàn)。由于互聯(lián)網(wǎng)采用光纖通信技術(shù),因此一旦某個應(yīng)用系統(tǒng)遭受到病毒或木馬感染之后,其會首先在互聯(lián)網(wǎng)中得到快速傳播,感染更多的服務(wù)器,主機和服務(wù)器爆發(fā)嚴(yán)重的安全事故,非常容易給網(wǎng)絡(luò)帶來嚴(yán)重的災(zāi)難,因此更加容易帶來安全嚴(yán)重?fù)p失。
因此,利用大數(shù)據(jù)技術(shù)可以構(gòu)建一個病毒、木馬識別模型,并且針對這個模型進行訓(xùn)練,提高數(shù)據(jù)發(fā)現(xiàn)的準(zhǔn)確度,數(shù)據(jù)挖掘利用自學(xué)習(xí)功能,可以利用互信息距離作為相似性評價和度量指標(biāo),采用無監(jiān)督分析模式,通常兩個數(shù)據(jù)對象的距離越近,這兩個數(shù)據(jù)對象的相似性就會越大。通常情況下,網(wǎng)絡(luò)安全攻擊威脅數(shù)據(jù)自身都有特別的符號,具有內(nèi)在的相似性行為和特征,系統(tǒng)可以針對這些數(shù)據(jù)進行分析和評價,從而不需要指定數(shù)據(jù)的類別標(biāo)簽就可以獲取文本內(nèi)部結(jié)構(gòu),將數(shù)據(jù)匯聚在一起,實現(xiàn)病毒和木馬數(shù)據(jù)挖掘。具體的大數(shù)據(jù)挖掘模型如圖1所示。
圖1 互聯(lián)網(wǎng)大數(shù)據(jù)挖掘模塊
目前,互聯(lián)網(wǎng)采用了高速的光纖通信和4G移動通信技術(shù),數(shù)據(jù)傳輸?shù)乃俣纫呀?jīng)達到千兆網(wǎng)、萬兆網(wǎng)時代,其中病毒和木馬傳輸速度更快,因此互聯(lián)網(wǎng)防御面對更加嚴(yán)峻的形勢。本文提出采用先進的大數(shù)據(jù)挖掘技術(shù)構(gòu)建自動化安全威脅識別技術(shù),實現(xiàn)一個強大的網(wǎng)絡(luò)安全系統(tǒng),能夠快速、實時地從系統(tǒng)中發(fā)現(xiàn)潛在的安全威脅數(shù)據(jù),這樣就可以提高互聯(lián)網(wǎng)防御性能,提高互聯(lián)網(wǎng)正常運行的性能。
[1]樊璐瑩.基于大數(shù)據(jù)的網(wǎng)絡(luò)安全防御技術(shù)及模型[J].計算機光盤軟件與應(yīng)用,2015.
[2]丁佳.基于大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)安全研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2014.
[3]管磊,胡光俊,王專.基于大數(shù)據(jù)的網(wǎng)絡(luò)安全態(tài)勢感知技術(shù)研究[J].信息網(wǎng)絡(luò)安全, 2016.
[4]魏國.大數(shù)據(jù)在網(wǎng)絡(luò)安全領(lǐng)域的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2016.
[5]王勝利.基于大數(shù)據(jù)聚類算法在網(wǎng)絡(luò)安全中的應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2016.