◆馬澤鑫
數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全未知威脅檢測(cè)中的應(yīng)用價(jià)值
◆馬澤鑫
(山東管理學(xué)院 山東 250357)
目前互聯(lián)網(wǎng)技術(shù)已經(jīng)在人們的生活中得到了普及,為人們的生活帶來(lái)了便利。通過(guò)運(yùn)用互聯(lián)網(wǎng)和計(jì)算機(jī)技術(shù),在生活中可以實(shí)現(xiàn)數(shù)據(jù)的保存、傳輸和應(yīng)用,但是在互聯(lián)網(wǎng)的應(yīng)用過(guò)程中,很多用戶因?yàn)闆](méi)有良好的網(wǎng)絡(luò)安全知識(shí),在使用計(jì)算機(jī)的過(guò)程中出現(xiàn)網(wǎng)絡(luò)安全問(wèn)題,造成了相關(guān)數(shù)據(jù)的丟失、損壞和泄漏等嚴(yán)重問(wèn)題。隨著科技的發(fā)展,通過(guò)數(shù)據(jù)挖掘技術(shù)可以有效的檢測(cè)網(wǎng)絡(luò)安全中未知威脅,在人們使用互聯(lián)網(wǎng)的過(guò)程中創(chuàng)造良好的環(huán)境?;诖?,本文通過(guò)分析數(shù)據(jù)挖掘技術(shù)的含義,探究數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全未知威脅檢測(cè)中的應(yīng)用方法。
數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)安全;未知威脅;檢測(cè)
數(shù)據(jù)挖掘技術(shù)具有獨(dú)特的性能和作用,主要體現(xiàn)在我國(guó)所有與互聯(lián)網(wǎng)有關(guān)的應(yīng)用技術(shù)中。例如,挖掘技術(shù)應(yīng)用于電子商務(wù)中,可以有效幫助電子商務(wù)中買賣雙方進(jìn)行數(shù)據(jù)分析。數(shù)據(jù)挖掘技術(shù)應(yīng)用于網(wǎng)絡(luò)入侵檢測(cè),可以有效保護(hù)計(jì)算機(jī)網(wǎng)絡(luò)的使用安全。所以將數(shù)據(jù)挖掘技術(shù)與當(dāng)代互聯(lián)網(wǎng)技術(shù)和計(jì)算機(jī)技術(shù)相結(jié)合,能夠保護(hù)我國(guó)網(wǎng)民的網(wǎng)絡(luò)使用安全,從而維護(hù)我國(guó)國(guó)家和國(guó)民的利益。網(wǎng)絡(luò)安全如果受到了侵犯,會(huì)使人們的財(cái)產(chǎn)以及個(gè)人隱私等泄漏,這樣會(huì)導(dǎo)致國(guó)民的恐慌和社會(huì)的不安定,因此利用數(shù)據(jù)挖掘技術(shù)進(jìn)行網(wǎng)絡(luò)安全未知威脅的檢測(cè),可以有效避免網(wǎng)絡(luò)黑客的入侵,從而在一定程度上維護(hù)了我國(guó)社會(huì)的穩(wěn)定。
數(shù)據(jù)挖掘技術(shù)的基本含義是通過(guò)現(xiàn)階段我國(guó)已經(jīng)具備的數(shù)據(jù)庫(kù),進(jìn)行有效數(shù)據(jù)的提取分析和應(yīng)用。數(shù)據(jù)挖掘技術(shù)在針對(duì)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)提取的過(guò)程中應(yīng)用非常廣泛,例如數(shù)據(jù)庫(kù)既可以提取關(guān)系庫(kù)中的數(shù)據(jù),也可以提取半結(jié)構(gòu)化中的數(shù)據(jù),這樣不僅能夠使數(shù)據(jù)型信息得到應(yīng)用,還能夠使文本、圖像以及視頻等信息得到有效的應(yīng)用。數(shù)據(jù)挖掘技術(shù)的挖掘過(guò)程流程分為很多階段,首先是在數(shù)據(jù)挖掘之前需要進(jìn)行一定的數(shù)據(jù)準(zhǔn)備工作。數(shù)據(jù)準(zhǔn)備工作中需要進(jìn)行數(shù)據(jù)清理,除了自己需要的有效數(shù)據(jù),會(huì)對(duì)其余噪聲或者與本次挖掘數(shù)據(jù)不一致的數(shù)據(jù)進(jìn)行清理工作。然后在數(shù)據(jù)準(zhǔn)備工作中還需要進(jìn)行數(shù)據(jù)的集成和結(jié)合,在數(shù)據(jù)集成過(guò)程中需要從不同的數(shù)據(jù)庫(kù)和數(shù)據(jù)源中采集相關(guān)數(shù)據(jù),然后將其有機(jī)結(jié)合在一起。數(shù)據(jù)準(zhǔn)備工作中最后一個(gè)階段,是需要將集合的數(shù)據(jù)進(jìn)行一定形式的變換,從而能保證在數(shù)據(jù)挖掘過(guò)程中可以有效給予適合挖掘的數(shù)據(jù)源形式。在準(zhǔn)備工作完成后,下一個(gè)階段就是數(shù)據(jù)的挖掘工作,數(shù)據(jù)挖掘工作是數(shù)據(jù)挖掘技術(shù)應(yīng)用的主要步驟,它集合了智能化分析技術(shù)和智能化提取技術(shù),對(duì)數(shù)據(jù)源中具有相關(guān)規(guī)律和知識(shí)利用性的信息進(jìn)行采集。數(shù)據(jù)挖掘技術(shù)所提取的知識(shí),一般都是人們能夠真正用到的知識(shí),因此這就需要進(jìn)行一定的模式評(píng)估。模式評(píng)估的方式有很多,主要是針對(duì)數(shù)據(jù)挖掘技術(shù)所提取的知識(shí)利用價(jià)值進(jìn)行相應(yīng)的評(píng)價(jià)。
數(shù)據(jù)挖掘技術(shù)在應(yīng)用過(guò)程中需要很多的模塊組成,首先是需要數(shù)據(jù)信息庫(kù)能夠讓數(shù)據(jù)挖掘在其數(shù)據(jù)庫(kù)中進(jìn)行有關(guān)知識(shí)和規(guī)律的采集。其次是要有相應(yīng)的知識(shí)庫(kù),以便于數(shù)據(jù)挖掘過(guò)程中能夠根據(jù)知識(shí)信息進(jìn)行有效數(shù)據(jù)的發(fā)現(xiàn)和挖掘工作。對(duì)于數(shù)據(jù)挖掘技術(shù)的硬件組成部分,需要在數(shù)據(jù)庫(kù)中安裝一些服務(wù)器,保證數(shù)據(jù)挖掘過(guò)程中能夠通過(guò)服務(wù)器進(jìn)行數(shù)據(jù)的收集,然后是為了保障數(shù)據(jù)挖掘工作順利進(jìn)行,需要安裝數(shù)據(jù)挖掘引擎,這樣能夠幫助數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)分析轉(zhuǎn)換和應(yīng)用等功能。還要有相應(yīng)的數(shù)據(jù)挖掘規(guī)律和知識(shí)的圖形用戶界面,通過(guò)圖形用戶界面才能夠真正使數(shù)據(jù)挖掘技術(shù)得到應(yīng)用價(jià)值的體現(xiàn)。
隨著數(shù)據(jù)挖掘技術(shù)應(yīng)用越來(lái)越廣泛,其在網(wǎng)絡(luò)安全未知威脅檢測(cè)中也有一定的應(yīng)用價(jià)值。數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全未知威脅檢測(cè)過(guò)程中,與其他檢測(cè)技術(shù)相比有很多的優(yōu)點(diǎn),例如數(shù)據(jù)挖掘檢測(cè)是將網(wǎng)絡(luò)安全未知威脅當(dāng)作一種數(shù)據(jù)庫(kù),將網(wǎng)絡(luò)運(yùn)行過(guò)程中出現(xiàn)的異?,F(xiàn)象及時(shí)的檢測(cè)出來(lái)。這種方式不僅能夠有效地提高檢測(cè)的效率,因?yàn)檫m用范圍比較廣,還能夠適應(yīng)于任何類型的網(wǎng)絡(luò)安全檢測(cè)中。
數(shù)據(jù)挖掘技術(shù)在針對(duì)未知威脅檢測(cè)過(guò)程中主要分為以下幾種步驟。第一個(gè)步驟就是利用數(shù)據(jù)挖掘技術(shù)建立適應(yīng)網(wǎng)絡(luò)安全檢測(cè)的模型。網(wǎng)絡(luò)安全未知威脅檢測(cè)的主要目的是通過(guò)數(shù)據(jù)挖掘技術(shù),檢測(cè)出所有入侵系統(tǒng)的異常數(shù)據(jù),在檢測(cè)的過(guò)程中可以使用模式匹配序列將報(bào)文進(jìn)行規(guī)則的制定,然后將所有侵入系統(tǒng)的報(bào)文與所制定的規(guī)則進(jìn)行比對(duì),利用數(shù)據(jù)挖掘技術(shù)對(duì)未知的報(bào)文進(jìn)行檢測(cè),最終判斷出是否是威脅網(wǎng)絡(luò)安全的數(shù)據(jù)或行為?,F(xiàn)階段我國(guó)互聯(lián)網(wǎng)技術(shù)所使用的數(shù)據(jù)挖掘技術(shù),能夠有效地避免常規(guī)檢測(cè)技術(shù)不能自動(dòng)發(fā)現(xiàn)未知的威脅數(shù)據(jù)。但是由于數(shù)據(jù)挖掘技術(shù)還存在速度慢、不夠準(zhǔn)確的問(wèn)題,需要進(jìn)行一定程度上的改進(jìn)。
第二個(gè)步驟是通過(guò)構(gòu)建的模型對(duì)檢測(cè)的數(shù)據(jù)進(jìn)行相應(yīng)的處理,數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全未知威脅檢測(cè)中的常見計(jì)算方式有以下幾種。第一種是關(guān)聯(lián)分析算法的計(jì)算方式,通過(guò)對(duì)所有入侵?jǐn)?shù)據(jù)進(jìn)行關(guān)聯(lián)分類,可以有效檢測(cè)出對(duì)網(wǎng)絡(luò)安全造成威脅的數(shù)據(jù)與威脅入侵者之間的關(guān)系,從而判定數(shù)據(jù)是否對(duì)網(wǎng)絡(luò)安全造成威脅。
在關(guān)聯(lián)規(guī)則中,支持度能夠?qū)⑷藗儾恍枰筒魂P(guān)心的刪除,從而檢測(cè)比較關(guān)鍵的網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)。置信度則能夠代表數(shù)據(jù)挖掘技術(shù)進(jìn)行網(wǎng)絡(luò)安全未知威脅檢測(cè)的可行性和可信度,從而保證數(shù)據(jù)挖掘技術(shù)能夠有效預(yù)防威脅數(shù)據(jù)的入侵。在進(jìn)行處理的過(guò)程中,支持度與可信度是所有網(wǎng)絡(luò)安全管理人員需要重點(diǎn)關(guān)注的因素,數(shù)據(jù)挖掘技術(shù)實(shí)施人員要嚴(yán)格的保證兩者大于用戶需求的最大支持度與可信度。第二種是序列分析算法,這種算法主要是針對(duì)數(shù)據(jù)記錄,先制定一個(gè)按照順序排列的有序數(shù)列,然后在數(shù)據(jù)記錄中尋找能夠符合有序數(shù)列順序的數(shù)據(jù),從而對(duì)未知的數(shù)據(jù)進(jìn)行檢測(cè),判斷是否存在威脅網(wǎng)絡(luò)安全的現(xiàn)象。第三種是分類和聚類分析算法,無(wú)論是分類算法還是聚類算法,都需要數(shù)據(jù)挖掘技術(shù)人員將數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行整理歸類,從而在對(duì)網(wǎng)絡(luò)安全未知威脅檢測(cè)時(shí),能夠?qū)ξ粗獢?shù)據(jù)進(jìn)行有效的分類和對(duì)比。綜上所述,關(guān)聯(lián)分析算法主要是找出記錄的數(shù)據(jù)之間的關(guān)聯(lián)性;序列分析算法主要是找出數(shù)據(jù)記錄之間的關(guān)聯(lián);聚類算法分類算法主要是通過(guò)與模型中分類的數(shù)據(jù)對(duì)比,判斷新入侵的數(shù)據(jù)是否正常。
通過(guò)數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全未知威脅檢測(cè)中的應(yīng)用,可以體會(huì)到當(dāng)代互聯(lián)網(wǎng)科技的發(fā)展水平已經(jīng)達(dá)到了一個(gè)非常高的階段。但是對(duì)于一些水平比較高的網(wǎng)絡(luò)黑客所發(fā)出的網(wǎng)絡(luò)安全未知威脅中,通過(guò)數(shù)據(jù)挖掘技術(shù)還不能夠完全阻止網(wǎng)絡(luò)安全未知威脅的入侵,因此,互聯(lián)網(wǎng)科技人員需要不斷提升網(wǎng)絡(luò)挖掘技術(shù)的技術(shù)水平,還要不斷改善數(shù)據(jù)挖掘技術(shù)在實(shí)際應(yīng)用過(guò)程中的便捷性,這樣才能夠保證數(shù)據(jù)挖掘技術(shù)在未來(lái)網(wǎng)絡(luò)發(fā)展領(lǐng)域能夠有更好的利用價(jià)值。通過(guò)數(shù)據(jù)挖掘技術(shù),可以有效檢測(cè)網(wǎng)絡(luò)安全未知威脅,還能夠有效的防御網(wǎng)絡(luò)安全未知威脅,因此數(shù)據(jù)挖掘技術(shù)將會(huì)為互聯(lián)網(wǎng)的有效、安全應(yīng)用做出更大的貢獻(xiàn)。
[1]趙秋實(shí).數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館服務(wù)中的應(yīng)用[J].信息記錄材料,2019,20(06):168-169.
[2]題興亮. 大數(shù)據(jù)技術(shù)對(duì)社會(huì)科學(xué)方法論的影響[D].哈爾濱理工大學(xué),2019.
[3]沈軍.價(jià)值創(chuàng)造理念下大數(shù)據(jù)挖掘技術(shù)如何運(yùn)用于管理會(huì)計(jì)[J].中國(guó)鄉(xiāng)鎮(zhèn)企業(yè)會(huì)計(jì),2019(03):254-255.
[4]楊林芬.基于大數(shù)據(jù)技術(shù)的名老中醫(yī)醫(yī)案價(jià)值挖掘困境及對(duì)策分析[J].中國(guó)民族民間醫(yī)藥,2018,27(21):120-122.
[5]陳珺.基于數(shù)據(jù)挖掘技術(shù)的圖書館信息管理系統(tǒng)開發(fā)[J].電子技術(shù)與軟件工程,2018(14):170.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2020年3期