張龍軍 鄒岳琳 劉昆 馬軍 郭江濤 國(guó)網(wǎng)新疆電力有限公司信息通信公司
網(wǎng)絡(luò)時(shí)代,與傳統(tǒng)的科學(xué)技術(shù)相比較,計(jì)算機(jī)技術(shù)無(wú)論是在傳播速度還是時(shí)間方面都做了較大的改革創(chuàng)新,給人們的生活帶來(lái)了較大的便利。在網(wǎng)絡(luò)信息處理和數(shù)字信息處理過(guò)程中,加強(qiáng)網(wǎng)絡(luò)環(huán)境的安全性,是網(wǎng)絡(luò)用戶(hù)使用計(jì)算機(jī)的前提和基礎(chǔ)。網(wǎng)絡(luò)技術(shù)的發(fā)展和創(chuàng)新改變了人們的生活和工作狀況,給人們的日常生活帶來(lái)較大的影響,但同時(shí)網(wǎng)絡(luò)病毒對(duì)于計(jì)算機(jī)技術(shù)的發(fā)展來(lái)說(shuō)始終是威脅。人們已經(jīng)逐漸進(jìn)入到信息時(shí)代,信息時(shí)代是以互聯(lián)網(wǎng)為基礎(chǔ),知識(shí)的傳播速度較快,網(wǎng)絡(luò)技術(shù)時(shí)刻影響著人們的生活和工作。數(shù)據(jù)挖掘中的數(shù)字推導(dǎo)和數(shù)字技術(shù)可以對(duì)病毒程序進(jìn)行快速破解,防止網(wǎng)絡(luò)病毒對(duì)計(jì)算機(jī)系統(tǒng)造成破壞。
數(shù)據(jù)挖掘,簡(jiǎn)稱(chēng)KDD,一般是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中的、未知的且有價(jià)值的信息和知識(shí)的一個(gè)過(guò)程。它所需要用到的知識(shí)很多,包括計(jì)算機(jī)技術(shù)、統(tǒng)計(jì)學(xué)、情報(bào)檢索、機(jī)器學(xué)習(xí)、模糊識(shí)別等。在挖掘過(guò)程中,主要分為三個(gè)步驟:數(shù)據(jù)準(zhǔn)備、尋找數(shù)據(jù)規(guī)律、表示數(shù)據(jù)規(guī)律。當(dāng)確定數(shù)據(jù)挖掘后,相關(guān)引擎啟動(dòng),開(kāi)始收索需要挖掘的數(shù)據(jù),找出其中數(shù)據(jù)的規(guī)律。完整的數(shù)據(jù)挖掘包括了很多工作,重點(diǎn)在于數(shù)據(jù)的預(yù)處理,這里面主要包括了數(shù)據(jù)的凈化、格式轉(zhuǎn)換、變量整合和鏈接數(shù)據(jù)表等。只有做好了數(shù)據(jù)的預(yù)處理工作,才能為后期數(shù)據(jù)的分析做好鋪墊。
計(jì)算機(jī)網(wǎng)絡(luò)安全病毒的傳播是以電子郵件、不良網(wǎng)頁(yè)、系統(tǒng)漏洞等為載體,進(jìn)一步入侵并損壞網(wǎng)絡(luò)系統(tǒng),以此對(duì)計(jì)算機(jī)網(wǎng)絡(luò)安全造成直接性威脅。
目前,隨著現(xiàn)代化科學(xué)技術(shù)的快速進(jìn)步與發(fā)展,作為特殊計(jì)算機(jī)程序,網(wǎng)絡(luò)安全病毒通過(guò)一定程度的編寫(xiě)與修改,能夠衍生大量的變化,以此促使計(jì)算機(jī)網(wǎng)絡(luò)病毒的類(lèi)型逐漸增多。
一些網(wǎng)絡(luò)病毒太過(guò)繁雜,結(jié)合黑客和木馬等相關(guān)技術(shù),形成混合性,其對(duì)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)具有非常強(qiáng)大的攻擊性與破壞性,并且隱藏很深。如果計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)并此病毒感染,就會(huì)導(dǎo)致網(wǎng)絡(luò)系統(tǒng)中的機(jī)密信息或重要數(shù)據(jù)信息被泄漏,嚴(yán)重時(shí)則會(huì)造成網(wǎng)絡(luò)系統(tǒng)整體癱瘓,對(duì)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)造成重大損壞。
計(jì)算機(jī)網(wǎng)絡(luò)病毒一旦侵入使用者電腦,會(huì)迅速傳播和破壞,入侵到計(jì)算機(jī)核心——操作系統(tǒng),然后會(huì)對(duì)計(jì)算機(jī)中的所有信息進(jìn)行整合和有針對(duì)性、有破壞性的破壞。而利用數(shù)據(jù)挖掘技術(shù),就可以在病毒入侵時(shí)獲取病毒的相關(guān)信息,分析網(wǎng)絡(luò)運(yùn)行中的數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行有效的處理,從而來(lái)抵御病毒的破壞,保障用戶(hù)計(jì)算機(jī)的安全。
數(shù)據(jù)挖掘是基于計(jì)算機(jī)技術(shù)基礎(chǔ)之上,在信息時(shí)代,充分的利用先進(jìn)的網(wǎng)絡(luò)技術(shù),收集網(wǎng)絡(luò)資源和信息,數(shù)據(jù)挖掘既包括數(shù)據(jù)信息收集、數(shù)據(jù)信息處理,還包括數(shù)據(jù)信息的歸類(lèi)和篩選,隨著網(wǎng)絡(luò)技術(shù)的普及應(yīng)用,數(shù)據(jù)挖掘技術(shù)逐漸被應(yīng)用到各個(gè)行業(yè)中去。將數(shù)據(jù)挖掘技術(shù)應(yīng)用在計(jì)算機(jī)病毒防御中,首先可以利用數(shù)據(jù)挖掘中的數(shù)據(jù)收集功能對(duì)計(jì)算機(jī)病毒的構(gòu)成數(shù)據(jù)和傳播途徑進(jìn)行數(shù)據(jù)收集。計(jì)算機(jī)病毒以代碼的形式為載體對(duì)計(jì)算機(jī)系統(tǒng)進(jìn)行入侵,在對(duì)計(jì)算機(jī)系統(tǒng)進(jìn)行破壞的過(guò)程中需要相關(guān)的計(jì)算機(jī)程序作為支撐,利用數(shù)據(jù)挖掘技術(shù)可以從大量的數(shù)據(jù)信息中快速搜尋與計(jì)算機(jī)病毒相關(guān)聯(lián)的病毒代碼程序,同時(shí)對(duì)病毒代碼程序進(jìn)行數(shù)據(jù)分析。通常來(lái)說(shuō),以計(jì)算機(jī)代碼為載體的病毒程序在制作過(guò)程中步驟復(fù)雜,程序繁瑣,病毒程序與普通的計(jì)算機(jī)軟件程序有一定的共性,在制作過(guò)程中分為多個(gè)模塊和功能,由不同的模塊組成。利用數(shù)據(jù)挖掘技術(shù),可以分模塊的形式對(duì)病毒進(jìn)行數(shù)據(jù)收集,在收集過(guò)程中對(duì)大量的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行抓取,數(shù)據(jù)信息中大多包含特定的數(shù)據(jù)形式和數(shù)據(jù)內(nèi)容,以功能模塊的形式對(duì)病毒信息進(jìn)行整理分類(lèi)。
數(shù)據(jù)挖掘技術(shù)既包括數(shù)據(jù)收集功能,同時(shí)包括數(shù)據(jù)處理功能,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在計(jì)算機(jī)病毒防御中,首先利用挖掘技術(shù)對(duì)大量的數(shù)據(jù)進(jìn)行分析、篩選,以關(guān)鍵信息帶入的形式篩選出與病毒相關(guān)的代碼,對(duì)篩選出的結(jié)果進(jìn)行整理分類(lèi),再利用數(shù)據(jù)處理技術(shù)將收集的數(shù)據(jù)信息進(jìn)行格式轉(zhuǎn)換。通常來(lái)說(shuō),病毒并不是文字的形式進(jìn)行攻擊,而代碼的形式需要轉(zhuǎn)換之后以常規(guī)的形式體現(xiàn)出來(lái),病毒代碼只能轉(zhuǎn)換成可識(shí)別模式,才能對(duì)病毒類(lèi)型進(jìn)行破解,而數(shù)據(jù)處理正是對(duì)病毒代碼形式的轉(zhuǎn)換。在對(duì)病毒形式進(jìn)行處理中,包括數(shù)據(jù)內(nèi)容的源IP位置、數(shù)據(jù)源位置、數(shù)據(jù)源信息,通過(guò)深層次的挖掘?qū)Σ《綢P目標(biāo)進(jìn)行定位,封鎖病毒傳播途徑,從根本上隔離病毒的傳播方式。數(shù)據(jù)挖掘技術(shù)還可以對(duì)收集到的數(shù)據(jù)信息進(jìn)行終端信息處理,包括數(shù)據(jù)歸類(lèi)、整理、分析,通過(guò)處理后轉(zhuǎn)化為可識(shí)別數(shù)據(jù)形式。數(shù)據(jù)處理可以縮短數(shù)據(jù)分析時(shí)間和病毒形式破解時(shí)間,在一定程度上提高了數(shù)據(jù)挖掘效果,增強(qiáng)了數(shù)據(jù)信息的準(zhǔn)確性。
規(guī)則庫(kù)模塊技術(shù)是利用計(jì)算機(jī)技術(shù)對(duì)現(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行深度挖掘,通過(guò)一系列的特征對(duì)數(shù)據(jù)內(nèi)容進(jìn)行判斷分析,在得出數(shù)據(jù)內(nèi)容的基本規(guī)律后,利用規(guī)律特征對(duì)后期的數(shù)據(jù)進(jìn)行深度分析。規(guī)則庫(kù)模塊可以清晰地記載與病毒程序相關(guān)聯(lián)的數(shù)據(jù)信息內(nèi)容和數(shù)據(jù)信息規(guī)律,對(duì)于后期的數(shù)據(jù)挖掘具有指導(dǎo)作用。將規(guī)則庫(kù)模塊技術(shù)應(yīng)用在計(jì)算機(jī)病毒防御中,可以快速地識(shí)別新的病毒內(nèi)容,快速地找到病毒程序的破解方法。還可以對(duì)數(shù)據(jù)內(nèi)容進(jìn)行分類(lèi)操作,完善數(shù)據(jù)庫(kù)中的模塊信息,為計(jì)算機(jī)病毒防御提供強(qiáng)有力的數(shù)據(jù)支撐。
隨著信息時(shí)代的不斷發(fā)展,網(wǎng)絡(luò)已成為人們生活、學(xué)習(xí)、工作中密不可分的一部分,要想保證網(wǎng)絡(luò)環(huán)境安全,就必須維護(hù)網(wǎng)絡(luò)的性能和系統(tǒng),這其中重要的就是避免計(jì)算機(jī)網(wǎng)絡(luò)病毒入侵,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到計(jì)算機(jī)網(wǎng)絡(luò)病毒的防御中來(lái),能夠有效抵制和預(yù)防計(jì)算機(jī)網(wǎng)絡(luò)病毒的入侵,從而保障計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的安全。