朱達(dá)明
(太原學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系 山西 太原 030032)
自從互聯(lián)網(wǎng)出現(xiàn)以來,網(wǎng)絡(luò)安全一直是人們關(guān)注的焦點(diǎn)。隨著互聯(lián)網(wǎng)的普及,產(chǎn)生了大量的數(shù)據(jù),而大量數(shù)據(jù)中存在著許多安全問題,如何在大量數(shù)據(jù)中發(fā)現(xiàn)不安全因素,并分析出當(dāng)今復(fù)雜多變的網(wǎng)絡(luò)安全問題,是廣大相關(guān)工作者都致力于研究的重點(diǎn)。網(wǎng)絡(luò)安全問題不僅會(huì)對(duì)網(wǎng)民個(gè)人造成影響,嚴(yán)重時(shí)甚至?xí)?duì)國(guó)家信息安全產(chǎn)生重大影響。近些年來,我國(guó)不斷發(fā)布網(wǎng)絡(luò)安全相關(guān)文件,足以看出網(wǎng)絡(luò)安全在用網(wǎng)過程中的重要性。在發(fā)展背景下,大數(shù)據(jù)技術(shù)應(yīng)運(yùn)而生,有效解決了海量數(shù)據(jù)中的信息分析與安全問題,對(duì)互聯(lián)網(wǎng)產(chǎn)生了重大影響。利用大數(shù)據(jù)技術(shù)對(duì)相關(guān)的有效信息進(jìn)行收集、存儲(chǔ)與分析,最終提高系統(tǒng)的安全性能,及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)安全中的問題,是互聯(lián)網(wǎng)產(chǎn)業(yè)今后發(fā)展的關(guān)鍵。
“大數(shù)據(jù)”指的是以多元化的形式,眾多渠道來源搜集而來的數(shù)據(jù)組,是一個(gè)龐大、高增長(zhǎng)且多元化的一種信息資產(chǎn),需要新的處理模式來做出更好的決策、洞察力發(fā)現(xiàn)和過程優(yōu)化。隨著云時(shí)代的到來,“大數(shù)據(jù)”成為當(dāng)前時(shí)代最引人關(guān)注的一個(gè)話題,主要特征有處理速度快、數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價(jià)值密度低等,可以對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)與分析,大數(shù)據(jù)技術(shù)就是在類型繁多的海量數(shù)據(jù)庫中,快速獲得具有價(jià)值信息數(shù)據(jù)的能力[1]。
大數(shù)據(jù)技術(shù)涵蓋了各種大數(shù)據(jù)平臺(tái)、大數(shù)據(jù)指標(biāo)體系等大數(shù)據(jù)應(yīng)用技術(shù),是一種新型數(shù)據(jù)處理模型,可以對(duì)海量數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、處理、分析與決策,大數(shù)據(jù)的滲透對(duì)各領(lǐng)域有著重大的影響。大數(shù)據(jù)優(yōu)勢(shì)的體現(xiàn)不僅僅是擁有海量數(shù)據(jù)信息,更重要的是其對(duì)大量數(shù)據(jù)的采集、處理與分析功能,可以從中獲取到有價(jià)值的數(shù)據(jù)信息[2]。
大數(shù)據(jù)技術(shù)可以有效保障網(wǎng)絡(luò)的安全,提升信息的安全性。在網(wǎng)絡(luò)安全分析中,大數(shù)據(jù)技術(shù)最凸顯的優(yōu)勢(shì)是對(duì)數(shù)據(jù)的分析。由于網(wǎng)絡(luò)信息的快速發(fā)展,數(shù)據(jù)規(guī)模呈現(xiàn)爆炸式的增長(zhǎng),傳統(tǒng)傳輸技術(shù)無法滿足現(xiàn)代社會(huì)對(duì)信息處理的需求,隨著大數(shù)據(jù)技術(shù)的不斷創(chuàng)新,使其能夠在保證效率的基礎(chǔ)上實(shí)現(xiàn)對(duì)大量不規(guī)則數(shù)據(jù)的高效處理,通過對(duì)搜集到的信息進(jìn)行分析,掌握網(wǎng)絡(luò)安全的整體情況,可以幫助決策者根據(jù)網(wǎng)絡(luò)安全狀況做出科學(xué)的決策。面對(duì)日益復(fù)雜和多樣化的網(wǎng)絡(luò)安全問題,大數(shù)據(jù)技術(shù)所具備的對(duì)繁雜信息進(jìn)行收集與分析處理能力,可以幫助相關(guān)人員做出精準(zhǔn)的判斷。此外,大數(shù)據(jù)技術(shù)應(yīng)用還可以降低網(wǎng)絡(luò)信息收集安全問題及成本,降低網(wǎng)絡(luò)安全問題現(xiàn)象出現(xiàn)的幾率,降低因網(wǎng)絡(luò)安全問題引發(fā)的損失。從上述分析可以看出,大數(shù)據(jù)技術(shù)的應(yīng)用,可以從根源上保護(hù)數(shù)據(jù)信息的安全,對(duì)網(wǎng)絡(luò)安全的分析與管理工作有著十分重要的意義[3]。
對(duì)大量數(shù)據(jù)進(jìn)行收集是大數(shù)據(jù)技術(shù)最主要的一個(gè)功能特征,可以將零散的數(shù)據(jù)、日志等信息進(jìn)行收集,并分類到數(shù)據(jù)庫中,便于存儲(chǔ)。網(wǎng)絡(luò)安全分析便需要對(duì)大量的數(shù)據(jù)進(jìn)行收集檢測(cè),分析其中的異常數(shù)據(jù)與存在的問題,利用大數(shù)據(jù)技術(shù)對(duì)微小零散的數(shù)據(jù)進(jìn)行收集,可以在一定程度上增加信息采集的準(zhǔn)確性、可靠性與完整性。在這方面,許多專業(yè)技術(shù)人員選用的是Flume、Scribe、Chukwa等工具的有效結(jié)合,實(shí)現(xiàn)數(shù)據(jù)快速全面的收集整合[4]。
在對(duì)數(shù)據(jù)進(jìn)行分析前,首先要完成的工作是數(shù)據(jù)的存儲(chǔ),這在整個(gè)網(wǎng)絡(luò)信息安全體系中占有舉足輕重的位置。利用大數(shù)據(jù)對(duì)信息進(jìn)行存儲(chǔ)有多種技術(shù)手段,比如大數(shù)據(jù)技術(shù)中的云數(shù)據(jù)庫、NOSQL數(shù)據(jù)庫、分布式系統(tǒng)等等,都可以對(duì)數(shù)據(jù)進(jìn)行分類與存儲(chǔ),并且不會(huì)占用太多的服務(wù)器,為網(wǎng)絡(luò)安全分析中的數(shù)據(jù)信息收集與存儲(chǔ)提供了堅(jiān)實(shí)的基礎(chǔ)。
首先,大數(shù)據(jù)技術(shù)可以實(shí)現(xiàn)數(shù)據(jù)信息的收集和存儲(chǔ)功能并對(duì)其進(jìn)行檢測(cè)和分析,快速發(fā)現(xiàn)網(wǎng)絡(luò)安全中的異常數(shù)據(jù)。利用Spark工具可以在對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行監(jiān)測(cè)的過程中進(jìn)行快速監(jiān)測(cè)分析,利用MapReduce分布式計(jì)算可以對(duì)過去的數(shù)據(jù)進(jìn)行更深入的檢測(cè)與分析。其次,網(wǎng)絡(luò)安全分析工作中,需要將待分析的數(shù)據(jù)與過往相似數(shù)據(jù)進(jìn)行對(duì)比分析,通過云數(shù)據(jù)庫對(duì)過往數(shù)據(jù)進(jìn)行長(zhǎng)期存儲(chǔ),再通過龐大的數(shù)據(jù)庫中檢測(cè)出異常數(shù)據(jù),并及時(shí)做出防范措施,可以有效增強(qiáng)網(wǎng)絡(luò)的安全保障,降低因網(wǎng)絡(luò)安全而造成損失的幾率。在網(wǎng)絡(luò)安全數(shù)據(jù)信息分析方面,常運(yùn)用關(guān)鍵分析算法、CEP技術(shù)來進(jìn)行輔助分析,通過分布式處理,規(guī)避網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。
綜上所述,大數(shù)據(jù)技術(shù)為網(wǎng)絡(luò)信息安全提供了堅(jiān)實(shí)的保障。通過運(yùn)用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)對(duì)大量數(shù)據(jù)的收集、存儲(chǔ)與分析處理功能,不僅可以提高網(wǎng)絡(luò)安全分析中對(duì)數(shù)據(jù)的檢測(cè)與分析處理效率,通過建立安全數(shù)據(jù)庫,還可以增強(qiáng)對(duì)網(wǎng)絡(luò)安全的預(yù)測(cè)與防范,為網(wǎng)絡(luò)安全提供保障,促進(jìn)互聯(lián)網(wǎng)行業(yè)未來的健康發(fā)展。