【摘 要】本文旨在闡述大數(shù)據(jù)背景下的信息安全,首先以大數(shù)據(jù)基本概念入手,介紹了大數(shù)據(jù)的數(shù)據(jù)量大、結構多樣化、價值密度低、處理速度快、復雜性的4C+V的特征,然后闡述了大數(shù)據(jù)網(wǎng)絡APT攻擊、用戶隱私數(shù)據(jù)保護、海量數(shù)據(jù)存儲等安全問題,最后詳細介紹了大數(shù)據(jù)信息安全體系構建、添加數(shù)據(jù)標識、加密數(shù)據(jù)通信以及實施動態(tài)數(shù)據(jù)存儲監(jiān)控和管理的大數(shù)據(jù)信息安全策略,從而構建大數(shù)據(jù)的信息安全的網(wǎng)絡環(huán)境。
【關鍵詞】大數(shù)據(jù);信息安全;APT;數(shù)據(jù)標識;存儲監(jiān)控
一、概述
隨著國民經(jīng)濟的不斷快速發(fā)展,尤其是我國加入世界貿(mào)易組織(WTO)之后,我國經(jīng)濟正朝著經(jīng)濟全球化和國際市場化的方向快速發(fā)展,從而使得我國各個企業(yè)與國外經(jīng)濟體的聯(lián)系和交流越來越廣泛。在經(jīng)濟全球化日益加速的今天,互聯(lián)網(wǎng)技術的不斷優(yōu)化和更新,企業(yè)經(jīng)濟的發(fā)展越來越快,經(jīng)濟樣式也越來越多,也就催生了企業(yè)生產(chǎn)數(shù)據(jù)的不斷增加,尤其是近幾年智能網(wǎng)絡終端的增加、云計算技術的廣泛應用等,互聯(lián)網(wǎng)的數(shù)據(jù)量更是呈爆炸式增長。據(jù)國際互聯(lián)網(wǎng)數(shù)據(jù)中心IDC (Internet Data Center)預計,互聯(lián)網(wǎng)內(nèi)現(xiàn)有的數(shù)據(jù)量90%以上是近幾年才產(chǎn)生的,而且每兩年就會翻一番的速度增長,到2020年,全球互聯(lián)網(wǎng)數(shù)據(jù)量將增加50倍。這就表明,互聯(lián)網(wǎng)經(jīng)濟已經(jīng)步入了大數(shù)據(jù)時代。大數(shù)據(jù)是指互聯(lián)網(wǎng)內(nèi)數(shù)據(jù)信息量非常巨大且不能用當前常見的工具在正常時間內(nèi)無法處理的數(shù)據(jù)信息。由于互聯(lián)網(wǎng)自身的特點,這些數(shù)據(jù)絕大多數(shù)都是以非結構化的多樣化形式存在,但是為人們的決策、規(guī)律研究、有用信息挖掘等提供重要的數(shù)據(jù)依據(jù)。隨著時代的前進,大數(shù)據(jù)將會隨著互聯(lián)網(wǎng)絡的發(fā)展而更具開發(fā)性,這也為大數(shù)據(jù)的私密數(shù)據(jù)泄露和敏感信息竊取等信息安全問題的解決提出了更大的挑戰(zhàn)。所以如何確保數(shù)據(jù)信息安全性對于在在大數(shù)據(jù)背景下推動各個政府部門、教育科研機構、企業(yè)單位和金融機構等諸多領域的快速安全發(fā)展來說具有非常重要的現(xiàn)實意義。
二、大數(shù)據(jù)簡介
上世紀八十年代初,美國著名謝家Alvin Toffler在《第三次浪潮》中提及了“大數(shù)據(jù)”(Big Data)的概念。大數(shù)據(jù)是指以計算機技術為基礎的規(guī)模龐大、利用當前常規(guī)的數(shù)據(jù)處理工具無法在合理時間內(nèi)進行正常存儲、提取、搜索、分析、處理等的數(shù)據(jù)信息。同時,大數(shù)據(jù)也代表著異于傳統(tǒng)數(shù)據(jù)信息處理系統(tǒng)的新的技術和框架,可以更加有效、經(jīng)濟地、高頻率地、智能地從大容量、不同數(shù)據(jù)結構和類型的多樣化數(shù)據(jù)中獲取有用的價值和信息。
大數(shù)據(jù)具有五個特征,可以通過4C+V來描述,分別是Volume,Variety,Value,Velocity,Complexity。
其中Volume表示大數(shù)據(jù)的數(shù)據(jù)量多、規(guī)模巨大的特性。在對大數(shù)據(jù)進行描述時,常見的GB或者TB的數(shù)據(jù)存儲單位已經(jīng)不再使用,而是以PB(1024TB)、EB(1024PB)甚至ZB(1024EB)。根據(jù)一些資料顯示,國際互聯(lián)網(wǎng)數(shù)據(jù)中心IDC預測,2020年全球互聯(lián)網(wǎng)數(shù)據(jù)量為35ZB。所以,大數(shù)據(jù)的特點首先就是數(shù)據(jù)規(guī)模龐大。Variety表示大數(shù)據(jù)的數(shù)據(jù)結構多樣化,數(shù)據(jù)類型更加復雜,不僅包括常見的計算機處理的結構數(shù)據(jù),包括二維或多維的數(shù)據(jù)結構存儲表,而且有很多文件、視頻、圖片、音頻等非結構化的數(shù)據(jù)信息。由于互聯(lián)網(wǎng)分布式的特點,加上物聯(lián)網(wǎng)、云計算等技術平臺的不斷發(fā)展,信息數(shù)據(jù)的來源逐漸趨于多樣化,互聯(lián)網(wǎng)數(shù)據(jù)來源逐漸增加,首先是互聯(lián)網(wǎng)終端用戶,在各種互聯(lián)網(wǎng)應用中產(chǎn)生的文字、圖片、視頻、音頻等各類數(shù)據(jù)信息,然后就是各種互聯(lián)網(wǎng)設備以及各種信息管理系統(tǒng),在生產(chǎn)過程中產(chǎn)生的各種文件、數(shù)據(jù)庫、審計、操作日志等信息數(shù)據(jù),最后就是各種物聯(lián)網(wǎng)的傳感設備和信號采集設備,如醫(yī)療設備產(chǎn)生的各種生命特征數(shù)據(jù)、天文望遠鏡產(chǎn)生的大量天文相關的信息數(shù)據(jù)等。Value表示大數(shù)據(jù)的價值密度低的特征。由于大數(shù)據(jù)數(shù)據(jù)量多,所以數(shù)據(jù)基數(shù)大,加上對于企業(yè)生產(chǎn)決策的有用信息并不多,所以大數(shù)據(jù)價值密度低也是大數(shù)據(jù)的另外一個特性。這里值得說明的是,價值密度低不是沒有價值,對于企業(yè)來說,大數(shù)據(jù)的存儲是一個企業(yè)在發(fā)展過程中非常寶貴的財富。Velocity表示大數(shù)據(jù)的數(shù)據(jù)信息處理速度快的特性,由于大數(shù)據(jù)基數(shù)龐大,所以數(shù)據(jù)處理速度快將是大數(shù)據(jù)時代數(shù)據(jù)處理工具一個最為明顯的特征。Complexity表示大數(shù)據(jù)的復雜性的特征。特別是當前人們要求大數(shù)據(jù)的智能分析和處理的階段,大數(shù)據(jù)處理和分析的復雜性將進一步提升。
三、大數(shù)據(jù)面臨的安全問題
在大數(shù)據(jù)時代,數(shù)據(jù)信息成為企業(yè)發(fā)展的重要資源,然而隨著數(shù)據(jù)的不斷增加,大數(shù)據(jù)的安全風險也會逐漸增加,加上大數(shù)據(jù)是未來互聯(lián)網(wǎng)絡新的競爭點,必然也成為眾矢之的,引發(fā)更多的安全為題。
(一)大數(shù)據(jù)的網(wǎng)絡攻擊
由于大數(shù)據(jù)的數(shù)據(jù)規(guī)模龐大,在互聯(lián)網(wǎng)云端采用分布式存儲形式進行存儲,相關數(shù)據(jù)已經(jīng)形成了統(tǒng)一的視圖,就存儲形勢來看,數(shù)據(jù)保護相對簡單,很容易為黑客留下攻擊漏洞,更加便以黑客實施高持續(xù)行威脅APT攻擊,造成安全問題。由于大數(shù)據(jù)環(huán)境下終端用戶非常多,且群體復雜,所以系統(tǒng)很難對網(wǎng)絡用戶的合法性進行快速實時的判斷。所以,大數(shù)據(jù)為高持續(xù)性威脅攻擊提供了良好的隱藏環(huán)境,APT在一個不確定的時間內(nèi)進行持續(xù)攻擊,并且無法被實時檢測到,對大數(shù)據(jù)造成極大的威脅。在2013年3月份,韓國包括KBS以及多家民間企業(yè)在內(nèi)的網(wǎng)站受到黑客的高持續(xù)性威脅攻擊(APT),導致互聯(lián)網(wǎng)絡受阻,計算機系統(tǒng)癱瘓。在此次APT中,韓國的金融機構共受到1500多次的非法入侵,受害的計算機達48000臺,成為2013年度最嚴重的APT攻擊。如圖1.所示,為近些年互聯(lián)網(wǎng)絡受到APT攻擊的趨勢圖。
由于高持續(xù)威脅攻擊具有很強的針對性,且攻擊時間長,配合數(shù)據(jù)挖掘技術等大數(shù)據(jù)分析攻擊和手段,很容易獲取大數(shù)據(jù)中獲取有用的數(shù)據(jù)信息,從而引發(fā)數(shù)據(jù)泄露,造成更大的危害。
(二)大數(shù)據(jù)的用戶隱私
由于大數(shù)據(jù)對所有網(wǎng)絡用戶的數(shù)據(jù)進行匯集存儲,在一定程度上,為用戶的個人數(shù)據(jù)的隱私保護埋下了安全隱患。如果大數(shù)據(jù)安全機制不完善,在用戶對個人數(shù)據(jù)操作不當?shù)那闆r下,可能會造成一些相關的隱私數(shù)據(jù)的泄露,從而造成嚴重的隱私數(shù)據(jù)的安全問題。大數(shù)據(jù)的個人用戶數(shù)據(jù)的隱私保護,需要強大的大數(shù)據(jù)分析和處理技術和完善的隱私數(shù)據(jù)保護機制,來提升數(shù)據(jù)安全級別。如果在大數(shù)據(jù)管理端沒有完善的數(shù)據(jù)管理機制,用戶的一些敏感數(shù)據(jù)信息的所有權和使用權的界定或者分配可能會出現(xiàn)問題,對于大數(shù)據(jù)分析的應用來說,勢必會造成用戶隱私數(shù)據(jù)泄露,引發(fā)數(shù)據(jù)安全問題。
在對大數(shù)據(jù)進行數(shù)據(jù)采集和信息挖掘的時候,要注重用戶隱私數(shù)據(jù)的安全問題,在不泄露用戶隱私數(shù)據(jù)的前提下進行數(shù)據(jù)挖掘,完成有用信息提取。當前,大數(shù)據(jù)與云計算平臺的結合,使得分布式計算的應用逐漸廣泛,如何在分布計算的信息傳輸和數(shù)據(jù)交換時保證各個存儲點內(nèi)的用戶隱私數(shù)據(jù)不被非法泄露和使用是當前大數(shù)據(jù)背景下云計算信息安全的主要問題。同時,當前的大數(shù)據(jù)數(shù)據(jù)量并不是固定的,而是在應用過程中動態(tài)增加的,而傳統(tǒng)的數(shù)據(jù)隱私保護技術大都是針對靜態(tài)數(shù)據(jù)的,所以如何有效地應對大數(shù)據(jù)動態(tài)數(shù)據(jù)屬性和表現(xiàn)形式的數(shù)據(jù)隱私保護也是要注重的安全問題。最后,大數(shù)據(jù)的數(shù)據(jù)遠比傳統(tǒng)數(shù)據(jù)復雜,現(xiàn)有的敏感數(shù)據(jù)的隱私保護是否能夠滿足大數(shù)據(jù)復雜的數(shù)據(jù)信息也是應該考慮的安全問題。
(三)大數(shù)據(jù)的數(shù)據(jù)存儲
大數(shù)據(jù)的數(shù)據(jù)類型和數(shù)據(jù)結構是傳統(tǒng)數(shù)據(jù)不能比擬的,在大數(shù)據(jù)的存儲平臺上,數(shù)據(jù)量是非線性甚至是指數(shù)級的速度增長的,各種類型和各種結構的數(shù)據(jù)進行數(shù)據(jù)存儲,勢必會引發(fā)多種應用進程的并發(fā)且頻繁無序的運行,極易造成數(shù)據(jù)存儲錯位和數(shù)據(jù)管理混亂,為大數(shù)據(jù)存儲和后期的處理帶來安全隱患。當前的數(shù)據(jù)存儲管理系統(tǒng),能否滿足大數(shù)據(jù)背景下的海量數(shù)據(jù)的數(shù)據(jù)存儲需求,還有待考驗。不過,如果數(shù)據(jù)管理系統(tǒng)沒有相應的安全機制升級,出現(xiàn)問題后則為時已晚。
四、大數(shù)據(jù)的信息安全策略
由于大數(shù)據(jù)自身的寶貴價值,在如火如荼地發(fā)展期間,必然要注重大數(shù)據(jù)的信息安全問題,來從而提升大數(shù)據(jù)的安全策略,推動大數(shù)據(jù)下的云計算的廣泛應用。
(一)加快大數(shù)據(jù)信息安全體系建設
大數(shù)據(jù)的信息安全體系建設不僅是計算機信息技術的發(fā)展問題,更是國家數(shù)據(jù)安全的策略問題。在大數(shù)據(jù)的發(fā)展規(guī)劃階段,要在戰(zhàn)略角度出發(fā),切實認識到大數(shù)據(jù)信息安全的重要性,不僅要在技術上加強大數(shù)據(jù)信息安全體系建設,更要在策略上態(tài)度上重視大數(shù)據(jù)信息安全建設,明確大數(shù)據(jù)的重點數(shù)據(jù)保護對象,構建大數(shù)據(jù)價值等級,加快完成大數(shù)據(jù)信息安全體系的建設。
(二)實施大數(shù)據(jù)信息安全技術
大數(shù)據(jù)的信息安全技術是通過相關的工具和一定的安全策略,構建完善的大數(shù)據(jù)信息安全模型,來實現(xiàn)數(shù)據(jù)信息的安全。首先,可以通過一定的工具,在數(shù)據(jù)收錄和存儲階段完成數(shù)據(jù)類型的劃分,并通過數(shù)據(jù)挖掘等技術,持續(xù)自動地對大數(shù)據(jù)進行分類、分析、評估,從而為有用信息提取做準備,最后要確保大數(shù)據(jù)框架下各個節(jié)點之間的加密安全的通信,降低大數(shù)據(jù)的攻擊。
在數(shù)據(jù)收錄和存儲時對數(shù)據(jù)進行標記處理,是在確保大數(shù)據(jù)安全性的前提下,對大規(guī)模的價值密度低的大數(shù)據(jù)實現(xiàn)快速運算處理的有效方法。針對數(shù)據(jù)標識的內(nèi)容,可以根據(jù)系統(tǒng)不同的要求,對數(shù)據(jù)的類別、敏感等級等進行標記,然后數(shù)據(jù)管理系統(tǒng)對該表示進行判斷之后,存放到數(shù)據(jù)庫中。如圖2.所示,為數(shù)據(jù)標識判斷流程圖。
如圖2.所示,當數(shù)據(jù)增加標識后,如果數(shù)據(jù)庫內(nèi)未對該標識進行記錄,則會將該表示直接存入數(shù)據(jù)庫。如果已經(jīng)有記錄,則會直接將該數(shù)據(jù)存入數(shù)據(jù)庫。在數(shù)據(jù)已經(jīng)有數(shù)據(jù)標識之后,則可以通過數(shù)據(jù)挖掘技術(如決策樹、聚類等)對數(shù)據(jù)進行實施快速處理,為后期有用價值提取做好準備。
在大數(shù)據(jù)的分布式計算框架下,數(shù)據(jù)加密的安全傳輸是加強大數(shù)據(jù)信息安全的重要問題,可以在分布式框架下的客戶端和服務器端配置統(tǒng)一的數(shù)據(jù)傳輸加密配置文件,通過將密鑰與通信數(shù)據(jù)的分開存儲來增加分布式系統(tǒng)的數(shù)據(jù)傳輸?shù)陌踩浴?/p>
(三)加強大數(shù)據(jù)動態(tài)存儲機制
大數(shù)據(jù)的數(shù)據(jù)存儲問題是解決海量數(shù)據(jù)動態(tài)并發(fā)存儲的安全監(jiān)控問題,在海量數(shù)據(jù)的動態(tài)存儲過程中,要對數(shù)據(jù)存儲程序進程等進行安全監(jiān)控和檢測,同時對系統(tǒng)各種硬件資源如CPU、內(nèi)存、磁盤、輸入輸出端口進行全面監(jiān)控和控制,從而建立高校的動態(tài)數(shù)據(jù)細粒度的分析機制和安全監(jiān)控機制,確保大數(shù)據(jù)的海量數(shù)據(jù)動態(tài)并發(fā)存儲的有序進行,保證大數(shù)據(jù)管理系統(tǒng)自身的運行可靠性和安全性。
五、總結
大數(shù)據(jù)的信息安全是針對大數(shù)據(jù)環(huán)境下的網(wǎng)絡APT攻擊、用戶隱私數(shù)據(jù)保護以及數(shù)據(jù)存儲等安全問題的安全的策略,主要是通過構建完善的大數(shù)據(jù)信息安全體系、實施數(shù)據(jù)標識、加密通信以及動態(tài)存儲監(jiān)控等方法手段來提升大數(shù)據(jù)信息安全性,從而為互聯(lián)網(wǎng)絡創(chuàng)建一個安全穩(wěn)定的大數(shù)據(jù)環(huán)境。
參考文獻:
[1]郭三強,郭燕錦. 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全研究[J]. 科技廣場. 2013(02)
[2]陳明奇,姜禾,張娟,廖方宇. 大數(shù)據(jù)時代的美國信息網(wǎng)絡安全新戰(zhàn)略分析[J]. 信息網(wǎng)絡安全. 2012(08)
[3]陳建昌. 大數(shù)據(jù)環(huán)境下的網(wǎng)絡安全分析[J]. 中國新通信. 2013(17)
[4]王文超,石海明,曾華鋒. 芻議大數(shù)據(jù)時代的國家信息安全[J]. 國防科技. 2013(02)
[5]吳蓓,劉海光.淺析大數(shù)據(jù)時代的信息安全[J]. 計算機光盤軟件與應用. 2013(15)
[6]錢林紅,鄧家榮. 信息系統(tǒng)數(shù)據(jù)安全防范策略[J]. 電腦知識與技術. 2011(12)
[7]網(wǎng)珊,王會舉,覃雄派,周烜. 架構大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J]. 計算機學報. 2011(10)
[8]馮登國,張敏,李昊. 大數(shù)據(jù)安全與隱私保護[J]. 計算機學報. 2014(01)