郭麗娟++岳利果
摘 要:大數(shù)據(jù)通過(guò)對(duì)海量數(shù)理進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品和服務(wù),為人們開(kāi)啟了一次重大的時(shí)代轉(zhuǎn)型的同時(shí),也使得人們應(yīng)用數(shù)據(jù)、分析數(shù)據(jù)的能力出現(xiàn)了質(zhì)的飛越,但與此同時(shí),大數(shù)據(jù)安全及個(gè)人信息保護(hù)也面臨嚴(yán)重威脅。因此,無(wú)論是從技術(shù)層面還是管理層面,如何更好地解決安全問(wèn)題是推動(dòng)大數(shù)據(jù)更好發(fā)展的重要課題。
關(guān)鍵詞:大數(shù)據(jù) 網(wǎng)絡(luò)安全 應(yīng)對(duì)措施
中圖分類(lèi)號(hào):TN948.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2016)08(c)-0078-02
大數(shù)據(jù)是在網(wǎng)絡(luò)時(shí)代來(lái)臨以來(lái)迎來(lái)的一項(xiàng)重要技術(shù)革新,在大數(shù)據(jù)逐漸參與到經(jīng)濟(jì)、社會(huì)、科技各個(gè)方面,并且為之帶來(lái)諸多應(yīng)用便利服務(wù)同時(shí),網(wǎng)絡(luò)安全問(wèn)題已成為了制約大數(shù)據(jù)浪潮發(fā)展的重要瓶頸,需要社會(huì)經(jīng)濟(jì)、科技各個(gè)方面加以研究解決,以期實(shí)現(xiàn)更好的服務(wù)技術(shù)及其應(yīng)有的更大價(jià)值。
1 大數(shù)據(jù)的特征
大數(shù)據(jù)通常被認(rèn)為是指規(guī)模大且復(fù)雜、很難用現(xiàn)有數(shù)據(jù)庫(kù)管理工具或數(shù)據(jù)處理應(yīng)用來(lái)處理的數(shù)據(jù)集。隨著大數(shù)據(jù)本身規(guī)模的不斷擴(kuò)大和人們對(duì)大數(shù)據(jù)研究的進(jìn)一步深入,共總結(jié)出以下幾個(gè)主要特征。
1.1 數(shù)據(jù)量龐大
當(dāng)前,隨著大數(shù)據(jù)時(shí)代的到來(lái),社交網(wǎng)絡(luò)、電子商務(wù)與各種智能終端以及眾多的移動(dòng)設(shè)備無(wú)時(shí)無(wú)刻地不通過(guò)網(wǎng)絡(luò)產(chǎn)生數(shù)據(jù),數(shù)量已不是以往的GB、TB級(jí),而是動(dòng)輒PB級(jí)乃至ZB、EB級(jí),統(tǒng)計(jì)數(shù)據(jù)量呈數(shù)幾何倍數(shù)上升,被稱(chēng)為數(shù)據(jù)的“海洋”,即XLDB(extremely large database)。據(jù)統(tǒng)計(jì),2015年全球產(chǎn)生的數(shù)據(jù)量超過(guò)8 ZB。
1.2 類(lèi)型多種多樣
大數(shù)據(jù)相比較以往的數(shù)據(jù)庫(kù)數(shù)據(jù)、抽樣數(shù)據(jù),增長(zhǎng)的不僅僅是數(shù)量,更是數(shù)據(jù)類(lèi)型的多樣化發(fā)展。隨著互聯(lián)網(wǎng)及智能終端技術(shù)的井噴式發(fā)展,數(shù)據(jù)突破了傳統(tǒng)的二維模式,轉(zhuǎn)向更加復(fù)雜非結(jié)構(gòu)化數(shù)據(jù),據(jù)統(tǒng)計(jì),非結(jié)構(gòu)化數(shù)據(jù)將占數(shù)據(jù)總量的80%。在云計(jì)算出現(xiàn)之前,傳統(tǒng)的計(jì)算機(jī)是無(wú)法處理如此量大,并且不規(guī)則的非結(jié)構(gòu)數(shù)據(jù)的。
1.3 運(yùn)算效率極高
區(qū)別于以往的數(shù)據(jù)庫(kù)運(yùn)算框架,大數(shù)據(jù)的運(yùn)算是一種在云計(jì)算的基礎(chǔ)上運(yùn)行出來(lái)的Hadoop大數(shù)據(jù)框架。大數(shù)據(jù)的分析和運(yùn)算在原有運(yùn)算范式的基礎(chǔ)上,需要探索新的數(shù)據(jù)研究處理方式,例如,在對(duì)數(shù)據(jù)的集成過(guò)程中,需要對(duì)其進(jìn)行必要的清洗,以保證數(shù)據(jù)的高利用率,同時(shí)利用其高速的運(yùn)算存儲(chǔ)能力,通過(guò)一種分布式運(yùn)行系統(tǒng),以流的形式高效地訪問(wèn)數(shù)據(jù)。
1.4 價(jià)值不可估量
大數(shù)據(jù)就像一個(gè)神奇的金礦,它最重要的價(jià)值不是一次性利用,而是被發(fā)掘后仍能不斷地被重復(fù)利用,從大數(shù)據(jù)技術(shù)的不斷發(fā)展中,可以源源不斷地獲得有價(jià)值的信息。特別是在競(jìng)爭(zhēng)異常激烈的領(lǐng)域,數(shù)據(jù)已經(jīng)成為了企業(yè)的重要資產(chǎn),企業(yè)都在不斷地努力并借助新一代的方法和工具來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)的挖掘分析以不斷地實(shí)現(xiàn)價(jià)值。因此,對(duì)大數(shù)據(jù)的發(fā)掘分析利用是每個(gè)企業(yè)都在追求的重點(diǎn)突破。
2 大數(shù)據(jù)時(shí)代所面臨的網(wǎng)絡(luò)安全挑戰(zhàn)
近幾年頻繁暴發(fā)的如“棱鏡門(mén)”之類(lèi)的網(wǎng)絡(luò)安全事件,使得大數(shù)據(jù)安全也不得不受到更多關(guān)注,大數(shù)據(jù)在為生產(chǎn)率不斷掀起新的利益浪潮同時(shí),其實(shí)也正如一柄雙刃劍,一樣帶來(lái)了信息安全的挑戰(zhàn)。
2.1 大數(shù)據(jù)中的用戶(hù)隱私容易成為網(wǎng)絡(luò)社會(huì)的攻擊目標(biāo)
在網(wǎng)絡(luò)社會(huì)中,人們時(shí)刻都暴露在“第三只眼”的監(jiān)控之下,大量事實(shí)證明,未被妥善處理的數(shù)據(jù)會(huì)對(duì)用戶(hù)的隱私造成極大的安全隱患。甚至那些人們常常認(rèn)為經(jīng)過(guò)匿名處理后的信息,在經(jīng)過(guò)精準(zhǔn)的分析定位后也會(huì)具體到個(gè)人,所以,僅通過(guò)匿名保護(hù)并不能很好地達(dá)到隱私保護(hù)的目的。目前,關(guān)于數(shù)據(jù)的收集、存儲(chǔ)、管理與使用在其規(guī)范及監(jiān)管方面都缺乏有效的長(zhǎng)效機(jī)制,特別是針對(duì)于大數(shù)據(jù)數(shù)據(jù)量大且相互關(guān)聯(lián)的特性而言,對(duì)于攻擊者,付出相對(duì)低的成本,就可以獲得成幾何倍的收益,更加容易成為黑客的攻擊對(duì)象。
2.2 技術(shù)的快速發(fā)展增加了安全風(fēng)險(xiǎn)
在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和人工智能正在日新月益發(fā)展的今天,社交媒體、物聯(lián)網(wǎng)、電子商務(wù)等新應(yīng)用的興起,使得針對(duì)于數(shù)據(jù)挖掘系統(tǒng)及網(wǎng)絡(luò)設(shè)備應(yīng)用系統(tǒng)等技術(shù)有了突飛猛進(jìn)的發(fā)展,雖然在很大程度上能夠?yàn)榇髷?shù)據(jù)自動(dòng)收集效率以及智能動(dòng)態(tài)分析性提供方便,但是卻對(duì)大數(shù)據(jù)安全防范能力提出了更高的要求。大數(shù)據(jù)的安全力度仍然不夠,本身的安全防護(hù)存在漏洞。特別是大數(shù)據(jù)打破了原有的數(shù)據(jù)邊界,使得原有的防護(hù)圍墻不能滿(mǎn)足安全需求。而且隨著數(shù)據(jù)價(jià)值也在呈動(dòng)態(tài)地增長(zhǎng),大數(shù)據(jù)作為一個(gè)可持續(xù)攻擊的蘊(yùn)含海量?jī)r(jià)值的載體,在其被不斷重復(fù)利用的同時(shí)也會(huì)隱藏在大數(shù)據(jù)中的惡意軟件和病毒代碼長(zhǎng)久攻擊。
2.3 多樣化的數(shù)據(jù)類(lèi)型對(duì)大數(shù)據(jù)存儲(chǔ)提出新要求
面對(duì)當(dāng)前大數(shù)據(jù)海量的存儲(chǔ)數(shù)量及結(jié)構(gòu)類(lèi)型的多樣呈現(xiàn),以往的SQL存儲(chǔ)系統(tǒng)已經(jīng)不能滿(mǎn)足大數(shù)據(jù)存儲(chǔ)應(yīng)用的需求。目前普通采用的是NoSQL存儲(chǔ)技術(shù)對(duì)大數(shù)據(jù)中大量存在的非結(jié)構(gòu)化數(shù)據(jù)完成讀取管理等數(shù)據(jù)處理工作。NoSQL數(shù)據(jù)存儲(chǔ)技術(shù)作為一種主流的大數(shù)據(jù)處理系統(tǒng)來(lái)說(shuō),有著突出的可擴(kuò)展性和可用性等優(yōu)點(diǎn),但仍存在一些安全隱患問(wèn)題,例如,目前適應(yīng)NoSQL的存儲(chǔ)模式并不成熟,比起有著嚴(yán)格訪問(wèn)、隱私控制管理技術(shù)成熟的SQL技術(shù),仍然存在各種漏洞,而且由于它使用的是新代碼,NoSQL還無(wú)法沿用SQL的模式。另外,由于客戶(hù)端應(yīng)用程序由于NoSQL服務(wù)器軟件沒(méi)有內(nèi)置足夠的安全,還需要內(nèi)建安全因素,從而在身份驗(yàn)證、輸入驗(yàn)證及授權(quán)等一系列環(huán)節(jié)中產(chǎn)生了大量安全問(wèn)題。
3 大數(shù)據(jù)安全的應(yīng)對(duì)策略
面對(duì)當(dāng)前亟待解決的大數(shù)據(jù)所面臨的用戶(hù)隱私保護(hù)、訪問(wèn)控制等安全挑戰(zhàn)問(wèn)題,大數(shù)據(jù)技術(shù)發(fā)展也為數(shù)據(jù)安全的發(fā)展提供了新機(jī)遇。隨著數(shù)據(jù)分析能力的逐步提升,以及通過(guò)對(duì)海量數(shù)據(jù)的分析技術(shù)的發(fā)展,可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)異常行為的跟蹤監(jiān)督,并將實(shí)時(shí)安全和應(yīng)用數(shù)據(jù)結(jié)合在一起對(duì)數(shù)據(jù)進(jìn)行預(yù)防性分析,防止黑客的入侵。
3.1 研究保障大數(shù)據(jù)安全的關(guān)鍵技術(shù)
保障大數(shù)據(jù)安全的技術(shù)可以從不同層面進(jìn)行考慮,如存儲(chǔ)安全、物理安全、網(wǎng)絡(luò)安全等不同的角度,通過(guò)對(duì)大數(shù)據(jù)的產(chǎn)生、存儲(chǔ)、處理、分析等環(huán)節(jié)進(jìn)行不同安全技術(shù)條件下的保障,例如,大數(shù)據(jù)的安全存儲(chǔ)即中采用了虛擬化海量存儲(chǔ)技術(shù)來(lái)存儲(chǔ)數(shù)據(jù)資源。解決大數(shù)據(jù)的安全存儲(chǔ)問(wèn)題通常有以下幾種方案,如在數(shù)據(jù)存儲(chǔ)過(guò)程中,采用數(shù)據(jù)加密、分離密鑰以及使用過(guò)濾器和數(shù)據(jù)備份等方法,將數(shù)據(jù)通過(guò)存儲(chǔ)空間加密、使用與保管分離和過(guò)濾器監(jiān)控等手段實(shí)現(xiàn)對(duì)數(shù)據(jù)存儲(chǔ)的安全保障,確保大數(shù)據(jù)在無(wú)損壞的情況下有備無(wú)患和安全管控。而在數(shù)據(jù)的應(yīng)用方面主要是采用防止APT攻擊、用戶(hù)訪問(wèn)控制及整合工具和流程等方法來(lái)實(shí)現(xiàn)數(shù)據(jù)應(yīng)用安全,通過(guò)對(duì)用戶(hù)訪問(wèn)進(jìn)行嚴(yán)格設(shè)計(jì)具備實(shí)時(shí)檢測(cè)及提醒隱藏病毒等方式對(duì)數(shù)據(jù)應(yīng)用安全提供保障。
3.2 加強(qiáng)大數(shù)據(jù)管理安全策略,提高安全意識(shí)
提高安全管理制度是在有了安全技術(shù)保障基礎(chǔ)上實(shí)現(xiàn)大數(shù)據(jù)安全的重要組成部分。通常,針對(duì)于大數(shù)據(jù)管理安全的策略主要有以下幾種:一是要對(duì)大數(shù)據(jù)建設(shè)進(jìn)行規(guī)范。任何機(jī)制運(yùn)行的基礎(chǔ)都是要有規(guī)范的機(jī)制和標(biāo)準(zhǔn)的建設(shè)共享平臺(tái)。對(duì)大數(shù)據(jù)建設(shè)進(jìn)行有效的規(guī)范可以在規(guī)范安全框架及制度的基礎(chǔ)上實(shí)現(xiàn)對(duì)其管理的有序運(yùn)行,實(shí)現(xiàn)其信息系統(tǒng)的數(shù)據(jù)集成、網(wǎng)絡(luò)互連、資源共享等功能。二是要建立以數(shù)據(jù)為中心的安全系統(tǒng)。為了大數(shù)據(jù)的所有者可以對(duì)大數(shù)據(jù)使用進(jìn)行控制,可以通過(guò)建設(shè)一個(gè)基于異構(gòu)數(shù)據(jù)為中心的安全方法來(lái)實(shí)現(xiàn)。三是要做好大數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估,提高安全意識(shí)。對(duì)于類(lèi)型不同的數(shù)據(jù)型態(tài)、大數(shù)據(jù)在不同層面的安全風(fēng)險(xiǎn)等級(jí),可以在細(xì)分為安全風(fēng)險(xiǎn)等級(jí)的基礎(chǔ)上,對(duì)數(shù)據(jù)安全等級(jí)進(jìn)行不同程度的安全防范,提高防范意識(shí),分析并消除數(shù)據(jù)安全盲目和誤區(qū)。
3.3 社交網(wǎng)絡(luò)匿名保護(hù)技術(shù)為保護(hù)用戶(hù)隱私提供保障
在社交網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)中,往往包含了大量的用戶(hù)隱私信息,這是大數(shù)據(jù)的重要來(lái)源之一,也是大數(shù)據(jù)安全管理的一個(gè)重要方面。根據(jù)2016年騰訊公司針對(duì)微信用戶(hù)的統(tǒng)計(jì),截至今年第一季度末,微信每月活躍用戶(hù)已達(dá)到5.49億,微信支付用戶(hù)則達(dá)到了4億左右。
社交網(wǎng)絡(luò)中的匿名保護(hù)通過(guò)“點(diǎn)匿名”與“邊匿名”兩種方式進(jìn)行保護(hù),“點(diǎn)匿名”即是在數(shù)據(jù)發(fā)布之時(shí)就隱藏了用戶(hù)的標(biāo)識(shí)與各種屬性信息,而“邊匿名”是在數(shù)據(jù)發(fā)布的同時(shí)也要相應(yīng)地隱藏用戶(hù)間的關(guān)系,即關(guān)系匿名,攻擊者若要獲取有價(jià)值的數(shù)據(jù)信息就要利用節(jié)點(diǎn)的各種屬性,重新識(shí)別出圖中節(jié)點(diǎn)的身份信息。然而,這些保護(hù)方案也面臨著一系列重要問(wèn)題,如“邊匿名”方案中,攻擊者可以從其他信息中推測(cè)其用戶(hù)之間的連接關(guān)系,甚至是詳細(xì)用戶(hù)信息。社交網(wǎng)絡(luò)的聚集特征,尤其是其局部連接密度的增強(qiáng),對(duì)于連接預(yù)測(cè)算法的準(zhǔn)確性成正比關(guān)系,因此,未來(lái)的匿名保護(hù)技術(shù)應(yīng)著重增強(qiáng)對(duì)于關(guān)系預(yù)測(cè)及關(guān)系恢復(fù)等方面的技術(shù)保障,并且應(yīng)該可以有效地抵抗這一類(lèi)型攻擊,實(shí)現(xiàn)對(duì)社交網(wǎng)絡(luò)匿名的有效保護(hù)。
參考文獻(xiàn)
[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[2] 馮國(guó)登,張敏,李昊.大數(shù)據(jù)管理:大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014(1):246-248.
[3] 陳明奇,姜禾,張娟.大數(shù)據(jù)時(shí)代的美國(guó)信息網(wǎng)絡(luò)安全新戰(zhàn)略分析[J].信息網(wǎng)絡(luò)安全,2012(8):32-35.
[4] 肖新斌,史召臣.云計(jì)算引發(fā)的安全風(fēng)險(xiǎn)[J].信息安全與技術(shù),2011(6):13-14.