劉洪霞
摘要:在互聯(lián)網(wǎng)技術(shù)快速普及的影響下,人們已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,這對(duì)人們的工作、學(xué)習(xí)與生活產(chǎn)生了顛覆性的影響。以網(wǎng)絡(luò)為依托的大數(shù)據(jù)已經(jīng)成為了產(chǎn)業(yè)界學(xué)者研究的焦點(diǎn)。由于網(wǎng)絡(luò)所附有的開放性特質(zhì),所以我們必須要重視大數(shù)據(jù)時(shí)代下數(shù)據(jù)的安全性,做好數(shù)據(jù)的安全管理,采用先進(jìn)的技術(shù)做好隱私保護(hù)。降低大數(shù)據(jù)的風(fēng)險(xiǎn),才能夠讓其發(fā)揮應(yīng)有的作用。下文中筆者對(duì)大數(shù)據(jù)安全與隱私保護(hù)方面的問題進(jìn)行了總結(jié),旨在對(duì)相關(guān)工作的落實(shí)有所幫助。
關(guān)鍵詞:大數(shù)據(jù);安全;隱私保護(hù);信息安全;研究
現(xiàn)如今,大數(shù)據(jù)依托于科技以及相關(guān)產(chǎn)業(yè)已經(jīng)逐漸受到了人們的關(guān)注,它已經(jīng)成為“云計(jì)算”之后信息產(chǎn)業(yè)發(fā)展的新的增長點(diǎn)。大數(shù)據(jù)在創(chuàng)造巨大的經(jīng)濟(jì)效益的同時(shí),其中暴露出來的問題我們也無法忽視。每天都有數(shù)以億計(jì)的人在依靠大數(shù)據(jù)獲取互聯(lián)網(wǎng)信息,這個(gè)過程中他們的個(gè)人信息也暴露在了互聯(lián)網(wǎng)之上,為了保障用戶的信息隱私,我們需要提高對(duì)于安全以及隱私保護(hù)問題的重視程度,革新現(xiàn)有的技術(shù)。
一、大數(shù)據(jù)的基本概述
1、來源
從概念層面來說,大數(shù)據(jù)主要指的是復(fù)雜且數(shù)量龐大、無法用現(xiàn)有的數(shù)據(jù)管理工具來進(jìn)行處理的數(shù)據(jù)群。大數(shù)據(jù)的來源渠道主要包括以下幾種:首先人為產(chǎn)生,人們使用計(jì)算機(jī)網(wǎng)絡(luò)在互聯(lián)網(wǎng)上發(fā)布的圖片、文字、音頻以及視頻等數(shù)據(jù)信息是大數(shù)據(jù)的主要來源,人為增加的這類數(shù)據(jù)信息會(huì)對(duì)人們篩選獲取信息的過程產(chǎn)生一定阻礙。其次機(jī)器產(chǎn)生,存儲(chǔ)在計(jì)算機(jī)中并且由機(jī)器產(chǎn)生的各類日志、數(shù)據(jù)庫以及文件等數(shù)據(jù)信息也是大數(shù)據(jù)的主要來源。最后計(jì)算機(jī)進(jìn)行的設(shè)備數(shù)據(jù)記錄也是大數(shù)據(jù)中非常重要的一部分來源,例如企業(yè)倉庫記錄的各類產(chǎn)品信息,天文望遠(yuǎn)鏡中計(jì)算所得的物品屬性類信息等等?!?】
2、特征
大數(shù)據(jù)的特征主要體現(xiàn)在以下幾個(gè)方面:首先規(guī)模性。依托于大數(shù)據(jù)而集結(jié)的信息龐大、復(fù)雜,信息總量也一直處在不斷上漲的趨勢之下。綜合相關(guān)數(shù)據(jù)分析,近些年總信息量已經(jīng)達(dá)到了8ZB,因此規(guī)模性是大數(shù)據(jù)最典型的特征。其次多樣性。過去大都依靠文本來完成對(duì)于數(shù)據(jù)的搜集,此種狀態(tài)下的數(shù)據(jù)也大都是結(jié)構(gòu)化的數(shù)據(jù),這降低了數(shù)據(jù)儲(chǔ)存以及查看的難度?!?】現(xiàn)如今在技術(shù)發(fā)展的影響之下,信息儲(chǔ)存的樣式也在不斷增加,在儲(chǔ)存文本的同時(shí)我們也通常需要儲(chǔ)存圖片、視頻以及音頻等資料,如此非結(jié)構(gòu)化的數(shù)據(jù)越來越多。最后價(jià)值性。大數(shù)據(jù)的價(jià)值性主要指的是對(duì)儲(chǔ)存的數(shù)據(jù)信息進(jìn)行分析統(tǒng)計(jì)的過程,提取出其中有價(jià)值的信息讓使用者使用,以滿足不同的需求。此外,當(dāng)前人們對(duì)信息處理效率的要求正在不斷提高,對(duì)實(shí)時(shí)信息的需求量也在不斷增加,從某種層面分析,信息的時(shí)效性也是其價(jià)值的體現(xiàn)。
二、大數(shù)據(jù)時(shí)代所面臨的安全挑戰(zhàn)
1、用戶隱私的保護(hù)
因?yàn)榇髷?shù)據(jù)中的信息量非常龐雜,所以為了保證用戶隱私信息的安全性必須要對(duì)其進(jìn)行妥善的處理。就用戶隱私保護(hù)而言,我們可以將其分為未知隱私保護(hù)、標(biāo)識(shí)符匿名隱私保護(hù)以及連接關(guān)系間的匿名隱私保護(hù)等類別。企業(yè)依托于大數(shù)據(jù),對(duì)用戶的行為以及生活狀態(tài)進(jìn)行分析預(yù)測,更助于企業(yè)掌握用戶的生活習(xí)慣、愛好以及消費(fèi)記錄情況?!?】以此為切入點(diǎn),有針對(duì)性的進(jìn)行廣告推薦取得的效果更好。結(jié)合實(shí)際分析,“匿名處理”因操作簡便等優(yōu)勢已經(jīng)成為了首選的隱私保護(hù)手段,但實(shí)際工作中,這種方式取得的效果實(shí)在非常有限。單純的隱藏用戶的真實(shí)姓名根本無法完成對(duì)于用戶隱私的保護(hù),若繼續(xù)沿用此種模式必然會(huì)引發(fā)一系列的問題。綜上,大數(shù)據(jù)時(shí)代下我們需要?jiǎng)?chuàng)新用戶的隱私保護(hù)模式。
2、大數(shù)據(jù)的可信度
基于大數(shù)據(jù),在人們的認(rèn)識(shí)里逐漸形成了一個(gè)錯(cuò)誤的觀點(diǎn):數(shù)據(jù)可以說明一切,數(shù)據(jù)本身即是事實(shí)。殊不知這一觀點(diǎn)不僅片面而且沒有根據(jù),如果不能仔細(xì)甄別數(shù)據(jù)信息,那么即便是大數(shù)據(jù)也會(huì)誘導(dǎo)我們作出錯(cuò)誤的結(jié)論。這就像人如果一味的相信自己的眼睛,必然會(huì)在自己“看不到”的地方出錯(cuò)一樣。
當(dāng)前大數(shù)據(jù)可信度的威脅主要包括偽造、刻意捏造數(shù)據(jù)以及數(shù)據(jù)在傳播中逐步失真兩部分內(nèi)容。首先若數(shù)據(jù)的應(yīng)用場景已知,那么數(shù)據(jù)信息的發(fā)布者為了誘導(dǎo)信息使用者得出某種有利的結(jié)論,便會(huì)刻意偽造某些數(shù)據(jù)來營造出某種“假象”。這些偽造的數(shù)據(jù)信息會(huì)藏在大量真實(shí)的數(shù)據(jù)信息之中,人們在短時(shí)間內(nèi)根本無法鑒別其真?zhèn)?,此時(shí)在這些被偽造的信息影響之下人們往往會(huì)得出錯(cuò)誤的結(jié)論。這類問題常見于點(diǎn)評(píng)網(wǎng)站之上,某些商品的虛假評(píng)論會(huì)混在真實(shí)評(píng)論之中,用戶根本無法分辨,最終有可能會(huì)選擇劣質(zhì)的服務(wù)以及商品?;ヂ?lián)網(wǎng)之上虛假信息的產(chǎn)生以及傳播越來越容易,僅依靠現(xiàn)有的信息安全手段想要甄別所有信息的來源是不現(xiàn)實(shí)的。此外,人工干預(yù)的數(shù)據(jù)采集過程很容易會(huì)出現(xiàn)誤差,由此而導(dǎo)致的數(shù)據(jù)失真或是出現(xiàn)偏差最終會(huì)影響數(shù)據(jù)分析的準(zhǔn)確性。數(shù)據(jù)版本的變更也有可能會(huì)導(dǎo)致數(shù)據(jù)逐步失真,由此現(xiàn)實(shí)情況的變化,早期采集的數(shù)據(jù)根本無法反映真實(shí)的狀況,這也會(huì)影響信息使用者的判斷。
綜上,基于大數(shù)據(jù)時(shí)代信息的使用者應(yīng)該具備判斷數(shù)據(jù)來源以及傳播途徑真實(shí)性的能力,以此來了解各類信息數(shù)據(jù)的可信度,避免得出有錯(cuò)或是無意義的結(jié)論。
三、大數(shù)據(jù)安全與隱私的保護(hù)措施
1、針對(duì)數(shù)據(jù)發(fā)布的匿名保護(hù)技術(shù)
基于結(jié)構(gòu)化大數(shù)據(jù),要想增強(qiáng)用戶數(shù)據(jù)安全與隱私的保護(hù),就必須強(qiáng)化數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)的研究,不斷改進(jìn)完善匿名保護(hù)技術(shù)?,F(xiàn)階段,國內(nèi)針對(duì)大數(shù)據(jù)的匿名保護(hù)仍處在較為初級(jí)的階段,保護(hù)的范圍也只是局限在一次性用戶靜態(tài)發(fā)布的數(shù)據(jù)之上。今后還需要相關(guān)技術(shù)人員不斷研究,從而擴(kuò)大匿名保護(hù)的范圍。此外,在數(shù)據(jù)信息多變性的影響之下,信息的發(fā)布大多不是一次性的,所以現(xiàn)有的技術(shù)條件根本無法對(duì)數(shù)據(jù)的發(fā)布實(shí)行匿名措施。
2、針對(duì)社交網(wǎng)絡(luò)的匿名保護(hù)技術(shù)
用戶在社交網(wǎng)絡(luò)中發(fā)布的數(shù)據(jù)包含大量的隱私信息,現(xiàn)如今這類數(shù)據(jù)已經(jīng)成為了大數(shù)據(jù)的主要來源。因其中圖結(jié)構(gòu)的數(shù)據(jù)占的比例較重,所以現(xiàn)有的數(shù)據(jù)保護(hù)技術(shù)無法對(duì)這類數(shù)據(jù)進(jìn)行有效的保護(hù)。入侵者通過分析點(diǎn)與邊的相關(guān)屬性會(huì)完成數(shù)據(jù)的分析整合,這能夠重新鑒定出用戶的身份信息。所以針對(duì)社交網(wǎng)絡(luò)中的信息所進(jìn)行的匿名保護(hù),必須依托于圖結(jié)構(gòu)的特征展開,在發(fā)布信息時(shí)就應(yīng)該對(duì)能夠標(biāo)識(shí)用戶信息的數(shù)據(jù)進(jìn)行處理。此外,也應(yīng)該對(duì)用戶間的關(guān)系進(jìn)行匿名處理,以提高用戶信息匿名保護(hù)的力度。【4】
3、數(shù)據(jù)水印技術(shù)
所謂數(shù)據(jù)水印技術(shù)就是將那些可以進(jìn)行標(biāo)識(shí)的信息在不影響正常的數(shù)據(jù)內(nèi)容和數(shù)據(jù)使用的前提下,用相對(duì)難以察覺的方式嵌入到數(shù)據(jù)載體之中,其中在媒體版權(quán)維護(hù)、數(shù)據(jù)庫和文本文件的比較中應(yīng)用的相對(duì)廣泛。根據(jù)數(shù)據(jù)水印的作用我們可以將其分為強(qiáng)健水印類和脆弱水印類兩種,強(qiáng)健水印類能夠很好的保護(hù)原作者的創(chuàng)作權(quán),而脆弱水印類則能夠確保數(shù)據(jù)的真實(shí)性。不過數(shù)據(jù)水印技術(shù)多是在小范圍內(nèi)應(yīng)用,因此需要我們加強(qiáng)對(duì)其的研究和應(yīng)用,更好的發(fā)揮其作用。
【總結(jié)】
大數(shù)據(jù)時(shí)代下,數(shù)據(jù)量呈現(xiàn)出了爆炸式的增長。大數(shù)據(jù)在給用戶帶來便利的同時(shí),也對(duì)用戶個(gè)人信息的安全帶來了極大的威脅。未來我們必須加強(qiáng)大數(shù)據(jù)安全技術(shù)的運(yùn)用,以技術(shù)為依托,保證信息在儲(chǔ)存、傳遞以及應(yīng)用環(huán)節(jié)的安全性。上文筆者對(duì)此類問題進(jìn)行了總結(jié),旨在對(duì)相關(guān)工作的落實(shí)有所幫助。
參考文獻(xiàn):
[1]曹珍富,董曉蕾,周俊,沈佳辰,寧建廷,鞏俊卿.大數(shù)據(jù)安全與隱私保護(hù)研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2016,53(10):2137-2151.
[2]馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014,37(01):246-258.
[3]崔洪剛,唐浩,汪永超.試論大數(shù)據(jù)安全與隱私保護(hù)[J].科技風(fēng),2016(07):92-93.
[4]呂欣,韓曉露.大數(shù)據(jù)安全和隱私保護(hù)技術(shù)架構(gòu)研究[J].信息安全研究,2016,2(03):244-250.