祝朝暉 顏佳偉
江蘇省泰興市廣播電視臺
大數(shù)據(jù)安全與隱私保護
祝朝暉 顏佳偉
江蘇省泰興市廣播電視臺
隨著計算機及網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,迎來了大數(shù)據(jù)時代。大數(shù)據(jù)不論對人們的工作、娛樂還是生活都產(chǎn)生著一定的影響,現(xiàn)已成為人們普遍關(guān)注的重點。當前我國的大數(shù)據(jù)仍舊在發(fā)展與完善過程中,大數(shù)據(jù)在應(yīng)用中存在著一些安全隱患,經(jīng)過網(wǎng)絡(luò)傳輸?shù)男畔乐厥д?,網(wǎng)絡(luò)用戶的個人隱私已經(jīng)不再是秘密?;诖?,本文對大數(shù)據(jù)的安全性與其隱私保護等相關(guān)方面做出相關(guān)探討。
大數(shù)據(jù) 安全 隱私保護
大數(shù)據(jù)在各行各業(yè)普及應(yīng)用,成為21世紀網(wǎng)絡(luò)信息技術(shù)發(fā)展的重要標志。大數(shù)據(jù)包含著規(guī)模巨大且復(fù)雜的信息,這增加了數(shù)據(jù)分析與處理的復(fù)雜性。面對這一規(guī)模巨大且復(fù)雜的數(shù)據(jù)系統(tǒng),應(yīng)加強其安全與隱私保護等相關(guān)技術(shù)的使用,提升對這一問題的重視程度。
1.1 大數(shù)據(jù)的起源與基本特征
廣泛的講,大數(shù)據(jù)即體系巨大且較為繁雜,管理難度大、處理分析難度大的數(shù)據(jù)信息系統(tǒng)。大數(shù)據(jù)的基本特征包括:大規(guī)?;?、高速化和多元化。
按照渠道的劃分,可將大數(shù)據(jù)分為以下幾種類別:
第一,來自人類。人們在應(yīng)用網(wǎng)絡(luò)中或者開展互聯(lián)網(wǎng)工作中會產(chǎn)生不同種類的數(shù)據(jù)信息,其中包含視音頻、圖片、數(shù)字、文字等象征符號。
第二,來自計算機。在不同類別的計算機系統(tǒng)中,因為人類的操作會自動生成數(shù)據(jù)信息,并且以文件、多媒體等方式存在,同時也包含著日志、審計等內(nèi)容的數(shù)據(jù)信息。
第三,來自物。各種不同類型的數(shù)字化設(shè)備為了方便將視音頻、圖片、數(shù)字、文字更好地存儲,將這些內(nèi)容轉(zhuǎn)化成不同的數(shù)字編號。比如:手機、攝像機等。
1.2 大數(shù)據(jù)的基本框架
大數(shù)據(jù)的基本框架基本劃分為數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)分析、數(shù)據(jù)解釋等。如圖1所示:
圖1 大數(shù)據(jù)的基本框架結(jié)構(gòu)
1.2.1 數(shù)據(jù)采集與預(yù)處理
因為大數(shù)據(jù)信息來源的渠道不同,存在不同方式的解釋,其中也包含著矛盾,所以,在信息整合過程中要對其內(nèi)容進行清理,對排除一些相同或是相似以及存在差異的信息尤為重要。
1.2.2 數(shù)據(jù)分析
這一環(huán)節(jié)處于中心位置,可以將其按照層次結(jié)構(gòu)分為三種類別:架構(gòu)、搜索與訪問、分析與處理。例如:我們可以通過對用戶的地點變化、行為等信息進行分析,得出不同國家、不同地區(qū)、不同群體的行為差異,進而對全球范圍內(nèi)不同國家、不同地區(qū)、不同用戶群體的具體情況進行預(yù)測;再如:我們可以通過對QQ、微信用戶的地點變化分析出節(jié)假日期間有多少人外出旅游、有多少人回家探親、有多少人留在原地。
1.2.3 數(shù)據(jù)解釋
這一環(huán)節(jié)能夠更好地幫助用戶進行數(shù)據(jù)處理與分析,并有效使用其結(jié)果,主要使用的技術(shù)為可視化與人機互動。
2.1 信息發(fā)布匿名
針對其中的結(jié)構(gòu)化數(shù)據(jù),這一技術(shù)占據(jù)核心位置,但仍舊處在前進的發(fā)展階段。例如:以較為經(jīng)典的k匿名為案例,初期階段方案借助元祖泛化,加之阻礙處理的方式,將信息符號分組每個組別中至少包含一個帶k的元祖;確定裁剪計劃;采用匿名模型將信息連串發(fā)布。
2.2 水印技術(shù)
這種處理技術(shù)常見于信息數(shù)據(jù)的版權(quán)保護中,將具備識別度的信息經(jīng)過技術(shù)處理以不被人發(fā)覺的方式隱藏在載體中,同時對其不產(chǎn)生任何影響。例如:(Agrawal)相關(guān)人員不能夠容忍數(shù)據(jù)庫中存在失誤,將較少的信息融入到大數(shù)據(jù)當中,選擇合適的位置儲存。
2.3 角色挖掘
考慮到不同角色在數(shù)據(jù)信息的訪問中受到限制,以對使用用戶分設(shè)角色的方式進行銜接與區(qū)分,對不同用戶授予不同權(quán)限。例如我們對“泰興網(wǎng)(www.taixing.cn)”、“泰興政府網(wǎng)(www. taixing.gov.cn)”的用戶權(quán)限進行分類,對不同等級的用戶分別授予不同權(quán)限。在大數(shù)據(jù)形式下,角色挖掘能夠按照不同用戶的訪問情況自動劃分角色,更好地為不同的使用用戶提供個性化服務(wù)。
3 結(jié)語
面對大數(shù)據(jù)的到來,技術(shù)也提升了發(fā)展更新的速度,但新的挑戰(zhàn)與問題也漸趨顯現(xiàn)出來,信息時代中大數(shù)據(jù)的安全與隱私保護是當前時期的重點問題。未來的大數(shù)據(jù)極有可能向著服務(wù)方向發(fā)展,各個企業(yè)之間互相合作、依賴,共創(chuàng)具備安全性的服務(wù)體系,保證涉及到的行業(yè)領(lǐng)域向著健康狀態(tài)發(fā)展。
[1]張冰,楊靜,張健沛等.面向聚類分析的鄰域拓撲勢熵數(shù)據(jù)擾動方法[J].哈爾濱工程大學(xué)學(xué)報,2014(9):1149-1155
[2]周志剛,張宏莉,余翔湛等.面向DaaS應(yīng)用的數(shù)據(jù)集成隱私保護機制研究[J].通信學(xué)報,2016,37(4):96-106
[3]李千目,李德強,趙健等.基于安全多方求和與可驗證私密分享的位置隱私保護協(xié)議[J].南京理工大學(xué)學(xué)報(自然科學(xué)版),2016,40(3):255-261