鎮(zhèn)江船艇學(xué)院基礎(chǔ)部信息技術(shù)教研室 楊 珍 鐘 誠 杜曉靜
淺析大數(shù)據(jù)環(huán)境下的隱私保護(hù)問題
鎮(zhèn)江船艇學(xué)院基礎(chǔ)部信息技術(shù)教研室 楊 珍 鐘 誠 杜曉靜
大數(shù)據(jù)是當(dāng)前的研究熱點(diǎn),正影響著人們?nèi)粘I罘绞?、工作?xí)慣及思考模式.但目前大數(shù)據(jù)在收集、存儲和使用過程中面臨著諸多安全風(fēng)險(xiǎn),大數(shù)據(jù)所導(dǎo)致的隱私泄露為用戶帶來嚴(yán)重困擾,本文分析了實(shí)現(xiàn)大數(shù)據(jù)安全與隱私保護(hù)所面臨的技術(shù)挑戰(zhàn),給出了相應(yīng)的對策。
大數(shù)據(jù);隱私保護(hù)
近年來,隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等IT與通信技術(shù)的迅猛發(fā)展,信息社會已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,數(shù)據(jù)的快速增長成了許多行業(yè)共同面對的嚴(yán)峻挑戰(zhàn)和寶貴機(jī)遇。大數(shù)據(jù)已被美國在內(nèi)的多國政府視為重要的戰(zhàn)略資源,我國也在抓緊研究并制定相應(yīng)的大數(shù)據(jù)戰(zhàn)略。
大數(shù)據(jù)的特點(diǎn)多總結(jié)為“3V”,即,規(guī)模性(volume)、多樣性(variety)、高速性(Velocity)[1],還有人提出真實(shí)性(Veracity)和價(jià)值性(Value)等特征[2]。由于其數(shù)據(jù)來源及應(yīng)用涉及廣泛,導(dǎo)致了以往在生產(chǎn)、經(jīng)濟(jì)活動、科學(xué)研究甚至日常生活中的很多思維方式發(fā)生巨大變化,帶來了無數(shù)機(jī)遇。但由于網(wǎng)絡(luò)大數(shù)據(jù)具有復(fù)雜性、不確定性和涌現(xiàn)性,導(dǎo)致網(wǎng)絡(luò)數(shù)據(jù)安全方面面臨巨大的挑戰(zhàn),制約大數(shù)據(jù)未來發(fā)展的瓶頸之一就是安全與隱私問題。
在大數(shù)據(jù)時(shí)代,通過對大數(shù)據(jù)分析、歸納,從中挖掘出潛在的模式,研究社會運(yùn)行的規(guī)律與發(fā)展趨勢,可以幫助企業(yè)、商家調(diào)整市場政策、減少風(fēng)險(xiǎn)、理性面對市場做出決策。隨著新技術(shù)的不斷出現(xiàn),在發(fā)現(xiàn)規(guī)律的同時(shí),可能會泄漏個(gè)人隱私,嚴(yán)重威脅到人們的個(gè)人信息安全和機(jī)構(gòu)的商業(yè)秘密安全。例如,我們的位置信息,每天的行程數(shù)據(jù),在大數(shù)據(jù)時(shí)代,通過GPS、手機(jī)定位等,可以輕易獲得。
如果僅僅為了保護(hù)隱私就將所有的數(shù)據(jù)都加以隱藏,那么數(shù)據(jù)的價(jià)值無法體現(xiàn)。數(shù)據(jù)公開是非常有必要的,政府可以利用公開的數(shù)據(jù)了解整個(gè)國民經(jīng)濟(jì)的運(yùn)行,以便更好地宏觀指導(dǎo)。企業(yè)可以利用公開的數(shù)據(jù)了解客戶的需求,從而推出特色服務(wù)。研究者可以利用公開的數(shù)據(jù),從社會、經(jīng)濟(jì)、技術(shù)等不同的角度來進(jìn)行研究。但是網(wǎng)絡(luò)中大量的公開數(shù)據(jù)如果缺乏監(jiān)管,會導(dǎo)致用戶無法確定自己隱私的用途,增大了隱私泄漏的風(fēng)險(xiǎn)。
在網(wǎng)絡(luò)上人們?yōu)榱吮Wo(hù)個(gè)人隱私,可能采取匿名等方式將自己的行為隱藏起來。但是互聯(lián)網(wǎng)尤其是社交網(wǎng)絡(luò)的出現(xiàn),使得人們在網(wǎng)絡(luò)中產(chǎn)生越來越多的數(shù)據(jù)足跡。這種數(shù)據(jù)具有累積性和關(guān)聯(lián)性,單個(gè)信息可能不會暴露用戶的隱私,但是如果有辦法將某個(gè)人的很多行為聚集在一起時(shí),他的隱私就很可能會暴露,因?yàn)橛嘘P(guān)他的信息已經(jīng)足夠多,這種隱性的數(shù)據(jù)暴露往往是個(gè)人無法預(yù)知和控制的。從技術(shù)層面來說,可以通過數(shù)據(jù)抽取和集成來實(shí)現(xiàn)用戶隱私的獲取,因此大數(shù)據(jù)時(shí)代的隱私性主要體現(xiàn)在不暴露用戶敏感信息的前提下進(jìn)行有效的數(shù)據(jù)挖掘,這有別于傳統(tǒng)的信息安全技術(shù)手段。
文獻(xiàn)[3]中提出保護(hù)隱私的數(shù)據(jù)挖掘這一概念,近年來逐漸成為相關(guān)領(lǐng)域的研究熱點(diǎn)。主要研究新型的數(shù)據(jù)發(fā)布技術(shù),嘗試在盡可能少損失數(shù)據(jù)信息的同時(shí)最大化地隱藏用戶隱私。Dwork在2006年提出了新的差分隱私方法[4]。差分隱私保護(hù)技術(shù)可能是解決大數(shù)據(jù)中隱私保護(hù)問題的一個(gè)方向,但是這項(xiàng)技術(shù)離實(shí)際應(yīng)用還很遠(yuǎn)。大數(shù)據(jù)未被妥善處理會對用戶的隱私造成極大的侵害,根據(jù)需要保護(hù)的內(nèi)容不同,隱私保護(hù)又可以進(jìn)一步細(xì)分為位置隱私保護(hù)、標(biāo)識符匿名保護(hù)、連接關(guān)系匿名保護(hù)等[5]。根據(jù)大數(shù)據(jù)處理流程,可以分為幾個(gè)階段:
(1)數(shù)據(jù)采集與預(yù)處理時(shí)的隱私保護(hù),如數(shù)據(jù)精度處理;
(2)數(shù)據(jù)共享、發(fā)布時(shí)的隱私保護(hù),如數(shù)據(jù)的匿名處理等;
(3)數(shù)據(jù)分析時(shí)的隱私保護(hù);
(4)隱私數(shù)據(jù)可信銷毀等。
保證用戶個(gè)人信息安全是大數(shù)據(jù)時(shí)代可持續(xù)發(fā)展的重要需求之一,賬戶被盜、資料丟失、隱私被敲詐等等問題,讓我們意識到隱私保護(hù)問題是一個(gè)綜合性的問題,需要用戶、運(yùn)營商和監(jiān)管部門共同協(xié)作,從國家、行業(yè)和用戶等各個(gè)層面來應(yīng)對大數(shù)據(jù)環(huán)境中出現(xiàn)的安全問題。
1.從法律政策上加強(qiáng)信息保護(hù)和管理?!叭旨夹g(shù),七分管理”,大數(shù)據(jù)下的隱私保護(hù)應(yīng)該是體制和法律的配套過程。數(shù)據(jù)資源是全民財(cái)產(chǎn),政府在推動數(shù)據(jù)公開的基礎(chǔ)上,需要對信息的保護(hù)范圍和措施從法律角度上限定,如敏感數(shù)據(jù)的所有權(quán)和使用權(quán)界定及侵犯他人隱私的處罰問題。2013年3月1日開始實(shí)施的《信息安全技術(shù)、公共及商用服務(wù)信息系統(tǒng)個(gè)人信息保護(hù)指南》,作為個(gè)人信息保護(hù)方面的最高國家標(biāo)準(zhǔn),它對大數(shù)據(jù)時(shí)代如何合理利用個(gè)人信息給予界定,以指導(dǎo)和規(guī)范利用信息系統(tǒng)處理個(gè)人信息的活動。
2.從技術(shù)上保護(hù)基礎(chǔ)設(shè)施和網(wǎng)絡(luò)安全。大數(shù)據(jù)時(shí)代下的社交網(wǎng)絡(luò)數(shù)據(jù)的存儲和處理需要大規(guī)模基礎(chǔ)設(shè)施的支撐,由于大量的數(shù)據(jù)匯集在一起,敏感數(shù)據(jù)集中起來會帶來攻擊效益的提高,極易成為黑客們攻擊的目標(biāo),基礎(chǔ)設(shè)施被攻擊的風(fēng)險(xiǎn)顯著提高,因而托管數(shù)據(jù)的云的安全非常重要,需要開發(fā)相應(yīng)的反數(shù)據(jù)挖掘技術(shù)手段。
3.從管理上加強(qiáng)運(yùn)營公司的監(jiān)控力度。社交網(wǎng)絡(luò)運(yùn)營商應(yīng)該杜絕公司內(nèi)部人員對用戶數(shù)據(jù)的非正當(dāng)訪問,對外限制第三方公司對平臺內(nèi)數(shù)據(jù)的訪問及相應(yīng)的授權(quán)公司能夠訪問到的數(shù)據(jù)對象范圍,來加強(qiáng)數(shù)據(jù)的可控性。
4.從認(rèn)識上提高用戶的隱私保護(hù)意識。要讓大眾知道數(shù)據(jù)有價(jià)值,并能意識到數(shù)據(jù)管理不善可能帶來的危害,提高自身的數(shù)據(jù)意識。
大數(shù)據(jù)給人們帶來極大便利的同時(shí),也帶來了新的安全挑戰(zhàn)。本文主要闡述了大數(shù)據(jù)帶來的個(gè)人隱私方面的安全問題。由于基于隱私保護(hù)的數(shù)據(jù)挖掘技術(shù)還處于起步階段,進(jìn)一步地完善基于隱私保護(hù)的大數(shù)據(jù)挖掘技術(shù)仍是將來的研究熱點(diǎn)。
[1]Grobelink M.Big-data computing:Creating revoIutionary breakthroughs in commerce,science and society[R/OL].20I2:10-02.
[2]http://wenku.baidu.com/view/abfb3a1552d380e b62946d9d.html:劉念真.利用0racle信息模型駕馭大數(shù)據(jù).
[3]Agrawal R,Srikant R.Privacy preserving data mining[C]//Proc of SIGMOD 2000.New York:ACM,2000:439-450.
[4]Dwork C.Differential privacy[C]//Proc of ICALP2006.Berlin:Springer,2006:1-12.
[5]馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014.
book=176,ebook=110