冷同虎
【摘 要】進入20世紀以來,高新科技迅猛發(fā)展。移動通信技術的升級換代,使得智能穿戴設備、計算機等一系列高科技產品迅速地進入我國普通人的生活,同時也產生了前所未有的大量數據。目前我國大數據技術整體的發(fā)展階段還處于初級階段,有許多技術缺陷,實際應用中,數據安全與隱私保護方面有一定隱患。近些年,大數據方面研究成為相關部門和企業(yè)關注的重點對象。文章淺談大數據環(huán)境下,信息和隱私保護,希望對大數據的合理應用有幫助。
【關鍵詞】大數據;數據安全;隱私保護
一、大數據簡單介紹
大數據這個概念起源于美國,大致從二十世紀初期,“大數據”開始流行于互聯(lián)網信息技術行業(yè)。如今,大數據更是應用于各個行業(yè),數據影響策略,數據大幅提高了社會智能化的程度?,F在來說大數據有四個特征:數據的價值高、數據總量很大、數據產生速度極快、數據種類繁多。但是其價值密度低,就是海量數據中數據質量很低,有價值數據少。大數據的來源列舉以下幾個方面:1)個人產生數據。比方編寫的文檔、收發(fā)的圖片、傳播的音頻、視頻,以及交際媒體所產生的數據流等等。2)市場數據。例如電子商務數據、互聯(lián)網瀏覽數據、企業(yè)系統(tǒng)數據、CRM系統(tǒng)數據、生產數據等。3)移動通信產生數據。智能生活設科技產品走進人們生活,產生大量數據。根據預測,2020年全球預計產生數據量50ZB左右,而已經過去的2019年為40ZB左右。大數據與每個人息息相關,它無處不在,影響著我們的工作、生活和學習,并將繼續(xù)帶來更大的影響。
二、數據安全與隱私保護相關面臨考驗以及法律法規(guī)
(一)大數據環(huán)境下,數據信息安全面臨大量威脅
例如,搜集數據、存儲信息、處理及分析數據、再銷毀某些數據[1]。安全的挑戰(zhàn)包括大數據可信度、是否暴露了私密信息。在互聯(lián)網框架下,這類安全威脅包含了存儲信息、調取數據時的竊取隱私[3]。此外,如果沒有配套完善的基礎設施,數據很容易被偷聽和竊取。此外,目前沒有完善的數據安全相關的法律法規(guī)和標準,這會讓有些不法分子鉆空子,這涉及到數據安全和個人信息保護,使得大數據生態(tài)系統(tǒng)中的數據安全保護難度加大,個人信息泄露風險加劇。另一方面,大數據技術和平臺安全也同樣面臨挑戰(zhàn),目前的大數據平臺安全機制嚴重不足,大數據錯綜復雜的背景下,黑客的攻擊意圖更加明顯,數據保護難度加大。
(二)我國有關隱私保護方面法律法規(guī)
當下,我國在保護個人隱私方面的法律法規(guī)有幾十部,但仍缺少一部完整的網絡數據安全隱私保護法,2020年,個人信息保護法與數據安全法也在擬定中,相信不久就會出臺。我國目前存在的一些法律法規(guī),如2017年實施《網絡安全法》,就保護公民個人信息和網絡空間安全做出了規(guī)定;2010年實施的《侵權責任法》規(guī)定劃定被侵權人可以要求侵權人承當法律責任。這條法律說的范圍較廣,對于數據安全、隱私保護方面同樣適用。對個人信息保護的還有2013年實施的《電信和互聯(lián)網用戶個人信息保護規(guī)定》,從事相關隱私信息工作人員履行職責中知悉了用戶個人信息對應當保密,不能對這些數據進行違法行為。進行由以上列舉的幾條法律條文來看,我們迫切需要一部完整,緊跟時代的隱私保護法律,目前歐盟已經生效嚴格的數據、隱私保護法,我們可以積極借鑒。
三、大數據安全與隱私保護技術
典型的隱私保護技術手段包含:抑制、泛化、置換、擾動,裁剪等,也可以通過密碼學技術保護隱私 [4]。
1.身份匿名
利用K-匿名模型,薩馬拉蒂和斯威尼首先提出了適用于關系數據表的K-匿名模型;每個分組至少包含k條記錄,因此,具有某個準標識符的每個記錄至少k-1個都不能與其他記錄區(qū)分開來,從而啟用匿名用戶身份保護[4]。該方法存在不足,不能抵抗鏈路攻擊。K-匿名模型作為一種經典的身份隱私保護模型,在實際的隱私保護應用中仍然發(fā)揮著一定的作用,為用戶提供了一定的隱私保護能力。
2.節(jié)點匿名
在圖連接的信息社會網絡中,攻擊者可以通過目標用戶節(jié)點的鄰居社會關系形成的獨特結構來重新識別用戶。攻擊者的背景知識大致可以分為三種類型:目標節(jié)點的節(jié)點度、節(jié)點附近子圖的形狀以及子圖范圍內節(jié)點的連通度[4]。這可以表現為三種不同的攻擊方針對上述攻擊,而節(jié)點匿名的目的是通過添加一定程度的抑制、替換或干擾來降低精確匹配的成功率。
3.屬性匿名
社交關系也會泄露了用戶屬性,用戶的社交網絡記錄已經成為隱私泄露的主要來源。用戶部分屬性與其社會結構有很高的相關性,屬性相同的用戶更容易成為朋友,形成密切相關的社區(qū)。結合其社會結構和朋友關系,可以推斷出用戶的未標記屬性。人以群分,針對這一問題,需要制定一種關于屬性社會網絡的屬性匿名保護方案。
四、結語
大數據是這個時代的必然產物,它為人類社會發(fā)展做出了巨大貢獻,同時帶來了巨大的風險,特別是隱私以及數據安全上,我們需要借助先進的技術,維護好大數據的隱私和安全,讓大數據應用更加可靠。建議加強大數據技術在大數據生態(tài)系統(tǒng)功能安全和網絡安全防護方面的研究,例如入侵檢測、安全狀態(tài)檢測、網絡攻擊取證、威脅分析等,以利用大數據技術抵御對大數據生態(tài)系統(tǒng)的網絡攻擊威脅。目前這大數據產業(yè)化發(fā)展的安全技術、機制沒有統(tǒng)一的標準,需要借助行業(yè)或團隊標準等對國家標準進行豐富。
【參考文獻】
[1]楊奔.試論大數據安全與隱私保護[J].計算機產品與流通,2020(06):115.
[2]葉曉俊,金濤,劉璘.大數據安全標準現狀和思考[J].科技導報,2020,38(03):94-102.
[3]劉亮.大數據安全與隱私保護技術要點[J].信息與電腦(理論版),2016(06):218-219.
[4]馮登國 等.大數據安全與隱私保護[M].北京,清華大學出版社,2018:176-192.