(北京信息職業(yè)技術(shù)學(xué)院,北京 100081)
21世紀(jì)是大數(shù)據(jù)的時(shí)代,它為人們帶來的巨大的機(jī)遇與財(cái)富,各行各業(yè)通過對大數(shù)據(jù)進(jìn)行分析及深挖,從中找到有用信息進(jìn)而提高企業(yè)效益。但是在另一方面來看,用戶個(gè)人數(shù)據(jù)的網(wǎng)絡(luò)化、透明化成為不可阻擋的大趨勢,如何對其隱私保護(hù)成為業(yè)內(nèi)人士注重的問題。如果不能加以有效保護(hù),用戶在網(wǎng)絡(luò)中留下的數(shù)據(jù)信息很可能被惡意利用,造成意外甚至是難以挽回的經(jīng)濟(jì)損失。
現(xiàn)階段,傳感器可以自動(dòng)采集用戶位置信息,其采集用戶位置信息的能力(速度、規(guī)模等)發(fā)展迅速,遠(yuǎn)超當(dāng)前系統(tǒng)的處理速度。在將來,隨著移動(dòng)傳感設(shè)備的發(fā)展與通信技術(shù)的進(jìn)步,位置信息產(chǎn)生的速度會(huì)更快,頻率則更高,其均會(huì)為人們的日常生活及科學(xué)研究帶來極大的便利,這類包含位置信息且具有規(guī)模大、產(chǎn)生速度快、蘊(yùn)含價(jià)值高等特點(diǎn)且被普遍認(rèn)可的數(shù)據(jù)被稱為位置大數(shù)據(jù)。
隱私是指與本人相關(guān)的且在不經(jīng)過本人的同意不可能在某些時(shí)間、某些地點(diǎn)以某種方式被公開,與一般的隱私定義有共同之處,大數(shù)據(jù)隱私是指用戶對自己位置信息的掌握。在當(dāng)今社會(huì),企業(yè)與商家可以用各種各樣的方式獲取用戶的位置信息,并且企業(yè)與商家可以利用位置信息得到用戶的活動(dòng)軌跡,利用活動(dòng)軌跡可以對用戶的家庭住址、生活習(xí)慣、健康狀況及社會(huì)地位等進(jìn)行初步推斷。比如,可以依據(jù)用戶出現(xiàn)在醫(yī)院的時(shí)間段及次數(shù)可以推斷用戶是醫(yī)院工作者還是身體出現(xiàn)了健康問題,進(jìn)而對用戶進(jìn)行下一步的推銷。
大數(shù)據(jù)隱私攻擊模型有統(tǒng)一的標(biāo)準(zhǔn)描述對用戶位置隱私信息的攻擊效果,不同的攻擊方法提供給攻擊者的用戶位置的數(shù)據(jù)量不同,攻擊者得到用戶的位置數(shù)據(jù)是需要用r(攻擊者取得的用戶的一條位置信息)、p(用戶的位置數(shù)據(jù))、t(收集到的用戶位置信息所對應(yīng)的時(shí)刻),因此攻擊者可以根據(jù)采集到的位置數(shù)據(jù)推斷用戶在t時(shí)刻處于某個(gè)敏感位置的概率。
在對大數(shù)據(jù)加密的方法進(jìn)行設(shè)計(jì)時(shí),我們需要引入模糊加密理論。這個(gè)模糊理論包括兩方面,一方面是對位置數(shù)據(jù)的空間模糊,另一個(gè)是對位置數(shù)據(jù)的時(shí)間模糊。位置數(shù)據(jù)的空間模糊是通過降低位置數(shù)據(jù)的精確度來對位置的空間數(shù)據(jù)進(jìn)行模糊進(jìn)而達(dá)到對用戶數(shù)據(jù)進(jìn)行隱私保護(hù)的目的,這種方法可以將用戶的位置信息從一個(gè)點(diǎn)擴(kuò)大到一片區(qū)域,使攻擊者無法直接得到用戶的具體位置信息。
圖1 位置數(shù)據(jù)空間模糊示意圖
圖2 位置數(shù)據(jù)時(shí)間模糊示意圖
a圖表示某一時(shí)刻內(nèi)A、B、C、D、E五個(gè)用戶的空間位置信息,b圖表示用戶之間的空間關(guān)系。
用戶如果想將黑色區(qū)域作為自身的模糊位置范圍,需要在符合各項(xiàng)要求的前提下對用戶的周圍區(qū)域進(jìn)行保護(hù),進(jìn)而對系統(tǒng)內(nèi)的所有數(shù)據(jù)進(jìn)行加密。針對本次設(shè)計(jì)的具體情況,進(jìn)一步提高針對隱私保護(hù)的修正速度是重中之重。針對位置數(shù)據(jù)的模糊加密理論,他是通過對位置數(shù)據(jù)時(shí)域進(jìn)行模糊,降低位置數(shù)據(jù)的精確度,進(jìn)而加密位置數(shù)據(jù)。
在對用戶位置數(shù)據(jù)定位與表示準(zhǔn)確的情況下,利用位置數(shù)據(jù)的時(shí)間模糊加密理論與空間模糊加密理論選定位置數(shù)據(jù)信息的加密保護(hù)強(qiáng)度,假定用ε表示位置數(shù)據(jù)的隱私預(yù)算,對于用戶的隱私保護(hù),需要對用戶的關(guān)聯(lián)位置的數(shù)據(jù)集合進(jìn)行集權(quán)化處理:
U代表大數(shù)據(jù)集,他的特點(diǎn)為具有位置特征,Qi表示最初位置信息的查看結(jié)果,S是范數(shù)距離,但是暫時(shí)不使用。
為避免位置數(shù)據(jù)時(shí)時(shí)刻刻在變化對加密的效果產(chǎn)生影響,在計(jì)算中加入一個(gè)位置數(shù)據(jù)的敏感系數(shù)Δβ和閾值N,若計(jì)算目錄到達(dá)或超過敏感度閾值則停止計(jì)算,針對數(shù)據(jù)集進(jìn)行調(diào)整。
綜合以上所述,設(shè)計(jì)數(shù)據(jù)加密算法模型,可以得出最后加密系數(shù)為:
數(shù)據(jù)越近似加密系數(shù)越大,這表明對用戶位置數(shù)據(jù)的隱私保護(hù)越好。
在對本加密方法進(jìn)行仿真時(shí)需要提供合適的仿真環(huán)境。在進(jìn)行仿真時(shí)為保證實(shí)驗(yàn)的準(zhǔn)確,需要進(jìn)行對比實(shí)驗(yàn)。對用戶的位置數(shù)據(jù)采用兩種加密方法:傳統(tǒng)加密方法與上文的隱私保護(hù)加密方法,在閾值確定時(shí),分析兩種方法對用戶隱私信息的保護(hù)程度。本文方法的惡意數(shù)據(jù)攔截量為97.68%,而傳統(tǒng)方法對惡意攻擊數(shù)據(jù)的有效攔截量僅為85.91%。綜上所述,本文的加密方法對用戶的隱私保護(hù)效果更加理想。
互聯(lián)網(wǎng)在滲透進(jìn)入人們生活的方方面面,因此對于用戶的隱私保護(hù)問題更應(yīng)該受到人們的重視,本文特針對這一問題設(shè)計(jì)了用戶位置隱私保護(hù)加密方法,但是該方法仍然存在一些不足,希望在后續(xù)研究中可以針對這些不足加以改進(jìn)。