王彩玲
(河南警察學(xué)院 網(wǎng)絡(luò)安全系,鄭州 450046)
隨著移動(dòng)互聯(lián)網(wǎng)、智能穿戴設(shè)備、社交網(wǎng)絡(luò)應(yīng)用等位置感知技術(shù)的快速發(fā)展,產(chǎn)生大量用戶位置數(shù)據(jù)并被收集,如微信中的“位置”、釘釘中的“簽到”等。這些數(shù)據(jù)信息具有產(chǎn)生速度快、信息價(jià)值高、數(shù)據(jù)規(guī)模大等特點(diǎn)。由于位置大數(shù)據(jù)蘊(yùn)含有描述人們行為特征的信息,通過(guò)對(duì)其進(jìn)行挖掘分析可以形成各種屬性畫像,從而在智慧商業(yè)、疫情防控、案件偵辦等方面提供重要的價(jià)值參考。與此同時(shí),位置大數(shù)據(jù)的不當(dāng)使用也給用戶帶來(lái)個(gè)人隱私泄露的嚴(yán)重威脅,甚至造成不可預(yù)估的嚴(yán)重后果。因此,在大數(shù)據(jù)時(shí)代,如何提高位置大數(shù)據(jù)的利用價(jià)值又確保用戶個(gè)人隱私不被泄露,已成為位置大數(shù)據(jù)隱私保護(hù)研究的熱點(diǎn)問(wèn)題之一。
本文針對(duì)位置大數(shù)據(jù)的隱私保護(hù)進(jìn)行研究,介紹相關(guān)的數(shù)據(jù)加密技術(shù),在確保隱私保護(hù)的同時(shí)分析相關(guān)敏感數(shù)據(jù),提出保護(hù)數(shù)據(jù)隱私的具體加密設(shè)計(jì)。
眾所周知,位置大數(shù)據(jù)服務(wù)具有以下幾個(gè)特點(diǎn):位置信息與用戶的身份信息相綁定;用戶的請(qǐng)求信息與位置有關(guān);用戶提交的位置信息越精確,獲得的位置數(shù)據(jù)服務(wù)質(zhì)量就越高;一旦高精度的位置信息發(fā)生泄漏,就會(huì)給用戶造成一定的威脅或?yàn)?zāi)難?;谶@些特點(diǎn),位置大數(shù)據(jù)的隱私安全問(wèn)題不容忽視。當(dāng)用戶向服務(wù)器端發(fā)送位置信息時(shí),惡意攻擊者可能會(huì)截取用戶的位置數(shù)據(jù);當(dāng)服務(wù)器端向用戶返回處理后的結(jié)果時(shí),惡意攻擊者也有可能會(huì)根據(jù)背景知識(shí)分析出用戶的位置信息[1]。
位置大數(shù)據(jù)中的隱私分為位置隱私和查詢隱私兩種。查詢隱私是用戶提出查詢請(qǐng)求的內(nèi)容數(shù)據(jù),而位置隱私是用戶提出查詢請(qǐng)求的位置數(shù)據(jù)。不管哪種隱私泄露都可能導(dǎo)致對(duì)用戶行為模式、身體狀況、業(yè)余愛好等方面的畫像分析,犯罪分子甚至偽裝身份向用戶推送各種惡意廣告、詐騙信息等。近幾年發(fā)生的多起案件表明,用戶在享受位置服務(wù)便利的同時(shí)也面臨著位置隱私安全的威脅,比如:Google收集用戶位置信息所引發(fā)的爭(zhēng)論、各類手機(jī)APP的定位功能侵犯?jìng)€(gè)人隱私等。
位置大數(shù)據(jù)隱私保護(hù)的方法很多,有位置隱私策略保護(hù)法、位置加密保護(hù)法、位置模糊匿名保護(hù)法等。因?yàn)榧用芗夹g(shù)是最直接最有效的隱私保護(hù)手段,本文主要研究基于數(shù)據(jù)加密技術(shù)的隱私保護(hù)方法。
2008年,IBM公司的研究人員Gentry發(fā)明了一種無(wú)需對(duì)數(shù)據(jù)解密的數(shù)學(xué)運(yùn)算方法,這是同態(tài)加密的首個(gè)應(yīng)用案例。同態(tài)加密是具有特殊代數(shù)結(jié)構(gòu)的一種加密方案,其特點(diǎn)是不需要使用解密密鑰就能直接對(duì)加密數(shù)據(jù)執(zhí)行操作。2016年,微軟技術(shù)人員突破了同態(tài)加密速度的障礙,使其應(yīng)用領(lǐng)域越來(lái)越廣泛。在醫(yī)療系統(tǒng)中,醫(yī)護(hù)人員可以根據(jù)數(shù)千萬(wàn)病患的醫(yī)療記錄來(lái)識(shí)別基于地理位置和人口結(jié)構(gòu)的疾病態(tài)勢(shì),這些醫(yī)療記錄在存儲(chǔ)過(guò)程中使用同態(tài)加密技術(shù)來(lái)實(shí)現(xiàn)對(duì)病患隱私的有效保護(hù)。
差分隱私也是一種比較先進(jìn)的數(shù)據(jù)加密技術(shù)。2006年由Dwork等人首次提出,它是利用密碼統(tǒng)計(jì)計(jì)算來(lái)提高數(shù)據(jù)查詢的準(zhǔn)確性,同時(shí)實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的保護(hù)[2]。與同態(tài)加密技術(shù)不同,差分隱私是對(duì)數(shù)據(jù)分析算法的一種屬性設(shè)置,通過(guò)數(shù)據(jù)計(jì)算權(quán)限標(biāo)準(zhǔn)的設(shè)計(jì),讓不具備計(jì)算標(biāo)準(zhǔn)的外部計(jì)算方式無(wú)法對(duì)該數(shù)據(jù)進(jìn)行計(jì)算或獲取,從而達(dá)到數(shù)據(jù)保護(hù)的目的。差分隱私技術(shù)應(yīng)用在位置大數(shù)據(jù)服務(wù)中,一是能夠?yàn)槲恢貌樵兎?wù)提供準(zhǔn)確率更高的數(shù)據(jù),二是能夠有效抵御基于背景知識(shí)的惡意攻擊所導(dǎo)致的隱私泄露。美國(guó)計(jì)劃在2020年的人口普查中使用差分隱私技術(shù)對(duì)公民的身份數(shù)據(jù)進(jìn)行保密,從而更好地保護(hù)個(gè)人隱私。
伴隨著定位技術(shù)及位置信息內(nèi)容的逐漸擴(kuò)充,更多的隱私加密技術(shù)已逐漸應(yīng)用到位置大數(shù)據(jù)的隱私保護(hù)中。本文涉及的位置大數(shù)據(jù)隱私保護(hù)的加密設(shè)計(jì)方法主要有以下幾個(gè)方面。
在位置大數(shù)據(jù)隱私保護(hù)中,對(duì)位置的獲取和定位是首要的環(huán)節(jié)。目前,對(duì)位置的獲取主要采用GPS技術(shù)。GPS是目前定位系統(tǒng)中效率最高、精準(zhǔn)性最強(qiáng)的技術(shù),主要應(yīng)用在移動(dòng)設(shè)備或其他定位設(shè)備中。用戶發(fā)出獲取位置信息的指令,指令符合相關(guān)權(quán)限后對(duì)位置信息進(jìn)行獲取,經(jīng)過(guò)衛(wèi)星和移動(dòng)設(shè)備的數(shù)據(jù)信號(hào)連接,從而獲取和訪問(wèn)到使用者的定位數(shù)據(jù)。定位數(shù)據(jù)的內(nèi)容主要包括:對(duì)獲取權(quán)限時(shí)間段內(nèi)用戶的經(jīng)度位置進(jìn)行定位;對(duì)獲取權(quán)限時(shí)間段內(nèi)用戶的緯度進(jìn)行定位;對(duì)獲取權(quán)限時(shí)間信息進(jìn)行校準(zhǔn)。
在數(shù)據(jù)隱私保護(hù)設(shè)計(jì)中,這三方面數(shù)據(jù)可表示為(x、y、t)。通過(guò)對(duì)這三項(xiàng)數(shù)據(jù)的定位測(cè)量,再利用當(dāng)前的三角測(cè)量方法,計(jì)算出精準(zhǔn)的位置信息。最后,移動(dòng)設(shè)備和互聯(lián)網(wǎng)相連接,對(duì)用戶定位數(shù)據(jù)信息完成有效地儲(chǔ)存處理及關(guān)聯(lián)數(shù)據(jù)的搜索。
依據(jù)當(dāng)前我國(guó)定位數(shù)據(jù)的獲取原理,對(duì)位置大數(shù)據(jù)進(jìn)行有效保護(hù)的主要措施就是針對(duì)性地采取切斷設(shè)備信號(hào)的方式來(lái)提高定位數(shù)據(jù)信息獲取的安全性。當(dāng)GPS移動(dòng)設(shè)備發(fā)出具體的定位請(qǐng)求時(shí),經(jīng)過(guò)數(shù)據(jù)保護(hù)系統(tǒng)的權(quán)限同意,加密保護(hù)裝置會(huì)立即獲取移動(dòng)設(shè)備的信號(hào)基站,并同時(shí)向其他關(guān)聯(lián)設(shè)備發(fā)出求救信號(hào),其他關(guān)聯(lián)設(shè)備對(duì)該設(shè)備的位置數(shù)據(jù)信息進(jìn)行保護(hù),并重新建立一個(gè)IP地址,這個(gè)IP地址就是對(duì)用戶位置信息的映射。加密設(shè)備和技術(shù)的應(yīng)用使攻擊者無(wú)法正常獲取信息信號(hào),客戶則通過(guò)自身的映射位置信息安全地了解到自身的位置信息,達(dá)到位置數(shù)據(jù)保護(hù)的目的。
除從獲取渠道保護(hù)位置數(shù)據(jù)信息外,還可以從位置信息的保護(hù)層面防止用戶的位置數(shù)據(jù)信息不受攻擊[3]。加密技術(shù)對(duì)位置數(shù)據(jù)的基礎(chǔ)模式進(jìn)行識(shí)別和保護(hù),即位置信息的(x、y、t)數(shù)據(jù)可以進(jìn)入使用者的移動(dòng)設(shè)備中,而惡意攻擊者使用其他數(shù)據(jù)入侵定位系統(tǒng)時(shí),加密技術(shù)會(huì)自動(dòng)對(duì)非位置屬性的數(shù)據(jù)進(jìn)行銷毀,從而達(dá)到對(duì)定位數(shù)據(jù)信息的保護(hù)。
目前模糊加密理論具體包括兩個(gè)層面:第一層是位置數(shù)據(jù)信息中的空間信息模糊;第二層是位置數(shù)據(jù)信息中的時(shí)間信息模糊。通過(guò)對(duì)這兩層信息進(jìn)行模糊加密,實(shí)現(xiàn)位置數(shù)據(jù)的保護(hù)。在具體加密的過(guò)程中,模糊加密工作是數(shù)據(jù)保護(hù)計(jì)算的重要前提[4]。
首先,通過(guò)對(duì)位置數(shù)據(jù)信息的空間模糊來(lái)完成對(duì)位置數(shù)據(jù)信息的有效保護(hù)。當(dāng)使用者想獲取位置信息時(shí),必然會(huì)發(fā)出信號(hào)獲取(x、y、t)三項(xiàng)數(shù)據(jù)。從反向研究方法來(lái)看,如果想保護(hù)用戶的位置數(shù)據(jù)信息,則可以利用模糊理論將(x、y、t)三項(xiàng)數(shù)據(jù)進(jìn)行模糊和隱蔽,當(dāng)竊取者想要獲取信息數(shù)據(jù)時(shí),得到的信息有可能是不完整的,也有可能是錯(cuò)誤的,這樣就起到了定位數(shù)據(jù)信息保護(hù)的作用。
根據(jù)模糊理論,可以設(shè)計(jì)隱蔽妨礙區(qū)域,通過(guò)妨礙區(qū)域的建立對(duì)數(shù)據(jù)進(jìn)行更全面地保護(hù)。圖1(a)中設(shè)置有五個(gè)模擬位置A、B、C、D、E,其中陰影部分表示當(dāng)前使用模糊理論模糊的區(qū)域,圖1(b)則反映出這五個(gè)位置的空間關(guān)系。從圖1可知,除A用戶本身之外,其他四個(gè)位置的用戶想要獲取A的位置信息,都會(huì)受到模糊區(qū)域的影響。通過(guò)位置模糊技術(shù)的應(yīng)用,能夠快速實(shí)現(xiàn)位置數(shù)據(jù)信息的隱私加密保護(hù)。
(a)
(b)
其次,模糊理論應(yīng)用還涉及到時(shí)間模糊加密理論。時(shí)間模糊理論是指通過(guò)增加使用者位置信息獲取時(shí)間的不確定性來(lái)擾亂信息竊取者的數(shù)據(jù)計(jì)算進(jìn)度,從而實(shí)現(xiàn)位置數(shù)據(jù)信息的保護(hù)和加密。其原理也是對(duì)(x、y、t)三項(xiàng)數(shù)據(jù)進(jìn)行模糊和隱藏,空間模糊中隱藏和模糊的是x、y兩項(xiàng)數(shù)據(jù),而時(shí)間模糊中隱藏和模糊的則是t項(xiàng)數(shù)據(jù)。在位置數(shù)據(jù)信息獲取的過(guò)程中,如果時(shí)間信息錯(cuò)誤,就會(huì)導(dǎo)致實(shí)際的計(jì)算精度失準(zhǔn)。
圖2為位置數(shù)據(jù)時(shí)間模糊示意圖,表1則為時(shí)間模糊理論應(yīng)用后的時(shí)間數(shù)據(jù)狀態(tài)。由表1可知,在進(jìn)行時(shí)間模糊之后,加密保護(hù)技術(shù)對(duì)設(shè)備獲取的位置信息進(jìn)行增加模糊,從外層增加了許多的模糊時(shí)間信息,當(dāng)竊取者想入侵到數(shù)據(jù)系統(tǒng)中時(shí),位置信息非常復(fù)雜且具有干擾性,這就影響到竊取者的數(shù)據(jù)分析和思考。由于位置信息竊取所獲得的信息都是模糊的、不準(zhǔn)確的,據(jù)此計(jì)算得出的信息結(jié)果也都不準(zhǔn)確,從而實(shí)現(xiàn)了位置數(shù)據(jù)信息的保護(hù)。
圖2 位置數(shù)據(jù)時(shí)間模糊示意圖
表1 時(shí)間模糊后位置數(shù)據(jù)移動(dòng)狀態(tài)表
位置數(shù)據(jù)信息的保護(hù)主要是以相關(guān)數(shù)據(jù)精準(zhǔn)計(jì)算為基礎(chǔ),通過(guò)精準(zhǔn)計(jì)算才能實(shí)現(xiàn)對(duì)數(shù)據(jù)的模糊,其中位置數(shù)據(jù)的敏感度計(jì)算能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)信息的模糊處理。具體計(jì)算公式為:
式(1)中,U表示滿足陷私保護(hù)數(shù)據(jù)計(jì)算的用戶位置數(shù)據(jù),P表示符合機(jī)密規(guī)則的位置數(shù)據(jù)信息,γ則表示離散集合數(shù)值,Δβ代表位置的敏感數(shù)據(jù)。
為更好地實(shí)現(xiàn)位置數(shù)據(jù)信息的保護(hù),采用基于隱私保護(hù)數(shù)據(jù)加密的計(jì)算方法進(jìn)行設(shè)計(jì)。在這個(gè)過(guò)程中,最終計(jì)算得到的機(jī)密系數(shù)就是加密過(guò)程中應(yīng)用的重要數(shù)據(jù)[5]。
式(2)中,E表示隱私保護(hù)加密計(jì)算系數(shù),Pi代表符合加密規(guī)則的位置數(shù)據(jù),e2表示在位置加密過(guò)程的使用函數(shù),Rk則表示數(shù)據(jù)敏感的程度。Rk越大,則表示當(dāng)前加密系數(shù)越大,加密保護(hù)功能越高[6]。
為驗(yàn)證上述加密算法的準(zhǔn)確度,進(jìn)行了仿真實(shí)驗(yàn)。實(shí)驗(yàn)環(huán)境:Win10操作系統(tǒng),ADM Athlon64 FX處理器,8GB內(nèi)存。搭建Python3.6.8平臺(tái),利用Geolife Trajectories 1.3獲取用戶的軌跡數(shù)據(jù)和標(biāo)簽。通過(guò)圖3的對(duì)比,可以發(fā)現(xiàn),使用本文的加密方法比傳統(tǒng)的加密方法計(jì)算誤差值要小3個(gè)點(diǎn),證明本文的加密計(jì)算方法有效。
圖3 數(shù)據(jù)誤差對(duì)比
由于位置大數(shù)據(jù)中含有用戶的位置和標(biāo)識(shí)信息,通過(guò)對(duì)這些信息的分析處理就可以掌握用戶的隱私信息和行為習(xí)慣,這就涉及到位置大數(shù)據(jù)的隱私保護(hù)問(wèn)題。本文通過(guò)分析相關(guān)的數(shù)據(jù)加密技術(shù),提出保護(hù)數(shù)據(jù)隱私的加密方法,利用模糊加密理論設(shè)計(jì)算法進(jìn)行計(jì)算和驗(yàn)證,比較發(fā)現(xiàn)誤差值變小,該計(jì)算方法有效。由于位置大數(shù)據(jù)的隱私保護(hù)屬于新興領(lǐng)域,如何完善提升位置信息的隱私保護(hù)技術(shù)還需要進(jìn)行更深入的探索和研究。