◆蒙絨娟 高玉琢
(寧夏大學信息工程學院 寧夏 750021)
隨著移動終端和無線定位技術的迅速發(fā)展,在人們?nèi)粘I钪杏性S多領域都應用到基于位置的服務(Location-Based Services,LBS)。LBS 主要分為:瞬時LBS 和連續(xù)LBS。從2003年學術界開始對位置隱私保護進行了相關研究,但是,多數(shù)研究僅考慮瞬時LBS的情形,對連續(xù)LBS的隱私保護相對較少。近些年,學術者發(fā)現(xiàn)僅對每一時刻的位置進行保護,攻擊者仍然可以分析出用戶的興趣愛好、生活習慣、身體缺陷等信息。因此,在確保服務質量的同時,保護用戶的軌跡隱私安全是如今亟待解決的問題。
用戶在應用位置服務時,給服務器上傳了一定信息,包括用戶身份、地理位置坐標、軌跡以及請求內(nèi)容。根據(jù)位置服務包含的容的不同,將隱私保護對象分為:單點位置隱私、軌跡位置隱私與查詢隱私。
根據(jù)身份信息和地理位置坐標,如果二者相匹配,就可以確定具體用戶,一旦泄露用戶的具體信息,就可以推斷出其他信息。用戶的身份信息和位置坐標信息形成單點隱私。身份信息包括用戶的身份證號、工號、MAC 地址等,位置坐標信息包括用戶經(jīng)緯度位置坐標和時間。單點位置用三元組可以表示為:
軌跡是指移動個體從開始到結束為止所經(jīng)過的路線。通常情況下,軌跡T 可以表示為T={qi,(x1,y1,t1),(x2,y2,t2),……,(xn,yn,tn)}。其中,qi 表示移動個體形成的軌跡信息,(xn,yn,tn)表示在tn 時刻移動用戶所在的地理位置坐標是(xn,yn)。移動的個體現(xiàn)在的狀態(tài)如果是靜止的,則采集的數(shù)據(jù)是靜態(tài)數(shù)據(jù);移動的個體如果還在運動當中,則采集的數(shù)據(jù)是逐漸增加的,是一個動態(tài)的數(shù)據(jù)收集。
用戶軌跡數(shù)據(jù)包含的信息量要比單點位置隱私多。通常,用戶每天往返于住處和工作單位之間上下班,形成軌跡數(shù)據(jù)。軌跡位置隱私可以通過大數(shù)據(jù)技術分析出軌跡數(shù)據(jù)中包含的個人信息。攻擊者擁有軌跡數(shù)據(jù)就能分析出用戶的家庭住址、興趣愛好等信息,也能夠推測用戶下一時間出現(xiàn)的地址,這威脅著用戶的人身安全。
用戶查詢的內(nèi)容中包含了個人信息,可能會導致個人隱私的泄露。查詢內(nèi)容本身不具有用戶隱私信息,但是可以通過關聯(lián)技術,挖掘出用戶的個人信息。用戶如果將查詢內(nèi)容進行模糊處理,則無法得到準確的結果,從而造成服務質量下降。
由于軌跡數(shù)據(jù)的特征和軌跡隱私保護的內(nèi)涵,造成了軌跡隱私保護方法只能采用集中式架構和分布式架構[1]。同時,軌跡隱私保護系統(tǒng)對位置服務器的存儲、計算性能要求較高。下面對各種結構分別進行描出,并討論優(yōu)缺點。
集中式架構也稱為中心服務器架構,它有三個部分:用戶端、位置匿名服務器(可信的第三方)和LBS 服務平臺(location-based services platform,LSP)組成,集中式架構示意圖如圖1所示。
圖1 集中式架構
用戶端將位置信息和查詢內(nèi)容發(fā)送給位置匿名服務器,位置匿名服務器按照特定的隱私保護規(guī)則對用戶端的查詢請求進行保護,并將隱私保護后的查詢內(nèi)容發(fā)送到LSP,LSP 根據(jù)接收到內(nèi)容進行查詢,并將結果集發(fā)送到位置匿名服務器,位置匿名服務器將該用戶的查詢結果求精后發(fā)送給用戶。集中式架構具有很好的隱私保護效果,且減小了用戶端隱私保護和數(shù)據(jù)處理的負擔。缺點:無法保證引入第三方的可信度;大量的計算分布在匿名服務器上,可能會成為系統(tǒng)性能瓶頸;在現(xiàn)實生活中,部署大量的匿名服務器具有一定的難度。
分布式架構由用戶端和LSP 構成,分布式架構示意圖如圖2所示。
圖2 分布式架構
用戶端使用點對點協(xié)議進行通信,形成滿足要求的匿名集,并以匿名集的形式發(fā)送到LSP,LSP 接收到某個固定用戶端的查詢請求,隨后將結果集返回給固定用戶端。分布式架構具有較好的隱私效果,無須依賴第三方,但是,對匿名組內(nèi)的用戶信任度較高,一旦其中一個用戶是惡意用戶,則整個匿名組的信息都會被泄露。
軌跡隱私保護根據(jù)用戶查詢請求到達LSP 方式的不同,將隱私保護技術分為:假軌跡、軌跡泛化、軌跡抑制、軌跡擾亂。在此將針對各類方法進行闡述與分析。
假軌跡隱私保護方法指的是由用戶的客戶端生成k-1 條假軌跡,與真實軌跡構成軌跡集進行發(fā)布。文獻[2]根據(jù)某一時刻位置和軌跡數(shù)量,提出了隨機法和旋轉法的假軌跡生成方案。當生成假軌跡沒有考慮到路網(wǎng)環(huán)境和移動對象的運行模式,假軌跡則不能保護軌跡數(shù)據(jù)的隱私安全。針對上述問題,文獻[3]提出了基于時空關聯(lián)的假軌跡隱私保護方法,從時間可達性、方向相似性和出入度3 個方面綜合考慮相鄰位置請求的時空關系。針對未考慮到用戶所處的背景信息,文獻[4]和文獻[5]提出根據(jù)歷史查詢概率通過重力模型和萬有引力定律模型計算出用戶位置轉移概率,充分地考慮到移動用戶的行為模式。假軌跡隱私保護方法機制簡單,計算量小,不需要第三方代理,且能保留完整的軌跡信息。
軌跡泛化中最流行的方法是軌跡k 匿名方法。軌跡k-匿名指的是由匿名服務器篩選出k-1 條其他用戶軌跡與真實軌跡組成軌跡集,使得k-1 條軌跡與真實軌跡無法區(qū)分,實現(xiàn)保護真實軌跡。文獻[6]在每個時刻選擇泛化區(qū)域時需要滿足該區(qū)域中有其他k-1 個用戶存在,以達到k-匿名保護。文獻[7]在文獻[6]的基礎上,考慮了用戶的移動方向和速度來最小化泛化區(qū)域。文獻[8]提出NWA(Never Walk Alone,NWA)方法,利用軌跡聚類和空間轉移實現(xiàn)(k,δ)-anonymity。NWA 方法在形成軌跡K 匿名集,要求軌跡的起始點都相同,在現(xiàn)實生活中很少能滿足這樣的要求,文獻[9]對此進行了改進,提出了W4M 方法,采用EDR 距離計算兩軌跡之間的距離。文獻[10]結合路網(wǎng)環(huán)境,使用貪心算法將軌跡k-匿名問題轉換成為無向圖k-node 劃分問題。該方法使用戶可個性化定義隱私保護度,實現(xiàn)比較簡單,但是計算量比較大,容易遭受推理攻擊。
軌跡抑制隱私保護方法指的是根據(jù)真實位置的敏感程度或者頻繁地、選擇性地刪除或者抑制發(fā)布。主要分為兩個方面:實時發(fā)布位置抑制和歷史軌跡發(fā)布抑制。文獻[11]基于軌跡頻率提出了兩種解決方案,對有問題的軌跡添加假數(shù)據(jù)或者抑制有問題的軌跡;以及對有問題的軌跡采用特定局部抑制法。文獻[12]基于網(wǎng)絡環(huán)境抑制軌跡數(shù)中位置的發(fā)布,提高軌跡數(shù)據(jù)的利用率。文獻[13]通過抑制敏感位置的發(fā)布以及通過統(tǒng)計用戶訪問率,選擇用戶訪問率最大的非敏感位置替代敏感位置發(fā)布。該類方法實現(xiàn)簡單、易造成信息丟失、數(shù)據(jù)的可用性降低的問題,具有局限性,因此不能保證發(fā)布的數(shù)據(jù)具有一定的價值。
以上三種隱私保護模型都是基于一定的背景知識,若背景知識改變或已被攻擊者掌握,那么這些方法將不再適用于隱私保護。因此,亟須一種不受背景知識影響,且具有良好隱私保護效果的技術。Dwork[14]首次提出差分隱私(differential privacy,DP),差分隱私保護技術不需要考慮攻擊者所擁有的背景知識,也不受某條數(shù)據(jù)變化的影響。因此,迅速成為學者們關注的重點,并成為隱私保護領域的研究熱點。
軌跡擾動隱私保護指的是利用差分隱私將軌跡上的真實位置擾動后發(fā)布。文獻[15]在前綴樹結構的基礎上,首次提出了差分隱私和軌跡隱私相結合的發(fā)布。為了提高軌跡數(shù)據(jù)的可用性,文獻[16]提出基于變長n-grams 模型。文獻[17]將馬爾科夫博弈與差分隱私相結合,為了更準確地找出需要保護的位置點,并采取相應的保護措施。文獻[18]考慮到地理空間分布,采用馬爾科夫概率轉移矩陣計算兩位置之間的聯(lián)系,提出了一種基于時空相關性的保護方法。
位置服務的應用在人們生活中已經(jīng)變得無處不在,目前,主要分為以下幾類:
基于位置服務通過定位獲得用戶的具體位置,才可以實現(xiàn)相應的增值服務。如車載GPS 定位、新浪微博、釘釘打卡簽到、位置導航等都采用了定位服務。
該服務主動或被動向用戶提供有價值的信息。當用戶到達陌生的地點時,可通過該服務查詢附近餐館、電影院、停車場等興趣點,或者由服務提供商給用戶主動推送消息。
隨著移動設備的普及,社交軟件成為人與人之間溝通的主要方式。如QQ、微信、抖音等軟件根據(jù)位置查找附近好友功能,甚至好友出現(xiàn)在附近時會提示用戶。
智慧管理服務主要體現(xiàn)在智慧交通和智慧城市。智慧交通可根據(jù)車載GPS 定位,分析出車輛分布情況,使得用戶及時了解道路現(xiàn)狀,并提出更好的出行路線。智慧城市通過對人群和物流的位置信息監(jiān)控,在發(fā)現(xiàn)異常后,可及時采取行動。
對用戶的實時位置進行統(tǒng)計分析,提前捕捉危險信息,及時向用戶提供避險方式,而當緊急情況發(fā)生后,公共安全服務主動并準確地提供受害人的位置,以便實施救援。如發(fā)現(xiàn)洪水、地震、臺風等惡劣天氣,則會向周圍群眾預警;110、119、120 等緊急救援。
隨著移動終端及其無線定位技術的快速發(fā)展,LBS 在多個領域產(chǎn)生了軌跡數(shù)據(jù),由于軌跡數(shù)據(jù)中包含很多個人隱私信息。因此,研究者對軌跡數(shù)據(jù)的保護越來越關注,提出不少的軌跡隱私保護方法,在一定程度上起到了對軌跡隱私的保護作用,但是,越來越多的攻擊方法同樣被開發(fā)出來,使得軌跡隱私保護方法需要不斷進行改進。文章分析并討論了軌跡隱私泄露的對象、系統(tǒng)架構,隱私保護方法、應用領域等方面??偟膩碚f,要徹底保護軌跡隱私不被攻擊者攻擊,還需進一步的研究與探索。