劉 琨,王???王 輝,周 超,劉沛騫
(河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 焦作 454002)
隨著移動(dòng)通信網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,它在改變?nèi)藗兩罘绞降耐瑫r(shí),也給用戶提供了豐富的信息服務(wù)和信息資源.用戶在社交網(wǎng)絡(luò)平臺(tái)、移動(dòng)定位終端、LBS(Location Based Services)服務(wù)[1]以及其他移動(dòng)信息通信網(wǎng)絡(luò)服務(wù)中產(chǎn)生的各項(xiàng)信息也日益增加.用戶在享受網(wǎng)絡(luò)信息服務(wù)的同時(shí),也面臨隱私泄露的安全問題.例如,2019年Greenbone Networks分析了全球約2300個(gè)在線PACC服務(wù)系統(tǒng),其中包含52個(gè)國家中2400多萬份患者數(shù)據(jù)記錄,數(shù)據(jù)中所包含的用戶身份信息、出生日期、放射圖像、主治醫(yī)生等信息都可以在網(wǎng)頁輕松下載;迪拜打車巨頭Careem Networks在2018年遭受網(wǎng)絡(luò)攻擊,導(dǎo)致1400萬用戶位置數(shù)據(jù)、姓名、手機(jī)號等都遭到泄露.K-匿名[2]是在位置隱私保護(hù)中常用的方法之一.K-匿名分為集中式和分布式,集中式是在用戶和LBS服務(wù)商中間添加可信第三方,該可信第三方來完成匿名處理和查詢.差分隱私在位置隱私保護(hù)中運(yùn)用也十分廣泛.2006年Dwork[3]等人提出差分隱私模型,差分隱私運(yùn)用數(shù)學(xué)模型,結(jié)合Laplace機(jī)制以及指數(shù)機(jī)制、高斯機(jī)制等可以對原始數(shù)據(jù)進(jìn)行加噪處理,從而達(dá)到隱私保護(hù)目的.陳[4]等利用k-means聚類算法進(jìn)行數(shù)據(jù)抽樣,借助差分隱私對軌跡數(shù)據(jù)進(jìn)行干擾,在不同位置對隱私預(yù)算進(jìn)行平均分配,缺乏對不同敏感位置的區(qū)分保護(hù).Yin[5]等人根據(jù)位置點(diǎn)訪問頻率來判斷敏感度,該方法由于缺少對用戶偏好的分類判斷,難以滿足用戶個(gè)性化的位置隱私保護(hù)需求.為了有效解決上述軌跡隱私保護(hù)中存在的問題,本文提出了一種基于OTM概率相似性度量的差分隱私算法(Differential privacy algorithm based on the OTM probabilistic similarity measure,DPBO).簡單來說,根據(jù)每個(gè)真實(shí)位置點(diǎn)的敏感度,來分配隱私預(yù)算,并加入相應(yīng)的噪聲.通過在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,證明了該方案使隱私保護(hù)強(qiáng)度增強(qiáng),且時(shí)間開銷更低.
本文各章節(jié)安排如下:第2節(jié)主介紹國內(nèi)外位置隱私保護(hù)研究現(xiàn)狀;第3節(jié)列出本文中所需的問題定義.第4節(jié)描述了本文提出的基于OTM概率相似性度量的隱私預(yù)算分配方法以及基于該方法的位置隱私保護(hù)方法.第5節(jié)對實(shí)驗(yàn)結(jié)果進(jìn)行了分析.第6節(jié)總結(jié)了全文.
定義1.差分隱私
有兩個(gè)數(shù)據(jù)集X和X′,當(dāng)X和X′結(jié)構(gòu)相同,有且只有一條數(shù)據(jù)不相同時(shí),則稱X和X′為相鄰數(shù)據(jù)集.F是相鄰數(shù)據(jù)集上的隨機(jī)查詢算法,M是算法F在相鄰數(shù)據(jù)集X和X′上任意的輸出結(jié)果,若F滿足公式(1),則稱F滿足ε-差分隱私.
(1)
其中ε表示隱私預(yù)算,在一般差分隱私中,ε往往取一個(gè)很小的值,例如0.01、0.1、ln2等,ε值越小,隱私保護(hù)程度就越高.
定義2.全局敏感度
假設(shè)任意函數(shù)F,數(shù)據(jù)集X和X′分別為兩個(gè)輸入數(shù)據(jù)集,輸出為d維實(shí)向量,滿足公式(2):
G=maxx,x′‖f(x)-f(x′)‖i,i=1
(2)
其中‖f(x)-f(x′)‖i,i=1表示f(x)和f(x′)的一階范數(shù)距離.不同的查詢函數(shù)具有不同的全局敏感度,全局敏感度和數(shù)據(jù)集無關(guān).
定義3.Laplace機(jī)制
Laplace分布[13]是統(tǒng)計(jì)學(xué)中的一種連續(xù)的概率分布.而在位置隱私領(lǐng)域,Laplace機(jī)制可以通過在位置查詢結(jié)果f(x)中添加噪聲來滿足ε-差分隱私,從而保護(hù)位置隱私.
給出數(shù)據(jù)集X,且假設(shè)存在一個(gè)靈敏度為ΔG的函數(shù),使得在輸入數(shù)據(jù)集為X的情況下,輸出結(jié)果為d維實(shí)向量Rd,隨機(jī)算法M(X)=f(X)+Y提供ε-差分隱私保護(hù),其中Y~Lap(ΔG/ε)為隨機(jī)噪聲,服從參數(shù)為ΔG/ε的Laplace分布.
(3)
公式(3)是拉普拉斯概率密度函數(shù),其中當(dāng)u=0時(shí),尺度參數(shù)越大,概率分布越均勻,尺度參數(shù)越小,概率分布越集中.噪聲添加量和ΔG的大小成正相關(guān),噪聲添加量和ε呈負(fù)相關(guān).ΔG越小,加入噪聲的量越少,算法效果更好.
定義4.TR概率特征
對于有i個(gè)位置的軌跡TR,設(shè)軌跡TR={tr1,tr2,tr3,…,tri},其中tr1,tr2,tr3,…,tri代表軌跡TR中的位置點(diǎn).用戶User訪問tri的概率為Pv(訪問概率),User從tri-1到tri的概率為Ps(轉(zhuǎn)移概率),則PA(tri)=(V,S)為tri的概率特征,其中V=Pv(tri),S=Ps(tri).
定義5.PPTLT范圍度量
PPTLT范圍度量指的是對兩個(gè)不同的位置點(diǎn)從轉(zhuǎn)移概率Ps、訪問概率Pv、時(shí)間T、地理位置LT4個(gè)方面進(jìn)行評判,若相似度在設(shè)定閾值之間,則代表兩個(gè)位置點(diǎn)相似.設(shè)地理坐標(biāo)為LT(Lo,La),其中其中Lo為經(jīng)度,La為緯度設(shè)歷史軌跡H={h1,h2,h3,…,hi},其中h1,h2,h3,…,hi為歷史軌跡中的位置點(diǎn),若hi和tri滿足以下關(guān)系,則他們具有位置點(diǎn)相似性:
|Pv(hi)-Pv(tri)|≤ΔPv
(4)
|Ps(hi)-Ps(tri)|≤ΔPs
(5)
|T(hi)-T(tri)|≤ΔT
(6)
|La(hi)-La(tri)|≤ΔLa&&|Lo(hi)-Lo(tri)|≤ΔLo
(7)
其中ΔPv為訪問概率之差的閾值,ΔPs為轉(zhuǎn)移概率之差的閾值,ΔT為時(shí)間差的閾值,ΔLa和ΔLo分別是緯度和經(jīng)度的差的閾值.
定義6.位置點(diǎn)庫LPLh
設(shè)存儲(chǔ)位置點(diǎn)的數(shù)據(jù)庫為LPLh,(ID,PA,LT(Lo,La),T)為位置點(diǎn)庫中的一條數(shù)據(jù),ID為位置點(diǎn)存儲(chǔ)入庫時(shí)的id,每條數(shù)據(jù)都有唯一id,PA為位置點(diǎn)概率特征,LT(Lo,La)為位置點(diǎn)的經(jīng)緯度信息,T為數(shù)據(jù)申請時(shí)的時(shí)間.
定義7.OTM概率相似性度量
本文中概率相似性度量針對一個(gè)位置點(diǎn)集合與單個(gè)位置進(jìn)行概率比對,即一對多(One To Many,OTM)概率相似性度量.設(shè)單個(gè)位置點(diǎn)為r0,設(shè)位置點(diǎn)集合為X={x1,x2,x3,…,xi},i=n,下列式子表示該位置點(diǎn)集合與單個(gè)位置點(diǎn)r0的概率相似度指數(shù):
(8)
SML(r0,X)代表r0與X的相似度指數(shù),λ是一個(gè)可變常數(shù),用于規(guī)范化相似度指數(shù),把相似度指數(shù)控制在[0,1]范圍之內(nèi).
在位置隱私保護(hù)中,位置點(diǎn)信息的存儲(chǔ)整合是至關(guān)重要.本文使用加權(quán)有向圖[14]來整合存儲(chǔ)位置點(diǎn)信息.設(shè)有向圖為Gr,Gr=(N(R,SET),E,Ve,Vn),N代表Gr中所有節(jié)點(diǎn)集合,即N={n1,n2,n3,…,ni},ni表示Gr中的i個(gè)節(jié)點(diǎn),N中的R代表真實(shí)位置點(diǎn),即R={r1,r2,r3,…,ri},SET代表與R點(diǎn)相似的位置點(diǎn)集合,即SET={set1,set2,set3,…,seti},如圖1所示.
圖1 圖節(jié)點(diǎn)結(jié)構(gòu)Fig.1 Figure node structure
其中r包含:
(ID,PA,LT(Lo,La),T)即r(ID,PA,LT(Lo,La),T),其中:
set={q1(ID,PA,LT(Lo,La),T),
q2(ID,PA,LT(Lo,La),T),
q3(ID,PA,LT(Lo,La),T),…,
qi(ID,PA,LT(Lo,La),T)}
代表set中有i個(gè)點(diǎn),每個(gè)點(diǎn)都是位置點(diǎn)數(shù)據(jù)庫中的記錄.E為Gr中所有邊S的集合,即E={e1,e2,e3,…,ei},圖中一共有i條邊.Ve和Vn分別為邊與節(jié)點(diǎn)的權(quán)值的集合,即
Ve={ve1,ve2,ve3,…,ve4},Vn={vn1,vn2,vn3,…,vni}.加權(quán)有向圖結(jié)構(gòu)如圖2所示.
圖2 加權(quán)有向圖Fig.2 Weighted directed graph
基于差分隱私的位置保護(hù),需要根據(jù)不同位置的敏感程度需求來分配隱私預(yù)算,這個(gè)位置敏感度判斷方法需要位置信息、查詢申請時(shí)間、概率特征等信息的支持.本文使用有向圖來直觀地反應(yīng)用戶的位置信息以及敏感度信息,本算法的整體流程如圖3所示.
圖3 DPBO算法流程圖Fig.3 Flow chart of DPBO algorithm
為了對真實(shí)軌跡LTr進(jìn)行位置點(diǎn)敏感度評判,本文采取從歷史軌跡中選取位置信息,對歷史位置點(diǎn)信息庫進(jìn)行遍歷,利用PPTLT范圍度量選取出與LTr中各位置點(diǎn)相似的位置點(diǎn)集,從而為下面計(jì)算LTr位置點(diǎn)敏感度做鋪墊.下面是具體流程:
1)真實(shí)軌跡LTr采樣.對LTr進(jìn)行位置點(diǎn)分割,把軌跡向量LTr={r1,r2,r3,…,ri}中位置點(diǎn)ri以位置點(diǎn)庫LPLh格式存放,即ri(ID,PA,LT(Lo,La),T),設(shè)鏈表Listr,對LTr取模,即|LTr|=M0,為Listr分配M0空間長度,位置向量ri中ID按軌跡中起始點(diǎn)到終點(diǎn)的順序依次升序排列,把Listr先存入緩沖區(qū)buf,buf中計(jì)數(shù)參數(shù)a=1,起始a=0,根據(jù)LTr位置邏輯,構(gòu)建圖Gr=(N(r,set),ED,Ve,VN),遍歷緩沖區(qū),若a>0,則選擇Listr數(shù)據(jù),為其分配M0個(gè)節(jié)點(diǎn),有向邊的指向?yàn)檐壽E中位置點(diǎn)邏輯方向,將Listr數(shù)據(jù)存放在N節(jié)點(diǎn)的r區(qū)域中,LTr采樣完成.
3)檢索圖節(jié)點(diǎn),保證LTr中ri與HTset中的seti對應(yīng)關(guān)系正確.根據(jù)軌跡LTr的邏輯,對應(yīng)圖中進(jìn)行深度優(yōu)先搜索,每個(gè)搜索節(jié)點(diǎn),都進(jìn)行公式(4)~公式(7)的再次判斷,進(jìn)行LTr與HTset的對應(yīng)驗(yàn)證.
本文使用差分隱私進(jìn)行位置隱私保護(hù),在對隱私預(yù)算ε分配時(shí),需要根據(jù)位置點(diǎn)敏感度進(jìn)行按需分配,所以本節(jié)對軌跡LTr中位置點(diǎn)ri進(jìn)行敏感度評判,為后文分配ε做準(zhǔn)備,敏感度評判方法如下:
將HTset={set1,set2,set3,…,seti}先依次存入鏈表List′中,建立一個(gè)二維數(shù)組a[x][y],x代表行,y代表列,一行存儲(chǔ)一個(gè)seti,seti中每一個(gè)位置點(diǎn)數(shù)據(jù)在一個(gè)列中,例如a[0][3]代表set1中第4個(gè)位置點(diǎn)數(shù)據(jù),a[4][2]代表set5中第3個(gè)位置點(diǎn)數(shù)據(jù).將LTr={r1,r2,r3,…,ri}中每個(gè)ri與對應(yīng)的seti進(jìn)行OTM概率相似度評判,將a[x][y]帶入公式(8),即:
經(jīng)過雙層循環(huán),得出每個(gè)ri與之對應(yīng)的seti的相似度指數(shù)SML.計(jì)算LTr中位置點(diǎn)ri與seti的概率相似度的算法如下:
輸入:真實(shí)軌跡點(diǎn)集合LTr={r1,r2,r3,…,ri},軌跡點(diǎn)個(gè)數(shù)n,緩存鏈表List′,存儲(chǔ)HTset={set1,set2,set3,…,seti}的二維數(shù)組a[x][y],規(guī)范化系數(shù)λ.
1.List′=Initialize();//初始化
2.inti,j;
3.i=x,j=y;
4.List′=LTr={r1,r2,r3,…,ri};
5.//軌跡存入緩存鏈表
6.for(i=0,j=0;i 7.for(i=1;i<=x;i++) 8. //雙重循環(huán)計(jì)算ri與seti相似度指數(shù) 10.SML0[i]=sum; 11.for(i=0;i 13.//使每個(gè)位置點(diǎn)相似度指數(shù)存入數(shù)組 14.returnSML[i]; SML[i]即是LTr={r1,r2,r3,…,ri}中每個(gè)ri與對應(yīng)的seti的概率相度性指數(shù)的集合,設(shè)為SMLI={sml1,sml2,sml3,…,smli}.smli越大說明真實(shí)位置點(diǎn)與對應(yīng)的seti越相似,表示該真實(shí)位置點(diǎn)在歷史位置中越具有普遍性,例如,某學(xué)生12:00時(shí),位置在餐廳周邊,在歷史位置集中,12:00該學(xué)生很大概率都在餐廳或餐廳周邊,所以12:00的餐廳對于該學(xué)生是極其敏感的位置點(diǎn).所以真實(shí)位置點(diǎn)smli越大即越敏感,則ΔG設(shè)定值就越高.ΔG分配策略如下:根據(jù)smli在所有SML中的百分比,按正比設(shè)定ΔG,例如,若甲位置smli占SML的25%,則該位置為1/4ΔG.假設(shè)SML為0.8,分配示意表如表1所示. 表1 OTM概率相似度與ΔG關(guān)系表Table 1 Relationship between OTM probability similarity and ΔG 本文通過4.2節(jié)來得到每個(gè)被保護(hù)位置點(diǎn)的敏感度,該部分根據(jù)敏感度的不同,分配不同的隱私預(yù)算,然后根據(jù)隱私預(yù)算,進(jìn)行加噪,使攻擊者很難對位置信息進(jìn)行攻擊. 設(shè)每個(gè)位置節(jié)點(diǎn)的敏感度為ΔGi,為了按需分配隱私預(yù)算,需要對ΔGi進(jìn)行權(quán)重計(jì)算,權(quán)重計(jì)算公式為: (9) 表2 節(jié)點(diǎn)敏感度和分配隱私預(yù)算的關(guān)系表Table 2 Relationship between node sensitivity and allocated privacy budget 分配ε與加噪流程為: 步驟1.獲取圖節(jié)點(diǎn)中的位置點(diǎn)信息,采用深度優(yōu)先遍歷,根據(jù)軌跡邏輯,取出軌跡位置點(diǎn)存入鏈表List″={r1,r2,r3,…,ri,}. 步驟2.遍歷鏈表List″,獲取節(jié)點(diǎn)ΔGi,根據(jù)不同節(jié)點(diǎn)ΔGi的值,動(dòng)態(tài)分配ε. 步驟3.成功分配ε的List″按序存入圖Gr中,每個(gè)節(jié)點(diǎn)的ε,存入節(jié)點(diǎn)權(quán)值Vn. 步驟4.深度優(yōu)先遍歷圖Gr,根據(jù)不同ε,加入相應(yīng)大小的Laplace噪聲. 步驟5.輸出加噪后的圖Gr. 輸出Gr的即為經(jīng)DPBO算法位置隱私保護(hù)處理后的格式化位置信息. 將本文基于位置相似性分析的差分隱私算法DPBO、根據(jù)簽到頻率分配隱私預(yù)算的算法Yin[5](由于文獻(xiàn)中沒有對該算法命名,則本文用作者名字命名),基于概率模型的K-匿名保護(hù)方法LRM[15],基于多匿名器的軌跡保護(hù)方法TPMA[8],進(jìn)行對比試驗(yàn).在相同實(shí)驗(yàn)環(huán)境下,對算法進(jìn)行數(shù)據(jù)可用性分析、隱私保護(hù)強(qiáng)度分析、時(shí)間開銷分析、參數(shù)對算法的性能影響分析. DPBO算法均采用Python實(shí)現(xiàn),實(shí)驗(yàn)環(huán)境是8.00GBRAM的Windows10操作系統(tǒng)和2.40GHzCPU.本文采用的實(shí)驗(yàn)數(shù)據(jù)是Checkin數(shù)據(jù)集和Geolife[16]數(shù)據(jù)集.Checkin數(shù)據(jù)集從基于LBS的社交網(wǎng)站Gowalla獲取,數(shù)據(jù)集包含由美國紐約超過49000名和洛杉磯31000名社交用戶的位置簽到信息.Geolife是由微軟亞洲研究所提供的數(shù)據(jù)集,其中包含182個(gè)志愿者提供的17621條軌跡數(shù)據(jù). 在本節(jié)中,為了評估DPBO機(jī)制的數(shù)據(jù)可用性,通過比較真實(shí)數(shù)據(jù)和發(fā)布數(shù)據(jù)的模糊查詢結(jié)果的誤差來定義.假設(shè)時(shí)間戳T發(fā)布數(shù)據(jù)的模糊查詢結(jié)果為uT,時(shí)間戳T的真實(shí)數(shù)據(jù)為kT,uT與kT之間的誤差定義為δ,該機(jī)制的總誤差定義為L. (10) (11) 選擇Geolife數(shù)據(jù)集,通過在相同地圖精度下,改變覆蓋范圍來比較DPBO算法與Yin算法、LRM算法、TPMA算法的L,從而衡量各算法的數(shù)據(jù)可用性,即相同條件下L越小,數(shù)據(jù)可用性越強(qiáng).數(shù)據(jù)結(jié)果圖如圖4所示. 圖4 各算法L隨覆蓋范圍變化關(guān)系Fig.4 Variation of L with coverage for each algorithm 隨著覆蓋范圍的擴(kuò)大,4種算法的L均呈上升趨勢.在相同覆蓋范圍內(nèi),由于Yin算法采取按簽到頻率分配ε,沒有對位置點(diǎn)進(jìn)行敏感度評判,所以L略大于DPBO算法;LRM算法對數(shù)據(jù)概率相似性以及地理相似性進(jìn)行判斷,所以LRM的L略大于Yin算法,小于TPMA算法;TPMA算法未考慮概率相似性以及地理相似性,在相同條件下L最大.綜上對比實(shí)驗(yàn),相同條件下,DPBO算法L最小,數(shù)據(jù)可用性最強(qiáng). 圖5中表明了在相同攻擊[17]算法下,隱私保護(hù)強(qiáng)度SOPP隨著不同保護(hù)強(qiáng)度等級R的變化而變化的關(guān)系.實(shí)驗(yàn)表明:隨著R的增大,所有算法的SOPP都呈下降趨勢.由于Yin算法按照簽到頻率來分配隱私預(yù)算,沒有對位置敏感度檢驗(yàn),所以SOPP值在4個(gè)算法中是最高的,隱私保護(hù)強(qiáng)度最低.LRM和TPMA算法均是對位置軌跡進(jìn)行K-匿名,但是LRM算法考慮位置信息的概率相似性以及地理相似性,所以LRM算法隱私保護(hù)強(qiáng)度SOPP優(yōu)于TPMA.DPBO算法根據(jù)概率特征,得出位置敏感度差異,進(jìn)行隱私預(yù)算分配,所以DPBO算法SOPP值明顯低于其他算法. 圖5 各算法SOPP值隨保護(hù)等級變化的規(guī)律Fig.5 Law of SOPP value of each algorithm with protection level 由于隱私保護(hù)算法都需要一定的時(shí)間進(jìn)行計(jì)算.所以假位置生成所需時(shí)間則是判斷算法性能的一個(gè)重要標(biāo)準(zhǔn).本實(shí)驗(yàn)通過對在不同隱私保護(hù)度R下,本算法與Yin算法、LRM算法、TPMA算法進(jìn)行對比實(shí)驗(yàn),對各算法的時(shí)間開銷進(jìn)行分析.圖6中表明,隨著隱私保護(hù)等級R增大,4個(gè)算法的運(yùn)行時(shí)間都增加.由于DPBO算法采用概率相似性選擇敏感位置,而Yin采用簽到頻率來判斷敏感位置,所以在相同條件下Yin的運(yùn)行時(shí)間略低于DPBO算法.由于TPMA與LRM均采用匿名來制造假位置,所以相同條件下運(yùn)行時(shí)間大于運(yùn)用差分隱私的Yin和DPBO算法,并且TPMA算法采用多匿名器方式,使得運(yùn)行時(shí)間在相同條件下4個(gè)算法中最大. 圖6 運(yùn)行時(shí)間與保護(hù)等級的變化規(guī)律Fig.6 Variation law of operation time and protection level 在本研究中,SOPP值越大,被識別位置點(diǎn)占總位置點(diǎn)的比重就越大,隱私保護(hù)程度就越低,SOPP值越小,被識別位置點(diǎn)占總位置點(diǎn)的比重就越小,隱私保護(hù)程度就越高.本研究中閾值是影響SOPP大小的重要因素,其中ΔPv、ΔPs、ΔLa和ΔLo均是本文中重要的閾值.本部分通過對閾值參數(shù)進(jìn)行控制變量實(shí)驗(yàn),分析改變不同閾值對SOPP值影響. 由圖7(a)和圖7(b)可知,SOPP根據(jù)ΔPv值的增加而逐步平穩(wěn)下降,并且下降斜率大致呈增加趨勢;隨著ΔPs值的增加,SOPP呈現(xiàn)下降趨勢,但是下降速率在逐步降低.根據(jù)圖7(c)所知,SOPP隨著ΔLa和ΔLo的增加而降低.本模塊中,SOPP都隨著ΔPv、ΔPs、ΔLa和ΔLo的增大而減少,是因?yàn)棣v、ΔPs、ΔLa和ΔLo的增大意味著相似范圍的擴(kuò)大,范圍的擴(kuò)大導(dǎo)致經(jīng)度下降,從而導(dǎo)致SOPP減小. 圖7 SOPP根據(jù)閾值參數(shù)的變化關(guān)系Fig.7 Relationship between SOPP and threshold parameters 本文利用加權(quán)有向圖收集表示歷史位置信息,通過位置點(diǎn)相似度找出歷史位置點(diǎn)與真實(shí)位置點(diǎn)的相似位置點(diǎn)集,提出DPBO算法來區(qū)分敏感度等級,通過整合加權(quán)有向圖,根據(jù)不同敏感度分配相應(yīng)隱私預(yù)算,最后運(yùn)用Laplace機(jī)制進(jìn)行加噪,從而實(shí)現(xiàn)位置隱私保護(hù).本算法在未來位置隱私保護(hù)研究中,可以解決移動(dòng)群智感知[18]中數(shù)據(jù)感知階段的位置數(shù)據(jù)保護(hù)問題,通過對感知用戶的歷史軌跡歸類,進(jìn)行對真實(shí)數(shù)據(jù)的動(dòng)態(tài)加噪,從而對感知用戶的位置數(shù)據(jù)進(jìn)行隱私保護(hù).從細(xì)節(jié)角度來看,如何更加智能化[19]、動(dòng)態(tài)化[20]、合理化為敏感位置分配隱私預(yù)算,是未來研究需要關(guān)注的重點(diǎn).4.3 分配隱私預(yù)算ε并加噪
5 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)設(shè)置
5.2 數(shù)據(jù)可用性分析
5.3 隱私保護(hù)強(qiáng)度分析
5.4 時(shí)間開銷分析
5.5 閾值對SOPP的影響
6 總 結(jié)