秦寶東,李媛媛,余沛航
(西安郵電大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,陜西 西安 710121)
機(jī)器學(xué)習(xí)[1]是一種使用歷史數(shù)據(jù)訓(xùn)練出模型,然后通過對(duì)模型輸入新的數(shù)據(jù)來進(jìn)行預(yù)測(cè)的方法。在當(dāng)今的大數(shù)據(jù)時(shí)代,機(jī)器學(xué)習(xí)技術(shù)取得了突破性的進(jìn)展,在無人駕駛汽車、垃圾郵件過濾等領(lǐng)域應(yīng)用廣泛,在醫(yī)療診斷領(lǐng)域也有著良好的發(fā)展前景[2]。然而,機(jī)器學(xué)習(xí)本身面臨著許多安全與隱私問題[3-4]。模型訓(xùn)練需要大量的訓(xùn)練數(shù)據(jù),其預(yù)測(cè)的準(zhǔn)確性與訓(xùn)練數(shù)據(jù)的多少以及數(shù)據(jù)質(zhì)量相關(guān)。訓(xùn)練數(shù)據(jù)通常包含諸如個(gè)人工作、愛好、身份信息和家庭狀況等涉及到個(gè)人隱私的信息,必須利用密碼技術(shù)進(jìn)行保護(hù)[5]。如果將這些信息以明文的形式傳輸,一旦被泄露,可能會(huì)造成嚴(yán)重后果。而且,大量訓(xùn)練數(shù)據(jù)的計(jì)算全部交給服務(wù)器完成,可能會(huì)超出服務(wù)器的計(jì)算能力,從而導(dǎo)致整個(gè)系統(tǒng)效率減慢甚至系統(tǒng)崩潰。
在早期的工作中,機(jī)器學(xué)習(xí)隱私保護(hù)主要重視模型訓(xùn)練階段數(shù)據(jù)的隱私保護(hù),如基于差分隱私[6]、(全)同態(tài)加密[7-8]和安全多方計(jì)算[9]等密碼技術(shù)的安全機(jī)器學(xué)習(xí)模型。除了保護(hù)訓(xùn)練數(shù)據(jù)的隱私,近年來,越來越多的學(xué)者更加關(guān)注隱私保護(hù)的機(jī)器學(xué)習(xí)分類研究,特別是用戶特征向量、分類模型和預(yù)測(cè)結(jié)果的隱私保護(hù)[10-11]。
2015年,Bost等[10]研究了超平面分割(Hyperplane Decision)、樸素貝葉斯(Na?ve Bayes)和決策樹(Decision Trees)等3種分類模型的隱私預(yù)測(cè)協(xié)議,主要使用半同態(tài)加密技術(shù)實(shí)現(xiàn)協(xié)議中的加、乘、比較等基本運(yùn)算。但是,對(duì)于決策樹模型,需要將決策樹模型表示成一個(gè)高次多項(xiàng)式函數(shù),并使用效率較低的全同態(tài)加密技術(shù)實(shí)現(xiàn)密文數(shù)據(jù)上的高次多項(xiàng)式運(yùn)算。2016年1月,Gilad-Bachrach等[11]提出一種基于同態(tài)加密的深度學(xué)習(xí)隱私保護(hù)方案用于醫(yī)療系統(tǒng)中,對(duì)患者病歷中的敏感信息進(jìn)行保護(hù)。醫(yī)院將患者的信息加密后發(fā)送給服務(wù)器,服務(wù)器對(duì)加密數(shù)據(jù)進(jìn)行預(yù)測(cè),并將預(yù)測(cè)結(jié)果返回給醫(yī)院進(jìn)行解密使用,該方案在MNIST(Mixed National Institute of Standards and Technology database)數(shù)據(jù)集上訓(xùn)練的準(zhǔn)確率為98.95%,不但保證了準(zhǔn)確性和安全性,同時(shí)也實(shí)現(xiàn)了較高的吞吐量。同年7月,Wu等[12]利用不經(jīng)意傳輸協(xié)議和加法半同態(tài)加密技術(shù)替代全同態(tài)加密實(shí)現(xiàn)Bost等人的決策樹隱私預(yù)測(cè)協(xié)議,從而提高了協(xié)議的效率。但是Wu等人的協(xié)議需要將決策樹模型發(fā)送給用戶,在發(fā)送給用戶之前,服務(wù)器需要先對(duì)決策樹模型進(jìn)行隨機(jī)化并且轉(zhuǎn)化為完全二叉樹,從而增加了用戶與服務(wù)器之間的通信及計(jì)算開銷。 2017年,Tai等[13]改進(jìn)了Wu等人協(xié)議的效率,提出一種基于線性函數(shù)的決策樹隱私保護(hù)查詢協(xié)議,用線性函數(shù)取代高次多項(xiàng)式函數(shù)表示決策樹模型,并利用路徑權(quán)重是否為零判斷二叉樹葉子節(jié)點(diǎn)是否包含分類結(jié)果,從而降低決策樹預(yù)測(cè)協(xié)議的總體運(yùn)行時(shí)間。但是,當(dāng)決策節(jié)點(diǎn)稀疏時(shí),該協(xié)議需要用戶與服務(wù)器交互兩輪,用戶端的計(jì)算效率并沒有提高。
除了解決用戶和模型提供者之間的隱私預(yù)測(cè)協(xié)議,還有一部分工作將用戶特征向量和決策模型同時(shí)外包給兩個(gè)云服務(wù)器來實(shí)現(xiàn)隱私預(yù)測(cè)協(xié)議[14-15]。該類協(xié)議一般通過秘密拆分和安全計(jì)算解決協(xié)議中的一些常規(guī)運(yùn)算,而不需要同態(tài)加密方案,因此效率一般較高。但是,該類協(xié)議需要引入可信密鑰中心預(yù)分配一些秘密信息到兩個(gè)服務(wù)器,從而保護(hù)用戶數(shù)據(jù)和預(yù)測(cè)模型的隱私性。針對(duì)基于線性函數(shù)的決策樹隱私保護(hù)查詢協(xié)議存在的不足之處,擬提出一種云計(jì)算輔助的高效決策樹隱私保護(hù)查詢協(xié)議,以期在一定程度上改善客戶端的計(jì)算和通信開銷。該協(xié)議包含用戶、決策服務(wù)器和云計(jì)算輔助服務(wù)器等3個(gè)實(shí)體。以醫(yī)療系統(tǒng)為例,協(xié)議的用戶是擁有一些疾病特征向量的患者,決策服務(wù)器是擁有一個(gè)決策樹分類模型的醫(yī)院。首先,用戶利用云計(jì)算輔助服務(wù)器的公鑰將自身的疾病特征向量加密后安全地傳送給醫(yī)院。其次,醫(yī)院和云計(jì)算輔助服務(wù)器通過運(yùn)行比較協(xié)議,計(jì)算出決策樹中每條路徑的權(quán)重和,將該權(quán)重和利用云計(jì)算輔助服務(wù)器的公鑰進(jìn)行加密,而相應(yīng)的分類結(jié)果用云計(jì)算輔助服務(wù)器的公鑰和用戶的公鑰進(jìn)行雙重加密,并將密文發(fā)送給云計(jì)算輔助服務(wù)器。再次,云計(jì)算輔助服務(wù)器通過判斷每條路徑的權(quán)重和是否為零,將正確的分類結(jié)果部分解密后返回給用戶。最后,用戶利用自己的私鑰恢復(fù)出正確的分類結(jié)果。
同態(tài)加密是一種加密形式,用戶對(duì)密文進(jìn)行特定運(yùn)算得到的結(jié)果仍然是密文,且和對(duì)明文進(jìn)行相同運(yùn)算后再加密得到的結(jié)果具有相同的分布,其分為全同態(tài)和半同態(tài)兩種形式。半同態(tài)加密是指已知兩個(gè)密文E(e,m1)和E(e,m2),用戶可以計(jì)算出明文m1+m2的密文E(e,m1+m2)。下面給出同態(tài)加密的形式化定義。
定義1一個(gè)(加法)同態(tài)加密方案包含以下4個(gè)概率多項(xiàng)式時(shí)間算法并滿足正確性和同態(tài)性。
1)系統(tǒng)參數(shù)生成算法S(1λ)。輸入安全參數(shù)λ,輸出系統(tǒng)參數(shù)s=S(1λ)。無特殊說明外,其他算法都將s作為其輸入?yún)?shù)的一部分。
2)密鑰生成算法G(s)。輸入系統(tǒng)參數(shù)s,輸出公鑰e和私鑰d,其中公鑰定義了消息空間M和密文空間C。
3)加密算法E(e,m)。輸入公鑰e和消息空間上的一個(gè)消息m,輸出密文c=E(e,m)。無特殊說明外,[m]e表示消息m在公鑰e下的密文。當(dāng)公鑰明確時(shí),可省略其下標(biāo),簡(jiǎn)記為[m]。
4)解密算法D(d,c)。輸入私鑰d和密文c,輸出明文m=D(d,c)。
正確性對(duì)于任意系統(tǒng)參數(shù)s,密鑰(e,d)←G(s)和消息m∈M,則有
D[d,E(e,m)]=m
同態(tài)性對(duì)于任意消息m1,m2∈M及其密文c1和c2,存在一個(gè)多項(xiàng)式時(shí)間算法H,則H(c1,c2)輸出一個(gè)密文c并滿足D(d,c)=m1+m2。
LEE[16](Lifted ElGamal Encryption)同態(tài)加密方案在DDH(Decisional Diffie-Hellman)假設(shè)下滿足不可區(qū)分選擇明文攻擊安全性,即語義安全性,具體構(gòu)造如下。
1)系統(tǒng)參數(shù)生成算法S(1λ)。λ選取一個(gè)循環(huán)群(,p,g),其中p和g分別是群的階和生成元,輸s=(,p,g)。
(c1,c2)=(gr,hrgm)
H([m1],[m2])=(grc1,1c1,2,hrc2,1c2,2)
顯然,H([m1],[m2])≡[m1+m2]。
下面介紹雙重LEE加密方案滿足的3個(gè)性質(zhì)。
性質(zhì)1交換加密順序,其密文是等價(jià)的,即兩個(gè)密文的解密結(jié)果一樣,表示為
[[m]e1]e2=[[m]e2]e1
根據(jù)性質(zhì)1,將消息m的雙重LEE加密簡(jiǎn)記為[[m]]。
性質(zhì)2雙重LEE加密方案滿足同態(tài)性,即已知消息m1和m2的雙重加密密文,存在算法H1計(jì)算消息m1+m2的雙重加密密文,即
H1([[m1]],[[m2]])≡[[m1+m2]]
性質(zhì)3已知消息m1在公鑰e1下的LEE密文[m1]e1、消息m2和公鑰e2,存在算法H2計(jì)算消息m1+m2的雙重LEE加密密文,即
H2([m1]e1,m2)≡[[m1+m2]]
類似地,已知公鑰e1和e2下的兩個(gè)密文[m1]e1和[m2]e2,則存在算法H3計(jì)算消息m1+m2的雙重LEE加密密文,即
H3([m1]e1,[m2]e2)≡[[m1+m2]]
2008年,Damg?rd、Geisler和Kr?igaard提出一種安全比較協(xié)議[17](簡(jiǎn)稱DGK安全比較協(xié)議)。該協(xié)議假設(shè)用戶A和用戶B分別持有t比特的正整數(shù)x和y,并且A擁有一對(duì)同態(tài)加密算法的公私鑰(e,d),通過運(yùn)行DGK安全比較協(xié)議,B將獲得加密后的比較結(jié)果,即[b]=[(x 圖1 DGK安全比較協(xié)議運(yùn)行過程 [x]表示對(duì)x按比特加密的結(jié)果,即 [x]=([xt-1],…,[x1],[x0]) PvtCmpA(d,c)算法的具體步驟如下。 輸入私鑰d和密文向量c=(ct-1,…,c1,c0)。 輸出bA。 步驟1對(duì)于任意0≤i≤t-1,利用私鑰d計(jì)算密文ci的解密結(jié)果mi←D(d,ci)。 步驟2如果存在解密結(jié)果滿足mi=0,則返回bA=1。 步驟3如果所有解密結(jié)果都不滿足mi=0,則返回bA=1。 PvtCmpB([x],y)算法的具體步驟如下。 輸出c和bB。 步驟1選擇一個(gè)隨機(jī)比特bB∈{0,1}。 步驟2令s=1-2bB。 步驟4輸出密文向量c=(ct-1,…,c1,c0)和隨機(jī)比特bB。 決策樹是一種常見的機(jī)器學(xué)習(xí)模型。一個(gè)決策樹模型包含若干中間節(jié)點(diǎn)(決策節(jié)點(diǎn))和葉節(jié)點(diǎn)(分類結(jié)果)。每個(gè)決策節(jié)點(diǎn)具有一個(gè)決策陷門值yi,每個(gè)葉節(jié)點(diǎn)具有一個(gè)分類值vj。因此,一個(gè)決策樹可以用所有決策節(jié)點(diǎn)的限門值構(gòu)成的決策向量y=(y1,y2,…,ym)和相應(yīng)的分類結(jié)果向量v=(v1,v2,…,vl)表示,其中m和l分別為決策節(jié)點(diǎn)和葉節(jié)點(diǎn)的數(shù)量。當(dāng)決策樹是一個(gè)滿二叉樹時(shí),決策節(jié)點(diǎn)和葉子節(jié)點(diǎn)的數(shù)量滿足關(guān)系l=m+1。決策樹模型的輸入是一組特征值向量,記作x=(x1,x2,…,xn),其中n是特征值的數(shù)量,輸出是某一分類結(jié)果vi。決策樹模型示例如圖2所示,該模型示例包含m=4個(gè)決策節(jié)點(diǎn)和l=m+1=5分類結(jié)果。 圖2 決策樹模型示例 圖2中,特征向量包含3個(gè)特征值,即輸入特征向量x=(6,8,10),根據(jù)模型,輸出分類結(jié)果v5。在明文狀態(tài)下,通過比較特征值和決策節(jié)點(diǎn)值,很容易判斷出分類結(jié)果。但是,這樣會(huì)泄露輸入的特征向量信息。通過DGK安全比較協(xié)議,決策模型持有者僅能獲取比較結(jié)果,如b=(x 云計(jì)算輔助的高效決策樹隱私保護(hù)查詢協(xié)議包含決策服務(wù)器D、用戶U和云輔助服務(wù)器C等3個(gè)實(shí)體。以醫(yī)療系統(tǒng)為例,決策服務(wù)器(醫(yī)院)擁有一套訓(xùn)練好的疾病預(yù)測(cè)模型,用戶(患者)具有某種疾病的特征值并期望利用預(yù)測(cè)模做出疾病診斷,其具體工作模式如圖3所示。 圖3 協(xié)議工作模式 假設(shè)每個(gè)特征向量包含n個(gè)特征值,決策樹是一個(gè)滿二叉樹,即包含m個(gè)決策節(jié)點(diǎn)和l=m+1個(gè)葉子節(jié)點(diǎn)。令(x1,x2,…,xn)∈n和(y1,y2,…,ym)∈m分別表示特征向量和所有決策節(jié)點(diǎn)的限門值。每個(gè)特征值和決策限門值不超過t比特。用戶和云輔助服務(wù)器分別擁一對(duì)LEE同態(tài)加密方案的公鑰和私鑰,記作(eU,dU)和(eC,dC)。該協(xié)議的詳細(xì)執(zhí)行步驟如下。 步驟1用戶利用云輔助服務(wù)器的公鑰將特征向量的每個(gè)元素按比特加密,并通過安全信道將加密結(jié)果[x1]C,[x2]C,…,[xn]C傳送給決策服務(wù)器。 步驟2對(duì)于每個(gè)決策節(jié)點(diǎn)元素yi,令xj表示相應(yīng)的特征值,其中1≤i≤m,1≤j≤n。決策服務(wù)器執(zhí)行算法(ci,bi,0)←PvtCmpB([xj],yi)并將密文c1,c2,…,cm發(fā)送給云輔助服務(wù)器。 步驟3對(duì)于每個(gè)密文ci,云輔助服務(wù)器首先利用算法PvtCmpA(dC,ci)計(jì)算共享比特bi,1,然后利用自己的公鑰加密每個(gè)共享比特bi,1,最后將密文[b1,1]C,[b2,1]C,…,[bm,1]C發(fā)送給決策服務(wù)器。 步驟4當(dāng)收到密文[b1,1]C,[b2,1]C,…,[bm,1]C后,決策服務(wù)器進(jìn)行以下計(jì)算。 (a)對(duì)于任意決策節(jié)點(diǎn)1≤i≤m,利用bi,0和密文[bi,1]C計(jì)算比較結(jié)果bi=bi,0⊕bi,1的密文,即[bi]C←[bi,0⊕bi,1]C。令決策節(jié)點(diǎn)i的左分支和右分支權(quán)重分別為wi,L=[1-bi]C和wi,R=[bi]C。 (b)對(duì)于任意葉節(jié)點(diǎn)Lk(1≤k≤l),計(jì)算從根節(jié)點(diǎn)到該葉節(jié)點(diǎn)路徑權(quán)重之和Pk。 最后,決策服務(wù)器按上述排序結(jié)果發(fā)送給云輔助服務(wù)器。 假設(shè)用戶、決策服務(wù)器和云輔助服務(wù)器都是誠實(shí)可信但好奇的,通過協(xié)議,3個(gè)實(shí)體能夠獲取以下信息。 1)用戶可以提交任意(加密后的)特征向量給決策服務(wù)器,并從云輔助服務(wù)器獲取正確的決策結(jié)果。 2)決策服務(wù)器可以獲取任意特征向量的密文以及比較結(jié)果的密文。 3)云輔助服務(wù)器可以獲取算法PvtCmpB輸出的密文以及所有從根節(jié)點(diǎn)到葉節(jié)點(diǎn)路徑權(quán)重和的密文和對(duì)應(yīng)分類結(jié)果的密文。 此外,任意實(shí)體可以監(jiān)聽其他實(shí)體之間通信的內(nèi)容,即模擬外部攻擊者和單一實(shí)體共謀情況。協(xié)議的隱私性意味著用戶僅能獲取決策結(jié)果,而決策服務(wù)器和云輔助服務(wù)器不能夠獲取用戶特征向量和分類結(jié)果的任何信息,除了特征向量的維數(shù)和長(zhǎng)度。同時(shí),云輔助服務(wù)器不能獲取決策服務(wù)器的分類模型信息。 定理1若LEE同態(tài)加密方案是語義安全的,DGK安全比較協(xié)議是隱私保護(hù)的,并且決策服務(wù)器與云輔助服務(wù)器之間不共謀,則上述決策樹查詢協(xié)議是隱私保護(hù)的。 證明在協(xié)議的步驟1中,用戶的特征向量用云輔助服務(wù)器的公鑰加密后通過安全信道將加密結(jié)果傳遞給決策服務(wù)器。盡管云輔助服務(wù)器擁有解密私鑰,但是利用安全信道的語義安全性,云輔助服務(wù)器等外部用戶無法獲取用戶和決策服務(wù)器之間通信的真實(shí)信息,即特征向量的密文[x1]C,[x2]C,…,[xn]C,保證用戶特征向量的語義安全性。決策服務(wù)器盡管可以獲取特征向量的密文,但是沒有云輔助服務(wù)器的解密密鑰。根據(jù)LEE方案的語義安全性,決策服務(wù)器無法從特征向量的密文中獲取任何有用信息。因此,用戶與決策服務(wù)器之間的通信內(nèi)容不會(huì)泄露用戶特征向量的信息。協(xié)議中步驟2、步驟3和步驟4(a),相當(dāng)于在云輔助服務(wù)器和決策服務(wù)器之間執(zhí)行了一次DGK安全比較協(xié)議,根據(jù)DGK比較協(xié)議的安全性,決策服務(wù)器僅能獲取比較結(jié)果的密文,即[bi]C根據(jù)加密方案的語義安全性,決策服務(wù)器從該密文中獲取不到bi的任何有用信息。云輔助服務(wù)器僅能獲取比較結(jié)果的隨機(jī)拆分結(jié)果,即共享比特bi,1。 總之,通過上述決策查詢協(xié)議,用戶可以正確地獲取分類結(jié)果,而不會(huì)獲取其他決策模型的其他信息。決策服務(wù)器除了獲取用戶特征向量的長(zhǎng)度,也不會(huì)獲取特征值的其他信息。云輔助服務(wù)器除了能夠獲取決策模型的葉子節(jié)點(diǎn)數(shù)量,也不會(huì)獲取決策模型以及用戶特征向量的其他任何信息。 為了分析所提決策樹隱私查詢協(xié)議的性能,將其與基于線性函數(shù)的決策樹隱私保護(hù)查詢協(xié)議[13]進(jìn)行對(duì)比。令n和t分別表示特征向量的維數(shù)和每個(gè)特征值的比特長(zhǎng)度,m表示決策樹中的決策節(jié)點(diǎn)個(gè)數(shù)。將一個(gè)實(shí)體到另一個(gè)實(shí)體的單向通信記作半次交互,雙向通信記作1次交互。假設(shè)同態(tài)加密方案定義在循環(huán)群(,p,g)上,用群元素的數(shù)量表示通信量。用戶、決策服務(wù)器和云輔助服務(wù)器端的理論計(jì)算復(fù)雜度及用戶特征向量和決策模型泄露的信息對(duì)比如表1所示,各實(shí)體間協(xié)議交互次數(shù)和通信量對(duì)比如表2所示。 表1 兩種協(xié)議計(jì)算復(fù)雜度對(duì)比 表2 兩種協(xié)議通信量對(duì)比 通過表1和表2可知,所提協(xié)議利用云輔助服務(wù)器可以將文獻(xiàn)[13]協(xié)議中用戶端的O(mt)計(jì)算量轉(zhuǎn)移至云輔助服務(wù)器,從而將用戶端的計(jì)算復(fù)雜度從O((n+m)t)降至O(nt)。此外,用戶與決策服務(wù)器的交互次數(shù)也由2次降至0.5次,同時(shí)增加0.5次用戶與云輔助服務(wù)器的交互。因此,在所提協(xié)議中,用戶參與的協(xié)議交互次數(shù)僅為1次,比文獻(xiàn)[13]協(xié)議減少了50%。在信息泄露方面,兩種協(xié)議都不會(huì)泄露用戶特征向量的任何信息,而僅會(huì)泄露決策模型中決策節(jié)點(diǎn)的數(shù)量信息,即m。在通信量方面,用戶參與的通信量之和為(2nt+2)個(gè)群元素,比文獻(xiàn)[13]協(xié)議減少了(2mt+6m+2)個(gè)群元素??偠灾?,借助云輔助服務(wù)器,所提協(xié)議不僅能夠降低用戶端的計(jì)算和通信復(fù)雜度,而且可以減少用戶參與協(xié)議的交互次數(shù)。 下面利用鳶尾花和乳腺癌兩種數(shù)據(jù)集訓(xùn)練的決策樹模型檢測(cè)上述兩種協(xié)議的實(shí)際效率。鳶尾花品種預(yù)測(cè)模型和乳腺癌預(yù)測(cè)模型分別如圖4和圖5所示。在鳶尾花品種預(yù)測(cè)模型中,特征向量維數(shù)為n=10,決策樹深度為d=5,決策節(jié)點(diǎn)數(shù)量為m=7,分類結(jié)果有“setosa”“versicolor”和“virginnica”等3種。在乳腺癌預(yù)測(cè)模型中,特征向量維數(shù)為n=15,決策樹深度為d=9,決策節(jié)點(diǎn)數(shù)量為m=20,分類結(jié)果有“benign”和“malignant”兩種。實(shí)驗(yàn)環(huán)境為一臺(tái)電腦配備Inter(R) Core(TM) i5-4210M (2.6 GHz)處理器,4G運(yùn)行內(nèi)存和64位Windows 10操作系統(tǒng)。令p=2q+1是一個(gè)1 024比特的素?cái)?shù),其中q是一個(gè)強(qiáng)素?cái)?shù)。實(shí)驗(yàn)選取的El-Gamal加密方案定義在模p生成的q階循環(huán)子群上。兩種協(xié)議的實(shí)驗(yàn)結(jié)果如表3所示。 圖4 鳶尾花分類模型 圖5 乳腺癌分類模型 表3 兩種協(xié)議的實(shí)驗(yàn)結(jié)果 由表3可以看出,對(duì)于不同的數(shù)據(jù)集,由于訓(xùn)練出來的模型參數(shù)不同,使得兩種協(xié)議的具體時(shí)間和通信開銷并不相同,這與表1和表2中的理論分析結(jié)果是一致的。對(duì)于鳶尾花數(shù)據(jù)集,由于決策節(jié)點(diǎn)數(shù)量和特征向量維數(shù)較小,所提協(xié)議的用戶計(jì)算時(shí)間與文獻(xiàn)[13]協(xié)議區(qū)別并不明顯。但是,當(dāng)決策節(jié)點(diǎn)數(shù)量和特征向量維數(shù)較高時(shí),如乳腺癌數(shù)據(jù)集,文獻(xiàn)[13]協(xié)議的用戶計(jì)算時(shí)間為11.27 s,而所提僅需要將近一半的時(shí)間,即6.61 s。在通信量方面,對(duì)于鳶尾花數(shù)據(jù)集,所提協(xié)議用戶與兩個(gè)服務(wù)器的通信量之和為0.16 MB,而文獻(xiàn)[13]協(xié)議需要0.22 MB。對(duì)于乳腺癌數(shù)據(jù)集,所提協(xié)議用戶的通信量比文獻(xiàn)[13]協(xié)議的用戶通信量減少0.23 MB,約為53%。 借助云計(jì)算技術(shù),提出一種高效的決策樹隱私保護(hù)查詢協(xié)議。該協(xié)議通過同態(tài)加密技術(shù)保護(hù)用戶特征向量信息不會(huì)泄露給決策服務(wù)器和云輔助服務(wù)器,同時(shí)保護(hù)決策樹信息不會(huì)泄露給用戶和云輔助服務(wù)器。性能分析結(jié)果表明,通過云輔助服務(wù)器,該協(xié)議用戶的計(jì)算時(shí)間和通信量較以往相關(guān)工作都有一定程度的改進(jìn)。但是,決策服務(wù)器和云輔助服務(wù)器之間的效率仍然較低。下一步,將考慮如何在保證協(xié)議安全的前提下提高服務(wù)器的效率以及如何將決策樹模型安全、高效地外包給云輔助服務(wù)器。1.3 決策樹模型
2 協(xié)議設(shè)計(jì)
2.1 協(xié)議描述
2.2 正確性分析
2.3 安全性分析
3 性能分析
4 結(jié)語