趙峰
摘要:近些年來,全世界范圍內(nèi)的移動(dòng)互聯(lián)網(wǎng)以及云計(jì)算技術(shù)都得到了飛速發(fā)展,網(wǎng)絡(luò)上隨時(shí)隨地都會(huì)出現(xiàn)諸多的各方面數(shù)據(jù),在這大數(shù)據(jù)時(shí)代背景下,有必要加強(qiáng)對(duì)于分布式隱私保護(hù)聚類挖掘算法展開深入分析。本文簡(jiǎn)略介紹了大數(shù)據(jù)挖掘安全技術(shù)以及隱私數(shù)據(jù)保護(hù)技術(shù),并對(duì)基于大數(shù)據(jù)的分布式隱私保護(hù)聚類挖掘算法展開了全面探索,旨在提升數(shù)據(jù)隱私保護(hù)水平的同時(shí),還能達(dá)到高精確度的大數(shù)據(jù)聚類挖掘效果。
關(guān)鍵詞:大數(shù)據(jù);隱私保護(hù);數(shù)據(jù)挖掘;分布式環(huán)境
中圖分類號(hào):TP393? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)04-0201-03
在當(dāng)今時(shí)代下,大數(shù)據(jù)已經(jīng)成為高校分析以及處理網(wǎng)絡(luò)中海量數(shù)據(jù)的重要環(huán)節(jié)。經(jīng)過調(diào)查發(fā)現(xiàn),我國在挖掘算法方面已經(jīng)取得了較為良好的研究成果,但事實(shí)上仍存在諸多不利因素對(duì)于數(shù)據(jù)安全以及隱私保護(hù)效率的提升起到了一定的制約作用。因此,有必要加強(qiáng)對(duì)該方面技術(shù)的重視,并在實(shí)踐過程中對(duì)其進(jìn)行逐漸地優(yōu)化與完善。
1相關(guān)技術(shù)
1.1大數(shù)據(jù)挖掘安全技術(shù)
大數(shù)據(jù)挖掘主要指的是不斷提取以及挖掘在當(dāng)下不規(guī)則并且海量數(shù)據(jù)中的各類知識(shí),當(dāng)各個(gè)站點(diǎn)開展挖掘大數(shù)據(jù)任務(wù)的過程中,應(yīng)著重考慮各站點(diǎn)所普遍存在地?cái)?shù)據(jù)隱私泄露問題。從目前來看,對(duì)于隱私保護(hù)的數(shù)據(jù)挖掘算法包含著諸多種研究類別,分別為序列模式、聚類和分類以及關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法。與此同時(shí),應(yīng)及時(shí)采取相關(guān)措施,強(qiáng)化對(duì)于各站點(diǎn)的規(guī)范和約束管理,此舉能夠切實(shí)保障在開展大數(shù)據(jù)挖掘的同時(shí),盡量降低泄露數(shù)據(jù)隱私的概率[1]。
近些年,全世界范圍內(nèi)對(duì)于上述研究已經(jīng)取得了一定的成果,例如:部分學(xué)者在半誠實(shí)模型和惡意模型的基礎(chǔ)條件下,針對(duì)挖掘數(shù)據(jù)算法過程中隱私保護(hù)的數(shù)據(jù)挖掘隱私保護(hù)安全性以及執(zhí)行效率展開了詳細(xì)研究。除此以外,還對(duì)于在隱私保護(hù)以及數(shù)據(jù)安全基礎(chǔ)上的序列數(shù)據(jù)挖掘技術(shù)進(jìn)行了深入探究,設(shè)計(jì)出了一種能夠高效實(shí)現(xiàn)重要序列屬性隱藏的數(shù)據(jù)挖掘算法,這對(duì)于高效落實(shí)對(duì)于數(shù)據(jù)挖掘的隱私保護(hù)起到了重要意義。還有部分學(xué)者以分布式環(huán)境為基礎(chǔ),對(duì)基于隱私保護(hù)的數(shù)據(jù)額挖掘算法進(jìn)行了科學(xué)系統(tǒng)的設(shè)計(jì),這有助于緩解當(dāng)前在進(jìn)行數(shù)據(jù)挖掘過程中普遍存在的數(shù)據(jù)安全以及隱私泄露等問題。
1.2隱私數(shù)據(jù)保護(hù)技術(shù)
在進(jìn)行大數(shù)據(jù)挖掘時(shí),其所涉及的是包含諸多同個(gè)人隱私相關(guān)的隱私數(shù)據(jù),例如個(gè)人社交動(dòng)態(tài)資料、工作資料、財(cái)產(chǎn)和病歷信息資料以及個(gè)人基本資料等,大數(shù)據(jù)挖掘隱私保護(hù)不僅要確保能夠在保護(hù)隱私數(shù)據(jù)不竊取其他站點(diǎn)隱私數(shù)據(jù)的基礎(chǔ)上進(jìn)行各個(gè)站點(diǎn)的數(shù)據(jù)挖掘工作,同時(shí),還要在充分考慮的其數(shù)據(jù)挖掘所達(dá)到的相關(guān)效果,確保其能夠同相關(guān)預(yù)期效果相符合。從上述研究中可以看出,一般來說,研究大多會(huì)將數(shù)據(jù)加密的隱私保護(hù)技術(shù)應(yīng)用于數(shù)據(jù)挖掘典型算法之中,通過使用全同態(tài)加密技術(shù),開展針對(duì)原始數(shù)據(jù)的加密處理,便可以直接在挖掘數(shù)據(jù)的過程中直接處理加密密文,不僅能夠確保隱私數(shù)據(jù)自身的安全性與穩(wěn)定性,還可以提升數(shù)據(jù)挖掘的實(shí)際效率。同態(tài)加密技術(shù)的應(yīng)用,并不會(huì)對(duì)原始數(shù)據(jù)進(jìn)行解密,而是會(huì)通過大數(shù)據(jù)挖掘算法的應(yīng)用,直接開展針對(duì)加密數(shù)據(jù)地復(fù)雜計(jì)算操作,并且可以得到同數(shù)據(jù)加密之前同樣地結(jié)果。部分學(xué)者在該方面進(jìn)行了深入的研究,其對(duì)全同態(tài)加密技術(shù)展開了探索,同時(shí),對(duì)在全同態(tài)加密算法運(yùn)行效率基礎(chǔ)上的改進(jìn)方案進(jìn)行了研發(fā)設(shè)計(jì),也得到了較為豐碩的研究成果。除此以外,部分學(xué)者在對(duì)全同態(tài)加密技術(shù)進(jìn)行研究地基礎(chǔ)上,提出了一種新型的全同態(tài)加密方法,這使得流行的外包計(jì)算以及云計(jì)算都能夠再實(shí)現(xiàn)對(duì)于全同臺(tái)加密技術(shù)的應(yīng)用。
此文中的觀點(diǎn)為,針對(duì)加法和乘法來說,任何一種加密算法都具有能夠與之相適應(yīng)的同態(tài)操作:
基于此便可以將其看作是全同態(tài)加密算法。
2分布式數(shù)據(jù)挖掘概述
2.1水平劃分的數(shù)據(jù)
水平劃分的數(shù)據(jù)是分布式數(shù)據(jù)挖掘的重要組成部分,其主要指的是在各個(gè)不同的站點(diǎn)中對(duì)擁有相同屬性的信息進(jìn)行搜集。但事實(shí)上其實(shí)體存在一定的差異性,例如:不同超市所搜集的雜貨店信息。以具有不同的信用卡信息的兩個(gè)數(shù)據(jù)庫為例,其全局?jǐn)?shù)據(jù)庫所搜集的信息具有不同的實(shí)體,但擁有者相同的屬性[2]。
2.2垂直劃分的數(shù)據(jù)
除了水平劃分的數(shù)據(jù)以外,垂直劃分的數(shù)據(jù)也是分布式數(shù)據(jù)挖掘的重要組成部分,其主要指的是不同站點(diǎn)對(duì)于各類相同實(shí)體集合信息的收集,但其屬性的集合存在差異,具體可以從以下角度出發(fā)進(jìn)行理解。例如在某個(gè)數(shù)據(jù)庫中,其中一個(gè)為相同實(shí)體使用手機(jī)的信息,另一個(gè)則為人的醫(yī)療信息。從數(shù)據(jù)庫中可以看出,相關(guān)工作人員可以通過采用相關(guān)挖掘方法對(duì)全局?jǐn)?shù)據(jù)庫進(jìn)行分析,以便于充分獲取患者的實(shí)際情況。該模式的描述如下所示:有k個(gè)集合P1.P2.…,Pk,n個(gè)事務(wù),基于此需要對(duì)n個(gè)與事物有關(guān)的信息進(jìn)行相應(yīng)的信息搜集工作。
2.3任意劃分的數(shù)據(jù)
任意劃分的數(shù)據(jù)是分布式數(shù)據(jù)挖掘的重要組成部分,其主要指的是搜集各不同站點(diǎn)中屬性也不相同的相關(guān)信息。以兩方參與方為例,分為A.B兩方,二者各自所擁有的數(shù)據(jù)能夠形成一個(gè)整體的數(shù)據(jù)庫,該數(shù)據(jù)庫中包含n個(gè)對(duì)象,可以采用m個(gè)屬性來表示對(duì)每個(gè)對(duì)象金鑫表示,參與方A對(duì)于每個(gè)對(duì)象d來說都有著部分屬性集,與此同時(shí),參與方B則會(huì)擁有剩下的。通常情況下來說,可以將從水平劃分以及垂直劃分的角度來看,可以將其數(shù)據(jù)當(dāng)作是進(jìn)行任一分布的特殊形式。
3基于大數(shù)據(jù)的分布式隱私保護(hù)聚類挖掘算法
在當(dāng)前分布式環(huán)境之下,若是基于大數(shù)據(jù)開展數(shù)據(jù)挖掘工作,有必要將各站點(diǎn)聯(lián)合起來進(jìn)行對(duì)于聚類結(jié)果的計(jì)算,有可能會(huì)導(dǎo)致數(shù)據(jù)安全及隱私泄露的問題。聚類挖掘主要指的是一種機(jī)器學(xué)習(xí)算法,其本身具有無指導(dǎo)的特點(diǎn),數(shù)據(jù)要在其原有的實(shí)際特征的基礎(chǔ)上經(jīng)過多次迭代,進(jìn)而形成各不相同的族群。在實(shí)際操作過程中可以通過多種方式實(shí)現(xiàn)聚類挖掘,包括基于模型的聚類、層次聚類、基于密度的聚類、劃分聚類以及基于神經(jīng)網(wǎng)絡(luò)的聚類等等。筆者在文中主要將會(huì)針對(duì)K-means算法進(jìn)行詳細(xì)講述,該算法本身是劃分聚類的一種數(shù)據(jù)挖掘算法,文中主要使用的是同態(tài)加密技術(shù)以及公鑰加密技術(shù)創(chuàng)新提出了一PPDK-means,其是在水平劃分基礎(chǔ)上的一種聚類挖掘方法[3]。
各參與方在分布式的環(huán)境中應(yīng)先展開針對(duì)相關(guān)數(shù)據(jù)的同態(tài)加密工作,然后再充分利用安全信道,實(shí)現(xiàn)對(duì)于原有數(shù)據(jù)高效共享的目的,接下來便需要展開對(duì)于加密數(shù)據(jù)的進(jìn)一步精密計(jì)算,然后便需要在某個(gè)參與方中通過同態(tài)加密技術(shù)的應(yīng)用高質(zhì)量地完成對(duì)于計(jì)算結(jié)果的加密。開展相應(yīng)的解密工作,然后向全體參與方廣播最終的實(shí)際計(jì)算結(jié)果,相關(guān)工作人員應(yīng)當(dāng)注意,實(shí)際所要開展的計(jì)算工作應(yīng)當(dāng)在經(jīng)過加密的數(shù)據(jù)基礎(chǔ)上進(jìn)行,在加密后的數(shù)據(jù)中,準(zhǔn)誠信第三方需要開展相應(yīng)的聚類挖掘工作,這樣一來便可以切實(shí)降低出現(xiàn)對(duì)于用戶明文數(shù)據(jù)進(jìn)行直接使用實(shí)踐出現(xiàn)的概率,切實(shí)保障好數(shù)據(jù)本身的安全性以及穩(wěn)定性,以免出現(xiàn)半程新的參與方直接獲取相關(guān)其他參與方的隱私數(shù)據(jù),進(jìn)而達(dá)到對(duì)隱私進(jìn)行高質(zhì)量的保護(hù)的目的。
經(jīng)過相關(guān)的實(shí)驗(yàn)證明以及理論分析發(fā)現(xiàn),該算法可以既可以保障好數(shù)據(jù)隱私,還能夠獲取精確地聚類結(jié)果,有著較強(qiáng)的應(yīng)用價(jià)值。
3.1問題描述
3.1.1分布式環(huán)境中的聚類算法
在以往所使用的數(shù)據(jù)儲(chǔ)存方法中,主要是在一個(gè)數(shù)據(jù)倉庫中實(shí)現(xiàn)對(duì)于全部數(shù)據(jù)的存儲(chǔ),然后在需要使用的時(shí)候,直接在其中進(jìn)行相應(yīng)的聚類分析,進(jìn)而將有益的知識(shí)以及規(guī)律提取出來,該模式應(yīng)用的最大優(yōu)勢(shì)便在于能夠高效實(shí)現(xiàn)對(duì)于存儲(chǔ)空間的利用,減少冗長(zhǎng)繁雜的數(shù)據(jù),同時(shí)還要從全面的眼光看待問題,進(jìn)而采取相應(yīng)的措施開展針對(duì)數(shù)據(jù)的保護(hù)工作。但從目前來看,全世界范圍內(nèi)的信息技術(shù)整體發(fā)展較為迅速,在當(dāng)下的信息社會(huì)中已經(jīng)有著越來越多傳統(tǒng)行業(yè)的融入,從政治以及商業(yè)利益角度出發(fā),未來的主流模式必定是多中心分布式的數(shù)據(jù)存儲(chǔ)格局。分布式環(huán)境這一概念與集中式環(huán)境是對(duì)立的,上文對(duì)其劃分進(jìn)行了詳細(xì)分析,下面不再贅述,在本文中,筆者將會(huì)對(duì)水平劃分?jǐn)?shù)據(jù)環(huán)境中的聚類挖掘算法進(jìn)行精細(xì)化的探索。
加設(shè)分布式系統(tǒng)中存在n個(gè)站點(diǎn)Si(i=1,…,n,n≥3),每個(gè)站點(diǎn)的數(shù)據(jù)集為Di(i=1,…,n,n≥3),在每個(gè)數(shù)據(jù)集Di(i=1,…,n,n≥3)中所包含的對(duì)象個(gè)數(shù)為mi(i=1,…,n,n≥3),則聯(lián)合數(shù)據(jù)集[D=i=1nDi(i=1,…,n,n≥3)]。
在針對(duì)聯(lián)合數(shù)據(jù)集D開展相應(yīng)的聚類挖掘的過程中,務(wù)必要確保各個(gè)站點(diǎn)Si的數(shù)據(jù)集D的數(shù)據(jù)安全,這主要指的是其他站點(diǎn)無法在經(jīng)過結(jié)果推斷之后將原本的數(shù)據(jù)集Di推導(dǎo)出來,同時(shí)還要對(duì)聯(lián)合數(shù)據(jù)D所挖掘出的知識(shí)進(jìn)行掌控。確保其是真實(shí)有效的,同直接挖掘Di所得出的結(jié)果完全符合[4]。
在分布式的數(shù)據(jù)存儲(chǔ)環(huán)境中,分布式聚類挖掘算法能夠有效實(shí)現(xiàn)聚類過程,在本文中,筆者先對(duì)于數(shù)據(jù)挖掘的環(huán)境進(jìn)行假設(shè),若是其為水平分割數(shù)據(jù)集,那么將由以下幾方面內(nèi)容入手展開對(duì)于分布式聚類算法的理解。首先,應(yīng)在系統(tǒng)中選用兩級(jí)架構(gòu)。其次局部站點(diǎn)Si(i=1,…,n,n≥3)要從主站點(diǎn)發(fā)來的聚類中心出發(fā),高質(zhì)量地完成對(duì)于本地聚簇?cái)?shù)據(jù)的計(jì)算工作,并將其直接向相應(yīng)的中心站點(diǎn)進(jìn)行發(fā)送。接下來中心站點(diǎn)便要接收那些從局部站點(diǎn)所發(fā)來的聚簇結(jié)構(gòu),并進(jìn)行全局計(jì)算,判斷其是否能夠同相應(yīng)的受立案條件相符合,若是可以符合便要立即停止迭代進(jìn)程,然后輸出相應(yīng)的聚類結(jié)果。如果其并未滿足收斂條件,便要繼續(xù)進(jìn)行迭代,直至其能夠相符合。
3.1.2分布式數(shù)據(jù)挖掘中的隱私安全問題
分布式環(huán)境相比其他環(huán)境來說具有一定的特殊性,數(shù)據(jù)在其中的存儲(chǔ)有著較為分散的特性,主要是存儲(chǔ)于各個(gè)邏輯隔離站點(diǎn)以及物理隔離站點(diǎn)之中,每個(gè)站點(diǎn)其所具備的功能基本上同相關(guān)資質(zhì)單元相似,基于此,各個(gè)站點(diǎn)中的數(shù)據(jù)便有一定程度的私有特點(diǎn)。在開展數(shù)據(jù)挖掘工作的過程中,應(yīng)聯(lián)合各個(gè)參與方對(duì)聚類結(jié)果以及分類模型展開共同計(jì)算,在該過程中極有可能會(huì)出現(xiàn)泄露隱私的現(xiàn)象。本文主要從局部站點(diǎn)以及中心站點(diǎn)兩級(jí)結(jié)構(gòu)入手展開數(shù)據(jù)挖掘,在進(jìn)行數(shù)值計(jì)算以及結(jié)果共享的過程中,是數(shù)據(jù)隱私最容易被侵犯的兩個(gè)環(huán)節(jié),所以有必要加強(qiáng)對(duì)以下幾方面內(nèi)容的認(rèn)識(shí)強(qiáng)化保護(hù)數(shù)據(jù)隱私。首先,加強(qiáng)對(duì)于各個(gè)站點(diǎn)自身隱私數(shù)據(jù)安全性的保障,以免出現(xiàn)其他參與方直接獲取他方數(shù)據(jù)的情況。其次,應(yīng)當(dāng)確保傳輸過程中數(shù)據(jù)的安全性,以免數(shù)據(jù)被其他半誠信以及被惡意的攻擊者截獲。最后,要加強(qiáng)對(duì)于聚類挖掘過程的重視,注重對(duì)于該過程中隱私數(shù)據(jù)安全的保護(hù),降低在進(jìn)行合作計(jì)算時(shí),出現(xiàn)數(shù)據(jù)隱私泄露現(xiàn)象的可能性。
3.2分布式k-means聚類挖掘算法
標(biāo)準(zhǔn)的分布式k-means聚類算法。
K-means算法本身屬于一種聚類挖掘算法,其是在距離基礎(chǔ)上實(shí)現(xiàn)的,在對(duì)于相似度的評(píng)級(jí)方面,將距離看作是相應(yīng)的評(píng)級(jí)指標(biāo),深入分析各聚簇對(duì)象的實(shí)際距離以及均值計(jì)算相似度,相似度會(huì)隨著距離的減小而逐漸增加。采用K-means算法的最基本的目的便是對(duì)聚簇內(nèi)相似度最低以及最高的聚類結(jié)果進(jìn)行獲取,通常情況下,可以通過使用歐幾里得距離、閔可夫斯基距離以及曼哈頓距離三種方法進(jìn)行距離度量,這三種算法之間都是衡量個(gè)體之間的差異的。其中,在運(yùn)用歐幾里得距離度量方法的過程中,其最終的結(jié)果會(huì)收到各指標(biāo)不同單位可讀的影響,所以在實(shí)際運(yùn)用中應(yīng)注重對(duì)其進(jìn)行標(biāo)準(zhǔn)化,若是其距離越大,便會(huì)使得其個(gè)體之間產(chǎn)生較大的差異性。除此以外,其他二者同歐幾里得距離基本上相似。
標(biāo)準(zhǔn)的歐式距離公式如下所示:
3.3正確性與安全性分析
3.3.1正確性
針對(duì)從站點(diǎn)的計(jì)算結(jié)果,筆者主要從同態(tài)加密系統(tǒng)以及RSA公鑰加密系統(tǒng)兩方面出發(fā)進(jìn)行加密,以此確保各個(gè)參與挖掘的各方數(shù)據(jù)在半誠信的環(huán)境當(dāng)中不會(huì)出現(xiàn)被泄露的問題。因?yàn)橥瑧B(tài)加密系統(tǒng)的加密操作并不會(huì)對(duì)最終的聚類結(jié)果產(chǎn)生影響,而RSK公鑰加密系統(tǒng)則只能應(yīng)用于對(duì)密鑰的加密,所以在本文所提出的算法可以實(shí)現(xiàn)對(duì)于挖掘結(jié)果的精確獲得。因?yàn)榇嬖谙鄳?yīng)的解密過程,所以該算法有著較高的時(shí)間復(fù)雜度,RSA公鑰加密的過程是最為耗時(shí)的,但是其智慧應(yīng)用在特定的部分進(jìn)行加密,并非是整個(gè)明文,所以可以在一定程度上減少指數(shù)運(yùn)算,在這樣的條件下便會(huì)適當(dāng)增多所要執(zhí)行相關(guān)挖掘操作的時(shí)間。在實(shí)際開展挖掘工作的過程中,如果其中心站點(diǎn)中的計(jì)算過程過于繁雜,那么便可以將其整體的計(jì)算過程輸送至云端進(jìn)行,這樣便可以減少其復(fù)雜程度,提高計(jì)算效率。
3.3.2安全性
在安全性方面,該算法主要分為三個(gè)層次對(duì)數(shù)據(jù)隱私進(jìn)行保護(hù):
相關(guān)工作人員在面對(duì)局部聚類結(jié)果的過程中應(yīng)靈活使用通態(tài)加密技術(shù)開展相應(yīng)的加密工作。因?yàn)镽本身是一個(gè)隨機(jī)數(shù),所以在實(shí)踐過程中可以僅將其看作是拒不保存的聚類結(jié)果,中心站的具體職能在于對(duì)于相關(guān)已經(jīng)完成好加密工作的局部數(shù)據(jù)的獲取,根據(jù)其實(shí)際應(yīng)用的各個(gè)方面來看,中心站無法實(shí)現(xiàn)對(duì)于其他與局部數(shù)據(jù)有關(guān)任何信息的獲取。當(dāng)中心站點(diǎn)做好計(jì)算工作之后,便會(huì)直接發(fā)送中間結(jié)果至局部站點(diǎn)處。接下來開展對(duì)其的解密工作,然后再將其反送至中心站點(diǎn),以便于開展后續(xù)的運(yùn)算工作,此舉能夠避免中心站點(diǎn)解密相關(guān)參與方隱私數(shù)據(jù)的問題,對(duì)于隱私數(shù)據(jù)的安全性有著較強(qiáng)的保障作用。所以本文中所提出的算法具有一定的安全性。
4結(jié)論
綜上所述,從當(dāng)下的時(shí)代背景來看,信息科技在飛速地發(fā)展以及進(jìn)步中使得各個(gè)領(lǐng)域都在實(shí)踐過程中積累了越來越多地?cái)?shù)據(jù),而數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠開展針對(duì)數(shù)據(jù)的二次利用以及分類管理工作。從目前來看,當(dāng)下最為重要的數(shù)據(jù)存儲(chǔ)模式便是分布式,過去的相關(guān)數(shù)據(jù)挖掘技術(shù)正在逐漸由原本的環(huán)境向當(dāng)下分布式的環(huán)境中進(jìn)行遷移。這使其逐漸出現(xiàn)了諸多安全問題。與此同時(shí),在進(jìn)行數(shù)據(jù)挖掘時(shí),部分持有者并不愿意披露數(shù)據(jù),而保護(hù)隱私數(shù)據(jù)的挖掘算法則能夠有效緩解該類問題。
參考文獻(xiàn):
[1] 鄧甜甜,熊蔭喬,何賢浩.一種基于時(shí)序性告警的新型聚類算法[J].計(jì)算機(jī)科學(xué),2020,47(S1):440-443,473.
[2] 楊濤,張紅梅,王家樂,等.大數(shù)據(jù)下數(shù)據(jù)流聚類挖掘算法的優(yōu)化分析[J].物聯(lián)網(wǎng)技術(shù),2019,9(8):58-60,64.
[3] 左國才.基于大數(shù)據(jù)的分布式隱私保護(hù)聚類挖掘算法研究[J].智能計(jì)算機(jī)與應(yīng)用,2018,8(6):57-60.
[4] 徐東,李賢,張子迎,等.面向聚類挖掘的個(gè)性化隱私保護(hù)算法[J].哈爾濱工程大學(xué)學(xué)報(bào),2018,39(11):1779-1785.
[5] 姚禹丞,宋玲,鄂馳.同態(tài)加密的分布式K均值聚類算法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017,27(2):81-85.
【通聯(lián)編輯:光文玲】