夏偉,蔡文婷,劉陽
(南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司, 廣州 510000)
數(shù)據(jù)聚合是對城市配電網(wǎng)信息綜合處理的重要技術(shù)手段,通過對數(shù)據(jù)聚合操作能夠降低數(shù)據(jù)采集過程中的通信費(fèi)用和能量消耗。但是在數(shù)據(jù)聚合中沒有受到隱私保護(hù),致使配電網(wǎng)數(shù)據(jù)常出現(xiàn)丟失、篡改現(xiàn)場,因此,在數(shù)據(jù)隱私保護(hù)的基礎(chǔ)上,對城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合已成為目前亟需解決的問題。
針對該問題,國內(nèi)外學(xué)者研究了數(shù)據(jù)聚合算法,可以有效聚合城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)。其中,文獻(xiàn)[1]研究了基于霧計算的智能電網(wǎng)安全與隱私保護(hù)數(shù)據(jù)聚合方法,該方法利用云霧合作的加密算法對數(shù)據(jù)多層隱私保護(hù),并在霧端對數(shù)據(jù)進(jìn)行了多層融合,實現(xiàn)整個網(wǎng)絡(luò)數(shù)據(jù)的聚合;文獻(xiàn)[2]研究了霧輔助的輕量級隱私保護(hù)數(shù)據(jù)多級聚合方法,該方法利用霧協(xié)作方法收集數(shù)據(jù),采用模數(shù)性質(zhì)對數(shù)據(jù)加密,并借助三列函數(shù)設(shè)計認(rèn)證方法,實現(xiàn)數(shù)據(jù)的聚合。但是上述兩種算法在進(jìn)行數(shù)據(jù)聚合過程中,沒有受到隱私保護(hù),導(dǎo)致數(shù)據(jù)常出現(xiàn)丟失、篡改情況。文獻(xiàn)[3]研究了智能電網(wǎng)中的數(shù)據(jù)聚合方法,結(jié)合Paillier加密體制和ElGamal加密體制對智能電網(wǎng)數(shù)據(jù)進(jìn)行加密處理,并通過雙線性對技術(shù)對數(shù)據(jù)聚合。文獻(xiàn)[4]研究了一種緩解能量空洞的數(shù)據(jù)聚合算法,通過數(shù)據(jù)聚合的方式使每個節(jié)點(diǎn)發(fā)送數(shù)據(jù)時以最大的分片數(shù)進(jìn)行傳送,采用節(jié)能的方式對WSN能耗進(jìn)行優(yōu)化,以減小EH的區(qū)域,使全網(wǎng)能耗最低。但是上述兩種算法的加密性較差,導(dǎo)致數(shù)據(jù)聚合時間較長,聚合效率較低。
而隱私同態(tài)是一種直接對密文數(shù)據(jù)進(jìn)行相關(guān)運(yùn)算的加密技術(shù),能夠避免數(shù)據(jù)融合時隱私信息的泄漏,常應(yīng)用于在數(shù)據(jù)聚合方案中?;陔[私同態(tài)的這個優(yōu)點(diǎn),將其應(yīng)用到城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合中,根據(jù)重新獲取的數(shù)據(jù),并在通過密度閾值函數(shù)設(shè)置、初始聚類中心選取與網(wǎng)格聚類的步驟下完成城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合,并采用隱私同態(tài)技術(shù)對聚合后的數(shù)據(jù)進(jìn)行加密處理。通過仿真實驗可知,文中在實現(xiàn)數(shù)據(jù)聚合的同時,提高了數(shù)據(jù)的安全性,解決了傳統(tǒng)算法中存在的問題。
在進(jìn)行城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合計算之前,首先要通過電力公司數(shù)據(jù)庫,獲取保存在電力公司中的所有數(shù)據(jù),以進(jìn)行數(shù)據(jù)聚合,包括涉及到的用電資源、網(wǎng)格信息等。雖然數(shù)據(jù)庫中存有大量各類型數(shù)據(jù),但與所研究的網(wǎng)格數(shù)據(jù)相差較大,每個數(shù)據(jù)的概念與結(jié)構(gòu)也應(yīng)符合計算需求,因此要在經(jīng)過處理后的數(shù)據(jù)庫中篩選與文中相匹配的數(shù)據(jù)。首先,在大數(shù)據(jù)中找到與公共信息模型可交換的數(shù)據(jù),互相融合,得到一個基于公共信息模型(CIM模型)的結(jié)構(gòu)。然后,選擇一個最優(yōu)的鏈路,在此過程中不斷完善數(shù)據(jù)結(jié)構(gòu),為配電網(wǎng)系統(tǒng)奠定一個夯實的基礎(chǔ)。最后,對重獲的數(shù)據(jù)進(jìn)行分析,提供一個最佳的聚類方式,保證電網(wǎng)的穩(wěn)定運(yùn)行,其這個配電網(wǎng)數(shù)據(jù)重獲的過程如圖1所示。
按照圖1中的步驟分析,個別數(shù)據(jù)的交換方式仍然不能全部導(dǎo)入,格式與模型中的結(jié)構(gòu)也互相不統(tǒng)一,致使準(zhǔn)確率有些許波動。因此,需要進(jìn)行格式統(tǒng)一,從而降低數(shù)據(jù)通信開銷。
圖1 配電網(wǎng)數(shù)據(jù)重獲過程
城市配電網(wǎng)多級網(wǎng)格映射關(guān)系圖如圖2所示。城市配電網(wǎng)多級網(wǎng)格的劃分需綜合考慮供電區(qū)相對獨(dú)立性、網(wǎng)格完整性、管理便利性等因素,主要分為高壓層、目標(biāo)網(wǎng)架、中壓線路層、配電站層、配變層。
圖2 配電網(wǎng)多級網(wǎng)格映射關(guān)系圖
傳統(tǒng)的聚類算法是基于數(shù)據(jù)庫完整的情況下進(jìn)行的,而數(shù)據(jù)流的聚類是基于數(shù)據(jù)的聚類算法上的,在其他領(lǐng)域上具有廣泛的應(yīng)用,例如商業(yè)互通、網(wǎng)絡(luò)記錄的記錄與分析。
對城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)空間進(jìn)行網(wǎng)格單元劃分,每個網(wǎng)格單元中,存在多維空間s,將k維為均分成長度相等的dk段,那么在dk段中的數(shù)據(jù)集合表示為:
sk={sk1,sk2,…,sk}
(1)
d=(d1,d2,…,dn)∈m
(2)
并且約束條件[4]為:
dk∈skgt,(k=1,…,n)
(3)
式中g(shù)t為空間中的網(wǎng)格單元。若整個配電網(wǎng)中網(wǎng)格單元的總數(shù)為:
(4)
D(m,td)=λtD(m,tb)+1
(5)
式中td為時間。如果數(shù)據(jù)在時刻ta時進(jìn)入網(wǎng)格單元,其數(shù)據(jù)密度就會與時間的改變相關(guān),將其定義為:
D(d,t)=λt-ta
(6)
式中λ為流動系數(shù),且為整數(shù),一般徘徊在0~1,d代表數(shù)據(jù),tb代表某一時刻。如果網(wǎng)格單元m中數(shù)據(jù)的密集程度為D(m,t),在不同的時刻t與y的分布密度也就不同,分別如下:
(7)
(8)
當(dāng)網(wǎng)格單元的數(shù)據(jù)密度滿足Di≤D(m,t),那么就稱為密集單元,式中Zt與Zy為常量,且兩者的關(guān)系為Zt>Zy,如果滿足Dy>D(m,t)≤Dt,那么在此條件下的網(wǎng)格單元為替代網(wǎng)格單元,當(dāng)Dy>D(m,t)時,網(wǎng)格單元就為噪聲網(wǎng)格單元[5-7]。
如果噪聲單元密度不斷增大,在時刻y的密度就遠(yuǎn)遠(yuǎn)大于普通網(wǎng)格單元密度,一般都會慢慢消化網(wǎng)格中的密集數(shù)據(jù),經(jīng)過處理,就形成了一個進(jìn)化的網(wǎng)格單元,叫做進(jìn)化噪聲單元;而剩下的網(wǎng)格單元情況是本來只具有很少的數(shù)據(jù),經(jīng)過慢慢疊加[8],逐漸演變成噪聲網(wǎng)格單元,只有將噪聲網(wǎng)格單元減少到最小或是消失,才會實現(xiàn)數(shù)據(jù)的有效聚合,保留網(wǎng)格數(shù)據(jù)攜帶的信息,并且被永久儲存。
假設(shè)單元m的初始移動時間為ta,最后移動時間為tb,那么兩者的密度閾值函數(shù)[9]定義為:
(9)
基于以上函數(shù),就可以判斷單元是否是噪聲網(wǎng)格單元,集合的最小值Dmin按照時間的長短來辨別新增的網(wǎng)格數(shù)據(jù),且會隨著時間的改變而進(jìn)行自身優(yōu)化,經(jīng)過時間的淘汰[10],就可以確定密度函數(shù)的閾值,當(dāng)接收到網(wǎng)格數(shù)據(jù)后,Dmin(tb,ta)的值會立即降到最小,因此利用Dmin(tb,ta)的變化來分析網(wǎng)格單元的類型的方法不但可行且效率最高。
選取聚類中心的目的在于判斷數(shù)據(jù)之間的距離,獲取最佳聚類系數(shù),為網(wǎng)格聚類奠定基礎(chǔ)。聚類中心的選取主要與系數(shù)K相關(guān),利用其均值隨機(jī)挑選一個初始聚類中心,但其結(jié)果容易受到影響,導(dǎo)致結(jié)果會處于一個波動的范圍,假如以距離為主進(jìn)行選擇,就會出現(xiàn)分貝不同的噪聲干擾,聚類的效果并不明顯。因此在進(jìn)行初始聚類中心的選取[11]時,要準(zhǔn)確無誤地判斷數(shù)據(jù)之間的距離以解決分布的密度問題,從網(wǎng)格數(shù)據(jù)庫中選擇,在密集單元里選出一個位移最大的初始K值作為聚類中心[12],盡量將噪聲的干擾降到最低,從而提升算法的運(yùn)行效率。假設(shè)將一個密集單元作為圓心,以數(shù)據(jù)間最大距離r作為半徑,其中包含的圓形區(qū)域就叫做r-鄰域[13],按照以往的聚類實踐,r的大小通常是數(shù)據(jù)之間最大距離的二分之一。
設(shè)定一個上限閾值為p,那么在r區(qū)域中最多有p個對象,因此稱此對象為網(wǎng)格中心對象[14],而兩個多維空間之間的最佳距離為:
(10)
式中i和j為兩個不同的對象,d(i,j)為兩個數(shù)據(jù)之間的最佳距離,n為空間維度,xi1,xi2,...,xin與yi1,yi2,...,yin為n維空間中的數(shù)據(jù)。該算法是基于兩個數(shù)據(jù)之間最佳距離來計算區(qū)域中的對象總數(shù)[15],如果數(shù)量超過閾值p,就可以將其挑選出來,移動到密集單元集合D中,然后在集合中找出初始聚類中心,利用系數(shù)K進(jìn)行聚類計算。
為了使得到的效果優(yōu)于原始值[16],將網(wǎng)格內(nèi)的數(shù)據(jù)進(jìn)行分離,運(yùn)用數(shù)據(jù)之間的差異算法來進(jìn)行評價,假設(shè)一組數(shù)據(jù)X={x1,x2,...,xN},并且分成k個小組為C1,C2,...,Ck,而每一組的聚類中心分別為m1,m2,...,mk,將網(wǎng)格數(shù)據(jù)中的某一點(diǎn)與聚類中心的距離定義[17]為:
(11)
而數(shù)據(jù)間的特異性決定聚類之間的差別[18],那么將網(wǎng)格數(shù)據(jù)中的邊緣與聚類中心的距離定義為:
(12)
式中N為數(shù)據(jù)總數(shù),Cj小組的聚類中心為mi,而mj為小組中的數(shù)據(jù),d(mi,mj)為Ci與Cj之間的距離,基于以上兩個距離,得到一個有效的評價函數(shù)V(k):
(13)
由以上公式可知,只有函數(shù)的范圍保證在[-1,1]之間,當(dāng)函數(shù)的值趨近于1時,代表網(wǎng)格內(nèi)數(shù)據(jù)之間的差異性越小,聚類的效果比較明顯;當(dāng)函數(shù)的值趨近于-1時,代表聚類方法失敗,所以當(dāng)Vk的值達(dá)到最大時,其系數(shù)K就為最佳聚類系數(shù)。
在上述處理的過程上,采用網(wǎng)格數(shù)據(jù)聚合計算的方法將有限的空間分割成多個小單元[19],這些獨(dú)立的小單元各自形成了一個網(wǎng)格結(jié)構(gòu),然后數(shù)據(jù)就會依附在網(wǎng)格上進(jìn)行聚類,假設(shè)一個網(wǎng)格結(jié)構(gòu)中的數(shù)據(jù)總數(shù)上限為γ,那么超過上限的網(wǎng)格單元就是一個密集單元[20],超過一個以上的密集單元就可以將其定義為最大的網(wǎng)格單元集合。若用t代表一個聚類,將其定義為2b長的0-1串a(chǎn)1,…,a2b-1,其中2b代表密集單元的數(shù)量,i為其中的一個數(shù)據(jù),當(dāng)ai=1時,i則處于聚類之內(nèi),反之a(chǎn)i=0。文中假設(shè)數(shù)據(jù)的計量單位是“塊”,那么以塊X1,X2,...,Xi的方式達(dá)到網(wǎng)格結(jié)構(gòu),每一塊都可以在本身存在的網(wǎng)格內(nèi)進(jìn)行轉(zhuǎn)換,利用隨機(jī)抽樣的方式抽取數(shù)據(jù),那么其目的就是完成設(shè)定的目標(biāo),數(shù)據(jù)自行聚類,結(jié)果為R1,R2,...,Rn,其中R代表每塊數(shù)據(jù)X1,X2,...,Xi聚類后的結(jié)果,n代表數(shù)量。
為了保證每個聚類都不丟失其中的主要數(shù)據(jù)信息,在其進(jìn)行移動時就可以隨機(jī)保存多個密集單元[21],因此所有信息都會被密集單元所攜帶,并將信息繼續(xù)傳遞下去。假設(shè)在t時刻完成的數(shù)據(jù)為X1,總數(shù)為m,此時將密集單元進(jìn)行定義:如果從t時刻為初始聚類,計算每一個網(wǎng)格單元μ中的數(shù)據(jù)密度,那么其密度滿足:
den(u)>γ(t-i+1)m
(14)
式中γ為數(shù)據(jù)密度上限。單個數(shù)據(jù)的聚類思想是如以上描述的方式,而整個數(shù)據(jù)集合的數(shù)據(jù)流聚類的核心就是先容納所有數(shù)據(jù)塊X1經(jīng)過,將其攜帶的數(shù)據(jù)都有規(guī)律的放入相應(yīng)的網(wǎng)格結(jié)構(gòu)中,然后再計算其中數(shù)據(jù)的密度,并找出密集單元;然后搜索得到最大的密集集合,在原有的聚類基礎(chǔ)上,重新將數(shù)據(jù)流去除、新增和組合[22]。而對于重新加入的網(wǎng)格單元μ,將會出現(xiàn)三種情況:如果周圍沒有與之相呼應(yīng)的單元,那么就要新建一個密集單元,互相結(jié)合得到新的聚類;若存在與其相對應(yīng)的網(wǎng)格單元ω,那么就將μ融合到新的單元ω;若其對應(yīng)的單元:
ω1,ω2,…,ωk(k>1)
(15)
則可以把ω1,ω2,...,ωk所在的聚類全部結(jié)合到一個網(wǎng)格中,而融合后的單元μ就會被取締,這時也會出現(xiàn)三種情況:如果所有聚類中存在空的密集單元,那么該單元就要被取消;如果聚類中的密集單元都是有所關(guān)聯(lián)的,那么就可以將單元μ去除,其他單元不變;如果聚類中的密集單元均為任何關(guān)聯(lián),那么該聚類就要分割,分別放入其他聚類中。在以上條件的約束下,重新將密集單元進(jìn)行聚類。
基于上述過程,實現(xiàn)城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)的聚合。
隱私同態(tài)加密原理,即對加密的數(shù)據(jù)進(jìn)行處理得到一個輸出,再將這一輸出進(jìn)行解密,其結(jié)果與用同一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果是一樣的。操作人員可以在加密的數(shù)據(jù)中進(jìn)行檢索、對比等操作,得到正確的結(jié)果,而在整個處理過程中無需對數(shù)據(jù)進(jìn)行解密。其重要意義在于,真正從根本上解決云計算等將數(shù)據(jù)及其操作委托給第三方時的保密問題。
隱私同態(tài)加密算法簡要介紹如下:
(1)加密Enc(m):r=2^n,p=2^n^2, 計算c=m+2r+pq;
(2)解密Dec(c):m=(cmodp) mod 2;
(3)密鑰:奇數(shù)p,遠(yuǎn)遠(yuǎn)大于r、m,q遠(yuǎn)大于p。
其中,加密操作為Enc,解密操作為Dec,明文為m,mod表示模運(yùn)算。明文空間是{0,1},密文空間是整數(shù)集。p是一個正的奇數(shù),q是一個大的正整數(shù)(沒有要求是奇數(shù),它比p要大的多),p和q在密鑰生成階段確定,p看成是密鑰。而r是加密時隨機(jī)選擇的一個小的整數(shù)(可以為負(fù)數(shù))。
通過上述過程對所有數(shù)據(jù)聚合,為保證數(shù)據(jù)的安全性,防止城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)丟失和篡改,采用隱私同態(tài)技術(shù)加密聚合后的數(shù)據(jù),過程如下所示:
(1)建立融合樹[23],將聚合后的數(shù)據(jù)發(fā)送到離基站節(jié)點(diǎn)最近的某個傳感器節(jié)點(diǎn),將距離最近的節(jié)點(diǎn)記作n0,構(gòu)建起以n0為中心的加密樹;
(2)對同態(tài)Hash函數(shù)參數(shù)g發(fā)布,g為一個大素數(shù);
(3)為網(wǎng)格內(nèi)數(shù)據(jù)分配ID號[24],在有數(shù)據(jù)查詢請求后,各個傳感器節(jié)點(diǎn)對數(shù)據(jù)檢測,并將隱私數(shù)據(jù)存儲到內(nèi)存中;
(4)對數(shù)據(jù)加密處理,將聚合后的數(shù)據(jù)進(jìn)行加密處理,加密算法表示為:
Ci=Enc(mi)=mi+IDi
(16)
式中mi為隱私數(shù)據(jù);IDi為第i個數(shù)據(jù)的ID號;Enc為數(shù)據(jù)加密參數(shù):
(5)對同態(tài)消息驗證碼計算[25],在隱私同態(tài)技術(shù)中,各個傳感器能夠計算出感知數(shù)據(jù)的同態(tài)消息驗證碼;
(6)將密文信息和聚合數(shù)據(jù)的消息驗證碼上傳到融合節(jié)點(diǎn)中,構(gòu)建基于隱私同態(tài)的數(shù)據(jù)聚合加密模型,從而實現(xiàn)城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)的聚合,其表達(dá)式為:
H(mi)=gmi
(17)
為驗證所提出的城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合算法的有效性,采用Matlab軟件搭建城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)模型仿真平臺并在此平臺下進(jìn)行實驗分析。實驗數(shù)據(jù)取自某城市電網(wǎng)公司建立的配電網(wǎng)多級網(wǎng)格數(shù)據(jù)庫,該數(shù)據(jù)庫含有2 000個數(shù)據(jù),對數(shù)據(jù)進(jìn)行分組,數(shù)據(jù)集的元組數(shù)設(shè)為10,配電網(wǎng)多級網(wǎng)格數(shù)據(jù)設(shè)置情況如表1所示。
表1 配電網(wǎng)多級網(wǎng)格數(shù)據(jù)設(shè)置情況
根據(jù)密度閾值函數(shù)設(shè)置對配電網(wǎng)多級網(wǎng)格數(shù)據(jù)進(jìn)行預(yù)處理,并將文獻(xiàn)[1]提出的基于霧計算的聚合方法與文獻(xiàn)[2]提出的基于霧輔助的方法與所研究方法對比,對比三種方法的聚合效果。
圖3為三種方法在數(shù)據(jù)聚合后,數(shù)據(jù)丟失的對比結(jié)果。
圖3 數(shù)據(jù)丟失情況對比
基于圖3可知,文中方法在數(shù)據(jù)量為100條到500條時沒有出現(xiàn)數(shù)據(jù)丟失情況,在數(shù)據(jù)量增多到1 000條時出現(xiàn)了數(shù)據(jù)丟失情況,但是丟失數(shù)量在1次內(nèi),丟失數(shù)量較少,在可接受范圍內(nèi)。而基于霧計算的聚合方法與霧輔助方法數(shù)據(jù)丟失情況較多,聚合效果較差。主要是因為文中方法采用隱私同態(tài)技術(shù)加密聚合后的數(shù)據(jù),保證了數(shù)據(jù)的安全性,最大限度防止了城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)丟失,由此可以證明文中方法在數(shù)據(jù)聚合過程中能夠保證數(shù)據(jù)的防丟失安全性。
對比經(jīng)過三種方法聚合后數(shù)據(jù)被篡改的情況,結(jié)果如圖4所示。
圖4 數(shù)據(jù)篡改情況
由圖4可知,文中方法的數(shù)據(jù)篡改次數(shù)在2次內(nèi),出現(xiàn)的被篡改情況較少,而其他兩種方法均發(fā)生不同情況的數(shù)據(jù)篡改情況,主要是因為文中方法采用隱私同態(tài)技術(shù)加密聚合后的數(shù)據(jù),保證了數(shù)據(jù)的安全性,最大限度防止了城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)被篡改。由此可以證明文中方法在數(shù)據(jù)聚合過程中能夠保證數(shù)據(jù)的防篡改安全性。
在數(shù)據(jù)聚合中,僅僅關(guān)注數(shù)據(jù)的完整性和機(jī)密性是遠(yuǎn)遠(yuǎn)不夠的,信息聚合的時效性也非常重要,為此對比三種方法的數(shù)據(jù)聚合效率,對比結(jié)果如圖5所示。由圖5可知,所研究的城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合方法聚合效率最高,在數(shù)據(jù)多與少的情況下,所花費(fèi)的數(shù)據(jù)聚合時間都較少。而基于霧計算的聚合方法,以及霧輔助的聚合方法受到數(shù)據(jù)量影響較大,在數(shù)據(jù)量較多時,花費(fèi)的聚合時間較多。而文中在密集單元里選出一個位移最大的初始值作為聚類中心,將噪聲的干擾降到最低,從而提升了算法的運(yùn)行效率。
圖5 數(shù)據(jù)聚合效率對比
三種方法的數(shù)據(jù)加密效率對比結(jié)果如圖6所示。由圖6可知,其他兩種方法的數(shù)據(jù)加密時間較多,文中方法研究的數(shù)據(jù)加密時間遠(yuǎn)遠(yuǎn)少于這兩種方法。主要原因是文中方法采用了隱私同態(tài)方法對數(shù)據(jù)加密,隱私同態(tài)技術(shù)不需要對數(shù)據(jù)密鑰分配,簡化了加密流程,從而減少了數(shù)據(jù)加密的時間。
圖6 數(shù)據(jù)加密效率對比
對比三種方法在傳輸數(shù)據(jù)時產(chǎn)生的通信開銷,對比結(jié)果如圖7所所示。由圖7可知,文中方法通信開銷維持在同一量級,通信開銷較低,且遠(yuǎn)低于其他兩種方法的通信開銷,說明所研究的方法不僅能夠減少數(shù)據(jù)聚合時間,還能夠減少數(shù)據(jù)通信開銷。主要原因是文中方法將數(shù)據(jù)的格式轉(zhuǎn)化成與大多數(shù)數(shù)據(jù)相同的格式,重新獲取新的數(shù)據(jù),保證了數(shù)據(jù)獲取的完整性,降低了數(shù)據(jù)通信開銷。
圖7 通信開銷對比
文中提出了基于隱私同態(tài)的城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合算法。(1)預(yù)先對數(shù)據(jù)采樣,保證數(shù)據(jù)聚合的完整性;(2)提出網(wǎng)格聚類算法,對聚類中心與密度函數(shù)選擇,保證數(shù)據(jù)的準(zhǔn)確聚類;(3)將隱私同態(tài)技術(shù)應(yīng)用到數(shù)據(jù)聚合中,在保證數(shù)據(jù)順利聚合的同時,保證數(shù)據(jù)的安全性。
實驗算例表明,通過對比已有經(jīng)典聚合方法,文中所提出的基于隱私同態(tài)的城市配電網(wǎng)多級網(wǎng)格數(shù)據(jù)聚合算法,數(shù)據(jù)丟失數(shù)量限制在1次內(nèi),數(shù)據(jù)篡改次數(shù)限制在2次內(nèi),減少聚合后數(shù)據(jù)丟失與被篡改的次數(shù),還能有效提高數(shù)據(jù)加密效率與聚合效率,并顯著降低數(shù)據(jù)的通信費(fèi)用。