摘要:隨著信息時(shí)代的發(fā)展,數(shù)據(jù)量的規(guī)模迅速增長,數(shù)據(jù)的類型也變得復(fù)雜化,數(shù)據(jù)中往往包含了很多具有重要價(jià)值的信息,然而現(xiàn)階段數(shù)據(jù)隱私保護(hù)技術(shù)上的不完善,無法切實(shí)的對大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私進(jìn)行加密保護(hù),使得大數(shù)據(jù)的數(shù)據(jù)隱私加密的算法的優(yōu)化改進(jìn)逐漸成為研究的重要課題。該文就以大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密算法的原理及數(shù)據(jù)隱私加密算法的優(yōu)化情況進(jìn)行探討,對其現(xiàn)狀及發(fā)展趨勢進(jìn)行分析。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)隱私;隱私保護(hù)
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)04-0018-02
隨著互聯(lián)網(wǎng)+與大數(shù)據(jù)時(shí)代的到來,以云計(jì)算和大數(shù)據(jù)為代表的信息技術(shù)深刻的改變了我們的生活。大數(shù)據(jù)環(huán)境的不斷發(fā)展,使得數(shù)據(jù)的存儲與計(jì)算、發(fā)布和共享等都有了極大的便利。據(jù)統(tǒng)計(jì),現(xiàn)階段的互聯(lián)網(wǎng)用戶已經(jīng)突破了30億,互聯(lián)網(wǎng)全球滲透率已經(jīng)高達(dá)43%,越來越多的網(wǎng)絡(luò)用戶愿意將自己的個(gè)人數(shù)據(jù)提供給服務(wù)提供商,例如醫(yī)療機(jī)構(gòu)、銀行以及大型的網(wǎng)絡(luò)企業(yè)等。隱私加密保護(hù)技術(shù)是防止隱私信息泄露的重要保障,通過對大數(shù)據(jù)的數(shù)據(jù)隱私加密算法進(jìn)行研究,可以對現(xiàn)階段的數(shù)據(jù)隱私進(jìn)行更好的了解和掌握。
1 大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密保護(hù)概述
1) 大數(shù)據(jù)隱私保護(hù)方法
隱私信息一般是指用戶不愿公開的與個(gè)人敏感事項(xiàng)有關(guān)的數(shù)據(jù)信息,例如,用戶的家庭關(guān)系、個(gè)人教育信息以及工作經(jīng)歷等。這些數(shù)據(jù)又是由多個(gè)元組所組成的,每一個(gè)元組又同時(shí)包含多個(gè)用戶屬性。用戶屬性可以按照特征分為以下三類:一是準(zhǔn)標(biāo)識符,需要多個(gè)屬性進(jìn)行組合才能共同對用戶的信息進(jìn)行標(biāo)識,即不能唯一標(biāo)識一個(gè)用戶身份的屬性,例如,生日、地址等;二是顯示標(biāo)識符,與準(zhǔn)標(biāo)識符相反,它可以標(biāo)識出一個(gè)用戶的屬性,例如,姓名和證件號碼等;三是敏感屬性,主要包括用戶不愿意公布的信息,包括個(gè)人隱私的薪資和健康狀況的等。
2) 隱私保護(hù)技術(shù)
現(xiàn)階段主要的隱私保護(hù)技術(shù)主要有三種。
一是基于數(shù)據(jù)匿名的隱私保護(hù)技術(shù),它是通過對數(shù)據(jù)進(jìn)行移植和泛化等來對數(shù)據(jù)進(jìn)行隱私保護(hù),針對大數(shù)據(jù)環(huán)境下數(shù)據(jù)的多維多源性和大規(guī)模等特征,可以很好的進(jìn)行針對性的操作。通過分布式計(jì)算模型設(shè)計(jì)以及多線程匿名技術(shù)等,大大的提高匿名的效率,起到數(shù)據(jù)保護(hù)的作用,主要的代表性技術(shù)有l(wèi)-diversity 和 t-closeness 等。
二是基于數(shù)據(jù)失真的隱私保護(hù)技術(shù),這種技術(shù)可以保證在用戶的一些數(shù)據(jù)的總體特征或者屬性不變的情況下對數(shù)據(jù)進(jìn)行干擾,干擾的強(qiáng)度與數(shù)據(jù)失真的強(qiáng)度成正比:數(shù)據(jù)失真越大,隱私保護(hù)強(qiáng)度就越高。傳統(tǒng)的有差分隱私保護(hù)技術(shù),通過對數(shù)據(jù)添加噪聲來進(jìn)行隱私保護(hù),但同時(shí)也會出現(xiàn)數(shù)據(jù)可用性較低的情況。
三是基于密碼學(xué)的隱私保護(hù)技術(shù),通過對數(shù)據(jù)進(jìn)行加密的方式來保護(hù)隱私信息,是現(xiàn)階段作為流行的一種技術(shù),隱私的保護(hù)強(qiáng)度較高。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)隱私的加密算法逐漸受到各方面的關(guān)注,圍繞可加密算法所提出的新理論、新方法和新技術(shù)等大大的提高了數(shù)據(jù)隱私加密的安全性和可靠性。
3) 隱私保護(hù)技術(shù)的性能評價(jià)指標(biāo)
在大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私加密保護(hù)中,數(shù)據(jù)的存儲和計(jì)算等都是通過對云服務(wù)器來進(jìn)行處理的,在對大數(shù)據(jù)的隱私加密技術(shù)進(jìn)行評價(jià)時(shí),可以從以下指標(biāo)來進(jìn)行測量:
一是隱私保護(hù)強(qiáng)度,主要是通過隱私信息泄露的風(fēng)險(xiǎn)1/R(s)來反映的,隱私泄露的風(fēng)險(xiǎn)越小則說明了保護(hù)的強(qiáng)度越高。
二是數(shù)據(jù)的可用性I,這主要是通過對隱私保護(hù)技術(shù)處理后的數(shù)據(jù)的缺損來進(jìn)行反映。數(shù)據(jù)的缺損性越高,則所代表的數(shù)據(jù)的可用性就越低。在對數(shù)據(jù)的可用性進(jìn)行度量時(shí)可運(yùn)用的指標(biāo)有分辨率度量DM,數(shù)據(jù)分類度量CM以及數(shù)據(jù)信息損失ILOSS等。
三是數(shù)據(jù)隱私加密的開銷成本C,包括數(shù)據(jù)計(jì)算開銷,指隱私保護(hù)技術(shù)處理數(shù)據(jù)時(shí)需占用的計(jì)算資源;數(shù)據(jù)通信開銷,指在云計(jì)算環(huán)境中用戶與云端進(jìn)行數(shù)據(jù)傳輸時(shí)的通信量;數(shù)據(jù)存儲開銷,指云端存儲經(jīng)隱私保護(hù)處理戶的數(shù)據(jù)空間大小。具體的原理可由下列公式來說明:
其中E表示隱私保護(hù)技術(shù)的評價(jià)值,α、β、為權(quán)重系數(shù),并且通過E整體來評估隱私數(shù)據(jù)的性能,權(quán)重系數(shù)可以由用戶的具體需求來進(jìn)行個(gè)性化的設(shè)定。
2 大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密算法的提出必要性
隨著大數(shù)據(jù)環(huán)境的發(fā)展,越來越多的敏感數(shù)據(jù)被存儲在云中,包括電子郵件、私人通信記錄以及企業(yè)的重要文件等。雖然借助云服務(wù)器所提供的高質(zhì)量數(shù)據(jù)存儲服務(wù)為用戶使用數(shù)據(jù)提供了極大的便利;為了方便科學(xué)研究或者其他方面的運(yùn)用,這些服務(wù)提供商通常采用私有云、混合云或者公有云的方式進(jìn)行數(shù)據(jù)的存儲和管理,但是這種方式也會使得用戶的個(gè)人數(shù)據(jù)的物理控制權(quán)與所有權(quán)相分離。對于不經(jīng)意間將隱私數(shù)據(jù)上傳到不可靠的云服務(wù)商來說,增加了隱私被泄露的風(fēng)險(xiǎn);同時(shí),一些黑客采用數(shù)據(jù)挖掘等方式來對數(shù)據(jù)中的隱私進(jìn)行收集與傳播,導(dǎo)致用戶的權(quán)益得不到應(yīng)有的保障?,F(xiàn)階段將數(shù)據(jù)加密再進(jìn)行上傳是一種比較常見的方法,但是在經(jīng)過重重的加密后,數(shù)據(jù)的原有特性可能出現(xiàn)變化。特別的是,隨著大數(shù)據(jù)環(huán)境下數(shù)據(jù)量的不斷增加,數(shù)據(jù)的加密顯得尤為復(fù)雜,當(dāng)用戶需要某些數(shù)據(jù)時(shí),無法直接在密文中對數(shù)據(jù)進(jìn)行篩選,無法直接得出自己想要的信息,很容易造成時(shí)間和帶寬的浪費(fèi)。
對于以往的數(shù)據(jù)隱私加密算法而言,采用的是直接對數(shù)據(jù)進(jìn)行加密,沒有注重對數(shù)據(jù)層與層之間的進(jìn)行劃分,對于涉及到的一些較為復(fù)雜的問題,不能夠保證數(shù)據(jù)加密的準(zhǔn)確性。在這種情況下對大數(shù)據(jù)環(huán)境下的數(shù)據(jù)加密算法進(jìn)行改進(jìn)具有很大的必要性,特別的是現(xiàn)在所流行的OPES+理論思想的運(yùn)用,將隱私數(shù)據(jù)映射為數(shù)值,并且通過位置排序等方式將其劃分成桶,通過加強(qiáng)獲取的加密函數(shù)為依據(jù)進(jìn)行隱私數(shù)據(jù)的優(yōu)化保護(hù),使其成為了現(xiàn)階段數(shù)據(jù)加密保護(hù)的一種比較流行的方式。
3 大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密算法
大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密保護(hù)的過程中,主要是對數(shù)據(jù)進(jìn)行加密算法和加密秘鑰等方式將其從明文轉(zhuǎn)變成為密文,在通過解密的方式將其從密文來轉(zhuǎn)變成為明文,從而可以有效的對數(shù)據(jù)進(jìn)行加密保護(hù)。在不改變大數(shù)據(jù)環(huán)境中的值的前提下有效的處理大數(shù)據(jù)環(huán)境下數(shù)據(jù)更新快以及數(shù)據(jù)量大的問題,通過對數(shù)據(jù)進(jìn)行組建索引的方式,防止用戶數(shù)據(jù)信息的泄露。以下將用公式的方式來闡述大數(shù)據(jù)環(huán)境下數(shù)據(jù)的加密與解密過程:
1) 加密過程:(其中I表示加密迭代次數(shù)的變量)
從上述公式或者變量可以看出,大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私加密保護(hù)原理,可以為大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私加密提供切實(shí)可行的理論基礎(chǔ),最大化的提高數(shù)據(jù)保護(hù)的效果。
4 大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密算法的優(yōu)化建議
雖然當(dāng)前采用的數(shù)據(jù)隱私加密算法對于促進(jìn)數(shù)據(jù)的隱私保護(hù)方面具有重要的重要,可以最大化的保障大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全問題,但是大數(shù)據(jù)環(huán)境具有數(shù)據(jù)量大且復(fù)雜的特點(diǎn),對于數(shù)據(jù)的保護(hù)的要求較高,而現(xiàn)有的數(shù)據(jù)加密保護(hù)隱私的算法也或多或少的存在一些不足,必須要進(jìn)行不斷的改進(jìn)才會使其保持應(yīng)有的活力,更好的實(shí)現(xiàn)對用戶的隱私數(shù)據(jù)進(jìn)行保護(hù)。以下便提出了一種基于改進(jìn)保護(hù)序加密算法的大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私加密算法。
1) 大數(shù)據(jù)環(huán)境下的隱私加密
大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私加密的首要步驟就是運(yùn)用OPES+的理論將隱私數(shù)據(jù)轉(zhuǎn)換成數(shù)值進(jìn)行表述,并對已經(jīng)排列好的數(shù)據(jù)按照桶來進(jìn)行劃分,通過這種均勻的劃分方式將各個(gè)桶內(nèi)點(diǎn)的數(shù)量控制在一個(gè)低于給定的閾值上,從而保證了數(shù)據(jù)加密的有效性。
在這個(gè)過程中,首先就是要做好數(shù)據(jù)的經(jīng)緯度的表示,可以以度分秒的形式來進(jìn)行表示。OPES+的理論為大數(shù)據(jù)環(huán)境下將隱私數(shù)據(jù)轉(zhuǎn)換從數(shù)值提供了很好的理論基礎(chǔ)。其次,需要將排列好的位置數(shù)據(jù)按照桶來進(jìn)行劃分,保證其分布空間的安排合理有序??梢约俣ㄒ宰帜窹代表明文空間中的原始數(shù)據(jù),則可以將P劃分為P={
其中,Z表示M(P)的范圍參數(shù),表示加密的二次項(xiàng)系數(shù)。
由上述公式可以看出,在對大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私優(yōu)化的加密保護(hù)過程中,運(yùn)用OPES+的理論可以將大數(shù)據(jù)環(huán)境下的隱私述轉(zhuǎn)換成數(shù)值進(jìn)行表述,通過將其劃分成為桶,可以保障數(shù)據(jù)在排列分布時(shí)的有序性,既保證了述分分布均勻,又在一定程度上將桶內(nèi)數(shù)據(jù)的點(diǎn)的數(shù)量進(jìn)行了限制,使其小于特定的閾值,并且還可以最大化的保證其順序的不變,為實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下的數(shù)據(jù)加密奠定好了技術(shù)保障。
2) 大數(shù)據(jù)環(huán)境下數(shù)據(jù)隱私加密的優(yōu)化原理
前面具體的闡述了對數(shù)據(jù)加密的過程的算法運(yùn)用,以其為基礎(chǔ),以獲取的加密函數(shù)為核心,下面將具體的闡述大數(shù)據(jù)環(huán)境下的數(shù)據(jù)優(yōu)化加密原理,對具體的算法進(jìn)行改進(jìn),實(shí)現(xiàn)數(shù)據(jù)的優(yōu)化處理。
用下式表述數(shù)據(jù)隱私加密保護(hù)問題的約束同構(gòu)的線性優(yōu)化問題
其中,g(z,c)表示目標(biāo)函數(shù)的參數(shù),optξ表示數(shù)據(jù)加密的目標(biāo)函數(shù),f(z,a)表示隱私加密數(shù)據(jù)的決策變量。
在對大大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私加密算法的優(yōu)化設(shè)計(jì)中,最重要的是要保證數(shù)據(jù)隱私的安全性,要做好措施保證數(shù)據(jù)隱私的不被泄漏,通過檢查各種非基變量的檢驗(yàn)數(shù),達(dá)到最優(yōu)解,以此來實(shí)現(xiàn)數(shù)據(jù)加密保護(hù)算法的不斷優(yōu)化。
4 結(jié)束語
從以上的研究可知,隨著大數(shù)據(jù)環(huán)境的不斷發(fā)展變化,對數(shù)據(jù)的隱私加密算法的研究需要不斷的與時(shí)俱進(jìn),要對其進(jìn)行進(jìn)一步的探索,不斷提高其適用性,使其更好的符合大數(shù)據(jù)環(huán)境下數(shù)據(jù)的需求與發(fā)展變化。
參考文獻(xiàn):
[1] 曾凌峰.大數(shù)據(jù)環(huán)境下新的數(shù)據(jù)加密算法研究[J].科技通報(bào),2017(6):205-208.
[2] 張少芳,趙李東.IPSec VPN 中數(shù)據(jù)加密方式探究[J].電腦編程技巧與維護(hù),2013(4):78-79.
[3] 朱錦明.計(jì)算機(jī)網(wǎng)絡(luò)通信安全中數(shù)據(jù)加密技術(shù)的應(yīng)用[J].科技與創(chuàng)新,2014(8):129-130.
[4] 江偉.計(jì)算機(jī)網(wǎng)絡(luò)通信安全中數(shù)據(jù)加密技術(shù)的應(yīng)用探析[J].建筑界,2013(14):64-65.