汪 飛
(江漢大學(xué)人工智能學(xué)院,湖北 武漢 430000)
網(wǎng)絡(luò)大數(shù)據(jù)指的是在網(wǎng)絡(luò)空間中將人、物、機(jī)互相融合后所產(chǎn)生的大數(shù)據(jù),并且人們可以在網(wǎng)絡(luò)中接觸或并得到這些數(shù)據(jù),大數(shù)據(jù)具有規(guī)模巨大、來源多樣化且復(fù)雜等屬性,此類大數(shù)據(jù)里存在了大量有價(jià)值信息,但是,目前已有處理方法不能有效地實(shí)行數(shù)據(jù)隱私加密保護(hù)[1]。由于大數(shù)據(jù)環(huán)境中,數(shù)據(jù)隱私加密保護(hù)優(yōu)化方法能夠保證原有數(shù)據(jù)不外泄,保證原有數(shù)據(jù)絕對(duì)完整性,并且滿足非單一類型與條件的數(shù)據(jù)保護(hù)要求,因此,受到大量專家和學(xué)者關(guān)注[2]。大數(shù)據(jù)環(huán)境中數(shù)據(jù)隱私加密保護(hù)優(yōu)化方法可以保證網(wǎng)絡(luò)安全運(yùn)行,業(yè)內(nèi)研究人員對(duì)該問題給予了極大的關(guān)注[3]。
傳統(tǒng)網(wǎng)絡(luò)大數(shù)據(jù)加密算法有基于數(shù)據(jù)聚類的無損加密算法、基于布隆過濾器的無損加密算法,上述方法可以對(duì)數(shù)據(jù)進(jìn)行加密時(shí),可以在一定程度上保證數(shù)據(jù)的穩(wěn)定性,但是由于未對(duì)加密過程進(jìn)行約束,導(dǎo)致加密后的數(shù)據(jù)易受入侵,數(shù)據(jù)加密魯棒性較差。且上述方法均以單向防御為主。因此,提出基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密算法,對(duì)網(wǎng)絡(luò)大數(shù)據(jù)實(shí)現(xiàn)雙向防御無損加密,為用戶提供最大尺度的數(shù)據(jù)安全保護(hù)。
采用改進(jìn)保護(hù)序加密方法,實(shí)現(xiàn)網(wǎng)絡(luò)大數(shù)據(jù)無損加密。優(yōu)化加密保護(hù)網(wǎng)絡(luò)大數(shù)據(jù)時(shí),先按照OPES+的理論思想將大數(shù)據(jù)環(huán)境中因素?cái)?shù)據(jù)變換為數(shù)值并按照所處方位排序[4]。同時(shí)將排列好的方位數(shù)據(jù)劃分成桶,增大其分布均勻性,讓每個(gè)桶中點(diǎn)的數(shù)目低于設(shè)定的閾值,使用保護(hù)序加密算法把桶中數(shù)據(jù)實(shí)行加密[5],并維持加密后數(shù)值大小順序不出現(xiàn)變動(dòng),按照加密約束條件,對(duì)數(shù)據(jù)隱私進(jìn)行加密。加密約束詳細(xì)流程是:
1)加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),將度分秒設(shè)成單位,描述數(shù)據(jù)的經(jīng)緯度,使用OPES+理論思想把大數(shù)據(jù)環(huán)境中隱私數(shù)據(jù)變成數(shù)值A(chǔ)進(jìn)行描述,如果通過度、分、秒代表原始的數(shù)據(jù)值,那么能夠獲?。?/p>
A=B+C/60+D/3600
(1)
其中,B表示度,C表示分,D表示秒。
2)把排列完畢的方位數(shù)據(jù)設(shè)成桶,增大其分布均勻性,假定基于明文空間里,通過q表示原始空間數(shù)值數(shù)據(jù)[6],那么把q劃分成q={E1,E2,…,En},En必須符合對(duì)隨機(jī)兩個(gè)桶的劃分,則把上述流程設(shè)成桶劃分。
3)加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),假定劃分函數(shù)是SPlit(En),那么此函數(shù)的作用為把En線性劃分成兩個(gè)子桶,直到每個(gè)桶中點(diǎn)數(shù)目低于設(shè)定閾值。qi(qi∈En)描述線性期望值,能夠通過式(4)實(shí)行計(jì)算
(2)
其中,(qs-qi)描述數(shù)據(jù)劃分的范疇參數(shù),i表示數(shù)據(jù)方位向量,s表示數(shù)據(jù)值域。
加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),按照上式運(yùn)算能夠選擇距離期望值較遠(yuǎn)的點(diǎn)實(shí)行遞歸劃分[7]。
4)加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),使用保護(hù)序加密算法把桶中的數(shù)據(jù)實(shí)行加密,并保證加密后數(shù)值的大小順序和原始一樣。運(yùn)算加密函數(shù)N(Q),假定F={f1,f2,…,fm}表示的密文空間是基于q={q1,q2,…,qm}表示的明文空間加密所獲取,同時(shí)?j符合式(3)
(3)
其中,?j表示桶寬。
(4)
5)加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),針對(duì)通過qi描述的桶Ej里隨機(jī)數(shù)值,通過fj描述其加密的密文值,那么能夠通過式(5)運(yùn)算fj
(5)
6)加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),使用式(6)把數(shù)據(jù)隱私加密過程約束成通過N(Q)表示的加密函數(shù)的計(jì)算,并平衡N(Q)分布
(6)
7)加密保護(hù)的網(wǎng)絡(luò)大數(shù)據(jù)時(shí),按照上述步驟能夠?qū)崿F(xiàn)網(wǎng)絡(luò)大數(shù)據(jù)對(duì)內(nèi)無損加密[8]。
加密約束條件,可以為網(wǎng)絡(luò)大數(shù)據(jù)無損加密提供可靠度保障,降低對(duì)加密的網(wǎng)絡(luò)大數(shù)據(jù)入侵的危險(xiǎn)。
在上述建立加密約束條件的基礎(chǔ)上,建立SAT雙向防御模型,大數(shù)據(jù)動(dòng)態(tài)安全 SAT 雙向防御模型是基于大數(shù)據(jù)的數(shù)據(jù)保存量與運(yùn)算性能進(jìn)行分析,模型里的各個(gè)部分相互依賴,實(shí)現(xiàn)雙向的安全防御。雙向防御架構(gòu)中存在行為數(shù)據(jù)拆分中心、行為數(shù)據(jù)分析中心、行為數(shù)據(jù)包裝中心、云客戶端,并采用動(dòng)態(tài)SAT雙向防御機(jī)制,為用戶提供最高的安全防御。機(jī)制流程是:
1)初始化,把一個(gè)預(yù)處理的異常數(shù)據(jù)任務(wù)實(shí)行排序,排序隊(duì)列是Gj(j=1,2,3,4,5,…,m)。若必須對(duì)異常數(shù)據(jù)實(shí)行加工處理,則行為數(shù)據(jù)拆分中心實(shí)行異常數(shù)據(jù)的內(nèi)部拆分與任務(wù)調(diào)度[9]。任務(wù)符合
(7)
其中,R表示異常數(shù)據(jù)匯總能夠拆分的有效可信數(shù)據(jù);m描述單位時(shí)間中處理大數(shù)據(jù)環(huán)境中的任務(wù)總值;j描述在資源中分配的個(gè)任務(wù)。
2)在行為數(shù)據(jù)拆分中心拆分?jǐn)?shù)據(jù)之前,建立一個(gè)判斷模塊,判斷模塊通過云端監(jiān)控?cái)?shù)據(jù)的操作行為并保存下來[10]。若隊(duì)列不屬于空,便實(shí)行拆分;若隊(duì)列是空,便實(shí)行標(biāo)記,同時(shí)遞歸至后續(xù)等待隊(duì)列[11]。
3)全部任務(wù)數(shù)H能夠分為j個(gè)任務(wù),其依次對(duì)應(yīng)j條可信記錄,那么這個(gè)分割的函數(shù)F符合
(8)
4)對(duì)任務(wù)進(jìn)行分割后,若不必實(shí)行后續(xù)信息處理便退出;若必須實(shí)行后續(xù)處理,便再次執(zhí)行[12]。綜上所述動(dòng)態(tài)SAT雙向防御架構(gòu)算法步驟如圖1所示。
圖1 SAT雙向安全防御模型流程示意圖
在網(wǎng)絡(luò)大數(shù)據(jù)加密約束條件的基礎(chǔ)上,優(yōu)化加密保護(hù)網(wǎng)絡(luò)大數(shù)據(jù),并建立SAT雙向安全防御模型,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)大數(shù)據(jù)無損加密。
為了分析所提算法對(duì)外入侵主動(dòng)防御效果,對(duì)所提算法實(shí)行實(shí)驗(yàn),基于MATLAB7.1軟件平臺(tái)中建立大數(shù)據(jù)下網(wǎng)絡(luò)數(shù)據(jù)入侵主動(dòng)防御仿真平臺(tái)。使用Blade Informer Nmap攻擊軟件經(jīng)過攻擊方傳輸模擬網(wǎng)絡(luò)數(shù)據(jù)攻擊包至受攻擊主機(jī)。
使用所提算法、基于數(shù)據(jù)聚類的無損加密算法、基于布隆過濾器的無損加密算法,進(jìn)行對(duì)外主動(dòng)防御實(shí)驗(yàn)對(duì)比。通過攻擊切斷程度來判斷三種算法在實(shí)行網(wǎng)絡(luò)數(shù)據(jù)入侵主動(dòng)防御時(shí)的自我防護(hù)性能,對(duì)比結(jié)果如圖2所示。
圖2 三種算法入侵防御效果
分析圖2可明顯看出,所提算法的對(duì)外入侵主動(dòng)防御效果最佳,當(dāng)攻擊包訪問的次數(shù)逐漸增多時(shí),所提算法的攻擊切斷程度并未受影響,始終高于93%,且始終高于基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法的切斷程度。
對(duì)上述實(shí)驗(yàn)里三種算法實(shí)行入侵主動(dòng)防御時(shí)節(jié)點(diǎn)損失水平進(jìn)行比較,比較結(jié)果如圖3所示。
圖3 節(jié)點(diǎn)損失程度對(duì)比結(jié)果
分析圖3,伴隨訪問次數(shù)的逐漸增多,所提算法的節(jié)點(diǎn)損失系數(shù)始終控制在0.10之內(nèi),最大值僅有0.07,而基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法的節(jié)點(diǎn)損失系數(shù)隨著訪問次數(shù)的增多也逐漸增多,且一直高于所提算法。則所提算法在對(duì)外入侵主動(dòng)防御時(shí),網(wǎng)絡(luò)大數(shù)據(jù)節(jié)點(diǎn)損失較小,數(shù)據(jù)完整度保存較好。
采用三種算法進(jìn)行對(duì)內(nèi)數(shù)據(jù)無損加密效果對(duì)比分析。設(shè)定三種算法的對(duì)比指標(biāo)依次是安全可靠性、精準(zhǔn)度、誤差率,則三種算法的對(duì)內(nèi)數(shù)據(jù)無損加密效果對(duì)比如表1所示。
表1 三種算法的對(duì)內(nèi)數(shù)據(jù)無損加密效果對(duì)比
分析表1數(shù)據(jù)可知,所提算法在實(shí)行網(wǎng)絡(luò)大數(shù)據(jù)無損加密時(shí)的精準(zhǔn)度、安全可靠性、誤差率均優(yōu)于基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法。由此驗(yàn)證了所提算法能夠有效避免網(wǎng)絡(luò)大數(shù)據(jù)隱私的泄露,存在優(yōu)越的應(yīng)用價(jià)值。
測(cè)試三種算法在實(shí)行網(wǎng)絡(luò)大數(shù)據(jù)對(duì)內(nèi)無損加密后的節(jié)點(diǎn)損失程度,對(duì)比結(jié)果如表2所示:
表2 網(wǎng)絡(luò)大數(shù)據(jù)對(duì)內(nèi)無損加密后的節(jié)點(diǎn)損失程度對(duì)比
根據(jù)表2數(shù)據(jù)顯示,所提算法網(wǎng)絡(luò)大數(shù)據(jù)對(duì)內(nèi)無損加密后的節(jié)點(diǎn)損失系數(shù)均值僅有0.02,和基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法相比,所提算法加密后的網(wǎng)絡(luò)大數(shù)據(jù)節(jié)點(diǎn)損失系數(shù)最小,對(duì)節(jié)點(diǎn)結(jié)構(gòu)不造成顯著影響。
結(jié)合表1和表2的實(shí)驗(yàn)結(jié)果可知,所提算法可實(shí)現(xiàn)網(wǎng)絡(luò)大數(shù)據(jù)無損加密。
進(jìn)行雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密時(shí),不論是對(duì)外防御還是對(duì)內(nèi)加密,均涉及數(shù)據(jù)檢索,為此,將網(wǎng)絡(luò)大數(shù)據(jù)檢索效率以及加密效率作為分析指標(biāo),使用三種算法實(shí)行基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密實(shí)驗(yàn),對(duì)比分析三種算法的數(shù)據(jù)檢索、數(shù)據(jù)加密時(shí)間,對(duì)比結(jié)果見圖4、圖5。
圖4 三種算法的數(shù)據(jù)加密效率對(duì)比結(jié)果
圖5 數(shù)據(jù)檢索效率對(duì)比結(jié)果
分析圖4、圖5可知,所提算法進(jìn)行網(wǎng)絡(luò)大數(shù)據(jù)無損加密時(shí)的網(wǎng)絡(luò)大數(shù)據(jù)檢索效率、加密效率均顯著高于其它兩種算法,這是由于所提算法先通過大數(shù)據(jù)動(dòng)態(tài)安全 SAT 雙向防御模型,完成網(wǎng)絡(luò)大數(shù)據(jù)雙向防御;再按照OPES+理論思想將大數(shù)據(jù)中的隱私數(shù)據(jù)變成數(shù)值并按照所處方位排序,同時(shí)將排序完的方位數(shù)據(jù)劃分成桶,使用保護(hù)序加密算法把桶中的數(shù)據(jù)實(shí)行加密,保證加密后數(shù)值大小順序保持原樣,將數(shù)據(jù)隱私加密過程約束成加密函數(shù)的計(jì)算,基于這個(gè)基礎(chǔ)之上得到加密函數(shù),把對(duì)網(wǎng)絡(luò)大數(shù)據(jù)無損加密問題變成約束同構(gòu)的線性優(yōu)化問題,以此優(yōu)化了網(wǎng)絡(luò)大數(shù)據(jù)無損加密效率。
以往的數(shù)據(jù)加密算法僅通過直接加密數(shù)據(jù)的形式實(shí)現(xiàn)數(shù)據(jù)安全保護(hù),未曾考慮到外來入侵攻擊包對(duì)數(shù)據(jù)安全產(chǎn)生的威脅,提出基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密算法,并將其通過仿真實(shí)驗(yàn)驗(yàn)證其有效性,經(jīng)驗(yàn)證得出:
1)所提算法的對(duì)外入侵主動(dòng)防御效果最佳,當(dāng)攻擊包訪問的次數(shù)逐漸增多時(shí),所提算法的攻擊切斷程度并未受影響,始終高于93%。
2)訪問次數(shù)的逐漸增多,所提算法對(duì)外防御時(shí)的節(jié)點(diǎn)損失系數(shù)始終控制在0.10之內(nèi),最大值僅有0.07,對(duì)內(nèi)加密時(shí)的節(jié)點(diǎn)損失系數(shù)均值僅有0.02,損失極小,可實(shí)現(xiàn)無損加密。
3)所提算法在實(shí)行網(wǎng)絡(luò)大數(shù)據(jù)無損加密時(shí)的精準(zhǔn)度、安全可靠性、誤差率均優(yōu)于同類算法。
4)所提算法在進(jìn)行基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密時(shí)的網(wǎng)絡(luò)大數(shù)據(jù)檢索效率、加密效率均顯著。