趙小凡,李 情
(廣東電網(wǎng)廣州供電局,廣東 廣州 510000)
隨著云存儲技術(shù)的發(fā)展,在云存儲環(huán)境中需要對半結(jié)構(gòu)化數(shù)據(jù)進行優(yōu)化編碼轉(zhuǎn)換和訪問控制[1]。對云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換設(shè)計建立在對半結(jié)構(gòu)化數(shù)據(jù)動態(tài)特征分析和融合處理的基礎(chǔ)上[2-3]。目前,關(guān)于數(shù)據(jù)安全轉(zhuǎn)換方法的研究受到了人們的極大關(guān)注。
文獻[4]提出面向大數(shù)據(jù)的非結(jié)構(gòu)化數(shù)據(jù)安全保障技術(shù),針對大數(shù)據(jù)的半結(jié)構(gòu)化數(shù)據(jù)安全問題,依據(jù)數(shù)據(jù)類型和數(shù)據(jù)敏感度級別,形成了保障半結(jié)構(gòu)化數(shù)據(jù)安全的研究成果。首先,通過數(shù)據(jù)分析獲取所需數(shù)據(jù)類型和敏感度級別,構(gòu)建數(shù)據(jù)庫的數(shù)據(jù)節(jié)點。其次,為數(shù)據(jù)節(jié)點提供安全算法,與數(shù)據(jù)節(jié)點交互形成安全套件。再次,通過接口的調(diào)度算法為半結(jié)構(gòu)化數(shù)據(jù)提供足夠的安全性。但該方法進行云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換時的自適應(yīng)性欠佳,統(tǒng)計分析能力不強。文獻[5]提出基于模式未知的半結(jié)構(gòu)化數(shù)據(jù)分析方法,利用多源適應(yīng)多標簽分類框架,根據(jù)基于字符串相似度的實體解析算法,將記錄分成多個子字符串,從而編輯相似度、計算子字符串之間的關(guān)聯(lián)度。在此基礎(chǔ)上,引入二分圖最大加權(quán)匹配算法度量記錄之間的關(guān)聯(lián)度。該方法進行半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換時的解密性能欠佳,數(shù)據(jù)轉(zhuǎn)換輸出誤碼率較高。
針對上述問題,本文提出基于元數(shù)據(jù)管理的半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換方法。首先,構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的Hash編碼模型,通過動態(tài)隨機碼元調(diào)制方法、元數(shù)據(jù)管理以及參數(shù)模糊度辨識方法,實現(xiàn)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換和多屬性群決策。然后,提取數(shù)據(jù)元特征,結(jié)合信息聚類和自適應(yīng)學(xué)習(xí)方法,實現(xiàn)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換和編碼控制。最后,通過仿真測試分析,展示了該方法在提高半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換能力方面的優(yōu)越性能。
為了實現(xiàn)基于元數(shù)據(jù)管理的半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換,構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的Hash編碼模型,采用動態(tài)隨機碼元調(diào)制方法進行數(shù)據(jù)編碼和輸出轉(zhuǎn)換控制設(shè)計[6]。假設(shè)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的時間分布序列為Xn,n為原始待分區(qū)的云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)特征分布集。在模糊時間序列分析處理下,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)傳輸?shù)膭討B(tài)模糊特征分布序列,表示為XN=Xn+η。其中,η為云存儲動態(tài)半結(jié)構(gòu)數(shù)據(jù)空間的分布噪聲相關(guān)融合調(diào)度結(jié)果。采用相位偏移轉(zhuǎn)換控制和離散調(diào)度的方法,構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的模糊時間分布模型,得到非隸屬度特征匹配參數(shù)輸出:
(1)
根據(jù)動態(tài)隨機碼元調(diào)制方法,在固定的融合空間分布模型中,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)分布的平均互信息熵:
(2)
式中:R1為平均互信息熵;T為線性編碼;U1、U2、U3為結(jié)合統(tǒng)計時間的大數(shù)據(jù)序列。
根據(jù)線性控制方法,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的演化特征參數(shù):
(3)
根據(jù)動態(tài)隨機碼元的轉(zhuǎn)換控制,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)自適應(yīng)編碼的算術(shù)密鑰協(xié)議:
(4)
式中:X為云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)自適應(yīng)編碼的算術(shù)密鑰協(xié)議。
在上述模糊調(diào)度集中,通過元數(shù)據(jù)管理,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)設(shè)計重構(gòu)的特征值:
(5)
式中:Er為重構(gòu)特征值;σ1為半結(jié)構(gòu)數(shù)據(jù)分布的文件的第1個數(shù)據(jù)塊;σ2為半結(jié)構(gòu)數(shù)據(jù)分布的文件的第2個數(shù)據(jù)塊;σr為半結(jié)構(gòu)數(shù)據(jù)分布的文件的第r個數(shù)據(jù)塊。
在更新策略下,得到數(shù)據(jù)組密鑰,采用分組交換的方法實現(xiàn)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)動態(tài)分析和聚類。
根據(jù)半結(jié)構(gòu)化數(shù)據(jù)動態(tài)分析和聚類結(jié)果,采用模糊自相關(guān)融合調(diào)度方法,建立云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的直覺模糊度對偶集;采用元數(shù)據(jù)管理和參數(shù)模糊度辨識方法,結(jié)合密鑰動態(tài)重組[8],構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的模糊屬性分區(qū)交換模型。表達式為:
p0,0=t(σz+y)
(6)
式中:p0,0為模糊屬性分區(qū)交換模型;t為數(shù)據(jù)采樣的時間間隔;σz為數(shù)據(jù)碼元分布;y為Hash函數(shù)動態(tài)分配。
根據(jù)云存儲動態(tài)半結(jié)構(gòu)數(shù)據(jù)樣本的密度取值[9-11],得到非邊緣點融合區(qū)域內(nèi)的動態(tài)碼元調(diào)制密度特征量:
I(Q,S)=H(S)-H(Q|S)
(7)
(8)
式中:I(Q,S)為動態(tài)碼元調(diào)制密度特征量,Q為碼元瞬時特性特征參數(shù),S為碼元瞬時延續(xù)性特征參數(shù);H(S)為動態(tài)碼元調(diào)制密度估計值;H(Q|S)為數(shù)據(jù)調(diào)制中產(chǎn)生的同相數(shù)據(jù)輸出;H(Q|si)為數(shù)據(jù)調(diào)制中產(chǎn)生的正交數(shù)據(jù)輸出;psq(si,qi)為滿足條件的分類屬性集合;η為模糊自相關(guān)融合調(diào)度結(jié)果。
云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的碼元調(diào)制輸出為:
(9)
式中:ti為碼元調(diào)制結(jié)果輸出的時間間隔;gs(ti)為云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的語義概念集出現(xiàn)在模糊概念集S中的概率;p1,n-1為離散化的數(shù)據(jù)序列。
采用先驗樣本分析,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)碼元調(diào)制的遞歸分析模型:
(10)
式中:λ為相鄰碼元之間的躍變;μ為云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)邊緣節(jié)點分布情況;r為碼元分割點。
在模糊時間序列分析訓(xùn)練下,構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的直覺模糊度對偶集,采用元數(shù)據(jù)管理和參數(shù)模糊度辨識方法實現(xiàn)對數(shù)據(jù)的調(diào)制和融合[12]。
本文以云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)碼元調(diào)制結(jié)果為基礎(chǔ),采用統(tǒng)計分析和概率密度特征采樣方法,構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)分簇聚類融合模型[13-14],得到數(shù)據(jù)融合參數(shù)匹配集:
Kwpg=H(Q|si)+d(ωi,k)
(11)
式中:Kwpg(x,y,wi)為數(shù)據(jù)融合參數(shù)匹配集;d(ωi,k)為云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)動態(tài)融合的適應(yīng)度算子。
根據(jù)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的粗糙集特征量,為:
Wx=X(v+k)X×Kwpg
(12)
式中:Wx為粗糙集特征量;X(v+k)為云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)存儲中心衰減特征量,v為衰減特征累加值,k為衰減系數(shù)。
根據(jù)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)中的用戶行為分布時頻特征提取復(fù)共軛,實現(xiàn)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換和多屬性群決策;建立云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)對偶模糊信息之間相關(guān)關(guān)系實現(xiàn)數(shù)據(jù)元特征提取,得到元數(shù)據(jù)管理的動態(tài)參數(shù)元數(shù)據(jù)管理模型。
在上述對云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)安全編碼設(shè)計的基礎(chǔ)上,采用隨機線性加密和Hash結(jié)構(gòu)重組方法,實現(xiàn)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的加密轉(zhuǎn)換,以提高數(shù)據(jù)轉(zhuǎn)換的安全性。設(shè)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)加密密鑰協(xié)議的分布幅值為A、數(shù)據(jù)聯(lián)合特征分解的離散序列分布為x(t),采用時頻特征分解,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)加密安全轉(zhuǎn)換輸出,為:
(13)
式中:x(y+gi)為前期數(shù)據(jù)存儲結(jié)構(gòu)數(shù)據(jù)實現(xiàn)分組檢測結(jié)果,y為數(shù)據(jù)組數(shù)量,gi為數(shù)據(jù)項;x*(ui)為元數(shù)據(jù)分布序列,ui為數(shù)據(jù)結(jié)構(gòu);e為數(shù)據(jù)安全系數(shù)。
基于混沌稀疏性重排,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)加密的密鑰傳輸控制協(xié)議,為:
W(X)=[s1,s2,sK]n×Wx
(14)
式中:W(X)為密鑰傳輸控制協(xié)議;s1為用戶行為屬性數(shù)據(jù)時間序列的第1個正交特征;s2為用戶行為屬性數(shù)據(jù)時間序列的第2個正交特征;sK為用戶行為屬性數(shù)據(jù)時間序列的第K個正交特征。
根據(jù)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)用戶行為屬性數(shù)據(jù)采樣的時間延遲,構(gòu)建相空間的嵌入維數(shù),得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的稀疏性散亂特征點。在此基礎(chǔ)上,建立云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)對偶模糊信息之間的相關(guān)關(guān)系,實現(xiàn)數(shù)據(jù)元特征提取,表示為:
(15)
式中:μik為數(shù)據(jù)元特征種類;Kψ為元數(shù)據(jù)特征。
根據(jù)元特征提取結(jié)果,得到數(shù)據(jù)分布的聯(lián)合空間指向性特征分布,為:
(16)
式中:xn,G為數(shù)據(jù)分布的聯(lián)合空間指向性特征分布;G為數(shù)據(jù)特征分布采樣頻率;Δxi為數(shù)據(jù)梯度分布特征量。
結(jié)合信息聚類和自適應(yīng)學(xué)習(xí)方法,進行半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換和編碼控制[15],得到元數(shù)據(jù)轉(zhuǎn)換輸出的統(tǒng)計時間序列分量:
xn+1=(Xn-2τ)n×xn,G
(17)
式中:xn+1為元數(shù)據(jù)轉(zhuǎn)換輸出的統(tǒng)計時間序列分量;Xn-2τ為時間序列聚類。
根據(jù)上述處理,通過網(wǎng)格融合聚類分析方法[16],實現(xiàn)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的安全轉(zhuǎn)換和加密設(shè)計。
為了驗證所提方法在實現(xiàn)云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換中的應(yīng)用性能,以文獻[4]方法和文獻[5]方法作為對照,進行仿真測試分析。
設(shè)置云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)存儲的網(wǎng)格數(shù)量為14×24,網(wǎng)格對象的密度值為0.35,云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)采樣的長度為1 024,樣本數(shù)據(jù)為700個,測試集規(guī)模為120,規(guī)范化殘差特征分布系數(shù)為1.26。在此基礎(chǔ)上,進行仿真試驗。
云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)分布如圖1所示。
圖1 云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)分布Fig.1 Cloud storage dynamic semi-structured data distribution
以圖1所示數(shù)據(jù)為研究對象,對云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)進行加密安全轉(zhuǎn)換。云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換輸出結(jié)果如圖2所示。
圖2 云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換輸出結(jié)果Fig.2 Secure conversion output of cloud storage dynamic semi-structured data
由圖2可知,運用本文方法進行云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換的輸出安全性較好,抗攻擊能力和隱私性明顯優(yōu)于其他兩種方法。由于本文方法采用時頻特征分解方法,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)加密安全轉(zhuǎn)換輸出,在此基礎(chǔ)上結(jié)合信息聚類和自適應(yīng)學(xué)習(xí)方法,實現(xiàn)了半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換和編碼控制,從而提升了半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換輸出的安全系數(shù)。
測試數(shù)據(jù)轉(zhuǎn)換的收斂曲線如圖3所示。
圖3 測試數(shù)據(jù)轉(zhuǎn)換的收斂曲線Fig.3 Convergences curves of test data conversion
由圖3可知,本文方法進行數(shù)據(jù)安全轉(zhuǎn)換時的收斂穩(wěn)態(tài)性較好,比另外兩種方法更具有安全性與真實性。云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換輸出的誤碼率如表1所示。
表1 云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換輸出的誤碼率Tab.1 BER of dynamic semi-structured dataconversion output of cloud storage
由表1中的數(shù)據(jù)可知,隨著迭代次數(shù)的增加,不同方法的數(shù)據(jù)轉(zhuǎn)換輸出誤碼率均呈現(xiàn)出不斷降低的趨勢。相比較之下,采用本文方法進行云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換時輸出誤碼率更低,說明本文方法的數(shù)據(jù)傳輸結(jié)果更可靠、安全性能更好。
針對傳統(tǒng)方法的半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換能力較差、數(shù)據(jù)轉(zhuǎn)換輸出誤碼率較高的問題,本文提出基于元數(shù)據(jù)管理的半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換方法:構(gòu)建云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的Hash編碼模型;采用動態(tài)隨機碼元調(diào)制方法,進行數(shù)據(jù)編碼和輸出轉(zhuǎn)換控制設(shè)計;采用元數(shù)據(jù)管理和參數(shù)模糊度辨識的方法,實現(xiàn)數(shù)據(jù)調(diào)制和融合。根據(jù)空間特征匹配的方法構(gòu)建數(shù)據(jù)安全轉(zhuǎn)換,得到云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)的粗糙集特征量。建立云存儲動態(tài)半結(jié)構(gòu)化數(shù)據(jù)對偶模糊信息之間的相關(guān)關(guān)系,實現(xiàn)數(shù)據(jù)元特征的提取實現(xiàn)半結(jié)構(gòu)化數(shù)據(jù)的安全轉(zhuǎn)化和加密。分析試驗結(jié)果可知,采用本文方法的半結(jié)構(gòu)化數(shù)據(jù)安全轉(zhuǎn)換的穩(wěn)定性較高、輸出誤碼率較低。該結(jié)果充分驗證了本文方法的有效性與實際應(yīng)用價值。