潘錦鋒,胡小琴
(泉州信息工程學(xué)院 軟件學(xué)院,福建 泉州 362000)
隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,對(duì)網(wǎng)絡(luò)信息平臺(tái)分布式數(shù)據(jù)流的安全性提出更高的要求,需要構(gòu)建優(yōu)化的分布式大數(shù)據(jù)流大信息安全評(píng)估平臺(tái),結(jié)合對(duì)分布式大數(shù)據(jù)流大信息安全特征融合和模糊信息聚類分析的方法,實(shí)現(xiàn)對(duì)分布式大數(shù)據(jù)流大信息安全評(píng)估和融合調(diào)度,提高分布式大數(shù)據(jù)流大信息安全性,在大數(shù)據(jù)分布式融合背景下,通過分析分布式大數(shù)據(jù)流大信息安全評(píng)估平臺(tái)的融合特征量,通過自相關(guān)特征分析和統(tǒng)計(jì)信息評(píng)估,實(shí)現(xiàn)對(duì)分布式大數(shù)據(jù)流大信息安全評(píng)估平臺(tái)設(shè)計(jì)[1]。
傳統(tǒng)方法中,分布式大數(shù)據(jù)流大信息安全評(píng)估方法主要有基于模糊度融合的高效頻繁集分布式數(shù)據(jù)流安全性評(píng)估方法、基于線性相關(guān)性特征分析的分布式數(shù)據(jù)流評(píng)估方法等[2-4],采用平衡度測(cè)量的方法進(jìn)行高效頻繁集分布式數(shù)據(jù)流安全性的模糊性控制,提取高效頻繁集分布式數(shù)據(jù)流安全性管理參數(shù),通過規(guī)則性調(diào)度方法實(shí)現(xiàn)高效頻繁集分布式數(shù)據(jù)流安全性評(píng)估,但傳統(tǒng)方法進(jìn)行分布式大數(shù)據(jù)流大信息評(píng)估的自適應(yīng)性不好,特征辨識(shí)度不高[5-6]。針對(duì)上述問題,提出基于分布式數(shù)據(jù)流的大數(shù)據(jù)信息安全評(píng)估平臺(tái)。首先構(gòu)建大數(shù)據(jù)信息安全評(píng)估的數(shù)據(jù)結(jié)構(gòu)融合模型,實(shí)現(xiàn)對(duì)分布式數(shù)據(jù)流的頻繁集挖掘,根據(jù)數(shù)據(jù)的特征屬性值來確定大數(shù)據(jù)信息記錄的位置,提取分布式數(shù)據(jù)流的候選集、事務(wù)集,對(duì)大數(shù)據(jù)信息進(jìn)行安全評(píng)估。最后進(jìn)行仿真測(cè)試分析,展示了本文方法在提高大數(shù)據(jù)信息安全評(píng)估能力方面的優(yōu)越性能。
為了實(shí)現(xiàn)基于分布式數(shù)據(jù)流的大數(shù)據(jù)信息安全評(píng)估平臺(tái)設(shè)計(jì),需要構(gòu)建大數(shù)據(jù)信息安全評(píng)估的統(tǒng)計(jì)分析模型,結(jié)合頻繁項(xiàng)集特征分析,得到高效頻繁集分布式數(shù)據(jù)流融合的狀態(tài)空間分布集,在候選集支持度學(xué)習(xí)下,得到大數(shù)據(jù)信息安全評(píng)估的約束參數(shù)集,通過添加存儲(chǔ)集合元素,得到頻繁集挖掘的約束方法,得到高效頻繁集分布式數(shù)據(jù)流的節(jié)點(diǎn)異構(gòu)模型[6],通過共享資源調(diào)度和關(guān)聯(lián)融合的方法,得到數(shù)據(jù)集中迭代挖掘模式下高效頻繁集分布式數(shù)據(jù)流的傳輸模型為:
f(x)=sgn(σ1,σ2,σr)∈X
(1)
其中,(σ1,σ2,σr)∈X表示高效頻繁集分布式數(shù)據(jù)流的線性融合分布特征量,σ1、σ2、σr分別表示評(píng)估約束、存儲(chǔ)約束以及挖掘約束。采用決策性融合的方法,得到高效頻繁集分布式數(shù)據(jù)流線性加權(quán)融合聚類的決策模型描述為一個(gè)具有n個(gè)輸入和m個(gè)輸出的多維信道均衡控制模型,采用線性加權(quán)控制的方法,得到高效頻繁集分布式數(shù)據(jù)流的關(guān)聯(lián)維分布矩陣形式:
φα=x{Xn,Yn-τ,Xn-2τ}×f(x)
(2)
其中,{Xn,Yn-τ,Xn-2τ}表示高效頻繁集分布式數(shù)據(jù)流的Hash融合向量,采用信息聚類和融合的方法,構(gòu)建高效頻繁集分布式數(shù)據(jù)流的可靠性融合度參數(shù),得到高效頻繁集分布式數(shù)據(jù)流的自適應(yīng)調(diào)度模型[7]。在該模型基礎(chǔ)上,輸出的像素值是核窗口內(nèi)像素值的均值(所有像素的加權(quán)系數(shù)相等),其中,歸一化就是把要處理的量都縮放到一個(gè)范圍內(nèi),比如(0,1),以便統(tǒng)一處理和直觀量化,得到高效頻繁集分布式數(shù)據(jù)融合的線性濾波輸出為:
(3)
其中,λ、μ分別表示空間匹配和自適應(yīng)特征向量,r表示高效頻繁集分布式數(shù)據(jù)流重復(fù)信息刪除模型,根據(jù)高效頻繁集分布式數(shù)據(jù)流重復(fù)信息,得到數(shù)據(jù)結(jié)構(gòu)分析模型為:
(4)
其中,Kψ+η表示高效頻繁集分布式數(shù)據(jù)流的信息融合模型,根據(jù)信息融合結(jié)果實(shí)現(xiàn)對(duì)大數(shù)據(jù)信息的安全評(píng)估[8]。
采用閉頻繁項(xiàng)特征融合的方法,實(shí)現(xiàn)對(duì)分布式數(shù)據(jù)流的頻繁集挖掘,結(jié)合關(guān)聯(lián)規(guī)則挖掘和結(jié)構(gòu)化數(shù)據(jù)檢測(cè)的方法[9],得到高效頻繁集分布式數(shù)據(jù)流傳輸?shù)哪:隣顟B(tài)特征分布集為:
(5)
在優(yōu)化支持度下,結(jié)合空間信息均衡和反饋調(diào)節(jié),得到高效頻繁集分布式數(shù)據(jù)流安全性評(píng)估的多源信息融合分布結(jié)果為:
s(f)|=c(v)+[s1,s2,sK]n
(6)
其中,[s1,s2,sK]n表示頻繁集的事務(wù)特征分析,得到高效頻繁集分布式數(shù)據(jù)流安全性評(píng)估的融合聚類參數(shù),在t時(shí)刻得到高效頻繁集分布式數(shù)據(jù)流安全性融合的狀態(tài)特征分解函數(shù)為:
Pi(t)=s(f)|+(t-8ui)e
(7)
其中,(t-8ui)e表示高效頻繁集分布式數(shù)據(jù)流安全性融合的幅度,提取高效頻繁集分布式數(shù)據(jù)流安全性管理參數(shù),在波動(dòng)頻次分布的子空間中,得到高效頻繁集分布式數(shù)據(jù)流安全性分布的目標(biāo)函數(shù):
(8)
結(jié)合貝葉斯估計(jì)的方法,得到高效頻繁集分布式數(shù)據(jù)流安全性評(píng)估的自相關(guān)檢測(cè)模型,將兩個(gè)聚類合并程度函數(shù)H(C1,C2)當(dāng)做兩類合并的判斷依據(jù),利用邊界點(diǎn)與各類中具有點(diǎn)數(shù)的熵值構(gòu)建算法模型:
(9)
公式中c1與c2分別表示C1、C2中包含的點(diǎn)數(shù)量,c代表C1、C2中具有的邊界點(diǎn)數(shù)量,如果邊界點(diǎn)數(shù)量是零,則合并程度函數(shù)值是+∞。
通過頻繁項(xiàng)目挖掘和關(guān)聯(lián)性分析,得到高效頻繁集分布式數(shù)據(jù)流的特征分析模型為:
(10)
其中,b2-y2表示數(shù)據(jù)集挖掘的特征集。根據(jù)上述分析,構(gòu)建了高效頻繁集分布式數(shù)據(jù)流特征融合模型,提高了數(shù)據(jù)的安全評(píng)估性[10]。
采用閉頻繁項(xiàng)特征融合的方法,實(shí)現(xiàn)對(duì)分布式數(shù)據(jù)流的頻繁集挖掘,結(jié)合關(guān)聯(lián)規(guī)則挖掘和結(jié)構(gòu)化數(shù)據(jù)檢測(cè)的方法,在云融合調(diào)度模型下,構(gòu)建高效頻繁集約束的分布式數(shù)據(jù)流的自適應(yīng)調(diào)度和信息特征采樣[11],建立高效頻繁集分布式數(shù)據(jù)流的分集均衡調(diào)度集,得到頻繁集分布式數(shù)據(jù)流的傳輸增益為:
(11)
其中x1+x2表示高效頻繁集分布式數(shù)據(jù)流的融合長(zhǎng)度,Z為數(shù)據(jù)流安全性管理參數(shù)。根據(jù)高效頻繁集分布式數(shù)據(jù)流的重復(fù)信息檢測(cè)結(jié)果,通過空間均衡濾波檢測(cè),得到高效頻繁集分布式數(shù)據(jù)流的融合參數(shù)模型
(12)
(13)
(14)
其中,VS-VCE表示高效頻繁集分布式數(shù)據(jù)。采用線性相關(guān)性融合的方法,構(gòu)建高效頻繁集分布式數(shù)據(jù)流解析模型,得到頻繁集的安全評(píng)估方程為:
(15)
其中,xi-yi表示高效頻繁集分布式的數(shù)據(jù)流,根據(jù)互相關(guān)融合結(jié)果,實(shí)現(xiàn)對(duì)大數(shù)據(jù)信息的安全評(píng)估和模糊特征檢測(cè)[12]。
通過模糊信息空間聚類和特征分布式融合的方法,將數(shù)據(jù)集加載到數(shù)據(jù)聚類中心,根據(jù)數(shù)據(jù)的特征屬性值來確定大數(shù)據(jù)信息記錄的位置,采用高效頻繁集分布式數(shù)據(jù)流抗干擾融合模型,得頻繁集分布式數(shù)據(jù)流安全信息評(píng)估梯度信息分量和誤差:
Δx=ta+F(z)
(16)
結(jié)合分組樣本檢測(cè)的方法,得到高效頻繁集分布式數(shù)據(jù)流的安全評(píng)估參數(shù)集、事務(wù)集合的交集,隨著數(shù)據(jù)集復(fù)制倍數(shù)的增大,倍數(shù)增加至3倍,得到高效頻繁集分布式數(shù)據(jù)流的傳輸特征量:
(17)
其中,Ro-Io表示高效頻繁集分布式數(shù)據(jù)流的安全評(píng)估參數(shù),得到頻繁集分布式數(shù)據(jù)流的線性相關(guān)性融合輸出。根據(jù)梯度信息特征分解的方法,得到高效頻繁集分布式數(shù)據(jù)流信息評(píng)估的迭代學(xué)習(xí)算子為:
(18)
采用關(guān)聯(lián)規(guī)則算法構(gòu)建高效頻繁集分布式數(shù)據(jù)流濾波的自適應(yīng)學(xué)習(xí)模型,提高高效頻繁集分布式數(shù)據(jù)流的信息飽和度,得到高效頻繁集分布式數(shù)據(jù)信息分布的衰減特征量為:
(19)
其中,a2+b2表示高效頻繁集分布式數(shù)據(jù)流的衰減關(guān)聯(lián)系數(shù)和時(shí)間延遲,根據(jù)數(shù)據(jù)的特征屬性值來確定大數(shù)據(jù)信息記錄的位置,提取分布式數(shù)據(jù)流的候選集、事務(wù)集,根據(jù)屬性集分布實(shí)現(xiàn)對(duì)大數(shù)據(jù)信息安全評(píng)估,得到安全評(píng)估輸出的優(yōu)化函數(shù)為:
(20)
其中,U0為自適應(yīng)權(quán)重分布融合調(diào)度的方法,采用高效頻繁集分布式數(shù)據(jù)流的模糊關(guān)聯(lián)映射特征量,得到高效頻繁集分布式數(shù)據(jù)流重復(fù)信息的濾波模型,實(shí)現(xiàn)安全評(píng)估平臺(tái)的優(yōu)化設(shè)計(jì)。
為驗(yàn)證本方法的應(yīng)用性能,進(jìn)行仿真測(cè)試分析,將分布式數(shù)據(jù)流的測(cè)試樣本設(shè)定為BMSWebView 數(shù)據(jù)集,測(cè)試樣本數(shù)為2000,分布式數(shù)據(jù)流訓(xùn)練樣本數(shù)為120,訓(xùn)練迭代數(shù)為500,構(gòu)建大數(shù)據(jù)信息安全評(píng)估模型,測(cè)試不同方法安全評(píng)估的傳輸加速比,將文獻(xiàn)[4]與文獻(xiàn)[6]作為對(duì)比方法,得到大數(shù)據(jù)信息安全傳輸加速比的對(duì)比結(jié)果(見圖1)。
大數(shù)據(jù)信息安全傳輸加速比對(duì)比分析得知,本方法進(jìn)行大數(shù)據(jù)信息安全評(píng)估,提高了數(shù)據(jù)傳輸?shù)募铀俦?,主要原因在于采用高效頻繁集分布式數(shù)據(jù)流抗干擾融合模型,算法執(zhí)行時(shí)不必使用速度較慢的內(nèi)存,存儲(chǔ)器讀寫時(shí)間能大幅降低,提高了傳輸加速比。測(cè)試不同方法進(jìn)行大數(shù)據(jù)信息安全評(píng)估的時(shí)間開銷,得到的對(duì)比結(jié)果如圖2所示。
圖1 傳輸加速比 圖2 時(shí)間開銷對(duì)比
進(jìn)行大數(shù)據(jù)信息安全評(píng)估,降低了數(shù)據(jù)傳輸和安全性評(píng)估的時(shí)間開銷。結(jié)合不同方法進(jìn)行大數(shù)據(jù)信息安全評(píng)估的準(zhǔn)確性,得到的對(duì)比結(jié)果見表1。
表1 大數(shù)據(jù)信息安全評(píng)估準(zhǔn)確性測(cè)試
分析表1得知,本方法明顯高于文獻(xiàn)[4]與[6]提出的方法,大數(shù)據(jù)信息安全評(píng)估的準(zhǔn)確性較高。
本文提出基于分布式數(shù)據(jù)流的大數(shù)據(jù)信息安全評(píng)估平臺(tái),構(gòu)建優(yōu)化的分布式大數(shù)據(jù)流大信息安全評(píng)估平臺(tái),結(jié)合對(duì)分布式大數(shù)據(jù)流大信息安全特征融合和模糊信息聚類分析的方法,實(shí)現(xiàn)對(duì)分布式大數(shù)據(jù)流大信息安全評(píng)估和融合調(diào)度。結(jié)合頻繁項(xiàng)集特征分析,得到高效頻繁集分布式數(shù)據(jù)流融合的狀態(tài)空間分布集,結(jié)合貝葉斯估計(jì)的方法,得到高效頻繁集分布式數(shù)據(jù)流安全性評(píng)估的自相關(guān)檢測(cè)模型,采用線性加權(quán)控制的方法,得到高效頻繁集分布式數(shù)據(jù)流的關(guān)聯(lián)維分布矩陣形式。根據(jù)高效頻繁集分布式數(shù)據(jù)流的重復(fù)信息檢測(cè)結(jié)果,根據(jù)數(shù)據(jù)的特征屬性值來確定大數(shù)據(jù)信息記錄的位置,得到頻繁集分布式數(shù)據(jù)流安全信息評(píng)估的梯度信息分量,實(shí)現(xiàn)大數(shù)據(jù)信息安全評(píng)估平臺(tái)的優(yōu)化設(shè)計(jì)。研究得知,本文方法進(jìn)行大數(shù)據(jù)信息安全評(píng)估的準(zhǔn)確性較高,可靠性較好。