李希敏,李書琪
(1.陜西財經(jīng)職業(yè)技術(shù)學(xué)院,陜西 咸陽 712000; 2.北京交通大學(xué)理學(xué)院,北京 100044)
隨著多源數(shù)據(jù)庫的廣泛應(yīng)用,采用多源數(shù)據(jù)庫進行數(shù)據(jù)存儲和緩存設(shè)計,可提高數(shù)據(jù)存儲的安全性。在采用多源數(shù)據(jù)庫進行數(shù)據(jù)存儲和調(diào)度過程中,由于多源數(shù)據(jù)庫緩存的隨機分布性,導(dǎo)致多源數(shù)據(jù)庫緩存的抗沖突性能不好。研究多源數(shù)據(jù)庫緩存的沖突處理方法,可提高多源數(shù)據(jù)庫緩存的輸出穩(wěn)定性和自動調(diào)度能力。對多源數(shù)據(jù)庫緩存沖突處理是建立在對多源數(shù)據(jù)庫緩存信息的輸出均衡處理基礎(chǔ)上,建立多源數(shù)據(jù)庫緩存均衡配置模型,結(jié)合空間均衡和信道均衡配置方法,進行多源數(shù)據(jù)庫緩存的沖突重組[1]。當(dāng)前,對多源數(shù)據(jù)庫緩存沖突處理方法主要有波特間隔均衡沖突處理方法、模糊均衡調(diào)度方法和自適應(yīng)均衡方法等。上述方法進行多源數(shù)據(jù)庫緩存沖突處理過程中存在抗干擾性不好的問題。對此,本文提出基于粗糙集的多源數(shù)據(jù)庫緩存沖突自動處理方法。構(gòu)造多源數(shù)據(jù)庫緩存數(shù)據(jù)疏導(dǎo)模型,提取多源數(shù)據(jù)庫緩存數(shù)據(jù)的粗糙集特征量,采用多元信息重組和大數(shù)據(jù)信息融合方法,進行多源數(shù)據(jù)庫緩存沖突的自適應(yīng)調(diào)整,并通過仿真實驗進行仿真測試分析,得出有效性結(jié)論。
構(gòu)造多源數(shù)據(jù)庫緩存數(shù)據(jù)疏導(dǎo)模型,采用負載均衡調(diào)度方法進行多源數(shù)據(jù)庫緩存的均衡配置,建立多源數(shù)據(jù)庫緩存沖突的數(shù)據(jù)庫分布式存儲結(jié)構(gòu)模型。采用分塊特征匹配和語義跟蹤識別方法進行多源數(shù)據(jù)庫緩存沖突數(shù)據(jù)結(jié)構(gòu)設(shè)計,構(gòu)建多源數(shù)據(jù)庫的分布式存儲模型?;谌悄:垲惙椒?,進行多源數(shù)據(jù)庫緩存沖突信息輸出穩(wěn)定性調(diào)節(jié)[2]。以語言變量形式作為自相關(guān)特征,采用關(guān)聯(lián)聯(lián)合概率分析方法[3-4],得到多源數(shù)據(jù)庫緩存信息的概率密度函數(shù)為p(xi,yj),其中,xi表示概率密度函數(shù)的自變量且0
p(xi|Xi-1,Yj-1)=p(xi|xi-1,yj-1)
(1)
p(yj|Xi,Yj-1)=p(yj|xi)
(2)
其中,X、Y分別表示信息分布序列的自變量列與因變量列。采用統(tǒng)計分析方法,建立多源數(shù)據(jù)庫緩存沖突信息的聯(lián)合概率密度函數(shù)的分解式為:
p(xi-1,yj-1)=p(xi-1|yj-1)p(yj-1)
(3)
利用有序加權(quán)平均方法進行信息空間融合,得到多源數(shù)據(jù)庫緩存沖突的聯(lián)合變量為ωk,即:
ωk∈Rd,d=nv+ne
(4)
其中,nv、ne分別為數(shù)據(jù)異常值以及簇頭節(jié)點數(shù),則多源數(shù)據(jù)庫緩存沖突信息的加權(quán)序列ωk是均值為uk、方差為Σk的條件高斯分布。采用響應(yīng)速度及改善用戶體驗聯(lián)合調(diào)度方法,進行多源數(shù)據(jù)庫緩存沖突控制,在數(shù)據(jù)查詢模板匹配的匹配過程中,得到模糊參量(uk,Σk)[5],此時,多源數(shù)據(jù)庫緩存沖突數(shù)據(jù)庫分布式存儲的優(yōu)化特征分布為:
ωk~N(uk,Σk)
(5)
其中:
(6)
(7)
其中,uv,k表示負載強度,ue,k表示突發(fā)損失率,Σvv,k表示負載率,Σve,k表示資源競爭沖突強度,Σee,k表示數(shù)據(jù)庫資源利用率。綜上分析,建立多源數(shù)據(jù)庫緩存沖突存儲結(jié)構(gòu)模型,結(jié)合緩存置換算法,進行多源數(shù)據(jù)庫緩存沖突處理[6]。
采用負載均衡調(diào)度方法進行多源數(shù)據(jù)庫緩存的均衡配置,結(jié)合模糊粗糙集特征提取方法進行多源數(shù)據(jù)庫緩存數(shù)據(jù)特征挖掘[7-9],得到多源數(shù)據(jù)庫緩存沖突的控制約束參量θk=(uk,Σk)。采用似然估計方法,建立多源數(shù)據(jù)庫緩存沖突的特征分布序列滿足:
(uk,Σk)~NiW(vk,Vk)
(8)
其中:
(9)
其中:iW(·)代表多源數(shù)據(jù)庫緩存沖突的Wishart分布,參量vk和Vk表示分布的統(tǒng)計特性。用戶訪問數(shù)據(jù)對象為Oi,若Oi∈Qset,Qset表示數(shù)據(jù)緩存信元集,多源數(shù)據(jù)庫緩存沖突特征分布為:
(10)
(11)
(12)
(13)
其中:Vωkωk,k是Vk的d×d維子矩陣塊,Vωk1,k是Vk的d×1維子矩陣塊,V1ωk,k是Vk的1×d維子矩陣塊,V11,k是Vk的1×1維子矩陣塊,即一個不為0的實數(shù)。根據(jù)鍵值找到數(shù)據(jù)對象返回給用戶[10],多源數(shù)據(jù)庫緩存沖突的置換矩陣為Vk∈R(d+1)×(d+1)。按照緩存置換函數(shù)計算每個Oi的極大扇出值Fi,則(uk,Σk)的聯(lián)合密度可以表示為:
(14)
其中:c是數(shù)據(jù)的保存價值。ωk為多源數(shù)據(jù)庫緩存均衡配置模型,表示為:
(15)
綜合以上過程,完成了多源數(shù)據(jù)庫緩存均衡配置模型的構(gòu)建。
構(gòu)造多源數(shù)據(jù)庫緩存數(shù)據(jù)疏導(dǎo)模型,采用負載均衡調(diào)度方法進行多源數(shù)據(jù)庫緩存的均衡配置[13-14],則多源數(shù)據(jù)庫緩存沖突的特征分解模型為:
(16)
采用多元信息重組和大數(shù)據(jù)信息融合方法,進行多源數(shù)據(jù)庫緩存沖突的自適應(yīng)調(diào)整[15-17],得到數(shù)據(jù)緩存沖突調(diào)節(jié)的條件分布p(ek|vk)可以表示為:
(17)
(18)
p(θk|Xk,Yk)=p(θk|ωk)=NiW(vk,Vk)
(19)
其中:
(20)
vk=λvk-1+1
(21)
采用粗糙集特征提取方法,得到多源數(shù)據(jù)庫緩存沖突的對象集為:
(22)
其中,f(·)表示數(shù)據(jù)庫交叉熵損失函數(shù),h(·)表示數(shù)據(jù)庫碼間串?dāng)_量。提取多源數(shù)據(jù)庫緩存數(shù)據(jù)的粗糙集特征量,采用多元信息重組[18-20]和大數(shù)據(jù)信息融合方法,進行多源數(shù)據(jù)庫緩存沖突的自適應(yīng)調(diào)整。
采用HashMap映射表進行多源數(shù)據(jù)庫緩存的沖突輸出調(diào)整,結(jié)合粗糙集映射方法[21-23],得到多源數(shù)據(jù)庫緩存沖突的置換函數(shù):
Tk(xk)=p(θk|xk,Yk)
(23)
則有:
(24)
緩存集合可表示為:
Oset={O1,O2,…,On}
(25)
其中,Oset為緩存集合,Oi為緩存對象。以Tk(xk)為約束參數(shù),進行多源數(shù)據(jù)庫緩存沖突調(diào)節(jié),得到優(yōu)化參數(shù)模型為:
(26)
其中,N是大于1的自然數(shù),且:
(27)
從頭開始遍歷Oset并檢查Oi的返回值,建立多源數(shù)據(jù)庫緩存沖突自動處理模型,通過粗糙集的分布式屬性,實現(xiàn)多源數(shù)據(jù)庫緩存沖突自動處理。
為了驗證本文方法在實現(xiàn)多源數(shù)據(jù)庫緩存沖突處理中的應(yīng)用性能,進行仿真實驗分析。實驗的算法采用Matlab設(shè)計,訪問延遲率設(shè)定為0.45,多源數(shù)據(jù)庫緩存沖突信息采樣的長度為1500 kb,多源數(shù)據(jù)的訓(xùn)練集長度為500 dB,緩存數(shù)據(jù)置換的帶寬為120 dB,從應(yīng)用服務(wù)器獲得數(shù)據(jù)對象的規(guī)模為20 Gb,數(shù)據(jù)包大小為0.0054 pJ/(bit·m4)。根據(jù)上述參數(shù)設(shè)定,進行多源數(shù)據(jù)庫緩存沖突處理仿真分析,比較不同方法下數(shù)據(jù)響應(yīng)時間如圖1所示。
圖1 緩存沖突處理時間
分析圖1可知,隨著數(shù)據(jù)存儲量的增加,緩存沖突處理時間隨之增加。當(dāng)數(shù)據(jù)量達到500 bit時,文獻[3]方法緩存處理時間為39 s,文獻[4]方法緩存處理時間為36 s,本文方法緩存處理時間僅為5 s。當(dāng)數(shù)據(jù)量達到1200 bit時,文獻[3]方法緩存處理時間為77 s,文獻[4]方法緩存處理時間為56 s,本文方法緩存處理時間僅為20 s。本文方法緩存沖突處理時間明顯低于其他2種方法,具有較好的處理效率。
為了進一步驗證本文方法的性能,采用文獻[3]方法、文獻[4]方法以及本文方法進行多源數(shù)據(jù)庫緩存沖突處理,得到多源數(shù)據(jù)庫緩存沖突出現(xiàn)的輪數(shù)。結(jié)果如圖2所示。
圖2 多源數(shù)據(jù)庫緩存沖突出現(xiàn)的輪數(shù)
分析圖2得知,簇頭數(shù)量會影響多源數(shù)據(jù)庫緩存沖突的出現(xiàn)輪數(shù)。簇頭個數(shù)增加到8個時,文獻[3]與文獻[4]方法出現(xiàn)峰值,多源數(shù)據(jù)庫緩存沖突的出現(xiàn)輪在25~30次之間,而此時本文方法不到10次。本文方法的峰值出現(xiàn)在簇頭個數(shù)為6個時,最高輪數(shù)為15次。由此說明本文方法進行多源數(shù)據(jù)庫緩存沖突處理時,沖突出現(xiàn)的輪數(shù)峰值較小,具有更好的沖突處理效果。
在以上基礎(chǔ)上進行數(shù)據(jù)庫網(wǎng)絡(luò)死亡節(jié)點數(shù)量測試,結(jié)果如圖3所示。
圖3 死亡節(jié)點的數(shù)量測試
分析圖3得知,隨著仿真時間增加,多源數(shù)據(jù)庫網(wǎng)絡(luò)開始出現(xiàn)死亡節(jié)點,并且網(wǎng)絡(luò)死亡節(jié)點個數(shù)緩慢增加。當(dāng)仿真時間為100 s時,文獻[3]方法死亡節(jié)點個數(shù)為100個,文獻[4]方法死亡節(jié)點個數(shù)為71個,本文方法死亡節(jié)點個數(shù)為11個。當(dāng)仿真時間為300 s時,文獻[3]方法死亡節(jié)點個數(shù)為279個,文獻[4]方法死亡節(jié)點個數(shù)為300個,本文方法死亡節(jié)點個數(shù)為120個。此時本文方法死亡節(jié)點個數(shù)明顯低于其他2種傳統(tǒng)方法,說明采用本文方法進行多源數(shù)據(jù)庫緩存沖突處理時,能夠有效降低死亡節(jié)點的數(shù)量,提高數(shù)據(jù)庫緩存穩(wěn)定性。
本文提出一種基于粗糙集的多源數(shù)據(jù)庫緩存沖突自動處理方法。采用響應(yīng)速度及改善用戶體驗聯(lián)合調(diào)度方法,進行多源數(shù)據(jù)庫緩存沖突控制,結(jié)合模糊粗糙集特征提取方法進行多源數(shù)據(jù)庫緩存數(shù)據(jù)特征挖掘,實現(xiàn)多源數(shù)據(jù)庫緩存沖突自動處理。通過實驗結(jié)果得出以下結(jié)論:
1)本文方法能夠有效降低緩存沖突處理時間,當(dāng)數(shù)據(jù)量為1200 bit時,本文方法緩存處理時間僅為20 s,具有較好的處理效率。
2)本文方法進行多源數(shù)據(jù)庫緩存沖突處理時,最高輪數(shù)為15次,明顯低于傳統(tǒng)方法,具有更好的沖突處理效果。
3)當(dāng)仿真時間為300 s時,本文方法死亡節(jié)點個數(shù)為120個,有效降低了死亡節(jié)點個數(shù),提高了數(shù)據(jù)庫緩存穩(wěn)定性。