林海霞
摘要:嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫優(yōu)化訪問的關(guān)鍵是對訪問目標(biāo)數(shù)據(jù)的準(zhǔn)確推薦和挖掘,以實(shí)現(xiàn)數(shù)據(jù)的準(zhǔn)確檢索。提出一種基于模糊C均值聚類的嵌入式數(shù)據(jù)庫并行推薦算法,構(gòu)建嵌入式數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)模型,進(jìn)行數(shù)據(jù)信息流屬性集特征提取。采用模糊C均值聚類算法實(shí)現(xiàn)屬性分類,以此實(shí)現(xiàn)嵌入式數(shù)據(jù)的庫并行推薦和挖掘。仿真結(jié)果表明,采用該算法進(jìn)行數(shù)據(jù)庫訪問,精度較高,執(zhí)行時間較短,性能優(yōu)越。
關(guān)鍵詞:模糊C均值聚類;嵌入式數(shù)據(jù)庫;數(shù)據(jù)挖掘
DOIDOI:10.11907/rjdk.161332
中圖分類號:TP312
文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2016)005-0050-03
0 引言
在嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫技術(shù)廣泛應(yīng)用的今天,嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫已經(jīng)成為互聯(lián)網(wǎng)、局域網(wǎng)和大規(guī)模集成系統(tǒng)的重要數(shù)據(jù)存儲介質(zhì)。嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫通過分布式云計(jì)算和云存儲方法進(jìn)行數(shù)據(jù)調(diào)度和管理,在嵌入式數(shù)據(jù)庫中,需要對網(wǎng)絡(luò)存儲介質(zhì)中的數(shù)據(jù)進(jìn)行有效地分類管理和信息獲取,并對獲取的信息進(jìn)行有機(jī)分類和聚合,以實(shí)現(xiàn)對嵌入式數(shù)據(jù)庫的準(zhǔn)確檢索和數(shù)據(jù)的并行挖掘。
傳統(tǒng)方法中,對嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫中的待檢索數(shù)據(jù)挖掘模型主要采用如高階累積量特征提取方法、時頻分析與特征提取方法、小波分析方法、支持向量機(jī)分類挖掘算法等[1-3]。上述方法通過對嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行相空間重構(gòu)分析,在高維相空間中進(jìn)行數(shù)據(jù)的特征分類和數(shù)據(jù)融合,以實(shí)現(xiàn)特定數(shù)據(jù)的典型性特征提取,達(dá)到數(shù)據(jù)匹配挖掘的目的,具有較好的應(yīng)用性能。但是傳統(tǒng)方法具有計(jì)算開銷過大、抗干擾性不好等缺點(diǎn),對此相關(guān)文獻(xiàn)進(jìn)行了算法改進(jìn)設(shè)計(jì)。其中,文獻(xiàn)[4]提出一種基于決策時分類搜索引擎構(gòu)建的嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫中的數(shù)據(jù)挖掘和文本檢索方法,建立了嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫中的待推薦檢索數(shù)據(jù)的分布結(jié)構(gòu)和數(shù)據(jù)信息流模型,對數(shù)據(jù)信息流進(jìn)行抗干擾濾波處理,實(shí)現(xiàn)嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫的數(shù)據(jù)訪問和挖掘。但上述方法在進(jìn)行數(shù)據(jù)挖掘過程中,采用關(guān)聯(lián)特征提取方法進(jìn)行數(shù)據(jù)庫特定數(shù)據(jù)推薦,在大規(guī)模數(shù)據(jù)分布和分布式云存儲數(shù)據(jù)的外界干擾下,數(shù)據(jù)挖掘的準(zhǔn)確度不高。針對上述問題,本文提出一種基于模糊C均值聚類的嵌入式數(shù)據(jù)庫并行推薦算法,構(gòu)建嵌入式數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)模型,進(jìn)行數(shù)據(jù)信息流屬性集特征提取。采用模糊C均值聚類算法實(shí)現(xiàn)屬性分類,以此實(shí)現(xiàn)嵌入式數(shù)據(jù)的庫并行推薦和挖掘。仿真結(jié)果表明,采用該算法進(jìn)行數(shù)據(jù)庫訪問,精度較高。
1 嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)信息流模型構(gòu)建
1.1 嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫結(jié)構(gòu)分析
假設(shè)V=[v1,v2,….,vn]表示同階匹配的向量,即一個存儲調(diào)度方案。經(jīng)過模糊C均值聚類結(jié)合Fourier變換,對嵌入式數(shù)據(jù)庫系統(tǒng)而言,vi代表第i個存儲狀態(tài)集合的資源節(jié)點(diǎn),β為K-L特征壓縮系數(shù)。采用K-L變換進(jìn)行特征壓縮,在數(shù)據(jù)庫存儲空間進(jìn)行模糊C均值聚類屬性特征重組的基礎(chǔ)上,在幅值穩(wěn)態(tài)下,使數(shù)據(jù)庫內(nèi)部的狀態(tài)和行為控制能力可以自動運(yùn)作,并用計(jì)算機(jī)相關(guān)語言進(jìn)行控制管理。通過上述處理實(shí)現(xiàn)了對數(shù)據(jù)庫并行推薦算法的改進(jìn),改進(jìn)算法實(shí)現(xiàn)流程如圖1所示。
3 仿真實(shí)驗(yàn)與結(jié)果分析
為了測試本文設(shè)計(jì)的算法在實(shí)現(xiàn)嵌入式網(wǎng)絡(luò)數(shù)據(jù)庫訪問和并行數(shù)據(jù)推薦中的性能,進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)建立在Matlab仿真軟件程序基礎(chǔ)上,嵌入式數(shù)據(jù)庫的并行測試數(shù)據(jù)來自大型KDDP2015網(wǎng)絡(luò)數(shù)據(jù)庫,以8個通道數(shù)據(jù)為一個數(shù)據(jù)文件進(jìn)行數(shù)據(jù)采樣。在數(shù)據(jù)采樣過程中,系統(tǒng)的CPU主頻較低,各個通道數(shù)據(jù)的排列格式采用均勻分布排列。假設(shè)數(shù)據(jù)采樣的時間間隔為1.2s,頻帶為3~15 KHz,通過上述實(shí)驗(yàn)參數(shù)和環(huán)境描述,啟動VISA資源管理器進(jìn)行數(shù)據(jù)加載,并進(jìn)行仿真,得到原始數(shù)據(jù)庫采樣信息流波形如圖2所示。
由圖2可見,原始的嵌入式數(shù)據(jù)庫信息流受干擾較大, 難以實(shí)現(xiàn)準(zhǔn)確訪問。采用模糊C均值聚類算法進(jìn)行數(shù)據(jù)聚類處理,得到模糊C均值聚類后的數(shù)據(jù)輸入如圖3所示。
由圖3可見,采用本文方法進(jìn)行數(shù)據(jù)庫的信息流聚類處理,有效提高了待檢索數(shù)據(jù)的推薦能力,提高了數(shù)據(jù)庫訪問精度。為了對比算法性能,采用本文算法和傳統(tǒng)算法,以數(shù)據(jù)庫并行推薦訪問的收斂度為測試指標(biāo),得到性能對比結(jié)構(gòu)如圖4所示。由圖可見,采用本文算法,收斂性較好,執(zhí)行時間較短,數(shù)據(jù)庫訪問和檢索數(shù)據(jù)推薦的準(zhǔn)確度較高。
參考文獻(xiàn):
[1]王曉初,王士同,包芳,等.最小化類內(nèi)距離和分類算法[J].電子與信息學(xué)報,2016,38(3):532-540.
[2]WU X,ZHU X,WU G,et al.Data mining with big data[J]. IEEE Transactions on Knowledge and Data Engineering,2014,26(1):97-107.
[3]王永貴,李鴻緒,宋曉.MapReduce模型下的模糊C均值算法研究[J].計(jì)算機(jī)工程,2014,40(10):47-51.
[4]GU R,YANG X,YAN J,et al.SHadoop:improving MapReduce performance by optimizing job execution mechanism in Hadoop clusters[J].Journal of Parallel and Distributed Computing,2014,74(3):2166-2179.
[5]GU R,HU W,HUANG Y H.Rainbow:a distributed and hierarchical RDF triple store with dynamic scalability[C].Proceedings of the 2014 IEEE International Conference on Big Data. Washington,DC:IEEE Computer Society,2014:561-566.
(責(zé)任編輯:黃 ?。?/p>