林倩瑜
(集美大學(xué)誠(chéng)毅學(xué)院, 福建 廈門 361021)
隨著云計(jì)算技術(shù)和云服務(wù)技術(shù)的快速發(fā)展,大量用戶通過云存儲(chǔ)的方法將數(shù)據(jù)存儲(chǔ)在云系統(tǒng)中,實(shí)現(xiàn)對(duì)數(shù)據(jù)的在線調(diào)度和管理。云存儲(chǔ)系統(tǒng)中的大數(shù)據(jù)稱為云服務(wù)組合大數(shù)據(jù),云服務(wù)組合大數(shù)據(jù)的準(zhǔn)確挖掘和分類管理是保障云服務(wù)質(zhì)量的關(guān)鍵。當(dāng)采用智能挖掘和信息處理算法進(jìn)行云服務(wù)組合大數(shù)據(jù)的優(yōu)化挖掘和調(diào)度,并根據(jù)云服務(wù)組合大數(shù)據(jù)的挖掘結(jié)果構(gòu)成最優(yōu)的服務(wù)組合時(shí),可提高數(shù)據(jù)的自適應(yīng)檢索和調(diào)度性能。研究云服務(wù)組合大數(shù)據(jù)的優(yōu)化分類挖掘算法在云服務(wù)器的優(yōu)化管理和智能控制方面都具有重要意義[1]。
云服務(wù)組合大數(shù)據(jù)建立在對(duì)大規(guī)模數(shù)據(jù)集的特征提取和關(guān)聯(lián)規(guī)則約束分析基礎(chǔ)上,結(jié)合模糊信息聚類和特征提取方法,實(shí)現(xiàn)云服務(wù)組合大數(shù)據(jù)的優(yōu)化挖掘和智能檢索[2]。傳統(tǒng)方法中,對(duì)云服務(wù)組合大數(shù)據(jù)挖掘的方法有時(shí)頻分析方法、平均互信息挖掘方法、模糊挖掘方法以及網(wǎng)格挖掘方法等[3-4]。上述方法采用智能特征提取技術(shù)進(jìn)行云服務(wù)組合數(shù)據(jù)的關(guān)聯(lián)規(guī)則項(xiàng)提取和模糊聚類處理,提取云服務(wù)組合大數(shù)據(jù)集的規(guī)則知識(shí)項(xiàng),實(shí)現(xiàn)數(shù)據(jù)優(yōu)化挖掘,取得了一定的研究成果。其中,文獻(xiàn)[5]中提出一種基于模糊指向性聚類的云服務(wù)組合大數(shù)據(jù)挖掘技術(shù),采用機(jī)器學(xué)習(xí)方法進(jìn)行關(guān)聯(lián)規(guī)則數(shù)據(jù)的量化編碼,基于模糊信息融合方法對(duì)大數(shù)據(jù)進(jìn)行準(zhǔn)確挖掘,但該方法的計(jì)算信息量較大,對(duì)云組合服務(wù)大數(shù)據(jù)挖掘的實(shí)時(shí)性不好。文獻(xiàn)[6]中提出基于粗糙集和神經(jīng)網(wǎng)絡(luò)的云服務(wù)組合大數(shù)據(jù)挖掘算法,構(gòu)建云服務(wù)組合大數(shù)據(jù)的特征分布模型,采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)分類,在特征子空間中實(shí)現(xiàn)云組合服務(wù)大數(shù)據(jù)的優(yōu)化挖掘,但該方法在抗干擾能力方面性能不佳。
針對(duì)上述問題,本文提出一種基于模糊卷積神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)分類挖掘技術(shù)。首先,進(jìn)行云服務(wù)組合大數(shù)據(jù)的信息融合處理,對(duì)高維融合數(shù)據(jù)進(jìn)行頻繁項(xiàng)檢測(cè)和關(guān)聯(lián)規(guī)則特征提取;然后,對(duì)提取的關(guān)聯(lián)規(guī)則采用模糊卷積神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行屬性分類,結(jié)合特征壓縮方法對(duì)分類輸出的云服務(wù)組合大數(shù)據(jù)進(jìn)行降維處理,采用模糊聚類方法實(shí)現(xiàn)對(duì)云服務(wù)組合大數(shù)據(jù)的分類挖掘;最后,進(jìn)行仿真實(shí)驗(yàn)分析,證明了本文方法在提高云組合服務(wù)大數(shù)據(jù)挖掘能力方面的優(yōu)越性。
為實(shí)現(xiàn)云服務(wù)組合大數(shù)據(jù)的優(yōu)化挖掘,首先構(gòu)建云服務(wù)組合模式下大數(shù)據(jù)的分布式數(shù)據(jù)結(jié)構(gòu)模型,用四元組G表示云服務(wù)組合大數(shù)據(jù)的模糊分布式存儲(chǔ)中心,G=(V,E,W,C)。假設(shè)d為云服務(wù)組合大數(shù)據(jù)交互的相空間嵌入維數(shù),采用多個(gè)非線性成分聯(lián)合統(tǒng)計(jì)方法進(jìn)行云服務(wù)組合大數(shù)據(jù)的高維特征空間重構(gòu),結(jié)合模糊聚類方法進(jìn)行大數(shù)據(jù)的自適應(yīng)分類處理。根據(jù)上述分析,構(gòu)建云服務(wù)組合大數(shù)據(jù)挖掘的總體結(jié)構(gòu)模型,如圖1所示。
圖1 云服務(wù)組合大數(shù)據(jù)挖掘的總體結(jié)構(gòu)模型
云服務(wù)組合大數(shù)據(jù)挖掘過程中受到的擾動(dòng)影響因素較多,具有時(shí)變性和隨機(jī)性。采用模糊聚類方法進(jìn)行大數(shù)據(jù)信息融合[7],構(gòu)建關(guān)聯(lián)規(guī)則項(xiàng)約束方程表達(dá)云服務(wù)組合大數(shù)據(jù)的信息流模型:
xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn
(1)
其中:h(·)為云服務(wù)組合大數(shù)據(jù)分布式時(shí)間序列,表示為一個(gè)具有多維數(shù)據(jù)結(jié)構(gòu)模型的函數(shù);ωn為大數(shù)據(jù)多傳感信息融合跟蹤的觀測(cè)或測(cè)量誤差。云服務(wù)組合大數(shù)據(jù)的分布結(jié)構(gòu)模型的分布函數(shù)描述式為:
(2)
式中:p為分布式云服務(wù)組合大數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的階數(shù);α為統(tǒng)計(jì)信息采樣的時(shí)間窗口寬度。
k=0,1,…,N-1
(3)
其中an表示云服務(wù)組合大數(shù)據(jù)線性規(guī)劃模型的幅值。對(duì)于一組連續(xù)的云服務(wù)組合大數(shù)據(jù),采用連續(xù)模板匹配技術(shù)進(jìn)行大數(shù)據(jù)的分布式數(shù)據(jù)結(jié)構(gòu)分析,結(jié)合匹配相關(guān)檢測(cè)方法進(jìn)行云服務(wù)組合大數(shù)據(jù)的信息融合處理[9]。
設(shè)有m個(gè)云服務(wù)組合大數(shù)據(jù)節(jié)點(diǎn)A1,A2,…,An,每個(gè)節(jié)點(diǎn)的閉頻繁項(xiàng)集特征提取輸出表示為a1,a2,…,an?;跇O限學(xué)習(xí)方法進(jìn)行數(shù)據(jù)特征提取的全局尋優(yōu),構(gòu)造云服務(wù)組合大數(shù)據(jù)挖掘的線性規(guī)劃問題數(shù)學(xué)表達(dá)如下:
(4)
(5)
(6)
其中NI、NR和NS分別表示云服務(wù)組合大數(shù)據(jù)的平均互信息特征量和狀態(tài)分布集。
在上述采用連續(xù)模板匹配技術(shù)的大數(shù)據(jù)分布式數(shù)據(jù)結(jié)構(gòu)分析和關(guān)聯(lián)規(guī)則特征提取基礎(chǔ)上,進(jìn)行數(shù)據(jù)分類挖掘算法的優(yōu)化設(shè)計(jì)。本文提出一種基于模糊卷積神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)分類挖掘技術(shù),采用統(tǒng)計(jì)平均方法[11],構(gòu)建需要挖掘的大數(shù)據(jù)的回歸分析模型:
(7)
采用一個(gè)多元統(tǒng)計(jì)特征方程描述云服務(wù)組合大數(shù)據(jù)的擬合狀態(tài)模型為
(8)
(9)
假設(shè)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行大數(shù)據(jù)識(shí)別的學(xué)習(xí)步長(zhǎng)為η,經(jīng)過n步訓(xùn)練和學(xué)習(xí)后,采用自適應(yīng)加權(quán)算法[13],得到模糊卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行大數(shù)據(jù)特征分類器的加權(quán)系數(shù)為
(10)
采用模糊卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法[14],得到云服務(wù)組合大數(shù)據(jù)分類的自適應(yīng)學(xué)習(xí)加權(quán)系數(shù)為
(11)
在B?D,A∩B?D等規(guī)則約束項(xiàng)下,得到云服務(wù)組合大數(shù)據(jù)分類的屬性集滿足:
(12)
數(shù)據(jù)的統(tǒng)計(jì)量化集為(u,v)∈E,設(shè)A?V,B?V且A∩B=φ,采用模糊卷積神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行屬性分類,實(shí)現(xiàn)云服務(wù)組合大數(shù)據(jù)重組和數(shù)據(jù)結(jié)構(gòu)重排[14]。
在采用模糊卷積神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行屬性分類的基礎(chǔ)上,為降低計(jì)算開銷,結(jié)合特征壓縮方法對(duì)分類輸出的云服務(wù)組合大數(shù)據(jù)進(jìn)行降維處理[15]。特征壓縮器描述為
(13)
其中:
(14)
采用模糊卷積神經(jīng)網(wǎng)絡(luò)分類器得到云服務(wù)組合大數(shù)據(jù)的概念格結(jié)點(diǎn)為
(15)
對(duì)分類輸出的云服務(wù)組合大數(shù)據(jù)進(jìn)行降維處理,采用模糊聚類方法實(shí)現(xiàn)對(duì)云服務(wù)組合大數(shù)據(jù)的分類挖掘[16-17],下面詳述其實(shí)現(xiàn)過程。
輸出:云服務(wù)組合大數(shù)據(jù)分類挖掘結(jié)果α。
初始化參數(shù),從t=1開始進(jìn)行云服務(wù)組合大數(shù)據(jù)特征的自適應(yīng)尋優(yōu):
步驟1計(jì)算所有樣本云服務(wù)組合大數(shù)據(jù)挖掘的規(guī)則項(xiàng)特征點(diǎn)e(t)=y-Dα(t)。
步驟2構(gòu)建模糊卷積神經(jīng)網(wǎng)絡(luò)分類器,得到神經(jīng)網(wǎng)絡(luò)分類器的加權(quán)值:
(16)
為測(cè)試本文方法在實(shí)現(xiàn)大數(shù)據(jù)分類挖掘中的性能,進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)軟件平臺(tái)采用Matlab 7,實(shí)驗(yàn)中的大數(shù)據(jù)樣本庫(kù)采用Olivetti-Oracle Research Lab(ORL)云服務(wù)組合大數(shù)據(jù)庫(kù)。每個(gè)高維融合數(shù)據(jù)子塊閾值YHW=0.43,大數(shù)據(jù)采樣的占空比為0.5 dB,樣本訓(xùn)練集規(guī)模為120 Kbps,測(cè)試集為3 000 Kbps,卷積神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點(diǎn)數(shù)為100,輸出層為20,關(guān)聯(lián)規(guī)則特征向量的分布密度為0.14,仿真迭代次數(shù)為100,對(duì)云服務(wù)組合大數(shù)據(jù)挖掘的采樣周期為12 s。實(shí)驗(yàn)中,以數(shù)據(jù)挖掘的準(zhǔn)確召回率為測(cè)試指標(biāo):
(17)
其中:I表示挖掘大數(shù)據(jù)事務(wù)中的項(xiàng);li表示準(zhǔn)確挖掘數(shù)據(jù)的組合長(zhǎng)度;函數(shù)f(Ij,Ik)定義為
(18)
根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定進(jìn)行大數(shù)據(jù)分類挖掘的仿真實(shí)驗(yàn),得到數(shù)據(jù)挖掘的時(shí)域波形如圖2所示。
圖2 數(shù)據(jù)挖掘的時(shí)域波形
以云服務(wù)組合大數(shù)據(jù)為研究對(duì)象,采用模糊卷積神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行屬性分類。結(jié)合特征壓縮方法對(duì)分類輸出的云服務(wù)組合大數(shù)據(jù)進(jìn)行降維處理,得到特征提取結(jié)果如圖3所示。
分析圖3得知:采用本文方法進(jìn)行云服務(wù)組合大數(shù)據(jù)挖掘?qū)Ω黝悢?shù)據(jù)的圖譜分辨能力較好,數(shù)據(jù)屬性聚類性能較高,特征分辨能力較強(qiáng)。采用不同方法測(cè)試數(shù)據(jù)挖掘的準(zhǔn)確性,在相同的數(shù)據(jù)仿真條件下,以文獻(xiàn)[5]和文獻(xiàn)[6]的方法為對(duì)比。上述方法分別采用FCM方法和普通的神經(jīng)外網(wǎng)絡(luò)方法進(jìn)行數(shù)據(jù)挖掘,本文方法建立在對(duì)上述兩種方法融合改進(jìn)的基礎(chǔ)上,因此具有對(duì)比性。通過仿真得到對(duì)比結(jié)果如圖4所示。分析仿真結(jié)果發(fā)現(xiàn):本文方法進(jìn)行數(shù)據(jù)挖掘的精度比傳統(tǒng)方法分別提升了12.43%和21.76%,且迭代步數(shù)較短,說明挖掘的時(shí)效性較高。
圖3 大數(shù)據(jù)分類挖掘的特征提取結(jié)果
圖4 數(shù)據(jù)挖掘準(zhǔn)確性對(duì)比
云服務(wù)組合大數(shù)據(jù)的準(zhǔn)確挖掘和分類管理是保障云服務(wù)質(zhì)量的關(guān)鍵。根據(jù)云服務(wù)組合大數(shù)據(jù)的挖掘結(jié)果構(gòu)成最優(yōu)的服務(wù)組合,提高數(shù)據(jù)的自適應(yīng)檢索和調(diào)度性能。本文提出一種基于模糊卷積神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)分類挖掘技術(shù),結(jié)合匹配相關(guān)檢測(cè)方法進(jìn)行云服務(wù)組合大數(shù)據(jù)的信息融合處理,對(duì)高維融合數(shù)據(jù)進(jìn)行頻繁項(xiàng)檢測(cè)和關(guān)聯(lián)規(guī)則特征提取。采用模糊卷積神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行屬性分類,結(jié)合特征壓縮方法對(duì)分類輸出的云服務(wù)組合大數(shù)據(jù)進(jìn)行降維處理,采用模糊聚類方法實(shí)現(xiàn)對(duì)云服務(wù)組合大數(shù)據(jù)的分類挖掘。仿真分析結(jié)果表明,采用本文方法的大數(shù)據(jù)挖掘的分類性能較好,數(shù)據(jù)挖掘精度較高。
重慶理工大學(xué)學(xué)報(bào)(自然科學(xué))2019年10期