楊繼武 河北旅游職業(yè)學院
Web數(shù)據(jù)挖掘能夠有效的為用戶提供各種網(wǎng)絡(luò)信息,并且?guī)椭脩糇钭羁斓臅r間內(nèi)尋找到自己所需要的知識,但是在Web數(shù)據(jù)挖掘發(fā)展的過程中卻并沒有能夠及及時解決之時發(fā)現(xiàn)的問題,也沒有深入的分析外部信息資源中所隱藏的知識,為此人們對于Web數(shù)據(jù)挖掘的要求也不斷增多,而通過利用云計算技術(shù)實現(xiàn)了分布式信息的獲取,提高Web數(shù)據(jù)挖掘的效果,保證知識技術(shù)的存取,有效提高Web數(shù)據(jù)挖掘的質(zhì)量。
云計算作為互聯(lián)網(wǎng)計算的一種,能夠?qū)Y源軟件信息進行共享,并且可以根據(jù)不同的方式為計算機和設(shè)備提供信息咨詢,云計算技術(shù)可以在web瀏覽器在線應(yīng)用服務(wù)程序中進行廣泛的應(yīng)用,而且云計算技術(shù)還包括各種各樣的產(chǎn)品,極大的提高數(shù)據(jù)處理的質(zhì)量和水平[1]。云計算作為信息時代的一種新興產(chǎn)物主要就是指在信息爆炸時代所產(chǎn)生的海量數(shù)據(jù),云計算技術(shù),能夠從各種海量數(shù)據(jù)中快速的針對數(shù)據(jù)信息進行收集與整理,從中發(fā)現(xiàn)具有價值的信息,通過云計算技術(shù),能夠針對數(shù)據(jù)信息進行深入挖掘,保證信息的利用效率,而且在云計算信息處理的過程中,也能夠保證生命周期得到全面的發(fā)展在云計算技術(shù)信息處理時,包括數(shù)據(jù)采集,數(shù)據(jù)存儲,數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)可視化與及數(shù)據(jù)安全管理等內(nèi)容,通過這些環(huán)節(jié)能夠保證云計算信息的整體質(zhì)量和處理水平。
虛擬化作為云計算的重要基礎(chǔ)技術(shù),能夠保證物理資源的統(tǒng)一轉(zhuǎn)換成為數(shù)字信息利用虛擬化技術(shù)金能夠提高資源利用的質(zhì)量也可以根據(jù)用戶不同的業(yè)務(wù)需求來快速的對資源進行部署,同時虛擬化技術(shù)還可以有效擴大硬件的存儲容量,保證資源軟件優(yōu)化配置,利用虛擬化技術(shù)還可以使得單CPU模擬多CPU共同運算,還能夠在同一個平臺運行不同的操作系統(tǒng),提高計算機整體的運行效率,在未來虛擬化技術(shù)快速發(fā)展的過程中,通過多元化的服務(wù)器存儲和網(wǎng)絡(luò),可以有效的將傳統(tǒng)的基礎(chǔ)設(shè)施與網(wǎng)絡(luò)資源進行緊密連接,并且成為大型的計算體系為用戶提供更加優(yōu)質(zhì)的數(shù)據(jù)信息服務(wù)[2]。
云計算的編程模型必須要關(guān)注后臺的保障性功能,尤其是在具體的執(zhí)行過程中,要保證數(shù)據(jù)存儲的合理進度,提高云計算資源利用的水平,也能夠滿足用戶實際的需求,云計算采用的編程通常會以樹狀圖的形式進行構(gòu)建,保證各種任務(wù)能夠快速準確的完成[3]。首先,云計算作為一種數(shù)據(jù)信息的服務(wù)和使用模式能夠針對各種資源信息和應(yīng)用按照實際需求來提供服務(wù),通過云計算能夠為信息技術(shù)的快速發(fā)展,提供充足的技術(shù)保障,并且成為國家大力推廣的新型技術(shù)之一,IDC模式作為數(shù)據(jù)應(yīng)用的主要平臺,必須要在云計算的基礎(chǔ)上進行發(fā)展,但是由于云計算的架構(gòu)與傳統(tǒng)的架構(gòu)存在明顯的區(qū)別,所以對于IDC的建設(shè)也存在比較明顯的區(qū)別。通過將模塊化,按照IDC主動進行劃分,能夠保證每一個電芯模塊和機架的整體數(shù)量進行統(tǒng)籌設(shè)計,并且將配電柜、UPS、制冷機等共同組成一個模塊化的IDC,保證資源利用效率實現(xiàn)最大化,同時通過這樣的標準化定制,也能夠根據(jù)實際的業(yè)務(wù)需求來進行制定,由于新型IDC模塊建設(shè)具有高靈活性,而且也能夠進行模塊化、標準化、定制化的設(shè)計,還可以通過將電源空調(diào)機柜等全部的設(shè)備,完全按照標準化的組件進行設(shè)計,保障了整個IDC設(shè)備裝配的模式化發(fā)展。
Web數(shù)據(jù)挖掘能夠利用Web、W數(shù)據(jù)挖掘、計算機語言以及信息學等多個學科共同組成。Web數(shù)據(jù)挖掘通過與外部進行有機統(tǒng)一,可以顯示出綜合性的特征,并且對Web數(shù)據(jù)挖掘的對象進行全面的分析,在Web數(shù)據(jù)挖掘的過程中又能夠?qū)Ω鞣N內(nèi)容和結(jié)構(gòu)進行全面的判斷。通過多種方法能夠有效提取數(shù)據(jù)信息獲取的效果和質(zhì)量,促進Web數(shù)據(jù)挖掘?qū)ο蟮木劢筟4]。
隨著云計算被廣泛的應(yīng)用于網(wǎng)絡(luò)安全、網(wǎng)絡(luò)數(shù)據(jù)存儲、數(shù)據(jù)傳輸?shù)确矫嫱ㄟ^與Web數(shù)據(jù)挖掘進行有機結(jié)合也能夠擴展云計算的應(yīng)用效果,尤其是在基礎(chǔ)建設(shè)的過程中,能夠保證Web數(shù)據(jù)挖掘與處理評估結(jié)果等多種工作共同發(fā)展。
在利用Web數(shù)據(jù)挖掘的過程中,通過對于用戶訪問數(shù)據(jù)以及機器人訪問數(shù)據(jù)進行分析,能夠快速的對大規(guī)模的數(shù)據(jù)進行過濾和處理,將有用的信息進行整合,而且還能夠?qū)⑾鄬Φ臄?shù)據(jù)信息轉(zhuǎn)化為xml文件,并且將文件存儲在分布式的文件體系之中,通過利用數(shù)據(jù)編程的方式可以對各種數(shù)據(jù)信息集中在數(shù)據(jù)庫之中,并且可以將所有的操作系統(tǒng)流程進行簡化,滿足數(shù)據(jù)連續(xù)傳播的效果,由于系統(tǒng)自身并不能夠進行保存和掃描,而且數(shù)據(jù)的算法也非常的簡單,所以可以有效的提高系統(tǒng)運行的質(zhì)量[5]。
在數(shù)據(jù)存儲的過程中,通過云計算技術(shù)不僅能夠提高數(shù)據(jù)存儲的效率,而且還可以對數(shù)據(jù)存儲節(jié)點失效的問題進行分析,加強數(shù)據(jù)遷移以及數(shù)據(jù)存儲的整體內(nèi)容,在云計算數(shù)據(jù)存儲的過程中,通過開源系統(tǒng)可以幫助數(shù)據(jù)的整合,加強數(shù)據(jù)存儲與計算遷移的工作效率最終實現(xiàn)商業(yè)化的發(fā)展[6]。
結(jié)論:本文對云計算的Web數(shù)據(jù)挖掘進行深入的分析和研究,能夠明確云計算環(huán)境下Web數(shù)據(jù)挖掘的處理,并且提高數(shù)據(jù)研究的整體質(zhì)量和水平。