【摘 要】隨著現(xiàn)代科技的不斷發(fā)展,云計(jì)算方式已經(jīng)擴(kuò)大了應(yīng)用領(lǐng)域,大多數(shù)企業(yè)都將運(yùn)用云計(jì)算來對(duì)互聯(lián)網(wǎng)中的數(shù)據(jù)進(jìn)行挖掘。云計(jì)算系統(tǒng)具有龐大的信息存儲(chǔ)空間,對(duì)于挖掘方式也是一種新科技的數(shù)據(jù)統(tǒng)計(jì)力量,能夠超越傳統(tǒng)的數(shù)據(jù)挖掘所不適應(yīng)的問題,并且不斷增長高效、可信的數(shù)據(jù)信息。本文首先介紹了云計(jì)算的含義及發(fā)展現(xiàn)狀,然后對(duì)云計(jì)算技術(shù)的數(shù)據(jù)挖掘的優(yōu)勢進(jìn)行分析,最后,提出了云計(jì)算技術(shù)的現(xiàn)有缺陷。
【關(guān)鍵詞】云計(jì)算;數(shù)據(jù)挖掘;綜述研究
前言:云計(jì)算的方式是針對(duì)互聯(lián)網(wǎng)中的海量存儲(chǔ)數(shù)據(jù)進(jìn)行隨意變化的計(jì)算模式,數(shù)據(jù)挖掘是從云計(jì)算的信息存儲(chǔ)中的大量、不全面、模糊信息且隨機(jī)的數(shù)據(jù)中,提取內(nèi)在的、有需要的信息和資源?!霸啤钡拇鎯?chǔ)數(shù)據(jù)不斷增長,傳統(tǒng)的數(shù)據(jù)挖掘已經(jīng)不能完全挖掘出數(shù)據(jù)的內(nèi)在信息,所以對(duì)數(shù)據(jù)挖掘提出了最新要求,云計(jì)算處理系統(tǒng)具有海量信息存儲(chǔ)和隨意變化的功能,能夠成功挖掘所需的內(nèi)在資源,成為解決大量數(shù)據(jù)挖掘的最佳挖掘方式。
一、云計(jì)算的含義
云計(jì)算發(fā)展至今已經(jīng)非常穩(wěn)定,但是到目前為止,對(duì)于云計(jì)算的含義還沒有確定。云計(jì)算的不斷更新發(fā)展,對(duì)它的定義也在產(chǎn)生變化?;ヂ?lián)網(wǎng)中對(duì)云計(jì)算的定義為:云計(jì)算是一種基于網(wǎng)絡(luò)的計(jì)算方式,以請(qǐng)求的方式將資源、軟件和信息分配到計(jì)算機(jī)和其他設(shè)備上,屬于一個(gè)公共基礎(chǔ)設(shè)施。
而我國學(xué)者認(rèn)為,云計(jì)算屬于一種在Internet上的大眾參與的計(jì)算模式,所使用的計(jì)算資源都是虛擬、動(dòng)態(tài)的,以服務(wù)的方式提供給用戶,這些資源將由存儲(chǔ)能力、交互能力、計(jì)算能力等組成。
二、云計(jì)算的現(xiàn)狀與發(fā)展
云計(jì)算在當(dāng)今社會(huì)已經(jīng)成為一個(gè)普遍的名詞。云計(jì)算屬于以多種技術(shù)混合逐漸演進(jìn)的結(jié)果。著名互聯(lián)網(wǎng)企業(yè)IBM、微軟、Yahoo等都是云計(jì)算的大力推廣使用企業(yè),Youtube、Facebook、Myspace等也都是使用云計(jì)算的成功公司。Google公司現(xiàn)已經(jīng)擁有上百萬的服務(wù)器,成為全球最大規(guī)模的云計(jì)算處理系統(tǒng),IBM、微軟、Yahoo等國際知名企業(yè)也均擁有50萬臺(tái)以上的服務(wù)器。
在我國,云計(jì)算的發(fā)展也十分迅速。早在2008年IBM已經(jīng)在我國成立起中國第一個(gè)云計(jì)算中心,隨后,電子學(xué)會(huì)成立了云計(jì)算專家委員會(huì)。翌年,電子學(xué)會(huì)舉辦了首屆中國云計(jì)算大會(huì)。現(xiàn)如今,我國的云計(jì)算平臺(tái)已經(jīng)更新了多個(gè)版本。
三、云計(jì)算的特點(diǎn)
云計(jì)算模式具有以下7大特點(diǎn):
(一)服務(wù)器規(guī)模巨大。云計(jì)算服務(wù)器的規(guī)模非常強(qiáng)大,云系統(tǒng)對(duì)信息處理、挖掘、統(tǒng)計(jì)具有超強(qiáng)能力。
(二)資源虛擬化。云計(jì)算的資源屬于虛擬化,其超強(qiáng)的功能對(duì)于用戶的位置、要求沒有界限,可以支持用戶在不同地理位置及各種終端服務(wù)的請(qǐng)求,數(shù)據(jù)的資源是動(dòng)態(tài)且無形,用戶對(duì)數(shù)據(jù)的需求無需接觸到它存在的位置,只是通過云繼續(xù)按的模式在計(jì)算機(jī)內(nèi)部運(yùn)行,并且運(yùn)行位置不固定。
(三)可靠性高。云系統(tǒng)的數(shù)據(jù)可靠性較高,在對(duì)數(shù)據(jù)挖掘過程中,會(huì)采用多副本、備份的措施來保障數(shù)據(jù)的可靠、安全性。
(四)通用性。通用性是指在云系統(tǒng)的支持下,構(gòu)建出各式各樣的應(yīng)用,應(yīng)用的運(yùn)行也是基于“云”的支撐。
(五)可擴(kuò)展性?!霸啤钡囊?guī)模也可以通過擴(kuò)展、伸縮來滿足用戶的需求,云系統(tǒng)的規(guī)模也在不斷壯大。
(六)價(jià)格低廉。云系統(tǒng)無需負(fù)擔(dān)高數(shù)據(jù)中心的管理成本,但這并不影響云系統(tǒng)的資源利用率。
三、基于云計(jì)算的海量數(shù)據(jù)挖掘優(yōu)勢
使用云計(jì)算對(duì)互聯(lián)網(wǎng)中的海量數(shù)據(jù)挖掘具有三個(gè)方面的優(yōu)勢:①由于互聯(lián)網(wǎng)中的數(shù)據(jù)龐大,要從龐大的數(shù)據(jù)庫中挖掘出理解的知識(shí),需要進(jìn)行大規(guī)模的數(shù)據(jù)挖掘,隨著互聯(lián)網(wǎng)中的數(shù)據(jù)快速壯大,數(shù)據(jù)挖掘的任務(wù)已經(jīng)超出搜索任務(wù),并且十分復(fù)雜。因此,在挖掘過程中需要具備良好的開發(fā)環(huán)境和應(yīng)用環(huán)境?;谶@種情況,使用云計(jì)算的方式進(jìn)行數(shù)據(jù)挖掘,十分合適;②云計(jì)算的運(yùn)行成本較低,并且分布于計(jì)算機(jī)環(huán)境內(nèi)部。因此,企業(yè)的數(shù)據(jù)處理成本很大程度的降低,同時(shí),對(duì)于傳統(tǒng)數(shù)據(jù)挖掘所使用的高性能機(jī)器也不再依賴;③云計(jì)算的數(shù)據(jù)挖掘十分方便,能夠利用原有設(shè)備對(duì)數(shù)據(jù)進(jìn)行大規(guī)模的處理,并且速度快、錯(cuò)誤率低。
四、基于云計(jì)算的海量數(shù)據(jù)挖掘所面臨的挑戰(zhàn)
云計(jì)算技術(shù)雖然已經(jīng)發(fā)展相對(duì)成熟,并且已經(jīng)成功運(yùn)用到各個(gè)領(lǐng)域,但是,在技術(shù)方面還有提高的空間。按照海量數(shù)據(jù)挖掘的現(xiàn)狀來看,云計(jì)算的發(fā)展還略顯欠缺。因此,利用云計(jì)算的方式來處理數(shù)據(jù)挖掘依然存在某些問題:
(一)云計(jì)算數(shù)據(jù)挖掘的算法并行存在一些問題。如果想要進(jìn)行數(shù)據(jù)挖掘,首先考慮依靠什么方法、手段來進(jìn)行,因?yàn)椴⒉皇撬械乃惴ǘ寄軌蛞揽吭朴?jì)算的方式完成目標(biāo),用戶需要選擇合適的算法,采取合適的策略,能夠提高并行效率。
(二)不確定性。數(shù)據(jù)挖掘中存在多數(shù)的不確定性,數(shù)據(jù)挖掘,實(shí)際上就是要解決不確定性所帶來的影響。因?yàn)閷?duì)數(shù)據(jù)挖掘任務(wù)的概念不明確,數(shù)據(jù)采集和預(yù)處理方式也帶有很多不確定性。
(三)挖掘結(jié)果的評(píng)價(jià)不確定。由于用戶所針對(duì)的目標(biāo)不同,都導(dǎo)致了對(duì)挖掘結(jié)果評(píng)價(jià)的不同,存在了一定的不確定性。
(四)軟件、服務(wù)方面的問題。眾所周知,云計(jì)算環(huán)境下能夠?qū)崿F(xiàn)數(shù)據(jù)挖掘,這便對(duì)數(shù)據(jù)挖掘的云服務(wù)軟件的可信度的有所依賴,服務(wù)軟件需要準(zhǔn)確、安全,在此基礎(chǔ)上提高服務(wù)的質(zhì)量。
結(jié)論:綜上所述,云計(jì)算是一種動(dòng)態(tài)定義,隨著信息科技的發(fā)展,云計(jì)算將應(yīng)用在各個(gè)領(lǐng)域中。數(shù)據(jù)挖掘是從云計(jì)算的信息存儲(chǔ)中的大量、不全面、模糊信息、隨機(jī)的數(shù)據(jù)中,提取內(nèi)在的、有用的信息和資源。文章中介紹了云計(jì)算的特點(diǎn)及發(fā)展方向,并對(duì)云計(jì)算技術(shù)的數(shù)據(jù)挖掘優(yōu)勢進(jìn)行分析,隨著云計(jì)算技術(shù)的發(fā)展進(jìn)步,定會(huì)給數(shù)據(jù)挖掘帶來更好的技術(shù)支持與新突破。
參考文獻(xiàn):
[1]黃章樹,劉晴晴.基于云計(jì)算服務(wù)模式的數(shù)據(jù)挖掘應(yīng)用平臺(tái)的構(gòu)建[J].電信科學(xué),2012,10(01):53-57.
[2]李志,李德琪,梁世傳.云計(jì)算技術(shù)及其在電站數(shù)據(jù)挖掘上的應(yīng)用研究[A].2013電力行業(yè)信息化年會(huì)論文集[C].中國電機(jī)工程學(xué)會(huì)電力信息化專業(yè)委員會(huì):2013:3.
[3]朱湘,金松昌,賈焰.一種基于Hadoop平臺(tái)的海量Web數(shù)據(jù)挖掘系統(tǒng)研究與實(shí)現(xiàn)[A].中國通信學(xué)會(huì).第九屆中國通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C].中國通信學(xué)會(huì):2012:5.
[4]張莉艷.基于云計(jì)算的鐵路信息共享平臺(tái)及關(guān)鍵技術(shù)研究[D].北京:中國鐵道科學(xué)研究院,2013.
[5]陳昊.基于移動(dòng)物聯(lián)網(wǎng)的區(qū)域協(xié)同心血管病急救模式研究[D].北京:第三軍醫(yī)大學(xué),2012.