李文艷
摘要:大數(shù)據(jù)時(shí)代是信息時(shí)代的一個(gè)重要特征,實(shí)際上,在大數(shù)據(jù)時(shí)代的背景下進(jìn)行數(shù)據(jù)挖掘技術(shù)的探究與應(yīng)用其實(shí)就是通過(guò)在巨大的信息群中不斷挖掘出具有一定價(jià)值意義的信息進(jìn)行整合,在此基礎(chǔ)上對(duì)已整合的信息進(jìn)行進(jìn)一步的處理,以提高信息數(shù)據(jù)的價(jià)值。本文以此為出發(fā)點(diǎn),就大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行深入探究。
關(guān)鍵詞:大數(shù)據(jù) 數(shù)據(jù)挖掘 挖掘技術(shù)
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2016)05-0000-00
1數(shù)據(jù)挖掘與數(shù)據(jù)挖掘技術(shù)的方法分析
“數(shù)據(jù)海量、信息缺乏”是相當(dāng)多企業(yè)在數(shù)據(jù)大集中之后面臨的尷尬問(wèn)題,由此而誕生的數(shù)據(jù)挖掘技術(shù)其實(shí)就是用以處理這一尷尬問(wèn)題的技術(shù)。數(shù)據(jù)挖掘?qū)嶋H上是相對(duì)比較新型的一門(mén)學(xué)科,在幾十年的發(fā)展過(guò)程中,已經(jīng)不可同日而語(yǔ)。其實(shí)數(shù)據(jù)挖掘技術(shù)的本質(zhì)就是人工智能技術(shù),而數(shù)據(jù)挖掘技術(shù)的利用相對(duì)應(yīng)的就是指人工智能技術(shù)的開(kāi)發(fā)與應(yīng)用,也就是說(shuō)數(shù)據(jù)挖掘其實(shí)是依賴(lài)技術(shù)的提升來(lái)實(shí)現(xiàn)數(shù)據(jù)的整體創(chuàng)新的技術(shù),所以,整個(gè)數(shù)據(jù)挖掘技術(shù)實(shí)際上是非常具有信息價(jià)值的,它能夠幫助決策者更快的得到重要信息并作出決策,提高效率和準(zhǔn)確率,是非常重要的知識(shí)憑證,能夠在一定程度上提高當(dāng)下企業(yè)的整體競(jìng)爭(zhēng)力。
數(shù)據(jù)挖掘技術(shù)的核心就是分析,通過(guò)分析方法的不同來(lái)解決不同類(lèi)別的問(wèn)題,以實(shí)現(xiàn)數(shù)據(jù)挖掘的潛在內(nèi)容。簡(jiǎn)單來(lái)說(shuō)就是對(duì)癥下藥以保證藥到病除。
1.1聚類(lèi)分析法
簡(jiǎn)單來(lái)說(shuō)聚類(lèi)分析就是通過(guò)將數(shù)據(jù)對(duì)象進(jìn)行聚類(lèi)分組,然后形成板塊,將毫無(wú)邏輯的數(shù)據(jù)變成了有聯(lián)系性的分組數(shù)據(jù),然后從其中獲取具有一定價(jià)值的數(shù)據(jù)內(nèi)容進(jìn)行進(jìn)一步的利用。由于這種分析方法不能夠較好的就數(shù)據(jù)類(lèi)別、屬性進(jìn)行分類(lèi),所以聚類(lèi)分析法一般都運(yùn)用在心理學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)識(shí)別等方面。
1.2人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是通過(guò)大批量的數(shù)據(jù)進(jìn)行分析,而這種數(shù)據(jù)分析方式本身是建立在一定的數(shù)據(jù)模型基礎(chǔ)上的,因此通常都可以隨時(shí)根據(jù)數(shù)據(jù)需求進(jìn)行分類(lèi),所以人工神經(jīng)網(wǎng)絡(luò)也是當(dāng)下數(shù)據(jù)挖掘技術(shù)中最常用的一種數(shù)據(jù)分析方式之一。
1.3關(guān)聯(lián)性分析法
有時(shí)數(shù)據(jù)本身存在一定的隱蔽性使得很難通過(guò)普通的數(shù)據(jù)分析法進(jìn)行數(shù)據(jù)挖掘和利用,這就需要通過(guò)關(guān)聯(lián)性分析法完成對(duì)于數(shù)據(jù)信息的關(guān)聯(lián)性識(shí)別,來(lái)幫助人力完成對(duì)于數(shù)據(jù)分辨的任務(wù),這種數(shù)據(jù)分析方法通常是帶著某種目的性進(jìn)行的,因此比較適用于對(duì)數(shù)據(jù)精準(zhǔn)度相對(duì)較高的信息管理工作。
1.4特征性數(shù)據(jù)分析法
網(wǎng)絡(luò)數(shù)據(jù)隨著信息時(shí)代的到來(lái)變成了數(shù)據(jù)爆炸式,其數(shù)據(jù)資源十分廣泛并且得到了一定的普及,如何就網(wǎng)絡(luò)爆炸式數(shù)據(jù)進(jìn)行關(guān)于特性的分類(lèi)就成為了當(dāng)下數(shù)據(jù)整理分類(lèi)的主要內(nèi)容。在上文中提到的人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析也屬于這其中的一種,此外還有很多方法都是通過(guò)計(jì)算機(jī)來(lái)進(jìn)行虛擬數(shù)據(jù)的分類(lèi),尋找數(shù)據(jù)之間存在的普遍規(guī)律性完成數(shù)據(jù)的特性分析從而進(jìn)行進(jìn)一步分類(lèi)。
2大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用
數(shù)據(jù)挖掘技術(shù)的具體流程就是先通過(guò)對(duì)于海量數(shù)據(jù)的保存,然后就已有數(shù)據(jù)中進(jìn)行分析、整理、選擇、轉(zhuǎn)換等,數(shù)據(jù)的準(zhǔn)備工作是數(shù)據(jù)挖掘技術(shù)的前提,也是決定數(shù)據(jù)挖掘技術(shù)效率及質(zhì)量的主要因素。在完成數(shù)據(jù)準(zhǔn)備工作后進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行挖掘,然后對(duì)數(shù)據(jù)進(jìn)行評(píng)估,最后實(shí)現(xiàn)運(yùn)用。因此,數(shù)據(jù)挖掘能夠運(yùn)用到很多方面。
2.1市場(chǎng)營(yíng)銷(xiāo)領(lǐng)域
市場(chǎng)營(yíng)銷(xiāo)其實(shí)就是數(shù)據(jù)挖掘技術(shù)最早運(yùn)用的領(lǐng)域,通常根據(jù)客戶的具體需求,進(jìn)行客戶分析,將不同的消費(fèi)習(xí)慣和消費(fèi)特點(diǎn)的客戶進(jìn)行簡(jiǎn)單的分類(lèi)管理,以此來(lái)保證商品能夠順利銷(xiāo)售,并提高個(gè)人銷(xiāo)售的成功率和業(yè)績(jī)。而銷(xiāo)售的范圍也從最初的超市購(gòu)物擴(kuò)展到了包括保險(xiǎn)、銀行、電信等各個(gè)方面。
2.2科學(xué)研究領(lǐng)域
科學(xué)研究與實(shí)驗(yàn)測(cè)試等都需要對(duì)數(shù)據(jù)進(jìn)行關(guān)系分析為進(jìn)一步的實(shí)驗(yàn)和總結(jié)失敗做準(zhǔn)備,而實(shí)驗(yàn)測(cè)試和科學(xué)研究產(chǎn)生的數(shù)據(jù)往往是巨大的,因此數(shù)據(jù)挖掘技術(shù)在科學(xué)研究領(lǐng)域也得以廣泛運(yùn)用。通常都是通過(guò)科學(xué)研究?jī)?nèi)容選擇數(shù)據(jù)挖掘技術(shù)分析法進(jìn)行計(jì)算來(lái)找到數(shù)據(jù)中存在的規(guī)律,實(shí)現(xiàn)數(shù)據(jù)挖掘的部分價(jià)值——科學(xué)知識(shí)的分析與運(yùn)用。
2.3電信業(yè)領(lǐng)域
隨著信息化時(shí)代的到來(lái),電信產(chǎn)業(yè)也飛速發(fā)展起來(lái),到目前為止,電信產(chǎn)業(yè)已經(jīng)形成了一個(gè)巨大的網(wǎng)絡(luò)信息載體,如何將其中信息數(shù)據(jù)進(jìn)行整合就成為電信產(chǎn)業(yè)發(fā)展過(guò)程中的重要問(wèn)題。而數(shù)據(jù)挖掘技術(shù)的運(yùn)用則在一定程度上解決了這一問(wèn)題,大量的數(shù)據(jù)通過(guò)數(shù)據(jù)挖掘技術(shù)得到了有效分類(lèi),并在這個(gè)過(guò)程中通過(guò)運(yùn)算得出數(shù)據(jù)之間的關(guān)聯(lián)性,運(yùn)用規(guī)律進(jìn)一步進(jìn)行數(shù)據(jù)分類(lèi)。
2.4教育教學(xué)領(lǐng)域
教學(xué)評(píng)價(jià)、教學(xué)資源、學(xué)生個(gè)人基本信息等組成了教育教學(xué)領(lǐng)域的數(shù)據(jù)庫(kù),利用數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn)教學(xué)資源的優(yōu)化配置,對(duì)學(xué)生的個(gè)人信息整理歸檔,從而保證教育教學(xué)領(lǐng)域中數(shù)據(jù)整理的良好運(yùn)作。
3結(jié)語(yǔ)
綜上所述,數(shù)據(jù)挖掘技術(shù)對(duì)于當(dāng)今社會(huì)的發(fā)展有著不可替代的作用,而如何改善當(dāng)下數(shù)據(jù)挖掘技術(shù)中存在的問(wèn)題,進(jìn)一步提高數(shù)據(jù)挖掘技術(shù)的質(zhì)量和效率就成為了數(shù)據(jù)挖掘技術(shù)進(jìn)步的方向。本文通過(guò)對(duì)于數(shù)據(jù)挖掘與數(shù)據(jù)挖掘技術(shù)的方法分析和大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用兩個(gè)方面對(duì)于數(shù)據(jù)挖掘技術(shù)進(jìn)行了簡(jiǎn)要的闡述和分析,相信在未來(lái)伴隨著科學(xué)技術(shù)的進(jìn)一步發(fā)展,數(shù)據(jù)挖掘技術(shù)也將更加強(qiáng)大。
參考文獻(xiàn)
[1]程軍鋒.Web數(shù)據(jù)挖掘研究[J].重慶三峽學(xué)院學(xué)報(bào),2013(03).
[2]高麗,王麗偉.數(shù)據(jù)挖掘技術(shù)在國(guó)內(nèi)圖書(shū)館應(yīng)用領(lǐng)域的研究[J].數(shù)字技術(shù)與應(yīng)用,2015(12).
[3]陳建偉,李麗坤.數(shù)據(jù)挖掘技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2016(01).
數(shù)字技術(shù)與應(yīng)用2016年5期