柴功昊 蘇萌
摘要:隨著科技的發(fā)展和互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)據(jù)庫(kù)中各種信息不斷增多,許多重要的信息都包含在海量的數(shù)據(jù)里面,需要我們將它們從中提取出來(lái),創(chuàng)造出更多的價(jià)值、獲取更大的利益。因此產(chǎn)生了數(shù)據(jù)挖掘技術(shù)。該文介紹了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生、概念、分類,并具體分析了幾種數(shù)據(jù)挖掘技術(shù),最后探究了數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域。
關(guān)鍵詞:數(shù)據(jù)挖掘;計(jì)算智能;應(yīng)用領(lǐng)域
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)03-0016-03
數(shù)據(jù)挖掘技術(shù)在當(dāng)前是人工智能和數(shù)據(jù)庫(kù)研究的熱點(diǎn)問(wèn)題,它是一門涉及面比較廣的學(xué)科,應(yīng)用范圍非常廣泛。通常大家都比較清楚的是,人們可以用數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的存儲(chǔ),還能夠借助計(jì)算機(jī)等工具進(jìn)行數(shù)據(jù)的分析以及從大量數(shù)據(jù)中搜尋有用的知識(shí),正是基于二者的結(jié)合才促成了數(shù)據(jù)挖掘技術(shù)的誕生。在當(dāng)前日益激增的信息量中,傳統(tǒng)的搜索技術(shù)顯然不能滿足,通過(guò)數(shù)據(jù)挖掘技術(shù),在海量的數(shù)據(jù)庫(kù)中提取有用的信息,以供人們使用,更加符合現(xiàn)實(shí)的需求。此外,數(shù)據(jù)挖掘技術(shù)能夠被廣泛應(yīng)用于銷售、金融等多個(gè)領(lǐng)域,極大地推動(dòng)了信息技術(shù)的發(fā)展以及現(xiàn)代化進(jìn)程。
1 數(shù)據(jù)挖掘技術(shù)概述
1.1數(shù)據(jù)挖掘技術(shù)的產(chǎn)生
隨著科技的進(jìn)步以及網(wǎng)絡(luò)技術(shù)的發(fā)展,計(jì)算機(jī)從硬件到軟件都有著極大的進(jìn)步。隨著數(shù)據(jù)信息的迅猛增加,數(shù)據(jù)庫(kù)技術(shù)現(xiàn)在被廣泛用于各行各業(yè)之中,但是如果利用數(shù)據(jù)庫(kù)中的信息,利用其隱藏的信息價(jià)值,獲取更大的收益,成為技術(shù)工作者不斷探究的新課題。雖然信息數(shù)據(jù)迅猛增長(zhǎng),但是現(xiàn)有的數(shù)據(jù)分析工具卻無(wú)法實(shí)現(xiàn)在海量的數(shù)據(jù)中搜尋有用的信息,為決策者提供有價(jià)值的數(shù)據(jù)作出正確的決策和發(fā)展預(yù)測(cè)。為了解決此問(wèn)題,數(shù)據(jù)挖掘技術(shù)便開始發(fā)展起來(lái)。在當(dāng)前全球海量的數(shù)據(jù)資源以及各行各業(yè)巨大的需求,再加上技術(shù)工作者的不斷努力,數(shù)據(jù)挖掘技術(shù)的發(fā)展取得了巨大的成就,并被廣泛應(yīng)用于商業(yè)管理、控制、分析、設(shè)計(jì)等領(lǐng)域。
20世紀(jì)60年代,數(shù)據(jù)庫(kù)技術(shù)從基本的文件處理發(fā)展為數(shù)據(jù)庫(kù)系統(tǒng);70年代,關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)據(jù)建模工具等迅速發(fā)展起來(lái);80年代中期開始,關(guān)系數(shù)據(jù)庫(kù)被普遍采用,促進(jìn)了新型數(shù)據(jù)庫(kù)系統(tǒng)等發(fā)展。但是,隨著數(shù)據(jù)庫(kù)系統(tǒng)等不斷發(fā)展,海量的數(shù)據(jù)成為數(shù)據(jù)庫(kù)的負(fù)累,如何從其中搜尋有用的數(shù)據(jù)已經(jīng)成為非常困難的事,在不借助任何工具等情況下,人類已經(jīng)無(wú)法進(jìn)行數(shù)據(jù)的處理和分析,這樣不斷地存儲(chǔ)數(shù)據(jù)就像“墓地”,不能被人們利用,決策者不能從中提取有價(jià)值的數(shù)據(jù)進(jìn)行決策的制定和發(fā)展的預(yù)測(cè)[1]。在此種背景下,數(shù)據(jù)挖掘技術(shù)便開始發(fā)展起來(lái),并取得巨大的成就,現(xiàn)在人們已經(jīng)能夠利用數(shù)據(jù)挖掘技術(shù)挖掘數(shù)據(jù)庫(kù)中有用的信息,幫助人們實(shí)現(xiàn)信息的利用和財(cái)富的轉(zhuǎn)化。
1.2 數(shù)據(jù)挖掘技術(shù)的概念
當(dāng)前,隨著科技的發(fā)展和互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)據(jù)庫(kù)中各種信息不斷增多,數(shù)據(jù)庫(kù)技術(shù)也隨之進(jìn)步。雖然數(shù)據(jù)庫(kù)管理系統(tǒng)被運(yùn)用于各個(gè)行業(yè),但因信息量的劇增,使得數(shù)據(jù)庫(kù)管理系統(tǒng)從中提取信息的難度非常大。許多重要的信息都包含在海量的數(shù)據(jù)里面,需要我們將它們從中提取出來(lái),利用這些數(shù)據(jù)發(fā)揮更大的作用,創(chuàng)造出更多的價(jià)值,獲取更大的利益。而將這些信息從海量的數(shù)據(jù)庫(kù)中提取出來(lái)的技術(shù),通常叫做數(shù)據(jù)挖掘技術(shù)[2]。
數(shù)據(jù)挖掘技術(shù)是從海量數(shù)據(jù)庫(kù)中搜索并挖掘有用信息的一種技術(shù),幫助企業(yè)或個(gè)人通過(guò)數(shù)據(jù)之間的聯(lián)系和不容易引起注意的信息,作出正確的決策,并且通過(guò)挖掘的信息進(jìn)行預(yù)測(cè)發(fā)展趨勢(shì)。數(shù)據(jù)挖掘技術(shù)能夠利用信息發(fā)現(xiàn)未知的東西,與先假設(shè)再驗(yàn)證的數(shù)據(jù)處理技術(shù)不同,數(shù)據(jù)挖掘技術(shù)顯然更加真實(shí)準(zhǔn)備,更加能夠被廣泛采用。目前,數(shù)據(jù)挖掘技術(shù)越來(lái)越被各行各業(yè)重視并運(yùn)用,在未來(lái)也有巨大的發(fā)展前景。
1.3 數(shù)據(jù)挖掘技術(shù)的功能
數(shù)據(jù)挖掘技術(shù)的功能非常強(qiáng)大,能夠使用此技術(shù)在數(shù)據(jù)挖掘任務(wù)中尋找需要的信息。一般數(shù)據(jù)挖掘的任務(wù)分為描述和預(yù)測(cè):簡(jiǎn)單在數(shù)據(jù)庫(kù)中搜尋數(shù)據(jù)反映數(shù)據(jù)的一般特性即為描述;利用數(shù)據(jù)信息進(jìn)行推算,進(jìn)行預(yù)測(cè)即為預(yù)測(cè)。當(dāng)前,數(shù)據(jù)挖掘技術(shù)的功能有以下幾種:
1)概念或者類描述
數(shù)據(jù)一般是與概念或者類聯(lián)系著的。能夠用總結(jié)的、簡(jiǎn)單的、正確的方法進(jìn)行概念或者類的描述就被稱為概念或類描述。通過(guò)此種描述方法能夠知道:一是任務(wù)數(shù)據(jù)的特征或者整體數(shù)據(jù)的特征,二是能夠?qū)⑷蝿?wù)數(shù)據(jù)的特征與其他數(shù)據(jù)進(jìn)行特征的對(duì)比,三是能夠利用前述二者進(jìn)行概念或者類描述。
2)關(guān)聯(lián)分析
數(shù)據(jù)挖掘技術(shù)通過(guò)關(guān)聯(lián)分析能夠發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則。這些規(guī)則比較固定地展示了數(shù)據(jù)之間的聯(lián)系。數(shù)據(jù)挖掘技術(shù)的這項(xiàng)功能在事務(wù)數(shù)據(jù)分析中應(yīng)用較多。
3)分類和預(yù)測(cè)
分類是指在任務(wù)數(shù)據(jù)中找出不同類或者概念的數(shù)據(jù),而后利用分類進(jìn)行預(yù)測(cè)還沒(méi)有被發(fā)現(xiàn)的信息。預(yù)測(cè)是給建立一個(gè)模型來(lái)對(duì)不知道的數(shù)據(jù)進(jìn)行預(yù)測(cè)或者給定一個(gè)數(shù)值區(qū)間,進(jìn)行任務(wù)數(shù)據(jù)的預(yù)測(cè)。分類與預(yù)測(cè)的不同之處為:分類是利用分散的數(shù)值進(jìn)行預(yù)測(cè);而預(yù)測(cè)是利用連續(xù)數(shù)值進(jìn)行預(yù)測(cè)。
4)聚類分析
聚類就是將任務(wù)數(shù)據(jù)進(jìn)行同類的聚集,這些任務(wù)數(shù)據(jù)中有著非常高的相同點(diǎn),但是不同聚類之間的差異非常大。與分類大區(qū)別在于,聚類是進(jìn)行未知數(shù)據(jù)的類別。通過(guò)聚類,而后進(jìn)行數(shù)據(jù)的分析預(yù)測(cè)。
5)孤立點(diǎn)分析
孤立點(diǎn)一般是度量或者系統(tǒng)執(zhí)行失誤造成的,也有固定數(shù)值突變產(chǎn)生的孤立點(diǎn)。目前,很多數(shù)據(jù)挖掘技術(shù)希望通過(guò)孤立點(diǎn)分析將其影響變?yōu)樽钚?。不過(guò),一單操作很容易使重要信息損壞或者丟失,畢竟孤立點(diǎn)是非常重要的。
6)演變分析
數(shù)據(jù)不是固定不變的,而是會(huì)不斷地進(jìn)行變化,利用數(shù)據(jù)挖掘技術(shù)進(jìn)行任務(wù)數(shù)據(jù)演變分析,對(duì)其規(guī)律或者趨勢(shì)進(jìn)行預(yù)測(cè)。演變分析包括對(duì)數(shù)據(jù)的時(shí)間序列、周期進(jìn)行分析或者類似性地?cái)?shù)據(jù)分析。
2 數(shù)據(jù)挖掘技術(shù)的分類
數(shù)據(jù)挖掘技術(shù)的分類能夠根據(jù)發(fā)現(xiàn)知識(shí)的種類、挖掘的數(shù)據(jù)庫(kù)種類、采用的技術(shù)等方法進(jìn)行分類。根據(jù)采用的技術(shù)進(jìn)行分類,則主要有七種。
2.1規(guī)則歸納
規(guī)則歸納就是利用設(shè)定的統(tǒng)計(jì)方法進(jìn)行歸納對(duì)挖掘者有用的規(guī)則,關(guān)聯(lián)規(guī)則挖掘就是其中的一種。
2.2決策樹方法
所謂決策樹方法就是建立樹狀模型進(jìn)行決策集合。利用已有信息挖掘數(shù)據(jù)庫(kù)中重要的有價(jià)值的信息,構(gòu)建支點(diǎn),再根據(jù)數(shù)據(jù)的不同取值進(jìn)行分支構(gòu)造,最后通過(guò)分析形成整個(gè)的決策樹。決策者可以根據(jù)此決策樹進(jìn)行決策的制定或者預(yù)測(cè)發(fā)展趨勢(shì)。
2.3人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用比較多,主要是模擬人腦進(jìn)行數(shù)據(jù)的分析,建立非線性預(yù)測(cè)模型,從而完成分類、聚類等多種任務(wù)。
2.4遺傳算法
遺傳算法是模擬生物進(jìn)化過(guò)程的算法。它是通過(guò)將一個(gè)問(wèn)題分解為多個(gè)個(gè)體,然后在每個(gè)個(gè)體上進(jìn)行取值,從而完成信息搜索、任務(wù)挖掘。
2.5模糊技術(shù)
顧名思義,模糊技術(shù)即是利用模糊集合理論對(duì)實(shí)際問(wèn)題進(jìn)行預(yù)測(cè)、推斷等。一般來(lái)說(shuō),數(shù)據(jù)庫(kù)數(shù)據(jù)具有模糊性,通過(guò)大概的數(shù)值估計(jì),利用期望值、隨機(jī)值進(jìn)行組合,使得信息挖掘能夠定性定量的轉(zhuǎn)換。
2.6粗集方法
1982年,Pawlak(波蘭)提出的數(shù)據(jù)分析方法。粗集方法是利用等價(jià)思想將數(shù)據(jù)分散,然后利用屬性的等價(jià)進(jìn)行集合,形成決策集合。
2.7可視化技術(shù)
可視化技術(shù)即是利用最直觀的圖形方法把數(shù)據(jù)庫(kù)信息、數(shù)據(jù)的關(guān)聯(lián)等呈現(xiàn)出來(lái),決策者能夠直觀地通過(guò)圖形進(jìn)行發(fā)展趨勢(shì)的預(yù)測(cè),作出正確的決策。
3基于計(jì)算智能的數(shù)據(jù)挖掘技術(shù)的具體技術(shù)探究
3.1關(guān)聯(lián)規(guī)則的挖掘
關(guān)聯(lián)規(guī)則挖掘是關(guān)聯(lián)分析中的一種數(shù)據(jù)挖掘技術(shù),利用數(shù)據(jù)庫(kù)中海量的數(shù)據(jù)進(jìn)行有用信息間的聯(lián)系的挖掘。當(dāng)前關(guān)聯(lián)規(guī)則的挖掘已經(jīng)取得巨大的成就,當(dāng)前,關(guān)聯(lián)規(guī)則的挖掘技術(shù)有:1)多循環(huán)方式多挖掘算法,它是基本算法,包括AIS、DHP算法、分割算法等;2)并行挖掘算法,包括CD 算法、CaD算法、DD算法等;3)增量式更新算法,主要是在數(shù)據(jù)庫(kù)增加紀(jì)錄后關(guān)聯(lián)規(guī)則的挖掘算法,包括FUP、IUA、PIUA、NEWIUA算法等;4)基于約束條件的關(guān)聯(lián)規(guī)則挖掘,就是為了發(fā)現(xiàn)更多、有用、特別的關(guān)聯(lián)規(guī)則;5)挖掘多值屬性關(guān)聯(lián)規(guī)則,包括擴(kuò)展布爾屬性的關(guān)聯(lián)規(guī)則算法、K度完全方法等 [3]。
3.2分類規(guī)則的挖掘
分類規(guī)則的挖掘就是在已有數(shù)據(jù)的基礎(chǔ)上建立分類模型,利用該模型將數(shù)據(jù)庫(kù)中的數(shù)據(jù)映射到分類中,從而進(jìn)行數(shù)據(jù)預(yù)測(cè)。分類模型的構(gòu)造方法有許多種,通常有決策樹法、神經(jīng)網(wǎng)絡(luò)算法等。由于分類模型等正確率與數(shù)據(jù)、屬性等因素有關(guān),因此在進(jìn)行分類評(píng)估時(shí)需要采用以下方法:一是保留方法,將數(shù)據(jù)庫(kù)中的一部分?jǐn)?shù)據(jù)保留,其他的用于數(shù)據(jù)分析評(píng)估;二是交叉糾錯(cuò)方法,即是將分類中有重復(fù)的數(shù)據(jù)進(jìn)行提取,而后進(jìn)行測(cè)試,提高評(píng)估正確率[4]。
3.3聚類分析
聚類分析就是將特征相似的數(shù)據(jù)進(jìn)行歸類,建立成一個(gè)集合。再聚類之時(shí)要保證數(shù)據(jù)相似性最大,而不同類別的數(shù)據(jù)相似性要最小。這些數(shù)據(jù)的特性在事前并不清楚,聚類分析就是要通過(guò)將數(shù)據(jù)進(jìn)行歸類在進(jìn)行分析,發(fā)現(xiàn)有價(jià)值的信息。聚類算法一般包括基于概率的聚類算法以及基于距離的聚類算法兩種。在實(shí)際應(yīng)用中,基于概率的聚類算法因效率低下而采用較少,基于距離的聚類算法因效率高被廣泛采用。通過(guò)聚類分析,對(duì)數(shù)據(jù)進(jìn)行挖掘分析,能夠更加準(zhǔn)確地獲得更多地具有價(jià)值的信息,為決策者作出決策或者作出發(fā)展預(yù)測(cè)提供更加有力的數(shù)據(jù)支持。
3.4離群數(shù)據(jù)挖掘
離群數(shù)據(jù)就是指那些明顯跟其他數(shù)據(jù)不同的數(shù)據(jù)類型。離群數(shù)據(jù)的挖掘時(shí)數(shù)據(jù)挖掘技術(shù)中非常重要的內(nèi)容,它通過(guò)發(fā)現(xiàn)離群數(shù)據(jù)與其他數(shù)據(jù)的區(qū)別,獲取比一般數(shù)據(jù)更有價(jià)值的信息。一般離群數(shù)據(jù)主要有以下發(fā)現(xiàn)方法:一是基于統(tǒng)計(jì),即在已知的數(shù)據(jù)上進(jìn)行離群數(shù)據(jù)的挖掘;二是基于距離,即通過(guò)計(jì)算數(shù)據(jù)間的距離進(jìn)行離群數(shù)據(jù)的挖掘;三是基于偏離,即在事前知道數(shù)據(jù)的特性前提下對(duì)數(shù)據(jù)進(jìn)行檢測(cè)發(fā)現(xiàn)離群數(shù)據(jù);四是基于規(guī)則,即是根據(jù)已有規(guī)則發(fā)現(xiàn)明顯不同規(guī)則的離群數(shù)據(jù);五是離群數(shù)據(jù)發(fā)現(xiàn)的多策略方法,即是對(duì)數(shù)據(jù)進(jìn)行聚類,進(jìn)行子集的劃分,再根據(jù)觀察發(fā)現(xiàn)明顯不同的離群數(shù)據(jù)。
4數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域
隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,各行各業(yè)越來(lái)越意識(shí)到數(shù)據(jù)挖掘技術(shù)的巨大優(yōu)勢(shì),因此其應(yīng)用前景非常廣泛。數(shù)據(jù)挖掘技術(shù)的應(yīng)用主要在以下領(lǐng)域:
4.1科學(xué)研究領(lǐng)域
科學(xué)技術(shù)領(lǐng)域需要運(yùn)用各種最新技術(shù),利用最新技術(shù)進(jìn)行科學(xué)領(lǐng)域的研究。隨著科學(xué)數(shù)據(jù)收集工具的運(yùn)用,各種科學(xué)研究收集到了海量的數(shù)據(jù),但是顯然依靠人力或者傳統(tǒng)的數(shù)據(jù)分析工具是不能夠應(yīng)付的,因此必須要使用一種能夠從海量數(shù)據(jù)中自動(dòng)搜尋分析提取的工具。正是科學(xué)技術(shù)領(lǐng)域的需求,推動(dòng)了數(shù)據(jù)挖掘技術(shù)的發(fā)展以及在科學(xué)技術(shù)領(lǐng)域的應(yīng)用,并為科學(xué)研究領(lǐng)域作出了巨大的貢獻(xiàn)。比如,在遺傳研究領(lǐng)域,涉及DNA的數(shù)據(jù)非常多,而且DNA的組合、順序等更不相同,如果想要從中找出致人疾病的基因組,依靠人力進(jìn)行數(shù)據(jù)的排練組合顯然是不可能的,所以必須采用數(shù)據(jù)挖掘工具,對(duì)不同的基因組進(jìn)行分析,剔除無(wú)害的基因組,選擇出有害的基因組,然后工作人員再根據(jù)提取的數(shù)據(jù)進(jìn)行分析[5]。此外,數(shù)據(jù)挖掘技術(shù)還能運(yùn)用于對(duì)歷史發(fā)展規(guī)律的預(yù)測(cè)、對(duì)人類行為規(guī)律的預(yù)測(cè)等等。
4.2商業(yè)零售業(yè)
眾所周知,零售業(yè)有著大量的數(shù)據(jù),從進(jìn)貨到銷售,都有大量的數(shù)據(jù),尤其是隨著電子商業(yè)的發(fā)展,數(shù)據(jù)量也劇增,而處理這些數(shù)據(jù)就需要依靠數(shù)據(jù)挖掘技術(shù)。通過(guò)數(shù)據(jù)挖掘技術(shù),對(duì)銷售數(shù)據(jù)進(jìn)行分析,就能夠知道什么商品受到顧客喜愛(ài),銷售得最快,而后有針對(duì)性地進(jìn)貨[6]。利用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,就能夠通過(guò)數(shù)據(jù)分析,制定有效銷售措施,獲取最大的利益。
4.3金融投資業(yè)
金融投資業(yè)無(wú)疑是有巨大的數(shù)據(jù)的 ,儲(chǔ)蓄、投資金額等都會(huì)產(chǎn)生大量的數(shù)據(jù),銀行或者金融機(jī)構(gòu)需要根據(jù)這些數(shù)據(jù)進(jìn)行分析,從而提供有針對(duì)性的服務(wù)等。而且,通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)客戶信用、儲(chǔ)蓄特點(diǎn)、投資偏向等進(jìn)行分析,能夠很好地降低銀行的風(fēng)險(xiǎn),降低銀行壞賬死賬。而且還能通過(guò)數(shù)據(jù)分析幫助警方偵破金融犯罪活動(dòng)等。
4.4電信業(yè)
電信業(yè)隨著社會(huì)、技術(shù)的發(fā)展已經(jīng)從傳統(tǒng)的提供通話服務(wù)發(fā)展成為提供短信、e-mail、網(wǎng)絡(luò)電話等服務(wù)。移動(dòng)、聯(lián)通、電信公司就是其中發(fā)展最好的電信企業(yè),囊括了包括通話、短信、寬帶在內(nèi)的各種電信業(yè)務(wù),產(chǎn)生的數(shù)據(jù)無(wú)疑是海量的[7]。顯然不能依靠人力或者傳統(tǒng)的數(shù)據(jù)分析工具進(jìn)行數(shù)據(jù)的分析,因此,必須采用數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析,從而有效管理電信業(yè)務(wù),更好地為客戶服務(wù),促進(jìn)電信事業(yè)的發(fā)展。
5其他應(yīng)用
數(shù)據(jù)挖掘技術(shù)除了在上述領(lǐng)域進(jìn)行應(yīng)用外,還能夠廣泛應(yīng)用到其他領(lǐng)域。例如醫(yī)藥行業(yè),通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)藥品、病患等進(jìn)行分析,促進(jìn)醫(yī)藥行業(yè)的發(fā)展;在司法領(lǐng)域,可以用于案件分析、推測(cè)等;在生產(chǎn)領(lǐng)域還能夠?qū)ιa(chǎn)故障等進(jìn)行預(yù)測(cè)分析等[8]。除此之外,還有許多的領(lǐng)域都能夠進(jìn)行數(shù)據(jù)挖掘技術(shù)的應(yīng)用,并且能夠通過(guò)應(yīng)用數(shù)據(jù)挖掘技術(shù)促進(jìn)行業(yè)的發(fā)展。
6 結(jié)束語(yǔ)
隨著科學(xué)技術(shù)的發(fā)展與信息數(shù)據(jù)的激增,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為比不可少的工具。從海量的數(shù)據(jù)庫(kù)中獲取隱藏的有用的信息,利用這些信息創(chuàng)造出更大的價(jià)值。決策者利用數(shù)據(jù)挖掘技術(shù)獲取可靠的數(shù)據(jù),通過(guò)分析作出正確的決策以及對(duì)未來(lái)的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),能夠有力促進(jìn)自身的發(fā)展。當(dāng)前,數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛應(yīng)用于各行各業(yè),在金融、銷售等都需要利用數(shù)據(jù)挖掘技術(shù)進(jìn)行有用信息多提取。本文通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)產(chǎn)生、概念、功能、分類,包括對(duì)具體的數(shù)據(jù)挖掘技術(shù)進(jìn)行了探究,并指出了數(shù)據(jù)挖掘技術(shù)的巨大潛力和應(yīng)用空間。在未來(lái),隨著數(shù)據(jù)挖掘技術(shù)的不斷進(jìn)步,各行各業(yè)必然能夠獲得數(shù)據(jù)挖掘技術(shù)的好處,同時(shí)也能夠促進(jìn)現(xiàn)代化的進(jìn)步。
參考文獻(xiàn):
[1] 李小慶.銀行數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)技術(shù)全景分析[J].華南金融電腦,2010,1(11):44-47.
[2] 任榮.淺析基于遺傳算法的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù)[J].電腦知識(shí)與技術(shù),2009,5(3):696-697,702.
[3] 萬(wàn)曉燕,陳姍.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù)研究[J].現(xiàn)代計(jì)算機(jī):普及版, 2015,4(5):18-21,27.
[4] 陳小健,宋承繼.數(shù)據(jù)挖掘技術(shù)在科研項(xiàng)目量化與評(píng)價(jià)中的應(yīng)用[J].電子設(shè)計(jì)工程,2015,7(12):37-40.
[5] 吳超超,李偉春.基于隱私保護(hù)的數(shù)據(jù)挖掘技術(shù)與研究[J].科技資訊,2015(15):20-20.
[6] 劉興明.淺析數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法[J].無(wú)線互聯(lián)科技,2014,5(8):183-184.
[7] 郭玲.數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究[J].硅谷,2014(15):30-32.
[8] 王權(quán),王軍,史子新,等.數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法及其應(yīng)用[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014(19):126-127.