劉子歡
摘要:本文探討了大數(shù)據(jù)時(shí)代的數(shù)據(jù)基本特征,以及數(shù)據(jù)挖掘技術(shù)與大數(shù)據(jù),分析了數(shù)據(jù)挖掘技術(shù)方法,研究了數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘技術(shù);應(yīng)用
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2020)01-0034-01
0 引言
大數(shù)據(jù)是現(xiàn)代互聯(lián)網(wǎng)信息技術(shù)發(fā)展的主要內(nèi)容,互聯(lián)網(wǎng)數(shù)據(jù)研究曾指出,互聯(lián)網(wǎng)現(xiàn)在數(shù)據(jù)以每年50%的比例在增長(zhǎng),而數(shù)據(jù)挖掘的關(guān)鍵價(jià)值是可以提高人們對(duì)大數(shù)據(jù)的加工能力,從大量的不規(guī)則數(shù)據(jù)中獲得新的信息價(jià)值,從而實(shí)現(xiàn)了數(shù)據(jù)的信息增值。數(shù)據(jù)挖掘技術(shù)是信息技術(shù)不斷進(jìn)步和發(fā)展的產(chǎn)物,它促進(jìn)信息應(yīng)用的轉(zhuǎn)型和優(yōu)化,實(shí)現(xiàn)數(shù)據(jù)信息應(yīng)用的更好發(fā)展。
1 大數(shù)據(jù)時(shí)代的數(shù)據(jù)基本特征
大數(shù)據(jù)時(shí)代,數(shù)據(jù)的顯著特征首先表現(xiàn)在于大量化,它體現(xiàn)了數(shù)據(jù)的量和數(shù)據(jù)的完整性兩個(gè)特性。大數(shù)據(jù)的另一個(gè)特征反映在多樣化,它體現(xiàn)在數(shù)據(jù)來(lái)源的多樣化,格式的多樣化,特別是其中非結(jié)構(gòu)化的數(shù)據(jù)占了大部分內(nèi)容。大數(shù)據(jù)的再一個(gè)特征方面是反映在數(shù)據(jù)的產(chǎn)生速度,大數(shù)據(jù)的數(shù)據(jù)產(chǎn)生的比較快,它很大程度上了滿足了現(xiàn)代人們對(duì)于信息的需求。大數(shù)據(jù)這些基本特征,在另一個(gè)角度則表現(xiàn)出它的珍貴之處——真實(shí)性。真實(shí)性,反應(yīng)數(shù)據(jù)的重要性對(duì)決策支持關(guān)鍵因素?,F(xiàn)行大數(shù)據(jù)的規(guī)模形態(tài),僅僅只是決策制定的一個(gè)重要因素,而真實(shí)性能夠保證信息的來(lái)源,在利用大數(shù)據(jù)信息制定相應(yīng)的決策時(shí),能夠讓所需的數(shù)據(jù)滿足信息價(jià)值的追求。
2 數(shù)據(jù)挖掘技術(shù)與大數(shù)據(jù)
隨著現(xiàn)代科學(xué)技術(shù)的不斷發(fā)展和大數(shù)據(jù)網(wǎng)絡(luò)的開(kāi)展,人工智能技術(shù)發(fā)展越來(lái)越迅猛,其中數(shù)據(jù)挖掘技術(shù)就是人工智能技術(shù)發(fā)展的一個(gè)表現(xiàn)。人工智能技術(shù)的運(yùn)用和數(shù)據(jù)挖掘技術(shù)的應(yīng)用相對(duì)應(yīng),從另一方面來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)就是依賴相應(yīng)機(jī)器的算法而實(shí)現(xiàn)的,數(shù)據(jù)挖掘技術(shù)根本目的是將規(guī)律之外的信息,或者是比較復(fù)雜的信息進(jìn)行深入的挖掘,挖掘出比較隱秘的信息,再利用這些隱秘的信息來(lái)提升它的潛在價(jià)值。數(shù)據(jù)挖掘技術(shù)對(duì)于大數(shù)據(jù)下數(shù)據(jù)應(yīng)用來(lái)說(shuō),對(duì)數(shù)據(jù)信息進(jìn)行深入研究并轉(zhuǎn)化成有意義的信息,促進(jìn)決策的生成,并保證決策可以獲得預(yù)定的應(yīng)用價(jià)值,實(shí)現(xiàn)了數(shù)據(jù)利用[1]。因此,數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)應(yīng)用環(huán)境下的一個(gè)重大應(yīng)用技術(shù)。
3 數(shù)據(jù)挖掘技術(shù)方法
基于對(duì)數(shù)據(jù)挖掘技術(shù)與大數(shù)據(jù)的關(guān)系認(rèn)識(shí),數(shù)據(jù)挖掘技術(shù)是可以實(shí)現(xiàn)從大數(shù)據(jù)中發(fā)掘不為人知的信息,來(lái)實(shí)現(xiàn)決策應(yīng)用的目的。數(shù)據(jù)挖掘技術(shù)的核心是通過(guò)數(shù)據(jù)分析方法對(duì)大數(shù)據(jù)進(jìn)行數(shù)理分析,挖掘數(shù)據(jù)的潛能[2]。
3.1 聚類分析法
聚類分析法的主要特點(diǎn)是將收集到的信息根據(jù)共通性來(lái)進(jìn)行相應(yīng)的分組和分類,讓信息以板塊的形式呈現(xiàn)。該方法將看似沒(méi)有關(guān)系的數(shù)據(jù)進(jìn)行深入研究,根據(jù)分析目標(biāo),將數(shù)據(jù)分成了不同的組別,然后利用數(shù)據(jù)之間的聯(lián)系,挖掘有價(jià)值的信息,挖掘信息的潛在價(jià)值。聚類分析法存在有一定的不足,原因在于數(shù)據(jù)信息本身存在的個(gè)性化,使得數(shù)據(jù)分析在統(tǒng)計(jì)學(xué)的計(jì)算上存在運(yùn)行難度,在數(shù)據(jù)的識(shí)別上也難以開(kāi)展。
3.2 人工神經(jīng)網(wǎng)絡(luò)分析法
人工神經(jīng)網(wǎng)絡(luò)方法是指試圖通過(guò)模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行信息處理的一種方法,它將復(fù)雜的、大批量的數(shù)據(jù)進(jìn)行分析,進(jìn)行抽象,獲得計(jì)算結(jié)果并加以利用,如趨勢(shì)分析等。人工神經(jīng)網(wǎng)絡(luò)方法主要是建立數(shù)學(xué)模型上的算法,而輸入到神經(jīng)網(wǎng)絡(luò)中的研究值都是數(shù)值型,這就要求在收集相應(yīng)數(shù)據(jù)的時(shí)候要按照自身的實(shí)際需求進(jìn)行相應(yīng)數(shù)據(jù)的分析,更好得實(shí)現(xiàn)數(shù)據(jù)的分析工作,保證數(shù)據(jù)挖掘技術(shù)的應(yīng)用。
3.3 關(guān)聯(lián)性分析法
關(guān)聯(lián)性分析法,是基于大數(shù)據(jù)的基礎(chǔ)上,發(fā)現(xiàn)數(shù)據(jù)庫(kù)中不同信息之間的聯(lián)系的一種分析技術(shù)法。關(guān)聯(lián)性分析法能夠?qū)⑹占降牟荒苤苯拥膶?duì)其進(jìn)行應(yīng)用的數(shù)據(jù)和信息進(jìn)行關(guān)聯(lián)性分析,實(shí)現(xiàn)挖掘到隱蔽性的信息和相應(yīng)處理,實(shí)現(xiàn)數(shù)據(jù)的顯性。這種分析方法是有比較好的精準(zhǔn)性和目的性,因此這種分析方法比較常應(yīng)用在數(shù)據(jù)的精密分析中,比如檔案信息管理工作。
3.4 特征性數(shù)據(jù)分析法
數(shù)據(jù)特征分析是基于對(duì)數(shù)據(jù)質(zhì)量分析的成果上,運(yùn)用計(jì)算數(shù)據(jù)特定的相關(guān)聯(lián)的特征量等手段而進(jìn)行的數(shù)據(jù)分析法,可以將得到的數(shù)據(jù)挖掘結(jié)果與先期所預(yù)達(dá)到的數(shù)據(jù)分析結(jié)果更加接近或一致,因此運(yùn)用該種方法來(lái)進(jìn)行數(shù)據(jù)分析,更好實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的分析。大數(shù)據(jù)時(shí)代,海量的數(shù)據(jù)信息呈現(xiàn)瘋狂增長(zhǎng)的勢(shì)態(tài),這使得對(duì)數(shù)據(jù)進(jìn)行整理與分析會(huì)顯得更加具有難度,在各種數(shù)據(jù)分析方法中,特征性的數(shù)據(jù)分析法是更適合數(shù)據(jù)量比較多的信息分析方法,它能夠從大量數(shù)據(jù)特征中提取到具有代表性的特征,更加有效的得到數(shù)據(jù)分析結(jié)果,實(shí)現(xiàn)信息利用。
4 數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用研究
數(shù)據(jù)挖掘技術(shù)是信息技術(shù)發(fā)展的產(chǎn)物,也是大數(shù)據(jù)時(shí)代下重要的數(shù)據(jù)分析方法,能夠促進(jìn)數(shù)據(jù)信息的實(shí)效性應(yīng)用[3]。
4.1 數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)提高行業(yè)的競(jìng)爭(zhēng)力
數(shù)據(jù)挖掘技術(shù)主要進(jìn)行對(duì)所保存的數(shù)據(jù)進(jìn)行挖掘、分析和運(yùn)用,首先它表現(xiàn)在提高行業(yè)的競(jìng)爭(zhēng)力的領(lǐng)域。該領(lǐng)域是最先應(yīng)用數(shù)據(jù)挖掘技術(shù)的,是應(yīng)用范圍較廣的領(lǐng)域。數(shù)據(jù)挖掘技術(shù)分析法可以找到數(shù)據(jù)內(nèi)部的價(jià)值,大大縮短了科學(xué)研究的時(shí)間,實(shí)現(xiàn)了行業(yè)競(jìng)爭(zhēng)力的提升。比如,現(xiàn)在很多的信息都可以通過(guò)人工智能技術(shù)進(jìn)行采集和分析,如類似淘寶的平臺(tái),他們可以從眾多個(gè)人數(shù)據(jù)所形成的大數(shù)據(jù)中分析到愛(ài)好和喜好,根據(jù)分析結(jié)果給消費(fèi)者推薦所愛(ài)好的商品,從而實(shí)現(xiàn)提高行業(yè)的競(jìng)爭(zhēng)力。再如,在制造業(yè)中應(yīng)用大數(shù)據(jù)的挖掘技術(shù),由于現(xiàn)代生活質(zhì)量的提高,人們對(duì)于基本的生活用品的質(zhì)量要求也高,所以要求有關(guān)的廠家要不斷提高產(chǎn)品的質(zhì)量,在進(jìn)行分析產(chǎn)品存在不足時(shí),可以運(yùn)用大數(shù)據(jù)的挖掘技術(shù),在海量數(shù)據(jù)中尋找不足的分析結(jié)果,幫助企業(yè)正視不足并制定相應(yīng)補(bǔ)救措施,從而幫助企業(yè)獲得更多的行業(yè)效益。
4.2 數(shù)據(jù)挖掘技術(shù)在高校管理中的具體應(yīng)用
日前,物聯(lián)網(wǎng)、云計(jì)算等信息產(chǎn)品可以將人們的行動(dòng)軌跡記錄下來(lái),構(gòu)建出各種大數(shù)據(jù)平臺(tái),也促進(jìn)數(shù)據(jù)挖掘技術(shù)在各項(xiàng)管理中的應(yīng)用,如數(shù)據(jù)挖掘技術(shù)可以有效地利用在高校管理中。高校是學(xué)生人口比較密集的地方,信息時(shí)代,學(xué)生的各類數(shù)據(jù)信息形成了一個(gè)龐大的數(shù)據(jù)量,使得高校的數(shù)據(jù)信息管理面臨了挑戰(zhàn)。通過(guò)數(shù)據(jù)挖掘技術(shù)分析方法對(duì)眾多學(xué)生信息進(jìn)行挖掘分析,利用分析結(jié)果應(yīng)用到高校的招生、教學(xué)評(píng)價(jià)、學(xué)生的思想政治工作等等方面。比如,利用數(shù)據(jù)挖掘技術(shù)分析學(xué)生對(duì)授課效果的反應(yīng),分析結(jié)果可提供為教學(xué)效果的參考依據(jù),也可監(jiān)督授課教師是否開(kāi)展有效教學(xué)工作;再如,對(duì)教學(xué)課堂或者是學(xué)生心理進(jìn)行數(shù)據(jù)分析,可以讓教師更好了解課堂教學(xué)中學(xué)生所疑惑的地方在哪里,幫助教師進(jìn)行教學(xué)方案的完善和改革,進(jìn)行針對(duì)性的教學(xué),提高教學(xué)效果;再比如,移動(dòng)學(xué)習(xí)模式應(yīng)用下,應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)影響網(wǎng)課學(xué)習(xí)的教學(xué)效果各類因素進(jìn)行分析,如在平臺(tái)上學(xué)生的學(xué)習(xí)進(jìn)度、學(xué)習(xí)疑惑等相關(guān)數(shù)據(jù),得到的分析結(jié)果可以促使教師改進(jìn)適應(yīng)移動(dòng)學(xué)習(xí)的教學(xué)辦法,促使移動(dòng)學(xué)習(xí)模式的培養(yǎng)效果完善,學(xué)習(xí)者也可獲得更多學(xué)習(xí)價(jià)值。
5 結(jié)語(yǔ)
總之,大數(shù)據(jù)的最大價(jià)值在于可以預(yù)測(cè)未來(lái)趨勢(shì),在海量數(shù)據(jù)信息中,快速發(fā)掘有價(jià)值的信息,幫助決策者做出判斷。大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)的應(yīng)用是現(xiàn)代信息分析技術(shù)的研究方向,挖掘信息潛在價(jià)值,實(shí)現(xiàn)數(shù)據(jù)應(yīng)用發(fā)展。
參考文獻(xiàn)
[1] 許麗卿.基于數(shù)據(jù)挖掘的高校教學(xué)質(zhì)量評(píng)估系統(tǒng)研究[J].信息技術(shù)與信息化,2016(08):79-82.
[2] 程軍鋒.Web數(shù)據(jù)挖掘研究[J].重慶三峽學(xué)院學(xué)報(bào),2013(3):43-45.
[3] 凌小萍,鄧伯軍.大數(shù)據(jù)時(shí)代高校思想政治教育探究[J].廣西師范大學(xué)學(xué)報(bào),2015(1):62-67.