孫福利
隨著社會科技的不斷發(fā)展,計算機(jī)技術(shù)水平也在不斷的提高,在這樣一個大環(huán)境的影響下,各個行業(yè)也在大力開展數(shù)據(jù)挖掘的工作。數(shù)據(jù)挖掘技術(shù)的提升不僅能擴(kuò)大數(shù)據(jù)信息的影響范圍,還對企業(yè)發(fā)展有著一定的推動作用。因此大力發(fā)展數(shù)據(jù)發(fā)掘技術(shù)時目前各個企業(yè)的首要任務(wù)。在發(fā)展數(shù)據(jù)挖掘技術(shù)的同時還要了解到其在企業(yè)中如何運用,本文對數(shù)挖掘技術(shù)與應(yīng)用做了簡要的分析。
【關(guān)鍵詞】數(shù)據(jù)挖掘 分析 應(yīng)用 信息技術(shù)
1 數(shù)據(jù)挖掘技術(shù)的含義
1.1 大數(shù)據(jù)
在二零一一年中旬,全球著名數(shù)據(jù)研究機(jī)構(gòu)肯麥錫研究院,發(fā)表文章聲明,數(shù)據(jù)已經(jīng)逐漸滲透到人們生活工作當(dāng)中的每一個角落,已經(jīng)在人們的生產(chǎn)工作當(dāng)中占據(jù)了主導(dǎo)地位。而人們在大數(shù)據(jù)時代下對于數(shù)據(jù)的發(fā)掘與應(yīng)用,告訴了我們在不久的將來生產(chǎn)效率將明顯提高的必然走向。在文章發(fā)表的第二年上旬,美國就提出要投入巨資全面的發(fā)展大數(shù)據(jù),從而進(jìn)一步擴(kuò)大數(shù)據(jù)信息技術(shù)的影響力。據(jù)研究表明,在肯麥錫發(fā)表的同一年,全球平均每人生產(chǎn)的數(shù)據(jù)以達(dá)到204800MB,其增長趨勢還將不斷的上升。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是一門較為新穎的科學(xué)技術(shù)研究。他最早出現(xiàn)于二十世紀(jì)末,其主要面向商業(yè)群體方面的應(yīng)用,數(shù)據(jù)挖掘技術(shù)就是在種類繁多且復(fù)雜多變的數(shù)據(jù)中找出一些不易發(fā)現(xiàn)且具有很高潛在價值的數(shù)據(jù),也可以理解為就是從繁多的數(shù)據(jù)中,找到對企業(yè)有潛在價值的數(shù)據(jù),進(jìn)行不斷地轉(zhuǎn)化與分析,將得出的數(shù)據(jù)運用到企業(yè)運營當(dāng)中,從而促進(jìn)企業(yè)的發(fā)展進(jìn)程。
2 對于數(shù)據(jù)挖掘技術(shù)的研究
2.1 聚類分析研究
聚類研究就是將實物或者概念上的物質(zhì)進(jìn)行整合,將相似的物質(zhì)分結(jié)合分成一組。這種由多個相同或類似的物質(zhì)組合成一組,且根據(jù)性質(zhì)不同分成若干大組的研究方式就是聚類研究。從根本意義上講,聚類研究就是對數(shù)據(jù)進(jìn)行分類,在這過程當(dāng)中從數(shù)據(jù)上找出一些潛在價值。但是它與常見的分類方式又有著一些差別,目前,有兩種聚類研究的方式,首先是硬聚類方式,硬聚類方式就是將間隔比較近的數(shù)據(jù)進(jìn)行整合。然后就是模糊聚類方式,模糊聚類研究方式就是根據(jù)數(shù)據(jù)的屬性不同進(jìn)行整合。這兩種聚類研究方式雖然在方法上有所不一樣,但是他們卻有共同的目的。因此,數(shù)據(jù)挖掘技術(shù)研究的過程當(dāng)中,模糊聚類發(fā)和硬聚類發(fā)都可以運用。
2.2 聯(lián)系研究
在自然界當(dāng)中,各種物質(zhì)之間都具有一定的關(guān)聯(lián)性,一種物質(zhì)的改變就會引起另外一種物質(zhì)發(fā)生對應(yīng)的改變,例如在同一生態(tài)系統(tǒng)當(dāng)中,草減少了,就會引起食草動物的減少,而食草動物的減少就會引起食肉動物的減少。因此數(shù)據(jù)聯(lián)系性的研究,是以自然界生態(tài)系統(tǒng)的變化關(guān)聯(lián)性為基礎(chǔ)理論的研究??梢岳斫鉃?,在具有聯(lián)系性的諸多數(shù)據(jù)當(dāng)中,通過不斷的分析研究,找出有意義的數(shù)據(jù)。聯(lián)系性研究也是開展挖局?jǐn)?shù)據(jù)研究的一種有效途徑。
2.3 神經(jīng)網(wǎng)絡(luò)研究
神經(jīng)網(wǎng)絡(luò)研究就是指,神經(jīng)網(wǎng)絡(luò)對于一些數(shù)值較大的數(shù)據(jù)進(jìn)行一系列的總結(jié),得出計算機(jī)以及人工所分析不出來的模式趨勢的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)研究是涵蓋在自主學(xué)習(xí)的數(shù)學(xué)模式范圍之內(nèi)的,它不僅可以具有指引的學(xué)習(xí),還擁有沒有指引的聚類,但是無論是有指引的學(xué)習(xí)還是無指引的聚類放入到神經(jīng)網(wǎng)絡(luò)當(dāng)中,都是以相同的形式呈現(xiàn)出來的,現(xiàn)階段數(shù)據(jù)挖掘技術(shù)研究當(dāng)中常見的神經(jīng)網(wǎng)絡(luò)方式運用的方法是bp和rbf。
2.4 可見性技術(shù)研究
在數(shù)據(jù)挖掘技術(shù)發(fā)展過程當(dāng)中最常見的輔助類技術(shù)就是可見性技術(shù)。它通過表格、動圖、視頻等表達(dá)手法準(zhǔn)確生動的引領(lǐng)發(fā)掘掘,引領(lǐng)操作,展現(xiàn)成果等,可見性技術(shù)很好的解決了數(shù)據(jù)挖掘過程當(dāng)中所遇到的一系列表達(dá)上面的難題。為客戶能夠更好的運用和熟悉提供了便捷,對數(shù)據(jù)挖掘技術(shù)的面向群體的擴(kuò)展起到了推動性的作用。
3 數(shù)據(jù)挖掘技術(shù)的運行過程
3.1 數(shù)據(jù)的前期預(yù)備
前期數(shù)據(jù)預(yù)備是從大批量的數(shù)據(jù)當(dāng)中通過挖掘預(yù)備出所需要的數(shù)據(jù),數(shù)據(jù)預(yù)備是長期間且沒有規(guī)律性的數(shù)據(jù)累計過程。由于最先的數(shù)據(jù)對于挖掘有不利的影響,所以要進(jìn)行前期準(zhǔn)備,通過一系列手段的處理過后,才能進(jìn)行數(shù)據(jù)挖掘。數(shù)據(jù)預(yù)備的質(zhì)量是發(fā)掘技術(shù)質(zhì)量的第一影響要素。
3.2 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是整體運行的重要環(huán)節(jié),依照其基本要求來說,運用有效的方式方法,才能找出數(shù)據(jù)的規(guī)律。
3.3 模式的預(yù)估
研究:模式的預(yù)估研究就是對找出來的數(shù)據(jù),進(jìn)行綜合的統(tǒng)計分析得出有意義的數(shù)據(jù),并將其敘述成人們能夠懂的表達(dá)形式。
3.4 數(shù)據(jù)應(yīng)用
數(shù)據(jù)應(yīng)用就是對預(yù)估分析后的出的數(shù)據(jù)在實際操作當(dāng)中運用上,這是整個過程當(dāng)中最重要的部分,同樣也是數(shù)據(jù)發(fā)掘技術(shù)的根本目的。
4 數(shù)據(jù)挖掘技術(shù)的應(yīng)用
4.1 在市場上的應(yīng)用
市場銷售時最早開始用到數(shù)據(jù)挖掘技術(shù)的,其具體利用在分析用戶挖掘出客戶的一些消費特征,通過對消費者的消費特征進(jìn)行分析,然后才去有效的營銷措施來提升經(jīng)濟(jì)收益。
4.2 電腦網(wǎng)絡(luò)上的應(yīng)用
電腦網(wǎng)絡(luò)對于數(shù)據(jù)挖掘的需求較高,就比如一些網(wǎng)站搜索及運用度上,都是同過對數(shù)據(jù)進(jìn)行挖掘然后進(jìn)行統(tǒng)計分析得出最適合消費者需求的數(shù)據(jù),并且針對得到的數(shù)據(jù)制定相關(guān)的策略。
4.3 在通信行業(yè)上的運用
數(shù)據(jù)挖掘技術(shù)的持續(xù)穩(wěn)定發(fā)展,推動了通信行業(yè)的發(fā)展,而其在通信行業(yè)的應(yīng)用具體就體現(xiàn)在通信市場的大數(shù)據(jù)力找出適合其發(fā)展的道路,將企業(yè)的實際條件進(jìn)行整合,形成一個較為龐大的數(shù)據(jù)庫,對這些數(shù)據(jù)進(jìn)行挖掘就成為了促進(jìn)企業(yè)發(fā)展的主要途徑。
5 結(jié)束語
在科技不斷進(jìn)步的大環(huán)境下,社會經(jīng)濟(jì)也得到了有效的發(fā)展,挖掘數(shù)據(jù)技術(shù)的水平也在顯著的提升,給數(shù)據(jù)這種具有一定潛在價值的物質(zhì)的研究分析帶來了極大的幫助?,F(xiàn)在商業(yè)企業(yè)的重點工作就是,在企業(yè)轉(zhuǎn)型上把數(shù)據(jù)應(yīng)用到實際操作當(dāng)中,將數(shù)據(jù)轉(zhuǎn)變?yōu)槭找?,使其變成企業(yè)發(fā)展的手段。如果企業(yè)的發(fā)展進(jìn)程要想跟上社會的發(fā)展腳步,企業(yè)必須要做到了解數(shù)據(jù)挖掘技術(shù),并且將其運用到實際運營商,這對一個企業(yè)的發(fā)展及其有利。
參考文獻(xiàn)
[1]胡天狀.數(shù)據(jù)挖掘技術(shù)在教育決策支持系統(tǒng)中的應(yīng)用[D].杭州:浙江師范大學(xué),2015.
[2]吳文紹.甘肅省教育管理信息決策支持系統(tǒng)[D].蘭州:蘭州理工大學(xué),2015.
[3]丁守哲.基于云計算的建筑設(shè)計行業(yè)信息系統(tǒng)開發(fā)模式與實現(xiàn)技術(shù)研究[D].合肥:合肥工業(yè)大學(xué),2016.
[4]劉華婷,郭仁祥,姜浩.關(guān)聯(lián)規(guī)則挖掘 Apriori算法的研究與改進(jìn)[J].計算機(jī)應(yīng)用與軟件,2014(01):146-149.
[5]盧建昌,樊圍國.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用[J].廣東電力,2014.
作者單位
山東廣電網(wǎng)絡(luò)有限公司青島分公司 山東省青島市 266071