房庭棟
摘要:傳統(tǒng)意義上的知識獲取往往是知識工程師從專家的經(jīng)驗和既有信息體系中進行進一步的分析、篩選、比較、綜合提取所需信息。然而,由于知識工程師所擁有知識儲備量的局限性,所獲得知識的可信度應(yīng)該有所降低。目前,傳統(tǒng)的知識獲取技術(shù)對龐大的數(shù)據(jù)量無能為力,數(shù)據(jù)挖掘技術(shù)得以迅速興起并指導(dǎo)眾多實踐環(huán)節(jié)。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);分類方法;應(yīng)用
前言
近年來,隨著我國進入大數(shù)據(jù)時代,互聯(lián)網(wǎng)技術(shù)被廣泛應(yīng)用到我國各個行業(yè)領(lǐng)域,對提高我國人民的工作效率及工作質(zhì)量起到了較好的積極作用,能夠有效提高各種數(shù)據(jù)信息的利用率,為個人及組織的發(fā)展提供有利支持。通過對數(shù)據(jù)挖掘技術(shù)進行分析,探究大數(shù)據(jù)時代背景下數(shù)據(jù)挖掘技術(shù)的應(yīng)用,有利于提出一些可靠的參考依據(jù),使相關(guān)工作人員能夠更好地運用這一技術(shù),在提高工作效率的同時,降低人力成本,為我國社會長遠(yuǎn)發(fā)展提供可靠的技術(shù)支持。
1數(shù)據(jù)挖掘技術(shù)分析
1.1數(shù)據(jù)挖掘
作為一種現(xiàn)代化的技術(shù),數(shù)據(jù)挖掘技術(shù)在各個行業(yè)領(lǐng)域體現(xiàn)出較高的應(yīng)用價值,能夠在第一時間掌握相關(guān)產(chǎn)品的使用情況,對海量的數(shù)據(jù)信息進行優(yōu)化,以此提高數(shù)據(jù)信息的利用效率,為企業(yè)重要決策提供可靠的參考依據(jù)。根據(jù)以往數(shù)據(jù)挖掘技術(shù)的發(fā)展情況來看,這一技術(shù)已經(jīng)發(fā)展到能夠從模糊、復(fù)雜的數(shù)據(jù)中找出有用信息,所以在技術(shù)方面提出的要求較高,想要發(fā)揮這一技術(shù)的作用,就必須要重視對互聯(lián)網(wǎng)技術(shù)的運用。
1.2聚類分析
就當(dāng)前情況來看,聚類分析法在數(shù)據(jù)挖掘中的應(yīng)用效果較好,可以對比較抽象、理解難度較高的事物進行形象化的分組,之后按照不同的性質(zhì)對其進行分析。與傳統(tǒng)技術(shù)相比,這一方法可以快速完成海量數(shù)據(jù)的劃分處理,將其中有價值的信息找出來。同時,聚類分析包括了模糊聚類和硬聚類這兩種分類方式,其中模糊聚類可以對模糊數(shù)據(jù)進行劃分,實現(xiàn)對數(shù)據(jù)信息的有效分類;而硬聚類是一種比較貼合數(shù)據(jù)信息的分類方式。雖然以上兩種數(shù)據(jù)信息的分類方式存在一定區(qū)別,但是能夠起到同樣的效果,可以實現(xiàn)對數(shù)據(jù)信息的有效劃分。
1.3特征性數(shù)據(jù)分析
作為數(shù)據(jù)挖掘中比較常用的一種方式,特征性數(shù)據(jù)分析就是按照不同的特征對數(shù)據(jù)信息進行分析,將其中有價值的信息找出來。與其他技術(shù)相比,特征性數(shù)據(jù)分析法體現(xiàn)出較好的便捷性,在大部分?jǐn)?shù)據(jù)分析中都有著較好的應(yīng)用效果,是當(dāng)前相關(guān)人員的重點研究內(nèi)容之一。對于特征性數(shù)據(jù)分析法的應(yīng)用,可以采用各種各樣的方法,比如選擇可視化技術(shù)來進行數(shù)據(jù)的挖掘和搜集,將數(shù)據(jù)挖掘技術(shù)的功能效用充分發(fā)揮出來;比如利用遺傳基因算法來進行數(shù)據(jù)分析,實現(xiàn)對海量數(shù)據(jù)的選擇和重組;比如利用人工神經(jīng)網(wǎng)絡(luò)來進行數(shù)據(jù)收集,通過在數(shù)據(jù)終端完成神經(jīng)網(wǎng)絡(luò)的建立,實現(xiàn)對有用信息的快速搜集。
2數(shù)據(jù)挖掘技術(shù)的實踐應(yīng)用場景
數(shù)據(jù)挖掘技術(shù)已經(jīng)應(yīng)用于許多領(lǐng)域,如學(xué)校、銀行、電信、股票市場、保險、運輸、零售等領(lǐng)域得到了廣泛應(yīng)用。
2.1在電信行業(yè)中的應(yīng)用
在信息化時代背景下,電信行業(yè)的發(fā)展速度不斷加快,在帶來更多經(jīng)濟效益的同時,也出現(xiàn)了各種各樣的問題,想要滿足用戶的實際需求,就必須要提高自身的服務(wù)水平,幫助用戶解決問題。一般在電信技術(shù)的服務(wù)過程中,對數(shù)據(jù)的需求量較大,整個技術(shù)服務(wù)過程很容易受到數(shù)據(jù)流的沖擊,以致電信技術(shù)的服務(wù)質(zhì)量無法得到保障,難以解決技術(shù)服務(wù)中存在的問題。面對這種情況,需要借助數(shù)據(jù)挖掘技術(shù)來提高數(shù)據(jù)處理效率,實現(xiàn)對電信數(shù)據(jù)的有效分析,將其中的規(guī)律找出來,結(jié)合用戶提供的信息對技術(shù)服務(wù)進行改進,使電信技術(shù)的服務(wù)質(zhì)量得以有效提升。
2.2在制造行業(yè)中的應(yīng)用
隨著我國社會經(jīng)濟的快速發(fā)展,我國人民的生活水平逐漸提升,在選購各種生活產(chǎn)品的時候,提出了更高的質(zhì)量要求,這就需要制造行業(yè)對數(shù)據(jù)挖掘技術(shù)進行有效應(yīng)用,以此保證產(chǎn)品質(zhì)量,充分滿足我國人民的生活需求。具體來講,在應(yīng)用數(shù)據(jù)挖掘技術(shù)進行制造活動的時候,能夠?qū)φ麄€生產(chǎn)過程進行實時監(jiān)管,便于及時找出產(chǎn)品生產(chǎn)中存在的問題,結(jié)合相關(guān)數(shù)據(jù)信息對其進行處理。通過對產(chǎn)品生產(chǎn)過程的數(shù)據(jù)信息進行收集和分析,能夠為往后的產(chǎn)品生產(chǎn)活動提供可靠的參考依據(jù),幫助企業(yè)解決產(chǎn)品生產(chǎn)中存在的問題,在提高企業(yè)生產(chǎn)效率的同時,降低生產(chǎn)成本,為企業(yè)帶來更高的經(jīng)濟效益。
2.3數(shù)據(jù)挖掘技術(shù)在高校中的應(yīng)用
隨著招生規(guī)模的擴大,高校學(xué)生人數(shù)已經(jīng)達到數(shù)萬,甚至數(shù)十萬的規(guī)模??荚嚦煽兊慕y(tǒng)計和分析已經(jīng)達到數(shù)十萬的數(shù)據(jù),除了學(xué)習(xí)成績還有很多數(shù)據(jù)需要進行分類。傳統(tǒng)的學(xué)習(xí)結(jié)果分析方法不能完全滿足需求。為此,引入數(shù)據(jù)挖掘技術(shù),找出影響學(xué)生成績的真正原因,并制定相應(yīng)的優(yōu)化方案和措施,提高教育教學(xué)質(zhì)量。
2.4科研領(lǐng)域
在科研領(lǐng)域中有許多信息,比如中國知網(wǎng)數(shù)據(jù)庫中擁有很多有價值的信息,包括科研文章、期刊以及論文等,這既需要對其進行及時的分類,將同類文章放在一起。同時在數(shù)據(jù)挖掘技術(shù)應(yīng)用中信息重復(fù)等也是需要考慮的問題,要保證獲取的信息不重復(fù),還要保證信息的準(zhǔn)確性。因此在在科研領(lǐng)域中數(shù)據(jù)挖掘技術(shù)占據(jù)著非常重要的地位,開展嚴(yán)謹(jǐn)科研實驗的時候,因為實驗涉及的數(shù)據(jù)比較多,且對實驗數(shù)據(jù)進行處理時會產(chǎn)生各種各樣的數(shù)據(jù),此時要想確保數(shù)據(jù)處理的準(zhǔn)確性和簡潔性,會選用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行處理,從而就能很大程度提高實驗的精準(zhǔn)度,保障實驗結(jié)果。
2.5數(shù)據(jù)挖掘技術(shù)在金融企業(yè)中的應(yīng)用
(1)數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于證券業(yè)。數(shù)據(jù)挖掘技術(shù)作為一種分析和決策輔助工具,越來越受到國內(nèi)證券公司的重視。
(2)數(shù)據(jù)挖掘技術(shù)也應(yīng)用于銀行業(yè)。數(shù)據(jù)挖掘可以從大量的銀行交易歷史記錄中發(fā)現(xiàn)或挖掘出數(shù)據(jù)背后關(guān)聯(lián)更深、更詳細(xì)的方面。
(3)數(shù)據(jù)挖掘技術(shù)也應(yīng)用于保險業(yè)。保險福利的確定:被保險人的分類有助于確定保險福利的適當(dāng)金額。通過數(shù)據(jù)挖掘,保險賠付機構(gòu)可以得到如何確定不同行業(yè)、年齡和社會水平的人的保險福利。它還可以同時進行風(fēng)險相關(guān)性分析:如,進一步結(jié)合數(shù)據(jù)挖掘技術(shù)購買了一種保險的人是否同時購買了另一種保險,進而預(yù)測哪些客戶將可能再次購買新保險,為銷售行為提供依據(jù)。
2.6數(shù)據(jù)挖掘技術(shù)在零售企業(yè)中的應(yīng)用
從超市銷售管理系統(tǒng)、客戶信息管理等操作數(shù)據(jù)中,我們可以收集商品銷售信息、客戶信息、庫存信息以及其他信息。大量數(shù)據(jù)從各種應(yīng)用系統(tǒng)中收集,根據(jù)不同的條件分類,并存儲在數(shù)據(jù)倉庫中,允許經(jīng)理、分析師、采購人員、市場人員和客戶訪問數(shù)據(jù)。數(shù)據(jù)挖掘工具用于分析數(shù)據(jù),并為管理者提供高效的科學(xué)決策工具。
結(jié)束語
數(shù)據(jù)挖掘技術(shù)是一個發(fā)展非常迅速的領(lǐng)域。本文概述了數(shù)據(jù)挖掘的定義、目標(biāo)、相關(guān)領(lǐng)域和一般方法。21世紀(jì)是信息時代的社會?!靶畔⒉粌H是一種資源,也是一種財富”。利用所提供的眾多公開數(shù)據(jù)信息,充分進行數(shù)據(jù)挖掘,將為數(shù)據(jù)庫的應(yīng)用和人類文明的新時代開辟廣闊的前景。
參考文獻:
[1]吳琛.數(shù)據(jù)挖掘技術(shù)在互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用研究[J/OL].電腦知識與技術(shù),2019(36)[2019-11-21].https://doi.org/10.14004/j.cnki.ckt.20191114.001.
[2]康力升,莫沂錦.基于決策樹的有機農(nóng)產(chǎn)品消費偏好應(yīng)用研究[J].中國市場,2019(32):127-128.
[3]李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012,27(06):647-657.