令狐永芳
摘要:互聯(lián)網(wǎng)技術的不斷發(fā)展以及和人類社會的不斷融合,使得互聯(lián)網(wǎng)技術已經(jīng)成為人類社會發(fā)展必不可少的關鍵因素之一。同時,其在逐漸發(fā)展的過程中演變成一個信息傳輸?shù)木C合體,網(wǎng)絡數(shù)據(jù)也呈現(xiàn)出一種爆炸式增長的趨勢,由此人們正式進入了大數(shù)據(jù)時代。在這個時代背景下,人們通過使用數(shù)據(jù)挖掘技術,在整合分析大量數(shù)據(jù)的基礎上實現(xiàn)從中發(fā)現(xiàn)其隱藏規(guī)律以及有價值的信息。本文從其概念剖析入手,在解析其基本數(shù)據(jù)分析方法的基礎上,就其在互聯(lián)網(wǎng)中的應用進行了詳細的分析,希望對今后數(shù)據(jù)挖掘技術的推廣使用帶來一定的幫助。
關鍵詞:數(shù)據(jù)挖掘技術;概念;分析方式;互聯(lián)網(wǎng);應用
1.何為數(shù)據(jù)挖掘技術
信息交互程度的提升以及網(wǎng)絡數(shù)據(jù)的實時分享,從某種意義上來說加速了人們的生活發(fā)展,人們在日常生活中可以時刻享受到大數(shù)據(jù)技術帶來的便利。同時在互聯(lián)網(wǎng)行業(yè)不斷發(fā)展的影響之下,互聯(lián)網(wǎng)平臺得以大規(guī)模發(fā)展,致使網(wǎng)絡數(shù)據(jù)得到了爆炸式的增長,出現(xiàn)了海量以及復雜性的特征。但是這些數(shù)據(jù)并非是全部具備使用價值的,其中包括了大量的噪聲數(shù)據(jù),導致實際的具備價值的數(shù)據(jù)所占比例相對較少,再加之數(shù)據(jù)內容可能會存在缺失及分散的現(xiàn)象,繼而引發(fā)數(shù)據(jù)質量不一致的問題。在這種情況下,我們就需要使用數(shù)據(jù)挖掘技術從這些數(shù)量龐大的且較為隨機雜亂的數(shù)據(jù)中,借助一定的算法將信息進行提取,在發(fā)現(xiàn)其中具備價值以及規(guī)律信息的數(shù)據(jù)基礎上,將數(shù)據(jù)信息庫進行重新組合。
所謂的數(shù)據(jù)挖掘并非是僅僅只有收據(jù)的收集,其中更是包括了從海量類型不同的數(shù)據(jù)中,將其中具備使用價值的信息予以挖掘,并合理使用這些數(shù)據(jù)做到社會治理數(shù)據(jù)改善以及數(shù)據(jù)系統(tǒng)使用率的提升。數(shù)據(jù)挖掘技術就是針對數(shù)量龐大數(shù)據(jù)進行整合、分析以及分析之后,借助于機器學習方式、人工智能方式以及各種數(shù)據(jù)挖掘方式進行數(shù)據(jù)的深度挖掘工作,在發(fā)現(xiàn)總結其中隱藏規(guī)律的基礎上,將之合理應用的一種方式。
2.數(shù)據(jù)挖掘技術的基本分析方法解析
2.1聚類分析
這種數(shù)據(jù)分析方式主要就是將物理以及抽象對象的整合予以分類,與此同時針對那些完全相同或者是具備一定相似性的對象組成的分類開展更為深入的分析工作。其最終的目標就是將這些數(shù)據(jù)進行有效的分類,也就是在深入分析事物之間規(guī)律的基礎上,從而實現(xiàn)各個領域的智能化學習目標。聚類分析這種方式其中又可以分為硬聚類和模糊聚類兩種方式,其中的硬聚類方式就是將分析的對象歸屬到相近程度最高的類別之中。而其中的模糊聚類方式在劃分對象的過程中以取值范圍作為依據(jù),同時還會出現(xiàn)同一個對象對應的多個類別的現(xiàn)象。
2.2關聯(lián)分析
關聯(lián)分析從其本質上來看和蝴蝶效應較為相似,所謂的蝴蝶效應就是指自然界中的任何一次微小變動都有很大的可能性帶來另一個事件的發(fā)生。同樣這也是關聯(lián)分析方式的規(guī)律所在,相同事物之間具備著不同程度的依賴以及關聯(lián)性,也正是因為事物之間的這一特點,就可以對事物之間的規(guī)律性予以有效的預測。
舉個例子,購物籃事件就是這種方式中最具有代表性的應用。就是通過針對顧客購物籃的物品管理規(guī)律進行相應的分析,就可以做到初步掌握顧客自身的購買特點以及習慣,并以這些數(shù)據(jù)作為基礎將日?;臓I銷方案以及策略予以制定。通過使用這種方式就可以取得很好的營銷效果。
2.3分類與預測
分類就是針對那些不具備排序規(guī)律的標號予以分類,預測則是針對連續(xù)值的函數(shù)模型開展相應的預測工作。而其中的分類則是數(shù)據(jù)挖掘技術極為重要的基礎之一,借助分類可以將數(shù)據(jù)集合自身的特征予以明確的表示,從而將各個類別的屬性進行相應的劃分,其中較為常見的方式之一就是決策樹、遺傳算法等等。而預測就是將當前已知的分類情況作為基礎,并按照其中的發(fā)展規(guī)律將其未來的發(fā)展趨勢予以預測,當前較常用的方式主要包括時間序列以及回歸分析等等。
3.數(shù)據(jù)挖掘技術在互聯(lián)網(wǎng)領域中應用分析
3.1應用于電子商務領域
互聯(lián)網(wǎng)技術的出現(xiàn)以及普及對于傳統(tǒng)的實體行業(yè)帶來了相應的沖擊,由此網(wǎng)購逐漸深入人們的日常生活中,使得我國的營銷市場得到了極大的發(fā)展。數(shù)據(jù)挖掘技術應用在電子商務領域中主要是負責挖掘消費者自身的喜好之上。通過數(shù)據(jù)挖掘技術的應用針對消費者的商品瀏覽以及購買記錄就可以從中挖掘出不同消費者在商品類型、價格上的偏好。當前絕大多數(shù)的網(wǎng)購平臺都通過數(shù)據(jù)挖掘技術,在深刻分析消費者自身購買喜好的基礎上,為企業(yè)制定營銷策略提供了精準化的數(shù)據(jù)支撐,就可以達到電子商務平臺的運營投放上的優(yōu)化。
3.2應用于金融領域
銀行業(yè)當前已經(jīng)針對大數(shù)據(jù)在其經(jīng)營管理、客戶營銷以及產(chǎn)品優(yōu)化等工作中的重要作用有了一個全面清醒的認知。銀行業(yè)中使用數(shù)據(jù)挖掘技術往往都是將其自身大數(shù)據(jù)的巨大價值予以挖掘,并以此作為其產(chǎn)品、服務以及管理工作方面的創(chuàng)新依據(jù)。而在金融投資方面則是通過數(shù)據(jù)挖掘技術的應用針對投資數(shù)據(jù)進行分析,將隱藏在其中的規(guī)律予以發(fā)現(xiàn),并以此作為投資行為的數(shù)據(jù)導向,最終目標就是降低投資風險的降低。
3.3應用于醫(yī)療領域
當前醫(yī)療信息化程度的不斷提升,導致醫(yī)院在病人檔案、醫(yī)療器具等方面管理工作的現(xiàn)代化程度逐漸得以提升,通過數(shù)據(jù)挖掘技術的幫助可以很好發(fā)現(xiàn)存在于其中的問題,實現(xiàn)醫(yī)院管理質量的不斷提升。
與此同時因為醫(yī)務工作人員自身的診斷方式也從之前的傳統(tǒng)依靠人員經(jīng)驗的診斷方式逐漸向著現(xiàn)代化診斷方式發(fā)展。通過數(shù)據(jù)挖掘技術的使用醫(yī)務人員就可以針對患者的過往病史、臨床癥狀表現(xiàn)以及相似程度較高患者的病史與數(shù)據(jù)庫中的各項信息進行分析以及綜合研究,可以很有效的提升相應的診斷正確率,有助于提升醫(yī)療服務質量。
4.總結
當前大數(shù)據(jù)時代的到來,社會中的數(shù)據(jù)信息呈現(xiàn)出一種爆炸式的增長態(tài)勢,為了更好的使用其中有價值的數(shù)據(jù),就需要借助于數(shù)據(jù)挖掘技術。通過數(shù)據(jù)挖掘技術中的聚類分析、分類預測以及關聯(lián)分析等方式就可以很好實現(xiàn)數(shù)據(jù)規(guī)律的發(fā)現(xiàn)以及利用,并且隨著技術的逐步發(fā)展在互聯(lián)網(wǎng)領域中的金融、醫(yī)療以及電子商務等領域中的應用將會逐漸得以推廣。
參考文獻
[1]管祥甫,管子涵.計算機文本信息挖掘技術在網(wǎng)絡安全中的應用[J/OL].電子技術與軟件工程,2019(21):184-185[2019-11-20].
[2]謝翠琴.淺析移動通信中數(shù)據(jù)挖掘技術的應用[J].電子世界,2019(20):192-193.