• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用研究

      2020-03-25 15:13吉立爽
      中國市場 2020年8期
      關鍵詞:經(jīng)濟統(tǒng)計數(shù)據(jù)挖掘應用

      吉立爽

      [摘要]經(jīng)濟統(tǒng)計中會收集經(jīng)濟運行數(shù)據(jù),把這些數(shù)據(jù)收錄在數(shù)據(jù)庫中,數(shù)據(jù)有一定的空值和噪聲,這些不利于數(shù)據(jù)的挖掘,因此為了保證數(shù)據(jù)挖掘的準確性,需要對數(shù)據(jù)預處理。文章主要研究的是對數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的內(nèi)涵及特點分析,并且提出挖掘技術在經(jīng)濟數(shù)據(jù)中的應用,以此來保證經(jīng)濟數(shù)據(jù)中有用價值的使用。

      [關鍵詞]數(shù)據(jù)挖掘;經(jīng)濟統(tǒng)計;應用

      [DOI]1013939/jcnkizgsc202008195

      1引言

      隨著社會經(jīng)濟的不斷發(fā)展,在對經(jīng)濟數(shù)據(jù)的收集過程中也造成數(shù)據(jù)的龐大,如何對龐大的數(shù)據(jù)使用,需要采用挖掘技術來處理。挖掘技術使用在經(jīng)濟數(shù)據(jù)處理中,能夠使數(shù)據(jù)更加簡潔,方便使用者采用。

      2數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的內(nèi)涵及特點分析

      21數(shù)據(jù)挖掘內(nèi)涵

      數(shù)據(jù)挖掘技術主要是對數(shù)據(jù)深層次的開發(fā),并且在龐大的數(shù)據(jù)中對有價值的數(shù)據(jù)進行整理,實現(xiàn)凌亂的數(shù)據(jù)規(guī)整化的目的[1]。龐大的數(shù)據(jù)中有數(shù)據(jù)的不完整性,也有數(shù)據(jù)的模糊性,還有數(shù)據(jù)的隨機性和數(shù)據(jù)的噪聲性,使用數(shù)據(jù)挖掘技術以后能夠把數(shù)據(jù)中有價值信息提煉,使數(shù)據(jù)信息更加有用化。使用數(shù)據(jù)挖掘在數(shù)據(jù)信息處理過程中,不僅僅只是對經(jīng)濟數(shù)據(jù)的轉(zhuǎn)換,更是一種學科交叉特征的技術,這門學科技術中涉及神經(jīng)網(wǎng)絡學科、數(shù)據(jù)庫使用學科、數(shù)據(jù)統(tǒng)計學科和機器學習學科。數(shù)據(jù)挖掘技術在統(tǒng)計學科中獲得廣泛的使用,使用數(shù)據(jù)挖掘技術以后獲得數(shù)據(jù)信息,能夠方便使用者采用,使數(shù)據(jù)使用更加簡便化。實際上對數(shù)據(jù)的挖掘,其實是對數(shù)據(jù)的一個深加工過程,也是一個精加工過程,數(shù)據(jù)挖掘有著高度的數(shù)據(jù)分析自主性。

      22數(shù)據(jù)挖掘技術的特點

      在使用的數(shù)據(jù)挖掘技術中,主要有著以下三個方面的特點:一是數(shù)據(jù)信息量大,能夠挖掘的數(shù)據(jù)中有著信息量巨大的特點,挖掘技術需要處理的信息非常大,有的時候需要處理的數(shù)據(jù)可以使用GB或者是TB來形容[2];二是在數(shù)據(jù)庫的建立中,如果用戶不知道需要使用什么信息時,只需要輸入關鍵詞就可以實現(xiàn)查找;三是在社會經(jīng)濟不斷發(fā)展的今天,經(jīng)濟信息量也在不斷地增長,經(jīng)濟信息數(shù)據(jù)庫也需要不斷地擴展容量來滿足發(fā)展需要。同時,在對用戶的使用時,還要不斷提高搜索的精準度,使使用者能夠更加輕松地查找需要的信息。

      3數(shù)據(jù)挖掘技術的應用

      31預處理方法運用

      對數(shù)據(jù)的使用時首先需要對數(shù)據(jù)的收集,但是在收集的數(shù)據(jù)中不一定完整,有些數(shù)據(jù)會出現(xiàn)不統(tǒng)一的情況,而有的數(shù)據(jù)內(nèi)容不能夠使用,還有的數(shù)據(jù)內(nèi)容完全不符合收集要求,因此對于收集的數(shù)據(jù)需要使用處理方法[3]。數(shù)據(jù)預處理是數(shù)據(jù)基礎處理的一種方法,使用預處理在經(jīng)濟數(shù)據(jù)收集中能夠預先對數(shù)據(jù)的處理。數(shù)據(jù)預處理主要包括三個組成部分:一是數(shù)據(jù)的變換;二是數(shù)據(jù)的集成;三是數(shù)據(jù)的清理。

      數(shù)據(jù)清理中主要是把收集的經(jīng)濟數(shù)據(jù)里面存在的一些數(shù)據(jù)不符合以及數(shù)據(jù)不全面的內(nèi)容去除。采用清楚法一般會采用四種方法:一種是頻率統(tǒng)計法,另一種是預測法,還有一種是平滑法,最后一種是均值法。使用這些方法需要具體情況具體分析,在不同的經(jīng)濟數(shù)據(jù)分析中需要采用不同的方法。比如在經(jīng)濟統(tǒng)計數(shù)據(jù)中存在噪聲或者是空值數(shù)據(jù)情況時,采用的清楚數(shù)據(jù)方法可以采用均值法。同樣在數(shù)據(jù)中有著噪聲或者是空值情況時,也可以采用平滑法清楚。使用的均值法和平滑法的不同之處是,平滑法是采用加權平均數(shù)代替了均值法中的平均數(shù),平滑法使用在經(jīng)濟數(shù)據(jù)的統(tǒng)計中能夠更好地實現(xiàn)數(shù)據(jù)的真實性。均值法主要是采用均值來彌補數(shù)據(jù)中的空缺,這種方法也是能夠獲得準確度較高的數(shù)據(jù)。這些統(tǒng)計方法中都是各有各的特點,在實際使用過程中,需要根據(jù)實際需要的取值方法,采用不同的數(shù)據(jù)處理方法來保證數(shù)據(jù)信息的準確性。

      數(shù)據(jù)集成中主要是把不相同的數(shù)據(jù)集合在一起,保證這些數(shù)據(jù)能夠形成一個總體[4]。數(shù)據(jù)的集成需要注意兩個方面的內(nèi)容:一個是保證數(shù)據(jù)能夠集合在一起;另一個是保證集合數(shù)據(jù)的準確性。社會在不斷的發(fā)展,社會經(jīng)濟數(shù)據(jù)也是在一個不斷積累的過程,造成經(jīng)濟數(shù)據(jù)量非常龐大。而且在提供數(shù)據(jù)的來源中也是多個方面,數(shù)據(jù)可以由官方提供,也可以是來源于個人,又或者是社會主體提供。這些不同模式的數(shù)據(jù)提供在數(shù)據(jù)的集成過程中會遇見兩個方面的問題:一個是冗余問題,另一個是模式集成問題。在模式集成問題中,主要是在實體識別存在的問題,因為在對數(shù)據(jù)挖掘時,會有多個數(shù)據(jù)多種模式出現(xiàn)。數(shù)據(jù)中的冗余問題主要是在數(shù)據(jù)多余的情況,為了減少在數(shù)據(jù)庫中數(shù)據(jù)容量問題,需要保持數(shù)據(jù)的最少化。數(shù)據(jù)收集以后會形成數(shù)據(jù)庫,并且需要對數(shù)據(jù)的挖掘,挖掘時采用不同的方法把數(shù)據(jù)的內(nèi)容呈現(xiàn)出來。經(jīng)濟數(shù)據(jù)的挖掘工作中,是對經(jīng)濟數(shù)據(jù)的一次深加工過程。使用挖掘數(shù)據(jù)技術以后,呈現(xiàn)出來的經(jīng)濟數(shù)據(jù)更加簡單化,為數(shù)據(jù)的使用者提供便利,也可以為決策者提供數(shù)據(jù)的支撐。

      數(shù)據(jù)變換主要是使用不同的方法對數(shù)據(jù)轉(zhuǎn)化,保證轉(zhuǎn)化以后的數(shù)據(jù)能夠滿足數(shù)據(jù)挖掘的要求,數(shù)據(jù)的變換中包括兩個方面的內(nèi)容:一個是數(shù)據(jù)的規(guī)?;?另一個是數(shù)據(jù)泛化。其中在數(shù)據(jù)的規(guī)范化中又包括了以下方面的內(nèi)容,分別是最小化規(guī)范、最大化規(guī)范和零均值規(guī)范。數(shù)據(jù)的泛化中主要是在高層次的數(shù)據(jù)替換低層次的數(shù)據(jù),這個方面包括了數(shù)據(jù)的連續(xù)性問題。在現(xiàn)在的數(shù)據(jù)處理中,很多方法是不能夠連續(xù)性處理數(shù)據(jù),造成的后果是出現(xiàn)數(shù)據(jù)的離散化。在對經(jīng)濟數(shù)據(jù)的收集過程中,實際上需要盡量減少對數(shù)據(jù)的收集,減少數(shù)據(jù)的收集又稱作概念分層。

      32決策樹方法

      決策樹方法在經(jīng)濟數(shù)據(jù)統(tǒng)計中運用,這種方法是一種快速分類法,決策樹方法能夠使數(shù)據(jù)直觀地呈現(xiàn)出來[5]。對于收集的經(jīng)濟數(shù)據(jù)需要挖掘其中有用價值,因此需要對收集的數(shù)據(jù)采用系統(tǒng)的分析。數(shù)據(jù)在系統(tǒng)的分析以后是對數(shù)據(jù)的輸出,分析數(shù)據(jù)的輸出在挖掘數(shù)據(jù)程序中是重要的步驟,因為輸出數(shù)據(jù)的質(zhì)量直接關系使用者的效率。特別是經(jīng)濟決策的管理者,對經(jīng)濟做出調(diào)控措施時,需要數(shù)據(jù)的有力支撐。

      經(jīng)濟數(shù)據(jù)使用決策樹分析時,需要構建完善的決策樹結(jié)構。決策樹結(jié)構建立需要從兩個方面來進行:一方面,建立好分析輸出的基本模型,運用訓練集建立一棵決策樹,而且還要做到精簡決策樹;另一方面,對已經(jīng)建立完成的決策樹做出數(shù)據(jù)分類,分類工作開始時使用決策樹的根部開始,最后到達樹枝,一直到數(shù)據(jù)輸入滿足設置為止。使用這種分類是一種遞歸的過程,需要開展時逐步完成。實際使用決策樹時,要實現(xiàn)決策樹的停止,有兩個條件:一個是節(jié)點上所有的數(shù)據(jù)全部歸類為同一個類別,這種情況下數(shù)據(jù)會停止;另一個是已經(jīng)沒有分類屬性可以繼續(xù)對數(shù)據(jù)進一步的再次分割。在使用的決策樹中,主要是解決數(shù)據(jù)挖掘中的兩個方面問題:一個是數(shù)據(jù)挖掘預測問題;另一個是數(shù)據(jù)分類問題。

      決策樹完成構建以后,決策樹可以根據(jù)實際使用的需要開展調(diào)整工作。開展調(diào)整工作是非常的需要,因為只有做出適當?shù)恼{(diào)整,才能夠使決策樹中的數(shù)據(jù)內(nèi)容能夠滿足使用者的需要,而且使用調(diào)整技術以后,還可以實現(xiàn)減少決策樹數(shù)據(jù)輸出的起伏變化,以此來保證決策樹的使用穩(wěn)定性和保證信息的質(zhì)量。

      4結(jié)論

      綜上所述,在經(jīng)濟數(shù)據(jù)的統(tǒng)計工作中,使用挖掘技術能夠保證有價值的信息使用,具體的挖掘技術使用在統(tǒng)計經(jīng)濟中,主要包括兩個方面:一個是在使用預處理方法運用;另一個是決策樹方法運用。做好這兩個方面的運用,能夠保證統(tǒng)計經(jīng)濟數(shù)據(jù)更好地發(fā)揮價值。

      參考文獻:

      [1]廖友國,熊建益,沈波數(shù)據(jù)挖掘技術在現(xiàn)代經(jīng)濟統(tǒng)計中的應用思路分析[J].商訊,2019(11):106-107

      [2]邢靜數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計調(diào)查中的應用研究[J].現(xiàn)代經(jīng)濟信息,2019(7):132

      [3]馬長青數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用[J].現(xiàn)代營銷(經(jīng)營版),2019(4):144

      [4]趙艦波數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用探索[J].經(jīng)濟研究導刊,2018(12):187-188

      [5]趙彬數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用探索[J].南方企業(yè)家,2018(2):226

      猜你喜歡
      經(jīng)濟統(tǒng)計數(shù)據(jù)挖掘應用
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      策勒县| 沈丘县| 福安市| 阳新县| 买车| 泾源县| 清远市| 农安县| 岑巩县| 武隆县| 科技| 涟水县| 山西省| 龙口市| 兴文县| 阳泉市| 尉氏县| 昭平县| 新源县| 抚州市| 凭祥市| 太保市| 进贤县| 翁源县| 宜宾市| 黔西县| 庆阳市| 南和县| 深泽县| 鹿邑县| 靖远县| 英吉沙县| 南开区| 城市| 澄江县| 色达县| 东源县| 河南省| 梅河口市| 平山县| 布尔津县|