楊勝衛(wèi) 趙璐瑤 孟慧蕓
摘要:在經(jīng)濟統(tǒng)計當中,因其涉及的數(shù)據(jù)量巨大,數(shù)據(jù)統(tǒng)計工作較為繁瑣,因此一直以來人們通常采用相關(guān)計算機軟件完成經(jīng)濟統(tǒng)計工作。為了能夠進一步提高經(jīng)濟統(tǒng)計結(jié)果的精準性與統(tǒng)計效率,本文將從數(shù)據(jù)挖掘的角度出發(fā),在闡明數(shù)據(jù)挖掘技術(shù)基本內(nèi)涵的基礎(chǔ)上,著重圍繞經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進行簡要分析研究。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 經(jīng)濟統(tǒng)計 信息數(shù)據(jù)
引言:在以往經(jīng)濟統(tǒng)計當中,采用傳統(tǒng)的數(shù)據(jù)處理方式,往往會因數(shù)據(jù)量較為龐大,而出現(xiàn)數(shù)據(jù)篩選誤差即在統(tǒng)計分析中篩選出虛假數(shù)據(jù),故而使得最終的經(jīng)濟統(tǒng)計結(jié)果缺乏較高的精準性,數(shù)據(jù)質(zhì)量無法得到有效保障。因此需要在經(jīng)濟統(tǒng)計當中,靈活使用數(shù)據(jù)挖掘技術(shù),通過充分發(fā)揮其應(yīng)有效用,以更好地完成經(jīng)濟統(tǒng)計工作。
一、數(shù)據(jù)挖掘技術(shù)的簡要概述
數(shù)據(jù)挖掘技術(shù)簡單來說指的就是一種可以從海量信息數(shù)據(jù)中,快速、精準鎖定所需有用信息數(shù)據(jù)的技術(shù)。在未進行數(shù)據(jù)挖掘之前,雖然信息數(shù)據(jù)量較為龐大,但其中有許多信息數(shù)據(jù)并不完整,甚至存在諸多錯誤信息數(shù)據(jù),而通過使用數(shù)據(jù)挖掘技術(shù),則可以將其中新穎的、有價值的信息數(shù)據(jù)準確提取出來,通過對此類精心篩選出的信息數(shù)據(jù)進行深度處理,從而為信息統(tǒng)計工作提供真實可靠的數(shù)據(jù)支持。
在經(jīng)濟統(tǒng)計當中運用數(shù)據(jù)挖掘技術(shù),可以幫助統(tǒng)計人員快速從眾多未加工的經(jīng)濟數(shù)據(jù)中,篩選出有價值的統(tǒng)計數(shù)據(jù),并對其進行深入處理與再加工,為相關(guān)工作人員分析經(jīng)濟形勢、判斷經(jīng)濟走向、制定經(jīng)濟決策決議等提供重要數(shù)據(jù)參考。此外,由于數(shù)據(jù)挖掘技術(shù)并不只是一種簡單的數(shù)據(jù)分析工具,其可以深入結(jié)合信息使用者的實際需求,特別是在我國經(jīng)濟不斷發(fā)展下,經(jīng)濟數(shù)據(jù)信息量驟增,其對于經(jīng)濟統(tǒng)計的要求也越來越高。因此將數(shù)據(jù)挖掘技術(shù)運用在經(jīng)濟統(tǒng)計當中,能夠有效保障信息評估的可靠性,實現(xiàn)數(shù)據(jù)處理成效的進一步優(yōu)化。在運用數(shù)據(jù)挖掘技術(shù)完成對經(jīng)濟數(shù)據(jù)的深入挖掘與分析處理下,建立起相應(yīng)的數(shù)據(jù)庫,可以在更好地融合各種數(shù)據(jù)信息的基礎(chǔ)上,為經(jīng)濟管理活動需求提供高質(zhì)量服務(wù),從根本上避免出現(xiàn)重復(fù)性的統(tǒng)計工作,以有效減輕統(tǒng)計人員的工作負荷。
二、經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)的應(yīng)用分析
(一)數(shù)據(jù)預(yù)處理。在將數(shù)據(jù)挖掘技術(shù)運用在經(jīng)濟統(tǒng)計當中時,首先需要對現(xiàn)有的經(jīng)濟數(shù)據(jù)進行預(yù)處理,這主要是由于在經(jīng)濟統(tǒng)計中搜集得到的各種經(jīng)濟數(shù)據(jù),屬于初始數(shù)據(jù),其中混雜著部分錯誤和虛假數(shù)據(jù),以及不完整數(shù)據(jù)。對經(jīng)濟數(shù)據(jù)進行預(yù)處理,其根本目的在于快速篩出存在于經(jīng)濟數(shù)據(jù)集當中,與經(jīng)濟統(tǒng)計工作無關(guān)的信息數(shù)據(jù),只精準提取出經(jīng)濟統(tǒng)計分析所需的重要數(shù)據(jù)。例如在某地區(qū)的經(jīng)濟統(tǒng)計當中,在對該地區(qū)歷年企業(yè)上報的基礎(chǔ)經(jīng)濟數(shù)據(jù)進行集中整理后,可以采用均值法進行經(jīng)濟數(shù)據(jù)的預(yù)處理。即企業(yè)上報的基礎(chǔ)經(jīng)濟數(shù)據(jù)中如果有數(shù)據(jù)點屬于空值或是噪聲數(shù)據(jù),則通過對存在的噪聲數(shù)據(jù)、空值進行均值處理,使用數(shù)據(jù)庫當中該屬性全部已知屬性均值進行空缺添補,可以有效保障后續(xù)經(jīng)濟基礎(chǔ)數(shù)據(jù)挖掘以及統(tǒng)計分析工作的順利進行,并由此獲得具有高精準性的經(jīng)濟統(tǒng)計分析數(shù)據(jù)。
(二)建立決策樹。在完成經(jīng)濟數(shù)據(jù)的預(yù)處理之后,需要建立相應(yīng)的決策樹。具體來說,在經(jīng)濟統(tǒng)計中運用數(shù)據(jù)挖掘技術(shù),建立決策樹時,工作人員首先需要利用訓(xùn)練集完成決策樹的初步建立,而后借助專門的決策樹算法對建立起的決策樹進行簡化。此時所建立的模型即為數(shù)據(jù)輸出分析模型,隨后經(jīng)濟統(tǒng)計工作人員需要對建立起的決策樹進行充分利用,對相關(guān)經(jīng)濟數(shù)據(jù)進行準確分類與深入分析。按照從決策樹根本開始逐漸延伸至決策樹各枝干部分的順序,直至數(shù)據(jù)與既定條件相符合后才可終止分割。值得注意的是,如果同時進行兩個分割,且分割點上的數(shù)據(jù)完全相同,此時將會自動終止分割,即順利完成決策。如果數(shù)據(jù)本身無分類屬性,但可以繼續(xù)分割輸入的經(jīng)濟數(shù)據(jù),則此時需要停止分割。在經(jīng)濟統(tǒng)計當中,可以根據(jù)該地區(qū)歷年企業(yè)上報的數(shù)據(jù),構(gòu)建起與各企業(yè)相對應(yīng)的序列模式,通過利用數(shù)據(jù)挖掘技術(shù)對企業(yè)預(yù)測值進行計算,將企業(yè)預(yù)測值與企業(yè)歷年上報的實際經(jīng)濟數(shù)據(jù)進行對比,由此獲得差別率。此后統(tǒng)計人員可以對獲得的差別率進行一次分類,如按照差別率的占比大小,依次將其分成A、B、c三類,其中A類差別率在20%以上,B類數(shù)據(jù)中差別率在10%至20%之間,c類數(shù)據(jù)中的差別率則不足10%。
(三)進一步調(diào)查。在使用數(shù)據(jù)挖掘技術(shù)進行某地區(qū)經(jīng)濟統(tǒng)計時,經(jīng)濟統(tǒng)計人員在立足本地區(qū)企業(yè)歷年上報數(shù)據(jù)的基礎(chǔ)上,通過充分結(jié)合企業(yè)規(guī)模變化率以及是否有重大經(jīng)營事件曾經(jīng)發(fā)生于企業(yè)內(nèi)部,判斷此時是否需要繼續(xù)進行先一步調(diào)查分析。具體來說,如果根據(jù)數(shù)據(jù)挖掘結(jié)果顯示,企業(yè)規(guī)模變化差異率較大,但并未超過合理范圍,則無需進行下一步調(diào)查從而獲取更加可靠的有效經(jīng)濟信息。如果企業(yè)規(guī)模變化差異率超過規(guī)定值,或是企業(yè)規(guī)模變化差異率極小,且企業(yè)確實曾經(jīng)發(fā)生過重大經(jīng)營事件,此時需要經(jīng)濟統(tǒng)計人員展開下一步調(diào)查分析,從而更加深入地了解企業(yè)及本地區(qū)存在的經(jīng)濟問題,以便可以制定出更加具有針對性和有效性的經(jīng)濟決策決議,在確保經(jīng)濟統(tǒng)計結(jié)果的完整性與可靠性的同時,對企業(yè)規(guī)模變化差異率進行合理調(diào)整,達到幫助企業(yè)提高自身核心競爭力,擴大經(jīng)濟效益規(guī)模,最終實現(xiàn)推動本地區(qū)經(jīng)濟長效發(fā)展的目的。
結(jié)束語:綜上所述,在經(jīng)濟統(tǒng)計中運用數(shù)據(jù)挖掘技術(shù),不僅有助于實現(xiàn)經(jīng)濟數(shù)據(jù)資源的有效擴展,同時也可以為判斷經(jīng)濟局勢與經(jīng)濟發(fā)展走向等提供真實可靠的數(shù)據(jù)支持。因此在實際運用數(shù)據(jù)挖掘技術(shù)進行經(jīng)濟統(tǒng)計分析的過程中,相關(guān)工作人員需要有意識地對獲取的經(jīng)濟數(shù)據(jù)進行預(yù)處理,并建立起相應(yīng)的決策樹,在完成經(jīng)濟數(shù)據(jù)科學(xué)分類并確定具體調(diào)查對象的基礎(chǔ)上,對挖掘提取出的有價值的經(jīng)濟數(shù)據(jù)進行深入統(tǒng)計分析,從而更好地為經(jīng)濟管理活動提供所需服務(wù)。