胡凱歌
(太原學(xué)院財經(jīng)系 山西 太原 030032)
我國市場經(jīng)濟處于穩(wěn)步提升的狀況,逐年呈現(xiàn)爆炸性增長態(tài)勢,經(jīng)濟統(tǒng)計數(shù)據(jù)庫擁有龐大規(guī)模的數(shù)據(jù),經(jīng)濟市場的繁榮景象必定會增加經(jīng)濟數(shù)據(jù)信息變得更加繁雜,經(jīng)濟市場對于經(jīng)濟統(tǒng)計工作的高效與準(zhǔn)確自然提出了更高的要求。因此,如何提升經(jīng)濟統(tǒng)計的整體水平,創(chuàng)新經(jīng)濟統(tǒng)計的方法與模式,已然成為我國經(jīng)濟統(tǒng)計相關(guān)部門不斷探索的重點。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為經(jīng)濟統(tǒng)計工作帶來了新的領(lǐng)航方向,可以對經(jīng)濟統(tǒng)計工作中涉及到的海量數(shù)據(jù)進行資源整合,并且可以在最快時間內(nèi)準(zhǔn)確地挖掘、分析、選擇出對經(jīng)濟統(tǒng)計工作有價值的數(shù)據(jù)信息,從而使數(shù)據(jù)的質(zhì)量得到提高,獲取信息也更加廣泛與準(zhǔn)確[1]。由此可以看出數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中占比越來越高,值得我們給予充分的關(guān)注與重視。
數(shù)據(jù)挖掘是數(shù)據(jù)庫與人工智能領(lǐng)域的研究重點,又被稱之為數(shù)據(jù)庫中的知識發(fā)現(xiàn),是一門多學(xué)科交叉的技術(shù)。所謂數(shù)據(jù)挖掘,即是從模糊、隨機的海量實際應(yīng)用數(shù)據(jù)中提取、挖掘出對人們具有一定價值數(shù)據(jù)的過程,主要基于人工智能、模式識別、可視化技術(shù)、統(tǒng)計學(xué)、神經(jīng)網(wǎng)絡(luò)等。數(shù)據(jù)挖掘技術(shù)簡單來說就是一種從大量繁冗的數(shù)據(jù)出提取出有價值信息的一種技術(shù)手段,可以對相關(guān)數(shù)據(jù)進行自動化、智能化的分析,并進行整合、歸納與推理,可以為企業(yè)的決策者提供科學(xué)的數(shù)據(jù)依據(jù),幫助其及時調(diào)整市場經(jīng)營策略,做出正確決策[2]。
由于經(jīng)濟統(tǒng)計領(lǐng)域的數(shù)據(jù)復(fù)雜性,目前數(shù)據(jù)挖掘技術(shù)在該領(lǐng)域已經(jīng)有了較為廣泛的應(yīng)用,可以幫助從事經(jīng)濟統(tǒng)計的相關(guān)工作人員在獲取數(shù)據(jù)信息方面更加便捷,將大量數(shù)據(jù)進行不同層次的處理,使之轉(zhuǎn)換為有價值的數(shù)據(jù)信息,可以打破原始數(shù)據(jù)隨機性、模糊性的制約。
數(shù)據(jù)挖掘技可以為經(jīng)濟統(tǒng)計帶來諸多的優(yōu)勢,經(jīng)濟統(tǒng)計與其他領(lǐng)域工作不同,涉及大量的金錢數(shù)據(jù)交易,在經(jīng)濟統(tǒng)計工作中,會涉及到一些企業(yè)商業(yè)機密,因此在經(jīng)濟統(tǒng)計工作方面進行信息數(shù)據(jù)安全管理非常重要。數(shù)據(jù)挖掘包含數(shù)據(jù)的清理、變化、挖掘?qū)嵤⒛J皆u估等共計八個步驟,屬于一個反復(fù)循環(huán)的過程,每一個步驟達(dá)到預(yù)期目標(biāo)后系統(tǒng)才會執(zhí)行下一個步驟,在這個過程中可以保證數(shù)據(jù)信息的保密性[3]。依托于數(shù)據(jù)挖掘技術(shù)的保密性,可以有效地保證經(jīng)濟數(shù)據(jù)統(tǒng)計所有環(huán)節(jié)中的安全性,避免數(shù)據(jù)分析中的潛在隱患帶來不必要的麻煩。此外,利用數(shù)據(jù)挖掘技術(shù)作為數(shù)據(jù)庫技術(shù),還可以實現(xiàn)對經(jīng)濟信息存儲的持久性與長期性,便于后期經(jīng)濟統(tǒng)計工作所需數(shù)據(jù)的調(diào)動與管理;數(shù)據(jù)挖掘技術(shù)具備較強的搜索與預(yù)測功能,其依托于信息技術(shù)手段對數(shù)據(jù)信息進行相關(guān)分析,不僅可以避免傳統(tǒng)人工檢索中容易丟失信息的問題,還具有人工信息檢索無法實現(xiàn)的信息采集效率與速度,可以使工作人員快速、準(zhǔn)確地獲取到一手經(jīng)濟信息,實現(xiàn)對經(jīng)濟信息發(fā)展趨勢的預(yù)測。
數(shù)據(jù)挖掘技術(shù)可以從規(guī)模龐大的原始數(shù)據(jù)中準(zhǔn)確地挖掘出具有價值性和真實性的數(shù)據(jù),還可以對這些數(shù)據(jù)進行分析與處理,使其具有應(yīng)用價值。隨著數(shù)據(jù)挖掘技術(shù)自身的不斷創(chuàng)新與完善,在經(jīng)濟統(tǒng)計中的應(yīng)用也逐漸廣泛,以下針對較為典型的應(yīng)用進行簡單分析。
數(shù)據(jù)挖掘技術(shù)應(yīng)用于經(jīng)濟統(tǒng)計中,第一步需要進行的是對數(shù)據(jù)進行分類、整合和處理。由于經(jīng)濟數(shù)據(jù)的復(fù)雜性,在對有用數(shù)據(jù)進行分析和研究之前,必須剔除其中的無用數(shù)據(jù),因此,需要通過數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)信息進行分類和預(yù)處理。數(shù)據(jù)挖掘技術(shù)只是經(jīng)濟數(shù)據(jù)統(tǒng)計處理的初級階段,而不是經(jīng)濟統(tǒng)計的全部工作,只能用計算機系統(tǒng)對經(jīng)濟數(shù)據(jù)進行分類和管理,因此,需要采用回歸法、分箱法、聚類法等數(shù)據(jù)清理方法對數(shù)據(jù)進行清理,并對異常數(shù)據(jù)進行處理,實現(xiàn)經(jīng)濟信息數(shù)據(jù)的整合與預(yù)處理[4]。
數(shù)據(jù)挖掘技術(shù)可以對原始數(shù)據(jù)進行分析和輸出便于用戶使用的數(shù)據(jù)信息。輸出數(shù)據(jù)的有效形式可以用決策樹來表示。決策樹方法在數(shù)據(jù)挖掘中是非常有效的,可以實現(xiàn)數(shù)據(jù)資料直觀快速查找,因此有必要建立決策樹,實現(xiàn)決策樹方法的有效應(yīng)用。首先對輸出數(shù)據(jù)的信息進行決策樹排序和分類,然后用樹形圖表示輸出數(shù)據(jù)的信息。決策樹可以建立一個清晰的系統(tǒng),對數(shù)據(jù)進行分類和排序,準(zhǔn)確地提取用戶需要的信息。當(dāng)決策樹中的數(shù)據(jù)進行多次分類時,最終目標(biāo)是完成標(biāo)記決策樹的數(shù)據(jù)分布。決策樹構(gòu)建完成后,還需根據(jù)具體的統(tǒng)計需求對決策樹進行修剪,刪除對應(yīng)急統(tǒng)計沒有幫助的數(shù)據(jù),確保所有分析數(shù)據(jù)對當(dāng)前的經(jīng)濟統(tǒng)計有所幫助。
為了更好地利用數(shù)據(jù)挖掘技術(shù)進行經(jīng)濟統(tǒng)計工作,為經(jīng)濟統(tǒng)計工作帶來一定的優(yōu)勢,需要正確認(rèn)識到數(shù)據(jù)挖掘技術(shù)的概念與特征,強化對數(shù)據(jù)挖掘技術(shù)的認(rèn)知,加強應(yīng)用力度,這樣才能實現(xiàn)經(jīng)濟統(tǒng)計信息數(shù)據(jù)的有效提供與分析,改善經(jīng)濟統(tǒng)計的工作質(zhì)量與效率,推動市場經(jīng)濟的穩(wěn)定發(fā)展。