蔣晨曦 牛敏
摘要:隨著計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)以及物聯(lián)網(wǎng)技術(shù)的成熟,當前大數(shù)據(jù)越來越廣泛地被應用于社會各個領(lǐng)域,對于傳統(tǒng)統(tǒng)計學帶來了新的變革與挑戰(zhàn)。本文主要分析了大數(shù)據(jù)技術(shù)對傳統(tǒng)統(tǒng)計學的影響,分析了大數(shù)據(jù)技術(shù)給統(tǒng)計學帶來的新發(fā)展。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);傳統(tǒng)統(tǒng)計學;挑戰(zhàn)分析
一、引言
在社會經(jīng)濟活動過程中,統(tǒng)計學的應用非常關(guān)鍵,例如:客戶對于產(chǎn)品的要求、數(shù)量、外觀、規(guī)格等信息需要統(tǒng)計,企業(yè)在生產(chǎn)經(jīng)營過程中,需要對產(chǎn)品原材料價格、產(chǎn)品的市場信息等進行統(tǒng)計調(diào)查與分析。在傳統(tǒng)的統(tǒng)計學背景下,企業(yè)需要通過問卷調(diào)查和電話調(diào)查等成本較高的方式獲取相關(guān)統(tǒng)計調(diào)查數(shù)據(jù),而隨著大數(shù)據(jù)技術(shù)的出現(xiàn),通過互聯(lián)網(wǎng)方式企業(yè)能夠以更低成本獲取相關(guān)調(diào)查統(tǒng)計數(shù)據(jù),不僅如此,大數(shù)據(jù)技術(shù)在定義、思維方式、作用都與傳統(tǒng)的統(tǒng)計學有著較大的區(qū)別。
二、大數(shù)據(jù)技術(shù)對傳統(tǒng)統(tǒng)計學的影響
(一)樣本概念的深化
在過去傳統(tǒng)的統(tǒng)計調(diào)查過程中,除了普查之外,大多數(shù)的調(diào)查都是通過抽樣調(diào)查的方式完成的,而抽樣調(diào)查盡管能夠大體反映相關(guān)群體的情況,但是其調(diào)查結(jié)果與實際往往存在一定的誤差,這使調(diào)查結(jié)果往往并不十分精準,而大數(shù)據(jù)技術(shù)通過網(wǎng)絡技術(shù)獲取網(wǎng)絡數(shù)據(jù),能夠獲取相關(guān)群體中的每一個樣本信息,因此大數(shù)據(jù)技術(shù)能夠使統(tǒng)計調(diào)查的數(shù)據(jù)更加精準和詳細,除此之外,大數(shù)據(jù)技術(shù)所使用的網(wǎng)絡技術(shù)還能夠幫助相關(guān)調(diào)查統(tǒng)計研究人員獲取實時動態(tài)數(shù)據(jù),幫助相關(guān)統(tǒng)計調(diào)查人員進行統(tǒng)計對比分析。
(二)數(shù)據(jù)類型的擴大
在傳統(tǒng)的統(tǒng)計調(diào)查過程中,所獲取的數(shù)據(jù)往往是結(jié)構(gòu)性數(shù)據(jù),是根據(jù)調(diào)查者所設計的問題流程所的出來的數(shù)據(jù),而在大數(shù)據(jù)技術(shù)出現(xiàn)后,大數(shù)據(jù)技術(shù)所獲取的統(tǒng)計數(shù)據(jù)不僅包含結(jié)構(gòu)性數(shù)據(jù),同時還會包含非結(jié)構(gòu)性數(shù)據(jù)和異結(jié)構(gòu)性數(shù)據(jù)等。
(三)收集概念的擴展
在傳統(tǒng)的數(shù)據(jù)搜集過程中,需要進行問卷調(diào)查設計、嚴格控制問卷發(fā)放流程,最終輸入和總結(jié)數(shù)據(jù),這一過程,需要花費較多的時間,而且成本較高,而在大數(shù)據(jù)時代對于數(shù)據(jù)成本的獲取則相對較低,通過對海量信息數(shù)據(jù)進行識別、整理與數(shù)據(jù)分析,就能夠提煉有價值的信息,但需要注意的是這樣獲取信息的方式有一定的數(shù)據(jù)安全風險。
(四)數(shù)據(jù)來源的不同
在傳統(tǒng)統(tǒng)計學中,由于數(shù)據(jù)通常是通過發(fā)放問卷的形式獲取的,因此,傳統(tǒng)統(tǒng)計學通常能夠明確數(shù)據(jù)信息的獲取來源,而在大數(shù)據(jù)技術(shù)背景下,數(shù)據(jù)的獲取是通過網(wǎng)絡途徑獲取的,而在網(wǎng)絡環(huán)境,人們都以匿名的形式參與網(wǎng)絡活動,因此大數(shù)據(jù)技術(shù)通過網(wǎng)絡途徑所獲取的數(shù)據(jù)往往不能夠明確數(shù)據(jù)的來源。
(五)量化方式的變化
在傳統(tǒng)統(tǒng)計學中,所有的信息數(shù)據(jù)都是以結(jié)構(gòu)性的形式存在的,當前統(tǒng)計學在對分析結(jié)構(gòu)性數(shù)據(jù)已經(jīng)形成了較為完善的研究方式,而在大數(shù)據(jù)技術(shù)背景下所獲取的統(tǒng)計數(shù)據(jù)不僅存在結(jié)構(gòu)性數(shù)據(jù),同時還存在其他非結(jié)構(gòu)性數(shù)據(jù),而如何研究和處理非結(jié)構(gòu)性數(shù)據(jù),目前并沒有得出系統(tǒng)性成熟的理論,仍有待進一步研究處理非結(jié)構(gòu)化數(shù)據(jù)的技術(shù)。
三、大數(shù)據(jù)給統(tǒng)計學帶來的發(fā)展
(一)統(tǒng)計質(zhì)量得以提高
對統(tǒng)計數(shù)據(jù)質(zhì)量的高低的評判主要是從適用性、準確性、時效性、平衡性幾個角度來評價,首先在適用性方面,大數(shù)據(jù)技術(shù)的所調(diào)查和統(tǒng)計的范圍明顯大于傳統(tǒng)統(tǒng)計學所能夠覆蓋的范圍,能夠更加全面地調(diào)查群體的相關(guān)信息,因此大數(shù)據(jù)技術(shù)所獲取的數(shù)據(jù)具有更強的適用性;其次,在時效性方面,傳統(tǒng)的調(diào)查統(tǒng)計過程中需要花費大量的時間經(jīng)過調(diào)查設計、問卷發(fā)放、以及數(shù)據(jù)統(tǒng)計等一系列流程才能夠獲取數(shù)據(jù)進行分析,這導致統(tǒng)計數(shù)據(jù)的時效性較低,而在大數(shù)據(jù)時代,則能夠通過對網(wǎng)絡數(shù)據(jù)信息的實時獲取獲取當下相關(guān)統(tǒng)計對象的數(shù)據(jù)信息,并進行分析,而這無疑大大提升了統(tǒng)計數(shù)據(jù)的及時性;再次,在準確性方面,傳統(tǒng)的統(tǒng)計數(shù)據(jù)在抽樣過程中存在樣本誤差,除此之外,還可能出現(xiàn)分析,分析模型誤差、人為誤差等,而這多重誤差重疊無疑會降低統(tǒng)計數(shù)據(jù)的準確性,而大數(shù)據(jù)時代,通過網(wǎng)絡技術(shù),相關(guān)調(diào)查統(tǒng)計者可以準確地獲取用戶的各類信息,例如:行程信息、各類消費信息等,這種信息獲取方式顯然比傳統(tǒng)的統(tǒng)計方式更加精準;最后,在平衡性方面,由于數(shù)據(jù)的發(fā)布者與數(shù)據(jù)分析者之間對于數(shù)據(jù)理解不同等因素會降低統(tǒng)計數(shù)據(jù)的平衡性,而隨著大數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)發(fā)布者在統(tǒng)計框架內(nèi)公布有關(guān)總量數(shù)據(jù)的分項,并公布有關(guān)數(shù)據(jù)的比較和核對方法與結(jié)果,便于數(shù)據(jù)使用者對于數(shù)據(jù)進行檢驗,從而提升數(shù)據(jù)的平衡性。
(二)統(tǒng)計成本得以降低
在傳統(tǒng)統(tǒng)計數(shù)據(jù)過程中無論是調(diào)查問卷設計、調(diào)查問卷發(fā)放還是調(diào)查問卷的數(shù)據(jù)信息統(tǒng)計都需要耗費大量的時間與人力,而在大數(shù)據(jù)背景下,對于數(shù)據(jù)信息的獲取無序經(jīng)過這些繁瑣的流程,通過網(wǎng)絡通信技術(shù)即可實現(xiàn)對信息的獲取,除此之外,大數(shù)據(jù)技術(shù)所獲取的信息內(nèi)容非常豐富,因此大數(shù)據(jù)背景下的信息數(shù)據(jù)能夠被多次使用,而傳統(tǒng)的統(tǒng)計學所獲取的數(shù)據(jù)信息往往具有明顯的針對性,難以重復使用,因此傳統(tǒng)統(tǒng)計學下獲取的統(tǒng)計數(shù)據(jù),其使用價值也相對較低。
(三)統(tǒng)計學科體系得以延伸
在傳統(tǒng)的統(tǒng)計學中,往往對統(tǒng)計數(shù)據(jù)的分析是按照既定統(tǒng)計學理論和模型進行分析的,而大數(shù)據(jù)時代由于信息數(shù)據(jù)并非都是結(jié)構(gòu)性數(shù)據(jù),且大數(shù)據(jù)信息技術(shù)所獲取的信息是海量的,因此數(shù)據(jù)挖掘技術(shù)出現(xiàn),進一步拓展和延伸了統(tǒng)計學體系。
參考文獻:
[1]朱建平,張悅涵. 大數(shù)據(jù)時代對傳統(tǒng)統(tǒng)計學變革的思考[J]. 統(tǒng)計研究,2016,33(02):3-9.
[2]耿直. 大數(shù)據(jù)時代統(tǒng)計學面臨的機遇與挑戰(zhàn)[J]. 統(tǒng)計研究,2014,31(01):5-9.
[3]魏瑾瑞,蔣萍. 數(shù)據(jù)科學的統(tǒng)計學內(nèi)涵[J]. 統(tǒng)計研究,2014,31(05):3-9.