李彤輝
(大同大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院15 級(jí)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)一班,山西大同,037009)
統(tǒng)計(jì)學(xué)的優(yōu)勢(shì)在于“以小見(jiàn)大”,但容易產(chǎn)生誤差等問(wèn)題,對(duì)于大數(shù)據(jù)來(lái)說(shuō),可以利用更多甚至是總體的數(shù)據(jù),數(shù)據(jù)的限制因素已經(jīng)成為歷史。統(tǒng)計(jì)學(xué)可以與大數(shù)據(jù)進(jìn)行合作,不僅可以做到以小見(jiàn)大,還可以做到由繁入簡(jiǎn),在大數(shù)據(jù)的基礎(chǔ)上大大提高統(tǒng)計(jì)效率、模型擬合度和推斷準(zhǔn)確性。本文將從以下3個(gè)方面闡述大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)的發(fā)展。
針對(duì)統(tǒng)計(jì)質(zhì)量而言,國(guó)際數(shù)據(jù)標(biāo)準(zhǔn)SDDS確定了兩條規(guī)則作為評(píng)估統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn),我們可以據(jù)此歸納出四個(gè)原則,即:適用性、準(zhǔn)確性、時(shí)效性、平衡性,來(lái)把握統(tǒng)計(jì)質(zhì)量的內(nèi)涵。
適用性,是指收集的統(tǒng)計(jì)信息符合用戶(hù)的需求。保證統(tǒng)計(jì)信息適用性的根本是使統(tǒng)計(jì)信息最大化地滿(mǎn)足用戶(hù)。大數(shù)據(jù)的廣泛覆蓋性能夠在很大程度上滿(mǎn)足適用性的原則。以CPI為例,傳統(tǒng)的價(jià)格統(tǒng)計(jì)涉及的商品和銷(xiāo)售點(diǎn)種類(lèi)繁多,且隨著社會(huì)的進(jìn)步、經(jīng)濟(jì)的發(fā)展和人們消費(fèi)觀念的改變,對(duì)于動(dòng)態(tài)的數(shù)據(jù)需要及時(shí)進(jìn)行調(diào)整,這必定會(huì)產(chǎn)生很大的誤差,使得統(tǒng)計(jì)工作者不能保證統(tǒng)計(jì)數(shù)據(jù)是否適用于用戶(hù)的需求。而基于大數(shù)據(jù)的“在線價(jià)格指數(shù)”不再必須通過(guò)樣本進(jìn)行分析,統(tǒng)計(jì)數(shù)據(jù)可以包含所有的商品和線上銷(xiāo)售網(wǎng)點(diǎn),可以實(shí)現(xiàn)通過(guò)總體進(jìn)行分析,使統(tǒng)計(jì)誤差大幅度下降。
時(shí)效性,是從統(tǒng)計(jì)調(diào)查的各個(gè)方面縮短時(shí)間。另外,為了使用戶(hù)及時(shí)掌握、使用統(tǒng)計(jì)信息,對(duì)于統(tǒng)計(jì)數(shù)據(jù)應(yīng)預(yù)先公布發(fā)布日期,按時(shí)發(fā)布,并建立規(guī)范的發(fā)布制度。傳統(tǒng)統(tǒng)計(jì)數(shù)據(jù)具有滯后性和低頻率等缺點(diǎn),而大數(shù)據(jù)由于其來(lái)源為信息網(wǎng)絡(luò),具有及時(shí)性和時(shí)效性的優(yōu)點(diǎn)。仍然用CPI的統(tǒng)計(jì)數(shù)據(jù)舉例,CPI的發(fā)布頻率為每月,如我國(guó)的CPI通常在每個(gè)月9日發(fā)布上個(gè)月的CPI,由此可見(jiàn),CPI的發(fā)布存在滯后;而“在線價(jià)格指數(shù)”能夠根據(jù)市場(chǎng)的變化對(duì)價(jià)格進(jìn)行即時(shí)的更新與匯總,提高了統(tǒng)計(jì)信息的時(shí)效性,并且“在線價(jià)格指數(shù)”的頻率可以從每月提高到每天甚至更短時(shí)間,據(jù)此分析出來(lái)的通貨膨脹規(guī)律相比傳統(tǒng)統(tǒng)計(jì)的準(zhǔn)確率大大提高。
準(zhǔn)確性,主要是估算值與“真值”之間的差異度。實(shí)際上所謂“真值”是不可知的,一般目標(biāo)為保證統(tǒng)計(jì)誤差在可接受的范圍內(nèi)變動(dòng),據(jù)此保證統(tǒng)計(jì)的準(zhǔn)確性,通過(guò)分析抽樣誤差、人為誤差、計(jì)數(shù)誤差、模型設(shè)計(jì)誤差等多個(gè)對(duì)準(zhǔn)確性產(chǎn)生影響的因素,測(cè)算統(tǒng)計(jì)估值的變動(dòng)系數(shù)、標(biāo)準(zhǔn)差、協(xié)方差等。由于大數(shù)據(jù)的全面性,因此可以通過(guò)減小統(tǒng)計(jì)過(guò)程中的人為誤差保證統(tǒng)計(jì)結(jié)果的準(zhǔn)確性。例如,傳統(tǒng)樣本搜集方法中,受調(diào)查者意識(shí)到自己在接受調(diào)查會(huì)有意對(duì)真實(shí)情況進(jìn)行掩飾,這會(huì)導(dǎo)致調(diào)查所得數(shù)據(jù)無(wú)法真實(shí)反映現(xiàn)實(shí)。大數(shù)據(jù)可以在受調(diào)查者無(wú)意識(shí)的情況下收集他們的信息、獲得數(shù)據(jù),如手機(jī)現(xiàn)在已經(jīng)成為居民必不可少的工具之一,當(dāng)移動(dòng)通訊用戶(hù)帶著手機(jī)進(jìn)行出行、吃飯等一系列日?;顒?dòng)時(shí),移動(dòng)通信商就已經(jīng)在用戶(hù)無(wú)意識(shí)的情況下通過(guò)跟蹤定位手機(jī)采集到了用戶(hù)的位置信息。這種方法獲得的數(shù)據(jù)顯然比傳統(tǒng)調(diào)查方法所獲得的數(shù)據(jù)更為真實(shí)準(zhǔn)確,從而在此基礎(chǔ)上的統(tǒng)計(jì)分析結(jié)果更為可信。
平衡性,即協(xié)調(diào)性,在統(tǒng)計(jì)學(xué)中指數(shù)據(jù)的協(xié)調(diào)能力,造成數(shù)據(jù)平衡性缺失的原因有很多,比如數(shù)據(jù)使用者對(duì)數(shù)據(jù)的理解與數(shù)據(jù)發(fā)布者有差異。大數(shù)據(jù)時(shí)代通過(guò)網(wǎng)絡(luò)數(shù)據(jù)資源,有助于數(shù)據(jù)平衡性的提高。根據(jù)SDDS的第二條規(guī)則,在公布統(tǒng)計(jì)數(shù)據(jù)的同時(shí),在統(tǒng)計(jì)框架內(nèi)公布有關(guān)總量數(shù)據(jù)的分項(xiàng),并公布有關(guān)數(shù)據(jù)的比較和核對(duì)方法與結(jié)果,有利于支持和鼓勵(lì)使用者對(duì)數(shù)據(jù)進(jìn)行核對(duì)和檢驗(yàn),借此提高數(shù)據(jù)平衡性。
統(tǒng)計(jì)成本是進(jìn)行一項(xiàng)統(tǒng)計(jì)調(diào)查或開(kāi)展統(tǒng)計(jì)工作所實(shí)際付出的代價(jià),是統(tǒng)計(jì)工作過(guò)程中耗費(fèi)的人力、財(cái)力和物力的總和。下面從調(diào)查方法與數(shù)據(jù)利用率兩個(gè)角度來(lái)闡述大數(shù)據(jù)時(shí)代統(tǒng)計(jì)成本的降低。
首先,從收集數(shù)據(jù)的方法來(lái)看,傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)收集方法主要依靠調(diào)查,如調(diào)查問(wèn)卷、電話采訪,或者通過(guò)查詢(xún)統(tǒng)計(jì)報(bào)表。開(kāi)展普查,可能就要?jiǎng)佑萌珖?guó)的力量。這些方法都存在缺點(diǎn),準(zhǔn)確性得不到保證,并且統(tǒng)計(jì)成本相當(dāng)可觀。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的獲得途徑為信息網(wǎng)絡(luò)、移動(dòng)通信等,因此從統(tǒng)計(jì)成本的各個(gè)要素來(lái)看,大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)成本會(huì)大幅下降,而且可以得到更大規(guī)模、更高準(zhǔn)確性的數(shù)據(jù)。
其次,從所得數(shù)據(jù)的利用率來(lái)看,傳統(tǒng)統(tǒng)計(jì)中,統(tǒng)計(jì)資料的失效過(guò)期是一個(gè)長(zhǎng)期無(wú)法得到改善的事實(shí),即使是依靠巨大的財(cái)政以及社會(huì)投入取得的普查資料,由于其開(kāi)發(fā)方式單一、傳遞被動(dòng)以及向公眾發(fā)布的手段方式的局限,也得不到及時(shí)廣泛的利用。而在大數(shù)據(jù)時(shí)代,對(duì)數(shù)據(jù)的初始收集沒(méi)有很強(qiáng)的目標(biāo)性,首先,數(shù)據(jù)可以服務(wù)于多個(gè)研究目的,無(wú)需再根據(jù)目的來(lái)重新收集數(shù)據(jù);其次,數(shù)據(jù)被多次利用意味著數(shù)據(jù)價(jià)值的增加;再次,相比于傳統(tǒng)統(tǒng)計(jì),每個(gè)統(tǒng)計(jì)目的收集數(shù)據(jù)的成本會(huì)大幅下降。
最后,統(tǒng)計(jì)成本還體現(xiàn)在公眾獲取方面。對(duì)此,SDDS制定了兩項(xiàng)規(guī)劃:一是成員國(guó)要預(yù)先公布日歷表,據(jù)此進(jìn)行統(tǒng)計(jì)數(shù)據(jù)的公布。預(yù)先公布統(tǒng)計(jì)數(shù)據(jù)發(fā)布日程表不僅可以使使用者根據(jù)自己的實(shí)際情況合理安排利用數(shù)據(jù),還表明統(tǒng)計(jì)工作管理制度的完善和數(shù)據(jù)編制的透明。二是必須保證有關(guān)各方同時(shí)收到所發(fā)布的統(tǒng)計(jì)數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)作為一項(xiàng)公共產(chǎn)品的基本特征之一就是官方統(tǒng)計(jì)數(shù)據(jù)的公布,公眾的基本要求就是及時(shí)和機(jī)會(huì)均等地獲得統(tǒng)計(jì)數(shù)據(jù)。因此 SDDS 通過(guò)此項(xiàng)規(guī)定體現(xiàn)公平的原則并滿(mǎn)足公眾需求。數(shù)據(jù)發(fā)布時(shí)可依次提供概括性數(shù)據(jù)、詳細(xì)的數(shù)據(jù),當(dāng)局應(yīng)至少提供一個(gè)地方使得公眾可以進(jìn)入并有權(quán)使用數(shù)據(jù),保證公眾可以在第一時(shí)間獲得發(fā)布的數(shù)據(jù)。SDDS的目的是指導(dǎo)成員國(guó)并對(duì)其提供一套在數(shù)據(jù)收集和公布方面的標(biāo)準(zhǔn),使各國(guó)在向公眾提供具有全面性、時(shí)效性、可行性和準(zhǔn)確性的數(shù)據(jù)時(shí)遵守共同的依據(jù)。在大數(shù)據(jù)時(shí)代,無(wú)論是數(shù)據(jù)的獲取、分析還是發(fā)布,皆通過(guò)網(wǎng)絡(luò)進(jìn)行,SDDS的規(guī)劃變得更為可行。
大數(shù)據(jù)時(shí)代,對(duì)于統(tǒng)計(jì)學(xué)的發(fā)展應(yīng)該用發(fā)展、辯證的眼光去看待,統(tǒng)計(jì)學(xué)應(yīng)當(dāng)在大數(shù)據(jù)的思想框架下構(gòu)建新的學(xué)科體系。將大數(shù)據(jù)總體統(tǒng)計(jì)的思想和方法納入統(tǒng)計(jì)學(xué)學(xué)科體系是非常必要的,例如,在統(tǒng)計(jì)學(xué)的教學(xué)內(nèi)容中,將樣本統(tǒng)計(jì)和總體統(tǒng)計(jì)相結(jié)合。樣本統(tǒng)計(jì)對(duì)樣本的要求是能夠正確地代表總體,這就要求總體的觀察單位必須是同質(zhì)的,在現(xiàn)實(shí)生活中這種理想情況不容易達(dá)到,而基于大數(shù)據(jù)的總體統(tǒng)計(jì)恰好能夠彌補(bǔ)樣本統(tǒng)計(jì)的這一不足之處。數(shù)據(jù)挖掘又稱(chēng)數(shù)據(jù)采礦,是數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)中的一個(gè)步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中的信息的過(guò)程。涉及機(jī)器學(xué)習(xí)、人工智能、模式識(shí)別、數(shù)據(jù)可視化等模塊,也屬于數(shù)據(jù)處理的范疇。因此,統(tǒng)計(jì)學(xué)應(yīng)該對(duì)其進(jìn)行充分的利用,將統(tǒng)計(jì)學(xué)原理應(yīng)用到數(shù)據(jù)挖掘的技術(shù)中。當(dāng)今大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)也應(yīng)與計(jì)算機(jī)緊密結(jié)合,以數(shù)據(jù)挖掘?yàn)槠鯔C(jī),進(jìn)一步延伸和完善統(tǒng)計(jì)學(xué)科體系,培養(yǎng)具有現(xiàn)代統(tǒng)計(jì)技術(shù)、數(shù)據(jù)挖掘技術(shù)與計(jì)算機(jī)技術(shù)的復(fù)合人才。同時(shí),統(tǒng)計(jì)學(xué)不僅要注重與其他學(xué)科的結(jié)合,更需要注重自身學(xué)科的提高,在原理、技術(shù)、方法等方面認(rèn)真鉆研,與時(shí)俱進(jìn),謀求創(chuàng)新與突破。結(jié)束語(yǔ):
在當(dāng)今社會(huì),統(tǒng)計(jì)起著“神經(jīng)系統(tǒng)”的作用。統(tǒng)計(jì)是連接社會(huì)再生產(chǎn)各個(gè)環(huán)節(jié)、各個(gè)要素的中介,是商品生產(chǎn)和商品交換的先導(dǎo),對(duì)經(jīng)濟(jì)活動(dòng)進(jìn)行起著靈敏有效的調(diào)節(jié)作用。例如,市場(chǎng)經(jīng)濟(jì)的統(tǒng)計(jì)信息是商品的生產(chǎn)和經(jīng)營(yíng)活動(dòng)的依據(jù)。市場(chǎng)經(jīng)濟(jì)信息主要有兩個(gè)方面:一是客戶(hù)對(duì)商品的需求,包括商品數(shù)量、品種、質(zhì)量和規(guī)格的要求等;二是各類(lèi)商品生產(chǎn)、供應(yīng)以及價(jià)格的變化。商品生產(chǎn)者生產(chǎn)商品的種類(lèi)、數(shù)量、質(zhì)量改進(jìn)等問(wèn)題都要根據(jù)市場(chǎng)需求信息和價(jià)格信息等來(lái)研究決定;商品經(jīng)營(yíng)者所決定的商品購(gòu)買(mǎi)、庫(kù)存、定價(jià)等問(wèn)題也需要根據(jù)生產(chǎn)、需求信息及其變化趨勢(shì)來(lái)研究決定。在大數(shù)據(jù)時(shí)代,以上這些統(tǒng)計(jì)信息的獲得不再局限于電話調(diào)查、問(wèn)卷調(diào)查等高成本、低收益的方式,而是可以借助網(wǎng)絡(luò)、移動(dòng)通信等方式。同時(shí),數(shù)據(jù)的質(zhì)量也不再受到主觀因素的限制。
由于大數(shù)據(jù)的產(chǎn)生,使得統(tǒng)計(jì)學(xué)的定義、思維方式、作用都不同于傳統(tǒng)統(tǒng)計(jì)。毫無(wú)疑問(wèn),隨著大數(shù)據(jù)時(shí)代的來(lái)臨,統(tǒng)計(jì)學(xué)的發(fā)展進(jìn)入了一個(gè)新的階段。
[1]Lynch C.Big data: How do your data grow? [J]Nature, 2008, 455(7209)
[2]Rifkin J.The third industrial revolution: How lateral power is transforming energy, the Economy, and the World [M].New York: Palgrave Macmillan,2012
[3]Bughin J.Chui M, Manyika J.Clouds, big data and smart assets: Ten tech-enabled business trends to watch [J].McKinsey Quarterly, 2010(8)
[4]Lavalle S, Lesser E, Shockley R, et al.Big data, analytics and the path from insights to value [J].MIT Sloan Management Review, 2011, 52(2)
[5]MacKinsey Global Institute.2011.Big data: The next frontier for innovation,competition and productivity.June 2011.Lexington, KY: McKinsey &Company
[6]Dabenport T H, Barth P, Bean R.How big data is different [J].MIT Sloan Management Review, 2012, 53(5).
[7]朱建平、章貴軍、劉曉葳,大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理念的辨析[J]統(tǒng)計(jì)研究,2014(2)
[8]袁衛(wèi),機(jī)遇與挑戰(zhàn)——寫(xiě)在統(tǒng)計(jì)學(xué)科成為一級(jí)學(xué)科之際[J]統(tǒng)計(jì)研究,2011(11)
[9]李金昌,大數(shù)據(jù)與統(tǒng)計(jì)新思維[J]統(tǒng)計(jì)研究,2014(1)
[10]朱建平著,世紀(jì)之交中國(guó)統(tǒng)計(jì)學(xué)科的回顧與思考[M].中國(guó)經(jīng)濟(jì)出版社,1999, 12.
[11]曾鴻、豐敏軒,大數(shù)據(jù)與統(tǒng)計(jì)變革[J]中國(guó)統(tǒng)計(jì),2013(9)
[12]肖紅葉,中國(guó)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)科建設(shè)30年回顧與評(píng)論——基于三大框架事件的研究[J].統(tǒng)計(jì)研究.2010(2)
[13]朱懷慶,大數(shù)據(jù)時(shí)代對(duì)本科經(jīng)管類(lèi)統(tǒng)計(jì)學(xué)教學(xué)的影響及策略[J]高等教育研究,2014(3)
[14]程開(kāi)明、莊燕杰,大數(shù)據(jù)背景下的統(tǒng)計(jì)[J]統(tǒng)計(jì)研究,2014(1)