摘 要:隨著科學(xué)技術(shù)的的快速發(fā)展,大數(shù)據(jù)時(shí)代如期而至,對(duì)社會(huì)各方面產(chǎn)生了巨大影響。統(tǒng)計(jì)學(xué)作為生活中必不可缺少的一門學(xué)科,受其影響頗深。因此,本文基于大數(shù)據(jù)時(shí)代背景,將對(duì)統(tǒng)計(jì)學(xué)的重構(gòu)與創(chuàng)新進(jìn)行研究。
關(guān)鍵詞:大數(shù)據(jù) 統(tǒng)計(jì)學(xué) 重構(gòu) 創(chuàng)新
21世紀(jì),科學(xué)技術(shù)迅猛發(fā)展,特別是計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的發(fā)展,促使大數(shù)據(jù)時(shí)代的到來(lái)。大數(shù)據(jù)被當(dāng)代許多人視為全新的致富方法,它所擁有的價(jià)值堪比黃金。據(jù)此推斷,大數(shù)據(jù)將給社會(huì)帶了全新的變革,影響社會(huì)生活的各個(gè)方面。同時(shí),在實(shí)際生活中,在農(nóng)業(yè)、經(jīng)濟(jì)等領(lǐng)域都有統(tǒng)計(jì)學(xué)應(yīng)用的表現(xiàn),足以說(shuō)明統(tǒng)計(jì)學(xué)在社會(huì)生活中應(yīng)用范圍的廣泛。鑒于此,在大數(shù)據(jù)時(shí)代背景下,對(duì)統(tǒng)計(jì)學(xué)展開研究是十分有必要的,本文將主要在大數(shù)據(jù)時(shí)代背景下,對(duì)統(tǒng)計(jì)學(xué)的重構(gòu)與創(chuàng)新兩個(gè)方面進(jìn)行研究。
一、大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的界定
1.大數(shù)據(jù)的來(lái)源。“大數(shù)據(jù)”一詞最早出現(xiàn)于apache.org的開源項(xiàng)目Nutch中。在當(dāng)時(shí),大數(shù)據(jù)通常是用于對(duì)大量數(shù)據(jù)的收集、分析和描述的集合。直到2009年,“163大數(shù)據(jù)”事件的發(fā)生,促使“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行術(shù)語(yǔ)。根據(jù)相關(guān)機(jī)構(gòu)統(tǒng)計(jì),當(dāng)前互聯(lián)網(wǎng)數(shù)據(jù)正以每年50%的比例增長(zhǎng),大數(shù)據(jù)涉及到我們生活的方方面面,如汽車、電表、溫度和濕度等。這都足以說(shuō)明,大數(shù)據(jù)在我們生活中無(wú)處不在,大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。
2.統(tǒng)計(jì)學(xué)的來(lái)源。統(tǒng)計(jì)學(xué)由來(lái)已久,它是伴隨人們的實(shí)踐活動(dòng)而產(chǎn)生的,因此,統(tǒng)計(jì)學(xué)的起源可以由遠(yuǎn)古時(shí)代談起,即統(tǒng)計(jì)學(xué)已經(jīng)存在并持續(xù)發(fā)展了五千多年,有著深厚的歷史淵源,隨著時(shí)間的流暢,統(tǒng)計(jì)學(xué)得到不斷的發(fā)展與應(yīng)用。但是,統(tǒng)計(jì)學(xué)作為一門科學(xué),距今僅僅大約三百年的歷史,根據(jù)統(tǒng)計(jì)學(xué)的發(fā)展而言,可以將其分為三個(gè)階段,分別是古典記錄統(tǒng)計(jì)學(xué)、近代描述統(tǒng)計(jì)學(xué)和現(xiàn)代推斷統(tǒng)計(jì)學(xué)。
3.大數(shù)據(jù)時(shí)代與統(tǒng)計(jì)學(xué)的關(guān)系。大數(shù)據(jù)與統(tǒng)計(jì)學(xué)之間有著千絲萬(wàn)縷的聯(lián)系,密不可分。當(dāng)前是信息時(shí)代,各處都充斥著大數(shù)據(jù),要通過(guò)大數(shù)據(jù)分析事物的本質(zhì),必須通過(guò)科學(xué)的統(tǒng)計(jì)學(xué)技術(shù),方可解決。反之,大數(shù)據(jù)時(shí)代的到來(lái),為統(tǒng)計(jì)學(xué)的發(fā)展提供了更為廣闊的空間,包括統(tǒng)計(jì)學(xué)應(yīng)用領(lǐng)域的擴(kuò)展,繼續(xù)信息技術(shù)開發(fā)的適用于大數(shù)據(jù)分析的技術(shù)手段。統(tǒng)計(jì)學(xué)采用不同的計(jì)量尺度,將所有的數(shù)據(jù)加以分類,得到不同類型的統(tǒng)計(jì)數(shù)據(jù)。分類后的數(shù)據(jù)在精確度和適用度方面都有顯著提高,便于利用。
二、大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)的重構(gòu)研究
1.大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)基本理論發(fā)展研究。
1.1統(tǒng)計(jì)學(xué)總體理論的框架。作為來(lái)在總體數(shù)據(jù)的樣本數(shù)據(jù),無(wú)論是傳統(tǒng)統(tǒng)計(jì)學(xué)理論還是大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)理論,都對(duì)總體數(shù)據(jù)的認(rèn)知方面起到關(guān)鍵作用。在傳統(tǒng)統(tǒng)計(jì)學(xué)理論中,通過(guò)樣本數(shù)據(jù),能夠?qū)崿F(xiàn)對(duì)總體數(shù)據(jù)的基本認(rèn)知;在大數(shù)據(jù)時(shí)代,樣本歸結(jié)于總體,其不再是隨機(jī)的樣本,因此,將不再需要對(duì)總體進(jìn)行假定。
1.2大數(shù)據(jù)視角的抽樣理論。在傳統(tǒng)統(tǒng)計(jì)學(xué)分析中,抽樣分析存在很多缺陷,通常為將這些缺陷的影響降低到最小,會(huì)設(shè)置許多假定條件;相反,在大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)分析,不再需要抽樣檢測(cè),因此,在沒(méi)有過(guò)多不必要的條件限制下,會(huì)得到更加準(zhǔn)確地結(jié)果。
1.3新的理論與方法。統(tǒng)計(jì)理論又被稱作是數(shù)理統(tǒng)計(jì),是一門關(guān)于社會(huì)經(jīng)濟(jì)活動(dòng)數(shù)量表現(xiàn)和數(shù)量關(guān)系的方法論科學(xué),是對(duì)數(shù)據(jù)進(jìn)行收集、分析、解釋的科學(xué)。統(tǒng)計(jì)理論通過(guò)利用分析、解釋和表述等方法,實(shí)現(xiàn)對(duì)事物現(xiàn)象本質(zhì)的推斷,是一門綜合性的科學(xué)。
2.大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)研究框架重構(gòu)。
2.1統(tǒng)計(jì)學(xué)理論和方法。傳統(tǒng)統(tǒng)計(jì)學(xué)研究中,重點(diǎn)主要集中在概率分布指數(shù)族,其又涵蓋了圖標(biāo)指數(shù)族和相關(guān)變量信息效應(yīng)等內(nèi)容。在指數(shù)族研究中,十分重要的一方面就是,它包含許多的已知概率分布。指數(shù)族研究作為數(shù)理統(tǒng)計(jì)的核心部分,其應(yīng)用不但廣泛而且重要。
2.2大數(shù)據(jù)吝嗇建模。伴隨計(jì)算機(jī)技術(shù)的快速發(fā)展,大數(shù)據(jù)時(shí)代到來(lái),快捷簡(jiǎn)單的算法不斷被開發(fā),這種線上算法是順應(yīng)時(shí)代潮流應(yīng)運(yùn)而生的,隨著大數(shù)據(jù)的不斷發(fā)展,線上算法的應(yīng)用將得到進(jìn)一步開發(fā)與發(fā)展,其也必將對(duì)統(tǒng)計(jì)學(xué)研究產(chǎn)生深遠(yuǎn)影響。
2.3巨型分布系統(tǒng)建模。利用當(dāng)今先進(jìn)的信息技術(shù),生成大數(shù)據(jù),進(jìn)而增加至億億兆平臺(tái)的速度。在當(dāng)前大數(shù)據(jù)系統(tǒng)平臺(tái)中,同時(shí)存在許多小數(shù)目的數(shù)據(jù)需要進(jìn)行比較,此種情況,也要花費(fèi)大量的資源。因此,就要以大數(shù)據(jù)系統(tǒng)為平臺(tái),利用分布方式結(jié)合大型科學(xué)數(shù)據(jù)集進(jìn)行建模和設(shè)計(jì),研發(fā)出適應(yīng)大數(shù)據(jù)的新型算法。
2.4巨大矩陣的統(tǒng)計(jì)模擬與推斷。隨著科學(xué)技術(shù)的迅猛發(fā)展,使用較低的成本就可以對(duì)大數(shù)據(jù)實(shí)現(xiàn)收集和存儲(chǔ),伴隨科學(xué)研究范圍的擴(kuò)大,海量數(shù)據(jù)涌現(xiàn)出來(lái)。一般來(lái)說(shuō)觀測(cè)能力要遠(yuǎn)遠(yuǎn)超過(guò)信息提取能力的,從這方面來(lái)看無(wú)疑為這項(xiàng)研究提供了動(dòng)力。當(dāng)前這方面研究主要集中在了波動(dòng)率矩陣、協(xié)方差矩陣等矩陣統(tǒng)計(jì)理論的研發(fā)上,該研究對(duì)進(jìn)一步理解大數(shù)據(jù)對(duì)科學(xué)研究的影響非常有利。
三、大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)的創(chuàng)新研究
1.統(tǒng)計(jì)學(xué)作用的擴(kuò)大。伴隨大數(shù)據(jù)時(shí)代的到來(lái),統(tǒng)計(jì)學(xué)的應(yīng)用范圍也得到擴(kuò)大,擴(kuò)展至其他的學(xué)科領(lǐng)域,如金融、農(nóng)學(xué)等領(lǐng)域,由此是統(tǒng)計(jì)學(xué)的價(jià)值不斷得到發(fā)展。21世紀(jì)是信息時(shí)代,統(tǒng)計(jì)學(xué)的發(fā)展也必須適應(yīng)當(dāng)前時(shí)代的發(fā)展,不斷與計(jì)算機(jī)技術(shù)相結(jié)合,擴(kuò)大自身的應(yīng)用范圍,產(chǎn)生更大的效用。利用先進(jìn)的計(jì)算機(jī)技術(shù),研發(fā)新新的分析技術(shù),使統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域更加廣泛,為社會(huì)創(chuàng)造更大的價(jià)值。
2.采用新的梳理與分類方法處理大數(shù)據(jù)。作為大數(shù)據(jù),其來(lái)源、表現(xiàn)方式和形式都不是一成不變的,是多樣化的,如果用以前的統(tǒng)計(jì)方法對(duì)大數(shù)據(jù)進(jìn)行分析研究,是行不通的。針對(duì)大數(shù)據(jù),必須開發(fā)新的統(tǒng)計(jì)方法,如新的梳理和分類方法,以適應(yīng)大數(shù)據(jù)的特性,開辟出新的分析路徑。
3.統(tǒng)計(jì)思維與現(xiàn)代信息技術(shù)相結(jié)合。傳統(tǒng)統(tǒng)計(jì)學(xué)所使用的技術(shù)已經(jīng)十分成熟,如收集和分析數(shù)據(jù)等技術(shù),但這些技術(shù)僅限于數(shù)據(jù)一定量時(shí)。現(xiàn)今大數(shù)據(jù)時(shí)代,一些技術(shù)的應(yīng)用受到限制,所以就必須將統(tǒng)計(jì)思維與現(xiàn)代信息技術(shù)相結(jié)合,創(chuàng)造出新型的技術(shù)方法,加強(qiáng)對(duì)新技術(shù)的創(chuàng)新與應(yīng)用。
四、結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代的到來(lái),提高了統(tǒng)計(jì)質(zhì)量,降低了統(tǒng)計(jì)成本,使得統(tǒng)計(jì)學(xué)發(fā)揮作用的領(lǐng)域增大,并且使統(tǒng)計(jì)學(xué)科得以延伸,提高了統(tǒng)計(jì)學(xué)科在自然科學(xué)和社會(huì)科學(xué)中的地位,對(duì)于統(tǒng)計(jì)學(xué)研究,要借助大數(shù)據(jù)時(shí)代背景,順應(yīng)潮流,不斷提出新的思維與方法。
參考文獻(xiàn):
[1]耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014,31(1):5-9.
[2]楊軼莘.大數(shù)據(jù)時(shí)代下的統(tǒng)計(jì)學(xué)[M].電子工業(yè)出版社,2015.
[3]劉文軒.大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)發(fā)展的新思路[J].經(jīng)濟(jì), 2016(5):00239-00239.
[4]謝文飛.淺談統(tǒng)計(jì)學(xué)的大數(shù)據(jù)時(shí)代的發(fā)展方向及趨勢(shì)[J].商,2015(20):206-206.
[5]侯慶璇.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)發(fā)展前景及應(yīng)用研究[J].管理學(xué)家,2014(4).