吳學(xué)品
(海南大學(xué) 經(jīng)濟(jì)與管理學(xué)院,海南 ???570228)
?
適應(yīng)大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)專業(yè)課程體系重構(gòu)初探
吳學(xué)品
(海南大學(xué) 經(jīng)濟(jì)與管理學(xué)院,海南 ???570228)
摘要:大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來機(jī)遇和挑戰(zhàn)。通過描述大數(shù)據(jù)特點(diǎn),分析并探究了現(xiàn)行統(tǒng)計(jì)學(xué)課程體系應(yīng)對數(shù)據(jù)爆發(fā)性增長、內(nèi)容體系和課程設(shè)置上的不足之處。并針對性地提出了大數(shù)據(jù)背景下未來統(tǒng)計(jì)學(xué)課程教學(xué)改革策略:重視培養(yǎng)學(xué)生的數(shù)據(jù)挖掘能力、現(xiàn)代計(jì)算技術(shù)能力、不同類型數(shù)據(jù)分析能力、數(shù)據(jù)復(fù)雜性和不確定性系統(tǒng)建模能力。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);應(yīng)對措施
引言
隨著云計(jì)算、互聯(lián)網(wǎng)+、物聯(lián)網(wǎng)及存儲(chǔ)等技術(shù)發(fā)展,全球數(shù)據(jù)呈指數(shù)型的爆炸性增長,大數(shù)據(jù)發(fā)展將給社會(huì)和個(gè)人帶來深遠(yuǎn)影響。大數(shù)據(jù)有著數(shù)量體量巨大(volume)、類型繁多(variety)、價(jià)值密度低(value)和處理速度快(velocity)的4V特點(diǎn),把握好大數(shù)據(jù)的特點(diǎn)是利用好大數(shù)據(jù)的關(guān)鍵,也只有有效掌握大數(shù)據(jù)特點(diǎn),才能對海量數(shù)據(jù)進(jìn)行分析,才能挖掘大數(shù)據(jù)有價(jià)值的信息,更好地為社會(huì)服務(wù)。因此,大數(shù)據(jù)給統(tǒng)計(jì)教育帶來了全新機(jī)遇和挑戰(zhàn),對統(tǒng)計(jì)專業(yè)人才提出更高要求,結(jié)合大數(shù)據(jù)特點(diǎn)對統(tǒng)計(jì)教育進(jìn)行改革是當(dāng)務(wù)之急,本人將就大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)專業(yè)課程建設(shè)談?wù)勛约旱南敕ā?/p>
一現(xiàn)行統(tǒng)計(jì)學(xué)課程體系存在的不足
統(tǒng)計(jì)抽樣理論得以迅速發(fā)展,是因?yàn)槿藗冊诖蠖鄷r(shí)候無法觀察到總體,需要抽取樣本數(shù)據(jù)推斷總體,這同時(shí)也是傳統(tǒng)統(tǒng)計(jì)學(xué)方法的基礎(chǔ)。實(shí)現(xiàn)這個(gè)目標(biāo)關(guān)鍵在于從總體中抽取的隨機(jī)樣本,樣本隨機(jī)性是減少統(tǒng)計(jì)推斷誤差的必要條件。在傳統(tǒng)統(tǒng)計(jì)學(xué)課程中,統(tǒng)計(jì)學(xué)是通過隨機(jī)收集等手段,以達(dá)到推斷研究對象本質(zhì)的目的。許多課程圍繞如何得到代表總體的隨機(jī)樣本數(shù)據(jù)開設(shè)。如《社會(huì)調(diào)查方法》《抽樣技術(shù)與應(yīng)用》等,這些課程作為統(tǒng)計(jì)專業(yè)核心課程,在學(xué)分、學(xué)時(shí)等方面所占比重較大,從理論和方法上闡述了如何收集隨機(jī)樣本并進(jìn)行統(tǒng)計(jì)推斷。而在大數(shù)據(jù)時(shí)代,數(shù)據(jù)量爆發(fā)式增長和存儲(chǔ)技術(shù)發(fā)展使得數(shù)據(jù)從“體量”、“類型”、“速度”與“量化”上發(fā)生了巨大變化。從數(shù)量上來看,所得到樣本就是總體。由于是全體數(shù)據(jù),因而不再有抽樣誤差問題,只有非抽樣誤差問題,在某種意義上來說,大數(shù)據(jù)對統(tǒng)計(jì)推斷更具有全面性和準(zhǔn)確性。雖然在一定程度上,這對傳統(tǒng)統(tǒng)計(jì)抽樣技術(shù)來說,巨量數(shù)據(jù)的出現(xiàn)在某種程度上并不是針對特定統(tǒng)計(jì)研究目的而產(chǎn)生,并且有價(jià)值低的特點(diǎn),但大數(shù)據(jù)類型繁多,包含信息量巨大,可以滿足多層次、多角度統(tǒng)計(jì)分析需要,這大大提高了人們從數(shù)據(jù)中獲取信息能力,使得人們更加了解總體。從這一點(diǎn)來看,在大數(shù)據(jù)時(shí)代,針對某種特定研究目的的隨機(jī)抽樣技術(shù)的作用會(huì)大大減弱。然而,面對大數(shù)據(jù)時(shí)代巨量數(shù)據(jù),傳統(tǒng)統(tǒng)計(jì)學(xué)現(xiàn)有的應(yīng)對方法顯得不足,無論從數(shù)據(jù)整理、分類、取舍,還是不同類型數(shù)據(jù)間信息轉(zhuǎn)換的角度,現(xiàn)有統(tǒng)計(jì)仍存在極大不足。
從統(tǒng)計(jì)學(xué)內(nèi)容來說,傳統(tǒng)統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)的一個(gè)分支,內(nèi)容體系主要為隨機(jī)理論體系,其大部分統(tǒng)計(jì)推斷方法也是在隨機(jī)理論基礎(chǔ)上建立起來的,即主要通過利用隨機(jī)理論,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化分析、總結(jié),作出推斷和預(yù)測,為相關(guān)決策提供依據(jù)和參考。從研究特點(diǎn)來看,統(tǒng)計(jì)學(xué)的數(shù)量性表現(xiàn)在用規(guī)模、水平、速度、結(jié)構(gòu)和比例等去描述和分析社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量表現(xiàn)、數(shù)量關(guān)系和數(shù)量變化,揭示事物本質(zhì),反映事物發(fā)展規(guī)律,推測事物發(fā)展前景。而在大數(shù)據(jù)時(shí)代,大部分?jǐn)?shù)據(jù)并非來自隨機(jī)抽樣,探知總體分布類型、數(shù)字特征或發(fā)展規(guī)律和本質(zhì)完全可不通過由隨機(jī)抽樣建立起來的統(tǒng)計(jì)推斷方法。大數(shù)據(jù)強(qiáng)調(diào)的是全體數(shù)據(jù),有關(guān)總體分布假設(shè)和總體特征等不再需要根據(jù)分布理論進(jìn)行推斷,只需進(jìn)行計(jì)數(shù)或歸納分析即可。有了全體數(shù)據(jù)以后,有關(guān)總體的一切統(tǒng)計(jì)應(yīng)用將變得非常簡單,包括發(fā)生概率大小、趨勢預(yù)測等,這些應(yīng)用只需要做一些簡單定量分析和總結(jié)即可。另外,大數(shù)定律、中心極限定理等的作用也將弱化。大數(shù)定律闡明了當(dāng)樣本容量足夠大時(shí),“頻率”靠近“概率”的理論證明以及隨機(jī)變量序列依概率收斂于常數(shù)的問題。在大數(shù)據(jù)時(shí)代,巨量數(shù)據(jù)的出現(xiàn)使得這些客觀存在的現(xiàn)象可以直接通過總體數(shù)據(jù)得到,而不必再局限于原來的有限樣本數(shù)據(jù)的推理和比較。值得一提的是,作為統(tǒng)計(jì)推斷工具,統(tǒng)計(jì)量也沒有存在的必要。因此,在大數(shù)據(jù)背景下,現(xiàn)有統(tǒng)計(jì)學(xué)理論缺乏對來自非隨機(jī)抽樣的全數(shù)據(jù)統(tǒng)計(jì)方法,建立基于全數(shù)據(jù)的統(tǒng)計(jì)推斷方法顯得極為重要。
從統(tǒng)計(jì)學(xué)課程設(shè)置來看,目前統(tǒng)計(jì)學(xué)教學(xué)體系主要由公共課程、學(xué)科基礎(chǔ)課、專業(yè)課、必修課和專業(yè)選修課構(gòu)成。公共課程主要為一些通識類課程組成,而學(xué)科基礎(chǔ)課由數(shù)學(xué)類和經(jīng)濟(jì)類課程組成,專業(yè)必修課和專業(yè)選修課則由以隨機(jī)理論體系的課程和數(shù)據(jù)分析應(yīng)用類的課程組成。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)種類繁多,并具有物聯(lián)網(wǎng)、存儲(chǔ)技術(shù)、信息化和非結(jié)構(gòu)化等特點(diǎn),現(xiàn)有統(tǒng)計(jì)學(xué)課程設(shè)置遠(yuǎn)遠(yuǎn)不能滿足數(shù)據(jù)整理、識別和分析需要,也難以應(yīng)對這些新數(shù)據(jù)技術(shù)挑戰(zhàn)。統(tǒng)計(jì)課程體系中公共基礎(chǔ)課和專業(yè)基礎(chǔ)課內(nèi)容較為狹窄,缺乏計(jì)算機(jī)技術(shù)、存儲(chǔ)技術(shù)、云計(jì)算等內(nèi)容的覆蓋,專業(yè)課中也缺乏對信息化內(nèi)容的設(shè)置,選修類課程中更應(yīng)該具有針對非結(jié)構(gòu)化數(shù)據(jù)處理方法的培養(yǎng)。
二重構(gòu)統(tǒng)計(jì)學(xué)課程體系提升學(xué)生適應(yīng)時(shí)代能力
隨著大數(shù)據(jù)時(shí)代來臨,統(tǒng)計(jì)教育教學(xué)將面臨著嚴(yán)峻挑戰(zhàn)。一方面,在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)巨量增長和數(shù)據(jù)類型多樣化等特點(diǎn)均對傳統(tǒng)統(tǒng)計(jì)方法和理論提出新要求,對大數(shù)據(jù)處理必定會(huì)需要挖掘新數(shù)據(jù)和計(jì)算技術(shù);另一方面,我國現(xiàn)行統(tǒng)計(jì)教育教學(xué)理論模式都是按隨機(jī)抽樣理論體系建立起來的,理論結(jié)構(gòu)比較固定,數(shù)據(jù)類型相對較少,統(tǒng)計(jì)方法單一,難以適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)量巨大、類型多變的統(tǒng)計(jì)要求。為使現(xiàn)行統(tǒng)計(jì)教育從數(shù)據(jù)思維、分析評價(jià)和實(shí)證邏輯等方面適應(yīng)大數(shù)據(jù)要求,滿足統(tǒng)計(jì)學(xué)對大數(shù)據(jù)時(shí)代建設(shè)需要,提出從以下方面去積極應(yīng)對大數(shù)據(jù),促進(jìn)統(tǒng)計(jì)學(xué)教育跟上時(shí)代步伐。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)并不等于信息,大數(shù)據(jù)具有兩個(gè)明顯特點(diǎn),第一,大數(shù)據(jù)量很大、速度快,但這些數(shù)據(jù)都是自動(dòng)收集的,這也意味著數(shù)據(jù)中有很多噪音信息;第二,現(xiàn)有統(tǒng)計(jì)方法大部分都局限在處理數(shù)字?jǐn)?shù)據(jù)上,較少針對其他數(shù)據(jù)類型,但大數(shù)據(jù)類型種類繁多,包括函數(shù)數(shù)據(jù)、文本數(shù)據(jù)、信息化數(shù)據(jù)等不同類型數(shù)據(jù)。應(yīng)改變對傳統(tǒng)數(shù)據(jù)形式認(rèn)知,培養(yǎng)學(xué)生從不同結(jié)構(gòu)數(shù)據(jù)挖掘有用信息的能力,剔除噪音數(shù)據(jù),加強(qiáng)學(xué)生對不同類型數(shù)據(jù)處理的能力培養(yǎng)。此外,應(yīng)增設(shè)信息處理類、計(jì)算數(shù)學(xué)類等課程設(shè)置,以培養(yǎng)學(xué)生應(yīng)對大數(shù)據(jù)時(shí)代數(shù)據(jù)信息化挑戰(zhàn),提高學(xué)生對信息化數(shù)據(jù)挖掘能力。
無論從數(shù)據(jù)容量還是數(shù)據(jù)種類上,傳統(tǒng)統(tǒng)計(jì)學(xué)方法所能處理的數(shù)據(jù)都非常有限。但在大數(shù)據(jù)時(shí)代,面對巨量非結(jié)構(gòu)化數(shù)據(jù),更需要依靠云計(jì)算技術(shù)才能應(yīng)對,特別是云計(jì)算中的虛擬化、云終端、云管理,以及編程模型、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、云計(jì)算平臺管理等內(nèi)容,只有這些計(jì)算機(jī)技術(shù)和統(tǒng)計(jì)技術(shù)結(jié)合起來,才能使得統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代大顯身手,有所作為,統(tǒng)計(jì)思想才能在大數(shù)據(jù)分析中得到體現(xiàn)。因此,應(yīng)加強(qiáng)對計(jì)算機(jī)類、數(shù)據(jù)庫管理類、語言編程類等課程設(shè)置,以培養(yǎng)學(xué)生計(jì)算機(jī)技術(shù)能力、數(shù)據(jù)庫管理能力和計(jì)算技術(shù)能力。
與傳統(tǒng)統(tǒng)計(jì)數(shù)據(jù)相比,大數(shù)據(jù)是一個(gè)數(shù)量巨大和高維變量的數(shù)據(jù)集合,覆蓋類型也多種多樣,包括文本或語言、圖像、網(wǎng)絡(luò)和圖形等。無論從數(shù)量還是類型上,大數(shù)據(jù)具有半結(jié)構(gòu)化和非結(jié)構(gòu)化特點(diǎn),傳統(tǒng)統(tǒng)計(jì)分析方法很難勝任分析大數(shù)據(jù)的重任,這需要來自包括數(shù)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、計(jì)算機(jī)科學(xué)和管理科學(xué)在內(nèi)的多學(xué)科交叉運(yùn)用。因此,在現(xiàn)有課程設(shè)置中,加強(qiáng)對通知類教育課程設(shè)置,增強(qiáng)學(xué)生對不同數(shù)據(jù)識別能力,并教授基于多學(xué)科的統(tǒng)計(jì)分析方法,組成強(qiáng)大分析工具,才能輕松對大數(shù)據(jù)進(jìn)行整理、歸類、分析和預(yù)測。
大數(shù)據(jù)具有復(fù)雜性和不確定性。為應(yīng)對大數(shù)據(jù)的個(gè)體復(fù)雜性和隨機(jī)性挑戰(zhàn),未來統(tǒng)計(jì)學(xué)人才應(yīng)掌握最優(yōu)化、數(shù)據(jù)包絡(luò)分析、期望理論、管理科學(xué)等理論方法。因此,在專業(yè)選修課設(shè)置中,加強(qiáng)對系統(tǒng)課程類及不確定性科學(xué)類課程設(shè)置,以幫助學(xué)生掌握系統(tǒng)建模方法,從而增強(qiáng)學(xué)生從種類繁多的數(shù)據(jù)類型中獲取與研究目的有關(guān)資料數(shù)據(jù)的能力以及定量統(tǒng)計(jì)分析能力。
結(jié)論
綜上所述,大數(shù)據(jù)給統(tǒng)計(jì)學(xué)科帶來新的生命力,同時(shí)也提出了新挑戰(zhàn),將給現(xiàn)有統(tǒng)計(jì)教學(xué)體系內(nèi)容、教學(xué)大綱及培養(yǎng)方案帶來大的變革。新的統(tǒng)計(jì)學(xué)教學(xué)體系需要數(shù)學(xué)、系統(tǒng)科學(xué)、計(jì)算機(jī)、統(tǒng)計(jì)學(xué)及信息學(xué)等學(xué)科的緊密結(jié)合,從教學(xué)大綱、教學(xué)內(nèi)容、教學(xué)體系以及培養(yǎng)方案上作出相應(yīng)調(diào)整,才能順應(yīng)大數(shù)據(jù)本質(zhì)及特點(diǎn),展現(xiàn)統(tǒng)計(jì)學(xué)新的生命力。
(責(zé)任編輯:王玨)
The Discussion on Reconstruction of
Statistics Course System in the Big Data Era
WU Xue-pin
(School of Economic and Management, Hainan University, Haikou 570228,China)
Abstract:The big data brings opportunities and challenges for statistics. This paper describes the characteristics of big data, and analyzes the shortage of statistics for dealing with the explosive growth of data、content system and curriculum under the big data background. and puts forward the coping strategies of statistics teaching reform in the future, it should pay attention to data mining capability、modern computing technology capability、analysis capability on different types of data and data modeling capability of complexity and uncertainty system.
Key words:big data; statistics; coping strategies
基金項(xiàng)目:2013年海南大學(xué)資助項(xiàng)目“中西部高校綜合能力提升計(jì)劃項(xiàng)目”成果之一。
作者簡介:吳學(xué)品,男,漢族,海南儋州人。經(jīng)濟(jì)學(xué)博士。海南大學(xué)經(jīng)濟(jì)與管理學(xué)院副教授。主要研究方向:統(tǒng)計(jì)方法、應(yīng)用計(jì)量模型等。
收稿日期:2015-11-29
DOI:10.13803/j.cnki.issn1009-9743.2015.04.026
中圖分類號:C829.2
文獻(xiàn)標(biāo)識碼:A
文章編號:1009-9743(2015)04-0117-03