王少瑾
(煙臺大學(xué) 經(jīng)濟(jì)管理學(xué)院,山東 煙臺 264005)
隨著互聯(lián)網(wǎng)和計算機(jī)技術(shù)的普及與飛速發(fā)展,人類進(jìn)入信息爆炸式增長的時代,各行各業(yè)每天都產(chǎn)生海量的數(shù)據(jù),其可以千萬億字節(jié)來計算,可以說,人們已經(jīng)進(jìn)入大數(shù)據(jù)時代,大數(shù)據(jù)已經(jīng)成為國家的基礎(chǔ)性戰(zhàn)略資源。
隨著大數(shù)據(jù)時代的來臨,世界各國對大數(shù)據(jù)均給予了前所未有的重視。早在2012 年3 月,美國奧巴馬政府頒布了《大數(shù)據(jù)的研究和發(fā)展計劃》,將大數(shù)據(jù)上升為國家戰(zhàn)略,引起全球的廣泛關(guān)注;2017 年12月,中共中央總書記習(xí)近平在主持實(shí)施國家大數(shù)據(jù)戰(zhàn)略第二次集體學(xué)習(xí)時強(qiáng)調(diào),大數(shù)據(jù)發(fā)展日新月異,應(yīng)該深入了解大數(shù)據(jù)發(fā)展現(xiàn)狀和趨勢及其對經(jīng)濟(jì)社會發(fā)展的影響,加快建設(shè)數(shù)字中國,更好地服務(wù)我國經(jīng)濟(jì)社會發(fā)展和人民生活改善。
大數(shù)據(jù)價值的發(fā)揮離不開統(tǒng)計,統(tǒng)計是和數(shù)據(jù)打交道的,可以說有數(shù)據(jù)的地方就有統(tǒng)計?!洞笥倏迫珪氛J(rèn)為統(tǒng)計學(xué)是一門收集與分析數(shù)據(jù),并且根據(jù)數(shù)據(jù)進(jìn)行推斷的藝術(shù)與科學(xué)。作為一門收集、整理、分析數(shù)據(jù)的傳統(tǒng)科學(xué),統(tǒng)計學(xué)在大數(shù)據(jù)時代既面臨著空前的發(fā)展機(jī)遇,也面臨著巨大的挑戰(zhàn)。
統(tǒng)計學(xué)作為一門與數(shù)據(jù)打交道的科學(xué),從誕生到現(xiàn)在已有300 多年的歷史,在經(jīng)濟(jì)管理、生物醫(yī)學(xué)、社會科學(xué)等領(lǐng)域得到了廣泛的應(yīng)用。傳統(tǒng)的統(tǒng)計分析過程包括根據(jù)研究目的來收集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù),并從中得出結(jié)論。雖然大數(shù)據(jù)與傳統(tǒng)意義上的數(shù)據(jù)有著極大的差異,但通過應(yīng)用大數(shù)據(jù)技術(shù)分析研究社會經(jīng)濟(jì)現(xiàn)象,揭示總體的數(shù)量特征所需要的分析過程卻與傳統(tǒng)的數(shù)據(jù)分析過程并無本質(zhì)的差別,依然可以劃分為數(shù)據(jù)的收集、整理加工、分析、解釋并得出結(jié)論等,文章接下來主要從這一角度對大數(shù)據(jù)時代統(tǒng)計學(xué)面臨的主要挑戰(zhàn)進(jìn)行闡述。
“數(shù)據(jù)是統(tǒng)計的語言”“有數(shù)據(jù)的地方就有統(tǒng)計”……從這些說法中不難看出數(shù)據(jù)對于統(tǒng)計的意義。傳統(tǒng)統(tǒng)計數(shù)據(jù)是對研究對象進(jìn)行觀測或?qū)嶒?yàn)的結(jié)果,往往有固定的結(jié)構(gòu)或標(biāo)準(zhǔn),屬于結(jié)構(gòu)化數(shù)據(jù),而大數(shù)據(jù)不但包含結(jié)構(gòu)化數(shù)據(jù),還包含海量的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),如圖片、音頻、視頻等。傳統(tǒng)的統(tǒng)計分析指標(biāo)和方法對這些非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)并不完全適用,如何直接處理非結(jié)構(gòu)化數(shù)據(jù)或者如何將半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù)是統(tǒng)計學(xué)面臨的一個重要挑戰(zhàn)。
傳統(tǒng)統(tǒng)計數(shù)據(jù)的來源主要是根據(jù)研究目的進(jìn)行的調(diào)查或?qū)嶒?yàn),往往需要預(yù)先設(shè)計周密的統(tǒng)計調(diào)查方案,組織各種形式的統(tǒng)計調(diào)查或者統(tǒng)計實(shí)驗(yàn),最終才能獲得相關(guān)數(shù)據(jù),而大數(shù)據(jù)的來源多種多樣、包羅萬象,如POS 機(jī)數(shù)據(jù)、電子商務(wù)數(shù)據(jù)等各種交易數(shù)據(jù);移動通信數(shù)據(jù);人為數(shù)據(jù),如各種社交網(wǎng)絡(luò)(微信、微博、推特、臉書)等社交媒體產(chǎn)生的數(shù)據(jù)流,包括電子郵件、文檔、圖片、音頻、視頻等;機(jī)器和傳感器數(shù)據(jù)等。
傳統(tǒng)的統(tǒng)計分析軟件如SPSS、E-views、SAS、STATA 等可以高效處理常規(guī)的結(jié)構(gòu)化數(shù)據(jù),揭示社會經(jīng)濟(jì)現(xiàn)象的數(shù)量特征或變量之間的數(shù)量依存關(guān)系等,有效滿足不同層次的統(tǒng)計分析者的研究需要,但對于分析具有4V(Volume、Variety、Velocity、Value)特征的大數(shù)據(jù)顯得力不從心,需要開發(fā)和應(yīng)用能夠有效處理非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計分析軟件。
大數(shù)據(jù)時代,傳統(tǒng)的抽樣調(diào)查法是否有存在的必要,對此學(xué)術(shù)界并無統(tǒng)一的看法,一種觀點(diǎn)認(rèn)為大數(shù)據(jù)時代,研究者可以直接面對研究總體,因而相關(guān)的分析方法,如參數(shù)估計、假設(shè)檢驗(yàn)就沒有以前那么重要了;另一種觀點(diǎn)則認(rèn)為,大數(shù)據(jù)時代,對于通過網(wǎng)絡(luò)獲取的靜態(tài)數(shù)據(jù),由于客戶在查看時數(shù)據(jù)已經(jīng)生成,可以認(rèn)為樣本等同于總體;對于通過網(wǎng)絡(luò)獲取的動態(tài)數(shù)據(jù)而言,數(shù)據(jù)會隨著時間的推移不斷變化,因而依然存在樣本和總體的區(qū)別,只不過這時的樣本不再局限于傳統(tǒng)意義上隨機(jī)抽取的數(shù)據(jù)。考慮到大數(shù)據(jù)的數(shù)據(jù)特征,傳統(tǒng)的統(tǒng)計分析方法如回歸分析、多元統(tǒng)計分析等不再適用,急需探索新的統(tǒng)計分析方法以更好地適應(yīng)時代的發(fā)展??梢哉f,大數(shù)據(jù)的研究需要用到統(tǒng)計方法,統(tǒng)計方法的優(yōu)化完善需要和大數(shù)據(jù)相結(jié)合。
總的來說,大數(shù)據(jù)時代給傳統(tǒng)統(tǒng)計學(xué)帶來的沖擊主要體現(xiàn)在統(tǒng)計數(shù)據(jù)的類型、收集和加工整理、分析過程等方面。
隨著大數(shù)據(jù)時代的來臨,國內(nèi)部分高校順應(yīng)時代潮流,積極應(yīng)對大數(shù)據(jù)帶來的挑戰(zhàn),及時作出了一系列教學(xué)方面的變革,但大部分高校反應(yīng)遲緩,課程改革遲遲未能提上日程,依然存在諸多不足。
大數(shù)據(jù)的數(shù)據(jù)特征對統(tǒng)計學(xué)的課程體系提出了更高的要求,統(tǒng)計學(xué)的課程設(shè)置必須與時俱進(jìn),方能彰顯其強(qiáng)大的生命力。雖然清華大學(xué)、中國人民大學(xué)、上海財經(jīng)大學(xué)等在國內(nèi)統(tǒng)計學(xué)領(lǐng)域位居前列的高校已經(jīng)先行一步,逐步設(shè)置了與大數(shù)據(jù)教學(xué)密切相關(guān)的課程,但絕大部分開設(shè)統(tǒng)計學(xué)專業(yè)的高校由于受觀念和師資力量限制,課程內(nèi)容比較老舊,傳統(tǒng)的統(tǒng)計學(xué)課程依然占據(jù)主體地位,課程體系不夠完善,教學(xué)案例和分析數(shù)據(jù)等比較陳舊,課程體系更新不夠及時,根本無法滿足大數(shù)據(jù)分析的需要。
目前,雖然統(tǒng)計學(xué)教學(xué)也開設(shè)了SPSS、SAS、STATA、E-views 等統(tǒng)計軟件課程,但對于收集、處理及分析大數(shù)據(jù)而言,這些統(tǒng)計軟件顯得“力不從心”,無法滿足半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的分析需要。另外,學(xué)生在上機(jī)操作中主要面對的是時間序列、橫截面數(shù)據(jù)、面板數(shù)據(jù)等傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),而且研究的數(shù)據(jù)容量往往偏小,與真正的大數(shù)據(jù)相去甚遠(yuǎn),使得學(xué)生一旦需要真正處理分析大數(shù)據(jù)時,可能會“束手無策”。
統(tǒng)計學(xué)課程的培養(yǎng)目標(biāo)是培養(yǎng)學(xué)生的統(tǒng)計學(xué)思維,使其具備一定的數(shù)據(jù)分析能力。目前,高校的統(tǒng)計學(xué)課程考核方式大多仍以傳統(tǒng)的筆試為主,雖然考慮到了平時成績,但期末的筆試成績依然占較大比例,這種考核方式并不能對教學(xué)目標(biāo)是否實(shí)現(xiàn)進(jìn)行全面準(zhǔn)確的衡量。此外,對學(xué)生的考核很少以團(tuán)隊(duì)的形式開展,大多都是對學(xué)生個人能力的考核,這種教學(xué)與考核模式不利于培養(yǎng)學(xué)生在大數(shù)據(jù)收集、處理及分析過程中的分工合作能力,也難以真正考查學(xué)生的數(shù)據(jù)分析能力。
大數(shù)據(jù)分析是將數(shù)學(xué)、統(tǒng)計學(xué)及計算機(jī)科學(xué)相結(jié)合的一門學(xué)科,具有明顯的交叉學(xué)科特點(diǎn)。雖然其分析處理過程類似于傳統(tǒng)的統(tǒng)計分析過程,可分為數(shù)據(jù)的收集、整理和加工、分析、預(yù)測及應(yīng)用等,但實(shí)際處理過程既需要統(tǒng)計學(xué)的基本理論指導(dǎo),又涉及數(shù)據(jù)庫的存儲、數(shù)據(jù)透視、數(shù)據(jù)挖掘算法等計算機(jī)技術(shù)的應(yīng)用等??梢哉f,大數(shù)據(jù)時代的來臨對統(tǒng)計學(xué)教師提出了更新、更高的要求。目前多數(shù)高校統(tǒng)計學(xué)教師缺乏計算機(jī)教育背景,已有的知識儲備難以應(yīng)對大數(shù)據(jù)帶來的挑戰(zhàn),對于涉及大數(shù)據(jù)專業(yè)知識的相關(guān)課程講授力不從心。
從統(tǒng)計學(xué)誕生到大數(shù)據(jù)時代以前的發(fā)展歷程來看,每一次統(tǒng)計學(xué)的快速發(fā)展都離不開社會生活各個領(lǐng)域的需求,正是農(nóng)業(yè)、工業(yè)品質(zhì)量監(jiān)測、生物醫(yī)藥、金融等領(lǐng)域的需求一次又一次地推動了統(tǒng)計方法的完善和改進(jìn)。而計算機(jī)科學(xué)的飛速發(fā)展進(jìn)一步有力推動了統(tǒng)計方法在社會生活各個領(lǐng)域的廣泛應(yīng)用。大數(shù)據(jù)的興起對統(tǒng)計學(xué)的應(yīng)用又提出了更高的要求,這就需要高校統(tǒng)計學(xué)專業(yè)進(jìn)行各方面的創(chuàng)新,從而更好地滿足社會的需求。
大數(shù)據(jù)時代,統(tǒng)計學(xué)專業(yè)的學(xué)生需要具備收集、處理及分析復(fù)雜數(shù)據(jù)的能力。因此,統(tǒng)計學(xué)要積極與計算機(jī)和數(shù)學(xué)緊密結(jié)合,進(jìn)一步完善統(tǒng)計學(xué)課程體系,培養(yǎng)復(fù)合型人才。大數(shù)據(jù)統(tǒng)計領(lǐng)域的人才培養(yǎng)需要統(tǒng)計學(xué)、數(shù)據(jù)及計算機(jī)等多個學(xué)科共同努力。課程設(shè)置方面,除了跟原來一樣需要設(shè)置數(shù)理專業(yè)課程和統(tǒng)計學(xué)理論課程,還需要開設(shè)必要的計算機(jī)課程,增加數(shù)據(jù)科學(xué)概論、數(shù)據(jù)科學(xué)統(tǒng)計基礎(chǔ)、Python 軟件學(xué)習(xí)、并行計算等計算機(jī)類的課程。
在大數(shù)據(jù)出現(xiàn)之前,學(xué)生收集數(shù)據(jù)可以親自開展社會實(shí)踐調(diào)查,獲取第一手?jǐn)?shù)據(jù),但這種數(shù)據(jù)獲取途徑往往需要耗費(fèi)較多的人力、物力及財力,因而應(yīng)用較少;學(xué)生更多的是通過各種網(wǎng)絡(luò)途徑獲取二手?jǐn)?shù)據(jù),如國家統(tǒng)計局或省、市統(tǒng)計信息網(wǎng)等官方網(wǎng)站公布的數(shù)據(jù),以及高校、科研院所等科研機(jī)構(gòu)公布的調(diào)研數(shù)據(jù)。此類數(shù)據(jù)都屬于結(jié)構(gòu)化數(shù)據(jù),要收集此類數(shù)據(jù)并不需要多么高深的專業(yè)技能,但在大數(shù)據(jù)時代,面對海量的非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù),即使在數(shù)據(jù)的收集階段,也需要研究者具備一定的專業(yè)統(tǒng)計軟件應(yīng)用能力才能完成大數(shù)據(jù)的收集,更不用說接下來的數(shù)據(jù)整理加工、分析等工作了。因此,高校在將計算機(jī)和數(shù)據(jù)庫應(yīng)用等作為專業(yè)必修課的同時,還應(yīng)高度重視Python 等軟件操作的培訓(xùn),切實(shí)提高學(xué)生應(yīng)用統(tǒng)計軟件的能力。
統(tǒng)計思維養(yǎng)成的關(guān)鍵是利用數(shù)據(jù)分析解決問題,統(tǒng)計學(xué)本質(zhì)上是一門應(yīng)用型科學(xué),只有在應(yīng)用中才能體現(xiàn)其強(qiáng)大的生命力。高校只有設(shè)置科學(xué)實(shí)用的實(shí)驗(yàn)課程,讓學(xué)生親自動手進(jìn)行大數(shù)據(jù)的收集、降維、處理、可視化,才能使其將書本上的抽象理論知識真正消化吸收。高校可以考慮加強(qiáng)與當(dāng)?shù)卣y(tǒng)計部門、市場調(diào)查咨詢公司、大型網(wǎng)絡(luò)企業(yè)、電商企業(yè)等機(jī)構(gòu)進(jìn)行合作,一方面便于獲取各種大數(shù)據(jù),另一方面可以借助校外數(shù)據(jù)分析專家的力量彌補(bǔ)校內(nèi)師資力量的不足。
目前,大多數(shù)高校統(tǒng)計學(xué)教師的知識儲備不足以應(yīng)對大數(shù)據(jù)帶來的挑戰(zhàn),為了切實(shí)提高學(xué)生的素質(zhì),一方面高校需要對現(xiàn)有的教師隊(duì)伍進(jìn)行有針對性的優(yōu)化,積極組織教師參與大數(shù)據(jù)研討會和培訓(xùn)等,力爭在較短的時間里培養(yǎng)一批在大數(shù)據(jù)教學(xué)方面有專長的教師隊(duì)伍;另一方面由于各高校最早在2015 年才獲批設(shè)立大數(shù)據(jù)專業(yè),按照目前各高校引進(jìn)人才的標(biāo)準(zhǔn),這批學(xué)生即使已經(jīng)畢業(yè)也不可能立刻進(jìn)入高校任教,無法彌補(bǔ)大數(shù)據(jù)教學(xué)的師資力量不足,所以高校在引進(jìn)人才時應(yīng)偏向于數(shù)學(xué)、計算機(jī)或二者相結(jié)合方面的人才,以滿足大數(shù)據(jù)時代新課程體系教學(xué)的需要。
隨著數(shù)字社會建設(shè)步伐的加快,大數(shù)據(jù)的相關(guān)競賽如雨后春筍般出現(xiàn),如阿里天池大數(shù)據(jù)競賽、“聯(lián)想杯”全國高校大數(shù)據(jù)能力提升大賽、全國大學(xué)生大數(shù)據(jù)技能競賽、“一帶一路”國際大數(shù)據(jù)競賽等,這些競賽往往同時面向本科院校和高職院校,參與者眾多。各高校要積極動員組織教師和學(xué)生參加各類競賽,通過參加競賽,一方面可以有效激發(fā)學(xué)生們的學(xué)習(xí)興趣,提升學(xué)生的專業(yè)技能和實(shí)踐動手能力;另一方面有助于參賽高校通過參加競賽及時發(fā)現(xiàn)不足,有針對性地調(diào)整專業(yè)體系建設(shè)、課程設(shè)置及人才培養(yǎng)方案等,緊密結(jié)合社會需求,促進(jìn)大數(shù)據(jù)專業(yè)人才的培養(yǎng)。
縱觀近一個世紀(jì)以來統(tǒng)計學(xué)的發(fā)展歷程,其每一次的飛速發(fā)展都與社會需求息息相關(guān)。當(dāng)前,大數(shù)據(jù)已經(jīng)滲透到人們工作和生活的每一個角落。大數(shù)據(jù)在為統(tǒng)計學(xué)的飛速發(fā)展提供良好契機(jī)的同時,也使得統(tǒng)計學(xué)教育在專業(yè)課程的設(shè)置、教學(xué)內(nèi)容的更新、學(xué)生統(tǒng)計能力的培養(yǎng)、師資的培訓(xùn)等方面面臨諸多挑戰(zhàn),高校統(tǒng)計學(xué)專業(yè)必須積極應(yīng)對這些挑戰(zhàn),主動擁抱數(shù)據(jù)科學(xué),進(jìn)行創(chuàng)新性的變革,如此才能適應(yīng)大數(shù)據(jù)時代,實(shí)現(xiàn)跨越式發(fā)展。