丁詠梅
摘要:在大數(shù)據(jù)時代背景下,將大數(shù)據(jù)與統(tǒng)計學教育、人才培養(yǎng)結(jié)合,剖析大數(shù)據(jù)的特征,分析大數(shù)據(jù)時代對統(tǒng)計人才的需求,從而總結(jié)出當前統(tǒng)計教育人才培養(yǎng)方向,迎接大數(shù)據(jù)時代對統(tǒng)計教育改革、發(fā)展的機遇和挑戰(zhàn)。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計教育;人才培養(yǎng)
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2017)44-0124-02
一、前言
2015年8月,《國務(wù)院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》對大數(shù)據(jù)的發(fā)展思路進行了明確標識,標志著大數(shù)據(jù)已經(jīng)成為國家發(fā)展的重要戰(zhàn)略資源;2016年3月發(fā)布的“十三五”規(guī)劃綱要指出,“把大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,全面實施促進大數(shù)據(jù)發(fā)展行動,加快推動數(shù)據(jù)資源共享開放和開發(fā)應(yīng)用,助力產(chǎn)業(yè)轉(zhuǎn)型升級和社會治理創(chuàng)新?!贝髷?shù)據(jù)時代的到來,帶來了能源、交通、醫(yī)療、通訊、氣象、環(huán)境、工程、教育等領(lǐng)域的全面變革和技術(shù)更新。社會發(fā)展由工業(yè)革命進入數(shù)據(jù)革命,數(shù)字化和可視化已成為各個領(lǐng)域的風向標。
大數(shù)據(jù)給科學和教育事業(yè)帶來了新的生命力,同時對于傳統(tǒng)教育也提出了新的挑戰(zhàn)。它將對現(xiàn)有的科研、教學體制、培養(yǎng)方案等帶來大的變革,用數(shù)據(jù)來研究科學,科學的研究數(shù)據(jù),對教育領(lǐng)域的影響已經(jīng)顯現(xiàn)[1]。如2013年9月北京航空航天大學計算機學院、軟件學院、工信部移動云計算教育培訓中心聯(lián)合啟動大數(shù)據(jù)技術(shù)與應(yīng)用碩士高端項目。
大數(shù)據(jù)時代,對于擁有三百多年歷史的統(tǒng)計學來說,既是機遇又是挑戰(zhàn)。機遇在于大數(shù)據(jù)的分析主要建立在統(tǒng)計學的基礎(chǔ)上對數(shù)據(jù)進行處理、分析,從而使得大數(shù)據(jù)“可視化”,而挑戰(zhàn)在于,當下傳統(tǒng)統(tǒng)計學的方法比較有局限性,需要我們進一步對統(tǒng)計學進行發(fā)展與創(chuàng)新。谷歌公司的經(jīng)濟學家兼加州大學的教授哈爾·范里安先生認為,統(tǒng)計學家將會成為像電腦工程師一樣受歡迎的工作[2]。在將來,不僅是教育領(lǐng)域,在各領(lǐng)域都需要數(shù)據(jù)專家對大量數(shù)據(jù)進行分析處理,提取有用信息。由于數(shù)據(jù)量龐大,數(shù)據(jù)結(jié)構(gòu)多樣,統(tǒng)計教育在新的形勢下如何順應(yīng)市場需要,調(diào)整人才培養(yǎng)方案和方向,是我們亟待解決的重要課題。
二、大數(shù)據(jù)時代對統(tǒng)計人才的需求
受傳統(tǒng)思想的影響,傳統(tǒng)統(tǒng)計主要是對行業(yè)和部門內(nèi)部的各項工作進行統(tǒng)計。如今的統(tǒng)計學已有很大不同,不論是統(tǒng)計方法還是研究理論都有很高的要求,力求通過對大量數(shù)據(jù)的分析整理發(fā)現(xiàn)真理。在大數(shù)據(jù)時代,統(tǒng)計原理與方法與其他學科如金融、醫(yī)學、計算機等的融合,使得統(tǒng)計學發(fā)揮了更大的價值。值得注意的是,當前市場上已經(jīng)十分渴求統(tǒng)計人員、數(shù)據(jù)科學家。據(jù)統(tǒng)計,當前我國專業(yè)數(shù)據(jù)分析人才缺口達1400萬,專業(yè)數(shù)據(jù)處理人才已從“走俏”變成“緊缺”。拿今年的就業(yè)市場情況來說,統(tǒng)計專業(yè)人才成為搶手的稀缺人才,薪資也要高于傳統(tǒng)的金融行業(yè)。另一方面,一些學校因為資源整合而放棄了統(tǒng)計學專業(yè)人才的培養(yǎng),比如湖北大學。在這樣雙重的壓力下,根據(jù)大數(shù)據(jù)時代的需要,高校如何構(gòu)建人才培養(yǎng)機制,尤為重要。而市場的需要是人才培養(yǎng)的原動力,綜合市場導向和各方面信息可知,基礎(chǔ)平臺架構(gòu)人才和數(shù)據(jù)科學家這兩類人才將成為大數(shù)據(jù)時代的“寵兒”。
(一)基礎(chǔ)架構(gòu)人才
大數(shù)據(jù)分析是在研究大量的數(shù)據(jù)的過程中尋找模式、相關(guān)性和其他有用的信息,可以幫助企業(yè)更好地適應(yīng)變化,并做出更明智的決策。當前的數(shù)據(jù)分析已經(jīng)從傳統(tǒng)的統(tǒng)計分析平臺到Hadoop大數(shù)據(jù)分析平臺,涉及到的技術(shù)構(gòu)件有Hadoop、HPCC、Storm、Apache Drill、RapidMiner、entaho BI。Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架;HPCC需要開發(fā)千兆比特網(wǎng)絡(luò)技術(shù),擴展研究和教育機構(gòu)及網(wǎng)絡(luò)連接能力;Storm是自由的開源軟件,一個分布式的、容錯的實時計算系統(tǒng);Apache Drill用于幫助支持廣泛的數(shù)據(jù)源、數(shù)據(jù)格式和查詢語言;RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,它的數(shù)據(jù)挖掘任務(wù)涉及范圍廣泛,包括各種數(shù)據(jù)藝術(shù),能簡化數(shù)據(jù)挖掘過程的設(shè)計和評價。
眾所周知,IT行業(yè)人員一直緊俏,而在大數(shù)據(jù)時代,具有計算機基礎(chǔ)軟件平臺構(gòu)建能力和編程能力的技術(shù)人員,需求缺口更大。而作為統(tǒng)計專業(yè)來說,掌握R/R Studio、SAS、Python,并輔以shell scripts和knitr等軟件,也構(gòu)成當前統(tǒng)計人才的必備技能。
(二)數(shù)據(jù)科學家
隨著市場環(huán)境的不斷變化,企業(yè)未來發(fā)展方向已經(jīng)不能再僅憑經(jīng)驗做決策,這需要數(shù)據(jù)科學家對大量的業(yè)務(wù)數(shù)據(jù)進行精準地分析解讀,從而得出準確結(jié)論,輔助決策者做決定,規(guī)避不利發(fā)展因素。由此,不難發(fā)現(xiàn),在企業(yè)未來發(fā)展中,數(shù)據(jù)科學家發(fā)揮的作用越來越重要。作為數(shù)據(jù)科學家,首先需要具備扎實的統(tǒng)計學基礎(chǔ)。很多數(shù)據(jù)分析理論都是基于統(tǒng)計科學,如概率分布、假設(shè)檢驗、貝葉斯理論、回歸分析、主成分、聚類分析等,只有具有堅實的統(tǒng)計基礎(chǔ)才能正確地解讀數(shù)據(jù)。其次,要具有數(shù)據(jù)可視化的能力。將設(shè)計融合到數(shù)據(jù)分析結(jié)果中,使非專業(yè)人員看不懂的數(shù)據(jù)分析結(jié)果以簡單易懂的形式出現(xiàn)在客戶面前。因此,數(shù)據(jù)可視化技術(shù)是數(shù)據(jù)專家必備能力之一。
三、大數(shù)據(jù)發(fā)展下的統(tǒng)計教育發(fā)展方向
數(shù)據(jù)科學家是21世紀最熱門的職業(yè)之一。統(tǒng)計學人才培養(yǎng)成數(shù)據(jù)科學家是在新時代發(fā)展統(tǒng)計學的必然趨勢。大數(shù)據(jù)融合了數(shù)學、計算機、統(tǒng)計學三門學科,來實現(xiàn)數(shù)據(jù)可視化過程,完成虛擬現(xiàn)實,提升各個領(lǐng)域的智能化水平。因此,數(shù)學知識的加固、計算機技能的拓展、數(shù)據(jù)可視化教育的開啟、校企合作的加強,是當前統(tǒng)計教育培養(yǎng)大數(shù)據(jù)科學家的必經(jīng)之路。
(一)加固數(shù)學基礎(chǔ)知識
數(shù)據(jù)分析沒有扎實的數(shù)學基礎(chǔ)是不行的。要成為數(shù)據(jù)科學家,除了要學習大學期間的數(shù)學基礎(chǔ)課程,還要對例如隨機過程論、函數(shù)逼近論、圖論等這些理論進行深入學習。因為,隨著數(shù)據(jù)分析的逐步深入,統(tǒng)計問題、計算機問題等,這些問題最終都將轉(zhuǎn)化為數(shù)學問題,最終都要用數(shù)學知識來解決。只有具備深厚的數(shù)學基礎(chǔ)才能成為優(yōu)秀的數(shù)據(jù)科學家。endprint
(二)拓展計算機技能
計算機是進行數(shù)據(jù)分析的基本工具,掌握熟練的計算機操作技能是開展數(shù)據(jù)分析的基本要求。因此,在數(shù)據(jù)科學家的知識構(gòu)架中,計算機技能也同樣占有很重要的地位。這里的計算機技能主要包括:計算機語言、數(shù)據(jù)庫、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)可視化等技能的運用。另外,數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)處理中也發(fā)揮著重要作用。EXCEL、SPSS、WEKA、MAHOUT、REPIDMINER 等這些軟件也要熟練掌握。
(三)加強數(shù)據(jù)可視化教學
作為數(shù)據(jù)科學家僅僅能夠?qū)?shù)據(jù)進行分析處理是不夠的,還要求能夠使用API,通過圖形、表格等手段將分析結(jié)果以簡單易懂的形式呈現(xiàn)出來。將數(shù)據(jù)化的信息轉(zhuǎn)換為簡單易懂的圖形化信息。要做到這些就需要引進數(shù)據(jù)可視化這門新興學科,加強數(shù)據(jù)可視化教育。
(四)加強校企合作
作為一名數(shù)據(jù)分析人員要成為數(shù)據(jù)專家,除了要具備扎實的統(tǒng)計學知識,還要具備扎實的數(shù)學基礎(chǔ)和計算機技術(shù),能夠綜合處理海量的數(shù)據(jù)信息。因此,學校結(jié)合數(shù)據(jù)分析人才培養(yǎng)的需要,將理學院、信息學院、計算機學院聯(lián)合起來為培養(yǎng)數(shù)據(jù)科學家服務(wù)。同時,大力開展校企合作模式,為學生提供大數(shù)據(jù)分析資源和實踐機會。校企合作后,擁有大數(shù)據(jù)資源的企業(yè)可以提供大量數(shù)據(jù)讓學生有機會進行數(shù)據(jù)分析研究,鍛煉學生的數(shù)據(jù)分析的實踐能力。從另一方面來說,校企合作共同培養(yǎng)出數(shù)據(jù)分析人才可以直接投入企業(yè)工作,為企業(yè)積累大量數(shù)據(jù)分析人才奠定基礎(chǔ)。
四、結(jié)論
教學改革不可能一蹴而就,統(tǒng)計學教育的改革需要順應(yīng)時代發(fā)展的需要,在引進先進思想和理論的基礎(chǔ)上不斷發(fā)展的過程中進行。在大數(shù)據(jù)時代背景下,統(tǒng)計學專業(yè)人才培養(yǎng)的問題同樣需要與時俱進,以滿足社會的需求。我們應(yīng)將大數(shù)據(jù)與統(tǒng)計學有機地結(jié)合在一起,在未來的科學發(fā)展和教育教學過程中,保持統(tǒng)計學旺盛的生命力,為國家產(chǎn)業(yè)發(fā)展和工業(yè)進程開創(chuàng)新的局面。
參考文獻:
[1]朱建平.大數(shù)據(jù)時代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計研究,2014,31(2):10-19.
[2]耿直.大數(shù)據(jù)時代統(tǒng)計學面臨的機遇與挑戰(zhàn)[J].統(tǒng)計研究,2014,31(1):5-9.
[3]邱東.大數(shù)據(jù)時代對統(tǒng)計學的挑戰(zhàn)[J].統(tǒng)計研究,2014,31(1):16-17.
[4]崔路云.基于大數(shù)據(jù)時代背景對統(tǒng)計學教育的幾點思考[D].首都經(jīng)貿(mào)大學,2014.
[5]朱建平,張悅涵.大數(shù)據(jù)時代對傳統(tǒng)統(tǒng)計學變革的思考[J].統(tǒng)計研究,2016,33(2):3-9.endprint