詹玲
摘要:大數(shù)據(jù)時(shí)代背景下,需要培養(yǎng)擅長(zhǎng)大數(shù)據(jù)收集、存儲(chǔ)、管理與分析的專業(yè)人才,以適應(yīng)社會(huì)和改革的需求。在計(jì)算機(jī)專業(yè)的大數(shù)據(jù)課程上,高等院校不管是在課程體系方面還是實(shí)踐教育上都需要進(jìn)行探索式創(chuàng)新改革。本文結(jié)合文華學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)應(yīng)用型人才的培養(yǎng)目標(biāo),探討了大數(shù)據(jù)方向課程群建設(shè)的目標(biāo)和思路,利用現(xiàn)有的浪潮云海大數(shù)據(jù)一體機(jī)平臺(tái),從課程群規(guī)劃、理論教學(xué)、實(shí)踐教學(xué)三個(gè)方面提出了一系列提高學(xué)生綜合應(yīng)用能力的高效的方法。
關(guān)鍵詞:大數(shù)據(jù)方向;課程群;應(yīng)用型人才;實(shí)踐課程
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2017)28-0274-03
一、背景
大數(shù)據(jù)的研究正面臨著全球性的人才荒問(wèn)題。根據(jù)麥肯錫報(bào)告,預(yù)計(jì)到2018年美國(guó)市場(chǎng)大數(shù)據(jù)人才(包括高級(jí)數(shù)據(jù)分析專家)缺口將高達(dá)19萬(wàn)。此外,美國(guó)企業(yè)還需要150萬(wàn)能夠看出關(guān)鍵問(wèn)題所在并運(yùn)用大數(shù)據(jù)來(lái)進(jìn)行分析的相關(guān)管理人才。中國(guó)是人才大國(guó),但掌握和應(yīng)用大數(shù)據(jù)技術(shù)的創(chuàng)新型人才仍是稀缺資源,培養(yǎng)大數(shù)據(jù)相關(guān)人才成為最為緊迫的任務(wù)。
國(guó)內(nèi)外相關(guān)高校先后通過(guò)開設(shè)《數(shù)據(jù)科學(xué)》課程、開展數(shù)據(jù)科學(xué)學(xué)位計(jì)劃及數(shù)據(jù)科學(xué)短期培訓(xùn)班來(lái)進(jìn)行數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的培養(yǎng)。美國(guó)加州大學(xué)伯克利分校從2011年起開設(shè)《數(shù)據(jù)科學(xué)導(dǎo)論》課程,并從2012年起開設(shè)《數(shù)據(jù)科學(xué)和分析》課程;麻省理工學(xué)院開設(shè)《計(jì)算思維和數(shù)據(jù)科學(xué)導(dǎo)論》這門課,介紹如何利用計(jì)算機(jī)來(lái)理解真實(shí)世界的現(xiàn)象,主要面向具備一定Python編程經(jīng)驗(yàn)和計(jì)算復(fù)雜度基礎(chǔ)知識(shí)的學(xué)生,課程更加看重涉及面的廣度,而不是一味追求深度,該課程為學(xué)生提供了許多主題的簡(jiǎn)要介紹,課程的主題包括:繪圖、隨機(jī)程序、概率和統(tǒng)計(jì)、隨機(jī)漫步、蒙特卡洛模擬、數(shù)據(jù)模型化、優(yōu)化問(wèn)題和分類歸并,使得學(xué)生對(duì)今后職業(yè)生涯中計(jì)算機(jī)的角色有了更多了解;美國(guó)華盛頓大學(xué)開設(shè)了《Introduction to Data Science》,介紹了關(guān)系型數(shù)據(jù)庫(kù)、MapReduce、NoSQL、基礎(chǔ)數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、可視化以及圖論[1]。在英國(guó),大概有七所高校開設(shè)了《數(shù)據(jù)科學(xué)》及其相關(guān)課程,包括謝菲爾德大學(xué)、愛丁堡大學(xué)、倫敦大學(xué)學(xué)院、東英吉利大學(xué)、布里斯托大學(xué)、曼徹斯特大學(xué)、倫敦大學(xué)皇家霍洛威學(xué)院。
在中國(guó),一批知名企業(yè)也開設(shè)了自己的大數(shù)據(jù)研究中心,并與各大高校開展合作,促進(jìn)了大學(xué)中大數(shù)據(jù)專業(yè)的發(fā)展。北航軟件學(xué)院、北航計(jì)算機(jī)學(xué)院與慧科教育(工信部移動(dòng)云計(jì)算教育培訓(xùn)中心)聯(lián)合打造的大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè),于2012年開始招收工程碩士[2];2013年,華東師范大學(xué)成立了數(shù)據(jù)科學(xué)與工程研究院;2014年,華南理工大學(xué)設(shè)立了云計(jì)算與大數(shù)據(jù)專業(yè);同年,清華大學(xué)成立“清華―青島數(shù)據(jù)科學(xué)研究院”,設(shè)立大數(shù)據(jù)的碩士博士學(xué)位項(xiàng)目。另外,開設(shè)大數(shù)據(jù)相關(guān)本科專業(yè)的院校有貴州師范學(xué)院、貴州大學(xué)和北京城市學(xué)院等。
二、大數(shù)據(jù)方向課程群構(gòu)建思路
大數(shù)據(jù)學(xué)科方向是一門交叉專業(yè)方向,與不同專業(yè)相結(jié)合可以發(fā)展成特定方向的專業(yè)或研究領(lǐng)域。IT、金融、管理、社會(huì)、生物等傳統(tǒng)專業(yè)方向與大數(shù)據(jù)學(xué)科方向相結(jié)合表現(xiàn)出多樣化的差異特征,包括專業(yè)研究方向與社會(huì)需求崗位。例如統(tǒng)計(jì)學(xué)專業(yè)與計(jì)算機(jī)專業(yè),前者注重?cái)?shù)據(jù)統(tǒng)計(jì)相關(guān)理論與數(shù)據(jù)挖掘理論的結(jié)合應(yīng)用,而后者則注重其應(yīng)用領(lǐng)域的IT工程實(shí)現(xiàn)方式;從崗位需求層次來(lái)看,前者需要數(shù)據(jù)分析人才,后者需要大數(shù)據(jù)應(yīng)用開發(fā)和大數(shù)據(jù)系統(tǒng)開發(fā)人才。不同的社會(huì)崗位有著不同的教育層次與專業(yè)技術(shù)背景要求,這就要求在不同的專業(yè)方向要有不同的課程規(guī)劃。就民辦高校來(lái)說(shuō),需要設(shè)置較為精細(xì)的專業(yè)課程,除基礎(chǔ)課程之外,還應(yīng)進(jìn)行主干專業(yè)課程和實(shí)踐課程設(shè)置的優(yōu)化改革,這樣才能形成民辦高校特有的計(jì)算機(jī)專業(yè)大數(shù)據(jù)方向的課程群特色。
三、大數(shù)據(jù)方向課程群構(gòu)建內(nèi)容
我們的課程群設(shè)置分為三個(gè)層次,逐步深入并加深難度。第一個(gè)層次是基礎(chǔ)課程,包括數(shù)學(xué)基礎(chǔ)課程和專業(yè)基礎(chǔ)課程;第二個(gè)層次是大數(shù)據(jù)專業(yè)方向課程;第三個(gè)層次是大數(shù)據(jù)實(shí)踐課程。從基礎(chǔ)課程、大數(shù)據(jù)專業(yè)方向課程到大數(shù)據(jù)實(shí)踐課程,給學(xué)生制定了一個(gè)系統(tǒng)、完整的課程體系,如下圖1所示。
1.基礎(chǔ)課程?;A(chǔ)課程是學(xué)生學(xué)習(xí)計(jì)算機(jī)知識(shí)的入門課程和能力培養(yǎng)的起點(diǎn)課程。包括數(shù)學(xué)基礎(chǔ)課程和計(jì)算機(jī)專業(yè)基礎(chǔ)課程。(1)數(shù)學(xué)基礎(chǔ)。主要包括高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)、概率論、數(shù)理統(tǒng)計(jì)等,數(shù)學(xué)是計(jì)算機(jī)專業(yè)的基礎(chǔ)課程,是進(jìn)行數(shù)據(jù)分析和處理的基礎(chǔ)工具。例如:微積分和線性代數(shù)為大多數(shù)數(shù)據(jù)挖掘應(yīng)用程序提供進(jìn)行矩陣計(jì)算的基本算法;數(shù)據(jù)結(jié)構(gòu)課程中涉及到大量的概念、模型及算法,模型和算法的理解需要學(xué)生有較為扎實(shí)的數(shù)學(xué)基礎(chǔ)和較強(qiáng)的邏輯推理能力。通過(guò)數(shù)學(xué)的學(xué)習(xí),使學(xué)生具有良好的抽象思維和邏輯推理能力。(2)計(jì)算機(jī)專業(yè)基礎(chǔ)。計(jì)算機(jī)專業(yè)基礎(chǔ)課程包含兩部分,第一部分是計(jì)算機(jī)專業(yè)基礎(chǔ)中的語(yǔ)言類課程,包括C語(yǔ)言、C++以及JAVA語(yǔ)言等,程序設(shè)計(jì)課程作為計(jì)算機(jī)專業(yè)的基礎(chǔ)課程,讓學(xué)生掌握解決問(wèn)題的算法和算法實(shí)現(xiàn)的具體過(guò)程是該類課程的主要目標(biāo),這些都需要通過(guò)強(qiáng)化計(jì)算思維訓(xùn)練實(shí)現(xiàn)。計(jì)算思維是運(yùn)用計(jì)算機(jī)科學(xué)的基礎(chǔ)概念進(jìn)行問(wèn)題求解、系統(tǒng)設(shè)計(jì)以及人類行為理解等涵蓋計(jì)算機(jī)科學(xué)的一系列思維活動(dòng)。基于計(jì)算思維的程序設(shè)計(jì)課程要在教會(huì)學(xué)生計(jì)算機(jī)編程的同時(shí)培養(yǎng)他們的計(jì)算思維能力。第二部分是計(jì)算機(jī)專業(yè)基礎(chǔ)中的核心課程,包含計(jì)算機(jī)專業(yè)中必修的一些核心課程,如:數(shù)據(jù)結(jié)構(gòu),linux操作系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)原理、計(jì)算機(jī)組成原理與系統(tǒng)、編譯原理、數(shù)據(jù)結(jié)構(gòu)和計(jì)算機(jī)網(wǎng)絡(luò)等。
其中《linux操作系統(tǒng)》和《Java語(yǔ)言程序設(shè)計(jì)》是大數(shù)據(jù)方向課程的先行課,在選修大數(shù)據(jù)方向課程之前,要把《linux操作系統(tǒng)》和《Java語(yǔ)言程序設(shè)計(jì)》作為必修課程。
2.大數(shù)據(jù)方向課程建設(shè)。了解和掌握大數(shù)據(jù)的整個(gè)處理流程是該課程群建設(shè)的關(guān)鍵,因?yàn)橹挥薪Y(jié)合具體的大數(shù)據(jù)處理流程才能做到有的放矢,而大數(shù)據(jù)的處理流程主要包括以下幾個(gè)部分[3]:①數(shù)據(jù)采集:使用傳感器、ETL工具、爬蟲等數(shù)據(jù)采集工具獲得結(jié)構(gòu)化、半結(jié)構(gòu)化(或稱之為弱結(jié)構(gòu)化)及非結(jié)構(gòu)化的海量各類數(shù)據(jù),經(jīng)過(guò)清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù),成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。②數(shù)據(jù)存儲(chǔ):分布式存儲(chǔ)與訪問(wèn)是大數(shù)據(jù)存儲(chǔ)的關(guān)鍵技術(shù),雖然采集端本身會(huì)有自己的數(shù)據(jù)庫(kù),但如果要相對(duì)海量的數(shù)據(jù)進(jìn)行有效分析,就應(yīng)該將這些前端的數(shù)據(jù)導(dǎo)入到一個(gè)大型分布式數(shù)據(jù)庫(kù),并且可以在導(dǎo)入基礎(chǔ)上做一些簡(jiǎn)單的預(yù)處理工作,從而減輕后續(xù)的數(shù)據(jù)處理壓力。③數(shù)據(jù)分析:數(shù)據(jù)分析就是用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行詳細(xì)研究和概括總結(jié),提取出有用信息并形成結(jié)論的過(guò)程。通常會(huì)使用相關(guān)性分析、多元回歸等來(lái)揉合各種數(shù)據(jù),從不同角度進(jìn)行預(yù)測(cè)性和指導(dǎo)規(guī)范性建模,學(xué)會(huì)使用R、SAS、SPSS、SciPy、Stata等統(tǒng)計(jì)工具軟件。④數(shù)據(jù)挖掘:數(shù)據(jù)挖掘就是從大量的、不完全的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,通過(guò)算法搜索隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。其常通過(guò)機(jī)器學(xué)習(xí)、專家系統(tǒng)和模式識(shí)別等方法來(lái)實(shí)現(xiàn)。⑤數(shù)據(jù)建模和預(yù)測(cè)建模:從ERWin、Agile Data Modeling、ORM Diagrams、ML class diagrams、CRC cards、Conceptual/logical/physical schema、DDL、Bachman diagrams、Zachman Framework等數(shù)據(jù)建模工具開始,掌握建模技術(shù)和方法。⑥數(shù)據(jù)可視化:清晰有效地在大數(shù)據(jù)與用戶之間傳遞信息是數(shù)據(jù)可視化的重要目標(biāo),將大數(shù)據(jù)分析和處理的結(jié)果以易于理解的方式呈現(xiàn)出來(lái),讓用戶對(duì)結(jié)果有更加直觀的認(rèn)知。⑦數(shù)據(jù)安全:隨著大數(shù)據(jù)的不斷增加,對(duì)數(shù)據(jù)存儲(chǔ)的物理安全性需求也越來(lái)越高,數(shù)據(jù)的多副本與容災(zāi)機(jī)制也面臨更高的要求。同時(shí),相對(duì)于傳統(tǒng)的數(shù)據(jù)模式,大數(shù)據(jù)更加容易成為網(wǎng)絡(luò)攻擊的目標(biāo),大數(shù)據(jù)分析技術(shù)也更容易被黑客利用到攻擊當(dāng)中去。大數(shù)據(jù)方向課程目前包括以下課程:大數(shù)據(jù)與云計(jì)算概論、Hadoop系統(tǒng)應(yīng)用、數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)、R語(yǔ)言數(shù)據(jù)分析。這些課程能夠讓學(xué)生系統(tǒng)地學(xué)習(xí)和掌握大數(shù)據(jù)基本架構(gòu)和整個(gè)處理流程。
3.大數(shù)據(jù)方向?qū)嵺`課程建設(shè)。大數(shù)據(jù)特色專業(yè),目前存在著理論教學(xué)要求較高,而學(xué)生實(shí)際設(shè)計(jì)和動(dòng)手能力偏弱的問(wèn)題,不能滿足當(dāng)前企業(yè)事業(yè)單位的需要。所以,實(shí)踐課程的設(shè)置對(duì)于大數(shù)據(jù)方向的教學(xué)體系建設(shè)至關(guān)重要。因此,我們結(jié)合民辦類院校學(xué)生的實(shí)際情況,在課程設(shè)置和教學(xué)內(nèi)容安排上做出改變,將“大數(shù)據(jù)及數(shù)據(jù)挖掘”的理論教學(xué)與浪潮大數(shù)據(jù)系統(tǒng)平臺(tái)的實(shí)操實(shí)訓(xùn)相結(jié)合,安排了《大數(shù)據(jù)應(yīng)用開發(fā)》和《R語(yǔ)言實(shí)訓(xùn)》課程,使學(xué)生能夠掌握大數(shù)據(jù)處理方向的理論基礎(chǔ)和應(yīng)用技能,對(duì)數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和模型預(yù)測(cè)等問(wèn)題有了深入了解,具有較為熟練的應(yīng)用技能和面對(duì)具體應(yīng)用進(jìn)行分析處理的能力。學(xué)校除了讓學(xué)生完成教學(xué)計(jì)劃中的實(shí)訓(xùn)課程以外,還應(yīng)該給學(xué)生提供加強(qiáng)實(shí)際動(dòng)手能力的輔助課程設(shè)置。例如:鼓勵(lì)學(xué)生參加大數(shù)據(jù)相關(guān)的學(xué)科競(jìng)賽,鼓勵(lì)學(xué)生參加教師的科研項(xiàng)目,指導(dǎo)學(xué)生申報(bào)大學(xué)生課外科技創(chuàng)新基金項(xiàng)目,組織學(xué)生到合作企業(yè)實(shí)習(xí),通過(guò)畢業(yè)實(shí)習(xí)和畢業(yè)設(shè)計(jì)來(lái)綜合訓(xùn)練大學(xué)生利用四年所學(xué)知識(shí)去系統(tǒng)完成某一方面科研課題的全過(guò)程,培養(yǎng)學(xué)生綜合知識(shí)運(yùn)用及解決實(shí)際問(wèn)題的能力等。這一系列實(shí)踐及輔助課程的設(shè)置使得大數(shù)據(jù)方向相比校內(nèi)其他專業(yè)具有同級(jí)乃至跨級(jí)別的專業(yè)優(yōu)勢(shì),使學(xué)生更具競(jìng)爭(zhēng)力。
四、結(jié)論
通過(guò)對(duì)現(xiàn)有計(jì)算機(jī)專業(yè)大數(shù)據(jù)方向培養(yǎng)方案的修訂,把大數(shù)據(jù)方向課程的先行課程作為必修課程,增加了大數(shù)據(jù)方向的實(shí)踐課程,并在此基礎(chǔ)上探討了適合于應(yīng)用型民辦高校計(jì)算機(jī)專業(yè)培養(yǎng)特點(diǎn)的大數(shù)據(jù)人才的課程群的設(shè)置與建設(shè)。以社會(huì)崗位的實(shí)際需求作為根本出發(fā)點(diǎn),把大數(shù)據(jù)系統(tǒng)基本理論學(xué)習(xí)與大數(shù)據(jù)實(shí)訓(xùn)結(jié)合起來(lái),為當(dāng)前蓬勃發(fā)展的大數(shù)據(jù)市場(chǎng)培養(yǎng)一批既具備扎實(shí)理論基礎(chǔ)知識(shí),又具備實(shí)際設(shè)計(jì)和動(dòng)手能力的人才,提高學(xué)生在就業(yè)市場(chǎng)的競(jìng)爭(zhēng)力[4]。民辦高校計(jì)算機(jī)專業(yè)的大數(shù)據(jù)人才培養(yǎng)也還在摸索過(guò)程中,隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,現(xiàn)有的課程群也在不斷完善和建設(shè),根據(jù)學(xué)生在學(xué)習(xí)過(guò)程中的反饋和學(xué)生就業(yè)的情況,不斷地探討和改進(jìn)課程體系及課程設(shè)置,使得學(xué)生能夠得到最好的教育。
參考文獻(xiàn):
[1]何海地.美國(guó)大數(shù)據(jù)專業(yè)碩士研究生教育的背景、現(xiàn)狀、特色與啟示:全美23所知名大學(xué)數(shù)據(jù)分析碩士課程網(wǎng)站及相關(guān)信息分析研究[J].圖書與情報(bào),2014,(2):48-56.
[2]張曉芳,王芬,黃曉濤.國(guó)內(nèi)外大數(shù)據(jù)課程體系與專業(yè)建設(shè)調(diào)查研究[A].Proceedings of 2nd International Conference on Education,Management and Social Science (ICEMSS 2014)[C]. 2014.
[3]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[4]程彥博.大數(shù)據(jù)專業(yè)人才急需培養(yǎng)[N].中國(guó)計(jì)算機(jī)報(bào),2014-07-21(24).
Abstract:With the evolution of big data,we need to train professional talents,good at collection,storage,management and analysis of big data,to meet the needs of society and reform. In the big data course of computer science,colleges and universities should bring forth new ideas in both the curriculum system and practical education. According to the practical talents cultivation target of computer science in Wenhua College,we explore the idea and goal of big data course group implementation. Finally,we propose some effective methods,mainly about course group programming,theoretical teaching and practical teaching,to improve the comprehensive ability of students by taking full advantage of Inspur big data platform.
Key words:big data;course group;applied talent;practical course