孫書韜 朱立谷 李春芳
摘 要:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)人才培養(yǎng)受到國家的高度重視,我國已經(jīng)有近480所高校開設(shè)了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)。文章分析了北美知名高校數(shù)據(jù)科學(xué)專業(yè)設(shè)置的特點、數(shù)據(jù)科學(xué)專業(yè)課程設(shè)置體系結(jié)構(gòu)及不同高校的課程設(shè)置特色,對我國高校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程設(shè)置與教學(xué)內(nèi)容的建設(shè)提出了積極建議。
關(guān)鍵詞:數(shù)據(jù)科學(xué);課程體系;北美高校
中圖分類號:G642.3 ? ? ? ?文獻標(biāo)志碼:A? ? ? ? ? 文章編號:1673-8454(2019)24-0048-03
一、引言
當(dāng)前,社會媒體以及各種社會和經(jīng)濟活動每天都在產(chǎn)生海量的數(shù)據(jù),對這些數(shù)據(jù)進行充分的利用,基于大數(shù)據(jù)進行決策分析、個性化服務(wù)、建立人工智能系統(tǒng)等,有著廣闊的應(yīng)用前景。大數(shù)據(jù)技術(shù)受到國家和工業(yè)界的高度重視,市場對于大數(shù)據(jù)人才的需求日益增多,許多高校順應(yīng)技術(shù)潮流和市場需求,開設(shè)了大數(shù)據(jù)技術(shù)的相關(guān)課程,部分高校建立起了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)。從2016年2月教育部批準(zhǔn)北京大學(xué)、對外經(jīng)濟貿(mào)易大學(xué)、中南大學(xué)等開設(shè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)起,截至目前我國共有近480所高校獲批設(shè)立該專業(yè)。
大數(shù)據(jù)技術(shù)包含大數(shù)據(jù)的采集、存儲、處理分析與應(yīng)用。從知識支撐角度看,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)涉及傳統(tǒng)的數(shù)學(xué)、統(tǒng)計科學(xué)、計算機科學(xué)與工程專業(yè)知識。但數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)又派生出許多針對海量數(shù)據(jù)處理和面向不同應(yīng)用學(xué)科的特定知識, 出現(xiàn)了面向大數(shù)據(jù)處理的許多新的技術(shù)、方法和平臺。
如何設(shè)置數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)核心課程和開展教學(xué),是高等學(xué)校這一年輕專業(yè)亟需解決的問題,國內(nèi)高校根據(jù)自身的特點進行了許多有益的探索。李莎莎等分析了數(shù)據(jù)科學(xué)與大數(shù)據(jù)人才專業(yè)課程體系, 給出了北京大學(xué)、復(fù)旦大學(xué)、中南大學(xué)、美國舊金山大學(xué)和英國華威大學(xué)數(shù)據(jù)科學(xué)專業(yè)開設(shè)課程的合集,并分析了各部分課程所占用的比重[1]。崔燕探討了面向大數(shù)據(jù)分析的信息管理實踐教學(xué)體系[2],偏向于計算機技術(shù)基礎(chǔ)知識與大數(shù)據(jù)處理平臺的建立與使用。許安見、鄒楊等探討了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)培養(yǎng)方案[3]。
本文收集整理了美國加州大學(xué)伯克利分校、麻省理工學(xué)院、斯坦福大學(xué)以及加拿大滑鐵盧大學(xué)等北美四所知名高校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)相關(guān)專業(yè)設(shè)置與專業(yè)要求以及課程設(shè)置情況,分析了該專業(yè)和課程設(shè)置的特點,對我國數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)建設(shè)提出了相關(guān)建議。
二、北美知名大學(xué)數(shù)據(jù)科學(xué)相關(guān)課程設(shè)置
1.典型大學(xué)專業(yè)設(shè)置與課業(yè)要求
北美相關(guān)專業(yè)設(shè)置一般不叫數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè),主流的專業(yè)名稱為數(shù)據(jù)科學(xué)(Data Science), 設(shè)置數(shù)據(jù)科學(xué)的教學(xué)單位一般為計算機、數(shù)學(xué)、統(tǒng)計、文理學(xué)院等學(xué)院或系。麻省理工學(xué)院將相關(guān)專業(yè)命名為計算機科學(xué)、經(jīng)濟與數(shù)據(jù)科學(xué)(Computer Science, Economics, and Data Science)。
加州大學(xué)伯克利分校數(shù)據(jù)科學(xué)專業(yè)設(shè)在文理學(xué)院,除了要求學(xué)生的數(shù)理和計算機科學(xué)基礎(chǔ)外,還要求學(xué)生在文學(xué)藝術(shù)(Arts and Literature)、生物科學(xué)(Biological Science)、歷史研究(Historical Studies)、國際研究(International Studies)、哲學(xué)和價值觀(Philosophy and Values)、物理科學(xué)(Physical Science)、社會與行為科學(xué)(Social and Behavioral Sciences)等7個方向,每個方向選擇一門課程,滿足知識寬廣度的要求。在此基礎(chǔ)上,在高階課程階段還需要專門在選定的方向上學(xué)習(xí)兩門深度要求的課程。表1給出了該校的數(shù)據(jù)科學(xué)專業(yè)課程設(shè)置和要求[4]。
麻省理工學(xué)院設(shè)置了“計算機科學(xué)、經(jīng)濟與數(shù)據(jù)科學(xué)”專業(yè)[5],可能是考慮到數(shù)據(jù)科學(xué)本身還不足以支撐一個專業(yè)或考慮到數(shù)據(jù)科學(xué)要與具體應(yīng)用相結(jié)合。事實上,許多國外知名高校沒有設(shè)置數(shù)據(jù)科學(xué)專業(yè),但一些學(xué)校設(shè)置了數(shù)據(jù)科學(xué)的輔修(Minor)。表2給出了麻省理工學(xué)院相關(guān)專業(yè)的課程學(xué)習(xí)要求。
從麻省理工學(xué)院的課程設(shè)置可以看出,學(xué)校也比較注重人文藝術(shù)和基礎(chǔ)科學(xué)的通識教育,但與加州大學(xué)伯克利分校相比,給學(xué)生提供的深度方向選擇指定了經(jīng)濟類。和加州大學(xué)伯克利分校一樣,學(xué)生可以在7個領(lǐng)域自行確定自己感興趣的數(shù)據(jù)科學(xué)結(jié)合的領(lǐng)域應(yīng)用。從上述兩所北美頂級名校的課程設(shè)置來看,二者都十分重視基礎(chǔ)理論的教育。同時也提供了一定數(shù)量的選修課,使學(xué)生可以發(fā)揮自己的興趣,培養(yǎng)某一方面的專長。
斯坦福大學(xué)在碩士階段設(shè)置了數(shù)據(jù)科學(xué)項目,但在本科階段沒有設(shè)置專門的數(shù)據(jù)科學(xué)專業(yè)。統(tǒng)計系提供了數(shù)據(jù)科學(xué)的輔修模塊(Minor)[6],目的是為人文與計算科學(xué)學(xué)院(Humatical and Computational Science)各專業(yè)提供感興趣領(lǐng)域的統(tǒng)計數(shù)據(jù)分析方法。數(shù)據(jù)科學(xué)輔修專業(yè)要求完成線性代數(shù)、程序設(shè)計、R程序設(shè)計、數(shù)據(jù)科學(xué)、統(tǒng)計、數(shù)據(jù)挖掘與分析、領(lǐng)域相關(guān)的數(shù)據(jù)科學(xué)方法論等7門相關(guān)課程。這7門相關(guān)課程除了2門是只有一個課程供選擇外,其他都提供了多于一門的課程供選擇。
北美信息學(xué)科教育另一所具有代表性的學(xué)校是加拿大的滑鐵盧大學(xué) ,它是以進行多次強制性實習(xí)(Coop)的項目而出名的,實習(xí)極大地提高了學(xué)生的就業(yè)能力。加拿大大學(xué)的本科專業(yè)設(shè)置與國內(nèi)略有不同。在教學(xué)中提供了職業(yè)專家(Professional specialist)、主修(Major)、輔修(Minor)幾類教學(xué)體系。其本科畢業(yè)要求一般要學(xué)30余門課,這可以由一個Professional specialist課程組支持,也可以由兩個Major課程組或一個Major、兩個Minor課程組支持。Major約16門課程,Minor約8門課程。滑鐵盧大學(xué)也開設(shè)了本科數(shù)據(jù)科學(xué)專業(yè),學(xué)生申請滑鐵盧大學(xué)的計算機科學(xué)或統(tǒng)計項目,在學(xué)習(xí)計算機科學(xué)或統(tǒng)計時, 可以選擇數(shù)據(jù)科學(xué)專業(yè)方向(Major)的學(xué)位,所以其專業(yè)設(shè)置在計算機科學(xué)與統(tǒng)計方面的課程設(shè)置較多[7]。但其畢業(yè)要求中也要求學(xué)生修學(xué)一定的廣度課程和在除計算機科學(xué)和統(tǒng)計之外的其他專業(yè)的某一個領(lǐng)域修習(xí)幾門課程,達到一定的深度,這點與美國高校要求類似,但從課程比例上來看,分量不如美國的頂尖高校重,具體見表3。
2.北美知名高校數(shù)據(jù)科學(xué)專業(yè)課分類
綜合北美知名高校的課程設(shè)置,可以看出數(shù)據(jù)科學(xué)的課程群主要包括以下幾個部分:
(1)數(shù)學(xué)基礎(chǔ)課。包括基礎(chǔ)課程:微積分、線性代數(shù)、概率論、統(tǒng)計、概率與隨機變量、最優(yōu)化方法、計算機科學(xué)的數(shù)學(xué)等。高階課程:隨機過程、線性建模理論與應(yīng)用、時間序列導(dǎo)論、實驗設(shè)計與分析、再生與協(xié)同統(tǒng)計數(shù)據(jù)科學(xué)等。
(2)計算機相關(guān)課程。包括基礎(chǔ)課程:計算機科學(xué)導(dǎo)論、Python編程、程序設(shè)計基礎(chǔ)、計算機程序結(jié)構(gòu)與解析、算法導(dǎo)論、算法設(shè)計與分析、網(wǎng)絡(luò)。高階課程:計算機安全、操作系統(tǒng)、程序設(shè)計語言與編譯、Internet導(dǎo)論、軟件工程、數(shù)據(jù)庫導(dǎo)論、人工智能導(dǎo)論、自然語言處理、信號處理、可視化與理解神經(jīng)網(wǎng)絡(luò)等。
(3)數(shù)據(jù)科學(xué)相關(guān)課程。包括數(shù)據(jù)科學(xué)導(dǎo)論、機器學(xué)習(xí)、數(shù)據(jù)科學(xué)中的計算結(jié)構(gòu)、數(shù)據(jù)挖掘與分析、數(shù)據(jù)可視化導(dǎo)論、現(xiàn)代統(tǒng)計預(yù)測與機器學(xué)習(xí)、數(shù)據(jù)的人文與倫理、社會生活計算、數(shù)據(jù)科學(xué)倫理問題等。
(4)領(lǐng)域相關(guān)課程。這是以UC Berkelev為標(biāo)志的學(xué)校強調(diào)的課程設(shè)置。這部分課程豐富多彩,一般每個領(lǐng)域都會提供幾門低階課程供學(xué)生選擇,滿足寬廣度的基本要求,另外還會提供10門左右的課程供數(shù)據(jù)科學(xué)專業(yè)的學(xué)生選擇,來滿足某一領(lǐng)域深入學(xué)習(xí)的要求。這些課程加起來約有上百門,給學(xué)生提供了充分的選擇余地。其他學(xué)校也有類似的要求。
上述課程設(shè)置并不會要求所有課程都需要學(xué)習(xí),學(xué)生可以根據(jù)興趣和自身特點在課程群內(nèi)部做出選擇,只要修夠一定的學(xué)分即可。在頂級學(xué)府中,更強調(diào)數(shù)據(jù)科學(xué)與領(lǐng)域知識的結(jié)合,這樣數(shù)據(jù)科學(xué)的畢業(yè)生畢業(yè)時就具有了在某一個領(lǐng)域從事數(shù)據(jù)分析工作的能力。
三、國外知名高校與我國數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教學(xué)的比較分析與建議
1.強調(diào)學(xué)生知識的寬廣度與某一非專業(yè)學(xué)科的深度
上述高校都強調(diào)數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生的知識體系要保持一定的寬廣度和某一特定領(lǐng)域的深度。一般情況下在某一特定學(xué)科要選修4門以上課程。麻省理工學(xué)院要深入學(xué)習(xí)經(jīng)濟類課程,其他兩所院校比較靈活,學(xué)生自己選擇一個專業(yè)進行深入學(xué)習(xí)。通過這種機制,使學(xué)生掌握特定領(lǐng)域的知識和數(shù)據(jù)分析技術(shù),能夠增強就業(yè)市場上的競爭力,也能增加以后轉(zhuǎn)移到其他領(lǐng)域的經(jīng)驗。對比我國高校給出的課程設(shè)置[1],可以看出除了經(jīng)濟類選修課程較多,我國各高校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)并沒有給學(xué)生提供很多的領(lǐng)域課程進行學(xué)習(xí),面向行業(yè)的大數(shù)據(jù)人才培養(yǎng)特色并不突出。
2.注重學(xué)生綜合能力的培養(yǎng)
所有學(xué)校都要求學(xué)生選擇一定的人文類課程,這其中不僅有歷史、文化等,還有一類重要課程是培養(yǎng)學(xué)生的交流能力,包括寫作、人際交流、公共演說、跨文化交流、領(lǐng)導(dǎo)力、沖突管理等等。這些課程對于學(xué)生走向社會后的成長具有十分重要的作用。國內(nèi)該課程設(shè)置中對學(xué)生的交流能力培養(yǎng)不是很充分。
3.大數(shù)據(jù)特色國內(nèi)外的側(cè)重有所不同
國內(nèi)高校將相關(guān)專業(yè)定位為數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè),在課程設(shè)置中開設(shè)了一些大數(shù)據(jù)平臺相關(guān)的課程,如Hadoop編程、Hive編程、大數(shù)據(jù)系統(tǒng)應(yīng)用實驗等,相當(dāng)比例課程以大數(shù)據(jù)為名稱來命名。在國外的幾所高校中,很少有以某一平臺或語言名稱命名的課程。課程還是以技術(shù)為統(tǒng)領(lǐng),平臺和語言是技術(shù)實現(xiàn)的依托或案例。上述國外高校純編程語言課程的教學(xué)很少,學(xué)生需要在課程實踐或?qū)嵙?xí)中具備較強的自學(xué)編程語言的能力和使用大數(shù)據(jù)平臺的能力。
四、結(jié)語
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)作為一個新興學(xué)科在我國得到了長足的發(fā)展,與國外相比,我們在順應(yīng)社會對數(shù)據(jù)處理和分析人才需求方面的進步非常迅速,具有自己鮮明的辦學(xué)特色。我國的數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)學(xué)生的培養(yǎng)在與領(lǐng)域和行業(yè)結(jié)合上、在綜合能力的培養(yǎng)上,與國外知名高校相比還存在一定的差距。如何改進課程設(shè)置體系,夯實基礎(chǔ),增加學(xué)生的選擇范圍,使學(xué)生在掌握數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)所需的計算機科學(xué)與數(shù)理統(tǒng)計核心知識的基礎(chǔ)上,在本科階段就完全具備從事某一領(lǐng)域與行業(yè)數(shù)據(jù)相關(guān)的科學(xué)研究與工程開發(fā)能力,是我國數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)培養(yǎng)的重點的努力方向之一。
參考文獻:
[1]李莎莎,周競文,唐晉韜,等.數(shù)據(jù)科學(xué)與大數(shù)據(jù)人才專業(yè)課程體系分析[J].計算機工程與科學(xué),2018,40(S1):109-113.
[2]崔燕.面向大數(shù)據(jù)分析的信息管理實踐教學(xué)體系構(gòu)建[J].課程教育研究,2017(18):21-23.
[3]許安見,鄒楊.數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)培養(yǎng)方案探討[J].教育教學(xué)論壇,2019(5):45-46.
[4]UC Berkeley. L&S Data Science Major[EB/OL]. https://data.berkeley.edu/degrees/data-science-ba.
[5]MIT.MIT Course Catalog Bulletin 2018-2019[EB/OL].http://catalog.mit.edu/archive/mit-bulletin-18-19.pdf.
[6]Stanford University.Undergraduate Programs[EB/OL].https://statistics.stanford.edu/academic-programs/undergraduate-programs.
[7]University of Waterloo.Data Science Checklist 2017-2018[EB/OL].https://uwaterloo.ca/statistics-and-actuarial-science/sites/ca.statistics-and-actuarial-science/files/uploads/files/datascience-2017-2018.pdf.(編輯:李曉萍)