摘? 要:針對(duì)目前研究生專業(yè)選修課教學(xué)中采用教師講課、學(xué)生寫讀書報(bào)告等教學(xué)形式,缺少工程素養(yǎng)的系統(tǒng)性訓(xùn)練等問題,在“大數(shù)據(jù)處理技術(shù)”課程中,探究專業(yè)選修課的教學(xué)改革方法。在講授大數(shù)據(jù)知識(shí)的同時(shí),通過設(shè)計(jì)與實(shí)現(xiàn)小組項(xiàng)目,培養(yǎng)學(xué)生系統(tǒng)分析與設(shè)計(jì)能力,以及團(tuán)隊(duì)協(xié)作和解決工程問題的能力。實(shí)踐證明,面向能力培養(yǎng)的教學(xué)方式效果良好,學(xué)生高度認(rèn)可。
關(guān)鍵詞:新工科;大數(shù)據(jù);工程能力;教學(xué)研究
中圖分類號(hào):TP392? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):2096-1472(2021)-01-47-03
Abstract: Currently, teacher lectures and reads reports are popular teaching methods in current postgraduate professional elective courses, which lacks of systematic training of engineering literacy. Therefore, it is necessary to explore a new teaching method for data processing technology course. The new teaching method aims to cultivate students capabilities of system analysis and design, teamwork and engineering problem solving capabilities, through design and implementation of group projects. The capability-oriented teaching method has proved to be effective and highly recognized by students.
Keywords: new engineering; big data; engineering ability; teaching research
1? ?引言(Introduction)
新工科致力于培養(yǎng)德才兼?zhèn)涞木哂猩疃葘W(xué)習(xí)、人工智能和大數(shù)據(jù)處理與分析等多元化技術(shù)的創(chuàng)新型人才,使之具有較強(qiáng)的工程實(shí)踐能力[1]。隨著大數(shù)據(jù)應(yīng)用的興起,對(duì)大數(shù)據(jù)應(yīng)用人才的需求急劇增長(zhǎng)。大數(shù)據(jù)應(yīng)用人才應(yīng)具備數(shù)據(jù)科學(xué)相關(guān)的專業(yè)知識(shí)和工程能力。專業(yè)知識(shí)包括人文社會(huì)科學(xué)知識(shí)、數(shù)據(jù)科學(xué)基礎(chǔ)知識(shí)和數(shù)據(jù)科學(xué)專業(yè)知識(shí)[2]。大數(shù)據(jù)創(chuàng)新型人才的培養(yǎng)首先必須培養(yǎng)學(xué)生跨學(xué)科的數(shù)據(jù)思維,同時(shí)還應(yīng)培養(yǎng)他們具備工程應(yīng)用的能力?!按髷?shù)據(jù)處理技術(shù)”是湖南大學(xué)信息科學(xué)與工程學(xué)院面向碩士研究生開設(shè)的選修課程,旨在系統(tǒng)地介紹大數(shù)據(jù)處理和應(yīng)用開發(fā)相關(guān)知識(shí)與技能[3]?!按髷?shù)據(jù)處理技術(shù)”課程在傳授研究生大數(shù)據(jù)專門知識(shí)的同時(shí),特別強(qiáng)調(diào)培養(yǎng)他們解決新工科工程問題的能力。
2? ?課程現(xiàn)狀(Course status)
目前國(guó)內(nèi)一些大學(xué)研究生選修課程的教學(xué)形式主要是采用任課老師講解部分內(nèi)容,博士生做幾個(gè)技術(shù)講座,研究生寫一篇讀書報(bào)告或者是寫一篇課程論文,老師根據(jù)讀書報(bào)告或者課程論文給出學(xué)生課程成績(jī)。這樣的教學(xué)方式存在著一些問題,要學(xué)生在一個(gè)學(xué)期的課程學(xué)習(xí)中寫出一篇有價(jià)值的論文實(shí)在是困難。如何提高研究生課程的授課質(zhì)量?如何實(shí)現(xiàn)從知識(shí)傳授到能力培養(yǎng)的轉(zhuǎn)變?如何把學(xué)生的被動(dòng)學(xué)習(xí)轉(zhuǎn)變?yōu)樽灾鲗W(xué)習(xí),提高學(xué)生的終身學(xué)習(xí)能力?這些問題需要高等教育的管理人員和任課教師深入思考。
3? ?課程教學(xué)模式(Course teaching mode)
目前許多大學(xué)都開設(shè)大數(shù)據(jù)分析相關(guān)課程,不同大學(xué)開設(shè)的大數(shù)據(jù)課程,其知識(shí)的側(cè)重點(diǎn)都不一樣。但是,基本上可以分成下面幾類:一是針對(duì)數(shù)據(jù)分析和數(shù)據(jù)挖掘的課程;二是針對(duì)并行與分布式編程架構(gòu)和模型的課程,主要是對(duì)Hadoop MapReduce以及Spark生態(tài)系統(tǒng)的講述;三是面向非結(jié)構(gòu)化數(shù)據(jù)處理與存儲(chǔ)管理的NoSQL數(shù)據(jù)庫和NewSQL數(shù)據(jù)庫技術(shù)以及面向云存儲(chǔ)的課程[4]。
通過查閱世界一流大學(xué)大數(shù)據(jù)相關(guān)課程,采用下面的知識(shí)點(diǎn)作為大數(shù)據(jù)應(yīng)用技術(shù)課程的主要教學(xué)內(nèi)容:大數(shù)據(jù)存儲(chǔ)與管理技術(shù)、大數(shù)據(jù)編程模型、大數(shù)據(jù)分析和可視化技術(shù),以及商業(yè)智能和數(shù)據(jù)湖等新的大數(shù)據(jù)應(yīng)用技術(shù)[5]。
課程學(xué)習(xí)是研究生面臨的一個(gè)重要學(xué)習(xí)過程,專業(yè)課程學(xué)習(xí)可以使研究生掌握更廣泛的專業(yè)知識(shí),在未來的研究中發(fā)揮重要作用。研究生專業(yè)選修課教學(xué)應(yīng)該根據(jù)課程的性質(zhì)和學(xué)生的特點(diǎn),采用不同于以往的教學(xué)方式和教學(xué)模式。教學(xué)模式不應(yīng)該是單一的,需要結(jié)合課程特點(diǎn)采用多種教學(xué)方法。在“大數(shù)據(jù)處理技術(shù)”研究生課程教學(xué)中,采用授課、技術(shù)講座、課程實(shí)驗(yàn)、討論會(huì)、課程小組項(xiàng)目等多種方式進(jìn)行。課程講解大數(shù)據(jù)生態(tài)系統(tǒng)中的軟件架構(gòu)和相應(yīng)的軟件產(chǎn)品與處理技術(shù),對(duì)學(xué)生難以理解的重要理論知識(shí)作出詳細(xì)和深入闡述,使學(xué)生掌握核心的數(shù)據(jù)科學(xué)專業(yè)知識(shí)。針對(duì)每一個(gè)重要的知識(shí)環(huán)節(jié),安排獨(dú)立的實(shí)驗(yàn),學(xué)生必須單獨(dú)完成。通過實(shí)驗(yàn),使學(xué)生掌握大數(shù)據(jù)生態(tài)系統(tǒng)的基礎(chǔ)和核心技術(shù),結(jié)合實(shí)際的操作和編程實(shí)驗(yàn),鞏固課堂教學(xué)內(nèi)容,使學(xué)生將所學(xué)理論與實(shí)際技能相結(jié)合,能夠應(yīng)用主流的大數(shù)據(jù)開發(fā)技術(shù)和開發(fā)工具。此外,課程需要結(jié)合當(dāng)前研究的熱點(diǎn)問題,通過提出問題和分小組完成一個(gè)大數(shù)據(jù)相關(guān)的工程項(xiàng)目。通過運(yùn)用軟件工程的原理與方法,小組成員全程參與問題描述、需求分析、算法(系統(tǒng))設(shè)計(jì)、編程實(shí)現(xiàn)到測(cè)試等每一個(gè)開發(fā)環(huán)節(jié),培養(yǎng)學(xué)生系統(tǒng)分析與設(shè)計(jì)能力以及團(tuán)隊(duì)協(xié)作和解決工程問題的能力。
4? ?課程教學(xué)目標(biāo)(Course teaching objectives)
大數(shù)據(jù)已經(jīng)成為企業(yè)和公司使用信息增進(jìn)用戶體驗(yàn)和改變運(yùn)營(yíng)模式的極其重要的新技術(shù)。如何有效使用大數(shù)據(jù)?如何從大數(shù)據(jù)分析中獲取知識(shí)和智慧?“大數(shù)據(jù)處理技術(shù)”課程將把最新的大數(shù)據(jù)處理技術(shù)介紹給學(xué)生,幫助學(xué)生掌握從海量的異構(gòu)數(shù)據(jù)源中對(duì)大數(shù)據(jù)進(jìn)行存儲(chǔ)與管理、高效處理、有效應(yīng)用與分析的技能。
4.1? ?理論教學(xué)目標(biāo)
課程涵蓋大數(shù)據(jù)技術(shù)的基本概念、大數(shù)據(jù)生態(tài)系統(tǒng)、大數(shù)據(jù)存儲(chǔ)模型、大數(shù)據(jù)編程模型、大數(shù)據(jù)分析技術(shù)、大數(shù)據(jù)可視化技術(shù)和大數(shù)據(jù)主流應(yīng)用技術(shù)。
4.2? ?工程能力培養(yǎng)目標(biāo)
學(xué)生解決工程問題能力的培養(yǎng)通過課程實(shí)驗(yàn)以及設(shè)計(jì)課程中綜合性的工程項(xiàng)目來達(dá)成。工程能力的培養(yǎng)問題不僅僅是個(gè)人的問題,工程問題的解決需要團(tuán)隊(duì)協(xié)作?!按髷?shù)據(jù)處理技術(shù)”課程希望通過項(xiàng)目小組的形式,培養(yǎng)學(xué)生團(tuán)隊(duì)合作、有效溝通、項(xiàng)目管理和終身學(xué)習(xí)的能力[6]。(1)團(tuán)隊(duì)合作,讓學(xué)生分成討論與項(xiàng)目小組,因?yàn)楣こ添?xiàng)目無法一人獨(dú)立解決,需與他人合作。(2)有效溝通,討論課讓學(xué)生書面及口頭報(bào)告,大家一起討論,形成最終解決方案。(3)主動(dòng)學(xué)習(xí)、終身學(xué)習(xí),讓學(xué)生主動(dòng)學(xué)習(xí),減少教師課堂講授。學(xué)生須設(shè)計(jì)實(shí)驗(yàn)來驗(yàn)證、解決問題,須自己或團(tuán)隊(duì)搜集資料、尋求資源、增進(jìn)專業(yè)素養(yǎng)。(4)項(xiàng)目管理,讓學(xué)生嘗試執(zhí)行項(xiàng)目,規(guī)劃任務(wù)和時(shí)間。
5? ?課程教學(xué)實(shí)施(Course teaching implementation)
5.1? ?課時(shí)安排
“大數(shù)據(jù)處理技術(shù)”為研究生選修課,共48學(xué)時(shí),課程通過課堂講授、課程實(shí)驗(yàn)、文獻(xiàn)閱讀、小組討論、課程小組項(xiàng)目和期末考試等環(huán)節(jié)來組織教學(xué)。教師用32課時(shí)講解核心的大數(shù)據(jù)生態(tài)系統(tǒng)架構(gòu)和關(guān)鍵技術(shù),選修課程的學(xué)生2—4人組成項(xiàng)目小組,必須完成一個(gè)與大數(shù)據(jù)處理技術(shù)相關(guān)的工程項(xiàng)目。教師安排4個(gè)課時(shí)點(diǎn)評(píng)學(xué)生的文獻(xiàn)閱讀報(bào)告和小組擬進(jìn)行的工程項(xiàng)目開題報(bào)告,對(duì)工作量、難易程度、實(shí)驗(yàn)數(shù)據(jù)來源、關(guān)鍵技術(shù)和算法等方面進(jìn)行把關(guān)。每個(gè)項(xiàng)目小組就項(xiàng)目的開題報(bào)告、實(shí)驗(yàn)環(huán)境搭建、實(shí)現(xiàn)的關(guān)鍵技術(shù)與算法設(shè)計(jì)、編程實(shí)現(xiàn)、系統(tǒng)測(cè)試、問題描述與解決方案等內(nèi)容在課堂上進(jìn)行討論。由各研究生小組成員講解或演示,共6次,12課時(shí),教師參與討論與引導(dǎo),學(xué)生遇到問題時(shí)給出解決方案的建議。
5.2? ?理論教學(xué)內(nèi)容
“大數(shù)據(jù)處理技術(shù)”課程的主要內(nèi)容分為四個(gè)部分:大數(shù)據(jù)處理與算法、大數(shù)據(jù)存儲(chǔ)與管理、大數(shù)據(jù)分析與可視化、大數(shù)據(jù)應(yīng)用技術(shù)。課程內(nèi)容和主要知識(shí)點(diǎn)如表1所示。
5.2.1? ?大數(shù)據(jù)存儲(chǔ)與管理
近十多年來,對(duì)存儲(chǔ)和處理大規(guī)模數(shù)據(jù)集的需求不斷增長(zhǎng),一直推動(dòng)著數(shù)據(jù)存儲(chǔ)技術(shù)和并行計(jì)算技術(shù)以及數(shù)據(jù)庫技術(shù)快速發(fā)展。從本地存儲(chǔ)到集群,從分布式存儲(chǔ)到云數(shù)據(jù)庫存儲(chǔ),數(shù)據(jù)存儲(chǔ)方法得到了極大的增強(qiáng)[7]。數(shù)據(jù)庫系統(tǒng)已從傳統(tǒng)的關(guān)系數(shù)據(jù)庫系統(tǒng)進(jìn)化到最新的基于NoSQL和支持?jǐn)?shù)據(jù)庫完整性約束的NewSQL數(shù)據(jù)庫系統(tǒng)。大數(shù)據(jù)除結(jié)構(gòu)化的數(shù)據(jù)外,主要涉及大量的非結(jié)構(gòu)化數(shù)據(jù),NoSQL和NewSQL是非結(jié)構(gòu)數(shù)據(jù)存儲(chǔ)的新方法。大數(shù)據(jù)存儲(chǔ)建立在分布式文件系統(tǒng)之上,HDFS是使用最廣泛的分布式文件系統(tǒng)。NoSQL數(shù)據(jù)庫的類型很多,有文檔的、圖的、列簇的和鍵值等[8]。課程將講解大數(shù)據(jù)存儲(chǔ)模型和管理技術(shù),大多數(shù)NoSQL數(shù)據(jù)庫系統(tǒng)都是開源的,因此很容易納入大數(shù)據(jù)課程的實(shí)驗(yàn)環(huán)節(jié)中。
5.2.2? ?大數(shù)據(jù)編程模型
并行分布式計(jì)算與處理模型是大數(shù)據(jù)應(yīng)用系統(tǒng)架構(gòu)的核心。大數(shù)據(jù)編程模型提供了編寫大數(shù)據(jù)應(yīng)用系統(tǒng)通用的接口,為構(gòu)建大數(shù)據(jù)應(yīng)用程序系統(tǒng)提供了簡(jiǎn)單的途徑。大數(shù)據(jù)通常涉及在集群上的分布式并行計(jì)算技術(shù)。MapReduce是主流的并行計(jì)算算法框架,它可以支持各種數(shù)據(jù)密集型程序,是事實(shí)上的大數(shù)據(jù)編程模型。大數(shù)據(jù)處理的核心是采用兩個(gè)基本過程對(duì)象Mapper和Reducer,它通過兩種特殊的計(jì)算方式Map和Reduce歸約到集群不同節(jié)點(diǎn)上進(jìn)行處理[9]。大數(shù)據(jù)處理另外一個(gè)廣泛應(yīng)用的算法框架是基于Spark平臺(tái)中實(shí)現(xiàn)的彈性分布式數(shù)據(jù)集RDD(Resilient Distributed Dataset)。通過使用RDD,用戶不必?fù)?dān)心底層數(shù)據(jù)的分布式特性,只需要將具體的應(yīng)用邏輯表達(dá)為一系列轉(zhuǎn)換處理,就可以實(shí)現(xiàn)管道化,從而避免了中間結(jié)果的存儲(chǔ),大大降低了數(shù)據(jù)復(fù)制、磁盤I/O和數(shù)據(jù)序列化的開銷。
課程將通過比較具體的代碼示例,全面闡述大數(shù)據(jù)框架Hadoop和Spark中的不同編程模型。
5.2.3? ?大數(shù)據(jù)分析與可視化
可視化已成為從大數(shù)據(jù)分析結(jié)果中提取有意義信息并帶來價(jià)值的一項(xiàng)核心技術(shù)。有效地工具和技術(shù),可以輕松地可視化雜亂的海量大數(shù)據(jù),通過可視化大數(shù)據(jù)來改善企業(yè)的經(jīng)營(yíng)決策能力。為了實(shí)現(xiàn)強(qiáng)大的數(shù)據(jù)分析和出色的可視化,在Hadoop上使用R語言將提供一個(gè)彈性的數(shù)據(jù)分析平臺(tái)。R語言提供了最流行的開放源代碼數(shù)據(jù)統(tǒng)計(jì)分析軟件包,Hadoop強(qiáng)大的數(shù)據(jù)處理能力和R強(qiáng)大的可視化分析能力相結(jié)合的Rhadoop,提供了很好的大數(shù)據(jù)分析平臺(tái)。課程將介紹R語言和Tableau等可視化工具。
5.2.4? ?大數(shù)據(jù)應(yīng)用技術(shù)
隨著大數(shù)據(jù)技術(shù)的不斷更新和迭代,數(shù)據(jù)管理工具得到了飛速的發(fā)展,相關(guān)概念層出不窮,如從最初決策支持系統(tǒng)(DSS)到商業(yè)智能(BI)、數(shù)據(jù)倉(cāng)庫、數(shù)據(jù)湖、數(shù)據(jù)中臺(tái)等。數(shù)據(jù)湖是企業(yè)所有數(shù)據(jù)的單一存儲(chǔ),包括源系統(tǒng)數(shù)據(jù)的原始副本,以及用于報(bào)告、可視化、分析和機(jī)器學(xué)習(xí)等任務(wù)的轉(zhuǎn)換數(shù)據(jù)。數(shù)據(jù)湖可以包括各種類型的數(shù)據(jù):關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)(CSV、日志、XML、JSON);非結(jié)構(gòu)化數(shù)據(jù)(電子郵件、文檔、PDF)和二進(jìn)制數(shù)據(jù)(圖像、音頻、視頻)。Hadoop是最常用的部署數(shù)據(jù)湖的技術(shù)。數(shù)據(jù)中臺(tái)是一個(gè)承接技術(shù)、引領(lǐng)業(yè)務(wù)、構(gòu)建規(guī)范定義的智能數(shù)據(jù)處理平臺(tái)。許多企業(yè)已經(jīng)開始嘗試使用大數(shù)據(jù)和云技術(shù)來構(gòu)建數(shù)據(jù)湖和數(shù)據(jù)中臺(tái),并支持?jǐn)?shù)據(jù)驅(qū)動(dòng)的智能決策。如今,世界上頂級(jí)的公司和大型企業(yè)已經(jīng)部署或正在部署數(shù)據(jù)湖和數(shù)據(jù)中臺(tái)。課程將向?qū)W生介紹這些新的技術(shù),讓學(xué)生了解企業(yè)大數(shù)據(jù)應(yīng)用的真實(shí)現(xiàn)狀。
5.3? ?課程實(shí)驗(yàn)設(shè)置
大數(shù)據(jù)處理技術(shù)課程安排了多次實(shí)驗(yàn),老師編寫了實(shí)驗(yàn)指導(dǎo)書,對(duì)大數(shù)據(jù)實(shí)驗(yàn)環(huán)境的構(gòu)建、開發(fā)平臺(tái)和開發(fā)工具都有基本的規(guī)定。對(duì)大數(shù)據(jù)主要技術(shù)都安排了至少一次的實(shí)驗(yàn)內(nèi)容,需要學(xué)生在規(guī)定的時(shí)間內(nèi)、課外獨(dú)立完成。所有實(shí)驗(yàn)為一個(gè)整體,有其延續(xù)性,如果不能完成當(dāng)次實(shí)驗(yàn)將會(huì)影響下次實(shí)驗(yàn)。每次實(shí)驗(yàn)后,必須認(rèn)真填寫實(shí)驗(yàn)報(bào)告,在要求的時(shí)間提交實(shí)驗(yàn)報(bào)告的電子版,超過規(guī)定時(shí)間,該次實(shí)驗(yàn)成績(jī)以零分計(jì)。
5.4? ?小組課程項(xiàng)目
大學(xué)的核心任務(wù)是培養(yǎng)人才,大學(xué)教學(xué)的本質(zhì)應(yīng)該是以學(xué)生為中心,以能力為本位的研究型教學(xué),以培養(yǎng)學(xué)生的自主學(xué)習(xí)、終身學(xué)習(xí)、研究性學(xué)習(xí)和解決工程問題的能力?!按髷?shù)據(jù)處理技術(shù)”課程教學(xué)體系的另外一個(gè)重要組成部分是學(xué)生按2—4個(gè)人組成一個(gè)課程討論與項(xiàng)目小組,項(xiàng)目小組的人數(shù)不能超過5人。學(xué)生自選具有一定難度和工作量的與大數(shù)據(jù)處理相關(guān)的研究或工程類題目,鼓勵(lì)結(jié)合導(dǎo)師的研究工作選擇項(xiàng)目,完成一個(gè)項(xiàng)目的開發(fā)。各小組進(jìn)行查閱資料、文獻(xiàn)閱讀、進(jìn)度分享、實(shí)驗(yàn)操作、成果展示等多個(gè)階段。在查閱文獻(xiàn)、資料的過程中,訓(xùn)練學(xué)生的文獻(xiàn)檢索能力以及理解能力,組內(nèi)每位成員參與討論,增強(qiáng)溝通能力。
(1)項(xiàng)目小組的組織與控制
項(xiàng)目小組成員要求有熟悉Java、Linux或Unix等技術(shù)的學(xué)生。小組長(zhǎng)負(fù)責(zé)任務(wù)的劃分,組織、討論詳細(xì)設(shè)計(jì),組織和協(xié)調(diào)本小組的開發(fā)、文檔整理等工作,確保開發(fā)過程中及時(shí)完成各個(gè)里程碑任務(wù)。研究生課程沒有配備助教,但是“大數(shù)據(jù)處理技術(shù)”課程采用自愿報(bào)名的方式選擇一位課代表,負(fù)責(zé)協(xié)助主講教師管理課程的相關(guān)事宜,包括實(shí)驗(yàn)報(bào)告的歸檔,記錄每組討論內(nèi)容。項(xiàng)目的討論課上,要求所有小組成員都能有機(jī)會(huì)上講臺(tái)講解,而不只是項(xiàng)目組長(zhǎng)的事情,鍛煉學(xué)生的表達(dá)能力。
(2)項(xiàng)目小組需要提交的技術(shù)文檔
課程需要填寫、檢查、整理和歸檔項(xiàng)目的過程報(bào)告。開題報(bào)告的目的是為了評(píng)估課程設(shè)計(jì)選題的內(nèi)容和難度是否達(dá)到一定要求,主要內(nèi)容包括:小組成員信息(人員、學(xué)號(hào)、聯(lián)系信息)、各個(gè)成員初步的項(xiàng)目分工計(jì)劃、項(xiàng)目題目、研究問題背景、主要技術(shù)難點(diǎn)、主要解決方法和算法設(shè)計(jì)思路等。小組項(xiàng)目總結(jié)報(bào)告主要包括的內(nèi)容:小組信息(人員、學(xué)號(hào)、聯(lián)系信息);小組具體的分工,需要明確說明各成員在整個(gè)課題中分工負(fù)責(zé)完成的內(nèi)容,所做貢獻(xiàn)的比例;研究問題的背景、主要技術(shù)難點(diǎn)、解決方法和算法設(shè)計(jì)思想;詳細(xì)的設(shè)計(jì)說明,包括詳細(xì)算法設(shè)計(jì)、程序框架、功能模塊、主要類的設(shè)計(jì)說明、程序運(yùn)行和實(shí)驗(yàn)結(jié)果的說明及分析,在完成系統(tǒng)的功能、性能、擴(kuò)展性等方面存在的不足和可能的改進(jìn)之處。
5.5? ?成績(jī)?cè)u(píng)定方法
課程強(qiáng)調(diào)學(xué)生大數(shù)據(jù)素養(yǎng)和能力培養(yǎng),課程的考評(píng)采用課程實(shí)驗(yàn)成績(jī)、小組項(xiàng)目、考勤和期末考試綜合評(píng)定的方法進(jìn)行,期末成績(jī)=個(gè)人課程實(shí)驗(yàn)25%+小組項(xiàng)目35%+期末考試30%+考勤10%。
6? ?結(jié)論(Conclusion)
“大數(shù)據(jù)處理技術(shù)”課程的授課,讓學(xué)生熟悉了大數(shù)據(jù)管理和分析的基本概念和主流技術(shù);能夠勝任處理大數(shù)據(jù)應(yīng)用程序所面臨的挑戰(zhàn),并可提出可擴(kuò)展性的解決方案。“大數(shù)據(jù)處理技術(shù)”課程采用學(xué)生小組項(xiàng)目的方式,在教師講解專業(yè)知識(shí)的同時(shí),學(xué)生通過一個(gè)小組,完成大數(shù)據(jù)應(yīng)用開發(fā)項(xiàng)目工程能力的培養(yǎng)。通過論文宣講、學(xué)生匯報(bào)討論,教師依據(jù)自己的經(jīng)驗(yàn)點(diǎn)評(píng),學(xué)生的收獲很大。這一教學(xué)形式很受歡迎,效果良好。
大數(shù)據(jù)技術(shù)涵蓋的主題非常多,要在一個(gè)學(xué)期的課程中全面涵蓋大數(shù)據(jù)處理和應(yīng)用的技術(shù)是不現(xiàn)實(shí)的,還有許多重要的技術(shù),比如大數(shù)據(jù)的數(shù)據(jù)采集與預(yù)處理、大數(shù)據(jù)流處理以及大數(shù)據(jù)安全與隱私保護(hù)等只能引導(dǎo)學(xué)生在課后自學(xué)。
參考文獻(xiàn)(References)
[1] 陳燕.新工科研究進(jìn)展與前瞻[J].天津大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2020,22(3):214-222.
[2] 田緒紅,鄺穎杰.大數(shù)據(jù)應(yīng)用人才的知識(shí)、能力、素質(zhì)結(jié)構(gòu)及其培養(yǎng)[J].計(jì)算機(jī)教育,2017(8):57-60.
[3] DePratti, R., Dancik, et al. Challenges in designing an introductory course in big data programming[J]. Journal of Computing Sciences in College, 2015, 30(6):104-105.
[4] Adam H. Villa. Motivating the development of an advanced database systems course[J]. Journal of Computing Sciences in College, 2016, 31(3):119-127.
[5] Yuri Demchenko. Big Data Platforms and Tools for Data Analytics in the Data Science Engineering Curriculum[C]. International Conference on Cloud and Big Data Computing, 2019:60-64.
[6] 劉爽,陳鵬,王巍,等.基于工程教育認(rèn)證背景的民族院校大數(shù)據(jù)課程體系設(shè)計(jì)[J].計(jì)算機(jī)時(shí)代,2020(5):74-77.
[7] Xiong,W., Hawley, D., Monismith, D. NoSQL in database education[J]. Journal of Computing Sciences in College, 2015, 30(5):151-152.
[8] Grolinger, K., Higashino, W.A., Tiwari, A.. Data management in cloud environments: NoSQL and NewSQL data stores[J]. Journal of Cloud Computing: Advances, Systems and Applications, 2013, 22(2):1-24.
[9] 劉萍.基于Hadoop與Spark的高校校園大數(shù)據(jù)平臺(tái)研究.軟件工程,2018,21(5):15-18.
作者簡(jiǎn)介:
戴牡紅(1964-),男,碩士,教授.研究領(lǐng)域:數(shù)據(jù)科學(xué).