DOI:10.3969/j.issn.1671-489X.2024.22.111
摘 要 隨著人工智能時代的到來,大數(shù)據(jù)技術(shù)作為人工智能的重要一環(huán),其作用愈加重要。因此,相關(guān)學科將大數(shù)據(jù)技術(shù)與應用設置為必/選修課程。然而,由于電子信息學科研究生大多來自非計算機及數(shù)據(jù)科學專業(yè),相關(guān)的計算機體系結(jié)構(gòu)、數(shù)據(jù)庫、文件系統(tǒng)、數(shù)據(jù)倉庫及計算模式等知識儲備不足,課程也存在教學內(nèi)容不完善、教學模式局限及考評機制單一等問題,影響課程培養(yǎng)目標的實現(xiàn)與培養(yǎng)質(zhì)量的提升?;诖?,從教學內(nèi)容、教學模式與考評機制等方面著手,實施基于Python語言案例實踐貫通、大數(shù)據(jù)技術(shù)原理講授為輔、機器學習模型大數(shù)據(jù)部署應用為落腳點、過程化考核機制相結(jié)合的課內(nèi)外“四位一體”的立體化改革及實踐。
關(guān)鍵詞 電子信息學科;大數(shù)據(jù)技術(shù)與應用;研究生;機器學習模型;Python
中圖分類號:G643 文獻標識碼:B
文章編號:1671-489X(2024)22-0-05
0 引言
數(shù)據(jù)產(chǎn)生方式的變革促成了大數(shù)據(jù)時代的到來。2015年8月,國務院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,提出加快建設數(shù)據(jù)強國。2017年4月,全國信息安全標準化技術(shù)委員會正式發(fā)布《大數(shù)據(jù)安全標準化白皮書(2017)》,從法律、政策、標準和應用角度,全面勾畫了大數(shù)據(jù)安全的整體輪廓。大數(shù)據(jù)的發(fā)展使科學研究進入數(shù)據(jù)密集型范式,已經(jīng)深刻改變了人類的思維方式,促進信息技術(shù)與各行業(yè)深度融合,產(chǎn)生眾多具體應用。同時,大數(shù)據(jù)的發(fā)展改變了我國高校信息技術(shù)相關(guān)專業(yè)的現(xiàn)有教學和科研體系,在理論研究上有很大進展[1]。大數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類型多、處理速度快、價值密度低等特點,關(guān)鍵技術(shù)包括數(shù)據(jù)采集與預處理、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)安全與隱私保護,計算模式包括批處理模式、流計算模式、圖計算及查詢分析計算,與云計算、物聯(lián)網(wǎng)相互滲透、互為補充[2]。在人工智能三要素數(shù)據(jù)、模型、算法中,數(shù)據(jù)是最基本最重要的一環(huán),可以說沒有數(shù)據(jù)就不存在人工智能。因此,大數(shù)據(jù)技術(shù)與應用在一定意義上是實現(xiàn)人工智能的主要方面,也是控制科學與工程及電子信息學科的學位選修課程。
1 大數(shù)據(jù)技術(shù)與應用專業(yè)和課程建設現(xiàn)狀
21世紀前十年,隨著Web2.0應用的迅猛發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)大量產(chǎn)生,大數(shù)據(jù)解決方案逐漸走向成熟,形成并行計算與分布式計算兩大核心技術(shù),以Google的GFS和MapReduce為代表,Hadoop平臺開始盛行。2010年以后,隨著NoSQL數(shù)據(jù)庫、Spark、Storm、Flink和圖計算等新型計算模式的出現(xiàn),大數(shù)據(jù)技術(shù)滲透到各行各業(yè),進入大規(guī)模應用期,但是相關(guān)技術(shù)以Amazon、Google、Micro-soft、Yahoo、IBM等國外互聯(lián)網(wǎng)巨頭為領(lǐng)導者。目前,國內(nèi)相關(guān)企業(yè)如華為、百度、阿里巴巴在大數(shù)據(jù)相關(guān)技術(shù)上已經(jīng)具有相當優(yōu)勢,并在某些技術(shù)方面處于領(lǐng)先地位。
1.1 大數(shù)據(jù)技術(shù)相關(guān)專業(yè)開設情況
大數(shù)據(jù)技術(shù)的興起和發(fā)展在很大程度上改變了我國高校信息技術(shù)相關(guān)專業(yè)的現(xiàn)有教學和科研體制,數(shù)據(jù)科學需要掌握數(shù)學(特別是統(tǒng)計學)、機器學習、可視化與編程等多方面知識的人才。在國外,2010年前后,美國的斯坦福大學、麻省理工學院和加州大學伯克利分校,英國的牛津大學、倫敦大學等,相繼開設大數(shù)據(jù)技術(shù)相關(guān)專業(yè)與課程,這些高校是世界上著名的數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)相關(guān)專業(yè)的領(lǐng)軍院校[3]。在國內(nèi),2014年,中國科學院大學開始設置首個大數(shù)據(jù)技術(shù)與應用專業(yè)方向,清華大學成立數(shù)據(jù)科學研究院;2015年,復旦大學大數(shù)據(jù)學院成立;2016年,華東師范大學數(shù)據(jù)科學與工程學院成立,北京大學、中南大學、對外經(jīng)濟貿(mào)易大學三所高校成為國內(nèi)首批獲得教育部批準設立數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)的本科院校。此后,教育部又于2017年、2018年和2019年分別批準32所、248所和203所本科院校設立數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)[4]。
1.2 大數(shù)據(jù)技術(shù)與應用課程建設情況
在大數(shù)據(jù)技術(shù)與應用課程建設方面,廈門大學于2013年開始為研究生開設大數(shù)據(jù)技術(shù)課程,隨后,林子雨副教授團隊出版十多部大數(shù)據(jù)相關(guān)系列教材,并建設了國內(nèi)首個大數(shù)據(jù)課程公共服務平臺,建成“大數(shù)據(jù)技術(shù)原理及應用”國家一流課程和國家精品課程。此外,清華大學的武永衛(wèi)教授建成了“大數(shù)據(jù)平臺核心技術(shù)”國家一流課程,北京理工大學的計衛(wèi)星等建成“大數(shù)據(jù)基礎(chǔ)及應用”國家精品課程,東北師范大學的李雁翎等建成“大數(shù)據(jù)技術(shù)及應用”國家精品課程[5],其他高校相關(guān)的在線課程及雙語課程也較多,這些線上及線下資源都為該課程的教學作出顯著貢獻。
雖然有較多的教材、一流和精品在線課程資源可以借鑒,但是大數(shù)據(jù)技術(shù)與應用課程各組件所涉及知識的原理及體系架構(gòu)多且復雜,對所采用的Java語言編程存在困難,而且目前新出版的教材也滯后于大數(shù)據(jù)技術(shù)的新成果和領(lǐng)域的新發(fā)展。張寧等[6]針對電氣工程學科特點進行該課程的構(gòu)建與教學實踐,楊尚東等[7]基于交互式大模型進行大數(shù)據(jù)技術(shù)課程實踐,各高校有自己的研究方向和特色,不能一味照搬他人的教學模式,而應該形成自己的模式和特點。
2 大數(shù)據(jù)技術(shù)與應用課程建設存在的主要
問題
就控制科學與工程及電子信息學科而言,由于大數(shù)據(jù)技術(shù)與應用課程學時少(四川輕化工大學為32學時),相關(guān)的計算機體系結(jié)構(gòu)和數(shù)據(jù)庫等基礎(chǔ)知識內(nèi)容偏少,所涉及知識的原理與架構(gòu)紛繁復雜,對所采用的Java語言編程存在困難。更由于是選修課、非學位課和考查課,很多研究生感覺內(nèi)容非??菰?,也不重視,整體呈現(xiàn)出“教師難上,學生不學”的課程特點。這些問題影響了學科該方向?qū)W生培養(yǎng)質(zhì)量的提高,也成為各高校電子信息學科學生培養(yǎng)所面臨的共性問題,歸納起來,主要有以下幾點。
2.1 大數(shù)據(jù)技術(shù)與應用課程教學內(nèi)容太原理化
該課程教學基本是對相關(guān)技術(shù)體系結(jié)構(gòu)與原理的理論化講授,實踐教學案例簡單,多數(shù)是大數(shù)據(jù)存儲與管理(如分布式文件系統(tǒng)HDFS或分布式數(shù)據(jù)庫HBase的安裝)、大數(shù)據(jù)處理與分析(如Hadoop或Spark平臺的安裝及簡單詞頻統(tǒng)計),最后是大數(shù)據(jù)應用的簡單介紹,沒有落腳到真正有用的案例上。而且這些簡單案例都是基于Java語言開發(fā)的,對電子信息學科的學生而言也難以掌握和學習。
2.2 電子信息學科研究生缺少大數(shù)據(jù)所需知識儲備
控制科學與工程及電子信息學科招收的研究生多來自通信工程、電氣工程及自動化、人工智能等專業(yè),學生雖有一些計算機體系結(jié)構(gòu)、數(shù)據(jù)庫及計算模式等相關(guān)大數(shù)據(jù)所需知識儲備,但是不具體和完備。此外,大部分學生不具備大數(shù)據(jù)技術(shù)所需要的Java編程基礎(chǔ)知識,而且Java編程入門較困難,大多數(shù)學生只具備或者正在學習學科目前流行的Python編程語言。
2.3 課內(nèi)外教學與實踐缺少銜接
課程進行課堂理論與簡單案例教學,課后一般是布置一些簡單的相關(guān)技術(shù)組件的安裝與簡單編程任務,但因是選修課程,學生不重視,大多數(shù)學生也沒有在項目中進行相關(guān)實踐,導致難以完成作業(yè)任務。課程教學沒有和實踐及有關(guān)課題研究對接,出現(xiàn)脫節(jié)現(xiàn)象。
2.4 大數(shù)據(jù)技術(shù)與應用課程考查手段單一
以四川輕化工大學為例,大數(shù)據(jù)技術(shù)與應用課程目前是選修、考查課,之前只是要求寫三篇課程相關(guān)技術(shù)論文或報告,以給分的形式考查測評,學生往往在網(wǎng)上快速查找資料就能拼湊而完成考查任務,缺乏多樣及個性化的綜合實踐性課程學習考查機制。
3 大數(shù)據(jù)技術(shù)與應用課程改革和實踐
為實現(xiàn)該課程教學目標,提高研究生培養(yǎng)質(zhì)量,使其掌握大數(shù)據(jù)技術(shù)原理及大數(shù)據(jù)技術(shù)應用和實踐能力,實現(xiàn)與研究生課題實踐無縫對接,在多年教研的基礎(chǔ)上,教研團隊對該課程進行了基于Python語言案例實踐貫通、大數(shù)據(jù)技術(shù)原理講授為輔、機器學習模型大數(shù)據(jù)部署應用為落腳點、過程化考核機制相結(jié)合的課內(nèi)外“四位一體”的立體化改革與實踐。
3.1 大數(shù)據(jù)技術(shù)理論的專題模塊化構(gòu)建與實踐
教研團隊通過多年實踐,構(gòu)建了該課程的專題模塊,如圖1所示。在圖1中,課程共分為大數(shù)據(jù)概述及基礎(chǔ)、數(shù)據(jù)采集與預處理、數(shù)據(jù)存儲與管理、大數(shù)據(jù)處理與分析、大數(shù)據(jù)應用及框架部署等五大專題模塊組,每一專題模塊組又分為多個單元模塊,單元模塊又包含相應單元的具體知識點與Python實踐案例。通過從專題模塊到單元模塊、到具體知識點的內(nèi)容構(gòu)建,使學生掌握大數(shù)據(jù)技術(shù)課程的基本內(nèi)容與脈絡。只有32學時的該課程,講授課件也略去枯燥乏味的某些大數(shù)據(jù)組件的原理及體系架構(gòu),從組件基本概念及適用場景、具體案例實踐等方面著手,突出實踐性和實用性,將抽象難懂的組件原理及體系架構(gòu)內(nèi)容弱化,通過實踐強調(diào)圖示化、形象化,強化教學效果。
3.2 基于Python的案例內(nèi)容專題模塊化構(gòu)建、實踐與研討
3.2.1 案例專題模塊化構(gòu)建與課堂演示
考慮到控制科學與工程及電子信息學科專業(yè)學位研究生基本沒有Java編程的知識儲備,但大多具有Python編程基礎(chǔ),所有案例都采用Python進行實現(xiàn),并且都以可視化的方法顯示結(jié)果。所建設的Python案例資源均嵌入各專題配套課件基本概念、理論介紹之后,如圖1所示。這些實踐案例共有14個,可以通過學生進一步擴展,實現(xiàn)一些高級別的功能,提升學生的實踐能力,達到相關(guān)知識的內(nèi)化掌握和與科研課題的銜接作用。有的案例通過相關(guān)大數(shù)據(jù)組件理論講解后進行案例演示實驗,有的作為課后實踐操作作業(yè)。通過教師在課堂案例演示中評講、總結(jié)和師生研討交流,學生在課后實踐中完成相應案例的編程和分析,從而加深對該課程相關(guān)知識的理解,從實踐中深入掌握一些常用大數(shù)據(jù)組件及技術(shù)的使用方法。
3.2.2 案例課后實踐、實現(xiàn)與課堂翻轉(zhuǎn)研討
由于課程學時數(shù)少,課堂不可能講解所有知識與實踐內(nèi)容,因此,課程建設的另外一個內(nèi)容是要求學生在課后完成部分專題的實踐案例并可以自行進行擴展。在下次課程時隨機請部分學生在課堂進行實踐匯報,師生共同探討,激發(fā)學生主動學習,在實踐中提升學生對相關(guān)知識的理解和實踐能力。具體做法:將學生分成10個左右實踐小組,每組3~4人,每次上課完后要求1~2個小組在組內(nèi)協(xié)作完成指定的實踐內(nèi)容,并在下次課程時結(jié)合PPT在課堂進行實踐報告,要求全體學生共同研討。這種翻轉(zhuǎn)課堂式實踐與報告能培養(yǎng)學生自學、演講、協(xié)作能力,加強對相關(guān)知識的理解和掌握,營造課程學習氛圍和提高學習興趣[8]。
3.2.3 大數(shù)據(jù)技術(shù)與應用課程報告
課程結(jié)束后要求每位學生提交三份論文式學習報告,包括大數(shù)據(jù)技術(shù)綜述報告、專題實踐報告、綜合實踐報告。綜合實踐報告要求將機器學習算法通過TensorFlow或者Deeplearning4j框架部署到大數(shù)據(jù)相關(guān)組件,實現(xiàn)大數(shù)據(jù)技術(shù)綜合應用。專題實踐報告可以是課程相關(guān)案例與知識的擴展,也可以是參與實踐的導師科研課題。并且各實踐報告必須包含摘要、實踐目的、數(shù)據(jù)來源及形式、技術(shù)原理、編程過程、結(jié)果的可視化展示、分析評價及參考文獻等方面。通過報告可以進一步提升學生對大數(shù)據(jù)技術(shù)知識的內(nèi)化理解,實現(xiàn)學生自主化和個性化學習、實踐創(chuàng)新以及創(chuàng)業(yè)探索能力的培養(yǎng),也能培養(yǎng)學生對學術(shù)論文的寫作能力。
3.3 課程教學效果評價機制建設與實踐
由于大數(shù)據(jù)技術(shù)與應用課程在控制科學與工程及電子信息學科學生培養(yǎng)中的特殊性,其也是本學科研究生的研究方向之一,還是一門技術(shù)型課程,課程以了解大數(shù)據(jù)組件基本原理、掌握相關(guān)技術(shù)、轉(zhuǎn)變思維方式和提高實踐能力為目標[9],因此,對課程教學效果的考評不能簡單地采用出試卷考試給分的方式[10]。經(jīng)過實踐,課程采用過程式實踐成績評定的考核機制。
大數(shù)據(jù)技術(shù)與應用課程在本學科培養(yǎng)體系中屬于考查選修課,因此,采用的過程式實踐課程成績考評機制為:平時成績占40%(出勤占10%,課堂專題或綜合實踐匯報占30%),期末三篇論文式學習報告占60%(大數(shù)據(jù)技術(shù)綜述報告占10%,專題實踐報告占20%,綜合實踐報告占30%)。其中,課堂專題或綜合實踐匯報根據(jù)研討小組成員貢獻大小及講解內(nèi)容和效果依次給分,最高分30分;最終綜合實踐報告根據(jù)研討小組團隊成員自己給出的貢獻率并結(jié)合完成效果與完成情況依次給分,最高分30分。
合理且科學的評價機制是保證教學質(zhì)量的關(guān)鍵和前提[11]。大數(shù)據(jù)技術(shù)與應用課程通過綜合學生評價、教師自評、教學督導評價和教師互評的科學多元化的評價機制,得到全面的評價結(jié)果,從而提高教學質(zhì)量。其中,學生評價和教師自評通過學校研究生教務系統(tǒng)完成,教學督導評價通過院校兩級建立的教學督導評價體系完成,教師互評則更具有專業(yè)性和針對性。這樣綜合性地評價學生學習課程的達成度是合理的,是提高教學質(zhì)量的有效方式。
4 結(jié)束語
為增強大數(shù)據(jù)技術(shù)與應用課程教學效果,結(jié)合學校與電子信息學科特點,對課程教學進行基于Python語言案例實踐貫通、大數(shù)據(jù)技術(shù)原理講授為輔、機器學習模型大數(shù)據(jù)部署應用為落腳點、過程化考核機制相結(jié)合的課內(nèi)外“四位一體”的立體化改革及實踐,可以呈現(xiàn)大數(shù)據(jù)技術(shù)基本原理與技術(shù)的新發(fā)展,通過講授、課內(nèi)外實踐與過程式考評,能實現(xiàn)學生中心、教師主導的教學效果,提高師生教與學的興趣,達到課程培養(yǎng)目標,培養(yǎng)學生的綜合創(chuàng)新和研究能力。
5 參考文獻
[1] 朝樂門.數(shù)據(jù)科學的科學性與科學問題的分析[J].計算
機科學,2024,51(1):26-34.
[2] 南樹君.基于大數(shù)據(jù)技術(shù)的案例課程信息化教學實踐[J].電子技術(shù),2023,52(10):312-313.
[3] 面對面教育.美國大數(shù)據(jù)專業(yè)實力強勁的5所大學,卡
內(nèi)基梅隆大學榜上有名[EB/OL].(2023-07-03)[2024-02-03].https://baijiahao.baidu.com/s?id=1770311383232175012amp;wfr=spideramp;for=pc.
[4] 林子雨.大數(shù)據(jù)技術(shù)原理與應用[M].北京:人民郵電出版社,2020.
[5] 中國大學MOOC[EB/OL].[2024-02-03].https://www.icourse163.org//channel/2001.htm.
[6] 張寧,余揚昊,章家維,等.面向電氣工程學科的“大數(shù)據(jù)技術(shù)與應用”課程構(gòu)建與教學實踐[J].中國電機工程學報,2023,43(19):7749-7759.
[7] 楊尚東,陳蕾,陳興國,等.交互式大模型驅(qū)動的大數(shù)
據(jù)技術(shù)實踐課程教學探索[J].計算機教育,2023(11):
55-59.
[8] 李兆飛,熊興中,王小剛,等.案例結(jié)合課堂學術(shù)報告
的研究生模式識別課程改革與實踐[J].計算機時代,
2021(12):109-112.
[9] 李松,張麗平,郝曉紅,等.新工科背景下大數(shù)據(jù)技術(shù)
基礎(chǔ)課程教學方法[J].西昌學院學報(自然科學版),
2022,36(2):109-113.
[10] 周顯春,許燕龍,郭倩,等.新工科背景下《大數(shù)據(jù)技
術(shù)原理與應用》課程過程化考核的教學模式改革[J].中國新通信,2023,25(22):98-100,67.
[11] 李森林.融合課程思政的大數(shù)據(jù)技術(shù)課程立體化教學模式探討[C]//湖南省高等教育學會計算機教育專業(yè)委員會.2022年(第26屆)湖南省計算機教育年會暨學術(shù)交流會論文集.2022:6.
*項目來源:教育部高等教育司產(chǎn)學合作協(xié)同育人項目“訊飛AILAB平臺產(chǎn)學研一體化實驗室建設”(202102325054);四川輕化工大學專業(yè)學位研究生課程案例庫建設項目“大數(shù)據(jù)技術(shù)與應用案例庫建設”(AL202213);四川輕化工大學研究生課程思政建設項目“模式識別與機器學習課程思政建設”(SZ202310);四川輕化工大學教學改革研究項目“工程認證驅(qū)動的智科專業(yè)培養(yǎng)復雜工程問題能力課程群體系構(gòu)建”(JG-24064);四川輕化工大學教學改革項目“以新工科建設和專業(yè)認證為導向的生物醫(yī)學工程專業(yè)人才培養(yǎng)模式研究”(JG-2285)。
作者簡介:李兆飛、丁菊容、王小剛,博士,副教授,碩士生導師;熊興中,博士,教授,博士生導師。