張程偉
摘要:《數(shù)據(jù)分析基礎(chǔ)》課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)的一門專業(yè)基礎(chǔ)課程。本文主要介紹了浙大城市學(xué)院《數(shù)據(jù)分析基礎(chǔ)》課程的建設(shè)思路,并總結(jié)了2020年教學(xué)實(shí)踐情況。
關(guān)鍵詞:數(shù)據(jù)分析;課程建設(shè);教學(xué)實(shí)踐
一、引言
《數(shù)據(jù)分析基礎(chǔ)》是我校大數(shù)據(jù)專業(yè)的必修課程。張彩伢等[1]提到在大數(shù)據(jù)專業(yè)人才培養(yǎng)模式中要構(gòu)建多層次的實(shí)踐教學(xué)體系:基礎(chǔ)實(shí)驗(yàn)層、綜合設(shè)計(jì)層和應(yīng)用創(chuàng)新層?!稊?shù)據(jù)分析基礎(chǔ)》就是基礎(chǔ)實(shí)驗(yàn)層的實(shí)踐類課程。周黎鳴等[2]分析了工科背景下數(shù)據(jù)分析的課程設(shè)計(jì),側(cè)重于可視化的實(shí)現(xiàn),而我校數(shù)據(jù)分析課程是在理科背景下,側(cè)重于采用統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析,主要教授R語言和Python語言的數(shù)據(jù)分析編程方法。朝樂門等[3]指出數(shù)據(jù)科學(xué)課程的一大難點(diǎn)就是理論基礎(chǔ)的跨學(xué)科性,數(shù)據(jù)分析實(shí)踐就是統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)及可視化的一個(gè)重要接合點(diǎn),無論對(duì)學(xué)生的學(xué)習(xí)還是對(duì)老師的教學(xué)都充滿著挑戰(zhàn)。
我校該課程主要介紹R語言以及Python語言的編程基礎(chǔ)以及數(shù)據(jù)分析相關(guān)理論方法。該課程的教學(xué)可以讓學(xué)生熟悉數(shù)據(jù)分析相關(guān)的工具R以及Python的編程環(huán)境和編程技術(shù),同時(shí)培養(yǎng)學(xué)生能夠使用R以及Python進(jìn)行數(shù)據(jù)分析處理的能力,最終使學(xué)生掌握數(shù)據(jù)可視化以及基本數(shù)據(jù)分析的相關(guān)理論方法和具備使用R以及Python編程工具進(jìn)行編程實(shí)現(xiàn)的能力。學(xué)生通過該課程的學(xué)習(xí),提高動(dòng)過手能力和獨(dú)立思考能力,能夠更好更輕松地將后續(xù)學(xué)習(xí)中關(guān)于數(shù)據(jù)處理的理論模型知識(shí)應(yīng)用到實(shí)處。
二、浙大城市學(xué)院統(tǒng)計(jì)軟件課程教學(xué)探索歷程
《數(shù)據(jù)分析基礎(chǔ)》是數(shù)據(jù)分析工具語言類的課程,隨著計(jì)算機(jī)相關(guān)軟件的發(fā)展,浙大城市學(xué)院的相關(guān)教學(xué)也經(jīng)歷了以下幾個(gè)階段:
2008年開始面向統(tǒng)計(jì)專業(yè)開設(shè)了《實(shí)用統(tǒng)計(jì)軟件》,培養(yǎng)學(xué)生實(shí)用計(jì)算機(jī)軟件進(jìn)行統(tǒng)計(jì)建模分析的能力。課程教學(xué)內(nèi)容從使用SPSS進(jìn)行統(tǒng)計(jì)分析到使用SAS進(jìn)行統(tǒng)計(jì)分析的編程實(shí)現(xiàn),從菜單式數(shù)據(jù)分析的計(jì)算機(jī)應(yīng)用到統(tǒng)計(jì)建模的編程實(shí)現(xiàn)。
2016年開始面向統(tǒng)計(jì)專業(yè)開設(shè)《統(tǒng)計(jì)軟件基礎(chǔ)(雙語)》,為了跟上學(xué)科發(fā)展的潮流,更好地開拓學(xué)生的統(tǒng)計(jì)建模實(shí)現(xiàn)能力,課程內(nèi)容轉(zhuǎn)為使用R語言進(jìn)行統(tǒng)計(jì)建模分析。
2019年開始,我校新開設(shè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè),為了使學(xué)生在未來的學(xué)習(xí)和研究中擁有足夠的數(shù)據(jù)處理和計(jì)算編程能力,開設(shè)《數(shù)據(jù)分析基礎(chǔ)》,重點(diǎn)介紹統(tǒng)計(jì)建模的R語言以及成熟的用于數(shù)據(jù)分析的Python語言的編程基礎(chǔ)以及數(shù)據(jù)分析相關(guān)理論方法和計(jì)算機(jī)編程實(shí)現(xiàn)。
三、課程建設(shè)
本課程建設(shè)的重點(diǎn)主要放在案例的設(shè)計(jì)和課堂教學(xué)形式的優(yōu)化。
本課程作為一門新開課程,建立在歷史開設(shè)的幾門相關(guān)課程的基礎(chǔ)之上,擁有一些教學(xué)案例的積累。教學(xué)內(nèi)容包括: R編程環(huán)境的熟悉、R語言數(shù)據(jù)結(jié)構(gòu)、基本統(tǒng)計(jì)分析及繪圖的R實(shí)現(xiàn)以及Python語言的基本語法、numpy科學(xué)計(jì)算庫、pandas數(shù)據(jù)分析處理庫和利用Matplotlib庫進(jìn)行數(shù)據(jù)可視化。
數(shù)據(jù)分析基礎(chǔ)這門課程的特色在于培養(yǎng)學(xué)生熟悉使用相關(guān)計(jì)算機(jī)編程語言的同時(shí)還要熟悉數(shù)據(jù)分析的相關(guān)理論基礎(chǔ)的同時(shí),將二者結(jié)合起來,達(dá)到能夠使用R或者Python進(jìn)行具體的數(shù)據(jù)處理和分析。
改革的創(chuàng)新點(diǎn)也在于和通過大量具體的數(shù)據(jù)分析案例入手,進(jìn)行案例教學(xué),在課堂上培養(yǎng)學(xué)生能夠針對(duì)不同數(shù)據(jù)案例給出相應(yīng)的分析建模方法,然后利用計(jì)算機(jī)進(jìn)行編程實(shí)現(xiàn),而不是單純割裂地進(jìn)行R語言或者Python語言的編程教學(xué)或者是數(shù)據(jù)分析理論的教學(xué)。
教學(xué)形式上增加學(xué)生的動(dòng)手參與的機(jī)會(huì),改革課程考核的方式,注重考查教學(xué)過程中學(xué)生的參與程度與效果。課程成績的評(píng)定將包括:平時(shí)成績(考勤+作業(yè))以及期末考查,期末考查的形式以上機(jī)完成一次綜合的數(shù)據(jù)分析實(shí)訓(xùn)為主,不唯考,重過程,看成效。
作為首開課程,在未來的教學(xué)過程中,將會(huì)首先將課程體系建設(shè)完善,完善教學(xué)的內(nèi)容和教學(xué)的案例以及考核內(nèi)容。然后調(diào)研大數(shù)據(jù)專業(yè)后續(xù)專業(yè)課程任課老師的教學(xué)需要,調(diào)整優(yōu)化本課程的教學(xué)內(nèi)容,使本課程融入專業(yè)課程建設(shè)的需要,提升學(xué)生的專業(yè)能力,更好地為其在后續(xù)的專業(yè)學(xué)習(xí)和研究服務(wù)。
(一) 課程教學(xué)內(nèi)容及課時(shí)安排:
1. Python語言基礎(chǔ)(8學(xué)時(shí))
2. Numpy基礎(chǔ)(8學(xué)時(shí))
3. Pandas入門(8學(xué)時(shí))
4. Python繪圖與可視化(8學(xué)時(shí))
5. Python數(shù)據(jù)分析初步(4學(xué)時(shí))
6. R語言基礎(chǔ)知識(shí)(8學(xué)時(shí))
7. R數(shù)據(jù)結(jié)構(gòu)(8學(xué)時(shí))
8. R數(shù)據(jù)轉(zhuǎn)換(4學(xué)時(shí))
9. R數(shù)據(jù)可視化(4學(xué)時(shí))
10. R描述性統(tǒng)計(jì)分析及隨機(jī)模擬(4學(xué)時(shí))
(二)考核重點(diǎn):熟悉Python的使用環(huán)境和編程方法,能夠使用Python進(jìn)行基本的數(shù)據(jù)處理與分析任務(wù)。熟悉R語言的語法結(jié)構(gòu)與數(shù)據(jù)處理方法,能夠使用R進(jìn)行基本的數(shù)據(jù)處理與分析任務(wù)。
(三)必須掌握的基本知識(shí)點(diǎn):Python的運(yùn)行編譯環(huán)境;Python語言基礎(chǔ),序列函數(shù)的使用,循環(huán)語句以及分支控制語句的應(yīng)用;內(nèi)建的數(shù)據(jù)結(jié)構(gòu)以及函數(shù)的定義與使用;numpy多維數(shù)組及逐元素通用函數(shù);pandas數(shù)據(jù)結(jié)構(gòu)及其基本操作;數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)可視化方法;數(shù)據(jù)的分組、聚合。熟悉R中的內(nèi)容顯示;變量、向量的生成、管理與運(yùn)算;函數(shù)的定義;程序包的裝載與使用;數(shù)據(jù)的輸入、輸出與管理;矩陣、數(shù)據(jù)框的定義與管理;數(shù)據(jù)的轉(zhuǎn)換;字符串與日期類數(shù)據(jù);統(tǒng)計(jì)相關(guān)基礎(chǔ)運(yùn)用(數(shù)據(jù)匯總,描述性統(tǒng)計(jì)分析,樣本均值t檢驗(yàn),正態(tài)性檢驗(yàn)等);R繪圖及圖形控制;其他一些關(guān)于R編程的有用方法。
考核內(nèi)容為平時(shí)十二次實(shí)驗(yàn)作業(yè)每次提交,期中進(jìn)行一次Python數(shù)據(jù)分析技能的上機(jī)考核,期末進(jìn)行一次R數(shù)據(jù)分析技能的上機(jī)考核。
(四)考核的評(píng)定(評(píng)分)標(biāo)準(zhǔn):(1)課程要求學(xué)生全程參與并簽到,不得無故缺勤??记诳偡譃?0分,無故缺勤一次減2分,無故缺勤次數(shù)達(dá)到3次,取消該課程的考核資格。(2)平時(shí)作業(yè)每次滿分10分,按照解答的準(zhǔn)確性以及態(tài)度進(jìn)行評(píng)分,最后總合按30分折算加入期末總評(píng)。(3)期中及期末考核按照完成任務(wù)的質(zhì)量和數(shù)量進(jìn)行評(píng)分,各滿分100分。(4)期末總評(píng)=平時(shí)作業(yè)成績(30分)+考勤(10分)+期中考核(30%)+期末考核(30%)
四、教學(xué)實(shí)踐
以上課程體系,經(jīng)過一輪針對(duì)2019級(jí)學(xué)生的教學(xué),學(xué)生成績?nèi)缦卤硭荆簠⑴c考核的總?cè)藬?shù)為63人,及格率為97%,優(yōu)秀率為62%。
從考核結(jié)果來看,學(xué)生基本能夠掌握并運(yùn)用所學(xué)Python或者R語言進(jìn)行簡單的數(shù)據(jù)分析工作,整體表現(xiàn)較好,學(xué)生們的學(xué)習(xí)主動(dòng)性較強(qiáng),在一個(gè)學(xué)期之內(nèi)基本掌握了兩門數(shù)據(jù)分析語言,成績理想。存在的問題主要有部分同學(xué)對(duì)于數(shù)據(jù)分析應(yīng)用的上機(jī)考核形式不是很熟悉,平時(shí)缺乏練習(xí)。
參考文獻(xiàn):
[1] 張彩伢,王貴. 理科大數(shù)據(jù)專業(yè)數(shù)據(jù)分析人才培養(yǎng)模式的探究[J]. 教育現(xiàn)代化,2021,8(01):37-41.
[2] 周黎鳴,林英豪,李征,陳小潘.新工科背景下大數(shù)據(jù)專業(yè)課程建設(shè)[J].計(jì)算機(jī)時(shí)代,2021(01):102-105.
[3] 朝樂門,楊燦軍,王盛杰,趙俊鵬,許夢甜.全球數(shù)據(jù)科學(xué)課程建設(shè)現(xiàn)狀的實(shí)證分析[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2017,1(06):12-21.