宋明麗
摘? ? 要:文章從數(shù)據(jù)分析實(shí)驗(yàn)課程設(shè)置的必要性出發(fā),針對(duì)當(dāng)前數(shù)據(jù)分析實(shí)驗(yàn)課程現(xiàn)狀,分析數(shù)據(jù)分析實(shí)驗(yàn)教學(xué)存在的問(wèn)題,提出了基于成果展示(Poster)的數(shù)據(jù)分析實(shí)驗(yàn)課程改革策略。
關(guān)鍵詞:數(shù)據(jù)分析;實(shí)驗(yàn)課程;成果展示;課程改革
中圖分類號(hào):G642.3? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ?文章編號(hào):1002-4107(2020)04-0035-02
數(shù)據(jù)爆炸與信息高速發(fā)展時(shí)代,計(jì)算機(jī)學(xué)科面臨的一個(gè)重要問(wèn)題就是如何從海量的、結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)中挖掘出人類需要的知識(shí),這些知識(shí)用以幫助人們做出合理的決策。數(shù)據(jù)分析這門課正是繼概率與數(shù)理統(tǒng)計(jì)等課程之后,數(shù)據(jù)挖掘課程等深度分析之前的基本的數(shù)據(jù)處理與分析的課程[1-2]。數(shù)據(jù)分析理論課程的主要目標(biāo)是使學(xué)生學(xué)會(huì)如何收集數(shù)據(jù),預(yù)處理數(shù)據(jù),處理數(shù)據(jù),獲取知識(shí)。數(shù)據(jù)分析課程理論性比較強(qiáng),統(tǒng)計(jì)學(xué)知識(shí)占據(jù)很大比例,學(xué)生學(xué)起來(lái)比較吃力。因此,課程一般設(shè)有實(shí)踐環(huán)節(jié)(實(shí)驗(yàn)課),使學(xué)生能夠?qū)W以致用,更好地理解理論知識(shí)。然而,同傳統(tǒng)的實(shí)驗(yàn)課一樣,數(shù)據(jù)分析實(shí)驗(yàn)課程不可避免地遇到了一些教學(xué)上的問(wèn)題,如實(shí)驗(yàn)步驟按部就班、學(xué)生積極性不高等。
通過(guò)幾年的對(duì)數(shù)據(jù)分析理論課與實(shí)驗(yàn)課的教學(xué)研究,筆者總結(jié)了現(xiàn)有實(shí)驗(yàn)課教學(xué)存在的不足,提出了基于成果展示,即Poster(海報(bào))的實(shí)驗(yàn)課程改革研究方案。
一、數(shù)據(jù)分析實(shí)驗(yàn)課程設(shè)置的必要性
數(shù)據(jù)分析這門課程既包含了一些常用的高級(jí)的統(tǒng)計(jì)學(xué)方法,又囊括了一些基本的簡(jiǎn)單的數(shù)據(jù)挖掘的方法。數(shù)據(jù)分析與經(jīng)濟(jì)學(xué)、管理學(xué)、醫(yī)學(xué)、天文學(xué)、生物學(xué)、工學(xué)、社會(huì)學(xué)等其他學(xué)科緊密相連。隨著網(wǎng)絡(luò)的迅速發(fā)展,來(lái)自網(wǎng)絡(luò)上的數(shù)據(jù)量大大增加,社會(huì)迫切需要具有數(shù)據(jù)分析能力與經(jīng)驗(yàn)的人才。中國(guó)傳媒大學(xué)自2015年開(kāi)設(shè)大數(shù)據(jù)專業(yè)至今,開(kāi)設(shè)了數(shù)據(jù)分析等相關(guān)課程。通過(guò)這幾年的教學(xué)探索,筆者總結(jié)了一點(diǎn)心得體會(huì)。數(shù)據(jù)分析理論課程必須講解經(jīng)典常用的理論與方法,這些方法大多需要公式的推導(dǎo),比較枯燥。而數(shù)據(jù)分析的實(shí)驗(yàn)課程需要應(yīng)用各學(xué)科的實(shí)際數(shù)據(jù)進(jìn)行編程分析,讓學(xué)生真正體會(huì)到數(shù)據(jù)分析理論的作用,這樣才能使學(xué)生具備一定的數(shù)據(jù)分析能力,畢業(yè)后可以直接面對(duì)工作中的問(wèn)題。
(一)有助于培養(yǎng)大學(xué)生的科研素質(zhì)
數(shù)據(jù)分析實(shí)驗(yàn)課程是將數(shù)據(jù)分析理論應(yīng)用于實(shí)踐的一門課程。毫不夸張地說(shuō),如果沒(méi)有實(shí)驗(yàn)課程,學(xué)生就不能真正地理解數(shù)據(jù)分析的方法,就不能很好地從事未來(lái)的數(shù)據(jù)相關(guān)的工作。通過(guò)實(shí)驗(yàn)課程,學(xué)生可以提高兩方面的能力:(1)發(fā)現(xiàn)問(wèn)題的能力;(2)恰當(dāng)運(yùn)用理論方法解決實(shí)際問(wèn)題的能力。在實(shí)驗(yàn)當(dāng)中,通過(guò)數(shù)據(jù)采集,數(shù)據(jù)整理,數(shù)據(jù)分析等過(guò)程,培養(yǎng)學(xué)生一絲不茍的嚴(yán)謹(jǐn)?shù)目茖W(xué)精神。
(二)有利于培養(yǎng)學(xué)生的實(shí)踐能力
數(shù)據(jù)分析的實(shí)踐必須依附于統(tǒng)計(jì)軟件與工具箱,如Excel, SPSS, SAS, Matlab,等。這些軟件雖然不難,但也需要從頭學(xué)起,而且要想熟練掌握一個(gè)軟件或語(yǔ)言,必須反復(fù)練習(xí)。數(shù)據(jù)分析實(shí)驗(yàn)課程不僅讓學(xué)生學(xué)會(huì)了運(yùn)用數(shù)據(jù)分析理論的同時(shí),也鍛煉了學(xué)生學(xué)習(xí)與應(yīng)用軟件的能力。
時(shí)代需要數(shù)據(jù)分析的人才。計(jì)算機(jī)的出現(xiàn),網(wǎng)絡(luò)的發(fā)展,使得當(dāng)今社會(huì)的數(shù)據(jù)量呈爆炸式增長(zhǎng),如經(jīng)濟(jì)領(lǐng)域、金融領(lǐng)域、人口統(tǒng)計(jì)、醫(yī)學(xué)領(lǐng)域和社會(huì)學(xué)等民生領(lǐng)域。怎樣從這些龐大的數(shù)據(jù)當(dāng)中選取我們需要的信息一直是科學(xué)家努力探索的事情。作為一名大學(xué)生,不僅需要掌握統(tǒng)計(jì)與挖掘的基礎(chǔ)理論知識(shí),還需要通過(guò)數(shù)據(jù)分析實(shí)驗(yàn)課鍛煉理論與實(shí)際相結(jié)合的能力。
二、數(shù)據(jù)分析實(shí)驗(yàn)課程現(xiàn)狀分析
數(shù)據(jù)分析實(shí)驗(yàn)課程不同于其他的計(jì)算機(jī)類實(shí)驗(yàn)課程。如C語(yǔ)言的實(shí)驗(yàn)課,教師布置一項(xiàng)題目,學(xué)生自行編碼,實(shí)驗(yàn)過(guò)程中教師的主要任務(wù)是幫助學(xué)生找出編碼中的錯(cuò)誤。數(shù)據(jù)分析的實(shí)驗(yàn)課程一般由教師給定一個(gè)題目,學(xué)生進(jìn)行數(shù)據(jù)收集,預(yù)處理,數(shù)據(jù)分析,最終獲得結(jié)論。這其中的每一個(gè)環(huán)節(jié)都可能產(chǎn)生學(xué)生解決不了的問(wèn)題,因此,實(shí)驗(yàn)課程應(yīng)采取小班制,或者輔以研究生助手。如題目為采用matlab軟件進(jìn)行判別分析蠓蟲問(wèn)題[3]。數(shù)據(jù)收集:是直接在matlab中輸入還是由其他文件導(dǎo)入?如果是輸入數(shù)據(jù),必須確定在輸入無(wú)誤的情況下才可以進(jìn)行下一步,否則出錯(cuò)。數(shù)據(jù)預(yù)處理:數(shù)據(jù)本身是否需要?dú)w一化?歸一化與不歸一化的結(jié)果有何區(qū)別?數(shù)據(jù)分析:到底是采用總體協(xié)方差矩陣相同還是不相同的方法進(jìn)行判別?不同的方法產(chǎn)生的結(jié)果是否相同?該如何解釋每一種方法下的結(jié)果?獲取知識(shí):如果不同方法的結(jié)論不一致,該怎樣抉擇?不同的數(shù)據(jù)是否應(yīng)考慮不同的方法?這些都是在實(shí)驗(yàn)過(guò)程中學(xué)生可能碰到的問(wèn)題。通過(guò)對(duì)這些問(wèn)題的思考與解答,學(xué)生了解到數(shù)據(jù)分析理論與應(yīng)用的緊密性。
數(shù)據(jù)分析實(shí)驗(yàn)課可選的軟件很多,如SPSS[4], SAS, Matlab, 等等。本人選用了SPSS與Matlab兩種。SPSS是經(jīng)典的統(tǒng)計(jì)分析軟件,它具有大量成熟的統(tǒng)計(jì)分析方法,完善的數(shù)據(jù)定義操作管理,開(kāi)放的數(shù)據(jù)接口以及靈活的統(tǒng)計(jì)表格與圖形,很多著名公司都采用這個(gè)軟件,掌握SPSS使學(xué)生能夠更從容地面對(duì)未來(lái)的工作。Matlab是基于C的一個(gè)高級(jí)編程工具,它是一套高性能的數(shù)值計(jì)算和可視化的軟件,集矩陣計(jì)算、數(shù)值分析、信號(hào)處理和圖形顯示于一體,軟件本身有很多內(nèi)置函數(shù)可以直接調(diào)用,也可以方便編寫自己想要的程序代碼,對(duì)于研究型的題目比較適合。采用這兩個(gè)軟件既可以使學(xué)生能夠應(yīng)對(duì)未來(lái)的就業(yè)問(wèn)題,也可以提高他們的科研水平,為研究生階段的學(xué)習(xí)打下基礎(chǔ)。
三、數(shù)據(jù)分析實(shí)驗(yàn)課程存在的問(wèn)題
目前有很多優(yōu)秀的數(shù)據(jù)分析軟件,可以為數(shù)據(jù)分析的實(shí)驗(yàn)提供準(zhǔn)確快速的答案,盡管如此,數(shù)據(jù)分析的實(shí)踐課程還是具有一定的問(wèn)題與困難[5-6]。
(一)理論知識(shí)與實(shí)際問(wèn)題結(jié)合困難
學(xué)生在數(shù)據(jù)分析理論課程上學(xué)到很多公式定理,怎樣應(yīng)用于實(shí)際問(wèn)題中是首要問(wèn)題。一般數(shù)據(jù)分析的實(shí)驗(yàn)題目通常都是教師提出,用給定的方法解決某一個(gè)問(wèn)題。而實(shí)際問(wèn)題需要學(xué)生自己面對(duì)并提出解決方案。比如,醫(yī)學(xué)上,有一種病癥X是一種常見(jiàn)疾病,目前有5種藥物可以對(duì)其進(jìn)行治療,不同的藥物對(duì)不同的病人有不同的療效,新入職的醫(yī)生不具備依據(jù)一定的經(jīng)驗(yàn)來(lái)判斷的能力,怎樣訓(xùn)練一個(gè)決策支持系統(tǒng)是可以利用歷史數(shù)據(jù)分析得到的。因此,理論與實(shí)際問(wèn)題之間的關(guān)系是需要在實(shí)驗(yàn)課上把握好的。
(二)實(shí)驗(yàn)結(jié)果難以解釋
數(shù)據(jù)分析面臨的數(shù)據(jù)多種多樣,很多學(xué)生由于預(yù)處理方法不同,采用的分析方法也不同,導(dǎo)致結(jié)果可能與給定的結(jié)果不一樣,甚至相反。這就需要我們探究每一種方法的理論依據(jù)。由結(jié)果解釋原因本身就是一個(gè)數(shù)據(jù)分析的過(guò)程,也是提高學(xué)生能力的一個(gè)過(guò)程。
(三)教學(xué)形式單一
一般的實(shí)驗(yàn)課程包括以下環(huán)節(jié):教師給出題目,學(xué)生根據(jù)問(wèn)題選取方法解決,給出報(bào)告,教師進(jìn)行批改講解等。許多計(jì)算機(jī)類的課程均采取這樣的形式。這種傳統(tǒng)的課程環(huán)節(jié)對(duì)學(xué)生來(lái)說(shuō)比較沉悶,他們覺(jué)得沒(méi)有成就感,大大削弱了他們的積極性。每次實(shí)驗(yàn)都采取相同的流程,學(xué)生一般屬于應(yīng)付式的思想,沒(méi)有探索精神。
四、數(shù)據(jù)分析實(shí)驗(yàn)課程改革策略
針對(duì)以上討論的數(shù)據(jù)分析實(shí)驗(yàn)課程的現(xiàn)狀與問(wèn)題,筆者總結(jié)出幾點(diǎn)改革建議。
1.每個(gè)題目的考核辦法除了報(bào)告之外,最主要是繪出一個(gè)Poster,即海報(bào)。Poster是報(bào)告的主要內(nèi)容的精煉,將所有重要的結(jié)論展示在一張紙上,有圖有表,有分析。讓學(xué)生以合適的大小打印出來(lái),答辯時(shí)展出Poster進(jìn)行本題目的講解。這種能看得到成果的方法既可以提高學(xué)生的自信,也可以增加趣味性,提高學(xué)生參與的積極性。通過(guò)講解與Poster的結(jié)合,其他學(xué)生一下可以比較出自己的優(yōu)勢(shì)與不足,在以后的實(shí)驗(yàn)課中予以改進(jìn)。Poster一般是會(huì)議的一項(xiàng)內(nèi)容,主要陳述參會(huì)者的主要貢獻(xiàn),在這里采用這樣的方法亦可以讓學(xué)生提前演練參與會(huì)議的流程。
2.在理論課的講解中,每一個(gè)算法后面都加入該算法的實(shí)際應(yīng)用問(wèn)題,如本算法的局限性是什么,優(yōu)勢(shì)是什么,在解決什么問(wèn)題時(shí)比較有效。這樣,在實(shí)驗(yàn)課中,教師提出問(wèn)題之后,讓學(xué)生迅速回想都有哪些方法可以解決這個(gè)問(wèn)題。在討論確定了可選用的方法之后再進(jìn)行實(shí)驗(yàn)操作,這樣從源頭避免了一些問(wèn)題的產(chǎn)生。
3.實(shí)驗(yàn)過(guò)程中將學(xué)生分組進(jìn)行討論。學(xué)生2—3人一組,編程時(shí)自己獨(dú)立實(shí)現(xiàn),結(jié)果運(yùn)行成功之后討論結(jié)果的有效性與正確性,最后由教師講解。讓學(xué)生先討論的辦法可以節(jié)省教師逐一解答的時(shí)間,提高課堂效率,也促進(jìn)了學(xué)生之間的相互交流,培養(yǎng)團(tuán)隊(duì)意識(shí)。
科學(xué)的進(jìn)步與發(fā)展,不僅要求大學(xué)生不斷提高自身的能力,同樣要求教師提高教學(xué)質(zhì)量。作為計(jì)算機(jī)相關(guān)專業(yè)的核心課程,數(shù)據(jù)分析的作用是至關(guān)重要的,而數(shù)據(jù)分析實(shí)驗(yàn)課程是數(shù)據(jù)分析課程重要的組成部分,怎樣上好實(shí)驗(yàn)課程是筆者一直學(xué)習(xí)探索的問(wèn)題。本文通過(guò)分析數(shù)據(jù)分析實(shí)驗(yàn)課程的現(xiàn)狀與問(wèn)題,提出了幾點(diǎn)建議,并運(yùn)用于實(shí)際授課過(guò)程,取得了不錯(cuò)的效果。當(dāng)今社會(huì),信息技術(shù)人才與統(tǒng)計(jì)應(yīng)用人才排名位列就業(yè)需求榜的前列,具有統(tǒng)計(jì)知識(shí)與計(jì)算機(jī)知識(shí)的復(fù)合型應(yīng)用人才在未來(lái)具有巨大的發(fā)展?jié)摿?。因此,學(xué)好數(shù)據(jù)分析理論課與實(shí)驗(yàn)課等相關(guān)的課程對(duì)當(dāng)代大學(xué)生的未來(lái)發(fā)展具有重要意義。
參考文獻(xiàn):
[1]趙衛(wèi)東,趙洪博.基于項(xiàng)目沉浸式的數(shù)據(jù)分析類課程教學(xué)研究[J].計(jì)算機(jī)教育,2017,(6).
[2]張蕾,魏立斐.大數(shù)據(jù)時(shí)代下“數(shù)據(jù)分析”課程的探索[J].教育教學(xué)論壇,2015,(25).
[3]吳禮斌,李伯年.MATLAB數(shù)據(jù)分析方法:第2版[M].北京:機(jī)械工業(yè)出版社,2017:115.
[4]薛薇.基于SPSS的數(shù)據(jù)分析方法:第3版[M].北京:中國(guó)人民大學(xué)出版社,2016:1.
[5]張慧.信息管理專業(yè)數(shù)據(jù)分析課程實(shí)驗(yàn)教學(xué)研究[J].計(jì)算機(jī)時(shí)代,2015,(10).
[6]李玉峰,汪潔明,賀玲,等.實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)分析教學(xué)的緊要性[J].當(dāng)代教育理論與實(shí)踐,2016,(5).