馮艷紅
(河北地質(zhì)大學(xué)信息工程學(xué)院 河北·石家莊 050031)
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)是以大數(shù)據(jù)、信息技術(shù)等為依托,適應(yīng)現(xiàn)代經(jīng)濟(jì)社會發(fā)展需要的新興專業(yè)。該專業(yè)突出培養(yǎng)具有大數(shù)據(jù)分析能力的面向社會的數(shù)據(jù)分析與決策專門人才。R語言是現(xiàn)今最受歡迎的數(shù)據(jù)分析和可視化軟件之一,目前越來越多的人員在使用R來分析數(shù)據(jù),因此,《R語言程序設(shè)計(jì)》在大數(shù)據(jù)分析和科研中具有舉足輕重的作用,對于培養(yǎng)學(xué)生基于統(tǒng)計(jì)與優(yōu)化的數(shù)據(jù)分析能力大有裨益。
R語言程序設(shè)計(jì)是我校數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)大學(xué)三年級第一學(xué)期的專業(yè)核心課程,課程包含32學(xué)時(shí)的理論教學(xué)和24學(xué)時(shí)的實(shí)踐教學(xué)。主要知識點(diǎn)包括:數(shù)據(jù)集基本操作,基本數(shù)據(jù)管理,高級數(shù)據(jù)管理,數(shù)據(jù)可視化,基本統(tǒng)計(jì)分析,回歸,方差分析,時(shí)間序列,聚類分析等。
R語言是一款自由、免費(fèi)的開源軟件,其特點(diǎn)是語法簡單,所有的R函數(shù)和數(shù)據(jù)集都保存在程序包中,只要有一定的編程基礎(chǔ),就可以很容易上手,因此,教師在授課過程中的主要任務(wù)不僅僅是講授基礎(chǔ)知識,更重要的是將前沿的知識融入教學(xué),將教師的科研內(nèi)容貫穿教學(xué),將實(shí)際工程應(yīng)用匯入教學(xué),形成科研教學(xué)的深度融合。
科研能力是高校教師必須具備的能力,本科生科研能力的培養(yǎng)是高校的重要任務(wù)之一,也是我?!把錾侥剿毙律嘤?jì)劃的重要組成部分。針對我國提出的建設(shè)“創(chuàng)新型”國家的戰(zhàn)略任務(wù),本科創(chuàng)新人才培養(yǎng)不僅需要基礎(chǔ)知識學(xué)習(xí),更需要加強(qiáng)科研素質(zhì)和綜合能力的培養(yǎng)。由于本科生的思維還未受到各種理論的束縛和限制,創(chuàng)新型人才培養(yǎng)最重要的環(huán)節(jié)是本科階段的教育。
在該階段,基于學(xué)?!把錾侥剿迸嘤?jì)劃,主要分為三步走:(1)課程開始階段,邀請領(lǐng)域內(nèi)的成功人士為學(xué)生做報(bào)告,特別是與學(xué)生專業(yè)緊密相關(guān)的、有行業(yè)背景的企業(yè)精英,使學(xué)生對整個(gè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)行業(yè)有一個(gè)全面、客觀的了解。(2)教學(xué)過程中,邀請優(yōu)秀的碩士研究生或者博士研究生,介紹一些與課程相關(guān)的科學(xué)技術(shù)或者與專業(yè)相關(guān)的最新科研成果,由此激發(fā)學(xué)生的科研興趣和科研意識。同時(shí),授課教師也需要實(shí)時(shí)的把自己的科研問題引入到課堂中,引起學(xué)生對求解問題的探索與興趣,鼓勵(lì)感興趣的學(xué)生參與到自己的科研團(tuán)隊(duì)。此外,授課過程也可以邀請課程組或者其他相關(guān)學(xué)院的教師講授與R語言相關(guān)的工作,打破傳統(tǒng)教學(xué)中“一門課程由一位教師講授”的固有模式。(3)課程結(jié)束時(shí),讓學(xué)生提交一篇與課程內(nèi)容相關(guān)的小論文并在課堂上進(jìn)行介紹,由此鍛煉其信息獲取能力,創(chuàng)造能力、寫作與表述能力等。這個(gè)過程,學(xué)生首先需要確定研究問題,然后到網(wǎng)上查閱學(xué)術(shù)論文,之后要獲取數(shù)據(jù),分析數(shù)據(jù),數(shù)據(jù)的可視化,最后給出結(jié)論。
實(shí)踐教學(xué)是培養(yǎng)學(xué)生實(shí)踐動(dòng)手能力、創(chuàng)新能力以及分析判斷和決策能力,將理論與實(shí)際結(jié)合的重要環(huán)節(jié),所以,實(shí)驗(yàn)的內(nèi)容和實(shí)驗(yàn)的方式非常重要。探索并研究針對不同層次的學(xué)生,設(shè)計(jì)多種實(shí)驗(yàn)組合,包括“層次化”實(shí)驗(yàn)內(nèi)容體系,提供“菜單式”自選內(nèi)容,讓學(xué)生在自己的能力范圍內(nèi)完成各自任務(wù),不僅能起到加強(qiáng)理論知識理解的作用,還能增強(qiáng)學(xué)生的自信心,使其有成就感,從而激發(fā)學(xué)生熱情。
在該階段,一部分有能力的學(xué)生可以參與到導(dǎo)師的科研活動(dòng)中,或者學(xué)生根據(jù)自己感興趣的內(nèi)容,自己尋找研究課題,并在導(dǎo)師指導(dǎo)下進(jìn)行。《R語言程序設(shè)計(jì)》課程開設(shè)于三年級的第一學(xué)期,此時(shí)學(xué)生已經(jīng)有了專業(yè)基礎(chǔ),又逐漸增加了專業(yè)知識,因此可以開始正式進(jìn)入創(chuàng)新與科研環(huán)節(jié)。這樣一個(gè)循序漸進(jìn)的過程,使學(xué)生在畢業(yè)設(shè)計(jì)階段,能夠從事自己感興趣的研究方向,從而具有創(chuàng)新能力、實(shí)踐能力、科學(xué)素養(yǎng)和人文情懷的創(chuàng)新型人才。
課程的考核方式主要分為兩部分:課程設(shè)計(jì)及小論文撰寫部分(40%)、筆試部分(60%)。從學(xué)生最終提交的小論文來看,學(xué)生對于這種模式積極性比較高,任務(wù)布置之后,積極尋找問題,查閱資料,很多學(xué)生的研究內(nèi)容,分析方法,統(tǒng)計(jì)指標(biāo),圖形展示等都是自學(xué)完成。此外,鼓勵(lì)學(xué)生用英文撰寫科技論文,少部分學(xué)生撰寫了英文論文。此外,筆試部分的考試采用河北省大學(xué)生思政教育平臺進(jìn)行,考試題目從題庫里隨機(jī)抽題,考試方式更加公平。
在課程結(jié)束時(shí),要求學(xué)生完成一篇課程論文,基本思路是利用R語言完成數(shù)據(jù)的獲取,數(shù)據(jù)的統(tǒng)計(jì)分析,數(shù)據(jù)的可視化。在數(shù)據(jù)獲取階段,學(xué)生可以直接使用R自帶的數(shù)據(jù)集,也可以使用R語言從網(wǎng)上獲取數(shù)據(jù),部分課程論文的信息如表1所示:
表1:《R語言程序設(shè)計(jì)》課程論文信息
由表1可知:學(xué)生的科研素養(yǎng)得以提升,數(shù)據(jù)分析能力得以體現(xiàn),學(xué)生的自主學(xué)習(xí),創(chuàng)新能力得到開發(fā),所使用的數(shù)據(jù)分析方法不僅涵蓋了課堂講授的內(nèi)容,而且主動(dòng)探索未知,用以求解問題。
此外,學(xué)生積極參與到教師的科研工作中,利用R的繪圖功能,繪制部分科研圖形包括:
圖1數(shù)據(jù)來源于教師的科研項(xiàng)目,利用四種群體算法求解多維背包問題的箱線圖。圖2的星圖則以數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)的學(xué)生為研究個(gè)體,對每位學(xué)生的總體情況設(shè)計(jì)構(gòu)圖并進(jìn)行分析。圖3是對金融數(shù)據(jù)進(jìn)行分析,抓取2019年3月-2020年2月蘋果公司、英特爾公司、微軟公司的股票數(shù)據(jù)。
圖1:四種算法求解多維背包問題(MKP)箱線圖
圖2:學(xué)習(xí)成績星型圖
圖3:英特爾公司股票收盤價(jià)格波動(dòng)曲線
通過本次課程小論文的撰寫,學(xué)生不僅掌握了多種實(shí)用軟件,包括Mathtype,Endnote等,而且初步了解了科技論文寫作的規(guī)范,掌握了文獻(xiàn)檢索技術(shù)。
《R語言程序設(shè)計(jì)》課程首次在我校數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)開設(shè),作為一門程序設(shè)計(jì)語言課程,我們打破傳統(tǒng)的程序設(shè)計(jì)語言類教學(xué)方法,輕語法,重實(shí)踐。同時(shí),在授課過程中,邀請資深數(shù)據(jù)分析師為學(xué)生作報(bào)告,使學(xué)生對數(shù)據(jù)科學(xué)的相關(guān)行業(yè)有個(gè)初步認(rèn)識。在今后的教學(xué)中,擬將機(jī)器學(xué)習(xí)的相關(guān)內(nèi)容融入到課程的教學(xué)中,將科研內(nèi)容融入到課程教學(xué),激發(fā)學(xué)生應(yīng)用R語言求解實(shí)際問題的熱情,使學(xué)生能夠在未來的學(xué)習(xí)以及工作中,能夠應(yīng)用R語言進(jìn)行高效的數(shù)據(jù)分析。