周峰 章蓀
關(guān)鍵詞:數(shù)據(jù)挖掘;課程設(shè)計(jì);Sklearn;PyTorch;深度學(xué)習(xí)
0引言
隨著科學(xué)技術(shù)的發(fā)展,人類社會(huì)已經(jīng)步入信息時(shí)代。日常生活中,人們大量地使用智能手機(jī)、電腦、平板電腦等信息化產(chǎn)品進(jìn)行購(gòu)物、社交、娛樂(lè)等活動(dòng),從而產(chǎn)生了大量的數(shù)據(jù)。據(jù)不完全統(tǒng)計(jì),僅經(jīng)過(guò)11年,全球數(shù)據(jù)量已由2009年的0.8ZB增長(zhǎng)到2020年的60ZB。得益于互聯(lián)網(wǎng)、云計(jì)算等技術(shù)的快速發(fā)展,這個(gè)數(shù)據(jù)量還在以指數(shù)級(jí)增長(zhǎng),預(yù)計(jì)2035年的全球數(shù)據(jù)量可達(dá)到2142ZB[1]。近期興起的數(shù)據(jù)分析等科學(xué)方法,使得能夠精準(zhǔn)分析這些大數(shù)據(jù),這對(duì)于改善人們生活、生產(chǎn)具有重要的意義。
大數(shù)據(jù)具有體量大、表現(xiàn)形式多樣、價(jià)值高等特點(diǎn)。雖然大數(shù)據(jù)能夠提供有價(jià)值的信息,但是體量大、表現(xiàn)形式多樣的特點(diǎn)也導(dǎo)致提取該信息的難度較高。此時(shí),數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,它旨在利用統(tǒng)計(jì)學(xué)、模式識(shí)別、數(shù)據(jù)庫(kù)技術(shù)、高性能計(jì)算等學(xué)科知識(shí)對(duì)大數(shù)據(jù)進(jìn)行分析,提取有價(jià)值的信息。該技術(shù)已經(jīng)被廣泛應(yīng)用于醫(yī)學(xué)、軍事、管理等多種領(lǐng)域[2]。因此,各行各業(yè)對(duì)能夠熟練掌握數(shù)據(jù)挖掘技術(shù)的人才需求越來(lái)越大。為了適應(yīng)社會(huì)生產(chǎn)、發(fā)展的需要,國(guó)內(nèi)各高校的計(jì)算機(jī)類專業(yè)都為本科生開(kāi)設(shè)了數(shù)據(jù)挖掘課程,讓學(xué)生能夠擁有分析大數(shù)據(jù)的能力。
1數(shù)據(jù)挖掘課程難點(diǎn)分析
數(shù)據(jù)挖掘是信息時(shí)代下的產(chǎn)物,為人們分析和利用大數(shù)據(jù)提供了技術(shù)支持。高校的多數(shù)專業(yè),包括計(jì)算機(jī)類和非計(jì)算機(jī)類(例如經(jīng)濟(jì)類)為本科生開(kāi)設(shè)了數(shù)據(jù)挖掘課程。但是由于該課程交叉了大量不同學(xué)科的內(nèi)容,增加了教學(xué)難度[3]。具體而言,目前存在的教學(xué)難題如下。
1.1課程的基礎(chǔ)知識(shí)要求高
如上所述,數(shù)據(jù)挖掘課程涉及統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)等多個(gè)學(xué)科的知識(shí),因此要求學(xué)生在學(xué)習(xí)該課程前已經(jīng)掌握這些基礎(chǔ)知識(shí)。不僅如此,學(xué)生還需要能夠在學(xué)習(xí)過(guò)程中靈活地綜合運(yùn)用這些知識(shí)。但是目前的教學(xué)體系還不夠完善,這些前置課程和數(shù)據(jù)挖掘課程無(wú)法很好地銜接。與此同時(shí),通過(guò)實(shí)際教學(xué)發(fā)現(xiàn)學(xué)生對(duì)這些前置課程掌握程度不一,導(dǎo)致如何針對(duì)不同基礎(chǔ)的學(xué)生設(shè)計(jì)合理的數(shù)據(jù)挖掘課程教學(xué)過(guò)程存在難度[4]。例如,支持向量機(jī)算法中需要經(jīng)常用到拉格朗日算子,這要求學(xué)生能熟練運(yùn)用高數(shù)知識(shí);程序設(shè)計(jì)的掌握程度好壞也會(huì)直接影響學(xué)生在數(shù)據(jù)挖掘算法編程過(guò)程中的進(jìn)度。
1.2課程與社會(huì)實(shí)際需求脫節(jié)
數(shù)據(jù)挖掘課程包含的諸如決策樹、支持向量機(jī)、k均值聚類等傳統(tǒng)算法,已經(jīng)無(wú)法應(yīng)對(duì)當(dāng)今復(fù)雜的數(shù)據(jù)環(huán)境。近期涌現(xiàn)的大量深度學(xué)習(xí)方法,已經(jīng)在數(shù)據(jù)挖掘算法中占據(jù)了主導(dǎo)地位。但是目前高校開(kāi)設(shè)的數(shù)據(jù)挖掘課程大多數(shù)沒(méi)有囊括最新的深度學(xué)習(xí)方法。此外,互聯(lián)網(wǎng)公司在招聘時(shí),會(huì)傾向于錄用掌握最新深度學(xué)習(xí)方法的畢業(yè)生,這使得只掌握傳統(tǒng)數(shù)據(jù)挖掘算法的學(xué)生競(jìng)爭(zhēng)力不足。除了教授的數(shù)據(jù)挖掘算法本身,與社會(huì)需求脫節(jié)的還有課程中所使用的數(shù)據(jù)。課程教材中提供的數(shù)據(jù)大多不包含任何噪聲且特征維度較小,這與實(shí)際社會(huì)生產(chǎn)時(shí)處理的數(shù)據(jù)大相徑庭。真實(shí)世界中的數(shù)據(jù)大都包含多種形式的噪聲且特征維度高,這使得只接受了課本知識(shí)教育的學(xué)生在應(yīng)對(duì)真實(shí)數(shù)據(jù)時(shí)手足無(wú)措。
1.3課程的實(shí)踐內(nèi)容不足
通過(guò)實(shí)際教學(xué)發(fā)現(xiàn),大部分教材沒(méi)有包含實(shí)踐部分,只有理論知識(shí)。有一些基于Python編程語(yǔ)言的數(shù)據(jù)挖掘教材,也很難把算法的完整過(guò)程講清楚。數(shù)據(jù)挖掘課程的本質(zhì)是教學(xué)生在面對(duì)不同的數(shù)據(jù)時(shí),如何選擇合適的算法提取有用的信息。因此,該課程的核心應(yīng)該是實(shí)踐部分,理論只作為實(shí)踐的支撐。尤其是計(jì)算機(jī)類專業(yè)的本科生,他們更應(yīng)該具備較強(qiáng)的實(shí)踐動(dòng)手能力。正如上一節(jié)所述,目前數(shù)據(jù)挖掘教材中的算法過(guò)于陳舊,且使用的數(shù)據(jù)比較干凈。所以,即使這些教材有實(shí)驗(yàn)內(nèi)容,也很難培養(yǎng)學(xué)生的實(shí)踐能力。
1.4課程思政融入生硬
在新工科背景下,如何保證學(xué)生在掌握專業(yè)知識(shí)的同時(shí),能夠具有較高的思想政治素質(zhì),堅(jiān)定準(zhǔn)確的政治立場(chǎng),具備使命責(zé)任感,是教師完成立德樹人任務(wù)的重要體現(xiàn)。但是,很多工科專業(yè)課程在實(shí)現(xiàn)課程思政的時(shí)候出現(xiàn)“邊緣化”問(wèn)題。很多教師認(rèn)為工科專業(yè)與文科專業(yè)不同,很難找到合適的切入點(diǎn),只能對(duì)思政內(nèi)容生搬硬套,導(dǎo)致學(xué)生很難意識(shí)到課程思政的重要性。
1.5課程考核方式單一
目前數(shù)據(jù)挖掘課程的考核方式仍然以閉卷考試為主,單一地將閉卷考試成績(jī)作為學(xué)生的最終課程成績(jī)。這種方式很難考查學(xué)生的學(xué)習(xí)過(guò)程以及實(shí)踐能力。經(jīng)過(guò)實(shí)際教學(xué)發(fā)現(xiàn),不同學(xué)生的學(xué)習(xí)情況差異較大,一部分學(xué)生擅長(zhǎng)理論考試,而另一部分學(xué)生對(duì)實(shí)現(xiàn)數(shù)據(jù)挖掘算法較為得心應(yīng)手。所以只使用閉卷考試作為考查手段,對(duì)學(xué)生來(lái)說(shuō)是不公平的。教師應(yīng)該充分考慮學(xué)生在理論和實(shí)踐兩方面的掌握差異,綜合設(shè)計(jì)考核方式。
2數(shù)據(jù)挖掘課程設(shè)計(jì)研究
針對(duì)數(shù)據(jù)挖掘課程教學(xué)中存在的難題,可以對(duì)傳統(tǒng)的教學(xué)模式進(jìn)行改進(jìn),提出更加專業(yè)的課堂教學(xué)。具體而言,可以研究如何使用開(kāi)源的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)開(kāi)發(fā)工具Sklearn和PyTorch進(jìn)行課程設(shè)計(jì)。
2.1開(kāi)源框架Sklearn和PyTorch
Sklearn是一個(gè)基于Python語(yǔ)言的機(jī)器學(xué)習(xí)開(kāi)發(fā)工具,全稱為Scikit-learn。該工具的基礎(chǔ)為同樣基于Python語(yǔ)言的四種開(kāi)源庫(kù)Numpy、Scipy、Pandas以及Matplotlib。這個(gè)庫(kù)包含了數(shù)據(jù)預(yù)處理、分類、聚類、回歸等算法的實(shí)現(xiàn)。僅使用Sklearn,就可以完成幾乎整個(gè)數(shù)據(jù)挖掘過(guò)程。Sklearn可以直接從官網(wǎng)https://scikit-learn.org/stable/免費(fèi)下載,并安裝在個(gè)人計(jì)算機(jī)上。
PyTorch框架是由知名的互聯(lián)網(wǎng)公司Facebook研發(fā)的一款基于Python的開(kāi)源深度學(xué)習(xí)工具。該工具相關(guān)的論文發(fā)表在2019年的國(guó)際頂級(jí)人工智能會(huì)議AdvancesInNeuralInformationProcessingSystems上。PyTorch有著很強(qiáng)的兼容性,目前支持Mac、Linux以及Windows三種操作系統(tǒng)。相比其他深度學(xué)習(xí)框架,例如TensorFlow、MXNet以及Caffe、PyTorch的函數(shù)封裝程度高,代碼易于理解,入門較快。學(xué)生只需要掌握基本的深度學(xué)習(xí)知識(shí),就可以熟練地使用PyTorch進(jìn)行編程。
2.2降低課程門檻
由于前面提到的數(shù)據(jù)挖掘課程涵蓋的學(xué)科內(nèi)容較廣,所以必須設(shè)計(jì)難度適中的教學(xué)內(nèi)容,才能讓學(xué)生接受。要做到這點(diǎn),必須從課前、課中、課后三個(gè)方面入手。在開(kāi)始課程前,教師要明確課程的核心內(nèi)容,即數(shù)據(jù)挖掘算法的實(shí)踐。數(shù)據(jù)挖掘?qū)嶋H包含數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)挖掘等多個(gè)步驟,囊括了從數(shù)據(jù)源開(kāi)始的一系列挖掘信息的過(guò)程。但對(duì)于學(xué)生來(lái)說(shuō),更重要的應(yīng)該是掌握多種數(shù)據(jù)挖掘算法。所以,在整個(gè)教學(xué)過(guò)程中,可以簡(jiǎn)化其他步驟的講授。在實(shí)驗(yàn)環(huán)節(jié),可以使用Sklearn的函數(shù)直接對(duì)原始數(shù)據(jù)進(jìn)行簡(jiǎn)單的加工處理,得到需要的數(shù)據(jù)形式。如果是圖片類型的數(shù)據(jù),可以使用PyTorch的圖像預(yù)處理函數(shù)進(jìn)行加工。與此同時(shí),由于上課時(shí)間有限,教師不應(yīng)該利用太多時(shí)間復(fù)習(xí)前置課程知識(shí)。教師應(yīng)該在課前將本節(jié)課會(huì)涉及到的基礎(chǔ)知識(shí)告知學(xué)生,讓學(xué)生能夠提前對(duì)這些內(nèi)容進(jìn)行回顧。例如,課程實(shí)驗(yàn)過(guò)程中需要經(jīng)常用到Sklearn和PyTorch這兩個(gè)庫(kù),可以找一些Py?thon基礎(chǔ)語(yǔ)法講解的資料發(fā)給學(xué)生。此外,教師也需要將本節(jié)課要介紹的數(shù)據(jù)挖掘算法的產(chǎn)生背景、算法思想以及在生活中的應(yīng)用等內(nèi)容以PPT的形式發(fā)放給學(xué)生,讓學(xué)生能夠?qū)ι险n內(nèi)容有一個(gè)初步的了解,避免課上跟不上教師的節(jié)奏。最后,應(yīng)該讓學(xué)生在課前將本節(jié)課可能產(chǎn)生的疑難問(wèn)題整理好,統(tǒng)一告知教師。
在課堂上,教師應(yīng)該首先對(duì)課前學(xué)生的疑難問(wèn)題進(jìn)行匯總和解答,不能讓學(xué)生帶著疑惑上課。講授數(shù)據(jù)挖掘算法時(shí),應(yīng)該以解釋思路為主,而不是注重公式的每一步推導(dǎo)。課件應(yīng)該以動(dòng)畫或者圖片形式為主,取代傳統(tǒng)的公式和文字,這樣可以調(diào)動(dòng)學(xué)生的學(xué)習(xí)熱情和興趣[5]。課中還應(yīng)該注意和學(xué)生的互動(dòng)交流,必須時(shí)刻了解學(xué)生的需求和困難。通過(guò)課堂提問(wèn),側(cè)面了解教師在講課時(shí)的一些問(wèn)題,可以將沒(méi)有講透徹的地方重新帶著學(xué)生梳理一遍。除了課堂提問(wèn),還可以讓學(xué)生組成小組,對(duì)課堂上介紹的特定數(shù)據(jù)挖掘算法如何應(yīng)用于生活中進(jìn)行討論,讓學(xué)生能夠?qū)⒄n本上的知識(shí)轉(zhuǎn)換到生活實(shí)踐中去。
在課后,教師可以布置一些大作業(yè),比如如何使用數(shù)據(jù)挖掘算法對(duì)課堂學(xué)生積極性進(jìn)行定量的監(jiān)測(cè)。讓學(xué)生組成小組,一起查找資料、提出解決方案以及編程實(shí)踐,最終以PPT的形式展示小組提出的方案。教師可以另找時(shí)間,讓小組進(jìn)行匯報(bào)。匯報(bào)主要以講解思路為主,教師也可以對(duì)學(xué)生的解決方案中存在的問(wèn)題和不足提出建議。這樣的課后作業(yè)形式,可以讓學(xué)生更深入地理解數(shù)據(jù)挖掘算法,教師也可以對(duì)學(xué)生進(jìn)行打分評(píng)價(jià),計(jì)入最后的總評(píng)成績(jī)。
2.3引入最新的深度學(xué)習(xí)方法
目前,深度學(xué)習(xí)方法已經(jīng)從傳統(tǒng)的數(shù)據(jù)挖掘算法中脫穎而出。得益于它出色的性能和簡(jiǎn)單的實(shí)現(xiàn)過(guò)程,現(xiàn)在已經(jīng)被廣泛用于各行各業(yè),例如精準(zhǔn)農(nóng)業(yè)、軍事、城市規(guī)劃以及環(huán)境監(jiān)測(cè)等。在今后的就業(yè)環(huán)境中,各大互聯(lián)網(wǎng)企業(yè)會(huì)希望應(yīng)聘的畢業(yè)生能夠掌握深度學(xué)習(xí)方法,而不是僅僅了解一些諸如支持向量機(jī)的傳統(tǒng)數(shù)據(jù)挖掘算法。為了提升學(xué)生畢業(yè)后的就業(yè)競(jìng)爭(zhēng)力,教師應(yīng)該與時(shí)俱進(jìn),不能局限于教材中的算法,應(yīng)當(dāng)適時(shí)地引入最新的深度學(xué)習(xí)方法。同時(shí),教師可以不用講授過(guò)于陳舊的數(shù)據(jù)挖掘算法。經(jīng)過(guò)教學(xué)發(fā)現(xiàn),數(shù)據(jù)挖掘教材中大都包含關(guān)聯(lián)分析、分類、聚類三種數(shù)據(jù)挖掘算法。深度學(xué)習(xí)方法在實(shí)際應(yīng)用中可能更多地關(guān)注分類,所以教師可以適當(dāng)?shù)卦黾臃诸愃惴ㄔ谡麄€(gè)課程中的比重,減少其他章節(jié)的內(nèi)容。
教師更應(yīng)該將科研與教學(xué)結(jié)合,把與數(shù)據(jù)挖掘領(lǐng)域相關(guān)的最新中英文論文講解給學(xué)生聽(tīng),讓學(xué)生了解前沿的科學(xué)方法。學(xué)生在了解了這些世界前沿技術(shù)可以為生活帶來(lái)的好處后,也能調(diào)動(dòng)學(xué)習(xí)積極性,培養(yǎng)興趣。教師可以在課后讓學(xué)生分組,每個(gè)小組分配一篇論文,要求小組成員閱讀并嘗試?yán)斫庹撐闹械姆椒?,并在下次課上以PPT的形式,講解給全班同學(xué)聽(tīng)。
2.4加強(qiáng)實(shí)踐環(huán)節(jié)
大部分?jǐn)?shù)據(jù)挖掘課程的核心都是介紹課本上的數(shù)據(jù)挖掘算法,實(shí)驗(yàn)內(nèi)容缺失。即使有些課本里面有基于Python的數(shù)據(jù)挖掘算法,但是大都代碼過(guò)長(zhǎng)且可讀性較差,學(xué)生很難對(duì)這樣的代碼感興趣。所以,在增加實(shí)驗(yàn)內(nèi)容的同時(shí),必須保證新增的編程不能過(guò)于復(fù)雜。因此,教師可以選擇使用上面介紹的Sklearn和PyTorch兩個(gè)公開(kāi)庫(kù)進(jìn)行實(shí)驗(yàn)課的教授。Sklearn極大地簡(jiǎn)化了構(gòu)建數(shù)據(jù)挖掘算法的過(guò)程,通常只需要一到兩行代碼就可以構(gòu)建一個(gè)算法模型。在使用Python編寫k均值分類器算法時(shí),需要多次計(jì)算兩點(diǎn)之間距離,且算法是否收斂需要人為設(shè)置判斷條件,這都為實(shí)現(xiàn)算法帶來(lái)難度。而Sklearn只需要使用一行代碼就可以構(gòu)建一個(gè)將數(shù)據(jù)劃分為k個(gè)簇的k均值分類器,如表1所示。剩下的諸如支持向量機(jī)等復(fù)雜算法都可以只用一行代碼實(shí)現(xiàn),具體見(jiàn)表1。Sklearn主要用于實(shí)現(xiàn)數(shù)據(jù)預(yù)處理和傳統(tǒng)的數(shù)據(jù)挖掘算法,無(wú)法實(shí)現(xiàn)復(fù)雜的深度學(xué)習(xí)方法。PyTorch的引入可以解決這個(gè)問(wèn)題。一個(gè)完整的深度學(xué)習(xí)方法,包括數(shù)據(jù)的加載、模型的定義、模型參數(shù)的優(yōu)化規(guī)則、模型訓(xùn)練過(guò)程、模型驗(yàn)證過(guò)程。如果這些步驟都使用Python編寫,將會(huì)耗費(fèi)大量的時(shí)間和精力,而且以本科的知識(shí)基礎(chǔ)是無(wú)法用Python直接編寫出一些復(fù)雜的優(yōu)化規(guī)則的。PyTorch與Sklearn相似,將深度學(xué)習(xí)過(guò)程中的數(shù)據(jù)加載、模型參數(shù)優(yōu)化規(guī)則、訓(xùn)練和驗(yàn)證過(guò)程都進(jìn)行了簡(jiǎn)化,只用簡(jiǎn)單的幾行代碼就可以實(shí)現(xiàn)。Py?Torch的重點(diǎn)集中在如何搭建深度學(xué)習(xí)模型,而這部分也被簡(jiǎn)化成積木形式的搭建。例如,深度學(xué)習(xí)模型中常用的卷積操作、池化操作、激活函數(shù)等都被簡(jiǎn)化成了一個(gè)函數(shù),如表2所示。
除了使用開(kāi)源工具簡(jiǎn)化數(shù)據(jù)挖掘算法的實(shí)驗(yàn)過(guò)程,還可以從以下方面加強(qiáng)課程的實(shí)踐環(huán)節(jié)。由于數(shù)據(jù)挖掘課程涵蓋的知識(shí)面范圍較廣,與目前許多學(xué)科和技能競(jìng)賽有一定的交叉,所以教師可以指導(dǎo)學(xué)生積極參加類似軟件杯、計(jì)算機(jī)設(shè)計(jì)大賽等競(jìng)賽。
2.5課程內(nèi)容導(dǎo)向的課程思政
任何專業(yè)課程都應(yīng)該包括德育教育,也就是課程思政。學(xué)生不僅需要通過(guò)專業(yè)課了解專業(yè)知識(shí),還應(yīng)該能夠通過(guò)課程學(xué)習(xí)提高自己的思政素質(zhì)。但是,由于數(shù)據(jù)挖掘課程的特殊性,很多教師在教學(xué)過(guò)程中只是將思政內(nèi)容生搬硬套,強(qiáng)行加到課程中。這種課程思政模式很難讓學(xué)生接受,甚至?xí)绊懙綄W(xué)生對(duì)整個(gè)課程的態(tài)度,對(duì)專業(yè)知識(shí)也產(chǎn)生排斥。
事實(shí)上,任何一門學(xué)科的發(fā)展過(guò)程,都必然能和傳統(tǒng)的中華優(yōu)秀傳統(tǒng)文化以及馬克思主義基本原理產(chǎn)生聯(lián)系,正確的課程思政能夠讓學(xué)生同時(shí)加深對(duì)專業(yè)知識(shí)以及德育教育的理解[6]。從課程內(nèi)容出發(fā),例如對(duì)數(shù)據(jù)挖掘課程做出突出貢獻(xiàn)的科學(xué)家軼事,天然就是課程自身包含的思政內(nèi)容。此外,還有其他角度可以從課程內(nèi)容出發(fā)延伸至思政內(nèi)容,以下案例可以為教師提供參考。首先,數(shù)據(jù)挖掘是利用各種算法從數(shù)據(jù)中挖掘出有價(jià)值的信息,這種數(shù)據(jù)驅(qū)動(dòng)的信息挖掘體現(xiàn)了唯物主義精神,一切從物質(zhì)本身出發(fā),而不是憑空出現(xiàn)。其次,深度學(xué)習(xí)方法雖然現(xiàn)在大受稱贊并被廣泛使用,但是它被提出的時(shí)候并不被人看好,很多科學(xué)家都不相信這類方法。深度學(xué)習(xí)總共經(jīng)歷了3次高潮和2次低谷。從深度學(xué)習(xí)的歷史來(lái)看,很多事物的發(fā)展都不是一帆風(fēng)順,只有不放棄,保持初心,才能大放光彩。此外,數(shù)據(jù)挖掘算法容易將訓(xùn)練樣本上得到的經(jīng)驗(yàn)直接套用到測(cè)試樣本上,得到錯(cuò)誤的結(jié)果,即過(guò)擬合問(wèn)題。過(guò)擬合問(wèn)題反映了經(jīng)驗(yàn)主義的錯(cuò)誤性,對(duì)于任何事物,不能一成不變地照搬以往的經(jīng)驗(yàn),一定要與時(shí)俱進(jìn)。
2.6多元化考核形式
學(xué)生的學(xué)習(xí)能力和學(xué)習(xí)基礎(chǔ)存在差異,只以期末考試的成績(jī)來(lái)評(píng)定學(xué)生一學(xué)期的學(xué)習(xí)效果是不合適的。此外,由于數(shù)據(jù)挖掘課程是理論和實(shí)踐結(jié)合的課程,大部分學(xué)生都會(huì)傾向于擅長(zhǎng)理論或者實(shí)踐中的一種,所以只以閉卷考試的分?jǐn)?shù)作為總評(píng)成績(jī)更顯得不合理。為了不以期末考試成績(jī)單一地評(píng)價(jià)學(xué)生的學(xué)習(xí)效果,教師應(yīng)當(dāng)引入過(guò)程性評(píng)價(jià),構(gòu)建多元化的考核體系[7]。首先,總評(píng)成績(jī)的20%為平時(shí)成績(jī)。具體而言,這部分是由學(xué)生簽到、課堂提問(wèn)、實(shí)驗(yàn)報(bào)告、平時(shí)作業(yè)構(gòu)成。針對(duì)學(xué)生簽到,教師應(yīng)當(dāng)充分利用現(xiàn)代化技術(shù),例如超星學(xué)習(xí)通的掃碼簽到,解決學(xué)生代簽的問(wèn)題。平時(shí)分充分體現(xiàn)了學(xué)生的整個(gè)學(xué)習(xí)過(guò)程,使整個(gè)評(píng)價(jià)體系更加合理、完整。剩下的80%分別由理論分和實(shí)踐分構(gòu)成。理論分是由期末的閉卷考試分?jǐn)?shù)決定,這一部分主要考查學(xué)生對(duì)數(shù)據(jù)挖掘算法理論知識(shí)的掌握程度,課堂中涉及到思政內(nèi)容也會(huì)出現(xiàn)在試卷的案例分析題中。實(shí)踐分是通過(guò)對(duì)學(xué)生的實(shí)踐大作業(yè)打分獲得。這部分主要考查學(xué)生是否能夠?qū)⑺鶎W(xué)的數(shù)據(jù)挖掘算法用于解決現(xiàn)實(shí)生活中的難題。為了突出理論和實(shí)踐同等的重要性,這兩部分各占總分的40%。構(gòu)建這樣多元化的考核形式,既能對(duì)教學(xué)過(guò)程進(jìn)行監(jiān)督和評(píng)價(jià),也能讓學(xué)生體驗(yàn)到完整、多樣化的數(shù)據(jù)挖掘課程。
3結(jié)束語(yǔ)
信息時(shí)代背景下,互聯(lián)網(wǎng)每天都在產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)包含了寶貴的信息。但是,如果這些數(shù)據(jù)不加以正確使用,就會(huì)變成垃圾數(shù)據(jù),也會(huì)造成個(gè)人信息的泄漏。因此,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,用于挖掘大數(shù)據(jù)中有價(jià)值的信息。數(shù)據(jù)挖掘課程目前已經(jīng)成為計(jì)算機(jī)類和非計(jì)算機(jī)類本科專業(yè)的必修課程。但是,在實(shí)際教學(xué)過(guò)程中,該課程還存在以下問(wèn)題:課程入門門檻較高,涉及多門基礎(chǔ)學(xué)科;課程內(nèi)容陳舊,無(wú)法跟上快速發(fā)展的社會(huì)需求;課程講授大都停留在理論層面,實(shí)踐內(nèi)容較少,很難鍛煉學(xué)生的實(shí)踐動(dòng)手能力;課程思政切入點(diǎn)生硬;考核形式單一,無(wú)法全面地評(píng)價(jià)學(xué)生的學(xué)習(xí)效果。本文針對(duì)這些問(wèn)題,對(duì)數(shù)據(jù)挖掘課程設(shè)計(jì)進(jìn)行研究,提出針對(duì)課前、課中、課后三階段降低課程門檻的教學(xué)方法;引入最新的深度學(xué)習(xí)方法,充實(shí)課本內(nèi)容;適當(dāng)?shù)卦黾訉?shí)踐內(nèi)容的比重,讓學(xué)生掌握數(shù)據(jù)挖掘算法編程能力;創(chuàng)新了課程思政的切入點(diǎn),能夠讓學(xué)生更好地理解思政的重要性;提出將平時(shí)成績(jī)、理論分以及實(shí)踐分融合,形成多元化的評(píng)價(jià)方式。