郭傳好
(浙江理工大學(xué) 經(jīng)濟(jì)管理學(xué)院,浙江 杭州 310018)
隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算、人工智能等新興信息技術(shù)的出現(xiàn)和普及,人們周?chē)臄?shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),整個(gè)社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代[1]。海量數(shù)據(jù)中隱藏著人們的消費(fèi)喜好、消費(fèi)方式及生活工作和行為的點(diǎn)點(diǎn)滴滴,存儲(chǔ)著與企業(yè)的發(fā)展和管理、生產(chǎn)與銷(xiāo)售、客戶(hù)關(guān)系管理等息息相關(guān)的各種各樣的數(shù)據(jù),挖掘和分析這些信息和數(shù)據(jù)背后所存在的模式、規(guī)律和趨勢(shì),并結(jié)合各行各業(yè)的特點(diǎn)進(jìn)行創(chuàng)新應(yīng)用,已成為當(dāng)前這個(gè)時(shí)代的主要研究課題。因此,在大數(shù)據(jù)背景下,為適應(yīng)經(jīng)濟(jì)社會(huì)發(fā)展需求和行業(yè)的發(fā)展需求,國(guó)內(nèi)眾多高校陸續(xù)設(shè)立了數(shù)據(jù)科學(xué)與工程等大數(shù)據(jù)相關(guān)專(zhuān)業(yè),并在一些學(xué)院開(kāi)設(shè)了數(shù)據(jù)挖掘、深度學(xué)習(xí)、統(tǒng)計(jì)學(xué)、人工智能、云計(jì)算等相關(guān)專(zhuān)業(yè)課程,使用統(tǒng)一兼分散的方式為社會(huì)培養(yǎng)數(shù)據(jù)挖掘與分析專(zhuān)業(yè)人才。由此亦可見(jiàn),數(shù)據(jù)挖掘?qū)W科是大數(shù)據(jù)時(shí)代的產(chǎn)物,是學(xué)校培養(yǎng)大數(shù)據(jù)挖掘人才的核心基礎(chǔ)課程[2-3]。
值得注意的是,數(shù)據(jù)挖掘是一門(mén)綜合交叉學(xué)科,涉及統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、數(shù)學(xué)建模、模式識(shí)別、高性能計(jì)算等多門(mén)學(xué)科的相關(guān)內(nèi)容,如圖1 所示,是一門(mén)以方法論為核心,以數(shù)學(xué)理論知識(shí)為基礎(chǔ),注重實(shí)踐創(chuàng)新能力培養(yǎng)和訓(xùn)練的綜合學(xué)科[4]。目前國(guó)內(nèi)眾多高校開(kāi)設(shè)了數(shù)據(jù)挖掘相關(guān)課程,但在對(duì)課程的理論性、應(yīng)用性、實(shí)踐性的認(rèn)識(shí)上同社會(huì)和學(xué)生的需求還存在一定差距,重理論教學(xué)輕實(shí)踐教學(xué)的現(xiàn)象比較普遍,尤其是面向商科、經(jīng)管專(zhuān)業(yè)或數(shù)學(xué)思維、計(jì)算能力比較薄弱的學(xué)生[5-6]。如何讓學(xué)生快速有效地掌握數(shù)據(jù)挖掘的基本理論知識(shí)內(nèi)容,并能夠較熟練地使用一些常用數(shù)據(jù)挖掘工具或軟件進(jìn)行相關(guān)數(shù)據(jù)挖掘與分析工作,還缺乏系統(tǒng)性的教學(xué)設(shè)計(jì)方案。因此,如何改進(jìn)數(shù)據(jù)挖掘課程的現(xiàn)有教學(xué)方法、教學(xué)內(nèi)容和教學(xué)實(shí)踐,建立一個(gè)以需求為導(dǎo)向的完整教學(xué)方案體系,具有重要的理論和實(shí)踐意義。
圖1 數(shù)據(jù)挖掘——多學(xué)科交叉的學(xué)科
本文將從社會(huì)需求、學(xué)生需求和學(xué)科專(zhuān)業(yè)發(fā)展需求等角度出發(fā),同時(shí)結(jié)合筆者近幾年對(duì)數(shù)據(jù)挖掘及其相關(guān)課程的授課經(jīng)歷和感受,對(duì)數(shù)據(jù)挖掘課程的教學(xué)內(nèi)容和過(guò)程進(jìn)行了新的思考和探討。
在大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等新技術(shù)逐漸發(fā)力,走進(jìn)社會(huì)各個(gè)領(lǐng)域的背景下,數(shù)據(jù)挖掘相關(guān)技術(shù)廣泛應(yīng)用于零售、加工制造、財(cái)務(wù)金融保險(xiǎn)、交通通訊、生物化工、物流以及社會(huì)醫(yī)療服務(wù)等眾多領(lǐng)域。而在這些風(fēng)口領(lǐng)域內(nèi),想要突圍的公司無(wú)數(shù),也帶動(dòng)了對(duì)數(shù)據(jù)挖掘優(yōu)秀人才的全面爭(zhēng)奪。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),應(yīng)屆畢業(yè)生培訓(xùn)后平均就業(yè)薪資為8-10K 左右,有一定實(shí)踐能力的可達(dá)15K 以上甚至更高,大數(shù)據(jù)工程師工作1 年后通常會(huì)成為月薪10K 以上的資深工程師或項(xiàng)目經(jīng)理??梢哉f(shuō),未來(lái)的大數(shù)據(jù)相關(guān)工作意味著高薪、穩(wěn)定、廣泛的職業(yè)使用度和優(yōu)越感。但是近幾年間大數(shù)據(jù)人才缺口非常大,企業(yè)高薪都難以找到足夠的大數(shù)據(jù)開(kāi)發(fā)人才,大數(shù)據(jù)從業(yè)者的增長(zhǎng)量,遠(yuǎn)遠(yuǎn)滿(mǎn)足不了市場(chǎng)需求的擴(kuò)張,大數(shù)據(jù)人才需求將可能出現(xiàn)“井噴”現(xiàn)象。
隨著越來(lái)越多的新智能產(chǎn)品科技公司、信息技術(shù)企業(yè)涌現(xiàn),許多學(xué)生也開(kāi)始逐漸意識(shí)到這是一個(gè)新興的且非常有發(fā)展?jié)摿Φ念I(lǐng)域,而與之相關(guān)聯(lián)緊密且易于就業(yè)的工作崗位就是數(shù)據(jù)挖掘與分析。我們現(xiàn)行開(kāi)設(shè)的數(shù)據(jù)挖掘課程,只是作為信息管理與信息系統(tǒng)專(zhuān)業(yè)學(xué)生的一門(mén)專(zhuān)業(yè)課程,而非數(shù)據(jù)挖掘與分析專(zhuān)業(yè)的專(zhuān)業(yè)核心課程。同時(shí),還有諸如課時(shí)時(shí)間限制、基礎(chǔ)知識(shí)課程的選課等諸多因素影響,導(dǎo)致了現(xiàn)有課程教學(xué)內(nèi)容和體系只能給學(xué)生介紹一些基礎(chǔ)的數(shù)據(jù)挖掘知識(shí)和方法,不能有效地滿(mǎn)足部分學(xué)生對(duì)相關(guān)知識(shí)的進(jìn)一步深入渴求。例如,在近幾屆畢業(yè)生中,就有部分學(xué)生為了想去應(yīng)聘數(shù)據(jù)挖掘相關(guān)工作崗位,在畢業(yè)之前,去報(bào)名社會(huì)上舉辦的一些數(shù)據(jù)挖掘培訓(xùn)公司進(jìn)行相關(guān)技能培訓(xùn)。此外,還有部分學(xué)生,在選修這門(mén)課程的時(shí)候,其目的和目標(biāo)是比較明確的,就是想今后從事數(shù)據(jù)挖掘與分析相關(guān)的工作,或有在這領(lǐng)域進(jìn)一步深造學(xué)習(xí)的計(jì)劃,因此現(xiàn)有的教學(xué)內(nèi)容和計(jì)劃也不能夠滿(mǎn)足這些學(xué)生的需求。
在上述兩個(gè)需求因素的合力驅(qū)動(dòng)下,國(guó)內(nèi)眾多高校的相關(guān)專(zhuān)業(yè)設(shè)置和學(xué)生培養(yǎng)定位也在隨之發(fā)生相應(yīng)變化。相關(guān)數(shù)據(jù)顯示,截至2018 年,全國(guó)已有35 所高校申報(bào)并開(kāi)設(shè)了大數(shù)據(jù)相關(guān)專(zhuān)業(yè),同時(shí)幾乎70%以上的高校都開(kāi)設(shè)有數(shù)據(jù)挖掘相關(guān)課程,其廣泛分散于理學(xué)院或數(shù)學(xué)學(xué)院、經(jīng)管學(xué)院、計(jì)算機(jī)或信息學(xué)院、通信或控制等學(xué)院的相關(guān)專(zhuān)業(yè)教學(xué)培養(yǎng)計(jì)劃中。值得注意的是,數(shù)據(jù)挖掘課程是大數(shù)據(jù)相關(guān)專(zhuān)業(yè)的專(zhuān)業(yè)核心基礎(chǔ)課程,這些被分散的數(shù)據(jù)挖掘課程,由于面向的學(xué)生專(zhuān)業(yè)不一樣,課程的教學(xué)內(nèi)容和要求定位也隨之大不相同,沒(méi)有統(tǒng)一的課程教學(xué)大綱和教學(xué)內(nèi)容要求,對(duì)后續(xù)相關(guān)學(xué)院申請(qǐng)大數(shù)據(jù)或數(shù)據(jù)挖掘相關(guān)專(zhuān)業(yè)具有一定的影響。作者所在信息管理與信息系統(tǒng)專(zhuān)業(yè)設(shè)置于經(jīng)管學(xué)院,盡管已開(kāi)設(shè)數(shù)據(jù)挖掘這一課程多年,但該課程的開(kāi)設(shè)主要面對(duì)的是經(jīng)管學(xué)院的學(xué)生,只是作為信管專(zhuān)業(yè)學(xué)生的一門(mén)專(zhuān)業(yè)基礎(chǔ)課程和金融、經(jīng)濟(jì)統(tǒng)計(jì)等專(zhuān)業(yè)學(xué)生的選修課,同時(shí)還存在學(xué)生的數(shù)學(xué)和計(jì)算能力基礎(chǔ)普遍較薄弱、相關(guān)課程內(nèi)容設(shè)置之間銜接不夠等一些問(wèn)題。此外,學(xué)院今年開(kāi)始也在積極準(zhǔn)備申報(bào)大數(shù)據(jù)相關(guān)專(zhuān)業(yè)。這一系列需求也是進(jìn)一步促使筆者對(duì)數(shù)據(jù)挖掘課程教學(xué)內(nèi)容和體系進(jìn)行深入探索和思考的重要因素。
眾所周知,數(shù)據(jù)挖掘應(yīng)用了很多學(xué)科的新概念,是多學(xué)科交融的學(xué)科,包括統(tǒng)計(jì)學(xué)、數(shù)學(xué)建模、機(jī)器學(xué)習(xí)、信息系統(tǒng)與數(shù)據(jù)庫(kù)等眾多學(xué)科。內(nèi)容廣泛、理論知識(shí)深、學(xué)習(xí)難度大是數(shù)據(jù)挖掘課程的突出特點(diǎn),尤其是面對(duì)數(shù)學(xué)基礎(chǔ)薄弱、計(jì)算能力偏弱的經(jīng)管學(xué)院的學(xué)生,學(xué)習(xí)起來(lái)更是困難。針對(duì)這些教學(xué)難點(diǎn),可以從以下幾方面進(jìn)行改進(jìn):第一,強(qiáng)化前期相關(guān)基礎(chǔ)課程的教學(xué)要求。對(duì)前期的管理統(tǒng)計(jì)、數(shù)據(jù)庫(kù)、管理運(yùn)籌學(xué)、程序設(shè)計(jì)等相關(guān)課程,加強(qiáng)課程的考核和學(xué)習(xí)要求,讓更大比例的同學(xué)不僅能夠比較扎實(shí)地掌握相關(guān)理論知識(shí)內(nèi)容,而且同時(shí)具有一定的知識(shí)運(yùn)用能力,為后續(xù)數(shù)據(jù)挖掘課程的學(xué)習(xí)打好堅(jiān)實(shí)基礎(chǔ)。第二,簡(jiǎn)化理論知識(shí)的學(xué)習(xí)。結(jié)合我們學(xué)校以培養(yǎng)應(yīng)用型本科人才為主的教育目標(biāo),強(qiáng)化數(shù)據(jù)挖掘相關(guān)方法實(shí)踐能力的培養(yǎng)和訓(xùn)練,在數(shù)據(jù)挖掘課程的實(shí)際教學(xué)過(guò)程中,以啟發(fā)學(xué)生思維和理解數(shù)據(jù)挖掘方法的思路為主,輔以會(huì)建立合理的數(shù)學(xué)模型和解讀數(shù)據(jù)挖掘結(jié)果,授課的主要內(nèi)容和安排如表1 所示。第三,強(qiáng)化學(xué)生數(shù)據(jù)挖掘?qū)嵺`能力的鍛煉。由于數(shù)據(jù)挖掘是一門(mén)實(shí)踐性很強(qiáng)的課程,加之企業(yè)對(duì)畢業(yè)生動(dòng)手實(shí)踐能力的需求,教學(xué)過(guò)程中不僅會(huì)安排相應(yīng)的實(shí)驗(yàn)課程(約12 學(xué)時(shí)),同時(shí)還鼓勵(lì)學(xué)生積極參加全國(guó)各類(lèi)數(shù)據(jù)挖掘、統(tǒng)計(jì)調(diào)查和數(shù)學(xué)建模等相關(guān)比賽,來(lái)鍛煉綜合實(shí)踐能力。
由于數(shù)據(jù)挖掘的課程內(nèi)容偏重于算法理論和數(shù)學(xué)模型,相關(guān)理論內(nèi)容的傳統(tǒng)授課方式對(duì)經(jīng)管學(xué)院學(xué)生而言晦澀難懂,內(nèi)容枯燥,無(wú)法激發(fā)學(xué)生的學(xué)習(xí)興趣,導(dǎo)致課堂教學(xué)難、教學(xué)效果不好。鑒于此類(lèi)情況,可從以下幾方面加以改進(jìn):第一,案例引導(dǎo),吸引學(xué)生興趣。每節(jié)課前,給學(xué)生介紹一個(gè)與本節(jié)課內(nèi)容相關(guān)的數(shù)據(jù)挖掘案例,尤其是經(jīng)濟(jì)、電子商務(wù)、金融等領(lǐng)域的實(shí)際案例,讓學(xué)生了解到數(shù)據(jù)挖掘能夠非常有效地解決實(shí)際領(lǐng)域的很多問(wèn)題,且能夠帶來(lái)很大效益,以激發(fā)學(xué)生學(xué)習(xí)相關(guān)知識(shí)的興趣和動(dòng)力。第二,參加數(shù)據(jù)挖掘相關(guān)競(jìng)賽,激發(fā)學(xué)習(xí)興趣。數(shù)據(jù)挖掘理論與方法學(xué)習(xí)成果的最好檢驗(yàn)方法就是去系統(tǒng)地解決一個(gè)實(shí)際問(wèn)題,而現(xiàn)行的各類(lèi)數(shù)據(jù)挖掘競(jìng)賽,包括大學(xué)生數(shù)學(xué)建模比賽、MathorCup 高校數(shù)學(xué)建模挑戰(zhàn)賽、泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽等賽事恰好提供了這樣一個(gè)平臺(tái)。學(xué)生通過(guò)比賽不僅能夠獲得榮譽(yù),還能夠鍛煉其團(tuán)隊(duì)合作能力、創(chuàng)新能力等綜合素質(zhì)。第三,多元化的授課方法。當(dāng)前在校的大學(xué)生熱衷于新技術(shù)以及新奇、靈活、多變的授課方式。教師要結(jié)合當(dāng)前流行的各種新技術(shù)手段,如翻轉(zhuǎn)課堂、雨課堂等技術(shù),在授課過(guò)程中靈活運(yùn)用,以激發(fā)和吸引學(xué)生的學(xué)習(xí)興趣。如在介紹SVM 算法時(shí),老師可以先介紹其相關(guān)概念和執(zhí)行流程,并以小組形式讓學(xué)生去研討該方法的具體細(xì)節(jié)、特點(diǎn),然后解決一個(gè)小問(wèn)題,總結(jié)匯報(bào)學(xué)習(xí)和作業(yè)心得,最后老師加以系統(tǒng)總結(jié)和點(diǎn)評(píng)??傊?,一切以激發(fā)和吸引學(xué)生學(xué)習(xí)興趣為出發(fā)點(diǎn),目的是讓其牢固習(xí)得相關(guān)知識(shí)和方法技能,為后續(xù)的工作和學(xué)習(xí)打好基礎(chǔ)。
表1 數(shù)據(jù)挖掘課程內(nèi)容和安排
傳統(tǒng)的課程效果考核方式通常以期末試卷分?jǐn)?shù)作為評(píng)分主要依據(jù),但筆試往往偏重于理論知識(shí)的考核,忽略了對(duì)實(shí)踐知識(shí)和技能的考核。鑒于數(shù)據(jù)挖掘是一門(mén)理論與實(shí)踐結(jié)合,側(cè)重于實(shí)踐能力培訓(xùn)的課程,建議采用多種考核方法。如采用試卷成績(jī)、實(shí)踐成績(jī)、大作業(yè)成績(jī)、競(jìng)賽成績(jī)等多種成績(jī)的綜合評(píng)分結(jié)果,作為學(xué)生的最終考核結(jié)果。針對(duì)不同水平和興趣的學(xué)生,考核方式靈活多變,如理論知識(shí)學(xué)習(xí)較好的學(xué)生,鼓勵(lì)其深入鉆研相關(guān)模型和算法的改進(jìn)與創(chuàng)新,指導(dǎo)其撰寫(xiě)相關(guān)學(xué)術(shù)論文;實(shí)踐動(dòng)手能力較好的學(xué)生,鼓勵(lì)其參加各類(lèi)數(shù)據(jù)挖掘競(jìng)賽。分別以論文水平、競(jìng)賽成績(jī)等作為考核重要指標(biāo)。
此外,老師教學(xué)質(zhì)量的評(píng)價(jià)應(yīng)與學(xué)生成績(jī)的考核方式相對(duì)應(yīng),也應(yīng)做相應(yīng)的調(diào)整。如將課程的理論教學(xué)結(jié)果和學(xué)生的競(jìng)賽成績(jī)、發(fā)表論文成績(jī)等因素結(jié)合起來(lái),按一定比例統(tǒng)一作為老師的總體評(píng)價(jià)。不論是學(xué)生,還是老師,采用多元化的考評(píng)方式不僅有利于學(xué)生實(shí)踐能力的培養(yǎng),對(duì)老師的教學(xué)水平也是一種促進(jìn),有利于整個(gè)課程教學(xué)質(zhì)量的不斷提高。
隨著商務(wù)、經(jīng)濟(jì)、醫(yī)療等社會(huì)各領(lǐng)域的信息數(shù)據(jù)爆炸式增長(zhǎng),掌握數(shù)據(jù)挖掘技能和方法將是大數(shù)據(jù)時(shí)代大學(xué)生必備的社會(huì)技能之一。在此背景下,對(duì)數(shù)據(jù)挖掘課程的教學(xué)內(nèi)容和教學(xué)方法等進(jìn)行研究,具有重要的理論和現(xiàn)實(shí)價(jià)值。本文從社會(huì)需求、學(xué)生需求和學(xué)科專(zhuān)業(yè)發(fā)展需求等角度出發(fā),同時(shí)結(jié)合筆者近幾年數(shù)據(jù)挖掘課程授課的結(jié)果反饋和感受,對(duì)數(shù)據(jù)挖掘課程的教學(xué)內(nèi)容和方法等進(jìn)行了總結(jié)和分析,得到了一些有意義的結(jié)果,其對(duì)進(jìn)一步提高數(shù)據(jù)挖掘課程教學(xué)質(zhì)量和相關(guān)課程教學(xué)改革具有一定的指導(dǎo)價(jià)值和借鑒意義。