李海林
摘 要: 近年來,大數(shù)據(jù)引起了各界相關(guān)部門的高度關(guān)注,中科院和各高校開始重視該方向的教學(xué)和研究。針對目前大數(shù)據(jù)帶來的社會影響力,根據(jù)大數(shù)據(jù)具體特性以及數(shù)據(jù)挖掘?qū)W科交叉性強(qiáng)的特點(diǎn),結(jié)合實(shí)際教學(xué)經(jīng)驗(yàn),分別從培養(yǎng)數(shù)據(jù)意識、加強(qiáng)理論體系、創(chuàng)新教學(xué)方法和深入科學(xué)研究等四個方面來探索如何設(shè)計(jì)高校數(shù)據(jù)挖掘課程,以解決大數(shù)據(jù)時代下數(shù)據(jù)挖掘課程因抽象而帶來的問題,為培養(yǎng)優(yōu)秀的大數(shù)據(jù)研究人才奠定理論基礎(chǔ)。
關(guān)鍵詞: 大數(shù)據(jù); 數(shù)據(jù)挖掘; 教學(xué)方法; 人才培養(yǎng)
中圖分類號:TP399 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2014)02-54-02
0 引言
近年來,隨著科技進(jìn)步和社會的發(fā)展,以數(shù)據(jù)為中心的各領(lǐng)域產(chǎn)生了越來越多的數(shù)據(jù),引起了各界業(yè)內(nèi)人士的高度關(guān)注。2012年初,美國政府投入2億美元啟動“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,使得大數(shù)據(jù)研究上升為國家意志,這意味著大數(shù)據(jù)對將來科學(xué)技術(shù)、經(jīng)濟(jì)發(fā)展,以至國家安全都有深遠(yuǎn)的影響。大數(shù)據(jù)的特點(diǎn)[1-2]可以歸結(jié)為四個V,即Volume(體量大)、Variety(模態(tài)多)、Velocity(速度快)和Value(價值密度低)。然而,從這樣的數(shù)據(jù)中挖掘和發(fā)現(xiàn)潛在有用的信息和知識,對數(shù)據(jù)理論分析和數(shù)據(jù)挖掘技術(shù)的要求也相應(yīng)提高。
數(shù)據(jù)挖掘作為高校理學(xué)和工學(xué)專業(yè)設(shè)計(jì)中一門主導(dǎo)課程[3-4],其原始目的主要是讓大學(xué)本科學(xué)生對數(shù)據(jù)挖掘的相關(guān)基礎(chǔ)知識有一定的了解,并對較為成熟的技術(shù)和方法具有相應(yīng)的應(yīng)用分析能力。然而,針對大數(shù)據(jù)在現(xiàn)今各領(lǐng)域中的重要性以及它所帶來的諸多問題和挑戰(zhàn),則應(yīng)該從高校課程設(shè)置的層面作考慮,建立并完善適應(yīng)時代發(fā)展的人才培養(yǎng)體系。本文根據(jù)大數(shù)據(jù)的特點(diǎn)和其發(fā)展方向,探索如何提高數(shù)據(jù)挖掘課程的教學(xué)質(zhì)量,從教學(xué)層面探討大數(shù)據(jù)研究人才的培養(yǎng)。
1 教學(xué)探索
1.1 科學(xué)引導(dǎo),培養(yǎng)數(shù)據(jù)意識
數(shù)據(jù)挖掘是以數(shù)據(jù)為驅(qū)動的理論分析和應(yīng)用課程,它既有具體性又有抽象性。具體性表現(xiàn)為其研究內(nèi)容是以具體的數(shù)據(jù)為對象挖掘出的信息和知識比較客觀,具有一定的解釋性和理解性。抽象性表現(xiàn)為數(shù)據(jù)挖掘過程中理論、技術(shù)和方法等概念,課堂上一般難以在短時間內(nèi)被消化和理解。針對這些問題,在進(jìn)行數(shù)據(jù)挖掘課程設(shè)計(jì)之前,先要科學(xué)地引導(dǎo)學(xué)生對數(shù)據(jù)挖掘產(chǎn)生興趣,并且逐漸培養(yǎng)學(xué)生的數(shù)據(jù)意識。
在數(shù)據(jù)挖掘課程中,可以先安排2至4個學(xué)時來講解什么是數(shù)據(jù),讓學(xué)生理解數(shù)據(jù)在當(dāng)今社會中的重要意義。特別地,針對大數(shù)據(jù)時代的到來,更多地讓學(xué)生了解何謂“大數(shù)據(jù)”,大數(shù)據(jù)來自生活中的哪些方面,大數(shù)據(jù)的增長方式和情況如何,哪些領(lǐng)域中通過大數(shù)據(jù)相關(guān)研究取得了什么樣的成果等。同時,通過實(shí)例或視頻教學(xué)引導(dǎo)學(xué)生知道數(shù)據(jù)就在身邊,并且能夠通過數(shù)據(jù)挖掘技術(shù)來發(fā)現(xiàn)有用的信息和知識,為企業(yè)、政府和高校服務(wù),使學(xué)生知道數(shù)據(jù)對于企業(yè)競爭的意義。另外,為了增強(qiáng)學(xué)生對數(shù)據(jù)挖掘更深刻的認(rèn)識,通過數(shù)據(jù)分析或數(shù)據(jù)挖掘相關(guān)的招聘案例,從招聘熱門程度、職位性質(zhì)、工資待遇以及可持續(xù)性發(fā)展的前景等就業(yè)規(guī)劃角度來吸引學(xué)生對大數(shù)據(jù)以及數(shù)據(jù)挖掘的了解和興趣,以便為接下來的數(shù)據(jù)挖掘課程學(xué)習(xí)做好心理準(zhǔn)備。
1.2 深化基礎(chǔ),加強(qiáng)理論體系
大數(shù)據(jù)的特征決定了現(xiàn)有的數(shù)據(jù)中心技術(shù)很難滿足其分析需求,主要表現(xiàn)在去噪降維技術(shù)、數(shù)據(jù)特征表示、數(shù)據(jù)存儲、數(shù)據(jù)整合、非結(jié)構(gòu)化和半結(jié)構(gòu)化處理、數(shù)據(jù)通信傳輸和處理等方面。這些決定了數(shù)據(jù)挖掘技術(shù)面臨著更嚴(yán)峻的挑戰(zhàn),并且數(shù)據(jù)挖掘的知識將涉及到數(shù)據(jù)庫技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析、模式識別、信息檢索、高性能和智能計(jì)算等學(xué)科內(nèi)容。然而,在目前的大學(xué)生課程體系中,難以在有限的時間內(nèi)開設(shè)這些課程。針對這個問題,我們的做法是:將數(shù)據(jù)挖掘課程授課對象定位在高年級的學(xué)生,即大三或大四年級,這些學(xué)生一般對學(xué)習(xí)目標(biāo)有較清晰的認(rèn)識,并且有一定的知識儲備;做好前期課程的準(zhǔn)備,如開設(shè)高等數(shù)學(xué)、高等代數(shù)、統(tǒng)計(jì)分析、概率等數(shù)學(xué)體系課程,以及算法設(shè)計(jì)與分析、數(shù)據(jù)庫原理、計(jì)算機(jī)系統(tǒng)原理等計(jì)算機(jī)課程,為學(xué)好數(shù)據(jù)挖掘打下必要的基礎(chǔ)理論。除些之外,鼓勵學(xué)生自覺學(xué)習(xí)這些相關(guān)課程,并推薦一些經(jīng)典且較易理解的文章和書籍。為了讓學(xué)生更好地了解國內(nèi)外最新有關(guān)大數(shù)據(jù)的知識以及數(shù)據(jù)挖掘技術(shù)的進(jìn)展,大學(xué)生英文閱讀理解和寫作水平的培養(yǎng)也值得關(guān)注。因此,在數(shù)據(jù)挖掘課程體系中,需要深化基礎(chǔ)技能和理論體系,為后期學(xué)習(xí)數(shù)據(jù)挖掘課程提供便利條件和知識儲備。
1.3 聯(lián)系實(shí)踐,創(chuàng)新教學(xué)方法
理論來源于實(shí)踐,而實(shí)踐是檢驗(yàn)理論的途徑。由于學(xué)生對大數(shù)據(jù)認(rèn)識的模糊性以及數(shù)據(jù)挖掘理論和算法的抽象性,數(shù)據(jù)挖掘教學(xué)方法應(yīng)該讓學(xué)生明白所學(xué)課程內(nèi)容的具體原理和實(shí)際應(yīng)用領(lǐng)域。在基本的教學(xué)過程中,對數(shù)據(jù)挖掘的基本概念、原理和算法的講解最好結(jié)合案例教學(xué)法[5-6],并且使用具體的數(shù)據(jù)演算實(shí)例來分析數(shù)據(jù)挖掘的過程和結(jié)果,使學(xué)生從實(shí)際案例中明白數(shù)據(jù)挖掘技術(shù)在處理大數(shù)據(jù)過程中的作用和意義。
除了從授課內(nèi)容和教學(xué)方法方面改善外,學(xué)生自己的積極參與可以大大提高整個教學(xué)質(zhì)量。學(xué)生是課堂學(xué)習(xí)的主體對象,被動學(xué)習(xí)的效果不如主動學(xué)習(xí),即讓學(xué)生欣然接受數(shù)據(jù)挖掘中的新內(nèi)容和新方法,并且鼓勵他們利用所學(xué)知識去解決科學(xué)實(shí)踐問題。因此,在數(shù)據(jù)挖掘課程設(shè)計(jì)過程中可以采用案例采編及案例分析法,讓學(xué)生自己獨(dú)立或組隊(duì)去搜集新課程內(nèi)容涉及到的案例,讓他們每兩周提供一次案例分析報告,報告內(nèi)容主要是數(shù)據(jù)挖掘在數(shù)據(jù)分析中的作用以及處理過程。同時,在上機(jī)實(shí)驗(yàn)時,讓學(xué)生演算案例中的具體實(shí)例,進(jìn)而有針對性地指導(dǎo)、啟發(fā)學(xué)生積極思考。另外,針對每次案例采集和實(shí)驗(yàn),讓學(xué)生提交相應(yīng)的分析報告,使得教師能更好地把握好學(xué)生對數(shù)據(jù)挖掘新內(nèi)容理解和接收程度。
1.4 增強(qiáng)興趣,深入科學(xué)研究
大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘?qū)⒚媾R著比以往更大的挑戰(zhàn),這也使得數(shù)據(jù)挖掘?qū)⑸婕暗礁嗟膶W(xué)科,造成教學(xué)難度加大。因此,在教學(xué)工作中,教師要發(fā)揮主導(dǎo)作用,積極引導(dǎo)學(xué)生學(xué)習(xí)新知識的興趣。例如,讓學(xué)生間隔性地去了解大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘技術(shù)解決了什么問題,哪些企業(yè)或政府在這方面又有了什么創(chuàng)舉,甚至讓他們調(diào)查如今各大型招聘網(wǎng)中有關(guān)大數(shù)據(jù)分析和數(shù)據(jù)挖掘等職位的情況,進(jìn)而增強(qiáng)學(xué)生對數(shù)據(jù)挖掘的興趣。
另外,高年級中部分學(xué)生可能將選擇深造,出國或考研。針對這部分學(xué)生,可以鼓勵其選擇數(shù)據(jù)挖掘方向的科學(xué)研究。通過分配一些具體且較為長期的課題任務(wù)讓這些學(xué)生來完成,其研究內(nèi)容可以精細(xì)到一個數(shù)據(jù)挖掘算法的研究,這樣可以培養(yǎng)他們對問題的深刻認(rèn)識,有助于他們對研究問題和研究方法的精確把握??梢酝ㄟ^閱讀經(jīng)典文獻(xiàn),掌握最新技術(shù)和方法,努力培養(yǎng)學(xué)生的創(chuàng)新性思維,并且鼓勵和引導(dǎo)他們進(jìn)行學(xué)術(shù)性創(chuàng)作。通過把科學(xué)研究引入到實(shí)際教學(xué)中,不僅可以培養(yǎng)學(xué)生接收新知識的能力,還可以提高其解決問題的能力,為他們后期的大數(shù)據(jù)科學(xué)研究打下較為堅(jiān)實(shí)的基礎(chǔ)。
2 結(jié)束語
數(shù)據(jù)挖掘是大數(shù)據(jù)環(huán)境下高校急需開設(shè)的一門重要課程。傳統(tǒng)教學(xué)主要是講解數(shù)據(jù)挖掘的基礎(chǔ)知識,學(xué)生對于抽象的概念和知識難以理解。針對數(shù)據(jù)挖掘交叉性強(qiáng)且知識結(jié)構(gòu)較為復(fù)雜的情況,提出相應(yīng)的教學(xué)策略以提高學(xué)生對知識內(nèi)容和技術(shù)方法的興趣。本文根據(jù)大數(shù)據(jù)的特征、作用和意義,結(jié)合實(shí)際教學(xué)經(jīng)驗(yàn),重點(diǎn)從培養(yǎng)學(xué)生的數(shù)據(jù)意識、加強(qiáng)理論體系、創(chuàng)新教學(xué)方法和深入科學(xué)研究等方面進(jìn)行數(shù)據(jù)挖掘課程教學(xué)設(shè)計(jì),為提高大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘課程的教學(xué)質(zhì)量提供參考依據(jù)。實(shí)踐教學(xué)結(jié)果表明,該教學(xué)方法不僅能夠提高學(xué)生對數(shù)據(jù)挖掘的興趣,更有利于學(xué)生掌握課程的主要內(nèi)容,并且對培養(yǎng)學(xué)生在計(jì)算機(jī)科學(xué)領(lǐng)域中數(shù)據(jù)算法研究能力具有一定的幫助。本文教學(xué)方法主要應(yīng)用于大學(xué)本科的數(shù)據(jù)挖掘課程,對于研究生的大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘教學(xué)模式和課程設(shè)計(jì)有待于進(jìn)一步探索和研究。
參考文獻(xiàn):
[1] 王珊,王會舉,覃雄派等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報,2011.34(10):1741-1752
[2] 李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域[J].中國科學(xué)院院刊,2012.27(6):647-657
[3] 黃美麗.“數(shù)據(jù)倉庫與數(shù)據(jù)挖掘”研討型教學(xué)實(shí)踐探析[J].計(jì)算機(jī)時代,2012.12:52-53,55
[4] 劉建偉.數(shù)據(jù)挖掘課程設(shè)計(jì)的教學(xué)探索[J].科技信息,2013.23:55-56
[5] 王華秋.任務(wù)驅(qū)動的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程案例教學(xué)[J].黑龍江教育(高教研究與評估),2011.6:52-53
[6] 周森鑫,盛鵬飛,王夫芹.數(shù)據(jù)挖掘課程案例教學(xué)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012.11:183-186