張明輝
摘要:本文介紹了當(dāng)前情況的數(shù)據(jù)挖掘技術(shù)和研究現(xiàn)狀,論述了關(guān)聯(lián)規(guī)則、時(shí)序模式等相關(guān)算法,分析了數(shù)據(jù)挖掘技術(shù)在高職教育教學(xué)中的相關(guān)應(yīng)用及未來(lái)的發(fā)展趨勢(shì),探討了在大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘技術(shù)面臨的挑戰(zhàn)。
關(guān)鍵詞:大數(shù)據(jù);高職教學(xué);關(guān)聯(lián)規(guī)則;時(shí)序模式
中圖分類(lèi)號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2020)01-0024-02
隨著國(guó)內(nèi)高等職業(yè)院校招生人數(shù)和院校數(shù)量的增加,目前全國(guó)高職院校近2700所,今年又?jǐn)U招職業(yè)院校學(xué)生100萬(wàn),這種形勢(shì)下給學(xué)校教育教學(xué)管理工作帶來(lái)嚴(yán)峻考驗(yàn),傳統(tǒng)的教學(xué)管理手段已逐漸不能適應(yīng)社會(huì)的發(fā)展,但是,原有這些教學(xué)教務(wù)信息會(huì)成為高職院校豐富的信息資源,隨著大數(shù)據(jù)時(shí)代的到來(lái),學(xué)校面對(duì)這些大量的數(shù)據(jù)信息時(shí)并未完全進(jìn)行隱含信息的挖掘和分析,而依然采用傳統(tǒng)的甚至還采用紙質(zhì)的管理方法,這在當(dāng)前的大數(shù)據(jù)時(shí)代,在當(dāng)前尤其需要大量高級(jí)職業(yè)技術(shù)人才的時(shí)代背景下,這種教學(xué)管理模式顯然已經(jīng)落伍。
目前大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘技術(shù)日漸成熟,高職院校已開(kāi)始將數(shù)據(jù)挖掘的相關(guān)技術(shù)應(yīng)用于教育教學(xué)管理之中,即對(duì)教學(xué)中產(chǎn)生的數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)信息進(jìn)行提取、分析、建模等工作,從分析結(jié)果中找出教育教學(xué)的日常規(guī)律,并指導(dǎo)教學(xué),甚至也可以為學(xué)生今后的就業(yè)提供有力的指導(dǎo)和幫助。
1 大數(shù)據(jù)與挖掘技術(shù)的現(xiàn)狀
大數(shù)據(jù)時(shí)代缺少不了數(shù)據(jù)挖掘技術(shù),它是匯聚了多個(gè)學(xué)科的交叉性學(xué)科,即從龐大的數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中,將未知、隱含或具備潛在價(jià)值的信息進(jìn)行提取和分析的過(guò)程。1995年,加拿大蒙特利爾市召開(kāi)的第一屆知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘國(guó)際學(xué)術(shù)會(huì)議上提到數(shù)據(jù)挖掘技術(shù),即數(shù)據(jù)挖掘的整個(gè)過(guò)程,主要包括:分類(lèi)、聚類(lèi)、模式挖掘和規(guī)則提取等環(huán)節(jié),之后技術(shù)領(lǐng)域?qū)<抑饾u地形成了一整套的理論基礎(chǔ)[1]。經(jīng)實(shí)踐研究發(fā)現(xiàn)數(shù)據(jù)挖掘技術(shù)可以獨(dú)立的身份存在于處理大數(shù)據(jù)的整個(gè)系統(tǒng)之中,與其他模塊之間相輔相成、協(xié)調(diào)發(fā)展。
自上述事件以后,大數(shù)據(jù)中數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用受到業(yè)界的高度重視。與此同時(shí),在教育信息化也搭乘了大數(shù)據(jù)的快車(chē)得到廣泛的應(yīng)用。利用數(shù)據(jù)挖掘分析學(xué)習(xí)者特征、狀態(tài)或者行為,利用得到精準(zhǔn)分析結(jié)果幫助學(xué)習(xí)者修正自己的學(xué)習(xí)行為,改變學(xué)習(xí)方法,對(duì)教師而言,根據(jù)分析結(jié)果合理設(shè)置課程,進(jìn)行學(xué)習(xí)評(píng)價(jià),提高教學(xué)質(zhì)量,有效進(jìn)行教學(xué)管理。
2 課堂教學(xué)中主要的挖掘技術(shù)
數(shù)據(jù)挖掘所牽涉的領(lǐng)域方向比較廣,下面主要介紹挖掘技術(shù)中的關(guān)聯(lián)方法和時(shí)序模式方法。
2.1 關(guān)聯(lián)方法
關(guān)聯(lián)方法是從數(shù)據(jù)庫(kù)中提取知識(shí)的一類(lèi)重要方法,若兩個(gè)或多個(gè)數(shù)據(jù)項(xiàng)的取值之間重復(fù)出現(xiàn)且概率較高時(shí),就可以建立起這些數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)方法。其形式如下:X→Y(a,b)其中X、Y為不相交的兩個(gè)項(xiàng)目集合,其含義為在交互中X項(xiàng)目集的發(fā)生將會(huì)導(dǎo)致Y項(xiàng)目集的發(fā)生,則認(rèn)為X和Y之間存在某種關(guān)聯(lián)關(guān)系,此時(shí),我們認(rèn)為X項(xiàng)目集為關(guān)聯(lián)規(guī)則中的支持度,Y項(xiàng)目集為關(guān)聯(lián)規(guī)則中的信任度。關(guān)聯(lián)規(guī)則算法就是從交互數(shù)據(jù)庫(kù)中找出滿(mǎn)足用戶(hù)需求a(大于最小支持度)和b(大于最小信任度)的關(guān)聯(lián)方法[2]。
a.設(shè)I ={I1,I2,...Im}是的屬性集,稱(chēng)為項(xiàng),給定一個(gè)存儲(chǔ)教學(xué)數(shù)據(jù)的數(shù)據(jù)庫(kù)D,其中每個(gè)記錄T是項(xiàng)對(duì)應(yīng)的數(shù)據(jù)集合,滿(mǎn)足T包含于I,每個(gè)記錄都有一個(gè)標(biāo)示符,稱(chēng)為T(mén)ID,X是I的子集,如果XT,則稱(chēng)T包含X;如果X的元素個(gè)數(shù)為K,則可以稱(chēng)為X為K-項(xiàng)集(K-Intemset)。
b.如果項(xiàng)集XI,YI,并且X∩Y=,則形如X→Y的蘊(yùn)含式稱(chēng)為關(guān)聯(lián)規(guī)則,其中,X是規(guī)則的前項(xiàng)集,Y是規(guī)則的后項(xiàng)集,它表示包含X項(xiàng)集的因子T也很有可能會(huì)包含Y項(xiàng)集。如果包含X的因子有c%也包含Y,那么規(guī)則X→Y的置信度為c%;如果D中有s%的因子包含X∪Y,那么規(guī)則X→Y的支持度為s%,其計(jì)算表達(dá)式分別為:
在大型數(shù)據(jù)庫(kù)中通過(guò)支持度a和信任度b兩個(gè)關(guān)聯(lián)值進(jìn)行提取數(shù)據(jù)項(xiàng),刪除那些無(wú)意義的關(guān)聯(lián)數(shù)據(jù)項(xiàng),而信任度是衡量設(shè)置規(guī)則的可能性。
例如:如既能正確回答課堂提問(wèn)又能及時(shí)有效的做好課堂筆記的學(xué)生占全班學(xué)生的百分比,這種學(xué)生通常學(xué)習(xí)成績(jī)都較優(yōu)秀。
2.2 時(shí)序模式方法
時(shí)序模式是主要與時(shí)間有密切關(guān)聯(lián)的方法,強(qiáng)調(diào)時(shí)間前后的影響,通過(guò)時(shí)間序列找出重復(fù)發(fā)生概率較高的數(shù)據(jù)項(xiàng)的模式方法。即按時(shí)間先后順序查看時(shí)間數(shù)據(jù)項(xiàng)數(shù)據(jù)庫(kù),從中找出另一個(gè)或多個(gè)相似的時(shí)序數(shù)據(jù)項(xiàng)[3]。
3 關(guān)聯(lián)規(guī)則的具體應(yīng)用
以創(chuàng)新學(xué)院為例,教師在講授,學(xué)生在被動(dòng)的接受知識(shí)和技能,其過(guò)程中以學(xué)生點(diǎn)名冊(cè),學(xué)生平時(shí)成績(jī)表為輔助,對(duì)學(xué)生進(jìn)行監(jiān)督和較粗略的評(píng)分,而沒(méi)有就過(guò)程中產(chǎn)生的問(wèn)題進(jìn)行后續(xù)個(gè)性化的智能分析與精準(zhǔn)反饋服務(wù)。在創(chuàng)新學(xué)院每學(xué)期近1.6萬(wàn)學(xué)時(shí),每個(gè)班級(jí),每節(jié)課的學(xué)生課堂信息反饋都會(huì)所變化,從中找出學(xué)校在過(guò)程中反應(yīng)的客觀規(guī)律,而挖掘技術(shù)的數(shù)據(jù)依據(jù)是通過(guò)記錄學(xué)生點(diǎn)名表,平時(shí)成績(jī)表進(jìn)行分析,通過(guò)監(jiān)測(cè)打開(kāi)網(wǎng)絡(luò)資源的時(shí)間點(diǎn)、停頓資源上的時(shí)間長(zhǎng)度,回答問(wèn)題正確率等判斷學(xué)生處于學(xué)習(xí)狀態(tài)的認(rèn)真程度和對(duì)知識(shí)的掌握程序,進(jìn)而可以定制個(gè)人學(xué)習(xí)行為報(bào)告,為后續(xù)的專(zhuān)業(yè)課學(xué)習(xí)預(yù)測(cè)提供技術(shù)上的支持[4]。
3.1 數(shù)據(jù)的采集與處理過(guò)程
大數(shù)據(jù)是面向過(guò)程、多種類(lèi)型的數(shù)據(jù)集合,其中網(wǎng)絡(luò)資源類(lèi)數(shù)據(jù)和學(xué)生行為數(shù)據(jù)占主要部分,只有采集到常態(tài)化海量的學(xué)生每次學(xué)習(xí)過(guò)程中數(shù)據(jù),才能為此建立模型,進(jìn)而客觀理性的學(xué)情分析和學(xué)業(yè)水平評(píng)估。而數(shù)據(jù)采集可以使用“電子數(shù)據(jù)”和“紙質(zhì)數(shù)據(jù)”相結(jié)合的辦法,電子數(shù)據(jù)可以是“點(diǎn)擊網(wǎng)絡(luò)資源的時(shí)間”、“停留在資源的時(shí)間”以及電子版作業(yè)和實(shí)驗(yàn)完成率和正確率等,同時(shí)還可以通過(guò)監(jiān)控確認(rèn)學(xué)生課堂玩手機(jī)、聽(tīng)耳機(jī)現(xiàn)象的時(shí)間和瞌睡時(shí)長(zhǎng)。而紙質(zhì)數(shù)據(jù)依然采用傳統(tǒng)的辦法進(jìn)行[5]。如圖1所示。
3.2 精準(zhǔn)的數(shù)據(jù)帶來(lái)精準(zhǔn)的教學(xué)
常規(guī)的表格數(shù)據(jù),如:學(xué)生平時(shí)成績(jī)和期末考試成績(jī)統(tǒng)計(jì)等說(shuō)明的情況比較粗略,不能完全反應(yīng)學(xué)生學(xué)習(xí)整體過(guò)程情況,更不能精準(zhǔn)反應(yīng)學(xué)生出現(xiàn)的具體問(wèn)題,也就不能真正掌握學(xué)生行為動(dòng)態(tài),學(xué)生日常學(xué)習(xí)過(guò)程的行為數(shù)據(jù)是海量的,離散的,需要專(zhuān)業(yè)人員根據(jù)實(shí)際需要建立數(shù)據(jù)模型,再由專(zhuān)業(yè)挖掘人員進(jìn)行提取、清洗、轉(zhuǎn)換等,進(jìn)行全面精準(zhǔn)科學(xué)的分析,生成對(duì)學(xué)生學(xué)習(xí)、教師等有價(jià)值的行為報(bào)告,為每個(gè)學(xué)生提供精確指導(dǎo)。
一所院校的這些稱(chēng)不上是大數(shù)據(jù),那么如果將100所,甚至更多職業(yè)院校的類(lèi)似數(shù)據(jù)聚集在一起,進(jìn)行數(shù)據(jù)挖掘和智能分析,從中找出課堂教學(xué)中反映的問(wèn)題,從而更有效的指導(dǎo)學(xué)生學(xué)習(xí)。
3.3 大數(shù)據(jù)使進(jìn)教學(xué)改革和教學(xué)形式的多樣化
隨著大數(shù)據(jù)、智能化時(shí)代的到來(lái),類(lèi)似資源不斷為學(xué)生推送個(gè)性的學(xué)習(xí)資源,從這些資源中可以完成聽(tīng)課、練習(xí)、實(shí)驗(yàn)等眾多環(huán)節(jié),而無(wú)需只依賴(lài)于課堂教學(xué)。這樣為學(xué)習(xí)創(chuàng)造更高效的學(xué)習(xí)和自由的學(xué)習(xí)環(huán)境。
同時(shí),充分利用上述提供的大數(shù)據(jù)平臺(tái),學(xué)生的表現(xiàn)、優(yōu)勢(shì)和劣勢(shì)在數(shù)據(jù)平臺(tái)中展示,幫助教師精準(zhǔn)診斷每個(gè)學(xué)生的精準(zhǔn)學(xué)習(xí)需求和知識(shí)空缺,并提供針對(duì)性的指導(dǎo),營(yíng)造支持性的學(xué)習(xí)環(huán)境,引導(dǎo)并幫助學(xué)生自適應(yīng)的學(xué)習(xí)、智能交互學(xué)習(xí),讓學(xué)生不斷從中認(rèn)知自己。
4 結(jié)語(yǔ)
關(guān)聯(lián)規(guī)則的支持度和信任度是分析學(xué)習(xí)過(guò)程潛在的規(guī)律和關(guān)聯(lián)項(xiàng),主要關(guān)注學(xué)習(xí)特點(diǎn)、行為傾向,利用建立的模型和分析報(bào)告更加精準(zhǔn)的反應(yīng)學(xué)生狀態(tài)信息,以學(xué)生為中心,使精準(zhǔn)的個(gè)性化教育成為可能,學(xué)習(xí)能力是有差異的,對(duì)于強(qiáng)者需要進(jìn)一步的激勵(lì)與提升,對(duì)于弱者課后需要建立個(gè)性化的輔導(dǎo)答疑,教師在借助大數(shù)據(jù)的情況下,主動(dòng)開(kāi)展一些個(gè)性化的教學(xué),包括錄制一些理論知識(shí)的講解視頻或?qū)嵅龠^(guò)程的視頻,推送給不同層次的學(xué)生,指導(dǎo)他們自主學(xué)習(xí)。
參考文獻(xiàn)
[1] 劉銘,呂丹.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].科技導(dǎo)報(bào),2018,36(9):1-2.
[2] 楊光.教育大數(shù)據(jù)應(yīng)用“獲”與“惑”[N].中國(guó)信息化周報(bào),2019- 10-14(008).
[3] 馮黎.關(guān)聯(lián)規(guī)則分析技術(shù)在高職院校教務(wù)管理中的應(yīng)用研究[D].蘭州:蘭州大學(xué),2009.
[4] 陳桂香.大數(shù)據(jù)對(duì)我國(guó)高校教育管理的影響及對(duì)策研究[D].武漢:武漢大學(xué),2017.
[5].孫秋年,饒?jiān)?基于關(guān)聯(lián)分析的網(wǎng)絡(luò)數(shù)據(jù)可視化技術(shù)研究綜述[J].計(jì)算機(jī)科學(xué),2015(S1):484-488.