馬靜
摘要
本文闡述了利用數(shù)據(jù)挖掘軟件clementine將數(shù)據(jù)挖掘技術(shù)引入到教學(xué)管理工作之中,從教學(xué)評(píng)價(jià)的數(shù)據(jù)中提取出隱藏在數(shù)據(jù)中的有用信息,探討影響教學(xué)質(zhì)量的關(guān)鍵因素,從而為教學(xué)主管部門的管理工作提供決策性參考。
【關(guān)鍵詞】數(shù)據(jù)挖掘 高職 評(píng)價(jià)模型
隨著“教育信息化”的發(fā)展,教務(wù)管理的相關(guān)數(shù)據(jù)越來越多,但這些數(shù)據(jù)除了作為歷史數(shù)據(jù)外,其有用信息的價(jià)值并未充分挖掘和利用,并使其轉(zhuǎn)化為有用的知識(shí),實(shí)現(xiàn)真正的教育信息化。教務(wù)管理中的教學(xué)評(píng)價(jià)對(duì)于教育質(zhì)量的提高起著十分重要的作用,而利用數(shù)據(jù)挖掘技術(shù)從教學(xué)評(píng)價(jià)數(shù)據(jù)中提取出隱藏在數(shù)據(jù)之中的有用信息可為教務(wù)管理工作提供決策性參考。數(shù)據(jù)挖掘技術(shù)是利用數(shù)據(jù)庫、數(shù)據(jù)倉庫技術(shù)存儲(chǔ)管理數(shù)據(jù),利用機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方法分析數(shù)據(jù)的一項(xiàng)跨學(xué)科技術(shù)。通過數(shù)據(jù)挖掘技術(shù)我們可以完成數(shù)據(jù)總結(jié)、分類、關(guān)聯(lián)、聚類等若干主要任務(wù)。為了提高數(shù)據(jù)挖掘工作效率,常借用一些工具軟件,clementine是眾多數(shù)據(jù)挖掘軟件之一,它擁有豐富的數(shù)據(jù)挖掘算法,支持與數(shù)據(jù)庫之間的數(shù)據(jù)和模型交換;同時(shí),具有可視化操作界面,簡(jiǎn)單易用,分析結(jié)果直觀易懂,圖形功能強(qiáng)大等特點(diǎn)。
1 教學(xué)評(píng)價(jià)模型及挖掘算法的選擇
教學(xué)評(píng)價(jià)是學(xué)校和教師、教師和學(xué)生相互聯(lián)系的一個(gè)紐帶。為了更好的完成教學(xué)評(píng)價(jià),各院校會(huì)認(rèn)真制定學(xué)生教學(xué)評(píng)價(jià)指標(biāo)體系。本文研究的指標(biāo)體系主要包括教學(xué)態(tài)度,基本素質(zhì),教學(xué)內(nèi)容,教學(xué)方法,教學(xué)效果,教學(xué)特色六項(xiàng)指標(biāo)。為了研究六項(xiàng)指標(biāo)之間,六項(xiàng)指標(biāo)與評(píng)價(jià)結(jié)果之間的關(guān)聯(lián),本文選擇clementine的關(guān)聯(lián)分析技術(shù)進(jìn)行數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘中,關(guān)聯(lián)分析的主要技術(shù)是關(guān)聯(lián)規(guī)則(Association Rule),clementine提供了Apriori、GRI、Carma等多種經(jīng)典關(guān)聯(lián)規(guī)則算法。本次研究選擇Apriori算法,其主要原因是:研究所涉及數(shù)據(jù)量較大,Apriori算法在提高關(guān)聯(lián)規(guī)則分析效率的同時(shí),還能有效揭示數(shù)據(jù)中隱含的關(guān)聯(lián)特征?;贏priori算法模型是無指導(dǎo)學(xué)習(xí)方法,本次研究采用web網(wǎng)狀圖分析報(bào)告與模型比較的方式來評(píng)價(jià)模型。
2 利用clementine對(duì)教學(xué)評(píng)價(jià)進(jìn)行數(shù)據(jù)挖掘
數(shù)據(jù)挖掘的過程主要包括五個(gè)階段:
(1)數(shù)據(jù)準(zhǔn)備;
(2)數(shù)據(jù)選擇;
(3)數(shù)據(jù)預(yù)處理;
(4)數(shù)據(jù)挖掘;
(5)轉(zhuǎn)換模型及模式評(píng)價(jià),本文研究嚴(yán)格按照上述步驟進(jìn)行。
2.1 數(shù)據(jù)準(zhǔn)備及數(shù)據(jù)選擇
數(shù)據(jù)準(zhǔn)備主要包含兩點(diǎn):一是要根據(jù)挖掘?qū)ο笫占紨?shù)據(jù),即確立數(shù)據(jù)源,第二是整合數(shù)據(jù)。本文數(shù)據(jù)源來源于教務(wù)系統(tǒng)3個(gè)學(xué)期39位教師的教學(xué)評(píng)價(jià)信息表666078條數(shù)據(jù),其表結(jié)構(gòu)如表1所示,經(jīng)過數(shù)據(jù)表的聯(lián)接與篩選生成了表結(jié)構(gòu)如表2所示的訓(xùn)練樣本集。
2.2 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理在數(shù)據(jù)挖掘過程中是很重要的一個(gè)環(huán)節(jié),它可以保證數(shù)挖掘所需數(shù)據(jù)集的質(zhì)量。數(shù)據(jù)預(yù)處理工作主要是對(duì)收集的數(shù)據(jù)進(jìn)行清理,針對(duì)教學(xué)評(píng)價(jià)信息特點(diǎn),數(shù)據(jù)預(yù)處理主要分兩步進(jìn)行:
2.2.1 數(shù)據(jù)清理
數(shù)據(jù)清理工作主要是對(duì)于空缺的屬性,使用數(shù)據(jù)清理技術(shù)來填充,當(dāng)記錄有多個(gè)屬性缺少屬性值時(shí),將這些記錄將視為無效記錄并刪除。
2.2.2 屬性歸約
樣本集中用于數(shù)據(jù)挖掘的字段都是連續(xù)型屬性,由于Apriori算法及web網(wǎng)狀圖分析需要離散性屬性數(shù)據(jù)值,本文研究將各項(xiàng)評(píng)分和最后得分做了離散性的屬性劃分,其劃分規(guī)則如表3所示。
2.3 關(guān)聯(lián)規(guī)則挖掘
(1)本文利用clementine的Apriori算法和web網(wǎng)狀圖對(duì)教學(xué)評(píng)價(jià)信息進(jìn)行了挖掘,創(chuàng)建數(shù)據(jù)流如圖1所示,其中partion結(jié)點(diǎn)的Trainingpartionsize和Testing partion size都設(shè)置為50%,Apriori算法設(shè)置其minmum antecedent support為10%,minimum rule confidence為80%。Apriori算法執(zhí)行結(jié)果如圖2所示。
2.4 挖掘結(jié)果分析
(1)假設(shè)關(guān)聯(lián)規(guī)則的最小支持度為10%,最小置信度為80%,進(jìn)行關(guān)聯(lián)規(guī)則挖掘產(chǎn)生3條強(qiáng)關(guān)聯(lián)規(guī)則:shuizi=“優(yōu)秀”→zhongping=“優(yōu)秀”(s=l1.256%c=86.519%);taidu=“優(yōu)秀”→zhongping=“優(yōu)秀”(s=l1.256%c=86.519%);fangfa=“優(yōu)秀”→zhongping=”優(yōu)秀”(s=12.1210/0c=85.579%);同時(shí)三條規(guī)則的提升值分別為1.319,1.319,1.305都可以接受。因此,基本素質(zhì),教學(xué)態(tài)度,教學(xué)方法三個(gè)指標(biāo)是最直接影響最后得分評(píng)優(yōu)的主要因素。
(2)教學(xué)評(píng)價(jià)的web網(wǎng)狀圖如圖3所示,移動(dòng)下方滑塊后的網(wǎng)狀圖如圖4所示??梢?,關(guān)聯(lián)規(guī)則和圖形展示的結(jié)論一致。
3 小結(jié)
本文主要介紹了基于學(xué)生評(píng)教信息,如何利用clementine數(shù)據(jù)挖掘工具采用Apriori算法進(jìn)行建模,再利用Web網(wǎng)狀圖分析進(jìn)行模型評(píng)價(jià)的數(shù)據(jù)挖掘過程,探索學(xué)生評(píng)價(jià)各指標(biāo)與評(píng)價(jià)結(jié)果關(guān)聯(lián)性知識(shí)的方法。本文的研究只是數(shù)據(jù)挖掘應(yīng)用與教學(xué)領(lǐng)域的初級(jí)階段,旨在為后續(xù)的深入研究做鋪墊。
參考文獻(xiàn)
[1]常軍林,張真.數(shù)據(jù)挖掘在高校教學(xué)評(píng)價(jià)中的應(yīng)用[J].中州大學(xué)學(xué)報(bào),2016,33(02):105—107.
[2]張超.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘在高校教學(xué)評(píng)價(jià)中的應(yīng)用研究[D].安徽:安徽大學(xué),2011.
[3]薛薇,陳歡歌.Clementine數(shù)據(jù)挖掘方法及應(yīng)用[M].北京:電子工業(yè)出版社,2010:14-14.
[4]鄭靜靜.高校教學(xué)評(píng)價(jià)體系中關(guān)于學(xué)生評(píng)教的思考[J].文教資料,2013(15):162-163.
[5]紀(jì)希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實(shí)例[M].北京:機(jī)械工業(yè)出版社,2009:7-8.
[6]鄒立娣.數(shù)據(jù)挖掘技術(shù)在教學(xué)評(píng)價(jià)系統(tǒng)中的應(yīng)用研究[D].安徽:合肥工業(yè)大學(xué),2009:24-25.