張美華++歐云
摘要:隨著高校數(shù)據(jù)的信息化,各高校啟用了教務(wù)信息管理、學(xué)生信息管理、教師信息管理等系統(tǒng)電子化,積累了完整的大量數(shù)據(jù),大多數(shù)學(xué)校面對這些數(shù)據(jù),僅僅用于簡單的教師統(tǒng)計和學(xué)生查詢操作,數(shù)據(jù)挖掘技術(shù)可以挖掘出數(shù)據(jù)背后隱藏的更有價值的信息。用數(shù)據(jù)挖掘技術(shù)有效的分析高校學(xué)生對教師上課評價的數(shù)據(jù),找到教師課堂教學(xué)質(zhì)量與職稱、年齡、學(xué)歷、專業(yè)素養(yǎng)等之間的關(guān)聯(lián),可以幫助學(xué)校管理者構(gòu)建科學(xué)、完備的評價系統(tǒng)通用模型,保證更加科學(xué)的為學(xué)生服務(wù),合理的調(diào)整教師結(jié)構(gòu),使教師能在更適合自己的位置上發(fā)揮其能力。
關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;apriori算法;教學(xué)評價
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)01-0031-04
Application of Data Mining in the Colleges'Teaching Quality Evaluation
ZHANG Mei-Hua, OU Yun
(School of Information Science and Engineering,Jishou University, Jishou 416000, China)
Abstract:with the data information in universities, universities now have applied the informational system in the management of academic affairs, students and teaching staff and have accumulated a lot of complete date. However, in the use of these data, the majority of universities only conduct statistical and query operations. The Date Mining technology can dig out ore valuable information hidden behind the data. the Data Mining technology enables universities to effectively analyze the data of College Students' evaluation of teachers, to find the relationship between teachers' teaching quality and their professional titles, age, education level, and proficiency. Data Mining can also help the school management to build a scientific and comprehensive evaluation system for general use, to ensure the students' service, and to adjust the structure of teaching staff reasonably, so that teachers can better realize their potentials at their positions.
Key words: data mining; association rule; Apriori algorithm; teaching evaluation
1 概述
隨著高校擴招,學(xué)生數(shù)量急劇增多,為了培養(yǎng)高質(zhì)量的大學(xué)生,急需把握高校教師教學(xué)質(zhì)量,隨著網(wǎng)絡(luò)的普及,很多高校采用學(xué)生作為主體通過網(wǎng)絡(luò)平臺對任課教師的課堂教學(xué)質(zhì)量進行評價,評教系統(tǒng)的指標體系是影響學(xué)生評教的重要因素,學(xué)生網(wǎng)上評教是高校教學(xué)質(zhì)量監(jiān)控的一種重要方式和手段[1],是師生之間交流和溝通的重要平臺,也是教學(xué)管理部門及時獲取教師課堂教學(xué)信息,了解教學(xué)運行狀態(tài)的重要渠道。
我國大部分高校在多年教學(xué)中積累了海量數(shù)據(jù),但這些數(shù)據(jù)很多僅被用來簡單的數(shù)據(jù)查詢和數(shù)據(jù)統(tǒng)計,真正隱含其中的有用信息卻極少得到利用[2],極大的浪費了資源。因此,如何從技術(shù)上改變目前高校教學(xué)評價系統(tǒng)存在的問題和不足,進一步利用積累下來的大量數(shù)據(jù),用科學(xué)的理論和方法來客觀的評價教師教學(xué)質(zhì)量,已成為教學(xué)領(lǐng)域急需解決的一個問題。
2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining,DM),是從已有數(shù)據(jù)中挖掘出未知的、隱藏的、對決策制定有潛在價值的趨勢、關(guān)系、模式,并利用挖掘出來的關(guān)系模式建立用于決策支持的數(shù)據(jù)模型,并提供預(yù)測性工具、方法、和過程,是利用各種分析工具在大量已有數(shù)據(jù)中構(gòu)建模型和挖掘數(shù)據(jù)間關(guān)系的過程,挖掘出的模型和關(guān)系可以為分析風(fēng)險、預(yù)測結(jié)果提供有力的支持。數(shù)據(jù)挖掘的研究成果應(yīng)用于社會各行各業(yè),同樣也用于教育領(lǐng)域[3],將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校教師教學(xué)質(zhì)量評價系統(tǒng)中,從已有的大量數(shù)據(jù)中提取挖掘出有用的關(guān)聯(lián)規(guī)則,對提高高校管理者的決策能力和管理水平有深遠的意義,并可以合理安排班級課表,提高學(xué)生學(xué)習(xí)興趣,調(diào)整高校教師結(jié)構(gòu)。
2.1 數(shù)據(jù)挖掘步驟
數(shù)據(jù)挖掘過程主要有數(shù)據(jù)準備、規(guī)律尋找和規(guī)律表示三個步驟。數(shù)據(jù)挖掘基本過程如圖1所示。
圖1 MD的基本過程
1)數(shù)據(jù)準備。從海量數(shù)據(jù)源中根據(jù)需要選擇數(shù)據(jù),經(jīng)過布爾轉(zhuǎn)換成可用于數(shù)據(jù)挖掘的數(shù)據(jù)集。
2)數(shù)據(jù)挖掘。利用適合的算法將整合數(shù)據(jù)集中隱藏的有用規(guī)律挖掘出來。
3)結(jié)果表達和解釋。指使用用戶可以理解的方式將步驟二找到的有用的規(guī)律表達出來,為用戶提供切實可行的方法。[3]
2.2 數(shù)據(jù)挖掘方法
利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析的常用方法有關(guān)聯(lián)、分類、聚類、異常檢測等方法,從不同的側(cè)重點和不同的角度對數(shù)據(jù)進行挖掘。
數(shù)據(jù)挖掘是制定決策的支持過程,通過分析現(xiàn)有數(shù)據(jù)庫中的海量數(shù)據(jù),找出隱藏在數(shù)據(jù)間未知的特征,進而推導(dǎo)出有指導(dǎo)性意義的規(guī)律,挖掘得到有效可行的模式,幫助管理者調(diào)整策略方向,制定正確的方案。這對于一個企業(yè)和教育系統(tǒng)的發(fā)展十分重要。
2.3 關(guān)聯(lián)規(guī)則及Apriori算法
關(guān)聯(lián)規(guī)則最初提出的動機是針對購物籃分析(Market Basket Analysis)問題提出的。1993年,Agrawal等人首先提出超市已有大量數(shù)據(jù)庫中各項集間的關(guān)聯(lián)問題,并率先提出了挖掘算法AIS。1994年,提出了著名的Apriori算法,至今Apriori算法仍然作為關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法被廣泛討論。
關(guān)聯(lián)規(guī)則用于發(fā)現(xiàn)實體與其他實體間的相互關(guān)聯(lián)性或依賴性,用來揭示數(shù)據(jù)之間沒有直接表示出來的相互關(guān)系,關(guān)聯(lián)分析的基本任務(wù)是發(fā)現(xiàn)實體間的關(guān)聯(lián)規(guī)則和相關(guān)程度。
關(guān)聯(lián)規(guī)則定義為:
假設(shè) I={i1,i2,…,im}是 m 個不同項目的集合,其中的元素稱為項(Item)。設(shè) D 為記錄 (Transaction)T 的集合,T 是項的集合,且T?I,對應(yīng)每一個記錄都有唯一的標識,如記錄號,記作 TID。一個關(guān)聯(lián)規(guī)則是形如 X=>Y 的蘊涵式,這里 X?I,Y?I,并且 X∩Y=Φ。X 稱為規(guī)則的前提,Y 是結(jié)果。規(guī)則 X=>Y 在交易數(shù)據(jù)庫D中的支持度(Support)是交易集中包含 X 和Y 的交易數(shù)與所有交易數(shù)之比,記為 Support(X=>Y),即 Support(X=>Y)=|{T:X∪Y?T,T∈D}|/|D|。規(guī)則 X=>Y 在交易集中的可信度(Confidence)是指包含 X和 Y 的交易數(shù)與包含 X 的交易數(shù)之比,記為 Confidence (X=>Y),即Confidence(X=>Y)=|{T:X∪Y?T,T∈D}|/|{T:X?T,T∈D}| [4]。
Apriori算法是基于挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法,核心是采用兩階段頻集思想的遞推算法,通過多次掃描數(shù)據(jù)庫的數(shù)據(jù)來完成。 其算法包含兩個步驟:1)連接;2)剪枝。
Apriori算法描述見參考文獻3和參考文獻4。
3 Apriori算法在高校教學(xué)質(zhì)量評價系統(tǒng)的應(yīng)用
高校教師的教學(xué)質(zhì)量評價以教師個體及其教學(xué)行為為主要評價對象,通過學(xué)生對教師提交的評價結(jié)果,教師可以及時了解學(xué)生對他的滿意程度及具體需求,適當(dāng)調(diào)整提升自己,更正教學(xué)方向和目標,完善教學(xué)過程,使得教學(xué)效果最優(yōu)化。
下面以吉首大學(xué)為例,闡述數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則在教學(xué)評價中的應(yīng)用。吉首大學(xué)教務(wù)處教務(wù)中心已經(jīng)積累歷年學(xué)生對教師評價的各項數(shù)據(jù),并且這些數(shù)據(jù)的格式可以轉(zhuǎn)換為滿足挖掘要求的格式。
3.1 確定挖掘目標,進行數(shù)據(jù)采集
下面利用隨機抽取法對2014年度吉首大學(xué)教師教學(xué)質(zhì)量評估表進行數(shù)據(jù)的提取,提取出來的數(shù)據(jù)具有一定的代表性,剔除空白數(shù)據(jù)和一些沒有意義的數(shù)據(jù),共300份。將抽取到的表中字段年齡、職稱和評價分數(shù)輸入數(shù)據(jù)表score中,調(diào)用評教程序,得到每位教師的評價結(jié)果,評價產(chǎn)生的數(shù)據(jù)存在outcome表中,表中每條記錄與一位教師的數(shù)據(jù)對應(yīng),表結(jié)構(gòu)包括字段屬性有:編號、年齡、學(xué)歷、職稱、課前準備、教態(tài)形象、教學(xué)方法、教學(xué)組織、作業(yè)評閱等,通過數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則,找出學(xué)歷、年齡、職稱和評價結(jié)果分數(shù)之間的關(guān)系。
3.2 數(shù)據(jù)整合
將教師信息表、學(xué)生評教結(jié)果表和學(xué)生成績表根據(jù)關(guān)鍵字段進行整合,整合后的表結(jié)構(gòu)如表1所示。
表 1 整合后的表結(jié)構(gòu)
[屬性名稱\&屬性說明\&編號ID\&教師編號\&年齡N\&教師現(xiàn)在年齡\&學(xué)歷X\&教師最終學(xué)歷\&職稱Z\&教師現(xiàn)在的職稱級別\&課前準備K\&課前是否準備充分,教案、課件等是否認真準備\&教態(tài)形象Y\&教態(tài)大方,精神飽滿,普通話標準,語言生動,感染力強\&教學(xué)方法F\&善于啟發(fā)誘導(dǎo),教學(xué)方法靈活,樂于與學(xué)生交流,合理運用現(xiàn)代化教學(xué)手段,效果良好,提高學(xué)生學(xué)習(xí)興趣\&教學(xué)組織J\&授課內(nèi)容適中,反映學(xué)科發(fā)展新動態(tài),闡述準確,重點突出,難點講透,不照本宣科\&作業(yè)評閱P\&作業(yè)評閱認真,成績評定公正,問題講評及時\&學(xué)生及格率G\&教師所授課程的學(xué)生對象平均及格率\&]
為了方便系統(tǒng)分析,得到正確的關(guān)聯(lián)規(guī)則整合后的數(shù)據(jù)必須進行數(shù)字化處理轉(zhuǎn)換為布爾類型。
年齡:N1 [20,30];N2[31, 35];N3[36,49];N4[50,60]。
學(xué)歷:X1:博士研究生;X2:碩士研究生;X3:本科;X4:???。
職稱:Z1:教授;Z2:副教授;Z3:講師;Z4:助教。
課前準備:優(yōu):K1;良:K2;中:K3;差:K4。
教態(tài)形象:優(yōu):Y1;良:Y2;中:Y3;差:Y4。
教學(xué)方法:優(yōu):F1;良:F2;中:F3;差:F4。
教學(xué)組織:優(yōu):J1;良:J2;中:J3;差:J4。
作業(yè)評閱:優(yōu):P1;良:P2;中:P3;差:P4。
學(xué)生及格率:90%-100%:G1;80%-89%:G2;70%—79%:G3; 60%以下:G4。將以上數(shù)據(jù)進行預(yù)處理,得到數(shù)據(jù)如表2所示。
表2 預(yù)處理后的數(shù)據(jù)
[編
號\&年齡\&學(xué)歷\&職
稱\&課前準備\&教態(tài)形象\&教學(xué)方法運用\&教學(xué)組織\&作業(yè)評閱\&學(xué)生成績(平均及格率)\&200001\&N4\&X2\&Z1\&K1\&Y1\&F1\&J1\&P1\&G1\&200212\&N2\&X2\&Z3\&K2\&Y3\&F3\&J3\&P3\&G2\&200213\&N3\&X2\&Z1\&K1\&Y3\&F1\&J2\&P1\&G1\&200304\&N4\&X1\&Z1\&K2\&Y2\&F2\&J2\&P3\&G2\&200415\&N3\&X2\&Z3\&K3\&Y3\&F3\&J3\&P4\&G2\&200416\&N3\&X2\&Z3\&K3\&Y3\&F3\&J3\&P4\&G2\&200507\&N4\&X2\&Z1\&K2\&Y2\&F2\&J2\&P2\&G2\&200518\&N4\&X2\&Z1\&K1\&Y2\&F2\&J1\&P2\&G1\&201009\&N3\&X2\&Z3\&K2\&Y3\&F3\&J3\&P4\&G2\&201010\&N3\&X2\&Z2\&K2\&Y2\&F1\&J1\&P1\&G2\&…\&…\&…\&…\&…\&…\&…\&…\&…\&…\&]
3.3 挖掘關(guān)聯(lián)規(guī)則
下面以分析表2中的10條記錄為例,闡述關(guān)聯(lián)規(guī)則的挖掘過程。先用關(guān)聯(lián)規(guī)則算法Apriori算法產(chǎn)生如表3、表4、表5、表6四個頻繁項集,再根據(jù)頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則。
表3
[Item1\&frequent\&N4\&4\&X2\&9\&Z1\&5\&Z3\&4\&K2\&5\&Y2\&4\&Y3\&5\&J3\&4\&G2\&7\&]
表4
[Item1\&Item2\&frequent\&N4\&G2\&2\&N3\&G2\&4\&G2\&X2\&5\&M2\&X2\&4\&Y3\&X2\&4\&Y3\&F3\&4\&X2\&F3\&4\&Y2\&Z1\&4\&X2\&Z1\&4\&Y3\&Z3\&4\&X2\&Z3\&4\&W3\&Z3\&4\&]
表5
[Item1\&Item2\&Item3\&frequent\&N3\&X2\&G2\&4\&Y3\&X2\&F3\&4\&Y3\&X2\&Z3\&4\&Y3\&F3\&Z3\&4\&X2\&F3\&Z3\&4\&]
表6
[Item1\&Item2\&Item3\&Item4\&Item5\&frequent\&N3\&Y3\&X2\&F3\&Z3\&4\&]
3.4 關(guān)聯(lián)結(jié)果分析
在大量數(shù)據(jù)中利用Apriori算法挖掘布爾關(guān)聯(lián)規(guī)則,可以得到強關(guān)聯(lián)規(guī)則有一下四條:
N3,Z3,X2?Y3 (Sups:38%,Confs:100%)
Z2?N3,Y3,F(xiàn)3 (Sups:39%,Confs:100%)
N3,X2,Z3? F3 (Sups:40%,Confs:100%)
N3,X2,Z3? Y3,F(xiàn)3 (Sups:40%,Confs:100%)
規(guī)則1表明:年齡在36~49歲,學(xué)生對其評定為優(yōu)秀的可能性是38%;
規(guī)則2表明:職稱是副高的,學(xué)生對其評定為優(yōu)秀的可能性是39%。
從上述關(guān)聯(lián)規(guī)則可以得到下列評價結(jié)果:
1)年齡31~49歲的教師大多數(shù)學(xué)歷為碩士,大多數(shù)職稱較高的教師深得學(xué)生喜歡,教態(tài)大方,教學(xué)時精神飽滿,有豐富的教學(xué)經(jīng)驗;講師職稱的青年教師,在作業(yè)評閱和教學(xué)組織方面得分較高,工作認真負責(zé);
2)年齡50~60歲以上年齡層的骨干教師占有較大比例,專業(yè)素質(zhì)高且?guī)煹潞徒虒W(xué)態(tài)度好的教師教的學(xué)生及格率很高;
3)高職稱的教師其師德與教學(xué)態(tài)度受到學(xué)生的一致好評。
通過對高校教師的年齡、學(xué)歷、職稱、專業(yè)素質(zhì)、教學(xué)組織、學(xué)生成績等大量數(shù)據(jù)進行整合挖掘,得到以下信息:在高等學(xué)校中,年齡在30-40歲之間的教師多為中級職稱,學(xué)歷中等,注重儀容,普通話較標準,教學(xué)手段新穎,喜歡接受新知識,容易被學(xué)生接受;40-49歲教師多為副教授,教學(xué)方法多樣,科研能力強,能夠很好地將教學(xué)與科研有效結(jié)合,促進學(xué)生科研能力的增長;初級職稱教師由于教學(xué)經(jīng)驗少,缺乏實踐,學(xué)生反映問題較多,應(yīng)加強教學(xué)組織能力,教學(xué)方法多樣化。通過關(guān)聯(lián)規(guī)則挖掘出來的規(guī)律,學(xué)校教務(wù)處給各班級排課時,應(yīng)根據(jù)學(xué)生特性合理配備教師年齡、職稱分配,使學(xué)生保持良好的學(xué)習(xí)狀態(tài),提高學(xué)生的學(xué)生興趣。
4 結(jié)語
本文將學(xué)校教務(wù)處系統(tǒng)數(shù)據(jù)庫中已經(jīng)存在的海量數(shù)據(jù),利用關(guān)聯(lián)規(guī)則進行數(shù)據(jù)挖掘,尋找學(xué)生和教師數(shù)據(jù)間隱藏的潛在有價值的關(guān)系,為檢查教學(xué)效果和提高教學(xué)質(zhì)量提供了正確有效的指導(dǎo),本文利用關(guān)聯(lián)規(guī)則算法Apriori算法對教師和學(xué)生成績數(shù)據(jù)庫中的數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘,探討了教師年齡、職稱、學(xué)歷、課前準備、教態(tài)形象、教學(xué)方法、教學(xué)組織、作業(yè)評閱等和學(xué)生成績之間的關(guān)系,得出了行之有效的結(jié)論,并促使教師不斷認識自己,提升自己。這種方法對高校其他指標的評定體系的建立和完善也是有效的,具有一定的指導(dǎo)作用。
參考文獻:
[1] 黃夢橋,李杰. 因素挖掘法在投資學(xué)課程中的教學(xué)實踐[J].吉首大學(xué)學(xué)報(自然科學(xué)版),2015(4):80-83.
[2] 文偉,陳晟. 從數(shù)據(jù)到?jīng)Q策的大數(shù)據(jù)時代[J].吉首大學(xué)學(xué)報(自然科學(xué)版),2014(3):31-36.
[3] Pang-Ning Tan,Michael Steinbach,Vipin Kumar.數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫M].北京:人民郵電出版社,2014.
[4] David H, HeikkiM, Padhraic S. 數(shù)據(jù)挖掘原理[M].北京:機械工業(yè)出版社, 2001.
[5] 毛國君,段立娟,王實,等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005:86-152.
[6] 劉星沙,譚利球,熊擁軍,等.關(guān)聯(lián)規(guī)則挖掘算法及其應(yīng)用研究[J].計算機工程與科學(xué),2007(5).