【摘 要】隨著高等教育的快速發(fā)展,高校的生存競爭越來越激烈。其核心競爭力是高校教學(xué)質(zhì)量,優(yōu)質(zhì)的教學(xué)質(zhì)量是高等院校的生命線,是高校進行動態(tài)管理的首要條件,也是實現(xiàn)科學(xué)管理的重要保證。在分析教學(xué)評估現(xiàn)狀基礎(chǔ)上,通過可視化數(shù)據(jù)挖掘工具Rattle,對教學(xué)評價數(shù)據(jù)進行清洗、轉(zhuǎn)換,然后進行指標相關(guān)分析,和各個維度對評價的影響分析,從而通過可視化過程控制達到目標管理。使教務(wù)管理部門能夠及時了解教學(xué)動態(tài)和師資情況,為教務(wù)老師提供相關(guān)決策支持,為職稱評聘提供教學(xué)工作質(zhì)量的科學(xué)依據(jù)。
【關(guān)鍵詞】數(shù)據(jù)挖掘 教學(xué)質(zhì)量 Rattle 可視化
【基金項目】國家社科基金項目“青少年科技創(chuàng)新能力的培養(yǎng)研究”(BCA150050)。
【中圖分類號】G40-057 【文獻標識碼】A 【文章編號】2095-3089(2017)07-0079-02
ZHANG Donghui
Computing Center, Beijing Information Science & Technology University, Beijing 100192,China
【Abstract】With the rapid development of higher education, the Universities struggle for the existence has been becoming more and more intense.The core of the competition lies in the quality of the teaching.The high quality of teaching is the lifeline of the universities.It is one of the most important conditions for the dynamic management of the universities.It also guarantees the realization of the scientific management. In this paper, based on analyzing the present situation of teaching evaluation, through the visual data mining tools Rattle to cleaning, conversion of teaching evaluation data, then index correlation analysis, and to evaluate the effect of each dimension analysis, so as to achieve goals through the visualization process control management. This paper enable the administrative department to find out about teaching development and teachers' situation in time, offer relevant decision support to the teachers of educational administration, offer the scientific basis of teaching work quality for the thing that the professional title is commented and engaged .
【Key words】data mining; teaching quality; rattle; visualization
1.教師教學(xué)評估的現(xiàn)狀
教師教學(xué)活動評價是一個復(fù)雜的過程,僅僅依靠一、兩次的單項評價, 不可能真實反映教師教學(xué)的真實過程,無法修正評價過程中的暈輪效應(yīng)、趨同效應(yīng)等引起的各種偏差[1]。所以,對教師用動態(tài)的、發(fā)展的眼光進行系統(tǒng)的、全程的、較長時間的、循環(huán)往復(fù)的評價是未來的趨勢。只有這樣, 才能充分挖掘教師的潛能, 發(fā)揮教師的特長,進而實現(xiàn)主動創(chuàng)新。
對眾多教師的多個環(huán)節(jié)的評價進行綜合處理,是一項非常復(fù)雜的工作,因此一個好的教師評價系統(tǒng)會帶來很大的方便。目前隨著信息技術(shù)的發(fā)展,一些學(xué)者研究出了基于多元線性回歸、偏最小二乘、支持向量機、神經(jīng)網(wǎng)絡(luò)等教學(xué)質(zhì)量評價方法[2-4],還有學(xué)者提出層次分析法和神經(jīng)網(wǎng)絡(luò)相融合的教學(xué)質(zhì)量評價模型[5]。這些教學(xué)評價是對調(diào)查得出的數(shù)據(jù)進行量化分析,然后得出結(jié)論,并由此做出判斷,在形式與內(nèi)容上顯得比較單一。而且這樣做并不能發(fā)現(xiàn)數(shù)據(jù)中深層次的內(nèi)容,很難找出有關(guān)教學(xué)質(zhì)量的一些規(guī)律。而數(shù)據(jù)挖掘作為一種深層次的數(shù)據(jù)分析方法和有效地解決這一問題的新技術(shù),可以對教學(xué)的質(zhì)量和水平與各因素之間隱藏的內(nèi)在聯(lián)系進行全面透徹的分析[6]。但由于現(xiàn)有數(shù)據(jù)挖掘方法存在操作繁瑣、缺乏個性化教學(xué)質(zhì)量評價,導(dǎo)致基于數(shù)據(jù)挖掘的教學(xué)評價系統(tǒng)實際使用率并不高[7]。本文基于可視化數(shù)據(jù)挖掘工具Rattle分析調(diào)查得到的教學(xué)評價數(shù)據(jù),并對評價數(shù)據(jù)進行合理的處理,從中發(fā)現(xiàn)類似“可能對教師教學(xué)水平產(chǎn)生影響的因素”等問題,以及在什么條件下教師的教學(xué)質(zhì)量和水平是“高的”或“不高的”,幫助教師改進教學(xué)的方法,進而提高教學(xué)的質(zhì)量和水平。
2.可視數(shù)據(jù)挖掘工具rattle的認識
2.1 數(shù)據(jù)挖掘過程
在大數(shù)據(jù)時代下,生活的方方面面都脫離不了數(shù)據(jù)挖掘。大數(shù)據(jù)不僅僅是一個概念、一個話題,而且正在成為生活中的一部分:用大數(shù)據(jù)預(yù)測疾病,用大數(shù)據(jù)助力企業(yè)商業(yè)決策,用大數(shù)據(jù)分析客戶心理。
所謂數(shù)據(jù)挖掘(Data Mining,DM)是指從大量不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、有用的信息和知識的過程。其表現(xiàn)形式為概念、規(guī)則、模式等形式。
一個完整的數(shù)據(jù)挖掘過程包括以下幾個步驟[8](圖1):
3.基于Rattle的教學(xué)質(zhì)量評價
3.1 數(shù)據(jù)準備
數(shù)據(jù)挖掘項目第一步就是收集所有必需的數(shù)據(jù)。在大數(shù)據(jù)時代,不缺乏數(shù)據(jù),但缺乏可轉(zhuǎn)換為信息、知識、智慧的數(shù)據(jù)。
每學(xué)期結(jié)束,筆者所在學(xué)校都會對任課教師的教學(xué)進行評價,本文選用了三年(2013-2015)6個學(xué)期10位教師的“計算機基礎(chǔ)”課程的評價數(shù)據(jù)作為挖掘?qū)ο蟆O葘?shù)據(jù)進行預(yù)處理,刪除異常數(shù)據(jù)后,提取各項評價數(shù)據(jù)見表1。
還需要學(xué)院信息表,學(xué)期信息表,課程信息表(略)。
數(shù)據(jù)準備主要進行如下一些工作:
(1)將“職稱”屬性進行泛化處理,把職稱為教授、研究員等正高級職稱的,泛化為正高,把職稱為副教授、副研究員、高級工程師等副高級職稱的,泛化為副高,把職稱為講師、實驗師、工程師等中級職稱的,泛化為中級,把職稱為助教、助理工程師等初級職稱的,泛化為初級。
(2)對“年齡”屬性進行離散化處理,轉(zhuǎn)換為年齡段區(qū)間。即將年齡分為:小于30、介于30至40之間、介于40至50之間、介于50至60之間、大于60等5個年齡段。
(3)對“分數(shù)”屬性進行離散化處理,轉(zhuǎn)換為分數(shù)區(qū)間等級。分數(shù)屬性離散化結(jié)果如圖3所示。
3.2 各維度因素對教學(xué)質(zhì)量的影響分析
考慮樣本數(shù)量及其代表性情況,對教師年齡、職稱、學(xué)歷、性別等主要屬性進行分析,以期發(fā)現(xiàn)主要屬性與教師評價結(jié)果之間的內(nèi)在聯(lián)系。
(1)教師維度與指標C1(教書育人,為人師表)分析(圖4)
從圖4左上角的得分分布和左下角的得分熱力圖情況可以看到,C1得分分布集中在9.3-9.7之間。從圖4右上角可以看到每位教師C1得分分析,有4個離群值,可以通過追溯原始數(shù)據(jù),分析這4個數(shù)據(jù)產(chǎn)生的原因。從每位教師的箱線圖可看出最高分、最低分、平均分、分位數(shù)等信息,平均分最高的是lili老師,Wang-dh對指標C1不穩(wěn)定,比較穩(wěn)定的是lili和zhang-hui。從圖4左下角可以看到C1得分集中的點(顏色越淺得分密度越大)。
同理,基于Rattle可以分析每位教師的其它指標(C2,..,C10)情況。
(2)性別維度對指標C2(精神飽滿,富有激情)和C3(注重交流,師生互動)的影響(圖5)
圖5 性別維度對指標C2和C3的影響
圖5的左上角和中間部分顯示的是所有教師的C2指標和C3指標的得分分布情況,可以看到C2大部分得分分布在8.3~9.8分之間,C3大部分得分分布在7.6~10分之間,結(jié)合圖5右邊的箱線圖,從得分分值的角度分析,看到C2的分數(shù)更集中一些,且集中于高分段,說明教師們上課時的精神飽滿狀態(tài)好于師生互動的投入。圖5的左下角和中下部分顯示的是男教師和女教師的C2和C3指標得分的對比情況,可以看到無論C2指標還是C3指標得分男教師的得分范圍都大于女教師,說明男教師的個體差異大于女教師,在講課時精神面貌和師生互動環(huán)節(jié)有欠缺的男教師比例大于女教師。
同理,基于Rattle可以分析職稱維度對指標的影響,學(xué)歷維度對指標的影響,學(xué)院維度對指標的影響,課程維度對指標的影響。
(3)指標相關(guān)分析(圖6)
圖6中,藍色越深(圈越大)表明其正相關(guān)性越強,黃色越深(圈越大)負相關(guān)越強,我們在設(shè)計指標時,希望指標獨立(負相關(guān)越大越好)。圖說明指標C4(方法新穎,深入淺出)和指標C5(備課充分,內(nèi)容充實)過于相關(guān),最好重新設(shè)計這兩個指標。
(4)教師維度與學(xué)期維度分析(圖7)
圖7顯示了教師2013-2015年的6個學(xué)期的上課門數(shù)情況,可以清楚看到wang-dh老師的上課總門數(shù)最多,hu-xf老師最少。各個老師各學(xué)期承擔的教學(xué)任務(wù)各不相同
(5)總的評價得分(分數(shù))與學(xué)歷維度之間的關(guān)系分析(圖8)
圖8 顯示所有教師的不合格率為18% ,合格率為23%,中等為18%,良好為21%,優(yōu)秀為20%。按教師的學(xué)歷分層為擁有碩士或博士學(xué)歷的教師和擁有博士學(xué)位的教師,前一層次的教師(碩博)中不合格為20% ,合格率為25%,中等為16%,良好為21%,優(yōu)秀為18%,后一層次的教師(博士)中不合格為18% ,合格率為28%,中等為21%,良好為13%,優(yōu)秀為21%。
本文中的合格率和優(yōu)秀率的計算與傳統(tǒng)方法不同,采用末位警告制,是分層次計算各個層次的不合格率和優(yōu)秀率,是局部角度而不是全局角度,這樣的統(tǒng)計更能準確評價與維度之間的關(guān)系。
4.結(jié)束語
隨著網(wǎng)絡(luò)技術(shù)與數(shù)據(jù)庫技術(shù)的迅速發(fā)展,人們所積累的數(shù)據(jù)越來越多,需要挖掘出這些數(shù)據(jù)背后隱藏的許多有用的信息和知識,在教育領(lǐng)域也是一樣。使用傳統(tǒng)的評價方法,即不客觀也不高效,已經(jīng)滿足不了現(xiàn)代教學(xué)發(fā)展的需要。人們希望能夠?qū)@些教學(xué)評價數(shù)據(jù)進行多角度、高層次的分析和處理,希望從中能發(fā)現(xiàn)更多、更有用的知識和信息,為提高教學(xué)質(zhì)量提供更多的方法和措施。本文利用Rattle分析了教學(xué)質(zhì)量評價數(shù)據(jù)。用戶只需要選擇相關(guān)菜單命令、對話框或者按鈕就可以實現(xiàn)對教師教學(xué)質(zhì)量的可視化評價。操作簡單快捷,結(jié)果顯示形象而直觀。
參考文獻:
[1]胡平波.高校教師教學(xué)質(zhì)量評價指標體系維度結(jié)構(gòu)及測量[J].江西財經(jīng)大學(xué)學(xué)報,2010,69(3):111 -118.
[2]劉強,戴起勛.高等教育大眾化條件下教學(xué)質(zhì)量評價體系研究現(xiàn)狀[J].江蘇大學(xué)學(xué)報,2003,25(2):31-34.
[3]劉偉,孫林.基于支持向量機的課堂教學(xué)質(zhì)量評價[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2010,33(7):968-971.
[4]孫曉玲,王寧,梁艷.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的教學(xué)評價模型及仿真[J].計算機仿真,2010,27(11):314-317.
[5]馮瑩瑩,于干,周紅志.層次分析法和神經(jīng)網(wǎng)絡(luò)相融合的教學(xué)質(zhì)量評價[J].計算機工程與應(yīng)用,2013,49(17):235-238.
[6]羅美淑,劉世勇,夏春艷.數(shù)據(jù)挖掘技術(shù)在教學(xué)評價中的應(yīng)用研究[J].教育探索,2013,2(260):81-83.
[7]陳青山.決策樹算法在高校教學(xué)質(zhì)量評價系統(tǒng)中的應(yīng)用研究[D].成都: 西南交通大學(xué)碩士學(xué)位論文,2010.
[8]Yanchang Zhao(陳建,黃琰 譯).R語言與數(shù)據(jù)挖掘——最佳實踐和經(jīng)典案例[M].北京:機械工業(yè)出版社,2015.
[9]Graham Williams.Data Mining with Rattle and R[M]. Springer Science+Business Media,2011.
作者簡介:
張冬慧(1969-),女,博士, 計算機實驗師,研究領(lǐng)域為計算機教育應(yīng)用。