祁瑞麗,郭學濤,孟軍英,李 瑗
(1.石家莊學院 計算機科學與工程學院,河北 石家莊 050035;2.中國電信集團有限公司石家莊分公司,河北 石家莊 050000)
教學評價是衡量高校教學質量的重要指標,也是教學環(huán)節(jié)的基礎組成部分,關系到學生學習效果和就業(yè)質量.當前的教學質量評價大多按照以下程序展開:首先教學主管部門結合本校實際制定評價指標和評價權重,然后通過網絡對評價量表進行逐項打分,最后,教務部門根據網絡評分劃分教學質量考核等級,并以此作為重要參考對教師進行評優(yōu)評先和年度考核.通常,評價主體采用多元化方式,包括學生評價、同行互評、專家評價等[1-4],各個評價部分按重要程度占有不同的比例.網絡系統(tǒng)評分后,如何合理地利用數(shù)據挖掘技術對大量的評教數(shù)據進行處理和分析,尋找其背后隱藏的有價值信息,更好地為教師和教學管理部門服務,已成為亟待解決的問題[5-7].
本研究首先對評價的原始數(shù)據進行預處理,然后選擇關聯(lián)規(guī)則作為數(shù)據挖掘算法,找出教師信息和課程信息與教學評價結果之間的隱藏聯(lián)系,發(fā)現(xiàn)提高教學質量的相關因素,為今后的課程設置和教學改革提供思路和方法.
數(shù)據挖掘是從大量、未經清洗、隨機的數(shù)據中,抽取出蘊含在其中隱含著有實用價值的信息和知識的過程[8].數(shù)據挖掘系統(tǒng)利用所挖掘的知識類型分類包括:關聯(lián)和相關分析、分類、預測、聚類等[9].
關聯(lián)規(guī)則挖掘是數(shù)據挖掘的一種重要方法,該算法從大規(guī)模數(shù)據集中尋找項間的隱含關系.關聯(lián)規(guī)則挖掘的主要步驟為:
1)找出所有滿足最小支持度的頻繁項集;
2)找出滿足最小支持度和最小置信度的頻繁項集,并產生強關聯(lián)規(guī)則.
關于支持度和置信度有如下定義:
假設I={I1,I2,…,I m}是項的集合.設數(shù)據庫D={T1,T2,…,T n}是數(shù)據庫事務的集合,其中每個事務T i(1<=i<=n)是項的集合,使得T i?I.每個事務有一個唯一標識符TID.關聯(lián)規(guī)則是形如A=>B的蘊涵式,其中 A?I,B?I,且 A∩B=?.
1)支持度:稱D中事務包含A∪B的百分比為規(guī)則A=>B的支持度support,即概率P(A∪B).因此有式(1)成立:
2)置信度:稱D中包含A的事務同時也包含B的百分比為規(guī)則A=>B的置信度confidence,即條件概率P(B|A).因此有式(2)成立:
通常用百分比表示支持度和置信度,二者的閾值由用戶或領域專家設定[10].若一個規(guī)則既滿足最小支持度閾值又滿足最小置信度閾值,則稱其為強關聯(lián)規(guī)則.
最常用的關聯(lián)規(guī)則挖掘算法是Aprioir算法.該算法掃描數(shù)據庫,搜索滿足最小支持度的項,并找出頻繁項的集合.算法多次迭代執(zhí)行,直到不能再找到頻繁K項集為止[10].
將關聯(lián)規(guī)則挖掘技術應用到教學評價分析中,試圖發(fā)現(xiàn)教師信息、課程信息與教學評價結果之間的關聯(lián)性,以便進一步提高教學質量,服務于教學管理.
為了去掉數(shù)據中的噪聲和不一致,提高挖掘結果的質量,采用數(shù)據清理技術對源數(shù)據進行處理.本研究提取石家莊學院計算機學院2014~2018年的學生評價數(shù)據作為源數(shù)據,對其中的不完整、噪聲和不一致進行消除處理,然后采用數(shù)據集成方法,將教師信息表、課程信息表和教學評價信息表整合到一起,并對用戶敏感信息做刪除處理,對教師工號和課程代碼做簡化處理,部分整合后的數(shù)據如表1所示.
為了提高數(shù)據挖掘過程的精度和性能[10],首先要對原始數(shù)據進行必要的轉換.結合上述原始數(shù)據特點及數(shù)據轉換方法,對數(shù)值型數(shù)據主要采用數(shù)據泛化的辦法,將原本分散的數(shù)值映射到特定的區(qū)間和范圍內.對文本型數(shù)據如職稱,則進行離散化處理,將其劃分為不同的類別標識.
具體轉換方法:將年齡分為 4 組:A1[28,35],A2[36,43],A3[44,51],A4[52,59];評定分數(shù)分為 4 組:S1[87,90],S2[91,92],S3[93,95],S4[96,98];職稱劃分為 4 組:L1 初級,L2 中級,L3 副高,L4 正高;對學生人數(shù)進行離散化處理,評價人數(shù)分為 4 組:N1[10,50],N2[51,100],N3[101,150],N4[151,350];教師學位劃分為學士,碩士,博士3個等級.
表1 部分教學評價信息
將處理后的教學評價數(shù)據作為源數(shù)據,采用數(shù)據挖掘工具SPSS Modeler,基于Aprioir算法進行數(shù)據建模,設置支持度和置信度閾值,尋找滿足條件的頻繁項集,分析評價等級相關因素與結果之間的內在聯(lián)系.
2.3.1 學生人數(shù)與評價等級之間的關系
設置數(shù)據流如圖1所示.利用Aprioir算法,對授課班級人數(shù)和教學評價等級進行關聯(lián)分析,得到學生人數(shù)和評價等級的支持度和置信度. 假設最小支持度為10%,最小置信度為45%,得到學生人數(shù)和評價等級的頻繁項集(表2)
圖1 數(shù)據流圖
從表2可以看出,授課班級人數(shù)在151~350人時,評價等級處于91~92分的支持度和置信度分別為10.87%和80.0%;學生人數(shù)在51~100人時,評價等級為93~95分的支持度為39.13%,置信度為47.22%.
2.3.2 教師年齡與評價等級之間的關系
以教師年齡作為輸入項,評價等級作為目標項,得到教師年齡和評價等級之間的支持度和置信度.設置最小支持度10%,最小置信度40%,得到教師年齡與評價等級的頻繁項集(表3).
由表3可知,當教師年齡處于28~35歲時,評價等級處于91~92分的支持度為16.30%,置信度為53.33%;當教師年齡處于44~51歲時,評價等級處于96~98分的支持度和置信度分別為17.39%和43.75%;當教師年齡處于36~43歲時,評價等級處于93~95分的支持度為57.61%,置信度為43.40%.
2.3.3 教師職稱與評價等級之間的關系
以教師職稱作為輸入項,評價等級作為目標項,得到教師職稱和評價等級之間的支持度和置信度.假設最小支持度20%,最小置信度40%,得到教師職稱與評價等級的頻繁項集(表4).
由表4可以看出,教師職稱為中級時,評價等級在93~95分的支持度為48.91%,置信度為40.0%;教師職稱為副高,評價等級在93~95分的支持度和置信度分別為27.17%和44.0%.職稱為副高,評價等級在93~95分的支持度和置信度分別為27.17%和44.0%.
表2 學生人數(shù)和評價等級的頻繁項集
表3 教師年齡與評價等級的頻繁項集
表4 教師職稱與評價等級的頻繁項集
根據以上數(shù)據相關性分析結果,得出如下結論:
1)授課班級的學生人數(shù)對評價結果有重要影響,二者之間大致呈反比關系.學生人數(shù)較少時,教學評價等級較高;反之,則教學評價等級較低.由此可見,授課班級人數(shù)會影響到教學效果與學習質量,人數(shù)超過一定數(shù)量就會影響授課方式、教學組織、課堂互動、作業(yè)批改和輔導答疑,造成學習體驗和學習效果的下降.因此,學院今后在安排課程時,要想提高整體教學質量,就應倡導小班授課模式,積極探索人數(shù)較多的公共基礎課和公選課的教學方法.
2)教師年齡與評價等級之間大致呈反比關系.年齡為44~51歲的教師,教學評價為96~98分的概率較大;年齡為28~35歲的教師,教學評價為91~92分的概率較大.學校應加大對青年教師的培養(yǎng)力度,為其提供培訓和學習的機會,充分發(fā)揮老教師的優(yōu)勢,形成青年教師導師制,以盡快提高青年教師業(yè)務能力和專業(yè)素養(yǎng).
3)教師職稱與評價等級之間沒有直接相關性.無論職稱如何,都不影響教師教學的積極性.
教學效果關系到學生的成長和發(fā)展,對高校人才培養(yǎng)的質量起著關鍵作用.本研究采用關聯(lián)規(guī)則挖掘技術對教學評價數(shù)據進行建模和分析,為高校的教學組織、人才引進和教師培訓等管理工作提供思路.進一步結合課程性質、專業(yè)特點及學生情感因素等挖掘評價數(shù)據,以及分析評價指標的維度和權重設置,以制定具有個性化的評價系統(tǒng),是未來研究的重要方向.