楊新平,徐登國,楊成宏
(1,2.楚雄師范學院,云南 楚雄 675000;3.楚雄市北浦中學,云南 楚雄 675000)
學生評教成績計算方法的探討*
楊新平1,徐登國2,楊成宏3
(1,2.楚雄師范學院,云南 楚雄 675000;3.楚雄市北浦中學,云南 楚雄 675000)
摘要:根據(jù)學生評教數(shù)據(jù),建立列聯(lián)表,并進行一致性檢驗。在此基礎(chǔ)上,提出一種高校教師學評成績的改進算法,這種算法和傳統(tǒng)算法相比較更加合理,計算結(jié)果更具有說服力,最后進行實證分析。
關(guān)鍵詞:學生評教;列聯(lián)表;概率矩陣;結(jié)構(gòu)相對數(shù)
學生評教起源于20世紀20年代早期的美國,Purdue用于收集學生評教信息的等級量表的第一次出版,標志著學生定量評價教學質(zhì)量的誕生[1]。80年代后,學生評價已成為大學教學評價的一個重要組成部分,評價的技術(shù)也越來越現(xiàn)代化[2]。目前學生評價教師已經(jīng)被美國和西方大多數(shù)國家認為是最基本的教學質(zhì)量評價方式,我國高校學生評價授課教師的教學質(zhì)量始于80年代中期。學生評教的目的是充分調(diào)動學生的參與積極性,結(jié)合自己的感受對教師課堂教學效果進行客觀評價,讓老師能了解自己教學的優(yōu)點、缺點及不足,進行自我完善[3]。國外學生評教的研究主要集中在學生評教的重要性、可靠性和有效性以及影響學生評教的主要因素和偏差這幾個層面。國內(nèi)高校學生評教的研究主要集中在學生評教的意義、作用及組織過程,利弊分析和對策,指標體系研究,學生評教與師生關(guān)系以及學生評教的有效性和影響因素等各個層面。
國外的研究主要是基于統(tǒng)計與數(shù)據(jù)分析的實證研究,國內(nèi)定性研究居多,缺乏學生評價數(shù)據(jù)所含有的真實信息作支撐。王海驪以“學生評教”為檢索詞,檢索了中國期刊網(wǎng)2000年至2010年的論文,共檢索到686篇相關(guān)論文,其中基于數(shù)據(jù)分析的學生評教有效性研究有11篇,僅占1.6%[4]。筆者研究發(fā)現(xiàn),國內(nèi)學生評教研究,絕大多數(shù)都是使用方差分析或者回歸分析的方法。如毛豐付用啞變量回歸分析法對浙江某校學生評教的基礎(chǔ)數(shù)據(jù)進行計量分析,得出高校學生評教結(jié)果是有效且有偏的結(jié)論[5]。王海驪、劉晶應(yīng)用單因素方差分析和相關(guān)分析的方法得到如下結(jié)論:課程類型、教師職稱、教師性別對學生評教結(jié)果無顯著影響;學生年級與學生評教結(jié)果具有較小的相關(guān)性,課程分數(shù)與學生評教結(jié)果不相關(guān),督導(dǎo)評教與學生評教具有一定的相關(guān)性,同一教師同一課程的學生評教結(jié)果更加趨于穩(wěn)定[6]。張巖,夏秀峰應(yīng)用ERD技術(shù)設(shè)計了數(shù)據(jù)集市的概念模型,并且進一步確定了數(shù)據(jù)集市的數(shù)據(jù)源和各個主題域[7],但該模型只給出一抽象的概念模型框架,沒有進行實證分析和驗證。丁福興[8],楊毅紅[9]從描述統(tǒng)計的角度介紹了一些學評數(shù)據(jù)的分析方法。還有部分文獻從學評數(shù)據(jù)中的異常值出發(fā),對學評數(shù)據(jù)進行分析。如姚成、龔毅等從標準化得分的角度討論了異常數(shù)據(jù)的特點,給出篩選流程,提出了處理方法[10]。這些研究方法均未涉及一個關(guān)鍵的問題,那就是有了學生評教數(shù)據(jù),且這些學評數(shù)據(jù)是有效的,如何根據(jù)這些實際的學評數(shù)據(jù)計算受評教師的學評成績,并且要求這個成績能真實反映受評教師的實際教學水平。傳統(tǒng)計算方法是:用各個評價項目的平均成績作為該評價項目得分的估計,再把各個評價項目的得分估計匯總得到一個分數(shù),此分數(shù)就作為受評教師的學評成績。這種計算方法在每個評價項目沒有異常值,且每個評價項目的評價指標的各個類別分布差別不大的情況下是適用的,得到的成績是穩(wěn)定有效的。但實際情況是這兩個條件很難滿足,導(dǎo)致的結(jié)果是學生評教成績普遍出現(xiàn)虛高的現(xiàn)象。還有一種情況是計算學生評教成績時,數(shù)據(jù)信息出現(xiàn)重疊統(tǒng)計的情況。比如文中實證部分給出某高校大學語文的學生評教成績?yōu)?00.95,這個成績是由學校教學管理部門計算出來的,沒有綜合考慮上述兩個條件,且學評數(shù)據(jù)信息被重復(fù)統(tǒng)計,導(dǎo)致成績明顯偏高。本文針對這種現(xiàn)象,重新構(gòu)造計算學生評教成績的方法,并給出最后的評價結(jié)果。
(一)傳統(tǒng)算法
將學生教學評價卡中評價項目的四個方面:教學態(tài)度、教學內(nèi)容、講授能力 (教學素質(zhì))、教學方法視為四個總體,分別記為Xk(k=1,2,3,4),每個總體均有數(shù)目不等的評價項目。對于第k個總體Xk的前mk個評價項目,不妨稱之為一般評價項目,最后一個評價項目是總體評價項目,記為第mk+1項。每個總體的評價項目的評價指標分成四個等級,分別為優(yōu)、良、中、差,分別用[A]、[B]、[C]、[D]表示 (詳見附件1:教學評價卡和附件2:教學評估表)。實際測評時,學生只需用鉛筆將相應(yīng)的字母涂黑,同時對每個評價事項打分,可以從評價卡計算出各個評價指標學生評定結(jié)果的頻次。
為n份教學評價卡總體評價項目的學生評教的最后得分。這是計算學生評教成績傳統(tǒng)的方法,分別得到一般評價項目得分和總體評價項目得分兩個成績,這兩個分數(shù)不能以任何方式求和,否則信息統(tǒng)計重疊。用各個總體的各個評價項目的平均分表示受評教師的該項目得分,由于內(nèi)部分組的數(shù)據(jù)計算平均值作為總體均值的估計時,各組頻數(shù)會對總平均產(chǎn)生影響[11],所以上述算法存在缺陷,需要進行修正。上述算法未考慮學生在n份教學評價卡評價指標的各個等級的分布信息,這樣計算得到的分數(shù)作為受評教師的學評分數(shù),是不合理的,不能真實反映受評教師的真實教學水平。
(二)列聯(lián)表的建立
假定:(1)各個評價項目是相互獨立的;(2)總體之間的相關(guān)性可忽略;(3)評教數(shù)據(jù)是客觀可信的 (許多文獻的研究已證實這一點);(4)任何兩份教學評價卡填寫是相互獨立的。
(三)改進算法
表1 n份有效教學評價卡數(shù)據(jù)匯總表 (一般評價項目)
本文以某高校公共課 (大學語文)53份教學評價卡及53份教學評估表采集的數(shù)據(jù) (詳見附件1,2,涉及的學校及教師隱去了姓名)作為樣本,展開討論。53份教學評價卡采用 (二)所述方法,經(jīng)數(shù)據(jù)處理后分別得到一般評價項目和總體評價項目的4×4列聯(lián)表 (表2、表3)。分別對兩個列聯(lián)表進行一致性檢驗得知,四個總體的評價指標的分布是有顯箸差異的,因而在計算學評結(jié)果的最后成績時一定要考慮評價指標的分布特征,否則將導(dǎo)致受評教師成績評定不準確。
表2 53份有效教學評價卡數(shù)據(jù)匯總表 (一般評價項目)
表3 53份有效教學評價卡數(shù)據(jù)匯總表 (總體評價項目)
大學語文四個總體一般評價項目的得分向量為y=(15.11,26.76,19.29,20.22),該得分向量中,得分最高的是教學內(nèi)容,說明教學內(nèi)容的確會直接影響到學生對教師的評教結(jié)果。53名學生的最后評教得分為s=81.3799分.如果根據(jù)這個分數(shù),受評教師的一般項目的學生評教成績定為“良”。另外,四個總體的總體評價得分向量為y1=(3.83,3.67,3.77,3.58),最后總體評價得分為 s1=14.8499分,折算成百分制為74.2495分。按總體評價教師學生評教成績?yōu)椤爸小?,兩者的評價結(jié)果不一致。這兩個分數(shù)是按傳統(tǒng)算法得到的,沒有考慮53名學生在教學評價卡中評價指標各個等級的分布特征。總體評價是對各個總體進行總的評價,用加權(quán)平均作為該名教師的學評成績,存在重復(fù)統(tǒng)計,是不合理的。如果忽略統(tǒng)計信息的重復(fù)應(yīng)用,用兩者的平均分77.8147分作為受評教師的學生評教成績,則該名教師的學生評教成績?yōu)椤爸小?,與后文采用改進算法進行計算得到的結(jié)論是一致的。
由z=yp^(49.8140,28.5711,2.9948,0),z的四個分量之和為81.3799分,正是53名學生最后的一般評價得分。但分數(shù)被分成四個部分,“優(yōu)”得49.8140分,“良”得28.5711分,“中”得2.9948分,“差”得0分。在一般情況下,四個總體中,評價指標等級為“差”的頻次接近于0,這是因為高校教師從事的教學工作專業(yè)性較強,如果教師的教學能力較差,通常學生會集體要求更換任課教師,所以等級為“差”的頻次為0是合理的。良以上的得分為78.3851分,未達到80分以上,一般評價項目學生評教成績定為“中”。通過計算,一般評價項目各等級分數(shù)的結(jié)構(gòu)相對數(shù)向量為r=(0.612117,0.351083,0.0368,0)。
由z1=y1Q^(9.7777,4.8679,0.2043,0)得到z1的四個分量和為14.8499分,正是53名學生最后的總體評價得分。分數(shù)仍被分成四個部分,“優(yōu)”得9.7777分,“良”得4.8679分,“中”得0.2043分,“差”得0分。良以上得分為14.6453分,折算成百分制為73.2765分,總體評價項目學生評教成績定為“中”。同樣計算總體評價項目各等級分數(shù)的結(jié)構(gòu)相對數(shù)向量是r1= (0.658435,0.327807,0.013758,0),λ=0.046318較小,說明53名學生對大學語文教師的測評是認真的,測評結(jié)論是有效的。一般項目和總體評價項目得到的結(jié)論一致,該名教師最后學評成績?yōu)椤爸小薄4送?,記差值矩陣為當k≥j時,△pkj共有十個元素,其中不為0的元素有8個。五元素符號為“-”,表明學生在一般評價項目選擇“良”以上的人數(shù)比總體評價選擇“良”以上的人少,53名學生在進行總體評價時,所給成績比作一般評價時偏高。r1的第一、第二個分量分別比r的第一、第二個分量大,也證實了這一點。在綜合評定大學語文的學生評教成績時,根據(jù)總體評價73.2765分,再結(jié)合一般評價78.3851分綜合考慮,最后受評教師學生評教成績定為73.2765分合適,等級為“中”。
(一)對學生評教數(shù)據(jù)進行分析時,首先要防止統(tǒng)計信息的重疊。其次,在計算受評教師的學生評教成績時,既考慮用各個評價項目的樣本均值來反映教師的教學水平,又考慮學生在評價指標 (或等級量表)的不同等級的分布,形成一種綜合的分析方法,這種分析方法可以彌補傳統(tǒng)學評成績計算方法的缺陷。此方法從學生最終評教分數(shù)中剔除了低等級中的分數(shù)成分,最后得到了能真實反映教師教學水平的學評得分。
(二)學評成績所用的計算方法是建立在教學評價卡及教學評估表設(shè)計充分合理的基礎(chǔ)之上的。教學評價卡及教學評估表設(shè)計原則以及在設(shè)計過程中需要考慮的因素,已經(jīng)有大量的文獻作過研究,也有大量的成功經(jīng)驗可以借鑒,它的合理性毋需置疑。但對于學評成績的計算,目前可查的文獻非常少,相對合理的學評成績的計算方法幾乎沒有。本文提供的計算方法還存在一些需要完善的地方,但可以起到拋磚引玉的作用,希望能引起更多的學者關(guān)注此類數(shù)據(jù)的分析計算方法,開展進一步研究。
(三)學生評教只是從學生的層面對授課教師的教學進行評價,授課教師的最終測評成績至少應(yīng)該從下面三個方面綜合考慮:(1)學生評教的成績,并且此項成績應(yīng)在最終成績中占較大比重;(2)授課教師的同行通過聽課評定的成績,此項成績在最終成績中占中等比重;(3)授課教師的主管領(lǐng)導(dǎo)評定的成績,此項成績在最終成績只能占較少比重。其中第 (1)項的評定是最復(fù)雜的,也是最值得研究的。文中所提出的分析方法和傳統(tǒng)分析方法相比,克服了傳統(tǒng)方法中的不足,計算結(jié)果更具有說服力,評定的結(jié)果更接近授課教師的真實水平,具有借鑒作用。
×××學院教學評價卡
×××學院大學語文教學評估表(教師)
16 38 71.70% 15 28.30% 0 9.40% 0 0.00% 0.8 200 3.77 17 19 35.90% 29 54.70% 5 11.30% 0 0.00% 1.2 271.2 5.12 18 23 43.40% 24 45.30% 6 5.70% 0 0.00% 1.2 274.8 5.18 19 27 50.90% 23 43.40% 3 3.80% 0 0.00% 1.2 283.2 5.34 20 33 62.30% 18 34.00% 2 3.80% 0 0.00% 1 243 4.58 21 27 50.90% 24 45.30% 2 0.00% 0 0.00% 0.8 189.6 3.58 22 38 71.70% 15 28.30% 0 3.10% 0 0.00% 1 250 4.72合計 728 62.40% 402 34.50% 36 1.90% 0 0.00% 22 5351.1 100.95
參考文獻:
[1]Kenneth.A.Feldman.Effctive College Teaching From The Students and Faculty s View:Matched or Mismatched Priorities?[J]Research in Higher Education[Z],Vol.28.1988,(04),291.
[2]陳曉端.大學學生評價教學的理論與實踐[J].比較教育研究,2001(02):29—32.
[3]譚瑩,宋萍.高校學生評教制度有效性的調(diào)查分析 [J].統(tǒng)計教育,2007(09):62—64.
[4]王海驪.基于數(shù)據(jù)分析的學生評教研究綜述 [J].中國電力教育,2011(19).
[5]毛豐付.學生評教,偏差幾何——對某校學生評教的數(shù)據(jù)分析 [J].高等教育研究,2009(03):88—91.
[6]王海驪,劉晶基于數(shù)據(jù)分析的高校學生評教研究——以2006-2009年北京某理工科高校為案例的分析[J].北京科技大學學報 (社會科學版),2012(09):155—161.
[7]張巖,夏秀峰.基于學生評教的教學分析決策數(shù)據(jù)集市模型的設(shè)計[J].沈陽師范大學學報 (自然科學版),2007(04):197—198.
[8]丁福興.高校學生評教數(shù)據(jù)的常用定量分析方法 [J].統(tǒng)計教育,2005(12):56—58.
[9]楊毅紅.Excel數(shù)據(jù)分析工具在學生評教中的應(yīng)用研究 [J].時代教育,2008(08):268—269.
[10]姚成,龔毅,濮光寧,葛文龍.學生評教異常數(shù)據(jù)的篩選與處理[J].牡丹江師范學院學報 (自然科學版),2012(03):7—8.
[11]朱洪文.應(yīng)用統(tǒng)計[M].北京:高等教育出版社,2004,7:134—135.
(責任編輯李艷梅)
中圖分類號:G4
文章標識碼:A
文章編號:1671-7406(2015)03-0009-07
*基金項目:楚雄師范學院教學改革立項研究項目。
收稿日期:2015-01-07
作者簡介:楊新平 (1969—),男,副教授,碩士,主要從事統(tǒng)計應(yīng)用的研究和教學工作。
Discussion on the Computing Method of the Students'Evaluation of Teaching Performance
YANG Xin-ping1;XU Deng-guo2;YANG Cheng-hong3
(1,2.Chuxiong Normal University Yunnan Chuxiong 675000;3.Chuxiong Beipu Middle School Yunnan Chuxiong 675000)
Abstract:According to the data of evaluted teaching by students,contingencytable is established and the test of consistency is made.On this basis,an improved algorithm for students'evaluation on the teachers in the university is proposed.The algorithm is more reasonable compared to traditional algorithm and the results are more convincing.Finally,the empirical analysis is given.
Key words:evaluation by students;contingencytable;probability matrix;Structural relative number