賀滿足
摘 要: 大學(xué)學(xué)業(yè)考試是檢查教學(xué)質(zhì)量的主要手段,要具備公平性以體現(xiàn)社會(huì)公正。本文采用問(wèn)卷形式調(diào)查學(xué)生對(duì)考試公平性的看法及高校教師對(duì)考試公平性的認(rèn)識(shí)和做法。結(jié)果表明,大學(xué)學(xué)業(yè)考試的公平性有待提高;教師對(duì)考試公平性的認(rèn)識(shí)不夠全面,在測(cè)試中會(huì)考慮與公平性相關(guān)的一些因素,但忽略其他重要環(huán)節(jié)。因此,有必要對(duì)教師進(jìn)行語(yǔ)言測(cè)試方面的培訓(xùn),提高認(rèn)識(shí),在實(shí)踐中采取更有效的措施體現(xiàn)考試的公平性。
關(guān)鍵詞: 學(xué)業(yè)考試 考試公平性 教師培訓(xùn)
一、引言
考試作為選拔人才和檢查教學(xué)質(zhì)量的重要手段,其公平性備受關(guān)注??荚嚬叫允侵冈谠嚲碓O(shè)計(jì)、開(kāi)發(fā)、實(shí)施、評(píng)閱和成績(jī)公布過(guò)程中,對(duì)全部考生公平對(duì)待、一視同仁,考試結(jié)果僅反映考生個(gè)人在考試中的知識(shí)及能力情況[1]。根據(jù)《教育與心理測(cè)量標(biāo)準(zhǔn)》[2](簡(jiǎn)稱“標(biāo)準(zhǔn)”),考試公平性包括四方面。第一,無(wú)偏頗,即考試內(nèi)容、答題形式或考試的使用,對(duì)不同考生群體意義一致,否則考試結(jié)果將出現(xiàn)偏差,不能準(zhǔn)確反映所測(cè)概念,降低考試效度。第二,考試過(guò)程公平,即所有考生考前都有機(jī)會(huì)得到復(fù)習(xí)資料,考試中具有同等機(jī)會(huì)展現(xiàn)考試所測(cè)的知識(shí)或能力,并給考生提供合適的條件讓他們正常發(fā)揮。第三,基于考試結(jié)果決策的公平。標(biāo)準(zhǔn)參照考試需確保不同考生群體之間的通過(guò)率具有可比性;選拔性考試應(yīng)讓所有考生有同等的選拔機(jī)會(huì)。第四,均等的學(xué)習(xí)機(jī)會(huì)。這主要是指標(biāo)準(zhǔn)參照考試如學(xué)業(yè)考試。學(xué)業(yè)考試旨在檢查考生對(duì)所學(xué)知識(shí)、能力的掌握程度。當(dāng)考試成績(jī)用來(lái)決定升留級(jí)或頒發(fā)證書時(shí),均等的學(xué)習(xí)機(jī)會(huì)尤為重要。
綜上所述,考試公平性涉及多個(gè)因素,包括考試效度、考前準(zhǔn)備、施考環(huán)節(jié)、考試成績(jī)的使用和學(xué)習(xí)考試內(nèi)容的機(jī)會(huì)。因此,考試公平性的概念涉及面廣,貫穿甚至超越整個(gè)考試過(guò)程,是考試賴以存在及使用的基礎(chǔ)[3]。大學(xué)考試中大部分由教師參與設(shè)計(jì)、命題和實(shí)施,他們對(duì)考試公平性的理解對(duì)于促進(jìn)考試公平性具有重要的作用。
二、研究設(shè)計(jì)
本文以問(wèn)卷為研究工具。學(xué)生問(wèn)卷共14小題,調(diào)查學(xué)生對(duì)考前準(zhǔn)備和施考環(huán)節(jié)中教師的做法及其對(duì)考試公平性的影響等的認(rèn)識(shí)。教師調(diào)查采用鄒申(2013)編制的“考試公平性調(diào)查問(wèn)卷”。除了教師基本信息,包括31題,第1至14題調(diào)查教師對(duì)公平性的認(rèn)識(shí)及理解,第15至31題調(diào)查教師在測(cè)試過(guò)程中的做法。具體而言,本文研究三個(gè)問(wèn)題:(1)大學(xué)學(xué)業(yè)考試的公平性如何?(2)英語(yǔ)教師對(duì)考試公平性的認(rèn)識(shí)如何?(3)英語(yǔ)教師怎樣在測(cè)試過(guò)程中體現(xiàn)考試公平性?
268位英語(yǔ)專業(yè)學(xué)生和來(lái)自5所高校的70位高校英語(yǔ)教師(學(xué)歷、職稱、教齡均處于不同層次,具體信息略)參與調(diào)查。學(xué)生問(wèn)卷有效率為92.9%(249份),采用Excel分析;教師問(wèn)卷有效率為94.3%(66份),采用SPSS(Version 16.0)進(jìn)行處理。教師問(wèn)卷的Cronbach Alpha系數(shù)為.830,具有較高的信度。
三、分析與討論
1.學(xué)生問(wèn)卷調(diào)查
學(xué)生調(diào)查結(jié)果采用頻數(shù)分析。第1題調(diào)查考試能否反映學(xué)生對(duì)知識(shí)的掌握,31%的學(xué)生選擇不到50%,約64.6%的學(xué)生認(rèn)為達(dá)到50%~80%,4.4%的學(xué)生覺(jué)得超過(guò)80%。第2題中,54.6%的學(xué)生認(rèn)為取得理想的考試成績(jī)最重要的是對(duì)知識(shí)的扎實(shí)掌握,43.8%的學(xué)生認(rèn)為需要進(jìn)行考前突擊,個(gè)別學(xué)生認(rèn)為靠事先弄到考題或作弊。第3、4題中,79%的學(xué)生認(rèn)為有同學(xué)作弊,但只有34.9%的人承認(rèn)自己曾作過(guò)弊。第5題調(diào)查教師是否透露考試內(nèi)容,3.6%的學(xué)生表示經(jīng)常有,55.4%的學(xué)生認(rèn)為偶爾有過(guò),40.9%的學(xué)生認(rèn)為從來(lái)沒(méi)有此類現(xiàn)象。第6題中,4.4%的學(xué)生承認(rèn)向老師說(shuō)過(guò)情。第7題,30%的學(xué)生認(rèn)為監(jiān)考老師態(tài)度松懈,其他人覺(jué)得監(jiān)考老師嚴(yán)抓作弊。8至14題是關(guān)于考試公平性。41.4%的學(xué)生認(rèn)為自己在大學(xué)學(xué)業(yè)考試中曾受過(guò)不公平待遇,11.2%的學(xué)生認(rèn)為考試不公對(duì)他們的學(xué)習(xí)生活產(chǎn)生重大不良影響,主要是班級(jí)排名,進(jìn)而影響各種評(píng)先評(píng)優(yōu)及獎(jiǎng)學(xué)金的評(píng)選;26.1%的學(xué)生認(rèn)為考試不公現(xiàn)象很大程度上影響他們的學(xué)習(xí)積極性,51.4%的學(xué)生認(rèn)為有影響,但不是很嚴(yán)重;57%的學(xué)生認(rèn)為考試不公在很大程度上影響大學(xué)考試制度的良性發(fā)展,39.6%的學(xué)生認(rèn)為這種影響不嚴(yán)重。28.9%的學(xué)生認(rèn)為大學(xué)考試不公平主要體現(xiàn)在改卷標(biāo)準(zhǔn)不統(tǒng)一,6%的人認(rèn)為是老師有意泄題,59.4%的學(xué)生認(rèn)為是作弊引起的,5.7%的學(xué)生認(rèn)為由其他原因引起,如公共科目的教師對(duì)不同專業(yè)劃的重點(diǎn)不一樣,對(duì)不同班級(jí)區(qū)別對(duì)待,以及采用往年試卷,導(dǎo)致泄題。針對(duì)考試不公現(xiàn)象,75.5%的學(xué)生認(rèn)為有必要改革現(xiàn)行考試制度。15題是關(guān)于提升考試公平性的措施,屬多選題。78.3%的學(xué)生認(rèn)為要完善考試制度,69.1%的認(rèn)為應(yīng)該完善考試評(píng)價(jià)體系,68.3%的學(xué)生認(rèn)為應(yīng)加強(qiáng)對(duì)作弊行為的管理和處罰,74.9%的學(xué)生提出考試要改革,注重對(duì)實(shí)際能力的考查,50.6%的學(xué)生認(rèn)為要嚴(yán)肅考紀(jì)考風(fēng),提高監(jiān)考人員的水平和素質(zhì),同時(shí)加強(qiáng)管理,增強(qiáng)試卷與閱卷保密度。
“標(biāo)準(zhǔn)”明確指出,考試公平性包括考試過(guò)程的公平及均等的學(xué)習(xí)機(jī)會(huì)。但是當(dāng)前大學(xué)考試存在以下問(wèn)題:對(duì)學(xué)生知識(shí)及能力的考查不夠,且部分教師在考前透露考試內(nèi)容,甚至存在學(xué)生向老師說(shuō)情的情況;一些監(jiān)考老師責(zé)任心不強(qiáng),態(tài)度松懈,致使舞弊現(xiàn)象發(fā)生;閱卷過(guò)程不太規(guī)范等。這些考試不公現(xiàn)象對(duì)學(xué)生的學(xué)習(xí)、生活及考試制度的良性發(fā)展產(chǎn)生較嚴(yán)重的影響。考試公平性的提升具有社會(huì)性,需要試卷開(kāi)發(fā)人員、教師、考試使用人員、考生等共同合作,形成良性循環(huán)和互動(dòng)[5]。在實(shí)際工作中,語(yǔ)言測(cè)試工作者(命題、施考及評(píng)閱人員等)要將確??荚嚬叫苑旁谑孜?,并具體落實(shí)到考試的每個(gè)階段。為提高考試的公平性,有必要對(duì)命題教師及監(jiān)考人員等進(jìn)行培訓(xùn)。
2.教師問(wèn)卷調(diào)查
(1)對(duì)考試公平性的認(rèn)識(shí)
教師按照學(xué)歷、職稱、教齡分組后,采用Kruskal Wallis對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn)。絕大多數(shù)題目組間差異未達(dá)到顯著水平(p<.05)。但第9題(均等的學(xué)習(xí)機(jī)會(huì)),按學(xué)歷分組時(shí),本科學(xué)歷和研究生學(xué)歷的教師認(rèn)識(shí)上存在顯著差異。第30題(考試對(duì)教與學(xué)的影響),按職稱分組時(shí),講師和副教授的認(rèn)識(shí)有顯著差異。這與鄒申(2013)的研究結(jié)果不太一致,可能是此次調(diào)查對(duì)象人數(shù)有限,且主要來(lái)自筆者所在學(xué)院所致。
第1、9、10、11、13、14題的平均值接近或大于4,標(biāo)準(zhǔn)差小于1,贊同度高于80%,說(shuō)明大多數(shù)教師對(duì)這些題目持肯定態(tài)度,且觀點(diǎn)較一致。第1題“考試應(yīng)該做到對(duì)每個(gè)考生都公平”,平均值達(dá)4.61,贊同度為93.8%。第9題中,80%的教師認(rèn)為公平的考試應(yīng)讓學(xué)生在考前有均等的機(jī)會(huì)學(xué)習(xí)相關(guān)材料。第10題,80%的教師認(rèn)為考試公平性包括對(duì)考試的熟悉程度,10%的教師持不確定的態(tài)度,其余持否定態(tài)度。第11題,89.4%的教師將維護(hù)考試公平性視為己任。第13題“考試公平性是檢驗(yàn)教學(xué)質(zhì)量的重要保障”和第14題“考試公平性是考試效度的組成部分”,教師的贊同度較高,說(shuō)明大多數(shù)教師認(rèn)同考試公平性的重要性。
但是,有8道題的標(biāo)準(zhǔn)差大于1,贊同度不高,表明教師的看法比較分散。第2題“考試可以做到對(duì)每個(gè)考生公平”,贊同度只有56.1%,約22%的教師表示不確定。第3題“考試公平性與考試分?jǐn)?shù)使用的關(guān)系”,贊同度為51.5%,19.7%的教師表示不確定,28.8%的教師不同意該觀點(diǎn)。第4、5題涉及考試公平性與及格線的設(shè)定問(wèn)題,贊同度較低,特別是第四題,持否定態(tài)度的高達(dá)46.9%。第6、7題(施考程序和考試內(nèi)容的公平性),教師的贊同度不高,特別是第7題,只有48.5%。第8題“答題要求的公平性”,贊同率為65.2%,約16.7%的教師表現(xiàn)為不確定,其余的持否定態(tài)度。第12題“公平性是院系或?qū)W校領(lǐng)導(dǎo)考慮的事”,教師的贊同率只有19.7%。
不難看出,參與調(diào)查的大部分教師有較強(qiáng)的公平意識(shí),認(rèn)為考試公平性是教師的職責(zé),公平性對(duì)保障教學(xué)質(zhì)量和考試效度有重要意義。但他們的認(rèn)識(shí)與“標(biāo)準(zhǔn)”有一定的差距。根據(jù)“標(biāo)準(zhǔn)”,公平性指考試內(nèi)容、答題形式、要求等無(wú)偏頗,即避免考生因上述原因而影響成績(jī)。雖然在答題要求上教師的認(rèn)識(shí)與“標(biāo)準(zhǔn)”還算一致(65.2%),但在考試內(nèi)容無(wú)偏頗上教師的認(rèn)可度與“標(biāo)準(zhǔn)”存在較大差距(48.5%)。其原因一方面可能是這些教師沒(méi)有學(xué)過(guò)相應(yīng)的測(cè)試學(xué)知識(shí),另一方面考試內(nèi)容無(wú)偏頗只是一個(gè)相對(duì)概念,依考試目的及考生特征而定[4]。根據(jù)“標(biāo)準(zhǔn)”,考試公平性包括考試過(guò)程的公平,即考前準(zhǔn)備及施考環(huán)節(jié)。教師對(duì)施考過(guò)程公平性的認(rèn)識(shí)較為一致,但與“標(biāo)準(zhǔn)”存在一定的差距,說(shuō)明程序公平在實(shí)際測(cè)試中受到一些阻礙。但是,程序公平是考試公平的基礎(chǔ),其重要性不容忽視。按照“標(biāo)準(zhǔn)”中的闡述,公平性還涉及分?jǐn)?shù)用途。約一半的教師(第3題)與“標(biāo)準(zhǔn)”持相同觀點(diǎn)。如果把對(duì)及格線的界定作為一種決策(第4、5題),那么與“標(biāo)準(zhǔn)”相近觀點(diǎn)的比例約為2/3。即在決策中如何體現(xiàn)公平性,教師的認(rèn)識(shí)有待提高。教師認(rèn)識(shí)的模糊性可能與缺乏專業(yè)培訓(xùn)有關(guān),這再次證明培訓(xùn)的重要性。
(2)教師采取的考試公平性保障措施
15至31題調(diào)查教師在測(cè)試過(guò)程中的做法。教師按學(xué)歷分組后用Kruskal Wallis檢驗(yàn),未發(fā)現(xiàn)組間差異達(dá)到顯著性水平(p<.05)。教師按職稱分組后檢驗(yàn),發(fā)現(xiàn)第18題(考試內(nèi)容和形式是否與考試目的一致)和第30題(考試對(duì)教與學(xué)的影響)組間存在顯著性差異(p<.05)。方差分析結(jié)果表明講師和副教授在這兩題上的做法存在顯著性差異。教師按教齡分組后檢驗(yàn),發(fā)現(xiàn)第30題組間存在顯著性差異(p<.05),教齡在6至10年之間的教師和教齡超過(guò)15年的教師之間存在顯著性差異。
大多數(shù)題目(16,26,28,29這4題除外)的標(biāo)準(zhǔn)差小于1,且符合度較高(17和24兩道題只有75.8%)。15至20題涉及考試規(guī)劃階段教師的做法,絕大多數(shù)教師的做法較理想,能夠保障考試公平性,會(huì)在此階段考慮考試的目的(87.9%),考試內(nèi)容及形式是否與考試目的一致(93.9%)、考試評(píng)分(89.4%)及考試的預(yù)期效應(yīng)(92.4%)。但第16題,只有69.7%的教師會(huì)考慮分?jǐn)?shù)的用途,13.6%的教師持否定態(tài)度,其他的持不確定態(tài)度,原因很可能是教師自主開(kāi)發(fā)的試卷大多都是用來(lái)評(píng)價(jià)學(xué)生在一個(gè)學(xué)期中對(duì)所學(xué)內(nèi)容的掌握程度,決定他們能否得到相應(yīng)的學(xué)分。第17題,75.8%的教師在寫題前會(huì)描述所測(cè)能力的特征,18.2%的教師沒(méi)有這樣做。21至24題調(diào)查教師在寫題階段的做法,絕大多數(shù)教師會(huì)考慮題目的難度及話題的選擇是否與考試目的一致(89.4%);100%的教師會(huì)注意語(yǔ)言的難度;89.4%的教師會(huì)注意避免考試歧視;75.8%的教師會(huì)注意考生的群體特征。25至26題調(diào)查寫作和翻譯的評(píng)分標(biāo)準(zhǔn)和評(píng)分方式。調(diào)查顯示,98.5%的教師會(huì)制定評(píng)分標(biāo)準(zhǔn),但只有48.5%的教師會(huì)采取雙評(píng)的方式。27至29題涉及考試結(jié)果的分析及反饋。89.4%的老師會(huì)分析考試的平均值和標(biāo)準(zhǔn)差,42.4%的教師會(huì)計(jì)算考試的信度,51.5%的教師會(huì)將考試結(jié)果反饋給學(xué)生。30、31題關(guān)注考試的后效,90.9%的教師會(huì)關(guān)注考試對(duì)教與學(xué)的影響,84.8%的教師會(huì)根據(jù)考試結(jié)果調(diào)整教學(xué)進(jìn)度和內(nèi)容。
考試公平性涉及規(guī)劃、命題、評(píng)閱和分析等階段。在規(guī)劃階段教師的表現(xiàn)總體較理想,這些都是建立考試公平性的基本條件。但少數(shù)教師未考慮測(cè)試技能的界定和分?jǐn)?shù)用途,很大程度上會(huì)影響考試的公平性。命題階段,教師考慮的因素較為全面,其中最關(guān)注的是語(yǔ)言難度(100%),但他們對(duì)考生群體特征的關(guān)注度略低,一方面可能是教師認(rèn)為考生的特征相對(duì)較一致,另一方面表明部分教師未意識(shí)到考生群體特征對(duì)實(shí)現(xiàn)考試公平性的重要作用。評(píng)閱階段,絕大部分教師會(huì)制定翻譯和寫作的評(píng)分標(biāo)準(zhǔn),可見(jiàn)對(duì)效度足夠重視,為提高公平性提供先決條件。然而,采用雙評(píng)模式的教師不到一半,這將影響評(píng)分信度、效度及公平性。分析階段,大部分教師會(huì)分析題目和試卷,但僅停留在分析平均分和標(biāo)準(zhǔn)差,且將近一半的教師未向?qū)W生反饋分析結(jié)果。盡管如此,絕大多數(shù)教師很重視考試對(duì)教與學(xué)的影響,并適時(shí)作出調(diào)整。因此,教師的行為具有雙重性:一方面有利于提升效度和公平性,另一方面可能對(duì)效度和公平性產(chǎn)生負(fù)面影響[5]。
四、結(jié)語(yǔ)
作為選拔人才和檢查教與學(xué)質(zhì)量的一種手段,大學(xué)學(xué)業(yè)考試需要具備公平性以體現(xiàn)社會(huì)公正??荚嚬叫缘奶嵘哂猩鐣?huì)性,需要多方面人員共同合作和努力,其中教師是一個(gè)重要群體。本文從學(xué)生和教師的角度調(diào)查大學(xué)學(xué)業(yè)考試的公平性。結(jié)果顯示,學(xué)生認(rèn)為大學(xué)學(xué)業(yè)考試的公平性有待提高,原因是教師在命題、監(jiān)考及閱卷等方面的行為影響考試的公平性。另外,教師對(duì)公平性的認(rèn)識(shí)與“標(biāo)準(zhǔn)”具有一致性有偏離處,在測(cè)試實(shí)踐中存在非均衡性:會(huì)考慮與公平性相關(guān)的一些環(huán)節(jié),忽略其他重要環(huán)節(jié)。因此,兩個(gè)調(diào)查結(jié)果共同表明教師參加測(cè)試培訓(xùn)的重要性。只有對(duì)考試公平性有更全面的認(rèn)識(shí),教師才可能在實(shí)踐中采取更有效的措施體現(xiàn)公平性。
參考文獻(xiàn):
[1]Brown J D.Testing in Language Programs[M].London:Prentice Hall (international),1996.
[2]American Educational Research Association,et al.Standards for educational and psychological testing[Z].Washington,D.C:American Educational Research Association,1999.
[3]鄒申.提升考試公平性——以英語(yǔ)專業(yè)四、八級(jí)考試為例[J].外語(yǔ)教學(xué)與測(cè)試,2011(1):42-50.
[4]鄒申.教師如何踐行考試公平性?—來(lái)自問(wèn)卷調(diào)查的反饋[J].當(dāng)代外語(yǔ)研究,2013,(8).
[5]Spaan,M.2001.Enhancing fairness through a social contract[A].In A.J.Kunnan(ed.).Fairness and validation in Language Assessment (Studies in Language Testing 9)[C].Cambridge:Cambridge University Press.35-38.
基金項(xiàng)目:①湖南第一師范學(xué)院科研課題“TEM-4考試的構(gòu)念效度與公平性研究”(編號(hào):XYS12S25)
②湖南省教育廳科研課題“現(xiàn)代社會(huì)文化背景下英語(yǔ)認(rèn)知能力性別差異研究”(編號(hào):11C0296)