戴 瑜,李 廉
(1.中國(guó)礦業(yè)大學(xué)徐海學(xué)院,江蘇徐州221008;2.中國(guó)礦業(yè)大學(xué)外文學(xué)院,江蘇徐州220016)
基于標(biāo)準(zhǔn)的評(píng)價(jià)主要是根據(jù)課程標(biāo)準(zhǔn)設(shè)定的學(xué)習(xí)要求,考查學(xué)生對(duì)要求的學(xué)習(xí)內(nèi)容的掌握情況及其能力水平。這種評(píng)價(jià)依據(jù)一系列預(yù)先設(shè)定的、描述不同階段的評(píng)估標(biāo)準(zhǔn)來(lái)評(píng)價(jià)學(xué)生的學(xué)習(xí),給出學(xué)生的成績(jī)。這種評(píng)價(jià)可以幫助學(xué)校確認(rèn)什么是重要的學(xué)習(xí)內(nèi)容,并協(xié)助教師和學(xué)生專注于重要的學(xué)習(xí)內(nèi)容,最終促進(jìn)學(xué)生的發(fā)展。按照這種定義,我國(guó)目前高校的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試普遍采用的是基于標(biāo)準(zhǔn)的評(píng)價(jià)模式。為了給學(xué)生提供及時(shí)有針對(duì)性的有益反饋,從而促進(jìn)學(xué)習(xí),大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試按照學(xué)生的具體能力水平是否達(dá)到課程標(biāo)準(zhǔn),將學(xué)生分為合格/不合格兩大類,進(jìn)而對(duì)不同的學(xué)生實(shí)施對(duì)應(yīng)的教學(xué)活動(dòng)。
我國(guó)高校普遍把期末考試作為主要的學(xué)業(yè)評(píng)估方式,目前各高校所使用的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試試題,主要采用教師自編測(cè)驗(yàn)方式。從命題內(nèi)容來(lái)看,這類測(cè)驗(yàn)大多以教材為中心或者依據(jù)主觀經(jīng)驗(yàn)進(jìn)行命題,考試往往缺乏合理的理論效度規(guī)劃,在難度和區(qū)分度上也通常缺乏明確的設(shè)計(jì)。從評(píng)分和分?jǐn)?shù)解釋來(lái)看,尤其是主觀測(cè)試項(xiàng)目上,存在評(píng)分標(biāo)準(zhǔn)籠統(tǒng)、測(cè)評(píng)結(jié)果穩(wěn)定性差、評(píng)分員差異大等問(wèn)題。對(duì)于一份試卷來(lái)說(shuō),需要通過(guò)考察哪些特定的知識(shí)和技能、考生需要有怎樣的具體表現(xiàn),才能判斷出該考生達(dá)到這些知識(shí)和技能的臨界水平,能夠獲得多少分?jǐn)?shù)。在此過(guò)程中,對(duì)具體標(biāo)準(zhǔn)的描寫和分?jǐn)?shù)的判定的過(guò)程即基于標(biāo)準(zhǔn)的測(cè)試中的“標(biāo)準(zhǔn)設(shè)定”環(huán)節(jié)。這些標(biāo)準(zhǔn)制定的是否合理、科學(xué)和明確,會(huì)影響到試卷的編制、分?jǐn)?shù)的解釋等,關(guān)系到測(cè)試效度的問(wèn)題。
Bachman認(rèn)為,考試與教學(xué)內(nèi)容的相關(guān)性和對(duì)教學(xué)內(nèi)容的覆蓋面是學(xué)業(yè)考試的要素,它能賦予分?jǐn)?shù)具體的意義,激勵(lì)學(xué)生更主動(dòng)地參與日常的學(xué)習(xí)活動(dòng),并對(duì)教與學(xué)產(chǎn)生有利的反撥效應(yīng)。多數(shù)研究顯示,基于標(biāo)準(zhǔn)的評(píng)價(jià)對(duì)學(xué)生的學(xué)習(xí)和成績(jī)有積極作用。
本文在Bachman和Palmer的“測(cè)試使用論證”的語(yǔ)言測(cè)評(píng)開(kāi)發(fā)與使用過(guò)程指導(dǎo)下,以中國(guó)礦業(yè)大學(xué)徐海學(xué)院為例,結(jié)合該院的《大學(xué)英語(yǔ)課程教學(xué)大綱》(以下簡(jiǎn)稱《大綱》)的要求,探討開(kāi)發(fā)編制適用于獨(dú)立學(xué)院的學(xué)生英語(yǔ)水平的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試需要關(guān)注和考慮的相關(guān)問(wèn)題,使其有助于對(duì)學(xué)生英語(yǔ)水平進(jìn)行科學(xué)的客觀評(píng)估。
“測(cè)試使用論證”的語(yǔ)言測(cè)評(píng)開(kāi)發(fā)與使用過(guò)程涉及一系列活動(dòng),包括初劃、構(gòu)建測(cè)試使用論證、選擇或開(kāi)發(fā)一項(xiàng)測(cè)試、收集用于測(cè)試修訂的反饋信息、獲得測(cè)試記錄、依照測(cè)試記錄解釋考生的語(yǔ)言能力、參照有關(guān)語(yǔ)言能力的解釋作決策等。這些活動(dòng)大致可歸入五個(gè)階段:初步規(guī)劃(initial planning)、設(shè)計(jì)(design)、實(shí)施(operationalization)、試測(cè)(trialing)和測(cè)評(píng)使用(assessment use)。測(cè)評(píng)開(kāi)發(fā)的第一階段是初始規(guī)劃,決策者初步考慮其是否需要使用測(cè)評(píng)為預(yù)期決策提供信息。若決策是使用一項(xiàng)測(cè)試,那么初劃的活動(dòng)會(huì)產(chǎn)生測(cè)試可行性的初步評(píng)估。若決策是選擇某一測(cè)試,那么測(cè)試開(kāi)發(fā)者需要論述主張及理?yè)?jù),以證明現(xiàn)有測(cè)試可以使用,然后測(cè)試開(kāi)發(fā)者開(kāi)始試測(cè)和測(cè)試使用,為理?yè)?jù)提供支撐依據(jù),為測(cè)試使用者提供真實(shí)的評(píng)估、評(píng)估記錄及解釋信息。若決策是開(kāi)發(fā)一項(xiàng)測(cè)試,那么測(cè)試開(kāi)發(fā)者開(kāi)始第二階段,即設(shè)計(jì)階段。本階段實(shí)施的活動(dòng)會(huì)產(chǎn)生設(shè)計(jì)方案(design statement),以及“測(cè)試使用論證”的理?yè)?jù)。第三階段的實(shí)施活動(dòng)產(chǎn)生測(cè)試藍(lán)圖(blueprint),一個(gè)以上的“評(píng)估”以及為測(cè)試使用者提供解釋信息,并產(chǎn)生“測(cè)試使用論證”的附加理?yè)?jù)。第四階段是試測(cè),會(huì)產(chǎn)生反饋信息,為理?yè)?jù)提供支撐依據(jù),為測(cè)試使用者提供測(cè)評(píng)任務(wù)檔案和其他的解釋信息。第五階段的測(cè)試使用活動(dòng)產(chǎn)生測(cè)評(píng)記錄,為測(cè)評(píng)使用者提供其他的解釋信息、語(yǔ)言能力解釋,以進(jìn)行決策。
在整個(gè)過(guò)程中產(chǎn)生的解釋性信息,包括需要評(píng)估的構(gòu)念說(shuō)明,并伴有測(cè)試任務(wù)說(shuō)明,以及測(cè)試記錄如何產(chǎn)生的說(shuō)明。這個(gè)信息由測(cè)試開(kāi)發(fā)者以條款表格的形式向測(cè)試參與者和其他利益相關(guān)者提供?;诮忉尩臎Q定會(huì)在現(xiàn)實(shí)世界中產(chǎn)生后效,該后效也由真實(shí)世界條件決定。測(cè)試開(kāi)發(fā)者的首要產(chǎn)品是“測(cè)試使用論證”本身,因?yàn)椴煌唧w的理?yè)?jù)要說(shuō)明論述,在測(cè)試開(kāi)發(fā)和使用不同階段要搜集支撐依據(jù)。
當(dāng)“測(cè)試使用論證”指導(dǎo)測(cè)評(píng)開(kāi)發(fā)和使用時(shí),“測(cè)試使用論證”本身也在整個(gè)過(guò)程中得到詳細(xì)說(shuō)明及修訂。同樣的,當(dāng)真實(shí)世界的條件影響測(cè)評(píng)開(kāi)發(fā)使用中所形成的某些決策時(shí),這些條件會(huì)隨著測(cè)試開(kāi)發(fā)者對(duì)這些活動(dòng)做的改變和調(diào)整而演變。因此,驗(yàn)證和真實(shí)世界的條件會(huì)引導(dǎo)并通知所有測(cè)試開(kāi)發(fā)使用中的決定和流程,也會(huì)確保有目的測(cè)試使用可以驗(yàn)證,并具有實(shí)用性。
按照我國(guó)《民辦教育促進(jìn)法》及相關(guān)規(guī)定要求,民辦高校以培養(yǎng)應(yīng)用型人才為目標(biāo)。對(duì)于培養(yǎng)應(yīng)用型人才為目標(biāo)的中國(guó)礦業(yè)大學(xué)徐海學(xué)院,其學(xué)生的英語(yǔ)應(yīng)用能力不容忽視,尤其在我國(guó)步入世界性經(jīng)濟(jì)、政治和文化的大流后,學(xué)生英語(yǔ)的實(shí)踐能力和綜合應(yīng)用能力是最為關(guān)鍵的。該院根據(jù)國(guó)家對(duì)民辦高校的指導(dǎo)性規(guī)定,制定了相應(yīng)的大學(xué)英語(yǔ)的教學(xué)大綱,確定了大學(xué)英語(yǔ)的課程性質(zhì)、教學(xué)目的及任務(wù)。即《大學(xué)英語(yǔ)》課是一門既發(fā)展語(yǔ)言能力,又發(fā)展交際能力的實(shí)踐課,培養(yǎng)學(xué)生較強(qiáng)的聽(tīng)、說(shuō)、讀和一定的寫作、翻譯能力,能夠用英語(yǔ)進(jìn)行日常交流。大學(xué)英語(yǔ)教學(xué)應(yīng)幫助學(xué)生打下扎實(shí)的語(yǔ)言基礎(chǔ),掌握良好的語(yǔ)言學(xué)習(xí)方法,提高文化素養(yǎng),以適應(yīng)社會(huì)發(fā)展和經(jīng)濟(jì)建設(shè)的需要。
基于標(biāo)準(zhǔn)的學(xué)業(yè)測(cè)試開(kāi)發(fā),以該院制定的《大綱》為基礎(chǔ)設(shè)定測(cè)試的評(píng)價(jià)標(biāo)準(zhǔn),按大綱要求對(duì)所要掌握的知識(shí)、技能和理解方面進(jìn)行有效測(cè)量并提供可信的測(cè)量結(jié)果。在AUA框架下和基于標(biāo)準(zhǔn)的理論下,開(kāi)發(fā)大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試需要經(jīng)過(guò)初步規(guī)劃、設(shè)計(jì)、實(shí)施、試測(cè)和測(cè)評(píng)使用這五個(gè)階段,并且在所有階段中需要體現(xiàn)《大綱》設(shè)定的要求標(biāo)準(zhǔn)。
初劃是測(cè)試開(kāi)發(fā)和使用的初始階段,在是否需要進(jìn)行測(cè)試開(kāi)發(fā)的決策作出之前完成。決策者和測(cè)試開(kāi)發(fā)者要回答一系列的問(wèn)題,以決定是否需要測(cè)試,是否需要開(kāi)發(fā)新的測(cè)試,以及考慮測(cè)試開(kāi)發(fā)所需的資源。為了回答上述問(wèn)題,在初步規(guī)劃學(xué)業(yè)測(cè)試時(shí),與《大綱》要求對(duì)應(yīng),在以下幾個(gè)方面設(shè)定標(biāo)準(zhǔn):
作為大學(xué)英語(yǔ)教學(xué)中重要組成部分的學(xué)業(yè)測(cè)試,其試卷設(shè)計(jì)要保證質(zhì)量,能夠客觀準(zhǔn)確地測(cè)量大學(xué)英語(yǔ)教與學(xué)的實(shí)際水平,科學(xué)解釋成績(jī)并及時(shí)反饋于教學(xué)中,對(duì)教學(xué)起正面把握作用。參考Bachman所列初劃階段需要關(guān)注的若干問(wèn)題,該院大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試開(kāi)發(fā)和使用有如下幾點(diǎn)考慮。首先,直接受測(cè)試使用影響的相關(guān)利益群體包括大學(xué)一年級(jí)和二年級(jí)的非英語(yǔ)專業(yè)的本科生以及大學(xué)英語(yǔ)各年級(jí)的授課教師和學(xué)校的教學(xué)管理部門。其次,以大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試依據(jù),所需要作出的決策是判定參加考試的學(xué)生通過(guò)或未通過(guò)大學(xué)英語(yǔ)一、二年級(jí)四個(gè)階段的學(xué)期學(xué)業(yè)測(cè)試。再者,為了決定學(xué)生是否通過(guò)階段性學(xué)業(yè)測(cè)試,教師可以利用的資源有:學(xué)生的自我評(píng)估、作業(yè)、對(duì)學(xué)生語(yǔ)言能力方面的印象或測(cè)試。其中,自我評(píng)估有可能會(huì)超過(guò)真實(shí)水平,家庭作業(yè)未必由學(xué)生自己完成,而教師對(duì)學(xué)生的印象不一定保持一致并會(huì)存在偏差,所以進(jìn)行測(cè)試是必要的。該院現(xiàn)有的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試,缺乏合理的理論效度設(shè)計(jì)、合理的難度和區(qū)分度,測(cè)評(píng)內(nèi)容和教學(xué)目標(biāo)不一致,評(píng)分標(biāo)準(zhǔn)籠統(tǒng)、測(cè)評(píng)結(jié)果不穩(wěn)定等問(wèn)題。判定學(xué)生是否可以通過(guò)該階段的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試,需要了解并收集與決策相關(guān)的學(xué)生語(yǔ)言能力方面的信息,而相應(yīng)階段的大學(xué)英語(yǔ)課程教學(xué)大綱是參考的標(biāo)準(zhǔn)。
在測(cè)試開(kāi)發(fā)設(shè)計(jì)階段,測(cè)試開(kāi)發(fā)者將實(shí)施具體的活動(dòng),主要的活動(dòng)就是編制設(shè)計(jì)方案。設(shè)計(jì)方案是說(shuō)明在設(shè)計(jì)一項(xiàng)測(cè)試之前所需的內(nèi)容,可以引導(dǎo)測(cè)試開(kāi)發(fā)和使用過(guò)程的最后三個(gè)階段——實(shí)施、試測(cè)和使用,同時(shí)也會(huì)為“測(cè)試使用論證”的幾個(gè)理?yè)?jù)的支撐材料提供信息,為測(cè)試使用者及其他相關(guān)利益者提供他們能理解的測(cè)試解釋信息。設(shè)計(jì)方案包括的內(nèi)容較廣泛,本文對(duì)以下幾下重要問(wèn)題進(jìn)行闡述討論:
1.考生錯(cuò)誤分類的嚴(yán)重性和政策性決策的標(biāo)準(zhǔn)
(1)錯(cuò)誤分類的嚴(yán)重性:錯(cuò)誤的積極分類決策比錯(cuò)誤的消極分類決策相對(duì)要嚴(yán)重。
表1 相關(guān)利益者及大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試所作決策產(chǎn)生的后效
(2)設(shè)立標(biāo)準(zhǔn)的政策性程序:通過(guò)大學(xué)英語(yǔ)課程的標(biāo)準(zhǔn)由大學(xué)英語(yǔ)課程負(fù)責(zé)人與該課程的授課教師協(xié)商共同制定標(biāo)準(zhǔn)并在學(xué)校網(wǎng)站公開(kāi)發(fā)布。
(3)通過(guò)大學(xué)英語(yǔ)考試的標(biāo)準(zhǔn):標(biāo)準(zhǔn)分線是60分,參照該院《大綱》要求測(cè)量學(xué)生的語(yǔ)言知識(shí)。
2.構(gòu)念的定義
構(gòu)念即一項(xiàng)測(cè)試要測(cè)的內(nèi)容,既是測(cè)試任務(wù)編制的基礎(chǔ),也是分?jǐn)?shù)解釋的依據(jù)。大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試用于診斷教學(xué)背景下具體的教學(xué)目標(biāo)的完成情況,其構(gòu)念主要依據(jù)課程教學(xué)大綱中所包括的語(yǔ)言能力要素。結(jié)合該院《大綱》中的教學(xué)目標(biāo)和基本要求,學(xué)生的英語(yǔ)綜合應(yīng)用能力是主要的培養(yǎng)目標(biāo),以幫助學(xué)生實(shí)現(xiàn)用英語(yǔ)進(jìn)行日常交流的需要,對(duì)詞匯、聽(tīng)力理解能力、口語(yǔ)表達(dá)能力、閱讀理解能力、書面表達(dá)能力和翻譯能力在四個(gè)學(xué)期有不同等級(jí)要求。包含的語(yǔ)言能力要素有兩方面:(1)策略能力方面的掌握大意、抓住要點(diǎn)、領(lǐng)會(huì)觀點(diǎn)和態(tài)度、一般性交流及描述等;(2)話題知識(shí)方面的日常話題、一般性題材、個(gè)人經(jīng)歷、事件、觀感、情感等。
3.描述目標(biāo)語(yǔ)言使用域
語(yǔ)言測(cè)試任務(wù)是構(gòu)成語(yǔ)言測(cè)試的基本要素,是能夠誘發(fā)考生作答的“程序”,通常要以目標(biāo)語(yǔ)言使用域的任務(wù)為參照進(jìn)行改造、設(shè)計(jì)。人們正是通過(guò)考生完成測(cè)試任務(wù)的具體表現(xiàn),來(lái)推測(cè)考生完成目標(biāo)語(yǔ)言使用域任務(wù)的表現(xiàn),據(jù)此對(duì)其語(yǔ)言能力做出解釋。根據(jù)Bachman的觀點(diǎn),在大學(xué)階段所施行的這種學(xué)業(yè)測(cè)試,很難去明確其具體的目標(biāo)語(yǔ)言使用域,因此在這類測(cè)試中,可以依據(jù)考生的相關(guān)屬性和受測(cè)的構(gòu)念,定義所需概化的目標(biāo)語(yǔ)言使用域。根據(jù)上述分析,大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試的語(yǔ)言構(gòu)念要以該院制定的《大綱》為指導(dǎo),按照大綱在四個(gè)學(xué)期的不同等級(jí)要求,開(kāi)發(fā)體現(xiàn)考生聽(tīng)力理解能力、口語(yǔ)表達(dá)能力、閱讀理解能力、書面表達(dá)能力和翻譯能力的測(cè)試任務(wù)。
實(shí)施包括開(kāi)發(fā)藍(lán)圖、開(kāi)發(fā)實(shí)際的測(cè)試任務(wù),然后按照藍(lán)圖把測(cè)試任務(wù)組織到整個(gè)測(cè)試。設(shè)計(jì)藍(lán)圖是整個(gè)測(cè)試以及測(cè)試中的單個(gè)任務(wù)的一組說(shuō)明文件,用以指導(dǎo)測(cè)試開(kāi)發(fā)者建立測(cè)試任務(wù),并為測(cè)試使用者和其他利益相關(guān)者提供信息。該院大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試的藍(lán)圖編寫,要注意到測(cè)驗(yàn)與課程標(biāo)準(zhǔn)之間的一致性,并結(jié)合該院學(xué)生的培養(yǎng)方案,參考以下兩個(gè)原則:(1)交際測(cè)試原則:根據(jù)該院《大綱》的課程性質(zhì),測(cè)試主要衡量學(xué)生的英語(yǔ)交際能力,著重考查聽(tīng)說(shuō)能力和交際閱讀能力,在測(cè)試內(nèi)容和考點(diǎn)設(shè)置上以《大綱》為基礎(chǔ),參考雅思和托??荚嚇?gòu)念效度,借鑒全國(guó)大學(xué)英語(yǔ)考試四六級(jí)的信度機(jī)制。這將使該院大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試明顯區(qū)別于大學(xué)英語(yǔ)四六級(jí)考試,后者主要用來(lái)測(cè)試考生的語(yǔ)言綜合結(jié)構(gòu)能力和應(yīng)用能力,是對(duì)語(yǔ)言基礎(chǔ)的標(biāo)準(zhǔn)化反映,而非交際能力;(2)泛校本原則:該院的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試兼具有本校特色。開(kāi)發(fā)學(xué)業(yè)測(cè)試,要根據(jù)該院學(xué)生專業(yè)特點(diǎn)和學(xué)校發(fā)展方向定位,測(cè)試內(nèi)容多采用與該院設(shè)置的不同專業(yè)類型領(lǐng)域相關(guān)的素材,而非大學(xué)英語(yǔ)四六級(jí)考試中的泛人文類素材。根據(jù)該院學(xué)生出國(guó)交流、攻讀研究生和畢業(yè)后工作等需求,部分測(cè)試內(nèi)容增加實(shí)用場(chǎng)景對(duì)話和學(xué)術(shù)場(chǎng)景素材。
該院大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試的編制遵循布盧姆認(rèn)知目標(biāo)劃分法,在測(cè)量各級(jí)別教學(xué)目標(biāo)的實(shí)現(xiàn)情況時(shí),在每份試卷中以知識(shí)占15%、理解占25%、應(yīng)用占30%、分析占15%、綜合占10%的分配組成。測(cè)試包括聽(tīng)力、閱讀、寫作和口試四項(xiàng),總時(shí)長(zhǎng)120分鐘(見(jiàn)附表1)。
測(cè)試的試測(cè)階段包括在一組人中試用該測(cè)試,搜集信息,以及為了改進(jìn)測(cè)試分析信息。這些活動(dòng)產(chǎn)品包括反饋、支撐信息,測(cè)試任務(wù)的記錄,其他的測(cè)試使用者的解釋性信息。測(cè)試開(kāi)發(fā)者使用試測(cè)中收集的信息提供支撐依據(jù)支持AUA中的理所,或是修訂AUA中具體的理?yè)?jù)。她也可以用這些信息指導(dǎo)其在測(cè)試任務(wù)或整個(gè)測(cè)試的修正中,這樣她能為AUA的理所提供更強(qiáng)的支撐依據(jù)。依據(jù)試測(cè)所獲得反饋所做的修正可能相對(duì)本地化,由少量的校訂組成。測(cè)試結(jié)果的分析可能會(huì)顯示要求有更廣泛的修訂,可能涉及到回歸到或再次思考AUA的設(shè)計(jì)方案或理所中的一些元素。在主要的測(cè)試努力中,測(cè)試或測(cè)試任務(wù)總是需要在使用前試用。涉及到管理測(cè)試,去收集關(guān)于測(cè)試使用者“語(yǔ)言能力”的信息,以用于作出決策。測(cè)試使用者解釋測(cè)試記錄作為想要測(cè)評(píng)的能力指示器,并用于決策。此外,測(cè)試使用將用于繼續(xù)收集作為測(cè)評(píng)論證過(guò)程部分的信息,為測(cè)試使用者提供額外信息。
開(kāi)發(fā)基于標(biāo)準(zhǔn)的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)評(píng)體系,設(shè)計(jì)要以學(xué)校的課程教學(xué)大綱為依據(jù),并結(jié)合學(xué)校的實(shí)際情況,制定開(kāi)發(fā)科學(xué)的、客觀的、系統(tǒng)的評(píng)估體系,這對(duì)于實(shí)現(xiàn)課程目標(biāo)至關(guān)重要。為保證學(xué)業(yè)測(cè)試的質(zhì)量,有必要成立專門的大學(xué)英語(yǔ)試題庫(kù)建設(shè)小組,負(fù)責(zé)測(cè)試的設(shè)計(jì)、分析和研究,收集和保存每次考試的試卷和數(shù)據(jù),將優(yōu)秀的題目存入電腦,這樣才能逐步提高試題的質(zhì)量,實(shí)現(xiàn)測(cè)試的標(biāo)準(zhǔn)化,保持同一級(jí)考試的穩(wěn)定性。用同一尺度衡量不同屆的學(xué)生,才能使考試有縱向的可比性,更準(zhǔn)確地評(píng)估各屆學(xué)生的水平和教學(xué)質(zhì)量。加強(qiáng)試題質(zhì)量控制,在沒(méi)有條件試測(cè)的情況下,可采取試做的方法,以預(yù)測(cè)試卷的效度。例如,可以由其他級(jí)別未參加本級(jí)別學(xué)業(yè)測(cè)試命題的老師將整套試題按照考試要求做一遍,這樣常??梢园l(fā)現(xiàn)不少問(wèn)題,如題目語(yǔ)言上的錯(cuò)誤、多種答案、答案給錯(cuò)、時(shí)間不夠等。
參考文獻(xiàn):
[1]汪賢澤.基于標(biāo)準(zhǔn)的評(píng)價(jià)研究[J].當(dāng)代教育科學(xué),2008(10):11-14.
[2]Cuyneth Hughes.Towards a Personal Best:A Case for Introducing Ipsative Assessment in Higher Education[J].Studies in Higher Eudcation,2011(5):353-367.
[3]Bachman L F,Palmer A S.Language Assessment in Practice[M].Oxford:Oxford University Press,2010.
[4]戴瑜,李廉.基于測(cè)試使用論證理論的大學(xué)英語(yǔ)學(xué)業(yè)測(cè)試體系建設(shè)[J].煤炭高等教育,2017(4):68-72.
[5]丁秀峰.心理測(cè)量學(xué)[M].北京:光明日?qǐng)?bào)出版社,2001.
附表1 各部分測(cè)試內(nèi)容、題型和所占分值比例