選擇題(multiple-choice items或MC)作為選擇應(yīng)答型試題(selected-response items)中的典型代表,從20世紀(jì)20年代開始就成為大規(guī)模標(biāo)準(zhǔn)化考試的主流題型(Fulcher,2014)。在施測(cè)和評(píng)分階段,選擇題有突出的優(yōu)勢(shì),例如在較短的時(shí)間內(nèi),測(cè)試者就可以收集到大量的測(cè)試數(shù)據(jù),覆蓋較廣的考查內(nèi)容。而在評(píng)分階段,運(yùn)用機(jī)器很容易就能實(shí)現(xiàn)準(zhǔn)確無誤的評(píng)分,因此在國內(nèi)各大型的英語考試中,選擇題仍占據(jù)重要的地位。初中英語學(xué)業(yè)水平考試(以下簡稱“中考英語”)同樣運(yùn)用大量的選擇題來收集數(shù)據(jù)。在本文中,筆者將首先闡述采用選擇題開展測(cè)試的四個(gè)方面的問題考量,介紹一個(gè)經(jīng)過驗(yàn)證的選擇題命題原則框架,并以此框架評(píng)價(jià)中考英語試題中選擇題的常見問題和改進(jìn)建議。最后,本文從效度角度討論中考英語試題中選擇題的運(yùn)用和建議。
Jones(2021)認(rèn)為,命題者在考慮選擇題的適用性時(shí)應(yīng)思考四個(gè)問題。第一個(gè)問題是選擇題本身的性質(zhì)問題。一般認(rèn)為,選擇題有天生的缺陷,就是它難以避免猜測(cè)問題,而且選項(xiàng)個(gè)數(shù)越少,猜對(duì)的可能性越大(Jones,2021)。僅僅看考生的最終選擇,我們無法了解他們答對(duì)或者答錯(cuò)的原因。如果是因?yàn)椴聹y(cè)或者排除錯(cuò)誤答案而答對(duì),很明顯測(cè)試分?jǐn)?shù)解釋和使用的效度就會(huì)受到威脅。但是,Rodriguez(2005)的研究發(fā)現(xiàn),除非時(shí)間趕不及了,考生基本不會(huì)做完全盲目的猜測(cè)。Rupp et al.(2006)發(fā)現(xiàn),考生在用盡其他所有的策略后才會(huì)啟用盲猜策略。Currie & Chiramanee(2010)則發(fā)現(xiàn),在一項(xiàng)語法測(cè)試中,只有6.7%的正確答案是通過盲猜獲得的。當(dāng)然,有策略地猜測(cè)也會(huì)對(duì)分?jǐn)?shù)解釋和使用的效度構(gòu)成威脅,因此在選擇題的命題中要盡量避免留下漏洞。
第二個(gè)問題是關(guān)于選擇題的構(gòu)念效度的問題。Hughes & Hughes(2020)認(rèn)為,語法選擇題不太能夠證明考生運(yùn)用語法結(jié)構(gòu)的能力,也就是說,考生能選對(duì)答案,但是卻不一定能夠在口語和寫作中正確運(yùn)用語法結(jié)構(gòu)。這就涉及構(gòu)念效度的問題。從這個(gè)角度來說,選擇題僅僅能測(cè)量識(shí)別能力,卻幾乎不能用來測(cè)量口語和寫作等產(chǎn)出性能力。從這個(gè)意義上說,選擇題很難測(cè)量高階思維能力。但是,選出正確答案也不一定是簡單識(shí)別的結(jié)果。大部分選擇題可以被看作是提出問題并提供一系列可能的解決方案,而這個(gè)過程需要復(fù)雜的認(rèn)知(Jones,2021)。因此,選擇題雖然不太能測(cè)試產(chǎn)出性技能,但也不僅僅可用于測(cè)量被動(dòng)知識(shí)。設(shè)計(jì)良好的選擇題可以考查較為高階的思維能力。
第三個(gè)問題是關(guān)于選擇題選項(xiàng)個(gè)數(shù)的問題。Haladyna(2004)建議運(yùn)用盡可能多的選項(xiàng),但是似乎也可以有限制。Rodriguez(2005)綜述了跨度80年的27項(xiàng)研究,得出三個(gè)選項(xiàng)就足夠的論斷。命題人員應(yīng)主要考慮以下三個(gè)方面的問題:1. 試題信度和題目區(qū)分度通常會(huì)隨著選項(xiàng)個(gè)數(shù)的增加而增加,但是從兩個(gè)選項(xiàng)到三個(gè)選項(xiàng),信度和區(qū)分度提高明顯,而超過三個(gè)選項(xiàng)后,兩者提高得就很少了,增加第三個(gè)干擾項(xiàng)的效果不明顯。2. 在實(shí)踐中,第三個(gè)干擾項(xiàng)撰寫難度非常高。3. 三個(gè)選項(xiàng)的選擇題比四個(gè)選項(xiàng)的選擇題需要的做題時(shí)間減少,因此更好的策略應(yīng)該是增加題量,收獲更高的信度。Lee & Winke(2012)比較了三個(gè)選項(xiàng)、四個(gè)選項(xiàng)和五個(gè)選項(xiàng)的語言測(cè)試,發(fā)現(xiàn)三個(gè)選項(xiàng)的測(cè)試題難度低,但在區(qū)分度和信度方面與其他兩類測(cè)試題未見明顯差異。Seinhorst(2008)也未發(fā)現(xiàn)三個(gè)選項(xiàng)和四個(gè)選項(xiàng)的語言測(cè)試題在難度、信度和區(qū)分度方面的差異,且三個(gè)選項(xiàng)的測(cè)試題比四個(gè)選項(xiàng)的測(cè)試題減少9%的施測(cè)時(shí)間,因此他認(rèn)為,三個(gè)選項(xiàng)的測(cè)試題為測(cè)試者收集更多的證據(jù)提供了條件。
第四個(gè)問題是關(guān)于選擇題的適用范圍的問題。雖然選擇題有很強(qiáng)的靈活性,可測(cè)試的能力范圍很廣(Green,2017),但是在其適用性方面仍需做較多的思考。例如在閱讀理解試題中,要測(cè)量文本的內(nèi)部邏輯結(jié)構(gòu),采用讓考生排序打亂的文本的題型會(huì)更加合適。在特定信息搜尋能力方面的考查可用簡答題。段落大意的考查則適用選擇題,因?yàn)樵谠u(píng)分方面,如果讓考生直接產(chǎn)出,很難判斷答案是否足夠精準(zhǔn),而當(dāng)考生直接抄寫文章的部分內(nèi)容作為答案時(shí),就很難判斷考生是否真正理解了原文。如果對(duì)原文進(jìn)行有深度的釋義,則能夠用選擇題來測(cè)量考生概括大意的能力。另外,在難度方面,選擇答案和產(chǎn)出答案對(duì)測(cè)試的結(jié)果有影響。選擇答案的難度明顯會(huì)低于產(chǎn)出答案的難度。Currie & Chiramanee(2010)比較了產(chǎn)出答案和選擇答案在測(cè)量語言知識(shí)時(shí)的異同,并通過問卷調(diào)查的方式開展研究,發(fā)現(xiàn)超過25%的考生依靠部分知識(shí)答對(duì)選擇題,而接近25%的考生通過排除法獲得答案。由于產(chǎn)出答案的題目中不存在選項(xiàng)支撐或干擾,因此不同題型所考查的構(gòu)念是否相同,仍需進(jìn)一步的研究。
題目命制的質(zhì)量是收集測(cè)試分?jǐn)?shù)解釋和使用效度證據(jù)的重要來源之一。Haladyna & Downing(1989a,1989b)對(duì)教育測(cè)量學(xué)教材和命題原則開展了廣泛的研究,后期Haladyna et al.(2002)將研究更新,并最終由Haladyna & Rodriguez(2013)進(jìn)行完整的論述(見表1)。表1的命題原則適用于選擇應(yīng)答型試題,也同樣適用于指導(dǎo)選擇題的命題。本節(jié)將對(duì)該原則進(jìn)行必要的解釋。
在內(nèi)容方面,要嚴(yán)格按照多維細(xì)目表的規(guī)劃,每個(gè)題目只能測(cè)試一個(gè)內(nèi)容和一種認(rèn)知。在中考這樣高利害的考試中要杜絕使用陳題,要用嶄新的內(nèi)容來測(cè)試學(xué)生,避免死記硬背。在多維細(xì)目表設(shè)計(jì)中,要注意選擇核心的內(nèi)容進(jìn)行考查,并保證題目之間的內(nèi)容相互獨(dú)立,不互相提醒。在選擇題中要避免測(cè)量答案因個(gè)人觀點(diǎn)不同而不同的情況,也要避免偏題怪題。
在格式方面,建議選項(xiàng)應(yīng)垂直排列。遺憾的是,在目前的中考英語試題中,我們可以看到密集的橫向排列選項(xiàng),這會(huì)給考生帶來很大的心理負(fù)擔(dān)。
在風(fēng)格方面,要細(xì)致編輯和校對(duì)題目,避免任何語法、標(biāo)點(diǎn)等語言和規(guī)范問題,并確保在選擇題的題干和選項(xiàng)中沒有生詞。要嚴(yán)格控制題目的閱讀量。例如在閱讀理解題中,要避免選擇題的題干和選項(xiàng)的詞數(shù)達(dá)到閱讀文本本身的詞數(shù)。
在題干編寫方面,要注意題干的含義要明確,避免使用“What do you know from the text?”等空問題。題干的撰寫應(yīng)盡量采用完整的問句,增強(qiáng)考生與試題之間的互動(dòng)感。題干不應(yīng)有否定輸入,以防過度增加考生的認(rèn)知負(fù)擔(dān)。
關(guān)于選項(xiàng)的撰寫,表1已有清晰的論述,在此不再贅述。
在本節(jié),筆者將根據(jù)近年來的中考英語命題評(píng)估經(jīng)驗(yàn),結(jié)合表1的選擇題命題原則,分析中考英語命題中的突出問題及改進(jìn)策略,以期為命題人員提升中考英語命題質(zhì)量提供參考。
在內(nèi)容選擇上,主要存在兩方面突出問題。一方面,部分試題存在單個(gè)題目測(cè)試的內(nèi)容超過一個(gè)的問題,影響其構(gòu)念效度。另一方面,部分試題測(cè)試內(nèi)容過于寬泛,導(dǎo)致構(gòu)念不清晰。要避免類似問題,命題人員在命題時(shí)應(yīng)科學(xué)規(guī)劃多維細(xì)目表,明確目標(biāo)測(cè)試構(gòu)念,并嚴(yán)格依照細(xì)目表進(jìn)行命題。以下結(jié)合具體示例進(jìn)行說明。
(1)單個(gè)題目測(cè)試的內(nèi)容超過一個(gè)
[例 1 ]
— As I know, your friend Jeff is very humorous.
— Yes. He is _______ person I know.
A. funnier B. the funniest
C. more serious D. the most serious
(參考答案:B)
該題既考查了funny與serious的詞義辨析,又考查了形容詞最高級(jí)的使用。這打破了單個(gè)題目與考點(diǎn)之間一一對(duì)應(yīng)的關(guān)系,影響了構(gòu)念效度。在本題中,如將選項(xiàng)改為funny、funnier、the funniest三個(gè)選項(xiàng),考查內(nèi)容就可以聚焦于形容詞最高級(jí)的使用,提升構(gòu)念效度2。
(2)測(cè)試內(nèi)容過于寬泛
[例2 ]
Which one of the statements below is a fact according to the passage?
A. Gan Yu is a hero like Lei Feng.
B. Zeng Qiangfei is warm-hearted.
C. Lei Feng’s hometown is in Hunan.
D. Edginton is a “foreign Lei Feng”.
(參考答案:C)
該題出自一篇閱讀理解,文章介紹了不同文化背景、不同年齡段的幾個(gè)人的志愿服務(wù)故事,生動(dòng)說明雷鋒精神歷久彌新。但該題目設(shè)置過于寬泛,未能指向所要聚焦的信息和技能,考生作答時(shí)不僅需要搜尋整篇文章信息,根據(jù)文章表述進(jìn)行推斷,還需要判斷該信息屬于事實(shí)(fact)還是觀點(diǎn)(opinion),導(dǎo)致題目構(gòu)念不清晰,作答困難。若將題目限定于某一人物的具體細(xì)節(jié),則可明確測(cè)試構(gòu)念。
在題目風(fēng)格上,主要存在兩點(diǎn)突出問題。首先,部分題目表述不當(dāng),題干或選項(xiàng)中存在超過被試水平的詞匯或表達(dá)。命題人員應(yīng)當(dāng)嚴(yán)格依照《義務(wù)教育英語課程標(biāo)準(zhǔn)(2022年版)》(教育部,2022)的要求進(jìn)行命題,使用符合要求的語言知識(shí)。若題目所包含的語言知識(shí)超標(biāo),則會(huì)阻礙考生理解題目,進(jìn)而影響作答。在選擇題命題中,不論是題干還是選項(xiàng),都應(yīng)使用符合考生當(dāng)前認(rèn)知水平的詞匯與表達(dá),確保作答不被構(gòu)念不相關(guān)的因素影響。其次,部分選擇題過度渲染情境,增加了考生作答時(shí)的閱讀量。命題人員在創(chuàng)設(shè)情境時(shí),應(yīng)盡可能使用簡潔的語言,避免冗余。以下結(jié)合具體示例進(jìn)行說明。
(1)表達(dá)超過考生水平
[例3 ]
The best way for him is a kidney transplant. Many members of the family _______ to be matched (匹配) with him.
A. volunteered B. refused
C. hated D. announced
(參考答案:A)
[例4 ]
What did we mainly use single bamboo drifting for in ancient times?
A. A kind of sport.
B. A way of dance.
C. A form of traditional art.
D. A type of transportation.
(參考答案:D)
在以上兩道例題中,例3的干擾項(xiàng)D. announced和例4的正答選項(xiàng)D. A type of transportation.均不屬于《義務(wù)教育英語課程標(biāo)準(zhǔn)(2022年版)》要求掌握的語言知識(shí)。
(2)過度渲染情境
[例5 ]
A best friend is a person _______ is always there when you need him or her. As the saying goes, “A friend in need is a friend indeed.”
A. whom B. whose C. who
(參考答案:C)
在本題中,考生依據(jù)第一句“A best friend is a person _______ is always there when you need him or her.”即可作出選擇;而題干又增加了第二句的諺語,看似是使情境更加豐富,實(shí)則是情境的過度渲染,造成了題干繁冗。建議刪除第二句,保留必要情境即可。
在題干編寫上,最突出的問題在于采用否定表述,增加了考生作答時(shí)的認(rèn)知負(fù)擔(dān)。Haladyna et al.(2002)指出,在題干中使用否定詞語會(huì)對(duì)學(xué)生及他們對(duì)此類題目的反應(yīng)產(chǎn)生負(fù)面影響。當(dāng)出現(xiàn)使用否定措辭的題目時(shí),學(xué)生往往較難理解題目含義,或是容易在作答時(shí)忘記反向思維,造成不必要的認(rèn)知負(fù)擔(dān)。要改進(jìn)此類題目,一方面可以盡可能規(guī)避否定措辭;另一方面也可考慮將題型改為多項(xiàng)判斷題(multiple true-false items),將原選項(xiàng)則轉(zhuǎn)化為新的題目(Harasym et al.,1993)。以下結(jié)合具體示例進(jìn)行說明。
[例6 ]
The mother albatross can do all the following things EXCEPT _______.
A. dive into water
B. reach faraway places
C. stay in air in windy weather
D. give birth to one baby every year
(參考答案:D)
[例7 ]
What can NOT passengers experience in the C919? 3
A. Comfortable seats. B. Clear screens.
C. Different kinds of foods. D. Exciting activities.
(參考答案:D)
例6和例7的題干中分別出現(xiàn)了EXCEPT、NOT這樣的否定表述。要改進(jìn)此類題目,一方面可以規(guī)避否定措辭。以例6為例,建議將題干改為“What can the mother albatross do?”,同時(shí)對(duì)應(yīng)調(diào)整選項(xiàng)。另一方面,可以采用多項(xiàng)判斷題,例如將例7進(jìn)行如下改編:
What can passengers experience in the C919? Mark A if true or B if false.
① Comfortable seats.
② Clear screens.
③ Different kinds of foods.
④ Exciting activities.
最后,在選項(xiàng)撰寫上,主要存在三點(diǎn)最為突出的問題。第一,部分選擇題答案不唯一,影響題目的科學(xué)性。第二,部分試題選項(xiàng)之間存在重疊,增加了考生作答時(shí)的閱讀量。第三,部分選項(xiàng)設(shè)置不科學(xué),存在答案泄露的情況,主要體現(xiàn)在選項(xiàng)間長度差異大、個(gè)別選項(xiàng)過于荒誕、選項(xiàng)內(nèi)容不同質(zhì)、干擾項(xiàng)干擾能力太弱等方面。以下結(jié)合具體示例進(jìn)行說明。
(1)答案不唯一
[例8 ]
What’s possibly the best title for the passage?
A. An unbelievable behavior.
B. An unforgettable experience.
C. Misjudgment in the mirror.
D. Payment at the toll station.
(參考答案:C)
本題出自一篇閱讀理解,文章講述了作者一次在收費(fèi)站被前車司機(jī)代付通行費(fèi)后深受感動(dòng),從而決定延續(xù)這種善舉的故事。在一次代付車費(fèi)時(shí),作者起初因在后視鏡中看到后車司機(jī)憤怒的神情而有所猶豫,但在支付費(fèi)用后,這位司機(jī)向他熱情地表示了感謝,這讓作者意識(shí)到不應(yīng)急于對(duì)他人作出判斷。該題為主旨大意題,參考答案C概括了作者誤判了后車司機(jī)這一情節(jié),但結(jié)合文章主要內(nèi)容,B選項(xiàng)和D選項(xiàng)也具有一定的正確性,無法完全排除。在命題時(shí),可以通過嚴(yán)格落實(shí)審題環(huán)節(jié)來避免這一情況。
(2)選項(xiàng)之間存在重疊
[例9 ]
What can we do if we feel disappointed?
A. We can go to bed.
B. We can call our friends.
C. We can walk on the playground.
D. We can write down our problems.
(參考答案:D)
在例9中,四個(gè)選項(xiàng)均包含“We can”,造成不必要的冗余。選項(xiàng)之間的重疊部分無疑增加了考生的閱讀量。要使這一題目更加簡潔,可以將選項(xiàng)中的“We can”均刪去,不影響本題表意。例如將該題進(jìn)行如下改編:
What can we do if we feel disappointed?
A. Go to bed.
B. Call our friends.
C. Walk on the playground.
D. Write down our problems.
(3)答案泄露
[例10 ]
Which of the physical actions in singing can lead to your happiness?
A. The control of the lungs.
B. The filling of the stomach.
C. The increase of the voices.
D. The movements of the mouth and the body.
(參考答案:D)
在例10中,與其他選項(xiàng)相比,正確答案D選項(xiàng)長度較為突出,一定程度上增加了考生通過猜測(cè)作答正確的概率,降低了題目的效度。要想避免這一情況,應(yīng)通過調(diào)整措辭盡可能保證各選項(xiàng)長度基本一致。
[例11 ]
What did scientists suggest people do before bed to sleep better?
A. Sleep an hour earlier.
B. Jump into bed.
C. Have a warm shower.
D. Set a time clock.
(參考答案:C)
在例11中,題干為“為了改善睡眠,科學(xué)家建議睡前做什么?”。B選項(xiàng)jump into bed(跳上床)明顯不合適,此時(shí)學(xué)生無需閱讀原文即可排除這一選項(xiàng)。
[例12 ]
She also to clean the house. When she finished her work, she felt happy to see the house much cleaner than before.
A. forget B. helped C. failed
(參考答案:B)
[例13 ]
— The food in the restaurant is great, isn’t it?
— Yes, it’s fine. I just don’t like the environment. The music is too .
A. talented B. useful C. noisy D. beautiful
(參考答案:C)
例12和例13呈現(xiàn)了選項(xiàng)不同質(zhì)的情況。在例12中,三個(gè)選項(xiàng)的語法結(jié)構(gòu)不一致(一個(gè)動(dòng)詞原形,兩個(gè)動(dòng)詞過去式),根據(jù)上下文時(shí)態(tài),動(dòng)詞原形可以被輕松排除,未能發(fā)揮干擾項(xiàng)作用;在例13中,四個(gè)選項(xiàng)的情感色彩不一致(一個(gè)負(fù)面,三個(gè)正面),根據(jù)題干中的“don’t like”,即可選出負(fù)面情感選項(xiàng),并不需要對(duì)上下文情境進(jìn)行仔細(xì)分析。因此,在命題時(shí),應(yīng)當(dāng)注意各選項(xiàng)間保持同質(zhì),避免答案泄露。
[例14 ]
How do you know where to go?
A. By inviting a guide.
B. By asking people on streets.
C. By calling the Treasure Find team.
D. By following the directions from the app.
(參考答案:D)
本題出自一篇閱讀理解,文章介紹了一款名為Treasure Find的游戲。題目考查細(xì)節(jié)理解,但在原文中未出現(xiàn)A、B選項(xiàng)的相關(guān)信息,完全不具備干擾能力,不能有效考查學(xué)生的理解能力。要提升干擾項(xiàng)的干擾能力,應(yīng)當(dāng)確保每一個(gè)選項(xiàng)都有可能合理。以本題為例,可在答案出處的上下文選取其他細(xì)節(jié)并改寫為干擾項(xiàng),起到一定程度的干擾作用。
選擇題作為中考英語最常見的題型,其質(zhì)量的提升對(duì)中考英語分?jǐn)?shù)解釋和運(yùn)用的效度有極其重要的影響?!读x務(wù)教育英語課程標(biāo)準(zhǔn)(2022年版)》在評(píng)價(jià)理念中明確了在語篇層面考查核心素養(yǎng)的要求(教育部,2022)。命題人員在運(yùn)用選擇題題型時(shí)首先要摒棄傳統(tǒng)上在單句層面考查語言知識(shí)的做法。設(shè)計(jì)良好的選擇題對(duì)中考英語的難度調(diào)控也能起到積極的作用,避免出現(xiàn)難度過大而難以滿足檢驗(yàn)初中英語課程目標(biāo)基本達(dá)成情況的測(cè)試目的。本文中論述的三個(gè)選項(xiàng)的優(yōu)勢(shì)應(yīng)落實(shí)在中考聽力理解方面的考查,部分省份也可以考慮在閱讀理解中采用三個(gè)選項(xiàng)的做法。如有必要,可將通過三個(gè)選項(xiàng)的設(shè)計(jì)節(jié)省出來的篇幅和考試時(shí)間用于增加幾道高質(zhì)量的選擇題,從而進(jìn)一步提高內(nèi)容覆蓋面和考試信度。限于篇幅,本文僅討論了經(jīng)過驗(yàn)證的選擇題的命題原則,建議命題者參閱更多語言測(cè)試相關(guān)的論著,如Green(2017)、Hughes & Hughes(2020)等,以磨煉選擇題命題技術(shù)。此外,命題人員應(yīng)充分認(rèn)識(shí)選擇題可能帶來的不良反撥效應(yīng),用良好的設(shè)計(jì)引導(dǎo)一線教學(xué),避免大量的課堂時(shí)間被浪費(fèi)在培訓(xùn)學(xué)生尋找漏洞、猜測(cè)命題意圖上,切實(shí)發(fā)揮好選擇題在核心素養(yǎng)測(cè)試中應(yīng)有的作用。
1 本文系中華人民共和國教育部課程教材研究所“初中學(xué)業(yè)水平考試命題質(zhì)量研究”(項(xiàng)目編號(hào):JCSZDXM2022009)的研究成果。
2 這里僅討論選擇題本身的設(shè)計(jì)問題。測(cè)查語言知識(shí)的單項(xiàng)選擇題因其缺乏足夠的語境,與《義務(wù)教育英語課程標(biāo)準(zhǔn)(2022年版)》的理念不相符,不建議在中考英語命題中采用。
3 更自然的表達(dá)應(yīng)為“What can passengers NOT experience in the C919?”,此處保留了原始題目的說法。
Currie, M. & Chiramanee, T. 2010. The effect of the multiple-choice item format on the measurement of knowledge of language structure [J]. Language Testing, 27(4): 471—491.
Fulcher, G. 2014. Multiple-choice items [EB/OL]. (2014-03)[2024-05-04]. https://languagetesting.info/features/mc/items.html.
Green, R. 2017. Designing listening tests: A practical approach [M]. London: Palgrave Macmillan.
Haladyna, T. M. 2004. Developing and validating multiple-choice test items (3rd ed.) [M]. Mahwah, NJ: Lawrence Erlbaum Associates.
Haladyna, T. M. & Downing, S. M. 1989a. A taxonomy of multiple-choice item-writing rules: Applied measurement in education [J]. Applied Measurement in Education, 2(1): 37—50.
Haladyna, T. M. & Downing, S. M. 1989b. Validity of a taxonomy of multiple-choice item-writing rules: Applied measurement in education [J]. Applied Measurement in Education, 2(1): 51—78.
Haladyna, T. M., Downing, S. M. & Rodriguez, M. C. 2002. A review of multiple-choice item-writing guidelines for classroom assessment [J]. Applied Measurement in Education, 15(3): 309—333.
Haladyna, T. M. & Rodriguez, M. C. 2013. Developing and validating test items [M]. New York, NY: Routledge.
Harasym, P. H., Doran, M. L., Brant, R. & Lorscheider, F. L. 1993. Negation in stems of single-response multiple-choice items: An overestimation of student ability [J]. Evaluation & the Health Professions, 16(3): 342—357.
Hughes, A. & Hughes, J. 2020. Testing for language teachers (3rd ed.) [M]. Cambridge: Cambridge University Press.
Jones, G. 2021. Designing multiple-choice test items [A]. In P. Winke & T. Brunfaut (eds.). The Routledge handbook of second language acquisition and language testing [C]. New York, NY: Routledge: 90—101.
Lee, H. & Winke, P. 2012. The differences among three-, four-, and five-option-item formats in the context of a high-stakes English-language listening test [J]. Language Testing, 30(1): 99—123.
Rodriguez, M. C. 2005. Three options are optimal for multiple-choice items: A meta-analysis of 80 years of research [J]. Educational Measurement: Issues and Practice, 24(2): 3—13.
Rupp, A. A., Ferne, T. & Choi, H. 2006. How assessing reading comprehension with multiple-choice questions shapes the construct: A cognitive processing perspective [J]. Language Testing, 23(4): 441—474.
Seinhorst, G. 2008. Are three options better than four: Investigating the effects of reducing the number of options per item on the quality of a multiple-choice reading test [D]. Lancaster: Lancaster University.
教育部. 2022. 義務(wù)教育英語課程標(biāo)準(zhǔn)(2022年版) [S]. 北京: 北京師范大學(xué)出版社.
林敦來, 高淼, 劉森, 等. 2022. 中國初中英語教師評(píng)價(jià)素養(yǎng)量表研究[M]. 長沙: 中南大學(xué)出版社.
林敦來 北京師范大學(xué)外國語言文學(xué)學(xué)院副院長、教授、博士生導(dǎo)師。
羅正清 北京師范大學(xué)外國語言文學(xué)學(xué)院博士生。
李威峰 浙江大學(xué)教育學(xué)院博士生,浙江省教育廳教研室初中英語教研員,浙江省英語特級(jí)教師。