高 燕
(山西大學(xué) 外國語學(xué)院,山西 太原 030006)
完形填空試題的考點效度分析
高 燕
(山西大學(xué) 外國語學(xué)院,山西 太原 030006)
完形填空試題由于在命題、實施、評卷、結(jié)果分析等方面具有客觀、便利等優(yōu)點,因而被廣泛應(yīng)用于外語教學(xué)和測試中。但是目前充斥市場的絕大多數(shù)完形填空試題效度不高,主要原因就是試題的考點層次不高,效度偏低。根據(jù)李筱菊提出的完形填空考點層次理論設(shè)計一道完形填空試題,并選擇某高校的學(xué)生進行試測,重點分析了答題正確率和失分原因,從實證的角度得出通過提高考點層次來提升完形填空試題考點效度的方法。應(yīng)著重培養(yǎng)學(xué)生在高層次考點上的能力,從而提高英語學(xué)習(xí)者的綜合英語水平。
完形填空;考點效度;試測;正確率
完形填空(cloze test)作為一種考試形式是從19世紀末開始得到應(yīng)用的。我們現(xiàn)在所采用的完形填空是以19世紀50年代泰勒的實踐為基礎(chǔ)設(shè)計的,根據(jù)的是格式塔心理(Gestalt psychology),即補全心理。[1]就是說,人們根據(jù)腦子里對事物的完整概念,看見不完整的事物,便會在思想里把它補全起來,應(yīng)用于語言現(xiàn)象。同樣,人們對于不完整的語言也有這種補全心理。完形填空正是基于此原理設(shè)計的試題形式。這種形式一出現(xiàn)就受到心理學(xué)界和語言教育界的關(guān)注。最初人們利用完形填空試題只是為了測量語言材料的可讀性和受試者的閱讀理解能力,后來發(fā)展為用于綜合語言能力的測試。曾經(jīng)有研究證明完形測試結(jié)果與綜合語言水平考試的結(jié)果高度相關(guān)。當(dāng)時形成的對完形填空的基本認識是:這是一種可靠并且有效的閱讀材料難度檢測與閱讀理解方式,可以用來作為標準化綜合性語言水平測試的組成部分,也可以用來配合課堂語言教學(xué)。[2]因此,迄今為止,完形填空這種題型被廣泛地用于國內(nèi)各種英語考試:如大學(xué)英語專業(yè)八級考試(TEM 8)、大學(xué)英語專業(yè)四級考試(TEM 4)等等。
完形填空的操作手段是刪除篇章中的一些詞語并評價讀者對刪掉詞語的反應(yīng)。經(jīng)典完形填空理論認為,完形填空具體刪什么詞,不影響考試的結(jié)果,因而是無關(guān)重要的。李筱菊卻認為,完形填空具體刪出的項目,在很大的程度上決定了完形填空試題的質(zhì)量。因此,她提出了完形填空考點效度的概
念,并將其考點劃分為四個層次:word單詞層次,phrase詞組層次,sentence句子層次,discourse語篇層次。李筱菊在《語言測試科學(xué)與藝術(shù)》中詳細指出:W(word)單詞層次是最低的層次。光看單詞,無須看單詞之外的上下文就能決定所填的詞。單純考拼寫、單純考詞法變位或單純考構(gòu)詞法的題目,屬于這個層次;P(phrase)詞組層次中,所要填的詞,和它前后的詞有固定的搭配關(guān)系,只要看空缺前或后的詞便能決定該填什么;S(sentence)句子層次要求空缺處要填的詞在本句內(nèi)決定,不用超出句子的范圍;D(discourse)語篇層次中,空缺處填什么詞,光看本句不成,要超出句子在語篇層次上考慮才能決定。這四個層次中單詞層次為最底層次,其次是詞組層次,句子層次,最高是語篇層次。[3]
考點層次的高低,對題目的效度很有關(guān)系。層次越高,意味著考點的效度越高。D層次考點的題目顯然比W層次考點的題目效度更高,更能測試出受試者運用語言的真正能力。而且,高層次的考點,在考高層次的能力(含知識)的同時,必然也考到低層次的能力(含知識)。也就是說高層次能包含低層次,但低層次卻不能反過來包含高層次。即:一個語篇層次的考點,在考查語篇層次的能力的同時,自然也考到了句子層次、詞組層次和單詞層次的能力。句子層次的考點,在考句子層次的能力的同時,也自然考到詞組層次和單詞層次的能力。但是單詞層次的考點,則只能考到單詞層次的能力或知識,不能考到它以上的任何層次的能力。因此,李筱菊提倡完形填空要著力使考點層次盡可能地高。另外,她提倡應(yīng)提高考點層次的原因是完形填空不同于語法測試和詞匯測試,它有語篇語境。這也是完形填空優(yōu)于低層次試題的方面。如果仍就用它去測試一些句子以下層次的考點,實際上是一種資源浪費?;谶@種理論,我們應(yīng)盡量使刪去的詞,即考點,靠近語篇層次,從而提高完形填空試題的效度。
首先,作者挑選了一篇題目為Global Warming的科普類文章,從中刪去一些詞,考點分別涉及詞匯意義區(qū)分(第7題),屬于單詞層次;詞組搭配(第10,14,17題),屬于詞組層次;非謂語形式(第1,6,18題),連詞(第19題),情態(tài)動詞的謂語形式(第12題),形容詞比較級形式(第15題),屬于句子層次;以及根據(jù)意義和上下文判斷的試題(第2,3,4,5,8,9,11,13,16,20題),屬于語篇層次。
在這20道題的完形填空當(dāng)中,涉及語篇層次考點的有10道,涉及句子層次考點的有6道,涉及詞匯層次考點的有3道,涉及單詞考點的只有1道。也就是說,80%的考點都在單詞和詞匯層次之上。
在試測中,作者抽取了某高校同等水平學(xué)生74名。測試時間設(shè)在上午。
整篇完形填空滿分20分,平均分只有9.9。也就是說平均每人的得分還不到50%。可見這篇完形填空對于學(xué)生來說難度較大。各個考點的正確率統(tǒng)計可見圖1。
圖1 各個考點層次的正確率
由此可以看出:第一,總體來看,正確率偏低。第二,語篇層次的得分率明顯低于其他三個層次的得分率。句子層次除了第12、第19題正確率較低(分別為26%和27%)之外,詞匯層次與單詞層次均處于中等水平。得分率基本為50%。第三,該完形填空答題正確率最高的是句子層次的第18題,正確率達到87%;其次是句子層次的第6題和第15題,正確率達到80%;正確率最低的是語篇層次的第2題和第4題,正確率都只有14%。
該篇完形填空試題難度較高,主要體現(xiàn)在以下幾個方面:第一,生詞較多。這是在各個層次都失分較多的一個原因。其中單詞層次的正確率也只有57%。例如,考題第7題,旨在考察表示“前總統(tǒng)”中“前”這一含義的單詞,要求區(qū)分former、formerly、previous、before這四個單詞。但是有一半的學(xué)生在此失了分。第二,語篇層次的考題較多。正確率最低的兩個考點就出在這一層次。傳統(tǒng)的教學(xué)使我們對語法、句法、詞匯等知識掌握的牢靠程度明顯高于對語篇語境的了解程度。在課堂上,經(jīng)常會遇到學(xué)生提問:“老師,這個詞在上篇文章中后面是加to的,這篇怎么加了in呢?”這就是很典型的忽視語境的表現(xiàn)。20世紀80年代之后興盛起來的交際英語教學(xué)卻并非如此。巴克曼和徐強提出的交際英語能力學(xué)
說,都包括語篇能力的部分[4-5]。第三,圖1顯示,句法層次除了個別題之外,正確率比詞匯和單詞層次還高。這是因為:句法層次的考題雖然比單詞和詞匯層次的考題難,但是由于涉及的基本語法知識在課堂中已經(jīng)詳細講授過,所以答題的正確率較高(如第18題)。該題目考察了兩個動詞在句子中的連接形式:要么采用動詞不定式來連接動詞原形,要么將第二個動詞改為動名次形式。其次是第6題和第15題。它們分別考察了現(xiàn)在分詞作伴隨狀語這種非謂語形式和形容詞的比較級形式。由于對這些句法知識掌握得比較牢靠,所以正確率很高。但是當(dāng)詞匯量加大,主要考察對語境的整體把握時,正確率就明顯降了下來。
上述實驗中以語篇層次為考點的題目錯誤率較高,說明學(xué)生運用語篇語境知識做題的能力較差,而只是注重了詞匯、語法等較低層次的知識訓(xùn)練。這種對較低層次能力考察的題型一般是單項填空之類的題型,而要想考察到較高層次能力的考點,只有完形填空之類的有語篇的題型才能做到。但是,如果我們對市場上大量的完形填空試題進行分析的話,就會發(fā)現(xiàn):絕大多數(shù)試題的考點都屬于低層次,超出句子層次達到語篇層次的題目很少,或一道也沒有。如果拿這些考試的結(jié)果作因素分析,很可能會發(fā)現(xiàn)單項填空試題和完形填空試題考察的是同樣的因素。也就是說,完全可以把完形填空試題拆開來成為一句一句的單項填空試題。這就使得完形填空的語篇語境完全失去了存在的意義,也就喪失了完形填空試題特有的效度。
因此,完形填空就要與單項填空的考點區(qū)別開來,應(yīng)當(dāng)充分利用其有語篇語境的優(yōu)點,不僅考查句子或句子以下層次的考點,還要有相當(dāng)量的題目考察語篇層次的考點。盡量提高考點的層次,從而有效地控制完形填空試題的質(zhì)量。
這樣的高質(zhì)量的試題可以引導(dǎo)學(xué)生更為注重綜合英語水平能力的提高,不僅重視詞匯語法知識,還更應(yīng)著重培養(yǎng)語篇、語境、語義,甚至文化常識等綜合知識,達到靈活運用,從而提高英語的綜合水平。因此,從這個角度來講,這樣的高質(zhì)量的試題對于從應(yīng)試教育向素質(zhì)教育的轉(zhuǎn)型具有重大的意義。
[1] TAYLOR W L. Cloze procedure:a new tool for measuring readability[J].Journalism Quarterly,1953(30):415-433.
[2] 武尊民.英語測試的理論與實踐[M].北京:外語教學(xué)與研究出版社,2002:115-126 .
[3] 李筱菊.語言測試科學(xué)與藝術(shù)[M].長沙:湖南教育出版社,1997:250-260.
[4] BACHMAN L F, PALMER A.Language testing in practice[M]. Oxford and New York:Oxford University Press,1996.
[5] 徐強.交際法英語教學(xué)和考試評估[M].上海:上海外語教育出版社,2000:1-24.
(責(zé)任編輯:施建平)
A Validity Analysis of Cloze Test
GAO Yan
(Foreign Language College, Shanxi University, Taiyuan 030006, China)
Cloze test, as a type of language practice and testing in foreign language teaching and testing, has been widely used for its convenience and objectiveness. However, it does not have high qualities and high validity, which are mostly caused by the low validity of testing points in a cloze test. Therefore, this paper determines to design a cloze, based on the theory of validity of testing points proposed by Li Xiaojv, and pretests it on a group of students from a certain university. After that, it makes a detailed analysis of how to improve the validity of testing points of a close test in terms of its accuracy rate and the causes of losing scores.
cloze test;validity of testing points;pretest;accuracy
H319
A
1008-7931(2014)05-0082-03
2014-04-02
高 燕(1979—),女,山西晉中人,講師,碩士,研究方向:應(yīng)用語言學(xué)及英語語言測試研究。