白雪
【摘要】本文根據(jù)空缺刪除原則的不同,將各種完形填空變體歸為基于語言冗余性和基于語言能力成分觀兩大類,并就兩類完形填空對(duì)效度論證的不同要求進(jìn)行了總結(jié)。
【關(guān)鍵詞】完形填空 語言冗余性 語言能力成分觀 效度論證
完形填空(cloze procedure)最初作為衡量文本易讀性(readability)的一種研究方法,由泰勒(Wilson L. Taylor)于1953年借鑒格式塔心理學(xué)術(shù)語closure正式命名。由于出題便捷、評(píng)分客觀,完型填空被拓展應(yīng)用于一般性智力測(cè)驗(yàn)、母語語言能力測(cè)量及學(xué)習(xí)效果(reading to learn)評(píng)定等領(lǐng)域。20世紀(jì)六七十年代,該題型開始用于第二語言教學(xué)與測(cè)試。(Alderson 1979)使用者出于測(cè)試目標(biāo)、語言觀以及可行性等方面的考慮,通過空缺刪除原則、答題方式等的改變,研發(fā)出不同的完形填空變體形式。其中空缺刪除原則的不同,反映了設(shè)計(jì)者的不同語言觀,語言觀的差異又對(duì)完形填空試題開發(fā)和效度論證都提出了不同要求。
一、基于語言冗余性的完形填空
1.標(biāo)準(zhǔn)定比刪除完型填空。最初,用于易讀性測(cè)試的完型填空使用定比刪除原則(fixed-ration deletion),即每隔n個(gè)單詞刪除一詞。被引入母語閱讀水平測(cè)試領(lǐng)域時(shí),仍堅(jiān)持這一標(biāo)準(zhǔn)操作程序。通過一系列信度和效標(biāo)關(guān)聯(lián)效度研究,研究者認(rèn)為被試在該題型上的表現(xiàn)一致性良好(performance consistency),測(cè)試結(jié)果穩(wěn)定有效。
完形填空用于易讀性研究和母語水平測(cè)試的理論基礎(chǔ)是語言中普遍存在可簡(jiǎn)化冗余性(Language reduced redundancy,簡(jiǎn)稱LRR)(Spolsky et al. 1968)人們有能力通過推測(cè)加工出被簡(jiǎn)化的冗余信息來補(bǔ)全話語完成交際。通過觀察被試?yán)谜Z言固有冗余性來填補(bǔ)空缺的情況,在被試同質(zhì)的情況下,可判斷文本的難易度,在文本一定的情況下,可判斷被試的母語水平。在母語水平測(cè)試中應(yīng)用LRR類題型最基本的操作原則是保證采樣的隨機(jī)性,完形填空設(shè)計(jì)中通過文本選擇和空缺設(shè)置兩層隨機(jī)性處理,確保對(duì)被試語言能力采樣的隨機(jī)性。(Lin et al. 2008)
這種對(duì)隨機(jī)性的強(qiáng)調(diào),是基于反實(shí)在論(antirealism)的工具主義(instrumentalism)證明測(cè)試有用性(usefulness)的必然要求(Fulcher 2014)。反實(shí)在論者認(rèn)為不存在所謂語言能力這一心理實(shí)體,或認(rèn)為沒有必要對(duì)其本質(zhì)及構(gòu)成進(jìn)行研究,需要證明的是測(cè)試語境(assessment context)對(duì)測(cè)試成績(jī)使用的目標(biāo)語境有充分的代表性,考生在測(cè)試中的表現(xiàn)可以概化到目標(biāo)語境(Chapelle 1998)。
對(duì)目標(biāo)語境的代表性一方面通過內(nèi)容分析等手段比較測(cè)試語境與目標(biāo)語境的異同獲得(Jonz 1989),另一方面就要從操作層面確保隨機(jī)性,保證對(duì)目標(biāo)語境的有效覆蓋,傳統(tǒng)的定比刪詞完型程序(fixed-ratio cloze procedure)被認(rèn)為是保證隨機(jī)性的有效手段,而基于語言冗余性原則的各類變體形式效度論證中也需要提供隨機(jī)性證明。
2.基于隨機(jī)性的完形填空變體形式。六七十年代,定比刪詞完型用于測(cè)試二語綜合能力(a measure of overall ESL proficiency)后,研究顯示,被試的表現(xiàn)一致性不如母語穩(wěn)定,不同研究所得的信度差異巨大,在0.31到0.96之間(Brown 2013),為一組被試設(shè)計(jì)的測(cè)試很難在更換被試后取得同樣可靠的效果。針對(duì)相同被試,文章難度、話題、刪詞頻率的變化也都會(huì)影響測(cè)試信度。(Klein-Braley 1981)而且,一段完形填空中大量題目的區(qū)分度很低。
鑒于此,有研究者在堅(jiān)持隨機(jī)性的基礎(chǔ)上,對(duì)完形填空進(jìn)行改造以提高測(cè)試的穩(wěn)定性和可靠性。比較有代表性的有以下兩種:
(1)剪裁型完型(well-tailored cloze)。即將一篇文章根據(jù)首個(gè)刪詞點(diǎn)的不同,按定比刪詞,設(shè)計(jì)為一組試卷,進(jìn)行試測(cè),根據(jù)試測(cè)得出的題目難度、區(qū)分度進(jìn)行篩選,得到一組改良版試題用于實(shí)測(cè)。(Brown et al. 2001)
(2)C-Test。標(biāo)準(zhǔn)C-Test中,文章首句保持完整,從第二句起,每隔一詞刪去一個(gè)單詞后一半(如單詞字母數(shù)是單數(shù),則刪除部分比保留部分多一個(gè)字母。單字母詞,如 “I”、“a”,可從計(jì)數(shù)中忽略。在實(shí)際操作中,往往也有以音節(jié)為刪除單位的情況)。Raatz and Klein-Braley (1981)認(rèn)為,C-Test比傳統(tǒng)完型更嚴(yán)格的遵守了隨機(jī)性原則,并且具有更高的可靠度。
二、基于語言能力成分觀的完形填空
為解決二語教學(xué)測(cè)試中完形填空信度不高、試題區(qū)分度不佳的問題,除上文所述在堅(jiān)持隨機(jī)性原則基礎(chǔ)上所提出的改良方法以外,有更多的研究者對(duì)隨機(jī)刪除原則本身提出了質(zhì)疑。Alderson指出基于LRR所要求的隨機(jī)性原則的傳統(tǒng)完形填空不適用于二語教學(xué)與測(cè)試,非母語條件下,刪除哪些語言成分還應(yīng)該基于“語言本體及語言加工理論”。后來更明確區(qū)分了兩類完型題型,用gap-filling test指基于一定理論的理性刪除完型(rational deletion cloze),用cloze專指?jìng)鹘y(tǒng)的定比刪除完型,并認(rèn)為前者可用于測(cè)試閱讀理解能力,后者則不能。(Alderson 2000)
從語言能力成分觀出發(fā)的刪除原則代表了向?qū)嵲谡摚╮ealism)方向的轉(zhuǎn)變,研究者認(rèn)同語言能力(competence)是一種實(shí)體性的抽象心理存在,只是不能被直接觀察到,需要將設(shè)想的抽象能力操作化為可觀察的形式,通過被試的表現(xiàn)對(duì)這些心理特質(zhì)(trait)進(jìn)行推測(cè)。(Fulcher 2014)“研究者在現(xiàn)實(shí)世界中進(jìn)行觀察,其目的是想在觀察的基礎(chǔ)上描寫、歸納或解釋某些東西,而這些東西我們可稱之為‘構(gòu)念(construct)”(Chapelle 1998)
對(duì)于理性刪除完型來說,測(cè)試設(shè)計(jì)者在不同的語言理論框架下根據(jù)各自需要考察的重點(diǎn),設(shè)置空缺,推測(cè)被試某方面的能力。如刪除語法詞考察句法能力,刪除實(shí)詞考察語篇連貫和詞匯搭配能力,按比例刪除有關(guān)句法、連貫、策略運(yùn)用的詞考察多元能力結(jié)構(gòu)(Bachman 1985)等等。
雖然研究者依據(jù)的語言理論不同,但研究興趣大體集中在完型填空能否在各個(gè)知識(shí)或加工過程層面有效區(qū)分被試。有研究認(rèn)為設(shè)計(jì)良好的完形填空題能全面反映被試詞匯、語法、語篇知識(shí),完成題目既需要低層解碼加工過程,也需要高層理解加工過程,題目不僅能檢測(cè)被試學(xué)習(xí)閱讀(learning to read)的情況,也能反映通過閱讀學(xué)習(xí)知識(shí)的情況(reading to learn)。(Gellert & Elbro 2013)另有研究者認(rèn)為,完形填空只能考察句法詞匯知識(shí),完成題目不涉及閱讀整合等高層加工過程,題目完成后無法更新記憶中已有的情境圖式(schema),不能從閱讀中學(xué)習(xí)新東西,和自然閱讀加工過程存在極大差異。(Nation & Snowling 1997) Brown(2004)則綜合雙方觀點(diǎn),認(rèn)為完形填空對(duì)低水平被試來說,更偏重考察低層加工能力,對(duì)高水平被試來說,更側(cè)重考察高層加工能力。
因?yàn)閷?duì)完型填空能否考察高層閱讀加工能力爭(zhēng)議較大,為明確突出考查語篇閱讀能力的目的,研究者又專門開發(fā)了以下變體形式:如句子/語段完型(gap sentence/ gap text),即抽取文中的句子、段落,打亂順序回填(用于First Certificate in English(簡(jiǎn)稱FCE)、Certificate in Advanced English(簡(jiǎn)稱CAE));空缺詞組(phrase cloze)(Sadeghi 2014)以及刪除語篇連貫機(jī)制(cohesive device)的語篇完型(discourse cloze)(Storey 1997)。
基于語言能力成分觀的完形填空在試題開發(fā)時(shí),要求命題者有清晰的欲測(cè)能力構(gòu)念,并對(duì)考生行為做出預(yù)測(cè);測(cè)試后收集答題結(jié)果和過程中的各項(xiàng)證據(jù),核查答題者行為是否與命題者的預(yù)測(cè)相符。
可見,基于不同語言觀的完形填空題型,從命題要求到效度論證需求都存在著較大差異,測(cè)試研發(fā)者需要審慎選擇,切忌在設(shè)空時(shí)既無測(cè)試目標(biāo),又不遵修隨機(jī)性原則,而使測(cè)量目標(biāo)不明確,構(gòu)念效度論證無的放矢。
參考文獻(xiàn):
[1]Alderson,J.C.1979.The cloze procedure and proficiency in English as a foreign language.TESOL Quarterly 13.219-28.
[2]Alderson,J.C..2000.Assessing reading Cambridge:Cambridge University Press.
[3]Bachman,L.F..1985.Performance on the cloze test with fixed ratio and rational deletions.TESOL Quarterly 19.335-56.
[4]Brown,J.D.2013.My twenty-five years of cloze testing research:So what?International Journal of Language Studies 7.1-32.
[5]Brown,J.D.,A.D.Yamashiro & E.Ogane.2001.The Emperors new cloze:Strategies for revising cloze tests.A focus on language test development,ed.by T.Hudson & J.D.Brown,143-61.Honolulu,HI:University of Hawai‘i Press.
[6]Chapelle,C.A.1998.Construct definition and validity inquiry in SLA research.Interfaces between second language acquisition and language testing research.,ed.by L.F.Bachman & A.D.Cohen,32-111.Cambridge,U.K.
[7]New York,NY:Cambridge University Press.
[8]Fulcher,G.2014.Philosophy and Language Testing.The Companion to Language Assessment,ed.by A.J.Kunnan.Chichester,West Sussex,U.K.; Malden,MA:Wiley-Blackwell.
[9]Gellert,A.S.& C.Elbro.2013.Cloze Tests May be Quick,But Are They Dirty?Development and Preliminary Validation of a Cloze Test of Reading Comprehension.Journal of Psychoeducational Assessment 31.16-28.
[10]Jonz,J..1989.Textual sequence and second-language comprehension.Language Learning 39.207–49.
[11]Klein-Braley,C..1981.Empirical Investigations of Cloze Tests:University of Duisburg Unpublished PhD.
[12]Lin,W.,H.Yuan & H.Feng.2008.Language reduced redundancy tests:a reexamination of cloze test and C-test.Pan-Pacific Association of Applied Linguistics 12.61-79.
[13]Nation,K.& M.Snowling.1997.Assessing reading difficulties:The validity and utility of current measures of reading skill.British Journal of Educational Psychology 67.359-70.
[14]Raatz,U.& C.Klein-Braley.1981.The C-Test-a modification of the cloze procedure.Practice and Problems in Language Testing,ed.by T.Culhane,C.Klein-Braley & D.K.Stevenson,113-48.Colchester:University of Essex.
[15]Sadeghi,K.2014.Phrase Cloze:A Better Measure of Reading?The Reading Matrix 14.76-94.
[16]Spolsky,B.,S.M.Bengt,E.W.Sako & C.Aterburn.1968.Preliminary studies in the development of techniques for testing overall second language proficiency.Problems in Foreign Language Testing.Language Learning Special Issue,ed.by J.A.U.a.J.Fata,79-103.
[17]Storey,P.1997.Examining the test-taking process:A cognitive perspective on the discourse cloze test.Language Testing 14.214-31.