張曉萍
(南京大學(xué)教育研究院,江蘇南京 210093;常州機(jī)電職業(yè)技術(shù)學(xué)院基礎(chǔ)部,江蘇常州 213164)
PRETCO考試中閱讀測試的效度研究
張曉萍
(南京大學(xué)教育研究院,江蘇南京 210093;常州機(jī)電職業(yè)技術(shù)學(xué)院基礎(chǔ)部,江蘇常州 213164)
閱讀測試是語言類測試的重要組成部分,其目的是測量學(xué)生的閱讀能力。閱讀測試的效度又是達(dá)到這一測試目的的保證。文章結(jié)合全國英語應(yīng)用能力考試,即PRETCO考試,從閱讀本質(zhì)、表面效度和內(nèi)容效度等方面探討了閱讀測試的效度,并指出通過明確測試目的、選取高質(zhì)量的閱讀材料和采用恰當(dāng)?shù)臏y試問題等方式,可以提高閱讀測試的效度。
PRETCO考試;閱讀測試;內(nèi)容效度;表面效度
PRETCO即高等學(xué)校英語應(yīng)用能力考試,是由教育部1998年批準(zhǔn)的標(biāo)準(zhǔn)化英語水平考試,2000年正式實(shí)施,主要考核高職學(xué)生實(shí)際應(yīng)用英語進(jìn)行日常和業(yè)務(wù)涉外交際的能力。它已逐漸成為高職高專類學(xué)校的統(tǒng)考內(nèi)容,教育部把該考試指標(biāo)作為評估學(xué)校的硬性標(biāo)準(zhǔn)之一。
PRETCO考試由5個(gè)部分組成,即聽力、詞匯、閱讀、翻譯和作文。第三部分是閱讀理解,即考察學(xué)生從書面文字材料獲取信息的能力,總閱讀量約1,000詞,閱讀材料涉及的詞匯限于《高職高專教育英語課程教學(xué)基本要求》所列的詞匯表中的3,400詞的范圍。此部分得分為35分 (占總分的35%),測試時(shí)間為40分鐘,閱讀部分在整個(gè)考試中分值和時(shí)間上所占比重都很大,因此對閱讀測試的效度研究很有必要。
對學(xué)生的閱讀技能進(jìn)行測試并使之具有一定的效度,首先必須先明確閱讀的本質(zhì)。閱讀就是讀者與作者交流的過程,從最小的語素到最大的段落、篇章,最終取得對整片文章的理解。閱讀活動(dòng)是一種多種因素、多向交流與反應(yīng)的復(fù)雜解碼過程。從對文字的感知、理解到獲得信息,需要經(jīng)過一系列的心理和物理多種因素相互作用的過程,從而完成多種認(rèn)識活動(dòng)。例如:接受“視覺輸入” (visual input)信息,激活已有的背景知識,對輸入信息的理解,對未輸入視覺信息的預(yù)測,對未明確表達(dá)的概念的推斷等。
從心理學(xué)的圖式理論來講,閱讀不是被動(dòng)地接受信息,而是積極地把新信息同已有的圖式表征的舊知識加以聯(lián)系,在以往經(jīng)驗(yàn)的舊知識與新信息相互聯(lián)系的基礎(chǔ)上,通過“同化”與“順應(yīng)”而形成的現(xiàn)有的知識結(jié)構(gòu)框架,就達(dá)到了閱讀理解,啟動(dòng)腦中相應(yīng)的圖式或是使現(xiàn)有的知識系統(tǒng)活躍起來。
Goodman(1967)[1]和Smith(1971)[3]提出了心理語言學(xué)的閱讀模式,稱為“自上而下模式”(topdown)。其中提出:人在閱讀的過程中,大腦就像是一個(gè)信息加工中心,閱讀者根據(jù)本人大腦中已有的句法知識和語義知識對閱讀材料進(jìn)行預(yù)測,并在閱讀過程中逐一證實(shí)和修正。這一模式的實(shí)質(zhì)即是:閱讀活動(dòng)實(shí)際上是一種語言知識的實(shí)踐和實(shí)現(xiàn)。
后來,拉柏格(Laberge)和薩姆爾(Samuels)提出了一種“自下而上模式”(bottom-up)。該模式強(qiáng)調(diào)把材料作為信息輸入,閱讀者從字母和單詞的辨認(rèn)開始,不斷進(jìn)行信息組合,完成閱讀活動(dòng)。其實(shí)質(zhì)就是把閱讀過程看作一種純粹的語言知識的應(yīng)用活動(dòng)。
由此可見,閱讀是一個(gè)極其復(fù)雜的過程,人在閱讀時(shí),大腦需要不斷的對外界輸入的信息進(jìn)行自上而下和自下而上的綜合加工處理。
Hughes(1989)[2]指出:閱讀測試要準(zhǔn)確地反映出被測試者的閱讀能力,即測試閱讀的效度(validity)。
效度(Validity)即有效性,它是指測量工具或手段能夠準(zhǔn)確測出所需測量的事物的程度。效度具體講,是指一份測試是否測量了設(shè)計(jì)者所想要測量的東西,或者說,是否測量了設(shè)計(jì)者所要考查的內(nèi)容。即便一項(xiàng)考試信度很高,但并沒有考到應(yīng)考的內(nèi)容,這樣的考試效度就不高。所以說效度的高低是語言測試的最基本出發(fā)點(diǎn)。
Bachman將語言測試的效度分為以下幾種類型:1)內(nèi)容效度(content validity),內(nèi)容效度的高低根據(jù)測試所包含的具體內(nèi)容來確定。測量目的是設(shè)計(jì)者在測試之前必須先考慮的因素,然后確定具體的測試內(nèi)容。2)結(jié)構(gòu)效度(construct validity),結(jié)構(gòu)效度的高低根據(jù)測試項(xiàng)目和其所反映的理論關(guān)系決定。比如,語言交際能力測試和語言交際能力理論的關(guān)系越大,測試的結(jié)構(gòu)效度就越高。3)標(biāo)準(zhǔn)關(guān)聯(lián)效度(criterion-related validity),標(biāo)準(zhǔn)關(guān)聯(lián)效度的高低源于一項(xiàng)測試在反映學(xué)習(xí)者水平方面與其他外在評估標(biāo)準(zhǔn)的一致性程度上。4)預(yù)測效度(predictive validity),預(yù)測效度的高低根據(jù)測試能否準(zhǔn)確地預(yù)測學(xué)習(xí)者將來的學(xué)習(xí)成績而定。某一單項(xiàng)語言測試應(yīng)該能夠預(yù)測學(xué)習(xí)者在這一語言能力方面的水平。5)表面效度(face validity),指測試中根據(jù)觀察者的主觀判斷。達(dá)到測試預(yù)先設(shè)想的知識或能力的程度。
效度的分析角度很多,本文只從內(nèi)容效度和表面效度來分析閱讀測試的效度。
內(nèi)容效度(content validity)指一套測試題是否測試了應(yīng)該測試的內(nèi)容或者說所測試的內(nèi)容是否反映了測試的要求,即測試的代表性和覆蓋面的程度。如果要測試一個(gè)人的學(xué)習(xí)成績,應(yīng)該按照教學(xué)大綱和教學(xué)目的來設(shè)計(jì)測試內(nèi)容;如果考試的目的是測試閱讀理解,應(yīng)該提供專業(yè)性不強(qiáng)、被試者比較熟悉的材料。表面效度(face validity)指測試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn),測量的內(nèi)容與測量目標(biāo)之間是否適合,即一套測試題從表面看來是否是合適的。例如,若一次閱讀理解力的測試包括許多被試者沒有學(xué)過的方言詞匯,那么這次測試缺乏表面效度。表面效度是測試出被試者正常水平的一種保證因素。
例如,在英語閱讀測試中,經(jīng)常會遇到對某個(gè)詞的測試。例如2010年6月A級英語考試第43題“forewarn” (Line 2,Para.4) is used in the passage to refer to____.本題要求考生根據(jù)上下文的來推測“forewarn”的含義,但是很多考生根據(jù)上下文也難以選出正確答案。而如果有些考生最近碰巧看過這單詞,根本不需要通過上下文就能輕而易舉地選出正確答案。而且這種方法所能測到的詞往往很少,因此具有極大的偶然性和隨機(jī)性,該測試的內(nèi)容效度就很低,從而影響了測試的效度。
在2010年12月的A級考試中,有如下兩個(gè)閱讀理解問題:
36.In the author’s opinion,which of the following is vital for a company to be successful?
A.Specialized knowledge B.Highly-skilled staff
C.Exceptional talent D.Teamwork skills
40.What is the best title of the passage?
A.Team Building B.Problem Solving
C.Communication Skills D.company Management
第36題考核考生能否根據(jù)文章內(nèi)容來進(jìn)行推理判斷,也可以視為主旨大意題,通看全文也不難發(fā)現(xiàn)答案是D Teamwork skills。因?yàn)槲恼碌牡?、3段落的內(nèi)容都是圍繞這個(gè)主題展開,40題則要求考生找個(gè)最佳標(biāo)題,即主題思想,這與36題作者的觀點(diǎn)相一致,所以36題直接影響了40題答案的選擇,正確答案即為A Team Building。根據(jù)項(xiàng)目反應(yīng)理論[4],一個(gè)考生對試卷里各個(gè)題目的反應(yīng)在統(tǒng)計(jì)上是獨(dú)立的,這就是說,他對某個(gè)題目的反應(yīng)不應(yīng)影響他對別的題目的反應(yīng);一個(gè)題目的內(nèi)容不應(yīng)對其他題目提供任何提示。所以在某種意義上來說,它違背了項(xiàng)目反應(yīng)理論。從表面效度來看,它達(dá)到了卷面標(biāo)準(zhǔn),且“符合”設(shè)計(jì)者的考察要求,但從內(nèi)容效度來看,測試的內(nèi)容覆蓋面程度不高,從而影響了考生的成績信度。
測試與考生的實(shí)際水平之間是存在差別的。但是,從某種程度上來說,以能力為主的考試可以有效測試學(xué)習(xí)者的實(shí)際水平和能力。要有效提高閱讀測試的效度,必須要做到:
1)明確測試的目的。從內(nèi)容效度上來講,測試者首先要明白閱讀測試的目的、測試的對象、被試者的語言能力和閱讀能力層次。針對不同階段、不同水平的學(xué)習(xí)者,測試者才能設(shè)計(jì)出效度高的閱讀問題。
2)選取高質(zhì)量的真實(shí)的閱讀測試材料。根據(jù)要測試的閱讀能力,選擇學(xué)習(xí)者合適的、比較熟悉的閱讀材料,為了保證閱讀測試的內(nèi)容效度,選擇閱讀材料時(shí)要注意:
①所選材料的長度和篇數(shù)要適當(dāng)。對于非英語專業(yè)的專科學(xué)生,每篇閱讀材料的字?jǐn)?shù)要控制在250詞左右,一般以4-6篇為宜。
②閱讀材料的類型要真實(shí)多樣。選取的材料要貼近生活,而且要具有多樣性。比如在2007年6月的A級考試中,閱讀第三篇涉及到一則藥物說明NUROFEN RECOVERY(紐洛芬去痛片),閱讀第五篇講的是Life Insurance。在2007年12月的A級考試中,同樣在閱讀第二篇講到勞動(dòng)合同Terms and Conditions of Employment,在現(xiàn)實(shí)生活中,人們常常會遇到此類問題,對考生來講,這類材料是真實(shí)存在的。
③避免選擇某一文化氛圍太重的文章,以免某些學(xué)生因不熟悉文化背景而影響理解;也不要選擇學(xué)生十分熟悉的題材,因?yàn)閷W(xué)生可能完全憑借背景知識來解題。這樣就無法真正測出學(xué)生的閱讀能力。比如2007年12月的A級考試,閱讀第一篇主要介紹了墨爾本這個(gè)城市,有以下兩道題目:
36.Melbourne is well-known in the world for its____.
A)large population B)educational institutions
C)transport system D)beautiful parks and gardens
38.Melbourne people are very interested in____.
A)sports B)sunbathing
C)sightseeing D)traveling
這兩道題目考生完全可以根據(jù)自己的文化背景來找到答案,墨爾本作為澳大利亞第二大城市,享有文化重鎮(zhèn)和體育之都的美譽(yù)。因此36題目答案為B,喜歡網(wǎng)球和F1賽車的考生不難發(fā)現(xiàn)38題的答案為A。
④語言難度要適當(dāng)。避免在文章中出現(xiàn)太多的生詞,一般生詞量不超過文字的2%就可以。
3)選擇恰當(dāng)?shù)臏y試問題。避免設(shè)計(jì)的測試題目考生根據(jù)一般常識就能回答。測試者應(yīng)多采用考查語言運(yùn)用水平的題型,盡量使試題多樣化。在歷年的PRETCO考試中,閱讀題型也會兼顧多樣化,除了傳統(tǒng)的選擇題,還設(shè)置了填空、回答問題和某一領(lǐng)域?qū)I(yè)詞匯匹配題。
事實(shí)上,測試者很難設(shè)計(jì)出一份完美的試卷。有些考生可以采用一些與閱讀理解無關(guān)的應(yīng)試技巧就可以回答問題。這些方式包括排除法、常識推理法、推測法、或者在前后的測試題目中發(fā)現(xiàn)相關(guān)線索等等。所以,測試者要盡量避免這類題目的出現(xiàn)。
從理論上講,測試中所反映出的被試者的水平必須與他的實(shí)際水平完全相同。但實(shí)際上,由于測試題目設(shè)計(jì)的內(nèi)容效度、表面效度等客觀原因或考生精神緊張,心情不好,缺乏考試經(jīng)驗(yàn)等主觀原因很難做到。要想達(dá)到理想的閱讀測試效度并不是一件容易的事情。測試者要選擇合適的閱讀材料、設(shè)計(jì)出高質(zhì)量的測試題目;同時(shí)還要考慮被試者的語言水平和閱讀能力層次、被試者的文化背景等等。所有這些都屬于內(nèi)容效度的范疇。如果能夠綜合地考慮到上述種種因素,就會使得測試能最大限度地反映被試者真正的閱讀水平,體現(xiàn)被試者的實(shí)際閱讀能力,達(dá)到較高的測試閱讀效度。
當(dāng)然,作為英語語言工作者,也應(yīng)該掌握一些語言測試?yán)碚?不能只憑感覺出題或隨意從一些文章或參考資料中信手拈來一些現(xiàn)成的試題來測試學(xué)生。在命題時(shí),為保證試題的質(zhì)量,必須在試題的選材和題型上狠下功夫。只有科學(xué)有效地測試學(xué)生的閱讀能力才能有利于提高教學(xué)效果,促進(jìn)教與學(xué)的共同發(fā)展。
[1]Goodman,K.S.Reading:A Psycholinguistic guessing game,Journal of the Reading Specialist[J].College Reading Association,1967,(6):259-264.
[2]Hughes,A.Testing for Language Teachers[M].Cambridge:CUP,1989.
[3]Smith,F.Understanding reading[M].New York:Holt,Rinehart,and Winston,1971.
[4]劉潤清,韓寶成.語言測試和它的方法(修訂版)[M].北京:外語教學(xué)與研究出版社,2000.
[5]李卿,任素貞.英語閱讀測試的效度研究 [J].雞西大學(xué)學(xué)報(bào),2008,(5).
[6]劉潤清.論大學(xué)英語教學(xué)[M].北京:外語教學(xué)與研究出版社,1999.
[7]易興霞.從效度、內(nèi)省法看我國英語閱讀測試[J].廣東教育學(xué)院學(xué)報(bào),2000,(4).
On the validity of reading materials in PRETCO tests
ZHANG Xiao-ping
(Education Research Institute,Nanjing University,Nanjing,Jiangsu,China 210093;Basic Courses Department,Changzhou Institute of Mechatronic Technology,Changzhou,Jiangsu,China 213164)
As an important part of language tests,reading test aims to check students’reading ability.Validity is an important means to ensure the goal.By analyzing the reading materials in PRETCO tests,the essay explores the validity of reading tests from perspective of the essence of reading test,face validity and content validity.The validity of reading tests can be improved by defining the testing purpose,choosing proper reading materials as well as adopting proper questions.
PRETCO tests;reading test;content validity;face validity
10.3969/j.issn.1671-9581.2012.03.023】
G424.74
A
1671-9581(2012)03-0089-04
2012-05-01
張曉萍(1979-),女,陜西渭南人,常州機(jī)電職業(yè)技術(shù)學(xué)院基礎(chǔ)部講師,南京大學(xué)教育研究院在讀碩士,研究方向:英語教學(xué)。