宋征
天津美術(shù)學(xué)院,天津300141
測試信度:Bachman(1996)把信度定義為“測試的一致性”。簡言之,就是測試結(jié)果的可信度、可靠度,即考分的一致性。測試信度是測試準(zhǔn)確度的一種體現(xiàn),測試的準(zhǔn)確度越高,信度越高。
影響語言測試信度的因素主要包括以下幾個方面。
1.環(huán)境因素。有大量的環(huán)境因素會對學(xué)生的考試產(chǎn)生不利影響。如嘈雜的考場環(huán)境和考場的溫度,此外諸如考場的光線、空間、通風(fēng)等因素都會對考試的信度造成影響。這里要特別提到的是,嘈雜的考場環(huán)境對外語語言測試中的聽力和口語考試影響尤為突出,因為這兩種考試涉及大量聽說內(nèi)容,如果有其它聲音的干擾,會嚴(yán)重影響測試效果,進(jìn)而大大降低測試信度。
2.測試的管理程序。不同的受測群體、不同的考試地點和不同的考試時間等因素會影響考試信度。
3.測試項目。首先,測試的題目數(shù)與測試的信度是相關(guān)的,題目數(shù)過少會降低測試信度。所以在測試設(shè)計中,要確保足量的測試題目數(shù)以保證測試的信度。Henning(1988)曾指出要保證信度,一次考試的題目數(shù)不應(yīng)少于75題。其次,考試難度也和考試信度息息相關(guān)??荚囘^難過易都會降低考試信度。最后,考試題目種類的設(shè)計也很重要。
4.受試者自身的生理、心理因素。受試者本身的一些生理和心理因素也會對考試信度造成影響。例如身體不適、心理上對考試的厭倦、情緒上的波動(緊張或焦慮等情緒)等因素都會導(dǎo)致考試成績無法真實反映學(xué)生語言能力,進(jìn)而影響測試信度。在外語語言測試中,口語和聽力測試在這方面問題尤為突出。很多國內(nèi)外學(xué)者都對心理緊張、焦慮和聽力、口語考試之間的關(guān)系進(jìn)行過研究,此方面的專業(yè)論述也頗多。
測試效度:指 “成功地實現(xiàn)測試目的程度”(Clark,1979:35-49)。語言測試的效度是指測試是否考查了測試者想要測試的語言方面的內(nèi)容,考生所考的成績是否合理地說明了該考生的語言能力。Hughes(1992)指出如果考試與其檢測的語言技能和結(jié)構(gòu)相匹配,那么就可以說此次考試具備效度了。
影響測試效度的因素主要包括以下幾個方面。
1.測試的目標(biāo)。測試目標(biāo)的確定,對于測試的效度有著重大影響。目標(biāo)一定要定得恰當(dāng),要在測試能達(dá)到的范圍之內(nèi)。比如剛完成大學(xué)英語第一單元的講授,單元測試的目標(biāo)就要突出本單元所講知識點的掌握上。
2.測試的內(nèi)容。必須使測試的內(nèi)容盡可能準(zhǔn)確地反映測試的目標(biāo)。命題實際上是一個抽樣的過程,如果抽樣合理,樣本大小合適,就能比較正確地反映整體的情況,就易于達(dá)到測試的目的。每—次測試,題項必須有代表性,側(cè)重點要明確。比如要考查名詞性從句的掌握,命題就應(yīng)該緊緊圍繞主語從句、賓語從句、表語從句和同位語從句這四大從句展開,題目數(shù)量的設(shè)置也要依據(jù)這四種從句平均分配。
3.測試的方法。測試的方法要與測試的內(nèi)容相適宜??伎谡Z要用口試法,筆試法無法直接測量口頭表達(dá)。
4.測試的組織。測試需要嚴(yán)格、科學(xué)的組織工作。組織得好,有利于提高測試的效度和信度。
5.測試的應(yīng)用。舉個例子,如果把為大學(xué)英語一年級考試試卷給高中生做,那么這個考試就缺乏效度。盡管這個考試在大學(xué)一年級學(xué)生測試時已證明效度,但受試者變化了,考試的效度就受到損害。
測試語言輸出能力類試題通俗講就是寫和說的試題。在我們實際外語測試中經(jīng)常會以寫作和口語考試的形式來體現(xiàn)。下面我們將針對這一類型試題的優(yōu)缺點進(jìn)行探討。
雖然測試語言輸入能力類試題(讀和聽的試題)作為直接試題也具有一定的效度,但測試語言輸出能力類試題(寫和說的試題)具有更高的效度。因為測試語言輸入能力,不一定能測試出語言輸出能力;而測試語言輸出能力,一定同時能測試出語言輸入能力。例如,在聽力測試中全部能夠聽懂的內(nèi)容,不一定都能說出來。但反之,口語測試中全部能說出來的內(nèi)容一定能聽懂。閱讀理解中讀懂的內(nèi)容不一定都能寫出來,而自己寫作的內(nèi)容是肯定能讀懂的。因而聽、讀類試題不一定能考查說、寫的能力,但說、寫類試題一定能考查聽、讀能力。
另外一個說明測試語言輸出能力類試題具有更高效度的原因是:這類試題能同時測試語言的各個層次。這里還用讀、聽類試題和寫、說類試題進(jìn)行比較。試想在做一篇閱讀理解時,雖然可能理解了通篇主要內(nèi)容,但對閱讀文章中的單詞、短語、每個句子的語法結(jié)構(gòu)和含義不一定都能理解。聽力測試中也常常出現(xiàn)類似問題,雖然聽力材料中的一些詞匯和句子并未聽懂,但有時也不影響對聽力內(nèi)容大意的理解。但寫和說類試題卻不然。寫作考試中所寫的每個句子的語法結(jié)構(gòu)和含義以及句子中的單詞和短語,受試者必然非常通曉??谡Z考試也是如此。否則就寫不出來、說不出來或者會寫錯、說錯。所以寫、說類試題在考語篇的同時,必然也考查了單詞、短語和句子,在考意義表達(dá)的同時,必然也考查了慣用搭配和語法。從這個角度來講,測試語言輸出能力類試題具有更高的效度。
由于測試語言輸出能力類試題都屬于主觀性試題,評分標(biāo)準(zhǔn)的科學(xué)客觀性相對客觀性試題會有一定差距。因此其信度也相對低。
可行性低也是測試語言輸出能力類試題的一個弱點。因為這一類測試對考試的時間、地點、人員及設(shè)備等條件要求較高。寫作考試相對于口語考試還較易實施。因為在同一時間、同一考場、有紙筆就可以進(jìn)行測試,而且監(jiān)考人員也不用具備專業(yè)知識。然而口語考試要求具備的條件就復(fù)雜多了。這也是此類型測試在很多重大考試中占比例不多的一個重要原因。例如,TOEFL從1964年開辦,到1986年才增加一個寫的試題 (TWE—Test of Written English)。TOEFL雖然從1982年開始也增加了一個口試測試(TSE—Test of Spoken English),但也只能作為主卷之外自由選考的額外考試。高考英語試卷雖然一直有寫作這項題型,但口語考試一直未能列入高考的項目。大學(xué)英語四六級考試雖有口試測試,但也是只有筆試成績達(dá)到優(yōu)秀的少部分學(xué)生才能取得口試資格。這些都說明了此類試題對考試條件要求苛刻,故可行性就低了。
1.要設(shè)法提高語言測試的信度和效度。要提高信度和效度,可以從試卷設(shè)計、考試環(huán)境、受試者三方面著手。第一,試卷設(shè)計是最重要的,對測試信度效度起決定意義。首先,保證題量。題多一些,覆蓋面大一些,題項的代表性好一些,就可以在一定程度上減少測試誤差。當(dāng)然題目和題型過多也會引起負(fù)面效應(yīng),所以“度”的把握就顯得尤為關(guān)鍵了。其次,把握好題項的難易程度,提高題項區(qū)分度。題項難易程度適當(dāng),題項區(qū)分程度高,受試者在兩次或多次測試中成績的一致性和穩(wěn)定性就高,測試的相關(guān)性就會提高,測試的信度也就會提高。第二,保持良好的考試環(huán)境和考試秩序,把干擾測試的因素降到最低。第三,幫助受試者在測試中穩(wěn)定發(fā)揮。如果考生帶著緊張、焦慮的情緒應(yīng)考,那么測試信度和效度必然大打折扣。教師應(yīng)幫助學(xué)生們樹立正確的考試態(tài)度,不要對學(xué)生的考試成績期望值過高,也不要在考前給學(xué)生施加太大的壓力。要讓他們以從容的心態(tài),帶著平穩(wěn)的情緒走進(jìn)考場,保證在考試中發(fā)揮自己的真實水平。
2.對于測試語言輸出能力類試題的設(shè)計和使用要有三點注意事項。第一,鑒于高效度是此類試題的優(yōu)勢,在測試設(shè)計實踐中應(yīng)將這一優(yōu)勢最大化發(fā)揮。要保證高效度,應(yīng)在測試設(shè)計中遵循以下幾點原則:以信息的表達(dá)為測試目的;情景設(shè)計對受試者應(yīng)為真實的情景;應(yīng)將測試層次保持在語篇層次的高度;試題內(nèi)容應(yīng)為互動性行為;試題中語言應(yīng)來自交際情景。第二,提高評分標(biāo)準(zhǔn)的科學(xué)客觀性,以提高此類試題的信度。首先,評分標(biāo)準(zhǔn)要以語言學(xué)習(xí)理論(尤其是寫作和口語學(xué)習(xí)的理論)為指導(dǎo)。其次,評分標(biāo)準(zhǔn)應(yīng)盡可能制定的具體準(zhǔn)確、清晰明了。最后,科學(xué)客觀的評分標(biāo)準(zhǔn)還要經(jīng)過反復(fù)的測試實踐驗證,多次修改才能得來。第三,提高此類試題的可行性。這方面既需要測試設(shè)計者提高自身水平,更需要社會、教育主管部門、學(xué)校通力合作,提供充分的人力物力支持。
3.外語語言測試是一種對受試者聽、說、讀、寫綜合能力的考核。本文提到了測試語言輸出能力的試題具有較高的效度,并不是說它可以代替測試語言輸入能力的試題。在語言測試實踐中,應(yīng)將兩者有機(jī)結(jié)合,充分發(fā)揮各自優(yōu)勢。
[1]蕭春麟,劉清華.英語測試教程[M].上海:上海交通大學(xué)出版社,2001.
[2]鄒申.英語語言測試—理論與操作[M].上海:上海外語教育出版社,1998.
[3]孔文,李清華.語言測試真實性的多維分析[J].解放軍外國語學(xué)院學(xué)報,2003,(1):55-58.
[4]吳小珊.論英語測試信度和效度的平衡關(guān)系[J].廣西民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2007,(12).