王琳
【摘要】語言測試是外語教學(xué)的一個(gè)環(huán)節(jié),信度和效度則是評價(jià)語言測試的兩個(gè)重要依據(jù)。本文試從信度與效度的角度出發(fā),針對目前雅思考試的聽力測試進(jìn)行了初步探討,從中得出一點(diǎn)對我國外語聽力測試的啟示。
【關(guān)鍵詞】雅思聽力測試 效度 信度 外語教學(xué)
一、語言測試?yán)碚摰陌l(fā)展
縱觀語言測試學(xué)的發(fā)展歷史,大致分“科學(xué)前語言測試”、“結(jié)構(gòu)主義語言學(xué)測試”及“交際語言測試”三個(gè)階段。20世紀(jì)40年代之前為語言測試發(fā)展的第一階段。該階段的語言測試缺乏效度和信度,基本談不上有什么科學(xué)性和理論性。到了20世紀(jì) 50、60年代,結(jié)構(gòu)主義語言測試在外語測試中占統(tǒng)治地位。這個(gè)階段以結(jié)構(gòu)主義語言學(xué)和行為主義心理學(xué)為理論基礎(chǔ),人們第一次較客觀、科學(xué)的分析和認(rèn)識語言測試,其信度較高,但內(nèi)容效度較低。隨著對語言的認(rèn)識逐漸深入,喬姆斯基首先徹底否定行為主義語言理論,提出了“語言能力”和“語言行為”兩個(gè)概念。
二、用效度和信度理論指導(dǎo)的雅思聽力測試
1.效度和信度的基本概念
(1)效度和信度的概念。效度是指成功實(shí)現(xiàn)測試目的的程度。討論測試效度必須與具體的測試目的相結(jié)合,脫離了具體的測試目的來談?wù)摐y試效度是無意義的。效度是一個(gè)相對的概念,對于不同的考試,目的不同、范圍相異,考試的有效性就不同。效度是語言測試的基本出發(fā)點(diǎn),一項(xiàng)效度很低的語言測試即使信度再高也是沒有意義的。
信度是指測試結(jié)果的穩(wěn)定性和可靠性。信度的高低能反映出測試結(jié)果在多大程度上反映了考生真實(shí)的語言能力。但絕對的準(zhǔn)確是不可能的,因?yàn)槿说囊蛩厥遣环€(wěn)定的。我們要盡量做到把影響不一致性的不利因素控制在最低,以便于提高測試的信度。
(2)效度和信度的關(guān)系。作為評估語言測試質(zhì)量的最重要的兩項(xiàng)指標(biāo),效度和信度是對立統(tǒng)一的關(guān)系。實(shí)現(xiàn)語言測試的目的,二者缺一不可。信度是效度的前提,一項(xiàng)測試如果沒有信度,也就無所謂效度。設(shè)計(jì)一項(xiàng)測試時(shí)不能為了追求任何一方而忽視另一方,應(yīng)采取一種積極平衡的態(tài)度?,F(xiàn)代語言測試,特別是一些大規(guī)??荚囃ǔ5淖龇ㄕ窃谛哦群托Ф戎g尋求一個(gè)平衡點(diǎn)。
2.雅思聽力測試中的效度和信度
(1)雅思聽力測試試題分析。雅思聽力測試包括四個(gè)部分,含39到42道不等的問題。第一、三部分為兩人或多人的對話,或提供信息,或陳述觀點(diǎn),或表達(dá)感受;對話內(nèi)容基本上是生活中常見的情形;第二、四部分為敘述或個(gè)人獨(dú)白,就某個(gè)熱點(diǎn)話題進(jìn)行論述,有時(shí)也會有專題訪談或?qū)W術(shù)演講等內(nèi)容。
(2)信度在雅思聽力測試中的體現(xiàn)。首先,在合理的范圍內(nèi),題量越大,抽樣越多,才能保證試卷的覆蓋面更為合理,信度就越高。從上表我們可以看出,雅思聽力測試題量充足,能夠從聽、讀、寫三方面考查考生綜合的語言能力,這就從很大程度上保證了雅思聽力測試的信度。其次,雅思聽力測試的問題類型頗為豐富。不同的題型可以長短互補(bǔ),更好地平衡測試的信度與效度。其中,多項(xiàng)選擇、正誤判斷和可視材料等客觀題型很好的保證了雅思聽力測試的較高信度。再次,雅思聽力測試中客觀題占45%,由于不受評卷人的影響而信度較高。而且,雅思首創(chuàng)了“考官規(guī)范”來確保所有考生受到公平和平等的待遇。雅思考官規(guī)范以現(xiàn)行雅思考試的運(yùn)作情況為研制基礎(chǔ),同時(shí)也借鑒了劍橋大學(xué)考試委員會在其他口語測試發(fā)展過程中積累的廣泛經(jīng)驗(yàn),要求考官至少每兩年參加一次標(biāo)準(zhǔn)化培訓(xùn)課程,這也使雅思聽力測試在信度上得到了保證。
三、雅思聽力測試體系對我國大學(xué)英語聽力測試的啟示
對于任何語言測試,都要在保證信度的前提下去提高效度,達(dá)到信度和效度的平衡。在平衡信度與效度的矛盾,建立有效測試模式方面,雅思聽力測試的做法給我國大學(xué)英語聽力測試以很大的啟示。
1.增強(qiáng)考試內(nèi)容的真實(shí)性。真實(shí)性是交際語言測試的基本要求。目前,我國大學(xué)英語四、六級考試的存在著“假” 聽力材料現(xiàn)狀,聽力材料的選擇更注重材料的規(guī)范性,所選材料基本上都是經(jīng)過加工轉(zhuǎn)化的,缺乏真實(shí)性和多樣性。這樣就不能準(zhǔn)確反映出考生的真實(shí)的語言交際能力。另一種情況是,我國大學(xué)英語四、六級考試的題型基本上都是多項(xiàng)選擇的形式,不能準(zhǔn)確檢測考生用英語獲取信息的能力與運(yùn)用語言知識的能力,試題得分的信度和效度均比較低。因此,大學(xué)英語四、六級考試要提高聽力測試的效度就應(yīng)盡量貼近真實(shí)的生活場景,并且設(shè)計(jì)出能有效反映考生語言能力豐富的題型,使主觀題評分盡量客觀,增加考試的效度和信度。
2.實(shí)行標(biāo)準(zhǔn)分與能力描述相結(jié)合??荚嚨淖罱K結(jié)果是以分?jǐn)?shù)的形式反饋給考生的,這就涉及到分?jǐn)?shù)的可解釋性問題。對于科學(xué)的考試來說,成績報(bào)道要力求做到信息量大、標(biāo)準(zhǔn)可靠、清晰明白,還要公平、公正。雅思考試的成績單直觀地反映了考生英語水平的高低,而我國改革后的四、六級考試變更了計(jì)分體制和成績報(bào)道方式,也以標(biāo)準(zhǔn)分來反映考生的成績。但是,這樣的一個(gè)分值并不能直觀地反映這個(gè)考生的英語水平。四、六級考試應(yīng)借鑒雅思的經(jīng)驗(yàn),采用準(zhǔn)則參照對學(xué)生公布評判標(biāo)準(zhǔn)的方法,激勵考生不斷超越自己去達(dá)到更高水平。不但報(bào)道成績,而且對考生的英語水平進(jìn)行詳盡的說明,為后續(xù)學(xué)習(xí)提供改進(jìn)的意見,這樣才能夠做到對考生的全面、詳盡的反饋,也能提高考試的權(quán)威性。
參考文獻(xiàn):
[1]Bachman,L.F.Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990.
[2]韓寶成.語言測試:理論、實(shí)踐與發(fā)展[J].北京:外語教學(xué)與研究出版社,2000.