高旭峰
(三峽大學(xué) 外國(guó)語(yǔ)學(xué)院,湖北 宜昌443002)
HSK(六級(jí))考試信度和效度的評(píng)析
高旭峰
(三峽大學(xué) 外國(guó)語(yǔ)學(xué)院,湖北 宜昌443002)
語(yǔ)言測(cè)試是通過(guò)測(cè)試目標(biāo)能力的表征行為,去推論目標(biāo)能力。信度與效度是評(píng)價(jià)測(cè)試的兩個(gè)重要依據(jù),文章首先介紹了新漢語(yǔ)水平考試的背景、語(yǔ)言測(cè)試種類和對(duì)效度和信度的理解,并對(duì)HSK(六級(jí))測(cè)試試卷的信度與效度進(jìn)行分析得出,只有對(duì)主客觀題型在一定比例上的兼顧才能保證考試的可靠性與準(zhǔn)確性。
HSK(六級(jí))考試;信度;效度
為使?jié)h語(yǔ)水平考試更好地服務(wù)于漢語(yǔ)學(xué)習(xí)者,中國(guó)國(guó)家漢辦組織中外漢語(yǔ)教學(xué)、語(yǔ)言學(xué)、心理學(xué)和教育測(cè)量學(xué)等領(lǐng)域的專家,在允許充分調(diào)查、了解海外漢語(yǔ)教學(xué)實(shí)際情況的基礎(chǔ)上,吸收原有HSK的優(yōu)點(diǎn),借鑒近年來(lái)國(guó)際語(yǔ)言測(cè)試研究最新成果,推出新漢語(yǔ)水平考試(HSK)。新HSK是一項(xiàng)國(guó)際漢語(yǔ)能力標(biāo)準(zhǔn)考試,終點(diǎn)是考察漢語(yǔ)非第一語(yǔ)言的考生在生活、學(xué)習(xí)和工作中運(yùn)用漢語(yǔ)進(jìn)行交際的能力。新HSK分筆試和口試兩部分,筆試和口試是相互獨(dú)立的。筆試包括HSK(一級(jí))、HSK(二級(jí))、HSK(三級(jí))、HSK(三級(jí))、HSK(四級(jí))、HSK(五級(jí))、HSK(六級(jí));口試包括HSK(初級(jí))、HSK(中級(jí))、HSK(高級(jí)),口試采取錄音形式。
隨著漢語(yǔ)國(guó)際推廣形勢(shì)的發(fā)展,以及語(yǔ)言測(cè)試、對(duì)外漢語(yǔ)教學(xué)、語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)等學(xué)科的最新發(fā)展,HSK逐漸表現(xiàn)出等級(jí)分?jǐn)?shù)劃分的不合理,主觀性考試所占的比重較小等一些不足。本文運(yùn)用語(yǔ)言測(cè)試學(xué)的相關(guān)理論,從考試效度和信度的角度出發(fā),以HSK(六級(jí))某次考試試卷作為樣卷材料來(lái)對(duì)HSK(六級(jí))考試的信度和效度進(jìn)行分析。
(一)語(yǔ)言測(cè)試的種類
從測(cè)試目的來(lái)看,語(yǔ)言測(cè)試主要可分為水平測(cè)試、等級(jí)測(cè)試、成就測(cè)試以及診斷性測(cè)試。無(wú)論我們采用哪一種類型,測(cè)試都必須是客觀的,有目的、有意義的,換言之,其信度和效度都必須得到高度的重視。正如Bachman所示,信度和效度是對(duì)語(yǔ)言能力測(cè)量的使用和說(shuō)明的重要質(zhì)素,“假如我們將對(duì)所給測(cè)試的分?jǐn)?shù)進(jìn)行說(shuō)明,作為個(gè)人能力的標(biāo)記的話,那么,該分?jǐn)?shù)就必須是可信且有效的”(1990:24)。HSK考試屬于水平測(cè)試考試。
(二)語(yǔ)言測(cè)試的信度與效度
考試信度對(duì)于任何一種有效考試來(lái)說(shuō)都是必不可少的。效度—信度的區(qū)分是語(yǔ)言能力的區(qū)分,也是標(biāo)準(zhǔn)與測(cè)試的區(qū)分。應(yīng)該說(shuō)沒(méi)有一種考試是完全依賴于信度與效度的。顯而易見(jiàn),完全依賴信度的測(cè)試,是什么也測(cè)不出來(lái)的,而完全依賴于效度的測(cè)試,也是什么都不能測(cè)試的。簡(jiǎn)單來(lái)說(shuō),信度是指一份試卷的測(cè)試結(jié)果在多大程度上具有一致性,即考試結(jié)果不受考試時(shí)間、監(jiān)考人員、考場(chǎng)等外在因素的影響。其實(shí)影響信度的因素有很多,諸如題目的質(zhì)量問(wèn)題,不管是主觀考試還是客觀考試,題目質(zhì)量的優(yōu)劣直接關(guān)系到考試的信度;題目的難度也會(huì)影響到信度,此外,施考中的一些問(wèn)題也會(huì)間接的影響信度,如考場(chǎng)紀(jì)律、考場(chǎng)周邊環(huán)境、考試要求等。衡量考試的另一個(gè)標(biāo)準(zhǔn)是考試效度。考試效度就是達(dá)到其預(yù)期測(cè)試意圖的程度。效度是指一份試卷能在多大程度上滿足考察的目的。它是針對(duì)某一目的來(lái)正確解釋和使用分?jǐn)?shù)的問(wèn)題。假如一份試卷同時(shí)考查數(shù)種語(yǔ)言技能或考查內(nèi)容超出了考查目的,那么其效度就大大降低。簡(jiǎn)單說(shuō),也就是考試是否考了要考和想考的內(nèi)容。在分別討論了考試的信度與效度后,那么我們來(lái)看一下它們之間又有什么關(guān)系呢?如前所說(shuō),信度指的是考試結(jié)果的可靠性;效度指的是考試達(dá)到預(yù)定目的的程度。一個(gè)考試有時(shí)可能信度很高,不一定效度也高,但是要具有效度的話,首先必須具有信度??偠灾?,對(duì)于考試來(lái)說(shuō),信度與效度都是必不可少的:信度是保證效度的基礎(chǔ);撇開(kāi)效度只談信度是沒(méi)有實(shí)際意義的。
(一)HSK(六級(jí))介紹
HSK(六級(jí))考查考生的漢語(yǔ)應(yīng)用能力,它對(duì)應(yīng)于《國(guó)際漢語(yǔ)能力標(biāo)準(zhǔn)》五級(jí)、《歐洲語(yǔ)言共同參考框架(CEF)》C2級(jí)。據(jù)HSK(六級(jí))考試大綱要求,通過(guò)HSK(六級(jí))的考生可以輕松地理解聽(tīng)到或讀到的漢語(yǔ)信息,以口頭或書(shū)面的形式用漢語(yǔ)流利地表達(dá)自己的見(jiàn)解。HSK(六級(jí))成績(jī)報(bào)告提供聽(tīng)力(100)、閱讀(100)、書(shū)寫(xiě)(100)和總分四個(gè)分?jǐn)?shù)??偡?80分為合格。
(二)HSK考試測(cè)試的信度
從試題的角度來(lái)說(shuō),首先,HSK(六級(jí))測(cè)試的題量較充足。從理論上說(shuō),題量越大,抽樣越多,信度就越高。HSK(六級(jí))考試內(nèi)容共101題,分聽(tīng)力。閱讀和書(shū)寫(xiě)三部分。其中有100題均為選擇題(客觀題),只有一題為主觀題。它在135分鐘內(nèi)要求受試者做完個(gè)200個(gè)得分點(diǎn),再加上一篇作文,這對(duì)HSK(六級(jí))測(cè)試信度有較大的保證。
從測(cè)試實(shí)施的角度來(lái)看,HSK(六級(jí))測(cè)試實(shí)施的各種條件對(duì)所有受試者是一致的。每年全國(guó)在六月和十二月統(tǒng)一的時(shí)間舉行兩次測(cè)試,其操作方式、聽(tīng)力時(shí)間等都是一致的,當(dāng)然,并不能排除個(gè)別考場(chǎng)的突發(fā)事故。但總體上這并不影響確保HSK(六級(jí))測(cè)試的信度。
從評(píng)分的角度來(lái)看,HSK(六級(jí))測(cè)試有嚴(yán)格一致的評(píng)分標(biāo)準(zhǔn),再加上客觀題比例大,便于機(jī)器閱卷,成績(jī)(得分)毫無(wú)人為因素,并且主觀題的比例不大(只有一篇作文)在分?jǐn)?shù)這個(gè)問(wèn)題上穩(wěn)定性相對(duì)不會(huì)過(guò)于偏差。這也是這項(xiàng)測(cè)試的最大優(yōu)點(diǎn),極大地保證了其信度。
(三)HSK(六級(jí))考試測(cè)試的效度
關(guān)于效度分析,筆者想從以下這兩方面進(jìn)行分析。
一是從試題設(shè)計(jì)。一方面,結(jié)合整個(gè)考試試題,該試卷設(shè)計(jì)共有100題為選擇題,一題為主觀題。從題型設(shè)計(jì)上就缺少效度,因?yàn)檫x擇題存在蒙題和猜題的可能性,所以這樣并不能考出實(shí)際想考知識(shí)的學(xué)生的掌握情況:另一方面,從題的考試類型上并沒(méi)有達(dá)到他所提出的大綱要求:即通過(guò)考試學(xué)生可以口頭或書(shū)面的形式用漢語(yǔ)流利地表達(dá)自己的見(jiàn)解的目的。因?yàn)榭荚噧?nèi)容分閱讀、縮寫(xiě)和聽(tīng)力,但是其中聽(tīng)力和閱讀都為客觀題,同樣也是有蒙題的可能性存在,所以學(xué)生的所得分?jǐn)?shù)并不能代表他已經(jīng)掌握了該項(xiàng)知識(shí)。例如聽(tīng)力有50個(gè)題目,如果一個(gè)學(xué)生做對(duì)了40個(gè),其中不乏很多是舞弊或是猜測(cè)等方式所得,因此并不能夠?qū)嶋H測(cè)試到學(xué)生的聽(tīng)力能力。從而該級(jí)考試的效度也就得不到保證。
二是從考試題型。在此筆者主要認(rèn)為閱讀這一題型設(shè)計(jì)缺少效度。在閱讀這一大題中,主要分為四小部分。其中前兩部分筆者認(rèn)為缺少效度,因?yàn)樗](méi)有考所要考的知識(shí)。大家都知道閱讀題項(xiàng)的設(shè)置,是為了測(cè)量考生的閱讀理解能力。但是這兩部分和閱讀能力并沒(méi)有相關(guān)的聯(lián)系。下面將以實(shí)例為證。
例一:第一部分 請(qǐng)選擇出有語(yǔ)病的一項(xiàng)(正確答案是D)
51.A.他突然提出辭職,讓我們感到很意外
B.矛盾的童年生活,是他創(chuàng)作《春蠶》的源泉
C.勞動(dòng)時(shí)間縮短,是大眾旅游得以發(fā)展的基本條件
D.他除了班里和學(xué)生會(huì)的工作外,還承擔(dān)了廣播站的主持人
這是選自HSK(六級(jí))某次考試試卷的一道題目,題目中有四個(gè)選項(xiàng)要求考生選出有病句的一項(xiàng),在這個(gè)題目中,其中D項(xiàng)是有語(yǔ)病的一項(xiàng),因?yàn)槌袚?dān)要和……的工作搭配,其實(shí)這是考察學(xué)生對(duì)漢語(yǔ)句子語(yǔ)法知識(shí)的掌握,和閱讀理解并沒(méi)有太大關(guān)系。閱讀,顧名思義就是通過(guò)閱讀理解文章或所讀內(nèi)容大意。就我們的常識(shí)來(lái)講,通過(guò)這四個(gè)句子,我們都可以理解到每句所表達(dá)的意思,盡管答案D是一項(xiàng)語(yǔ)病句,但是它并不會(huì)影響人們獲得該句話的含義。因此該項(xiàng)題目的側(cè)重點(diǎn)并不是考察學(xué)生的閱讀理解能力,而是對(duì)漢語(yǔ)的語(yǔ)法知識(shí)的掌握。
例二:第二部分 選詞填空
61.椅子的舒適問(wèn)題,只要設(shè)計(jì)時(shí)考慮人體結(jié)構(gòu)的( ),便可以解決。設(shè)計(jì)一把椅子而()了人體的結(jié)構(gòu),就像設(shè)計(jì)蛋盒而不顧蛋的()。(正確答案是A)
A.特征 忽略 形狀
B.本質(zhì) 忽視 形態(tài)
C.特點(diǎn) 忘記 外觀
D.構(gòu)造 違反 外貌
這同樣也是選擇HSK(六級(jí))某次考試試卷中閱讀第二部分的一道題,題目要求考試選詞填空,這道題其實(shí)考的是漢語(yǔ)詞語(yǔ)的搭配和近義詞的區(qū)分,并用排除法也可以直接選出,和閱讀無(wú)太大關(guān)系。
從以上兩例,可以得出整個(gè)試卷的效度難以得到保證。在閱讀題項(xiàng)中,其中第一部分和第二部分的題型缺少效度。
以上分別從HSK(六級(jí))測(cè)試信度與效度的角度評(píng)析了其信度和效度。在客觀上,測(cè)試的信度與效度并不總是保持一致,而常常出現(xiàn)矛盾的一面。其一,語(yǔ)言測(cè)試檢測(cè)的是語(yǔ)言運(yùn)用能力(HSK測(cè)試也是如此),而能力是不可數(shù)的,不能用數(shù)字加數(shù)量單位表示。這樣,若將測(cè)試設(shè)計(jì)成定量型的,則信度高,效度低;若將試題設(shè)計(jì)成定性型的,則效度高,信度低。HSK(六級(jí))測(cè)試大體上屬定量型的。其二,HSK(六級(jí))測(cè)試中99%的測(cè)試點(diǎn)都是“對(duì)”與“錯(cuò)”這種兩分判斷,而只有1%的主觀試題,即能體現(xiàn)受試者英語(yǔ)的得體性、流利性、有效性。從理論上講,語(yǔ)言的運(yùn)用不能單純用對(duì)或錯(cuò)來(lái)衡量,應(yīng)該反映受試者語(yǔ)言熟練程度。從這個(gè)意義上講,HSK(六級(jí))測(cè)試的效度低。
像其它所有語(yǔ)言測(cè)試一樣,HSK(六級(jí))測(cè)試的信度也比較容易獲得有關(guān)數(shù)據(jù),因而容易確定;相比之下,其效度則顯得抽象些,難以獲得確切數(shù)據(jù),因而比較難確定。筆者建議一方面可以將客觀考試主觀化,將閱讀部分的第一部分題直接以改錯(cuò)形式出現(xiàn),要學(xué)生找出病句的問(wèn)題之處,并改正。這樣可以避免猜題現(xiàn)象,并且改錯(cuò)和學(xué)生的實(shí)際知識(shí)水平相聯(lián)系,知識(shí)的掌握直接決定題目的正誤;另一方面,可以涉及一些情景對(duì)話的題目,因?yàn)榧热灰紝W(xué)生的實(shí)際應(yīng)用能力,就可以在語(yǔ)言中交流得以體現(xiàn)??偠灾惶自囶}中兼有客觀題與主觀題,且主客觀題的比例適中,才能保證考試的可靠性與準(zhǔn)確性,增強(qiáng)測(cè)試的目的性,從而提高測(cè)試的質(zhì)量。
[1]BACHMAN,L.F.Fundamental Considerations in Language Testing [M].Oxford University Press,1990.
[2]阿蘭·戴維期著.語(yǔ)言測(cè)試原理[M].北京:經(jīng)濟(jì)科學(xué)出版社,1997.
[3]國(guó)家漢辦.新漢語(yǔ)水平考試大綱 HSK(六級(jí)).北京:商務(wù)印書(shū)館,2001.
[4]宋瑩.關(guān)于留學(xué)生HSK考試的分析與研究[J].科教縱橫,2008,(8).
[5]謝小慶.關(guān)于HSK(初中等)長(zhǎng)度適當(dāng)性的研究[J].語(yǔ)言教學(xué)與研究,1999,(1).
[6]鄒申,楊任明.簡(jiǎn)明英語(yǔ)測(cè)試教程[M].北京:高等教育出版社,2007.
湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào)·人文社科版2012年1期