劉冬冰,魏海棠,趙思達(dá)
(1.南京林業(yè)大學(xué)語言應(yīng)用研究中心,江蘇南京 210037;2.南京曉莊學(xué)院新聞與傳播學(xué)院,江蘇南京 211171;3.北京師范大學(xué)文學(xué)院,北京 100875)
論普通話水平測(cè)試中的評(píng)分誤差
劉冬冰1,魏海棠2,趙思達(dá)3
(1.南京林業(yè)大學(xué)語言應(yīng)用研究中心,江蘇南京 210037;2.南京曉莊學(xué)院新聞與傳播學(xué)院,江蘇南京 211171;3.北京師范大學(xué)文學(xué)院,北京 100875)
對(duì)普通話水平測(cè)試的復(fù)審表明,評(píng)分中“朗讀”與“說話”的誤差較大,其原因涉及試卷構(gòu)成與隊(duì)伍建設(shè)等多個(gè)方面。為提高普通話水平測(cè)試的信度,以普通話語音知識(shí)和方言學(xué)、音位學(xué)的基本知識(shí)作為內(nèi)容的測(cè)試員后期培訓(xùn)應(yīng)盡快付諸實(shí)施。
普通話;水平測(cè)試;評(píng)分誤差
普通話水平測(cè)試作為一項(xiàng)較新的語言測(cè)試,涉及到語言學(xué)中的實(shí)驗(yàn)語音學(xué)、言語聲學(xué)、心理語言學(xué)、統(tǒng)計(jì)語言學(xué)和語言教學(xué)與測(cè)試等領(lǐng)域。因其新,故在測(cè)試的理論和方法上有待完善。目前,一些省份已經(jīng)利用計(jì)算機(jī)輔助測(cè)試,對(duì)前三項(xiàng)進(jìn)行評(píng)分,取得了較好的效果。但是,第四項(xiàng)“說話”仍然為人工打分。就筆者調(diào)查情況來看,測(cè)試員在實(shí)際操作中,由于主觀因素的影響,對(duì)標(biāo)準(zhǔn)的把握不盡相同,測(cè)試誤差在所難免。為了把因主觀性評(píng)定而產(chǎn)生的測(cè)評(píng)誤差降到最低限度,許多省份采取了復(fù)審制度??梢哉f,復(fù)審制度是普通話水平測(cè)試的補(bǔ)充和延續(xù),是其重要的輔助部分。筆者近些年參與了江蘇省普通話水平測(cè)試的復(fù)審工作,發(fā)現(xiàn)一些測(cè)試點(diǎn)的音檔中存在著評(píng)分過松過緊現(xiàn)象,其中過松占多數(shù)。打分誤差集中表現(xiàn)在第三項(xiàng)“朗讀”和第四項(xiàng)“說話”上。即使是同一組測(cè)試員,在對(duì)同一個(gè)被測(cè)對(duì)象打分時(shí)前兩項(xiàng)非常接近,而第三項(xiàng)“朗讀”和第四項(xiàng)“說話”的打分卻相差較大。本文擬以江蘇省為例,就復(fù)審中發(fā)現(xiàn)的測(cè)試誤差現(xiàn)象進(jìn)行分析。
通過考察我們發(fā)現(xiàn),造成評(píng)分誤差的原因大致有這樣幾個(gè)方面。
第一、二項(xiàng)的測(cè)試內(nèi)容基本上處于一個(gè)較穩(wěn)定的狀態(tài),對(duì)相對(duì)穩(wěn)定狀態(tài)中的錯(cuò)誤和缺陷的認(rèn)識(shí)容易取得一致;而第三、第四項(xiàng)的內(nèi)容處于動(dòng)態(tài)的語流中,對(duì)其語音錯(cuò)誤與缺陷的認(rèn)識(shí)不易取得一致。相對(duì)來說,測(cè)試第一、二項(xiàng)時(shí),由于字詞之間的間隔使應(yīng)試人的語速也相對(duì)緩慢,測(cè)試員判定正誤的時(shí)間較充分;而第三、第四兩項(xiàng)中,漢語音節(jié)是以動(dòng)態(tài)的形態(tài)出現(xiàn)在語流中的,被測(cè)的語速相對(duì)較快,發(fā)音不易穩(wěn)定,這是造成判分誤差的原因之一。
語言習(xí)得理論顯示:同一個(gè)音位在不同的語流中出現(xiàn)時(shí),被試者需用不同的音位去替換。這說明語音的靜態(tài)難度和動(dòng)態(tài)難度是不同的,對(duì)發(fā)音器官協(xié)調(diào)能力的要求也是不同的?,F(xiàn)場(chǎng)測(cè)試也證明了這一點(diǎn)——被測(cè)的語速、詞語在句子中的地位都可能使一個(gè)音節(jié)在音質(zhì)上和韻律特征上發(fā)生改變。例如“很高興”中的“很”如果發(fā)成“哼”的上聲,既不應(yīng)定為錯(cuò)誤,也不應(yīng)判為缺陷,因?yàn)椤案摺钡穆暷甘莻€(gè)舌根音,很容易同化“很”的韻尾。所以,測(cè)試不僅要求測(cè)試員的聽覺高度靈敏,注意語音學(xué)上不同音素的分析,而且還要注意從音位學(xué)的角度進(jìn)行分辨與歸納,即測(cè)試員應(yīng)具備必要的音位學(xué)知識(shí)和對(duì)語流音變把握的能力,確認(rèn)漢語普通話每一音位常見的條件變體,這樣才可能不放過一個(gè)“錯(cuò)誤”或“缺陷”,不冤枉一個(gè)正確的發(fā)音,才可能將錯(cuò)誤與缺陷區(qū)分開來。
錯(cuò)誤和缺陷的判定應(yīng)該以音位理論為參照系,理由是,以能否區(qū)別意義為依據(jù)比較合理,也比較容易控制。所以,不能簡(jiǎn)單地認(rèn)為凡把甲音素發(fā)成了乙音素或把甲調(diào)值發(fā)成了乙調(diào)值都為錯(cuò)誤。例如:徐州方言區(qū)的人往往把[a]鼻化,失去韻尾,近乎[~a];南京方言區(qū)的人則易把[α]發(fā)成[ε],盡管把甲音素發(fā)成了乙音素,但并未造成意義的混淆,所以,應(yīng)定為缺陷;另外,許多人把第一項(xiàng)中的上聲也發(fā)成半上,調(diào)值為 21或 211,也由于并未產(chǎn)生歧義而只能算作缺陷。前鼻音與后鼻音的音質(zhì)差別盡管在二者相混的方言區(qū)聽來幾乎為零,但從普通話音位系統(tǒng)的角度分析就特別重要了,倘若相混就是錯(cuò)誤。都是相似,有的為錯(cuò)誤,有的為缺陷,衡量標(biāo)準(zhǔn)是能否區(qū)別意義。就目前復(fù)審的結(jié)果看,有些測(cè)試員對(duì)音位理論的把握不甚到位,因此把一些缺陷判為了錯(cuò)誤。這對(duì)第四項(xiàng)的評(píng)分尤為重要,因?yàn)椤罢f話”是按照讀錯(cuò)的音節(jié)的數(shù)量為主要參照系來定檔的。
有時(shí)候,測(cè)試員判定錯(cuò)誤與缺陷的標(biāo)準(zhǔn)會(huì)從一個(gè)角度偏向另一個(gè)角度,從而造成誤判。我們注意到,在第一項(xiàng)讀單音節(jié)字詞時(shí),不論漢語普通話中有無 B音節(jié),被試者若把 A音節(jié)發(fā)成 B音節(jié),盡管 B音節(jié)并不存在,測(cè)試員很容易將其定為錯(cuò)誤 ,例如 :把“騰 ”讀成“[t?n]”或讀成上聲、去聲。但是,在第二、三、四項(xiàng)測(cè)試中,如果把 A音節(jié)發(fā)成 B音節(jié),B音節(jié)在普通話中本不存在,測(cè)試員卻很容易將其定為缺陷。例如:把“沸騰”之“騰”發(fā)成[t?n]。為什么同一種語音現(xiàn)象時(shí)而被認(rèn)為是錯(cuò)誤,時(shí)而被認(rèn)為是缺陷呢?原因很可能就是:這時(shí)候,測(cè)試員判定正誤的標(biāo)準(zhǔn)已經(jīng)從“某個(gè)音素能否區(qū)別意義”變成“在語流中是否造成意義的誤解”了。
“語調(diào)偏誤”在江蘇省的《細(xì)則》中被界定為重音不當(dāng)、詞的輕重格式不對(duì)、聲調(diào)有系統(tǒng)性缺陷、句調(diào)不自然和語速不當(dāng)?shù)葞讉€(gè)方面。由于測(cè)試員本人在朗讀方面的理論知識(shí)和實(shí)踐能力有差異,因此對(duì)以上語調(diào)偏誤的種種表現(xiàn)理解起來就出現(xiàn)了一些差別,或者對(duì)一些明顯的語調(diào)偏誤能夠正確處理,而對(duì)一些不大常見的語調(diào)偏誤則因難以識(shí)別而不加處理。下面針對(duì)處理語調(diào)偏誤的諸要素逐一進(jìn)行討論。
關(guān)于對(duì)重音不當(dāng)?shù)奶幚韱栴}。重音可分為詞重音和語句重音兩類。詞重音我們后邊討論。語句重音,是指句子中讀得較重的詞語,又分語法重音和邏輯重音兩種。語法重音根據(jù)語法結(jié)構(gòu)的需要把句子的某些部分重讀。大致規(guī)律是:謂語比主語讀得稍重,賓語比動(dòng)詞讀得稍重;表性狀和程度的狀語、表結(jié)果或程度的補(bǔ)語、表疑問和指示的代詞、名詞前面的定語等常讀重音。邏輯重音也叫強(qiáng)調(diào)重音,是為了強(qiáng)調(diào)語意重點(diǎn)或?yàn)楸磉_(dá)強(qiáng)烈感情而把句子某些部分讀得特別重。這種重音主要是由說話人的意圖和情感決定的,沒有固定的規(guī)律。[1]普通話水平測(cè)試 60篇朗讀作品中沒有重音標(biāo)志,被測(cè)人完全憑著自己對(duì)作品的理解做不同處理。如果測(cè)試員對(duì)以上重音的基本規(guī)律有所了解,就會(huì)對(duì)被測(cè)者做出比較正確的評(píng)判;否則,就無法正確地進(jìn)行判分,從而與其他測(cè)試員的評(píng)判結(jié)果出現(xiàn)較明顯的差異。
至于輕重格式問題,主要是就復(fù)音詞說的。這種重音大都有固定的格式,例如:帶輕聲的雙音詞,一般是重輕式。有一部分詞語雖未明確標(biāo)注要讀輕聲,但將其后一個(gè)音節(jié)輕讀語感較自然,這些往往屬于重次輕式。雙音節(jié)的人名、帶前綴的雙音詞、疊音形容詞或副詞、動(dòng)賓式、主謂式、偏正式以及大部分聯(lián)合式雙音節(jié)合成詞等常常是輕重式。三個(gè)音節(jié)的人名、地名、音譯詞、尾部疊音形容詞、前正后偏的合成詞,是中輕重式。而四個(gè)音節(jié)的專有名詞、疊音形容詞、象聲詞,為中輕中重式。雙音動(dòng)詞重疊為重輕中輕式。[2]對(duì)于以上規(guī)律性的知識(shí),并非每一個(gè)測(cè)試員都了解或掌握得恰如其分;同時(shí),到底哪些詞語為中-重格、哪些詞語為重-中格,目前還沒有可靠的言語聲學(xué)數(shù)據(jù)支持和權(quán)威性依據(jù)。所以在測(cè)評(píng)時(shí),測(cè)試員往往只能根據(jù)自己的感覺或者對(duì)漢語詞語輕重格式的一般特征去把握,因此就必然出現(xiàn)評(píng)判不一的情況。
在“說話”或“朗讀”中,發(fā)音是否清楚明白,是否生動(dòng)中聽,句調(diào)也是個(gè)重要條件。語句的這種高低升降的變化,應(yīng)隨著句子語氣的不同而區(qū)別,或隨說話者特殊的感情需要而變化。否則就會(huì)給人一種呆板、單調(diào)或句調(diào)不自然的感覺。[2]高等級(jí)的人員應(yīng)該對(duì)此有明確的反應(yīng)。但復(fù)審中發(fā)現(xiàn),有相當(dāng)多的測(cè)試員對(duì)此沒有反應(yīng)。
該問題容易忽略的是陰平偏低,有的被測(cè)者把 55發(fā)成 33還容易引起注意,但發(fā)成 44就不容易發(fā)現(xiàn);[3]再有就是保留入聲調(diào)方言區(qū)的測(cè)試員對(duì)聲調(diào)不完整不敏感;對(duì)單音節(jié)字詞中上聲不到位容易發(fā)現(xiàn),而對(duì)朗讀中位于句末的上聲調(diào)值是否到位則容易忽略。
在“句調(diào)自然”和語速的理解方面,筆者認(rèn)為,自然流暢中的“自然”除了要求被測(cè)者不拿腔拿調(diào)、不生硬外,還應(yīng)包括對(duì)作品基調(diào)的把握和感情的處理。尤其是對(duì)二甲和一級(jí)的人員,更要重視這一點(diǎn)。在測(cè)試中,被測(cè)者對(duì)于作品內(nèi)容、層次的理解以及對(duì)作品風(fēng)格的把握和感情基調(diào)的處理都存在著差別,從另一方面體現(xiàn)其朗讀的自然度。意識(shí)到這一點(diǎn)的測(cè)試員可能在“語調(diào)偏誤”的評(píng)分上予以顯示,例如從自然、流暢度等方面處理。意識(shí)不到的測(cè)試員則可能對(duì)此恝然置之,于是就有了標(biāo)準(zhǔn)上的不一致。
朗讀時(shí),根據(jù)內(nèi)容表達(dá)的需要或作者思想感情的變化,語速該快則快、該慢就慢、有快有慢,才能真實(shí)而生動(dòng)地表達(dá)不同的內(nèi)容和情境。[4]快慢沒有一個(gè)絕對(duì)標(biāo)準(zhǔn),只能以同一語境或文章中的各部分相互比較為依據(jù)。但是,有的被測(cè)者能夠做到快慢適度,或快中有慢,或慢中有快,段與段之間,一般都有一個(gè)較長(zhǎng)的停歇,處理得層次分明;有的則一味地快,看似流暢,卻削弱了作品的藝術(shù)價(jià)值。這些在評(píng)分中本應(yīng)考慮進(jìn)去,但由于部分測(cè)試員的關(guān)注點(diǎn)過度集中在語音失誤上,而對(duì)此不加考慮,也會(huì)出現(xiàn)判分不當(dāng)?shù)那闆r。
有的測(cè)試員對(duì)“自然流暢程度”僅停留在口語化程度的識(shí)別層面或說話中斷的次數(shù)上,忽略了其他要素。第三項(xiàng)朗讀和第四項(xiàng)說話旨在檢測(cè)應(yīng)試者運(yùn)用普通話的水平,但由于朗讀是借助于文字材料的作者說普通話,文字材料的作者對(duì)詞匯、語法已進(jìn)行過斟酌推敲,因此對(duì)應(yīng)試者來說,主要就剩下語音問題了。說話顯然不那么簡(jiǎn)單,它是對(duì)普通話口語能力的綜合性考察,它要求在較短的時(shí)間內(nèi)審清題意,確定主題,選擇材料,構(gòu)思層次,遣詞造句,適當(dāng)修辭,因而應(yīng)試者的語音、詞匯、語法各方面的熟練程度和規(guī)范程度都同時(shí)受到檢驗(yàn),其思維的敏捷性、語言與交際的能力也能得到一定程度的顯現(xiàn)?!毒V要》和江蘇省《細(xì)則》均要求從語音面貌、流暢程度和詞匯語法運(yùn)用的規(guī)范三個(gè)方面評(píng)分。[2]15但在實(shí)際操作中,說話部分在評(píng)定成績(jī)時(shí)伸縮性較大。有的測(cè)試員給分缺乏足夠的依據(jù),帶有較大的隨意性。如對(duì)應(yīng)試者在某一話題上偏離主題或結(jié)構(gòu)混亂,機(jī)械呆板、喜怒不聞?dòng)诼?、好惡不留于音、哀樂不見于調(diào)的,卻按字詞發(fā)音規(guī)范的標(biāo)準(zhǔn)評(píng)定為較好的等級(jí);對(duì)輕重音、語調(diào)、停連、語流停頓、語速徐疾等表情達(dá)意的手段幾乎無所顯現(xiàn)的,有的測(cè)試員卻本著錯(cuò)誤不多的原則不予扣分。
我們認(rèn)為,在朗讀中,由于連貫的語流已經(jīng)形成,所以要特別重視對(duì)被測(cè)者語感的宏觀把握,在定量分析的基礎(chǔ)上加大定性分析的力度。在說話項(xiàng)中,則應(yīng)更重視對(duì)語流的動(dòng)態(tài)的把握,以一種宏觀的視角進(jìn)行分析和評(píng)價(jià),而不宜將注意力過多地放到單個(gè)的語音單位上,不宜將語音問題簡(jiǎn)單地累計(jì)或量化,而是將個(gè)別語音單位的表現(xiàn)作為判定整體語流規(guī)范程度的依據(jù)。
測(cè)試的結(jié)果是否合乎被測(cè)的實(shí)際水平,在一定程度上與測(cè)試員心理注意密切相關(guān)。桂詩春先生在《實(shí)驗(yàn)心理語言學(xué)綱要》中科學(xué)地論證了“注意”在測(cè)試中的種種表現(xiàn):每個(gè)音位都有著不同的區(qū)別性特征和非區(qū)別性特征,當(dāng)區(qū)別性特征受注意時(shí),測(cè)評(píng)的誤差就小;而當(dāng)非區(qū)別性特征受注意時(shí),評(píng)價(jià)誤差就大。注意的容量有限是聽覺不能處理所有語音的根本原因。[5]在第三、第四兩項(xiàng)中,當(dāng)連續(xù)的語流中區(qū)別性特征與非區(qū)別性特征數(shù)量不斷增多且頻率加快時(shí),每個(gè)區(qū)別性特征引起注意的心理幾率便會(huì)減少,于是評(píng)價(jià)誤差也會(huì)增大。另外,注意存在選擇性,一方面,測(cè)試員自身方言基礎(chǔ)難以擺脫注意,另一方面,審音水平差異也會(huì)影響注意力集中。于是,測(cè)試員就會(huì)出現(xiàn)顧此失彼的現(xiàn)象,在語音關(guān)鍵特征與無關(guān)特征中來回轉(zhuǎn)換注意,而發(fā)生注意的位移或逆轉(zhuǎn),造成心理評(píng)價(jià)誤差顯著。
首先,對(duì)朗讀篇目的熟悉程度不一。有的測(cè)試員對(duì)作品沒有做到爛熟于心,所以對(duì)添字、漏字意識(shí)不到,導(dǎo)致漏扣分;尤其是遇到朗讀過快者就更跟不上打分,或分辨不清錯(cuò)誤與缺陷了。其次,對(duì)詞匯、語法錯(cuò)誤的敏感度不同。詞匯、語法問題只有在說話項(xiàng)中才得以暴露。最常見的語法失誤是動(dòng)詞與賓語搭配不當(dāng)、主語與謂語搭配不當(dāng)、狀語與中心詞不搭配,等等。有的測(cè)試員則只關(guān)注前者,不留意后者;另有測(cè)試員不僅本身對(duì)方言詞語不敏感,對(duì)諸如“蠻好的!”甚至“好好耶!”之類見怪不怪,對(duì)一些方言句式無所知覺,而且對(duì)病句不加扣分。對(duì)該項(xiàng)打分的差別之大,就可想而知了。其三,在“朗讀”項(xiàng)重復(fù)扣分。有的測(cè)試員在“朗讀”中既扣了聲母或韻母的系統(tǒng)性缺陷的分,又在錯(cuò)誤中重復(fù)扣分。在實(shí)際操作中,這一點(diǎn)比較難掌握。除了錯(cuò)誤與缺陷的界限本來就難以分清外,對(duì)同一個(gè)難點(diǎn)音,被測(cè)者可能時(shí)而讀錯(cuò),時(shí)而不完全錯(cuò),錯(cuò)誤與缺陷的量也不好計(jì)算。其四,把“說話”中的缺陷算成了錯(cuò)誤。按照普通話水平測(cè)試的打分原則,“說話”中錯(cuò)誤的個(gè)數(shù)要量化,而缺陷只幫助定性,可以用來衡量被測(cè)方音是否明顯。但是,有的測(cè)試員過于苛刻,把“缺陷”算成“錯(cuò)誤”,自然造成打分的不公允。
普通話水平測(cè)試不僅存在著提高試卷信度的問題,也存在著提高評(píng)分者信度的問題。以往的測(cè)試員培訓(xùn)主要側(cè)重于測(cè)試能力,這對(duì)于一部分具有較高專業(yè)水平的測(cè)試員來說不失為一種多快好省的培訓(xùn),但對(duì)于那些沒有受過正規(guī)語音學(xué)訓(xùn)練的測(cè)試員來說,似乎有些治標(biāo)不治本。據(jù)了解,有的省份已經(jīng)意識(shí)到這一點(diǎn),擬在首次培訓(xùn)后進(jìn)行后續(xù)培訓(xùn),把普通話語音知識(shí)和方言學(xué)、音位學(xué)的基本知識(shí)作為后續(xù)培訓(xùn)的內(nèi)容,但因《綱要》的頒布和測(cè)評(píng)內(nèi)容的調(diào)整,需要在后續(xù)培訓(xùn)中學(xué)習(xí),這一想法未能落實(shí)。
總之,從復(fù)審的結(jié)果看,測(cè)試員的后續(xù)培訓(xùn)問題需要盡快付諸實(shí)施。
[1]李曉華.普通話口語教程[M].開封:河南大學(xué)出版社,1996:142.
[2]國(guó)家語委普通話培訓(xùn)測(cè)試中心.首屆全國(guó)普通話水平測(cè)試學(xué)術(shù)研討會(huì)論文集[C].北京:語文出版社,2003.
[3]林燾,王理嘉.語音學(xué)教程[M].北京:北京大學(xué)出版社:1992:143-145.
[4]李曉華.普通話口語教程[M].開封:河南大學(xué)出版社,1996:266.
[5]桂詩春:實(shí)驗(yàn)心理語言學(xué)綱要[M].長(zhǎng)沙:湖南人民出版社,1991:99,215.
The Rating Error in Putonghua Proficiency Test
LIU Dong-bing1,WEIHai-tang2,ZHAO Si-da3
(1.Language Application Research Centre,Nanjing Forestry University,Nanjing210037,China;2.School of Journalism&Comm unication,Nanjing Xiaozhuang University,Nanjing211171,China;3.School of Chinese Language and Literature,Beijing Normal University,Beijing100875,China)
It is shown in the reexamination of Putonghua Proficiency Test that the reason why the error in rating of“reading”and “speaking” is greater is concerned with a wide range of problems of the test paper structuring,the tester team constructing,and so on.Consequently,the post training of the testers focusing on the basic knowledge of the phonetics in Putonghua,dialectology and phonemics should be implemented as soon as possible to improve the reliability of Putonghua Proficiency Test.
Putonghua;proficiency test;rating error
H102
A
1672-3910(2010)02-0037-04
2009-09-10
江蘇省教育廳課題(07SJD740009)
劉冬冰(1954-),女,河南開封人,教授,國(guó)家級(jí)普通話水平測(cè)試員。