摘 要:計(jì)算機(jī)智能測(cè)試和信息管理系統(tǒng)的結(jié)合規(guī)范了普通話(huà)水平測(cè)試程序,提高了測(cè)試效率,降低了測(cè)試成本,促進(jìn)了普通話(huà)水平測(cè)試管理工作的發(fā)展。但“說(shuō)話(huà)”仍是依賴(lài)人工評(píng)判的測(cè)試項(xiàng),新的測(cè)試手段、測(cè)試模式以及測(cè)試時(shí)出現(xiàn)的新情況、新問(wèn)題會(huì)影響測(cè)試的信度。因此,把人文關(guān)懷滲透到測(cè)試的方方面面,是進(jìn)一步提高“說(shuō)話(huà)”的測(cè)試信度,完善普通話(huà)水平測(cè)試的有效嘗試。
關(guān)鍵詞:普通話(huà)水平智能測(cè)試 說(shuō)話(huà) 信度 影響 對(duì)策
普通話(huà)水平測(cè)試(以下簡(jiǎn)稱(chēng)PSC)是國(guó)家推廣普通話(huà)工作的重要組成部分。自2007年國(guó)家語(yǔ)委正式推廣應(yīng)用計(jì)算機(jī)智能測(cè)試和信息管理系統(tǒng)后,許多省市已實(shí)現(xiàn)了計(jì)算機(jī)輔助測(cè)試普通話(huà)。利用智能測(cè)試系統(tǒng),計(jì)算機(jī)可以自動(dòng)完成對(duì)有文字憑借的前三題的測(cè)評(píng),而對(duì)于無(wú)文字憑借的“說(shuō)話(huà)”測(cè)試項(xiàng),則由信息管理系統(tǒng)分配給測(cè)試員進(jìn)行評(píng)分,然后管理系統(tǒng)自動(dòng)將計(jì)算機(jī)測(cè)評(píng)的前三題的分?jǐn)?shù)和測(cè)試員評(píng)判的第四題的分?jǐn)?shù)相加,計(jì)算出考生的測(cè)試總成績(jī),并評(píng)定出相應(yīng)等級(jí)。普通話(huà)智能測(cè)試簡(jiǎn)化了評(píng)測(cè)程序,降低了測(cè)試站組織評(píng)測(cè)的難度和成本,減輕了測(cè)試員的工作量和勞動(dòng)強(qiáng)度,提高了測(cè)試質(zhì)量。但《普通話(huà)水平測(cè)試大綱》規(guī)定的考核內(nèi)容與評(píng)分標(biāo)準(zhǔn)是既定的,特別是“說(shuō)話(huà)”仍是依賴(lài)人工評(píng)判的測(cè)試項(xiàng),免不了還是會(huì)受到測(cè)試員經(jīng)驗(yàn)?zāi)芰?、心理因素或自身素養(yǎng)的影響。測(cè)試手段改變之初,一些新情況、新問(wèn)題的出現(xiàn),也會(huì)影響到測(cè)試的信度。
信度是指測(cè)試的可靠性或穩(wěn)定性,指測(cè)試結(jié)果在多大程度上反映了受試者的實(shí)際語(yǔ)言水平。信度是測(cè)試的基本保證,一個(gè)良好的語(yǔ)言測(cè)試,必須要有較高的信度。影響信度的因素很多,并且存在于語(yǔ)言測(cè)試的每個(gè)環(huán)節(jié)中,如試卷樣本的大小與區(qū)分度、測(cè)試環(huán)境、試題管理、考生的心理因素、評(píng)分者的經(jīng)驗(yàn)?zāi)芰靶睦硪蛩氐取?/p>
為了進(jìn)一步完善PSC,考察機(jī)輔測(cè)試中影響“說(shuō)話(huà)”測(cè)試項(xiàng)信度的因素并探尋其改進(jìn)途徑具有重要意義。
一、普通話(huà)水平智能測(cè)試對(duì)說(shuō)話(huà)信度的影響
(一)普通話(huà)水平智能測(cè)試中“說(shuō)話(huà)”測(cè)試項(xiàng)的測(cè)評(píng)特點(diǎn)
普通話(huà)水平智能測(cè)試對(duì)“說(shuō)話(huà)”測(cè)試項(xiàng)的測(cè)評(píng)方式具有以下特點(diǎn):第一,機(jī)測(cè)人評(píng),測(cè)評(píng)分離,測(cè)在前,評(píng)在后。機(jī)測(cè)結(jié)束后,由測(cè)試中心管理員按照登記的測(cè)試員和試卷的情況,將“說(shuō)話(huà)”語(yǔ)音分配給各個(gè)測(cè)試員進(jìn)行人工評(píng)判。第二,測(cè)試員通過(guò)網(wǎng)絡(luò)進(jìn)行遠(yuǎn)程判分。登錄測(cè)試中心網(wǎng)頁(yè)后,測(cè)試員通過(guò)網(wǎng)絡(luò)對(duì)考生“說(shuō)話(huà)”語(yǔ)音進(jìn)行在線(xiàn)評(píng)分。第三,增加了評(píng)分標(biāo)準(zhǔn)。除了對(duì)語(yǔ)音檔、詞匯語(yǔ)法規(guī)范程度、自然流暢度進(jìn)行測(cè)評(píng)外,還對(duì)離題、缺時(shí)、無(wú)效語(yǔ)料等方面做了規(guī)定。第四,測(cè)試員分散,“背靠背”獨(dú)立評(píng)測(cè),不能與其他測(cè)試員就同一應(yīng)試者的評(píng)定進(jìn)行溝通與商討。第五,定時(shí)嚴(yán)格,測(cè)試過(guò)程完整。
與傳統(tǒng)的人工測(cè)評(píng)相比,新的測(cè)評(píng)方式可以有效地防止以前存在的對(duì)“說(shuō)話(huà)”測(cè)試項(xiàng)隨意增刪內(nèi)容或時(shí)間的現(xiàn)象,可以避免在測(cè)試過(guò)程中由于測(cè)試員測(cè)試疲勞而導(dǎo)致的漏判和誤判現(xiàn)象,可以杜絕人情分,加上“說(shuō)話(huà)”由全省測(cè)試員獨(dú)立打分,較以前多了一個(gè)復(fù)審環(huán)節(jié),因此,從某種程度上說(shuō),其準(zhǔn)確性有了一定的保證。但從測(cè)試實(shí)踐來(lái)看,我們發(fā)現(xiàn),新的測(cè)試方式帶來(lái)了一些新問(wèn)題、新情況,而這些新問(wèn)題與新情況影響到了測(cè)試的信度。
(二)普通話(huà)水平智能測(cè)試對(duì)“說(shuō)話(huà)”信度的影響
為了對(duì)機(jī)測(cè)的信度進(jìn)行測(cè)定,我們運(yùn)用重測(cè)法與重判法做了一些考察和實(shí)驗(yàn)。先拿同一份試卷用重測(cè)法對(duì)同一組受試者分時(shí)段進(jìn)行傳統(tǒng)的人工測(cè)試與機(jī)輔測(cè)試,發(fā)現(xiàn)應(yīng)試者的應(yīng)試狀態(tài)有異,機(jī)輔測(cè)試時(shí)應(yīng)試者的緊張、不自然等非語(yǔ)音因素較重。再用重判法比較測(cè)試員對(duì)“說(shuō)話(huà)”測(cè)試項(xiàng)先后兩次的評(píng)分結(jié)果,發(fā)現(xiàn)機(jī)測(cè)結(jié)果與人測(cè)結(jié)果之間存在較大差距。我們認(rèn)為,測(cè)試手段的改變,對(duì)測(cè)試環(huán)境與測(cè)試方式、測(cè)試員的評(píng)分習(xí)慣、評(píng)分標(biāo)準(zhǔn)以及應(yīng)試者的測(cè)試心理與狀態(tài)都產(chǎn)生了較大的影響,這些都是測(cè)試信度受損的直接因素。
1.測(cè)試環(huán)境、測(cè)試方式及其對(duì)應(yīng)試者應(yīng)試心理的影響
“普通話(huà)水平測(cè)試是一種能力考察,因此測(cè)試環(huán)境越接近生活,越容易測(cè)查出真實(shí)的水平?!盵1]“說(shuō)話(huà)”本身就是一種傾訴,它需要傾聽(tīng)者與說(shuō)話(huà)者進(jìn)行思想與情感的互動(dòng)。在傳統(tǒng)的測(cè)試環(huán)境中,應(yīng)試者需面對(duì)幾位測(cè)試員就某一話(huà)題發(fā)表單向談話(huà),這種“三堂會(huì)審”式的陣勢(shì)可能會(huì)增加受測(cè)者的心理緊張程度,但測(cè)試員可以通過(guò)表情、態(tài)度、眼神或偶爾的雙向談話(huà)來(lái)緩解應(yīng)試者的緊張情緒。同時(shí),遇到諸如聲音過(guò)小、語(yǔ)速過(guò)慢過(guò)快、離題、缺時(shí)等不良現(xiàn)象時(shí),測(cè)試員可對(duì)應(yīng)試者加以提醒,這在一定程度上有助于應(yīng)試者語(yǔ)言水平的正常發(fā)揮。但在機(jī)輔測(cè)試下,卻是另一種情形。首先,應(yīng)試者完全沒(méi)有交流對(duì)象,沒(méi)有互動(dòng),沒(méi)有提醒,只有電腦屏幕下方不斷累積時(shí)長(zhǎng)的計(jì)分條,這有可能導(dǎo)致部分應(yīng)試者緊張程度加劇,不可避免地出現(xiàn)嚴(yán)重缺時(shí)、無(wú)效語(yǔ)料、簡(jiǎn)單重復(fù)、離題等現(xiàn)象。其次,應(yīng)試者測(cè)試過(guò)程的語(yǔ)速、音量把握不好會(huì)影響到錄音質(zhì)量,無(wú)意中把玩麥克風(fēng)、數(shù)據(jù)線(xiàn)或其他物品,也會(huì)影響到錄音效果。第三,機(jī)測(cè)時(shí)如果隔音效果不好,同一測(cè)試室中應(yīng)試者之間的測(cè)查內(nèi)容會(huì)相互干擾,這會(huì)在一定程度上影響應(yīng)試者的測(cè)試情緒與測(cè)試成績(jī)。最后,應(yīng)試者一旦進(jìn)入測(cè)試,就失去了對(duì)考試環(huán)境與考試模式熟悉的過(guò)程,為了不影響測(cè)試成績(jī),應(yīng)試者必須在規(guī)定的時(shí)間內(nèi)一道題接一道題地讀下去,特別是語(yǔ)音提示后單調(diào)的一聲“嘟”,更平添了許多緊張與壓抑,尤其是“說(shuō)話(huà)”,除非考前做好了充分的準(zhǔn)備,否則是難以在瞬間的應(yīng)急狀態(tài)下做到思路清晰、語(yǔ)言流暢、言之有物的。
2.新增評(píng)分標(biāo)準(zhǔn)可行性不強(qiáng)
“說(shuō)話(huà)”向來(lái)是測(cè)評(píng)難度最高、評(píng)分出入最大的測(cè)試項(xiàng),主要原因在于評(píng)分標(biāo)準(zhǔn)難以把握。
在傳統(tǒng)的測(cè)試中,《大綱》規(guī)定“說(shuō)話(huà)”有4個(gè)評(píng)分項(xiàng):語(yǔ)音標(biāo)準(zhǔn)程度、詞匯語(yǔ)法規(guī)范程度、自然流暢程度、缺時(shí)扣分。開(kāi)展計(jì)算機(jī)輔測(cè)后,由于考場(chǎng)的特殊性,考生極易出現(xiàn)無(wú)效語(yǔ)料、延時(shí)開(kāi)口、內(nèi)容雷同、離題、停頓過(guò)多等新情況,為了解決這些問(wèn)題,國(guó)家新增了對(duì)離題、無(wú)效語(yǔ)料、朗讀文本、缺時(shí)等評(píng)分項(xiàng)的補(bǔ)充規(guī)定。如對(duì)離題、雷同、無(wú)效話(huà)語(yǔ)等情況給出的標(biāo)準(zhǔn)是視程度扣4、5、6分。暫且不論如何準(zhǔn)確地把握“視程度”,僅就扣分來(lái)看,就有點(diǎn)太過(guò)嚴(yán)格,扣分是為了懲戒測(cè)試中的惡意離題、雷同者,但這種情況的出現(xiàn)與測(cè)試自身存在的諸多不足有著莫大的聯(lián)系。同時(shí),對(duì)于出現(xiàn)的這些新問(wèn)題,國(guó)家也沒(méi)有形成統(tǒng)一明確的定性描述。如在朗讀文本這一項(xiàng)中,對(duì)何為朗讀文本,又有哪些具體表現(xiàn),應(yīng)如何判定,它和自然流暢度里的背稿子有何質(zhì)的區(qū)別等問(wèn)題沒(méi)有做出明確的說(shuō)明。再如,缺時(shí)與無(wú)效語(yǔ)料、自然流暢度之間有沒(méi)有同質(zhì)性?有沒(méi)有重復(fù)扣分的可能?不同的理解會(huì)出現(xiàn)不同的評(píng)分細(xì)則,如何靈活地變通評(píng)分標(biāo)準(zhǔn),對(duì)各種新情況做出客觀(guān)公正的判斷,對(duì)測(cè)試員來(lái)說(shuō)無(wú)疑是一個(gè)嚴(yán)峻的考驗(yàn)。
3.新的評(píng)分方式太過(guò)孤立
“PSC得出的結(jié)論是建立在精確的定量評(píng)估和模糊的定性評(píng)價(jià)的對(duì)立統(tǒng)一之上的。”在傳統(tǒng)的測(cè)試中,對(duì)“說(shuō)話(huà)”的等級(jí)定性可以前三題測(cè)試的定量評(píng)估為參考依據(jù)。實(shí)施機(jī)輔測(cè)試后,測(cè)試員通過(guò)測(cè)試管理系統(tǒng)接受評(píng)分任務(wù),對(duì)“說(shuō)話(huà)”項(xiàng)進(jìn)行在線(xiàn)評(píng)分,這樣一方面失去了對(duì)前三項(xiàng)的定量參照與應(yīng)試者語(yǔ)音面貌的整體感知,另一方面也失去了與其他測(cè)試員面對(duì)面互相參考的機(jī)會(huì)。測(cè)試方式的改變,使測(cè)試員在評(píng)分過(guò)程中難以改變?cè)械脑u(píng)測(cè)思維與習(xí)慣,評(píng)分尺度不好把握,甚至無(wú)所適從,不可避免地會(huì)出現(xiàn)評(píng)分較之前過(guò)嚴(yán)或過(guò)松的現(xiàn)象。
4.測(cè)試員對(duì)新的測(cè)試方式的適應(yīng)能力有差異
普通話(huà)智能測(cè)試對(duì)測(cè)試員的素質(zhì)提出了更高的標(biāo)準(zhǔn)與更嚴(yán)的要求。計(jì)算機(jī)輔助測(cè)試中出現(xiàn)的新情況、新問(wèn)題,必然要求測(cè)試員改變固有的測(cè)試經(jīng)驗(yàn)與評(píng)測(cè)習(xí)慣,在短期內(nèi)適應(yīng)和熟悉新的測(cè)試模式,準(zhǔn)確把握新的評(píng)分標(biāo)準(zhǔn),熟練地進(jìn)行上機(jī)操作。但是測(cè)試員的職業(yè)、專(zhuān)業(yè)背景、文化素養(yǎng)、業(yè)務(wù)素質(zhì)及測(cè)試工作經(jīng)驗(yàn)等存在著個(gè)體差異性,他們適應(yīng)能力的高低、責(zé)任心的大小、聽(tīng)辨能力的高低、語(yǔ)言理論知識(shí)的強(qiáng)弱、語(yǔ)音心理定勢(shì)的有無(wú)、對(duì)評(píng)分標(biāo)準(zhǔn)理解程度的深淺等都有可能影響到“說(shuō)話(huà)”評(píng)分的準(zhǔn)確性。
二、突出人文關(guān)懷,提高普通話(huà)水平智能測(cè)試的信度
“人文關(guān)懷是社會(huì)文明進(jìn)步的標(biāo)志,是人類(lèi)自覺(jué)意識(shí)提高的反映,簡(jiǎn)言之,就是關(guān)心人、愛(ài)護(hù)人、尊重人、關(guān)注人的生存與發(fā)展”。普通話(huà)水平測(cè)試中的“說(shuō)話(huà)”不是語(yǔ)言知識(shí)、文化水平的測(cè)試,也不是演講口才的評(píng)估,而是對(duì)應(yīng)試者語(yǔ)言水平的考查,是對(duì)被測(cè)人在無(wú)文字憑借下運(yùn)用普通話(huà)所達(dá)到的標(biāo)準(zhǔn)程度的檢測(cè)和評(píng)定。普通話(huà)水平測(cè)試的最終目的是促進(jìn)全社會(huì)普通話(huà)水平的提高,推動(dòng)全國(guó)普通話(huà)的普及。測(cè)試只是一種手段而不是目的,機(jī)輔測(cè)試需要更多的人文關(guān)懷。堅(jiān)持“以人為本”,關(guān)注應(yīng)試者的感受和體驗(yàn),使受試人始終保持一種輕松愉快的測(cè)試心態(tài),對(duì)其進(jìn)行公平公正的評(píng)測(cè),可最大限度地反映受試者的實(shí)際語(yǔ)言水平,從而提高測(cè)試的可靠性。
(一)采取靈動(dòng)自然的考核形式
“說(shuō)話(huà)”測(cè)試項(xiàng)的主要目的是為了檢測(cè)應(yīng)試者在自然狀態(tài)下使用普通話(huà)的能力,側(cè)重語(yǔ)言形式的考核。目前“說(shuō)話(huà)”測(cè)試采用的是“命題說(shuō)話(huà)”形式,雖以言語(yǔ)內(nèi)容為載體,但表達(dá)的內(nèi)容卻不是測(cè)試的初衷,同時(shí)單向的說(shuō)話(huà)方式也增加了應(yīng)試者表達(dá)的尷尬?;诖?我們認(rèn)為有必要采取靈動(dòng)自然的考核形式,比如在題后可就主題設(shè)置多個(gè)提問(wèn)或作答提綱,這些提示的設(shè)計(jì)可以幫助應(yīng)試者理順說(shuō)話(huà)思路,克服緊張狀態(tài),實(shí)現(xiàn)應(yīng)試者與計(jì)算機(jī)的“雙向”交流,把應(yīng)試者從“無(wú)話(huà)可說(shuō)”的窘境中解脫出來(lái),讓內(nèi)容不再成為表達(dá)形式的羈絆,還應(yīng)試者一個(gè)真正的自然狀態(tài)。
(二)研制明確理性的評(píng)分標(biāo)準(zhǔn)
測(cè)試方式的改變,使測(cè)試員失去了對(duì)前三項(xiàng)的定量參照,從而在在線(xiàn)評(píng)分時(shí)可能會(huì)出現(xiàn)評(píng)分尺度把握不當(dāng)?shù)那闆r。解決這個(gè)問(wèn)題的前提是必須研制出科學(xué)、細(xì)致、明確、操作性較強(qiáng)的評(píng)分標(biāo)準(zhǔn),能對(duì)測(cè)試時(shí)出現(xiàn)的不同程度的新情況、新問(wèn)題做出準(zhǔn)確的定性判斷與理性的定量裁定。并列評(píng)分指標(biāo)之間要有明確的界限,不可籠統(tǒng)含糊,更不能有重復(fù)扣分或扣分過(guò)嚴(yán)過(guò)松的現(xiàn)象,真正實(shí)現(xiàn)測(cè)試的公平與公正,體現(xiàn)測(cè)試的人文關(guān)懷。
(三)設(shè)計(jì)人性化的說(shuō)話(huà)測(cè)試模式
首先,進(jìn)入測(cè)試后,系統(tǒng)應(yīng)留有一定的時(shí)間,讓?xiě)?yīng)試者有一個(gè)思維緩沖、熟悉環(huán)境的過(guò)程,應(yīng)試者做好適當(dāng)?shù)臏?zhǔn)備后再點(diǎn)擊“開(kāi)始錄音”,讓測(cè)試生效。其次,可賦予計(jì)算機(jī)以“靈性”與“生命”。如通過(guò)建立友好活潑和諧的界面給應(yīng)試者營(yíng)造一種輕松愉快的測(cè)試氛圍;設(shè)計(jì)親切可愛(ài)的小卡通與應(yīng)試者進(jìn)行簡(jiǎn)單的互動(dòng),如缺時(shí)或無(wú)效語(yǔ)料提醒等;在題目切換時(shí),可輔以簡(jiǎn)短動(dòng)聽(tīng)的音樂(lè)??傊?要盡量創(chuàng)造仿真的生活環(huán)境與語(yǔ)言情景,消除應(yīng)試者面對(duì)計(jì)算機(jī)時(shí)因缺乏交流對(duì)象而產(chǎn)生的不適感或因特殊的測(cè)試環(huán)境而產(chǎn)生的緊張感。
(四)測(cè)試員要樹(shù)立“以人為本”的理念
一個(gè)優(yōu)秀的測(cè)試員應(yīng)把應(yīng)試者作為一個(gè)特殊的交際對(duì)象來(lái)對(duì)待,雖然在評(píng)分過(guò)程中只聞其聲,不見(jiàn)其人,但也應(yīng)給應(yīng)試者一些人文關(guān)懷。由于沒(méi)有考場(chǎng)監(jiān)測(cè),測(cè)試員更應(yīng)對(duì)測(cè)試時(shí)出現(xiàn)的新問(wèn)題盡量做出全面的分析與正確的判斷,不能憑主觀(guān)猜測(cè),更不能憑已有經(jīng)驗(yàn)草率評(píng)分,而要做到謹(jǐn)慎但不失靈活,嚴(yán)格但不失關(guān)愛(ài)。同時(shí),要更多地學(xué)習(xí)與掌握有關(guān)的語(yǔ)言學(xué)知識(shí),與時(shí)俱進(jìn),“適應(yīng)新形勢(shì),研究新問(wèn)題,了解新政策,學(xué)習(xí)新規(guī)章,掌握新措施”[2],做到以測(cè)促學(xué)、以測(cè)促研,不斷提高自身素養(yǎng),努力實(shí)現(xiàn)人文關(guān)懷與科學(xué)精神的有機(jī)統(tǒng)一。
注 釋:
[1]佟樂(lè)泉.不斷提高普通話(huà)水平測(cè)試的科學(xué)水平[J].語(yǔ)言文字應(yīng)用,1997,(3):22.
[2]周小兵.論普通話(huà)水平測(cè)試的信度[Z].廣東語(yǔ)言文字網(wǎng),2005.
參考文獻(xiàn):
[1]沈昌明.國(guó)家普通話(huà)水平智能測(cè)試系統(tǒng)與人工測(cè)試之比較(上)[N].語(yǔ)言文字周報(bào),2007-6-27.
[2]王永紅.計(jì)算機(jī)智能測(cè)試系統(tǒng)輔助普通話(huà)水平測(cè)試應(yīng)注意的問(wèn)題[N].語(yǔ)言文字周報(bào),2008-5-7.
[3]劉潤(rùn)清.語(yǔ)言測(cè)試和它的方法[M].北京:外語(yǔ)教學(xué)與研究出版社,1991.
(劉湘濤 重慶 長(zhǎng)江師范學(xué)院教師教育學(xué)院 408100)