羅運久
詞匯測試是語言測試的重要領(lǐng)域,有兩個重要的構(gòu)念效度:詞匯量和詞匯深度[1]。詞匯量即學生知道的詞的數(shù)量,詞匯深度代表著學生對目標詞匯掌握的水平。詞匯自由聯(lián)想測試(以下簡稱詞匯聯(lián)想測試)作為一種產(chǎn)出性詞匯測試,紙質(zhì)版本和電腦版本均得到了廣泛的應(yīng)用。大多數(shù)詞匯聯(lián)想測試用于測試學生詞匯量的大小,但這些測試基本沒有提供構(gòu)念效度的證據(jù),也無法準確給出學生對目標詞匯的了解情況,因此很難說是合格的詞匯測試工具。為解決這一問題,本研究使用有聲思維方法收集調(diào)查了學生在完成詞匯聯(lián)想測試時的心理活動過程,意圖為該測試提供構(gòu)念效度的證據(jù)。
詞匯測試中有兩個重要的構(gòu)念效度:詞匯量和詞匯深度[2]。詞匯量是指學生所知道的詞匯總數(shù),學生至少要掌握這些詞匯的意思,即看到詞匯可以辨認出詞的意思,或者給出詞匯意思能夠辨認出詞。相比之下,詞匯深度是指學生對目標詞匯的掌握情況。一般而言,學生最淺的知識是只掌握詞匯的發(fā)音,而最深的知識是掌握詞匯的使用限制,即什么時候該用,什么時候不該用[3]。除了以上兩個維度,詞匯知識還可以分為接受性知識和產(chǎn)出性知識。簡單來說,接受性知識表示學生會認這些詞匯,而產(chǎn)出性知識則表示學生會用這些詞匯。因此,對產(chǎn)出性詞匯知識而言,詞匯量就是學生能夠回想起來的能說或者能寫的詞匯數(shù)量,而詞匯深度就是學生對目標詞匯的掌握程度,即能在不同的語境下使用詞匯。產(chǎn)出性詞匯知識具體構(gòu)成如表1。
表1 詞匯聯(lián)想測試所涉及的產(chǎn)出性詞匯知識
作為一種廣泛使用的產(chǎn)出性詞匯測試,詞匯聯(lián)想測試主要著眼于學生回答與目標詞匯的語義相似性,即兩個詞詞義和使用語境的相似程度。理論上說,詞匯聯(lián)想測試至少涉及了三方面的詞匯深度知識:詞匯關(guān)聯(lián)、語法功能以及詞匯搭配。然而,目前很少有研究將詞匯聯(lián)想測試作為一種詞匯深度測試進行設(shè)計和驗證[4]。
在詞匯聯(lián)想測試中,所展示的詞匯被稱為刺激詞(the stimulus word),考生需要根據(jù)刺激詞寫出一個或多個詞匯[5](如附錄1)。目前大多數(shù)研究聚焦在對學生產(chǎn)出性詞匯量的評估上,通常的做法是計算考生答案的中級和高級答案個數(shù),從而對考生的詞匯量做出大致的估計。例如,Walters[4]在2012 年的研究中給考生答案中每個中級(第二千個最常用的英文單詞)和高級(學術(shù)及其他高級詞匯)詞匯打一分(見表2)。
雖然將詞匯聯(lián)想測試視作測量詞匯量手段的研究者不在少數(shù),但其在構(gòu)念效度上仍有無法解釋的問題,即考生似乎更依賴他們的詞匯深度知識來得到答案。具體來說,考生可能首先想到的是與刺激詞語義相近的詞匯;如果沒有,再去尋找和他們字形相近或者發(fā)音相近的詞匯。也就是說,比起想到的詞匯數(shù)量,考生更關(guān)注刺激詞和答案之間的語義相似度[5]。
此外,如果研究者將詞匯聯(lián)想測試用于測量考生詞匯量,他們很可能無法判斷考生是否真正掌握了目標詞匯。Fitzpatrick[6]指出,她曾遇到一位考生對“習慣”這一刺激詞給出三個答案:紅眼睛、青草以及大耳朵。研究者直到看到第三個答案才發(fā)現(xiàn)考生錯把“習慣”當成了“兔子”一詞。
表2 詞匯聯(lián)想測試作為詞匯量測量手段的概況
整體來看,國內(nèi)外詞匯聯(lián)想測試的研究主要缺乏構(gòu)念效度證據(jù),這直接影響到測試工具的效度以及考試的具體設(shè)計。鑒于此,有必要使用有聲思維來探究考生在完成詞匯聯(lián)想測試時的心理活動,從而為其提供堅實的構(gòu)念效度證據(jù)。
在以往的研究中,詞匯聯(lián)想測試都是作為產(chǎn)出性詞匯量的測量工具在使用,一般提供的效度證據(jù)是效標關(guān)聯(lián)效度(如和其他詞匯量測試的相關(guān)性)。為了探究該工具的構(gòu)念效度的證據(jù)(即評估的目標知識能力),本研究提出了如下問題:
1. 詞匯聯(lián)想測試所衡量的是哪一個維度的產(chǎn)出性知識:詞匯量還是詞匯深度知識?
2. 如果詞匯聯(lián)想測試評估的是學生的詞匯深度知識,學生更可能回想還是使用詞匯知識來得到答案?
受試為43 位在中國學習漢語的留學生。這43位學生來自三所不同的大學,有著不同的母語背景(見表3)。他們均為中高級的漢語學習者。(《HSK考試大綱》對漢語水平劃分如下:1-2 級為初級水平、3-4 級為中級水平、5-6 級為高級水平)。大部分學生來自哈薩克斯坦、秘魯、白俄羅斯以及日本。
表3 受試的基本信息
續(xù)表
研究設(shè)計分為兩個方面:(1)研究材料和工具的設(shè)計;(2)實驗步驟。
在研究材料的設(shè)計上,研究者根據(jù)Meara 和Fitzpatrick[5]在2000 年提出的詞匯聯(lián)想測試,從《HSK考試詞匯大綱》中選取了22個4級詞匯作為刺激詞,占4 級實詞總數(shù)的4.6%(見附錄2)。每位考生都需要根據(jù)刺激詞寫出至少10 個答案?!禜SK 考試詞匯大綱》中包含六個等級的詞匯,其中1 級和2 級詞匯為常見的高頻詞,而3 到6 級詞匯為學術(shù)詞匯[7]。選取這22 個詞匯是基于兩方面的考慮,一是選取中高級詞匯作為目標詞能夠使學生的答案更加多樣[8];二是中高級的漢語學習者被認為掌握完成產(chǎn)出性詞匯測試所必需的讀寫能力[9]。
在實驗步驟上,為了了解學生答案與刺激詞的關(guān)聯(lián),研究者讓每一位考生采取有聲思維法來報告他們在完成測試題目時的心理活動。在正式開展有聲思維報告之前,每位考生都參加了15 分鐘的演練。在演練過程中,考生需要根據(jù)不在考試范圍中的刺激詞作答,并向研究者報告他們是如何得到答案的。整個正式環(huán)節(jié)持續(xù)1 到2 個小時。在考生解釋不清或者陷入沉默的時候,研究者會提出如下的問題:“你為什么要聯(lián)系這兩個詞,能不能稍微再解釋下你的理由?”有聲思維環(huán)節(jié)是用中文進行的,并在征得學生許可的情況下進行了錄音。
使用有聲思維收集到的數(shù)據(jù)作為考試的構(gòu)念效度證據(jù),是語言測試的普遍做法[10]。為了更好地幫助研究者理解考生在完成詞匯聯(lián)想測試時的思維過程,有聲思維語料將按照兩個系統(tǒng)來進行編碼:(1)Fitzpatrick 提 出 的 詞 匯 聯(lián) 想 測 試 答 案 分 類[6];(2)Nation 對產(chǎn)出性詞匯知識的分類[3]。另外,考慮到中文沒有類似英文的詞族(如mends、mended 和mending),有關(guān)單詞組成部分的答題策略也被相應(yīng)刪除。
針對第一個研究問題,從兩個角度進行分析:一是學生答案的平均數(shù)量,二是學生運用不同詞匯知識回答問題的具體情況。
首先,對于學生回答數(shù)量這一描述性統(tǒng)計量,研究發(fā)現(xiàn),三個水平的學生平均能夠給出2.65個答案。其中3 級水平學生所能給出的答案最少,約為1.75個。相比之下,4 級和5 級水平學生答案數(shù)量有所增加,分別為2.25個和3.95個。初步來看,三個水平學生給出的答案數(shù)量遠低于測試要求(10個答案)。
導致學生答案數(shù)量遠低于研究要求的原因有兩個:一是學生更關(guān)注答案和刺激詞之間的語義相似度,而不是答案的數(shù)量。如果學生僅能找出3 個和刺激詞相關(guān)聯(lián)的答案,學生寧可只寫3 個答案,而不是強行填滿10 個答案。二是中文產(chǎn)出性詞匯測試對考生有不小的難度。考慮到中文書寫系統(tǒng)的獨特性,目前大多數(shù)中文詞匯測試題為單項選擇題,即不要求學生“會寫”詞匯,而是要求學生“會認”詞匯。本研究中的詞匯聯(lián)想測試屬于產(chǎn)出性測試,要求寫出詞匯,這對學生造成了不小的挑戰(zhàn)。
其次,對于學生回答問題的具體情況,有聲思維收集到的語料顯示,學生會采用不同層次的詞匯知識來完成測試,而不僅僅局限于對刺激詞詞義的理解。表4 是學生運用不同詞匯知識回答問題的具體情況見:
表4 考生有聲思維使用策略節(jié)選
1. 使用發(fā)音策略回答問題
節(jié)選1 中的學習者來自日本,她之所以給出“漂亮”這一答案是因為該詞的日語發(fā)音和刺激詞“可憐”的發(fā)音非常相似。在這個過程中,學生首先回想到與刺激詞發(fā)音相似的日語詞匯,然后給出其中文翻譯作為答案??偟膩碚f,這種答題策略并沒有獲得考生的青睞,很少有考生通過這種策略來回答問題。
2. 使用拼寫策略回答問題
在節(jié)選2中,考生3是因為刺激詞和答案中都有一個“理”字得到的答案。從后面考生給出的解釋不難看出,考生并沒有掌握刺激詞的詞義,而是通過構(gòu)成該詞的字義來推測詞的意思。大多數(shù)時候,考生是在缺乏對刺激詞或答案詞義了解的情況下使用拼寫策略回答問題。
3. 使用詞性策略回答問題
在節(jié)選3中,考生1將刺激詞和答案作為一對單詞進行記憶。在詞匯學習過程中,學習者常常將語義相近、詞性不同的詞匯成對記憶,而不是根據(jù)詞匯表死記硬背[11]??傮w來看,考生很少通過這種策略來得到答案。
4. 使用詞義策略回答問題
學習者對詞義的掌握程度有高低之分。當詞義掌握程度低的時候,學生通常只能對詞匯的大致印象進行描述,如“不好的詞”“貶義詞”。相比于大致的描述,在有聲思維語料中,大多數(shù)考生其實更傾向于對詞義下相對準確的定義。在節(jié)選4中,考生5分別對刺激詞和答案下了定義。盡管該考生對兩個詞下了定義,由于答題策略在功能上的一致性,這段節(jié)選仍然被編碼成使用了一次詞義策略。
5. 使用多義詞策略回答問題
在節(jié)選5中,考生22提到刺激詞有兩個意思,這是典型的使用多義詞策略回答問題的例子。雖然在節(jié)選的后半部分,考生有提及過該詞的詞性(形容詞),這段節(jié)選并沒有被編碼成使用詞性策略回答問題,原因在于該考生的目標是介紹刺激詞的其中一個意思,而不是介紹它的詞性。
6. 使用詞匯關(guān)聯(lián)策略回答問題
之前的研究顯示有三種描述詞匯組織的方式[12]:(1)近義詞;(2)反義詞;(3)上位詞。其中,最受學生關(guān)注的是詞匯的近義關(guān)系。在節(jié)選6 中,考生1 明確指出了刺激詞和答案是一對近義詞。除了明確使用“近義詞”這一條目外,學生同樣會使用“差不多”“A 就是B”這樣的方式來指明詞匯之間的近義關(guān)系。
7. 使用造句策略回答問題
這一策略指的是學生能夠用自己原創(chuàng)的句子將刺激詞和答案聯(lián)系起來,這種策略的使用在一定程度上反映出學生在語境中使用詞匯的能力[13]。由于這一策略事實上缺乏較為準確的定義,在實際的編碼過程會出現(xiàn)編碼重疊的現(xiàn)象(如將學生給出的句子編碼成解釋詞義或使用搭配)。考慮到這一現(xiàn)象,這一策略的編碼要符合兩個條件:一是句子中不包含連系動詞(如“是”),二是句子中刺激詞和答案至少要相隔兩個詞以上。在節(jié)選7 中,考生3造的句子將刺激詞和答案聯(lián)系在了一起。在句子中,該考生試圖向研究者傳達一個觀念,即同情心是覺得他人可憐的前提。這個句子既沒有連系動詞,刺激詞和答案也沒有相鄰,符合使用造句策略回答問題的條件。
8. 使用詞匯搭配策略回答問題
詞匯搭配策略是最受考生青睞的答題策略之一。一般有三種方法判斷學生是否使用搭配知識回答問題:(1)基于形式的方法;(2)基于心理詞匯儲存的方法;(3)反例。首先,基于形式的方法要求刺激詞和答案相鄰,考生6在節(jié)選8中給出了包含刺激詞和答案的短語,這是在句子或短語中使用搭配的典型例子,因此研究者將其編碼為使用詞匯搭配策略回答問題。相比之下,基于心理詞匯儲存的方式要看學生是否明確指出是將刺激詞和答案作為搭配進行記憶的。反例是則指學生指出目標詞不可以和某些特定詞匯搭配。
9. 使用詞匯使用限制策略回答問題
這種策略和詞匯的使用場合以及正式程度有關(guān)。有聲思維語料顯示,學生會在選擇書面語和口頭語的情況下使用該策略。在節(jié)選9 中,該名學生明確指出了該答案是適合書面表達這類正式場合使用的。
從上面的有聲思維語料中不難看出,學生在完成詞匯聯(lián)想測試的時候,使用了不同方面、不同層次的產(chǎn)出性詞匯知識。再者,根據(jù)以往對詞匯量測試的研究,學生并不需要使用深度的詞匯知識,僅僅需要了解詞義就可以正確回答題目[14]。這都說明詞匯聯(lián)想測試更應(yīng)被看作為詞匯深度測試,而非詞匯量測試。
針對第二個研究問題,研究者對20 位考生使用的答題策略頻率進行了分析,其中高水平學習者10人(5 級學習者)、低水平學習者10 人(3 級學習者)(見表5)。結(jié)果顯示,相比于詞匯的回想知識(如詞匯的拼寫知識),兩組考生都對詞匯的使用知識更為關(guān)注(如詞匯的關(guān)聯(lián)知識)。考生的漢語水平越高,就越有可能將答案和刺激詞在語境中聯(lián)系起來。這進一步說明了詞匯聯(lián)想測試所測量的是學生深度的、高水平的詞匯知識,而非簡單的回想。
表5 學習者考試策略的比較
本研究初步探討了詞匯聯(lián)想測試的構(gòu)念效度,主要得到了以下結(jié)論:(1)詞匯聯(lián)想測試所衡量的是學生的詞匯深度知識;(2)相比于回想知識,學生更關(guān)注詞匯的使用。
本研究結(jié)果有助于在二語習得領(lǐng)域更好地開發(fā)和利用詞匯聯(lián)想測試,對其作為詞匯深度測試的設(shè)計和開發(fā)也有著啟示意義。初步看來,學生更關(guān)注詞匯的使用而非回想,如果能對代表使用知識的答案給出較高的分數(shù),而對代表回想的答案給出較低的分數(shù),則詞匯聯(lián)想測試作為深度測試的實用性和可操作性將大大增強。