【摘要】本研究旨在任務型測試視角下從理論角度探討現(xiàn)行詞匯測試工具在測量學習者詞匯能力上的可靠性。我們結(jié)合Bachman的語言測試理論回顧相關研究后發(fā)現(xiàn)對詞匯能力的定義應該包含語言運用的范疇,在確保信度和強化效度間取得均衡進而實現(xiàn)任務設置中能力評級多層次性和語言使用特征真實性。由于話題和任務設置目標相關性對學習者引起的反撥效應可以通過控制引發(fā)手段來確保測試結(jié)果的可解釋性,因此為了保持測試工具高預測力,必須使任務設置符合不同水平學習者要求,同時還要注意語境對測試結(jié)果的干擾,合理采用人工干預確保信度。
【關鍵詞】詞匯知識 語境 任務型測試 預測準確性 結(jié)構(gòu)效度
【中圖分類號】H319 【文獻標識碼】A 【文章編號】2095-3089(2018)27-0089-02
一、引言
詞匯學習是一個循環(huán)往復的過程,如何準確判斷學習者詞匯能力進展已成為測試評估中重要問題。詞匯能力發(fā)展受詞匯知識多層次性、接受輸入量和質(zhì)、學習者語言能力影響,是處于習得準備狀態(tài)的學習者通過操練等方法進入形態(tài)-功能接口時形成的詞法能力。然而詞法化的形成又是潛移默化的過程,設計合適的測量工具來研究詞法化成為最佳選擇。本文就近十年來有關詞匯能力測量的相關研究進行綜述,為進一步改進測量工具提供理論依據(jù)。
二、詞匯知識和測試
一個英語單詞包含的知識有多層次性(戴曼純,2000)。就知識深度而言,一個詞所囊括知識可分為接受性知識和產(chǎn)出性知識。接受性知識包括詞的形式、意義和功能,產(chǎn)出性知識是接受性知識的延伸,包括拼讀、在語境中的使用等(Nation, 1990/2003)。任務內(nèi)容自然分為學習材料和學習目標,材料是實現(xiàn)目標的載體,而目標不僅是記憶,更要求在不同語境中能準確使用(Gu, 2003)。因此,測量詞匯能力不單是記憶的量,更重要的是在不同任務類型和語境下使用詞匯的質(zhì)。
盡管單個詞所包含知識呈現(xiàn)多層次性,但就知識廣度而言,大體涵蓋形式、意義和用法三方面。三者各自獨立但又相互聯(lián)系,形式與意義層面發(fā)生互動,形式和意義層面又分別與用法層面產(chǎn)生互動關系,三者間互動有賴于概念結(jié)構(gòu)中介作用。在測試中,應試者與測試任務間需通過形式、意義、用法間的循環(huán)才能實現(xiàn)互動。當遇到生詞時,應試者在初期準備中形式、意義和用法間的互動關系較弱,因此憑借自身經(jīng)驗性知識通過已知來構(gòu)建未知,與原有概念結(jié)構(gòu)形成有效鏈接,經(jīng)過同化使其發(fā)生“量”的更新;更新后結(jié)構(gòu)進入中期處理,應試者心理機制發(fā)揮過濾作用對已發(fā)生“量”的變化后結(jié)構(gòu)進行篩選,以便提取關鍵新信息結(jié)構(gòu);提取完成進入后期產(chǎn)出,前一階段形成的結(jié)構(gòu)通過順應實現(xiàn)與原有概念結(jié)構(gòu)整合,從而實現(xiàn)概念結(jié)構(gòu)在“質(zhì)”上重組。在此階段,形式、意義和用法在新概念結(jié)構(gòu)中介作用下形成較強互動關系,在此基礎上重回至任務中完成預設要求。一旦出現(xiàn)生詞,此過程將重新進入準備階段,如此循環(huán)往復以至最終完成任務設置目標。
語境對測試過程影響主要是通過受試者為完成任務設置目標而采用的心理評估手段來實現(xiàn)的。根據(jù)與話題相關程度,語境可分為直接語境和背景語境。直接語境與話題相關程度低,指存在于句子或文章中非話題知識或背景知識的語言線索或暗示等信息;背景語境與話題相關程度高,指在主題知識暗示下與學習者經(jīng)驗性知識相匹配的形式或意義上的圖式框架。在直接語境下,學習者憑借文本中出現(xiàn)的提示信息對目標生詞完成策略選擇、利用已知提示分析、生成語義和驗證推理這一系列過程。其中,提示信息包括分析詞語形態(tài)結(jié)構(gòu)、詞性、生詞所在句的語法結(jié)構(gòu),而驗證過程則將經(jīng)驗性知識放入文本所蘊涵的語境中加以檢驗其恰當性;在背景語境下,學習者主要利用自己積累的經(jīng)驗、話題知識、篇章結(jié)構(gòu)知識進行從上到下處理來揣摩生詞,并通過文本中語法提示信息進行從下到上處理來驗證結(jié)果,易受話題化影響引起反撥效應。
三、詞匯知識和測量
詞匯量測試和詞匯層級測試是關注焦點。Nation (1993)認為詞匯量測試項目從字典所列詞條中抽取樣本,基于此,Schmitt, D. Schmitt & Clapham (2001)提出了擴展版詞匯層級測試方案。Beglar (2010)通過R語言發(fā)現(xiàn)詞匯量測試對接受性詞匯知識的信度和效度都達到了要求,而Perkins & Linnville (1987)通過檢驗詞匯測試工具的結(jié)構(gòu)定義發(fā)現(xiàn)應試者所處學習階段應包含在結(jié)構(gòu)定義中。因此,工具通用性不僅取決于對詞匯量進行準確的概念化,而且還要使概念化后的詞匯量具有可操作性(Laufer, Elder, Hill & Congdon, 2004)。
盡管測量工具按照理論要求設計,但往往不參照語境對詞匯量做粗略估計,應在互動觀基礎上考慮語境構(gòu)建新測量框架 (Read & Chapelle, 2001),然而現(xiàn)有測試工具常忽略語境聚焦接受性詞匯量,比如Yes-No測試法雖具有一定的效度和信度,然而用離散法設計出的試題與傳統(tǒng)選擇題和正誤判斷題相比,測試結(jié)果被高估導致信度存在問題(Beeckmans, R et al., 2001)。通過計算應試者對項目反應時間并不存在優(yōu)勢(Pellicer-Sánchez & Schmitt, 2012),原因在于應試者推測和反應方式,只有改進控制手段(Huibregtse, Admiraal & Meara, 2002)。但Yes-No測試法在詞匯層級測試中能有效測量接受性詞匯量(Mochida & Harrington, 2006),既能提供評估詞匯知識掌握質(zhì)量,又能確認詞匯是否完全為學習者掌握(Meara & Buxton,1987;Read,1993)。
對產(chǎn)出性詞匯知識測量需要控制式誘發(fā)加詞匯頻度測試手段,如Laufer & Nation (1999)調(diào)查出了不同級別學習者產(chǎn)出詞匯量,而Fitzpatrick & Clenton (2010)通過誘導產(chǎn)出并結(jié)合詞頻分析計算產(chǎn)出詞匯量。而在詞匯豐富性上,Jarvis (2002)通過比較詞匯形符和類符比例曲線,發(fā)現(xiàn)課堂輸入與詞匯豐富性正相關,寫作質(zhì)量受制于詞匯知識,而詞匯豐富性受母語背景影響;Malvern & Richards (2002)則使用自行設計D測量法結(jié)合vocd軟件來計算話語詞匯豐富性中間接發(fā)現(xiàn)受試群體對研究者所采用的誘發(fā)詞匯法引起的反撥效應。在測量中,詞匯知識深度有可能受母語影響,Schoonen & Verhallen (2008)發(fā)現(xiàn)母語水平對兒童二語學習者詞匯知識深度影響顯著;而詞匯知識廣度可能受學習者語法能力影響,Shiotso & Weir(2007)發(fā)現(xiàn)句法知識在預測閱讀能力水平上略高于詞匯廣度知識預測力。此外,Schmitt,Wun Chung Ng & Garras (2010)的研究發(fā)現(xiàn)詞義聯(lián)想范式預測能力高低上限時解釋力良好,預測中階能力段時解釋力欠佳。
除測試方法外,語言能力也會影響學習者完成詞匯測試任務質(zhì)量。Yamada (2009)驗證Hoey所構(gòu)建文本主旨辯識理論中發(fā)現(xiàn)語言能力受語境中主旨識別影響,F(xiàn)airclough (2011)在檢驗Meara & Buxton(1987)的識別任務中發(fā)現(xiàn)對水平低的學習者效果顯著,對水平高的學習者解釋力不足。而Crossley, Salsbury,McNamara & Javis (2011)和Crossley,Salsbury & McNamara (2012)提出詞匯能力要包含詞匯量和知識特征,詞匯能力模型應當考慮不同語言能力間可比性。
此外,對大規(guī)模語言能力測試(如TOEFL)中詞匯測試項目分析后發(fā)現(xiàn)語法、搭配、詞際聯(lián)想及語義方面知識都未能完全體現(xiàn)出來(Schmitt, 1999)?;诖耍琎ian & Schedl (2004)為新TOEFL開發(fā)的詞匯測試項目與舊詞匯測試項目相比較對學習者閱讀水平預測能力相當。OLoughlin (1995)則挑選了澳大利亞英語交際能力評估考試進行分析后發(fā)現(xiàn)互動量和非語言因素影響到受試詞匯知識的豐富性。
四、結(jié)語
影響詞匯測試效度和信度的核心問題是對詞匯能力的定義。對能力的范疇化不僅僅是詞匯量、深度和豐富性,而更應包含詞匯運用,即運用已有知識結(jié)構(gòu)解決新問題,在此基礎上形成詞法化能力。對詞匯能力范疇化同時會影響到結(jié)構(gòu)效度對應試者能力評級區(qū)分度,結(jié)構(gòu)效度本身也受任務設置類型的影響。傳統(tǒng)語法判斷題在測試詞匯廣度上占有優(yōu)勢,但在測試詞匯深度上囿于單一選項設置易出現(xiàn)預測效度問題,即測試出能力反映不出真實水平。在信度不受影響前提下,通過引入R語言進行殘差分析以改進測試工具內(nèi)容效度。針對書面語和口語的測試往往存在信度問題,其任務設置易受到應試者背景知識影響,一旦設置內(nèi)容與話題知識相關,易引起反撥效應產(chǎn)生測量誤差。通過語言建架構(gòu)筑能力評級指標可以改進由測量誤差引起的信度失衡,在不影響內(nèi)容效度的前提下控制引發(fā)手段使受試者克服由于話題相關所帶來的遷移效應,通過提高預測效度來提升測試信度。
參考文獻:
[1]Bachman,L.F.& A.S.Palmer Language Testing in Practice [M]. Shanghai: Shanghai Foreign Language Education Press,1996/2003:44-47
[2]Bachman,L.F.Fundamental Considerations in Language Testing [M]. Shanghai: Shanghai Foreign Language Education Press,1997/2004:127-130
[3]Beeckmans,R.et al Examining the Yes/No vocabulary test: some methodological issues in theory and practice[J].Language Testing,2001,18:235-274
[4]Beglar,D.A Rasch-based validation of the Vocabulary Size Test[J].Language Testing,2010,27:101-118
[5]Crossley,S.A.,T.Salsbury & D.S.McNamara Predicting the proficiency level of language learners using lexical indices[J].Language Testing,2012,29:243-263
[6]Crossley,S.A.,T.Salsbury,D.S.McNamara & S. Jarvis Predicting lexical proficiency in language learner texts using computational indices[J],Language Testing,2011,28:561-580
[7]Fairclough,M.Testing the lexical recognition task with Spanish/English bilinguals in the United States[J].Language Testing,2011,28:273-297
[8]Fitzpatrick & Clenton The challenge of validation:Assessing the performance of a test of productive vocabulary[J].Language Testing,2010,27:537-554
[9]Gu,Y.Q.Vocabulary Learning in a Second Language: Person, Task, Context and Strategies[J/OL].TESL-EJ,2003(2):1-25
[10]Huibregtse,I.,W.Admiraal & P.Meara Scores on a yes-no vocabulary test: correction for guessing and response style[J]. Language Testing,2002,19:227-245
[11]Jarvis,S.Short texts, best-fitting curves and new measures of lexical diversity[J]. Language Testing,2002,19:57-84
[12]Laufer,B.& P.Nation A vocabulary-size test of controlled productive ability[J]. Language Testing,1999,16:33-51
[13]Laufer,B.,C.Elder,K.Hill & P. Congdo Size and strength:do we need both to measure vocabulary knowledge?[J].Language Testing,2004,21:202-226
[14]Malvern,D.& B.Richards Investigating accommodation in language proficiency interviews using a new measure of lexical diversity[J]. Language Testing, 2002, 19: 85-104
[15]Meara,P.& B.Buxton An alternative to multiple choice vocabulary tests[J]. Language Testing,1987,4:142-154
[16]Mochida,K.& M. Harrington The Yes/No test as a measure of receptive vocabulary knowledge[J].Language Testing,2006,23:73-98
[17]Nation,I.S.P.Teaching and Learning Vocabulary[M]. Beijing: Foreign Language Teaching and Research Press,1990/2003
[18]Nation,P.Using dictionaries to estimate vocabulary size:essential,but rarely followed, procedures[J].Language Testing,1993,10:27-40
[19]O'Loughlin,K.Lexical density in candidate output on direct and semi-direct versions of an oral proficiency test[J].Language Testing,1995,12:217-237
[20]Pellicer-Sánchez,A.& N.Schmitt Scoring Yes–No vocabulary tests: Reaction time vs. nonword approaches[J].Language Testing,2012,29:489-509
[21]Perkins,K.& S.E.Linnville A construct definition study of a standardized ESL vocabulary test[J].Language Testing,1987,4:125-141
[22]Qian,David,D.& M.Schedl Evaluation of an in-depth vocabulary knowledge measure for assessing reading performance[J]. Language Testing, 2004, 21: 28-52
[23]Read,J.& C.A.Chapelle A framework for second language vocabulary assessment[J]. Language Testing,2001,18:1-32
[24]Read,J.The development of a new measure of L2 vocabulary knowledge[J]. Language Testing,1993,10:355-371
[25]Schmitt,N.The relationship between TOEFL vocabulary items and meaning, association, collocation and word-class knowledge[J].Language Testing,1999,16:189-216
[26]Schmitt,N.,D.Schmitt,& C.Clapham Developing and exploring the behaviour of two new versions of the Vocabulary Levels Test[J]. Language Testing, 2001, 18: 55-88
[27]Schmitt,N.,J.Wun Ching Ng, & J. Garras The Word Associates Format: Validation evidence[J].Language Testing,2011,28:105-126
[28]Schoonen,R.& M. Verhallen The assessment of deep word knowledge in young first and second language learners[J]. Language Testing,2008,25:211-236
[29]Shiotsu,T.& C.J.Weir The relative significance of syntactic knowledge and vocabulary breadth in the prediction of reading comprehension test performance[J]. Language Testing, 2007,24:99-128
[30]Yamada,K.Lexical patterns in L2 textual gist identification assessment[J].Language Testing, 2009,26:101-122
[31]戴曼純,論第二語言詞匯習得研究[J].外語教學與研究,2000(2):138-144
[32]劉潤清、韓寶成,語言測試和它的方法(修訂版)[M].北京:外語教學與研究出版社,1999
作者簡介:
方昊 (1981-),男,安徽省安慶市人,碩士研究生學歷,就職于安慶師范大學外國語學院,講師,研究方向為二語習得,語法和詞匯教學。