王麗 王華
(西安外國語大學,西安 710128;上海交通大學,上海 200240)
提 要:專門用途英語有兩個顯著特征:一是強調(diào)學習者有明確的學習目的;二是強調(diào)學習內(nèi)容與特定專業(yè)或?qū)W科相關(guān)。近年來,專門用途英語在我國迎來全新的發(fā)展時期,相關(guān)課程、培訓、測試以及學習人數(shù)都顯著增長。但同時也出現(xiàn)許多問題,如課程目標模糊、課堂教學隨意和評估體系缺失等,突顯出建設(shè)ESP 能力等級量表的重要性和迫切性。本文回顧當今最具國際影響力的量表——歐洲語言共同參考框架(CEFR)的框架結(jié)構(gòu)、開發(fā)方式以及效度研究,著重分析其成就與不足,并基于我國國情與外語教學現(xiàn)狀,探討制定ESP 量表的原則和方法,以期能夠?qū)ξ磥砦覈鳨SP 量表建設(shè)有所啟迪。
專門用途英語(English for Specific Purposes,簡稱ESP)指與某種特定職業(yè)、學科或目的相關(guān)的英語。它有兩個顯著特征:一是強調(diào)學習者有明確的學習目的;二是強調(diào)學習內(nèi)容與特定專業(yè)或?qū)W科有關(guān)。在我國,ESP 教學與研究可以追溯到20世紀70年代末(秦秀白 2003: 79)。近年來,隨著我國與世界其他各國在政治、經(jīng)濟、科技等領(lǐng)域的交往,社會對外語能力的要求愈加呈現(xiàn)出多元化、專業(yè)化的趨勢,ESP 也迎來其蓬勃發(fā)展的時期,成為當前我國高校英語教育改革的熱點。
然而,由于缺乏宏觀的指導政策和質(zhì)量標準,目前我國ESP 教學仍處于無綱可依、無章可循的狀態(tài),存在教學目標模糊、課堂教學隨意、評價體系缺失等問題,嚴重桎梏ESP 的進一步發(fā)展(谷志忠2010:26-27)。為了扭轉(zhuǎn)這一局面,當務(wù)之急就是要制定統(tǒng)一、規(guī)范的ESP 能力等級量表,科學劃分ESP 語言能力等級水平,為ESP 教學、學習和評估提供系統(tǒng)、明晰的能力標準參照和指導。目前,世界上使用范圍最廣泛、相關(guān)研究最豐富的量表是歐洲語言共同參考框架(Common European Framework of Reference,簡稱 CEFR)。自其 2001年面世以來,CEFR 已經(jīng)成為歐洲各國外語教學領(lǐng)域重要的綱領(lǐng)性文件,并在全球語言教育和測試領(lǐng)域發(fā)揮著愈加重要的作用(Figueras 2012:477)。有鑒于此,本文將回顧CEFR 的內(nèi)容構(gòu)架、開發(fā)方式和效度研究,著重分析其優(yōu)勢與不足,探討構(gòu)建我國ESP 能力等級量表的科學原則和方法,以期能夠?qū)ξ磥鞥SP 量表建設(shè)有所啟迪。
CEFR 是在歐洲一體化的背景下,由歐洲理事會組織41 個國家的語言學家歷時十多年研制而成。其本質(zhì)是一個綱領(lǐng)性文件,由9 章構(gòu)成,共二百六十余頁。其中,第1-3 章介紹CEFR 的開發(fā)目的和理念;第4-5 章是CEFR 的核心內(nèi)容,其中列出五十余個細分量表(illustrative scales),從不同維度全面、系統(tǒng)地描述外語學習者的語言能力等級水平;第6-9 章討論CEFR 在語言教學、學習和測試中的應(yīng)用。
表1列出CEFR 的語言能力描述框架、各個參數(shù)級別以及具體的描述指標。其中,從左至右分別是“語言交際能力”“語言交際策略”和“語言交際活動”的描述維度。在這3 個維度下的每一欄中,黑體部分代表一級參數(shù),加下劃線部分代表二級參數(shù),標注星號部分即CEFR 的具體描述指標,每個指標對應(yīng)一項細分量表,這些細分量表是CEFR 的核心內(nèi)容,也是教育界和學術(shù)界的關(guān)注重點。
與早期量表相比,CEFR 描述框架的搭建、描述語等級的劃分以及量表的目標用途等方面都有所突破,極大提升量表的科學性和專業(yè)性,也進一步推動語言能力量表建設(shè)的理論和實踐的發(fā)展,為CEFR 的世界影響力奠定基礎(chǔ)。具體而言,CEFR 的創(chuàng)新之處主要體現(xiàn)在以下3 點:
(1)語言學理論基礎(chǔ)和現(xiàn)實意義
在搭建描述語框架時,CEFR 開發(fā)者回顧大量的語言能力理論,合理界定目標描述能力(即語言交際能力)的構(gòu)念和內(nèi)涵,并在此基礎(chǔ)上構(gòu)建量表描述框架以及框架下設(shè)的能力參數(shù)描述項目和指標,為量表框架的科學性提供理論保障。此外,CEFR 開發(fā)者基于語言教學和社會需求的實際,廣泛調(diào)研外語學習者典型語言學習和使用任務(wù),最終確定三十余種典型語言活動,并將這些活動按照“接收”“交互”和“產(chǎn)出”歸類后一并納入量表框架的描述體系之內(nèi)。
(2)研究方法與技術(shù)路線
CEFR 在描述語采集和等級設(shè)定等方面也有重要突破?;谥庇X的傳統(tǒng)量表開發(fā)方式從起草描述語到描述語排序,往往都是專家主觀判斷的結(jié)果,缺乏最根本的效度證據(jù),因此難以大范圍推廣使用(North 2002:88)。CEFR 的構(gòu)建打破這種自上而下的量表開發(fā)方式,采用專家判斷、定量研究和定性研究相結(jié)合的混合式研究設(shè)計方案。從量表框架的搭建到描述語的采集、改編、撰寫,每個步驟都經(jīng)過嚴密的論證,充分參考專家意見和實證數(shù)據(jù)分析結(jié)果。尤其值得肯定的是,在將描述語量表化的過程中,CEFR 開發(fā)者利用先進統(tǒng)計工具Rasch 模型對每條描述語所對應(yīng)的能力等級和穩(wěn)定性進行分析驗證,篩選出最有效的描述語納入量表框架的各個參數(shù)項目下,不但保障量表等級劃分的專業(yè)性和可推廣性,也開創(chuàng)基于語言能力描述語庫開發(fā)量表的科學技術(shù)路線。
(3)應(yīng)用價值和影響力
量表的類型不同,用途也有所區(qū)別。Alderson(1991:71-86)根據(jù)量表的使用目的將它們分為3 類:1)面向測試開發(fā)者的量表,用于指導測試設(shè)計和開發(fā);2)面向評卷員的量表,用作口語或?qū)懽鞯脑u分標準參照;3)面向使用者的量表,用于幫助測試用戶解讀成績。早期的語言能力量表只具備一種功能,如上世紀50年代的FSI(Foreign Service Institute)就是專為口語評分所開發(fā)的量表。相比之下,CEFR 得益于其扎實的理論基礎(chǔ)和科學的技術(shù)路線,不但突破單一的量表功能限制,更將語言能力量表的概念拓寬為外語教學及評估領(lǐng)域的指導方針和行動綱領(lǐng),并成為歐洲各國制訂教學大綱、規(guī)劃課程、編寫教材、開發(fā)考試等的統(tǒng)一能力參考標準。近年來,歐洲以外的國家和地區(qū)也開始研究和應(yīng)用CEFR,或嘗試將CEFR 引入到本地語言教學體系中,或開展本土化考試和能力標準與CEFR 的對接研究等(如Franz,Teo 2017)。在這一背景下,我國學者也越來越關(guān)注構(gòu)建語言能力量表的重要性和迫切性(Jin et al.2017)。2014年,教育部考試中心啟動“中國英語能力等級量表”項目,歷時3年,已經(jīng)初步研制成功第一個覆蓋我國各教育階段通用英語教學、學習和測評的能力標準。
表1 CEFR 量表框架與能力描述參數(shù)指標
語言量表正式發(fā)布后,在教學、測試和社會應(yīng)用的各相關(guān)領(lǐng)域里,都會產(chǎn)生大量的反饋信息,這些信息就是量表的效度證據(jù)。豐富的效度證據(jù),尤其是負面證據(jù),會對量表的修訂產(chǎn)生巨大影響(朱正才 2016:4)。迄今為止,CEFR 在量表效度研究方面積累了豐富經(jīng)驗(方緒軍楊惠中2017:3)。學者們已經(jīng)針對CEFR 等級劃分和描述語內(nèi)容(Deygers,Gorp 2014)、CEFR 與其它量表或測試的對接(Jones 2002)、基于 CEFR 的教材、語言測試和評分量表開發(fā)(Imig 2013)以及CEFR 在不同語言環(huán)境和專業(yè)領(lǐng)域中的適用性(Franz,Teo 2017)等問題開展多角度的研究。這些研究在充分肯定CEFR 的科學性和實用價值的同時,也報告它的不足之處。這些不足之處主要體現(xiàn)在描述語內(nèi)容、數(shù)據(jù)收集渠道和量表使用這3 個方面,對未來量表建設(shè)具有重要的參考價值。
首先,在描述語內(nèi)容方面,研究者發(fā)現(xiàn)CEFR存在以下問題:(1)部分描述語措辭含糊或過于簡單(Alderson 2007:661);(2)一些描述語并沒有經(jīng)過效度檢驗(Little 2007:648);(3)不同級別描述語之間存在重復現(xiàn)象(Weir 2005:296);(4)部分“質(zhì)”類描述語(語言知識和策略)是基于口語活動撰寫的,不完全適用于其他分技能(劉建達彭川2017:5);(5)跨文化能力與中介能力描述語缺失(North,Docherty 2016:24-33)。為改善這些問題,歐洲理事會于2005年推出基于“劍橋?qū)W習者語料庫”的英語語言描述項目,利用學習者語料庫數(shù)據(jù),提煉出不同等級學習者在使用語言時所呈現(xiàn)出的區(qū)別性語言特征,旨在補充CEFR 中對于語言要素(包括詞匯、語法等)的能力等級描述(Saville,Hawkey 2010:1-14)。針對“中介”(mediation)的描述語開發(fā)工作也于2013年啟動,通過擴充CEFR 的描述語庫,進一步提升量表效度(North,Panthier 2016:16-24)。
其次,在CEFR 的實證開發(fā)階段,只有語言教師這一單一群體參與對描述語質(zhì)量和難度等級的判斷,缺乏來自外語學習者等其它量表利益群體的數(shù)據(jù),因此該框架中的能力等級所反映的也許只是教師的主觀態(tài)度而非學習者的真實語言情況(Hulstijn 2007:666)。此外,CEFR 源描述語庫中包含許多與“工作”領(lǐng)域外語使用能力相關(guān)的描述語(work-related descriptors)(如“參加正式會議”“做報告”等),但是這些描述語均在Rasch 分析結(jié)果中被認定為不擬合項,從而未能出現(xiàn)在量表的最終版本之中(Council of Europe 2001:219-220)。CEFR 開發(fā)者對此的解釋是:參與量表開發(fā)的語言教師對非通用英語領(lǐng)域的外語使用情況缺乏了解,因此對同一條描述語的難度判斷差異過大(同上:220),這一結(jié)果充分說明數(shù)據(jù)來源的多樣性和代表性在實證開發(fā)量表過程中的重要意義。
最后,如何合理使用CEFR 也是學術(shù)界爭論的焦點。隨著CEFR 國際認可度的不斷提高,越來越多的考試機構(gòu)(如劍橋大學考試中心、美國教育考試服務(wù)中心等)爭相與CEFR 建立對接關(guān)系,許多ESP 測試(如劍橋商務(wù)英語考試、托業(yè)考試等)也因此在CEFR 的描述標準下來尋求統(tǒng)一的分數(shù)解釋和能力鑒定(Khalifa,Ffrench 2009:10-14)。然而,CEFR 對語言交際能力、語言交際策略和語言交際活動的描述都扎根于通用英語(English for General Purposes,簡稱 EGP)使用場合,用來充當ESP 能力標準明顯缺乏針對性。
從上文可以看出,CEFR 以描述EGP 能力為主,且源于歐洲語言教學與評估環(huán)境,因此并不是一個放之四海皆準的綱領(lǐng)。構(gòu)建科學的ESP 量表應(yīng)立足于我國ESP 教育現(xiàn)狀以及未來發(fā)展需要,參照先進ESP 教學、學習和測試理論,同時有選擇地借鑒CEFR 經(jīng)驗。具體而言,建設(shè)有中國特色的ESP 量表應(yīng)遵循以下原則和方法。
CEFR 的成功離不開其深厚的理論基礎(chǔ)。ESP 量表建設(shè)也應(yīng)以ESP 能力理論模型為基礎(chǔ),充分挖掘ESP 能力模型下各個維度的內(nèi)涵、外延和它們之間的關(guān)系,確定在建量表中“目標語言能力”(即ESP 語言能力)的構(gòu)念,從而形成相對完整、全面和細致的 ESP 能力描述參數(shù)體系。ESP 是一門相對年輕的學科,目前只有Douglas 從語言測試的角度界定 ESP 語言能力(Douglas 2000:35)。Douglas 認為,語言能力本身只是實現(xiàn)ESP 交際目的的必要條件,而非充分條件,因此ESP 能力既應(yīng)包含語言因素,還應(yīng)包含非語言因素。基于這一理念,Douglas 提出ESP 能力模型,包括“語言知識”(language knowledge)、“策略能力”(strategic competence)和“背景知識”(background knowledge)3 個維度(同上)。Douglas 尤其強調(diào),與專業(yè)相關(guān)的背景知識是決定語言使用者能否順利完成ESP 語言交際任務(wù)的關(guān)鍵因素,必須在ESP 測評體系中予以體現(xiàn),這樣才能保證測試的真實性和有效性,以及測試結(jié)果在目標語言使用環(huán)境下的可推廣性。須要注意的是,由于非語言類能力描述指標(如策略能力、背景知識等)鮮少出現(xiàn)在現(xiàn)有語言能力量表中且內(nèi)容極其廣泛,因此在確定非語言類描述指標時,須要首先對理論模型中的各個維度進行抽樣,全面考慮描述維度的可操作性(朱正才2015:12)。在抽樣的過程中應(yīng)著重思考以下3 個問題:(1)哪些非語言維度是重要且能夠被分級描述的;(2)各個維度的能力描述應(yīng)精細到什么程度;(3)語言能力和非語言能力的描述指標比例如何分配。
此外,ESP 與EGP 在詞匯、句法、篇章結(jié)構(gòu)等方面既存在顯著差異,又有大量重合,因此,在確定ESP 量表中“語言知識”和“策略能力”等語言能力維度下設(shè)的描述參數(shù)與指標時,應(yīng)充分參考現(xiàn)代語言能力理論模型,詳略得當?shù)伢w現(xiàn)出EGP 和ESP的語言使用共性,同時突出ESP 語言使用特點。一個簡便易行的方法是沿用依據(jù)先進語言能力理論模型所構(gòu)建的EGP 量表框架(如立足于我國國情最新開發(fā)出來的“中國英語能力量表”),采納該量表中語言類的描述參數(shù)和指標(如詞匯、語法等),但是在縱向的等級描述語層面突出ESP 區(qū)別于EGP 的語言使用特點。這樣開發(fā)出來的量表既能體現(xiàn)ESP 語言能力等級的特性,亦有助于實現(xiàn)EGP 和ESP 教學的對接和溝通,避免二者之間的重復或脫節(jié),進一步提升我國各類型英語教學、學習和測評的效率。
一個富有指導意義的量表應(yīng)當是多層次、立體的,這樣才能為語言學習、教學和評估提供有效參照(North 2000:28)。CEFR 不僅從詞匯、語法、語篇等方面描述語言能力等級特征,還對諸如“能夠看懂外語說明書”“能夠聽懂外語電視或電影”等三十余種與語言學習者息息相關(guān)的典型語言活動和教學活動進行分級描述,顯著提升CEFR 的實用價值。ESP 的宗旨是滿足專業(yè)領(lǐng)域?qū)W習者的特殊語言需要,ESP 量表更應(yīng)以具體應(yīng)用為導向,因此ESP 框架不僅需要涵蓋基于理論模型所提煉出來的參數(shù)體系指標,還應(yīng)納入典型ESP 語言活動描述指標。
ESP 量表中的典型語言活動應(yīng)具有較高的實用性、能夠被分級描述,且具有良好的可推廣性。確定這些語言活動的一個重要方法就是開展需求分析。在進行需求分析時,可以采用多種研究方法,如問卷調(diào)查、訪談、觀察、文本分析以及文獻調(diào)查等(Serafini et al.2015:12-21);數(shù)據(jù)來源也應(yīng)盡量多樣化,充分涉及ESP 學習者、教師、行業(yè)專家、從業(yè)者、已出版或未出版的文獻(如涉外企業(yè)招聘廣告或企業(yè)對從業(yè)人員的外語能力要求)等。須要注意的是,來自多種渠道的信息可能相互矛盾,如語言教師和行業(yè)專家的理念之間有時存在較大差異(Manias,McNamara 2016:235-249)。出現(xiàn)這種情況時,可以采用三角核查法來確定最終的活動類型(Long 2005:19-79)。
此外,ESP 交際活動往往是不可窮盡的,這是因為每項語言活動都能夠以專業(yè)、體裁等為單位衍生出一系列亞活動。例如,“撰寫報告”這一活動可以被分為“撰寫商務(wù)報告”“撰寫法律報告”等,而“撰寫商務(wù)報告”又可以進一步被細分為“撰寫年度報告”“撰寫可行性分析報告”等。如果將所有的細分活動都納入到量表的描述范圍之中,那么整個量表評測體系將會不堪其繁;但反過來如果ESP 量表中的語言活動過于籠統(tǒng),又會降低量表的實際指導價值。因此,有必要在搭建框架時就考慮如何平衡量表的細化程度和可操作性,并在量表開發(fā)過程中根據(jù)實際情況不斷調(diào)整修正。
ESP 目標明確、實用性強,故種類繁多。根據(jù)不同使用目的,ESP 可以被劃分為學術(shù)用途英語和職業(yè)用途英語(Robinson 1991:2)兩大類。前者強調(diào)在學術(shù)環(huán)境中的英語使用能力,如能夠聽懂英語講座、撰寫英語學術(shù)論文等。后者強調(diào)在工作中的英語使用能力,如能夠用英語進行商務(wù)談判、新聞采訪等。根據(jù)學科門類差異,ESP 還可以被劃分為科技英語、商務(wù)英語、法律英語、醫(yī)學英語等。ESP 使用目的和學科門類之間的交叉與融合往往又演化出新的ESP 分支,如職業(yè)商務(wù)英語、學術(shù)醫(yī)學英語等,不斷拓展ESP 的內(nèi)涵和外延(Belcher 2009:6)。
ESP 發(fā)展初期,曾有學者提出“語言共核”理論,認為“在不同學科中使用的語言具有共同的推理和解釋過程,存在一種既有科學性但又不屬于任何專門學科的語言共核”(Hutchinson,Waters 1987:13)。“語言共核論”持有者認為:在ESP 教學中,應(yīng)打破ESP 專業(yè)學科界限,只講授ESP 交際的一般規(guī)則和通用技巧。但是,隨著ESP 的逐步發(fā)展和大量實證研究的開展,人們發(fā)現(xiàn)不同學科在詞匯、句法、篇章結(jié)構(gòu)、體裁特征等方面均存在顯著差異,即使是報告、講座等常見的ESP 體裁在不同學科環(huán)境下也呈現(xiàn)出迥異的語言特征(Hyland 2013:95-113)。除了表層的語言差異,各個學科專業(yè)領(lǐng)域的典型活動也有很大差別。例如,在職業(yè)領(lǐng)域,典型的商務(wù)英語活動包括:能夠撰寫商務(wù)郵件,能夠進行商務(wù)談判等;而典型的醫(yī)學英語活動則包括:能夠詢問病情、能夠參與醫(yī)學會診等。同樣,每個專業(yè)對聽、說、讀、寫等技能的掌握程度也不同,有的專業(yè)更強調(diào)聽說能力,如旅游、航空等,有的專業(yè)則更強調(diào)書面表達能力,如物理、生物等。
由此可見,與編制統(tǒng)一的ESP 量表相比,以學科為基本單位來編制ESP 量表(如商務(wù)英語量表、醫(yī)學英語量表、法律英語量表等)更具有科學性,只有當量表內(nèi)容緊密依托于目標語言使用域時,才能避免過度同質(zhì)化現(xiàn)象,保證其等級描述的相關(guān)性和專業(yè)性,為ESP 學習者提供詳細且有實際意義的能力標準參照。
描述語是語言能力量表最核心的內(nèi)容,決定不同語言能力等級水平的意義(North 2000:29-35)。CEFR 開發(fā)經(jīng)驗告訴我們,量表的開發(fā)過程中會淘汰掉大量的初始描述語,從而導致某些級別描述語缺失。因此,在編制ESP 量表時,收集足夠多、能區(qū)別不同能力等級水平且關(guān)鍵特征明顯的ESP 描述語極其重要。事實上,構(gòu)建描述語庫是ESP 量表開發(fā)者面臨的最艱巨挑戰(zhàn)之一,這是因為目前國際上較有影響力的語言能力量表(如CEFR,CLB,ILSPR,ALTE 量表等)均以在英語為母語或英語為第二語言的環(huán)境中學習、工作的人群為描述對象,許多描述語無法直接應(yīng)用于中國以英語為外語的學習環(huán)境。此外,現(xiàn)有量表描述內(nèi)容多根植于EGP 教學與測試范疇,鮮少涉及ESP 所特有的語言特征和典型活動。有鑒于此,ESP 量表編制者應(yīng)立足于我國ESP 語言教學與測試現(xiàn)狀,對接國家未來發(fā)展需求,結(jié)合問卷調(diào)查、訪談、語料庫分析等手段,廣泛收集、改編或撰寫描述語。具體而言,建設(shè)ESP 描述語庫可以從以下幾個方面入手:(1)充分回顧國內(nèi)外相關(guān)文獻(如ESP 教學大綱、測試大綱、課程描述、教材、行業(yè)標準等),尋找ESP 能力描述語;(2)采用田野觀察、視頻錄像分析、ESP測試等方式,采集不同能力水平等級ESP 學習者和使用者的語料數(shù)據(jù),開發(fā)能力描述語;(3)以訪談、開放式問卷等方式邀請ESP 教師、測試專家、行業(yè)專家等描述不同等級ESP 語言使用特征或?qū)W習目標,從中提煉能力描述語;(4)利用語料庫技術(shù)分析對應(yīng)不同等級水平的ESP 教材、語料等,尋找等級之間的區(qū)別性特征。
初始描述語收集完成之后,量表開發(fā)者可以借鑒CEFR 的經(jīng)驗,以工作坊的形式組織ESP 教師、語言學家、測試專家、行業(yè)專家等修改、篩選初始描述語,并在必要時撰寫全新描述語。在這一過程中,工作坊參與者須要做到以下4 點:(1)對ESP 能力構(gòu)念有清晰、統(tǒng)一的認識,并能準確理解和把握量表框架中的每個描述指標的內(nèi)涵;(2)將“ESP 學習者或使用者的語言行為表現(xiàn)”作為描述對象,力求每條描述語都具有典型性和代表性,能夠體現(xiàn)我國ESP 學習者或使用者的語言等級特點和學習目標;(3)確保描述語的能力參數(shù)明確且獨立,避免同一條描述語中出現(xiàn)幾種不同的能力參數(shù);(4)統(tǒng)一描述語的表述方式。描述語表述方式可以借鑒中國英語能力量表的做法,采用“能做”描述語,從語言行為(performance)、質(zhì)量標準(criteria)以及外部條件(conditions)這3個方面來界定每一條標準,這樣既有助于保證描述語滿足標準撰寫對“能做什么”和“能做到什么程度”這兩個重要維度的要求(Pearson Standards and Quality Office 2014:1-16),也有助于實現(xiàn)新建ESP 量表與“中國英語能力等級量表”的對接。
描述語庫建成后,需要采集大規(guī)模實證數(shù)據(jù)并利用Rasch 統(tǒng)計工具將描述語量表化,設(shè)置符合實際需求的等級數(shù)量和等級跨距。數(shù)據(jù)收集期間應(yīng)確保抽樣的代表性和隨機性,盡量覆蓋不同地域、不同背景、不同英語水平層次的ESP 學習者和使用者。此外,由于定量分析具有一定的局限性,還需要從描述語文字表述層面檢驗相鄰等級之間是否存在明顯的能力梯度差異且具有邏輯上的連貫性。
“語言能力等級量表只有經(jīng)過效度論證,才能證明其有效性和可操作性”(楊惠中等2015:139)。量表效度是一個復雜、多維度的整體概念,因此效度研究應(yīng)是一個長期的、動態(tài)的過程,需要多渠道積累效度證據(jù)。例如,針對CEFR 開展的效度研究自其面世以來一直延續(xù)至今,既為CEFR 注入新的活力,也推動量表開發(fā)領(lǐng)域理論與實踐的進一步發(fā)展。同樣地,在ESP 量表建設(shè)完成后,也需要對其進行大規(guī)模、多角度的效度驗證研究,并根據(jù)研究結(jié)果修正和完善量表內(nèi)容,這樣才能有效保證量表的先進性和科學性,從而更好地指導ESP 語言教學、學習和評估實踐。
尤其須要注意的是,量表效度研究方法和范式的選擇必須與效度研究目的相匹配(同上)。例如,可以用國際著名商務(wù)英語能力測試——劍橋商務(wù)英語考試(BEC) 作為效標來檢驗商務(wù)英語能力等級量表的效標關(guān)聯(lián)效度;但如果研究對象是這項量表的使用效度,那么就不宜采用BEC 考試作為效標,除非該量表的預期用途包括解釋BEC 考試的成績。此外,效度研究涉及大量的實驗和調(diào)查,因此,需要嚴格把控實驗和調(diào)查的設(shè)計、參與者培訓、材料選擇、數(shù)據(jù)分析等環(huán)節(jié),避免產(chǎn)生無效證據(jù),影響人們對量表質(zhì)量的判斷。
2017年,我國初步研制完成“中國英語能力等級量表”,這是第一個全面覆蓋我國各教育階段教學、學習和測評的能力參照標準。相比之下,我國ESP 教學與評估雖然已經(jīng)迎來蓬勃發(fā)展的時期,但是有針對性的能力標準建設(shè)卻仍然欠缺,導致ESP 教學與評估處于無法可依、無章可循的狀態(tài),已經(jīng)造成大量時間和資源的浪費。可以說,構(gòu)建中國ESP 能力等級量表刻不容緩。
我國ESP 教學和測試規(guī)模龐大,實際情況復雜,ESP 量表開發(fā)可以從局部做起,分階段、分步驟實現(xiàn)制定ESP 量表的最終目標。此外,還應(yīng)配合開展量表宣傳和相關(guān)知識普及工作,如出版量表使用手冊等,幫助使用者正確解讀量表信息,了解其使用方法和適用范圍,引導社會合理預期(金艷 揭薇2017:12)。