(浙江工業(yè)大學 外國語學院,浙江 杭州 310023)
長期以來,語言測試工作者研究的核心是如何提高測試的信度與效度,以客觀、精確地測量考生的語言能力。二十世紀七十年代中期,國際語言教學界興起了一場轟轟烈烈的交際語言教學運動,學界提出了“語言交際能力”(communicative competence)和“交際語言能力”(communicative language ability)培養(yǎng)的新理念。受其影響,以做事測試(performance test)為主的交際語言測試(communicative language testing)逐漸推行。同時,隨著批判語言測試(Critical Language Testing)的興起,測試的社會維度日益受到關(guān)注,語言水平的構(gòu)念也隨之發(fā)生了變化。研究的范式開始從單一的心理測量實證研究擴展到更廣泛的定量與定性相結(jié)合的綜合研究,對于信度和效度的理解也上升到了新的高度。Messick(1989)在統(tǒng)一效度理論模式中引入了測試的社會性概念,提出:(1)測試設計者語言能力的構(gòu)念以及在實施測量過程中的某些方面的側(cè)重會反映其社會文化價值;(2)考試在特定的社會環(huán)境中發(fā)生并對結(jié)果使用的教育和社會環(huán)境產(chǎn)生影響[1]。繼Messick后,Bachman(1990)基于Canale and Swain(1980)[注]①Canale ,Swain對“交際語言能力”的研究資料參見:Canale ,M. and Swain,M. Theoretical bases of communicative approaches to second language teaching and testing[J].Applied Linguistics, 1980,(1):1-47.、Canale(1983)[注]②Canale對“交際語言能力”的研究資料參見:Canale,M. From communicative competence to communicative panguage pedagogy[A]. J.C.Richards & R.W. Schmidt.Language and communication[C].London: Longman Press,1983.2-27.以及Hymes(1972)[注]③Hymes對“交際語言能力”的研究資料參見:Hymes,D.H. On Communicative Competence[A]. J.B.Pride & J.Holmes.Sociolingistics. armondsworth[C].UK:Penguin Press, 1972.269-293.對“交際語言能力”的闡述,構(gòu)建了二語語言交際能力模式,將“社會語言適切性”(sociolinguistic appropriateness)納入二語交際語言能力的一個組成部分[2]。2006年,McNamara和Roever全面系統(tǒng)地從語言測試理論和實踐論述述語言測試的社會性,具體闡述了測試公平性、分數(shù)的使用以及語言測試在社會中的用途等,以口語能力測試和語用能力測試為例討論了語言能力的社會維度及其測量,強調(diào)語言能力包括語用能力,語言在交際中的使用受情景因素影響, 進一步明確定了語言能力社會維度的定義和范疇[3]。McNamara和Roever的著作問世將語言測試的社會維度研究推向了高潮。
從此,做事測試社會維度的研究成為了熱點。
口語測試為做事測試的一種,形式多樣,主要為半直接(考生根據(jù)要求錄音、考官根據(jù)錄音評分)、直接(面試)兩種。目前最常見的是面試:一名考官面對一名考生的一對一形式、兩名考官面對兩名考生的配對形式(paired format)或兩名考官面對兩名以上考生的小組形式(group format)。配對(組)口語測試中兩名考官承擔不同的任務:一名考官按照考試要求向考生提問、引導考生完成考試任務并對照口試評分量表對考生的各項口語能力進行評估,另一名考官不參與提問,主要任務是充當評分員,對照口試評分量表評估考生的各項口語能力。國際知名的大型英語水平測試中雅思(IELTS)口語測試采用一對一形式,劍橋第一證書(FCE) 采用配對形式,我國的大學英語四、六級口試(CET-SET)采用的是配對延伸形式。近年來,受二語習得理論發(fā)展以及課堂教學實踐理論影響,配對(組)口試作為測試語言交際能力的最直接形式越來越被廣泛采用。
社會學家Goffman (1964)認為面對面的口頭交際具有鮮明的社會性,它遵循一定的規(guī)律、有內(nèi)在的社會文化法則,規(guī)律和法則通過語言作為載體來體現(xiàn)[4]。面對面互動中交際雙方通過共同承擔責任、協(xié)同構(gòu)建交際秩序、完成交際任務。由此,互動交際中的話語及其產(chǎn)生的效應并非預先設定、更不是某一方單獨的貢獻?;又幸饬x的構(gòu)建并非僅僅取決于對話者的努力,聽者的配合和貢獻同等重要。配對(組)口語測試屬互動交際范疇,是考官和考生、考生和考生之間面對面互動的一種測試形式,融入了非考試狀態(tài)下對話交際的元素,被認為是考生展示真實交際事件中的不同交際能力的考試[5]。毫無疑問,配對(組)口語測試具有雙向互動(interaction)的特性。因此,考試過程中主體的互動具有社會/行為學的意義即個體之間的共同行為構(gòu)成共同表現(xiàn)的基礎[6]??脊倥c考生、考生與考生之間的各方面表現(xiàn)相互影響,期間有諸多因素對考生的行為和表現(xiàn)起作用。換句話說,這種特定情景下的口試具有較強的社會性,考生不再是一個個孤立的個體,考試過程中的交際參與者已構(gòu)成了“一個社會的世界”,被試所得的考試分數(shù)并非就是其個人語言能力的反映,而是交際互動者共同構(gòu)建的語言能力反映。對這類考試成績的解釋顯然就是對一種社會行動的解釋。已有研究表明,考生的性別、性格、母語背景、考生之間的熟悉程度、對話者語言水平等均為影響因素。
口語測試的目的主要是測試考生運用某種語言進行口頭交際的能力。鑒于面對面的口頭交際帶有的鮮明社會屬性和配對口試的社會性,傳統(tǒng)的以語法、詞匯等語言使用準確性為主的語言水平構(gòu)念已無法全面反映個體語言交際的真實能力。同樣,基于傳統(tǒng)語言水平構(gòu)念的評分標準難以體現(xiàn)考生成功從事口語交際的水平。配對(組)口語測試中考生的語言水平構(gòu)念必須包括語用能力和社會語言文化能力。為提高考試的信度和效度,保證分數(shù)的詮釋性,語言測試工作者必須重視將考試作為一種社會行動研究,運用微觀分析方法,深入分析“互動交際”的本質(zhì),從不同的但又互補的視角詮釋考生最后所得分數(shù)的意義[6],從而完善考試設計的構(gòu)念、為教學提供正面的反撥。
傳統(tǒng)的語言測試效度研究側(cè)重考試結(jié)果的分析,主要范式是基于心理測量的實證研究。研究者通常運用先進的統(tǒng)計學方法如多層面Rasch模型、概化理論、結(jié)構(gòu)方程模型等來研究語言測試的信度和效度。20世紀后半葉,受二語習得研究交際能力培養(yǎng)的轉(zhuǎn)向的影響,語言能力的構(gòu)念開始變化,交際語言測試開始興起。隨后,受批判語言學和社會語言學影響,批判語言測試研究推行。語言測試學領(lǐng)域開始關(guān)注測試過程的研究,測試社會維度研究得到重視。因受后現(xiàn)代主義批判理論研究范式的影響,語言測試研究方法開始轉(zhuǎn)變,定性研究方法或定量與定性結(jié)合的混合方法逐漸被采用。
配對口試過程研究主要采用社會學的定性研究方法——會話分析。會話分析源于民族方法學,它既是民族方法學的繼承又是對民族方法論在專業(yè)方向的拓展和延伸,是一種精致地、經(jīng)驗性地、形式化地描述社會行為之細節(jié)的自然的觀察學科[7]。會話分析學反對通過假想的例證研究人們言語行為的規(guī)則,反對社會學常用的訪談、問卷調(diào)查、人種志法等研究,批評心理學領(lǐng)域理論先導的試驗方法。會話分析學追求建立自然、可觀察的社會(科)學,認為社會科學的對象應該是可觀察的行為。會話分析的研究目的是明確說明交際者創(chuàng)造社會有序性的方式和方法。Heritage (1984)認為Sacks的會話分析研究基于以下三個假設[8]:(1)人們的日常交際會話是有組織的,并非雜亂無章、無章可循。(2)交際行為是以語境為導向的。一方面語境制約人們的交際行為,話語是順應語境的產(chǎn)物;另一方面,任何話語都能構(gòu)建、影響和制約語境。(3)以上兩個特點存在于交際的細節(jié)中,研究者在分析話語時不能放棄任何細節(jié)。話語并不僅適用于日常會話研究,它對于交往中的談話(talk-in-interaction)序列組織的關(guān)注也適用于日常會話之外的其他交際方式或語體[7]。
CET-SET為配對(組)口語測試,以面對面的口語交際形式呈現(xiàn)。盡管因眾多因素如考試的高風險、考試環(huán)境等的交互作用,這種交際形式不能完全等同于自然會話,但仍然在Goffman(1983)所謂的交際秩序(interaction order)下進行。因此這種交際秩序具有分析性,“其可取的分析方法便是微觀分析”[9]。應用語言學界的知名學者已通過研究發(fā)現(xiàn)會話分析對于檢驗測試效度的必要性和重要性: Shohamy 認為會話分析應是研究口語測試中互動本質(zhì)的工具[10],F(xiàn)ulcher通過實踐證明口試的構(gòu)念效度可以通過話語分析來驗證[11]。van Lier 在研究中發(fā)現(xiàn)口語交際過程錯綜復雜,要考察語言學習者的口語交際表現(xiàn)必須從對話交際研究的過程著手,用微觀分析的方法探索口語互動過程中產(chǎn)生的話語本質(zhì)[12]。Lazaraton在博士論文中率先運用會話分析開展口試效度研究,獲得了豐富的定量分析無法檢測到的效度證據(jù)[13]。近十年來,除信度仍主要采用先進的統(tǒng)計學方法研究外,配對(組)口試效度相關(guān)研究轉(zhuǎn)向以定性和定量相結(jié)合或以定性方法開展,話語分析成為收集效度證據(jù)的有效方法。借鑒民族方法學的社會學研究方法,研究者首先將考試過程完整地錄音錄像,依據(jù)國際學術(shù)界公認的轉(zhuǎn)寫系統(tǒng)將口試參與者(考官、考生等)的會話完整地轉(zhuǎn)寫成文字,通過逐輪的(turn-by-turn)會話分析,探索會話互動中影響話語產(chǎn)出和口試成績的因素。十余年的研究表明,會話分析測試過程效果良好、啟發(fā)深刻。通過會話分析,我們才有可能辨析交際者(尤指考生)通過語言運用(performance)展示自己的語言能力(competence)、剖析交際者之間受互動情景影響共建語言能力的過程。分析所得到的大量信息和證據(jù)彌補心理測量的缺陷,是可信的效度檢驗方法[14]。
口語測試反映的是考生和考官共同構(gòu)建的語言能力(joint construction of performance),這一特點對于口語測試效度極具挑戰(zhàn)性。而研究測試環(huán)境下的交互交際社會特征對口語測試效度不失為一個有力的理論支撐。由多個直接參與者的口試交互交際看似微觀但蘊藏著多個宏觀社會學相關(guān)范疇的問題。最近十幾年中,國內(nèi)外學者已開展了針對配對口試的效度研究(Davis[注]①Davis,L. The influence of partner proficiency in a paired oral assessment[D]. St Paul: America University of Minnesota,2007.28.,2007;Davis[注]②Davis, L. The influence of interlocutor proficiency in a paired oral assessment[J]. Language Testing,2009,(26):367-396.,2009;Lazaraton[注]③④⑤Lazaraton,A. A qualitative approach to monitoring examiner conduct in CASE[M]. Cmabridge: Cambridge University Press,1996.18-33. Lazaraton, A. Interlocutor support in oral proficiency interviews: The case of CASE[J]. Language Testing, 1996,(13):151-172.Lazaraton,A. A qualitative approach to the validation of oral language tests[M].Cambridge: Cambridge University Press,2002.1-6.,2008)。 主要的效度研究尤其是關(guān)于考試社會性相關(guān)的效度研究有如下幾個方面:
1.構(gòu)念效度研究。構(gòu)念效度指的是測試中的表現(xiàn)與基于能力或構(gòu)念理論所作出的預測之間的一致性(Bachman, 1990)。研究構(gòu)念效度主要是驗證測試能夠測量到理論上的構(gòu)想或特質(zhì)的程度。因口語測試的特性,國內(nèi)外大規(guī)模口語測試包括配對(組)口語測試、口語面試等在考試設計構(gòu)念中都會包含語用能力和社會語言文化能力等要素,但迄今為止僅有少數(shù)相關(guān)的實證研究構(gòu)念在任務和考生考試表現(xiàn)中的實現(xiàn)情況。換言之,任務(即測試的題型、每個題型下的題目、考試設計的活動等)是否能使考生展示構(gòu)念預設的能力、考試過程中考生的表現(xiàn)是否與考試設計者的意圖吻合缺乏研究。就配對口測試而言,國內(nèi)外共有兩個典型的構(gòu)念效度實證研究。He & Dai(2006)基于17 萬字的大學英語四、六級口語測試語料庫,運用定量和定性相(會話分析)結(jié)合方法分析小組討論活動中考生運用交互語言功能的情況。通過對48個小組討論的分析,發(fā)現(xiàn)考生之間交互性較低, 考試大綱中列出的諸如支持或挑戰(zhàn)對方觀點、修改、勸說、繼續(xù)交談、意義協(xié)商等交互語言功能運用頻率低,有的甚至為0。該研究表明了大學英語四、六級口語測試小組活動中交互語言功能構(gòu)念的不充分代表性(construct underrepresentation)[15]。Galaczi(2013)針對劍橋口語測試中的考生間互動交際任務部分進行了研究[16]。她主要通過定量和定性(會話分析)混合方法研究不同英語水平考生在劍橋英語配對口試中表現(xiàn)的互動交際能力(interactional competence),發(fā)現(xiàn)實際考試中考生表現(xiàn)出的互動交際能力超過評分標準中描述的范疇,證明已有評分標準互動交際能力描述不夠充分。Galaczi提出:互動交際能力是個廣義的概念,它包括話輪內(nèi)部和話輪之間的主題發(fā)展(topic development),比如發(fā)起主題、回應等,也包括話輪轉(zhuǎn)換策略和積極聆聽(active listening) 。 Galaczi的研究結(jié)論是:無論在課堂教學中還是在考試設計中,我們對互動交際能力的理解不能僅限于一些互動交際特征層面,還應將會話聆聽者的支持策略(listener support strategies)、話輪轉(zhuǎn)換策略等等納入互動交際能力范疇 。
2.對話者效應研究?!皩υ捳咝笔强谡Z測試的研究焦點之一。因配對(組)口試中考官參與互動的頻率極低,對話者效應研究主要圍繞考生進行。在互動交際責任共同承擔 、意義共同構(gòu)建的配對(組)口語測試中,對話者(即配對考生)的語言水平、互動交際能力、性別、年齡、性格等都是影響考生表現(xiàn)的因素??忌g的交互具有雙向互動特性(McNamara,1997),考試使用者較難從考分中推斷個體考生的口語水平,考試分數(shù)其實是交互者共同構(gòu)建的結(jié)果。同輩考生交互效應隨之成為研究該口試效度的焦點。
不同背景和身份的考生配對或配組共同完成口語測試任務時,其口語水平表現(xiàn)方式、方法和程度會相互影響[14],已有會話分析研究發(fā)現(xiàn):不同語言水平考生配對后,水平高的考生控制整個交互過程而水平低的幾乎無法平等地進行交際[17];配對考生之間的熟悉度影響考生句子結(jié)構(gòu)、詞匯的使用與選擇[18],當考生與朋友配對時,語言精確度、所得的分數(shù)明顯高于其與陌生人配對時[19]。劍橋第一證書口試錄音(像)資料分析顯示:配對考生之間互動交際采用的話語策略以及交互的總體模式與其口語考試“互動交際(IC)”部分的得分密切相關(guān):對話雙方自始至終非常配合的小組IC中位數(shù)分別為4.5/5和4.25/5;而對話雙方缺乏交互、以各自陳述為主的小組獲得的IC中位數(shù)較低,分別只有3. 45/5[20]。Berry(2004)研究考生外向程度對考試成績的影響,協(xié)方差計算(ANCOVA)發(fā)現(xiàn):外向(n=78)和內(nèi)向性格的(n=85)受試與平均外向程度高的配組時口試分數(shù)較高,而內(nèi)向型受試與平均外向度低的配組后口試分數(shù)比預期差(Ockey,2009)。 Ockey(2009)運用綜合人格調(diào)查問卷和周密的配組方法,考察日本225名英語專業(yè)學生性格特征與口試分數(shù)的關(guān)系,發(fā)現(xiàn):自信考生的口試分數(shù)受其組員的自信程度影響,而自卑考生口試分數(shù)與其組員自信程度無關(guān)[21]。樓荷英(2013)對大規(guī)??谡Z測試小組討論活動中考生的表現(xiàn)進行了深入研究,發(fā)現(xiàn)在配組口試的環(huán)境下,考生的性格與其互動能力表現(xiàn)無關(guān)。此外,也有零星的研究表明考生的焦慮程度、學習背景等特點對考試表現(xiàn)有一定影響[22]。
為數(shù)不多的配對(組)口語測試對話者效應研究中最值得一提的是Lazaraton and Davis開展的研究[23]。他們認為考生通常將多種身份帶入開始中,而這些身份隨環(huán)境的變化而變化。研究中Lazaraton and Davis將社會學的身份理論、語言測試的社會性理論為主要理論框架,運用會話分析的微觀視角, 研究分析劍橋ESOL’s FCE和PET配對(組)口語測試中考生定位其“語言水平身份”的過程、驗證真實考試中考生的話語特征與最后得分的關(guān)系。Lazaraton and Davis從配對(組)口語測試的社會視角出發(fā),將考生的語言水平確定為一種社會身份,通過轉(zhuǎn)寫口試錄像材料、分析每組對話中考生的交互過程,考察考生所帶入的身份在互動交際過程中是否變化、如何變化、考生是否“共同構(gòu)建”語言水平等,最后對照考生已得的口試分數(shù)與會話分析發(fā)現(xiàn)的“擬合度”。該研究最后得出的結(jié)論是:考生的語言水平隨著配對對象的語言水平及其在互動中的發(fā)揮和激活程度而動態(tài)變化。在配對(組)口語測試環(huán)境下,考生的語言水平身份通過配對互動交際展演、認同、重新構(gòu)建,身份定位過程可以通過會話分析全面呈現(xiàn),考生的會話特征(discourse features)與其所得的口試分數(shù)緊密相關(guān)。該項研究跨學科且視角新穎,其研究發(fā)現(xiàn)不僅填補語言測試社會維度研究方面的空白從而引起高度關(guān)注,而且會對拓寬今后語言測試界的研究思路產(chǎn)生顯著作用,對促進應用語言學跨學科研究具有深刻的意義。
總體來說,關(guān)于配對(組)口語測試社會性的研究尚在起步階段,已有研究多數(shù)具有樣本小、缺乏代表性等特點,對同一問題的研究結(jié)果各異?;诖笠?guī)??荚嚨臉颖痉治鋈狈?,基于大規(guī)??荚嚇颖厩医沂窘换ミ^程中對話者(interlocutor)的行為與分數(shù)的關(guān)系的研究僅有兩項,并且都是針對同一項考試——劍橋第一證書(FCE)進行[20][23]。在中國,類似研究仍為個位數(shù)。
配對(組)形式不僅在交際語言教學課堂中越來越受歡迎,而且正成為口語測試的主要形式之一。但該形式在國外口語測試中已使用二十多年,其效度研究尤其是實證性研究僅始于二十一世紀初,有許多效度相關(guān)的維度尚無研究報道。隨著配對(組)口試形式越來越多地運用在國內(nèi)外高風險測試中如雅思(IELTS)、劍橋口語證書考試、大學英語四、六級口試、公共英語等級考試(PETS),考試的效度勢必會不斷引起利益相關(guān)者(stakeholder)的高度關(guān)注。而對于此類考試,要盡量保證測試結(jié)果的詮釋性、保證考試的效度,口試社會視角的研究必不可少。
隨著語言測試研究領(lǐng)域范式的多元化和語言測試社會維度研究的進一步深入,研究者將完善建構(gòu)主義研究范式——民族志研究( ethnographic studies) , 并將這種方法與基于后實證主義研究范式的定性研究相結(jié)合。今后,研究者不僅充當一個立場中立的外部觀察者,而是更加貼近研究對象、以一個“局內(nèi)人(insider)的身份開展研究。因此,會話分析將成為分析和揭示口語測試具體過程微觀細節(jié)重要的、必不可少的工具和研究方法。通過精致的會話分析,語言測試研究者挖掘考生互動中的話語特征、獲得實證主義研究難以提供的大量信息,用來檢驗評分的正確性和合理性、收集考生口語能力表現(xiàn)的特征,從而豐富驗證測試效度的證據(jù)。
然而,如上文所述,配對(組)口語測試的社會視角研究仍然處于初始階段,許多只是嘗試性研究。為充分驗證配對(組)口試的效度,完善其考試設計,以下幾個方面將是今后研究的主要方向:(1)基于大樣本、深入研究高風險、大規(guī)??荚囍信鋵?組)口試的社會視角研究。研究的考試將不局限于國際性的英語水平考試,各國具有規(guī)模效應的口語測試都有可能作為研究對象,同時,樣本將不再局限于英語作為外語的日本學生、在歐美留學的中國學生等,將擴大到參加各類考試的受試。我國的大學英語四、六級口語測試、公共英語等級考試因樣本的規(guī)模、考生的英語學習背景、考生英語學習的環(huán)境等方面的特點都將是值得研究的對象。與此同時,研究也將延伸到除英語以外的其他語種口語測試中。(2)配對(組)口試相關(guān)的構(gòu)念研究??谡Z能力的構(gòu)成要素迄今為止眾說紛紜??荚囬_發(fā)和設計時的構(gòu)念差異直接影響評分量表描述,從而影響評分的客觀性和公平性。目前,口語能力構(gòu)念主要基于理論研究,研究表明真實考試過程中考生表現(xiàn)的口語能力與設計構(gòu)念存在明顯差異[15-16]。因此,有必要通過微觀分析語料歸納考生的互動交際特征、影響交際的語境因素,通過大量真實考試語料分析收集口語能力構(gòu)念證據(jù)彌補偏重理論研究形成構(gòu)念的缺陷。(3)考生特質(zhì)如性別、年齡、熟悉程度、性格、母語背景等方面對于考試表現(xiàn)及其最后成績影響將繼續(xù)成為研究的重點。現(xiàn)有研究數(shù)量少、規(guī)模小、結(jié)論迥異,不足以證明考生某個特質(zhì)對考試過程中的表現(xiàn)的真實影響。在已有相關(guān)研究基礎上,擴大研究規(guī)模、拓展研究領(lǐng)域,開展與心理學、社會學等學科的交叉研究將成為必然。
此外,受批判語言測試的進一步影響,口語測試與其他測試一樣,將置于更加廣闊的社會政治語境中,對測試后效(consequences)的反思不再局限于反撥效應(washback),而是重新審視測試中滲透的權(quán)力與控制,測試所具有的社會價值、政治功能等[24]。考試的測試后果、道德和公平性等社會問題也將成為研究的熱點。
參考文獻:
[1] Messick,S.Validity in Educational measurement[M].New York:American Council on Education & Mcmillan,1989 .13-103.
[2] Bachman,L. Fundamental considerations in language testing[M].Oxford:Oxford University Press,1990.81-107.
[3] McNamara,T.& Roever,C. Language testing: The social dimension[J].Language Learning,2006,(2):1-291.
[4] Goffman, E. The neglected situation[J]. American Anthropologist,1964,(66):133-136.
[5] Brown,A. Interviewer variation and the co-construction of speaking proficiency[J]. Language Testing,2003, (1):1-25.
[6] McNamara,T.F. “Interaction” in second language performance assessment: Whose performance?[J].Applied Linguistics,1997,(18):446-465.
[7] 于國棟.會話分析[M].上海:上海外語教育出版社,2008.4,30.
[8] Atkinson, J. M.& Heritage.Structures of social action:Studies in conversation analysis[M]. Cambridge: Cambridge University Press,1984.1-15.
[9] Goffman,E. The interaction order[J].American Sociological reviewing ,1983,(8):1-17.
[10] Shohamy,E. Discourse Analysis and Language Testing[J].Annual Review of Applied Linguistics,1991,(11):115-131.
[11] Fulcher, G.Test of oral performance: The need for data-based criteria[J]. EST Journal,1987,(41):287-291.
[12] van Lier, L. Reeling, Writhing, Drawling, Stretching, and Fainting in Coils:Oral Proficiency Interviews as Conversation[J]. TESOL Quarterly,1989,(23):489-508.
[13] Lazaraton, A. A conversation Analysis of Structure and Interaction in the Language Interview[D]. Los Angeles :University of California at Los Angeles,1991.65-90.
[14] McNamara, T. Discourse and assessment[J].Annual Review of Applied Linguistics,2002,(22): 22-43.
[15] He, L. & Dai, Y.A corpus-based investigation into the validity of the CET-SET group discussion[J]. Language Testing,2006,(3):370-401.
[16] Glaczi, E. Interactional competence across proficiency levels: How do learners manage interaction in paired speaking tests?[J]. Applied Linguistics,2013,(30):1-23.
[17] Iwashita,N. The validity of the paired interview format in oral performance assessment[J].Melbourne Papers of Language Testing,1998,(2):51-65.
[18] Norton, J.The paired format in the Cambridge speaking tests[J]. ELT Journal,2005,(59): 287-297.
[19] O’Sullivan,B. Learner acquaintanceship and oral proficiency test pair-task performance[J].Language Testing, 2002,(19):277-295.
[20] Galaczi,E. Peer-peer interaction in a speaking test: The case of the First Certificate in English examination[J]. Language Assessment Quarterly, 2008,(5):89-119.
[21] Ockey, G. The Effect of Group Members’ Personalities on a Test-taker’s L2 Group Oral Discussion Test Scores[J]. Language Testing ,2009, (2): 161-186.
[22] LOU He-ying. The relationship between test-takers’ personality and their interactional competence——A mixed approach[D]. Hangzhou:Thejiang University,2013.56.
[23] Lazaraton.A. & Davis.L. A Microanalytic Perspective on Discourse, Proficiency, and Identity in Paired Oral Assessment[J].Language assessment Quarterly,2008,(4):313-335.
[24] 何蓮珍,呂洲洋.語言測試研究的新視角:批判語言測試[J].浙江大學學報(社會科學版),2013,(6):164-173.