羅 琴
(四川外國語大學 英語學院, 重慶 400031)
語料庫(corpus)指以電子形式出現(xiàn)的自然語言文本的集合,是語言研究的數(shù)據(jù)來源[1]。在過去20年里,隨著語料庫語言學的蓬勃發(fā)展,基于語料庫的學術英語寫作研究也得到了突飛猛進的發(fā)展。語料庫為學術英語寫作提供了豐富而真實的語言素材,從而衍生出新的研究維度和方法[2]。近年來,隨著寫作語體的發(fā)展,語料庫工具在寫作中的應用逐漸增多,這對以英語為主體的第二語言學術寫作發(fā)展研究大有裨益。為了厘清最近10年語料庫在學術英語寫作中的應用情況與發(fā)展特點,本文針對這一領域的研究進行了概括、分析和歸納,旨在為今后的相關研究提供借鑒和參考。
為了更好地了解全球范圍內(nèi)語料庫在學術英語寫作中的應用與研究,本文選取了具有權威性的SSCI期刊文獻作為研究對象。首先,在Web of Science引文數(shù)據(jù)庫中以“corpus”和“writing”為詞條、2011-2020為年限進行搜索,檢索到相關 SSCI期刊文獻85篇;排除掉非英語學術寫作相關文獻,得到目標文獻53篇。下文以這53篇SSCI文獻為分析材料,對語料庫在英語學術英語中的應用與研究進行分析、歸納和總結。
從圖1可以看出,隨著時間的推移,該領域的研究呈現(xiàn)波動,但總體研究數(shù)量呈上升趨勢,尤其是2015年之后出現(xiàn)逐年遞增。
圖1 樣本文獻歷年發(fā)展趨勢
從表1的主要語料庫及檢索工具的使用情況所示,使用最多的語料庫為自建學習者語料庫、自建學術論文語料庫、COCA(美國當代英語語料庫)、BAWE(英國學術英語語料庫)以及BNC(英國國家語料庫),使用頻率分別為12次、9次、5次、4次和4次。除此而外,使用頻率略低的語料庫還有MICUSP(密西根高階學生論文語料庫)、ICCI(國際跨語言中介語語料庫)、LOCNESS (魯汶本土英語散文語料庫)等。
表1 主要語料庫及檢索工具的使用情況
檢索工具中,使用最多的是WordSmith、AntConc、Sketch Engine、the Biber Tagger以及the Corua Corpus Tool,使用頻率分別為10次、8次、4次、4次和3次。除此而外,檢索工具還有English Corpora、CLAWS、Lancsbox等。由此可見,語料庫及檢索工具的選擇,根據(jù)研究內(nèi)容和研究需求的不同而呈現(xiàn)多樣化的趨勢,其中自建語料庫成為語料庫選擇的熱點。
本文通過提取目標文獻的關鍵詞,整理出十大高頻關鍵詞(圖2)及其知識圖譜(圖3)。綜合圖2和圖3可以看出,“academic writing”和“English corpus”處于網(wǎng)絡的核心位置。其中語料庫類型中,“l(fā)earner corpus”是學術寫作語料庫研究的一大熱點。其次,從研究方法上看,對比分析法和多維度分析法比較突出。從研究內(nèi)容上看,語料庫學術英語寫作在教學、句法、詞匯和體裁等四個方面研究得到了顯著應用。
圖2 高頻關鍵詞提取
圖3 高頻關鍵詞知識圖譜
1.教學
語料庫盛行之前的外語教學往往是基于教育專家的直覺和經(jīng)驗,其教材編撰并非以真實的語言素材為基礎,脫離語言運用實際[3]。而語料庫為外語寫作教學提供了豐富而真實的語言材料,更有利于教師和學習者對語言進行多維度分析,透過語言表層結構探索其本質(zhì)[4]。
語料庫在學術英語寫作教學中的應用可分為直接使用語料庫和間接使用語料庫兩種形式。在直接使用語料庫的過程中,學習者通過直接使用檢索工具分析和識別重復模式,從而做出自己的概括。研究表明,學習者可以通過語料庫提高對常用詞使用模式的認知,增強學習者的詞匯語法模式和修辭功能意識,有效進行錯誤分析,養(yǎng)成良好的自主學習習慣等,從而提高學術英語寫作水平[5]。
間接使用語料庫的過程中,教師從語料庫檢索工具中提取真實語料作為授課材料以及通過對語料庫的分析研究制定教學計劃,學習者作為語料庫的間接使用者。通過語料庫,教師對詞匯語法特征、體裁特征、錯誤類型、修辭功能等方面進行分析研究,找出其規(guī)律和模式,對調(diào)整教學計劃、制定測試標準、詞匯語法選擇、提高跨文化意識等方面都大有裨益[6]。
從數(shù)量上看,在學術英語寫作教學中間接使用語料庫的研究是直接使用的近兩倍(比例為24:13)。但從近五年的發(fā)展趨勢看,直接在教學中使用語料庫的占比有所提升,也逐漸成為基于語料庫的學術英語寫作研究之熱點。
2.句法
語言是一個復雜的動態(tài)適應系統(tǒng),隨著計算機科技的不斷發(fā)展,Biber Tagger、Coh-Metrix等句法分析工具層出不窮,為基于學術英語寫作語料庫的句法研究提供了極大便利。
近年來對學術英語寫作中句法復雜度的研究為數(shù)不在少數(shù)。例如,Lu借助語料庫討論了句法復雜性與二語寫作質(zhì)量的關系,認為句法復雜性的某些方面可以納入二語寫作質(zhì)量評價的理論框架和評分量表中[7]。Jiang對不同水平的英語學術寫作語料庫中的句法復雜度差異進行研究,發(fā)現(xiàn)某些句法結構的出現(xiàn)頻率與寫作水平相關[8]。
除此之外,對學習者在學術英語寫作中的句法使用進行錯誤分析也獲得了很多學者的青睞。Jiang收集了中國452所高校的英語寫作作為研究對象,對詞匯和句法搭配的頻率、模式、長度、常見錯誤等進行分析,揭示了中國學生學術寫作的趨勢和特點[9]。Reynolds通過使用英漢雙語平行語料庫及句法搭配檢索工具,讓學生對其學術寫作中的動名搭配錯誤進行自我編輯,發(fā)現(xiàn)該方法可以使動名詞搭配的準確率穩(wěn)步提高[10]。
3.詞匯
從近十年的相關文獻來看,基于學術英語寫作語料庫的詞匯研究主要聚焦在詞語搭配、詞語功能等兩個方面。
詞語搭配是學術英語寫作研究和語料庫語言學的一大要點。比如,Liu對比兩個學術英語語料庫中的多詞結構類型,尋找其中的差異[11];Bedmar和Paredes對名詞短語進行研究,提供了學習者語言驅(qū)動的動詞短語結構分類,并強調(diào)其在二語習得研究中的優(yōu)勢[12]。
對學術英語語料庫中詞語功能的研究,近年來逐漸朝著多樣化的方向發(fā)展。Ha和Gao等通過對連接狀語的探究,發(fā)現(xiàn)不同母語的學習者對連接狀語的使用頻率和使用模式上存在較大差異[13-14];Crosthwaite和Jiang從立場特征的角度對英語學術寫作中運用的模糊限制語、助推器、態(tài)度標記語和自我提及語四個方面的言語功能進行分析比較,旨在提高學生的學術寫作意識[15]。
4.體裁
研究者通過對不同學科、領域或?qū)懽魉降膶W術英語寫作進行體裁分類和分析,挖掘其差異,并分析差異出現(xiàn)的原因,以此探究更適宜該學習群體的學習策略。語料庫為體裁分析提供了大量的可靠素材。Chang和Kuo認為,將語料庫分析與體裁分析相結合,可以開發(fā)出既真實又有研究意義的特定學科的教材[16]。Nesi和Sheena對不同領域和學習水平的大學生寫作進行體裁分析,并解釋了如何將分析結果應用于教學研究[6]。Maher和Milligan對16篇碩士論文的導論進行體裁分析,揭示了學生在撰寫本部分研究報告時所使用的典型話語功能[17]。
文獻引用頻率也可在一定程度上反映出研究的來源、熱點和潮流?;诖?,本文統(tǒng)計了目標文獻的引用頻率,并將十大高頻被引文獻列于表2中。
由該表可見,目標文獻中被引用頻率最高的是Laufer和Waldman所著的Verb-noun collocations in second language writing: A corpus analysis of learners' English(被引次數(shù)高達490次)。該文章研究了英語動名詞搭配在學術英語寫作中的運用,并對不同水平的學習者在搭配頻率和正確性上進行了比較。Laufer和Waldman指出,即使是對高水平學習者來說,詞語搭配也是一大難點,因此應把詞語搭配作為寫作教學研究的長期重點。不僅如此,被引排名第二和第三的文獻也均屬于詞匯范疇,為立場語言標記和多詞結構。由此可見,基于語料庫的詞匯研究是英語學術寫作一大熱點。除此之外,排名第四到第八的五篇文獻均與學術寫作教學相關,為教材編寫、錯誤分析以及教學法研究,充分顯示了寫作教學研究的重要性。
綜合上文的分析結果,可以總結出語料庫在學術英語寫作應用與研究熱點和前沿如下。
首先,從語料庫的使用和可視化分析結果來看,自建語料庫,尤其是自建學習者語料庫成為研究的熱點。對學習者語料庫的研究,可以比較不同類型學習者的語言特征,以此為寫作教學提供指導,提高學習者的寫作水平和寫作意識。
其次,綜合可視化分析和知識來源分析,可以得出詞匯研究和教學研究是基于語料庫的學術英語寫作研究的主流,并且詞匯研究正在逐漸朝多視角和多維度的方向發(fā)展,教學研究中學生直接參與語料庫分析的教學方法逐漸興起。
表2 高頻被引文獻
最后,從發(fā)展特點上看,研究呈現(xiàn)多元化發(fā)展趨勢。其一,語料庫種類繁多,不論是現(xiàn)存語料庫還是自建語料庫,都是朝著多元化方向發(fā)展;其二,研究內(nèi)容除了上述四個主要方面——教學、語義、句法、體裁外,還包括語義、翻譯、測試、元話語分析等多方面內(nèi)容;其三,研究方法多元化也為基于語料庫的學術英語寫作研究拓寬了方向,例如比較分析法、多維度分析法、句法分析法、錯誤分析法等;其四,隨著科技的發(fā)展,語料庫工具也逐漸多元化。除了常見的檢索工具和詞性標記工具,還涌現(xiàn)出了錯誤分析工具、情感分析工具、修辭功能分析工具等語料分析工具,為學術英語寫作的后續(xù)研究奠定了良好基礎。
雖然語料庫在學術英語寫作中的應用與研究,在近十年取得了豐碩成果,但也存在一定問題和不足。
首先體現(xiàn)在研究領域的發(fā)展不均衡上。如上文所述,研究內(nèi)容主要集中于教學、詞匯、句法和體裁等四個方面,其他領域如測試、語篇等研究較少。即使是研究數(shù)量很多的詞匯研究,也主要集中在動名詞、連接詞、多詞結構、修辭功能等少數(shù)方面。
其次是教學相關的研究不夠深入。雖然語料庫應用于英語學術寫作教學的相關研究數(shù)量可觀,但是大都僅僅體現(xiàn)在教學啟示上,如何將研究結果真正運用于教學實踐、教學步驟如何開展、教學結果如何體現(xiàn)等還需要進一步深入探討。
本文基于2011-2020年的SSCI期刊文獻,對語料庫在學術英語寫作中的應用情況與發(fā)展特點進行分析、歸納和總結,并借助可視化分析從研究概況和研究內(nèi)容兩個方面進行闡釋,概括出語料庫在學術英語寫作應用與研究的四大主要內(nèi)容,教學研究、詞匯研究、句法研究和體裁研究。歸納出三大熱點和前沿,自建語料庫、詞匯研究和教學研究以及多元化發(fā)展趨勢。最后總結了該領域的研究發(fā)展不均衡和不夠深入兩方面不足。針對語料庫在學術英語寫作應用中的發(fā)展特點,未來的研究應朝著更均衡、更深入的多元化方向發(fā)展。相信科技的飛速發(fā)展會使更多的語料庫研究方法和工具涌現(xiàn),帶來更多研究成果。