姜 蕾, 康夢超
(東北大學 外國語學院, 遼寧 沈陽 100819)
摘要是學術論文體裁中的重要次語體,因其在結構和功能上的獨立性和自含性成為一種獨立的學術語篇體裁。摘要被認為是論文的“濃縮(distillation)”“精華(crystallization)”和“概要(summary)”,高度概括研究內容,展示研究結果和意義,以實現介紹和推廣研究的目的。因此,學術寫作研究十分關注對摘要的語篇分析。學術語篇體裁分析最常用的方法是語步分析。語步的概念最早由斯韋爾斯提出,指“話語或語篇中執(zhí)行連貫交際功能的語篇或修辭單位”[1]。因為特定的語步承載特定的語篇和修辭功能,所以語步分析能夠發(fā)現構建不同語步、實現不同交際和修辭功能時所使用的語言的特征,即功能和語言形式的對應。
使用語篇分析的方法研究學術語篇中作者在實現不同修辭功能時所使用的語言形式是學術寫作研究的重要話題。一些研究對比分析了不同學科期刊論文摘要的語篇結構和語步差異[2-4];一些研究對比分析了不同語種期刊論文摘要的語步差異[5-6];一些研究著重考查了論文摘要如何通過恰當的語言形式實現語步功能或勸說目的[7-8]。這些研究主要從詞、詞塊或短語層面討論了表達不同交際或修辭功能語步的語言特征。也有一些研究關注論文摘要的句法特征,如論文摘要的人稱、時態(tài)和語態(tài)[9],論文摘要中表達評價性態(tài)度的that從句[10],但對實現修辭功能所對應的句法特征的研究相對較少。此外,只分析個別語言特征不足以表現語言特征的共現性及語言特征之間如何相互作用以達到特定的交際目的。與專注單個特征的分布和功能的研究相比,一次性研究語言中多種特征的分布和共現更具有效性和啟發(fā)性。本研究以應用語言學期刊為例,從多個維度考查摘要中不同語步的句法復雜度特征,以期對學術英語寫作教學、測試和研究提供啟示。
論文摘要的語步模型在過去幾十年的探索中得到不斷發(fā)展。斯韋爾斯認為,摘要的結構應該與學術論文的宏觀結構一致,由引言(Introduction)、方法(Methods)、結果(Results)和討論(Discussion)4個語步組成,即他提出的IMRD模型[1]。巴蒂亞修正了該模型,提出目的、方法、結果和結論的四語步模型[11]。之后,桑托斯提出五語步模型,認為應用語言學期刊論文的摘要包括研究背景、研究內容、研究方法、研究結果和結果討論5個部分[12]。在前人理論的基礎上,海蘭德也提出了自己的摘要五語步模型,他的模型與桑托斯的模型類似,雖然二者用的術語不盡相同,但表達的意思大致相同,語步順序也一致,即先描述研究背景(Introduction),然后說明研究目的(Purpose)、描述研究方法(Method)、呈現研究結果(Product),最后總結和討論結果(Conclusion)[2]。摘要的五語步模型得到了研究者的普遍認可,許多研究均采用海蘭德的五語步模型為理論框架,如:姜峰和海蘭德[13]的研究。
本研究以海蘭德的五語步模型為框架,分析應用語言學國際期刊論文摘要中不同語步的句法復雜度特征,并嘗試回答以下兩個問題:
(1)應用語言學國際期刊論文摘要中不同語步有哪些句法復雜度特征?
(2)句法復雜度指標在應用語言學國際期刊論文摘要中的不同語步間是否存在顯著性差異?
基于2019年SSCI期刊JCR排名,本研究選取10個高被引應用語言學國際期刊作為研究對象,逐一瀏覽每個期刊發(fā)表在2016—2020年間的論文題目和摘要,以每個期刊每年選4篇為原則,共選取200篇論文的摘要作為語料,建成應用語言學國際期刊論文摘要語料庫(以下簡稱“摘要語料庫”),總計35 140個詞符,詳見表1。本研究僅選取實證性研究論文摘要,因為實證性研究論文的語篇結構高度規(guī)約化,非實證性研究論文的語篇結構則較為隨性,會因研究目的不同而有所差異。摘要作為論文的濃縮版,其語篇結構勢必受到論文語篇結構特征的影響。
表1 摘要語料庫
語步標注可以以短語、小句、T單位和句子為基本單位,需要人工完成?;締挝辉叫?越便于解讀語步嵌套現象;基本單位越大,人工標注的一致性越高。研究者們建議以句子為語步的基本單位進行標注,因為句子能夠表達一個完整的意思,遇到語步嵌套的情況可標注該句子最基本的功能。短語、小句、T單位這些較小的基本單位更適用于對少量文本進行質化分析。因此,本研究以句子為基本單位,采用海蘭德的論文摘要五語步模型(詳見表2)對摘要語料庫中的每個句子進行語步標注。
表2 海蘭德五語步模型
為保證語步標注的準確性,在正式標注前進行了語步標注練習。兩位標注者先對摘要語料庫之外的20篇國際期刊論文摘要進行標注,并計算標注者信度,Cohen’s Kappa系數是0.88,表明兩位標注者之間具有良好的一致性。正式標注包括3個步驟:①由標注者1對摘要語料庫中的所有文本進行標注;②標注結果由標注者2審核;③不一致的標注由兩位標注者討論確定。
本研究采用陸小飛等人提出的5個句法復雜度指標:句長、名詞化、限定小句、非限定小句及主句謂語動詞前置詞數量[14]。這5個指標涵蓋句法復雜度的不同維度:句長和主句謂語動詞前置詞數量體現句子的整體復雜度;限定小句的數量體現限定性從屬結構的復雜度;非限定小句的數量體現子句復雜度;名詞化則體現短語復雜度。詳見表3。這些指標在學術語篇中十分常見,而且使用自動檢索時具有很高的信度。
表3 句法復雜度指標及其描述
首先使用克萊茵和曼寧開發(fā)的斯坦福句法分析器(Stanford Parser)對文本中的每個句子進行句法拆分[15];然后使用Python程序分析所有拆分的句子,并對5個句法復雜度指標進行檢索和統計。為保證Python代碼的準確性,語料分析前進行了初步試驗。本文對摘要語料庫之外的Journal of English for Academic Purposes期刊中的50篇摘要進行人工統計,再用代碼對這部分語料進行檢索和統計,將人工統計和代碼檢索結果進行對比,計算該代碼統計/檢索每個指標準確性的F值(1)F值指精確率(precision)與召回率(recall)的調和平均數。精確率指代碼檢索出的指標有多少比例是正確的,也叫查準率;召回率指語料庫中所有相關指標有多少比例被代碼正確檢索出來,也叫查全率。F值介于0~1之間,F值越大說明代碼準確性越高。本文以斯坦福句法分析器的平均F值0.867為參照標準,高于該值則說明準確性良好。,結果表明該代碼具有良好的準確性(句長F=1.00,名詞化F=0.96,限定小句F=0.94,非限定小句F=0.90,謂語動詞前置詞F=0.94)。使用Python代碼對摘要語料庫中的數據進行正式檢索時,還輔助了人工篩查,例如:在名詞化的檢索結果中,人工剔除了quality和section這些非派生名詞化的單詞,人工篩查進一步提升了數據的準確性。
首先,對不同語步的5個句法復雜度指標進行描述性統計,提取和分析每個語步的句法復雜度特點;然后,使用單因素方差分析(ANOVA)和均值分析(ANOM)探究句法復雜度指標在不同語步間是否存在顯著性差異。
不同語步句法復雜度的描述性統計詳見表4,數據表明不同語步表現出不同的句法復雜度特征。引言語步謂語動詞前置詞最多;目的語步句子最長,非限定小句數量最多;方法語步句子最短,名詞化結構和限定小句最少;結果語步限定小句最多,非限定小句最少;結論語步名詞化結構最多,主句謂語動詞前置詞最少。
表4 不同語步句法復雜度的描述性統計
本研究使用方差分析法與均值分析法探究不同語步之間在5個句法復雜度指標上是否存在顯著性差異,結果見表5。
表5 不同語步之間的句法復雜度差異
方差分析結果顯示:不同語步在句長、名詞化、限定小句和主句謂語動詞前置詞4個句法復雜度指標上均存在顯著性差異(p<0.010);在非限定小句方面,不存在顯著性差異(p=0.406)。均值分析結果顯示:在應用語言學國際期刊實證性論文摘要中,在p<0.050的條件下:目的語步的句長(mean=26.73,SD=8.61)顯著大于5個語步總體平均句長(mean=23.67,SD=9.21),方法語步的句長(mean=21.71,SD=9.25)則顯著小于5個語步總體平均句長;結論語步使用的名詞化數量(mean=1.73,SD=1.18)顯著多于5個語步總體平均名詞化數量(mean=1.35,SD=1.26),而方法語步使用的名詞化數量(mean=1.11,SD=1.16)顯著少于5個語步的總體平均名詞化數量;結果語步使用的限定小句數量(mean=0.81,SD=0.95)顯著多于5個語步總體平均限定小句數量(mean=0.59,SD=0.84),方法語步使用的限定小句數量(mean=0.27,SD=0.58)顯著少于5個語步總體平均限定小句數量;對于主句謂語動詞前置詞引言語步(mean=5.88,SD=5.01)和方法語步(mean=5.53,SD=5.13)的數量顯著多于5個語步謂語動詞前置詞總體平均數量(mean=4.85,SD=4.65),目的語步(mean=3.65,SD=3.32)和結論語步(mean=3.61,SD=3.53)的數量顯著少于5個語步謂語動詞前置詞的總體平均數量;對于非限定小句,均值分析結果顯示沒有與非限定小句的總體均值(mean=0.70,SD=0.89)之間存在顯著性差異的語步。方差分析的結果與均值分析的結果相互佐證。
數據分析的結果顯示,應用語言學國際期刊實證論文摘要中,不同語步表現出不同的句法復雜度特征,測量的5個句法復雜度指標在不同語步之間存在顯著差異。這表明作者在表達不同的修辭功能時傾向于使用不同形式的復雜的句法結構。
長句更多地使用于目的語步,通常用于表明研究目的、論點及假設。研究目的一般較為抽象, 作者為清楚地表述研究目的,會順帶描述研究方法的部分信息,以使研究目的具體化。如下述例1,不但表明了研究目的,也描述了參與者、數據提取方法、數據分析方法等信息。正如有些學者在研究中指出的,目的語步與方法語步經常嵌套,提供的信息較為豐富[17-18]。美國心理學會也曾建議,實證研究論文的摘要在描述研究問題時,如有可能,應盡量使用1個句子。因為句子越長,所呈現的信息越多,更有助于實現目的語步的交際功能。摘要語料庫中包含212句目的語步,平均每篇1.06句,基本符合美國心理學會的要求。
例1 The present study examines differences in syntactic complexity in English writing among lower intermediate and intermediate secondary education writers by means of quantitative measures of syntactic complexity, and compares the scores on the selected syntactic complexity measures with holistic ratings of learners’ overall writing quality.(摘要語料庫:AW9)
名詞化更多地使用在結論語步,用來進一步解釋、延展研究結果,對結果作出推斷,說明研究的理論意義或實踐意義。有研究發(fā)現,作者在陳述研究意義時,通常使用表示價值取向的implication及contribution[14],以及pedagogical implication of、the implication of、the general conclusion of、the application of、the discussion of等名詞性短語[19]。在摘要語料庫中,實現結論語步的句子有201句,其中包含implication(s)的句子有54句,占約27%,是最典型的名詞化形式。
限定小句常用在陳述研究發(fā)現、結果、觀點或所完成的任務的結果語步,V+that句式是最常見的限定小句。摘要語料庫中結果語步總計421句,使用AntConc檢索發(fā)現,V+that結構共出現114次,占27%,最常用的動詞有show、suggest、reveal和indicate。使用that從句補全信息是結果語步最突出的語言特征,這個發(fā)現與其他學者的研究結論一致[19-20],“Results showed…”“It was found that…”“A main conclusion reached is that…”這些結果語步常見句型均包含限定小句。此外,結果語步也頻繁使用其他從屬結構,摘要語料庫中共出現152次從屬結構,常用的從屬連詞有as、while(whilst)、whereas、when以及although。
主句謂語動詞前置詞增多讓句子看起來更加復雜,這類復雜句式常用于介紹研究背景與動機的引言語步。在說明前人研究的不足時,作者通常在句首先使用一個從屬小句對前人的研究作出肯定,再用主句說明研究空白。把前人的研究與現在的研究結合起來,再指出研究空白可以凸顯研究主題的重要性,并幫助作者構建更加權威的學術身份。這種處理方式使得引言語步使用較多的主句謂語動詞前置詞。方法語步的主句謂語動詞前置詞也相對較多,可能是因為在表明實驗步驟時需要對實驗條件進行限定,表明使用的理論基礎、描述參試者或語料庫信息,如:數量、年齡、性別等,例2和例3便屬于這種情況。
例2 Using a focused Swalesian move analysis combined with corpus-based methods, the study examines the rhetorical moves in different phases of EAP lessons and frequent lexical phrases used to signal discourse organization in each phase.(摘要語料庫:JEAP3)
例3 Three sizeable subcorpora, representing the Common European Framework of Reference B1, B2, and C1 levels, were then selected for investigation.(摘要語料庫:AL3)
研究發(fā)現,與其他語步相比,方法語步在多個維度上表現出簡短和簡潔的特點,通常由多個短句來實現。摘要語料庫中,實現方法語步的每個短句僅描述研究方法的一個方面,信息較少,句長較短,如例4。為實現方法語步,學者們需要描述研究中所涉及的參與者身份特征、數據來源、數據收集或實驗設計步驟,以及所用的統計分析方法。學者們傾向于使用多個句子分別描述研究方法的不同方面,因此基本上每個句子長度適中,有的句子甚至偏短,且偶爾會和目的語步嵌套。此外,名詞化結構和限定小句也少用于方法語步。肖建安和王志軍曾指出,名詞化除了使語篇更具公允性與客觀性外,還可增加句子的信息密度[21]。因方法語步包含多個句子,每個句子僅描述研究設計的某個方面,故方法語步對句子信息密度要求較低,降低了名詞化使用頻率,也不需要使用從屬小句增加單個句子的信息量,句法結構相對精悍,如例4。
例4 Scores were then compared for both summary writing tasks.(摘要語料庫:AW3)
目的語步和結論語步在謂語動詞前置詞這個維度上體現出簡短性和簡潔性。目的語步通常把表研究的(research-oriented)動詞放在靠近句首的位置,確保讀者能夠清楚地理解該句的修辭功能,即陳述研究目的。在摘要語料庫中檢索“study”和“article”后發(fā)現,212句實現目的語步的句子中有182句把表研究的動詞放在靠句首的位置,約占80.7%,其中最常見的句型為This study investigates/ed、examines/ed、explores/ed、is to,這導致目的語步的主句謂語動詞前置詞數量明顯更少。在結論語步的句子中,表示價值取向(value-oriented)的動詞,如:suggest、contribute、conclude、demonstrate通常也出現在靠近句首的位置,并且主語較短,一般為單個名詞或代詞,如we、findings、results、paper、research,或與這些詞相關的名詞短語,如these findings、this result等,見例5。本研究發(fā)現非限定小句在不同語步之間不存在顯著差異,可能因為本研究使用的語料庫較小。
例5 This result suggests that raters with linguistic expertise were more attentive to accuracy whereas non-trained raters were relatively more attentive to fluency.(摘要語料庫:LL11)
本研究的發(fā)現有助于增強對論文摘要不同語步句法特征的了解,深化對語言形式與功能之間聯系的理解。很多學者在研究中發(fā)現,語言形式與修辭功能之間在詞匯和短語維度上存在聯系,本文的研究證明在句法維度上語言特征與特定的修辭功能之間也存在聯系。這些研究的結果表明,學者在表達特定修辭功能時使用的語言在短語、小句及句法復雜度層面都表現出一定的傾向與特點。這個發(fā)現可以為學術英語寫作教學、測試和相關研究提供一定的啟示。值得注意的是,雖然句法復雜度通常被看作衡量二語學習者語言能力發(fā)展的重要指標,然而高水平的寫作者應能在特定的體裁中表達特定的修辭功能時使用恰當的復雜句法結構。教學中若只強調句法形式的復雜性,學習者可能會忽視語言形式與功能之間的聯系,導致為增加文本的復雜度而錯誤地刻意使用復雜句法結構。
本研究以應用語言學國際期刊的200篇實證性論文的摘要為語料,考查了不同語步在句法復雜度不同維度上的特點,結果顯示不同語步在句法復雜度的多個維度上均表現出顯著性差異。該研究結果表明,復雜的句法結構與修辭功能之間存在著明顯的形式-功能聯系,此發(fā)現為以功能為導向的句法復雜性研究提供了有力證據。此外,本研究從句法維度入手,是對以往基于詞匯、詞塊和短語的研究的補充,拓展了學術英語研究以功能為導向的研究視角,對于學術英語寫作教學具有很重要的啟示。
然而,本研究也存在一定的局限性,其結論僅限于針對應用語言學國際期刊論文200篇摘要的5個句法復雜度的考查,對于結論的泛化需要采取審慎的態(tài)度。未來研究可以進行不同學科間的對比分析,以及期刊論文其他部分的句法復雜度特征的討論。句法復雜度是一個多維概念,擁有多個測量指標,未來研究可以考查更多的句法復雜度指標。此外,本文所用語料規(guī)模較小,未來研究可以收集更多的語料。