江西師范大學 龍紹赟 上海外國語大學 黃寶榮
提 要:“參照語料庫可以是多種文體的混合語料,而且越大越好?!保∕ike Scott,2016:112)。本文以BaREnloB為參考語料對比探析了中國英語專業(yè)學生語料庫WECCL(1.0)四個年級大學生議論文中情態(tài)序列使用的年級趨向。研究發(fā)現:1)方差分析與穩(wěn)健性檢驗表明,BIS、LOG_L與LOG_R各指標基本呈現顯著的年級差異,類認知序列除外。2)方差分析均值圖發(fā)現:就認知序列而言,BIS與LOG_L隨年級上升而上升,在三年級達到高峰值,四年級跌入低谷;而LOG_R隨年級上升而緩步上升,四年級達到高峰值;就義務序列而言,BIS與LOG_L隨年級上升而逐步下降,但在二年級有些反復,出現高值;而LOG_R隨年級上升穩(wěn)步向下,時急時緩;而在類認知序列方面,盡管BIS、LOG_L與LOG_R的變化趨勢基本趨于一致,隨著年級的上升基本平緩不動,稍有波動,只在四年級時達到最好,但并不存在顯著的年級區(qū)別。3)參數檢驗與非參數檢驗結論基本不相同,有些結論完全相反。
情態(tài)動詞研究近年來備受國內外學者關注(如Aijmer,2002;Biber et al.,1999;Coates,1983;de Haan,1997;Hunston,2004;Mindt,1993;Palmer,2001等),其中單就主題性的或語言其他特征研究紛繁多樣,還有進行實證操作的研究。國外鮮見以“情態(tài)序列(modal sequences)”命名的研究,而國內自2008年以來,出現了不少專以情態(tài)序列為題或為關鍵詞的論文(如劉文艷,2009;劉陳艷,2013;龍紹赟,2009,2011,2012,2013,2014,2016;梁茂成,2008;馮莎,2017;張正厚等,2016;張紅瓊,2014等)??傮w來說,因所用語料大小、語體各異,得出的結論不夠一致,且不涉及效應量,因此科學性不夠強。況且,國內從年級的視角對學習者情態(tài)序列總體進行發(fā)展特征的探究鳳毛麟角,有研究(如龍紹赟,2013)因參照語料庫較小,且語體單一,可靠性不太高,因此需要進一步的探討。
情態(tài)動詞常與助動詞以及實義動詞構成“主語+情態(tài)動詞(+助動詞)實義動詞”類屬序列,此類屬序列可能是類連接(colligation),可能是搭配(collocation),可能是“主語(+認知情態(tài)副詞)+情態(tài)動詞”,也可能是“情態(tài)動詞+動詞(的完成體/進行體)+(狀語/補語)”等,這些都叫做情態(tài)序列(Hunston,2001,2004)。因為情態(tài)動詞大多一詞多義,且詞義往往重疊(Aijmer,2002;Mindt,1993),反復無定,加之所處語言文化與語言習慣的不同,語義容易混搭,導致意義混淆,使得語義只能在具體語境中予以衡定(Bybee&Fleischman,1995;Hunston,2004;Kratzer,1981;Mindt,1993)。因此,在語言學習中,情態(tài)序列學習比孤立情態(tài)動詞學習與研究的意義更強大(Hunston,2004;Sinclair,1995)。
情態(tài)序列的概念也得到Firth和Sinclair的啟發(fā)與認同。Firth(1957)和Sinclair(1991,2004)認為詞語的意義由“詞項序列(lexical sequences)”決定。Sinclair(1995)還認為套語(phraseology)能最充分地解釋詞匯運用。他發(fā)現,在不同的短語搭配中,“must”可以獲得不同的語義。據此可得:學習情態(tài)動詞時,不能孤立地學習獨立的詞項,而應在具體的語境中對情態(tài)序列的多種具體含義進行具體分析。
Biber et al.(1999)、Coates(1983)、de Haan(1997)、Larreya(2004)、Palmer(2001)等把情態(tài)大致分為兩類:認知情態(tài)與義務情態(tài)。認知情態(tài)關注語氣的肯定程度、敘事的真值評價或個案的可能性,而義務情態(tài)表達主語承擔的責任與要求或主語可實施的行為(Biber et al.,1999;Coates,1983)。
常見的情態(tài)序列有:a.無靈主語或there或其他引導詞+情態(tài)動詞;b.情態(tài)動詞+靜態(tài)動詞;c.情態(tài)動詞+動詞的進行體/完成體;d.情態(tài)動詞(+認知情態(tài)副詞)+實義動詞。只要句法搭配中出現表1中4種結構,我們就可以據此認定并證實情態(tài)語義序列在句中出現。
表1列出了常見的認知情態(tài)序列,如:NN1 CAN VBI VVN[The ground can be made(wet)]表達的是典型的真值判斷。像PPY MUST VVI就是典型的義務情態(tài)序列,因為you must make涉及有靈主語、動態(tài)動詞等。而像COULD XX VVI(could not do)就是類認知情態(tài)序列,因為不結合上下文具體的情景無法同時判斷這是表達“禁止”“意愿”“能力”還是“可能”,本文權稱為“類認知情態(tài)序列”,略為“類認知序列”。
表1.情態(tài)動詞句式與情態(tài)語義的對應關系
Biber et al.(1999)、Coates(1983)、W?rnsby(2003)等認為,情態(tài)序列與情態(tài)語義類型之間存在簡單的對應關系,可通過序列句式預測情態(tài)動詞的情態(tài)語義。具體概括如表1。
我們認為,給定語料中,認知情態(tài)序列出現越多,一定程度上可以預測義務情態(tài)序列出現越少,反之亦然?;谶@種認識,運用語料庫序列提取與加工技術,我們就可以比較精準地判斷出語言的認知語義表述形式。
本研究以WECCL1.0議論文為觀察語料,以BaREnloB為參照語料(大于觀察語料庫6倍以上),以主題性的三大考察指數BIS、Log_L與Log_R(效應量的一種變體,具體解釋見2.3.3),同時增加考察變量(類認知序列)歷時考察中國專業(yè)學生對于情態(tài)語義表述的特征表現,進一步從主題性的角度(唯一測量指標)探究專業(yè)學生在情態(tài)序列上的發(fā)展特征,以期更科學、更全面地揭示中國大學生書面語中情態(tài)語義表述現狀,驗證并發(fā)展之前有關本主題的研究,更有效地為情態(tài)動詞的教學等提供適切的進一步理論啟發(fā),提高情態(tài)動詞習得效果。
(1)受語言認知規(guī)律的影響,中國英語專業(yè)學生議論文中認知情態(tài)序列的使用會隨著年級的升高而升高,義務情態(tài)序列會隨年級上升基本呈現下降的趨勢,類認知情態(tài)序列的變化大體上與認知序列的變化趨于一致,受到社會及文化環(huán)境影響,上述頻率在某些年級存在細微的差異。
(2)主題性結果指標BIS、Log_L與Log_R所呈現的數據與圖表中,BIS與Log_L基本相似,Log_R會有不一樣的表現。
(3)同一組數據,參數檢驗與非參數檢驗結論會有所不同。
基于上述假設,本研究旨在解決如下問題:
(1)專業(yè)大學生議論文中的認知情態(tài)序列是否會隨著年級升高而升高,義務情態(tài)序列是否會隨著年級升高而降低,類認知情態(tài)序列是否會隨著年級升高而升高?
(2)參數檢驗與非參數檢驗結果是否有所不同?
(1)語料
①觀察語料:本研究使用的學習者語料來自WECCL1.0(文秋芳等,2001)專業(yè)學生議論文作文子庫。為了便于觀察認知情態(tài)序列使用情況,研究者試用分庫軟件把本語料中賦碼后帶有標記題頭的文件析取出4個不同年級的語料子庫,組成本研究中的“學習者議論文年級語料庫”,具體見表2。
表2.觀察語料庫、參照語料形符等具體情況
續(xù) 表
②參照語料庫:為了形成對比,研究中使用了學術程度不同的語料庫,分別為:1.BAWE,2.RA,3.ENS,4.LOCNESS,5.BNCessay。遂命名為BaREnloB。
BAWE由牛津布魯克斯大學、雷丁大學和華威大學于2004—2007年間創(chuàng)建。語料包括本科生或研究生撰寫的2 761個學術文本,共計6 506 995詞次,本研究隨機選取了英語學術語料庫(BAWE)中的2 062個文本,共計5 251 926詞次。
RA(Research articles)語料是作者學生自創(chuàng)①此庫由學生彭玉娜于2014年為完成碩士論文時自我編制完成,在此表達感謝。,從2002—2014年應用語言學的3個國際期刊:Applied Linguistics,Studies on Second Language Acquisition and System中抽取來的共39篇文章。作者大多數來自英語國家,其中一小部分是非母語人士,主題全部為應用語言學和二語習得。
ICNALE自2007年開始由日本神戶大學石川慎一郎(Shin'ichiro Ishikawa)教授主持開發(fā)建設,所有的文本均基于兩個給定的作文題目,作文長度為200~400詞。該語料庫收集了東南亞幾個國家的英語學習者的寫作語料和英語本族語者的寫作語料。本研究選用該語料庫中的英語本族語者子語料庫(ENS1和ENS2),此處合稱ENS。
英語本族語大學生議論文語料(LOCNESS)(Louvain Corpus of Native English Essays)是由比利時Louvain大學Sylvine Granger教授于1995年主持建立的英美本族語大學生作文語料庫,共包含297個文件。
英國國家語料庫(British National Corpus,簡稱BNC)是由英國牛津大學出版社、蘭卡斯特大學英語計算機研究中心以及大英圖書館等聯合開發(fā)建立的大型語料庫。本文由本庫開發(fā)INDEX選取的BNC essay包括英美大學生撰寫的主題議論文,共包含10個文本庫。
從上文可以看出,本研究所用參照語料庫:a.總量大,是學習者語料庫的6倍,就最小的grade 4而言,達到313倍,符合國際通用規(guī)范與標準(Berber-Sardinha,2000)。b.學術性強。像BAWE、BNC essay以及RA就是較為典型的學術性程度不一的語料庫。
根據Scott(2016)的研究,就關鍵詞產生的好壞而言,無關乎參照語料庫大小之以及是否奇怪與正常;就關鍵詞的產生精準值(precision value)②精準值是在Oakes之后計算的“實際上相關的檢索條目的比例”(獲得的相關條目的數量除以檢索條目的總數)(Scott,2016:85)。精準值衡量的是實際相關的檢索項的比例(獲得的相關項的數量除以檢索項的總數)(Oakes,1998:176)。而言,沒有所謂的不合格的參照語料庫;參照語料庫可以是多種文體的混合語料,而且越大越好,當然最好在標準之內。同時,他的研究還得出結論:參照語料文本的語體不同,所得出的關鍵詞也會有所不同。
同時,本研究的參照語料庫為最近二十幾年之內的學術與一般議論文所得出的關鍵詞基本同質,其主題性數據基本可信、有效。
(2)語料預處理
為了方便考察語料中情態(tài)序列的句法特征,本研究運用Aarts&Granger(1998)和To-no(1999)的方法,我們利用PowerGrep對經過CLAWS tagset7處理文本進行預處理,例示見表3。
表3.文本處理方法例舉
處理后,再利用相關軟件對文本中的所有認知類、義務類以及類認知情態(tài)序列逐一進行提取,以便獲取各大主題性數據。
(3)語料處理方法
為便于理解與解釋結果,下文介紹幾種Wordsmith7.0中統計技術涉及的術語:
BIS:BIC Score的縮寫(參見Wilson,2013),屬Bayes Factor,有效替代了統計學中的統計顯著性指標p值,適合于比較小型的語料庫。
Log_L:Log Likelihood test的縮寫,Ted Dunning(1993)設計的算法,統計意義上比卡方檢驗更合適的主題性測量,尤其適合與參考語料庫對比時的長文本。
Log_R:log ratio的縮寫,Andrew Hardie(2014)設計的算法,強調主題性效應強度而不是它的統計意義,數據可以理解為語料庫統計效應量,“2”這個值意味此條目頻率在新詞列表中比在對照語料庫多4倍,“3”意味著條目頻率是對照語料庫的8倍,以此類推,比似然對數更易理解。
主題性:觀察語料中出現的關鍵詞突顯程度的指標,可以是上述三種算法的綜合?!瓣P鍵”詞必須滿足:a)頻次等于或高于用戶設定的最小頻次;b)與參考語料庫中的頻率相比,小于或等于用戶指定的p值;c)主題性強度等于或高于用戶設定的最小對數比。
本研究獲取了三大主題性數據,再進行基于年級的對比,意在發(fā)現其年級趨向。
本文序列處理具體方法如下:
(a)創(chuàng)建主題詞表:基于賦碼及正則表達法處理后的語料庫,以具體的情態(tài)動詞/情態(tài)動詞賦碼(CAN、COULD-MD等)作為參照詞表,基于3—8跨距分別創(chuàng)建相應的情態(tài)序列詞叢列表,然后使用WordSmith的keyness等功能進行逐一對比并觀察該情態(tài)序列詞叢列表,進行主題詞(KeyWords)分析;根據該分析結果(BIS,Log_L,Log_R等)確定具體的情態(tài)序列,分別得出學習者語料庫中各情態(tài)序列的所有詞叢(含認知情態(tài)序列、義務情態(tài)序列以及類認知情態(tài)序列)的頻率(以每100詞為單位計算)。
(b)詞叢歸并:刪除非認知序列形式后,諸如NN1 SHOULD VBI,NN2 SHOULD VBI等認定為是認知情態(tài)序列,諸如CAN XX VVI,COULD XX VVI等認定為是類認知情態(tài)序列,諸如PPY CAN VVI,PPIS2 CAN RR VVI等認定為義務情態(tài)序列,然后依據實際出現的序列按主題詞詞叢歸類,最終得到學習者語料庫中類/認知和義務等情態(tài)序列。
(c)依主題性結果(BIS,Log_L,Log_R)按年級排布:對四個年級中使用頻率較高的三類情態(tài)序列依“主題性”按年級排列,得到四個年級中三類情態(tài)序列的頻率差異數據。
(d)繪制圖表,做差異分析:繪制圖表,進行各類差異分析(含非參數檢驗與參數檢驗等),找出數據的變化規(guī)律,解決本文的研究問題。
本研究以BIS、Log_L或Log_等主題性數據說明學習者語料與本族語對照語料中認知等情態(tài)序列的使用差異,如果該序列主題性為正,則表明學習者相對于本族語者過多使用此序列,反之,則過少使用,其絕對值越大,差異越大,“/”意為不存在數據,沒有對比序列。
為了了解學生對于認知情態(tài)的總體把握狀況,基于參照語料庫“BaREnloB”的對比,本文比較了“學習者議論文年級語料庫”的主題性結果(BIS,Log_L,Log_R)(以下類同),然后根據實際出現的序列結合自己擬定模板進行數據歸并及重新組合后,得到表4,再依據單元方差分析均值圖得出圖1(以下類同)。
表4.認知序列三大主題性的年級差異
圖1.認知序列三大主題性的年級差異
由圖1可以看出,weccl.0議論文年級語料中,認知序列的BIS與LOG_L變化基本趨于一致:隨著年級的上升穩(wěn)步向上,在三年級時達到峰值,隨后急劇下降,在四年級時到達底部。LOG_R隨著年級的上升緩步向上,在四年級達到高峰值。
正態(tài)檢驗發(fā)現認知類主題性均呈正態(tài)分布,方差齊性檢驗發(fā)現三大類數據方差齊性。單元方差分析發(fā)現,三大類主題性值均存在顯著的年級差異(BIS:F=3.333,P=0.034;LOG_L:F=3.318,P=0.034;LOG_R:F=4.073,P=0.016),多重分析發(fā)現差異均在四年級與一、二、三年級之間,雖顯著性值都很低。
未假設方差齊性時,只有LOG_R的Dunnette C值存在顯著的年級差異。Welch,Brown-Forsythe檢驗發(fā)現,除LOG_R的Welch有差異外,其余均無差異。
非參數Kruskal-Wallis檢驗發(fā)現三大主題性值都不存在顯著的年級差異,與參數檢驗方差分析的結論恰好相反。
就LOG_R而言,無論方差齊性與否,參數檢驗與非參數檢驗結果均有影響力,尤其是序列NN2 SHOULD VBI,說明群體的責任意識一直較強。
表5.義務序列三大主題性的年級差異
由圖2可以看出,weccl.0議論文年級語料中,義務序列的BIS與LOG_L的變化趨勢趨于一致,隨著年級的上升基本朝下發(fā)展,只在二年級時反而平緩上升達到最高值。LOG_R隨著年級的上升穩(wěn)步向下,但時急時緩。
圖2.義務序列三大主題性的年級差異
正態(tài)檢驗發(fā)現義務類主題性全部呈正態(tài)分布。單元方差分析發(fā)現,只有LOG_R值存在顯著的年級差異(F=5.346,P=0.006 6<0.05),且方差齊性(levene值=0.337,P=0.287>0.05),顯示這個維度上主題性效應強度一致,但其他兩項(BIS與LOG_L)沒有顯著的年級差異,且方差不齊性。
均值相等性檢驗發(fā)現BIS與LOG_L只有Welch值存在顯著的年級差異,分別為0.036和0.034,而LOG_R的Welch與Forsythe值均存在顯著性差異,且P都為0.001。
非參數Kruskal-Wallis檢驗發(fā)現,三類主題性都存在顯著的年級差異(BIS&LOG_L:χ2=13.42,Asymp.sig.=0.004;LOG_R=9.398,Asymp.sig.=0.024)
就效應量(LOG_R)的意義表明參數檢驗都有影響力,但影響力越來越低。但有些序列,尤其是序列PPIS2 SHOULD VVI始終在低年級且居于高位,而PPIS2 CAN VVI在全年級居于高位,且越來越高,表明隨著年級的增長,責任意識的逐步減弱,能力意識的逐步增強。
表6.類認知序列三大主題性的年級差異
由圖3可以看出,weccl.0議論文年級語料中,類認知序列的BIS、LOG_L與LOG_R的變化趨勢基本趨于一致,隨著年級的上升基本平緩不動,但在四年級時達到最好。
圖3.類認知序列三大主題性的年級差異
正態(tài)檢驗發(fā)現類認知類主題性全部呈正態(tài)分布,四個年級的三大主題性的Kolmogorov-Smirnova與Shapiro-wilk值的顯著性值均為0.00。
方差齊性檢驗也發(fā)現全部齊性。單元方差分析發(fā)現,三大主題性值均不存在顯著的年級差異。未假設方差齊性時,發(fā)現所有值都不存在顯著的年級差異。均值相等性檢驗發(fā)現三大主題性值的Welch與Forsythe值均不存在顯著性的年級差異。
非參數K-W檢驗還發(fā)現三大主題性值均不存在顯著的年級差異。
單就效應量(LOG_R)而言,發(fā)現有些序列都有了有影響力的結果,但影響力越來越低,如COULD XX VVI與CAN RR VVI,而帶有認知傾向的PPHS2 COULD VVI與PPHS2 CAN XX VVI根本不出現影響力,表明個人意識雖然一直較強,但群體意識還是較差。
吳明?。?003)、秦曉晴(2015)等認為,數據出現非正態(tài)或方差不齊性時可以進行數據轉換或非參數檢驗。均值相等的穩(wěn)健性檢驗,因Welch與Brown-Forsythe值近似F分布,而且對數據方差是否齊性沒有更高要求,所以比方差分析更為穩(wěn)妥(Algina et.al.,1997;Brown&Forsythe,1974)。非參數條件下的數據,如果符合參數檢驗條件,也可以進行相應的參數檢驗。
本文進行的數據分析過程簡述如下:先進行數據正態(tài)性檢驗,再進行方差分析,同時進行方差齊性檢驗。如發(fā)現方差問題,再進行未假設方差齊性的條件下四個值(Tanhane,DunnetteT3,Games-HOWELL,Dunnette C)的檢驗①不假設方差相等的多重比較檢驗有Tamhane的T2、Dunnett T3、Games-Howell和Dunnett的C。當方差不相等時,適合使用如下檢驗:Tamhane T2?;趖檢驗的保守成對比較(Dmitrienko,Tamhane&Bretz,2009);Dunnett T3。基于學生化最大值模數的成對比較檢驗(Dunnette,1990);Games-Howell。有時會變得隨意的成對比較檢驗(Games&Howell,1976);Dunnett C。基于學生化的范圍的成對比較檢驗(Dunnett,1955)。,同時進行均值相等的穩(wěn)健性(Welch,Brown-Forsythe)檢驗,最后對所有數據再進行非參數Kruskal-Wallis檢驗,無論方差齊不齊性。
本研究數據檢驗結果如下:
(1)三大類數據皆呈正態(tài)分布(所以不必對數據進行對數等轉換)。
(2)方差齊性狀況:三大類主題性數據中,各項都方差齊性(所以不必進行數據轉換),除去義務類的BIS與LOG_L方差不齊性。三大類主題性數據的變化強度(Log_R)趨于一致,顯示在Log_R這個維度上主題性基本一致,年級間的效應強度沒有差異。
(3)方差齊性條件下的方差分析結果:認知類全部主題性值、義務類的LOG_R存在顯著的年級差異,且多重分析都發(fā)現四年級與一、二、三個年級之間都存在顯著差異,類認知類除外。這表明,與本土語言使用者相比,中國各年級學生在認知類、義務類情態(tài)序列使用上存在顯著性年級差別。認知類序列的主題性隨年級越來越大,義務類卻越來越少,這說明學習者語言使用趨勢正在向本族語者靠近,且達到統計學上意義,且效應強度也有了顯著性改變。
(4)方差不齊性條件下的均值穩(wěn)健性檢驗結果:只有類認知各主題性值不存在顯著性的年級差異,認知類只有LOG_R的Welch值存在顯著的年級差異,義務類的BIS與LOG_L只有Welch值存在顯著的年級差異,但LOG_R的Welch與Brown-Forsythe值存在顯著的年級差異(見上文分析),這說明認知序列的使用無形中越來越多,義務序列的使用越來越少,且效應明顯。說明學生隨著年級的增加,學生對于真值的判斷與評估意識增強,簡單敘述加武斷意識的減弱,而類認知也許因定義模糊等原因無法發(fā)現差異。
(5)非參數條件下的K-W檢驗結果:基本不能驗證上述均值相等的穩(wěn)健檢驗性分析結果以及參數方差分析結果,但類認知類除外。非參數檢驗與參數檢驗因檢驗的靈敏性、精確性、應用范圍、可靠性差距等的原因無法等同,只因適用條件不一,所以結果也不同。
(1)分析結果
基于學生議論文年級語料庫的主題性數據,并結合研究假設與問題,本文總結如下:
A.參數檢驗的方差分析發(fā)現認知序列三大主題性值存在顯著的年級差異,四年級分別與一年級、二年級、三年級3個年級都存在顯著的區(qū)別,這表明中國英語專業(yè)本科生英語議論文中的認知情態(tài)序列基本隨著年級升高而升高,且效應強度也存在差別。雖趨勢有些反復,單元方差分析發(fā)現,義務序列在四年級與其他三個年級存在區(qū)別,這表明中國英語專業(yè)本科生英語議論文中的義務情態(tài)序列會隨著年級升高而降低,雖然二年級時有些反復達到最高。方差齊性條件下的方差分析、均值相等的穩(wěn)健性檢驗分析發(fā)現類認知序列三大類主題性數據值都不存在顯著性的年級差異,表明中國英語專業(yè)本科生英語議論文中的類認知情態(tài)序列不會隨著年級升高而升高,呈現一種無法預知的趨勢。部分支持假設一。
B.參數檢驗與非參數檢驗結論基本不相同,有些結論完全相反。如對于認知序列,非參數檢驗發(fā)現與參數檢驗方差分析的結論正好相反;對于義務序列,非參數檢驗發(fā)現,三類主題性都存在顯著的年級差異,與均值相等檢驗結果不完全相同;對于類認知序列中,非參數檢驗發(fā)現所有值都不存在顯著的年級差異,與方差分析一樣。部分否定假設二。
(2)討論
上述結論再一次證實:中國專業(yè)學生對于情態(tài)序列的認知有一定的規(guī)律:隨著年級的升高,認知序列的使用越來越頻繁,越來越趨近于本族語者使用特征,而義務序列的使用卻越來越少,符合中介語特征:不同層次學習者中介語的質量存在差異,雖尚未達到自然語言的程度,但總體而言,均已構成獨立自足的系統(Corder,1973;Brown,1987)。
中國學生認知情態(tài)習得所體現的中介語特性可以具體表述如下:
(a)系統性:學習者在習得認知情態(tài)序列的過程中,認知類情態(tài)序列的主題性都隨著年級的上升而上升,義務類情態(tài)序列的主題性都隨著年級水平的上升逐漸下降,雖然由于社會文化等具體情景原因在某個階段有所反復。這種趨勢的表現已成為一種普遍共識:義務類情態(tài)動詞僅表示義務、責任,而認知類情態(tài)序列表示價值判斷和真值評價。情態(tài)序列習得的這種規(guī)律性已然標準化我們的認知,幾成系統,完全可以理解為“系統性”。
(b)不完備性:中介語在結構的復雜度、優(yōu)先使用的功能以及語言類型的差錯上與自然語言存在差異。在情態(tài)序列使用上,中介語特點表現較為明顯。認知序列的BIS與LOG_L隨年級上升而上升,在三年級達到高峰值,四年級跌入低谷,而LOG_R隨年級上升緩步上升,四年級達到高峰值;義務序列的BIS與LOG_L隨年級上升而逐步下降,但在二年級有些反復,出現高值;而LOG_R隨年級上升穩(wěn)步向下,時急時緩;類認知序列的BIS、LOG_L與LOG_R的變化趨勢基本趨于一致,隨著年級的上升基本平緩不動,稍有波動,只在四年級時達到最好,但不存在顯著的年級區(qū)別??梢钥闯鲈谇閼B(tài)習得的整個過程中,序列的習得會有些程度不同的反復,這本身也是一種規(guī)律:“認知情態(tài)動詞是由義務動態(tài)情態(tài)演化而來……因而常有反復”(束孟卿,2009),出現語言反復現象??傮w上隨著學習層次的提高而更吻合認知規(guī)律,更習慣自然地表現出對于事件的價值判斷與真值評價,但同時又表現出特別明顯的中國學生情態(tài)習得中所體現的中介語特性。
(c)不穩(wěn)定性:在語言習得過程中,學習者不斷學習和內化語言輸入,優(yōu)化其認知結構,產生新的信息,是不斷發(fā)展的過程,中介語的不穩(wěn)定性體現在這種動態(tài)的發(fā)展進步中。本文的不穩(wěn)定性主要體現在認知序列、義務序列各指標的波動及顯著年級差異上,這種在各維度各階段上出現的逆轉與語言結構反復現象就是學生認知上出現的不穩(wěn)定性表現。也許語言的潮汐現象可以有效說明其原因(龍紹赟,2012)。
不完備性、不穩(wěn)定性也可以從效應量(LOG_R)看出,對于認知序列和義務序列,LOG_R的參數檢驗發(fā)現了有影響力的結果,隨影響力越來越低,如COULD XX VVI與CAN RR VVI在所有年級都有影響力,雖然越來越小。
本研究借鑒了前人的方法,使用Claws7賦碼文本后,利用PowerGrep和語料庫工具WordSmith(7.0),對比分析了中國英語專業(yè)學習者議論文中的情態(tài)序列主題性數據,基本驗證了本文假設。本文認為中國學生情態(tài)習得體現了中介語特性:系統性、不完備性、不穩(wěn)定性。對于情態(tài)動詞的教學具有一定的啟發(fā)作用(龍紹赟,2012,2016)。
基于主題性(keyness)的序列研究方法是當前語料庫較復雜的研究手段,可用于觀察詞法與句法序列。本研究從年級視角援引主題性數據BIS,LOG_L,LOG_R等指標,特別指出可利用LOG_R作為效應量來衡量學生情態(tài)序列習得的階段性特征。本文突破了以往研究束縛,援用程度不同學術語料庫作為參照語料,一定程度上彌補語料庫研究難以參照多文體語料庫的不足。不過,如果能自我創(chuàng)建動態(tài)監(jiān)控語料庫以觀察學生的情態(tài)序列使用模式,同時,如能更為科學地定義、規(guī)范與抽取各種序列結構與組合(模板),尤其是類認知序列,研究則更具科學性。再者,鑒于參照語料庫的不同的學術性程度,可以考慮進行不同學術參照文本與同一年級作文文本的對比來看學生語言不同學術性表現,相信對學術英語教學與習得會有更大啟發(fā)與參考。