任小華
(陜西科技大學(xué) 文理學(xué)院,陜西 西安710021)
用英語演講是許多中國大學(xué)生渴望具備的能力之一。國內(nèi)各類英語演講比賽的舉辦,如外語教學(xué)與研究出版社主辦的“外研杯”全國英語演講大賽和中國日報社主辦的“21世紀杯”全國英語演講比賽,在一定程度上促使中國大學(xué)生更加重視使用英語,尤其是用英語進行演講的能力。高質(zhì)量的演講詞對成功演講起著舉足輕重的作用。研究表明,詞塊(有時被稱為語塊或詞束)能力是語言能力的一項重要指標[1],有助于提高口語和寫作能力[2],也有助于提高學(xué)生的英語演講水平[3]。Altenberg的研究甚至表明,實際語言輸出中的70%是通過詞塊實現(xiàn)的[4],因而“詞塊在英語演講教學(xué)中越來越多地受到重視”[5]。過宇認為,對預(yù)制語塊(詞塊)語用功能知識的掌握有助于演講者準確、得體地使用英語與聽眾交流[6]。羅憲樂也認為詞塊是提高學(xué)習(xí)者演講語言地道性和流利性的關(guān)鍵所在[7]。然而,學(xué)生在英語演講中對詞塊的使用存在一些問題,如搭配不合理[8]。由于缺乏英語本族語學(xué)習(xí)者演講詞,目前國內(nèi)相關(guān)研究大多針對中國大學(xué)生的英語演講詞[9],或?qū)⑵渑c英美國家專業(yè)人士的演講詞進行對比[10]。我們無意否定這兩類研究的價值,而是將中國大學(xué)生與美國大學(xué)生英語演講詞中詞塊的使用進行對比,以期對中國大學(xué)生英語演講詞中詞塊的研究有所啟示,進而對提高中國大學(xué)生英語演講能力有所裨益。
詞塊,又叫(預(yù)制)語塊,是“可以整體儲存、提取和產(chǎn)出的程式語”[11]9。詞塊具有心理現(xiàn)實[12],這已部分得到了證實[13]。Wray對詞塊的界定比較模糊,相比之下,衛(wèi)乃興和王曉婷的定義更為可取,他們把詞塊定義為“以一定結(jié)構(gòu)在語料庫中高頻出現(xiàn)的不同長度的有意義的連續(xù)詞語片段”[14]60,詞塊一般語法結(jié)構(gòu)良好、長短不一、意義相對完整、高頻并連續(xù)出現(xiàn)[14]60-61。結(jié)構(gòu)良好是為了排除軟件機械切割而產(chǎn)生的噪音序列,詞塊長度一般介于2~6詞之間,意義不完整的語言單位研究價值不大,詞塊遵循“成語原則”[15]110,因而高頻出現(xiàn),因提取技術(shù)所限,軟件目前還無法提取非連續(xù)的詞塊。另外,“2詞序列大多可以作為一般搭配研究”[16]210,故不在本研究之列。對中美大學(xué)生英語演講詞中的詞塊提取時,我們發(fā)現(xiàn),7詞詞塊在兩種類型的語料中都存在,故本研究將考察3詞、4詞、5詞、6詞和7詞詞塊。
通過語料庫對中國大學(xué)生和英語本族語者(包括學(xué)習(xí)者)演講詞中詞塊的研究還不多見,目前我們收集的文獻有5項,這些研究主要基于Altenberg或Nattinger和DeCarrico的研究框架[4][17]。
基于Nattinger和DeCarrico的框架,王立非和錢娟對自建中國學(xué)習(xí)者英語演講語料庫和英國國家語料庫(British National Corpus,簡稱BNC)口語庫中的即興演講語料中的詞塊進行了研究,結(jié)果發(fā)現(xiàn):中國英語演講者使用多元詞、短語架構(gòu)、習(xí)俗語和句子構(gòu)造框架等4類語塊,且使用頻率上存在差異,較少使用習(xí)俗語和多元詞;中國演講者的語塊使用與英國演講者相比存在顯著差異,在語塊總體豐富度上未見顯著差異,但表現(xiàn)出過多使用習(xí)俗語塊的傾向[18]。基于同樣的理論框架,黃晨晨和魯修紅對2008年“CCTV杯”全國英語演講大賽決賽選手的定題演講與即興演講文本進行了分析[9][19],結(jié)果發(fā)現(xiàn)多元詞和句子框架在即興演講中的使用相對較高,而短語架構(gòu)和習(xí)俗語在定題演講中使用較高。
基于Altenberg的理論框架,張艷研對近十屆“21世紀杯”全國英語演講比賽前三名選手的演講稿中的詞塊進行了研究,結(jié)果發(fā)現(xiàn),2詞詞塊最為頻繁,其次為3詞詞塊,4詞詞塊最少;在演講者的話語構(gòu)建中,分句成分所起的作用最大[10]。陳清對中國大學(xué)生英語演講語料庫和BNC口語中的4個詞塊進行了研究,結(jié)果表明,本族語者高頻使用的口語化程度很高的詞塊,而中國大學(xué)生卻用得很少[20]。
對有關(guān)文獻的梳理后發(fā)現(xiàn),首先,目前對中國英語演講中詞塊的實證研究大都基于Nattinger和DeCarrico的分析框架,但是該框架中的“多元詞”“短語架構(gòu)”“習(xí)俗語”和“句子構(gòu)造框架”的判定目前缺乏比較科學(xué)的依據(jù)。其次,因為“習(xí)俗語”雖然結(jié)構(gòu)和意義比較固定,但是在實際語言使用中不太常見,將其看作詞塊難以令人信服。再次,對中國學(xué)習(xí)者和本族語者英語演講中的詞塊研究缺乏可比性。最后,對英語演講詞中詞塊的諸如組篇、立場等功能的研究依然很缺乏。鑒于此,本文借鑒相對容易于通過軟件實現(xiàn)的Altenberg理論框架,結(jié)合軟件識別和人工核查,主要對中美大學(xué)生英語演講詞中的詞塊的長度和功能進行研究。
本文要回答的兩個研究問題是:
1.中美大學(xué)生英語演講詞中的詞塊使用在長度上有何異同?
2.中美大學(xué)生英語演講詞的詞塊使用在功能上有何異同?
本研究所使用的是作者自建的小型英語演講語料庫,美國大學(xué)生英語演講語料來自美國大學(xué)生的演講詞,共26篇①第1-20篇來自蔡基剛編著的《美國大學(xué)生英語演講點評》,上海交通大學(xué)出版社,1998年版;第21-26篇來自祁壽華編著的《英語演講藝術(shù)》,上海外語教育出版社,2005年版。,37 909詞,題材為大學(xué)生的學(xué)習(xí)生活以及社會問題。中國大學(xué)生英語演講語料來自中國大學(xué)生的演講詞②來自“21世紀杯”全國英語演講比賽第1至18屆冠軍演講詞和第三、四、五、八、九、十、十一、十三、十四、十五、十六、十七、十八屆亞軍演講詞。,共31篇,17 909詞,題材與美國大學(xué)生演講詞的大體一致?!巴庋斜庇⒄Z演講比賽始于2002年,而“21世紀杯”英語演講比賽始于1996年,在時間上后者與美國大學(xué)生演講詞更接近。
美國大學(xué)生的演講詞沒有電子版,故我們將紙質(zhì)文本掃描后轉(zhuǎn)化word,在和原文核對確保無誤后,將其保存為.txt格式。對于中國大學(xué)生的演講詞,有電子版的,我們將其與紙質(zhì)的或其他網(wǎng)站的演講詞進行比較,選出質(zhì)量優(yōu)者,隨后保存為.txt格式;沒有電子版的,我們重復(fù)采集美國大學(xué)生演講詞語料的做法。
詞塊提取分兩步:軟件自動提取和人工核查。自動提取時,我們使用的是AntConc3.3.3的Cluster/N-Grams功能,加載語料后,我們將N-Grams Size分別設(shè)定為2、3、4、5、6和7就得到對應(yīng)詞數(shù)的語言片段。由于語料庫庫容比較小,對于三詞語言片段,我們提取閾限設(shè)為3次,對于四詞語言片段及四詞以上的語言片段,閾限設(shè)為2次③參閱衛(wèi)乃興《詞語學(xué)要義》,上海外語教育出版社2011年版,第210頁,故研究者可根據(jù)語料庫大小確定。。由于軟件所進行的只是機械切割,故自動提取后,我們根據(jù)詞塊的結(jié)構(gòu)和意義相對完整性的要求,對所得語言片段逐一核查,將最終所得的語言片段看作詞塊。此外,中美大學(xué)生語料庫容不同,為了便于比較,我們將原始頻數(shù)轉(zhuǎn)化為標準頻數(shù)(次/每萬詞)①換算方法為:(原始頻數(shù)/庫容)x10000,如中國大學(xué)生三詞詞塊原始頻數(shù)為70,標準頻次經(jīng)過換算為39.09[(70/17909)x10000)次/每萬詞。。
在本部分,我們將從長度和功能兩個角度對中美大學(xué)生英語演講詞中詞塊的使用進行研究。
2~7詞詞塊在中美大學(xué)生英語演講詞中的頻次如表1所示。
表1 英語演講詞中詞塊的長度分布
由表1可見,就詞塊的長度而言,中美大學(xué)英語演講詞中詞塊使用的頻次由低到高依次為7詞詞塊<6詞詞塊<5詞詞塊<4詞詞塊<3詞詞塊,即詞塊越長,出現(xiàn)頻次越低。Biber等基于學(xué)術(shù)語篇和對話的研究表明,“一般而言,詞語單位越長,在語料庫中出現(xiàn)的頻率越小”[21]990,作為一種語言單位的詞塊也不應(yīng)例外,這已得到了張艷研、李文中和張寧等研究的驗證[10][22][23]。李文中對中國英語的研究得出了“詞簇長度越大,復(fù)現(xiàn)頻率越小”[22]的結(jié)論。張艷研對2~4詞詞塊研究結(jié)果顯示,2詞詞塊所占的比例最大,3詞詞塊次之,4詞詞塊較少[10]。張寧對美國總統(tǒng)就職演說詞中詞塊的使用研究也表明,詞塊的出現(xiàn)頻率隨著其長度的增加而遞減[23]。我們對中美大學(xué)生英語演講詞的研究再次證實了Biber等的結(jié)論。從表1可以看出,由3詞詞塊到7詞詞塊,隨著詞塊增長,不管是中國大學(xué)生,還是美國大學(xué)生,演講詞中詞塊的頻次一直在下降,圖1比較形象呈現(xiàn)了這種特征。
圖1 詞塊長度的頻數(shù)分布
由表1還可見,除了5詞詞塊(按標準頻次)外,在其他類型詞塊的使用上,美國大學(xué)生均高于中國大學(xué)生。此外,由表1還可見,2~7詞詞塊分別在中美大學(xué)生英語演講詞中占80.96%和91.01%。Altenberg在其研究中聲稱,實際語言輸出中的70%都是通過詞塊實現(xiàn)的[4]。我們通過研究得出的這兩個比例均高于Altenberg的比例,這充分表明演講詞高度詞塊化的特征。對表1數(shù)據(jù)整理后還發(fā)現(xiàn),中美大學(xué)生在演講詞中使用較多的是3詞詞塊和4詞詞塊,分別占68.13%和80.72%。就詞塊長度而言,對中美大學(xué)生詞塊使用頻次的卡方檢驗顯示,二者存在顯著差異(X2=175.023,df=9,p=.000,<.01)。這在一定程度上說明,盡管“21世紀杯”英語演講賽的冠、亞軍代表了中國英語演講者中的較高水平,但與同為學(xué)習(xí)者的美國大學(xué)生在詞塊的使用上還存在較大差距。王立非和錢娟對中英演講選手的詞塊使用研究也發(fā)現(xiàn),二者之間存在著顯著差異[18]。所不同的是,王立非和錢娟比較的是中國演講選手和英國本族語演講者的演講詞,而我們比較的是中美大學(xué)生演講者的演講詞。
Biber、Concrad和Cortes區(qū)分了詞束所起的三種功能:表述立場、組織語篇和指稱[24]。立場類詞束表明人們對命題肯定性的態(tài)度/評價,如we need to,I would like to;組織語篇類詞束反映前后語篇之間的關(guān)系,如last but not least,first of all;指稱類詞束直接指向具體/抽象的實體,或語篇語境本身,或者指認實體/把實體某一點特征凸現(xiàn)出來[24],如more and more,from all over the world[24]。任小華對大學(xué)英語教材中的詞塊進行研究后,發(fā)現(xiàn)Biber,Concrad和Cortes對詞束的三種功能的區(qū)分也適用于詞塊的研究[25]。在英語演講過程中,演講者需要在某種程度上表述自己的立場,也需要將前后話語有機聯(lián)系起來,更不可避免地會指稱人、物、時間、地點和事件等,故在本部分我們從表述立場、組織語篇和指稱角度對中美大學(xué)生英語演講中的詞塊進行研究,按三種功能對詞塊的頻次進行整理,如表2所示。
表2 英語演講詞中詞塊的功能分布①在表1和表2中,中美大學(xué)生使用的詞塊總數(shù)不一致,主要是重復(fù)計算了中國大學(xué)生的立場詞塊和組篇詞塊,如like to begin with,這樣的詞塊可以看作立場詞塊,也可以看作組篇詞塊;美國大學(xué)生則有部分詞塊無法歸入上述三類。
由表2可見,中國大學(xué)生使用的指稱詞塊最多,其次為組篇詞塊,最后為立場詞塊,美國大學(xué)生使用的指稱詞塊也最多,但其次是立場詞塊,最后是組篇詞塊。由此可見,不論是中國大學(xué)生還是美國大學(xué)生,在演講詞中使用指稱詞塊的頻次最高,這與Biber、Concrad和Cortes和任小華的研究結(jié)論一致[24-25]。Biber、Concrad和Cortes對教材中詞塊的研究顯示,頻次在每百萬次20詞以上的指稱詞塊遠遠多于立場和組篇詞塊[24]。任小華對我國大學(xué)英語教材的研究發(fā)現(xiàn),指稱詞塊數(shù)量也最多[25]。Biber、Concrad,Cortes、任小華和我們的三項研究在一定程度上表明,指稱詞塊是教材和演講詞中主要的詞塊類型。
由表2還可見,美國大學(xué)生對立場和指稱語塊的使用頻次高于中國大學(xué)生,而他們對組篇詞塊的使用卻比中國大學(xué)生低,圖2比較形象呈現(xiàn)了這一特征。
圖2 詞塊的功能分布
卡方檢驗表明,總體而言,中美大學(xué)生在語篇功能詞塊的使用上存在顯著差異(X2=44.797,df=5,p=.000,<.01)。為了探明中美大學(xué)生在立場、指稱和組篇詞塊使用上有無差異以及差異到底有多大,我們對這三類詞塊進行了對數(shù)似然性檢驗(Log-likelihood test)②計算工具由曲阜師范大學(xué)秦洪武老師在上海交通大學(xué)2013年語料庫翻譯學(xué)暑期講習(xí)班上提供。,LL值和顯著性如表3所示。
表3 英語演講詞中三類詞塊功能的對數(shù)似然性檢驗
由表3可見,中美大學(xué)生在演講詞中對立場和指稱詞塊的使用存在顯著差異(p分別等于.002和.000,均小于.01),他們對組篇詞塊的使用雖然存在差異,但不顯著(p=.335,>.01)。
既然“詞塊能力是語言能力的一項重要指標”[1],并且本族語者高頻使用口語化程度很高的詞塊[18],那么作為本族語者的美國大學(xué)生對詞塊使用在數(shù)量上應(yīng)該優(yōu)于英語作為外語的中國大學(xué)生,然而,我們的研究數(shù)據(jù)顯示,中國大學(xué)生對5詞詞塊和組篇詞塊的使用均高于美國大學(xué)生,是中國大學(xué)生超用了這兩類詞塊,還是另有他因,語料庫方法難以對此做出解釋,我們將在后續(xù)研究中予以關(guān)注。
基于自建語料庫,本文對中美大學(xué)生演講詞中的詞塊的長度和功能進行了研究,結(jié)果表明:就詞塊的長度而言,詞塊的使用頻次隨著其長度的增加而下降;除了5詞詞塊外,在其他類型詞塊的使用頻次上,美國大學(xué)生均高于中國大學(xué)生;中美大學(xué)生在演講詞中對詞塊的使用總體上存在顯著差異。就詞塊的功能而言,中美大學(xué)生對指稱詞塊的使用最頻繁,但對立場和組篇詞塊的使用順序則相反;美國大學(xué)生對立場和指稱語塊的使用頻次高于中國大學(xué)生,而他們對組篇詞塊的使用卻比中國大學(xué)生低;中美大學(xué)生在組篇詞塊的使用總體上存在顯著差異。此外,他們在立場和指稱詞塊的使用上也存在顯著差異,在組篇詞塊的使用上也存在差異,但不顯著。
本研究還存在三個問題。第一,自建的中美大學(xué)生英語演講詞語料庫容較小,難以對詞塊進行全面深入的考察。第二,軟件提取后對詞塊的認定依然沒有公認的標準,人為因素的介入在一定程度上影響了對詞塊的確定。第三,對詞塊的其他功能,如語法功能,本文沒有考察。我們將在后續(xù)研究中盡可能多收集有代表性的中國大學(xué)生和英語本族語大學(xué)生的英語演講詞,并努力增加本族語者英語演講詞部分,除了讓中國大學(xué)生認識到他們與美國大學(xué)生演講詞中詞塊使用的異同外,也為他們提供可能的終極努力目標,即像本族語者那樣在演講中熟練靈活使用詞塊,從而使得他們的演講更地道。此外,后期我們將通過文獻閱讀并反復(fù)嘗試的辦法,為詞塊的識別提供較為科學(xué)的依據(jù)。我們還將考察不同類型和不同水平的演講者在使用詞塊時,他們在諸如語法功能、名詞詞塊、動詞詞塊等方面的特點。