摘要本文基于語料庫的方法,對《中國日報》(英文版)和《紐約時報》財經新聞報道的語言特點進行對比分析。
關鍵詞語料庫 財經新聞報道 對比分析
中圖分類號:H313文獻標識碼:A
1 引言
語料庫語言學是一種新興的語言學研究方法,近幾十年來發(fā)展迅速,逐漸成為語言學研究的一股潮流。語料庫是按照一定原則收集的電子文本集合,能夠用專門檢索軟件進行統(tǒng)計分析。語料庫語言學是用檢索工具對語料庫進行檢索,并以此來分析語料庫文本語言特點的研究方法。語料庫為研究文本的語言特點和結構提供了量化的工具。隨著計算機和相關技術的發(fā)展,基于語料庫的研究方法將更加準確、可靠,這為語料庫語言學的進一步發(fā)展奠定了基礎。
通過對單個文本的檢索,能夠分析該文本的語言特征;對集合了同類文本對單個文本的檢索,能夠分析該文本的語言特征;對集合了同類文本的語料庫進行檢索,能夠對該語料庫的整體語言特點進行描述。Chafe總結了書面語和口語語體的兩點區(qū)別:語篇結構的緊密性和分散性以及作者觀點態(tài)度的參與性和分離性。根據(jù)Chafe的研究,書面語體結構上更為緊密,作者的參與性較弱,與讀者的互動較少;而口語語體的分散性較強,作者的態(tài)度的分離性較弱,作者與聽眾的互動較多。
本文基于語料庫方法,以Chafe的理論為基礎,對《中國日報》和《紐約時報》兩家媒體英文財經報道的語言特征進行對比分析。研究過程中,自建兩個小型語料庫,分別命名為“Coverage of China Daily(CCD)”和“Coverage of New York Times(CNYT)”。本文的研究方法采用Chafe概括的兩分法:文本結構的緊密性和分散性以及作者態(tài)度的參與性和分離性。
2 資料收集與數(shù)據(jù)分析
語料庫的代表性和規(guī)模,是影響其分析結果有效性和可靠性最重要的兩個因素。語料庫包含的文本數(shù)、文本種類、各類文本所占的比重等諸多因素都會影響其代表性,在構建語料庫時必須加以考慮。該研究中,選用的文本來自兩家新聞媒體網站上的財經新聞,時間是從2009年12月到2010年1月。為確保語料庫的代表性,所選用的文本盡量涵蓋經濟生活各個領域。
語料庫規(guī)模是影響分析結果有效性的另一重要指標。一般而言,規(guī)模越大,統(tǒng)計結果就越準確;但考慮到時間、投入等的影響,語料庫規(guī)模能滿足研究目的即可。在該研究中,語料庫的樣本都是從網上選取的自然語篇,樣本數(shù)都是300。將兩家媒體網站上的新聞文本復制到txt.文件中,再進行必要的格式調整和標注,以便使用檢索軟件。為保持語料庫代表性,作者姓名和日期都被刪除,只保留標題和正文。
3 數(shù)據(jù)分析
本文選用的檢索工具是Antconc3.2 和Concordance Text Analysis 3.2,二者合用能提供比較詳細的信息。語料庫對比分析由兩個方面展開:文本結構的緊密性和分散性以及作者態(tài)度的參與性和分離性。
3.1 緊密型和分散性
本文從詞匯和句子兩個層面對語篇結構緊密性和分散性進行分析。詞匯層面的因素有平均詞長、話語標識、邏輯連接詞、詞匯密度等,句子層面的分析因素主要是平均句長。
3.1.1 平均詞長
Grzybek認為,平均詞長是影響文本類型的重要因素。平均詞長越大,文本的專業(yè)性、復雜度越高,緊密性一般也就越高。Biber指出,在書面語體,尤其是學術性語言中,更傾向于使用較長的詞匯,以表達更為具體或專業(yè)的意義;而在其他場合,如口語中,小詞的運用則更為普遍。本文所使用的檢索軟件不能直接統(tǒng)計出語料庫的平均詞長,但可以通過以下的公式求出:
平均詞長=字符數(shù)/形符數(shù)
字符數(shù)是指除去空格以后所有字符的數(shù)量,即語料庫中所有詞匯包含的字母總數(shù)。數(shù)據(jù)表明,語料庫CCD和CNYT 的平均詞長比較接近,CCD要稍大一些。這可能是由于中美作者用詞習慣不同造成的?!吨袊請蟆返淖髡叽蠖嗍侵袊?,傾向于使用大詞來表達,而《紐約時報》的作者大都以英語為母語,能夠運用小詞來準確、靈活地表達。
3.1.2 平均句長
平均句長對句子的復雜度有很明顯的影響。句子越長,句子所表達的意義和結構就越復雜,緊密性也就越強。所建立的兩個語料庫在平均句長方面的差距比較明顯。CCD的平均句長為16.74,遠低于CNYT的19.16。從這個方面來說,CNYT中語篇的句子結構更為復雜,文本的緊密性也就更強。
3.1.3 話語標記
話語標記的功能在于保持口語中前后話題的連續(xù)性或促使話題順暢。話語標記不僅用于英語口語,它們也常見于書面語。在CCD中,每千形符中話語標記出現(xiàn)的平均頻次為29.1,而CNYT中每千形符的頻次是32.3??梢?,CNYT中的文本話題的連續(xù)性更強。
表1話語標記
3.1.4 邏輯連接詞
話語標記在口語中運用比較普遍,用來維持話題和內容的連續(xù)性;在書面語中則更多使用邏輯連接詞。邏輯連接詞對文本緊密性的影響很大,能使語篇結構更加緊湊。Ochs 指出,邏輯連接詞所代表的話題之間的關系要比話語標記更精確、具體、嚴密,大量使用邏輯連接詞會使語篇結構非常嚴謹。
3.1.5 詞匯密度
詞匯密度是指文本中實詞出現(xiàn)的頻次與總形符數(shù)的比值。實詞主要包括名詞、動詞、形容詞、副詞等,具有很強的表意功能;而其他諸如介詞、助詞之類的語法詞匯主要是結構上的功能。詞匯密度較高,蘊含的信息量較大;詞匯密度越低,傳遞的信息相對較少,而語篇的機構會更緊湊。CCD的詞匯密度要高于CNYT,這說明CCD的語篇更著重于傳遞信息,而CNYT的結構緊密性更強一些。
表2詞匯密度
3.2 參與性和分離性
參與性和分離性是判定作者對所論述問題的觀點和態(tài)度的重要指標。在寫作時,如果作者較明顯地表現(xiàn)出他們的情感或態(tài)度,作者的參與性就較強,與讀者的互動就較明顯。根據(jù)Chafe的研究,口語的參與性比較強,作者與聽眾的互動比較頻繁;而在書面語中,分離性更明顯,作者更傾向于傳遞信息。判斷參與性和分離性的指標主要有第一、第二人稱和被動語態(tài)。
3.2.1 第一、第二人稱的使用
第一、第二人稱的頻繁使用會提高文本的參與性。第一、第二人稱在口語中的應用比較普遍,而第三人稱在書面語中的出現(xiàn)頻次更高。另一方面,大多作者在表達時一般會追求客觀,尤其是在科技或行政等語域中,從而刻意減少第一、第二人稱的使用,使文章說服力更強。因此,我們可以通過分析第一、第二人稱的使用來判定作者的參與性和分離性。本文發(fā)現(xiàn)CCD 中,平均每千形符第一、第二人稱出現(xiàn)的次數(shù)明顯少于CNYT,見表4。從該角度而言,CCD中的文本分離性更強,CNYT的參與性更強。
表3第一、第二人稱代詞
3.2.2 被動語態(tài)
Chafe認為,使用被動結構能降低文本的參與性。被動語態(tài)通常能將句子中的主語如“I”、“We”等隱去,使得其表達的觀點顯得更加客觀可信。本文所使用的軟件不能直接檢索出被動語態(tài)在語料庫中出現(xiàn)的頻次,但可以通過一些間接的指標來統(tǒng)計被動語態(tài)的使用,例如介詞“by”的使用,“be”動詞后面跟動詞-ed形式的頻次等?!癰y”偶爾會用在形容詞性詞組之中,但主要是用來引導被動語態(tài)的施動者。盡管有一部分動詞是不規(guī)則的,但大多數(shù)都是規(guī)則的,動詞的過去分詞大都是以-ed結尾,因此可以通過檢索“to be *ed”來統(tǒng)計被動結構的使用。本文通過檢索介詞“by”和“be *ed”的頻次大概統(tǒng)計被動結構出現(xiàn)的次數(shù)。由“am”引導的“am *ed”在分析時略去,因為這種結構未能隱去主語“I”,不能降低文本的分離性。
根據(jù)統(tǒng)計數(shù)據(jù),“by”和“be *ed”每千形符平均出現(xiàn)的頻次都是CCD高于CNYT。可以推測CCD中被動語態(tài)的使用比CNYT更為普遍。這表明CCD的分離性比CNYT要高。
4 討論
本文基于語料庫方法,在Chafe關于口語和書面語對比分析兩分法的理論基礎上,對《中國日報》和《紐約時報》英文財經新聞報道的語言特點和結構進行對比分析。分析表明,《紐約時報》的財經報道結構上更加緊密,作者在表達觀點時參與性較強;而《中國日報》財經新聞語篇結構的分散性和作者表達觀點的分離性都更強。一方面,這是由中國特殊的國情造成的。我國堅持中國特色社會主義道路,形成了獨特的經濟發(fā)展模式;中國還有獨特的文化傳統(tǒng),作者在寫作時不可避免受到傳統(tǒng)思維習慣和文化的影響。此外,中國的財經報道作者大多是中國人,英語是第二外語,語言掌握程度影響了表達,與英美等國相比,在語言運用上存在差距。再次,中國的財經新聞篇幅更短小,大多是淺顯的事實報道,沒有專業(yè)的深入分析,這也折射出我國英文財經新聞領域專業(yè)人才的匱乏。
本文由中國礦業(yè)大學大學生科研創(chuàng)新計劃項目資助
參考文獻
[1]Kennedy G. An Introduction to Corpus Linguistics [M]. London: Addison Wesley Longman, 1998. 1~2.
[2]楊惠中. 語言學導論[M]. 上海:上海外語教育出版社, 2002.152~161.
[3]Chafe W. Integration and involvement in speaking, writing, and oral literature [C]. // Tannen D. Spoken and Written language: exploring orality and literacy. Norwood,?N.J.:?Ablex?Pub. Corp., 1982. 35~53.
[4]Biber D. Representativeness in corpus design [J]. Literary and Linguistic Computing, 1993 8(4):243~257.
[5]Grzybek P etc. Quantitative text typology: the impact of word length [C]. // Jahrestagung, Claus Weihs, Gesellschaft f€黵 Klassifikation,?Wolfgang Gaul. Classification, the ubiquitous challenge. University of Dortmund, 2004:53~64.
[6]Biber D. Variation across speech and writing [M]. Cambridge: Cambridge University Press, 1988.
[7]Flowerdew J. Variation across speech and writing in biology: a quantitative study [J]. Perspectives. City university of Hong Kong, 1993.
[8]Ochs E. Planned and Unplanned Discourse [C]. //Talmy Giv€髇. Discourse and Syntax, Syntax and Semantics. New York: Academic Press, 1979:51~80.