王 靜
(遼寧師范大學(xué) 外國語學(xué)院,遼寧 大連 116029)
馬克·吐溫,美國19世紀(jì)偉大的作家,其作品集盎然有趣的生活體驗(yàn)、秀麗的自然風(fēng)光和豐富多彩的冒險(xiǎn)經(jīng)歷為一體,同時(shí)充滿了幽默和諷刺,并將其作為一種抨擊當(dāng)時(shí)美國社會(huì)不合理現(xiàn)實(shí)的手段。《哈克貝利·費(fèi)恩歷險(xiǎn)記》(1884)是馬克·吐溫的代表作,也是美國文學(xué)史上一部影響深遠(yuǎn)的作品。故事的主人公是在《湯姆·索亞歷險(xiǎn)記》中就跟讀者見面的哈克貝利·費(fèi)恩。小說的中心情節(jié)是講白人孩子哈克和黑奴吉姆如何結(jié)下深厚友誼的故事。哈克為了逃避酒鬼父親的虐待,逃到一座小島上,巧遇逃奴吉姆,兩人結(jié)伴而行,企圖從密西西比河上逃往北方的自由州?!豆素惱べM(fèi)恩歷險(xiǎn)記》歷來備受學(xué)者的廣泛關(guān)注,但研究出發(fā)點(diǎn)大多是基于定性的。本研究將從計(jì)算文體學(xué)的角度對(duì)其進(jìn)行定量研究。
現(xiàn)在,許多暢銷書籍出版的續(xù)篇,大多是基于商業(yè)利益,借助于已經(jīng)積累的人氣,而自身的可讀性很低。那為什么馬克·吐溫的續(xù)篇《哈克貝利·費(fèi)恩歷險(xiǎn)記》獲得了很大的成功,甚至比《湯姆·索亞歷險(xiǎn)記》更受歡迎呢?本文試圖從詞匯層面對(duì)小說進(jìn)行計(jì)算文體學(xué)的分析來尋求解析,通過對(duì)比《哈克貝利·費(fèi)恩歷險(xiǎn)記》和《湯姆·索亞歷險(xiǎn)記》兩篇文本的詞長、詞匯密度和關(guān)鍵詞來揭示其詞匯特點(diǎn),從而為以后的英語寫作提供一些可靠的參考建議。
哈特曼和斯托克在《語言與語言學(xué)詞典》中指出:文體是個(gè)人或集體在談話或?qū)懽髦羞\(yùn)用語言的方式[1]。文體學(xué)源自古代亞里士多德的修辭論,是一門結(jié)合文學(xué)和語言學(xué)的交叉學(xué)科,是運(yùn)用語言學(xué)的理論去闡釋文學(xué)內(nèi)容和寫作風(fēng)格的一門學(xué)科。計(jì)算文體學(xué)是將計(jì)算機(jī)技術(shù)和計(jì)算主義思想應(yīng)用到語篇分析中,試圖給理論分析找出科學(xué)的數(shù)據(jù)證明[2]。Wales 將計(jì)算文體學(xué)定義為采用統(tǒng)計(jì)學(xué)和計(jì)算機(jī)輔助的分析方法來研究文體的各種問題[3]。通常文體學(xué)分為傳統(tǒng)文體學(xué)和計(jì)算文體學(xué),傳統(tǒng)文體學(xué)研究的重心在文學(xué)或非文學(xué)文本的審美特性上,而Craig認(rèn)為,通過計(jì)算技術(shù)才發(fā)現(xiàn)的語言現(xiàn)象是計(jì)算文體學(xué)主要的研究目標(biāo)[4]。可見計(jì)算文體學(xué)是用統(tǒng)計(jì)的理念分析文體,通過機(jī)器全面而快速地查找文體標(biāo)記,從而捕捉到一些連作者自己也沒有意識(shí)到的寫作習(xí)慣。因此,計(jì)算文體學(xué)借助于計(jì)算技術(shù)的應(yīng)用補(bǔ)充了傳統(tǒng)文體學(xué)的分析方法。
文體學(xué)家Crystal 和Davy 曾深入研究過語言系統(tǒng)的形式和意義,把文體特征按照語言層級(jí)劃分為五大范疇。這五大范疇是:第一,句子間關(guān)系,它包括語義、語用、節(jié)律特征以及三者間的關(guān)系;第二,句子類型,它描寫句子的形式和句子的復(fù)雜性;第三,從句類型,它指句子中各從句之間的作用和關(guān)系;第四,短語,它描寫組成從句的各要素之間的作用和關(guān)系;第五,詞匯,它描寫句子中詞的形式和語音特征。[5]
本文基于詞匯層面,從詞匯密度、詞長和關(guān)鍵詞的角度對(duì)《哈克貝利·費(fèi)恩歷險(xiǎn)記》和《湯姆·索亞歷險(xiǎn)記》兩文本進(jìn)行比較探究。為了測(cè)量文本中詞匯的豐富程度,采用類符/形符比(type/token ratio,TTR),即一個(gè)文本中出現(xiàn)的不同單詞總數(shù)與實(shí)際出現(xiàn)的單詞總數(shù)之比。Baker 指出類符/形符比值的高低與寫作者詞匯使用的豐富程度和多樣性成正比。她還認(rèn)為,當(dāng)所比較的文本長度不同時(shí),標(biāo)準(zhǔn)化的類符/形符比值(standardized TTR)更為可靠[6]。
本研究主要采用定量技術(shù)。為了保證數(shù)據(jù)分析的客觀可靠,采用語料分析軟件Oxford Wordsmith Tools、社會(huì)科學(xué)統(tǒng)計(jì)軟件SPSS、卡方檢驗(yàn)和T 檢驗(yàn)。Oxford Wordsmith Tools 包含多個(gè)高效的語料分析功能,主要有索引(concordance)、詞頻列表(wordlist)和關(guān)鍵詞分析(keyword)。本文使用詞頻列表來分析文本單詞的類型,使用關(guān)鍵詞分析來列舉文本中所有的關(guān)鍵詞。SPSS 是世界上最早的統(tǒng)計(jì)分析軟件,主要用于調(diào)查數(shù)據(jù)的處理,并且能建立、編輯和清理數(shù)據(jù)文件及對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析等。卡方檢驗(yàn)是通過比較兩篇文本單詞的類符的頻率來看是否存在顯著性差異。T 檢驗(yàn)用于測(cè)量兩篇文本中由詞頻列表產(chǎn)生的數(shù)據(jù),這樣可以在一定程度上用科學(xué)的方法證明文本表層的差異。
為研究《哈克貝利·費(fèi)恩歷險(xiǎn)記》(以下簡稱《哈克》)的詞匯特征,采用《湯姆·索亞歷險(xiǎn)記》(以下簡稱《湯姆》)做參照文本,通過比較兩文本的差異來解釋為什么《哈克》比《湯姆》更受歡迎。
《哈克》和《湯姆》兩文本的詞匯密度見表1。
表1 兩文本的詞匯密度
通過對(duì)比表1中的數(shù)據(jù)看到,《哈克》的形符比《湯姆》的形符多出42 783個(gè),而前者的類符卻比后者的類符少了1694個(gè),從形符到類符的數(shù)量,《哈克》減少得比《湯姆》更顯著。同時(shí),《哈克》與《湯姆》的類符/形符比分別是5.23 和10.57,而標(biāo)準(zhǔn)化的類符/形符比分別是42.56 和35.55。眾所周知,標(biāo)準(zhǔn)化的類符/形符比值越高,文本的詞匯密度越低,可見,在《哈克》中詞匯的重復(fù)度要高于《湯姆》。對(duì)于平均句長,《哈克》的平均句長3.63 要小于《湯姆》的4.05,如果與布朗語料庫(世界上第一個(gè)根據(jù)系統(tǒng)性原則采集樣本的標(biāo)準(zhǔn)語料庫,選自美國人撰寫出版的普通語體的文本)的平均句長4.66 相比,《哈克》的易讀性顯而易見。
為了知道《哈克》和《湯姆》在類符/形符比值中是否存在顯著性差異,采用卡方檢驗(yàn)。兩文本的形符/類符比值的卡方檢驗(yàn)結(jié)果如表2所示。從表2中可以看出,雙尾的顯著性差異檢測(cè)低于0.05,這就表明《哈克》和《湯姆》在類符/形符比值中存在顯著性差異。
表2 兩文本的形符/類符比值的卡方檢驗(yàn)結(jié)果
詞長是詞匯分析的一個(gè)重要手段。文本中使用的單詞越短越簡單,語言就越簡單、易懂。表3顯示了兩文本中包含1個(gè)到16個(gè)字母單詞的頻數(shù)。
表3 兩文本中包含1個(gè)到16個(gè)字母單詞的頻數(shù)
從表3中可以看出2個(gè)、3個(gè)和4個(gè)字母的單詞在《哈克》和《湯姆》中普遍使用,而對(duì)于10個(gè)及以上字母的單詞,《哈克》的使用明顯要少于《湯姆》,可見馬克·吐溫在寫作中更加傾向于使用短單詞。下面使用T 檢驗(yàn)檢測(cè)《哈克》和《湯姆》在詞長的使用上是否存在顯著性差異。表4為詞長配對(duì)樣本T檢驗(yàn)結(jié)果。從表4可以看出,P 值為0.015,其值小于0.05,可見《哈克》和《湯姆》在詞長使用上存在顯著性差異。
表4 詞長配對(duì)樣本T 檢驗(yàn)結(jié)果
通過使用Wordsmith 的關(guān)鍵詞功能,《哈克》的30個(gè)關(guān)鍵詞按詞性列在表5中。
表5 《哈克》的30個(gè)關(guān)鍵詞
由表5可知,其中關(guān)鍵詞的非標(biāo)準(zhǔn)形式占了整個(gè)文本的20%,《哈克》文本中大量使用不規(guī)范的拼寫和表達(dá)方式,是由于作者馬克·吐溫對(duì)美國南部地方方言和個(gè)人言語的偏好,這些使得語言更加地道、地方性和口語化。名詞Jim,duke,king,nigger的使用暗含一種尖銳的社會(huì)和道德價(jià)值。所謂的“公爵”和“國王”到頭來只不過是詐取別人錢財(cái)?shù)尿_子,而那個(gè)“忘恩負(fù)義出逃的”奴隸卻是心地善良、體貼他人的朋友。通過對(duì)哈克貝利·費(fèi)恩心理沖突和最后決定的生動(dòng)描述,讀者自身也能知道如何去辨別是非與對(duì)錯(cuò)。名詞canoe,raft 的出現(xiàn)對(duì)于描寫密西西比河美不勝收的景色起到了重要作用,寬廣而未知的密西西比河使得哈克的冒險(xiǎn)更加引人入勝。代詞中關(guān)鍵詞I,we,me,my 的出現(xiàn),證明了《哈克》成功地使用了第一人稱敘述故事,使讀者對(duì)哈克的經(jīng)歷確信無疑,增加了小說的真實(shí)性,同時(shí)也為讀者提供了一個(gè)感受小說敘述事件的最佳視角,使讀者對(duì)主人公的心路歷程、經(jīng)歷及當(dāng)時(shí)美國社會(huì)的現(xiàn)實(shí)狀況能感同身受,真實(shí)清晰地體驗(yàn)。
本文將《湯姆·索亞歷險(xiǎn)記》作為參照文本,研究了馬克·吐溫知名的續(xù)篇《哈克貝利·費(fèi)恩歷險(xiǎn)記》的詞匯特征,得到以下結(jié)論:首先,在詞匯密度方面,《哈克》比《湯姆》有更多的形符,但是更少的類符,并且通過卡方檢驗(yàn),發(fā)現(xiàn)它們?cè)陬惙?形符比值中存在顯著性差異。其次,在詞長方面,平均而言,《哈克》比《湯姆》少一個(gè)字母,并且通過T 檢驗(yàn),發(fā)現(xiàn)它們?cè)谠~長使用上存在顯著性差異。最后,《哈克》中關(guān)鍵詞占用的比重較大,并且關(guān)鍵詞的口語性充分體現(xiàn)在非標(biāo)準(zhǔn)形式的地方方言中。總之,這兩篇小說非常適合低年級(jí)孩子閱讀,故詞長較短和類符/形符比值較低是有利于閱讀理解的。
本研究對(duì)學(xué)生在英語寫作中如何選詞提供了更好的理據(jù),同時(shí)也為他們對(duì)文學(xué)作品的深刻理解提供了平臺(tái),從而促進(jìn)其寫作實(shí)踐能力的提高。但本研究使用的計(jì)算文體學(xué)分析方法,就本質(zhì)而言是解釋性的,并且沒有涉及文學(xué)作品的語音、語法和語義層面。除此之外,在詞匯層面,由于空間的限制,重疊詞和特殊詞沒有考慮,這就為以后的研究提供了更多的空間。
[1]哈特曼,斯托克.語言與語言學(xué)詞典[M].上海:上海辭書出版社,1981:335-336.
[2]胡壯麟.理論文體學(xué)[M].北京:外語教學(xué)與研究出版社,2000:138.
[3]WALES K.A dictionary of stylistics[M].2nd ed.London:Longman,2001:74.
[4]SCHREIBMAN S,SIEMENS R,UNSWORTH J.A companion to digital humanities[M].Oxford:Blackwell Publishing,2004:318.
[5]CRYSTAL D,DAVY D.Investigating English style[M].London:Longman,1969.
[6]BAKER M.Towards a methodology for investigating the style of a literary translator[J].Target,2000,12(2):241-266.