石春讓 鄧林
(1.西安外國語大學(xué) 英語實驗基地,陜西 西安 710128;2.西安外國語大學(xué) 英文學(xué)院,陜西 西安 710128)
當(dāng)前,在中國文學(xué)對外傳播過程中,全球化的電子商務(wù)是重要的一個傳播渠道。西方的普通消費者可以通過電商平臺購買中國文學(xué)譯介讀本,并通過電商平臺的商品評論機(jī)制反饋閱讀感受。此類消費者在一定程度上代表著廣大的讀者群體。他們不同于專業(yè)書評人,他們的評論反映了中國文學(xué)譯介讀本的真正消費者的意見。歸納總結(jié)這類讀者的網(wǎng)絡(luò)評論能更真實地反映出西方普通消費者對中國文學(xué)譯介讀本的接受特點(張璐,2019:81)。通過應(yīng)用計算機(jī)情感分析(Sentiment Analysis)技術(shù),可以突破人工分析的局限性,能夠高效率的批量處理大量評論數(shù)據(jù),并進(jìn)行分析歸納,因此網(wǎng)絡(luò)平臺的用戶評論擁有更高的研究價值(李涵昱 等,2017:51)。本研究選取近年來具有重大國際影響力的中國傳統(tǒng)文學(xué)作家莫言的小說為例,對葛浩文翻譯的11部莫言小說英譯本在西方電商平臺的所有購買評論進(jìn)行情感分析,歸納出西方讀者群體的代表性評論,進(jìn)而評判莫言小說在西方國家普通讀者群體中的接受態(tài)度與特點。
情感分析(Sentiment Analysis),又稱意見挖掘(Opinion Mining),是指能夠?qū)ξ谋居^點、情感以及主觀性進(jìn)行計算分析的計算機(jī)信息技術(shù)。作為自然語言處理中的一條重要分支,情感分析可以在不同的文本層級上完成相應(yīng)的自然語言處理任務(wù)(Pang et al., 2004:271)。應(yīng)用情感分析技術(shù),可以識別和理解他人的觀點態(tài)度,使得人們能夠積極應(yīng)對網(wǎng)絡(luò)信息資源帶來的機(jī)遇與挑戰(zhàn)(Pang et al., 2008:5)。根據(jù)文本的不同層級,文本情感分析可細(xì)分為針對詞匯、句子以及篇章三個層面的情感信息識別與分類。由于本研究中的文本研究對象為用戶評論,屬于篇章層面,因此本文主要討論篇章層面情感分析的方法及原理。總體而言,針對篇章的情感分析綜合了詞匯以及句子的情感分析模式,并且在輸出結(jié)果的準(zhǔn)確性上也大程度上依賴于詞匯以及句子的情感分析結(jié)果信度,此外,篇章情感分析還需考慮到文本上下文語境,因此篇章情感分析在方法原理上更為復(fù)雜(楊立公 等,2013:1574-1575)。
目前,針對篇章的情感分析主要有兩種方法,分別是基于情感詞典的分析方法和基于統(tǒng)計機(jī)器學(xué)習(xí)的分析方法(李涵昱 等,2017:52)。兩種方法各有優(yōu)劣,針對不同屬性的目標(biāo)文本具有不同的適用性。其中基于情感詞典的文本情感分析主要依賴預(yù)設(shè)的情感詞典來計算目標(biāo)文本的情感極性并進(jìn)行情感分類。一般來說,情感詞典由已標(biāo)注情感值的情感詞匯單元或詞匯組合單元構(gòu)成。在進(jìn)行情感分析時,情感詞典可以識別和提取目標(biāo)文本中的情感詞,并根據(jù)詞典數(shù)據(jù)匹配相應(yīng)的單個情感詞的情感值,通過求和或加權(quán)平均等算法計算出目標(biāo)文本總體的情感值,進(jìn)而判斷目標(biāo)文本的情感傾向。可以直接使用現(xiàn)有的較為權(quán)威的情感詞典,如General Inquirer lexicon,Sentiment lexicon等(楊立公 等,2013:1576)。也可以根據(jù)研究對象的特殊性構(gòu)建專用的情感詞典,以保證情感計算和分類的準(zhǔn)確性?;谇楦性~典的文本情感分析方法可以快速準(zhǔn)確地識別并計算詞典收錄詞及相應(yīng)的情感值,整體操作難度也相對較低。然而,其局限性在于不能準(zhǔn)確地計算詞典非收錄詞的情感值(楊立公 等,2013:1575)。
基于統(tǒng)計機(jī)器學(xué)習(xí)的文本情感分析方法主要依賴于使用機(jī)器學(xué)習(xí)模型,將已標(biāo)注的文本作為訓(xùn)練集訓(xùn)練出文本情感分類器,并基于此分類器對新的目標(biāo)文本進(jìn)行情感分析。通常用于訓(xùn)練文本情感分類器的機(jī)器學(xué)習(xí)模型有K近鄰算法、最大熵模型、支持向量機(jī)和樸素貝葉斯模型(李涵昱,2017:52)。其中,支持向量機(jī)與樸素貝葉斯模型在訓(xùn)練文本分類器時被多數(shù)相關(guān)研究證明具有較好的效果(楊立公 等,2013:1576)。基于統(tǒng)計機(jī)器學(xué)習(xí)的文本情感分析方法,可以對任意詞語情感預(yù)測,但仍然不能準(zhǔn)確有效的處理含有復(fù)雜情感的文本以及特殊領(lǐng)域的文本,重新訓(xùn)練適配的分類器需要收集大量數(shù)據(jù),操作難度也相對較大。因此,針對特殊文本,根據(jù)此方法是一種相對較為簡便,省時且準(zhǔn)確的方法。
目前,情感分析主要被應(yīng)用在產(chǎn)品評論分析,輿情分析以及信息預(yù)測三個方面(趙妍妍 等,2010:1843-1844),并已獲得較好的研究成果。
近年來,中國文化“走出去”成為中國重要的國策和主要文化潮流。在中國文化“走出去”的過程中,中國當(dāng)代文學(xué)的譯介及評價是重要的工作之一。評價中國當(dāng)代譯介文學(xué)的傳播質(zhì)量,可以找出目前工作中的問題和不足,制定更加合適的中國文化對外傳播策略。
本文收集了英國和美國亞馬遜網(wǎng)站上11部莫言小說的葛浩文英譯本的所有讀者評論,基于情感分析技術(shù),量化普通在線消費者群體對于莫言小說的情感取向,并以此作為參考,總結(jié)莫言小說在西方英語讀者群體中的接受現(xiàn)狀和特點。
本研究以葛浩文所翻譯的11部莫言小說的英譯本的亞馬遜英語讀者的書評作為研究對象,通過TextBlob的情感極性分析功能,將每一條書評所包含的情感態(tài)度量化,用定量分析法在宏觀層面上說明莫言小說的英譯本在英語讀者群體中的總體接受程度。基于情感分類后的讀者評論,可以篩選出讀者的共同偏好和觀點,進(jìn)而反映出莫言小說在西方讀者群體中的宏觀接受特點。
本研究使用的輔助工具為TextBlob,它是由Steven Loria帶領(lǐng)團(tuán)隊基于Python語言開發(fā)的第三方程序庫,庫中整合了Pattern與NLTK工具包,可以完成一些常見的自然語言處理(NLP)任務(wù),如詞性標(biāo)注、文本分類、名詞短語抽取、情感分析等。
1)獲取原始分析文本并進(jìn)行預(yù)處理。分別從美國亞馬遜和英國亞馬遜網(wǎng)站上收集《紅高粱》《天堂蒜薹之歌》《酒國》《四十一炮》《豐乳肥臀》《生死疲勞》《檀香刑》《變》《蛙》《透明的紅蘿卜》《師傅越來越幽默》十一部葛浩文英譯本的讀者評論,以文檔形式分別保存,截至2019年11月5日共收集評論536條。隨后對文檔中的評論文本進(jìn)行人工檢查,即替換或刪除原評論文本中無法被Python識別的字符,修正原評論文本中存在的錯誤拼寫以及重復(fù)輸入。通過以上程序可以達(dá)到人工文本降噪的效果,使得最終數(shù)據(jù)分析結(jié)果更加準(zhǔn)確可靠。
2)TextBlob情感分析。從Python中加載TextBlob程序庫,并調(diào)用其情感分析功能。如前文所提到的,TextBlob整合了Pattern和NLTK工具包,因此它具有兩種不同的情感分析器,分別為PatternAnalyzer和NaiveBayesAnalyzer。經(jīng)過實際運用發(fā)現(xiàn),針對本次研究的研究對象而言,讀者評論篇幅長短不一,基于機(jī)器學(xué)習(xí)的NaiveBayesAnalyzer常常不能有效地分析長文本,對于篇幅較長的單條評論來說,容易得出完全積極或完全消極的情感值,進(jìn)而以偏概全地影響最終結(jié)果。而基于情感詞典的PatternAnalyzer則不會受到目標(biāo)文本篇幅長短的影響,它通過將內(nèi)置情感詞典中被預(yù)先賦予情感值的詞匯與目標(biāo)文本中的詞匯進(jìn)行匹配,再根據(jù)加權(quán)平均的算法得出目標(biāo)文本情感極性值,計算結(jié)果不會出現(xiàn)極端值,因此本研究選擇使用PatternAnalyzer。通過PatternAnalyzer可以得出的情感極性值的范圍在-1到1之間,1和-1為情感值的上限和下限,分別為絕對積極情感和絕對消極情感。當(dāng)極性值處于0到1之間時,當(dāng)前評論被視為正向/積極評論;當(dāng)極性值處于-1到0之間時,當(dāng)前評論被視為負(fù)向/消極評論;當(dāng)極性值為0時,當(dāng)前評論被視為中性評論。將經(jīng)過情感分析的讀者評論以積極/消極評論為單位,歸納出兩類評論中普遍出現(xiàn)的觀點,可總結(jié)莫言小說在西方讀者群體中的總體印象。
通過對搜集到的536條讀者評論進(jìn)行情感極性分析后,經(jīng)過統(tǒng)計可得出表1數(shù)據(jù)。
表1 各類型評論的數(shù)量,占比以及均值
在所有評論中,正向的積極情感評論共410條,占比76.50%;中性情感評論共25條,占比4.66%;負(fù)向的消極評論共101條,占比18.84%。其中,正向的積極情感評論的情感極性均值為0.25,負(fù)向的消極評論的情感極性均值為-0.19。從情感分析得出的數(shù)據(jù)可看出,莫言小說英譯本在西方普通讀者群體中的接受情況較好,多數(shù)讀者對其作品持有積極評價。
根據(jù)分類后的讀者評論,可歸納出西方讀者針對莫言小說較為突出的正向和負(fù)向評價共同點,如表2所示,其中中性情感評論無實質(zhì)內(nèi)容和突出觀點,此處忽略不計。
表2 西方讀者評論中突出的正、負(fù)向觀點
通過對所有情感極性值大于0的積極正面評價進(jìn)行匯總歸納,,可以總結(jié)出讀者對莫言小說的共同偏好(即在各部作品評論中均提及的積極評論),以及讀者對莫言小說持有的普遍觀點。通過歸納分析,可總結(jié)出以下幾點。
3.2.1莫言的小說讓西方讀者了解近代中國的歷史,社會,政治,文化等多元化信息
74%的正向讀者評論反映了這一觀點。從以20世紀(jì)初清政府時期為故事背景的《檀香刑》到以20世紀(jì)末新中國農(nóng)村改革為故事背景的《四十一炮》,11部莫言小說反映了20世紀(jì)中國不同時期的社會現(xiàn)實,向西方讀者提供了一個了解近代中國歷史發(fā)展變遷的媒介。同時,莫言小說多以中國農(nóng)村為故事舞臺,更加突出了近代中國動蕩變遷的歷史對普通勞動人民的影響。因此,有讀者將莫言的作品稱為“極其絕妙的卻又樸實接地氣的中國近代史詩”(Guilford, 2012)。針對小說的歷史背景,一些讀者評論中提到,莫言是一位創(chuàng)作型作家,將歷史事件和政治事件描寫得淋漓盡致,讓西方讀者了解到了義和團(tuán)運動、日本侵華等20世紀(jì)中國具有代表性的歷史事件(Whipple, 2004),也讓西方讀者了解到了計劃生育和改革開放等中國具有代表性的社會政策(Biblioteca, 2015)。因此也有讀者認(rèn)為,莫言通過小說介紹了不為西方人所知的中國農(nóng)村日常生活(Thuringer, 2014)。從整體來看,莫言的小說很好的對外傳播了近代中國的人文發(fā)展歷程。
3.2.2莫言小說普遍具有幻覺現(xiàn)實主義色彩
21%的讀者在正向評論中共同提到莫言小說普遍具有幻覺現(xiàn)實主義色彩。多數(shù)讀者評論將莫言與拉丁美洲及其他地區(qū)的魔幻現(xiàn)實主義文學(xué)作者進(jìn)行橫向?qū)Ρ?,如加西亞·馬爾克斯、若澤·薩拉馬戈、薩爾曼·魯西迪、君特·格拉斯以及威廉·??思{等。有讀者稱“莫言是中國的加西亞·馬爾克斯”(Snaporaz, 2016)。有讀者表示《生死疲勞》通過魔幻現(xiàn)實主義手法講述一個村鎮(zhèn)在半個多世紀(jì)中的人民生死,婚姻和人際關(guān)系的變遷容易使人聯(lián)想到《百年孤獨》中布恩迪亞家族七代人的百年傳奇故事(Profane,2012)。而《豐乳肥臀》中對上官魯氏和她八個女兒將近一個世紀(jì)的命運描寫與《百年孤獨》在敘事對象上也存在共同點(Clara,2013)。同時,也有讀者提到薩爾曼·魯西迪的《午夜的孩子》,將其與《生死疲勞》作對比,認(rèn)為兩部作品在描述社會歷時變遷上具有相似性(Emilsson, 2014)。在《四十一炮》的評論中,有讀者表示《四十一炮》是對君特·格拉斯《鐵皮鼓》的致敬,兩部作品均通過超現(xiàn)實的手法描繪了一個精神心理不愿成熟的主人公所感知到的成人世界(Eustathios,2014),以此揭露成人世界中復(fù)雜的矛盾沖突。由此可見,莫言獨特的寫作風(fēng)格引起了多數(shù)西方讀者對于魔幻現(xiàn)實主義的共鳴??傮w而言,西方讀者對于莫言小說的寫作風(fēng)格持欣賞接納的態(tài)度。
3.2.3莫言和他的作品因2012年諾貝爾文學(xué)獎在西方獲得了廣泛的知名度和影響力
28%的讀者都在正向評論中提到,他們是通過諾貝爾文學(xué)獎得知莫言,并以此為契機(jī)開始接觸莫言的小說。誠如一些讀者所說,在2012年諾貝爾文學(xué)獎頒發(fā)之前,并不知道莫言這位中國作家(Brunyate, 2012),此后才開始購買和閱讀莫言的英譯小說。在西方讀者群體中,比起近現(xiàn)代中國大陸本土作家,外籍華裔作家歷來受到的關(guān)注度和流行程度更高,如譚恩美、鄺麗莎等,西方讀者從書籍中了解到的“中國元素”大多來自這些作家的作品(cotlar, 2012)。毫無疑問,諾貝爾文學(xué)獎對于莫言小說對外傳播的推進(jìn)作用是巨大的,不僅使得莫言的小說加速進(jìn)入了西方書籍市場,而且也讓西方讀者有機(jī)會了解到一位中國大陸作家?guī)Ыo他們的與以前不一樣的閱讀體驗和原汁原味的中國故事。
相比于正面積極評論,負(fù)面消極評論數(shù)量較少,僅占不到兩成。匯總所有情感極性值小于0的負(fù)向消積評論,可以發(fā)現(xiàn)讀者對莫言小說普遍持有的批評觀點有以下幾點。
3.3.1小說中的人物名字難記
44%的負(fù)向評論中指出,小說中的人物名字難以記住,常常無法將出場人物與名字對應(yīng)起來,因此造成了一定程度上的閱讀困難。一位讀者說,對于非中文母語的西方人來說,難以跟進(jìn)每一個人物在曲折故事情節(jié)中的走向,閱讀體驗欠佳(Roth, 2013)。
3.3.2小說存在多處繁復(fù)的描述
11%的負(fù)向評論中指出,小說中有時對人物和場景存在過度描寫,對某些事物存在重復(fù)描寫,這使得故事稍微顯得冗長。有讀者在評論中表示,《紅高粱》中有非常多對于“紅高粱”的描寫,即使已經(jīng)明白了這一個意象所包含的象征意義,因此閱讀時會有冗長和頻繁重復(fù)的感覺(Stauffer,2013)。在《豐乳肥臀》中,對主角迷戀乳汁這一現(xiàn)象有不斷重復(fù)的描寫,使部分讀者感到乏味(BlueDog,2013)。
3.3.3小說中太過殘酷的故事情節(jié)
40%的負(fù)向評論中指出,小說中一些場景和情節(jié)充滿了荒蠻和暴力,其中對人性太過現(xiàn)實的刻畫令讀者感到壓抑,甚至難以接受。部分讀者在評論中稱,《四十一炮》中刻畫出的貧窮,貪婪和腐敗令人難以繼續(xù)閱讀下去(Woodside, 2013)?!敦S乳肥臀》中的一些描寫性詞語令讀者感到不快(Margo, 2014),甚至部分讀者認(rèn)為這樣的詞語選擇有損女性的形象,是對女性的詆毀(Kline ,2014)?!都t高粱》中一個接一個的血淋淋的畫面難以讓人感到放松,即使這樣的描寫確實幫助讀者體會到了當(dāng)時中國受到日本侵略時人民的苦痛(pripollg ,2012)。
本研究表明,經(jīng)過情感分析后的西方電商平臺讀者評論顯示,莫言的11部英譯作品在西方普通英語讀者群體中的接受情況較好,約八成讀者對其持積極的接受態(tài)度。原因在于,一方面,莫言小說內(nèi)容多數(shù)以中國近代歷史為基礎(chǔ),介紹了不少西方讀者相對較為陌生的中國近代大事件,因此激發(fā)了西方讀者的閱讀興趣。另一方面,莫言小說的寫作風(fēng)格類似于西方讀者所熟知的魔幻現(xiàn)實主義風(fēng)格,給西方讀者帶來了一種熟悉卻又新穎的閱讀體驗。經(jīng)過情感分析后的西方電商平臺讀者評論還表明,約二成讀者對其持消極的接受態(tài)度。原因在于,莫言小說中包含的民族性或地域性的文化成為西方讀者的閱讀障礙之一,具體表現(xiàn)在難記的人名、繁復(fù)的人物和場景描述風(fēng)格、太過殘酷的故事情節(jié)等。本研究也表明,情感分析技術(shù)可以為中國文學(xué)作品的譯作在西方受眾接受效果分析研究提供可靠的客觀量化標(biāo)準(zhǔn)。因此,將計算機(jī)自然語言處理技術(shù)應(yīng)用到譯介文學(xué)書籍西方受眾接受效果分析的研究中是具有一定的可行性,尤其為中國知名鄉(xiāng)土作家(如賈平凹、阿來)作品的對外譯介提供借鑒。