陶建明
(武漢文理學(xué)院,湖北武漢 430345)
《雪國》是一部將日本的傳統(tǒng)美學(xué)與現(xiàn)代西方文學(xué)創(chuàng)作手法巧妙結(jié)合的經(jīng)典文學(xué)作品。文本內(nèi)容以島村兩次前往雪國為主線,描述了這位來自東京的已婚成年男子在雪國與兩位女性的感情羈絆,以及其在雪國的所見所聞。主線內(nèi)容簡單,卻以生動細膩的人物形象刻畫、巧妙的故事情節(jié)構(gòu)造,成為川端康成獲獎代表作品之一,具有極高的美學(xué)與藝術(shù)欣賞價值,深受海內(nèi)外文學(xué)愛好研究者的追捧。因此國內(nèi)外針對《雪國》文學(xué)作品的研究熱度極高,層出不窮,碩果累累。尤其是在《雪國》文學(xué)作品呈現(xiàn)出的悲與美方面,積淀了大量的先行研究成果,然而,歷來的先行研究,多傾向于主觀方面判斷,客觀實證研究較少。
近年來,數(shù)字人文研究方法在文學(xué)領(lǐng)域的廣泛應(yīng)用與開展,為研究者采用新的手段方式解讀研究文學(xué)作品提供了可能性。該文結(jié)合研究發(fā)展新趨勢,基于數(shù)字人文視角,采用KH Coder 文本分析軟件,對標記后的整篇文本文檔進行了相關(guān)系列數(shù)據(jù)挖掘,并以數(shù)據(jù)圖的形式重新解讀《雪國》文本內(nèi)容,把握文本內(nèi)容發(fā)展主線。結(jié)合建立起的網(wǎng)絡(luò)效果分析圖,整合相關(guān)數(shù)據(jù),進一步對《雪國》文本內(nèi)容及高頻詞匯進行數(shù)字編碼分析,為開展文本內(nèi)容呈現(xiàn)的悲與美的系列研究提供數(shù)據(jù)支撐,以期豐富發(fā)展先行研究中的實證研究成果[1]。
將《雪國》日語原版文本內(nèi)容,輸入整理成txt 文檔形式進行保存。采用HTML 形式,對保存好的txt文檔,依次進行部分章節(jié)的歸納劃分。將文檔劃分成上下兩部分,以<H1>形式進行標記,上部分進一步細分為01~04,四大章節(jié),下部分進一步細分為01~05,五大章節(jié),以<H2>形式對上下兩部分中的各個章節(jié)進行區(qū)分標記,以便將處理好的文本文檔順利導(dǎo)入分析軟件KH Coder,方便其進行后續(xù)的操作使用以及相關(guān)數(shù)據(jù)的統(tǒng)計處理[2]。
該文是基于數(shù)字人文視角下,針對《雪國》文本中悲與美的數(shù)字化實證研究,因此,為結(jié)合對應(yīng)文本內(nèi)容的數(shù)據(jù)挖掘,需要提前做好編碼文檔的相關(guān)內(nèi)容設(shè)定。即將文本主線脈絡(luò)中,高頻出現(xiàn)的“人の死”“病気”“美しい”作為悲與美的代表性因素,以各自形式,提前做好編碼內(nèi)容設(shè)定,并單獨以txt 形式進行文本保存,方便后續(xù)編碼文檔的導(dǎo)入和相關(guān)數(shù)據(jù)的挖掘分析[3]。
將整理好的《雪國》文本文檔內(nèi)容手動導(dǎo)入KH Coder 中,運用其文件預(yù)處理功能,自動進行對象文件的檢測。如果檢測過程中出現(xiàn)無法識別或者亂碼等現(xiàn)象提示,亦可采取自動處理方式進行修復(fù)。系統(tǒng)檢測無誤,即可執(zhí)行預(yù)處理,處理結(jié)果會自動展示匯總單元即H1、H2、段落、字數(shù)的相關(guān)數(shù)據(jù)[4]。
利用KH Coder,對預(yù)前處理好的《雪國》文本進行數(shù)據(jù)挖掘與統(tǒng)計分析。首先,在不進行詞匯類別詳細區(qū)分的條件下,對文本內(nèi)容中的高頻詞匯進行篩查統(tǒng)計。由KH Coder 自動導(dǎo)出的文本高頻詞匯Excel 表格中,可明顯統(tǒng)計出“島村”(位次1,頻率370)、“駒子”(位次2,頻率263 次)、“雪”(位次9,頻率106)、“葉子”(位次16,頻率81)等涉及文本內(nèi)容主線發(fā)展的高頻詞匯及相關(guān)出現(xiàn)頻率數(shù)據(jù)。除此之外,還可清晰直觀看出形容詞“美しい”在整個文本中,共計出現(xiàn)頻次26 次,在前150 個高頻詞匯統(tǒng)計圖中位居第71 位。而在對“美しい”相關(guān)詞匯搜索統(tǒng)計中(見圖1),形容詞“悲しい”的Jaccard 值最高,位居第一位。為進一步驗證上述搜索數(shù)據(jù),對“悲しい”的相關(guān)詞匯進行KWICK 索引統(tǒng)計,部分結(jié)果如圖1所示,很明顯可看出,在索引圖中“美しい”位于右2 位置上,共計出現(xiàn)4 次,分值居于索引圖首位[5]。
圖1 相關(guān)詞匯搜索效果部分圖
結(jié)合統(tǒng)計數(shù)據(jù),亦可明顯發(fā)現(xiàn),不管是針對“美しい”的相關(guān)詞匯搜索,還是對“悲しい”的相關(guān)詞匯進行KWICK 索引統(tǒng)計,雙方都在彼此統(tǒng)計數(shù)據(jù)的首要位置。因此,單從《雪國》文本內(nèi)容中的高頻詞匯數(shù)據(jù)的初步統(tǒng)計方面,便可發(fā)現(xiàn)“悲”與“美”存在的影子,為該研究主題開展的必要性提供了一定的數(shù)據(jù)支撐,同時,也進一步推動了后續(xù)文本主題脈絡(luò)走向方面的數(shù)據(jù)挖掘及相關(guān)研究的開展[6]。
此外,通過對圖1的相關(guān)數(shù)據(jù)進一步分析比較,還可明顯發(fā)現(xiàn),“葉子”“聲”等詞,同時存在于彼此關(guān)聯(lián)的詞匯表格中,且統(tǒng)計數(shù)據(jù)均位居前列。而在完整效果圖中,不管是“美しい”的相關(guān)詞匯搜索,還是對“悲しい”的相關(guān)詞匯進行KWICK 索引統(tǒng)計,亦可發(fā)現(xiàn)與之關(guān)聯(lián)的名詞中,除了典型人物及人物特征詞匯外,同時,還出現(xiàn)的有“木”“花”“山”“船”“雪”“蟲”等物象的詞匯。基于以上數(shù)據(jù)結(jié)果統(tǒng)計,文本內(nèi)容中,除了以葉子為代表的主要人物形象設(shè)定外,文本類構(gòu)造出的動植物等物象同樣也賦予了悲與美的系列特征[7]。
基于以上針對《雪國》文本中高頻詞匯初步分析結(jié)果,為進一步挖掘該研究主題在文本主線脈絡(luò)走向方面的相關(guān)數(shù)據(jù),利用KH Coder 對文本內(nèi)容進行編碼分析。將提前準備好的編碼文檔手動導(dǎo)入,制作出對應(yīng)因素的熱力圖與曲線分布圖(見圖2)。
圖2 文本內(nèi)容編碼分析效果圖
圖2更加直觀地展示了“悲”與“美”相關(guān)因素在《雪國》文本內(nèi)容中的整體走向,以及具體章節(jié)分布情況。通過圖2左側(cè)的熱力分布圖可以看出,“美しい”貫穿于整個文本,除文本下-03 部分之外,在其他各個章節(jié)內(nèi)容中均較廣分布,“人の死”“病気”這些悲傷因素的典型代表性詞度,同樣貫穿于整個文本中。且“人の死”在整個文本主題脈絡(luò)發(fā)展中,出現(xiàn)頻率波動較大,而“病気”則呈現(xiàn)出逐漸縮小的變化趨勢。再結(jié)合右側(cè)折線圖的分布情況,從整體上把握悲與美的發(fā)展趨勢。代表“悲しい”的紅色折線和代表“美しい”的藍色折線,交叉分布在整個文本內(nèi)容中,兩者均在文本開端出現(xiàn)一個高峰值分布。而代表“悲しい” 的紅色折線在整個文本脈絡(luò)中波動性較大,代表“美しい”的藍色折線則整體呈現(xiàn)下降趨勢,且在文本下部分后一直低于紅色折線的數(shù)值。兩者在文本內(nèi)容中的上-03,上-05,以及下-02 部分均出現(xiàn)交集,且在文本結(jié)尾處,再一次出現(xiàn)集體上升趨勢。
結(jié)合對應(yīng)文本內(nèi)容進行驗證分析,作者在文本開端,無論是對雪國環(huán)境的描述,還是以島村視角,在火車上對初次遇見陪伴照顧疾病纏身的葉子的相關(guān)系列描寫,均包含了“悲”與“美”的情節(jié)設(shè)定,由此可見,從一開始作者便賦予了文本內(nèi)容悲與美的感情色彩基調(diào),所以兩條曲線在文本開端便呈現(xiàn)了高峰值。文本上半部分,在對駒子以及雪國美麗環(huán)境刻畫的同時,伴隨文本內(nèi)容發(fā)展需要,還有對相關(guān)物景以及人物際遇的悲慘刻畫,其中便包括駒子成為藝伎的無奈,純潔美麗的葉子悉心照顧行男,而行男卻最終難以避免死亡命運的安排。而下半部分當中,縱然行男去世,美麗的駒子不用再為醫(yī)藥費而奔波勞累,卻依舊難以擺脫殘酷的現(xiàn)實,繼續(xù)生活在燈紅酒綠之中,因此,整個文本內(nèi)容交織著悲與美的客觀存在,兩條曲線也多次出現(xiàn)交集點。而葉子之死作為文本結(jié)尾設(shè)定,實際是在一個悲慘火災(zāi)結(jié)局中,重新塑造了超脫現(xiàn)實、實現(xiàn)自由的美麗葉子形象,即文本結(jié)尾是悲與美的再次交織,所以兩條曲線再次呈現(xiàn)上升趨勢。
基于以上針對《雪國》 文本內(nèi)容得出的數(shù)據(jù)分析,結(jié)合文本內(nèi)容主題脈絡(luò)走向的相關(guān)圖例證明,《雪國》中的悲與美是廣泛存在的。從文本高頻詞匯統(tǒng)計數(shù)據(jù),可以看出,其不僅存在于像對葉子這種典型的文本人物形象的細節(jié)刻畫中,而且還存在于如飛蛾、蟬、樹木、雪、村落等自然景物的描寫中。結(jié)合主題脈絡(luò)走向的相關(guān)圖例證明,亦可明顯發(fā)現(xiàn),作者從一開始便奠定了悲與美的感情基調(diào),且貫穿于整篇文本內(nèi)容,雖未達到逐字逐段的地步,但是在各個章節(jié)中均廣泛呈現(xiàn)。在文本內(nèi)容結(jié)尾,從島村視角出發(fā),以葉子慘死于火災(zāi)結(jié)局,塑造了美的永恒,首尾呼應(yīng),再次實現(xiàn)了悲與美的完美交織。
該文基于數(shù)字人文視角,采用文本分析軟件KH Coder,對《雪國》文本內(nèi)容進行數(shù)據(jù)挖掘與相關(guān)分析。通過文本高頻詞匯的數(shù)據(jù)統(tǒng)計,發(fā)現(xiàn)形容詞“美しい”存在于整個文本前150 個高頻詞匯中,“悲しい”位居“美しい”的相關(guān)詞匯搜索表中的首位,相關(guān)數(shù)據(jù)進一步挖掘后,發(fā)現(xiàn)這兩個形容詞在文本內(nèi)容中的互關(guān)性很高,且文本內(nèi)容中具有悲與美的特征詞匯,除了對文本人物形象描述外,眾多物象的描寫同時兼具,也從一定程度上,側(cè)面反映了文本內(nèi)容悲與美的客觀存在。該文基于以上數(shù)據(jù)挖掘,進一步對文本內(nèi)容進行編碼分析,從宏觀角度把握文本主題脈絡(luò)走向,基于制作出的相關(guān)效果圖例,把握各個因素在文本章節(jié)中的分布情況,結(jié)合文本內(nèi)容驗證后,直觀證明出悲與美貫穿于文本始終,作者在一開始便奠定了悲與美的感情基調(diào),并在文章結(jié)尾處,再次實現(xiàn)了悲與美的完美交織。