——以2009年10月至2019年10月的“知網(wǎng)”數(shù)據(jù)為中心"/>
戰(zhàn)玉冰
(復旦大學 中文系, 上海 200433)
本文的研究緣起和思路設計大致基于兩方面的前提:一是“數(shù)字人文”(Digital Humanities,簡稱DH)研究方法在全球的興起,以及其在研究思路與思考范式上給傳統(tǒng)人文學科帶來的巨大沖擊;二是從國內(nèi)“數(shù)字人文”相關(guān)研究近年來的發(fā)展情況看,其已經(jīng)開始由“文獻數(shù)字化”向“研究數(shù)字化”轉(zhuǎn)型。當然前者是后者不可或缺的基礎(chǔ),“中國知網(wǎng)”、“全國報刊索引”、“中國歷代人物傳記資料庫”(China Biographical Database Project,簡稱CBDB)、“中國歷史地理信息系統(tǒng)”(China Historical GIS,簡稱CHGIS,以譚其驤先生《中國歷史地圖集》為基礎(chǔ))等都是“文獻數(shù)字化”階段重大的學術(shù)成果,也為后來國內(nèi)“數(shù)字人文”研究工作的展開奠定了扎實的“數(shù)據(jù)庫”基礎(chǔ)。而后者(“研究數(shù)字化”)很多具體研究工作的展開,也需要依靠前者(“文獻數(shù)字化”)多年來積累下來的數(shù)據(jù)庫資料。甚至進一步細究下來,上述國內(nèi)“數(shù)字人文”發(fā)展的兩個階段也不是能夠截然分開的,比如“中國知網(wǎng)”作為國內(nèi)最大的“文獻數(shù)字化”集成平臺之一,自身也帶有比較強大的“研究數(shù)字化”分析功能,這給本文的寫作以很大啟發(fā)。
具體到本文的研究上來說,本文以“巴金”為主題詞,以2009年10月至2019年10月為檢索日期范圍(“知網(wǎng)”上所顯示的該時間對應的是文章發(fā)表時間),在“中國知網(wǎng)”(https://www.cnki.net)中進行了文獻檢索,得到相關(guān)檢索結(jié)果共計1 725條。同時本文選取了18名中國現(xiàn)代知名作家,采用同樣的主題詞定位和日期范圍進行檢索,分別獲得數(shù)據(jù),見表1:
表1 “知網(wǎng)”檢索18位中國現(xiàn)代作家姓名關(guān)鍵詞所得結(jié)果
從表1初步檢索結(jié)果可以看出,在“知網(wǎng)”上近十年間涉及關(guān)于中國現(xiàn)代文學作家的討論和研究中,小說家的關(guān)注程度和研究熱度要普遍高于詩人(魯迅、茅盾、老舍、沈從文、張愛玲的數(shù)據(jù)檢索結(jié)果要普遍高于艾青、馮至、卞之琳、穆旦),而在傳統(tǒng)的“魯郭茅巴老曹”的中國現(xiàn)代著名作家序列中,“巴金研究”顯然還有很大的、可以進一步投入和展開的空間(巴金的數(shù)據(jù)檢索結(jié)果明顯低于其他五位作家)。
針對這1 725條檢索結(jié)果,本文進行了如下的數(shù)據(jù)篩選和清洗工作,人工核對并剔除了以下四類數(shù)據(jù):
1.重復的數(shù)據(jù)。
2.與“巴金”完全無關(guān),只是字面上巧合的數(shù)據(jù)(比如由于“巴金森病”“德巴金”等近似主題詞所產(chǎn)生的檢索結(jié)果)。
3.只有個別章節(jié),甚至部分段落、句子提及巴金,而非主要以巴金為研究對象的文章。
4.關(guān)于巴金某篇作品(如《小狗包弟》)在中小學語文課堂上的教學方法與實踐案例類的文章(此類文章共計65篇)(1)鑒于本文主要考察有關(guān)作家巴金本人及其作品的研究情況,過多的課堂教學案例類文章會形成數(shù)據(jù)干擾,故將其人工整理并剔除。。
經(jīng)過上述篩選后,本文得到有效數(shù)據(jù)761篇,共計956萬余字,其發(fā)表時間分布情況見表2:
表2 以“巴金”為主題的論文發(fā)表年度分布情況(2009.10—2019.10)統(tǒng)計表
以“巴金”為主題的論文發(fā)表年度分布情況折線如圖1所示:
圖1 以“巴金”為主題的論文發(fā)表年度分布情況(2009.10—2019.10)折線圖
從圖1來看,除個別年份數(shù)據(jù)偏高或偏低外,整體上近十年的“巴金研究”呈現(xiàn)出比較平穩(wěn)的發(fā)展態(tài)勢。尤其是近五年以來,平均每年有80篇左右的研究文章,一定程度上代表了近年來“巴金研究”發(fā)展的成熟和研究成果增長的穩(wěn)定。
關(guān)于這761篇文章,共計有645名作者,其中發(fā)表三篇文章以上(含三篇)的作者有26人。發(fā)表文章數(shù)量最多的作者依次為:周立民(20篇)、賈玉民(14篇)、石健(12篇)、胡景敏(10篇)、李樹德(6篇)、田悅芳(6篇)、黃長華(6篇)等。但此類作者整體論文數(shù)量占“巴金研究”論文總數(shù)的比例并不大(僅為18.4%),說明專門投入“巴金研究”的研究者并不算多,更多文章作者屬于“一次性投入”或“臨時性涉及”,而并非持續(xù)且深入地從事“巴金研究”。
借助谷臻故事工場所研發(fā)的“一葉·故事薈”軟件工具,本文對2009年10月至2019年10月的761篇“巴金研究”論文進行全體和逐年高頻詞統(tǒng)計分析,剔除錯誤數(shù)據(jù)與無效數(shù)據(jù)后,得到十年整體性高頻詞統(tǒng)計及逐年高頻詞統(tǒng)計結(jié)果見表3、表4:
表3 2009年10月—2019年10月761篇有關(guān)“巴金”的論文高頻詞十年整體性統(tǒng)計結(jié)果
注:由于論文篇幅限制,本文只展示排序在1—50位的高頻詞統(tǒng)計與清洗結(jié)果。
從表3對2009年10月至2019年10月這十年論文的整體高頻詞統(tǒng)計結(jié)果來看,“巴金研究”主要集中在巴金的“小說”“作品”“創(chuàng)作”(2)引號表示該詞語為統(tǒng)計數(shù)據(jù)結(jié)果中的高頻詞,下同。等“文本”審美研究與“思想”“生活”“精神”等作家傳記研究兩大方面。在前者中,《家》和《寒夜》分別是研究者涉及最多的兩部作品,而巴金作品中所涉及的關(guān)于“革命”“現(xiàn)代”“女性”“青年”“愛情”“家庭”等主題和其小說文本的“敘事”研究等相關(guān)問題,以及巴金作品的“讀者”接受情況等都是研究者所持續(xù)關(guān)注的重點。而在后者中,巴金的“翻譯”工作、“無政府主義”信仰、以“隨想錄”為代表的“知識分子”擔當,及其與“魯迅”的關(guān)系和比較等則是研究者討論較為熱烈的話題。此外,“人民文學出版社”出版的“1986年版”《巴金全集》是研究者參考和征引最多的研究資料之一。
從表4逐年高頻詞統(tǒng)計數(shù)據(jù)結(jié)果來看,2009年10月至2010年10月這一年的論文更多傾向于巴金與“時代”關(guān)系的外部研究,“五四”“文革”“魯迅”“歷史”“時代”等詞語皆成為這一年論文的高頻詞。這一時期在此方面的代表性論文有:劉志榮的《文學的<家>與歷史的“家”》[1]、坂井洋史的《關(guān)于“后啟蒙”時期現(xiàn)代文學研究的思考——以“巴金與五四新文學傳統(tǒng)”為主題的研究〈是否可能/如何可能〉》[2]、周立民的《“家”與“街頭”——巴金敘述中的“五四”意象》[3]等。
而在之后三年(2010年10月至2013年10月)中,巴金研究呈現(xiàn)出某種“向內(nèi)轉(zhuǎn)”的趨勢,即更多研究論文關(guān)注于文本內(nèi)部的分析,與之相應地,“文本”“敘述者”“敘述”“描寫”“人物形象”“語言”“敘事”“形式”“結(jié)構(gòu)”“話語”,甚至于更為細致入微的諸如“時間”“場景”“虛詞”等相關(guān)詞匯出現(xiàn)非常頻繁。這一方面的代表論文有:門紅麗的《無法著陸的靈魂——論巴金短篇小說中的“夢游人”》[4]、戴翊的《寄希望于獻身革命的熱血青年——重讀〈滅亡〉、〈新生〉和〈愛情的三部曲〉》[5]等。
在2013年10月至2017年10月這四年之中,關(guān)于巴金的翻譯研究、比較文學研究,及巴金與基督教關(guān)系的研究逐漸增多,也正是由此開始,“翻譯”穩(wěn)定地成為此后歷年巴金研究的重要高頻詞,“屠格涅夫”“王爾德”“圣經(jīng)”“懺悔”“基督教”“兒童”“拯救”等也開始成為巴金研究中出現(xiàn)頻次較高的熱門詞匯。而關(guān)于巴金的翻譯、域外經(jīng)歷及其海外研究情況方面的史料鉤沉、傳記性梳理和學術(shù)綜述也是這幾年間巴金研究的一個特色。此外,關(guān)于巴金研究的角度也變得更為豐富,比如巴金與“曹禺”的關(guān)系、巴金與“老舍”的比較、巴金小說的“兒童”敘事,及有關(guān)巴金的“文章”“散文”,乃至更為具體的“序跋”研究,甚至于還出現(xiàn)了通過“語料庫”來分析研究巴金小說的新思路和新方法。此一時期的代表性論文有:董斌孜孜的《法國漢學界巴金研究歷史語境變遷》[6]、常楠的《從一封珍貴的諾貝爾文學獎推薦信說起——兼談賈植芳的巴金研究》[7]、周立民的《美好的回憶與可怕的“噩夢”——從新發(fā)現(xiàn)文獻中重構(gòu)巴金第一次訪日足跡》[8]等。
從2017年10月到2019年10月,學界對“巴金研究”的重心更加傾向于對作為文學編輯與出版人的巴金(或者說在出版場域中的巴金)來加以理解和研究,“收獲”(雜志)、“媒介”“出版”“傳播”“發(fā)表”等高頻詞較為集中地在這兩年間得到體現(xiàn)。與此同時,巴金作品的出版、傳播與版本問題也是這一時期研究者所關(guān)注的熱點。其中代表性論文有:李明剛和張鴻聲的《“人類意識”與作為出版家的巴金》[9]、宋劍華的《巴金為什么要反復地修改〈家〉?——由“開明本”與“全集本”的對讀說起》[10]、許海洋的《〈激流〉險遭“腰斬”事件新探——兼論新文學長篇小說進入市民報紙的意義》[11]等。
必須說明的是,本文所描述的近十年“巴金研究”狀況與動態(tài)變化并非單向度且絕對化的,而且也不可能簡單地概括和理解“巴金研究”近十年來所取得的成果的復雜性和繁榮局面。一方面,有關(guān)巴金經(jīng)典文本諸如《滅亡》《家》《寒夜》《憩園》《第四病室》《隨想錄》的研究在任何一年的“巴金研究”中都從未斷絕,關(guān)于巴金生平與作品的新史料發(fā)現(xiàn)與鉤沉、對于巴金的翻譯研究和其無政府主義思想研究等都是“常說不衰”“常提常新”的持續(xù)性研究熱點;另一方面,很多研究成果很難以文學的傳記/文本、外部/內(nèi)部、史料/理論、影響/比較等二元維度來進行簡單切割和劃分,比如陳思和的《關(guān)于巴金<春夢>殘稿的整理與讀解》[12]一文,即涉及史料考證、文本細讀、傳記分析、文學史研究等多個層面的內(nèi)容,這也標志著當下巴金研究中面對新材料的較高水平論文所呈現(xiàn)出的綜合性、多面性和強輻射性的特點。本文選取了“無政府主義”“魯迅”“翻譯”“寒夜”“隨想錄”等五個高頻詞,對其分別進行歷年出現(xiàn)頻率的追蹤觀察,具體情況見圖2、圖3、圖4、圖5、圖6:
圖2 關(guān)鍵詞“無政府主義”歷年詞頻追蹤
圖3 關(guān)鍵詞“魯迅”歷年詞頻追蹤
圖4 關(guān)鍵詞“翻譯”歷年詞頻追蹤
圖5 關(guān)鍵詞“寒夜”歷年詞頻追蹤
圖6 關(guān)鍵詞“隨想錄”歷年詞頻追蹤
從圖2、圖3、圖4、圖5、圖6可以發(fā)現(xiàn),關(guān)于“無政府主義”和“魯迅”的研究多年來相對比較穩(wěn)定,前者呈現(xiàn)略微下降的趨勢,后者則略微上升。相比較而言,關(guān)于“翻譯”的研究近幾年增長很快,除了2010年10月到2011年10月出現(xiàn)特殊情況之外,近十年來關(guān)于巴金的翻譯研究成果可謂“突飛猛進”,“翻譯”作為高頻詞也一直排在全體高頻詞的前列。浙江文藝出版社于2019年最新出版的《巴金譯文集》(共十冊),無疑又為巴金的翻譯研究提供了一筆豐厚的資料。而在以具體作品名稱為關(guān)鍵詞的考察上,關(guān)于“寒夜”的研究一直頗為熱門,而涉及“隨想錄”的研究成果數(shù)量則在近些年整體上呈現(xiàn)出下降趨勢。
除了全體高頻詞之外,本文借助谷臻故事工場所研發(fā)的“一葉·故事薈”軟件工具,對近十年以“巴金”為主題詞的“知網(wǎng)”論文中的“人物高頻詞”、“地點高頻詞”、文中“涉及作品高頻詞”等專項高頻詞進行了整體性和逐年的統(tǒng)計分析,結(jié)果見表5、表6、表7。
從表5“人物高頻詞”來看,大致可以分為四類:第一類是源自巴金小說中的人物,如“汪文宣”“曾樹生”“覺新”“杜大心”“吳仁民”“李佩珠”“張為群”等。第二類就是和巴金有過接觸、交往,或者可引為比較、參照的真實歷史人物,如“魯迅”“曹禺”“老舍”“靳以”“郭沫若”“沈從文”“胡風”“茅盾”“夏衍”“李健吾”“蕭珊”“賈植芳”等。第三類是多年來堅持從事并投入巴金研究或巴金研究資料編纂的學界前輩,他們的研究專著或論文,持續(xù)地對學界產(chǎn)生深遠影響,成為后來學者研究、寫作時參考和征引的對象,如“陳思和”“李存光”等。第四類是對巴金產(chǎn)生思想影響或成為巴金翻譯對象的國外思想家或作家,比如“克魯泡特金”“屠格涅夫”“高爾基”“王爾德”等。而從“人物高頻詞”的出現(xiàn)頻率來看,對于巴金作品做文本分析與內(nèi)部研究的學者,最喜歡分析的人物首推《寒夜》中的曾樹生和汪文宣(他們都是出現(xiàn)頻率最高且在不同年份里反復出現(xiàn)的“人物高頻詞”),而從事外部研究的學者則喜歡討論魯迅、曹禺與巴金之間的關(guān)系(包括精神影響、文學交往、作品改編)等議題。
表5 2009年10月—2019年10月761篇有關(guān)“巴金”的論文“人物高頻詞”統(tǒng)計及逐年統(tǒng)計結(jié)果
表6 2009年10月—2019年10月761篇有關(guān)“巴金”的論文中“涉及作品高頻詞”整體統(tǒng)計結(jié)果
雖然從“人物高頻詞”的統(tǒng)計結(jié)果中,我們發(fā)現(xiàn)最頻繁被研究者們關(guān)注的巴金小說人物是《寒夜》中的曾樹生和汪文宣,但從本文所統(tǒng)計的文章中“涉及作品高頻詞”的統(tǒng)計結(jié)果表6來看,《家》才是巴金被反復提及最多次的作品,這還不包括以“激流三部曲”為標志而出現(xiàn)的情況(也有944次之多)。這種統(tǒng)計結(jié)果上的差異應該是因為小說《家》中主要人物眾多,最后導致研究者人物姓名引用結(jié)果比較分散,而《寒夜》則緊緊圍繞汪文宣、曾樹生和汪母三個人物之間的關(guān)系展開,因而學者討論和使用小說人物姓名時更為集中所致。
此外,從本文中“涉及作品高頻詞”的相關(guān)統(tǒng)計結(jié)果中,我們也不難看出除了巴金自己的作品之外,研究者較多關(guān)注作為文學編輯的巴金(《收獲》和《雷雨》成為高頻詞)、巴金與基督教信仰的關(guān)系(《圣經(jīng)》成為高頻詞)、《紅樓夢》與《家》的比較(《紅樓夢》成為高頻詞)及巴金對王爾德童話的翻譯(《快樂王子》成為高頻詞)等研究方向和角度。
從表7“地點高頻詞”來看,“北京”“上?!焙汀八拇ā笔侨齻€出現(xiàn)頻次最高的國內(nèi)地域單元。而“日本”“東京”“法國”“巴黎”“俄羅斯”“俄國”等則是出現(xiàn)頻率較高的外國地理單位。這里值得特別注意的是“朝鮮”,一般巴金研究多以其民國時期的小說創(chuàng)作或新時期的散文創(chuàng)作為關(guān)注熱點,忽視“十七年”時期的巴金,而“朝鮮”作為地理高頻詞則是對這一段巴金經(jīng)歷及創(chuàng)作進行研究并試圖將巴金生平予以整體性觀照的體現(xiàn),如李丹丹的《歷史危機中巴金的主體轉(zhuǎn)換》[13]便是其中一例。此外,常彬、邵海倫的《共和國文學范式的建立——以<人民日報>朝鮮戰(zhàn)爭文學文獻為樣本》[14]一文也關(guān)注到了巴金在20世紀50年代赴朝鮮戰(zhàn)場前線訪問歸來后的小說創(chuàng)作及后來的電影改編等內(nèi)容。
對于數(shù)字人文的研究方法如何介入到具體的文學研究之中,美國學者弗朗哥·莫萊蒂(Franco Moretti)“遠讀”(Distant Reading)理論的提出及其一系列相關(guān)論著(如Graphs,Maps,Trees:AbstractModelsforaLiteraryHistory等)無疑有著開拓之功和巨大影響。安德魯·派博(Andrew Piper)的《計算:數(shù)據(jù)與文學研究》與泰德·安德伍德(Ted Underwood)的《遠距離視野:數(shù)字證據(jù)與文學變化》兩本近著則可以代表這一研究脈絡目前的最新進展。此外,姜文濤、戴安德(Anatoly Detwyler)、嚴程、趙薇、王賀等則在數(shù)字人文與中國現(xiàn)代文學研究相結(jié)合領(lǐng)域進行了一定探索。具體而言,采用數(shù)字人文方法所進行的文學研究大致可以粗略分為兩類:一類是用數(shù)字人文分析“海量文學文本”,比如筆者的《<收獲>刊載小說的數(shù)據(jù)性考察(1979—2018)》[15]、《網(wǎng)絡小說的數(shù)據(jù)法與類型論──以 2018 年的 749 部中國網(wǎng)絡小說為考察對象》[16]和《數(shù)據(jù)分析視角下的茅盾文學獎研究》[17]等論文都是在這方面的探索和嘗試;另一類則是通過大數(shù)據(jù)來完成對文學研究本身狀況的呈現(xiàn)與學術(shù)史脈絡的梳理,比如青年學者王賀的不少研究都具有這方面的性質(zhì)。相對而言,前者可以稱為用數(shù)字人文直接研究“文學”,后者則是通過數(shù)字人文展開的有關(guān)“文學研究”的再研究。
據(jù)筆者自己有限的研究經(jīng)驗和感受而論,針對文學本身的數(shù)字人文研究具體操作難度更大,因為文學文本的復雜性、文學語言的模糊性與文學意蘊的豐富性,都使得其很難被完美量化、條理化與數(shù)據(jù)化。舉一個最簡單的例子,即使是想對文學文本進行最初級的詞頻統(tǒng)計工作,首先就需要面臨“什么是詞”的關(guān)鍵問題。這里所說的“什么是詞”并非在語言學本體論意義上來談,而是不同作家在作品中會有很多方言土語、個人習慣性用語、個人風格詞匯等不符合現(xiàn)代語言規(guī)范,也不在《現(xiàn)代漢語詞典》之中的“書寫實踐”。而這些“不合規(guī)范”的詞句一方面很難被詞頻數(shù)據(jù)庫全部收納和統(tǒng)計(即使人工補充仍很難做到完整),另一方面其又很可能是該作家個人風格與文學魅力之所在(比如賈平凹小說中對“團結(jié)”一詞的本義性使用)。相對而言,對“文學研究”展開數(shù)字人文再研究,或者說通過數(shù)字人文的方法來研究學術(shù)史就少了很多這方面的障礙,起碼大多數(shù)學術(shù)論文在用詞方面都是合乎通行學術(shù)語言規(guī)范或起碼的現(xiàn)代漢語語法要求,個人化“發(fā)揮”與“創(chuàng)造”詞語的機會不多,詞頻數(shù)據(jù)庫的建立更加簡單且可重復使用。
此外,隨著諸如“知網(wǎng)”“萬方”等大型學術(shù)論文網(wǎng)站數(shù)據(jù)庫的日益完善,采取數(shù)字人文的研究方法對“文學研究”展開再研究,在某種意義上具備了追求“整全性”的可能。比如,本文采取數(shù)據(jù)統(tǒng)計的方法縱觀“知網(wǎng)”論文所呈現(xiàn)出的十年間(2009—2019年)“巴金研究”的基本狀況,我們不難發(fā)現(xiàn)其中既包含“常說常新”的經(jīng)典性議題(如對于《家》《寒夜》等文本的解讀),也出現(xiàn)了一些近年來越發(fā)受到學界關(guān)注的研究熱點(如關(guān)于巴金的翻譯研究)。與此同時,新材料的出現(xiàn)、新角度的切入、新方法的運用更是為“巴金研究”注入了源源不斷的新的活力,使其呈現(xiàn)出多元且繁榮的面貌,基本上可以初窺十年間“巴金研究”之“大略”。但本文也并非忽略數(shù)字人文研究方法本身的固有缺陷,比如對于那些沒有被“知網(wǎng)”收錄的“巴金研究”學術(shù)成果(僅筆者所知,就有上海巴金故居所創(chuàng)辦的《點滴》雜志和復旦大學中文系所主持的學術(shù)集刊《史料與闡釋》,兩種刊物上面都有不少關(guān)于巴金的高質(zhì)量論文,但這兩種雜志皆沒有被“知網(wǎng)”收錄,也就不在本文所能夠統(tǒng)計的范疇之內(nèi))。
最后,隨著互聯(lián)網(wǎng)的不斷發(fā)展與數(shù)據(jù)庫的不斷完善,數(shù)字人文在對象考察上可以做到逐步接近于“整全”(比如把《點滴》和《史料與闡釋》也收錄于“知網(wǎng)”似乎并非不可能),但其同時不可避免的“先天不足”更在于“深刻”性方面的缺失,甚至于我們可以說這種“整全”更多是一種表面性的“整全”,或者“淺表的整全”(simple integrity)。比如我們可以通過統(tǒng)計數(shù)據(jù)發(fā)現(xiàn)十年間“巴金研究”中“翻譯”作為高頻詞的詞頻上升,而這到底是一種隨著新理論、新方法、新材料的涌入所形成的新的“學術(shù)熱點”與“學術(shù)增長點”,還是一種低水平的“學術(shù)重復勞動”,則是數(shù)字人文研究方法所不能很好回答的問題,但這也恰是相關(guān)巴金研究者可以發(fā)揮其自身研究專長來展開對話的新空間。