李 陽
依托于數(shù)字人文(Digital Humanities),以算法批評(Algorithmic Criticism)為代表的量化研究逐漸凸顯其力量,并與文本細(xì)讀的闡釋傳統(tǒng)形成了看似不可調(diào)和之勢。很多研究者將兩種文學(xué)批評模式的不可調(diào)和追溯到人文學(xué)科和自然學(xué)科中“人文范式”和“科學(xué)范式”本身的不可兼容性,也代表著質(zhì)性研究和量化處理、主觀與客觀、審美和經(jīng)驗(yàn)之間的差異,由此衍生出了褒揚(yáng)和批判之聲。褒揚(yáng)之人如蘇珊?哈琪(Susan Hockey)認(rèn)為,相較于某些批評方法,數(shù)字人文視域下的算法批評可以加強(qiáng)對文本的理解,矯正某些批評家的個(gè)人闡釋。而批評之人如霍爾(Gary Hall)則認(rèn)為這不過是“從事幼稚而膚淺的學(xué)術(shù)工作的借口”①Gold,M.K.(2012).Debates in the Digital Humanities.Minneapolis: University of Minnesota Press.。相較于以上兩種截然相反的態(tài)度,也有學(xué)者認(rèn)為兩種分歧仍然具有可以融合,或者應(yīng)該融合之處。如C.P.斯諾(C.P.Snow)相信“人文科學(xué)和硬核科學(xué)的不同方法論和知識傳統(tǒng)可以而且/或應(yīng)該趨同”②Thaller,M.(2012).Controversies around the Digital Humanities: An Agenda.Historical Social Research,37,7-23.。筆者認(rèn)為,傳統(tǒng)文學(xué)批評方法③傳統(tǒng)批評方法指的是已經(jīng)經(jīng)典化、知識化和結(jié)構(gòu)化的批評范式,如心理分析、女性主義、后殖民主義、性別研究等,它背靠著定性研究的傳統(tǒng)。和算法批評確實(shí)存在分歧和沖突,但二者也應(yīng)存有可以融合之處,融合之處正是跨學(xué)科研究的依據(jù)和陣地所在。
在文學(xué)研究中,算法批評(Algorithmic Criticism)是計(jì)算機(jī)算法和文學(xué)批評相融合的跨學(xué)科研究范式,其基本含義是以計(jì)算機(jī)的算法功能進(jìn)行文學(xué)批評實(shí)踐,對作品的量性和結(jié)構(gòu)性關(guān)系進(jìn)行考察。從歷史形成角度,算法批評經(jīng)歷了無意識至有意識階段,中間也包含著“他覺”與“自覺”的交織,整體上呈現(xiàn)出人為計(jì)算主體至計(jì)算機(jī)為算法主體的過渡。(1)人為計(jì)算主體的批評階段:指無意識地將文學(xué)文本看作語料,對某一關(guān)鍵詞出現(xiàn)的位置、數(shù)量、結(jié)構(gòu)和規(guī)模進(jìn)行分析,并聯(lián)系文本進(jìn)行闡釋。如不同時(shí)代的批評者在對曹雪芹的《紅樓夢》進(jìn)行意象分析時(shí),基于自身的計(jì)算本能,已然能夠覺察到“夢”出現(xiàn)的頻次和位置的特殊性,再結(jié)合文本的歷史背景和自身的批評經(jīng)驗(yàn),總結(jié)出“夢”的意義包括賈寶玉的“云雨之夢”、功名利祿的“黃粱一夢”、虛虛實(shí)實(shí)的“人生如夢”等。無意識之處體現(xiàn)在,從將文本看作承載“開端—高潮—結(jié)局”的“敘事話語”轉(zhuǎn)而看作是以待計(jì)算的語料,以模糊的、非算法經(jīng)驗(yàn)的方式進(jìn)行詞頻的計(jì)算。算法研究的“他覺”與“自覺”相交織。“他覺”指的是其他領(lǐng)域研究者以算法切入文學(xué)研究。如語言學(xué)學(xué)者基于計(jì)算機(jī)科學(xué)和數(shù)學(xué)算法開始將文學(xué)文本做成語料庫,相繼出現(xiàn)了“計(jì)算文體學(xué)”“計(jì)量文體學(xué)”“統(tǒng)計(jì)文體學(xué)”等基于計(jì)算機(jī)“文本聚類和分類”的研究分支,其中也包含作品與作家語言面貌的分析。如19 世紀(jì),T.C.門登霍爾(T.C.Mendenhall)通過詞頻計(jì)算對比分析了狄更斯和薩克雷的創(chuàng)作風(fēng)格。20 世紀(jì)80 年代,對古典文學(xué)進(jìn)行語料庫轉(zhuǎn)換的“帕爾修斯項(xiàng)目”被設(shè)想和開展?!白杂X”則是立足于文學(xué)本體對算法覺察并進(jìn)行有意識地研究。后現(xiàn)代主義敘事學(xué)家馬克?柯里(Mark Carrie)曾在敘事話語的研究中評價(jià)文學(xué)的定量研究:“計(jì)算文體學(xué)并不問諸如‘愛瑪可愛嗎?’之類的問題,而像問‘在康拉德的《黑暗之心》中l(wèi)ike 這個(gè)詞出現(xiàn)了多少次?’”①[英]馬克?柯里:《后現(xiàn)代敘事學(xué)理論》,寧一中譯,北京:北京大學(xué)出版社,2003 年,第29 頁。也就是說算法批評分析語言出現(xiàn)的次數(shù)與人物意識、文本闡釋之間的關(guān)系。意大利耶穌會羅伯特?布薩(Roberto Busa)與IBM 合作,對圣徒托馬斯?阿奎那(Thomas Acquinas)多達(dá)1100 多萬字拉丁文《托馬斯著作索引》編制了索引。自此,文學(xué)批評者更加自覺地將量性關(guān)系納入文學(xué)研究的范疇內(nèi)?!白杂X”與“他覺”的交織使得文學(xué)與其他學(xué)科的交流互動愈加頻繁。(2)“計(jì)算機(jī)”算法批評的進(jìn)一步發(fā)展階段:隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)對大數(shù)據(jù)管理應(yīng)用的成熟,促使“算法”研究形成一股重要的力量。此時(shí),算法批評圍繞著計(jì)算機(jī)為核心展開,主要在批評媒介、批評實(shí)踐和批評結(jié)果三個(gè)方面貫穿算法,包括文學(xué)數(shù)據(jù)庫的建立、計(jì)算機(jī)算法批評實(shí)踐、可視化系統(tǒng)下批評結(jié)果的呈現(xiàn)等過程。從批評媒介的角度來看,文學(xué)數(shù)據(jù)庫的建立將承載符號的物質(zhì)化實(shí)在轉(zhuǎn)向數(shù)據(jù)化虛在,脫實(shí)向虛的媒介變更讓符號具有了實(shí)現(xiàn)算法的基本前提。從批評方法的角度來看,通過將文本看作確定性的語言總集,以計(jì)算機(jī)對關(guān)鍵詞識別和提取,以算法對文本數(shù)量和結(jié)構(gòu)關(guān)系,對不同文本之間的互文性、作家身份等進(jìn)行分析。從批評結(jié)果呈現(xiàn)的角度來看,傳統(tǒng)的批評依托于“話語的再現(xiàn)”完成其實(shí)踐過程,而算法批評多以可視化系統(tǒng)完成數(shù)據(jù)的輸出,以“數(shù)與圖的再現(xiàn)”來凸顯量性、位置和結(jié)構(gòu)關(guān)系。與此同時(shí),計(jì)算過程中算法對闡釋的主導(dǎo)問題逐漸凸顯。
對“算法批評”進(jìn)行較為詳細(xì)論述的代表學(xué)者是斯蒂芬?拉塞姆(Stephen Ramsay),其代表作《算法批評》(Algorithmic Criticism)中幾個(gè)基本觀點(diǎn)如下:其一,數(shù)字人文是算法批評得以展開的基本背景。拉塞姆明確說明,與其他跨學(xué)科研究領(lǐng)域相同,數(shù)字人文促進(jìn)人文科學(xué)與計(jì)算機(jī)科學(xué)之間發(fā)生革新和對抗,導(dǎo)致二者范式的破裂,其研究方法在社會融合中不斷發(fā)生形態(tài)的變化。宏觀的變化也牽動文學(xué)批評將計(jì)算機(jī)的算法功能納入研究的范疇,延續(xù)原本就已然存在的計(jì)算批評傳統(tǒng)。其二,算法批評可以起到繼往開來的作用。拉塞姆追溯了算法批評的研究歷史,分析了當(dāng)下的研究現(xiàn)狀。他指出以計(jì)算機(jī)進(jìn)行文本分析的傳統(tǒng)有將近六十余年的歷史,其中文本風(fēng)格(style)、作者研究(authorship)、對比研究(comparative analysis)都是較為成熟的研究領(lǐng)域。而當(dāng)下互聯(lián)網(wǎng)時(shí)代,計(jì)算文本的研究范式在自然語言進(jìn)程(natural language processing)、數(shù)據(jù)計(jì)算(statistical computing)和人工智能(artificial intelligence)方面均有很大潛力。其三,算法批評的核心是圍繞文學(xué)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行計(jì)算而展開。算法批評的底層邏輯是將文學(xué)文本看作數(shù)據(jù),通過計(jì)算機(jī)的計(jì)算功能對數(shù)據(jù)進(jìn)行統(tǒng)計(jì),并用某種算法進(jìn)行詞頻計(jì)算,以實(shí)現(xiàn)對文本的解讀。其四,算法批評具有能為和不能為之處。從實(shí)際應(yīng)用的狀態(tài)來說,算法批評可以用數(shù)據(jù)驗(yàn)證人類假設(shè),其數(shù)據(jù)事實(shí)確實(shí)具有抵抗主觀判斷的功能。但算法批評也因局限文本資料,被質(zhì)疑只關(guān)注文本本身,對文學(xué)語言整體性的偏信,以及對作者意圖和讀者闡釋的忽視。在拉塞姆的眼中,算法批評有待實(shí)現(xiàn)認(rèn)識論上的轉(zhuǎn)變。
除了拉塞姆對算法批評進(jìn)行過較為集中的論述,其他數(shù)字人文工作者或是直接或是間接地對“算法批評”及其內(nèi)涵進(jìn)行過討論。如對算法批評背后的人文計(jì)算、計(jì)算機(jī)和數(shù)字人文之間關(guān)系的討論:“當(dāng)下的數(shù)字人文學(xué)科源于人文計(jì)算的60 多年傳統(tǒng),并且在某些方面仍然延續(xù),從20 世紀(jì)中葉大型機(jī)的詞匯和語言工作開始,一直持續(xù)到該世紀(jì)末互聯(lián)網(wǎng)和萬維網(wǎng)的誕生。數(shù)字人文的關(guān)注點(diǎn)將注意力集中在對文化遺產(chǎn)、匯總檔案的數(shù)字化上?!雹貸ones,S.(2014) .The Emergence of the Digital Humanities.New York and London: Routledge.安妮?伯迪克等人說到:“數(shù)字活動的第一階段,主要是對文本和數(shù)據(jù)進(jìn)行排序、搜索、計(jì)算和匹配等基本操作?!@些標(biāo)簽的插入,意味著可以對解釋的內(nèi)容和展開的方式進(jìn)行操作?!雹赱美]安妮?伯迪克等:《數(shù)字人文:改變知識創(chuàng)新與分享的游戲規(guī)則》,馬林青、韓若畫譯,北京:中國人民大學(xué)出版社,2018 年,第17 頁。馬克?維澤(Mark Weiser)早在1991 年就在《科學(xué)美國人》(Scientific American)中提出“普適計(jì)算”(pervasive 或ubiquitous computing)③普適計(jì)算的不同英文名是對其不同特點(diǎn)的強(qiáng)調(diào)。pervasive 一詞更強(qiáng)調(diào)計(jì)算對日常生活的嵌入性,ubiquitous 強(qiáng)調(diào)計(jì)算的普遍性。,“強(qiáng)調(diào)把計(jì)算機(jī)嵌入到環(huán)境或日常工具中去,讓計(jì)算機(jī)本身從人們的視線中消失,讓人們注意的中心回歸到要完成的任務(wù)本身”④徐光祐等:《普適計(jì)算》,《計(jì)算機(jī)學(xué)報(bào)》2003 年第9 期。。亞當(dāng)?格林菲爾德(Adam Greenfield)也提出了“普適算法”(everyware)指的是“無處不在或普適的計(jì)算已經(jīng)在2005 年左右形成一種范式的轉(zhuǎn)變”⑤Greenfield,A.(2006) .Everyware: The Dawning Age of Ubiquitous Computing.Berkeley,CA: New Riders.。以上論述也表現(xiàn)出互聯(lián)網(wǎng)科技的背景、文本的數(shù)據(jù)化,計(jì)算與算法⑥算法指的是用于計(jì)算的方法,是解決問題的步驟和規(guī)范,在計(jì)算過程中起到主導(dǎo)作用,在計(jì)算機(jī)端以“數(shù)據(jù)結(jié)構(gòu)+算法=程序”為構(gòu)成。計(jì)算是按照算法進(jìn)行的運(yùn)算,得到數(shù)量結(jié)果的過程,二者不能分而用之。實(shí)際上,文學(xué)批評史中“計(jì)算批評”到“算法批評”的更迭表現(xiàn)出批評者從對計(jì)算結(jié)果的關(guān)注轉(zhuǎn)向?qū)τ?jì)算方法的關(guān)注,二者都指向定量的文學(xué)批評范式。內(nèi)涵的互相滲透,共同指向計(jì)算機(jī)算法設(shè)定及數(shù)據(jù)計(jì)算的定量研究范式。
對傳統(tǒng)的文學(xué)批評方法來說,算法批評既像一個(gè)批評的內(nèi)部成員也像一個(gè)外來者。因?yàn)樗惴ㄅu承載著計(jì)算批評的傳統(tǒng),又與計(jì)算機(jī)技術(shù)進(jìn)行新的合作,為傳統(tǒng)批評方法注入了新的力量。因此,當(dāng)下算法批評的意義源自跨學(xué)科的居間所帶來的新視角,正因?yàn)槭峭鈦淼?,在一定距離之外,才會成為傳統(tǒng)文學(xué)批評的一面透視鏡。它也提供一種不同價(jià)值,能喚醒一種新的批評意識,能夠給批評者帶來用數(shù)量關(guān)系“體驗(yàn)事物自身的那種明晰,或體驗(yàn)事物之本來面目的那種明晰”⑦[美]蘇珊?桑塔格:《反對闡釋》,程巍譯,上海:上海譯文出版社,2011 年,第15 頁。。但也正因?yàn)樗惴ㄅu在科學(xué)和人文之間居中,其跨學(xué)科屬性帶來了研究的模糊和閾限,使得很多核心概念的歸總出現(xiàn)難以調(diào)和之處。
從長久的爭論歷史看,傳統(tǒng)批評方法和算法批評的分歧有表隱之分。表象區(qū)別清晰地表現(xiàn)在批評媒介的數(shù)據(jù)化、批評實(shí)踐的算法化、批評結(jié)果的可視化。隱性之處表現(xiàn)在“因果邏輯”典型與“大數(shù)定律”典型的差異,也切合著闡釋客觀主義和主觀主義、語言“自明性”的歷史性爭論。
1.批評媒介的數(shù)據(jù)化。它的涵義指的是文學(xué)文本從印刷媒介轉(zhuǎn)變到數(shù)據(jù)媒介的過程。安妮?伯迪克曾說:“人文主義之勢的現(xiàn)代概念是建立在創(chuàng)作、敘述和印刷媒介組成的文本模型之上的?!雹郲美]安妮?伯迪克等:《數(shù)字人文:改變知識創(chuàng)新與分享的游戲規(guī)則》,第5 頁。而數(shù)字人文的概念則建立在文本的數(shù)據(jù)化之上。從文學(xué)批評的角度來說,承載符號的批評媒介正從實(shí)體轉(zhuǎn)向虛體,形成大數(shù)據(jù)的積累(accumulation of data)。當(dāng)文本以數(shù)據(jù)的方式存在于互聯(lián)網(wǎng)時(shí),編碼方式的改變導(dǎo)致文本既可以被粘貼,文本與文本之間又能以超鏈接的方式跳躍。特別是文學(xué)的數(shù)據(jù)庫被不斷地建立,進(jìn)一步實(shí)現(xiàn)了對文本語句的提取和整合。比較典型的系統(tǒng)有 Infonetware Real Term Search,基于 Java 的開源Carrot2 搜索結(jié)果聚合聚類引擎 2.0 版,它“可以自動把自然的搜索結(jié)果歸類(聚合聚類)到相應(yīng)的語義類別中,提供基于層級的、同義的以及標(biāo)簽過濾的功能”①姚清耘、劉功申、李翔:《基于向量空間模型的文本聚類算法》,《計(jì)算機(jī)工程》2008 年第9 期。。如北京大學(xué)“吾與點(diǎn)古籍整理系統(tǒng)”,它通過計(jì)算機(jī)極高的處理速率和響應(yīng)速率,對文本進(jìn)行處理,進(jìn)而實(shí)現(xiàn)字句識別、自動斷句等功能。由此可見,批評媒介的數(shù)據(jù)化是激發(fā)算法批評的重要力量,更迭了原有的話語結(jié)構(gòu)。
2.批評實(shí)踐的算法化。傳統(tǒng)文學(xué)批評實(shí)踐多基于文本細(xì)讀的方法,在考察量性關(guān)系時(shí),批評者本人承擔(dān)計(jì)算和批評的任務(wù)。但是算法批評下,批評過程發(fā)生了解離,分解成以計(jì)算機(jī)主導(dǎo)的“算法階段”和以人為主導(dǎo)的“批評階段”,人和計(jì)算機(jī)共同負(fù)責(zé)闡釋結(jié)果。在計(jì)算機(jī)主導(dǎo)的“算法階段”,由于海量的數(shù)據(jù)遠(yuǎn)超人的計(jì)算能力,也由于計(jì)算機(jī)、數(shù)學(xué)和人文學(xué)科之間的知識壁壘,傳統(tǒng)的人文學(xué)科研究者很難插手到算法建構(gòu)和數(shù)據(jù)計(jì)算之中。如拉塞姆在研究弗吉尼亞?伍爾夫 (Virginia Woolf) 的小說《浪潮》(The Waves)時(shí),涉及了將文本數(shù)據(jù)化,并以“tf-idf=tf?(N/df)”進(jìn)行算法的設(shè)定,最后依賴于計(jì)算機(jī)對算法的執(zhí)行?!皌f-idf”是信息檢索和數(shù)據(jù)分析的經(jīng)典公式,tf 是詞頻(Term Frequency,縮寫為tf),“idf”是“逆文檔頻率”(Inverse Document Frequency,縮寫為idf)。該公式的計(jì)算結(jié)果數(shù)值越大,這個(gè)詞在文本中的重要性會越高。拉塞姆分別對《浪潮》中的路易斯、本納德、金妮等角色的詞頻進(jìn)行計(jì)算,并結(jié)合數(shù)據(jù)闡釋了主要人物的性格愛好等。一般來說,該公式的計(jì)算結(jié)果也需要研究者進(jìn)一步闡釋,這也代表著數(shù)據(jù)由“生”到“熟”的階段。由此為例,這個(gè)過程清晰地呈現(xiàn)出批評過程的算法化和批評職責(zé)的分裂。
3.批評結(jié)果的可視化。算法的輸出結(jié)果往往依托于可視化系統(tǒng)呈現(xiàn),即批評的可視化??梢暬傅氖菍?shù)據(jù)轉(zhuǎn)換成可見的“形象”或“圖形”,既包含文本相關(guān)“形象”的多維建立,也更偏重經(jīng)計(jì)算后以“圖形”呈現(xiàn)數(shù)據(jù)。圖形、圖像和文本三者構(gòu)成批評實(shí)踐的結(jié)果。如“數(shù)字亞述學(xué)”研究重點(diǎn)在于,以楔形文字為母本材料進(jìn)行數(shù)字化建模,對巴比倫等遺址進(jìn)行3D 全景重現(xiàn)和虛擬VR 應(yīng)用。這一過程“不僅表現(xiàn)為對母本意義的遴選與重組,甚至是一種基于母本之上的顛覆性重構(gòu),圖像創(chuàng)作者掌控著頗為強(qiáng)勢的主觀能動性”②張偉:《視覺批評何以可能——圖像時(shí)代文學(xué)闡釋的視覺轉(zhuǎn)向與審美創(chuàng)構(gòu)》,《河南社會科學(xué)》2017 年第3 期。,即是一種闡釋。“圖形”呈現(xiàn)文本數(shù)據(jù)的含義是對單一或多個(gè)文學(xué)元素進(jìn)行計(jì)算后,再以“圖形”來呈現(xiàn),計(jì)算結(jié)果的表現(xiàn)形式往往是聚類樹狀圖、生命線、同心圓、矩陣、地圖等形式。如中國歷代人物傳記資料庫(CBDB)與中國歷史地理信息系統(tǒng)(CHGIS)關(guān)聯(lián)建立立體圖景,實(shí)現(xiàn)了空間信息可視化。闡釋結(jié)果的可視化包含著兩層含義:第一層是圖像與圖形已然是一種批評結(jié)果的可視化。第二層含義是圖形、圖像需要經(jīng)批評者的進(jìn)一步甄別與解釋形成闡釋結(jié)果。
由批評媒介的數(shù)據(jù)化、批評實(shí)踐的算法化和批評結(jié)果的可視化可看出傳統(tǒng)批評方法和算法批評之間確實(shí)存在較大不同,而二者的核心區(qū)別在于文本“典型”塑造的路徑以及定性與定量研究的分歧。以“作家”為中心的經(jīng)典批評方法,以“社會”為中心的文化研究等,分別在方法層面體現(xiàn)出作家、社會歷史、文化研究的理論意識前置性,以及與文本之間定性因果律下“典型”的判斷。以“文本”為中心的新批評、結(jié)構(gòu)主義等研究方法專注于文學(xué)文本自身的語言和結(jié)構(gòu)。但在二元對立、人物功能、故事情節(jié)的提煉等又滲透著“重視抽象,輕視數(shù)據(jù)”的實(shí)證研究特點(diǎn),具體表現(xiàn)在它更加“強(qiáng)調(diào)結(jié)構(gòu)是一個(gè)被遮掩的,然而確實(shí)成型的更深的層面”③[澳]安德魯?米爾納、[澳]杰夫?布勞伊特:《當(dāng)代文化理論》,劉超、肖雄譯,南京:江蘇人民出版社,2008 年,第90 頁。,但在實(shí)際操作時(shí)往往越過文本自身的量性和結(jié)構(gòu)關(guān)系。以“讀者”為中心的讀者反應(yīng)批評中,對文本的闡釋是基于個(gè)人的前經(jīng)驗(yàn)對文本進(jìn)行體驗(yàn)性理解,是個(gè)體圍繞自身的情況與文本之間的互動過程。文本自身的事實(shí)居于次要地位,以文本形成體驗(yàn)的真實(shí)和共情式的“典型”居于主要地位。綜合現(xiàn)有的批評方法,均“強(qiáng)調(diào)以自然的、非參與和參與性的觀察為手段,注重對研究對象的過程和整體進(jìn)行具有豐富性、生動性、深層性的描述,并在此基礎(chǔ)上進(jìn)行想象、移情”①沃野:《關(guān)于社會科學(xué)定量、定性研究的三個(gè)相關(guān)問題》,《學(xué)術(shù)研究》2005 年第4 期。,再以不同側(cè)重點(diǎn)對典型進(jìn)行提煉和研究。算法批評則是基于“大數(shù)定律”下的定量研究方式。在研究文本內(nèi)容時(shí),它主張對某一目標(biāo)詞進(jìn)行頻率的計(jì)算,以詞頻反應(yīng)小說中的人物意識、身份、關(guān)系網(wǎng)絡(luò),并以此來建立“概率性”典型。兩種樹立文本典型的路徑各有不同,其結(jié)果便存在一定區(qū)隔。正如以不同視角對《浪潮》的解讀包括女性主義、女性意識、意識流等結(jié)果,而拉塞姆通過算法得出的結(jié)論則是:“許多人注意到路易癡迷于埃及和尼羅河”②Simens,R.&Schreibman,S.(Ed.).(2013) .A Companion to Digital Studies.New Jersey: Wiley-Blackwell.,言談中不斷提及“西方”,反映出他的民族意識。
定量和定性之別包含著二者對彼此方法論不足的指摘。傳統(tǒng)批評方法者普遍認(rèn)為,要基于文本的體驗(yàn)尋求字面背后意義的“有沒有”,指責(zé)文學(xué)的定量研究根本問題就在于對“有”的基本假設(shè)。這也是對意義所進(jìn)行的先驗(yàn)假設(shè),好像意義只等待數(shù)據(jù)來揭示。而定量研究則相信通過數(shù)據(jù)即可以觀察到文本中的固有規(guī)律以及背后代表的意義。它也批判傳統(tǒng)研究方法,容易因?yàn)槲谋净佣a(chǎn)生過量的個(gè)人情感與審美意識,滑向闡釋個(gè)人主義。正如伊格爾頓尖銳地指出了傳統(tǒng)批評方法在論據(jù)方面的不足:“過于關(guān)心概念而很少關(guān)心堅(jiān)實(shí)的論據(jù),因此它在非常脆弱的基礎(chǔ)上建立起它的不穩(wěn)定、頭重腳輕的知識系統(tǒng)”③[英]特里?伊格爾頓:《現(xiàn)象學(xué)、闡釋學(xué)、接受理論》,王逢振譯,南京:江蘇教育出版社,2006 年,第54—55 頁。,忽視了文本本身就可以確定的東西。實(shí)際上,在人文研究傳統(tǒng)內(nèi),兩方的指摘自古有之。其一是源于經(jīng)驗(yàn)哲學(xué)家亞里士多德對經(jīng)驗(yàn)事例和辨別細(xì)微區(qū)別的研究傳統(tǒng),后經(jīng)孔德、實(shí)證主義、羅素的語言分析等一脈的發(fā)揚(yáng)。這一派別的闡釋傳統(tǒng)堅(jiān)定“任何有價(jià)值的哲學(xué)都必定是嚴(yán)格科學(xué)性的”④[愛爾蘭]德爾默?莫蘭:《現(xiàn)象學(xué):一部歷史的和批評的導(dǎo)論》,李幼蒸譯,北京:中國人民大學(xué)出版社,2017 年,第27 頁。,闡釋的結(jié)果具有理性。第二股力量是闡釋的主觀主義。闡釋的主觀主義指的是對研究對象進(jìn)行具體視角下的詮釋,強(qiáng)調(diào)文本的個(gè)人體驗(yàn),而體驗(yàn)的結(jié)果與闡釋者的主觀心境、視域等密切相關(guān)。二者呈現(xiàn)出客觀和主觀兩股闡釋力量的糾纏,也是對闡釋的絕對理性和絕對自由的追求。
而以上分歧的底層邏輯切合了歷史上對語言本身“明晰性”認(rèn)知的爭論。此番爭論由來已久:語言學(xué)領(lǐng)域有索緒爾提出的語言的任意性,喬姆斯基的表層結(jié)構(gòu)與深層結(jié)構(gòu),哲學(xué)領(lǐng)域有語言學(xué)轉(zhuǎn)向,“語言說人”中暗藏的文化支配性,再到不同學(xué)者對基于話語形成歷史闡釋問題的爭辯,都是圍繞著語言展開的。格林布拉特以歷史的文本化為論點(diǎn)也提出:“方法論的自覺意識是新歷史主義在文化研究中反對另一種歷史主義的特殊標(biāo)志,這種歷史主義以對符號以及解釋程序的透明性信任為基礎(chǔ)?!雹軬reenblatt,S.(1990).Learning to Curse: Essays in Early Modern Culture,London: Routledge.一方面,算法批評程序的建立大部分是基于各種語言模型上實(shí)現(xiàn)的,如深度學(xué)習(xí)語言模型。它依賴于語言的此在,對語言出現(xiàn)的頻率進(jìn)行計(jì)算。語言之間的邏輯聯(lián)系是先于經(jīng)驗(yàn)而存在的,并可以通過語言頻次總結(jié)出理論命題。因此,意義在語言中、意義也在語言出現(xiàn)的頻率中,這凸顯了對語言所指功能、語言明晰性、整體語言系統(tǒng)共享性的信任,也代表對大數(shù)據(jù)規(guī)律的信任。另一方面,傳統(tǒng)批評方法承認(rèn)文本也存在語言的表象規(guī)律,但不是自然科學(xué)領(lǐng)域的大數(shù)法則,而是一種類似休謨式的因果關(guān)系(Humean Causation),其含義是“兩個(gè)事件之間的因果關(guān)系僅僅在于第一個(gè)事件總是伴隨著第二類事件”⑥Beebee,H.(2006).Hume On Causation.London and New York: Routledge.。在文本空間中,休謨因果觀指批評者在對某些觀念和意象覺察時(shí),一般將知覺下的第一個(gè)因素稱為原因,把后出現(xiàn)的稱為結(jié)果;在批評的過程中,則指批評者多以作者、社會文化、自身經(jīng)驗(yàn)為因,文本創(chuàng)作為果,以此類邏輯來驗(yàn)證文學(xué)命題。更重要的是,文學(xué)批評經(jīng)歷了后現(xiàn)代主義、哲學(xué)的語言學(xué)轉(zhuǎn)向等,傳統(tǒng)批評家們都對語言的任意性達(dá)成了基本的共識,對語言的明晰性持保留意見。他們相信文學(xué)性語言不依賴語言的此在,不用對語言本身進(jìn)行過多關(guān)注,而是關(guān)注語言自身能指與所指的延異、語言與語氣之間的反諷張力、語言與行為之間的斷裂、語言的空指造成的“模糊性”等。傳統(tǒng)批評家們大多也擅長解讀語言背后的象征、隱喻和留白??傮w來說,算法批評對語言達(dá)意和文本意義澄明性有著基本的信任。而傳統(tǒng)批評者多以“邏輯因果”觀,將批評者、作家、社會文化等納入與文本的間性關(guān)系中,倡導(dǎo)文本的意義是在批評者與文本之間的互動中生產(chǎn)出來的,語言是間性和交往關(guān)系的中介,而非意義本身。
以上的分歧顯示出科學(xué)主義與人文研究之間看似堅(jiān)實(shí)的壁壘,正如希利斯?米勒(Hillis Miller)在其《現(xiàn)代性、后現(xiàn)代性與新技術(shù)制度》中提及當(dāng)下各學(xué)科的研究都依賴于“相對嚴(yán)格的壁壘,邊界和高墻”①[美]希利斯?米勒:《現(xiàn)代性、后現(xiàn)代性與新技術(shù)制度》,陳永國譯,《文藝研究》2000 年第5 期。。但是壁壘也會導(dǎo)致伊格爾頓(Terry Eagleton)所描述的“科學(xué)似乎已經(jīng)縮成以一種枯燥的實(shí)證主義與另一方面站不住腳的主觀主義之間發(fā)生了分裂”②[英]特里 ?伊格爾頓:《現(xiàn)象學(xué)、闡釋學(xué)、接受理論:當(dāng)代西方文藝?yán)碚摗罚醴暾褡g,南京:江蘇教育出版社,2006 年,第 53 頁。。因此,破墻之錘是融合的開端,在后續(xù)的研究中還需要以跨學(xué)科的范式和態(tài)度進(jìn)行研究。但跨學(xué)科并不如布拉格學(xué)派的穆卡洛夫斯基(J.Mukarovsky)所認(rèn)為文學(xué)的純?nèi)恍孕纬闪伺c社會諸多元素的天然屏障,只能將定性和定量研究機(jī)械地放置于文學(xué)批評辯證法的兩端。而應(yīng)以文學(xué)批評的飽滿性、復(fù)雜性和多維性為目標(biāo),將批評的實(shí)踐和標(biāo)準(zhǔn)的建構(gòu)反復(fù)地放在不同系統(tǒng)中加以應(yīng)用和評估,如庫恩(Thomas Kuhn)對范式形成的論證一般,將文學(xué)批評的本質(zhì)論變成持續(xù)的建構(gòu)論,以形成整體的、揚(yáng)棄的批評史觀。因此,二者會從淺表性接觸過度到深度的融合,以期在今后的發(fā)展中形成“定性—定量”共同體的批評成長模式,形成“質(zhì)感—信度”并存的批評標(biāo)準(zhǔn)。
定性—定量融合的現(xiàn)階段批評實(shí)踐包括以下較為成熟的方面:(1)作者身份研究。基于作家基本的文化面貌和較為穩(wěn)定的寫作特點(diǎn),可以通過算法對作家常用詞匯的頻次及其分布進(jìn)行分析,以確定其身份。如利用計(jì)算機(jī)人工智能中的支持向量技術(shù),以44 個(gè)文言虛字頻率為特征向量對《紅樓夢》的作者身份進(jìn)行分析,“結(jié)果證明,從第81 回開始的后40 回和前80 回在寫作風(fēng)格上存在明顯差別,從技術(shù)的角度確認(rèn)了《紅樓夢》前80 回和后40 回為兩人所作”③施建軍:《基于支持向量機(jī)技術(shù)的〈紅樓夢〉作者研究》,《紅樓夢學(xué)刊》2011 年第5 期。。(2)人物意識研究。不同的詞頻可以確定文本人物性別意識、種族意識和共同體意識。如麥克爾?斯特布斯(Micheal Stubbs)對康拉德的《黑暗之心》進(jìn)行定量分析,通過詞語分布研究、文本結(jié)構(gòu)搭建、互文關(guān)系“為文學(xué)闡釋提供更加細(xì)節(jié)性描述”④Stubbs,M.(2005).Conrad in the Computer: Examples of Quantitative Stylistic Methods.Language and Literature,14,5-24.,總結(jié)分析馬洛敘事不可靠性下的種族偏見。(3)空間研究?;谧髌分谐霈F(xiàn)的地點(diǎn),對文本空間所有的地理數(shù)據(jù)進(jìn)行挖掘計(jì)算,可以較為精準(zhǔn)地繪制出文本地理空間。如一批學(xué)者試圖以克里斯托弗?哥倫布、雅克?卡地亞圣勞倫斯海灣的旅程記錄、約翰?史密斯于1612 年繪制的弗吉尼亞地圖等建立可搜索的數(shù)據(jù)庫,以“差異化制圖”的方式建構(gòu)并還原原住民的生存空間,進(jìn)一步研究其心理呈現(xiàn)與文化表征。其他領(lǐng)域的學(xué)者也在進(jìn)行語言學(xué)與文學(xué)的結(jié)合研究,如麥克?布克(Michael Burke)希望通過回到文學(xué)的結(jié)構(gòu)主義中汲取理論資源再進(jìn)行更符合文學(xué)研究需要的語料庫建設(shè)。如2003 年在蘭卡斯特大學(xué)召開的“比喻性語言基于語料庫的研究方法”(corpus-based approaches to figurative language),將文學(xué)語言的模糊性特點(diǎn)與讀者心理反應(yīng)納入語料庫和可視化系統(tǒng)研發(fā)的重點(diǎn)。
在以上若干“定性—定量”融合的研究現(xiàn)狀中可見:一方面,部分文學(xué)研究者對批評方法“質(zhì)”“量”的結(jié)合已然從認(rèn)知—接受進(jìn)入到應(yīng)用階段,為獲得闡釋的公共性和理性,他們愿意讓渡部分的闡釋主導(dǎo)權(quán)力給計(jì)算機(jī)的算法,接受以實(shí)證數(shù)據(jù)驗(yàn)證自己的闡釋結(jié)果,進(jìn)一步規(guī)定自己的闡釋路徑。而語言學(xué)的研究者也已經(jīng)注意到文學(xué)性語言與日常語言在傳情達(dá)意方面的區(qū)別,試圖在語料庫的建設(shè)中尋求解決文學(xué)的無序、偶然和主觀的辦法。另一方面,當(dāng)下大部分的融合仍然未能破除思維定勢。如在文學(xué)批評意識中,一部分學(xué)者仍然將定性等于主觀的無序,將定量等于客觀的有序,忽視二者辯證共在的狀態(tài)。在批評方法運(yùn)用中,局限在以數(shù)據(jù)“盡可能減少分析和解釋中的任意性和循環(huán)性”①O’Halloran,K.(2007).The Subconscious in James Joyce’s Eveline’: A Corpus Stylistic Analysis That Chews on the Fish hook’.Language and Literature 16,227-244.,以語言的確定性驗(yàn)證闡釋的確定性。但是未來的融合方向是打破既定思維,以共同體的成長模式實(shí)現(xiàn)認(rèn)識論和方法論上的轉(zhuǎn)變。
“世界上科學(xué)發(fā)展的總趨勢是走向綜合與交叉。走向一體化,不再區(qū)分自然科學(xué)方法論與社會科學(xué)方法論?!雹诜拢骸犊茖W(xué)主義與20 世紀(jì)中國文學(xué)史寫作研討會綜述》,《文學(xué)批評》2005 年第2 期。傳統(tǒng)批評與算法批評之間的融合也是二者不斷凝視對方,又在被凝視中回看自身,在實(shí)踐中共同發(fā)生了轉(zhuǎn)向性、價(jià)值性、顛覆性的變化,形成文學(xué)批評方法論層面“系統(tǒng)關(guān)系體”的共在狀態(tài)。
“耗散結(jié)構(gòu)理論”對未來文學(xué)批評“定性—定量”融合研究的啟示。如果研究者基本承認(rèn)算法批評和傳統(tǒng)批評之間本就具有截然不同的屬性,質(zhì)性研究的文學(xué)批評多是主觀的、情感的、模糊的、偶然的,量化處理的算法批評是客觀的、規(guī)律的、確定的和結(jié)構(gòu)的,那么“耗散結(jié)構(gòu)理論”會對必然與偶然的關(guān)系形成顛覆。它是伊?普里戈金(I.Prigogine)在其《從混沌到有序》(Order Out of Chaos)中提出的觀念,主張“偶然的必然性”和“必然的偶然性”辯證關(guān)系。(1)書中列舉了“化學(xué)鐘”的實(shí)驗(yàn)和DNA 復(fù)制。“化學(xué)鐘”實(shí)驗(yàn)是海量的黑球和白球混合在箱子里亂跳,觀察者通過孔洞觀察箱子應(yīng)該是符合可視窗口樣本分布,預(yù)測出現(xiàn)的球或是白或是黑。但是實(shí)際上,白球和黑球的顯現(xiàn)隨著時(shí)間規(guī)律地、交替地出現(xiàn)。這是從無序到自顯的有序。而在遺傳學(xué)研究中DNA 進(jìn)行生物信息復(fù)制時(shí),外界的微小干擾可能導(dǎo)致DNA復(fù)制時(shí)發(fā)生巨大的結(jié)構(gòu)性破壞。這是從有序到自顯的無序。(2)基于若干類似的觀察,普里戈金認(rèn)為任何系統(tǒng)都有兩個(gè)走向:有序的系統(tǒng)不會永遠(yuǎn)延續(xù)其定勢,而是會進(jìn)入新的混沌與無序。無序的系統(tǒng)不會永遠(yuǎn)保持其亂勢,它會躍遷到新的有序高階階段,即其所說的“耗散結(jié)構(gòu)”。整體的過程體現(xiàn)了:低層次的混沌會形成高層次的有序,有序則會因變量的出現(xiàn)散落為新的無序,形成偶然中走向必然,必然中走向偶然的一體化進(jìn)程。阿爾文?托勒夫認(rèn)為普里戈金的研究價(jià)值是把“必然性和偶然性重新裝到一起,把自然科學(xué)和人文科學(xué)重新裝到一起”③[比]伊?普里戈金、[比]伊?斯唐熱:《從混沌到有序:人與自然的新對話》,曾慶宏、沈曉峰譯,上海:上海譯文出版社,2005 年,第1 頁。。
再以耗散結(jié)構(gòu)回看文學(xué)批評的定量和定性之別,以及二者融合的問題。其一,文學(xué)的定性研究不再等于主觀的差異性,它也會逐漸造成闡釋的固步自封。在西方精細(xì)化發(fā)展的批評歷史中,如精神分析對人物心理的力比多還原、性別研究中的二元對立性別結(jié)構(gòu)等,均是一種被經(jīng)驗(yàn)構(gòu)造并加以抽象的批評模式,它在具體視角的觀點(diǎn)中被進(jìn)一步先驗(yàn),又循環(huán)地前置成批評者的范式居于意識之中。當(dāng)批評者本來混沌的文本體驗(yàn)被固定的批評范式強(qiáng)制聚焦,尋找的文本證據(jù)都會向聚焦的視角靠攏,進(jìn)而陷入自我封閉的闡釋循環(huán)之中。這一封閉的狀態(tài)需要引進(jìn)大數(shù)據(jù)的變量來激發(fā)其闡釋的活力。定量研究不再等同于有序的確定性,算法也會造成闡釋的混亂。正如斯坦利?費(fèi)什(Stanley Fish)在《數(shù)字人文及其不朽》中對經(jīng)數(shù)據(jù)計(jì)算后的“過程性文本”的批判性反思,他認(rèn)為數(shù)字化計(jì)算后的文本像《失樂園》中的神秘舞蹈,逐級遞增的數(shù)據(jù)增加了闡釋的噪音,在某種程度上并沒有起到聚合闡釋的作用而是加深了分歧。因此,在闡釋的混亂中需要為數(shù)字錨定具體的人文價(jià)值。斯科李莫夫斯基(H.Skolimowski)也認(rèn)為:“任何現(xiàn)代技術(shù)文明的人文化嘗試,首先都會把人類的價(jià)值觀貫徹其中”④[俄]B.M.羅津:《技術(shù)哲學(xué)——從埃及金字塔到虛擬現(xiàn)實(shí)》,張藝芳譯,上海:上海科技教育出版社,2018 年,第6 頁。,實(shí)際也應(yīng)該貫徹其中。其二,普里戈金的耗散結(jié)構(gòu)理論明確地把系統(tǒng)的“必—偶”運(yùn)動歸結(jié)為自發(fā)性生成,它“是一個(gè)‘自組織’的過程,真的從無序和混沌中‘自發(fā)地’產(chǎn)生出來”①[比]伊?普里戈金、[比]伊?斯唐熱:《從混沌到有序:人與自然的新對話》,第6 頁。。但文學(xué)批評的實(shí)踐不能依靠自發(fā)變化,或者它表現(xiàn)為自發(fā)的運(yùn)動,實(shí)際上也是人的主導(dǎo)實(shí)踐在宏觀層面被觀測為自發(fā)無意識進(jìn)程。綜合以上兩個(gè)方面,具體的融合實(shí)踐路徑,就不是從方法論共時(shí)天平的兩端,擇其一而用。而是讓主觀的文學(xué)判斷融合實(shí)證意識,讓數(shù)字技術(shù)研究貫穿人文價(jià)值,抑或主動地在定量中引入變量,在變量中把握定量,在歷時(shí)性批評實(shí)踐中保證有序與無序的并存和轉(zhuǎn)化,以形成文學(xué)批評共同體的成長模式。它會成為對文學(xué)“原生式的把握,不是線性的,而是非線性的;不是決定論的,也不是純粹偶然論的,而是有序與無序的統(tǒng)一,偶然與必然的統(tǒng)一。隨機(jī)中有著有序,有序中又有著隨機(jī);無序中孕育著有序,有序復(fù)分為隨機(jī)”②王鐘陵:《論文學(xué)史運(yùn)動的內(nèi)在機(jī)制及其展開形式》,《中國社會科學(xué)》1995 年第5 期。。
最后,共同體成長的文學(xué)批評可能更加切合拉塞姆說所的“認(rèn)識論轉(zhuǎn)變”,“‘算法批評’拒絕將計(jì)算機(jī)的經(jīng)驗(yàn)主義觀點(diǎn)視為可以驗(yàn)證批判性解釋的一種手段,而是尋求將計(jì)算過程定位在豐富的傳統(tǒng)或解釋性努力中(相較于批評,它通常與藝術(shù)更一致),這種尋求不限制意義,而是保證其多樣性”③Simens,R.&Schreibman,S.(Ed.).(2013) .A Companion to Digital Studies.New Jersey: Wiley-Blackwell.,形成“質(zhì)感—信度”并存的批評標(biāo)準(zhǔn)。
綜上所述,從印刷業(yè)到互聯(lián)網(wǎng)行業(yè)、書籍到數(shù)據(jù)庫,正如波茲曼曾對媒介更迭進(jìn)行評論:“一種重要新媒介會改變話語的結(jié)構(gòu)”④[美]尼爾?波茲曼:《娛樂至死》,章艷譯,桂林:廣西師范大學(xué)出版社,2004 年,第33 頁。。而文學(xué)作為人文研究的子部分,同樣受到了大數(shù)據(jù)下算法的撥弄。這種撥弄是否會成為一股強(qiáng)大的力量并與傳統(tǒng)批評方法形成融合之勢,研究者確有積極的預(yù)測。算法批評對“人文的科學(xué)化、科學(xué)的人文化”趨勢更加敏感并進(jìn)行積極回應(yīng)。它代表了定量和定性的融合,有打破闡釋的封閉性,又使其獲得一定秩序性的潛力。算法批評研究不僅僅局限于發(fā)揮其實(shí)證作用,最終目的更不是打破文學(xué)的中心性,而是共生于傳統(tǒng)批評方法之中,助力形成更加具有“質(zhì)量”的批評成果。