■吳春梅
(作者單位:中國現(xiàn)代文學(xué)館)
數(shù)字人文,一般被理解為以數(shù)字信息技術(shù)為方法來研究人文領(lǐng)域的問題。人文研究的對(duì)象是人類的精神世界及其積淀的精神文化,它主要運(yùn)用意義分析和解釋的方法來研證人的觀念、精神、情感、價(jià)值和悟性等。因此,人文研究的過程更強(qiáng)調(diào)個(gè)性、特色、差異。當(dāng)我們嘗試將數(shù)字技術(shù)融入到人文研究領(lǐng)域時(shí),人文研究者很快就意識(shí)到了數(shù)字科技已經(jīng)不可逆轉(zhuǎn)地滲透到他們的生活、工作之中,從而改變了他們的工作方式、研究方式和對(duì)象的載體。上海大學(xué)文學(xué)院教授曾軍曾在《數(shù)字人文的人文之維》中指出:“數(shù)字人文研究作為人文研究與數(shù)字技術(shù)的跨學(xué)科結(jié)合,同時(shí)包含了兩個(gè)維度的趨向:其一是‘人文研究數(shù)字化’,即用數(shù)字技術(shù)解決人文問題;其二是‘?dāng)?shù)字技術(shù)人文化’,即以人文方式發(fā)展數(shù)字技術(shù),‘讓數(shù)字更人文’?!眰鹘y(tǒng)的人文研究是以文獻(xiàn)史料為基礎(chǔ),而數(shù)字人文則是以數(shù)據(jù)為研究問題的基礎(chǔ),因此數(shù)字人文興起的前提,就是人文資料和文獻(xiàn)史料的數(shù)據(jù)化和數(shù)字化。隨著技術(shù)的驅(qū)動(dòng)、研究者數(shù)據(jù)思維的逐步形成和新時(shí)代新寫作手法的不斷涌現(xiàn),賦予數(shù)字人文更深層次的內(nèi)涵,即以數(shù)字化的文獻(xiàn)史料和新傳播方式產(chǎn)生的數(shù)字化文本為數(shù)據(jù)基礎(chǔ),利用大數(shù)據(jù)處理和算法分析的方法實(shí)現(xiàn)人文學(xué)術(shù)研究。作為以收集、保管中國現(xiàn)當(dāng)代作家史料為主要職責(zé)的中國現(xiàn)代文學(xué)館,在數(shù)字時(shí)代如何合理地構(gòu)建文學(xué)史料的大數(shù)據(jù)?為研究者提供怎樣的數(shù)字化資源?怎樣將數(shù)字化資源應(yīng)用于文學(xué)研究?能夠提供何種數(shù)字技術(shù)方法來支持人文領(lǐng)域的研究?面對(duì)層出不窮的新寫作手法和數(shù)據(jù)庫文本資料,如何收集、保管?都是文學(xué)館要面對(duì)和亟待解決的問題。
(一)現(xiàn)當(dāng)代文學(xué)文獻(xiàn)史料數(shù)字化是數(shù)字人文的基礎(chǔ)。在傳統(tǒng)研究方式上,學(xué)者進(jìn)行學(xué)術(shù)研究的基礎(chǔ)性工作就是大量閱讀文獻(xiàn)資料,了解本專業(yè)的研究背景,廣泛接觸前沿理論,才能進(jìn)行深一層次的思考,得到更進(jìn)一步的成果,達(dá)到“后浪推前浪”的效果。就文學(xué)領(lǐng)域來說,無人不贊嘆錢鍾書先生旁征博引,縱貫古今中西的治學(xué)能力。著名國學(xué)大師吳宓曾專門寫詩稱贊他的才華:“才情學(xué)識(shí)誰兼具,新舊中西子竟通。大器能成由早慧,人謀有補(bǔ)賴天工?!比欢?,就是憑借超群的記憶能力和博覽群書的勤奮態(tài)度,錢先生在晚年也深感力不從心,他在《管錐編》再版序言中寫道:“《管錐編》問世以還,數(shù)承讀者貽書啟益。余重閱一過,亦見樹義之蘊(yùn)蓄未宣、舉證之援據(jù)中者,往往而有?!贝搜源蟾啪褪蔷売阱X先生自覺年事已高,記憶力衰退,感嘆自己不再能以博聞強(qiáng)記、考辨舉證的能力為學(xué)術(shù)擅長而自居。上世紀(jì)八十年代,錢先生從女兒錢媛處得知英國利用計(jì)算機(jī)儲(chǔ)存和查閱莎士比亞資料,并在戲劇研究領(lǐng)域取得顯著成果后,受到啟發(fā)而于1984年開始倡導(dǎo)把計(jì)算機(jī)技術(shù)引入到中國古典文獻(xiàn)的搜集、疏證和整理中來。錢先生的治學(xué)方式是,“在大量讀書的基礎(chǔ)上,發(fā)現(xiàn)相關(guān)文獻(xiàn)之間的內(nèi)在聯(lián)系,進(jìn)而抽繹出問題,并以大量例證予以解析。這顯然是一種抽絲剝繭、披沙揀金的過程。發(fā)現(xiàn)大量的材料是前提,深厚的學(xué)養(yǎng)、敏銳的眼光和判斷力是關(guān)鍵。而在大量書籍中找尋材料與計(jì)算機(jī)的模式識(shí)別數(shù)據(jù)挖掘顯然具有某種程度上的相似性,只是計(jì)算機(jī)效率更高,速度更快。”這種數(shù)據(jù)概念無疑為學(xué)者埋首“故紙堆”的傳統(tǒng)研究方式,從治學(xué)時(shí)間和治學(xué)能力上都帶來了很大程度的縮短和降低。
強(qiáng)大的搜索功能和對(duì)海量數(shù)據(jù)的儲(chǔ)存和處理能力是計(jì)算機(jī)的特長,錢鍾書先生以超前的視野預(yù)見到,計(jì)算機(jī)技術(shù)對(duì)知識(shí)生產(chǎn)方式上可能帶來變革。中南民族大學(xué)數(shù)字人文資源研究中心主任王兆鵬認(rèn)為,“傳統(tǒng)的文學(xué)研究是以主觀的理解闡釋、客觀的文獻(xiàn)史料為基礎(chǔ),偶爾會(huì)用到數(shù)據(jù),但數(shù)據(jù)只是點(diǎn)綴和補(bǔ)充。而數(shù)字人文研究,以數(shù)據(jù)作為討論問題的基礎(chǔ),需要將文獻(xiàn)史料轉(zhuǎn)化為數(shù)據(jù)?!睆难芯繉?duì)象的角度,對(duì)于實(shí)物文獻(xiàn)的數(shù)字化是目前為數(shù)字人文研究提供可能性所能做到的數(shù)據(jù)準(zhǔn)備,即全力建設(shè)好中國現(xiàn)當(dāng)代文學(xué)文獻(xiàn)基礎(chǔ)設(shè)施。在這方面,已經(jīng)走在前面的有,臺(tái)北中研院近史所建立的“胡適檔案資料庫”,北京中國社科院近史所檔案館建立的“顧維鈞檔案數(shù)據(jù)庫”,北京大學(xué)圖書館建立的“陳翰笙檔案資料庫”,中南大學(xué)文學(xué)院建立的“網(wǎng)絡(luò)文學(xué)文獻(xiàn)數(shù)據(jù)庫”等。正在建置中的項(xiàng)目有,山東師范大學(xué)申報(bào)的“中國近現(xiàn)代文學(xué)期刊全文數(shù)據(jù)庫建設(shè)與研究(1872-1949)”,華中師范大學(xué)文學(xué)院申報(bào)的“中國新詩傳播接受文獻(xiàn)集成、研究及數(shù)據(jù)庫建設(shè)(1917-1949)”,重慶師范大學(xué)申報(bào)的“抗戰(zhàn)大后方文學(xué)史料數(shù)據(jù)庫建設(shè)研究”,“延安時(shí)期未刊文獻(xiàn)資料收集、整理與數(shù)據(jù)庫建設(shè)”,“中國文學(xué)史著作整理、研究及數(shù)據(jù)庫建設(shè)”,“中國近現(xiàn)代文學(xué)期刊全文數(shù)據(jù)庫建設(shè)與研究(1872-1949)”等。這些已建成或正在建置的基礎(chǔ)設(shè)施,已經(jīng)從專題角度為現(xiàn)當(dāng)代文學(xué)提供了研究的可能性。而對(duì)學(xué)者而言,建設(shè)一個(gè)整合的、互聯(lián)互通的、可持續(xù)的基礎(chǔ)設(shè)施是對(duì)館藏機(jī)構(gòu)的學(xué)術(shù)訴求。
(二)新媒介文學(xué)文本為人文研究帶來新的可能。數(shù)字人文的出現(xiàn)是現(xiàn)代研究方法發(fā)展的一個(gè)縮影,隨著數(shù)字技術(shù)的發(fā)展,學(xué)術(shù)研究已經(jīng)從理論驅(qū)動(dòng)發(fā)展到數(shù)據(jù)驅(qū)動(dòng)。數(shù)據(jù)已經(jīng)成為學(xué)術(shù)研究的基礎(chǔ),首先由于數(shù)字技術(shù)的出現(xiàn),讓研究對(duì)象完全以數(shù)據(jù)的形式呈現(xiàn)出來。隨著新的歷史條件的變化和社會(huì)科技的發(fā)展,新時(shí)代的文學(xué)文本以嶄新的途徑進(jìn)行傳播和流傳。電腦書寫時(shí)代使手稿變得彌足珍貴;電子郵件、社交軟件的盛行使信函成為永遠(yuǎn)的歷史;微博、微信的普及極大地加快了信息傳播速度,提高了傳播效果,拓寬了傳播范圍,降低了準(zhǔn)入門檻,提高了公眾參與度;網(wǎng)絡(luò)文學(xué)的“網(wǎng)絡(luò)”屬性和它的生產(chǎn)機(jī)制無疑增強(qiáng)了公眾對(duì)作者寫作的影響力。這些數(shù)字科技的產(chǎn)物天然是屬于“數(shù)字人文”的,并伴隨數(shù)字技術(shù)的發(fā)展不斷更新迭代?!皬膫鞑W(xué)媒介研究的視角來看,技術(shù)就是媒介?!盵數(shù)字技術(shù)的發(fā)展改變了文學(xué)創(chuàng)作者封閉寫作的習(xí)慣,延伸了人文研究者獲取資料的能力,擴(kuò)展了多方交流的途徑。當(dāng)代評(píng)論家陳福民在《破局者:金宇澄和他的〈繁花〉》中記錄,“金宇澄在談及《繁花》在弄堂網(wǎng)連載更新時(shí)說,‘起因是我想在網(wǎng)上,寫一些無名無姓者的市井事跡,于是起了網(wǎng)名,上去開帖。我經(jīng)歷了80 年代的手寫稿時(shí)代,小說寫在格子稿紙上,編輯閱讀手寫稿,得到讀者反饋,過程更緩慢,等得更久?,F(xiàn)在匿名寫到網(wǎng)上,就有了意見,帶來奇怪的促進(jìn)作用,與閉門面壁的感覺完全不同?!鳛橐粋€(gè)作家,他的這種出場(chǎng)姿態(tài)也十分值得玩味。他從一個(gè)事實(shí)上的老作家變身“文學(xué)新人”去愉快地匿名寫作,后來人們都知道,《繁花》的寫作過程完全是自由自在無功利的。”網(wǎng)絡(luò)文學(xué)的生產(chǎn)機(jī)制是在互聯(lián)網(wǎng)媒介中,依靠數(shù)字技術(shù)發(fā)展形成和不斷更新的。在這種生產(chǎn)機(jī)制中生產(chǎn)出的文學(xué)作品無疑具備網(wǎng)絡(luò)的特性,即開放、平等、互動(dòng)。那么,“從數(shù)字人文的角度介入網(wǎng)絡(luò)文學(xué)研究,并不僅僅是‘可能的選項(xiàng)’,而理應(yīng)成為某種不可或缺的、內(nèi)在化的思維范式?!比欢壳熬W(wǎng)絡(luò)文學(xué)發(fā)表平臺(tái)不勝枚舉,如榕樹下原創(chuàng)文學(xué)網(wǎng)、晉江文學(xué)城、起點(diǎn)中文網(wǎng)、小說閱讀網(wǎng)、瀟湘書院、紅袖添香、云起書院等,都各具特色、各有偏重,且都具備了一定的專題檢索功能。雖然,資本驅(qū)動(dòng)的商業(yè)文學(xué)網(wǎng)站從架構(gòu)和功能上與學(xué)術(shù)資源庫已具備一定的相似性,但正是由于它的商業(yè)本質(zhì),使“它終究只需要對(duì)投資者和用戶(作者、讀者)負(fù)責(zé),既無義務(wù)也無意向?yàn)閷W(xué)術(shù)研究提供服務(wù)”。這是人文學(xué)者對(duì)于學(xué)術(shù)自覺的擔(dān)憂,也是呼吁建立學(xué)術(shù)導(dǎo)向的網(wǎng)絡(luò)文學(xué)數(shù)據(jù)庫的緣由。但是,網(wǎng)絡(luò)文學(xué)從興起到發(fā)展壯大雖然只有二十幾年的時(shí)間,已經(jīng)形成了龐大的數(shù)據(jù)集群,現(xiàn)在進(jìn)行廣泛收集、整合談何容易。何況涉及的研究數(shù)據(jù)各有不同,包括網(wǎng)絡(luò)文學(xué)原文本、讀者評(píng)論、粉絲社群、積分規(guī)則和數(shù)量、點(diǎn)積量等信息。當(dāng)然,中國現(xiàn)代文學(xué)館作為現(xiàn)當(dāng)代文學(xué)資料中心的自覺性不容許網(wǎng)絡(luò)文學(xué)領(lǐng)域的缺失。如此看來,與文學(xué)網(wǎng)站、社交平臺(tái)的戰(zhàn)略合作才是目前切實(shí)可行的挽救網(wǎng)絡(luò)文學(xué)研究所需數(shù)據(jù)信息的有效途徑。
(三)智能技術(shù)助力文學(xué)領(lǐng)域人文研究的科技轉(zhuǎn)化。數(shù)字人文起源于人文計(jì)算,而人文計(jì)算通常是在大數(shù)據(jù)的基礎(chǔ)上完成。因此,數(shù)字人文的前提就是以數(shù)據(jù)作為討論問題的基礎(chǔ),在資料數(shù)據(jù)化、可視化方面做準(zhǔn)備,利用計(jì)算機(jī)的運(yùn)算速度優(yōu)勢(shì)完成搜索、統(tǒng)計(jì)、匯總、分析等功能。人工智能在數(shù)據(jù)存儲(chǔ)和推理方面已經(jīng)取得了巨大的突破,從而實(shí)現(xiàn)了自我學(xué)習(xí),自我更新的能力。因此,智能技術(shù)在知識(shí)生產(chǎn)方面發(fā)揮作用指日可待。只要有一定量級(jí)的數(shù)據(jù)積累,遵循一定的知識(shí)生產(chǎn)規(guī)則和研究范式,整合文化和意識(shí)形態(tài)資源完成設(shè)定的目標(biāo)問題就不難實(shí)現(xiàn)。然而,設(shè)定目的研究本身即是人文研究方向,“人文”服從目的律,“數(shù)字”服從因果律。因此,如若將人文與數(shù)字更為緊密的聯(lián)結(jié),有效的手段還是以數(shù)據(jù)作為學(xué)術(shù)研究的基本要素,以人文學(xué)者的研究目標(biāo)為導(dǎo)向設(shè)計(jì)開發(fā)恰當(dāng)?shù)臄?shù)字人文分析工具,解決不同的問題。文學(xué)館作為資料中心的職能之一就是提供基于數(shù)據(jù)的服務(wù),因此更應(yīng)關(guān)注到學(xué)者在學(xué)術(shù)研究時(shí)希望以何種多元的數(shù)字方法切入現(xiàn)代文學(xué)研究。上海師范大學(xué)學(xué)者王賀總結(jié)出七個(gè)方向的研究方法:一是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)從事包括現(xiàn)代文學(xué)版本、圖像史料的內(nèi)的諸多文獻(xiàn)史料研究。二是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)人事作家生平傳記研究。三是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)從事文學(xué)社團(tuán)、思潮、流派的譜系研究。四是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)從事文學(xué)思想史、觀念史的研究。五是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)從事文學(xué)文本的文體學(xué)(風(fēng)格學(xué))、修辭學(xué)、語言學(xué)研究和情感分析等。六是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)將研究數(shù)據(jù)可視化并展開分析。七是利用數(shù)據(jù)庫、互聯(lián)網(wǎng)從事以現(xiàn)代文學(xué)(史)為主體的跨學(xué)科、跨地域、跨族裔、跨語言的比較與綜合研究。數(shù)字技術(shù)已經(jīng)改變了文學(xué)研究的對(duì)象,“并非我們熟悉的數(shù)千年人類文明的載體——紙質(zhì)文獻(xiàn)、出版物,而是一種全新的信息生產(chǎn)、儲(chǔ)存和傳播形式——數(shù)字文獻(xiàn)?!蓖踬R預(yù)言,它勢(shì)必“持續(xù)地影響我們的閱讀、思考、寫作及日常生活。”
利用數(shù)字人文方法進(jìn)行現(xiàn)當(dāng)代文學(xué)研究,在數(shù)據(jù)準(zhǔn)備方面切實(shí)有效的工作路徑可以從數(shù)據(jù)可視化和文本深度挖掘開始。對(duì)于可視化的素材,仰仗老一輩學(xué)者的積累和專業(yè)機(jī)構(gòu)持之以恒的收集和數(shù)字化轉(zhuǎn)換工作的成果積蓄,已經(jīng)構(gòu)建出結(jié)構(gòu)化程度較高的數(shù)據(jù)基礎(chǔ)。而文本深度挖掘則是對(duì)數(shù)據(jù)資源內(nèi)容進(jìn)行精細(xì)化揭示,實(shí)現(xiàn)資源的知識(shí)化、專題化服務(wù)。圖書館界已經(jīng)開始探索實(shí)施,對(duì)資源進(jìn)行內(nèi)容細(xì)粒度標(biāo)引,對(duì)文本類資源實(shí)現(xiàn)篇章級(jí)、段落級(jí)的標(biāo)引,實(shí)現(xiàn)主題詞、關(guān)鍵詞級(jí)的標(biāo)引建設(shè),對(duì)音視頻類資源做關(guān)鍵詞、主題詞控制的內(nèi)容標(biāo)引。這是一種以人工智能為基礎(chǔ),全面面向未來的知識(shí)圖譜布局,實(shí)現(xiàn)了傳統(tǒng)文化數(shù)字化、文化服務(wù)形式信息化和文化資源共享,也必然會(huì)為數(shù)字人文研究提供更為全面的數(shù)據(jù)支持。
數(shù)字基礎(chǔ)建置對(duì)于館藏機(jī)構(gòu)參與數(shù)字人文建設(shè)而言十分重要,這需要進(jìn)行大量的工作并投入大量的資源。而像一些學(xué)者呼吁的,希望建設(shè)一個(gè)互聯(lián)互通的數(shù)字基礎(chǔ)設(shè)施,而不是建立每一個(gè)機(jī)構(gòu)獨(dú)立的基礎(chǔ)設(shè)施,更需要巨額的投入和費(fèi)用。建設(shè)一個(gè)整合的、互聯(lián)互通的基礎(chǔ)設(shè)施需要資金和人才的雙重投入,單純依靠公立館藏機(jī)構(gòu)是難以為繼的,公立機(jī)構(gòu)的適度商業(yè)化運(yùn)營能否成為解決問題的途徑也并不明朗??赡苡龅降膯栴},一是公立機(jī)構(gòu)對(duì)館藏資源分享的意愿不足;二是一旦資方覺得數(shù)字化的館藏資源并未達(dá)到預(yù)料中的成效,繼續(xù)投入基礎(chǔ)設(shè)施建設(shè)的意愿就會(huì)有所遲疑,導(dǎo)致項(xiàng)目半途而廢。
(一)數(shù)字技術(shù)驅(qū)動(dòng)人文研究
隨著人工智能技術(shù)的發(fā)展,數(shù)字人文方法也在不斷地升級(jí)調(diào)整,數(shù)字人文已經(jīng)從“博聞強(qiáng)記”的存儲(chǔ)、搜索時(shí)代發(fā)展到利用數(shù)字技術(shù)對(duì)數(shù)據(jù)資源進(jìn)行分析處理的時(shí)代。接下來的數(shù)字人文研究方式將是對(duì)數(shù)據(jù)的闡述,這使人文研究外延擴(kuò)大到跨領(lǐng)域的合作研究。從紙本閱讀到檢索平臺(tái),從檢索平臺(tái)到分析工具,從分析工具到人工智能,人文學(xué)科的學(xué)術(shù)研究正在向數(shù)字化智能化的方向轉(zhuǎn)變。當(dāng)視覺識(shí)別技術(shù)廣泛應(yīng)用后,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人工智能程序的識(shí)別準(zhǔn)確率已經(jīng)超過了人類的平均水平。目前,對(duì)史料照片進(jìn)行分類、檢索、比較、鑒別的功能已經(jīng)是照片管理系統(tǒng)的基本功能,見圖識(shí)人更是在大量人像標(biāo)引數(shù)據(jù)的基礎(chǔ)上利用智能識(shí)別技術(shù)的現(xiàn)實(shí)應(yīng)用。計(jì)算機(jī)識(shí)別技術(shù)的不斷自我深度學(xué)習(xí),能否在漢字手寫體識(shí)別、字跡甄別方面有進(jìn)一步突破,從應(yīng)用層面上讓電腦代替人工進(jìn)行學(xué)術(shù)資料生產(chǎn),勢(shì)必極大地提高工作效率。而搜索引擎根據(jù)提出的知識(shí)性問題給出對(duì)應(yīng)的回答也是在人工智能技術(shù)助力下轉(zhuǎn)變?yōu)橹R(shí)引擎和個(gè)人助理的成果,減少了學(xué)者搜集資料的工作量,也能夠擴(kuò)大研究范圍。時(shí)下最熱門的深度學(xué)習(xí),是對(duì)數(shù)據(jù)的訓(xùn)練,是建立在大數(shù)據(jù)基礎(chǔ)上的。它是對(duì)特定問題建模,不斷地嘗試、修正,直至最終逼近目標(biāo)的學(xué)習(xí)方法。遵循這樣的學(xué)習(xí)方法可以解決研究領(lǐng)域內(nèi)相似的問題。那么,我們就可以將其應(yīng)用到智能翻譯、智能識(shí)別、知識(shí)推薦等領(lǐng)域中在知識(shí)生產(chǎn)中發(fā)揮其價(jià)值。
《數(shù)字人文:媒介驅(qū)動(dòng)的學(xué)術(shù)生產(chǎn)方式變革》一文中指出,人文學(xué)科與數(shù)字科技相融合使各學(xué)科間的交叉研究有了更多的可能性,“正是由于數(shù)字媒介的中介作用,人文學(xué)科領(lǐng)域日益走向問題為導(dǎo)向的學(xué)術(shù)生產(chǎn)格局,打破了固化的思維習(xí)慣,轉(zhuǎn)而根據(jù)問題的特性采用多維的研究方法,不同局限于定量和定性的分野,試圖充分發(fā)揮數(shù)字技術(shù)在量化和質(zhì)化研究中的長處,在跨學(xué)科的視野中探索問題的解決方案。”這種改變學(xué)術(shù)研究方式的變革是數(shù)字技術(shù)帶來的,也將隨著數(shù)字技術(shù)的不斷更新、發(fā)展改變?nèi)藗兊乃季S模式和學(xué)術(shù)發(fā)展方向。
(二)數(shù)字化的文學(xué)知識(shí)生產(chǎn)需要人文研究方法
數(shù)字人文研究是一種跨學(xué)科的研究方法,從最初的數(shù)字科技參與人文資源的數(shù)字化生產(chǎn),到人文學(xué)者開始習(xí)慣利用數(shù)字化資源,直至當(dāng)前采用數(shù)字技術(shù)進(jìn)行研究和實(shí)踐的數(shù)字人文發(fā)展路徑。早有學(xué)者看到,數(shù)字人文研究正在“逐漸從數(shù)字技術(shù)為主的研究導(dǎo)向轉(zhuǎn)向以人文性為主、技術(shù)為輔的研究導(dǎo)向,讓以數(shù)字技術(shù)解決人文課題變得有溫度”。尤其在文學(xué)研究領(lǐng)域,如德國浪漫派作家、最早的純粹意義上的文學(xué)學(xué)者之一弗·施萊格爾所言,文學(xué)不是“粗糙的書本堆積”,而是對(duì)某種“精神”的抒發(fā),對(duì)某種共同生活狀態(tài)的表達(dá)。那么隨著數(shù)字技術(shù)的發(fā)展和研究環(huán)境的變化,人文研究主動(dòng)參與到數(shù)字化的文學(xué)知識(shí)生產(chǎn)過程將勢(shì)在必行。
在這里有必要強(qiáng)調(diào)的一點(diǎn)是,數(shù)字技術(shù)生產(chǎn)出的文學(xué)知識(shí)具有文獻(xiàn)、資料的屬性,而非屬于直覺、審美的文學(xué)作品。電腦的本質(zhì)是處理事實(shí)和規(guī)則的,它可以根據(jù)以往的數(shù)據(jù)預(yù)測(cè)結(jié)果,但無法像人腦那樣隨心所欲地暢想,憑借難以置信的直覺預(yù)測(cè)莫名其妙的可能性。固然“深藍(lán)”(Deep Blue)可以戰(zhàn)勝加里·卡斯帕羅夫(Garry Kasparov),“阿爾法狗”(AlphaGO)可以戰(zhàn)勝李世石,但是人工智能卻不會(huì)下出安慰棋,即在膠著的對(duì)戰(zhàn)之后輸?shù)羝寰郑逸數(shù)貌伙@山不露水、讓對(duì)手心滿意足的這種人類行為。在文學(xué)領(lǐng)域,人工智能也曾做出嘗試,2016年谷歌工程師讓人工智能學(xué)習(xí)了2865篇愛情小說,然后又教人工智能一些英語詩歌創(chuàng)作的基本格式,于是人工智能算法就真的寫出了一首又一首情感小詩。雖然這些英文詩讀起來真有一些多愁善感的意味,但并不具有文本意義,人工智能始終無法寫出“鄉(xiāng)愁是一枚小小的郵票,我在這頭,母親在那頭”這種奈人尋味的詩句的。
因此,短時(shí)間內(nèi)無需存在人類智能被人工智能取代的隱憂,值得被文學(xué)研究者關(guān)注的是如何駕馭海量的數(shù)字資源?怎樣以數(shù)字的思維來完成文學(xué)領(lǐng)域的學(xué)術(shù)研究。如四川師范大學(xué)文學(xué)院教授譚光輝所言,“記憶已不是最重要的,知識(shí)積累并非知識(shí)生產(chǎn)的決定性因素,而目的、意識(shí)形態(tài)、文化、政治、能力、思維方式、信息儲(chǔ)存和傳播技術(shù)等因素對(duì)知識(shí)生產(chǎn)的影響更大?!睌?shù)字技術(shù)發(fā)展的依托必然是人文學(xué)科已經(jīng)取得的研究成果。而人文學(xué)科通過對(duì)情感的反思和研究,必將為數(shù)字技術(shù)的實(shí)現(xiàn)做出重要的貢獻(xiàn)。雖然在現(xiàn)當(dāng)代文學(xué)研究領(lǐng)域數(shù)字人文之火還僅呈現(xiàn)星星之態(tài),但已經(jīng)有很多目光敏銳的學(xué)者預(yù)測(cè)到它的燎原之勢(shì),在不同場(chǎng)合和媒介參與討論和撰寫文章,表達(dá)出對(duì)文學(xué)與數(shù)字聯(lián)結(jié)的興趣,并在此方面做出了嘗試。中國社會(huì)科學(xué)院文學(xué)研究所助理研究員趙薇就以問題意識(shí)為指引,將數(shù)字人文方法落實(shí)到現(xiàn)當(dāng)代文學(xué)的研究,從李劼人的《大波》中人物網(wǎng)絡(luò)的結(jié)構(gòu)分析,就“李劼人接受之謎”做出了數(shù)據(jù)上的實(shí)證和解答。
當(dāng)數(shù)字人文深刻地改變文學(xué)研究者的知識(shí)結(jié)構(gòu)和研究路徑后,勢(shì)必會(huì)提出傳統(tǒng)文學(xué)研究無法提出的問題與研究結(jié)論,這才是數(shù)字人文開花結(jié)果之時(shí),即實(shí)現(xiàn)新知識(shí)生產(chǎn)機(jī)制。如山東大學(xué)歷史文化學(xué)院歷史學(xué)系副研究員邱偉云團(tuán)隊(duì)的工作流程:“先由文學(xué)學(xué)者提出傳統(tǒng)人文研究的議題,再由統(tǒng)計(jì)學(xué)者轉(zhuǎn)譯成可以量化的理論建模,接著由計(jì)算機(jī)學(xué)者進(jìn)行編程和計(jì)算,最后再由人文學(xué)者進(jìn)行應(yīng)用詮釋?!比绱?,館藏機(jī)構(gòu)需要在進(jìn)行基礎(chǔ)設(shè)施建設(shè)時(shí),思考、整合文學(xué)研究者可能提出的人文問題,在館藏?cái)?shù)據(jù)的準(zhǔn)確度、精細(xì)度標(biāo)引上多下功夫。學(xué)者們普遍認(rèn)同,針對(duì)大多數(shù)文學(xué)研究,還是需要個(gè)性化設(shè)計(jì),才能對(duì)問題有細(xì)致精微的把握。那么,理想的工作狀態(tài)就應(yīng)該是各盡所能,即館藏機(jī)構(gòu)做好完備、可靠的數(shù)據(jù)準(zhǔn)備工作,而文學(xué)研究者要主動(dòng)進(jìn)行基于項(xiàng)目的學(xué)術(shù)研究,利用館藏機(jī)構(gòu)提供的文學(xué)史料數(shù)據(jù)構(gòu)想人文研究課題、組織利用資源、建立數(shù)字模型、進(jìn)行數(shù)字分析,以完成一種文學(xué)學(xué)術(shù)研究項(xiàng)目驅(qū)動(dòng),館藏機(jī)構(gòu)提供數(shù)據(jù)基礎(chǔ),科技團(tuán)隊(duì)進(jìn)行算法支持的數(shù)字人文研究模式。
總之,數(shù)字人文是人文學(xué)科學(xué)術(shù)研究的未來,人文學(xué)者將漸漸習(xí)慣于用數(shù)據(jù)思維進(jìn)行人文研究。計(jì)算機(jī)以其善長的儲(chǔ)存和速算優(yōu)勢(shì)去做那些規(guī)律性、事實(shí)性的工作,如字句???、索引編纂、資料匯編等。學(xué)者們則要具備大數(shù)據(jù)集群搜索的能力,在浩如煙海的不同知識(shí)和學(xué)科庫中,尋找彼此之間的關(guān)系,建立知識(shí)與人生存處境之間的關(guān)聯(lián),讓知識(shí)活起來,讓學(xué)術(shù)互相融合,“將知識(shí)如何使人生活得更美好作為叩問知識(shí)問題的終極關(guān)懷”。如中國人民大學(xué)歷史學(xué)院副教授胡恒所言,“數(shù)字人文不僅僅是數(shù)據(jù)庫檢索,而是包含了計(jì)量、可視化、社會(huì)網(wǎng)絡(luò)分析等層次很豐富的研究方法。”“從事數(shù)字人文研究,數(shù)字化是手段,最終還是要回歸到傳統(tǒng)的人文問題。”