錢國富
數(shù)字人文正在迅速發(fā)展,成為人文社科領(lǐng)域重要的研究范式。但數(shù)字人文本身還是一個(gè)相對(duì)復(fù)雜的話題,對(duì)很多非專業(yè)研究人員、圖書館從業(yè)人員而言,要對(duì)其學(xué)科定義有比較清晰的認(rèn)識(shí),仍是一件比較困難的事情。人們往往容易混淆數(shù)字人文、人文計(jì)算之間的關(guān)系,并且不清楚學(xué)科邊界所在。對(duì)這樣重要的學(xué)科范式演變,實(shí)際上需要更多人來準(zhǔn)確認(rèn)識(shí),以及從容應(yīng)對(duì)。
2016年英國Routledge學(xué)術(shù)出版社出版《走向數(shù)字人文:實(shí)踐、訓(xùn)練與研究》(Doing Digital Humanities:Practice,Training,Research,ISBN:9781138899445,以下簡稱《走向數(shù)字人文》),該書由加拿大不列顛哥倫比亞大學(xué)奧卡納根分校(University of British Columbia Okanagan Campus,Canada)數(shù)字人文助理教授Constance Crompton、加拿大溫哥華島大學(xué)(Vancouver Island University,Canada)數(shù)字人文實(shí)驗(yàn)中心教授Richard J.Lane、加拿大維多利亞大學(xué)(University of Victoria,Canada)英語與人文計(jì)算中心特聘教授Ray Siemens編撰。Ray Siemens亦是布萊克維爾出版社(Blackwell Publishing)2004年出版的A Companion to Digital Humanities(ISBN:9781405168069)、2007年出版的the Companion to Digital Literary Studies(ISBN:9781118492277)和2016年出版的A New Companion to Digital Humanities(ISBN:9781118680643)3種關(guān)于數(shù)字人文概念和實(shí)踐圖書的編撰者?!蹲呦驍?shù)字人文》對(duì)數(shù)字人文概念、項(xiàng)目案例、數(shù)字人文相關(guān)資源等做了介紹分析,可謂數(shù)字人文學(xué)科的“使用指南”。美國德克薩斯A&M大學(xué)(Texas A&M University)英語系副教授Amy Earhart認(rèn)為,《走向數(shù)字人文》提供了一個(gè)新視角,對(duì)數(shù)字人文實(shí)踐中的熱點(diǎn)問題,包括最小計(jì)算、全球主義、包容性和教育學(xué)等進(jìn)行了審視,書中論文能夠幫助讀者對(duì)快速變化的數(shù)字人文進(jìn)行批判性思考[1]。
圖1 《走向數(shù)字人文》書影
作為論文集,《走向數(shù)字人文》由23篇相對(duì)獨(dú)立的文章組成,作者達(dá)41位。根據(jù)書中提供的作者簡介,筆者對(duì)作者的學(xué)科背景進(jìn)行分類統(tǒng)計(jì),形成作者學(xué)科領(lǐng)域圖,見圖2。從圖2看出,作者的學(xué)科領(lǐng)域幾乎涵蓋人文社科領(lǐng)域各個(gè)學(xué)科,并與計(jì)算機(jī)科學(xué)、信息科學(xué)密切相關(guān),學(xué)科交叉和融合明顯。學(xué)科背景的復(fù)雜性和多樣性使數(shù)字人文概念的明確變得困難。從作者簡介還看出,歐美各高校已開始設(shè)立基于學(xué)科協(xié)同的數(shù)字人文研究中心或提供專門的數(shù)字人文教授職位,如英國的蘭卡斯特大學(xué)(Lancaster University)、切斯特大學(xué)(University of Chester)、謝菲爾德大學(xué)(University of Sheffield),以及美國的堪薩斯大學(xué)(University of Kansas),加拿大的麥吉爾大學(xué)(McGill University)[2]。
圖2 《走向數(shù)字人文》作者學(xué)科領(lǐng)域分布圖
全書共分4個(gè)部分23個(gè)章節(jié)。第1部分:基礎(chǔ)(Foundations);第2部分:核心概念和技能(Core concepts and skills);第3部分:創(chuàng)造、修復(fù)和內(nèi)容管理(Creation,remediation and curation);第4部分:管理、傳播與教育(Administration,dissemination and teaching)。每個(gè)章節(jié)除有詳細(xì)的備注和參考文獻(xiàn)外,還提供進(jìn)一步閱讀和實(shí)踐的參考鏈接、文獻(xiàn)信息,以方便對(duì)該章節(jié)內(nèi)容有興趣的讀者繼續(xù)深入學(xué)習(xí);全書還提供完整的圖表清單、作者介紹、名稱索引,可謂了解數(shù)字人文概念、教育和實(shí)踐的簡明“百科”。
第1章對(duì)計(jì)算機(jī)輔助文本分析的歷史進(jìn)行回顧,通過對(duì)1887年T.C.Mendenhall在《科學(xué)》(Science)雜志發(fā)表的The Characteristic Curves of Composition(被視為最早的定量分析和文本可視化論文之一)中文本分析技術(shù)的重現(xiàn)(replication)來反思計(jì)算機(jī)輔助文本分析的歷史。通過重現(xiàn)和分析,作者認(rèn)為這種研究方法可以幫助研究人員更好地開展數(shù)字人文研究,開展數(shù)字人文研究應(yīng)當(dāng)和開展所有人文研究一樣,注重前人經(jīng)驗(yàn)和歷史視角,通過計(jì)算來思考并超越計(jì)算。
為了應(yīng)對(duì)數(shù)字人文社區(qū)日益增長的復(fù)雜性,2013年國際數(shù)字人文組織聯(lián)合會(huì)(Alliance of Digital Humanities Organizations,ADHO)成立了名為“數(shù)字人文全球展望”(Global Outlook:Digital Humanities,GO:DH)的特別工作組,宗旨是消除數(shù)字人文社區(qū)研究人員、學(xué)生在溝通、合作上面臨的障礙。第2章對(duì)GO:DH組織的起源和宗旨進(jìn)行了說明,并對(duì)特別工作組正在開展的兩個(gè)項(xiàng)目——多語言社區(qū)翻譯(Community Translation:Multilingualism in DH)和最小計(jì)算(Minimal Computing)進(jìn)行了介紹。多語言社區(qū)翻譯項(xiàng)目開展了一系列調(diào)研以及研制了一些工具包,最小計(jì)算項(xiàng)目則從“我們需要什么”出發(fā),對(duì)樹莓派(Raspberry Pi)等小型軟硬件在數(shù)字人文中的應(yīng)用進(jìn)行了探索。數(shù)字人文社區(qū)中進(jìn)行女權(quán)主義研究的科研人員存在白人占多數(shù)的現(xiàn)象。因此,作者從創(chuàng)新環(huán)境、起源、信息技術(shù)、數(shù)字概念等角度進(jìn)行了分析,認(rèn)為只有進(jìn)一步普及數(shù)字人文概念和實(shí)踐,才能解決這一問題。
《在線協(xié)作知識(shí)創(chuàng)造的最佳實(shí)踐》(Best Practices in Online Knowledge Production)從共享合作、數(shù)據(jù)格式和元數(shù)據(jù)標(biāo)準(zhǔn)、工具和工作流程、合作共識(shí)、信用機(jī)制等角度論述了如何更好地開展在線知識(shí)創(chuàng)造生態(tài)系統(tǒng)。
為了幫助科研人員、圖書館員、存檔管理員、學(xué)生更好地理解圖書資料數(shù)字化的標(biāo)準(zhǔn)和技術(shù),維多利亞大學(xué)(University of Victoria)數(shù)字人文夏令營(Digital Humanities Summer Institute,DHSI)開設(shè)了一門為期5天的課程:“Understanding the Pre-Digital Book”,第5章對(duì)課程的設(shè)計(jì)、內(nèi)容進(jìn)行了詳細(xì)介紹,課程在維多利亞大學(xué)取得了良好的效果。
維多利亞大學(xué)數(shù)字人文夏令營開設(shè)了一系列課程,以幫助沒有編程經(jīng)驗(yàn)的研究者學(xué)習(xí)編程。第6章介紹了課程的指導(dǎo)思想和核心內(nèi)容,如Python、文本剪輯器、命令行的使用,但課程內(nèi)容沒有涉及目前在數(shù)字人文研究領(lǐng)域熱門的R語言相關(guān)知識(shí)。在討論數(shù)字人文時(shí)無法回避文本編碼問題,第7章對(duì)文本編碼相關(guān)的XML和文本編碼標(biāo)準(zhǔn)(Text Encoding Initiative,TEI)基礎(chǔ)知識(shí)、使用以及工具進(jìn)行了介紹,并指出對(duì)TEI進(jìn)行個(gè)性化定制是確保其使用效果的關(guān)鍵要素。文本計(jì)量和文本分析作為研究方法,在科研中應(yīng)用歷史悠久。第8章結(jié)合實(shí)例對(duì)文本計(jì)量和文本分析在文學(xué)研究中的應(yīng)用進(jìn)行了分析,認(rèn)為對(duì)不同顆粒度文獻(xiàn)信息單元的計(jì)量分析,可以簡化和創(chuàng)新文學(xué)研究,并得到不同層次的研究成果。
數(shù)據(jù)庫、項(xiàng)目管理、地理信息系統(tǒng)都和數(shù)字人文研究密不可分。第9章到第11章對(duì)這3個(gè)主題,結(jié)合實(shí)際案例進(jìn)行了簡要介紹。在數(shù)字人文項(xiàng)目管理上,提出了三階段項(xiàng)目模型:目標(biāo)、處理和分享。第12章主要圍繞電子文獻(xiàn)(Electronic Literature,E-LIT)“是什么”和“在哪里”的問題,對(duì)電子文獻(xiàn)的概念、特點(diǎn)、流派、組織、使用進(jìn)行了分析,并提出了電子文獻(xiàn)的核心特點(diǎn)是“數(shù)字原生”。
數(shù)字人文研究資料,包括數(shù)字資源和非原生數(shù)字資源的處理和利用是數(shù)字人文研究的核心問題。這一部分結(jié)合案例,對(duì)數(shù)字資料編輯的方法步驟、如何利用可擴(kuò)展樣式表轉(zhuǎn)換語言XSLT對(duì)XML文檔進(jìn)行轉(zhuǎn)化、語義網(wǎng)核心概念、關(guān)聯(lián)數(shù)據(jù)的使用和發(fā)布、Drupal以及其他內(nèi)容管理系統(tǒng)、增強(qiáng)現(xiàn)實(shí)(Augmented Reality,AR)、3D打印等關(guān)鍵技術(shù)進(jìn)行了分析介紹。
第19章對(duì)一個(gè)基于數(shù)字人文理念的教學(xué)卡片游戲—Root of Play的設(shè)計(jì)理念、實(shí)踐進(jìn)行了介紹,并對(duì)寓教于樂、寓教于游戲這一教學(xué)方式進(jìn)行了探討,認(rèn)為數(shù)字人文為參與體驗(yàn)式學(xué)習(xí)提供了一個(gè)獨(dú)特的思路,有助于營造“做中學(xué)、學(xué)中做”的交互式學(xué)習(xí)環(huán)境。
數(shù)字人文加強(qiáng)了人文社科研究人員、圖書館員等相關(guān)人員之間的合作交流。如何才能在數(shù)字人文社區(qū)里更好地推廣研究工具并提供相應(yīng)的技能培訓(xùn),科學(xué)地進(jìn)行項(xiàng)目管理,數(shù)字人文夏令營項(xiàng)目對(duì)此問題進(jìn)行了跟蹤調(diào)查。調(diào)查結(jié)果顯示,對(duì)相關(guān)人員進(jìn)行項(xiàng)目管理培訓(xùn),提升項(xiàng)目管理能力是最重要的。第20章對(duì)項(xiàng)目管理的理論、過程、方法、工具、反饋等進(jìn)行了系統(tǒng)分析并提供了相應(yīng)的參考資料,結(jié)合數(shù)字人文夏令營的課程設(shè)計(jì)和課堂教學(xué),對(duì)數(shù)字人文人才培養(yǎng)、學(xué)術(shù)傳播、交流等問題進(jìn)行了探討。
如前所述,此書作為一本數(shù)字人文實(shí)踐的簡明“百科”,對(duì)數(shù)字人文的諸多方面進(jìn)行了介紹和論述。實(shí)際上最具理論價(jià)值的是序言,序言是作者Ray Siemens在2014年“國際數(shù)字人文論壇”上的報(bào)告,對(duì)數(shù)字人文的概念、方法論以及標(biāo)準(zhǔn)和實(shí)踐進(jìn)行了系統(tǒng)性的回顧和總結(jié)。
Ray Siemens指出,學(xué)界公認(rèn)的觀點(diǎn)是數(shù)字人文起源于人文計(jì)算,從最早的語言學(xué)研究逐漸向文學(xué)、歷史學(xué),甚至文化藝術(shù)領(lǐng)域普及,隨著2004年《數(shù)字人文指南》(A Companion to Digital Humanities)出版,數(shù)字人文成為這一新興跨學(xué)科研究范式和領(lǐng)域的代名詞[3]。研究者都認(rèn)為數(shù)字人文的定義處在不斷發(fā)展變化和再定義的過程之中,但數(shù)字人文作為一種新的研究范式和視角,有兩個(gè)可以確認(rèn)的顯著特征:人文和計(jì)算、跨界和融合。這也是北京大學(xué)首屆“數(shù)字人文論壇”會(huì)議的主題之一[4]。Ray Siemens在2004年和2007年參與編撰的兩本數(shù)字人文主題圖書中,都試圖對(duì)數(shù)字人文的概念做一個(gè)明確的界定,但并未成功。因此,他認(rèn)為應(yīng)該超越傳統(tǒng)思維方式,跳出關(guān)于概念問題的爭論,更多地關(guān)注數(shù)字人文的學(xué)術(shù)共同體做什么、怎么做、和誰合作、在什么機(jī)構(gòu)做等具體問題。這一指導(dǎo)思想促使作者編撰了這本簡明“百科”,跳出概念的視角來審視數(shù)字人文學(xué)術(shù)共同體的建立、方法論和實(shí)踐。在北京大學(xué)首屆“數(shù)字人文論壇”上,王曉光、徐力恒也一致認(rèn)為“數(shù)字人文”是一個(gè)不斷發(fā)展的概念,難以清晰界定[5]。作為一個(gè)不斷變化、不停被影響和發(fā)展的學(xué)科范式,僅僅要明確定義數(shù)字人文中“人文”一詞都是極其困難的,因?yàn)檫@一研究范式的邊界似乎沒有到達(dá)終點(diǎn)。
數(shù)字人文作為新的研究范式,共同的方法論基礎(chǔ)是連接社區(qū)和研究者的另一個(gè)紐帶。數(shù)字人文的方法論核心是確認(rèn)研究材料的數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)建模的工具和方法。云計(jì)算、大數(shù)據(jù)和語義網(wǎng)的普及給數(shù)字人文帶來了新的機(jī)遇。數(shù)據(jù)量、數(shù)據(jù)格式、信息基礎(chǔ)架構(gòu)和數(shù)據(jù)分析利用,甚至相關(guān)的工具標(biāo)準(zhǔn)都在隨著信息技術(shù)大環(huán)境的變化而改變。對(duì)數(shù)字人文研究者而言,不僅需要關(guān)注研究社區(qū)的發(fā)展,還需要了解社區(qū)之外的變化。劉煒認(rèn)為數(shù)據(jù)和方法是數(shù)字人文的兩大支柱,并將數(shù)字人文的關(guān)鍵技術(shù)歸納為文本編碼標(biāo)準(zhǔn)(TEI)、電子編輯與出版、數(shù)字文學(xué)、文本分析與挖掘、多媒體搜索中的沉浸與虛擬環(huán)境、3D圖像技術(shù)與激光掃描技術(shù)、數(shù)字圖形設(shè)計(jì)、信息美學(xué)、計(jì)算機(jī)游戲與人文、人文領(lǐng)域的超級(jí)計(jì)算、GIS高級(jí)應(yīng)用、語義技術(shù)[6]。
國際數(shù)字人文組織聯(lián)合會(huì)(ADHO)是一個(gè)旨在促進(jìn)和支持?jǐn)?shù)字人文研究,提供出版、協(xié)作和培訓(xùn)社區(qū)支持的機(jī)構(gòu)。Ray Siemens以發(fā)起于1987年的文本編碼協(xié)會(huì)(The Text Encoding Initiative,TEI)為案例來分析和探討ADHO的使命。從1994年開始,文本編碼標(biāo)準(zhǔn)指南(the TEI Guidelines)被圖書館、博物館、出版商和個(gè)人廣泛利用,基于該標(biāo)準(zhǔn)利用編碼結(jié)構(gòu)呈現(xiàn)文章和語言學(xué)文件,以供在線研究和教學(xué)使用。2001年1月成立TEI協(xié)會(huì),并在2002年6月發(fā)布新版電子文件編碼指南,簡稱TEI P4。這一指南完全兼容XML標(biāo)準(zhǔn),可以在互聯(lián)網(wǎng)環(huán)境下得到更加有效的利用。TEI協(xié)會(huì)作為非營利機(jī)構(gòu),其宗旨是維護(hù)并發(fā)展TEI相關(guān)標(biāo)準(zhǔn)和系統(tǒng)。TEI協(xié)會(huì)的建設(shè)經(jīng)驗(yàn)給數(shù)字人文社區(qū)建設(shè)提供了最佳案例,給數(shù)字人文研究社區(qū)提供了構(gòu)建基于實(shí)踐共識(shí),數(shù)字人文做什么、怎么做和為什么要這么做,而不是概念共識(shí)的社區(qū)框架,并且提供了數(shù)字人文社區(qū)在平臺(tái)、標(biāo)準(zhǔn)和基礎(chǔ)架構(gòu)上進(jìn)行協(xié)作的參考案例。
數(shù)字人文和新技術(shù)的應(yīng)用密不可分。以語義網(wǎng)和關(guān)聯(lián)技術(shù)為例,對(duì)數(shù)字人文而言,研究者可以通過將主次層級(jí)不同的數(shù)據(jù)源關(guān)聯(lián)起來,利用受信任的詞匯表和著者控制,在一個(gè)更大的學(xué)科視野下開展研究工作。關(guān)聯(lián)數(shù)據(jù)是不斷進(jìn)行場景交互和探索性交流的學(xué)術(shù)數(shù)據(jù)。ADHO要開展專題培訓(xùn),以協(xié)助研究者理解、利用和發(fā)布關(guān)聯(lián)數(shù)據(jù),從而幫助他們更好地開展數(shù)字人文研究實(shí)踐與創(chuàng)新。
人才培養(yǎng)是ADHO的另一個(gè)重要使命。ADHO成員通過組織內(nèi)部正式和非正式的信息交流,地區(qū)、國家和國際間的數(shù)字人文研究技能培訓(xùn)工作坊以及部分機(jī)構(gòu)已開展的數(shù)字人文博士、碩士培養(yǎng),形成了相對(duì)完備的教育培訓(xùn)體系。
作為簡明的數(shù)字人文“百科”,《走向數(shù)字人文》的體例結(jié)構(gòu)和內(nèi)容可以給讀者提供關(guān)于數(shù)字人文的全景式了解。該書內(nèi)容大多是案例分析、實(shí)踐總結(jié),理論性不強(qiáng),且很多內(nèi)容屬于基礎(chǔ)知識(shí)和介紹性內(nèi)容,目標(biāo)讀者是對(duì)數(shù)字人文缺乏系統(tǒng)了解的初學(xué)者,并非該領(lǐng)域的學(xué)科專家。
對(duì)圖書館而言,該書給圖書館開展面向數(shù)字人文的服務(wù)提供了思路,如積極參與構(gòu)建數(shù)字人文研究支撐環(huán)境、提供數(shù)字人文研究工具、通過夏令營等方式參與數(shù)字人文人才培養(yǎng),優(yōu)化培訓(xùn)項(xiàng)目,根據(jù)數(shù)字人文研究人員需求定制針對(duì)性的數(shù)字技術(shù)培訓(xùn)等。