崔倩倩
(南通大學(xué)圖書館,江蘇 南通 226019)
數(shù)字人文研究屬于跨學(xué)科領(lǐng)域,其核心是采用計(jì)算機(jī)技術(shù)、信息技術(shù)、知識(shí)組織技術(shù)來解決迄今常以偶然方式處理的人文學(xué)科問題。作為一個(gè)舶來概念,2009年武漢大學(xué)教授王曉光[1]在教育部人文社會(huì)科學(xué)研究方法創(chuàng)新論壇上發(fā)表了《“數(shù)字人文”的產(chǎn)生、發(fā)展與前沿》一文之后,“數(shù)字人文”才真正開始受到國(guó)內(nèi)學(xué)者的關(guān)注。2011年,武漢大學(xué)成立了國(guó)內(nèi)第一家數(shù)字人文研究中心,隨后臺(tái)灣大學(xué)、香港公開大學(xué)、南京大學(xué)等高校也相繼成立了數(shù)字人文研究機(jī)構(gòu),開始有組織有計(jì)劃地進(jìn)行數(shù)字人文研究。在“數(shù)字人文”這個(gè)概念被翻譯到中國(guó)之前,國(guó)內(nèi)已經(jīng)存在數(shù)字人文實(shí)踐,但相關(guān)的研究大多處于一種自為狀態(tài),缺乏相應(yīng)的數(shù)字人文理論的有效支撐。本文采用文獻(xiàn)計(jì)量和科學(xué)知識(shí)圖譜方法,通過對(duì)CNKI和Web of Science核心數(shù)據(jù)集中收錄的主題為數(shù)字人文的相關(guān)文獻(xiàn)進(jìn)行多層次剖析,以期為數(shù)字人文的深入研究提供參考。
科學(xué)知識(shí)圖譜能夠?qū)茖W(xué)知識(shí)的發(fā)展進(jìn)程與結(jié)果關(guān)系進(jìn)行可視化分析,本文采用美國(guó)德雷賽爾大學(xué)陳超美博士開發(fā)的科學(xué)計(jì)量與知識(shí)可視化軟件CiteSpace[2]來進(jìn)行知識(shí)圖譜的繪制,直觀地展現(xiàn)國(guó)內(nèi)外數(shù)字人文研究的信息全景,并通過對(duì)數(shù)字人文相關(guān)文獻(xiàn)進(jìn)行研究機(jī)構(gòu)、作者合作關(guān)系分析、關(guān)鍵詞聚類、中心性分析等,探究和挖掘數(shù)字人文研究的熱點(diǎn)及其動(dòng)態(tài)變化過程。
在保證查全率的條件下,采用相同的檢索策略分別在CNKI和Web of Science核心數(shù)據(jù)集中獲取代表國(guó)內(nèi)和國(guó)外有關(guān)數(shù)字人文研究的數(shù)據(jù)集合。在CNKI中,“檢索主題”等于“數(shù)字人文”或“人文計(jì)算”,精確檢索,檢索范圍為2019年12月31日之前數(shù)據(jù)庫(kù)收錄的所有文獻(xiàn),檢索到包括博碩士論文、期刊、專利等中文文獻(xiàn)共計(jì)725條,經(jīng)人工篩選,去除與主題相關(guān)度低的文獻(xiàn)、人物訪談、選題指南以及一些會(huì)議綜述和報(bào)道后,獲得樣本文獻(xiàn)512篇。在Web of Science核心數(shù)據(jù)集(包括SCI-EXPANDED、CPCI-S)中,“檢索主題”等于“digital humanit*”or“humanities computing”,檢索范圍為2019年12月31日之前數(shù)據(jù)庫(kù)收錄的所有文獻(xiàn),檢索到827條記錄,經(jīng)人工篩選,去除與主題相關(guān)度低的文獻(xiàn)、書評(píng)、會(huì)議文摘等,同時(shí)也去除第一作者單位為中國(guó)地區(qū)的若干文獻(xiàn),獲得樣本文獻(xiàn)489篇。
CiteSpace軟件可對(duì)Web of Science核心數(shù)據(jù)集中導(dǎo)出的數(shù)據(jù)進(jìn)行作者、機(jī)構(gòu)、國(guó)家、地區(qū)合作網(wǎng)絡(luò)分析,關(guān)鍵詞、術(shù)語、領(lǐng)域共現(xiàn)分析,文獻(xiàn)、作者、期刊共被引分析,以及文獻(xiàn)耦合、雙圖疊加分析[3],但對(duì)于CNKI數(shù)據(jù)只能進(jìn)行作者、機(jī)構(gòu)合作網(wǎng)絡(luò)以及關(guān)鍵詞共現(xiàn)分析。本文為了進(jìn)行國(guó)內(nèi)外數(shù)字人文研究狀態(tài)的可視化對(duì)比,選擇了CNKI和Web of Science數(shù)據(jù)共有的分析字段,僅對(duì)樣本數(shù)據(jù)進(jìn)行作者、機(jī)構(gòu)合作圖譜分析和關(guān)鍵詞共現(xiàn)圖譜分析。
圖1 數(shù)字人文研究文獻(xiàn)統(tǒng)計(jì)
為考察數(shù)字人文研究成果,對(duì)2019年12月31日之前CNKI和Web of Science核心數(shù)據(jù)集中收錄的相關(guān)文獻(xiàn)進(jìn)行統(tǒng)計(jì),并繪制文獻(xiàn)發(fā)表的年限分布趨勢(shì)圖(見圖1),直觀地展示國(guó)內(nèi)外數(shù)字人文研究發(fā)展速度及趨勢(shì)。經(jīng)分析,國(guó)內(nèi)數(shù)字人文的研究文獻(xiàn)最早出現(xiàn)在2005年,而國(guó)外在2003年就出現(xiàn)了相關(guān)的研究報(bào)道。2003—2013年,國(guó)內(nèi)外研究趨勢(shì)都較為平緩,國(guó)外一直保持著一定數(shù)量的研究,但國(guó)內(nèi)的研究似乎才剛剛萌芽;2014—2016年,國(guó)內(nèi)外研究均呈現(xiàn)出明顯的上升趨勢(shì),從趨勢(shì)線的走勢(shì)可以看出,國(guó)內(nèi)研究的增長(zhǎng)速度明顯要高于國(guó)外研究;2017—2019年,國(guó)內(nèi)研究更是突飛猛進(jìn),不僅在增長(zhǎng)的速度上超越了國(guó)外,在文獻(xiàn)的發(fā)表量上也明顯高于國(guó)外,而國(guó)外始終保持著平穩(wěn)的發(fā)展趨勢(shì)??梢?,數(shù)字人文的研究越來越受到國(guó)內(nèi)學(xué)者的重視。出現(xiàn)這一現(xiàn)象的原因可能是由于2014年在上海召開的“圖書館前沿技術(shù)論壇:數(shù)字人文與語義技術(shù)”專題研討會(huì)和2016年在北京大學(xué)舉辦的首屆數(shù)字人文論壇推動(dòng)了數(shù)字人文在各個(gè)領(lǐng)域的實(shí)踐和發(fā)展。此外,國(guó)務(wù)院于2016年底發(fā)布《“十三五”國(guó)家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》,規(guī)劃中明確指出要促進(jìn)人文資源的數(shù)字化,實(shí)現(xiàn)優(yōu)秀人文資源的創(chuàng)造性轉(zhuǎn)化,同時(shí),提高博物館、圖書館和檔案館等公共文化服務(wù)機(jī)構(gòu)的數(shù)字化水平,將數(shù)字技術(shù)與文化服務(wù)深度融合來推動(dòng)文化產(chǎn)業(yè)發(fā)展。隨后,原文化部在2017年4月先后出臺(tái)了《文化部關(guān)于推動(dòng)數(shù)字文化產(chǎn)業(yè)創(chuàng)新發(fā)展的指導(dǎo)意見》和《文化部“十三五”時(shí)期文化產(chǎn)業(yè)發(fā)展規(guī)劃》,這一系列政策的提出也為國(guó)內(nèi)數(shù)字人文研究的發(fā)展提供了良好機(jī)遇。
通過對(duì)國(guó)內(nèi)外作者、機(jī)構(gòu)的合作情況進(jìn)行圖譜繪制,探究數(shù)字人文研究學(xué)術(shù)領(lǐng)域的合作關(guān)系。首先,對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,利用Notepad++軟件將國(guó)內(nèi)外研究機(jī)構(gòu)以及國(guó)外作者的名稱進(jìn)行梳理(機(jī)構(gòu)名稱保留到某大學(xué),同一作者名稱格式統(tǒng)一),再分別將樣本數(shù)據(jù)導(dǎo)入CiteSpace軟件,設(shè)置每一年一個(gè)時(shí)間分區(qū),分析對(duì)象分別選擇作者和機(jī)構(gòu),分析對(duì)象節(jié)點(diǎn)之間連線強(qiáng)度選擇夾角余弦距離Cosine,篩選標(biāo)準(zhǔn)選擇Top50。由于預(yù)處理時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)密度較低,所以這里對(duì)網(wǎng)格不進(jìn)行修剪,運(yùn)行后分別得到國(guó)內(nèi)外數(shù)字人文研究作者合作圖譜和機(jī)構(gòu)合作圖譜。
圖2和圖3分別是國(guó)內(nèi)外數(shù)字人文研究作者的合作圖譜。圖中節(jié)點(diǎn)的大小體現(xiàn)了該作者的發(fā)文量,也代表了該作者在這一研究領(lǐng)域的活躍程度,節(jié)點(diǎn)間的連線體現(xiàn)了作者之間的合作關(guān)系,連線越粗表示合作越緊密。圖2的網(wǎng)絡(luò)密度為 0.002 3,圖3的網(wǎng)絡(luò)密度為 0.003 1,說明該領(lǐng)域的作者之間的研究比較分散,學(xué)術(shù)交流和科研成果上的聯(lián)系不緊密,但是,國(guó)外作者之間的聯(lián)系要比國(guó)內(nèi)相對(duì)密切一些。國(guó)內(nèi)外該領(lǐng)域的作者大部分是以個(gè)人或者小團(tuán)體形式進(jìn)行研究的,沒有形成權(quán)威性的大型學(xué)術(shù)組織。在國(guó)內(nèi)數(shù)字人文研究領(lǐng)域中發(fā)文較多的作者有夏翠娟、趙宇翔、鄂麗君、朱慶華、李欣、曾子明、王濤、劉煒、楊曉雯、趙薇、王東波、王曉光、許鑫,其中夏翠娟和趙宇翔各有9篇相關(guān)文獻(xiàn)。國(guó)外數(shù)字人文研究領(lǐng)域中發(fā)文較多的作者有Richard Furuta,Tobias Blanke,Akira Maeda,Mark Hedges,Colin Allen,Biligsaikhan Batjargal,Seamus Lawless,Stefan Jaenicke,Robert B Allen,其中,Richard Furuta有8篇相關(guān)文獻(xiàn)。
圖2 國(guó)內(nèi)數(shù)字人文研究作者合作圖譜
圖3 國(guó)外數(shù)字人文研究作者合作圖譜
圖4和圖5分別是國(guó)內(nèi)外數(shù)字人文研究機(jī)構(gòu)的合作圖譜。圖中節(jié)點(diǎn)的大小體現(xiàn)了該機(jī)構(gòu)的發(fā)文量,也代表了該機(jī)構(gòu)在這一研究領(lǐng)域的活躍程度,節(jié)點(diǎn)間的連線體現(xiàn)了機(jī)構(gòu)之間的合作關(guān)系,連線的粗細(xì)體現(xiàn)了合作的緊密程度。圖4的網(wǎng)絡(luò)密度為 0.003 5,圖5的網(wǎng)絡(luò)密度為 0.005 3,說明國(guó)外機(jī)構(gòu)之間的聯(lián)系要比國(guó)內(nèi)密切很多。在國(guó)內(nèi)數(shù)字人文研究領(lǐng)域中發(fā)文較多的機(jī)構(gòu)有南京大學(xué)、武漢大學(xué)、北京大學(xué)、上海圖書館、上海大學(xué)、華東師范大學(xué)、中國(guó)人民大學(xué)、上海交通大學(xué)、南京農(nóng)業(yè)大學(xué)、中山大學(xué),其中,南京大學(xué)有46篇相關(guān)文獻(xiàn)。國(guó)外數(shù)字人文研究領(lǐng)域中發(fā)文較多的機(jī)構(gòu)有阿姆斯特丹自由大學(xué)、倫敦國(guó)王學(xué)院、阿姆斯特丹大學(xué)、倫敦大學(xué)學(xué)院、烏得勒支大學(xué)、伊利諾伊大學(xué)、都柏林圣三一學(xué)院、立命館大學(xué)、得克薩斯A&M大學(xué)、牛津大學(xué)、印第安納大學(xué)、萊比錫大學(xué),其中,阿姆斯特丹自由大學(xué)有14篇相關(guān)文獻(xiàn)。
圖4 國(guó)內(nèi)數(shù)字人文研究機(jī)構(gòu)合作圖譜
圖5 國(guó)外數(shù)字人文研究機(jī)構(gòu)合作圖譜
縱觀國(guó)內(nèi)外作者、機(jī)構(gòu)合作圖譜可以發(fā)現(xiàn),國(guó)外研究者、研究機(jī)構(gòu)之間的合作更為密切,展現(xiàn)出積極交流與合作的態(tài)度,而國(guó)內(nèi)獨(dú)撰作者較多,研究機(jī)構(gòu)數(shù)量少且較為分散,還沒有形成良好的跨界合作氛圍。
對(duì)國(guó)內(nèi)外數(shù)字人文研究文獻(xiàn)的關(guān)鍵詞進(jìn)行共現(xiàn)圖譜繪制,探究數(shù)字人文研究的熱點(diǎn)主題和熱點(diǎn)的演變。首先,對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,利用Notepad++軟件將關(guān)鍵詞進(jìn)行同義詞合并,再分別將樣本數(shù)據(jù)導(dǎo)入CiteSpace軟件,設(shè)置每一年一個(gè)時(shí)間分區(qū),分析對(duì)象選擇關(guān)鍵詞,分析對(duì)象節(jié)點(diǎn)之間連線強(qiáng)度選擇夾角余弦距離Cosine,篩選標(biāo)準(zhǔn)選擇Top50,采用“PathFinder+Pruning Sliced Networks”算法對(duì)圖譜進(jìn)行修剪,并生成唯一解,運(yùn)行后分別得到國(guó)內(nèi)外數(shù)字人文研究關(guān)鍵詞共現(xiàn)圖譜。
3.2.1 研究熱點(diǎn)分析。圖6和圖7分別是國(guó)內(nèi)外數(shù)字人文研究關(guān)鍵詞共現(xiàn)圖譜。關(guān)鍵詞作為文獻(xiàn)內(nèi)容的高度精練,在圖譜中出現(xiàn)的頻次高低能在一定程度上反映該研究領(lǐng)域的研究特點(diǎn)及現(xiàn)狀。共現(xiàn)分析方法作為一種能界定跨學(xué)科新興領(lǐng)域研究范圍、研究?jī)?nèi)容與研究方法以及構(gòu)建該領(lǐng)域內(nèi)學(xué)術(shù)生態(tài)系統(tǒng)的有效途徑,可以應(yīng)用于數(shù)字人文研究熱點(diǎn)的捕捉與評(píng)價(jià)[4]。圖中節(jié)點(diǎn)大小代表關(guān)鍵詞出現(xiàn)的頻次,節(jié)點(diǎn)間連線粗細(xì)代表關(guān)鍵詞間共現(xiàn)的強(qiáng)弱,節(jié)點(diǎn)年輪的顏色和厚度代表研究出現(xiàn)的時(shí)間和對(duì)應(yīng)時(shí)間出現(xiàn)的文獻(xiàn)量。在CiteSpace中,常以“中介中心性”作為測(cè)度節(jié)點(diǎn)在網(wǎng)絡(luò)中重要性的指標(biāo),中心性越高的關(guān)鍵詞在網(wǎng)絡(luò)中所起的“中介”作用越大,高中心性的重要節(jié)點(diǎn)在圖譜中由紫色外圈標(biāo)注,表明與其他節(jié)點(diǎn)連接緊密。圖6中高中介中心性的節(jié)點(diǎn)有“數(shù)字人文、高校圖書館、圖書館、人文計(jì)算”,圖7中高中介中心性的節(jié)點(diǎn)有“digital humanity”,說明國(guó)內(nèi)圍繞“高校圖書館”“圖書館”的數(shù)字人文研究比較多,而國(guó)外數(shù)字人文研究的內(nèi)容比較分散。
圖6 國(guó)內(nèi)數(shù)字人文研究關(guān)鍵詞共現(xiàn)圖譜
去除檢索主題“數(shù)字人文”,得到頻次大于9、中介中心性大于0.05的關(guān)鍵詞(見表1)??梢园l(fā)現(xiàn),國(guó)內(nèi)數(shù)字人文的研究熱點(diǎn),包括基于元數(shù)據(jù)、大數(shù)據(jù)、檔案、關(guān)聯(lián)數(shù)據(jù)、數(shù)據(jù)庫(kù)等研究對(duì)象,數(shù)字技術(shù)、可視化、數(shù)字化、GIS、知識(shí)圖譜等研究方法以及高校圖書館、圖書館服務(wù)、文本挖掘、遠(yuǎn)讀、知識(shí)服務(wù)、閱讀推廣、跨學(xué)科服務(wù)等一系列的研究應(yīng)用。
對(duì)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)進(jìn)行聚類(見圖6),得到國(guó)內(nèi)數(shù)字人文研究的熱點(diǎn)方向分布:(#0)高校圖書館、(#1)知識(shí)圖譜、(#2)人文計(jì)算、(#3)文學(xué)、(#4)徽學(xué)、(#5)圖書館、(#6)基礎(chǔ)設(shè)施建設(shè)。
表1 國(guó)內(nèi)數(shù)字人文研究關(guān)鍵詞共現(xiàn)頻次、中介中心性及最早出現(xiàn)年份(部分)
圖7 國(guó)外數(shù)字人文研究關(guān)鍵詞共現(xiàn)圖譜
去除檢索主題“digital humanity”,得到頻次大于9、中介中心性大于0.05的關(guān)鍵詞(見表2)??梢园l(fā)現(xiàn),國(guó)外數(shù)字人文的研究熱點(diǎn),包括基于文化遺產(chǎn)、本體、歷史、大數(shù)據(jù)、人文、關(guān)聯(lián)數(shù)據(jù)、藝術(shù)、語料庫(kù)等研究對(duì)象,可視化、GIS、機(jī)器學(xué)習(xí)等研究方法,以及數(shù)字圖書館、眾包、自然語言處理、信息檢索、評(píng)估、文本挖掘、語義網(wǎng)服務(wù)等一系列的研究應(yīng)用。
對(duì)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)進(jìn)行聚類(見圖7),得到國(guó)外數(shù)字人文研究的熱點(diǎn)方向分布:(#0)image retrieval,(#1)digital library,(#2)visualization,(#3)citizen science,(#4)humanities,(#5)big data,(#6)metadata。
表2 國(guó)外數(shù)字人文研究關(guān)鍵詞共現(xiàn)頻次、中介中心性及最早出現(xiàn)年份(部分)
通過國(guó)內(nèi)外數(shù)字人文研究熱點(diǎn)分析,可以看出國(guó)內(nèi)外研究熱點(diǎn)不盡相同:國(guó)內(nèi)側(cè)重于圖書館服務(wù)的拓展研究,尤其是高校圖書館的知識(shí)服務(wù)、閱讀推廣、古籍文獻(xiàn)數(shù)字化等;國(guó)外側(cè)重于歷史、人文、藝術(shù)等文化遺產(chǎn)的可視化研究以及自然語言處理、語料庫(kù)建設(shè)、人文資料評(píng)估、語義網(wǎng)服務(wù)等。從研究對(duì)象和研究應(yīng)用上看,國(guó)外數(shù)字人文研究所涉及的領(lǐng)域更廣,更能體現(xiàn)數(shù)字人文研究的學(xué)科交叉特點(diǎn)。從熱點(diǎn)方向分布上看,國(guó)內(nèi)更注重高校圖書館、基礎(chǔ)設(shè)施建設(shè)等應(yīng)用層面的研究,國(guó)外則更注重圖像檢索、可視化等技術(shù)層面的研究。
3.2.2 研究熱點(diǎn)轉(zhuǎn)移分析。為直觀的考察數(shù)字人文研究領(lǐng)域熱點(diǎn)的轉(zhuǎn)移情況,根據(jù)上文發(fā)文量的統(tǒng)計(jì)分析,將數(shù)字人文研究劃分為三個(gè)階段,即2003—2013年、2014—2016年、2017—2019年,分別聚類關(guān)鍵詞,分析這3個(gè)階段國(guó)內(nèi)外數(shù)字人文研究的熱點(diǎn)及變化情況。將樣本數(shù)據(jù)導(dǎo)入CiteSpace軟件,時(shí)間跨度選擇所劃分的時(shí)間段,設(shè)置每一年一個(gè)時(shí)間分區(qū),分析對(duì)象選擇關(guān)鍵詞,分析對(duì)象節(jié)點(diǎn)之間連線強(qiáng)度選擇夾角余弦距離Cosine,篩選標(biāo)準(zhǔn)選擇Top50,采用“PathFinder+Pruning Sliced Networks”算法對(duì)圖譜進(jìn)行修剪,運(yùn)行后分別得到國(guó)內(nèi)外數(shù)字人文研究3個(gè)階段的關(guān)鍵詞共現(xiàn)詞頻/中心性。
(1)國(guó)內(nèi)數(shù)字人文研究熱點(diǎn)的轉(zhuǎn)移
2003—2013年,國(guó)內(nèi)研究表現(xiàn)出剛剛起步的狀態(tài),發(fā)文量較少,該年段內(nèi)的熱點(diǎn)關(guān)鍵詞(中心性≥0.05)有:數(shù)字技術(shù)、人文計(jì)算、人文精神、文本挖掘、人文研究、交叉學(xué)科、可視化、媒體。主要針對(duì)數(shù)字時(shí)代人文精神[5]以及對(duì)數(shù)字化、文本挖掘等數(shù)字技術(shù)在人文科學(xué)研究中的應(yīng)用[6]的探討。隨著技術(shù)的發(fā)展和大數(shù)據(jù)時(shí)代的到來,人文資料被數(shù)字化,知識(shí)成為一種可以計(jì)算的數(shù)據(jù),這不僅改變了知識(shí)的獲取方式和使用方式,也改變了人文學(xué)科研究的思維范式。
2014—2016年,發(fā)文量有了一定的增長(zhǎng),但仍處于摸索階段,該年段內(nèi)的熱點(diǎn)關(guān)鍵詞(中心性≥0.05)有:人文計(jì)算、高校圖書館、圖書館、文學(xué)、大數(shù)據(jù)、數(shù)據(jù)庫(kù)、新媒體、大數(shù)據(jù)時(shí)代、數(shù)字倉(cāng)儲(chǔ)、博物館。主要針對(duì)圖書館、博物館、數(shù)據(jù)庫(kù)、數(shù)字倉(cāng)儲(chǔ)等作為科研支撐的基礎(chǔ)設(shè)施建設(shè)研究[7]。國(guó)內(nèi)目前還停留在數(shù)字資源建設(shè)層面,如各種方言數(shù)據(jù)庫(kù)、俗語數(shù)據(jù)庫(kù)、語料數(shù)據(jù)庫(kù)、少數(shù)民族特色數(shù)據(jù)庫(kù)、地方志數(shù)據(jù)庫(kù)、族譜數(shù)據(jù)庫(kù)、非物質(zhì)文化數(shù)據(jù)庫(kù)以及各種檔案數(shù)據(jù)庫(kù)的建設(shè)。同時(shí),高校、科研機(jī)構(gòu)研發(fā)各種數(shù)據(jù)平臺(tái),來支撐數(shù)據(jù)庫(kù)建設(shè)。
2017—2019年,發(fā)文量激增,國(guó)內(nèi)數(shù)字人文時(shí)代正欣欣向榮,該年段內(nèi)的熱點(diǎn)關(guān)鍵詞(中心性≥0.05)有:高校圖書館、圖書館、研究型圖書館、圖書情報(bào)、遠(yuǎn)讀、檔案、大數(shù)據(jù)。主要針對(duì)高校圖書館的轉(zhuǎn)型研究,如數(shù)字人文資源建設(shè)、數(shù)字人文館員、數(shù)字人文素養(yǎng)[8]、數(shù)字人文教育等以及檔案、古籍等文獻(xiàn)的知識(shí)服務(wù)和可視化分析。
(2)國(guó)外數(shù)字人文研究熱點(diǎn)的轉(zhuǎn)移
2003—2013年,發(fā)文量較少。該年段內(nèi)的熱點(diǎn)關(guān)鍵詞(中心性≥0.05)有:digital library,TEI,HPC,humanity,XML,art,semantic web,metadata,e-Research,repository,digital philosophy,infrastructure,attribute relationship graph,cloud computing。主要涉及:1)數(shù)字圖書館、高性能計(jì)算、云計(jì)算、知識(shí)庫(kù)等基礎(chǔ)設(shè)施建設(shè)研究[9]。在e-Research環(huán)境下,大量的傳統(tǒng)文獻(xiàn)和特色文獻(xiàn)被數(shù)字化,作為文獻(xiàn)資源的主要保留地,數(shù)字圖書館自然而然成為數(shù)字人文最初的基礎(chǔ)設(shè)施建設(shè)者,高性能計(jì)算、大數(shù)據(jù)技術(shù)等則成為數(shù)字人文基礎(chǔ)設(shè)施的技術(shù)保障,與此同時(shí),高性能計(jì)算作為文學(xué)分析的新方法,被用來檢索和識(shí)別數(shù)字圖書館中大規(guī)模文本資源的主題、關(guān)鍵詞和語言模式等[10]。2)電子文本編碼研究[11]。TEI(文本編碼倡議)是一種建立在SGML(標(biāo)準(zhǔn)通用置標(biāo)語言)和XML(可擴(kuò)展標(biāo)記語言)基礎(chǔ)上的語料庫(kù)文本標(biāo)記模式,用于制定電子形式交換的文本編碼標(biāo)準(zhǔn),提高電子文本的規(guī)范化和標(biāo)準(zhǔn)化,使編碼語言處理的文本能夠更加方便的傳輸和共享。3)人文與藝術(shù)研究。人文和藝術(shù)作為人類文明和文化的精髓,與數(shù)字技術(shù)和計(jì)算機(jī)技術(shù)相結(jié)合,進(jìn)行數(shù)據(jù)化和數(shù)字化重構(gòu),從而挖掘新的研究方法、研究領(lǐng)域和范疇。4)語義網(wǎng)技術(shù)研究[12]。對(duì)人文資源進(jìn)行語義描述和語義組織,從而實(shí)現(xiàn)人文資源的整合和共享,并在此基礎(chǔ)上進(jìn)行深層次的知識(shí)服務(wù)。
2014—2016年,發(fā)文量明顯增長(zhǎng)。該年段內(nèi)的熱點(diǎn)關(guān)鍵詞(中心性≥0.05)有:visualization,cultural heritage,digital library,big data,ontology,linked data,history,machine learning,community model,crowd-sourcing,social media,augmented reality,archive,humanity,text mining。主要涉及:1)歷史、文化遺產(chǎn)等數(shù)字化重構(gòu)和可視化研究[13]。將歷史上的手稿、語言、音樂、舞蹈等數(shù)字化,并建設(shè)數(shù)字化的文化遺產(chǎn)館藏,確保其長(zhǎng)期保存和開放獲取。這一研究過程涉及了語義信息架構(gòu)、內(nèi)容組織、文本挖掘、3D建模、自動(dòng)索引、數(shù)字化重構(gòu)、語音分析以及對(duì)可視化成果進(jìn)行信息檢索、信息增強(qiáng)、標(biāo)注、注釋等。2)本體與關(guān)聯(lián)數(shù)據(jù)研究[14]。本體作為對(duì)文獻(xiàn)資源對(duì)象進(jìn)行語義描述的規(guī)范,能將無序的原始人文資源轉(zhuǎn)換為結(jié)構(gòu)化的數(shù)據(jù),關(guān)聯(lián)數(shù)據(jù)再將結(jié)構(gòu)化的文獻(xiàn)數(shù)據(jù)進(jìn)行組織和加工,使其變成可以通過計(jì)算機(jī)統(tǒng)計(jì)并呈現(xiàn)可視化結(jié)果的數(shù)據(jù)平臺(tái)。3)數(shù)字建模[15]和增強(qiáng)現(xiàn)實(shí)研究[16]。借鑒自然科學(xué)研究中先通過計(jì)算機(jī)模擬分析再實(shí)驗(yàn)的研究方法,在人文科學(xué)研究中,利用計(jì)算機(jī)技術(shù)和大數(shù)據(jù)建立數(shù)字化模型來模擬和分析各種人文現(xiàn)象。例如,傳播研究領(lǐng)域采用社交媒體(如推特、互聯(lián)網(wǎng)、物聯(lián)網(wǎng))搜集大數(shù)據(jù)來進(jìn)行社會(huì)關(guān)系方面的研究,或針對(duì)某一人文研究設(shè)定的虛擬空間,通過虛擬視覺技術(shù)和增強(qiáng)現(xiàn)實(shí)技術(shù)來推演一個(gè)活動(dòng)或者一個(gè)事件的進(jìn)程。
2017—2019年,發(fā)文量平穩(wěn)增長(zhǎng)。該年段內(nèi)的熱點(diǎn)關(guān)鍵詞(中心性≥0.05)有:cultural heritage,corpus,crowdsourcing,GIS,visualization,metadata,evaluation,machine learning,digital library,big data,linked data,distant reading,natural language processing。主要涉及:1)語料庫(kù)研究[17]。隨著數(shù)字人文研究的發(fā)展,語料庫(kù)研究隊(duì)伍不斷壯大,其研究?jī)?nèi)容也從早期簡(jiǎn)單的詞匯、語法和詞典,擴(kuò)展到信息處理、深度翻譯、社會(huì)語言、認(rèn)知語言、抽象語言、話語分析等廣泛領(lǐng)域。2)眾包、大眾協(xié)同、人機(jī)協(xié)同研究[18]。在大數(shù)據(jù)和人工智能時(shí)代,通過對(duì)知識(shí)的開源,讓每個(gè)人都能參與到知識(shí)的產(chǎn)生、知識(shí)的發(fā)現(xiàn)、知識(shí)的組織和知識(shí)的服務(wù)當(dāng)中,再通過人機(jī)協(xié)同、交互處理各種知識(shí)。
本文通過CiteSpace軟件,對(duì)2019年12月31日之前CNKI和Web of Science核心數(shù)據(jù)集中收錄的主題為數(shù)字人文的相關(guān)文獻(xiàn)進(jìn)行計(jì)量分析和圖譜可視化分析,得出以下結(jié)論:
(1)文獻(xiàn)計(jì)量表明:數(shù)字人文研究越來越受到國(guó)內(nèi)學(xué)者的重視,且研究成果豐富,整體呈上升趨勢(shì),2017年起發(fā)文量明顯超越國(guó)外,發(fā)展十分迅速。但國(guó)內(nèi)外相關(guān)研究成果的總體數(shù)量仍略顯不足,還需要更多學(xué)者的投入和關(guān)注。
(2)作者合作圖譜表明:國(guó)內(nèi)外數(shù)字人文領(lǐng)域的科研隊(duì)伍在不斷壯大,但科研人員之間的學(xué)術(shù)交流不緊密,多以個(gè)人或小團(tuán)體形式進(jìn)行研究,缺少權(quán)威性的大型學(xué)術(shù)團(tuán)隊(duì)和領(lǐng)軍人物。雖然,在檢索外文數(shù)據(jù)庫(kù)時(shí)去除了幾條第一作者單位為中國(guó)地區(qū)的文獻(xiàn)記錄,但這幾篇文獻(xiàn)也僅是國(guó)內(nèi)作者獨(dú)撰或是國(guó)內(nèi)少數(shù)作者合著,并未有與國(guó)外研究者合作,這也反映了數(shù)字人文作為一個(gè)跨學(xué)科新興研究領(lǐng)域,還需要設(shè)立更多國(guó)內(nèi)外重大研究專項(xiàng)(如重點(diǎn)基金項(xiàng)目),促進(jìn)國(guó)內(nèi)外研究者之間的交流與合作。
(3)機(jī)構(gòu)合作圖譜表明:國(guó)內(nèi)形成了以南京大學(xué)和武漢大學(xué)為中心的機(jī)構(gòu)合作團(tuán)體,研究成果顯著,但是其他科研機(jī)構(gòu)各自為政,合作較少。國(guó)外研究機(jī)構(gòu)雖然總體發(fā)文量少,但是各機(jī)構(gòu)之間聯(lián)系緊密,跨界合作多,研究成果具有較高的科技含量。同樣,由于缺乏國(guó)內(nèi)外數(shù)字人文聯(lián)合項(xiàng)目的支持,研究機(jī)構(gòu)之間也缺少該領(lǐng)域內(nèi)深層次的交流與合作,需要更多政策上的宏觀引領(lǐng),建立長(zhǎng)效機(jī)制,保障科研機(jī)構(gòu)對(duì)數(shù)字人文領(lǐng)域的關(guān)注度,逐漸形成主流研究方向,促進(jìn)數(shù)字人文研究的科學(xué)發(fā)展。
(4)關(guān)鍵詞共現(xiàn)圖譜表明:1)國(guó)內(nèi)數(shù)字人文研究側(cè)重在高校圖書館應(yīng)用,如知識(shí)服務(wù)、閱讀推廣、文獻(xiàn)數(shù)字化等;國(guó)外數(shù)字人文研究側(cè)重技術(shù)發(fā)展,如文化遺產(chǎn)的可視化,以及自然語言處理、語料庫(kù)建設(shè)、語義網(wǎng)服務(wù)等。2)國(guó)內(nèi)數(shù)字人文領(lǐng)域的研究熱點(diǎn)從人文精神探討和人文科學(xué)數(shù)字化,到基礎(chǔ)設(shè)施建設(shè)研究,再到高校圖書館轉(zhuǎn)型、數(shù)字人文素養(yǎng)、數(shù)字人文服務(wù)研究進(jìn)行轉(zhuǎn)變;國(guó)外數(shù)字人文領(lǐng)域的研究熱點(diǎn)從數(shù)字圖書館、高性能計(jì)算、云計(jì)算、知識(shí)庫(kù)等基礎(chǔ)設(shè)施建設(shè)、電子文本編碼、人文與藝術(shù)、語義網(wǎng)技術(shù)研究,到歷史、文化遺產(chǎn)等數(shù)字化重構(gòu)和可視化研究、本體與關(guān)聯(lián)數(shù)據(jù)研究、數(shù)字建模和增強(qiáng)現(xiàn)實(shí)研究,再到語料庫(kù)建設(shè)、眾包、大眾協(xié)同、人機(jī)協(xié)同研究進(jìn)行轉(zhuǎn)變??梢姡瑖?guó)內(nèi)數(shù)字人文研究主題比較單一,需要進(jìn)一步發(fā)展,不斷開拓新的研究方向,國(guó)外在數(shù)字人文領(lǐng)域的研究范圍更廣,更能體現(xiàn)數(shù)字人文跨學(xué)科、跨領(lǐng)域的特點(diǎn)。
本文通過知識(shí)圖譜直觀地展現(xiàn)了國(guó)內(nèi)外數(shù)字人文研究領(lǐng)域作者、機(jī)構(gòu)的合作關(guān)系,并通過關(guān)鍵詞共現(xiàn)挖掘研究熱點(diǎn),不足之處是樣本數(shù)據(jù)只包括了主題為“數(shù)字人文”或“人文計(jì)算”的相關(guān)文獻(xiàn),忽略了未實(shí)際命名“數(shù)字人文”的研究成果。但也從側(cè)面說明,數(shù)字人文研究機(jī)構(gòu)傳播力不夠,只有涉及該領(lǐng)域的學(xué)者才會(huì)去了解數(shù)字人文,除了提高“數(shù)字人文”標(biāo)簽的使用度以外,還應(yīng)在核心期刊多展現(xiàn)數(shù)字人文的研究成果,提高數(shù)字人文的普及率。此外,學(xué)者的數(shù)字人文理念也不夠深入,數(shù)字人文研究思維還需要進(jìn)一步提高,要從開放思維、量化思維不斷向著關(guān)聯(lián)思維、跨學(xué)科思維和協(xié)同思維轉(zhuǎn)變。
數(shù)字人文作為跨學(xué)科領(lǐng)域,涉及文學(xué)、社會(huì)學(xué)、歷史、計(jì)算機(jī)科學(xué)等,深刻地影響著人文科學(xué)的發(fā)展,也自然地與以知識(shí)組織為主要功能的圖書館相契合[19]。數(shù)字人文與圖書情報(bào)都是有關(guān)信息的學(xué)科,圖書館學(xué)作為數(shù)字人文產(chǎn)生的基礎(chǔ)科學(xué)和主要應(yīng)用領(lǐng)域,應(yīng)從內(nèi)涵、研究對(duì)象、研究方法和實(shí)踐中始終保持與數(shù)字人文研究協(xié)同發(fā)展[20]。
目前,國(guó)外已有圖書館專聘數(shù)字人文館員以支持?jǐn)?shù)字人文研究,并在圖書館內(nèi)建立了數(shù)字人文研究中心,加強(qiáng)圖書館與其他科研機(jī)構(gòu)的交流與合作[21]。雖然上文圖譜分析顯示,國(guó)內(nèi)十分注重高校圖書館數(shù)字人文建設(shè),但大多是一些探索性研究。國(guó)內(nèi)的圖書館,尤其是作為科研支撐的高校圖書館,應(yīng)當(dāng)在深入研究的基礎(chǔ)上,加緊建立數(shù)字人文中心或明確提供數(shù)字人文服務(wù)的相關(guān)機(jī)構(gòu),通過與學(xué)院緊密合作,研發(fā)人文數(shù)據(jù)庫(kù)和基礎(chǔ)性應(yīng)用軟件,改善數(shù)字人文研究平臺(tái)。此外,聘任專職數(shù)字人文館員,并加大對(duì)數(shù)字人文研究項(xiàng)目的資助力度,鼓勵(lì)科研人員積極參與國(guó)際會(huì)議和項(xiàng)目,創(chuàng)新數(shù)字人文研究?jī)?nèi)容、研究方法和研究范式,推動(dòng)我國(guó)人文科學(xué)的進(jìn)步。