龍 泉
〔1.武漢大學(xué)圖書館;2.科技大數(shù)據(jù)湖北省重點(diǎn)實(shí)驗(yàn)室(中國科學(xué)院武漢文獻(xiàn)情報(bào)中心),湖北 武漢430000〕
數(shù)字人文起源于人文計(jì)算,可追溯至20世紀(jì)60年代,始于利用計(jì)算機(jī)技術(shù)對(duì)意大利文學(xué)作品進(jìn)行語言和文字處理[1],后隨著文學(xué)、歷史、藝術(shù)、音樂等人文學(xué)科的擴(kuò)展,各類技術(shù)如超文本、超媒體、數(shù)據(jù)可視化、信息檢索、數(shù)據(jù)挖掘、統(tǒng)計(jì)、文本挖掘等的應(yīng)用,逐漸改變了傳統(tǒng)人文學(xué)科的研究方式,數(shù)字人文也成為計(jì)算機(jī)與人文學(xué)科學(xué)習(xí)、研究、發(fā)明以及創(chuàng)新的新興跨學(xué)科研究領(lǐng)域。
全球多個(gè)國家及高校建立了數(shù)字人文中心或聯(lián)盟,如歐洲于1973年和1978年成立了關(guān)于文學(xué)、語言、計(jì)算機(jī)領(lǐng)域數(shù)字人文研究的組織;加拿大于1986年成立數(shù)字人文聯(lián)合會(huì);美國國家人文基金會(huì)和馬里蘭大學(xué)于2007年建立國際數(shù)字人文網(wǎng)絡(luò)CenterNet。國內(nèi)學(xué)者對(duì)數(shù)字人文的關(guān)注度亦不斷提升。2011年,武漢大學(xué)成立了大陸地區(qū)首家數(shù)字人文研究中心,并于2018年9月加入Cen?terNet;2014年6月,上海市圖書館學(xué)會(huì)舉行2014年圖書館前沿技術(shù)論壇“數(shù)字人文與語義技術(shù)”專題研討會(huì);2016年5月,北京大學(xué)圖書館聯(lián)合哈佛大學(xué)“中國歷代人物傳記資料庫(CBDB)”項(xiàng)目和北京大學(xué)“數(shù)字人文建設(shè)與發(fā)展研究課題組”共同舉辦了首屆北京大學(xué)“數(shù)字人文論壇”,邀請(qǐng)國內(nèi)外專家對(duì)數(shù)字人文在文史、藝術(shù)等方面的應(yīng)用進(jìn)行探討和交流,該論壇已經(jīng)舉辦了3屆;2016年5月,中國人民大學(xué)清史研究所召開“數(shù)字人文與清史研究”學(xué)術(shù)工作坊;2017年7月1-2日南京大學(xué)召開“數(shù)字人文:大數(shù)據(jù)時(shí)代學(xué)術(shù)前沿與探索”學(xué)術(shù)研討會(huì),涉及地理、歷史、統(tǒng)計(jì)學(xué)、資訊科學(xué)、建筑、經(jīng)濟(jì)、文學(xué)、藝術(shù)等多個(gè)學(xué)科;2017年12月,深圳大學(xué)城圖書館主辦了“數(shù)字人文與圖書館”國際研討會(huì),來自英國、美國及國內(nèi)的數(shù)字人文專家從不同角度就數(shù)字人文研究及圖書館在其中的作用進(jìn)行了廣泛探討;2019年7月,敦煌研究院和中國社會(huì)科學(xué)情報(bào)學(xué)會(huì)數(shù)字人文專業(yè)委員會(huì)主辦了“敦煌(DH2019)文化遺產(chǎn)數(shù)字化國際研討會(huì)暨中國社會(huì)科學(xué)情報(bào)學(xué)會(huì)數(shù)字人文專委會(huì)學(xué)術(shù)年會(huì)”,會(huì)議圍繞文化遺產(chǎn)數(shù)字化、人文社科智慧數(shù)據(jù)建設(shè)與管理,文化遺產(chǎn)知識(shí)圖譜構(gòu)建與應(yīng)用等8個(gè)議題展開討論;2019年10月,北京大學(xué)人文社會(huì)科學(xué)研究院等聯(lián)合主辦的“數(shù)字人文視角下的典籍傳承與學(xué)科融合論壇”召開,各高校介紹了在數(shù)字人文領(lǐng)域現(xiàn)有的成果積累,研討數(shù)字人文的發(fā)展。
隨著信息技術(shù)不斷發(fā)展,越來越多學(xué)科與計(jì)算機(jī)科學(xué)交叉融合,數(shù)字人文研究方興未艾。通過文獻(xiàn)計(jì)量學(xué)、可視化技術(shù)分析我國雙一流高校數(shù)字人文研究現(xiàn)狀,了解其研究內(nèi)容、研究作者及機(jī)構(gòu),揭示其發(fā)展趨勢(shì)、演化路徑,有助于把握整體研究水平和研究模式,聚焦研究熱點(diǎn),對(duì)推動(dòng)跨機(jī)構(gòu)、跨學(xué)科數(shù)字人文項(xiàng)目建設(shè)有重要意義。
“雙一流”是世界一流大學(xué)和世界一流學(xué)科建設(shè)的簡(jiǎn)稱,在2017年9月公布的名單中,有42所高校被納入世界一流大學(xué)建設(shè)[2]。筆者以這42所高校為調(diào)研對(duì)象,在中國知網(wǎng)以“數(shù)字人文”或“人文計(jì)算”為主題,即限定為題名、關(guān)鍵詞、摘要字段,機(jī)構(gòu)限定為以各高校名開頭的名稱,發(fā)表時(shí)間截至2019年12月31日,進(jìn)行檢索。檢索時(shí)間為2020年2月15日,得到“雙一流”高校作者參與撰寫的相關(guān)主題文獻(xiàn)共246篇,占總篇數(shù)793篇的31%,去掉學(xué)位論文、報(bào)紙來源、主持人的話、主編的話等以及個(gè)別作者缺失的題錄后,最終得到226篇,作為研究對(duì)象。
筆者采用文獻(xiàn)計(jì)量學(xué)、知識(shí)圖譜可視化方法進(jìn)行研究。采用EXCEL統(tǒng)計(jì)了226篇論文的發(fā)表時(shí)間、研究機(jī)構(gòu)分布、發(fā)文期刊類型及發(fā)文量,了解研究整體情況;通過逐篇閱讀對(duì)論文進(jìn)行分類分析,識(shí)別主流研究方向;采用VOSviewer進(jìn)行作者合著網(wǎng)絡(luò)分析,識(shí)別合著模式和主要研究團(tuán)體;采用CiteSpace進(jìn)行機(jī)構(gòu)合作網(wǎng)絡(luò)分析和關(guān)鍵詞聚類演化時(shí)間線分析,識(shí)別機(jī)構(gòu)合作模式、機(jī)構(gòu)關(guān)系、熱點(diǎn)研究主題及時(shí)間分布。
中國知網(wǎng)上收錄以“數(shù)字人文”或“人文計(jì)算”為主題詞,“雙一流”高校作者參與撰寫的論文各年份發(fā)文量及增長幅度如表1所示。
表1 “雙一流”高校數(shù)字人文研究年度發(fā)文量
最早的一篇論文發(fā)表于2006年,為數(shù)字人文研究起步階段,探討了技術(shù)與人文融合的利弊[3];2007—2012年間,并未迎來領(lǐng)域研究的快速發(fā)展階段,只有2篇研究成果,研究內(nèi)容為技術(shù)或項(xiàng)目介紹,為數(shù)字人文研究的探索階段,該領(lǐng)域此時(shí)并未受到廣泛關(guān)注;2013—2019年,經(jīng)歷從成長過渡到快速發(fā)展的階段,每年均有成果發(fā)表,在數(shù)量上基本呈逐年增多態(tài)勢(shì),近3年已有一定數(shù)量積累,2019年達(dá)到84篇,且在研究內(nèi)容上更多元化,包括國內(nèi)外調(diào)研、研究進(jìn)展等理論研究,也有基于技術(shù)、項(xiàng)目實(shí)踐的具體經(jīng)驗(yàn)探索。
42所雙一流高校中,有33所參與數(shù)字人文主題的研究,占比78.6%。其中,綜合類高校20所,占比最高,為60.6%,其次為理工類高校8所,占比24.2%,另有師范類、民族類、軍事類、農(nóng)林類高校亦有參與。
從機(jī)構(gòu)類型上看,筆者對(duì)226篇文獻(xiàn)作者機(jī)構(gòu)進(jìn)行統(tǒng)計(jì),結(jié)果顯示:包括合著在內(nèi)的所有作者共來自195家機(jī)構(gòu),其中院系、研究中心、實(shí)驗(yàn)室共142家,占比72.8%;圖書館35家,占比17.9%;以一級(jí)機(jī)構(gòu)“大學(xué)”為發(fā)文機(jī)構(gòu)的共14家,占比7.2%;公司5家,占比2.6%。進(jìn)一步對(duì)其中雙一流高校數(shù)據(jù)進(jìn)行統(tǒng)計(jì):雙一流高校機(jī)構(gòu)共136家,其中院系、研究中心、實(shí)驗(yàn)室共101家,占比74.3%;圖書館25家,占比18.4%;以一級(jí)機(jī)構(gòu)“大學(xué)”為發(fā)文機(jī)構(gòu)的共9家,占比6.6%;出版社/公司共2家,占比1.5%??梢?,有專業(yè)學(xué)科背景的研究機(jī)構(gòu)是從事數(shù)字人文研究的主體,其次,圖書館對(duì)該領(lǐng)域亦表現(xiàn)出一定程度的關(guān)注。
從機(jī)構(gòu)發(fā)文量及學(xué)科背景看,將二級(jí)機(jī)構(gòu)匯總至其所屬一級(jí)機(jī)構(gòu)后,排名前三的一級(jí)機(jī)構(gòu)為:南京大學(xué)(47篇)、武漢大學(xué)(27篇)、北京大學(xué)(22篇);排名前三的二級(jí)機(jī)構(gòu)為:南京大學(xué)信息管理學(xué)院(29篇)、武漢大學(xué)信息管理學(xué)院(23篇)、中國人民大學(xué)信息資源管理學(xué)院(13篇)。發(fā)文總量排名前十的一級(jí)、二級(jí)機(jī)構(gòu)如表2所示。
數(shù)字人文研究是跨學(xué)科研究,除了要擁有歷史、人文、教育等不同學(xué)科知識(shí)和研究基礎(chǔ)外,還需掌握數(shù)據(jù)的搜集、處理、分析等信息技術(shù)手段。從一級(jí)機(jī)構(gòu)看,發(fā)文量排名前10的除華東師范大學(xué)外,均為綜合類高校,表明學(xué)科門類豐富的高校產(chǎn)出了更多研究成果,原因或?yàn)槠涠鄬W(xué)科優(yōu)勢(shì),且校內(nèi)院系、研究中心等機(jī)構(gòu)之間便于開展交流合作,研究人員有更多機(jī)會(huì)接觸并學(xué)習(xí)不同的專業(yè)知識(shí),具備從事跨學(xué)科研究的意愿和有利條件。
同時(shí),根據(jù)教育部學(xué)位與研究生教育發(fā)展中心最新公布的第四輪學(xué)科評(píng)估結(jié)果[4],發(fā)文量排名前10的14所大學(xué)均開設(shè)了信息科學(xué)相關(guān)專業(yè),其中有8所擁有圖書情報(bào)與檔案管理類一級(jí)學(xué)科,且南京大學(xué)、武漢大學(xué)、中國人民大學(xué)將該學(xué)科評(píng)估為A類;有13所擁有管理科學(xué)與工程一級(jí)學(xué)科,且清華大學(xué)、上海交通大學(xué)、浙江大學(xué)、四川大學(xué)、東南大學(xué)將該學(xué)科評(píng)估為A類。進(jìn)一步分析排名前10的16所二級(jí)機(jī)構(gòu)類型,有8所為信息科學(xué)類院系或研究中心,5所為圖書館,3所為文史學(xué)院或文學(xué)研究所。據(jù)此可知,雙一流高校中從事數(shù)字人文研究的機(jī)構(gòu)較為集中,主要為信息科學(xué)相關(guān)學(xué)科類型,該學(xué)科包含信息組織與管理、數(shù)據(jù)和文本的分析與挖掘、信息可視化等研究方向,具備技術(shù)優(yōu)勢(shì),也是其他專業(yè)人員從事數(shù)字人文研究的有效助力。
表2 發(fā)文量排名前10的一級(jí)、二級(jí)機(jī)構(gòu)
3.3.1 發(fā)文期刊類型分析
發(fā)表雙一流高校作者數(shù)字人文研究的期刊共95種。按CSSCI、核心期刊、“CSSCI+核心期刊”和普通期刊四類進(jìn)行分類,各類期刊種數(shù)、發(fā)文篇數(shù)及占比、平均發(fā)文量見表3所示。
表3 發(fā)文期刊種數(shù)、發(fā)文篇數(shù)及占比
從發(fā)文期刊的種數(shù)及篇數(shù)占比來看,“CSSCI+核心期刊”類是雙一流高校作者主要發(fā)文渠道,且近80%的作者在CSSCI或核心期刊上發(fā)文,論文整體質(zhì)量較高,或因雙一流高校的教學(xué)條件、人員科研能力、職稱評(píng)定等各項(xiàng)指標(biāo)對(duì)此產(chǎn)生的影響。
進(jìn)一步按年份統(tǒng)計(jì),各類期刊發(fā)文量逐年變化趨勢(shì)如下圖1所示。
圖1 各類型期刊年度發(fā)文趨勢(shì)
從年份變化來看,近5年為數(shù)字人文研究快速發(fā)展期,其中“CSSCI+核心期刊”的發(fā)文量大幅度躍升,是拉動(dòng)數(shù)據(jù)上升的關(guān)鍵因素。表明“雙一流”高校近年來不斷重視數(shù)字人文領(lǐng)域研究,研究數(shù)量增加,研究質(zhì)量顯著提高。
3.3.2 期刊所屬學(xué)科分析
中國知網(wǎng)收錄的期刊按所屬學(xué)科分成不同專輯及不同專題,95種期刊共涉及7個(gè)不同專輯(4種期刊未標(biāo)明專輯,只計(jì)入總數(shù)未列入表中;1種期刊同屬兩個(gè)專輯計(jì)2次),各專輯、專題的期刊種數(shù)及占比如表4所示。
可見,占比排名第一的信息科技類期刊是數(shù)字人文研究發(fā)表的主要陣地,共51種,占比53.7%。其下屬專題圖書情報(bào)與數(shù)字圖書館類期刊亦在總種數(shù)中占比最高,共36種,占比39.6%。且該類期刊發(fā)文量達(dá)135篇,占總發(fā)文量(226篇)的比例高達(dá)59.7%,說明數(shù)字人文研究除了研究機(jī)構(gòu)集中,研究成果的主要類型也相對(duì)集中。
占比第二的為社會(huì)科學(xué)II類期刊,共17種,占比17.9%,其下屬專題教育綜合類期刊在總種數(shù)中亦排名第二,共16種,占比17.6%。同時(shí),在這16種期刊中,有10種為人文、哲學(xué)類學(xué)報(bào),可見雙一流高校對(duì)數(shù)字人文研究有一定支持力度,且該研究的跨學(xué)科特性也在信息科學(xué)與人文社會(huì)科學(xué)的融合中得到體現(xiàn)。
對(duì)期刊發(fā)文量進(jìn)一步分析,發(fā)文量排名前10的14種期刊中,12種為圖書情報(bào)與數(shù)字圖書館類;發(fā)文量超過平均值2.4篇的期刊有25種,具體如表5所示。
由表5可見,發(fā)文量相對(duì)較高的期刊幾乎都為信息科技類期刊,主要集中于圖書情報(bào)與數(shù)字圖書館、檔案及博物館兩類。反映了:(1)數(shù)字人文研究較多涉及信息處理及分析方法,發(fā)文期刊類型與上一節(jié)機(jī)構(gòu)分析中得出的研究人員主要為信息科學(xué)相關(guān)專業(yè)相符的結(jié)論一致;(2)檔案及博物館類期刊在期刊總種數(shù)中占比并不高,但發(fā)文量卻較高,一方面說明該類期刊對(duì)數(shù)字人文研究的支持力度,另一方面說明,除圖情領(lǐng)域外,檔案及博物館領(lǐng)域的研究人員對(duì)數(shù)字人文的理論與方法亦頗為熟悉,且兩個(gè)領(lǐng)域交叉、互通較多,有助于研究框架與知識(shí)結(jié)構(gòu)的不斷完善,也更易積累研究經(jīng)驗(yàn)與成果。
表4 各學(xué)科期刊種數(shù)及占比
表5 發(fā)文量超過平均值以上的期刊
論文被引頻次是學(xué)術(shù)評(píng)價(jià)的指標(biāo)之一,也代表了該研究在業(yè)內(nèi)的被認(rèn)可度、學(xué)術(shù)影響力和學(xué)術(shù)價(jià)值。中國引文數(shù)據(jù)庫中所有機(jī)構(gòu)的數(shù)字人文研究論文被引篇數(shù)為645篇,被引總次數(shù)為3469次,平均被引5.38次;雙一流高校的數(shù)字人文論文被引篇數(shù)為153篇,被引總次數(shù)為1125次,平均被引7.35次。說明“雙一流”高校數(shù)字人文研究數(shù)量不多,影響力較整體平均水平略高,但優(yōu)勢(shì)不明顯。
同時(shí),筆者統(tǒng)計(jì)了被引頻次高于7.35次的論文,共得到108篇。其中,“雙一流”高校作者參與撰寫的有36篇,占比33.3%;“雙一流”高校作者為第一作者的有32篇,占比29.6%。即在影響力超過平均水平的論文中,雙一流高校成果并不多,大約僅占三分之一。一方面說明,各級(jí)各類機(jī)構(gòu)對(duì)數(shù)字人文研究都有重要貢獻(xiàn),產(chǎn)出了高質(zhì)量的成果,并得到廣泛認(rèn)可和采納;另一方面,被引量靠前的“雙一流”高校論文主要集中在北京大學(xué)、南京大學(xué)、武漢大學(xué)等少數(shù)幾所高校,說明“雙一流”高校數(shù)字人文研究的發(fā)展不平衡,整體水平并未走在前列,研究成果的認(rèn)可度及影響力在領(lǐng)域內(nèi)并不突出。
高被引論文除了作為揭示學(xué)術(shù)影響力的評(píng)價(jià)指標(biāo),也揭示了當(dāng)前核心研究方向。筆者分析32篇被引頻次較高的核心論文發(fā)現(xiàn),這些論文的研究方向主要分為3類:數(shù)字人文研究及發(fā)展現(xiàn)狀(11篇);數(shù)字人文應(yīng)用理論(17篇);數(shù)字人文項(xiàng)目實(shí)踐(4篇),各類被引頻次排名靠前的論文如表6所示。
“數(shù)字人文研究及發(fā)展現(xiàn)狀”類論文主要包含會(huì)議和文獻(xiàn)綜述、文獻(xiàn)計(jì)量學(xué)分析、服務(wù)調(diào)研等,通過歸納總結(jié)、數(shù)據(jù)統(tǒng)計(jì)、調(diào)研等方式,闡釋概念、發(fā)現(xiàn)熱點(diǎn)研究領(lǐng)域、了解國內(nèi)外現(xiàn)狀、提出參考意見和見解,該類論文的被引及下載頻次最高,為重點(diǎn)關(guān)注及研究方向;“數(shù)字人文應(yīng)用理論”類論文在數(shù)量上占比最大,主要包含技術(shù)理論研究和工作探討,如文本挖掘、GIS、關(guān)聯(lián)數(shù)據(jù)等信息技術(shù)工具的理論及相關(guān)案例介紹、數(shù)字人文與實(shí)際工作結(jié)合模式的構(gòu)想等,工作探討集中在圖書館和檔案兩個(gè)領(lǐng)域,這亦是從事數(shù)字人文研究人員的主要學(xué)科背景;“數(shù)字人文項(xiàng)目實(shí)踐”類論文主要為研究人員對(duì)自己親自參與、實(shí)際從事工作或項(xiàng)目的介紹和分析,所提出的經(jīng)驗(yàn)和方法來自于他們本人的實(shí)踐,這類論文數(shù)量最少,且被引次數(shù)和下載次數(shù)也相對(duì)較少,說明“雙一流”高校的數(shù)字人文研究主要以理論為主,將理論與實(shí)踐相結(jié)合的研究力度不夠。
“雙一流”高校作者參與撰寫的226篇論文,共涉及到326位作者。在VOSviewer中創(chuàng)建作者合著網(wǎng)絡(luò),設(shè)置最小作者數(shù)為1,得到145個(gè)群組,其中72個(gè)群組包含2位及以上作者,說明近一半是合作式研究。
表6 核心研究方向論文統(tǒng)計(jì)
在合著作者網(wǎng)絡(luò)中,最大關(guān)聯(lián)網(wǎng)絡(luò)涉及22位作者,如圖2所示,節(jié)點(diǎn)大小代表發(fā)文量,連線粗細(xì)代表作者間合著頻次多少。南京大學(xué)信息管理學(xué)院朱慶華為關(guān)鍵節(jié)點(diǎn),參與撰寫8篇論文,與之合著較多的為南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院的趙宇翔(合著3次),其次為上海圖書館的陳濤、劉煒(合著2次),并以此為紐帶,產(chǎn)生了新的子網(wǎng)絡(luò)。
圖2 雙一流高校數(shù)字人文研究作者合著最大子網(wǎng)絡(luò)
另外,作者關(guān)聯(lián)數(shù)大于10人的網(wǎng)絡(luò)有3個(gè),如圖3所示。
圖3 雙一流高校數(shù)字人文研究作者合著子網(wǎng)絡(luò)
圖3 (a)網(wǎng)絡(luò)包含11位作者,均來自北京大學(xué)圖書館,11人合著1篇會(huì)議綜述,沒有其他相關(guān)研究,該網(wǎng)絡(luò)中沒有關(guān)鍵節(jié)點(diǎn);圖3(b)網(wǎng)絡(luò)包含10位作者,武漢大學(xué)信息管理學(xué)院王曉光為關(guān)鍵節(jié)點(diǎn),參與或獨(dú)著5篇相關(guān)論文,與網(wǎng)絡(luò)中其他作者均只有1次合著;圖3(c)網(wǎng)絡(luò)包含10位作者,華東師范大學(xué)信息管理系許鑫為關(guān)鍵節(jié)點(diǎn),參與或獨(dú)著6篇相關(guān)論文,且與同校同院系陳路遙、楊佳穎有過2次合著。可見,圖譜中呈現(xiàn)出明顯的核心子網(wǎng)絡(luò),主要原因是關(guān)鍵作者參與發(fā)文量和總合著次數(shù)較多,但與同一對(duì)象的合著次數(shù)較少,除以朱慶華為核心的最大子網(wǎng)絡(luò)外,并未表現(xiàn)出穩(wěn)定的合作關(guān)系。
進(jìn)一步分析子網(wǎng)絡(luò)發(fā)現(xiàn),關(guān)鍵節(jié)點(diǎn)均為圖書館或信息科學(xué)相關(guān)人員,說明該類人員是數(shù)字人文研究的核心力量,與前文機(jī)構(gòu)分析結(jié)果一致;同時(shí),結(jié)合各作者學(xué)歷層次和身份分析,主要合著模式為導(dǎo)師-本碩博士生,其次為同領(lǐng)域?qū)<液献鳌⑼瑱C(jī)構(gòu)同事合作,這表明雖然數(shù)字人文是跨學(xué)科研究,不同學(xué)科背景的學(xué)者合作是理想的研究模式,但目前這種模式還不占主流,研究者仍更傾向于選擇同領(lǐng)域人員作為合作對(duì)象。
機(jī)構(gòu)合作反映了不同高校、高校部門院系之間的聯(lián)系。數(shù)字人文的典型特征之一是跨學(xué)科研究,通過對(duì)其機(jī)構(gòu)合作情況進(jìn)行分析,有助于了解各高校不同學(xué)科人員間的交流及參與度,揭示研究模式及研究深度。
利用CiteSpace軟件進(jìn)行機(jī)構(gòu)合作分析,閾值設(shè)置為1,得到圖譜如圖4。
圖4 雙一流高校數(shù)字人文研究機(jī)構(gòu)合作圖譜
節(jié)點(diǎn)及字號(hào)大小代表該機(jī)構(gòu)發(fā)文量多少,節(jié)點(diǎn)間連線代表機(jī)構(gòu)間存在合作關(guān)系,連線越粗,機(jī)構(gòu)間合作次數(shù)越多。圖4明確顯示,南京大學(xué)信息管理學(xué)院、武漢大學(xué)信息管理學(xué)院和中國人民大學(xué)信息資源管理學(xué)院是三大核心節(jié)點(diǎn),這3所機(jī)構(gòu)的發(fā)文量、機(jī)構(gòu)合作次數(shù)最多。
南京大學(xué)信息管理學(xué)院?jiǎn)蝹€(gè)機(jī)構(gòu)的發(fā)文量為9篇,合作發(fā)文量最多的機(jī)構(gòu)為南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院(5篇),其次為福建師范大學(xué)社會(huì)發(fā)展學(xué)院(3篇)、上海圖書館(3篇),且與本校圖書館、工程學(xué)院有合作,與其他3所高校圖書館有合作;武漢大學(xué)信息管理學(xué)院?jiǎn)蝹€(gè)機(jī)構(gòu)發(fā)文量為6篇,合作發(fā)文量最多的機(jī)構(gòu)為武漢大學(xué)信息資源研究中心(7篇),其次為中國人民大學(xué)信息資源管理學(xué)院(2篇)、南昌大學(xué)人文學(xué)院(2篇),與本校計(jì)算機(jī)學(xué)院、遙感信息工程學(xué)院、數(shù)字圖書館研究所、數(shù)字出版研究所有合作,與中山大學(xué)資訊管理學(xué)院有合作;中國人民大學(xué)信息資源管理學(xué)院?jiǎn)蝹€(gè)機(jī)構(gòu)發(fā)文量為5篇,合作發(fā)文量最多的機(jī)構(gòu)為中國人民大學(xué)人文北京研究中心(3篇)和中國人民大學(xué)數(shù)據(jù)工程與知識(shí)工程教育部重點(diǎn)實(shí)驗(yàn)室(3篇)、武漢大學(xué)信息管理學(xué)院(3篇),其次為南昌大學(xué)人文學(xué)院(2篇),與本校數(shù)字人文研究中心、電子文件管理研究中心有合作,與北京航空航天大學(xué)經(jīng)濟(jì)管理學(xué)院有合作。
可見,機(jī)構(gòu)合作方式分為4類:同機(jī)構(gòu)內(nèi)合作、校內(nèi)合作、同地域合作和跨地域合作。同機(jī)構(gòu)內(nèi)人員合作是主要方式。校內(nèi)合作方面,武漢大學(xué)信息管理學(xué)院與其他院系建立的聯(lián)系較多;同地域合作方面,南京大學(xué)信息管理學(xué)院與南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院較密切;跨地域合作方面,南京大學(xué)信息管理學(xué)院與福建師范大學(xué)、上海圖書館較密切。
關(guān)鍵詞隨時(shí)間變化的趨勢(shì)和分布,能揭示不同階段研究熱點(diǎn)的變化和行業(yè)發(fā)展?!半p一流”高校數(shù)字人文主題論文共包含628個(gè)關(guān)鍵詞,其中,頻次最高的關(guān)鍵詞是“數(shù)字人文”,也是主題檢索用詞之一,頻次176次;頻次10以上的關(guān)鍵詞有兩個(gè);頻次5-9次的關(guān)鍵詞有12個(gè);頻次2-4次的關(guān)鍵詞有102個(gè);頻次1次的有511個(gè)。利用CiteSpace軟件對(duì)關(guān)鍵詞進(jìn)行聚類分析,閾值設(shè)置為1,分布模式選擇時(shí)間線視圖(TimeLine View),得到圖譜如圖5。
圖5 關(guān)鍵詞聚類時(shí)間線
圖5 包含13個(gè)聚類,反映出“雙一流”高校數(shù)字人文研究的13個(gè)主題。聚類詞字號(hào)大小代表該類關(guān)鍵詞數(shù)量多少,序號(hào)越小表示該聚類關(guān)鍵詞越多;節(jié)點(diǎn)圓圈大小代表該關(guān)鍵詞在全時(shí)間段內(nèi)的總詞頻高低,關(guān)鍵詞節(jié)點(diǎn)所在位置的年份代表其第一次在文獻(xiàn)中出現(xiàn)的時(shí)間,連線代表其共現(xiàn)關(guān)鍵詞及共現(xiàn)年份。
從關(guān)鍵詞總體分布來看,自2006年第一篇論文發(fā)表后的5年內(nèi),并無太多相關(guān)研究,此階段“雙一流”高校對(duì)數(shù)字人文研究的熱度較低;2012年,“數(shù)字人文”首次作為關(guān)鍵詞出現(xiàn);2013年開始,關(guān)鍵詞數(shù)量有增加趨勢(shì),且近5年新興關(guān)鍵詞涌現(xiàn),關(guān)鍵詞密度明顯增大,表明學(xué)者對(duì)該領(lǐng)域關(guān)注度及創(chuàng)新研究明顯增加。從聚類詞大小來看,知識(shí)圖譜、圖書館服務(wù)、大數(shù)據(jù)為三大熱點(diǎn)主題,各聚類主要關(guān)鍵詞及演化過程如下。
聚類#0知識(shí)圖譜:熱點(diǎn)關(guān)鍵詞有關(guān)聯(lián)數(shù)據(jù)、可視化、知識(shí)網(wǎng)絡(luò)等?!爸R(shí)圖譜”首現(xiàn)于2016年,主要研究內(nèi)容為不同主題研究熱點(diǎn)及演化分析[5-6]、人物關(guān)系挖掘[7]等;“關(guān)聯(lián)數(shù)據(jù)”首現(xiàn)于2014年,相關(guān)詞為“關(guān)聯(lián)爵士項(xiàng)目”和“社會(huì)網(wǎng)絡(luò)分析”,為音樂領(lǐng)域的數(shù)字人文研究[7];2016—2019年出現(xiàn)“演化路徑”“知識(shí)網(wǎng)絡(luò)”“馬克思著作”“融合網(wǎng)絡(luò)”等詞,研究內(nèi)容與“知識(shí)圖譜”關(guān)聯(lián)較強(qiáng);“可視化”首現(xiàn)于2017年,但自2013年開始便有相關(guān)研究發(fā)表,為詞云在內(nèi)容表達(dá)方面的應(yīng)用介紹[8],2017—2019年,均有可視化相關(guān)論文發(fā)表,且數(shù)量逐年增加。
聚類#1圖書館服務(wù)、#3圖書館、#6大學(xué)圖書館:這3個(gè)聚類主題詞都與圖書館有關(guān),熱點(diǎn)關(guān)鍵詞有移動(dòng)視覺搜索、數(shù)字學(xué)術(shù)等。“圖書館”關(guān)鍵詞最早出現(xiàn)于2014年,是何青芳、姚俊蘭[9]的一篇國際會(huì)議綜述,以敦煌研究、Mapping the Republic of Letters等國內(nèi)外項(xiàng)目為例,說明圖書館對(duì)數(shù)字人文的推動(dòng)作用。“移動(dòng)視覺搜索”關(guān)鍵詞首次出現(xiàn)于2016年,2017、2018年有相關(guān)論文發(fā)表,主要論述該技術(shù)及相關(guān)的圖像檢索、增強(qiáng)現(xiàn)實(shí)技術(shù)發(fā)展現(xiàn)狀,及其在圖書館、高校的應(yīng)用實(shí)踐與未來方向的思考[10-11]?!皥D書館服務(wù)”“大學(xué)圖書館”“數(shù)字學(xué)術(shù)”關(guān)鍵詞首次出現(xiàn)于2017年,與之相關(guān)的關(guān)鍵詞有“高校圖書館”“科研支持服務(wù)”等,研究內(nèi)容主要為國外數(shù)字學(xué)術(shù)中心、數(shù)字人文服務(wù)調(diào)研,在此基礎(chǔ)上總結(jié)對(duì)國內(nèi)相關(guān)服務(wù)提供、中心建設(shè)、圖書館角色定位等問題的啟示[12-14]。
聚類#2大數(shù)據(jù):熱點(diǎn)關(guān)鍵詞有數(shù)據(jù)庫、歷史研究等。該類最早出現(xiàn)的關(guān)鍵詞“德國”“TextGrid”首現(xiàn)于2009年,論文介紹了德國將網(wǎng)格技術(shù)用于人文科學(xué)的TextGrid項(xiàng)目,旨在創(chuàng)建虛擬研究圖書館,為人文科學(xué)學(xué)者提供文本數(shù)據(jù)處理發(fā)布的工作平臺(tái),促進(jìn)跨學(xué)科研究,為中文數(shù)據(jù)信息的處理、平臺(tái)建設(shè)提供指導(dǎo)[15]?!皵?shù)據(jù)庫”首現(xiàn)于2014年,且在2017—2019年有多篇論文關(guān)鍵詞出現(xiàn)“數(shù)據(jù)庫”“數(shù)據(jù)庫系統(tǒng)”相關(guān)詞語,研究內(nèi)容主要為歷史文獻(xiàn)、方志、地理信息等專題數(shù)據(jù)庫和特藏資源的建設(shè)[16-17]。2017年,首現(xiàn)“量化數(shù)據(jù)庫”關(guān)鍵詞,且共現(xiàn)關(guān)鍵詞包括“歷史研究”“史學(xué)方法”,研究指出需構(gòu)建可量化分析的數(shù)據(jù)庫,而非文獻(xiàn)數(shù)據(jù)庫,以用于數(shù)據(jù)驅(qū)動(dòng)的文史研究[18]。
聚類#4檔案學(xué):熱點(diǎn)關(guān)鍵詞有數(shù)字化、檔案工作等。該類最早出現(xiàn)的關(guān)鍵詞“數(shù)字技術(shù)”首現(xiàn)于2006年,亦是筆者所有研究中最早出現(xiàn)的。“數(shù)字化”首現(xiàn)于2014年,2017—2019年有相關(guān)論文發(fā)表,研究內(nèi)容有包含數(shù)字化技術(shù)的數(shù)字人文相關(guān)技術(shù)與理論探討[19],也有針對(duì)古籍、非遺、圖像資源等具體對(duì)象的數(shù)字化研究方法及思路。2018年,出現(xiàn)“檔案”相關(guān)的數(shù)字人文研究,且在2019年有較多論文發(fā)表,共現(xiàn)關(guān)鍵詞有“資源整合”“檔案工作”“檔案服務(wù)”“檔案資源”等,研究內(nèi)容包括檔案資源的保存、整合、組織與開發(fā)利用[20-21],檔案工作與數(shù)字人文的關(guān)系等[22]。
聚類#5知識(shí)組織:熱點(diǎn)關(guān)鍵詞有數(shù)字人文、元數(shù)據(jù)等?!皵?shù)字人文”首現(xiàn)于2012年,也是筆者研究對(duì)象和檢索詞,與其他各聚類關(guān)鍵詞均存在共現(xiàn)關(guān)系?!霸獢?shù)據(jù)”首現(xiàn)于2016年,共現(xiàn)關(guān)鍵詞有“地方歷史文獻(xiàn)”“史料資源”等,主要為數(shù)字人文方法在史料等特藏資源組織、整理、數(shù)據(jù)化中的應(yīng)用[23]。
聚類#7文學(xué)研究、聚類#8人文學(xué)科、聚類#13數(shù)字史學(xué):這3個(gè)聚類的主題均關(guān)系到數(shù)字人文研究的對(duì)象——人文,及其所涵蓋的文學(xué)和歷史。熱點(diǎn)關(guān)鍵詞有文本挖掘、人文研究、數(shù)據(jù)庫建設(shè)等。“文本挖掘”“人文研究”首現(xiàn)且共現(xiàn)于2012年,前者多次與“文學(xué)研究”共現(xiàn),主要用于特藏資源揭示和數(shù)據(jù)庫建設(shè),并與#13聚類中的“遠(yuǎn)距離閱讀”“文本可視化”共現(xiàn)于2017年關(guān)于利用計(jì)算機(jī)處理文本以幫助文獻(xiàn)閱讀和理解的論文中[24];后者則多出現(xiàn)于理論問題的探討中?!拔膶W(xué)研究”首現(xiàn)于2016年,且與關(guān)鍵詞“遠(yuǎn)讀”共現(xiàn),可見其為文史研究中的重要技術(shù)之一;“人文學(xué)科”首現(xiàn)于2016年,主要為相關(guān)理論研究;“數(shù)字史學(xué)”首現(xiàn)于2017年,且與“遠(yuǎn)距離閱讀”共現(xiàn)于關(guān)于德語歷史文獻(xiàn)的數(shù)據(jù)挖掘研究中[25]。
聚類#9人文計(jì)算:“人文計(jì)算”首現(xiàn)于2013年,該詞是數(shù)字人文的概念發(fā)源和早期表達(dá),因此,其涉及的論文多為數(shù)字人文理論研究,如發(fā)展史、研究進(jìn)展分析等,相關(guān)關(guān)鍵詞有數(shù)字人文發(fā)展史、生命周期、教育體系等。
聚類#10美國:“美國”首現(xiàn)于2017年,實(shí)際上關(guān)于“美國”的研究自2015年便出現(xiàn)了,且在2017—2019年均有相關(guān)論文發(fā)表。該聚類中的關(guān)鍵詞,如案例分析、實(shí)踐、熱點(diǎn)等,主要體現(xiàn)在美國高校及圖書館關(guān)于數(shù)字人文、數(shù)字學(xué)術(shù)服務(wù)實(shí)踐的調(diào)研分析中[13,26]。
聚類#11gis:“gis”首現(xiàn)于2014年,該文列舉將地理信息系統(tǒng)(GIS)技術(shù)用于歷史地理研究、建立歷史地理信息系統(tǒng)的案例和可行性,提供空間綜合人文社科研究說明[27]。歷史地理信息可視化亦是數(shù)字人文重要研究方向之一,2017—2019年均有相關(guān)論文發(fā)表。
聚類#12語義描述:“語義描述”首現(xiàn)于2018年,僅2018、2019年2篇論文包含該關(guān)鍵詞,主要內(nèi)容為圖像、人文資源的語義描述研究[28-29],相關(guān)關(guān)鍵詞有語義組織、圖像、人文信息資源等。
筆者以“雙一流”高校參與撰寫的數(shù)字人文主題相關(guān)論文為研究對(duì)象,統(tǒng)計(jì)論文發(fā)表年份、發(fā)文機(jī)構(gòu)、發(fā)文期刊類型及學(xué)科、論文影響力、主要研究方向,并采用科學(xué)知識(shí)圖譜軟件VOSviewer、Citespace繪制作者合著、機(jī)構(gòu)合著和關(guān)鍵詞聚類時(shí)間線圖譜,對(duì)“雙一流”高校數(shù)字人文整體研究層次、所涉學(xué)科背景、作者和機(jī)構(gòu)合作模式、核心研究方向和領(lǐng)域進(jìn)行統(tǒng)計(jì)及可視化分析。
研究發(fā)現(xiàn),“雙一流”高校數(shù)字人文研究起步于2006年,2007—2012年為探索階段,“數(shù)字人文”首次作為關(guān)鍵詞出現(xiàn)在論文中;2013—2019年從成長階段過渡到快速發(fā)展階段,研究數(shù)量增幅明顯,所涉領(lǐng)域不斷擴(kuò)展。綜合類高校為研究主體,發(fā)文機(jī)構(gòu)主要為有信息科學(xué)學(xué)科背景的院系、研究中心和圖書館;發(fā)文期刊主要為CSSCI和核心期刊,且信息科學(xué)類期刊占比最高;研究影響力較領(lǐng)域平均水平略高,但優(yōu)勢(shì)不明顯;論文研究方向主要為3類:數(shù)字人文研究及發(fā)展現(xiàn)狀、數(shù)字人文應(yīng)用理論、數(shù)字人文項(xiàng)目實(shí)踐,以理論研究偏多,實(shí)踐及相關(guān)成果不足。同時(shí),通過作者合著分析發(fā)現(xiàn),近一半論文為合著,主要合著模式為:導(dǎo)師-本碩博士生。其次為同領(lǐng)域?qū)<液献?、同機(jī)構(gòu)同事合作,較為穩(wěn)定的合著關(guān)系為以南京大學(xué)信息管理學(xué)院朱慶華為核心的子網(wǎng)絡(luò);通過機(jī)構(gòu)合作分析發(fā)現(xiàn),主要合作模式為同機(jī)構(gòu)內(nèi)合作,其次為校內(nèi)合作、同地域合作和跨地域合作,跨學(xué)科作者、機(jī)構(gòu)合作不占主流;通過關(guān)鍵詞聚類時(shí)間線分析發(fā)現(xiàn),知識(shí)圖譜、圖書館、大數(shù)據(jù)為3大熱點(diǎn)研究主題,自2013年開始主題類型有增加趨勢(shì),近5年創(chuàng)新研究不斷涌現(xiàn)。
據(jù)以上結(jié)果分析,當(dāng)前,信息科學(xué)為“雙一流”高校數(shù)字人文主要基礎(chǔ)學(xué)科,亦是其主要應(yīng)用學(xué)科,說明該領(lǐng)域研究人員對(duì)數(shù)字人文的思想啟蒙、初步實(shí)踐、推動(dòng)發(fā)展起到關(guān)鍵作用,產(chǎn)生了大量成果與貢獻(xiàn)。但未來的發(fā)展方向不能局限于此,一方面,應(yīng)更多考慮到數(shù)字人文跨學(xué)科特性,推動(dòng)信息科學(xué)類研究人員與人文學(xué)科人員間的交流協(xié)作,隨著數(shù)字人文機(jī)構(gòu)的建立、相關(guān)服務(wù)的開展,信息科學(xué)研究人員、研究機(jī)構(gòu)應(yīng)成為不同學(xué)科人員間聯(lián)系的紐帶,并承擔(dān)起將信息技術(shù)、相關(guān)研究方法引入人文學(xué)科研究實(shí)踐的責(zé)任。另一方面,在數(shù)字人文研究網(wǎng)絡(luò)中的核心高校,應(yīng)發(fā)揮牽頭和輻射帶動(dòng)作用,不局限于本機(jī)構(gòu)內(nèi)合作,打通與校內(nèi)的人文學(xué)院、校際信息科學(xué)類學(xué)院和數(shù)字人文機(jī)構(gòu)的溝通渠道,尋求并擴(kuò)展合作模式,以幫助建立多樣化的項(xiàng)目及實(shí)施落地。