The Progress and Trends of Digital Humanities Research in the Field of Information Resource Management in China
GuQing,ZhangMengyun,TanJie
AbstractBased on internal and external perspectives,the deep learning model BER Topic is used for topic recognition,building semantic networksbasedonpoint-to-point informationPMI,exploring thedevelopmenttrendand expansion spaceof digital humanities research inthe fieldof information resourcemanagement in China.Theresearch in the past 1O years can be divided into12 themes,which can be broadly classified into six aspects,combining two majorfeaturesinthelogical evolution: digitalempowermentandopenfusion.Onthis basis,wereflect andlook forward to: improving theconstructionof thedigital humanitiesdiscipline system; strengthening empirical research ondigital humanities;inovating digital humanities visualizationresearch; expanding digital humanities servicecontent; promoting thedigitizationoflibrary,informationandarchivesciencehumanities resources;andacelerating thedigital humanities transformationofthelibrary,informationandarchivescience.
KeywordsInformation resource management.Digital Humanities. BERTopic.PMI.
0 引言
黨的二十屆三中全會提出“傳承中華優(yōu)秀傳統(tǒng)文化,加快適應(yīng)信息技術(shù)迅猛發(fā)展新形勢”,“加強基礎(chǔ)學(xué)科、新興學(xué)科、交叉學(xué)科建設(shè)”①,為數(shù)字人文發(fā)展提供了重要的理論指導(dǎo)和實踐遵循。重視新技術(shù)對文科發(fā)展帶來的機遇、加強多學(xué)科之間的交叉和融通等逐漸成為學(xué)界和相關(guān)業(yè)界的共識②。信息資源管理作為管理學(xué)門類的一級學(xué)科,涵蓋圖書館學(xué)、情報學(xué)、檔案學(xué)、數(shù)字人文等具有相同學(xué)科使命和共同理論基礎(chǔ)的二級學(xué)科。數(shù)字人文與其他傳統(tǒng)學(xué)科并列,共同納人信息資源管理范疇,這一調(diào)整彰顯了其學(xué)科獨特性,鼓勵跨學(xué)科研究促進信息資源管理與其他學(xué)科的交叉融合,為數(shù)字人文研究提供了更加廣闊的發(fā)展空間。在傳統(tǒng)人文社科領(lǐng)域,數(shù)字人文更多地用作一種研究方法和輔助工具,譬如運用計算機科學(xué)、信息科學(xué)、數(shù)字技術(shù)等對文學(xué)文本進行整理、分析,為人文研究注入新的活力;在信息管理領(lǐng)域,數(shù)字人文是一個重要的研究方向。作為人文與數(shù)字交叉融合的新興學(xué)科,數(shù)字人文研究涉及大量的數(shù)字化文本、圖像、音視頻等資源,為信息資源管理提供了豐富的數(shù)據(jù)來源,由此本文擬通過對數(shù)字人文研究方法和技術(shù)的研究,可以為信息資源管理領(lǐng)域提供新的理論支持和實踐指導(dǎo),提高信息資源的利用效率和質(zhì)量。
1數(shù)字人文研究
有關(guān)數(shù)字人文的研究成果豐富,主要采用以下方法發(fā)現(xiàn)其研究領(lǐng)域和熱點: ① 系統(tǒng)綜述。針對期刊論文、圖書、會議報告、訪談[5-7]、實踐項目[8-9]等方面進行系統(tǒng)研究,例如以法國數(shù)字人文中心為研究對象歸納法國數(shù)字人文中心建設(shè)的特點[10]。 ② 文獻計量。借助CiteSpace、Vosviewer等工具統(tǒng)計作者分布、研究熱點等,如以知識圖譜形式呈現(xiàn)全球數(shù)字人文領(lǐng)域的熱點前沿、演化歷程和趨勢變化[]。 ③ 元分析。對論文的研究理論、參考學(xué)科、研究層次等進行逐一編碼,如運用內(nèi)容分析法對數(shù)字人文網(wǎng)站中的文本內(nèi)容進行深度分析,描述各高校數(shù)字人文專業(yè)的課程體系和教學(xué)模式[12];借鑒扎根理論質(zhì)性研究范式分析信息資源管理領(lǐng)域數(shù)字人文特征、研究體系及構(gòu)建路徑[13]。 ④ 國際數(shù)字人文研究歸納。國內(nèi)外越來越多的高校開設(shè)數(shù)字人文課程和學(xué)科方向,借鑒數(shù)字人文領(lǐng)域發(fā)展較成熟的國際數(shù)字人文研究內(nèi)容、方法及范式等對我國具有借鑒意義[4,如以馬克斯·韋伯基金會下屬德國海外人文機構(gòu)為例研究數(shù)字人文視域下的跨國史[5??傊?,這些文獻通過描繪知識圖譜和研究路徑,梳理和充實了國內(nèi)外各個領(lǐng)域數(shù)字人文研究的內(nèi)容與方法。但是,由于大部分選取少量代表性文獻,覆蓋面不足,可能存在信息缺失、知識偏向性等問題;研究方法多為定性分析,而少量定量分析未涉及文本層面的深層次挖掘;從信息資源管理視角對數(shù)字人文研究的相關(guān)成果進行綜合梳理和量化分析的研究尤為少見。
為了客觀全面地揭示國內(nèi)信息資源管理領(lǐng)域數(shù)字人文的研究現(xiàn)狀,采取基于主題模型的分析方法,挖掘文獻中潛在的語義關(guān)系和主題信息[。點互信息PMI基于共現(xiàn)概率計算詞語間相關(guān)度,彌補了傳統(tǒng)共現(xiàn)網(wǎng)絡(luò)中詞語間缺乏語義聯(lián)系的缺點[7]。因此,文章基于內(nèi)外視角,借助BERTopic模型[18-19]提取主題,運用PMI構(gòu)建關(guān)鍵詞語義網(wǎng)絡(luò)[20],并借助Gephi軟件對其可視化,探究國內(nèi)信息資源管理領(lǐng)域數(shù)字人文的研究方向與拓展空間。
2數(shù)據(jù)獲取與處理
基于內(nèi)部視角,使用BERTopic主題模型進行主題識別,對研究熱點和前沿進行關(guān)聯(lián)探測分析;基于外部視角,使用語義網(wǎng)絡(luò)分析法構(gòu)建國內(nèi)信息資源管理領(lǐng)域數(shù)字人文研究的知識網(wǎng)絡(luò)結(jié)構(gòu),繪制關(guān)鍵詞知識圖譜進一步探索其發(fā)展趨勢。
在數(shù)據(jù)獲取上是以中國知網(wǎng)為資料庫,搜索條件設(shè)定為“數(shù)字人文 + 人文計算”主題詞,文獻來源類別為CSSCI和CSCD,同時將研究范圍聚焦于“圖書館情報學(xué)”及“檔案管理與博物館學(xué)”兩大學(xué)科領(lǐng)域,得到854篇文獻。通過人工檢查篩選,最終,數(shù)據(jù)集中包含有效論文737篇。對于獲取的論文采用適合中文文本分析的Jieba分詞的精確模式處理原始語料,并設(shè)置自定義詞典來保留與主題相關(guān)的專用名詞,例如“數(shù)字人文技術(shù)體系”“語料庫建設(shè)”“記憶再生產(chǎn)”等。通過整理百度停用詞表、中文停用詞表等多個停用詞表,最終構(gòu)建的停用詞表包含2664個詞;通過整理所得論文中的關(guān)鍵詞,最終構(gòu)建的自定義詞典中包含1534個詞。
在利用BERTopic進行主題提取時,首先,使用sentence-transformers/all-MiniLM-L6-v2模型進行詞嵌入。其次,使用UMAP算法降維(設(shè)置高維空間近似鄰近數(shù)量為20,低維空間中點之間的最小距離為0),同時使用HDBSCAN算法實現(xiàn)主題聚類,并使用適合中文文本的TfidfVectorizer進行詞語特征提??;最后,創(chuàng)建基于c-TF-IDF算法的主題表示,使用c-TF-IDF提取主題詞和減少主題數(shù)量,基于最大邊際相關(guān)性提高詞的連貫性和多樣性[2]。當(dāng)BERTopic發(fā)現(xiàn)相似度超過0.9的主題對時,便迭代地減少主題的數(shù)量;為確保主題數(shù)量合適,在訓(xùn)練模型時將nr_topics 值設(shè)為“auto”,由BERTopic 自動迭代生成[18]
在構(gòu)建語義網(wǎng)絡(luò)時,主要以選取高頻詞構(gòu)建語義網(wǎng)絡(luò),因此,文章基于PMI計算語義網(wǎng)絡(luò)的鄰接矩陣,并將結(jié)果導(dǎo)入到軟件Gephi中進行可視化呈現(xiàn)。點互信息PMI的計算公式如下所示:
其中,P( w1 , w2 )代表關(guān)鍵詞 w1 和 w2 同時出現(xiàn)的概率,P( w1 )和P( w2 )分別代表關(guān)鍵詞 w1 和 w2 出現(xiàn)的概率。
針對獲取詞頻最高的前200個詞語,構(gòu)建高頻詞的共現(xiàn)矩陣,然后按照公式依次計算詞語之間的PMI,構(gòu)建高頻詞語義網(wǎng)絡(luò),規(guī)定 PMIgt;0 時存在關(guān)聯(lián)關(guān)系;最后導(dǎo)人復(fù)雜網(wǎng)絡(luò)分析軟件Gephi進行可視化呈現(xiàn),并計算總體網(wǎng)絡(luò)密度、平均加權(quán)度以及平均距離。其中,平均加權(quán)度反映了網(wǎng)絡(luò)節(jié)點在組合上的潛在能力;同時,網(wǎng)絡(luò)節(jié)點間的平均距離較短,意味著它們之間的協(xié)作更為便捷,知識傳遞效率也相應(yīng)提高。
3基于BERTopic主題模型分析
基于BERTopic模型對國內(nèi)信息資源管理領(lǐng)域數(shù)字人文研究相關(guān)文獻進行主題識別和分析,從內(nèi)部探究我國信息資源管理領(lǐng)域數(shù)字人文研究的發(fā)展概況和研究熱點。對數(shù)據(jù)集進行主題建模,共識別出12個主題,一致性檢驗結(jié)果為0.7741,主題識別效果較好。最后依據(jù)相關(guān)主題詞及其c-TF-IDF確定的主題標簽。
結(jié)合數(shù)據(jù)預(yù)處理結(jié)果和主題標簽可得,在國內(nèi)信息資源管理領(lǐng)域數(shù)字人文的研究中,TopicO(數(shù)字人文可視化)是出現(xiàn)頻率最高的主題,Topic2(古籍?dāng)?shù)字化)、Topic4(歷史檔案資源開發(fā))、Topic7(數(shù)字敘事探索)和Topic11(文獻資源保護與數(shù)字化)均與該主題緊密相關(guān)??梢姡瑖鴥?nèi)信息資源管理模式中的數(shù)字人文研究主題及主題特征詞“數(shù)據(jù)驅(qū)動、知識表示”的數(shù)字人文新范式已經(jīng)成為大數(shù)據(jù)時代圖檔博數(shù)據(jù)資源組織管理創(chuàng)新的途徑[22],具體見表1。Topic1(數(shù)字學(xué)術(shù)服務(wù))也是信息資源管理領(lǐng)域數(shù)字人文研究中出現(xiàn)頻率較高的主題,Topic6(智慧圖書館體系建設(shè))與其緊密相關(guān)。圖書館數(shù)字化轉(zhuǎn)型背景下,建設(shè)數(shù)字學(xué)術(shù)個性化服務(wù)平臺有利于向用戶針對性推薦高價值信息資源[23]。
為了更細粒度地展示主題的研究情況,調(diào)用topic_model.visualize_documents函數(shù)進行主題聚類分析,得到該領(lǐng)域文檔-主題分布[18],可知國內(nèi)信息資源管理領(lǐng)域的數(shù)字人文研究主要包括12個主題,大體可以歸入六個方面:數(shù)字人文學(xué)科體系建設(shè)、數(shù)字人文實證研究、數(shù)字人文可視化研究、數(shù)字人文服務(wù)、圖檔博人文資源數(shù)字化、圖情檔學(xué)科的數(shù)字人文轉(zhuǎn)型。
4基于點互信息PMI的語義網(wǎng)絡(luò)分析
運用BERTopic模型歸納研究主題可以分析國內(nèi)信息資源管理領(lǐng)域數(shù)字人文研究的關(guān)注熱點,但是無法反映該領(lǐng)域詞語之間的聯(lián)系。因此,本研究從外部視角,構(gòu)建基于點互信息PMI的語義網(wǎng)絡(luò),探索領(lǐng)域高頻詞之間的語義關(guān)系,進而分析國內(nèi)數(shù)字人文研究未來的發(fā)展方向與拓展空間。研究發(fā)現(xiàn)該領(lǐng)域注重理論與實踐相結(jié)合,主要涵蓋六個研究方向的12個相關(guān)主題,但研究文章中的高頻詞語義網(wǎng)絡(luò)的密度較低,文獻的知識元素間的組合比較稀疏,聯(lián)系不密切,主題間的關(guān)聯(lián)度較弱;詞語間的知識流動速度比較慢,知識傳遞效率較低。
4.1數(shù)字人文學(xué)科體系建設(shè)
Topic3(數(shù)字人文學(xué)科建設(shè))主要包括構(gòu)建數(shù)字人文的學(xué)科體系,明確學(xué)科的范疇、研究方法和特點,推動數(shù)字人文學(xué)科的發(fā)展和應(yīng)用。信息資源管理領(lǐng)域?qū)W者對數(shù)字人文學(xué)科體系建設(shè)方面進行的探討主要包括數(shù)字人文理論基礎(chǔ)、數(shù)字人文教育與服務(wù)、數(shù)字人文技術(shù)開發(fā)與應(yīng)用、數(shù)字人文學(xué)科與其他相關(guān)學(xué)科的融合和系統(tǒng)發(fā)展、數(shù)字人文學(xué)科的研究方法和理論框架,以及國內(nèi)外數(shù)字人文學(xué)科建設(shè)情況的比較研究和啟示等方面。國內(nèi)高校以信息資源管理學(xué)科為發(fā)展基礎(chǔ),通過設(shè)立數(shù)字人文學(xué)位或開展數(shù)字人文課程確定數(shù)字人文的學(xué)科屬性,其中,中國人民大學(xué)在信息資源管理一級學(xué)科下設(shè)置了我國第一個數(shù)字人文二級學(xué)科學(xué)術(shù)型博士點[24]。
4.2 數(shù)字人文實證研究
Topic9(數(shù)字人文項目研究)和Topic10(面向數(shù)字人文的開放數(shù)據(jù))聚焦三方面的實證研究。一是數(shù)字人文案例。例如,從國內(nèi)外基于數(shù)字人文的歷史檔案文獻開發(fā)典型項目中提取實踐要素,解析實踐要點,分析國內(nèi)外數(shù)字人文案例,梳理國內(nèi)數(shù)字人文實踐。二是數(shù)字人文項目。我國信息資源管理領(lǐng)域數(shù)字人文項目成果豐碩,影響力較大的有上海圖書館開發(fā)的“碑帖建筑VR 沉浸式體驗展項”、中國人民大學(xué)信息資源管理學(xué)院主導(dǎo)的“北京孔廟數(shù)字記憶項目”、武漢大學(xué)大數(shù)據(jù)研究院研發(fā)的“珞珈圖騰家譜數(shù)字化平臺”等。三是數(shù)字人文競賽。上海圖書館舉辦的開放數(shù)據(jù)競賽數(shù)據(jù)來源于上海圖書館、復(fù)旦大學(xué)圖書館、CBDB等機構(gòu),充分體現(xiàn)了數(shù)字人文學(xué)科知識創(chuàng)新、協(xié)同合作的本質(zhì)[25]。
4.3數(shù)字人文可視化研究
Topic0(數(shù)字人文可視化)將文本、圖像、音頻、視頻等多種類型的信息資源進行有效融合,主要使用可視化工具以及通過四種類型的可視化更好地呈現(xiàn)、檢索、分析和利用數(shù)字人文數(shù)據(jù)和信息。一是數(shù)據(jù)可視化。包括圖表、地圖、網(wǎng)絡(luò)圖等方式,如面向藏醫(yī)學(xué)專業(yè)研究人員和醫(yī)療工作者的科研需求,設(shè)計基于知識圖譜的藏醫(yī)古籍服務(wù)平臺的知識服務(wù)功能[8]。二是交互式可視化。用戶與數(shù)字人文數(shù)據(jù)通過交互式設(shè)計進行互動,如使用滑塊、下拉菜單等交互元素控制數(shù)據(jù)展示[26]。三是虛擬現(xiàn)實可視化。如虛擬現(xiàn)實技術(shù)創(chuàng)造虛擬場景,讓用戶身臨其境地體驗數(shù)字人文數(shù)據(jù)。四是多維可視化。如使用熱力圖、散點圖等方式來展示數(shù)字人文數(shù)據(jù)??梢暬ぞ唛_發(fā)如基于Web的可視化工具、桌面應(yīng)用程序[27]等,具體的應(yīng)用包括文本分析、歷史研究、網(wǎng)絡(luò)關(guān)系分析、知識表達、古物保存、時空分析、文化研究等內(nèi)容。
4.4 數(shù)字人文服務(wù)
Topic1(數(shù)字學(xué)術(shù)服務(wù))和Topic6(智慧圖書館體系建設(shè))緊密關(guān)聯(lián)。圖書館作為學(xué)術(shù)資料的集散地,與生俱來具備跨學(xué)科合作優(yōu)勢,這為數(shù)字人文領(lǐng)域的探索與實踐奠定了堅實的基礎(chǔ)。這種優(yōu)勢恰好與數(shù)字人文的跨界特質(zhì)相契合,使其成為該研究領(lǐng)域不可或缺的應(yīng)用平臺。數(shù)字人文的介入為圖書館的服務(wù)拓展注入了新的活力,助推了在新興文科背景下學(xué)術(shù)服務(wù)的轉(zhuǎn)型與提升。圖書館通過數(shù)字人文轉(zhuǎn)型及提供相關(guān)服務(wù)來拓寬其學(xué)術(shù)服務(wù)的邊界,同時通過主導(dǎo)或參與相關(guān)研究,顯著提升學(xué)術(shù)參與度和研究質(zhì)量。智慧圖書館與數(shù)字人文融合發(fā)展的理論和實踐不斷深化:一是知識圖譜、數(shù)字孿生、元宇宙等數(shù)字人文技術(shù)在智慧圖書館建設(shè)中的應(yīng)用,二是智慧圖書館空間再造與數(shù)字人文服務(wù)創(chuàng)新策略[28]。
4.5 圖檔博人文資源數(shù)字化
Topic2(古籍?dāng)?shù)字化)、Topic4(歷史檔案資源開發(fā))、Topic7(文獻資源保護與數(shù)字化)和Topic11(數(shù)字學(xué)術(shù)服務(wù))包括對圖像、文獻、藝術(shù)品等文化遺產(chǎn)進行數(shù)字化處理和存儲,主要包括幾個方面: ① 數(shù)字化技術(shù)和方法。采用多元化的處理手段,例如實施電子成像、光學(xué)字符識別(OCR)、立體建模等,保障數(shù)字化成果的品質(zhì)與可信度。 ② 制訂一致性標準與規(guī)程。維護數(shù)字化資源在轉(zhuǎn)換過程中的完整性與真實性,同時促進數(shù)字化資源的順暢交流與共用。利用計算機編目、文本標注、知識圖譜、語義關(guān)聯(lián)等技術(shù)構(gòu)建知識庫,充分利用和傳播數(shù)字化資源。 ③ 數(shù)字化展示和呈現(xiàn)。運用地理信息系統(tǒng)(GIS)、數(shù)據(jù)可視化手段及人工智能技術(shù),提升數(shù)字資源的表現(xiàn)手法與展示效果。通過數(shù)字出版和在線教育等渠道,向大眾傳播文化與信息內(nèi)容。 ④ 數(shù)字化的維護與復(fù)原。運用數(shù)字化的工藝與手段,對受到損害或隨時間推移而老化的文化資產(chǎn)實施維護及復(fù)原工作。
4.6 圖情檔學(xué)科數(shù)字人文轉(zhuǎn)型
Topic5(檔案學(xué)教育改革)和Topic8(圖情檔學(xué)科的轉(zhuǎn)型發(fā)展)涵蓋圖情檔學(xué)科的數(shù)字人文轉(zhuǎn)型。一方面,數(shù)字人文研究需要大量的原始數(shù)據(jù)和文獻資源,而信息資源管理為這些數(shù)據(jù)和資源的收集、整理、保存和共享提供了技術(shù)手段和方法,如元數(shù)據(jù)、知識組織、信息檢索等。另一方面,數(shù)字人文為信息資源管理提供了新的理論視角與實踐領(lǐng)域,推動了信息資源管理的創(chuàng)新發(fā)展,包括從傳統(tǒng)的紙質(zhì)文獻分類向網(wǎng)絡(luò)信息資源分類拓展、從單一的知識組織向多元化的知識服務(wù)轉(zhuǎn)變、從簡單的信息檢索向智能化的知識發(fā)現(xiàn)演進等。例如,從信息活動至頂層認知的理論深化、從項目管理至行動模型的方法拓展、從教學(xué)優(yōu)化至學(xué)科升級的教研演進三大方面促進圖書情報與檔案管理領(lǐng)域整體發(fā)展[29;基于數(shù)字人文領(lǐng)域?qū)嵶C分析,探討信息資源管理學(xué)科研究增長點的定位[30]。
5思考與展望
根據(jù)分析結(jié)果可以發(fā)現(xiàn),“資源”“信息”“數(shù)字”“融合”“交融”的研究熱度較高,主題歸納六大方面的研究相互關(guān)聯(lián),串聯(lián)起整體框架和知識全景,在邏輯演進脈絡(luò)中,始終貫穿著信息資源管理領(lǐng)域內(nèi)的數(shù)字人文兼具兩大特征:一是數(shù)字賦能。數(shù)字人文研究借助可視化等多種數(shù)字技術(shù)手段,既關(guān)注理論和方法的發(fā)展,也注重將研究成果應(yīng)用于圖博檔等領(lǐng)域的實際場景,深化數(shù)字人文的實際應(yīng)用和社會影響。二是開放融合。數(shù)字人文研究在信息資源管理開放體系中指向融合,包括學(xué)科融合、數(shù)據(jù)融合、技術(shù)融合、理論融合等多個層面。
數(shù)字人文研究不僅有助于推進信息資源管理領(lǐng)域的學(xué)科建設(shè),進一步推動跨學(xué)科整合與協(xié)同創(chuàng)新,而且對于推動我國數(shù)字化建設(shè)、提升國家文化軟實力具有重要意義。因此,本文在梳理信息資源管理領(lǐng)域的數(shù)字人文研究進展的基礎(chǔ)上,對我國數(shù)字人文研究和信息資源管理實踐進行思考。
5.1完善數(shù)字人文學(xué)科體系建設(shè)
我國信息資源管理領(lǐng)域在數(shù)字人文研究方面成果豐碩,開放性和包容性強,但語義網(wǎng)絡(luò)密度和關(guān)聯(lián)度均較低,說明理論體系尚不成熟,研究的深度和廣度還需要進一步擴展,亟待從不同的角度去研究探索。這可能與學(xué)科歸屬不夠明確有關(guān)。在最新研究生和本科專業(yè)目錄中,分別屬于管理學(xué)和文學(xué);數(shù)字人文研究成果在中圖法分類體系中缺乏明確的歸類位置,不利于學(xué)術(shù)成果的檢索傳播;數(shù)字人文專業(yè)期刊較少,缺乏具有國際影響力的學(xué)術(shù)交流和學(xué)術(shù)品牌。目前國內(nèi)一些高校已建立了數(shù)字人文學(xué)科,培養(yǎng)具有數(shù)字素養(yǎng)和人文素養(yǎng)的復(fù)合型人才、跨學(xué)科知識和技能的研究人才是推動數(shù)字人文研究發(fā)展的關(guān)鍵。
5.2 加強數(shù)字人文實證研究
數(shù)字人文研究理論發(fā)展與應(yīng)用案例日益豐富,不僅為信息資源管理提供新的理論視角和方法論,還推動了相關(guān)領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。如借助數(shù)字技術(shù)對大量文獻進行深度挖掘,發(fā)現(xiàn)潛在的知識關(guān)聯(lián),為人文研究提供新的視角。例如,我國國家圖書館的“數(shù)字方志”項目,通過數(shù)字化手段將全國各地的方志資料進行整合,為學(xué)者提供了便捷的檢索和利用途徑。但總體來看,覆蓋范圍廣、持續(xù)時間久、受益人群多、跨學(xué)科跨系統(tǒng)的綜合項目還不多,數(shù)據(jù)開放還存在學(xué)科壁壘、政策滯后、區(qū)域差異等障礙。為了推動我國信息資源管理領(lǐng)域數(shù)字人文研究的發(fā)展,可以借鑒國外相關(guān)經(jīng)驗,結(jié)合“一帶一路”等國際國內(nèi)重大戰(zhàn)略,加大對數(shù)字人文研究的政策支持力度,引導(dǎo)和鼓勵學(xué)術(shù)組織和政府部門共同參與數(shù)字人文研究。例如,歐盟資助的“數(shù)字人文歐洲”項目,整合歐洲各國數(shù)字人文資源,推動跨學(xué)科研究;美國國家科學(xué)基金會支持的“數(shù)字人文基礎(chǔ)設(shè)施”項目,為數(shù)字人文研究提供強大的技術(shù)支持。
5.3 創(chuàng)新數(shù)字人文可視化研究
數(shù)字化可視化方面的文獻數(shù)量多達195篇(占比超過 30% ),說明數(shù)字人文研究的發(fā)展離不開技術(shù)方法的支撐。隨著信息技術(shù)的飛速發(fā)展,在信息資源管理領(lǐng)域,技術(shù)創(chuàng)新與數(shù)字人文的結(jié)合將更加緊密,數(shù)字人文研究也將更趨于依賴于先進的技術(shù)手段。未來技術(shù)方法的發(fā)展應(yīng)提高數(shù)據(jù)處理與分析技術(shù)的效率,為研究者提供便捷的研究平臺,提高數(shù)字人文研究的深度和廣度。推動跨領(lǐng)域技術(shù)方法的融合與創(chuàng)新,應(yīng)用數(shù)字化展示、虛擬現(xiàn)實、增強現(xiàn)實等數(shù)字技術(shù)更好地保護、研究和傳播我國寶貴的歷史文化資源,講好中國故事。例如,故宮博物院利用虛擬現(xiàn)實技術(shù),讓觀眾可以在家中“走進”故宮,近距離感受歷史文化的魅力。
5.4拓展數(shù)字人文服務(wù)內(nèi)容
數(shù)字人文為數(shù)字化時代的知識生產(chǎn)和服務(wù)注入了新內(nèi)涵。數(shù)字圖書館作為信息資源管理領(lǐng)域的重要應(yīng)用,將數(shù)字人文理念貫穿于資源建設(shè)、組織、管理與服務(wù)的全過程,通過引入數(shù)字人文技術(shù),如文本挖掘、數(shù)據(jù)可視化、語義關(guān)聯(lián)等提供更加智能化、個性化的知識服務(wù),為用戶提供便捷高效的學(xué)術(shù)研究環(huán)境。美國國會圖書館利用數(shù)字技術(shù)對歷史文獻進行數(shù)字化處理,建立了龐大的數(shù)字化文獻資源庫,為全球研究者提供便捷的在線檢索服務(wù)。在數(shù)字人文視角下,檔案不再僅被視為一種存儲和傳遞的實體,而是被賦予了更深層次的文化、社會和歷史內(nèi)涵。檔案館不僅關(guān)注檔案資源的數(shù)字化,通過數(shù)字人文技術(shù)對檔案資料進行整理、編目、檢索和可視化展示等為歷史研究、文化傳承等領(lǐng)域提供有力支持。同時也致力于構(gòu)建檔案知識圖譜,挖掘檔案之間的關(guān)聯(lián)性,為研究者提供更加豐富和立體的歷史信息。
5.5 推進圖檔博人文資源數(shù)字化
技術(shù)創(chuàng)新為數(shù)字人文研究帶來更多可能性,推動信息資源管理領(lǐng)域的發(fā)展。除此以外,國家政策的支持、法律的完善、文化產(chǎn)業(yè)的繁榮以及社會對高質(zhì)量精神文化產(chǎn)品的需求,都將為數(shù)字人文發(fā)展創(chuàng)造更多的發(fā)展機遇。黨的二十屆三中全會指出,“加快適應(yīng)信息技術(shù)迅猛發(fā)展新形勢,培育形成規(guī)模宏大的優(yōu)秀文化人才隊伍,激發(fā)全民族文化創(chuàng)新創(chuàng)造活力”①數(shù)字人文在文化遺產(chǎn)保護、中華文明標識等方面作用日益重要,然而公眾參與和普及程度還不高。在我國職業(yè)分類大典中雖然尚無專門的數(shù)字人文職業(yè),但涉及數(shù)字內(nèi)容策劃、數(shù)字資產(chǎn)管理、數(shù)字出版、數(shù)字檔案管理等多個方向,尤其是圖檔博等相關(guān)工作人員。因此,可以利用數(shù)字技術(shù)搭建文化遺產(chǎn)保護平臺,鼓勵公眾參與文化遺產(chǎn)的數(shù)字化記錄、傳播和利用,提高公眾參與意識與素養(yǎng)、創(chuàng)新公眾參與方式與手段,如意大利龐貝古城保護項目不僅使用機器狗保護古跡,還面向公眾設(shè)立志愿者項自等;參考國外一些檔案館的眾包模式,邀請公眾參與檔案資料的數(shù)字化和標注工作,既提高檔案資料的利用率和研究范圍,也進一步提高社會效益和社會影響。
5.6加快圖情檔學(xué)科數(shù)字人文轉(zhuǎn)型
跨學(xué)科合作與交融將成為數(shù)字人文未來發(fā)展的關(guān)鍵。在信息資源管理領(lǐng)域,數(shù)字人文領(lǐng)域依托于多學(xué)科的互動融合、知識交流及深度合作,催生了諸多創(chuàng)新的研究路徑,從而促使圖書館學(xué)、情報學(xué)和檔案學(xué)的研究向更縱深和寬廣方向發(fā)展。這種交叉融合不僅能豐富學(xué)科研究內(nèi)容,還能促進學(xué)科間的優(yōu)勢互補,為信息資源管理帶來新的研究視角和方法,也為數(shù)字人文在其他領(lǐng)域的融合發(fā)展路徑提供范式。產(chǎn)學(xué)研協(xié)同創(chuàng)新是推動數(shù)字人文研究發(fā)展的重要途徑,學(xué)術(shù)界應(yīng)與產(chǎn)業(yè)界、政府部門緊密合作,在項目研發(fā)、人才培養(yǎng)、成果轉(zhuǎn)化等方面開展國際國內(nèi)深入合作,實現(xiàn)資源共享、優(yōu)勢互補、深度整合,為行業(yè)培育數(shù)字人文人才和繁榮發(fā)展提供創(chuàng)新驅(qū)動,為我國信息資源管理產(chǎn)業(yè)催生新質(zhì)生產(chǎn)力提供有力支持。
參考文獻:
[1]中國學(xué)位與研究生教育學(xué)會.研究生教育學(xué)科專業(yè)簡介及其學(xué)位基本要求[EB/OL].[2024-07-10]. https://www.acge.org.cn/encyclopediaFront/enterEncyclopediaIndex.
[2]李文琦.數(shù)字人文中的交互式可視化應(yīng)用研究綜述[J].圖書情報知識,2022.39(5):42-55.
[3]劉麗萍.數(shù)字人文時代外國文學(xué)批評實踐研究[J].語言與文化研究,2024,32(5):224-227.
[4]付雅明,劉煒,祝蕊.東亞文明的數(shù)字未來:2023論壇,2024,44(5):153-161.
[5]段青玉,王曉光,梁夢麗.文史研究生的數(shù)字人文學(xué)術(shù)動機、需求與學(xué)術(shù)原語[J].圖書情報知識,2023,40(1):124-136.
[6]劉煒,劉越男,王曉光,等.建構(gòu)中國自主數(shù)字人文知識體系的使命與路徑[J].數(shù)字人文研究,2022,2(4):3-13.
[7]徐永明,張世海.中國數(shù)字人文:發(fā)展現(xiàn)狀、核心問題與多維價值:浙江大學(xué)文學(xué)院徐永明教授訪談實錄[J].數(shù)字出版研究,2024,3(2):10-17.
[8]劉佳,張心祺,張承坤.基于人文計算的藏醫(yī)古籍服務(wù)平臺知識服務(wù)功能設(shè)計研究[J].現(xiàn)代情報,2023,43(11):47-57.
[9]王春迎,王舒芳,姬恒,等.FamilySearch家譜資源數(shù)字化開發(fā)利用實踐及啟示[J].數(shù)字圖書館論壇,2023,19(8):34-43.
[10]孟令國,李芙蓉.法國數(shù)字人文中心建設(shè)特點及啟示[J].圖書館工作與研究,2023(10):39-46,76.
[11]吳利俊,辛繼賓,宋元明.數(shù)字人文研究概念、學(xué)科和熱點的演變與趨勢[J].圖書館理論與實踐,2023(4):104-112.
[12]楊艷.全球數(shù)字人文教育全景:基于schools高校的調(diào)查研究[J].山西檔案,2024(4):119-122.
[13]張海,陳宇軒,王東波.信息資源管理領(lǐng)域數(shù)字人文研究特征、研究體系及構(gòu)建路徑[J].情報理論與實踐,2024,47(2):70-76.
[14]王麗華,駱雨辰.數(shù)字人文領(lǐng)域主題熱點與演化趨勢:基于ADHO數(shù)字人文年會論文的分析[J].圖書情報工作,2024,68(13):15-27.
[15]王思婕,王濤.數(shù)字人文視域下的跨國史研究:以馬克斯·韋伯基金會下屬德國海外人文機構(gòu)為例[J].全球史評論,2023(2):55-81.
[16]曾江峰,黃泳潼,陳靜怡,等.面向融合出版技術(shù)的主題演化研究[J].數(shù)字圖書館論壇,2023,19(4):9-18.
[17]王日芬,劉佳寧,王柳虹,等.高質(zhì)量發(fā)展背景下科技新聞主題識別及其熱點演化分析[J].情報理論與實踐,2023,46(5):107-116.
[18]曹樹金,曹茹燁.基于研究主題和引文分析的信息資源管理學(xué)科發(fā)展探究[J].信息資源管理
[19]嚴實蓮,盧益清.基于在線評論的家具供應(yīng)商服務(wù)質(zhì)量影響研究[J].物流科技,2023,46(7):48-50.
[20]邵浩,張凱,李方圓,等.從零構(gòu)建知識圖譜:技術(shù)、方法與案例[M].北京:機械工業(yè)出版社,2021:1-18.
[21]GROOTENDORST M.BERTopic: neural topicmodeling with a class-based TF-IDF procedure[EB/OL].(2022-03-11)[2024-09-28]. https://arxiv.0rg/pdf/2203.05794.pdf.
[22]羅煜楚,吳昊,郭宇涵,等.數(shù)字人文中的可視化[J].大數(shù)據(jù),2022,8(6):74-93.
[23]蘇志芳,周芬,唐睿.美國高校圖書館數(shù)字學(xué)術(shù)服務(wù)平臺建設(shè)現(xiàn)狀及啟示[J].圖書館學(xué)研究,2023(8):88-101.
[24]王業(yè)成.iSchools高校數(shù)字人文教育現(xiàn)狀研究及啟示[D].福建:福建師范大學(xué),2022:15-28.
[25]張旭,洪逸暄,尤劍.我國數(shù)字人文研究熱點與趨勢[J].圖書館工作與研究,2023(10):69-76.
[26]張強,高勁松,龍家慶,等.基于知識重構(gòu)的詞人時空情感軌跡可視化研究:以辛棄疾為例[J].情報學(xué)報,2023,42(6):729-739.
[27]王春迎,王舒芳,姬恒,等.FamilySearch家譜資源數(shù)字化開發(fā)利用實踐及啟示[J].數(shù)字圖書館論壇,2023,19(8):34-43.
[28]唐燕,劉小榕,李健.智慧圖書館空間再造與數(shù)字人文服務(wù)創(chuàng)新研究[J].圖書館,2020(5):74-80.
[29]周文泓,劉靜.數(shù)字人文和圖書情報與檔案管理的雙向構(gòu)建要點研究[J]圖書與情報,2019(6):101-110.
[30]劉朔宇,袁曦臨.iField視域下信息資源管理學(xué)科的研究領(lǐng)域定位思考:基于數(shù)字人文研究的實證分析[J].圖書館建設(shè),2024(3):50-59.顧青上海大學(xué)《秘書》編輯部主任。上海,200444。
張夢蕓上海大學(xué)文化遺產(chǎn)與信息管理學(xué)院碩士研究生。上海,200444。
談潔上海圖書館(上海科學(xué)技術(shù)情報研究所)副研究館員。上海,200031。
(收稿日期:2024-10-30編校:董瑩,謝艷秋)