分類號 G251DOI10.16810/j.cnki.1672-514X.2025.06.010
摘要 論文針對業(yè)界有關(guān)“古籍保護(hù)”主題的學(xué)術(shù)成果,使用基于深度學(xué)習(xí)的無監(jiān)督集群學(xué)習(xí)主題識別方法,旨在梳理國內(nèi)該領(lǐng)域的研究熱點(diǎn)與分布,為古籍保護(hù)研究提供參考。從中國知網(wǎng)(CNKI)數(shù)據(jù)庫中總共下載2973條記錄,利用BERTopic模型進(jìn)行主題建模與關(guān)鍵信息提取。通過研究主題的主題詞分布揭示古籍保護(hù)工作的內(nèi)在主題結(jié)構(gòu)和重要內(nèi)容,結(jié)合主題演化分析結(jié)果,提出國內(nèi)古籍保護(hù)工作發(fā)展意見。
Analysis of the Research Progress of Ancient Books Protection in China Based on BERTopic Model
Wang Weizheng, Qiao Hong,Li Xiaojun,Wang Jingjing, Xue Chaohui
AbstractBased on the academic achievements of the industry on the theme of“ancient book protection”,the unsupervised clusterlearning topic recognition method basedon deep learning algorithm is used to sortout the research hotspots and distribution inthis field in China,soas to provide reference fortheresearch of ancientbook protection.A total of 973 records were downloaded from the CNKIdatabase,andthe BERTopic model was used for topic modeling and key information extraction.The internal theme structureand important contentof ancient book protection work are revealed bystudying the subject word distributionof the theme.Itidentifies2Oresearch topics,which can be divided into three clusters: traditionalarchivesresearch,electronicarchives research,and natural disasterimpactonliterature research.Finally,combined with theresultsof theme evolution analysis,this paperputs forward some suggestions on the development of ancient book protection in China.
KeywordsProtection of ancient books.Research topics.BERTopic.Topic mining.Research progress.
隨著我國古籍保護(hù)工作的不斷發(fā)展,2000年之后“國家重點(diǎn)檔案保護(hù)與搶救”和“古籍保護(hù)計劃”[2等古籍保護(hù)項目的開展,極大促進(jìn)了我國文獻(xiàn)遺產(chǎn)的保存和保護(hù)工作的規(guī)范化。相關(guān)學(xué)者也開始對古籍保護(hù)工作研究全景進(jìn)行了闡釋,通過定量和定性方法探析了我國古籍保護(hù)工作的研究現(xiàn)狀。然而,現(xiàn)有研究大多是從古籍保存、檔案保存或紙質(zhì)文物保存的單一角度出發(fā),使用文獻(xiàn)計量工具對數(shù)據(jù)進(jìn)行分析,很少涉及面向文本內(nèi)容的深度知識發(fā)現(xiàn),對古籍保護(hù)研究工作的研究現(xiàn)狀缺乏系統(tǒng)分析,難以準(zhǔn)確掌控整體研究主題結(jié)構(gòu)特征。為解決以上問題,本研究以中國知網(wǎng)為數(shù)據(jù)源,使用BERTopic主題模型挖掘并分析國內(nèi)古籍保護(hù)工作研究的結(jié)構(gòu)特征,深度歸納了古籍保護(hù)研究的主題結(jié)構(gòu)和研究熱點(diǎn),對學(xué)界系統(tǒng)把握研究體系、選擇合適的研究方向具有重要的參考價值。
1文獻(xiàn)綜述
我國古籍保護(hù)工作現(xiàn)有成果可歸納為四類。一是國內(nèi)古籍保護(hù)工作發(fā)展歷程綜述,例如肖媚媚回顧了我國古籍保護(hù)政策,分析了現(xiàn)有古籍保護(hù)工作存在的問題,從數(shù)字人文角度提出了未來古籍保護(hù)的工作方向3;趙躍等作者對我國非物質(zhì)文化遺產(chǎn)保護(hù)與傳承工作進(jìn)行回顧,針對目前我國非遺數(shù)字化發(fā)展困境提出建議4;劉偉成以湖北省圖書館為例,展示了新時代背景下的古籍保護(hù)與實踐的工作機(jī)制5。二是國內(nèi)古籍保護(hù)理論和學(xué)科建設(shè)總結(jié),例如宋鵬梳理了國內(nèi)紙質(zhì)文獻(xiàn)修復(fù)與實踐的發(fā)展歷程,充分認(rèn)識了當(dāng)前紙質(zhì)文獻(xiàn)保護(hù)工作的發(fā)展?fàn)顩r,為未來的文獻(xiàn)保護(hù)工作提供了有力的支持和指導(dǎo);張美芳對圖書、文物、檔案保護(hù)的學(xué)科整合問題進(jìn)行了探討,構(gòu)建了一個三維度的專業(yè)人才培養(yǎng)體系。三是分析我國古籍保護(hù)領(lǐng)域的技術(shù)成果,例如,趙淑梅對我國檔案修復(fù)技術(shù)的主要成果進(jìn)行分類,并總結(jié)了這些技術(shù)成果的發(fā)展趨勢;彭道友從傳統(tǒng)技藝創(chuàng)新的角度論述了“紙漿修復(fù)技術(shù)\"的內(nèi)涵與表現(xiàn)形式;張珂探究了季銨型瓜爾膠在紙質(zhì)文獻(xiàn)加固工作中的應(yīng)用,為實現(xiàn)古籍資料“修舊如舊\"提供了新技術(shù)。四是對古籍工作不足的總結(jié),有學(xué)者提出了古籍?dāng)?shù)字化過程中的古籍保護(hù)問題;史偉等分析了古籍資源轉(zhuǎn)化存在的諸多問題[2;楊光輝探討了高等院校“古籍活化”存在的問題[13]。
從文獻(xiàn)主題知識發(fā)現(xiàn)采用的研究方法來看,傳統(tǒng)方法如關(guān)鍵詞網(wǎng)絡(luò),往往只基于詞頻或者數(shù)據(jù)進(jìn)行信息挖掘,無法體現(xiàn)整個文獻(xiàn)的語境、捕捉詞語之間的復(fù)雜關(guān)系。隨著人工智能技術(shù)的不斷發(fā)展,學(xué)者開始使用文本挖掘技術(shù)對科技文獻(xiàn)進(jìn)行深入研究。SHARMA等使用結(jié)構(gòu)主題建模(STM)全面概述1970—2019年信息管理領(lǐng)域的研究進(jìn)展,揭示了信息管理領(lǐng)域的熱點(diǎn)主題與研究方向[14]。Lin等使用文本挖掘方法潛在語義分析(LSA)對社會商務(wù)研究現(xiàn)狀進(jìn)行了總結(jié),確定了社會商務(wù)領(lǐng)域的主要研究主題和課題,為未來的研究提供指導(dǎo)[15]。劉江峰等以圖書情報領(lǐng)域期刊為例,根據(jù)文獻(xiàn)句子的語義特征使用BERT模型進(jìn)行關(guān)鍵語句的識別,最終有效地挖掘出圖書情報領(lǐng)域的新興主題[1]。崔旭等使用LDA主題模型對我國檔案館官網(wǎng)和非遺保護(hù)中心的新聞報道進(jìn)行文本挖掘,通過對比分析發(fā)現(xiàn)了檔案館在非遺保護(hù)中存在的諸多問題[17]。
值得說明的是,文本挖掘是一種新型的知識發(fā)現(xiàn)技術(shù),已經(jīng)廣泛應(yīng)用在科技文獻(xiàn)分析中,它使研究人員能夠檢查非結(jié)構(gòu)化文本,并從文本數(shù)據(jù)集合中提取以前未知的、可理解的、潛在的和觀察到的模式或知識,從而更好地理解文獻(xiàn)的內(nèi)容和主題。BERTopic作為一種深度學(xué)習(xí)主題模型,可以將單詞表示為多維向量并捕獲上下文信息,從而產(chǎn)生更準(zhǔn)確、更豐富的特征。Grootendorst證明了該方法在主題識別方面的有效性[18],因此我們采用BERTopic模型來高效地進(jìn)行主題識別。
基于此,本研究使用文本挖掘技術(shù)中自下而上的無監(jiān)督主題建模技術(shù)BERTopic,基于期刊論文、學(xué)位論文、會議論文等多源異構(gòu)數(shù)據(jù)集,通過數(shù)據(jù)清洗、去停用詞、分詞等方法,使用BERTopic模型中的all-MiniLM-L6-v2提取文獻(xiàn)數(shù)據(jù)集的詞向量,通過BERT嵌入、統(tǒng)一面域逼近和投影(UMAP)、HDB-SCAN聚類算法及c -TF-IDF創(chuàng)建主題類團(tuán),最大限度保留了主題中的重要詞匯。相較傳統(tǒng)的主題模型如潛在語義分析(LSA)和結(jié)構(gòu)主題建模(STM),BERTopic主題模型能更好地理解詞語的語義并考慮上下文信息,更準(zhǔn)確地捕獲詞語之間的語義關(guān)系。
2研究設(shè)計及主題識別
本研究選擇中國知網(wǎng)(CNKI數(shù)據(jù)庫作為古籍保護(hù)工作研究相關(guān)文獻(xiàn)的數(shù)據(jù)源,檢索式為:SU%= “文獻(xiàn)保存”O(jiān)R SU%= “文獻(xiàn)修復(fù)”O(jiān)RSU%= “紙張保存”O(jiān)R SU%= “紙張修復(fù)”O(jiān)RSU%= “書籍保存”O(jiān)R SU%= “書籍修復(fù)” ORSU%= “圖書保存”O(jiān)R SU%= “古籍保存” ORSU%= “古籍修復(fù)”O(jiān)R SU%= “檔案保存”O(jiān)RSU%= “檔案修復(fù)”O(jiān)R SU%= “紙文物保存”O(jiān)RSU%= “紙文物修復(fù)”,時間跨度為1955年1月1日至2023年10月20日。檢索的文獻(xiàn)類型包括“期刊論文”“博士論文”“碩士論文”“國內(nèi)會議論文”,共獲得4393條結(jié)果。
為了精準(zhǔn)提煉文獻(xiàn)中的相關(guān)主題,本研究使用基于深度學(xué)習(xí)的BERTopic主題識別算法對古籍保護(hù)領(lǐng)域的論文進(jìn)行主題挖掘。與傳統(tǒng)的主題模型如潛在語義分析(LSA)和結(jié)構(gòu)主題建模(STM)相比,BERTopic主題模型具有更強(qiáng)的語義表達(dá)能力,可以更好地捕捉上下文中的語義信息,從而更準(zhǔn)確地識別和組織主題。先剔除搜索結(jié)果中的“問題”文獻(xiàn),再使用Jieba分詞等工具包對數(shù)據(jù)集中的文獻(xiàn)進(jìn)行摘要預(yù)處理,預(yù)處理工作包括分詞、去停用詞、詞頻統(tǒng)計、刪除無意義高頻詞等。剔除不相關(guān)文獻(xiàn)后,得到3345篇,接下來由兩名古籍專業(yè)的研究生共同篩選出符合古籍保護(hù)研究的文獻(xiàn),最終將篩選后的2973篇文獻(xiàn)作為研究數(shù)據(jù)集。
針對預(yù)處理后的文獻(xiàn)數(shù)據(jù),首先使用BERT模型對文本進(jìn)行嵌人,通過Stence—Transformer將文本轉(zhuǎn)換為嵌人向量;然后通過UMAP算法將高維嵌入向量降維到低維空間,降低嵌入后的維度,以便之后再使用HDB一SCAN算法對降維后的嵌入向量進(jìn)行密度聚類,得到不同的主題詞;最后,通過c—TF—IDF計算聚類中詞的重要性,然后根據(jù)最大邊際相關(guān)性提取出與主題相關(guān)的候選詞,并生成主題特征詞分布圖、研究主題的潛在層次結(jié)構(gòu)圖、主題相似度圖、文檔一主題分布圖等,進(jìn)而分析國內(nèi)古籍保護(hù)工作主題分布特征與研究進(jìn)展。
對于BERTopic主題模型,首先使用了更大的中文語料庫進(jìn)行預(yù)訓(xùn)練,使其具有更好的性能。預(yù)訓(xùn)練模型使用“RoBERTa-wwm-ext”[19],該模型是在BERT基礎(chǔ)上進(jìn)一步優(yōu)化的RoBERTa模型。經(jīng)過多輪實驗對比與查找文獻(xiàn),將UMAP維度(n_components設(shè)置為5;距離計算方式(metric)設(shè)置為cosine,使用余弦相似度計算點(diǎn)與點(diǎn)的距離;點(diǎn)與點(diǎn)之間的最小距離(min_dist)設(shè)置為0.01,使文檔嵌入效果更加緊密;將最小聚類規(guī)模(min_cluster_size)設(shè)置為20;最小樣本(min_samples)設(shè)置為10,這樣就避免了小集群數(shù)據(jù)的噪聲影響;將主題數(shù)(nr_topics)設(shè)置為“auto”,與不限定主題數(shù)目的兩組結(jié)果進(jìn)行對比,對聚類結(jié)果進(jìn)行合并。此外,我們使用(2,3)的n元語法范圍,并選擇頂部特征詞進(jìn)行輸出,而其余參數(shù)則設(shè)置為默認(rèn)值。
根據(jù)主題建模設(shè)計,在對數(shù)據(jù)集摘要進(jìn)行關(guān)鍵詞分析的基礎(chǔ)上,共識別出20個主題。以條形圖的形式顯示這20個主題,并展示它們的特征詞,如圖1所示。
3我國古籍保護(hù)工作研究主題分布
從圖1可以發(fā)現(xiàn),“檔案保護(hù)\"“檔案修復(fù)”“古籍修復(fù)\"等主題詞在多個主題下有重疊,這些主題詞分布廣泛也從側(cè)面說明了我國古籍保護(hù)工作研究的熱點(diǎn)。同時,某些重復(fù)的主題詞在不同主題中分布,說明這些主題詞在不同的上下文中具有不同的含義。這不僅增加了主題模型的魯棒性,也可以幫助我們更好地理解文本數(shù)據(jù)中的潛在主題,并揭示出不同主題之間的關(guān)聯(lián)性,提供更豐富和準(zhǔn)確的主題分析結(jié)果。根據(jù)圖1,可以看出國內(nèi)古籍保護(hù)工作大致包括以下幾個主題:檔案保護(hù)與開發(fā)、數(shù)字檔案長期保存、非物質(zhì)文化遺產(chǎn)保護(hù)、古籍保護(hù)技術(shù)、科學(xué)技術(shù)研究、古代科技文獻(xiàn)修復(fù)、中國特色檔案學(xué)、檔案修復(fù)技術(shù)、自然災(zāi)害對檔案影響研究等。
3.1研究主題聚類集群分析
對這些主題進(jìn)行歸類,可以分為古籍?dāng)?shù)字化、古籍修復(fù)與保護(hù)技術(shù)、古籍環(huán)境控制、數(shù)字檔案保存等研究方向。從這些主題聚類來看,其中,電子檔案保護(hù)、檔案保護(hù)與開發(fā)、數(shù)字檔案長期保存是出現(xiàn)概率最高的主題。另外,通過交互式主題圖譜可知我國古籍保護(hù)工作主要分為三個研究集群。
(1)我國傳統(tǒng)檔案研究:包含Topic1(檔案保護(hù)與開發(fā))、Topic4(非物質(zhì)文化遺產(chǎn)保護(hù))Topic15(國家檔案)、Topic17(城市檔案)Topic18(古代科技文獻(xiàn)修復(fù))、Topic19(中國特色檔案學(xué))等主題,該集群研究主要內(nèi)容是對中國傳統(tǒng)檔案的收集、整理、保護(hù)、修復(fù)和利用,以建立完整的中國特色檔案學(xué)研究體系,滿足中國歷史研究和文化傳承的需要。
(2)我國電子檔案研究:Topic0(電子檔案保護(hù))Topic2(數(shù)字檔案長期保存)Topic3(古籍保護(hù)技術(shù))Topic10(信息系統(tǒng))Topic13(檔案修復(fù)技術(shù))等主題,隨著信息技術(shù)的發(fā)展,越來越多的檔案以電子形式存儲,電子檔案研究成了一個重要的研究課題。
(3)自然災(zāi)害對文獻(xiàn)影響研究:Topic5(濕溫度對檔案庫房影響研究)、Topic14(自然災(zāi)害對檔案影響研究),這類集群研究主要是通過對自然環(huán)境和歷史上自然災(zāi)害事件的分析,探討其對文獻(xiàn)的破壞和保護(hù)的影響,有利于文獻(xiàn)保護(hù)部門制定更加科學(xué)合理的文化遺產(chǎn)保護(hù)措施。
3.2 主題內(nèi)容關(guān)聯(lián)度分析
為識別主題的潛在層次結(jié)構(gòu),本研究使用層次聚類scipy.cluster.hierarchy庫,將主題之間潛在的關(guān)聯(lián)和組織模式可視化20,結(jié)果如圖2所示。從圖2中可以清晰地觀察到各主題潛在的關(guān)聯(lián)和組織模式,例如Topic3(古籍保護(hù)技術(shù))和Topic16(紙質(zhì)文物保護(hù))有緊密關(guān)聯(lián),有學(xué)者探究了化學(xué)保護(hù)技術(shù)在紙質(zhì)文物保護(hù)工作中的應(yīng)用情況,對脫酸劑和纖維素等脫酸與加固工作中的新材料進(jìn)行總結(jié)歸納2;Topic6(紙質(zhì)檔案)和Topic13(檔案修復(fù)技術(shù))有直接關(guān)聯(lián),有研究對我國紙質(zhì)檔案修復(fù)技術(shù)文獻(xiàn)進(jìn)行了統(tǒng)計分析,回顧了傳統(tǒng)修復(fù)技術(shù)與現(xiàn)代修復(fù)技術(shù)的發(fā)展路徑;Topic10(信息系統(tǒng))和Topic2(數(shù)字檔案長期保存)有間接聯(lián)系,有學(xué)者為保證數(shù)字檔案的安全保存,通過聯(lián)盟區(qū)塊鏈和公有區(qū)塊鏈管理電子檔案信息,構(gòu)建了一個數(shù)字檔案管理信息系統(tǒng)[22]。
3.3研究主題相似度分析
為更好地分析和解釋主題模型的結(jié)果,本研究基于余弦相似度計算了每個主題之間的相似度,并通過seaborn庫將相似度矩陣轉(zhuǎn)化為熱力圖。熱力圖中的顏色深淺反映了主題之間的相似度大小,如圖3所示。通過觀察圖3,我們可以更加直觀地了解主題之間的區(qū)別,如哪些主題比較相似,哪些主題差異較大。
圖2研究主題潛在關(guān)聯(lián)和組織模式可視化圖譜
圖3主題相似度熱力圖
從圖3中可知,Topic1(檔案保護(hù)與開發(fā))和Topic19(中國特色檔案學(xué)),這兩個主題之間具有較高的相似度,這是是因為中國特色檔案學(xué)是對檔案保護(hù)與開發(fā)的一種研究方法和理論體系,它強(qiáng)調(diào)了檔案保護(hù)與開發(fā)的文化價值和社會功能,提出了許多具有中國特色的檔案保護(hù)與開發(fā)的方法和理念,如“以人為本”“文化自信\"等[23]。因此,這兩個主題都會涉及檔案保護(hù)與開發(fā)的相關(guān)內(nèi)容,使得它們之間具有較高的相似度。
TopicO(電子檔案保護(hù))和Topic7(非物質(zhì)文化遺產(chǎn)檔案),這兩個主題相似度較高是因為電子檔案保護(hù)和非物質(zhì)文化遺產(chǎn)檔案都屬于檔案保護(hù)領(lǐng)域中的一個重要分支,都涉及檔案的數(shù)字化、存儲、管理和保護(hù)等方面。此外,非物質(zhì)文化遺產(chǎn)也可以通過數(shù)字化手段進(jìn)行保護(hù)和傳承[24],因此這兩個主題之間具有較高的相似度。
Topic18(古代科技文獻(xiàn)修復(fù))和Topic19(中國特色檔案學(xué)),這兩個主題相似是因為古代科技文獻(xiàn)修復(fù)和中國特色檔案學(xué)都屬于檔案保護(hù)與開發(fā)領(lǐng)域中的重要分支,都涉及檔案保護(hù)與開發(fā)的相關(guān)內(nèi)容。同時,古代科技文獻(xiàn)修復(fù)也需要借鑒中國傳統(tǒng)文化中的修復(fù)技術(shù)和理念25,因此這兩個主題之間具有較高的相似度。
與以上主題相反,Topic3(古籍保護(hù)技術(shù))和Topic4(非物質(zhì)文化遺產(chǎn)保護(hù))與所有主題相似度都非常低。這是因為Topic3(古籍保護(hù)技術(shù))更側(cè)重于古籍保護(hù)的技術(shù)方面,如數(shù)字化修復(fù)、光學(xué)掃描、纖維素使用等2。而其他主題可能更加關(guān)注古籍保護(hù)的文化價值、歷史意義等,這種不同的關(guān)注點(diǎn)導(dǎo)致Topic3(古籍保護(hù)技術(shù))與其他主題之間的相似度較低;Topic4(非物質(zhì)文化遺產(chǎn)保護(hù))側(cè)重于非物質(zhì)文化遺產(chǎn)的保護(hù),如傳統(tǒng)技藝、民俗文化等[27]。
3.4文檔一主題分布圖譜分析
為探索文本數(shù)據(jù)中不同主題下文檔分布的關(guān)系與特征,更好地理解文本數(shù)據(jù)中主題的分布情況,我們使用topic_model.visualize_documents函數(shù)將文本數(shù)據(jù)轉(zhuǎn)換為二維平面上的散點(diǎn)圖,得到文檔一主題分布圖譜,如圖4所示。
圖4中每個散點(diǎn)代表一個文檔,通過不同的顏色和形狀等參數(shù),將不同主題的文檔區(qū)分開來,從中可以看出,國內(nèi)古籍保護(hù)工作集中在TopicO(電子檔案保護(hù))、Topic1(檔案保護(hù)與開發(fā))、Topic2(數(shù)字檔案長期保存)、Topic13(檔案修復(fù)技術(shù))等研究主題,尤其是Topic0(電子檔案保護(hù))和Topic1(檔案保護(hù)與開發(fā))是研究數(shù)量最多的主題類團(tuán)。這也從側(cè)面說明,隨著數(shù)字化技術(shù)的不斷發(fā)展,越來越多的檔案被數(shù)字化保存和傳播,因此電子檔案保護(hù)也成了研究者們關(guān)注的重要問題2,而傳統(tǒng)檔案也一直是檔案保護(hù)與開發(fā)領(lǐng)域中的重要研究對象[29]。
4主題挖掘和進(jìn)展分析結(jié)果
本研究基于深度學(xué)習(xí)算法的無監(jiān)督集群學(xué)習(xí)方法Bertopic模型,探究了我國古籍保護(hù)工作研究主題和研究進(jìn)展。通過研究主題識別,發(fā)現(xiàn)了傳統(tǒng)檔案研究、電子檔案研究、自然災(zāi)害對文獻(xiàn)影響研究等三個主要集群;利用主題內(nèi)容識別,發(fā)現(xiàn)了國內(nèi)古籍保護(hù)工作的主要研究方向;使用層次聚類法,識別出主題的潛在層次結(jié)構(gòu)和各主題潛在的關(guān)聯(lián)和組織模式;運(yùn)用主題相似度熱力圖,更好地分析和解釋了主題模型的結(jié)果。對此,從上述分析結(jié)果歸納出如下結(jié)論。
4.1技術(shù)應(yīng)用于古籍保護(hù)的研究發(fā)展迅速
科技的不斷進(jìn)步,為古籍保護(hù)提供了更多的工具和手段,例如TopicO(電子檔案保護(hù))Topic2(數(shù)字檔案長期保存)、Topic3(古籍保護(hù)技術(shù))和Topic13(檔案修復(fù)技術(shù))等主題在古籍保護(hù)研究中占有較大比例。這主要體現(xiàn)在兩方面:一方面,應(yīng)用現(xiàn)代科學(xué)(物理、化學(xué)、生物和材料學(xué)等學(xué)科)技術(shù)可以通過非侵入性或微創(chuàng)性的手段3%,對古籍的載體和內(nèi)容進(jìn)行外部干預(yù),實現(xiàn)原生性保護(hù),并延長其壽命;另一方面,數(shù)字化技術(shù)可以對古籍進(jìn)行高效、精確的數(shù)字化處理,避免使用者不斷損傷實物,同時也為古籍的傳承和研究提供了更多的便利[3]。
4.2有關(guān)古籍保護(hù)的管理工作研究不足
傳統(tǒng)的古籍保護(hù)工作往往只關(guān)注古籍內(nèi)部的保護(hù),而忽視了管理工作中的外部社會環(huán)境影響。例如Topic19(中國特色檔案學(xué))主題熱點(diǎn)非常低,說明我國古籍保護(hù)研究體系并不規(guī)范,缺乏相關(guān)政策、法規(guī)和規(guī)范的支持。古籍保護(hù)工作的不規(guī)范和非制度化,社會環(huán)境的惡劣和法治環(huán)境的欠缺,則會增加古籍被盜、被毀等風(fēng)險,這些問題都會對古籍保護(hù)工作造成不良影響[32]
4.3數(shù)字人文和數(shù)字記憶研究是古籍保護(hù)工作研究的焦點(diǎn)
數(shù)字人文和數(shù)字記憶技術(shù)的應(yīng)用為古籍保護(hù)工作提供了更加高效、準(zhǔn)確、全面的解決方案。當(dāng)前,數(shù)字人文工作受到了高度重視,特別是2003年聯(lián)合國教科文組織發(fā)布的《數(shù)字遺產(chǎn)保護(hù)憲章》和聯(lián)合國教科文組織大會通過的《關(guān)于保存和獲取包括數(shù)字遺產(chǎn)在內(nèi)的文獻(xiàn)遺產(chǎn)的建議書》引發(fā)了我國對數(shù)字遺產(chǎn)保護(hù)的關(guān)注。例如Topic0(電子檔案保護(hù))、Topic2(數(shù)字檔案長期保存)、Topic11(數(shù)字化處理)等主題成為古籍保護(hù)領(lǐng)域的研究熱點(diǎn)。數(shù)字人文以數(shù)字技術(shù)為基礎(chǔ),將人文學(xué)科的研究對象進(jìn)行數(shù)字化處理,并通過計算機(jī)技術(shù)進(jìn)行管理、分析和展示[33]。在古籍保護(hù)工作中,數(shù)字人文技術(shù)可以對古籍進(jìn)行高效、精確的數(shù)字化處理,從多學(xué)科角度實現(xiàn)了對古籍內(nèi)容的全面、系統(tǒng)化的管理和研究[34。數(shù)字記憶技術(shù)將物質(zhì)文化遺產(chǎn)、非物質(zhì)文化遺產(chǎn)等遷移到網(wǎng)絡(luò)資源庫中,有助于提高可訪問性,方便研究與學(xué)習(xí),促進(jìn)數(shù)據(jù)共享與合作[35]。同時,數(shù)字記憶技術(shù)還可以為古籍保護(hù)工作提供新的安全保障和備份手段,避免了傳統(tǒng)古籍保存方式中可能出現(xiàn)的丟失、損毀等問題。
5古籍保護(hù)學(xué)科發(fā)展建議
我國歷來重視古籍保護(hù)工作,2007年,國務(wù)院辦公廳出臺了《關(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見》,強(qiáng)調(diào)了古籍保護(hù)的重要性,提出了加強(qiáng)古籍保護(hù)工作的指導(dǎo)意見和措施。2022年,國務(wù)院辦公廳印發(fā)《關(guān)于推進(jìn)新時代古籍工作的意見》,強(qiáng)調(diào)在新時代背景下,古籍保護(hù)對傳承中華優(yōu)秀傳統(tǒng)文化、促進(jìn)文化繁榮具有重要意義。由此,根據(jù)本文分析的結(jié)論,對古籍保護(hù)學(xué)科發(fā)展提出如下建議。
5.1加強(qiáng)與自然科學(xué)的融合與滲透
由于古籍文獻(xiàn)自身的脆弱性,以及利用不當(dāng)或環(huán)境不適宜造成的各種損害,許多古籍正在老化、破損甚至無法使用,造成了古籍文獻(xiàn)永久價值和壽命有限之間的基本矛盾。因此,筆者認(rèn)為應(yīng)擴(kuò)大古籍保護(hù)研究的跨學(xué)科交流與融合范圍,加強(qiáng)與物理、化學(xué)、生物和材料學(xué)等自然學(xué)科的協(xié)同合作,共同解決古籍保護(hù)所面臨的多樣而嚴(yán)峻的挑戰(zhàn)。例如,借助生物學(xué)技術(shù),可探索古籍中可能存在的生物侵害問題,進(jìn)一步實施有針對性的防治措施。實際上,為應(yīng)對老化、破損與文獻(xiàn)使用的矛盾,尋找最合適的方法搶救和保存有價值的人類記錄和文件,保持人類記憶的完整性,1960年開始,我國一批來自生物學(xué)、化學(xué)、物理學(xué)等學(xué)科領(lǐng)域的學(xué)者就加入了古籍保護(hù)工作。當(dāng)下,更應(yīng)該不斷打破生物、化學(xué)、材料學(xué)和計算機(jī)科學(xué)的學(xué)科壁壘,從以人為本的角度,利用古籍保護(hù)學(xué)科的研究思維,梳理研究問題的內(nèi)在邏輯。對其他學(xué)科關(guān)于文物保存的研究問題,運(yùn)用先進(jìn)的分析技術(shù),例如質(zhì)譜、光譜學(xué),對古籍材料的成分進(jìn)行深入分析,以制定更為有效的保存策略。同時,要勇于探索新的、適用于各種情境的理論和方法體系,將學(xué)科內(nèi)的理論和方法應(yīng)用于具體的文化遺產(chǎn)保護(hù)實踐中,通過數(shù)字技術(shù)的運(yùn)用,建立虛擬檔案,實現(xiàn)古籍的數(shù)字化保存和傳承。此外,參考其他學(xué)科的建設(shè)經(jīng)驗,可以考慮新增特定于古籍保護(hù)的二級學(xué)科,研究如何將先進(jìn)的古籍保護(hù)知識應(yīng)用于不同的文化和歷史背景,提高學(xué)科的實用性和適應(yīng)性,推動古籍保護(hù)學(xué)科的前沿發(fā)展。
5.2促進(jìn)古籍保護(hù)領(lǐng)域的制度化建設(shè)
古籍保護(hù)領(lǐng)域的法制建設(shè)工作要以問題為導(dǎo)向,以解決古籍保護(hù)領(lǐng)域存在的突出問題為核心[3。在制定專門的古籍保護(hù)法規(guī)時,要明確各方責(zé)任、義務(wù)和權(quán)利,同時法規(guī)應(yīng)考慮到古籍特有的保存需求。在推進(jìn)古籍保護(hù)領(lǐng)域的法治體系建設(shè)過程中強(qiáng)調(diào)法治教育與宣傳,以提高相關(guān)從業(yè)人員和社會公眾的法治素養(yǎng)。同時,要強(qiáng)調(diào)法治文化的建設(shè),倡導(dǎo)法治思維方式、法治精神,使古籍保護(hù)從業(yè)人員更好地融入法治文化,將法治理念貫徹落實在工作實踐中。
5.3擁抱數(shù)字人文和數(shù)字記憶研究
數(shù)字人文研究的最終目的是服務(wù)于人文研究,解決人文社科中具有現(xiàn)實需求和研究價值的具體問題。從這個角度來看,數(shù)字人文應(yīng)該與古籍保護(hù)領(lǐng)域的具體研究問題緊密結(jié)合,同時,促進(jìn)人文學(xué)者與技術(shù)人員之間的交流,進(jìn)而促進(jìn)古籍保護(hù)領(lǐng)域亟待解決的研究問題,與數(shù)字人文的深度融合[37。在數(shù)字人文研究的初始階段,圖書情報學(xué)、計算機(jī)科學(xué)等資源構(gòu)建與服務(wù)學(xué)科成為數(shù)字人文研究的中流砥柱,這導(dǎo)致歷史、文學(xué)、古籍保護(hù)等領(lǐng)域的人文學(xué)者缺失。為此,人文領(lǐng)域的學(xué)者應(yīng)積極擁抱數(shù)字人文和數(shù)字記憶研究,積極主動學(xué)習(xí)數(shù)字人文領(lǐng)域的相關(guān)技能,深人理解和應(yīng)對數(shù)字人文的發(fā)展趨勢,促進(jìn)古籍保護(hù)工作更好地適應(yīng)數(shù)字時代的需求。
參考文獻(xiàn):
[1]張美芳,唐躍進(jìn).檔案保護(hù)概論[M].北京:中國人民大學(xué)出版社,2013.
[2]趙文友,林世田.“中華古籍保護(hù)計劃”成果:以“中華古籍資源庫”建設(shè)為中心的古籍?dāng)?shù)字化工作[J].新世紀(jì)圖書館,2018(3):12-15.
[3]肖媚媚.政策驅(qū)動的古籍保護(hù)與數(shù)字人文學(xué)思考[J].圖書與情報,2022(2):122-126.
[4]趙躍,吳曉梅,朵婷,等.擁抱文化數(shù)字化戰(zhàn)略:非遺數(shù)字化實踐回顧與前瞻[J].圖書館建設(shè),2023(6):80-87.
[5]劉偉成.凝聚新智,開創(chuàng)新局:湖北省圖書館古籍保護(hù)與創(chuàng)意利用實踐[J].新世紀(jì)圖書館,2024 (6):5-11.
[6]宋鵬.新中國成立以來紙質(zhì)文獻(xiàn)修復(fù)實踐與理論發(fā)展研究[D].沈陽:遼寧大學(xué),2023
[7]張美芳.圖書保護(hù)、檔案保護(hù)、文物保護(hù)學(xué)科整合研究[J].大學(xué)圖書館學(xué)報,2016,34(4):69-73,42.
[8]趙淑梅.數(shù)字時代我國檔案保護(hù)技術(shù)發(fā)展趨勢:基于1987—2015年國家檔案局優(yōu)秀科技成果獎的統(tǒng)計分析[J].檔案學(xué)通訊,2017(2):72-76.
[9]彭道友.基于古籍修復(fù)技藝傳承創(chuàng)新的“紙漿修復(fù)技術(shù)”研究[J].新世紀(jì)圖書館,2021(8):37-40.
[10]張珂.季銨型瓜爾膠在紙質(zhì)文獻(xiàn)加固中的應(yīng)用研究[D].廣州:華南理工大學(xué),2022.
[11] 潘星耀.淺談古籍?dāng)?shù)字化掃描工作需注意的問題[J].新世紀(jì)圖書館,2016(12):60-62.
[12]史偉,李天碩,王宇.新時期古籍資源轉(zhuǎn)化利用工作的若干思考[J].圖書情報工作,2023,67(11):71-76.
[13]楊光輝.關(guān)于高等院?!肮偶罨钡膸讉€問題[J].大學(xué)圖書館學(xué)報,2022,40(3):9-12.
[14] SHARMA A, RANA N P, NUNKOO R. Fifty yearsof information management research: a conceptualstructure analysis using structural topic modeling[J].International Journal of Information Management,2021(58): 102316.
[15]LINX,LIY,WANGX.Social commerce research:definition,research themes and the trends[J].International Journal of Information Management,2016(3): 190-201.
[IU] 小 人 肌不語義特征視角下的期刊新興研究主題發(fā)現(xiàn)[J].情報理論與實踐,2024,47(3):177-187.
[17]崔旭,楊煜,李姍姍.基于LDA模型的我國檔案館非物質(zhì)文化遺產(chǎn)保護(hù)主題挖掘與演化分析:與非遺保護(hù)中心對比視角[J].圖書情報工作,2022,66(23): 82-92.
[18] GROOTENDORST M. BERTopic: neural topicmodeling with a class-based TF-IDF procedure[J/OL].(2022-03-11)[2024-12-01].http://arxiv.org/abs/2203.05794.
[19]CUIY,CHEW,LIUT,etal.Pre-training withwholeword masking for Chinese BERT[J/OL].(2021-11-25)[2024-12-01]. http://rxiv.org/abs/1906.08101v1.
[20]BLEI D M.Probabilistic topic models[J].Communications of the ACM, 2012:5.
[21]韓瑩.近十年來化學(xué)方法在紙質(zhì)文物脫酸與加固方面的應(yīng)用[J].中國國家博物館館刊,2022(6):143-160.
[22]左晉佺,張曉娟.基于信息安全的雙區(qū)塊鏈電子檔案管理系統(tǒng)設(shè)計與應(yīng)用[J].檔案學(xué)研究,2021(2): 60-67.
[23]尹鑫,張斌.論加快構(gòu)建中國特色檔案學(xué)學(xué)術(shù)體系[J].圖書情報知識,2021,38(5):4-14.
[24]趙云海,劉瑞.數(shù)字化時代非物質(zhì)文化遺產(chǎn)知識產(chǎn)權(quán)保護(hù)實踐反思[J].文化遺產(chǎn),2023(2):10-18.
[25]徐擁軍,閆靜.中國特色檔案學(xué)的基本范疇與核心命題[J].中國圖書館學(xué)報,2024,50(3):30-46.
[26]王國強(qiáng).古籍修復(fù)可逆性原則、技術(shù)應(yīng)用策略及實現(xiàn)途徑[J].大學(xué)圖書館學(xué)報,2023,41(1):106-112, 128.
[27]吳興幟,周靈穎.非物質(zhì)文化遺產(chǎn)村落化保護(hù)認(rèn)知研究[J].云南民族大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2023,40(6):72-79.
[28]趙淑梅.數(shù)字時代我國檔案保護(hù)技術(shù)學(xué)學(xué)科發(fā)展走向[J].檔案學(xué)通訊,2016(3):72-76.
[29]任漢中.中國傳統(tǒng)檔案文化問題研究[J].檔案學(xué)研究,2001(3): 8-11.
[30]陶琴.霉菌對檔案的危害及其防治技術(shù)研究進(jìn)展[J].檔案學(xué)通訊,2013(6):90-93.
[31]李世鈺,張向先,沈旺,等.古籍?dāng)?shù)字化國內(nèi)外研究現(xiàn)狀分析與路徑構(gòu)建研究[J].現(xiàn)代情報,2023 43(11)-4-20
[32]李永卉,孫悅帆.建構(gòu)與邊緣:近代中國古籍保護(hù)立法研究[J].圖書館雜志,2023,42(5):116-127.
[33]付雅明,劉煒,祝蕊.東亞文明的數(shù)字未來:2023年哈佛大學(xué)數(shù)字人文國際會議綜述[J]圖書館論壇,2024,44(5):153-160.
[34]劉朔宇,袁曦臨.iField視域下信息資源管理學(xué)科的研究領(lǐng)域定位思考:基于數(shù)字人文研究的實證分析[J].圖書館建設(shè),2024(3):50-59,116.
[35]姜婷婷,傅詩婷.人本視角下的數(shù)字記憶:“人一記憶一技術(shù)”三位一體理論框架構(gòu)建與啟示[]中國圖書館學(xué)報,2022,48(5):103-115.
[36]史偉,王宇,胡萬德.我國古籍保護(hù)法治現(xiàn)狀及相關(guān)政策建議[J].圖書情報工作,2022,66(11):59-65.
[37]于英香.數(shù)字人文研究論爭及思考[J].圖書館雜志,2023,42(2):98-105.
王偉正南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院博士研究生。江蘇南京,210000。
喬鴻山東師范大學(xué)商學(xué)院副教授、碩士生導(dǎo)師。山東濟(jì)南,250358。
李肖俊齊魯工業(yè)大學(xué)(山東省科學(xué)院)情報研究所副研究員。山東濟(jì)南,250014。
王靜靜山東大學(xué)新聞傳播學(xué)院副研究員、碩士生導(dǎo)師。山東濟(jì)南,250100。
薛朝輝空軍指揮學(xué)院研究生大隊碩士研究生。北京,100097。
(收稿日期:2024-04-08編校:曹曉文,陳安琪)