王君
國家文化數(shù)字化戰(zhàn)略的出臺,為圖書館的古籍保護事業(yè)指明了新的方向。本文以國家文化數(shù)字化戰(zhàn)略的內在邏輯和首要任務為出發(fā)點,從資源、管理、服務三個方面指出國家文化數(shù)字化戰(zhàn)略下圖書館古籍保護事業(yè)的發(fā)展方向。以此為基礎,提出文化數(shù)字化戰(zhàn)略視角下古籍保護工作的實踐路徑。
一、國家文化數(shù)字化戰(zhàn)略背景下圖書館古籍保護的緣起
互聯(lián)網(wǎng)技術的飛速發(fā)展讓文化事業(yè)受到了挑戰(zhàn),為滿足數(shù)字時代背景下群眾多樣化的精神文化需求,夯實文化基礎,增加文化供給,2022 年,國家文化數(shù)字化戰(zhàn)略的提出和相關意見的出臺,從國家層面出發(fā),為實現(xiàn)文化產業(yè)生態(tài)保障、文化資源數(shù)字化建設以及文化傳播治理機制提供了方向指引。[1]國家文化數(shù)字化戰(zhàn)略的內在邏輯是以中華文化數(shù)據(jù)庫為文化基礎,將各數(shù)據(jù)庫聯(lián)入國家文化專網(wǎng),從而形成與用戶相連的服務平臺。
國家文化數(shù)字化戰(zhàn)略的首要任務就是要整合零散的數(shù)據(jù)資源,按照統(tǒng)一的格式標準,搭建中華文化數(shù)據(jù)庫。[2]在現(xiàn)代化進程中,圖書館依托數(shù)字圖書館與文化信息資源共享工程,存儲了大量的數(shù)字文化資源,在國家戰(zhàn)略布局中發(fā)揮重要作用。其中,古籍作為國家和民族文化記憶的重要載體,是人類寶貴的文化資源。妥善保護古籍、有效發(fā)揮古籍的文化價值,圖書館責無旁貸。數(shù)字化是古籍保護和利用的重要手段之一,也是圖書館落實文化數(shù)字化戰(zhàn)略的必要路徑。目前古籍數(shù)字化工作已經普遍開展,并積累了豐富的資源成果,國家文化數(shù)字化戰(zhàn)略的提出,為“十四五”時期到2035 年我國圖書館古籍數(shù)字化保護工作提供了實踐指引。
二、國家文化數(shù)字化戰(zhàn)略背景下圖書館古籍保護工作的動力
(一)增加和創(chuàng)新數(shù)字文化內容
文化事業(yè)數(shù)字化的本質就是要持續(xù)推進公共文化內容數(shù)字化建設,增強數(shù)字內容的供給能力。自2012 年國家圖書館啟動古籍數(shù)字化工作以來,雖形成了大量的數(shù)字成果,但古籍數(shù)字化工作受到專業(yè)設備、人才等因素的限制,推進緩慢,存世的古籍還有很大一部分沒有被開發(fā)出來。根據(jù)相關意見要求,各地要因地制宜,制定具體實施方案,盡快落實相關工作, 圖書館可以此為契機,持續(xù)穩(wěn)健推進數(shù)字化工作,進一步增加和豐富古籍數(shù)字化種類。[2]
公共文化數(shù)字化內容豐富是基礎,更重要的是要提升數(shù)字化服務的水平。圖書館可以在數(shù)字化保護的基礎上,利用數(shù)字人文和區(qū)塊鏈等信息技術,對數(shù)字資源進行利用和開發(fā),創(chuàng)新古籍內容的傳播方式,促使古籍事業(yè)朝著傳承性保護、知識服務方向發(fā)展。
(二)探索資源價值
國家文化數(shù)字化戰(zhàn)略的最終目標是實現(xiàn)中華文化全景的呈現(xiàn)。要保障這一目標的實現(xiàn),就要全面梳理中華文化資源,從不同領域內的文化資源中提取中華文化元素、符號和標識,展示中華文化的全貌。[3] 卷帙浩繁的古代文獻典籍是中華文明綿延數(shù)千年的歷史見證,是中華優(yōu)秀傳統(tǒng)文化的瑰寶。古籍數(shù)字化后,圖書館可以將文化資源轉換為生產要素,生成文化創(chuàng)意產品,探索數(shù)字資源的價值。
三、國家文化數(shù)字化戰(zhàn)略背景下圖書館古籍保護工作的發(fā)展方向
文化事業(yè)數(shù)字化是國家文化數(shù)字化的重要組成部分。具體而言,文化數(shù)字化建設的工作就是將數(shù)字技術和設備融入公共文化資源的生產、管理、服務中。[3] 為落實國家文化數(shù)字化戰(zhàn)略的任務部署,立足于現(xiàn)狀,圖書館古籍保護事業(yè)的未來發(fā)展主要有三個方向。
(一)源頭保障:優(yōu)化古籍資源數(shù)字化建設
相關意見對文化資源的戰(zhàn)略部署中,要求文化機構要增強公共文化數(shù)字內容的供給能力,提升公共文化數(shù)字化水平。為了給用戶提供多種古籍資源,保障不同用戶的閱讀需求,就必須挑選出優(yōu)質的古籍資源。但是,我國古籍都是由各個單位進行保藏的,單位間缺少溝通,就造成了同類古籍數(shù)字資源的重復建設。例如,文淵閣的《四庫全書》電子版就出現(xiàn)了3 個版本,分別是由武漢大學圖書館、岳麓書院等單位參與出版的。3 個版本造成資源的大量浪費,影響用戶的判斷與選擇。[4] 因此,進行古籍數(shù)字化工作時一方面要進行前期的選題規(guī)劃,選擇稀缺且具有優(yōu)質主題的古籍資源,另一方面要加強對古籍數(shù)字資源類別的細分,加大資源覆蓋廣度,減少數(shù)字化過程中的邊際成本。
(二)管理高效:推進古籍數(shù)字資源的處理和整合
1. 加強古籍數(shù)字化標準化建設
相關意見要求構建文化數(shù)字化治理體系,進行文化數(shù)字化標準體系的研究,包括文化數(shù)據(jù)安全標準、文化數(shù)據(jù)庫入庫標準等。[5]自2007 年“中華古籍保護計劃”實施以來,我國的古籍數(shù)字化保護工作在逐步推進。2014 年,國家古籍保護中心就規(guī)定了古籍數(shù)字化的工作流程,但在開展工作中卻遇到了問題。古籍數(shù)字化的主體多樣,包含了公共圖書館、高校圖書館以及數(shù)字資源開發(fā)商等,他們在進行數(shù)字化工作中多獨立開展工作,并且都在嘗試制定古籍數(shù)字化標準,出現(xiàn)了古籍書影質量與元數(shù)據(jù)著錄存在差異,數(shù)據(jù)庫質量良莠不齊、數(shù)據(jù)平臺使用多樣等問題。[6] 由于數(shù)字化工作的標準存在差異,形成的數(shù)據(jù)庫和數(shù)據(jù)服務平臺不利于跨平臺的接口,也不利于異構數(shù)據(jù)庫之間的二次開發(fā)與利用。為保證融入中華文化數(shù)據(jù)庫,應盡快完善古籍數(shù)字化標準。
2. 實現(xiàn)數(shù)據(jù)服務平臺的統(tǒng)一檢索
隨著國家文化數(shù)字化戰(zhàn)略的落實,古籍數(shù)字化會逐漸成為圖書館古籍保護的主要方式,古籍數(shù)據(jù)庫的數(shù)量也會逐漸增加。[7] 這必然有利于古籍資源的共建共享,有利于實現(xiàn)公共文化的便利化和權益的均等化。但是,目前由于古籍收藏單位各自搭建服務平臺,古籍數(shù)字資源過度分散,極其不利于讀者的檢索與利用。例如,打開國家古籍保護中心的階段性重要成果“中華古籍數(shù)字資源庫”,發(fā)現(xiàn)該庫除了國家圖書館特藏的古籍,只收納了少數(shù)幾家國內圖書館的古籍資源,包括云南省圖書館、天津圖書館以及上海圖書館。如果想要了解其他古籍資源,只能去尋找相應的收藏單位。[8] 因此,應加強全網(wǎng)古籍數(shù)據(jù)庫的資源整合,加快建立統(tǒng)一的檢索平臺,解決古籍收藏單位資源過于分散的問題,并且要積極接入國家文化專網(wǎng),提升數(shù)據(jù)庫的網(wǎng)絡能見度,擴大資源的輻射范圍。
(三)服務升級:開發(fā)深層次的數(shù)字資源
對于圖書館而言,不僅要加強對文化資源的整合,更重要的是要利用大數(shù)據(jù)、人工智能、云計算等技術,提升對資源的計算能力。[8] 目前古籍數(shù)字化工作還停留在對古籍文獻的表層處理,只能實現(xiàn)古籍的長期保存和檢索,且大多局限于全文檢索,有些數(shù)據(jù)庫甚至不支持全文檢索,只能對數(shù)字化的影像進行簡單的文本瀏覽。[9] 僅通過題名從茫茫資源中找到用戶所需文獻的方式已不能滿足用戶的需求,用戶更希望可以按照作者的時代、所處學派以及文獻中某個章節(jié)等多字段進行組合式全文檢索,或者輸入關鍵詞就能查閱到某個句子或者詞語的出處。[9] 接下來,應加強對古籍文獻內容的深層次開發(fā),注重古籍資源的細顆粒度標識標引、知識單元標注和知識網(wǎng)絡的構建,加強古籍文獻文本內容的分析與挖掘,促使古籍保護事業(yè)朝著知識服務方向發(fā)展。
四、國家文化數(shù)字化戰(zhàn)略背景下圖書館古籍保護工作的實踐路徑
(一)加強頂層規(guī)劃,資源建設共享
古籍數(shù)字化工作是復雜且持久性的工程。數(shù)字化工程涉及古籍版本的篩選、數(shù)據(jù)加工、數(shù)據(jù)管理等多個環(huán)節(jié)。國家文化數(shù)字化戰(zhàn)略背景下,應該由國家相關部門牽頭主導,自上而下構建統(tǒng)一規(guī)范的工作和標準體系,從源頭上把控數(shù)字化工作。
古籍數(shù)字化工作可以項目為主導整合各文化資源,由各個古籍收藏單位每年自行申報數(shù)字化項目,國家古籍保護中心組織相應的專家組對項目的價值進行評估,最終形成數(shù)字化項目清單,最大化地整合資源。各古籍收藏單位在選擇申報的古籍時,可以充分參考“全國古籍普查登記基本數(shù)據(jù)庫”和“國家珍貴古籍名錄數(shù)據(jù)庫”,對古籍版本進行判斷與選擇,不能將年代久遠當作選取的唯一標準,同時也不能因殘缺,而漏掉具有較高文獻價值的古籍。在做好頂層規(guī)劃與設計的基礎上,保障古籍數(shù)字化工作的可持續(xù)發(fā)展與共建共享。各收藏單位可以加強交流與溝通,互通數(shù)據(jù),相互補充數(shù)字資源館藏,收集重要古籍的重要版本。
(二)完善協(xié)調機制,持續(xù)完善古籍數(shù)字化標準
在國家文化數(shù)字化戰(zhàn)略的背景下,依托中華文化數(shù)據(jù)庫建設,在現(xiàn)有研究成果的基礎上,推進建立統(tǒng)一的數(shù)字化標準體系。
第一,完善協(xié)調機制。應將公共圖書館、學術機構以及數(shù)字資源開發(fā)商等標準建設主體協(xié)調起來,統(tǒng)一管理,滿足各主體的訴求,同時借鑒和引進國外相關標準,形成一套全國統(tǒng)一的強制標準。另外,古籍數(shù)字化的標準規(guī)范在實踐的過程時也會不斷出現(xiàn)新問題,應及時對相關問題進行解答,收集使用者的反饋意見,對不符合現(xiàn)階段情況的部分內容進行修改、完善,保障標準的可操作性。
第二,明確古籍數(shù)字化標準。古籍數(shù)字化標準應包含項目規(guī)劃標準、版本選擇標準、生產標準、發(fā)布標準、數(shù)據(jù)保存標準。古籍項目規(guī)劃標準規(guī)定了數(shù)字化項目全流程的監(jiān)管方式和方法,包括選題標準、選題審核流程標準以及監(jiān)督標準。版本選擇標準是對數(shù)字化實體的確定標準,包含了類型選擇標準和細節(jié)敲定標準。同一本古籍應該選擇比較完善且被廣泛認可的版本。版本細節(jié)明確版刻工藝、紙張、字體類型、裝幀方式、墨色類型等,以減少數(shù)字化成果中出現(xiàn)脫文、衍文和殘缺的現(xiàn)象。[10] 古籍數(shù)字資源生產標準按照生產環(huán)節(jié)分為數(shù)碼掃描標準、原書圖像數(shù)據(jù)庫標準、文字抓取標準和數(shù)字化產品校對標準,確定了數(shù)字化工作中的掃描設備、方式,掃描圖像的大小和清晰度等。數(shù)字資源發(fā)布標準包括發(fā)布網(wǎng)站的建設標準、檢索標準。檢索方式影響古籍數(shù)字資源的使用,檢索標準是關鍵性標準。古籍數(shù)字資源保存標準包括元數(shù)據(jù)著錄規(guī)則、描述元數(shù)據(jù)規(guī)范、機讀格式、分類標引標準、主題標引標準、數(shù)字化古籍圖像標準等。保存標準的建立為跨數(shù)據(jù)庫檢索奠定了基礎。
(三)數(shù)據(jù)庫相互銜接,實現(xiàn)聯(lián)合跨庫檢索
國家文化數(shù)字化戰(zhàn)略下的古籍數(shù)字化工作,在生產和發(fā)布數(shù)字資源的同時,要努力探索古籍數(shù)據(jù)庫之間的鏈接模式。可以利用“中華古籍書目數(shù)據(jù)庫”的成果,聯(lián)合有數(shù)字化成果的古籍收藏單位,逐步將古籍影像資源與古籍目錄進行鏈接,實現(xiàn)書目與內容的銜接。數(shù)據(jù)庫之間的銜接可以利用跨庫檢索來實現(xiàn)。跨庫檢索的功能簡單總結來說就是只要輸入關鍵詞,就能在多個不同的數(shù)據(jù)資源庫中進行檢索,提高結果的查全率,減少檢索時間。目前有兩種方式來實現(xiàn)跨庫檢索,一是利用數(shù)據(jù)庫操作語句在多個異構數(shù)據(jù)庫中檢索出相關數(shù)據(jù)后,再對數(shù)據(jù)進行處理后返回前端頁面;二是建立數(shù)據(jù)中臺,將各個數(shù)據(jù)庫中的數(shù)據(jù)同步到數(shù)據(jù)中臺后,對數(shù)據(jù)進行處理,去除重復數(shù)據(jù)和存在質量問題的數(shù)據(jù),最后將處理完畢的數(shù)據(jù)作為檢索系統(tǒng)的檢索對象。[10]
(四)技術賦能,構建古籍數(shù)字資源知識體系
國家文化數(shù)字化戰(zhàn)略新時期,圖書館應當致力于古籍事業(yè)的轉型與升級,促使古籍工作朝著智能化、智慧化的方向發(fā)展?!巴诰蛭幕z產中更深層次的歷史文化知識,是數(shù)字人文研究的重要內容。”古籍數(shù)字化工作可以將數(shù)字人文技術應用于古籍數(shù)字資源的深層次開發(fā)利用中,對文獻內容進行挖掘、分類整合以及可視化展示,形成知識產品,提供知識獲取服務,促進古籍事業(yè)向著“知識域”邁進。[11] 如學者提出可以利用文本挖掘技術挖掘某一作者的寫作風格、情感傾向,某一流派的社交網(wǎng)絡關系等;借助GIS 技術對古籍文獻中與地理分布、歷史進程有關的數(shù)據(jù)進行處理與描述,展現(xiàn)靜態(tài)與動態(tài)的可視化分析,來發(fā)現(xiàn)不同數(shù)據(jù)間隱藏的、有潛在價值的知識。[12]
五、結語
國家文化數(shù)字化戰(zhàn)略對構建中華優(yōu)秀傳統(tǒng)文化傳承發(fā)展體系、增強國家文化軟實力有重要的意義。戰(zhàn)略中的目標與規(guī)劃為推動圖書館古籍保護工作提供了新的動力和路徑,未來圖書館古籍事業(yè)要找準自身在國家文化數(shù)字化戰(zhàn)略中的使命,抓住機會,積極探索。