張琳
(廣東省立中山圖書館,廣州 510000)
2021年6月,文化和旅游部印發(fā)《“十四五”公共文化服務體系建設規(guī)劃》,提出“要以全國智慧圖書館體系建設項目為引領,運用5G、云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等信息技術,搭建一套支撐智慧圖書館運行的云基礎設施,打造面向未來的圖書館智慧服務體系和自有知識產(chǎn)權(quán)的智慧圖書館管理系統(tǒng)”[1]。2022年,國家在政策層面對推進“全國智慧圖書館體系”建設提出更高要求,《“十四五”文化發(fā)展規(guī)劃》[2]《關于推進實施國家文化數(shù)字化戰(zhàn)略的意見》等相繼出臺,錨定建成國家文化大數(shù)據(jù)體系的遠景目標,要求提升數(shù)字文化內(nèi)容供給能力和數(shù)字文化服務水平[3]。在以上報告及規(guī)劃的指導下,我國智慧圖書館的建設勢在必行且目標明確。截至2021年底,全國公共圖書館的數(shù)字資源建設總量達到2.5萬TB[4],海量的數(shù)字資源在滿足公眾文化需求的同時,也面臨確權(quán)管理、有效盤活、安全利用及體系化建設方面的壓力。
完成智慧圖書館的轉(zhuǎn)型升級,建設信任體系是基礎。區(qū)塊鏈技術是一種新興的數(shù)字技術,實質(zhì)上可被理解為去中心化的分布式賬本數(shù)據(jù)庫[5],其去中心化、分布式部署、不可篡改特性能夠保證數(shù)據(jù)信息的真實、完整及安全。在建設智慧圖書館過程中,區(qū)塊鏈天然的“創(chuàng)造信任”能力很好地契合了數(shù)字資源管理的需求。設計一個基于區(qū)塊鏈的智慧圖書館數(shù)字資源管理系統(tǒng),將解決智慧圖書館建設進程中所遇到的數(shù)據(jù)安全難題、資源利用難題;而系列難題的解決,是搭建“全國智慧圖書館體系”的基礎一步,也是響應國家建設號角的必然一步。
目前,國內(nèi)相關研究大部分集中于區(qū)塊鏈在智慧圖書館建設路徑、館藏資源管理、數(shù)據(jù)安全管理、讀者服務等方面的技術應用的可行性分析,且大多僅停留在理論層面,只有少數(shù)學者或機構(gòu)提出具體業(yè)務系統(tǒng)設計方案:曾子明等[6]提出構(gòu)建去中心化智慧圖書館MVS資源管理架構(gòu);李默[7]提出構(gòu)建圖書館元宇宙體系架構(gòu);何寶亮[8]提出應用區(qū)塊鏈技術構(gòu)建智慧型知識服務系統(tǒng);張煒等[9]提出利用區(qū)塊鏈技術建成智慧圖書館版權(quán)管理系統(tǒng)等。區(qū)塊鏈應用于智慧圖書館數(shù)字資源建設方面的研究較少,側(cè)重于區(qū)塊鏈技術在數(shù)字資源管理和數(shù)字版權(quán)方面的理論研究。
整體上,國外對區(qū)塊鏈技術在圖書館領域的應用研究相對重視。美國圖書館協(xié)會(ALA)下設的未來圖書館研究中心(Center for the Future of Libraries)將區(qū)塊鏈技術列為會對未來學校圖書館的發(fā)展產(chǎn)生重大影響的因素之一,持續(xù)跟進這一課題的研究,建議圖書館就區(qū)塊鏈技術的應用進行相應的規(guī)劃[10]。2019年希臘雅典的國際圖聯(lián)(IFLA)年度大會,國際圖聯(lián)信息技術專委會(Information Technology Sections)和大都市圖書館專委會(Metropolitan Libraries Sections)特別舉辦了“圖書館的新興技術:智慧城市和區(qū)塊鏈”分會場,介紹了美國博物館和圖書館服務研究所(IMLS)的研究資助項目“信息專業(yè)區(qū)塊鏈”(Blockchains for the Information Profession)的研究成果,以及區(qū)塊鏈技術在國際范圍的圖書館館際互借、跨圖書館系統(tǒng)使用的通用圖書館卡、教育成果認證等實踐中的應用[11]。根據(jù)當前可以公開查閱到的資料,國外圖書館界對區(qū)塊鏈技術正逐漸由理論研究向?qū)嶋H應用轉(zhuǎn)變。
綜上,目前我國圖書館領域?qū)^(qū)塊鏈技術的研究相對較為分散。雖然已有國家圖書館初步將其應用于數(shù)字圖書館版權(quán)保護及其他領域,中國科學院文獻情報中心為管理其學術論文利用和學術行為規(guī)范進行了一些有針對性的研究[12],但整體上場景應用分析仍較為單一,對智慧圖書館數(shù)據(jù)運用的需求分析與區(qū)塊鏈技術自身特點的匹配性研究仍有待深入,且欠缺基于具體應用場景方面的研究與實際應用模型設計。
區(qū)塊鏈問世以來,被譽為創(chuàng)造信任的機器,具有天然契合智慧圖書館數(shù)字資源管理業(yè)務需求和發(fā)展方向的屬性,其與智慧圖書館數(shù)字資源管理的高適配度特性體現(xiàn)在3個方面。
(1)分布式賬本。公共圖書館展開跨界合作是越來越普遍的公共文化服務形式,高協(xié)作、高耦合的工作模式與區(qū)塊鏈分布式賬本的技術思路非常相似。以圖書館聯(lián)盟鏈建設為例,作為聯(lián)盟成員的圖書館都是建設主體,建設效率比單一主體高很多。此外,各圖書館對鏈上數(shù)字資源的獲取,以及不同圖書館之間資源交易(交換)的賬單,都分別記錄在不同節(jié)點中,而且每一個節(jié)點的記錄都是完整的。此時,每一個節(jié)點都起到了參與監(jiān)督交易合法性的作用,也各自成為一個完整的備份,亦可成為追溯“證據(jù)”。不同于傳統(tǒng)的中心化記賬方案,多節(jié)點協(xié)同記錄的優(yōu)點在于大大避免了錯賬、假賬的可能性,并且多處備份不容易丟失數(shù)據(jù),可用于保障數(shù)字資源管理中的數(shù)據(jù)安全。
(2)對稱加密和授權(quán)技術。區(qū)塊鏈模式下,Hash鏈表的每一塊數(shù)據(jù)都包含兩個Hash值,一個是本身的Hash值,另一個是上一塊數(shù)據(jù)的Hash值,通過這種鏈式結(jié)構(gòu),在知道一個區(qū)塊數(shù)據(jù)的情況下,就可以一直追溯到第一個創(chuàng)建的數(shù)據(jù),它從數(shù)據(jù)結(jié)構(gòu)的層面保證了數(shù)據(jù)或賬本的可追溯。當圖書館的數(shù)字資源在鏈上被其他成員獲取時,獲取方的ID是被加密的,非授權(quán)不可見,適用于圖書館用戶的個人隱私保護。
(3)共識機制。所有節(jié)點之間按照一定的標準標識數(shù)據(jù),從而認定一個數(shù)字資源塊是否有效,這保障了每個上傳的數(shù)字資源塊的唯一性和真實性。而共識機制也可以保障數(shù)字資源難以被隨意修改,若要偽造出一條不存在的記錄,需要控制全網(wǎng)超過51%的節(jié)點才有可能實現(xiàn),當加入基于區(qū)塊鏈的數(shù)字資源管理系統(tǒng)的圖書館或其他文化機構(gòu)足夠多時,造假基本上不可能,也就保護了數(shù)字資源的版權(quán)安全。
區(qū)塊鏈最基本的架構(gòu)模式,通常由下到上劃分為6個層級,即數(shù)據(jù)層、網(wǎng)絡層、共識層、激勵層、合約層和應用層[13],每一層級有自己的邏輯與作用。在區(qū)塊鏈發(fā)展歷程中,又形成多種具體的分支形態(tài),如公有鏈、私有鏈、聯(lián)盟鏈等,在這其中,是有可供智慧圖書館數(shù)字資源管理系統(tǒng)參考的基礎框架的。
公有鏈是完全去中心化、完全開放的鏈,任何機構(gòu)或個體都可以直接參與記賬,無須任何身份認證。在這個形態(tài)下,互聯(lián)網(wǎng)上的所有人都可以看到鏈上信息,故其無法滿足圖書館的隱私保護需求。私有鏈完全中心化,對外不公開,一般只應用于內(nèi)部管理,近年來圖書館的跨界合作、多方協(xié)同作業(yè)模式日益增多,私有鏈在協(xié)同作業(yè)和共同建設中的運用存在明顯的局限性。聯(lián)盟鏈則是考量了公有鏈和私有鏈特點之后的平衡方案。外部機構(gòu)或個體經(jīng)過事先選擇才能正式加入,這部分節(jié)點可以參與鏈上作業(yè);非機構(gòu)成員不可參與作業(yè),只能實現(xiàn)有限的數(shù)據(jù)查詢。這樣一來,聯(lián)盟鏈上的數(shù)據(jù)就可以分為內(nèi)部使用和外部使用兩種,在操作層面上更方便建立不同路徑的統(tǒng)計指標、統(tǒng)計規(guī)范。在當前區(qū)塊鏈的應用形態(tài)中,從共識算法、隱私保護、可控性等特性看,聯(lián)盟鏈適合圖書館的實際業(yè)務環(huán)境。
傳統(tǒng)圖書館對信息資源的管理以儲存為主要形式,智慧圖書館的愿景則是希望通過大數(shù)據(jù)分析、人工智能等現(xiàn)代信息技術盤活已有資源,甚至增值已有資源,最終達到知識服務的互聯(lián)互通、開放共享及智慧知識圖譜化聯(lián)系。在智慧圖書館的建設進程中,各圖書館數(shù)字資源數(shù)量激增,如何對這些數(shù)字資源進行全流程的、精準化的確權(quán)管理成為順應時代要求的業(yè)務重點。筆者認為,智慧圖書館時代的數(shù)字資源管理,其需求在于結(jié)合區(qū)塊鏈等適配度高的現(xiàn)代信息技術,對生產(chǎn)的數(shù)字資源進行集成揭示、封裝、業(yè)務交流,在此過程中提倡標準化建設,以期將大規(guī)模的數(shù)字資源轉(zhuǎn)化為被標準標識、可供發(fā)現(xiàn)、使用安全的圖書館數(shù)字資產(chǎn),進而構(gòu)建智慧圖書館的數(shù)字資產(chǎn)體系。
圖書館業(yè)內(nèi)一直致力于建設各類區(qū)域性聯(lián)盟項目,在聯(lián)盟式建設方面有大量的經(jīng)驗。國家圖書館、中國科學院文獻情報中心等較有組織實施能力的機構(gòu)所展開的區(qū)塊鏈應用探索,為區(qū)塊鏈應用于圖書館提供了良好的實踐范本參考。
在綜合分析區(qū)塊鏈的基礎框架、與圖書館業(yè)務適配的關鍵技術后,筆者提出以區(qū)塊鏈為核心的數(shù)字資源管理系統(tǒng)(Digital Resource Management System,DRMS)設計思路如下。首先,在區(qū)塊鏈原始模型基礎上結(jié)合圖書館業(yè)務需求進行DRMS系統(tǒng)框架設計,主要由基礎設施層、數(shù)據(jù)存儲層、聯(lián)盟治理層、業(yè)務服務層、用戶層組成,每一層邏輯清晰、職責分明,便于維護和管理(見圖1);其次,在智慧圖書館建設多主體協(xié)同的趨勢下,DRMS系統(tǒng)需要由預選的若干圖書館或文化機構(gòu)共同完成建設與維護,并對成員和特定的用戶(讀者)開放,因此DRMS系統(tǒng)選擇聯(lián)盟鏈形態(tài)設計;最后,以區(qū)塊鏈技術去中心化、全程留痕不可篡改和可溯源的特點為技術支撐,對區(qū)域知識內(nèi)容進行權(quán)屬認證和資產(chǎn)溯源,從而為保護知識產(chǎn)權(quán)提供技術保障并創(chuàng)造高度共享和互信知識產(chǎn)權(quán)環(huán)境。
圖1 基于區(qū)塊鏈的DRMS系統(tǒng)分層架構(gòu)圖
DRMS系統(tǒng)整體業(yè)務流程包括資源上傳、資源存證、資產(chǎn)化封裝、資產(chǎn)交易、溯源跟蹤五大部分。其中,資源上傳和資源存證是核心部分,通過資產(chǎn)化封裝實現(xiàn)對聯(lián)盟鏈機構(gòu)的注冊與登錄,完成資產(chǎn)查詢及溯源跟蹤,并在此基礎上構(gòu)建一個統(tǒng)一的聯(lián)盟鏈平臺,實現(xiàn)對整個聯(lián)盟鏈的管理。據(jù)此,以區(qū)塊鏈技術為核心的智慧圖書館DRMS系統(tǒng)可由數(shù)據(jù)資源管理平臺、圖書館聯(lián)盟鏈數(shù)字資源交易中心、聯(lián)盟鏈節(jié)點管理平臺三大部分組成(見圖2)。
圖2 基于區(qū)塊鏈的DRMS系統(tǒng)功能
(1)形成圖書館數(shù)字資源管理聯(lián)盟鏈。DRMS系統(tǒng)通過開發(fā)數(shù)字資源集中管理平臺(以下簡稱“集中平臺”)的形式來建設聯(lián)盟鏈。管理平臺是指面向機構(gòu)成員的資源管理操作業(yè)務后臺。通過管理平臺,機構(gòu)成員將完成資源上傳、資源存證、資產(chǎn)化封裝三大業(yè)務,在聯(lián)盟鏈內(nèi)實現(xiàn)資源共享和信息互通,提高資源的利用率。
①資源上傳:圖書館、出版社及其他文化機構(gòu)通過聯(lián)盟節(jié)點注冊為成員機構(gòu)后,可通過節(jié)點上傳本機構(gòu)的圖片、音視頻、其他文檔資產(chǎn)等數(shù)字資源,所上傳數(shù)字資源經(jīng)過清洗、標準化組織整理、查重后,入庫產(chǎn)生本機構(gòu)正式資源庫以及資源特征庫。②資源存證:成員機構(gòu)建設完自己的資源特征庫與正式資源庫后,可基于此庫將資源進行上鏈存證操作,存證后在聯(lián)盟鏈內(nèi)形成本機構(gòu)的資源存證賬本。③資產(chǎn)化封裝:利用集中平臺,結(jié)合區(qū)塊鏈技術對數(shù)字資源進行資產(chǎn)化封裝。成員機構(gòu)基于已存證的資源存證賬本,可以選擇已存證資源進行資產(chǎn)化封裝,資產(chǎn)化封裝完畢即可在聯(lián)盟鏈內(nèi)形成本機構(gòu)的數(shù)字資產(chǎn)賬本。
(2)形成數(shù)字資源全流程留痕的機制。DRMS系統(tǒng)通過開發(fā)圖書館聯(lián)盟鏈數(shù)字資源交易中心(以下簡稱“交易中心”),實現(xiàn)數(shù)字資源發(fā)行、流通、利用的全流程留痕。交易中心是指面向機構(gòu)成員進行上鏈資源展示、查詢,鏈上資產(chǎn)交易的業(yè)務前臺,類似于電商平臺,功能以資產(chǎn)的展示與流轉(zhuǎn)交易為主。交易:聯(lián)盟鏈內(nèi)所有成員機構(gòu)的數(shù)字資產(chǎn)都可以發(fā)布到聯(lián)盟鏈資產(chǎn)交易市場內(nèi),所有成員機構(gòu)根據(jù)資產(chǎn)訪問范圍規(guī)則檢索查詢可訪問的資產(chǎn),并進行資產(chǎn)流轉(zhuǎn)交易(下訂單購買),完成交易后,所有交易行為數(shù)據(jù)在區(qū)塊鏈存證,形成聯(lián)盟鏈數(shù)字資產(chǎn)交易賬本。
(3)強化數(shù)字資源的監(jiān)控管理和數(shù)字資產(chǎn)溯源。DRMS系統(tǒng)通過開發(fā)聯(lián)盟鏈節(jié)點治理平臺(以下簡稱“治理平臺”)實現(xiàn)對數(shù)字資源的監(jiān)控以及對數(shù)字資產(chǎn)的溯源。治理平臺是指面向參與聯(lián)盟鏈治理的機構(gòu),也就是部署了聯(lián)盟鏈節(jié)點的機構(gòu)用于開展規(guī)范管理的平臺。各機構(gòu)可通過治理平臺,根據(jù)部署時所設定的角色身份、權(quán)限分配進行規(guī)范化的管理,如節(jié)點接入管理、證書管理、合約管理、通道管理、鏈上數(shù)據(jù)審計管理等。
本文在分析區(qū)塊鏈技術的基本特點及行業(yè)發(fā)展現(xiàn)狀基礎上,結(jié)合公共圖書館各種應用場景下數(shù)據(jù)管理的要求與追求,認為DRMS系統(tǒng)可以適用于如下圖書館業(yè)務場景中。
DRMS因其匿名性特征適用于該業(yè)務場景。信息化時代背景下,圖書館數(shù)字資源服務大量展開,服務數(shù)據(jù)的安全管理是重中之重。以廣東省立中山圖書館的“粵讀通”工程為例,該項目希望消除館際的溝通壁壘,聯(lián)合省內(nèi)各級圖書館,實現(xiàn)公共文化服務共建共享?;涀x通是廣東省文化和旅游廳面向公眾推出的首個針對個人應用服務的電子證照,讀者一次辦證,即可全省通用。項目開展信息服務的基礎,在于對分散在各圖書館的讀者信息進行統(tǒng)一采集、集中貯存及加工利用,如此龐大的數(shù)據(jù)要集中貯存,信息安全壓力非常大。借鑒DRMS系統(tǒng)的思路,在粵讀通工程中圖書館可通過靈活高效的管理方式和數(shù)據(jù)加密方式提供安全的數(shù)據(jù)分析環(huán)境;在安全環(huán)境下對大量樣本的用戶行為進行分析,是提供數(shù)字資源精準服務的前提,因此各聯(lián)盟機構(gòu)間可通過分布式的網(wǎng)絡架構(gòu)共同分析同一用戶在不同機構(gòu)中的借閱行為習慣,以此完成同一用戶畫像的描述與共享;通過數(shù)字簽名和加密機制來實現(xiàn)讀者的個人隱私數(shù)據(jù)的保護。
DRMS系統(tǒng)因其去中心化特征適用于該業(yè)務場景。DRMS系統(tǒng)的數(shù)據(jù)管理采用去中心化的數(shù)據(jù)記錄與傳輸模式。系統(tǒng)服務層根據(jù)數(shù)據(jù)申請需求生成Hash值,根據(jù)該值定位數(shù)字資源在鏈上的準確存儲位置完成數(shù)據(jù)傳輸,鏈上的各節(jié)點機構(gòu)完全具備了相等的數(shù)據(jù)管理權(quán)限,并且這些機構(gòu)記錄數(shù)據(jù)的形式具有完整性和一致性特點。在目前信息交互場景中,不同機構(gòu)間數(shù)據(jù)交換非常復雜,真正的互操作性不僅是信息交互,還是多個系統(tǒng)間的相互信任以及共享信息和責任的能力。DRMS系統(tǒng)通過構(gòu)建統(tǒng)一的底層網(wǎng)絡和信任機制,可以讓不同類型的圖書館、不同行政區(qū)域內(nèi)的圖書之間建立良好的數(shù)據(jù)協(xié)作模式,實現(xiàn)對網(wǎng)絡訪問權(quán)限的共享,同時也不會對各自數(shù)據(jù)的安全性和完整性形成威脅。
以廣東省立中山圖書館基于“館社合作”的圖書館聯(lián)合采選系統(tǒng)的構(gòu)建為例,DRMS系統(tǒng)可為其業(yè)務開展提供更進一步的思路:聯(lián)合采選平臺通過書目采編信息的上傳和共享,構(gòu)建一個全省總館、成員館及出版社之間的溝通平臺,以此打破成員館在傳統(tǒng)采訪模式下遇到的與書商交易時信息獲取不對稱的被動局面。而通過區(qū)塊鏈技術的加持,采選平臺將能夠?qū)崿F(xiàn)對各館同時上傳分享自己獨有的優(yōu)勢資源信息的技術保障,如孤本、善本以及獨有地方文獻等特色性資源,這部分資源上傳后可被發(fā)現(xiàn),可供分享,并且安全不可篡改。此外,在現(xiàn)行的圖書館數(shù)據(jù)安全管理模式中,往往由明顯的權(quán)力責任個體或機構(gòu)來負責數(shù)據(jù)安全,權(quán)力集中,存在一定的安全隱患。DRMS系統(tǒng)應用于數(shù)字資源安全存儲時,每個個體既是管理者,同時又是責任人,能有效地杜絕權(quán)力集中帶來的風險,能更好地實現(xiàn)對資源安全的保護。在搭建此類行業(yè)協(xié)同共享平臺的同時,利用區(qū)塊鏈技術強化數(shù)據(jù)的安全管理力度,是為圖書館資源共建做好準備。
DRMS系統(tǒng)因其開放扁平、透明化和不可篡改特征適用于該業(yè)務場景。在目前廣泛應用的中心化版權(quán)管理模式中,一般需要30個工作日以上才能完成數(shù)字資源的確權(quán)過程,并且費用不少。成果及時確權(quán)難、權(quán)力歸屬不清晰、交易全流程監(jiān)管難、侵權(quán)證據(jù)留存難等問題突出。而如今諸如MOOC、3D打印、UGC等新形式大規(guī)模開展,數(shù)字資源出現(xiàn)版權(quán)許可碎片化的趨勢,且總量及種類劇增;但此類資源的個體使用很分散,因此個體授權(quán)成本很高。一旦出現(xiàn)侵權(quán)行為,由于證據(jù)的留存不完整,維權(quán)行為會占用大量資源。此外,自建資源往往還存在孤兒作品授權(quán)及使用難題。在此方面,區(qū)塊鏈技術的應用可以達到數(shù)據(jù)唯一、權(quán)威、可追溯:聯(lián)盟鏈可引入國家版權(quán)局、專利局及商標局等權(quán)威的國家確權(quán)和司法認定機構(gòu)對數(shù)字資源進行內(nèi)部比對、備案認證,提供背書,用戶登記信息并得到存證證書后就可進行交易,效率大大提高;得到認證的交易上鏈,合同信息及相關權(quán)利人、權(quán)力類型、授權(quán)范圍等內(nèi)容及其實時變更信息對全網(wǎng)公開,所有用戶都可以作為監(jiān)督者享有知情權(quán),而所有的惡意侵權(quán)行為都會被記錄在鏈上成為永久性的證據(jù),一切有跡可循。由于區(qū)塊鏈的不可篡改性,每一個“交易”,無論是機構(gòu)方還是用戶方獲取資源都得到了保障,確保了版權(quán)可確權(quán)、交易可追蹤、流程可審計。
公共文化服務作為一國經(jīng)濟與社會發(fā)展的重要標志,在當前國家發(fā)展要求與信息技術革新的雙重時代背景下,圖書館所承載功能的拓展需引入新型技術手段,其產(chǎn)業(yè)發(fā)展需保持持續(xù)創(chuàng)新能力,其產(chǎn)業(yè)應用需強化應用場景調(diào)研。設計一個基于區(qū)塊鏈技術的智慧圖書館數(shù)字資源管理系統(tǒng),通過數(shù)字資源的上鏈協(xié)作與管理,安全高效,可實現(xiàn)全網(wǎng)知識資源的相關聯(lián),深度挖掘資源價值,一方面擴大了資源應用范圍,另一方面對于探索構(gòu)建新時期智慧圖書館數(shù)字資產(chǎn)聯(lián)盟也有一定的啟示。