摘要:在信息化發(fā)展和數(shù)字化升級的背景下,向智慧圖書館轉(zhuǎn)型是圖書館的發(fā)展趨勢。數(shù)據(jù)中臺作為智慧圖書館建設(shè)的重要技術(shù)支撐,應(yīng)在其中發(fā)揮重要作用。文章探討了數(shù)據(jù)中臺的起源與概念、目前的探索與研究,詳細描述了智慧圖書館數(shù)據(jù)中臺自底向上四個層次的架構(gòu):數(shù)據(jù)采集、數(shù)據(jù)體系、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)服務(wù),探討了數(shù)據(jù)中臺在智慧圖書館的應(yīng)用場景,包括業(yè)務(wù)中臺、BI系統(tǒng)、智能檢索、個性化推薦、管理服務(wù)優(yōu)化。最后提出了智慧圖書館數(shù)據(jù)中臺的發(fā)展趨勢,并從數(shù)據(jù)質(zhì)量、隱私與安全、技術(shù)復雜性三個方面提出了未來發(fā)展挑戰(zhàn)與應(yīng)對。
關(guān)鍵詞:數(shù)據(jù)中臺;智慧圖書館;數(shù)據(jù)
中圖分類號:G250.76文獻標識碼:A
Application Research of Data Middle Platform in Smart Libraries
Abstract In the context of information development and digital upgrading,transitioning to smart libraries has become the development trend for libraries.As an essential technical support for building smart libraries,the data middle platform plays a crucial role.This paper explores the origin and concept of the data middle platform,as well as current explorations and research in the field.It provides a detailed description of the bottom-up four-layer architecture of the data middle platform in smart libraries:data collection,data systems,data assets,and data services.Additionally,the paper discusses its application scenarios in smart libraries,including business middle platforms,BI systems,intelligent search,personalized recommendations,and management service optimization.Finally,it identifies the development trends of data middle platforms in smart librariesand outlines future challenges and responses in terms of data quality,privacy and security,and technical complexity.
Keywords data middle platform;smart library;data
1引言
隨著我國信息技術(shù)的發(fā)展和數(shù)字化轉(zhuǎn)型的推進,國家出臺了系列政策鼓勵文化機構(gòu)開展數(shù)字化建設(shè)和大數(shù)據(jù)體系建設(shè)。2021年,文化和旅游部發(fā)布了《“十四五”文化和旅游科技創(chuàng)新規(guī)劃》,要求研發(fā)智慧圖書館相關(guān)技術(shù)、平臺、裝備和系統(tǒng),推進文化和旅游數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展[1]。2022年,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于推進實施國家文化數(shù)字化戰(zhàn)略的意見》,強調(diào)搭建文化數(shù)字化基礎(chǔ)設(shè)施和服務(wù)平臺,統(tǒng)籌推進全國智慧圖書館體系和公共文化云建設(shè)[2]。2023年,中共中央、國務(wù)院印發(fā)《數(shù)字中國建設(shè)整體布局規(guī)劃》,提出深入實施國家文化數(shù)字化戰(zhàn)略,建設(shè)國家文化大數(shù)據(jù)體系,形成中華文化數(shù)據(jù)庫[3]。一些地方政府也根據(jù)本地的文化發(fā)展需求和信息化水平,制定針對性的政策措施,對文化產(chǎn)業(yè)的數(shù)字化建設(shè)提供指導意見。在此背景下,傳統(tǒng)圖書館亟需向智慧圖書館轉(zhuǎn)型。
數(shù)據(jù)作為智慧圖書館的重要資產(chǎn),蘊涵豐富價值。傳統(tǒng)圖書館的數(shù)據(jù)主要是藏書管理和借閱記錄,社會發(fā)展和技術(shù)進步使圖書館數(shù)據(jù)的外延不斷擴大。從數(shù)據(jù)的生產(chǎn)方式來看,圖書館數(shù)據(jù)包括館藏數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、讀者行為數(shù)據(jù)、服務(wù)數(shù)據(jù)等;從空間視角來看,圖書館數(shù)據(jù)包括物理空間數(shù)據(jù)、網(wǎng)絡(luò)空間數(shù)據(jù)、社會空間數(shù)據(jù);從圖書館內(nèi)外視角來看,圖書館數(shù)據(jù)包括內(nèi)部數(shù)據(jù)、圖書館上下級相關(guān)單位數(shù)據(jù)、行業(yè)發(fā)展數(shù)據(jù)、政府政策相關(guān)數(shù)據(jù)、利益相關(guān)者數(shù)據(jù)等[4]。圖書館數(shù)據(jù)來源廣泛、體量龐大、種類多樣、結(jié)構(gòu)各異、價值豐富。如何妥善存儲并高效利用這些數(shù)據(jù),使之轉(zhuǎn)化為有價值的知識并促進服務(wù),已成為圖書館不可忽視的亟待解決的問題。
智慧圖書館是圖書館發(fā)展的必然趨勢,其本質(zhì)是智慧。技術(shù)是圖書館智慧第一和直接的推力[5],而技術(shù)的應(yīng)用離不開數(shù)據(jù)的支持。例如,大數(shù)據(jù)技術(shù)分析和挖掘能力的基礎(chǔ)是充足的數(shù)據(jù);數(shù)字孿生技術(shù)通過實時數(shù)據(jù)反饋實現(xiàn)對實體的精準模擬和預測,創(chuàng)建物理實體的虛擬對應(yīng)物;持續(xù)且準確的數(shù)據(jù)輸入才能使數(shù)字孿生模型反映真實情況,為優(yōu)化決策提供可靠依據(jù);人工智能與大模型的訓練和優(yōu)化需要大量數(shù)據(jù)樣本。以上技術(shù)在圖書館中已得到了實際應(yīng)用,中國國家圖書館通過大數(shù)據(jù)技術(shù)對海量的讀者畫像數(shù)據(jù)及資源畫像數(shù)據(jù)進行分析,得以提供圖書館業(yè)務(wù)分析及精細化讀者服務(wù)[6];上海圖書館東館將館內(nèi)的空間布局、活動內(nèi)容、資源信息等作為輸入數(shù)據(jù),利用數(shù)字孿生技術(shù)使讀者可以沉浸式體驗場所、展覽、會議等[7];瑞典國家圖書館利用人工智能模型將百年館藏加入數(shù)據(jù)集進行訓練,以支持歷史、語言學等人文學科的研究[8]。豐富且準確的數(shù)據(jù)是新技術(shù)在智慧圖書館建設(shè)中發(fā)揮作用的保證。
雖然圖書館的信息化建設(shè)已經(jīng)開展多年,但是傳統(tǒng)信息化系統(tǒng)在數(shù)據(jù)使用方面仍暴露出許多不足,如數(shù)據(jù)孤島現(xiàn)象嚴重、數(shù)據(jù)質(zhì)量問題突出、數(shù)據(jù)分析不充分、智能化應(yīng)用缺乏等。所以筆者認為,盡管圖書館在信息化建設(shè)方面已經(jīng)投入了大量的資源和努力,但數(shù)據(jù)整合和應(yīng)用方面亟待進一步優(yōu)化。數(shù)據(jù)中臺能高效管理和利用圖書館數(shù)據(jù),為圖書館在新時代的發(fā)展提供有力支持。在智慧圖書館建設(shè)中,數(shù)據(jù)中臺的應(yīng)用順應(yīng)政策導向、符合時代命題,成為必然的戰(zhàn)略選擇。
2相關(guān)研究
2.1數(shù)據(jù)中臺的起源與概念
數(shù)據(jù)中臺是大數(shù)據(jù)平臺進一步發(fā)展的產(chǎn)物。雖然國外沒有“數(shù)據(jù)中臺”的說法,但是EA、Twitter等公司為了解決數(shù)據(jù)資源無法互通、共享和復用等問題,搭建了包含數(shù)據(jù)中臺基本理念的大數(shù)據(jù)平臺,顯著提升了公司效益。2015年,阿里巴巴在Supercell公司實踐的基礎(chǔ)上,首次提出了“數(shù)據(jù)中臺”的概念。2018年起,在互聯(lián)網(wǎng)媒體、研究機構(gòu)的宣傳和互聯(lián)網(wǎng)巨頭的示范效應(yīng)下,眾多傳統(tǒng)企業(yè)開始建設(shè)數(shù)據(jù)中臺。
目前,業(yè)內(nèi)對于“數(shù)據(jù)中臺”尚無統(tǒng)一定義。付登坡等人認為,數(shù)據(jù)中臺是一套可持續(xù)“讓數(shù)據(jù)用起來”的機制,是一種戰(zhàn)略選擇和組織形式,是依據(jù)企業(yè)特有的業(yè)務(wù)模式和組織架構(gòu),通過有形的產(chǎn)品和實施方法論支撐,構(gòu)建的一套持續(xù)不斷把數(shù)據(jù)變成資產(chǎn)并服務(wù)于業(yè)務(wù)的機制[9]。彭鋒等人認為,數(shù)據(jù)中臺是企業(yè)數(shù)字化運營的統(tǒng)一數(shù)據(jù)能力平臺,能夠按照規(guī)范匯聚和治理全局數(shù)據(jù),為各個業(yè)務(wù)部門提供標準的數(shù)據(jù)能力和數(shù)據(jù)工具,同時在公司層面管理數(shù)據(jù)能力的抽象、共享和復用[10]。綜合以上觀點,筆者認為,數(shù)據(jù)中臺是基于數(shù)據(jù)驅(qū)動的管理機制和解決方案,通過實現(xiàn)全局數(shù)據(jù)的抽象、共享、復用的方式將數(shù)據(jù)價值轉(zhuǎn)化為資產(chǎn)價值。
2.2數(shù)據(jù)中臺的探索與研究
國內(nèi)已有公司和圖書館探索智慧圖書館數(shù)據(jù)中臺的理念或應(yīng)用。重慶維普公司研發(fā)的智慧圖書館服務(wù)平臺,通過統(tǒng)一的數(shù)據(jù)接入、治理和分析,將不同類型、來源、載體的資源數(shù)據(jù)轉(zhuǎn)化為面向業(yè)務(wù)場景的標準化、高質(zhì)量數(shù)據(jù)資產(chǎn),主要用戶有內(nèi)蒙古工業(yè)大學圖書館、西南交通大學圖書館等[11]。超星旗下子公司江蘇圖星軟件科技有限責任公司與南京大學圖書館共同開發(fā)出“Libstar智慧圖書館服務(wù)平臺”,重構(gòu)并統(tǒng)一了圖書館對各類資源管理的工作流程,以全球知識庫代替分散的本地資源庫,通過整套API(Application Program Interface,應(yīng)用程序接口)整合和擴展多種服務(wù),主要用戶有南京大學圖書館、中國礦業(yè)大學圖書館等[12]。上海圖書館與上海阿法迪智能數(shù)字科技股份有限公司、江蘇嘉圖網(wǎng)絡(luò)科技股份有限公司等42家公司共同研發(fā)了云瀚平臺,將開源圖書館服務(wù)平臺FOLIO(The Future of Libraries isOpen)本地化,制定統(tǒng)一標準加強底層數(shù)據(jù)管理,采用“平臺+應(yīng)用”模式形成開放社區(qū)[13],合作圖書館有上海交通大學圖書館、寧波圖書館等。
這三個平臺對數(shù)據(jù)中臺的探索與研究既有共同點,又各具特色。維普平臺在資源整合與推薦方面具有優(yōu)勢,超星平臺的應(yīng)用管理更加靈活、中文資源更加豐富,云瀚平臺在開放性和自主創(chuàng)新性方面走在前列[14-16]。其他圖書館或公司也在積極研究。這為圖書館進一步建設(shè)架構(gòu)更合理、應(yīng)用更全面、擴展更便捷的數(shù)據(jù)中臺積累了寶貴經(jīng)驗。
3數(shù)據(jù)中臺在智慧圖書館的建設(shè)與應(yīng)用
3.1智慧圖書館數(shù)據(jù)中臺架構(gòu)與層次
智慧圖書館數(shù)據(jù)中臺架構(gòu)自底向上分為數(shù)據(jù)采集、數(shù)據(jù)體系、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)服務(wù)四個層次,并結(jié)合統(tǒng)一數(shù)據(jù)安全管理和統(tǒng)一數(shù)據(jù)運營體系將數(shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)化為應(yīng)用(見圖1)。
3.1.1數(shù)據(jù)采集
數(shù)據(jù)采集層是數(shù)據(jù)中臺的入口,負責從各類數(shù)據(jù)源采集數(shù)據(jù)。圖書館的數(shù)據(jù)源主要包括:①內(nèi)部系統(tǒng)數(shù)據(jù),如圖書館門戶網(wǎng)站、圖書館管理系統(tǒng)、讀者管理系統(tǒng)、數(shù)字資源管理系統(tǒng)等的數(shù)據(jù)。②外部系統(tǒng)數(shù)據(jù),如通借通還平臺、第三方編目系統(tǒng)、其他圖書館系統(tǒng)等的數(shù)據(jù)。③物聯(lián)網(wǎng)數(shù)據(jù),如圖書標簽、門禁傳感器、環(huán)境監(jiān)測設(shè)備等的數(shù)據(jù)。④日志數(shù)據(jù),如系統(tǒng)日志、行為日志、埋點日志等的數(shù)據(jù)。這些數(shù)據(jù)源的結(jié)構(gòu)不一,有關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫、網(wǎng)絡(luò)數(shù)據(jù)源等,可以通過Sqoop、DataX、Kafka等技術(shù)對其進行采集。對于需要實時計算和查詢的業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù)等,可以實時采集;而對于數(shù)據(jù)量大、時效要求低的歷史數(shù)據(jù)等,可以采用離線采集的方式從源頭直接同步。
3.1.2數(shù)據(jù)體系
數(shù)據(jù)體系是數(shù)據(jù)中臺的砥柱,具有承上啟下的作用——“承”原始數(shù)據(jù)、“啟”數(shù)據(jù)價值。數(shù)據(jù)體系應(yīng)盡可能覆蓋全局數(shù)據(jù),遵循統(tǒng)一標準,避免煙囪式建設(shè),為實現(xiàn)數(shù)據(jù)共享奠定基礎(chǔ),降低存儲、計算等成本。圖書館數(shù)據(jù)中臺的數(shù)據(jù)體系主要包括四個部分:貼源數(shù)據(jù)、統(tǒng)一數(shù)倉、標簽數(shù)據(jù)、應(yīng)用數(shù)據(jù)。
貼源數(shù)據(jù)最接近源數(shù)據(jù)。在建設(shè)中,除結(jié)構(gòu)化處理外一般不做額外處理,盡可能保留原始業(yè)務(wù)數(shù)據(jù),可用作對業(yè)務(wù)系統(tǒng)數(shù)據(jù)的參考。對于貼源數(shù)據(jù)表來說,表名可添加前綴“ODS_”,字段名稱與業(yè)務(wù)系統(tǒng)保持一致,同時記錄入庫時間、更新時間、原始業(yè)務(wù)系統(tǒng)標識等信息。
統(tǒng)一數(shù)倉站在全局業(yè)務(wù)的角度對貼源數(shù)據(jù)進行清洗、轉(zhuǎn)換,保證數(shù)據(jù)的質(zhì)量、一致性和互操作性。因此,需要先針對圖書館整體業(yè)務(wù),做好業(yè)務(wù)流及數(shù)據(jù)流的調(diào)研和梳理,形成數(shù)據(jù)域。數(shù)據(jù)域是面向業(yè)務(wù)的數(shù)據(jù)抽象,其劃分涵蓋當前所有業(yè)務(wù)并能適應(yīng)未來需求更迭。數(shù)據(jù)域是數(shù)據(jù)表合理設(shè)計的基石。數(shù)據(jù)表一般分為維度表、事實表:維度表是最基礎(chǔ)的信息表,在數(shù)倉中保證唯一性,如圖書館維度表,其表字段含有圖書館代碼、圖書館名稱等;事實表用來描述業(yè)務(wù)過程,如流通事實表,含有統(tǒng)一ID、讀者ID、館藏ID、流通時間、流通類型等字段。
標簽數(shù)據(jù)可以在同一粒度的基礎(chǔ)上刻畫對象,解決了以往跨業(yè)務(wù)計算和使用數(shù)據(jù)的不便。標簽數(shù)據(jù)對象包括實體和關(guān)系,可以通過唯一ID來標識;標簽需要根據(jù)對象屬性和業(yè)務(wù)需求進行設(shè)計。以“讀者”這一對象的標簽體系構(gòu)建為例:首先從基礎(chǔ)特征、行為特征、閱讀特征、其他特征等方面歸納標簽類目;其次對標簽類目細化,如基礎(chǔ)特征可以分為自然屬性、社會屬性、業(yè)務(wù)屬性,自然屬性又可以進一步分為性別、年齡等。這樣對每個標簽類目層層細化,最后形成讀者標簽體系。在存儲時,標簽數(shù)據(jù)表一般采用二維形式包含多個標簽,能更全面描述對象、提升性能。
應(yīng)用數(shù)據(jù)面向特定業(yè)務(wù),類似于傳統(tǒng)的數(shù)據(jù)集市。應(yīng)用數(shù)據(jù)表沒有嚴格的建設(shè)標準,需要根據(jù)業(yè)務(wù)主題來進行組織設(shè)計。比如即席統(tǒng)計的業(yè)務(wù)會采取寬表的方式增加冗余,以減少表查詢時的連接、提高效率。
貼源數(shù)據(jù)、統(tǒng)一數(shù)倉、標簽數(shù)據(jù)、應(yīng)用數(shù)據(jù)共同構(gòu)成了數(shù)據(jù)體系,是數(shù)據(jù)中臺的核心,從原始數(shù)據(jù)的保存到業(yè)務(wù)應(yīng)用的支持,形成了一個連貫的數(shù)據(jù)處理流程。
3.1.3數(shù)據(jù)資產(chǎn)
數(shù)據(jù)資產(chǎn)指由組織合法擁有或控制,以電子或其他方式記錄,可進行計量或交易,能直接或間接帶來經(jīng)濟效益和社會效益的數(shù)據(jù)。良好的數(shù)據(jù)資產(chǎn)一方面可以保證數(shù)據(jù)的質(zhì)量,增強數(shù)據(jù)的可理解性,另一方面可以更直觀地查看和使用數(shù)據(jù),增強數(shù)據(jù)的可用性。數(shù)據(jù)資產(chǎn)管理主要包括數(shù)據(jù)模型管理、數(shù)據(jù)標準管理、數(shù)據(jù)質(zhì)量管理、主數(shù)據(jù)管理、元數(shù)據(jù)管理、數(shù)據(jù)安全管理、數(shù)據(jù)價值管理、數(shù)據(jù)共享管理[20]。數(shù)據(jù)資產(chǎn)管理需要按照業(yè)務(wù)梳理數(shù)據(jù),明確系統(tǒng)內(nèi)的數(shù)據(jù)及其含義,同時記錄數(shù)據(jù)的生產(chǎn)者、維護者、使用者;制定統(tǒng)一維護標準,細致到語義定義、命名規(guī)范、血緣關(guān)系、變更流程、監(jiān)控流程;明確數(shù)據(jù)的應(yīng)用場景和業(yè)務(wù)邊界,分級制定安全策略,挖掘數(shù)據(jù)價值,實現(xiàn)數(shù)據(jù)共享。
3.1.4數(shù)據(jù)服務(wù)
數(shù)據(jù)服務(wù)是數(shù)據(jù)中臺的出口,通過數(shù)據(jù)API網(wǎng)關(guān)、數(shù)據(jù)服務(wù)權(quán)限管理、數(shù)據(jù)服務(wù)質(zhì)量保障,將處理后的數(shù)據(jù)共享給各類應(yīng)用。數(shù)據(jù)API網(wǎng)關(guān)提供基于RESTful、GraphQL等的數(shù)據(jù)服務(wù)接口,支持多種協(xié)議和格式的數(shù)據(jù)訪問,覆蓋圖書館全局業(yè)務(wù),便于統(tǒng)一數(shù)據(jù)口徑,減少接口重復建設(shè)。數(shù)據(jù)服務(wù)權(quán)限管理通過數(shù)據(jù)權(quán)限控制,使不同用戶和應(yīng)用只訪問被授權(quán)的數(shù)據(jù),保障數(shù)據(jù)使用的安全性。數(shù)據(jù)服務(wù)質(zhì)量保障通過負載均衡、緩存、查詢優(yōu)化等技術(shù),保障數(shù)據(jù)服務(wù)的高效性和穩(wěn)定性。數(shù)據(jù)服務(wù)面向上層應(yīng)用,將數(shù)據(jù)轉(zhuǎn)化為能力,是數(shù)據(jù)中臺建設(shè)的價值體現(xiàn)。
3.2數(shù)據(jù)中臺在智慧圖書館的應(yīng)用場景
3.2.1業(yè)務(wù)中臺
業(yè)務(wù)中臺與數(shù)據(jù)中臺相輔相成,業(yè)務(wù)中臺將數(shù)據(jù)沉淀至數(shù)據(jù)中臺,數(shù)據(jù)中臺又反哺業(yè)務(wù)中臺的運行。比如,浙江圖書館智慧圖書館項目在全面梳理原有系統(tǒng)和架構(gòu)的基礎(chǔ)上,將業(yè)務(wù)整合成業(yè)務(wù)中臺,同時也大力建設(shè)數(shù)據(jù)中臺[21]。隨著圖書館服務(wù)的推進,業(yè)務(wù)中臺將持續(xù)產(chǎn)生海量異構(gòu)數(shù)據(jù),數(shù)據(jù)中臺能夠?qū)ζ涓咝Р杉c管理。與此同時,數(shù)據(jù)中臺能為業(yè)務(wù)中臺提供多樣化服務(wù),如部分業(yè)務(wù)中嵌入的報表統(tǒng)計查詢服務(wù),以及多種黑名單行為觸發(fā)讀者證權(quán)益凍結(jié)的數(shù)據(jù)回刷服務(wù)等。如果這些服務(wù)直接由業(yè)務(wù)中臺提供,那么必然會擠占業(yè)務(wù)中臺的資源,影響線上業(yè)務(wù)的正常運行,而且效率也不如數(shù)據(jù)中臺。數(shù)據(jù)中臺憑借其專業(yè)的處理能力和優(yōu)化的架構(gòu),能夠更出色地完成這些任務(wù)。
3.2.2 BI系統(tǒng)
數(shù)據(jù)中臺支持BI(Business Intelligence,商業(yè)智能)系統(tǒng)實現(xiàn)多維度、多層次的數(shù)據(jù)可視化展示。數(shù)據(jù)中臺憑借其強大的數(shù)據(jù)集成與治理能力,匯聚與整合分散在不同系統(tǒng)中的數(shù)據(jù),并通過數(shù)據(jù)清洗、轉(zhuǎn)換和標準化,確保數(shù)據(jù)的準確性與一致性,為BI分析與結(jié)果展示提供高質(zhì)量的數(shù)據(jù)基礎(chǔ)[22]。一方面,目前圖書館BI系統(tǒng)越來越向可以自助式操作發(fā)展,館員按需求自主選取合適的維度和度量,靈活生成報表,減少代碼開發(fā)的介入。比如,館員想獲取當月全省公共圖書館的流通量報表時,即可選取以月份為時間維度,以公共圖書館為地點維度,以流通量為度量指標,以表格為呈現(xiàn)方式來生成報表。另一方面,BI系統(tǒng)可以組合多份報表形成有動態(tài)性、交互性的大屏展示。比如,江西省圖書館的智慧大屏包含了入館人數(shù)、借閱排行、讀者行為偏好、資源推薦等各種類型的統(tǒng)計和分析[23]。數(shù)據(jù)中臺通過實時數(shù)據(jù)采集、流處理、OLAP(Online Analytical Processing,聯(lián)機分析處理)等技術(shù)確保大屏數(shù)據(jù)實時更新。
3.2.3智能檢索
數(shù)據(jù)中臺通過匯聚和治理圖書館的文獻資源、讀者行為、時事熱點等數(shù)據(jù),可以形成龐大而準確的知識圖譜,為智能檢索提供語義理解能力。當讀者搜索一些簡單關(guān)鍵詞時,數(shù)據(jù)中臺能基于知識圖譜和機器學習算法,結(jié)合讀者的個人信息、借閱歷史、瀏覽記錄、檢索記錄等數(shù)據(jù)進行推測,返回更加精準的結(jié)果。此外,數(shù)據(jù)中臺可以結(jié)合自然語言處理技術(shù)對文獻內(nèi)容進行深度分析。比如,澳門科技大學圖書館構(gòu)建的ChatLib平臺,通過會話式服務(wù)使檢索系統(tǒng)更好地理解讀者的需求[24]。當讀者用自然語言提問時,系統(tǒng)能夠理解讀者的問題并對文獻內(nèi)容進行檢索,而非局限于標題與關(guān)鍵詞,為讀者挖掘出更多以往可能被忽視的資源。同時,數(shù)據(jù)中臺可以實時或定時更新索引,提升檢索結(jié)果的時效性。當產(chǎn)生新入藏的文獻或者新的讀者行為數(shù)據(jù)時,數(shù)據(jù)中臺可以將其快速納入并整合更新,使讀者能及時掌握最新信息。通過這些應(yīng)用,數(shù)據(jù)中臺顯著提升了智慧圖書館智能檢索的準確性、全面性和時效性,為讀者提供了更優(yōu)質(zhì)的檢索體驗。
3.2.4個性化推薦
數(shù)據(jù)中臺通過整合讀者各類特征構(gòu)建起全面而細致的讀者畫像?;谶@些畫像,數(shù)據(jù)中臺能夠深入了解讀者的基本情況、知識水平、興趣偏好和閱讀習慣,進行個性化推薦。比如,對于喜歡歷史的讀者,數(shù)據(jù)中臺可以分析出其感興趣的歷史時期、歷史人物、地域等,為其推薦相應(yīng)的歷史讀物;對于學術(shù)研究型讀者,數(shù)據(jù)中臺可以分析出其關(guān)注的研究領(lǐng)域,為其推薦相應(yīng)的學術(shù)成果或?qū)I(yè)期刊。同時,數(shù)據(jù)中臺還可以挖掘具有相似偏好的讀者群體。當一些讀者表現(xiàn)出對某一資源感興趣時,數(shù)據(jù)中臺能夠?qū)⒃撡Y源推薦給相似讀者。比如,上海圖書館通過協(xié)同過濾算法綜合考量讀者自身和相似讀者的信息,并進行權(quán)重分配,最終給出推薦結(jié)果[25]。此外,數(shù)據(jù)中臺還可以結(jié)合實時數(shù)據(jù)和場景數(shù)據(jù)進行動態(tài)推薦。比如,當中小學生放假時,數(shù)據(jù)中臺可以給他們推薦適齡的課外讀物或者閱讀推廣活動;當處于考試季時,數(shù)據(jù)中臺可以給備考讀者推薦考試輔導資料等。通過這些精準的個性化推薦,數(shù)據(jù)中臺能有效提升讀者發(fā)現(xiàn)心儀資源的效率,增強讀者與圖書館的互動和黏性。
3.2.5管理服務(wù)優(yōu)化
在資源管理方面,數(shù)據(jù)中臺可以分析文獻的檢索頻率、借閱記錄、預約狀況等,為精準采購和館藏管理提供決策依據(jù)。比如,對于近期熱門或者需求量可能增長的文獻,可以提前制訂增加副本采購計劃;對于借閱量極低或者過時的文獻,可以改為館內(nèi)閱覽。在服務(wù)流程優(yōu)化方面,數(shù)據(jù)中臺可以分析圖書館各項服務(wù)辦理流程的數(shù)據(jù),如注冊流程、借閱流程、跨館流通流程等,幫助圖書館找出操作痛點,進行簡化優(yōu)化,提高服務(wù)效率。在空間布局和設(shè)施配置方面,數(shù)據(jù)中臺可以分析當前各區(qū)域的人數(shù)、讀者的常去區(qū)域、停留時間、活動軌跡等,幫助圖書館合理控制人流,并根據(jù)讀者的需求量重新規(guī)劃空間大小或增減設(shè)施配置。在人員調(diào)度方面,數(shù)據(jù)中臺可以根據(jù)讀者流量和服務(wù)需求的波動,提供合理的館員安排建議。
4智慧圖書館數(shù)據(jù)中臺的未來發(fā)展
4.1發(fā)展趨勢
未來智慧圖書館數(shù)據(jù)中臺將更趨智能化。在與生成式人工智能緊密結(jié)合下,機器人服務(wù)咨詢將擺脫機械問答的模式,像“人”一樣用更加自然的語言風格交流。它能理解并回應(yīng)讀者的模糊意圖和復雜情感表達,實現(xiàn)文本、圖像、音視頻等多模態(tài)混合檢索。數(shù)據(jù)中臺還可以發(fā)展出更具交互性和沉浸式的可視化形式,比如與虛擬現(xiàn)實(Virtural Reality,VR)、增強現(xiàn)實(Augmented Reality,AR)結(jié)合,依托圖書館大量文獻資料搭建圖書館元宇宙。不斷升級迭代的智能化技術(shù)與數(shù)據(jù)中臺的結(jié)合將使數(shù)據(jù)中臺的智能化水平達到新的高度,讓數(shù)據(jù)中臺成為智慧圖書館的“智慧大腦”。
未來智慧圖書館數(shù)據(jù)中臺將更趨生態(tài)化。比如,云瀚FOLIO平臺秉承“開放共享,協(xié)作共贏”的理念,通過統(tǒng)一接入標準,支持多種數(shù)據(jù)接入和跨平臺應(yīng)用集成,同時開放數(shù)據(jù)共享,構(gòu)建數(shù)據(jù)生態(tài)體系[26]。未來,圖書館數(shù)據(jù)中臺還可以與博物館、文化館等的數(shù)據(jù)中臺組成文化機構(gòu)數(shù)據(jù)中臺聯(lián)盟,共享館內(nèi)資源、數(shù)據(jù)資源和服務(wù)經(jīng)驗,讓資源按需跨館流動。出版商、作者能與圖書館深度合作,依據(jù)數(shù)據(jù)中臺的分析了解讀者反饋、洞察市場需求,出版更契合讀者興趣的圖書。廣大讀者和市民也可融入此生態(tài)環(huán)境,與作者、專家和其他讀者在線互動,參與圖書創(chuàng)作、評論及推薦,形成閱讀社區(qū),推動知識傳播與共享。“生態(tài)化”的數(shù)據(jù)中臺能塑造一個多方參與、互利共贏的智慧圖書館生態(tài)系統(tǒng)。
未來智慧圖書館數(shù)據(jù)中臺將更趨普惠化。數(shù)據(jù)中臺本身將更加注重用戶體驗的平等性,為圖書館降低資源使用門檻提供統(tǒng)計分析依據(jù),使兒童、老人、殘障人士等各類群體都能獲得無障礙的服務(wù)。它還有助于打破圖書資源分配不均的現(xiàn)狀,特別是一些偏遠地區(qū)的基層圖書館,能夠借助大型圖書館數(shù)據(jù)中臺的能力惠及周邊讀者,或加強與社會各界的合作推出更多公益服務(wù)。數(shù)據(jù)中臺的普惠化將打破圖書館服務(wù)的時空限制,實現(xiàn)知識全民共享,推動全民文化素養(yǎng)提升。
4.2挑戰(zhàn)與應(yīng)對
4.2.1數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量是數(shù)據(jù)中臺能否有效運作的關(guān)鍵因素。但是,數(shù)據(jù)質(zhì)量在實踐中仍是一項巨大的挑戰(zhàn)。數(shù)據(jù)中臺的數(shù)據(jù),因來源不同,往往容易產(chǎn)生格式?jīng)_突與語義歧義,需要投入大量時間和資源進行數(shù)據(jù)清洗、轉(zhuǎn)換及校驗等數(shù)據(jù)治理工作。由于技術(shù)限制、人為疏忽或者系統(tǒng)故障等,隨著圖書館業(yè)務(wù)的持續(xù)發(fā)展及讀者需求的不斷變化,數(shù)據(jù)極有可能存在滯后、偏差和缺失的情況。此類數(shù)據(jù)在數(shù)據(jù)中臺中傳播,將會影響整個系統(tǒng)的可靠性。為達成數(shù)據(jù)的高效整合與共享,數(shù)據(jù)中臺需要依據(jù)業(yè)務(wù)需求,權(quán)衡好成本與收益,構(gòu)建統(tǒng)一的數(shù)據(jù)標準和規(guī)范以保障數(shù)據(jù)質(zhì)量,如數(shù)據(jù)格式標準、元數(shù)據(jù)標準、數(shù)據(jù)接口標準等,同時設(shè)立審核和校驗機制,確保數(shù)據(jù)的一致性和準確性。
4.2.2隱私與安全
隨著數(shù)據(jù)量的增長和數(shù)據(jù)的廣泛應(yīng)用,數(shù)據(jù)的隱私與安全變得愈發(fā)重要。圖書館數(shù)據(jù)中臺需要存儲及處理大量讀者隱私數(shù)據(jù),如數(shù)據(jù)防護出現(xiàn)漏洞極易導致數(shù)據(jù)被竊取。數(shù)據(jù)中臺還涉及與其他系統(tǒng)的頻繁交互,若第三方的安全措施不足或數(shù)據(jù)傳輸過程中加密方法不當,數(shù)據(jù)容易被破解。內(nèi)部人員操作不當、權(quán)限設(shè)置不合理等,也有可能導致數(shù)據(jù)暴露在風險之中。當前法律法規(guī)對個人隱私保護的要求日益嚴格,面對這樣的挑戰(zhàn),數(shù)據(jù)中臺必須采取相應(yīng)的數(shù)據(jù)保護措施。比如,通過數(shù)據(jù)加密、訪問控制、數(shù)據(jù)脫敏、敏感數(shù)據(jù)保護等技術(shù)方法加強數(shù)據(jù)的安全性;通過提高館員的安全意識,制定完善的數(shù)據(jù)安全管理機制和應(yīng)急響應(yīng)機制,定期邀請專業(yè)的第三方安全機構(gòu)評估和測試等方法,提高數(shù)據(jù)的安全性。
4.2.3技術(shù)復雜性
數(shù)據(jù)中臺的建設(shè)和運營涉及多種復雜的技術(shù)。數(shù)據(jù)中臺不僅要存儲和處理不斷增長的數(shù)據(jù),還要滿足高可用和高并發(fā)等性能需求。這些技術(shù)和需求一方面對操作系統(tǒng)、網(wǎng)絡(luò)、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)處理和分析工具等軟硬件配置提出嚴格要求;另一方面需要兼具圖書館業(yè)務(wù)與計算機技術(shù)的高素質(zhì)人才團隊來進行設(shè)計、開發(fā)、運維和管理。因此,針對數(shù)據(jù)中臺的技術(shù)復雜性,我們需要合理規(guī)劃并持續(xù)優(yōu)化架構(gòu)設(shè)計,制定系統(tǒng)的技術(shù)培訓計劃,組織員工定期參加技術(shù)交流活動。
5結(jié)語
數(shù)據(jù)中臺可以實現(xiàn)智慧圖書館數(shù)據(jù)的高效整合和共享,在業(yè)務(wù)中臺、BI系統(tǒng)、智能檢索、個性化推薦、管理服務(wù)優(yōu)化等多種應(yīng)用場景大有可為。未來,圖書館不僅需要認識到數(shù)據(jù)中臺的重要性和必要性,將其納入智慧圖書館建設(shè)的重點內(nèi)容,還要加強對國內(nèi)外優(yōu)秀案例和經(jīng)驗的學習,積極探索、創(chuàng)新先進理念和先進技術(shù),并結(jié)合圖書館實際情況制定合理的建設(shè)計劃和發(fā)展戰(zhàn)略。通過數(shù)據(jù)中臺的應(yīng)用推動智慧圖書館的全面發(fā)展,推動圖書館行業(yè)轉(zhuǎn)型升級,為廣大讀者提供更好的服務(wù)體驗和價值,助力文化事業(yè)邁向更加美好的未來。
參考文獻:
[1]文化和旅游部關(guān)于印發(fā)《“十四五”文化和旅游科技創(chuàng)新規(guī)劃》的通知[EB/OL].[2024-06-05].https://www.gov.cn/zhengce/zhengceku/2021-06/11/content_5616972.htm.
[2]中共中央辦公廳國務(wù)院辦公廳印發(fā)《關(guān)于推進實施國家文化數(shù)字化戰(zhàn)略的意見》[EB/0L].[2024-06-05].https://www.gov.cn/zhengce/2022-05/22/content_5691759.htm.
[3]中共中央國務(wù)院印發(fā)《數(shù)字中國建設(shè)整體布局規(guī)劃》[EB/0L].[2024-06-05].https://www.gov.cn/xinwen/2023-02/27/content_5743484.htm.
[4]趙發(fā)珍.數(shù)據(jù)賦能圖書館治理創(chuàng)新:內(nèi)涵、模式及發(fā)展路徑[J].國家圖書館學刊,2023,32(2):40-48.
[5]吳政.智慧圖書館的本質(zhì)、特征與實現(xiàn)路徑[J].國家圖書館學刊,2022,31(3):12-21.
[6]楊帆.畫像分析為基礎(chǔ)的圖書館大數(shù)據(jù)實踐:以國家圖書館大數(shù)據(jù)項目為例[J].圖書館論壇,2019,39(2):58-64.
[7]王曄斌,張磊.虛實相生:元宇宙視角下智慧圖書館場景實現(xiàn)[J].圖書館雜志,2022,41(7):18-24.
[8]瑞典國家圖書館利用AI解讀百年館藏[J].國家圖書館學刊,2023,32(6):49.
[9]付登坡,江敏,趙東輝,等.數(shù)據(jù)中臺:讓數(shù)據(jù)用起來[M].第2版.北京:機械工業(yè)出版社,2024:2-3.
[10]彭鋒,宋文欣,孫浩峰.云原生數(shù)據(jù)中臺架構(gòu)、方法論與實踐[M].北京:機械工業(yè)出版社,2021:13-14.
[11]智慧圖書館整體解決方案[EB/0L].[2024-06-25].https://www.vipslib.com/plan-vipsmart.html.
[12]智慧圖書館服務(wù)平臺[EB/0L].[2024-06-26].https://www.libstar.net/html/service/service.html.
[13]劉煒,嵇婷.“云瀚”與智慧圖書館:以開放創(chuàng)造未來[J].中國圖書館學報,2021,47(6):50-61.
[14]盧鳳玲,周蘭羽.國內(nèi)智慧圖書館服務(wù)平臺比較研究:以維普、超星和云瀚為例[J].圖書館理論與實踐,2024(1):107-114.
[15]陳煉.下一代圖書館服務(wù)平臺比較研究:以Alma、Sierra、FOLIO、Libstar為例[J].辦公室業(yè)務(wù),2022(21):169-172,176.
[16]印炳蔚.國內(nèi)外下一代圖書館系統(tǒng)平臺的比較分析:以ALMA與Libstar為例[J].辦公室業(yè)務(wù),2022(11):174-177.
[17]熊擁軍,白瀚禎,張廷成.基于數(shù)據(jù)中臺的圖書館數(shù)據(jù)資產(chǎn)管理架構(gòu)[J].圖書館學研究,2023(8):36-47.
[18]童忠勇.公共圖書館數(shù)字資源智慧化服務(wù)模式探索:以國家圖書館讀者云門戶網(wǎng)站為例[J].圖書館理論與實踐,2022(1):80-83,98.
[19]鮑劼,李丕仕,尹良偉,等.高校圖書館數(shù)據(jù)中臺建構(gòu)研究:以中國礦業(yè)大學圖書館為例[J].圖書館學刊,2023,45(8):34-38.
[20]數(shù)據(jù)資產(chǎn)管理實踐白皮書(6.0版)[EB/OL].[2024-07-11].http://221.179.172.81/images/20230104/12651672818383015.pdf.
[21]錢彥,梅影.從理念到實踐:生成式人工智能在智慧圖書館中的應(yīng)用探索[J].圖書館研究與工作,2023(12):27-34.[22]石秀峰.請不要將數(shù)據(jù)中臺做成BI[J].大數(shù)據(jù)時代,2023(10):6-15.
[23]江西聯(lián)通:5G讓圖書館有顏更有智[EB/0L].[2024-07-29].https://m.thepaper.cn/baijiahao_19607777.
[24]袁虎聲,唐嘉樂,趙洗塵,等.ChatLib:重構(gòu)智慧圖書館知識服務(wù)平臺[J].大學圖書館學報,2024,42(2):72-80.
[25]金佳麗,盧盈蕾,陳雪梅,等.基于大數(shù)據(jù)的個性化推薦:思路與實踐[J].圖書館雜志,2023,42(5):63-70.
[26]嵇婷,周綱,張春景.開放圖書館平臺社區(qū)的構(gòu)建:“新時代,新勢力:2022世界開放圖書館聯(lián)盟亞太會議暨中國云瀚社區(qū)年會”綜述[J].圖書館論壇,2023,43(3):25-33.
作者簡介:陳宇,浙江圖書館助理館員,研究方向為信息化建設(shè)、數(shù)據(jù)分析、系統(tǒng)開發(fā)和運維;錢彥,浙江圖書館館員,研究方向為數(shù)據(jù)中心建設(shè)、網(wǎng)絡(luò)安全。
收稿日期:2024-07-31
編校:李萍 王曉琳