周笑盈(國家圖書館)
在智慧圖書館的運行和發(fā)展過程中,知識資源是智慧圖書館建設(shè)的基礎(chǔ),具有數(shù)字化、網(wǎng)絡(luò)化、智能化、多維融合、泛在互聯(lián)、情境感知、高效協(xié)同、精準增值、以人為本等特點。隨著智慧圖書館時代的到來,知識資源的闡釋與挖掘面臨著新的課題。
從整體看,智慧圖書館具有場所泛在化、空間虛擬化、手段智能化、內(nèi)容知識化、體驗滿意化等特點。本文基于全國智慧圖書館體系的視角探究知識資源建設(shè)的內(nèi)涵與要素,提出以解構(gòu)抽取、融合重構(gòu)、人文呈現(xiàn)為主線的知識資源建設(shè)方法論模型,從數(shù)據(jù)層、組織層和消費層探索全國智慧圖書館體系下知識資源的建設(shè)策略。
關(guān)于智慧圖書館的理論研究,一般從新基建、數(shù)字孿生、全程智能、用戶體驗、數(shù)據(jù)驅(qū)動、泛在網(wǎng)絡(luò)環(huán)境、協(xié)同理論、信息生態(tài)理論等視角論述。智慧圖書館的定義主要從哲學(xué)、技術(shù)、服務(wù)、空間、學(xué)科五個角度展開。劉煒等提出了智慧圖書館是“無人+ 自助+自動感知+精準高質(zhì)量”的科技型圖書館[1],唐燕等認為智慧圖書館是“數(shù)字人文咨詢+ 數(shù)據(jù)管理+ 社交協(xié)作+ 創(chuàng)意制作+ 勞動力孵化+ 數(shù)字人文素養(yǎng)培養(yǎng)”的綜合服務(wù)體[2]。關(guān)于智慧圖書館的構(gòu)成要素,有學(xué)者認為是“人+物”[3],有學(xué)者認為是“技術(shù)+資源+服務(wù)+館員+用戶”的協(xié)同體[4]??梢?,智慧圖書館的關(guān)注熱點在宏觀層面表現(xiàn)為戰(zhàn)略規(guī)劃與體系管理,在微觀層面表現(xiàn)為知識服務(wù)、用戶服務(wù)與技術(shù)應(yīng)用。
智慧圖書館技術(shù)應(yīng)用研究主要從技術(shù)發(fā)展趨勢和建設(shè)項目探索兩個方面展開。相關(guān)技術(shù)包括:3R(AR、VR、MR)技術(shù)、標識技術(shù)、協(xié)同計算技術(shù)、模擬仿真技術(shù)、深度學(xué)習(xí)技術(shù)、神經(jīng)網(wǎng)絡(luò)、人臉識別、深度學(xué)習(xí)、RFID、微服務(wù)平臺建設(shè)、人工智能、數(shù)據(jù)挖掘、區(qū)塊鏈等。建設(shè)內(nèi)容涉及:用戶場景庫、用戶畫像庫、知識資源庫,主要目標是為讀者提供無感借閱、直播互動、智慧場館、精準推送、智慧書房等服務(wù)。吳丹等認為,智慧圖書館服務(wù)有數(shù)據(jù)來源更加廣泛、數(shù)據(jù)融合更加全面、服務(wù)更加精準化、更加注重數(shù)據(jù)隱私和安全等 4 個發(fā)展趨勢[5]。
國家圖書館“十四五”發(fā)展規(guī)劃提出建設(shè)“全國智慧圖書館體系”[6],將總體架構(gòu)歸納為“1+3+N”:“1”指智慧圖書館的云基礎(chǔ)設(shè)施,“3”指搭載于其上的全國智慧圖書館管理系統(tǒng)、全網(wǎng)知識內(nèi)容集成倉儲和多維融合知識服務(wù)平臺,“N”指在全國各級圖書館及其基層服務(wù)點普遍建立線下智慧服務(wù)空間。我國圖書館中已有應(yīng)用現(xiàn)代信息技術(shù)積極推動資源、服務(wù)、設(shè)施、管理等領(lǐng)域轉(zhuǎn)型創(chuàng)新的案例,為智能技術(shù)在圖書館的一些業(yè)務(wù)環(huán)節(jié)、服務(wù)領(lǐng)域的落地應(yīng)用提供解決方案。如:在大數(shù)據(jù)領(lǐng)域,上海交通大學(xué)建設(shè)了覆蓋圖書館主要業(yè)務(wù)的一站式統(tǒng)計平臺;在人工智能領(lǐng)域,武漢大學(xué)圖書館建設(shè)了“百度大腦”應(yīng)用;在物聯(lián)網(wǎng)領(lǐng)域,深圳圖書館支持圖書智能盤點、定位、防盜及街區(qū)自助圖書館;在情境感知領(lǐng)域,國家圖書館、福州圖書館、上海交通大學(xué)圖書館建設(shè)了 VR、AR 閱讀體驗區(qū)[7]。
伴隨知識化處理技術(shù)的提升與圖書館用戶服務(wù)水平的發(fā)展,下一代智慧圖書館的知識資源建設(shè)將充分融合圖書館的資源數(shù)據(jù)、用戶數(shù)據(jù)、機構(gòu)數(shù)據(jù)和空間數(shù)據(jù),利用智能標引、文本挖掘、多源異構(gòu)融合、泛在互聯(lián)、量化分析、多維可視化展示等技術(shù),促進細顆粒度資源挖掘、跨領(lǐng)域數(shù)據(jù)關(guān)聯(lián)、多維度計量分析和可視化故事表達,實現(xiàn)科學(xué)性數(shù)據(jù)決策、場景化閱讀感知和交互式知識發(fā)現(xiàn),進而促進知識資源的智慧流轉(zhuǎn)和知識服務(wù)的價值再造。智慧圖書館知識資源建設(shè)涉及的要素很多,本文從數(shù)據(jù)要素、技術(shù)要素、場景要素和功能要素四個維度入手進行分析。其中,數(shù)據(jù)要素是基礎(chǔ),技術(shù)要素是關(guān)鍵,場景要素是目標,功能要素是價值體現(xiàn)。
知識資源建設(shè)的基礎(chǔ)是圖書館豐富的數(shù)據(jù)要素。圖書館是資源的集散地,長期致力于資源采集加工、知識組織和傳播傳承,傳統(tǒng)圖書館的數(shù)據(jù)通常包括資源數(shù)據(jù)、用戶數(shù)據(jù)和機構(gòu)數(shù)據(jù),這些數(shù)據(jù)廣泛存在于管理系統(tǒng)中。資源數(shù)據(jù)規(guī)模大,具有跨領(lǐng)域、多種類、來源不同、粒度不一、格式迥異、缺乏關(guān)聯(lián)的特點,跨機構(gòu)的共建與資源共享為知識資源建設(shè)奠定了一定的數(shù)據(jù)基礎(chǔ)。智慧圖書館語境下知識資源的數(shù)據(jù)要素應(yīng)從全方位、立體化、資產(chǎn)化的角度考慮建設(shè)綜合性的數(shù)據(jù)生態(tài),在傳統(tǒng)的以文獻為基礎(chǔ)的對象數(shù)據(jù)和元數(shù)據(jù)建設(shè)的基礎(chǔ)上,還應(yīng)新增本體數(shù)據(jù)、三維立體資源和數(shù)據(jù)集資源。用戶數(shù)據(jù)不僅包括用戶的基本信息數(shù)據(jù),還應(yīng)增加用戶行為數(shù)據(jù)、行業(yè)監(jiān)測數(shù)據(jù)。機構(gòu)數(shù)據(jù)在充分梳理各成員機構(gòu)的管理數(shù)據(jù)和服務(wù)數(shù)據(jù)的基礎(chǔ)上,應(yīng)向時空角度延伸,新增空間數(shù)據(jù)和業(yè)務(wù)流程數(shù)據(jù)。
知識資源建設(shè)的條件是可被廣泛應(yīng)用的新型智能技術(shù),如智能標引、文本挖掘、量化分析、關(guān)聯(lián)數(shù)據(jù)、知識圖譜和區(qū)塊鏈等技術(shù),它們?yōu)橹R資源建設(shè)提供了路徑和解決方案。如:利用本體技術(shù)從高層視角實現(xiàn)對隱性知識的顯性表示,將異構(gòu)資源納入統(tǒng)一的知識模型中;利用知識圖譜技術(shù)建立抽象的知識共享模型,達到統(tǒng)一的知識建模和知識表示,進而提供語義分析和個性化的知識發(fā)現(xiàn)服務(wù)。
智慧圖書館背景下的知識資源服務(wù)場景可總結(jié)為空間體驗服務(wù)、泛在閱讀服務(wù)、情境閱讀服務(wù)、虛擬參考咨詢服務(wù)、虛擬在線教育服務(wù)、用戶互動與反饋服務(wù)。從總體來看,知識服務(wù)是知識資源建設(shè)的根本目標,智慧圖書館的建設(shè)應(yīng)該更好地整合、組織和定位資源,以幫助用戶更容易、更快速、更高效地利用圖書館的資源,支持用戶自主知識發(fā)現(xiàn)。如:為研究者提供大數(shù)據(jù)分析工具和語義檢索、關(guān)系發(fā)現(xiàn)、自主專題生成等個性化的知識定制服務(wù),幫助用戶自主知識發(fā)現(xiàn);通過智慧服務(wù)設(shè)備和智慧服務(wù)空間(如RFID、智能書架、智能門禁與人臉識別、智能展覽、智能監(jiān)控、智能機器人等)實現(xiàn)智慧服務(wù)場景的嵌入與融合;基于已有平臺優(yōu)勢為用戶提供增值服務(wù),包括用戶的個人活動管理、用戶評價、閱讀報告、學(xué)科分析、自動查新與科技報告等。
知識資源建設(shè)的價值是依靠功能要素實現(xiàn)的,傳統(tǒng)圖書館的功能包括社會記憶功能、知識管理功能、文化教育功能和文明傳承與發(fā)展功能。智慧圖書館在新時代也承擔(dān)了新的智慧服務(wù)理念和價值觀,強調(diào)在具體的服務(wù)過程中,全面捕捉、記錄和分析讀者行為和偏好,從而融通資源優(yōu)勢,建立多維的服務(wù)體系和形式,其目標是促進資源挖掘從“事實—信息—智力—知識—智慧”的功能進階(見圖1)。
圖1 知識獲取模型框架
根據(jù)數(shù)據(jù)生命周期和圖書館資源開發(fā)利用的基本模式及其理論基礎(chǔ),結(jié)合智慧圖書館數(shù)據(jù)類型和特點,本研究構(gòu)建了“解構(gòu)抽取—融合重構(gòu)—人文呈現(xiàn)”的知識資源建設(shè)方法論模型(見圖 2)。
圖2 知識資源建設(shè)方法論模型
傳統(tǒng)的書目著錄往往以資源種類或篇章作為最小單元,無法充分揭示資源內(nèi)容特征和發(fā)揮文獻整合利用的功能,在知識元、關(guān)聯(lián)數(shù)據(jù)等概念提出后,傳統(tǒng)的文獻著錄單元讓位于知識單元。
知識資源的聚合是解構(gòu)抽取的基礎(chǔ),即通過文獻整合、聯(lián)盟性整合及跨學(xué)科互操作等方式建立大型的知識庫群,匯聚海量網(wǎng)絡(luò)信息資源、各類數(shù)字文獻資源和特色館藏自建資源,將資源的聚合視角從傳統(tǒng)的載體形式擴展到內(nèi)容、時空和知識體系。在智慧圖書館建設(shè)背景下,知識資源建設(shè)的關(guān)注點從單件文獻的數(shù)字化保存與著錄轉(zhuǎn)向?qū)χR內(nèi)容的解構(gòu)和知識單元的建設(shè),利用語義網(wǎng)、知識圖譜、大數(shù)據(jù)、智能計算等技術(shù),開展對知識資源的細顆粒度內(nèi)容標識、關(guān)鍵知識點的標簽和標引建設(shè),在對文獻的形式結(jié)構(gòu)和邏輯結(jié)構(gòu)分析的基礎(chǔ)上,構(gòu)建細顆粒著錄的數(shù)據(jù)框架[8],并根據(jù)不同層級的細顆粒度知識單元設(shè)置著錄字段,最終的著錄成果為XML 格式的數(shù)據(jù)信息,為資源的精細化揭示和知識化、專題化服務(wù)奠定基礎(chǔ)。
本研究提出知識資源解構(gòu)抽取的兩個維度:基于知識結(jié)構(gòu)的文獻著錄和基于文獻內(nèi)容的知識標引?;谥R結(jié)構(gòu)的文獻著錄以文獻的最小單元為加工單位,拆分各組成要素,得到由文獻層、節(jié)段單元層和知識單元層組成的細粒度描述單元。在此基礎(chǔ)上開展知識內(nèi)容標引,標引對象一般從文獻內(nèi)容出發(fā),以人物、機構(gòu)、地理名稱、事件或其他具有標目意義的關(guān)鍵詞為標引單元,各個知識實體均具有屬性值。如:人的屬性包括姓名、性別、出生日期、國籍、所屬機構(gòu)、親屬關(guān)系、作品等;事件的屬性包括事件名稱、重要人物、主要地點、過程、結(jié)果等;地理名稱的屬性包括地名、年代、沿革、隸屬、地理位置等;書目資源的屬性包括標題、名稱、出版社、責(zé)任者、語言、版權(quán)、標識號、來源等。
針對解構(gòu)抽取環(huán)節(jié)提煉出了細顆粒度的知識單位,利用知識本體、語義知識圖譜等技術(shù),按照特定的邏輯進行關(guān)聯(lián),以形成特定主題下規(guī)范有序的知識網(wǎng)絡(luò)。泛在互聯(lián)下的多維度組織通過自上而下的知識組織形式抽象出獨立于領(lǐng)域且與資源的載體和格式無關(guān)的高層互操作層,是對知識的整理、加工、揭示、控制及有序化操作。
融合重構(gòu)的核心是構(gòu)建知識組織本體和搭建知識圖譜。構(gòu)建知識組織本體一方面包括需要復(fù)用已有的領(lǐng)域本體,并在此基礎(chǔ)上補充相關(guān)元素加以改進,另一方面則需要自建本體,篩選本領(lǐng)域相關(guān)的元數(shù)據(jù)標準,構(gòu)建術(shù)語詞表,定義類和屬性,完成本體模型的設(shè)計和轉(zhuǎn)換。知識圖譜是充分利用和有效呈現(xiàn)細粒度標引資源的關(guān)鍵方法,為深層次的資源知識發(fā)現(xiàn)提供了可能,知識圖譜的構(gòu)建主要通過語義關(guān)聯(lián)和系統(tǒng)構(gòu)建兩個步驟。語義關(guān)聯(lián)是指基于細顆粒度標引的知識實體屬性信息,構(gòu)建知識實體之間、屬性之間、知識實體與屬性之間的關(guān)系,通過元數(shù)據(jù)框架完成書目關(guān)系和字段的映射擴展;系統(tǒng)構(gòu)建是通過知識獲取、知識存儲、知識建模和知識發(fā)布與服務(wù)四個流程完成知識圖譜的運維和操作。知識圖譜技術(shù)可以利用先進的挖掘算法分析圖譜關(guān)聯(lián)路徑,對資源相關(guān)的人、事、地、時等基礎(chǔ)要素潛藏關(guān)系進行挖掘[9],并以可視化的方式完成展示,如針對“人”的社會網(wǎng)絡(luò)關(guān)系構(gòu)建和時空軌跡構(gòu)建,針對“事”的歷史線索串聯(lián)等。
圖3 知識資源融合重構(gòu)架構(gòu)
人文呈現(xiàn)是大數(shù)據(jù)時代的新課題,傳統(tǒng)圖書館往往更關(guān)注數(shù)據(jù)建模、數(shù)據(jù)整合等數(shù)據(jù)處理業(yè)務(wù),但有一項關(guān)鍵技能經(jīng)常被忽視:清晰有效地表達數(shù)據(jù)結(jié)果的能力,即數(shù)據(jù)的人文呈現(xiàn)能力。數(shù)據(jù)的人文呈現(xiàn)是數(shù)據(jù)科學(xué)的“最后一公里”問題[10],其重點是將數(shù)據(jù)中的價值內(nèi)容傳遞出去,智慧圖書館的知識資源呈現(xiàn)更需要將數(shù)據(jù)洞察力轉(zhuǎn)換為數(shù)據(jù)行動力,完成數(shù)據(jù)可視化產(chǎn)品和數(shù)據(jù)故事化產(chǎn)品的開發(fā)。
本研究認為,知識資源的人文呈現(xiàn)主要涉及兩方面內(nèi)容:數(shù)據(jù)可視化與故事化表達。數(shù)據(jù)可視化強調(diào)易于理解、易于感知和易于洞察,而故事化表達則強調(diào)易于記憶、易于認知和易于體驗。知識資源的人文呈現(xiàn)分為兩個基本步驟:從數(shù)據(jù)到可視化模型(通過可視化建模)以及從可視化模型到故事化表達(通過故事化敘事)。數(shù)據(jù)呈現(xiàn)涉及時空維度、目的維度、場景維度:時空維度以帶有空間坐標或時間信息的數(shù)據(jù)的可視化為重點;目的維度包括說明型數(shù)據(jù)呈現(xiàn)、解釋型數(shù)據(jù)呈現(xiàn)、陳述型數(shù)據(jù)呈現(xiàn)和預(yù)測型數(shù)據(jù)呈現(xiàn);場景維度包括虛擬教育服務(wù)、專題特色資源推介、立體資源整合、文化遺產(chǎn)實物數(shù)字化延展、空間智能導(dǎo)航、用戶信息分析等角度。
圖4 知識資源的人文呈現(xiàn)模型
綜上所述,智慧圖書館知識資源建設(shè)的本質(zhì)是立體化的數(shù)據(jù)收集、智能化的數(shù)據(jù)解構(gòu)、泛在化的知識組織和全方位的知識呈現(xiàn),通過知識解構(gòu)、知識組織和知識呈現(xiàn),達到知識融通的目的。
智慧圖書館中知識資源建設(shè)對公共圖書館館藏資源的挖掘、展示、重構(gòu)與傳承具有重要的意義。本文在提出“解構(gòu)抽取—融合重構(gòu)—人文呈現(xiàn)”的知識資源建設(shè)路徑的基礎(chǔ)上,從數(shù)據(jù)層、組織層和消費層總結(jié)了知識資源建設(shè)的策略選擇。
知識資源解構(gòu)的核心是構(gòu)建單元層級的細顆粒度加工框架,細顆粒度加工框架是文獻資源全部數(shù)據(jù)描述信息的集合,分為文獻層、片段單元層、知識單元層等三個層級。
4.1.1 文獻層
文獻層描述文獻的基本元數(shù)據(jù)信息,書目數(shù)據(jù)內(nèi)容包含題名、責(zé)任者、出版信息、主題詞、分類號等字段。
4.1.2 片段單元層
片段單元層依據(jù)加工對象的文獻形態(tài)、邏輯結(jié)構(gòu)、服務(wù)需求等確定知識資源的加工粒度,標引的對象一般按照文獻結(jié)構(gòu)的最小單元劃分,如:圖書類資源的文獻結(jié)構(gòu)單元一般包括:封面、題詞頁、書名頁、出版說明、版權(quán)頁、序、前言、凡例、目次、正文篇章、圖表、參考文獻、附錄、索引、插頁、后記(跋)、封底等;報紙一般以單篇文章(單個廣告)作為著錄單元;古籍文獻結(jié)構(gòu)單元一般包括:封面、版權(quán)頁、題名頁、牌記、序、凡例、正文各卷、跋、簽條、封底等。片段單元層的著錄內(nèi)容包括基本信息著錄、內(nèi)容著錄和連接著錄?;拘畔影俗R符、結(jié)構(gòu)類型、語種、名稱、創(chuàng)建者、著錄對象的起止頁、總頁數(shù)、摘要等;內(nèi)容著錄涉及內(nèi)容層面的信息標引,包括分類號、關(guān)鍵詞、個人名稱、機構(gòu)名稱、地理名稱、事件名稱等,標引詞盡量復(fù)用受控詞表,在無特定受控詞表的情況下,可選擇自由詞或依據(jù)主題設(shè)計分類標簽體系;連接著錄通過唯一標識符信息關(guān)聯(lián)文獻層和圖表層,著錄來源文獻ID、參考文獻、圖表ID 等。
4.1.3 知識單元層
知識單元層在語篇和句群結(jié)構(gòu)分析的基礎(chǔ)上對知識內(nèi)容的語義功能進行描述,知識單元的體量與維度并非固定的,可能存在于同一個語句中,也可能是多個語段、篇章的集合。
在劃分不同層級的細粒度片段單元后,針對片段單元中抽取的人物、機構(gòu)、事件、地理名稱等其他具有標目意義的關(guān)鍵詞作為標目開展知識標引,參照文獻著錄規(guī)則完成知識單元著錄。如:針對人物知識單元的標引,除了對人物名稱、性別、時代、生卒年、籍貫、職官等進行著錄外,同時標引關(guān)系人物、關(guān)系事件和關(guān)系機構(gòu);針對特色知識單位的專題標引,例如對古籍鈐印的印文、印章、印主等內(nèi)容進行標引。
最終借助知識定位技術(shù)及單元層關(guān)聯(lián)技術(shù),在文獻層、片段單元層、知識單元層之間按照聚合單元層級組織相互關(guān)聯(lián)的數(shù)據(jù)ID 形成知識體系。
圖5 不同層級的信息組織框架
本研究在總結(jié)知識資源融合重構(gòu)的方法論模型的基礎(chǔ)上,從學(xué)科建設(shè)、文獻內(nèi)容建設(shè)和知識圖譜服務(wù)三個角度提出了知識資源組織與揭示的建設(shè)方向。
4.2.1 基于圖書情報學(xué)的領(lǐng)域本體模型
在學(xué)科建設(shè)方面,本文以圖書情報學(xué)為例展開論述,利用已有的學(xué)術(shù)專著梳理出圖書情報學(xué)的學(xué)科體系結(jié)構(gòu),以此為基礎(chǔ)對領(lǐng)域本體的概念集進行第一次分類,然后對每一個大類進行二次分類,再選擇部分二級類目進行更細致的分類,所得類目即為核心概念集。根據(jù)權(quán)威圖書情報學(xué)教材《圖書館學(xué)概論》《圖書情報學(xué)發(fā)展導(dǎo)覽》《圖書館學(xué)研究概論》將圖書情報學(xué)的領(lǐng)域知識劃分為4 個大類,分別為圖書情報學(xué)、圖書情報學(xué)研究代表人物、圖書館以及文獻。
(1) 圖書情報學(xué)類。該類下設(shè)3 個子類:① 圖書情報學(xué)基礎(chǔ)理論,主要研究和闡明圖書情報學(xué)的研究對象、學(xué)科性質(zhì)、社會職能等;② 圖書情報學(xué)研究方法,主要研究圖書情報學(xué)常用的研究方法,如文獻研究法、訪問研究法、調(diào)查研究法、實驗研究法、統(tǒng)計分析法、歷史研究法、文獻計量法等;③ 圖書情報學(xué)應(yīng)用技術(shù),主要研究文獻保護、縮微、計算機管理等新技術(shù)如何應(yīng)用于圖書館學(xué)研究。
(2)圖書情報學(xué)研究代表人物類。該類下設(shè)子類:國內(nèi)圖書情報學(xué)者、國外圖書情報學(xué)者。
(3)圖書館類。該類下設(shè)4 個子類:① 圖書館事業(yè),主要研究圖書館歷史、圖書館事業(yè)結(jié)構(gòu)、圖書館聯(lián)盟和圖書館法;② 圖書館業(yè)務(wù),主要研究圖書館業(yè)務(wù)機構(gòu)設(shè)置,包括文獻資源建設(shè)、用戶服務(wù)、特色館藏建設(shè)、自動化管理等;③ 圖書館管理,主要研究圖書館規(guī)章制度設(shè)計、圖書館統(tǒng)計、圖書館工作評價與圖書館評估等;④ 數(shù)字圖書館,主要研究虛擬圖書館、智慧圖書館等。
(4)文獻類。文獻的子類則分別按時間、內(nèi)容和載體等進行劃分,在完成圖書情報學(xué)領(lǐng)域本體框架構(gòu)建后,基于對每個類的分析,可為每個類設(shè)定屬性集,定義類目概念之間的相互關(guān)系,并創(chuàng)建若干類的實例。
4.2.2 基于文獻內(nèi)容的本體關(guān)系模型
采用本體建模方法,構(gòu)建人物類、時間類、地點類、事件類、機構(gòu)類、實物類、作品類,并設(shè)計類間關(guān)系描述模型。
人物類可細分為責(zé)任者和內(nèi)容人物,同時可按性別、職業(yè)、家庭關(guān)系、社會地位等進行屬性描述;機構(gòu)類可細分為內(nèi)容組織、責(zé)任者單位和出版單位;事件類可按軍事活動、文化活動、政治活動、宗教活動、經(jīng)濟活動、心理活動、自然活動細分;時間類可細分為創(chuàng)作時間和出版時間;地點類可細分為創(chuàng)作地點和內(nèi)容地點。
在各類知識實體細分的基礎(chǔ)上,以文獻的知識單元為父節(jié)點,定義不同知識單元間的關(guān)系,關(guān)系屬性可以通過繼承機制進行擴展和衍生,從而勾畫出文獻資源中的重要人物、組織機構(gòu)和事件之間的關(guān)系,建立起知識單元網(wǎng)絡(luò)。關(guān)系類別一般從內(nèi)容特征角度進行描述,如表1 列出了部分人物、機構(gòu)、時間、空間、作品等知識單元之間的關(guān)聯(lián)關(guān)系。
表1 知識單元間語義關(guān)系定義
4.2.3 強化數(shù)據(jù)感知的知識圖譜
知識圖譜能夠?qū)⒅R及知識間的關(guān)系轉(zhuǎn)化為可理解的視覺表達形式,特別是在瀏覽、研究大規(guī)模數(shù)據(jù)時,有助于發(fā)現(xiàn)隱藏特征和規(guī)律。本研究提出知識圖譜服務(wù)的兩種應(yīng)用場景:關(guān)聯(lián)關(guān)系知識圖譜和發(fā)展變化知識圖譜。
(1)關(guān)聯(lián)關(guān)系知識圖譜的建設(shè)對象一般為文獻資源、敘詞表或知識條目信息,建設(shè)內(nèi)容包括資源語義網(wǎng)絡(luò)、主題敘詞表思維導(dǎo)圖或知識條目關(guān)聯(lián)圖譜,一般采用旭日圖、元堆圖、樹狀圖、氣泡圖、結(jié)構(gòu)圖、熱力圖、標簽云、網(wǎng)絡(luò)圖等可視化呈現(xiàn)形態(tài)將知識及知識間的關(guān)系轉(zhuǎn)化為可理解的視覺表達,對數(shù)據(jù)中的人、事、物等構(gòu)建社會網(wǎng)絡(luò),理清社會關(guān)系,將用戶與資源密切關(guān)聯(lián),重點關(guān)注高頻出現(xiàn)的資源與用戶信息,實現(xiàn)知識資源的多重關(guān)系發(fā)現(xiàn)。
(2)發(fā)展變化知識圖譜建立在知識計算的基礎(chǔ)上,通過文本分析、社會網(wǎng)絡(luò)分析、知識挖掘等技術(shù)方法,揭示資源集合中內(nèi)在結(jié)構(gòu)特征,發(fā)現(xiàn)海量數(shù)字化對象中隱藏的知識脈絡(luò)與演化規(guī)律。如:通過詞頻統(tǒng)計、詞匯共現(xiàn)、時空演化技術(shù)分析資源內(nèi)容特征與演化趨勢;通過跨文本比對、知識片段比對的方式展示知識流變歷程;通過提供文本分析工具和開放數(shù)據(jù)形式幫助用戶自主完成知識發(fā)現(xiàn),實現(xiàn)跨領(lǐng)域共建共治共享;通過時空敘事圖譜、地圖、時間軸等方式展示資源內(nèi)容或社會記憶的發(fā)展變遷。
新型數(shù)字資源是指運用VR、AR、MR 多種數(shù)字創(chuàng)意技術(shù),將原始紙質(zhì)文獻的物理形態(tài)在三維立體空間中形象地還原初始風(fēng)貌,并進行故事化解讀,為讀者提供交互性、立體化和沉浸式的多維度閱讀體驗。新型數(shù)字資源具有虛擬性、交互性、臨場感、沉浸性特征,強調(diào)為讀者創(chuàng)設(shè)一種視覺、聽覺、觸覺的三維立體感受,營造虛實場景深度融合效果,產(chǎn)生身臨其境之感。其加工對象既包括文化遺產(chǎn)等重要實物資源,又包括古籍特藏等傳統(tǒng)文獻內(nèi)容。
4.3.1 新型數(shù)字資源的應(yīng)用場景
一是主題閱讀推廣,遴選適用于閱讀推廣的內(nèi)容,讓用戶充分了解主題資源的知識背景,完成知識解讀,引導(dǎo)深度閱讀。建設(shè)主題包括:教育、科幻、藝術(shù)、音樂、旅游、民俗、中華優(yōu)秀傳統(tǒng)文化。二是文化遺產(chǎn)的數(shù)字化保護與傳承,針對稀缺資源,通過虛擬現(xiàn)實等技術(shù)創(chuàng)建立體影像,構(gòu)筑三維立體展示空間,有效保存和傳承文化遺產(chǎn)資源,為圖書館資源開發(fā)注入活力。建設(shè)主題包括:古籍、善本、手稿、膠片等特殊類型文獻。三是圖書館館藏特色資源推介,通過對館藏特色資源的加工整理,構(gòu)建三維影像,融合語音、圖片、文字、文獻鏈接等信息,串聯(lián)人物、時間、事件、地理人文等要素,將文本、書籍、圖片、人文地理和音視頻等不同資源類型進行立體呈現(xiàn),為用戶提供系統(tǒng)、全面的主題化資源推介服務(wù)。建設(shè)主題包括:地域特藏文獻、古籍(民國)特藏、名人大家特藏、專題領(lǐng)域特藏。四是紅色文化資源開發(fā),充分挖掘紅色文化資源的豐富內(nèi)涵,利用實物史料創(chuàng)作虛擬場景,增強紅色教育的生動性。建設(shè)主題包括:紅色文獻、革命傳統(tǒng)資源、警示教育資源、廉政文化資源。五是虛擬教育課程的開發(fā),融合虛擬現(xiàn)實技術(shù)和MOOC 優(yōu)勢,借助多媒體、仿真、虛擬現(xiàn)實等技術(shù),設(shè)計教學(xué)任務(wù)、課程、過程和細節(jié),建設(shè)線上新型教育課程,讓學(xué)習(xí)者產(chǎn)生沉浸式學(xué)習(xí)體驗。建設(shè)主題包括:思政類、醫(yī)學(xué)類、藝體類、地理類、建筑類、消防安全教育等。除此之外,還可以從立體資源整合、智能導(dǎo)航、游戲體驗服務(wù)等角度開展新型數(shù)字資源建設(shè)。
4.3.2 新型數(shù)字資源的建設(shè)路徑
一是VR 虛擬現(xiàn)實全景視頻內(nèi)容制作,利用虛擬現(xiàn)實技術(shù)挖掘圖書館特色資源,推動現(xiàn)有館藏特色文本數(shù)據(jù)向虛擬現(xiàn)實內(nèi)容轉(zhuǎn)移,推進古籍等特色資源的深度利用。二是AR 增強現(xiàn)實場景可讀服務(wù),利用AR 掃描、實景拍攝、3D 建模等技術(shù)助推文旅融合,串聯(lián)線下文旅資源,鏈接館藏檢索系統(tǒng),動態(tài)展示相關(guān)的背景知識和館藏狀態(tài)。三是MR 混合現(xiàn)實內(nèi)容制作,將虛擬場景和現(xiàn)實場景相結(jié)合,突破傳統(tǒng)空間呈現(xiàn)形態(tài),產(chǎn)生隔空互動的效果。四是虛擬漫游導(dǎo)航系統(tǒng),對場館進行高精度還原,將圖書館藏品以720°形態(tài)呈現(xiàn)在觀眾面前。五是歷史文化時空地圖,將地方重大歷史文化事件與地圖結(jié)合,通過時空地圖方式快速瀏覽歷史文化變遷。六是文旅知識圖譜應(yīng)用,采用圖譜等不同知識可視化形態(tài),將重要歷史人物、文獻、歷史事件等百科內(nèi)容全景式呈現(xiàn)給讀者。七是其他發(fā)展創(chuàng)新服務(wù),從虛擬教育服務(wù)、館藏資源推介、立體資源整合、智能導(dǎo)航、文獻評價、遠程服務(wù)等角度開展新型數(shù)字資源建設(shè),創(chuàng)新服務(wù)方式,增強服務(wù)效果,實現(xiàn)資料、實物、場景的深度揭示、關(guān)聯(lián)、展現(xiàn),乃至沉浸式體驗和應(yīng)用。
知識資源是智慧圖書館建設(shè)的核心智慧,智慧圖書館知識資源的構(gòu)成主要包括數(shù)據(jù)要素、技術(shù)要素、場景要素和功能要素四個部分。本文提出了“解構(gòu)抽取-融合重構(gòu)-人文呈現(xiàn)”的知識資源建設(shè)的方法論模型,“解構(gòu)抽取”包括基于知識結(jié)構(gòu)的文獻著錄和基于文獻內(nèi)容的知識標引,核心是構(gòu)建單元層級的細顆粒度加工框架,分為文獻層、片段單元層、知識單元層等三個層級;“融合重構(gòu)”的核心是構(gòu)建知識組織本體和搭建知識圖譜,本文提出了圖書情報學(xué)的領(lǐng)域本體模型、基于文獻內(nèi)容的本體關(guān)系模型和知識圖譜可視化的建設(shè)方向;“人文呈現(xiàn)”主要涉及數(shù)據(jù)可視化與故事化表達兩方面內(nèi)容,本文提出了智慧圖書館背景下新型數(shù)字資源的應(yīng)用場景和建設(shè)路徑,希望這些有關(guān)知識資源建設(shè)的內(nèi)涵、路徑和策略方法的研究能對全國智慧圖書館體系構(gòu)建有所助益。