錢海鋼
[廣東省立中山圖書館(廣東省古籍保護(hù)中心),廣東 廣州 510110]
《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》第十六章“加快數(shù)字社會(huì)建設(shè)步伐”第一節(jié)明確指出“要推進(jìn)智慧圖書館建設(shè),提供智慧便捷的公共服務(wù)”[1]。文化和旅游部、國(guó)家圖書館也提出“全國(guó)智慧圖書館體系”建設(shè)項(xiàng)目,建設(shè)的總體架構(gòu)可以歸納為“1+3+N”,其中“1”是指1個(gè)“云上智慧圖書館”,“3”是指搭載其上的全網(wǎng)知識(shí)內(nèi)容集成倉儲(chǔ)、全國(guó)智慧圖書館管理系統(tǒng)和全域智慧化知識(shí)服務(wù)運(yùn)營(yíng)環(huán)境,“N”是指在全國(guó)各級(jí)圖書館及其基層服務(wù)點(diǎn)普遍建立線下智慧服務(wù)空間?!?+3+N”為未來智慧圖書館體系建設(shè)做了初步頂層設(shè)計(jì)和規(guī)劃,設(shè)立了總體思路和建設(shè)目標(biāo)[2]。
圖書館資源有廣義和狹義之分。廣義的圖書館資源是指“圖書館為將資源利用而組織起來的相互聯(lián)系的多種資源的動(dòng)態(tài)有機(jī)整體”,包括信息資源、人力資源、館舍、設(shè)備、技術(shù)、資金等。狹義的圖書館資源是指界定為館藏的信息資源,主要類型有紙質(zhì)書刊資料、紙質(zhì)特種文獻(xiàn)等正式文獻(xiàn),書信書稿等非正式出版物,磁盤光盤出版物,自有數(shù)字化文獻(xiàn)數(shù)據(jù)庫、館藏書目數(shù)據(jù)、可授權(quán)訪問的數(shù)字資源(主要是圖書館購買的可遠(yuǎn)程訪問或通過鏡像訪問的各類數(shù)據(jù)庫產(chǎn)品)。另外,圖書館的服務(wù)數(shù)據(jù)也被認(rèn)為是圖書館資源,如讀者的借閱記錄等。這些信息資源一般不直接用于讀者服務(wù),但它們能夠幫助圖書館了解讀者,了解圖書館服務(wù)狀況,從而達(dá)到優(yōu)化讀者服務(wù)的目的。筆者所述的圖書館資源限于狹義圖書館資源。
1.1.1 國(guó)內(nèi)資源發(fā)現(xiàn)系統(tǒng)發(fā)展演進(jìn)較晚
2005年,Google Scholar發(fā)布后,M.Breeding意識(shí)到Google Scholar的搜索模式是當(dāng)時(shí)的聯(lián)邦檢索系統(tǒng)所不能比擬的,于是他提出了“集中搜索”模型用以應(yīng)對(duì)。該模型是資源發(fā)現(xiàn)系統(tǒng)的原型,國(guó)內(nèi)外學(xué)者們對(duì)資源發(fā)現(xiàn)系統(tǒng)作出了定義[3]。國(guó)外學(xué)者以原型為基礎(chǔ),在資源發(fā)現(xiàn)系統(tǒng)的應(yīng)用、成效和影響等方面進(jìn)行了探討。國(guó)內(nèi)實(shí)踐相對(duì)較晚,多集中于具體個(gè)案的實(shí)施。經(jīng)過多年的發(fā)展,資源發(fā)現(xiàn)系統(tǒng)的首頁極似谷歌或百度搜索引擎,提供了單一檢索框、按相關(guān)性排序、集中索引等功能[4-6]。
1.1.2 研究?jī)?nèi)容以實(shí)踐工作為主,理論研究不足
無論是國(guó)內(nèi)還是國(guó)外,對(duì)圖書館資源發(fā)現(xiàn)系統(tǒng)的研究主要集中在用戶需求、系統(tǒng)對(duì)比、部署經(jīng)驗(yàn)、效能評(píng)價(jià)等與實(shí)踐緊密聯(lián)系的方面,在理論研究方面較為欠缺[7-10]。
1.1.3 檢索結(jié)果龐大,用戶需具備更強(qiáng)的信息素養(yǎng)
資源發(fā)現(xiàn)系統(tǒng)能夠根據(jù)用戶的檢索詞最大化發(fā)現(xiàn)挖掘資源,為用戶提供更多的相關(guān)檢索結(jié)果以及更多可能的答案和選擇[11]。同時(shí),面對(duì)眾多檢索結(jié)果集,如何從中準(zhǔn)確地選擇一個(gè)自己想要的結(jié)果是考驗(yàn)用戶的一個(gè)難題,需要用戶擁有更強(qiáng)的信息素養(yǎng)能力[12]。
1.2.1 知識(shí)圖譜被用于圖書館員、圖書館資源可視化管理
利用知識(shí)圖譜重塑圖書館員目錄,以動(dòng)態(tài)的方式揭示他們之間的關(guān)系,提高館員管理的可視性,從而帶來更全面的了解和更高水平的協(xié)作潛力[13]。如,哈佛大學(xué)的中國(guó)歷代人物傳記資料庫(CBDB),將其收錄的41萬人的傳記和著作資料用圖譜的方式可視化,清晰地揭示了人物關(guān)系和著作關(guān)系[14]。
1.2.2 利用知識(shí)圖譜分析文獻(xiàn)情況
使用CiteSpace工具構(gòu)建知識(shí)圖譜并進(jìn)行深入解析,從圖書館資源建設(shè)、服務(wù)創(chuàng)新、技術(shù)實(shí)現(xiàn)3個(gè)角度探討圖書館個(gè)性化推薦研究的發(fā)展趨勢(shì),并提出相應(yīng)建議[15-17]。
1.2.3 利用知識(shí)圖譜實(shí)現(xiàn)某種圖書館知識(shí)可視化服務(wù)的探討
一是利用語義網(wǎng)對(duì)學(xué)術(shù)領(lǐng)域?qū)嶓w和實(shí)體間的關(guān)聯(lián)關(guān)系構(gòu)建知識(shí)圖譜,實(shí)現(xiàn)圖書館參考咨詢智能問答系統(tǒng)的知識(shí)庫構(gòu)建[18]。二是提出以跨媒體知識(shí)圖譜構(gòu)建和管理為核心、跨媒體知識(shí)發(fā)現(xiàn)和創(chuàng)新為關(guān)鍵的跨媒體知識(shí)服務(wù)實(shí)現(xiàn)路徑,以期為其深入研究提供參考[19]。三是利用知識(shí)圖譜技術(shù)對(duì)數(shù)字圖書館資源進(jìn)行知識(shí)聚合的可視化模型構(gòu)建,以期為數(shù)字圖書館資源的細(xì)粒度聚合對(duì)象挖掘、多維度知識(shí)結(jié)構(gòu)揭示、靜動(dòng)態(tài)交互知識(shí)可視化展示及精準(zhǔn)化知識(shí)分析應(yīng)用提供參考借鑒,推進(jìn)數(shù)字圖書館知識(shí)資源在縱深層面的再組織與再利用[20]。另外,上海圖書館基于家譜文獻(xiàn),通過關(guān)聯(lián)數(shù)據(jù)技術(shù),發(fā)布了家譜知識(shí)服務(wù)平臺(tái),直接讓讀者接觸到數(shù)據(jù)、事實(shí)和知識(shí)[21]。
綜上所述,資源發(fā)現(xiàn)系統(tǒng)尚無一種能夠幫助用戶快速、準(zhǔn)確、智能地選擇資源的解決辦法,而知識(shí)圖譜技術(shù)是一種智慧數(shù)據(jù),是有語義、自解釋、可計(jì)算、能行動(dòng)的信息單元,能夠?qū)⒏黝悢?shù)據(jù)(用戶和資源)關(guān)聯(lián)并直觀地展示給用戶,助力圖書館資源發(fā)現(xiàn)服務(wù)智慧化,以克服現(xiàn)階段資源發(fā)現(xiàn)系統(tǒng)的缺點(diǎn)。雖然知識(shí)圖譜在圖書館領(lǐng)域的應(yīng)用已有少量成果,如在數(shù)字圖書館方面的應(yīng)用,但鮮有圖書館資源智慧服務(wù)的研究。筆者嘗試對(duì)知識(shí)圖譜技術(shù)在圖書館資源智慧發(fā)現(xiàn)和服務(wù)過程中的應(yīng)用進(jìn)行研究,借助知識(shí)圖譜的智慧數(shù)據(jù)特性挖掘圖書館資源,用全新的角度去發(fā)現(xiàn)、構(gòu)建智慧服務(wù)體系,以期為智慧圖書館建設(shè)提供一種思路和借鑒。
商業(yè)營(yíng)銷的核心主體是“人、貨、場(chǎng)”,分別指消費(fèi)者、商品、場(chǎng)景[22]。商業(yè)活動(dòng)中用好“人、貨、場(chǎng)”模型即可獲得營(yíng)收的增長(zhǎng)。同樣,把該模型運(yùn)用到圖書館,“人”即是讀者,“貨”即是文獻(xiàn)資源,“場(chǎng)”即是服務(wù)場(chǎng)景。要明確目標(biāo)讀者,文獻(xiàn)資源是讀者想要的,服務(wù)場(chǎng)景要有舒適的體驗(yàn)。圖書館要研究目標(biāo)讀者的閱讀喜好、閱讀習(xí)慣,才能有針對(duì)性地推出滿足需求的文獻(xiàn);文獻(xiàn)資源只有適合目標(biāo)讀者才能吸引更多人前來閱讀;人性化的服務(wù)場(chǎng)景能給讀者以良好的場(chǎng)景體驗(yàn)。圖書館要運(yùn)用好“人、貨、場(chǎng)”模型,把“貨”盤好,提高圖書館資源的管理和服務(wù)效能,以及提供智慧型資源服務(wù),為此,筆者從基于知識(shí)圖譜技術(shù)的圖書館資源組織、揭示、發(fā)現(xiàn)和服務(wù)方面予以討論。
現(xiàn)階段,國(guó)內(nèi)外的資源數(shù)據(jù)庫主要分為導(dǎo)航型數(shù)據(jù)庫與全文數(shù)據(jù)庫,其中導(dǎo)航型數(shù)據(jù)庫包括書目數(shù)據(jù)庫、題錄數(shù)據(jù)庫,文摘數(shù)據(jù)庫等;全文數(shù)據(jù)庫包括圖片數(shù)據(jù)庫、多媒體數(shù)據(jù)庫等。全文數(shù)據(jù)庫比導(dǎo)航數(shù)據(jù)庫的資源檢索效率與利用效率高,但數(shù)據(jù)之間的關(guān)聯(lián)性差,資源揭示不夠直觀,使用體驗(yàn)較差。
利用語義網(wǎng)、知識(shí)圖譜技術(shù)對(duì)圖書館資源的組織形式進(jìn)行重構(gòu)。將書目數(shù)據(jù)、用戶基本信息、檢索記錄、借閱記錄、活動(dòng)參與記錄等本地?cái)?shù)據(jù),以及相關(guān)的外圍數(shù)據(jù)等圖書館資源進(jìn)行主題和內(nèi)容的細(xì)顆粒度標(biāo)引。如,文本類型的資源可做到最小對(duì)段落進(jìn)行主題詞、關(guān)鍵詞的標(biāo)引;音視頻類資源可按時(shí)間區(qū)段或內(nèi)容系列做到對(duì)最小以秒或篇章為單位的主題詞、關(guān)鍵詞的標(biāo)引。通過已經(jīng)重做的標(biāo)引,對(duì)圖書館資源重新聚類,形成主題化、專題化的分類揭示。如,前一段時(shí)間很多人去借《流浪地球》這本書,但是圖書館所有的復(fù)本都是借出狀態(tài),此時(shí),通過標(biāo)引聚類服務(wù)系統(tǒng)發(fā)現(xiàn)《流浪地球》是科幻小說、作者是劉慈欣,那么可以為讀者推薦相關(guān)書籍,如《三體》《變型戰(zhàn)爭(zhēng)》《星際穿越》等。
綜上,通過組織形式的重構(gòu),實(shí)現(xiàn)圖書館資源實(shí)體間的數(shù)據(jù)關(guān)聯(lián),形成“一張網(wǎng)”,通過其中一個(gè)節(jié)點(diǎn)便可以發(fā)現(xiàn)其他關(guān)聯(lián)的節(jié)點(diǎn),進(jìn)而使得節(jié)點(diǎn)數(shù)據(jù)不再是獨(dú)立存在或不被發(fā)現(xiàn)的。
在資源數(shù)據(jù)重構(gòu)的基礎(chǔ)上,利用知識(shí)圖譜的可視化實(shí)現(xiàn)資源的聚類和揭示。根據(jù)著者、文獻(xiàn)、出版社等實(shí)體的語義關(guān)聯(lián),建立圖形可視化、可交互的圖書館資源圖譜系統(tǒng),用戶通過可視化界面操作來獲得關(guān)聯(lián)圖譜上的節(jié)點(diǎn)信息。
圖書館資源圖譜系統(tǒng)接受來自讀者的請(qǐng)求,根據(jù)資源(知識(shí))關(guān)聯(lián)做出回應(yīng),不僅讓讀者直觀地進(jìn)行判斷選擇,還能夠以一種“引導(dǎo)”的方式啟發(fā)讀者新的閱讀路徑。此外,利用另外一種圖書館資源,如讀者行為特征、基本屬性、借閱屬性、興趣偏好、潛力特征和預(yù)測(cè)需求等服務(wù)數(shù)據(jù),建立讀者的用戶畫像,為其提供精準(zhǔn)推薦服務(wù)。
(1)行為特征:主要用來記錄讀者的行為操作信息和借還行為。如,網(wǎng)頁端(App)的日啟動(dòng)次數(shù)、周啟動(dòng)次數(shù)、月啟動(dòng)次數(shù)、使用活躍度、最近瀏覽頁面及瀏覽時(shí)間等??捎肦MF①模型記錄讀者借還行為中的最近借還時(shí)間、借閱數(shù)量、借還頻率等。(2)基本屬性:描述讀者的一些基本特征,用來反映讀者的通用信息。如用戶ID、昵稱、性別、年齡、城市、注冊(cè)時(shí)間、活躍度、流失傾向等。(3)借閱屬性:主要用來記錄讀者的借閱偏好,如借閱次數(shù)、借閱數(shù)量、借閱時(shí)間間隔等。(4)興趣偏好:主要是有針對(duì)性地尋找讀者的興趣點(diǎn),用來區(qū)分用戶。興趣偏好往往結(jié)合日常閱讀推廣活動(dòng)設(shè)置,如主題偏好、著者偏好、新書偏好等。(5)潛力特征和預(yù)測(cè)需求:主要用來分析讀者的閱讀偏好和目標(biāo)閱讀量等。
總的來說,通過圖書館資源圖譜系統(tǒng)的揭示,讀者能夠非常直觀地看到數(shù)據(jù)以及數(shù)據(jù)背后的關(guān)聯(lián),真正做到“所見即所得”,將更多隱藏或未知的資源和關(guān)系展現(xiàn)給更多的讀者;通過用戶畫像,館員或系統(tǒng)可以了解讀者的需求,為讀者匹配資源,為圖書館的“人、貨、場(chǎng)”模型提供實(shí)現(xiàn)基礎(chǔ)。
資源發(fā)現(xiàn)和服務(wù)是建立在資源的組織和揭示基礎(chǔ)上的,具有直觀、高效的可視化效果,它著力解決以下3個(gè)方面的問題。
第一,閱讀推廣決策。一般地,消費(fèi)者只要在淘寶搜索過圖書,淘寶系統(tǒng)就會(huì)在后續(xù)打開的頁面推送相關(guān)書籍,甚至?xí)扑偷街Ц秾?,其他相關(guān)軟件也是如此。軟件會(huì)根據(jù)用戶的瀏覽和搜索喜好進(jìn)行推薦。淘寶和抖音推送即是系統(tǒng)根據(jù)用戶畫像對(duì)用戶所做的精準(zhǔn)投放,以有效地提高轉(zhuǎn)化率。同樣地,用戶畫像也適用于閱讀推廣。“我們的用戶是誰”和“我們有什么資源”在閱讀推廣過程中至關(guān)重要。根據(jù)讀者用戶畫像,可利用知識(shí)圖譜的語義關(guān)聯(lián),深挖資源與讀者之間的關(guān)系,組織和開展知識(shí)服務(wù),實(shí)現(xiàn)資源的精準(zhǔn)化、智慧化推薦服務(wù)。
第二,館藏建設(shè)決策。信息是數(shù)據(jù)的內(nèi)容,數(shù)據(jù)是信息的載體。數(shù)據(jù)代表著事實(shí)、邏輯和智慧,是對(duì)現(xiàn)實(shí)世界及業(yè)務(wù)活動(dòng)的事實(shí)性記錄,是信息有序化、集合化、結(jié)構(gòu)化的結(jié)果。信息經(jīng)過加工處理之后便成了數(shù)據(jù)。信息奠基人香農(nóng)(Shannon)認(rèn)為“信息是用來消除隨機(jī)不確定性的東西”。利用傳統(tǒng)的統(tǒng)計(jì)方法,館員可以知道所采圖書的數(shù)量、借閱率等,而通過知識(shí)圖譜技術(shù)的整合,館員可以清晰地獲得所采圖書的主題、著者、出版社、出版年等橫向、縱向的關(guān)聯(lián)數(shù)據(jù)。因?yàn)橹R(shí)圖譜里元素之間的關(guān)系不是簡(jiǎn)單的“屬性-值”關(guān)系,而是三元組關(guān)系,一條三元組代表了對(duì)圖書某個(gè)屬性的陳述,這些三元組頭尾相互連接就形成了一張描述萬物關(guān)系的圖譜(見圖1)。由“上海世界書局,出版,西游記”“西游記,是,四大名著”“三國(guó)演義,是,四大名著”這3條三元組可知上海世界書局出版了四大名著之一的《西游記》,而《三國(guó)演義》也屬四大名著,這時(shí)采購員可確認(rèn)上海世界書局是否出版《三國(guó)演義》,若是,便可一并采購以豐富館藏品種。
圖1 三元組關(guān)系
通過知識(shí)圖譜,圖書館能夠更加了解本館資源的組成情況,利用資源與資源之間的關(guān)聯(lián),及時(shí)根據(jù)數(shù)據(jù)方向標(biāo)優(yōu)化文獻(xiàn)資源建設(shè)結(jié)構(gòu),推動(dòng)館藏建設(shè)高質(zhì)量發(fā)展。
第三,館藏利用決策。在圖書館數(shù)以萬計(jì)的海量圖書中,僅靠22個(gè)大類的分類法作為讀者檢索圖書的方法已顯得“力不從心”,無法滿足讀者獲取知識(shí)的數(shù)量、時(shí)效和準(zhǔn)確性需求。基于知識(shí)圖譜的館藏利用決策模塊可分為有限推薦和無限揭示兩個(gè)模式,幫助讀者對(duì)館藏資源進(jìn)行選擇決策。
有限推薦如圖2所示,假設(shè)讀者2檢索了梁羽生的《白發(fā)魔女傳》,此時(shí)系統(tǒng)不但自動(dòng)推薦梁羽生的其他作品,且還會(huì)推薦金庸的作品,因?yàn)樽x者1同時(shí)借過梁羽生和金庸的作品。此為基于“他也讀過”,在一定范圍內(nèi)的“猜你喜歡”。
圖2 著者社會(huì)關(guān)系及作品圖譜(節(jié)選)
無限揭示有效利用知識(shí)圖譜的關(guān)聯(lián)圖譜,讀者要檢索資源時(shí),可直觀地通過一個(gè)節(jié)點(diǎn)不斷打開關(guān)聯(lián)節(jié)點(diǎn),從而獲得潛在的資源內(nèi)容。圖2展示了著者與著者之間的社會(huì)關(guān)系圖譜,以社會(huì)關(guān)系為線索可以檢索到關(guān)聯(lián)著者在庫中的所有作品,無論是熱門還是冷門。無論讀者在哪個(gè)節(jié)點(diǎn)進(jìn)入,都可以得到類似圖2的關(guān)聯(lián)圖譜。
資源的關(guān)聯(lián)圖譜除了可幫助讀者檢索資源時(shí)獲知相關(guān)資源,這種“無差別”的鏈?zhǔn)桨l(fā)現(xiàn)還有助于圖書館發(fā)現(xiàn)未被利用或利用率較低的圖書,如無關(guān)聯(lián)讀者節(jié)點(diǎn)的圖書節(jié)點(diǎn)(如果該書被借過,則有關(guān)聯(lián)節(jié)點(diǎn)),這類圖書即是所謂的“零數(shù)據(jù)”資源[23-24],利用知識(shí)圖譜的“無差別”發(fā)現(xiàn)能力,館員可適當(dāng)調(diào)整“零數(shù)據(jù)”資源的“曝光”機(jī)會(huì),讓資源處于“在線”狀態(tài),使每種資源都實(shí)現(xiàn)其價(jià)值,提高館藏利用率。
以“問題導(dǎo)向”為思路,筆者按照“四大問題”開展相關(guān)研究,知識(shí)圖譜賦能圖書館資源發(fā)現(xiàn)和服務(wù)系統(tǒng)的構(gòu)建基本思路如圖3所示。
圖3 知識(shí)圖譜賦能的資源發(fā)現(xiàn)和服務(wù)系統(tǒng)構(gòu)建思路
第一,不足之處。現(xiàn)階段圖書館資源數(shù)據(jù)來源復(fù)雜、資源數(shù)據(jù)分布廣、來源多、類型雜、組織程度低;數(shù)據(jù)無關(guān)聯(lián),主要依據(jù)主題、地域與級(jí)別等進(jìn)行分類歸檔,組織單元的顆粒度較粗,組織模式是線性的、一維的;數(shù)據(jù)與應(yīng)用聯(lián)系弱,資源數(shù)據(jù)與其相關(guān)的多媒體資源、展覽策劃、研究文獻(xiàn)等長(zhǎng)期處于分離狀態(tài),沒有實(shí)現(xiàn)有序的結(jié)構(gòu)化管理。因此,找準(zhǔn)、明確現(xiàn)階段資源發(fā)現(xiàn)系統(tǒng)的不足之處是筆者研究的出發(fā)點(diǎn)和解決問題的著力點(diǎn)。
第二,方法工具。筆者利用知識(shí)圖譜有語義、自解釋、可計(jì)算、能行動(dòng)的智慧數(shù)據(jù)特性來組織信息資源。
第三,具體做法。(1)梳理現(xiàn)有圖書館資源數(shù)據(jù)。如書目數(shù)據(jù)、用戶基本信息、檢索記錄、借閱記錄、活動(dòng)參與記錄等本地?cái)?shù)據(jù)以及相關(guān)的外圍數(shù)據(jù)。(2)確定資源內(nèi)容具體的“細(xì)顆粒度”程度并進(jìn)行標(biāo)引。對(duì)文本類資源實(shí)現(xiàn)篇章級(jí)、段落級(jí)的標(biāo)引,實(shí)現(xiàn)主題詞、關(guān)鍵詞的標(biāo)引建設(shè);對(duì)音視頻類資源做關(guān)鍵詞、主題詞控制的內(nèi)容標(biāo)引等。(3)搭建知識(shí)圖譜系統(tǒng)平臺(tái)。對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的圖書館資源數(shù)據(jù)進(jìn)行知識(shí)抽?。▽?shí)體抽取、關(guān)系抽取和屬性抽?。⒅R(shí)融合(數(shù)據(jù)整合、實(shí)體對(duì)齊、實(shí)體消歧)。(4)進(jìn)行本體構(gòu)建和質(zhì)量評(píng)估。利用知識(shí)推理技術(shù)進(jìn)一步完成資源的發(fā)現(xiàn)。(5)資源利用研究。利用可視化技術(shù),構(gòu)建資源發(fā)現(xiàn)和服務(wù)系統(tǒng),實(shí)現(xiàn)可視化決策,完成對(duì)研究的實(shí)踐應(yīng)用,實(shí)施系統(tǒng)測(cè)試、上線和迭代更新。
第四,預(yù)期效果。實(shí)現(xiàn)資源的重新組織和發(fā)現(xiàn),實(shí)現(xiàn)圖書館資源的搜索引擎可見度以及決策應(yīng)用。以W3C標(biāo)準(zhǔn)全網(wǎng)呈現(xiàn)圖書館資源,讓搜索引擎可搜索到圖書館資源,滿足用戶對(duì)圖書館信息完整發(fā)現(xiàn)和即時(shí)獲取的期望。
構(gòu)建基于知識(shí)圖譜的圖書館資源發(fā)現(xiàn)和服務(wù)系統(tǒng)時(shí)應(yīng)該遵循如下原則:(1)賦予萬物以URI(名稱),使用URI來識(shí)別資源,也就是網(wǎng)絡(luò)中任何東西或者資源的標(biāo)識(shí)名稱,如HTML文檔、讀者、文獻(xiàn)、著者、發(fā)行者等,均使用URI來標(biāo)識(shí)和定位,用以幫助用戶更加直接地訪問資源。(2)利用HTTP URIs,以便用戶對(duì)這些資源進(jìn)行訪問,并利用HTTPURI對(duì)資源進(jìn)行標(biāo)識(shí),數(shù)據(jù)資源可以通過HTTP協(xié)議進(jìn)行訪問得到,實(shí)現(xiàn)真正意義上Web的訪問和互聯(lián)。(3)檢索HTTPURIs時(shí),利用標(biāo)準(zhǔn)的RDF來給出有用的信息數(shù)據(jù),而當(dāng)檢索一個(gè)URI時(shí),則利用RDF給出和當(dāng)前資源相關(guān)的其他有用信息數(shù)據(jù),從而給用戶帶來更加寶貴的關(guān)聯(lián)資源。(4)數(shù)據(jù)發(fā)布時(shí)包含引用內(nèi)容的其他鏈接,將更多相關(guān)資源的HTTPURI建立語義鏈接,提高用戶對(duì)于網(wǎng)絡(luò)中可能出現(xiàn)的相關(guān)信息資源的挖掘、獲取和使用能力。
利用知識(shí)圖譜技術(shù)實(shí)現(xiàn)資源的發(fā)現(xiàn)和利用,達(dá)到圖書館智慧化管理和服務(wù),是對(duì)智慧圖書館服務(wù)建設(shè)的創(chuàng)新。(1)一種資源組織的創(chuàng)新。利用更加高效的知識(shí)圖譜技術(shù)將圖書館資源相互關(guān)聯(lián),實(shí)現(xiàn)圖書館資源的深度發(fā)現(xiàn)和利用,更加直觀地展示了資源的脈絡(luò)。知識(shí)圖譜將讀者、文獻(xiàn)、著者等資源相互關(guān)聯(lián),向讀者呈現(xiàn)更全面、更直觀的知識(shí)脈絡(luò)。通過知識(shí)圖譜可以發(fā)現(xiàn)這些資源本身并非孤立而是相互關(guān)聯(lián)的。根據(jù)關(guān)聯(lián)關(guān)系,向讀者精準(zhǔn)化推送相關(guān)信息,讀者更容易發(fā)現(xiàn)或找到喜歡的文獻(xiàn)。(2)一種交互平臺(tái)的創(chuàng)新。提供了一個(gè)能夠與讀者智能交互的平臺(tái),讓圖書館更了解讀者的情況,同時(shí)也讓讀者了解圖書館。在互聯(lián)網(wǎng)時(shí)代,營(yíng)銷手段多種多樣,但不管有多少種方式,都離不開一個(gè)核心——分析用戶和理解用戶。對(duì)于圖書館的讀者,系統(tǒng)向讀者展示并推薦讀者可能未知的資源,引導(dǎo)讀者閱讀,增強(qiáng)閱讀廣度和深度,提升讀者閱讀體驗(yàn),幫助讀者有效發(fā)現(xiàn)目標(biāo)。(3)一種發(fā)現(xiàn)方法的創(chuàng)新。有助于消除和發(fā)掘“零數(shù)據(jù)”資源和“零數(shù)據(jù)”讀者,從而提升閱讀推廣效果。事實(shí)上,圖書館存在著大量不活躍資源,它們可能被遺忘,或者顯露不了頭角,同時(shí)也存在著大量的不活躍讀者,他們不經(jīng)常來圖書館。根據(jù)知識(shí)圖譜找到這些“零數(shù)據(jù)”的關(guān)聯(lián),從而消除“零數(shù)據(jù)”。如通過尋找“睡美人”資源、網(wǎng)借服務(wù)等手段把圖書館資源“曝光”,吸引讀者重新利用圖書館資源。
《關(guān)于促進(jìn)文化和科技深度融合的指導(dǎo)意見》中提出要“利用物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)對(duì)公共文化服務(wù)和文化產(chǎn)業(yè)進(jìn)行全方位、全鏈條的改造”[25]。建設(shè)文化知識(shí)圖譜,是文化資源數(shù)據(jù)庫建設(shè)到一定階段后的必然選擇,是應(yīng)對(duì)數(shù)字化、智能化的時(shí)代要求,貼合國(guó)家新基建的規(guī)劃思路。借鑒“人、貨、場(chǎng)”概念,利用知識(shí)圖譜相關(guān)技術(shù)構(gòu)建的圖書館資源發(fā)現(xiàn)和服務(wù)系統(tǒng),通過對(duì)圖書館資源的重新組織,從縱向和橫向提供更優(yōu)質(zhì)的資源服務(wù)。
3.4.1 找對(duì)“人”:建立讀者與資源的關(guān)聯(lián)
建立讀者的用戶畫像,為其提供精準(zhǔn)化閱讀推廣服務(wù)。利用知識(shí)圖譜技術(shù)如標(biāo)簽傳播、社群發(fā)現(xiàn)、復(fù)雜網(wǎng)絡(luò)等,或引入外部知識(shí)庫擴(kuò)充、泛化傳統(tǒng)用戶畫像標(biāo)簽,以此來豐富用戶畫像,彌補(bǔ)其不完整性和不正確性。依托清晰的用戶畫像,圖書館的閱讀推廣工作可以更加精準(zhǔn)有效。
3.4.2 盤好“貨”:深入挖掘基于知識(shí)圖譜的資源關(guān)聯(lián)
通常,對(duì)于某個(gè)事件或物品只有一段簡(jiǎn)單介紹,解釋了“是什么”,而關(guān)于其“怎么來的”“與誰有關(guān)”等相關(guān)背景卻無從知曉,造成“知其然不知其所以然”的現(xiàn)象。知識(shí)圖譜能夠非常直觀地揭示數(shù)據(jù)以及數(shù)據(jù)背后的關(guān)聯(lián),形成“一張網(wǎng)”,真正做到“所見即所得”,使更多隱藏或未知的資源和關(guān)系得到揭示。讀者通過這張“網(wǎng)”可以直觀地看到圖書館更多關(guān)聯(lián)的資源,進(jìn)而更快地獲取有價(jià)值、個(gè)性化的信息,得到更加精準(zhǔn)的服務(wù)。圖書館可以更加熟悉自身資源的組成情況,了解資源與資源之間、資源與讀者之間的關(guān)聯(lián),進(jìn)而幫助圖書館優(yōu)化資源配置,指導(dǎo)館藏資源建設(shè),組織和開展知識(shí)服務(wù),針對(duì)“藏”得太深的“睡美人”資源進(jìn)行調(diào)整,增加“曝光”機(jī)會(huì),讓資源處于“在線”狀態(tài),建立個(gè)性化的圖書館資源,提高資源利用率。
3.4.3 建好“場(chǎng)”:去圖書館專業(yè)門檻,提升服務(wù)體驗(yàn)
圖書館資源的管理和使用等相對(duì)專業(yè)化,如館藏查詢有專業(yè)的檢索術(shù)語,不如百度、必應(yīng)等大眾搜索引擎簡(jiǎn)單明了,讀者可能需要花費(fèi)一定的學(xué)習(xí)成本,檢索效率低。利用知識(shí)圖譜技術(shù)將資源關(guān)聯(lián)起來,消除資源孤島效應(yīng),給讀者提供直觀明了的服務(wù)體驗(yàn)——不需要專業(yè)知識(shí),只需要“拎”起其中一個(gè)節(jié)點(diǎn)便能知曉所有相關(guān)資源。
3.5.1 提供了新時(shí)期公共文化事業(yè)建設(shè)的新思路
智慧圖書館建設(shè)是“十四五”時(shí)期圖書館轉(zhuǎn)型和高質(zhì)量發(fā)展的重點(diǎn)。知識(shí)圖譜賦能的圖書館資源發(fā)現(xiàn)和服務(wù)系統(tǒng)可以在圖書館資源發(fā)現(xiàn)和服務(wù)過程中發(fā)揮作用,提升圖書館智慧化服務(wù)水平,為“十四五”時(shí)期公共圖書館貫徹高質(zhì)量發(fā)展理念、建設(shè)“智慧圖書館”提供新思路。
3.5.2 提高圖書館資源的合理配置和利用率
在館藏建設(shè)方面,能使圖書館更加熟悉資源的組成情況,了解資源與資源之間、資源與讀者之間的關(guān)聯(lián),及時(shí)根據(jù)數(shù)據(jù)風(fēng)向標(biāo)優(yōu)化文獻(xiàn)資源建設(shè)結(jié)構(gòu),推動(dòng)館藏建設(shè)高質(zhì)量發(fā)展;在館藏利用率方面,使圖書館可對(duì)“零數(shù)據(jù)”資源進(jìn)行適當(dāng)調(diào)整增加“曝光”機(jī)會(huì),使每個(gè)資源都能實(shí)現(xiàn)其價(jià)值,提高館藏利用率。
3.5.3 探索智慧圖書館建設(shè),提供實(shí)踐經(jīng)驗(yàn)
知識(shí)圖譜賦能的圖書館資源發(fā)現(xiàn)和服務(wù)系統(tǒng)可以提供資源發(fā)現(xiàn)、推薦等智慧服務(wù),有助于讀者發(fā)現(xiàn)圖書館資源,使資源物盡其用,避免資源浪費(fèi)。打造“潤(rùn)物細(xì)無聲”的智慧服務(wù)效果,為“十四五”時(shí)期圖書館轉(zhuǎn)型和高質(zhì)量發(fā)展、智慧圖書館建設(shè)提供經(jīng)驗(yàn)借鑒。
社會(huì)的不斷發(fā)展推動(dòng)圖書館信息服務(wù)的巨大變革,圖書館界吸納了越來越多的海量信息,而海量信息的多樣性和多元化給圖書館服務(wù)帶來更大的挑戰(zhàn)。圖書館亟需尋求一種資源管理方式,幫助用戶快速、準(zhǔn)確地選擇資源。知識(shí)圖譜是一種智慧數(shù)據(jù),能夠?qū)⒏黝悘?fù)雜的數(shù)據(jù)(用戶和資源)關(guān)聯(lián)并直觀地展示給用戶,使讀者對(duì)隱藏信息的來龍去脈一目了然,體驗(yàn)到智慧化服務(wù),在更短的時(shí)間內(nèi)獲取到所需的知識(shí),為智慧圖書館建設(shè)提供新思路。
注釋:
① RFM模型是衡量客戶價(jià)值和客戶創(chuàng)利能力的重要工具和手段。該機(jī)械模型通過一個(gè)客戶的最近一次消費(fèi)(Recency)、消費(fèi)頻率(Frequency)以及消費(fèi)金額(Monetary)3項(xiàng)指標(biāo)來描述該客戶的價(jià)值狀況。