于 歡,孫 青,易 靜,路 青,孫紅亮
(河北醫(yī)科大學(xué) 圖書館,河北 石家莊 050017)
隨著智能及信息技術(shù)的快速發(fā)展,智慧圖書館的理論研究和實踐成果也在不斷發(fā)展,適應(yīng)大數(shù)據(jù)環(huán)境下用戶信息需求的不斷升級,提供全新的智慧服務(wù)模式是其發(fā)展的必然趨勢。信息泛化的時代,圖書館提供服務(wù)的各類設(shè)備、文獻系統(tǒng)、服務(wù)及社交平臺積累了海量資源和用戶行為數(shù)據(jù),依靠信息識別、數(shù)據(jù)采集等技術(shù)將這些數(shù)據(jù)有效整合,深入挖掘空間、資源與人的內(nèi)在關(guān)聯(lián),能夠最大程度地發(fā)揮數(shù)據(jù)價值,突破時空局限,打造實時、優(yōu)質(zhì)、精確、專業(yè)的智慧服務(wù)體系,從而幫助用戶實現(xiàn)知識增值,提升知識服務(wù)內(nèi)涵[1-2]。
先進的信息技術(shù)及智能化的設(shè)備是圖書館提供智慧服務(wù)的基本技術(shù)保障,通過RFID、GPS、物聯(lián)網(wǎng)等智能感知技術(shù),結(jié)合圖書館集成管理系統(tǒng)、各類空間資源、虛擬服務(wù)平臺及資源信息系統(tǒng)等多種途徑將空間、信息資源與用戶等多元異構(gòu)數(shù)據(jù)建立關(guān)聯(lián),形成圖書館的大數(shù)據(jù),以此為基礎(chǔ)實現(xiàn)館內(nèi)資源的互聯(lián)互通與信息共享,提高館員工作效率及用戶體驗。
圖書館蘊含著大量的文獻資料、用戶行為數(shù)據(jù)及業(yè)務(wù)流程數(shù)據(jù),使用大數(shù)據(jù)技術(shù)能夠動態(tài)串聯(lián)這3類數(shù)據(jù),然后通過數(shù)據(jù)挖掘、聚類分析、用戶畫像等技術(shù),對用戶喜好與需求進行全方位分析,深入挖掘出數(shù)據(jù)的潛在交叉價值,發(fā)現(xiàn)用戶的隱性需求,進而構(gòu)建精準、智慧的個性化服務(wù),實現(xiàn)空間、資源與人三者之間的持續(xù)化融合。
信息爆炸的時代,圖書館應(yīng)堅持以用戶體驗為中心,以大數(shù)據(jù)為驅(qū)動,深化圖書館服務(wù)層次,拓展圖書館服務(wù)功能及服務(wù)范圍,以優(yōu)質(zhì)的服務(wù)體現(xiàn)圖書館的存在價值。目前,圖書館基于大數(shù)據(jù)開展的個性化推薦服務(wù)主要集中在信息檢索及資源推薦,圖書館未來應(yīng)逐步實現(xiàn)知識咨詢、閱讀推廣、空間使用等全領(lǐng)域、全要素智慧化、個性化服務(wù);除此之外圖書館還應(yīng)借助大數(shù)據(jù)技術(shù),打破數(shù)據(jù)壁壘,積極探索跨領(lǐng)域、跨區(qū)域的融合發(fā)展路徑,借助外部力量拓展圖書館的服務(wù)功能,形成內(nèi)外部環(huán)境立體交互、實體與虛擬服務(wù)融合的泛在服務(wù)空間。
依據(jù)大數(shù)據(jù)的數(shù)據(jù)采集與存儲、數(shù)據(jù)治理與建模和大數(shù)據(jù)應(yīng)用的技術(shù)使用流程,借鑒計算機軟件設(shè)計中的3層體系結(jié)構(gòu),構(gòu)建基于智慧數(shù)據(jù)層、智慧業(yè)務(wù)層和智慧應(yīng)用層的3層框架結(jié)構(gòu),如圖1所示。
(1)智慧數(shù)據(jù)層:匯總圖書館各終端、應(yīng)用系統(tǒng)及服務(wù)平臺,采集用戶、用戶行為及資源3種不同維度的數(shù)據(jù),并對數(shù)據(jù)進行清洗和預(yù)處理,在這個過程中一方面要對數(shù)據(jù)進行填補、降噪等處理,另一方面也要注重建立各異構(gòu)系統(tǒng)數(shù)據(jù)間的關(guān)聯(lián)模型,形成標準、干凈、實時、連續(xù)的大數(shù)據(jù)資源,構(gòu)建圖書館智慧大數(shù)據(jù)中心。
(2)智慧業(yè)務(wù)層:完成了元數(shù)據(jù)的標準化倉儲,需要對數(shù)據(jù)進行統(tǒng)計、特征提取、聚類分析,通過用戶畫像技術(shù)構(gòu)建館藏資源畫像、用戶個人畫像、用戶群體畫像,建立資源與用戶、用戶與用戶、用戶與機構(gòu)或群體間的關(guān)聯(lián)度模型,為智慧檢索、智慧推薦等服務(wù)提供數(shù)據(jù)支撐。智慧業(yè)務(wù)層具有承上啟下的作用,它接收智慧應(yīng)用層的計算請求,并依此向智慧數(shù)據(jù)層發(fā)送數(shù)據(jù)請求,然后進行數(shù)據(jù)處理,最終將計算結(jié)果反饋至智慧應(yīng)用層。
(3)智慧應(yīng)用層:智慧應(yīng)用層直接面向用戶,為用戶提供智慧服務(wù)。各高校圖書館依據(jù)辦學(xué)層次、學(xué)科類型、發(fā)展理念不同為用戶提供的各項服務(wù)也不盡相同,筆者以僅跨系統(tǒng)的大數(shù)據(jù)技術(shù)應(yīng)用為前提,將智慧服務(wù)歸納為智慧檢索、智慧推薦、智慧學(xué)科及智慧互動4個場景。
2.2.1 數(shù)據(jù)清洗技術(shù)
圖書館的大數(shù)據(jù)采集自不同終端及系統(tǒng),不可避免地存在數(shù)據(jù)重復(fù)、數(shù)據(jù)缺失、數(shù)據(jù)污染等各種類型的臟數(shù)據(jù)。因此需要通過數(shù)據(jù)的清洗與預(yù)處理完成數(shù)據(jù)的統(tǒng)一標準化,確保數(shù)據(jù)格式一致,提升大數(shù)據(jù)價值密度和可用性。對于重復(fù)數(shù)據(jù)一般采取主鍵去重策略;對于缺失數(shù)據(jù),則需要根據(jù)不同情況,采取不同策略;對于無效、低價值、弱相關(guān)的缺失值可采取直接刪除的策略;對于高價值、高相關(guān)的缺失值則可酌情采取人工填補、均值填補、預(yù)測值填補等方式完成清洗。除此之外,還應(yīng)特別注意異常數(shù)據(jù)和噪聲大數(shù)據(jù)的清洗,可以通過建立規(guī)則庫、分箱處理、聚類算法、構(gòu)造回歸函數(shù)等方式完成數(shù)據(jù)清洗[3]。
2.2.2 數(shù)據(jù)挖掘技術(shù)
通過數(shù)據(jù)挖掘技術(shù)能夠了解、分析用戶行為,從而為用戶提供優(yōu)質(zhì)的個性化服務(wù)。常見的數(shù)據(jù)挖掘技術(shù)包括關(guān)聯(lián)分析、序列分析、聚類分析、協(xié)同過濾等技術(shù)。關(guān)聯(lián)分析即分析不同數(shù)據(jù)、表單的關(guān)聯(lián)性,挖掘隱藏信息,最常使用的算法是APRIOR算法[4]。通過關(guān)聯(lián)分析,能夠獲取用戶訪問不同數(shù)據(jù)資源間的關(guān)聯(lián)性;序列分析即將用戶行為與時間進行關(guān)聯(lián),獲取在一定時間間隔內(nèi)某事件發(fā)生的變化規(guī)律,可以對某一段時間內(nèi)圖書館各個空間使用情況進行分析,并依此調(diào)整圖書館空間服務(wù)策略;聚類分析是首先抽取對象特征,然后判斷不同對象間特征的相似性,依據(jù)相似性實現(xiàn)數(shù)據(jù)分類集合,通過聚類分析,能夠獲取用戶的行為知識及興趣模式;協(xié)同過濾技術(shù)即利用集體智慧,分析不同用戶之間的項目信息并篩選出他們興趣的相似之處,一般用于推薦系統(tǒng)[5-6]。
2.2.3 用戶畫像技術(shù)
通過用戶畫像技術(shù)構(gòu)建館藏資源畫像、用戶個人畫像、用戶群體畫像,建立資源和用戶間的關(guān)聯(lián)度模型,是智慧服務(wù)實現(xiàn)的前提和保障。用戶畫像創(chuàng)建流程大致可分為數(shù)據(jù)采集、數(shù)據(jù)處理及數(shù)據(jù)應(yīng)用3個階段[7]。其中的標簽?zāi)K是整個流程中的核心模塊,其模型的合理性直接影響用戶畫像的精確度。一般來說用戶標簽體系的構(gòu)建需要使用多種算法完成,例如使用K-means聚類算法在用戶基本數(shù)據(jù)及海量的用戶行為數(shù)據(jù)中獲取相似用戶及其特征,實現(xiàn)用戶的分群處理;使用RFM、TF-IDF算法完成代表用戶選取和關(guān)鍵詞的權(quán)重賦值過程[7];使用機器學(xué)習(xí)算法完成行為建模;使用協(xié)同過濾、回歸預(yù)測等方法計算用戶或館藏資源的相似度,實現(xiàn)相似用戶的行為預(yù)測及個性化推薦服務(wù)[8]。
2.3.1 智慧檢索服務(wù)
相比傳統(tǒng)檢索服務(wù),智慧檢索以大數(shù)據(jù)為基礎(chǔ),通過用戶畫像與資源畫像關(guān)聯(lián)度模型的構(gòu)建,能夠使檢索結(jié)果更為精準化、智能化、個性化。目前,我國高校圖書館智慧檢索服務(wù)僅有一定程度的實現(xiàn)傾向,其提供檢索功能的欄目導(dǎo)航大致可以分為:館藏目錄、中文發(fā)現(xiàn)、外文發(fā)現(xiàn)、聯(lián)盟資源、學(xué)術(shù)搜索、館內(nèi)電子資源、數(shù)據(jù)庫、站內(nèi)搜索8種,多數(shù)圖書館同時提供其中幾種檢索功能,不同欄目導(dǎo)航的檢索范圍有所重合,但檢索側(cè)重點略有不同。這就可能帶來一定的矛盾與問題:一方面,用戶依據(jù)自己需求選擇合適的搜索欄目能夠快速獲得信息;另一方面,在用戶對各檢索欄目不甚了解的前提下,過多的選擇可能會給用戶帶來困惑。為解決這一問題,部分高校圖書館,如清華大學(xué)、北京大學(xué)圖書館將紙質(zhì)資源與電子資源進行了充分整合,實現(xiàn)了跨資源類型的一站式檢索,并提供智慧篩選及排序功能,形成了智慧檢索的雛形。但圖書館智慧檢索系統(tǒng)在檢索速度、界面可讀性及檢索功能的豐富程度上與互聯(lián)網(wǎng)其他搜索引擎還存在一定差距,一些先進技術(shù)如基于移動視覺的搜索模式,尚未得到有效利用。
2.3.2 智慧推薦服務(wù)
智慧推薦服務(wù)是圖書館主動服務(wù)用戶的重要形式,通過大數(shù)據(jù)技術(shù)分析用戶的行為特征和興趣屬性,將所獲取的信息與對應(yīng)的服務(wù)信息進行匹配,并及時推送給用戶,能夠滿足用戶個性化需求。我國高校圖書館智慧推薦資源類型和范圍還存在局限性,主要集中在基于信息檢索的文獻資源推薦及依賴于OPAC系統(tǒng)的館藏資源推薦,其中動態(tài)非個性化推薦占主流,如“借閱排行”“熱門推薦”等,只有少數(shù)高校圖書館,如重慶大學(xué)、華東師范大學(xué)提供了“猜你喜歡”“與你相似的讀者也喜歡”這樣基于用戶借閱歷史、瀏覽記錄、用戶群體分析等能夠體現(xiàn)用戶偏好及需求的動態(tài)個性化閱讀推薦。由此可見,我國高校圖書館智慧推薦服務(wù)無論從廣度還是從深度上都難以滿足用戶需求,推薦場景單一、類型單一。因此未來的智慧推薦應(yīng)立足大數(shù)據(jù)技術(shù),跨系統(tǒng)收集用戶行為、用戶情景及用戶位置信息,與社交網(wǎng)絡(luò)及移動互聯(lián)網(wǎng)相融合,全方位獲取用戶信息,建立完備的用戶知識庫,拓展智慧推薦類型及手段,如依據(jù)用戶當前位置、用館習(xí)慣、用戶群體分類等信息,通過短信、微信、站內(nèi)信等形式實時向用戶推薦空間、文獻、圖書、設(shè)備等所有圖書館可用資源,并進一步加強推薦服務(wù)精確度。
2.3.3 智慧學(xué)科服務(wù)
學(xué)科服務(wù)是圖書館的核心業(yè)務(wù),大數(shù)據(jù)背景下,高校圖書館應(yīng)堅守以用戶為核心的服務(wù)理念,積極運用各類智能、信息技術(shù),探尋學(xué)科服務(wù)創(chuàng)新路徑,為用戶提供智慧、泛化、主動、精準、專業(yè)的學(xué)科信息和知識服務(wù)。學(xué)科服務(wù)平臺是高校圖書館智慧學(xué)科服務(wù)的新模式,它依托計算機與信息技術(shù),整合了豐富的學(xué)科資源,提供了多種學(xué)科服務(wù)功能,是用戶和學(xué)科館員交流、互動的平臺。我國高校圖書館學(xué)科服務(wù)平臺搭建方式大體可分為基于LibGuides平臺、基于維度信息管理平臺、基于學(xué)科門戶網(wǎng)站、基于超星學(xué)科知識支持服務(wù)平臺4種模式,學(xué)科服務(wù)平臺整體建設(shè)程度不高,且存在發(fā)展不均衡、使用效率低下等問題。因此,積極強化用戶認知,整合技術(shù)資源,挖掘數(shù)據(jù)價值,以大數(shù)據(jù)技術(shù)為驅(qū)動,拓展學(xué)科服務(wù)平臺的智慧功能,在學(xué)科服務(wù)平臺中嵌入智慧檢索、智慧推薦、智慧學(xué)科社區(qū)、個性定制等深層次服務(wù)內(nèi)容,為用戶提供自動化、智能化的體驗,用精準、個性化的服務(wù)提高用戶使用黏性是學(xué)科服務(wù)發(fā)展的必然趨勢。
2.3.4 智慧互動服務(wù)
智慧互動是圖書館提供泛在服務(wù)的重要手段,高校圖書館應(yīng)通過構(gòu)建圖書館日常知識庫、智慧社交平臺與智能咨詢機器人,創(chuàng)建實時的參考咨詢服務(wù)平臺,及時準確地處理用戶的各種服務(wù)需求,使用戶獲得良好的知識獲取體驗。目前一些高校已經(jīng)開通了智能咨詢機器人服務(wù),減少了館員的工作量,提高了用戶咨詢效率,符合圖書館24小時服務(wù)用戶的理念,給用戶帶來了良好的體驗。準確無誤地解決用戶問題,是智能咨詢機器人的最終目標,但在實際應(yīng)用過程中仍存在答非所問、個性化需求無法滿足等情況。針對這樣的情況,可從人員和技術(shù)兩方面入手:一方面,在智能咨詢機器人中增加“轉(zhuǎn)人工”服務(wù),滿足用戶個性化需求;另一方面,強調(diào)大數(shù)據(jù)技術(shù)的使用,在構(gòu)建完備的圖書館日常知識庫的基礎(chǔ)上,建立用戶畫像、用戶畫像與資源畫像關(guān)聯(lián)度模型,在用戶發(fā)出信息之前,了解用戶基本行為特征,然后結(jié)合語義分析,使智能咨詢機器人獲取用戶真實意圖,最終將最優(yōu)解決方案反饋給用戶。
高校圖書館的智慧化建設(shè)離不開現(xiàn)代信息技術(shù),開放的智慧服務(wù)中心更需要高科技、智能化的硬件設(shè)施作為支撐。RFID、AI機器人、3D打印機、智能書架、3D人臉識別、VR/AR、5G等技術(shù)和智能設(shè)備的使用,不僅能夠增強用戶的視聽體驗,依托這些傳感設(shè)備,通過數(shù)據(jù)的對象識別、信息采集與數(shù)字管控,能夠?qū)崟r獲取圖書館的場館、空間、設(shè)施設(shè)備等信息,并依此進一步優(yōu)化圖書館的智慧服務(wù)。例如,通過3D人臉識別、RFID自助借還、空間預(yù)約、門禁等業(yè)務(wù)系統(tǒng)的互聯(lián),可為用戶提供無感知服務(wù),即用戶只需要在入館時通過人臉識別進行身份驗證就可以無障礙地享受圖書館的借閱、空間使用等服務(wù)。
高校圖書館的大數(shù)據(jù)具有系統(tǒng)多樣性、分布異構(gòu)性的特點,因此必須加強資源整合,實現(xiàn)數(shù)據(jù)統(tǒng)一組織管理。為提高數(shù)據(jù)整合效率,可在采集終端對海量的原始數(shù)據(jù)進行初步過濾及整合,消除部分冗余和噪聲數(shù)據(jù),減少數(shù)據(jù)傳輸數(shù)量,減輕網(wǎng)絡(luò)擁塞。對于圖書館不同業(yè)務(wù)平臺數(shù)據(jù),需借助于語義網(wǎng)和關(guān)聯(lián)數(shù)據(jù)技術(shù),完成數(shù)據(jù)和資源的語義標注、鏈接,使其成為具有邏輯意義、能夠相互關(guān)聯(lián)的知識對象,創(chuàng)新數(shù)據(jù)價值。除此之外,圖書館還應(yīng)注重與其合作的第三方數(shù)據(jù)的整合,從長遠發(fā)展的角度,綜合考慮大數(shù)據(jù)平臺的集成框架、采集技術(shù)、可擴展性及安全性。
智慧館員是提供智慧服務(wù)的主體,是實現(xiàn)智慧圖書館的關(guān)鍵。因此高校圖書館必須加強館員人才隊伍建設(shè),可從以下3方面展開:第一,完善圖書館員準入制度,制定科學(xué)合理的招聘標準;第二,構(gòu)建長效的培訓(xùn)機制,定期開展系統(tǒng)的、有針對性的培訓(xùn),并鼓勵館員投入智慧圖書館的建設(shè)中來;第三,構(gòu)建動態(tài)的智慧館員職業(yè)能力評估體系,優(yōu)化績效考核,提升館員職業(yè)能力水平。
我國圖書館智慧服務(wù)仍處于起步探索階段,大數(shù)據(jù)技術(shù)在圖書館領(lǐng)域的應(yīng)用尚未全面展開,圖書館門戶網(wǎng)站、集成管理系統(tǒng)、各類服務(wù)及應(yīng)用系統(tǒng)仍存在各自為政的局面。因此,在未來的智慧圖書館建設(shè)過程中,必須樹立大數(shù)據(jù)意識,深入挖掘數(shù)據(jù)內(nèi)蘊含的知識與智慧,構(gòu)建圖書館的大數(shù)據(jù)中心,以此提升圖書館服務(wù)的智慧化、主動性、個性化及準確度。