金潔潔
摘 要:文章從智慧圖書(shū)館建設(shè)需求出發(fā),分析圖書(shū)館加強(qiáng)用戶個(gè)性化檔案信息歸集整理和利用的必要性,闡述圖書(shū)館用戶個(gè)性化檔案信息的主要內(nèi)容、類(lèi)別和功用,并以作者設(shè)計(jì)和實(shí)現(xiàn)的圖書(shū)館個(gè)性化圖書(shū)精準(zhǔn)推薦系統(tǒng)為例,詳細(xì)展示用戶個(gè)性化檔案信息在智慧圖書(shū)館中的應(yīng)用,指出在歸集和使用圖書(shū)館用戶個(gè)性化檔案信息的過(guò)程中應(yīng)該注意的問(wèn)題,以期能夠?yàn)橹腔蹐D書(shū)館建設(shè)提供參考和借鑒。
中圖分類(lèi)號(hào):G252文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2021)09-0128-03
關(guān)鍵詞:用戶個(gè)性化檔案信息;智慧圖書(shū)館;個(gè)性化圖書(shū)精準(zhǔn)推薦系統(tǒng)
隨著移動(dòng)互聯(lián)技術(shù)的發(fā)展,用戶對(duì)圖書(shū)館提出了更高的需求。他們不僅要求圖書(shū)館可以隨時(shí)隨地為用戶提供資源與服務(wù),更希望圖書(shū)館能夠根據(jù)用戶的個(gè)性化需求直接從圖書(shū)館海量的資源中有針對(duì)性地篩選出用戶最有可能使用的資源,提供智能化、精準(zhǔn)化的信息資源,以實(shí)現(xiàn)資源與服務(wù)的高效獲取,智慧圖書(shū)館正是在這種背景下應(yīng)運(yùn)而生的。智慧圖書(shū)館是圖書(shū)館在“人工智能+5G”技術(shù)視域下,充分利用5G網(wǎng)絡(luò)、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù),全面掌握不同類(lèi)型用戶的需求,并為用戶提供精準(zhǔn)化、智能化信息服務(wù)的綜合性知識(shí)服務(wù)系統(tǒng)[1]。智慧圖書(shū)館強(qiáng)調(diào)圖書(shū)館資源、用戶、館舍(系統(tǒng))以及服務(wù)的相互感知。通過(guò)智慧圖書(shū)館建設(shè),圖書(shū)館服務(wù)將由被動(dòng)轉(zhuǎn)為主動(dòng),通過(guò)人工智能、大數(shù)據(jù)分析、云計(jì)算技術(shù)精準(zhǔn)分析用戶個(gè)性化信息需求,繼而通過(guò)數(shù)據(jù)挖掘、推薦算法等應(yīng)用系統(tǒng)實(shí)現(xiàn)圖書(shū)館資源與服務(wù)的主動(dòng)精準(zhǔn)推介。
1 圖書(shū)館的用戶個(gè)性化檔案
1.1 加強(qiáng)用戶個(gè)性化檔案信息的歸集整理和利用的必要性
檔案是國(guó)家機(jī)構(gòu)、社會(huì)組織或個(gè)人在社會(huì)活動(dòng)中直接形成的有價(jià)值的各種形式的歷史記錄[2]。圖書(shū)館作為圖書(shū)的收集、傳遞、服務(wù)機(jī)構(gòu),用戶在使用圖書(shū)館資源與服務(wù)的過(guò)程中必然會(huì)留下很多“痕跡”。這些痕跡以數(shù)字、數(shù)據(jù)、符號(hào)等形式記錄存儲(chǔ)在圖書(shū)館的各類(lèi)系統(tǒng)中,形成圖書(shū)館用戶個(gè)性化信息檔案。
由于圖書(shū)館員素質(zhì)和技術(shù)條件的限制,當(dāng)前大部分圖書(shū)館對(duì)用戶個(gè)性化檔案信息僅作存檔,并未對(duì)其進(jìn)行充分開(kāi)發(fā)和利用,基本處于閑置狀態(tài)。而在智慧圖書(shū)館環(huán)境下,智能化、精準(zhǔn)化、個(gè)性化是其顯著特征。提供智能、精準(zhǔn)、個(gè)性化智慧服務(wù)均以分析用戶當(dāng)前需求和潛在需求為前提,以用戶個(gè)性化檔案信息為基礎(chǔ)。因此,在智慧圖書(shū)館建設(shè)過(guò)程中,加強(qiáng)用戶個(gè)性化檔案信息的歸集整理和利用是重要的基礎(chǔ)環(huán)節(jié)。
1.2 圖書(shū)館用戶個(gè)性化檔案信息的主要內(nèi)容和功用
圖書(shū)館用戶個(gè)性化檔案信息主要包含個(gè)人身份識(shí)別信息、個(gè)人資源與服務(wù)使用信息及個(gè)人行為軌跡信息等[3]。個(gè)人身份識(shí)別信息主要包含具有身份識(shí)別屬性的文本信息和生物特征信息,文本信息主要包括用戶姓名、性別、身份證號(hào)、讀者證號(hào)、專(zhuān)業(yè)、學(xué)歷、家庭住址等,生物特征識(shí)別信息主要包含指紋、人臉、虹膜等信息。個(gè)人身份識(shí)別信息主要用于實(shí)現(xiàn)用戶身份識(shí)別,以確定圖書(shū)館與用戶的一對(duì)一關(guān)系,區(qū)分圖書(shū)館的不同用戶。個(gè)人借閱檔案信息主要指讀者在圖書(shū)館借閱過(guò)程中產(chǎn)生的各種記錄,主要包含借閱圖書(shū)信息、借閱行為信息(如借閱時(shí)間、歸還時(shí)間)、資源使用記錄等。通過(guò)對(duì)借閱信息的處理和分析可以了解讀者的基本閱讀偏好、閱讀習(xí)慣、借閱信用、專(zhuān)業(yè)背景、研究方向等信息,掌握用戶的個(gè)性化信息需求,并將其需求與新書(shū)推薦、參考咨詢、專(zhuān)題服務(wù)等業(yè)務(wù)相結(jié)合,有針對(duì)性地為用戶推送他們所需的資源和服務(wù)。個(gè)人軌跡信息主要利用圖書(shū)館門(mén)禁、借閱讀卡器、監(jiān)控?cái)z像頭等設(shè)備,依托RFID和人臉識(shí)別等生物識(shí)別技術(shù)實(shí)現(xiàn)用戶在館內(nèi)的動(dòng)態(tài)身份識(shí)別,并不間斷地記錄用戶在圖書(shū)館的時(shí)空運(yùn)動(dòng)軌跡。在智慧圖書(shū)館建設(shè)中,目前圖書(shū)館采用最廣泛、最便捷的生物特征識(shí)別技術(shù)即人臉識(shí)別技術(shù),人臉信息對(duì)于實(shí)現(xiàn)圖書(shū)館人與館舍環(huán)境的感知具有決定性作用。軌跡信息是圖書(shū)館針對(duì)用戶開(kāi)展信息空間精準(zhǔn)推送服務(wù)的重要依據(jù)。
2 個(gè)性化檔案信息在智慧圖書(shū)館中的應(yīng)用——以個(gè)性化圖書(shū)精準(zhǔn)推薦系統(tǒng)為例
筆者在實(shí)際工作中將智慧圖書(shū)館理念融入數(shù)字圖書(shū)館建設(shè)中,進(jìn)行了智慧圖書(shū)館嘗試性建設(shè),特別是在圖書(shū)個(gè)性化推薦方面,充分利用用戶個(gè)性化檔案信息,精準(zhǔn)分析用戶需求,開(kāi)展資源推送服務(wù),并取得了一定成效?,F(xiàn)以筆者設(shè)計(jì)的個(gè)性化圖書(shū)精準(zhǔn)推薦系統(tǒng)為例,展示個(gè)性化檔案信息在智慧圖書(shū)館的應(yīng)用,以期能夠?yàn)闃I(yè)內(nèi)同仁開(kāi)發(fā)同類(lèi)系統(tǒng)提供參考,為智慧圖書(shū)館建設(shè)提供參考和借鑒。
2.1 系統(tǒng)實(shí)現(xiàn)的基本流程
用戶到館借閱資源,流通管理系統(tǒng)記錄用戶的借閱行為形成用戶借閱檔案。系統(tǒng)通過(guò)用戶的借閱檔案信息,從流通管理系統(tǒng)中查找具有相似借閱記錄的若干用戶進(jìn)行用戶聚類(lèi),形成相似用戶群;依托用戶群獲取相似用戶的借閱歷史記錄,形成初始資源推薦集合,同時(shí)對(duì)用戶和相似用戶進(jìn)行借閱歷史行為比較,生成用戶與相似用戶群中每位用戶的相似度;通過(guò)初始資源推薦集合與用戶相似度的加權(quán)計(jì)算形成擬推薦資源權(quán)重,并通過(guò)一定的協(xié)同過(guò)濾規(guī)則對(duì)結(jié)果進(jìn)行刪除和排序,形成最終的推薦資源庫(kù);依托用戶使用的圖書(shū)館服務(wù)終端,如網(wǎng)站、App、微信公眾號(hào)等將資源推薦給用戶,進(jìn)而完成整個(gè)推送過(guò)程。見(jiàn)圖1。
2.2 系統(tǒng)實(shí)現(xiàn)的關(guān)鍵模塊——推薦算法
推薦算法是系統(tǒng)實(shí)現(xiàn)的關(guān)鍵,其通過(guò)對(duì)用戶資源使用檔案記錄進(jìn)行分析,發(fā)現(xiàn)用戶之間的潛在聯(lián)系,并經(jīng)過(guò)一系列模型計(jì)算,最終推薦用戶最有可能感興趣的資源[4]。目前,主流的推薦算法包括基于項(xiàng)目?jī)?nèi)容的過(guò)濾推薦算法和基于用戶行為的協(xié)同過(guò)濾推薦算法。
基于內(nèi)容的推薦方法是根據(jù)用戶過(guò)去的借閱記錄和用戶個(gè)人信息屬性向用戶推薦用戶沒(méi)有接觸過(guò)的推薦資源,其推薦過(guò)程主要包含信息檢索和信息過(guò)濾兩個(gè)部分。在實(shí)際應(yīng)用中,基于項(xiàng)目?jī)?nèi)容的過(guò)濾算法大多應(yīng)用于系統(tǒng)冷啟動(dòng)階段,即在用戶和數(shù)據(jù)較少的情況下通過(guò)一定策略推薦相關(guān)資源,如:智慧圖書(shū)館可以根據(jù)用戶個(gè)人檔案信息中的專(zhuān)業(yè)信息,從系統(tǒng)中自動(dòng)隨機(jī)選取一部分本專(zhuān)業(yè)的圖書(shū)作為推薦資源。
基于用戶行為的協(xié)同過(guò)濾算法按照“物以類(lèi)聚、人以群分”的基本思想,為用戶推薦和他有相似行為的用戶(鄰域用戶)喜歡的資源。用戶行為相似度越高,其喜歡的資源被推薦的可能性就越大。相似度計(jì)算是基于用戶行為的協(xié)同過(guò)濾算法的核心,其計(jì)算結(jié)果決定了推薦結(jié)果的排序,進(jìn)而影響被推薦資源能否被有效展示。常見(jiàn)的相似度算法包括余弦相似度、Jaccard相似系數(shù)、歐式距離、曼哈頓距離等。相對(duì)于基于內(nèi)容的線性推薦,基于用戶行為的協(xié)同過(guò)濾系統(tǒng)推薦的資源更科學(xué)和準(zhǔn)確,推薦資源的范圍可以脫離系統(tǒng)冷啟動(dòng)階段推薦策略限制(如專(zhuān)業(yè)、學(xué)科等),結(jié)果集合更廣泛;當(dāng)用戶和使用數(shù)據(jù)達(dá)到一定規(guī)模后,其推薦結(jié)果具有較高的準(zhǔn)確率,也更符合用戶實(shí)際需求?;谟脩粜袨榈膮f(xié)同過(guò)濾系統(tǒng)推薦的不足之處主要在于無(wú)法解決新資源、新用戶冷啟動(dòng)問(wèn)題以及個(gè)別用戶推薦數(shù)據(jù)稀疏問(wèn)題。
無(wú)論哪種推薦系統(tǒng)均是在分析用戶個(gè)性化檔案信息的基礎(chǔ)上,了解用戶興趣愛(ài)好和需求,進(jìn)而為用戶推薦資源。用戶個(gè)性化檔案信息是推薦系統(tǒng)的基礎(chǔ)和出發(fā)點(diǎn)[5]。筆者設(shè)計(jì)和實(shí)現(xiàn)的個(gè)性化圖書(shū)推薦系統(tǒng)將兩種推薦算法結(jié)合使用,即在用戶行為數(shù)據(jù)較少、相似用戶不具規(guī)模的情況下,采用內(nèi)容推薦算法進(jìn)行冷啟動(dòng)推薦相關(guān)資源,保證推薦系統(tǒng)的全面性;當(dāng)系統(tǒng)運(yùn)行一段時(shí)間,用戶數(shù)據(jù)積累到一定數(shù)量時(shí)采用基于用戶行為的協(xié)同推薦算法,提高推薦的科學(xué)性和準(zhǔn)確率。
2.3 推薦系統(tǒng)使用效果
筆者設(shè)計(jì)和實(shí)現(xiàn)的個(gè)性化圖書(shū)精準(zhǔn)推薦系統(tǒng),以“拉取”和“推送”相結(jié)合的方式為用戶推薦資源。在“拉取”模式下,在用戶進(jìn)行館藏檢索、借閱歷史查詢時(shí),圖書(shū)館將其可能喜歡的圖書(shū)展示在對(duì)應(yīng)頁(yè)面上,供用戶點(diǎn)擊查看,提高相關(guān)資源的曝光率,進(jìn)而提升資源被借閱的可能。在“推送”模式下,系統(tǒng)主要以圖書(shū)館微信公眾號(hào)為服務(wù)平臺(tái),以模板消息提醒的形式,定期為用戶推送其可能感興趣的圖書(shū)資源,主動(dòng)出擊,吸引用戶到館閱讀。系統(tǒng)上線后,圖書(shū)館讀者到館率、二次借閱量和資源使用量較之前均有顯著提升?;谟脩魝€(gè)性化檔案信息的圖書(shū)精準(zhǔn)推薦系統(tǒng)在提升圖書(shū)館資源利用率和服務(wù)層次的同時(shí),也增強(qiáng)了用戶的使用體驗(yàn),提高了用戶使用資源與服務(wù)的效率,深受用戶好評(píng)。
3 智慧圖書(shū)館在使用用戶個(gè)性化檔案信息時(shí)應(yīng)注意的問(wèn)題
3.1 個(gè)性化檔案信息的搜集應(yīng)符合相關(guān)法律規(guī)范
圖書(shū)館用戶個(gè)人檔案信息涉及基本識(shí)別信息、借閱愛(ài)好信息、行為軌跡信息等,相關(guān)信息的獲取應(yīng)在國(guó)家允許采集的范圍內(nèi)進(jìn)行,采集過(guò)程應(yīng)符合國(guó)家法律規(guī)范,如:用戶人臉信息的獲取應(yīng)在明確告知用戶且在用戶允許采集的情況下才能開(kāi)展。同時(shí),圖書(shū)館應(yīng)根據(jù)相關(guān)法律規(guī)定制定本館不同用戶個(gè)人檔案信息的機(jī)密程度、使用范圍、使用策略、安全機(jī)制等使用辦法,以制度約束使用行為,確保信息使用安全。
3.2 在資源使用過(guò)程中,應(yīng)注意用戶個(gè)人隱私權(quán)的保護(hù)
在使用用戶個(gè)性化檔案信息實(shí)現(xiàn)個(gè)性化、智能化資源推薦服務(wù)的過(guò)程中,圖書(shū)館要注意用戶個(gè)人隱私特別是敏感數(shù)據(jù)的保護(hù),應(yīng)絕對(duì)避免個(gè)人信息的泄露,涉及用戶隱私的數(shù)據(jù)應(yīng)盡量只在程序后臺(tái)使用,而不應(yīng)對(duì)他人公開(kāi)。例如,在圖書(shū)資源的智能化推薦過(guò)程中,圖書(shū)館應(yīng)盡量做到根據(jù)用戶本人借閱檔案信息,推薦具有相似借閱行為的用戶借閱了哪些書(shū),而不應(yīng)涉及借閱相同書(shū)的用戶有哪些(以書(shū)會(huì)友),以免引起不必要的麻煩甚至是法律糾紛。
4 結(jié)語(yǔ)
物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能以及數(shù)據(jù)挖掘技術(shù)為圖書(shū)館帶來(lái)了新的機(jī)遇,為圖書(shū)館實(shí)現(xiàn)由數(shù)字化向智能化信息服務(wù)的轉(zhuǎn)變提供了可能?;谟脩魝€(gè)性化檔案信息的智慧服務(wù)可以讓圖書(shū)館主動(dòng)地服務(wù)用戶,通過(guò)信息推送實(shí)現(xiàn)用戶之間、用戶與圖書(shū)館之間、用戶與信息資源之間的溝通,進(jìn)而實(shí)現(xiàn)真正意義上的智慧化服務(wù)和管理[6]。今后,圖書(shū)館將繼續(xù)發(fā)揮用戶個(gè)性化檔案信息的服務(wù)保障功能,加強(qiáng)用戶個(gè)性化檔案信息管理,利用大數(shù)據(jù)分析技術(shù)進(jìn)一步挖掘用戶的潛在信息需求,為智慧圖書(shū)館建設(shè)提供強(qiáng)有力的支撐。
參考文獻(xiàn):
[1] 趙希波.“人工智能+5G”視域下圖書(shū)館泛在化智慧服務(wù)模式研究[J].中國(guó)中醫(yī)藥圖書(shū)情報(bào)雜志,2021(2):38-40,44.
[2] 朱加榮.小站練兵研究的史料基礎(chǔ)與檔案利用[J].軍事歷史研究,2010(S1):198-199.
[3] 化秀玲.高校圖書(shū)館資源整合與個(gè)性化用戶檔案管理[J].檔案管理,2018(4):91-92.
[4] 賈偉,劉旭艷,徐彤陽(yáng).融合用戶智能標(biāo)簽與社會(huì)化標(biāo)簽的推薦服務(wù)[J].情報(bào)科學(xué),2019(10):120-125.
[5] 閆巧琴.圖書(shū)館個(gè)性化服務(wù)與數(shù)字化用戶檔案管理[J].檔案管理,2016(3):75-77.
[6] 熊擁軍.數(shù)字圖書(shū)館個(gè)性化服務(wù)資源推薦模式分析[J].圖書(shū)館,2014(2):132-134.
(編校:崔 萌)