江波
摘?要:隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,信息數(shù)據(jù)的挖掘水平得到快速提高。為了提高數(shù)字圖書館電子資源推薦服務的水平,有效避免“數(shù)據(jù)孤島”,文章從基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務模型的構(gòu)建策略及構(gòu)建方案著手,分析了數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館電子資源推薦服務中的作用,為數(shù)字圖書館提高用戶的信息采用率提供了參考。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2018)12-0059-03
關(guān)鍵詞:用戶行為;數(shù)據(jù)挖掘;數(shù)字圖書館;電子資源推薦服務
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,圖書信息資源的電子化進程也得到快速推進,數(shù)字圖書館的電子資源推薦服務是信息資源電子化推進過程中的一個重要環(huán)節(jié),應該引起圖書館界的重視。為了滿足用戶的實際需求,數(shù)字圖書館在開展電子資源推薦服務前,應了解用戶的個性化特征和使用習慣。從這個角度看,用戶行為特征的提取能力決定數(shù)字圖書館電子資源推薦服務的水平。隨著科技的發(fā)展,數(shù)據(jù)挖掘技術(shù)水平得到快速提高,在應用領(lǐng)域也得到迅速推廣,數(shù)字圖書館采用數(shù)據(jù)挖掘技術(shù)對用戶的行為特征進行提取,可避免“知識迷航”“信息過載”等情況的發(fā)生。
1?用戶行為的類型
互聯(lián)網(wǎng)技術(shù)的發(fā)展不僅給圖書館帶來了大量的信息資源,在很大程度上還拓寬了用戶獲取信息資源的渠道,改變了用戶獲取信息的習慣和方式。為了幫助人們從互聯(lián)網(wǎng)海量的信息資源中獲取他們所需的信息,數(shù)字圖書館在提高信息資源檢索能力的同時,也應不斷提高對用戶行為特征的挖掘能力。用戶行為指圖書館用戶為了解決自身在日常生產(chǎn)生活中遇到的問題,或者為了達到某種目的,對一定時期的相關(guān)事件數(shù)據(jù)進行查詢、檢索和信息加工等。圖書館只有掌握用戶的這些行為特征,才能整理和分析用戶的使用特點及信息需求,才能充分發(fā)揮自身優(yōu)勢為用戶提供更貼合實際的服務。常見的用戶行為主要有兩種:一是用戶在圖書館內(nèi)的直接使用行為,即用戶進入圖書館,在不同區(qū)域進行信息資源的查閱和咨詢行為。二是用戶通過圖書館網(wǎng)站進行的檢索行為,即用戶帶著問題在圖書館網(wǎng)站進行檢索、瀏覽、交流互動及下載資源信息等行為。
2?數(shù)字圖書館挖掘用戶行為數(shù)據(jù)的必要性
隨著圖書館數(shù)字化進程的不斷推進,數(shù)字圖書館擁有的數(shù)據(jù)量呈幾何倍數(shù)增長,這些數(shù)據(jù)極大地豐富了館藏資源,給用戶的信息獲取帶來了便利。數(shù)字圖書館的數(shù)據(jù)資源主要包括館藏書刊資源信息、電子期刊資源信息、視頻音頻信息、用戶借閱信息,以及用戶的留言信息、分享信息和相關(guān)的硬件設備信息等,這些數(shù)據(jù)是數(shù)字圖書館正常運轉(zhuǎn)的基礎(chǔ)。但是,受技術(shù)水平和經(jīng)費的限制,部分數(shù)字圖書館還不能很好地利用先進技術(shù)對館藏數(shù)據(jù)進行合理優(yōu)化和融合。在這種情況下,大量數(shù)據(jù)不能進行有效連接與貫通,不能得到有效利用,形成了“數(shù)據(jù)孤島”。然而,這些冗余、孤立存在的數(shù)據(jù)往往含有大量有價值的信息,如果這些信息不能被及時發(fā)現(xiàn)和有效利用,就會造成資源浪費,同時也削弱了數(shù)字圖書館的服務能力。
針對上述情況,數(shù)字圖書館應重視館藏數(shù)據(jù)的冗余問題,尤其是用戶行為數(shù)據(jù)的冗余、孤立等問題,并采取有效手段進行解決。一方面,數(shù)字圖書館可以采取有效的管理手段,對館藏數(shù)據(jù)進行分類管理,避免出現(xiàn)疊加或盲區(qū)等現(xiàn)象,方便用戶快速獲取數(shù)據(jù);另一方面,數(shù)字圖書館可以采用先進的技術(shù),如數(shù)據(jù)挖掘技術(shù),對館藏數(shù)據(jù)進行挖掘和整理。隨著數(shù)據(jù)挖掘技術(shù)的逐漸成熟,該技術(shù)的數(shù)據(jù)特征挖掘效果良好,可以幫助使用單位實現(xiàn)數(shù)據(jù)的有效利用。因此,數(shù)字圖書館應引入數(shù)據(jù)挖掘技術(shù)對用戶行為數(shù)據(jù)進行挖掘,及時分析用戶的行為特征,掌握用戶的使用習慣,為個性化推薦服務打下基礎(chǔ)。
3?基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務模型構(gòu)建
數(shù)字圖書館通過對用戶行為數(shù)據(jù)進行挖掘的方式,掌握用戶的行為習慣和行為特征,提高服務水平。筆者結(jié)合數(shù)字圖書館的資源情況,構(gòu)建了基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務模型。
3.1?電子資源推薦服務模型的構(gòu)建策略
電子資源推薦服務在數(shù)字圖書館各種功能中占主要地位,它是數(shù)字圖書館與用戶聯(lián)系的中間紐帶,可以完整展現(xiàn)數(shù)字圖書館的服務能力和水平。電子資源推薦服務主要有交互性、人性化、即時性等特征。即時性和交互性特征的作用是通過大量數(shù)據(jù)即時鏈接、即時交互,解決用戶在海量數(shù)據(jù)包圍中可能出現(xiàn)的“知識信息迷航”問題;個性化特征的作用是在用戶被動接受無用數(shù)據(jù)時,幫助用戶過濾掉主觀上不需要的信息,解決“知識信息過載”的問題。具體的構(gòu)建策略如圖1所示。
3.1.1?利用關(guān)聯(lián)技術(shù)應對“知識信息迷航”的問題。關(guān)聯(lián)技術(shù)是一個統(tǒng)稱,包括本體、云平臺等,具有規(guī)范化、可共享等特點。在本體、云平臺的基礎(chǔ)上,關(guān)聯(lián)技術(shù)可以對多種類型的知識庫(包括異構(gòu)知識庫)進行有機連接,各類知識庫通過關(guān)聯(lián)技術(shù)進行連接,最終形成龐大的數(shù)據(jù)集群庫。一方面,用戶可以通過數(shù)據(jù)集群庫對相關(guān)的信息資源進行精確匹配查詢,提高檢索數(shù)據(jù)的準確率和查全率;另一方面,各類信息數(shù)據(jù)管理平臺通過該數(shù)據(jù)集群庫縮小數(shù)據(jù)資源的檢索范圍,提高用戶檢索數(shù)據(jù)資源的效率,進而解決“知識信息迷航”的問題。
3.1.2?利用關(guān)聯(lián)技術(shù)應對“知識信息過載”的問題。數(shù)字圖書館在提供電子資源推薦服務的過程中,“知識信息過載”的問題尤為凸顯。數(shù)字圖書館如果沒有掌握用戶的行為特征,就會向用戶推薦過多不需要的信息,給用戶帶來一定的困擾。數(shù)字圖書館通過關(guān)聯(lián)技術(shù),可以將用戶的行為數(shù)據(jù)進行有機連接,挖掘用戶的行為特征,對用戶進行有效推薦,提高用戶的滿意度。
3.2?電子資源推薦服務模型的構(gòu)建方案
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務方案主要由用戶行為特征數(shù)據(jù)本體庫、用戶需求與喜好挖掘本體庫和館藏資源信息庫三部分構(gòu)成,具體的構(gòu)建方案如圖2所示。
3.2.1?用戶行為特征數(shù)據(jù)本體庫的構(gòu)建方案。數(shù)字圖書館可利用本體技術(shù),對獲取的用戶行為特征信息進行再處理,提取與用戶行為特征數(shù)據(jù)庫相關(guān)的字段。同時,數(shù)字圖書館也應分析整理館藏資源信息庫的信息,提取與用戶行為特征相關(guān)聯(lián)的服務日志信息等內(nèi)容,進而構(gòu)建用戶行為特征數(shù)據(jù)本體庫。該本體庫構(gòu)建的一個難點是用戶實際需求與館藏資源的匹配問題,在整個本體庫構(gòu)建的過程中應引起數(shù)字圖書館的重視。
3.2.2?用戶需求與喜好挖掘本體庫的構(gòu)建方案。數(shù)字圖書館積累了大量用戶需求及喜好的信息,如何利用這些信息提高電子資源推薦服務的效率是其亟須解決的問題。在構(gòu)建用戶需求與喜好挖掘本體庫的過程中,數(shù)字圖書館要詳細統(tǒng)計和分析用戶的行為日志,對用戶的顯性需求和隱性需求進行分類,用特定的本體術(shù)語進行描述,方便相關(guān)功能模塊的調(diào)用。
3.2.3?電子資源推薦服務流程設計。當用戶登錄數(shù)字圖書館后,系統(tǒng)會根據(jù)用戶的登錄信息,在用戶行為特征數(shù)據(jù)本體庫和用戶需求與喜好挖掘本體庫中進行檢索,將用戶的需求與館藏資源進行信息匹配,得出用戶可能需要的圖書、期刊、專利等方面的信息,并以小窗口的形式向用戶進行推送。當用戶在操作界面檢索需要的信息時,系統(tǒng)會將用戶輸入的檢索信息與用戶的特征數(shù)據(jù)信息進行融合,找出關(guān)聯(lián)信息,并在館藏資源信息庫中進行檢索?;谟脩粜袨閿?shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務是一個實時的過程,主要通過系統(tǒng)后臺運行,避免影響用戶的實際操作,同時又能向用戶推送符合其要求的信息。
4?基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務的優(yōu)勢分析
4.1?推薦服務更加精準
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館從用戶的實際需求出發(fā),對用戶行為特征進行挖掘,并對獲取的用戶行為特征信息進行詳細比對和關(guān)聯(lián)分析,找出其中的隱性信息,更好地掌握用戶的行為習慣、需求和喜好等內(nèi)容,進而為用戶提供精準的電子資源推薦服務。數(shù)字圖書館利用數(shù)據(jù)挖掘技術(shù)不僅提高了電子資源推薦服務的準確性,還滿足了用戶的個性化信息需求,提高了用戶的信息采用率。
4.2?用戶使用更加便捷
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務的操作系統(tǒng)是自動運行的,系統(tǒng)后臺能自動根據(jù)用戶的登錄信息獲取用戶的行為特征信息,并與館藏資源數(shù)據(jù)庫中的資源進行比對,找出用戶可能需要的資源信息并進行推薦。在推薦信息時,數(shù)字圖書館通過小窗口顯示的方式,避免對用戶的操作界面產(chǎn)生影響,進而提高用戶的檢索效率。因此,用戶在輸入檢索信息關(guān)鍵詞時,可以快速瀏覽系統(tǒng)的推薦信息,如果推薦信息包括用戶需要查找的信息,用戶就不需要再重新查找。
4.3?數(shù)字圖書館管理更加高效
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務主要是通過運行計算機程序?qū)崿F(xiàn)的,不需要專門人員負責實施。該推薦服務主要是通過增設系統(tǒng)模塊實現(xiàn)的,也就是說在系統(tǒng)升級過程中數(shù)字圖書館只要將模塊融入管理系統(tǒng),就不需要再派專門人員負責分析用戶行為,從而降低了經(jīng)費開支,提高了管理效率。
5?結(jié)語
隨著科技的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)滲透到各行各業(yè),并在多個領(lǐng)域發(fā)揮著積極的作用?;谟脩粜袨閿?shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務提高了用戶的信息采用率,為數(shù)字圖書館電子資源推薦服務智能化發(fā)展打下了堅實的基礎(chǔ)。
參考文獻:
[1] 張宏.我國高校圖書館大數(shù)據(jù)研究現(xiàn)狀分析[J].圖書館工作與研究,2016(7):46-50.
[2] 王捷.大數(shù)據(jù)時代下圖書館開展信息服務的對策[J].現(xiàn)代情報,2013(3):81-83.
[3] 張衛(wèi)群.圖書館用戶信息行為研究綜述[J].圖書館學研究,2006(8):87-90.
[4] 朱立紅.高校圖書館的數(shù)據(jù)挖掘技術(shù)應用與用戶研究[J].圖書館雜志,2008(6):39-42.
[5] 應璇,孫濟慶.面向大數(shù)據(jù)的用戶檢索行為研究[J].情報雜志,2014(2):140-143.
(編校:孫新梅)