陳瑤
摘 要:大數(shù)據(jù)時代,如何從海量的資源中為用戶提供個性化信息服務(wù),是當(dāng)前高職院校圖書館遇到的困難之一。本文首先分析總結(jié)了目前高職院校圖書館個性化信息服務(wù)現(xiàn)狀,針對這些問題,結(jié)合數(shù)據(jù)挖掘技術(shù),提出了優(yōu)化圖書館個性化信息服務(wù)的若干方式。
關(guān)鍵詞:圖書館,個性化,數(shù)據(jù)挖掘,信息服務(wù)
近年來,國家對高職教育愈發(fā)重視,高職院校發(fā)展的同時其圖書館館藏資源也飛速增長,隨之也導(dǎo)致資源利用效率不高。信息資源豐富對圖書館來說既是優(yōu)勢,又是挑戰(zhàn)。如何有效利用海量的資源為用戶提供個性化信息服務(wù),是圖書館目前要解決的重要問題。而數(shù)據(jù)挖掘技術(shù),就是最有效的科學(xué)方法,可幫助圖書館精準(zhǔn)開展個性化信息服務(wù)。
1 高職圖書館個性化信息服務(wù)的現(xiàn)狀及原因
個性化信息服務(wù),重點在于個性化,是面對不同用戶的信息需求,根據(jù)用戶的個人特征,定制不同的服務(wù)方式,主動為用戶提供不同的信息和服務(wù)內(nèi)容,實現(xiàn)服務(wù)內(nèi)容、方式、時空的個性化。用戶不用再毫無頭緒得面對海量信息,獲得的主要是其感興趣的信息。
然而,由于高職院校圖書館的管理理念落后、資源經(jīng)費不足等種種原因,高職院校圖書館的個性化信息服務(wù)發(fā)展水平落后,未能及時跟上信息社會的變化。目前,大多數(shù)高職圖書館的個性化信息服務(wù)項目主要有資源(圖書)推薦、星級評價等基本形式。在資源(圖書)推薦服務(wù)模塊,大多數(shù)高職院校圖書館的圖書推薦僅僅停留在新書推薦、熱書推薦形式,是面向全員的統(tǒng)一推薦,并不是真正意義上的個性化推薦??偟膩碚f,目前高職院校圖書館的個性化信息服務(wù)內(nèi)容單一,讀者參與度也不高,無法充分發(fā)揮圖書館的功能職責(zé)。
究其成因,主要有以下幾點:
1)被動服務(wù),項目單一。目前,大多數(shù)高職圖書館的服務(wù)方式還是以管理為中心,主要提供基本的查找和借閱文獻的傳統(tǒng)服務(wù),服務(wù)項目單一。而本身高職院校師生主動利用圖書館資源的意愿也并不強烈,參與度較低,這也降低了高職院校圖書館工作的積極性。長此以往,高職圖書館在學(xué)校的地位和作用將會受到巨大的挑戰(zhàn)。
2)讀者反饋機制不健全。高職院校師生入館率低,圖書館也沒有積極走向師生,導(dǎo)致讀者和圖書館缺乏溝通交流,無法及時了解用戶的信息需求。
3)技術(shù)薄弱,人才短缺。當(dāng)前高職圖書館的人才隊伍質(zhì)量參差不齊,專業(yè)技術(shù)人才較少,在個性化信息服務(wù)研發(fā)工作中面臨各種技術(shù)難題。而完善的個性化信息服務(wù)系統(tǒng)也需要先進的設(shè)備支撐,且系統(tǒng)維護和完善更是一項長期的工程。一般的中小型高職圖書館很難獨立完成個性化信息服務(wù)系統(tǒng)的研發(fā)工作。
2 個性化信息服務(wù)的必要性
2.1 轉(zhuǎn)變信息服務(wù)方式,提高圖書館服務(wù)質(zhì)量
隨著信息技術(shù)的發(fā)展,各類資源的不斷增加,基本的咨詢和借閱服務(wù),已經(jīng)完全不能滿足圖書館用戶的信息需求。順應(yīng)時代的變化,圖書館開展個性化信息服務(wù),是從簡單的借閱服務(wù)完善到個性化的信息服務(wù),是從被動服務(wù)方式向主動服務(wù)轉(zhuǎn)變,提升了服務(wù)質(zhì)量,充分體現(xiàn)了“用戶至上”的服務(wù)理念,也大大提升了用戶體驗。
2.2 發(fā)揮圖書館功能職責(zé),提升競爭力
圖書館作為文獻、信息資源中心,肩負教育的職能,其實具有不可忽視的作用。為此,開展個性化信息服務(wù),進行閱讀推廣、信息推送等活動,可以更好地為師生提供信息資源服務(wù)。當(dāng)圖書館滿足了師生的信息需求,也就讓師生感受到了圖書館的功能作用,這也就增強了圖書館在校園的影響力。
3 數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘,就是從大量的、不完整的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中但又是潛在有用的信息和知識的過程。這是一門適應(yīng)信息社會從海量數(shù)據(jù)中提取信息的需要而產(chǎn)生的新學(xué)科,是統(tǒng)計學(xué)、機器學(xué)習(xí)、數(shù)據(jù)庫技術(shù)、人工智能、可視化技術(shù)等學(xué)科的交叉,所涉及的方法也很多。目前比較成熟且應(yīng)用廣泛主要有分類(Classification)、預(yù)測(Prediction)、關(guān)聯(lián)規(guī)則(association rules)、聚類(Clustering)等分析方法,每一類方法又涉及很多算法。
由于數(shù)據(jù)挖掘方法的科學(xué)高效,上述算法也被各方學(xué)者不斷改進與優(yōu)化,廣泛運用于實踐。在農(nóng)業(yè)、制造業(yè)、教育、體育競技、生物科學(xué)等各學(xué)科各領(lǐng)域的決策支持活動中,數(shù)據(jù)挖掘技術(shù)也都扮演著越來越重要的角色。科學(xué)利用數(shù)據(jù)挖掘技術(shù),有助于圖書館開展個性化信息服務(wù)。
4 利用數(shù)據(jù)挖掘技術(shù)優(yōu)化圖書館個性化服務(wù)的方式
4.1 用戶研究
圖書館以用戶為中心,研究用戶基本屬性和行為習(xí)慣,有利于圖書館全面了解用戶的需求,及時調(diào)整及時優(yōu)化,為用戶提供有需要的信息和服務(wù)。
利用數(shù)據(jù)挖掘的聚類算法,可以進行用戶分類,了解群體特征。例如,通過入館數(shù)據(jù)和借閱數(shù)據(jù),分析活躍用戶的行為習(xí)慣,對非活躍用戶的行為習(xí)慣加以引導(dǎo),有利于提高圖書館整體的入館率和借閱率。此外,聚類分析結(jié)果中用戶的平均借閱天數(shù)、平均借閱冊數(shù)及其標(biāo)準(zhǔn)差,可以作為圖書館個性化調(diào)整最大借閱天數(shù)和最大借閱冊數(shù)的參考依據(jù)。當(dāng)前,多數(shù)高職圖書館的借書期限和借閱冊數(shù)都是最初開館設(shè)定,后期也并未進行實踐優(yōu)化,可能無法滿足部分用戶的借閱需求。通過適當(dāng)調(diào)整,盡可能地將圖書主動提供給更多“適合的讀者”,提高圖書館各類圖書的流通率。
4.2 優(yōu)化館藏
利用語義分析和關(guān)鍵詞提取等方法,分析用戶的留言、建議等信息,了解用戶的需求,不斷優(yōu)化圖書服務(wù)。了解讀者薦購需求,結(jié)合圖書館各類型圖書的借閱率統(tǒng)計結(jié)果,制定科學(xué)的圖書采購計劃,減少盲目采購行為,優(yōu)化圖書館館藏,提高圖書的利用率。
4.3 個性化圖書推薦
通過相關(guān)算法,依據(jù)讀者個人的特征以及圖書的特征,圖書館可以為每位讀者進行個性化的圖書推薦,推薦讀者感興趣的圖書。目前,常用的推薦算法有基于內(nèi)容推薦、協(xié)同過濾推薦、關(guān)聯(lián)規(guī)則推薦、組合推薦等。不同的算法各有優(yōu)缺點,針對不同領(lǐng)域和不同的數(shù)據(jù)源,選擇合適的算法是提高推薦效果的關(guān)鍵。針對高職圖書館的特點,本文建議從用戶相關(guān)性和圖書相似性兩個角度來進行推薦。
用戶相關(guān)性角度可以使用關(guān)聯(lián)規(guī)則來進行挖掘,雖然關(guān)聯(lián)規(guī)則尋找的是物品之間的聯(lián)系,但它是依據(jù)大量用戶的歷史記錄挖掘出相關(guān)的規(guī)則,只有用戶之間具有相似的興趣愛好才會產(chǎn)生相同的事務(wù),因此它是用戶之間相似性的表現(xiàn)。
針對圖書之間的相似性,本文建議采用谷歌的開源工具word2vec。它能夠?qū)⒃~表征為向量從而方便的計算詞與詞之間的相似度。對圖書館來說,圖書的書名信息可以做為word2vec的輸入數(shù)據(jù),經(jīng)過訓(xùn)練能夠得到對應(yīng)每本圖書的詞向量,向量之間的距離可作為圖書之間相似性的體現(xiàn),從而據(jù)此為讀者提供相似的圖書的推薦。
5 結(jié)語
在國家大力推進職業(yè)教育現(xiàn)代化的新形勢下,高職院校的圖書館的服務(wù)也需要與時俱進,加快革新。特別是在大數(shù)據(jù)環(huán)境下圖書館應(yīng)該充分利用圖書館的文獻、信息資源,運用現(xiàn)代信息技術(shù),主動為圖書館用戶提供個性化信息服務(wù),滿足圖書館用戶的需求,貫徹圖書館“用戶至上”的服務(wù)理念。
參考文獻
[1]曹金梅.淺談高職院校圖書館的個性化信息服務(wù)[J].哈爾濱職業(yè)技術(shù)學(xué)院學(xué)報,2012,(01):103-104.
[2]張宇惠.數(shù)據(jù)挖掘在電信數(shù)據(jù)分析中的應(yīng)用[J].信息通信,2017,01:279-280.
[3]邵曉紅.高職院校圖書館個性化信息服務(wù)的思考[J].鄂州大學(xué)學(xué)報,2015,22(09):57-58+61.