侯燁 時圣宇
摘 要:高等院校內(nèi)部圖書館系統(tǒng)設(shè)計和應(yīng)用工作,在現(xiàn)代化科學(xué)技術(shù)和管理原則的共同作用下,已經(jīng)產(chǎn)生了十分明顯的發(fā)展效果。本文首先對高校圖書館,圖書推薦系統(tǒng)當(dāng)中,關(guān)聯(lián)規(guī)則的應(yīng)用進(jìn)行了簡單概述,分析了數(shù)據(jù)倉庫和聯(lián)機(jī)分析模塊的設(shè)計工作;隨后,在此基礎(chǔ)上,進(jìn)一步探究了高校圖書館中,關(guān)聯(lián)規(guī)則的優(yōu)化模式,旨在為關(guān)注這一領(lǐng)域的人士,提供一些可行性較高的參考意見。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;高校圖書館;圖書推薦
隨著我國國民經(jīng)濟(jì)的發(fā)展,以及人民生活水平的提高,社會各界對于我國高等院校的圖書館管理模式,尤其是高校圖書館中,關(guān)聯(lián)規(guī)則的應(yīng)用方面越來越關(guān)注。圖書館的信息服務(wù)模式,是面向全體讀者的,在高等院校內(nèi)部的圖書館中,關(guān)聯(lián)規(guī)則的合理應(yīng)用,可以為讀者們推薦更加適合的圖書信息,幫助學(xué)生們根據(jù)自己的實際需求,靈活地挑選和借閱圖書,提高圖書的可讀性。
1 關(guān)聯(lián)規(guī)則在高校圖書館圖書推薦中的應(yīng)用
高校圖書館中,圖書借閱數(shù)據(jù)庫和聯(lián)機(jī)分析模塊的設(shè)計和管理,是關(guān)聯(lián)規(guī)則應(yīng)用最為廣泛的項目。
1.1 數(shù)據(jù)倉庫設(shè)計
在進(jìn)行數(shù)據(jù)倉庫的設(shè)計工作中,設(shè)計師要明確不同區(qū)域各自所具備的主題。將邏輯模型按照主題進(jìn)行分化和管理,之后,再利用關(guān)聯(lián)規(guī)則,將其進(jìn)行延伸,明確各個主題下,不同邏輯模型之間的關(guān)聯(lián)關(guān)系。比如,在實際的設(shè)計工作中,可以將粒度層次劃分方法,應(yīng)用到其中。粒度層次劃分方法,是數(shù)據(jù)倉庫設(shè)計環(huán)節(jié)最為重要的內(nèi)容。首先對數(shù)據(jù)倉庫的數(shù)量級進(jìn)行分析,將數(shù)據(jù)倉庫的數(shù)量級應(yīng)用到不同的管理管理模塊,采用多種數(shù)據(jù)粒度策略。當(dāng)數(shù)據(jù)量較大時,應(yīng)用雙重粒度;當(dāng)數(shù)據(jù)量較小時,可以采取直接存儲細(xì)節(jié)的方式,并且定期進(jìn)行數(shù)據(jù)庫綜合測試,優(yōu)化數(shù)據(jù)粒度[1]。
1.2 聯(lián)機(jī)分析模塊
多維聯(lián)機(jī)分析數(shù)據(jù)倉庫中,數(shù)據(jù)分析模塊是其最重要的功能。例如,我國某地區(qū)的高校圖書館,在進(jìn)行設(shè)計的過程中,應(yīng)用了Oracle10g和Oracle Warehouse Builder組織數(shù)據(jù)庫,對模塊進(jìn)行了集中數(shù)據(jù)管理。在具體的操作環(huán)節(jié),工作人員分別建立了數(shù)據(jù)倉庫的圖書維、讀者維和時間維等三個模塊。建立讀者多維數(shù)據(jù)庫和圖書多維數(shù)據(jù)庫,通過時間軸,對讀者在不同時間段內(nèi)查詢、瀏覽和借閱的圖書信息進(jìn)行集中管理。在讀者共享的維度,可以按照讀者所在學(xué)院、專業(yè)、借閱組等方面的信息進(jìn)行分類,形成具有遞進(jìn)層次的數(shù)據(jù)信息,可以為聯(lián)機(jī)分析模塊的優(yōu)化設(shè)計,提供更為準(zhǔn)確的信息數(shù)據(jù)支持。
2 高校圖書館中關(guān)聯(lián)規(guī)則的優(yōu)化研究
在對高校圖書館中,關(guān)聯(lián)規(guī)則的具體應(yīng)用模式進(jìn)行優(yōu)化研究的過程中,筆者以某地區(qū)高等院校內(nèi)部讀者在校期間的借閱數(shù)據(jù)作為主要的研究對象,開展了如下的研究工作:
2.1 研究流程
應(yīng)用關(guān)聯(lián)規(guī)則和時間軸分析方法,對不同讀者的閱讀數(shù)據(jù)進(jìn)行了分類管理。在這一過程中,將讀者所在學(xué)院和所學(xué)專業(yè)等變量信息考慮在內(nèi),以此得出讀者閱讀偏好和圖書類型的關(guān)聯(lián)關(guān)系。通過關(guān)聯(lián)規(guī)則分析的方法,重點掌握了以專業(yè)為單位的用戶群體,不同的閱讀需求、閱讀偏好與閱讀傾向等,將各項數(shù)據(jù)存儲到數(shù)據(jù)庫當(dāng)中,為后續(xù)高校圖書館圖書推薦系統(tǒng)的個性化和私人化推薦,提供更為準(zhǔn)確的信息數(shù)據(jù)支持。在大數(shù)據(jù)和云計算等科學(xué)技術(shù)的配合下,關(guān)聯(lián)原則在高校圖書館中的應(yīng)用效果更為明顯,以行之有效的推薦方法,可以讓高校圖書館的圖書資源,發(fā)揮出最佳的應(yīng)用效果。將科學(xué)的圖書信息服務(wù),貫穿于用戶閱讀全過程。
在數(shù)據(jù)信息選取的過程中,筆者選取了抽樣調(diào)查的方法,將抽樣比例控制在30%。從圖書館的借閱管理系統(tǒng),對抽樣用戶從一年級到四年級期間,在圖書館中借閱的數(shù)據(jù)進(jìn)行了調(diào)取,共獲取了1200名用戶的27905條數(shù)據(jù)。抽樣的用戶專業(yè)覆蓋了管理、經(jīng)濟(jì)、法學(xué)、醫(yī)學(xué)、文學(xué)、理學(xué)和工學(xué)等多個學(xué)科的71個專業(yè)。在數(shù)據(jù)處理階段,根據(jù)用戶的學(xué)號、專業(yè)、借閱操作日期、中圖分類號和圖書名稱等信息,將各項數(shù)據(jù)進(jìn)行了集成處理。應(yīng)用Apriori算法,對圖書借閱活動中的用戶維度、圖書維度和時間維度等內(nèi)容進(jìn)行了處理。運(yùn)用Apriori算法,找出全部數(shù)據(jù)當(dāng)中的頻繁項集,之后判斷最大頻繁項集中,沒有超過最小支持度的數(shù)據(jù),將其進(jìn)行剔除,得到的滿足條件的最小置信度,即為強(qiáng)關(guān)聯(lián)原則[2]。
2.2 研究結(jié)果
在筆者調(diào)查的1200名用戶的27905條數(shù)據(jù)中,用戶借閱的圖書類型共計22類,借閱密度為0.17。其中,最常借閱的圖書類型為B、H、I、K、T等五種類型。有155名用戶的借閱數(shù)據(jù)顯示,平時只借閱一種類型的圖書。并且,數(shù)據(jù)還顯示,用戶在一、二和四年級的學(xué)習(xí)中,借閱類型與自身專業(yè)匹配度較高。對此,在系統(tǒng)進(jìn)行優(yōu)化設(shè)計時,可以根據(jù)用戶的專業(yè)類型以及在不同年級的發(fā)展水平,為用戶推薦更適合的專業(yè)書籍。此外,用戶除了專業(yè)書籍之外,其他興趣愛好方面的發(fā)展總體呈現(xiàn)出較低的水平。對此,高校圖書館系統(tǒng)可以適當(dāng)?shù)卦谕扑]項目中,增加用戶可能感興趣的課外閱讀材料,并根據(jù)用戶的點擊量,隨時進(jìn)行優(yōu)化調(diào)整。
3 總結(jié)
綜上所述,關(guān)聯(lián)規(guī)則在高校圖書館中,有著良好的應(yīng)用效果。相關(guān)領(lǐng)域的工作人員,可以在日常的組織和管理過程中,深入系統(tǒng)地分析出,高校圖書館圖書推薦服務(wù)中,關(guān)聯(lián)規(guī)則的操作模式。通過設(shè)計出合理的研究流程,可以提升研究所得結(jié)果的科學(xué)性和準(zhǔn)確性,從而可以為高校圖書館圖書推薦服務(wù),更好地應(yīng)用和發(fā)展關(guān)聯(lián)規(guī)則,更加便捷靈活地為讀者們服務(wù),提供了可行的途徑。
參考文獻(xiàn)
[1]王娜,岳俊英.基于關(guān)聯(lián)規(guī)則的高校圖書信息數(shù)據(jù)挖掘[J].信息系統(tǒng)工程,2014(02):153-154.
[2]趙琳. 數(shù)據(jù)挖掘技術(shù)及其在高校圖書管理系統(tǒng)中的應(yīng)用研究[D].中國海洋大學(xué),2011.