孫常麗+王國軍+石丹+金松跟+胡艷君+武麗影
[摘 要]文章概述了高醫(yī)院校圖書館構(gòu)建薦讀系統(tǒng)可行性,對推薦系統(tǒng)中的核心技術(shù)——推薦算法進行了探討,同時進行了高醫(yī)院校推薦系統(tǒng)的推薦模式的創(chuàng)新性設(shè)計,簡述了基于局部數(shù)據(jù)的推薦模式的實現(xiàn)過程,對國內(nèi)圖書館提供推薦服務(wù)的未來做出了展望。
[關(guān)鍵詞]高醫(yī)院校圖書館;推薦系統(tǒng);推薦技術(shù);推薦算法;推薦服務(wù)
[DOI]10.13939/j.cnki.zgsc.2017.15.053
高醫(yī)院校圖書館的使命是提供專業(yè)的圖書館信息服務(wù)以滿足醫(yī)療、教學(xué)、科研的需求,完成高醫(yī)院校的使命——通過將一棵棵醫(yī)學(xué)“嫩苗”培育成“參天大樹”而貢獻社會。圖書推薦服務(wù)作為高校圖書館信息服務(wù)之一,它的發(fā)展有其迫在眉睫的理由,原因在于高醫(yī)院校圖書館的藏書非常專業(yè),加上醫(yī)學(xué)知識膨脹日益加速,廣大師生很難從眾多醫(yī)學(xué)藏書中找到自己需要的圖書。那么,如何將這些醫(yī)學(xué)專業(yè)圖書推薦給真正需要它的讀者,就成為了目前各大高醫(yī)院校圖書館迫切需要解決的問題。因此,圖書館作為信息交匯和資源共享平臺,構(gòu)建圖書薦讀系統(tǒng)(即推薦系統(tǒng))變得十分必要。本文提出了在高校圖書館領(lǐng)域構(gòu)建基于局部數(shù)據(jù)的圖書薦讀系統(tǒng),既能很好地滿足廣大師生的信息需求,同時也能夠通過這種主動推薦的模式幫助更多師生節(jié)省查找圖書資料的時間,提高工作學(xué)習(xí)效率。
1 高醫(yī)院校圖書館構(gòu)建薦讀系統(tǒng)的可行性分析
高校圖書館擁有豐富的藏書資源,是知識和信息的集散地,但是在知識爆炸的時代,移動設(shè)備頻頻更新?lián)Q代,讀者閱讀行為已經(jīng)改變,如果圖書館不能推出新的面向讀者的服務(wù)方式,高校圖書館將無法很好發(fā)揮其資源的優(yōu)勢。在這種環(huán)境下,本文對在高校圖書館領(lǐng)域構(gòu)建基于局部數(shù)據(jù)的圖書薦讀系統(tǒng)做了可行性研究。
近年來,推薦系統(tǒng)在各個領(lǐng)域內(nèi)逐漸興起,并得到越來越廣泛的應(yīng)用,目前在圖書館領(lǐng)域應(yīng)用推薦系統(tǒng)的同樣比比皆是,除了各自采用不同的推薦技術(shù)之外,目的都是為讀者提供更快更好的信息推送服務(wù),其中斯坦福大學(xué)的Fab推薦系統(tǒng),它將基于內(nèi)容和協(xié)同過濾算法結(jié)合起來,采用混合推薦技術(shù)為特定用戶進行推薦;加州大學(xué)的Melvy推薦系統(tǒng),它采用了兩種生成推薦系統(tǒng)的方法:一種是利用圖書館的流通數(shù)據(jù)進行推薦,另一種是基于相似性的推薦;美國俄勒岡的SERF推薦系統(tǒng)是一種通過寫作過濾的新型搜索引擎;在國內(nèi),雖然也有高校圖書館推出了推薦系統(tǒng),但并不普遍,其中中國人民大學(xué)圖書館的推薦系統(tǒng)比較成型,它同樣采用了混合的推薦模式為讀者推送書目信息。從技術(shù)的角度講,推薦系統(tǒng)在國際上已有成熟范例,而國內(nèi)圖書館領(lǐng)域仍屬于起步階段,需我們各大高校共同努力,實現(xiàn)圖書館領(lǐng)域的智能圖書推薦。[1]
2 各種推薦算法比較分析
目前,推薦系統(tǒng)在各行各業(yè)中應(yīng)用廣泛,其核心算法已經(jīng)基本成熟,主要分為以下三種。
2.1 基于內(nèi)容過濾的推薦算法
該算法通常使用機器學(xué)習(xí),向量空間,聚類等多種方法,進行文本挖掘。這個算法推薦結(jié)果直觀,容易解釋,且不需要領(lǐng)域知識,但是由于物品屬性有限,相似度分析又僅僅依賴于物品本身的特征,其復(fù)雜的屬性不好處理,所以很難得到有效數(shù)據(jù),且存在稀疏性問題和新用戶問題。
2.2 協(xié)同過濾推薦算法
它是在用戶對于一些項目或新聞資訊的評分或可以表達用戶喜好的行為的基礎(chǔ)上,查找具有相同興趣愛好或行為的用戶,以此來為目標用戶推薦一些他們可能會感興趣的資料的技術(shù)。這種算法是目前較常用的推薦技術(shù),它的優(yōu)點是與領(lǐng)域無關(guān),發(fā)現(xiàn)速度更快,性能隨著時間推移會提高,其推薦個性化、自動化程度都很高,能處理復(fù)雜的非結(jié)構(gòu)化對象;但是,存在稀疏性問題、可擴展問題和新用戶問題。[2]
2.3 基于關(guān)聯(lián)規(guī)則的推薦
這種方法需要挖掘數(shù)據(jù)的依賴關(guān)系,找到同時被購買的物品,這些用戶還買了哪些其他物品,這就是關(guān)聯(lián)規(guī)則,掌握這些就可以對用戶成功的實現(xiàn)物品推薦。這種方法優(yōu)點是可以充分利用大量的讀者數(shù)據(jù),挖掘讀者潛在借閱模式,缺點是關(guān)聯(lián)規(guī)則挖掘本身復(fù)雜,非專業(yè)人士難以理解挖掘結(jié)果,而且會出現(xiàn)產(chǎn)品名同義性問題,個性化程度比較低。[3]
3 基于局部數(shù)據(jù)的協(xié)同過濾推薦算法的采用
在高醫(yī)院校圖書館中進行圖書,推薦物品為圖書,用戶為特定的讀者群(廣大師生),以上三種常用的推薦方法,有其自身的優(yōu)勢,同樣也有弊端。
第一,高校圖書館管理系統(tǒng)中關(guān)于圖書的元信息十分有限。以牡丹江醫(yī)學(xué)院圖書館金盤管理系統(tǒng)為例,在金盤管理系統(tǒng)中,圖書的元數(shù)據(jù)只有題名、著者、出版社、期等信息,沒有圖書簡介,也沒有圖書的相關(guān)內(nèi)容,并且,在我們的傳統(tǒng)圖書館管理系統(tǒng)中也不提供讀者評論的平臺,而協(xié)同過濾推薦算法具有內(nèi)容無關(guān)性,這種特性可以彌補我們傳統(tǒng)圖書館中的元數(shù)據(jù)十分單一的不足。
第二,目前,牡丹江醫(yī)學(xué)院圖書館的金盤集成管理系統(tǒng)大概擁有100萬條讀者借閱記錄,據(jù)統(tǒng)計每年產(chǎn)生10萬余條數(shù)據(jù),這些借閱數(shù)據(jù)會越來越多,這些數(shù)據(jù)都會被圖書館管理系統(tǒng)記錄并保存下來,它們將會成為推薦系統(tǒng)進行推薦行為的數(shù)據(jù)來源,會及時更新我們對推薦系統(tǒng)的認知。
第三,便于隱式反饋數(shù)據(jù)的積累,在高校,讀者借閱日志的產(chǎn)生是圖書館管理系統(tǒng)自動生成的,無須讀者的任何協(xié)助行為,相比一般推薦系統(tǒng)中常用的需要用戶參與集中“評分數(shù)據(jù)”,更易獲取,同時,這種獲取方式不會給高校讀者帶來任何額外的負擔。
第四,讀者的借閱數(shù)據(jù)更能反映讀者的真實借閱需求。在高醫(yī)院校,讀者借閱數(shù)據(jù)是能夠真實地反映高校讀者需求的數(shù)據(jù),雖然借閱行為是屬于用戶的“隱式反饋”行為,但這種數(shù)據(jù)相比在互聯(lián)網(wǎng)上記錄一個用戶是否讀過一篇新聞更具參考價值,可行度更高。
第五,盡量減少推薦系統(tǒng)的實現(xiàn)對現(xiàn)有圖書管理系統(tǒng)的影響。推薦系統(tǒng)的實現(xiàn)往往會對高校圖書館管理系統(tǒng)造成影響,這是我們擔憂的問題之一,同時我們也擔心推薦系統(tǒng)會泄露讀者的個人隱私,所以,如果我們的推薦是基于用戶借閱數(shù)據(jù)的,我們只需要按時導(dǎo)出我們需要的那一部分數(shù)據(jù)即可,對原有圖書館管理系統(tǒng)沒有任何其他的操作,不會對其造成任何影響。[4]
基于以上因素的考慮,及幾種推薦算法的優(yōu)劣對比分析,本文提出了基于局部近鄰搜索的方法,即基于局部用戶數(shù)據(jù)的協(xié)同過濾推薦算法來構(gòu)建圖書薦讀系統(tǒng),該算法在協(xié)同過濾推薦算法的基礎(chǔ)上進行了改良創(chuàng)新,其基本思想是假設(shè)如果某些讀者同時喜歡某一專業(yè)或某一類別的圖書,那么他們對其他專業(yè)或類別的圖書的喜愛也比較相似,即評分相似,當然,這種算法尤其適合高校進行圖書推薦,原因在于高校由于其按專業(yè)進行劃分的這種特點,在挑選圖書時,相同專業(yè)的讀者往往會挑選相同或相似類別的圖書,因此我們在進行推薦方法設(shè)計時創(chuàng)新性地采用了讀者局部數(shù)據(jù),即采用相同專業(yè)的讀者借閱數(shù)據(jù)來進行圖書推薦服務(wù),這種方法區(qū)別于以往的利用全校讀者的借閱數(shù)據(jù)來發(fā)掘讀者潛在興趣的推薦模式,可以提供更為準確的圖書推薦服務(wù)[5]。
4 結(jié) 論
將推薦系統(tǒng)應(yīng)用于圖書館領(lǐng)域,既能很好地滿足廣大師生的信息需求,同時也能夠通過這種主動推薦的模式幫助更多師生節(jié)省查找圖書資料的時間、提高工作學(xué)習(xí)效率,提高圖書館現(xiàn)有資源的利用率,節(jié)省讀者查找所需圖書資料的時間,為高校教學(xué)科研提供極大便利。目前,國內(nèi)很少有成熟的推薦系統(tǒng)應(yīng)用在高校圖書館領(lǐng)域,由于構(gòu)建推薦系統(tǒng)的算法多種多樣,各具優(yōu)勢,各大高校應(yīng)該根據(jù)自己院校的特點進行選擇,適當創(chuàng)新,以促進推薦系統(tǒng)在未來高校圖書館中的發(fā)展應(yīng)用。
參考文獻:
[1]張閃閃,黃鵬.高校圖書館圖書推薦系統(tǒng)中的稀疏性問題實證探析[J].大學(xué)圖書館學(xué)報,2014(6):47-53.
[2]艾磊,趙輝.基于知識的推薦系統(tǒng)用戶交互模型研究[J].軟件導(dǎo)刊,2015(3):15-17.
[3]吳玉春,龍小建.基于關(guān)聯(lián)規(guī)則的圖書借閱數(shù)據(jù)挖掘[J].江蘇科技信息,2016(1):12-14.
[4]董坤.基于協(xié)同過濾算法的高校圖書館圖書推薦系統(tǒng)研究[J].現(xiàn)代圖書情報技術(shù),2011(11):44-47.
[5]張瑤.面向高校圖書館的推薦系統(tǒng)研究與實現(xiàn)[D].泉州:華僑大學(xué),2013.