• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      協(xié)同過濾算法在高校圖書館個性化推薦中的應(yīng)用研究

      2022-09-15 11:36:24袁瑰霞
      無線互聯(lián)科技 2022年14期
      關(guān)鍵詞:書籍個性化圖書

      袁瑰霞

      (安陽師范學(xué)院 圖書館,河南 安陽 455000)

      0 引言

      近年來,我國科學(xué)技術(shù)發(fā)展迅猛,高校圖書館開始引入信息化技術(shù),發(fā)揮館藏豐富的書籍資源作用,使教師用戶和學(xué)生用戶的整體知識素養(yǎng)得到有效的提升[1]。用戶通常通過信息檢索尋找符合自己需要以及喜好的書籍資源,但信息檢索的步驟較為煩瑣,許多用戶需要經(jīng)過多次的關(guān)鍵詞檢索才能尋找到適合的資源,因此,許多高校圖書館在高校圖書館系統(tǒng)中引入信息推送模塊[2]。高校圖書館通過對各用戶的檢索記錄和借閱記錄進(jìn)行整理,分析用戶行為數(shù)據(jù),根據(jù)各用戶的資源點(diǎn)擊情況對圖書館資源進(jìn)行分類與排序,制定推薦榜單[3]。許多熱門書籍資源不斷引進(jìn),高校圖書館還會將新進(jìn)資源進(jìn)行推薦,但許多高校圖書館還不能實(shí)現(xiàn)對最新的資源自動推薦,使用戶不能及時了解高校圖書館新進(jìn)資源的更新情況,同時,高校圖書館的書籍資源推薦方法還不夠完善,本文研究基于協(xié)同濾波算法為提高高校圖書館的服務(wù)水平提供參考依據(jù),對提高高校圖書館的個性化推薦效果具有重要的現(xiàn)實(shí)意義。

      1 協(xié)同過濾算法在高校圖書館個性化推薦中的應(yīng)用

      1.1 用戶信息數(shù)據(jù)獲取與顯示

      本文用戶信息數(shù)據(jù)來源于某高校圖書館的真實(shí)數(shù)據(jù),主要包括學(xué)生注冊基本信息,后臺借閱記錄以及學(xué)習(xí)行為數(shù)據(jù)。獲取學(xué)生基礎(chǔ)數(shù)據(jù)是進(jìn)行高校圖書館個性化推薦的信息基礎(chǔ),本文首先通過不同用戶對圖書資源的打分和點(diǎn)贊,分析不同用戶的資源需求和圖書偏好,再通過數(shù)據(jù)支持模塊建立與知識庫和顯示終端的聯(lián)系,實(shí)現(xiàn)個性化推薦。本文數(shù)據(jù)共有6 820名學(xué)生,涉及395 876本圖書,134 571條借閱記錄。在學(xué)生的后臺借閱記錄中,包括借還書信息,借閱方式以及圖書信息。將高校圖書館中的各類信息進(jìn)行整合,這些信息中存在著大量對個性化推薦結(jié)果不會產(chǎn)生影響的數(shù)據(jù)。因此,對該類信息的冗余數(shù)據(jù)進(jìn)行相應(yīng)的剔除,只保留幾條基礎(chǔ)信息數(shù)據(jù)。若數(shù)據(jù)中存在關(guān)鍵信息的缺失,則需要對該數(shù)據(jù)進(jìn)行補(bǔ)充,如索書號、借還時間以及用戶證號等。對獲取的數(shù)據(jù)進(jìn)行整理,若存在不完整的數(shù)據(jù)則需要進(jìn)行補(bǔ)全修正,在數(shù)據(jù)檢查中發(fā)現(xiàn)近3年來存在此類情況的數(shù)據(jù)較少,為了避免后文進(jìn)行數(shù)據(jù)處理時所產(chǎn)生的較大誤差,因此本文選取近3年的數(shù)據(jù)來研究用戶行為。

      1.2 基于協(xié)同過濾處理數(shù)據(jù)

      本文對于高校圖書館的數(shù)據(jù)集處理主要包括數(shù)據(jù)變化以及隱式數(shù)據(jù)的轉(zhuǎn)化。隱式數(shù)據(jù)表現(xiàn)著用戶與圖書館的瀏覽、借閱等互動行為,由于隱式數(shù)據(jù)不能直接反映出學(xué)生對于不同類型圖書資源的偏好,以及對書籍資源的喜好程度,只能從某類別的書籍借閱記錄中獲取用戶的偏好,并根據(jù)該類型圖書資源的;瀏覽與借閱次數(shù)好數(shù)量,判斷用戶對該類別書籍的喜好程度。本文基于協(xié)同過濾算法,將用戶借閱記錄的隱式反饋轉(zhuǎn)化對圖書資源類別的顯式評分,通過數(shù)據(jù)變化解決高校圖書館數(shù)據(jù)稀疏問題。本文將書籍類別進(jìn)行進(jìn)一步細(xì)分,將書目分為若干大類,根據(jù)用戶借閱圖書的隱私反饋轉(zhuǎn)化為對書目類別的興趣評分,以用戶的書目類別興趣的變換數(shù)據(jù)衡量用戶對某類圖書資源的興趣,進(jìn)行興趣預(yù)測評分,具體公式為:

      式中:xi為該類書籍的借閱數(shù)量,λ和γ分別為用戶和書籍的相關(guān)系數(shù),興趣度與書籍借閱的數(shù)量成正相關(guān)關(guān)系,但增加幅度會逐漸減小。在興趣度中,認(rèn)為借閱數(shù)量為5本的用戶興趣度明顯高于借閱數(shù)量為2本的用戶,但借閱數(shù)量為12本和15本的興趣度差異不大。在隱式評分轉(zhuǎn)化后,構(gòu)建用戶與書籍類別的評分矩陣為:

      矩陣中Rnj為第n個用戶對第j個書籍類別的興趣預(yù)測評分,在興趣評分計算完成后,便實(shí)現(xiàn)了顯性評分矩陣的構(gòu)建,完成了數(shù)據(jù)轉(zhuǎn)換。

      1.3 用戶與圖書相似度定義及描述

      用戶與圖書的相似度定義及描述需要對用戶和圖書的相似度進(jìn)行分別計算,本文采用內(nèi)積法進(jìn)行圖書相似度的計算,分別表示不同圖書的關(guān)鍵詞和對應(yīng)的權(quán)重,將各類圖書的不同關(guān)鍵詞信息構(gòu)成向量空間。選取相似的兩本圖書進(jìn)行相似度的計算,查詢這兩本圖書的相同關(guān)鍵詞,并根據(jù)相同關(guān)鍵詞形成新的向量信息,計算圖書向量的相似度。設(shè)兩本書共有m個共同關(guān)鍵詞,根據(jù)兩本書的對應(yīng)的不同向量進(jìn)行計算,具體公式為:

      其中兩本書分別表示為Wa和Wb,Bak和Bbk分別代表兩本書對應(yīng)的向量,k為圖書的關(guān)鍵詞,B為關(guān)鍵詞對應(yīng)的權(quán)重。其用戶相似度線性加權(quán)公式為:

      式中:SIMnum和SIMt分別為用戶的數(shù)值型屬性相似度和文本型屬性相似度,SIMact為用戶活躍相似度。用戶與圖書的相似度定義及描述通過比對用戶動態(tài)信息表和圖書關(guān)鍵詞信息,列出相同關(guān)鍵詞,記錄關(guān)鍵詞出現(xiàn)的頻率,使用上文相同算法,計算得到用戶和圖書向量的相似度,具體計算公式為:

      式中:Cn為用戶,通過上式建立用戶和圖書之間的關(guān)聯(lián),SIMcn值越大,用戶和圖書的關(guān)聯(lián)度越高,個性化推薦的質(zhì)量越高。

      1.4 建立高校圖書館個性化推薦模型

      本文在協(xié)同過濾算法的基礎(chǔ)上,建立高校圖書館的個性化推薦模型,該模型由3個模塊構(gòu)成,首先是利用知識庫技術(shù),為高校圖書館個性化推薦提供核心數(shù)據(jù)的數(shù)據(jù)支持模塊,該模塊具有多個數(shù)據(jù)庫,其用戶信息庫中包括用戶的基本信息和個人書籍偏好類型等內(nèi)容,個人書籍偏好信息中詳細(xì)記錄了用戶檢索頻率較高的關(guān)鍵詞和瀏覽的書籍類別。學(xué)習(xí)行為數(shù)據(jù)庫中存儲了用戶的學(xué)習(xí)行為過程中產(chǎn)生的軌跡信息,該數(shù)據(jù)庫也是評分模塊的主要數(shù)據(jù)來源。書籍資源庫是整個圖書館的圖書資源倉庫,具有學(xué)術(shù)資源和不同學(xué)科資源等,用戶評分?jǐn)?shù)據(jù)反映著不同書籍資源的熱門程度,能夠?yàn)閭€性化推薦提供依據(jù)。個性化服務(wù)推薦模塊為個性化推薦提供技術(shù)支持,是個性化推薦服務(wù)的核心。最后一個模塊是新進(jìn)資源推薦模塊,由于用戶獲取新進(jìn)資源常常存在一定的滯后性,使新進(jìn)資源不能充分發(fā)揮時效性作用,出現(xiàn)許多資源閑置的現(xiàn)象。因此該模塊根據(jù)用戶評分?jǐn)?shù)據(jù)進(jìn)行相似度判斷,進(jìn)行新進(jìn)資源的分類推薦。不同的相似度得分體現(xiàn)著書籍推薦質(zhì)量,相似度較高的鄰集為預(yù)測的準(zhǔn)確性提供保障。因此,需要將相關(guān)相似度和余弦相似度進(jìn)行結(jié)合,調(diào)用存有相似數(shù)據(jù)的數(shù)據(jù)集中的數(shù)據(jù),形成鄰集,根據(jù)設(shè)定比對規(guī)則實(shí)現(xiàn)個性化推薦。

      2 實(shí)驗(yàn)論證分析

      2.1 個性化推薦效果評價

      為驗(yàn)證本文方法的有效性,本文利用Matlab仿真軟件設(shè)置實(shí)驗(yàn)環(huán)境,本文使用的實(shí)驗(yàn)數(shù)據(jù)在A高校圖書館真實(shí)數(shù)據(jù)的基礎(chǔ)上,抽取部分具有代表性的作為實(shí)驗(yàn)的測試集和訓(xùn)練集,本次實(shí)驗(yàn)共抽取用戶數(shù)據(jù)、圖書數(shù)據(jù)、圖書借閱記錄共18 000條。本文以查準(zhǔn)率作為個性化推薦的效果,從縱向推薦和橫向推薦兩個角度進(jìn)行驗(yàn)證,其查準(zhǔn)率公式為:

      式中:sumv和sumh分別為成功推薦的圖書數(shù)量和全部推薦的圖書數(shù)量??v向角度以學(xué)生的不同年級作為變量因素,用戶隨著年級的增長,對于書籍的喜好會產(chǎn)生一定的變化,因此會產(chǎn)生不同的推薦結(jié)果。

      2.2 算法性能測試與對比分析

      為了驗(yàn)證本文算法在高校圖書館個性化推薦中的性能,本文將10 000條借閱數(shù)據(jù)隨機(jī)劃分為N個部分,為了便于后續(xù)的性能測試,取N值為10,以訓(xùn)練集為基礎(chǔ)構(gòu)建用戶的借閱模式,通過修正后的測試集數(shù)據(jù)進(jìn)行圖書個性化推薦,為了保證試驗(yàn)指標(biāo)的穩(wěn)定性和可靠性,將10組數(shù)據(jù)輪流做測試集,進(jìn)行10組實(shí)驗(yàn),根據(jù)本文算法為用戶推薦和他興趣最相似的K個鄰居用戶喜歡的圖書,驗(yàn)證不同K值下本文算法的性能指標(biāo),得到最終性能測試結(jié)果如表1所示。

      表1 本文算法在不同參數(shù)下的性能

      由表1可知,隨著K值的不斷增加,準(zhǔn)確率和召回率不斷增高,K值越大,推薦列表中的圖書就越熱門,本文算法的性能較為理想,由此可見,K值對推薦的準(zhǔn)確性具有重要作用。預(yù)測評分能夠展現(xiàn)本文算法進(jìn)行個性化推薦預(yù)測的效果,通過平均絕對誤差對比不同算法的預(yù)測評分的準(zhǔn)確性,具體計算公式為:

      式中:Rc,n和Pc,n是用戶c對圖書n的預(yù)測評分和實(shí)際評分,N為測試集中的所有書籍?dāng)?shù)量,平均絕對誤差越小,推薦算法的準(zhǔn)確性越大。以不同鄰居用戶K的取值為變量,驗(yàn)證平均絕對誤差值的大小,具體對比結(jié)果如圖1所示。

      圖1 不同算法平均誤差值對比

      由圖1可知,傳統(tǒng)算法的平均絕對誤差均高于本文算法,在鄰居用戶為150時,平均絕對誤差最小,證明此條件下的推薦結(jié)果更為準(zhǔn)確,與傳統(tǒng)算法對比發(fā)現(xiàn),本文算法的性能更高,經(jīng)計算得到的用戶相似度更準(zhǔn)確,本文算法具有有效性。

      3 結(jié)語

      本文通過獲取用戶信息數(shù)據(jù),利用協(xié)同過濾法進(jìn)行數(shù)據(jù)處理,定義及描述用戶與圖書相似度,建立高校

      圖書館個性化推薦模型,完成個性化推薦,取得了一定的研究成果。同時,由于時間和條件的限制,本文研究還存在著諸多不足,有待于在今后的研究中深入探討,如未對圖書館中的教師用戶數(shù)據(jù)進(jìn)行實(shí)驗(yàn),在今后的研究中還將對教師用戶的書籍喜好進(jìn)行研究,完善對教師用戶的個性化推薦。另外,本文研究沒有充分考慮借閱超期等問題,未來還將不斷提高高校圖書館的服務(wù)水平。

      猜你喜歡
      書籍個性化圖書
      魯迅與“書籍代購”
      圖書推薦
      南風(fēng)(2020年22期)2020-09-15 07:47:08
      堅持個性化的寫作
      文苑(2020年4期)2020-05-30 12:35:12
      歡迎來到圖書借閱角
      AOS在書籍編寫的應(yīng)用
      新聞的個性化寫作
      新聞傳播(2018年12期)2018-09-19 06:27:10
      書籍
      班里有個圖書角
      上汽大通:C2B個性化定制未來
      書籍是如何改變我們的
      建阳市| 乃东县| 清徐县| 清水河县| 莆田市| 临颍县| 襄垣县| 天气| 定远县| 新绛县| 上饶市| 临汾市| 达孜县| 同德县| 轮台县| 磴口县| 宜章县| 武邑县| 朝阳县| 甘孜县| 辉南县| 嘉鱼县| 永年县| 嵊泗县| 额济纳旗| 屏山县| 新建县| 周至县| 绵阳市| 余庆县| 潍坊市| 巩义市| 南投县| 随州市| 佳木斯市| 娱乐| 商洛市| 秀山| 祁门县| 长海县| 广宁县|