• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于模糊聚類和模糊模式識別的數(shù)字圖書館個性化推薦研究

    2016-11-19 16:22:21王敏嵇紹春
    現(xiàn)代情報 2016年4期
    關(guān)鍵詞:模糊聚類推薦系統(tǒng)數(shù)字圖書館

    王敏 嵇紹春

    〔摘 要〕為提高圖書館個性化推薦的效果,采用模糊聚類和模糊識別技術(shù)建立數(shù)字圖書館的個性化推薦系統(tǒng)。通過分析用戶的信息素質(zhì)、興趣愛好、網(wǎng)絡(luò)和電子資源檢索情況,對讀者進(jìn)行數(shù)學(xué)模糊聚類分析,確定最佳閾值λ,得到最佳聚類。根據(jù)個體用戶的基本情況進(jìn)行模糊識別,由識別結(jié)果的歸屬給出針對當(dāng)前用戶的個性化推薦。實驗結(jié)果表明,在模糊聚類與模糊識別基礎(chǔ)上的個性化推薦方案是可行的和有效的,為創(chuàng)新數(shù)字圖書館個性化服務(wù)提供了一種新的方法。

    〔關(guān)鍵詞〕數(shù)字圖書館;個性化;推薦系統(tǒng);模糊聚類;模糊識別

    DOI:10.3969/j.issn.1008-0821.2016.04.010

    〔中圖分類號〕G251 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2016)04-0052-05

    〔Abstract〕In order to improve the effect of library personalized recommendation,personalized recommendation system of digital library is designed based on fuzzy clustering and fuzzy pattern recognition.The paper analyzed the users information literacy,discipline background,interests,electronic resources retrieval and history information.Then the readers were classified by using fuzzy clustering.The best threshold λ is determined and the optimal clustering is obtained.According to the basic situation of individual user,the paper used fuzzy pattern recognition to give the personalized recommendation for the current user.From the experiment result,it showed that the proposed approach is feasible and effective,and it provided a new way for the innovation of digital library personalized service.

    〔Key words〕digital library;personalized;recommendation system;fuzzy clustering;fuzzy recognition

    數(shù)字圖書館的個性化推薦是指通過有效利用不同層次、不同類別的數(shù)據(jù)資源,向不同興趣特點、專業(yè)背景的讀者推薦其期待看的信息資源,以滿足不同用戶的個性化需求。數(shù)字圖書館的個性化推薦系統(tǒng)已成為當(dāng)前提高數(shù)字圖書館的服務(wù)質(zhì)量、效率和信息資源利用水平的一種重要工具[1]。目前,很多高校也以不同的形式向其讀者提供個性化的服務(wù)信息,如康奈爾大學(xué)圖書館的MyLibrary[2]、Stanford大學(xué)數(shù)字圖書館Fab系統(tǒng)[3]、NEC研究院的CiteSeer系統(tǒng)[4]等。圖書館構(gòu)建一個有效的個性化信息推薦系統(tǒng),快速高效地從海量的數(shù)據(jù)和信息中獲取有關(guān)知識,提高資源檢索和推薦的智能水平,滿足各類用戶不同的個性化需求,已成為數(shù)字圖書館領(lǐng)域研究的一項重要內(nèi)容[5-11]。個性化推薦系統(tǒng)的核心是利用目標(biāo)用戶興趣、專業(yè)背景、信息素質(zhì)的相似程度產(chǎn)生對用戶的個性化推薦。數(shù)學(xué)上的模糊聚類方法具有模糊特性,可以更好地體現(xiàn)用戶興趣的多樣性特點,適合數(shù)字圖書館用戶的分類需求。

    本文提出一種基于模糊聚類和模糊識別相結(jié)合的推薦技術(shù),通過對用戶全體進(jìn)行聚類分析并統(tǒng)計每類群體的文獻(xiàn)資源使用及瀏覽記錄,得到最佳聚類中各類別用戶的文獻(xiàn)偏好,建立最佳分類的用戶推薦模型庫。在此基礎(chǔ)上,對于目標(biāo)用戶,根據(jù)其注冊信息、圖書借閱記錄、用戶定制信息、Web 服務(wù)器日志等情況,通過模糊識別的方式歸屬在最佳聚類中的一類,為其推薦相應(yīng)類別的圖書。我們將這種個性化推薦模式應(yīng)用于淮陰工學(xué)院圖書館,實踐證明基于模糊聚類與模糊識別模式的個性化推薦系統(tǒng)是一個比較成功的推薦系統(tǒng)。

    模糊聚類分析是模糊集與傳統(tǒng)的聚類分析相結(jié)合的一種分析方法,常用的模糊聚類方法有:基于模糊等價矩陣的聚類方法、基于模糊相似矩陣的直接聚類法、基于目標(biāo)函數(shù)的模糊聚類分析法[12-14]。近年來,模糊聚類分析在圖書館中也得到了應(yīng)用:盤美英利用模糊聚類分析法對圖書館績效進(jìn)行評價[15],秦小鐵等人利用模糊聚類分析提供了圖書館的選書決策方法[16]。我們利用等價矩陣的聚類方法對圖書館的用戶進(jìn)行模糊聚類分析,根據(jù)最佳聚類中的每類用戶的瀏覽、借閱歷史及電子資源的使用情況給出個性化推薦。針對目標(biāo)用戶的個體情況進(jìn)行模糊識別,由識別結(jié)果給出推薦方案。具體思路如圖1。

    1 模糊聚類分析

    數(shù)字圖書館的個性化系統(tǒng)推薦的前提是要了解用戶需求,根據(jù)用戶的個體特點進(jìn)行推薦服務(wù)。模糊聚類需要了解用戶特點、興趣愛好、學(xué)科背景等,根據(jù)相關(guān)數(shù)據(jù)對其進(jìn)行聚類。廣泛開展對用戶特點的調(diào)查,可以通過問卷調(diào)查、座談、借閱情況等方式了解圖書館用戶,并得到原始數(shù)據(jù)。

    1.1 數(shù)據(jù)標(biāo)準(zhǔn)化

    設(shè)X={x1,x2,…,xn}是收集到用戶信息的全體,每個用戶調(diào)查其m個特征,則每個對象都可由一組數(shù)據(jù)xi1,xi2,…,xm來表征第i個用戶的m個特征,從而得到一個n×m階的原始資料數(shù)據(jù)矩陣,即

    (xij)n×m=x11x12…x1m

    x21x22…x2m

    xn1xn2…xnm

    對得到的原始矩陣根據(jù)模糊矩陣的需要進(jìn)行變換,可以進(jìn)行平移標(biāo)準(zhǔn)差變換和平移極差變換:

    x′ik=xik-ksk(i=1,2,…,n;k=1,2,…,m)

    其中,k=1n∑ni=1xik?"sk=1n∑ni=1(xik-k)2

    x″ik=x′ik-min1≤i≤n{x′ik}max1≤i≤n{x′ik}-min1≤i≤n{x′ik}?"(k=1,2,…,m)

    1.2 建立模糊相似矩陣并求其模糊等價矩陣

    根據(jù)變換后的模糊矩陣計算對象xi與xj間的相似程度rij,即相似系數(shù),我們利用最大最小法得到相似系數(shù),即:

    rij=∑mk=1(xik∧xjk)∑mk=1(xik∨xjk)

    從而,建立起了圖書館用戶的模糊相似矩陣R。

    檢驗得到的相似矩陣R是否具有傳遞性,如果有傳遞性,即R為模糊等價矩陣,直接聚類即可,如果沒有傳遞性,為了進(jìn)行聚類,我們要求其等價矩陣,即通過逐次平方求其傳遞閉包t(R),由其性質(zhì)知t(R)為模糊等價矩陣。對t(R)再取適當(dāng)?shù)摩恕蔥0,1],由λ截矩陣Rλ便可得到動態(tài)聚類。

    1.3 確定最佳閾值λ

    設(shè)P為分類方案數(shù),顯然P≤n。設(shè)r為對應(yīng)于λ值的類數(shù),ni為第i類元素的個數(shù),記ik=1ni∑nij=1xjk,k=1,2,…,m,為第i類元素的第k個特征的平均值,記k=1n∑nj=1xjk,k=1,2,…,m,為全體樣本第k個特征的平均值。

    引入F統(tǒng)計量:

    F=∑ri=1ni∑mk=1(ik-k)2/(r-1)∑ri=1∑ni〖〗j(luò)=1∑mk=1(xik-jk)2/(n-r)F(r-1,n-r)

    它服從自由度為r-1、n-r的F分布,其分子表征類與類間的距離,分母表征類內(nèi)元素距離,因此F值越大,說明類與類間的距離越大,則分類就越好[17]。

    對給定的信度α,查F臨界值表得到Fα,然后將各F值與Fα作比較。如果F>Fα,根據(jù)數(shù)理統(tǒng)計方差理論,知類間差異顯著,說明分類比較合理;在滿足F>Fα的所有情況中,取F-Fα最大者的F所對應(yīng)的λ作為最佳λ值,其所對應(yīng)的分類即為最佳分類。

    根據(jù)對讀者的分析,本文給出可能影響讀者使用圖書館的相關(guān)因素,根據(jù)相關(guān)因素進(jìn)行讀者的模糊聚類分析,聚類指標(biāo)如表1。

    表1中的各項指標(biāo)值為7度量值,其中1最差,7最好。根據(jù)對讀者的最佳模糊聚類中每一讀者的歷史借閱、瀏覽和查找歷史、電子資源的使用和下載情況及在問卷中讀者感興趣圖書和資源的反饋情況,統(tǒng)計并分析給出每個聚類的讀者最佳推薦圖書及電子資源類型。

    2 模糊識別

    在模糊識別的過程中,我們利用擇近原則,設(shè){A1,A2,…,An}是論域U上的n個模糊集A1,A2,…,An構(gòu)成一個標(biāo)準(zhǔn)模型庫,B為待識別模型。若存在i∈{1,2,…,n},使得σ0(Ai,B)=max1≤j≤nσ0(Aj,B),則認(rèn)為B與Ai最貼近,應(yīng)把B歸為模型Ai。其中σ0(A,B)=12[AB+(1-AB)],這里AB=∨x∈U(A(x)∧B(x))和AB=∧x∈U(A(x)∨B(x))分別為A與B的內(nèi)積和外積。

    對每個具體讀者根據(jù)其注冊時提供的基本信息及其借閱、瀏覽和下載情況自動進(jìn)行模糊識別,根據(jù)識別結(jié)果的類別進(jìn)行數(shù)字圖書館個性化的讀者推薦服務(wù)。對于個體用戶進(jìn)行模糊識別時,由于收集到的信息可能會缺項,所以對缺項的部分可以暫時不去考慮,根據(jù)收集到的相關(guān)信息進(jìn)行識別,給出推薦方案,根據(jù)推薦效果情況的收集可以重新調(diào)整識別信息,直到推薦效果滿意為止。

    3 實驗結(jié)果分析

    以淮陰工學(xué)院圖書館為例,我們通過對讀者的聚類分析和模糊識別,對數(shù)字圖書館個性化推薦方案進(jìn)行了模擬測試。我們采用問卷調(diào)查形式收集原始的聚類數(shù)據(jù),發(fā)放問卷1 000份,發(fā)放范圍覆蓋淮陰工學(xué)院全部13個院系的4個年級、在校碩士研究生、教師及繼續(xù)教育學(xué)院的成人大學(xué)生,其范圍覆蓋了所有可能用戶,收到的數(shù)據(jù)有普及性和代表性,共收回問卷982份,其中有效問卷980份。問卷調(diào)查中除了上述50個聚類指標(biāo)的調(diào)查,另外還添加了“您的年級和專業(yè)”、“感興趣和喜歡閱讀的圖書類別”、“喜歡或常用的電子資源及數(shù)據(jù)庫”3個問題。調(diào)查結(jié)束后,我們通過圖書館的后臺,調(diào)出每個用戶的借閱歷史,瀏覽和下載電子資源情況的記錄,為了便于得到最佳聚類后,詳細(xì)的了解該類群用戶的喜好及特點,從而給出各類別的用戶的推薦目錄。

    根據(jù)用戶給出的資料信息得到聚類的原始數(shù)據(jù)(xij)980×50。利用數(shù)學(xué)工具M(jìn)atlab對收集到的數(shù)據(jù)進(jìn)行平移標(biāo)準(zhǔn)差變換和平移極差變換得到模糊矩陣(x″ij)980×50

    x′ik=xik-ksk(i=1,2,…,980;k=1,2,…,50)

    其中,k=1980∑980i=1xik,?"sk=1980∑980i=1(xik-k)2

    x″ik=x′ik-min1≤i≤980{x′ik}max1≤i≤980{x′ik}-min1≤i≤980{x′ik}?"(k=1,2,…,50)

    利用最大最小法建立起了980×980模糊相似矩陣R。

    利用Matlab計算模糊相似矩陣R的傳遞閉包t(R),得到模糊等價矩陣t(R)。對t(R)再取適當(dāng)?shù)摩恕蔥0,1],由λ截矩陣Rλ便可得到動態(tài)聚類。

    通過對F統(tǒng)計量的運算,對給定的信度α=0.05,查F臨界值表得到Fα,得到表2:

    通過對t(R)的聚類分析,可以看出淮陰工學(xué)院圖書館讀者用戶的調(diào)查中最佳聚類結(jié)果為50類。從最佳聚類結(jié)果,得到教師和碩士研究生其分類基本上是按照學(xué)科聚類,其借閱和瀏覽情況也大多數(shù)與自己的學(xué)科背景相關(guān),所以對教師及研究生的推薦目錄基本上可以結(jié)合問卷調(diào)查中用戶感興趣的圖書及資源并請相關(guān)專業(yè)的學(xué)者綜合制定。本科生群體的用戶,從分類結(jié)果看到,聚類因素中學(xué)科、興趣、社會實踐、人生觀等對其分類均有影響。例如在理科學(xué)生中有近1/4的學(xué)生用戶感興趣的資源非專業(yè)信息,這部分讀者大致又分為兩類:一類趨向于文學(xué)、歷史類圖書資源;一類取向于管理和計算機(jī)類資源。工科類學(xué)生讀者的情況更為復(fù)雜,根據(jù)統(tǒng)計結(jié)果工科類學(xué)生的分類高達(dá)32類,幾乎每類中都有來自工科不同專業(yè)的學(xué)生用戶群體。我們統(tǒng)計在問卷調(diào)查中每個聚類感興趣的圖書情況及讀者的歷史借閱、瀏覽和查找歷史、電子資源的使用和下載情況給出最佳推薦書目和資源。在實踐過程中,我們利用Matlab對大量實驗數(shù)據(jù)進(jìn)行了處理和分析,這是一個較為困難和具體挑戰(zhàn)性的工作,它對獲取準(zhǔn)確聚類結(jié)果又是必需的。

    選取淮陰工學(xué)院的在校本科生、碩士研究生、教師100名,利用擇近原則對其模糊識別并推薦相應(yīng)的書目和電子資源,跟蹤調(diào)查其對推薦結(jié)果的滿意情況。實驗證明通過模糊識別的個性化推薦系統(tǒng)得到用戶的認(rèn)可,其中56名用戶對最佳聚類推薦的結(jié)果滿意并使用了我們推薦的資源和圖書,32名用戶經(jīng)過再次收集相關(guān)的信息資料,重新調(diào)整識別信息后對推薦結(jié)果給出滿意答復(fù),12名用戶,經(jīng)過三次識別分析后,對其推薦結(jié)果表示滿意。實驗結(jié)果表明本文提出的基于模糊聚類和模糊識別的數(shù)字圖書館個性化推薦系統(tǒng)方案是可行和有效的。

    4 結(jié) 語

    利用模糊聚類分析方法對圖書館用戶的資源使用情況進(jìn)行聚類,其先決條件是收集并得到大量的用戶資源數(shù)據(jù)信息,并進(jìn)行最佳聚類的分析整理。實踐證明,基于模糊聚類和模糊識別數(shù)字圖書館的個性化推薦系統(tǒng)的推薦結(jié)果是得到用戶認(rèn)可的。利用推薦系統(tǒng)提供個性化信息服務(wù),是數(shù)字圖書館發(fā)展的必然趨勢,也是目前研究的一個熱點問題。本文提出的個性化推薦系統(tǒng)方案,在提高數(shù)字圖書館個性化服務(wù)水平方面做了有益的探索與嘗試。

    參考文獻(xiàn)

    [1]徐偉芬.基于模糊聚類的數(shù)字圖書館個性化推薦系統(tǒng)方案設(shè)計[J].價值工程,2013,32(6):174-176.

    [2]Balabanovic M,Shoham Y.Fab:Content-based,Collaborative Recommendation[J].Communications of the ACM,2007,40(3):6672.

    [3]Rucker J,Polance M J.Siteseer:Personalized Navigation for the Web[J].Communications of the ACM,1997,40(3):7375.

    [4]Giles L,Bollacker K,Lawrence S.CiteSeer:An Automatic Citation Indexing System[J].In:Proceedings of the 3rd ACM Conference on Digital Libraries.1998:89-98.

    [5]劉劍濤.個性化推薦系統(tǒng)中用戶多態(tài)聚類研究[J].現(xiàn)代圖書情報技術(shù),2012,28(2):18-22.

    [6]黃曉斌.基于協(xié)同過濾的數(shù)字圖書館推薦系統(tǒng)研究[J].大學(xué)圖書館學(xué)報,2006,(1):53-57.

    [7]張紅燕.高校圖書館新書推薦系統(tǒng)的研究與實現(xiàn)[J].大學(xué)圖書館學(xué)報,2013,(5):106-113.

    [8]唐秋鴻,曹紅兵,唐小新,等.高校圖書館個性化專題推薦研究[J].圖書館學(xué)研究,2012,(13):53-58,24.

    [9]何金晶.個性化信息推薦服務(wù)中用戶潛在興趣挖掘研究[J].現(xiàn)代情報,2013,33(4):8-11,16.

    [10]楊亮,雷智雁.大數(shù)據(jù)環(huán)境下圖書館個性化服務(wù)研究[J].現(xiàn)代情報,2014,34(4):74-77.

    [11]李微娜,馬小琪,馮艷光.基于MADM方法的個性化推薦研究[J].現(xiàn)代情報,2011,31(4):20-22,25.

    [12]秦如新,田英杰,陳靜,等.雙聚類的關(guān)聯(lián)規(guī)則挖掘方法[J].北京工業(yè)大學(xué)學(xué)報,2009,(4):561-565.

    [13]杜靜,敖富江,楊學(xué)軍,等.基于模糊聚類分析的構(gòu)件并行技術(shù)研究[J].計算機(jī)學(xué)報,2007,30(11):1939-1946.

    [14]CHATZIS S,VARVARIGOU T.Factor analysis latent subspace modeling and robust fuzzy clustering using t-distributions[J].IEEE Transactions on Fuzzy Systems,2009,17(3):505-517.

    [15]盤美英.模糊聚類分析方法在圖書館績效評估中的應(yīng)用[J].現(xiàn)代情報,2008,28(10):210-213,216.

    [16]秦小鐵,鄭輝昌.基于模糊聚類分析的圖書館選書決策方法[J].重慶科技學(xué)院學(xué)報:社會科學(xué)版,2011,(11):165-166.

    [17]梁保松,曹殿立.模糊數(shù)學(xué)及其應(yīng)用[M].北京,科學(xué)出版社,2007.

    (本文責(zé)任編輯:孫國雷)

    猜你喜歡
    模糊聚類推薦系統(tǒng)數(shù)字圖書館
    基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
    基于個性化的協(xié)同過濾圖書推薦算法研究
    個性化推薦系統(tǒng)關(guān)鍵算法探討
    高校數(shù)字圖書館資源整合的初探
    商情(2016年39期)2016-11-21 09:27:10
    淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
    基于云計算的數(shù)字圖書館建設(shè)與服務(wù)模式研究
    從谷歌案析數(shù)字圖書館對作品的使用行為
    基于MATLAB回采巷道圍巖分類可視化系統(tǒng)開發(fā)及應(yīng)用
    模糊聚類在區(qū)域環(huán)境質(zhì)量評價中的運用
    芻議數(shù)字圖書館計算機(jī)網(wǎng)絡(luò)的安全技術(shù)及其防護(hù)策略
    南投市| 新丰县| 林芝县| 阿拉善右旗| 怀柔区| 合川市| 黎城县| 阿城市| 顺昌县| 奎屯市| 玉溪市| 元谋县| 赞皇县| 广汉市| 秦皇岛市| 嘉禾县| 黄平县| 普安县| 洪洞县| 石家庄市| 肇东市| 麻江县| 铜山县| 南汇区| 翼城县| 五常市| 云和县| 察哈| 随州市| 汤原县| 台中县| 烟台市| 基隆市| 湘潭县| 夏津县| 古交市| 云和县| 绩溪县| 北京市| 德令哈市| 钟祥市|