[摘要]隨著電子商務(wù)的飛速發(fā)展,如何準(zhǔn)確高效地提供給用戶(hù)需要的信息變得越來(lái)越重要。在分析傳統(tǒng)推薦機(jī)制的基礎(chǔ)上,該文提出了一種混合推薦機(jī)制。該機(jī)制在向用戶(hù)進(jìn)行個(gè)性化產(chǎn)品推薦時(shí),綜合考慮了用戶(hù)自身和其鄰居用戶(hù)對(duì)推薦的影響。在MovieLens上的實(shí)驗(yàn)證明,該文提出的這種算法在預(yù)測(cè)精度上較傳統(tǒng)的推薦算法有很大的提高。
[關(guān)鍵詞] 矩陣分塊 信息項(xiàng) 用戶(hù)群
一、引言
面對(duì)電子商務(wù)新的商務(wù)模式,如何有效的縮短用戶(hù)花費(fèi)在瀏覽網(wǎng)頁(yè)以發(fā)現(xiàn)他們需要的信息上的時(shí)間成為電子商務(wù)成敗的一個(gè)關(guān)鍵問(wèn)題。信息推薦機(jī)制是通過(guò)學(xué)習(xí)用戶(hù)的興趣和訪問(wèn)模式,逐漸了解用戶(hù)的興趣愛(ài)好,進(jìn)而向用戶(hù)推薦系統(tǒng)認(rèn)為用戶(hù)可能感興趣的信息。推薦算法主要分為基于內(nèi)容的推薦和協(xié)同推薦。
基于內(nèi)容的推薦是根據(jù)用戶(hù)以前的興趣來(lái)推測(cè)用戶(hù)以后的興趣。協(xié)作推薦實(shí)現(xiàn)的思想是采用某種技術(shù)找到目標(biāo)用戶(hù)的最近鄰居,然后根據(jù)最近鄰居對(duì)目標(biāo)項(xiàng)目的評(píng)分,產(chǎn)生推薦,用戶(hù)評(píng)分?jǐn)?shù)據(jù)可以用一個(gè)m*n階矩陣A(m*n)來(lái)表示。
二、基于混合模式的推薦機(jī)制
該文提出的推薦算法綜合考慮了用戶(hù)自身興趣對(duì)推薦的影響和其鄰居用戶(hù)對(duì)推薦的影響,前者是從基于內(nèi)容的推薦中借鑒過(guò)來(lái)的思想,計(jì)算時(shí),采用基于信息項(xiàng)的方法。后者是基于協(xié)作的推薦思想,根據(jù)鄰居用戶(hù)對(duì)目標(biāo)項(xiàng)目的評(píng)分產(chǎn)生推薦。
1.基于內(nèi)容的推薦
在用戶(hù)-項(xiàng)目矩陣中,用戶(hù)已評(píng)分的項(xiàng)目可以看作是用戶(hù)自身的興趣,這相當(dāng)于基于內(nèi)容推薦中用戶(hù)的興趣模型。在推薦時(shí),系統(tǒng)首先計(jì)算項(xiàng)目之間的相似性,然后根據(jù)項(xiàng)目之間的相似性,來(lái)預(yù)測(cè)用戶(hù)對(duì)未評(píng)分項(xiàng)目的評(píng)分。
2.基于合作的推薦
系統(tǒng)首先采用某種方法查找目標(biāo)用戶(hù)的最近鄰居,然后根據(jù)鄰居用戶(hù)對(duì)目標(biāo)項(xiàng)目的評(píng)價(jià)產(chǎn)生對(duì)目標(biāo)用戶(hù)的推薦。
(1)計(jì)算最近鄰
假設(shè)目標(biāo)用戶(hù)為I,計(jì)算完I和其他用戶(hù)的相似度后,計(jì)算公式如式1所示。按大小排序,選擇前N個(gè)作為I的最近鄰,這里涉及到N的取值問(wèn)題。
式1
Ii,j:用戶(hù)i和j共同評(píng)分過(guò)的項(xiàng)目集,Ri,c:用戶(hù)i對(duì)項(xiàng)目c的評(píng)分,
:用戶(hù)i對(duì)資源的平均評(píng)分。
(2)產(chǎn)生推薦
采用式2計(jì)算U對(duì)I的評(píng)分:
式2
:用戶(hù)u對(duì)資源的平均評(píng)分,:用戶(hù)m對(duì)項(xiàng)目i的評(píng)分,
:用戶(hù)m對(duì)資源的平均評(píng)分,:用戶(hù)u和m的相似度。
3.混合信息推薦機(jī)制
假設(shè)要度量用戶(hù)I對(duì)項(xiàng)目j的興趣程度,采用基于信息項(xiàng)的方法計(jì)算得到的評(píng)價(jià)值,記為Vi1,采用基于用戶(hù)群的方法從行的角度計(jì)算得到的評(píng)價(jià)值記作Vi2,用戶(hù)I的推薦計(jì)算公式如式3所示:
α、β為權(quán)重因子 式3
三、實(shí)驗(yàn)及結(jié)果分析
實(shí)驗(yàn)采用的數(shù)據(jù)集是MovieLens。利用平均絕對(duì)誤差(MAE)來(lái)衡量算法的預(yù)測(cè)精度,MAE越小說(shuō)明系統(tǒng)的預(yù)測(cè)精度越高,實(shí)驗(yàn)結(jié)果如圖所示。
參考文獻(xiàn):
[1]Voorhees E .Harrman D .,Overview of the SeventhText Retrieval Conference[A],In Proceedings seventh Text Retrieval Conference[C ],1999,1~24,NIS'P Pres
[2]曾青刑春曉周立柱:個(gè)性化服務(wù)技術(shù)綜述[J].軟件學(xué)報(bào),2002,13(10):1952~1961
[3]Breese J, Heckerman D, Kadie C. Empirical analysis of predictive algorithms for collaborative filtering. In: Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence, San Francisco, CA, July 1998:43~52