[摘 要] 傳統(tǒng)的協(xié)同過濾算法在計(jì)算用戶相似度時(shí),只考慮其評分,而忽略了不同用戶評分的差異性。為此,本系統(tǒng)對傳統(tǒng)的協(xié)同過濾算法做了改進(jìn),對貴賓用戶的評分進(jìn)行了加權(quán)處理,這樣可以提高某些商品的預(yù)測評分,從而提高推薦的質(zhì)量。
[關(guān) 鍵 詞] 個(gè)性化推薦;協(xié)同過濾算法;相似性
[中圖分類號(hào)] G203 [文獻(xiàn)標(biāo)志碼] A [文章編號(hào)] 2096-0603(2017)02-0156-01
一、協(xié)同過濾算法介紹
為了解決用戶的評分力度問題,用平均規(guī)范化可以解決。公式如下:
Pu■i■=■+■
用上述方法產(chǎn)生的對目標(biāo)用戶沒有評分的項(xiàng)目進(jìn)行預(yù)測評分,接著再按照評分的高低順序排列,把符合條件的前面幾項(xiàng)或大于某個(gè)閾值的前面幾項(xiàng)推薦給目標(biāo)用戶。
二、算法存在的問題
1.隨著用戶和商品數(shù)量的不斷增加,參與評分的數(shù)據(jù)規(guī)模也越來越大。
2.越是熱門的商品越容易得到推薦,而使冷門的商品無法被推薦。
3.算法中沒有考慮到用戶活躍度和推薦結(jié)果間的關(guān)系。
三、推薦公式改進(jìn)設(shè)計(jì)
(一)計(jì)算相似度的改進(jìn)
為提高推薦算法的性能,必須考慮長尾分布的影響。為此,可以在計(jì)算相似度時(shí)消除雙方都購買了熱門商品的影響。對于給定用戶u和用戶v,計(jì)算相似度的公式可以改進(jìn)如下:Wu?淄=■
其中,參數(shù)N(u)表示目標(biāo)用戶u曾經(jīng)購買商品后對商品的正反饋的集合,參數(shù)N(v)表示購買了目標(biāo)用戶相同商品的用戶v對商品的正反饋的集合。公式中增加了■用來懲罰目標(biāo)用戶u和用戶v在購買共同商品的興趣列表中熱門商品對其相似度的影響。
(二)計(jì)算用戶興趣度的改進(jìn)
對VIP用戶的評分進(jìn)行加權(quán)處理。在推薦系數(shù)相同(普通用戶為1)的情況下,VIP用戶可以獲得一定的推薦權(quán)值,從而對結(jié)果產(chǎn)生一定的影響。具體采用多少和VIP用戶的等級有關(guān)。
而用戶興趣度的計(jì)算公式可以改為:P(u,i)=■
其中,參數(shù)S(u,K)指和目標(biāo)用戶u興趣愛好最接近的前K個(gè)用戶,參數(shù)N(i)是指對商品i曾經(jīng)有過正面反饋行為的所有用戶集合,wuv是前面步驟中計(jì)算出的目標(biāo)用戶u和其他用戶v的相似度,rvi表示鄰居用戶v對物品i的興趣度。如果該鄰居用戶是普通用戶,它取值為1,對于VIP用戶來說,可以增加適當(dāng)權(quán)值參與計(jì)算。
四、實(shí)驗(yàn)設(shè)計(jì)
1.把數(shù)據(jù)集隨機(jī)均勻分為8份,選擇任意一份作為測試集,剩下的7份作為訓(xùn)練集。
2.在訓(xùn)練集上建立用戶興趣模型。在測試集上通過鄰居用戶的評分?jǐn)?shù)據(jù)來計(jì)算目標(biāo)用戶對未知商品的預(yù)測評分,并且計(jì)算出相應(yīng)的評測指標(biāo)。
3.為了使測試結(jié)果更加真實(shí)全面,數(shù)據(jù)對比性強(qiáng),實(shí)驗(yàn)中對推薦個(gè)數(shù)的取值設(shè)為(5,10,20,40,80,160)。
參考文獻(xiàn):
[1]李海霞.基于蟻群聚類的電子商務(wù)商務(wù)個(gè)性化推薦算法研究[D].山東師范大學(xué),2014.
[2]劉恒.基于協(xié)同過濾的推薦技術(shù)研究[D].蘭州理工大學(xué),2014.