葉錫君,龔 玥
(南京農(nóng)業(yè)大學(xué)信息科技學(xué)院,南京 210095)
基于項目類別的協(xié)同過濾推薦算法多樣性研究
葉錫君,龔 玥
(南京農(nóng)業(yè)大學(xué)信息科技學(xué)院,南京 210095)
推薦系統(tǒng)的多樣性正日益成為評價推薦質(zhì)量的重要指標(biāo)。為提高傳統(tǒng)協(xié)同過濾推薦算法的個體多樣性,在基于項目的協(xié)同過濾推薦算法的基礎(chǔ)上,加入項目的類別屬性信息,定義項目類別貢獻(xiàn)函數(shù)以改進預(yù)測評分公式,提高與目標(biāo)項目類別不完全相同的項目得分,實現(xiàn)最優(yōu)項目推薦。實驗結(jié)果表明,在保證一定推薦精確度的前提下,改進算法增強了推薦系統(tǒng)的個體多樣性,具有更高的推薦質(zhì)量。
協(xié)同過濾;多樣性;項目類別;貢獻(xiàn)函數(shù);預(yù)測評分;列表內(nèi)相似度指標(biāo)
DO I:10.3969/j.issn.1000-3428.2015.10.009
信息化社會的到來給人們帶來了一大難題:如何從豐富的網(wǎng)絡(luò)資源中快速準(zhǔn)確地找到自己需要的信息。傳統(tǒng)搜索引擎技術(shù)的智能化程度較低,且以被動方式為用戶提供服務(wù),已不能滿足用戶需求,為了更好地解決這一難題,推薦系統(tǒng)應(yīng)運而生。推薦系統(tǒng)的核心是推薦算法。目前,推薦算法并沒有一個統(tǒng)一的分類,大多數(shù)學(xué)者將推薦算法分為3類:基于內(nèi)容的推薦算法,協(xié)同過濾推薦算法以及混合推薦算法。協(xié)同過濾推薦算法是目前應(yīng)用最廣泛且最成功的推薦算法,特別是在電子商務(wù)領(lǐng)域。
目前,對協(xié)同過濾推薦算法的研究主要集中于解決數(shù)據(jù)稀疏性、冷啟動、概念漂移和可擴展等問題,經(jīng)過長期研究,學(xué)者們提出了多種解決方案,并從理論和實驗上得到了證明。然而新的問題也不斷涌出,例如推薦多樣性程度低、推薦系統(tǒng)脆弱以及推薦系統(tǒng)評估效果不理想等。推薦系統(tǒng)的多樣性正日益成為評價推薦系統(tǒng)推薦質(zhì)量的重要度量指標(biāo)。文獻(xiàn)[1]指出在MovieLens電影數(shù)據(jù)集上實施標(biāo)準(zhǔn)協(xié)同過濾算法時,只有15%的電影會獲得推薦機會,其中最熱門的電影會被推薦給高達(dá) 70%的用戶。2014年3月,阿里巴巴舉行了大數(shù)據(jù)競賽,比賽內(nèi)容
為基于天貓海量真實用戶訪問數(shù)據(jù)的推薦算法。參加比賽過程中,參賽者發(fā)現(xiàn)熱門商品幾乎出現(xiàn)在了80%用戶的推薦列表中。除熱門商品影響外,推薦系統(tǒng)還存在另外一種多樣性程度低的推薦問題,例如某用戶在某購物網(wǎng)站搜索了某種產(chǎn)品,接下來他將會在各種推薦中看到此類商品的推薦。本文將針對推薦多樣性程度低的問題,在基于項目的協(xié)同過濾算法基礎(chǔ)上,加入對項目類別屬性,對推薦算法進行改進,提高推薦多樣性。
2.1 算法描述
基于項目的協(xié)同過濾推薦算法的思想是根據(jù)用戶對項目的評分,計算出項目間的相似度,然后為每個用戶未評分的項目構(gòu)造最近鄰,通過用戶對最近鄰的評分預(yù)測出對未評分項目的評分[2],最后將得分最高的前N項項目推薦給用戶。N值可根據(jù)需要自由設(shè)定,協(xié)同過濾推薦流程[3]如圖 1所示。
圖1 協(xié)同過濾推薦流程
根據(jù)推薦流程,推薦主要分為3個步驟:
步驟1 數(shù)據(jù)描述?;陧椖康膮f(xié)同過濾推薦算法的數(shù)據(jù)通常描述為一個用戶-項目評分矩陣R:其中,rij表示用戶i對項目j的評分,評價值及單位與具體場景有關(guān),可根據(jù)實際情況設(shè)定。
步驟2 獲得最近鄰?;陧椖康膮f(xié)同過濾算法的關(guān)鍵步驟在于計算項目間的相似度,找出最相似項目集[4]。傳統(tǒng)相似度計算方法有以下 3種:余弦相似度,修正的余弦相似度以及相關(guān)相似度(也稱為Pearson相關(guān)系數(shù))[5]。
(1)余弦相似度:在用戶-項目評分矩陣R中,將項目評分看成是m維用戶空間上的向量,然后用向量間的夾角度量兩項目的相似度,角度越小也即余弦值越大,說明相似度越高。項目i和項目j的余弦相似度計算如下:
其中,rui表示用戶u對項目i的評分。未得到評分的項目評分值設(shè)置為0。
(2)修正的余弦相似度:在余弦相似度的基礎(chǔ)上考慮各項目被評價的標(biāo)準(zhǔn)問題,通過減去各項目被評分的平均值彌補余弦相似度的缺陷[6],具體計算如下:
其中,Uij為項目i與項目j被共同評分的用戶集合;分別為項目i、項目j被評分的用戶集合表
(3)相關(guān)相似度:項目i和項目j的相關(guān)相似度計算如下:
其中,Uij為項目i與項目j被共同評分的用戶集合。
當(dāng)數(shù)據(jù)稀疏時,不同項目被同一個用戶共同評過分的情況將很少,這時修正的余弦相似度和相關(guān)相似度將難以發(fā)揮作用,相關(guān)相似度計算公式甚至可能出現(xiàn)分母為0的情況,導(dǎo)致計算無意義。所以,在計算相似度時,需要根據(jù)實際數(shù)據(jù)情況選取合適的公式。
步驟3 實現(xiàn)推薦。常用方法是運用平均加權(quán)策略計算目標(biāo)用戶對不同項目的預(yù)測評分。然后選取評分值最高的前N項(TOP-N推薦策略)推薦給用戶。用戶u對項目i的預(yù)測評分的計算如下:
其中,I表示項目i的最近鄰項目集合。
2.2 現(xiàn)有協(xié)同過濾推薦算法研究
通過對已有文獻(xiàn)的研究發(fā)現(xiàn),2013年前大多數(shù)學(xué)者對推薦算法的研究主要集中在數(shù)據(jù)稀疏性、冷啟動、概念漂移等問題上,算法研究已經(jīng)達(dá)到比較成熟的階段。然而,周濤[7]在 2012年提出了個性化推薦系統(tǒng)面臨的十大挑戰(zhàn),除了前面提到的問題,
推薦系統(tǒng)還面臨多樣性程度低、推薦系統(tǒng)脆弱性、系統(tǒng)效果評估等問題[8]。目前的推薦系統(tǒng)是基于用戶的歷史行為,通過計算被打分項目的相似度進行推薦,從而導(dǎo)致熱門項目對推薦產(chǎn)生的影響越來越大,這種推薦雖能達(dá)到較好的準(zhǔn)確率,但從長遠(yuǎn)看,熱門項目會占滿所有用戶的推薦列表,使得推薦系統(tǒng)變得毫無意義,推薦列表成為排行榜的復(fù)制品[9]。而一個好的推薦系統(tǒng)應(yīng)該為不同用戶提供個性化的推薦,為用戶找到潛在的興趣,同時為服務(wù)提供商提供額外收益。因此,推薦系統(tǒng)的多樣性變得尤為重要。在此給出多個多樣性比精確率更重要的應(yīng)用場景,例如:當(dāng)被推薦的商品有“長期消耗品”或“周期性消耗品”或“體驗性商品”等特點時,當(dāng)用戶選擇該類商品后,可能短期內(nèi)或永久都不會再有選擇它們的欲望,這時多樣性的推薦甚至能提高推薦的精確率,這類商品有家具、月餅、旅游地點等。當(dāng)被推薦的商品受時間影響價值會發(fā)生變化時,對于提供下載或租賃這類商品的商家,多樣性推薦可以通過推薦一些非熱門的商品降低商家的成本,這類商品有電影、小說、音樂等,對于這類商品通常用戶的興趣不會僅限于一二種類型,多樣性推薦十分必要。以一個學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)為例,假設(shè)系統(tǒng)推薦的是同一個作者的論文,即使準(zhǔn)確性很高,用戶可能也會認(rèn)為這是一次很差的推薦,因為用戶很容易通過其他方式找到這些論文[10]。由此可以看出,多樣性推薦能為服務(wù)提供商獲得更多的收益,為用戶提供更好的用戶體驗,提高用戶的置信度。
近年來,越來越多的學(xué)者開始關(guān)注推薦系統(tǒng)的推薦多樣性問題。文獻(xiàn)[11]提出一種能夠提高會話推薦多樣性的融合協(xié)同過濾算法,在用戶會話期內(nèi)建立會話推薦列表,有效避免會話推薦樹中出現(xiàn)推薦環(huán)路,從而消除重復(fù)推薦。文獻(xiàn)[12]提出集合多樣性的概念,通過增設(shè)預(yù)測評分的閾值來改變原有的推薦排序方法,以提高整體推薦的多樣性。文獻(xiàn)[13]提出時間多樣性的概念,強調(diào)隨著時間的推移,推薦系統(tǒng)對用戶推薦應(yīng)呈現(xiàn)多樣性。
上述提高推薦多樣性的方法要么是從推薦想要達(dá)到的效果出發(fā),要么是從影響推薦多樣性的外在原因出發(fā)改進算法,忽略了導(dǎo)致推薦多樣性低的根本原因。本文結(jié)合基于項目的協(xié)同過濾算法,通過在項目的原始信息中分析協(xié)同過濾推薦過程中導(dǎo)致多樣性低的原因,從根本上進行改進,提高推薦的多樣性。
3.1 算法設(shè)計思想
本文研究目的在于提高推薦多樣性,多樣性分為個體多樣性和總體多樣性,個體多樣性又可分為個體內(nèi)部多樣性和個體外部多樣性。個體內(nèi)部多樣性是指在對單個用戶的一次推薦中,推薦列表內(nèi)部項目之間具有多樣性。個體外部多樣性是指在對多個用戶的推薦中,多個用戶的推薦列表之間具有多樣性[11]??傮w多樣性是對全體用戶而言,系統(tǒng)所產(chǎn)生的全部推薦項目所表現(xiàn)的多樣性[14]。總體多樣性可以通過個體外部多樣性來體現(xiàn)。個體外部多樣性越大,則總體多樣性也越大[11]。由于推薦系統(tǒng)大多數(shù)為個性化推薦,即為每個不同用戶提供不同推薦,因此本文關(guān)注的多樣性為個體多樣性。
推薦算法的關(guān)鍵在于相似度計算,余弦相似度在數(shù)學(xué)上用來考慮兩向量的方向,應(yīng)用到推薦算法中,用來計算用戶的相似度,表現(xiàn)為用戶興趣的相似程度;用來計算項目的相似度,表現(xiàn)為項目特征的相似程度。而項目特征通??梢酝ㄟ^項目的類別體現(xiàn),因此,聯(lián)想到在傳統(tǒng)的推薦算法上考慮項目類別屬性的影響,通過推薦與用戶喜歡的項目類別較相似的項目來提高推薦的多樣性。
傳統(tǒng)的協(xié)同過濾算法并不涉及用戶或項目的具體特征,輸入值只有用戶-項目評分矩陣,而通過上文分析,基于項目的推薦是將與用戶喜歡的項目相似度最高的項目推薦給用戶,這樣推薦的項目通常為一種項目或者是與用戶喜歡的項目相同的項目,也即項目的特征是高度一致的,這就導(dǎo)致推薦多樣性程度很低。因此,可以借助項目的類別屬性信息,提高具有較相似而不完全相似類別屬性的項目被推薦的可能,使得它們能被推薦給用戶,從而提高推薦的多樣性。在這個過程中,由于依然是根據(jù)相似度進行推薦,因此推薦的精確度也不會很低。由于改進算法使用了項目屬性信息,因此本文的改進算法也可以看作是結(jié)合基于內(nèi)容的推薦算法和協(xié)同過濾推薦算法的混合推薦算法。
定義1(項目類別貢獻(xiàn)函數(shù)) 對于項目 i的最近鄰項目j,項目j的類別貢獻(xiàn)函數(shù)f(j)=n/N,其中,n表示兩項目共有的類別屬性個數(shù);N表示項目i的類別屬性總個數(shù)。分析可知,f(j)=1的情況有2種:(1)項目 i和項目 j的類別屬性完全相同,根據(jù)改進算法的思想,需要降低這種項目被推薦的可能,因此在貢獻(xiàn)函數(shù)中引入懲罰因子 α。當(dāng)f(j)=1時,0<α<1,當(dāng)f(j)<1時,α=1。(2)項目j的類別屬性個數(shù)大于項目i的屬性個數(shù),這時它們的類別屬性不完全相同,為與第(1)種情況相區(qū)分,在這種情況下,定義 f(j)=n/N′,其中,n表示兩項目共有的類別屬性個數(shù);N′表示項目j的類別屬性總個數(shù)。
定義2(綜合預(yù)測評分) 項目 i和項目 j的綜
合預(yù)測評分公式具體如下:
其中,α為定義1中的懲罰因子,用來降低與目標(biāo)項目類別完全相同的項目的預(yù)測評分;f(j)為項目j對項目i的項目類別貢獻(xiàn)函數(shù)。
3.2 算法步驟
根據(jù)上述分析和定義,改進算法步驟具體如下:
(1)根據(jù)用戶-項目評分矩陣,利用式(2)計算出目標(biāo)項目與其他各項目的相似度;
(2)根據(jù)相似度計算目標(biāo)項目的K最近鄰;
(3)根據(jù)定義1計算最近鄰中各項目對目標(biāo)項目的項目類別貢獻(xiàn)函數(shù);
(4)根據(jù)定義2,利用式(6)計算出用戶對目標(biāo)項目的綜合預(yù)測評分;
(5)用TOP-N推薦策略將前N項得分最高的項目推薦給用戶。
3.3 算法分析
本文算法的改進目的是為了提高推薦算法的個體多樣性,其具體策略是使得與用戶最喜歡的項目的類別屬性相似度高但并不完全相同的項目得到更多推薦,因此,在改進時需要降低類別屬性完全相同的項目相似度,以及類別屬性差距過大的項目的相似度。
根據(jù)定義1可知,當(dāng)最近鄰項目與目標(biāo)項目的共有屬性個數(shù)越多時,貢獻(xiàn)函數(shù)值越大,即與目標(biāo)項目類別屬性相似度越大的項目被推薦的概率越大。通過將定義1中的懲罰因子 α取一個0~1之間的數(shù)來降低項目的預(yù)測評分,從而降低與目標(biāo)項目類別屬性完全相同的項目被推薦的可能性。目前,如何平衡精確性和多樣性還沒有一個統(tǒng)一的標(biāo)準(zhǔn),考慮到不同應(yīng)用場合的需求,可以通過設(shè)置一個變量的具體取值來調(diào)控兩者之間的關(guān)系。本文α的取值將會平衡推薦的多樣性與精確性。當(dāng)對推薦的精確性要求較高時,α可以取1,而當(dāng)對精確性要求不高時,可通過調(diào)整α的取值來適當(dāng)降低推薦的精確性、提高推薦的多樣性。
4.1 實驗數(shù)據(jù)及評價指標(biāo)
目前提供給學(xué)術(shù)界用于推薦系統(tǒng)測試的數(shù)據(jù)不多,大多數(shù)學(xué)者都采用MovieLens[15]數(shù)據(jù)集進行實驗。本文實驗也選取該網(wǎng)站提供的數(shù)據(jù)集。該數(shù)據(jù)集是由明尼蘇達(dá)大學(xué)計算機科學(xué)與工程系的GroupLens小組提供并維護,記錄了用戶對電影的評分,評分值一共分為5個等級,1表示最不喜歡,5表示最喜歡。目前它提供了 3個不同大小的數(shù)據(jù)集供實驗使用,分別是包含1×105條、1×106條和1×107條評分?jǐn)?shù)據(jù)的數(shù)據(jù)集,每個用戶都至少對20部電影進行了評價。本文實驗選取1×105條數(shù)據(jù)集進行實驗,共有943個用戶對1 682部電影進行評價。
對推薦算法的評價是推薦算法研究中的重要組成部分,然而,由于推薦系統(tǒng)的研究和應(yīng)用領(lǐng)域十分廣泛,推薦算法的評價缺乏統(tǒng)一性,不同應(yīng)用環(huán)境對推薦算法的要求也存在很大差別,因此在選擇評價指標(biāo)時要綜合考慮實驗數(shù)據(jù)的特征以及算法改進兩方面。
現(xiàn)有提出的評價指標(biāo)基本是針對精確性的,本文實驗的目的是提高推薦多樣性,此方向的研究相對較少,大多數(shù)研究者在對改進算法進行評價時都是提出各自的多樣性評價指標(biāo),而這些指標(biāo)尚未得到廣泛認(rèn)可和使用。文獻(xiàn)[16]闡述了推薦系統(tǒng)精確性和精確性外的評價指標(biāo)的研究進展,提出平均海明距離來度量推薦系統(tǒng)的多樣性,并且總結(jié)了現(xiàn)有推薦系統(tǒng)多樣性的主要度量指標(biāo)。根據(jù)本文研究目的,實驗將選取列表內(nèi)相似度(Intra-list Similarity,ILS)[16]來評價推薦算法的多樣性,并選用精確率P來評價推薦算法的精確性。
列表內(nèi)相似度主要指針對單個用戶,推薦列表中所有項目的平均兩兩相似度[17-18]。一般來說,ILS值越大,推薦列表多樣性效果越差[16]。ILS計算公式具體如下:
其中,R表示推薦列表中推薦項目的集合;i和j是推薦列表中的項目;k是推薦項目的個數(shù)。精確率 P的計算公式具體如下:
其中,Nrt表示推薦項目集合與用戶真實選擇項目集合的交集個數(shù);Nr表示推薦項目的個數(shù)。
4.2 結(jié)果分析
考慮到數(shù)據(jù)稀疏性問題,本文實驗選取余弦相似度計算項目相似度,實驗共涉及傳統(tǒng)的基于項目的協(xié)同過濾推薦算法和本文改進的加入項目類別貢獻(xiàn)函數(shù)進行推薦的協(xié)同過濾算法。雖然本文改進了推薦算法的多樣性,并且多樣性與精確性是一對矛盾的概念,但實驗依然關(guān)注精確性,力求在保證一定精確性的前提下改進算法多樣性。關(guān)于懲罰因子的取值,分別取0.4,0.5,0.6,0.7,0.8進行實驗,發(fā)現(xiàn)當(dāng)α取0.5時,改進算法的P值最大,因此實驗中α取0.5。精確性實驗結(jié)果如圖2所示。
圖2 推薦算法精確性比較
從圖2可以看出,2種算法在最近鄰數(shù)遞增時,呈現(xiàn)先上升后下降的趨勢,這是由于用戶所看電影一般都不會只是一種或少數(shù)幾種類別,當(dāng)最近鄰取值增大時,更多類別的項目打分將會影響最終的預(yù)測評分,這時推薦效果會更好,而當(dāng)最近鄰數(shù)大于一定值時,由于影響最終評分的項目太多,其中很多可能是無用的,導(dǎo)致推薦效果不理想。從圖2中還可以看出,當(dāng)k=20時,算法精確性最高,因此在多樣性實驗中,最近鄰的值取20。
多樣性實驗結(jié)果如圖3所示,可以看出,無論推薦個數(shù)是多少,傳統(tǒng)協(xié)同過濾算法的ILS值都大于改進后的 ILS值,即改進算法提高了推薦多樣性。隨著推薦個數(shù)的增加,ILS值不斷變小,這是由于越來越多的項目被推薦導(dǎo)致。實驗結(jié)果表明,改進算法在提高推薦多樣性的同時降低了精確性,但由圖2可知,精確性差距并不大。該結(jié)果與實驗前的預(yù)期結(jié)果相吻合,即多樣性得到提高的同時,精確率稍有降低,這是因為改進的協(xié)同過濾算法仍是根據(jù)相似度進行推薦,所以精確率不會有大幅下降。
圖3 推薦算法多樣性比較
目前,到底是多樣性提高獲得的收益大,還是精確率下降帶來的損失大還沒有明確的結(jié)果,這個問題的難點在于學(xué)術(shù)界沒有符合條件的實驗環(huán)境,也無法獲得多樣性比精確率更重要的場景下的收益情況。然而,從文獻(xiàn)[13,19-20]以及上述實驗中可以得出以下規(guī)律:在精確率降低較小的情況下,通常可以得到大幅提高多樣性。以文獻(xiàn)[19]中的實驗結(jié)果做具體說明,因為該文獻(xiàn)中用到的實驗數(shù)據(jù)集之一是Netflix提供的數(shù)據(jù)集,在2.2節(jié)提到的多樣性比精確率更重要的應(yīng)用場景中,Netflix類似的電影租賃商符合該應(yīng)用場景。文獻(xiàn)[19]給出了5種算法的多樣性提高以及精確率損失情況,列出當(dāng)精確率降低0.1%~10%時,多樣性提高比例。以精確率降低0.1%為例,多樣性提高最小的一組實驗結(jié)果為,當(dāng)精確率降低0.1%時,多樣性提高7.3%;多樣性提高最大的一組實驗結(jié)果為,當(dāng)精確率降低0.1%時,多樣性提高20.1%。這種多樣化的推薦結(jié)果能夠鼓勵用戶去租賃“長尾”類型的電影(即位于銷售分布尾部的冷門電影),而此類電影相對新發(fā)行或熱門電影通常只需支付更少的版權(quán)費用,從而可提高商家收益。
本文通過原始信息分析推薦系統(tǒng)多樣性低的原因,考慮到項目屬性可以區(qū)分同類項目,提出在傳統(tǒng)協(xié)同過濾推薦算法中加入項目屬性信息進行推薦的改進算法。實驗結(jié)果證明,改進算法提高了推薦多樣性,但精確率稍有降低,然而目前沒有明確的結(jié)論證明多樣性提高帶來的收益大于精確率下降帶來的損失,同時在實驗過程中,因為數(shù)據(jù)量大導(dǎo)致實驗時間較長,對計算機硬件要求也較高。并且考慮到大數(shù)據(jù)時代的到來,將改進算法應(yīng)用于大數(shù)據(jù)環(huán)境,解決精確性和多樣性相互制約的矛盾問題以及尋找符合條件的實驗環(huán)境來論述多樣性提高對算法的影響,是下一步研究的主要方向。
[1] Zhou Tao,Kuscsik Z,Liu Jianguo.Solving the Apparent Diversity-accuracy Dilemma of Recommender Systems[J]. Proceedings of National Academy of Sciences of the United States of America,2010,107(10):4511-4515.
[2] 劉建國.周 濤.汪秉宏.個性化推薦系統(tǒng)的研究進展[J].自然科學(xué)進展,2009,19(1):1-15.
[3] 葉錫君,曹 萍.ASUCF:基于平均相似度的協(xié)同過濾推薦算法[J].計算機工程與設(shè)計,2014,35(12):61-67.
[4] 韋素云,業(yè) 寧,吉根林,等.基于項目類別和興趣度的協(xié)同過濾推薦算法[J].南京大學(xué)學(xué)報,2013,49(2):142-149.
[5] 楊 博,趙鵬飛.推薦算法綜述[J].山西大學(xué)學(xué)報,2011,34(3):337-350.
[6] 鄧愛林,朱揚勇,施伯樂.基于項目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報,2003,14(9):1621-1628.
[7] 周 濤.個性化推薦的十大挑戰(zhàn)[J].中國計算機學(xué)會通訊,2012,8(7):48-61.
[8] Lv Linyuan,Medo M,Yeung Chi-Ho,et al.Recommender System[J].Physics Reports,2012,519(1):1-49.[9] 黃杜鵑.基于多樣性的社會化推薦系統(tǒng)研究與實現(xiàn)[D].成都:電子科技大學(xué),2012.
[10] 安 維,劉啟華,張李義.個性化推薦系統(tǒng)的多樣性研究進展[J].圖書情報工作,2013,57(20):127-135.
[11] 李晶皎,孫麗梅,王 驕.Web-based推薦系統(tǒng)中的會話推薦多樣性研究[J].小型微型計算機系統(tǒng),2014,35(6):1265-1269.
[12] Gediminas A,Young O K.Improving Aggregate Recommendation Diversity Using Ranking-based Techniques[J].IEEE Transactions on Know ledge and Data Engineering,2011,24(5):896-911.
[13] Neal L,Stephen H,Licia C,et al.Temporal Diversity in Recommender Systems[C]//Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York,USA:ACM Press,2010:210-217.
[14] 岳可誠.個性化推薦技術(shù)的多樣性研究[D].合肥:安徽大學(xué),2013.
[15] Grouplens[EB/OL].[2014-04-15].http://grouplens. org/datasets/movielens/.
[16] 劉建國,周 濤,郭 強,等.個性化推薦系統(tǒng)評價方法綜述[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2009,6(3):1-10.
[17] Zhang Mi,Hurley N.Avoiding Monotony:Improving the Diversity of Recommendation Lists[C]//Proceedings of ACM Conference on Recommender Systems.New York,USA:ACM Press,2008:123-130.
[18] Ziegler C N,Lausen G.Making Product Recommendations More Diverse[J].IEEE Data Engineering Bulletin,2009,32(4):23-32.
[19] Adomavicius Y K.Toward More Diverse Recommendations:Item Re-ranking Methods for Recommender Systems[C]//Proceedings of the 19th Workshop on Information Technologies and System s.Berlin,Germ any:Springer,2009:3-10.
[20] Chen Jinpeng,Liu Yu,Hu Jun,et al.A Novel Framework for Improving Recommender Diversity[M]//Cao Longbing,Motoda H,Srivastava J,et al. Behavior and Social Computing.Berlin,Germany:Springer,2013:129-138.
編輯 陸燕菲
Study on Diversity of Collaborative Filtering Recommendation Algorithm Based on Item Category
YE Xijun,GONG Yue
(School of Information Science and Technology,Nanjing Agricultural University,Nanjing 210095,China)
Diversity of recommendation system becomes an important index of evaluating the quality of the recommendation.To improve the individual diversity of traditional collaborative filtering recommendation algorithm,the improved algorithm is based on item-based collaborative filtering recommendation algorithm,which adds item category information and defines a contribution function to optimize the formula of prediction score.It increases the item s scores which have not exactly the same item category with the objective item,and achieves the best item s recommendation. Experimental result proves the improved algorithm strengthens the individual diversity of recommendion system which at the same time keeps a high precision.As a result,it has a higher quality of recommendation.
collaborative filtering;diversity;item category;contribution function;prediction score;Intra-list Similarity(ILS)index
葉錫君,龔 玥.基于項目類別的協(xié)同過濾推薦算法多樣性研究[J].計算機工程,2015,41(10):42-46,52.
英文引用格式:Ye Xijun,Gong Yue.Study on Diversity of Collaborative Filtering Recommendation Algorithm Based on Item Category[J].Computer Engineering,2015,41(10):42-46,52.
1000-3428(2015)10-0042-05
A
TP391
國家自然科學(xué)基金資助項目(61403205);江蘇省高等教育教改研究基金資助項目(2013JSJG195)。
葉錫君(1964-),男,副教授、博士,主研方向:數(shù)據(jù)挖掘,知識發(fā)現(xiàn),生物信息學(xué);龔 玥,碩士研究生。
2014-09-17
2014-11-27E-m ail:yexj@njau.edu.cn