余永紅 高 陽 王 皓 孫栓柱
1(南京郵電大學(xué)通達(dá)學(xué)院 南京 210003)
2(計(jì)算機(jī)軟件新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室(南京大學(xué)) 南京 210023)
3(江蘇省軟件新技術(shù)與產(chǎn)業(yè)化協(xié)同創(chuàng)新中心(南京大學(xué)) 南京 210023)
4(江蘇方天電力技術(shù)有限公司 南京 211100)
(yuyh.nju@gmail.com)
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,從海量數(shù)據(jù)中找到有價(jià)值的相關(guān)信息變得越來越困難.推薦系統(tǒng)[1]通過分析用戶的歷史活動(dòng)數(shù)據(jù),挖掘用戶的潛在偏好,為用戶提供個(gè)性化的推薦服務(wù),成為解決信息過載問題的有效手段,近年來受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注.推薦系統(tǒng)的典型應(yīng)用包括Amazon和淘寶的商品推薦、Netflix的電影推薦、Last.fm的音樂推薦、LinkedIn的朋友推薦、Google News的新聞推薦等.這些互聯(lián)網(wǎng)應(yīng)用或者電商平臺(tái)通過部署推薦系統(tǒng),一方面滿足了用戶的個(gè)性化需求,減輕了信息過載的問題;另一方面提高了用戶的忠誠(chéng)度,增加了企業(yè)的營(yíng)業(yè)收入.
在推薦系統(tǒng)的研究中,協(xié)同過濾算法是目前應(yīng)用最廣泛的推薦技術(shù).協(xié)同過濾算法通過分析用戶的歷史反饋信息,預(yù)測(cè)用戶未來的偏好.由于協(xié)同過濾算法僅需要用戶的反饋信息,不需要用戶的概要信息和項(xiàng)目的描述信息,因此協(xié)同過濾的方法獨(dú)立于具體的應(yīng)用領(lǐng)域,可以泛化到不同的應(yīng)用領(lǐng)域中.然而,協(xié)同過濾算法存在數(shù)據(jù)稀疏、冷啟動(dòng)等問題.數(shù)據(jù)稀疏導(dǎo)致協(xié)同過濾算法不能準(zhǔn)確地根據(jù)用戶的評(píng)分?jǐn)?shù)據(jù)計(jì)算用戶或者項(xiàng)目之間的相似性,從而嚴(yán)重影響協(xié)同過濾推薦算法的準(zhǔn)確性.冷啟動(dòng)指由于與新注冊(cè)用戶和新加入系統(tǒng)項(xiàng)目相關(guān)的評(píng)分?jǐn)?shù)據(jù)較少,協(xié)同過濾推薦算法不能準(zhǔn)確地找到相似用戶或者項(xiàng)目,因而不能為新注冊(cè)用戶提供個(gè)性化推薦,或者將新加入系統(tǒng)的項(xiàng)目推薦給感興趣的用戶.
隨著社交網(wǎng)絡(luò)的出現(xiàn),越來越多的推薦算法利用社交網(wǎng)絡(luò)提供的豐富信息來改進(jìn)傳統(tǒng)推薦算法的性能,特別是解決傳統(tǒng)協(xié)同過濾方法中的冷啟動(dòng)問題.基于社交網(wǎng)絡(luò)的推薦算法一般假設(shè)社交網(wǎng)絡(luò)中用戶的偏好受到朋友的影響,并且朋友之間具有相似的偏好.典型的基于社交網(wǎng)絡(luò)的推薦算法如SoRec[2],RSTE[3],SocialMF[4],TrustMF[5],TrustSVD[6]等.然而,已有的基于社交網(wǎng)絡(luò)的推薦算法忽略了2個(gè)事實(shí):1)在不同的領(lǐng)域中,用戶信任不同的朋友;2)用戶不僅在不同領(lǐng)域中受到不同朋友的影響,而且不同用戶受朋友影響的程度不同.例如在某個(gè)社交網(wǎng)絡(luò)中,用戶u信任用戶v,用戶v在餐飲方面是權(quán)威,但是在電子產(chǎn)品方面是入門者.用戶u往往會(huì)接受用戶v在餐飲方面的建議;相反,在電子產(chǎn)品方面則不會(huì)接受用戶v的推薦,而會(huì)轉(zhuǎn)向在電子產(chǎn)品領(lǐng)域的權(quán)威朋友征詢意見.另外,當(dāng)用戶v向用戶u推薦餐飲方面的產(chǎn)品時(shí),如果用戶u自身不精通餐飲方面的知識(shí),或者說在餐飲方面具有較低的社會(huì)地位,那么用戶u受到用戶v的影響程度較大;相反,如果用戶u對(duì)餐飲方面的知識(shí)也非常精通,換句話說,用戶u在餐飲方面具有較高的社會(huì)地位,那么用戶u受到用戶v的影響程度則較小.因此,在推薦系統(tǒng)中,針對(duì)不同的領(lǐng)域,考慮用戶在不同領(lǐng)域的社會(huì)地位可以更加準(zhǔn)確地反映實(shí)際的推薦過程,從而有效地改進(jìn)推薦算法的性能.
為了解決以上的問題,本文提出了融合用戶社會(huì)地位的矩陣分解推薦算法.首先結(jié)合整體社交網(wǎng)絡(luò)和用戶的評(píng)分反饋信息,利用用戶評(píng)分和用戶信任關(guān)系共現(xiàn)的原則來推導(dǎo)特定領(lǐng)域的用戶社交網(wǎng)絡(luò)結(jié)構(gòu);然后利用PageRank[7]算法計(jì)算每個(gè)特定領(lǐng)域內(nèi)用戶的社會(huì)地位;最后以用戶社會(huì)地位來約束矩陣分解過程.在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文提出融合用戶社會(huì)地位的矩陣分解推薦算法的性能優(yōu)于傳統(tǒng)的基于社交網(wǎng)絡(luò)推薦算法.
本節(jié)主要介紹2類典型的推薦算法,包括協(xié)同過濾推薦算法和基于社交網(wǎng)絡(luò)的推薦算法.
協(xié)同過濾推薦算法僅需分析用戶的歷史活動(dòng)記錄(一般為用戶-項(xiàng)目評(píng)分矩陣)來進(jìn)行推薦,不需要分析用戶概要信息和項(xiàng)目描述信息,避免了復(fù)雜的自然語言處理過程,是目前應(yīng)用最廣泛的推薦技術(shù).協(xié)同過濾推薦算法主要分為基于內(nèi)存的協(xié)同過濾推薦算法、基于模型的協(xié)同過濾算法和混合推薦算法三大類[1].
基于內(nèi)存的協(xié)同過濾推薦算法使用整個(gè)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行推薦.它的基本假設(shè)為:與當(dāng)前活動(dòng)用戶(active user)愛好相似用戶喜歡的項(xiàng)目,當(dāng)前活動(dòng)用戶可能也喜歡;或者,與當(dāng)前活動(dòng)用戶喜歡的項(xiàng)目相似的項(xiàng)目,用戶也可能喜歡.協(xié)同過濾推薦算法首先通過某種相似度度量指標(biāo)找到與當(dāng)前活動(dòng)用戶或者目標(biāo)項(xiàng)目相似的用戶或者相似的項(xiàng)目;然后利用相似用戶對(duì)目標(biāo)項(xiàng)目評(píng)分的權(quán)重平均或當(dāng)前活動(dòng)用戶對(duì)相似項(xiàng)目評(píng)分的權(quán)重平均來預(yù)測(cè)當(dāng)前活動(dòng)用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分.典型的基于內(nèi)存協(xié)同過濾算法包括基于用戶的協(xié)同過濾算法[8]和基于項(xiàng)目的協(xié)同過濾算法[9-10].
與基于內(nèi)存協(xié)同過濾算法不同,基于模型的協(xié)同過濾算法使用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)技術(shù)從用戶-項(xiàng)目評(píng)分矩陣中學(xué)習(xí)一個(gè)預(yù)測(cè)模型,預(yù)測(cè)模型刻畫用戶的行為模式,然后利用預(yù)測(cè)模型進(jìn)行推薦.典型的基于模型的協(xié)同過濾算法包括:基于貝葉斯網(wǎng)絡(luò)推薦算法[11]、基于聚類模型推薦算法[12-14]、基于潛在語義分析推薦算法[15-16]、基于關(guān)聯(lián)規(guī)則推薦算法[17]、基于深度學(xué)習(xí)推薦算法[18-20].
基于內(nèi)存協(xié)同過濾算法雖然易于實(shí)現(xiàn)而且預(yù)測(cè)質(zhì)量較高,但是存在嚴(yán)重的可擴(kuò)展性問題.隨著用戶數(shù)量和項(xiàng)目數(shù)量的不斷增長(zhǎng),較差的在線預(yù)測(cè)性能使得基于內(nèi)存協(xié)同過濾推薦算法越來越不適應(yīng)大規(guī)模的電子商務(wù)平臺(tái).基于模型的協(xié)同過濾算法的響應(yīng)速度往往比基于內(nèi)存的協(xié)同過濾算法快,但是使用的理論模型復(fù)雜,有時(shí)并不能準(zhǔn)確地?cái)M合實(shí)際的數(shù)據(jù),另外模型的線下學(xué)習(xí)和更新過程時(shí)間較長(zhǎng).
自Netflix競(jìng)賽以來,由于在處理大規(guī)模數(shù)據(jù)方面良好的可擴(kuò)展性和準(zhǔn)確的預(yù)測(cè)能力,基于矩陣分解的推薦算法[21]受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注.基于矩陣分解的推薦算法認(rèn)為僅有少量的隱藏因子影響用戶的偏好和刻畫項(xiàng)目的特征.因此,基于矩陣分解的推薦算法將用戶和項(xiàng)目的特征向量同時(shí)映射到低維的隱藏因子空間中.在低維的隱藏因子空間中,由于用戶偏好和項(xiàng)目特征之間的相關(guān)性可以直接計(jì)算,矩陣分解的推薦算法利用用戶和項(xiàng)目的低維特征向量的內(nèi)積來預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分.典型的基于矩陣分解的推薦算法包括SVD++[22],NMF[23],MMMF[24],PMF[25],NPCA[26]等.
由于用戶-項(xiàng)目評(píng)分矩陣極度稀疏,導(dǎo)致協(xié)同過濾算法存在嚴(yán)重的冷啟動(dòng)問題.如,當(dāng)活動(dòng)用戶的評(píng)分信息較少時(shí),基于用戶協(xié)同過濾推薦算法[8]很難根據(jù)評(píng)分信息找到偏好相似的用戶.類似地,基于項(xiàng)目的協(xié)同過濾推薦算法[9-10]也不能準(zhǔn)確地找到與目標(biāo)項(xiàng)目相似的其他項(xiàng)目;基于矩陣分解的推薦算法很難準(zhǔn)確地學(xué)習(xí)新注冊(cè)用戶或者新加入系統(tǒng)的項(xiàng)目的隱藏特征向量.
傳統(tǒng)協(xié)同過濾算法認(rèn)為用戶之間是獨(dú)立的,忽略了用戶的社會(huì)屬性,即用戶總是存在于一個(gè)社交圈子中,與社交圈子內(nèi)的其他用戶相互影響.社交網(wǎng)絡(luò)的出現(xiàn)為解決協(xié)同過濾推薦算法中的數(shù)據(jù)稀疏和冷啟動(dòng)問題帶了契機(jī).基于社會(huì)學(xué)中的同質(zhì)理論[27]和社交影響理論[28],研究人員提出了幾種典型的基于社交網(wǎng)絡(luò)的推薦算法,如SoRec[2],RSTE[3],SocialMF[4],TrustMF[5],TrustSVD[6]等.
Ma 等人[2]提出了基于概率矩陣分解模型的推薦算法 SoRec.SoRec集成了用戶的評(píng)分信息和用戶的社交網(wǎng)絡(luò)信息,并通過用戶評(píng)分信息和用戶社交網(wǎng)絡(luò)信息之間共享用戶隱藏特征矩陣的方式來融合2種不同類型的信息源.為了更加準(zhǔn)確直觀地對(duì)推薦過程進(jìn)行建模,Ma等人[3]進(jìn)一步提出了基于社交網(wǎng)絡(luò)的推薦算法RSTE.RSTE推薦算法假設(shè)用戶的最終決策是用戶自身偏好和朋友偏好的折中權(quán)衡,并通過集成參數(shù)來融合用戶自身偏好和朋友的偏好.在文獻(xiàn)[4]中,Jamali 等人提出了SocialMF推薦算法.SocialMF推薦算法在矩陣分解模型中集成了信任的傳遞機(jī)制來改進(jìn)推薦算法的準(zhǔn)確性.在SocialMF中,信任傳遞機(jī)制對(duì)于處理推薦系統(tǒng)中的冷啟動(dòng)問題特別有效,因?yàn)樾伦?cè)用戶的隱藏特征向量依賴于此用戶最相似鄰居們的特征向量,而鄰居們的特征向量可以從他們的評(píng)分信息中學(xué)習(xí),所以,一定程度上確保了新注冊(cè)用戶的隱藏特征向量可以被學(xué)習(xí)到.在文獻(xiàn)[5]中,Yang等人集成用戶評(píng)分信息和用戶信任關(guān)系信息,提出了TrustMF推薦算法.TrustMF認(rèn)為用戶一方面受到信任朋友的評(píng)分信息和評(píng)論的影響;另一方面,用戶自身的評(píng)分信息和評(píng)論也會(huì)影響其他用戶的決定.TrustMF通過在信任關(guān)系矩陣上執(zhí)行矩陣分解,將用戶映射到2個(gè)不同的隱藏特征空間:信任特征空間和被信任特征空間.因此,在TrustMF中,每個(gè)用戶同時(shí)由信任特征向量和被信任特征向量描述.在文獻(xiàn)[6]中,Guo等人提出了基于社交網(wǎng)絡(luò)的推薦算法TrustSVD.TrustSVD擴(kuò)展了SVD++算法,在SVD++算法的基礎(chǔ)上,綜合考慮了評(píng)分和信任值的顯式和隱式影響,使用已評(píng)分項(xiàng)目的隱藏特征向量和信任朋友的隱藏特征向量來表示用戶的隱藏特征向量.在文獻(xiàn)[29]中,郭弘毅等人提出了融合社區(qū)結(jié)構(gòu)和興趣聚類的協(xié)同過濾算法.上述提及推薦算法的實(shí)驗(yàn)結(jié)果表明,社交網(wǎng)絡(luò)信息有助于改進(jìn)傳統(tǒng)協(xié)同過濾推薦算法的性能,特別是減輕冷啟動(dòng)問題.
另外,為了建模信任關(guān)系的多面性,Yang等人[30]提出基于社交網(wǎng)絡(luò)圈的推薦算法.基于社交網(wǎng)絡(luò)圈的推薦算法首先從評(píng)分?jǐn)?shù)據(jù)和社交網(wǎng)絡(luò)數(shù)據(jù)中推導(dǎo)特定領(lǐng)域的社交信任關(guān)系;然后在每個(gè)領(lǐng)域內(nèi)應(yīng)用SocialMF算法學(xué)習(xí)用戶隱藏特征向量和項(xiàng)目隱藏特征向量.Tang等人[31]認(rèn)為用戶可能向社交網(wǎng)絡(luò)中朋友或者全局具有較高聲譽(yù)的用戶尋求建議,他們同時(shí)利用局部和全局的社交關(guān)系,提出了LOCABAL推薦算法.不同于Yang等人[30]提出基于社交網(wǎng)絡(luò)圈的推薦算法,本文提出的方法不僅考慮了不同領(lǐng)域的社交網(wǎng)絡(luò)圈,還考慮了不同社交網(wǎng)絡(luò)圈內(nèi)用戶的社會(huì)地位存在差異,不同社會(huì)地位的用戶受到同一個(gè)領(lǐng)域內(nèi)朋友的影響程度不同.LOCABAL利用PageRank算法在整個(gè)社交網(wǎng)絡(luò)中計(jì)算用戶的信譽(yù)值,但是未考慮不同領(lǐng)域內(nèi),用戶的信譽(yù)值是不同的.在一個(gè)包含多個(gè)領(lǐng)域項(xiàng)目的推薦系統(tǒng)中,來自于多種領(lǐng)域的社交關(guān)系混合在一起,這種方法不符合實(shí)際情況.與LOCABAL不同點(diǎn)在于,本文提出的方法考慮了用戶的信譽(yù)值或者社會(huì)地位在不同領(lǐng)域是不同的.
基于社交網(wǎng)絡(luò)的推薦系統(tǒng)往往包含2種不同類型的數(shù)據(jù)源:用戶-項(xiàng)目評(píng)分矩陣和社交網(wǎng)絡(luò)信息.用戶-項(xiàng)目評(píng)分矩陣RN×M由2種實(shí)體集合組成:N個(gè)用戶集合U={u1,u2,…,uN}和M個(gè)項(xiàng)目集合I={i1,i2,…,iM}.RN×M中的每項(xiàng)ru i是用戶u對(duì)項(xiàng)目i的評(píng)分.原則上,評(píng)分?jǐn)?shù)據(jù)ru i可以為任意的實(shí)數(shù),但通常情況下,評(píng)分?jǐn)?shù)據(jù)為整數(shù),而且ru i∈{0,1,2,3,4,5},其中0值表示用戶未對(duì)此項(xiàng)目進(jìn)行評(píng)分.評(píng)分值越高意味著用戶對(duì)當(dāng)前項(xiàng)目越滿意.用戶u評(píng)過分的項(xiàng)目集合表示為Iu(Iu?I).由于用戶通常只對(duì)少量的項(xiàng)目進(jìn)行評(píng)分,用戶-項(xiàng)目評(píng)分矩陣RN×M通常非常的稀疏.例如MovieLens100K 和 MovieLens1M數(shù)據(jù)集中分別有93%和95%的評(píng)分項(xiàng)缺失,Netflix數(shù)據(jù)集評(píng)分缺失項(xiàng)更高達(dá)99%.用戶-項(xiàng)目評(píng)分矩陣的稀疏性是影響推薦準(zhǔn)確性的重要因素.
社交網(wǎng)絡(luò)信息通常表示為有向社會(huì)關(guān)系圖G=(U,E),其中U是用戶集合,邊集合E表示用戶之間的社交信任關(guān)系.Tu,v∈[0,1]表示用戶u和用戶v之間信任權(quán)重,Tu,v=0意味著用戶u和用戶v之間沒有建立信任關(guān)系.推薦系統(tǒng)中所有用戶之間的信任關(guān)系組成信任關(guān)系矩陣T.需要注意的是:由于用戶之間信任關(guān)系往往不是相互的,所以信任關(guān)系矩陣T通常是非對(duì)稱的.
由于在處理大規(guī)模用戶-項(xiàng)目評(píng)分矩陣R方面的有效性,矩陣分解技術(shù)在推薦系統(tǒng)中被廣泛采用.矩陣分解的目標(biāo)是通過分析用戶-項(xiàng)目評(píng)分矩陣R,學(xué)習(xí)用戶的隱藏特征矩陣P和項(xiàng)目隱藏特征矩陣Q,然后利用P和Q預(yù)測(cè)R中的缺失項(xiàng).形式化地,設(shè)用戶的隱藏特征矩陣和項(xiàng)目隱藏特征矩陣分別為P∈K×N和Q∈K×M(K?min(N,M)),其中K為隱藏特征向量的維數(shù),矩陣分解的方法將用戶-項(xiàng)目評(píng)分矩陣R分解為2個(gè)低維的隱藏特征矩陣P和Q,然后用P和Q的乘積來近似評(píng)分矩陣R,即:
(1)
(2)
矩陣分解通過最小化誤差平方和損失函數(shù)來學(xué)習(xí)隱藏特征矩陣P和Q,即:
(3)
一般使用梯度下降或者隨機(jī)梯度下降的算法求解式(3)定義的目標(biāo)函數(shù)的局部最優(yōu)解.另外,從貝葉斯的角度出發(fā),上述描述的矩陣分解算法等價(jià)于概率矩陣分解算法(PMF)[25].
本文擴(kuò)展了上述矩陣分解方法,特別是在其中融合了用戶社會(huì)地位信息.
本節(jié)詳細(xì)描述本文提出的融合用戶社會(huì)地位和矩陣分解的推薦算法.首先描述融合用戶社會(huì)地位和矩陣分解推薦算法的框架,然后詳細(xì)介紹此推薦算法的模型和參數(shù)學(xué)習(xí)過程.
融合用戶社會(huì)地位和矩陣分解的推薦算法框架如圖1所示:
Fig. 1 The framework of our proposed recommendation algorithm圖1 融合用戶社會(huì)地位和矩陣分解的推薦算法框架
融合用戶社會(huì)地位和矩陣分解的推薦算法主要由用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)劃分和特定類別用戶社交網(wǎng)絡(luò)的推導(dǎo)、用戶社會(huì)地位的計(jì)算、用戶社會(huì)地位增強(qiáng)的矩陣分解和評(píng)分預(yù)測(cè)等部分組成.
(4)
2) 用戶社會(huì)地位的計(jì)算.在社交網(wǎng)絡(luò)中,社交網(wǎng)絡(luò)的結(jié)構(gòu)一定程度上反映了用戶的社會(huì)地位.如社會(huì)地位高的用戶往往可以為其他用戶提供有價(jià)值的參考信息,因而擁有大量的in-link;社會(huì)地位低的用戶一般喜歡參考社會(huì)地位高的用戶的建議,因而具有較多的out-link、較少的in-link.目前有大量的算法根據(jù)社交網(wǎng)絡(luò)的結(jié)構(gòu)計(jì)算用戶在社交網(wǎng)絡(luò)中的社會(huì)地位,如PageRank[7],HIST[32].本文在Tc基礎(chǔ)上,首先采用PageRank算法計(jì)算用戶在每個(gè)類別下的PageRank值.設(shè)PRc∈Nc表示所有用戶在社交關(guān)系矩陣Tc中的PageRank值,Nc表示Tc中用戶的數(shù)量.用戶u在類別c內(nèi)的PageRank值PRc(u)可以表示為
(6)
4) 評(píng)分預(yù)測(cè).預(yù)測(cè)缺失項(xiàng)的評(píng)分值:
(7)
在社交網(wǎng)絡(luò)中,不同的用戶往往具有不同的社會(huì)地位,社會(huì)地位低的用戶通常會(huì)向社會(huì)地位高的用戶征求意見;反之,社會(huì)地位高的用戶則較少考慮社會(huì)低的用戶的建議.換句話說,社會(huì)地位高的用戶往往受到其他用戶的影響?。簧鐣?huì)地位低的用戶則由于缺乏相關(guān)領(lǐng)域的知識(shí),受到其他用戶的影響大.因此,本文使用用戶社會(huì)地位衡量用戶評(píng)分的重要性,即:
(8)
加上防止過擬合的正則化項(xiàng)后,目標(biāo)函數(shù)定義為
(9)
式(9)僅從社交網(wǎng)絡(luò)全局的角度考慮用戶社會(huì)地位對(duì)用戶評(píng)分的影響,但是未考慮用戶的行為同時(shí)受到朋友的影響,即式(9)未考慮局部的社會(huì)影響力.
為了在矩陣分解的過程考慮局部社會(huì)影響力對(duì)用戶行為的影響,本文在由式(9)定義的目標(biāo)函數(shù)基礎(chǔ)上,加上正則化項(xiàng):
(10)
使得用戶的隱藏特征向量依賴于其信任用戶的隱藏特征向量.這種方法對(duì)于處理推薦系統(tǒng)的冷啟動(dòng)問題特別有效.對(duì)于新加入系統(tǒng)的用戶,由于其評(píng)分?jǐn)?shù)據(jù)較少,矩陣分解的方法不能準(zhǔn)確地根據(jù)評(píng)分?jǐn)?shù)據(jù)學(xué)習(xí)用戶的隱藏特征向量.新用戶雖然評(píng)分?jǐn)?shù)據(jù)較少,但是可能與其他用戶建立了信任關(guān)系,通過式(10)可以使新加入系統(tǒng)的用戶的隱藏特征向量與其信任朋友的隱藏特征向量盡可能地靠近,從而間接地學(xué)習(xí)新用戶的隱藏特征向量.
(11)
(12)
(13)
為了驗(yàn)證融合用戶社會(huì)地位和矩陣分解推薦算法的性能,本文在真實(shí)的數(shù)據(jù)集上與其他流行的推薦算法進(jìn)行了對(duì)比分析.
本文選擇Epinions數(shù)據(jù)集驗(yàn)證本文提出推薦算法的性能.Epinions數(shù)據(jù)集中含有用戶評(píng)分、社交關(guān)系和項(xiàng)目類別等信息.在Epinions中,用戶可以瀏覽其他用戶對(duì)產(chǎn)品的評(píng)分和評(píng)論信息,同時(shí)用戶以評(píng)分和評(píng)論的方式發(fā)表自己的意見.Epinions中的產(chǎn)品按類別分類,如電影類、數(shù)字產(chǎn)品類和書籍類等.另外,Epinions中的每個(gè)用戶維護(hù)一個(gè)信任用戶列表.Epinions中信任關(guān)系是有向的,信任值是二值的.
本文使用的Epinions數(shù)據(jù)集是由文獻(xiàn)[27]的作者提供的.此數(shù)據(jù)集包含922 267條評(píng)分記錄、22 166個(gè)用戶和296 277個(gè)產(chǎn)品、355 813條信任關(guān)系.用戶-項(xiàng)目評(píng)分矩陣的稀疏度為99.986%,用戶評(píng)分記錄基本符合冪律分布,如圖2所示.從圖2可以觀察,Epinions數(shù)據(jù)集中大量用戶僅提供較少的評(píng)分記錄.
Fig. 2 The power-law distribution of users for Epinions dataset圖2 Epinions數(shù)據(jù)集的用戶評(píng)分冪律分布
Epinions中的產(chǎn)品分為27個(gè)類別,用戶涉及的類別數(shù)量分布如圖3所示.
Fig. 3 Distribution of users for different number of categories for Epinions dataset圖3 Epinions數(shù)據(jù)集的用戶涉及項(xiàng)目類別分布
從圖3可以觀察,用戶平均涉及到的項(xiàng)目類別數(shù)較少,僅21.7%的用戶涉及到的類別數(shù)超過10,也就是說,用戶并不是對(duì)所有的類別都感興趣,因而不能在所有類別上影響朋友的評(píng)分行為.這也表明了本文提出的推薦算法對(duì)用戶評(píng)分?jǐn)?shù)據(jù)和社交關(guān)系按項(xiàng)目類別分類處理的必要性.本文選取“Movie”,“Home Garden”,“Education”這3個(gè)類別的子數(shù)據(jù)集來驗(yàn)證本文提出的推薦算法.“Movie”,“Home Garden”,“Education”分別代表大、中、小規(guī)模的數(shù)據(jù)集.經(jīng)過評(píng)分?jǐn)?shù)據(jù)劃分和特定類別的用戶社交網(wǎng)絡(luò)的推導(dǎo)后,3個(gè)類別數(shù)據(jù)集統(tǒng)計(jì)信息如表1所示:
Table 1 Statistics of Three Data Sets表1 數(shù)據(jù)集統(tǒng)計(jì)信息
目前,在推薦系統(tǒng)研究領(lǐng)域有很多不同的度量指標(biāo)被用來度量推薦算法的性能.例如平均絕對(duì)值誤差(mean absolute error,MAE)、均方根誤差(root mean squared error,RMSE)和歸一化的平均絕對(duì)值誤差(normalized mean absolute error,NMAE)等.本文采用RMSE來評(píng)價(jià)推薦算法的性能.RMSE的定義為
(14)
為了驗(yàn)證本文提出推薦算法的有效性,我們選取如下的推薦算法作為對(duì)比方法.
1) PMF.PMF是由Mnih和Salakhutdinov[25]提出,可以看作是 SVD模型的概率擴(kuò)展,它僅利用用戶-項(xiàng)目評(píng)分矩陣來生成推薦項(xiàng).
2) SoRec.SoRec[2]同時(shí)分解用戶評(píng)分矩陣和用戶信任關(guān)系矩陣,并以用戶評(píng)分矩陣和用戶信任關(guān)系矩陣共享用戶隱藏特征矩陣的方式來融合評(píng)分信息和社交網(wǎng)絡(luò)信息.不同于PMF,SoRec是一個(gè)基于社交網(wǎng)絡(luò)的推薦算法,它同時(shí)利用用戶評(píng)分信息和社交網(wǎng)絡(luò)信息來為用戶提供推薦服務(wù).
3) RSTE.RSTE[3]在產(chǎn)生推薦項(xiàng)過程中考慮了用戶自身偏好和朋友偏好,并通過集成參數(shù)來融合用戶自身偏好和朋友偏好.RSTE是一種基于社交網(wǎng)絡(luò)的推薦算法.
4) SocialMF.SocialMF是由Jamali等人[4]提出的一種基于社交網(wǎng)絡(luò)的推薦算法.SocialMF在PMF中加入信任的傳遞機(jī)制來提高推薦算法的準(zhǔn)確性.
5)TrustMF.TrustMF[5]認(rèn)為用戶的行為既受到其他用戶評(píng)分和評(píng)論的影響,同時(shí)他的評(píng)分和評(píng)論也會(huì)影響其他用戶.TrustMF在用戶信任關(guān)系矩陣上執(zhí)行矩陣分解,將用戶映射到2個(gè)不同隱藏特征空間:信任特征空間和被信任特征空間.
我們隨機(jī)從用戶-項(xiàng)目評(píng)分矩陣中抽取80%的數(shù)據(jù)作為訓(xùn)練集,剩余20%的數(shù)據(jù)作為測(cè)試數(shù)據(jù).這種隨機(jī)抽取獨(dú)立地執(zhí)行5次,以5次運(yùn)行結(jié)果的平均值作為最后的運(yùn)行結(jié)果.為了公平對(duì)比,我們參照對(duì)比算法的相應(yīng)文獻(xiàn)或者實(shí)驗(yàn)結(jié)果設(shè)置不同算法的參數(shù),在這些參數(shù)設(shè)置下,各對(duì)比算法取得最優(yōu)性能.在PMF中,λU=λV=0.03;在SoRec中,λU=λV=λZ=0.001,λC=1;在RSTE中,λU=λV=0.001,α=0.4;在SocialMF中,λU=λV=0.001,λT=1;在TrustMF中,λ=0.001,λT=1;對(duì)于本文提出的方法,λ1=λ2=0.001,λ3在3個(gè)數(shù)據(jù)集上分別設(shè)置為0.5,0.1,0.1.另外,我們?cè)O(shè)置PMF的學(xué)習(xí)率η=0.05,本文提出的推薦算法的學(xué)習(xí)率η=0.03,其他基于社交網(wǎng)絡(luò)推薦算法的學(xué)習(xí)率η=0.001.
另外,對(duì)于SoRec,RSTE,SocialMF,TrustMF,我們使用Epinions中所有的社交關(guān)系來訓(xùn)練預(yù)測(cè)模型,對(duì)于本文提出的方法,使用3.1節(jié)中推導(dǎo)的特定領(lǐng)域的社交關(guān)系來訓(xùn)練預(yù)測(cè)模型.
實(shí)驗(yàn)運(yùn)行環(huán)境為:4核Intel?Xeon?E3-1225 CPU,3.2 GHz主頻,8 GB內(nèi)存,Window7操作系統(tǒng)和J2SE1.7.
在隱藏特征維度值K=10和K=20情況下,所有對(duì)比算法在3個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表2~4所示.
Table 2 Performance Comparison on Education 表2 在Education數(shù)據(jù)集上的性能對(duì)比
Table 3 Performance Comparison on Home Garden 表3 在Home Garden數(shù)據(jù)集上的性能對(duì)比
Table 4 Performance Comparison on Movie表4 在Movie數(shù)據(jù)集上的性能對(duì)比
從表2~4可以發(fā)現(xiàn):
1) 基于社交網(wǎng)絡(luò)的推薦算法的性能優(yōu)于僅利用用戶評(píng)分信息的推薦算法,再次驗(yàn)證了社交網(wǎng)絡(luò)信息有助于改進(jìn)推薦算法的性能.
2) 在3個(gè)數(shù)據(jù)集上,本文提出的融合用戶社會(huì)地位的矩陣分解推薦算法的推薦準(zhǔn)確度高于其他對(duì)比算法,說明了本文提出算法的有效性.在Education,Home Garden,Movie數(shù)據(jù)集上,K=20時(shí),與PMF,SoRec,RSTE,SocialMF,TrustMF中的最優(yōu)結(jié)果對(duì)比,本文提出算法的改進(jìn)幅度分別為9.2%,1.4%,1.3%.
3) 在3個(gè)數(shù)據(jù)集上,隨著K的增加,所有對(duì)比算法的性能下降,說明增加隱藏特征向量的維數(shù)不能有效提高矩陣分解算法的準(zhǔn)確性,這也驗(yàn)證了矩陣分解算法的假設(shè):僅有少量的隱藏因子影響用戶的偏好和刻畫項(xiàng)目的特征.
4) 在K=10時(shí),對(duì)比PMF,SoRec,SocialMF,RSTE,TrustMF,RSTE在Education數(shù)據(jù)集上取得最優(yōu)性能,SocialMF 在 Home Garden和Movie數(shù)據(jù)集上取得最優(yōu)性能.這可能是由于Movie,Home Garden中的用戶平均信任關(guān)系數(shù)大于Education中的用戶平均信任關(guān)系數(shù),即在用戶平均信任關(guān)系數(shù)較大時(shí)SocialMF的推薦準(zhǔn)確性較高,在用戶平均信任關(guān)系數(shù)較小時(shí)RSTE的推薦準(zhǔn)確性高.
在本文提出的推薦算法中,參數(shù)λ3是一個(gè)影響推薦性能的重要參數(shù).較大的λ3值意味著我們?cè)诰仃嚪纸饽P椭懈右蕾嚿缃痪W(wǎng)絡(luò)關(guān)系.在極端的情況下,如λ3=∞,本文提出的推薦算法將完全依賴社交網(wǎng)絡(luò)關(guān)系來學(xué)習(xí)用戶和項(xiàng)目隱藏特征向量,而忽視用戶的評(píng)分信息;相反,較小的λ3值意味著我們賦予用戶評(píng)分信息更多的權(quán)重,如λ3=0表示推薦算法完全依賴用戶評(píng)分信息來學(xué)習(xí)用戶和項(xiàng)目隱藏特征向量.在本節(jié)中,我們?cè)O(shè)置λ3為0,0.01,0.1,0.5,1,5來檢驗(yàn)λ3對(duì)本文提出推薦算法的影響.在本組實(shí)驗(yàn)中,設(shè)置隱藏特征向量的維數(shù)K=10.實(shí)驗(yàn)結(jié)果如圖4所示.
Fig. 4 The impact of λ3圖4 λ3的影響
從圖4可以看出,參數(shù)λ3確實(shí)影響本文提出推薦算法的性能.其次,在3個(gè)數(shù)據(jù)集上,RMSE的值呈現(xiàn)類似的變化趨勢(shì):隨著λ3的增加,RMSE先降低,推薦準(zhǔn)確性提高,到達(dá)最優(yōu)值后,RMSE隨λ3的增加而增加,推薦準(zhǔn)確性降低.最后,在3個(gè)數(shù)據(jù)集上,本文提出的推薦算法并沒有在同一個(gè)λ3值下獲得最低RMSE,說明數(shù)據(jù)集不同則本文提出推薦算法對(duì)社交網(wǎng)絡(luò)信息的依賴程度不同.在Movie,Home Garden和 Education上,RMSE分別在λ3=0.5,0.1,0.1時(shí)取得最優(yōu)性能,表示本文提出的推薦算法在Movie數(shù)據(jù)集上更加依賴社交網(wǎng)絡(luò)信息.這是由于在Movie類別中,用戶平均信任關(guān)系數(shù)比Home Garden和 Education中的用戶平均信任關(guān)系數(shù)相對(duì)大.
隱藏特征向量的維數(shù)K是影響本文提出融合用戶社會(huì)地位和矩陣分解推薦算法性能的另一個(gè)重要參數(shù).在本節(jié)中,我們變化K的值,從5~50,遞增步長(zhǎng)為5,觀察RMSE在3個(gè)數(shù)據(jù)集上的變化情況.參數(shù)λ3分別設(shè)置為0.5,0.1,0.1.實(shí)驗(yàn)結(jié)果如圖5所示:
Fig. 5 The impact of K圖5 K的影響
從圖5可以觀察到,隨著K的遞增,RMSE的值先增加,后趨于穩(wěn)定,整體推薦性能下降.這個(gè)觀察結(jié)果表明:雖然K值增大使得矩陣分解模型可以表示較多的隱藏特征,但是同時(shí)會(huì)引入一些噪音,降低矩陣分解推薦算法的準(zhǔn)確性.這個(gè)觀察結(jié)果再次驗(yàn)證了矩陣分解模型的基本假設(shè):僅有少量的隱藏因子影響用戶的偏好和刻畫項(xiàng)目的特征.
在本節(jié)中,我們對(duì)比不同推薦算法的模型訓(xùn)練時(shí)間,以檢驗(yàn)本文提出推薦算法的效率.在Movie,Home Garden,Education數(shù)據(jù)集上,參數(shù)λ3分別設(shè)置為0.5,0.1,0.1,K=10.其他對(duì)比推薦算法的參數(shù)設(shè)置同4.3節(jié).不同推薦算法在3個(gè)數(shù)據(jù)集上的模型訓(xùn)練時(shí)間如表5所示:
Table 5 The Runtime of Model Training (min:sec)表5 模型訓(xùn)練時(shí)間(分:秒)
從表5可以觀察到,PMF在3個(gè)數(shù)據(jù)集上的模型訓(xùn)練時(shí)間最少.這是由于PMF在學(xué)習(xí)用戶和項(xiàng)目隱藏特征向量時(shí),未考慮社交網(wǎng)絡(luò)關(guān)系對(duì)用戶隱藏特征向量的影響.在基于社交網(wǎng)絡(luò)的推薦算法中,SoRec和TrustMF在效率方面勝過SocialMF,RSTE和本文提出的推薦算法.就模型訓(xùn)練時(shí)間而言,這說明在用戶評(píng)分矩陣和用戶社交關(guān)系矩陣中共享用戶隱藏特征向量的推薦模型(即SoRec和TrustMF)優(yōu)于通過社交關(guān)系約束用戶隱藏特征向量的模型(即SocialMF和RSTE).本文提出的推薦算法在Movie和 Home Garden數(shù)據(jù)集上,效率高于SocialMF和RSTE算法,在Education數(shù)據(jù)集上效率優(yōu)于SoRec,RSTE,SocialMF,TrustMF.
綜上所述,從實(shí)驗(yàn)結(jié)果看出:本文提出的融合用戶社會(huì)地位和矩陣分解的推薦算法在3個(gè)數(shù)據(jù)集上的推薦準(zhǔn)確性優(yōu)于對(duì)比算法,在模型學(xué)習(xí)的效率方面,與目前主流的基于社交網(wǎng)絡(luò)推薦算法相當(dāng).
基于社交網(wǎng)絡(luò)的推薦算法一般假設(shè)社交網(wǎng)絡(luò)中用戶的偏好受到朋友的影響,并且朋友之間具有類似的偏好.然而,在現(xiàn)實(shí)生活中,用戶在不同的領(lǐng)域往往信任不同的朋友;另外,用戶在不同領(lǐng)域具有不同的社會(huì)地位,因此,用戶在不同的領(lǐng)域內(nèi),受朋友的影響程度各不相同.為了解決傳統(tǒng)基于社交網(wǎng)絡(luò)推薦算法中存在的上述問題,本文提出了融合用戶社會(huì)地位和矩陣分解的推薦算法.首先利用用戶評(píng)分和社交信任關(guān)系共現(xiàn)的原則來推導(dǎo)特定領(lǐng)域內(nèi)的用戶社交網(wǎng)絡(luò)結(jié)構(gòu);然后利用PageRank算法計(jì)算每個(gè)特定領(lǐng)域內(nèi)用戶的社會(huì)地位;最后以用戶社會(huì)地位來約束矩陣分解過程.在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文提出融合用戶地位信息的矩陣分解推薦算法的性能優(yōu)于傳統(tǒng)的基于社交網(wǎng)絡(luò)推薦算法.
本文僅考慮以社交網(wǎng)絡(luò)結(jié)構(gòu)信息來衡量用戶的社會(huì)地位,而用戶的評(píng)分信息以及用戶的評(píng)論信息也在一定程度上反映了用戶的社會(huì)地位.結(jié)合社交網(wǎng)絡(luò)結(jié)構(gòu)信息、評(píng)分信息和評(píng)論信息來衡量用戶的社會(huì)地位是本文未來的研究方向;另外,現(xiàn)實(shí)的生活場(chǎng)景中,用戶往往只提供隱式的反饋信息,如購(gòu)買記錄、點(diǎn)擊記錄等,即此時(shí)我們面對(duì)的是One-Class Collaborative Filtering[33-35]問題.在One-Class Collaborative Filtering推薦場(chǎng)景中,如何學(xué)習(xí)用戶的社會(huì)地位值,并將其用于改進(jìn)推薦算法的性能也是本文未來的研究方向.最后,深度學(xué)習(xí)技術(shù)已經(jīng)在自然語言處理、計(jì)算機(jī)視覺等領(lǐng)域表現(xiàn)出強(qiáng)大的潛力,結(jié)合深度學(xué)習(xí)技術(shù)來改進(jìn)現(xiàn)有的推薦算法將是推薦系統(tǒng)研究領(lǐng)域中一個(gè)非常有趣的研究方向.
[1] Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions[J]. IEEE Trans on Knowledge and Data Engineering, 2005, 17(6): 734-749
[2] Ma Hao, Yang Haixuan, Lyu M R, et al. SoRec: Social recommendation using probabilistic matrix factorization[C] //Proc of the 17th ACM Conf on Information and Knowledge Management (CIKM’08). New York: ACM, 2008: 931-940
[3] Ma Hao, King I, Lyu M R. Learning to recommend with social trust ensemble[C] //Proc of the 32nd Int ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR’09). New York: ACM, 2009: 203-210
[4] Jamali M, Ester M. A matrix factorization technique with trust propagation for recommendation in social networks[C] //Proc of the 4th ACM Conf on Recommender Systems (RecSys’10). New York: ACM, 2010: 135-142
[5] Yang Bo, Lei Yu, Liu Dayou, et al. Social collaborative filtering by trust[C] //Proc of the 23rd Int Joint Conf on Artificial Intelligence (IJCAI’13). Menlo Park, CA: AAAI, 2013: 2747-2753
[6] Guo Guibing, Zhang Jie, Yorke-Smith N. TrustSVD: Collaborative filtering with both the explicit and implicit influence of user trust and of item ratings[C] //Proc of the 29th AAAI Conf on Artificial Intelligence (AAAI’15). Menlo Park, CA: AAAI, 2015: 123-129
[7] Page L, Brin S, Motwani R, et al. The PageRank citation ranking: Bringing order to the Web[R]. Stanford InfoLab. 1999 [2017-02-05]. http://ilpubs.stanford.edu:8090/422/1/1999-66.pdf
[8] Resnick P, Iacovou N, Suchak M, et al. GroupLens: An open architecture for collaborative filtering of netnews[C] //Proc of the 1994 ACM Conf on Computer Supported Cooperative Work. New York: ACM, 1994: 175-186
[9] Sarwar B, Karypis G, Konstan J, et al. Item-based collaborative filtering recommendation algorithms[C] //Proc of the 10th Int Conf on World Wide Web (WWW’01). New York: ACM, 2001: 285-295
[10] Linden G, Smith B, York J. Amazon. com recommenda-tions: Item-to-item collaborative filtering[J]. Internet Computing, 2003, 7(1): 76-80
[11] Breese J S, Heckerman D, Kadie C. Empirical analysis of predictive algorithms for collaborative filtering[C] //Proc of the 14th Conf on Uncertainty in Artificial Intelligence (UAI’98). San Francisco, CA: Morgan Kaufmann, 1998: 43-52
[12] Ungar L H, Foster D P. Clustering methods for collaborative filtering[C] //Proc of the AAAI Workshop on Recommendation Systems. Menlo Park, CA: AAAI, 1998, 1: 114-129
[13] Xue GuiRong, Lin Chenxi, Yang Qiang, et al. Scalable collaborative filtering using cluster-based smoothing[C] //Proc of the 28th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR’05). New York: ACM, 2005: 114-121
[14] Yu Yonghong, Wang Can, Gao Yang, et al. A coupled clustering approach for items recommendation[C] //Proc of the 17th Pacific-Asia Conf on Knowledge Discovery and Data Mining (PAKDD’13). Berlin: Springer, 2013: 365-376
[15] Hofmann T. Latent semantic models for collaborative filtering[J]. ACM Trans on Information Systems, 2004, 22(1): 89-115
[16] Hofmann T. Collaborative filtering via Gaussian probabilistic latent semantic analysis[C] //Proc of the 26th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR’03). New York: ACM, 2003: 259-266
[17] Sarwar B, Karypis G, Konstan J, et al. Analysis of recommendation algorithms for e-commerce[C] //Proc of the 2nd ACM Conf on Electronic Commerce. New York: ACM, 2000: 158-167
[18] Wang Hao, Wang Naiyan, Yeung Dit-Yan. Collaborative deep learning for recommender systems[C] //Proc of the 21st ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining (KDD’15). New York: ACM, 2015: 1235-1244
[19] Li Sheng, Kawale J, Fu Yun. Deep collaborative filtering via marginalized denoising auto-encoder[C] //Proc of the 24th ACM Int on Conf on Information and Knowledge Management (CIKM’15). New York: ACM, 2015: 811-820
[20] Liang Huizhi, Baldwin T. A probabilistic rating auto-encoder for personalized recommender systems[C] //Proc of the 24th ACM Int Conf on Information and Knowledge Management (CIKM’15). New York: ACM, 2015: 1863-1866
[21] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009,42(8): 30-37
[22] Koren Y. Factorization meets the neighborhood: A multifaceted collaborative filtering model[C] //Proc of the 14th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining (KDD’08). New York: ACM, 2008: 426-434
[23] Lee D D, Seung H S. Learning the parts of objects by non-negative matrix factorization[J]. Nature, 1999, 401(6755): 788-791
[24] Weimer M, Karatzoglou A, Le Q V, et al. Maximum margin matrix factorization for collaborative ranking[C] //Proc of the 21st Annual Conf on Neural Information Processing Systems (NIPS’07). New York: Curran Associates, 2007: 1-8
[25] Mnih A, Salakhutdinov R. Probabilistic matrix factorization[C] //Proc of the 21st Annual Conf on Neural Information Processing Systems (NIPS’07). New York: Curran Associates, 2007: 1257-1264
[26] Yu Kai, Zhu Shenghuo, Lafferty J, et al. Fast nonparametric matrix factorization for large-scale collaborative filtering[C] //Proc of the 32nd Int ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR’09). New York: ACM, 2009: 211-218
[27] McPherson M, Smith-Lovin L, Cook J M. Birds of a feather: Homophily in social networks[J]. Annual Review of Sociology, 2001,27: 415-444
[28] Marsden P V, Friedkin N E. Network studies of social influence[J]. Sociological Methods & Research, 1993, 22(1): 127-151
[29] Guo Hongyi, Liu Gongshen, Su Bo, et al. Collaborative filtering recommendation algorithm combining community structure and interest clusters[J]. Journal of Computer Research and Development, 2016, 53(8): 1664-1672 (in Chinese)
(郭弘毅, 劉功申, 蘇波, 等. 融合社區(qū)結(jié)構(gòu)和興趣聚類的協(xié)同過濾推薦算法[J]. 計(jì)算機(jī)研究與發(fā)展, 2016, 53(8): 1664-1672)
[30] Yang Xiwang, Steck H, Liu Yong. Circle-based recommendation in online social networks[C] //Proc of the 18th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining (KDD’12). New York: ACM, 2012: 1267-1275
[31] Tang Jiliang, Hu Xia, Gao Huiji, et al. Exploiting local and global social context for recommendation[C] //Proc of the 23rd Int Joint Conf on Artificial Intelligence (IJCAI’13). Menlo Park, CA: AAAI, 2013: 2712-2718
[32] Kleinberg J M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM, 1999, 46(5): 604-632
[33] Pan Rong, Zhou Yunhong, Cao Bin, et al. One-class collaborative filtering[C] //Proc of the 8th IEEE Int Conf on Data Mining (ICDM’08). Los Alamitos, CA: IEEE Computer Society, 2008: 502-511
[34] Hu Yifan, Koren Y, Volinsky C. Collaborative filtering for implicit feedback datasets[C] //Proc of the 8th IEEE Int Conf on Data Mining (ICDM’08). Los Alamitos, CA: IEEE Computer Society, 2008: 263-272
[35] Zhao Tong, McAuley J, King I. Leveraging social connections to improve personalized ranking for collaborative filtering[C] //Proc of the 23rd ACM Conf on Information and Knowledge Management (CIKM’14). New York: ACM, 2014: 261-270