鄭修猛,陳福才,吳奇,朱宇航,黃瑞陽
(國家數(shù)字交換系統(tǒng)工程技術(shù)研究中心,450002,鄭州)
?
一種利用多群組智慧的協(xié)同推薦算法
鄭修猛,陳福才,吳奇,朱宇航,黃瑞陽
(國家數(shù)字交換系統(tǒng)工程技術(shù)研究中心,450002,鄭州)
針對當(dāng)前基于社會網(wǎng)絡(luò)的推薦系統(tǒng)大多數(shù)采用一般的啟發(fā)式方法,存在節(jié)點復(fù)雜路徑選擇和信任弱傳遞現(xiàn)象導(dǎo)致推薦精確度不高的問題,以及針對推薦系統(tǒng)固有的冷啟動問題,提出了一種利用多群組智慧的協(xié)同推薦算法。該算法首先根據(jù)用戶的社會屬性和社會信任關(guān)系信息進(jìn)行群組劃分,將用戶分為多個不同的群組;然后分析群組中用戶的社會活動和社會關(guān)系等,建立一種利用多群組的評分預(yù)測模型,并利用群組評分預(yù)測新用戶的評分。該算法通過對社會網(wǎng)絡(luò)進(jìn)行深層次的群組挖掘,利用多群組智慧可以有效提高推薦效果,利用群組評分可改善對冷啟動用戶的推薦。仿真實驗表明,該算法相比傳統(tǒng)的協(xié)同推薦算法在效果評分上提高了約0.2,相比其他社會化推薦算法進(jìn)一步提高了約0.02,并有效解決了冷啟動問題。
協(xié)同推薦;社會網(wǎng)絡(luò);群組智慧;冷啟動
傳統(tǒng)的協(xié)同過濾推薦系統(tǒng)普遍存在推薦精確度不高和冷啟動問題。將社會網(wǎng)絡(luò)中的人與人之間的信任關(guān)系應(yīng)用到推薦系統(tǒng)中使得推薦結(jié)果更加真實,能夠提高推薦的精確度和緩解冷啟動問題。
在相關(guān)研究中,研究者通過納入社會化上下文信息等,提出了社會化推薦算法[1]。其中在傳統(tǒng)的協(xié)同推薦算法基礎(chǔ)上,結(jié)合社會網(wǎng)絡(luò)中的社會信任關(guān)系,研究者提出了基于信任的推薦算法[2]。早期的研究大數(shù)集中在信任網(wǎng)絡(luò)中的信任搜索策略和信任傳遞等方面,相繼出現(xiàn)了Tidal Trust算法[3]、Mole Trust算法[4]和Trust Walker算法[5]等推薦算法,但是這些算法存在復(fù)雜路徑選擇和信任弱傳遞等問題。后來,研究者們將矩陣分解模型引入到基于信任的推薦系統(tǒng)中,出現(xiàn)了Social MF算法[6]、Trust MF算法[7]等推薦算法,但是此類研究大多數(shù)從用戶或者資源對象的角度進(jìn)行,卻很少基于社會網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)來對推薦進(jìn)行分析。隨著社會化網(wǎng)絡(luò)理論的成熟,基于社會網(wǎng)絡(luò)的社團(tuán)發(fā)現(xiàn)技術(shù)開始在傳統(tǒng)的協(xié)同推薦算法中使用。在相關(guān)研究中,文獻(xiàn)[8]通過用戶聚類手段等,刪除群組外一些不活躍用戶,降低了待分析用戶的規(guī)模,但是對于邊緣冷啟動用戶的推薦問題無法解決;Liu等人通過將對社會網(wǎng)絡(luò)中的特征向量加權(quán)來促進(jìn)群組的貢獻(xiàn),并在社團(tuán)中進(jìn)行用戶評分的規(guī)范化處理[9];Li Yu等通過社團(tuán)特征預(yù)測用戶的偏好,然后對用戶-項目矩陣進(jìn)行填充等[10]。但是,以上基于群組發(fā)現(xiàn)的推薦算法均未考慮網(wǎng)絡(luò)中的節(jié)點同時屬于多個群組的情況。在真實的社會網(wǎng)絡(luò)里,1個用戶可以屬于多個不同類型的群組,同時這些群組大部分是重疊的(如圖1所示)。用戶在不同群組中的歸屬度是不同的,反過來不同社會群組又對特定的個體在項目的選擇上也會產(chǎn)生不同的影響。
圖1 重疊群組示例圖
因此,本文考慮用戶的多群組現(xiàn)象,在社會群組推薦系統(tǒng)的基礎(chǔ)上,通過引入社團(tuán)發(fā)現(xiàn)中的層疊社團(tuán)理論和社會計算中的群體智慧相關(guān)概念,提出了利用多群組智慧的協(xié)同推薦算法(MGICF)。本文基于用戶的社會屬性、社會行為和社會信任網(wǎng)絡(luò)等,采用2種不同的群組劃分策略產(chǎn)生多個聚合的模型,結(jié)合群組中用戶偏好信息,建立預(yù)測模型。與現(xiàn)有方法相比,本文方法可以有效提高推薦效果,利用群組評分可解決冷啟動問題。
1.1 社會群組描述
在推薦系統(tǒng)中,用戶集合為{u1,u2,…,un},項目集合為{I1,I2,…,Im},評分矩陣為R,R中元素Ruj代表用戶u對項目j的評分,取值范圍為[1,5]。本文將用戶分成不同的群組{G1,G2,…,GN},群組中的用戶社會網(wǎng)絡(luò)關(guān)系數(shù)據(jù)可用圖模型表示,每個點表示1個用戶,每條邊表示用戶之間的社會關(guān)系,目標(biāo)用戶和群組中的鄰居用戶關(guān)系示意圖如圖2所示。圖2中群組中的某個用戶u1屬于N個不同的群組,在群組G1中有6個用戶,其他5個用戶和u1之間存在著必然的社會聯(lián)系,本文用S(u,v)表示群組中用戶u和用戶v之間的社會關(guān)系。
圖2 目標(biāo)用戶和群組中的鄰居用戶關(guān)系示意圖
1.2 群組中社會關(guān)系定義
群組中用戶之間的社會關(guān)系可以是真實的社會網(wǎng)絡(luò)關(guān)系,也可以用用戶共同參與的社會活動等表示。因此,本文定義了群組中的3種社會關(guān)系。
定義1 將用戶是否存在共同評分定義為第1種社會關(guān)系,用SC表示。若群組中的用戶u、v之間有共同評分時,SC(u,v)=1,反之SC(u,v)=0,SC是對稱無向的。
定義2 將用戶在真實的社會網(wǎng)絡(luò)中的社會信任關(guān)系定義為第2種社會關(guān)系,用ST表示。若群組中用戶u信任用戶v,則ST(u,v)=1;若用戶v對用戶u不存在信任關(guān)系則ST(u,v)=0,ST是有向的。
定義3 將用戶之間的評分相似度定義為第3種社會關(guān)系,用SS表示。SS(u,v)=sim(u,v),SS是無向的。傳統(tǒng)協(xié)同推薦算法通過修正的余弦相似度計算用戶之間的評分相似度,如下式所示
sim(u,v)=
(1)
1.3 群組中社會關(guān)系分析
一般認(rèn)為用戶在群組中的影響力越大,對群組的評分影響力越大。文獻(xiàn)[11]在分析真實信任關(guān)系數(shù)據(jù)集時得出:一個用戶的跟從者越少,其更容易選擇信任其所信任的用戶。因此,可以有這樣的解釋:如果其他用戶對用戶i信任度越大,表示用戶i具有更鮮明的偏好,不易受到群組中其他用戶和整個群組的影響。由群組中的3種社會關(guān)系,本文又定義了用戶信任度、群組歸屬度和群組貢獻(xiàn)度如下。
定義4 用戶信任度,表示群組中用戶在信任網(wǎng)絡(luò)中的重要程度,用DT表示。
定義5 群組歸屬度,表示用戶歸屬于不同群組的程度,用DB表示。
定義6 群組貢獻(xiàn)度,表示推薦系統(tǒng)中社會群組對用戶評分預(yù)測的貢獻(xiàn)程度,用DC表示。
用戶的信任度越大,用戶的偏好越明顯;用戶對群組的歸屬度越大,表明用戶對群組的信賴程度越大。因此,本文假定群組貢獻(xiàn)度與用戶的信任度成反比,與群組歸屬度是等價的,則群組的貢獻(xiàn)度為
(2)
本文利用定義2的第2種社會關(guān)系,利用PageRank算法來計算用戶在群組中的信任度
(3)
式中:M為群組中的所有用戶數(shù);n為信任u的用戶的總數(shù);C(DT(i))代表i信任用戶數(shù);d為損失參數(shù),據(jù)經(jīng)驗?zāi)J(rèn)為d=0.85。
于是,本文定義群組的貢獻(xiàn)度為
(4)
式中:DT(u)為用戶u在群組中的信任度。例如,當(dāng)用戶在群組信任度為1時,表示用戶偏好明確,群組對其貢獻(xiàn)度為0,當(dāng)用戶與其他用戶不存在社會關(guān)系時,信任度為0,該用戶的評分可設(shè)定為群組評分,因此群組對其影響為100%。點(0,1)和(1,0)代入求解α和β。擬合曲線如圖3所示。
圖3 群組貢獻(xiàn)度和用戶信任度反比例關(guān)系擬合曲線
2.1 社會群組劃分策略
本文根據(jù)用戶的顯性特征和隱性特征分別對用戶群組進(jìn)行劃分,提出了2種社會群組劃分策略:基于人口統(tǒng)計的群組劃分策略和基于信任矩陣分解的群組劃分策略。
(1)基于人口統(tǒng)計的群組劃分策略。在MovieLens數(shù)據(jù)集中除了包含用戶-項目的評分信息,還有用戶屬性信息(年齡、性別和職業(yè)等),以此對用戶進(jìn)行群組劃分,這是一種最為簡便的劃分策略。一般具有相同屬性的用戶興趣愛好越相似,比如女性觀眾對韓劇的喜好程度比男性高,男性更熱衷于電子產(chǎn)品。利用用戶的社會屬性進(jìn)行群組劃分,1個用戶具有多個社會屬性,用戶會同時被劃分到多個群組中。用戶群組中與其他用戶又發(fā)生必然的社會關(guān)系,通過分析群組中的用戶之間的關(guān)系,建立多群組預(yù)測模型。
(2)基于信任矩陣分解的群組劃分策略。在Ciaos和Epinions數(shù)據(jù)集中不但包含了評分信息,還包含已有的社會信任關(guān)系信息。用戶之間的社會信任關(guān)系構(gòu)成的連接矩陣是規(guī)模比較大的非負(fù)矩陣。針對復(fù)雜網(wǎng)絡(luò)中的社團(tuán)發(fā)現(xiàn)算法有很多,目前代表性的算法有GN算法[12]和Newman快速算法[13]等。但是,以上算法都是對網(wǎng)絡(luò)進(jìn)行單一的社團(tuán)劃分,網(wǎng)絡(luò)中的節(jié)點被劃分到多個完全獨立的社團(tuán)中,而在真實網(wǎng)絡(luò)中,1個節(jié)點很可能屬于多個不同的社團(tuán),根據(jù)社團(tuán)發(fā)現(xiàn)中重疊社團(tuán)相關(guān)理論,可以利用矩陣的特征向量來發(fā)現(xiàn)網(wǎng)絡(luò)社團(tuán)重疊結(jié)構(gòu)。因此,本文采用文獻(xiàn)[14]中非負(fù)矩陣分解的方法對用戶進(jìn)行群組劃分。
假設(shè)擁有n個節(jié)點的信任網(wǎng)絡(luò)的鄰接矩陣為A∈Rn×n,則非負(fù)矩陣分解方法的策略為:通過尋找最大近似原始網(wǎng)絡(luò)數(shù)據(jù)A的2個低秩因子矩陣W和H來實現(xiàn)社區(qū)發(fā)現(xiàn)。分解后得到的基向量矩陣W表示網(wǎng)絡(luò)降維后的群組特征,具有稀疏性和線性無關(guān)性,而歸屬矩陣H則表示相應(yīng)節(jié)點與群組的隸屬程度。于是,就把用戶劃分為K個不同的群組,歸屬矩陣H可以轉(zhuǎn)換為用戶的群組的歸屬度Ubelong。在非負(fù)矩陣分解過程中,一般采用歐幾里德距離最小化方式,優(yōu)化的目標(biāo)函數(shù)O(E)為
s.t.W≥0,H≥0
(5)
式中:‖·‖F(xiàn)為Frobenius范數(shù),用來度量目標(biāo)函數(shù)的逼近程度;W∈Rn×K和H∈RK×n分別是分解之后得到的關(guān)于模式節(jié)點的基矩陣和歸屬矩陣,n表示網(wǎng)絡(luò)中的節(jié)點個數(shù),K表示相關(guān)模式節(jié)點子空間的聚類個數(shù),反映了信任網(wǎng)絡(luò)中存在的群組的個數(shù)。
2.2 利用多群組的目標(biāo)用戶評分預(yù)測
在對目標(biāo)用戶u進(jìn)行評分預(yù)測時,本文在傳統(tǒng)的基于用戶的協(xié)同推薦算法的基礎(chǔ)上,考慮群組內(nèi)相鄰用戶的影響以及群組對用戶貢獻(xiàn)度,通過加權(quán)求和預(yù)測用戶的評分
(6)
2.3 新用戶的評分預(yù)測問題
當(dāng)用戶的鄰居用戶過少或者為新用戶時,本文利用群組推薦系統(tǒng)的相關(guān)理論,為新用戶進(jìn)行評分預(yù)測。群組推薦系統(tǒng)從為特定用戶的個性化推薦擴(kuò)展到為整個群組的推薦,當(dāng)然群組推薦系統(tǒng)不僅可以為群組推薦,也可以為單個用戶推薦,并能解決多準(zhǔn)則推薦問題和新用戶引起的冷啟動問題[15]。在群組推薦系統(tǒng)研究中,研究者們提出了多種不同的評分策略,如平均滿意度、最小失望度、最大滿意度等合并特定用戶的推薦列表,使推薦結(jié)果讓群組中的所有人一致滿意。
本文考慮群組評分對用戶評分預(yù)測的影響,設(shè)GR(n,i)為群組n的群組評分,當(dāng)用戶u為新用戶或者鄰居用戶數(shù)小于k時,可以根據(jù)用戶u的所屬社會群組評分GR(n,i)代替式(6)基于鄰居相似度的評分
(7)
基于社會群組推薦算法的目標(biāo)是使群組評分盡最大可能擬合群組所有成員的偏好,群組圖中節(jié)點的鏈接數(shù)越多,表示用戶在群組的權(quán)重越高,對群組評分時的影響就越大。因此,本文提出基于用戶權(quán)重的群組評分策略。
首先通過用戶之間的第1種社會關(guān)系,可以計算用戶u在群組評分時中的權(quán)重
(8)
式(8)中,M表示群組G中所有用戶的數(shù)量,通過計算用戶u存在的社會關(guān)系與群組G中所有社會關(guān)系的比值,可得群組的最終評分為
(9)
基于人口統(tǒng)計學(xué)的群組劃分偽代碼程序如下。
輸入 用戶屬性信息UA(a1,a2,…,an)、評分Rui、信任T。
(1) forj←1 tondo
(2)GRj←predict(W(u),Ruj)
(3) end
(4) foru←1 tondo
(5)DT(u)←PageRank(DT(i))
(6) end
基于非負(fù)矩陣分解的群組劃分偽代碼如下。
輸入 用戶屬性信息UA(a1,a2,…,an)、評分Rui、信任T。
(2)forj←1tondo
(3) GRj←predict(W(u),Ruj);
(4)end
(5)foru←1tondo
(6) DC(k)=DB(k)
(7)end
2.4 算法復(fù)雜度分析
按照本文設(shè)計的2種群組劃分策略計算基于多群組智慧的協(xié)同推薦算法的復(fù)雜度?;谌丝诮y(tǒng)計的群組劃分策略,用戶節(jié)點為n,用戶的社會屬性有g(shù)種,需要劃分為g個群組,但主要仍是計算兩兩用戶之間的相似度,計算復(fù)雜度為O(n2)。在不同群組的貢獻(xiàn)度求解時,還需要計算用戶的信任度,在每個群組中構(gòu)建的隱性信任矩陣上進(jìn)行PageRank算法的計算復(fù)雜度也約為O(n2),因此算法的復(fù)雜度為O(n2)。當(dāng)然,用戶的信任度也可以離線計算。基于信任矩陣分解的群組劃分策略中,除了需要計算兩兩用戶之間的相似度,還需要對信任矩陣進(jìn)行分解,其中信任關(guān)系圖中邊數(shù)為m,非負(fù)矩陣分解的算法復(fù)雜度除了矩陣乘法運算之外,還取決于迭代次數(shù)l,其算法復(fù)雜度約為O(lmk2),綜合兩者,算法的復(fù)雜度為O(n2)+O(lmK2)。
為了評估本文所提MGICF算法的推薦效果,采用推薦系統(tǒng)中常用的MovieLens、Ciaos和Epinions數(shù)據(jù)集進(jìn)行測試實驗,并與現(xiàn)有的推薦算法進(jìn)行對比實驗。
3.1 實驗數(shù)據(jù)介紹
MovieLens數(shù)據(jù)集中除了用戶項目評分信息外,還包含電影及用戶的屬性信息。在用戶屬性文檔中包括年齡、性別、職業(yè)等相關(guān)信息,在項目屬性文檔中包括電影的類型。在Ciaos和Epinions數(shù)據(jù)集中除了包含評分信息還包含用戶之間的信任關(guān)系。數(shù)據(jù)集統(tǒng)計情況如表1所示。
表1 實驗數(shù)據(jù)集節(jié)點數(shù)量和關(guān)系數(shù)量統(tǒng)計情況
3.2 算法評價指標(biāo)
在實驗過程中,可利用推薦系統(tǒng)中2個常用的誤差度量參數(shù)——平均絕對偏差MAE和均方根誤差RMSE,當(dāng)MAE或者RMSE越小時,表明預(yù)測結(jié)果越精確。因此,本文采用MAE和RMSE作為推薦性能評價指標(biāo),計算公式如下
(10)
(11)
3.3 實驗結(jié)果及分析
首先根據(jù)基于人口統(tǒng)計的群組劃分策略,在MovieLens數(shù)據(jù)集上進(jìn)行推薦算法的性能測試實驗。將傳統(tǒng)的基于用戶的推薦算法(User-based)、按照用戶社會屬性劃的為單一群組內(nèi)的協(xié)同推薦算法(Group by Gender,Group by Age,Group by Occupation)和多群組智慧的推薦算法MGICF(G1+G2+G3)的推薦效果進(jìn)行比較。
根據(jù)MovieLens數(shù)據(jù)集,首先按性別分為2個群組,男性為第1組,女性為第2組;年齡按照年齡段分為5個群組,將低于21年齡組設(shè)為第1組,將21到30年齡組設(shè)為第2組,將31到40年齡組設(shè)為第3組,將41到50年齡組設(shè)為第4組,將大于50年齡組設(shè)為第5組;按照職業(yè)細(xì)分為21個群組,這些職業(yè)分別為管理員、藝術(shù)家、醫(yī)生、教育家、工程師、藝人、經(jīng)理、按摩師、家庭主婦、律師、圖書管理員、市場投資者、農(nóng)民、程序員、退休人員、銷售員、科學(xué)家、學(xué)生、技術(shù)員、作家、其他,將這些職業(yè)按照1至21進(jìn)行分組,劃分后群組中用戶數(shù)統(tǒng)計分布圖如圖4所示。
由于MovieLens數(shù)據(jù)集中不包含用戶之間的直接信任關(guān)系,實驗過程中需要重新定義用戶之間的隱性信任關(guān)系。假設(shè)用戶a和用戶b存在共同的評分,則a和b之間存在信任關(guān)系;否則a和b不存在信任關(guān)系。其中,當(dāng)用戶a評論過的項目數(shù)大于或等于用戶b評論過的項目數(shù),b對a的信任值為1;反之,則a對b的信任值為0。用戶之間的隱性信任關(guān)系如下
(12)
(a)性別群組統(tǒng)計 (b)年齡段群組統(tǒng)計
(c)職業(yè)群組統(tǒng)計圖4 不同群組數(shù)據(jù)統(tǒng)計
在每個群組中利用PageRank算法進(jìn)行用戶信任度DT(u)計算,然后計算群組對用戶的評分預(yù)測過程中的貢獻(xiàn)度DC(n)。
圖5為多群組智慧推薦算法與其他幾種算法的比較。由圖5實驗結(jié)果得知,基于人口統(tǒng)計的群組劃分策略,可以在一定程度上提高推薦系統(tǒng)的準(zhǔn)確度,但整體結(jié)果并不是十分明顯。分析原因如下:①由于在社會屬性劃分時,用戶的顯性社會特征捕捉不全面,加上現(xiàn)有數(shù)據(jù)集的局限性,可利用的社會屬性僅有3種;②由于在用戶的評分過程,用戶的性別、年齡、職業(yè)等特征一定程度上已經(jīng)反映在評分結(jié)果中。
圖5 基于用戶、單一群組和多群組智慧的 推薦算法效果比較
根據(jù)第2種基于信任矩陣分解的群組劃分策略,分別在Ciaos和Epinions數(shù)據(jù)集上進(jìn)行測試。將本文算法的測試結(jié)果與傳統(tǒng)的基于近鄰用戶的協(xié)同推薦算法UserKNN、基本的矩陣分解算法BiasedMF以及2種基于信任矩陣分解算法SocialMF和TrustMF進(jìn)行比較,如表2所示。
表2 5種不同算法在2個數(shù)據(jù)集上的實驗結(jié)果對比
在此之前,需要提前對群組個數(shù)K參數(shù)進(jìn)行預(yù)估計,也就是非負(fù)矩陣分解迭代運算中H矩陣行數(shù),這里采用的譜分析的方法。由第1種社會關(guān)系構(gòu)成鄰接矩陣,將鄰接矩陣作為基矩陣進(jìn)行估計,社團(tuán)數(shù)可以由該鄰接矩陣帶的譜分析進(jìn)行預(yù)估計,本文進(jìn)行相關(guān)實驗后將K取值10。
圖6為本文MGICF算法與現(xiàn)有幾種算法的對比。由圖6實驗結(jié)果可知,基于多群組智慧的推薦效果在Ciao和Epinions數(shù)據(jù)集上均得到一些提升,相比傳統(tǒng)的基于鄰居用戶的協(xié)同推薦算法,提升最為明顯。但可能由于用戶之間的信任關(guān)系數(shù)據(jù)依然存在稀疏性和弱社區(qū)效應(yīng)問題,相比其他基于信任推薦算法,效果有所提升,但是幅度不是十分明顯。不同數(shù)據(jù)集上提升效果對比,在Ciaos數(shù)據(jù)集上面比Epinions數(shù)據(jù)集上面的效果更為明顯,這是由于不同數(shù)據(jù)集中的信任關(guān)系強(qiáng)度和邊數(shù)不同。
圖6 本文MGICF與現(xiàn)有算法比較
綜上,本文利用多群組智慧的協(xié)同推薦算法有如下優(yōu)點:①可以根據(jù)多重標(biāo)準(zhǔn)進(jìn)行聚合,避免了傳統(tǒng)協(xié)同推薦系統(tǒng)中默認(rèn)單一群組,利用不同的興趣群組協(xié)同進(jìn)行目標(biāo)用戶評分預(yù)測,提高預(yù)測精確度;②利用群組評分對新用戶的評分預(yù)測,解決了推薦系統(tǒng)的冷啟動問題;③多群組智慧非常類似于并行化處理思想,為后續(xù)的并行化算法提供借鑒。
本文提出了一種利用多群組智慧的協(xié)同推薦算法,以及基于人口統(tǒng)計和基于信任矩陣分解的2種群組劃分策略。本文算法通過將用戶劃分在不同的群組中,分析群組中的社會關(guān)系進(jìn)行綜合評分,能有效提高推薦精確度。此外,考慮群組評分,可以解決對冷啟動用戶進(jìn)行推薦的問題。本文提出的多群組智慧的推薦算法均是基于用戶群組的,并未考慮項目也可以屬于多群組現(xiàn)象;并且隨著時間變化用戶興趣和群組結(jié)構(gòu)都會發(fā)生變化,考慮時間因素的影響也是下一步的研究方向。
[1] 孟祥武, 劉樹棟, 張玉潔, 等. 社會化推薦系統(tǒng)研究 [J]. 軟件學(xué)報, 2015, 26(6): 1356-1372. MENG Xiangwu, LIU Shudong, ZHANG Yujie. Research on social recommender systems [J]. Journal of Software, 2015, 26(6): 1356-1372.
[2] MASSA P, BHATTACHARJEE B. Using trust in recommender systems: an experimental analysis [C]∥ Proceedings of the 2nd International Conference on Trust Management. Berlin, Germany: Springer-Verlag, 2004, : 221-235.
[3] GOLBECK J. Personalizing applications through integration of inferred trust values in semantic web-based social networks [C]∥ Proceedings of Workshop on Semantic Network Analysis. Tilburg, Netherlands: Sun SITE Central Europe CEUR-WS, 2005: 1`5-28.
[4] MASSA P, AVESANI P. Trust metrics on controversial users: balancing between tyranny of the majority and echo chambers [J]. Semantic Web and International System, 2007, 3(1): 39-64.
[5] JAMALI M, ESTER M. Trustwalker: a random walk model for combining trust-based and item-based recommendation [C]∥Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2009: 397-406.
[6] YANG B, LEI Y, LIU D, et al. Social collaborative filtering by trust [C]∥Proceedings of the Twenty-Third International Joint Conference on Artificial Intelligence.Washington, D.C., USA: IJCAI, 2013: 2747 -2753.
[7] JAMALI M, ESTER M. A matrix factorization technique with trust propagation for recommendation in social networks [C]∥Proceedings of the Fourth ACM Conference on Recommender Systems. New York, USA: ACM, 2010: 135-142.
[8] LING Y, GUO D, FEI C, et al. User-based clustering with top-n recommendation on cold-start problem [C]∥2013 Third International Conference on Intelligent System Design and Engineering Applications. Piscataway, NJ, USA: IEEE, 2013: 1585-1589.
[9] 劉繼, 鄧貴仕. 基于加權(quán)譜分析的用戶網(wǎng)絡(luò)社團(tuán)協(xié)作推薦方法 [J]. 大連理工大學(xué)學(xué)報, 2010, 50(3): 438-443. LIU J, DENG Gui-shi. A collaborative recommendation method based on user network community with weighted spectral analysis [J]. Journal of Dalian University of Technology, 2010, 50(3): 438-443.
[10]YU L. Using ontology to enhance collaborative recommendation based on community [C]∥ Proceedings of the 9th International Conference on Web-Age Information Management. Piscataway, NJ, USA: IEEE, 2008: 45-49.
[11]TANG J, GAO H, LIU H. Mtrust: discerning multi-faceted trust in a connected world [C]∥Proceedings of the Fifth ACM International Conference on Web Search and Data Mining. New York, USA: ACM, 2012: 93-102.
[12]GIRVAN M, NEWMAN M E J. Community structure in social and biological networks [J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12): 7821-7826.
[13]NEWMAN M E. Fast algorithm for detecting community structure in networks [J]. Physical Review: E Statistical Nonlinear & Soft Matter Physics, 2004, 69(6): 066133.
[14]常振超, 陳鴻昶, 劉陽, 等. 基于聯(lián)合矩陣分解的節(jié)點多屬性網(wǎng)絡(luò)社團(tuán)檢測 [J]. 物理學(xué)報, 2015, 64(21): 218901. CHANG Zhenchao, CHEN Hongchang, LIU Yang, et al. Community detection based on joint matrix factorization in networks with node attributes [J]. Acta Physica Sinica, 2015, 64(21): 218901.
[15]MASTHOFF J. Group recommender systems: combining individual models [M]∥RICCI F, ROKACH L, SHAPIRA B, et al. Recommender Systems Handbook. Berlin, Germany: Springer-Verlag, 2011: 677-702.
(編輯 劉楊)
A Collaborative Filtering Recommendation Algorithm Using Multiple Groups Intelligence
ZHENG Xiumeng,CHEN Fucai,WU Qi,ZHU Yuhang,HUANG Ruiyang
(National Digital Switching System Engineering & Technological R&D Center, Zhengzhou 450002, China)
A collaborative filtering recommendation algorithm using the multiple groups intelligence is proposed to address the problems that most of the current recommendation systems that are based-on social networks use the general heuristic methods and have drawbacks of choice of complex paths and weak transferring of trust phenomenon which leads to low recommendation precision, and there exists the inherent cold start problem in recommendation systems. The proposed algorithm divides users into several different groups from their social attribution and social trust relationship information Then predictive models are built based on multi-group through analyzing the user’s social activities and social relationships in the groups and the evaluated group scores are used to predict ratings of new users The algorithm uses a deep group mining in a social network, the multi group intelligence to effectively improve the effect of the recommendation, and the evaluated group score to improve the recommendation of the cold start users. Simulation results and comparisons with the traditional collaborative recommendation algorithm and other social recommendation algorithms show that the recommendation effects of the proposed algorithm improve by about 0.2 and 0.22, respectively, and that the problem of cold start is effectively solved.
collaborative filtering recommendation; social network; group intelligence; cold start
2016-01-13。
鄭修猛(1989—),男,碩士生;陳福才(通信作者),男,研究員。
國家自然科學(xué)基金資助項目(61171108);國家重點基礎(chǔ)研究發(fā)展計劃資助項目(2012CB315901,2012CB315905);國家科技支撐計劃資助項目(2014BAH30B01)。
時間:2016-07-22
http:∥www.cnki.net/kcms/detail/61.1069.T.20160722.1953.004.html
10.7652/xjtuxb201610018
TN311.1
A
0253-987X(2016)10-0118-07