原福永,馬 琳,梁順攀
(燕山大學(xué)信息科學(xué)與工程學(xué)院,河北秦皇島066004)
融合用戶相似度和信任傳播重組信任矩陣算法
原福永*,馬 琳,梁順攀
(燕山大學(xué)信息科學(xué)與工程學(xué)院,河北秦皇島066004)
針對(duì)協(xié)同過(guò)濾面臨的一些本質(zhì)問(wèn)題,如數(shù)據(jù)稀疏和冷啟動(dòng),本文提出了融合用戶相似度和加權(quán)的信任傳播來(lái)重組信任矩陣的方法。首先,將原始信任矩陣中用戶相似度低于某一閾值的信任關(guān)系去掉;其次,將評(píng)分矩陣中用戶相似度高于某一閾值的用戶對(duì)添加到信任矩陣中;最后,考慮加權(quán)的信任傳播,以此找到更多的信任鄰居并對(duì)不同距離的信任鄰居進(jìn)行區(qū)分。在Epinions和FilmTrust數(shù)據(jù)集上進(jìn)行的對(duì)比實(shí)驗(yàn)結(jié)果表明,重組信任矩陣的方法能夠有效地提高推薦精度,并在一定程度上解決了冷啟動(dòng)問(wèn)題。
協(xié)同過(guò)濾;用戶相似度;加權(quán)的信任傳播;重組信任矩陣
Web 2.0的迅猛發(fā)展極大地改善了用戶線上行為,從瀏覽、搜索到交互、共享[1]。協(xié)同過(guò)濾方法是推薦系統(tǒng)中使用最廣泛、應(yīng)用最成功的方法之一[2]。一般來(lái)說(shuō),協(xié)同過(guò)濾方法可以分為兩大類:基于模型的方法(model-based)和基于內(nèi)存的方法(memory-based)。在基于模型的方法中,使用最廣泛的是矩陣分解,如SVD[3]、NNMF[4]及張量分解[5]。但是,基于模型的方法不能對(duì)如何產(chǎn)生推薦進(jìn)行合理的解釋,并且由于訓(xùn)練得出的模型是靜態(tài)的,因此也不能有效地利用新的評(píng)分?jǐn)?shù)據(jù)。所以本文針對(duì)基于內(nèi)存的協(xié)同過(guò)濾方法進(jìn)行改進(jìn)。
協(xié)同過(guò)濾面臨著數(shù)據(jù)稀疏和冷啟動(dòng)等一些本質(zhì)問(wèn)題。數(shù)據(jù)稀疏是由于用戶只評(píng)論少量的項(xiàng)目從而很難有效地找到可信的相似用戶。冷啟動(dòng)包括兩方面的問(wèn)題:1)怎樣向從沒(méi)有做出過(guò)任何評(píng)價(jià)的新用戶進(jìn)行推薦;2)怎樣處理從來(lái)沒(méi)有評(píng)論過(guò)的項(xiàng)目。為了解決這些問(wèn)題,一些額外信息融入了協(xié)同過(guò)濾中,如friendship[6]、membership[7]和信任[8]等,其中信任比f(wàn)riendship和membership更可靠。
Jamali等人提出了TrustWalker方法[9],該方法在信任矩陣中隨機(jī)選取信任鄰居,將信任與基于項(xiàng)目的評(píng)分預(yù)測(cè)方法相結(jié)合。與之不同的是,本文方法是將信任與基于用戶的評(píng)分預(yù)測(cè)方法結(jié)合以此產(chǎn)生推薦。Massa等人提出了MoleTrust算法[10],考慮信任傳播并通過(guò)深度優(yōu)先搜索方法來(lái)找到更多的信任鄰居。實(shí)驗(yàn)結(jié)果表明隨著信任傳播長(zhǎng)度增大,覆蓋率增大了,但是預(yù)測(cè)精度變化很小。最近Deng等人提出了RelevantTrustWalker方法[11],首先使用矩陣分解方法來(lái)獲取社交網(wǎng)絡(luò)中信任用戶之間的信任度。其次,提出了一個(gè)可擴(kuò)展的隨機(jī)游走算法來(lái)獲取推薦結(jié)果。Guo等人提出了一種融合方法Mergex[12],該方法首先利用信任傳播擴(kuò)充信任矩陣,其次將擴(kuò)充后的信任、PCC計(jì)算的相似度以及信任用戶交集與并集的比例三部分作為權(quán)重對(duì)評(píng)分進(jìn)行加權(quán),最后利用CPCC計(jì)算新的評(píng)分矩陣中用戶的相似度來(lái)產(chǎn)生推薦。但是該方法使用的是整個(gè)信任矩陣,并沒(méi)有對(duì)信任矩陣進(jìn)行預(yù)處理。Ray等人提出了另外一種基于信任的方法[13],通過(guò)重組信任矩陣來(lái)提高評(píng)分預(yù)測(cè)精度。具體來(lái)說(shuō),如果用戶之間的相似度低于某一閾值,那么就要去掉這兩個(gè)用戶對(duì)應(yīng)的信任關(guān)系。但是從實(shí)驗(yàn)結(jié)果可以看出高質(zhì)量的預(yù)測(cè)結(jié)果是以犧牲覆蓋率為代價(jià)的,并且也不能很好地解決冷啟動(dòng)問(wèn)題。
針對(duì)以上問(wèn)題,本文提出了將用戶相似度與加權(quán)的信任傳播結(jié)合以此重組信任矩陣的算法。具體思路如下:1)由于信任矩陣中低相似度會(huì)降低推薦質(zhì)量,所以去掉信任矩陣中相似度低于某一閾值的信任關(guān)系;2)信任矩陣中相似度高的用戶會(huì)提高評(píng)分預(yù)測(cè)精度,所以如果兩個(gè)用戶之間的相似度高于某一閾值,那就將這兩個(gè)用戶對(duì)應(yīng)的信任關(guān)系添加到信任矩陣中;3)由于冷啟動(dòng)用戶不活躍且信任鄰居數(shù)量少,所以考慮信任傳播,以此找到更多的信任鄰居,但是由于信任值是二進(jìn)制的,不能對(duì)不同距離的信任用戶進(jìn)行區(qū)分,所以引入一個(gè)權(quán)重因子來(lái)評(píng)估不同距離的信任用戶的信任值。實(shí)驗(yàn)結(jié)果表明,本文方法能夠較精確的預(yù)測(cè)評(píng)分,并且有效的解決冷啟動(dòng)問(wèn)題。
在基于信任的系統(tǒng)中,大多數(shù)評(píng)分預(yù)測(cè)的方法都是使用全部信任矩陣中的數(shù)據(jù)。但是,用戶A信任用戶B并不代表A與B之間的相似度也很高,而信任矩陣中低相似度的信任用戶會(huì)對(duì)推薦結(jié)果造成一定的影響,因此本文提出了將相似度與信任結(jié)合來(lái)重組信任矩陣的方法。由于Pearson Correlation Coefficient(PCC)是協(xié)同過(guò)濾中使用較廣泛的方法且計(jì)算精度較高,所以選取PCC來(lái)計(jì)算用戶之間的相似度。它的定義如下:
定義1:PCC算法
對(duì)于給定的兩個(gè)用戶a和b,他們之間的PCC相似度用Sab來(lái)表示,定義如下所示:
其中,rai和rbi分別表示用戶a和b對(duì)項(xiàng)目i的評(píng)分,和分別代表用戶a和b對(duì)其評(píng)價(jià)的所有項(xiàng)目的平均評(píng)分,Iab表示用戶a和b的共評(píng)項(xiàng)目集合。Sab<0代表用戶a和b負(fù)相關(guān),Sab>0代表用戶a和b正相關(guān),Sab=0代表用戶a和b不相關(guān),負(fù)相關(guān)及不相關(guān)在實(shí)際計(jì)算中沒(méi)有意義,故只考慮正相關(guān)的情況。
在一個(gè)推薦系統(tǒng)中,評(píng)分矩陣表示為Rating,原始信任矩陣用Trust表示,tab代表用戶a和b的信任值。通常情況下,信任值是二進(jìn)制的,即0或1,其中0代表不信任,1代表信任。在重組信任矩陣時(shí),本文設(shè)置了兩個(gè)相似度閾值,分別為α和β。重組信任矩陣包括以下兩個(gè)步驟:首先,由于信任矩陣中相似度低的用戶會(huì)降低評(píng)分預(yù)測(cè)質(zhì)量,所以對(duì)于信任矩陣中的兩個(gè)用戶a和b,即tab為1,如果他們的相似度Sab<α,那么就去掉a與b之間的信任關(guān)系,即tab設(shè)置為0;若Sab>α,則保留a與b之間的信任關(guān)系。定義如下所示:
其次,由于信任矩陣中高相似度的用戶會(huì)提高推薦效果,所以對(duì)于不在信任矩陣中的兩個(gè)用戶a和b,即tab為0,如果他們之間的相似度Sab>β,那么在信任矩陣中添加a與b之間的信任關(guān)系,即tab設(shè)置為1;若Sab<β,則不添加a與b之間的信任關(guān)系。定義如下所示:
通過(guò)上述步驟,對(duì)信任矩陣完成了重組,重組后的信任矩陣用UpTrust表示。UpTrust中去掉了原始信任矩陣中相似度低的用戶信任關(guān)系,并將相似度高的用戶信任添加到了信任矩陣中。
根據(jù)以上算法思想,給出重組信任矩陣算法(Reconstructing Trust Matrix Algorithm RTXA)的描述,如下所示:
算法1:重組信任矩陣算法(RTXA)
Input:Rating,Trust,α,β
Output:UpTrust
1:For each user u
2: For each user ν
3: if tuν=1 and Suν<α
4:tuν=0
5:else if and tuν=1 Suν>α
6: tuν=1
7: else if tuν=0 and Suν>β
8:tuν=1
9:else if tuν=0 and Suν<β
10:tuν=0
11: End for
12:End for
13:Return UpTrust
2.1相關(guān)定義
圖1所示為信任網(wǎng)絡(luò)T,網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn)代表一個(gè)用戶,每一條有向邊對(duì)應(yīng)一條信任關(guān)系。在信任網(wǎng)絡(luò)中,每一個(gè)用戶u有一組直接信任鄰居ν∈{Nu|tuν≠0},信任值tuν為二進(jìn)制值,其中0代表完全不信任(圖中無(wú)有向邊的用戶),1代表完全信任(圖中有有向邊的用戶)。
圖1 信任網(wǎng)絡(luò)圖Fig.1 Trust network
定義2:信任傳播步長(zhǎng)d
設(shè)信任網(wǎng)絡(luò),T={u1,u2,…,un},在T中任意選取兩個(gè)用戶節(jié)點(diǎn)ui和uj,分別作為信任傳播的源用戶節(jié)點(diǎn)和目的用戶節(jié)點(diǎn),定義信任從源用戶節(jié)點(diǎn)傳播到目的用戶節(jié)點(diǎn)的最短距離為信任傳播步長(zhǎng)d。
冷啟動(dòng)用戶通常被定義為評(píng)價(jià)項(xiàng)目數(shù)不多于5個(gè)的用戶。由于冷啟動(dòng)用戶不活躍,他們的信任鄰居也不多,所以為冷啟動(dòng)用戶進(jìn)行項(xiàng)目推薦非常困難。但是,由于信任具有傳遞性,如果用戶A信任用戶B,并且用戶B信任用戶C,那么用戶A與用戶C之間也存在某種程度的信任。所以通過(guò)信任傳播找到更多的信任鄰居來(lái)解決冷啟動(dòng)問(wèn)題是一種非常有效的方法。MoleTrust方法就是一種用上述信任傳播方式來(lái)衡量信任關(guān)系的方法,但是由于重組的信任矩陣UpTrust仍然是二進(jìn)制的,所以使用MoleTrust方法計(jì)算得到的信任值也是二進(jìn)制的,這樣無(wú)法對(duì)不同距離的信任用戶進(jìn)行區(qū)分。為了解決這個(gè)問(wèn)題,本文采取一個(gè)權(quán)重因子來(lái)重新評(píng)估不同距離的信任用戶的信任值,定義如下:
其中,tuν表示使用MoleTrust方法得到的用戶u與 ν之間的信任值,d為信任傳播步長(zhǎng),表示加權(quán)后u與ν之間的信任值。顯然d越大,找到的信任鄰居越多,但同時(shí)內(nèi)存消耗也越大,且產(chǎn)生的噪音越多。因此,本文限制d的范圍為d≤3以降低計(jì)算的復(fù)雜度并防止無(wú)意義的搜索。使用加權(quán)的信任傳播后得到的信任矩陣即為UpTrust_d。
根據(jù)上述描述,加權(quán)的信任傳播算法(Weighted Trust Propagation Algorithm,WTPA)思想如下:
算法2:加權(quán)的信任傳播算法(WTPA)
Input:UpTrust
Output:UpTrust_d
1:For user u in UpTrust
2: For user ν in UpTrust
3: if duν≤3
6: End for
7:End for
8:Return UpTrust_d
3.1數(shù)據(jù)集
為了驗(yàn)證重組信任矩陣算法的有效性,本文將用兩個(gè)數(shù)據(jù)集進(jìn)行試驗(yàn)。分別是:
1)Epinions數(shù)據(jù)集。該數(shù)據(jù)集包括一個(gè)評(píng)分矩陣和一個(gè)信任矩陣,其中評(píng)分矩陣是49K個(gè)用戶對(duì)139K個(gè)項(xiàng)目的664K個(gè)評(píng)分,評(píng)分范圍是1~5,稀疏度為99.95%;信任矩陣包括478K個(gè)信任關(guān)系,信任值是二進(jìn)制的。
2)FilmTrust數(shù)據(jù)集。FilmTrust也包括評(píng)分矩陣和信任矩陣。評(píng)分矩陣包含1 986個(gè)用戶,2 071個(gè)電影以及35 497個(gè)評(píng)分,評(píng)分范圍為0.5~4.0,稀疏度為98.86%;信任矩陣,包含609個(gè)用戶的1 853個(gè)信任評(píng)分,信任值也是二進(jìn)制的。
實(shí)驗(yàn)時(shí),采用五折交叉驗(yàn)證法進(jìn)行試驗(yàn),即將數(shù)據(jù)集隨機(jī)劃分為5份,其中4份為訓(xùn)練集,余下的1份為測(cè)試集。5次實(shí)驗(yàn)得到結(jié)果的平均值即為實(shí)驗(yàn)結(jié)果。
3.2測(cè)量指標(biāo)
為了驗(yàn)證本文方法能否有效地提高評(píng)分預(yù)測(cè)精度以及解決冷啟動(dòng)問(wèn)題,實(shí)驗(yàn)選用平均絕對(duì)誤差MAE(Mean Absolute Error,MAE)、均方根誤差RMSE(Root Mean Squared Error,RMSE)及評(píng)分覆蓋率RC(Rating Coverage)來(lái)衡量實(shí)驗(yàn)結(jié)果。MAE和RMSE用于測(cè)量預(yù)測(cè)評(píng)分與真實(shí)評(píng)分的接近程度,預(yù)測(cè)評(píng)分與真實(shí)評(píng)分越接近,MAE和RMSE的值越低;RC用于測(cè)量可以預(yù)測(cè)出的評(píng)分占全部待預(yù)測(cè)評(píng)分的比例,RC值越大,說(shuō)明能夠預(yù)測(cè)出的項(xiàng)目評(píng)分越多,即算法越好。它們的定義如下所示:
其中,rui為用戶u對(duì)項(xiàng)目i的實(shí)際評(píng)分,pui為用戶u對(duì)用戶i的預(yù)測(cè)評(píng)分。T為預(yù)測(cè)結(jié)果集,|T|表示集合中元素的數(shù)。
其中,M和N分別代表可預(yù)測(cè)出的項(xiàng)目評(píng)分?jǐn)?shù)和全部待預(yù)測(cè)的項(xiàng)目。
3.3結(jié)果與討論
在這一小節(jié)中,對(duì)本文提出的重組信任矩陣的算法進(jìn)行驗(yàn)證。UpTrust_d(d=1,2,3)是本文提出的算法,對(duì)原始信任矩陣進(jìn)行重組,并設(shè)置信任傳播長(zhǎng)度為d。Trust_d(d=1,2,3)是使用原始信任矩陣且信任傳播長(zhǎng)度為d來(lái)產(chǎn)生推薦的算法。另外還與PCC算法進(jìn)行了對(duì)比,所以在每組實(shí)驗(yàn)中會(huì)產(chǎn)生7個(gè)實(shí)驗(yàn)結(jié)果。為了驗(yàn)證該算法可以有效地解決冷啟動(dòng)的問(wèn)題,從FilmTrust數(shù)據(jù)集中提取出冷啟動(dòng)用戶,也就是評(píng)論項(xiàng)目數(shù)不超過(guò)5個(gè)的用戶,并將PCC和UpTrust_1兩個(gè)算法在冷啟動(dòng)用戶上就MAE、RMSE和RC進(jìn)行了對(duì)比。下面分別對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。
實(shí)驗(yàn)1 圖2和圖3分別是對(duì)比算法在FilmTrust數(shù)據(jù)集上MAE和RMSE的實(shí)驗(yàn)結(jié)果,重組信任矩陣的閾值分別設(shè)置為α=0.2,β=0.3。從圖中可以看出UpTrust_d是所有方法中最好的方法,且PCC比Trust_d方法效果好,這說(shuō)明信任矩陣中低相似度的用戶會(huì)降低評(píng)分預(yù)測(cè)質(zhì)量,而重組信任矩陣的方法能夠有效地解決這一問(wèn)題。從圖中還可以觀察到,隨著信任傳播長(zhǎng)度增大,使用原始信任矩陣方法的效果越來(lái)越好,即Trust_3比Trust_2效果好且Trust_2比Trust_1效果好,這說(shuō)明信任傳播在提高推薦效果方面有一定的影響。但是,在本文提出的算法UpTrust_d中,隨著信任傳播長(zhǎng)度d增大,方法的效果越來(lái)越差,其中UpTrust_1是最好的方法。這是因?yàn)殡S著信任傳播長(zhǎng)度增大,雖然可以找到更多的信任鄰居,但是這并不能保證找到更多的項(xiàng)目,反而有可能會(huì)包含進(jìn)一些干擾用戶,帶來(lái)噪聲,從而降低評(píng)分預(yù)測(cè)的精度。
圖2 各算法在FilmTrust數(shù)據(jù)集上MAE值比較Fig.2 Comparison of MAE between relevant recommendation algorithms on the FilmTrust dataset
圖3 各算法在FilmTrust數(shù)據(jù)集上RMSE值比較Fig.3 Comparison of RMSE between relevant recommendation algorithms on the FilmTrust dataset
實(shí)驗(yàn)2 圖4和圖5分別是對(duì)比算法在Epinions數(shù)據(jù)集上MAE和RMSE的實(shí)驗(yàn)結(jié)果,重組信任矩陣的閾值分別設(shè)置為α=0.1,β=0.3。從圖中同樣可以觀察到,UpTrust_d是最好的方法,且PCC比Trust_d方法效果好,這也說(shuō)明了信任矩陣中低相似度的信任關(guān)系會(huì)影響推薦效果,而重組信任矩陣的方法能夠提高評(píng)分預(yù)測(cè)質(zhì)量。但是,隨著信任傳播長(zhǎng)度增大,Trust_1是Trust_d中最好的方法而UpTrust_3是UpTrust_d中效果最好的方法,這與FilmTrust數(shù)據(jù)集中得到的結(jié)論正好相反。這一現(xiàn)象同樣說(shuō)明信任傳播不保證一定能得到最好的推薦結(jié)果,雖然它能找到更多的信任鄰居,但同樣會(huì)引入噪聲,對(duì)推薦產(chǎn)生干擾。
圖4 各算法在Epinions數(shù)據(jù)集上MAE值比較Fig.4 Comparison of MAE between relevant recommendation algorithms on the Epinions dataset
圖5 各算法在Epinions數(shù)據(jù)集上RMSE值比較Fig.5 Comparison of RMSE between relevant recommendation algorithms on the Epinions dataset
實(shí)驗(yàn)3 為了驗(yàn)證本文方法能夠有效解決冷啟動(dòng)問(wèn)題,在FilmTrust數(shù)據(jù)集上提取出冷啟動(dòng)用戶,由于UpTrust_1在FilmTrust數(shù)據(jù)集上效果最好,所以將PCC和UpTrust_1兩個(gè)算法在冷啟動(dòng)用戶上就MAE、RMSE和RC進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果分別如圖6、圖7和表1所示。從圖中和表中的數(shù)據(jù)可以看出,UpTrust_1方法在MAE、RMSE及覆蓋率上明顯比PCC效果好,說(shuō)明本文算法能夠在較大范圍上對(duì)冷啟動(dòng)用戶進(jìn)行高質(zhì)量的評(píng)分預(yù)測(cè),有效地解決了冷啟動(dòng)問(wèn)題。
圖6 各算法在FilmTrust數(shù)據(jù)集上冷啟動(dòng)用戶的MAE值比較Fig.6 Comparison of MAE between relevant recommendation algorithms on the cold users in FilmTrust dataset
圖7 各算法在FilmTrust數(shù)據(jù)集上冷啟動(dòng)用戶的RMSE值比較Fig.7 Comparison of RMSE between relevant recommendation algorithms on the cold users in FilmTrust dataset
表1 PCC及UpTrust_1算法在FilmTrust數(shù)據(jù)集上冷啟動(dòng)用戶的覆蓋率比較Tab.1 Comparison of rating coverage between PCC and UpTrust_1 algorithms on the cold users in FilmTrust dataset
本文提出了結(jié)合用戶相似度與加權(quán)的信任傳播重組信任矩陣的方法來(lái)提高協(xié)同過(guò)濾推薦系統(tǒng)的評(píng)分預(yù)測(cè)精度,并解決冷啟動(dòng)問(wèn)題。由于傳統(tǒng)基于信任的方法中大部分使用的是全部信任矩陣數(shù)據(jù),而信任矩陣中相似度低的用戶會(huì)降低評(píng)分預(yù)測(cè)精度,所以本文首先將信任矩陣中用戶相似度低于某一閾值的信任關(guān)系去掉;其次,信任矩陣中高相似度的用戶會(huì)提高推薦質(zhì)量,因此為相似度高于某一閾值的用戶對(duì)添加信任關(guān)系;最后,由于冷啟動(dòng)用戶不活躍且其信任鄰居少,所以考慮信任傳播來(lái)尋找更多的信任鄰居,但是傳統(tǒng)的信任傳播方法計(jì)算所得的信任值仍然是二進(jìn)制的,不能對(duì)不同距離的信任鄰居進(jìn)行區(qū)分,因此采用加權(quán)的信任傳播,來(lái)區(qū)分不同距離的信任用戶。對(duì)比實(shí)驗(yàn)結(jié)果表明,本文提出的重組信任矩陣的方法有效地提高了評(píng)分預(yù)測(cè)質(zhì)量,并且較好地解決了冷啟動(dòng)問(wèn)題。
[1]Zhou X,Xu Y,Li Y,et al.The state-of-the-art in personalized recommendersystemsforsocialnetworking[J].Artificial Intelligence Review,2012,37(2):119-132.
[2]Xu Hai-ling,Wu Xiao,Li Xiao-dong,et al.Comparison study of Internet recommendation system[J].Journal of Software,2009,20(2):350-362.
[3]Li Gai,Li Lei.Collaborative filtering algorithm based on matrix decomposition[J].Computer Engineering and Applications,2011,47(30):4-7.
[4]Zhang S,Wang W,F(xiàn)ord J.et al.Learning from incomplete ratings using non-negative matrix factorization[C]//Proceedings of the 2006 SIAM International Conference on Data Mining,Maryland,2006:549-553.
[5]Li Gui,Wang Shuang,Li Zheng-yu,et al.Personalized tag recommendation algorithm based on tensor decomposition[J].Computer Science,2015,42(2):267-173.
[6]Konstas I,Stathopoulos V,Jose J.On social networks and collaborative recommendation[C]//Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval,Boston,2009:195-202.
[7]Yuan Q,Zhao S,Chen L,et al.Augmenting collaborative recommender by fusing explicit social relationships[C]//Proceedings of Workshop on Recommender Systems and the Social Web,New York,2009:49-56.
[8]Audun J,Quattrochicchi D.Taste and trust[J].Trust Management V,2011,358:312-322.
[9]Jamali M,Ester M.Trustwalker:a random walk model for combining trustbased and item-based recommendation[C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Paris,2009:397-406.
[10]Massa P,Avesani P.Trust-aware recommender systems[C]//Proceedings of the 2007 ACM Conference on Recommender Systems,Minneapolis,2007:17-24.
[11]Deng S,Huang L,Xu G.Social network-based service recommendation with trust enhancement[J].Expert Systems with Applications,2014,41(18):8075-8084.
[12]Guo G,Zhang J,Thalmann D.Merging trust in collaborative filtering to alleviate data sparsity and cold start[J].Knowledgebased Systems,2014,57:57-68.
[13]Ray S,Mahanti A.Improving prediction accuracy in trust-aware recommendersystems[C]//Proceedings ofthe 43rd Hawaii International Conference on System Sciences,Hawaii,2010:1-9.
Algorithm of reconstructing trust matrix by integrating user similarity and trust propagation
YUAN Fu-yong,MA Lin,LIANG Shun-pan
(School of Information Science and Engineering,Yanshan University,Qinhuangdao,Hebei 066004,China)
Aiming at the problems of Collaborative Filtering(CF),such as data sparsity and cold start,an algorithm of reconstructing trust matrix is proposed in this paper,which integrates user similarity and weighted trust propagation.Specifically,the trust relationship of those users whose similarity falls below a certain threshold is removed firstly.Then the users of rating matrix is added into trust matrix when the similarity between the users exceeds a certain threshold.Finally,weighted trust propagation is considered,in order to incorporate more trusted neighbors as well as distinguish trusted neighbors in a shorter distance with those in a longer distance.Experimental results on FilmTrust and Epinions data sets show that the proposed method can achieve superior prediction accuracy and solve cold user problem better.
collaborative filtering;user similarity;weighted trust propagation;reconstructing trust matrix
TP39
A DOI:10.3969/j.issn.1007-791X.2015.06.011
1007-791X(2015)06-0535-06
2015-09-05 基金項(xiàng)目:國(guó)家自然科學(xué)基金青年基金資助項(xiàng)目(51305383);教育部博士點(diǎn)專項(xiàng)基金資助項(xiàng)目(20131333120007)
*原福永(1958-),男,遼寧丹東人,教授,主要研究方向?yàn)榫W(wǎng)絡(luò)信息檢索技術(shù),數(shù)據(jù)庫(kù)技術(shù),計(jì)算信任模型等,Email:fyyuan@ysu.edu.cn。