賀超波, 付志文, 石玉強, 鐘松林
(仲愷農(nóng)業(yè)工程學(xué)院信息科學(xué)與技術(shù)學(xué)院,廣州 510225)
?
應(yīng)用非負(fù)矩陣分解的社交網(wǎng)絡(luò)好友推薦
賀超波*, 付志文, 石玉強, 鐘松林
(仲愷農(nóng)業(yè)工程學(xué)院信息科學(xué)與技術(shù)學(xué)院,廣州 510225)
現(xiàn)有好友推薦方法只利用用戶關(guān)系或內(nèi)容信息進(jìn)行推薦,難以獲得較好的推薦質(zhì)量. 針對該問題,在利用非負(fù)矩陣分解模型適合數(shù)據(jù)聚類以及數(shù)據(jù)約簡的基礎(chǔ)上,提出一種基于非負(fù)矩陣分解的好友推薦方法:FRNMF. 該方法采用基于非負(fù)矩陣分解的用戶聚類為核心的好友推薦框架,利用用戶好友關(guān)系網(wǎng)絡(luò)信息和內(nèi)容信息分別進(jìn)行用戶聚類,然后基于聚類結(jié)果計算用戶間的綜合相似度并進(jìn)行好友推薦;不僅可以綜合集成利用用戶關(guān)系和內(nèi)容兩類信息,而且具有線性時間復(fù)雜度,還可以解決數(shù)據(jù)稀疏引起的推薦質(zhì)量下降問題. 實驗開發(fā)了FRNMF的原型系統(tǒng),并在真實的新浪微博和學(xué)者網(wǎng)社交網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行對比實驗,結(jié)果表明FRNMF比傳統(tǒng)的好友推薦方法具有更好的推薦質(zhì)量. 此外,對用戶關(guān)系和內(nèi)容兩類信息的權(quán)重參數(shù)設(shè)置進(jìn)行實驗分析,分析表明適當(dāng)提高用戶關(guān)系信息的權(quán)重對于提高好友推薦質(zhì)量具有促進(jìn)作用.
非負(fù)矩陣分解; 社交網(wǎng)絡(luò); 好友推薦
目前社交網(wǎng)絡(luò)發(fā)展日益迅速,F(xiàn)acebook、Twitter、微博以及微信等國內(nèi)外大型社交網(wǎng)絡(luò)服務(wù)平臺已吸引了大量用戶使用. 根據(jù)有關(guān)資料統(tǒng)計,全球最大的社交網(wǎng)絡(luò)Facebook的用戶數(shù)在2015年初超過13億,而國內(nèi)的微信也超過了5億的用戶數(shù)量[1],并且保持著很高的用戶增長率. 社交網(wǎng)絡(luò)能夠不斷吸引用戶使用的重要原因在于用戶不僅能通過社交網(wǎng)絡(luò)維護(hù)現(xiàn)實中的好友關(guān)系,而且能夠通過社交網(wǎng)絡(luò)發(fā)現(xiàn)更多感興趣的好友并擴大自己的社交圈子[2]. 由于大規(guī)模社交網(wǎng)絡(luò)用戶數(shù)量龐大,用戶主動查找好友很容易遇到“信息過載”的問題,所以社交網(wǎng)絡(luò)需要提供好友推薦服務(wù)功能幫助用戶快速準(zhǔn)確地發(fā)現(xiàn)感興趣的好友. 目前對于社交網(wǎng)絡(luò)的好友推薦問題已提出了不少解決方法,其中包括基于社交圈[3]、基于角色協(xié)同[4]、基于用戶Profile相似度計算[5]、基于鏈接預(yù)測[6]以及基于協(xié)同過濾[7]的好友推薦方法. 總的來說,現(xiàn)有好友推薦方法都需要在計算用戶間相似性或者好友鏈接關(guān)系建立概率的基礎(chǔ)上進(jìn)行推薦,但往往都只單一使用用戶好友關(guān)系信息或者內(nèi)容信息,并不能綜合利用這2類信息提高推薦質(zhì)量. 此外,這2類信息都存在很高的稀疏度,如用戶的平均好友數(shù)遠(yuǎn)遠(yuǎn)小于用戶總數(shù)量,這將引起推薦質(zhì)量的下降. 針對以上問題,本文提出了一種基于非負(fù)矩陣分解的好友推薦方法:FRNMF(Friend Re-commendation using Nonnegative Matrix Factorization),所做的主要工作包括:(1)設(shè)計了FRNMF的好友推薦框架,該框架可以利用用戶好友關(guān)系網(wǎng)絡(luò)信息和內(nèi)容信息分別進(jìn)行用戶聚類,通過基于2類信息的聚類結(jié)果進(jìn)行用戶相似度計算和好友推薦;(2)在真實的社交網(wǎng)絡(luò)數(shù)據(jù)集上進(jìn)行實驗驗證,結(jié)果表明FRNMF不僅可以綜合利用用戶關(guān)系和內(nèi)容這2類信息,而且可以通過NMF的維度約簡解決數(shù)據(jù)稀疏問題并提高推薦質(zhì)量.
1.1NMF模型
NMF是一種低秩矩陣近似逼近模型,適合于分析非負(fù)值矩陣的主要組成部分[8]. 該模型的數(shù)學(xué)描述為:給定一個矩陣X和期望的秩r?min(m,n),可以將X分解為2個矩陣F和G,且滿足X≈FGT,其中+為非負(fù)值元素集合. F和G可通過求解以下目標(biāo)函數(shù)獲得:
(1)
其中目標(biāo)函數(shù)J用于量化矩陣X和FGT的近似逼近程度.LEE和SEUNG[9]提出了2種常用的目標(biāo)函數(shù):Frobenius范數(shù)和Kullback-leibler離散度,并指出這2個函數(shù)對于單獨的F或G均是凸函數(shù),同時對于F和G卻不是凸函數(shù),因此要找到一個解決上述2個目標(biāo)函數(shù)的全局最優(yōu)解是非常困難的. 現(xiàn)實中,往往使用優(yōu)化算法得到局部最優(yōu)解作為矩陣分解結(jié)果,較為常用的方法為迭代更新求解方法[10].
NMF已被證明可等價于經(jīng)典的K-means聚類算法以及具有強大的聚類結(jié)果可解釋能力,此外,NMF可以將1個高維的矩陣分解為2個或多個低維矩陣的乘積實現(xiàn)維度約簡,不僅可以解決矩陣數(shù)據(jù)稀疏問題而且不會丟失原有信息的主要特征,因此在個性化信息推薦領(lǐng)域也得到廣泛應(yīng)用[11]. 例如,基于正則化NMF的協(xié)同過濾方法RSNMF[12]、基于聯(lián)合概率矩陣分解的推薦算法UPMF[13]、基于受限約束NMF的協(xié)同過濾方法BNMF[14]以及基于結(jié)構(gòu)投影NMF的協(xié)同過濾算法CF-SPNMF[15]等均通過實驗證明基于NMF可以解決項目評分矩陣存在的高度稀疏問題并且具有較高的推薦精度. 本文利用NMF具有的數(shù)據(jù)聚類以及數(shù)據(jù)約簡特點,研究應(yīng)用NMF進(jìn)行社交網(wǎng)絡(luò)好友推薦的方法FRNMF. 1.2FRNMF推薦框架
社交網(wǎng)絡(luò)中包含豐富的用戶好友關(guān)系網(wǎng)絡(luò)信息和用戶內(nèi)容信息(如用戶標(biāo)簽、微博以及簡介等),這些信息隱含著用戶的興趣特征,可以加以利用進(jìn)行好友推薦. FRNMF具有基于NMF的用戶聚類為核心的好友推薦框架(圖1),可以綜合利用這2類用戶信息進(jìn)行好友推薦. 該推薦框架首先通過數(shù)據(jù)預(yù)處理從社交網(wǎng)絡(luò)中抽取用戶好友關(guān)系網(wǎng)絡(luò)信息和內(nèi)容信息并構(gòu)建相對應(yīng)的鏈接矩陣X和內(nèi)容特征矩陣Y,然后分別對X和Y應(yīng)用NMF進(jìn)行用戶聚類挖掘,最后基于2類用戶信息的聚類結(jié)果進(jìn)行用戶綜合相似度計算以及好友推薦排序.
圖1 FRNMF推薦框架
1.3基于NMF的用戶聚類
社交網(wǎng)絡(luò)中的用戶好友關(guān)系網(wǎng)絡(luò)以及內(nèi)容信息都可以進(jìn)行用戶聚類挖掘,首先對于用戶好友關(guān)系網(wǎng)絡(luò)信息,可以構(gòu)建一個n×n用戶鏈接矩陣X,其中n為用戶總數(shù),X中的各元素值xij=xji=1(當(dāng)用戶i和j有好友關(guān)系時)或者xij=xji=0(當(dāng)用戶i和j沒有好友關(guān)系或者i=j時),可知X為對稱矩陣. 由于?xijX,均有xij≥0,所以適合采用NMF進(jìn)行分解. 文獻(xiàn)[16]指出用戶鏈接矩陣X可以分解為三分解(Tri-Factorization)形式X≈HSHT,由于X為對稱矩陣,所以S也為對稱矩陣,假設(shè)H←HS1/2,那么基于X的矩陣三分解形式可以進(jìn)一步簡化為X≈HHT,其中H為用戶節(jié)點聚類歸屬強度矩陣,且H+n×p,p為基于好友關(guān)系網(wǎng)絡(luò)信息的用戶聚類數(shù)目. 采用Frobenius范數(shù)作為目標(biāo)函數(shù),則X的NMF分解模型為:
(2)
根據(jù)矩陣Trace和Frobenius范數(shù)的關(guān)系,目標(biāo)函數(shù)J可以重寫為:
J=tr(XXT)-2tr(XHHT)+tr(HHTHHT).
(3)
由于?hijH均有hij≥0,那么最小化J可以轉(zhuǎn)化為典型的受限約束求極值問題,可以應(yīng)用拉格朗日乘數(shù)方法進(jìn)行求解. 設(shè)αij為受限條件hij≥0對應(yīng)的拉格朗日乘數(shù),且α=[αij],則J對應(yīng)的拉格朗日乘數(shù)函數(shù)L為:L=J+tr(αHT),為優(yōu)化求解函數(shù)L,可以引入Karush-Kuhn-Tucker(KKT)條件,首先求得:
(4)
然后根據(jù)KKT的平滑條件,要求αijhij=0,則由式(4)可得到如下新的等式:
(4XH)ijhij-(4HHTH)ijhij=0.
(5)
由式(5)可得到hij的迭代更新規(guī)則為:
(6)
由于hij表示用戶i屬于聚類j的強度,所以用戶i在基于關(guān)系網(wǎng)絡(luò)信息的聚類中可以劃入歸屬強度最大的聚類中.
社交網(wǎng)絡(luò)用戶的內(nèi)容信息主要來自于用戶標(biāo)簽、微博動態(tài)以及簡歷等文本類型的數(shù)據(jù),可以首先應(yīng)用經(jīng)典的詞袋模型TF/IDF進(jìn)行文本內(nèi)容特征信息提取,并構(gòu)建n×m的用戶文本內(nèi)容特征矩陣Y,其中m為詞典詞項總數(shù),Y中的任一元素yij為用戶所關(guān)聯(lián)詞項的TF/IDF值,可知Y同樣為非負(fù)值矩陣,所以也適合基于NMF進(jìn)行分解. 基于NMF模型,可以將Y近似分解為2個矩陣U、VT的乘積:Y≈UVT,其中U,V,q為基于內(nèi)容信息的用戶聚類數(shù)目. 采用Frobenius范數(shù)作為目標(biāo)函數(shù),Y的NMF分解模型為:
(7)
根據(jù)與X的NMF分解模型相同的求解方法,可以得到U和V各元素的迭代求解規(guī)則為:
(8)
(9)
其中,uij同樣可表示為用戶i屬于聚類j的強度,所以用戶i在基于內(nèi)容信息的聚類中可以劃入歸屬強度最大的聚類.
1.4好友推薦
用戶聚類步驟中分別得到2類信息的聚類結(jié)果指示矩陣H和U,H和U均為NMF進(jìn)行維度約簡后的矩陣,稀疏度遠(yuǎn)小于原始矩陣X和Y,所以基于H和U計算用戶相似度更加準(zhǔn)確. 首先對于H,任意2個用戶i和j在H中對應(yīng)的行向量分別為hi和hj,那么用戶i和j的基于H的相似度simH(i,j)可以采用hi和hj的點積進(jìn)行計算:
simH(i,j)=hi·hj=(HHT)ij.
(10)
同理,用戶i和j的基于U的相似度simU(i,j)也可以按照相同方法計算獲得.simH(i,j)為用戶好友關(guān)系網(wǎng)絡(luò)信息特征相似度,simU(i,j)為用戶內(nèi)容信息特征相似度,為此可以設(shè)計一種帶權(quán)重信息的用戶綜合相似度sim(i,j)的計算方法:
sim(i,j)=αsimH(i,j)+(1-α)simU(i,j),
(11)
算法1基于NMF的好友推薦算法
輸入:用戶集合V={v1,v2,…,vn},用戶好友關(guān)系矩陣X,用戶內(nèi)容信息特征矩陣Y,聚類數(shù)目p、q,權(quán)重參數(shù)α;
輸出:好友推薦Top-K列表;
過程:
Step1. 隨機初始化H、U、V;
Step2. 分別應(yīng)用迭代更新規(guī)則6和規(guī)則8獲得H和U;
Step3. 基于H計算兩兩用戶相似度simH(i,j);
Step4. 基于U計算兩兩用戶相似度simU(i,j);
Step5. 根據(jù)式(11)計算兩兩用戶相似度sim(i,j);
Step6. ?viV返回與其相似度處于Top-K范圍內(nèi)的用戶.
可以分析算法1的計算時間消耗都集中在Step2,即分別迭代應(yīng)用更新規(guī)則6和規(guī)則8獲得H和U. 由于X和Y均為稀疏矩陣,假設(shè)X和Y的非0元素個數(shù)分別為μX和μY,迭代次數(shù)為t,則可計算規(guī)則6的時間復(fù)雜度為O(μXp+2np2+2np)t,規(guī)則8的時間復(fù)雜度為O(μYq+(n+m)q2+2nq)t. 由于p?n以及q?m,可知算法1的時間復(fù)雜度跟n和m是線性相關(guān)的.
2.1數(shù)據(jù)集和評價準(zhǔn)則
選擇了2個真實的社交網(wǎng)絡(luò)作為實驗數(shù)據(jù)來源,分別為新浪微博Weibo(http://d.weibo.com/)和學(xué)者網(wǎng)SCHOLAT(http://www.scholat.com/). 新浪微博為大眾類的社交網(wǎng)絡(luò),用戶可以互相加為好友以及分享最新動態(tài),學(xué)者網(wǎng)則是面向科研教學(xué)工作者的垂直社交網(wǎng)絡(luò),提供管理個人科研教學(xué)信息以及學(xué)術(shù)社交網(wǎng)絡(luò)服務(wù). 實驗開發(fā)了FRNMF的原型系統(tǒng)(圖2).通過該原型系統(tǒng)的Web爬蟲程序首先分別爬取了新浪微博和學(xué)者網(wǎng)部分用戶公開的好友關(guān)系網(wǎng)絡(luò)、個人簡歷、標(biāo)簽以及微博動態(tài)數(shù)據(jù)等,然后再通過數(shù)據(jù)預(yù)處理和文本分詞程序得到實驗用數(shù)據(jù)集,數(shù)據(jù)集特征信息見表1.
圖2 FRNMF原型系統(tǒng)
數(shù)據(jù)集用戶數(shù)好友關(guān)系對用戶內(nèi)容特征詞數(shù)新浪微博49453310714670632學(xué)者網(wǎng)5683358957591
為度量好友推薦的質(zhì)量,采用了信息推薦領(lǐng)域常用的查準(zhǔn)率P和召回率R作為度量標(biāo)準(zhǔn). 假設(shè)為目標(biāo)用戶推薦的好友集合為A,目標(biāo)用戶已有的好友集合為B,各標(biāo)準(zhǔn)的具體計算規(guī)則如下:
(12)
(13)
2.2實驗對比分析
為驗證本文FRNMF的推薦質(zhì)量,實驗選擇了與3種常用的社交網(wǎng)絡(luò)好友推薦方法進(jìn)行對比分析,這3種方法分別是:(1)FoF[2]:即friend-of-friend,該方法需要首先計算用戶間具有共同好友的數(shù)量,然后為目標(biāo)用戶推薦具有共同好友較多的用戶. (2)Profile-based(PB)[5]:該方法需要首先計算用戶間Profile的相似度,然后為目標(biāo)用戶推薦相似度較高的用戶. (3)協(xié)同過濾[7]:該方法直接利用好友關(guān)系鏈接矩陣X計算用戶間的相似性,然后為目標(biāo)用戶推薦前K個最相似的用戶. 實驗過程中隨機抽取新浪微博和學(xué)者網(wǎng)用戶80%的好友關(guān)系數(shù)據(jù)作為訓(xùn)練集,20%的好友關(guān)系數(shù)據(jù)作為測試集,各種對比方法分別進(jìn)行Top 2、Top 4、Top 5、Top 8以及Top 10的推薦,并都進(jìn)行了10次實驗,取得P和R的平均值作為最終度量結(jié)果(圖3~圖6).
圖3 Weibo的查準(zhǔn)率對比
圖4 Weibo的召回率對比
圖5 學(xué)者網(wǎng)的查準(zhǔn)率對比
圖6 學(xué)者網(wǎng)的召回率對比
從圖3~圖6可以看出,本文提出的FRNMF方法與其他方法相比具有更好的推薦質(zhì)量,其原因在于:(1)綜合利用用戶關(guān)系和內(nèi)容信息比利用單一信息進(jìn)行好友推薦更能反映用戶選擇好友的偏好;(2)2類信息本身存在噪音數(shù)據(jù),兩者集成可以起到互為補充的作用;(3)2類信息都存在很高的稀疏度,這在進(jìn)行Profile相似度計算以及協(xié)同過濾用戶相似度計算過程會產(chǎn)生較大誤差,進(jìn)而影響最終推薦的質(zhì)量.
2.3權(quán)重參數(shù)α設(shè)置分析
式(11)的參數(shù)α可以起到控制2類信息對于綜合相似度計算的影響程度,在現(xiàn)實應(yīng)用中可以通過實驗評估FRNMF的推薦質(zhì)量來確定α的值. 通過設(shè)置α值在[0,1]范圍內(nèi)按0.1遞增,并分別計算FRNMF在新浪微博和學(xué)者網(wǎng)進(jìn)行Top 2、Top 4、Top 5、Top 8以及Top 10推薦獲得的Precision和Recall平均值,結(jié)果見圖7、圖8,可以看出,α值設(shè)置在[0.5,0.7]范圍內(nèi),F(xiàn)RNMF在2類數(shù)據(jù)集上都具有較好的推薦質(zhì)量,表明適當(dāng)提高用戶關(guān)系信息的權(quán)重對于提高好友推薦質(zhì)量具有促進(jìn)作用.
圖7 查準(zhǔn)率與α
圖8 召回率與α
本文基于NMF提出了一種社交網(wǎng)絡(luò)好友推薦方法:FRNMF,設(shè)計了相應(yīng)的好友推薦框架和好友推薦算法,其優(yōu)勢在于:可以綜合利用用戶關(guān)系信息和內(nèi)容信息推薦好友;利用NMF維度約簡克服了數(shù)據(jù)稀疏問題,提高了用戶相似性的準(zhǔn)確度,進(jìn)而提高了社交網(wǎng)絡(luò)好友推薦準(zhǔn)確性. 實驗驗證表明FRNMF與傳統(tǒng)方法相比具有更好的推薦質(zhì)量. 由于現(xiàn)實中的社交網(wǎng)絡(luò)用戶數(shù)量巨大,將帶來大數(shù)據(jù)處理問題,所以,下一步工作將重點研究如何提高FRNMF在進(jìn)行好友推薦時的計算效率.
[1]中文互聯(lián)網(wǎng)數(shù)據(jù)資訊中心. WeAreSocial: 2015年全球移動&社交報告精華解讀[EB/OL]. (2015-02-02)[2015-10-19]. http:∥www.199it.com/archives/326417.html.
[2]賀超波,湯庸,陳國華,等.面向大規(guī)模社交網(wǎng)絡(luò)的潛在好友推薦方法[J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2013,36(4):420-424.
HE C B, TANG Y, CHEN G H, et al. Potential frined recommendation method for large-scale social network [J]. Journal of Hefei University of Technology (Natural Science Edition), 2013, 36(4):420-424.
[3]王玙,高琳.基于社交圈的在線社交網(wǎng)絡(luò)朋友推薦算法[J].計算機學(xué)報,2014,37(4):801-808.
WANG Y, GAO L. Social circle-based algorithm for friend recommendation in online social networks [J]. Chinese Journal of Computers, 2014, 37(4):801-808.
[4]劉冬寧,劉艷,滕少華,等. 基于角色協(xié)同的在線社交網(wǎng)絡(luò)好友推薦機制[J].廣西大學(xué)學(xué)報(自然科學(xué)版),2014,39(6):1316-1323.
LIU D N, LIU Y, TENG S H, et al. The friend recommendation on social network based on role cooperation [J]. Journal of Guangxi University (Natural Science Edition), 2014, 39(6):1316-1323.
[5]AKCORA C G, CARMINATI B, FERRARI E. User similarities on social networks [J]. Social Network Analysis and Mining, 2013, 3(3):475-495.
[6]DONG Y X, TANG J, WU S, et al. Link prediction and recommendation across heterogeneous social networks[C]∥Proceedings of the 12th International Conference on Data Mining. Chicago: IEEE, 2012:181-190.
[7]AGARWAL V, BHARADWAJ K K. A collaborative filtering framework for friends recommendation in social networks based on interaction intensity and adaptive user similarity [J]. Social Network Analysis and Mining, 2013, 3(3):359-379.
[8]LEE D D, SEUNG H S. Learning the parts of objects by non-negative matrix factorization [J]. Nature, 1999, 401(10):788-791.
[9]LEE D D, SEUNG H S. Algorithms for non-negative matrix factorization[C]∥Proceedings of 2000 Annual Conference on Neural Information Processing Systems. Cambridge, MA: MIT Press, 2000:556-562.
[10]LIU H W, LI X L, ZHENG X Y. Solving non-negative matrix factorization by alternating least squares with a modified strategy[J]. Data Mining and Knowledge Discovery, 2013, 26(3):435-451.
[11]陳潔敏, 湯庸, 李建國, 等.個性化推薦算法研究[J].華南師范大學(xué)學(xué)報(自然科學(xué)版),2015,46(5):8-15.CHEN J M, TANG Y, LI J G, et al. Survey of personali-zed recommendation algorithms [J]. Journal of South China Normal University (Natural Science Edition), 2015, 46(5):8-15.[12]LUO X, ZHOU M C, XIA Y N, et al. An efficient nonnegative matrix factorization-based approach to collaborative filtering for recommender systems [J]. IEEE Tran-sactions on Industrial Informatics, 2014, 10(2):1273 - 1284.
[13]涂丹丹,舒承椿,余海燕.基于聯(lián)合概率矩陣分解的上下文廣告推薦算法[J].計算機學(xué)報,2013,24(3):454-464.TU D D, SHU C C, YU H Y. Using unified probabilistic matrix factorization for contextual advertisement recommendation [J].Journal of Software, 2013, 24(3):454-464.
[14]KANNAN R, ISHTEVA M, PARK H. Bounded matrix factorization for recommender system [J]. Knowledge and Information Systems, 2014, 39(3):491-511.
[15]居斌,錢沄濤,葉敏超.基于結(jié)構(gòu)投影非負(fù)矩陣分解的協(xié)同過濾算法[J].浙江大學(xué)學(xué)報(工學(xué)版),2015, 49(7):1319-1325.
JU B, QIAN Y T, YE M C. Collaborative filtering algorithm based on structured projective nonnegative matrix factorization[J]. Journal of Zhejiang University (Engineering Science Edition) , 2015,49(7):1319-1325.
[16]ZHANG Y, YEUNG D Y. Overlapping community detection via bounded nonnegative matrix tri-factorization[C] ∥Proceedings of the 18th ACM International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2012:606-614.
【中文責(zé)編:莊曉瓊英文責(zé)編:肖菁】
Friend Recommendation in Social Network Using Nonnegative Matrix Factorization
HE Chaobo*, FU Zhiwen, SHI Yuqiang, ZHONG Songlin
(School of Information Science and Technology, Zhongkai University of Agriculture and Engineering, Guangzhou 510225, China)
Most of existing friend recommendation methods only utilize user friendship or content information, and hence they are hard to obtain better recommendation quality. Aiming at this problem, Friend Recommendation using Nonnegative Matrix Factorization (FRNMF) for friend recommendation based on Nonnegative Matrix Factorization (NMF) is proposed, which is fit for data clustering and data reduction. FRNMF adopts user clusters as the core component of its framework. It firstly clusters users by utilizing user friendship network and user-generated content information respectively, and then calculates user pairwise similarities for recommendation based on the cluster results. It can use both user friendship and content information, and it has linear time complexity. FRNMF can alleviate the problem of data sparsity, which can result in the low recommendation quality. By developing protosystem of FRNMF and conducting comparative experiments on Weibo and Scholat social networks, the results show that our method performs better than traditional friend recommendation methods. Moreover, by experimental analysis, moderate increase of the weight of user friendship information can further improve the recommendation quality.
nonnegative matrix factorization; social network; friend recommendation
2015-11-10 《華南師范大學(xué)學(xué)報(自然科學(xué)版)》網(wǎng)址:http://journal.scnu.edu.cn/n
廣東省科技計劃項目(2016A030303058,2015A020209178);廣州市云計算安全與測評技術(shù)重點實驗室開放基金(GZCSKL-1407);國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(201511347005)
賀超波,副教授,Email:hechaobo@foxmail.com.
TP391
A
1000-5463(2016)04-0100-06