孟璐
華中師范大學(xué) 湖北 武漢 430079
社交網(wǎng)絡(luò)中的好友推薦一般是通過運用算法和構(gòu)建模型來計算和預(yù)測用戶之間的隱藏鏈接關(guān)系,并按照與當前社交圈的親密度進行降序排列,為社交網(wǎng)絡(luò)用戶推薦他們感興趣的或可能認識的朋友,并引導(dǎo)他們建立新的好友關(guān)系,這表現(xiàn)在社交網(wǎng)絡(luò)模型中,即建立新的節(jié)點連邊。
已有的社交網(wǎng)絡(luò)好友推薦方法為我們提供了多種考量用戶關(guān)系的思路,其中研究最廣泛的是基于用戶興趣偏好的方法,其他還包括基于用戶社會關(guān)系的方法、基于用戶社會影響力的方法、基于好友信任度的方法等。上述方法往往忽略了用戶作為社交網(wǎng)絡(luò)主體的一些網(wǎng)絡(luò)行為和所處環(huán)境可能對好友推薦的結(jié)果產(chǎn)生潛在影響。因此,筆者選取了社交網(wǎng)絡(luò)好友推薦方法中研究較少的兩種思路,即基于用戶行為和基于地理位置的方法,對國內(nèi)這兩個領(lǐng)域已產(chǎn)生的最新研究進行綜述。
近年來,多樣化的社交網(wǎng)絡(luò)衍生出了紛繁復(fù)雜的用戶在線互動行為,除了傳統(tǒng)的瀏覽、評論、轉(zhuǎn)發(fā)、回復(fù)外,還增加了點贊、@、評分等。此外,社交網(wǎng)絡(luò)用戶行為具有實時更新不易把控的特點,考量起來有一定難度,而基于用戶行為的方法為社交網(wǎng)絡(luò)好友推薦提供了很好的借鑒。
吳不曉[1]以用戶標注行為為本,使用詞頻-逆向文件頻率(TF-IDF)將用戶標簽以語義相似度聚類成不同的話題,并據(jù)此推薦具有相同興趣愛好的潛在好友的算法——基于用戶標注行為的好友推薦算法(FRBT)。李全樂[2]研究了基于用戶@行為的好友推薦問題,他使用機器學(xué)習(xí)排序框架(Learning To Rank),并引入概率圖模型思想,將用戶@行為的好友推薦問題轉(zhuǎn)化成二分類問題。過云燕[3]借助機器學(xué)習(xí)方法,研究不同類型的屬性對用戶行為產(chǎn)生的不同貢獻度,并以此為依據(jù)對屬性進行分類,提出一種基于分類屬性的好友推薦算法。
蔣文麗[4]則研究社交網(wǎng)絡(luò)中不同的社群/團隊角色或相同角色下不同的用戶行為造成的角色活躍度差異,并通過E-GARGO模型模擬社群拓撲結(jié)構(gòu)中的角色活躍度,提出一種基于角色活躍度的好友推薦方法。李天立[5]和鄭佳佳[6]等均將用戶行為模式歸納為檔案創(chuàng)建、內(nèi)容創(chuàng)建及關(guān)系建立三方面,依據(jù)用戶和網(wǎng)頁的關(guān)系構(gòu)建用戶訪問模型,并依據(jù)用戶間的評分計算用戶相似性,從而研究熱點好友推薦問題。
施少懷[7]把社交網(wǎng)絡(luò)用戶劃分為興趣用戶和交際用戶兩種類型,由此形成的興趣關(guān)系和交際關(guān)系則代表了用戶的不同傾向。而用戶在社交網(wǎng)絡(luò)中的行為必然會受其好友行為影響,因此他引入行為信任機制,把基于用戶行為傾向的相似度模型評估結(jié)果在每個用戶節(jié)點中傳播,以此進行好友推薦。
趙釹森[8]深入分析了用戶行為與用戶興趣的關(guān)系,重點研究目前主要的互聯(lián)網(wǎng)行為,包括瀏覽行為、評論行為、評分行為,并以此為出發(fā)點,建立情感與評分的回歸模型,分析由用戶評分高低與其所表達的興趣愛好程度大小之間的關(guān)系,提出了一種模糊興趣分類方法。同樣從移動互聯(lián)網(wǎng)用戶所處的動態(tài)情境去思考的還有陳獨伊[9],將用戶瀏覽社交網(wǎng)絡(luò)實時動態(tài)的情境因素納入用戶行為模型,提出一種基于用戶情境的三維社交網(wǎng)絡(luò)推薦模型,并通過基于情境的三維用戶項目評分矩陣,預(yù)測用戶對信息的采納程度。王立人[10]以微博為例,將微博中四種常見的用戶行為——轉(zhuǎn)發(fā)、評論、@、參與話題討論融入主題模型LDA(文檔主題生成模型),并通過時間窗把微博文本劃分到時間片中,構(gòu)建了一種融合用戶行為和時間窗的動態(tài)主題挖掘模型。
與位置服務(wù)相融合是社交網(wǎng)絡(luò)服務(wù)未來發(fā)展的一大趨勢。就目前研究狀況來看,大部分好友推薦研究方法忽略了用戶興趣與其位置間的潛在關(guān)系。這樣的推薦方法更適用于虛擬網(wǎng)絡(luò),推薦結(jié)果產(chǎn)生的好友關(guān)系也多為虛擬關(guān)系,在現(xiàn)實世界并沒有真正的交集,這將造成用戶線上線下的社交活動無法緊密連接,在滿足用戶的社交現(xiàn)實需求方面存在一定缺陷。
基于用戶地理位置的好友推薦方法彌補了上述缺陷。從這個思路出發(fā),朱金奇[11]提出把用戶的興趣和位置結(jié)合起來,即將傳統(tǒng)的用戶興趣挖掘及相似性匹配算法加入鄰居發(fā)現(xiàn)的方法,通過地理位置相似度計算剖析近鄰關(guān)系。田恩菊[12]以用戶簽到地點歷史記錄為信息源,提出將矩陣分解挖掘出的用戶現(xiàn)有社交關(guān)系(隱式因子)與用戶地理位置(顯式因子)相互補充的思路。
朱榮鑫[13]對位置簽到型社交網(wǎng)站Foursquare進行研究,發(fā)現(xiàn)用戶簽到的位置范圍多為近距離,由此印證用戶更傾向于近距離社交?;诖?,他進一步挖掘位置與人的關(guān)系,提出了位置推薦模型和用戶推薦模型——前者采用主題模型,將用戶和位置的簽到序列與文本聚類LDA中的詞與文檔相對應(yīng),得到主題-位置矩陣和簽到-主題矩陣,觀察用戶簽到和位置在矩陣中的分布情況,從而進行位置推薦;后者采用圖模型,將用戶之間的關(guān)系轉(zhuǎn)化為圖中邊的關(guān)系,通過對邊的關(guān)系進行權(quán)重計算來確立好友關(guān)系的強弱。
隋雪芹[14]以新浪微博為例,探究了如何通過挖掘用戶移動軌跡來進行好友推薦。首先通過貝葉斯分布來監(jiān)測用戶所發(fā)微博狀態(tài)中包含的地名等位置信息,并綜合考慮所發(fā)微博上下文內(nèi)容、用戶活躍度和用戶在城際間的移動時間,最終提出了位置敏感的朋友推薦模型。劉乾[15]結(jié)合用戶的地理簽到歷史信息,提出了由地理相似性和用戶社交距離共同決定的用戶社交位置距離(Social Location)的概念,并以此為基礎(chǔ)構(gòu)建好友推薦模型。
王晨[16]對基于位置的國外社交網(wǎng)絡(luò)Brightkite進行數(shù)據(jù)采集,通過分析社交網(wǎng)絡(luò)用戶使用地點簽到功能的行為習(xí)慣,探究用戶位置信息對好友拓撲結(jié)構(gòu)的影響。李林[17]在基于位置服務(wù)(Location-Based Service)的基礎(chǔ)上,引入基于位置的社交網(wǎng)絡(luò)(Location-Based Social Networks,簡稱LBSN)的概念,并針對這個概念提出一種叫作PFRSC的基于用戶社交關(guān)系和簽到行為的朋友推薦算法。同樣將LBSN概念運用到好友推薦方式中的還有李媛[18]和劉袁柳[19],他們認為在LBSN模式下應(yīng)實現(xiàn)用戶不受任何時間和空間的約束,能隨時隨地通過簽到來分享自己的位置或發(fā)表帶位置的文本或媒體數(shù)據(jù)。他們還認為,用戶的位置信息能有效彌補線上線下社交好友活動的鴻溝,它不應(yīng)只被看作一個簡單的屬性。
李朔[20]為了解決前人基于位置的推薦研究中關(guān)于數(shù)據(jù)稀疏及冷啟動的問題,結(jié)合聚類算法與協(xié)同過濾方法二者之長,并綜合考慮位置語義等因素,提出一種改進的地點推薦方法。孫曉晨[21]通過計算用戶在各個位置興趣點的位置權(quán)重來計算用戶的位置相似度和好友相似度,同時應(yīng)用基于密度聚類的DBSCAN算法達到將各個位置興趣點聚類為不同的位置興趣區(qū)域塊的目標,最后綜合用戶間的互動親密度進行好友推薦。
朱煦[22]針對移動互聯(lián)網(wǎng)提出了一種利用移動設(shè)備上下文信息進行朋友推薦的思路——采集用戶移動設(shè)備中的通信數(shù)據(jù),以此計算用戶間的通信社交強度,并利用無線通信技術(shù)收發(fā)信號以感知用戶間的位置社交強度,最后利用通信社交強度和位置社交強度構(gòu)造綜合反映用戶聯(lián)絡(luò)關(guān)系的移動社交強度,并根據(jù)此思想,利用基于圖的推薦算法進行好友推薦。
綜上所述,基于用戶行為和基于地理位置的社交網(wǎng)絡(luò)好友推薦方法彌補了以用戶興趣為考察主體的推薦方法的不足的效果值得思考,國內(nèi)已有研究雖不多,但為進一步深入探討提供了借鑒。期待好友推薦方法能更加多角度、多覆蓋地考察用戶關(guān)系,為社交網(wǎng)絡(luò)用戶提供更精準的好友推薦結(jié)果。※
參考文獻:
[1]吳不曉,肖菁.基于用戶標注行為的潛在好友推薦[J].計算機應(yīng)用,2015,35(6):1663-1667.
[2]李全樂.社交網(wǎng)絡(luò)的@行為用戶推薦方法研究[D].北京:北京理工大學(xué),2015.
[3]過云燕,王宏志,張瑋奇.社交網(wǎng)絡(luò)中基于分類屬性的好友推薦[J].計算機工程與應(yīng)用,2015,51(12):99-106.
[4]蔣文麗,湯庸,許玉贏,等.社交網(wǎng)絡(luò)中角色活躍度的好友推薦[J].小型微型計算機系統(tǒng),2016,37(10):2162-2165.
[5]李天立.社交網(wǎng)絡(luò)中好友推薦技術(shù)的研究[D].大連:大連海事大學(xué),2014.
[6]鄭佳佳.社交網(wǎng)絡(luò)中基于圖排序的好友推薦機制研究與實現(xiàn)[D].杭州:浙江大學(xué),2011.
[7]施少懷.一種基于用戶傾向的微博好友推薦算法[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013.
[8]趙釹森.基于用戶行為的動態(tài)推薦系統(tǒng)算法研究及實現(xiàn)[D].成都:電子科技大學(xué),2013.
[9]陳獨伊.基于用戶情境的社交網(wǎng)絡(luò)推薦[D].上海:上海交通大學(xué),2014.
[10]王立人.基于主題分析和社交圈發(fā)現(xiàn)的微博朋友推薦[D].昆明:昆明理工大學(xué),2016.
[11]朱金奇,張兆年,馬春梅,等.基于地理近鄰關(guān)系的微博系統(tǒng)朋友推薦[J].計算機工程與應(yīng)用,2017,53(13):72-77.
[12]田恩菊.基于地理位置的朋友推薦研究[D].濟南:山東大學(xué).2017.
[13]朱榮鑫.基于地理位置的社交網(wǎng)絡(luò)潛在用戶和位置推薦模型研究[D].南京:南京郵電大學(xué),2013.
[14]隋雪芹.基于社會媒體的用戶移動軌跡挖掘及其在朋友推薦中的應(yīng)用研究[D].濟南:山東大學(xué),2016.
[15]劉乾.基于社交網(wǎng)絡(luò)和地理位置信息的好友推薦方法研究[D].杭州:浙江大學(xué),2013.
[16]王晨.基于位置的社交網(wǎng)絡(luò)好友推薦算法研究[D].北京:北京工商大學(xué),2015.
[17]李林.基于位置的社交網(wǎng)絡(luò)潛在好友推薦系統(tǒng)研究[D].南寧:廣西大學(xué),2016.
[18]李媛.基于位置的社交網(wǎng)絡(luò)推薦算法的研究與應(yīng)用[D].北京:中國科學(xué)院大學(xué),2015.
[19]劉袁柳.面向LBSN的興趣點和用戶推薦方法研究[D].蘇州:蘇州大學(xué),2015.
[20]李朔,石宇良.基于位置社交網(wǎng)絡(luò)中地點聚類推薦方法[J].山東大學(xué)學(xué)報,2016(3):44-50.
[21]孫曉晨,徐雅斌.位置社交網(wǎng)絡(luò)的潛在好友推薦模型研究[J].電信科學(xué),2014(10):71-77.
[22]朱煦.移動互聯(lián)網(wǎng)中好友推薦機制的研究[D].大連:大連理工大學(xué),2014.