• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種融合社會標(biāo)簽的聯(lián)合概率矩陣分解推薦方法

    2020-10-23 09:11:12鄭紹振鄭東霞
    軟件工程 2020年10期
    關(guān)鍵詞:社交網(wǎng)絡(luò)

    鄭紹振 鄭東霞

    摘 ?要:社交網(wǎng)絡(luò)發(fā)展迅猛,社會網(wǎng)絡(luò)環(huán)境下的信息量驟增,如何在大數(shù)據(jù)下向用戶推薦感興趣的項目是當(dāng)前研究的熱點(diǎn)問題之一。目前的推薦系統(tǒng)在用戶反饋數(shù)據(jù)稀疏的情況下和向新用戶推薦中存在推薦不準(zhǔn)確的問題,為了提高推薦質(zhì)量,提出了一種融合社會標(biāo)簽的聯(lián)合概率矩陣分解推薦模型TaSoRec,該模型運(yùn)用社交網(wǎng)絡(luò)的用戶、項目、標(biāo)簽三者信息進(jìn)行推薦,通過對訓(xùn)練模型參數(shù)優(yōu)化,從而提升推薦效果。

    關(guān)鍵詞:社會標(biāo)簽;聯(lián)合概率矩陣;推薦方法;社交網(wǎng)絡(luò)

    中圖分類號:TP181 ? ? 文獻(xiàn)標(biāo)識碼:A

    Incorporating Social Tagging for Unified Probabilistic

    Matrix Factorization Recommendation

    ZHENG Shaozhen1, ZHENG Dongxia2

    (1. Liaoning Jinyang Group Information Technology Co., Ltd., Dandong 118000, China;

    2.School of Computer and Software, Dalian Neusoft University of Information, Dalian 116023, China)

    94225621@qq.com; zhengdongxia@neusoft.edu.cn

    Abstract: With the development of social network, the explosive growth of information makes a hot issue to recommend attractive resources to users based on big data. In order to improve the quality of recommendation, this paper proposes a joint probability matrix factorization recommendation model called TaSoRec (Tag Social Recommendation) which integrates social tags. The model uses information of users, resources and tags of social network, and optimizes the parameters of the training model to achieve better recommendation results.

    Keywords: social tagging; unified probability matrix; recommendation method; social network

    1 ? 引言(Introduction)

    社交網(wǎng)絡(luò)發(fā)展迅猛,開放的網(wǎng)絡(luò)環(huán)境下,數(shù)據(jù)在爆發(fā)式的增長,在海量的數(shù)據(jù)中,用戶通常很難找到自己感興趣的信息。Web 2.0時代允許用戶對網(wǎng)絡(luò)上的信息進(jìn)行標(biāo)注,比如對喜歡的電影、音樂等標(biāo)注,

    本文主要研究社交網(wǎng)絡(luò)中的項目推薦問題,向用戶推薦用戶可能感興趣的項目?,F(xiàn)有的推薦方法在用戶顯示反饋數(shù)據(jù)稀疏的情況下,推薦準(zhǔn)確度下降;如果是新用戶,沒有反饋數(shù)據(jù)時,推薦效果不理想,即存在冷啟動問題。本文使用的是協(xié)同過濾推薦技術(shù),提出了一種融合社會標(biāo)簽的聯(lián)合概率矩陣分解推薦算法(TaSoRec),算法研究用戶、項目和標(biāo)簽的兩兩關(guān)系,并使用概率矩陣分解方法進(jìn)行求解,得到三個特征矩陣的隱含特征向量,進(jìn)而對項目進(jìn)行最優(yōu)推薦。

    2 ? 相關(guān)工作分析(Related Work)

    現(xiàn)有的協(xié)同過濾推薦方法很難解決在大數(shù)據(jù)環(huán)境下用戶給予較少反饋信息或無反饋信息情況下的推薦,為了解決這種數(shù)據(jù)稀疏問題,文獻(xiàn)[1]中,Ruslan Salakhutdinov和Andriy Mnih提出的一種概率矩陣分解方法,這種方法將一個高維矩陣分解為兩個或多個低維度的矩陣,即用同一個空間的維度來描述推薦過程中兩個實體(用戶、項目)的隱語義的特征,這種算法目前被應(yīng)用于當(dāng)數(shù)據(jù)很少時對于缺失數(shù)據(jù)的預(yù)測,以提高推薦質(zhì)量。文獻(xiàn)[2]提出了一種聯(lián)合概率矩陣分解算法(UMPF),傳統(tǒng)的概率矩陣分解算法結(jié)合兩個實體進(jìn)行兩維的矩陣分解,而聯(lián)合概率矩陣分解算法結(jié)合三方面的實體,考慮三者中的兩兩關(guān)系,進(jìn)行矩陣分解。文獻(xiàn)[3]提出一種AdRec框架模型,將聯(lián)合概率分解算法首次應(yīng)用于上下文廣告的推薦中,實驗表明,推薦效果好于傳統(tǒng)的單一概率矩陣分解算法;但是這種方法并不能簡單地應(yīng)用到社會網(wǎng)絡(luò)環(huán)境下,社交網(wǎng)絡(luò)中用戶與用戶之間存在關(guān)系,此方法并沒有考慮到用戶之間的聯(lián)系。以上使用概率矩陣分解方法或聯(lián)合概率矩陣的算法,對于社交網(wǎng)絡(luò)中用戶之間的聯(lián)系及項目標(biāo)簽沒有受到關(guān)注。文獻(xiàn)[4]中,在協(xié)同過濾推薦模型中使用了標(biāo)簽信息,通過標(biāo)簽信息正則化概率矩陣分解的矩陣分解過程。文獻(xiàn)[5]中通過標(biāo)簽選擇每個用戶的鄰居和每個項目的鄰居,然后在矩陣分解中為每個用戶和每個項目的潛在特征向量填加唯一的高斯分布,使相似的用戶或項目具有相似的潛在特征。

    3 ? 問題描述(Problem description)

    3.1 ? 現(xiàn)存問題

    目前的推薦系統(tǒng)大部分只從用戶對項目的評分和用戶與用戶之間的信任關(guān)系兩個方面考慮來預(yù)測推薦,但是忽略了用戶對項目標(biāo)簽的使用問題,比如用戶通常會對喜歡的項目加標(biāo)簽標(biāo)注,也會對自己加各種標(biāo)簽。將用戶對項目的評分,又考慮用戶對標(biāo)簽的使用,項目與標(biāo)簽的關(guān)系等融入推薦中,考慮兩兩關(guān)系勢必能增強(qiáng)推薦的準(zhǔn)確度。

    目前大部分的推薦系統(tǒng)只考慮了用戶的顯式反饋信息,而忽略了用戶的隱式反饋信息,隱式反饋信息具有數(shù)據(jù)量大、易收集、應(yīng)用廣的特點(diǎn),放棄隱式反饋信息的推薦系統(tǒng)浪費(fèi)了寶貴的數(shù)據(jù)項目,隱式反饋信息雖然不直接表現(xiàn)出用戶的傾向,但是跟蹤用戶的隱式反饋信息,將隱式反饋信息融合到推薦系統(tǒng)中并不困難,用戶對項目進(jìn)行標(biāo)注標(biāo)簽,標(biāo)簽被標(biāo)注的次數(shù)能夠隱式地反饋出用戶對哪些項目的喜好程度。因此本文探討了一種融合社會標(biāo)簽的聯(lián)合概率矩陣分解的推薦算法。

    3.2 ? 符號定義

    本文結(jié)合用戶、項目、標(biāo)簽三個方面的信息進(jìn)行項目的推薦,主要是用戶對項目的評分信息和用戶對項目的隱式反饋信息,用戶使用社會標(biāo)簽的信息,項目與標(biāo)簽的關(guān)聯(lián)信息。當(dāng)用戶瀏覽網(wǎng)頁,訪問音樂項目時,向目標(biāo)用戶推薦其可能感興趣的其他音樂項目。

    假定一組有個用戶的用戶集合為,一組有個項目的項目集合為,一組有個標(biāo)簽的標(biāo)簽集合為,其中,維的用戶潛在特征矩陣用表示,維的項目潛在特征矩陣用表示,維的標(biāo)簽潛在特征矩陣用表示,用戶對項目的評分矩陣為,標(biāo)簽與用戶的關(guān)聯(lián)矩陣為,項目與標(biāo)簽的對應(yīng)矩陣為。

    4 ?使用標(biāo)簽信息的聯(lián)合概率矩陣分解推薦模型(Unified probabilistic matrix factorization recommendation model ?incorporated social tagging)

    本文提出一種使用社會標(biāo)簽的語義分析和概率矩陣分解的推薦方法。該方法根據(jù)用戶標(biāo)簽的歷史信息得到不同用戶間的相似性,然后建立用戶—標(biāo)簽、用戶—項目和標(biāo)簽—項目得分矩陣,最后計算獲得這些矩陣的隱含特征向量;其中在用戶—項目評分矩陣中加入了用戶相似性的正則化參數(shù),以避免過擬合;最后討論推薦方法的求解過程。

    4.1 ? 用戶相似性計算

    本文認(rèn)為具有相似標(biāo)簽標(biāo)注行為的用戶,其興趣愛好在很大程度上是具有相似性的,因此通過用戶對項目進(jìn)行標(biāo)注的歷史行為得到標(biāo)簽矩陣,本文提出的模型是在矩陣的基礎(chǔ)上使用皮爾森相似性計算用戶的相似性。假設(shè)表示用戶和用戶對項目進(jìn)行標(biāo)注的標(biāo)簽指數(shù)集,兩個用戶間的皮爾森相關(guān)系數(shù)定義如式(1):

    (1)

    其中,。從而,皮爾森相似性定義如下:

    。用戶相似性正則化參數(shù)的求解函數(shù)如式(2):

    (2)

    其中,是通過對用戶和用戶標(biāo)注的標(biāo)簽歷史記錄計算所得,并通過拉普拉斯矩陣,為對角矩陣,對角元素,表示矩陣的跡。

    利用上面的方法計算用戶間的相似權(quán)重,進(jìn)一步獲得三個矩陣的特征向量。

    4.2 ? 用戶—項目評分矩陣

    假設(shè)={}表示個用戶給個項目打分,其中矩陣中各元素的值在[0,1]區(qū)間,即,可由式(3)計算得到:

    (3)

    其中,為邏輯斯蒂函數(shù),,用于將值映射在[0,1]的區(qū)間。表示用戶訪問項目的次數(shù)。

    如果相關(guān)用戶具有相似的標(biāo)簽歷史記錄,那么這些用戶的隱含特征向量極有可能具有相似性,在用戶—項目概率矩陣中,考慮了用戶間的相似性。假定用戶和項目的隱含特征向量為、,維數(shù)均為維。則用戶—項目評分概率矩陣的條件分布如式(4)所示。

    (4)

    其中,為概率密度函數(shù),滿足均值為,方差為的高斯分布;為指示函數(shù),當(dāng)用戶訪問了項目,則=1;否則=0;為附加的正則化參數(shù)用來調(diào)整標(biāo)簽貢獻(xiàn)率。矩陣中假設(shè)用戶的特征向量、項目的特征向量均滿足均值為0的球形高斯先驗分布,如式(5)和式(6)所示。

    (5)

    (6)

    通過貝葉斯推理,可以得到式(7)。

    (7)

    在式(7)中,通過用戶對項目的訪問來估算用戶對項目的興趣指數(shù),但這個過程未考慮項目被用戶所標(biāo)注的標(biāo)簽語義信息,下面進(jìn)一步討論用戶對感興趣項目標(biāo)注標(biāo)簽的概率,以提高推薦準(zhǔn)確率。

    4.3 ? 用戶—標(biāo)簽概率矩陣

    假設(shè)表示個用戶對個標(biāo)簽標(biāo)注的概率矩陣,其中矩陣中各元素的值為用戶對標(biāo)簽標(biāo)注的次數(shù),值在[0,1]區(qū)間,即。表示項目被用戶標(biāo)注的標(biāo)簽。如果用戶頻繁使用某類標(biāo)簽,說明用戶對這類標(biāo)簽標(biāo)注的項目感興趣,可由式(8)計算得到。

    (8)

    其中,表示用戶使用標(biāo)簽的頻率。

    用戶—標(biāo)簽關(guān)聯(lián)矩陣中,假設(shè)用戶的隱含特征向量為,假設(shè)標(biāo)簽的隱含特征向量為,維數(shù)均為維。則用戶—標(biāo)簽概率矩陣的條件分布如式(9)所示。

    (9)

    其中,為概率密度函數(shù),滿足均值為,方差為的高斯分布;為指示函數(shù),當(dāng)用戶使用了標(biāo)簽,則=1;否則=0。矩陣中假設(shè)用戶特征向量、標(biāo)簽特征向量均滿足均值為0的高斯先驗分布如式(10)和式(11)。

    (10)

    (11)

    通過貝葉斯推理,可以得到式(12)。

    (12)

    4.4 ? 項目—標(biāo)簽概率矩陣

    假設(shè)表示個項目被標(biāo)注個標(biāo)簽的概率矩陣,其中矩陣中各元素的值為項目被標(biāo)注標(biāo)簽的次數(shù),值在[0,1]區(qū)間,即。表示用戶對項目標(biāo)注標(biāo)簽的次數(shù)概率,假設(shè)某個項目,用戶頻繁對其標(biāo)注標(biāo)簽,說明這個項目受用戶的喜歡,可由式(13)計算得到:

    (13)

    其中,表示項目被用戶標(biāo)注標(biāo)簽的頻率。

    項目—標(biāo)簽概率矩陣中,假定項目和標(biāo)簽的隱含特征向量為、,維數(shù)均為。則項目-標(biāo)簽概率矩陣的條件分布如(14)所示。

    (14)

    其中,為概率密度函數(shù),滿足均值為,方差為的高斯分布;為指示函數(shù),當(dāng)項目被標(biāo)注了標(biāo)簽,則=1;否則=0。矩陣中假設(shè)用戶特征向量、項目特征向量均滿足均值為0的球形高斯先驗分布如式(15)和式(16):

    (15)

    (16)

    通過貝葉斯推理,可以得到式(17)。

    (17)

    4.5 ? TaSoRec推薦模型

    用戶給項目標(biāo)注標(biāo)簽的個數(shù),用戶使用某類標(biāo)簽的頻率,項目與某類標(biāo)簽的關(guān)聯(lián)程度,都是影響推薦的因素,這些因素由用戶直接行為顯示出來的,即用戶給出的顯示反饋信息。而用戶對項目的訪問次數(shù)、轉(zhuǎn)發(fā)行為等不是用戶直接給出的傾向,但用戶的這些行為隱式的反饋了用戶的喜好程度。因此,將隱式反饋信息融入推薦模型中,對推薦準(zhǔn)確率的影響具有現(xiàn)實的積極意義。本文提出一種融合隱式反饋信息的TaSoRec模型,該模型通過聯(lián)合概率矩陣分解技術(shù)來進(jìn)行推薦。TaSoRec模型的圖形表示如圖1所示。

    由圖1可得出LaSoRec推薦的后驗分布函數(shù)的log函數(shù),如式(18)。

    (18)

    其中,C是常量,最大化公式(18)可看作無約束優(yōu)化問題,最小化公式(19)等價于最大化公式(18):

    (19)

    其中,,,,,,應(yīng)用梯度下降法求出公式(19)的局部最小值。參數(shù)的梯度下降公式如式(20)所示。

    (20)

    的梯度下降公式如式(21)所示。

    (21)

    的梯度下降公式如式(22)所示。

    (22)

    5 ? 實驗分析(Experiment analysis)

    本文采用推薦系統(tǒng)常用的數(shù)據(jù)集合MovieLens,該數(shù)據(jù)中包括標(biāo)簽信息和評分信息,適用于我們提出的模型。實驗選取MovieLens數(shù)據(jù)集大規(guī)模庫中的數(shù)據(jù)進(jìn)行試驗,有6040個獨(dú)立用戶對3900部電影作的大約100萬次評分。本文采用RMSE指標(biāo)來評價本文提出模型的推薦效果。

    為了驗證本文提出模型TaSoRec的推薦效果,進(jìn)行了四組比較實驗,第一組、第二組、第三組、第四組的訓(xùn)練數(shù)據(jù)分別使用實驗數(shù)據(jù)的90%、70%、20%、10%,分別對本文提出的TaSoRec模型、文獻(xiàn)[6]提出的推薦模型(TPR)、文獻(xiàn)[7]提出的MsRec進(jìn)行實驗驗證,實驗結(jié)果如表1和表2所示。

    多次實驗表明,設(shè)置特征維數(shù)為10和20,,,,,時,實驗效果最優(yōu)。

    6 ? 結(jié)論(Conclusion)

    本文提出的模型考慮了社會網(wǎng)絡(luò)環(huán)境下用戶與用戶之間的關(guān)系,并認(rèn)為具有相似行為的用戶之間存在相似性,通過分析用戶標(biāo)注的標(biāo)簽語義信息來識別相似用戶,融合用戶相似度的情況下,利用聯(lián)合概率矩陣分解方法進(jìn)行推薦。經(jīng)過反復(fù)實驗表明:本模型適用于數(shù)據(jù)稀少的情況及新用戶情況下的推薦,推薦效果具有很大優(yōu)勢,能夠?qū)ι鐣W(wǎng)絡(luò)環(huán)境下的推薦提供算法支持。

    參考文獻(xiàn)(References)

    [1] Hernando A, Bobadilla J, Ortega F. A non negative matrix factorization for collaborative filtering recommender systems based on a Bayesian probabilistic model[J]. Knowledge-Based Systems, 2016, 97(C): 188-202.

    [2] 王永貴,宋真真,肖成龍.基于改進(jìn)聚類和矩陣分解的協(xié)同過濾推薦算法[J].計算機(jī)應(yīng)用,2018,038(004):1001-1006.

    [3] 涂丹丹,舒承椿,余海燕.基于聯(lián)合概率矩陣分解的上下文廣告推薦算法[J].軟件學(xué)報,2013,24(3):454-464.

    [4] Zhen Y, Li W J, Yeung D Y. TagiCoFi: Tag informed collaborative filtering[C]. Proceedings of the 2009 ACM Conference on Recommender Systems, RecSys, 2009.

    [5] Le Wu, Enhong Chen, Qi Liu, et al. Leveraging Tagging for Neighborhood-aware Probabilistic Matrix Factorization[C]. the 21st ACM Conference on Information and Knowledge Management(CIKM 2012), 2012.

    [6] 吳燎原,蔣軍,王剛.科研社交網(wǎng)絡(luò)中基于聯(lián)合概率矩陣分解的科技論文推薦方法研究[J].計算機(jī)科學(xué),2016,43(9):213-217.

    [7] 熊麗榮,劉堅,湯穎.基于聯(lián)合概率矩陣分解的移動社會化推薦[J].計算機(jī)科學(xué),2016,43(009):255-260.

    作者簡介:

    鄭紹振(1980-),男,本科,工程師.研究領(lǐng)域:智能交通,推薦系統(tǒng).

    鄭東霞(1978-),女,碩士,副教授.研究領(lǐng)域:數(shù)據(jù)分析,推薦系統(tǒng).

    猜你喜歡
    社交網(wǎng)絡(luò)
    口碑信息傳播對圖書館服務(wù)創(chuàng)新的啟示
    社交網(wǎng)絡(luò)對大學(xué)英語教學(xué)的影響及應(yīng)用
    科技視界(2016年26期)2016-12-17 20:01:00
    社交網(wǎng)絡(luò)推薦系統(tǒng)
    社交網(wǎng)絡(luò)對大學(xué)生人際交往的影響及對策研究
    基于五要素理論的視頻自媒體盈利模式
    聲屏世界(2016年10期)2016-12-10 21:16:45
    大數(shù)據(jù)時代社交網(wǎng)絡(luò)個人信息安全問題研究
    社交網(wǎng)絡(luò)中的隱私關(guān)注及隱私保護(hù)研究綜述
    基于圖片分享為核心的社交網(wǎng)絡(luò)應(yīng)用分析
    戲劇之家(2016年19期)2016-10-31 19:44:28
    社交網(wǎng)絡(luò)自拍文化的心理解讀
    新聞前哨(2016年10期)2016-10-31 17:46:44
    社交網(wǎng)絡(luò)營銷策略及盈利模式探討
    商情(2016年11期)2016-04-15 20:16:05
    滨州市| 南开区| 万宁市| 江源县| 乌什县| 天水市| 吐鲁番市| 黄浦区| 屯留县| 资兴市| 门头沟区| 永福县| 富源县| 报价| 五寨县| 当涂县| 团风县| 宁陕县| 都兰县| 安平县| 吉林省| 遂川县| 黄石市| 开平市| 海丰县| 南宁市| 南川市| 衡东县| 赤壁市| 博湖县| 吴旗县| 忻城县| 蕲春县| 资阳市| 桃江县| 天等县| 永仁县| 中江县| 福安市| 安新县| 蒙山县|