劉曉露,賈書偉
(1.山東財經(jīng)大學管理科學與工程學院,濟南 250014;2.河南農(nóng)業(yè)大學信息與管理科學學院,鄭州 450002)
在線評分系統(tǒng)中用戶聲譽的度量對產(chǎn)品質(zhì)量排名具有重要意義[1-3]。隨著現(xiàn)代科技的發(fā)展,許多網(wǎng)站都使用在線評分系統(tǒng),用戶在網(wǎng)上瀏覽、收藏或購買產(chǎn)品后,可以根據(jù)對產(chǎn)品的體驗對產(chǎn)品質(zhì)量給出一個打分[4-5],基于用戶的打分來度量產(chǎn)品的質(zhì)量可以為用戶找到高質(zhì)量的產(chǎn)品。然而,由于系統(tǒng)中用戶對產(chǎn)品不熟悉或不誠實等原因,用戶對產(chǎn)品的打分不一定能準確反映產(chǎn)品的質(zhì)量。有些商家為了提高自身的信譽,雇傭一些水軍來給予自身高評價或?qū)Ω偁帉κ痔摷僭u價來迷惑其他消費者,通過簡單地對評分取平均的方法來對產(chǎn)品質(zhì)量進行排名可能不那么準確[6-7]。準確的打分可以對產(chǎn)品質(zhì)量的度量起到積極的作用,同時,不準確的打分則會起到干擾的影響,損害用戶與商家的利益。因此,度量用戶的打分準確程度(用戶聲譽)對于準確度量產(chǎn)品的質(zhì)量、保障社會經(jīng)濟和民生的健康發(fā)展起著重要的作用。對在線用戶聲譽的研究與分析成為眾多學術(shù)研究者感興趣的課題[8-10]。
聲譽的概念一直沒有得到統(tǒng)一,社會學[11-12]、信息經(jīng)濟學[13-17]、科學計量學[18-19]以及計算機科學[20-21]的研究學者分別從不同角度研究聲譽。本文將在線評分系統(tǒng)建模成用戶—產(chǎn)品二部分網(wǎng)絡(luò),用戶的聲譽(reputation)是指在特定的時間段和上下文環(huán)境中,依據(jù)用戶對產(chǎn)品的歷史評分,對該用戶可以對相應(yīng)產(chǎn)品做出準確評價(符合大眾認知)的感知[22]?;谟脩魧Ξa(chǎn)品的評分對用戶聲譽的研究近幾年取得了非常顯著的成果。目前3種主要的用戶聲譽度量方法有:聲譽和質(zhì)量不斷迭代的方法[6,23-28]、分組方法[29-30]和貝葉斯方法[31]。1)聲譽和質(zhì)量不斷迭代的方法中用戶聲譽和產(chǎn)品質(zhì)量是相互影響、相互依賴的,基本思想是:假設(shè)產(chǎn)品有其內(nèi)在的質(zhì)量,通過用戶評分與產(chǎn)品質(zhì)量的關(guān)系度量用戶的聲譽,再通過用戶聲譽和評分度量產(chǎn)品質(zhì)量,如此迭代直到用戶聲譽和產(chǎn)品質(zhì)量達到穩(wěn)定為止。優(yōu)點是計算用戶聲譽和產(chǎn)品質(zhì)量的準確性高,不足之處在于迭代方法的時間比較長,且迭代方法在某些數(shù)據(jù)集上不一定收斂。2)在分組方法中,用戶聲譽的度量是通過評分計算得到,不依賴于產(chǎn)品質(zhì)量,從打分分組的角度度量用戶聲譽。分組方法突破了已有迭代方法中用戶聲譽與產(chǎn)品質(zhì)量相互依賴的思想,提出分組的方法度量用戶的聲譽,計算時間較短。缺點是用給出相同評分的用戶個數(shù)所占的比例表示這一評分的可信度容易造成民主暴力,且該方法在度量用戶聲譽時只考慮了相同評分的用戶個數(shù),沒有考慮具體的評分。3)貝葉斯方法中用戶聲譽表示成一種概率,被評價者下次提供滿意服務(wù)的概率,貝葉斯方法的優(yōu)點是它提供了一種理論上的計算聲譽的基礎(chǔ),缺點是對于普通人來說,它過于復(fù)雜,不易理解。
在線評分系統(tǒng)中用戶集群行為分析[32-33]近年來受到越來越多的關(guān)注,劉[34]發(fā)現(xiàn)一些產(chǎn)品被幾乎所有的用戶所收藏,而一些度很小的產(chǎn)品只被度比較大的用戶所收藏,表明用戶的品味可以分為兩類:流行的和獨特的。同時,倪[35]發(fā)現(xiàn)系統(tǒng)中存在一些用戶在流行的產(chǎn)品剛開始投放市場,即早期還不流行的時候就發(fā)現(xiàn)并給出高的評價,然后當這些流行產(chǎn)品變得流行之后就有許多用戶去瀏覽、購買或收藏。用戶集群行為的研究可以為用戶聲譽度量算法提供新的思路,文獻[25]和[28]引入用戶活躍度對傳統(tǒng)的聲譽和質(zhì)量不斷迭代的方法加以改進,提高了用戶聲譽和產(chǎn)品質(zhì)量度量的準確性。
由于不同活躍度的用戶的行為機制不同,用戶行為也隨時間而變化,本文從用戶活躍度與時間因素兩個角度研究用戶打分行為,進行用戶聲譽的實證研究,為進一步提出準確的用戶聲譽度量算法提供研究基礎(chǔ)。所采用的數(shù)據(jù)集是電影網(wǎng)站MovieLens數(shù)據(jù),從以下兩個方面進行分析:1)用戶聲譽與活躍度的關(guān)系。根據(jù)用戶的度分類,然后分別計算每一組用戶的聲譽及其對產(chǎn)品打分的平均度,研究兩者的關(guān)系;將數(shù)據(jù)集按照時間分成季度片段,研究每個片段上用戶聲譽與活躍度的關(guān)系。2)用戶聲譽是否具有記憶性。將數(shù)據(jù)集按照時間分成年度片段,計算t年之后用戶的存在率;同時,提出一種衡量用戶聲譽記憶性的度量指標,計算t年之后兩個年份之間用戶聲譽排名的肯德爾系數(shù)與用戶活躍度排序的肯德爾系數(shù)隨時間t的變化。最后,通過建立隨機模型與實證結(jié)果進行比較。
本文的結(jié)構(gòu)安排如下:第二部分介紹用戶—產(chǎn)品二部分網(wǎng)絡(luò)中一種聲譽度量算法(CR方法)計算用戶聲譽;第三部分給出實證數(shù)據(jù)集中用戶聲譽研究結(jié)果;第四部分建立一個隨機模型來與實證結(jié)果進行比較;最后總結(jié)全文。
在復(fù)雜網(wǎng)絡(luò)中,在線評分系統(tǒng)可以建模成加權(quán)的用戶—產(chǎn)品二部分網(wǎng)絡(luò),其結(jié)構(gòu)圖如圖1所示。圖1中有兩類節(jié)點,圓圈代表用戶,方框代表產(chǎn)品,用戶和產(chǎn)品之間的連線表示用戶對產(chǎn)品的打分(權(quán)重)。
圖1 用戶—產(chǎn)品二部分網(wǎng)絡(luò)的結(jié)構(gòu)圖Fig.1 The structure diagram of the user-object bipartite network
下面以CR方法[6]為例介紹聲譽和質(zhì)量不斷迭代的方法。CR方法是目前復(fù)雜網(wǎng)絡(luò)領(lǐng)域度量用戶聲譽的一種比較經(jīng)典的迭代算法,后續(xù)多篇文章[25,28]都是在此基礎(chǔ)上提出用戶聲譽與產(chǎn)品質(zhì)量迭代算法,用戶對產(chǎn)品打分的數(shù)據(jù)集都適用CR方法。CR方法的核心思想是將用戶對產(chǎn)品的打分與相應(yīng)的產(chǎn)品質(zhì)量之間的皮爾森相關(guān)系數(shù)作為用戶的聲譽。產(chǎn)品質(zhì)量以打分的加權(quán)平均來計算,其中,權(quán)重是用戶的聲譽。根據(jù)用戶對產(chǎn)品的打分與產(chǎn)品質(zhì)量之間的相關(guān)系數(shù)來計算用戶的聲譽,這樣迭代計算下去,直到兩步迭代之間的產(chǎn)品質(zhì)量的差值小于一個很小的數(shù)。具體操作如下:
1)對于產(chǎn)品α,計算產(chǎn)品質(zhì)量Qα:
(1)
2)對于用戶i,計算每個用戶的打分和相應(yīng)的產(chǎn)品質(zhì)量的皮爾森相關(guān)系數(shù)TRi:
(2)
3)對于用戶i,計算用戶聲譽Ri:
(3)
用戶聲譽Ri∈[0,1],用戶聲譽越大,表明用戶對產(chǎn)品打分越準確。根據(jù)計算得到的用戶聲譽和產(chǎn)品質(zhì)量的結(jié)果再依次進行1)、2)、3)步的計算,循環(huán)迭代,直到兩步迭代之間的產(chǎn)品質(zhì)量的差值小于一個很小的數(shù),
(4)
這個很小的數(shù)δ取δ=10-5,其中|O|為產(chǎn)品的個數(shù)。
本文采用一個對電影評分的網(wǎng)站的數(shù)據(jù)集來進行實證研究:MovieLens。MovieLens是一個對電影進行在線評分的網(wǎng)站(http://www.grouplens.org),用戶可以對電影進行打分,網(wǎng)站可以對用戶提供個性化推薦服務(wù)。用戶對自己瀏覽、收藏過的產(chǎn)品進行打分,打分集合為{0.5,1,1.5,2,2.5,3,3.5,4,4.5,5},其中最低分0.5分表示最不喜歡,最高分5分表示最喜歡。如果用戶看了一部電影并且對它進行了打分,用戶與電影之間就會建立一條連邊。本文選取的MovieLens數(shù)據(jù)集中共包含69 878個用戶、10 677個電影和10 000 054條打分信息,時間跨度為13年(1997年~2009年)。對用戶聲譽的實證研究,從以下兩個方面進行分析:1)用戶聲譽與活躍度的關(guān)系;2)用戶聲譽的記憶性。
用戶活躍度指用戶在系統(tǒng)中的活躍程度,本文采取用戶的度(用戶打分的個數(shù))來表示。由于不同活躍度的用戶的行為機制不同,所以研究將用戶分組的情況下用戶聲譽與活躍度的關(guān)系。要分析不同活躍度的用戶的聲譽,即不同活躍度用戶對產(chǎn)品打分的準確程度,本文在數(shù)據(jù)集中將用戶按照他們的活躍度分為21組,活躍度落在同一區(qū)間內(nèi)的用戶為一組,每組中用戶活躍度的區(qū)間上限和下限如表1所示。
表1 MovieLens數(shù)據(jù)集中按用戶活躍度分組的區(qū)間上限和下限
在MovieLens數(shù)據(jù)集中根據(jù)CR方法計算用戶聲譽得到數(shù)據(jù)集中用戶聲譽的結(jié)果R,將同一組中用戶聲譽R取平均,得到不同活躍度分組用戶的平均聲譽〈R〉如圖2a所示,其中Km表示每組用戶活躍度的區(qū)間范圍的上限和下限的均值。從圖2a可以看出,總體上用戶聲譽隨著用戶度的增加而增加,即度大的用戶有較高的聲譽,打分越多的用戶打分越準確。同時,采用最小二乘法進行線性擬合得到平均聲譽與用戶度的斜率為0.000 079。這在現(xiàn)實生活中是合理的,度大的用戶進入系統(tǒng)的時間較長,對產(chǎn)品質(zhì)量的把握會比較強一些,對產(chǎn)品的評價相對于度小的用戶會更準確。
為了更加細致地研究用戶聲譽與度的關(guān)系,本文按照打分時間將數(shù)據(jù)集切分成季度的片段,計算每個片段上的用戶聲譽。由于本文中采用的數(shù)據(jù)集是電影的打分數(shù)據(jù),每年電影的上映會受時間的影響,比如節(jié)假日會有比較多的電影上映,所以研究季度片段的數(shù)據(jù)中用戶聲譽與度的關(guān)系。1997年~1999年的數(shù)據(jù)中每年的打分數(shù)量波動很大,比如1996年有1 047 618條打分,而1998年有202 092條打分,接近1996年打分數(shù)量的1/5。所以本文采用MovieLens數(shù)據(jù)集中2000到2008年打分數(shù)據(jù)進行季度層面的分析,為便于展示,年度數(shù)據(jù)的基本統(tǒng)計特性如表2所示。
表2 MovieLens數(shù)據(jù)集中2000到2008年打分數(shù)據(jù)的基本統(tǒng)計特性
注:〈ku〉與〈ko〉分別表示用戶的平均度和電影的平均度。
將MovieLens數(shù)據(jù)集中2000到2008年打分數(shù)據(jù)切分成36個季度的片段(即2000年1月~3月、4月~6月、…、2008年10月~12月),計算每個片段上的用戶聲譽。按照季節(jié)的不同,得到4個季度中不同活躍度分組用戶的平均聲譽〈R〉如圖2b所示,可以看出,總體上隨著用戶度的增加,用戶聲譽出現(xiàn)上升的趨勢,與圖2a的結(jié)果一致。在4個季度中,采用最小二乘法進行線性擬合得到平均聲譽與用戶度的斜率分別為0.000 064、0.000 071、0.000 065、0.000 065,均大于0,表明用戶的活躍度越大,聲譽越高,對產(chǎn)品的打分越準確。同時,本文用簡單平均法計算季節(jié)指數(shù):將每個季度中的用戶聲譽取均值,分別除以36個片段上用戶聲譽的均值,得到4個季度的季節(jié)指數(shù)分別為1.018 58,0.996 055,0.992 683,0.992 682 866??梢钥闯龅谝患径戎杏脩袈曌u要高于第二、第三和第四季度。
圖2 MovieLens數(shù)據(jù)集中用戶聲譽與度的關(guān)系實驗結(jié)果Fig.2 The experimental results on the relationships between user′s reputation and degree for the Movie Lens data set
本文提出用戶聲譽記憶性[36-37]的概念,即當前時間段內(nèi)用戶的聲譽排序與之前某一個時間段的聲譽排序的一致程度。將MovieLens數(shù)據(jù)集中2000到2008年打分數(shù)據(jù)切分成9個年度的片段(2000年、2001年、…、2008年),計算每個片段上的用戶聲譽。
在計算用戶聲譽的記憶性之前,首先研究一下隨著時間的變化,用戶在系統(tǒng)中的存在情況。在2000年到2008年這9個年份的數(shù)據(jù)中,計算兩兩年份的數(shù)據(jù)片段之間用戶的平均持續(xù)存在率ρ(t):
(5)
其中,t1=2000,2001,…,2007,t=1,2,…,8,Ut1為第t1年系統(tǒng)中的用戶集合,ρ(t)為t年之后系統(tǒng)中仍然存在的用戶所占的平均比例。MovieLens數(shù)據(jù)集中t年之后用戶的持續(xù)存在率ρ(t)如圖3a所示,可以看出隨著t的增加,用戶的平均持續(xù)存在率降低,表明經(jīng)過時間越長,用戶中仍然存在的用戶越少。
同時,在MovieLens數(shù)據(jù)集中2000年到2008年的9個年份數(shù)據(jù)中,以兩兩年份的數(shù)據(jù)片段之間用戶聲譽的肯德爾系數(shù)[38]τR(t)來衡量用戶聲譽的記憶性:
(6)
其中,m=|Ut1∩Ut1+t|為第t1年與第t1+t年相同用戶的數(shù)量,t1=2000,2001,…,2007,t=1,2,…,8。Rμ(t1)為第t1年數(shù)據(jù)集中用戶μ的聲譽,τR(t)為t年之后系統(tǒng)中存在的用戶聲譽的一致程度。τR(t)的值越大表明t年之后用戶聲譽的記憶性越高。
為了與用戶聲譽的記憶性作比較,計算兩兩年份的數(shù)據(jù)片段之間用戶度的肯德爾系數(shù)τK(t)作為用戶聲譽記憶性的衡量指標:
(7)
其中,Kμ(t1)為第t1年數(shù)據(jù)集中用戶μ的度,τK(t)為t年之后系統(tǒng)中存在的用戶活躍度的一致程度。τR(t)的值越大表明t年之后用戶活躍度的記憶性越高。
MovieLens數(shù)據(jù)集中t年之后用戶聲譽的平均記憶性τR(t)與用戶活躍度的平均記憶性τK(t)如圖3b所示??梢钥闯?,隨著t的增加,用戶聲譽的平均記憶性τR(t)降低,表明經(jīng)過時間越長,用戶聲譽的一致程度在降低,這在現(xiàn)實生活中是合理的。隨著時間的增長,影響用戶打分的準確程度的因素會越來越多,打分準確程度與過去相比的變化會越來越大;同時,用戶聲譽的平均記憶性τR(t)與用戶活躍度的平均記憶性τK(t)相比較,t≤5時,τR(t)>τK(t),說明5年之內(nèi)用戶聲譽的記憶性高于用戶活躍度的記憶性,表明用戶打分的準確程度與用戶活躍度相比更具有記憶性,隨時間變化更小。這在現(xiàn)實生活中也是合理的。用戶度是用戶打分數(shù)量多少的度量,反映用戶在打分系統(tǒng)中的活躍度,受影響的因素更多,隨時間變化更不穩(wěn)定。用戶聲譽反映用戶打分的準確程度,與用戶活躍度相比,更能反映用戶打分行為的內(nèi)在特性,隨時間變化更小,更加穩(wěn)定。
圖3 MovieLens數(shù)據(jù)集中用戶聲譽的記憶性實驗結(jié)果Fig.3 The experimental results on the memory of user reputation for the MovieLens data set
本文通過建立一個隨機模型來與實證結(jié)果進行比較。隨機模型是人工建立的與實證數(shù)據(jù)做對照的數(shù)據(jù)集,建立的目的是與實證數(shù)據(jù)中的結(jié)果進行比較,分析實證數(shù)據(jù)中的結(jié)果是否由隨機行為產(chǎn)生。在隨機模型中,本文保證用戶和產(chǎn)品的數(shù)量、打分數(shù)量、用戶的度與真實的MovieLens數(shù)據(jù)集保持一致,但是用戶選擇電影的行為完全隨機,打分時間也是完全隨機。因此,本文建立了一個新的、完全隨機的用戶—產(chǎn)品二部分網(wǎng)絡(luò):69 878個用戶和10 677個電影的度與真實數(shù)據(jù)集保持一致,10 000 054條連邊(打分)的節(jié)點(用戶與產(chǎn)品)通過產(chǎn)生隨機數(shù)
圖4 隨機模型中不同活躍度分組用戶的平均聲譽Fig.4 The average reputation of users in different groups divided by the activity for the Null model
的方法從真實數(shù)據(jù)集的節(jié)點集合中選取,每條連邊從真實數(shù)據(jù)集的打分時間集合中隨機選取一個打分時間與之匹配,每條連邊的權(quán)重(打分)從集合{0.5,1,1.5,2,2.5,3,3.5,4,4.5,5}中隨機選取。在隨機模型中進行用戶聲譽的實證研究:1)用戶聲譽與活躍度的關(guān)系;2)用戶聲譽的記憶性。
根據(jù)CR方法計算隨機模型中用戶的聲譽R,將用戶按照活躍度分組,將同一組中用戶聲譽R取平均,得到隨機模型中不同活躍度分組用戶的平均聲譽〈R〉如圖4所示,可以看出,隨著用戶活躍度的增加,用戶聲譽并沒有明顯的變化,且用戶聲譽的值都比較小(小于0.1)。無論是用戶聲譽與活躍度的關(guān)系還是用戶聲譽的值,都與實證數(shù)據(jù)中的結(jié)果(圖2a)有明顯不同。與隨機模型的結(jié)果比較,表明真實數(shù)據(jù)中用戶聲譽并不是由隨機行為引起的,隨著用戶活躍度的增大用戶的打分越準確。
圖5 隨機模型中用戶聲譽的記憶性實驗結(jié)果Fig.5 The experimental results on the memoryof user′s reputation for the Null model
隨機模型中t年之后用戶的平均持續(xù)存在率ρ(t)如圖5a所示,可以看出,對于不同的t,ρ(t)的值都在0.96附近,遠高于實證數(shù)據(jù)中的結(jié)果(圖3a中t=1時ρ(t)取最大值為0.34),表明隨機模型中t年之后,幾乎所有的用戶仍然存在。隨機模型中t年之后用戶聲譽的平均記憶性τR(t)與用戶活躍度的平均記憶性τK(t)如圖5b所示??梢钥闯觯瑢τ诓煌膖,τR(t)的值都在0附近,表明隨機模型中t年之后用戶聲譽完全沒有記憶性。τK(t)的值也不隨t的變化而變化,都在0.63附近,遠大于τR(t)的值,與實證數(shù)據(jù)中的結(jié)果(圖3a)有明顯差異。與隨機模型的結(jié)果比較,表明真實數(shù)據(jù)中用戶的打分行為并不是隨機產(chǎn)生的,t年之后用戶打分準確性具有記憶性。
本文在電影網(wǎng)站MovieLens數(shù)據(jù)上進行用戶—產(chǎn)品二部分網(wǎng)絡(luò)中用戶聲譽的實證研究,從以下兩個方面進行分析:1)用戶聲譽與活躍度的關(guān)系。根據(jù)用戶的度分類,發(fā)現(xiàn)用戶聲譽隨著用戶度的增加而增加;將數(shù)據(jù)集按照時間細分為36個季度的片段,同樣發(fā)現(xiàn)隨著用戶度的增加,用戶聲譽出現(xiàn)上升的趨勢。2)用戶聲譽是否具有記憶性。將數(shù)據(jù)集按照時間分成9個年度的片段,發(fā)現(xiàn)用戶的持續(xù)存在率隨著t的增加逐漸減?。煌瑫r,計算t年之后兩個年份之間用戶聲譽排名的肯德爾系數(shù)與用戶活躍度排序的肯德爾系數(shù),發(fā)現(xiàn)t≤5時,t年之后用戶聲譽排名的肯德爾系數(shù)比用戶度的肯德爾系數(shù)更高,表明5年之內(nèi)用戶聲譽比用戶的活躍度更具有記憶性。最后,通過建立隨機模型與實證結(jié)果進行比較,表明真實數(shù)據(jù)中用戶聲譽并不是由隨機行為引起的,側(cè)面驗證了實證數(shù)據(jù)中的實驗結(jié)果。
用戶集群行為的研究可以為用戶聲譽度量算法提供新的思路,本文從用戶活躍度與時間因素兩個角度進行在線評分系統(tǒng)中用戶聲譽的實證研究,拓寬了用戶聲譽研究的廣度,為進一步提出準確的用戶聲譽度量算法以及用戶聲譽在個性化推薦中的應(yīng)用提供研究基礎(chǔ)。