金加衛(wèi) 王占鳳 李玲玲
(巢湖學(xué)院,安徽 巢湖 238000)
基于主題劃分的在線評論影響力度量方法研究
金加衛(wèi) 王占鳳 李玲玲
(巢湖學(xué)院,安徽 巢湖 238000)
伴隨著網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展,消費者更傾向于在互聯(lián)網(wǎng)上發(fā)表在線評論,這類評論對潛在消費者購買決策和企業(yè)市場推廣具有重要影響。文章分析互聯(lián)網(wǎng)在線評論影響力,遴選影響力指標(biāo),借鑒主題劃分思想,構(gòu)建了基于主題劃分的在線評論影響力度量方法,實現(xiàn)對網(wǎng)絡(luò)社區(qū)在線評論影響力的有效度量,并采用大眾點評網(wǎng)實驗數(shù)據(jù)檢驗其合理性和可行性。
在線評論;主題劃分;影響力;大眾點評網(wǎng)
在線評論(Online Review),又被稱作在線客戶評論,它作為在線口碑傳播最主要的一種形式,以文本形式為主對產(chǎn)品進行評價,是消費者通過互聯(lián)網(wǎng)提交的對產(chǎn)品或者公司的評論信息[1]。隨著電子商務(wù)在國民經(jīng)濟中的比重越來越大,消費者采用互聯(lián)網(wǎng)搜尋產(chǎn)品信息、了解他人對產(chǎn)品的感知、制定購物決策以及發(fā)布自己的體驗已經(jīng)成為商務(wù)新模式。而當(dāng)前像豆瓣網(wǎng)、大眾點評網(wǎng)等在線評論網(wǎng)站的異軍突起,更催生了在線評論的發(fā)展。因此,在線評論作為傳統(tǒng)口碑信息的新形式,在當(dāng)前環(huán)境下的消費者決策中正在扮演一個重要的角色[2];并已成為消費者獲取產(chǎn)品質(zhì)量信息的重要來源,也是互聯(lián)網(wǎng)環(huán)境下對傳統(tǒng)方式的替代和重要補充[3]。
相關(guān)研究指出,在網(wǎng)絡(luò)社區(qū)中,消費者更易受到影響力較大的在線評論及其用戶的影響,因此如何獲取影響力較大的在線評論及其用戶一直都是相關(guān)學(xué)者重點研究的領(lǐng)域。在線評論影響力受很多因素影響,這些因素大致可分為三類[4]:一是在線評論源相關(guān)因素,如網(wǎng)站可信度、評論人專業(yè)能力、評論人可靠性等;二是在線評論自身因素,如在線評論質(zhì)量、在線評論數(shù)量、在線評論效用等;三是在線評論接收人特征方面因素,如接收人的專業(yè)能力、接收人的產(chǎn)品涉入度、接收人的感知風(fēng)險和信任傾向等。上述研究都只側(cè)重在線評論影響力的定性層面,未采用定量方法對其進行度量。
蔡淑琴等人[5]提出用RFMS模型來測量在線評論發(fā)布者的影響力,以程度中心性來評估識別結(jié)果的有效性。Cha等人[6]為了度量Twitter中個體影響力,分別計算了關(guān)注網(wǎng)絡(luò)、轉(zhuǎn)發(fā)網(wǎng)絡(luò)、提及網(wǎng)絡(luò)的點中心度。Pal等人[7]在數(shù)據(jù)集上考慮了在線用戶的發(fā)帖數(shù)、回復(fù)數(shù)、被轉(zhuǎn)發(fā)數(shù)、被提及數(shù)和粉絲數(shù)目,分別計算在線用戶的轉(zhuǎn)發(fā)影響力、被提及影響力和擴散影響力等。文獻[8-11]主要考慮在線用戶的粉絲數(shù)、粉絲質(zhì)量及其轉(zhuǎn)發(fā)數(shù)與回復(fù)數(shù)等參數(shù),利用PageRank算法和用戶行為權(quán)值的方法進行在線用戶影響力計算。
但上述研究未進一步考慮在線評論的跨主題性,鑒于此,本文研究基于主題劃分的在線評論影響力度量方法。通過引入主題劃分KNN模型,并對其進行擴展,結(jié)合在線評論自身特點,把網(wǎng)絡(luò)社區(qū)按照主題進行劃分;并在前人影響力評價指標(biāo)研究基礎(chǔ)上增加新的指標(biāo)度量在線評論及其用戶影響力。相比于傳統(tǒng)方法,本文方法充分考慮了在線評論的跨主題性特點,使得在線評論在各主題的影響力計算具有更強的實用性。最后采用國內(nèi)專業(yè)點評類網(wǎng)站 (大眾點評網(wǎng),www.dianping.com)的數(shù)據(jù)進行了驗證。本文旨在能夠豐富在線評論研究理論,同時給國內(nèi)企業(yè)實時監(jiān)控和管理在線評論傳播提供一種方法。
現(xiàn)有研究[8-10]主要針對在線用戶,且沒有對在線評論內(nèi)容進行主題劃分,因此,現(xiàn)有研究對于在線評論影響力計算存在以下問題:
問題1 影響力計算的指標(biāo)選擇問題
現(xiàn)有研究中在線評論用戶的影響力主要從以下幾個方面進行度量,如表1所示:
表1 現(xiàn)有研究在線評論影響力指標(biāo)匯總
用戶影響力本質(zhì)上是用戶間的相互作用,而用戶間的相互作用除了通過在線評論數(shù)、被轉(zhuǎn)發(fā)數(shù)、被回復(fù)數(shù)考量外,還能夠通過發(fā)表評論人的總在線時間及注冊時間比值、評論文本質(zhì)量、評論人等級等指標(biāo)反映。
問題2 在線評論用戶跨主題性問題
在網(wǎng)絡(luò)社區(qū)注冊的同時,用戶可選擇自己所感興趣的主題,其發(fā)布的在線評論能夠跨越多個主題,而不局限于其從事的行業(yè)。但是傳統(tǒng)的度量方法將所有在線評論均歸類為用戶所從事的主題,沒有考慮在線評論的跨主題性,因此干擾了在線評論用戶在不同主題影響力的計算。
為了解決上述問題,本文做了以下兩方面工作:
1)增加在線評論用戶總在線時間與注冊時間比值、在線評論在所屬主題的影響力、用戶在各主題的在線評論數(shù)量、評論文本質(zhì)量、評論人等級5個指標(biāo)。見表2:
表2 在線評論影響力增加指標(biāo)匯總
2)對在線評論所涉及的主題進行分類,解決在線評論用戶跨主題問題。運用基于KNN的主題分類算法對用戶的在線評論內(nèi)容進行分類,將其分配到相似度最大的主題中,從而將所有的在線評論根據(jù)主題劃分為若干個子集,解決了在線評論跨主題性問題。
3.1 總體思想
用戶在網(wǎng)絡(luò)社區(qū)里發(fā)表在線評論,其影響力取決于他所發(fā)出的所有在線評論受到其他評論人的關(guān)注程度,因此計算用戶影響力的前提是分別計算他在所有主題區(qū)發(fā)表的在線評論的影響力。運用主題分類算法對在線評論用戶所涉及的主題進行劃分,并對在線評論用戶各指標(biāo)進行量化,代入計算公式得到在線評論用戶影響力。
本文將所有在線評論用戶指標(biāo)分為以下兩部分:在線評論用戶集A和在線評論集C,其中,
A= {A1,A2,…,Ai,…,Am},Ai為第 i個用戶,m為所有在線評論用戶的數(shù)量;
Cij=為Ai在主題Bj發(fā)表的在線評論集合。
基于主題劃分的在線評論用戶影響力計算方法共有4個基本步驟:
步驟1獲取在線評論用戶信息。通過評論采集軟件(網(wǎng)絡(luò)神采),得到在線評論用戶集A及其每個在線評論用戶的在線評論集C。
步驟2通過KNN分類算法對用戶AR在線評論集合中的每篇在線評論進行主題分類。并確定在線評論的所屬主題Bj。
步驟3計算在線評論在所屬主題Bj的影響力I()。通過在線評論的被轉(zhuǎn)發(fā)數(shù)D、被回復(fù)數(shù)E、在線評論文本質(zhì)量H、評論人等級A計算得到在線評論在主題Bj的影響力I()。
3.2 具體度量模型
問題描述:在某段時間內(nèi),某網(wǎng)絡(luò)社區(qū)中共有m個人發(fā)表在線評論,其集合記為
A= {A1,A2,…,Ai,…,Am},Ai為第 i個用戶。
按KNN算法將此網(wǎng)絡(luò)社區(qū)劃分為
B= {B1,B2,…,Bi,…,Bn}n個主題區(qū)域。
設(shè)評論人Ai的等級為Ai1,故所有評論人的等級為集合
設(shè)評論人Ai的總在線時間集合為
T= {T1,T2,…,Ti,…,Tm};
設(shè)評論人Ai的注冊時間集合為
t= {t1,t2,…,ti,…,tm};故評論人Ai的總在線時間和注冊時間比值為
設(shè)評論人Ai在Bj主題里發(fā)表的所有評論記為 Cij=
同理,把評論集合Cij的被轉(zhuǎn)發(fā)數(shù)記為
記評論集合Cij的被回復(fù)數(shù)為
記評論集合Cij的關(guān)鍵詞為
記評論集合Cij的字數(shù)為
在線評論集合Cijr的質(zhì)量記為
為了清晰地描述在線評論影響力與各指標(biāo)之間的內(nèi)在關(guān)系,這里把評論人Ai在主題Bj中發(fā)表的n條在線評論:
Cij= {Cij1,Cij2,…,Cijr,…,Cijn}各屬性指標(biāo)進行歸納總結(jié),以確定在線評論影響力各指標(biāo)之間的關(guān)系,見表3所示。
表3 在線評論影響力指標(biāo)對應(yīng)表
上述定義中的在線評論數(shù)、被轉(zhuǎn)發(fā)數(shù)、被回復(fù)數(shù)能夠直接得到,這里需要對評論人等級和在線評論文本質(zhì)量兩個指標(biāo)做詳細說明。
在對幾個訪問量較大的網(wǎng)絡(luò)社區(qū)的評論人等級分析后發(fā)現(xiàn),評論人的等級大體可以概括為以 下 五 種 形 式 :A(A1,A2, … ,An)、B(B1,B2, … ,An)、C(C1,C2,…,Cn)、D(D1,D2,…,Dn)、E(E1,E2,…,En)。
通常等級高的用戶發(fā)表的在線評論由于其描述內(nèi)容詳細專業(yè),更具有說服力,更能獲得其他評論者的積極響應(yīng)。為便于計算,對評論人的等級利用專家打分法進行賦值量化,A至E的取值分別為:0.2,0.4,0.6,0.8,1.0。
對于在線評論文本質(zhì)量,文獻[12]指出抽取文本中的關(guān)鍵詞個數(shù)、文本字數(shù)以反映其影響力。通常,高影響力的評論包含豐富的產(chǎn)品使用過程、體驗和感受等信息,能體現(xiàn)評論人感知產(chǎn)品真實屬性的水平,且文本內(nèi)容組織合理,邏輯嚴密、容易得到他人的認同;反之,低影響力的評論由于內(nèi)容組織零散,邏輯性差,缺乏論證說服力,不易得到其他用戶積極響應(yīng)。那日薩、李媛[13]在分析在線客戶評論時,利用客戶的情緒、特征、評價、感知等關(guān)鍵詞,獲得消費者在線評論的態(tài)度情感傾向計算模型;主要思想是把評論文本中的關(guān)鍵詞(涉及產(chǎn)品的質(zhì)量優(yōu)劣、價格高低、性能好壞、消費者情感傾向等)個數(shù)、文本字數(shù)作為度量文本質(zhì)量的關(guān)鍵指標(biāo)。如在大眾點評網(wǎng)的酒店評論專區(qū),客戶的在線評論如下:“房間比較大!地理位置不錯。但是上樓電梯較差。前臺接待態(tài)度不怎么樣。問網(wǎng)上訂有沒有優(yōu)惠,告知網(wǎng)上訂不了房,只有一個商務(wù)間,收了我193,結(jié)果上樓后網(wǎng)上發(fā)現(xiàn)還有100左右的。不誠信!”可得此在線評論關(guān)鍵詞數(shù)為6,文本字數(shù)為83。
如何依據(jù)關(guān)鍵詞數(shù)量和文本字數(shù)來度量評論文本質(zhì)量,本文采用權(quán)重比例系數(shù)方法來分配這兩類指標(biāo)的權(quán)重,具體計算過程如下:在線評論文本質(zhì)量可表示為p2為權(quán)重。其中p1+p2=1。式中p1、p2表示評論文本關(guān)鍵詞數(shù)和文本字數(shù)所占權(quán)重;分別表示關(guān)鍵詞個數(shù)和字數(shù),由專家打分法對p1、 p2賦權(quán)重得到,p1=0.6, p2=0.4。
文獻[14]提出微博內(nèi)容在所屬領(lǐng)域的權(quán)重主要由該微博內(nèi)容與所屬領(lǐng)域的相關(guān)度、被評論數(shù)、轉(zhuǎn)發(fā)數(shù)決定。基于以上算法改進,在線評論在所屬主題的影響力計算公式為:
其中 λ1,λ2為調(diào)節(jié)因子。 (1)
文獻[15]提出的話題熱度計算公式與本文的用戶影響力的計算具有相似之處,該方法的研究對象為多條微博,且均考慮了被評論數(shù),被回復(fù)數(shù),時間比值等指標(biāo)。基于以上算法改進,在線評論用戶在網(wǎng)絡(luò)社區(qū)影響力的計算公式為:
其中 λ3為調(diào)節(jié)因子。 (2)
研究以大眾點評網(wǎng)為實驗平臺,大眾點評網(wǎng)官網(wǎng)把評論內(nèi)容分為若干個主題(美食、電影、酒店、休閑娛樂、外賣、火鍋、麗人、周邊游、KTV和生活服務(wù)等),符合主題劃分思想。為便于討論,利用在線評論采集軟件 “網(wǎng)絡(luò)神采”重點將前3個主題(美食、電影和酒店)中的10位常見網(wǎng)絡(luò)用戶的相關(guān)評論信息搜集到一起,實驗數(shù)據(jù)采集時間跨度為6個月(2016.7.1—2017.1.1),從中獲取各個相關(guān)屬性指標(biāo),并把相關(guān)屬性指標(biāo)量化。
1)首先將10個評論人在3個主題的所有評論指標(biāo)匯總,建立如下表格:
表4 大眾點評網(wǎng)某時間段十個評論人的屬性指標(biāo)匯總
2)將評論人的評論信息按照3個主題分別建立表格。限于文章篇幅,這里只列舉“l(fā)elolu、吉吉狗狗、貓咪家”3個評論人分主題的評論信息,表格如下:
表5 “l(fā)elolu、吉吉狗狗、貓咪家”分主題評論信息匯總表
利用公式(1)和(2)對以上兩個表格中屬性指標(biāo)進行計算得到這十個評論人的分主題影響力和匯總影響力,計算結(jié)果如表6和表7所示:
表6 評論人分主題影響力大?。ńY(jié)果保留整數(shù))
表7 評論人在大眾點評網(wǎng)的影響力大?。ńY(jié)果保留整數(shù))
實驗結(jié)果分析:從表7可知這十個評論人的影響力從大到小依次是“雨巷0322、lelolu、貓咪家、眼淚笑8181、滾筒洗衣機君、春天花花家家、Shenxintong、Hfutjcd、吉吉狗狗、執(zhí)念 6064。 但從表6也知評論人在分主題中的影響力不是嚴格按照表7的大小進行排序,例如按照總影響力排序,“雨巷0322”大于“貓咪家”,但是在酒店主題區(qū)的影響力,“貓咪家”大于“雨巷0322”。故評論人在不同主題的影響力大小排序并不一定和總影響力排序完全一致。因此,潛在消費者和相關(guān)企業(yè)在考慮在線評論的影響力時,既要考慮用戶總的影響力,也要對不同主題進行區(qū)別對待。這樣潛在消費者才能有的放矢,得到更加精準(zhǔn)的產(chǎn)品評論和購物決策信息;企業(yè)也能夠針對不同主題對產(chǎn)品的各個性能參數(shù)和服務(wù)質(zhì)量做出改進,為企業(yè)贏得口碑,提高其經(jīng)營效益。
文章通過分析網(wǎng)絡(luò)社區(qū)里評論人所發(fā)在線評論的相關(guān)屬性指標(biāo),得到評論人影響力計算指標(biāo):評論人等級、總在線時間和注冊時間比值、評論文本數(shù)量、關(guān)鍵詞個數(shù)、文本字數(shù)、被轉(zhuǎn)發(fā)數(shù)、在線評論回復(fù)數(shù)、被轉(zhuǎn)發(fā)數(shù)等,并且綜合這些指標(biāo)得到度量在線評論影響力的計算方法,最后通過實例驗證了此度量方法的合理性和可行性。進一步的研究工作可以細化這些指標(biāo),努力把上述度量方法擴充得更加完美,為實際度量網(wǎng)絡(luò)社區(qū)在線評論影響力打下更堅實的理論基礎(chǔ),更加利于潛在消費者和企業(yè)做出科學(xué)決策。
參考文獻:
[1]HENNIG-THURAU T,GWINNER K P,WALSH G,et a1.Electronic word-of-mouth via consumer-opinion platform:what motivates consumers to articulate themselves on the internet[J].Journal of Interactive Marketing,2004,(1):38-52.
[2]CHEN Y B,XIE J H.Online consumer review:word of mouth as a new element of marketing communication mix[J].Management Science,2008,(3):477-491.
[3]CHEVALIER J A,MAYZLIN D.The effect of word of mouthon sales:Online book reviews[J].Journal of Marketing Research,2006,(3):345-354.
[4]HOVLAND C I,JANIS I L,KELLEY H H.Communication and persuasion[M].New Haven:Yale University Press,1953.
[5]蔡淑琴,馬玉濤,王瑞.在線口碑傳播的意見領(lǐng)袖識別方法研究[J].中國管理科學(xué),2013,(2):185-192.
[6]CHA M,HADDADI H,BENEVENUTO F,et al.Measuring user influence in twitter:the million follower fallacy[J].Berlin:Springer,2010:11-13.
[7]SWEENEY J C,SOUTRA G N,MAZZAROL T.Word of mouth:measuring the power of individual messages[J].European Journal of Marketing,2012,(1):237-257.
[8]劉耀庭.社交網(wǎng)絡(luò)結(jié)構(gòu)研究[D].杭州:浙江大學(xué),2008:19.
[9]YAMAGUCHI Y,TAKAHASHI T,AMAGASA T,et al.TURank:twitter user ranking based on user-tweet graph analysis[J].LNCS,2010,6488:240-253.
[10]BAKSHY E,HOFMAN J M,MASON W A,et al.Everyone’s an influencer:quantifying influence on twitter[J].WSDM 2011.New York:ACM,2011:65-74.
[11]肖宇,許煒,商召璽.微博用戶區(qū)域影響力識別算法及分析[J].計算機科學(xué),2012,(9):38-42.
[12]郭巖,劉春陽,余智華,等.網(wǎng)絡(luò)輿情信息源影響力的評估研究[J].中文信息學(xué)報,2011,(3):64-71.
[13]那日薩,李媛.基于在線評論的消費者模糊情感計算與推理[J].情報學(xué)報,2011,(4):417-423.
[14]孫勝平.中文微博客熱點話題檢測與跟蹤技術(shù)研究[D].北京:北京交通大學(xué),2011:41.
[15]許志凱.網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)的研究與實現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011:32.
THE RESEARCH ON THE MEASUREMENT METHOD OF THE INFLUENCE OF ONLINE REVIEW BASED ON SUBJECT DIVISION
JIN Jia-weiWANG Zhan-feng LI Ling-ling
(Chaohu College, Chaohu Anhui 238000)
With the rapid development of network and communication technology,consumers are more inclined to issue their online review on Internet.The review has an important impact on the purchase decision-making of potential consumers and marketing promotion of enterprises.This paper analyzes the influence of the online review on Internet,selects the influence indexes,and learns from the idea of subject division.Thus,it builds the method of measuring online review influence based on subject division,achieving effective evaluation of online community review influence.And the public comment network data is used to test its rationality and feasibility.
Online review;Subject division;Influence;Public comment network
TP393
A
:1672-2868(2017)03-0035-07
責(zé)任編輯:陳 侃
2017-03-04
巢湖學(xué)院校級科研項目(項目編號:XLY-201613);巢湖學(xué)院校級科研項目(項目編號:XLY-201407)
金加衛(wèi)(1986-),男,安徽鳳陽人。巢湖學(xué)院信息工程學(xué)院,助教。研究方向:電子商務(wù)。