汪祖柱,謝悅蕓
(安徽大學(xué) 管理學(xué)院,合肥 230601)
在線評論視角下App服務(wù)的用戶滿意度分析
汪祖柱,謝悅蕓
(安徽大學(xué) 管理學(xué)院,合肥 230601)
以“墨墨背單詞”“百詞斬”和“扇貝單詞”三個英語背單詞App為研究對象,通過對社交媒體上相關(guān)App用戶的在線評論文本的情緒挖掘,從中發(fā)現(xiàn)用戶使用這些App所關(guān)注的屬性信息及其情感極性,并以VIKOR多屬性決策方法分析用戶對于使用App所關(guān)注的各個屬性的滿意程度。研究表明:用戶關(guān)注屬性的程度從大到小依次為實用、效率、易用、經(jīng)濟、美觀,“墨墨背單詞”實用和效率屬性較好,“百詞斬”和“扇貝單詞”的用戶滿意度有待提高。
用戶滿意度;在線評論;情感分析;多屬性決策
中國互聯(lián)網(wǎng)信息中心發(fā)布的第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2016年12月,中國網(wǎng)民規(guī)模達7.31億。同時,我國手機網(wǎng)民規(guī)模達6.95億。臺式電腦、筆記本電腦的使用率下降,手機不斷擠占其他個人上網(wǎng)設(shè)備的使用[1]。隨著手機等移動設(shè)備的發(fā)展,移動學(xué)習(xí)憑借其隨時隨地性、實時性、個性化等諸多優(yōu)勢迅速蔓延開來。在移動學(xué)習(xí)的眾多應(yīng)用中,英語背單詞App(手機軟件)是該領(lǐng)域的典型應(yīng)用之一。英語詞匯的學(xué)習(xí)相比于其他傳統(tǒng)學(xué)科,有獨特的碎片化特點,允許學(xué)習(xí)中進行便捷的學(xué)習(xí)與記憶,因此,用App背單詞已成為許多用戶學(xué)習(xí)英語的風(fēng)尚。
用戶使用App后,以在線評論的方式通過社交媒體發(fā)表對此產(chǎn)品的觀點。用戶評論具有潛在的重要價值,但單個用戶評論不具有典型性,因此需要對此進行收集與挖掘;若通過人工進行統(tǒng)計,則會出現(xiàn)較多的錯誤和遺漏。并且,移動端的用戶評論和其他渠道的用戶評論相比有獨特的鮮明特點,即用戶一般更簡明扼要地表達對產(chǎn)品的看法,同時,這些情感信息反映了用戶使用App時所關(guān)注的一些App服務(wù)屬性及其情感反饋信息。
所以運用在線評論挖掘技術(shù)對在線評論文本數(shù)據(jù)進行分析已成必然趨勢。分析在線評論有利于企業(yè)在日益激烈的市場競爭中提升產(chǎn)品及服務(wù)品質(zhì),使得用戶享受到更優(yōu)質(zhì)的服務(wù)。本文主要通過對社交媒體中用戶在線評論文本的情感分析,以獲得用戶關(guān)于App使用的情感極性信息。在此基礎(chǔ)上運用多準則分析方法從整體上分析用戶使用App的滿意度,以進一步獲取用戶對于各種屬性的滿意程度。
本文主要對情感分析方面的研究進行概述,然后對多屬性分析方法VIKOR做概要敘述。
情感分析(sentiment analysis)又稱評論挖掘或意見挖掘(opinion mining),是指通過自動分析某種商品評論的文本內(nèi)容,發(fā)現(xiàn)消費者對該商品的褒貶態(tài)度和意見。
國外對于在線評論情感分析涉及的研究內(nèi)容較為廣泛,所用方法也較為先進。Turney[2]提出了基于PMI-IR算法的語義情感分類思想,該方法將點互信息(PMI)與信息檢索方法(IR)相結(jié)合,借助搜索引擎的后臺數(shù)據(jù)庫獲得語義傾向信息,從而做出情感判斷。Pang等[3]假定主客觀屬性相同的句子,位置分布上也會比較接近,從而將所選擇的句子形成一幅圖,然后利用求最小切割的方法來分類主、客觀句子。
Kang等通過編制特征詞和情感詞詞典、對英語在線評論文本構(gòu)建用戶觀點的關(guān)鍵詞向量,然后提出了一種結(jié)合VIKOR和情感分析的用戶滿意度測評體系,這種多準則評價方法更準確衡量用戶滿意度的具體屬性及其之間的區(qū)別,從而有利于產(chǎn)品設(shè)計者或制造者更好把握用戶對于產(chǎn)品各個屬性方面需求及其評價[5]。
國內(nèi)相關(guān)研究中,王根等[6]提出了詞語傾向性的極坐標方式,并且使用均衡化的互信息方法探討了詞語獨立于上下文的自身傾向性。朱嫣嵐等[7]提出基于HowNet的語義相似度和語義相關(guān)場等兩種詞匯語義傾向計算方法,實驗表明,前者方法計算結(jié)果比后者的精確率高。王素格等[8]提出了基于類別區(qū)分能力與情感詞表相結(jié)合的基準詞選取方法,然后根據(jù)詞匯與其同義詞很大程度上具有相同的情感傾向的特點,提出了基于同義詞的詞匯情感傾向判別方法,該方法不僅考慮了目標詞與基準詞的關(guān)聯(lián)強度,也考慮了目標詞的同義詞與基準詞的關(guān)聯(lián)強度。
VIKOR模型屬于多屬性決策模型,它的基本思想是;首先定義理想解PIS(Positive Ideal Solution)和負理想解NIS(Negative Ideal Solution),理想解是在各判斷準則下的備選方案的最佳者,負理想解是在各判斷準則下的備選方案的最差者;然后根據(jù)各方案屬性的解與理想解的接近程度,在可接受的決策條件下對方案的優(yōu)先性進行排序。VIKOR模型最大的特色就是最大化群體效益和最小化個別遺憾,因此妥協(xié)解是可以被決策者所接受的。
假設(shè)VIKOR模型有一組可能的方案記為A1,A2,…,Am,每個Ai(i=1,2,…,m)具有屬性記為C1,C2,…,Cn,每個屬性的權(quán)重分別記為W1,W2,…,Wn,W1+W2+…+Wn=1。方案Ai中的屬性Cj(j=1,2,…,n)所對應(yīng)的屬性值記為fij,由此得到:
(1)
(2)
其中:Si為群體效益,Si值越小,群體效益就越大;Ri為個別遺憾,Ri值越小,個別遺憾就越小。
3)S*=minSi,S-=maxSi,R*=minRi,R-=maxRi,若v是最大化群體效益的權(quán)重,那么(1-v)就是最小化個別遺憾的權(quán)重。在此基礎(chǔ)上得到:
(3)
VIKOR模型一般取v=0.5,用均衡折衷的方式以使群體效益最大化和個別遺憾最小化。且Qi值越小,說明備選方案越好。
4)將Qi(i=1,2,…,m)按照由小到大的順序進行排序,并對各方案及屬性進行比較和評價。
(4)
F1為Qi值排第一對應(yīng)的方案,F(xiàn)2為Qi值排第二對應(yīng)的方案。條件1視為可接受的利益門檻。
如果排序的方案為多個時,需要依次比較排序在第一位的方案與排在后面的各個方案之間的關(guān)系是否滿足條件1。
條件2:F1相應(yīng)的Si必須同時比F2相應(yīng)的Si值要?。换蛘逨1相應(yīng)的Si值必須同時比F2相應(yīng)的Ri值要小。條件2視為可接受的決策可靠度。
如果排序的方案為多個時,需要依次比較排序在第一位的方案與排在后面的各個方案之間的關(guān)系是否滿足條件2。
基于上述分析,得到該多屬性決策方法判斷準則為:如果F1和F2能同時滿足條件1和條件2,則F1被看作是最優(yōu)方案;如果F1和F2只滿足條件2,兩個方案都被認為是最優(yōu)方案。相應(yīng)地,如果排在第一的方案和排在其后的各個方案之間的關(guān)系都不符合條件1,而只是符合條件2的話,則所有不符合條件1的方案都被認為是最優(yōu)方案。
本文以“扇貝單詞”“墨墨背單詞”“百詞斬”3個App的用戶體驗為例,對這3個App用戶于社交媒體所發(fā)表的在線評論為研究對象。“扇貝單詞”首創(chuàng)了智能啟發(fā)式學(xué)習(xí)方式,用戶不做選擇題,而是必須自己判斷是否認識該單詞;“墨墨背單詞”根據(jù)用戶獨特的學(xué)習(xí)遺忘曲線,量身定制記憶單詞規(guī)劃,高效抗遺忘策略;“百詞斬”則為每一個單詞提供了趣味的配圖和例句,讓記單詞成為一種樂趣。為敘述方便,將“扇貝單詞”“墨墨背單詞”“百詞斬”分別表示為A1、A2、A3。
目前,微博已成為大眾化的輿論傳播中心,豆瓣是一個社區(qū)網(wǎng)站,其中“發(fā)現(xiàn)感興趣的移動應(yīng)用”板塊有用戶對App詳細評論,App Store則提供了高效的軟件銷售平臺,同時用戶可以通過這個平臺對軟件進行評價與評論。因此本文從App Store、微博、豆瓣等3個網(wǎng)絡(luò)平臺分別獲取3個App用戶的在線評論數(shù)據(jù)。
使用Fiddler軟件對App Store評論進行抓包,通過電腦監(jiān)控iTunes請求的接口、抓取HTTPS流量來獲得用戶在App Store上的評論數(shù)據(jù);另外針對微博和豆瓣上的用戶評論,使用八爪魚采集器進行爬取。微博、豆瓣、App Store 3個平臺中采集到的各App用戶評論數(shù)如表1所示,總計1 702條用戶評論。
表1 各App在網(wǎng)絡(luò)平臺上的客戶評論數(shù)量
數(shù)據(jù)的預(yù)處理包含分詞處理和詞性標注:分詞處理有利于識別屬性特征詞和情感詞;詞性標注能確定詞語的唯一詞性,避免在不同語境下的詞性歧義。本文使用NLPIR分詞系統(tǒng)進行分詞和詞性標注。
在用戶的評論中出現(xiàn)了眾多的屬性特征,不同屬性的重要程度不同。屬性特征詞在評論數(shù)據(jù)中出現(xiàn)次數(shù)的多少,能夠說明該屬性特征在用戶心中的重要程度。設(shè)用戶對于事件d的評論中,第k種屬性特征在評論中出現(xiàn)的頻率為nk(d)(k=1,2,…,m),則第k種屬性特征的權(quán)重Wk為
(5)
評論文本經(jīng)過預(yù)處理后,利用NLPIR的詞頻統(tǒng)計功能從中提取名詞以制作特征詞表,對各個特征詞表進行歸類、詞頻統(tǒng)計和排序,得到排在前面的五個屬性特征詞為:經(jīng)濟、實用、易用、美觀、效率。本文以這5個屬性特征詞形成屬性特征詞表,用于表征用戶關(guān)于背單詞App的滿意度影響因素。各個屬性的具體含義如表2所示。
表2 屬性特征詞及其含義
根據(jù)式(5)計算得到各個屬性的權(quán)重,如表3所示。
表3 屬性詞的頻率和加權(quán)權(quán)重
同樣地從預(yù)處理后的評論數(shù)據(jù)中提取出形容詞、副詞短語形成情感詞表,再結(jié)合知網(wǎng)(HowNet)詞典的“情感分析用詞語集”中的“中文情感分析用詞語集”,對情感詞語再次進行人工提取分類,并將情感詞語初步分成褒義、貶義、中性3大類。在此基礎(chǔ)上將情感詞語再細分為5類的極性表達:非常積極的、積極的、中性的、消極的和非常消極的,對應(yīng)的情感極性取值范圍分別為2~-2之間的整數(shù)。這樣就得到含有94個情感詞構(gòu)成的詞典,如表4所示。
表4 情感詞詞典
利用屬性特征詞表和情感詞詞典,可以將每個用戶評論轉(zhuǎn)化為關(guān)鍵詞向量。設(shè)CRi是第i個用戶的觀點集,PAij是第i個用戶的第j個觀點的屬性特征所對應(yīng)的情感分數(shù),則:
CRi=(PAi1,PAi2,…,PAin),i=1,2,…,m
(6)
設(shè)CS為各種屬性特征的用戶滿意度水平,PAk是m個用戶關(guān)于第k種屬性特征的情感極性分數(shù)之和,則情感極性分數(shù)的線性組合為:
(7)
根據(jù)式(6),每個用戶評論所包含的特征詞和情感詞及其對應(yīng)的情感分數(shù)都能計算出來,構(gòu)成用戶意見的關(guān)鍵詞向量。根據(jù)式(7),分別對3個App用戶評論關(guān)鍵詞向量進行加總,從而得到“扇貝單詞”“墨墨背單詞”“百詞斬”等3個App的關(guān)鍵詞屬性情感極性值向量分別為(105,71,24,7,-8)、(132,40,32,-1,9)、(98,35,64,11,2)。并將這3個向量中的每個屬性情感極性分數(shù)歸一化為0至1之間的數(shù)值,結(jié)果如表5所示。
表5 屬性情感極性分數(shù)的歸一化值
根據(jù)VIKOR算法,衡量用戶對于3個App服務(wù)平臺的整體滿意度水平。首先,根據(jù)式(5)計算屬性特征詞的理想解f*和負理想解f-,如表6所示。
表6 屬性特征的理想解f*值與負理想解f -值
表7 3個App的各項屬性特征的群體效益值
根據(jù)式(2),求解各個App群體效益Si值和個別遺憾Ri值,如表8所示。
表8 群體效益Si值和個別遺憾Ri值
此時,可以得到S*=minSi=0.487,S-=maxSi=0.600,R*=minRi=0.210,R-=maxRi=0.265。
不同的權(quán)重v值能體現(xiàn)不同權(quán)重的群體效益和個別遺憾,從而體現(xiàn)不同的用戶滿意度水平。將權(quán)重v值分別取值為1,0.5,0,由式(3)計算出不同v值對應(yīng)的妥協(xié)解Qi值,結(jié)果如表9所示。
表9 3個App的Si值、Ri值、Qi值及其排序
由式(4)可知,v=1時,Q(A1)-Q(A2)=0.885>0.5,Q(A3)-Q(A2)=1.000>0.5,此時3個App之間的關(guān)系滿足條件1,且S(A2)
當(dāng)v=0.5時,Q(A1)-Q(A2)=0.324<0.5,Q(A3)-Q(A2)=0.882>0.5,此時不滿足條件1。但S(A2)
當(dāng)v=0時,Q(A2)-Q(A1)=0.236<0.5,Q(A3)-Q(A1)=1.000>0.5,此時不滿足條件1,且S(A1)>S(A2),S(A1)
綜上,墨墨背單詞和扇貝單詞的排序都靠前。當(dāng)以折衷的方式,根據(jù)群體效益最大化和個別遺憾最小化,即權(quán)重v=0.5時,墨墨背單詞和扇貝單詞的排名分別為1和2。而且,兩個App的Qi值都出現(xiàn)等于零的情況,說明其用戶的滿意度較高。
由式(3)可知,若v=0,則(Si-S*)/(S--S*)=0,此時妥協(xié)解Qi值僅受到個別遺憾Ri值的影響,Ri值的微小變動均能影響屬性特征的表現(xiàn),影響用戶滿意度的整體評價,因此,企業(yè)應(yīng)該慎重選擇用于衡量和提高用戶滿意度水平的重要屬性特征。
由表3可知,用戶對英語背單詞App的屬性關(guān)注程度排序依次為:實用、效率、易用、經(jīng)濟、美觀。由表7和表8可知,墨墨背單詞在實用、易用方面表現(xiàn)突出;百詞斬在美觀和經(jīng)濟方面優(yōu)勢明顯,但在實用和效率方面有待改進;扇貝單詞在效率方面表現(xiàn)突出,但在易用屬性方面亟待提高,如用戶使用App期間頻頻發(fā)生閃退的問題,使得用戶對易用屬性的評價較差。
當(dāng)v值取0至1間不同數(shù)值時,3個App相應(yīng)的妥協(xié)解Qi值相對v值進行排序,如圖1所示。
圖1 權(quán)重v值的敏感性分析
由圖1可知,無論v值如何變化,對百詞斬的排序沒有任何影響,表明百詞斬的用戶滿意度水平不受其最大化群體效益Si值和最小化個別遺憾Ri值的影響;扇貝單詞的排序隨著v值的降低而提高,說明扇貝單詞在注意其最小化個別遺憾時將會有更高的用戶滿意度水平;墨墨背單詞的排序隨著權(quán)重v值的升高而提高,意味著最大化群體效益的重要性被重視時,墨墨背單詞將能獲得更高的用戶滿意度水平。按照判斷準則,墨墨背單詞和扇貝單詞的群體效益比較大,個別遺憾比較小,用戶滿意度水平較高;百詞斬的用戶滿意度水平有待提高。
本文運用情感分析對3個移動學(xué)習(xí)服務(wù)平臺的App的用戶評論文本進行分析,揭示用戶所關(guān)注的相關(guān)屬性,并結(jié)合多屬性決策分析方法VIKOR對這3個App的用戶滿意度進行比較分析。相對于傳統(tǒng)的滿意度研究,本文一方面利用社交媒體中的用戶評論作為數(shù)據(jù)源,從而避免了傳統(tǒng)研究中的數(shù)據(jù)獲取問題,并且利用新興的情感分析方法,能夠從用戶所關(guān)注的具體屬性方面比較分析用戶滿意度,研究結(jié)果顯示該方法是有效的。在社交媒體和電子商務(wù)日益發(fā)展的今天,本研究方法具有一定普適性。同時,本研究也存在一定的局限。一方面,本文使用的文本數(shù)據(jù)量較小,且限于目前的情感分析技術(shù)有待完善,在編制特征詞詞典和情感詞詞典時,還是較多地借助了人工的方法。在未來的研究發(fā)展方面,無論是理論研究還是實踐應(yīng)用,結(jié)合計算機應(yīng)用技術(shù)的文本挖掘,能夠較為可靠的利用大規(guī)模文本數(shù)據(jù)以分析和評測用戶滿意度問題,這都將是一個值得積極探索的方向。
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心.第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》[EB/OL].(2017-01-22)[2017-06-10].http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/t20170122_66437.htm.
[2]TURNEY P D.Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews[C]// Meeting on Association for Computational Linguistics. Association for Computational Linguistics,2002:417-424.
[3]PANG B,LEE L.A sentimental education:sentiment analysis using subjectivity summarization based on minimum cuts[C]//Meeting on Association for Computational Linguistics. Association for Computational Linguistics, 2004:271.
[4]MCDONALD R T,HANNAN K,NEYLON T, et al.Structured models for fine-to-coarse sentiment analysis[C]//ACL 2007, Proceedings of the, Meeting of the Association for Computational Linguistics,June 23-30,2007,Prague, Czech Republic. DBLP,2007:30-32.
[5]KANG D,PARK Y.Review-based measurement of customer satisfaction in mobile service: sentiment analysis and VIKOR approach[J].Expert Systems with Applications,2014,41(4):1041-1050.
[6]王根,趙軍.中文褒貶義詞語傾向性的分析[C]//學(xué)生計算語言學(xué)研討會,2006.
[7]朱嫣嵐,閔錦,周雅倩,等.基于HowNet的詞匯語義傾向計算[J].中文信息學(xué)報,2006,20(1):14-20.
[8] 王素格,李德玉,魏英杰,等.基于同義詞的詞匯情感傾向判別方法[J].中文信息學(xué)報,2009,23(5):68-74.
CustomerSatisfactionAnalysisofAppServicesbasedontheOnlineComments
WANGZuzhu,XIEYueyun
(Management School, Anhui University, Hefei 230601, China)
With the rapid dissemination of mobile services, more and more learners are reading and learning conveniently through App. Therefore, enhancement of customer satisfaction has emerged as a core issue for mobile software service providers. In this paper, three App using for reciting English words was taken as the object of study, and the attribute information the customers are interested in and the emotional polarity were found through mining the online reviews of these three App customers on social media. Then the satisfaction degree of each attribute the customers are concerned with was analyzed by using VIKOR multiple attribute decision model. Research results show that the degree customers concern to attributes are sorted from strong to weak is practical, efficient, easy to use, economic, and beautiful, and the practical and efficient attributes of “Ink Recite words” is better, and the customer satisfaction of “Hundred words cut” and “Scallop word” needs to be improved.
customer satisfaction; online comment; sentiment analysis; VIKOR
10.13542/j.cnki.51-1747/tn.2017.04.005
2017-10-08
國家社科基金項目(16BTQ053);安徽大學(xué)2016年省級大學(xué)生創(chuàng)新實驗項目資助(201610357294)
汪祖柱(1969—),男,副教授,博士,研究方向:信息管理的理論與方法,電子郵箱:97087@ahu.edu.cn。
謝悅蕓(1995—),女,信息管理與信息系統(tǒng)專業(yè),2013級本科生。
TP391
A
2095-5383(2017)04-0021-06