陳 曄, 曹 帥, 徐海燕, 盧 波
(南京航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211100)
?
以顧客需求導(dǎo)向的產(chǎn)品評(píng)價(jià)體系構(gòu)建研究
陳曄, 曹帥, 徐海燕, 盧 波
(南京航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211100)
針對(duì)產(chǎn)品評(píng)價(jià)體系構(gòu)建的問(wèn)題,提出了一種通過(guò)對(duì)顧客評(píng)論信息的挖掘進(jìn)行顧客需求的識(shí)別,進(jìn)而應(yīng)用數(shù)據(jù)聚類分析,自下而上地構(gòu)建產(chǎn)品評(píng)價(jià)體系的方法。有別于傳統(tǒng)多屬性評(píng)價(jià)分析中大多通過(guò)自上而下(從概括到具體)方式進(jìn)行評(píng)價(jià)體系構(gòu)建的思路,該方法以顧客評(píng)價(jià)信息為導(dǎo)向,使最終構(gòu)建出來(lái)的產(chǎn)品評(píng)價(jià)體系更具客觀性,能有效為產(chǎn)品評(píng)價(jià)體系優(yōu)化設(shè)計(jì)提供幫助,相關(guān)案例演算展示了方法的可行性。
多屬性決策; 指標(biāo)體系; 語(yǔ)言評(píng)價(jià)集; 逆向構(gòu)建; 顧客需求識(shí)別
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心相關(guān)報(bào)告顯示:截至2014年6月,我國(guó)網(wǎng)購(gòu)用戶規(guī)模達(dá)3.32億,隨著互聯(lián)網(wǎng)廣泛應(yīng)用,各電商網(wǎng)站積累了大量產(chǎn)品或服務(wù)的客戶評(píng)論,能在很大程度上影響消費(fèi)者購(gòu)買(mǎi)決策[1]。自2002年,評(píng)論挖掘研究逐漸興起,如Turney[2]提出將語(yǔ)義傾向性應(yīng)用在評(píng)論分類,將評(píng)論分為兩類,推薦和不推薦。Dave等[3]開(kāi)發(fā)了情感分析工具和針對(duì)給定產(chǎn)品評(píng)論區(qū)別其褒貶性的系統(tǒng)ReviewSeer。漢語(yǔ)評(píng)論挖掘研究起步較晚,如文獻(xiàn)[4]通過(guò)數(shù)據(jù)挖掘手段發(fā)現(xiàn)產(chǎn)品主要特征,分析顧客對(duì)這些特征評(píng)價(jià)和態(tài)度;文獻(xiàn)[5]采用共詞分析和基于句法分析的極性傳遞法,構(gòu)建了評(píng)論挖掘模型;李愛(ài)清等構(gòu)建了手機(jī)產(chǎn)品評(píng)論挖掘?qū)嶒?yàn)數(shù)據(jù)集和可視化平臺(tái)[6]。沿著應(yīng)用評(píng)論挖掘思路,本文探索了自下而上構(gòu)建指標(biāo)評(píng)價(jià)系統(tǒng)的研究。
指標(biāo)集和評(píng)價(jià)集構(gòu)成了整個(gè)評(píng)價(jià)體系,是多屬性決策的兩個(gè)核心要素。現(xiàn)有對(duì)于評(píng)價(jià)體系構(gòu)建研究,多采用自上而下的指標(biāo)體系構(gòu)建思路,即通過(guò)直觀抽象分析,從概括到具體的正向逐層構(gòu)建思路,從總目標(biāo)出發(fā),細(xì)化為子目標(biāo),通過(guò)層層分解,最后形成可量化的指標(biāo)集。如層次分析法(AHP)為這一思路典型代表[7]。而針對(duì)評(píng)價(jià)集的構(gòu)建,通常按照定性和定量指標(biāo)兩大類分別處理。其中定量指標(biāo)可通過(guò)各種途徑如統(tǒng)計(jì)文獻(xiàn)直接獲得客觀數(shù)據(jù),而定性指標(biāo)則相對(duì)復(fù)雜,簡(jiǎn)單處理方法可通過(guò)邀請(qǐng)專家直接打分獲取,如通過(guò)問(wèn)卷調(diào)研,或者構(gòu)建不同類型的基于語(yǔ)言評(píng)價(jià)集,如模糊語(yǔ)言[8]評(píng)價(jià)。
圖1 多屬性決策傳統(tǒng)自上而下構(gòu)建模式圖
1.1整體構(gòu)建框架
傳統(tǒng)自上而下的評(píng)價(jià)體系構(gòu)建,主觀因素多,無(wú)法有效反映備選方案自身的特征信息。而隨著電子商務(wù)在深度和廣度的應(yīng)用,積累了大量顧客對(duì)產(chǎn)品的評(píng)價(jià)信息。鑒于此,依托于聚類分析方法[9],提出基于顧客需求[10]的評(píng)價(jià)體系逆向構(gòu)建方法。
基本流程如下。1)顧客評(píng)價(jià)文本挖掘與處理:將分散的顧客評(píng)價(jià)信息,運(yùn)用文本挖掘技術(shù)結(jié)合專家判斷,根據(jù)頻度、語(yǔ)義的前后關(guān)聯(lián)程度以及評(píng)論語(yǔ)言的主觀內(nèi)容識(shí)別,整理成高頻短語(yǔ),即名詞+形容詞/副詞形式。2)相似度判定及相似矩陣構(gòu)建:上述高頻短語(yǔ)中的名詞設(shè)為基本指標(biāo)元素,通過(guò)專家判斷語(yǔ)義相似性,構(gòu)建相似度矩陣,類似處理形容詞/副詞形成基本語(yǔ)言評(píng)價(jià)元素,構(gòu)建基本語(yǔ)言評(píng)價(jià)相似度矩陣。3)基于聚類指標(biāo)集和子目標(biāo)集構(gòu)建:對(duì)基本指標(biāo)元素相似度矩陣的聚類分析,形成指標(biāo)集,進(jìn)一步對(duì)指標(biāo)集構(gòu)建相似度矩陣和聚類分析,從而獲得子目標(biāo)集。4)基于聚類評(píng)價(jià)集構(gòu)建:對(duì)基本語(yǔ)言評(píng)價(jià)元素相似度矩陣的聚類分析,形成語(yǔ)言評(píng)價(jià)集。5)產(chǎn)品評(píng)價(jià)體系整合優(yōu)化:通過(guò)整合以上獲得的指標(biāo)集、子目標(biāo)集和語(yǔ)言評(píng)價(jià)集,實(shí)現(xiàn)自下而上的評(píng)價(jià)體系構(gòu)建,可用以指導(dǎo)產(chǎn)品評(píng)價(jià)體系的優(yōu)化,如顧客調(diào)查問(wèn)卷的優(yōu)化設(shè)計(jì)。
1.2顧客評(píng)價(jià)的挖掘和處理
表1 有效高頻詞組
1.3相似性判定及相似矩陣構(gòu)建
邀請(qǐng)專家在充分理解評(píng)價(jià)者的真實(shí)表達(dá)意圖基礎(chǔ)上,針對(duì)基本名詞單元集或者基本形容詞/副詞單元集分別進(jìn)行兩兩相似性判斷(用0~1之間的數(shù)值表示),形成相似矩陣。進(jìn)一步,定義如下:基本詞語(yǔ)的相似程度,S(nj,ni),為詞nj與詞ni的相似程度,0≤S(nj,ni)≤1,從定義易知,S(nj,ni)=S(ni,nj),構(gòu)建如表2所示基本詞語(yǔ)(以名詞為例)相似矩陣。
表2 詞語(yǔ)相似矩陣
2.1聚類算法概述
聚類分析是將數(shù)據(jù)劃分或分組處理聚成不同的類的過(guò)程,同一個(gè)類中的對(duì)象間具有強(qiáng)相似性,而不同類間的對(duì)象具有強(qiáng)相異性。在分類過(guò)程中,不必事先給出一個(gè)分類標(biāo)準(zhǔn),聚類分析能夠從數(shù)據(jù)出發(fā),客觀地決定分類標(biāo)準(zhǔn)。主要的聚類算法有層次聚類分析(hierarchical cluster analysis)[13]和K-means算法[14]。
在層次聚類過(guò)程中,需要確定聚類過(guò)程中樣本與類、類與類之間的距離度量方式,常用的距離度量方式[16]有最小距離(single-link)、最大距離(complete-link)、平均值距離(average-link)、均值點(diǎn)距離(mean-distance)及離差平方和(ward法)。本文采用層次聚類方法,通過(guò)聚類個(gè)數(shù)與相似性水平交互對(duì)比,將基本名詞(形容詞/副詞)元素進(jìn)行聚類,構(gòu)建指標(biāo)集和子目標(biāo)集。
2.2基于聚類的指標(biāo)(子目標(biāo))集構(gòu)建
圖2 基于聚類的指標(biāo)(子目標(biāo))集構(gòu)建流程圖
圖2為基于聚類的指標(biāo)集和子目標(biāo)集的構(gòu)建流程圖。
通過(guò)上述兩輪聚類,依次完成從基本指標(biāo)元素到指標(biāo)集以及從指標(biāo)集到子目標(biāo)的逆向構(gòu)建過(guò)程。
2.3基于聚類的語(yǔ)言評(píng)價(jià)集構(gòu)建
圖3 基于聚類的語(yǔ)言評(píng)價(jià)集構(gòu)建過(guò)程
為了驗(yàn)證方法有效性,選取京東商城作為實(shí)驗(yàn)載體,通過(guò)對(duì)其商品URL的規(guī)律抽取關(guān)鍵信息[15]:通過(guò)URL抓取頁(yè)面源碼,分析源碼中所需信息的上下文環(huán)境,得到抽取規(guī)則,用正則表達(dá)式表示該規(guī)則,然后進(jìn)行抽取。限于篇幅,本文選擇近期受關(guān)注的國(guó)產(chǎn)手機(jī)錘子作為研究對(duì)象,進(jìn)行算法演示分析。
3.1評(píng)價(jià)指標(biāo)(子目標(biāo))集構(gòu)建
1)基本數(shù)據(jù)的預(yù)處理。首先利用火車頭數(shù)據(jù)采集平臺(tái)來(lái)抽取網(wǎng)站評(píng)論頁(yè)面的信息,截止實(shí)驗(yàn)時(shí),錘子手機(jī)在售的3種不同型號(hào)的產(chǎn)品共計(jì)7 173條評(píng)論,考慮到用戶隱私以及實(shí)際需要,本文只抽取了用戶關(guān)于商品的評(píng)價(jià)語(yǔ)言。在評(píng)論語(yǔ)言中,會(huì)出現(xiàn)“外觀”、“外形”、“看起來(lái)”、“樣子”這種明顯同義的名詞,在完成分詞處理之后,首先把這種明顯同義的詞語(yǔ)用出現(xiàn)頻率最高那一個(gè)詞語(yǔ)替代表示。
2)基本指標(biāo)元素與相似度矩陣的構(gòu)建。本文通過(guò)對(duì)錘子手機(jī)7 000多條評(píng)論語(yǔ)言的預(yù)處理,合并整理出20個(gè)高頻名詞用于本次試驗(yàn)的基本指標(biāo)元素構(gòu)建,即N={手機(jī),外觀,錘子(手機(jī)品牌),系統(tǒng)運(yùn)行,老羅(該品牌創(chuàng)始人),手感,國(guó)產(chǎn),包裝,細(xì)節(jié),設(shè)計(jì),做工,后蓋,UI,配置,硬件,拍照效果,按鍵,屏幕,音質(zhì),配件},之后通過(guò)邀請(qǐng)10名智能機(jī)資深用戶進(jìn)行名詞間的相似度比較,構(gòu)建基本指標(biāo)元素相似度矩陣,受篇幅限制,本文只提供部分?jǐn)?shù)據(jù)如表3所示。
3)基本指標(biāo)元素聚類分析。本文選用Minitab進(jìn)行聚類分析,選定離差平方和的聯(lián)結(jié)規(guī)則,選擇相關(guān)性作為距離量度,設(shè)定α1等于60,作為基本指標(biāo)元素聚類的相似度閾值,處理后得出如圖4的聚類結(jié)果。
表3 基本指標(biāo)元素相似度矩陣
圖4 基本指標(biāo)元素聚類結(jié)果和指標(biāo)集聚類結(jié)果
4)指標(biāo)集和子目標(biāo)集的構(gòu)建。由樹(shù)狀圖(圖4a)可知最終共聚為9類,并用綜合名詞進(jìn)行代表替換,即:c1={手機(jī),錘子,老羅}→品牌口碑(即用品牌口碑作為指標(biāo)整合代表手機(jī)、錘子和老羅3個(gè)基本指標(biāo)元素),c2={外觀,包裝,按鍵}→外觀包裝,c3={系統(tǒng)運(yùn)行,國(guó)產(chǎn),設(shè)計(jì),UI}→系統(tǒng)設(shè)計(jì),c4={手感,做工,后蓋}→工藝水平,c5={細(xì)節(jié),配件}→細(xì)節(jié)配件,c6={配置,硬件}→硬件配置,c7={拍照效果},c8={屏幕},c9={音質(zhì)},從而完成指標(biāo)集的構(gòu)建,即:C={c1,c2,…,c9}。
類似地通過(guò)構(gòu)建指標(biāo)集相似度矩陣,并設(shè)定α2=70,作為指標(biāo)集聚類的相似度閾值,根據(jù)處理結(jié)果的樹(shù)狀圖(圖4b)顯示進(jìn)行類似綜合名詞代表,即:g1={品牌口碑,系統(tǒng)設(shè)計(jì)}→品牌與設(shè)計(jì),g2={工藝水平},g3={外觀包裝,細(xì)節(jié)配件}→外觀與細(xì)節(jié),g4={硬件配置,屏幕}→硬件配置,g5={拍照效果,音質(zhì)}→拍照與音質(zhì),從而完成子目標(biāo)集的構(gòu)建,即:G={g1,g2,g3,g4,g5}。
3.2語(yǔ)言評(píng)價(jià)集的構(gòu)建
通過(guò)對(duì)顧客的評(píng)論挖掘,根據(jù)對(duì)詞義的了解和分析,把表達(dá)的情感傾向程度十分相近的形容詞/副詞等用于評(píng)價(jià)手機(jī)的詞語(yǔ)歸為一類。如“贊”和“給個(gè)贊”歸為一類,用“贊”代替表示。本文通過(guò)整理綜合后,邀請(qǐng)資深用戶進(jìn)行基本語(yǔ)言元素的相似度判定,其相似度矩陣的部分?jǐn)?shù)據(jù)如表4。選定離差平方和的聯(lián)結(jié)規(guī)則,設(shè)定β=85,作為基本語(yǔ)言評(píng)價(jià)元素聚類的相似度閾值,處理后得出如圖5所示的聚類結(jié)果,即o1={精致,人性化,非常好,大贊,流暢}→非常好,o2={很好,贊,好}→好,o3={還好,不錯(cuò),還算可以}→還算可以,o4={一般,需要完善,湊合}→一般,o5={易留指紋,噪點(diǎn)很多,不適應(yīng),不方便,發(fā)熱,不怎么耐用,不精準(zhǔn)}→存在問(wèn)題,從而完成語(yǔ)言評(píng)價(jià)集的構(gòu)建,即O={o1,o2,o3,o4,o5}。
表4 基本語(yǔ)言評(píng)價(jià)元素相似度矩陣
圖5 基本語(yǔ)言評(píng)價(jià)元素聚類結(jié)果
3.3產(chǎn)品評(píng)價(jià)體系的整合優(yōu)化分析
依托前文計(jì)算結(jié)果,以下給出該產(chǎn)品評(píng)價(jià)體系的優(yōu)化設(shè)計(jì)建議。 1)評(píng)價(jià)指標(biāo)體系設(shè)計(jì):根據(jù)前文獲得的指標(biāo)集和子目標(biāo)集,建議調(diào)查應(yīng)該從5個(gè)大維度(對(duì)應(yīng)5個(gè)子目標(biāo))進(jìn)行總體設(shè)計(jì),即:品牌與設(shè)計(jì)、工藝水平、外觀與細(xì)節(jié)、硬件配置、拍照與音質(zhì);進(jìn)一步,對(duì)品牌與設(shè)計(jì)維度,相關(guān)問(wèn)題應(yīng)該圍繞:品牌口碑、系統(tǒng)設(shè)計(jì)(即分別對(duì)應(yīng)每個(gè)子目標(biāo)包含的指標(biāo)集)。 2)評(píng)價(jià)的語(yǔ)言尺度設(shè)計(jì):根據(jù)獲得的語(yǔ)言評(píng)價(jià)集,建議語(yǔ)言評(píng)價(jià)應(yīng)該從以下5個(gè)層級(jí)(對(duì)應(yīng)5個(gè)語(yǔ)言評(píng)價(jià)集)進(jìn)行設(shè)計(jì),即:非常好、好、還算可以、一般、存在問(wèn)題。
隨著互聯(lián)網(wǎng)驅(qū)動(dòng)的電子商務(wù)在我國(guó)蓬勃發(fā)展,在2013年已占我國(guó)GDP總量15%,其應(yīng)用深度和廣度日益拓展,積累了大量各類用戶數(shù)據(jù),如何有效地應(yīng)用數(shù)據(jù)分析工具去識(shí)別顧客需求成為一個(gè)研究熱點(diǎn)。本文通過(guò)挖掘顧客評(píng)論辨識(shí)顧客需求,以顧客需求為導(dǎo)向,利用文本挖掘與聚類思想和方法,構(gòu)建產(chǎn)品評(píng)價(jià)體系。有別于傳統(tǒng)自上而下的指標(biāo)體系構(gòu)建方法,所提方法使得評(píng)價(jià)體系構(gòu)建更客觀,更貼近真實(shí)的用戶意圖。由此設(shè)計(jì)的評(píng)價(jià)體系也更貼近顧客關(guān)注的價(jià)值,從而幫助決策者準(zhǔn)確地把握產(chǎn)品反饋和市場(chǎng)動(dòng)向。
[1]韓偉偉,王晶.從神經(jīng)學(xué)角度評(píng)估分析消費(fèi)者網(wǎng)略購(gòu)物決策[J].工業(yè)工程, 2015,18(1):135-141.
HAN Weiwei, WANG Jing. Assessment from a neurological perspective analysis of consumer online shopping decisions[J].Industrial Engineering Jourmal, 2015,18(1): 135-141.
[2]TURNEY P. Mining the web for synonyms: PMI-IR versus LSA on TOEFL[C]. Proceedings of the 12th European Conference on Machine Learning,Berlin,2001:491-502.
[3]DAVE K, LAWRENEE S, PENNOEK D. Mining the peanut gallery: opinion exaction and semantic classification of product reviews[C]. In Proceeding Of WWW(World Wide Web)’2003, 2003:519-528.
[4]李實(shí), 葉強(qiáng), 李一軍. 中文網(wǎng)絡(luò)客戶評(píng)論的產(chǎn)品特征挖掘方法研究[J]. 管理科學(xué)學(xué)報(bào), 2009, 12(2): 142-152.
LI Shi, YE Qiang, LE Yijun. Product features of Chinese network customer review mining methods[J]. Journal of Management Sciences in China, 2009, 12(2): 142-152.
[5]唐曉波,肖璐.基于情感分析的評(píng)論挖掘模型研究[J].情報(bào)理論與實(shí)踐,2013(7):100-105.
TANG Xiaobo, XIAO Lu. The model of information theory and practice in mining sentiment analysis based on the comments[J]. 2013(7):100-105.
[6]李愛(ài)清,何爍,郗亞輝.產(chǎn)品評(píng)論挖掘可視化試驗(yàn)平臺(tái)的開(kāi)發(fā)[J].河北大學(xué)學(xué)報(bào)(自然科學(xué)版), 2012, 32(2):212-217.
LI Aiqing, HE Shuo, XI Yahui. Product reviews of test platform for the mining development[J]. Journal of Hebei University of technology(Natural Science), 2012, 32(2): 212-217.
[7]許樹(shù)柏.層次分析法原理[M].天津:天津大學(xué)出版社,1988.
[8]徐澤水.基于模糊語(yǔ)言評(píng)估及語(yǔ)言O(shè)WA算子的多屬性群決策法[J]. 系統(tǒng)工程, 2002, 20(5):79-82.
XU Zeshui. Based on fuzzy linguistic assessments and linguistic OWA operator for multiple attribute group decision making method[J]. Systems Engineering, 2002, 20(5): 79-82.[9]廖勇,陳曄,徐海燕.基于優(yōu)勢(shì)粗糙集的中小企業(yè)二維績(jī)效評(píng)價(jià)模型[J].工業(yè)工程,2015,18(2):119-127.
LIAO Yong, CHEN Ye, XU Haiyan. Two-dimensional performance evaluation of SMEs based on dominance rough set model[J]. Industrial Engineering Journal, 2015,18(2): 119-127.
[10]孫曉東,馮學(xué)鋼.多顧客個(gè)性化需求下產(chǎn)品屬性配置策略[J].工業(yè)工程, 2013,16(1):54-60.
SUN Xiaodong, FENG Xuegang. Multi-customer demand for personalized product attributes configuration policy[J]. Industrial Engineering Journal, 2013,16(1): 54-60.
[11]秦凱.Android開(kāi)源社區(qū)應(yīng)用項(xiàng)目開(kāi)發(fā)的效率研究[D].廣州:華南理工大學(xué),2012.
Qin Kai.Study the development efficiency of android open source application project[D].Guangzhou:South China University of Technology,2012.
[12]張紫瓊,葉強(qiáng),李一軍.互聯(lián)網(wǎng)商品評(píng)論情感分析研究綜述[J].管理科學(xué)學(xué)報(bào), 2010,13(6):84-96.
ZHANG Ziqiong, YE Qiang, LI Yijun. Internet product reviews review of sentiment analysis[J]. Journal of Management Sciences in China, 2010,13(6): 84-96.
[13]田久樂(lè),趙蔚.基于同義詞詞林的詞語(yǔ)相似度計(jì)算方法[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版), 2010,28(6):602-608.
TIAM Jiule, ZHAO Wei. Calculation of word similarity based on synonym word forest[J]. Journal of Jilin University(Information Science), 2010,28(6): 602-608.
[14]賀玲,吳玲達(dá),蔡益朝.數(shù)據(jù)挖掘中的聚類算法綜述[J].計(jì)算機(jī)應(yīng)用研究, 2007(1): 10-13.
HE Ling, WU Lingda, CAI Yichao. A summary of clustering algorithm in data mining[J]. Computer Application Research, 2007(1): 10-13.
[15]王繼成,潘金貴,張福炎.Web文本挖掘技術(shù)研究[J].計(jì)算機(jī)研究與發(fā)展, 2000, 37(5):513-520.
WANG Jicheng, PAN Jingui, ZHANG Fuyan. Web text mining technology research[J]. Journal of Computer Research and Development, 2000, 37(5): 513-520.
Customer Demand-oriented Product Evaluation System Construction
CHEN Ye, CAO Shuai, XU Haiyan, LU Bo
(College of Economy and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 211100, China)
Aiming at the problem of product evaluation system, a bottom-up method of constructing evaluation system of product is proposed, which needs mining customer reviews, identifying the needs of customers, and then applying data to a clustering analysis. Unlike traditional multiple attribute evaluation and analysis of the most top-down (from generalization to specific) approach to the idea of building evaluation system, this method is customer demand-oriented, from bottom to top, layers forward, so that the final product evaluation system contains more objective features, thus helping to optimize the product evaluation design. Finally, a case study demonstrates the feasibility of the proposed method.
multiple attribute decision making; criteria set; linguistic evaluation set; reverse construction; customer needs' identification
2015- 05- 26
國(guó)家自然科學(xué)基金資助項(xiàng)目(71471087)
陳曄(1974-)男,江蘇省人,教授,博士,主要研究方向?yàn)槎鄬傩詻Q策與優(yōu)化.
10.3969/j.issn.1007- 7375.2016.04.005
C934
A
1007-7375(2016)04- 0030- 06