徐 斌,余軍合,沙 鶴,施培妤,吳 宇
(寧波大學機械工程與力學學院,浙江寧波 315211)
互聯(lián)網時代,越來越多的用戶喜歡在互聯(lián)網上發(fā)布對產品或服務的在線評論[1],這些在線評論中包含了客戶對各種產品特性的評價信息,表征出客戶特定的偏好、觀點和情感等,通過挖掘在線評論中客戶對產品特性的偏好和滿意度能夠為產品改進提供決策支持[2]。大量產品在線評論信息以文本形式存在,需要解決幾個方面的問題:如何抽取每條評論信息表述的產品特征,評判客戶情感(如正面或者負面評價),不同產品特征對客戶滿意度的影響程度,已經有相關文獻對在線產品評論數(shù)據(jù)分析方法展開了研究。
情感分析(Sentiment Analysis,SA)能夠用來評判客戶評論的正面性和負面性,是常用的產品評論信息分析技術之一。目前情感分析方法可分為兩大類:基于情感詞典的方法和基于機器學習的方法?;谇楦性~典的方法是利用情感詞典、領域詞典等人工編寫的詞典來獲取文本的情感極性,構建一個能準確評價情感強度的詞典是其核心工作[3]。楊小平等(2017)[4]將三個基礎情感詞典合并,并用Word2vec 進行訓練來自動構建情感詞典。尤眾喜等(2019)[5]發(fā)現(xiàn)在針對不同的情感詞典,分詞器在語料-詞典匹配度、詞典低頻詞比例以及中性語料占比方面表現(xiàn)出不同程度的差異?;跈C器學習的方法重點在于提取合適的標簽來表征文本。通過人工標注文本的情感類別并將文本向量化表示,然后利用機器學習的方法對情感分類器進行訓練,最終獲得文本的情感極性[6]。Chen 等(2017)[7]為了解決特定主題下的情感分類問題提出了結合位置注意力機制與循環(huán)神經網絡的組合方式。Baziotis 等(2017)[8]將注意力機制融入到深度LSTM 模型中并在SemEval-2017 情感分類任務中獲得了不錯的效果。Kumar 等(2018)[9]將雙層注意力機制加入到BiLSTM 模型中,分別提高了文本詞語級和句子級的特征提取效果。
Kano 等指出顧客對產品的不同特征有不同的態(tài)度,不同的特征對顧客滿意度的影響程度也不同,并提出了根據(jù)產品特征對顧客滿意度的影響進行分類的基于問卷調查的KANO 模型。唐娜(2016)[10]在圖書館數(shù)字參考咨詢服務質量的評價中引入了KANO 模型。Violante 和Vezzetti(2017)[11]將產品功能劃分為KANO 類別,為設計師設計新產品提供有價值的信息。Liu 等(2019)[12]通過KANO 模型將社交媒體中提及的產品功能進行劃分。Bigorra 等(2019)[13]提出了一種將文本數(shù)據(jù)中提取的方面自動分類為KANO 類別的方法。趙宇翔等(2019)[14]利用KANO 模型將公眾科學平臺游戲化要素進行劃分并提出了對策建議。李夢楠和周秀會(2019)[15]通過KANO 模型將高校圖書館微信公眾號的服務內容分類并提出滿意度最大化的管理策略。
KANO 模型分類研究目前大多數(shù)采用調查問卷的形式,本文嘗試從產品在線評論數(shù)據(jù)中挖掘客戶需求,并進行KANO 模型產品特征類別劃分,為設計者提供產品改進策略。本文首先通過LDA 模型對評論文本進行聚類分析獲得主題詞,通過篩選主題詞來明確評論文本中包含的產品特征;然后對評論文本進行特征分類和情感分析;最后基于情感結果和產品特征占比及重要度構建了產品特征KANO分類模型,基于KANO 分析結果提出了產品特征改進意見,并結合實例進行實證。
詞向量模型作為自然語言處理NLP 的基本工具,能夠把真實世界抽象存在的文字轉換成數(shù)學空間的詞向量表達,在向量空間完成各種文本信息處理和各種文本處理任務。詞向量模型從word2vec 到ELMo 再到BERT(Bidirectional EncoderRepresentation from Transformers),被認為是自然語言處理領域的突破。Devlin 等(2018)[16]在2018 年提出的BERT 語言模型,在自然語言領域的11 項任務中取得了突破,包括文本分類、情感分析、問答系統(tǒng)等典型應用。
BERT 把自然語言處理任務分成兩個部分:預訓練產生詞向量和針對下游具體NLP 任務對模型的微調整。BERT 通過在海量語料基礎上采用自監(jiān)督學習方法為單詞學習一個好的特征表示,在下游特定的NLP 任務中可以直接使用BERT 模型的特征向量表示作為任務的詞向量特征,BERT 提供了一個供其它任務遷移學習的模型。很多文獻都采用Google 開源的BERT 模型作為預訓練詞向量進行相關研究,本文提出如圖1 所示的基于BERT 語言模型的產品評論數(shù)據(jù)分析框架,分析每條產品評論的產品特征和情感特征。
圖1 基于BERT 模型的評論數(shù)據(jù)分析框架
獲取特征詞的一種常用方法是通過詞頻統(tǒng)計選取高頻詞作為特征詞,這種方式選取出來的特征詞雖然一定程度上能代表產品特征,但卻會遺漏一些重要的低頻詞,并不能很好的代表產品評論中涉及到的產品特征。
LDA 模型是一種利用三層貝葉斯網絡識別文本中主題信息的無監(jiān)督的機器學習方法。該模型能將文檔劃分成不同的主題類,并提取每類主題下的主題詞,主題詞是對主題類的內部結構的反映,可以顯示出主題類涉及到的方面。通過K-means 算法明確聚類數(shù)然后利用LDA 模型選擇最優(yōu)類進行聚類并提取主題類中的主題詞,從主題詞中篩選出與產品特征相關的特征詞,這些特征詞能夠表示評論文本中主要涉及到的產品特征。
BERT 模型在預訓練階段創(chuàng)新性的提出了“Masked LM(MLM)”和“Next Sentence Prediction(NSP)”兩個任務來增強模型的語義表達能力。文本的特征分類和情感分析都是BERT 模型中典型的下游任務,是句子級別的分類任務。BERT 模型輸出第一個[CLS]隱含了句子的分類特征,只需要增加一層權重w 后采用softmax 函數(shù)就能實現(xiàn)句子級別的分類任務。通過選擇一定數(shù)量的帶有特征標簽或情感標簽的樣本數(shù)據(jù),利用BERT 模型進行分類器分類訓練從而能夠實現(xiàn)對產品評論的特征分類和情感分析。
Kano 等指出用戶對不同的產品特征有不同偏好,不同特征對用戶滿意度的影響也不同,在對產品評論進行特征分類和情感分類的基礎上,能夠通過統(tǒng)計信息表征KANO 模型中產品必備特征、期望特征和魅力特征等信息。從每款產品的產品評論中提取,其中表示第p 款產品的第i 個產品特征分別表示第p 款產品評論中第i 個產品特征的正向情感評論比例和負向情感評論比例,表示第p 款產品的第i 個產品特征的評論數(shù)量。
基于產品評論數(shù)據(jù)實現(xiàn)KANO 模型產品特征分類取決于產品特征占比(PCFi)、產品特征重要度(PCDi)以及產品特征情感值(Ei)。
產品特征占比(PCFi):第i 個產品特征被評論次數(shù)占總產品評論數(shù)的相對比例,可以通過計算產品特征i 在每款產品的評論中所占比例的均值來計算,如公式(1)所示:
其中,m 指共有m 款產品,Rp是第p 款產品的產品評論總數(shù)。產品特征占比可以用來表征產品特征在系列產品中的通用性。
產品特征重要度(PCDi):產品評論中第i 個產品特征在各款產品評論中占主要地位的比重。PCDi接近1 說明該產品特征在所有產品的評論中都占據(jù)主要地位,而PCDi接近0 則意味著該產品特征在所有產品的評論中都只是偶爾被提及。PCDi的計算如公式(2)所示:
以KANO 類別定義為基礎,根據(jù)上述指標和產品評論數(shù)據(jù)將產品特征分為必備特征(M)、期望特征(O)和魅力特征(A),如圖2 所示。
必備特征(M):產品提供該特征,不會提高用戶滿意度;不提供該特征,則會引起用戶的強烈不滿,大幅度降低用戶滿意度。從客戶產品評論的角度來看,產品必備特征會被大多數(shù)用戶提到(即PCFi值較高),重要度也高(即PCDi值較高);同時,作為必備特征,正向情感值要遠大于負向情感值(即,因為必備特征一般是產品所具有的通用功能,如果是非常負面的評價,產品必定會被淘汰。
期望特征(O):產品提供該特征能使用戶滿意,該特征的性能越好用戶滿意度越高;不提供該特征或該特征性能很差則會大幅度降低用戶滿意度。相比于必備特征,期望特征受關注度較低,一些用戶在評論時并不會提及這些特征(即PCFi值較低),然而這些特征也是產品的重要特征,在產品組評論中占有主要地位(即PCDi值較高)。這些特征只能達到一部分用戶的期望,因此,在評論集中期望特征的正向情感值和負向情感接近值
魅力特征(A):產品提供該特征,則會大幅度提高用戶滿意度;不提供該特征,則不會影響用戶滿意度。這些特征的實際效果比用戶預期的更好,否則用戶在評論中不會提及它們(即PCFi值較低),而且并非是所有的產品品牌都能夠實現(xiàn)這些特征,所以這些特征在評論組中并不占有主要地位(即PCDi值較低)。在情感方面,這些特征的正向情感值要遠遠大于負向情感值(即,)。
圖2 基于KANO 模型的產品特征分類
圖2 中PCFi閾值表示在整個產品評論組中產品特征被廣泛提及的比例。PCFi閾值表示在整個產品評論組中產品特征占主要地位的比例。這些閾值取決于所關注的目標產品、市場特征等因素。
利用網絡爬蟲技術從“京東商城(www.jd.com)”上獲取空調類別下銷量排名前60 位的各品牌產品評論數(shù)據(jù),共獲悉30 431 條原始數(shù)據(jù),通過初步數(shù)據(jù)處理后得可用數(shù)據(jù)29 438 條。對這些評論數(shù)據(jù)進行詞頻統(tǒng)計,分別截取詞頻和占總詞頻和前60%、70%、80%和90%的詞語,從中提取出特征詞并統(tǒng)計這些特征詞能覆蓋多少評論文本,結果如表1 所示。
表1 詞頻統(tǒng)計結果
在用LDA 模型提取主題詞前先用K-means 算法計算評論文本的簇內誤差平方和系數(shù)Distortions和輪廓系數(shù)Silhouette 來確定最優(yōu)聚類數(shù)k,其中Distortions 系數(shù)越小越好,Silhouette 系數(shù)越大越好,結果如圖3、圖4 所示。
圖3 簇內誤差平方和系數(shù)Distortions
圖4 輪廓系數(shù)Silhouette
從圖3、圖4 中可以看出,綜合考慮簇內誤差平方和系數(shù)Distortions 和輪廓系數(shù)Silhouette 最優(yōu)聚類數(shù)為9 最為合理。選取最優(yōu)聚類數(shù)和相鄰的聚類數(shù)進行LDA 主題聚類并從主題詞中提取特征詞,結果如表2 所示。
表2 LDA 統(tǒng)計結果
其中30 表示從前30 個主題詞中選取特征詞,占比表示所選的特征詞覆蓋的評論文本數(shù)量占總評論文本數(shù)量的比例。
從表2 中可以看出,LDA 按最優(yōu)聚類數(shù)9 類得到的主題詞中提取特征詞的效果最好,相鄰的8 類和10 類聚類結果得到的特征詞的效果與最優(yōu)聚類結果較為接近,而6 類和7 類聚類得到的特征詞的效果與最優(yōu)聚類結果差距稍大。從LDA 主題詞中選取的特征詞覆蓋的評論文本的數(shù)量比從高頻詞中選取的特征詞覆蓋的評論文本數(shù)量多,從LDA 主題詞中選取的特征詞更能代表評論文本所涉及到的產品特征。選取最優(yōu)結果LDA-9 前150 個主題詞中選取的特征詞可分為9 類,結果如表3 所示。
表3 產品特征詞
從表3 中可知,產品評論數(shù)據(jù)中主要涉及到9類產品特征,通過產品特征及其表述詞能夠對產品評論數(shù)據(jù)進行標注從而實現(xiàn)產品特征的分類。從評論文本中選出包含產品特征的20 072 條評論數(shù)據(jù),將其分為每份各10 036 的A、B 兩份數(shù)據(jù)。由于一些評論往往會包含多個產品特征,在對評論數(shù)據(jù)進行標注前需要將包含多個產品特征的評論分句成只包含單個產品特征的單句。A 數(shù)據(jù)分句后共獲得17 708 條單句,B 數(shù)據(jù)分句后共獲得17 224 條單句。
本文使用Google 提供的BERT-Base 模型作為BERT 的預訓練模型,該模型共有12 層網絡結構,隱藏層為768 維,采用12 頭模式,共110 M 個參數(shù),最大序列長度為512。
A 數(shù)據(jù)進行特征標注后按照8∶2 的比例隨機分成訓練集(Train)和驗證集(Dev)進行產品特征分類訓練。進行情感分類訓練時為了避免正負樣本不均衡導致的樣本過擬合問題(即預測偏向樣本較多類別),需選取相同數(shù)量的正負樣本,由于負樣本只有5 621 條,所有選取正負樣本各5 600 條作為情感分析的樣本集。
樣本集訓練結果如表4 所示,其中精準率(Precision)指分類正確的正樣本數(shù)與判定為正樣本的樣本數(shù)之比,召回率(Recall)指分類正確的正樣本數(shù)與真正的正樣本數(shù)之比。由于精準率和精準率是相互干擾,故使用F1 值(Macro-F1)進行綜合評價。
表4 BERT 模型分類結果
利用訓練好的BERT 模型對B 數(shù)據(jù)進行產品特征分類和情感類別預測,從而獲得產品評論中九類產品特征的正負情感分布情況,如圖5 所示。基于60 款產品的評論數(shù)據(jù)計算產品特征的PCFi值和PCDi值,再結合產品特征的情感分布從而獲得產品特征的KANO 類別分布,如圖6 所示。
圖5 產品特征情感分布
圖6 產品特征KANO 類別分布
結果表明,九類產品特征中制冷、質量、外觀和聲音屬于空調產品的必備特征,這些特征在評論集中占有大量比例,在評論組中也占據(jù)主要地位,而且正向情感值遠遠大于負向情感值;制熱、價格和吹風系統(tǒng)屬于空調產品的期望特征,這些特征在評論集中占據(jù)較小的比例,但在評論組中卻占據(jù)主要地位,并且正向情感值與負向情感值接近;節(jié)能和智能控制則屬于空調產品的魅力特征,這些特征在評論集中占有的比例較小,在評論組中也不占據(jù)主要地位,但正向情感值卻遠遠大于負向情感值。
實驗中使用的60 款產品數(shù)據(jù)中包含A 品牌的產品13 款,B 品牌的產品11 款,C 品牌的產品8 款。重復上述方法對A、B、C 三品牌的空調產品特征進行KANO 分類,結果如圖7、圖8、圖9 所示。
圖7 A、B、C 三品牌產品特征情感分布圖
圖8 產品組和A 品牌的產品特征KANO 類別分布
圖9 A、B、C 三品牌的產品特征KANO 類別分布
圖8 顯示了產品組和A 品牌的產品特征的KANO 分類,A 品牌空調的產品特征除價格和吹風系統(tǒng)外都與產品組的產品特征KANO 類別一致。A品牌產品特征的吹風系統(tǒng)被劃分為無法辨別的類別,吹風系統(tǒng)的PCFi值和PCDi值都較高,但正負情感差值,未達到必備特征的情感差值要求,卻也超出了期望特征的界限,有從期望特征轉化為必備特征的趨勢,是該品牌的一個優(yōu)勢特征;A 品牌中價格特征屬于魅力特征,而產品組中價格特征屬于期望特征,這顯示A 品牌產品的價格在行業(yè)中并不具有優(yōu)勢,通過查看評論可知A 品牌在促銷活動期間價格降價較多,從而成為了吸引用戶的魅力特征。
圖9 展示了A、B、C 三個品牌產品特征的KANO分類,三個品牌的產品特征在必備特征上與產品組的分類是一致的,C 品牌產品特征的KANO 分類與產品組的KANO 分類一致,A、B 兩個品牌在期望特征和魅力特征上的KANO 分類與產品組存在差別。A 品牌產品特征中的吹風系統(tǒng)被劃分為無法辨別類,價格被劃分為魅力特征類;B 品牌產品特征中智能控制被劃分為期望特征,而在產品組中卻是魅力特征,該品牌的智能控制特征不是新穎的特征,該特征早已被用戶所知,并且給用戶帶來了較好的體驗(即正負情感<0.1),B 品牌空調的智能控制特征領先于同行業(yè),是B 品牌的優(yōu)勢特征。
用戶對產品的不同特征有不同的需求,產品的不同特征提高用戶滿意度的能力也不同。在對產品進行改進時,把用戶提出的所有需要改進的地方都進行改進對企業(yè)來說成本太大并不現(xiàn)實,優(yōu)先改進最能影響用戶滿意度的產品特征不僅能為企業(yè)節(jié)約成本還能提高產品競爭力,提高企業(yè)的市場占有率。
根據(jù)KANO 模型分析的結果和產品特征的重要度,確定了產品特征改進的優(yōu)先順序:
(1)KANO 模型確定為必備特征且重要度越低的產品特征優(yōu)先進行改進;
(2)在必備特征達到用戶滿意度的前提下,KANO 模型確定為期望特征且重要度越低的產品特征優(yōu)先進行改進;
(3)在必備特征和期望特征都達到用戶滿意度的前提下,KANO 模型確定為魅力特征且重要度越低的產品特征優(yōu)先進行改進。
產品特征重要度其值的高低需要在競爭市場中進行比較才更具有實際意義,所以,產品特征是否需要改進需要參考競爭企業(yè)的情況。以C 品牌空調產品為例,將其與產品組數(shù)據(jù)進行比較,其中優(yōu)勢度=(C 品牌產品特征重要度%-產品組產品特征重要度%)/產品組產品特征重要度%。根據(jù)以上原則可以得到以下產品改進信息。如表5 所示。
表5 產品特征改進信息
本文針對產品特征分類的復雜性和多樣性,對面向產品評論數(shù)據(jù)的產品特征KANO 分析方法進行了研究,提出了一種基于BERT 模型的產品評論分析方法,在對評論數(shù)據(jù)進行特征和情感分類的基礎上,實現(xiàn)了基于KANO 模型的產品特征分析方法。在實驗基礎上,通過分析品牌組和各品牌的產品特征KANO 類別之間的差異,對各品牌的產品特征是否需要改進提出一些合理的建議。本文也存在一些不足之處,只針對空調領域的產品特征KANO分類進行了實驗,提出的KANO 分類方法是否適用于其他領域的產品評論數(shù)據(jù)需進一步驗證。KANO模型有五個分類,本文只針對其中三個類型進行了研究,余下的反向特征和無差別特征還有待進一步研究。