段 岳,李安然,張心怡
具有商品聲譽(yù)評(píng)價(jià)功能的模型建立
段 岳1,李安然2,張心怡3
(1.哈爾濱工業(yè)大學(xué)(威海) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 威海 264200;2.哈爾濱工業(yè)大學(xué)(威海) 新能源學(xué)院,山東 威海 264200;3.哈爾濱工業(yè)大學(xué)(威海) 理學(xué)院,山東 威海 264200)
針對(duì)在線商城產(chǎn)品在售期間的聲譽(yù)評(píng)價(jià)問題,采用基于熵權(quán)法和正態(tài)云構(gòu)建綜合評(píng)價(jià)模型的方法,分析產(chǎn)品的評(píng)價(jià)數(shù)據(jù),從而分別獲得各個(gè)數(shù)據(jù)類別的分?jǐn)?shù),其中評(píng)價(jià)數(shù)據(jù)包括星級(jí)、評(píng)論和幫助等級(jí),進(jìn)而得到各商品聲譽(yù)評(píng)價(jià)。通過對(duì)亞馬遜上的商品進(jìn)行實(shí)例分析,構(gòu)建了商品的聲譽(yù)評(píng)價(jià)模型,可應(yīng)用于商品銷售模式的改善和銷售價(jià)格的調(diào)整。
NLP;熵權(quán)法;正態(tài)云模型;聲譽(yù)評(píng)價(jià)
電商平臺(tái)對(duì)于我國銷售業(yè)的影響是無比深遠(yuǎn)的,對(duì)于商家而言,如何利用用戶的評(píng)價(jià)去分析商品的聲譽(yù),并預(yù)測(cè)它在未來是否會(huì)取得市場(chǎng)上的成功是十分重要的。所以,建立合適的模型對(duì)電商平臺(tái)在售商品的聲譽(yù)進(jìn)行評(píng)價(jià),對(duì)準(zhǔn)確分析該商品未來的市場(chǎng)表現(xiàn),以及商家銷售策略的調(diào)整具有重要作用。本文旨在利用基于熵權(quán)法及正態(tài)云模型的綜合評(píng)價(jià)模型對(duì)含有星級(jí)評(píng)價(jià)及文本評(píng)論的電商在售產(chǎn)品進(jìn)行聲譽(yù)評(píng)價(jià)[1-2]。
數(shù)據(jù)來自于亞馬遜市場(chǎng),主要收集了在售商品微波爐、嬰幼兒奶嘴和電吹風(fēng)機(jī)在所給定的時(shí)間段內(nèi)客戶提供的評(píng)級(jí)和評(píng)價(jià)。
根據(jù)產(chǎn)品數(shù)據(jù)集,主要可以分成3部分,分別是星級(jí)、評(píng)論和幫助等級(jí)。
由于數(shù)據(jù)是按時(shí)間離散分布的,可以使用月度標(biāo)度并計(jì)算每個(gè)月內(nèi)星級(jí)評(píng)定的平均值和標(biāo)準(zhǔn)差來評(píng)定其星級(jí)。由此可以輕松地看到評(píng)分隨時(shí)間的變化,并大致了解這些產(chǎn)品在亞馬遜上銷售的聲譽(yù)變化。
客戶提交基于文本的信息來展示他們使用該產(chǎn)品時(shí)的感受。為了使這些評(píng)論能夠被計(jì)算機(jī)理解,以便對(duì)其進(jìn)行處理和分析,可以使用NLP(自然語言處理)來進(jìn)行分析處理[3]。
對(duì)于文本評(píng)論,本文使用LDA(Latent Dirichlet Allocation)對(duì)評(píng)論的內(nèi)容進(jìn)行提取和分類。潛在的狄利克雷分配模型是一個(gè)文檔主題模型,它可以發(fā)現(xiàn)文檔集合中的基本主題以及主題中的推斷詞概率。
然后將LDA模型擬合的優(yōu)劣與不同數(shù)量的主題進(jìn)行了比較以此來選擇主題[4]。通過計(jì)算出一組較低的文檔的困惑度,表明模型可以很好地描述這組文檔。同時(shí),較低的困惑度意味著更好的選擇。通過分析得到當(dāng)有5個(gè)主題時(shí)是最合適的。根據(jù)以上分析結(jié)果,將目標(biāo)主題數(shù)設(shè)置為5,然后分別處理吹風(fēng)機(jī)、微波爐和奶嘴的數(shù)據(jù),并得到以下話題分類結(jié)果(以吹風(fēng)機(jī)為例):
在為這3種產(chǎn)品分別找到了最常見的5個(gè)主題之后,我們決定使用VADER對(duì)數(shù)據(jù)中的每個(gè)注釋進(jìn)行情感分析[5]。
圖1 吹風(fēng)機(jī)話題分類
其中()代表客戶評(píng)論中的單詞,()∈{0,1},()代表其情感評(píng)分。,,代表主題、客戶和總評(píng)論數(shù)。
云模型是從概率論和模糊集理論的交叉滲透中得出的。選擇使用它的原因是需要建立一個(gè)評(píng)估系統(tǒng)來處理和分析評(píng)論。評(píng)論中的自然語言非常模糊,云模型可以反映事物歧義和隨機(jī)性,因此我們認(rèn)為使用云模型是適當(dāng)?shù)摹?/p>
客戶對(duì)產(chǎn)品的評(píng)論和星級(jí)評(píng)價(jià)及其對(duì)產(chǎn)品銷售的影響是隨機(jī)的和不確定的。為了使權(quán)重更符合客觀性和合理性,本文使用熵權(quán)法確定權(quán)重[6],以權(quán)衡不同指標(biāo)的影響,熵值越大系統(tǒng)的混亂程度越大,對(duì)綜合得分的影響也越大。最終得到了每種產(chǎn)品的熵指標(biāo)權(quán)重。
與常規(guī)云模型相結(jié)合,建立了客戶評(píng)估的綜合評(píng)分模型。將客戶的評(píng)價(jià)與云滴映射在一起,然后根據(jù)評(píng)價(jià)指標(biāo)將綜合得分分為多個(gè)級(jí)別。每個(gè)評(píng)估指標(biāo)屬于某個(gè)評(píng)分水平的確定性程度可以用一個(gè)全面的云表示。模型構(gòu)建步驟如下:
(1)根據(jù)上文建立的評(píng)估指數(shù),我們建立評(píng)估對(duì)象={1,2,···,q}的因子集(集合中的元素代表平均星級(jí),評(píng)分標(biāo)準(zhǔn)差,情感值等)。評(píng)估集={1,2,···,a}(指等級(jí)數(shù)),權(quán)重集={1,2,···,w}。
(2)元素(=1,2,···,)和相應(yīng)級(jí)別(=1,2,···,)的定性概念由云模型的3個(gè)數(shù)值特征表示,即云滴的數(shù)學(xué)期望E、云滴的熵E、云滴的超熵H:
x1和x2表示等級(jí)的上下邊界(=1,2,···,),對(duì)應(yīng)于元素(=1,2,···,),為樣本方差。對(duì)于具有單一邊界限制的最高和最低級(jí)別,可以根據(jù)數(shù)據(jù)的上限和下限來確定默認(rèn)邊界參數(shù)。超熵H通常基于實(shí)驗(yàn)值或經(jīng)驗(yàn)值(這里我們?nèi)?.1),它重新檢驗(yàn)評(píng)價(jià)的總體得分:超熵越大,顧客評(píng)價(jià)的差異越大,定性概念反映的隨機(jī)性越強(qiáng)。
(3)根據(jù)云模型的數(shù)字特征值(期望值、熵和超熵),利用正向云發(fā)生
器,得到對(duì)應(yīng)于不同層次云模型的各指標(biāo)的隸屬度。運(yùn)行正向云發(fā)生器N次以提高計(jì)算結(jié)果的準(zhǔn)確性。計(jì)算不同隸屬度條件下的平均綜合評(píng)價(jià)值:
通過計(jì)算得到相應(yīng)的隸屬度獲得隸屬度矩陣的結(jié)果。
(4)模糊關(guān)系矩陣的構(gòu)建,中的元素F表示集合中第個(gè)元素q到集合中第個(gè)層次a的隸屬度。用隸屬度矩陣對(duì)權(quán)重集進(jìn)行模糊變換,得到評(píng)價(jià)集上的模糊關(guān)系矩陣:
由于最大隸屬度在模糊概念下不適用,我們?cè)诜诸悤r(shí)使用秩特征值(=1,2,···,)對(duì)進(jìn)行加權(quán)平均:
其中F是每個(gè)等級(jí)的評(píng)估結(jié)果,此處為中的第列元素。
星級(jí)評(píng)定的特點(diǎn)和評(píng)審主題,我們將評(píng)價(jià)指標(biāo)的等級(jí)標(biāo)準(zhǔn)分為四個(gè)等級(jí)[7-8]:低(一級(jí))、相對(duì)低(二級(jí))、相對(duì)高(三級(jí))、高(四級(jí))。在確定上下邊界后,采用等間隔法求出各層對(duì)應(yīng)的評(píng)價(jià)區(qū)間(表2)。其中代表星級(jí)平均指數(shù),代表星級(jí)標(biāo)準(zhǔn)偏差指數(shù)。
表2 評(píng)價(jià)指標(biāo)的等級(jí)劃分
Tab.2 classification of evaluation indexes
從模型的基本原理和上述評(píng)價(jià)標(biāo)準(zhǔn)出發(fā),編寫了正態(tài)云模型運(yùn)行代碼。最終計(jì)算結(jié)果如圖2所示。
圖2 星級(jí)平均值指標(biāo)(上)和星級(jí)標(biāo)準(zhǔn)差指標(biāo)(下)云滴分布圖
上圖以星級(jí)評(píng)定的均值指數(shù)和星級(jí)評(píng)定的標(biāo)準(zhǔn)差指數(shù)作為例子,評(píng)估中的其他5個(gè)指標(biāo)的云滴分布也可以用同樣的方法得到。
標(biāo)準(zhǔn)云圖中的云滴分布反映了這2個(gè)指標(biāo)屬于4個(gè)級(jí)別。在運(yùn)行前向云生成器500次后,計(jì)算了不同隸屬度條件下各指標(biāo)對(duì)應(yīng)的4個(gè)層次的平均綜合評(píng)價(jià)值。然后我們運(yùn)用公式得到7項(xiàng)指標(biāo)對(duì)應(yīng)于低,相對(duì)低,相對(duì)高,高4個(gè)等級(jí)的單因素評(píng)價(jià)矩陣,以微波爐為例,其單因素評(píng)價(jià)矩陣為:
根據(jù)上文中表1利用熵權(quán)法求出的指標(biāo)權(quán)重,由公式(3)將指標(biāo)權(quán)重集與各商品的單因素評(píng)價(jià)矩陣進(jìn)行模糊轉(zhuǎn)換,最終利用公式(4)得到綜合評(píng)價(jià)結(jié)果如圖3和圖4(以微波爐和吹風(fēng)機(jī)為例):
圖3 微波爐(左)和吹風(fēng)機(jī)(右)綜合評(píng)價(jià)得分
從上圖可以得出,綜合評(píng)價(jià)結(jié)果值越大,基于星級(jí)和評(píng)論的聲譽(yù)測(cè)度越積極;相反,評(píng)價(jià)結(jié)果值越小,基于星級(jí)和評(píng)論的聲譽(yù)測(cè)度越消極。
熵權(quán)法和云模型克服了模糊數(shù)學(xué)用精確、唯一的隸屬函數(shù)嚴(yán)格表示模糊概念的缺點(diǎn)和概率理論非此即彼的缺點(diǎn)?;陟貦?quán)法和云模型的綜合評(píng)價(jià)方法,能夠較好地解決評(píng)價(jià)中模糊性和隨機(jī)性共存的難題,使評(píng)價(jià)結(jié)果更加客觀、真實(shí)。對(duì)基于云模型的商品聲譽(yù)評(píng)價(jià)方法進(jìn)行應(yīng)用并給出了結(jié)果,該方法能有效地進(jìn)行聲譽(yù)評(píng)價(jià)。
商品聲譽(yù)的綜合評(píng)價(jià)是商品銷售策略決策的前期工作,沒有正確的評(píng)價(jià)就不可能有正確的銷售策略決策。本文提出的方法能夠?qū)υ诰€電商在售商品的聲譽(yù)進(jìn)行正確、全面地評(píng)價(jià),能夠有效的為商家提供輔助支持。
創(chuàng)新點(diǎn):(1)在以往的綜合評(píng)價(jià)或聲譽(yù)評(píng)價(jià)中,一般采用的模型最后都只能得到一個(gè)籠統(tǒng)的綜合結(jié)果。本文提出的基于熵權(quán)法和云模型的綜合評(píng)價(jià)方法,不僅可以比較直觀地看出各個(gè)商品評(píng)價(jià)數(shù)據(jù)的狀態(tài),還可以較客觀地發(fā)現(xiàn)各個(gè)數(shù)據(jù)對(duì)整個(gè)產(chǎn)品聲譽(yù)的影響。(2)產(chǎn)品的評(píng)價(jià)數(shù)據(jù)可以包含文本評(píng)價(jià),與傳統(tǒng)使用量化的評(píng)價(jià)分?jǐn)?shù)進(jìn)行綜合評(píng)價(jià)有本質(zhì)的區(qū)別。(3)利用熵權(quán)法確定指標(biāo)的權(quán)重集,使得云模型中模糊關(guān)系矩陣的構(gòu)建更具有可信度。
[1]周金明.基于云模型的非確定性數(shù)據(jù)綜合評(píng)價(jià)問題研究[D].杭州:浙江工商大學(xué), 2018.
[2]何菲菲.基于云模型的圖像分割方法研究[D].重慶:重慶郵電大學(xué), 2016.
[3]郝帥.基于詞典擴(kuò)增和修飾結(jié)構(gòu)的文本情感識(shí)別研究[D].南昌:南昌大學(xué), 2015.
[4]李婷.云模型在圖像分割領(lǐng)域中的應(yīng)用研究[D].太原:太原理工大學(xué),2015.
[5]吳正洋.基于云理論的高校職員績效評(píng)價(jià)研究[J]. 統(tǒng)計(jì)教育,2010(12):31-34+41.
WU Zhengyang. Research on performance evaluation of university staff based on cloud theory [J].Statistical Education,2010(12):31-34 + 41.
[6]王彥彬,賈崇,張競一.基于熵值法與可拓學(xué)理論的PPP項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2019,21(6):415-420.
WANG Yanbin, JIA Chong, ZHANG Jingyi. Risk assessment of PPP project based on entropy method and extension theory[J].Journal of Liaoning University Technical(Social Science Edition),2019, 21(6):415-420.
[7]蔡祥軍,朱憲辰.體驗(yàn)經(jīng)濟(jì)模式下的消費(fèi)者行為選擇和效用提升研究[J].信息系統(tǒng)工程,2010(9):101- 102+25.
CAI Xiangjun, ZHU Xianchen. Research on consumer behavior choice and utility improvement under the mode of experience economy[J]. Information System Engineering,2010(9):101-102+25.
[8]汪秀英.基于體驗(yàn)經(jīng)濟(jì)的消費(fèi)者行為模式研究[D]. 大連:大連理工大學(xué), 2010.
The establishment of a model with the function of commodity reputation evaluation
DUAN Yue1, LI Anran2, ZHANG Xinyi3
(1.School of Computer Science and Technology, Harbin Institute of Technology(Weihai), Weihai 264200, China; 2.School of New Energy, Harbin Institute of Technology(Weihai), Weihai 264200, China; 3.School of Science, Harbin Institute of Technology(Weihai), Weihai 264200, China)
Aiming at the problem of how to evaluate the reputation of online shopping mall products during the sales period, this paper adopts the method of building a comprehensive evaluation model based on entropy weight method and normal cloud to analyze the evaluation data of products, so as to obtain the scores of each data category, including star rating, comment and help level, and then get the reputation evaluation of each commodity. Based on the analysis of Amazon's products, this paper constructs the reputation evaluation model of commodities, which can be applied to the improvement of commodity sales mode and the adjustment of sales price.
NLP; entropy weight method; normal cloud model; reputation evaluation
TP 391.1; F 724.6
A
1008-391X(2021)01-0052-05
2020-06-08
段岳(1999-),男,內(nèi)蒙古通遼人,主要從事計(jì)算機(jī)科學(xué)方面的研究。
段岳,李安然,張心怡.具有商品聲譽(yù)評(píng)價(jià)功能的模型建立[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2021,23(1):52-56.doi:10.11955/j.issn.1008- 391x.20210107.
DUAN Yue, LI Anran, ZHANG Xinyi.The establishment of a model with the function of commodity reputation evaluation[J].Journal of Liaoning Technical University(Social Science Edition),2021,23(1):52-56.doi:10.11955/j.issn.1008-391x.20210107.