錢(qián)寅亮,王忠群,吳東勝,蔣勝,陳云霞 (安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院,安徽 蕪湖 241000)
作為互聯(lián)網(wǎng)經(jīng)濟(jì)的一部分,電子商務(wù)近年來(lái)發(fā)展迅速。據(jù)中國(guó)電子商務(wù)研究中心(100EC.CN)監(jiān)測(cè)數(shù)據(jù)顯示,2016年中國(guó)電子商務(wù)交易額22.97萬(wàn)億元,同比增長(zhǎng)25.5%,其中網(wǎng)絡(luò)零售市場(chǎng)交易額5.3萬(wàn)億元,同比增長(zhǎng)39.1%[1]。
電子商務(wù)發(fā)展的同時(shí),商家進(jìn)入電商平臺(tái)的門(mén)檻越來(lái)越低,這導(dǎo)致網(wǎng)絡(luò)上商家信譽(yù)狀況良莠不齊并充斥大量假冒偽劣商品,消費(fèi)者很難從商家對(duì)商品的相關(guān)描述中識(shí)別出真實(shí)的商品,從而作出正確的購(gòu)買(mǎi)決策[2]。在線商品評(píng)論包含了豐富的商品評(píng)價(jià)信息和商家信譽(yù)維度信息,但是在某些利益的驅(qū)動(dòng)下,一些商家或用戶惡意發(fā)布虛假評(píng)論,以此誤導(dǎo)潛在客戶[3~6]。因此,如何對(duì)評(píng)論文本進(jìn)行有效地分析和處理,以構(gòu)建更加準(zhǔn)確、客觀、可信的商家信譽(yù)維度體系已成為當(dāng)前的研究熱點(diǎn)問(wèn)題。目前關(guān)于商家信譽(yù)的研究主要在信譽(yù)的影響因素和評(píng)價(jià)方面:陳婭[7]通過(guò)從C2C模式的電子商務(wù)出發(fā),得出影響C2C商家網(wǎng)絡(luò)信譽(yù)的4個(gè)因素:信譽(yù)、產(chǎn)品價(jià)格、服務(wù)水平和網(wǎng)站;方明珠等[8]對(duì)電子商務(wù)環(huán)境中影響在線信譽(yù)的因素進(jìn)行研究并歸納總結(jié)為正式制度、非正式制度、微觀賣(mài)方和微觀買(mǎi)方4個(gè)方面;姜政軍[9]從影響在線信譽(yù)的4個(gè)方面:賣(mài)家因素、消費(fèi)者特征、外部環(huán)境因素和網(wǎng)站因素出發(fā),在已有的在線信譽(yù)框架模型基礎(chǔ)上建立了在線信譽(yù)的影響模型;胡劍波等[10]探討采用熵權(quán)和TOPSIS法協(xié)同的模型來(lái)評(píng)價(jià)賣(mài)方信用;茹永梅[11]建立基于層次分析法(AHP)和模糊綜合評(píng)價(jià)法的商家信譽(yù)評(píng)估模型,得出O2O電商交易中影響商家信譽(yù)的5個(gè)主要因素為:商家、顧客、商家提供的產(chǎn)品和服務(wù)O2O 網(wǎng)站平臺(tái)及交易環(huán)境。
針對(duì)目前大多數(shù)研究從數(shù)值化分值的角度來(lái)探討在線信譽(yù)問(wèn)題,趙學(xué)峰等[12,13]從在線評(píng)論文本出發(fā),通過(guò)對(duì)在線評(píng)論文本聚類分析,拓展了已有的在線商家信譽(yù)維度范圍;針對(duì)在線評(píng)論文本語(yǔ)言表達(dá)隨意、文本長(zhǎng)度不一等社會(huì)化特征的問(wèn)題,王宇等[2]基于HNC理論提出一種改進(jìn)的評(píng)論主題詞抽取方法和主題詞聚類算法,提高了主題詞的抽取準(zhǔn)確率和聚類準(zhǔn)確率,并構(gòu)建了商家信譽(yù)指標(biāo)體系。
但上述文獻(xiàn)存在以下不足:①大量虛假評(píng)論干擾了評(píng)論主題詞的抽取,使得抽取出的主題詞準(zhǔn)確性降低;②用戶某些正面或者負(fù)面觀點(diǎn)表達(dá)了商家的信譽(yù),例如,“系統(tǒng)運(yùn)行很流暢”“外觀感覺(jué)陳舊”“物流服務(wù)很差”,但所提取主題詞作為評(píng)價(jià)商家信譽(yù)的維度未考慮用戶觀點(diǎn)詞,缺失用戶情感對(duì)商家信譽(yù)的影響。商品評(píng)論的可信性是構(gòu)建信譽(yù)維度的前提,需要從可信的角度剔除虛假垃圾評(píng)論,同時(shí)考慮用戶觀點(diǎn)抽取主題詞來(lái)構(gòu)建商家信譽(yù)維度。為此,筆者基于依存句法分析提取出在線評(píng)論中包含的特征詞和觀點(diǎn)詞(即特征觀點(diǎn)對(duì)[14]),引入“主流特征觀點(diǎn)對(duì)”(評(píng)論可信信息承載的基本單元)這個(gè)概念[15],并對(duì)主流特征觀點(diǎn)對(duì)的特征進(jìn)行聚類分析,最終構(gòu)建出商家信譽(yù)維度體系。
基于在線評(píng)論文本進(jìn)行商家信譽(yù)維度的提取包含2個(gè)部分:一是信譽(yù)維度特征詞的提?。欢翘卣髟~的聚類分析。目前信譽(yù)維度特征詞提取的方法主要是基于特征詞出現(xiàn)的頻率提取出高頻特征詞作為信譽(yù)維度,鮮少有結(jié)合用戶觀點(diǎn)詞來(lái)提取信譽(yù)維度特征詞。基于在線評(píng)論構(gòu)建的信譽(yù)維度是對(duì)商家信譽(yù)進(jìn)行評(píng)價(jià),每個(gè)信譽(yù)維度存在相應(yīng)的觀點(diǎn)詞。因此,表達(dá)信譽(yù)維度且含有觀點(diǎn)詞的特征詞更能真實(shí)反映商家信譽(yù)的情況。如評(píng)論手機(jī) “電池十分耐用,像素清晰,遺憾的是沒(méi)有送耳機(jī)”,其中包含的特征詞有“電池”、“像素”和“耳機(jī)”,前2個(gè)特征詞對(duì)應(yīng)的觀點(diǎn)詞分別為“耐用”和“清晰”,而“耳機(jī)”沒(méi)有修飾觀點(diǎn)詞。筆者認(rèn)為,“電池”和“像素”這2個(gè)特征詞實(shí)際上更適宜作為商品的評(píng)價(jià)維度。在評(píng)論中,觀點(diǎn)詞的詞性通常以形容詞為主,其評(píng)價(jià)對(duì)象特征詞以名詞為主,通過(guò)二者間的修飾關(guān)系將二者作為一個(gè)整體(“特征觀點(diǎn)對(duì)”)提取,更能獲取完整的商家信譽(yù)維度信息。
隨著在線評(píng)論數(shù)量呈現(xiàn)爆炸式增長(zhǎng)的同時(shí),越來(lái)越多的惡意虛假評(píng)論嚴(yán)重干擾了人們對(duì)有用信息(包括其中的商家信譽(yù)維度信息)的獲取。如何在獲取商家信譽(yù)維度信息之前對(duì)相關(guān)的垃圾、虛假評(píng)論進(jìn)行過(guò)濾就變得十分重要。評(píng)論可信的本質(zhì)是評(píng)論中出現(xiàn)的用戶觀點(diǎn)可信,即這種觀點(diǎn)的闡述是符合實(shí)際的?;谀壳岸鄶?shù)搜索引擎的原理,即搜索引擎對(duì)查詢頁(yè)面的排序是基于以往用戶查詢相同內(nèi)容時(shí)點(diǎn)擊頁(yè)面的數(shù)量,被點(diǎn)擊次數(shù)較多的頁(yè)面排序較靠前[16,17],頁(yè)面內(nèi)容越可信?,F(xiàn)實(shí)中,一個(gè)觀點(diǎn)被越多的人提及,其可信賴度則越高,被認(rèn)為是一種主流觀點(diǎn)。據(jù)此,引入 “主流特征觀點(diǎn)對(duì)” 概念,相關(guān)定義如下。
假設(shè)C表示某商品,F(xiàn)為商品C的特征集合,fi為商品C第i個(gè)特征,O為商品C的觀點(diǎn)集合,oi為商品C的某特征的觀點(diǎn),c(fi,oi)為商品C的第i個(gè)特征觀點(diǎn)對(duì)。商品C的評(píng)論集合為CR={cr1,cr2,cr3,…,cri,…},其中,cri為第i條商品評(píng)論。第i條商品評(píng)論的特征觀點(diǎn)對(duì)集合cri_fo={c(f1,o1,c(f2,o2),…,c(fm,om)} ,商品C評(píng)論的所有特征觀點(diǎn)對(duì)為集合CR_FO={cr1_fo∪cr2_fo∪…∪cri_fo∪…}。如果2個(gè)特征觀點(diǎn)對(duì)集合的交集為非空,則對(duì)應(yīng)的2條評(píng)論存在共同的特征觀點(diǎn)對(duì)。設(shè)包含商品第j個(gè)特征觀點(diǎn)對(duì)c(fj,oj)的評(píng)論數(shù)量為count_c(fj,oj),即:
①count_c(fj,oj)=0,
②count_c(fj,oj)=count_c(fj,oj)+1, ?i(c(fj,oj)∈cri_foandcri∈CR)。
定義1(主流特征觀點(diǎn)對(duì)[15])給定閾值η,如第i個(gè)特征觀點(diǎn)對(duì)c(fi,oi)的count_c(fi,oi)≥η,那么第i個(gè)特征觀點(diǎn)對(duì)c(fi,oi)為主流特征觀點(diǎn)對(duì)。
注閾值η可以在測(cè)試商品特征觀點(diǎn)對(duì)的穩(wěn)定性時(shí)進(jìn)行選擇和調(diào)整。特征觀點(diǎn)對(duì)的穩(wěn)定性將在試驗(yàn)部分給予驗(yàn)證。
根據(jù)上述主流特征觀點(diǎn)對(duì)的定義,主流特征觀點(diǎn)對(duì)是可信信息承載的基本單元。如果一條評(píng)論中所包含的主流特征觀點(diǎn)對(duì)數(shù)量越多,該條評(píng)論就越可信[15]。
選取目前國(guó)內(nèi)購(gòu)物市場(chǎng)的主要電商平臺(tái)——京東上手機(jī)的評(píng)論作為試驗(yàn)數(shù)據(jù)集,利用八爪魚(yú)采集器對(duì)評(píng)論進(jìn)行采集。對(duì)采集到的評(píng)論數(shù)據(jù)清洗,去除其中無(wú)關(guān)的評(píng)論和重復(fù)的評(píng)論,并對(duì)其中部分句子格式進(jìn)行調(diào)整和補(bǔ)充。
注:n為名詞;d為副詞;a為形容詞。 圖1 詞性標(biāo)注和依存句法分析
目前存在的分詞軟件較多,筆者使用哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心所提供的語(yǔ)言處理平臺(tái)(LTP)對(duì)在線評(píng)論進(jìn)行分詞、詞性標(biāo)注。句法依存分析是通過(guò)分析句子內(nèi)各成分之間的依存關(guān)系揭示其句法結(jié)構(gòu),句法依存分析能夠識(shí)別出句子中的“主謂賓”“定狀補(bǔ)”等語(yǔ)法成分,并分析各成分之間的關(guān)系。如對(duì)評(píng)論“手機(jī)很漂亮,手感很好?!边M(jìn)行句法依存分析,得到分析結(jié)果如圖1所示,各種分詞標(biāo)識(shí)符號(hào)代表的含義如表1所示。
表1 分詞標(biāo)識(shí)符號(hào)說(shuō)明
使用LTP對(duì)在線評(píng)論進(jìn)行分詞、詞性標(biāo)注和句法依存分析,將分析結(jié)果以XML文件格式輸出并保存。在已有的在線評(píng)論產(chǎn)品特征和觀點(diǎn)提取研究中,通常將名詞視為產(chǎn)品特征,形容詞視為相應(yīng)的觀點(diǎn)詞。觀察產(chǎn)品評(píng)論,發(fā)現(xiàn)名詞詞組或者動(dòng)詞作為產(chǎn)品特征同樣經(jīng)常出現(xiàn)。如手機(jī)評(píng)論:
①屏幕n分辨率n很d高a,運(yùn)行v流暢a;②充電v速度n非常d快a。
根據(jù)上述分析,可以構(gòu)建相應(yīng)的產(chǎn)品特征觀點(diǎn)對(duì)識(shí)別規(guī)則:在在線評(píng)論中一個(gè)單句滿足SBV(主謂)依存關(guān)系,將其對(duì)應(yīng)的主語(yǔ)名詞或動(dòng)詞提取為產(chǎn)品特征,對(duì)應(yīng)的形容詞作為觀點(diǎn)詞;判斷名詞或動(dòng)詞之前是否有與其構(gòu)成ATT依存關(guān)系的詞,如有則將二者作為一個(gè)名詞詞組提取為產(chǎn)品特征。
通過(guò)對(duì)分詞、詞性標(biāo)注以及依存句法分析的結(jié)果文件(XML文件)解析,提取出特征觀點(diǎn)對(duì)。
對(duì)上述提取出的特征觀點(diǎn)對(duì)在評(píng)論中出現(xiàn)的頻率進(jìn)行數(shù)量統(tǒng)計(jì),在進(jìn)行數(shù)量統(tǒng)計(jì)前,先對(duì)特征觀點(diǎn)對(duì)進(jìn)行初步的聚類分析,這里的聚類分析主要是考慮同義詞的情況。由于特征觀點(diǎn)對(duì)中包含了特征詞和觀點(diǎn)詞這2類詞,因此聚類時(shí)需要同時(shí)考慮。如特征觀點(diǎn)對(duì)“價(jià)格合適”和“價(jià)錢(qián)合理”則可聚為一類。根據(jù)主流特征觀點(diǎn)對(duì)的定義即可得到每一特征觀點(diǎn)對(duì)在評(píng)論中出現(xiàn)的數(shù)量,如count_c(fj,oj)的大小。根據(jù)數(shù)量大小進(jìn)行降序排列,并結(jié)合閾值η即可得到主流特征觀點(diǎn)對(duì)。
根據(jù)上述方法可以提取出評(píng)論中的主流特征觀點(diǎn)對(duì),每個(gè)主流特征觀點(diǎn)對(duì)中的觀點(diǎn)詞量化方式可以采用如下的方法:①根據(jù)觀點(diǎn)詞的情感傾向?qū)⒂^點(diǎn)詞分為正向觀點(diǎn)詞、負(fù)向觀點(diǎn)詞以及中性觀點(diǎn)詞3類,分別賦予其1、-1、0對(duì)應(yīng)的基礎(chǔ)情感值;②對(duì)于修飾觀點(diǎn)詞的相關(guān)程度副詞劃分為3個(gè)程度等級(jí)并賦予一定的極性值,代表修飾強(qiáng)度的不同,具體如表2所示;③情感值=程度副詞極性值×基礎(chǔ)情感值,對(duì)于觀點(diǎn)詞之前出現(xiàn)的否定副詞這種情況,需要將最終計(jì)算出的情感值上加上一個(gè)負(fù)號(hào),如主流特征觀點(diǎn)對(duì)“<電池,不耐用>”,其最終的情感值=(-1)×1= -1。
表2 程度副詞極性值
主流特征觀點(diǎn)對(duì)的聚類主要是針對(duì)產(chǎn)品特征的聚類,產(chǎn)品特征的聚類方法較多,筆者主要參照產(chǎn)品說(shuō)明書(shū)上對(duì)產(chǎn)品特征的分類并結(jié)合產(chǎn)品特征詞語(yǔ)之間的互信息(PMI)來(lái)進(jìn)行產(chǎn)品特征聚類。如從專業(yè)的電子產(chǎn)品評(píng)價(jià)網(wǎng)站——中關(guān)村在線(http://www.zol.com.cn/)上下載一份某型號(hào)的手機(jī)說(shuō)明書(shū),根據(jù)說(shuō)明書(shū)的內(nèi)容可以將手機(jī)的產(chǎn)品特征主要分為網(wǎng)絡(luò)、屏幕、攝像頭、外觀、硬件、服務(wù)與支持這6大類,對(duì)于硬件這一類別則可繼續(xù)細(xì)分為系統(tǒng)、處理器、存儲(chǔ)器、電池這4類。對(duì)于提取出的主流特征觀點(diǎn)對(duì)中的產(chǎn)品特征,如果能直觀找到其所對(duì)應(yīng)的類別則直接加入到該類別中,對(duì)于一些劃分較細(xì)難以判斷其所屬類別的產(chǎn)品特征可計(jì)算該產(chǎn)品特征與各類別詞之間的互信息,互信息高說(shuō)明詞語(yǔ)之間的關(guān)聯(lián)性很強(qiáng),則可以聚為一類?;バ畔⒂?jì)算公式如下:
(1)
式中:ω1和ω2是2個(gè)詞匯;p(ω1,ω2)表示將和構(gòu)成的二元詞對(duì)使用搜索引擎檢索出現(xiàn)的網(wǎng)頁(yè)數(shù)量;p(ω1)、p(ω2)分別表示使用搜索引擎從網(wǎng)絡(luò)上檢索出現(xiàn)ω1和ω2的網(wǎng)頁(yè)數(shù)量。
設(shè)根據(jù)上述聚類方法可將主流特征觀點(diǎn)對(duì)聚類為n類,則可將這n類視為商家信譽(yù)的n個(gè)維度,設(shè)每一維度中包含的主流特征觀點(diǎn)對(duì)集合foi={c(f1,o1),c(f2,o2),…,c(fm,om)}(i=1,2,…,n),sentj(j=1,2,…,m)為該維度中第j個(gè)主流特征觀點(diǎn)對(duì)的情感值,count_c(fj,oj)為特征觀點(diǎn)對(duì)的數(shù)量,則每一信譽(yù)維度總體情感值Si的計(jì)算公式如下:
(2)
不同的信譽(yù)維度側(cè)重點(diǎn)不同,用戶對(duì)其關(guān)注也會(huì)有所不同,因此還需要計(jì)算各個(gè)維度本身所對(duì)應(yīng)的權(quán)重大小。對(duì)于每一類別構(gòu)成信譽(yù)維度的權(quán)重主要是考慮該類別中包含的主流特征觀點(diǎn)對(duì)在評(píng)論中出現(xiàn)的數(shù)量,即count_c(fj,oj)大小,如果某個(gè)維度中的主流特征觀點(diǎn)對(duì)數(shù)量越大,權(quán)重就越大。每一維度的權(quán)重計(jì)算公式如下所示:
(3)
式中:M為評(píng)論數(shù)量。
此外,計(jì)算出的權(quán)重需要進(jìn)行歸一化處理。根據(jù)每一信譽(yù)維度的情感值以及權(quán)重,最終即可得出商家信譽(yù)的得分,消費(fèi)者可根據(jù)商家信譽(yù)得分選擇商家實(shí)施購(gòu)買(mǎi)行為。
1)主流特征觀點(diǎn)對(duì)閾值設(shè)定 利用八爪魚(yú)軟件分別抓取京東、天貓和淘寶等平臺(tái)上有關(guān)華為榮耀8手機(jī)評(píng)論各2000條左右,經(jīng)過(guò)預(yù)處理后各自保留1200條共3600條有效評(píng)論作為試驗(yàn)數(shù)據(jù)集,以XML文件的形式存儲(chǔ)。通過(guò)對(duì)XML文件的解析可提取出相應(yīng)的特征觀點(diǎn)對(duì)。
主流特征觀點(diǎn)對(duì)的提取需根據(jù)設(shè)定閾值來(lái)確定。為了研究在不同閾值和評(píng)論數(shù)量下主流特征觀點(diǎn)對(duì)是如何變化的,是否具有穩(wěn)定性,具體的驗(yàn)證方案可參照文獻(xiàn)[15]中的方法。最終選取主流特征觀點(diǎn)對(duì)的閾值為η=12。
2)單個(gè)主流特征觀點(diǎn)對(duì)穩(wěn)定性驗(yàn)證 為了進(jìn)一步驗(yàn)證主流特征觀點(diǎn)對(duì)的穩(wěn)定性,就單個(gè)主流特征觀點(diǎn)對(duì),探究包含該觀點(diǎn)對(duì)的評(píng)論數(shù)量與評(píng)論規(guī)模數(shù)量間的關(guān)系。具體說(shuō),假設(shè)某個(gè)主流特征觀點(diǎn)對(duì)c(fi,oi),當(dāng)評(píng)論數(shù)量為n1時(shí),其在評(píng)論中的出現(xiàn)的數(shù)量為a1;評(píng)論數(shù)量為n2時(shí),出現(xiàn)的數(shù)量為a2,以此類推下去,設(shè)定一個(gè)變量δi,計(jì)算公式如下:
(4)
根據(jù)上述選定的閾值η,選取提取到的8個(gè)主流特征觀點(diǎn)對(duì),繪制變量δi隨評(píng)論數(shù)量ni的變化折線圖,不同顏色的折線表示不同的商品特征觀點(diǎn)對(duì)的變化情況。
由圖2和圖3可看出,就單個(gè)折線來(lái)說(shuō),當(dāng)評(píng)論數(shù)量較小時(shí),折線的波動(dòng)表現(xiàn)差異較大,有些折線的起始值較?。浑S著評(píng)論數(shù)量增加,折線逐步向上,達(dá)到一個(gè)頂點(diǎn)后逐步向下;有些折線穩(wěn)步向下逐步趨穩(wěn);不同折線走向趨穩(wěn)的起始點(diǎn)不同,表明該商品特征的觀點(diǎn)被較多用戶關(guān)注認(rèn)可。但總體來(lái)說(shuō),隨著評(píng)論數(shù)量的增加, 數(shù)值逐漸趨于穩(wěn)定的,當(dāng)評(píng)論數(shù)量達(dá)到2100時(shí),包含主流特征觀點(diǎn)對(duì)的評(píng)論數(shù)量基本上是隨評(píng)論數(shù)量同步變化的,即主流特征觀點(diǎn)對(duì)中商品特征的觀點(diǎn)被用戶認(rèn)可是穩(wěn)定的,這表明主流特征觀點(diǎn)對(duì)是持久得到多數(shù)用戶認(rèn)可的,其可信性是可靠的。
圖2 數(shù)值δi 隨評(píng)論數(shù)量ni的變化趨勢(shì)(1) 圖3 數(shù)值δi 隨評(píng)論數(shù)量ni的變化趨勢(shì)(2)
試驗(yàn)中,分別使用文獻(xiàn)[2]和結(jié)合觀點(diǎn)詞的依存方法進(jìn)行特征詞的抽取,通過(guò)每種方法相應(yīng)的準(zhǔn)確率和召回率來(lái)進(jìn)行對(duì)比分析,分析結(jié)果如圖4和圖5所示。從上述試驗(yàn)對(duì)比效果可以看出,相對(duì)于文獻(xiàn)[2]中的信譽(yù)維度特征詞抽取方法,結(jié)合觀點(diǎn)詞的依存方法在準(zhǔn)確率、召回率上都有明顯的提升;其中隨著評(píng)論數(shù)量的增大,準(zhǔn)確率提升較為明顯,而召回率的提升幅度較小。
圖4 2種方法準(zhǔn)確率對(duì)比 圖5 2種方法召回率對(duì)比
表3 主流特征觀點(diǎn)對(duì)提取及聚類結(jié)果
1)主流特征觀點(diǎn)對(duì)提取與聚類 采集天貓平臺(tái)上榮耀8手機(jī)評(píng)論1200條中的有效評(píng)論1123條,對(duì)評(píng)論進(jìn)行預(yù)處理(分詞、詞性標(biāo)注)并進(jìn)行主流特征觀點(diǎn)對(duì)提取,從中關(guān)村在線網(wǎng)站上下載一份華為榮耀8的手機(jī)說(shuō)明書(shū)并結(jié)合特征詞語(yǔ)之間的互信息計(jì)算公式對(duì)主流特征觀點(diǎn)對(duì)聚類,結(jié)果如表3所示。
2)信譽(yù)維度評(píng)價(jià) 根據(jù)表2的聚類結(jié)果可以構(gòu)建出手機(jī)商家的10個(gè)信譽(yù)維度,每個(gè)信譽(yù)維度分別包含不同的主流特征觀點(diǎn)對(duì),根據(jù)式(2)可計(jì)算出每一信譽(yù)維度的情感值大小,結(jié)果如表4所示。根據(jù)式(3)可計(jì)算出各信譽(yù)維度的權(quán)重大小,如圖6所示。文獻(xiàn)[2]構(gòu)建的手機(jī)商家信譽(yù)維度如圖7所示。
選取天貓平臺(tái)上手機(jī)評(píng)論500條,其中有效評(píng)論411條,根據(jù)筆者和文獻(xiàn)[2]構(gòu)建的信譽(yù)維度,對(duì)每條評(píng)論進(jìn)行商家信譽(yù)值計(jì)算并排序,評(píng)論排序結(jié)果如表5、表6所示(注:由于文獻(xiàn)[2]中并未介紹信譽(yù)值的具體計(jì)算方法,所以在具體某一維度情感量化方式上采用和筆者相同的方法。表5、表6所示顯示的是排名前3的結(jié)果)。
隨著網(wǎng)絡(luò)交易平臺(tái)的不斷規(guī)范,交易環(huán)境的安全性逐漸提高,消費(fèi)者對(duì)交易安全等因素的擔(dān)憂已經(jīng)越來(lái)越少,使得網(wǎng)絡(luò)購(gòu)物與傳統(tǒng)的線下購(gòu)物之間的差異越來(lái)越小。傳統(tǒng)線下消費(fèi)者對(duì)商家信譽(yù)的評(píng)價(jià)則主要集中在商品表現(xiàn)和服務(wù)表現(xiàn)這2個(gè)方面,與線下購(gòu)物不同,網(wǎng)絡(luò)購(gòu)物需要涉及到相應(yīng)的物流配送,所以網(wǎng)絡(luò)環(huán)境下商家的信譽(yù)主要由如下3個(gè)方面構(gòu)成:①商品表現(xiàn)。商品表現(xiàn)主要指對(duì)商品本身的一些描述,如商品的質(zhì)量、性能、價(jià)格等。商品表現(xiàn)是商家信譽(yù)評(píng)價(jià)的本質(zhì)依據(jù),所以,信譽(yù)越好的商家其評(píng)論中則會(huì)包含越多對(duì)商品本身描述的一些信息,同時(shí)描述的也更為詳細(xì)。②服務(wù)表現(xiàn)。服務(wù)表現(xiàn)主要包括商家的售后服務(wù)、服務(wù)態(tài)度、咨詢等。③物流表現(xiàn)。物流表現(xiàn)主要包括物流速度、發(fā)貨及時(shí)性以及物流服務(wù)態(tài)度等。
表4 信譽(yù)維度情感值
圖6 手機(jī)商家信譽(yù)維度體系及權(quán)重
為了進(jìn)一步驗(yàn)證筆者構(gòu)建的商家信譽(yù)維度的有效性,對(duì)表5、表6排序出的評(píng)論結(jié)果進(jìn)行相關(guān)問(wèn)卷調(diào)查。共發(fā)放問(wèn)卷230份,有效問(wèn)卷152份,對(duì)比結(jié)果如表7所示,其中“√”表示認(rèn)可度超過(guò)60%,“×”表示認(rèn)可度低于60%。
圖7 文獻(xiàn)[2]構(gòu)建的手機(jī)商家信譽(yù)維度
筆者/文獻(xiàn)[2]商家信譽(yù)值評(píng)論內(nèi)容評(píng)論者評(píng)論時(shí)間1/41.960 等了2天終于發(fā)貨了,順豐物流很快,昨天收貨了,馬上打開(kāi)包裹,對(duì)手機(jī)很滿意。顏值很高,拍照也不錯(cuò),性價(jià)比也高,用起來(lái)很流暢,玩游戲也不卡頓,電池也耐用,期待后續(xù)精彩表現(xiàn)。榮耀手機(jī)也越來(lái)越好了,繼續(xù)關(guān)注榮耀手機(jī),期待更多更好的手機(jī)。收貨當(dāng)天追加:信號(hào)強(qiáng)度非常好。 像素高,拍照效果好,清晰。 續(xù)航能力強(qiáng)。 手機(jī)外觀漂亮大氣,手感也好。使用中沒(méi)有卡頓現(xiàn)象,作為千元機(jī)性價(jià)比很高,值得購(gòu)買(mǎi)充電速度快。 服務(wù)周到,細(xì)致物流包裝很完美,不會(huì)有損壞。買(mǎi)手機(jī),就買(mǎi)華為的!好評(píng)!菲???吧(匿名)2017-08-242/441.840總體來(lái)說(shuō)很棒,很流暢,這個(gè)價(jià)位也確實(shí)親民,同等價(jià)位來(lái)說(shuō),拍照清晰、音質(zhì)清楚、信號(hào)較強(qiáng),操作暫無(wú)長(zhǎng)時(shí)間卡頓,較為順暢。手機(jī)很流暢,反應(yīng)很快,顏色很好看,手感超棒,手機(jī)尺寸大小剛剛好,真的物超所值,好評(píng),支持華為,支持國(guó)產(chǎn)。等???¥(匿名)2017-08-093/521.792 給老媽買(mǎi)的額,很快就收到貨了!特地試用了一段時(shí)間才來(lái)評(píng)價(jià)的,運(yùn)行速度很快,給老媽用足夠了,外形、手感都不錯(cuò),指紋識(shí)別也很靈敏,性價(jià)比很高,建議大家玩手機(jī)不是特別多的可以考慮!x???n(匿名)2017-08-19
表6 評(píng)論商家信譽(yù)值排序(2)
從表7可以看出,基于筆者構(gòu)建的手機(jī)商家信譽(yù)維度進(jìn)行商家信譽(yù)評(píng)價(jià)的評(píng)論較多的涉及商品表現(xiàn)、物流表現(xiàn)以及服務(wù)表現(xiàn)3個(gè)方面,其中商品表現(xiàn)包括手機(jī)、硬件、屏幕、外觀、性價(jià)比、網(wǎng)絡(luò)、攝像頭、質(zhì)量,相比于文獻(xiàn)[2]較為具體且更加全面,對(duì)于文獻(xiàn)[2]排序出的評(píng)論雖然有涉及商品表現(xiàn)這一部分,但對(duì)物流表現(xiàn)和服務(wù)表現(xiàn)涉及過(guò)少,使得對(duì)商家的信譽(yù)評(píng)價(jià)不夠全面,其中73.98%的消費(fèi)者認(rèn)為經(jīng)筆者商家信譽(yù)維度評(píng)價(jià)排序出的評(píng)論更加能真實(shí)反映出商家的信譽(yù),而文獻(xiàn)[2]的只有68.38%。此外,從表5、表6排序結(jié)果可看出,筆者方法得出的評(píng)論內(nèi)容豐富,體現(xiàn)商家信譽(yù)的信息較為全面,一定程度上能夠更加合理反映商家信譽(yù)。
表7 商家信譽(yù)維度對(duì)比
電子商務(wù)的快速發(fā)展使得各種電商平臺(tái)上商家數(shù)量逐漸增多,但商家之間信譽(yù)差異較大。在線商品評(píng)論是用戶反饋商家信譽(yù)的重要渠道,但惡意虛假評(píng)論干擾了該渠道作用的正常發(fā)揮。著眼于構(gòu)建合理的商家信譽(yù)維度體系,筆者基于主流特征觀點(diǎn)對(duì)——評(píng)論可信信息承載單元這一概念,驗(yàn)證了可信評(píng)論中主流特征觀點(diǎn)對(duì)的穩(wěn)定性;基于主流特征觀點(diǎn)對(duì)的數(shù)量閾值的設(shè)定,篩選過(guò)濾虛假評(píng)論,對(duì)在線評(píng)論的主流特征觀點(diǎn)對(duì)進(jìn)行提??;最后,結(jié)合產(chǎn)品說(shuō)明書(shū)以及詞語(yǔ)互信息計(jì)算方法對(duì)主流特征觀點(diǎn)對(duì)進(jìn)行聚類分析,構(gòu)建出商家的信譽(yù)維度體系以及維度權(quán)重,并根據(jù)觀點(diǎn)詞對(duì)信譽(yù)維度進(jìn)行情感值計(jì)算及評(píng)價(jià),驗(yàn)證了筆者方法比其他信譽(yù)維度體系構(gòu)建方法更為有效。