王龍葛 王敏
摘要:用戶的情感傾向在推薦算法中起到非常重要的作用,本文利用設(shè)計的情感模型對用戶評論進行量化計算,并利用一定的公式計算用戶情感值和用戶評分所占的比例,構(gòu)建最終用戶評分矩陣模型。經(jīng)過實驗證明,該模型比單純的用戶評分更能反映出用戶的情感傾向。
關(guān)鍵詞:情感模型;用戶評論;評分矩陣
中圖分類號:TP277 文獻標(biāo)識碼:A 文章編號:1007-9416(2019)06-0071-02
0 引言
互聯(lián)網(wǎng)的飛速發(fā)展促使了推薦算法的快速發(fā)展[1]。然而,現(xiàn)有的推薦系統(tǒng)大多不考慮用戶的真實情感,研究結(jié)果表明,情感對用戶行為和喜好的決定有著至關(guān)重要的作用,在信息推薦過程中充分考慮用戶的情感傾向和情感狀態(tài)可以更好地適應(yīng)用戶的個性化需求,以更好地實現(xiàn)個性化推薦服務(wù)[2]。
1 國內(nèi)外研究現(xiàn)狀
電子商務(wù)的發(fā)展促使了推薦系統(tǒng)的快速發(fā)展,從本世紀初,不少的學(xué)者開始將情感分析和推薦算法結(jié)合起來取得不少成果。
Huettner等人[3]在2001年手工建立有極性標(biāo)注的情感詞典;Shanahan[4]等人通過詞語間的搭配規(guī)則,利用情感標(biāo)注語料庫,找到文本中存在的情感詞以及它們之間的規(guī)則關(guān)系。婁德成和姚天防[5]提出了聯(lián)系全文,分析全文主題和各詞語之間的關(guān)系,進行詞語極性的計算從而從整體考慮全文傾向;王丙坤[6]為提高網(wǎng)絡(luò)文本的在線分類效率,提出利用多粒度計算和多準則融合無監(jiān)督的方法進行了情感分類。
本文在前人工作的基礎(chǔ)上做了如下工作:(1)將深度學(xué)習(xí)的模型應(yīng)用用戶評論的切詞中,提高了切詞的準確率;(2)提出了情感計算的量化模型,并計算了用戶評論和評分的權(quán)值比例,構(gòu)建了最終的用戶評分矩陣。
2 用戶評論情感量化模型
2.1 情感詞典的建立
文本情感分析必須以情感詞典為基礎(chǔ),本文將對餐飲領(lǐng)域的用戶評論進行分析,在傳統(tǒng)的LSTM模型上,引入趙淑芳[7]等的方法,將輸入門和遺忘門合成一個單一的更新門,延長LSTM的記憶時間;同時引入許寧[8]等的方法,在LSTM模型前加入多層神經(jīng)網(wǎng)絡(luò),提高LSTM模型的特征提取能力。最終將改進得到的LSTM模型運用與中文切詞技術(shù)中,提高中文切詞的準確率。
2.2 用戶評論情感評價量化模型
在對用戶評論進行情感量化時,評論語句中往往還有其他的詞語,這些詞的出現(xiàn)會在很大程度上影響情感的傾向和傾向程度。在進行情感量化的過程中加入了否定詞和程度副詞的考慮。用戶評論中的情感詞分為兩類:褒義詞和貶義詞。褒義設(shè)值為1,貶義設(shè)值為-1。利用已經(jīng)獲取的6個級別的程度副詞和否定詞表,進行情感值的計算。
在計算中發(fā)現(xiàn),評論語句復(fù)雜難以控制,所以數(shù)值會出現(xiàn)很大的差值,最終要與評分進行結(jié)合時,會出現(xiàn)計算結(jié)果不和諧的情況。需要進行歸一化處理,計算公式如式子(1)所示。
degree(pi)=*5? ? ? ? ? ? (1)
其中i指的是第i條評論,j表示第i條評論中的第j個情感詞,褒義詞設(shè)值為1,貶義詞設(shè)值為-1。 K為否定詞的個數(shù),sj表示情感詞的量化值,wj表示第j個情感詞前程度副詞的量化值,pmax,pmin表示單條用戶評論的最大值和最小值。
3 基于評論和評分的最終評分模型
基于用戶評論的評分模型是結(jié)合了用戶評分和用戶評論而得到的最終評分,最終評分的計算公式如式子(2)所示。
Score(i)=w1*scorei+w2*degree(pi)? ? ? ? ? ? ? ? ? ? ?(2)
其中,Score(i)為用戶對第i個門店的最終評分,w1評分的權(quán)重值,scorei為用戶對該門店的評分,w2為用戶評論的權(quán)重值,degree(pi)為式子(1)計算的結(jié)果。
接下來,利用式子(3)和式子(4)來計算w1和w2的值。
=n? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)
degree(pi)+scorei=1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
其中score(i)表示用戶第i個用戶的最終評分,scorei表示的是用戶對第i個用戶的五分制打分情況,degree(pi)表示的是用戶對第i個用戶的評論情感的份情況。利用抓取的美團數(shù)據(jù)進行驗證,可計算出當(dāng)評分的權(quán)重為0.242,用戶評論的權(quán)重為0.758。美團數(shù)據(jù)的準確率最高,如圖1所示。
在圖2的基礎(chǔ)上,可計算出用戶評分的權(quán)重為0.242,用戶評論的權(quán)重為0.758,得到基于美團抓取數(shù)據(jù)的最終的評分模型如式子(5)所示。
score(i)=0.242*scorei+0.758*degree(pi)? ? ? ? ? ? ? ? ?(5)
利用美團外賣數(shù)據(jù)集來展示在將用戶評論和用戶評分進行結(jié)合后的推薦效果,如圖2所示。
從圖2中看到,在相同的數(shù)據(jù)集中,利用計算權(quán)重的建模公式進行權(quán)重設(shè)置后,將用戶評論和用戶評分結(jié)合后,再利用推薦算法推薦,結(jié)果比只單純的使用評分和評論進行推薦的準確率要用明顯的提升。
4 結(jié)語
本文以美團外賣數(shù)據(jù)為基礎(chǔ),對基于用戶評論情感量化的評分模型進行了研究,其中,在情感詞典的建立、情感值的計算以及最終用戶評分矩陣等方面,本文都進行了改進和創(chuàng)新,通過實驗驗證,將用戶評論和用戶評分結(jié)合起來建立的基于評論的用戶最終評分矩陣在實際的推薦算法中可以將推薦結(jié)果的準確率有一定的提高。
參考文獻
[1] Andrew Y N.Feature selection l1 vs.l2 regularization,and rotationalinvariance[C]Proc of the 21st International Conference on MachineLearning,2004:78-85.
[2] Jain A K,Duin RPW,Mao Jianchang.Statistical pattern recognition:a review[J].IEEE Trans on Pattern Analysis and Machine Intel-ligence,2000,22(1):4-37.
[3] Subasic P ,Huettner A .Affect analysis of text using fuzzy semantic typing[J]. IEEE Transactions on Fuzzy Systems,2001,2(4):483-496.
[4] Shanahan JG, QuY,Wiebe J.Computing Attitude and Affect in Text:Theory and Applications[M].Springer Netherlands,2006.
[5] 婁德成,姚天昉.漢語句子語義極性分析和觀點抽取方法的研究[J].計算機應(yīng)用,2006, 26(11):2622-2625.
[6] 王丙坤,黃永峰,李星.基于多粒度計算和多準則融合的情感分類[J].清華大學(xué)學(xué)報(自然科學(xué)版),2015,55(5):497-502.
[7] 趙淑芳,董小雨.基于改進的LSTM深度神經(jīng)網(wǎng)絡(luò)語音識別研究[J].鄭州大學(xué)學(xué)報(工學(xué)版),2018,05(6):48-51.
[8] 許寧,徐昌榮.改進型LSTM變形預(yù)測模型研究[J].江西理工大學(xué)報,2018,39(05):48-54.
Research on Emotional Quantization Scoring Model Based on User Comments
WANG Long-ge,WANG Min
(School of Software Henan University, Kaifeng Henan? 475000)
Abstract:The user's emotional tendency plays a very important role in the recommendation algorithm. This paper uses the designed emotional model to quantify the user's comments, and uses a certain formula to calculate the proportion of user's emotional value and user's score, and build the end user. The scoring matrix model. Experiments show that the model can reflect the user's emotional tendency more than the simple user score.
Key words:emotion model;user review;scoring matrix