楊 明
(復(fù)旦大學(xué)軟件學(xué)院 上海 200000)
如今大量消費(fèi)者在網(wǎng)絡(luò)上購(gòu)買(mǎi)酒店服務(wù),用戶(hù)產(chǎn)生的評(píng)論非常多。當(dāng)別的用戶(hù)消費(fèi)時(shí)通常會(huì)參考這些評(píng)論,同時(shí)商家也關(guān)心如何利用這些評(píng)論[1]來(lái)改進(jìn)服務(wù)質(zhì)量。因?yàn)楦鞣N各樣的利益,虛假評(píng)論在這個(gè)過(guò)程當(dāng)中大量產(chǎn)生,使得消費(fèi)者難以獲得真實(shí)準(zhǔn)確的信息[2]。為了創(chuàng)造一個(gè)健康的電子商務(wù)環(huán)境,我們需要識(shí)別虛假評(píng)論。
虛假評(píng)論識(shí)別是一個(gè)新的研究領(lǐng)域,目前有很多方法。很早的時(shí)候有一些非機(jī)器學(xué)習(xí)的辦法,后來(lái)隨著機(jī)器學(xué)習(xí)方法的發(fā)展,許多基于機(jī)器學(xué)習(xí)的方法被提了出來(lái),這些方法大多數(shù)使用特征工程,比如使用評(píng)論文本和評(píng)論提供者的特征[3]。這類(lèi)任務(wù)需要完成大量的數(shù)據(jù)標(biāo)注,通常因?yàn)楣ぷ髁刻蠖斐闪藰?biāo)注數(shù)據(jù)集缺失[4]。近期的研究開(kāi)始轉(zhuǎn)向基于深度學(xué)習(xí)的方法[5-6],這些方法在相關(guān)任務(wù)上取得了較好的效果。
本文針對(duì)傳統(tǒng)酒店領(lǐng)域的評(píng)論還存在數(shù)據(jù)稀少、不利于深度學(xué)習(xí)的問(wèn)題,提出一種無(wú)監(jiān)督的數(shù)據(jù)增強(qiáng)方法。增強(qiáng)后的數(shù)據(jù)進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)對(duì)比原始的小樣本數(shù)據(jù)集取得了較好的結(jié)果。
虛假評(píng)論識(shí)別主要方法包括基于文本解析的方法和基于機(jī)器學(xué)習(xí)的方法?;谖谋窘馕龅姆椒ㄖ饕▋煞N類(lèi)型:一種是基于語(yǔ)料的方法,這種方法有較好的領(lǐng)域針對(duì)性,比如對(duì)不同的情感詞在不同領(lǐng)域賦予不同的含義和情感[7];另一種是基于字典的方法,文獻(xiàn)[8]表明基于字典的方法在論文中的數(shù)據(jù)集上獲得了78%的準(zhǔn)確率,這種方法常因?yàn)檎也坏结槍?duì)特定領(lǐng)域的意見(jiàn)詞而受到限制?;跈C(jī)器學(xué)習(xí)的方法主要包括有監(jiān)督學(xué)習(xí)的辦法和無(wú)監(jiān)督學(xué)習(xí)的辦法。有監(jiān)督學(xué)習(xí)方法主要包括決策樹(shù)[9]、基于規(guī)則的方法、貝葉斯網(wǎng)絡(luò)[10]、SVM[11]等,它們各自在一些任務(wù)上表現(xiàn)良好。無(wú)監(jiān)督學(xué)習(xí)的方法主要有二次聚類(lèi)、k-means聚集等方法[12-13]。有的研究將文本解析與評(píng)論者的特點(diǎn)結(jié)合起來(lái),例如將文本與評(píng)論者特點(diǎn)結(jié)合起來(lái),使用內(nèi)容相似性、評(píng)論平均長(zhǎng)度、重復(fù)評(píng)級(jí)行為[4]、相關(guān)知識(shí)[14]和情感極性等來(lái)增強(qiáng)辨別真?zhèn)蔚男Ч鸞15]。隨著深度學(xué)習(xí)的興起,一些新的基于深度學(xué)習(xí)的方法被提出來(lái),例如,聯(lián)合行業(yè)知識(shí)方法[6]、利用詞向量的深度學(xué)習(xí)模型[5]和對(duì)抗神經(jīng)網(wǎng)絡(luò)[16]等。最近意見(jiàn)挖掘的工作有研究針對(duì)文本當(dāng)中特定實(shí)體(稱(chēng)為aspect)進(jìn)行情感識(shí)別。文獻(xiàn)[17]指出在“Yesterday, I bought a new smartphone.The quality of the display is very good, but the battery lasts too little.”當(dāng)中能識(shí)別出兩個(gè)aspect 即display與battery,它們分別對(duì)應(yīng)的情感是非常好和一般。卷積神經(jīng)網(wǎng)絡(luò)也在文本分類(lèi)任務(wù)中表現(xiàn)出色。文獻(xiàn)[18]設(shè)計(jì)了一種非常深的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)能夠在字符級(jí)別上面運(yùn)行,在文本分類(lèi)任務(wù)上表現(xiàn)出色。
本文提出一種結(jié)合數(shù)據(jù)增強(qiáng)、無(wú)監(jiān)督學(xué)習(xí)aspect級(jí)別情感和文本卷積神經(jīng)網(wǎng)絡(luò)的方法,稱(chēng)為H-text-cnn。該方法首先對(duì)單條評(píng)論進(jìn)行EDA增強(qiáng),然后用無(wú)監(jiān)督aspect級(jí)別情感識(shí)別方法獲得單條評(píng)論中的情感數(shù)據(jù),最后將這些數(shù)據(jù)處理過(guò)后帶入到卷積神經(jīng)網(wǎng)絡(luò)中得到虛假評(píng)論識(shí)別的結(jié)果。實(shí)驗(yàn)結(jié)果表明本文方法在實(shí)驗(yàn)的數(shù)據(jù)集上比傳統(tǒng)方法獲得了很好的提升。本文方法的架構(gòu)如圖1所示。
圖1 H-textcnn
EDA(Easy Data Augumentation)由學(xué)者Wei等[19]提出,主要過(guò)程是對(duì)原來(lái)的文本進(jìn)行一些如替換、插入、隨機(jī)交換等方式的操作,使得原來(lái)一條文本變成幾條經(jīng)過(guò)上述方式修改過(guò)后的文本。作者稱(chēng)當(dāng)對(duì)數(shù)據(jù)集的文本進(jìn)行EDA后,對(duì)應(yīng)的分類(lèi)實(shí)驗(yàn)效果得到了提升。本文將它用于酒店領(lǐng)域評(píng)論的增強(qiáng),每一條評(píng)論獲得10條增強(qiáng)評(píng)論,增強(qiáng)數(shù)據(jù)對(duì)應(yīng)的分類(lèi)標(biāo)簽不改變。文獻(xiàn)[19]方法的處理過(guò)程如下:
(1) 同義詞替換,從單條評(píng)論中選擇幾個(gè)不是停用詞的詞語(yǔ)進(jìn)行同義詞替換。
(2) 隨機(jī)插入,在單條評(píng)論任意位置插入不是停用詞的詞語(yǔ)的同義詞n次。
(3) 隨機(jī)交換,隨機(jī)交換單條評(píng)論中任何詞語(yǔ)的位置n次。
(4) 隨機(jī)刪除,以概率p隨機(jī)移除單條評(píng)論中的每個(gè)詞。
經(jīng)上述EDA增強(qiáng)處理,原來(lái)的數(shù)據(jù)集被增強(qiáng)為一個(gè)很大的數(shù)據(jù)集。實(shí)驗(yàn)參數(shù)的設(shè)置請(qǐng)參考實(shí)驗(yàn)部分。下面是原評(píng)價(jià)經(jīng)過(guò)EDA增強(qiáng)處理過(guò)后的例子:
原評(píng)價(jià):Excellent staff and customer service,very clean and spotless elegant and luxurious with a beautiful ocean view. The bed is very comfortable and relaxing. I give it a five star.
EDA: excellent staff and customer service very clean and spotless light elegant and luxurious with a beautiful ocean view lighting the bed is very comfortable and leading relaxing I give it a five star
文獻(xiàn)[4]表明極端的情感傾向和虛假評(píng)論有顯著的相關(guān)性。文獻(xiàn)[15]在虛假評(píng)論識(shí)別過(guò)程中加入情感識(shí)別的步驟,提高了對(duì)餐廳虛假評(píng)論識(shí)別的準(zhǔn)確率。文獻(xiàn)[17]表明細(xì)粒度的感情對(duì)整體感情傾向的識(shí)別非常重要,因?yàn)橛脩?hù)可能對(duì)評(píng)論主體的一個(gè)方面的情感是積極的,但是對(duì)另一個(gè)方面的情感是消極的。李彬等[20]在酒店服務(wù)質(zhì)量管理中指出,酒店六大維度點(diǎn)評(píng)內(nèi)容分別是餐飲、價(jià)格、位置、服務(wù)、設(shè)施和衛(wèi)生。為了方便本文模型識(shí)別,本文選取了前四項(xiàng)作為本文的aspects。
當(dāng)完成EDA數(shù)據(jù)增強(qiáng)后,本文利用前人提出的依存句法無(wú)監(jiān)督aspect情感分析[17]和結(jié)合領(lǐng)域知識(shí)[20]的情感分析[6]方法,進(jìn)行融合提出一種針對(duì)酒店評(píng)論結(jié)合領(lǐng)域知識(shí)的依存句法無(wú)監(jiān)督學(xué)習(xí)aspect情感的方法。本文使用以下兩條規(guī)則:
(1) 當(dāng)評(píng)論中依存關(guān)系是amod(形容詞修飾),當(dāng)評(píng)論是涉及到酒店消費(fèi)領(lǐng)域的aspect,當(dāng)支配者是可能的aspect,被支配者是情感詞。這個(gè)時(shí)候該關(guān)系可能描述了用戶(hù)對(duì)酒店屬性的某一方面的情感。如good service表達(dá)了針對(duì)服務(wù)aspect積極的情感。
(2) 當(dāng)句子中的依存關(guān)系是nsubj(名詞性主語(yǔ))且當(dāng)支配者是情感傾向的詞語(yǔ)同時(shí)被支配者是酒店消費(fèi)領(lǐng)域有關(guān)酒店屬性的aspect時(shí),該關(guān)系可能描述了用戶(hù)對(duì)酒店某一方面的情感。如enjoy the service表達(dá)了針對(duì)服務(wù)aspect積極的情感。
本文增加了一些新的術(shù)語(yǔ),以便算法的描述和實(shí)現(xiàn):
定義1每一個(gè)aspect能被識(shí)別出的情感為E0=0、E1=1、E2=-1。分別對(duì)應(yīng)情感當(dāng)中的中立(neutral)、積極(positive)和消極(negative)情緒。
定義2酒店消費(fèi)領(lǐng)域四個(gè)方面的集合aspects={Service,Location,Price,Food}。
獲取到每條評(píng)論中所有的依存關(guān)系后,如其中一條依存關(guān)系如下:
favorite(JJ) ← amod - hotel(NN)
然后計(jì)算單條評(píng)論每一個(gè)依存關(guān)系中aspect的詞和定義2中aspect的情感詞語(yǔ)的相似度,每一個(gè)情感詞和定義1中的相似度,來(lái)獲得定義2中每個(gè)aspect在定義1中的情感。在學(xué)習(xí)到單條評(píng)論后,使用加權(quán)的辦法來(lái)計(jì)算,每一條評(píng)論對(duì)應(yīng)定義2中aspect在定義1中的情感。計(jì)算過(guò)程如下:
(1) 當(dāng)從每條評(píng)論當(dāng)中學(xué)習(xí)到針對(duì)定義2中aspects中一個(gè)aspect的情感時(shí),當(dāng)積極情感的數(shù)量多于消極情感的時(shí)候,該aspect定義為積極情感。
(2) 當(dāng)從每條評(píng)論中學(xué)習(xí)到的消極情感的數(shù)量多于積極情感的時(shí)候,該aspect定義為消極情感。確定針對(duì)某一aspect的積極或消極情感計(jì)算式表示為:
(1)
式中:k是在一條評(píng)論中針對(duì)某aspecti積極情感個(gè)數(shù);j是在一條評(píng)論中針對(duì)aspecti消極情感個(gè)數(shù);P代表積極情感;N代表消極情感;E為最終該aspect的情感;f-1表示對(duì)所得到的積極情感和消極情感的個(gè)數(shù)進(jìn)行統(tǒng)計(jì),取最多積極或消極的情感個(gè)數(shù)的情感作為本條評(píng)論的aspect的情感。
(3) 當(dāng)該評(píng)論中沒(méi)有學(xué)習(xí)到針對(duì)定義2中積極情感和消極情感時(shí),該aspect定義為中立情感。
本文分別從酒店的定義2中四個(gè)方面對(duì)情感進(jìn)行了無(wú)監(jiān)督學(xué)習(xí),四個(gè)aspect相關(guān)的部分詞語(yǔ)如表1所示。
表1 四個(gè)aspect相關(guān)的部分詞語(yǔ)舉例
從評(píng)論當(dāng)中可以學(xué)習(xí)到不同aspect的情感。例如,從下面這條評(píng)論中學(xué)習(xí)得到的定義2中的aspect情感中的Location為neutral、Service為neutral、Price為neutral、Food為positive。
How should I start? Well, after staying at the Ambassador East Hotel, I realized it was my favorite hotel ever. The rooms are amazing. The food is great. The Pump room bar is awesome. I love this hotel. If your ever in Chicago, the Ambassador East Hotel is the place to go.
本節(jié)將上面擴(kuò)充好的數(shù)據(jù)集轉(zhuǎn)化為向量集合,同時(shí)將學(xué)習(xí)到的aspect級(jí)別情感的數(shù)據(jù)與之進(jìn)行拼接。本文采用Keras提供的Embedding(嵌入)層庫(kù)函數(shù)學(xué)到數(shù)據(jù)集中每個(gè)詞語(yǔ)的詞向量。這里文檔數(shù)量由數(shù)據(jù)增強(qiáng)后的文檔數(shù)量K_au決定,其類(lèi)標(biāo)簽由原來(lái)對(duì)應(yīng)的評(píng)論文本決定。為此,先對(duì)預(yù)處理過(guò)后的評(píng)論使用one-hot編碼,然后將每一個(gè)文本向量進(jìn)行填充至最大長(zhǎng)度max_len,該最大長(zhǎng)度由數(shù)據(jù)集中最長(zhǎng)的評(píng)論決定。然后再使用無(wú)監(jiān)督方式獲得的情感對(duì)該向量v_emo進(jìn)行拼接得到包含aspect級(jí)別情感的向量,最后輸入到Keras的嵌入層。接下來(lái)使用一個(gè)三層的卷積層,每個(gè)卷積層后面加了一個(gè)池化層。最后分別加了一個(gè)規(guī)范化層和兩個(gè)Dense(全連接)層。整個(gè)神經(jīng)網(wǎng)絡(luò)以及各部分的參數(shù)設(shè)置如圖2所示,實(shí)驗(yàn)具體的參數(shù)參考實(shí)驗(yàn)設(shè)置部分。
圖2 卷積神經(jīng)網(wǎng)絡(luò)模型
本文使用芝加哥地區(qū)的酒店評(píng)論的數(shù)據(jù)集,該數(shù)據(jù)集由康奈爾大學(xué)提供[16]。這個(gè)數(shù)據(jù)集分成兩部分,一部分是由積極情感表述的數(shù)據(jù)構(gòu)成,另一部分是由消極情緒組成。每一部分包含800條數(shù)據(jù)。每一部分由400條虛假評(píng)論和400條真實(shí)評(píng)論構(gòu)成。其中,真實(shí)評(píng)論來(lái)源于旅游點(diǎn)評(píng)網(wǎng)站;虛假評(píng)論來(lái)自于亞馬遜的眾包平臺(tái)。要求該平臺(tái)每一個(gè)人只能撰寫(xiě)一條虛假評(píng)論。在真實(shí)評(píng)論的收集過(guò)程中,針對(duì)不同的酒店該數(shù)據(jù)集對(duì)負(fù)面評(píng)論僅允許一星或兩星的評(píng)論。這些評(píng)論的平均字?jǐn)?shù)為116個(gè)詞左右。
對(duì)酒店評(píng)論進(jìn)行了一系列的預(yù)處理,將數(shù)據(jù)集進(jìn)行生成向量的一系列操作。數(shù)據(jù)預(yù)處理分為兩個(gè)部分:對(duì)每一條評(píng)論中的停用詞語(yǔ)進(jìn)行抽??;獲取到數(shù)據(jù)集中所有的tokens。對(duì)每一條評(píng)論進(jìn)行詞語(yǔ)性質(zhì)分析提取形容詞和副詞。另外,使用spacy對(duì)酒店知識(shí)域中的相關(guān)方面的主語(yǔ)和賓語(yǔ)進(jìn)行提取。獲取到每條評(píng)論的one-hot向量。90%的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,剩下部分作為測(cè)試集合。采用本文提出的架構(gòu)對(duì)數(shù)據(jù)集進(jìn)行增強(qiáng)。每次實(shí)驗(yàn)當(dāng)中測(cè)試集包含了整個(gè)單次實(shí)驗(yàn)中增強(qiáng)前的數(shù)據(jù)集。
本文實(shí)驗(yàn)使用了Google Colab作為基礎(chǔ)的實(shí)驗(yàn)環(huán)境,在預(yù)處理階段,使用Python對(duì)兩個(gè)數(shù)據(jù)集進(jìn)行了切分。在數(shù)據(jù)增強(qiáng)階段使用了EDA文本增強(qiáng)技術(shù)。EDA數(shù)據(jù)集增強(qiáng)的參數(shù)num_ag為10,修改比列α為默認(rèn)參數(shù)0.05。在無(wú)監(jiān)督aspect級(jí)別情感學(xué)習(xí)時(shí),使用spacy自然語(yǔ)言解析工具。卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)如下:模型的Embedding層是890維的向量,輸出是890×20,在卷積模型部分使用了Keras來(lái)構(gòu)建本文的卷積層,具體的參數(shù)參考圖2。在訓(xùn)練過(guò)程中epoch為5,batchsize為5。每次訓(xùn)練集均被混洗。在模型的驗(yàn)證階段使用和對(duì)比論文中相同的驗(yàn)證方式[5]:重復(fù)分層交叉驗(yàn)證(Rpeated Stratifiled KFold)。其中:重復(fù)次數(shù)為10;劃分參數(shù)為10。該方式能有效地防止過(guò)擬合。本文在每次的實(shí)驗(yàn)過(guò)程中,使用n-1折的增強(qiáng)數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練;使用1折的數(shù)據(jù)進(jìn)行測(cè)試??偣策M(jìn)行了100次實(shí)驗(yàn)。
本文以100次實(shí)驗(yàn)當(dāng)中1次實(shí)驗(yàn)中對(duì)應(yīng)1折當(dāng)中的評(píng)論為例,說(shuō)明完成虛假評(píng)論識(shí)別的過(guò)程。首先數(shù)據(jù)被分為10折,其中9折經(jīng)過(guò)H-textcnn進(jìn)行增強(qiáng)和aspect級(jí)別的情感識(shí)別過(guò)后,將對(duì)應(yīng)的數(shù)據(jù)經(jīng)過(guò)實(shí)驗(yàn)設(shè)置中的方法轉(zhuǎn)化為訓(xùn)練集。在訓(xùn)練集上訓(xùn)練本文設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò),最后使用1折中的評(píng)論經(jīng)過(guò)上述同樣過(guò)程后轉(zhuǎn)為向量輸入到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)后得到分類(lèi)結(jié)果。如在第21次實(shí)驗(yàn)過(guò)程中,其中10條評(píng)論被用作測(cè)試集。本文選擇如下評(píng)論為例:
We just got back from a trip to Chicago for my 30th birthday and we could not have been more impressed by this hotel! Service was excellent, especially the maid service. Our room was so clean and fresh towels brought in daily. The front desk staff was some of the most professional and friendly staff I have ever dealt with while travling. The location is excellent as it is within walking distance of the best restaurants and stores. I highly recommend Affinia for a the perfect family vacation.
此條評(píng)論經(jīng)過(guò)預(yù)處理過(guò)后成為一個(gè)one-hot向量,使用無(wú)監(jiān)督aspect學(xué)習(xí)到的依存句法關(guān)系有excellent(JJ)←amod—service(NN), friendly(JJ)←amod—staff(NN),best(JJ)←amod—restaurants(NNS)等。進(jìn)行相似度比對(duì)和算法處理過(guò)后得到定義2中的aspects的情感分別為{positive,positive,neutral,positive},然后將其轉(zhuǎn)為向量與上面的one-hot向量進(jìn)行拼接。將該向量傳入到卷積神經(jīng)網(wǎng)絡(luò)得到分類(lèi)結(jié)果為該評(píng)論為偽造的評(píng)論,該結(jié)果與數(shù)據(jù)集中的標(biāo)簽一致。
本文使用了如下的評(píng)價(jià)指標(biāo)來(lái)驗(yàn)證本文方法的有效性,分別是acc、fn-rate和fp-rate。fp-rate代表了虛假評(píng)論被分類(lèi)為真實(shí)評(píng)論的比例;fn-rate代表真實(shí)評(píng)論被分類(lèi)為虛假評(píng)論的比例;acc代表評(píng)論被正確分類(lèi)的比例。計(jì)算公式如下:
(2)
(3)
(4)
式中:tp為被模型預(yù)測(cè)為真實(shí)評(píng)論的真實(shí)評(píng)論的數(shù)量;tn表示被模型預(yù)測(cè)為虛假評(píng)論的數(shù)量;fp代表的是被模型預(yù)測(cè)為真實(shí)評(píng)論的虛假評(píng)論的數(shù)量;fn是被模型預(yù)測(cè)為虛假評(píng)論的真實(shí)評(píng)論的數(shù)量。
本文選取的對(duì)比方法為樸素貝葉斯、支持向量機(jī)、深度神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)。
對(duì)應(yīng)的技術(shù)指標(biāo)實(shí)驗(yàn)結(jié)果數(shù)據(jù)[5]來(lái)自于實(shí)現(xiàn)相同目的即酒店虛假評(píng)論識(shí)別,采用的是同樣的數(shù)據(jù)集即3.1節(jié)中描述的數(shù)據(jù)集,同樣的交叉驗(yàn)證過(guò)程即重復(fù)分層交叉驗(yàn)證,同樣的評(píng)價(jià)標(biāo)準(zhǔn)。
將本文方法與文獻(xiàn)[5]的方法作比較,它們都基于同樣的領(lǐng)域、目的、數(shù)據(jù)集、評(píng)價(jià)指標(biāo)和驗(yàn)證過(guò)程,對(duì)比結(jié)果如表2所示,其中對(duì)比方法的技術(shù)指標(biāo)實(shí)驗(yàn)結(jié)果數(shù)據(jù)來(lái)自文獻(xiàn)[16]。
表2 不同方法的技術(shù)指標(biāo)-積極
表3 不同方法的技術(shù)指標(biāo)-消極
表2和表3的結(jié)果說(shuō)明本文使用的方法比對(duì)比方法在評(píng)價(jià)指標(biāo)上有了明顯的提升。對(duì)于實(shí)驗(yàn)性能獲得的顯著提升,本文認(rèn)為是因?yàn)檫M(jìn)行了EDA和無(wú)監(jiān)督aspect情感識(shí)別的原因。
評(píng)論在酒店消費(fèi)當(dāng)中有著非常重要的作用。很多消費(fèi)者通過(guò)閱讀酒店評(píng)論的辦法來(lái)做出消費(fèi)決定。因此有人通過(guò)制造虛假評(píng)論來(lái)影響消費(fèi)者的決定。目前酒店消費(fèi)領(lǐng)域因?yàn)楦鞣N各樣的原因缺少標(biāo)注的大量樣本的數(shù)據(jù)集,導(dǎo)致針對(duì)小樣本的數(shù)據(jù)集識(shí)別困難。本文提出一種結(jié)合數(shù)據(jù)增強(qiáng)、無(wú)監(jiān)督學(xué)習(xí)aspect級(jí)別情感和文本卷積神經(jīng)網(wǎng)絡(luò)的方法。該方法較好地克服了小樣本數(shù)據(jù)集的問(wèn)題,有效地進(jìn)行了數(shù)據(jù)增強(qiáng)和情感特征增強(qiáng),在實(shí)驗(yàn)的數(shù)據(jù)集上有較好的效果。未來(lái)的工作主要包括改進(jìn)新的網(wǎng)絡(luò)結(jié)構(gòu),探索更準(zhǔn)確的細(xì)粒度的情感識(shí)別方法,同時(shí)也可以進(jìn)一步研究數(shù)據(jù)增強(qiáng)辦法。