慕永利,李 旸,王素格,2
(1山西大學(xué) 計算機與信息技術(shù)學(xué)院,山西 太原 030006;2山西大學(xué) 計算機智能與中文信息處理教育部重點實驗室,山西 太原 030006)
文本情緒分析是自然語言處理領(lǐng)域非常重要的研究方向之一,它主要研究文本所蘊含的情緒及與情緒相關(guān)的深層信息。目前,文本情緒分析大都將研究聚焦在情緒分類方法上。王蓉等人[1]采用bag-of-words表示文本,通過聯(lián)合學(xué)習(xí)對文本的情感和情緒進行分類。Shoushan Li等人[2]同樣采用bag-of-words表示文本,再利用依賴因子圖模型預(yù)測句子級別的情緒類型。伴隨著深度學(xué)習(xí)技術(shù)的成熟,基于深度學(xué)習(xí)的情緒分類方法也呈現(xiàn)出比傳統(tǒng)機器學(xué)習(xí)方法更為有效的結(jié)果。張志華[3]提出基于卷積神經(jīng)網(wǎng)絡(luò)對長文本進行情感語義建模,解決了長文本(句子)的情感分類問題。Yaqi Wang等人[4]利用卷積神經(jīng)網(wǎng)絡(luò)對句子建模,實現(xiàn)了微博文本數(shù)據(jù)的多標簽情緒分類。然而對于情緒分析問題,若忽略了文本情緒相關(guān)的深層次信息的挖掘,將影響其分析的效果。例如,2016年的羅爾詐捐門事件,公眾情緒從最初的同情演變?yōu)楹竺娴膽嵟?,引起一系列的社會問題。因此,不僅要關(guān)注公眾情緒是什么,更應(yīng)該關(guān)注公眾為什么會從同情演變?yōu)閼嵟那榫w,由此可見,事件中的情緒原因的識別是非常重要和必需的。所謂情緒原因識別就是針對文本中出現(xiàn)的被描述者的情緒,抽取出觸發(fā)被描述者情緒產(chǎn)生的原因信息。
隨著深度學(xué)習(xí)在自然語言處理領(lǐng)域中的廣泛應(yīng)用,人們開始利用神經(jīng)網(wǎng)絡(luò)模型,通過對句子進行建模來處理文本分類任務(wù)。Xinchi Chen[5]采用GRNN(gated recursive neural network)、Nal Kalchbrenner[6]和Yoon Kim[7]通過不同卷積和池化的CNN神經(jīng)網(wǎng)絡(luò)對句子建模,最后他們都在SST[8]、TREC[9]數(shù)據(jù)集上分別進行情感分類和問題分類,通過實驗驗證了采用CNN的句子建模可以獲得最好的分類性能。由此可見,神經(jīng)網(wǎng)絡(luò)不僅可以應(yīng)用到文本情感分類任務(wù)(SST[8]數(shù)據(jù)集上的情感分類),還可以應(yīng)用到文本問答類型的分類任務(wù)(TREC[9]數(shù)據(jù)集上的問題分類)。此前,情緒歸因一般研究人員大都采用基于規(guī)則和統(tǒng)計的方法[10-16]。
本文針對文本情緒原因識別任務(wù),提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的集成(E-CNN模型)的情緒原因識別方法,首先利用卷積神經(jīng)網(wǎng)絡(luò)對句子進行建模,在詞向量的訓(xùn)練表示上,融合上下文語義信息,然后通過多個CNN的集成,用于文本情緒原因的識別。實驗結(jié)果表明,本文提出的E-CNN(Ensemble Convolution Neural Network)方法,在情緒原因識別方面獲得了較好的實驗性能。
針對情緒原因的識別,Ying Chen[10]等人通過對標注語料的分析,發(fā)現(xiàn)超過80%的情緒原因信息位于出現(xiàn)情緒的核心子句的前后兩個子句中,Sophia Yat Mei Lee[10]同樣根據(jù)對標注的語料分析,獲得情緒原因信息大多位于出現(xiàn)情緒的核心子句的上下文信息中。為了獲得這些情緒原因,研究人員主要采用基于規(guī)則和基于統(tǒng)計的方法。
基于規(guī)則的情緒原因識別方法方面,Ying Chen[10]和Sophia Yat Mei Lee[10-11]等人建立了一個情緒歸因的語料庫,并且根據(jù)標注的語料庫建立了相應(yīng)的規(guī)則,用于情緒原因子句的識別。Kai Gao[13]等人提出一種基于規(guī)則的情緒原因識別模型,然后對相應(yīng)的微博數(shù)據(jù)進行情緒原因的抽取,然而,制定的規(guī)則并不能完全覆蓋所有的語言現(xiàn)象,而且同一個子句可能同時匹配多個規(guī)則,很容易造成規(guī)則沖突。再者不同領(lǐng)域語料的語言結(jié)構(gòu)有一定的區(qū)別,針對特定領(lǐng)域的文本制定的規(guī)則并不能很好地適用于其他領(lǐng)域的文本,需要耗費巨大的人力物力重新分析語言結(jié)構(gòu)來添加新的規(guī)則。Alena Neviarouskaya[14]通過句法、語法和規(guī)則相結(jié)合的方法,分析八種情緒原因的語言現(xiàn)象,以此來推測一段文本的情緒類別和情緒原因。Weiyuan Li[15]等人通過抽取情緒原因特征進行情緒分類,其特征抽取仍采用基于規(guī)則的方法。
在基于統(tǒng)計方法的情緒原因識別方面,袁麗[16]提取語言學(xué)線索詞的特征、句子距離特征、候選詞詞法特征等信息,然后得到特征向量空間,最后應(yīng)用SVM分類器和條件隨機場對文本情緒歸因進行了判別。Lin Gui等人[17]不僅通過建立25條規(guī)則來進行文本情緒原因的預(yù)測,還運用分類方法來預(yù)測文本情緒原因。李逸薇等[18]將情緒歸因識別任務(wù)看成序列標注,并建立了相應(yīng)的模型,將所有候選原因子句當成一個序列,從而標記出哪些屬于原因子句,她特別指出在利用序列標注模型進行情緒原因識別的過程中,上下文特征尤為重要。Ghazi D等人[19]利用FrameNet建立了情緒和情緒原因相關(guān)聯(lián)的數(shù)據(jù)集,然后利用CRF來預(yù)測文本句子級別的情緒。Gaoyan Ou等人[20]建立文本公眾情緒和情緒事件之間關(guān)系,利用文本情緒對文本中事件進行預(yù)測。Lin Gui等人[21]首先構(gòu)建了一個情緒歸因語料庫,標注了表達情緒的核心子句,在核心句的前后子句中標注情緒原因子句,然后從核心句的前后每個子句中抽取候選原因事件,通過訓(xùn)練分類器,最后判定抽取的候選原因事件是否是情緒核心子句的原因事件。
綜上可知,無論是基于規(guī)則的情緒原因識別方法,還是基于統(tǒng)計的情緒原因識別方法,二者都表明情緒原因的相關(guān)信息一般都位于文本中情緒核心句的上下文信息中。針對這一重要的語言現(xiàn)象,本文提出了一種基于E-CNN模型的情緒原因識別方法,該方法不同于目前的情緒原因識別方法,而是利用了詞向量和卷積神經(jīng)網(wǎng)絡(luò),同時融合了句子的語義信息進行情緒原因識別。
為了分析情緒和情緒原因在句子中出現(xiàn)的情況,我們將情緒出現(xiàn)的文本子句稱為情緒核心子句,被描述者情緒原因信息所在的子句稱為情緒原因子句,這里所描述的子句可以是逗號、問號、感嘆號、句號為結(jié)尾的句子,子句示例信息見表1。通過在數(shù)據(jù)集中的統(tǒng)計,獲得情緒原因子句在數(shù)據(jù)集中的統(tǒng)計信息,如表2所示。
表1 情緒原因識別示例表
表2 數(shù)據(jù)集相關(guān)統(tǒng)計信息示例表
其中,表1中的S0表示情緒核心子句所在位置,S-3、S-2、S-1表示緊鄰情緒核心子句前的三個子句,S+1、S+2、S+3表示緊鄰情緒核心子句的后三個子句。標簽信息為1表示情緒原因子句,標簽信息為0表示非情緒原因子句。
(1) 從表1可知,示例中的上下文句子中情緒原因子句僅有一個,非情緒原因子句有六個,就單個示例來看,情緒原因信息在整個示例的上下文信息中所占比例較小,導(dǎo)致在對情緒核心子句上下文中的子句進行情緒原因識別時,可以利用的信息也較少,從而使非情緒原因信息所占比重較大。因此,在整個上下文信息中進行情緒原因信息的識別存在不平衡問題。
(2) 由表2可知,整個數(shù)據(jù)集中情緒原因子句約占整個句子的18.366%,原因信息位于包含情緒核心子句在內(nèi)的上下文7個子句中約占98.06%,原因信息位于其他位置約占1.94%;包含一個原因子句信息的示例約占98.06%,包含多個原因子句信息的示例占1.94%。通過我們的考察以及對Lin Gui標注語料的統(tǒng)計,發(fā)現(xiàn)幾乎所有的情緒原因信息都位于緊鄰情緒核心子句的上下文信息中。這與文獻[10]得到的結(jié)論相同。因此,從緊鄰情緒核心子句的上下文中識別情緒原因信息將成為情緒原因識別問題的關(guān)鍵。
由2.1節(jié)對情緒原因識別問題的分析,可將情緒原因識別任務(wù)看成一個分類問題,主要判別一個核心子句的上下文子句是否包含情緒原因信息。傳統(tǒng)的分類方法普遍采用詞袋模型對句子進行向量表示,再采用SVM等傳統(tǒng)機器學(xué)習(xí)方法進行分類。其不足是不能很好地充分融合句子中詞與詞之間的語義信息。另外,由于非情緒原因信息所占比重較大,使得情緒原因信息與非情緒原因信息之間的比例存在非平衡問題。因此,本文結(jié)合CNN卷積神經(jīng)網(wǎng)絡(luò)提出了一種集成的卷積神經(jīng)網(wǎng)絡(luò)(E-CNN)情緒歸因模型,對情緒原因進行分類識別。模型整體框架如圖1所示。
圖1 E-CNN情緒原因識別框架圖
如表1所示,對于一組文本,通過E-CNN模型得到每個子句的概率值,數(shù)據(jù)集中多原因子句的情況所占比例很小,因此,將概率最大的一個候選原因子句作為每組示例的情緒原因子句。
利用情緒核心子句的上下文子句識別情緒原因子句時,由于原因子句與非原因子句所占比例是不平衡的,我們將每個示例的原因子句和非原因子句分別構(gòu)成多個較平衡的數(shù)據(jù)集,分別在各個新數(shù)據(jù)集上進行相對應(yīng)的CNN卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練;然后將訓(xùn)練好的多個CNN集成組合,構(gòu)建E-CNN模型;最后在E-CNN模型上進行情緒原因子句的分類,以識別包含情緒原因信息的子句。
基于E-CNN模型進行情緒原因識別的過程如圖2所示。
圖2 E-CNN情緒原因識別過程圖
由圖2可知,E-CNN由多個訓(xùn)練好的CNN集成。
在E-CNN模型中:(1)將句子中的詞語利用Word2Vec工具進行詞向量表示,然后通過詞向量矩陣化操作將句子中的詞向量組合成為一個詞向量矩陣;(2)通過CNN模型中的卷積操作融合詞與詞之間的語義信息;(3)通過CNN模型中Max-pooling池化操作、連接操作和attention操作將候選原因子句表示為一個向量;(4)通過sigmoid函數(shù)和集成操作得到候選原因子句的概率值,在核心子句的上下文的七個候選子句中,概率最大的子句即為情緒原因子句。
本文建立的CNN卷積神經(jīng)網(wǎng)絡(luò)模型如圖3所示,CNN包含輸入層、卷積層、池化層、Attention層,連接層。
圖3 CNN模型圖
(1) 輸入層:該層主要是初始化輸入數(shù)據(jù),通過Word2Vec將句子中的詞語表示成詞向量,采用⊕運算操作將詞向量連接表示為一個詞向量矩陣X,如式(1)所示。
(1)
(2) 卷積層:該層采用不同大小的卷積窗口進行卷積操作,將句子中的局部語義信息融合。通過卷積窗口選取c個句子中的局部詞向量首尾相連,gj被表示為一個具有局部語義信息的新向量,如公式(2)所示。G(n-c+1)×(c×k)為將gj通過連接運算操作表示為一個具有句子全局語義信息的新矩陣,如式(3)所示。Md×(n-c+1)為G(n-c+1)×(c×k)通過σ函數(shù)表示為最終的卷積層矩陣,如式(4)所示。
σ表示sigmoid函數(shù),c表示卷積窗口大小,Wd×(c×k)是卷積核系數(shù)矩陣,Bd×(n-c+1)是卷積核偏置矩陣。
(3) 池化層:該層通過Max-pooling操作[6]從一個卷積層矩陣中選取代表句子全局語義信息中的有效特征。Q表示池化后代表句子語義信息的池化層向量。Md×(n-c+1)表示卷積層矩陣,如式(5)和式(6)所示。
(5)
(6)
(5) Attention層:根據(jù)對所有情緒原因子句的句子結(jié)構(gòu)的分析可以得知,超過90%的原因子句含有動詞和動詞短語,而且很多情緒原因子句還含有代表原因信息的連詞,如“由于”“因為”等連詞。針對這些情緒原因子句特殊的語言結(jié)構(gòu),我們通過在CNN中添加Attention層來增強情緒原因子句語言現(xiàn)象對情緒原因子句識別的影響。在模型中通過句法分析和詞性標注選取動詞和原因連詞。
如圖4所示,如果一個句子中至少含有一個動詞,那么該句子的核心詞(HED表示核心關(guān)系)就是動詞。通過詞性標注可知,圖4中的“因”(詞性標注中的c表示連詞)為連詞。綜上所述,從候選原因子
圖4 句法分析示例圖
句中選取核心詞(通過HED關(guān)系選取句子的核心詞)和原因連詞(詞性標注中的c表示連詞,如果沒有連詞則不選),選取核心詞和連詞構(gòu)成新的詞向量矩陣E,然后通過全連接操作得到一個attention向量,如式(7)所示。
A1×k=W1×a·Ea×k
(7)
如圖3中的Attention層所示,a為被選中的詞的總個數(shù),k表示詞向量的維度。
(10)
(11)
通過在3.1節(jié)數(shù)據(jù)集上進行了大量實驗,并進行了參數(shù)調(diào)整,獲得的超參數(shù)設(shè)置如下:詞向量維數(shù)k設(shè)為50,CNN的個數(shù)h設(shè)為5,卷積窗口s的個數(shù)為3,3個卷積窗口c的大小分別為設(shè)為3、4、5,卷積核的大小d設(shè)為300,學(xué)習(xí)率α設(shè)為0.01,批大小batchsize設(shè)為50,λ設(shè)為10-8。
為了驗證在一個CNN模型的迭代次數(shù)對情緒原因發(fā)現(xiàn)的影響,本文隨機選取原因子句和非原因子句為1∶1的數(shù)據(jù)集(原因子句2 167,非原因子句2 167)上進行迭代實驗。實驗結(jié)果如圖5所示。
圖5 測試集上的F值隨迭代次數(shù)變化圖
由圖5可知,隨著iteration的增大,在測試集上的情緒原因發(fā)現(xiàn)的F值也逐漸增大。當iteration超過100時,F(xiàn)值就快速達到0.672 1,說明在前100詞迭代過程中,模型快速收斂靠近最優(yōu)解。當iteration超過1 100以后,情緒原因發(fā)現(xiàn)的F值基本保持不變,甚至略有下降,說明當iteration達到1 100時,模型基本達到了穩(wěn)定狀態(tài);iteration超過1 100以后,可能出現(xiàn)了過擬合的現(xiàn)象。因此,為了使模型達到情緒原因識別的最優(yōu)狀態(tài),也為了防止過擬合的出現(xiàn),在實驗過程中我們將iteration設(shè)為1 100。
為了驗證本文所提方法的有效性,設(shè)置了方法間的比較實驗和不同評價方法的實驗。
(1) 方法間的對比實驗
選用了如下的方法進行對比實驗:
① 基于規(guī)則
? RB(Rule based method):基于規(guī)則的方法[11];
? CB(Commonsense based method):基于常識的方法[22-23];
? ML(Rule base features for machine learning):利用基于規(guī)則的方法進行特征抽取,然后利用機器學(xué)習(xí)方法進行分類[24]。
② 基于SVM分類器
KET-O、KET-M:均是利用詞袋模型進行句子中候選原因事件的向量表示[21],然后利用樹核SVM[21]和修改后的樹核SVM進行分類[21],如果子句中包含了原因事件,則該子句為原因子句;
Knew+O、Knew*O、Knew+M、Knew*M:均是利用詞袋模型進行句子中候選原因事件的向量表示[21],然后利用多種不用核函數(shù)結(jié)合的SVM進行分類[21],如果子句中包含了原因事件,則該子句為原因子句。
③ 基于深度學(xué)習(xí)
? CNN:采用單個CNN在數(shù)據(jù)集上進行實驗;
? E-CNN:采用E-CNN在數(shù)據(jù)集上進行實驗。
最后CNN和E-CNN均選取概率最大候選原因子句作為該組示例的情緒原因子句。
上述方法數(shù)據(jù)集與參數(shù)均在3.1和3.2節(jié)進行了介紹。規(guī)則、SVM和CNN三大類方法間的比較實驗結(jié)果如表3所示。
表3 各種方法的實驗結(jié)果比較
由表3可知:
① 與基于規(guī)則的情緒歸因方法比較,E-CNN在準確率、召回率和F值上均高于RB+CB,準確率、召回率、F值分別達到0.571 4、0.543 7、0.556 9。同時E-CNN的召回率高于RB+CB+ML。由上述分析可知,E-CNN比基于規(guī)則的情緒原因識別方法效果更好。
② 與基于SVM分類器的情緒歸因方法比較,E-CNN方法在精確率、召回率、F值都明顯高于KET-M。而Knew×M中由于加入了NER以及Parsering結(jié)果,所以E-CNN方法不及Knew×M。同時Knew×M在候選原因子句抽取原因事件時,將會丟失不包含情緒原因事件的句子,主要原因在事件抽取時需要每個子句必須包含動詞或者動詞短語,而有些原因子句中并不一定包含動詞或動詞短語。另一方面,E-CNN雖然實驗效果低于Knew×M方法,但是可以識別不包含事件信息的情緒原因子句,以及各種類型語言結(jié)構(gòu)的情緒原因子句。
③ 在和單個CNN方法比較中,E-CNN方法的精確率、召回率、F值都明顯高于本文單個CNN方法。主要原因是:使用E-CNN方法,可以分別將每組示例(表1所示)中的各個非情緒原因子句和同一個情緒原因子句組成新的數(shù)據(jù)集,分別訓(xùn)練CNN會充分融合情緒原因子句和各個子句的句間關(guān)系。因此,E-CNN的實驗效果更好。
(2) 三種評價方法
由于情緒原因識別問題本身存在不平衡問題,有時抽取概率最大的一個候選原因子句并不能很好地幫助研究人員進行情緒原因識別問題的研究,因此,在用E-CNN模型進行情緒原因子句識別后,對每組示例預(yù)測的情緒原因子句按概率從大到小排序,分別選取概率較大的一個和多個子句同時作為情緒原因子句。這里選取概率最大的一個候選原因子句作為該組示例的情緒原因子句(E-CNN),選取概率最大的兩個候選原因子句作為原因子句,且只要兩個子句至少包含一個原因子句即視為正確(E-CNN-2),選取概率最大的三個候選原因子句作為原因子句,且只要三個子句中至少包含一個原因子句即視為正確(E-CNN-3);三種方式的實驗結(jié)果如表4所示
表4 E-CNN實驗結(jié)果對比表
由表4可知,利用E-CNN-2識別兩個候選原因子句中至少包含一個原因子句的精確率達到0.825 2,召回率達到0.758 6。在E-CNN-3識別三個候選原因子句中至少包含一個原因子句的精確率高達0.959 3,召回率高達0.936 7。由此可知,E-CNN模型可以幫助情緒原因識別研究方法進行情緒原因的前期識別過濾,同時也可以用于有關(guān)情緒原因識別的問答類問題的候選子句的選取。
情緒原因識別方法需要對上下文信息進行很好的融合和處理,而CNN卷積神經(jīng)網(wǎng)絡(luò)可以在句子建模過程中充分考慮句子中所有的詞義信息的融合,并且還可以從所有語義信息中選取有效的全局語義信息。另一方面,情緒原因子句與非情緒原因子句在實際語料中存在極不平衡情況。基于兩種因素,本文提出的E-CNN模型,為了增強因果句子的顯式特征,在E-CNN模型中加入了attention機制,以增強對情緒原因子句的識別。
在E-CNN模型中,雖然E-CNN-2和E-CNN-3兩種實驗的結(jié)果是最佳的,但E-CNN的識別結(jié)果不及Knew×M,下一步,需要將事件的主體信息考慮到模型中,同時引入句法信息和命名體信息。另一方面,需要給出一個更為合理的度量,用于判斷候選情緒原因子句中真正的情緒原因子句。
[1]R Wang,S Li,G Zhou,et al.Joint sentiment and emotion classification with integer linear programming[C]//Proceedings of International Conference on Database Systems for Advanced Applications.Springer International Publishing,2015:259-265.
[2]Shoushan Li,Lei Huang,Rong Wang.et al.Sentence-level emotion classification with label and context dependence[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing,2015:1045-1053.
[3]張志華.基于深度學(xué)習(xí)的情感詞向量及文本情感分析的研究[D].上海:華東師范大學(xué)碩士學(xué)位論文,2016.
[4]Yaqi Wang,S Feng,D Wang,et al.Multi-label Chinese microblog emotion classification via convolutional neural network[C]//Proceedings of Asia-Pacific Web Conference:Springer International Publishing,2016:567-580.
[5]Xinchi Chen,Xipeng Qiu,Chenxi Zhu,et al.Sentence modeling with gated recursive neural network[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing,2015:793-798.
[6]Nal Kalchbrenner,Edward Grefenstette,Phil Blunsom.A convolutional neural network for modeling sentences[C]//Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics,2014:655-665.
[7]Yoon Kim.Convolutional neural networks for sentence classification[C]//Proceedings of Conference on Empirical Methods in Natural Language Processing,2014:1746-1751.
[8]Richard Socher,Alex Perelygin,Jean Y Wu,et al.Recursive deep models for semantic compositionality over a sentiment treebank[C]//Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing,2013:1631-1642.
[9]Xin Li,Dan Roth.Learning question classifiers[C]//Proceedings of the International Conference on Computational Linguistics,2002,12(24):556-562.
[10]Ying Chen,Sophia Yat Mei Lee,Shoushan Li,et al.Emotion cause detection with linguistic constructions[C]//Proceedings of the 23rd International Conference on Computational Linguistics,2010:179-187.
[11]Sophia Yat Mei Lee,Ying Chen,Chu-Ren Huang.A text-driven rule-based system for emotion cause detection[C]//Proceedings of the NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Tex,2010:45-53.
[12]S Y M Lee,Ying Chen,Shoushan Li,et al.Emotioncause events:corpus construction and analysis[C]//Proceedings of the International Conference on Language Resources and Evaluation,Computational Intelligence,2010:1121-1128.
[13]Kai Gao,Hua Xu,Jiushuo Wang.A rule-based approach to emotion cause detection for Chinese micro-blogs[J].Expert Systems with Applications,2015,42(9):4517-4528.
[14]A Neviarouskaya,M Aono.Extracting causes of emotions from text[C]//Proceedings of International Joint Conference on Natural Language Processing,2013:932-936.
[15]Weiyuan Li,Hua Xu.Text-based emotion classification using emotion cause extraction[J].Expert Systems with Applications,2014,41(4):1742-1749.
[16]袁麗.基于文本的情緒自動歸因方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué)碩士學(xué)位論文,2014.
[17]Lin Gui,Li Yuan,RuifengXu,Bin Liu,et al.Emotion cause detection with linguistic construction in chinese weibo text[J].Communications in Computer & Information Science,2014,496(s 3-4):457-464.
[18]李逸薇,李壽山,黃居仁,等.基于序列標注模型的情緒原因識別方法[J].中文信息學(xué)報,2013,27(5):93-99.
[19]Ghazi D,Inkpen D,Szpakowicz S.Detecting emotion stimuli in emotion-bearing sentences[M]//Computational Linguistics and Intelligent Text Processing.Springer International Publishing,2015,152-165.
[20]Gaoyan Ou,Wei Chen,Tengjiao Wang,et al.Exploiting community emotion for microblog event detection[C]//Proceedings of Conference on Empirical Methods in Natural Language Processing,2014:1159-1168.
[21]Lin Gui,Dongyin Wu,Ruifeng Xu,et al.Event-driven emotion cause extraction with corpus construction[C]//Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing,2016:1639-1649.
[22]Irene Russo,Tommaso Caselli,Francesco Rubino,et al.EMO-cause:An easy-adaptable approach to emotion cause contexts[C]//Proceedings of the 2nd Workshop on Computational Approaches to Subjectivity and Sentiment Analysis,2011:153-160.
[23]Ruifeng Xu,Chengtian Zou,Yanzhen Zheng,et al.A new emotion dictionary based on the distinguish of emotion expression and emotion cognition[J].Journal of Chinese Information Processing,2013,27(6):82-90.
[24]Y Chen,S Y M Lee,S Li,et al.Emotion cause detection with linguistic constructions[C]//Proceedings of International Conference on Computational Linguistics,2010:179-187.
慕永利(1990—),碩士研究生,主要研究領(lǐng)域為文本情感分析。E-mail:1203962063@qq.com
李旸(1990—),博士研究生,主要研究領(lǐng)域為文本情感分析。E-mail:770624917@qq.com
王素格(1964—),博士,教授,主要研究領(lǐng)域為自然語言處理。E-mail:wsg@sxu.edu.cn