摘 要:本文針對給定主題的微博小句內(nèi)評價對象與評價詞情況,采取基于規(guī)則的方法,利用(CUCsas)傾向性分析系統(tǒng)(CUCsas),以第八屆SIGHAN中文信息處理研討會(SIGHAN-8)提供的評測語料為研究對象進(jìn)行實(shí)驗(yàn),并得出相關(guān)結(jié)論。
關(guān)鍵詞:評價 微博 主題 規(guī)則
一、研究背景
目前,傾向性分析主要集中于詞語、句子、語篇三個層面,采用的主要是基于規(guī)則與基于機(jī)器學(xué)習(xí)的方法兩種。這兩種技術(shù)在傾向性分析領(lǐng)域各有優(yōu)劣。基于規(guī)則的方法對語言本體研究較為深入,對于指定語料分析效果較好,但普適性相對不高。基于機(jī)器學(xué)習(xí)的方法在COAE、CCF等歷屆評測中雖占據(jù)主流,但效果并不理想。
雖然目前國內(nèi)對微博的傾向性分析研究較多,但大多集中于整體文本的處理與策略的研究,而對特定微博主題的評價對象與評價詞的句內(nèi)或跨句搭配研究并不十分深入。本文針對這類問題,采取基于規(guī)則的方法,利用CUCsas傾向性分析系統(tǒng),以第八屆SIGHAN中文信息處理研討會(SIGHAN-8)提供的評測語料為研究對象進(jìn)行實(shí)驗(yàn),并得出相關(guān)結(jié)論。
二、相關(guān)工作
(一)系統(tǒng)及運(yùn)行流程
傾向性分析系統(tǒng)(CUCsas)由短語和句子傾向性計(jì)算規(guī)則解釋器、評價對象抽取與極性判定規(guī)則解釋器以及詞典、規(guī)則庫組成。短語和句子傾向性計(jì)算規(guī)則解釋器加載語料、詞典、短語規(guī)則庫。詞典除原有分詞詞典以外,還包括用戶詞典、情感詞典、褒貶值詞典、語義詞典等多部詞典。借助詞典對語料進(jìn)行分詞及詞性、語義、傾向、傾向值4層標(biāo)注。詞典加載切分結(jié)束后,進(jìn)行短語規(guī)則庫匹配,根據(jù)規(guī)則與相關(guān)公式對整個句子或整條微博進(jìn)行傾向值的計(jì)算。傾向性計(jì)算后,通過評價對象抽取與極性判定規(guī)則解釋器對評價對象提取規(guī)則進(jìn)行解釋,完成評價對象的抽取。
本次評測的任務(wù)是基于主題的漢語短信息極性分類(Topic-Based Chinese Message Polarity Classification),語料中主題(topic)已經(jīng)給定,因此傾向性分析系統(tǒng)(CUCsas)在運(yùn)行時與以往略有不同,不再提取評價對象,而在語義詞典中對給定或與之相關(guān)的主題賦予“topic”的標(biāo)簽。
(二)確定評價對象
本次評測提供的訓(xùn)練語料共5000條微博,分為五個話題,分別是:日本馬桶、三星S6、霧霾、央行降息、油價。其中非評價句4016條,評價句984條。每個話題各1000條。根據(jù)評測給定的五個話題,我們對央行、央媽、油價、霧霾、降息、馬桶蓋、馬桶、馬桶圈、馬桶蓋子、日本馬桶、s6、S6、三星、三星S6、三星s6、S6旗艦、S6手機(jī)、三星手機(jī)、S6手機(jī)、S系列、Edge、edge、GalaxyS6Edge、GalaxyS6、S6旗艦等詞或短語賦予“topic”的標(biāo)記。我們暫時認(rèn)為這些詞是評價對象。
(三)選取語料
由于本次評測提供的訓(xùn)練語料中非評價句居多,為保證研究效果,我們從5000條微博中每話題選取100句能確定答案正確的微博,且選取的評價句與非評價句數(shù)量基本相當(dāng)。最終在500句中確定評價句228條,非評價句272條。評價句中褒義有79句,貶義有149句。
微博語料與以前傳統(tǒng)語料在形式、內(nèi)容上都有很大差別。由于微博具有“轉(zhuǎn)發(fā)”功能,因此用戶除發(fā)表自己觀點(diǎn)以外還可以轉(zhuǎn)發(fā)其他用戶內(nèi)容,因此在形式上就會出現(xiàn)一些特殊標(biāo)記。如“轉(zhuǎn)發(fā)”會有“//”標(biāo)記。發(fā)布或轉(zhuǎn)發(fā)新聞時,新聞標(biāo)題會用“【】”標(biāo)記。我們認(rèn)為新聞標(biāo)題中的評價詞不是針對整個微博做出的評價,因此對語料進(jìn)行預(yù)處理時首先屏蔽掉了“【】”中的內(nèi)容。
(四)相關(guān)數(shù)據(jù)統(tǒng)計(jì)
為了研究微博句內(nèi)評價對象與評價詞距離關(guān)系,運(yùn)行如下短語規(guī)則進(jìn)行實(shí)驗(yàn):
*/w+#[*/!(w|topic)]+*/(po|ne)+#[*/?。╳|topic)]=#3:0
該規(guī)則的含義是:兩相鄰標(biāo)點(diǎn)間(即小句內(nèi))如果有評價詞而沒有主題“topic”標(biāo)記,則取消評價詞的情感值。這是一條覆蓋面非常廣的規(guī)則,如果將該規(guī)則放在所有短語規(guī)則最前面,則其他規(guī)則必須經(jīng)過此規(guī)則篩選后方可運(yùn)行,而如果放在后面則此規(guī)則毫無意義。這條規(guī)則對主題與評價詞在小句內(nèi)共現(xiàn)的情況可以得到較好處理,但對于跨句評價的情況則判斷錯誤。因此該規(guī)則只是用來驗(yàn)證研究微博句內(nèi)評價對象與評價詞距離關(guān)系,而不能盲目地放進(jìn)系統(tǒng)作為常駐規(guī)則運(yùn)行。
系統(tǒng)未運(yùn)行該規(guī)則前,短語規(guī)則計(jì)算出5000條微博的總體準(zhǔn)確率為54.42%,500條微博為76.2%;運(yùn)行該規(guī)則后5000條微博總體準(zhǔn)確率為71.9%,500條微博為72.4%。系統(tǒng)未運(yùn)行該規(guī)則前評價規(guī)則計(jì)算出5000條微博的總體準(zhǔn)確率為73.82%,500條微博為77%;運(yùn)行該規(guī)則后5000條微博總體準(zhǔn)確率為75.66%,500條微博為69.2%。
對500條微博語料進(jìn)行統(tǒng)計(jì)。從小句的角度看,文本中出現(xiàn)主題“topic”標(biāo)記809處,“topic”標(biāo)記與評價詞(即帶有“ne”或“po”標(biāo)記的詞)出現(xiàn)在同一小句的情況314處。以每條微博為單位進(jìn)行統(tǒng)計(jì),小句中有“topic”標(biāo)記而無評價詞標(biāo)記的情況有182處,占總數(shù)的36.4%?!皌opic”標(biāo)記與評價詞標(biāo)記在小句中共現(xiàn)的情況有259處,占總數(shù)的51.8%。整篇微博中因?yàn)椤啊尽俊毙侣剺?biāo)題標(biāo)記而預(yù)處理的文本中有“topic”標(biāo)記的情況有58處,占總數(shù)的11.6%。
三、實(shí)驗(yàn)結(jié)果分析
(一)運(yùn)行小句內(nèi)規(guī)則
從整體看,5000句微博在運(yùn)行該規(guī)則后短語規(guī)則的總體準(zhǔn)確率由54.42%提升到71.9%;從準(zhǔn)確率看,褒義、貶義都有所提升,但中性下降;從召回率看,褒義、貶義下降幅度較大而中性提升幅度較大;從F值看,褒義、貶義都有所下降,中性較大幅度提升。500句微博褒義、貶義、中性的準(zhǔn)確率、召回率變化情況與5000條微博大致相當(dāng),但F值有所下降,整體準(zhǔn)確率由77%降為69.2%。
5000條微博的語料中,非評價句占大多數(shù),而該規(guī)則屏蔽掉了大量評價詞的值,這就將很多原系統(tǒng)歸為評價句的微博歸到非評價句中,從而使得總體正確率有較大提高,但召回率褒義、貶義都有所下降而中性提高。由此可見,500篇評價句與非評價句數(shù)量大致相當(dāng)?shù)恼Z料在運(yùn)行該規(guī)則時說服力可能相對強(qiáng)一些。
由于該規(guī)則放在所有規(guī)則之前運(yùn)行,且傾向性分析系統(tǒng)(CUCsas)先運(yùn)行短語規(guī)則之后再運(yùn)行評價規(guī)則,因此在該條規(guī)則的影響下,運(yùn)行評價規(guī)則情況與短語規(guī)則大致相當(dāng)。
(二)主題“topic”與評價詞共現(xiàn)情況
通過語料可知,主題“topic”與評價詞共現(xiàn)情況占總數(shù)的51.8%。運(yùn)行主題“topic”與評價詞的小句共現(xiàn)規(guī)則,整體正確率為64.09%,中性準(zhǔn)確率最高,達(dá)86.67%??梢?,小句中主題詞與評價詞共現(xiàn)情況在總文本中所占比例較大,且小句內(nèi)的評價詞對評價對象(即主題“topic”)有很大影響。如:
(-1)(Y:-0.25)【1-1-427】(:/w)(魅族/nq)(黃章/nr)(叫板/v)(三星/nq)(Galaxy/x)(S6/nq)(也/d/clue)(不/d/mone1)(過/v)(如此/r/mopo:-0.25)(!/w)(http/x)(@/w)(鳳凰/n)(新聞/n)(客戶端/n)
例句中被標(biāo)記“topic”的詞為“三星”和“S6”。
(三)主題“topic”與評價詞跨句情況
這種情況下小句內(nèi)無評價詞對主題topic產(chǎn)生影響。因此,中性切分較好,達(dá)97.16%,而褒義、貶義切分較差。
如果將該規(guī)則放在所有短語規(guī)則前運(yùn)行,因?yàn)橹黝}topic與評價詞不在同一小句內(nèi),本應(yīng)該所有小句都被認(rèn)為是非評價句,但這種情況下CUCsas傾向性分析系統(tǒng)切分得到的結(jié)果存在有傾向性的情況。如:
(-1)(Y:-0.25)【312-312-8657】(:/w)(出來/v)(混/v)(早晚/n)(還是/d/clue)(要/v)(還/v)(的/u)(,/w)(柴靜/nr)(你/r)(也/d/clue)(不/d/mone1)(過/v)(如此/r/mopo:-0.25)(。/w)(——/w)(看到/v)(周忠民/nr)(的/u)(博文/n)(《/w)(崔永元/nr)(點(diǎn)評/v)(柴靜/nr)(:/w)(紀(jì)錄片/n)(如果/c)(能/v)(治/v)(霧霾/n)(,/w)(還/d)(要/v)(有關(guān)/v)(部門/n)(干/a)(啥/r)(》/w)(有感而發(fā)/lv)(的/u)(評論/v)(。/w)(http/x)
出現(xiàn)這種情況的原因是,“如此/r/mopo:-0.25”這類詞或語的情感值不是在情感詞典中被賦予的,而是運(yùn)行短語規(guī)則后得到情感值。
例句中“如此/r/mopo:-0.25”運(yùn)行的短語規(guī)則是:
(1)不/d+過/%+如此/%+*/w|y=#3:-0.25
(1)VL=N1
例句中第一條規(guī)則的含義是,副詞“不”與任意詞性的“過”“如此”三詞連用時,如果后面直接連接任意標(biāo)點(diǎn)符號或語氣詞時,該規(guī)則中匹配的第三項(xiàng)(即例句中的“如此”)被賦予“-0.25”的情感值。該規(guī)則運(yùn)行一次。例1中第二條規(guī)則是匹配沒有關(guān)系的句子,第一條規(guī)則運(yùn)行幾次就產(chǎn)生幾個“VL”。該例句中第一條規(guī)則運(yùn)行一次,產(chǎn)生一個“VL”,則該句的情感值就是“VL”的值。第二條規(guī)則運(yùn)行一次。
雖然小句內(nèi)規(guī)則導(dǎo)致了很多錯誤,但(CUCsas)傾向性分析系統(tǒng)(CUCsas)有一定的修正能力。由此可見,基于規(guī)則的方法在解決這類問題上非常有效果。
(四)小句內(nèi)規(guī)則放在短語規(guī)則最后
本文前面對小句內(nèi)規(guī)則“*/w+#[*/!(w|topic)]+*/(po|ne)+#[*/?。╳|topic)]=#3:0”放在短語規(guī)則最前部的情況進(jìn)行了相關(guān)實(shí)驗(yàn),對主題“topic”與評價詞在小句內(nèi)外的情況進(jìn)行了驗(yàn)證。我們可以看出,該規(guī)則對語料的影響非常大,雖然可以解決一定問題,但也導(dǎo)致了很多不可解決的錯誤。盡管(CUCsas)傾向性分析系統(tǒng)(CUCsas)有一定的修正能力,但不能保證準(zhǔn)確客觀。該規(guī)則最大的問題是過分地將很多跨句對評價對象進(jìn)行評價的詞取消了情感值。為了避免這一點(diǎn),下面將該規(guī)則置于短語規(guī)則最后面,使用500條微博語料進(jìn)行實(shí)驗(yàn),短語規(guī)則計(jì)算得出總體準(zhǔn)確率為76.6%。運(yùn)行評價規(guī)則后,總體準(zhǔn)確率為73%。整體來看,將規(guī)則置于最后雖然比將規(guī)則置于最前效果好一些,運(yùn)行短語規(guī)則后總體準(zhǔn)確率較原系統(tǒng)也略高,但運(yùn)行評價規(guī)則后效果依然不如原系統(tǒng)好。
四、結(jié)語
本文在傾向性分析系統(tǒng)(CUCsas)的基礎(chǔ)上,通過基于規(guī)則的方法對微博句內(nèi)評價對象與評價詞距離進(jìn)行了相關(guān)實(shí)驗(yàn)。驗(yàn)證發(fā)現(xiàn),雖然目前基于規(guī)則的方法在學(xué)術(shù)界并不是普遍流行的用法,但我們堅(jiān)信基于規(guī)則的方法對語言的深度研究是十分必要的。
本文只是從5000條微博中抽取500條作為樣例進(jìn)行研究,由于能力與精力所限,研究的語料規(guī)模不夠大,語料分析的程度不夠細(xì)致,所得結(jié)論也存在很多偏差,沒能完全做到科學(xué)準(zhǔn)確,仍需進(jìn)一步探索與研究。對微博文本進(jìn)行傾向性分析有非常重要的研究價值和應(yīng)用價值,相關(guān)問題有待進(jìn)一步探討。
參考文獻(xiàn):
[1]侯敏,滕永林,李雪燕等.話題型微博語言特點(diǎn)及其情感分析策
略[J].語言文字應(yīng)用,2013,(2):135?143.
[2]劉鴻宇,趙妍妍,秦兵等.評價對象抽取及其傾向性分析[J].
中文信息學(xué)學(xué)報,2010,(1):84?88
[3]周紅照,侯明午,顏彭莉等.語義特征在評價對象抽取與極性
判定中的作用[J].北京大學(xué)學(xué)報(自然科學(xué)版),2014,(1):93-99.
(牟彥霏 北京 中國傳媒大學(xué)文法學(xué)部文學(xué)院 100024)