• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于詞典和弱標(biāo)注信息的電影評(píng)論情感分析

    2018-12-14 05:30:56張振豪韓美琪
    計(jì)算機(jī)應(yīng)用 2018年11期
    關(guān)鍵詞:詞典副詞分類

    樊 振,過(guò) 弋,2,張振豪,韓美琪

    (1.華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海 200237; 2.石河子大學(xué) 信息科學(xué)與技術(shù)學(xué)院,新疆 石河子 832003)(*通信作者電子郵箱guoyi@ecust.edu.cn)

    0 引言

    近年來(lái),隨著我國(guó)經(jīng)濟(jì)快速發(fā)展以及國(guó)家對(duì)文化產(chǎn)業(yè)的大力支持,我國(guó)電影市場(chǎng)環(huán)境日益改善。2017年上半年,中國(guó)內(nèi)地票房規(guī)模為271.2億元,相比2016年上半年總票房規(guī)模248.1億元,增長(zhǎng)9.3%;同時(shí)第二季度,用戶在線購(gòu)買電影票占比達(dá)78.2%,較上一季度有小幅上升,在線電影購(gòu)票市場(chǎng)滲透率趨于穩(wěn)定[1]。大量用戶通過(guò)電影平臺(tái)表達(dá)自己對(duì)電影的觀點(diǎn)和看法,這些評(píng)論中包含著大量用戶對(duì)電影及其相關(guān)內(nèi)容的評(píng)價(jià),包括演員、劇情、演技、特效等。合理地利用這些用戶評(píng)論可以為用戶消費(fèi)決策、商家營(yíng)銷規(guī)劃、電影制作方內(nèi)容優(yōu)化等提供幫助, 因此挖掘用戶評(píng)論文本中的情感信息有著重要的價(jià)值。

    Hu等[2]認(rèn)為評(píng)論的情感極性主要通過(guò)評(píng)論中的形容詞來(lái)判定,提出根據(jù)形容詞建立情感詞典,再根據(jù)一定的規(guī)則來(lái)計(jì)算評(píng)論的情感極性;但是該方法太依賴于情感詞典和規(guī)則的質(zhì)量,需要一定的經(jīng)驗(yàn)知識(shí),推廣能力差。Pang等[3]首次提出利用機(jī)器學(xué)習(xí)的方法來(lái)進(jìn)行情感分類,將文本表示成不同的特征組合,并在不同的分類算法下進(jìn)行對(duì)比實(shí)驗(yàn);但是利用機(jī)器學(xué)習(xí)的方法需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,這會(huì)耗費(fèi)大量的人力資源和時(shí)間。近年來(lái),研究者開(kāi)始從用戶產(chǎn)生的信息中訓(xùn)練數(shù)據(jù),如用戶評(píng)分。Qu等[4]使用用戶評(píng)分信息作為標(biāo)注數(shù)據(jù)訓(xùn)練模型來(lái)解決文本情感分類問(wèn)題,但是這部分標(biāo)注數(shù)據(jù)具有隨意性,容易產(chǎn)生數(shù)據(jù)噪聲(如低評(píng)分的正面評(píng)論)。

    針對(duì)上述問(wèn)題,本文提出了基于詞典和弱標(biāo)注信息的電影評(píng)論情感分析方法,利用評(píng)論的評(píng)分?jǐn)?shù)據(jù)和基于情感詞典的情感傾向來(lái)標(biāo)注數(shù)據(jù)。本文的工作主要有:

    1)對(duì)知網(wǎng)的中文情感詞典(HowNet)和臺(tái)灣大學(xué)的簡(jiǎn)體中文極性情感詞典(National Taiwan University Simplified Dictionary, NTUSD)整合,并構(gòu)建符合現(xiàn)有數(shù)據(jù)的情感詞典。

    2)設(shè)計(jì)基于情感詞典的評(píng)論情感計(jì)算規(guī)則,并對(duì)數(shù)據(jù)自動(dòng)標(biāo)注。

    3)利用支持向量機(jī)(Support Vector Machine, SVM)算法對(duì)數(shù)據(jù)進(jìn)行情感分類。

    1 相關(guān)工作

    目前情感分析研究技術(shù)主要分為基于情感詞典的方法和基于機(jī)器學(xué)習(xí)的方法[5]。

    基于情感詞典的研究方法主要是根據(jù)情感詞庫(kù)來(lái)匹配計(jì)算評(píng)論的情感傾向。Liu等[6]在文獻(xiàn)[2]的基礎(chǔ)上考慮了主題詞與情感詞之間的距離對(duì)評(píng)論情感傾向的影響,距離越遠(yuǎn)影響越弱?;谠~典的方法沒(méi)有辦法識(shí)別文本中隱含的觀點(diǎn),Zhang等[7]認(rèn)為基于詞典的方法只能通過(guò)顯式的情感詞提取觀點(diǎn)。此外,本文還常常出現(xiàn)上下半句情感傾向出現(xiàn)轉(zhuǎn)折、同一情感詞在不同環(huán)境下極性不一樣的情況。

    基于機(jī)器學(xué)習(xí)的研究方法主要是將評(píng)論情感分析轉(zhuǎn)化為一個(gè)分類問(wèn)題。目前主流方向是二分類問(wèn)題,即將評(píng)論分成正面情感和負(fù)面情感。通過(guò)人工設(shè)計(jì)代表評(píng)論文本的特征,然后抽取評(píng)論特征并表示成文本向量,即可對(duì)文本進(jìn)行分類。Pang等[3]首先提出使用機(jī)器學(xué)習(xí)的方法來(lái)解決情感分類問(wèn)題,該工作選取了Unigrams、bigrams、POS(Part of Speech)等特征進(jìn)行不同組合并在分類算法樸素貝葉斯(Naive Bayes, NB)、支持向量機(jī)(SVM)和最大熵模型下進(jìn)行實(shí)驗(yàn)。在使用Unigrams特征的情況下,SVM的效果最好。李婷婷等[8]在前人工作基礎(chǔ)上提出使用詞性、情感詞、否定詞、程度副詞來(lái)構(gòu)建特征,并選用不同的特征組合進(jìn)行多組實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示選用詞性、否定詞和情感詞組合時(shí),SVM效果最好;而使用情感詞、程度副詞、否定詞和特殊符號(hào)組合時(shí),條件隨機(jī)場(chǎng)(Conditional Random Field, CRF)模型效果最好。

    基于機(jī)器學(xué)習(xí)的方法需要人工去標(biāo)注數(shù)據(jù)集,花費(fèi)大量人力資源:Qu等[4]曾嘗試使用包含用戶評(píng)分信息的評(píng)論數(shù)據(jù)作為弱標(biāo)注信息對(duì)模型進(jìn)行訓(xùn)練,最終對(duì)評(píng)論進(jìn)行情感分析;Tang等[9]使用評(píng)論中的表情符號(hào)作為標(biāo)簽值來(lái)訓(xùn)練模型,從而對(duì)文本進(jìn)行情感分類。但是這類方法的標(biāo)注具有較大隨意性,容易對(duì)數(shù)據(jù)產(chǎn)生噪聲。

    2 詞典構(gòu)建

    2.1 預(yù)處理

    從豆瓣電影采集的評(píng)論數(shù)據(jù)包含兩部分內(nèi)容,用戶評(píng)論和用戶評(píng)分。在對(duì)數(shù)據(jù)整理后發(fā)現(xiàn),部分?jǐn)?shù)據(jù)中用戶評(píng)分缺失,所以先要將這部分?jǐn)?shù)據(jù)過(guò)濾。在對(duì)數(shù)據(jù)進(jìn)行情感分析之前,先要對(duì)評(píng)論數(shù)據(jù)分詞和詞性標(biāo)注,本文選取結(jié)巴分詞作為自然語(yǔ)言處理工具完成數(shù)據(jù)預(yù)處理工作。

    2.2 領(lǐng)域情感詞典構(gòu)建

    目前,中文領(lǐng)域使用較多的情感詞典包括知網(wǎng)提供的HowNet和臺(tái)灣大學(xué)的NTUSD。HowNet包含情感詞語(yǔ)和評(píng)價(jià)詞語(yǔ)兩個(gè)部分,其中情感詞語(yǔ)中含有836個(gè)中文正面情感詞和1 254個(gè)中文負(fù)面情感詞語(yǔ),評(píng)價(jià)詞語(yǔ)中含有3 730個(gè)中文正面評(píng)價(jià)詞語(yǔ)和3 116個(gè)中文負(fù)面評(píng)價(jià)詞語(yǔ)。NTUSD包含2 810 個(gè)正面情感詞語(yǔ)和8 276個(gè)負(fù)面情感詞語(yǔ)。將這三部分詞典去重后得到新的情感詞典構(gòu)成基礎(chǔ)詞典,正向情感詞極性為1,負(fù)向情感詞極性為-1。

    但是在文本評(píng)論中,存在基礎(chǔ)詞典未包括的情感詞也有情感傾向。比如“這電影好搞笑啊”,搞笑就是積極情緒的詞,因此,只靠基礎(chǔ)詞典來(lái)識(shí)別電影評(píng)論的情感詞是不夠的,特定的領(lǐng)域還需要領(lǐng)域詞典,本文通過(guò)互信息(Point-wise Mutual Information, PMI)來(lái)構(gòu)建領(lǐng)域情感詞典[10],PMI可以計(jì)算詞語(yǔ)之間的相似度。計(jì)算兩個(gè)詞w1和w2的PMI公式:

    (1)

    其中:p(w1,w2)表示詞w1和詞w2一起出現(xiàn)的概率,p(w1)表示詞w1出現(xiàn)的概率,p(w2)表示詞w2出現(xiàn)的概率。在使用過(guò)程中,w1是語(yǔ)料中切分出來(lái)的情感詞,w2是核心情感詞,通過(guò)PMI來(lái)計(jì)算兩個(gè)詞相似度:如果相似度高則認(rèn)為兩個(gè)詞情感極性相同; 反之亦然。

    核心情感詞的詞性必須非常明確,比如積極詞有“好”,消極詞有“爛”,但是單個(gè)核心情感詞在PMI計(jì)算時(shí)容易造成較大的誤差,因此本文進(jìn)行多詞考察。本文通過(guò)統(tǒng)計(jì)基礎(chǔ)情感詞在評(píng)論文本里的詞頻,挑選出最高的正、負(fù)核心情感詞各30個(gè)。

    在計(jì)算了新詞和正負(fù)核心情感詞之間PMI之后,就可以得到新詞的情感傾向,其計(jì)算公式[11]為:

    (2)

    2.3 否定詞構(gòu)建

    一條評(píng)論中的否定詞往往會(huì)改變?cè)u(píng)論的情感極性,因此本文整理了一些常用的否定詞用來(lái)判定評(píng)論情感極性。常用否定詞包括:不、沒(méi)、無(wú)、非、未、否、勿、不是、并非、沒(méi)有、絕不。

    2.4 程度副詞構(gòu)建

    程度副詞可以改變情感詞的情感強(qiáng)度,如“我非常喜歡”,非常就是程度副詞,增加了喜歡的強(qiáng)度。本文使用的是HowNet里的程度副詞表,該表包含219個(gè)程度級(jí)別詞語(yǔ)。按照級(jí)別不同,分為6個(gè)類別,分別是“極其/最” “很” “較” “稍” “欠” “超”。本文按照其語(yǔ)氣強(qiáng)度不同分別賦予不同權(quán)值,如表1。

    表1 程度副詞及其權(quán)值

    3 情感分析與計(jì)算

    本文提出基于詞典和弱標(biāo)注信息相結(jié)合的機(jī)器學(xué)習(xí)方法來(lái)對(duì)電影評(píng)論進(jìn)行情感分析,在用戶評(píng)分的基礎(chǔ)上,通過(guò)領(lǐng)域詞典對(duì)評(píng)論進(jìn)行情感傾向分類,挑選出評(píng)分和分類結(jié)果情感一致的訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練。圖1顯示了本文方法的整體流程。

    在數(shù)據(jù)標(biāo)注部分,本文首先對(duì)采集數(shù)據(jù)進(jìn)行過(guò)濾、分詞及詞性標(biāo)注等預(yù)處理;然后利用基礎(chǔ)詞典在語(yǔ)料中提取出核心情感詞,進(jìn)而構(gòu)建領(lǐng)域情感詞典;接著利用基于詞典的情感分類和用戶評(píng)分相結(jié)合的方式對(duì)數(shù)據(jù)進(jìn)行標(biāo)注。在SVM模型訓(xùn)練部分,先對(duì)評(píng)論數(shù)據(jù)提取特征,然后對(duì)訓(xùn)練數(shù)據(jù)訓(xùn)練模型,最后利用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行情感分類。

    圖1 系統(tǒng)整體流程

    3.1 基于詞典和弱標(biāo)注信息的數(shù)據(jù)標(biāo)注

    目前,基于機(jī)器學(xué)習(xí)的文本情感分類問(wèn)題主要是有監(jiān)督的分類問(wèn)題,需要人工去標(biāo)注數(shù)據(jù),但是標(biāo)注數(shù)據(jù)會(huì)花費(fèi)大量人力資源。本文采集的數(shù)據(jù)中包含著用戶評(píng)分,可以根據(jù)用戶評(píng)分簡(jiǎn)單來(lái)標(biāo)注數(shù)據(jù),但是用戶打分具有隨意性,容易對(duì)數(shù)據(jù)產(chǎn)生噪聲(用戶評(píng)分與評(píng)論情感不一致),這種標(biāo)注稱為弱標(biāo)注信息[12],因此本文采用詞典和弱標(biāo)注信息相結(jié)合的方法對(duì)電影評(píng)論數(shù)據(jù)進(jìn)行情感分析。

    對(duì)于單條評(píng)論,本文先對(duì)它進(jìn)行分詞和詞性標(biāo)注處理,然后根據(jù)前文構(gòu)建的領(lǐng)域情感詞典查找評(píng)論中的情感詞。若找到情感詞,標(biāo)記該情感詞位置,然后向前查找修飾該情感詞的否定詞和程度副詞,這樣,每個(gè)情感詞及其相關(guān)的否定詞和程度副詞稱之為情感詞類。其情感分析算法描述如下:

    機(jī)房當(dāng)中的監(jiān)控設(shè)備能夠在一定程度上防止其事故的發(fā)生,還能夠在某種層面上讓電網(wǎng)自動(dòng)化技術(shù)得到充分的運(yùn)用。因此,為了能夠讓供電企業(yè)更好地安全運(yùn)行,就必須要增加監(jiān)控設(shè)備技術(shù)的使用,要將那些技術(shù)落后的,設(shè)備性能較差的全部淘汰掉,要將先進(jìn)設(shè)備技術(shù)進(jìn)行完善、安裝。對(duì)不同的監(jiān)控設(shè)備進(jìn)行不同的安裝方式,要在后期對(duì)其進(jìn)行定期或者不定期的日常維護(hù),與此同時(shí),還需要將那些出現(xiàn)故障的設(shè)備,進(jìn)行問(wèn)題的分析,要找到出現(xiàn)問(wèn)題的原因,如果是人工導(dǎo)致的,那么就會(huì)追究其責(zé)任,對(duì)工作人員進(jìn)行處罰,讓其能夠更深地認(rèn)識(shí)到供電設(shè)備維護(hù)的重要性,從而去實(shí)現(xiàn)供電的安全穩(wěn)定性的提升,促進(jìn)經(jīng)濟(jì)可持續(xù)發(fā)展[3]。

    1)評(píng)論預(yù)處理,包括分詞和詞性標(biāo)注

    2)While 情感詞 do

    尋找修飾情感詞的否定詞、程度副詞,計(jì)算情感詞類情感值

    3)計(jì)算評(píng)論情感值,情感值大于等于0,評(píng)論情感傾向標(biāo)記為1,否則標(biāo)記為-1

    每個(gè)情感詞類的情感值計(jì)算公式為:

    s(w)=n(w)×d(w)×p(w)×l(w)

    (3)

    其中:s(w)表示情感詞類w的情感極性;n(w)表示否定詞的情感權(quán)重。一個(gè)否定詞表示情感反轉(zhuǎn),但是雙重否定情感就沒(méi)變化,當(dāng)否定詞個(gè)數(shù)為奇數(shù)時(shí),n(w)為-1,為偶數(shù)時(shí),n(w)為1,其計(jì)算如式(4):

    (4)

    其中count(neg)表示否定詞個(gè)數(shù)。d(w)表示修飾情感詞的多個(gè)程度副詞權(quán)值累加和,其計(jì)算如式(5):

    (5)

    p(w)表示情感詞的極性,正面情感詞為1,負(fù)面情感詞為-1;l(w)表示否定詞和程度副詞的相對(duì)位置,它們之間位置不同,情感也不一樣,比如評(píng)論“這部電影很不好看”和“這部電影不很好看”,表達(dá)情感完全不同;當(dāng)否定詞在程度副詞前面時(shí),l(w)設(shè)置為0.5,反之l(w)設(shè)置為-1,其計(jì)算如式(6):

    (6)

    其中:loc(neg)表示情感詞類中否定詞的位置,loc(dg)表示情感詞類中程度副詞的位置,“<”表示相對(duì)位置在前,“>”表示相對(duì)位置在后。

    單條評(píng)論由多個(gè)情感詞類組成,因此單條評(píng)論的情感極性計(jì)算如式(7):

    (7)

    其中:r表示單條評(píng)論中所有的情感詞類,sen(r)表示單條評(píng)論的情感極性。利用式(7),本文可以計(jì)算得到每條評(píng)論基于詞典的情感值,sen(r)≥0表示評(píng)論正面情感,反之為負(fù)面情感。

    用戶評(píng)分中,評(píng)論情感值分為1、2、3、4、5一共5個(gè)等級(jí),本文設(shè)定用戶評(píng)分大于等于3為正面情感,小于3為負(fù)面情感。最后,本文挑選出二者情感傾向一致的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。

    3.2 特征選擇

    基于機(jī)器學(xué)習(xí)的情感分析的核心就是特征選擇,它關(guān)系著情感分類的準(zhǔn)確度。目前常見(jiàn)的特征選擇有:一元詞(unigram)特征、二元詞(bigram)特征、三元詞(trigram)特征、詞頻、詞性、情感詞等[8]。其中一元詞特征、二元詞特征、三元詞特征的特征維度與語(yǔ)料量有關(guān),當(dāng)語(yǔ)料很大時(shí),特征維度會(huì)達(dá)到千維級(jí)別,很難處理;詞頻可以反映一個(gè)詞語(yǔ)的重要性,但是并不是所有的詞都與文本情感相關(guān),引入詞頻會(huì)導(dǎo)致數(shù)據(jù)產(chǎn)生噪聲。本文選擇詞性、程度副詞、否定詞、正面情感詞以及負(fù)面情感詞這五個(gè)特征維度,其中一個(gè)文本是由多個(gè)詞及其詞性構(gòu)成的,詞性在其中起很大作用;情感詞是一個(gè)文本情感分類的關(guān)鍵核心,而否定詞通常會(huì)使一個(gè)文本的情感極性發(fā)生反轉(zhuǎn);與此同時(shí),程度副詞能改變情感詞的強(qiáng)度,當(dāng)一個(gè)文本中既出現(xiàn)正面情感詞又出現(xiàn)負(fù)面情感詞時(shí),如果只依靠情感詞的極性,是很難判斷文本的情感傾向的,而程度副詞可以幫助抉擇。比如說(shuō)評(píng)論“電影很不錯(cuò),就是情節(jié)有點(diǎn)拖。”中,“很”比“有點(diǎn)”程度強(qiáng),可以判斷評(píng)論情感傾向?yàn)檎妗?/p>

    在選擇文本特征時(shí),對(duì)于每個(gè)維度具體含義如表2。

    表2 特征維度含義

    以評(píng)論“電影非常好,但不喜歡女主角”為例提取特征,首先采用結(jié)巴分詞進(jìn)行分詞和詞性標(biāo)注,得到結(jié)果如下:

    電影/n 非常/d 好/a ,/x 但/c 不/d 喜歡/v 女主角/n

    其中:n表示名詞,d表示副詞,c表示連詞,a表示形容詞,v表示動(dòng)詞。從上可知,詞性個(gè)數(shù)為5,正面情感詞個(gè)數(shù)為1,負(fù)面情感詞個(gè)數(shù)為0,否定詞個(gè)數(shù)為1,程度副詞權(quán)值為2。

    3.3 SVM模型

    SVM是近幾年發(fā)展起來(lái)的新型分類方法,主要解決文本分類問(wèn)題[11]。SVM的原理是通過(guò)將一個(gè)樣本通過(guò)某種映射關(guān)系映射到高維空間或者是無(wú)窮維特征空間,使原來(lái)在樣本空間中非線性化可分的問(wèn)題轉(zhuǎn)化為在特征空間中線性可分的問(wèn)題[14]。目前應(yīng)用最為廣泛的SVM分類器主要有LibSVM和SVMLight兩種[15],本文采用臺(tái)灣大學(xué)林智仁教授開(kāi)發(fā)的LibSVM進(jìn)行分類測(cè)試。

    4 實(shí)驗(yàn)結(jié)果及分析

    4.1 實(shí)驗(yàn)準(zhǔn)備

    本文利用爬蟲(chóng)工具Pyspider在豆瓣電影平臺(tái)上抓取了關(guān)于電影《捉妖記》《戰(zhàn)狼2》的用戶評(píng)論及評(píng)分,在經(jīng)過(guò)去重、過(guò)濾后,分別剩下23 605,23 415條數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。由于本文使用的是基于情感詞典的方法和用戶評(píng)分情感傾向相結(jié)合來(lái)標(biāo)注數(shù)據(jù),因此不需要人工標(biāo)注數(shù)據(jù)。

    將數(shù)據(jù)隨機(jī)分成5組,然后每次取4組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩下1組數(shù)據(jù)作為測(cè)試數(shù)據(jù)進(jìn)行交叉實(shí)驗(yàn),最后將每次測(cè)試結(jié)果累加在一起作為最終測(cè)試結(jié)果。每組數(shù)據(jù)基于詞典和用戶評(píng)分相結(jié)合標(biāo)注的情況如表3所示(表中第一個(gè)字母P表示基于詞典的計(jì)算結(jié)果為正面情感,N表示為負(fù)面情感;第二個(gè)字母P表示用戶評(píng)分情感傾向?yàn)檎媲楦校琋表示負(fù)面情感)。

    表3 數(shù)據(jù)分組以及標(biāo)注結(jié)果

    在每次交叉實(shí)驗(yàn)中,取4組數(shù)據(jù)為訓(xùn)練數(shù)據(jù),其中每組數(shù)據(jù)只取標(biāo)記為P_P和N_N的數(shù)據(jù);取1組數(shù)據(jù)為測(cè)試組數(shù),包含該組所有數(shù)據(jù)。

    4.2 實(shí)驗(yàn)結(jié)果與分析

    本文使用的分類器是LibSVM,為了避免不同的參數(shù)對(duì)分類效果產(chǎn)生影響,本文利用LibSVM的工具包grid.py通過(guò)交叉驗(yàn)證的方法求最優(yōu)核函數(shù)的參數(shù)c和gamma。表4列出了不同數(shù)據(jù)集的最優(yōu)參數(shù)c和gamma以及交叉驗(yàn)證的準(zhǔn)確率rate,rate最大值對(duì)應(yīng)的c和gamma即是最優(yōu)參數(shù)。

    表4 LiSVM最優(yōu)參數(shù)

    為了評(píng)價(jià)最終的分類效果,本文采用分類準(zhǔn)確率(Accuracy),即文本分類正確數(shù)占文本總數(shù)的比例,作為評(píng)價(jià)指標(biāo),其公式為:

    (8)

    其中:ncorrect表示文本分類正確數(shù),nall表示本文總數(shù)。

    本文在兩種不同類型電影數(shù)據(jù)集上分別進(jìn)行了三組對(duì)比實(shí)驗(yàn),分別為:

    1)Lexicon。 基于詞典的方法。

    2)WT。 使用弱標(biāo)注信息作為數(shù)據(jù)的標(biāo)注,并在SVM分類器上進(jìn)行情感分類。

    3)WT+Lexicon。 使用基于詞典的方法和弱標(biāo)注信息標(biāo)注數(shù)據(jù),并在SVM分類器上進(jìn)行情感分類。

    最終實(shí)驗(yàn)結(jié)果如表5所示。

    表5 3種方法分類準(zhǔn)確率對(duì)比

    從表5可以看出,基于機(jī)器學(xué)習(xí)的方法在準(zhǔn)確率上比基于詞典的方法高,準(zhǔn)確率分別達(dá)到了75.5%和75.7%,而本文方法在準(zhǔn)確率上分別達(dá)到了77.2%和77.8%,相比單一基于弱標(biāo)注信息的機(jī)器學(xué)習(xí)方法,分別提高了1.7個(gè)百分點(diǎn)和2.1個(gè)百分點(diǎn),證明了本文算法的有效性,本文方法也更加適合于評(píng)論文本的情感分析。本文方法與基于機(jī)器學(xué)習(xí)的方法相比,在數(shù)據(jù)訓(xùn)練部分,利用基于情感詞典的分類方法和用戶評(píng)分相結(jié)合的方式去除了部分?jǐn)?shù)據(jù)噪聲,使得模型訓(xùn)練更加準(zhǔn)確,因此本文方法在準(zhǔn)確率上才會(huì)提高。

    同時(shí),從三類實(shí)驗(yàn)的結(jié)果看,三種方法的準(zhǔn)確率都有待提高??紤]到基于詞典的方法是基于詞典和規(guī)則的算法,同時(shí)也對(duì)分詞工具有一定的要求,因此要提高基于詞典的方法的準(zhǔn)確率就需要分詞工具能準(zhǔn)確分出評(píng)論的詞語(yǔ)和詞性,其次要擴(kuò)充現(xiàn)有的詞典以滿足現(xiàn)在的互聯(lián)網(wǎng)評(píng)論語(yǔ)句,最后應(yīng)設(shè)定更加合理的情感匹配規(guī)則。而本文方法與特征選擇和標(biāo)注信息相關(guān),要提高準(zhǔn)確率就需要在特征選取方面加以改進(jìn);在不考慮人工標(biāo)注的情況下,本文方法是有一定的適用性的。

    5 結(jié)語(yǔ)

    本文提出了一種基于詞典和弱標(biāo)注信息相結(jié)合的文本情感分析方法,實(shí)驗(yàn)準(zhǔn)確率相比傳統(tǒng)的基于詞典的方法和基于弱標(biāo)注信息的機(jī)器學(xué)習(xí)方法有了一定的提升,在不同類型的電影數(shù)據(jù)集上準(zhǔn)確率分別達(dá)到了77.2%和77.8%,分別提升了1.7個(gè)百分點(diǎn)和2.1個(gè)百分點(diǎn),驗(yàn)證了本文方法的有效性。評(píng)論語(yǔ)料的初始預(yù)處理到進(jìn)一步的特征選擇都會(huì)影響最終的分類結(jié)果,因此本文方法在分詞工具選擇和特征選擇方面可以進(jìn)一步對(duì)比和優(yōu)化,選擇最適合本領(lǐng)域的分詞工具和特征組合。

    猜你喜歡
    詞典副詞分類
    The Wheels on the Bus
    分類算一算
    副詞“好容易”及其詞匯化成因
    米沃什詞典
    文苑(2019年24期)2020-01-06 12:06:50
    分類討論求坐標(biāo)
    數(shù)據(jù)分析中的分類討論
    評(píng)《現(xiàn)代漢語(yǔ)詞典》(第6版)
    教你一招:數(shù)的分類
    詞典例證翻譯標(biāo)準(zhǔn)探索
    副詞和副詞詞組
    久久香蕉激情| 久久ye,这里只有精品| 久久久久视频综合| 老鸭窝网址在线观看| 狠狠婷婷综合久久久久久88av| а√天堂www在线а√下载 | 亚洲在线自拍视频| 丝袜美足系列| 久久久久久人人人人人| 午夜免费成人在线视频| 怎么达到女性高潮| 欧美日韩视频精品一区| 18禁黄网站禁片午夜丰满| 少妇的丰满在线观看| 别揉我奶头~嗯~啊~动态视频| 国产97色在线日韩免费| 99久久精品国产亚洲精品| 日韩有码中文字幕| 男人操女人黄网站| 1024视频免费在线观看| 99国产综合亚洲精品| 亚洲性夜色夜夜综合| 免费在线观看完整版高清| 一本一本久久a久久精品综合妖精| 深夜精品福利| 久久久久精品人妻al黑| 久久精品国产亚洲av香蕉五月 | 成人黄色视频免费在线看| 久久九九热精品免费| 国产成人影院久久av| av超薄肉色丝袜交足视频| 91国产中文字幕| 精品无人区乱码1区二区| 免费一级毛片在线播放高清视频 | 亚洲精品一卡2卡三卡4卡5卡| 午夜福利欧美成人| 在线观看午夜福利视频| 91老司机精品| 亚洲精品国产区一区二| 日韩熟女老妇一区二区性免费视频| 亚洲色图 男人天堂 中文字幕| 91大片在线观看| 精品少妇一区二区三区视频日本电影| 波多野结衣av一区二区av| 宅男免费午夜| 高清毛片免费观看视频网站 | 国产成人免费无遮挡视频| 老司机靠b影院| www.999成人在线观看| 男人的好看免费观看在线视频 | 国内毛片毛片毛片毛片毛片| 夜夜夜夜夜久久久久| 精品国产国语对白av| 国产精品影院久久| 大陆偷拍与自拍| 久久久精品国产亚洲av高清涩受| 搡老熟女国产l中国老女人| 精品人妻1区二区| 亚洲人成77777在线视频| 热99re8久久精品国产| 一级毛片高清免费大全| 精品久久久久久,| 久久中文字幕一级| 欧美一级毛片孕妇| 国产精品98久久久久久宅男小说| 亚洲av美国av| 黄色片一级片一级黄色片| 91精品国产国语对白视频| 国产欧美日韩一区二区三区在线| 极品教师在线免费播放| www.精华液| 亚洲精品一卡2卡三卡4卡5卡| 国产av一区二区精品久久| 一级片免费观看大全| 国产精品欧美亚洲77777| 精品福利观看| 80岁老熟妇乱子伦牲交| 后天国语完整版免费观看| 人人妻人人添人人爽欧美一区卜| 久久久久久久国产电影| 国产一区二区三区在线臀色熟女 | 中文字幕精品免费在线观看视频| 国产精品香港三级国产av潘金莲| 日韩人妻精品一区2区三区| 久久久久精品国产欧美久久久| 黑人巨大精品欧美一区二区mp4| 欧美老熟妇乱子伦牲交| 99久久国产精品久久久| 9191精品国产免费久久| avwww免费| 久久久久久久久久久久大奶| 亚洲欧洲精品一区二区精品久久久| 久久香蕉精品热| 99热只有精品国产| 午夜老司机福利片| 下体分泌物呈黄色| 少妇被粗大的猛进出69影院| 亚洲色图 男人天堂 中文字幕| 亚洲精品av麻豆狂野| 伊人久久大香线蕉亚洲五| 免费高清在线观看日韩| 国产精品欧美亚洲77777| 亚洲熟女毛片儿| 精品人妻熟女毛片av久久网站| 在线观看日韩欧美| 国产成+人综合+亚洲专区| 搡老岳熟女国产| 交换朋友夫妻互换小说| 在线播放国产精品三级| 老汉色∧v一级毛片| 女人久久www免费人成看片| 日本wwww免费看| 搡老熟女国产l中国老女人| 啦啦啦免费观看视频1| 夜夜爽天天搞| 9色porny在线观看| 乱人伦中国视频| 欧美激情高清一区二区三区| 欧美精品av麻豆av| 嫩草影视91久久| 少妇裸体淫交视频免费看高清 | 窝窝影院91人妻| 老熟女久久久| 一级,二级,三级黄色视频| 欧美久久黑人一区二区| 人人妻,人人澡人人爽秒播| 免费女性裸体啪啪无遮挡网站| 熟女少妇亚洲综合色aaa.| 免费一级毛片在线播放高清视频 | 脱女人内裤的视频| 好男人电影高清在线观看| 久久人妻福利社区极品人妻图片| 法律面前人人平等表现在哪些方面| 欧美不卡视频在线免费观看 | 一边摸一边抽搐一进一小说 | 久久久精品区二区三区| 他把我摸到了高潮在线观看| 国产一区二区三区综合在线观看| 少妇裸体淫交视频免费看高清 | 久久精品国产a三级三级三级| 美女午夜性视频免费| 久久中文看片网| 啦啦啦 在线观看视频| 欧美激情极品国产一区二区三区| 满18在线观看网站| 一区二区三区精品91| bbb黄色大片| 成熟少妇高潮喷水视频| 久久人人爽av亚洲精品天堂| 久久精品亚洲熟妇少妇任你| 色老头精品视频在线观看| 一进一出抽搐gif免费好疼 | av中文乱码字幕在线| 欧美黑人精品巨大| 精品免费久久久久久久清纯 | 身体一侧抽搐| 久久午夜综合久久蜜桃| 99久久精品国产亚洲精品| 亚洲色图av天堂| 好看av亚洲va欧美ⅴa在| 村上凉子中文字幕在线| 欧美午夜高清在线| 国产精品自产拍在线观看55亚洲 | 在线观看66精品国产| 精品国产一区二区三区四区第35| 午夜福利,免费看| 69av精品久久久久久| 久久国产精品人妻蜜桃| 久久久国产欧美日韩av| 免费女性裸体啪啪无遮挡网站| 视频在线观看一区二区三区| 亚洲欧美激情综合另类| 国产精品欧美亚洲77777| 日日摸夜夜添夜夜添小说| 色婷婷久久久亚洲欧美| 麻豆成人av在线观看| 精品电影一区二区在线| 黑人巨大精品欧美一区二区蜜桃| 99热只有精品国产| 女性生殖器流出的白浆| 久久精品国产亚洲av高清一级| 18禁黄网站禁片午夜丰满| 久久影院123| 欧美日韩av久久| 亚洲全国av大片| 久久精品国产清高在天天线| 国产有黄有色有爽视频| 午夜老司机福利片| 色婷婷久久久亚洲欧美| 日韩熟女老妇一区二区性免费视频| 亚洲综合色网址| 热re99久久精品国产66热6| 黑丝袜美女国产一区| 国产片内射在线| 日韩制服丝袜自拍偷拍| 91国产中文字幕| 咕卡用的链子| 亚洲熟妇中文字幕五十中出 | 中文字幕精品免费在线观看视频| 在线天堂中文资源库| 99久久综合精品五月天人人| 国产无遮挡羞羞视频在线观看| 久久人妻福利社区极品人妻图片| 夫妻午夜视频| 又紧又爽又黄一区二区| www.自偷自拍.com| 久热这里只有精品99| 久久中文字幕一级| 99久久国产精品久久久| 在线播放国产精品三级| 曰老女人黄片| 99国产极品粉嫩在线观看| 美女高潮喷水抽搐中文字幕| 老鸭窝网址在线观看| 亚洲成国产人片在线观看| 搡老熟女国产l中国老女人| 成年人午夜在线观看视频| 国产精品香港三级国产av潘金莲| 国内毛片毛片毛片毛片毛片| 久久九九热精品免费| 亚洲avbb在线观看| 真人做人爱边吃奶动态| 亚洲五月色婷婷综合| 久久久久久久午夜电影 | 又黄又爽又免费观看的视频| 成在线人永久免费视频| 精品久久久久久久久久免费视频 | 免费av中文字幕在线| 久久国产亚洲av麻豆专区| 亚洲中文字幕日韩| 91麻豆精品激情在线观看国产 | 中亚洲国语对白在线视频| 国产精品久久电影中文字幕 | 一进一出好大好爽视频| 狠狠狠狠99中文字幕| 欧美在线黄色| videosex国产| 午夜精品久久久久久毛片777| 欧洲精品卡2卡3卡4卡5卡区| 丰满饥渴人妻一区二区三| 成人免费观看视频高清| 色婷婷av一区二区三区视频| 亚洲av片天天在线观看| 欧美 日韩 精品 国产| 亚洲第一av免费看| 男女下面插进去视频免费观看| 精品欧美一区二区三区在线| 亚洲成人手机| 成人特级黄色片久久久久久久| 少妇被粗大的猛进出69影院| 18禁裸乳无遮挡免费网站照片 | 十分钟在线观看高清视频www| 王馨瑶露胸无遮挡在线观看| 纯流量卡能插随身wifi吗| 国产免费现黄频在线看| 操出白浆在线播放| 看黄色毛片网站| 亚洲国产精品sss在线观看 | 亚洲成av片中文字幕在线观看| 欧美日韩一级在线毛片| 午夜福利影视在线免费观看| 天堂√8在线中文| 男女高潮啪啪啪动态图| 不卡av一区二区三区| 一本一本久久a久久精品综合妖精| 久久精品亚洲熟妇少妇任你| 俄罗斯特黄特色一大片| 中国美女看黄片| 亚洲午夜理论影院| 19禁男女啪啪无遮挡网站| 成人18禁在线播放| 国产一区在线观看成人免费| av片东京热男人的天堂| 婷婷成人精品国产| 青草久久国产| 亚洲五月色婷婷综合| 日本a在线网址| 男男h啪啪无遮挡| 人妻一区二区av| 国产男女内射视频| 国产不卡一卡二| 色婷婷av一区二区三区视频| 99国产极品粉嫩在线观看| 国产欧美日韩一区二区精品| 亚洲精品中文字幕在线视频| 国产精品成人在线| 欧美成人午夜精品| 十八禁人妻一区二区| 亚洲午夜精品一区,二区,三区| 国产男女超爽视频在线观看| 99国产精品99久久久久| 捣出白浆h1v1| 久久青草综合色| 午夜福利乱码中文字幕| 18禁裸乳无遮挡免费网站照片 | 久久影院123| 中文字幕av电影在线播放| 两人在一起打扑克的视频| av国产精品久久久久影院| 一边摸一边做爽爽视频免费| 91麻豆精品激情在线观看国产 | 91精品三级在线观看| 久久午夜亚洲精品久久| 精品国产乱子伦一区二区三区| 色老头精品视频在线观看| 国产又爽黄色视频| 久久中文字幕一级| aaaaa片日本免费| 天天躁日日躁夜夜躁夜夜| 亚洲少妇的诱惑av| 国产成人精品久久二区二区91| 搡老乐熟女国产| 老汉色∧v一级毛片| 国产三级黄色录像| 国产区一区二久久| 亚洲精品一卡2卡三卡4卡5卡| 天堂动漫精品| 欧美丝袜亚洲另类 | 国产成人免费观看mmmm| 国产极品粉嫩免费观看在线| 黄色怎么调成土黄色| 黄网站色视频无遮挡免费观看| av在线播放免费不卡| 少妇裸体淫交视频免费看高清 | 精品无人区乱码1区二区| 久久精品91无色码中文字幕| 校园春色视频在线观看| 午夜激情av网站| 亚洲视频免费观看视频| 视频在线观看一区二区三区| 久久 成人 亚洲| 一本大道久久a久久精品| 黄色怎么调成土黄色| 麻豆乱淫一区二区| www.999成人在线观看| 国产色视频综合| 一级毛片女人18水好多| 美女视频免费永久观看网站| 亚洲精品一二三| 久久天躁狠狠躁夜夜2o2o| 国产精品一区二区在线不卡| 国产精品久久久av美女十八| 99久久国产精品久久久| 欧美日韩av久久| 国产一区在线观看成人免费| 久久久久久久精品吃奶| 黑人猛操日本美女一级片| 国产精品98久久久久久宅男小说| 国产精品久久久人人做人人爽| 两性夫妻黄色片| 日日爽夜夜爽网站| 日本五十路高清| 免费人成视频x8x8入口观看| 国产人伦9x9x在线观看| 大型黄色视频在线免费观看| 超色免费av| 黑人巨大精品欧美一区二区mp4| 1024视频免费在线观看| 一级a爱视频在线免费观看| 一级片免费观看大全| 欧美日韩av久久| 欧美精品人与动牲交sv欧美| 下体分泌物呈黄色| 免费看十八禁软件| 日本黄色视频三级网站网址 | 九色亚洲精品在线播放| 久久精品成人免费网站| 久久久精品区二区三区| 69精品国产乱码久久久| 亚洲 国产 在线| 人人妻人人澡人人看| 男人舔女人的私密视频| 日本vs欧美在线观看视频| 99久久人妻综合| 日本撒尿小便嘘嘘汇集6| 国产在线一区二区三区精| 性少妇av在线| 天天影视国产精品| 欧洲精品卡2卡3卡4卡5卡区| 久久精品aⅴ一区二区三区四区| 欧美国产精品一级二级三级| 日韩欧美三级三区| 99精品在免费线老司机午夜| 色94色欧美一区二区| 久久精品国产综合久久久| 极品教师在线免费播放| 欧美日韩瑟瑟在线播放| 亚洲一区二区三区欧美精品| 国产99白浆流出| 亚洲一卡2卡3卡4卡5卡精品中文| 国产视频一区二区在线看| 黄频高清免费视频| 伦理电影免费视频| 少妇粗大呻吟视频| 中亚洲国语对白在线视频| 精品少妇久久久久久888优播| 999久久久国产精品视频| 男女免费视频国产| 成人影院久久| 日韩制服丝袜自拍偷拍| 精品国产一区二区三区久久久樱花| 国产单亲对白刺激| 黄网站色视频无遮挡免费观看| 亚洲av日韩精品久久久久久密| 性少妇av在线| 色老头精品视频在线观看| av福利片在线| 成人永久免费在线观看视频| 精品一品国产午夜福利视频| 欧美成狂野欧美在线观看| 精品久久久精品久久久| 十八禁网站免费在线| 国产激情久久老熟女| 国产不卡一卡二| 国内久久婷婷六月综合欲色啪| 亚洲,欧美精品.| 淫妇啪啪啪对白视频| 岛国毛片在线播放| 欧美乱色亚洲激情| 亚洲五月天丁香| 久久香蕉精品热| 麻豆国产av国片精品| 韩国精品一区二区三区| 91麻豆av在线| 国产91精品成人一区二区三区| 50天的宝宝边吃奶边哭怎么回事| videosex国产| 女性被躁到高潮视频| 最近最新免费中文字幕在线| 美女视频免费永久观看网站| 亚洲成a人片在线一区二区| 国产又爽黄色视频| 久久影院123| 日韩三级视频一区二区三区| 欧美日韩国产mv在线观看视频| 久久精品国产亚洲av高清一级| 一级a爱视频在线免费观看| 国产精品成人在线| 亚洲 国产 在线| 少妇的丰满在线观看| 久久久精品免费免费高清| 国产精品免费大片| 亚洲熟妇中文字幕五十中出 | 欧美+亚洲+日韩+国产| 夜夜夜夜夜久久久久| 精品一品国产午夜福利视频| 精品久久久久久久久久免费视频 | 欧美精品人与动牲交sv欧美| 欧美日韩黄片免| 热99re8久久精品国产| 色精品久久人妻99蜜桃| 美女 人体艺术 gogo| 女人被躁到高潮嗷嗷叫费观| 亚洲av欧美aⅴ国产| 亚洲va日本ⅴa欧美va伊人久久| 亚洲人成77777在线视频| 丁香六月欧美| 99re6热这里在线精品视频| 两个人看的免费小视频| 深夜精品福利| 91大片在线观看| 国产野战对白在线观看| 精品国产一区二区久久| 不卡一级毛片| 桃红色精品国产亚洲av| 麻豆成人av在线观看| 老鸭窝网址在线观看| 激情在线观看视频在线高清 | 中文字幕精品免费在线观看视频| 黑丝袜美女国产一区| 久久精品国产综合久久久| 五月开心婷婷网| 国产激情欧美一区二区| 亚洲视频免费观看视频| 日韩欧美在线二视频 | 久久久国产一区二区| 精品久久久久久,| 亚洲精品乱久久久久久| 亚洲欧美色中文字幕在线| 成人影院久久| 精品久久久久久久毛片微露脸| 美女国产高潮福利片在线看| 一区在线观看完整版| 村上凉子中文字幕在线| 成人影院久久| 国产男女超爽视频在线观看| 国产精品免费视频内射| 久久久国产成人免费| 亚洲美女黄片视频| 高清在线国产一区| 色94色欧美一区二区| 激情在线观看视频在线高清 | 在线视频色国产色| 欧美大码av| 色94色欧美一区二区| 曰老女人黄片| 操出白浆在线播放| 精品视频人人做人人爽| 欧美最黄视频在线播放免费 | 国产色视频综合| 男女午夜视频在线观看| 国产精品永久免费网站| 90打野战视频偷拍视频| av免费在线观看网站| 国产极品粉嫩免费观看在线| 久久精品熟女亚洲av麻豆精品| 亚洲欧美日韩高清在线视频| 51午夜福利影视在线观看| 天堂俺去俺来也www色官网| 日本vs欧美在线观看视频| 国产av一区二区精品久久| 日日摸夜夜添夜夜添小说| 国产成人精品久久二区二区91| 身体一侧抽搐| 自拍欧美九色日韩亚洲蝌蚪91| 中文字幕人妻丝袜一区二区| 又黄又粗又硬又大视频| 成年人黄色毛片网站| 免费黄频网站在线观看国产| 久久人人爽av亚洲精品天堂| 精品国产乱码久久久久久男人| 在线观看免费视频日本深夜| 免费不卡黄色视频| 国产不卡av网站在线观看| 色播在线永久视频| 99riav亚洲国产免费| 日本五十路高清| 国产精品一区二区在线不卡| 精品国产一区二区三区久久久樱花| 黑人巨大精品欧美一区二区mp4| 亚洲人成伊人成综合网2020| 1024香蕉在线观看| 午夜福利影视在线免费观看| 欧美精品一区二区免费开放| 国产男靠女视频免费网站| 91大片在线观看| 久久中文字幕一级| 不卡一级毛片| 国产成人一区二区三区免费视频网站| 极品少妇高潮喷水抽搐| 国产成人欧美在线观看 | 亚洲伊人色综图| 免费在线观看亚洲国产| 激情视频va一区二区三区| 国产欧美日韩一区二区精品| 成人国产一区最新在线观看| 免费不卡黄色视频| 久久精品熟女亚洲av麻豆精品| 国产国语露脸激情在线看| 在线视频色国产色| 91大片在线观看| 午夜福利在线免费观看网站| 又黄又爽又免费观看的视频| 黄片大片在线免费观看| 色婷婷久久久亚洲欧美| 欧美日韩成人在线一区二区| 欧美+亚洲+日韩+国产| 亚洲精品国产一区二区精华液| 深夜精品福利| 午夜免费鲁丝| 亚洲九九香蕉| 一边摸一边做爽爽视频免费| 一级作爱视频免费观看| 美女视频免费永久观看网站| tocl精华| 久久久国产欧美日韩av| 高清在线国产一区| 美女高潮到喷水免费观看| 成人永久免费在线观看视频| av超薄肉色丝袜交足视频| 免费在线观看影片大全网站| 国产精品秋霞免费鲁丝片| 国产高清激情床上av| 国精品久久久久久国模美| 亚洲精品中文字幕一二三四区| 一区二区三区激情视频| 国产成人av教育| 国产在线观看jvid| 久久人人爽av亚洲精品天堂| 精品久久久久久久毛片微露脸| 国产精品久久久久成人av| 欧美日韩成人在线一区二区| 国产深夜福利视频在线观看| 大码成人一级视频| 国产不卡av网站在线观看| 亚洲精品久久午夜乱码| 日韩视频一区二区在线观看| 老熟妇乱子伦视频在线观看| 欧美乱妇无乱码| av天堂在线播放| 免费久久久久久久精品成人欧美视频| 免费在线观看完整版高清| 看黄色毛片网站| av一本久久久久| 亚洲精品一二三| 看片在线看免费视频| 日本a在线网址| 黄网站色视频无遮挡免费观看| 精品久久久久久电影网| 国产又色又爽无遮挡免费看| 免费在线观看日本一区| 亚洲国产精品一区二区三区在线| 999精品在线视频| 两人在一起打扑克的视频| 在线永久观看黄色视频| 国产激情欧美一区二区| 男女之事视频高清在线观看| 欧美人与性动交α欧美软件| 欧美激情高清一区二区三区| 天堂俺去俺来也www色官网| 两人在一起打扑克的视频| 久久精品国产亚洲av香蕉五月 | 女性生殖器流出的白浆| 美女国产高潮福利片在线看| 中文字幕人妻熟女乱码|