• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于詞加權(quán)LDA算法的無監(jiān)督情感分類

    2016-09-27 06:25:26郝潔謝珺蘇婧瓊續(xù)欣瑩韓曉霞
    智能系統(tǒng)學(xué)報(bào) 2016年4期
    關(guān)鍵詞:詞匯分類情感

    郝潔,謝珺,蘇婧瓊,續(xù)欣瑩,韓曉霞

    (太原理工大學(xué) 信息工程學(xué)院,山西 晉中 030600)

    ?

    基于詞加權(quán)LDA算法的無監(jiān)督情感分類

    郝潔,謝珺,蘇婧瓊,續(xù)欣瑩,韓曉霞

    (太原理工大學(xué) 信息工程學(xué)院,山西 晉中 030600)

    主題情感混合模型可以有效地提取語料的主題信息和情感傾向。本文針對(duì)現(xiàn)有主題/情感分析方法主題間區(qū)分度較低的問題提出了一種詞加權(quán)LDA算法(weighted latent dirichlet allocation algorithm,WLDA),該算法可以實(shí)現(xiàn)無監(jiān)督的主題提取和情感分析。通過計(jì)算語料中詞匯與情感種子詞的距離,在吉布斯采樣中對(duì)不同詞匯賦予不同權(quán)重,利用每個(gè)主題下的關(guān)鍵詞判斷主題的情感傾向,進(jìn)而得到每篇文檔的情感分布。這種方法增強(qiáng)了具有情感傾向的詞匯在采樣過程中的影響,從而改善了主題間的區(qū)分性。實(shí)驗(yàn)表明,與JST(Joint Sentiment/Topic model)模型相比,WLDA不僅在采樣中迭代速度快,也能夠更好地實(shí)現(xiàn)主題提取和情感分類。

    情感分類;主題情感混合模型;主題模型;LDA;加權(quán)算法

    中文引用格式:郝潔,謝珺,蘇婧瓊,等. 基于詞加權(quán)LDA算法的無監(jiān)督情感分類[J]. 智能系統(tǒng)學(xué)報(bào), 2016, 11(4): 539-545.

    英文引用格式:HAO Jie, XIE Jun, SU Jingqiong, et al. An unsupervised approach for sentiment classification based on weighted latent dirichlet allocation[J]. CAAI Transactions on Intelligent Systems, 2016, 11(4): 539-545.

    互聯(lián)網(wǎng)不僅是獲取信息的重要途徑,也是廣大網(wǎng)民表達(dá)觀點(diǎn)和看法的平臺(tái)。隨著博客、微博、微信等自媒體的流行,網(wǎng)絡(luò)購物的盛行和網(wǎng)購評(píng)價(jià)體系的不斷完善,對(duì)事件的觀點(diǎn)、對(duì)物品的評(píng)價(jià)等具有情感傾向的文本飛速增長(zhǎng)。這些信息對(duì)于政府部門的輿情監(jiān)控、企業(yè)的經(jīng)營決策和個(gè)人的購買決定都起著至關(guān)重要的作用。然而,這些評(píng)價(jià)信息數(shù)量巨大、變化迅速,僅依賴人工收集整理不僅成本高,也難以滿足時(shí)效性要求。因此文本情感分析受到了學(xué)術(shù)界與工業(yè)界越來越多的關(guān)注[1-2]。

    情感分類是文本情感分析的重要組成部分。它是指根據(jù)文本所表達(dá)的含義和情感信息將文本劃分為褒揚(yáng)或貶義兩種或幾種類型,是對(duì)文本作傾向性、觀點(diǎn)和態(tài)度的劃分。目前,大多數(shù)情感分類方法都是監(jiān)督模型或半監(jiān)督模型,但標(biāo)記好的語料常常難以獲取,給情感分類造成困難?;谥黝}模型的情感分類,不僅具有無監(jiān)督的優(yōu)勢(shì),也具有較強(qiáng)的可移植性[3]。

    Lin 等[4]提出了LSM模型(latent sentiment model),該模型將情感作為主題的特例,認(rèn)為文檔中詞匯的分布與情感有關(guān),從而實(shí)現(xiàn)了文檔的無監(jiān)督情感分類,但無法識(shí)別出更細(xì)粒度的情感信息。Titov等[5]提出的MG-LDA模型(multi-grain model)能夠以較細(xì)的粒度提取主題,該算法是一個(gè)有監(jiān)督學(xué)習(xí)模型,需要對(duì)樣本類別進(jìn)行人工標(biāo)注。TAM(topic-aspect model)[6]和TSM(topic sentiment mixture)[7]能夠無監(jiān)督地抽取文檔的主題和情感信息。但這兩種算法假定主題和情感的分布相互獨(dú)立,忽略了二者的聯(lián)系,也給解釋主題和情感的關(guān)系造成困難。ASUM模型(aspect and sentiment unification model)考慮了主題和情感的相關(guān)性,建立了“句子—主題—詞”的3層模型,有效提取了情感和主題信息,但這種方法將每個(gè)句子視為一個(gè)文檔,丟失了上下文信息[8]。JST模型(joint sentiment/topic model)是一種可以無監(jiān)督地提取文檔主題和情感信息的4層貝葉斯網(wǎng)絡(luò),但該算法的復(fù)雜度較高,結(jié)果不夠穩(wěn)定[3]。歐陽繼紅等在JST模型的基礎(chǔ)上,提出了多粒度的主題情感混合模型MG-R-JST和MG-JST,該方法同時(shí)考慮到文檔和局部?jī)蓚€(gè)粒度的情感主題分布,穩(wěn)定性好,但面臨復(fù)雜度較高的問題[9]。

    本文在LDA模型的基礎(chǔ)上,提出了應(yīng)用于主題/情感分析的詞加權(quán)LDA算法(weighted latent dirichlet allocation,WLDA),通過計(jì)算語料中詞匯與情感種子詞的距離,在吉布斯采樣中對(duì)各詞區(qū)分對(duì)待,利用每個(gè)主題下的關(guān)鍵詞判斷主題的情感傾向,進(jìn)而得到每篇文檔的情感分布。實(shí)驗(yàn)表明,WLDA可提取細(xì)粒度情感,并且具有迭代速度快、分類精度高的優(yōu)點(diǎn)。

    1 LDA模型

    LDA(latent dirichlet allocation)[10]是一種3層貝葉斯模型,它描述了文檔、主題、詞匯間的關(guān)系。LDA模型自2003年提出以來,已經(jīng)有了諸多的改進(jìn)和變形算法,并在文本分類[11]、信息檢索[12]等領(lǐng)域得到了廣泛應(yīng)用。其圖模型見圖1。

    圖1 LDA圖模型[10]Fig.1 Graphical model of LDA[10]

    圖1中,各個(gè)符號(hào)的含義見表1。

    表1 LDA符號(hào)含義對(duì)照表

    根據(jù)LDA模型,文檔的產(chǎn)生過程見算法1。

    算法1[10]LDA文檔產(chǎn)生過程。

    輸入α、β、K;

    輸出文檔。

    對(duì)每個(gè)主題k∈[1,K],采樣詞分布φk~Dir(β)

    對(duì)每篇文檔m∈[1,M]

    采樣一個(gè)主題分布θm~Dir(α)

    對(duì)文檔m中的每個(gè)詞w

    根據(jù)θm采樣一個(gè)主題z~Mult(θm)

    根據(jù)主題z采樣一個(gè)詞w~Mult(φz)其中,隱含變量θ和φ可按式(1)和式(2)估計(jì):

    (1)

    (2)

    2 本文算法

    LDA模型假設(shè)每個(gè)詞都是同等重要的。然而,無論是從信息論或是語言學(xué)來看,該假設(shè)都并不完美。文獻(xiàn)[13]指出高頻停用詞對(duì)LDA模型的主題推理有很大影響。然而,對(duì)于文本情感分類任務(wù),在去除通常的停用詞后,仍有大量與領(lǐng)域相關(guān)但對(duì)情感分類作用較小的詞,具有褒貶傾向的詞匯淹沒其中,而使得LDA模型主題間區(qū)分度較小,分類精度不高。以酒店評(píng)價(jià)語料為例,大量文檔中都出現(xiàn)有“酒店”、“房間”、“前臺(tái)”等詞,這些詞是情感分類時(shí)的廣義“停用詞”,若不加以處理,將隨機(jī)散布在各個(gè)主題的關(guān)鍵詞當(dāng)中。

    由于這些詞與領(lǐng)域相關(guān),無法通過構(gòu)建統(tǒng)一的詞表去除該類詞匯,給主題的提取和情感傾向的劃分造成困難。本文針對(duì)情感語料的詞匯分布特點(diǎn),根據(jù)每個(gè)詞與情感種子詞的點(diǎn)互信息(point mutual information,PMI)[14],賦予詞匯不同權(quán)重,并將權(quán)值信息融入吉布斯采樣過程,利用每個(gè)主題下的關(guān)鍵詞判斷主題的情感傾向,從而實(shí)現(xiàn)文檔的情感分類。整個(gè)算法的步驟如圖2所示。

    圖2 WLDA算法步驟Fig.2 Road map of WLDA algorithm

    點(diǎn)互信息可根據(jù)兩個(gè)離散隨機(jī)變量的共現(xiàn)概率度量其相關(guān)性。對(duì)于兩個(gè)變量x和y,其點(diǎn)互信息:

    (3)

    顯然,兩個(gè)變量共現(xiàn)的概率越大,其PMI值越大。以此為理論基礎(chǔ),文獻(xiàn)[15]根據(jù)某一詞匯與正面情感種子詞和負(fù)面情感種子詞的PMI值度量該詞的情感傾向。考慮到種子詞在語料中的出現(xiàn)可能不均衡,本文對(duì)原公式稍加改動(dòng),根據(jù)語料中出現(xiàn)的正向和負(fù)向種子詞個(gè)數(shù)添加歸一化因子。對(duì)于詞w,其權(quán)重定義為

    (4)

    式中:pos為語料中包含的正面情感種子詞集合,a為正面情感種子詞個(gè)數(shù),neg為語料中包含的負(fù)面情感種子詞集合,b為負(fù)面情感種子詞個(gè)數(shù)。

    p(zi=k|z,w,weight)=

    (5)

    整個(gè)模型的“文檔—主題”分布θ和“主題—詞匯”分布φ可分別按照式(6)和式(7)計(jì)算:

    (6)

    (7)

    與LDA模型類似,此處選取每個(gè)主題下φ值最大的S個(gè)詞作為該主題的關(guān)鍵詞。定義主題k的情感傾向E(k):

    (8)

    “文檔-情感”矩陣π表征了文檔的情感分布,其規(guī)模為M×2,由正面情感分布πpos和負(fù)面情感分布πneg組成。其定義見式(9)和式(10):

    (9)

    (10)

    式中:θi為每一篇文檔分配給主題i的概率,πpos和πneg分別是文檔為正面或負(fù)面的概率值,刻畫了每篇文檔的情感分布情況。在后面的實(shí)驗(yàn)中,認(rèn)為文檔d的情感傾向:

    E(d)=argmax(πd)

    (11)

    完整的WLDA算法如下:

    算法2基于WLDA的情感分類算法。

    輸入待分類文檔,情感種子詞;

    輸出情感分類結(jié)果。

    For w∈W

    按式(4)計(jì)算weight(w)

    Repeat

    For m∈M

    For n∈N

    按式(5)采樣每個(gè)詞的主題

    Until 收斂 or 達(dá)到最大迭代次數(shù)

    分別按照式(6)和式(7)計(jì)算θ、φ

    For k∈K

    For s∈S

    按式(8)計(jì)算主題k的情感傾向E(k)

    If E(k)>0

    π1=π1+θk

    If E(k)<0

    π2=π2+θk

    For m∈M

    If πm,1>πm,2

    文檔情感為正面

    Else

    文檔情感為負(fù)面

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1實(shí)驗(yàn)設(shè)置

    語料1為中科院譚松波等收集整理的酒店評(píng)論語料,從中隨機(jī)選取帶有正向和負(fù)向情感傾向標(biāo)注的評(píng)論各500篇;語料2為從互聯(lián)網(wǎng)爬取的酒店評(píng)論11 197篇,包含正向文本5 891篇和負(fù)向文本5 306篇。WLDA和JST 模型的正面和負(fù)面情感種子詞來自知網(wǎng)的《中文情感分析用詞語集》。實(shí)驗(yàn)前,首先對(duì)語料進(jìn)行了分詞、去停用詞等預(yù)處理。

    WLDA參數(shù)取經(jīng)驗(yàn)值α=50/K,β=0.01,S=100。實(shí)驗(yàn)以LSM和JST兩種經(jīng)典算法作為對(duì)比,LSM模型中,選取α=50/K,β=0.01;JST模型參數(shù)設(shè)置與文獻(xiàn)[6]保持一致。3種算法的迭代次數(shù)均為1 000次。

    3.2加權(quán)方式對(duì)比

    表2列舉了部分詞匯在3種加權(quán)方式下的權(quán)重值。

    表2 各加權(quán)方式下部分詞匯權(quán)重對(duì)比

    方法1 PMI已在上文詳述,方法2IDF權(quán)重計(jì)算方法來自文獻(xiàn)[16],方法3的二值化見式(12):

    (12)

    當(dāng)一個(gè)詞的權(quán)重大于1時(shí),表明其作用在采樣中將會(huì)被增強(qiáng);小于1時(shí),其重要性降低。若將全部權(quán)重置為1,則為一般的吉布斯采樣。

    方法1和方法3均能將“舒適”、“實(shí)惠”等詞賦以較大權(quán)重,將部分沒有情感色彩的詞如“服務(wù)員”、“酒店”等賦以較小權(quán)重,但對(duì)于未收錄的情感詞匯如“很臟”、“破”等,方法3表現(xiàn)不佳。方法2將提高出現(xiàn)次數(shù)較少的罕見詞的權(quán)重,而同時(shí)降低高頻情感詞和高頻非情感詞的權(quán)重。綜上,3種方法中PMI加權(quán)最適用于本文,故以下實(shí)驗(yàn)中采用的均是PMI加權(quán)方式。

    3.3WLDA和LSM模型對(duì)比

    在主題模型中,通常以各個(gè)主題下的關(guān)鍵詞來表征該主題的含義。表3為采用語料1時(shí)WLDA與LSM模型的關(guān)鍵詞對(duì)比。

    表3 WLDA和LSM關(guān)鍵詞

    在WLDA中,超過一半的關(guān)鍵詞都具有明顯的情感傾向,如“不錯(cuò)”、“方便”、“失望”等,使讀者更容易區(qū)分主題的情感傾向;而在LSM模型中,正如上文所提到的,體現(xiàn)情感的詞匯出現(xiàn)較少,而“酒店”、“房間”、“入住”等不能表達(dá)明確情感色彩的詞散布在正面和負(fù)面兩類情感的關(guān)鍵詞中。

    表4展示了WLDA和LSM模型對(duì)文檔的情感分類精度。在關(guān)鍵詞部分,雖然LSM中涉及的具有情感傾向的詞匯較少,仍可辨別兩類關(guān)鍵詞的正負(fù)情感傾向。但具體到刻畫各個(gè)文檔的情感,其精度遠(yuǎn)低于WLDA,可見這類廣義停用詞對(duì)模型性能的影響。

    表4 WLDA和LSM模型情感分類精度

    此處以LSM為對(duì)比,說明了詞匯加權(quán)對(duì)吉布斯采樣結(jié)果的影響,但由于LSM模型只能將文檔劃分為正面、負(fù)面兩類或正面、負(fù)面、中性三類,無法提取更細(xì)粒度的主題和情感信息,后文的實(shí)驗(yàn)均采用WLDA與JST兩個(gè)模型的對(duì)比。

    3.4WLDA和JST模型的情感分類精度對(duì)比

    圖3為WLDA和JST模型選取不同主題數(shù)目時(shí),在語料1和語料2下的情感分類精度。

    圖3 WLDA和JST模型分類精度對(duì)比Fig.3 Sentiment classification accuracy of WLDA and JST

    對(duì)于語料1和語料2,WLDA不僅在情感分類上均有良好表現(xiàn),受主題數(shù)目選取的影響也比JST模型更小。

    3.5WLDA和JST模型的關(guān)鍵詞對(duì)比

    在語料1中,當(dāng)K=6時(shí),兩種算法的分類精度達(dá)到最高。表5列舉了K=6時(shí),WLDA和JST模型得到的關(guān)鍵詞,并歸納了關(guān)鍵詞的主要內(nèi)容。

    表5 WLDA和JST關(guān)鍵詞

    可以看到,WLDA得到的關(guān)鍵詞多為單一方面評(píng)價(jià),一致性較強(qiáng),易于人的理解。而在JST模型中,部分主題由多個(gè)方面的評(píng)價(jià)組成,如主題2,在15個(gè)關(guān)鍵詞中,同時(shí)涉及到房間、服務(wù)、餐飲三方面內(nèi)容;主題6 同時(shí)涉及房間、服務(wù)、交通三方面內(nèi)容。除此之外,WLDA的關(guān)鍵詞中涵蓋的情感詞匯更豐富,主題的情感傾向也更加突出。與JST模型相比,WLDA得到的各個(gè)主題的關(guān)鍵詞語義和情感都更加明晰。

    3.6WLDA和JST模型的主題KL距離對(duì)比

    上文通過關(guān)鍵詞的列舉直觀展示了WLDA的性能,本部分將借助主題與背景主題的平均KL距離定量描述主題的區(qū)分性。其核心思想是一個(gè)合理的主題總傾向于在部分文檔集中出現(xiàn),主題在所有文檔中出現(xiàn)的概率越平均,說明該主題越可能為垃圾/非重要主題[17]。極端情況,當(dāng)某個(gè)主題在所有文檔中出現(xiàn)的概率都相同,該主題對(duì)文檔的區(qū)分能力為零。主題與背景主題的平均KL距離KL_b定義如下:

    (11)

    表6 WLDA和JST模型中主題與背景主題的平均KL距離

    表6展示了WLDA和JST模型主題與背景主題的平均KL距離,其值越大,說明主題與背景主題的距離越遠(yuǎn),主題的可區(qū)分性越強(qiáng)??梢钥吹剑诟鱾€(gè)主題數(shù)目下,WLDA的主題區(qū)分能力均優(yōu)于JST模型。

    3.7WLDA和JST模型的時(shí)間消耗對(duì)比

    以語料1為例,圖4對(duì)比了K=6時(shí)WLDA和JST模型不同迭代次數(shù)所需的時(shí)間。

    圖4 WLDA和JST模型運(yùn)行時(shí)間對(duì)比Fig.4 Time consumption comparison of WLDA and JST

    由于本文算法需要首先計(jì)算詞匯權(quán)重,故吉布斯采樣前的處理時(shí)間比JST模型長(zhǎng),但單次迭代速度比JST更快。當(dāng)吉布斯采樣的次數(shù)較小時(shí),JST模型消耗時(shí)間更短,然而,隨著采樣次數(shù)的增加,WLDA的時(shí)間優(yōu)勢(shì)愈發(fā)明顯。另外,對(duì)于同一語料庫,取不同K值或其他參數(shù)發(fā)生改變時(shí)無需重復(fù)計(jì)算詞匯權(quán)重,故在多次試驗(yàn)中,其平均運(yùn)行時(shí)間將比圖3所展示的更短。

    4 結(jié)束語

    本文提出了一種用于情感分類的詞加權(quán)LDA算法,通過度量詞匯與情感種子詞的點(diǎn)互信息,在吉布斯采樣中為不同詞匯賦予不同權(quán)重,并利用每個(gè)主題下的關(guān)鍵詞判斷主題的情感傾向,從而實(shí)現(xiàn)文檔的情感分類。實(shí)驗(yàn)表明,WLDA不僅具有無監(jiān)督、可提取細(xì)粒度情感的優(yōu)點(diǎn),而且分類精度較高,在采樣中迭代速度較快。由于WLDA采用的是“詞袋”模型,忽略了詞與詞之間的聯(lián)系,可能會(huì)出現(xiàn)局部情感判斷錯(cuò)誤,因此,如何將詞序信息融入WLDA是下一步的工作重點(diǎn)。

    [1]AGARWAL B, PORIA S, MITTAL N, et al. Concept-level sentiment analysis with dependency-based semantic parsing: a novel approach[J]. Cognitive computation, 2015, 7(4): 487-499.

    [2]CAMBRIA E. Affective computing and sentiment analysis[J]. IEEE intelligent systems, 2016, 31(2): 102-107.

    [3]LIN Chenghua, HE Yulan. Joint sentiment/topic model for sentiment analysis[C]//Proceedings of the 18th ACM Conference on Information and Knowledge Management. Hong Kong, China: ACM, 2009: 375-384.

    [4]LIN Chenghua, HE Yulan, EVERSON R. A comparative study of Bayesian models for unsupervised sentiment detection[C]//Proceedings of the Fourteenth Conference on Computational Natural Language Learning. Stroudsburg, PA, USA: ACM, 2011: 144-152.

    [5]TITOV I, MCDONALD R. A joint model of text and aspect ratings for sentiment summarization[C]//Proceedings of Annual Meeting of the Computational Linguistics. Columbus, USA: Association for Computational Linguistics, 2008: 308-316.

    [6]PAUL M, GIRJU R. A two-dimensional topic-aspect model for discovering multi-faceted topics[C]//Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence. Atlanta, USA: AAAI, 2010: 545-550.

    [7]MEI Qiaozhu, LING Xu, WONDRA M, et al. Topic sentiment mixture: modeling facets and opinions in weblogs[C]//Proceedings of the 16th International Conference on World Wide Web. North Carolina, USA: ACM, 2010: 171-180.

    [8]JO Y, OH A H. Aspect and sentiment unification model for online review analysis[C]//Proceedings of the Fourth ACM International Conference on Web Search and Data Mining. Hong Kong, China: ACM, 2011: 815-824.

    [9]歐陽繼紅, 劉燕輝, 李熙銘, 等. 基于LDA的多粒度主題情感混合模型[J]. 電子學(xué)報(bào), 2015, 43(9): 1875-1880.

    OUYANG Jihong, LIU Yanhui, LI Ximing, et al. Multi-grain sentiment/topic model based on LDA[J]. Acta electronica sinica, 2015, 43(9): 1875-1880.

    [10]BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. The journal of machine learning research, 2003, 3: 993-1022.

    [11]RUBIN T N, CHAMBERS A, SMYTH P, et al. Statistical topic models for multi-label document classification[J]. Machine learning, 2012, 88(1/2): 157-208.

    [12]ANDRZEJEWSKI D, BUTTLER D. Latent topic feedback for information retrieval[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Diego, USA: ACM, 2011: 600-608.

    [13]WALLACH H M. Topic modeling: beyond bag-of-words[C]//Proceedings of the 23rd International Conference on Machine Learning. New York, USA: ACM, 2006: 977-984.

    [14]CHURCH K W, HANKS P. Word association norms, mutual information, and lexicography[J]. Computational linguistics, 1990, 16(1): 22-29.

    [15]TURNEY P D, LITTMAN M L. Measuring praise and criticism: inference of semantic orientation from association[J]. ACM transactions on information systems, 2003, 21(4): 315-346.

    [16]張小平. 主題模型及其在中醫(yī)臨床診療中的應(yīng)用研究[D]. 北京: 北京交通大學(xué), 2011: 57-58.

    ZHANG Xiaoping. Study on topic model and its application to TCM clinical diagnosis and treatment[D]. Beijing: Beijing Jiaotong University, 2011: 57-58.

    [17]ALSUMAIT L, BARBARá D, GENTLE J, et al. Topic significance ranking of LDA generative models[C]//Proceedings of the European Conference on Machine Learning and Knowledge Discovery in Databases. Bled, Slovenia: ACM, 2009: 67-82.

    郝潔,女,1992年生,碩士研究生,主要研究方向?yàn)樽匀徽Z言處理、粗糙集。

    謝珺,女,1979年生,副教授,主要研究方向?yàn)榱S?jì)算、粗糙集、數(shù)據(jù)挖掘、智能信息處理。

    蘇婧瓊,女,1991年生,碩士研究生,主要研究方向?yàn)樽匀徽Z言處理、粒計(jì)算。

    An unsupervised approach for sentiment classification based on weighted latent dirichlet allocation

    HAO Jie, XIE Jun, SU Jingqiong, XU Xinying, HAN Xiaoxia

    (Information Engineering College, Taiyuan University of Technology, Jinzhong 030600, China)

    The topic and sentiment unification model can efficiently detect topics and emotions for a given corpus. Faced with the low discriminability of topics in sentiment/topic analysis methods, this paper proposes a novel method, the weighted latent dirichlet allocation algorithm (WLDA), which can acquire sentiments and topics without supervision. The model assigns weights to terms during Gibbs sampling by calculating the distance between seed words and terms, then counts the weights of key words to estimate the sentiment orientation of each topic and obtain the emotional distribution throughout documents. This method enhances the impact of words that convey emotional attitudes and obtains more discriminative topics as a consequence. The experiments show that WLDA, compared with the joint sentiment/topic model (JST), not only has a higher iteration sampling speed, but also gives better results for topic extraction and sentiment classification.

    sentiment classification; topic and sentiment unification model; topic model; LDA; weighting algorithm

    10.11992/tis.201606007

    網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160808.0830.020.html

    2016-06-02. 網(wǎng)絡(luò)出版日期:2016-08-08.

    山西省回國留學(xué)人員科研項(xiàng)目(2015-045,2013-033);山西省留學(xué)回國人員科技活動(dòng)擇優(yōu)資助項(xiàng)目(2013);山西省自然科學(xué)基金項(xiàng)目(2014011018-2).

    謝珺. E-mail:xiejun@tyut.edu.cn.

    TP391

    A

    1673-4785(2016)04-0539-07

    猜你喜歡
    詞匯分類情感
    分類算一算
    本刊可直接用縮寫的常用詞匯
    如何在情感中自我成長(zhǎng),保持獨(dú)立
    一些常用詞匯可直接用縮寫
    失落的情感
    北極光(2019年12期)2020-01-18 06:22:10
    情感
    本刊可直接用縮寫的常用詞匯
    分類討論求坐標(biāo)
    如何在情感中自我成長(zhǎng),保持獨(dú)立
    數(shù)據(jù)分析中的分類討論
    看免费av毛片| 欧美日韩精品网址| 黑人巨大精品欧美一区二区蜜桃| 在线永久观看黄色视频| 欧美日韩乱码在线| 别揉我奶头~嗯~啊~动态视频| 亚洲一卡2卡3卡4卡5卡精品中文| 一个人免费在线观看的高清视频| 国产精品1区2区在线观看. | 91在线观看av| 精品无人区乱码1区二区| 国产日韩欧美亚洲二区| 亚洲欧美色中文字幕在线| 成人特级黄色片久久久久久久| 亚洲欧美一区二区三区久久| 欧美大码av| 国产97色在线日韩免费| 免费观看a级毛片全部| 69av精品久久久久久| 91成年电影在线观看| 一级a爱片免费观看的视频| 757午夜福利合集在线观看| 色婷婷av一区二区三区视频| 19禁男女啪啪无遮挡网站| 人人妻,人人澡人人爽秒播| 丁香欧美五月| 天堂动漫精品| 日韩熟女老妇一区二区性免费视频| 俄罗斯特黄特色一大片| 国产精品成人在线| 99精品久久久久人妻精品| 如日韩欧美国产精品一区二区三区| 两人在一起打扑克的视频| 夫妻午夜视频| 啦啦啦在线免费观看视频4| 高潮久久久久久久久久久不卡| www日本在线高清视频| 久久精品亚洲精品国产色婷小说| 亚洲色图av天堂| 老熟妇仑乱视频hdxx| 每晚都被弄得嗷嗷叫到高潮| 新久久久久国产一级毛片| 一区福利在线观看| 国产精品.久久久| 久久亚洲真实| 欧美精品一区二区免费开放| 中文字幕人妻熟女乱码| 国产成人欧美在线观看 | 成人影院久久| 人妻久久中文字幕网| 色尼玛亚洲综合影院| 成熟少妇高潮喷水视频| 久久午夜综合久久蜜桃| 人妻丰满熟妇av一区二区三区 | www.自偷自拍.com| 韩国精品一区二区三区| tube8黄色片| 国产高清激情床上av| 热99久久久久精品小说推荐| 日韩三级视频一区二区三区| 免费高清在线观看日韩| 男人的好看免费观看在线视频 | 国产区一区二久久| www日本在线高清视频| 99re在线观看精品视频| 日韩大码丰满熟妇| 久久久久精品国产欧美久久久| 欧美日韩精品网址| 亚洲成人国产一区在线观看| 别揉我奶头~嗯~啊~动态视频| 日日夜夜操网爽| 久久婷婷成人综合色麻豆| 男女床上黄色一级片免费看| 午夜老司机福利片| 99国产精品一区二区三区| 久久国产精品男人的天堂亚洲| 天堂中文最新版在线下载| 中文字幕色久视频| a级毛片黄视频| 日韩精品免费视频一区二区三区| 免费看十八禁软件| 黄色丝袜av网址大全| 一级黄色大片毛片| 欧美日本中文国产一区发布| 亚洲成a人片在线一区二区| 美国免费a级毛片| 村上凉子中文字幕在线| 亚洲国产欧美一区二区综合| 国产成人av激情在线播放| 久久婷婷成人综合色麻豆| 岛国毛片在线播放| 亚洲欧美激情综合另类| 下体分泌物呈黄色| 国产欧美亚洲国产| 精品久久蜜臀av无| 亚洲三区欧美一区| 99在线人妻在线中文字幕 | 国产xxxxx性猛交| 亚洲av熟女| 国产成人啪精品午夜网站| 国产精品免费视频内射| 国产三级黄色录像| 亚洲精品乱久久久久久| 一边摸一边抽搐一进一出视频| 国产精品香港三级国产av潘金莲| 国产色视频综合| 一级毛片精品| 乱人伦中国视频| 91av网站免费观看| 91大片在线观看| 妹子高潮喷水视频| 国产精品av久久久久免费| 亚洲第一欧美日韩一区二区三区| 麻豆乱淫一区二区| 久久香蕉国产精品| 777米奇影视久久| 欧美日韩精品网址| 国产精品.久久久| 最新在线观看一区二区三区| 不卡av一区二区三区| 久久亚洲精品不卡| 别揉我奶头~嗯~啊~动态视频| 99久久99久久久精品蜜桃| 天天躁狠狠躁夜夜躁狠狠躁| a在线观看视频网站| 精品国内亚洲2022精品成人 | 日韩免费高清中文字幕av| 在线观看一区二区三区激情| 国产一区二区三区在线臀色熟女 | 亚洲一区二区三区不卡视频| 亚洲成人免费av在线播放| 亚洲av第一区精品v没综合| 亚洲精品乱久久久久久| 久久久久久免费高清国产稀缺| 岛国毛片在线播放| 首页视频小说图片口味搜索| 亚洲专区国产一区二区| 国产成人精品在线电影| www.精华液| 超碰97精品在线观看| 国产一区二区激情短视频| 性少妇av在线| 亚洲欧美日韩另类电影网站| 成人免费观看视频高清| www.精华液| 精品一区二区三区视频在线观看免费 | 亚洲第一欧美日韩一区二区三区| 亚洲精品中文字幕在线视频| 免费观看人在逋| 欧美国产精品一级二级三级| 伊人久久大香线蕉亚洲五| 免费女性裸体啪啪无遮挡网站| 校园春色视频在线观看| 精品电影一区二区在线| av网站免费在线观看视频| 久久久久久久久免费视频了| 在线视频色国产色| 欧美精品一区二区免费开放| 免费日韩欧美在线观看| 19禁男女啪啪无遮挡网站| 十分钟在线观看高清视频www| 欧美激情久久久久久爽电影 | 啦啦啦免费观看视频1| 亚洲一区二区三区欧美精品| 久久精品国产综合久久久| 日韩 欧美 亚洲 中文字幕| 十八禁人妻一区二区| 亚洲欧美日韩高清在线视频| 丁香欧美五月| 在线观看免费午夜福利视频| 欧美日韩av久久| 精品人妻熟女毛片av久久网站| 亚洲人成伊人成综合网2020| 激情在线观看视频在线高清 | 搡老熟女国产l中国老女人| 国产淫语在线视频| 无人区码免费观看不卡| 久久国产精品影院| 欧美日韩亚洲综合一区二区三区_| 亚洲国产中文字幕在线视频| 丝袜在线中文字幕| 国产精品久久视频播放| 韩国av一区二区三区四区| 一区二区日韩欧美中文字幕| 99久久国产精品久久久| 在线观看66精品国产| 捣出白浆h1v1| 欧美成人免费av一区二区三区 | 国产成人精品无人区| 高潮久久久久久久久久久不卡| 国产亚洲精品第一综合不卡| 久久午夜亚洲精品久久| 曰老女人黄片| 老司机影院毛片| 午夜久久久在线观看| 欧美亚洲日本最大视频资源| 亚洲av熟女| 看免费av毛片| 他把我摸到了高潮在线观看| 成人国语在线视频| 午夜精品国产一区二区电影| 免费看十八禁软件| 欧美国产精品va在线观看不卡| 在线免费观看的www视频| 久久这里只有精品19| 成年版毛片免费区| 久久中文字幕人妻熟女| 国产精品电影一区二区三区 | 久久国产精品人妻蜜桃| 精品视频人人做人人爽| 很黄的视频免费| 久热爱精品视频在线9| 精品久久久久久久毛片微露脸| 国内久久婷婷六月综合欲色啪| 丝瓜视频免费看黄片| 色精品久久人妻99蜜桃| 99久久99久久久精品蜜桃| 精品国产美女av久久久久小说| bbb黄色大片| 精品福利观看| 国内毛片毛片毛片毛片毛片| 久久国产亚洲av麻豆专区| avwww免费| 欧美日韩视频精品一区| 一边摸一边抽搐一进一出视频| 日韩三级视频一区二区三区| 最近最新中文字幕大全电影3 | 一区在线观看完整版| 成年人午夜在线观看视频| 久久香蕉国产精品| 精品久久久久久久久久免费视频 | 一区福利在线观看| 女人被狂操c到高潮| 丰满饥渴人妻一区二区三| 欧美激情高清一区二区三区| 少妇猛男粗大的猛烈进出视频| 80岁老熟妇乱子伦牲交| 欧美一级毛片孕妇| 欧美日韩亚洲高清精品| 男女下面插进去视频免费观看| 日日摸夜夜添夜夜添小说| 国产精品香港三级国产av潘金莲| 亚洲一区高清亚洲精品| 伊人久久大香线蕉亚洲五| 视频在线观看一区二区三区| 色老头精品视频在线观看| videosex国产| 夜夜躁狠狠躁天天躁| 日本欧美视频一区| 色婷婷av一区二区三区视频| 精品一区二区三区视频在线观看免费 | 捣出白浆h1v1| xxx96com| 午夜免费观看网址| 午夜成年电影在线免费观看| videos熟女内射| 国产精华一区二区三区| av免费在线观看网站| 极品教师在线免费播放| 亚洲中文日韩欧美视频| 国产欧美日韩精品亚洲av| √禁漫天堂资源中文www| www.自偷自拍.com| 在线观看免费午夜福利视频| 亚洲五月色婷婷综合| 国产有黄有色有爽视频| 亚洲午夜理论影院| 国产三级黄色录像| 免费在线观看日本一区| 18禁国产床啪视频网站| www.精华液| 午夜影院日韩av| 99香蕉大伊视频| 亚洲欧美日韩另类电影网站| 久久精品国产亚洲av高清一级| 日日夜夜操网爽| 国产一卡二卡三卡精品| 在线播放国产精品三级| 亚洲国产看品久久| 精品欧美一区二区三区在线| 国产精品影院久久| 无人区码免费观看不卡| 久久久久久久国产电影| 在线观看日韩欧美| 又黄又爽又免费观看的视频| 男女之事视频高清在线观看| 久久精品亚洲精品国产色婷小说| 极品教师在线免费播放| 黑人操中国人逼视频| 亚洲精品美女久久久久99蜜臀| 国产男女内射视频| 美女午夜性视频免费| 日本撒尿小便嘘嘘汇集6| 美女视频免费永久观看网站| 午夜精品在线福利| 国产亚洲一区二区精品| 国产成人影院久久av| 女人爽到高潮嗷嗷叫在线视频| 在线视频色国产色| 久久精品国产清高在天天线| 男男h啪啪无遮挡| 一a级毛片在线观看| 国产不卡一卡二| 19禁男女啪啪无遮挡网站| 亚洲五月天丁香| 丰满迷人的少妇在线观看| 日韩欧美国产一区二区入口| 国产精品九九99| 中文欧美无线码| 国产aⅴ精品一区二区三区波| 女同久久另类99精品国产91| 一本一本久久a久久精品综合妖精| 成人黄色视频免费在线看| 美女福利国产在线| 乱人伦中国视频| 久久人妻熟女aⅴ| 欧美日韩亚洲国产一区二区在线观看 | 美女 人体艺术 gogo| 妹子高潮喷水视频| 久久午夜亚洲精品久久| 久久香蕉精品热| 天天操日日干夜夜撸| 精品久久久精品久久久| 久久国产精品大桥未久av| 精品少妇久久久久久888优播| 久久精品国产清高在天天线| 91大片在线观看| 久久精品国产亚洲av香蕉五月 | 18禁国产床啪视频网站| 丰满迷人的少妇在线观看| 一进一出好大好爽视频| 欧美大码av| 在线永久观看黄色视频| 中文字幕最新亚洲高清| 久久精品国产清高在天天线| 久久国产精品人妻蜜桃| 久热这里只有精品99| 一级片'在线观看视频| 免费黄频网站在线观看国产| 狂野欧美激情性xxxx| 99国产极品粉嫩在线观看| 99久久国产精品久久久| 99国产极品粉嫩在线观看| 国产成人av教育| 三上悠亚av全集在线观看| 两性夫妻黄色片| 一边摸一边做爽爽视频免费| 国产精品成人在线| 丝袜在线中文字幕| 69精品国产乱码久久久| 91字幕亚洲| 欧美日韩一级在线毛片| 韩国精品一区二区三区| e午夜精品久久久久久久| 99久久人妻综合| 人人妻人人澡人人看| 18禁观看日本| 精品久久久久久电影网| 日韩制服丝袜自拍偷拍| 国产成人免费观看mmmm| 国产精品久久久av美女十八| 精品欧美一区二区三区在线| 亚洲片人在线观看| 色尼玛亚洲综合影院| 久久精品国产亚洲av香蕉五月 | 亚洲中文av在线| 日日摸夜夜添夜夜添小说| 19禁男女啪啪无遮挡网站| 国产99久久九九免费精品| 亚洲成av片中文字幕在线观看| 久久人妻av系列| 精品乱码久久久久久99久播| xxxhd国产人妻xxx| 久久久国产精品麻豆| 黄色毛片三级朝国网站| 大陆偷拍与自拍| 99久久99久久久精品蜜桃| 天天添夜夜摸| 一本大道久久a久久精品| 99国产综合亚洲精品| 王馨瑶露胸无遮挡在线观看| 中文字幕人妻丝袜制服| 美女国产高潮福利片在线看| 亚洲精品自拍成人| 色婷婷久久久亚洲欧美| 国产免费现黄频在线看| 国产精品欧美亚洲77777| 亚洲午夜精品一区,二区,三区| 人妻 亚洲 视频| 日韩有码中文字幕| 美女国产高潮福利片在线看| 90打野战视频偷拍视频| 国产精品 欧美亚洲| 精品久久久久久,| 亚洲国产精品一区二区三区在线| 免费在线观看日本一区| 热99久久久久精品小说推荐| 日本wwww免费看| 在线观看www视频免费| 久久亚洲真实| 色综合婷婷激情| 午夜福利,免费看| 欧美日韩亚洲国产一区二区在线观看 | 成人国产一区最新在线观看| 一区二区三区精品91| 下体分泌物呈黄色| 人人妻人人澡人人爽人人夜夜| 丰满迷人的少妇在线观看| 男女午夜视频在线观看| 后天国语完整版免费观看| 亚洲自偷自拍图片 自拍| 国产欧美亚洲国产| 精品第一国产精品| 久久精品国产亚洲av香蕉五月 | 久久国产精品男人的天堂亚洲| 精品国产一区二区久久| 亚洲精品中文字幕在线视频| 久久精品91无色码中文字幕| 两性午夜刺激爽爽歪歪视频在线观看 | 黄色丝袜av网址大全| 亚洲精品在线观看二区| 后天国语完整版免费观看| 在线观看66精品国产| 日本a在线网址| 一区二区三区国产精品乱码| 中文字幕人妻丝袜一区二区| 高清在线国产一区| 国产不卡一卡二| 国产亚洲欧美98| 国产高清视频在线播放一区| 一边摸一边抽搐一进一小说 | 亚洲七黄色美女视频| 美国免费a级毛片| 久久中文字幕一级| 在线观看免费高清a一片| 中文字幕人妻丝袜一区二区| 黑人猛操日本美女一级片| 久久久国产欧美日韩av| 女人精品久久久久毛片| 亚洲av成人不卡在线观看播放网| 国产欧美日韩一区二区精品| 丰满饥渴人妻一区二区三| 丰满的人妻完整版| 男人操女人黄网站| 黑人巨大精品欧美一区二区mp4| 久久精品国产亚洲av高清一级| 国产精品一区二区精品视频观看| 午夜精品在线福利| 午夜免费成人在线视频| 国产男女内射视频| 天堂动漫精品| 女人爽到高潮嗷嗷叫在线视频| 国产成人精品无人区| 国产精品亚洲一级av第二区| 女警被强在线播放| 国产真人三级小视频在线观看| 久久久久精品国产欧美久久久| 亚洲熟妇中文字幕五十中出 | 麻豆乱淫一区二区| 免费在线观看黄色视频的| 精品人妻1区二区| 成年女人毛片免费观看观看9 | 女人被狂操c到高潮| 久久精品aⅴ一区二区三区四区| 亚洲情色 制服丝袜| 亚洲精品国产精品久久久不卡| 好看av亚洲va欧美ⅴa在| 免费人成视频x8x8入口观看| 欧美亚洲日本最大视频资源| 最新在线观看一区二区三区| 在线永久观看黄色视频| 久久 成人 亚洲| 欧美日韩乱码在线| 国产亚洲精品久久久久久毛片 | 亚洲国产毛片av蜜桃av| 在线播放国产精品三级| 五月开心婷婷网| 免费在线观看视频国产中文字幕亚洲| 麻豆av在线久日| 每晚都被弄得嗷嗷叫到高潮| 久久久久久亚洲精品国产蜜桃av| 丰满的人妻完整版| 男男h啪啪无遮挡| 国产成人精品无人区| 动漫黄色视频在线观看| 两人在一起打扑克的视频| 午夜福利乱码中文字幕| 免费在线观看日本一区| 狠狠婷婷综合久久久久久88av| 亚洲欧美日韩另类电影网站| 国产成人一区二区三区免费视频网站| 啦啦啦免费观看视频1| 两个人看的免费小视频| 精品国产一区二区三区久久久樱花| 老熟妇乱子伦视频在线观看| 波多野结衣一区麻豆| 精品亚洲成a人片在线观看| 国产精品欧美亚洲77777| 在线天堂中文资源库| av不卡在线播放| 大香蕉久久成人网| 极品少妇高潮喷水抽搐| svipshipincom国产片| 日本黄色日本黄色录像| 免费在线观看视频国产中文字幕亚洲| 亚洲五月婷婷丁香| 99国产极品粉嫩在线观看| 国产精品欧美亚洲77777| 欧美激情极品国产一区二区三区| 欧美精品啪啪一区二区三区| 欧美日韩视频精品一区| 丁香欧美五月| 怎么达到女性高潮| 亚洲七黄色美女视频| 999久久久精品免费观看国产| 夜夜夜夜夜久久久久| 久久天堂一区二区三区四区| 午夜日韩欧美国产| 中国美女看黄片| 国产深夜福利视频在线观看| 成人18禁在线播放| 国产精品一区二区在线观看99| 美女国产高潮福利片在线看| 亚洲人成电影免费在线| 美女午夜性视频免费| 精品国产乱子伦一区二区三区| 午夜亚洲福利在线播放| 亚洲精品国产区一区二| 精品欧美一区二区三区在线| 亚洲av成人av| 久久久久国产精品人妻aⅴ院 | 久久国产乱子伦精品免费另类| 搡老乐熟女国产| 黄色视频,在线免费观看| 国产精品免费视频内射| x7x7x7水蜜桃| 国产91精品成人一区二区三区| 亚洲中文日韩欧美视频| 视频在线观看一区二区三区| 日本五十路高清| 黄色丝袜av网址大全| 精品久久久久久久毛片微露脸| 一级黄色大片毛片| 99久久精品国产亚洲精品| 久久天堂一区二区三区四区| 搡老熟女国产l中国老女人| 黄片大片在线免费观看| 欧美av亚洲av综合av国产av| 精品国产乱子伦一区二区三区| 精品免费久久久久久久清纯 | 18禁裸乳无遮挡动漫免费视频| 午夜福利,免费看| 免费在线观看视频国产中文字幕亚洲| 欧美日韩视频精品一区| 国产又色又爽无遮挡免费看| 久久国产亚洲av麻豆专区| 亚洲国产欧美一区二区综合| 99久久人妻综合| 欧美大码av| 日韩欧美免费精品| 超碰97精品在线观看| 自拍欧美九色日韩亚洲蝌蚪91| 99国产精品免费福利视频| 欧美 亚洲 国产 日韩一| 久9热在线精品视频| 久久精品熟女亚洲av麻豆精品| 少妇猛男粗大的猛烈进出视频| 一级,二级,三级黄色视频| 乱人伦中国视频| 久久国产精品人妻蜜桃| 日本a在线网址| 久久久久久人人人人人| 国产精品欧美亚洲77777| 免费高清在线观看日韩| 动漫黄色视频在线观看| 老司机福利观看| 欧美激情极品国产一区二区三区| 国产精品免费视频内射| 女人精品久久久久毛片| 老汉色av国产亚洲站长工具| 手机成人av网站| 免费在线观看亚洲国产| 深夜精品福利| 激情在线观看视频在线高清 | 亚洲精品久久成人aⅴ小说| 午夜日韩欧美国产| 中文欧美无线码| 久久精品熟女亚洲av麻豆精品| 丝袜美足系列| 青草久久国产| 美女午夜性视频免费| 中文字幕高清在线视频| 又大又爽又粗| 国产一区有黄有色的免费视频| 日日爽夜夜爽网站| 又大又爽又粗| www.自偷自拍.com| 欧美另类亚洲清纯唯美| 午夜福利,免费看| 色播在线永久视频| 亚洲熟女毛片儿| 巨乳人妻的诱惑在线观看| 91大片在线观看| 亚洲人成77777在线视频| 99精品在免费线老司机午夜| 久久国产精品大桥未久av| 色婷婷久久久亚洲欧美| 这个男人来自地球电影免费观看| 999精品在线视频| 久久久久久亚洲精品国产蜜桃av| 亚洲片人在线观看| 亚洲欧美日韩高清在线视频| 国产男女超爽视频在线观看| 欧美国产精品va在线观看不卡| 黄片大片在线免费观看|