• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GV—LDA的微博話題檢測(cè)研究

    2018-03-10 00:49:37李少華李衛(wèi)疆余正濤
    軟件導(dǎo)刊 2018年2期
    關(guān)鍵詞:微博

    李少華+李衛(wèi)疆+余正濤

    摘 要:隨著社交網(wǎng)絡(luò)的不斷發(fā)展,微博成為越來越多的人獲取信息的平臺(tái)。為了有效解決微博話題檢測(cè)中海量短文本帶來的詞稀疏問題,提出結(jié)合全局向量模型(GloVe)和潛在狄利克雷分布(LDA)的GV-LDA模型。在使用LDA進(jìn)行話題檢測(cè)前,模型利用多義詞詞項(xiàng)的含義與詞性相關(guān)的事實(shí),在標(biāo)注過并去除低頻詞的語料上,對(duì)全局向量模型進(jìn)行訓(xùn)練獲得詞向量,對(duì)詞性相同且相似度大于閾值的詞進(jìn)行替換以解決稀疏性問題。實(shí)驗(yàn)結(jié)果表明, GV-LDA模型較傳統(tǒng)的LDA主題模型,可有效提高話題檢測(cè)的準(zhǔn)確率和召回率,并降低“主題-詞”處理的維度,因此GV-LDA更適合微博話題檢測(cè)。

    關(guān)鍵詞:微博;話題檢測(cè);全局向量;潛在狄利克雷分布

    DOIDOI:10.11907/rjdk.172432

    中圖分類號(hào):TP319

    文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2018)002-0131-05

    0 引言

    隨著信息技術(shù)的快速發(fā)展,社交網(wǎng)絡(luò)信息量出現(xiàn)了爆炸式增長(zhǎng),人們可接觸的信息越來越豐富,如何從海量信息中獲取有效信息受到研究者越來越多的關(guān)注。

    微博是一個(gè)基于用戶關(guān)系的信息傳播平臺(tái),可使用電腦或手機(jī)上的網(wǎng)頁或應(yīng)用,通過發(fā)布、評(píng)論、點(diǎn)贊、轉(zhuǎn)發(fā)文字消息、照片或視頻音頻鏈接等方式,即時(shí)分享自己對(duì)事件的感受。微博作為一種新的網(wǎng)絡(luò)媒體形式,已經(jīng)成為普通民眾分享、關(guān)注、獲取所關(guān)心信息的重要平臺(tái)。微博的字?jǐn)?shù)限制在140字之內(nèi),更加契合忙碌運(yùn)轉(zhuǎn)的現(xiàn)代社會(huì)對(duì)寫作和傳播方式的需要,增加了人們創(chuàng)作的隨意性。微博用戶可以便捷地了解自己所關(guān)注的人和群組發(fā)布的消息,但無法及時(shí)掌握整個(gè)平臺(tái)的熱點(diǎn)話題。為此,需要將海量的微博信息進(jìn)行組織和歸并,從中提取話題,并以簡(jiǎn)潔而明確的形式予以展示。

    利用微博的結(jié)構(gòu)和內(nèi)容信息,結(jié)合現(xiàn)有的話題檢測(cè)技術(shù),本文提出一套適合微博的話題檢測(cè)方法,以更加有效地利用微博信息為用戶提供更完善的信息服務(wù)。本文研究的主要問題包括共現(xiàn)窗口大小的確定、如何從詞共現(xiàn)獲得詞向量、相似詞歸并中如何選定相似度閾值、如何通過文本得出話題等。

    1 相關(guān)工作

    Hofmann等[1]提出基于似然原理的生成模型PLSA(Probabilistic Latent Semantic Analysis,概率潛在語義分析),其基本思想是每個(gè)文檔都是通過選擇主題的分布,然后根據(jù)分布選擇文檔中的詞語生成的。主題的數(shù)量有限,對(duì)應(yīng)低維的語義空間,主題挖掘就是通過“降維”將文檔從高維空間投影到語義空間。PLSA使用EM(Exception Maximization,最大期望算法)對(duì)模型進(jìn)行求解,其計(jì)算復(fù)雜度小于SVD算法,因此PLSA在性能和擴(kuò)展性等方面的表現(xiàn)優(yōu)于LSA。但是PLSA在文檔層面沒有提供合適的概率模型,同時(shí)EM算法需要反復(fù)迭代,計(jì)算量依然很大。

    Blei等[2]提出的LDA(Latent Dirichlet Allocation,潛在狄利克雷分布)在PLSA中加入了Dirichlet先驗(yàn)分布。在這個(gè)模型中,文檔建模為主題潛在集合上的有限混合,而主題則建模為主題概率潛在集合上的無限混合。針對(duì)PLSA中過多的參數(shù)導(dǎo)致過擬合及難以對(duì)訓(xùn)練集外的文檔分配概率等缺陷,LDA引入了超參數(shù),形成“文檔-主題-詞”的三層貝葉斯模型,使用變分貝葉斯近似后驗(yàn)分布推導(dǎo)參數(shù)來挖掘文本主題。

    ThomasL.Grffiths等[3]在LDA模型的參數(shù)推導(dǎo)階段引入馬爾科夫鏈-蒙特卡洛算法(Gibbs抽樣),并使用貝葉斯模型的選擇來確定主題數(shù)量。其對(duì)參數(shù)的推導(dǎo)過程更加快速,同時(shí)解決了變分貝葉斯方法中參數(shù)局部最優(yōu)的問題。

    微博與傳統(tǒng)文本在結(jié)構(gòu)和內(nèi)容上有差異,傳統(tǒng)的話題檢測(cè)方法不能很好地對(duì)其建模。為此,研究者紛紛提出新的模型,LDA模型在傳統(tǒng)文本話題檢測(cè)中表現(xiàn)卓越,多數(shù)模型基于LDA模型進(jìn)行改進(jìn)。

    孫勝平[4]提出在空間向量模型中使用SP&HA聚類算法用于微博話題檢測(cè)。總體思想是:首先使用歸一化TF-IDF函數(shù)計(jì)算特征權(quán)重,然后使用余弦法則計(jì)算文本的相似度,接著在話題初步檢測(cè)中采用Single-Pass增量聚類算法,對(duì)與話題相似度高于閾值的文本進(jìn)行歸并,最后在話題合并環(huán)節(jié)采用自底向上的凝聚式層次聚類算法,不斷合并相似度矩陣中相似度最大的兩個(gè)文本,得到滿足相似度預(yù)設(shè)值的話題類。

    張晨逸等[5]綜合考慮微博文本包含的社交網(wǎng)絡(luò)結(jié)構(gòu)化信息進(jìn)行統(tǒng)一建模,提出MB-LDA微博生成模型。該模型基于如下假設(shè):與同一個(gè)用戶有關(guān)聯(lián)的微博主題相關(guān);轉(zhuǎn)發(fā)的微博與原創(chuàng)微博主題相關(guān)。對(duì)以@開頭的對(duì)話微博,模型抽樣出@的聯(lián)系人與各個(gè)主題的關(guān)系,并賦值給微博與主題之間的關(guān)系;對(duì)轉(zhuǎn)發(fā)微博,模型從伯努利分布中抽取參數(shù)確定的多項(xiàng)式分布,抽樣出當(dāng)前單詞所屬主題;對(duì)原創(chuàng)微博,則使用LDA模型生成,然后使用吉布斯抽樣得出模型參數(shù),最終獲得微博語料上的話題分布。

    黃波[6]針對(duì)微博的結(jié)構(gòu)和內(nèi)容特點(diǎn),利用LDA模型提取文本隱含主題,同時(shí)使用VSM計(jì)算文本向量的特征權(quán)重,并在計(jì)算文本相似度階段,通過實(shí)驗(yàn)確定兩種模型得出的相似度進(jìn)行線性疊加權(quán)重,最后通過兩層聚類得出微博話題。

    鄭磊[7]為了解決LDA模型需要預(yù)先確定話題個(gè)數(shù)而難以擬合微博話題分布的問題,選擇設(shè)定較大的話題數(shù),然后利用層次聚類算法需事先確定類別個(gè)數(shù)的特點(diǎn),對(duì)LDA的輸出進(jìn)行聚類,同時(shí)引入互信息度量微博話題詞之間的依存關(guān)系,使得模型能夠動(dòng)態(tài)地由話題詞的相關(guān)性生成話題。

    路榮等[8]提出的微博新聞話題發(fā)現(xiàn)方法,首先利用LDA得出主題-文檔分布,然后在每個(gè)時(shí)間窗口內(nèi)根據(jù)新聞的特點(diǎn)給單義詞單元評(píng)分,并對(duì)每個(gè)微博中單義詞單元得分累加得到的總分排序,獲得若干可能的新聞微博。接著用K均值和層次聚類的兩層聚類,對(duì)選取的微博文本進(jìn)行聚類,從而檢測(cè)出新聞話題。該方法能有效解決微博文本的稀疏性問題,具有良好的擴(kuò)展性。endprint

    謝昊等[9]通過對(duì)原創(chuàng)和轉(zhuǎn)發(fā)兩種類型的微博結(jié)構(gòu)和內(nèi)容分析,得出原創(chuàng)微博主題由微博本身確定,而轉(zhuǎn)發(fā)微博主題由轉(zhuǎn)發(fā)的原創(chuàng)微博內(nèi)容確定的結(jié)論。提出了基于LDA主題模型的RT-LDA模型,從作者的主題分布中抽取原創(chuàng)微博主題,并將溯源到的最終的原創(chuàng)微博主題作為轉(zhuǎn)發(fā)微博的主題,并采用吉布斯抽樣法推導(dǎo)模型參數(shù),最終得出微博的主題和用戶的主題分布。

    劉嘉等[10]針對(duì)微博中新詞不斷出現(xiàn),傳統(tǒng)模型無法對(duì)新詞相關(guān)的話題有效建模的問題,提出首先使用經(jīng)過標(biāo)準(zhǔn)語料庫訓(xùn)練各層隱馬爾科夫模型的CHMM(Cascaded Hidden Markov Model,層疊隱馬爾科夫模型)發(fā)現(xiàn)新詞,然后使用微博語料和更新過的詞典作為L(zhǎng)DA模型輸入的改進(jìn)LDA模型。該模型能夠使社交網(wǎng)絡(luò)環(huán)境下的話題檢測(cè)結(jié)果更加準(zhǔn)確全面。

    李衛(wèi)疆等[11]為了解決傳統(tǒng)話題模型無法對(duì)稀疏的短文本有效建模的問題,使用BTM模型將微博文本轉(zhuǎn)換為詞對(duì)形式,以獲取微博語料庫上的話題分布,并使用吉布斯抽樣推導(dǎo)模型參數(shù),最后進(jìn)行K-means聚類以獲取區(qū)分度良好的話題。在新浪微博數(shù)據(jù)集上的實(shí)驗(yàn)表明,該模型話題檢測(cè)的F值優(yōu)于LDA模型。

    郭藍(lán)天等[12]為了解決微博數(shù)據(jù)集的高維性及主題不明確問題,提出結(jié)合CBOW神經(jīng)網(wǎng)絡(luò)語言模型和LDA主題模型的CBOW-LDA主題建模方法。模型首先使用CBOW(Continuous Bag-of-Word,連續(xù)詞袋模型)得出詞向量,然后對(duì)相似度大于相似度閾值的詞語進(jìn)行聚類,接著從相似詞聚類中抽取詞語替換詞表和語料中的其它項(xiàng),接著將處理過的詞表和語料作為L(zhǎng)DA主題模型的輸入進(jìn)行話題檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該話題檢測(cè)方法能有效降低LDA模型的困惑度。該模型能夠發(fā)現(xiàn)詞項(xiàng)之間的相關(guān)關(guān)系,但是不能有效處理一詞多義問題,同時(shí)相似度閾值的選擇缺乏說服力。

    2 基于GV-LDA的話題檢測(cè)

    2.1 GV-LDA算法框架

    本文針對(duì)CBOW-LDA中存在的問題,提出GV-LDA模型,其核心思想是結(jié)合一詞多義通常與詞性相關(guān)的實(shí)際情況,首先對(duì)微博語料進(jìn)行標(biāo)注,然后使用較CBOW模型更為快速高效的GloVe模型(Global Vector,全局向量模型)進(jìn)行詞表示,分別在多個(gè)相似度閾值下對(duì)相似度大于閾值且詞性相同的詞進(jìn)行聚類,接著從相似詞聚類中抽取頻率最大的詞語替換詞表和語料中同一簇的其它項(xiàng),以降低LDA模型的處理維度。將處理過的詞表和語料作為L(zhǎng)DA主題模型的輸入進(jìn)行話題檢測(cè),過程如圖1所示。

    2.2 文本向量化

    GloVe語言模型是J Pennington等[13]于2014年提出的一種基于全局log-bilinear的語言模型,它結(jié)合了整體矩陣分解和局部?jī)?nèi)容窗口的優(yōu)點(diǎn),通過訓(xùn)練非零元素的詞共生矩陣,有效利用統(tǒng)計(jì)信息,產(chǎn)生一個(gè)具有意義子結(jié)構(gòu)的向量空間。通過詞向量在多個(gè)維度上的差異表示詞項(xiàng)在語義上的相似度。

    Pennington通過實(shí)驗(yàn)表明,詞向量學(xué)習(xí)更合適的起始點(diǎn)應(yīng)該是詞共現(xiàn)概率之比而非詞共現(xiàn)概率本身。使用X表示詞共現(xiàn)計(jì)數(shù),Xij表示詞j在詞i的上下文中出現(xiàn)的次數(shù),wi表示詞i的詞向量,j為另一個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)例生成的獨(dú)立的上下文詞向量。詞向量與共現(xiàn)矩陣統(tǒng)計(jì)量的關(guān)系可以表示為:

    式(1)結(jié)合了多個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)例并對(duì)其進(jìn)行合并,可以降低過擬合和噪聲,一般情況下可改進(jìn)結(jié)果。wi為目標(biāo)詞向量,j為另一個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)例生成的獨(dú)立的上下文詞向量。詞i、詞j在彼此的上下文窗口內(nèi),角色可互換,加入兩個(gè)詞向量的偏移量bi,j,以保證方程的對(duì)稱性。方程右側(cè)是對(duì)窗口內(nèi)全局共現(xiàn)的統(tǒng)計(jì),對(duì)方程(1)進(jìn)行因式分解,得到的詞向量既包含全局統(tǒng)計(jì)信息又包含局部上下文信息。

    低頻詞共現(xiàn)通常為噪聲,相比高頻詞共現(xiàn)攜帶較少的信息。移除頻率低于閾值的詞共現(xiàn)可有效減少詞匯表大小。詞向量的目標(biāo)是避免常用詞權(quán)重過大。

    通過把式(1)轉(zhuǎn)化為一個(gè)最小平方問題并引入權(quán)重函數(shù)f(Xij),可以有效解決上述問題。加權(quán)最小平方回歸模型為

    對(duì)模型進(jìn)行優(yōu)化即得詞向量。

    2.3 文本模型表示

    LDA主題模型是包含文檔-主題-詞語3層的貝葉斯模型,在這個(gè)模型中,文檔被建模為主題潛在集合上的有限混合,而主題則建模為主題概率潛在集合上的無限混合。在LDA模型中使用吉布斯抽樣得出模型參數(shù)后,便可由生成規(guī)則得到文-主題分布和主題-詞分布。文本和主題的生成規(guī)則得到文本的主題結(jié)構(gòu)。GV-LDA中LDA模型的輸入是經(jīng)過相似詞聚類的文檔和詞表,降低了LDA主題模型的處理維度,使得待檢測(cè)的主題更加明確。

    LDA主題模型采用概率的產(chǎn)生式模型對(duì)文本進(jìn)行建模,每篇文本是由服從參數(shù)為θ多項(xiàng)式分布的主題混合而成,θ滿足參數(shù)為α的對(duì)稱狄利克雷先驗(yàn)分布;每個(gè)主題又是由服從參數(shù)為φ多項(xiàng)式分布的詞匯混合而成,φ滿足參數(shù)為β的對(duì)稱狄利克雷先驗(yàn)分布。

    一個(gè)文本中所有單詞與其所屬主題的聯(lián)合概率分布如式(8)所示:

    LDA生成文本的過程見圖2。①從主題的狄利克雷先驗(yàn)Dirichlet(β)中為每個(gè)主題t_i抽取多項(xiàng)式分布Multi(φ);②從文檔的狄利克雷先驗(yàn)Dirichlet(α)中為每個(gè)文檔dm抽取多項(xiàng)式分布Multi(θ);③對(duì)語料庫中所有文檔dm和文檔中所有詞匯wn:從多項(xiàng)式分布Multi(φ)中抽取主題tk;從多項(xiàng)式分布Multi(θ)中抽取詞wn。

    LDA建模的目的是求得參數(shù)θ和φ的值,進(jìn)而得出文本-主題分布和主題-詞分布??梢允褂肎ibbs抽樣構(gòu)造收斂于目標(biāo)概率分布的Markov鏈并從中抽取樣本估算參數(shù)。

    Gibbs Sampling每次選取概率向量的一個(gè)維度,給定其它維度的變量值抽樣得到當(dāng)前維度的值。隨著迭代的進(jìn)行,Gibbs Sampling對(duì)參數(shù)的改變?cè)絹碓叫。ǔ_x取一定的迭代次數(shù)作為循環(huán)終止條件,Gibbs Sampling過程如圖3所示。endprint

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 評(píng)價(jià)指標(biāo)

    采用的評(píng)價(jià)指標(biāo)包括文本及常用的困惑度和準(zhǔn)確率、召回率、F1指標(biāo)。

    困惑度Perplex是用于生成測(cè)試數(shù)據(jù)集的詞表大小的期望值,困惑度越小,表明語言模型吻合度越好。

    式(9)中,wm為測(cè)試集文檔m中可觀測(cè)到的單詞,p(wm)表示模型產(chǎn)生文本wm的概率,Nm為文檔m的詞項(xiàng)數(shù)。

    準(zhǔn)確率p指文本分類正確的樣本數(shù)與所有分類文本數(shù)的比值:

    召回率r是文本分類正確的樣本數(shù)與該類的實(shí)際文本數(shù)比值:

    式(10)、(11)中,a是正確分類的樣本數(shù),b是不屬于該類但劃分到該類的樣本數(shù),c是屬于該類但未劃分到該類的樣本數(shù)。

    3.2 數(shù)據(jù)集

    本文采用的數(shù)據(jù)集為新浪關(guān)鍵詞語料,包含30個(gè)主題,共211 413個(gè)json文件,其中的漢字表示為16進(jìn)制的unicode編碼,以u(píng)XXXX(X表示十六進(jìn)制數(shù)字)的形式出現(xiàn)。文件編碼為UTF-8無BOM。文件包含以“#”的話題信息、用戶鏈接、用戶名、轉(zhuǎn)發(fā)列表、用戶發(fā)布內(nèi)容的ID(mid)、用戶發(fā)布的內(nèi)容及發(fā)布時(shí)間等信息,其中轉(zhuǎn)發(fā)列表包括各轉(zhuǎn)發(fā)用戶的用戶名、轉(zhuǎn)發(fā)內(nèi)容、轉(zhuǎn)發(fā)字符串、轉(zhuǎn)發(fā)時(shí)間和轉(zhuǎn)發(fā)用戶的用戶鏈接。轉(zhuǎn)發(fā)用戶的轉(zhuǎn)發(fā)內(nèi)容為轉(zhuǎn)發(fā)時(shí)的評(píng)論,默認(rèn)為“轉(zhuǎn)發(fā)微博”。轉(zhuǎn)發(fā)用戶的轉(zhuǎn)發(fā)字符串為轉(zhuǎn)發(fā)用戶的用戶名加上轉(zhuǎn)發(fā)內(nèi)容、點(diǎn)贊信息、轉(zhuǎn)發(fā)時(shí)間及轉(zhuǎn)發(fā)用戶的客戶端信息。轉(zhuǎn)發(fā)評(píng)論非默認(rèn)內(nèi)容的,視為統(tǒng)一話題下的新微博。

    3.3 數(shù)據(jù)集預(yù)處理

    數(shù)據(jù)集本身包含的是原始微博數(shù)據(jù),在使用模型分析之前需要進(jìn)行預(yù)處理:編碼轉(zhuǎn)換、去除標(biāo)記、分詞、標(biāo)注、去低頻詞。其中停用詞出現(xiàn)頻率高但攜帶的語義信息較少,而低頻詞學(xué)習(xí)的向量置信度不高。通過編碼轉(zhuǎn)換取得微博內(nèi)容,去除不可解讀的文件,得到11 246個(gè)json。

    3.4 實(shí)驗(yàn)步驟與參數(shù)設(shè)置

    去除微博標(biāo)記后,使用LTP進(jìn)行分詞和標(biāo)注,再依據(jù)詞項(xiàng)的頻率去低頻詞,低頻詞的閾值為5。在不同的相似度條件下比較CBOW-LDA和GV-LDA的Perplexity。詞向量聚類中相似度的取值范圍為0.7~0.95,間距為0.05.Word2Vec、GloVe、LDA的參數(shù)設(shè)置見表1、表2、表3。

    3.5 實(shí)驗(yàn)結(jié)果與分析

    在相同的參數(shù)設(shè)置和語料下,通過計(jì)算不同相似度閾值時(shí)的困惑度度量GV-LDA和CBOW-LDA模型的處理效果。兩種方法困惑度隨相似度的變化情況如圖4所示。

    可以看出,模型的困惑度隨相似度閾值的增加先減少后增加,GV-LDA的困惑度在0.8~0.9范圍內(nèi)優(yōu)于CBOW-LDA,且在相似度閾值為0.8時(shí),GV-LDA模型取得最小困惑度。

    取相似度閾值為0.8,對(duì)詞表聚類后,詞表大小由原來的324 438減少到63 725,有效減少了LDA階段的運(yùn)算時(shí)間。LDA階段取相同參數(shù),分別使用GV-LDA和Gibbs-LDA進(jìn)行話題檢測(cè)。GV-LDA和Gibbs-LDA++在30個(gè)主題上進(jìn)行話題檢測(cè)的準(zhǔn)確率如圖5所示,其中GV-LDA的平均準(zhǔn)確率為77.69%,Gibbs-LDA++的平均準(zhǔn)確率為70.51%。

    GV-LDA和Gibbs-LDA++在30個(gè)主題上進(jìn)行話題檢測(cè)的召回率如圖6所示,其中GV-LDA的平均召回率為77.09%,Gibbs-LDA++的平均召回率為69.24%。

    根據(jù)之前得出的準(zhǔn)確率和召回率,計(jì)算GV-LDA和Gibbs-LDA++在30個(gè)主題上進(jìn)行話題檢測(cè)的F值如圖7所示,其中GV-LDA的平均F值為77.35%,Gibbs-LDA++的平均F值為69.79%。

    從結(jié)果可以看出,本文GV-LDA方法的處理結(jié)果較Gibbs-LDA++有明顯改善,雖然額外的GloVe階段耗時(shí)較長(zhǎng),但相似詞分析可以使用維基中文語料等通用語料,復(fù)用性強(qiáng),因此GV-LDA方法實(shí)用價(jià)值很高。

    4 結(jié)語

    本文針對(duì)微博中短文本信息的特點(diǎn),將文本深度表示模型的GloVe方法與LDA主題模型結(jié)合進(jìn)行文本建模,將文本向量化表示,然后對(duì)LDA模型的輸入進(jìn)行文本向量聚類。通過比較不同閾值下的GV-LDA和CBOW-LDA模型的困惑度,得出GV-LDA能有效減少話題檢測(cè)中困惑度的結(jié)論,并得出最佳相似度閾值。通過與LDA模型在準(zhǔn)確率、召回率、F值等指標(biāo)上的對(duì)比,顯示該模型與LDA比較在話題檢測(cè)方面有較大改進(jìn)。

    參考文獻(xiàn):

    [1] HOFMANN T. Probabilistic latent semantic indexing[C].Proc of the 22nd Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 1999:50-57.

    [2] BLEI D M, NG A Y, JORDAN M I. Lantent Dirichlet Allocation[J]. The Journal of Machine Learning Research, 2003(3): 993-1022.

    [3] GRIFFITHS T L, STEYVERS M. Finding scientific topics.[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101 (1):5228-5229.

    [4] 孫勝平.中文微博客人電話檢測(cè)與跟蹤技術(shù)研究[D].北京:北京交通大學(xué),2011.

    [5] 張晨逸,孫建伶,丁軼群.基于MB-LDA模型的微博主題挖掘[J].計(jì)算機(jī)研究與發(fā)展,2011,48(10):1795-1802.

    [6] 黃波.基于向量空間模型和LDA模型相結(jié)合的微博客話題發(fā)現(xiàn)算法研究[D].成都:西南交通大學(xué),2011.

    [7] 鄭磊.微博客話題檢測(cè)的研究與實(shí)現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2012.

    [8] 路榮,項(xiàng)亮,劉明榮,等.基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J].模式識(shí)別與人工智能,2012,25(3):382-387.

    [9] 謝昊,江紅.一種面向微博主題挖掘的改進(jìn)LDA模型[J].華東師范大學(xué)學(xué)報(bào):自然科學(xué)版,2013(6):93-101.

    [10] 劉嘉,王慶林,劉禹,等.一種適合社交網(wǎng)絡(luò)的短文本主題發(fā)現(xiàn)方法[C]. 中國控制會(huì)議 , 2014.

    [11] 李衛(wèi)疆,王真真,余正濤.基于BTM和K-means的微博話題檢測(cè)[J].計(jì)算機(jī)科學(xué),2017(2):257-261.

    [12] 郭藍(lán)天,李揚(yáng),慕德俊,等.一種基于LDA主題模型的話題發(fā)現(xiàn)方法[J].西北工業(yè)大學(xué)學(xué)報(bào),2016,34(4):698-702.

    [13] J PENNINGTON,R SOCHER,C MANNING. Glove: global vectors for word representation[C]. Conference on Empirical Methods in Natural Language Processing, 2014:1532-1543.endprint

    猜你喜歡
    微博
    青少年數(shù)字素養(yǎng)的社會(huì)與文化內(nèi)涵及其教育啟示
    基于社交網(wǎng)絡(luò)的英語互動(dòng)微平臺(tái)建設(shè)
    新浪微博的“語—圖”互文分析
    基于Redis的微博系統(tǒng)基本功能設(shè)計(jì)
    “985工程”高校圖書館閱讀推廣的調(diào)查與分析
    微信與微博平臺(tái)謠言差異分析
    打造醫(yī)院里的“主流媒體”
    事實(shí)與流言的博弈
    人間(2016年26期)2016-11-03 18:19:04
    基于微博營銷的企業(yè)推廣模式研究
    重大突發(fā)事件中微博之力不微
    人民論壇(2016年27期)2016-10-14 13:08:58
    啦啦啦视频在线资源免费观看| 久久久欧美国产精品| 性高湖久久久久久久久免费观看| 国产真实伦视频高清在线观看| xxx大片免费视频| 好男人视频免费观看在线| 亚洲精品中文字幕在线视频 | 欧美丝袜亚洲另类| 国产又色又爽无遮挡免| 日产精品乱码卡一卡2卡三| 国产亚洲91精品色在线| 最近手机中文字幕大全| 老女人水多毛片| 性高湖久久久久久久久免费观看| 精品一区二区免费观看| 我要看黄色一级片免费的| 99久久人妻综合| 九草在线视频观看| 搡女人真爽免费视频火全软件| 亚洲精品久久午夜乱码| 精品99又大又爽又粗少妇毛片| 伦精品一区二区三区| 久久99精品国语久久久| 激情 狠狠 欧美| 国产美女午夜福利| 久久这里有精品视频免费| 永久免费av网站大全| 在线观看三级黄色| 成年人午夜在线观看视频| 少妇精品久久久久久久| 国产精品一区二区性色av| 国产精品国产三级国产av玫瑰| av在线播放精品| 建设人人有责人人尽责人人享有的 | 三级经典国产精品| 一级毛片 在线播放| 91精品国产国语对白视频| 欧美成人精品欧美一级黄| 麻豆成人av视频| 久久久午夜欧美精品| 国国产精品蜜臀av免费| 水蜜桃什么品种好| 午夜免费观看性视频| 1000部很黄的大片| 国产高清国产精品国产三级 | 日韩中字成人| 日韩欧美精品免费久久| 精品亚洲成a人片在线观看 | 美女视频免费永久观看网站| 黄色配什么色好看| 日韩伦理黄色片| 国产高清有码在线观看视频| 久久精品国产a三级三级三级| h日本视频在线播放| 精品国产三级普通话版| 日韩免费高清中文字幕av| av在线app专区| 国产男女超爽视频在线观看| 777米奇影视久久| 一本一本综合久久| 18+在线观看网站| 国产爱豆传媒在线观看| 日本猛色少妇xxxxx猛交久久| 一本一本综合久久| 人妻 亚洲 视频| 中文天堂在线官网| 国产精品免费大片| 亚洲欧美中文字幕日韩二区| 国产精品国产av在线观看| 久久久亚洲精品成人影院| 国产精品三级大全| 美女视频免费永久观看网站| 高清午夜精品一区二区三区| xxx大片免费视频| 精品一区二区三区视频在线| 中文资源天堂在线| 日韩不卡一区二区三区视频在线| 在现免费观看毛片| 国产午夜精品一二区理论片| 一区在线观看完整版| 一区二区三区四区激情视频| 如何舔出高潮| 老司机影院毛片| 国产精品国产三级国产av玫瑰| 大香蕉97超碰在线| 国产成人午夜福利电影在线观看| av国产免费在线观看| 日本爱情动作片www.在线观看| 欧美成人精品欧美一级黄| 大香蕉久久网| 亚洲精品乱久久久久久| 亚洲精品第二区| 欧美老熟妇乱子伦牲交| 五月伊人婷婷丁香| 毛片女人毛片| 日韩欧美一区视频在线观看 | 亚洲欧洲日产国产| 免费看av在线观看网站| h日本视频在线播放| 成人国产av品久久久| 欧美少妇被猛烈插入视频| 亚洲精品第二区| 人妻一区二区av| 亚洲天堂av无毛| 嫩草影院入口| 国产淫语在线视频| 亚洲精品日韩av片在线观看| 97热精品久久久久久| 国产高清三级在线| 自拍偷自拍亚洲精品老妇| 少妇裸体淫交视频免费看高清| 免费看av在线观看网站| 高清午夜精品一区二区三区| 一级a做视频免费观看| 国产中年淑女户外野战色| 日日摸夜夜添夜夜添av毛片| 亚洲伊人久久精品综合| 色婷婷久久久亚洲欧美| 伊人久久精品亚洲午夜| 久久久久视频综合| a 毛片基地| 色5月婷婷丁香| 久久精品国产自在天天线| 丰满少妇做爰视频| 国产精品国产av在线观看| 日本av免费视频播放| 免费观看无遮挡的男女| 亚洲国产毛片av蜜桃av| 久久99蜜桃精品久久| 国产av国产精品国产| 直男gayav资源| 在线看a的网站| 啦啦啦在线观看免费高清www| 日韩 亚洲 欧美在线| 日日摸夜夜添夜夜添av毛片| 18禁裸乳无遮挡动漫免费视频| av女优亚洲男人天堂| 午夜免费男女啪啪视频观看| 日本wwww免费看| 国产老妇伦熟女老妇高清| 中文资源天堂在线| 亚洲精品乱久久久久久| 免费看av在线观看网站| 亚洲欧美精品自产自拍| 黄色怎么调成土黄色| 亚洲精品国产av蜜桃| 熟女电影av网| 国产高清国产精品国产三级 | 亚州av有码| 欧美精品亚洲一区二区| 国产精品一区二区三区四区免费观看| 国产亚洲欧美精品永久| 国产精品伦人一区二区| 国产熟女欧美一区二区| 欧美一区二区亚洲| 亚洲人成网站高清观看| 中文欧美无线码| 国产免费一区二区三区四区乱码| a级一级毛片免费在线观看| 亚洲真实伦在线观看| 免费观看无遮挡的男女| 欧美变态另类bdsm刘玥| 少妇人妻 视频| 久久久久网色| 性高湖久久久久久久久免费观看| 男女国产视频网站| 久久久久久人妻| 亚洲欧美精品自产自拍| 校园人妻丝袜中文字幕| 久久国产精品男人的天堂亚洲 | av线在线观看网站| 亚洲精品久久久久久婷婷小说| 亚洲aⅴ乱码一区二区在线播放| 观看免费一级毛片| 一区二区三区精品91| 久久韩国三级中文字幕| 午夜视频国产福利| 久久久久久伊人网av| 水蜜桃什么品种好| 99视频精品全部免费 在线| 免费av中文字幕在线| 国产精品蜜桃在线观看| 国产乱人视频| 久久国产亚洲av麻豆专区| 国产一区有黄有色的免费视频| 亚洲av国产av综合av卡| 欧美成人一区二区免费高清观看| 亚洲国产精品999| 国产成人91sexporn| 水蜜桃什么品种好| 国产熟女欧美一区二区| 国产av国产精品国产| 欧美97在线视频| 亚洲美女黄色视频免费看| 王馨瑶露胸无遮挡在线观看| 国产成人一区二区在线| 大片电影免费在线观看免费| 亚洲美女搞黄在线观看| 中文字幕av成人在线电影| 亚洲色图综合在线观看| 小蜜桃在线观看免费完整版高清| 日韩制服骚丝袜av| 简卡轻食公司| 精品国产露脸久久av麻豆| 狂野欧美激情性xxxx在线观看| 午夜精品国产一区二区电影| 日产精品乱码卡一卡2卡三| 欧美xxxx黑人xx丫x性爽| 欧美变态另类bdsm刘玥| 国产精品人妻久久久影院| 欧美zozozo另类| 夜夜爽夜夜爽视频| 成人黄色视频免费在线看| 亚洲国产最新在线播放| 日本黄色日本黄色录像| 男女国产视频网站| 国产亚洲av片在线观看秒播厂| 欧美亚洲 丝袜 人妻 在线| 一区二区三区免费毛片| 十八禁网站网址无遮挡 | 日本一二三区视频观看| 成人免费观看视频高清| 偷拍熟女少妇极品色| 国产色爽女视频免费观看| 日本av免费视频播放| 一本久久精品| 亚洲在久久综合| 久久人人爽人人爽人人片va| 极品教师在线视频| 免费人妻精品一区二区三区视频| 男人爽女人下面视频在线观看| 久久鲁丝午夜福利片| 欧美3d第一页| 亚洲精品,欧美精品| 美女内射精品一级片tv| 国产成人一区二区在线| 成人特级av手机在线观看| av在线app专区| 少妇人妻一区二区三区视频| 丝袜脚勾引网站| 亚洲成色77777| 丰满迷人的少妇在线观看| 久久精品国产亚洲av天美| 午夜日本视频在线| 精品一区二区三区视频在线| 在线天堂最新版资源| 超碰av人人做人人爽久久| 国产一区有黄有色的免费视频| 精华霜和精华液先用哪个| 亚洲欧美一区二区三区国产| 制服丝袜香蕉在线| 午夜老司机福利剧场| 亚洲在久久综合| 精品久久国产蜜桃| 成人美女网站在线观看视频| 久久久久久伊人网av| 亚洲精品中文字幕在线视频 | 精品国产一区二区三区久久久樱花 | 国产成人aa在线观看| 欧美最新免费一区二区三区| 超碰av人人做人人爽久久| 免费人成在线观看视频色| 国内揄拍国产精品人妻在线| 国产中年淑女户外野战色| 精品熟女少妇av免费看| 欧美成人a在线观看| 中国美白少妇内射xxxbb| 中文精品一卡2卡3卡4更新| 中文字幕制服av| 亚洲精品乱久久久久久| 国产成人aa在线观看| 国产熟女欧美一区二区| 美女内射精品一级片tv| 伊人久久精品亚洲午夜| 久久人人爽av亚洲精品天堂 | 中国国产av一级| 亚洲三级黄色毛片| 亚洲精品色激情综合| 亚洲精品国产av蜜桃| 只有这里有精品99| 国产精品一区www在线观看| 全区人妻精品视频| 亚洲婷婷狠狠爱综合网| 三级经典国产精品| 少妇猛男粗大的猛烈进出视频| 18+在线观看网站| 中文精品一卡2卡3卡4更新| 精品亚洲乱码少妇综合久久| 国产精品av视频在线免费观看| 亚洲精品成人av观看孕妇| 天堂中文最新版在线下载| 六月丁香七月| 女人久久www免费人成看片| 永久网站在线| 亚洲,一卡二卡三卡| 人人妻人人看人人澡| 97超视频在线观看视频| 国产爽快片一区二区三区| 黄片无遮挡物在线观看| 在现免费观看毛片| 亚洲av日韩在线播放| av国产久精品久网站免费入址| 国产探花极品一区二区| 91久久精品国产一区二区三区| 久久久久久久亚洲中文字幕| av免费在线看不卡| 亚洲精品一区蜜桃| 菩萨蛮人人尽说江南好唐韦庄| 女的被弄到高潮叫床怎么办| 国产真实伦视频高清在线观看| 99热6这里只有精品| 国产免费福利视频在线观看| av不卡在线播放| 老司机影院毛片| 高清不卡的av网站| 日韩,欧美,国产一区二区三区| 我要看日韩黄色一级片| 午夜视频国产福利| 国产亚洲最大av| 国产色婷婷99| 啦啦啦在线观看免费高清www| 在线观看人妻少妇| 一本色道久久久久久精品综合| 亚洲精品乱码久久久v下载方式| 精华霜和精华液先用哪个| 亚洲国产成人一精品久久久| 日本av免费视频播放| 少妇 在线观看| 久久热精品热| 久久久久国产精品人妻一区二区| 亚洲av国产av综合av卡| 水蜜桃什么品种好| 亚洲精品日韩在线中文字幕| 亚洲精品成人av观看孕妇| 久久热精品热| 99热6这里只有精品| 国内少妇人妻偷人精品xxx网站| 日韩亚洲欧美综合| 三级国产精品欧美在线观看| 五月天丁香电影| 制服丝袜香蕉在线| 麻豆成人午夜福利视频| 精品人妻偷拍中文字幕| 97精品久久久久久久久久精品| 欧美精品人与动牲交sv欧美| 一区二区三区免费毛片| 欧美区成人在线视频| 毛片一级片免费看久久久久| 夫妻性生交免费视频一级片| 日韩免费高清中文字幕av| 欧美区成人在线视频| av国产久精品久网站免费入址| 成人亚洲精品一区在线观看 | 国产成人a区在线观看| 99热网站在线观看| 国产 一区 欧美 日韩| 国产精品秋霞免费鲁丝片| 免费黄网站久久成人精品| 最黄视频免费看| 极品教师在线视频| 亚洲欧美成人综合另类久久久| 在线亚洲精品国产二区图片欧美 | 亚洲精品自拍成人| 99热这里只有是精品在线观看| 亚洲精品视频女| 久久久久网色| 亚洲激情五月婷婷啪啪| 建设人人有责人人尽责人人享有的 | 在线观看三级黄色| av专区在线播放| 国国产精品蜜臀av免费| 另类亚洲欧美激情| 一级二级三级毛片免费看| 另类亚洲欧美激情| 99久久精品热视频| 国产精品久久久久成人av| 成年女人在线观看亚洲视频| 欧美日韩在线观看h| 久久ye,这里只有精品| 水蜜桃什么品种好| 亚洲在久久综合| 精品午夜福利在线看| 国产乱来视频区| 欧美激情极品国产一区二区三区 | 精品一区在线观看国产| 一级av片app| 天堂中文最新版在线下载| 天堂8中文在线网| 日韩电影二区| 国产一区二区在线观看日韩| 在线 av 中文字幕| 日韩国内少妇激情av| 有码 亚洲区| 老师上课跳d突然被开到最大视频| 国产免费福利视频在线观看| 2021少妇久久久久久久久久久| 国产伦在线观看视频一区| 黑人猛操日本美女一级片| 日韩电影二区| 国产极品天堂在线| 国产精品女同一区二区软件| 老熟女久久久| 免费播放大片免费观看视频在线观看| 日本黄色片子视频| 亚洲一区二区三区欧美精品| 一区二区三区免费毛片| 91狼人影院| 七月丁香在线播放| 国产乱来视频区| 久久精品人妻少妇| 国产成人免费无遮挡视频| 久久精品国产亚洲网站| 日本欧美视频一区| 日本av免费视频播放| 在线免费十八禁| 亚洲欧美一区二区三区黑人 | 午夜福利网站1000一区二区三区| 18禁裸乳无遮挡动漫免费视频| 熟妇人妻不卡中文字幕| 亚洲精品视频女| 丝袜脚勾引网站| 欧美日韩综合久久久久久| 国产黄片视频在线免费观看| 人妻 亚洲 视频| 国产国拍精品亚洲av在线观看| 又黄又爽又刺激的免费视频.| www.色视频.com| 中文字幕免费在线视频6| 国产精品福利在线免费观看| 一级毛片我不卡| 波野结衣二区三区在线| 黄色怎么调成土黄色| 中国美白少妇内射xxxbb| 少妇的逼好多水| 久久精品熟女亚洲av麻豆精品| 亚洲自偷自拍三级| 一级av片app| 欧美精品一区二区免费开放| 人妻系列 视频| 日本免费在线观看一区| av在线播放精品| 亚洲在久久综合| 超碰av人人做人人爽久久| 欧美老熟妇乱子伦牲交| 免费av中文字幕在线| 亚洲av成人精品一区久久| 一本色道久久久久久精品综合| 婷婷色av中文字幕| 亚洲精品,欧美精品| 久久99热6这里只有精品| 在线看a的网站| 国产在视频线精品| 国产高清不卡午夜福利| 久久国产亚洲av麻豆专区| 欧美激情极品国产一区二区三区 | 在线免费观看不下载黄p国产| 性高湖久久久久久久久免费观看| 久久6这里有精品| 亚洲最大成人中文| 人人妻人人添人人爽欧美一区卜 | 亚洲精品视频女| 女性被躁到高潮视频| 偷拍熟女少妇极品色| 免费黄网站久久成人精品| 一区在线观看完整版| 妹子高潮喷水视频| 午夜福利在线在线| 伊人久久国产一区二区| 少妇丰满av| 纯流量卡能插随身wifi吗| 这个男人来自地球电影免费观看 | 婷婷色麻豆天堂久久| 97精品久久久久久久久久精品| 亚洲精品乱码久久久久久按摩| 亚洲av免费高清在线观看| 日本-黄色视频高清免费观看| 午夜福利影视在线免费观看| 欧美区成人在线视频| 最后的刺客免费高清国语| 亚洲成人av在线免费| 欧美成人一区二区免费高清观看| 成人亚洲精品一区在线观看 | 国产免费又黄又爽又色| 日韩中文字幕视频在线看片 | 国产亚洲欧美精品永久| 国产色婷婷99| 国产亚洲91精品色在线| 99re6热这里在线精品视频| 欧美成人一区二区免费高清观看| 亚洲激情五月婷婷啪啪| 欧美高清性xxxxhd video| 国产亚洲91精品色在线| 不卡视频在线观看欧美| 亚洲欧美清纯卡通| freevideosex欧美| av线在线观看网站| 丰满乱子伦码专区| 性高湖久久久久久久久免费观看| 亚洲国产精品成人久久小说| 亚洲天堂av无毛| 国产色爽女视频免费观看| 日韩强制内射视频| 网址你懂的国产日韩在线| 麻豆成人午夜福利视频| 欧美日韩精品成人综合77777| 一个人免费看片子| 久久综合国产亚洲精品| 欧美日韩一区二区视频在线观看视频在线| 99热全是精品| 国产成人免费观看mmmm| 蜜桃在线观看..| av卡一久久| 22中文网久久字幕| 中文字幕免费在线视频6| 一级片'在线观看视频| 久久久久久久久久成人| 国产在视频线精品| 街头女战士在线观看网站| 老熟女久久久| 国产亚洲最大av| 久久女婷五月综合色啪小说| 乱系列少妇在线播放| 男女下面进入的视频免费午夜| 日韩电影二区| 91精品国产国语对白视频| 日韩欧美 国产精品| 欧美日韩亚洲高清精品| 免费久久久久久久精品成人欧美视频 | 2022亚洲国产成人精品| 久久久久久久久久久丰满| 男女国产视频网站| 黑丝袜美女国产一区| 日韩 亚洲 欧美在线| 亚洲欧洲国产日韩| 国产伦精品一区二区三区四那| av在线播放精品| 国产高潮美女av| 18禁动态无遮挡网站| 国产亚洲欧美精品永久| 色综合色国产| 亚洲欧美一区二区三区国产| 久久99热这里只有精品18| 亚洲av中文字字幕乱码综合| 亚洲婷婷狠狠爱综合网| 免费高清在线观看视频在线观看| 国产亚洲av片在线观看秒播厂| 色哟哟·www| 中文资源天堂在线| av国产精品久久久久影院| 大陆偷拍与自拍| 麻豆成人午夜福利视频| 国产精品偷伦视频观看了| 狠狠精品人妻久久久久久综合| 久久久成人免费电影| 乱码一卡2卡4卡精品| 亚洲综合色惰| 免费黄频网站在线观看国产| 少妇的逼好多水| 在线播放无遮挡| 天美传媒精品一区二区| 看十八女毛片水多多多| videossex国产| 永久网站在线| 狂野欧美白嫩少妇大欣赏| 黄片无遮挡物在线观看| 久久久久久久国产电影| 亚洲综合色惰| 精品视频人人做人人爽| 美女xxoo啪啪120秒动态图| 黄色一级大片看看| 一区二区三区免费毛片| 1000部很黄的大片| 国产乱来视频区| 26uuu在线亚洲综合色| 新久久久久国产一级毛片| 免费久久久久久久精品成人欧美视频 | 天堂俺去俺来也www色官网| 久久国产乱子免费精品| 直男gayav资源| 又粗又硬又长又爽又黄的视频| 熟妇人妻不卡中文字幕| 十分钟在线观看高清视频www | 一级av片app| 亚洲av.av天堂| h视频一区二区三区| 99九九线精品视频在线观看视频| 久久久久国产网址| 少妇裸体淫交视频免费看高清| 人妻制服诱惑在线中文字幕| 18禁在线无遮挡免费观看视频| 肉色欧美久久久久久久蜜桃| 久久久久精品性色| 国产精品国产三级专区第一集| 欧美3d第一页| 国产精品秋霞免费鲁丝片| 精品久久久噜噜| 成人影院久久| 五月开心婷婷网| 国产精品熟女久久久久浪| 亚洲av中文av极速乱| 亚洲国产成人一精品久久久| 丰满人妻一区二区三区视频av| 欧美变态另类bdsm刘玥| 久久99热这里只频精品6学生| 精品国产一区二区三区久久久樱花 | 久久久久网色| 欧美日韩在线观看h| 新久久久久国产一级毛片| 97在线视频观看| 国产欧美亚洲国产| 毛片女人毛片| 免费人妻精品一区二区三区视频| 国产色婷婷99| 欧美成人一区二区免费高清观看| 成人黄色视频免费在线看|