• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于UR-LDA的微博主題挖掘

    2017-06-27 08:14:13趙海博
    關(guān)鍵詞:單詞文本用戶

    陳 陽,邵 曦,趙海博

    (1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003; 2.軟通動力信息技術(shù)有限公司,浙江 杭州 310000)

    基于UR-LDA的微博主題挖掘

    陳 陽1,邵 曦1,趙海博2

    (1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003; 2.軟通動力信息技術(shù)有限公司,浙江 杭州 310000)

    以微博為代表的社交網(wǎng)絡(luò)已經(jīng)成為用戶發(fā)布和獲取實時信息的重要手段,然而這些實時信息中很大一部分都是垃圾或者是冗余的信息。通過有效的手段,精準(zhǔn)地發(fā)現(xiàn)、組織和利用社交網(wǎng)絡(luò)海量短文本背后隱藏的有價值的信息,對微博中隱含主題的挖掘,具有較高的輿情監(jiān)控和商業(yè)推廣價值。盡管概率生成主題模型LDA(Latent Dirichlet Allocation)在主題挖掘方面已經(jīng)得到了廣泛的應(yīng)用,但由于微博短文本消息語義稀疏以及文本之間相互關(guān)聯(lián)等特點(diǎn),傳統(tǒng)的LDA模型并不能很好地對它進(jìn)行建模。為此,基于LDA模型,綜合考慮微博的文本關(guān)聯(lián)關(guān)系和聯(lián)系人關(guān)聯(lián)關(guān)系,提出了適用于處理微博用戶關(guān)系數(shù)據(jù)的UR-LDA模型,并采用吉布斯抽樣對模型進(jìn)行推導(dǎo)。真實數(shù)據(jù)集上的實驗結(jié)果表明,UR-LDA模型能有效地對微博進(jìn)行主題挖掘。

    微博;主題挖掘;UR-LDA;吉布斯抽樣

    1 概 述

    微博,微型博客(Micro Blog)的簡稱,是Web2.0時代興起的一種新型社交網(wǎng)絡(luò)形式,以其開放性、交互性、自由性和及時性而風(fēng)靡全球。微博基于用戶之間的關(guān)聯(lián)關(guān)系,構(gòu)建了一個海量信息分享、傳播和獲取的平臺。用戶可以通過網(wǎng)絡(luò),移動設(shè)備和其他客戶端軟件登錄微博,進(jìn)行短文本信息的實時獲取或更新。據(jù)新浪微博財報顯示,新浪微博日活躍用戶數(shù)(DAU)達(dá)到1.06億,在2016年第一分鐘發(fā)出去的微博信息高達(dá)883 536條。

    用戶通過微博網(wǎng)站構(gòu)建的平臺可以發(fā)布海量信息。但微博用戶人群構(gòu)成多樣,文本內(nèi)容口語化,主題隨意性強(qiáng),語法缺少規(guī)范。據(jù)統(tǒng)計發(fā)現(xiàn),超過50%的微博內(nèi)容為情感語錄、個人心情等,因此,微博文本噪聲占比高。在信息爆炸的時代,通過有效的手段從海量的短文本中挖掘出有效的主題信息就顯得尤為重要。優(yōu)質(zhì)的主題挖掘?qū)η楦蟹治鱿到y(tǒng)、輿情監(jiān)控系統(tǒng)以及大數(shù)據(jù)預(yù)警系統(tǒng)的發(fā)展具有極大的推動作用。

    傳統(tǒng)的微博主題挖掘算法按照其輸入數(shù)據(jù)的種類,主要分為以下三類:基于網(wǎng)絡(luò)關(guān)系的微博主題挖掘、基于用戶標(biāo)簽或文本內(nèi)容的微博主題挖掘、結(jié)合用戶文本內(nèi)容、網(wǎng)絡(luò)關(guān)系的微博主題挖掘。

    M.E.J.Newman等[1]提出的算法是基于網(wǎng)絡(luò)關(guān)系的社交網(wǎng)絡(luò)主題挖掘方法的典型代表。該算法認(rèn)為移除不同主題之間的連接邊就能較好地將社交網(wǎng)絡(luò)分割成不同的主題[1]。

    文獻(xiàn)[2]提取用戶標(biāo)簽,將各個用戶興趣特征向量化,最后對用戶興趣特征向量聚類進(jìn)行主題挖掘。在該算法中,用戶標(biāo)簽不完整及口語化會嚴(yán)重影響最終的聚類效果。

    文獻(xiàn)[3]利用一種正規(guī)化框架,結(jié)合用戶關(guān)系和用戶文本內(nèi)容進(jìn)行社交網(wǎng)絡(luò)主題挖掘。

    Blei等[4]提出了概率主題模型LDA,即“文檔—主題—詞”三層貝葉斯模型,為社交網(wǎng)絡(luò)主題挖掘提供了新的思路。

    汪進(jìn)祥[5]利用LDA主題模型與中文標(biāo)注相結(jié)合進(jìn)行微博話題挖掘。

    但是未經(jīng)修改,LDA主題模型一般適用于新聞等經(jīng)過初次加工的語料,而微博是短文本(字?jǐn)?shù)通常小于140),語義信息稀疏,噪聲大,文本語言口語化,極大地增加了對其主題挖掘的難度[6];另一方面,轉(zhuǎn)發(fā)型微博文本和對話型微博文本從形式上說明微博文本之間是相互關(guān)聯(lián)的,與傳統(tǒng)LDA模型假設(shè)文本之間相互獨(dú)立是矛盾的。以上特性說明微博主題挖掘不能簡單套用傳統(tǒng)的LDA模型?;贚DA,結(jié)合微博文本的特性,提出了一種適合中文微博主題挖掘模型UR-LDA。

    2 文本生成模型LDA

    2.1 LDA模型

    LDA主題模型繼承自LSA[7]和PLSA[8]方法,在文檔—單詞引入“主題”的概念,形成了“文檔—主題—詞”的三層貝葉斯模型[9]。在LDA模型中,文本m可以表示成多個主題的聯(lián)合分布,記為P(z),每個主題又是詞匯表中所有單詞上的概率分布,記為P(w|z)。因此,文本中每個單詞的概率分布為:

    (1)

    其中,K為主題個數(shù);i∈[1,Nm],Nm為數(shù)據(jù)集中所有單詞的個數(shù)。

    同時,LDA模型是一個完備的主題模型,詞語符合“詞袋模式”,即在文檔的生成過程中,不同詞語之間相互獨(dú)立,順序無關(guān),模型引入Dirichlet分布,只需要分別設(shè)置超參數(shù)α和β就可以表示文檔m與主題的關(guān)系θm以及主題k與詞語的關(guān)系φk,實現(xiàn)文檔—主題和主題—詞語之間參數(shù)的精簡。LDA模型的文本生成模型如圖1所示。

    (1)根據(jù)先驗參數(shù)為α的Dirichlet分布,隨機(jī)抽取每篇文檔的混合主題概率θm。

    (2)根據(jù)先驗參數(shù)為β的Dirichlet分布,隨機(jī)抽取各個詞語在主題k下出現(xiàn)的概率φk。

    (3)針對每篇文檔m中的每一個待生成的詞wm,n:

    ①根據(jù)θm抽取當(dāng)前單詞所代表的主題zm,n。

    ②根據(jù)p(wm,n|φk,zm,n)抽取具體的單詞wm,n。

    一個文本中所有單詞與其所屬主題的聯(lián)合概率分布,如式(2)所示:

    (2)

    2.2 吉布斯抽樣法

    吉布斯抽樣法是一種簡單的蒙特卡洛算法實現(xiàn),經(jīng)常用來進(jìn)行LDA模型概率推導(dǎo)。該方法的思想是[10]:對于已知概率分布π(x),x=(x1,x2,…,xn)(通常稱為目標(biāo)分布),如果π太過復(fù)雜以致不能直接從它抽樣,可以通過構(gòu)造一個非周期且不可約的馬爾可夫鏈來間接獲取樣本。由于模擬的數(shù)值可以被視作是來自目標(biāo)分布的獨(dú)立樣本,當(dāng)馬爾可夫鏈足夠長時,就可以用其穩(wěn)態(tài)分布來推斷π的重要特征。具體過程如下:

    3 微博主題挖掘

    3.1 微博生成模型UR-LDA

    從微博消息的發(fā)布形式可以看出,微博不同于一般文本,本身帶有表征文本之間關(guān)聯(lián)關(guān)系的信息,如:轉(zhuǎn)發(fā)型微博中含有“//@”,對話型微博含有“@”。其中,轉(zhuǎn)發(fā)型微博的文本內(nèi)容由當(dāng)前用戶和其他用戶發(fā)布原創(chuàng)微博共同組成,往往用于當(dāng)前用戶對轉(zhuǎn)發(fā)部分的評論,可以通過“//@”把原創(chuàng)部分和轉(zhuǎn)發(fā)部分隔離開來。例如,“好樣的!//@陳陽:林說會以馬努為榜樣,說會無視交易流言,已經(jīng)習(xí)慣了”。其中“//@”之前的是原創(chuàng)內(nèi)容,“//@”之后的轉(zhuǎn)發(fā)內(nèi)容,“@陳陽”表示轉(zhuǎn)發(fā)部分的作者是陳陽。轉(zhuǎn)發(fā)型微博的主題主要取決轉(zhuǎn)發(fā)部分而不取決于微博發(fā)布者,而且當(dāng)微博發(fā)布者原創(chuàng)部分的內(nèi)容不包含能夠表征任何有意義主題的詞時,可以將其忽略。對話型微博含有特定的提醒或者發(fā)送對象,如“@JeremyLin林書豪一直被你的精神鼓舞著,前進(jìn)著!”,“@JeremyLin林書豪”表示該條微博所要發(fā)送的對象是JeremyLin林書豪。這種類型的微博體現(xiàn)了微博文本聯(lián)系人之間的關(guān)聯(lián)關(guān)系。

    UR-LDA是在研究LDA的基礎(chǔ)上,綜合考慮微博文本關(guān)聯(lián)關(guān)系和聯(lián)系人關(guān)聯(lián)關(guān)系以及微博短文本特性,形成適合中文微博主題挖掘的模型。在UR-LDA模型中,一條微博如果是轉(zhuǎn)發(fā)微博,其主題由當(dāng)前用戶原創(chuàng)部分和轉(zhuǎn)發(fā)部分共同確定;如果是對話型微博,其主題由該條微博發(fā)送對象中所有與當(dāng)前微博相關(guān)的微博共同確定。其中發(fā)送對象中的相關(guān)微博是指,發(fā)送對象發(fā)布的,含有當(dāng)前微博關(guān)鍵字的微博。

    UR-LDA模型的參數(shù)介紹見表1。

    表1 模型符號定義說明

    續(xù)表1

    UR-LDA模型的貝葉斯網(wǎng)絡(luò)圖如圖2所示。

    圖2 UR-LDA模型

    (1)UR-LDA從參數(shù)為β的Dirichlet分布中抽取主題k與單詞的關(guān)系φk。

    (2)通過正則表達(dá)式[//\s*?@.*?:]過濾掉微博文本中與轉(zhuǎn)發(fā)相關(guān)的特殊字符,僅保留用戶原創(chuàng)部分和轉(zhuǎn)發(fā)部分。

    (3)針對包含“@”文本:

    ①通過正則表達(dá)式[@(.+?)\s+]找出該文本所有與“@對話對象名”相匹配的字符串,提取相應(yīng)的對話對象名并利用中科院的ICTCLAS提取當(dāng)前文本的關(guān)鍵字。

    ②遍歷①中所有的對話對象,找出每個對象發(fā)布的含有①中提取的關(guān)鍵字的微博。為降低微博短文本語義稀疏對主題挖掘效果的影響,將同一會話對象中找到的相關(guān)微博存入到一個文件中,作為一個新的文本。

    ③利用傳統(tǒng)的LDA模型,根據(jù)先驗參數(shù)為αur的Dirichlet分布,隨機(jī)抽?、谥懈鱾€會話對象的新文本的混合主題概率θmui,并對其求均值,記為θur,置πur為1(πur初始值為0)。θur的計算公式為:

    (3)

    其中,N為①中得到對話對象的總數(shù);θur為每個會話對象生成的新文本在各個主題上的概率分布。

    (4)判斷πur的取值,若πur=1,則將求得的θur賦給微博m與各個主題之間的關(guān)系θm;否則直接從參數(shù)為α的Dirichlet分布中抽取該微博m與各個主題之間的關(guān)系θm。整個微博集中,θm的概率分布為:

    (4)

    一條微博中,所有單詞與其所屬主題的聯(lián)合概率分布為:

    P(w,z|θm,β)=P(z|θm)P(w|z,β)

    (5)

    3.2 模型推導(dǎo)

    用Gibbs Sampling對UR-LDA模型進(jìn)行推導(dǎo),其過程如下:

    (1)利用歐拉公式對式(2)進(jìn)行展開:

    (6)

    (7)

    (2)對式(7)反復(fù)迭代,并對所有主題進(jìn)行抽樣,最終達(dá)到抽樣結(jié)果穩(wěn)定。由于抽取單詞和抽取主題都滿足多項式分布,θm和φk的結(jié)果分別如下:

    (8)

    (9)

    類似的,可以得到θmui:

    (10)

    對θmui求均值,得到θur:

    (11)

    至此,UR-LDA模型通過吉布斯抽樣求解出微博文本在各個主題上的概率分布θm以及每個主題在單詞上的概率分布φk。對整個微博集進(jìn)行分析,通過概率計算,就可以挖掘出單個微博文本最有可能屬于哪個主題,每個主題最具代表性的單詞。

    4 主題挖掘?qū)嶒?/h2>

    4.1 數(shù)據(jù)準(zhǔn)備

    4.1.1 新浪微博數(shù)據(jù)采集

    微博數(shù)據(jù)采集是微博主題挖掘的基礎(chǔ)。目前微博數(shù)據(jù)的獲取主要有兩種方式,即網(wǎng)絡(luò)爬蟲技術(shù)和新浪微博提供API接口獲取數(shù)據(jù),但這兩種方式都存在一定的問題。

    目前許多網(wǎng)頁都采用了Ajax[11]技術(shù),利用JavaScript動態(tài)生成網(wǎng)頁,爬蟲技術(shù)很難爬取到完整的網(wǎng)頁數(shù)據(jù)。由于微博平臺的不開放性,新浪對API的調(diào)用有諸多限制,使用微博開放的API接口的方式并不能滿足大規(guī)模數(shù)據(jù)需求的情況。因此,在實驗過程中,可以將兩者結(jié)合,在多臺機(jī)器上進(jìn)行采集,獲取大量完整的微博數(shù)據(jù)。最后將獲取到的微博數(shù)據(jù)進(jìn)行格式化,保存為json格式或者保存到關(guān)系型數(shù)據(jù)庫中。

    將網(wǎng)絡(luò)爬蟲技術(shù)和新浪微博API接口獲取數(shù)據(jù)方式進(jìn)行結(jié)合,共獲取1 894個新浪微博用戶214 870條微博數(shù)據(jù),將這些數(shù)據(jù)存入MySQL數(shù)據(jù)庫作為實驗數(shù)據(jù),利用UR-LDA模型對其建模。

    4.1.2 數(shù)據(jù)預(yù)處理

    在獲得原始數(shù)據(jù)后,通常需要進(jìn)行數(shù)據(jù)預(yù)處理,提高數(shù)據(jù)的可靠性。實驗室針對中文微博的主題挖掘,通過以下步驟優(yōu)化數(shù)據(jù)源。

    (1)去掉微博文本中不能體現(xiàn)任何有意義主題的文本,如不包含任何漢字的文本。

    (2)通過正則表達(dá)式[//\s*?@.*?:]過濾掉微博文本中與轉(zhuǎn)發(fā)相關(guān)的特殊字符。

    (3)對微博文本長度小于10的微博進(jìn)行刪除。

    (4)通過正則表達(dá)式[@(.+?)\s+]取出微博文本所有會話聯(lián)系人,以“@[會話聯(lián)系人1,會話聯(lián)系人2,…,會話聯(lián)系人n]”的形式寫在當(dāng)前微博文本的前面,并以空格將兩者隔開。

    (5)設(shè)置白名單詞典、用戶詞典及停用詞表。

    白名單詞典[12]是為了防止一些有意義的詞被當(dāng)成噪聲而設(shè)置的,如:KTV。

    用戶詞典是為了防止一些人名和固定詞被無意義分割而設(shè)計的,如“成龍”。

    停用詞是指沒有實際主題含義的詞,如“十分”、“非?!薄ⅰ疤貏e”等。設(shè)計停用詞表,主要是為了去除微博文本中的停用詞。

    (6)通過ICTCLAS[13]進(jìn)行分詞處理,過濾掉微博中不屬于白名單詞典的所有單個漢字,非漢字詞語,停用詞,地點(diǎn)以及特殊字符等影響主題挖掘?qū)嶒灥脑~。

    4.1.3 實驗環(huán)境

    實驗環(huán)境為Intel(R) Pentium(R)4 3.00 GHz 的CPU,4 G內(nèi)存,160 GB硬盤的PC機(jī),操作系統(tǒng)為Win8,實驗工具為JetBrains PyCharm 2016.1.2。

    4.2 UR-LDA模型參數(shù)

    模型參數(shù)參考文獻(xiàn)[14]中的方法進(jìn)行設(shè)置。取經(jīng)驗值α=αur=50/K,β=0.01,K=60,其中K是整個數(shù)據(jù)集上的主題總數(shù)。

    4.3 實驗結(jié)果

    4.3.1 整體效果

    選取UR-LDA模型的主題挖掘前4個主題社區(qū)的結(jié)果,如圖3所示。

    圖3 UR-LDA模型部分效果圖

    圖中,每個主題選擇了20個關(guān)鍵詞進(jìn)行表征,關(guān)鍵詞是按照其在主題下的分布概率由高到低顯示。

    根據(jù)各個主題相對應(yīng)的關(guān)鍵詞可以發(fā)現(xiàn)Topic 1是與房價相關(guān)的主題,Topic 2是與公務(wù)員相關(guān)的主題,Topic 3是與足球相關(guān)的主題,Topic 4是與手機(jī)產(chǎn)品相關(guān)的主題。不同主題的關(guān)鍵詞都能有效表征當(dāng)前主題,說明主題的關(guān)鍵詞分類合理,主題之間的獨(dú)立性比較高。

    4.3.2 對比實驗

    在研究主題模型時,可以使用困惑度(perplexity)指標(biāo)對模型進(jìn)行評估。perplexity是度量概率圖模型性能的常用指標(biāo)[14],它表示了預(yù)測數(shù)據(jù)時的不確定度,該值越小,模型建模效果越好[15]。計算公式[16-17]如下:

    (12)

    其中,w為微博數(shù)據(jù)集;wm為在數(shù)據(jù)集中出現(xiàn)的單詞;Nm為測試集中出現(xiàn)的詞語總數(shù)。

    在相同參數(shù)下,分別計算傳統(tǒng)LDA模型和UR-LDA模型的perplexity,結(jié)果如圖4所示。

    從圖中可以看出,隨著迭代次數(shù)的增加,直到模型趨于收斂,UR-LDA模型的perplexity都要小于傳統(tǒng)的LDA模型,說明UR-LDA模型在測試數(shù)據(jù)上具有更好的建模效果。

    5 結(jié)束語

    圖4 模型困惑度對比圖

    針對新浪微博短文本語義稀疏以及文本之間相互關(guān)聯(lián)的特點(diǎn),提出了一種適合處理微博用戶關(guān)系數(shù)據(jù)的UR-LDA模型,并采用吉布斯抽樣對模型進(jìn)行推導(dǎo)。在真實的數(shù)據(jù)集上進(jìn)行實驗,結(jié)果證明UR-LDA較傳統(tǒng)的LDA主題模型有更好的主題挖掘效果。

    雖然UR-LDA模型能夠較有效地對微博進(jìn)行主題挖掘,但也有一定的局限性[18]。通過新浪微博,也可以發(fā)布音樂、視頻、圖片等多媒體信息,而不再是單純的文字信息。今后的研究工作主要集中在處理微博中的多媒體數(shù)據(jù),增強(qiáng)主題模型挖掘能力等方面。

    [1] Girvan M,Newman M E J.Community structure in social and biological networks[J].PNAS,2002,99(12):7821-7826.

    [2] Li Xin,Guo Lei,Zhao Yihong.Tag-based social interest discovery[C]//Proceedings of the 17th international conference on world wide web.[s.l.]:[s.n.],2008:675-684.

    [3] Mei Qiaozhu,Cai Deng,Zhang Duo,et al.Topic modeling with network regularization[C]//Proceedings of the 17th international conference on world wide web.[s.l.]:[s.n.],2008:101-110.

    [4] Blei D M,Ng A Y,Jordan M I.Latent Dirichlet allocation[J].Journal of Machine Learning Research,2003,3:993-1022.

    [5] 汪進(jìn)祥.基于主題模型的微博話題挖掘[D].北京:北京郵電大學(xué),2015.

    [6] Kang J H,Lerman K,Plangprasopchok A.Analyzing Microblogs with affinity propagation[C]//Proceedings of the KDD workshop on social media analytics.New York:ACM,2010:67-70.

    [7] Deerwester S,Dumais S,Landauer T,et al.Indexing by latent semantic analysis[J].Journal of the American Society of Information Science,1990,41(6):391-407.

    [8] Hofmann T.Probabilistic latent semantic indexing[C]//Proceedings of the 22nd annual international ACM SIGIR conference on research and development in information retrieval.New York:ACM,1999:50-57.

    [9] Nallapati R M, Ahmed A, Xing E P,et al.Joint latent topicmodels for text and critations[C]//Proceedings of the 14th ACM SIGKDD international conference on knowledge discovery and data mining.[s.l.]:ACM,2008:542-550.

    [10] 李 明,王占宏,魯 明.基于J2EE框架的混合模式治安管理信息系統(tǒng)研究與應(yīng)用[J].計算機(jī)工程,2003,29(1):252-252.

    [11] Garrett J J.Ajax:a new approach to web applications[EB/OL].(2005-02-18)[2011-02-18].http://www.adaptivepath.com/publications/essays/archives/000385.php.

    [12] 郭劍飛.基于LDA多模型中文短文本主題分類體系構(gòu)建與分類[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014.

    [13] Thomas H.Probabilistic latent semantic indexing[C]//Proceedings of SIGIR.Berkeley,CA,USA:[s.n.],1999:50-57.

    [14] Griffiths T,Steyvers M.Probabilistic topic models[M]//Latent semantic analysis:a road to meaning.Hillsdale,NJ:Laurence Erlbaum,2006.

    [15] Philp R,Eric H.Gibbs sampling for the uninitiated[R].[s.l.]:[s.n.],2010.

    [16] 張晨逸,孫建伶,丁軼群.基于MB-LDA模型的微博主題挖掘[J].計算機(jī)研究與發(fā)展,2011,48(10):1795-1802.

    [17] 胡吉明,陳 果.基于動態(tài)LDA主題模型的內(nèi)容主題挖掘與演化[J].圖書情報工作,2014,58(2):138-142.

    [18] Ma D,Rao Lan,Wang Ting.An empirical study of SLDA for information retrieval[J].Information Retrieval Technology,2011(1):84-92.

    Microblog Topic Mining Based on UR-LDA

    CHEN Yang1,SHAO Xi1,ZHAO Hai-bo2

    (1.College of Communication & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China; 2.Isoftstone Information Technology (Group) Co.,Ltd.,Hangzhou 310000,China)

    Social network in particular microblog has become a significant way for users to propagate and retrieve information.However,a large proportion of the real time information is junk or redundant.So the discovery of latent topics in social networks through finding,organizing and using valuable information behind the mass passage with effective ways carries high value in public option monitoring and commercial promotion.Although probabilistic generative topic model (Latent Dirichlet Allocation,LDA) has been widely applied in the field of topics mining,it cannot work well on microblog,which contains little information and has connection with others.A novel probabilistic generative model based on LDA,called UR-LDA,has been proposed which is suitable for modeling the micro-blog data and taking the document relation and user relation into consideration to help mining in micro-blog.A Gibbs sampling implementation for inference the UR-LDA model has been also presented.Experimental results used with actual dataset show that UR-LDA can offer an effective solution to topic mining for microblog.

    microblog;topic mining;UR-LDA;Gibbs sampling

    2016-05-23

    2016-09-14 網(wǎng)絡(luò)出版時間:2017-03-13

    國家自然科學(xué)基金青年基金(60902065)

    陳 陽(1992-),女,碩士研究生,研究方向為社交網(wǎng)絡(luò)主題挖掘;邵 曦,博士,副教授,研究生導(dǎo)師,研究方向為多媒體信息處理系統(tǒng)。

    http://kns.cnki.net/kcms/detail/61.1450.TP.20170313.1545.016.html

    TP31

    A

    1673-629X(2017)06-0173-05

    10.3969/j.issn.1673-629X.2017.06.036

    猜你喜歡
    單詞文本用戶
    單詞連一連
    在808DA上文本顯示的改善
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    看圖填單詞
    看完這些單詞的翻譯,整個人都不好了
    關(guān)注用戶
    商用汽車(2016年11期)2016-12-19 01:20:16
    關(guān)注用戶
    商用汽車(2016年6期)2016-06-29 09:18:54
    關(guān)注用戶
    商用汽車(2016年4期)2016-05-09 01:23:12
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    如何獲取一億海外用戶
    九色成人免费人妻av| 精品久久久噜噜| videossex国产| 亚洲国产欧美在线一区| 久久精品人妻少妇| 欧美不卡视频在线免费观看| 欧美一级a爱片免费观看看| 能在线免费观看的黄片| 色综合站精品国产| 亚洲精品日韩av片在线观看| 麻豆成人av视频| 国产单亲对白刺激| 一本一本综合久久| 97热精品久久久久久| 一级毛片电影观看 | 搞女人的毛片| 黄色欧美视频在线观看| 精品人妻熟女av久视频| 天天躁日日操中文字幕| 久久这里只有精品中国| 精品酒店卫生间| 18+在线观看网站| 欧美人与善性xxx| 亚洲,欧美,日韩| 麻豆成人av视频| 国语自产精品视频在线第100页| www.av在线官网国产| 久久久久久久久久成人| 男女啪啪激烈高潮av片| 男女边吃奶边做爰视频| 水蜜桃什么品种好| 国产又色又爽无遮挡免| 精品人妻视频免费看| 深爱激情五月婷婷| 晚上一个人看的免费电影| 特级一级黄色大片| 美女大奶头视频| 国产一区二区亚洲精品在线观看| 亚洲国产欧美在线一区| 五月伊人婷婷丁香| 国产伦在线观看视频一区| 特级一级黄色大片| 国产精品国产高清国产av| 亚洲欧美成人精品一区二区| 亚洲图色成人| 欧美3d第一页| 午夜福利在线观看免费完整高清在| 国产精品不卡视频一区二区| АⅤ资源中文在线天堂| 在线观看一区二区三区| 欧美bdsm另类| 国产亚洲5aaaaa淫片| 亚洲丝袜综合中文字幕| 在线播放无遮挡| 国产精品一区二区三区四区免费观看| 你懂的网址亚洲精品在线观看 | 亚洲欧美精品专区久久| 国产老妇女一区| 亚洲精品亚洲一区二区| 人体艺术视频欧美日本| 老司机影院毛片| 日本三级黄在线观看| 在线观看美女被高潮喷水网站| 在线免费观看的www视频| 永久免费av网站大全| 免费看光身美女| 欧美最新免费一区二区三区| 老司机影院毛片| 日本-黄色视频高清免费观看| 99精国产麻豆久久婷婷| 中文字幕人妻丝袜制服| 人体艺术视频欧美日本| 欧美最新免费一区二区三区| 久久精品人人爽人人爽视色| 色网站视频免费| av.在线天堂| 午夜福利网站1000一区二区三区| 交换朋友夫妻互换小说| 日韩av在线免费看完整版不卡| 日韩人妻精品一区2区三区| freevideosex欧美| 母亲3免费完整高清在线观看 | 五月天丁香电影| 美国免费a级毛片| 亚洲国产精品成人久久小说| 性色avwww在线观看| 久久国内精品自在自线图片| 五月天丁香电影| 久久久久精品性色| 欧美精品亚洲一区二区| 国产亚洲一区二区精品| 一边摸一边做爽爽视频免费| 久久久久网色| 亚洲av综合色区一区| 黄色视频在线播放观看不卡| 中文字幕制服av| 男女无遮挡免费网站观看| 久久精品国产亚洲av涩爱| 九九在线视频观看精品| 丝袜人妻中文字幕| 国产欧美日韩综合在线一区二区| 又粗又硬又长又爽又黄的视频| 午夜免费鲁丝| 国产精品久久久久成人av| 丝袜脚勾引网站| 涩涩av久久男人的天堂| 亚洲性久久影院| 最近中文字幕2019免费版| 国产黄频视频在线观看| 日韩中文字幕视频在线看片| 免费观看性生交大片5| 在线 av 中文字幕| 国产精品久久久久久久久免| 国产精品久久久av美女十八| 在线天堂中文资源库| 男的添女的下面高潮视频| 少妇人妻 视频| 制服人妻中文乱码| a级毛片黄视频| 18禁观看日本| 精品人妻在线不人妻| 成人亚洲精品一区在线观看| 蜜臀久久99精品久久宅男| av免费在线看不卡| 黄色怎么调成土黄色| 久久综合国产亚洲精品| 国产日韩一区二区三区精品不卡| 观看美女的网站| 欧美 亚洲 国产 日韩一| 国产亚洲一区二区精品| 老女人水多毛片| 熟女av电影| 在线看a的网站| 黄片无遮挡物在线观看| 桃花免费在线播放| 观看美女的网站| 最近2019中文字幕mv第一页| 久久精品国产鲁丝片午夜精品| 久久亚洲国产成人精品v| 满18在线观看网站| 搡女人真爽免费视频火全软件| 一本—道久久a久久精品蜜桃钙片| 亚洲精品国产色婷婷电影| 99九九在线精品视频| 99热这里只有是精品在线观看| 国产xxxxx性猛交| 女人久久www免费人成看片| 国产精品 国内视频| 国产成人免费观看mmmm| 成人漫画全彩无遮挡| 美女内射精品一级片tv| 成年人午夜在线观看视频| 国产片特级美女逼逼视频| 久久久精品区二区三区| av在线app专区| 国产毛片在线视频| 美女脱内裤让男人舔精品视频| 天天躁夜夜躁狠狠久久av| 成人手机av| 18禁裸乳无遮挡动漫免费视频| 免费大片18禁| 中文字幕精品免费在线观看视频 | 国产免费现黄频在线看| 亚洲欧美一区二区三区黑人 | 视频区图区小说| av片东京热男人的天堂| 有码 亚洲区| 亚洲高清免费不卡视频| 亚洲综合精品二区| 一二三四在线观看免费中文在 | 90打野战视频偷拍视频| 天堂中文最新版在线下载| 大香蕉久久成人网| 各种免费的搞黄视频| 黑人欧美特级aaaaaa片| 91精品国产国语对白视频| 国产片特级美女逼逼视频| av黄色大香蕉| 欧美激情国产日韩精品一区| 亚洲成人av在线免费| 狠狠婷婷综合久久久久久88av| 精品一区二区免费观看| 卡戴珊不雅视频在线播放| 香蕉精品网在线| 亚洲,欧美,日韩| 亚洲美女黄色视频免费看| 成人漫画全彩无遮挡| 国产黄色视频一区二区在线观看| 夜夜爽夜夜爽视频| 日韩熟女老妇一区二区性免费视频| 国产永久视频网站| 日本色播在线视频| 欧美少妇被猛烈插入视频| 色婷婷久久久亚洲欧美| 国产深夜福利视频在线观看| 黄色配什么色好看| 欧美精品一区二区免费开放| 国产片内射在线| 女性被躁到高潮视频| 久久久国产欧美日韩av| 少妇高潮的动态图| 69精品国产乱码久久久| 国产精品一区二区在线不卡| 水蜜桃什么品种好| 国产一区有黄有色的免费视频| 欧美日韩综合久久久久久| 国产一区二区在线观看日韩| 免费观看性生交大片5| 亚洲精品中文字幕在线视频| kizo精华| 久久99精品国语久久久| 亚洲国产精品一区三区| 日韩一区二区三区影片| 亚洲人成网站在线观看播放| 91午夜精品亚洲一区二区三区| 精品久久国产蜜桃| 一级黄片播放器| 国产毛片在线视频| av在线观看视频网站免费| 成人影院久久| 久久国内精品自在自线图片| 久久久国产欧美日韩av| 亚洲经典国产精华液单| 成人国产麻豆网| 国产av国产精品国产| 蜜桃国产av成人99| 日本黄色日本黄色录像| 美女主播在线视频| 久久ye,这里只有精品| 人妻少妇偷人精品九色| 免费黄频网站在线观看国产| 国产av码专区亚洲av| 国产成人91sexporn| 性色avwww在线观看| 老女人水多毛片| 在线看a的网站| 国产成人精品婷婷| 免费日韩欧美在线观看| 少妇精品久久久久久久| 精品熟女少妇av免费看| 有码 亚洲区| 少妇 在线观看| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 大香蕉97超碰在线| 乱码一卡2卡4卡精品| 永久网站在线| 国产精品欧美亚洲77777| 麻豆乱淫一区二区| 尾随美女入室| 26uuu在线亚洲综合色| 精品卡一卡二卡四卡免费| 日本91视频免费播放| 午夜福利网站1000一区二区三区| 丰满乱子伦码专区| 黄网站色视频无遮挡免费观看| 又黄又爽又刺激的免费视频.| 大话2 男鬼变身卡| 多毛熟女@视频| 热re99久久精品国产66热6| 久久鲁丝午夜福利片| 26uuu在线亚洲综合色| 大片免费播放器 马上看| 精品人妻一区二区三区麻豆| 日本-黄色视频高清免费观看| 亚洲精品色激情综合| 免费日韩欧美在线观看| 欧美97在线视频| 精品福利永久在线观看| 九色成人免费人妻av| 亚洲欧美一区二区三区国产| 日韩欧美一区视频在线观看| 美女大奶头黄色视频| av天堂久久9| 一二三四在线观看免费中文在 | 伊人亚洲综合成人网| 欧美精品国产亚洲| 免费av中文字幕在线| 在线观看www视频免费| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 精品亚洲成国产av| 性高湖久久久久久久久免费观看| 亚洲精品日韩在线中文字幕| 又粗又硬又长又爽又黄的视频| 一本大道久久a久久精品| 精品亚洲成a人片在线观看| 国产av码专区亚洲av| 九九爱精品视频在线观看| 90打野战视频偷拍视频| 国产男人的电影天堂91| a 毛片基地| 亚洲三级黄色毛片| 国产免费一级a男人的天堂| 国产男女内射视频| 在线 av 中文字幕| 青春草视频在线免费观看| 男女免费视频国产| xxx大片免费视频| 性色avwww在线观看| 亚洲国产精品国产精品| 免费av不卡在线播放| 日韩精品有码人妻一区| 午夜福利视频精品| 国产深夜福利视频在线观看| 亚洲成色77777| 少妇人妻久久综合中文| 9191精品国产免费久久| 男女午夜视频在线观看 | 一区二区三区四区激情视频| 女的被弄到高潮叫床怎么办| 99视频精品全部免费 在线| 亚洲伊人久久精品综合| 黄色视频在线播放观看不卡| 亚洲久久久国产精品| 如日韩欧美国产精品一区二区三区| 在线观看美女被高潮喷水网站| 妹子高潮喷水视频| 免费看光身美女| 一区在线观看完整版| 日本爱情动作片www.在线观看| 晚上一个人看的免费电影| 国产一区二区三区综合在线观看 | 国产黄色视频一区二区在线观看| 久久狼人影院| 亚洲av欧美aⅴ国产| 男女国产视频网站| 久久99热6这里只有精品| 久久亚洲国产成人精品v| 汤姆久久久久久久影院中文字幕| 丰满乱子伦码专区| 欧美成人午夜精品| 久久亚洲国产成人精品v| 街头女战士在线观看网站| 精品久久国产蜜桃| 黄色视频在线播放观看不卡| 日韩一区二区视频免费看| 日韩人妻精品一区2区三区| 男女国产视频网站| 51国产日韩欧美| 午夜视频国产福利| 亚洲av中文av极速乱| xxxhd国产人妻xxx| 亚洲欧美色中文字幕在线| 国产精品成人在线| 一本大道久久a久久精品| 久久av网站| 爱豆传媒免费全集在线观看| 18禁在线无遮挡免费观看视频| 精品一品国产午夜福利视频| 成年美女黄网站色视频大全免费| 色视频在线一区二区三区| 乱码一卡2卡4卡精品| 亚洲,欧美精品.| 免费观看a级毛片全部| 99久久综合免费| 国产淫语在线视频| 欧美日韩精品成人综合77777| 99久久综合免费| 国产又爽黄色视频| 午夜av观看不卡| 最后的刺客免费高清国语| 日本91视频免费播放| 制服诱惑二区| 久久久久精品性色| 欧美97在线视频| 国产免费一级a男人的天堂| 国国产精品蜜臀av免费| 成年av动漫网址| 肉色欧美久久久久久久蜜桃| 夫妻午夜视频| 国产欧美日韩一区二区三区在线| 成年美女黄网站色视频大全免费| 国产综合精华液| 亚洲美女搞黄在线观看| 午夜福利网站1000一区二区三区| 色视频在线一区二区三区| 精品亚洲成a人片在线观看| 亚洲精品自拍成人| 在线观看美女被高潮喷水网站| 久久久久久久大尺度免费视频| 免费女性裸体啪啪无遮挡网站| 制服人妻中文乱码| 国产深夜福利视频在线观看| 永久免费av网站大全| 精品少妇久久久久久888优播| 国产亚洲av片在线观看秒播厂| 男的添女的下面高潮视频| 日本av手机在线免费观看| 亚洲伊人色综图| 男女免费视频国产| 国产亚洲最大av| 内地一区二区视频在线| 岛国毛片在线播放| 亚洲av男天堂| 久久久久精品性色| 日韩成人伦理影院| 最黄视频免费看| 毛片一级片免费看久久久久| 久久久国产欧美日韩av| 久久99蜜桃精品久久| 亚洲高清免费不卡视频| 天天影视国产精品| 91国产中文字幕| 18禁在线无遮挡免费观看视频| 人妻一区二区av| xxx大片免费视频| 老熟女久久久| 波多野结衣一区麻豆| 欧美xxxx性猛交bbbb| 少妇高潮的动态图| 18禁裸乳无遮挡动漫免费视频| 欧美亚洲日本最大视频资源| 99re6热这里在线精品视频| 欧美日韩精品成人综合77777| 男人爽女人下面视频在线观看| 一区二区日韩欧美中文字幕 | 亚洲国产欧美在线一区| 久久久久久久国产电影| 99热网站在线观看| 天天躁夜夜躁狠狠躁躁| 国产精品成人在线| 国产黄色视频一区二区在线观看| 大陆偷拍与自拍| 啦啦啦中文免费视频观看日本| 欧美97在线视频| 99热网站在线观看| 中文字幕亚洲精品专区| 亚洲,欧美,日韩| 大话2 男鬼变身卡| 最近中文字幕高清免费大全6| 精品一区二区三卡| 视频在线观看一区二区三区| 国产成人精品一,二区| 午夜日本视频在线| 卡戴珊不雅视频在线播放| 亚洲人成网站在线观看播放| 久久久久视频综合| 女的被弄到高潮叫床怎么办| 只有这里有精品99| a 毛片基地| 免费女性裸体啪啪无遮挡网站| 大片免费播放器 马上看| 精品少妇黑人巨大在线播放| av一本久久久久| 亚洲欧美色中文字幕在线| 极品人妻少妇av视频| 中文字幕亚洲精品专区| 91aial.com中文字幕在线观看| 国产黄色视频一区二区在线观看| 国产熟女欧美一区二区| 高清不卡的av网站| 色5月婷婷丁香| 一级毛片电影观看| 男人添女人高潮全过程视频| 色吧在线观看| 日日啪夜夜爽| www.色视频.com| 中文字幕亚洲精品专区| 一区在线观看完整版| 少妇猛男粗大的猛烈进出视频| 97精品久久久久久久久久精品| 午夜福利在线观看免费完整高清在| 国产精品久久久久久av不卡| 亚洲,欧美,日韩| 久久人人爽av亚洲精品天堂| 久久久欧美国产精品| 亚洲综合色网址| 日日啪夜夜爽| 亚洲一级一片aⅴ在线观看| 国产一区有黄有色的免费视频| 最近中文字幕高清免费大全6| 色5月婷婷丁香| 国产成人免费无遮挡视频| 日本免费在线观看一区| 99热6这里只有精品| 日韩中字成人| 在线观看一区二区三区激情| 久久ye,这里只有精品| 欧美激情极品国产一区二区三区 | 在线精品无人区一区二区三| 咕卡用的链子| a级毛片在线看网站| 黄色 视频免费看| 我的女老师完整版在线观看| 少妇被粗大的猛进出69影院 | 国产精品国产av在线观看| 色视频在线一区二区三区| 黑丝袜美女国产一区| 午夜激情av网站| av免费观看日本| 内地一区二区视频在线| 免费播放大片免费观看视频在线观看| 欧美成人精品欧美一级黄| 大香蕉久久成人网| a级毛色黄片| 国产黄频视频在线观看| 亚洲成人一二三区av| 日本午夜av视频| 成年av动漫网址| 国产国语露脸激情在线看| 在线观看www视频免费| 亚洲av欧美aⅴ国产| 中文乱码字字幕精品一区二区三区| 狠狠婷婷综合久久久久久88av| 嫩草影院入口| 18禁国产床啪视频网站| 男女高潮啪啪啪动态图| 国产成人午夜福利电影在线观看| 国产国拍精品亚洲av在线观看| 乱人伦中国视频| 成人国语在线视频| 日本欧美视频一区| 高清av免费在线| 美女内射精品一级片tv| 妹子高潮喷水视频| 大香蕉久久成人网| 黄色视频在线播放观看不卡| 高清黄色对白视频在线免费看| 一区二区三区乱码不卡18| 老司机影院毛片| 成人无遮挡网站| 色网站视频免费| 18禁在线无遮挡免费观看视频| 90打野战视频偷拍视频| 亚洲婷婷狠狠爱综合网| 国产精品.久久久| 国产成人免费无遮挡视频| 国产成人精品在线电影| 51国产日韩欧美| 日韩精品有码人妻一区| 80岁老熟妇乱子伦牲交| 18禁在线无遮挡免费观看视频| 一级,二级,三级黄色视频| 九九爱精品视频在线观看| 免费av中文字幕在线| 色94色欧美一区二区| 久久久久国产精品人妻一区二区| 国产一区二区在线观看av| 久久婷婷青草| 99久久综合免费| 视频在线观看一区二区三区| 日日啪夜夜爽| 美女xxoo啪啪120秒动态图| 在线天堂最新版资源| 性色av一级| 亚洲成国产人片在线观看| 伦精品一区二区三区| 又黄又粗又硬又大视频| 国产 一区精品| 一级爰片在线观看| 日本av手机在线免费观看| 国产成人精品无人区| 午夜精品国产一区二区电影| 黑人猛操日本美女一级片| 夫妻性生交免费视频一级片| 青春草国产在线视频| 桃花免费在线播放| 在线精品无人区一区二区三| 国产片特级美女逼逼视频| 久久精品久久久久久噜噜老黄| 久久这里有精品视频免费| 大片免费播放器 马上看| 最新的欧美精品一区二区| 涩涩av久久男人的天堂| 国产成人av激情在线播放| 久久99一区二区三区| 国产爽快片一区二区三区| 男女国产视频网站| 国产精品久久久久久久电影| 在线观看www视频免费| 国产男人的电影天堂91| 看十八女毛片水多多多| 欧美成人午夜精品| 最近最新中文字幕免费大全7| 高清视频免费观看一区二区| 成年人午夜在线观看视频| 亚洲欧洲国产日韩| 日韩成人伦理影院| 亚洲av免费高清在线观看| 欧美人与性动交α欧美精品济南到 | 视频区图区小说| 国产av一区二区精品久久| 99九九在线精品视频| 在线观看一区二区三区激情| av天堂久久9| 天堂中文最新版在线下载| 在线亚洲精品国产二区图片欧美| 男女边吃奶边做爰视频| 成人亚洲欧美一区二区av| 免费看av在线观看网站| 九色成人免费人妻av| 老司机影院毛片| 免费看av在线观看网站| 国产激情久久老熟女| 国产成人精品在线电影| 在线观看www视频免费| 国产国拍精品亚洲av在线观看| 久久女婷五月综合色啪小说| 国产69精品久久久久777片| 国产成人精品婷婷| 免费av不卡在线播放| 亚洲av综合色区一区| √禁漫天堂资源中文www| 最近中文字幕2019免费版| 亚洲精品中文字幕在线视频| 多毛熟女@视频| 肉色欧美久久久久久久蜜桃| 久久久久久久国产电影| 久久影院123| 人成视频在线观看免费观看| 国产在线一区二区三区精| 欧美日韩视频高清一区二区三区二| 成人毛片a级毛片在线播放| 国产亚洲精品第一综合不卡 | 日本-黄色视频高清免费观看| 中文字幕免费在线视频6|