• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于文本雙表示模型的微博熱點(diǎn)話題發(fā)現(xiàn)

    2021-12-18 01:19:10劉夢(mèng)穎
    計(jì)算機(jī)與現(xiàn)代化 2021年12期
    關(guān)鍵詞:熱點(diǎn)話題博文聚類

    劉夢(mèng)穎,王 勇

    (北京工業(yè)大學(xué)信息學(xué)部,北京 100124)

    0 引 言

    隨著信息技術(shù)的快速發(fā)展以及社交網(wǎng)絡(luò)的興起,通過互聯(lián)網(wǎng)傳播的信息量更是呈爆炸式增長(zhǎng)。微博作為當(dāng)前國(guó)內(nèi)廣泛使用的社交媒體平臺(tái)之一,憑借其平臺(tái)的開放性已經(jīng)成為越來越多的網(wǎng)民表達(dá)自我情感、獲取時(shí)事新聞、討論社會(huì)輿論的重要平臺(tái)[1]。

    目前,針對(duì)微博平臺(tái)的熱點(diǎn)話題發(fā)現(xiàn),眾多學(xué)者已經(jīng)開展了大量的研究工作。Chen等[2]通過計(jì)算每個(gè)單詞的TF-ID值,即使用單詞出現(xiàn)的頻率衡量其是否為熱詞,進(jìn)行熱點(diǎn)話題挖掘。路榮等[3]采用LDA模型對(duì)微博文本進(jìn)行隱主題建模,通過隱主題模型計(jì)算微博文本之間的相似度,進(jìn)行話題聚類。Ye等[4]將微博中的點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)、時(shí)間、用戶權(quán)限等微博特征信息添加到主題模型中,利用這些特征計(jì)算每個(gè)微博的關(guān)注價(jià)值、權(quán)威價(jià)值和詞頻,構(gòu)造了微博新的主題模型MF-LDA,實(shí)驗(yàn)顯示具有更好的準(zhǔn)確性。陳珊珊[5]使用LDA模型來挖掘隱藏在數(shù)據(jù)中主題信息,使用主題信息來實(shí)現(xiàn)文本表示。Liu等[6]提出使用HowNet來擴(kuò)展文本中單詞的語義特征,以達(dá)到更好的聚類效果。為了進(jìn)一步解決文本表示模型的高維問題,有學(xué)者提出將頻繁詞集的概念[7]應(yīng)用于短文本聚類中,Zhang等[8]提出用挖掘的頻繁詞集作為特征來表示文本,并使用文本包含的頻繁詞集個(gè)數(shù)計(jì)算文本之間的相似度進(jìn)行聚類。徐雅斌等[9]針對(duì)微博這一特殊媒體進(jìn)行分析,提出使用頻繁詞集聚類FWSC(Frequent Words Sets Clustering)算法進(jìn)行微博話題發(fā)現(xiàn)。彭敏等[10]提出了一種聚類簇?cái)?shù)目自適應(yīng)的頻繁項(xiàng)集譜聚類算法CSA_SC,實(shí)現(xiàn)微博文本聚類與話題抽取。

    由于微博文本具有篇幅較短、信息量少等特點(diǎn),傳統(tǒng)的話題發(fā)現(xiàn)方法僅僅考慮詞的統(tǒng)計(jì)關(guān)系而無法兼顧低頻描述詞,大大影響了短文本的聚類效果。再加上微博文本內(nèi)容隨意,一些用語一詞多義也增加了微博熱點(diǎn)話題發(fā)現(xiàn)的難度。因此,提出一種行之有效的中文微博熱點(diǎn)話題發(fā)現(xiàn)方法具有重要的現(xiàn)實(shí)意義。

    本文在深入分析目前國(guó)內(nèi)外已有的熱點(diǎn)話題發(fā)現(xiàn)技術(shù)基礎(chǔ)上,研究其在短文本聚類結(jié)果和熱點(diǎn)話題評(píng)估等方面都不是很理想的原因,考慮在傳統(tǒng)的基于統(tǒng)計(jì)詞頻的方法基礎(chǔ)之上融入BERT句向量語義進(jìn)行主題聚類,通過改進(jìn)相似性度量的Affinity Propagation(AP)聚類算法進(jìn)行微博話題挖掘,并引入H指數(shù)進(jìn)行話題熱點(diǎn)評(píng)估分析,提出一種更適合微博熱點(diǎn)話題發(fā)現(xiàn)的方法。

    1 基于文本雙表示模型的微博熱點(diǎn)話題發(fā)現(xiàn)方法

    本文提出的基于文本雙表示模型的微博熱點(diǎn)話題發(fā)現(xiàn)方法如圖1所示。首先,對(duì)微博數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,然后對(duì)文本進(jìn)行頻繁詞集挖掘和BERT句向量表示,通過構(gòu)造FWS-BERT文本雙表示模型計(jì)算文本相似度進(jìn)行譜聚類,之后再對(duì)主題聚類結(jié)果進(jìn)行話題挖掘,最后通過話題描述詞進(jìn)行微博熱點(diǎn)話題評(píng)估。

    圖1 基于文本雙表示模型的微博熱點(diǎn)話題發(fā)現(xiàn)方法流程

    1.1 FWS-BERT文本雙表示模型

    1.1.1 頻繁詞集挖掘

    在文本中,經(jīng)常同時(shí)出現(xiàn)的特征詞往往存在一定的關(guān)聯(lián)性,同一主題下不同短文本之間包含的特征詞也經(jīng)常重復(fù)出現(xiàn)。因此,利用微博文本之間共有的特征詞數(shù)量來衡量微博文本相似度是目前普遍采用的一種標(biāo)準(zhǔn)。

    本文采用韓家煒教授等人[11]提出的FP-Growth算法作為頻繁詞集挖掘算法。FP-Growth算法是頻繁模式挖掘領(lǐng)域的經(jīng)典算法,相比Apriori等算法在大數(shù)據(jù)集上較為高效。本文根據(jù)微博文本的數(shù)據(jù)量設(shè)置最小支持度,對(duì)清洗處理后的微博文本進(jìn)行頻繁詞集挖掘。相關(guān)定義如下:

    定義1 文本集合。進(jìn)行數(shù)據(jù)預(yù)處理及特征詞匯篩選后的微博文本組成文本集合D={D1,D2,D3,…,Dn}。

    定義2 最小支持度。文本集合D中所有特征詞集合T={t1,t2,t3,…,tn}。文檔Di包含的所有特征詞集合WDi∈T。詞集U為T的子集,U的支持度為support(U)=|{Di|U?WDi,Di∈D}|,表示包含詞集的文本數(shù)量??紤]到頻繁詞集挖掘算法效率對(duì)實(shí)驗(yàn)復(fù)雜度的影響,設(shè)置一個(gè)控制頻繁詞集數(shù)量的閾值θ,稱該閾值θ為最小支持度。

    定義3 頻繁詞集。通過對(duì)數(shù)據(jù)文本集合D進(jìn)行FP-Growth頻繁詞集挖掘,得到大于設(shè)置的最小支持度閾值的頻繁詞集集合U={U1,U2,U3,…,Un},其中Ui表示每個(gè)頻繁詞集,每個(gè)頻繁詞集由多個(gè)詞語組成Ui={w1,w2,w3,…,wn}。

    由于頻繁詞集長(zhǎng)度較短、信息量較小,難以依據(jù)傳統(tǒng)的文本相似度度量方法,如余弦相似度或歐氏距離來評(píng)估頻繁詞集之間的相似度。因此,本文采用Jaccard系數(shù)來度量微博文本之間的頻繁詞集相似度,如公式(1):

    (1)

    其中,Jaccard_Sim(Di,Dj)表示2個(gè)微博文本之間的相似度,分子表示2個(gè)文本所包含的頻繁詞集交集數(shù)量,分母表示2個(gè)文本所包含的頻繁詞集并集數(shù)量。

    1.1.2 BERT句向量

    BERT[12](Bidirectional Encoder Representation from Transformers)是2018年Google AI團(tuán)隊(duì)發(fā)布的一種新的語言模型,其結(jié)構(gòu)如圖2所示。BERT采用Transformer[13]編碼器作為模型核心結(jié)構(gòu),E1,E2,…,EN為模型的輸入向量,T1,T2,…,TN為模型的輸出向量。

    圖2 BERT語言模型結(jié)構(gòu)

    BERT作為一個(gè)多任務(wù)模型,其預(yù)訓(xùn)練過程是由2個(gè)自監(jiān)督任務(wù)組成,即掩碼語言模型(MLM)任務(wù)和句子連貫性判定(NSP)任務(wù)。MLM是指在訓(xùn)練的時(shí)候隨機(jī)將輸入語料中15%的詞遮蓋起來,然后通過上下文預(yù)測(cè)被遮蓋的詞,通過迭代訓(xùn)練可以學(xué)習(xí)到詞的上下文特征、語法結(jié)構(gòu)特征、句法特征等,保證了句子特征提取的全面性。NSP的任務(wù)是判斷某個(gè)句子X是否是另一個(gè)句子Y的下文,通過迭代訓(xùn)練學(xué)習(xí)到句子之間的關(guān)系。

    BERT預(yù)訓(xùn)練語言模型拋棄了傳統(tǒng)的RNN和CNN,通過多層Transformer使用自注意力機(jī)制(self-attention)同時(shí)并行提取輸入序列中每個(gè)詞的特征,有效地解決了棘手的長(zhǎng)期依賴問題。與傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)相比,BERT模型使用雙向Transformer對(duì)當(dāng)前單詞的上下文信息做特征提取,能夠較完整地保存文本語義信息;同時(shí)BERT模型根據(jù)上下文信息動(dòng)態(tài)調(diào)整文本句向量能解決一詞多義問題。Transformer的網(wǎng)絡(luò)架構(gòu)如圖3所示。

    圖3 Transformer網(wǎng)絡(luò)架構(gòu)

    “BERT-Base,Chinese”是Google開源的BERT中文預(yù)訓(xùn)練模型,模型總參數(shù)大小為110 MB。為了將BERT預(yù)訓(xùn)練模型用在特定的微博領(lǐng)域,當(dāng)前通用的做法是在BERT預(yù)訓(xùn)練模型上繼續(xù)使用特定領(lǐng)域語料對(duì)該模型進(jìn)行繼續(xù)訓(xùn)練[14]。因此,本文使用海量的微博文本作為繼續(xù)訓(xùn)練BERT預(yù)訓(xùn)練模型的語料庫,使得到的BERT模型更加符合微博語言環(huán)境。將訓(xùn)練好的模型載入后,可以直接將微博文本輸出為768維的句向量。微博文本的BERT句向量語義相似度采用余弦距離來表示,2個(gè)向量夾角的余弦值越接近于1,代表2個(gè)向量越相近,2個(gè)文本越相似。如公式(2):

    (2)

    其中,Di、Dj表示由BERT模型訓(xùn)練而得到文本句向量。

    1.1.3 構(gòu)建FWS-BERT文本雙表示模型

    由于微博短文本的特殊性,目前單一的基于文本特征詞統(tǒng)計(jì)關(guān)系往往不能準(zhǔn)確表示文本內(nèi)容,容易發(fā)生相似度漂移現(xiàn)象,大大影響了短文本的聚類效果。因此本文選擇采用BERT文本句向量所計(jì)算的外部語義關(guān)系并將其融合到基于頻繁詞集計(jì)算文本相似度的方法中,構(gòu)建基于特征詞的統(tǒng)計(jì)關(guān)系和上下文語義關(guān)系的文本雙表示模型來處理微博文本,從更全面的角度對(duì)微博文本進(jìn)行表示。

    最終文本相似度由頻繁詞集相似度(公式(1))和BERT句向量語義相似度(公式(2))這2個(gè)部分加權(quán)集成得到,如公式(3):

    Sim(Di,Dj)=αJaccard_Sim(Di,Dj)+(1-α)Vec_Sim(Di,Dj)

    (3)

    其中,α是調(diào)節(jié)2種相似度所占比重的重要參數(shù),根據(jù)實(shí)驗(yàn)結(jié)果確定,0<α<1。

    通過FWS-BERT文本雙表示模型構(gòu)建的微博文本融合相似度矩陣M如下:

    (4)

    其中,Simij表示由文本雙表示模型計(jì)算出的下標(biāo)為i與下標(biāo)為j的2個(gè)微博文本融合相似度。

    最后,本文通過融合相似度矩陣M采用譜聚類算法[15]對(duì)微博文本進(jìn)行主題聚類。

    1.2 話題挖掘

    對(duì)于聚類后每個(gè)主題下所有微博數(shù)據(jù)文本,本文使用FP-Growth算法分別設(shè)置不同的最小支持度對(duì)每個(gè)主題下文本進(jìn)行頻繁詞集挖掘,考慮到只有一個(gè)詞的頻繁詞集對(duì)話題表示意義不大,因此選取了長(zhǎng)度大于等于2的頻繁詞集作為每個(gè)主題的聚類結(jié)果。

    為了準(zhǔn)確檢測(cè)到各個(gè)主題下的隱含話題,本文將MinHash算法[16]引入AP聚類算法[17]中,代替原有的歐氏距離度量來構(gòu)建頻繁詞集相似性矩陣進(jìn)行話題聚類。實(shí)驗(yàn)表明,本文在主題聚類結(jié)果上使用改進(jìn)相似性度量的AP聚類算法能有效地挖掘到各個(gè)主題下的隱含話題。

    1.3 熱點(diǎn)話題評(píng)估分析

    對(duì)于微博話題的熱度估計(jì),目前沒有一個(gè)統(tǒng)一的度量標(biāo)準(zhǔn)[18]。本文通過對(duì)微博話題傳播規(guī)律進(jìn)行分析,綜合考慮微博話題熱度的影響因素,通過引入文獻(xiàn)計(jì)量學(xué)中的H指數(shù)[19-21]并選取話題詞熱度和用戶參與度這2個(gè)維度進(jìn)行話題熱度值計(jì)算,綜合得出微博熱點(diǎn)話題。

    1)話題詞熱度。首先將某個(gè)話題描述詞所在微博的被轉(zhuǎn)發(fā)數(shù)、被評(píng)論數(shù)、被點(diǎn)贊數(shù)分別從高到低進(jìn)行排序,直到前H篇微博的被轉(zhuǎn)發(fā)數(shù)、被評(píng)論數(shù)、被點(diǎn)贊數(shù)各不少于H,得到某話題描述詞的H指數(shù)。如公式(5):

    (5)

    其中,Hz、Hp、Hd分別是包含某話題詞所在微博的被轉(zhuǎn)發(fā)、被評(píng)論、被點(diǎn)贊的H指數(shù)。

    2)用戶參與度。本文假設(shè)粉絲數(shù)達(dá)到10萬的用戶為大用戶。用戶參與度由包含話題詞的微博總條數(shù)、包含話題詞的微博參與用戶數(shù)和參與用戶中大用戶數(shù)量來度量。如公式(6):

    (6)

    其中,sum是包含某話題詞的微博總數(shù),sum_user是包含某話題詞的微博參與用戶數(shù),user_v是參與用戶中大用戶數(shù)。

    設(shè)某話題包含k個(gè)話題詞,綜合話題詞熱度和用戶參與度得出話題的熱度計(jì)算如公式(7):

    (7)

    2 實(shí)驗(yàn)結(jié)果與分析

    2.1 數(shù)據(jù)集

    本文對(duì)新浪開放平臺(tái)API進(jìn)行分析,利用Python爬蟲技術(shù)在新浪微博上采集了2類數(shù)據(jù),第一類是隨機(jī)爬取的微博文本共3.609 GB,作為BERT語言模型的訓(xùn)練數(shù)據(jù);第二類是采用定主題的方式爬取了2020年11月5日至12月3日之間的微博數(shù)據(jù),包含微博內(nèi)容數(shù)據(jù)和微博用戶數(shù)據(jù)2個(gè)部分。

    通過對(duì)微博內(nèi)容數(shù)據(jù)集進(jìn)行篩選,選取了新冠、5G、直播3個(gè)主題,每個(gè)主題下5個(gè)熱點(diǎn)話題,共5359條數(shù)據(jù),該數(shù)據(jù)集沒有進(jìn)行對(duì)主題及話題的人工標(biāo)注;與之對(duì)應(yīng)微博用戶數(shù)據(jù)集共4611條。數(shù)據(jù)集的詳細(xì)信息如表1~表3所示。

    表1 新冠主題下話題數(shù)據(jù)詳細(xì)信息

    表2 5G主題下話題數(shù)據(jù)詳細(xì)信息

    表3 直播主題下話題數(shù)據(jù)詳細(xì)信息

    本文使用Jieba分詞工具包實(shí)現(xiàn)分詞,并通過構(gòu)建停用詞表匹配去掉停用詞。利用TF-IDF[22-23]和TextRank[24]分別提取關(guān)鍵詞并進(jìn)行合并形成關(guān)鍵詞集合,使用該集合對(duì)微博文本進(jìn)行關(guān)鍵詞篩選,降低數(shù)據(jù)的稀疏性以及建模的維度。

    2.2 實(shí)驗(yàn)結(jié)果分析

    2.2.1 FWS-BERT模型參數(shù)確定實(shí)驗(yàn)

    在FWS-BERT文本雙表示模型中,α決定了計(jì)算文本相似度時(shí)頻繁詞集和BERT語義所占的比重,是影響微博主題聚類效果的重要參數(shù)。α取值較大時(shí),F(xiàn)WS-BERT模型過多地考慮微博文本的統(tǒng)計(jì)特征而忽略了上下文語義挖掘;α取值較小時(shí),由于微博短文本自身包含的信息量較少、上下文特征不足,F(xiàn)WS-BERT模型過多地關(guān)注短文本的語義信息,可能也不能很好地實(shí)現(xiàn)主題聚類。

    為了達(dá)到更為理想的實(shí)驗(yàn)結(jié)果,本文在新冠、5G、直播3個(gè)主題的數(shù)據(jù)集上進(jìn)行主題聚類實(shí)驗(yàn)。本文采用輪廓系數(shù)(Silhouette Coefficient)作為實(shí)驗(yàn)結(jié)果評(píng)價(jià)標(biāo)準(zhǔn),記錄每個(gè)α值下多次聚類實(shí)驗(yàn)結(jié)果的輪廓系數(shù)平均值,如圖4所示。通過對(duì)比不同α值下的輪廓系數(shù)平均值,發(fā)現(xiàn)當(dāng)α值太大或太小時(shí)都不能達(dá)到較好的主題聚類實(shí)驗(yàn)效果,最終取α為0.6。

    圖4 不同α值下的輪廓系數(shù)

    2.2.2 FWS-BERT模型聚類有效性實(shí)驗(yàn)

    為驗(yàn)證使用本文提出的FWS-BERT模型進(jìn)行主題聚類的有效性,采用輪廓系數(shù)和Calinski-Harabaz指數(shù)作為本實(shí)驗(yàn)的評(píng)價(jià)標(biāo)準(zhǔn),分別對(duì)比了以下4種文本表示方法:

    1)FWS-BERT-S。本文的FWS-BERT模型譜聚類。

    2)FWS-BERT-K。本文的FWS-BERT模型K-means聚類。

    3)FWS-S?;陬l繁詞集的單一文本表示譜聚類。

    4)LDA-S?;贚DA主題模型譜聚類。

    在實(shí)驗(yàn)過程中,分別使用這4種方法在不同的數(shù)據(jù)量下進(jìn)行實(shí)驗(yàn),記錄不同方法在每次實(shí)驗(yàn)中聚類結(jié)果的輪廓系數(shù)和CH值。重復(fù)實(shí)驗(yàn)多次,記錄多個(gè)輪廓系數(shù)和CH值,并計(jì)算得到對(duì)應(yīng)文本表示方法的平均輪廓系數(shù)和平均CH值,實(shí)驗(yàn)結(jié)果如圖5和圖6如示。

    圖5 不同數(shù)據(jù)量下4種聚類方法的輪廓系數(shù)

    圖6 不同數(shù)據(jù)量下4種聚類方法的CH值

    分析圖5、圖6的實(shí)驗(yàn)結(jié)果,在不同的數(shù)據(jù)量下,本文提出的FWS-BERT模型譜聚類結(jié)果在輪廓系數(shù)和CH值上均優(yōu)于基于LDA主題模型譜聚類算法和基于頻繁詞集的單一文本表示譜聚類算法,同時(shí)也表明使用譜聚類算法在微博短文本上的聚類效果要明顯優(yōu)于K-means算法。由于短文本中特征詞較少,在LDA主題模型中會(huì)出現(xiàn)數(shù)據(jù)稀疏性問題,單一的頻繁詞集表示雖然在一定程度上降低了短文本表示的維度,但由于該方法只考慮文本中特征詞的統(tǒng)計(jì)關(guān)系而忽略了上下文語義信息,僅僅使用頻繁詞集對(duì)文本進(jìn)行建模會(huì)大大影響聚類效果。本文提出的基于FWS-BERT的譜聚類算法既使用頻繁詞集挖掘考慮了短文本的統(tǒng)計(jì)信息,又通過BERT句向量中融入了更多的語法、詞法以及語義信息,從而能更準(zhǔn)確地表示文本中詞語之間的潛在語義關(guān)系,達(dá)到了很好的聚類實(shí)驗(yàn)效果。

    2.2.3 話題聚類算法有效性對(duì)比

    為了驗(yàn)證本文提出的改進(jìn)AP聚類算法對(duì)于微博話題聚類的有效性,本文設(shè)置了原始的AP聚類算法、經(jīng)典的K-means算法和本文提出的改進(jìn)AP算法進(jìn)行對(duì)比,其中原始的AP算法使用頻繁詞集作為文本表示,K-means算法分別使用TF-IDF(K-means1)和頻繁詞集(K-means2)文本表示。實(shí)驗(yàn)評(píng)價(jià)指標(biāo)仍采用輪廓系數(shù)和CH值。在實(shí)驗(yàn)過程中,將每個(gè)微博主題下所有文本數(shù)據(jù)當(dāng)成一個(gè)整體,分別對(duì)每個(gè)主題進(jìn)行話題聚類實(shí)驗(yàn),每組實(shí)驗(yàn)運(yùn)行多次,計(jì)算得到聚類結(jié)果的平均輪廓系數(shù)和平均CH值,觀察不同聚類算法在結(jié)果上的差異,實(shí)驗(yàn)結(jié)果如圖7、圖8所示。

    圖7 不同主題下4種聚類方法的輪廓系數(shù)

    圖8 不同主題下4種聚類方法的CH值

    由圖7、圖8的實(shí)驗(yàn)結(jié)果可知,本文提出的改進(jìn)AP聚類算法在輪廓系數(shù)和CH值上均取得了較好的實(shí)驗(yàn)效果。首先,AP算法相比于經(jīng)典的K-means算法而言,不用事先指定每個(gè)主題下聚類的結(jié)果簇?cái)?shù)目,從而對(duì)話題檢測(cè)具有一定的靈活性?;陬l繁詞集的文本表示方法在一定程度上優(yōu)于TF-IDF,主要是頻繁詞集提取的文本特征更加完整,比TF-IDF能夠較為準(zhǔn)確的表示文本。同時(shí),實(shí)驗(yàn)結(jié)果表明,引入MinHash算法計(jì)算文本集合之間的相似度更加符合微博文本的特點(diǎn),能有效實(shí)現(xiàn)對(duì)各個(gè)主題下的微博話題檢測(cè)。

    2.2.4 話題挖掘及熱度評(píng)估實(shí)驗(yàn)

    本實(shí)驗(yàn)主要是驗(yàn)證本文提出的話題挖掘及話題熱度評(píng)估分析方法有效,實(shí)驗(yàn)前在微博熱搜搜索引擎上逐一使用關(guān)鍵詞“新冠”“5G”“直播”查詢每個(gè)主題下各個(gè)話題的熱度值并進(jìn)行記錄和排名。利用本文提出的基于改進(jìn)相似性度量的AP聚類算法對(duì)話題進(jìn)行挖掘,并使用公式(7)話題熱度計(jì)算公式分別計(jì)算每個(gè)主題下各個(gè)話題的熱度值,與所記錄的真實(shí)微博熱度排名進(jìn)行對(duì)比,驗(yàn)證本文方法的有效性。各個(gè)主題下話題表示、話題熱度真實(shí)值及實(shí)驗(yàn)結(jié)果如表4~表6所示。

    表4 新冠主題下話題熱度真實(shí)值及實(shí)驗(yàn)結(jié)果

    表5 5G主題下話題熱度真實(shí)值及實(shí)驗(yàn)結(jié)果

    表6 直播主題下話題熱度真實(shí)值及實(shí)驗(yàn)結(jié)果

    分析表4~表6的實(shí)驗(yàn)結(jié)果,各個(gè)主題下的話題描述詞基本能準(zhǔn)確描述話題內(nèi)容,沒有出現(xiàn)話題描述重疊、無法辨識(shí)話題內(nèi)容的現(xiàn)象。受到采集數(shù)據(jù)和聚類結(jié)果的影響,新冠主題和5G主題各個(gè)話題熱度值排名與真實(shí)的微博熱度值排名稍有偏差,直播主題下各個(gè)話題熱度值與真實(shí)的微博熱度值排名一致。本實(shí)驗(yàn)驗(yàn)證了本文提出的話題挖掘方法及話題熱度評(píng)估分析方法的有效性。

    3 結(jié)束語

    本文針對(duì)傳統(tǒng)的熱點(diǎn)話題發(fā)現(xiàn)方法中存在的單一文本表示不準(zhǔn)確、熱點(diǎn)話題發(fā)現(xiàn)效果差等問題,提出了一種切實(shí)可行的微博熱點(diǎn)話題發(fā)現(xiàn)方法,并通過實(shí)驗(yàn)證明了本文提出的方法在微博主題聚類、話題挖掘、話題熱度評(píng)估等方面是有效的,可為市場(chǎng)行業(yè)的調(diào)研、政府對(duì)輿論的預(yù)警和正確引導(dǎo)提供重要的參考。下一步將在更大規(guī)模的微博數(shù)據(jù)集上研究FWS-BERT模型中α取值問題,進(jìn)一步細(xì)化α取值梯度以得到更為理想的實(shí)驗(yàn)效果。

    猜你喜歡
    熱點(diǎn)話題博文聚類
    第一次掙錢
    誰和誰好
    基于DBSACN聚類算法的XML文檔聚類
    2017年高考作文熱點(diǎn)話題預(yù)測(cè)
    基于SVM的熱點(diǎn)話題跟蹤實(shí)現(xiàn)過程研究
    Review on Tang Wenzhi’s The Gist of Chinese Writing Gamut
    基于改進(jìn)的遺傳算法的模糊聚類算法
    一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
    打電話2
    熱點(diǎn)話題排行榜
    亚洲熟妇熟女久久| av在线天堂中文字幕| 精品乱码久久久久久99久播| 热99在线观看视频| 在线免费观看的www视频| 日本与韩国留学比较| 波多野结衣高清无吗| 日韩精品青青久久久久久| 中文字幕av成人在线电影| 欧美一区二区精品小视频在线| 每晚都被弄得嗷嗷叫到高潮| 国产av在哪里看| 99国产极品粉嫩在线观看| 一级a爱片免费观看的视频| 人人妻人人澡欧美一区二区| 18禁黄网站禁片免费观看直播| 在线视频色国产色| 最好的美女福利视频网| 国产欧美日韩精品亚洲av| 亚洲,欧美精品.| 亚洲av美国av| 欧美色欧美亚洲另类二区| 蜜桃亚洲精品一区二区三区| 热99re8久久精品国产| 噜噜噜噜噜久久久久久91| 欧美黄色片欧美黄色片| 国产精品自产拍在线观看55亚洲| 中文字幕人妻丝袜一区二区| 亚洲精华国产精华精| 亚洲精华国产精华精| 给我免费播放毛片高清在线观看| 首页视频小说图片口味搜索| 日本在线视频免费播放| 国内精品久久久久精免费| 一本综合久久免费| 三级国产精品欧美在线观看| av福利片在线观看| 亚洲精品在线美女| 日韩欧美国产一区二区入口| 五月伊人婷婷丁香| 精品乱码久久久久久99久播| 亚洲精品色激情综合| 两个人视频免费观看高清| 免费看十八禁软件| 狂野欧美白嫩少妇大欣赏| 少妇的丰满在线观看| 色尼玛亚洲综合影院| 亚洲人成网站在线播| 欧美中文综合在线视频| 免费观看精品视频网站| 婷婷亚洲欧美| 黄色成人免费大全| 一区福利在线观看| a级毛片a级免费在线| 性色av乱码一区二区三区2| 欧美xxxx黑人xx丫x性爽| 1024手机看黄色片| 欧美另类亚洲清纯唯美| 免费一级毛片在线播放高清视频| 婷婷亚洲欧美| 91麻豆精品激情在线观看国产| 久久精品影院6| 男人的好看免费观看在线视频| 69av精品久久久久久| 午夜老司机福利剧场| 中文字幕精品亚洲无线码一区| 色综合欧美亚洲国产小说| 亚洲精品乱码久久久v下载方式 | 日韩中文字幕欧美一区二区| 亚洲自拍偷在线| 在线观看一区二区三区| 淫秽高清视频在线观看| 狠狠狠狠99中文字幕| 国产精品久久久久久人妻精品电影| 日本黄色片子视频| 精品国内亚洲2022精品成人| 国内精品一区二区在线观看| 欧美不卡视频在线免费观看| 国产精品av视频在线免费观看| 五月玫瑰六月丁香| 亚洲七黄色美女视频| 一本一本综合久久| 欧美极品一区二区三区四区| 丁香六月欧美| 网址你懂的国产日韩在线| 99久久久亚洲精品蜜臀av| 久久国产乱子伦精品免费另类| 亚洲片人在线观看| 18禁在线播放成人免费| 午夜精品在线福利| 精品午夜福利视频在线观看一区| 淫妇啪啪啪对白视频| 小说图片视频综合网站| 日本与韩国留学比较| avwww免费| 欧美黑人欧美精品刺激| 精品久久久久久久毛片微露脸| 亚洲av熟女| 日韩欧美免费精品| 一夜夜www| 少妇高潮的动态图| 国产亚洲精品综合一区在线观看| 国产精品亚洲一级av第二区| 国产真实伦视频高清在线观看 | 精品无人区乱码1区二区| 在线观看免费午夜福利视频| 亚洲男人的天堂狠狠| 国产在线精品亚洲第一网站| 熟妇人妻久久中文字幕3abv| 日韩中文字幕欧美一区二区| 亚洲专区国产一区二区| h日本视频在线播放| 亚洲一区二区三区色噜噜| 丁香欧美五月| 欧美午夜高清在线| 欧美成人性av电影在线观看| 很黄的视频免费| 亚洲第一欧美日韩一区二区三区| 99久久成人亚洲精品观看| 国产成+人综合+亚洲专区| 免费av观看视频| 中文资源天堂在线| 欧美日韩精品网址| 18禁在线播放成人免费| 操出白浆在线播放| 国产精品嫩草影院av在线观看 | 精品欧美国产一区二区三| 在线看三级毛片| 久久久久性生活片| 亚洲国产欧美网| 小说图片视频综合网站| 午夜福利欧美成人| 一个人免费在线观看电影| 国产伦人伦偷精品视频| 日韩有码中文字幕| 国产伦精品一区二区三区四那| 国产精品1区2区在线观看.| 午夜福利高清视频| 亚洲国产精品合色在线| 五月伊人婷婷丁香| 女生性感内裤真人,穿戴方法视频| 亚洲内射少妇av| 欧美zozozo另类| 久9热在线精品视频| 欧美一级毛片孕妇| 国产激情欧美一区二区| 又粗又爽又猛毛片免费看| 国产精品av视频在线免费观看| 久久久精品欧美日韩精品| 18禁裸乳无遮挡免费网站照片| 免费在线观看成人毛片| 中文字幕av在线有码专区| 国产视频一区二区在线看| 亚洲乱码一区二区免费版| 欧美一区二区精品小视频在线| 午夜福利欧美成人| 精品国产三级普通话版| 中文字幕熟女人妻在线| 亚洲av免费高清在线观看| e午夜精品久久久久久久| 欧美日本视频| 久久久久久人人人人人| 国产精品一区二区三区四区久久| 亚洲国产精品成人综合色| 亚洲人成电影免费在线| 亚洲在线观看片| 在线十欧美十亚洲十日本专区| 欧美一区二区精品小视频在线| 一进一出好大好爽视频| 日本a在线网址| 精品久久久久久久毛片微露脸| 99国产综合亚洲精品| 成人特级av手机在线观看| 狠狠狠狠99中文字幕| 一进一出抽搐动态| 欧美国产日韩亚洲一区| 国内精品一区二区在线观看| 欧美av亚洲av综合av国产av| 国产国拍精品亚洲av在线观看 | 久久久久久久精品吃奶| 在线播放国产精品三级| 亚洲午夜理论影院| 男人舔奶头视频| 亚洲av免费在线观看| 观看美女的网站| 一本一本综合久久| 法律面前人人平等表现在哪些方面| 日韩大尺度精品在线看网址| 伊人久久精品亚洲午夜| 无遮挡黄片免费观看| 国产成年人精品一区二区| 夜夜爽天天搞| 少妇的丰满在线观看| 亚洲国产欧美网| 熟女电影av网| 久久国产乱子伦精品免费另类| 深夜精品福利| 欧美黑人巨大hd| 成年女人毛片免费观看观看9| 国产高清videossex| 国产精品国产高清国产av| 亚洲专区中文字幕在线| 亚洲熟妇中文字幕五十中出| 久久久久久久精品吃奶| 最近最新中文字幕大全电影3| 国产乱人伦免费视频| 在线视频色国产色| av视频在线观看入口| 女人被狂操c到高潮| 一级毛片女人18水好多| av天堂中文字幕网| 一二三四社区在线视频社区8| 免费看十八禁软件| 最新美女视频免费是黄的| 久久精品亚洲精品国产色婷小说| 神马国产精品三级电影在线观看| 少妇人妻一区二区三区视频| 久久久久久久精品吃奶| 午夜精品一区二区三区免费看| 免费av不卡在线播放| 美女免费视频网站| 欧美黑人欧美精品刺激| www国产在线视频色| 久久久久免费精品人妻一区二区| 久久欧美精品欧美久久欧美| 日本精品一区二区三区蜜桃| 在线免费观看不下载黄p国产 | 大型黄色视频在线免费观看| 亚洲国产精品sss在线观看| 99久久无色码亚洲精品果冻| 好男人在线观看高清免费视频| 欧美日韩亚洲国产一区二区在线观看| 国产伦在线观看视频一区| 成人av一区二区三区在线看| 久久国产乱子伦精品免费另类| 亚洲精品一卡2卡三卡4卡5卡| 欧美+亚洲+日韩+国产| 日本精品一区二区三区蜜桃| 99国产精品一区二区蜜桃av| 亚洲av日韩精品久久久久久密| 久久午夜亚洲精品久久| 九色国产91popny在线| 又黄又粗又硬又大视频| 国产高清视频在线播放一区| 国产不卡一卡二| 18美女黄网站色大片免费观看| 色av中文字幕| 波多野结衣巨乳人妻| 999久久久精品免费观看国产| 黄色女人牲交| 51午夜福利影视在线观看| 欧美日韩乱码在线| 国产麻豆成人av免费视频| 亚洲18禁久久av| 亚洲av一区综合| a在线观看视频网站| 99久久综合精品五月天人人| 伊人久久精品亚洲午夜| 美女免费视频网站| 亚洲av一区综合| 很黄的视频免费| 天堂影院成人在线观看| 在线a可以看的网站| 女人高潮潮喷娇喘18禁视频| 久久精品综合一区二区三区| 欧美成人一区二区免费高清观看| 夜夜躁狠狠躁天天躁| 天堂av国产一区二区熟女人妻| 亚洲一区二区三区色噜噜| 国产欧美日韩一区二区三| 色播亚洲综合网| 又爽又黄无遮挡网站| 狂野欧美激情性xxxx| 99热精品在线国产| 一级黄色大片毛片| 国产精品av视频在线免费观看| 欧美成人性av电影在线观看| 国产高清videossex| 欧美三级亚洲精品| www.999成人在线观看| 国产精品嫩草影院av在线观看 | 亚洲人与动物交配视频| 久久久久免费精品人妻一区二区| 久久中文看片网| xxxwww97欧美| 搡老熟女国产l中国老女人| 久久这里只有精品中国| 热99re8久久精品国产| 伊人久久精品亚洲午夜| 国产一区在线观看成人免费| 一个人免费在线观看电影| 欧美色欧美亚洲另类二区| 又爽又黄无遮挡网站| 中文字幕av在线有码专区| 亚洲 国产 在线| 久久久久久久久久黄片| 最后的刺客免费高清国语| 内地一区二区视频在线| 99视频精品全部免费 在线| 他把我摸到了高潮在线观看| 一本久久中文字幕| 午夜久久久久精精品| 动漫黄色视频在线观看| 天堂√8在线中文| 一卡2卡三卡四卡精品乱码亚洲| 欧美精品啪啪一区二区三区| 国产精品久久久人人做人人爽| 99riav亚洲国产免费| 99热这里只有是精品50| 成人特级黄色片久久久久久久| 一级a爱片免费观看的视频| 亚洲av第一区精品v没综合| 国产在线精品亚洲第一网站| 免费在线观看影片大全网站| 国产精品日韩av在线免费观看| 中文字幕精品亚洲无线码一区| 亚洲国产日韩欧美精品在线观看 | 免费看美女性在线毛片视频| 桃色一区二区三区在线观看| 老司机深夜福利视频在线观看| 白带黄色成豆腐渣| 99国产极品粉嫩在线观看| www日本黄色视频网| 国产伦人伦偷精品视频| 欧美另类亚洲清纯唯美| 久久欧美精品欧美久久欧美| 夜夜爽天天搞| 国内精品一区二区在线观看| 露出奶头的视频| 国产av一区在线观看免费| 国产男靠女视频免费网站| www.www免费av| 好看av亚洲va欧美ⅴa在| 色吧在线观看| 国产亚洲精品久久久com| 中文字幕高清在线视频| 最新中文字幕久久久久| 黄片大片在线免费观看| 亚洲va日本ⅴa欧美va伊人久久| 国产成人福利小说| 国内精品久久久久精免费| 男女做爰动态图高潮gif福利片| 免费在线观看成人毛片| 91字幕亚洲| a在线观看视频网站| 国内精品一区二区在线观看| 一个人免费在线观看电影| 淫妇啪啪啪对白视频| 欧美日本亚洲视频在线播放| 99riav亚洲国产免费| 日日夜夜操网爽| 精品国产亚洲在线| 嫩草影院精品99| 亚洲第一欧美日韩一区二区三区| 精品国产超薄肉色丝袜足j| 在线观看一区二区三区| 婷婷丁香在线五月| 每晚都被弄得嗷嗷叫到高潮| 精品免费久久久久久久清纯| e午夜精品久久久久久久| 悠悠久久av| 搡老妇女老女人老熟妇| 亚洲精品美女久久久久99蜜臀| 日本在线视频免费播放| 午夜精品一区二区三区免费看| 国产伦精品一区二区三区四那| 免费大片18禁| aaaaa片日本免费| 少妇人妻一区二区三区视频| avwww免费| 色在线成人网| 18禁黄网站禁片免费观看直播| 国产三级在线视频| 国产一级毛片七仙女欲春2| 在线观看免费视频日本深夜| 国产三级中文精品| 日韩成人在线观看一区二区三区| 午夜免费观看网址| 天美传媒精品一区二区| 99riav亚洲国产免费| 国产av麻豆久久久久久久| 亚洲精品日韩av片在线观看 | 色哟哟哟哟哟哟| 亚洲熟妇熟女久久| 国产69精品久久久久777片| 在线观看66精品国产| 亚洲无线在线观看| 欧洲精品卡2卡3卡4卡5卡区| 日韩欧美 国产精品| 一二三四社区在线视频社区8| 欧美色视频一区免费| 亚洲在线自拍视频| 精品久久久久久,| 老鸭窝网址在线观看| 午夜久久久久精精品| 久久欧美精品欧美久久欧美| 亚洲av熟女| www.熟女人妻精品国产| 国产精品综合久久久久久久免费| 狠狠狠狠99中文字幕| 欧美一级a爱片免费观看看| 欧美日本亚洲视频在线播放| 欧美乱妇无乱码| 内射极品少妇av片p| 国产精品一及| 中出人妻视频一区二区| 精品国产亚洲在线| 色精品久久人妻99蜜桃| 搞女人的毛片| 亚洲内射少妇av| 亚洲avbb在线观看| 大型黄色视频在线免费观看| 一本久久中文字幕| 内射极品少妇av片p| 国产高清激情床上av| av女优亚洲男人天堂| 欧美日韩国产亚洲二区| 国产精品免费一区二区三区在线| 亚洲人成电影免费在线| 精品一区二区三区视频在线观看免费| а√天堂www在线а√下载| 欧美一级a爱片免费观看看| 五月伊人婷婷丁香| 三级毛片av免费| 手机成人av网站| 久久精品综合一区二区三区| 在线免费观看不下载黄p国产 | 青草久久国产| 精品午夜福利视频在线观看一区| 国产欧美日韩精品一区二区| 国产精品亚洲美女久久久| 欧美区成人在线视频| 亚洲精品在线观看二区| 草草在线视频免费看| 精品国产美女av久久久久小说| 男插女下体视频免费在线播放| 免费观看精品视频网站| 在线十欧美十亚洲十日本专区| 人人妻人人澡欧美一区二区| 99在线人妻在线中文字幕| 欧美xxxx黑人xx丫x性爽| xxxwww97欧美| 女人被狂操c到高潮| 亚洲av中文字字幕乱码综合| av天堂中文字幕网| 丁香欧美五月| 99国产综合亚洲精品| 夜夜夜夜夜久久久久| 长腿黑丝高跟| 午夜精品在线福利| 成人永久免费在线观看视频| 亚洲精品成人久久久久久| 麻豆成人午夜福利视频| 全区人妻精品视频| 51午夜福利影视在线观看| 日日夜夜操网爽| 国产主播在线观看一区二区| 国产麻豆成人av免费视频| 久久国产精品影院| 成人无遮挡网站| 草草在线视频免费看| 禁无遮挡网站| 国内精品美女久久久久久| 欧美成狂野欧美在线观看| 久久精品91蜜桃| 成年人黄色毛片网站| 国产午夜福利久久久久久| 国产亚洲精品久久久com| 又黄又爽又免费观看的视频| 亚洲18禁久久av| 日韩成人在线观看一区二区三区| 有码 亚洲区| 国产69精品久久久久777片| 小说图片视频综合网站| 乱人视频在线观看| 日韩大尺度精品在线看网址| av欧美777| 国产成人影院久久av| a级一级毛片免费在线观看| 午夜a级毛片| 久9热在线精品视频| 啦啦啦韩国在线观看视频| 久久国产乱子伦精品免费另类| 偷拍熟女少妇极品色| 18禁黄网站禁片午夜丰满| av专区在线播放| 亚洲欧美日韩无卡精品| 母亲3免费完整高清在线观看| 天堂网av新在线| 人人妻人人澡欧美一区二区| 99国产精品一区二区蜜桃av| 高潮久久久久久久久久久不卡| 久久国产乱子伦精品免费另类| 老鸭窝网址在线观看| 免费在线观看日本一区| 亚洲欧美日韩无卡精品| 午夜免费激情av| 亚洲无线观看免费| 美女黄网站色视频| 欧美黄色淫秽网站| 精品一区二区三区视频在线观看免费| 欧美性感艳星| 久久人妻av系列| 97碰自拍视频| 欧美在线一区亚洲| h日本视频在线播放| 久久性视频一级片| 中文字幕av成人在线电影| 免费在线观看成人毛片| 少妇丰满av| 国产高清videossex| 五月玫瑰六月丁香| 精品久久久久久久人妻蜜臀av| 极品教师在线免费播放| 日韩精品中文字幕看吧| 久久久久九九精品影院| 91久久精品电影网| 成人鲁丝片一二三区免费| avwww免费| 国产在线精品亚洲第一网站| 女生性感内裤真人,穿戴方法视频| 国产伦在线观看视频一区| 久久亚洲真实| 国产免费一级a男人的天堂| 热99re8久久精品国产| 美女免费视频网站| 在线播放国产精品三级| 久久精品影院6| 国产熟女xx| 免费搜索国产男女视频| 麻豆久久精品国产亚洲av| 三级毛片av免费| 精华霜和精华液先用哪个| av黄色大香蕉| 床上黄色一级片| 99热精品在线国产| 观看美女的网站| 亚洲精品一卡2卡三卡4卡5卡| 午夜福利视频1000在线观看| 久久精品人妻少妇| 91麻豆av在线| 国产91精品成人一区二区三区| 啦啦啦观看免费观看视频高清| 国产精品爽爽va在线观看网站| 国产精品国产高清国产av| 嫁个100分男人电影在线观看| 91字幕亚洲| 亚洲第一欧美日韩一区二区三区| 精品国产美女av久久久久小说| 免费一级毛片在线播放高清视频| 亚洲七黄色美女视频| 欧美区成人在线视频| 18禁黄网站禁片午夜丰满| eeuss影院久久| 国产又黄又爽又无遮挡在线| 久久久国产精品麻豆| 色老头精品视频在线观看| 毛片女人毛片| av天堂在线播放| 欧美极品一区二区三区四区| 精品乱码久久久久久99久播| 久久精品国产综合久久久| 亚洲国产精品成人综合色| 日本黄色视频三级网站网址| 国产视频内射| 国产高清激情床上av| svipshipincom国产片| 国产真人三级小视频在线观看| 高清毛片免费观看视频网站| a在线观看视频网站| 欧美成人免费av一区二区三区| 午夜福利18| 国产成人欧美在线观看| 午夜影院日韩av| 99久久精品国产亚洲精品| 久久久久久人人人人人| 久久久久久久精品吃奶| 欧美国产日韩亚洲一区| 亚洲美女黄片视频| 中文字幕精品亚洲无线码一区| 国产探花极品一区二区| 大型黄色视频在线免费观看| 久久6这里有精品| 看片在线看免费视频| 亚洲av免费在线观看| 亚洲男人的天堂狠狠| 一级a爱片免费观看的视频| 国产真实乱freesex| ponron亚洲| 非洲黑人性xxxx精品又粗又长| 搡老熟女国产l中国老女人| 淫秽高清视频在线观看| 亚洲中文日韩欧美视频| 综合色av麻豆| 欧洲精品卡2卡3卡4卡5卡区| 久久久成人免费电影| 天堂影院成人在线观看| 亚洲av美国av| 国产成人a区在线观看| 日本精品一区二区三区蜜桃| 欧美一级a爱片免费观看看| 天堂√8在线中文| 人人妻人人看人人澡| 国产精品 国内视频| 老熟妇仑乱视频hdxx| 国产97色在线日韩免费| 久久精品国产清高在天天线| 色综合婷婷激情| 午夜老司机福利剧场| 久久久久亚洲av毛片大全| 级片在线观看| 舔av片在线| 99视频精品全部免费 在线| 最新在线观看一区二区三区| 88av欧美|