• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于層疊條件隨機場的微博熱點話題跟蹤

    2016-05-09 07:07:30馮旭鵬劉利軍黃青松
    計算機應用與軟件 2016年4期
    關鍵詞:熱點話題詞典閾值

    戴 丹 胡 楊 劉 驪 馮旭鵬 劉利軍 黃青松,2

    基于層疊條件隨機場的微博熱點話題跟蹤

    戴 丹1胡 楊1劉 驪1馮旭鵬3劉利軍1黃青松1,2

    1(昆明理工大學信息工程與自動化學院 云南 昆明 650500)

    2(云南省計算機技術應用重點實驗室 云南 昆明 650500)

    3(昆明理工大學教育技術與網(wǎng)絡中心 云南 昆明 650500)

    微博文本的數(shù)據(jù)稀疏特性,使傳統(tǒng)話題跟蹤技術只能捕獲部分話題微博且準確度不高。同時,在追蹤過程中,話題會出現(xiàn)漂移現(xiàn)象。針對以上兩個問題,提出一種基于層疊條件隨機場的微博熱點話題跟蹤方法。該方法先通過標識模型標識出可能相關的微博,源熱點微博和標識微博分別作為分類模型的觀察序列和狀態(tài)序列來計算相關度分類。其次,通過構造自適應模型對識別模型進行更新且削弱數(shù)據(jù)稀疏問題,并從相關微博中選取新的觀察序列,其余作為新的狀態(tài)序列進行迭代分類處理。實驗表明,該方法比傳統(tǒng)方法綜合指標F值平均提升4.13%。

    話題跟蹤 話題漂移 層疊條件隨機場 話題詞典

    0 引 言

    微博憑借開放性、低門檻、短文本等特性,已成為一個新興的網(wǎng)絡服務平臺。大量用戶在微博中參與話題討論,導致微博每天產(chǎn)生大量涉及多個熱點話題的信息。微博熱點話題,代表網(wǎng)民當前關注的重點,其內(nèi)容隨時間的發(fā)展而變化。某些微博可能只是某熱點話題中的一部分,并不能體現(xiàn)其完整性。所以,如何從海量微博中挖掘出熱點話題的發(fā)展走向具有重大的實際意義[1]。通過話題跟蹤,將熱點話題的相關微博組織起來,用戶可以即時了解微博熱點與輿論主題。相關政府部門和企業(yè)等機構可以了解民眾對特定話題的態(tài)度和發(fā)展動態(tài),對微博中輿論的傳播與方向進行恰當引導,保證用戶合理表達微博網(wǎng)絡傳播的正確秩序。

    本文對傳統(tǒng)話題跟蹤方法準確度不高且只能捕獲部分話題問題,在微博熱點話題跟蹤過程中采用層疊條件隨機場CCRFs(Cascaded CRFs)來解決。該方法通過多個條件隨機場 CRFs(Conditional Random Fields)建立CCRFs模型來分別對微博進行標識、分類和實體識別從而實現(xiàn)話題跟蹤和緩解話題漂移。實驗結果表明,該方法對于微博話題跟蹤具有較好效果。

    1 相關研究

    針對微博話題跟蹤研究的基礎方法[2]是計算文檔之間的相似性,從而判別是否與該話題相關。張劍峰等人[3]指出微博話題在進行相似性計算時,常常會伴隨數(shù)據(jù)稀疏問題,對話題跟蹤性能產(chǎn)生嚴重影響。針對數(shù)據(jù)稀疏問題,Liu等人[4]提出選擇詞性豐富的詞匯作為初始特征,并將這些詞匯通過HowNet的相關語義進行擴展,這樣短文本就有更多有用特征,最終克服微博文本的數(shù)據(jù)稀疏問題。Sriram等人[5]考慮到短文本沒有提供充足的詞信息,選取了八類特征(作者信息,話題時間短語等)。加入這些特征后,分類性能得到了顯著提高,改善了數(shù)據(jù)稀疏問題。在微博話題跟蹤方面Lin等人[6]利用基于復雜的分類器過濾博文流,提出了面向在線語言模型的平滑技術跟蹤微博流中的話題。Swit等人[7]提出在名詞上增加權值并根據(jù)熱點流行度和可信度因素來收集、分組、排序以及跟蹤Twitter中的突發(fā)新聞方法。上述研究工作對話題追蹤有良好效果,但由于初始信息相對稀疏,并只是發(fā)現(xiàn)利用微博部分特點與現(xiàn)象,無法有效跟蹤一段時期以后微博話題的發(fā)展。且在話題追蹤過程中,話題會動態(tài)發(fā)展并產(chǎn)生話題漂移現(xiàn)象。以上方法無法緩解話題漂移現(xiàn)象,識別不了最新相關話題。

    為解決話題漂移現(xiàn)象,王會珍等人[8]提出基于反饋學習自適應的中文話題追蹤,其方法是采用增量學習的思想并考慮時序性,提出在話題跟蹤中的自適應學習算法,此算法可以解決話題漂移現(xiàn)象,還可以彌補現(xiàn)有自適應方法的不足。張輝等人[9]提出基于三維文檔向量的自適應話題追蹤器模型,此模型在追蹤過程中可根據(jù)事件的發(fā)展動態(tài)來進行自我學習和自我修正,在避免話題漂移方面具有一定優(yōu)勢。郝秀蘭等人[10]在中文論壇內(nèi)容監(jiān)測方法的研究上提出了將話題表示為種子向量與后續(xù)學習的改進模型,在此模型上運用最新的命名實體權重調(diào)節(jié)策略,緩解了話題漂移現(xiàn)象。由于上述文獻提出的方法并不是針對微博,且微博具有社交、實時更新等特性,對于緩解話題漂移存在一定困難,并不適用于本文所研究工作的場景。

    針對話題跟蹤過程中存在的相似度計算與話題漂移現(xiàn)象,本文分別引入條件隨機場模型來解決這些問題。CRFs模型[11]可很好地捕捉上下文信息,它克服了最大熵等模型的標記偏置問題,同時,能夠考慮節(jié)點之間的聯(lián)系,從而利用上下文特征獲得全局最優(yōu)的標注結果。近年來,在詞性標注、命名實體識別等自然語言處理方面具有較好的應用效果[12]。由于本方法需要CRFs來實現(xiàn)微博標識、分類與實體識別的多任務處理,僅單層CRFs達不到最佳效果,因此引入了CCRFs模型[13,14]。

    2 CCRFs微博熱點話題跟蹤模型

    對微博話題進行跟蹤是一項復雜的任務,在本方法中,將該復雜任務分解為微博標識、微博分類與實體識別等子任務,再分別對每一個子任務使用條件隨機模型,故通過CCRFs模型來對本文任務進行處理。每項任務之間相互聯(lián)系與利用,上一模型得到的結果作為下一個模型的起始條件。本文微博熱點話題追蹤任務模型如圖1所示,該模型由3個模塊構成:標識模型(M1);分類模型(M2);自適應模型(M3)。模型的輸入是采集到的文本,輸出是熱點微博話題追蹤結果。

    圖1 基于CCRFs微博熱點話題跟蹤模型

    標識模型(M1)為整個CCRFs模型建立基礎,它對采集到的文本判斷是否存在可能與熱點話題相關的微博,主要是通過特征來標識篩選出一部分可能相關的微博,防止以后大量冗余操作。分類模型(M2)起過渡作用,從標識模型得到結果作為輸入條件,經(jīng)處理把輸出結果作為自適應模型的條件。該模型主要功能是對標識模型中得到的微博通過計算其與源熱點話題微博的相關度來分類。自適應模型(M3)主要是為了緩解話題漂移現(xiàn)象并實現(xiàn)話題深層次的跟蹤。對分類模型中得到的相關微博進行實體識別填充到話題詞典中,擴充特征并更新標識模型。通過模型迭代得出其余相關微博,防止漏檢話題微博。通過以上三個模型相互結合形成CCRFs模型來實現(xiàn)微博熱點話題追蹤。

    2.1 標識模型

    標識模型是整個層疊條件隨機場模型的基礎,通過該模型標識獲得可能與熱點話題相關的微博,得到結果為分類模型的輸入。本節(jié)內(nèi)容主要描述CRFs模型標識過程。

    2.1.1 CRFs特征選取

    條件隨機場模型有一個很好很重要的特性就是可以任意靈活定義各種特征,以構建相應模型。在分析熱點微博的基礎上,發(fā)現(xiàn)熱點話題相關微博文本形式復雜多樣,且存在不正式語法表達,若從語法方面來選取特征,隨話題跟蹤一段時間后其特征存在一定的不確定性。從微博內(nèi)容表達的主題來看,對于熱點話題主要是事件的發(fā)展,事件主要是由時間、地點、人物和相關機構描述而成。故考慮話題詞典特征。用戶發(fā)表微博字數(shù)不能超過140個字符,但如果內(nèi)容長度太短則包含話題有效信息較少,故考慮內(nèi)容長度特征。如表1所示。

    表1 CRFs特征表

    話題詞典特征主要是建立時間詞典,地點詞典、人物詞典和機構詞典。時間,地點,人物和相關機構都是追蹤話題的基本和重要要素。時間和機構詞典,通過語料識別,把熱點事件發(fā)生時間與相關機構加入詞典中。對于地點詞典,先把熱點話題包含的地點存入詞典中,接著通過地名大全和地名替換詞庫等進行擴充,添加地點名的子地點、父地點和替換地點。比如:話題為“云南魯?shù)榈卣稹保攸c詞典則收入昭通市、文屏鎮(zhèn)或滇等地名。人物詞典構造跟地點詞典一樣需擴展。如:“郭美美事件”中人物有郭美美,還可有與其相關人物,如其干爹王軍,中國紅十字會常委副會長趙白鴿等。

    內(nèi)容長度的描述為:微博去除停用詞后詞匯的數(shù)目。微博具有短文本特性,但當微博內(nèi)容長度低于某一個閾值時,包含熱點話題的概率極低。通過多次實驗比較,選擇閾值為10。

    2.1.2 CRFs模型標識微博

    針對CRFs模型中因特征單一而導致模型標注識別準確度不高問題,本文將所選特征進行組合,形成復合特征模板。

    CRFs模型對采集文檔進行標識,將檢測話題可能相關微博的問題轉(zhuǎn)化為序列標注問題,即通過對文檔序列標注的方法,確定其包含話題相關微博。標識過程如下:1) 通過話題詞典的時間、地點、人物和機構中的任意一個特征為序列中的話題事件賦予對應的角色標簽;2) 為已經(jīng)標注的微博貼上邊界標簽,并判斷內(nèi)容長度是否大于閾值10。在1)中,根據(jù)朱莎莎等人[15]的標注方法,分別引入時間標簽集Time={T,N}、地點標簽集Loc={L,N}、人物標簽集Per={P,N}和機構標簽集Org={O,N}對句子中的每個詞賦予一個標記。每個標記代表詞在微博中的位置,T、L、P、O分別標識詞在該事件中代表的角色,N標識其他詞。對于2),借鑒組塊分析中的{B,I,E}標簽集,B表示微博開始,I表示中間,E表示結尾。根據(jù)這種表示方法,文本根據(jù)標識語料被映射成獨立標記的微博段落,并轉(zhuǎn)換為序列標識問題。如“2014年8月3號下午4點30分,昭通魯?shù)?.5級地震魯?shù)榭h龍頭山鎮(zhèn)龍井村房屋倒塌嚴重”,標記為“2014年/B/T8月/I/T3號/I/T下午/I/N4點/I/T30分/I/T,昭通/I/L魯?shù)?I/L6.5級/I/N地震/I/N魯?shù)榭h/I/L龍頭山鎮(zhèn)/I/L龍井村/I/L房屋/I/N倒塌/I/N嚴重/E/N”。在此表示方法上進行話題詞典與長度特征選擇,即將獲得話題可能相關微博任務轉(zhuǎn)化為序列標注問題。

    2.2 分類模型

    由于CRFs模型可以計算在給定輸入序列時指定輸出序列的概率值,通過其概率值來判別是否相關。微博話題跟蹤過程中,傳統(tǒng)方法計算相似度存在一定困難,本文通過特征擴充與CRFs模型計算相關性來進行追蹤,提出了一種解決數(shù)據(jù)稀疏問題的分類模型。標識模型用于識別出可能與熱點話題相關的微博,分類模型則是對標識模型得到的結果進行優(yōu)化,以進一步確定相關度。在該模型中源熱點話題微博作為輸入序列,從標識模型中得到的標識微博作為輸出序列。在對序列進行模型表示時,本文借鑒Liu[4]的方法通過大量不同的詞性標注信息并根據(jù)HowNet對每個詞匯進行擴充,拓展詞性特征,使短文本具有更多的特征。

    根據(jù)CRFs模型來計算輸入微博序列生成輸出序列的相關度,相關度用概率值來表征。本文微博跟蹤過程中X={x1,x2,…,xn}表示在不同模型中輸入的微博觀察序列,即分類模型中源熱點話題微博、自適應模型中與熱點話題相關的微博,隨機變量Y={y1,y2,…,yn}表示在給定觀察序列下其對應的微博輸出序列,即分類模型中標識后的微博、自適應模型中與熱點話題不相關的微博。在給定觀測序列X,生成輸出序列Y的概率分布P(Y|X)公式如下:

    (1)

    其中Z(x)是歸一化因子,公式如下:

    (2)

    其中,sl和tk是特征函數(shù),μl和λk是對應的權值。給定訓練微博{(xk,yk)}預定義的特征函數(shù),可以從微博樣本中學習一個CRFs模型。微博樣本參數(shù)Λ={μl,λk}采用L-BFGS(Limited Memory BFGs)算法[15]來求解最優(yōu)值。若概率值大于閾值μ,說明此微博跟話題相關并把得到的相關微博作為自適應模型的輸入條件。若不大于,則不相關。

    2.3 自適應模型

    針對在話題追蹤過程中會產(chǎn)生話題漂移現(xiàn)象,本方法設計了自適應模型,可削弱先驗數(shù)據(jù)稀疏造成信息的不完備性,并通過不斷的自適應學習能力來更新標識模型,最終提高CCRFs模型跟蹤話題發(fā)展的能力,緩解話題漂移現(xiàn)象。其具體實現(xiàn)為從分類模型得到相關微博集中選取兩篇作為輸入序列,剩余微博作為輸出序列,計算相關度并進行迭代計算。選取規(guī)則為:

    (1) 分類模型中得到的概率值P={P1,P2,…,Pi},其最大概率為Pmax,最小概率為Pmin,平均概率為Pavg。

    (2) 比較概率值P中哪兩個概率值是與Px和Py最相近,對應微博就為下一次計算的觀察序列。概率Px和Py的計算公式如下:

    (3)

    (4)

    為緩解話題漂移現(xiàn)象,需對話題詞典進行擴充,根據(jù)邱泉清等人[16]使用CRFs模型對微博命名實體識別,把相關微博里面的人名、地點和機構添加到對應的詞典庫中,對于時間的識別,利用朱莎莎等[14]基于條件隨機場的中文時間短語識別方法,把時間短語加入到話題時間詞典庫中以提升下一次的識別效果。為了保證迭代的收斂與后效性,在不相關微博數(shù)小于k值時結束迭代過程。對于k值選取規(guī)則如下:

    如果k取值較大,不能對熱點話題進行完整的追蹤。若k取值較小,話題跟蹤信息冗余并且增加復雜度和運算量。本實驗中,通過估計相關話題熱點占標識微博的百分比,選擇k=35%作為閾值。實驗完整設計流程如下:

    Step1 基于時間段閾值獲取微博文本語料,在此設置閾值為一小時。

    Step2 根據(jù)語料選取熱點話題特征,第一層CRFs模型對其微博進行標識與提取。

    Step3 提取出來的微博段落作為輸出序列,源熱點微博作為輸入序列S,第二層CRFs模型來計算輸入序列S得到每一篇輸出序列Oi的概率Pi。

    Step4 如果Pi大于等于閾值μ,其輸出序列Oi跟熱點話題相關,否則就不相關。

    Step5 通過第三層CRFs模型實體識別把相關微博中時間、地點、人物和相關機構短語添加到對應話題詞典庫中。

    Step6 從相關話題集中根據(jù)規(guī)則挑選兩篇微博作為輸入序列S′={S1,S2},剩余不相關微博作為輸出序列O′={O1,O2,…,Oj},通過CRFs模型來計算輸入序列得到每一篇輸出序列Oj的概率Pj。

    Step7 重復Step4-Step6,直到輸出序列的微博數(shù)小于k值,結束迭代過程。

    3 實驗及結果分析

    3.1 實驗語料的準備與過程設計

    本實驗采用的語料是從新浪微博上從2014年8月01日至2014年8月10日每天上午9點到下午16點每隔一小時采集的文本共70篇,每一篇包含該時間段中發(fā)表的微博且作為一個段落,獲取微博內(nèi)容和發(fā)表時間。經(jīng)預處理識別,包括5個熱點話題:臺灣高雄燃氣爆炸、天津動物園老虎骨瘦如柴、李承鉉求婚戚薇、昆山中榮工廠爆炸、云南魯?shù)榈卣稹?/p>

    3.2 實驗結果分析

    在實驗中,采用準確率(P),召回率(R),綜合指標(F)值作為評價的標準。

    (6)

    (7)

    (8)

    其中a表示已經(jīng)跟蹤到與原熱點話題相關的微博數(shù),b為跟蹤到但跟原熱點話題不相關的博文數(shù),c表示為沒有跟蹤到與原熱點話題相關的博文數(shù)。

    3.2.1 閾值μ的調(diào)整

    閾值μ對CCRFs模型有著重要的影響,控制著實驗的準確度,μ值是對CCRFs中分類模型概率的判別,如果μ值設置過高,則后續(xù)相關話題微博的漏檢率加大,會遺落一些話題的發(fā)展趨勢。如果μ值較小,引入大量噪聲,而造成不必要的信息發(fā)展,導致跟蹤方向偏差。通過五個話題的源微博與標識后的微博進行多次概率生成實驗,取P、R和F的平均值結果如表2所示。當μ=0.3時,在準確率P和召回率R之間得到較好的平衡點,因此,在CCRFs模型中,選擇μ=0.3作為閾值。

    表2 閾值μ實驗結果

    3.2.2 話題跟蹤對比實驗

    在本文方法和傳統(tǒng)相似度計算的方法上進行話題跟蹤,通過兩種方法的對比,得到結果如表3所示,本實驗中選擇向量空間模型VSM(Vector Space Model)為基本模型。本文方法比基本模型得到的準確率和召回率都有一定提高,且F值平均提高了4.13%。

    表3 基本模型與CCRFs模型方法對比結果

    在不同時間段,話題走向會發(fā)生變化,本文選擇影響力較大的“云南魯?shù)榈卣稹边M行基于時間段網(wǎng)友討論話題的變化,話題的發(fā)展如圖2、圖3。圖2為基本模型的子話題曲線圖,圖3為CCRFs模型的子話題曲線圖,圖中橫坐標以每4小時為單位,縱坐標分別代表每個子話題在該時間段獲得的話題微博與所有相關微博的比例。實驗每隔4小時統(tǒng)計微博數(shù),在每天的0~4和4~7點間微博數(shù)較之平常下將很多。獲取語料是從8月1號到10號,故對于災后重建的話題微博數(shù)較少,大部分是關于地震傷亡情況與救災活動的微博。從圖3中觀察到在8月6號20點左右,由于某名人團體發(fā)起的救援活動以致救災活動話題微博數(shù)突增。在8月9號與10號,因9號是“七日祭”、10號全國默哀3分鐘故關于地震傷亡情況話題微博數(shù)劇增。其子話題分別經(jīng)歷了:地震傷亡情況、救災活動、災后處理工作三個階段。

    圖2 基本模型子話題發(fā)展趨勢

    圖3 CCRFs模型子話題發(fā)展趨勢

    通過圖2、圖3比較可以看出在對災后處理工作的追蹤過程中,基本模型獲取到的子話題只有兩個,且關于救災活動話題微博的捕獲能力不如CCRFs模型,基本模型幾乎沒有獲取到與災后處理話題相關的微博,而本實驗模型卻完全捕獲了其相關微博。話題從地震發(fā)生到災后重建已發(fā)生了漂移,CCRFs模型能夠較準確地跟隨子話題的發(fā)展,追蹤到全部三個子話題,而基本模型遺漏了災后處理子話題,且對救災話題捕獲能力不足??梢姳疚姆椒ū葌鹘y(tǒng)方法能夠更好地應對話題漂移現(xiàn)象。

    本實驗能緩解話題漂移現(xiàn)象,其中自適應話題模型起了重大作用。該模型通過對話題相關微博進行實體識別填充了話題詞典從而實現(xiàn)對初始模型的更新,并對是否相關進行了迭代的模型計算,防止大量救災話題與災后處理話題微博被漏檢而沒跟蹤到相關信息。

    4 結 語

    本文對微博熱點話題跟蹤采用了基于層疊條件隨機場方法,基于三層模型對微博話題進行跟蹤并在此過程中考慮到了話題漂移現(xiàn)象,根據(jù)自適應模型對話題漂移現(xiàn)象進行緩解,通過實驗與傳統(tǒng)方法進行比較。實驗結果表明,本方法在一定程度上提高了微博話題跟蹤的準確率和召回率。但此實驗過程中仍存在一些問題:1) 由于存在話題集中時間跨度短、微博內(nèi)容非正式等問題,話題追蹤的效果會受一定的影響;2) 實驗效果跟閾值的選定有極大關聯(lián)。因此,對微博文本不正式語法的研究和增強模型穩(wěn)定性是后續(xù)研究的發(fā)展方向。

    [1] 王曉巖.微博客熱點話題發(fā)現(xiàn)與跟蹤技術及系統(tǒng)[D].北京:中國科學院大學,2013.

    [2] 丁兆云,賈焰,周斌.微博數(shù)據(jù)挖掘研究綜述[J].計算機研究與發(fā)展,2014,51(4):691-706.

    [3] 張劍峰,夏云慶,姚建民.微博文本處理研究綜述[J].中文信息學報,2012,26(4):21-27.

    [4] Liu Z,Yu W,Chen W,et al.Short text feature selection and classification for microblog miming[C]//Proceedings of CiSE’2010,2010:1-4.

    [5] Sriram B,Davis Fuhry,Engin Demir,et al.Short text classification in twitter to improve information filtering[C]//Proceedings of SIGIR’10.Switzerland,2010.

    [6] Lin J,Snow R,Morgan W.Smoothing techniques for adaptive online language models:Topic tracking in Tweet streams[C]//Proc of the 17th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining(KDD’11).New York:ACM,2011:422-429.

    [7] Phuvipadawat S,Murata T.Breaking News Detection and Tracking in Twitter[C]//Proc of the 9thIEEE/WIC/ACM Int Conf on Web Intelligence and Intelligent Agent Technology (WI-IAT’10).New York:ACM,2010:120-123.

    [8] 王會珍,朱靖波,季鐸,等.基于反饋學習自適應的中文話題跟蹤[J].中文信息學報,2006,20(3):92-98.

    [9] 張輝,周敬民,王亮.等.基于三維文檔向量的自適應話題追蹤器模型[J].中文信息學報,2010,24(5):70-76.

    [10] 郝秀蘭,胡運發(fā),申情.中文論壇內(nèi)容監(jiān)測的方法研究[J].中文信息學報,2012,26(3):129-136.

    [11] Lafferty J,Mccallum A,Perira F.Conditional random fields:Probabilistic models for segmenting and labeling sequence data[C]//Proc.of the 18th Int’l Conf. on Machine Learning (ICML 2001),2001,28(6):282-289.

    [12] 張傳巖,洪曉光,彭朝暉,等.基于SVM和擴展條件隨機場的Web實體活動抽取[J].軟件學報,2012,23(10):2612-2627.

    [13] Sutton C,Mccallum A.Composition of Conditional Random Fields for transfer learning[C]//Proc of the Human Language Technology Conference on Empirical Methods in Natural Language Processing Vancouver,Canada,2005:748-754.

    [14] 鄭敏潔,雷志城,廖祥文,等.基于層疊CRFs的中文句子評價對象抽取[J].中文信息學報,2013,27(3):69-76.

    [15] 朱莎莎,劉宗田,付劍鋒,等.基于條件隨機場的中文時間短語識別[J].計算機工程,2011,37(15):164-167.

    [16] Nocedal J,Wright S.Numerical Optimization[M].New York,USA:Springer-Verlag,1999.

    [17] 邱泉清,苗奪謙,張志飛.中文微博命名實體識別[J].計算機科學,2013,40(6):196-198.

    HOT MICROBLOGGING TOPICS TRACKING BASED ON CASCADED CONDITIONAL RANDOM FIELDS

    Dai Dan1Hu Yang1Liu Li1Feng Xupeng3Liu Lijun1Huang Qingsong1,2

    1(FacultyofInformationEngineeringandAutomation,KunmingUniversityofScienceandTechnology,Kunming650500,Yunnan,China)2(YunnanKeyLaboratoryofComputerTechnologyApplications,Kunming650500,Yunnan,China)3(EducationalTechnologyandNetworkCenter,KunmingUniversityofScienceandTechnology,Kunming650500,Yunnan,China)

    Because of the sparse data characteristic of microblogging text, traditional topics tracking technologies can only capture part of the topical microblogs in low accuracy. At the same time, topic drifting problem will appear in tracking process as well. In this paper, we present a CCRFs-based hot microblogging topics tracking method for two problems mentioned above. The method first marks the microblogs possibly correlated with hot topics through identification model, the source microblogs with hot topics and the marked microblogs are used as the classification model’s observation sequence and the state sequence respectively to calculate the correlation classification. Then, by constructing the adaptive model it updates the identification model and weakens the data sparse problem, and selects new observation sequence from correlated microblogs and leaves the rest as new state sequence for iterative classification processing. Experiments showed that this method improved 4.13% in average in value of comprehensive index (F) compared with traditional methods.

    Topic tracking Topic drifting Cascaded conditional random fields (CCRFs) Topic dictionary

    2014-12-04。國家自然科學基金項目(81360230);科技部科技型中小企業(yè)技術創(chuàng)新基金項目(13C26215305404)。戴丹,碩士,主研領域:機器學習,自然語言處理。胡楊,碩士。劉驪,副教授。馮旭鵬,碩士。劉利軍,碩士。黃青松,教授。

    TP3

    A

    10.3969/j.issn.1000-386x.2016.04.013

    猜你喜歡
    熱點話題詞典閾值
    米沃什詞典
    文苑(2019年24期)2020-01-06 12:06:50
    小波閾值去噪在深小孔鉆削聲發(fā)射信號處理中的應用
    基于自適應閾值和連通域的隧道裂縫提取
    評《現(xiàn)代漢語詞典》(第6版)
    比值遙感蝕變信息提取及閾值確定(插圖)
    河北遙感(2017年2期)2017-08-07 14:49:00
    2017年高考作文熱點話題預測
    詞典例證翻譯標準探索
    室內(nèi)表面平均氡析出率閾值探討
    基于SVM的熱點話題跟蹤實現(xiàn)過程研究
    熱點話題排行榜
    tocl精华| 内地一区二区视频在线| 悠悠久久av| 搡老妇女老女人老熟妇| 欧美在线黄色| 精品一区二区三区av网在线观看| 久久久久久国产a免费观看| 老司机在亚洲福利影院| 又爽又黄无遮挡网站| 国产亚洲欧美在线一区二区| 亚洲中文字幕一区二区三区有码在线看| 欧美丝袜亚洲另类 | 在线观看午夜福利视频| 欧美bdsm另类| 91在线观看av| 女人被狂操c到高潮| 黄片小视频在线播放| 日韩精品中文字幕看吧| 亚洲五月婷婷丁香| 宅男免费午夜| 我的老师免费观看完整版| 真人做人爱边吃奶动态| 一级作爱视频免费观看| 欧美性猛交黑人性爽| 久久香蕉精品热| 蜜桃久久精品国产亚洲av| 一个人观看的视频www高清免费观看| 91av网一区二区| 天天一区二区日本电影三级| 法律面前人人平等表现在哪些方面| 成人午夜高清在线视频| 久久这里只有精品中国| 亚洲专区中文字幕在线| 精品99又大又爽又粗少妇毛片 | 内射极品少妇av片p| 亚洲av电影不卡..在线观看| 12—13女人毛片做爰片一| 亚洲人成电影免费在线| 久久久国产精品麻豆| 国产野战对白在线观看| 中文资源天堂在线| 欧美中文日本在线观看视频| 日本a在线网址| 九九久久精品国产亚洲av麻豆| 熟女电影av网| 一本精品99久久精品77| 99在线视频只有这里精品首页| 久久精品影院6| 国产精品综合久久久久久久免费| 久久伊人香网站| 午夜免费激情av| 国产精品三级大全| 欧美日本亚洲视频在线播放| 网址你懂的国产日韩在线| 夜夜躁狠狠躁天天躁| www.www免费av| 97超视频在线观看视频| 精品一区二区三区人妻视频| 成人一区二区视频在线观看| 桃色一区二区三区在线观看| 一个人观看的视频www高清免费观看| 亚洲av免费在线观看| 男人舔奶头视频| 激情在线观看视频在线高清| 黑人欧美特级aaaaaa片| 狂野欧美白嫩少妇大欣赏| 18禁在线播放成人免费| av欧美777| 麻豆久久精品国产亚洲av| 亚洲一区二区三区不卡视频| 日本在线视频免费播放| 日本 欧美在线| 亚洲乱码一区二区免费版| 色综合婷婷激情| 成人18禁在线播放| 真人一进一出gif抽搐免费| 香蕉丝袜av| 99久久精品热视频| 中文字幕av成人在线电影| 日韩国内少妇激情av| www.熟女人妻精品国产| 国产成人aa在线观看| 91在线精品国自产拍蜜月 | bbb黄色大片| 精品久久久久久久末码| 88av欧美| 美女免费视频网站| 身体一侧抽搐| 岛国在线观看网站| 窝窝影院91人妻| 国产精品一区二区三区四区免费观看 | 人妻丰满熟妇av一区二区三区| 又爽又黄无遮挡网站| 久久亚洲真实| 久久精品影院6| 亚洲真实伦在线观看| 亚洲 欧美 日韩 在线 免费| 成人一区二区视频在线观看| 国产日本99.免费观看| 日本 欧美在线| 麻豆国产97在线/欧美| 男人舔女人下体高潮全视频| 欧美一区二区精品小视频在线| 亚洲精品色激情综合| av专区在线播放| а√天堂www在线а√下载| 成年女人看的毛片在线观看| 国产aⅴ精品一区二区三区波| 亚洲欧美日韩高清专用| 一个人看视频在线观看www免费 | 一区二区三区高清视频在线| 国产亚洲精品综合一区在线观看| 日本黄色片子视频| 69av精品久久久久久| 香蕉av资源在线| 午夜影院日韩av| 精品不卡国产一区二区三区| 亚洲成av人片在线播放无| 亚洲人成网站在线播| 少妇人妻精品综合一区二区 | bbb黄色大片| a在线观看视频网站| 亚洲国产欧美人成| 午夜免费观看网址| 一区二区三区高清视频在线| 国产伦一二天堂av在线观看| 国产成人a区在线观看| 黄色片一级片一级黄色片| 69av精品久久久久久| 老汉色av国产亚洲站长工具| 亚洲成人中文字幕在线播放| 中文字幕高清在线视频| 国产精品 欧美亚洲| 夜夜夜夜夜久久久久| 日韩欧美精品免费久久 | 草草在线视频免费看| 亚洲专区中文字幕在线| 亚洲人成网站在线播放欧美日韩| 日韩欧美国产在线观看| 一进一出抽搐动态| 夜夜爽天天搞| 亚洲狠狠婷婷综合久久图片| 国产精品久久久久久精品电影| 日本与韩国留学比较| 亚洲成人免费电影在线观看| 内射极品少妇av片p| 99热这里只有是精品50| 精品午夜福利视频在线观看一区| 在线观看免费午夜福利视频| 久久久久久久精品吃奶| 嫩草影院精品99| 美女高潮喷水抽搐中文字幕| 国产精品香港三级国产av潘金莲| 亚洲精品在线观看二区| 老司机在亚洲福利影院| 久久精品亚洲精品国产色婷小说| 精品久久久久久久久久免费视频| 欧美另类亚洲清纯唯美| 亚洲国产色片| 久久性视频一级片| 黄片大片在线免费观看| 免费搜索国产男女视频| av视频在线观看入口| 超碰av人人做人人爽久久 | 男人和女人高潮做爰伦理| 精品久久久久久久末码| 一个人观看的视频www高清免费观看| 亚洲av第一区精品v没综合| 免费大片18禁| 欧美一区二区亚洲| 麻豆国产97在线/欧美| 九色成人免费人妻av| 国产欧美日韩精品亚洲av| 五月玫瑰六月丁香| 亚洲av免费在线观看| 在线免费观看的www视频| 国产欧美日韩一区二区三| 夜夜爽天天搞| 欧美黄色淫秽网站| 美女 人体艺术 gogo| 成人av在线播放网站| 1024手机看黄色片| 亚洲国产精品合色在线| 亚洲五月天丁香| 日本黄色片子视频| 最近最新中文字幕大全免费视频| 久久久久久久午夜电影| 亚洲国产欧洲综合997久久,| 国产精品免费一区二区三区在线| 亚洲精品成人久久久久久| 村上凉子中文字幕在线| 国产精品影院久久| 97碰自拍视频| 国产精品影院久久| 人人妻人人澡欧美一区二区| 大型黄色视频在线免费观看| 97碰自拍视频| 精品人妻1区二区| 亚洲成人精品中文字幕电影| 久久久久亚洲av毛片大全| 婷婷精品国产亚洲av在线| 男人舔奶头视频| 亚洲乱码一区二区免费版| 欧美日韩乱码在线| 综合色av麻豆| 日韩欧美免费精品| 51午夜福利影视在线观看| 精品免费久久久久久久清纯| 狠狠狠狠99中文字幕| 欧美zozozo另类| 啪啪无遮挡十八禁网站| 最近最新免费中文字幕在线| 亚洲精品久久国产高清桃花| 午夜福利视频1000在线观看| 免费看十八禁软件| 免费观看的影片在线观看| 午夜福利视频1000在线观看| 精品一区二区三区视频在线 | 99久久九九国产精品国产免费| 波野结衣二区三区在线 | 国产高清激情床上av| 久久99热这里只有精品18| 香蕉av资源在线| 国产欧美日韩精品亚洲av| 成人特级av手机在线观看| or卡值多少钱| 51午夜福利影视在线观看| 日本 欧美在线| 精品欧美国产一区二区三| 51国产日韩欧美| 日本撒尿小便嘘嘘汇集6| aaaaa片日本免费| 老司机午夜福利在线观看视频| 国产精品久久电影中文字幕| 欧美大码av| av专区在线播放| 特级一级黄色大片| 免费无遮挡裸体视频| 在线天堂最新版资源| 嫩草影视91久久| 精品久久久久久,| 婷婷六月久久综合丁香| 97超视频在线观看视频| 露出奶头的视频| 久久亚洲真实| 久99久视频精品免费| 欧美一级毛片孕妇| 亚洲人成网站高清观看| 久久精品国产综合久久久| 每晚都被弄得嗷嗷叫到高潮| 亚洲美女黄片视频| 亚洲国产精品999在线| 免费av毛片视频| 国产精品日韩av在线免费观看| 最近最新中文字幕大全免费视频| 桃红色精品国产亚洲av| 亚洲欧美激情综合另类| 色尼玛亚洲综合影院| 一区二区三区国产精品乱码| 亚洲国产精品合色在线| 色哟哟哟哟哟哟| 搡老岳熟女国产| 亚洲熟妇中文字幕五十中出| 性色av乱码一区二区三区2| 俺也久久电影网| 国产视频内射| 久久国产精品人妻蜜桃| 久久精品国产综合久久久| 又紧又爽又黄一区二区| 此物有八面人人有两片| 热99在线观看视频| 亚洲av成人av| 欧美zozozo另类| 国产黄a三级三级三级人| tocl精华| 中文字幕精品亚洲无线码一区| 人妻久久中文字幕网| 99热精品在线国产| 亚洲色图av天堂| 精品电影一区二区在线| 国产高清激情床上av| 欧美一区二区国产精品久久精品| 夜夜爽天天搞| 一级黄片播放器| 天堂影院成人在线观看| 国产伦一二天堂av在线观看| 国产精品久久久久久久电影 | 最近在线观看免费完整版| 国内精品久久久久久久电影| 成人18禁在线播放| 国产亚洲精品av在线| 变态另类成人亚洲欧美熟女| 欧美一区二区精品小视频在线| 日本五十路高清| 18禁黄网站禁片免费观看直播| 亚洲美女视频黄频| 亚洲色图av天堂| 三级国产精品欧美在线观看| 我的老师免费观看完整版| 精华霜和精华液先用哪个| 国产真实伦视频高清在线观看 | 久久久成人免费电影| 日韩 欧美 亚洲 中文字幕| 欧美最黄视频在线播放免费| 天堂av国产一区二区熟女人妻| h日本视频在线播放| 国产精品99久久99久久久不卡| 男人舔奶头视频| 免费看a级黄色片| 国产成人系列免费观看| 床上黄色一级片| 久久香蕉国产精品| 久久香蕉国产精品| 在线观看美女被高潮喷水网站 | 国内精品久久久久久久电影| 好男人在线观看高清免费视频| 一卡2卡三卡四卡精品乱码亚洲| 久久草成人影院| 国产久久久一区二区三区| 亚洲avbb在线观看| 看免费av毛片| 老司机福利观看| 欧美高清成人免费视频www| 亚洲一区二区三区不卡视频| www日本在线高清视频| 伊人久久大香线蕉亚洲五| 亚洲乱码一区二区免费版| 国内少妇人妻偷人精品xxx网站| 亚洲中文字幕日韩| 夜夜看夜夜爽夜夜摸| 婷婷精品国产亚洲av在线| 在线观看av片永久免费下载| 此物有八面人人有两片| 丁香欧美五月| 一进一出好大好爽视频| 91在线观看av| 欧美+日韩+精品| 国产乱人视频| 2021天堂中文幕一二区在线观| 成人三级黄色视频| 男女下面进入的视频免费午夜| eeuss影院久久| 色综合亚洲欧美另类图片| 宅男免费午夜| 久久久久久久午夜电影| 欧美性猛交╳xxx乱大交人| 成人午夜高清在线视频| 国产精品久久视频播放| 午夜免费观看网址| 欧美又色又爽又黄视频| 国产成人系列免费观看| 国产真人三级小视频在线观看| 最好的美女福利视频网| 国产一区在线观看成人免费| 亚洲,欧美精品.| 好男人电影高清在线观看| 五月玫瑰六月丁香| 制服丝袜大香蕉在线| bbb黄色大片| 亚洲av不卡在线观看| 首页视频小说图片口味搜索| 成人18禁在线播放| 亚洲久久久久久中文字幕| 国内精品久久久久精免费| 日日夜夜操网爽| 熟女人妻精品中文字幕| 老司机福利观看| 搞女人的毛片| 动漫黄色视频在线观看| 日本五十路高清| 丰满乱子伦码专区| 两个人视频免费观看高清| 久久久久九九精品影院| 九九久久精品国产亚洲av麻豆| 性色avwww在线观看| 99久久99久久久精品蜜桃| 欧美一区二区精品小视频在线| 国产高清视频在线播放一区| 亚洲欧美日韩无卡精品| 高清日韩中文字幕在线| 中文字幕久久专区| 在线播放国产精品三级| 亚洲内射少妇av| 丰满乱子伦码专区| 国产精品爽爽va在线观看网站| 狠狠狠狠99中文字幕| 欧美乱妇无乱码| 色av中文字幕| 国产色婷婷99| netflix在线观看网站| 精品福利观看| 91字幕亚洲| 中文亚洲av片在线观看爽| 91久久精品电影网| 午夜福利18| 国产精品影院久久| 精品国产三级普通话版| 19禁男女啪啪无遮挡网站| 久久中文看片网| 欧美av亚洲av综合av国产av| 美女高潮喷水抽搐中文字幕| 国产伦人伦偷精品视频| 毛片女人毛片| 人妻丰满熟妇av一区二区三区| 手机成人av网站| 热99在线观看视频| 亚洲内射少妇av| 亚洲七黄色美女视频| 国产麻豆成人av免费视频| x7x7x7水蜜桃| 高清在线国产一区| 日韩中文字幕欧美一区二区| 免费看a级黄色片| av欧美777| 国产欧美日韩精品亚洲av| 免费观看的影片在线观看| 狂野欧美激情性xxxx| 久久久久久久精品吃奶| 禁无遮挡网站| 成人18禁在线播放| 国产成人av激情在线播放| 国产高清视频在线播放一区| 久久婷婷人人爽人人干人人爱| 免费大片18禁| 一卡2卡三卡四卡精品乱码亚洲| 真人做人爱边吃奶动态| 99视频精品全部免费 在线| 91字幕亚洲| 极品教师在线免费播放| 国模一区二区三区四区视频| 在线看三级毛片| 亚洲精品乱码久久久v下载方式 | 国产探花在线观看一区二区| 在线a可以看的网站| 国产真人三级小视频在线观看| 国产精品三级大全| 高清毛片免费观看视频网站| 日本黄色片子视频| 国产精品国产高清国产av| av天堂在线播放| 女生性感内裤真人,穿戴方法视频| 免费在线观看成人毛片| 精品久久久久久久久久免费视频| 国产在视频线在精品| 欧美日韩精品网址| 美女高潮喷水抽搐中文字幕| 亚洲精华国产精华精| 精品日产1卡2卡| 亚洲精品一卡2卡三卡4卡5卡| 97人妻精品一区二区三区麻豆| 亚洲国产欧美人成| 首页视频小说图片口味搜索| 一级毛片高清免费大全| 亚洲 欧美 日韩 在线 免费| 国产精品影院久久| av视频在线观看入口| 欧美丝袜亚洲另类 | 色精品久久人妻99蜜桃| 精品一区二区三区视频在线 | 看黄色毛片网站| 国语自产精品视频在线第100页| 日韩免费av在线播放| 国产91精品成人一区二区三区| 午夜亚洲福利在线播放| 无人区码免费观看不卡| 中文在线观看免费www的网站| netflix在线观看网站| 不卡一级毛片| 国产三级在线视频| 亚洲精品国产精品久久久不卡| 99久久无色码亚洲精品果冻| 欧美日韩福利视频一区二区| 亚洲国产色片| 成人亚洲精品av一区二区| 99久久精品一区二区三区| 波野结衣二区三区在线 | 欧美精品啪啪一区二区三区| 男人舔奶头视频| 精品国产美女av久久久久小说| 免费看a级黄色片| 桃色一区二区三区在线观看| 国内精品久久久久久久电影| 精品久久久久久久久久免费视频| 亚洲人成网站在线播放欧美日韩| 国内揄拍国产精品人妻在线| 51午夜福利影视在线观看| 在线看三级毛片| 变态另类成人亚洲欧美熟女| 搡女人真爽免费视频火全软件 | 色精品久久人妻99蜜桃| 国产精品永久免费网站| 亚洲专区中文字幕在线| 一进一出好大好爽视频| 国产成人aa在线观看| 国产午夜精品论理片| 他把我摸到了高潮在线观看| 精品欧美国产一区二区三| 9191精品国产免费久久| 久久久久久九九精品二区国产| 久久中文看片网| 男插女下体视频免费在线播放| 在线播放国产精品三级| 97碰自拍视频| 久久香蕉国产精品| 99热6这里只有精品| 色老头精品视频在线观看| 久久99热这里只有精品18| 亚洲五月天丁香| 久久草成人影院| 三级国产精品欧美在线观看| 嫩草影视91久久| 亚洲av电影在线进入| 别揉我奶头~嗯~啊~动态视频| 欧美日韩亚洲国产一区二区在线观看| 夜夜躁狠狠躁天天躁| h日本视频在线播放| 精品国产三级普通话版| 亚洲黑人精品在线| 精品午夜福利视频在线观看一区| 在线观看舔阴道视频| 人妻夜夜爽99麻豆av| 精品国产三级普通话版| 欧美性猛交黑人性爽| 青草久久国产| 国产精品 欧美亚洲| 欧美激情久久久久久爽电影| 亚洲美女黄片视频| а√天堂www在线а√下载| 99久久综合精品五月天人人| 国产精品亚洲美女久久久| 国产av在哪里看| 最近视频中文字幕2019在线8| x7x7x7水蜜桃| 中文字幕av在线有码专区| 在线观看av片永久免费下载| 90打野战视频偷拍视频| 别揉我奶头~嗯~啊~动态视频| 亚洲欧美日韩高清在线视频| 少妇高潮的动态图| 国产高清激情床上av| a在线观看视频网站| 天堂网av新在线| 黄色成人免费大全| 国产午夜精品久久久久久一区二区三区 | 热99在线观看视频| 亚洲欧美日韩卡通动漫| 久久草成人影院| 岛国在线观看网站| 国产精品av视频在线免费观看| 亚洲黑人精品在线| 国产精品 欧美亚洲| 黄色日韩在线| 久久99热这里只有精品18| 国产伦人伦偷精品视频| 婷婷丁香在线五月| 欧美激情久久久久久爽电影| 午夜福利18| 18禁美女被吸乳视频| 欧美成人免费av一区二区三区| 中文字幕高清在线视频| 午夜免费成人在线视频| 88av欧美| 国产欧美日韩一区二区精品| 真人做人爱边吃奶动态| 美女大奶头视频| 欧美成人a在线观看| 黑人欧美特级aaaaaa片| 亚洲精品在线美女| 长腿黑丝高跟| 国产成人欧美在线观看| 久久久久国产精品人妻aⅴ院| 国产真人三级小视频在线观看| 亚洲av第一区精品v没综合| 免费看日本二区| 日本成人三级电影网站| 亚洲av美国av| 99在线视频只有这里精品首页| 亚洲国产欧美网| 最好的美女福利视频网| 午夜亚洲福利在线播放| 老司机午夜福利在线观看视频| www日本在线高清视频| 色综合亚洲欧美另类图片| 亚洲av免费高清在线观看| 国产探花在线观看一区二区| 日本熟妇午夜| 色噜噜av男人的天堂激情| 制服丝袜大香蕉在线| 最近最新中文字幕大全电影3| 动漫黄色视频在线观看| 少妇的逼好多水| 嫁个100分男人电影在线观看| 日韩大尺度精品在线看网址| 亚洲精品在线观看二区| 成年女人永久免费观看视频| 国产v大片淫在线免费观看| 亚洲一区二区三区色噜噜| 丰满乱子伦码专区| 最新在线观看一区二区三区| 国产精品98久久久久久宅男小说| 丰满的人妻完整版| 久9热在线精品视频| 国产激情偷乱视频一区二区| 美女免费视频网站| 色精品久久人妻99蜜桃| 亚洲av成人精品一区久久| 亚洲av成人不卡在线观看播放网| 超碰av人人做人人爽久久 | 亚洲在线观看片| 日韩欧美国产一区二区入口| av视频在线观看入口| 两个人看的免费小视频| 国内少妇人妻偷人精品xxx网站| 亚洲av一区综合| 国产色爽女视频免费观看|