• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于情節(jié)記憶的高效短文本流聚類算法

    2023-10-17 05:50:02劉子健王勇劉媛妮周由勝
    計(jì)算機(jī)工程 2023年10期
    關(guān)鍵詞:短文文檔語(yǔ)義

    劉子健,王勇,劉媛妮,周由勝,

    (1.重慶郵電大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶 400065;2.大唐微電子技術(shù)有限公司,北京 100094;3.重慶郵電大學(xué) 網(wǎng)絡(luò)空間安全與信息法學(xué)院,重慶 400065)

    0 概述

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,社交媒體平臺(tái)上每天都涌現(xiàn)出海量的短文本數(shù)據(jù),例如微博、Twitter、新聞網(wǎng)站等。隨著時(shí)間推移這些源源不斷產(chǎn)生的短文本數(shù)據(jù)形成了短文本流。近年來(lái),短文本流聚類受到較多的關(guān)注,廣泛應(yīng)用于熱點(diǎn)話題檢測(cè)[1]、事件檢測(cè)與追蹤[2]、新聞推薦[3]等任務(wù)。但由于短文本流具有無(wú)限長(zhǎng)、特征稀疏、多歧義、主題演化等特性,對(duì)其進(jìn)行聚類仍是一個(gè)很大的挑戰(zhàn)。

    與K-means[4]、高斯混合模型[5]、譜聚類[6]等傳統(tǒng)聚類算法不同,流聚類算法根據(jù)所采用的技術(shù)可分為基于相似度的流聚類算法和基于模型的流聚類算法。基于相似度的短文本流聚類算法大多使用向量空間模型來(lái)表示文檔,通過(guò)相似度度量計(jì)算文檔和聚類之間的相似度,再根據(jù)相似度閾值將文檔分配給現(xiàn)有聚類或新的聚類。CluStream[7]是經(jīng)典的短文本流聚類算法,包括在線微聚類階段和離線宏聚類階段,使用金字塔時(shí)間框架存儲(chǔ)不同時(shí)刻的歷史微集群,使用改進(jìn)的K-means 算法在微集群上進(jìn)行聚類,獲得用戶指定數(shù)量為K的宏集群。之后提出的很多流聚類算法都借鑒了這個(gè)框架。DenStream[8]將微聚類與用于流聚類的密度估計(jì)過(guò)程相結(jié)合,能夠在線對(duì)離群值和真實(shí)數(shù)據(jù)進(jìn)行區(qū)分,形成任何形狀的數(shù)據(jù)聚類。SHOU等[9]建立一個(gè)持久摘要模型Sumblr,在Twitter文本流中將Tweet壓縮成Tweet 特征向量(TCVs)并進(jìn)行在線維護(hù),模型根據(jù)TCVs 的統(tǒng)計(jì)信息將未來(lái)的Tweet 分配到聚類。MStream[10]計(jì)算文檔屬于現(xiàn)有集群和新集群的概率,并根據(jù)這些概率將文檔分配給現(xiàn)有集群或新集群,無(wú)須設(shè)置相似度閾值,能更自然地檢測(cè)新集群并處理概念漂移問(wèn)題。RAKIB等[11]提出一種利用文本中高頻的biterm 項(xiàng)對(duì)每批文本中的小部分文本進(jìn)行聚類的方法,然后利用獲得的聚類分配填充MStream 算法的聚類模型,使用基于統(tǒng)計(jì)度量的相似度閾值進(jìn)行文本分配,在緩解概念漂移問(wèn)題的同時(shí)提升了聚類效率?;谙嗨贫鹊牧骶垲愃惴ù蠖噙\(yùn)行速度較快、實(shí)時(shí)性較好,局限性在于需要手動(dòng)設(shè)置閾值以確定在線文檔的主題分配以及難以處理文本稀疏問(wèn)題。

    近幾年,越來(lái)越多的研究人員對(duì)基于模型的短文本流聚類算法進(jìn)行研究。MStream[10]是一種基于狄利克雷多項(xiàng)式混合模型的短文本流聚類算法,該算法使用了兩個(gè)狄利克雷先驗(yàn)α和β,其中,α是指文本選擇新集群的先驗(yàn)概率,β對(duì)應(yīng)于文本選擇與共享比其他集群更相似內(nèi)容集群的先驗(yàn)概率,該算法的變體為MStreamF(刪除舊群體)。DP-BMM[12]是一種基于比特?cái)?shù)的短文本流聚類混合算法,與MStreamF 類似,該算法的變體為DP-BMM-FP(刪除以前批次中獲得的聚類)。OSDM[13]是一種基于語(yǔ)義增強(qiáng)狄利克雷模型的短文本流聚類算法,它擴(kuò)展了MStream 算法,整合了文本和集群之間的常用詞,從中獲得單詞的語(yǔ)義信息,并使用該語(yǔ)義信息計(jì)算文本和集群之間的相似性。DCT-L[14]是一種基于狄利克雷多項(xiàng)式混合模型的短文本流動(dòng)態(tài)聚類算法,它在一個(gè)特定的時(shí)間戳內(nèi)為每個(gè)短文本分配一個(gè)主題(即集群),并使用產(chǎn)生的主題分布作為推斷后續(xù)文檔主題的優(yōu)先級(jí)。OSGM[15]在計(jì)算文本分配概率中引入詞共現(xiàn)語(yǔ)義信息,在線地在詞匯變化的子空間中動(dòng)態(tài)維護(hù)不斷變化的活動(dòng)主題,并且無(wú)須通過(guò)外部資源來(lái)處理術(shù)語(yǔ)歧義問(wèn)題。LAST[16]是一個(gè)終身學(xué)習(xí)增強(qiáng)短文本流聚類算法,在基于模型的流聚類算法上增加了情節(jié)記憶模塊,使得聚類算法同時(shí)保持基于批處理和基于單遍處理的優(yōu)點(diǎn)?;谀P偷亩涛谋玖骶垲愃惴僭O(shè)文檔是由一個(gè)混合模型生成的,這個(gè)混合模型通過(guò)選擇一定概率的主題,再?gòu)倪@個(gè)主題中選擇一定概率的單詞生成文檔,通常使用吉布斯采樣[17]或EM 算法[18]來(lái)估計(jì)混合模型的參數(shù),局限性在于需要預(yù)先指定主題數(shù)量,不能處理短文本流中不斷發(fā)展的未知數(shù)量的主題。

    本文提出一種帶情節(jié)記憶的短文本流聚類算法。該算法由兩個(gè)階段組成:在線聚類和離線聚類。在線聚類階段將情節(jié)記憶思想[19]融入聚類算法,通過(guò)稀疏經(jīng)驗(yàn)重放增強(qiáng)聚類的特征表示,使得未來(lái)文本以更大的概率選擇最近的聚類,并采用反向索引計(jì)算文本和選定聚類的相似度并分配文檔到現(xiàn)有聚類或新的聚類,通過(guò)動(dòng)態(tài)閾值處理概念漂移問(wèn)題。離線聚類階段采用目前最優(yōu)的聚類增強(qiáng)算法進(jìn)行優(yōu)化,并通過(guò)語(yǔ)義再分配算法處理歧義問(wèn)題,同時(shí)根據(jù)聚類id 對(duì)過(guò)時(shí)聚類進(jìn)行刪減。

    1 基礎(chǔ)知識(shí)

    1.1 情景記憶模塊與稀疏經(jīng)驗(yàn)重放

    情景記憶模塊[19]用于在內(nèi)存中存儲(chǔ)一些之前處理過(guò)的文本。由于內(nèi)存有限,選擇在一定更新間隔內(nèi)將新文本寫入內(nèi)存。算法在內(nèi)存中維護(hù)一個(gè)情節(jié)記憶模塊,如圖1 所示,當(dāng)連續(xù)到達(dá)的文檔數(shù)量達(dá)到存儲(chǔ)間隔時(shí),就把當(dāng)前文本添加到情節(jié)記憶模塊。由于文本流中的文本是按順序到達(dá)的,最開(kāi)始存入的文本具有更高的過(guò)時(shí)性,因此當(dāng)情節(jié)記憶模塊的大小超過(guò)了設(shè)置的最大值時(shí),則從后往前刪除文本,以保持記憶模塊中存儲(chǔ)最近的一些文本數(shù)據(jù)。

    圖1 情節(jié)記憶模塊結(jié)構(gòu)Fig.1 Structure of episodic memory module

    在聚類過(guò)程中,每經(jīng)過(guò)一定的更新間隔從情節(jié)記憶模塊中選擇文本進(jìn)行經(jīng)驗(yàn)重放。經(jīng)驗(yàn)重放將有助于利用過(guò)去的文本信息更新這些主題的特征向量,增大這些主題在聚類過(guò)程中被選中的概率。但將記憶模塊中的文本全部用來(lái)經(jīng)驗(yàn)重放,一方面增加了時(shí)間和空間的開(kāi)銷,另一方面太多不相關(guān)的文本也會(huì)影響聚類結(jié)果,因此隨機(jī)抽取記憶模塊中的部分文本進(jìn)行稀疏經(jīng)驗(yàn)重放。當(dāng)?shù)竭_(dá)重放間隔時(shí),在情節(jié)記憶模塊中隨機(jī)抽取數(shù)量為E的文本,并對(duì)其進(jìn)行一次掃描聚類。對(duì)這些過(guò)去已經(jīng)處理的文本都只選擇一個(gè)已經(jīng)存在的聚類而不是產(chǎn)生一個(gè)新聚類。在確定聚類后需要更新聚類對(duì)應(yīng)的詞匯特征和語(yǔ)義表示。重放文本用t表示,更新聚類詞匯特征過(guò)程如式(1)~式(3)所示,更新聚類語(yǔ)義表示過(guò)程如式(4)和式(5)所示。

    其中:nz,f是聚類z中的特征f對(duì)應(yīng)的頻率;Nt,f是重放文本t中的特征f對(duì)應(yīng)的頻率;nz是聚類z的特征數(shù)量;Nt是文本t的特征數(shù)量;mz是聚類z的文本數(shù)量;Sz是聚類z的聚類向量;St是文本t的語(yǔ)義向量;Sz,m是聚類z的聚類中心向量。

    1.2 反向索引

    在線聚類階段先在內(nèi)存中生成聚類id-特征正向索引,再通過(guò)正向索引創(chuàng)建反向索引,如圖2 所示。算法通過(guò)反向索引能夠找到包括同一特征的聚類id。反向索引由向量I={lf,id}表示,其中,lf,id是聚類特征中包括特征f的聚類id 集合。通過(guò)計(jì)算當(dāng)前文本和選定具有共同特征聚類的相似度進(jìn)行聚類。使用反向索引減少文本相似度計(jì)算次數(shù),提高算法運(yùn)行效率。

    2 基于情節(jié)記憶的短文本流聚類算法

    所提算法主要包括在線聚類和離線聚類兩個(gè)階段。整個(gè)算法流程如圖3 所示,其中,T表示當(dāng)前模型的運(yùn)行時(shí)間,UI 表示離線聚類算法運(yùn)行的更新間隔,通過(guò)取余在UI 內(nèi)執(zhí)行離線聚類算法。在線聚類階段包括特征提取、相似度計(jì)算、構(gòu)建聚類模型以及情節(jié)記憶模塊;離線聚類階段包括增強(qiáng)聚類、語(yǔ)義再分配和刪除過(guò)時(shí)聚類。

    圖3 算法整體流程Fig.3 Overall procedure of the algorithm

    從詞匯特征和語(yǔ)義兩個(gè)層面進(jìn)行文本特征提取。使用biterm[20]對(duì)文本進(jìn)行詞匯層面特征提取。與biterm 類似的還有unigram 和bigram。unigram 將單個(gè)單詞作為一個(gè)特征,而bigram 是將連續(xù)的兩個(gè)單詞作為一個(gè)特征。biterm 對(duì)文本預(yù)處理后的文本進(jìn)行分詞,然后計(jì)算單詞列表的笛卡爾積,能夠更加全面地提取文本中的詞匯特征,提取出的特征數(shù)量比其他方法更多。對(duì)于單詞數(shù)量為k的句子,特征數(shù)量為(k×(k-1))/2。特征提取過(guò)程如式(6)所示:

    通過(guò)詞平均法構(gòu)建文檔向量表示文本語(yǔ)義信息,其中詞向量可以通過(guò)GloVe 模型[21]獲得。每個(gè)聚類的詞匯特征通過(guò)一個(gè)向量F表示,F(xiàn)={nz,f,nz,mz,iid,z},其中,nz,f是聚類z中的特征f對(duì)應(yīng)的頻率,nz是聚類z的特征數(shù)量,mz是聚類z的文本數(shù)量,iid,z是聚類z的唯一id。每個(gè)聚類的語(yǔ)義表示由聚類向量Sz和聚類中心向量Sz,m組成。Sz為聚類z中文本的文檔向量求和。Sz,m由聚類向量除以聚類大?。ㄍㄟ^(guò)聚類中的文本數(shù)量mz表示)計(jì)算得到。

    2.1 在線聚類階段

    在線聚類階段基于單遍處理的方法。先對(duì)當(dāng)前文本進(jìn)行預(yù)處理和特征提取,如果已處理的文本數(shù)量達(dá)到了經(jīng)驗(yàn)重放間隔R,則隨機(jī)選取數(shù)量為E的文本進(jìn)行稀疏經(jīng)驗(yàn)重放更新聚類特征,再對(duì)當(dāng)前文本進(jìn)行聚類。聚類過(guò)程根據(jù)反向索引選擇現(xiàn)有包含該文本特征的聚類,計(jì)算文本和選取聚類的相似度,基于統(tǒng)計(jì)度量的動(dòng)態(tài)相似度閾值將文本分配到新的聚類或者是現(xiàn)有聚類中。如果處理文本數(shù)量達(dá)到了存儲(chǔ)間隔T,則將當(dāng)前文本加入情節(jié)記憶模塊,并且根據(jù)設(shè)置的內(nèi)存大小判斷是否刪除舊文本。

    2.1.1 文本與聚類相似度計(jì)算

    采取基于共同特征的相似度計(jì)算公式計(jì)算文本和聚類之間的相似度,計(jì)算公式如式(7)所示:

    其中:Nt,f為文本t的特征f對(duì)應(yīng)的頻率;Nt為文本t的特征總數(shù)。

    首先對(duì)文本t和聚類z之間共同的特征f對(duì)應(yīng)的頻率求和,然后再乘上一個(gè)類似于逆文檔頻率(Inverse Document Frequency,IDF)的權(quán)重Df,計(jì)算公式如式(8)所示:

    其中:|z|為存在的聚類總數(shù);|f∈z|為包含特征f的聚類數(shù)量;Df的大小能夠反映特征f的重要性。

    如果特征f在聚類中越多出現(xiàn),那么該特征的重要性越低。

    2.1.2 聚類模型構(gòu)建

    當(dāng)文本t被分配到聚類z時(shí)更新聚類z的F向量,構(gòu)建過(guò)程如式(1)~式(5)所示。如果當(dāng)前文本沒(méi)有被分配到一個(gè)新的聚類,那么iid,z保持不變,否則iid,z自增1,因此最近創(chuàng)建的聚類擁有最高的聚類id。同時(shí),更新反向索引I,對(duì)于文本中的每個(gè)特征添加聚類id 到相應(yīng)的F特征向量中。語(yǔ)義向量更新和文本分配過(guò)程如式(9)所示:

    算法1在線聚類算法

    輸入文本流、重放間隔R、重放文本數(shù)量E、寫入模塊更新間隔T

    輸出每個(gè)文本的聚類標(biāo)簽ZSt

    1.for t=1 to ∞ do//從短文本流開(kāi)始

    2.if t % R=0 then//執(zhí)行稀疏經(jīng)驗(yàn)重放

    3.從M 中隨機(jī)選取文本集E

    4.通過(guò)式(1)和式(2)執(zhí)行稀疏經(jīng)驗(yàn)重放

    5.通過(guò)式(1)~式(5)更新聚類模型M

    6.end if

    7.通過(guò)式(6)提取文本特征

    8.通過(guò)反向索引I 得到與St有相同特征的聚類集L

    9.通過(guò)式(7)計(jì)算St和L 中聚類的相似度Siml

    10.計(jì)算Siml中的最大相似度maxl、相似度均值μl和方差σl

    11.if maxl> μl+σlthen

    12.j=cluster index for maxl//獲取maxl對(duì)應(yīng)的聚類標(biāo)簽

    13.ZSt=jth//分配文本聚類標(biāo)簽

    14.else

    15.分配該文本到一個(gè)新聚類

    16.end if

    17.通過(guò)式(1)~式(5)更新聚類模型M

    18.if t % T=0 then

    19.把當(dāng)前文本St寫入情節(jié)記憶模塊M

    20.end if

    21.return ZSt

    2.2 離線聚類階段

    在每個(gè)更新間隔內(nèi)進(jìn)行離線聚類。離線聚類階段主要包括聚類增強(qiáng)、語(yǔ)義再分配、過(guò)時(shí)聚類刪除3步。

    2.2.1 聚類增強(qiáng)

    在每個(gè)更新間隔內(nèi)選擇一組在線聚類模塊獲得的聚類,對(duì)這些聚類的分布進(jìn)行增強(qiáng)。聚類的大小對(duì)應(yīng)聚類中文本的數(shù)量,選擇聚類大小大于μ+σ的聚類,μ和σ分別為在線聚類結(jié)果中所有聚類大小的平均值和方差。文本數(shù)量較大的聚類具有更多的異常值,這可能導(dǎo)致未來(lái)文本的不正確分配。通過(guò)增強(qiáng)較大聚類中的文本分布,將未來(lái)文本分配到合適的聚類。采用目前較優(yōu)的聚類增強(qiáng)算法[22],該算法通過(guò)迭代分類進(jìn)行聚類增強(qiáng),每次迭代生成分別包含非異常值和異常值的訓(xùn)練集和測(cè)試集,使用訓(xùn)練集訓(xùn)練分類算法,再使用訓(xùn)練好的模型對(duì)測(cè)試集進(jìn)行分類,重復(fù)迭代直到每個(gè)聚類中文本分布趨于穩(wěn)定或者達(dá)到預(yù)設(shè)的最大迭代次數(shù)。另外,該聚類增強(qiáng)算法的質(zhì)量在很大程度上取決于初始聚類質(zhì)量(對(duì)應(yīng)所提算法在線聚類階段的結(jié)果),具體算法過(guò)程參考文獻(xiàn)[22]。

    2.2.2 語(yǔ)義再分配

    單文本聚類(只包含一個(gè)文本的聚類)中的文本與其他聚類沒(méi)用共享的詞匯特征,但這些聚類可能在語(yǔ)義上與其他現(xiàn)有聚類類似,選擇這些文本重新分配至其他現(xiàn)有的聚類。通過(guò)余弦相似度計(jì)算文本和聚類中心的語(yǔ)義相似度,再分別計(jì)算相似度的均值μ和方差σ,如果最大的相似度值大于μ+σ,則將該文本分配到對(duì)應(yīng)的聚類,否則仍然在原來(lái)通過(guò)在線聚類階段得到的聚類中。在進(jìn)行語(yǔ)義分配后,需要同時(shí)更新聚類的詞匯特征表示以及語(yǔ)義表示。

    算法2語(yǔ)義再分配算法

    輸入聚類大小為1 的聚類文本集合T、詞向量字典D、聚類的語(yǔ)義特征集合字典{Sz,Sz,m}、文本語(yǔ)義特征向量和SSUM(初始化為0 向量)

    輸出聚類模型M

    1.for t in T do

    2.對(duì)文本t 進(jìn)行預(yù)處理得到單詞列表Wt

    3.for w in Wtdo

    4.SSUM=SSUM+D(w)

    8.計(jì)算Simt中的最大相似度maxt、相似度均值μt和方差σt

    9.if maxt> μt+σtthen

    10.獲取maxt對(duì)應(yīng)的聚類標(biāo)簽j

    11.ZSt=j//修改當(dāng)前文本聚類標(biāo)簽為j

    12.通過(guò)式(1)~式(5)更新聚類模型并刪除原始聚類中的文本t

    13.else

    14.文本t 保留在原始聚類中

    15.end for

    2.2.3 過(guò)時(shí)聚類刪除

    根據(jù)聚類編號(hào)iid,z以及聚類大小來(lái)刪除過(guò)時(shí)聚類,根據(jù)在線聚類算法最近創(chuàng)建的聚類擁有更高的iid,z,分別計(jì)算聚類編號(hào)和聚類大小的均值μz、μm和方差σz、σm,刪除聚類編號(hào)idz小于μz-σz并且聚類大小小于μm-σm的聚類對(duì)應(yīng)的F向量和反向索引I中該聚類的信息。

    算法3過(guò)時(shí)聚類刪除算法

    輸入聚類id 集合{iid,z,z∈Z}、聚類大小集合{mz,z∈Z}

    輸出聚類模型M

    1.計(jì)算iid,z和mz的均值μz、μm和方差σz、σm

    2.for z in F do

    3.if iid,z<μz-σzand mz<μm-σmthen

    4.Delete Fidzand reverse index lf,idz//刪除過(guò)時(shí)聚類的特//征向量以及反向索引中該聚類信息

    3 實(shí)驗(yàn)與結(jié)果分析

    3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集

    實(shí)驗(yàn)環(huán)境為Windows 10 64 位操作系統(tǒng),處理器為AMD Ryzen 7 4800H CPU,內(nèi)存為16.00 GB。使用PyCharm 2021 實(shí)現(xiàn)所提算法,調(diào)用Python 的Sklearn 包進(jìn)行指標(biāo)統(tǒng)計(jì)。在實(shí)驗(yàn)中使用3 個(gè)公開(kāi)的短文本數(shù)據(jù)集。News-T[23]和Tweets-T[10]數(shù)據(jù)集分別包含11 109 個(gè)新聞標(biāo)題和30 322 篇推文,它們分別有152 和269 個(gè)類別。NT[11]數(shù)據(jù)集是News-T 數(shù)據(jù)集和Tweets-T 數(shù)據(jù)集的結(jié)合,包括41 429 篇文本和416 個(gè)類別,文檔的平均長(zhǎng)度為7.97。文本預(yù)處理包括將所有字母轉(zhuǎn)化成小寫字母、刪除停用詞以及詞干提取。表1 顯示了這些短文本數(shù)據(jù)集預(yù)處理之后的統(tǒng)計(jì)數(shù)據(jù),從平均單詞數(shù)可以看出這3 個(gè)數(shù)據(jù)集適用于短文本流聚類。在實(shí)驗(yàn)時(shí)對(duì)數(shù)據(jù)集進(jìn)行混亂處理,以檢驗(yàn)不同算法在處理順序隨機(jī)且不同主題的文本到達(dá)時(shí)的算法質(zhì)量。

    表1 實(shí)驗(yàn)數(shù)據(jù)集基本統(tǒng)計(jì)信息Table 1 Basic statistical information of experimental data sets 單位:個(gè)

    3.2 評(píng)價(jià)指標(biāo)

    使用4 種廣泛使用的度量指標(biāo)來(lái)評(píng)估聚類性能:歸一化互信息(Normalized Mutual Information,NMI),準(zhǔn)確率(A),同質(zhì)性(h)和V-Measure(V)[24]。

    NMI 用于評(píng)價(jià)整體聚類質(zhì)量,代表聚類分配和文檔實(shí)際分配組的隨機(jī)變量共享的統(tǒng)計(jì)信息數(shù)量。NMI 定義如下:

    其中:nc是類別c中文檔的數(shù)量;nk是聚類k中文檔的數(shù)量;nc,k是既在類別c又在聚類k中的文檔數(shù) 量;N是數(shù)據(jù)集中文檔的數(shù)量。NMI 越接近1,意味著聚類質(zhì)量越高。

    準(zhǔn)確率用于將聚類結(jié)果與數(shù)據(jù)的實(shí)際類別進(jìn)行比較,測(cè)量了所有聚類中正確分配的文檔所占的比率。準(zhǔn)確率定義如下:

    其中:ki和ci分別表示xi對(duì)應(yīng)的聚類結(jié)果和真實(shí)標(biāo)簽;δ表示指示函數(shù);map 函數(shù)表示最佳類別標(biāo)記的重現(xiàn)分配,以保證統(tǒng)計(jì)結(jié)果的正確。一般通過(guò)匈牙利算法[25]實(shí)現(xiàn)最佳重分配,從而在多項(xiàng)式時(shí)間內(nèi)求解標(biāo)簽分配問(wèn)題。準(zhǔn)確率越高,意味著聚類效果越好。

    同質(zhì)性表示算法從真值組的同一類中獲得的聚類成員所占的比例,定義如下:

    其中:H(C|K)是給定集群劃分條件下類別劃分的條件熵;H(C)是類別劃分的熵;n表示實(shí)例總數(shù);nc表示類別c下的實(shí)例數(shù);nk表示集群k下的實(shí)例數(shù);nc,k表示類別c中被劃分到集群k的實(shí)例數(shù)。

    V-Measure 基于兩個(gè)類別之間的條件熵,也就是求已知某一個(gè)類別劃分后,另外一個(gè)類別劃分的不確定性程度。不確定性越小,意味著兩個(gè)類別劃分越接近,相應(yīng)h值或c值越大。完整性衡量了屬于同一個(gè)真實(shí)類別的樣本都被分配到同一個(gè)簇中的比例的加權(quán)平均值。V-Measure 是同質(zhì)性和完整性的調(diào)和平均值,定義如下:

    3.3 結(jié)果分析

    將所提算法與以下基準(zhǔn)算法進(jìn)行比較:

    1)MStream,基于狄利克雷多項(xiàng)式混合模型的短文本流聚類算法有基于批處理和基于單遍處理的兩種變體。基于批處理的方法對(duì)每一批短文本進(jìn)行聚類,存儲(chǔ)一段時(shí)間內(nèi)產(chǎn)生的所有聚類。通過(guò)對(duì)同一批文本多次進(jìn)行吉布斯采樣,提高初始聚類結(jié)果。基于單遍處理的方法只對(duì)文本進(jìn)行一次聚類。

    2)MStreamF,是MStream 的一個(gè)帶有遺忘規(guī)則的變體,只保留有限時(shí)間范圍內(nèi)的最新文本,刪除以前批次的過(guò)時(shí)聚類。本文采用基于批處理模式的MStream 和MStreamF 算法進(jìn)行實(shí)驗(yàn),并采用原始論文中MStream 和MStreamF 算法的參數(shù)(α=0.03、β=0.03)。

    3)OSDM,基于單遍處理的短文本流聚類算法,將詞形語(yǔ)義信息集成到MStream 算法,以消除短文本流聚類中的術(shù)語(yǔ)歧義問(wèn)題。本文采用原始論文中的參數(shù)進(jìn)行實(shí)驗(yàn)(α=2×10-3、β=4×10-5、γ=6×10-6)。

    4)DP-BMM,采用與MStream 算法類似的方法,利用每個(gè)文檔構(gòu)造的詞來(lái)增強(qiáng)短文本中的單詞共現(xiàn)模式。與MStream 算法的區(qū)別在于,DP-BMM 采用基于biterm 的聚類方法。本文采用原論文中的DPBMM 算法參數(shù)進(jìn)行實(shí)驗(yàn)(α=0.03、β=0.03)。

    5)EStream,采用在線和離線兩個(gè)階段進(jìn)行短文本流聚類,并且通過(guò)反向索引計(jì)算文本和選定聚類相似度。EStream 算法的參數(shù)只有一個(gè)UI,實(shí)驗(yàn)中UI 設(shè)置為500。

    將所提算法和以上基準(zhǔn)算法進(jìn)行比較。為了減少誤差,對(duì)每個(gè)數(shù)據(jù)集取10 次實(shí)驗(yàn)結(jié)果的平均值作為最終結(jié)果。表2 給出了所提算法與其他算法在3 個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,其中部分實(shí)驗(yàn)結(jié)果來(lái)源于文獻(xiàn)[11],不同數(shù)據(jù)集的最優(yōu)結(jié)果用加粗字體標(biāo)示。從實(shí)驗(yàn)結(jié)果來(lái)看,所提算法相比于其他算法具有一定的性能優(yōu)勢(shì),在3 個(gè)數(shù)據(jù)集上多項(xiàng)評(píng)價(jià)指標(biāo)都高于EStream,證明了改進(jìn)后的流聚類算法結(jié)合情節(jié)記憶模塊的有效性。值得注意的是,所提算法在News-T 數(shù)據(jù)集上的歸一化互信息指標(biāo)沒(méi)達(dá)到最優(yōu),可能的原因是該數(shù)據(jù)集的數(shù)據(jù)量偏小,導(dǎo)致在進(jìn)行經(jīng)驗(yàn)重放時(shí)能夠增強(qiáng)的聚類表示較少。相比之下,DP-BMM 和MStreamF 進(jìn)行了超參數(shù)調(diào)優(yōu),更好地實(shí)現(xiàn)了將文本分配到不同聚類。但是在NT 數(shù)據(jù)集上,所提算法的歸一化互信息、同質(zhì)性、準(zhǔn)確率指標(biāo)明顯高于其他算法,可能的原因是其他算法并沒(méi)有在NT數(shù)據(jù)集上進(jìn)行超參數(shù)調(diào)優(yōu),而所提算法使用經(jīng)驗(yàn)重放緩解文本流稀疏性問(wèn)題,并且通過(guò)參數(shù)影響實(shí)驗(yàn)得到最佳的重放間隔和重放數(shù)量。

    表2 各算法在3 個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 2 Experimental results of each algorithm on three data sets

    另外,對(duì)比所提算法和其他算法的平均運(yùn)行時(shí)間,實(shí)驗(yàn)結(jié)果如表3 所示。由表3 可知,所提算法比MStream、MStreamF、DP-BMM、OSDM 算法的運(yùn)行時(shí)間更短,證明了所提算法通過(guò)反向索引優(yōu)化聚類運(yùn)行效率的有效性。DP-BMM 算法的運(yùn)行時(shí)間最長(zhǎng),可能的原因是該算法在每個(gè)聚類中存儲(chǔ)了該聚類所有文本的biterm項(xiàng),使用吉布斯采樣選取聚類,而對(duì)同一文本多次執(zhí)行吉布斯采樣是一項(xiàng)很耗時(shí)的操作。假設(shè)文本數(shù)量為M,聚類數(shù)量為K,每個(gè)文本的單詞個(gè)數(shù)為L(zhǎng),執(zhí)行吉布斯采樣的次數(shù)為I,那么DP-BMM 算法的時(shí)間復(fù)雜度為O(IKML)。由于所提算法包括情節(jié)記憶模塊和稀疏經(jīng)驗(yàn)重放,整體聚類次數(shù)得到了增加,因此運(yùn)行時(shí)間比EStream 算法略長(zhǎng)。在線聚類階段計(jì)算的是當(dāng)前文本和選定聚類的相似度,假設(shè)每次運(yùn)行需要挑選聚類個(gè)數(shù)為c,稀疏經(jīng)驗(yàn)重放的數(shù)量為E,因?yàn)樵诰€聚類對(duì)當(dāng)前文本只須執(zhí)行一次,只有產(chǎn)生重放才會(huì)再次執(zhí)行聚類,所以所提算法的時(shí)間復(fù)雜度為O((M+E)×cLL)。本文忽略了離線聚類階段的運(yùn)行時(shí)間,因?yàn)殡x線聚類階段只會(huì)對(duì)一小部分文本進(jìn)行再次聚類。

    表3 不同算法的平均運(yùn)行時(shí)間Table 3 Average running time of different algorithms 單位:s

    3.4 消融實(shí)驗(yàn)

    本節(jié)主要分析內(nèi)存大小M、重放間隔R和重放文本數(shù)量E對(duì)算法性能的影響。參照EStream 算法設(shè)置在線階段和離線階段的更新間隔為500。采用控制變量法進(jìn)行實(shí)驗(yàn)。

    3.4.1 內(nèi)存大小對(duì)算法性能的影響

    內(nèi)存大小是指情節(jié)記憶模塊中存儲(chǔ)的文本數(shù)量。圖4 顯示了在News-T、Tweets-T、NT 數(shù)據(jù)集上不同的內(nèi)存大小對(duì)NMI 的影響。由圖4 可以看出,隨著內(nèi)存大小的不斷增大,NMI 數(shù)值總體而言也不斷增大。因?yàn)榍楣?jié)記憶模塊中存放著較多的最近文本,更有助于利用過(guò)去的文本信息更新主題的特征向量,但內(nèi)存大小并不是越大越好,可通過(guò)驗(yàn)證集來(lái)設(shè)置一個(gè)適合的數(shù)值。

    圖4 內(nèi)存大小對(duì)歸一化互信息指標(biāo)的影響Fig.4 Influence of the memory size on the normalized mutual information index

    3.4.2 重放間隔對(duì)算法性能的影響

    重放間隔是指稀疏經(jīng)驗(yàn)重放的文本數(shù)量間隔。圖5 顯示了在News-T、Tweets-T、NT 數(shù)據(jù)集上不同的重放間隔對(duì)NMI 的影響。由圖5 可以看出,隨著重放間隔的增加,NMI 大體呈現(xiàn)下降趨勢(shì),可能的原因是一些聚類的特征會(huì)隨著時(shí)間慢慢減少。過(guò)小的重放間隔會(huì)使得聚類時(shí)間變長(zhǎng),而過(guò)大的重放間隔會(huì)使得算法的性能降低。

    圖5 重放間隔對(duì)歸一化互信息指標(biāo)的影響Fig.5 Influence of the replay interval on the normalized mutual information index

    3.4.3 重放文本數(shù)量對(duì)算法性能的影響

    重放文本是指在每個(gè)重放間隔內(nèi)進(jìn)行經(jīng)驗(yàn)重放的文本。圖6 顯示了在News-T、Tweets-T、NT 數(shù)據(jù)集上不同的重放文本數(shù)量對(duì)NMI 的影響。由圖6 可以看出,隨著重放文本數(shù)量增加,NMI 呈現(xiàn)上升趨勢(shì)。可能的原因是重放文本數(shù)量越多,就會(huì)有更多的采樣文本被用來(lái)更新聚類特征向量。如圖7 所示,過(guò)少的重放文本會(huì)減少聚類的特征數(shù)量降低算法的性能,但過(guò)多的重放文本會(huì)導(dǎo)致算法運(yùn)行時(shí)間變長(zhǎng)。

    圖6 重放文本數(shù)量對(duì)歸一化互信息指標(biāo)的影響Fig.6 Influence of the number of replay texts on the normalized mutual information index

    圖7 重放文本數(shù)量對(duì)算法運(yùn)行時(shí)間的影響Fig.7 Influence of the number of replay texts on the running time of the algorithm

    4 結(jié)束語(yǔ)

    本文將情節(jié)記憶思想融入短文本流聚類算法,提出一種帶情節(jié)記憶的高效短文本流聚類算法。采用在線-離線階段對(duì)短文本流進(jìn)行聚類:在線階段融入情節(jié)記憶思想緩解短文本流的稀疏性問(wèn)題,通過(guò)反向索引減少聚類運(yùn)行時(shí)間;離線階段通過(guò)聚類增強(qiáng)、語(yǔ)義再分配以及刪除過(guò)時(shí)聚類來(lái)提高聚類性能。通過(guò)在3 個(gè)公開(kāi)數(shù)據(jù)集上與6 個(gè)基準(zhǔn)算法進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果表明所提算法的多項(xiàng)評(píng)價(jià)指標(biāo)都取得了較好的結(jié)果,并且在運(yùn)行時(shí)間上比多數(shù)算法減少1~3 個(gè)數(shù)量級(jí)。通過(guò)消融實(shí)驗(yàn)可知,不同的記憶內(nèi)存大小、重放間隔以及重放文本數(shù)量對(duì)算法性能均有一定的影響。后續(xù)可將深度學(xué)習(xí)模型和詞共現(xiàn)矩陣引入短文本流聚類算法,對(duì)文本進(jìn)行深度順序編碼,以提高聚類精度,并將其應(yīng)用于針對(duì)短文本流的新聞推薦等場(chǎng)景進(jìn)一步拓寬使用范圍。

    猜你喜歡
    短文文檔語(yǔ)義
    有人一聲不吭向你扔了個(gè)文檔
    語(yǔ)言與語(yǔ)義
    KEYS
    Keys
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    認(rèn)知范疇模糊與語(yǔ)義模糊
    短文改錯(cuò)
    短文改錯(cuò)
    精品免费久久久久久久清纯| www.999成人在线观看| 男人舔女人的私密视频| 欧美日韩av久久| 一级毛片高清免费大全| 久久午夜综合久久蜜桃| 免费在线观看亚洲国产| 后天国语完整版免费观看| 性色av乱码一区二区三区2| 国产一区二区三区综合在线观看| 美女高潮喷水抽搐中文字幕| 亚洲成人精品中文字幕电影 | 丰满的人妻完整版| 男女午夜视频在线观看| 18禁观看日本| 色哟哟哟哟哟哟| 国产精品亚洲一级av第二区| 黑人操中国人逼视频| 亚洲av片天天在线观看| 亚洲色图综合在线观看| 最近最新中文字幕大全电影3 | 免费日韩欧美在线观看| 午夜福利影视在线免费观看| 国产精品电影一区二区三区| 亚洲在线自拍视频| 制服人妻中文乱码| 国产片内射在线| www.精华液| 久久久国产精品麻豆| a级片在线免费高清观看视频| 天天影视国产精品| 免费少妇av软件| 午夜免费成人在线视频| 精品电影一区二区在线| 免费看a级黄色片| 亚洲一区二区三区色噜噜 | 国产又爽黄色视频| 久久国产精品男人的天堂亚洲| 99久久人妻综合| 18禁观看日本| av天堂在线播放| 国产精品影院久久| 自线自在国产av| 国产精品综合久久久久久久免费 | av天堂久久9| 免费久久久久久久精品成人欧美视频| 国产激情久久老熟女| av网站在线播放免费| 少妇的丰满在线观看| 国产区一区二久久| 最新在线观看一区二区三区| 精品无人区乱码1区二区| 97超级碰碰碰精品色视频在线观看| 99热国产这里只有精品6| 一区在线观看完整版| 国产av又大| 99精品久久久久人妻精品| 午夜精品在线福利| 69精品国产乱码久久久| 香蕉国产在线看| 99在线视频只有这里精品首页| 免费看十八禁软件| 亚洲一区二区三区欧美精品| 国产黄色免费在线视频| 麻豆av在线久日| 久久亚洲真实| 1024视频免费在线观看| 免费看十八禁软件| 色精品久久人妻99蜜桃| 色精品久久人妻99蜜桃| 日韩高清综合在线| 这个男人来自地球电影免费观看| 亚洲国产欧美一区二区综合| 久久天躁狠狠躁夜夜2o2o| 亚洲精华国产精华精| 视频在线观看一区二区三区| 最近最新免费中文字幕在线| 国产黄色免费在线视频| 欧美乱妇无乱码| 午夜精品久久久久久毛片777| 免费在线观看黄色视频的| 国产精品美女特级片免费视频播放器 | 亚洲人成伊人成综合网2020| 可以免费在线观看a视频的电影网站| 国产97色在线日韩免费| 可以免费在线观看a视频的电影网站| 欧美中文日本在线观看视频| 亚洲第一欧美日韩一区二区三区| 精品日产1卡2卡| www.精华液| 成人18禁高潮啪啪吃奶动态图| 久久国产精品人妻蜜桃| 丁香六月欧美| 精品高清国产在线一区| 搡老熟女国产l中国老女人| 中文字幕精品免费在线观看视频| 久久精品国产综合久久久| 精品久久久精品久久久| 女性被躁到高潮视频| 国产精品一区二区精品视频观看| 亚洲专区国产一区二区| 亚洲欧美激情在线| 国产高清视频在线播放一区| 涩涩av久久男人的天堂| 99re在线观看精品视频| 80岁老熟妇乱子伦牲交| 亚洲视频免费观看视频| 在线天堂中文资源库| 久久精品人人爽人人爽视色| 黑丝袜美女国产一区| 51午夜福利影视在线观看| 亚洲国产欧美一区二区综合| 久久九九热精品免费| 别揉我奶头~嗯~啊~动态视频| 日韩一卡2卡3卡4卡2021年| www国产在线视频色| 成人18禁在线播放| 精品一区二区三区av网在线观看| 黄色a级毛片大全视频| av国产精品久久久久影院| 成人精品一区二区免费| 99久久99久久久精品蜜桃| 欧美激情久久久久久爽电影 | 国产亚洲av高清不卡| 久久精品亚洲av国产电影网| 国产精品久久视频播放| 亚洲人成电影免费在线| 精品久久久久久电影网| 母亲3免费完整高清在线观看| 国产成人精品无人区| 在线天堂中文资源库| 亚洲七黄色美女视频| 桃红色精品国产亚洲av| 国产欧美日韩一区二区精品| 美女 人体艺术 gogo| av网站在线播放免费| 日日夜夜操网爽| 欧美乱色亚洲激情| 免费在线观看视频国产中文字幕亚洲| 一二三四在线观看免费中文在| 午夜两性在线视频| 身体一侧抽搐| 久久欧美精品欧美久久欧美| 国产xxxxx性猛交| 岛国视频午夜一区免费看| 午夜福利免费观看在线| 一个人观看的视频www高清免费观看 | 99国产精品一区二区蜜桃av| 成人手机av| 亚洲成av片中文字幕在线观看| 99国产精品免费福利视频| 天天添夜夜摸| 色精品久久人妻99蜜桃| 国产麻豆69| 高清av免费在线| 亚洲在线自拍视频| 亚洲自偷自拍图片 自拍| 国产亚洲av高清不卡| 久久久久亚洲av毛片大全| 日本欧美视频一区| 久久天堂一区二区三区四区| 女生性感内裤真人,穿戴方法视频| av在线天堂中文字幕 | 亚洲成国产人片在线观看| 久久久久精品国产欧美久久久| 久久热在线av| 欧美激情久久久久久爽电影 | √禁漫天堂资源中文www| 成人亚洲精品av一区二区 | 午夜免费观看网址| 亚洲熟妇熟女久久| 亚洲黑人精品在线| 国产色视频综合| 免费不卡黄色视频| 多毛熟女@视频| 中文字幕高清在线视频| 日韩精品中文字幕看吧| 老汉色∧v一级毛片| 一级a爱片免费观看的视频| 国产精品一区二区三区四区久久 | 国产欧美日韩综合在线一区二区| 中出人妻视频一区二区| 在线观看免费高清a一片| 色老头精品视频在线观看| 欧美日韩亚洲高清精品| 美女午夜性视频免费| 国产无遮挡羞羞视频在线观看| 国产野战对白在线观看| 久久狼人影院| 欧美激情极品国产一区二区三区| 国产精品久久视频播放| 亚洲免费av在线视频| 天堂影院成人在线观看| 日韩国内少妇激情av| 999久久久精品免费观看国产| 午夜免费成人在线视频| 亚洲成人国产一区在线观看| 久久人妻福利社区极品人妻图片| 国产精华一区二区三区| 女人被狂操c到高潮| 精品国内亚洲2022精品成人| 欧美激情久久久久久爽电影 | 夜夜看夜夜爽夜夜摸 | 久久久精品欧美日韩精品| 亚洲精华国产精华精| 国产区一区二久久| 看免费av毛片| 手机成人av网站| 涩涩av久久男人的天堂| 欧美日本中文国产一区发布| 久久精品成人免费网站| 国产单亲对白刺激| 国产精品野战在线观看 | 国产有黄有色有爽视频| 亚洲色图 男人天堂 中文字幕| 国产激情久久老熟女| 91在线观看av| 久久人人97超碰香蕉20202| 亚洲成人国产一区在线观看| 中文字幕人妻丝袜制服| 亚洲色图 男人天堂 中文字幕| 国产精品久久电影中文字幕| 亚洲欧美一区二区三区久久| 精品一区二区三区视频在线观看免费 | 亚洲欧美激情在线| 久久国产精品影院| 99国产极品粉嫩在线观看| 国产一卡二卡三卡精品| 18禁美女被吸乳视频| 在线观看免费午夜福利视频| 黑人猛操日本美女一级片| 欧美日韩国产mv在线观看视频| 精品国产超薄肉色丝袜足j| av在线播放免费不卡| 亚洲精品国产精品久久久不卡| 久久天躁狠狠躁夜夜2o2o| 国产精品久久电影中文字幕| 丝袜美足系列| 黄色 视频免费看| a级片在线免费高清观看视频| 久久人妻福利社区极品人妻图片| 久久午夜亚洲精品久久| 国产激情久久老熟女| 亚洲自偷自拍图片 自拍| 18禁观看日本| 国产精品一区二区三区四区久久 | 午夜成年电影在线免费观看| 超碰成人久久| 国产深夜福利视频在线观看| 免费在线观看完整版高清| 亚洲av熟女| 日本wwww免费看| 夜夜躁狠狠躁天天躁| 一级a爱视频在线免费观看| 婷婷精品国产亚洲av在线| 国产亚洲欧美在线一区二区| 亚洲一卡2卡3卡4卡5卡精品中文| 国产人伦9x9x在线观看| 女同久久另类99精品国产91| 国产精品香港三级国产av潘金莲| 99国产综合亚洲精品| 亚洲人成电影免费在线| 啦啦啦在线免费观看视频4| 亚洲人成网站在线播放欧美日韩| 亚洲国产毛片av蜜桃av| 亚洲av电影在线进入| 中文字幕人妻熟女乱码| 国产高清国产精品国产三级| 欧美激情久久久久久爽电影 | 神马国产精品三级电影在线观看 | 91精品三级在线观看| 18美女黄网站色大片免费观看| av网站在线播放免费| 欧美乱色亚洲激情| 好男人电影高清在线观看| 欧美激情极品国产一区二区三区| 超色免费av| 国内久久婷婷六月综合欲色啪| 岛国在线观看网站| 欧美av亚洲av综合av国产av| 国产av精品麻豆| 国产亚洲欧美98| 欧美日韩国产mv在线观看视频| 999久久久国产精品视频| 深夜精品福利| 超色免费av| 精品第一国产精品| 亚洲欧美精品综合一区二区三区| 亚洲第一av免费看| 亚洲国产精品一区二区三区在线| 女人被狂操c到高潮| 不卡av一区二区三区| 99国产极品粉嫩在线观看| 国产精品日韩av在线免费观看 | 老鸭窝网址在线观看| www.精华液| 亚洲午夜精品一区,二区,三区| 免费少妇av软件| 日本免费a在线| 国产区一区二久久| 好看av亚洲va欧美ⅴa在| 99国产极品粉嫩在线观看| av有码第一页| 国产欧美日韩综合在线一区二区| 久久青草综合色| 女同久久另类99精品国产91| 91麻豆精品激情在线观看国产 | 丝袜在线中文字幕| 亚洲成人国产一区在线观看| 久久久久国内视频| 亚洲精品国产色婷婷电影| 一级a爱视频在线免费观看| 亚洲精品久久成人aⅴ小说| 免费人成视频x8x8入口观看| 色综合欧美亚洲国产小说| 美国免费a级毛片| 国产亚洲精品第一综合不卡| 国产成人精品在线电影| 久久九九热精品免费| 91老司机精品| 亚洲专区国产一区二区| 亚洲精品一二三| 桃红色精品国产亚洲av| 国产精品一区二区免费欧美| 一边摸一边做爽爽视频免费| 国产蜜桃级精品一区二区三区| 亚洲国产欧美一区二区综合| 国产高清videossex| 国产亚洲av高清不卡| 99精品欧美一区二区三区四区| 丝袜人妻中文字幕| 成人影院久久| 亚洲中文字幕日韩| 亚洲av成人av| 69精品国产乱码久久久| 真人做人爱边吃奶动态| 亚洲伊人色综图| 黑丝袜美女国产一区| 国产成人欧美在线观看| 欧美国产精品va在线观看不卡| 天天影视国产精品| 日韩av在线大香蕉| 日本精品一区二区三区蜜桃| 日韩人妻精品一区2区三区| 国产aⅴ精品一区二区三区波| 久久久久久免费高清国产稀缺| 日本精品一区二区三区蜜桃| 黄色片一级片一级黄色片| 精品卡一卡二卡四卡免费| 亚洲欧美日韩无卡精品| 一夜夜www| 天堂影院成人在线观看| 身体一侧抽搐| 午夜福利免费观看在线| 欧美丝袜亚洲另类 | 99国产精品一区二区三区| 免费少妇av软件| a级毛片在线看网站| 国产日韩一区二区三区精品不卡| 亚洲精品国产区一区二| 啦啦啦 在线观看视频| 精品一区二区三区四区五区乱码| 国产精品久久久久成人av| 国产又色又爽无遮挡免费看| 亚洲一区二区三区欧美精品| 丰满迷人的少妇在线观看| 国产成人欧美| videosex国产| 中出人妻视频一区二区| 777久久人妻少妇嫩草av网站| 在线永久观看黄色视频| 嫁个100分男人电影在线观看| 我的亚洲天堂| 国产精品影院久久| 天堂中文最新版在线下载| 成人18禁在线播放| 麻豆久久精品国产亚洲av | 国产片内射在线| 妹子高潮喷水视频| 久久久久久大精品| 国产亚洲欧美精品永久| 侵犯人妻中文字幕一二三四区| 黄片小视频在线播放| bbb黄色大片| 欧美性长视频在线观看| 国产真人三级小视频在线观看| 中亚洲国语对白在线视频| 成人18禁高潮啪啪吃奶动态图| www.自偷自拍.com| 久久精品国产亚洲av高清一级| 级片在线观看| 男人舔女人的私密视频| 99国产精品一区二区蜜桃av| 丰满迷人的少妇在线观看| 午夜视频精品福利| 久久中文字幕人妻熟女| 国产成人啪精品午夜网站| 亚洲成人免费电影在线观看| 国产一区二区激情短视频| av片东京热男人的天堂| av电影中文网址| 一区二区日韩欧美中文字幕| 久9热在线精品视频| 亚洲专区字幕在线| 少妇被粗大的猛进出69影院| 欧美精品一区二区免费开放| 看黄色毛片网站| 国产精品香港三级国产av潘金莲| 视频区图区小说| 日韩精品中文字幕看吧| 中文字幕人妻丝袜一区二区| 午夜老司机福利片| www日本在线高清视频| 88av欧美| www国产在线视频色| 国产亚洲av高清不卡| 亚洲精品国产精品久久久不卡| 可以免费在线观看a视频的电影网站| 亚洲欧美日韩另类电影网站| 亚洲精品粉嫩美女一区| 大码成人一级视频| 国产精品免费视频内射| 亚洲熟妇熟女久久| 老司机午夜福利在线观看视频| 国产精品亚洲一级av第二区| 淫秽高清视频在线观看| 成人18禁在线播放| 女人被躁到高潮嗷嗷叫费观| 性色av乱码一区二区三区2| av天堂久久9| 涩涩av久久男人的天堂| 色精品久久人妻99蜜桃| 麻豆一二三区av精品| 日韩精品免费视频一区二区三区| 亚洲五月婷婷丁香| 在线观看舔阴道视频| 国产蜜桃级精品一区二区三区| 女警被强在线播放| av免费在线观看网站| 国产精品爽爽va在线观看网站 | 欧美精品啪啪一区二区三区| 亚洲成人国产一区在线观看| 精品一区二区三区视频在线观看免费 | 成人亚洲精品av一区二区 | 桃红色精品国产亚洲av| 热re99久久国产66热| 美女午夜性视频免费| 中文字幕人妻熟女乱码| 激情在线观看视频在线高清| 日本精品一区二区三区蜜桃| 狂野欧美激情性xxxx| 每晚都被弄得嗷嗷叫到高潮| 国内毛片毛片毛片毛片毛片| 色尼玛亚洲综合影院| 欧美另类亚洲清纯唯美| 12—13女人毛片做爰片一| 欧美日韩乱码在线| 怎么达到女性高潮| 亚洲美女黄片视频| 99精国产麻豆久久婷婷| 亚洲avbb在线观看| 久久精品91蜜桃| 他把我摸到了高潮在线观看| 久久久精品国产亚洲av高清涩受| 九色亚洲精品在线播放| 国产精品爽爽va在线观看网站 | 侵犯人妻中文字幕一二三四区| 亚洲性夜色夜夜综合| 中文字幕最新亚洲高清| 久久国产乱子伦精品免费另类| 麻豆国产av国片精品| 757午夜福利合集在线观看| 国产精品爽爽va在线观看网站 | 老司机在亚洲福利影院| 国产黄a三级三级三级人| 美女扒开内裤让男人捅视频| 日韩免费av在线播放| 又大又爽又粗| 好看av亚洲va欧美ⅴa在| 欧美日本中文国产一区发布| www.熟女人妻精品国产| 亚洲国产毛片av蜜桃av| 日韩有码中文字幕| 侵犯人妻中文字幕一二三四区| 中文字幕另类日韩欧美亚洲嫩草| 国产精品电影一区二区三区| 亚洲精品久久成人aⅴ小说| 两人在一起打扑克的视频| 妹子高潮喷水视频| 久久天躁狠狠躁夜夜2o2o| 国产熟女xx| 在线天堂中文资源库| 伦理电影免费视频| 国产三级在线视频| 久久久国产成人免费| 欧美成人午夜精品| 黄频高清免费视频| 国产成人精品久久二区二区免费| 他把我摸到了高潮在线观看| 99久久综合精品五月天人人| 99久久久亚洲精品蜜臀av| www.www免费av| 女性被躁到高潮视频| 亚洲狠狠婷婷综合久久图片| 淫妇啪啪啪对白视频| 一进一出好大好爽视频| 久久久久国产一级毛片高清牌| 婷婷精品国产亚洲av在线| 成年人黄色毛片网站| 国产精品免费视频内射| 久久精品国产亚洲av高清一级| 看片在线看免费视频| 亚洲精品美女久久久久99蜜臀| 91大片在线观看| 国产真人三级小视频在线观看| 日本撒尿小便嘘嘘汇集6| 成人av一区二区三区在线看| 久久久久久久久久久久大奶| 久久精品亚洲精品国产色婷小说| 国产精品日韩av在线免费观看 | 中文字幕最新亚洲高清| 久久狼人影院| 十分钟在线观看高清视频www| 一进一出抽搐gif免费好疼 | 色婷婷久久久亚洲欧美| 久久久精品欧美日韩精品| 亚洲九九香蕉| 黑人猛操日本美女一级片| 国产真人三级小视频在线观看| 亚洲免费av在线视频| 嫩草影视91久久| 香蕉国产在线看| 一区二区三区激情视频| 久久天躁狠狠躁夜夜2o2o| 热99国产精品久久久久久7| 成在线人永久免费视频| 国产成人精品久久二区二区免费| 免费高清视频大片| 级片在线观看| 国产免费av片在线观看野外av| 亚洲第一欧美日韩一区二区三区| 亚洲自拍偷在线| 两人在一起打扑克的视频| 好男人电影高清在线观看| 真人一进一出gif抽搐免费| 少妇 在线观看| 最近最新免费中文字幕在线| 两性午夜刺激爽爽歪歪视频在线观看 | 黑人巨大精品欧美一区二区mp4| 最近最新免费中文字幕在线| 美女国产高潮福利片在线看| 亚洲七黄色美女视频| 日韩免费高清中文字幕av| 精品久久久久久久毛片微露脸| 亚洲色图综合在线观看| 老汉色av国产亚洲站长工具| 精品第一国产精品| 黄色女人牲交| 色尼玛亚洲综合影院| 久久亚洲精品不卡| 美女扒开内裤让男人捅视频| 免费少妇av软件| 亚洲人成伊人成综合网2020| 日韩欧美国产一区二区入口| 欧美日韩福利视频一区二区| 一边摸一边做爽爽视频免费| 18美女黄网站色大片免费观看| 欧美日韩av久久| 国产精品久久久久久人妻精品电影| 亚洲专区字幕在线| 国产伦人伦偷精品视频| 国产免费男女视频| 国产精品自产拍在线观看55亚洲| 真人做人爱边吃奶动态| 欧美日韩中文字幕国产精品一区二区三区 | 午夜免费成人在线视频| 国产av又大| 色哟哟哟哟哟哟| 高清毛片免费观看视频网站 | 亚洲片人在线观看| 女人被狂操c到高潮| 在线视频色国产色| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲第一av免费看| 人妻久久中文字幕网| 男女做爰动态图高潮gif福利片 | 极品教师在线免费播放| 女性生殖器流出的白浆| 看黄色毛片网站| 黑丝袜美女国产一区| 欧美乱码精品一区二区三区| 久久中文字幕一级| 亚洲自偷自拍图片 自拍| 国产精品av久久久久免费| 精品卡一卡二卡四卡免费| 在线天堂中文资源库| 黄色毛片三级朝国网站| 19禁男女啪啪无遮挡网站| 成人精品一区二区免费| 精品久久久久久久毛片微露脸| 亚洲午夜理论影院| 嫩草影院精品99| 搡老熟女国产l中国老女人| 香蕉丝袜av| 亚洲国产精品合色在线| av网站免费在线观看视频| 欧美成人午夜精品| 日日干狠狠操夜夜爽| 中文字幕高清在线视频| 视频区欧美日本亚洲| 国产成人精品久久二区二区免费| 亚洲视频免费观看视频| 久久久久国产一级毛片高清牌| 精品国产一区二区三区四区第35| 欧美成人免费av一区二区三区|