• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于主題與語(yǔ)義的作弊網(wǎng)頁(yè)檢測(cè)方法

    2015-11-04 06:19:34易軍凱劉慕凡
    計(jì)算機(jī)工程 2015年9期
    關(guān)鍵詞:作弊分類器網(wǎng)頁(yè)

    易軍凱,劉慕凡,萬 靜

    (北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京100029)

    基于主題與語(yǔ)義的作弊網(wǎng)頁(yè)檢測(cè)方法

    易軍凱,劉慕凡,萬 靜

    (北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京100029)

    網(wǎng)頁(yè)作弊檢測(cè)可以被看作二元分類問題。當(dāng)前基于內(nèi)容的作弊網(wǎng)頁(yè)檢測(cè)方法主要使用統(tǒng)計(jì)特征,不能準(zhǔn)確識(shí)別隱藏的作弊手段。為此,提出一種改進(jìn)的作弊網(wǎng)頁(yè)檢測(cè)方法,使用語(yǔ)義與統(tǒng)計(jì)兩類特征,將作弊檢測(cè)深入至主題層次。該方法對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行主題建模,將網(wǎng)頁(yè)內(nèi)容映射至主題空間,根據(jù)其主題分布進(jìn)行語(yǔ)義分析計(jì)算,從中提取語(yǔ)義特征,結(jié)合統(tǒng)計(jì)特征對(duì)網(wǎng)頁(yè)進(jìn)行分類檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該方法在精確率、召回率與F1測(cè)度上均獲得了較好的效果。

    分類;主題模型;潛在狄利克雷分配;語(yǔ)義特征;語(yǔ)義相似度

    1 概述

    網(wǎng)頁(yè)作弊指信息檢索中網(wǎng)頁(yè)使用不正當(dāng)手段來獲得不公正的查詢相關(guān)性與重要性的行為[1]。網(wǎng)頁(yè)作弊行為使用戶獲取不相關(guān)的查詢結(jié)果,還可能向用戶提供危險(xiǎn)信息,造成用戶安全隱患,大量作弊網(wǎng)頁(yè)的存在還降低了搜索引擎的準(zhǔn)確率,增加索引與查詢的開銷,降低了搜索引擎的系統(tǒng)性能[2]。識(shí)別網(wǎng)頁(yè)作弊,提高檢索內(nèi)容可信度,是搜索引擎面臨的主要挑戰(zhàn)之一。

    根據(jù)不同的作弊方式,目前已經(jīng)提出了相應(yīng)的反作弊方法。文獻(xiàn)[2]對(duì)當(dāng)今各種作弊技術(shù)進(jìn)行了總結(jié),將作弊方式分為內(nèi)容作弊、鏈接作弊以及隱藏的作弊。文獻(xiàn)[3]提出了一種基于內(nèi)容的檢測(cè)方法,使用詞匯數(shù)量、標(biāo)題長(zhǎng)度、詞匯平均長(zhǎng)度等統(tǒng)計(jì)特征進(jìn)行分類檢測(cè)。文獻(xiàn)[4]提出改進(jìn)的基于內(nèi)容的方法,他們使用轉(zhuǎn)碼功能、代碼比例、拼寫檢查等特征進(jìn)行檢測(cè),提高了傳統(tǒng)方法的檢測(cè)效果。文獻(xiàn)[5]提出了一種基于鏈接的反作弊算法TrustRank,其思想是優(yōu)質(zhì)頁(yè)面也會(huì)鏈向優(yōu)質(zhì)頁(yè)面,很少鏈向作弊頁(yè)面,從而使用圖算法進(jìn)行可信度傳遞。文獻(xiàn)[6]提出思路相反的Spam Rank算法,該算法認(rèn)為鏈向作弊網(wǎng)頁(yè)的網(wǎng)頁(yè)也大多數(shù)是作弊網(wǎng)頁(yè)。文獻(xiàn)[7]提出了一種將基于內(nèi)容與基于鏈接相結(jié)合的反作弊方法,使用網(wǎng)絡(luò)拓?fù)鋱D與聚類算法,對(duì)作弊網(wǎng)頁(yè)進(jìn)行匯集識(shí)別。文獻(xiàn)[8]提出一種基于鏈接結(jié)構(gòu)的作弊網(wǎng)頁(yè)過濾算法。該算法認(rèn)為作弊網(wǎng)頁(yè)之間相互勾結(jié)相互鏈接,鏈接結(jié)構(gòu)具有較高的相似性。基于這一特性,對(duì)網(wǎng)頁(yè)進(jìn)行聚類與權(quán)值分配,并運(yùn)行PageRank算法,以達(dá)到對(duì)Spam頁(yè)面的過濾。文獻(xiàn)[9]提出了一種基于Co-Training模型的作弊網(wǎng)頁(yè)檢測(cè)方法,該方法使用內(nèi)容的統(tǒng)計(jì)特征與基于網(wǎng)絡(luò)圖的鏈接,建立2個(gè)獨(dú)立的分類器,使用Co-Training半監(jiān)督學(xué)習(xí)方法,利用大量未標(biāo)記數(shù)據(jù)來改善分類器質(zhì)量。文獻(xiàn)[10]提出了一種基于證據(jù)的內(nèi)容可信度模型檢測(cè)算法,他們提出基于證據(jù)的信息可靠度模型,并在此基礎(chǔ)上給出了新的學(xué)習(xí)算法來進(jìn)行垃圾網(wǎng)頁(yè)檢測(cè)。文獻(xiàn)[11]針對(duì)隱藏的作弊,提出了一種雙爬蟲檢測(cè)方法,通過模擬搜索引擎爬蟲與用戶瀏覽爬蟲抓取網(wǎng)頁(yè)內(nèi)容,進(jìn)行對(duì)比判斷。

    這些方法從不同的角度提出了相應(yīng)的檢測(cè)算法,但是基于內(nèi)容的作弊檢測(cè)方法一般只考慮文本淺層的統(tǒng)計(jì)特征,沒有考察文本深層的語(yǔ)義特征,不能很好識(shí)別隱藏的作弊手段;基于鏈接的方法則往往忽略對(duì)網(wǎng)頁(yè)本身內(nèi)容的評(píng)估。本文提出了一種基于主題與語(yǔ)義的作弊網(wǎng)頁(yè)檢測(cè)方法(Topic models and Semantic analysis based Spam Detection,TSSD),該方法使用深層語(yǔ)義特征,對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行主題建模,分析其語(yǔ)義特點(diǎn),深入主題進(jìn)行檢測(cè)。同時(shí)結(jié)合淺層統(tǒng)計(jì)特征,對(duì)網(wǎng)頁(yè)進(jìn)行綜合檢測(cè),以提高檢測(cè)效果。

    2 相關(guān)定義

    2.1 LDA主題模型

    LDA(Latent Dirichlet A llocation)是由Blei等人提出的一種文本模型[12],可以用來識(shí)別文檔或者語(yǔ)料庫(kù)中潛藏的主題信息。

    LDA主題模型中定義了詞語(yǔ)(w)、文檔(m)與主題(z)3個(gè)基本定義。其中詞語(yǔ)是最基本的離散概念,就是自然語(yǔ)言中的詞。文檔就是多個(gè)詞語(yǔ)的集合,主題則是一系列詞語(yǔ)的集合。對(duì)于語(yǔ)料庫(kù)中的每篇文檔,LDA假設(shè)了如下生成過程:

    (1)從參數(shù)為ξ的泊松分布Possion(ξ)中抽取N個(gè)詞語(yǔ);

    (2)從參數(shù)為α的Dirichlet先驗(yàn)分布Dir(α)中為每個(gè)文檔m∈[1,M]抽取多項(xiàng)分布θm,從參數(shù)為β的Dirichlet先驗(yàn)分布Dir(β)中為主題z[1,K]抽取多項(xiàng)分布φz;

    (3)對(duì)每個(gè)詞語(yǔ)wn,n[1,N]:

    1)根據(jù)多項(xiàng)分布θm抽取一個(gè)主題z;

    2)根據(jù)多項(xiàng)分布φz抽取一個(gè)詞語(yǔ)w。

    其中,M為文檔的數(shù)量;K為每個(gè)文檔中主題的數(shù)目,超參數(shù)α與β為Dirichlet先驗(yàn)概率假設(shè),在模型推斷中設(shè)定為固定值;θm表示文檔m在主題上的后驗(yàn)概率分布;φz表示主題在詞匯上的后驗(yàn)概率分布。

    2.2 語(yǔ)義分析

    本文使用LDA主題模型與語(yǔ)義相似度計(jì)算來進(jìn)行語(yǔ)義分析。對(duì)于一個(gè)網(wǎng)頁(yè)m,其主題分布為:Z(m)={z1,z2,…,zK}。每個(gè)主題zi(1≤K≤K)屬于文檔m的概率為δzK。zK中包含了一系列代表該主題的詞匯,記為W(zK),對(duì)其中每個(gè)單詞wi,它屬于主題zK的可能性為φ(wi|zK)。

    定義1 語(yǔ)義相似度(Sim):表示文檔或術(shù)語(yǔ)之間語(yǔ)義內(nèi)容或涵義內(nèi)容的相似程度。本文中使用基于W ordNet(http://wordnet.princeton.edu/)的Lin方法來進(jìn)行語(yǔ)義相似度計(jì)算。Lin方法計(jì)算2個(gè)詞語(yǔ)c1,c2的語(yǔ)義相似度為:

    其中,lso(c1,c2)是詞語(yǔ)c1,c2最近的公共父節(jié)點(diǎn)的距離;P(c)表示c的概率。該方法除了考慮詞語(yǔ)c1,c2的共享信息,還考慮了詞語(yǔ)自身包含的信息,其結(jié)果貼近于人工判斷的結(jié)果。

    定義2 主題語(yǔ)義明確度(T):表示一個(gè)主題所表達(dá)含義的清晰程度。對(duì)于一個(gè)主題zi,其主題語(yǔ)義明確度為:

    其中,Sim(wK,wl)表示單詞wK,wl之間的語(yǔ)義相似度;nzi表示主題zi中含有的詞匯數(shù)目。主題語(yǔ)義明確度是一個(gè)主題的內(nèi)部詞匯之間平均相似程度。

    定義3 主題間語(yǔ)義相關(guān)度(TS):為2個(gè)主題間的語(yǔ)義相似程度。對(duì)2個(gè)主題zi,zj,其主題間語(yǔ)義相關(guān)度為:

    式(3)反映了2個(gè)主題之間的語(yǔ)義相似程度。值越高,說明這2個(gè)主題的語(yǔ)義越相似。

    定義4 主題詞匯分布偏斜性(TW)。構(gòu)造基準(zhǔn)主題zb,使得對(duì)于每個(gè)詞語(yǔ)wi(i=1,2,…,V),出現(xiàn)概率φ(wi|zb)=1/V。主題的詞分布偏斜性TW定義為主題zi的詞分布與zb的詞分布的差異程度,使用KL散度進(jìn)行計(jì)算:

    式(4)反映了主題中詞匯的分布與平均分布的差異性,TW值越小,主題上詞語(yǔ)的分布越接近平均分布。

    3 主題與語(yǔ)義的檢測(cè)方法

    作弊網(wǎng)頁(yè)檢測(cè)通常被視為一個(gè)二元分類的問題:將網(wǎng)頁(yè)用一系列特征來表示,隨后使用機(jī)器學(xué)習(xí)的方法建立分類器,將網(wǎng)頁(yè)分為正常網(wǎng)頁(yè)與作弊網(wǎng)頁(yè)兩類。TSSD的算法框架如圖1所示。

    圖1 TSSD算法框架

    TSSD算法以網(wǎng)頁(yè)文件作為輸入,對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行預(yù)處理,抽取網(wǎng)頁(yè)正文,去掉停用詞,最終生成網(wǎng)頁(yè)詞集文檔,然后使用LDA方法進(jìn)行主題建模,并對(duì)構(gòu)建好的主題模型進(jìn)行語(yǔ)義分析與計(jì)算,抽取網(wǎng)頁(yè)的語(yǔ)義特征與統(tǒng)計(jì)特征,最后使用機(jī)器學(xué)習(xí)分類算法進(jìn)行分類檢測(cè)。

    3.1 算法設(shè)計(jì)思想

    在基于內(nèi)容的網(wǎng)頁(yè)作弊中,作弊網(wǎng)頁(yè)不僅在詞匯數(shù)目、詞匯頻率等統(tǒng)計(jì)特征上與正常網(wǎng)頁(yè)具有區(qū)別,而且在文本主題上也有與正常網(wǎng)頁(yè)顯著不同的特征。作弊頁(yè)面通常是“主題堆積”的,即在內(nèi)容中添加了大量與某些主題相關(guān)的關(guān)鍵詞,以提升網(wǎng)頁(yè)在這些主題上的查詢相關(guān)度。這些關(guān)鍵詞通常是語(yǔ)義相近的,且在頻率分布上不具有自然語(yǔ)言中的詞匯分布特點(diǎn)。TSSD方法根據(jù)此特點(diǎn),提出了以下5個(gè)語(yǔ)義特征,在主題相關(guān)度、主題詞匯分布規(guī)律等方面進(jìn)行作弊網(wǎng)頁(yè)檢測(cè)。

    3.2 主題與語(yǔ)義的特征

    3.2.1 網(wǎng)頁(yè)主題詞匯分布傾斜度

    定義網(wǎng)頁(yè)主題詞匯分布傾斜度PW(m)的計(jì)算公式為:

    其中,TW(zi)為定義4中主題詞匯分布偏斜性;PW(m)反映了網(wǎng)頁(yè)主題關(guān)鍵詞分布,取值越小說明主題中各個(gè)關(guān)鍵詞出現(xiàn)頻率越平均,不符合自然語(yǔ)言中少數(shù)詞匯出現(xiàn)頻率較高的特點(diǎn),這樣的網(wǎng)頁(yè)有可能是作弊網(wǎng)頁(yè)。本文基礎(chǔ)了統(tǒng)計(jì)計(jì)算,繪制圖形如圖2所示。

    圖2 網(wǎng)頁(yè)主題詞匯分布傾斜度統(tǒng)計(jì)圖

    圖2 中包含了一個(gè)柱形圖和一個(gè)折線圖,柱形圖描述了網(wǎng)頁(yè)在某個(gè)方面的分布,水平軸描述了網(wǎng)頁(yè)在該方面的取值范圍。左垂直軸適用于柱形圖,反映了區(qū)間上網(wǎng)頁(yè)數(shù)目比例,右垂直軸適用于折線圖,反映了區(qū)間上作弊網(wǎng)頁(yè)的比例,即作弊可能性。本節(jié)其他圖的描述方式也是如此。

    從圖2中可以看出,當(dāng)網(wǎng)頁(yè)的PW(m)取值較低時(shí),網(wǎng)頁(yè)具有較高的作弊可能性。

    3.2.2 網(wǎng)頁(yè)主題明確度

    定義網(wǎng)頁(yè)主題明確度PT(m)的計(jì)算公式為:

    其中,T(zi)為定義2中主題語(yǔ)義明確度;PT(m)反映了網(wǎng)頁(yè)各個(gè)主題明確度的平均值,部分作弊網(wǎng)頁(yè)中過分堆積特定主題相關(guān)的關(guān)鍵詞,導(dǎo)致其PT(m)取值明顯高于正常網(wǎng)頁(yè)。對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)繪制,圖3為網(wǎng)頁(yè)主題明確度統(tǒng)計(jì)圖。

    圖3 網(wǎng)頁(yè)主題明確度統(tǒng)計(jì)圖

    3.2.3 網(wǎng)頁(yè)主題間相關(guān)度

    定義網(wǎng)頁(yè)主題間相關(guān)度PTS(m)的計(jì)算公式為:

    其中,TS(zi,zj)為定義3中的主題間語(yǔ)義相關(guān)度。PTS(m)反映了網(wǎng)頁(yè)各個(gè)主題之間語(yǔ)義相關(guān)度的平均水平,作弊網(wǎng)頁(yè)中由于主題堆積導(dǎo)致其主題間語(yǔ)義相關(guān)度取值過高。對(duì)此針對(duì)實(shí)驗(yàn)數(shù)據(jù)繪制了統(tǒng)計(jì)圖如圖4所示。

    圖4 網(wǎng)頁(yè)主題間相關(guān)度統(tǒng)計(jì)圖

    圖4 顯示,作弊網(wǎng)頁(yè)取值與正常網(wǎng)頁(yè)具有較大的不同。取值高于0.001后,網(wǎng)頁(yè)作弊的可能性隨著取值的變大而不斷增加。

    3.2.4 網(wǎng)頁(yè)主題綜合明確度

    定義網(wǎng)頁(yè)主題綜合明確度PTA(m)的計(jì)算公式為:

    其中,δzi表示主題zi在網(wǎng)頁(yè)m中的權(quán)重。PIA(m)考慮到各個(gè)主題在網(wǎng)頁(yè)中的權(quán)重,對(duì)T(zi)進(jìn)行了加權(quán)求和,反映網(wǎng)頁(yè)整體的主題明確度。作弊網(wǎng)頁(yè)中的主題堆積現(xiàn)象導(dǎo)致網(wǎng)頁(yè)整體主題明確度取值過高。如圖5所示描繪了對(duì)實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,可以看出作弊網(wǎng)頁(yè)與正常網(wǎng)頁(yè)的差異,隨著取值的不斷上升,網(wǎng)頁(yè)作弊的可能性也不斷提高。

    圖5 網(wǎng)頁(yè)主題綜合明確度統(tǒng)計(jì)圖

    3.2.5 網(wǎng)頁(yè)主題詞匯語(yǔ)義相關(guān)度PWS(m)

    定義網(wǎng)頁(yè)主題詞匯語(yǔ)義相關(guān)度PWS(m)計(jì)算公式為:

    其中,Sim(wi,wj)是詞匯wi,wj的語(yǔ)義相似度。PWS(m)考察主題內(nèi)詞匯之間的語(yǔ)義相似度,取值過高可能是主題堆積與關(guān)鍵詞堆積導(dǎo)致,這樣的網(wǎng)頁(yè)很有可能是作弊網(wǎng)頁(yè)。圖6為關(guān)鍵詞語(yǔ)義相似度統(tǒng)計(jì)圖。

    圖6 關(guān)鍵詞語(yǔ)義相似度統(tǒng)計(jì)圖

    從圖6中可以看到,大部分網(wǎng)頁(yè)的網(wǎng)頁(yè)關(guān)鍵詞語(yǔ)義相似度的取值在0~4之間。當(dāng)取值超過4時(shí),網(wǎng)頁(yè)作弊的可能性迅速上升,當(dāng)取值超過6時(shí),網(wǎng)頁(yè)作弊可能性幾乎達(dá)到100%。

    TSSD方法以網(wǎng)頁(yè)內(nèi)容作為輸入,每個(gè)網(wǎng)頁(yè)看作一個(gè)單獨(dú)的文檔,對(duì)于不同長(zhǎng)度的網(wǎng)頁(yè),文檔規(guī)模也大小不一。部分網(wǎng)頁(yè)含有的文本內(nèi)容較少,只有幾十甚至十幾個(gè)詞語(yǔ),類似于tw eets。有研究顯示,對(duì)這樣的短文本進(jìn)行建模時(shí),由于詞匯數(shù)目較少,缺少足夠的詞出現(xiàn)數(shù)目,無法推斷詞之間的相關(guān)性,導(dǎo)致主題建模結(jié)果受到影響[13]。針對(duì)這個(gè)缺陷,同時(shí)為了加強(qiáng)文中方法的檢測(cè)效果,本文選取了文獻(xiàn)[3-4]中部分基于內(nèi)容的統(tǒng)計(jì)特征:平均單詞長(zhǎng)度,標(biāo)題單詞數(shù)目,Keywords元標(biāo)簽詞匯數(shù)目,錨文本數(shù)目,可見內(nèi)容比例,網(wǎng)頁(yè)壓縮率。

    (1)平均單詞長(zhǎng)度。部分作弊網(wǎng)頁(yè)采用熱點(diǎn)詞匯拼接的方式進(jìn)行作弊,統(tǒng)計(jì)顯示網(wǎng)頁(yè)平均單詞長(zhǎng)度較高的網(wǎng)頁(yè)具有高的作弊可能性。

    (2)標(biāo)題單詞數(shù)目。標(biāo)題是網(wǎng)頁(yè)內(nèi)容的概括,在信息檢索中具有很高的權(quán)重。作弊網(wǎng)頁(yè)常常在網(wǎng)頁(yè)標(biāo)題中添加大量檢索關(guān)鍵詞,以增加檢索范圍與權(quán)重,導(dǎo)致其標(biāo)題單詞數(shù)目遠(yuǎn)高于正常網(wǎng)頁(yè)。

    (3)Keywords元標(biāo)簽詞匯數(shù)目。Keywords元標(biāo)簽關(guān)鍵詞填充是一種常見的作弊手段,部分作弊網(wǎng)頁(yè)在Keywords元標(biāo)簽中添加了大量關(guān)鍵詞,導(dǎo)致其詞匯數(shù)目明顯高于正常網(wǎng)頁(yè)。

    (4)錨文本數(shù)目。搜索引擎中,錨文本可以同時(shí)提高所在網(wǎng)頁(yè)與指向網(wǎng)頁(yè)的排名。作弊網(wǎng)頁(yè)之間通常相互鏈接,并大量使用錨文本來增加彼此的權(quán)重。因此,作弊網(wǎng)頁(yè)中通常具有更多的錨文本。

    (5)可見內(nèi)容比例。一些HTML標(biāo)簽并不會(huì)被瀏覽器翻譯,例如網(wǎng)頁(yè)頭部meta標(biāo)簽,圖片標(biāo)簽中alt屬性等。然而這些標(biāo)簽通常被作弊網(wǎng)頁(yè)利用,作為關(guān)鍵詞堆積的隱藏目標(biāo)。這里的可見內(nèi)容比例定義為網(wǎng)頁(yè)中無標(biāo)記文本的長(zhǎng)度除以網(wǎng)頁(yè)總長(zhǎng)度,以比特為單位。正常網(wǎng)頁(yè)注重網(wǎng)頁(yè)的布局與文本的裝飾,文本標(biāo)記較多,可見內(nèi)容比例較低;而作弊網(wǎng)頁(yè)注重關(guān)鍵詞的堆積,文本標(biāo)記相對(duì)較少,導(dǎo)致其可見內(nèi)容比例較高。

    (6)網(wǎng)頁(yè)壓縮率。一些搜索引擎給予網(wǎng)頁(yè)中多次出現(xiàn)的關(guān)鍵詞較高的權(quán)重,因此部分作弊網(wǎng)頁(yè)添加了大量的重復(fù)關(guān)鍵詞與重復(fù)內(nèi)容,造成網(wǎng)頁(yè)內(nèi)容的冗余。對(duì)此可以利用壓縮率來測(cè)試網(wǎng)頁(yè)的冗余,其中壓縮率為網(wǎng)頁(yè)壓縮后的大小除以網(wǎng)頁(yè)壓縮之前的大小。具有較高重復(fù)內(nèi)容的作弊網(wǎng)頁(yè),其壓縮率遠(yuǎn)遠(yuǎn)小于正常網(wǎng)頁(yè)。文中采用GZIP算法來進(jìn)行網(wǎng)頁(yè)壓縮。

    3.3 特性提取

    TSSD方法以網(wǎng)頁(yè)文件作為輸入,每個(gè)網(wǎng)頁(yè)對(duì)應(yīng)一個(gè)單獨(dú)的文件,文件內(nèi)容即網(wǎng)頁(yè)源碼。本文中特征提取的步驟如下:

    (1)網(wǎng)頁(yè)預(yù)處理:對(duì)每一個(gè)網(wǎng)頁(yè)m,進(jìn)行預(yù)處理,得到網(wǎng)頁(yè)正文內(nèi)容。例如,去掉htm l標(biāo)簽、腳本與布局等。

    (2)生成詞集文檔:使用Lucene提取正文中的詞匯,并去掉停用詞與無用的標(biāo)記與符號(hào),生成詞匯集合W(m)。

    (3)LDA主題建模:以W(m)作為輸入進(jìn)行主題建模,得到m的主題模型,包括文檔-主題矩陣、主題-詞語(yǔ)矩陣以及詞匯表等。

    (4)語(yǔ)義分析與特征提?。簩?duì)構(gòu)建好的模型進(jìn)行計(jì)算,得到語(yǔ)義特征集以及統(tǒng)計(jì)特征集,最終將m表示為語(yǔ)義特征和統(tǒng)計(jì)特征組成的向量。

    3.4 分類學(xué)習(xí)

    TSSD方法將網(wǎng)頁(yè)用語(yǔ)義特征和統(tǒng)計(jì)特征組成的特征向量來表示,然后使用W eka中的機(jī)器學(xué)習(xí)算法進(jìn)行分類學(xué)習(xí),如決策樹,貝葉斯方法等。圖7為使用C4.5算法獲得的決策樹的一部分。

    圖7 決策樹(部分)

    4 實(shí)驗(yàn)與結(jié)果分析

    4.1 數(shù)據(jù)集

    實(shí)驗(yàn)中使用了2個(gè)公共數(shù)據(jù)集:WebbSpamCorpus與WEBSPAM-UK2007。其中,WebbSpamCorpus包含了超過350 000個(gè)作弊網(wǎng)頁(yè),是已知最大的作弊網(wǎng)頁(yè)數(shù)據(jù)集。WEBSPAM-UK 2007包含了105 896 555個(gè)網(wǎng)頁(yè),專門用以進(jìn)行作弊網(wǎng)頁(yè)檢測(cè)研究。

    實(shí)驗(yàn)將以上2個(gè)數(shù)據(jù)集混合,進(jìn)行隨機(jī)選取,去掉其中的跳轉(zhuǎn)頁(yè)面與空白頁(yè)等無效頁(yè)面,最后得到一個(gè)包含18 724個(gè)正常網(wǎng)頁(yè)與2 560個(gè)作弊網(wǎng)頁(yè)的數(shù)據(jù)集,其規(guī)模與作弊網(wǎng)頁(yè)比例近似于文獻(xiàn)[3]中使用的數(shù)據(jù)。

    實(shí)驗(yàn)中使用開源工具JGibbLDA作為主題模型推斷的實(shí)現(xiàn)工具,并使用開源機(jī)器學(xué)習(xí)工具W eka進(jìn)行作弊網(wǎng)頁(yè)的分類測(cè)試。使用精確率(precision)、召回率(recall)與F1測(cè)度(F-measure)作為分類結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)。

    4.2 結(jié)果分析

    為測(cè)試方法的檢測(cè)效果,本文進(jìn)行了多組實(shí)驗(yàn):首先對(duì)LDA中K與twords的不同取值進(jìn)行了對(duì)比測(cè)試,然后測(cè)試了機(jī)器學(xué)習(xí)中不同分類器的分類效果,最后與文獻(xiàn)[3]的統(tǒng)計(jì)特征進(jìn)行了對(duì)比測(cè)試。

    4.2.1 K與twords對(duì)結(jié)果的影響

    在LDA方法中,主題數(shù)K與主題中關(guān)鍵詞數(shù)twords的取值對(duì)建模結(jié)果影響較大。對(duì)此,實(shí)驗(yàn)中對(duì)實(shí)驗(yàn)數(shù)據(jù)構(gòu)建了多組主題模型,分別取值K,twords=4,5,6,7,8,9,10,并采用w eka中C4.5分類器進(jìn)行分類測(cè)試。最后結(jié)果如圖8所示。

    圖8 不同參數(shù)的結(jié)果對(duì)比

    從圖8中可以看到,隨著K與twords取值的上升,Spam類的Precision、Recall與F-measure值都在不斷上升。當(dāng)取值為10時(shí),作弊頁(yè)面的查全率最高,同時(shí)獲得了較高的精確率與F-measure值。

    4.2.2 比較不同分類器對(duì)分類結(jié)果的影響

    實(shí)驗(yàn)中對(duì)Weka中不同分類器在實(shí)驗(yàn)中的檢測(cè)效果進(jìn)行了對(duì)比分析。選取K=10,twords=10,并使用了C4.5、Random Forest、Random Tree、NaiveBayes、REPTree分類器進(jìn)行了分類對(duì)比。結(jié)果如圖9所示。可以看出,使用RandomForest分類器可以獲得最好的分類效果。為了增強(qiáng)檢測(cè)效果,實(shí)驗(yàn)隨后使用Boosting與Bagging方法來提高Random Forest分類器的分類效果。結(jié)果如表1所示。

    圖9 不同分類算法的結(jié)果

    表1 AdaBoost與Bagging分類效果 %

    結(jié)果顯示,使用Boosting與Bagging方法均可以提高Random Forest分類器的分類效果,其中Boosting方法提升作弊網(wǎng)頁(yè)的查全率與正常網(wǎng)頁(yè)的精確率,而使用Bagging方法則提升可作弊網(wǎng)頁(yè)的精確率與正常網(wǎng)頁(yè)的查全率。

    4.2.3 與傳統(tǒng)檢測(cè)方法的效果比較

    為了比較基于主題的檢測(cè)方法與其他檢測(cè)方法的效果,實(shí)驗(yàn)中模擬了文獻(xiàn)中Ntoulas提出的基于內(nèi)容的檢測(cè)方法,并使用本文提出的TSSD方法在同一實(shí)驗(yàn)數(shù)據(jù)上與其進(jìn)行對(duì)比。方法選取Random Forest分類器,結(jié)果如表2所示。

    表2 TSSD與N tou las方法比較 %

    實(shí)驗(yàn)結(jié)果顯示,TSSD方法可以獲得更高的精確率、查全率與F-measure值,在各項(xiàng)指標(biāo)上均優(yōu)于Ntoulas的檢測(cè)方法。由此可見,TSSD方法可以有效的對(duì)作弊網(wǎng)頁(yè)進(jìn)行識(shí)別,并且比起傳統(tǒng)的基于統(tǒng)計(jì)特征的檢測(cè)方法可以獲得更好的檢測(cè)效果。

    5 結(jié)束語(yǔ)

    針對(duì)傳統(tǒng)的基于內(nèi)容的作弊網(wǎng)頁(yè)檢測(cè)方法的檢測(cè)只停留在淺層統(tǒng)計(jì)特征的缺陷,本文提出基于主題與語(yǔ)義的作弊網(wǎng)頁(yè)檢測(cè)方法TSSD,對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行主題建模與語(yǔ)義分析,提取了一系列深層的語(yǔ)義特征,提升了檢測(cè)層面。實(shí)驗(yàn)結(jié)果顯示,該方法可以獲得較高的精確率、查全率與F1測(cè)度,具有良好的檢測(cè)效果。

    [1] Gyongyi Z,Garcia-Molina H.Web Spam Taxonomy[C]// Proceedings of the 1st International Workshop on Adversarial Information Retrieval on the Web.Chiba,Japan:[s.n.],2005:576-587.

    [2] Spirin N,Han J.Survey on Web Spam Detection:Principles and Algorithm s[J].ACM SIGKDD Explorations Newsletter,2012,13(2):50-64.

    [3] Ntoulas A,Najork M,M anasse M,et al.Detecting Spam Web Pages Through Content Analysis[C]//Proceedings of the 15th International Conference on W orld W ide Web.New York,USA:ACM Press,2006:83-92.

    [4] Prieto V M,álvarez M,Cacheda F.SAAD,a Content Based Web Spam Analyzer and Detector[J].Journal of System s and Software,2013,86(11):2906-2918.

    [5] Gy?ngyi Z,Garcia-Molina H,Pedersen J.Combating Web Spam with Trustrank[C]//Proceedings of the 30th International Conference on Very Large Data Bases.New York,USA:ACM Press,2004:576-587.

    [6] Benczur A A,Csalogany K,Sarlos T,et al.SpamRankˉˉˉ Fully Automatic Link Spam Detection Work in Progress[C]//Proceedings of the 1st International Workshop on Adversarial Information Retrieval on the Web.New York,USA:ACM Press,2005:57-64.

    [7] Castillo C,Donato D,Gionis A,et al.Know Your Neighbors:Web Spam Detection Using the Web Topology[C]//Proceedings of the 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.New York,USA:ACM Press,2007:423-430.

    [8] 陳小飛,王軼彤.一種基于鏈接結(jié)構(gòu)的Spam網(wǎng)頁(yè)過濾算法[C]//第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集.北京:中國(guó)計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫(kù)專業(yè)委員會(huì),2010.

    [9] 魏小娟,李翠平,陳 紅.Co-Trainingˉˉˉ內(nèi)容和鏈接的Web Spam檢測(cè)方法[J].計(jì)算機(jī)科學(xué)與探索,2010,(10):899-908.

    [10] Wang W,Zeng G,Tang D.Using Evidence Based Content Trust Model for Spam Detection[J].Expert System s with Applications,2010,37(8):5599-5606.

    [11] Wu B,Davison B D.Cloaking and Redirection:A Preliminary Study[C]//Proceedings of the 2nd International Workshop on Adversarial Information Retrieval on the Web.New York,USA:ACM Press,2005:33-40.

    [12] Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,(3):993-1022.

    [13] Hong Liangjie,Davison B D.Empirical Study of Topic Modeling in Twitter[C]//Proceedings of the 1st Workshop on Social Media Analytics.New York,USA:ACM Press,2010:80-88.

    編輯 索書志

    SPam Web Detection Method Based on ToPic and Semantic

    YI Junkai,LIU Mufan,WAN Jing
    (College of Inform ation Science and Technology,Beijing University of Chem ical Technology,Beijing 100029,China)

    Web spam detection can be considered as a bi-classification problem.Currently,content-based spam web detection mainly uses statistic features,however,they are just at a junior level and have several limitations.The topic and semantic based spam Web detection method is presented which uses both semantic features and statistic features,expanding the spam detection to topic-level.The method conducts topic modeling,mappings the content to topic space,and computes and extracts the semantic features based on its topic distribution in topic space,and uses both semantic and statistic features to detect the spam.Experimental results show that the proposed method perform s better in term s of precision,recall and F1values.

    classification;topic model;Latent Dirichlet A llocation(LDA);semantic feature;semantic sim ilarity

    易軍凱,劉慕凡,萬 靜.基于主題與語(yǔ)義的作弊網(wǎng)頁(yè)檢測(cè)方法[J].計(jì)算機(jī)工程,2015,41(9):311-316.

    英文引用格式:Yi Junkai,Liu Mufan,Wan Jing.Spam Web Detection Method Based on Topic and Semantic[J]. Computer Engineering,2015,41(9):311-316.

    1000-3428(2015)09-0311-06

    A

    TP309

    10.3969/j.issn.1000-3428.2015.09.057

    中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)基金資助項(xiàng)目(ZZ1311)。

    易軍凱(1972-),男,教授,主研方向:信息安全,人工智能,語(yǔ)義挖掘;劉慕凡,碩士研究生;萬 靜(通訊作者),講師。

    2014-07-10

    2014-09-19 E-m ail:wanjing@mail.buct.cn

    猜你喜歡
    作弊分類器網(wǎng)頁(yè)
    換裝等
    作弊
    有人要你幫忙作弊怎么辦
    基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
    電子制作(2018年10期)2018-08-04 03:24:38
    BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
    基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
    結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
    網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
    沒作弊
    最近最新中文字幕免费大全7| 777久久人妻少妇嫩草av网站| 亚洲伊人色综图| 老汉色av国产亚洲站长工具| 日产精品乱码卡一卡2卡三| 最近最新中文字幕免费大全7| 免费观看无遮挡的男女| 亚洲三区欧美一区| 国产午夜精品一二区理论片| 永久免费av网站大全| av片东京热男人的天堂| 人妻人人澡人人爽人人| 亚洲国产毛片av蜜桃av| 黄频高清免费视频| 桃花免费在线播放| 99九九在线精品视频| 久久久久久人妻| kizo精华| 国产黄频视频在线观看| 校园人妻丝袜中文字幕| 999久久久国产精品视频| 午夜福利,免费看| 一级,二级,三级黄色视频| 国产男人的电影天堂91| 高清欧美精品videossex| 国产在线一区二区三区精| 国产一区二区激情短视频 | 乱人伦中国视频| 国产一区二区激情短视频 | 免费少妇av软件| 最近中文字幕2019免费版| 精品国产一区二区久久| av电影中文网址| videos熟女内射| 大陆偷拍与自拍| 少妇人妻 视频| 免费观看无遮挡的男女| 精品亚洲成a人片在线观看| 色94色欧美一区二区| 69精品国产乱码久久久| 国产成人a∨麻豆精品| 18禁观看日本| 国产av精品麻豆| 久久久精品国产亚洲av高清涩受| 性色avwww在线观看| 老熟女久久久| 免费观看av网站的网址| 欧美中文综合在线视频| 狂野欧美激情性bbbbbb| 免费看不卡的av| 日韩av不卡免费在线播放| 久久久国产一区二区| 中文乱码字字幕精品一区二区三区| 老女人水多毛片| 亚洲成人av在线免费| 日本wwww免费看| 男男h啪啪无遮挡| 999久久久国产精品视频| 欧美激情极品国产一区二区三区| 99久久中文字幕三级久久日本| 天天躁日日躁夜夜躁夜夜| 高清在线视频一区二区三区| 亚洲欧美一区二区三区黑人 | 国产成人一区二区在线| 欧美bdsm另类| 9191精品国产免费久久| 亚洲精品一区蜜桃| 最近最新中文字幕大全免费视频 | 少妇人妻 视频| 大片免费播放器 马上看| 欧美成人午夜免费资源| 国产福利在线免费观看视频| 中国国产av一级| 国产精品国产三级国产专区5o| 蜜桃在线观看..| 18在线观看网站| 久久热在线av| 国产精品蜜桃在线观看| 国产av码专区亚洲av| 色吧在线观看| 久久久久国产精品人妻一区二区| 国产伦理片在线播放av一区| 亚洲av成人精品一二三区| 久久午夜福利片| 久久精品国产a三级三级三级| 人人妻人人澡人人爽人人夜夜| 精品国产一区二区久久| 亚洲欧美中文字幕日韩二区| 国产又色又爽无遮挡免| 26uuu在线亚洲综合色| 亚洲成人手机| 国产日韩欧美在线精品| 男女啪啪激烈高潮av片| 久久精品久久精品一区二区三区| av在线老鸭窝| 最新的欧美精品一区二区| 国产精品女同一区二区软件| 亚洲图色成人| 亚洲人成77777在线视频| 十分钟在线观看高清视频www| 久久国内精品自在自线图片| av视频免费观看在线观看| 欧美日韩成人在线一区二区| 卡戴珊不雅视频在线播放| 国产深夜福利视频在线观看| 男的添女的下面高潮视频| 男女国产视频网站| 久久精品久久久久久久性| 久久久久国产网址| 一本色道久久久久久精品综合| 国产精品嫩草影院av在线观看| 成年动漫av网址| 麻豆av在线久日| 国产成人av激情在线播放| 国产精品久久久久久久久免| 成人亚洲欧美一区二区av| xxx大片免费视频| 人妻少妇偷人精品九色| 黄色配什么色好看| 最近最新中文字幕免费大全7| 亚洲精品日本国产第一区| 午夜免费男女啪啪视频观看| 最新中文字幕久久久久| 亚洲精品日本国产第一区| 赤兔流量卡办理| 成人黄色视频免费在线看| 黄色毛片三级朝国网站| 国产淫语在线视频| 精品99又大又爽又粗少妇毛片| 国产欧美亚洲国产| av又黄又爽大尺度在线免费看| 水蜜桃什么品种好| 九草在线视频观看| 免费久久久久久久精品成人欧美视频| 欧美 日韩 精品 国产| 亚洲经典国产精华液单| www.精华液| 一区二区三区激情视频| 欧美日韩综合久久久久久| 大码成人一级视频| 成人二区视频| 国产成人精品久久久久久| 国产男女内射视频| 国产精品久久久久久久久免| 亚洲一码二码三码区别大吗| 看免费av毛片| 亚洲三级黄色毛片| av免费观看日本| 久久午夜福利片| 久久精品熟女亚洲av麻豆精品| 91国产中文字幕| 午夜免费鲁丝| 免费少妇av软件| 亚洲精品久久久久久婷婷小说| 亚洲 欧美一区二区三区| 亚洲精品一区蜜桃| 只有这里有精品99| 又黄又粗又硬又大视频| 亚洲成av片中文字幕在线观看 | 亚洲成人一二三区av| 90打野战视频偷拍视频| 中国国产av一级| 久久精品国产亚洲av天美| 亚洲国产精品一区二区三区在线| 校园人妻丝袜中文字幕| 午夜福利视频在线观看免费| 香蕉国产在线看| 咕卡用的链子| 免费在线观看完整版高清| 久久久精品国产亚洲av高清涩受| 韩国av在线不卡| 亚洲中文av在线| 在线观看三级黄色| 亚洲精品国产av蜜桃| 久久人妻熟女aⅴ| 国产高清国产精品国产三级| 久久久a久久爽久久v久久| 视频在线观看一区二区三区| 一区二区三区乱码不卡18| 国产av一区二区精品久久| 99香蕉大伊视频| 免费在线观看视频国产中文字幕亚洲 | 日韩三级伦理在线观看| 日本av手机在线免费观看| 日日啪夜夜爽| 在线观看免费日韩欧美大片| 又黄又粗又硬又大视频| 国产在线免费精品| 国产精品一区二区在线不卡| 一级爰片在线观看| 搡女人真爽免费视频火全软件| 久久久久网色| 亚洲中文av在线| 亚洲内射少妇av| 国产一级毛片在线| 午夜福利网站1000一区二区三区| 热re99久久国产66热| 亚洲国产看品久久| 极品人妻少妇av视频| 黄色视频在线播放观看不卡| 亚洲成人av在线免费| 国产高清国产精品国产三级| 欧美在线黄色| 久久这里只有精品19| 下体分泌物呈黄色| 免费高清在线观看日韩| 成人漫画全彩无遮挡| 国产亚洲av片在线观看秒播厂| 亚洲精品自拍成人| 不卡av一区二区三区| 人妻一区二区av| 亚洲一级一片aⅴ在线观看| 久久人人爽人人片av| 久久久久久久久久人人人人人人| 国产亚洲最大av| www.自偷自拍.com| 如日韩欧美国产精品一区二区三区| 一区二区三区乱码不卡18| 午夜福利,免费看| 亚洲精品乱久久久久久| 伊人久久大香线蕉亚洲五| 天天操日日干夜夜撸| 亚洲 欧美一区二区三区| 国产淫语在线视频| 最近最新中文字幕免费大全7| 国产亚洲一区二区精品| 边亲边吃奶的免费视频| 美国免费a级毛片| 国产伦理片在线播放av一区| 多毛熟女@视频| 亚洲av在线观看美女高潮| 最新的欧美精品一区二区| 天天躁日日躁夜夜躁夜夜| 国产伦理片在线播放av一区| √禁漫天堂资源中文www| www.自偷自拍.com| 男人操女人黄网站| 精品少妇一区二区三区视频日本电影 | 18禁动态无遮挡网站| 亚洲成人av在线免费| av天堂久久9| tube8黄色片| 亚洲天堂av无毛| 丝袜脚勾引网站| 五月开心婷婷网| www.熟女人妻精品国产| 国产xxxxx性猛交| 国产国语露脸激情在线看| 久久精品夜色国产| 精品福利永久在线观看| 一二三四中文在线观看免费高清| 国产毛片在线视频| 亚洲av福利一区| 18禁观看日本| 哪个播放器可以免费观看大片| 人妻少妇偷人精品九色| 叶爱在线成人免费视频播放| 欧美日韩视频高清一区二区三区二| 国产日韩欧美在线精品| 成人国产av品久久久| 欧美97在线视频| 男人操女人黄网站| 激情视频va一区二区三区| 亚洲av日韩在线播放| 午夜日韩欧美国产| 久久久久国产网址| 人人妻人人添人人爽欧美一区卜| 1024香蕉在线观看| www.精华液| 午夜福利视频在线观看免费| 精品一区二区免费观看| 纯流量卡能插随身wifi吗| 亚洲精品日韩在线中文字幕| 曰老女人黄片| 国产成人精品久久二区二区91 | 777久久人妻少妇嫩草av网站| 最近中文字幕2019免费版| 久久精品久久精品一区二区三区| 伦精品一区二区三区| 熟女少妇亚洲综合色aaa.| av在线app专区| av天堂久久9| 午夜福利视频在线观看免费| 欧美日韩一级在线毛片| 妹子高潮喷水视频| 国产精品国产三级专区第一集| 女性被躁到高潮视频| 免费高清在线观看日韩| 99久久综合免费| a级片在线免费高清观看视频| 亚洲国产欧美在线一区| 十八禁高潮呻吟视频| 国产精品一国产av| 国产黄色视频一区二区在线观看| 欧美激情高清一区二区三区 | 自线自在国产av| 如日韩欧美国产精品一区二区三区| 最近2019中文字幕mv第一页| 亚洲av日韩在线播放| 精品卡一卡二卡四卡免费| 亚洲,欧美,日韩| 欧美另类一区| 80岁老熟妇乱子伦牲交| 欧美中文综合在线视频| 日韩电影二区| 精品久久蜜臀av无| 国产成人精品一,二区| 精品一区二区免费观看| 伊人久久国产一区二区| 国产精品无大码| 狂野欧美激情性bbbbbb| 久久久亚洲精品成人影院| 亚洲欧美清纯卡通| 在线天堂最新版资源| 啦啦啦视频在线资源免费观看| 国产毛片在线视频| 欧美日韩视频高清一区二区三区二| 亚洲人成网站在线观看播放| 欧美国产精品一级二级三级| 国产av一区二区精品久久| 中文字幕色久视频| 久久精品国产鲁丝片午夜精品| 久久精品国产自在天天线| 啦啦啦啦在线视频资源| 91午夜精品亚洲一区二区三区| 亚洲精品日本国产第一区| 一级毛片黄色毛片免费观看视频| 丰满少妇做爰视频| 色网站视频免费| 亚洲色图综合在线观看| 国产一区二区激情短视频 | 中文字幕人妻丝袜制服| 久久精品国产综合久久久| 女人久久www免费人成看片| 久久99热这里只频精品6学生| 18禁国产床啪视频网站| 男女高潮啪啪啪动态图| 人妻 亚洲 视频| 日韩av免费高清视频| 免费少妇av软件| 各种免费的搞黄视频| 丝瓜视频免费看黄片| 久久精品久久久久久噜噜老黄| 亚洲成人一二三区av| 久久99蜜桃精品久久| 久久人人爽人人片av| 亚洲精品自拍成人| 日韩中文字幕欧美一区二区 | 永久网站在线| 我要看黄色一级片免费的| 国产av精品麻豆| 精品国产国语对白av| 久久精品人人爽人人爽视色| 王馨瑶露胸无遮挡在线观看| 国产av码专区亚洲av| 性色avwww在线观看| 美女脱内裤让男人舔精品视频| 9191精品国产免费久久| 国产有黄有色有爽视频| 老司机影院成人| 日本-黄色视频高清免费观看| 高清欧美精品videossex| 你懂的网址亚洲精品在线观看| 天天躁日日躁夜夜躁夜夜| 国产av精品麻豆| 一区二区三区乱码不卡18| 叶爱在线成人免费视频播放| 国产精品熟女久久久久浪| 午夜福利在线观看免费完整高清在| 一级毛片我不卡| 熟女电影av网| 亚洲精品日本国产第一区| 久久99一区二区三区| 在现免费观看毛片| a级毛片在线看网站| 九色亚洲精品在线播放| 亚洲精品日韩在线中文字幕| 韩国av在线不卡| av在线观看视频网站免费| 国产乱来视频区| 这个男人来自地球电影免费观看 | 宅男免费午夜| 久久久久久久精品精品| 国产探花极品一区二区| 日日爽夜夜爽网站| 黑丝袜美女国产一区| 精品卡一卡二卡四卡免费| 老司机影院毛片| 欧美日韩国产mv在线观看视频| videosex国产| 我要看黄色一级片免费的| 午夜福利在线观看免费完整高清在| 国产精品熟女久久久久浪| 男女下面插进去视频免费观看| av女优亚洲男人天堂| 久久久久久久久久久久大奶| 亚洲五月色婷婷综合| 一区二区三区精品91| 久久久久久免费高清国产稀缺| 欧美日韩视频精品一区| 狠狠精品人妻久久久久久综合| 99热国产这里只有精品6| 久久精品国产a三级三级三级| 亚洲av男天堂| 欧美精品高潮呻吟av久久| 久久久国产一区二区| 国产av一区二区精品久久| 久久午夜综合久久蜜桃| 不卡视频在线观看欧美| 99久久综合免费| 国产av码专区亚洲av| 日本欧美国产在线视频| 男女边摸边吃奶| 一区二区三区激情视频| 国产极品粉嫩免费观看在线| 老女人水多毛片| 啦啦啦在线观看免费高清www| 美女中出高潮动态图| 97在线视频观看| 亚洲精华国产精华液的使用体验| 亚洲欧洲精品一区二区精品久久久 | 国产无遮挡羞羞视频在线观看| 一区在线观看完整版| 男人舔女人的私密视频| 亚洲成国产人片在线观看| 亚洲国产看品久久| 精品第一国产精品| 国产精品.久久久| 国语对白做爰xxxⅹ性视频网站| av.在线天堂| 欧美日韩精品网址| 香蕉国产在线看| 男人舔女人的私密视频| 成年女人毛片免费观看观看9 | 韩国av在线不卡| 一区在线观看完整版| 国产深夜福利视频在线观看| 亚洲av福利一区| 国产午夜精品一二区理论片| av国产精品久久久久影院| 日韩不卡一区二区三区视频在线| 亚洲少妇的诱惑av| 国产精品三级大全| 亚洲欧美成人精品一区二区| 日日摸夜夜添夜夜爱| 叶爱在线成人免费视频播放| 水蜜桃什么品种好| av免费观看日本| 亚洲少妇的诱惑av| 欧美国产精品一级二级三级| 亚洲国产日韩一区二区| 天天躁日日躁夜夜躁夜夜| 男女下面插进去视频免费观看| 日韩一区二区三区影片| 搡女人真爽免费视频火全软件| 国产一区有黄有色的免费视频| 日本猛色少妇xxxxx猛交久久| 欧美黄色片欧美黄色片| 好男人视频免费观看在线| 亚洲av日韩在线播放| 九草在线视频观看| 人人妻人人添人人爽欧美一区卜| 色网站视频免费| 亚洲一区中文字幕在线| 久久99精品国语久久久| 国产深夜福利视频在线观看| 高清av免费在线| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 精品亚洲成a人片在线观看| 一级片'在线观看视频| 亚洲第一青青草原| 久久韩国三级中文字幕| 亚洲av日韩在线播放| 欧美成人午夜精品| 精品一区二区三区四区五区乱码 | 黄色视频在线播放观看不卡| 一区在线观看完整版| videos熟女内射| 免费av中文字幕在线| 日本黄色日本黄色录像| 国产精品久久久久久av不卡| 天堂中文最新版在线下载| 一级黄片播放器| 免费播放大片免费观看视频在线观看| 男人添女人高潮全过程视频| 黄色怎么调成土黄色| 精品国产露脸久久av麻豆| 下体分泌物呈黄色| 中文字幕人妻熟女乱码| 丝袜喷水一区| 青春草亚洲视频在线观看| 国产免费现黄频在线看| 水蜜桃什么品种好| 99热国产这里只有精品6| 免费少妇av软件| 9色porny在线观看| 国产熟女欧美一区二区| 免费黄色在线免费观看| 亚洲欧洲国产日韩| 日韩一区二区视频免费看| av在线播放精品| 国产成人精品久久久久久| 久久久精品区二区三区| 色吧在线观看| 男女无遮挡免费网站观看| 人人妻人人添人人爽欧美一区卜| 中文字幕另类日韩欧美亚洲嫩草| 在线免费观看不下载黄p国产| 久久精品久久久久久噜噜老黄| 欧美在线黄色| 91在线精品国自产拍蜜月| 免费观看av网站的网址| 另类精品久久| 日韩三级伦理在线观看| 亚洲成av片中文字幕在线观看 | 精品酒店卫生间| 国产在视频线精品| 一级,二级,三级黄色视频| 久久久久久人妻| 国产男女内射视频| av有码第一页| 亚洲欧美一区二区三区国产| 日韩不卡一区二区三区视频在线| 久久这里有精品视频免费| 黄色毛片三级朝国网站| 母亲3免费完整高清在线观看 | 亚洲人成电影观看| 亚洲伊人色综图| 亚洲精品国产色婷婷电影| 亚洲av电影在线进入| 久久精品夜色国产| 亚洲伊人久久精品综合| 国产精品国产av在线观看| 好男人视频免费观看在线| 1024视频免费在线观看| 日日啪夜夜爽| 精品第一国产精品| 黄频高清免费视频| 黄色 视频免费看| 亚洲综合色网址| 久久久久国产网址| 97人妻天天添夜夜摸| 视频区图区小说| 久久精品aⅴ一区二区三区四区 | 在线精品无人区一区二区三| 欧美国产精品va在线观看不卡| 欧美精品一区二区免费开放| 天天影视国产精品| 国产av国产精品国产| 制服丝袜香蕉在线| 女的被弄到高潮叫床怎么办| 一级片'在线观看视频| 大香蕉久久网| 黄色视频在线播放观看不卡| 久久这里只有精品19| 国产不卡av网站在线观看| 9191精品国产免费久久| 一区二区三区精品91| 少妇精品久久久久久久| 免费观看性生交大片5| 成人毛片60女人毛片免费| 女人被躁到高潮嗷嗷叫费观| 大片电影免费在线观看免费| 五月开心婷婷网| 侵犯人妻中文字幕一二三四区| av片东京热男人的天堂| 在线精品无人区一区二区三| 国产老妇伦熟女老妇高清| 欧美人与性动交α欧美精品济南到 | 欧美激情极品国产一区二区三区| 视频区图区小说| 另类亚洲欧美激情| 亚洲欧美一区二区三区久久| 街头女战士在线观看网站| 天天躁狠狠躁夜夜躁狠狠躁| 色视频在线一区二区三区| 国产福利在线免费观看视频| 亚洲美女搞黄在线观看| 国产片内射在线| 欧美激情高清一区二区三区 | 岛国毛片在线播放| 最近的中文字幕免费完整| 桃花免费在线播放| 不卡视频在线观看欧美| 97人妻天天添夜夜摸| 色婷婷av一区二区三区视频| 黄片小视频在线播放| 一本大道久久a久久精品| 美女主播在线视频| 另类亚洲欧美激情| 欧美人与性动交α欧美软件| 美女主播在线视频| 热99久久久久精品小说推荐| 我要看黄色一级片免费的| 欧美bdsm另类| 亚洲精华国产精华液的使用体验| 久久国内精品自在自线图片| 国产极品粉嫩免费观看在线| 熟女av电影| 国产老妇伦熟女老妇高清| 亚洲欧美成人综合另类久久久| a级片在线免费高清观看视频| 色婷婷久久久亚洲欧美| 久久久精品国产亚洲av高清涩受| 国产毛片在线视频| 9热在线视频观看99| 日本wwww免费看| 欧美人与善性xxx| 水蜜桃什么品种好| 国产精品亚洲av一区麻豆 | 亚洲美女视频黄频| 亚洲,欧美精品.| 亚洲精品日本国产第一区| 极品人妻少妇av视频| 久久久久精品人妻al黑|