• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于擴(kuò)展主題特征庫的領(lǐng)域主題爬蟲

    2015-12-23 00:59:14吳岳廷李石君
    計算機(jī)工程與設(shè)計 2015年5期
    關(guān)鍵詞:爬蟲權(quán)值網(wǎng)頁

    吳岳廷,李石君

    (武漢大學(xué) 計算機(jī)學(xué)院,湖北 武漢430072)

    0 引 言

    與傳統(tǒng)的通用爬蟲不同,領(lǐng)域主題爬蟲的目標(biāo)在于抓取與指定主題相關(guān)的網(wǎng)頁集。目前計算網(wǎng)頁與特定主題的相關(guān)性通常采用的是基于靜態(tài)關(guān)鍵詞項的頁面量化與向量空間模型相結(jié)合的方法。然而,這種方法忽略了頁面語義層面與主題領(lǐng)域之間的關(guān)系,片面地通過計算詞頻作為網(wǎng)頁過濾的依據(jù),容易造成爬取的結(jié)果與主題偏離,引入大量的噪音頁面從而降低領(lǐng)域主題爬蟲的抓取效率和實用性[1]。

    為了提高目標(biāo)網(wǎng)頁爬取的準(zhǔn)確度和效率,綜合考慮現(xiàn)有模型和方法的優(yōu)缺點(diǎn),將擴(kuò)展主題特征庫引入網(wǎng)頁相關(guān)度計算過程中,提出一種基于擴(kuò)展主題特征庫的領(lǐng)域主題爬蟲。該爬蟲基于擴(kuò)展主題特征庫定義網(wǎng)絡(luò)空間中的頁面。為了能夠?qū)崟r調(diào)整對主題相關(guān)頁面的捕獲粒度,提高對噪音頁面的識別精度,在網(wǎng)頁抓取過程中動態(tài)地更新主題庫,通過動態(tài)的擴(kuò)展主題項和網(wǎng)頁相關(guān)度計算算法量化頁面的主題相關(guān)度,剔除不相關(guān)或相關(guān)性較弱的網(wǎng)頁,從而彌補(bǔ)了傳統(tǒng)的領(lǐng)域主題爬蟲對網(wǎng)頁語義層次處理的不足。最后通過對新舊方法的實驗結(jié)果進(jìn)行分析與比較,驗證改進(jìn)后的主題爬蟲的優(yōu)勢。

    1 標(biāo)簽塊節(jié)點(diǎn)

    1.1 標(biāo)簽塊節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu)

    在網(wǎng)絡(luò)空間中,網(wǎng)頁是由各種類型的HTML 標(biāo)簽和嵌入在其中的文本內(nèi)容所組成,不同種類的標(biāo)簽放置在網(wǎng)頁的不同區(qū)域體現(xiàn)其對頁面的不同作用[3]。例如突出強(qiáng)調(diào)重要信息,劃分文本塊結(jié)構(gòu)或者裝載子標(biāo)簽形成嵌套復(fù)雜結(jié)構(gòu) (類似容器)等多種功能,而同類型的標(biāo)簽通常在頁面的表現(xiàn)形式中發(fā)揮類似的作用。例如,<strong>、<b>、<h1>、<i>都在頁面中起到對重點(diǎn)內(nèi)容進(jìn)行突出展示的作用,而<p>、<div>、<span>起著類似于文本容器的作用。正因為網(wǎng)頁與HTML標(biāo)簽存在緊密的聯(lián)系,且標(biāo)簽可以根據(jù)其功能劃分成不同的類型集,因此可以將網(wǎng)頁抽象成重要標(biāo)簽塊和標(biāo)簽塊相互之間關(guān)系集的節(jié)點(diǎn)集模型

    根據(jù)Web站點(diǎn)中不同種類的網(wǎng)頁從中抽取出所有代表性的標(biāo)簽,表示成標(biāo)簽塊節(jié)點(diǎn) (tag-block node),所有標(biāo)簽塊節(jié)點(diǎn)及其相互之間的關(guān)系構(gòu)成整體頁面。具體表示如下所示

    式中:TN——頁面中的所有標(biāo)簽塊節(jié)點(diǎn)的集合,Block(m)——由標(biāo)簽塊節(jié)點(diǎn)的詳細(xì)結(jié)構(gòu),m——頁面中標(biāo)簽塊的數(shù)目。BlockId——標(biāo)簽塊節(jié)點(diǎn)編號,是對頁面中特定位置特定類型標(biāo)簽的唯一標(biāo)識,BlockName——標(biāo)簽塊的名稱,BlockDetail——對標(biāo)簽塊的描述信息,BlockContent——標(biāo)簽塊內(nèi)的文本內(nèi)容,BlockType——標(biāo)簽塊節(jié)點(diǎn)類型,由塊內(nèi)標(biāo)簽的功能特點(diǎn)決定。AttributeSet——標(biāo)簽塊的屬性集合,KeyTagSet——節(jié)點(diǎn)中的重要標(biāo)簽集合,weight——標(biāo)簽節(jié)點(diǎn)的權(quán)重,impact——標(biāo)簽塊節(jié)點(diǎn)的影響因子。

    1.2 標(biāo)簽塊節(jié)點(diǎn)的影響因子和權(quán)值

    各標(biāo)簽塊節(jié)點(diǎn)的影響因子 (impact factor)和權(quán)值(weight)不同,在計算其影響因子和權(quán)值之前,首先給出影響因子和權(quán)值的定義。

    定義1 標(biāo)簽塊節(jié)點(diǎn)影響因子標(biāo)簽塊節(jié)點(diǎn)p 的影響因子Block.impact是對節(jié)點(diǎn)p 對頁面主題的語義和結(jié)構(gòu)方面綜合影響力的量值。由塊所含有的標(biāo)簽和其在頁面中的所在的區(qū)域特征等因素所構(gòu)成。

    通常而言,頁面的任意一區(qū)域塊,如果其含有的重要標(biāo)簽數(shù)目越多,則其重要性即影響因子越大;塊中的標(biāo)簽和文本內(nèi)容對塊類型貢獻(xiàn)出的語義特征越顯著,其影響因子相應(yīng)地也越大。根據(jù)這兩點(diǎn),可以將標(biāo)簽塊節(jié)點(diǎn)的影響因子的數(shù)值量化成二者的加權(quán)組合求和。計算方法如式(3)所示

    式中:Block.impact0由塊節(jié)點(diǎn)中含有的重要信息標(biāo)簽的數(shù)量決定,——Block.impact0對應(yīng)的權(quán)值,計算公式如下所示

    式中:keyTagSet——標(biāo)簽塊中含有的所有關(guān)鍵標(biāo)簽集,keyTagSet.size ()——標(biāo)簽塊節(jié)點(diǎn)中關(guān)鍵標(biāo)簽的個數(shù)。Block.impact1根據(jù)經(jīng)驗值設(shè)定,根據(jù)標(biāo)簽塊節(jié)點(diǎn)Block-Type的不同設(shè)置不同的數(shù)值。

    定義2 標(biāo)簽塊節(jié)點(diǎn)權(quán)值標(biāo)簽塊塊節(jié)點(diǎn)權(quán)值指其影響因子在其所在的頁面所有標(biāo)簽塊影響因子數(shù)值總和中的比例。

    塊節(jié)點(diǎn)的影響因子具有可傳遞性。如果某個塊含有關(guān)鍵標(biāo)簽和重要文本信息,即其影響因子較大,則該區(qū)域塊的外層嵌套塊的影響因子也隨之受影響而相應(yīng)較大。類似于這種情形,如果隨著網(wǎng)頁主題的轉(zhuǎn)移某一標(biāo)簽塊的重要性發(fā)生變化,則影響因子會擴(kuò)展到其相鄰的或內(nèi)包含的區(qū)域塊,最終影響塊節(jié)點(diǎn)權(quán)值。mj的權(quán)值計算公式如下所示

    在網(wǎng)頁WP 中統(tǒng)計得出塊mj中關(guān)鍵詞j 的詞項頻率WTfij,即可以計算出詞項j的權(quán)值

    式中:m——網(wǎng)頁中所有的重要詞項總數(shù),NT——WP-m頁面模型中標(biāo)簽塊節(jié)點(diǎn)的總數(shù)。

    2 擴(kuò)展主題特征庫

    傳統(tǒng)爬蟲的主題特征庫是一個靜態(tài)的常量。根據(jù)特定專業(yè)領(lǐng)域的特點(diǎn)由富有經(jīng)驗的領(lǐng)域?qū)<医?,結(jié)合網(wǎng)頁相關(guān)度計算策略來篩選網(wǎng)頁,以決定網(wǎng)頁是否下載到本地文件系統(tǒng)或者數(shù)據(jù)庫中。靜態(tài)的主題特征庫 (static topic feature library,STFL)由于在爬蟲爬取網(wǎng)頁的過程中不能根據(jù)爬取的深度和已處理的站點(diǎn)規(guī)律作出適應(yīng)性變化,所以缺乏靈活性和可變性。而且單純根據(jù)獨(dú)立的關(guān)鍵詞項來篩選網(wǎng)頁還忽略了對頁面語義層次的相關(guān)度考量,易漏掉很多不屬于靜態(tài)主題特征庫但含有很多與特征庫中的關(guān)鍵詞項同義或近義詞的網(wǎng)頁集。

    為了提高主題特征關(guān)鍵詞的區(qū)分能力和移植性,在相對較少的時間內(nèi)搜索少而準(zhǔn)確的網(wǎng)頁集,同時盡可能動態(tài)地在爬取過程中適應(yīng)主題多變性的要求,這就要求與主題相關(guān)的特征項是動態(tài)變化的,且包含體現(xiàn)頁面語義的特征項。具備這樣特點(diǎn)的特征庫稱之為動態(tài)主題特征庫 (dynamic topic feature library,DTFL)。將靜態(tài)和動態(tài)的主題特征庫結(jié)合起來形成了擴(kuò)展主題特征庫 (extended topic feature library,ETFL),如下所示

    2.1 專業(yè)領(lǐng)域主題特征項

    主題特征項通常包括事物主體、時間、地點(diǎn)以及詳情信息等要素。為了精確地描述專業(yè)領(lǐng)域內(nèi)的特定概念和事件,主題特征項應(yīng)該至少包含事物發(fā)生的主體,專業(yè)領(lǐng)域內(nèi)的專用詞匯以及有利情報的判定詞。事物發(fā)生的主體定義了事物涉及的團(tuán)體或機(jī)構(gòu),專用詞匯則限定事物的范圍,具有指向性強(qiáng)和專業(yè)領(lǐng)域分辨度高等特點(diǎn),情報判定詞則在一定程度上定義了信息的有效性和重要性,結(jié)合3種關(guān)鍵詞項可以最基本地描述一個領(lǐng)域主題。以稅務(wù)領(lǐng)域為例,涉稅主體包括國稅機(jī)關(guān),地稅機(jī)關(guān)在內(nèi)的征稅主體和個體工商戶、企業(yè)集團(tuán)在內(nèi)的納稅主體;涉稅專業(yè)詞匯包括印花稅、對物稅等,這類詞大量應(yīng)用于稅務(wù)領(lǐng)域,對辨別稅務(wù)信息非常有效。

    另一方面,由于稅務(wù)信息種類繁多,為了從多而繁雜的涉稅信息中爬取到稅收情報相關(guān)信息,有必要對頁面信息作價值性判定分析。因此需要在主題特征庫中引入體現(xiàn)稅收情報信息特點(diǎn)的判定詞項,這類詞對網(wǎng)頁內(nèi)容是否具備稅務(wù)情報特點(diǎn)具有較強(qiáng)的引導(dǎo)和分辨力,能決定頁面是否具有情報利用價值。涉稅主題特征詞項的示例見表1。

    表1 涉稅信息的主題特征詞項示例

    2.2 網(wǎng)頁主題特征項提取算法

    因為不同位置和類型的標(biāo)簽對網(wǎng)頁主題的貢獻(xiàn)重要性不同。例如同樣是標(biāo)題,網(wǎng)頁標(biāo)題和段落標(biāo)題對網(wǎng)頁主題的貢獻(xiàn)度不同,對超鏈接進(jìn)行描述的錨文本和網(wǎng)頁正文對網(wǎng)頁的重要性也不一樣??梢灾匾圆煌臉?biāo)簽劃分到不同的標(biāo)簽塊節(jié)點(diǎn)中,因為其對所屬主題的區(qū)分貢獻(xiàn)度不同,所以在主題特征項的提取過程中需要對不同的標(biāo)簽進(jìn)行區(qū)別對待。下面是本文提出的網(wǎng)頁主題動態(tài)提取算法的偽代碼:

    2.3 擴(kuò)展主題特征庫生成算法

    基于靜態(tài)主題特征庫進(jìn)行爬取被證實存在諸多缺陷,要改進(jìn)網(wǎng)頁過濾算法首要要對主題特征庫進(jìn)行擴(kuò)展。擴(kuò)展主要采取如下兩種方案。

    一種方案是基于Wikipedia,HowNet等電子資料庫來生成動態(tài)主題特征庫,這種方法通過采用包含同義詞和上下位相關(guān)聯(lián)詞在內(nèi)的同義詞典的方式來擴(kuò)展特征庫[9]。第二種方案是通過在Google、百度等主流的搜索引擎的搜索框中輸入原始的靜態(tài)主題特征項,在搜索引擎返回的搜索結(jié)果中選擇前top L 篇文檔作為預(yù)選頁面,利用2.2所示的網(wǎng)頁主題特征提取算法從上述頁面中抽取擴(kuò)展特征項;

    以第二種方案為例,其執(zhí)行過程是,針對原始主題特征庫中的每一個特征項,在Google等搜索引擎中輸入詞rw,Google基于詞rw 返回一個結(jié)果列表,其中包括一系列與rw 相關(guān)的URL列表,選取前Top L 個URL,下載至本地文件系統(tǒng)中,構(gòu)成與詞項rw 相關(guān)的網(wǎng)頁集WSet。然后對WSet中的網(wǎng)頁進(jìn)行正文抽取,去除正文中的停用詞和主題噪音詞,采用式 (6)所示的加權(quán)的TF*IDF 公式計算出的權(quán)值Wek對結(jié)果進(jìn)行排序,選擇詞頻排在前Top n位的擴(kuò)展詞構(gòu)成詞集 {e1,e2,...,en},作為基于rw 詞項擴(kuò)展的主題特征項集。在經(jīng)過用戶的辨別,篩選和編輯后,加入到擴(kuò)展主題庫特征庫中

    式中:w——詞項,f (ek)——詞w 在頁面中的詞頻,fmax——頁面中所有詞詞頻的最大值。采用兩種方案相結(jié)合的方法生成擴(kuò)展主題特征庫的算法描述如下所示:

    設(shè)Topic表示某一主題的名稱,TD 表示對主題Topic的描述字符串,SE 表示Google、百度等主流搜索引擎集合,OL 表示Hownet、Wikipedia等在線語料庫集合,IW為用戶手動輸入的主題特征項集,EW 表示通過方案一提取出的擴(kuò)展詞項,SW 表示通過方案二提取出的擴(kuò)展詞項,UT 為主題特征項待選集,CT 為經(jīng)過用戶確認(rèn)后的主題特征項集,CT_s為涉稅主體特征項集,CT_t為涉稅專業(yè)特征項集,CT_i為稅務(wù)情報判定特征項集,RS 經(jīng)過用戶確認(rèn)后的種子URL 集。SU 表示主題Topic的種子URL(爬蟲最開始爬取的站點(diǎn))待選集,CU 為經(jīng)過用戶確認(rèn)后的種子URL集合。

    接著定義一些方法來描述主題特征集動態(tài)擴(kuò)展算法中的子過程。

    方法fq(U)表示將網(wǎng)頁下載到本地文件系統(tǒng)中或者將網(wǎng)頁相關(guān)信息存儲到數(shù)據(jù)庫中的過程。

    σ(p)表示從網(wǎng)頁P(yáng) 中下自動抽取出主題特征詞項的過程。

    方法fe(UT)表示用戶對主題特征項的辨別,篩選和編輯后,形成最終主題特征項集的過程。

    方法fc(CT)表示根據(jù)稅務(wù)主題的特點(diǎn)對主題特征項進(jìn)行分類的過程。

    主題特征庫動態(tài)擴(kuò)展的算法描述如下所示:

    3 網(wǎng)頁過濾

    3.1 網(wǎng)頁相關(guān)度計算

    因為不同類型的標(biāo)簽塊節(jié)點(diǎn)對網(wǎng)頁主題的貢獻(xiàn)度不同,所以對各部分進(jìn)行加權(quán)求和,公式如下所示

    式中:Rtitle(wp)——標(biāo)題的主題相關(guān)度,Rcontent(wp)——正文的主題相關(guān)度,Rnavigation(wp)——網(wǎng)頁導(dǎo)航欄的主題相關(guān)度,Ranchor(wp)——網(wǎng)頁內(nèi)錨文本的主題相關(guān)度,Rother(wp)——其它類標(biāo)標(biāo)簽塊節(jié)點(diǎn)的主題相關(guān)度。

    其中,各標(biāo)簽塊節(jié)點(diǎn)主題相關(guān)度的計算方法是采用向量空間模型 (vector space model,VSM)和TF-IDF算法相結(jié)合的方法。使用VSM 將網(wǎng)頁wp表示為各詞項權(quán)重組成的主題特征向量。即wp ={w1,w2,…,wn},其中wt表示詞項t在網(wǎng)頁中的權(quán)重值。

    在擴(kuò)展特征庫中,將領(lǐng)域主體Fb,領(lǐng)域?qū)I(yè)詞Fs,領(lǐng)域情報判定詞Fv表示成主題特征向量

    通過TF-IDF算法對頁面中各詞項的權(quán)重值進(jìn)行計算,計算公式如下所示

    上述公式中的tft為詞項t頁面中出現(xiàn)的頻數(shù),idft為詞項的逆文本頻率。為了避免網(wǎng)頁文本內(nèi)容的篇幅的長短給權(quán)值計算造成的影響,對權(quán)值進(jìn)行歸一化處理,計算方法如式 (13)所示

    式中:fl(t)——特征項t所在的標(biāo)簽塊節(jié)點(diǎn)l 的位置權(quán)值,L——f(t)所在的標(biāo)簽塊總數(shù)。越能體現(xiàn)網(wǎng)頁主題且與其它標(biāo)簽塊的區(qū)分度越高的節(jié)點(diǎn),其fl(t)的值越大,反之則越低。

    fl(t)的計算方法如式 (14)所示

    最后使用余弦相似度計算式 (15)計算網(wǎng)頁P(yáng)j與相應(yīng)主題T 的相關(guān)度

    根據(jù)主題T 的特點(diǎn)設(shè)置相關(guān)度的閾值η,若sim(Pj,T)≥η,則任務(wù)頁面Pj與主題T 相關(guān),爬蟲允許其通過各處理鏈,最終下載到文件系統(tǒng)或數(shù)據(jù)庫中;否則網(wǎng)頁過濾模塊將其丟棄。

    3.2 基于擴(kuò)展主題特征庫的網(wǎng)頁過濾

    令L= {L1,L2,…,Ls}表示經(jīng)過上述算法生成的擴(kuò)展主題特征庫,其中,Li為擴(kuò)展主題特征項,s為主題特征項個數(shù),WP = {wp1,wp2,…,wpt}表示網(wǎng)頁集。

    基于擴(kuò)展主題特征庫的網(wǎng)頁過濾算法的基本思路是:首先對網(wǎng)頁pj進(jìn)行分析,表示成如1.1小節(jié)所示的標(biāo)簽塊節(jié)點(diǎn)集模型,并抽取出重要的詞項構(gòu)成精簡的網(wǎng)頁文本集sj,將sj中與擴(kuò)展項ei具有同義或者上下相關(guān)的詞項替換成主題概念ci,通過使用主題概念代替固定的關(guān)鍵詞,從而使對網(wǎng)頁與主題的相關(guān)性評定轉(zhuǎn)化為語義層次的頁面文本概念集與擴(kuò)展特征庫的相關(guān)度計算。算法描述如下:

    對于網(wǎng)頁集WP 中的每一個網(wǎng)頁WPj,基于擴(kuò)展的主題特征集k形成基于概念的新頁面WPj’,在算法開始執(zhí)行時,WPj’與原始頁面基本相同。

    記擴(kuò)展主題特征庫為E= {E1,E2,…,En},Ei={ei1,ei2,…,ein},其中eij(1≤i≤n,1≤j≤t)表示根據(jù)關(guān)鍵詞ei擴(kuò)展出的同義詞或者上下相關(guān)聯(lián)詞;對每個原始詞ei將Ei的每一項存入template;

    根據(jù)式 (13),可以計算出基于概念的新頁面WP’j的特征向量 (w1,j’,w2,j’,...,wn,j’)。設(shè)定θ為閾值,如果網(wǎng)頁WPj的主題相關(guān)性sim(Pj,T)≥θ,則認(rèn)為頁面為主題相關(guān),應(yīng)該下載。

    4 實驗結(jié)果分析與比較

    為了檢驗本文中提出的領(lǐng)域主題爬蟲在網(wǎng)頁過濾方法上的有效性,選定稅務(wù)領(lǐng)域為示例,將基于擴(kuò)展主題特征庫的涉稅主題爬蟲與基于靜態(tài)關(guān)鍵詞的涉稅主題爬蟲在相同的實驗環(huán)境中進(jìn)行爬取,然后對結(jié)果進(jìn)行分析和比較。

    實驗采用CentOS6.2作為操作系統(tǒng),選用Sybase ASE 15.0.3for Linux作為數(shù)據(jù)庫管理系統(tǒng),開發(fā)集成環(huán)境為InteliJIDEA+jdk-6u10-rc2。

    衡量主題爬蟲網(wǎng)頁過濾策略是否優(yōu)良的一個重要指標(biāo)是頁面抓取精度RR (relevance ratio),頁面抓取精度RR=涉稅主題爬蟲實際抓取的主題相關(guān)網(wǎng)頁數(shù)目relevant_pages/領(lǐng)域主題爬蟲實際抓取的主題相關(guān)網(wǎng)頁數(shù)目/領(lǐng)域主題爬蟲爬取的網(wǎng)頁總數(shù)total_crawled。除此之外,衡量爬取抓取結(jié)果的兩個重要指標(biāo)為準(zhǔn)確率precision和召回率recall,準(zhǔn)確率precision =領(lǐng)域主題爬蟲實際抓取的主題相關(guān)網(wǎng)頁數(shù)目relevant_pages/經(jīng)過爬蟲判定為主題相關(guān)后下載的主題相關(guān)網(wǎng)頁的數(shù)目fetch_pages,召回率recall =領(lǐng)域主題爬蟲實際抓取的主題相關(guān)網(wǎng)頁數(shù)目relevant_pages/網(wǎng)絡(luò)空間中實際存在的與主題相關(guān)的網(wǎng)頁數(shù)目existing_relevant_pages,為了能夠綜合體現(xiàn)準(zhǔn)確率和召回率的指標(biāo)性,引入指標(biāo)F,計算公式如下所示

    實驗結(jié)果如表2和圖1所示。

    由表2的實驗結(jié)果分析得出,相對于傳統(tǒng)的靜態(tài)特征庫,采用擴(kuò)展特征庫的涉稅主題爬蟲準(zhǔn)確率precision 對比傳統(tǒng)主題爬蟲提高了23.74%,召回率recall 提高了24.28%,二者的綜合因素F 對比提高了24.43%,爬取結(jié)果中主題相關(guān)性網(wǎng)頁的比例明顯增大。而從圖1網(wǎng)頁抓取精度和已爬取網(wǎng)頁總數(shù)的動態(tài)變化趨勢圖可以看出,在網(wǎng)頁抓取初期階段,由于初始URL 和根據(jù)鏈接分析得出的URL離主題相關(guān)性資源集中域較近,所以兩種爬蟲中的網(wǎng)頁的抓取精度都比較高而且差距較小,而隨著爬蟲的運(yùn)行,處理的頁面網(wǎng)址偏離主題資源區(qū)域的概率增大,抓取精度下降比較快,且差距增大。觀察可知,隨著爬蟲的運(yùn)行,基于擴(kuò)展主題特征庫的主題爬蟲網(wǎng)抓取精度均比基于靜態(tài)主題庫的高,而且上下浮動比較小,表明爬取精度較為穩(wěn)定;而靜態(tài)主題庫爬蟲的實驗結(jié)果上下浮動比較大,表示判定主題相關(guān)性網(wǎng)頁的穩(wěn)定性不足,易引入主題噪音頁面。

    表2 兩次采集實驗結(jié)果對比

    圖1 靜態(tài)主題庫與動態(tài)主題庫對比

    因此,通過實驗結(jié)果表2和圖1的分析和比較可知,相比于傳統(tǒng)的基于靜態(tài)關(guān)鍵詞項的領(lǐng)域主題爬蟲,基于擴(kuò)展主題庫的主題爬蟲能夠更精準(zhǔn)地對主題相關(guān)性頁面進(jìn)行下載,對主題噪音頁面進(jìn)行過濾,使網(wǎng)頁抓取更加高效和實用。

    5 結(jié)束語

    在領(lǐng)域主題爬蟲中,傳統(tǒng)的方法僅根據(jù)網(wǎng)頁的靜態(tài)主題特征庫來定義主題相關(guān)性網(wǎng)頁,缺乏對隱藏在主題特征項之間語義層次關(guān)系的處理。本文提出一種基于擴(kuò)展主題特征庫的新型領(lǐng)域主題爬蟲。該爬蟲通過標(biāo)簽塊節(jié)點(diǎn)集模型定義頁面,通過在線語料庫和從擴(kuò)展頁面中動態(tài)提取特征項等方式對主題特征項進(jìn)行擴(kuò)充,生成擴(kuò)展主題特征庫,并結(jié)合改進(jìn)的網(wǎng)頁相關(guān)性判定算法對網(wǎng)頁進(jìn)行過濾。這種方法綜合了特征項的詞頻與頁面主題概念兩方面的因素,彌補(bǔ)了傳統(tǒng)方法對網(wǎng)頁語義和概念層次上的缺失。實際測試和項目應(yīng)用結(jié)果表明,引入擴(kuò)展主題特征庫的領(lǐng)域主題爬蟲在網(wǎng)頁抓取中具有較強(qiáng)的定向性和準(zhǔn)確度。下一步將對網(wǎng)頁正文的抽取和主題噪音頁面模式的識別方面進(jìn)行研究,以進(jìn)一步提高爬蟲對目標(biāo)頁面抓取的效率和精確度。

    [1]HUANG Ren,WANG Liangwei.Research on focused crawler based on topic-related concept and page segmentation[J].Applica-tion Research of Computers,2013,30 (8):2377-2380 (in Chinese).[黃仁,王良偉.基于主題相關(guān)概念和網(wǎng)頁分塊的主題爬蟲研究[J].計算機(jī)應(yīng)用研究,2013,30 (8):2377-2380.]

    [2]Ramiz MA.A new sentence similarity measure and sentence based extractive technique for automatic text summarization [J].Expert Systems with Application,2009,36 (4):7764-7772.

    [3]HUANG Chenghui,YIN Jian,HOU Fang.A text similarity measurement combining word semantic information with TFIDF method [J].Chinese Journal of Computers,2011,34(5):856-863 (in Chinese). [黃承慧,印鑒,侯昉.一種結(jié)合語義信息和TF-IDF方法的文本相似度量方法 [J].計算機(jī)學(xué)報,2011,34 (5):856-863.]

    [4]JIN Mingzhu,DING Yuewei.Topic crawler based on dynamic topic knowledge base [J].Journal of Computer Application,2009,29:45-46 (in Chinese).[金明珠,丁岳偉.基于動態(tài)主題庫的主題爬蟲 [J].計算機(jī)應(yīng)用,2009,29:44-46.]

    [5]JU Shiguang,LV Xia,WANG Jing.Temporal link-analyze based on Web page ranking algorithm [J].Application Research of Computers,2009,26 (7):2438-2441(in Chinese). [鞠時光,呂霞,王婧.基于時間鏈接分析的頁面排序優(yōu)化算法 [J].計算機(jī)應(yīng)用與研究,2009,26 (7):2438-2441.]

    [6]WANG Zhihua,WEI Bin,LI Zhanbo,et al.Web information extraction system based on ontology [J].Computer Engineering and Design,2012,33 (7):2634-2639 (in Chinese).[王志華,魏斌,李占波,等.基于本體的Web研究 [J].計算機(jī)工程與設(shè)計,2012,33 (7):2634-2639.]

    [7]JIN Mingzhu,DING Yuewei.Research and implementation for topic crawler using statistic model[J].Computer Engineering and Design,2010,31 (16):3700-3704 (in Chinese).[金明珠,丁岳偉.基于模型統(tǒng)計的主題爬蟲的研究與實現(xiàn) [J].計算工程與設(shè)計,2010,31 (16):3700-3704.]

    [8]GUAN Huifen,SHI Jun.Focused crawler technology based on ontology [J].Computer Simulation,2009,26 (10):123-126 (in Chinese).[關(guān)慧芬,師軍.基于本體的主題爬蟲技術(shù)研究 [J].計算機(jī)仿真,2009,26 (10):123-126.]

    [9]TIAN Xuan,LI Dongmei.Probability estimation for semantic association on domain ontology [J].Computer Engineering and Application,2011,47 (27):136-140 (in Chinese).[田萱,李冬梅.領(lǐng)域本體中概念間語義相關(guān)度的概率估計 [J].計算機(jī)工程與應(yīng)用,2011,47 (27):136-140.]

    [10]DAI Kuan,ZHAO Hui,HAN Dong,et al.Theme feature extraction of Chinese Web page based on vector space model[J].Journal of Jilin University,2014,32 (1):88-93 (in Chinese).[代寬,趙輝,韓東,等.基于向量空間模型的中文網(wǎng)頁主題特征項抽?。跩].吉林大學(xué)學(xué)報,2014,32 (1):88-93.]

    猜你喜歡
    爬蟲權(quán)值網(wǎng)頁
    利用網(wǎng)絡(luò)爬蟲技術(shù)驗證房地產(chǎn)灰犀牛之說
    一種融合時間權(quán)值和用戶行為序列的電影推薦模型
    基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
    CONTENTS
    基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計
    電子制作(2018年10期)2018-08-04 03:24:38
    利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
    電子測試(2018年1期)2018-04-18 11:53:04
    基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
    大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
    電子制作(2017年9期)2017-04-17 03:00:46
    網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
    電子測試(2015年18期)2016-01-14 01:22:58
    久久精品亚洲av国产电影网| 国产一区二区在线av高清观看| 成人特级黄色片久久久久久久| 一级黄色大片毛片| 国产精品久久电影中文字幕| 成年人黄色毛片网站| 成年人免费黄色播放视频| 精品一区二区三区视频在线观看免费 | 中出人妻视频一区二区| 99国产综合亚洲精品| 国产又爽黄色视频| 侵犯人妻中文字幕一二三四区| 咕卡用的链子| svipshipincom国产片| 精品福利永久在线观看| 欧美黑人欧美精品刺激| 亚洲精品国产区一区二| 欧美日韩国产mv在线观看视频| 国产片内射在线| 久99久视频精品免费| 亚洲狠狠婷婷综合久久图片| 女人高潮潮喷娇喘18禁视频| 免费日韩欧美在线观看| 国产精品一区二区免费欧美| 桃色一区二区三区在线观看| 国产精品偷伦视频观看了| 欧美日本中文国产一区发布| 亚洲少妇的诱惑av| 欧美精品亚洲一区二区| 精品高清国产在线一区| 成熟少妇高潮喷水视频| 久久午夜亚洲精品久久| 99国产综合亚洲精品| 欧美黑人精品巨大| 国产欧美日韩一区二区三区在线| 亚洲专区字幕在线| 久久久久精品国产欧美久久久| √禁漫天堂资源中文www| 麻豆av在线久日| 露出奶头的视频| 另类亚洲欧美激情| 欧美日韩亚洲高清精品| 中文字幕av电影在线播放| 国产有黄有色有爽视频| 欧美黑人精品巨大| 亚洲精品一区av在线观看| 欧美精品亚洲一区二区| 一边摸一边抽搐一进一出视频| 一本综合久久免费| 国产aⅴ精品一区二区三区波| 在线观看免费日韩欧美大片| 国产91精品成人一区二区三区| 黑人巨大精品欧美一区二区蜜桃| 欧美日韩精品网址| 国产精品久久久久成人av| 国产日韩一区二区三区精品不卡| www国产在线视频色| 女生性感内裤真人,穿戴方法视频| 国产无遮挡羞羞视频在线观看| 亚洲三区欧美一区| 亚洲午夜理论影院| 亚洲精品av麻豆狂野| 黄色丝袜av网址大全| 亚洲一区高清亚洲精品| 99香蕉大伊视频| 亚洲精品美女久久av网站| 国产欧美日韩精品亚洲av| 国产一区在线观看成人免费| 波多野结衣高清无吗| 老司机靠b影院| 欧美乱色亚洲激情| 精品国内亚洲2022精品成人| 最近最新中文字幕大全电影3 | 夜夜看夜夜爽夜夜摸 | 国产99白浆流出| 老汉色∧v一级毛片| 悠悠久久av| 身体一侧抽搐| 亚洲熟女毛片儿| 国产乱人伦免费视频| 精品高清国产在线一区| 天堂影院成人在线观看| 欧美黄色淫秽网站| 亚洲一卡2卡3卡4卡5卡精品中文| 久久天躁狠狠躁夜夜2o2o| 天堂中文最新版在线下载| 国产精品九九99| 久久精品国产清高在天天线| 波多野结衣av一区二区av| ponron亚洲| 亚洲 欧美 日韩 在线 免费| 高清欧美精品videossex| 国产精品野战在线观看 | www.自偷自拍.com| 亚洲一区二区三区色噜噜 | 午夜两性在线视频| 成人永久免费在线观看视频| 亚洲欧洲精品一区二区精品久久久| 精品国产一区二区久久| 亚洲人成电影观看| 18美女黄网站色大片免费观看| av在线天堂中文字幕 | 日本a在线网址| 亚洲av电影在线进入| 老汉色av国产亚洲站长工具| 岛国视频午夜一区免费看| 91成人精品电影| 亚洲av成人不卡在线观看播放网| 女同久久另类99精品国产91| 久久香蕉国产精品| 亚洲精品在线观看二区| 欧美日韩黄片免| 侵犯人妻中文字幕一二三四区| 久热爱精品视频在线9| 亚洲一区中文字幕在线| 中文字幕精品免费在线观看视频| 精品卡一卡二卡四卡免费| 麻豆一二三区av精品| 久久国产亚洲av麻豆专区| 淫妇啪啪啪对白视频| 99精品在免费线老司机午夜| 精品国内亚洲2022精品成人| 91老司机精品| 91大片在线观看| 国产高清国产精品国产三级| 婷婷丁香在线五月| 亚洲人成伊人成综合网2020| 无人区码免费观看不卡| 免费在线观看黄色视频的| 国产亚洲欧美98| 一区在线观看完整版| 久久精品91无色码中文字幕| 老鸭窝网址在线观看| 日本a在线网址| 久久久久久久久久久久大奶| 日韩人妻精品一区2区三区| 夜夜爽天天搞| 午夜免费激情av| 超色免费av| 这个男人来自地球电影免费观看| av网站免费在线观看视频| 久久99一区二区三区| 91av网站免费观看| 精品一品国产午夜福利视频| 一进一出好大好爽视频| 亚洲视频免费观看视频| 欧美黑人精品巨大| www.999成人在线观看| 淫秽高清视频在线观看| 免费观看人在逋| 亚洲av熟女| 99riav亚洲国产免费| 18禁黄网站禁片午夜丰满| 国产单亲对白刺激| 国产精品一区二区免费欧美| 淫妇啪啪啪对白视频| av电影中文网址| 777久久人妻少妇嫩草av网站| 国产一区二区三区视频了| 亚洲专区中文字幕在线| 精品少妇一区二区三区视频日本电影| 欧美日韩国产mv在线观看视频| 亚洲一区二区三区不卡视频| 欧美不卡视频在线免费观看 | 亚洲 欧美一区二区三区| 搡老熟女国产l中国老女人| 国产乱人伦免费视频| 999精品在线视频| 欧美av亚洲av综合av国产av| 亚洲片人在线观看| 亚洲av成人av| 亚洲七黄色美女视频| 这个男人来自地球电影免费观看| 国产精品偷伦视频观看了| 日韩有码中文字幕| 中出人妻视频一区二区| 最新美女视频免费是黄的| 在线观看免费高清a一片| 欧美激情久久久久久爽电影 | 女性被躁到高潮视频| 亚洲欧美激情在线| 亚洲国产欧美日韩在线播放| 久久欧美精品欧美久久欧美| 国产精品香港三级国产av潘金莲| 欧美激情 高清一区二区三区| 免费高清在线观看日韩| 午夜福利在线观看吧| 在线观看日韩欧美| 久99久视频精品免费| 色综合欧美亚洲国产小说| 丰满人妻熟妇乱又伦精品不卡| 国产1区2区3区精品| 高清欧美精品videossex| 亚洲精品成人av观看孕妇| 久久久久久人人人人人| av天堂在线播放| 成人三级黄色视频| 国产av一区二区精品久久| 国产精品免费一区二区三区在线| www.999成人在线观看| 99国产综合亚洲精品| 性色av乱码一区二区三区2| 麻豆av在线久日| 欧美日韩一级在线毛片| 日本vs欧美在线观看视频| 精品熟女少妇八av免费久了| 日韩有码中文字幕| 欧美中文日本在线观看视频| 伦理电影免费视频| 窝窝影院91人妻| 午夜91福利影院| 不卡av一区二区三区| 一级黄色大片毛片| 亚洲全国av大片| 欧美黑人精品巨大| 精品久久久久久久毛片微露脸| 精品乱码久久久久久99久播| 亚洲狠狠婷婷综合久久图片| 日韩av在线大香蕉| 99riav亚洲国产免费| 久久精品亚洲av国产电影网| 日韩有码中文字幕| 狂野欧美激情性xxxx| 国产精品永久免费网站| 可以在线观看毛片的网站| 欧美人与性动交α欧美软件| 欧美日韩瑟瑟在线播放| 国产亚洲av高清不卡| 精品电影一区二区在线| 91成人精品电影| 在线永久观看黄色视频| 老汉色av国产亚洲站长工具| 亚洲人成77777在线视频| 国产精品久久久久久人妻精品电影| 热99re8久久精品国产| 日本撒尿小便嘘嘘汇集6| www.精华液| 看免费av毛片| 国产精品乱码一区二三区的特点 | 成年版毛片免费区| 亚洲精品在线观看二区| 久久中文字幕一级| 久99久视频精品免费| 国产高清国产精品国产三级| 咕卡用的链子| 国产无遮挡羞羞视频在线观看| 亚洲熟妇中文字幕五十中出 | 成人18禁高潮啪啪吃奶动态图| 亚洲自偷自拍图片 自拍| 好男人电影高清在线观看| 国产91精品成人一区二区三区| 国产一区二区三区在线臀色熟女 | 午夜91福利影院| 亚洲三区欧美一区| 男人舔女人下体高潮全视频| 91精品三级在线观看| 亚洲七黄色美女视频| bbb黄色大片| 亚洲精品av麻豆狂野| 色哟哟哟哟哟哟| 国产免费av片在线观看野外av| 日韩欧美免费精品| 成人手机av| 精品国产一区二区久久| 国产成人免费无遮挡视频| 久久人人爽av亚洲精品天堂| 精品久久久精品久久久| 国产成人欧美| 巨乳人妻的诱惑在线观看| www.999成人在线观看| 久久久久国内视频| 老司机午夜福利在线观看视频| 免费一级毛片在线播放高清视频 | 欧美最黄视频在线播放免费 | 亚洲av成人不卡在线观看播放网| 国产一区二区激情短视频| 最近最新中文字幕大全免费视频| 美女 人体艺术 gogo| 黄色a级毛片大全视频| 又黄又粗又硬又大视频| 波多野结衣高清无吗| 成人免费观看视频高清| 日韩人妻精品一区2区三区| 午夜精品久久久久久毛片777| 亚洲欧洲精品一区二区精品久久久| 精品高清国产在线一区| 三上悠亚av全集在线观看| 中文字幕人妻丝袜一区二区| 1024视频免费在线观看| 亚洲人成电影免费在线| 精品一区二区三区av网在线观看| 亚洲av五月六月丁香网| 欧美在线黄色| 俄罗斯特黄特色一大片| 久久午夜亚洲精品久久| 高清在线国产一区| 一本综合久久免费| 18禁观看日本| 国产av在哪里看| 精品乱码久久久久久99久播| 久久亚洲真实| 国产97色在线日韩免费| 丁香六月欧美| 亚洲国产欧美日韩在线播放| 巨乳人妻的诱惑在线观看| 国产精品爽爽va在线观看网站 | 高清在线国产一区| 搡老熟女国产l中国老女人| 身体一侧抽搐| 色综合站精品国产| 99热国产这里只有精品6| 国产人伦9x9x在线观看| 9热在线视频观看99| 亚洲专区中文字幕在线| 五月开心婷婷网| 一区在线观看完整版| 一级片'在线观看视频| 色综合婷婷激情| 欧美国产精品va在线观看不卡| 男人舔女人的私密视频| 免费av毛片视频| 午夜免费激情av| 精品日产1卡2卡| 欧美精品啪啪一区二区三区| 亚洲 国产 在线| 一二三四社区在线视频社区8| 日韩大码丰满熟妇| 色尼玛亚洲综合影院| 欧美 亚洲 国产 日韩一| 色哟哟哟哟哟哟| 国产精品一区二区三区四区久久 | 色婷婷av一区二区三区视频| 美女福利国产在线| 亚洲av成人不卡在线观看播放网| 长腿黑丝高跟| 成人黄色视频免费在线看| 午夜免费鲁丝| 亚洲欧美激情在线| 精品乱码久久久久久99久播| tocl精华| 一级毛片女人18水好多| 妹子高潮喷水视频| 一区二区日韩欧美中文字幕| 一级,二级,三级黄色视频| 夜夜夜夜夜久久久久| 一边摸一边抽搐一进一出视频| 欧美老熟妇乱子伦牲交| 久久天躁狠狠躁夜夜2o2o| 美女扒开内裤让男人捅视频| 高清欧美精品videossex| 亚洲成人免费av在线播放| 精品国产乱码久久久久久男人| 夜夜夜夜夜久久久久| 又黄又粗又硬又大视频| 日本 av在线| 欧美成人性av电影在线观看| 国产成人啪精品午夜网站| 九色亚洲精品在线播放| 两个人免费观看高清视频| 久久天躁狠狠躁夜夜2o2o| 国产aⅴ精品一区二区三区波| 999久久久精品免费观看国产| 欧美黑人精品巨大| 国产精品久久视频播放| 黄片播放在线免费| 欧美一区二区精品小视频在线| 午夜免费观看网址| 国产黄色免费在线视频| 天堂影院成人在线观看| 亚洲精品中文字幕在线视频| 免费高清视频大片| 日本wwww免费看| 中文字幕av电影在线播放| 亚洲国产欧美日韩在线播放| 嫩草影院精品99| 久久久久久亚洲精品国产蜜桃av| 亚洲一区中文字幕在线| 久久亚洲精品不卡| 一区二区三区精品91| 亚洲色图综合在线观看| av中文乱码字幕在线| 亚洲av熟女| 国产精品 欧美亚洲| 侵犯人妻中文字幕一二三四区| 亚洲激情在线av| 欧美乱妇无乱码| 男男h啪啪无遮挡| 久热爱精品视频在线9| 亚洲,欧美精品.| 99精品久久久久人妻精品| 香蕉久久夜色| 精品人妻在线不人妻| 亚洲人成电影观看| 天堂影院成人在线观看| 天天躁夜夜躁狠狠躁躁| 久久人妻福利社区极品人妻图片| 婷婷丁香在线五月| a级毛片黄视频| 1024香蕉在线观看| 精品熟女少妇八av免费久了| 在线观看免费高清a一片| 婷婷精品国产亚洲av在线| 久久人妻熟女aⅴ| 校园春色视频在线观看| 一级黄色大片毛片| 久久中文看片网| 久9热在线精品视频| 热re99久久国产66热| 精品久久久久久,| 亚洲精品中文字幕一二三四区| 国产97色在线日韩免费| 色老头精品视频在线观看| 丰满的人妻完整版| 两性夫妻黄色片| 91九色精品人成在线观看| 日本 av在线| 男人操女人黄网站| 国产熟女xx| 在线永久观看黄色视频| 桃红色精品国产亚洲av| 丝袜美足系列| av欧美777| 国产精品偷伦视频观看了| 国产亚洲精品综合一区在线观看 | 每晚都被弄得嗷嗷叫到高潮| 久久精品人人爽人人爽视色| 久久久久国产一级毛片高清牌| 成年版毛片免费区| www.999成人在线观看| 首页视频小说图片口味搜索| 黑人巨大精品欧美一区二区mp4| 国产精品爽爽va在线观看网站 | 看片在线看免费视频| 国产亚洲精品第一综合不卡| 午夜福利在线观看吧| 99精品在免费线老司机午夜| 欧美+亚洲+日韩+国产| 久久99一区二区三区| 国产精品一区二区免费欧美| 亚洲美女黄片视频| 久久天躁狠狠躁夜夜2o2o| 在线观看免费高清a一片| 亚洲激情在线av| 性欧美人与动物交配| 日本免费一区二区三区高清不卡 | 色综合站精品国产| 国产成人欧美在线观看| 久久久久久免费高清国产稀缺| 亚洲av熟女| 9191精品国产免费久久| 波多野结衣av一区二区av| 久久午夜亚洲精品久久| 搡老熟女国产l中国老女人| 久久青草综合色| 中文字幕另类日韩欧美亚洲嫩草| 亚洲人成电影免费在线| 超碰成人久久| 免费在线观看完整版高清| 在线观看免费午夜福利视频| 亚洲一区中文字幕在线| 久久精品影院6| 人妻久久中文字幕网| 超碰97精品在线观看| 亚洲aⅴ乱码一区二区在线播放 | www日本在线高清视频| 久久中文字幕人妻熟女| 91精品国产国语对白视频| 欧美日本中文国产一区发布| 国产人伦9x9x在线观看| 欧美日本亚洲视频在线播放| 国产精品成人在线| 水蜜桃什么品种好| 中文字幕另类日韩欧美亚洲嫩草| 脱女人内裤的视频| 久久欧美精品欧美久久欧美| a级毛片在线看网站| 色综合婷婷激情| 亚洲激情在线av| 午夜老司机福利片| 曰老女人黄片| 国产精品一区二区三区四区久久 | 久久青草综合色| 精品国产美女av久久久久小说| 中文字幕色久视频| 国产欧美日韩一区二区三区在线| 久久久久久久精品吃奶| 免费观看精品视频网站| 国产xxxxx性猛交| 一区在线观看完整版| 欧美不卡视频在线免费观看 | 国产精品一区二区三区四区久久 | 亚洲中文日韩欧美视频| 一进一出好大好爽视频| 十分钟在线观看高清视频www| 一二三四在线观看免费中文在| 淫秽高清视频在线观看| 最新美女视频免费是黄的| 91成人精品电影| 免费看a级黄色片| 麻豆av在线久日| 日韩免费高清中文字幕av| www.999成人在线观看| 校园春色视频在线观看| 亚洲av成人不卡在线观看播放网| 亚洲国产欧美一区二区综合| 男男h啪啪无遮挡| 国产精品一区二区三区四区久久 | 无限看片的www在线观看| 天堂√8在线中文| 国产精品 欧美亚洲| 亚洲成人免费av在线播放| 国产熟女午夜一区二区三区| 欧美不卡视频在线免费观看 | 亚洲熟妇熟女久久| 夫妻午夜视频| 色在线成人网| 黄色片一级片一级黄色片| 亚洲精品在线美女| 欧美日韩乱码在线| 久久国产亚洲av麻豆专区| av在线播放免费不卡| 国产成人影院久久av| 国产亚洲精品综合一区在线观看 | 国产精品免费视频内射| 国产精品自产拍在线观看55亚洲| 91老司机精品| avwww免费| 久久久国产成人精品二区 | 久久精品91无色码中文字幕| 国产成+人综合+亚洲专区| 亚洲中文av在线| 精品一区二区三区av网在线观看| 男人舔女人下体高潮全视频| e午夜精品久久久久久久| 日韩免费av在线播放| 99riav亚洲国产免费| 午夜激情av网站| 最近最新免费中文字幕在线| 岛国在线观看网站| 天天添夜夜摸| 99国产精品99久久久久| www.999成人在线观看| 中文字幕最新亚洲高清| 久久狼人影院| 成人亚洲精品av一区二区 | 成人手机av| 一边摸一边做爽爽视频免费| 老鸭窝网址在线观看| 国产精品久久久久成人av| 少妇裸体淫交视频免费看高清 | 后天国语完整版免费观看| 777久久人妻少妇嫩草av网站| 国产伦人伦偷精品视频| 热re99久久国产66热| 国产一区二区三区综合在线观看| 色尼玛亚洲综合影院| 日韩精品免费视频一区二区三区| 老司机福利观看| 新久久久久国产一级毛片| 桃色一区二区三区在线观看| 国产深夜福利视频在线观看| 精品熟女少妇八av免费久了| 亚洲精品中文字幕在线视频| 中文欧美无线码| 黄色成人免费大全| 最近最新免费中文字幕在线| 欧美不卡视频在线免费观看 | 国产有黄有色有爽视频| 亚洲一区二区三区不卡视频| 露出奶头的视频| 久久国产亚洲av麻豆专区| 99在线人妻在线中文字幕| 精品国产乱子伦一区二区三区| 美女高潮喷水抽搐中文字幕| 人人澡人人妻人| 天堂动漫精品| svipshipincom国产片| 男女做爰动态图高潮gif福利片 | 免费观看人在逋| 一本大道久久a久久精品| 欧美日韩乱码在线| 99国产精品一区二区三区| 午夜亚洲福利在线播放| 一本大道久久a久久精品| 91av网站免费观看| 午夜福利影视在线免费观看| 黑丝袜美女国产一区| 色综合婷婷激情| 露出奶头的视频| 99久久99久久久精品蜜桃| 亚洲狠狠婷婷综合久久图片| 香蕉久久夜色| 满18在线观看网站| 老熟妇乱子伦视频在线观看| 最近最新免费中文字幕在线| 777久久人妻少妇嫩草av网站| 久久精品91无色码中文字幕| 女同久久另类99精品国产91| 在线观看免费日韩欧美大片| 日本黄色视频三级网站网址| 欧美成狂野欧美在线观看| 亚洲 欧美 日韩 在线 免费| 亚洲一区二区三区欧美精品| 国产亚洲av高清不卡| 成人黄色视频免费在线看| 亚洲伊人色综图| 欧美另类亚洲清纯唯美| 一区福利在线观看| 精品第一国产精品| 日韩三级视频一区二区三区| 中文字幕av电影在线播放| 成人亚洲精品一区在线观看| 亚洲专区字幕在线| 亚洲精华国产精华精| 成人特级黄色片久久久久久久|