• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于統(tǒng)計(jì)學(xué)的Web論壇增量更新策略研究

    2017-07-10 10:27:27
    關(guān)鍵詞:爬蟲(chóng)增量網(wǎng)頁(yè)

    馮 凱 陳 軍 王 鵑 王 勇

    1(武漢大學(xué)國(guó)家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)2(武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)3(武漢大學(xué)空天信息安全與可信計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室 湖北 武漢 430072)

    基于統(tǒng)計(jì)學(xué)的Web論壇增量更新策略研究

    馮 凱1,2*陳 軍1,2王 鵑2,3王 勇2,3

    1(武漢大學(xué)國(guó)家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)2(武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)3(武漢大學(xué)空天信息安全與可信計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室 湖北 武漢 430072)

    傳統(tǒng)預(yù)測(cè)網(wǎng)頁(yè)變化的模型將一種規(guī)律應(yīng)用到所有網(wǎng)頁(yè)之上,沒(méi)有考慮各頁(yè)面之間的區(qū)別,針對(duì)網(wǎng)絡(luò)論壇索引頁(yè)面提出了一種基于統(tǒng)計(jì)學(xué)規(guī)律的增量更新策略模型。通過(guò)相關(guān)論壇版塊的索引頁(yè)面進(jìn)行數(shù)據(jù)的采集,觀察并證明其變化大致呈現(xiàn)以日為周期的規(guī)律性變化,一日之內(nèi)的變化曲線(xiàn)與人們的生活規(guī)律相吻合。然后采用最小二乘法多項(xiàng)式曲線(xiàn)擬合對(duì)其進(jìn)行數(shù)學(xué)建模,得到合適的數(shù)學(xué)模型,并將其應(yīng)用在索引頁(yè)面的增量更新之上,從而可以準(zhǔn)確預(yù)測(cè)索引頁(yè)面下一次更新的時(shí)間間隔。實(shí)驗(yàn)結(jié)果表明,該模型在10%誤差范圍內(nèi),預(yù)測(cè)的準(zhǔn)確率為93.9%。

    增量更新 網(wǎng)頁(yè)變化 統(tǒng)計(jì)學(xué) 數(shù)學(xué)建模

    0 引 言

    網(wǎng)絡(luò)爬蟲(chóng)是用來(lái)從互聯(lián)網(wǎng)上收集網(wǎng)頁(yè)的程序,一般用于搜索引擎上?;ヂ?lián)網(wǎng)上網(wǎng)頁(yè)千變?nèi)f化,更新速度快,所以網(wǎng)絡(luò)爬蟲(chóng)需要獲取到最新的頁(yè)面來(lái)替換舊的頁(yè)面, 更新本地存儲(chǔ)。傳統(tǒng)的方法是周期性訪(fǎng)問(wèn)網(wǎng)頁(yè)實(shí)現(xiàn)更新,其需要重新下載所有已經(jīng)下載的網(wǎng)頁(yè),而不管該頁(yè)面是否真的發(fā)生變化。該方法不僅浪費(fèi)爬蟲(chóng)系統(tǒng)資源,還會(huì)影響網(wǎng)絡(luò)帶寬,也會(huì)耗費(fèi)一定的時(shí)間。由此,產(chǎn)生了對(duì)爬蟲(chóng)系統(tǒng)增量更新策略的研究[1]。爬蟲(chóng)系統(tǒng)增量更新主要是指只更新真正發(fā)生改變的頁(yè)面,而未改變的頁(yè)面不做處理。毫無(wú)疑問(wèn),該方法大大節(jié)約了系統(tǒng)資源和網(wǎng)絡(luò)資源,提高了爬蟲(chóng)效率。該方法的難點(diǎn)就在于爬蟲(chóng)系統(tǒng)本身如何去判斷一個(gè)頁(yè)面是否發(fā)生了變化或者其變化程度為多少。

    當(dāng)前的研究主要有兩種方法:一是通過(guò)實(shí)驗(yàn)手段對(duì)Web中的數(shù)據(jù)進(jìn)行采樣,研究樣本的變化規(guī)律,從而估計(jì)整個(gè)Web的變化規(guī)律[1];二是事先從理論上建立數(shù)學(xué)模型,并用實(shí)驗(yàn)對(duì)模型進(jìn)行驗(yàn)證,得出模型參數(shù),最后利用模型對(duì)頁(yè)面變化進(jìn)行預(yù)測(cè)[9]。他們的研究適用于一般性的網(wǎng)站,并且將得到的網(wǎng)頁(yè)更新頻繁度應(yīng)用到對(duì)應(yīng)網(wǎng)頁(yè)的任何時(shí)刻。但是我們相信不同的爬蟲(chóng)策略應(yīng)該適用于不同特點(diǎn)和類(lèi)型的網(wǎng)站,同一網(wǎng)頁(yè)在不同時(shí)刻的更新頻繁度也應(yīng)該不同。本文的工作重點(diǎn)在于對(duì)網(wǎng)絡(luò)論壇增量更新策略的研究。

    作為UCC(User-Created Content)的典型代表,網(wǎng)絡(luò)論壇在搜索引擎、數(shù)據(jù)挖掘等領(lǐng)域具有越來(lái)越重要的作用。沈文勤等[14]利用HTTP的head請(qǐng)求獲取頁(yè)面的元信息,從而避免了整個(gè)文件的傳輸。孟慶浩等[15]提出利用網(wǎng)頁(yè)的Hash摘要來(lái)判斷網(wǎng)頁(yè)是否發(fā)生了變化。代鵬等[16]提出使用Simhash算法和漢明距離計(jì)算出網(wǎng)頁(yè)相似度,根據(jù)網(wǎng)頁(yè)相似度計(jì)算出網(wǎng)頁(yè)采集周期。Cai等[17]提出了一種基于學(xué)習(xí)的論壇采集方法,通過(guò)離線(xiàn)分析論壇的總體結(jié)構(gòu)特點(diǎn),重建網(wǎng)站的站點(diǎn)地圖,過(guò)濾無(wú)效鏈接,獲得有效鏈接。蔡欣寶等[18]在其基礎(chǔ)上,通過(guò)泊松模型對(duì)網(wǎng)頁(yè)更新頻繁度進(jìn)行估計(jì),實(shí)現(xiàn)論壇增量采集。李莎莎等[19]提出了一種改進(jìn)的泊松模型,基于更新頻率計(jì)算窗口、內(nèi)容分析和網(wǎng)頁(yè)隸屬分析來(lái)預(yù)測(cè)更新時(shí)間。張皓等[20]提出基于去噪Hash的增量式網(wǎng)絡(luò)爬蟲(chóng),該算法針對(duì)經(jīng)典的Hash算法對(duì)文本產(chǎn)生的Hash值過(guò)于敏感的問(wèn)題提出了解決方法,并將其應(yīng)用在Heritrix上[21]。

    Kleinberg等[22]提出將網(wǎng)站頁(yè)面分為索引頁(yè)面和信息頁(yè)面,同時(shí)Meng等[8]提出sina網(wǎng)大約0.05%的網(wǎng)頁(yè)鏈接到其他20%的網(wǎng)頁(yè),20%的網(wǎng)頁(yè)鏈接到其他50%的網(wǎng)頁(yè),50%的網(wǎng)頁(yè)鏈接到其他90%的網(wǎng)頁(yè),所以通過(guò)對(duì)索引頁(yè)面的觀察可以掌握整個(gè)論壇網(wǎng)頁(yè)的變化,如果只對(duì)索引頁(yè)面進(jìn)行增量監(jiān)測(cè),判斷是否有新的鏈接,將新鏈接指向的內(nèi)容下載下來(lái),并不需要對(duì)所有頁(yè)面進(jìn)行對(duì)比。本文結(jié)合人們對(duì)網(wǎng)絡(luò)論壇訪(fǎng)問(wèn)的統(tǒng)計(jì)學(xué)規(guī)律,利用人們生活作息本身的規(guī)律性,將當(dāng)前主要的兩種研究方法相結(jié)合,通過(guò)對(duì)論壇索引頁(yè)面的采樣和觀察,發(fā)現(xiàn)其變化的規(guī)律性和周期性,然后采用合適的數(shù)學(xué)模型去描述該規(guī)律性和周期性,最后用該數(shù)學(xué)模型去預(yù)測(cè)索引頁(yè)面下一次變化的時(shí)間,并與其他增量更新策略進(jìn)行比較。實(shí)驗(yàn)結(jié)果證明,該模型可以有效預(yù)測(cè)網(wǎng)絡(luò)論壇索引頁(yè)面更新的時(shí)間,在10%誤差范圍內(nèi),可以獲得93.9%的預(yù)測(cè)準(zhǔn)確率。

    1 相關(guān)定義

    現(xiàn)有網(wǎng)絡(luò)論壇的總體結(jié)構(gòu)一般由多個(gè)版塊組成,每個(gè)版塊中又包含多個(gè)主題鏈接。所以,論壇中Web頁(yè)面根據(jù)其功能大致可以分為兩類(lèi):信息頁(yè)面和索引頁(yè)面[22]。前者主要用于展示基本信息內(nèi)容,多為陳述信息的普通文本。后者則主要用于信息瀏覽的導(dǎo)航和組織,其內(nèi)容主要是鏈接到信息頁(yè)面的超鏈接,超鏈接的變化意味著信息頁(yè)面也發(fā)生了變化,所以通過(guò)對(duì)索引頁(yè)面的觀察可以掌握整個(gè)論壇網(wǎng)頁(yè)的變化。索引頁(yè)面是本文的研究對(duì)象,參照文獻(xiàn)[8],針對(duì)該種頁(yè)面我們有如下定義:

    定義1 網(wǎng)絡(luò)論壇索引頁(yè)面

    網(wǎng)絡(luò)論壇中包含多個(gè)信息頁(yè)面鏈接、起信息頁(yè)面目錄作用、變化頻繁的網(wǎng)頁(yè),我們稱(chēng)之為索引頁(yè)面(如沒(méi)特殊說(shuō)明,文中的索引頁(yè)面均指網(wǎng)絡(luò)論壇中的索引頁(yè)面)。

    定義2 索引頁(yè)面的有效鏈接數(shù)

    索引頁(yè)面是信息頁(yè)面鏈接的合集,但是其中一般也包含指向論壇網(wǎng)站其他位置的鏈接,即噪音鏈接[23],于是我們將索引頁(yè)面中除去噪音鏈接后的信息頁(yè)面鏈接的數(shù)量稱(chēng)為其有效鏈接數(shù)。

    那么我們?nèi)绾潍@取一個(gè)索引頁(yè)面的有效鏈接數(shù)?假設(shè)我們的爬蟲(chóng)系統(tǒng)在時(shí)刻t1獲取索引頁(yè)面a,得到其中全部鏈接的集合為s1;接著爬蟲(chóng)系統(tǒng)在時(shí)刻t2再次獲取a,同樣得到其中的全部鏈接的集合為s2。當(dāng)T=t2-t1大于某一值時(shí),索引頁(yè)面a的有效鏈接即為:

    s={l|l∈s2,l?s1}

    (1)

    其中,s中鏈接的個(gè)數(shù)即為索引頁(yè)面中有效連接的數(shù)量。從物理含義上解釋?zhuān)诮?jīng)過(guò)時(shí)間T后,索引頁(yè)面a中信息頁(yè)面鏈接全部被新產(chǎn)生的信息頁(yè)面鏈接所替換。T的大小與論壇的活躍度相關(guān),一般活躍度越高,T越小,反之亦然。

    定義3 索引頁(yè)面有效鏈接變化數(shù)

    對(duì)于索引頁(yè)面a,爬蟲(chóng)系統(tǒng)在時(shí)刻t1得到其全部鏈接集合s1,在時(shí)刻t2得到其全部鏈接集合s2,那么在時(shí)間間隔T=t2-t1內(nèi),集合s={l|l∈s2,l?s1}中鏈接個(gè)數(shù)n即為索引頁(yè)面a在時(shí)刻t2有效鏈接變化數(shù)。其表示的物理含義是頁(yè)面a在時(shí)間間隔T內(nèi)產(chǎn)生了n條新的信息頁(yè)面鏈接。

    定義4 索引頁(yè)面有效鏈接變化頻率

    定義5 索引頁(yè)面變化率

    索引頁(yè)面a在時(shí)間間隔T=t2-t1內(nèi)的有效鏈接變化數(shù)和索引頁(yè)面的有效鏈接數(shù)的比值稱(chēng)為a在時(shí)間間隔T內(nèi)的變化率。其表示的物理含義是索引頁(yè)面a在時(shí)間間隔T內(nèi)的變化程度。

    2 策略模型

    本節(jié)將對(duì)索引頁(yè)面的變化規(guī)律作出合理性的假設(shè),并在此假設(shè)的基礎(chǔ)上對(duì)相關(guān)的數(shù)據(jù)進(jìn)行采樣和后處理,然后采用合適的數(shù)學(xué)模型去描述這種變化規(guī)律,最后將說(shuō)明新建立的模型如何進(jìn)行應(yīng)用在索引頁(yè)面的增量更新上。

    2.1 變化規(guī)律假設(shè)

    網(wǎng)絡(luò)論壇的使用主體是人,人都有一定的生活作息規(guī)律,如晚上睡覺(jué)、白天上班等。所以,人們生活的規(guī)律性使得人們對(duì)論壇的訪(fǎng)問(wèn)也具有一定的規(guī)律性,進(jìn)而使得網(wǎng)絡(luò)論壇本身的更新頻率也具有一定的規(guī)律性,如睡覺(jué)時(shí)間段3:00-6:00更新頻率較小,上午9:00-11:00更新頻率較大等。從而我們知道索引頁(yè)面變化頻率不是一成不變的,而是在一日之內(nèi)隨著時(shí)間的推移而發(fā)生變化,并且其變化周期為一天(我們將在3.1節(jié)中對(duì)其進(jìn)行驗(yàn)證)。

    基于這樣的規(guī)律假設(shè),我們就可以確定索引頁(yè)面的更新時(shí)間間隔不是固定的,而是動(dòng)態(tài)變化的。

    2.2 數(shù)據(jù)采樣與后處理

    我們對(duì)不同天的同一時(shí)間的采樣數(shù)據(jù)取平均值(即S中每一列取平均值):

    (3)

    得到數(shù)據(jù)集合{(ti,ai),1≤i≤n}。同時(shí):

    (4)

    其中,ri表示ti時(shí)刻索引頁(yè)面有效鏈接變化頻率,進(jìn)而可以得到我們的數(shù)據(jù)集:

    Φ={(t1,r1),(t2,r2),…,(tn,rn)}

    (5)

    基于2.1節(jié)的假設(shè),索引網(wǎng)頁(yè)中有效鏈接變化頻率呈現(xiàn)以日為周期的變化,此為典型的線(xiàn)性變化模型,于是我們采用最小二乘法多項(xiàng)式曲線(xiàn)擬合的方法對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行處理,得到我們的數(shù)學(xué)模型。

    2.3 最小二乘法多項(xiàng)式曲線(xiàn)擬合

    根據(jù)給定的n個(gè)點(diǎn),并不要求所求的多項(xiàng)式曲線(xiàn)精確地經(jīng)過(guò)這些點(diǎn),而是求一條近似曲線(xiàn)y=f(t)得近似曲線(xiàn)y=f(t)定的實(shí)際點(diǎn)之間的偏差最小,這就是線(xiàn)性模型中的曲線(xiàn)擬合[24]。

    對(duì)于2.2節(jié)中的等式對(duì)應(yīng)的數(shù)據(jù)集,擬合曲線(xiàn)y=f(t)的偏差平方和l為:

    (6)

    按照偏差平方和最小的準(zhǔn)則,即求得y=f(t)使得l最小。

    設(shè)擬合曲線(xiàn)滿(mǎn)足下列多項(xiàng)式:

    y=f(t)=a0+a1×t+…+ak×tk

    (7)

    那么:

    (8)

    等式為a0,a1,…,ak的多元函數(shù),由此將問(wèn)題轉(zhuǎn)化為求l=l(a0,a1,…,ak)的極值問(wèn)題。由多元函數(shù)求極值的必要條件,得:

    (9)

    (10)

    進(jìn)一步化簡(jiǎn)得到:

    (11)

    即X×A=Y,從而可以得到系數(shù)矩陣A,也得到了擬合曲線(xiàn),進(jìn)而得到了我們的數(shù)學(xué)模型。

    2.4 模型應(yīng)用

    由2.3節(jié)中式(6)-式(11),我們得到了擬合曲線(xiàn)y=f(t),其表示的物理含義為索引頁(yè)面有效鏈接變化頻率隨時(shí)間t的變化。那么索引頁(yè)面在任意時(shí)間段內(nèi)的有效鏈接變化數(shù)可以通過(guò)求曲線(xiàn)y=f(t)的積分來(lái)實(shí)現(xiàn)。

    圖1表示的是曲線(xiàn)y=f(t),橫軸為時(shí)間,縱軸表示的是索引頁(yè)面有效鏈接變化頻率。那么時(shí)刻a和時(shí)刻b間隔內(nèi)有效鏈接變化數(shù)n可以表示為:

    (12)

    當(dāng)索引頁(yè)面變化率達(dá)到z時(shí),我們認(rèn)為該索引頁(yè)面應(yīng)該進(jìn)行更新。令索引頁(yè)面有效鏈接的數(shù)量為v,我們?cè)跁r(shí)刻a對(duì)索引頁(yè)面進(jìn)行了更新,下一次更新的時(shí)刻b應(yīng)該滿(mǎn)足如下公式:

    (13)

    從而可以計(jì)算出下一次索引頁(yè)面最合適的更新時(shí)刻b。

    圖1 模型應(yīng)用說(shuō)明

    3 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析

    本節(jié)將對(duì)2.1節(jié)中的規(guī)律性假設(shè)進(jìn)行實(shí)驗(yàn)驗(yàn)證,對(duì)該模型進(jìn)行測(cè)試,并與現(xiàn)有的更新策略進(jìn)行比較。

    所有實(shí)驗(yàn)均在Ubuntu14.04機(jī)器上進(jìn)行,機(jī)器配置:4 GB內(nèi)存,Intel Core i7-3612QM處理器,100 MPbs網(wǎng)卡,實(shí)驗(yàn)均采用python2.7編碼實(shí)現(xiàn)。

    3.1 規(guī)律性驗(yàn)證

    我們選取表 1中的四大論壇相關(guān)板塊作為我們的實(shí)驗(yàn)對(duì)象,獲取版塊索引頁(yè)面的有效鏈接變化數(shù),并將其轉(zhuǎn)化為有效鏈接變化頻率(單位時(shí)間內(nèi)鏈接變化數(shù))??紤]到不同版塊固有的訪(fǎng)問(wèn)量不同,對(duì)應(yīng)的更新頻率也會(huì)有所區(qū)別,所以我們對(duì)不同版塊的采樣周期也會(huì)有所不同。實(shí)驗(yàn)環(huán)境下,該采樣周期通過(guò)觀察相關(guān)版塊日更新總數(shù)進(jìn)行確定。

    表1 實(shí)驗(yàn)使用的網(wǎng)絡(luò)論壇及采樣周期

    我們對(duì)上述四個(gè)板塊進(jìn)行30天的數(shù)據(jù)采樣,并繪制樣本數(shù)據(jù)平均值和方差隨樣本容量的變化曲線(xiàn)。圖 2和圖 3分別表示的是樣本平均值和方差的變化曲線(xiàn)。圖 2橫軸表示樣本容量,縱軸表示有效鏈接變化頻率的平均值,從中可以看出,不同論壇版塊對(duì)應(yīng)的鏈接變化頻率的平均值不同,但是隨著樣本容量的增加,總體平均值趨向穩(wěn)定。同時(shí),圖 3說(shuō)明隨著樣本容量的增加,樣本總體方差趨向于穩(wěn)定。所以,我們可以認(rèn)為樣本對(duì)應(yīng)時(shí)間序列是穩(wěn)定的。

    圖2 樣本總體平均值隨樣本數(shù)量變化曲線(xiàn)圖

    同時(shí),我們對(duì)樣本進(jìn)行FFT變換[25],將其從時(shí)域變換到頻域,并繪制出圖4所示的頻譜圖。圖4橫軸表示的頻率成分,縱軸表示的是幅值,對(duì)其進(jìn)行主頻率成分分析,得到最大幅值對(duì)應(yīng)的頻率,得到表2的結(jié)果。從表2中可以看出,四個(gè)論壇對(duì)應(yīng)的變化周期均約為24小時(shí)。

    圖3 樣本總體方差隨樣本數(shù)量變化曲線(xiàn)圖

    圖4 樣本頻譜圖

    通過(guò)實(shí)驗(yàn)我們可知,不同論壇相關(guān)的索引頁(yè)面更新頻率不一樣,但更新頻率的變化大致以日為周期,具有周期性,從而可以通過(guò)合適的數(shù)學(xué)模型來(lái)描述這種周期性的變化,為以后的變化趨勢(shì)做出更好地預(yù)測(cè)。

    表2 論壇對(duì)應(yīng)幅值頻率及周期

    3.2 模型測(cè)試及對(duì)比

    從3.1節(jié)中我們得到了采集數(shù)據(jù),根據(jù)2.2節(jié)中公式-對(duì)數(shù)據(jù)進(jìn)行處理,求得平均值,得到如公式所示的采樣數(shù)據(jù)集合,對(duì)該集合通過(guò)最小二乘法進(jìn)行多項(xiàng)式曲線(xiàn)擬合,得到預(yù)測(cè)模型。我們將以論壇2為例進(jìn)行闡述。

    圖5顯示的是論壇2中公式對(duì)應(yīng)的數(shù)據(jù)集、擬合曲線(xiàn)和平均變化頻率。從該圖中可以看出,從23點(diǎn)開(kāi)始,索引頁(yè)面鏈接變化頻率開(kāi)始下降,6:00-11:00為變化頻率上升階段,18:00左右會(huì)有小幅度的下降,17:00-22:00會(huì)有小幅度的上升,這與一般人們的日常生活規(guī)律相符。

    為了對(duì)該模型進(jìn)行測(cè)試,我們定義公式中的索引網(wǎng)頁(yè)變化率z為50%[1],其物理含義是當(dāng)索引網(wǎng)頁(yè)有效鏈接變化數(shù)達(dá)到其全部有效鏈接數(shù)的一半時(shí),我們認(rèn)為該索引網(wǎng)頁(yè)應(yīng)該得到更新,爬蟲(chóng)系統(tǒng)應(yīng)該去重新獲取該網(wǎng)頁(yè)。從而我們可以不斷利用預(yù)測(cè)模型并結(jié)合公式來(lái)預(yù)測(cè)下一次合理的更新時(shí)間。同時(shí)我們選取下面兩種方案作為對(duì)比:

    ? 常規(guī)的周期性更新策略,更新周期和采樣周期相同,論壇2更新周期為10 min;

    ? 基于學(xué)習(xí)的周期性更新策略[26],即不考慮一天之內(nèi)更新頻率隨時(shí)間的變化,得到總的平均有效鏈接變化率,從而確定采樣周期。

    對(duì)上述三種方案進(jìn)行為期10天的測(cè)試,得到每次更新索引頁(yè)面實(shí)際的變化率,并與期望的變化率z(50%)進(jìn)行比較。

    圖5 索引頁(yè)面鏈接變化數(shù)學(xué)模型

    圖6-圖8表示的是測(cè)試結(jié)果,橫軸均表示時(shí)間(HH:MM),縱軸均表示索引頁(yè)面實(shí)際變化率(期望值為50%)。從圖 6和圖 7中可以看出,與期望的變化率50%相比,常規(guī)周期性更新策略和基于學(xué)習(xí)的周期性更新策略在00:00-09:00的誤差較大,09:00-24:00誤差率減少,并且后者的誤差率小于前者。圖 8為作者提出的數(shù)學(xué)模型對(duì)應(yīng)的實(shí)驗(yàn)結(jié)果,從中可以看出00:00-09:00更新次數(shù)明顯減少,這即與人們的生活規(guī)律相吻合,同時(shí)說(shuō)明模型的正確性:索引網(wǎng)頁(yè)變化頻率降低時(shí),爬蟲(chóng)系統(tǒng)增量更新的次數(shù)也應(yīng)該降低;此外,索引頁(yè)面的實(shí)際變化率大部分都位于期望值50%的附近。表 3是對(duì)圖 6-圖 8的統(tǒng)計(jì)結(jié)果。從表中可以看出,策略③相比策略①,平均每天的更新次數(shù)減少了27.0%,預(yù)測(cè)的準(zhǔn)確性在A、B、C范圍內(nèi)分別提高了26.0%、65.3%、57.7%,總體而言,預(yù)測(cè)的準(zhǔn)確性大幅提升。策略③相比策略②,平均每天的更新次數(shù)增加了26.4%,但是預(yù)測(cè)的準(zhǔn)確性在A、B、C范圍內(nèi)分別提高了18.6%、57.5%、50.7%??傮w而言,策略③通過(guò)犧牲一定的更新次數(shù),在10%誤差范圍內(nèi),可以獲得93.9%的預(yù)測(cè)準(zhǔn)確率,從而為網(wǎng)絡(luò)爬蟲(chóng)的增量更新確定合適的時(shí)間間隔。

    圖6 常規(guī)周期性更新策略實(shí)驗(yàn)結(jié)果

    圖7 基于學(xué)習(xí)的周期性更新策略實(shí)驗(yàn)結(jié)果

    圖8 基于數(shù)學(xué)模型預(yù)測(cè)的更新策略實(shí)驗(yàn)結(jié)果

    表3 不同更新策略實(shí)驗(yàn)結(jié)果比較

    4 結(jié) 語(yǔ)

    本文針對(duì)網(wǎng)絡(luò)論壇索引頁(yè)面提出了一種基于統(tǒng)計(jì)學(xué)規(guī)律的增量更新策略模型。通過(guò)對(duì)4大論壇相關(guān)版塊的索引頁(yè)面進(jìn)行數(shù)據(jù)的采集,觀察并證明其變化大致呈現(xiàn)以日為周期的規(guī)律性變化,一日之內(nèi)的變化曲線(xiàn)與人們的生活規(guī)律相吻合。然后采用最小二乘法多項(xiàng)式曲線(xiàn)擬合對(duì)其進(jìn)行數(shù)學(xué)建模,得到合適的數(shù)學(xué)模型,并將其應(yīng)用在索引頁(yè)面的增量更新之上,從而可以準(zhǔn)確預(yù)測(cè)索引頁(yè)面下一次更新的時(shí)間間隔。實(shí)驗(yàn)結(jié)果表明,在10%誤差范圍內(nèi),預(yù)測(cè)的準(zhǔn)確率為93.9%。相比現(xiàn)有的方法,增加了約26%的更新次數(shù),預(yù)測(cè)的準(zhǔn)確率提高了57.5%。因?yàn)椴煌搲鎵K訪(fǎng)問(wèn)量不同,導(dǎo)致其更新頻率不同,所以不同論壇版塊對(duì)應(yīng)的日變化曲線(xiàn)不相同,并且該模型需要對(duì)數(shù)據(jù)進(jìn)行較長(zhǎng)時(shí)間的采樣,從而限制了該模型在實(shí)際場(chǎng)景中的應(yīng)用。

    [1] Junghoo, GarciaMolina, Hector. The Evolution of the Web and Implications for an Incremental Crawler[C]// International Conference on Very Large Data Bases. Morgan Kaufmann Publishers Inc. 2000:200-209.

    [2] Douglis F, Feldmann A, Krishnamurthy B, et al. Rate of Change and other Metrics: a Live Study of the World Wide Web[C]//USENIX Symposium on Internet Technologies and Systems. 1997, 119.

    [3] Fetterly D, Manasse M, Najork M, et al. A large-scale study of the evolution of web pages[C]//Proceedings of the 12th international conference on World Wide Web. ACM, 2003: 669-678.

    [4] Fetterly D, Manasse M, Najork M. On the evolution of clusters of near-duplicate web pages[J]. Journal of Web Engineering, 2003, 2(4): 228-246.

    [5] Brewington B E, Cybenko G. How dynamic is the Web?[J]. Computer Networks, 2000, 33(1): 257-276.

    [6] Brewington B E, Cybenko G. Keeping up with the changing web[J]. Computer, 2000 (5): 52-58.

    [7] Francisco-Revilla L, Shipman III F M, Furuta R, et al. Perception of content, structure, and presentation changes in Web-based hypertext[C]//Proceedings of the 12th ACM conference on Hypertext and Hypermedia. ACM, 2001: 205-214.

    [8] Meng T, Yan H, Wang J, et al. The evolution of link-attributes for pages and its implications on web crawling[C]//Proceedings of the 2004 IEEE/WIC/ACM International Conference on Web Intelligence. IEEE Computer Society, 2004: 578-581.

    [9] Cho J, Garcia-Molina H. Synchronizing a database to improve freshness[J]. ACM Sigmod Record. ACM, 2000, 29(2): 117-128.

    [10] Cho J, Ntoulas A. Effective change detection using sampling[C]//Proceedings of the 28th international conference on Very Large Data Bases. VLDB Endowment, 2002: 514-525.

    [11] Ntoulas A, Cho J, Olston C. What's new on the web?: the evolution of the web from a search engine perspective[C]//Proceedings of the 13th international conference on World Wide Web. ACM, 2004: 1-12.

    [12] Ipeirotis P G, Ntoulas A, Cho J, et al. Modeling and managing content changes in text databases[C]//Data Engineering, 2005. ICDE 2005. Proceedings. 21st International Conference on. IEEE, 2005: 606-617.

    [13] Cho J, Garcia-Molina H. Estimating frequency of change[J]. ACM Transactions on Internet Technology (TOIT), 2003, 3(3): 256-290.

    [14] 沈文勤,李慶超,邵志清. 搜索引擎的漸增式爬行和備份式更新模式[J]. 華東理工大學(xué)學(xué)報(bào), 2004,30( 3): 284-287.

    [15] 孟慶浩. 互聯(lián)網(wǎng)數(shù)據(jù)增量采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 北京: 北京郵件大學(xué), 2015.

    [16] 代鵬. 基于Nutch的增量網(wǎng)頁(yè)信息采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 軟件, 2015, 36(11) : 100-104.

    [17] Cai R, Yang J M, Lai W, et al. iRobot: An intelligent crawler for Web forums[C]//Proceedings of the 17th international conference on World Wide Web. ACM, 2008: 447-456.

    [18] 蔡欣寶,郭若飛,趙朋朋, 等. Web 論壇數(shù)據(jù)源增量爬蟲(chóng)的研究[J]. 計(jì)算機(jī)工程, 2010, 36(9): 285-287.

    [19] 李莎莎. 增量式 Web 信息采集與信息提取系統(tǒng)的研究與實(shí)現(xiàn)[D]. 武漢: 武漢理工大學(xué), 2011.

    [20] 張皓,周學(xué)廣. 基于網(wǎng)頁(yè)去噪 Hash 的增量式網(wǎng)絡(luò)爬蟲(chóng)研究[J]. 艦船電子工程, 2014, 34(2): 86-90.

    [21] 張皓, 周學(xué)廣. 基于 Heritrix 的增量式網(wǎng)絡(luò)爬蟲(chóng)研究[J]. 軟件導(dǎo)刊, 2013, 12(11): 135-137.

    [22] Kleinberg J M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM (JACM), 1999, 46(5): 604-632.

    [23] Guo Y, Li K, Zhang K, et al. Board forum crawling: a Web crawling method for Web forum[C]//Proceedings of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence. IEEE Computer Society, 2006: 745-748.

    [24] 李航等.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.

    [25] Lyons R G. Understanding digital signal processing[M]. Pearson Education, 2010.

    [26] 徐文杰, 陳慶奎. 增量更新并行 Web 爬蟲(chóng)系統(tǒng)[J]. 計(jì)算機(jī)應(yīng)用, 2009, 29(4): 1117-1119.

    RESEARCH ON INCREMENTAL UPDATING STRATEGY OF WEB FORUM BASED ON STATISTICS

    Feng Kai1, 2*Chen Jun1,2Wang Juan2,3Wang Yong2,3

    1(NationalEngineeringResearchCenterforMultimediaSoftware,WuhanUniversity,Wuhan430072,Hubei,China)2(CollegeofComputer,WuhanUniversity,Wuhan430072,Hubei,China)3(KeyLaboratoryofAerospaceInformationSecurityandTrustedComputingMinistryofEducation,WuhanUniversity,Wuhan430072,Hubei,China)

    The traditional model of forecasting page changes applies a rule to all pages, without regard to the differences between pages. In this paper, we propose an incremental updating strategy model based on statistical rules for indexing web pages. Through the data collection and observation of the index page of the relevant forum, it is found that the index page shows a regular change in the daily cycle, and the curve of variation within a day coincides with the law of people’s life. The mathematical model is established by using the least square polynomial curve fitting, and it is applied to incremental updating of the index page, which can predict the time interval of the next updating of the index page. The experimental results show that the accuracy of the model is 93.9% within the 10% error range.

    Incremental updating Page changes Statistics Mathematic modeling

    2016-05-09。國(guó)家自然科學(xué)基金項(xiàng)目(61402342)。馮凱,碩士生,主研領(lǐng)域:模式識(shí)別與智能系統(tǒng)。陳軍,教授。王鵑,副教授。王勇,碩士生。

    TP3

    A

    10.3969/j.issn.1000-386x.2017.06.007

    猜你喜歡
    爬蟲(chóng)增量網(wǎng)頁(yè)
    利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說(shuō)
    提質(zhì)和增量之間的“辯證”
    基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
    “價(jià)增量減”型應(yīng)用題點(diǎn)撥
    基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
    電子制作(2018年10期)2018-08-04 03:24:38
    利用爬蟲(chóng)技術(shù)的Geo-Gnutel la VANET流量采集
    基于URL和網(wǎng)頁(yè)類(lèi)型的網(wǎng)頁(yè)信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
    電子制作(2017年9期)2017-04-17 03:00:46
    基于均衡增量近鄰查詢(xún)的位置隱私保護(hù)方法
    網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
    日本一本二区三区精品| 麻豆国产av国片精品| 欧美性猛交╳xxx乱大交人| 精品久久久久久久久亚洲 | 国产探花在线观看一区二区| 一进一出抽搐动态| 免费大片18禁| 亚洲精品成人久久久久久| h日本视频在线播放| 亚洲在线自拍视频| 亚洲一区高清亚洲精品| 国产精品久久视频播放| 精品午夜福利在线看| 神马国产精品三级电影在线观看| 黄色日韩在线| 免费一级毛片在线播放高清视频| 亚洲欧美激情综合另类| 嫩草影院入口| 久久精品人妻少妇| 在线观看舔阴道视频| 亚洲国产精品久久男人天堂| 熟女人妻精品中文字幕| а√天堂www在线а√下载| 亚洲综合色惰| av福利片在线观看| www.熟女人妻精品国产| 久久九九热精品免费| 人人妻人人澡欧美一区二区| 高潮久久久久久久久久久不卡| 亚洲精华国产精华精| 国产av不卡久久| 成人三级黄色视频| 免费在线观看影片大全网站| 成人永久免费在线观看视频| 国产av一区在线观看免费| 简卡轻食公司| 欧美黑人巨大hd| 亚洲国产欧美人成| 国产不卡一卡二| 一进一出抽搐gif免费好疼| 国产亚洲精品综合一区在线观看| 国产精品久久电影中文字幕| 一进一出抽搐动态| 91久久精品国产一区二区成人| 他把我摸到了高潮在线观看| 日本五十路高清| 国产视频一区二区在线看| 国产伦精品一区二区三区四那| 欧美另类亚洲清纯唯美| 久99久视频精品免费| 亚洲欧美日韩卡通动漫| av在线天堂中文字幕| 国产一区二区亚洲精品在线观看| a级毛片a级免费在线| 国产精品自产拍在线观看55亚洲| 久久久久久大精品| 国产一区二区三区在线臀色熟女| 一级毛片久久久久久久久女| 色吧在线观看| 免费看a级黄色片| 九九在线视频观看精品| 久久久久久久久久成人| 看十八女毛片水多多多| 国产色婷婷99| 亚洲一区高清亚洲精品| 成年人黄色毛片网站| 舔av片在线| 亚洲av.av天堂| 国产真实伦视频高清在线观看 | 好看av亚洲va欧美ⅴa在| 又黄又爽又刺激的免费视频.| 国产日本99.免费观看| 亚洲五月婷婷丁香| 国产精品久久久久久人妻精品电影| 波多野结衣高清作品| 搡女人真爽免费视频火全软件 | 亚洲自偷自拍三级| 美女大奶头视频| 成人毛片a级毛片在线播放| 免费av不卡在线播放| 免费看光身美女| 国产白丝娇喘喷水9色精品| 国产精品一区二区三区四区免费观看 | 搡老熟女国产l中国老女人| 99热这里只有是精品50| 乱码一卡2卡4卡精品| 久久伊人香网站| 夜夜夜夜夜久久久久| 亚洲人成电影免费在线| 青草久久国产| 午夜免费激情av| 欧美在线一区亚洲| 亚洲av第一区精品v没综合| 成年女人永久免费观看视频| 欧美黑人欧美精品刺激| 黄色女人牲交| 一区福利在线观看| 五月伊人婷婷丁香| 精品久久久久久,| 婷婷精品国产亚洲av在线| 精品一区二区三区视频在线观看免费| 婷婷精品国产亚洲av| 国产探花极品一区二区| 看黄色毛片网站| 亚洲欧美精品综合久久99| 欧美成人a在线观看| 国产精品精品国产色婷婷| 3wmmmm亚洲av在线观看| 精品不卡国产一区二区三区| 黄色一级大片看看| 伊人久久精品亚洲午夜| 中文字幕av在线有码专区| 人妻丰满熟妇av一区二区三区| 亚洲第一电影网av| 91麻豆av在线| 国产成人啪精品午夜网站| 麻豆av噜噜一区二区三区| 三级毛片av免费| 午夜精品久久久久久毛片777| 给我免费播放毛片高清在线观看| 日本 欧美在线| 老鸭窝网址在线观看| 国产黄色小视频在线观看| 国内毛片毛片毛片毛片毛片| 听说在线观看完整版免费高清| 国产亚洲欧美在线一区二区| 国产精品日韩av在线免费观看| 欧美日韩中文字幕国产精品一区二区三区| 亚洲18禁久久av| 亚洲国产欧洲综合997久久,| 欧美黑人欧美精品刺激| 日韩欧美三级三区| 国产成年人精品一区二区| 深夜精品福利| 88av欧美| 宅男免费午夜| 五月玫瑰六月丁香| 国产精品一区二区三区四区久久| 精品乱码久久久久久99久播| 国产私拍福利视频在线观看| 色吧在线观看| 精品乱码久久久久久99久播| 国产主播在线观看一区二区| 男女下面进入的视频免费午夜| 丁香欧美五月| 3wmmmm亚洲av在线观看| 一a级毛片在线观看| eeuss影院久久| 午夜a级毛片| 精品一区二区免费观看| a级毛片免费高清观看在线播放| 一边摸一边抽搐一进一小说| 最新在线观看一区二区三区| 天堂网av新在线| 内射极品少妇av片p| 两个人的视频大全免费| 亚洲片人在线观看| 国产av不卡久久| 色综合站精品国产| 五月玫瑰六月丁香| 九色成人免费人妻av| 露出奶头的视频| 十八禁人妻一区二区| 免费搜索国产男女视频| 最近中文字幕高清免费大全6 | 亚洲国产高清在线一区二区三| 国产视频一区二区在线看| 成年女人看的毛片在线观看| 999久久久精品免费观看国产| 91久久精品电影网| 欧美又色又爽又黄视频| 日韩成人在线观看一区二区三区| 99国产极品粉嫩在线观看| 自拍偷自拍亚洲精品老妇| 亚洲成人精品中文字幕电影| 少妇丰满av| 99久久精品热视频| 国产精品,欧美在线| 亚洲18禁久久av| 国产亚洲欧美在线一区二区| 欧美性感艳星| 欧美激情在线99| 日韩欧美精品免费久久 | 国产黄片美女视频| 午夜两性在线视频| 午夜福利高清视频| 免费看a级黄色片| 亚洲片人在线观看| 在线免费观看的www视频| 色哟哟·www| 制服丝袜大香蕉在线| 日本a在线网址| 在线观看午夜福利视频| 亚洲成av人片免费观看| 国产成人aa在线观看| 国内精品久久久久久久电影| 国产中年淑女户外野战色| 国产精品亚洲av一区麻豆| 亚洲久久久久久中文字幕| 国产在视频线在精品| 精品国内亚洲2022精品成人| 国产精品不卡视频一区二区 | 国产一区二区亚洲精品在线观看| 极品教师在线免费播放| 国产毛片a区久久久久| 又黄又爽又免费观看的视频| 欧美日韩综合久久久久久 | 精品久久久久久成人av| 国产综合懂色| 中文字幕av在线有码专区| 欧美精品啪啪一区二区三区| .国产精品久久| 亚洲成人久久性| 午夜福利18| 他把我摸到了高潮在线观看| 我要看日韩黄色一级片| 一级作爱视频免费观看| 高潮久久久久久久久久久不卡| 亚洲国产高清在线一区二区三| 亚洲综合色惰| 午夜福利在线观看吧| 欧美极品一区二区三区四区| 日韩国内少妇激情av| 亚洲美女黄片视频| 色综合站精品国产| 可以在线观看的亚洲视频| 午夜久久久久精精品| 又黄又爽又免费观看的视频| 国产精品久久久久久亚洲av鲁大| 欧美黑人欧美精品刺激| 国内毛片毛片毛片毛片毛片| 久久久久国内视频| 99热这里只有是精品在线观看 | 丰满的人妻完整版| 精品乱码久久久久久99久播| 色综合站精品国产| 一区二区三区四区激情视频 | 毛片一级片免费看久久久久 | 国产成年人精品一区二区| 淫秽高清视频在线观看| 久久6这里有精品| 精品一区二区三区视频在线| 国产精品亚洲av一区麻豆| 老女人水多毛片| 搡老熟女国产l中国老女人| 一级黄色大片毛片| 国产乱人视频| 九九久久精品国产亚洲av麻豆| 久久久久久国产a免费观看| 欧美在线一区亚洲| 久99久视频精品免费| 婷婷丁香在线五月| 高潮久久久久久久久久久不卡| 久久精品国产亚洲av涩爱 | 成年版毛片免费区| 日本免费一区二区三区高清不卡| 久久精品国产自在天天线| 有码 亚洲区| 18美女黄网站色大片免费观看| 给我免费播放毛片高清在线观看| 女人被狂操c到高潮| 国产高清三级在线| 一个人看视频在线观看www免费| 国产精品亚洲一级av第二区| 午夜福利在线在线| 国产私拍福利视频在线观看| 亚洲av一区综合| 麻豆国产av国片精品| 一卡2卡三卡四卡精品乱码亚洲| 脱女人内裤的视频| 757午夜福利合集在线观看| 人妻夜夜爽99麻豆av| 搡老岳熟女国产| 久久精品综合一区二区三区| 97热精品久久久久久| 两人在一起打扑克的视频| 乱码一卡2卡4卡精品| 两性午夜刺激爽爽歪歪视频在线观看| 一区二区三区高清视频在线| 一区福利在线观看| 淫秽高清视频在线观看| 免费观看的影片在线观看| 国产成人欧美在线观看| 国产精品野战在线观看| 99视频精品全部免费 在线| 久久欧美精品欧美久久欧美| 美女黄网站色视频| 亚洲av第一区精品v没综合| 亚洲人成电影免费在线| 国产av一区在线观看免费| 日日摸夜夜添夜夜添av毛片 | 日韩国内少妇激情av| 国产高清视频在线播放一区| 久久精品国产亚洲av香蕉五月| 成人特级av手机在线观看| 在现免费观看毛片| 丁香六月欧美| 亚洲美女黄片视频| 91久久精品国产一区二区成人| 精品久久久久久久久久久久久| 国产亚洲精品久久久久久毛片| 欧美黑人欧美精品刺激| 国产成人av教育| 伊人久久精品亚洲午夜| 国产蜜桃级精品一区二区三区| 毛片女人毛片| 免费在线观看日本一区| 男人舔奶头视频| 亚洲七黄色美女视频| 国产精品久久久久久久久免 | 精品久久久久久,| 一级毛片久久久久久久久女| 男人狂女人下面高潮的视频| 人妻制服诱惑在线中文字幕| 精品久久久久久久久亚洲 | 91在线精品国自产拍蜜月| 欧美日韩福利视频一区二区| 国产又黄又爽又无遮挡在线| 99国产精品一区二区三区| 97碰自拍视频| 国产精品一区二区三区四区久久| 精品久久久久久久末码| 一级av片app| 看片在线看免费视频| 国产一区二区三区视频了| 国产欧美日韩一区二区三| 欧美成人性av电影在线观看| 国产成人av教育| 丁香六月欧美| 悠悠久久av| 长腿黑丝高跟| 亚洲成av人片免费观看| 天堂影院成人在线观看| 国语自产精品视频在线第100页| 十八禁网站免费在线| 一级av片app| 91在线观看av| 亚洲专区中文字幕在线| 亚洲精品色激情综合| 夜夜爽天天搞| 国产v大片淫在线免费观看| 亚洲午夜理论影院| 不卡一级毛片| 国产精品免费一区二区三区在线| 91久久精品国产一区二区成人| 成人鲁丝片一二三区免费| 中文字幕久久专区| 在线观看免费视频日本深夜| 一区福利在线观看| 69人妻影院| 又爽又黄无遮挡网站| 9191精品国产免费久久| 身体一侧抽搐| 国产91精品成人一区二区三区| 老鸭窝网址在线观看| 婷婷丁香在线五月| 熟妇人妻久久中文字幕3abv| av天堂在线播放| a级毛片免费高清观看在线播放| 精品一区二区三区视频在线| 精品久久久久久久久久免费视频| 又紧又爽又黄一区二区| 久久婷婷人人爽人人干人人爱| 99久久无色码亚洲精品果冻| 精品日产1卡2卡| 国产毛片a区久久久久| 亚洲成人中文字幕在线播放| 免费大片18禁| 最新在线观看一区二区三区| 亚洲国产日韩欧美精品在线观看| 日韩欧美国产一区二区入口| 淫秽高清视频在线观看| 国产中年淑女户外野战色| 国产精品亚洲美女久久久| 亚洲av成人av| 亚洲男人的天堂狠狠| 国内少妇人妻偷人精品xxx网站| 两个人视频免费观看高清| 中文在线观看免费www的网站| 欧美一区二区精品小视频在线| 男女之事视频高清在线观看| 国产精品一区二区免费欧美| 美女cb高潮喷水在线观看| 亚洲天堂国产精品一区在线| 亚洲av成人不卡在线观看播放网| 日韩av在线大香蕉| 中文在线观看免费www的网站| 午夜福利18| 久久久国产成人免费| 国产探花在线观看一区二区| 欧美日韩黄片免| 天堂动漫精品| 久9热在线精品视频| 中文字幕久久专区| 亚洲第一区二区三区不卡| 少妇丰满av| 欧美日韩乱码在线| 在线免费观看不下载黄p国产 | 成人午夜高清在线视频| 国产精品美女特级片免费视频播放器| 99久久成人亚洲精品观看| 国产毛片a区久久久久| 国产一区二区在线观看日韩| 一区二区三区四区激情视频 | 女人十人毛片免费观看3o分钟| 成年免费大片在线观看| 免费av观看视频| av天堂在线播放| 欧美一区二区亚洲| 欧美3d第一页| 一个人看视频在线观看www免费| 亚洲成人精品中文字幕电影| 日本免费a在线| 精品无人区乱码1区二区| 日日摸夜夜添夜夜添av毛片 | 婷婷精品国产亚洲av| www.999成人在线观看| 国产精品亚洲av一区麻豆| 一进一出抽搐gif免费好疼| 午夜老司机福利剧场| 亚洲天堂国产精品一区在线| 91字幕亚洲| 老鸭窝网址在线观看| 欧美潮喷喷水| 精品久久久久久久久亚洲 | 国模一区二区三区四区视频| 怎么达到女性高潮| 国产乱人视频| 免费大片18禁| 亚洲人成网站在线播| 九九在线视频观看精品| 美女黄网站色视频| 99精品久久久久人妻精品| netflix在线观看网站| 3wmmmm亚洲av在线观看| 男插女下体视频免费在线播放| 天堂av国产一区二区熟女人妻| 成人av在线播放网站| 小蜜桃在线观看免费完整版高清| 最好的美女福利视频网| 一个人观看的视频www高清免费观看| 内地一区二区视频在线| 亚洲中文字幕日韩| a级毛片免费高清观看在线播放| 免费看日本二区| 国产精品亚洲一级av第二区| 国产精品三级大全| 国产视频内射| 中亚洲国语对白在线视频| 午夜老司机福利剧场| 日日摸夜夜添夜夜添av毛片 | 婷婷六月久久综合丁香| 欧美日韩亚洲国产一区二区在线观看| 五月伊人婷婷丁香| 麻豆av噜噜一区二区三区| 2021天堂中文幕一二区在线观| 在线看三级毛片| 日韩精品青青久久久久久| 国产美女午夜福利| 国产乱人视频| 精品人妻熟女av久视频| 国产精品综合久久久久久久免费| 精品一区二区三区视频在线| 亚洲一区二区三区色噜噜| 一区二区三区免费毛片| av天堂中文字幕网| 国模一区二区三区四区视频| 久久国产精品影院| 一边摸一边抽搐一进一小说| 久久国产精品影院| 午夜福利在线观看吧| 精品不卡国产一区二区三区| 97热精品久久久久久| 一级黄色大片毛片| 午夜老司机福利剧场| 小说图片视频综合网站| 99riav亚洲国产免费| 免费av不卡在线播放| 国产精品爽爽va在线观看网站| 国内久久婷婷六月综合欲色啪| 亚洲美女视频黄频| 亚洲国产精品久久男人天堂| 久久精品国产亚洲av香蕉五月| 中文字幕免费在线视频6| av国产免费在线观看| 欧美极品一区二区三区四区| avwww免费| 色尼玛亚洲综合影院| 日韩欧美一区二区三区在线观看| 高清在线国产一区| 精品一区二区免费观看| 精品人妻一区二区三区麻豆 | 中文在线观看免费www的网站| 久久久久久久久大av| 又爽又黄a免费视频| 他把我摸到了高潮在线观看| 高清在线国产一区| 九九久久精品国产亚洲av麻豆| 欧美中文日本在线观看视频| 国产av在哪里看| 非洲黑人性xxxx精品又粗又长| 好男人电影高清在线观看| 一进一出抽搐动态| 91久久精品电影网| 一级作爱视频免费观看| 91久久精品电影网| 日韩有码中文字幕| 久久精品人妻少妇| 亚洲成人久久爱视频| 日韩人妻高清精品专区| 狂野欧美白嫩少妇大欣赏| 91字幕亚洲| 精品无人区乱码1区二区| av在线观看视频网站免费| 99热这里只有是精品在线观看 | 免费在线观看成人毛片| 亚洲真实伦在线观看| 午夜精品久久久久久毛片777| 三级国产精品欧美在线观看| 久99久视频精品免费| 又粗又爽又猛毛片免费看| 午夜激情欧美在线| 人人妻,人人澡人人爽秒播| 非洲黑人性xxxx精品又粗又长| av中文乱码字幕在线| 最新在线观看一区二区三区| 亚洲av成人不卡在线观看播放网| 亚洲人与动物交配视频| 国内少妇人妻偷人精品xxx网站| 美女 人体艺术 gogo| 国产精品影院久久| 免费在线观看成人毛片| 亚洲成人精品中文字幕电影| 老司机午夜福利在线观看视频| 国产一区二区在线观看日韩| 欧美高清性xxxxhd video| 国产高清激情床上av| 亚洲美女搞黄在线观看 | 国产熟女xx| 俄罗斯特黄特色一大片| 淫妇啪啪啪对白视频| 变态另类丝袜制服| 人人妻人人看人人澡| 欧美性猛交╳xxx乱大交人| 色5月婷婷丁香| 深爱激情五月婷婷| 日本熟妇午夜| 久久亚洲真实| 一级黄色大片毛片| 亚洲五月婷婷丁香| 人妻夜夜爽99麻豆av| 午夜激情福利司机影院| 波多野结衣高清无吗| 久久久国产成人免费| 成人特级黄色片久久久久久久| 午夜福利视频1000在线观看| 国产精品一区二区性色av| 国产成人av教育| 国产真实伦视频高清在线观看 | 美女高潮的动态| av在线蜜桃| 成人av在线播放网站| 亚洲一区二区三区色噜噜| 亚洲欧美日韩高清专用| 日本免费一区二区三区高清不卡| 在线免费观看不下载黄p国产 | av在线观看视频网站免费| 欧美丝袜亚洲另类 | 亚洲精品亚洲一区二区| 美女 人体艺术 gogo| 午夜影院日韩av| 国产v大片淫在线免费观看| 人人妻,人人澡人人爽秒播| 国产欧美日韩一区二区精品| 动漫黄色视频在线观看| 国产真实乱freesex| 午夜影院日韩av| 亚洲av不卡在线观看| 亚洲美女视频黄频| 国产综合懂色| 亚洲熟妇熟女久久| 亚洲国产日韩欧美精品在线观看| 成人午夜高清在线视频| 国产探花极品一区二区| 国内毛片毛片毛片毛片毛片| 亚洲成av人片在线播放无| 琪琪午夜伦伦电影理论片6080| 亚洲无线观看免费| 丝袜美腿在线中文| 亚洲精品在线美女| 亚洲欧美激情综合另类| eeuss影院久久| 直男gayav资源| 免费电影在线观看免费观看| 国产激情偷乱视频一区二区| 亚洲性夜色夜夜综合| 白带黄色成豆腐渣| 国产亚洲精品久久久com| 国产精品一区二区性色av| 亚洲成a人片在线一区二区| 亚洲成人精品中文字幕电影| 欧美极品一区二区三区四区| 高清日韩中文字幕在线| 国产成人a区在线观看| 国产一区二区在线av高清观看| 熟妇人妻久久中文字幕3abv| 久久久久久久精品吃奶| 午夜福利在线观看免费完整高清在 | 国产爱豆传媒在线观看| 中国美女看黄片| 久久香蕉精品热| 久久性视频一级片| 1000部很黄的大片| 久久99热6这里只有精品| 午夜a级毛片|