• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    三種用于垃圾網(wǎng)頁(yè)檢測(cè)的隨機(jī)欠采樣集成分類器

    2017-04-20 03:38:34陳木生盧曉勇
    計(jì)算機(jī)應(yīng)用 2017年2期
    關(guān)鍵詞:小類分類器網(wǎng)頁(yè)

    陳木生,盧曉勇

    (1.南昌大學(xué) 信息工程學(xué)院,江西 南昌 330031; 2.南昌大學(xué) 軟件學(xué)院,江西 南昌 330047)

    (*通信作者電子郵箱dreaminit@163.com)

    三種用于垃圾網(wǎng)頁(yè)檢測(cè)的隨機(jī)欠采樣集成分類器

    陳木生1*,盧曉勇2

    (1.南昌大學(xué) 信息工程學(xué)院,江西 南昌 330031; 2.南昌大學(xué) 軟件學(xué)院,江西 南昌 330047)

    (*通信作者電子郵箱dreaminit@163.com)

    針對(duì)垃圾網(wǎng)頁(yè)檢測(cè)過程中輕微的不平衡分類問題,提出三種隨機(jī)欠采樣集成分類器算法,分別為一次不放回隨機(jī)欠采樣(RUS-once)、多次不放回隨機(jī)欠采樣(RUS-multiple)和有放回隨機(jī)欠采樣(RUS-replacement)算法。首先使用其中一種隨機(jī)欠采樣技術(shù)將訓(xùn)練樣本集轉(zhuǎn)換成平衡樣本集,然后對(duì)每個(gè)平衡樣本集使用分類回歸樹(CART)分類器算法進(jìn)行分類,最后采用簡(jiǎn)單投票法構(gòu)建集成分類器對(duì)測(cè)試樣本進(jìn)行分類。實(shí)驗(yàn)表明,三種隨機(jī)欠采樣集成分類器均取得了良好的分類效果,其中RUS-multiple和RUS-replacement比RUS-once的分類效果更好。與CART及其Bagging和Adaboost集成分類器相比,在WEBSPAM UK-2006數(shù)據(jù)集上,RUS-multiple和RUS-replacement方法的AUC指標(biāo)值提高了10%左右,在WEBSPAM UK-2007數(shù)據(jù)集上,提高了25%左右;與其他最優(yōu)研究結(jié)果相比,RUS-multiple和RUS-replacement方法在AUC指標(biāo)上能達(dá)到最優(yōu)分類結(jié)果。

    垃圾網(wǎng)頁(yè)檢測(cè);不平衡分類;集成學(xué)習(xí);欠采樣;分類回歸樹

    0 引言

    隨機(jī)欠采樣方法是一種從數(shù)據(jù)方面解決類不平衡問題的有效有段。近年來(lái),類不平衡問題已成為數(shù)據(jù)挖掘領(lǐng)域的重要挑戰(zhàn)之一[1]。許多現(xiàn)實(shí)世界的分類問題,比如故障診斷[2]、異常檢測(cè)[3]、醫(yī)療診斷[4]、人臉識(shí)別[5]等,都屬于類不平衡分類問題。為解決類不平衡分類問題,許多技術(shù)相繼被提出。根據(jù)其處理類不平衡的方式不同,這些方法大體可劃分為三類:算法層面的方法是創(chuàng)立或修訂已存在的算法以特別考慮少數(shù)類的重要性[6-8];數(shù)據(jù)層面的方法則是采用重采樣技術(shù)以消除類分類偏置所帶來(lái)的影響[9-10],有欠采樣[11]和過采樣[12]兩種方式;最后一種方法則是同時(shí)結(jié)合算法和數(shù)據(jù)層面的代價(jià)敏感方法,通過調(diào)整不同類別的誤分類成本提高分類性能[13-14]。本文設(shè)計(jì)三種隨機(jī)欠采樣方法以解決類不平衡分類問題,分別為一次不放回隨機(jī)欠采樣(Random Under-Sampling once without replacement, RUS-once)、多次不放回隨機(jī)欠采樣(Random Under-Sampling multiple times without replacement, RUS-multiple)和有放回隨機(jī)欠采樣(Random Under-Sampling with replacement, RUS-replacement)。

    垃圾網(wǎng)頁(yè)指的是那些在搜索引擎查詢結(jié)果中具有良好的排名而實(shí)際價(jià)值卻較差的網(wǎng)站和網(wǎng)頁(yè)。垃圾網(wǎng)頁(yè)削弱了搜索引擎的權(quán)威性,浪費(fèi)了大量計(jì)算與存儲(chǔ)資源,剝奪了合法網(wǎng)站的正當(dāng)利益,降低了搜索結(jié)果的質(zhì)量[15]。為此,搜索引擎公司和研究人員都在設(shè)計(jì)出各種算法以檢測(cè)垃圾網(wǎng)頁(yè),降低其搜索引擎查詢結(jié)果排名。據(jù)估計(jì),整個(gè)互聯(lián)網(wǎng)的垃圾網(wǎng)頁(yè)占到15%左右[15]。由此可知,垃圾網(wǎng)頁(yè)檢測(cè)是一個(gè)不平衡分類問題。但是與異常檢測(cè)、故障診斷等問題相比,其不平衡程度是較為輕微的,正負(fù)類比例在1∶6左右。對(duì)于這種輕微的類不平衡分類問題,本文假設(shè)可以從數(shù)據(jù)方面著手采用隨機(jī)欠采樣方法得到解決。為此,本文選擇分類回歸樹(Classification And Regression Tree, CART)作為子分類器,結(jié)合設(shè)計(jì)的三種隨機(jī)欠采樣方法進(jìn)行垃圾網(wǎng)頁(yè)檢測(cè),并比較其分類性能差異。

    1 隨機(jī)欠采樣集成分類比較

    本文提出的用于垃圾網(wǎng)頁(yè)檢測(cè)的隨機(jī)欠采樣集成分類的過程框架如圖1所示,共分訓(xùn)練階段和測(cè)試階段兩個(gè)階段。其中訓(xùn)練階段包括三個(gè)步驟:首先采用隨機(jī)欠采樣方法將不平衡數(shù)據(jù)集轉(zhuǎn)換成多個(gè)平衡數(shù)據(jù)集;然后,基于上個(gè)步驟得到的多個(gè)平衡數(shù)據(jù)集訓(xùn)練出多個(gè)CART分類器;最后采用簡(jiǎn)單投票法將此多個(gè)決策樹分類器構(gòu)建一個(gè)集成分類器。在測(cè)試階段,使用此基于隨機(jī)欠采樣的集成分類器對(duì)測(cè)試數(shù)據(jù)集進(jìn)行分類。本文設(shè)計(jì)了三種隨機(jī)欠采樣方法RUS-onces、RUS-multiple和RUS-replacement,并比較了它們用于垃圾網(wǎng)頁(yè)檢測(cè)的性能差異。本文重點(diǎn)介紹這三種隨機(jī)欠采樣方法的設(shè)計(jì)及其性能比較,而CART分類、簡(jiǎn)單投票法集成都是已得到充分研究的技術(shù),在本文提出的三種方法中的使用方式都一樣,因此僅在1.1節(jié)中介紹它們?nèi)绾闻c隨機(jī)欠采樣方法一起構(gòu)建集成分類器。

    圖1 隨機(jī)欠采樣集成分類器過程框架

    1.1 一次不放回隨機(jī)欠采樣

    本文將垃圾網(wǎng)頁(yè)檢測(cè)視為一個(gè)二元分類問題。在一個(gè)二元分類問題中,假設(shè)小類樣本集S和大類樣本集N,隨機(jī)欠采樣方法從大類樣本集N中隨機(jī)地抽取出樣本子集N′,使得N′的樣本數(shù)n′遠(yuǎn)遠(yuǎn)小于N的樣本數(shù)n,即n′?n,但約等于小類樣本集S的樣本數(shù)s,即n′≈s。將大類樣本子集N′與小類樣本集S合并到一起構(gòu)成一個(gè)新的平衡樣本集D,使用此平衡的樣本集D訓(xùn)練分類器模型要比原來(lái)不平衡的樣本集無(wú)論是在運(yùn)行性能還是分類準(zhǔn)確率上都要更好。然而D只利用了大類樣本集的小部分樣本,其他樣本未得到利用,造成浪費(fèi)。為充分利用所有大類樣本,將大類樣本采用不放回抽樣平均分成k等份可得到k個(gè)樣本子集:N1′,N2′, …,Nk′,其中k=n/s。這樣得到每份大類樣本子集N′的樣本數(shù)n′也約等于小類樣本集S的樣本數(shù)s。分別組合N′與S,得到k個(gè)均衡的樣本子集Di={S,Ni′}(i=1, 2, …,k),每個(gè)平衡的樣本集Di均可用于訓(xùn)練一個(gè)分類器。算法1列出了此一次不放回隨機(jī)欠采樣技術(shù)將不平衡數(shù)據(jù)集轉(zhuǎn)換為平衡數(shù)據(jù)集的偽代碼。

    算法1 一次不放回隨機(jī)欠采樣方法RUS-once。

    輸入 不平衡數(shù)據(jù)集,內(nèi)含小類樣本集S和大類樣本集N;

    輸出 多個(gè)平衡的樣本子集Di(i=1, 2, …,k)。

    1)

    s=小類樣本個(gè)數(shù);

    2)

    n=大類樣本個(gè)數(shù);

    3)

    k=n/s;

    4)

    將大類樣本平均分成k個(gè)樣本子集N1′,N2′, …,Nk′,其中Ni′的樣本個(gè)數(shù)ni′約等于小類樣本集S的樣本個(gè)數(shù)s;

    5)

    分別組合樣本子集Ni′和小類樣本集S構(gòu)成新的平衡的樣本子集Di;

    6)

    返回Di。

    該算法實(shí)現(xiàn)較為簡(jiǎn)單,小類樣本重復(fù)多次,大類樣本只使用一次,已充分利用所有樣本。與后面將要介紹的RUS-multiple和RUS-replacement方法相比,該方法生成的分類器數(shù)要少很多,但也可能正是這個(gè)原因,導(dǎo)致該集成分類器的分類性能比后兩種方法略差。

    基于上述一次不放回隨機(jī)欠采樣方法得到的多個(gè)平衡數(shù)據(jù)集,可訓(xùn)練出多個(gè)CART分類器,采用簡(jiǎn)單投票法集成所有分類器即得到一個(gè)集成決策樹分類器。在測(cè)試階段,每個(gè)集成分類器中的子分類器均將測(cè)試樣本分類為垃圾網(wǎng)頁(yè)或正常網(wǎng)頁(yè),根據(jù)分類結(jié)果的不同,得到一個(gè)分?jǐn)?shù)。該分?jǐn)?shù)的計(jì)算如式(1)所示:

    (1)

    其中:x為測(cè)試樣本;C是子分類器,即為一個(gè)CART分類器;Score(x,C)為使用C對(duì)x進(jìn)行分類后分類結(jié)果對(duì)應(yīng)的分?jǐn)?shù)。匯總所有子分類器得到的分?jǐn)?shù)并取平均值,即得到一個(gè)范圍在[-1,1]的實(shí)數(shù),該值可稱為樣本x的垃圾值(spamicity),該值越大則樣本越可能為垃圾網(wǎng)頁(yè),越小則越不可能為垃圾網(wǎng)頁(yè)??蓪⑺袠颖镜膕pamicity值直接用于計(jì)算集成分類器的AUC(AreaUnderthereceiveroperatingcharacteristicCurve)值。同時(shí),樣本的最終分類結(jié)果也可通過式(2)計(jì)算得到。

    (2)

    如果最終的分類結(jié)果值為1,則表示樣本為垃圾網(wǎng)頁(yè),否則為正常網(wǎng)頁(yè)。

    1.2 多次不放回隨機(jī)欠采樣

    上述一次不放回隨機(jī)欠采樣方法將僅對(duì)大類樣本作一次不放回隨機(jī)欠采樣,這樣只能夠得到一種類型的平衡數(shù)據(jù)集。實(shí)際上,多次進(jìn)行隨機(jī)欠采樣可以得到多種類型的平衡數(shù)據(jù)集,將此多種類型的平衡數(shù)據(jù)集用于訓(xùn)練學(xué)習(xí),可得到多種不同的決策樹分類器,將此決策樹分類器用于分類,可提升分類效果。如果同樣采用不放回隨機(jī)欠采樣,可將此方法稱為基于多次不放回隨機(jī)欠采樣的集成分類器。多次不放回隨機(jī)欠采樣跟一次不放回隨機(jī)欠采樣相比,需要多確定一個(gè)輸入?yún)?shù),即重復(fù)欠采樣多少次為宜。一般而言,為了方便簡(jiǎn)單投票法集成,應(yīng)該設(shè)置為奇數(shù)。因?yàn)樽罱K的子分類器個(gè)數(shù)(即平衡數(shù)據(jù)集個(gè)數(shù))為每次采樣產(chǎn)生的分類器個(gè)數(shù)和重復(fù)欠采樣次數(shù)的積,所以每次采樣產(chǎn)生的分類器個(gè)數(shù)也應(yīng)該為奇數(shù)。理論上,重復(fù)欠采樣的次數(shù)越多,得到不平衡數(shù)據(jù)集的種類也更多,相應(yīng)的子分類器的種類也更多,最終集成分類器的分類準(zhǔn)確率也可能更高;但是,重復(fù)次數(shù)越多,分類器之間的差異越小,運(yùn)行時(shí)間也越久。因此應(yīng)該權(quán)衡設(shè)置一個(gè)可兼顧二者的較為合理的重復(fù)次數(shù)。算法2列出了多次不放回隨機(jī)欠采樣方法將不平衡數(shù)據(jù)集轉(zhuǎn)換為平衡數(shù)據(jù)集的偽代碼。

    算法2 多次不放回隨機(jī)欠采樣算法RUS-multiple。

    輸入 不平衡數(shù)據(jù)集,內(nèi)含小類樣本集S和大類樣本集N,隨機(jī)欠采樣重復(fù)次數(shù)t;

    輸出 多個(gè)平衡的樣本子集Dij(i=1, 2, …,t,j=1, 2, …,k)。

    1)

    s=小類樣本個(gè)數(shù);

    2)

    n=大類樣本個(gè)數(shù);

    3)

    k=n/s;

    4)

    fori=1tot

    a)

    將大類樣本平均分成k個(gè)樣本子集Ni1′,Ni2′, …,Nik′,其中Nij′的樣本個(gè)數(shù)nij′約等于小類樣本集S的樣本個(gè)數(shù)s;

    b)

    分別組合樣本子集Nij′和小類樣本集S構(gòu)成新的平衡的樣本子集Dij;

    5)

    endfor

    6)

    返回Dij。

    該算法與RUS-once算法非常類似,只是多了一個(gè)參數(shù):重復(fù)次數(shù)t。即除了小類樣本要重復(fù)更多次外,大類樣本也要重復(fù)出現(xiàn)t次。因?yàn)槊看未箢愔貜?fù)時(shí),隨機(jī)采樣得到的樣本并不相同,最終學(xué)習(xí)得到的分類器模型也就不盡相同。這就保證了分類器的多樣性,一定程度上提高了其分類性能。當(dāng)然,該算法所需訓(xùn)練的分類器數(shù)是RUS-once的t倍,訓(xùn)練學(xué)習(xí)以及最終分類的時(shí)間都要更長(zhǎng)。

    1.3 有放回隨機(jī)欠采樣

    上述兩種不放回隨機(jī)欠采樣方法中,每次采樣得到的平衡數(shù)據(jù)集中,相互之間的大類樣本是完全不一樣的,這保證了讓盡可能多的大類樣本參與分類,同時(shí)確保平衡數(shù)據(jù)集的多樣性。然而不放回隨機(jī)欠采樣有一個(gè)缺陷,即在每個(gè)平衡數(shù)據(jù)集中大類樣本數(shù)與小類樣本數(shù)并不相等。在每個(gè)平衡數(shù)據(jù)集中,如果大類樣本數(shù)與小類樣本數(shù)完全相同,集成分類器的性能是否會(huì)提升?為驗(yàn)證此想法,提出一種有放回的隨機(jī)欠采樣方法。該方法確保每個(gè)平衡數(shù)據(jù)集中大類樣本數(shù)和小類樣本數(shù)完全相等,但在同一個(gè)數(shù)據(jù)集中,同一個(gè)大類樣本是否出現(xiàn)多次則不再考慮。為了確保數(shù)據(jù)集的多樣性,采樣的次數(shù)應(yīng)該足夠多。當(dāng)然,最終平衡數(shù)據(jù)集的個(gè)數(shù)同樣應(yīng)該為奇數(shù)。本文在將這些隨機(jī)欠采樣方法應(yīng)用于垃圾網(wǎng)頁(yè)檢測(cè)的過程中,為了使得該方法能更好地與上述多次不放回隨機(jī)欠采樣方法相比較,兩種方法得到平衡數(shù)據(jù)集個(gè)數(shù)應(yīng)該相同,即有放回隨機(jī)欠采樣的次數(shù)應(yīng)該等于多次不放回隨機(jī)欠采樣的重復(fù)次數(shù)乘以每次產(chǎn)生的平衡數(shù)據(jù)集個(gè)數(shù)。有放回隨機(jī)欠采樣的偽代碼如算法3所示。

    算法3 有放回隨機(jī)欠采樣算法RUS-replacement。

    輸入 不平衡數(shù)據(jù)集,內(nèi)含小類樣本集S和大類樣本集N,采樣次數(shù)(平衡數(shù)據(jù)集個(gè)數(shù))t;

    輸出 多個(gè)平衡的樣本子集Di(i=1, 2, …,t)。

    1)

    s=小類樣本個(gè)數(shù);

    2)

    n=大類樣本個(gè)數(shù);

    3)

    fori=1tot

    a)

    從n個(gè)大類樣本中隨機(jī)采樣出1個(gè)大類樣本;

    b)

    將步驟a)重復(fù)s次,即通過有放回的隨機(jī)欠采樣得到s個(gè)大類樣本,構(gòu)成大類子樣本集Ni′;

    c)

    將采樣得到的大類子樣本集Ni′和小類樣本集S組合一起構(gòu)成新的平衡的樣本子集Di;

    4)

    endfor

    5)

    返回Di。

    該算法與RUS-multiple相比,生成的子分類器個(gè)數(shù)相同,因此訓(xùn)練學(xué)習(xí)和最終分類的時(shí)間相差不大,是RUS-once算法的t倍。與RUS-multiple相比,該算法用于訓(xùn)練分類器的樣本集中,大小類樣本數(shù)完全相等。但后面的實(shí)驗(yàn)表明,這并不一定能使分類性能更好。

    2 實(shí)驗(yàn)與分析

    2.1 數(shù)據(jù)集及評(píng)價(jià)指標(biāo)

    本文實(shí)驗(yàn)所用數(shù)據(jù)集為WEBSPAM-UK2006[16]和WEBSPAM-UK2007[16],它們分別是網(wǎng)絡(luò)對(duì)抗信息檢索研討會(huì)2007年、2008年用于垃圾網(wǎng)頁(yè)檢測(cè)競(jìng)賽使用的數(shù)據(jù)集,現(xiàn)已成為垃圾網(wǎng)頁(yè)檢測(cè)研究的公開數(shù)據(jù)集。數(shù)據(jù)集本身已按保持法的要求分為訓(xùn)練集和測(cè)試集兩個(gè)部分,擁有多種不同的特征。本文采納了其中四種特征,分別是基于內(nèi)容的特征96個(gè),基于鏈接的特征41個(gè),基于鏈接轉(zhuǎn)換的特征135個(gè),基于鄰接圖的特征2個(gè)?;趦?nèi)容的特征包括網(wǎng)頁(yè)中含有的單詞數(shù)量、平均單詞長(zhǎng)度、平均標(biāo)題長(zhǎng)度、可見內(nèi)容比率、流行詞所占比率等;基于鏈接的特征主要通過分析主頁(yè)和最高PageRank值頁(yè)面的相關(guān)情況得到,包括主頁(yè)與最大PageRank值頁(yè)面是否為同一頁(yè),主頁(yè)和最大PageRank值頁(yè)面的鏈入數(shù)(In-Degree)、鏈出數(shù) (Out-Degree)、PageRank、TrustRank等;基于鏈接轉(zhuǎn)換的特征則是通過基于鏈接的特征進(jìn)行不同的換算得到;基于鄰接圖的特征是通過對(duì)Stacked鏈接圖進(jìn)行學(xué)習(xí)而得到的,但WEBSPAM-UK2007未提供此特征。這些特征是進(jìn)行垃圾網(wǎng)頁(yè)檢測(cè)的常用特征,也是2007、2008兩年垃圾網(wǎng)頁(yè)檢測(cè)競(jìng)賽各團(tuán)隊(duì)所使用的基本特征。除這些特征外,各團(tuán)隊(duì)還可以使用其他辦法提取更多的特征用于分類。訓(xùn)練集和測(cè)試集的樣本數(shù)情況如表1所示。由表1可知,WEBSPAM-UK2006訓(xùn)練集中正常網(wǎng)站與垃圾網(wǎng)站的比例約為7∶1,這表明訓(xùn)練集是不平衡的,與真實(shí)情況較為一致,但測(cè)試數(shù)據(jù)集未體現(xiàn)出不平衡性;WEBSPAM-UK2007訓(xùn)練集和測(cè)試集中正常網(wǎng)站與垃圾網(wǎng)站的比例都約為17∶1,體現(xiàn)了數(shù)據(jù)不平衡性。

    表1 實(shí)驗(yàn)數(shù)據(jù)集

    本文使用三種指標(biāo)評(píng)估分類模型,分別是準(zhǔn)確率(Accuracy),F(xiàn)1-測(cè)度(F1-Measure)和AUC值。對(duì)于二元分類問題,其表達(dá)測(cè)試樣本集分類結(jié)果的混淆矩陣由TP(TruePositive)、TN(TrueNegative)、FP(FalsePositive)和FN(FalseNegative)四個(gè)值構(gòu)成,其中TP為被正確分類的正例,TN為正確分類的負(fù)例,F(xiàn)P為錯(cuò)誤分類的正例,F(xiàn)N為錯(cuò)誤分類的負(fù)例。于是準(zhǔn)確率和F1-測(cè)度值可分別用式(3)、式(4)計(jì)算得到。

    (3)

    (4)

    對(duì)于二元分類而言,隨機(jī)挑選一個(gè)正例樣本以及一個(gè)負(fù)例樣本,分類算法根據(jù)計(jì)算得到的分?jǐn)?shù)(Score)值將正例樣本排在負(fù)例樣本前面的概率即為AUC值[17]。在垃圾網(wǎng)頁(yè)檢測(cè)中,最終得到的spamicity值即可作為Score值。AUC值越大表明當(dāng)前的分類算法越有可能將正例樣本排在負(fù)例樣本前面,即能夠更好地分類。AUC值相比準(zhǔn)確率和F1-測(cè)度而言,更適合于不平衡數(shù)據(jù)集的分類性能評(píng)價(jià)[18]。

    2.2 子分類器和參數(shù)設(shè)置

    本文使用CART分類器作為子分類器。通過多次實(shí)驗(yàn)發(fā)現(xiàn),基于隨機(jī)欠采樣集成的方法中,子分類器采用決策樹和隨機(jī)森林分類器中比其他分類器如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、K近鄰、樸素貝葉斯等分類器更好。而隨機(jī)森林分類器本身就是使用Bootstrap采樣然后Bagging集成CART分類器得到的,為了更好地將本文設(shè)計(jì)的三種隨機(jī)欠采樣方法與Bagging、AdaBoost等集成方法進(jìn)行比較,使用CART分類器作為子分類器。

    據(jù)前文介紹可知:一次不放回隨機(jī)欠采樣集成分類方法只需輸入訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集即可,不需要設(shè)置其他參數(shù);而多次不放回隨機(jī)欠采樣集成分類方法則需要設(shè)置一個(gè)重復(fù)次數(shù)的參數(shù),根據(jù)實(shí)驗(yàn)結(jié)果可知,將此參數(shù)設(shè)置為9更加合適。由于在每次不放回隨機(jī)欠采樣過程中,WEBSPAM-UK2006將產(chǎn)生7個(gè)平衡訓(xùn)練數(shù)據(jù)集,WEBSPAM-UK2007將產(chǎn)生17個(gè)平衡訓(xùn)練數(shù)據(jù)集,因此在有放回隨機(jī)欠采樣方法中,應(yīng)該將采樣次數(shù)t分別設(shè)置為7×9=63和17×9=153。

    2.3 不同欠采樣方法的比較

    表2列出了將一次不放回隨機(jī)欠采樣(CART+RUS-once)、多次不放回隨機(jī)欠采樣(CART+RUS-multiple)和有放回隨機(jī)欠采樣(CART+RUS-replacement)三種集成分類器用于對(duì)數(shù)據(jù)集WEBSPAM-2006和WEBSPAM-2007進(jìn)行垃圾網(wǎng)頁(yè)檢測(cè)后的分類結(jié)果值。為了更好地與其他傳統(tǒng)分類器比較,表2同時(shí)列出了CART、CART+Bagging和CART+Adaboost三種分類器的檢測(cè)結(jié)果。從表2中WEBSPAM-UK2006的結(jié)果可以看出,三種隨機(jī)欠采樣集成分類器跟決策樹及其Bagging、Adaboost集成分類器相比,無(wú)論在準(zhǔn)確率、F1-測(cè)度還是AUC指標(biāo)方面,都要明顯更優(yōu)。Bagging和Adaboost集成分類器與其子分類器CART分類器相比在分類準(zhǔn)確率、F1測(cè)度和AUC三個(gè)指標(biāo)上都有3~5個(gè)百分點(diǎn)的提升,而本文提出的隨機(jī)欠采樣集成分類器則又提升了10個(gè)百分點(diǎn)左右;而且本文提出的三種隨機(jī)欠采樣集成分類器中,有放回的隨機(jī)欠采樣集成分類器性能表現(xiàn)最優(yōu)。由表2中WEBSPAM-UK2007的結(jié)果可知,從準(zhǔn)確率和F1測(cè)度兩個(gè)指標(biāo)看,集成分類器并不比單一分類器表現(xiàn)更優(yōu);但從AUC指標(biāo)看,本文提出的三種方法比其他方法明顯更優(yōu),提高25個(gè)百分點(diǎn)左右。

    表3和表4分別列出了2007、2008年垃圾網(wǎng)頁(yè)挑戰(zhàn)競(jìng)賽各優(yōu)勝團(tuán)隊(duì)的分類結(jié)果。因?yàn)閃EBSPAM-UK2007中測(cè)試數(shù)據(jù)集也是不平衡的,而準(zhǔn)確率和F1測(cè)度兩個(gè)指標(biāo)不適合于評(píng)價(jià)不平衡分類的性能,因此只能通過AUC指標(biāo)來(lái)評(píng)判各分類器的優(yōu)劣,所以2008年垃圾網(wǎng)頁(yè)挑戰(zhàn)賽(Webspamchallenge2008)優(yōu)勝團(tuán)隊(duì)的分類結(jié)果中就只列出了AUC的值。將其與本文提出的三種隨機(jī)欠采樣集成分類器中較優(yōu)的RUS-multiple和RUS-replacement兩種方法就AUC指標(biāo)進(jìn)行比較可以發(fā)現(xiàn),在WEBSPAM-UK2006中,RUS-replacement方法的AUC值為0.943 4,高于最優(yōu)團(tuán)隊(duì)匈牙利科學(xué)院的結(jié)果值;在WEBSPAM-UK2007中,RUS-multiple方法的AUC值為0.854 4,達(dá)到最優(yōu)團(tuán)隊(duì)中國(guó)科學(xué)院的結(jié)果值。這反映出本文提出的RUS-multiple和RUS-replacement兩種集成分類器具有良好的分類性能。

    Scarselli等[15]提出一種包含概率映射圖自組織映射(ProbabilisticMappingGraphself-organizingmap,PM-G)和圖神經(jīng)網(wǎng)絡(luò)(GraphNeuralNetwork,GNN)的圖層疊架構(gòu)用于垃圾網(wǎng)頁(yè)檢測(cè),同樣基于WEBSPAMUK-2006進(jìn)行實(shí)驗(yàn)。表5列出了其所提方法的實(shí)驗(yàn)結(jié)果,其中的FNN、PM-G+GNN(3)+GNN(1)算法表現(xiàn)出最好的檢測(cè)效果。本文提出的RUS-replacement方法與其相比,除了準(zhǔn)確率稍微低一些外,F(xiàn)1-測(cè)度明顯更優(yōu),AUC指標(biāo)值也略勝一籌。

    表2 CART、CART+Bagging、CART+Adaboost及本文方法的檢測(cè)結(jié)果

    本文作者也曾提出結(jié)合隨機(jī)森林和欠采樣的方法(RandomForest+Under-Sampling,RF+US)[19]、結(jié)合免疫克隆特征選擇和欠采樣的方法(ImmuneClonalFeatureSelectionandUnder-Sampling+EnsembleRandomForest,ICFSUS+ERF)[20]針對(duì)數(shù)據(jù)集WEBSPAM-UK2006進(jìn)行垃圾網(wǎng)頁(yè)檢測(cè),分類結(jié)果如表6所示。其中RF+US、ICFSUS+ERF算法中的欠采樣算法其實(shí)就是本文的RUS-once采樣算法。對(duì)照表2和表6可知,RF+US方法的分類效果比本文提出的CART+RUS-once更好,這正是因?yàn)镽F+US中除了使用RUS-once進(jìn)行欠采樣外,其中的隨機(jī)森林算法本身還采用了Bagging集成的緣故;但RF+US方法的分類效果比本文提出的CART+RUS-multiple和CART+RUS-replacement兩種方法在AUC指標(biāo)上略微差些。與ICFSUS-ERF相比,本文提出的三種方法還是略顯不足,但是ICFSUS-ERF需要耗費(fèi)大量的時(shí)間采用免疫遺傳算法進(jìn)行智能搜索選擇出最優(yōu)特征子集,在運(yùn)行性能上比本文提出的三種方法都要更差。

    表3 2007年垃圾網(wǎng)頁(yè)挑戰(zhàn)賽優(yōu)勝團(tuán)隊(duì)分類結(jié)果

    表5 Scarselli等[15]提出方法的分類結(jié)果

    表6 本文作者設(shè)計(jì)的其他算法的分類結(jié)果

    2.4 討論

    由實(shí)驗(yàn)結(jié)果可知,本文提出的三種以CART為子分類器的隨機(jī)欠采樣集成分類器用于正負(fù)類稍顯不平衡的垃圾網(wǎng)頁(yè)檢測(cè)的分類,得到了較為優(yōu)良的效果。三種方法中,多次不放回的隨機(jī)欠采樣集成分類器和有放回的隨機(jī)欠采樣集成分類器比一次不放回的隨機(jī)欠采樣集成分類器性能更優(yōu),取得了更好的分類結(jié)果;跟其他最優(yōu)的分類結(jié)果相比,多次不放回的隨機(jī)欠采樣集成分類器和有放回的隨機(jī)欠采樣集成分類器在AUC指標(biāo)上達(dá)到最優(yōu)分類結(jié)果水平。這些優(yōu)良分類效果的取得,一方面要?dú)w因于決策樹分類器本身的優(yōu)異分類性能,另一方面則是讓正負(fù)類平衡的隨機(jī)欠采樣技術(shù)從數(shù)據(jù)方面在一定程度上解決了類不平衡分類問題,而集成方法又使得所有數(shù)據(jù)都得到了充分的利用,尤其是多次不放回隨機(jī)欠采樣和有放回隨機(jī)欠采樣兩種方法,使每一個(gè)樣本都參與了多個(gè)決策樹分類器的構(gòu)建,每個(gè)決策樹分類器又由于樣本不完全一樣而存在多樣性,多種決策分類器集成分類,分類性能提升極大。

    3 結(jié)語(yǔ)

    針對(duì)垃圾網(wǎng)頁(yè)檢測(cè)中輕微的類不平衡現(xiàn)象,從數(shù)據(jù)方面著手,本文設(shè)計(jì)了三種隨機(jī)欠采樣算法,以CART分類器作為子分類器,構(gòu)建集成分類器,對(duì)垃圾網(wǎng)頁(yè)數(shù)據(jù)集進(jìn)行分類。這三種隨機(jī)欠采樣集成分類器中,除一次不放回隨機(jī)欠樣性能稍差外,多次不放回隨機(jī)欠采樣分類器和有放回隨機(jī)欠采樣分類器都表現(xiàn)出優(yōu)良的分類性能,與當(dāng)前最優(yōu)秀的垃圾網(wǎng)頁(yè)檢測(cè)算法相比,仍然有其優(yōu)勢(shì)。可將本文提出的三種隨機(jī)欠采樣集成分類方法用于其他輕微類不平衡的應(yīng)用領(lǐng)域,以檢驗(yàn)它們的泛化能力,探索其適用范圍。

    )

    [1]YANGQ,WUX.10challengingproblemsindataminingresearch[J].InternationalJournalofInformationTechnology&DecisionMaking.2006, 5(4): 597-604.

    [2]YANGZ,TANGWH,SHINTEMIROVA,etal.Associationrulemining-baseddissolvedgasanalysisforfaultdiagnosisofpowertransformers[J].IEEETransactionsonSystems,Man,andCybernetics,PartC:ApplicationsandReviews, 2009, 39(6): 597-610.

    [3]KHREICHW,GRANGERE,MIRIA,etal.IterativeBooleancombinationofclassifiersintheROCspace:anapplicationtoanomalydetectionwithHMMs[J].PatternRecognition.2010, 43(8): 2732-2752.

    [4]MAZUROWSKIMA,HABASPA,ZURADAJM,etal.2008specialissue:trainingneuralnetworkclassifiersformedicaldecisionmaking:theeffectsofimbalanceddatasetsonclassificationperformance[J].NeuralNetworks.2008, 21(2/3): 427-436.

    [5]LIUY-H,CHENY-T.Totalmarginbasedadaptivefuzzysupportvectormachinesformultiviewfacerecognition[C]//Proceedingsofthe2005IEEEInternationalConferenceonSystems,ManandCybernetics.Piscataway,NJ:IEEE, 2005: 1704-1711

    [6]QUINLANJR.Improvedestimatesfortheaccuracyofsmalldisjuncts[J].MachineLearning, 1991, 6(1): 93-98.

    [7]ZADROZNYB,ELKANC.Learningandmakingdecisionswhencostsandprobabilitiesarebothunknown[C]//ProceedingsoftheSeventhACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.NewYork:ACM, 2001: 204-213.

    [8]WUG,CHANGEY.KBA:kernelboundaryalignmentconsideringimbalanceddatadistribution[J].IEEETransactionsonKnowledgeandDataEngineering, 2005, 17(6): 786-795.

    [9]BATISTAGEAPA,PRATIRC,MONARDMC.Astudyofthebehaviorofseveralmethodsforbalancingmachinelearningtrainingdata[J].ACMSIGKDDExplorationsNewsletter, 2004, 6(1): 20-29.

    [10]CHAWLANV,JAPKOWICZN,KOTCZA.Editorial:specialissueonlearningfromimbalanceddatasets[J].ACMSIGKDDExplorationsNewsletter, 2004, 6(1): 1-6.

    [11]GENGG-G,WANGC-H,LIQ-D,etal.BoostingtheperformanceofWebspamdetectionwithensembleunder-samplingclassification[C]//FSKD’07:ProceedingsoftheIEEEFourthInternationalConferenceonFuzzySystemsandKnowledgeDiscovery.Piscataway,NJ:IEEE, 2007, 4: 583-587

    [12]CHAWLANV,BOWYERKW,HALLLO,etal.SMOTE:syntheticminorityover-samplingtechnique[J].JournalofArtificialIntelligenceResearch, 2002, 16(1): 321-357.

    [13]CHAWLANV,CIESLAKDA,HALLLO,etal.Automaticallycounteringimbalanceanditsempiricalrelationshiptocost[J].DataMiningandKnowledgeDiscovery, 2008, 17(2): 225-252.

    [14]FREITASA,COSTA-PEREIRAA,BRAZDILP.Cost-sensitivedecisiontreesappliedtomedicaldata[C]//DaWaK2007:Proceedingsofthe9thInternationalConferenceonDataWarehousingandKnowledgeDiscovery,LNCS4654.BerlinHeidelberg:Springer, 2007: 303-312.

    [15] SPIRIN N, HAN J.Survey on Web spam detection: principles and algorithms[J].ACM SIGKDD Explorations Newsletter, 2012, 13(2): 50-64.

    [16] CASTILLO C, DONATO D, BECCHETTI L, et al.A reference collection for Web spam[J].ACM SIGIR Forum.2006, 40(2): 11-24.

    [17] FAWCETT T.An introduction to ROC analysis[J].Pattern Recognition Letters, 2006, 27(8): 861-874.

    [18] DAVIS J, GOADRICH M.The relationship between precision-recall and ROC curves [C]// Proceedings of the 23rd International Conference on Machine Learning.New York: ACM, 2006: 233-240.

    [19] 盧曉勇,陳木生.基于隨機(jī)森林和克隆選擇的垃圾網(wǎng)頁(yè)檢測(cè)[J].計(jì)算機(jī)應(yīng)用,2016,36(1):156-159.(LU X Y, CHEN M S.Web spam detection based on random forests and under-sampling ensemble [J].Journal of Computer Applications, 2016, 36(1): 156-159.)

    [20] 盧曉勇,陳木生,吳政隆,等.基于免疫克隆特征選擇和欠采樣集成的垃圾網(wǎng)頁(yè)檢測(cè)[J].計(jì)算機(jī)應(yīng)用,2016,36(7):1899-1903.(LU X Y, CHEN M S, WU J L, et al.Web spam detection based on immune clonal feature selection and under-sampling ensemble [J].Journal of Computer Applications, 2016, 36(7): 1899-1903.)

    This work is partially supported by the Sciences and Technology Support Program of Jiangxi Province (20131102040039).

    CHEN Musheng, born in 1977, Ph.D.candidate.His research interests include data mining and knowledge discovery, information management and information system.

    LU Xiaoyong, born in 1957, Ph.D., professor.His research interests include information management and information system, industry engineering.

    Three random under-sampling based ensemble classifiers for Web spam detection

    CHEN Musheng1*, LU Xiaoyong2

    (1.SchoolofInformationEngineering,NanchangUniversity,NanchangJiangxi330031,China;2.SchoolofSoftware,NanchangUniversity,NanchangJiangxi330047,China)

    In order to solve the problem of slighty imbalanced classification in Web spam detection, three ensemble classifiers based on random under-sampling techniques were proposed, including Random Under-Sampling once without replacement (RUS-once), Random Under-Sampling multiple times without replacement (RUS-multiple) and Random Under-Sampling with replacement (RUS-replacement).At first, the unbalanced training dataset was converted into several balanced datasets by using one of the under-sampling techniques.Secondly, the Classification And Regression Tree (CART) classifiers were trained based on the balanced datasets.Finally, an ensemble classifier was constructed with all of the CART classifiers based on simple voting rule and used to classify the test samples.The experimental results show that the three kinds of random under-sampling based ensemble classifiers achieve good classification results, the performance of RUS-multiple and RUS-replacement are better than RUS-once.Compared with CART, Bagging with CART and Adaboost with CART, the AUC values of RUS-multiple and RUS-replacement increase about 10% on WEBSPAM UK-2006 and about 25% on WEBSPAM UK-2007; compared with several state-of-the-art baseline classification models, RUS-multiple and RUS-replacement achieve the optimal results in AUC value.

    Web spam detection; imbalanced classification; ensemble learning; under-sampling; Classification And Regression Tree (CART)

    2016- 08- 01;

    2016- 08- 22。 基金項(xiàng)目:江西省科技支撐計(jì)劃項(xiàng)目(20131102040039)。

    陳木生(1977—),男,江西于都人,博士研究生,主要研究方向:數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)、信息管理與信息系統(tǒng); 盧曉勇(1957—),男,江西高安人,教授,博士,主要研究方向:信息管理與信息系統(tǒng)、工業(yè)工程。

    1001- 9081(2017)02- 0535- 05

    10.11772/j.issn.1001- 9081.2017.02.0535

    TP391.1; TP393.098; TP181

    A

    猜你喜歡
    小類分類器網(wǎng)頁(yè)
    基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
    電子制作(2018年10期)2018-08-04 03:24:38
    BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
    浙江配電網(wǎng)物資標(biāo)準(zhǔn)化研究與應(yīng)用
    基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
    結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
    網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
    基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
    10個(gè)必知的網(wǎng)頁(yè)設(shè)計(jì)術(shù)語(yǔ)
    小類:年輕人要多努力
    大學(xué)(2008年10期)2008-10-31 12:51:10
    黄色怎么调成土黄色| 国产视频一区二区在线看| 9色porny在线观看| 亚洲avbb在线观看| 狠狠婷婷综合久久久久久88av| 国产深夜福利视频在线观看| 国产精品久久久久久精品电影小说| 在线观看免费高清a一片| 国产单亲对白刺激| 久久九九热精品免费| 叶爱在线成人免费视频播放| 老汉色av国产亚洲站长工具| 亚洲男人天堂网一区| 午夜福利视频在线观看免费| 日本五十路高清| 日韩免费av在线播放| 黄网站色视频无遮挡免费观看| 久久精品亚洲精品国产色婷小说| 久久人人爽av亚洲精品天堂| 久久久久精品国产欧美久久久| 高清在线国产一区| 国产成人一区二区三区免费视频网站| www.熟女人妻精品国产| 狠狠狠狠99中文字幕| 成在线人永久免费视频| 精品久久久久久久毛片微露脸| 亚洲精品粉嫩美女一区| videosex国产| 99国产综合亚洲精品| a级片在线免费高清观看视频| 国产高清激情床上av| 国产真人三级小视频在线观看| 天天躁夜夜躁狠狠躁躁| 999久久久精品免费观看国产| 欧美日韩黄片免| 侵犯人妻中文字幕一二三四区| 超碰成人久久| 精品高清国产在线一区| 亚洲午夜理论影院| 欧美精品av麻豆av| 在线播放国产精品三级| 久久久久国产一级毛片高清牌| 久久性视频一级片| 一夜夜www| 五月开心婷婷网| 99国产精品免费福利视频| av视频免费观看在线观看| 99re在线观看精品视频| 亚洲国产毛片av蜜桃av| 国产精品免费视频内射| 在线 av 中文字幕| 国产免费视频播放在线视频| 黄片播放在线免费| 亚洲avbb在线观看| 亚洲伊人久久精品综合| 精品国产一区二区久久| 亚洲免费av在线视频| 99久久精品国产亚洲精品| 日本wwww免费看| 日本wwww免费看| 高清毛片免费观看视频网站 | 日韩免费av在线播放| 久久午夜综合久久蜜桃| 久久中文看片网| 久久天堂一区二区三区四区| 国产免费av片在线观看野外av| 国产欧美日韩精品亚洲av| 亚洲av电影在线进入| 国产男女超爽视频在线观看| 亚洲九九香蕉| 亚洲av日韩在线播放| 国产精品 国内视频| 啪啪无遮挡十八禁网站| 一区二区三区精品91| 国产av又大| 国产97色在线日韩免费| 成人国语在线视频| 精品久久蜜臀av无| 操美女的视频在线观看| 色综合欧美亚洲国产小说| 国产高清国产精品国产三级| 搡老乐熟女国产| 国产av国产精品国产| 国产成人精品久久二区二区免费| 精品卡一卡二卡四卡免费| 国产亚洲精品一区二区www | 国产日韩一区二区三区精品不卡| av国产精品久久久久影院| 搡老熟女国产l中国老女人| 久久精品国产综合久久久| av电影中文网址| 午夜激情av网站| 亚洲欧美精品综合一区二区三区| 欧美成人午夜精品| 成人特级黄色片久久久久久久 | 黄色 视频免费看| 久久久国产欧美日韩av| 80岁老熟妇乱子伦牲交| 国产欧美日韩精品亚洲av| 国产在线视频一区二区| 美女高潮到喷水免费观看| 黑丝袜美女国产一区| 欧美激情高清一区二区三区| 国产精品久久久久久人妻精品电影 | 国产精品国产av在线观看| 国产伦理片在线播放av一区| 国产男女超爽视频在线观看| 久久免费观看电影| 大香蕉久久成人网| 两人在一起打扑克的视频| 91麻豆av在线| 欧美国产精品一级二级三级| 午夜免费鲁丝| 成年人黄色毛片网站| 久久性视频一级片| 首页视频小说图片口味搜索| 欧美大码av| 国产亚洲精品一区二区www | 欧美激情久久久久久爽电影 | 亚洲三区欧美一区| 好男人电影高清在线观看| 亚洲国产看品久久| 欧美黑人欧美精品刺激| 黄频高清免费视频| 成人手机av| 女人精品久久久久毛片| 国产亚洲午夜精品一区二区久久| 啦啦啦中文免费视频观看日本| 国产成+人综合+亚洲专区| 一级a爱视频在线免费观看| 亚洲 国产 在线| 欧美黑人精品巨大| 女人久久www免费人成看片| 啪啪无遮挡十八禁网站| 在线观看免费午夜福利视频| 精品午夜福利视频在线观看一区 | 老司机深夜福利视频在线观看| 国产亚洲av高清不卡| av线在线观看网站| 男女无遮挡免费网站观看| 亚洲熟妇熟女久久| 精品福利永久在线观看| 国产熟女午夜一区二区三区| 国产精品免费大片| 免费一级毛片在线播放高清视频 | 国产日韩欧美视频二区| 国产亚洲精品第一综合不卡| 欧美黄色片欧美黄色片| 精品久久久久久久毛片微露脸| a级毛片在线看网站| 欧美人与性动交α欧美精品济南到| 午夜老司机福利片| 国产高清国产精品国产三级| 99九九在线精品视频| 国产一区二区三区视频了| 女人高潮潮喷娇喘18禁视频| 久久av网站| 中文字幕人妻丝袜制服| 亚洲熟女精品中文字幕| 亚洲精品国产一区二区精华液| 黄色毛片三级朝国网站| 美女国产高潮福利片在线看| 在线 av 中文字幕| 丝袜在线中文字幕| 国产主播在线观看一区二区| 国产一区二区激情短视频| 中国美女看黄片| 桃花免费在线播放| 精品国产乱子伦一区二区三区| 亚洲av片天天在线观看| 老司机亚洲免费影院| 飞空精品影院首页| 久久狼人影院| 女人久久www免费人成看片| 亚洲黑人精品在线| 视频区图区小说| 精品第一国产精品| 超碰成人久久| 亚洲国产成人一精品久久久| 欧美变态另类bdsm刘玥| 欧美日韩亚洲综合一区二区三区_| 一级,二级,三级黄色视频| 久久精品成人免费网站| 精品一区二区三区四区五区乱码| 国产亚洲欧美精品永久| 看免费av毛片| 老司机在亚洲福利影院| 999久久久国产精品视频| 精品国产一区二区三区四区第35| 人人妻人人澡人人爽人人夜夜| 天堂中文最新版在线下载| 国产黄色免费在线视频| 久久香蕉激情| 在线av久久热| 黄片播放在线免费| 久久久久网色| 亚洲av成人不卡在线观看播放网| 亚洲少妇的诱惑av| 国产不卡一卡二| 天天影视国产精品| 19禁男女啪啪无遮挡网站| 男女边摸边吃奶| 午夜老司机福利片| 亚洲精品国产一区二区精华液| 啦啦啦视频在线资源免费观看| 亚洲欧美日韩另类电影网站| 亚洲少妇的诱惑av| 99精品欧美一区二区三区四区| 天天操日日干夜夜撸| 视频区图区小说| 淫妇啪啪啪对白视频| 久热爱精品视频在线9| 亚洲少妇的诱惑av| 成人亚洲精品一区在线观看| 亚洲人成电影观看| 亚洲欧洲精品一区二区精品久久久| 香蕉久久夜色| 韩国精品一区二区三区| 久久久欧美国产精品| 中文字幕人妻丝袜制服| 如日韩欧美国产精品一区二区三区| 国产黄色免费在线视频| 黄色片一级片一级黄色片| 欧美成人免费av一区二区三区 | 午夜精品久久久久久毛片777| 欧美大码av| 黄色视频在线播放观看不卡| 国产不卡一卡二| cao死你这个sao货| 国产精品亚洲av一区麻豆| netflix在线观看网站| 男人舔女人的私密视频| 少妇被粗大的猛进出69影院| 满18在线观看网站| 99热网站在线观看| 美女福利国产在线| 18禁观看日本| 精品人妻在线不人妻| 中文字幕另类日韩欧美亚洲嫩草| 午夜精品久久久久久毛片777| 青青草视频在线视频观看| 一区二区三区激情视频| 亚洲成人国产一区在线观看| 久久精品成人免费网站| 久久久精品94久久精品| 国产精品一区二区精品视频观看| 日韩 欧美 亚洲 中文字幕| 国产有黄有色有爽视频| 十分钟在线观看高清视频www| 日韩免费高清中文字幕av| 精品亚洲成a人片在线观看| 亚洲精品国产精品久久久不卡| 别揉我奶头~嗯~啊~动态视频| 精品国产乱子伦一区二区三区| 婷婷成人精品国产| 欧美激情 高清一区二区三区| 欧美日韩成人在线一区二区| 久久人人爽av亚洲精品天堂| 日韩一区二区三区影片| 亚洲,欧美精品.| 国产精品av久久久久免费| 精品国产一区二区久久| 丁香六月欧美| 无遮挡黄片免费观看| 亚洲七黄色美女视频| av又黄又爽大尺度在线免费看| 国产精品久久久久成人av| 少妇精品久久久久久久| videosex国产| 国产成人av教育| 亚洲av片天天在线观看| 亚洲精品在线观看二区| 成人免费观看视频高清| 亚洲国产av新网站| av国产精品久久久久影院| 精品国产超薄肉色丝袜足j| 国产主播在线观看一区二区| 久久久久国内视频| 久久青草综合色| 久久人人97超碰香蕉20202| 成人免费观看视频高清| 亚洲国产av新网站| 国产亚洲精品一区二区www | 大型黄色视频在线免费观看| 岛国毛片在线播放| 99热网站在线观看| 不卡av一区二区三区| 丁香欧美五月| 亚洲黑人精品在线| 丰满人妻熟妇乱又伦精品不卡| 麻豆成人av在线观看| 国产不卡av网站在线观看| 国产精品偷伦视频观看了| 久久热在线av| 老汉色∧v一级毛片| 美女高潮到喷水免费观看| 免费观看a级毛片全部| 精品少妇内射三级| 精品亚洲成国产av| 中文字幕人妻丝袜制服| 亚洲avbb在线观看| 欧美成人午夜精品| 亚洲av美国av| 菩萨蛮人人尽说江南好唐韦庄| 日韩免费高清中文字幕av| 午夜福利一区二区在线看| 汤姆久久久久久久影院中文字幕| 国产成人av激情在线播放| 少妇粗大呻吟视频| 国产精品av久久久久免费| 精品欧美一区二区三区在线| 欧美国产精品va在线观看不卡| 国产精品久久久人人做人人爽| 亚洲av国产av综合av卡| 两个人看的免费小视频| 欧美日韩亚洲高清精品| 免费在线观看影片大全网站| 99精品欧美一区二区三区四区| 欧美日韩福利视频一区二区| 丰满少妇做爰视频| 亚洲欧美色中文字幕在线| 电影成人av| 91老司机精品| 欧美+亚洲+日韩+国产| 99精国产麻豆久久婷婷| 欧美成人免费av一区二区三区 | 国产男女内射视频| 欧美日韩av久久| 免费在线观看完整版高清| 一进一出抽搐动态| 色综合婷婷激情| 亚洲第一av免费看| 汤姆久久久久久久影院中文字幕| 国产av国产精品国产| 亚洲美女黄片视频| 久久天躁狠狠躁夜夜2o2o| 国产在线精品亚洲第一网站| 三上悠亚av全集在线观看| 少妇裸体淫交视频免费看高清 | 欧美日韩av久久| 精品一区二区三卡| 丝袜人妻中文字幕| xxxhd国产人妻xxx| 免费黄频网站在线观看国产| 这个男人来自地球电影免费观看| 日日夜夜操网爽| 涩涩av久久男人的天堂| 国产成人精品久久二区二区91| 最新美女视频免费是黄的| 日韩制服丝袜自拍偷拍| 男女之事视频高清在线观看| 久久ye,这里只有精品| 欧美日韩亚洲高清精品| 少妇裸体淫交视频免费看高清 | 亚洲色图综合在线观看| 国产精品影院久久| 久久久久久久久久久久大奶| 亚洲精品av麻豆狂野| 久久久国产欧美日韩av| 欧美亚洲 丝袜 人妻 在线| 免费一级毛片在线播放高清视频 | 老司机影院毛片| 国产精品免费大片| 一边摸一边做爽爽视频免费| 国产免费现黄频在线看| 亚洲欧洲日产国产| 久久婷婷成人综合色麻豆| 黑丝袜美女国产一区| 91大片在线观看| 国产亚洲精品第一综合不卡| 男女边摸边吃奶| 午夜福利视频精品| 在线观看免费视频网站a站| 国产熟女午夜一区二区三区| 不卡av一区二区三区| 中文字幕人妻丝袜一区二区| 少妇的丰满在线观看| 日韩中文字幕欧美一区二区| 色94色欧美一区二区| 一本—道久久a久久精品蜜桃钙片| 亚洲精品av麻豆狂野| 午夜福利视频在线观看免费| 久久人妻福利社区极品人妻图片| 制服诱惑二区| 99国产精品一区二区三区| 国产精品免费一区二区三区在线 | 亚洲九九香蕉| av一本久久久久| 狠狠精品人妻久久久久久综合| 亚洲av电影在线进入| 亚洲精品国产色婷婷电影| 人人妻,人人澡人人爽秒播| 又大又爽又粗| 伊人久久大香线蕉亚洲五| 一个人免费在线观看的高清视频| 国产精品免费大片| www.自偷自拍.com| 视频在线观看一区二区三区| 色播在线永久视频| 午夜福利欧美成人| 日韩有码中文字幕| 一二三四在线观看免费中文在| 亚洲精品美女久久av网站| 欧美中文综合在线视频| 亚洲av成人不卡在线观看播放网| 电影成人av| 成人永久免费在线观看视频 | 亚洲精品国产色婷婷电影| 母亲3免费完整高清在线观看| 99久久99久久久精品蜜桃| 欧美黑人精品巨大| 日韩有码中文字幕| 欧美精品啪啪一区二区三区| 老汉色av国产亚洲站长工具| 2018国产大陆天天弄谢| 18禁观看日本| 久久免费观看电影| 男男h啪啪无遮挡| 国产不卡一卡二| 免费在线观看黄色视频的| 色老头精品视频在线观看| 十八禁网站免费在线| www.精华液| 新久久久久国产一级毛片| 大香蕉久久成人网| 超碰成人久久| 五月开心婷婷网| 国产精品久久电影中文字幕 | 久久 成人 亚洲| 亚洲男人天堂网一区| 欧美另类亚洲清纯唯美| 久久久久久久大尺度免费视频| 久久人妻熟女aⅴ| 久久青草综合色| 午夜福利欧美成人| 国产成人av教育| 久久久久久免费高清国产稀缺| 性色av乱码一区二区三区2| 国产成人av激情在线播放| 国产不卡一卡二| 国产精品秋霞免费鲁丝片| 亚洲三区欧美一区| 最近最新中文字幕大全免费视频| 久久 成人 亚洲| 国产伦理片在线播放av一区| 精品午夜福利视频在线观看一区 | 蜜桃在线观看..| 国产精品二区激情视频| 天天躁狠狠躁夜夜躁狠狠躁| 欧美精品一区二区免费开放| 黄色视频在线播放观看不卡| 99国产综合亚洲精品| 亚洲精品av麻豆狂野| 欧美午夜高清在线| 免费不卡黄色视频| 少妇粗大呻吟视频| 99riav亚洲国产免费| 欧美国产精品va在线观看不卡| 欧美日韩中文字幕国产精品一区二区三区 | 精品人妻在线不人妻| 自拍欧美九色日韩亚洲蝌蚪91| 老汉色∧v一级毛片| 视频在线观看一区二区三区| 一边摸一边抽搐一进一出视频| 国产成人精品在线电影| 国产高清国产精品国产三级| 丁香欧美五月| 国产麻豆69| 国产精品久久久久久精品古装| 纵有疾风起免费观看全集完整版| 精品久久久精品久久久| 欧美黄色片欧美黄色片| 国产激情久久老熟女| 99国产极品粉嫩在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 97人妻天天添夜夜摸| 久久人妻熟女aⅴ| 99九九在线精品视频| 欧美日本中文国产一区发布| 在线播放国产精品三级| 国产淫语在线视频| 国产97色在线日韩免费| 丰满迷人的少妇在线观看| 国产精品久久久av美女十八| 老司机午夜十八禁免费视频| 免费在线观看影片大全网站| 亚洲五月婷婷丁香| 黄色视频在线播放观看不卡| 精品免费久久久久久久清纯 | 久久精品国产综合久久久| 五月开心婷婷网| 亚洲色图综合在线观看| 91精品三级在线观看| 男女高潮啪啪啪动态图| 国产精品香港三级国产av潘金莲| 亚洲精品乱久久久久久| 天天躁夜夜躁狠狠躁躁| 69精品国产乱码久久久| 亚洲三区欧美一区| 中亚洲国语对白在线视频| 黄色视频在线播放观看不卡| 久久久久久久久久久久大奶| 757午夜福利合集在线观看| 黄色视频,在线免费观看| 国产免费视频播放在线视频| 在线天堂中文资源库| 啦啦啦中文免费视频观看日本| 亚洲精品美女久久久久99蜜臀| 人人澡人人妻人| 欧美老熟妇乱子伦牲交| 多毛熟女@视频| 人妻 亚洲 视频| 2018国产大陆天天弄谢| 国产又色又爽无遮挡免费看| 精品久久蜜臀av无| 欧美av亚洲av综合av国产av| 日本wwww免费看| 日本五十路高清| 性少妇av在线| 色在线成人网| 欧美黄色淫秽网站| 极品少妇高潮喷水抽搐| 一区二区av电影网| 黑人巨大精品欧美一区二区蜜桃| 热99re8久久精品国产| 丝瓜视频免费看黄片| 在线观看免费午夜福利视频| 狠狠精品人妻久久久久久综合| 精品熟女少妇八av免费久了| 亚洲三区欧美一区| 久久精品亚洲av国产电影网| 日本黄色视频三级网站网址 | 后天国语完整版免费观看| 欧美日韩黄片免| 欧美人与性动交α欧美精品济南到| 成人av一区二区三区在线看| 国产熟女午夜一区二区三区| 欧美日韩亚洲高清精品| 精品国产乱码久久久久久小说| 国产欧美日韩一区二区三区在线| 99香蕉大伊视频| www.自偷自拍.com| 一区二区av电影网| 99国产极品粉嫩在线观看| 国产成人免费观看mmmm| 天天躁狠狠躁夜夜躁狠狠躁| 欧美成人免费av一区二区三区 | 国产一区二区三区视频了| 日本av免费视频播放| 老司机靠b影院| 无人区码免费观看不卡 | 精品久久久久久电影网| 99国产极品粉嫩在线观看| 成人国语在线视频| 国产又爽黄色视频| 色综合欧美亚洲国产小说| 国产又色又爽无遮挡免费看| 国产亚洲午夜精品一区二区久久| 在线观看一区二区三区激情| 日韩中文字幕视频在线看片| 亚洲欧美色中文字幕在线| 亚洲avbb在线观看| 两个人免费观看高清视频| 国产男女内射视频| 国产免费av片在线观看野外av| 男女高潮啪啪啪动态图| 亚洲男人天堂网一区| 免费在线观看日本一区| 亚洲久久久国产精品| 丁香六月欧美| 欧美黄色片欧美黄色片| 中文字幕av电影在线播放| 国产成人精品在线电影| 久久精品亚洲精品国产色婷小说| 狠狠狠狠99中文字幕| 国产精品1区2区在线观看. | 99精品欧美一区二区三区四区| 成人影院久久| 国产高清激情床上av| 久久久国产成人免费| 757午夜福利合集在线观看| 成年人免费黄色播放视频| 婷婷丁香在线五月| 三上悠亚av全集在线观看| 一级片免费观看大全| 亚洲av片天天在线观看| 欧美激情 高清一区二区三区| 成人国语在线视频| 91字幕亚洲| 别揉我奶头~嗯~啊~动态视频| 三上悠亚av全集在线观看| 三级毛片av免费| 少妇精品久久久久久久| 一级片'在线观看视频| 在线永久观看黄色视频| 久久热在线av| 女人久久www免费人成看片| 亚洲中文日韩欧美视频| 亚洲欧美一区二区三区黑人| 亚洲专区国产一区二区| 欧美精品人与动牲交sv欧美| 亚洲中文字幕日韩| 久久久国产成人免费| 男女午夜视频在线观看| 精品欧美一区二区三区在线| 他把我摸到了高潮在线观看 | 一区二区日韩欧美中文字幕| 91大片在线观看| 日韩三级视频一区二区三区| 女人爽到高潮嗷嗷叫在线视频| 国产成人精品久久二区二区91| 国产日韩欧美视频二区| 操出白浆在线播放| 亚洲国产毛片av蜜桃av| 国产成人啪精品午夜网站|