• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于擬合特征分布的垃圾網(wǎng)頁(yè)檢測(cè)方法

    2013-09-11 03:20:52張化祥
    關(guān)鍵詞:決策樹網(wǎng)頁(yè)比例

    劉 陽(yáng),張化祥

    (1.山東師范大學(xué) 信息科學(xué)與工程學(xué)院,山東 濟(jì)南250014;2.山東省分布式計(jì)算機(jī)軟件新技術(shù)重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南250014)

    0 引 言

    信息檢索 (IR)[1]是幫助用戶找到與需求相匹配的信息。由于網(wǎng)絡(luò)包含驚人的信息,用戶通常通過搜索引擎查詢有用的網(wǎng)頁(yè)。給定一個(gè)查詢,搜索引擎可識(shí)別在網(wǎng)絡(luò)上的相關(guān)網(wǎng)頁(yè)和鏈接,一旦用戶看到相關(guān)的鏈接,可以點(diǎn)擊一個(gè)或多個(gè)鏈接以訪問頁(yè)面。研究表明[2],80%的搜索引擎使用者查看返回結(jié)果不超過三頁(yè),因此在搜索引擎返回結(jié)果中,排名越高帶來的利潤(rùn)越大,很多網(wǎng)頁(yè)通過欺騙搜索引擎的手段獲得較高的排名,這類網(wǎng)頁(yè)被稱為垃圾網(wǎng)頁(yè)[3]。垃圾網(wǎng)頁(yè)損害搜索引擎的聲譽(yù),削弱了其用戶對(duì)搜索引擎的信任,檢測(cè)垃圾網(wǎng)頁(yè)已是搜索引擎面臨的重大的挑戰(zhàn)之一。

    目前垃圾網(wǎng)頁(yè)的作弊方法主要分為3種:第一種是基于網(wǎng)頁(yè)內(nèi)容的作弊方法,主要作弊手段為重復(fù)重要的關(guān)鍵詞和堆砌大量不相關(guān)的關(guān)鍵詞。通過分析正常網(wǎng)頁(yè)與垃圾網(wǎng)頁(yè)的內(nèi)容特征可以檢測(cè)出基于內(nèi)容作弊的垃圾網(wǎng)頁(yè),例如文獻(xiàn) [4]中分析網(wǎng)頁(yè)內(nèi)容特征文本單詞數(shù)量、網(wǎng)頁(yè)標(biāo)題字?jǐn)?shù)、錨文本比例等分布信息,利用決策樹分類器進(jìn)行分類;第二種作弊方法基于網(wǎng)頁(yè)鏈接結(jié)構(gòu),垃圾網(wǎng)頁(yè)通過添加多余的網(wǎng)頁(yè)鏈接或誤導(dǎo)其他網(wǎng)頁(yè)鏈接指向它以此欺騙搜索引擎的排序算法。PageRank算法[5,6]是著名的網(wǎng)頁(yè)排序算法,PageRank算法根據(jù)網(wǎng)頁(yè)之間互相鏈接的貢獻(xiàn)值對(duì)網(wǎng)頁(yè)進(jìn)行排名。越重要的網(wǎng)頁(yè)得分越高,排名越靠前。Wang等[7]介紹了一種新的頁(yè)面排序算法DirichletRank,解決了PageRank算法的zero-one gap問題;Caverlee等[8]利 用頁(yè)面信任得分改進(jìn)HIST算法對(duì)基于鏈接作弊的垃圾網(wǎng)頁(yè)進(jìn)行檢測(cè);Gyongyi[9]提出了一種基于初始信任種子集合的信任傳播模式,經(jīng)過多次傳播之后每一個(gè)網(wǎng)頁(yè)產(chǎn)生一個(gè)信任值,根據(jù)信任值的大小對(duì)網(wǎng)頁(yè)排序檢測(cè)垃圾網(wǎng)頁(yè)。Jacob等[10]則使用了基于網(wǎng)絡(luò)圖的正則化對(duì)垃圾網(wǎng)頁(yè)進(jìn)行檢測(cè);第三種作弊方法為隱藏技術(shù),垃圾網(wǎng)頁(yè)通過隱藏垃圾句子、關(guān)鍵詞和鏈接達(dá)到作弊目的。一個(gè)簡(jiǎn)單的方法是使垃圾關(guān)鍵詞的顏色與背景色相同,垃圾網(wǎng)頁(yè)還可以為用戶和網(wǎng)絡(luò)爬蟲提供不同的HTML文件達(dá)到隱藏的目的。

    基于內(nèi)容特征的垃圾網(wǎng)頁(yè)檢測(cè)方法只考慮了網(wǎng)頁(yè)的文本內(nèi)容特征,沒有考慮網(wǎng)頁(yè)的鏈接結(jié)構(gòu),很難適應(yīng)不斷發(fā)展的網(wǎng)頁(yè)作弊技術(shù),而基于鏈接結(jié)構(gòu)的垃圾網(wǎng)頁(yè)檢測(cè)方法則忽略了網(wǎng)頁(yè)的內(nèi)容信息,如果只考慮網(wǎng)頁(yè)的拓?fù)浣Y(jié)構(gòu),很難檢測(cè)出那些拓?fù)浣Y(jié)構(gòu)與正常網(wǎng)頁(yè)十分相似的垃圾網(wǎng)頁(yè)。文獻(xiàn) [11]提出將內(nèi)容特征與鏈接信息結(jié)合起來建立分類器垃圾網(wǎng)頁(yè)檢測(cè)。在文獻(xiàn) [11]中,通過對(duì)數(shù)據(jù)集的統(tǒng)計(jì)分析,根據(jù)正常網(wǎng)頁(yè)與垃圾網(wǎng)頁(yè)內(nèi)容特征與鏈接特征分布的差異利用決策樹對(duì)垃圾網(wǎng)頁(yè)進(jìn)行檢測(cè)。對(duì)于某一特征,如果網(wǎng)頁(yè)的特征值小于閾值,決策樹將網(wǎng)頁(yè)判定為垃圾網(wǎng)頁(yè),因此特征值小于閾值的正常網(wǎng)頁(yè)被誤判為垃圾網(wǎng)頁(yè)。為了減少將正常網(wǎng)頁(yè)誤判為垃圾網(wǎng)頁(yè)的錯(cuò)誤率,本文在分析數(shù)據(jù)集網(wǎng)頁(yè)特征分布的基礎(chǔ)上,用各種分布函數(shù)擬合網(wǎng)頁(yè)的特征分布,根據(jù)網(wǎng)頁(yè)特征值與擬合函數(shù)的差值利用決策樹檢測(cè)垃圾網(wǎng)頁(yè)。在后面的數(shù)據(jù)集網(wǎng)頁(yè)特征分析中,我們可以看到正常網(wǎng)頁(yè)的特征分布比較有規(guī)律,而垃圾網(wǎng)頁(yè)的特征分布混亂,因此用分布函數(shù)擬合之后求差值,正常網(wǎng)頁(yè)差值較小而垃圾網(wǎng)頁(yè)差值較大。

    1 數(shù)據(jù)集

    本文采用的數(shù)據(jù)集是由yahoo實(shí)驗(yàn)室發(fā)布的UK-2007[12]。志愿者標(biāo)注集合標(biāo)記為主機(jī)級(jí)別,其中,主機(jī)名被人工標(biāo)注為三類: “non-spam”、 “spam”、 “undecided”。標(biāo)記為主機(jī)而非單個(gè)頁(yè)面的好處是能夠獲得一個(gè)大的覆蓋范圍,這意味著樣例包含了各種各樣的垃圾網(wǎng)頁(yè)以及它們之間有用的鏈接信息。我們只選取了 “non-spam”與 “spam”作為數(shù)據(jù)集用例。標(biāo)記數(shù)據(jù)集共有5797個(gè)數(shù)據(jù),其中spam 321個(gè),non-spam 5476個(gè)。spam與non-spam比例為1∶17。

    2 網(wǎng)頁(yè)內(nèi)容特征

    2.1 文本單詞數(shù)量

    網(wǎng)頁(yè)內(nèi)容與查詢關(guān)鍵詞的匹配程度通常作為網(wǎng)頁(yè)排名的一個(gè)重要因素。垃圾網(wǎng)頁(yè)堆砌大量的流行關(guān)鍵詞,因此在查詢時(shí)可以匹配上很多關(guān)鍵詞,排名就會(huì)靠前。本文統(tǒng)計(jì)了數(shù)據(jù)集中正常網(wǎng)頁(yè)與垃圾網(wǎng)頁(yè)的文本單詞數(shù)量特征分布,結(jié)果如圖1和圖2所示。

    在圖1與圖2中我們可以看出垃圾網(wǎng)頁(yè)與正常網(wǎng)頁(yè)的文本單詞數(shù)量均在0-50之間所占比例最多。在圖2中,84.7%的正常網(wǎng)頁(yè)的文本單詞數(shù)量小于500,只有3.06%的正常網(wǎng)頁(yè)的文本單詞數(shù)量大于1000,而由于堆砌大量流行關(guān)鍵詞,在圖1中超過7.5%的垃圾網(wǎng)頁(yè)文本單詞數(shù)量大于1000。正常網(wǎng)頁(yè)的文本單詞數(shù)量分布在100之后近似指數(shù)分布,垃圾網(wǎng)頁(yè)分布散亂沒有規(guī)律。我們用指數(shù)分布擬合正常網(wǎng)頁(yè)的文本單詞數(shù)量,指數(shù)分布的密度函數(shù)為

    式中:λ——指數(shù)分布的參數(shù),θ——權(quán)重,控制p(x)的值。由于文本單詞數(shù)量值過大,所以將文本單詞數(shù)量x值除以1000。經(jīng)過實(shí)驗(yàn)測(cè)試,λ=3.6,θ=4.5時(shí)能夠很好的擬合正常網(wǎng)頁(yè)文本單詞數(shù)量分布。,由于正常網(wǎng)頁(yè)文本單詞數(shù)量分布近似指數(shù)分布,所以網(wǎng)頁(yè)比例與指數(shù)分布的差值較小,而垃圾網(wǎng)頁(yè)的文本單詞數(shù)量分布散亂,差值較大,因此我們把文本單詞數(shù)量網(wǎng)頁(yè)比例與指數(shù)分布概率密度函數(shù)的差值ω作為決策樹的一個(gè)閾值。差值計(jì)算公式為

    式中:y(x)——網(wǎng)頁(yè)文本單詞數(shù)量為x時(shí)網(wǎng)頁(yè)所占的比例。

    2.2 網(wǎng)頁(yè)標(biāo)題單詞數(shù)量

    搜索引擎查詢結(jié)果時(shí)根據(jù)網(wǎng)頁(yè)標(biāo)題中出現(xiàn)的關(guān)鍵詞返回結(jié)果,一些搜索引擎對(duì)標(biāo)題中出現(xiàn)的查詢關(guān)鍵詞給予額外的權(quán)重,所以出現(xiàn)了網(wǎng)頁(yè)標(biāo)題中的關(guān)鍵詞堆砌。正常網(wǎng)頁(yè)標(biāo)題單詞數(shù)量分布與垃圾網(wǎng)頁(yè)標(biāo)題單詞數(shù)量分布如圖3和圖4所示。

    由圖3和圖4可知,正常網(wǎng)頁(yè)與垃圾網(wǎng)頁(yè)的標(biāo)題字?jǐn)?shù)為2時(shí)所占比例最多,網(wǎng)頁(yè)所占比例均為13.7%,正常網(wǎng)頁(yè)中標(biāo)題字?jǐn)?shù)大于15的網(wǎng)頁(yè)所占比例為4.10%,而垃圾網(wǎng)頁(yè)為了獲得較高的排名,在網(wǎng)頁(yè)標(biāo)題中惡意填充或者大量重復(fù)目標(biāo)關(guān)鍵詞,網(wǎng)頁(yè)標(biāo)題字?jǐn)?shù)大于15的網(wǎng)頁(yè)所占比例高達(dá)10.40%。正常網(wǎng)頁(yè)標(biāo)題字?jǐn)?shù)大于2時(shí),其網(wǎng)頁(yè)比例分布近似正態(tài)分布,而垃圾網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題分布沒有規(guī)律。正態(tài)分布的概率密度函數(shù)為

    式中:μ——服從正態(tài)分布的隨機(jī)變量的均值,σ——隨機(jī)變量的標(biāo)準(zhǔn)差。經(jīng)過實(shí)驗(yàn)測(cè)試μ=4,σ=3.96時(shí)函數(shù)擬合正常網(wǎng)頁(yè)標(biāo)題字?jǐn)?shù)分布最佳。我們同樣計(jì)算網(wǎng)頁(yè)標(biāo)題字?jǐn)?shù)特征分布函數(shù)與網(wǎng)頁(yè)比例的差值作為決策樹的閾值之一。

    2.3 網(wǎng)頁(yè)壓縮率

    如果一個(gè)網(wǎng)頁(yè)多次包含同一查詢關(guān)鍵詞,搜索引擎將對(duì)此網(wǎng)頁(yè)給予較高的排名。例如,對(duì)于給定的一個(gè)查詢關(guān)鍵詞,出現(xiàn)十次的網(wǎng)頁(yè)要比只出現(xiàn)一次的網(wǎng)頁(yè)排名高。壓縮比指未壓縮的網(wǎng)頁(yè)與壓縮之后的網(wǎng)頁(yè)的比值。數(shù)據(jù)集中正常網(wǎng)頁(yè)與垃圾網(wǎng)頁(yè)的網(wǎng)頁(yè)壓縮率分布如圖5和圖6所示。

    通過圖5與圖6的對(duì)比可以發(fā)現(xiàn)正常網(wǎng)頁(yè)與垃圾網(wǎng)頁(yè)的壓縮率均在2.1-2.2之間網(wǎng)頁(yè)比例最大,所占比例分別為12.39%和14.5%。正常網(wǎng)頁(yè)壓縮率大于2.8的網(wǎng)頁(yè)比例驟減,比例為6.0%,而垃圾網(wǎng)頁(yè)壓縮率大于2.8的網(wǎng)頁(yè)所占比例為14.5%,遠(yuǎn)遠(yuǎn)高于正常網(wǎng)頁(yè),正常網(wǎng)頁(yè)壓縮率的網(wǎng)頁(yè)比例在最高峰之前遞增而在最高峰之后遞減近似泊松分布,泊松分布的概率分布列為

    其中參數(shù)ε>0。k的取值為網(wǎng)頁(yè)壓縮率除以0.2之后的整數(shù)部分,ε=10,δ=80時(shí)能夠較好的擬合正常網(wǎng)頁(yè)壓縮率的分布。

    為了提供更相關(guān)的搜索結(jié)果,一些搜索引擎提供網(wǎng)頁(yè)中HTML元素的信息,例如,網(wǎng)頁(yè)內(nèi)容的注釋,分配給圖像的ALT屬性,標(biāo)題中META標(biāo)簽,這些元素被用于提示網(wǎng)頁(yè)或圖片的性質(zhì),但卻被垃圾網(wǎng)頁(yè)當(dāng)作可視目標(biāo)作為關(guān)鍵詞堆砌。因此我們分析了可視文本比例的分布。網(wǎng)頁(yè)中一個(gè)鏈接的錨文本用來對(duì)目標(biāo)網(wǎng)頁(yè)的內(nèi)容注釋,例如一個(gè)網(wǎng)頁(yè)A有一個(gè)錨文本為 “電腦”的鏈接指向B,我們可以認(rèn)為網(wǎng)頁(yè)B的內(nèi)容與 “電腦”有關(guān),盡管網(wǎng)頁(yè)B的關(guān)鍵詞沒有 “電腦”。有的垃圾網(wǎng)頁(yè)僅僅是為其他頁(yè)面提供錨文本,因此我們計(jì)算錨文本比例的分布。我們一共分析了包括平均單詞長(zhǎng)度、語料庫(kù)前100精確度等在內(nèi)的24個(gè)網(wǎng)頁(yè)內(nèi)容特征分布,并用近似的分布函數(shù)擬合求差值。

    3 網(wǎng)頁(yè)鏈接特征

    3.1 PageRank值

    PageRank算法根據(jù)網(wǎng)頁(yè)之間互相鏈接的貢獻(xiàn)值對(duì)網(wǎng)頁(yè)進(jìn)行排名。越重要的網(wǎng)頁(yè)得分越高,排名越靠前,而那些垃圾網(wǎng)頁(yè)往往得分較低。PageRank值的計(jì)算公式為

    式中:α——衰減系數(shù),r(q)——網(wǎng)頁(yè)q的PageRank值,o(q)——網(wǎng)頁(yè)q的出度。網(wǎng)頁(yè)p的分?jǐn)?shù)由兩部分組成:一部分來源于那些指向網(wǎng)頁(yè)p的網(wǎng)頁(yè),另一部分是全部網(wǎng)頁(yè)對(duì)p所做的貢獻(xiàn)。對(duì)于所有的網(wǎng)頁(yè),其PageRank值計(jì)算方式為

    其中T為整個(gè)網(wǎng)絡(luò)圖的躍遷矩陣。T的計(jì)算方法為

    式中:o(p)——網(wǎng)頁(yè)p的出度,(p,q)——網(wǎng)頁(yè)p和網(wǎng)頁(yè)q之間是否存在鏈接關(guān)系。

    3.2 TrustRank值

    TrustRank算法在PageRank算法的基礎(chǔ)上利用信任傳播的方式對(duì)每一個(gè)網(wǎng)頁(yè)賦值一個(gè)信任值,根據(jù)信任值的大小對(duì)網(wǎng)頁(yè)進(jìn)行排名。TrustRank算法首先人工選擇好的網(wǎng)頁(yè)作為種子集合,并賦初始值,然后在web圖中以信任衰減或信任分裂的方式傳播直至圖中每一個(gè)網(wǎng)頁(yè)都有一個(gè)信任值。TrustRank算法認(rèn)為如果一個(gè)網(wǎng)頁(yè)有較高的PageR-ank值但是沒有被好的網(wǎng)頁(yè)指向,則這個(gè)網(wǎng)頁(yè)很有可能是垃圾網(wǎng)頁(yè)。TrustRank值計(jì)算公式為

    式中:β——衰減因子 (通常取值為0.85),T——web圖的躍遷矩陣,d——種子集合中好網(wǎng)頁(yè)的初始信任值。由于式(8)收斂,所以經(jīng)過n(通常取值為20)次迭代后,TR值即為web圖中網(wǎng)頁(yè)的信任值。

    通過計(jì)算web圖中的網(wǎng)頁(yè)鏈接結(jié)構(gòu)得到網(wǎng)頁(yè)的PageR-ank值與TrustRank值。網(wǎng)頁(yè)的PageRank值和TrustRank值越大,表示該網(wǎng)頁(yè)是正常網(wǎng)頁(yè)的概率越大,因此我們直接把PageRank值與TrustRank值作為決策樹的閾值,PageRank值與TrustRank值小于閾值的網(wǎng)頁(yè)判定為垃圾網(wǎng)頁(yè)。我們還考慮了數(shù)據(jù)集中主機(jī)的入度、出度、與鄰居的距離等21個(gè)網(wǎng)頁(yè)鏈接特征分布,用分布函數(shù)擬合并計(jì)算差值。

    4 實(shí)驗(yàn)結(jié)果

    4.1 度量標(biāo)準(zhǔn)

    為了檢測(cè)實(shí)驗(yàn)結(jié)果,我們使用web spam的準(zhǔn)確率、召回率和F值作為實(shí)驗(yàn)結(jié)果的衡量標(biāo)準(zhǔn)。

    表1中,TP表示垃圾網(wǎng)頁(yè)被正確分類的網(wǎng)頁(yè)比例,TN表示垃圾網(wǎng)頁(yè)被錯(cuò)分為正常網(wǎng)頁(yè)的比例,F(xiàn)P表示正常網(wǎng)頁(yè)被誤分為垃圾網(wǎng)頁(yè)的比例,F(xiàn)N表示正常網(wǎng)頁(yè)被正確分類的比例。

    準(zhǔn)確率是指預(yù)測(cè)的垃圾網(wǎng)頁(yè)中真實(shí)垃圾網(wǎng)頁(yè)的比例,準(zhǔn)確率越大,算法將正常網(wǎng)頁(yè)誤判為垃圾網(wǎng)頁(yè)的概率就越小

    表1 度量單位定義

    召回率是指真實(shí)垃圾網(wǎng)頁(yè)中預(yù)測(cè)正確的比例

    F值實(shí)際上是準(zhǔn)確率和召回率的調(diào)和平均,它將準(zhǔn)確率和召回率綜合為一個(gè)指標(biāo)

    4.2 實(shí)驗(yàn)結(jié)果及分析

    我們使用的分類方法為C4.5決策樹。C4.5決策樹分類算法的工作原理如下:給定該算法的數(shù)據(jù)集和數(shù)據(jù)集特征,C4.5決策樹創(chuàng)建一個(gè)類似流程圖的樹結(jié)構(gòu)。樹的每個(gè)內(nèi)部接點(diǎn)對(duì)應(yīng)一個(gè)特定特征的值的測(cè)試,并且該接點(diǎn)的每個(gè)后繼分支對(duì)應(yīng)該特征的一個(gè)可能值,樹葉即為對(duì)應(yīng)的分類結(jié)果。對(duì)于每一個(gè)內(nèi)部節(jié)點(diǎn),C4.5決策樹用基于信息增益的熵挑選特征,能夠越好的分離訓(xùn)練樣例的特征 (即分離后的類熵越?。┓旁跇渲械奈恢迷礁?。

    為了訓(xùn)練C4.5決策樹,本文采用十折交叉驗(yàn)證方法。十折交叉驗(yàn)證算法將數(shù)據(jù)集隨機(jī)的分為十等份,并執(zhí)行十次訓(xùn)練、測(cè)試步驟,其中每次步驟使用九份作為訓(xùn)練數(shù)據(jù)集,剩余的一份作為測(cè)試數(shù)據(jù)集。最后取十次測(cè)試結(jié)果的平均值作為實(shí)驗(yàn)結(jié)果。

    通過使用C4.5決策樹和十折交叉驗(yàn)證算法對(duì)網(wǎng)頁(yè)的每一個(gè)特征測(cè)試,實(shí)驗(yàn)顯示用指數(shù)函數(shù)擬合文本單詞數(shù)量分布的效果最好,圖7為閾值的選擇與實(shí)驗(yàn)結(jié)果的關(guān)系。

    圖7 閾值的選擇與實(shí)驗(yàn)結(jié)果

    當(dāng)文本單詞數(shù)量分布與網(wǎng)頁(yè)比例差值選擇為1.4時(shí)準(zhǔn)確率最高,為0.662,能夠識(shí)別33.9%的垃圾網(wǎng)頁(yè),誤分頁(yè)面為17.4%。

    使用上述所有特征后,C4.5決策樹的準(zhǔn)確率為0.928,召回率為0.579,F(xiàn)值為0.713。

    5 結(jié)束語

    本文通過分析數(shù)據(jù)集中網(wǎng)頁(yè)內(nèi)容特征與鏈接特征的分布,用近似的分布函數(shù)對(duì)其擬合并計(jì)算差值,使用C4.5決策樹和十折交叉驗(yàn)證算法根據(jù)差值對(duì)垃圾網(wǎng)頁(yè)進(jìn)行檢測(cè)。實(shí)驗(yàn)結(jié)果表明,使用分布函數(shù)擬合網(wǎng)頁(yè)特征分布能夠減少被錯(cuò)誤分類的正常網(wǎng)頁(yè),提高準(zhǔn)確率。下一步的工作是進(jìn)一步結(jié)合更多的網(wǎng)頁(yè)內(nèi)容特征分布和鏈接特征分布,以期獲得更好的檢測(cè)結(jié)果。

    [1]Bing Liu.Web data mining:Exploring hyperlinks,contents,and usage data[M].Berlin,Heidelberg:Springer-Verlag,2007.

    [2]Janden B,Spink A.An analysis of web documents retrieved and viewed [C]// The 4th International Conference on Internet Computing,2003:65-69.

    [3]Metaxas P T.On the evolution of search engine rankings[C]//Proceedings of the WEBIST Conference,2009.

    [4]Ntoulasa M,Najork M Manasse.Detecting spam WebPages through content analysis [C]//Proceedings of the 15th International Conference on World Wide Web.New York:ACM,2006:83-92.

    [5]Lin Yiqin,Shi Xinghua.On computing PageRank via lumping the google matrix [J].Journal of Computational and Applied Mathematics,2009,224 (2):702-708.

    [6]Oren K T,Lillian L,Cornell U.PageRank without hyperlinks:Structural reranking using links induced by language models[J].ACM Transactions on Information Systems,2010,28(4):18.

    [7]Wang X,Tao T,Sun J T,et al.DirichletRank:Solving the zeroone gap problem of PageRank [J].ACM Transactions on Information System,2008,26 (2):10.

    [8]Asano Y,Tezuka Y,Nishizeki T.Improvements of HITS algorithms for spam links [G].LNCS 4505:APWeb/WAIM,2007:479-496.

    [9]Gyongyi Z,Molina H G,Pedersen J.Combating web spam with TrustRank[C]//Proceedings of the 30th VLDB Conference.ACM Press,2004:576-587.

    [10]Jacob Abernethy,Olivier Chapelle.Graph regularization methods for Web spam decetion [J].Mach Learn,2010,81 (2):207-225.

    [11]Carlos Castillo,Debora Donato,Aristides Gionis,et al.Know your neighbors:Web spam detection using the web topology[C]//Proceedings of the 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2007.

    [12]Yahoo.Research:Web spam collections[EB/OL].http://Barcelona.research.yahoo.net/web spam/datasets/,2007.

    猜你喜歡
    決策樹網(wǎng)頁(yè)比例
    人體比例知多少
    一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
    決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
    電子制作(2018年10期)2018-08-04 03:24:38
    基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    基于決策樹的出租車乘客出行目的識(shí)別
    按事故責(zé)任比例賠付
    紅土地(2016年7期)2016-02-27 15:05:54
    網(wǎng)頁(yè)制作在英語教學(xué)中的應(yīng)用
    基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
    限制支付比例只是治標(biāo)
    欧美日韩亚洲高清精品| 啦啦啦 在线观看视频| 国产亚洲精品久久久久5区| 如日韩欧美国产精品一区二区三区| 少妇的丰满在线观看| xxx96com| 精品一区二区三区视频在线观看免费 | 国产精品免费大片| 日韩免费高清中文字幕av| 黄色 视频免费看| 他把我摸到了高潮在线观看| 欧美在线一区亚洲| 熟女少妇亚洲综合色aaa.| 在线观看舔阴道视频| 三上悠亚av全集在线观看| 美女高潮喷水抽搐中文字幕| 欧美日韩视频精品一区| 欧美大码av| 国产乱人伦免费视频| 国产亚洲精品第一综合不卡| 亚洲av日韩精品久久久久久密| 波多野结衣一区麻豆| 9色porny在线观看| 亚洲三区欧美一区| 在线免费观看的www视频| 中国美女看黄片| 欧美日韩亚洲国产一区二区在线观看 | 丝袜在线中文字幕| 捣出白浆h1v1| 久99久视频精品免费| 91老司机精品| 美女视频免费永久观看网站| 欧美黑人欧美精品刺激| 国产av又大| 91大片在线观看| 黄色成人免费大全| 一a级毛片在线观看| 免费女性裸体啪啪无遮挡网站| 热99re8久久精品国产| 脱女人内裤的视频| 日韩欧美国产一区二区入口| 国内毛片毛片毛片毛片毛片| 精品久久蜜臀av无| 午夜激情av网站| av在线播放免费不卡| 天堂中文最新版在线下载| 99热网站在线观看| 国产精品乱码一区二三区的特点 | 亚洲精品国产区一区二| av有码第一页| 99久久国产精品久久久| 亚洲一区二区三区不卡视频| 色在线成人网| 男女下面插进去视频免费观看| 国产真人三级小视频在线观看| 欧美激情高清一区二区三区| 成熟少妇高潮喷水视频| 水蜜桃什么品种好| 宅男免费午夜| 精品熟女少妇八av免费久了| 亚洲欧美一区二区三区久久| 国产又色又爽无遮挡免费看| 国产成人影院久久av| 国产高清国产精品国产三级| 免费在线观看影片大全网站| 久久久久久久久久久久大奶| 国产高清videossex| av免费在线观看网站| 久久精品国产亚洲av香蕉五月 | 999久久久精品免费观看国产| 久久精品熟女亚洲av麻豆精品| 亚洲av熟女| 91麻豆av在线| 久久香蕉精品热| 在线免费观看的www视频| 中文欧美无线码| 久久久久久久久免费视频了| www.自偷自拍.com| 黄频高清免费视频| av片东京热男人的天堂| 成人永久免费在线观看视频| 日韩精品免费视频一区二区三区| 18禁裸乳无遮挡免费网站照片 | 成年动漫av网址| 夜夜爽天天搞| 最新美女视频免费是黄的| 国产亚洲av高清不卡| 亚洲第一青青草原| 欧美精品一区二区免费开放| 亚洲成人手机| 国产日韩欧美亚洲二区| cao死你这个sao货| 久久热在线av| 中文字幕制服av| 欧美日韩中文字幕国产精品一区二区三区 | 精品亚洲成a人片在线观看| 99国产综合亚洲精品| 18禁裸乳无遮挡动漫免费视频| 免费在线观看视频国产中文字幕亚洲| 国产高清激情床上av| 免费看十八禁软件| 日日爽夜夜爽网站| 天天躁狠狠躁夜夜躁狠狠躁| 午夜福利在线观看吧| 制服人妻中文乱码| 午夜精品国产一区二区电影| 狠狠婷婷综合久久久久久88av| 自拍欧美九色日韩亚洲蝌蚪91| 9热在线视频观看99| 一区二区日韩欧美中文字幕| 久久久国产成人免费| 少妇猛男粗大的猛烈进出视频| 婷婷精品国产亚洲av在线 | 亚洲成人免费电影在线观看| 国产一区二区三区综合在线观看| 亚洲成国产人片在线观看| 热99国产精品久久久久久7| 午夜福利欧美成人| 国产av又大| 99国产精品99久久久久| 亚洲国产看品久久| 十八禁人妻一区二区| 人妻丰满熟妇av一区二区三区 | a级毛片在线看网站| 中文字幕最新亚洲高清| www.自偷自拍.com| 亚洲五月天丁香| 久久热在线av| 亚洲成人免费av在线播放| 亚洲一码二码三码区别大吗| 黄色丝袜av网址大全| 黑人巨大精品欧美一区二区mp4| 人妻一区二区av| 99热国产这里只有精品6| 91在线观看av| 91麻豆精品激情在线观看国产 | 亚洲精品av麻豆狂野| 韩国精品一区二区三区| 电影成人av| 丰满人妻熟妇乱又伦精品不卡| 亚洲专区国产一区二区| 欧美日韩中文字幕国产精品一区二区三区 | avwww免费| 高清毛片免费观看视频网站 | 热99国产精品久久久久久7| 国产av一区二区精品久久| 中文欧美无线码| 少妇猛男粗大的猛烈进出视频| 无遮挡黄片免费观看| 久久亚洲真实| 一级毛片高清免费大全| 午夜福利一区二区在线看| 18禁裸乳无遮挡免费网站照片 | 人妻一区二区av| 国产国语露脸激情在线看| 亚洲一区二区三区不卡视频| 高清视频免费观看一区二区| 免费不卡黄色视频| 在线观看免费视频日本深夜| 亚洲中文av在线| 精品久久蜜臀av无| 悠悠久久av| 国产av精品麻豆| 国产精品免费大片| 婷婷精品国产亚洲av在线 | 每晚都被弄得嗷嗷叫到高潮| 男女下面插进去视频免费观看| 欧美久久黑人一区二区| 久久久国产欧美日韩av| 久久九九热精品免费| 成人精品一区二区免费| 1024香蕉在线观看| 久久这里只有精品19| 色婷婷久久久亚洲欧美| 在线天堂中文资源库| 十分钟在线观看高清视频www| 777久久人妻少妇嫩草av网站| 天堂动漫精品| 国产激情久久老熟女| 妹子高潮喷水视频| 男女免费视频国产| 一级毛片精品| 精品视频人人做人人爽| 美女 人体艺术 gogo| 国产成+人综合+亚洲专区| avwww免费| 99热网站在线观看| 一二三四在线观看免费中文在| 亚洲精品美女久久久久99蜜臀| 免费在线观看亚洲国产| 水蜜桃什么品种好| 欧美日韩亚洲综合一区二区三区_| √禁漫天堂资源中文www| 12—13女人毛片做爰片一| 狠狠婷婷综合久久久久久88av| 丰满迷人的少妇在线观看| 午夜精品国产一区二区电影| 18在线观看网站| 亚洲av成人一区二区三| 高清视频免费观看一区二区| 亚洲免费av在线视频| 在线观看免费视频日本深夜| 老汉色av国产亚洲站长工具| 欧美国产精品一级二级三级| 亚洲全国av大片| 99国产精品一区二区蜜桃av | 少妇裸体淫交视频免费看高清 | 王馨瑶露胸无遮挡在线观看| 99热只有精品国产| 亚洲一区高清亚洲精品| 中文亚洲av片在线观看爽 | 国产精品免费视频内射| 国产免费现黄频在线看| 人人澡人人妻人| 国产野战对白在线观看| 午夜精品久久久久久毛片777| 不卡av一区二区三区| 国产精品二区激情视频| 亚洲国产中文字幕在线视频| 国产日韩欧美亚洲二区| 久99久视频精品免费| 午夜激情av网站| 日韩熟女老妇一区二区性免费视频| 大片电影免费在线观看免费| av天堂在线播放| 日韩大码丰满熟妇| 老熟妇乱子伦视频在线观看| 国产av精品麻豆| 成人18禁高潮啪啪吃奶动态图| 精品亚洲成a人片在线观看| 久久性视频一级片| 国产乱人伦免费视频| 人人妻人人澡人人爽人人夜夜| 免费av中文字幕在线| 好男人电影高清在线观看| 麻豆av在线久日| 9191精品国产免费久久| 亚洲熟妇熟女久久| 国产人伦9x9x在线观看| 99re在线观看精品视频| 美女 人体艺术 gogo| 欧美成人午夜精品| 男女下面插进去视频免费观看| 国产1区2区3区精品| avwww免费| 久久久精品国产亚洲av高清涩受| 妹子高潮喷水视频| 久久久久久久精品吃奶| 亚洲专区字幕在线| 国产三级黄色录像| 午夜免费鲁丝| 精品一品国产午夜福利视频| 亚洲第一欧美日韩一区二区三区| 精品人妻1区二区| 十八禁人妻一区二区| 欧美性长视频在线观看| 亚洲九九香蕉| 在线观看免费视频日本深夜| 亚洲精品粉嫩美女一区| 精品第一国产精品| 日韩欧美一区二区三区在线观看 | 老熟妇仑乱视频hdxx| 亚洲黑人精品在线| 久久精品亚洲精品国产色婷小说| 女性生殖器流出的白浆| 精品少妇久久久久久888优播| 亚洲片人在线观看| 狂野欧美激情性xxxx| 中文字幕制服av| 日韩大码丰满熟妇| 水蜜桃什么品种好| cao死你这个sao货| www日本在线高清视频| 国产三级黄色录像| 欧美最黄视频在线播放免费 | 久久香蕉国产精品| 人妻丰满熟妇av一区二区三区 | 中文字幕色久视频| 新久久久久国产一级毛片| 久久精品亚洲av国产电影网| 国产视频一区二区在线看| 亚洲欧美一区二区三区黑人| 亚洲一区二区三区不卡视频| 黑丝袜美女国产一区| 怎么达到女性高潮| 99re6热这里在线精品视频| 黑人猛操日本美女一级片| 十八禁高潮呻吟视频| 亚洲熟女精品中文字幕| 黄网站色视频无遮挡免费观看| 男女下面插进去视频免费观看| 91在线观看av| 国产精品一区二区在线观看99| 久久国产精品人妻蜜桃| 午夜免费观看网址| 国产成人啪精品午夜网站| 亚洲成人免费av在线播放| 欧美日韩福利视频一区二区| 国产高清视频在线播放一区| 国产av又大| 国产亚洲av高清不卡| cao死你这个sao货| 一边摸一边抽搐一进一出视频| 天天添夜夜摸| 欧美日韩国产mv在线观看视频| 一二三四社区在线视频社区8| √禁漫天堂资源中文www| 国产在线观看jvid| 国产精品亚洲av一区麻豆| 久久人人97超碰香蕉20202| 中文欧美无线码| 精品少妇一区二区三区视频日本电影| 啪啪无遮挡十八禁网站| 欧美日韩av久久| 欧美激情极品国产一区二区三区| 国产亚洲欧美98| 国产99白浆流出| 天堂中文最新版在线下载| 国产片内射在线| 国产日韩欧美亚洲二区| 亚洲免费av在线视频| 成人国产一区最新在线观看| 人人妻人人澡人人看| 亚洲国产欧美日韩在线播放| 久9热在线精品视频| 亚洲中文字幕日韩| 日韩大码丰满熟妇| 黄网站色视频无遮挡免费观看| a级毛片在线看网站| a级毛片黄视频| 中文字幕人妻丝袜制服| 9色porny在线观看| 丝瓜视频免费看黄片| 久久久精品免费免费高清| 日韩免费av在线播放| 国产精品免费一区二区三区在线 | 视频在线观看一区二区三区| 脱女人内裤的视频| 国产xxxxx性猛交| 波多野结衣一区麻豆| 97人妻天天添夜夜摸| 国产一区二区三区在线臀色熟女 | 精品国产一区二区三区四区第35| 色精品久久人妻99蜜桃| 一级片'在线观看视频| 一区二区三区激情视频| 色94色欧美一区二区| 欧美中文综合在线视频| 欧美亚洲日本最大视频资源| 欧美日韩中文字幕国产精品一区二区三区 | 欧美日韩精品网址| 亚洲av美国av| x7x7x7水蜜桃| 精品福利观看| 啦啦啦 在线观看视频| 高清av免费在线| 国产高清视频在线播放一区| 大型av网站在线播放| 国产激情欧美一区二区| 国产成人系列免费观看| 欧美乱妇无乱码| 天天躁日日躁夜夜躁夜夜| 国产免费av片在线观看野外av| 一进一出抽搐动态| 老熟妇乱子伦视频在线观看| 大香蕉久久网| 免费久久久久久久精品成人欧美视频| 久久久久久免费高清国产稀缺| 久久人妻熟女aⅴ| 9色porny在线观看| 国产精品久久久av美女十八| 香蕉国产在线看| 无限看片的www在线观看| 美女高潮喷水抽搐中文字幕| 女人精品久久久久毛片| 精品少妇一区二区三区视频日本电影| 90打野战视频偷拍视频| 国产精品永久免费网站| 国产日韩欧美亚洲二区| 日韩大码丰满熟妇| 国产亚洲精品一区二区www | 成人18禁在线播放| 黑人巨大精品欧美一区二区蜜桃| 一级,二级,三级黄色视频| 亚洲色图综合在线观看| 亚洲国产看品久久| 免费观看a级毛片全部| 下体分泌物呈黄色| 国产三级黄色录像| www.熟女人妻精品国产| 韩国精品一区二区三区| 中亚洲国语对白在线视频| 欧美久久黑人一区二区| 丁香欧美五月| 午夜精品在线福利| 超碰成人久久| 捣出白浆h1v1| 91麻豆av在线| 12—13女人毛片做爰片一| 男女下面插进去视频免费观看| 精品国内亚洲2022精品成人 | 免费观看人在逋| 在线播放国产精品三级| 日韩制服丝袜自拍偷拍| 色精品久久人妻99蜜桃| 热re99久久国产66热| 两个人免费观看高清视频| 日本一区二区免费在线视频| 少妇 在线观看| 久久久久久久午夜电影 | 成人18禁高潮啪啪吃奶动态图| 日本五十路高清| 国产黄色免费在线视频| 色播在线永久视频| av视频免费观看在线观看| 国产麻豆69| 在线观看www视频免费| 亚洲aⅴ乱码一区二区在线播放 | 又大又爽又粗| 国产aⅴ精品一区二区三区波| ponron亚洲| 亚洲九九香蕉| 午夜久久久在线观看| 亚洲国产欧美日韩在线播放| 中文字幕人妻丝袜制服| 国产片内射在线| 韩国精品一区二区三区| cao死你这个sao货| 国产人伦9x9x在线观看| 黑人巨大精品欧美一区二区蜜桃| 欧美在线一区亚洲| 淫妇啪啪啪对白视频| 亚洲国产精品sss在线观看 | 国产av一区二区精品久久| 亚洲国产欧美一区二区综合| 国产aⅴ精品一区二区三区波| 嫩草影视91久久| 欧美色视频一区免费| 黄色成人免费大全| 中文字幕另类日韩欧美亚洲嫩草| 一区二区三区国产精品乱码| 亚洲男人天堂网一区| 午夜久久久在线观看| 十八禁高潮呻吟视频| 久9热在线精品视频| 亚洲熟女毛片儿| 久久精品91无色码中文字幕| 韩国av一区二区三区四区| 国产欧美日韩精品亚洲av| 中文字幕最新亚洲高清| 自拍欧美九色日韩亚洲蝌蚪91| 热99re8久久精品国产| 国产精品久久久久久精品古装| 最近最新中文字幕大全免费视频| 国产亚洲精品一区二区www | 中文字幕av电影在线播放| 人妻一区二区av| 久久ye,这里只有精品| 亚洲国产毛片av蜜桃av| 十八禁人妻一区二区| 曰老女人黄片| 国产精品av久久久久免费| 久久国产亚洲av麻豆专区| 国产欧美日韩精品亚洲av| 成人18禁高潮啪啪吃奶动态图| 国产主播在线观看一区二区| 99精品久久久久人妻精品| 在线观看免费视频日本深夜| 欧美在线一区亚洲| av电影中文网址| 亚洲人成77777在线视频| 美女福利国产在线| 国产一区二区三区综合在线观看| 亚洲精品国产色婷婷电影| 国产一区有黄有色的免费视频| 老司机午夜十八禁免费视频| 亚洲全国av大片| 一进一出抽搐动态| 每晚都被弄得嗷嗷叫到高潮| 中文欧美无线码| 中文亚洲av片在线观看爽 | 手机成人av网站| 狠狠婷婷综合久久久久久88av| 少妇猛男粗大的猛烈进出视频| 久久久水蜜桃国产精品网| 我的亚洲天堂| 日韩欧美三级三区| 成人影院久久| 他把我摸到了高潮在线观看| 国产精品免费大片| 啦啦啦免费观看视频1| 中出人妻视频一区二区| 精品人妻1区二区| 欧美丝袜亚洲另类 | 女性生殖器流出的白浆| 国产99久久九九免费精品| 亚洲av成人av| 精品久久久久久久久久免费视频 | 新久久久久国产一级毛片| 人人妻人人澡人人看| 天天躁夜夜躁狠狠躁躁| 久99久视频精品免费| 国产成人欧美| 男人操女人黄网站| 超碰97精品在线观看| 成年人黄色毛片网站| 精品国产亚洲在线| 久久精品亚洲av国产电影网| 黄网站色视频无遮挡免费观看| 久久精品91无色码中文字幕| av免费在线观看网站| 国产精品久久久久久人妻精品电影| 曰老女人黄片| av网站免费在线观看视频| 欧美日韩精品网址| a级毛片在线看网站| 国产精品98久久久久久宅男小说| 电影成人av| 国产精品免费视频内射| 中国美女看黄片| 麻豆乱淫一区二区| 18在线观看网站| 午夜两性在线视频| 在线观看免费日韩欧美大片| 国产亚洲精品久久久久久毛片 | 超碰97精品在线观看| 免费观看a级毛片全部| 久久久久久人人人人人| 别揉我奶头~嗯~啊~动态视频| 亚洲精品中文字幕在线视频| 在线观看日韩欧美| 午夜精品国产一区二区电影| 美女 人体艺术 gogo| 国产男靠女视频免费网站| 国产亚洲欧美98| 亚洲欧美色中文字幕在线| 亚洲精品乱久久久久久| 免费少妇av软件| 色尼玛亚洲综合影院| 80岁老熟妇乱子伦牲交| 成人影院久久| 中文字幕人妻丝袜一区二区| 国产激情欧美一区二区| 亚洲av电影在线进入| 欧美人与性动交α欧美软件| 人成视频在线观看免费观看| 九色亚洲精品在线播放| 18在线观看网站| 国产99白浆流出| 免费在线观看黄色视频的| 男人舔女人的私密视频| 久久精品91无色码中文字幕| 天天躁日日躁夜夜躁夜夜| 一夜夜www| 一级a爱视频在线免费观看| 亚洲五月天丁香| 国产无遮挡羞羞视频在线观看| 一区在线观看完整版| 日韩欧美国产一区二区入口| 首页视频小说图片口味搜索| 亚洲国产毛片av蜜桃av| 国产精品 欧美亚洲| 久久天堂一区二区三区四区| 50天的宝宝边吃奶边哭怎么回事| 国产精品九九99| 色综合婷婷激情| 国产精品自产拍在线观看55亚洲 | 90打野战视频偷拍视频| 久久精品亚洲精品国产色婷小说| 天天操日日干夜夜撸| 在线观看66精品国产| 欧美色视频一区免费| 免费看a级黄色片| 国产精品亚洲av一区麻豆| 在线观看免费视频网站a站| 久久ye,这里只有精品| 岛国毛片在线播放| 国产亚洲精品一区二区www | 777久久人妻少妇嫩草av网站| 十八禁人妻一区二区| 少妇粗大呻吟视频| 日本撒尿小便嘘嘘汇集6| 天天影视国产精品| 欧美精品av麻豆av| 在线天堂中文资源库| 搡老熟女国产l中国老女人| 男女免费视频国产| 侵犯人妻中文字幕一二三四区| 成人手机av| 国产深夜福利视频在线观看| 可以免费在线观看a视频的电影网站| 免费少妇av软件| 亚洲精品国产色婷婷电影| 亚洲久久久国产精品| 99久久99久久久精品蜜桃| 日本a在线网址| 亚洲精品成人av观看孕妇| 午夜精品在线福利| 人人妻,人人澡人人爽秒播| 精品午夜福利视频在线观看一区| 精品国产美女av久久久久小说| 50天的宝宝边吃奶边哭怎么回事| 欧美日韩中文字幕国产精品一区二区三区 | 久久国产精品影院| 欧美日韩视频精品一区| 十八禁高潮呻吟视频| 熟女少妇亚洲综合色aaa.| 久久精品国产清高在天天线| 脱女人内裤的视频| 欧美激情高清一区二区三区| 757午夜福利合集在线观看| 欧美亚洲 丝袜 人妻 在线| 三上悠亚av全集在线观看| 亚洲第一欧美日韩一区二区三区| 日韩欧美一区二区三区在线观看 |