• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Nutch搜索引擎的公安應(yīng)用研究

    2015-12-08 09:23:52萍申亞鵬
    關(guān)鍵詞:爬蟲搜索引擎網(wǎng)頁

    肖 萍申亞鵬

    (1 中國刑警學(xué)院 遼寧 沈陽 110035;2 大連市公安局西崗分局 遼寧 大連 116011)

    Nutch搜索引擎的公安應(yīng)用研究

    肖萍1申亞鵬2

    (1中國刑警學(xué)院遼寧沈陽110035;2大連市公安局西崗分局遼寧大連116011)

    網(wǎng)絡(luò)“爬蟲”作為網(wǎng)絡(luò)信息搜索的工具,在網(wǎng)絡(luò)輿情管控、搜查中起著至關(guān)重要的作用。隨著互聯(lián)網(wǎng)的廣泛普及,網(wǎng)絡(luò)中不安全因素、不和諧因素日益增多,使用百度等商業(yè)搜索引擎已經(jīng)不能滿足日益增長的公安輿情信息監(jiān)控工作需求。在介紹搜索引擎工作原理的基礎(chǔ)上,詳細(xì)分析了Nutch的工作機(jī)制,并與商業(yè)搜索引擎進(jìn)行了比對分析,實(shí)驗(yàn)結(jié)果表明了商業(yè)搜索引擎在公安應(yīng)用中的局限性,在特定的公安應(yīng)用背景下,在搜索精度、結(jié)果排序方面,Nutch要優(yōu)于商業(yè)搜索引擎。

    搜索引擎Nutch網(wǎng)絡(luò)輿情信息搜索

    Nutch是Apache公司推出的一款用JAVA語言編寫的支持分布式的開源網(wǎng)絡(luò)爬蟲軟件,它提供了用戶構(gòu)建網(wǎng)絡(luò)搜索引擎的全部工具。Nutch性能卓越,構(gòu)建簡易,功能強(qiáng)大。當(dāng)下,海量的、復(fù)雜的輿情信息充斥在網(wǎng)絡(luò)間,如何快速、精確地找到網(wǎng)絡(luò)輿情信息是對公安工作的重大考驗(yàn)。基于Nutch網(wǎng)絡(luò)爬蟲可針對輿情信息頻發(fā)的網(wǎng)站進(jìn)行重點(diǎn)布控,精確查找。本文研究了Nutch網(wǎng)絡(luò)爬蟲的工作機(jī)制,通過實(shí)驗(yàn)比對Nutch與商業(yè)搜索引擎的性能,指出了Nutch在公安工作中的應(yīng)用優(yōu)越性。

    1 搜索引擎工作原理

    搜索引擎也稱為“網(wǎng)絡(luò)爬蟲”,其核心任務(wù)是抓取網(wǎng)頁,該過程復(fù)雜、多變。爬蟲抓取過程總的來說,是依照“抓取——生產(chǎn)——更新”這一模式進(jìn)行的。具體過程是:添加初始URL,爬蟲程序訪問并解析初始網(wǎng)頁內(nèi)容,同時(shí)更新Visited表;分離初始網(wǎng)頁鏈接,保存初始網(wǎng)頁內(nèi)容,更新爬蟲隊(duì)列(初始URL不比對Visited表);繼續(xù)訪問爬蟲隊(duì)列中的URL,尋址、解析網(wǎng)頁,更新Visited表;分離網(wǎng)站鏈接,比對Visited表。若網(wǎng)站鏈接已被訪問,則過濾刪除。否則,更新至爬蟲隊(duì)列中,進(jìn)行下一循環(huán)。網(wǎng)絡(luò)爬蟲的抓取原理如圖1所示。

    圖1 網(wǎng)絡(luò)爬蟲抓取原理

    網(wǎng)絡(luò)爬蟲原理由URL尋址,遍歷互聯(lián)網(wǎng),爬蟲隊(duì)列,Visited表和網(wǎng)頁更新策略五部分核心內(nèi)容組成。

    1.1URL尋址

    URL(Uniform Resource Locator)是用于標(biāo)識(shí)網(wǎng)絡(luò)資源位置的標(biāo)志。它由服務(wù)方式、主機(jī)地址和文件存儲(chǔ)位置三部分組成。網(wǎng)絡(luò)爬蟲通過人工方式添加初始URL。而對初始URL的尋址則類似于瀏覽器訪問網(wǎng)站,通過DNS服務(wù)器獲取被訪問主機(jī)IP地址以便進(jìn)行下一步抓取。

    1.2遍歷互聯(lián)網(wǎng)

    如果把目標(biāo)網(wǎng)站比作一個(gè)圖,那么每一個(gè)頁面即為圖的節(jié)點(diǎn),頁面間的鏈接關(guān)系則為圖的有向邊。爬蟲注入初始URL后,選擇對網(wǎng)站的遍歷方式至關(guān)重要,因?yàn)檫@直接影響到爬蟲工作效率。爬蟲通用網(wǎng)站遍歷方式為寬度優(yōu)先遍歷,也叫層級(jí)遍歷方式。這種遍歷方式通過對網(wǎng)站的URL分層,按層順序遍歷。寬度優(yōu)先遍歷的優(yōu)勢在于其節(jié)省系統(tǒng)資源,易于封閉目標(biāo)網(wǎng)站,形成重點(diǎn)布控區(qū)。

    1.3爬蟲隊(duì)列

    隨著抓取的進(jìn)行,成千上萬的URL被解析出來。在爬蟲程序中,通常使用隊(duì)列數(shù)據(jù)結(jié)構(gòu)來管理未被訪問的URL。但受計(jì)算機(jī)內(nèi)存容量的限制,直接以隊(duì)列方式存儲(chǔ)海量的URL不現(xiàn)實(shí)。通用方法是引入HASH算法。對URL進(jìn)行md5計(jì)算,存儲(chǔ)其散列值,降低對計(jì)算機(jī)內(nèi)存的要求。在實(shí)際應(yīng)用中,爬蟲隊(duì)列通常會(huì)構(gòu)建一個(gè)優(yōu)化機(jī)制,來微調(diào)爬蟲隊(duì)列中URL的排序,分離訪問流量,避免爬蟲程序?qū)δ骋环?wù)器造成過大訪問壓力。

    1.4Visited表

    Visited表用來存儲(chǔ)已被訪問的URL。爬蟲程序在分離出網(wǎng)站鏈接之后,與Visited表比對,保存未被訪問的URL,優(yōu)化爬蟲隊(duì)列。構(gòu)建Visited表的通用技術(shù)是BLOOM過濾器。BLOOM過濾器的工作原理如圖2所示。

    圖2 BLOOM過濾器的工作原理

    首先劃分出存儲(chǔ)塊,塊大小=16*N(N為URL個(gè)數(shù))位。然后將塊中的每個(gè)二進(jìn)制位設(shè)置為0。對每一個(gè)URL通過隨機(jī)數(shù)產(chǎn)生器1生成8位的指紋信息,以此來標(biāo)識(shí)URL。然后再通過一個(gè)隨機(jī)數(shù)產(chǎn)生器2將這8位指紋信息映射到存儲(chǔ)塊中,將映射位置的二進(jìn)制位修改為1。當(dāng)需要對URL進(jìn)行比對時(shí),只需查看這一URL對應(yīng)的8位存儲(chǔ)位置是否全部為1。若全為1,就表明該URL已被訪問;否則,未被訪問。BLOOM過濾器的這種工作原理保證其不會(huì)漏掉任何一個(gè)已訪問的URL,但有一定概率誤識(shí)未被訪問的URL。因?yàn)橛锌赡苣骋籙RL的地址對應(yīng)的8位二進(jìn)制恰好被設(shè)置為1。通用的解決方法是建立一張白名單,以此來標(biāo)識(shí)被誤識(shí)的URL。

    1.5網(wǎng)頁更新策略

    互聯(lián)網(wǎng)上的網(wǎng)頁信息并非是一成不變的,而是隨著用戶的需求時(shí)刻更新。對于網(wǎng)絡(luò)爬蟲來說,不僅僅要抓取網(wǎng)頁,而且也要隨著互聯(lián)網(wǎng)的更新而更新本地網(wǎng)頁。通用的網(wǎng)頁更新策略有:歷史參考策略、用戶體驗(yàn)策略和聚類抽樣策略。

    歷史參考策略是建立在以往更新經(jīng)驗(yàn)之上的一種更新策略?;竟ぷ魉悸肥牵哼^去更新頻繁的網(wǎng)頁,未來也將頻繁更新。該策略利用泊松過程來對網(wǎng)頁的變化進(jìn)行建模,根據(jù)網(wǎng)頁過去的更新情況,來推測其未來的更新情況。

    用戶體驗(yàn)策略是建立在用戶最為關(guān)心的特定網(wǎng)頁上的更新策略?;竟ぷ魉悸肥牵簝?yōu)先更新搜索結(jié)果排序靠前的網(wǎng)頁。該策略根據(jù)過去每次內(nèi)容變化對搜索質(zhì)量的影響,通過建立數(shù)學(xué)模型,計(jì)算影響值。值高的網(wǎng)頁,優(yōu)先進(jìn)行調(diào)度抓取。

    聚類抽象策略認(rèn)為:網(wǎng)頁有一些屬性,根據(jù)這些屬性可以預(yù)測其更新周期,具有相似屬性的網(wǎng)頁,其更新周期也類似。該策略的優(yōu)勢在于不用依賴對網(wǎng)頁的歷史更新信息,減少系統(tǒng)負(fù)擔(dān)。

    2 主流開源搜索引擎

    隨著互聯(lián)網(wǎng)信息量的激增,如何準(zhǔn)確快速地搜索出網(wǎng)上熱點(diǎn)輿情信息成為公安網(wǎng)絡(luò)信息監(jiān)控部門的迫切需求。由于百度等商業(yè)搜索引擎存在著付費(fèi)和功能限制的弊端,不能很好準(zhǔn)確地提供搜索結(jié)果,因此在實(shí)際公安工作中可以研究應(yīng)用開源搜索引擎來定制個(gè)性化的公安搜索工具。目前主流的開源搜索引擎有以下幾種。

    2.1Sphider

    Sphider是一個(gè)輕量級(jí),采用PHP開發(fā)的web spider和搜索引擎,使用mysql來存儲(chǔ)數(shù)據(jù)。Sphider非常小,易于安裝和修改,已經(jīng)有數(shù)千網(wǎng)站在使用它,它支持所有的標(biāo)準(zhǔn)搜索選項(xiàng),還包括大量的如Word自動(dòng)完成、拼寫建議等選項(xiàng),使系統(tǒng)易于管理,Sphider支持中文搜索,但對中文分詞的效果不是很好。

    2.2PhpDig

    PhpDig是國外非常流行的垂直搜索引擎產(chǎn)品,采用PHP語言編寫,使用Mysql來存儲(chǔ)數(shù)據(jù)。利用了PHP程序運(yùn)行的高效性,極大地提高了搜索反應(yīng)速度,它可以像Google或者Baidu以及其他搜索引擎一樣搜索互聯(lián)網(wǎng),搜索內(nèi)容除了普通的網(wǎng)頁外還包括.txt,.doc,.xls,.pdf等類型的文件,具有強(qiáng)大的內(nèi)容搜索和文件解析功能,適用于專業(yè)化更強(qiáng)、層次更深的個(gè)性化搜索引擎,但是目前所有版本的PhpDig均不支持中文檢索。

    2.3Lucene

    Lucene是Apache軟件基金會(huì)Jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,即它不是一個(gè)完整的全文檢索引擎,而是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。Lucene的目的是為軟件開發(fā)人員提供一個(gè)簡單易用的工具包,以方便地在目標(biāo)系統(tǒng)中實(shí)現(xiàn)全文檢索的功能,或者是以此為基礎(chǔ)建立起完整的全文檢索引擎。其運(yùn)算速度較快,在現(xiàn)在流行的硬件平臺(tái)上每個(gè)小時(shí)可處理超過150GB的數(shù)據(jù),并且內(nèi)存占用小,只需1MB的堆內(nèi)存。由于Lucene是由JAVA語言實(shí)現(xiàn)的,因此具有良好的兼容性。

    2.4Nutch

    Nutch是Apache基金會(huì)的一個(gè)開源項(xiàng)目,它原本是開源文件索引框架Lucene項(xiàng)目的一個(gè)子項(xiàng)目,后來漸漸發(fā)展為一個(gè)獨(dú)立的開源項(xiàng)目。它基于Lucene框架,由JAVA語言實(shí)現(xiàn),提供了搜索引擎所需的全部工具,包括全文搜索和Web爬蟲。它具有以下主要特點(diǎn):(1) 使用Plugin機(jī)制來提高可擴(kuò)展性;(2)通過多協(xié)議和多線程分布式抓取,提供抓取效率;(3)具備可擴(kuò)展的數(shù)據(jù)處理模型,全文索引器和搜索引擎;(4)支持分布式查詢,具有強(qiáng)大的API接口和集成配置。

    2.5Heritrix

    Heritrix作為JAVA開源項(xiàng)目,是SourceForge上的開源產(chǎn)品,它提供了豐富的抓取設(shè)置選項(xiàng),主要被用來獲取完整的、精確的站點(diǎn)內(nèi)容深度復(fù)制,包括獲取圖像以及其他非文本內(nèi)容。Heritrix的體系結(jié)構(gòu)是采用了多線程和鏈接隊(duì)列的形式組織。整個(gè)系統(tǒng)的工作部分可以分成對配置文件管理部分、下載任務(wù)管理部分、下載控制部分和下載工作單元。附帶的工作隊(duì)列、緩沖區(qū)等的引入則為網(wǎng)絡(luò)蜘蛛提供了良好的性能。Heritrix主要具有以下特點(diǎn):(1)專注的網(wǎng)絡(luò)信息下載功能;(2)適用于各種類型網(wǎng)頁信息并嚴(yán)格保持網(wǎng)頁原貌;(3)在保留歷史的下載網(wǎng)頁庫內(nèi)容基礎(chǔ)上不斷地添加新的下載內(nèi)容;(4)以任務(wù)形式管理并提供命令行和友好的Web控制界面。

    3 Nutch搜索引擎研究

    對目前主流的幾款開源搜索引擎進(jìn)行了比較分析發(fā)現(xiàn),Sphider及PhpDig搜索引擎均是使用mysql數(shù)據(jù)庫來存儲(chǔ)數(shù)據(jù),對數(shù)據(jù)的存儲(chǔ)能力有限,而且不能很好地支持中文檢索,另外考慮到Lucene不是一個(gè)完整的全文檢索引擎,僅僅是一個(gè)工具包,而且相對于Heritrix來說,Nutch具有集群擴(kuò)展能力,并具備多種功能,包括內(nèi)容索引功能、搜索功能、內(nèi)容解析、鏈接解析等,因此本文選擇Nutch作為應(yīng)用研究對象,其運(yùn)行原理如圖3所示。

    圖3 Nutch網(wǎng)絡(luò)爬蟲運(yùn)行原理

    注入初始url,啟動(dòng)爬蟲程序;抓取指定網(wǎng)頁,解析網(wǎng)頁內(nèi)容,更新Nutch文件;待抓取全部完畢后,為抓取內(nèi)容建立索引。用戶進(jìn)入Nutch服務(wù)界面,鍵入關(guān)鍵字,檢索索引文件,返回結(jié)果。

    由于Nutch網(wǎng)絡(luò)爬蟲提供給用戶構(gòu)建搜索引擎的全部工具,所以其不僅僅包含網(wǎng)頁抓取功能,還包含信息索引功能和關(guān)鍵字檢索功能。

    Nutch網(wǎng)絡(luò)爬蟲的存儲(chǔ)文件共有五個(gè),分別是Crawldb,Linkdb,Indexes,Index和Segments。

    (1)Crawldb文件夾用來存儲(chǔ)爬蟲爬取的url。

    (2)Linkdb文件夾用來存儲(chǔ)網(wǎng)頁間的鏈接信息。

    (3)Segments文件夾是Nutch的核心文件,其中有若干個(gè)以時(shí)間命名的文件夾,每個(gè)文件夾是爬蟲抓取的一次循環(huán)。用于存儲(chǔ)爬蟲抓取來的網(wǎng)頁內(nèi)容、預(yù)抓取URL等信息。每個(gè)段都有一個(gè)完整的子索引。

    (4)Index文件夾用來存儲(chǔ)Nutch的索引文件。該文件不是直接通過網(wǎng)頁內(nèi)容建立索引,而是合并眾多子索引文件來實(shí)現(xiàn)。

    (5)Indexes文件夾用于存儲(chǔ)子索引。

    Nutch網(wǎng)絡(luò)爬蟲工作機(jī)制分為三部分,分別是抓取部分、索引部分及檢索部分。

    3.1抓取部分

    Nutch網(wǎng)絡(luò)爬蟲在抓取部分的主要任務(wù)是獲取網(wǎng)頁,其依照“抓取——生產(chǎn)——更新”這一循環(huán)進(jìn)行的。

    在爬蟲抓取的過程中,Nutch生成Crawldb、Linkdb和Segments文件夾。在Segments文件夾中,共存儲(chǔ)六類文件,Crawl_generate存儲(chǔ)待抓取的URL;Crawl_fetch存儲(chǔ)每個(gè)下載URL的狀態(tài);Content存儲(chǔ)抓取網(wǎng)頁的內(nèi)容;Parse_text存儲(chǔ)抓取URL的文本信息;Parse data存儲(chǔ)每個(gè) URL的外連接;Crawl parse存儲(chǔ)用來更新Crawldb的URL集。

    3.2索引部分

    Nutch網(wǎng)絡(luò)爬蟲的抓取部分與檢索部分通過索引部分連接。因此,索引部分是Nutch網(wǎng)絡(luò)爬蟲的關(guān)鍵技術(shù)。

    在Nutch的工作流程中,索引階段負(fù)責(zé)對網(wǎng)頁重要度評(píng)測、抓取網(wǎng)頁分析和構(gòu)建逆向索引表。

    3.2.1PageRank算法

    PageRank算法是由Google的創(chuàng)始人Larry Page和Sergey Brin于1998年提出的一種網(wǎng)頁重要度排序算法。該算法的基本思路是“被大量網(wǎng)頁所鏈接的網(wǎng)頁必然是優(yōu)質(zhì)網(wǎng)頁”。PageRank值表明用戶訪問某一網(wǎng)站的概率。這就需要基于用戶隨機(jī)從互聯(lián)網(wǎng)上任意一個(gè)網(wǎng)頁開始訪問互聯(lián)網(wǎng)這樣一個(gè)前提。

    Nutch自身并沒有實(shí)現(xiàn)PageRank算法,而是通過構(gòu)建Hadoop集群來實(shí)現(xiàn)。大量實(shí)驗(yàn)證明,Nutch實(shí)現(xiàn)PageRank算法,可提高系統(tǒng)的檢索效率,更好地為用戶提供檢索服務(wù)。

    計(jì)算網(wǎng)頁P(yáng)ageRank值的公式定義為

    其中,P(A)表示網(wǎng)頁A的PageRank值;P(Ti)為鏈接指向網(wǎng)頁A的網(wǎng)頁Ti的PageRank值;C(Ti)為網(wǎng)頁Ti的外連接總數(shù);d為阻尼系數(shù),Google推薦d值為0.85。

    Google的研究表明,進(jìn)行大約100次的迭代運(yùn)算能估計(jì)出整個(gè)互聯(lián)網(wǎng)中任意一個(gè)網(wǎng)頁的PageRank值。

    網(wǎng)頁P(yáng)ageRank值可作為一個(gè)獨(dú)立的索引項(xiàng)添加到倒排索引文件中,優(yōu)化Nutch檢索結(jié)果排序。

    3.2.2Luence工具包

    Nutch檢索階段構(gòu)建索引表,主要依賴Luence完成。Luence構(gòu)建索引的對象是文本文件。這就要求必須對Nutch抓取到的網(wǎng)頁進(jìn)行預(yù)處理,把網(wǎng)頁內(nèi)容轉(zhuǎn)換為文本格式。

    Luence的最終目的是構(gòu)建索引表,為用戶提供查詢服務(wù)。索引表是由文檔(Document),域(Field)和項(xiàng)(Term)組成。索引表存儲(chǔ)結(jié)構(gòu)類似關(guān)系數(shù)據(jù)庫,項(xiàng)是組成索引表的最小單位,若干項(xiàng)組成一組

    其中,P(X,Y)表示字X與字Y相鄰的概率。P(X)標(biāo)識(shí)字X出現(xiàn)的頻率;P(Y)標(biāo)識(shí)字Y出現(xiàn)的頻率。當(dāng)M(X,Y)的值高于某一閥值時(shí),字X與Y被定義為一個(gè)詞。

    實(shí)際應(yīng)用中,是把此兩種分詞法結(jié)合起來。用字符串分詞法劃分簡單,常用詞匯,同時(shí)結(jié)合統(tǒng)計(jì)分析法提取新詞匯。這樣既繼承了字符串分詞法效率高的特點(diǎn),又結(jié)合了統(tǒng)計(jì)分詞法靈活的特點(diǎn),明顯提高分詞器的工作效率。

    (3)逆向索引。逆向索引技術(shù),又稱倒排索引技術(shù)。是當(dāng)前搜索引擎應(yīng)用最普遍的技術(shù)之一??梢哉f,正是它的出現(xiàn),搜索引擎才得以發(fā)展到如今的規(guī)模。逆向索引技術(shù)原理如圖4所示。

    .fnm文件、.tis文件、.frq文件及.prx文件是構(gòu)建逆向索引表的關(guān)鍵文件,存儲(chǔ)在index文件夾中。其域,若干組域組成一個(gè)文檔。

    Luence構(gòu)建索引的過程總共分為三步:第一,網(wǎng)頁內(nèi)容分析;第二,中文分詞;第三,構(gòu)建逆向索引表。

    (1)網(wǎng)頁內(nèi)容分析。網(wǎng)頁內(nèi)容分析是將Nutch抓取來的網(wǎng)頁去除廣告信息等無用內(nèi)容,分析網(wǎng)頁結(jié)構(gòu),將網(wǎng)頁內(nèi)容轉(zhuǎn)換為文本文件,為Luence提供索引對象。

    通用網(wǎng)頁分析方法有簡單語言標(biāo)記法,正則式信息抽取法和DOM內(nèi)容抽取法。其中簡單言語標(biāo)記法,主要是根據(jù)HTML語言的特點(diǎn),通過簡單程序的遍歷,刪除所有被標(biāo)記出來的信息;正則式信息抽取法,通過事先定義好的規(guī)則和模塊快速提取網(wǎng)頁中符合要求的信息。這種方式效率高,但抽取的精度低,對于一些特殊網(wǎng)頁效果不好;DOM樹內(nèi)容抽取法是把原始網(wǎng)頁內(nèi)容轉(zhuǎn)換成樹形結(jié)構(gòu)儲(chǔ)存,這樣就可以靈活獲取網(wǎng)頁任何內(nèi)容。

    (2)中文分詞。中文分詞是將已經(jīng)文本化的網(wǎng)頁文件以項(xiàng)為單位劃分,為下一步的建立索引表提供語素。中文分詞過程包括整句劃分切割,詞提取,標(biāo)點(diǎn)符號(hào)去除,連接詞語去除等

    目前通用自動(dòng)分詞方法有兩種:基于字符串的分詞法和基于統(tǒng)計(jì)的分詞法。

    基于字符串的分詞法,它是按照一定的策略,將漢字字符串與一個(gè)“詞典”進(jìn)行比對,提取信息。該方法分詞效率高,但分詞過程機(jī)械,死板。

    基于統(tǒng)計(jì)的分析法,是根據(jù)統(tǒng)計(jì)學(xué)原理,將出現(xiàn)頻率高的相鄰字視為一個(gè)詞。其計(jì)算公式為中.fnm文件維護(hù)索引表的域名(Field name)信息。Luence為域名信息提供兩種選用功能:Indexed和Stored。Indexed功能標(biāo)注該域名信息是否被索引。Stored功能標(biāo)注每個(gè)field索引的內(nèi)容是否被存儲(chǔ)在索引文件中,通常大量索引文件存儲(chǔ)在Segments文件夾中;.tis文件維護(hù)一張域(Field)信息表。該表存儲(chǔ)所有域名稱,值以及出現(xiàn)該值的文檔數(shù)量(Doc frequency);.frq文件列出了Luence文檔中出現(xiàn)任意項(xiàng)的次數(shù);.prx文件展現(xiàn)了每一項(xiàng)在文檔中的具體位置,便于精確查找。

    圖4 逆向索引表

    逆向索引技術(shù)對文檔中的每一項(xiàng)(Term)建立索引庫,詳細(xì)標(biāo)明項(xiàng)在文件中出現(xiàn)次數(shù)以及位置。當(dāng)用戶鍵入關(guān)鍵字進(jìn)行搜索時(shí),Nutch可根據(jù)事先建立的索引表,迅速找到關(guān)鍵字的位置,提高Nutch的檢索效率。

    3.3檢索部分

    檢索部分主要是為用戶提供查詢服務(wù)。Nutch根據(jù)建立的索引表來完成此功能。這一部分是由Luence完成。

    設(shè)D={t1,t2,…,tn} 為系統(tǒng)記錄的項(xiàng),集合P={p1,p2,…,pn}為系統(tǒng)當(dāng)前網(wǎng)頁集合。系統(tǒng)的索引表示為集合R={<t,p>|r(t,p)>0,(t,p)∈D×P}。其中,r(t, p)是項(xiàng)與網(wǎng)頁的相關(guān)度函數(shù),若r>0,表示項(xiàng)與網(wǎng)頁相關(guān);若r=0,表示項(xiàng)與網(wǎng)頁無關(guān)。搜索引擎S={<t, p,r>|r(t,p,r)>0,(t,p,r)∈D×P×R}。檢索關(guān)鍵字T函數(shù)φ(T,S)={p|(t,p)∈R,p∈P}。由上可知,檢索部分是將關(guān)鍵字T與索引表通過r(t,p)函數(shù)相關(guān)聯(lián),最后返回網(wǎng)頁p。

    Lunece對檢索部分的優(yōu)化在于初次索引時(shí),并不是返回所有符合函數(shù)r(t,p)的p值,而是將r值最高的頭100項(xiàng)返回。對于一般的模糊檢索,頭100天記錄已經(jīng)可以滿足90%以上的檢索需求。

    4 Nutch搜索引擎公安應(yīng)用研究

    目前公安機(jī)關(guān)網(wǎng)監(jiān)部門對網(wǎng)絡(luò)監(jiān)管手段還比較單一,大多是依賴商業(yè)搜索引擎來實(shí)施信息搜索和查詢。由于商業(yè)搜索引擎是根據(jù)用戶繳費(fèi)情況來返回搜索結(jié)果,摻雜了各種推廣鏈接,制約了公安輿情監(jiān)控工作的發(fā)展。因此在公安機(jī)關(guān)網(wǎng)監(jiān)部門普及應(yīng)用個(gè)性化搜索引擎是勢在必行的,尤其是在公安隊(duì)伍信息化大發(fā)展的今天。本小節(jié)通過實(shí)驗(yàn)來驗(yàn)證應(yīng)用Nutch搜索引擎在公安工作中的優(yōu)越性。

    本實(shí)驗(yàn)應(yīng)用對比:Nutch爬蟲和百度搜索引擎。應(yīng)用目標(biāo):通過百度搜索引擎和Nutch網(wǎng)絡(luò)爬蟲找到詐騙信息。Nutch網(wǎng)絡(luò)爬蟲配置所需軟件如表1所示。

    表1 Nutch配置所需軟件

    4.1Nutch搜索引擎測試

    本實(shí)驗(yàn)將Nutch的抓取線程設(shè)為5,抓取深度為4,開始對目標(biāo)網(wǎng)站進(jìn)行網(wǎng)頁抓取。打開Nutch用戶界面,輸入關(guān)鍵字“遼寧家園論壇和風(fēng)瑜”,“遼寧家園論壇二手車和風(fēng)瑜”。搜索部分結(jié)果如圖5和圖6所示

    圖5 Nutch網(wǎng)絡(luò)爬蟲搜索結(jié)果(一)

    圖6 Nutch網(wǎng)絡(luò)爬蟲搜索結(jié)果(二)

    實(shí)驗(yàn)中Nutch搜索結(jié)果共18條記錄(每組搜索結(jié)果各9條)。這18條結(jié)果實(shí)則是2條URL的重復(fù)出現(xiàn),分別是 http://lnjylt.com/forum.php? mod=forumdisplay&fid=91及http://lnjylt.com/forum.php? mod=forumdisplay&fid=268。這兩條URL分別是遼寧家園論壇中“汽車論壇”和“二手交易”頻道。在其中可直接找到目標(biāo)信息。

    在Nutch搜索結(jié)果中,當(dāng)中出現(xiàn)“二手車”字樣時(shí),“二手交易”頻道排在首位;否則,“汽車論壇”頻道排在首位。因此Nutch的排序結(jié)果更能滿足用戶需求。

    4.2百度搜索引擎測試

    打開百度搜索引擎,輸入“遼寧家園論壇和風(fēng)瑜site:www.lnjylt.com”及“遼寧家園論壇二手車和風(fēng)瑜site:www.lnjylt.com”進(jìn)行搜索,其中第一組搜索結(jié)果4條,第二組搜索結(jié)果0條。逐個(gè)打開第一組搜索結(jié)果,都不能直接找到目標(biāo)信息,搜索精度為0。

    若不指定目標(biāo)搜索網(wǎng)站,僅使用“遼寧家園論壇和風(fēng)瑜”及“遼寧家園論壇二手車和風(fēng)瑜”進(jìn)行搜索,則搜索結(jié)果多達(dá)數(shù)百萬條,在搜索結(jié)果中,對于用戶來說很難快速準(zhǔn)確找到目標(biāo)網(wǎng)頁。

    從搜索結(jié)果看,百度搜索引擎總是能定位到信息的大概位置,但是不精確到具體的位置。尤其是在論壇中,大量的帖子、留言充斥著整個(gè)網(wǎng)站,信息量如此之大,僅僅是找到信息的大概位置而不是精確位置是遠(yuǎn)遠(yuǎn)不夠的。同時(shí),在百度搜索結(jié)果中,往往是“百度推廣”信息被排在前邊,而用戶真正需要的結(jié)果卻被排到后邊,進(jìn)一步地暴露了商業(yè)搜索引擎的應(yīng)用局限性。

    4.3Nutch搜索引擎在公安工作中的優(yōu)勢

    在搜索結(jié)果、搜索精度、結(jié)果排序方面將Nutch與百度的搜索能力比對,結(jié)果如表2所示。

    從實(shí)驗(yàn)對比結(jié)果中可看出在搜索精度、結(jié)果排序方面Nutch要優(yōu)于百度等商業(yè)搜索引擎,商業(yè)搜索引擎由于其技術(shù)內(nèi)幕隱秘、非公開,并且搜索結(jié)果也是具有商業(yè)性質(zhì)的,因此難以滿足公安工作需求。在特定的公安應(yīng)用背景下,相對于百度等商業(yè)搜索引擎來說,Nutch能夠更高效準(zhǔn)確地完成搜索任務(wù)。

    表2 實(shí)驗(yàn)比對結(jié)果

    5 結(jié)束語

    本文在分析Nutch工作機(jī)制且在實(shí)驗(yàn)驗(yàn)證的前提下,總結(jié)出Nutch較之百度等商業(yè)搜索引擎的優(yōu)勢,但通過實(shí)驗(yàn)也看出Nutch的每組關(guān)鍵字搜索結(jié)果為9條,實(shí)際都指向2條鏈接,重復(fù)度較高,未來可以對Nutch的檢索模塊進(jìn)行優(yōu)化,減少搜索結(jié)果的重復(fù)度。另外,在實(shí)際公安工作應(yīng)用中,可建立熱點(diǎn)輿情數(shù)據(jù)庫,應(yīng)用Nutch實(shí)時(shí)過濾區(qū)域信息,查詢輿情熱點(diǎn),提高公安輿情信息監(jiān)控工作效率。

    [1]羅剛,王振東.自己動(dòng)手寫網(wǎng)絡(luò)爬蟲[M].北京:清華大學(xué)出版社,2010.

    [2]張俊林.這就是搜索引擎核心技術(shù)詳解[M].北京:電子工業(yè)大學(xué)出版社,2012.

    [3]黃德才,威化春.PageRank算法研究[J].計(jì)算機(jī)工程,2006,32(4).

    [4]Brin S,Page L.The anatomy of a large-scale hypertextual Web search engine[J].Computer Network and ISDN Systems,1998,30.

    [5]童威.基于Nutch框架下的中小型網(wǎng)絡(luò)開源搜索引擎的研究與應(yīng)用[D].貴州:貴州大學(xué),2010.

    [6]何世林.基于Java技術(shù)的搜索引擎研究與實(shí)現(xiàn)[D].四川:西南交通大學(xué),2006.

    [7]龔磊,武友新.Lucene全文搜索系統(tǒng)的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)與數(shù)學(xué)工程,2010.

    [8]李曉明,閆宏飛,王繼民.搜索引擎—原理、技術(shù)與系統(tǒng)[M].北京:科學(xué)出版社,2005.

    (責(zé)任編輯:孟凡騫)

    TP391.1

    A

    2095-7939(2015)01-0039-06

    2014-11-10

    公安部公安理論及軟科學(xué)研究項(xiàng)目(編號(hào):2012LLYJXJXY052);遼寧省教育科學(xué)“十二五”規(guī)劃立項(xiàng)課題(編號(hào):JG14db440)。

    作簡簡介:肖萍(1978-),女,黑龍江雞西人,中國刑警學(xué)院網(wǎng)絡(luò)犯罪偵查系講師,碩士,主要從事網(wǎng)絡(luò)安全、信息監(jiān)控研究。

    猜你喜歡
    爬蟲搜索引擎網(wǎng)頁
    利用網(wǎng)絡(luò)爬蟲技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說
    基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
    基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計(jì)
    電子制作(2018年10期)2018-08-04 03:24:38
    利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
    電子測試(2018年1期)2018-04-18 11:53:04
    基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
    電子制作(2017年9期)2017-04-17 03:00:46
    網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
    電子測試(2015年18期)2016-01-14 01:22:58
    網(wǎng)絡(luò)搜索引擎亟待規(guī)范
    基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
    10個(gè)必知的網(wǎng)頁設(shè)計(jì)術(shù)語
    美女脱内裤让男人舔精品视频| 成年版毛片免费区| 下体分泌物呈黄色| 2022亚洲国产成人精品| 免费av不卡在线播放| 熟女av电影| 波多野结衣巨乳人妻| 99热这里只有是精品50| 美女视频免费永久观看网站| 国产黄色视频一区二区在线观看| 一本一本综合久久| 王馨瑶露胸无遮挡在线观看| 偷拍熟女少妇极品色| 国产成人精品婷婷| 国产精品久久久久久精品电影| 国产一区二区在线观看日韩| 亚洲激情五月婷婷啪啪| 男的添女的下面高潮视频| 午夜福利在线观看免费完整高清在| 国产白丝娇喘喷水9色精品| 在线精品无人区一区二区三 | 久久影院123| 日本猛色少妇xxxxx猛交久久| 国产国拍精品亚洲av在线观看| 国产欧美另类精品又又久久亚洲欧美| 久久久久久久久大av| 亚洲怡红院男人天堂| 3wmmmm亚洲av在线观看| 自拍偷自拍亚洲精品老妇| 边亲边吃奶的免费视频| 国产乱人视频| 国产精品国产三级专区第一集| av在线蜜桃| 熟女电影av网| 欧美最新免费一区二区三区| 人人妻人人爽人人添夜夜欢视频 | 黄色一级大片看看| 久久久久久久久久成人| 亚洲,欧美,日韩| 日日摸夜夜添夜夜添av毛片| 欧美潮喷喷水| 秋霞伦理黄片| 男人添女人高潮全过程视频| av在线老鸭窝| 观看免费一级毛片| 亚洲在线观看片| a级一级毛片免费在线观看| 国产一级毛片在线| 干丝袜人妻中文字幕| 欧美 日韩 精品 国产| 欧美成人精品欧美一级黄| 特大巨黑吊av在线直播| 国产v大片淫在线免费观看| 女的被弄到高潮叫床怎么办| 欧美极品一区二区三区四区| 国产在线一区二区三区精| 亚洲国产成人一精品久久久| 久久久久久久大尺度免费视频| 高清在线视频一区二区三区| 亚洲av成人精品一区久久| 午夜精品一区二区三区免费看| 97在线人人人人妻| 最近最新中文字幕大全电影3| 国产成人a区在线观看| 乱码一卡2卡4卡精品| 免费看日本二区| 色婷婷久久久亚洲欧美| 日本爱情动作片www.在线观看| a级毛片免费高清观看在线播放| 日本猛色少妇xxxxx猛交久久| 91久久精品国产一区二区三区| 一级片'在线观看视频| 亚洲精品国产色婷婷电影| 亚洲,一卡二卡三卡| 性插视频无遮挡在线免费观看| 成人无遮挡网站| 国产片特级美女逼逼视频| 下体分泌物呈黄色| 国产精品一二三区在线看| 国产精品久久久久久精品古装| 成人鲁丝片一二三区免费| 色视频www国产| 青春草国产在线视频| 国产精品一二三区在线看| 成年av动漫网址| 老女人水多毛片| 涩涩av久久男人的天堂| 丝袜喷水一区| 久久精品熟女亚洲av麻豆精品| 国产日韩欧美亚洲二区| 国产久久久一区二区三区| 国产91av在线免费观看| 熟妇人妻不卡中文字幕| 亚洲国产精品国产精品| 国产色爽女视频免费观看| 欧美一级a爱片免费观看看| 老女人水多毛片| 国产探花在线观看一区二区| av在线app专区| 亚洲最大成人手机在线| 国产淫片久久久久久久久| 麻豆精品久久久久久蜜桃| 亚洲av不卡在线观看| 中文字幕制服av| 久久久久久久国产电影| 国产亚洲av片在线观看秒播厂| 日日啪夜夜爽| 成人欧美大片| 午夜免费男女啪啪视频观看| 免费av观看视频| 久久久久国产网址| 三级国产精品欧美在线观看| 久久久亚洲精品成人影院| 男女下面进入的视频免费午夜| 亚洲av福利一区| 成人特级av手机在线观看| 国产精品女同一区二区软件| 成人无遮挡网站| 狂野欧美白嫩少妇大欣赏| 久久久久久久大尺度免费视频| 日本三级黄在线观看| 日本三级黄在线观看| 大又大粗又爽又黄少妇毛片口| 免费av观看视频| 国产成人freesex在线| 免费av不卡在线播放| 日本免费在线观看一区| 22中文网久久字幕| 亚洲精品自拍成人| 国产 一区精品| 高清日韩中文字幕在线| 精品久久国产蜜桃| 久久97久久精品| 麻豆成人午夜福利视频| 女人被狂操c到高潮| 乱码一卡2卡4卡精品| a级一级毛片免费在线观看| 久久女婷五月综合色啪小说 | 日本与韩国留学比较| 亚洲怡红院男人天堂| 又粗又硬又长又爽又黄的视频| 国产亚洲91精品色在线| 大片电影免费在线观看免费| 亚洲aⅴ乱码一区二区在线播放| 久久久色成人| 久久精品国产亚洲网站| 在线亚洲精品国产二区图片欧美 | 中文字幕免费在线视频6| 亚洲精品成人av观看孕妇| 亚洲美女搞黄在线观看| 一级爰片在线观看| 久久久久久久久久成人| 亚洲欧美一区二区三区黑人 | 亚洲精品自拍成人| 亚洲天堂av无毛| 国产一区二区亚洲精品在线观看| 精品少妇久久久久久888优播| 最近中文字幕高清免费大全6| 男人爽女人下面视频在线观看| 亚洲精品第二区| 国产人妻一区二区三区在| 久久久久久久国产电影| 国产伦在线观看视频一区| 欧美精品人与动牲交sv欧美| 亚洲av成人精品一二三区| 欧美精品国产亚洲| 一级毛片久久久久久久久女| 男人和女人高潮做爰伦理| 97精品久久久久久久久久精品| videos熟女内射| 国产伦在线观看视频一区| 人体艺术视频欧美日本| 1000部很黄的大片| 日本-黄色视频高清免费观看| 99久久精品热视频| 中国国产av一级| 一本一本综合久久| 亚洲天堂国产精品一区在线| 男人添女人高潮全过程视频| 夫妻性生交免费视频一级片| 欧美日韩视频精品一区| 日韩强制内射视频| 亚洲婷婷狠狠爱综合网| 国产一级毛片在线| 日韩电影二区| 国产黄片美女视频| 精品人妻视频免费看| 有码 亚洲区| 99久国产av精品国产电影| 亚洲精品国产av蜜桃| 国产欧美日韩精品一区二区| 最近中文字幕2019免费版| 亚洲精品日韩av片在线观看| 一级片'在线观看视频| 六月丁香七月| 欧美丝袜亚洲另类| 麻豆成人午夜福利视频| 王馨瑶露胸无遮挡在线观看| 久久99热6这里只有精品| 亚洲人成网站在线观看播放| 亚洲电影在线观看av| av免费观看日本| 精品久久久久久电影网| 日韩欧美精品v在线| 日韩大片免费观看网站| 青青草视频在线视频观看| 水蜜桃什么品种好| 日韩视频在线欧美| 人人妻人人澡人人爽人人夜夜| 欧美日韩在线观看h| 久久久精品欧美日韩精品| 美女内射精品一级片tv| 欧美日韩亚洲高清精品| 波多野结衣巨乳人妻| 欧美精品一区二区大全| 国产精品人妻久久久影院| 一级毛片久久久久久久久女| 精品人妻熟女av久视频| 亚洲天堂国产精品一区在线| 色5月婷婷丁香| 午夜福利网站1000一区二区三区| 九九久久精品国产亚洲av麻豆| 国国产精品蜜臀av免费| 男插女下体视频免费在线播放| 国产精品久久久久久精品古装| 赤兔流量卡办理| 亚洲av欧美aⅴ国产| 在线观看三级黄色| 国产老妇伦熟女老妇高清| 黄色欧美视频在线观看| 国产免费福利视频在线观看| 国产伦精品一区二区三区视频9| 久久精品久久精品一区二区三区| 丝袜脚勾引网站| 精品一区二区三卡| 一级毛片黄色毛片免费观看视频| 日韩伦理黄色片| 欧美成人a在线观看| 欧美成人精品欧美一级黄| 日本熟妇午夜| 亚洲欧美日韩无卡精品| 国产成人免费无遮挡视频| 建设人人有责人人尽责人人享有的 | 日韩在线高清观看一区二区三区| 夜夜看夜夜爽夜夜摸| 免费av毛片视频| 成人国产av品久久久| 国产成人91sexporn| 蜜桃久久精品国产亚洲av| 午夜激情久久久久久久| 日韩av免费高清视频| 偷拍熟女少妇极品色| 国产av国产精品国产| 欧美丝袜亚洲另类| 中文资源天堂在线| 亚洲成人精品中文字幕电影| 深爱激情五月婷婷| 啦啦啦啦在线视频资源| 赤兔流量卡办理| 国产爱豆传媒在线观看| 欧美少妇被猛烈插入视频| 亚洲成人久久爱视频| 成人美女网站在线观看视频| 亚洲第一区二区三区不卡| 一级毛片 在线播放| 欧美日韩国产mv在线观看视频 | 97精品久久久久久久久久精品| 国产高清三级在线| 欧美激情久久久久久爽电影| 99热国产这里只有精品6| 久久97久久精品| 成人鲁丝片一二三区免费| 久久亚洲国产成人精品v| 日产精品乱码卡一卡2卡三| 一级毛片电影观看| 国产在视频线精品| 国产亚洲av片在线观看秒播厂| 国产精品久久久久久久电影| 99久久中文字幕三级久久日本| 国产在视频线精品| 青春草视频在线免费观看| 男女啪啪激烈高潮av片| av一本久久久久| 99热6这里只有精品| 日韩电影二区| 两个人的视频大全免费| 日韩大片免费观看网站| 久久久久九九精品影院| 成人一区二区视频在线观看| 亚洲精品视频女| 国产高清国产精品国产三级 | 下体分泌物呈黄色| 日韩视频在线欧美| 日本-黄色视频高清免费观看| 自拍欧美九色日韩亚洲蝌蚪91 | 自拍偷自拍亚洲精品老妇| 激情五月婷婷亚洲| 青春草国产在线视频| 日韩,欧美,国产一区二区三区| 亚洲熟女精品中文字幕| 91精品伊人久久大香线蕉| av黄色大香蕉| 亚洲第一区二区三区不卡| av免费在线看不卡| 天天躁日日操中文字幕| 国产爽快片一区二区三区| 看十八女毛片水多多多| 菩萨蛮人人尽说江南好唐韦庄| 午夜福利视频1000在线观看| 可以在线观看毛片的网站| 你懂的网址亚洲精品在线观看| 国产成年人精品一区二区| 啦啦啦中文免费视频观看日本| 精品视频人人做人人爽| 久久久久国产网址| 亚洲自拍偷在线| 国产精品久久久久久av不卡| tube8黄色片| 午夜日本视频在线| 啦啦啦中文免费视频观看日本| 涩涩av久久男人的天堂| 日本黄大片高清| 五月玫瑰六月丁香| 免费在线观看成人毛片| 在线精品无人区一区二区三 | 国产一区二区在线观看日韩| 能在线免费看毛片的网站| 可以在线观看毛片的网站| 少妇人妻一区二区三区视频| 天天躁日日操中文字幕| 精品人妻一区二区三区麻豆| 永久免费av网站大全| av在线天堂中文字幕| 精品99又大又爽又粗少妇毛片| 成人亚洲欧美一区二区av| 日韩av免费高清视频| 啦啦啦啦在线视频资源| 成人免费观看视频高清| 亚洲av免费在线观看| 国产人妻一区二区三区在| 伊人久久精品亚洲午夜| 亚洲一级一片aⅴ在线观看| 在线免费观看不下载黄p国产| 国产伦理片在线播放av一区| 亚洲欧洲国产日韩| 插阴视频在线观看视频| 午夜免费男女啪啪视频观看| 最新中文字幕久久久久| 亚洲欧美中文字幕日韩二区| 99re6热这里在线精品视频| 亚洲av福利一区| 性色av一级| 久久女婷五月综合色啪小说 | 久久精品国产亚洲网站| 国产黄片美女视频| 日韩强制内射视频| 亚洲久久久久久中文字幕| 大话2 男鬼变身卡| 91在线精品国自产拍蜜月| 狂野欧美白嫩少妇大欣赏| av福利片在线观看| 97在线视频观看| 狠狠精品人妻久久久久久综合| 国产女主播在线喷水免费视频网站| 一个人观看的视频www高清免费观看| 午夜免费观看性视频| 99热国产这里只有精品6| 乱系列少妇在线播放| 亚洲最大成人中文| 亚洲精品成人久久久久久| 午夜福利视频1000在线观看| 秋霞伦理黄片| 免费av毛片视频| 久久精品国产亚洲网站| av在线亚洲专区| 免费电影在线观看免费观看| 国产美女午夜福利| 人人妻人人澡人人爽人人夜夜| 久久久精品94久久精品| 成人二区视频| 国产女主播在线喷水免费视频网站| 久久精品久久精品一区二区三区| 观看免费一级毛片| 日本色播在线视频| 18禁裸乳无遮挡免费网站照片| 免费黄频网站在线观看国产| 麻豆久久精品国产亚洲av| 一级二级三级毛片免费看| 老女人水多毛片| 自拍偷自拍亚洲精品老妇| 亚洲最大成人手机在线| 国产成人一区二区在线| 高清日韩中文字幕在线| 狂野欧美白嫩少妇大欣赏| 大陆偷拍与自拍| 日韩强制内射视频| 如何舔出高潮| 午夜福利高清视频| 一区二区三区免费毛片| 国产毛片在线视频| 2018国产大陆天天弄谢| 18禁动态无遮挡网站| 欧美精品人与动牲交sv欧美| 国模一区二区三区四区视频| 免费av观看视频| 亚洲av男天堂| 国产 精品1| www.av在线官网国产| 日韩强制内射视频| 真实男女啪啪啪动态图| 欧美日韩精品成人综合77777| 一区二区三区免费毛片| 久久精品熟女亚洲av麻豆精品| 精品一区二区免费观看| 久热久热在线精品观看| 欧美精品人与动牲交sv欧美| 性插视频无遮挡在线免费观看| 日韩一区二区视频免费看| 男女下面进入的视频免费午夜| 最近2019中文字幕mv第一页| 大陆偷拍与自拍| 免费观看性生交大片5| 日韩电影二区| 免费播放大片免费观看视频在线观看| 韩国av在线不卡| av.在线天堂| 日本av手机在线免费观看| 欧美变态另类bdsm刘玥| 一级毛片 在线播放| 超碰97精品在线观看| 国产午夜福利久久久久久| 亚洲色图综合在线观看| 国产成人午夜福利电影在线观看| 久久99热这里只有精品18| 亚洲精品456在线播放app| 国内少妇人妻偷人精品xxx网站| 日日摸夜夜添夜夜爱| 欧美日本视频| 国产成人免费观看mmmm| 成人二区视频| 亚洲av国产av综合av卡| 大香蕉97超碰在线| 亚洲欧美日韩东京热| 久久久久久久午夜电影| 亚洲精品一区蜜桃| 精品久久久久久久久亚洲| 国产精品一区www在线观看| 国产精品三级大全| 噜噜噜噜噜久久久久久91| 国产亚洲一区二区精品| 亚洲天堂av无毛| 狂野欧美激情性bbbbbb| 日本免费在线观看一区| 少妇猛男粗大的猛烈进出视频 | av又黄又爽大尺度在线免费看| 国产v大片淫在线免费观看| 亚洲精品自拍成人| 国内精品宾馆在线| 免费av不卡在线播放| 69人妻影院| 波多野结衣巨乳人妻| 亚洲精品乱久久久久久| 99久久人妻综合| 一区二区三区精品91| 久久久久精品性色| 亚洲第一区二区三区不卡| 亚洲精品影视一区二区三区av| 精品少妇黑人巨大在线播放| 欧美精品国产亚洲| 亚洲天堂国产精品一区在线| 黄片wwwwww| 亚洲成人一二三区av| 亚洲一区二区三区欧美精品 | av福利片在线观看| 69人妻影院| 色5月婷婷丁香| 亚洲精品国产色婷婷电影| 成人综合一区亚洲| 丰满人妻一区二区三区视频av| av国产久精品久网站免费入址| 久久久久国产网址| 欧美性感艳星| 看黄色毛片网站| 九色成人免费人妻av| 成人综合一区亚洲| 国产精品国产三级国产av玫瑰| 内地一区二区视频在线| 亚洲熟女精品中文字幕| 少妇熟女欧美另类| 亚洲av日韩在线播放| 春色校园在线视频观看| 成人亚洲精品一区在线观看 | 亚洲国产欧美在线一区| 老女人水多毛片| 亚洲精品日韩av片在线观看| 欧美丝袜亚洲另类| 在线观看av片永久免费下载| 成年人午夜在线观看视频| 永久网站在线| 18禁在线无遮挡免费观看视频| 成年版毛片免费区| 亚洲,一卡二卡三卡| 免费看光身美女| 91在线精品国自产拍蜜月| 亚洲在久久综合| 舔av片在线| 免费av观看视频| av在线天堂中文字幕| 97超碰精品成人国产| 夫妻午夜视频| 又黄又爽又刺激的免费视频.| 七月丁香在线播放| 国产中年淑女户外野战色| freevideosex欧美| 男人爽女人下面视频在线观看| 在线天堂最新版资源| 成人无遮挡网站| 一个人看的www免费观看视频| 国产精品久久久久久av不卡| 五月开心婷婷网| 亚洲精品影视一区二区三区av| 国产高清不卡午夜福利| 欧美xxxx黑人xx丫x性爽| av福利片在线观看| 嫩草影院入口| 波野结衣二区三区在线| 国产精品久久久久久av不卡| 成人亚洲精品一区在线观看 | 精品一区二区免费观看| 亚洲不卡免费看| 精华霜和精华液先用哪个| 色视频www国产| 黄片无遮挡物在线观看| 午夜激情福利司机影院| 午夜福利网站1000一区二区三区| 五月天丁香电影| 交换朋友夫妻互换小说| 欧美xxxx性猛交bbbb| 神马国产精品三级电影在线观看| 久久久色成人| 身体一侧抽搐| 日韩亚洲欧美综合| 日韩欧美 国产精品| 狂野欧美激情性bbbbbb| 欧美亚洲 丝袜 人妻 在线| 久久久久精品性色| av网站免费在线观看视频| 国产片特级美女逼逼视频| 午夜福利在线观看免费完整高清在| 国产亚洲精品久久久com| 在线看a的网站| 国产精品嫩草影院av在线观看| 国产成人精品久久久久久| 国产 精品1| av在线观看视频网站免费| 亚洲成人一二三区av| 97人妻精品一区二区三区麻豆| 久久久久久久国产电影| 99久久精品热视频| 国产日韩欧美亚洲二区| 日韩大片免费观看网站| 又黄又爽又刺激的免费视频.| 午夜激情久久久久久久| 欧美变态另类bdsm刘玥| 国产综合精华液| 久久久久国产网址| 嫩草影院入口| av.在线天堂| 在现免费观看毛片| 永久免费av网站大全| 午夜爱爱视频在线播放| 午夜福利高清视频| 老司机影院成人| 亚洲成人av在线免费| 69av精品久久久久久| 成人亚洲欧美一区二区av| 久久97久久精品| 亚洲无线观看免费| 一级二级三级毛片免费看| 日本熟妇午夜| videossex国产| 我的老师免费观看完整版| 久久精品夜色国产| 2021天堂中文幕一二区在线观| 国产精品久久久久久久久免| 男女下面进入的视频免费午夜| 中文字幕人妻熟人妻熟丝袜美| 欧美精品国产亚洲| 波多野结衣巨乳人妻| 观看美女的网站| 白带黄色成豆腐渣| 精品久久久精品久久久| 1000部很黄的大片| 秋霞在线观看毛片| eeuss影院久久| 真实男女啪啪啪动态图| 精品久久国产蜜桃| 人妻一区二区av| 校园人妻丝袜中文字幕| 久久女婷五月综合色啪小说 | 观看免费一级毛片| 夫妻午夜视频| 日韩国内少妇激情av| 国产成人免费无遮挡视频| 国产有黄有色有爽视频| 熟女人妻精品中文字幕| 欧美亚洲 丝袜 人妻 在线| 欧美极品一区二区三区四区| 99久久中文字幕三级久久日本| 国产探花在线观看一区二区| 99九九线精品视频在线观看视频| 国产精品.久久久| 日韩亚洲欧美综合| 久久99蜜桃精品久久| 亚洲图色成人|