• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Web垂直搜索引擎實(shí)現(xiàn)過(guò)程的研究

    2016-05-14 00:24:05張弘弦田玉玲
    現(xiàn)代電子技術(shù) 2016年8期
    關(guān)鍵詞:爬蟲(chóng)

    張弘弦 田玉玲

    摘 要: Web垂直搜索引擎是一個(gè)復(fù)雜的信息系統(tǒng),目前大多數(shù)研究都集中在解決搜索引擎中出現(xiàn)的某一個(gè)方面的問(wèn)題,仍缺乏對(duì)Web垂直搜索引擎完整實(shí)現(xiàn)過(guò)程的相關(guān)研究。針對(duì)這個(gè)問(wèn)題,提出一種三層架構(gòu)的Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程,整個(gè)過(guò)程包含數(shù)據(jù)準(zhǔn)備、查詢處理和界面交互。使用Java語(yǔ)言和相關(guān)的開(kāi)源工具,對(duì)實(shí)現(xiàn)過(guò)程描述的具體任務(wù)進(jìn)行實(shí)際操作,實(shí)現(xiàn)了一個(gè)查詢手機(jī)信息的Web垂直搜索引擎。該三層架構(gòu)和實(shí)現(xiàn)過(guò)程有效地為構(gòu)建面向主題的完整Web垂直搜索引擎提供了理論依據(jù)和實(shí)踐指導(dǎo)。

    關(guān)鍵詞: Web搜索; 搜索引擎實(shí)現(xiàn); 垂直搜索架構(gòu); 爬蟲(chóng)

    中圖分類號(hào): TN911?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)08?0055?05

    Research on implementation process of Web vertical search engine

    ZHANG Hongxian, TIAN Yuling

    (School of Computer Science and Technology, Taiyuan University of Technology, Taiyuan 034000, China)

    Abstract: The Web search engine is a complex information system. However, most researches are concentrated on one detailed problem appearing in a aspect of the search engine, but they lack of the correlational research on the complete implementation process of Web vertical search engines. Aiming at this problem, the implementation process of a Web vertical search engine with a three?layer architecture is proposed, in which data preparation, query processing and interface interaction are contained. An actual operation of a certain task describing the implementation process was performed with Java platform and relative open?source tools. And by this operation, the Web vertical search engine that could query mobile information was realized. The three?layer architecture and implementation process provide a theoretical basis and practical guidance for building a complete subject?oriented Web vertical search engine.

    Keywords: Web search; search engine implementation; architecture of vertical search engine; crawler

    0 引 言

    從2000年開(kāi)始,Web垂直搜索引擎開(kāi)始贏得用戶的親睞[1?2]。視頻、音樂(lè)、圖片、軟件、貼吧、地圖分門(mén)別類展開(kāi)搜索,專業(yè)性更強(qiáng),主題相關(guān)性更高。然而Web垂直搜索引擎的應(yīng)用主題并不局限,擁有非常廣闊的發(fā)展空間,例如面對(duì)電子商務(wù)的商品搜索,數(shù)碼產(chǎn)品信息搜索以及近年開(kāi)始出現(xiàn)的微博搜索。垂直搜索的出現(xiàn)主要有兩個(gè)方面的原因:一是通用搜索引擎索引Web的全部?jī)?nèi)容變得越來(lái)越難,而垂直搜索引擎索引數(shù)據(jù)量較小且專業(yè),投入成本也相對(duì)較低;二是垂直搜索引擎提供的搜索質(zhì)量較高,因?yàn)樗梢运阉鞯酵ㄓ盟阉饕娌荒芩褜さ降捻?yè)面,而且在可搜索頁(yè)面上提供更強(qiáng)有力的搜索功能。垂直搜索引擎與通用搜索引擎的最大區(qū)別在于對(duì)網(wǎng)頁(yè)信息進(jìn)行結(jié)構(gòu)化信息抽取,即將網(wǎng)頁(yè)的非結(jié)構(gòu)化數(shù)據(jù)提取成特定的結(jié)構(gòu)化數(shù)據(jù)。構(gòu)建一個(gè)垂直搜索引擎主要有兩種方法:一種方法是通過(guò)爬蟲(chóng)爬取某種主題網(wǎng)頁(yè)而構(gòu)建專業(yè)索引;另一種方法是為用戶提供專業(yè)化搜索的接口。

    Web搜索引擎是種復(fù)雜、多組件信息檢索系統(tǒng)的具體應(yīng)用[3],也因其應(yīng)用在擁有超大規(guī)模數(shù)據(jù)的互聯(lián)網(wǎng)中,使構(gòu)建Web搜索引擎變得比較困難。已有眾多的研究者參與到Web搜索引擎的研究中,Brin和Page發(fā)表論文首次公開(kāi)大規(guī)模Web搜索引擎Google的設(shè)計(jì)原型[4],提出Web搜索引擎的基本組件包括爬蟲(chóng)(Crawler)、索引組件、搜索組件、排序系統(tǒng)以及反饋組件。高效Web垂直搜索的關(guān)鍵之一在于爬蟲(chóng)能否精確爬取主題相關(guān)的Web文檔,Soumen等人提出聚焦爬蟲(chóng)[5](Focused Crawler),利用一種能夠評(píng)估網(wǎng)頁(yè)是否與主題相關(guān)的分類器選擇性地爬取與預(yù)定義主題相關(guān)的頁(yè)面,實(shí)現(xiàn)了以目標(biāo)為導(dǎo)向的爬取。文獻(xiàn)[6]開(kāi)發(fā)了一種潛語(yǔ)義索引分類器,將鏈接分析和文本內(nèi)容結(jié)合起來(lái),目的是抓取指定主題域的Web文檔。文獻(xiàn)[7]設(shè)計(jì)并實(shí)現(xiàn)了一種基于網(wǎng)格架構(gòu)的大型Web搜索引擎,討論實(shí)現(xiàn)流程和細(xì)節(jié),對(duì)Web垂直搜索引擎的研究提供了寶貴的經(jīng)驗(yàn)。信息檢索領(lǐng)域的研究成果對(duì)Web搜索引擎有著較高的參照價(jià)值,特別是檢索模型的研究更加重要,Web搜索引擎的排序組件好壞很大程度上決定了用戶體驗(yàn)。信息檢索模型得到了飛速發(fā)展,傳統(tǒng)的檢索模型包括布爾模型、向量空間模型、概率模型、語(yǔ)言模型?,F(xiàn)代檢索模型的建立大多通過(guò)排序?qū)W習(xí)方法得到,即利用機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)集上自動(dòng)創(chuàng)建排序模型[8]。這些研究成果很多通過(guò)開(kāi)源軟件實(shí)現(xiàn),這些工具不僅為開(kāi)發(fā)軟件提供先進(jìn)的技術(shù)支持,而且大大縮短了開(kāi)發(fā)周期。

    本文提出了一種Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程,以該過(guò)程為基礎(chǔ)開(kāi)發(fā)了一個(gè)查詢與手機(jī)相關(guān)信息的Web垂直搜索引擎,并且對(duì)實(shí)現(xiàn)原理和細(xì)節(jié)進(jìn)行了詳細(xì)的闡述。此垂直搜索引擎可以為搜索手機(jī)相關(guān)信息的用戶提供直觀的、快捷的、有效的手機(jī)信息搜索服務(wù),驗(yàn)證了這種實(shí)現(xiàn)過(guò)程的有效性和完整性。

    1 Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程

    Web垂直搜索引擎與通用搜索引擎原理類似,都需要從互聯(lián)網(wǎng)上下載網(wǎng)頁(yè)、建立索引,響應(yīng)用戶查詢。但是垂直搜索引擎可以返回結(jié)構(gòu)化的數(shù)據(jù),這些數(shù)據(jù)經(jīng)過(guò)人工分析與整理再存入數(shù)據(jù)庫(kù)中。本文將Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程分為3層,分別為:數(shù)據(jù)準(zhǔn)備層、提供查詢服務(wù)層、前臺(tái)交互層。這3層可互相獨(dú)立開(kāi)發(fā),最終整合到一起形成一套完整的Web垂直搜索引擎。圖1為一種Web垂直垂直搜索引擎實(shí)現(xiàn)過(guò)程。

    1.1 數(shù)據(jù)準(zhǔn)備層

    數(shù)據(jù)準(zhǔn)備層的目的是準(zhǔn)備用于檢索的數(shù)據(jù),這些數(shù)據(jù)最終存放在關(guān)系數(shù)據(jù)庫(kù)中并建立倒排索引。Web垂直搜索引擎的目的是為用戶提供更專業(yè)、主題性更強(qiáng)的搜索服務(wù),這種服務(wù)與大量主題相關(guān)的數(shù)據(jù)為基礎(chǔ),數(shù)據(jù)處理分為兩個(gè)階段,第一個(gè)階段為采集原始數(shù)據(jù),原始數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)某些主題性較強(qiáng)的、數(shù)據(jù)來(lái)源可靠的網(wǎng)站。原始數(shù)據(jù)大多是未經(jīng)處理的無(wú)結(jié)構(gòu)網(wǎng)頁(yè),這些原始網(wǎng)頁(yè)無(wú)法支持搜索服務(wù)并返回給用戶查看。第二階段為數(shù)據(jù)分析與處理,將原始無(wú)結(jié)構(gòu)網(wǎng)頁(yè)中的數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),并將這些結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,這些存儲(chǔ)在數(shù)據(jù)庫(kù)中數(shù)據(jù)最終以更加直接的形式展示給用戶。然而,關(guān)系數(shù)據(jù)庫(kù)中模糊查詢難以應(yīng)對(duì)海量數(shù)據(jù)查詢,所以需要建立一種面向詞匯的數(shù)據(jù)結(jié)構(gòu),即倒排索引,以實(shí)現(xiàn)毫秒級(jí)的查詢性能。

    數(shù)據(jù)準(zhǔn)備層主要包含以下5個(gè)過(guò)程:

    (1) 選擇主題信息來(lái)源網(wǎng)站和網(wǎng)頁(yè)

    認(rèn)真選擇主題信息來(lái)源網(wǎng)站以確保原始數(shù)據(jù)的可靠性,通常需要遵循以下4個(gè)原則:來(lái)源網(wǎng)站沒(méi)有屏蔽爬蟲(chóng)對(duì)網(wǎng)頁(yè)的爬取;網(wǎng)頁(yè)內(nèi)容不是JavaScript動(dòng)態(tài)生成的。爬蟲(chóng)不需要模擬瀏覽器解釋腳本去生成網(wǎng)頁(yè)內(nèi)容,否則會(huì)嚴(yán)重影響爬蟲(chóng)效率;網(wǎng)站中網(wǎng)頁(yè)URL有統(tǒng)一的風(fēng)格。這樣的URL更容易被爬蟲(chóng)抓取,數(shù)據(jù)更加準(zhǔn)確;選擇訪問(wèn)量比較大的知名網(wǎng)站,保證數(shù)據(jù)源可靠性。

    (2) 網(wǎng)站和網(wǎng)頁(yè)內(nèi)容分析

    分析網(wǎng)頁(yè)的目的是定向抓取網(wǎng)頁(yè),在確定主題信息來(lái)源網(wǎng)站之后,為了能夠準(zhǔn)確獲取主題數(shù)據(jù),需要對(duì)網(wǎng)站的URL結(jié)構(gòu)進(jìn)行分析,找出實(shí)際擁有主題信息的一級(jí)URL頁(yè)面,該頁(yè)面通常擁有該主題下全部子主題的二級(jí)URL鏈接,分析出這些二級(jí)URL鏈接作為種子鏈接交給爬蟲(chóng)。分析方法主要以人工觀測(cè)為主,以程序分析為輔。通過(guò)觀察一級(jí)網(wǎng)頁(yè)URL規(guī)律,查看網(wǎng)頁(yè)源碼,再設(shè)計(jì)抽取二級(jí)URL的計(jì)算機(jī)程序,利用程序自動(dòng)抽取種子鏈接。

    (3) 定向抓取網(wǎng)頁(yè)

    抓取網(wǎng)頁(yè)的目的是把主題相關(guān)的網(wǎng)頁(yè)下載到本地磁盤(pán)。爬蟲(chóng)是一種能夠從互聯(lián)網(wǎng)上自動(dòng)抓取網(wǎng)頁(yè)并下載到本地的程序,這種程序的輸入是一些URL鏈接,這些鏈接也稱之為種子,爬蟲(chóng)抓取種子網(wǎng)頁(yè)的結(jié)果是將所有相關(guān)目標(biāo)網(wǎng)頁(yè)下載到本地磁盤(pán)中。

    (4) 分析并抽取網(wǎng)頁(yè)內(nèi)容到本地

    將網(wǎng)頁(yè)中無(wú)規(guī)則的數(shù)據(jù)規(guī)范地保存到本地文件中,數(shù)據(jù)保存采取統(tǒng)一的格式,使其能夠存入數(shù)據(jù)庫(kù)并建立全文索引。

    (5) 存入數(shù)據(jù)庫(kù)并建立索引

    格式化的數(shù)據(jù)不能僅存儲(chǔ)在文本文件中,否則提取數(shù)據(jù)的開(kāi)銷非常大。將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中,使用數(shù)據(jù)庫(kù)統(tǒng)一管理所有數(shù)據(jù),這樣訪問(wèn)速度與安全性也大大增強(qiáng)。搜索引擎中數(shù)據(jù)準(zhǔn)備過(guò)程中最關(guān)鍵的技術(shù)就是建立索引,用戶查詢首先訪問(wèn)的是索引而不是數(shù)據(jù)庫(kù),通過(guò)索引查找關(guān)鍵詞然后返回結(jié)果文檔的數(shù)據(jù)庫(kù)ID,再到數(shù)據(jù)庫(kù)中查找具體記錄。

    數(shù)據(jù)準(zhǔn)備層的任務(wù)集中于數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)存儲(chǔ)以及索引。這一層的活動(dòng)對(duì)用戶不可見(jiàn),最終的產(chǎn)物是保存主題相關(guān)結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫(kù)以及這些數(shù)據(jù)上的倒排索引。

    1.2 提供查詢服務(wù)層

    查詢服務(wù)層首先將用戶的查詢字符串轉(zhuǎn)換為可識(shí)別的對(duì)象,并進(jìn)行預(yù)處理,然后發(fā)送給相應(yīng)的查詢方法處理,最后返回與查詢字符串匹配的數(shù)據(jù)對(duì)象列表。要得到最后的數(shù)據(jù)對(duì)象列表實(shí)際經(jīng)過(guò)2次查詢,第一次查詢倒排索引得到所有相關(guān)文檔ID,這次查詢的時(shí)間復(fù)雜度是O(1),因?yàn)榈古潘饕脑~典結(jié)構(gòu)多為哈希表。第二次查詢將文檔ID發(fā)送至數(shù)據(jù)庫(kù)引擎,根據(jù)文檔ID查詢文檔的全部信息,并且將所有查詢到的文檔以對(duì)象的方式返回。

    1.3 前臺(tái)交互層

    前臺(tái)交互層的重點(diǎn)主要是加強(qiáng)用戶輸入和輸出的體驗(yàn),主要包含兩個(gè)方面:一是隨著用戶按鍵自動(dòng)彈出提示關(guān)鍵字列表;二是直接展示查詢結(jié)果詳細(xì)信息。列表提示功能使用Ajax異步響應(yīng),當(dāng)onkeyup事件發(fā)生后,向數(shù)據(jù)庫(kù)服務(wù)器發(fā)送模糊查詢SQL語(yǔ)句,將查詢結(jié)果列表返回給JavaScript代碼,JavaScript修改dom將提示列表展示在搜索框下面。查詢結(jié)果顯示數(shù)據(jù)要直接,例如查詢數(shù)碼產(chǎn)品的結(jié)果中,產(chǎn)品圖片和參數(shù)直接顯示在頁(yè)面上,技術(shù)上同樣是利用Ajax技術(shù)減少延時(shí)來(lái)增加用戶體驗(yàn)。

    2 Web垂直搜索引擎具體實(shí)現(xiàn)

    下面基于以上實(shí)現(xiàn)過(guò)程在Java平臺(tái)上構(gòu)建查詢手機(jī)相關(guān)信息的Web垂直搜索引擎,構(gòu)建過(guò)程分別按照?qǐng)D1中的3層進(jìn)行實(shí)現(xiàn),并對(duì)關(guān)鍵技術(shù)和實(shí)現(xiàn)原理進(jìn)行總結(jié)和描述。

    2.1 數(shù)據(jù)準(zhǔn)備層實(shí)現(xiàn)

    (1) 選擇主題信息來(lái)源網(wǎng)站和網(wǎng)頁(yè)。根據(jù)選擇主題網(wǎng)站的原則,最終確定選擇太平洋電腦網(wǎng)(http://www.pconline.com.cn/)作為手機(jī)信息數(shù)據(jù)的來(lái)源網(wǎng)站,數(shù)據(jù)源網(wǎng)站可以有多個(gè)。作為一個(gè)綜合性IT網(wǎng)站,手機(jī)頻道的一級(jí)URL頁(yè)面為:

    http://product.pconline.com.cn/mobile/list.shtml

    (2) 網(wǎng)站和網(wǎng)頁(yè)內(nèi)容分析。通過(guò)查看一級(jí)URL頁(yè)面源碼,并且分析網(wǎng)站URL鏈接規(guī)律,得出手機(jī)信息數(shù)據(jù)所在的URL地址規(guī)格,如下所示:

    手機(jī)信息:http://product.pconline.com.cn/mobile/品牌/編號(hào).html。

    手機(jī)圖片:http://img.pconline.com.cn/images/product/編號(hào)

    確定URL規(guī)格的目的是為了確定抓取哪些URL規(guī)格的頁(yè)面。獲取所有手機(jī)品牌的URL鏈接后將這些鏈接作為種子,送給爬蟲(chóng)抓取。

    (3) 定向抓取網(wǎng)頁(yè)。爬蟲(chóng)的輸入是待抓取URL種子鏈接,而爬蟲(chóng)抓取的結(jié)果就是將預(yù)定抓取的HTML和圖片等資源下載到本地磁盤(pán)。本次開(kāi)發(fā)使用開(kāi)源爬蟲(chóng)框架Heritrix[9],它是一個(gè)開(kāi)源的Java爬蟲(chóng)框架,它保留了各種各樣的配置接口用于定制和擴(kuò)展爬蟲(chóng)的功能,為了能夠準(zhǔn)確抓取目標(biāo)資源,從官方文檔中了解Heritrix本身運(yùn)行機(jī)制并進(jìn)行配置和定制。

    (4) 分析并抽取網(wǎng)頁(yè)內(nèi)容到本地抓取到的原始網(wǎng)頁(yè)和圖片不能被直接利用,需要將網(wǎng)頁(yè)中的有用數(shù)據(jù)抽取出來(lái)并以一定的格式保存起來(lái),這個(gè)過(guò)程可以稱之為結(jié)構(gòu)化數(shù)據(jù)提取。每一個(gè)有效的HTML文件都對(duì)應(yīng)一個(gè)txt文件,txt文件的內(nèi)容和文件名稱都有固定的結(jié)構(gòu)。本次開(kāi)發(fā)中將文件名規(guī)范為這樣的格式:“手機(jī)名?型號(hào)?時(shí)間字符串.txt”。txt文件的內(nèi)容格式如下:

    原始網(wǎng)頁(yè)URL

    品牌名(如華為)

    價(jià)格

    屬性名1:值1(如操作系統(tǒng):android2.2)…

    ============================

    產(chǎn)品圖片編碼后的文件名

    結(jié)構(gòu)化提取包含3個(gè)過(guò)程:一個(gè)是文件的I/O操作,此操作可以使用Java.io包實(shí)現(xiàn);另一個(gè)是從HTML網(wǎng)頁(yè)中提取數(shù)據(jù),此操作可以使用開(kāi)源解析軟件實(shí)現(xiàn);第三個(gè)過(guò)程是對(duì)圖片進(jìn)行轉(zhuǎn)存處理,這個(gè)過(guò)程的目的是將手機(jī)信息和圖片名稱進(jìn)行映射,新圖片名將原圖片名經(jīng)過(guò)MD5編碼后得到。HTML元素之間是以分層嵌套的結(jié)構(gòu)組織在一起的,HTML文檔的這種結(jié)構(gòu)稱為HTML文檔樹(shù)。本次開(kāi)發(fā)中使用開(kāi)源HTML解析庫(kù)HtmlParser[10],使用這個(gè)庫(kù)可以方便快速地從HTML網(wǎng)頁(yè)中提取標(biāo)簽節(jié)點(diǎn),文本節(jié)點(diǎn)和和屬性節(jié)點(diǎn)的值。同樣,在開(kāi)發(fā)過(guò)程中使用該解析包需要了解其API和調(diào)用機(jī)制,這些內(nèi)容來(lái)源于官方文檔。

    (5) 存入數(shù)據(jù)庫(kù)并建立索引。磁盤(pán)中的數(shù)據(jù)文件是結(jié)構(gòu)化數(shù)據(jù),但是仍然不能直接作為查詢的直接數(shù)據(jù)源,其原因在于磁盤(pán)I/O速度較慢。故而將這些文件的信息存入關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)庫(kù)表的字段對(duì)應(yīng)文件內(nèi)容結(jié)構(gòu)的字段,每一個(gè)文件的數(shù)據(jù)都對(duì)應(yīng)表的一條記錄。在查詢數(shù)據(jù)庫(kù)時(shí)按照產(chǎn)品的主關(guān)鍵字(如ID號(hào))查詢,查詢效率較高。但是用戶的查詢是若干關(guān)鍵詞,實(shí)際是字符串格式,如果直接將查詢關(guān)鍵詞放入SQL語(yǔ)句中,向數(shù)據(jù)庫(kù)發(fā)送模糊查詢匹配關(guān)鍵詞,那么對(duì)于成千上萬(wàn)的記錄來(lái)說(shuō)效率非常低。所以,并不能直接對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢關(guān)鍵詞的模糊查詢,而首先將查詢發(fā)送給倒排索引進(jìn)行查詢。

    倒排索引一種面向詞匯的查找結(jié)構(gòu),通常使用哈希表存儲(chǔ),故查詢效率非常高。倒排索引包括兩個(gè)部分:一個(gè)部分是詞典;另一個(gè)部分是倒排列表。建立索引的過(guò)程中,首先要使用分詞程序?qū)κ謾C(jī)信息文本文件分詞建立詞典,每個(gè)詞典項(xiàng)中包含一個(gè)指向?qū)?yīng)倒排列表的指針,倒排列表由若干倒排項(xiàng)組成,倒排項(xiàng)存儲(chǔ)的是包含該詞匯的文檔屬性(文檔ID,詞頻,單詞在該文檔中出現(xiàn)的位置)。

    用戶的查詢首先由同樣的分詞程序切割為若干詞匯,然后查詢?cè)~典找出對(duì)應(yīng)倒排列表,按照某種規(guī)則對(duì)倒排列表進(jìn)行合并,然后將最后的文檔列表ID發(fā)送給數(shù)據(jù)庫(kù)查詢整個(gè)文檔信息,進(jìn)而將數(shù)據(jù)庫(kù)的返回結(jié)果展示給用戶。綜上,用戶的查詢處理過(guò)程為:“查詢索引”→“獲取每個(gè)相關(guān)文檔的數(shù)據(jù)庫(kù)ID”→“查詢數(shù)據(jù)庫(kù)”→“返回給用戶”。這種查詢機(jī)制決定了必須先將手機(jī)信息存儲(chǔ)在數(shù)據(jù)庫(kù),然后建立索引,構(gòu)建索引和執(zhí)行查詢的機(jī)理如圖2所示。

    本次開(kāi)發(fā)中使用MySQL數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù),使用開(kāi)源Java全文檢索工具包Lucene建立索引[11],使用基于詞庫(kù)的字符串匹配分詞模式,以正向最大匹配為分詞算法,配合極易中文分詞組件進(jìn)行分詞?;谠~庫(kù)的分詞原理是使用正向最大匹配算法掃描待分詞文本,將掃描出的詞匯與詞庫(kù)中的詞進(jìn)行比對(duì),按照一定的匹配粒度去判別該詞匯是否被切分出來(lái)加入索引中,所以分詞前必須在原有詞庫(kù)基礎(chǔ)上增加主題相關(guān)的詞匯作為詞庫(kù)的一部分,開(kāi)發(fā)中首先解析所有txt文件名,將所有手機(jī)名稱和不同的型號(hào)解析出來(lái)作為詞匯單獨(dú)存儲(chǔ)在一個(gè)文本文件中,通過(guò)簡(jiǎn)單的配置即可將文件的詞匯加入到極易分詞的詞庫(kù)中,選用極易分詞組件的另一個(gè)原因是它實(shí)現(xiàn)了Lucene標(biāo)準(zhǔn)分詞解析器的接口,從而可以直接整合進(jìn)Lucene[12]。對(duì)于查詢字符串必須使用同樣的分詞程序去分詞,以同樣的規(guī)則切分出待查詢?cè)~匯,在索引的詞典中查詢是否存在該詞匯,如果存在則返回該詞匯對(duì)應(yīng)的倒排列表,否則返回空,對(duì)于多詞匯查找的處理是根據(jù)邏輯運(yùn)算對(duì)倒排列表進(jìn)行合并后再返回。倒排列表中的文檔排序模型是經(jīng)典的向量空間模型,該模型以文檔的TF*IDF值為向量的特征,實(shí)際參數(shù)可以在Lucene中按需設(shè)置。

    圖2 索引與查詢機(jī)理圖

    2.2 提供查詢服務(wù)層實(shí)現(xiàn)

    提供查詢服務(wù)作為一個(gè)中間層,在整個(gè)搜索引擎中起著非常重要的連接作用,它接收用戶的查詢字符串并預(yù)處理,然后在索引和數(shù)據(jù)庫(kù)中查詢相關(guān)文檔并返回給用戶。

    通過(guò)圖2可知搜索模塊和分詞模塊一起提供查詢服務(wù),實(shí)驗(yàn)中分詞模塊與建立索引所用分詞的模塊有相同的配置,而搜索模塊承擔(dān)查詢索引和數(shù)據(jù)庫(kù)的任務(wù),由Lucene提供的搜索模塊實(shí)現(xiàn),開(kāi)發(fā)中這2個(gè)任務(wù)分別由2個(gè)方法實(shí)現(xiàn),它們是查詢服務(wù)類中的2個(gè)方法,查詢索引方法的參數(shù)是查詢關(guān)鍵詞對(duì)象,返回的是相關(guān)文檔列表對(duì)象,查詢數(shù)據(jù)庫(kù)方法的參數(shù)是整型的文檔ID,返回文檔對(duì)象,如圖3所示。

    2.3 前臺(tái)交互層實(shí)現(xiàn)

    前臺(tái)交互是直接面向用戶的應(yīng)用層,為了增加用戶在輸入和輸出上的體驗(yàn),分別實(shí)現(xiàn)2種功能:一是用戶每次敲擊按鍵時(shí)都會(huì)提示關(guān)鍵詞列表;二是結(jié)果列表頁(yè)面上直接展示主要結(jié)果,包括圖片和其他重要屬性。開(kāi)發(fā)中,列表提示的數(shù)據(jù)來(lái)源于已經(jīng)抽取得到的手機(jī)相關(guān)詞匯,將這些詞匯存入MySQL數(shù)據(jù)庫(kù)的一張表里,針對(duì)該表設(shè)計(jì)一個(gè)查詢方法,參數(shù)是用戶按鍵后提交的當(dāng)前字符串,實(shí)現(xiàn)機(jī)理是向該表發(fā)送模糊查詢,返回字符串?dāng)?shù)組(一般規(guī)定提示字符串個(gè)數(shù)不超過(guò)10)。

    圖3 前臺(tái)交互層與提供查詢服務(wù)層交互

    該方法的調(diào)用是通過(guò)用戶觸發(fā)onkeyup事件,隨即以Ajax機(jī)制向服務(wù)器發(fā)送字符串并完成調(diào)用,前端通過(guò)Ajax代碼接收返回的字符串?dāng)?shù)組作為顯示數(shù)據(jù),使用JavaScript改變dom的方式將這些字符串以列表的方式顯示在輸入框的下面。當(dāng)點(diǎn)擊搜索按鈕后,開(kāi)始向服務(wù)器發(fā)送查詢,前臺(tái)交互層與中間層的交互如圖3所示,它們的交互通過(guò)Ajax框架DWR來(lái)完成,這樣有效降低延時(shí),能夠明顯提高用戶體驗(yàn)。用戶查詢的關(guān)鍵字(query)以及每頁(yè)的起始索引號(hào)(startindex)封裝在Request對(duì)象中,直接通過(guò)Ajax發(fā)送給查詢服務(wù)層的SearchServiceImpl對(duì)象的getSearchResults方法,該方法返回的SearchResults對(duì)象包含了相關(guān)文檔ID的列表,然后將文檔的ID作為參數(shù)發(fā)送給getSearchResultById方法查詢數(shù)據(jù)庫(kù),返回文檔全部信息并封裝在SearchResult對(duì)象中,最后將SearchResult對(duì)象返回到前臺(tái)展示給用戶。

    3 結(jié) 論

    實(shí)驗(yàn)中多次查詢的平均時(shí)間在毫秒級(jí),完成了整個(gè)Web垂直搜索引擎的設(shè)計(jì)目標(biāo)。驗(yàn)證了這種實(shí)現(xiàn)過(guò)程的完整性和有效性。提出的三層架構(gòu)面向的是構(gòu)建主題相關(guān)的Web垂直搜索引擎,通過(guò)實(shí)現(xiàn)查詢手機(jī)信息的Web垂直搜索引擎來(lái)提供一種可操作的實(shí)施方案,為成功構(gòu)建其他面向其他主題的Web垂直搜索引擎提供理論依據(jù)和技術(shù)參照。整個(gè)實(shí)現(xiàn)過(guò)程利用了Java平臺(tái)下的優(yōu)秀開(kāi)源軟件包,包含了可定制爬蟲(chóng)Heritrix、網(wǎng)頁(yè)解析庫(kù)HTMLParser、索引及查詢工具包Lucene、Ajax框架DWR、Bean容器Spring以及MySQL數(shù)據(jù)庫(kù),這些開(kāi)源軟件為搜索引擎的實(shí)現(xiàn)提供了強(qiáng)大的支持,對(duì)于這些軟件的具體使用方法和過(guò)程本文沒(méi)有詳細(xì)贅述,而重點(diǎn)討論了構(gòu)建搜索引擎的實(shí)現(xiàn)過(guò)程、技術(shù)要點(diǎn)和方法。

    由于垂直搜索引擎索引數(shù)據(jù)本身就是面向主題的,所以檢索結(jié)果的主題相關(guān)度、正確率必然比通用搜索引擎高,而且展示數(shù)據(jù)的能力更強(qiáng)??v觀現(xiàn)有的研究成果,作者認(rèn)為未來(lái)Web垂直搜索引擎主要的研究方向有以下幾個(gè)方面:

    (1) 結(jié)構(gòu)化數(shù)據(jù)提取自動(dòng)化。爬蟲(chóng)應(yīng)該能夠自動(dòng)發(fā)現(xiàn)、發(fā)掘Web上主題相關(guān)的來(lái)源網(wǎng)站,并能夠自動(dòng)對(duì)網(wǎng)站內(nèi)容評(píng)級(jí),能夠?qū)崟r(shí)監(jiān)控Web主題網(wǎng)站的頁(yè)面變化并更新本地的頁(yè)面,通過(guò)自動(dòng)化的爬蟲(chóng)的監(jiān)控、爬取、抽取與更新操作增強(qiáng)搜索引擎的靈活性。

    (2) 用戶個(gè)性化。個(gè)性化搜索引擎盡管理論上已經(jīng)得到發(fā)展,但是從理論到實(shí)際應(yīng)用還需要繼續(xù)研究,搜索引擎應(yīng)該能夠自動(dòng)識(shí)別用戶種類、意圖,對(duì)用戶的需求進(jìn)行精確預(yù)測(cè),并對(duì)歧義進(jìn)行自動(dòng)矯正,重點(diǎn)在推薦系統(tǒng)、相關(guān)反饋方面進(jìn)行完善。

    (3) 數(shù)據(jù)可靠性。由于垂直搜索引擎的返回結(jié)果大多是領(lǐng)域相關(guān)的內(nèi)容,返回給用戶的結(jié)果應(yīng)該對(duì)用戶負(fù)責(zé),在醫(yī)療、問(wèn)答、新聞、學(xué)術(shù)等領(lǐng)域的返回結(jié)果應(yīng)保證數(shù)據(jù)來(lái)源的準(zhǔn)確性,對(duì)排名靠前的結(jié)果應(yīng)特別進(jìn)行自動(dòng)的審核,保證信息的可靠性。

    本文通訊作者為田玉玲。

    參考文獻(xiàn)

    [1] 劉天嬌,周瑛.淺析近年來(lái)網(wǎng)絡(luò)搜索引擎研究現(xiàn)狀:以2001至2010年為例[J].情報(bào)科學(xué),2012(8):1192?1195.

    [2] 王文鈞,李巍.垂直搜索引擎的現(xiàn)狀與發(fā)展探究[J].情報(bào)科學(xué),2010(3):477?480.

    [3] 王斌.從信息檢索到搜索引擎[J].產(chǎn)品安全與召回,2009(4):38?43.

    [4] BRIN S, PAGE L. The anatomy of a large?scale hypertextual Web search engine [J]. Computer networks and isdn systems, 1998, 30: 107?117.

    [5] CHAKRABARTIA Soumen, VAN DEN BERGB Martin, DOMC Byron. Focused crawling: A new approach to topic?specific Web resource discovery [J]. Computer networks, 1999, 31: 1623?1640.

    [6] ALMPANIDIS G, KOTROPOULOS C, PITAS I. Combining text and link analysis for focused crawling: An application for vertical search engines [J]. Information systems, 2007, 32(6): 886?908.

    [7] CAMBAZOGLU Barla, KARACA Evren, KUCUKYILMAZ Tayfun, et al. Architecture of a grid?enabled Web search engine [J]. Information processing & management, 2007, 43(3): 609?623.

    [8] LIU Tie?yan. Learning to rank for information retrieval [J]. Foundations and trends in information retrieval, 2009, 3: 225?331.

    [9] 白萬(wàn)民,蘇希樂(lè).Heritrix在垂直搜索引擎中的應(yīng)用[J].計(jì)算機(jī)時(shí)代,2011(9):7?9.

    [10] 桂林斌.基于HtmlParser抽取動(dòng)態(tài)異構(gòu)Web信息的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)與數(shù)字工程,2009,37(7):161?164.

    [11] 張俊,李魯群,周熔.基于Lucene的搜索引擎的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(6):230?232.

    [12] 黃翼彪.實(shí)現(xiàn)Lucene接口的中文分詞器的比較研究[J].科技信息,2012(12):246?247.

    猜你喜歡
    爬蟲(chóng)
    利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說(shuō)
    基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
    善用網(wǎng)絡(luò)爬蟲(chóng)
    基于Django 的分布式爬蟲(chóng)框架設(shè)計(jì)與實(shí)現(xiàn)*
    目前互聯(lián)網(wǎng)中的網(wǎng)絡(luò)爬蟲(chóng)的原理和影響
    網(wǎng)絡(luò)爬蟲(chóng)技術(shù)原理
    誰(shuí)搶走了低價(jià)機(jī)票
    利用爬蟲(chóng)技術(shù)的Geo-Gnutel la VANET流量采集
    大數(shù)據(jù)背景下校園輿情的爬蟲(chóng)應(yīng)用研究
    電子制作(2018年2期)2018-04-18 07:13:42
    大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
    電子制作(2017年9期)2017-04-17 03:00:46
    成人午夜精彩视频在线观看| 久久精品久久久久久噜噜老黄| 最近最新中文字幕免费大全7| 欧美日韩视频高清一区二区三区二| 免费观看的影片在线观看| 亚洲成人一二三区av| 联通29元200g的流量卡| 国产女主播在线喷水免费视频网站| www.色视频.com| 久久综合国产亚洲精品| 成人二区视频| 亚洲,欧美,日韩| 亚洲欧美一区二区三区黑人 | 国产白丝娇喘喷水9色精品| 国产亚洲5aaaaa淫片| 亚洲内射少妇av| 亚洲高清免费不卡视频| 丝瓜视频免费看黄片| 伦精品一区二区三区| 日韩av在线免费看完整版不卡| 亚洲av福利一区| 18禁裸乳无遮挡免费网站照片| 亚洲精品国产av蜜桃| 麻豆成人av视频| 男女边摸边吃奶| 自拍欧美九色日韩亚洲蝌蚪91 | 国产黄片视频在线免费观看| 成年免费大片在线观看| 99re6热这里在线精品视频| 日日啪夜夜撸| 少妇裸体淫交视频免费看高清| 亚洲欧美日韩另类电影网站 | 在线精品无人区一区二区三 | 欧美一区二区亚洲| 久久精品夜色国产| 国产精品国产av在线观看| 国产高潮美女av| 777米奇影视久久| 美女cb高潮喷水在线观看| 精品亚洲乱码少妇综合久久| 在线天堂最新版资源| 日本wwww免费看| 久久99热这里只频精品6学生| 中国国产av一级| 欧美老熟妇乱子伦牲交| 18+在线观看网站| 免费看不卡的av| 又爽又黄无遮挡网站| 性色avwww在线观看| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产精品女同一区二区软件| 一本久久精品| 久久99热6这里只有精品| 又黄又爽又刺激的免费视频.| av在线亚洲专区| 亚州av有码| 亚洲欧洲日产国产| 亚洲经典国产精华液单| 蜜桃亚洲精品一区二区三区| 亚洲精品久久午夜乱码| 男人舔奶头视频| 国产精品麻豆人妻色哟哟久久| videos熟女内射| 91在线精品国自产拍蜜月| 日日撸夜夜添| 人体艺术视频欧美日本| 熟女av电影| 女人久久www免费人成看片| 大话2 男鬼变身卡| 国产一区二区三区av在线| 最近最新中文字幕免费大全7| 久久影院123| 欧美日韩国产mv在线观看视频 | 欧美 日韩 精品 国产| 最近最新中文字幕大全电影3| 日韩成人伦理影院| 人体艺术视频欧美日本| 亚洲欧美精品专区久久| 777米奇影视久久| 亚洲国产色片| 亚洲无线观看免费| 久久精品久久久久久噜噜老黄| 午夜福利视频精品| 一级爰片在线观看| 男的添女的下面高潮视频| 一级a做视频免费观看| 黄色视频在线播放观看不卡| 欧美人与善性xxx| 亚洲天堂av无毛| 国产高清有码在线观看视频| av黄色大香蕉| 亚洲av欧美aⅴ国产| 男女边吃奶边做爰视频| 美女视频免费永久观看网站| 岛国毛片在线播放| av免费在线看不卡| 久久久色成人| 国产又色又爽无遮挡免| 亚洲精品成人久久久久久| 国精品久久久久久国模美| 精品99又大又爽又粗少妇毛片| 国产白丝娇喘喷水9色精品| 久久久久久伊人网av| 插阴视频在线观看视频| 亚洲三级黄色毛片| 只有这里有精品99| av在线播放精品| 精品99又大又爽又粗少妇毛片| 成年版毛片免费区| 精品午夜福利在线看| 国产淫片久久久久久久久| 日韩欧美一区视频在线观看 | av在线蜜桃| 国产男人的电影天堂91| 三级国产精品片| 看免费成人av毛片| 国产欧美另类精品又又久久亚洲欧美| 成年免费大片在线观看| 大陆偷拍与自拍| 美女国产视频在线观看| 国产淫片久久久久久久久| 人人妻人人看人人澡| 亚洲精品,欧美精品| 久久久久久久精品精品| 伊人久久国产一区二区| 精品熟女少妇av免费看| 精品久久久久久久久av| 18禁动态无遮挡网站| 波野结衣二区三区在线| 国产男女内射视频| 晚上一个人看的免费电影| 国产白丝娇喘喷水9色精品| 免费电影在线观看免费观看| 秋霞在线观看毛片| 人人妻人人澡人人爽人人夜夜| 日韩制服骚丝袜av| 色婷婷久久久亚洲欧美| 看黄色毛片网站| 亚洲自拍偷在线| 亚洲aⅴ乱码一区二区在线播放| 老师上课跳d突然被开到最大视频| 在线看a的网站| 久久精品综合一区二区三区| 午夜精品国产一区二区电影 | 欧美激情在线99| 高清在线视频一区二区三区| 亚洲av日韩在线播放| 听说在线观看完整版免费高清| 在线亚洲精品国产二区图片欧美 | 国产乱来视频区| 亚洲在久久综合| 99热网站在线观看| 亚洲人与动物交配视频| 看免费成人av毛片| 亚洲国产欧美人成| 国产爽快片一区二区三区| 亚洲欧美一区二区三区黑人 | a级毛片免费高清观看在线播放| 免费看日本二区| 波野结衣二区三区在线| 欧美性感艳星| av在线app专区| 国产女主播在线喷水免费视频网站| 久久精品综合一区二区三区| 伊人久久国产一区二区| 久久99蜜桃精品久久| 欧美xxxx黑人xx丫x性爽| 夜夜爽夜夜爽视频| 亚洲真实伦在线观看| 亚洲aⅴ乱码一区二区在线播放| 亚洲人成网站高清观看| 亚洲av国产av综合av卡| 国产成人a∨麻豆精品| 亚洲人成网站高清观看| 看非洲黑人一级黄片| 亚洲综合精品二区| 欧美人与善性xxx| 色吧在线观看| 免费看日本二区| 你懂的网址亚洲精品在线观看| 久久久国产一区二区| 国产69精品久久久久777片| 伊人久久精品亚洲午夜| 国产一区亚洲一区在线观看| 国产v大片淫在线免费观看| 国产老妇女一区| 一级a做视频免费观看| 免费在线观看成人毛片| 国产白丝娇喘喷水9色精品| 啦啦啦在线观看免费高清www| 国产乱来视频区| 在线a可以看的网站| 亚洲内射少妇av| 国产精品蜜桃在线观看| 亚洲欧美一区二区三区黑人 | 亚洲内射少妇av| 极品教师在线视频| 寂寞人妻少妇视频99o| 欧美性猛交╳xxx乱大交人| 伊人久久国产一区二区| 亚洲成人中文字幕在线播放| 简卡轻食公司| 人人妻人人澡人人爽人人夜夜| 欧美国产精品一级二级三级 | 亚洲成人一二三区av| 欧美日韩一区二区视频在线观看视频在线 | a级毛片免费高清观看在线播放| 久久久久久久国产电影| 亚洲精品自拍成人| 在线观看免费高清a一片| 日韩欧美一区视频在线观看 | 亚洲自拍偷在线| 高清欧美精品videossex| 人人妻人人爽人人添夜夜欢视频 | 亚洲欧美一区二区三区黑人 | 国产综合精华液| 中文字幕人妻熟人妻熟丝袜美| 日韩av在线免费看完整版不卡| 一二三四中文在线观看免费高清| 国产伦理片在线播放av一区| 男女边吃奶边做爰视频| 老女人水多毛片| 一区二区三区精品91| 插阴视频在线观看视频| 白带黄色成豆腐渣| 国产综合精华液| 午夜精品一区二区三区免费看| 深夜a级毛片| 亚洲最大成人手机在线| 国产成人精品福利久久| 我要看日韩黄色一级片| 精品一区二区三卡| 亚洲一级一片aⅴ在线观看| 建设人人有责人人尽责人人享有的 | 亚洲性久久影院| 大码成人一级视频| av在线app专区| 中文欧美无线码| 在线 av 中文字幕| 看免费成人av毛片| 亚洲av一区综合| 国产日韩欧美在线精品| 亚洲av男天堂| 在线亚洲精品国产二区图片欧美 | 欧美成人午夜免费资源| 一区二区三区精品91| 国产亚洲精品久久久com| 人妻制服诱惑在线中文字幕| 舔av片在线| 在线观看人妻少妇| 菩萨蛮人人尽说江南好唐韦庄| 秋霞在线观看毛片| 久久久久久九九精品二区国产| 国产免费一区二区三区四区乱码| 少妇高潮的动态图| 美女xxoo啪啪120秒动态图| 久久久久久久亚洲中文字幕| 亚洲国产av新网站| 欧美成人精品欧美一级黄| 免费观看av网站的网址| 国产成人精品婷婷| 久久精品夜色国产| 国产成人freesex在线| 精品国产乱码久久久久久小说| 69人妻影院| 精品视频人人做人人爽| 亚洲国产精品专区欧美| 欧美极品一区二区三区四区| 91午夜精品亚洲一区二区三区| 王馨瑶露胸无遮挡在线观看| 国产欧美亚洲国产| av一本久久久久| 99热这里只有是精品50| 日韩制服骚丝袜av| 亚洲不卡免费看| 亚洲欧美日韩无卡精品| 少妇熟女欧美另类| 亚洲av欧美aⅴ国产| 性色avwww在线观看| 亚洲欧美日韩东京热| 91久久精品国产一区二区三区| 亚洲人成网站高清观看| 免费电影在线观看免费观看| 久久久久久久国产电影| 国产一区二区在线观看日韩| 午夜激情福利司机影院| 午夜福利网站1000一区二区三区| 久久久久九九精品影院| .国产精品久久| 一级毛片久久久久久久久女| av在线亚洲专区| 国国产精品蜜臀av免费| 国产色婷婷99| 99久久中文字幕三级久久日本| 国产v大片淫在线免费观看| 亚洲精品视频女| 99久久精品国产国产毛片| 网址你懂的国产日韩在线| 在线观看美女被高潮喷水网站| 精品视频人人做人人爽| 少妇的逼好多水| 中文字幕人妻熟人妻熟丝袜美| 精品国产乱码久久久久久小说| 天堂俺去俺来也www色官网| 身体一侧抽搐| 久久久色成人| 在线看a的网站| 插阴视频在线观看视频| 老司机影院毛片| 69av精品久久久久久| 亚洲欧美成人精品一区二区| 久久久精品欧美日韩精品| 黄色欧美视频在线观看| 国产成年人精品一区二区| 熟妇人妻不卡中文字幕| 亚洲自拍偷在线| 少妇熟女欧美另类| 欧美亚洲 丝袜 人妻 在线| 精品人妻熟女av久视频| 交换朋友夫妻互换小说| 中文乱码字字幕精品一区二区三区| av天堂中文字幕网| 大片免费播放器 马上看| 国产探花极品一区二区| 综合色丁香网| 国产精品99久久久久久久久| 视频中文字幕在线观看| 伦精品一区二区三区| 亚洲最大成人av| 成年女人在线观看亚洲视频 | 麻豆成人av视频| 搡老乐熟女国产| 成年女人在线观看亚洲视频 | 久久久久久久久久成人| 听说在线观看完整版免费高清| 赤兔流量卡办理| 国产黄a三级三级三级人| 一级爰片在线观看| 欧美精品国产亚洲| 夜夜爽夜夜爽视频| 麻豆国产97在线/欧美| 国产高清三级在线| 又粗又硬又长又爽又黄的视频| 内地一区二区视频在线| www.色视频.com| 高清毛片免费看| 五月伊人婷婷丁香| 亚洲久久久久久中文字幕| 美女主播在线视频| 久久久久久久国产电影| 日韩制服骚丝袜av| 国产乱人偷精品视频| 草草在线视频免费看| 香蕉精品网在线| 哪个播放器可以免费观看大片| 亚洲精品中文字幕在线视频 | 免费看光身美女| 99九九线精品视频在线观看视频| 人妻一区二区av| 偷拍熟女少妇极品色| 国产毛片在线视频| 亚洲,一卡二卡三卡| 99re6热这里在线精品视频| 青青草视频在线视频观看| 国产成人一区二区在线| 亚洲色图综合在线观看| 人人妻人人澡人人爽人人夜夜| 久久韩国三级中文字幕| 欧美区成人在线视频| 欧美成人一区二区免费高清观看| 人体艺术视频欧美日本| 日韩亚洲欧美综合| 91久久精品电影网| 51国产日韩欧美| 天天躁夜夜躁狠狠久久av| 国产美女午夜福利| 亚洲精品日韩在线中文字幕| 免费看av在线观看网站| 五月伊人婷婷丁香| 国产在线一区二区三区精| 亚洲国产精品专区欧美| 亚洲av成人精品一区久久| 国产精品国产三级国产av玫瑰| 又黄又爽又刺激的免费视频.| 日韩三级伦理在线观看| 99久久精品一区二区三区| 欧美另类一区| 中国美白少妇内射xxxbb| 亚洲av一区综合| 日本熟妇午夜| 国产成人a∨麻豆精品| 三级经典国产精品| 插阴视频在线观看视频| 永久免费av网站大全| 人妻少妇偷人精品九色| 亚洲av国产av综合av卡| 嘟嘟电影网在线观看| 看非洲黑人一级黄片| 丝瓜视频免费看黄片| 亚洲av男天堂| 成年女人在线观看亚洲视频 | 看十八女毛片水多多多| 亚洲国产最新在线播放| 国产午夜福利久久久久久| 国产亚洲精品久久久com| 两个人的视频大全免费| 最近2019中文字幕mv第一页| 午夜日本视频在线| 干丝袜人妻中文字幕| 少妇人妻一区二区三区视频| 中文字幕免费在线视频6| 免费播放大片免费观看视频在线观看| 最近最新中文字幕大全电影3| 精品少妇久久久久久888优播| 春色校园在线视频观看| 国产淫语在线视频| av国产免费在线观看| 一本久久精品| 18禁裸乳无遮挡免费网站照片| 亚洲不卡免费看| 国产精品麻豆人妻色哟哟久久| 黄色日韩在线| 精品一区二区免费观看| 色婷婷久久久亚洲欧美| 日韩成人伦理影院| 亚洲欧美日韩无卡精品| 国产成人a∨麻豆精品| tube8黄色片| 亚洲av日韩在线播放| 激情 狠狠 欧美| 成人欧美大片| 精品久久国产蜜桃| 欧美激情久久久久久爽电影| 国产av国产精品国产| 免费看光身美女| 校园人妻丝袜中文字幕| 五月开心婷婷网| 一二三四中文在线观看免费高清| 欧美最新免费一区二区三区| 精品久久久久久久末码| 国产精品久久久久久久电影| 国产亚洲av嫩草精品影院| 国产老妇女一区| 大香蕉97超碰在线| 久久久亚洲精品成人影院| 97精品久久久久久久久久精品| 只有这里有精品99| 91精品国产九色| 视频区图区小说| 中文在线观看免费www的网站| 久久久久久久久大av| 国产成人a区在线观看| 国产精品三级大全| 中文资源天堂在线| 69av精品久久久久久| 免费av不卡在线播放| 国产精品福利在线免费观看| 亚洲精品成人av观看孕妇| 国产黄频视频在线观看| 国产欧美日韩一区二区三区在线 | eeuss影院久久| 别揉我奶头 嗯啊视频| 国产精品久久久久久精品电影| 国产 一区 欧美 日韩| 一级片'在线观看视频| 波多野结衣巨乳人妻| 国产综合精华液| 黄色日韩在线| 国产精品嫩草影院av在线观看| 男的添女的下面高潮视频| 久久精品国产亚洲网站| 亚洲欧洲国产日韩| 免费少妇av软件| 一级毛片电影观看| 免费看光身美女| 一级毛片我不卡| 午夜福利网站1000一区二区三区| 99热全是精品| 日韩精品有码人妻一区| 尤物成人国产欧美一区二区三区| 久久久国产一区二区| 国产毛片在线视频| 嫩草影院入口| 两个人的视频大全免费| 性色av一级| 亚洲欧洲国产日韩| 一级毛片aaaaaa免费看小| 欧美性猛交╳xxx乱大交人| 亚洲色图av天堂| 国产亚洲av嫩草精品影院| 亚洲av中文av极速乱| 如何舔出高潮| 成人国产麻豆网| 国产一区有黄有色的免费视频| 97在线视频观看| 国产伦理片在线播放av一区| 毛片一级片免费看久久久久| 三级国产精品欧美在线观看| 99热这里只有是精品在线观看| 国产精品秋霞免费鲁丝片| 欧美一级a爱片免费观看看| 我要看日韩黄色一级片| 三级经典国产精品| 中文乱码字字幕精品一区二区三区| 亚洲欧美精品专区久久| 伊人久久国产一区二区| 夫妻午夜视频| 黄色一级大片看看| 一本一本综合久久| 街头女战士在线观看网站| 别揉我奶头 嗯啊视频| 亚洲国产欧美在线一区| 80岁老熟妇乱子伦牲交| 久久6这里有精品| 全区人妻精品视频| 亚洲人与动物交配视频| 26uuu在线亚洲综合色| 观看免费一级毛片| 91久久精品国产一区二区三区| 国产欧美亚洲国产| 日韩亚洲欧美综合| 日韩欧美精品v在线| 欧美成人午夜免费资源| 久久久国产一区二区| 亚洲国产日韩一区二区| 国产精品熟女久久久久浪| 亚洲真实伦在线观看| 亚洲图色成人| 久久久久久国产a免费观看| 黄色配什么色好看| 国产淫片久久久久久久久| 日韩欧美精品v在线| tube8黄色片| 国产综合精华液| 欧美三级亚洲精品| 色视频www国产| 国产精品一及| 日韩成人伦理影院| 春色校园在线视频观看| 免费高清在线观看视频在线观看| 亚洲国产精品国产精品| 男女国产视频网站| 人人妻人人澡人人爽人人夜夜| 在线免费十八禁| 婷婷色综合大香蕉| 日韩视频在线欧美| 免费观看性生交大片5| 制服丝袜香蕉在线| 国产精品伦人一区二区| 亚州av有码| 高清视频免费观看一区二区| 久久久久九九精品影院| 亚洲av国产av综合av卡| 亚洲人成网站在线播| 国产精品人妻久久久影院| 亚洲,欧美,日韩| 午夜福利视频1000在线观看| 国产精品偷伦视频观看了| 国产在线一区二区三区精| a级毛片免费高清观看在线播放| 伦理电影大哥的女人| 黄色视频在线播放观看不卡| 又大又黄又爽视频免费| 人人妻人人看人人澡| 欧美成人一区二区免费高清观看| 国产精品国产三级专区第一集| 伊人久久国产一区二区| 久久人人爽av亚洲精品天堂 | 中国三级夫妇交换| 亚洲国产精品999| 久久久久九九精品影院| 亚洲精品日韩av片在线观看| 男女无遮挡免费网站观看| 国精品久久久久久国模美| 交换朋友夫妻互换小说| 亚洲久久久久久中文字幕| 一级毛片电影观看| 国产有黄有色有爽视频| 香蕉精品网在线| 久久久国产一区二区| 国产白丝娇喘喷水9色精品| 日韩 亚洲 欧美在线| 免费av毛片视频| 人人妻人人爽人人添夜夜欢视频 | 国产成人精品婷婷| 岛国毛片在线播放| 国产黄色视频一区二区在线观看| 国产伦精品一区二区三区视频9| 午夜免费男女啪啪视频观看| 春色校园在线视频观看| 久久精品国产自在天天线| av专区在线播放| 精品久久久精品久久久| 亚洲自拍偷在线| 成人欧美大片| 最后的刺客免费高清国语| 中文欧美无线码| 国产欧美日韩精品一区二区| 美女内射精品一级片tv| 一区二区三区精品91| 成人美女网站在线观看视频| 亚洲色图综合在线观看| 天天躁夜夜躁狠狠久久av| 中文在线观看免费www的网站| 91在线精品国自产拍蜜月| 22中文网久久字幕| 精品亚洲乱码少妇综合久久| 深爱激情五月婷婷| 三级国产精品欧美在线观看| 99久久人妻综合| 国产精品女同一区二区软件| 亚洲av日韩在线播放| 精品亚洲乱码少妇综合久久| 日本爱情动作片www.在线观看| 国产永久视频网站|