• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Lucene中文分析器在書目搜索應(yīng)用中的比較研究

    2014-08-08 03:41:30王澤賢
    現(xiàn)代情報(bào) 2014年4期
    關(guān)鍵詞:分析器

    基金項(xiàng)目:本文系廣州市教育科學(xué)“十二五”規(guī)劃課題項(xiàng)目“關(guān)于用開源軟件實(shí)現(xiàn)OPAC 20的研究”(項(xiàng)目編號(hào):11A147)研究成果之一。

    作者簡(jiǎn)介:王澤賢(1972-),男,副研究館員,研究方向:圖書館計(jì)算機(jī)自動(dòng)化、知識(shí)管理,發(fā)表論文10多篇?!I(yè)務(wù)研究·

    〔摘要〕針對(duì)基于Lucene實(shí)現(xiàn)中文書目搜索系統(tǒng)的項(xiàng)目中,如何選擇最合適的Lucene中文分析器進(jìn)行了研究。通過大量實(shí)驗(yàn),對(duì)Lucene自帶的3個(gè)分析器及開發(fā)活躍度較高的兩個(gè)第三方中文分析器,從分詞效果,建立索引的時(shí)間和空間,檢索的時(shí)間、檢全率和平均檢準(zhǔn)率等方面進(jìn)行了分析比較。綜合實(shí)驗(yàn)分析結(jié)果,指出ik分析器總體性能最優(yōu),為最佳選擇。

    〔關(guān)鍵詞〕Lucene;書目搜索;中文分詞;分析器

    DOI:10.3969/j.issn.1008-0821.2014.04.030

    〔中圖分類號(hào)〕G25071〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2014)04-0132-05

    Comparative Study on Application of Lucene Chinese

    Analyzer in Bibliographic RetrievalWang Zexian

    (Library,Guangzhou University,Guangzhou 510006,China)

    〔Abstract〕How to choose the most appropriate Chinese analyzer Lucene in Chinese bibliographic Retrieval system which bases on Lucene?With a lot of experiments,the author has compared three analyzers and two kinds of third party Chinese analyzers that are development of high active,which were all owned by Lucene.From the effect of Chinese segmentation,indexing time and space,and time retrieval,recall and average precision,etc.the author deemed that the IK analyzer was the best selection,due to its best overall performance.

    〔Keywords〕lucene;bibliographic retrieval;chinese segmentation;analyzer

    Lucene作為Apache軟件基金會(huì)的一個(gè)頂級(jí)項(xiàng)目,是一個(gè)開放源碼的全文檢索工具包。Lucene以其開源可免費(fèi)使用、架構(gòu)清晰、擴(kuò)展性高、索引結(jié)構(gòu)優(yōu)異、性能高、跨平臺(tái)、易使用等優(yōu)點(diǎn),近年來越來越廣泛地被應(yīng)用到各類應(yīng)用系統(tǒng)中,實(shí)現(xiàn)全文索引和搜索功能?;贚ucene開發(fā)書目搜索系統(tǒng),實(shí)現(xiàn)對(duì)書目信息任意關(guān)鍵詞進(jìn)行全文檢索,可提高書目搜索的查全率、查準(zhǔn)率,并簡(jiǎn)化讀者的查詢操作,是一個(gè)較好的解決方案。

    分詞技術(shù)對(duì)于搜索引擎來說是一個(gè)非常重要的指標(biāo)。中文信息和英文信息有一個(gè)明顯的差別:英語單詞之間用空格分隔;而在中文文本中,詞與詞之間沒有天然的分隔符,中文詞匯大多是由2個(gè)或2個(gè)以上的漢字組成的,并且詞句是連續(xù)書寫的[1]。因?yàn)橹形奈谋局性~和詞之間不像英文一樣存在邊界,所以中文分詞是一個(gè)專業(yè)處理中文信息的搜索引擎首先面對(duì)的問題[2]。中文語言雖然句子間有標(biāo)點(diǎn)分隔,但詞與詞之間沒有分隔符,需要靠程序切分出詞。Lucene中通過分析器(Analyzer)進(jìn)行詞法過濾和分析,實(shí)現(xiàn)對(duì)文本分詞,選擇一個(gè)合適的分析器是基于Lucene實(shí)現(xiàn)中文搜索系統(tǒng)成功的關(guān)鍵。在CNKI中檢索,目前只有2篇文獻(xiàn)專門對(duì)Lucene的中文分析器的比較研究:文獻(xiàn)[3]只是對(duì)6種主流中文分詞器分別進(jìn)行測(cè)試,簡(jiǎn)單地從分詞結(jié)果、分詞速度進(jìn)行對(duì)比;文獻(xiàn)[4]較為深入,對(duì)基于Lucene的中文分析器,從對(duì)語句分詞、分詞速度、建立索引的空間與時(shí)間、檢索結(jié)果以及檢索速度等方面進(jìn)行比較。這2篇文獻(xiàn)都是針對(duì)一般中文文本進(jìn)行評(píng)測(cè),并且沒有從開發(fā)活躍度等方面進(jìn)行研究。本文針對(duì)基于Lucene實(shí)現(xiàn)書目搜索系統(tǒng)的項(xiàng)目中,如何選擇最合適的Lucene中文分析器實(shí)現(xiàn)中文書目搜索進(jìn)行研究:首先,根據(jù)開發(fā)活躍度選定了參與本文研究的Lucene中文分析器;然后,使用大量的中文書目數(shù)據(jù),通過詳盡的實(shí)驗(yàn)對(duì)這些分析器從分詞效果,建立索引的時(shí)間和空間,檢索的時(shí)間、檢全率和平均檢準(zhǔn)率等方面進(jìn)行了分析比較;最后,綜合分析、比較實(shí)驗(yàn)結(jié)果,選擇出最佳的Lucene中文分析器。

    1參與評(píng)測(cè)的Lucene中文分析器

    11選取參與評(píng)測(cè)的Lucene中文分析器

    Lucene保持了較高的開發(fā)活躍度,每一新版本都會(huì)帶來較大的性能提升和功能增強(qiáng)。Lucene為了保證最高的性能與更多的功能,犧牲了部分向后兼容性,新版本的接口可能會(huì)有所改變,使得一些未能及時(shí)更新的分析器在高版本中會(huì)無法使用。目前Lucene的最新版本是44,在30、40、42等版本的分析器接口都有所改變。所以對(duì)于實(shí)現(xiàn)中文書目搜索,選擇Lucene分析器的首要條件是可處理中文文本外,有較高的開發(fā)活躍度也是首要考慮條件之一,使其能緊密跟進(jìn)Lucene版本變動(dòng),適應(yīng)最新版本的接口,以便在系統(tǒng)中應(yīng)用最新的Lucene技術(shù)。所以本文首先對(duì)Lucene中文分析器從最近更新時(shí)間、更新版本、支持Lucene版本這幾個(gè)指標(biāo)進(jìn)行開發(fā)活躍度的比較分析,選取開發(fā)活躍度高,符合最新Lucene 44版接口的分析器參與下一步的深入評(píng)測(cè)。

    目前較常見的支持中文的Lucene分析器有Standard Analyzer、CJK Analyzer、Smart Chinese Analyzer、ik[5]、mmseg4j[6]、paoding[7]。Standard Analyzer、Chinese Analyzer、CJK Analyzer、Smart Chinese Analyzer是Lucene自帶分析器,與Lucene保持同步更新,所以不用參與本步測(cè)試而直接通過。開放活躍度的比較主要針對(duì)ik、mmseg4j、paoding這些第三方提供的分析器進(jìn)行,通過訪問這些分析器的原始網(wǎng)站,獲取它們的開發(fā)、發(fā)布信息,比較結(jié)果如表1所示。Lucene的內(nèi)部分析器Chinese Analyzer功能與Standard Analyzer差不多,并且在Lucene 31版開始已被不贊成使用,并在Lucene 50開始會(huì)移出Lucene[8];還有一種早幾年較多人談?wù)摰腗M Analyzer,目前能找到的最新版本是153,在2009年開始原始網(wǎng)站已經(jīng)找不到下載,并且聲明不提供維護(hù)和支持[9]。所以Chinese Analyzer、MM Analyzer在本文不參與比較。表1分析器開發(fā)活躍度比較

    分析器最后更新日期最新版本支持Lucene版本ik2012-10-292012 FF40mmseg4j2013-01-18191431paoding2010-01-203030

    endprint

    paoding主要在1x、2x版的Lucene應(yīng)用比較多,最后提供的運(yùn)行包是在2008年6月3日提供的204版,只能在Lucene的2x版運(yùn)行;在2010年1月20日,針對(duì)Lucene的30版提供了SVN方式下載的源程序包,之后再無更新。ik與mmseg4j開放活躍度相對(duì)較高,其中mmseg4j最高,可以直接支持Lucene 44,而ik要另行下載修改程序,才能在Lucene 44版運(yùn)行[10]。所以在第三方提供的分析器中,本文只選取ik與mmseg4j參與評(píng)測(cè)。

    12參與評(píng)測(cè)的Lucene中文分析器概述

    Lucene處理中文分詞的常用切分方式有3種:(1)單字方式,1個(gè)中文單字為1個(gè)詞;(2)二元覆蓋方式,相鄰的2個(gè)中文單字為1個(gè)詞;(3)分詞方式,按照一定算法,把中文的句子切分成有意義的詞。Standard Analyzer是單字方式,CJK Analyzer是二元覆蓋方式,Smart Chinese Analyzer、ik、mmseg4j都是分詞方式。分詞式切詞算法可分為機(jī)械分詞方法、基于統(tǒng)計(jì)的分詞方法和基于理解的分詞方法三大類。機(jī)械分詞方法是目前較常見的分詞算法,它是按照一定的策略將待分析的漢字串與詞典中的詞條進(jìn)行匹配,若在詞典中找到某個(gè)字符串,則識(shí)別出一個(gè)詞。按照掃描方向的不同,機(jī)械分詞方法可以分為正向匹配和逆向匹配;按照不同長(zhǎng)度優(yōu)先匹配的情況,可以分為最大匹配和最小匹配等。常用的幾種機(jī)械分詞方法有:(1)正向最大匹配法;(2)逆向最大匹配法;(3)最少切分,使每一句中切出的詞數(shù)最小;(4)最大切分,使每一句中切出的詞數(shù)最大。實(shí)驗(yàn)已經(jīng)證明,逆向最大匹配的準(zhǔn)確率會(huì)比正向最大匹配的準(zhǔn)確率略高,正向最大匹配分詞算法的匹配錯(cuò)誤率是1/169,而逆向最大匹配分詞算法的匹配錯(cuò)誤率是1/245[11]。ik分析器采用正反向匹配方式,提高了匹配正確率,它提供了細(xì)粒度與智能2種分析器:以IK Analyzer()方式建立的是細(xì)粒度分析器;以IK Analyzer(true)方式建立時(shí)是智能分析器(本文下面用IK Analyzer()表示ik的細(xì)粒度分析器,IK Analyzer(true)表示ik的智能分析器)。mmseg4j根據(jù)分詞算法的不同,提供了Simple Analyzer、Complex Analyzer、Max Word Analyzer 3種分析器。表2是參與本文評(píng)測(cè)的Lucene中文分析器概述。表2分析器概述

    分析器分詞方式說明Standard Analyzer單字方式,根據(jù)空格和符號(hào)來分割原始的文本信息,一個(gè)中文單字為一個(gè)詞還可以完成數(shù)字、字母、E-mail地址、IP地址的分析,支持過濾詞表CJK Analyzer二元覆蓋方式,根據(jù)空格和符號(hào)來分割原始的文本信息,相鄰的兩個(gè)中文單字為一個(gè)詞Smart Chinese Analyzer基于隱馬爾科夫模型,根據(jù)漢語詞匯的詞頻和跳轉(zhuǎn)概率對(duì)整個(gè)漢語句子進(jìn)行分詞,是中國(guó)科學(xué)院計(jì)算技術(shù)研究所的ICTCLAS中文分詞程序的java實(shí)現(xiàn)是原來的imdict-chinese-analyzer。帶有ICTCLAS 10詞庫,暫不支持用戶自定義詞庫ikIK Analyzer()細(xì)粒度分析器,以詞典為基礎(chǔ)的正反向最大切分方式分詞IK Analyzer(true)智能分析器,以詞典為基礎(chǔ)的正反向最大匹配方式分詞自帶的默認(rèn)主詞典有近27萬的詞匯量,可以通過API以及配置文件指定詞庫文件實(shí)現(xiàn)詞庫擴(kuò)充mmseg4jSimple Analyzer基于Tsai Chih-Hao的MMSeg算法,正向最大匹配分詞Complex Analyzer是在Simple模式上加了4個(gè)過慮規(guī)則,詞語的正確識(shí)別提高到了9841%Max Word Analyzer在Complex基礎(chǔ)上實(shí)現(xiàn)了最大切分方式分詞自帶的主詞典是將近15萬的sogou詞庫,支持用戶自定義詞庫

    2分析器比較

    實(shí)驗(yàn)環(huán)境為Windows 7操作系統(tǒng),Intel T7250處理器,3G內(nèi)存,Lucene版本為44。

    21分詞效果比較

    分別對(duì)《開發(fā)自己的搜索引擎:Lucene 20+Heritrix》、《中華人民共和國(guó)專利法實(shí)施細(xì)則》這2本書的題名進(jìn)行分詞,比較結(jié)果見表3:

    表3分詞效果比較

    分析器題名1分詞結(jié)果題名2分詞結(jié)果Standard Analyzer開/發(fā)/自/己/的/搜/索/引/擎/lucene/20/heritrix中/華/人/民/共/和/國(guó)/專/利/法/實(shí)/施/細(xì)/則CJK Analyzer開發(fā)/發(fā)自/自己/己的/的搜/搜索/索引/引擎/lucene/20/heritrix中華/華人/人民/民共/共和/和國(guó)/國(guó)專/專利/利法/法實(shí)/實(shí)施/施細(xì)/細(xì)則Smart Chinese Analyzer開發(fā)/自己/的/搜索引擎/lucen/2/0/heritrix〖〗中華人民共和國(guó)/專利法/實(shí)施/細(xì)則IK Analyzer()開發(fā)/發(fā)自/自己/搜索引擎/搜索/索引/引擎/lucene/20/heritrix中華人民共和國(guó)/中華人民/中華/華人/人民共和國(guó)/人民/共和國(guó)/共和/國(guó)/專利法/專利/法/實(shí)施細(xì)則/實(shí)施/細(xì)則IK Analyzer(true)開發(fā)/自己/搜索引擎/lucene/20/heritrix中華人民共和國(guó)/專利法/實(shí)施細(xì)則mmseg4j的Simple Analyzer開發(fā)/自己的/搜索/引擎/lucene/2/0/heritrix中華人民共和國(guó)/專利法/實(shí)施細(xì)則mmseg4j的Complex Analyzer開發(fā)/自己的/搜索/引擎/lucene/2/0/heritrix〖〗中華人民共和國(guó)/專利法/實(shí)施細(xì)則mmseg4j的Max Word Analyzer開發(fā)/自己/的/搜索/引擎/lucene/2/0/heritrix中華/華人/人民/共和/國(guó)/專利/法/實(shí)施/細(xì)則

    從表3可以看出,這些分析器都會(huì)將標(biāo)點(diǎn)符號(hào)去除,都能正確地將英語單詞切分出來,也都能將數(shù)字切分出來,但相對(duì)來說Standard Analyzer、CJK Analyzer、ik分析器對(duì)數(shù)字的切分更加準(zhǔn)確。Standard Analyzer采用單字方式,CJK Analyzer采用二元覆蓋方式,而基于分詞方式的Smart Chinese Analyzer、ik、mmseg4j分詞效果明顯較好,其中Smart Chinese Analyzer和ik分詞最為準(zhǔn)確,都能將“搜索引擎”和“中華人民共和國(guó)”準(zhǔn)確切分出來。ik的IK Analyzer()可以切分出最多的詞;mmseg4j的3種分析器中,Max Word Analyzer相對(duì)于Simple Analyzer和Complex Analyzer也可以切分出較多的詞。

    22建立索引比較

    該實(shí)驗(yàn)對(duì)廣州大學(xué)圖書館最新的10萬條中文書目記錄內(nèi)容建立索引:首先,將這10萬條書目記錄從ILAS Ⅲ中導(dǎo)出,并生成一個(gè)文本文件,該文件大小為758MB,每一條書目記錄按格式“書目記錄號(hào):書目文本內(nèi)容”生成一行文本數(shù)據(jù),書目文本內(nèi)容是書目MARC記錄的題名、責(zé)任者、出版者、主題詞、簡(jiǎn)介等所有數(shù)據(jù)字段的文本內(nèi)容。然后,使用各分析器,通過該文本文件逐行按書目記錄號(hào)、書目文本內(nèi)容建立索引。各分析器建立索引占用的時(shí)間、空間的結(jié)果見表4。表4建立索引的時(shí)間、空間比較

    endprint

    分析器時(shí)間(ms)空間(MB)Standard Analyzer64 847821CJK Analyzer73 189880Smart Chinese Analyzer387 615774IK Analyzer()112 541918IK Analyzer(true)106 237744mmseg4j的Simple Analyzer75 612748mmseg4j的Complex Analyzer76 140747mmseg4j的Max Word Analyzer78 734756

    由實(shí)驗(yàn)結(jié)果可以看出,Standard Analyzer的算法最簡(jiǎn)單,耗時(shí)最小,而Smart Chinese Analyzer和ik的分詞算法復(fù)雜,所以建立索引耗時(shí)較長(zhǎng);IK Analyzer()采用最大切分算法得到的詞最多,所以占用的空間最大;mmseg4j的采用的是正向匹配,近乎是將原句在若干個(gè)位置進(jìn)行切分,分詞后的詞語冗余少,所以在建立索引的時(shí)間和空間性能方面,綜合最優(yōu)。

    23檢索結(jié)果比較

    該實(shí)驗(yàn)分別使用上面實(shí)驗(yàn)各分析器建立的索引,對(duì)書目文本內(nèi)容進(jìn)行檢索。對(duì)IK Analyzer()建立的索引分別用IK Analyzer()、IK Analyzer(true)對(duì)檢索詞進(jìn)行解析(IK Analyzer()表示用IK Analyzer()解析,IK Analyzer()-IK Analyzer(true)表示用IK Analyzer(true)解析),其它的,采用與建立索引對(duì)應(yīng)相同的分析器對(duì)檢索詞進(jìn)行解析;查詢解析器缺省的邏輯操作為“與”(Query Parser.Operator.AND);分別用檢索詞“平凡的世界”和“平凡世界”進(jìn)行檢索《平凡的世界》一書的書目信息。實(shí)驗(yàn)結(jié)果見表5,表中的時(shí)間單位為毫秒(ms),檢全率=檢索結(jié)果中的相關(guān)記錄÷系統(tǒng)中存在的相關(guān)記錄,平均檢準(zhǔn)率按文獻(xiàn)[12]的無干擾的平均檢準(zhǔn)率計(jì)算方法得出。

    表5檢索結(jié)果比較

    分析器平凡的世界平凡世界檢索

    時(shí)間返回

    記錄數(shù)檢全率平均

    檢準(zhǔn)率檢索

    時(shí)間返回

    記錄數(shù)檢全率平均

    檢準(zhǔn)率Standard Analyzer81371002447741100190CJK Analyzer583101556000Smart Chinese Analyzer68241003635425100306IK Analyzer()552810030652000IK Analyzer()-IK Analyzer(true)55281003065728100306IK Analyzer(true)61211004405521100440mmseg4j的Simple Analyzer55181005175519100340mmseg4j的Complex Analyzer55191004405420100306mmseg4j的Max Word Analyzer57261003065327100254

    由實(shí)驗(yàn)結(jié)果可以看出,Lucene的檢索速度優(yōu)異,Standard Analyzer需較長(zhǎng)的檢索時(shí)間,也只需81毫秒就可從10萬條書目記錄中檢索出所需記錄。當(dāng)檢索詞與所檢內(nèi)容一致時(shí),所有分析器都可以成功檢索出結(jié)果,并且CJK Analyze的平均檢準(zhǔn)率最高;但當(dāng)檢索詞較為模糊時(shí),CJK Analyzer與IK Analyzer()都容易出現(xiàn)檢索不到結(jié)果的情況,這主要是因?yàn)樗鼈兌加锌赡軐z索詞分解出無關(guān)詞參與檢索,例如檢索詞“平凡世界”會(huì)分解成“平凡?凡世?世界”3個(gè)詞進(jìn)行檢索,從而檢索不出結(jié)果。所以使用ik分析器時(shí),無論是用IK Analyzer()或IK Analyzer(true)建立索引,進(jìn)行檢索詞解析時(shí),都應(yīng)使用IK Analyzer(true)解析器,避免出現(xiàn)檢索不出結(jié)果的情況。綜合考慮,Smart Chinese Analyzer、ik和mmseg4j這些基于分詞方式切詞的分析器檢索結(jié)果較好,都可在較短時(shí)間內(nèi)完成檢索,并且檢全率和平均檢率都較高,其中,ik分析器最優(yōu)。

    3結(jié)語

    本文為了選擇最合適的Lucene中文分析器實(shí)現(xiàn)中文書目搜索,選定了Lucene自帶的中文分析器:Standard Analyzer、CJK Analyzer、Smart Chinese Analyzer,和開發(fā)活躍度比較高的第三方中文分析器:ik、mmseg4j,并通過大量實(shí)驗(yàn)數(shù)據(jù)對(duì)這些分析器進(jìn)行分析比較。綜合考慮分詞效果,建立索引的時(shí)間和空間,檢索的時(shí)間、檢全率和平均檢準(zhǔn)率,ik分析器總體性能最優(yōu),而且它可以簡(jiǎn)便地實(shí)現(xiàn)詞庫擴(kuò)充,從而可以將書目信息中的作者姓名、出版社等提取出來用于擴(kuò)充ik詞庫,進(jìn)一步提高書目搜索的檢全率和檢準(zhǔn)率。Smart Chinese Analyzer和mmseg4j分析器也有較好的表現(xiàn),特別是Smart Chinese Analyzer由Lucene自帶,可以保證與Lucene的同步更新,有一定優(yōu)勢(shì),但它建立索引花費(fèi)時(shí)間太長(zhǎng),并且不支持用戶擴(kuò)展詞庫。該研究結(jié)果對(duì)其它基于Lucene、Solr實(shí)現(xiàn)中文全文搜索的項(xiàng)目中,選擇中文分析器時(shí)也有一定的參考價(jià)值。

    參考文獻(xiàn)

    [1]李曉明,閆宏飛,王繼民.搜索引擎:原理、技術(shù)與系統(tǒng)[M].北京:科學(xué)出版社,2012:58.

    [2]羅剛.解密搜索引擎技術(shù)實(shí)戰(zhàn):Lucene & Java精華版[M].北京:電子工業(yè)出版社,2011:166.

    [3]黃翼彪.實(shí)現(xiàn)Lucene接口的中文分詞器的比較研究[J].科技信息,2012,(12):246-247.

    [4]義天鵬,陳啟安.基于Lucene的中文分析器分詞性能比較研究[J].計(jì)算機(jī)工程,2012,(22):279-282.

    [5]ik-analyzer-java開源中文分詞器-Google Project Hosting[EB/OL].http:∥code.google.com/p/ik-analyzer/,2013-08-22.

    [6]mmseg4j-MMSEG for java lucene chinese analyzer,or for solr-Google Project Hosting[EB/OL].http:∥code.google.com/p/mmseg4j/,2013-08-22.

    [7]paoding Lucene中文分詞“庖丁解?!盤aoding Analysis-Google Project Hosting[EB/OL].http:∥code.google.com/p/paoding/,2013-08-22.

    [8]Chinese Analyzer(Lucene 440 API)[EB/OL].http:∥lucene.apache.org/core/440/analyzers-common/index.html,2013-08-22.

    [9]Lucene中文分析器的中文分詞準(zhǔn)確性和性能比較[EB/OL].http:∥approximation.iteye.com/blog/345885,2013-08-22.

    [10]與lucene,solr版本同步的ik分詞[EB/OL].https:∥github.com/qingw/ik-analyzer/,2013-08-22.

    [11]湯國(guó)鋒,徐振偉,張華熊.基于Lucene的中文分詞技術(shù)研究[J].電腦編程技巧與維護(hù),2012,(10):4-5,12.

    [12]常娥,侯漢清.平均檢準(zhǔn)率研究[J].情報(bào)科學(xué),2006,(4):627-631.

    (本文責(zé)任編輯:馬卓)

    endprint

    分析器時(shí)間(ms)空間(MB)Standard Analyzer64 847821CJK Analyzer73 189880Smart Chinese Analyzer387 615774IK Analyzer()112 541918IK Analyzer(true)106 237744mmseg4j的Simple Analyzer75 612748mmseg4j的Complex Analyzer76 140747mmseg4j的Max Word Analyzer78 734756

    由實(shí)驗(yàn)結(jié)果可以看出,Standard Analyzer的算法最簡(jiǎn)單,耗時(shí)最小,而Smart Chinese Analyzer和ik的分詞算法復(fù)雜,所以建立索引耗時(shí)較長(zhǎng);IK Analyzer()采用最大切分算法得到的詞最多,所以占用的空間最大;mmseg4j的采用的是正向匹配,近乎是將原句在若干個(gè)位置進(jìn)行切分,分詞后的詞語冗余少,所以在建立索引的時(shí)間和空間性能方面,綜合最優(yōu)。

    23檢索結(jié)果比較

    該實(shí)驗(yàn)分別使用上面實(shí)驗(yàn)各分析器建立的索引,對(duì)書目文本內(nèi)容進(jìn)行檢索。對(duì)IK Analyzer()建立的索引分別用IK Analyzer()、IK Analyzer(true)對(duì)檢索詞進(jìn)行解析(IK Analyzer()表示用IK Analyzer()解析,IK Analyzer()-IK Analyzer(true)表示用IK Analyzer(true)解析),其它的,采用與建立索引對(duì)應(yīng)相同的分析器對(duì)檢索詞進(jìn)行解析;查詢解析器缺省的邏輯操作為“與”(Query Parser.Operator.AND);分別用檢索詞“平凡的世界”和“平凡世界”進(jìn)行檢索《平凡的世界》一書的書目信息。實(shí)驗(yàn)結(jié)果見表5,表中的時(shí)間單位為毫秒(ms),檢全率=檢索結(jié)果中的相關(guān)記錄÷系統(tǒng)中存在的相關(guān)記錄,平均檢準(zhǔn)率按文獻(xiàn)[12]的無干擾的平均檢準(zhǔn)率計(jì)算方法得出。

    表5檢索結(jié)果比較

    分析器平凡的世界平凡世界檢索

    時(shí)間返回

    記錄數(shù)檢全率平均

    檢準(zhǔn)率檢索

    時(shí)間返回

    記錄數(shù)檢全率平均

    檢準(zhǔn)率Standard Analyzer81371002447741100190CJK Analyzer583101556000Smart Chinese Analyzer68241003635425100306IK Analyzer()552810030652000IK Analyzer()-IK Analyzer(true)55281003065728100306IK Analyzer(true)61211004405521100440mmseg4j的Simple Analyzer55181005175519100340mmseg4j的Complex Analyzer55191004405420100306mmseg4j的Max Word Analyzer57261003065327100254

    由實(shí)驗(yàn)結(jié)果可以看出,Lucene的檢索速度優(yōu)異,Standard Analyzer需較長(zhǎng)的檢索時(shí)間,也只需81毫秒就可從10萬條書目記錄中檢索出所需記錄。當(dāng)檢索詞與所檢內(nèi)容一致時(shí),所有分析器都可以成功檢索出結(jié)果,并且CJK Analyze的平均檢準(zhǔn)率最高;但當(dāng)檢索詞較為模糊時(shí),CJK Analyzer與IK Analyzer()都容易出現(xiàn)檢索不到結(jié)果的情況,這主要是因?yàn)樗鼈兌加锌赡軐z索詞分解出無關(guān)詞參與檢索,例如檢索詞“平凡世界”會(huì)分解成“平凡?凡世?世界”3個(gè)詞進(jìn)行檢索,從而檢索不出結(jié)果。所以使用ik分析器時(shí),無論是用IK Analyzer()或IK Analyzer(true)建立索引,進(jìn)行檢索詞解析時(shí),都應(yīng)使用IK Analyzer(true)解析器,避免出現(xiàn)檢索不出結(jié)果的情況。綜合考慮,Smart Chinese Analyzer、ik和mmseg4j這些基于分詞方式切詞的分析器檢索結(jié)果較好,都可在較短時(shí)間內(nèi)完成檢索,并且檢全率和平均檢率都較高,其中,ik分析器最優(yōu)。

    3結(jié)語

    本文為了選擇最合適的Lucene中文分析器實(shí)現(xiàn)中文書目搜索,選定了Lucene自帶的中文分析器:Standard Analyzer、CJK Analyzer、Smart Chinese Analyzer,和開發(fā)活躍度比較高的第三方中文分析器:ik、mmseg4j,并通過大量實(shí)驗(yàn)數(shù)據(jù)對(duì)這些分析器進(jìn)行分析比較。綜合考慮分詞效果,建立索引的時(shí)間和空間,檢索的時(shí)間、檢全率和平均檢準(zhǔn)率,ik分析器總體性能最優(yōu),而且它可以簡(jiǎn)便地實(shí)現(xiàn)詞庫擴(kuò)充,從而可以將書目信息中的作者姓名、出版社等提取出來用于擴(kuò)充ik詞庫,進(jìn)一步提高書目搜索的檢全率和檢準(zhǔn)率。Smart Chinese Analyzer和mmseg4j分析器也有較好的表現(xiàn),特別是Smart Chinese Analyzer由Lucene自帶,可以保證與Lucene的同步更新,有一定優(yōu)勢(shì),但它建立索引花費(fèi)時(shí)間太長(zhǎng),并且不支持用戶擴(kuò)展詞庫。該研究結(jié)果對(duì)其它基于Lucene、Solr實(shí)現(xiàn)中文全文搜索的項(xiàng)目中,選擇中文分析器時(shí)也有一定的參考價(jià)值。

    參考文獻(xiàn)

    [1]李曉明,閆宏飛,王繼民.搜索引擎:原理、技術(shù)與系統(tǒng)[M].北京:科學(xué)出版社,2012:58.

    [2]羅剛.解密搜索引擎技術(shù)實(shí)戰(zhàn):Lucene & Java精華版[M].北京:電子工業(yè)出版社,2011:166.

    [3]黃翼彪.實(shí)現(xiàn)Lucene接口的中文分詞器的比較研究[J].科技信息,2012,(12):246-247.

    [4]義天鵬,陳啟安.基于Lucene的中文分析器分詞性能比較研究[J].計(jì)算機(jī)工程,2012,(22):279-282.

    [5]ik-analyzer-java開源中文分詞器-Google Project Hosting[EB/OL].http:∥code.google.com/p/ik-analyzer/,2013-08-22.

    [6]mmseg4j-MMSEG for java lucene chinese analyzer,or for solr-Google Project Hosting[EB/OL].http:∥code.google.com/p/mmseg4j/,2013-08-22.

    [7]paoding Lucene中文分詞“庖丁解?!盤aoding Analysis-Google Project Hosting[EB/OL].http:∥code.google.com/p/paoding/,2013-08-22.

    [8]Chinese Analyzer(Lucene 440 API)[EB/OL].http:∥lucene.apache.org/core/440/analyzers-common/index.html,2013-08-22.

    [9]Lucene中文分析器的中文分詞準(zhǔn)確性和性能比較[EB/OL].http:∥approximation.iteye.com/blog/345885,2013-08-22.

    [10]與lucene,solr版本同步的ik分詞[EB/OL].https:∥github.com/qingw/ik-analyzer/,2013-08-22.

    [11]湯國(guó)鋒,徐振偉,張華熊.基于Lucene的中文分詞技術(shù)研究[J].電腦編程技巧與維護(hù),2012,(10):4-5,12.

    [12]常娥,侯漢清.平均檢準(zhǔn)率研究[J].情報(bào)科學(xué),2006,(4):627-631.

    (本文責(zé)任編輯:馬卓)

    endprint

    分析器時(shí)間(ms)空間(MB)Standard Analyzer64 847821CJK Analyzer73 189880Smart Chinese Analyzer387 615774IK Analyzer()112 541918IK Analyzer(true)106 237744mmseg4j的Simple Analyzer75 612748mmseg4j的Complex Analyzer76 140747mmseg4j的Max Word Analyzer78 734756

    由實(shí)驗(yàn)結(jié)果可以看出,Standard Analyzer的算法最簡(jiǎn)單,耗時(shí)最小,而Smart Chinese Analyzer和ik的分詞算法復(fù)雜,所以建立索引耗時(shí)較長(zhǎng);IK Analyzer()采用最大切分算法得到的詞最多,所以占用的空間最大;mmseg4j的采用的是正向匹配,近乎是將原句在若干個(gè)位置進(jìn)行切分,分詞后的詞語冗余少,所以在建立索引的時(shí)間和空間性能方面,綜合最優(yōu)。

    23檢索結(jié)果比較

    該實(shí)驗(yàn)分別使用上面實(shí)驗(yàn)各分析器建立的索引,對(duì)書目文本內(nèi)容進(jìn)行檢索。對(duì)IK Analyzer()建立的索引分別用IK Analyzer()、IK Analyzer(true)對(duì)檢索詞進(jìn)行解析(IK Analyzer()表示用IK Analyzer()解析,IK Analyzer()-IK Analyzer(true)表示用IK Analyzer(true)解析),其它的,采用與建立索引對(duì)應(yīng)相同的分析器對(duì)檢索詞進(jìn)行解析;查詢解析器缺省的邏輯操作為“與”(Query Parser.Operator.AND);分別用檢索詞“平凡的世界”和“平凡世界”進(jìn)行檢索《平凡的世界》一書的書目信息。實(shí)驗(yàn)結(jié)果見表5,表中的時(shí)間單位為毫秒(ms),檢全率=檢索結(jié)果中的相關(guān)記錄÷系統(tǒng)中存在的相關(guān)記錄,平均檢準(zhǔn)率按文獻(xiàn)[12]的無干擾的平均檢準(zhǔn)率計(jì)算方法得出。

    表5檢索結(jié)果比較

    分析器平凡的世界平凡世界檢索

    時(shí)間返回

    記錄數(shù)檢全率平均

    檢準(zhǔn)率檢索

    時(shí)間返回

    記錄數(shù)檢全率平均

    檢準(zhǔn)率Standard Analyzer81371002447741100190CJK Analyzer583101556000Smart Chinese Analyzer68241003635425100306IK Analyzer()552810030652000IK Analyzer()-IK Analyzer(true)55281003065728100306IK Analyzer(true)61211004405521100440mmseg4j的Simple Analyzer55181005175519100340mmseg4j的Complex Analyzer55191004405420100306mmseg4j的Max Word Analyzer57261003065327100254

    由實(shí)驗(yàn)結(jié)果可以看出,Lucene的檢索速度優(yōu)異,Standard Analyzer需較長(zhǎng)的檢索時(shí)間,也只需81毫秒就可從10萬條書目記錄中檢索出所需記錄。當(dāng)檢索詞與所檢內(nèi)容一致時(shí),所有分析器都可以成功檢索出結(jié)果,并且CJK Analyze的平均檢準(zhǔn)率最高;但當(dāng)檢索詞較為模糊時(shí),CJK Analyzer與IK Analyzer()都容易出現(xiàn)檢索不到結(jié)果的情況,這主要是因?yàn)樗鼈兌加锌赡軐z索詞分解出無關(guān)詞參與檢索,例如檢索詞“平凡世界”會(huì)分解成“平凡?凡世?世界”3個(gè)詞進(jìn)行檢索,從而檢索不出結(jié)果。所以使用ik分析器時(shí),無論是用IK Analyzer()或IK Analyzer(true)建立索引,進(jìn)行檢索詞解析時(shí),都應(yīng)使用IK Analyzer(true)解析器,避免出現(xiàn)檢索不出結(jié)果的情況。綜合考慮,Smart Chinese Analyzer、ik和mmseg4j這些基于分詞方式切詞的分析器檢索結(jié)果較好,都可在較短時(shí)間內(nèi)完成檢索,并且檢全率和平均檢率都較高,其中,ik分析器最優(yōu)。

    3結(jié)語

    本文為了選擇最合適的Lucene中文分析器實(shí)現(xiàn)中文書目搜索,選定了Lucene自帶的中文分析器:Standard Analyzer、CJK Analyzer、Smart Chinese Analyzer,和開發(fā)活躍度比較高的第三方中文分析器:ik、mmseg4j,并通過大量實(shí)驗(yàn)數(shù)據(jù)對(duì)這些分析器進(jìn)行分析比較。綜合考慮分詞效果,建立索引的時(shí)間和空間,檢索的時(shí)間、檢全率和平均檢準(zhǔn)率,ik分析器總體性能最優(yōu),而且它可以簡(jiǎn)便地實(shí)現(xiàn)詞庫擴(kuò)充,從而可以將書目信息中的作者姓名、出版社等提取出來用于擴(kuò)充ik詞庫,進(jìn)一步提高書目搜索的檢全率和檢準(zhǔn)率。Smart Chinese Analyzer和mmseg4j分析器也有較好的表現(xiàn),特別是Smart Chinese Analyzer由Lucene自帶,可以保證與Lucene的同步更新,有一定優(yōu)勢(shì),但它建立索引花費(fèi)時(shí)間太長(zhǎng),并且不支持用戶擴(kuò)展詞庫。該研究結(jié)果對(duì)其它基于Lucene、Solr實(shí)現(xiàn)中文全文搜索的項(xiàng)目中,選擇中文分析器時(shí)也有一定的參考價(jià)值。

    參考文獻(xiàn)

    [1]李曉明,閆宏飛,王繼民.搜索引擎:原理、技術(shù)與系統(tǒng)[M].北京:科學(xué)出版社,2012:58.

    [2]羅剛.解密搜索引擎技術(shù)實(shí)戰(zhàn):Lucene & Java精華版[M].北京:電子工業(yè)出版社,2011:166.

    [3]黃翼彪.實(shí)現(xiàn)Lucene接口的中文分詞器的比較研究[J].科技信息,2012,(12):246-247.

    [4]義天鵬,陳啟安.基于Lucene的中文分析器分詞性能比較研究[J].計(jì)算機(jī)工程,2012,(22):279-282.

    [5]ik-analyzer-java開源中文分詞器-Google Project Hosting[EB/OL].http:∥code.google.com/p/ik-analyzer/,2013-08-22.

    [6]mmseg4j-MMSEG for java lucene chinese analyzer,or for solr-Google Project Hosting[EB/OL].http:∥code.google.com/p/mmseg4j/,2013-08-22.

    [7]paoding Lucene中文分詞“庖丁解?!盤aoding Analysis-Google Project Hosting[EB/OL].http:∥code.google.com/p/paoding/,2013-08-22.

    [8]Chinese Analyzer(Lucene 440 API)[EB/OL].http:∥lucene.apache.org/core/440/analyzers-common/index.html,2013-08-22.

    [9]Lucene中文分析器的中文分詞準(zhǔn)確性和性能比較[EB/OL].http:∥approximation.iteye.com/blog/345885,2013-08-22.

    [10]與lucene,solr版本同步的ik分詞[EB/OL].https:∥github.com/qingw/ik-analyzer/,2013-08-22.

    [11]湯國(guó)鋒,徐振偉,張華熊.基于Lucene的中文分詞技術(shù)研究[J].電腦編程技巧與維護(hù),2012,(10):4-5,12.

    [12]常娥,侯漢清.平均檢準(zhǔn)率研究[J].情報(bào)科學(xué),2006,(4):627-631.

    (本文責(zé)任編輯:馬卓)

    endprint

    猜你喜歡
    分析器
    基于內(nèi)存共享的多道分析器與應(yīng)用軟件數(shù)據(jù)交換的設(shè)計(jì)
    離子注入機(jī)分析器模型的自動(dòng)調(diào)束控制方法
    酒精分析器為什么能分辨人是否喝過酒
    Apache日志分析器設(shè)計(jì)
    多邊形電極線形離子阱質(zhì)量分析器的結(jié)構(gòu)與性能
    液質(zhì)聯(lián)用儀離子源與質(zhì)量分析器的類型及其在食品安全檢測(cè)中的應(yīng)用
    CO2紅外線氣體分析器示值誤差的不確定度評(píng)定
    應(yīng)用于詞法分析器的算法分析優(yōu)化
    熱導(dǎo)式氣體分析器校準(zhǔn)方法
    X射線法分析金屬的精細(xì)結(jié)構(gòu)
    国产精品久久久人人做人人爽| 丝袜在线中文字幕| 久久香蕉精品热| 国产三级在线视频| 99热只有精品国产| 亚洲中文av在线| 国产精品久久久人人做人人爽| 国产蜜桃级精品一区二区三区| 国产精品久久久人人做人人爽| a级毛片a级免费在线| 亚洲一码二码三码区别大吗| 亚洲精品美女久久av网站| 国产主播在线观看一区二区| 亚洲电影在线观看av| 怎么达到女性高潮| 中文亚洲av片在线观看爽| 丁香欧美五月| av在线天堂中文字幕| 无人区码免费观看不卡| 国产亚洲精品综合一区在线观看 | 一a级毛片在线观看| 香蕉丝袜av| 美女 人体艺术 gogo| 我的亚洲天堂| 中文亚洲av片在线观看爽| 午夜福利一区二区在线看| av视频在线观看入口| 少妇的丰满在线观看| 欧美日本视频| 啦啦啦免费观看视频1| 亚洲无线在线观看| 制服丝袜大香蕉在线| 久久国产乱子伦精品免费另类| 法律面前人人平等表现在哪些方面| 啦啦啦观看免费观看视频高清| 亚洲午夜精品一区,二区,三区| 麻豆久久精品国产亚洲av| 午夜福利欧美成人| 亚洲国产欧洲综合997久久, | 亚洲免费av在线视频| 后天国语完整版免费观看| 一本一本综合久久| 亚洲av中文字字幕乱码综合 | 久久久久久亚洲精品国产蜜桃av| 91九色精品人成在线观看| 久久精品人妻少妇| 丝袜美腿诱惑在线| 熟女少妇亚洲综合色aaa.| 欧美日韩瑟瑟在线播放| 巨乳人妻的诱惑在线观看| 久久人妻福利社区极品人妻图片| 老司机福利观看| 色婷婷久久久亚洲欧美| 午夜福利欧美成人| 禁无遮挡网站| 久久国产亚洲av麻豆专区| 国产爱豆传媒在线观看 | 欧美乱妇无乱码| 国产精品一区二区免费欧美| 精品国产超薄肉色丝袜足j| 久久精品国产清高在天天线| 国产精品 欧美亚洲| 可以在线观看毛片的网站| 国产高清视频在线播放一区| 长腿黑丝高跟| 国产成人一区二区三区免费视频网站| 午夜日韩欧美国产| 99re在线观看精品视频| www.www免费av| 级片在线观看| 亚洲成人久久性| 日韩三级视频一区二区三区| 国产亚洲欧美98| 亚洲av成人一区二区三| 亚洲精品一区av在线观看| 久久中文字幕一级| 法律面前人人平等表现在哪些方面| 精品福利观看| 国产精品二区激情视频| 午夜激情福利司机影院| 亚洲va日本ⅴa欧美va伊人久久| 亚洲真实伦在线观看| 嫩草影院精品99| 午夜老司机福利片| 欧美激情久久久久久爽电影| 国产精品,欧美在线| 禁无遮挡网站| 国产精品一区二区免费欧美| 午夜福利在线在线| 国产精品精品国产色婷婷| 99久久精品国产亚洲精品| 色播在线永久视频| 97人妻精品一区二区三区麻豆 | 免费观看精品视频网站| 午夜福利高清视频| 亚洲七黄色美女视频| 国产亚洲欧美精品永久| 妹子高潮喷水视频| 成在线人永久免费视频| 欧美中文综合在线视频| 亚洲精品中文字幕在线视频| 欧美性猛交╳xxx乱大交人| 亚洲成国产人片在线观看| 少妇熟女aⅴ在线视频| 久久精品夜夜夜夜夜久久蜜豆 | 久久久精品国产亚洲av高清涩受| 欧美日本视频| 久久99热这里只有精品18| 高清毛片免费观看视频网站| 淫妇啪啪啪对白视频| 欧美不卡视频在线免费观看 | 国产精品野战在线观看| 久久亚洲真实| 国产野战对白在线观看| 在线观看一区二区三区| 精品国产一区二区三区四区第35| 久久中文看片网| 最近最新免费中文字幕在线| 无人区码免费观看不卡| 十分钟在线观看高清视频www| 在线播放国产精品三级| 久久久久久久久免费视频了| 日韩国内少妇激情av| 一进一出抽搐gif免费好疼| 婷婷六月久久综合丁香| 天天添夜夜摸| 99热6这里只有精品| 一本精品99久久精品77| 欧美精品啪啪一区二区三区| 韩国精品一区二区三区| 99精品欧美一区二区三区四区| 亚洲aⅴ乱码一区二区在线播放 | 99精品久久久久人妻精品| 成人18禁高潮啪啪吃奶动态图| 老司机在亚洲福利影院| 亚洲精品粉嫩美女一区| xxxwww97欧美| 欧美激情久久久久久爽电影| 国产精品九九99| 欧美丝袜亚洲另类 | 看黄色毛片网站| 亚洲精品一区av在线观看| 亚洲av熟女| xxx96com| www.自偷自拍.com| 18禁美女被吸乳视频| 精品久久久久久久久久久久久 | 麻豆av在线久日| 国内精品久久久久精免费| av中文乱码字幕在线| а√天堂www在线а√下载| 在线播放国产精品三级| ponron亚洲| 国产亚洲精品久久久久5区| 亚洲国产中文字幕在线视频| 大型黄色视频在线免费观看| 夜夜爽天天搞| 亚洲国产欧美网| 精华霜和精华液先用哪个| 日韩高清综合在线| 好看av亚洲va欧美ⅴa在| 中文字幕人成人乱码亚洲影| 69av精品久久久久久| 91老司机精品| 一级a爱片免费观看的视频| 1024视频免费在线观看| 搡老熟女国产l中国老女人| av在线播放免费不卡| 亚洲五月婷婷丁香| 亚洲va日本ⅴa欧美va伊人久久| 91麻豆精品激情在线观看国产| 国产真实乱freesex| 一本大道久久a久久精品| 国产主播在线观看一区二区| 午夜福利视频1000在线观看| 久久久久免费精品人妻一区二区 | 最新在线观看一区二区三区| 久久国产精品影院| 女性生殖器流出的白浆| svipshipincom国产片| 国产成人欧美| 日本a在线网址| 最新美女视频免费是黄的| www.自偷自拍.com| 中亚洲国语对白在线视频| 精品国内亚洲2022精品成人| 日韩欧美一区视频在线观看| 俺也久久电影网| 九色国产91popny在线| 两个人看的免费小视频| tocl精华| 熟女少妇亚洲综合色aaa.| 精品卡一卡二卡四卡免费| 在线观看www视频免费| 国产私拍福利视频在线观看| 色精品久久人妻99蜜桃| 国产精品 欧美亚洲| www日本在线高清视频| 久久精品人妻少妇| 91成年电影在线观看| 国产真实乱freesex| 日本一本二区三区精品| 亚洲电影在线观看av| 美女高潮喷水抽搐中文字幕| 桃红色精品国产亚洲av| 正在播放国产对白刺激| 女同久久另类99精品国产91| 亚洲,欧美精品.| 欧美日韩福利视频一区二区| 亚洲五月色婷婷综合| 国产一区二区三区在线臀色熟女| 国内精品久久久久精免费| 搡老岳熟女国产| 欧美人与性动交α欧美精品济南到| 99国产精品一区二区三区| 男女床上黄色一级片免费看| 亚洲国产精品久久男人天堂| 午夜福利18| 亚洲成av人片免费观看| 国产精品一区二区精品视频观看| 久久中文字幕一级| 一级毛片高清免费大全| 精品乱码久久久久久99久播| 午夜福利成人在线免费观看| 村上凉子中文字幕在线| 女警被强在线播放| 日本黄色视频三级网站网址| 免费搜索国产男女视频| 又黄又粗又硬又大视频| 国产黄a三级三级三级人| 国产成人啪精品午夜网站| 午夜福利高清视频| 午夜精品在线福利| 一边摸一边做爽爽视频免费| 欧美在线一区亚洲| 老司机深夜福利视频在线观看| 亚洲国产欧洲综合997久久, | 午夜福利18| 国产av又大| 色老头精品视频在线观看| 亚洲熟妇熟女久久| 久久热在线av| 亚洲成人精品中文字幕电影| 国产成人精品无人区| 无遮挡黄片免费观看| 长腿黑丝高跟| 最近最新中文字幕大全免费视频| 午夜老司机福利片| 男男h啪啪无遮挡| 欧美+亚洲+日韩+国产| 黑丝袜美女国产一区| 女人被狂操c到高潮| 老司机在亚洲福利影院| 黄色女人牲交| 亚洲五月婷婷丁香| 正在播放国产对白刺激| 国产精品98久久久久久宅男小说| 色综合亚洲欧美另类图片| 一本久久中文字幕| 黄色a级毛片大全视频| 色哟哟哟哟哟哟| 亚洲av日韩精品久久久久久密| 桃色一区二区三区在线观看| 岛国在线观看网站| 亚洲片人在线观看| 人成视频在线观看免费观看| aaaaa片日本免费| 在线十欧美十亚洲十日本专区| 在线观看一区二区三区| 一本久久中文字幕| 搡老熟女国产l中国老女人| 亚洲精品美女久久久久99蜜臀| 欧美中文综合在线视频| 99re在线观看精品视频| 成年女人毛片免费观看观看9| 999久久久国产精品视频| 午夜免费激情av| 欧美不卡视频在线免费观看 | 日韩大码丰满熟妇| 国语自产精品视频在线第100页| 国产精品爽爽va在线观看网站 | 在线观看一区二区三区| 精品久久蜜臀av无| 亚洲国产精品sss在线观看| 18禁黄网站禁片午夜丰满| 日本黄色视频三级网站网址| 俺也久久电影网| 曰老女人黄片| 人成视频在线观看免费观看| 又黄又爽又免费观看的视频| 日本免费a在线| 在线国产一区二区在线| 视频区欧美日本亚洲| 精品一区二区三区av网在线观看| 99热只有精品国产| 亚洲国产精品久久男人天堂| 日韩欧美一区视频在线观看| √禁漫天堂资源中文www| 亚洲国产精品999在线| 久久久精品国产亚洲av高清涩受| 自线自在国产av| 麻豆国产av国片精品| 久久香蕉精品热| 99久久无色码亚洲精品果冻| 久久久久国产精品人妻aⅴ院| 极品教师在线免费播放| 久久久久免费精品人妻一区二区 | 亚洲人成网站高清观看| 亚洲精品久久成人aⅴ小说| 欧美丝袜亚洲另类 | 在线观看www视频免费| 色精品久久人妻99蜜桃| 欧美精品亚洲一区二区| 99久久无色码亚洲精品果冻| 搡老熟女国产l中国老女人| 亚洲久久久国产精品| 国产又黄又爽又无遮挡在线| 亚洲,欧美精品.| 高清在线国产一区| 午夜福利一区二区在线看| 色综合欧美亚洲国产小说| 国产三级在线视频| 性欧美人与动物交配| 97碰自拍视频| 久久香蕉激情| 日韩免费av在线播放| 欧美色视频一区免费| 欧美成人午夜精品| 嫁个100分男人电影在线观看| 亚洲精品一卡2卡三卡4卡5卡| 亚洲一码二码三码区别大吗| 成年版毛片免费区| 母亲3免费完整高清在线观看| 老司机深夜福利视频在线观看| 叶爱在线成人免费视频播放| 久久久久免费精品人妻一区二区 | 精品国产乱子伦一区二区三区| 国产91精品成人一区二区三区| 可以免费在线观看a视频的电影网站| 日本成人三级电影网站| 国产精品爽爽va在线观看网站 | 一个人免费在线观看的高清视频| 欧美一级毛片孕妇| 久热爱精品视频在线9| 成人免费观看视频高清| 美女扒开内裤让男人捅视频| 欧美日韩黄片免| 欧美性猛交╳xxx乱大交人| 亚洲天堂国产精品一区在线| 婷婷精品国产亚洲av在线| 日本a在线网址| 日本一本二区三区精品| 午夜福利在线在线| cao死你这个sao货| 国产片内射在线| 欧美日韩精品网址| 久久久国产精品麻豆| 老司机福利观看| 精华霜和精华液先用哪个| 午夜激情福利司机影院| 久久欧美精品欧美久久欧美| 在线看三级毛片| 波多野结衣高清无吗| 欧美人与性动交α欧美精品济南到| 国产一级毛片七仙女欲春2 | 国产精品久久久久久亚洲av鲁大| 99热6这里只有精品| 欧美又色又爽又黄视频| 久久这里只有精品19| 亚洲专区中文字幕在线| 午夜激情福利司机影院| 91成人精品电影| 亚洲人成伊人成综合网2020| 亚洲成人精品中文字幕电影| www国产在线视频色| 97人妻精品一区二区三区麻豆 | 欧美精品啪啪一区二区三区| 亚洲av熟女| 激情在线观看视频在线高清| 国产精品久久久久久人妻精品电影| 亚洲一区中文字幕在线| 一级片免费观看大全| 777久久人妻少妇嫩草av网站| 国产精品 国内视频| 变态另类成人亚洲欧美熟女| 亚洲精品久久国产高清桃花| 精品少妇一区二区三区视频日本电影| 制服诱惑二区| 亚洲全国av大片| 可以在线观看的亚洲视频| 老熟妇仑乱视频hdxx| 人人妻人人澡人人看| 日韩精品青青久久久久久| x7x7x7水蜜桃| 美女免费视频网站| 熟女少妇亚洲综合色aaa.| 久热这里只有精品99| 正在播放国产对白刺激| 99精品欧美一区二区三区四区| 啦啦啦观看免费观看视频高清| 国产午夜精品久久久久久| 波多野结衣巨乳人妻| 听说在线观看完整版免费高清| 亚洲专区字幕在线| 一级片免费观看大全| 老熟妇乱子伦视频在线观看| 淫秽高清视频在线观看| 国产视频内射| 欧美成人免费av一区二区三区| 一边摸一边做爽爽视频免费| 制服丝袜大香蕉在线| 午夜福利成人在线免费观看| 黄色成人免费大全| 亚洲无线在线观看| 久久久久精品国产欧美久久久| 波多野结衣av一区二区av| 欧美人与性动交α欧美精品济南到| 又黄又爽又免费观看的视频| 淫秽高清视频在线观看| 男女那种视频在线观看| 18禁黄网站禁片免费观看直播| 日韩有码中文字幕| 777久久人妻少妇嫩草av网站| 亚洲狠狠婷婷综合久久图片| 国产v大片淫在线免费观看| 亚洲人成网站在线播放欧美日韩| 国产午夜精品久久久久久| 少妇的丰满在线观看| 久久久久久人人人人人| 99riav亚洲国产免费| 美女国产高潮福利片在线看| 露出奶头的视频| 脱女人内裤的视频| 1024香蕉在线观看| 校园春色视频在线观看| 国产男靠女视频免费网站| 中文字幕人妻熟女乱码| 亚洲人成网站在线播放欧美日韩| cao死你这个sao货| 国产免费男女视频| 淫秽高清视频在线观看| 国产99久久九九免费精品| 久久中文看片网| 亚洲第一电影网av| 亚洲第一av免费看| 十分钟在线观看高清视频www| 久久精品人妻少妇| 麻豆成人午夜福利视频| 不卡一级毛片| 午夜免费激情av| 欧美最黄视频在线播放免费| 亚洲熟妇中文字幕五十中出| 午夜日韩欧美国产| 99国产精品一区二区蜜桃av| 亚洲精品在线美女| 国产视频内射| 国产免费av片在线观看野外av| 国产在线精品亚洲第一网站| 亚洲狠狠婷婷综合久久图片| 欧美日韩精品网址| 久久香蕉激情| 亚洲国产精品999在线| 亚洲第一电影网av| 国产三级黄色录像| 无限看片的www在线观看| 日本 欧美在线| 老司机靠b影院| 日韩一卡2卡3卡4卡2021年| 国产又色又爽无遮挡免费看| 人人澡人人妻人| 国产亚洲欧美在线一区二区| 女性被躁到高潮视频| www.www免费av| 999久久久国产精品视频| 狂野欧美激情性xxxx| 黄色女人牲交| 看片在线看免费视频| 日本免费a在线| 亚洲五月色婷婷综合| 免费在线观看黄色视频的| 国产成人系列免费观看| 男女那种视频在线观看| 久久中文字幕人妻熟女| 精品不卡国产一区二区三区| 午夜激情福利司机影院| 久久精品夜夜夜夜夜久久蜜豆 | 成人亚洲精品av一区二区| 亚洲av美国av| 精品国产国语对白av| 亚洲一码二码三码区别大吗| 久久婷婷成人综合色麻豆| 久久久久久亚洲精品国产蜜桃av| 香蕉av资源在线| 热re99久久国产66热| 色播亚洲综合网| 国产成人欧美| 中出人妻视频一区二区| 亚洲熟妇中文字幕五十中出| 中文字幕精品免费在线观看视频| 在线观看免费日韩欧美大片| 国产亚洲精品第一综合不卡| 最近最新中文字幕大全电影3 | 免费在线观看日本一区| 精品免费久久久久久久清纯| 久久久久久免费高清国产稀缺| 99久久国产精品久久久| 日本 av在线| 啦啦啦韩国在线观看视频| 日韩欧美免费精品| 精品少妇一区二区三区视频日本电影| 非洲黑人性xxxx精品又粗又长| 亚洲片人在线观看| 丁香六月欧美| 男女视频在线观看网站免费 | 90打野战视频偷拍视频| 亚洲精品一卡2卡三卡4卡5卡| 欧美日韩福利视频一区二区| 午夜a级毛片| 免费在线观看日本一区| 国产成人精品久久二区二区91| 亚洲精品国产区一区二| 一级毛片女人18水好多| 黄频高清免费视频| 在线观看www视频免费| 十分钟在线观看高清视频www| 亚洲激情在线av| 波多野结衣巨乳人妻| 欧美黑人巨大hd| 天天躁夜夜躁狠狠躁躁| 欧美国产日韩亚洲一区| a级毛片a级免费在线| 亚洲专区国产一区二区| 老司机午夜十八禁免费视频| 亚洲成人国产一区在线观看| 国产精品亚洲美女久久久| 禁无遮挡网站| 亚洲国产毛片av蜜桃av| 一级毛片女人18水好多| cao死你这个sao货| 男人舔女人的私密视频| 亚洲第一电影网av| 亚洲性夜色夜夜综合| 亚洲成人免费电影在线观看| 国产97色在线日韩免费| 亚洲av美国av| 757午夜福利合集在线观看| 欧美人与性动交α欧美精品济南到| www日本黄色视频网| 成人一区二区视频在线观看| 99国产精品一区二区蜜桃av| 男人舔女人的私密视频| 国产片内射在线| av在线天堂中文字幕| 久久精品91蜜桃| 老司机午夜福利在线观看视频| 免费高清视频大片| 白带黄色成豆腐渣| 国产国语露脸激情在线看| 在线永久观看黄色视频| av电影中文网址| 黄片大片在线免费观看| 美女大奶头视频| 亚洲 欧美一区二区三区| 国产成人精品久久二区二区91| 国内少妇人妻偷人精品xxx网站 | 精品久久蜜臀av无| 国产黄a三级三级三级人| 国语自产精品视频在线第100页| 中文字幕精品亚洲无线码一区 | 国产精品久久电影中文字幕| 欧美性猛交黑人性爽| 国产视频一区二区在线看| 国产精品亚洲av一区麻豆| 亚洲久久久国产精品| 日韩精品中文字幕看吧| 可以在线观看的亚洲视频| 丰满的人妻完整版| 无限看片的www在线观看| 久久久国产成人免费| 两个人免费观看高清视频| 中文资源天堂在线| 国产亚洲av嫩草精品影院| 午夜福利欧美成人| 在线国产一区二区在线| 国产精华一区二区三区| 欧美在线黄色| 热re99久久国产66热| 亚洲五月婷婷丁香| 中文字幕人成人乱码亚洲影| 人人妻人人看人人澡| 午夜福利视频1000在线观看| 精品国产一区二区三区四区第35| 热re99久久国产66热| 男人的好看免费观看在线视频 | 夜夜爽天天搞| 国产男靠女视频免费网站| 国内精品久久久久精免费| 一级片免费观看大全| 午夜影院日韩av| 免费在线观看日本一区| 中国美女看黄片| 国产成人系列免费观看| 成人精品一区二区免费| 亚洲五月婷婷丁香| 国产不卡一卡二| 色综合婷婷激情| 欧美成狂野欧美在线观看| 国产高清激情床上av| 香蕉久久夜色| 可以在线观看的亚洲视频| 免费电影在线观看免费观看| 久久久久国产精品人妻aⅴ院| 免费在线观看成人毛片| 亚洲av成人av| 黑人巨大精品欧美一区二区mp4|