• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    查詢擴(kuò)展技術(shù)在跨語(yǔ)言信息檢索中的應(yīng)用

    2015-05-15 10:13:40楊亮
    現(xiàn)代計(jì)算機(jī) 2015年2期
    關(guān)鍵詞:查全率查準(zhǔn)率語(yǔ)種

    楊亮

    (廣東技術(shù)師范學(xué)院圖書館,廣州 510400)

    查詢擴(kuò)展技術(shù)在跨語(yǔ)言信息檢索中的應(yīng)用

    楊亮

    (廣東技術(shù)師范學(xué)院圖書館,廣州 510400)

    互聯(lián)網(wǎng)的快速發(fā)展使得網(wǎng)絡(luò)資源的表現(xiàn)形式日益多樣化,其中信息資源的多語(yǔ)種問(wèn)題,成為人們獲取信息的主要障礙。當(dāng)用戶檢索的信息是自己不熟悉的語(yǔ)言時(shí),往往難以獲得準(zhǔn)確的檢索結(jié)果?;贚ucene平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)跨語(yǔ)言信息檢索系統(tǒng),系統(tǒng)在提問(wèn)式翻譯的基礎(chǔ)上應(yīng)用查詢擴(kuò)展技術(shù)。實(shí)驗(yàn)結(jié)果表明,查詢擴(kuò)展技術(shù)可有效提高跨語(yǔ)言信息檢索的查全率。

    跨語(yǔ)言信息檢索;查詢擴(kuò)展;Lucene

    0 引言

    隨著互聯(lián)網(wǎng)的不斷發(fā)展,使用不同語(yǔ)言的互聯(lián)網(wǎng)用戶也在不斷增加,網(wǎng)絡(luò)上的海量信息資源由很多不同的語(yǔ)言所組成,當(dāng)用戶需要檢索的信息是自己不熟悉的語(yǔ)言時(shí)往往會(huì)面臨一定的障礙,這使得很多用戶不能自由地獲取信息。為了解決多語(yǔ)種問(wèn)題帶來(lái)的語(yǔ)言障礙,讓用戶可以更加便捷地檢索信息,學(xué)者們開始對(duì)跨語(yǔ)言信息檢索進(jìn)行探索。

    傳統(tǒng)的信息檢索研究的是單一語(yǔ)種的檢索問(wèn)題,即檢索提問(wèn)式和被檢索文檔集采用的是同一種語(yǔ)言表述。而跨語(yǔ)言信息檢索(Cross-Language Information Retrieval,簡(jiǎn)稱CLIR)是指用戶通過(guò)一種語(yǔ)言(通常是自己的母語(yǔ))進(jìn)行檢索,獲取以另一種或幾種語(yǔ)言表述的信息或文檔的信息檢索技術(shù)和方法[1]。在跨語(yǔ)言信息檢索中,用戶構(gòu)造檢索提問(wèn)式所使用的語(yǔ)言通常稱為源語(yǔ)言(Source Language),一般是用戶的母語(yǔ)或用戶所熟悉的語(yǔ)言;而被檢索的文檔集所使用的語(yǔ)言通常稱為目標(biāo)語(yǔ)言(Target Language),目標(biāo)語(yǔ)言一般是用戶不熟悉甚至完全陌生的語(yǔ)言[2]。跨語(yǔ)言檢索重點(diǎn)研究的是源語(yǔ)言與目標(biāo)語(yǔ)言之間翻譯匹配的問(wèn)題。

    1 翻譯方法

    目前,實(shí)現(xiàn)源語(yǔ)言與目標(biāo)語(yǔ)言的翻譯匹配主要有四種方法:提問(wèn)式翻譯、文獻(xiàn)翻譯、中間語(yǔ)種轉(zhuǎn)換和非翻譯[3~6]。

    提問(wèn)式翻譯(Query Translation Approach)。這種方法將用戶輸入的檢索提問(wèn)式翻譯為系統(tǒng)支持的語(yǔ)言,然后進(jìn)行檢索。提問(wèn)式翻譯是目前最為常用的方法,它可以很容易地與傳統(tǒng)的單語(yǔ)種信息檢索相結(jié)合,特點(diǎn)是對(duì)系統(tǒng)要求不高,執(zhí)行速度快。但由于提問(wèn)式比較短,通常都是一個(gè)或幾個(gè)詞,缺乏一定的上下文語(yǔ)境,對(duì)于一詞多義、一義多詞等翻譯歧義問(wèn)題不能很好地解決。實(shí)現(xiàn)提問(wèn)式翻譯主要有基于詞典(Dictionary-Based)和基于雙語(yǔ)語(yǔ)料庫(kù)(Bilingual Corpus-Based)兩種模式。

    文獻(xiàn)翻譯(Document Translation Approach)。文獻(xiàn)翻譯在信息檢索之前,將被檢索的文檔集轉(zhuǎn)化為與檢索提問(wèn)式相同的語(yǔ)種,通過(guò)該方法返回給用戶的結(jié)果是用源語(yǔ)言所描述的,且上下文語(yǔ)境信息比較寬泛,用戶選擇利用起來(lái)也就更加便利。不過(guò)由于目前機(jī)器翻譯的效果并不理想,而將系統(tǒng)中的所有文獻(xiàn)都從目標(biāo)語(yǔ)種翻譯為源語(yǔ)種的工作量十分龐大,完全由人工來(lái)翻譯又不現(xiàn)實(shí),因此,文獻(xiàn)翻譯的實(shí)用性較差。

    中間語(yǔ)種轉(zhuǎn)換(Interlingual Representation Approach)。提問(wèn)式翻譯將源語(yǔ)種轉(zhuǎn)化為目標(biāo)語(yǔ)種,而文獻(xiàn)翻譯將目標(biāo)語(yǔ)種轉(zhuǎn)化為源語(yǔ)種,中間語(yǔ)種轉(zhuǎn)換方法則是將源語(yǔ)種和目標(biāo)語(yǔ)種同時(shí)轉(zhuǎn)換為第三方的中間語(yǔ)種。這種方法多用于源語(yǔ)種和目標(biāo)語(yǔ)種不能直接翻譯或雙語(yǔ)詞典不存在時(shí),如德語(yǔ)和意大利語(yǔ)。

    非翻譯(No Translation Approach)。該方法不對(duì)源語(yǔ)種或者目標(biāo)語(yǔ)種進(jìn)行翻譯就可以實(shí)現(xiàn)跨語(yǔ)言信息檢索,即潛語(yǔ)義索引。這種方法不需要詞典、機(jī)器翻譯系統(tǒng),但是如何針對(duì)具體問(wèn)題構(gòu)造優(yōu)化的向量空間模型是一項(xiàng)經(jīng)驗(yàn)性的工作,且訓(xùn)練文檔不容易獲取。

    2 查詢擴(kuò)展技術(shù)

    信息需求是用戶想要查找的信息主題,信息檢索就是從大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)的集合中找出滿足用戶信息需求的資料的過(guò)程。在檢索時(shí)用戶使用檢索提問(wèn)式來(lái)代表其信息需求,將檢索提問(wèn)式提交給系統(tǒng),系統(tǒng)從文檔集中返回與之相關(guān)的文檔[7]。然而,用戶提交的檢索提問(wèn)式通常是一個(gè)很短的句子或者是少量的關(guān)鍵詞,簡(jiǎn)短的檢索提問(wèn)式不能很好地代表用戶的信息需求,從而造成檢索出的文檔對(duì)用戶的需求價(jià)值不高。為此,有學(xué)者提出了查詢擴(kuò)展技術(shù)。

    查詢擴(kuò)展(Query Expansion)指的是利用計(jì)算機(jī)語(yǔ)言學(xué)、信息學(xué)等多種技術(shù),把與原查詢相關(guān)的詞語(yǔ)或者與原查詢語(yǔ)義相關(guān)聯(lián)的概念添加到原查詢,得到比原查詢更長(zhǎng)的新查詢,然后檢索文檔,以改善信息檢索的性能,解決信息檢索領(lǐng)域長(zhǎng)期困擾的詞不匹配問(wèn)題,彌補(bǔ)用戶查詢信息不足的缺陷[8]。查詢擴(kuò)展技術(shù)主要分為全局分析和局部分析兩大類。全局分析是對(duì)整個(gè)文檔集的語(yǔ)詞進(jìn)行相關(guān)分析,計(jì)算每對(duì)語(yǔ)詞間的關(guān)聯(lián)程度,在檢索時(shí)選取與檢索提問(wèn)式關(guān)聯(lián)程度高的語(yǔ)詞對(duì)檢索提問(wèn)式進(jìn)行擴(kuò)充。全局分析需要對(duì)整個(gè)文檔集進(jìn)行相關(guān)處理,系統(tǒng)計(jì)算量大,只適合小范圍內(nèi)的信息檢索,不適用于大規(guī)模的海量檢索。局部分析利用初始檢索得到的最相關(guān)的N篇文檔作為擴(kuò)展用詞的來(lái)源,不需要對(duì)全部語(yǔ)詞進(jìn)行相關(guān)計(jì)算[9]。

    在跨語(yǔ)言信息檢索領(lǐng)域,以往的研究多集中在理論和模型方面,實(shí)踐研究較少,本文基于Lucene平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)漢英跨語(yǔ)言信息檢索系統(tǒng),使用局部分析中的相關(guān)性反饋技術(shù)對(duì)翻譯后的檢索提問(wèn)式進(jìn)行查詢擴(kuò)展[10],通過(guò)實(shí)驗(yàn)研究應(yīng)用查詢擴(kuò)展前后系統(tǒng)的檢索性能。

    3 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    本文基于Lucene平臺(tái)實(shí)現(xiàn)了一個(gè)跨語(yǔ)言信息檢索系統(tǒng),結(jié)構(gòu)如圖1。系統(tǒng)應(yīng)用了查詢擴(kuò)展技術(shù)檢索系統(tǒng),采用了B/S架構(gòu),使用Eclipse開發(fā)平臺(tái)和Tomcat服務(wù)器搭建開發(fā)環(huán)境,采用Java語(yǔ)言進(jìn)行編程,并使用MySQL數(shù)據(jù)庫(kù)管理機(jī)讀詞典。

    圖1 跨語(yǔ)言信息檢索系統(tǒng)結(jié)構(gòu)圖

    3.1 Lucene檢索引擎

    Lucene是一款高性能的、可擴(kuò)展的信息檢索(IR)工具庫(kù),是一款以Java實(shí)現(xiàn)的成熟、自由、開源的軟件,為開發(fā)者提供了完整的檢索引擎和索引引擎,可以方便地在系統(tǒng)中實(shí)現(xiàn)全文檢索的功能。同時(shí),Lucene是Apache軟件基金會(huì)(Apache Software Foundation)中的一個(gè)項(xiàng)目,基于Apache軟件許可協(xié)議授權(quán),在近年來(lái)已經(jīng)成為最受歡迎的開源信息檢索工具庫(kù)。

    本文基于Lucene平臺(tái)實(shí)現(xiàn)系統(tǒng)的檢索功能,Lucene的核心API主要可分為兩類。第一類是索引過(guò)程的核心類,包括IndexWriter、Directory、Analyzer、Document等。其中IndexWriter(寫索引)是索引過(guò)程的核心組件,主要負(fù)責(zé)創(chuàng)建新索引和對(duì)索引的維護(hù)。Directory類指明了Lucene索引的位置所在。Analyzer和Document則表示在建立索引前,文本文件需要經(jīng)過(guò)分析器和文檔化的處理。第二類是搜索過(guò)程的核心類,包括IndexSearcher、QueryParser、Query、TopDocs等。其中IndexSearcher用于搜索由IndexWriter類創(chuàng)建的索引,所有的檢索操作都是通過(guò)IndexSearcher實(shí)例使用一個(gè)重載的search方法來(lái)實(shí)現(xiàn)。QueryParser類將用戶輸入的檢索提問(wèn)式處理為一個(gè)具體的Query對(duì)象;大多數(shù)IndexSearcher的search方法都會(huì)以返回TopDocs對(duì)象的形式來(lái)返回搜索結(jié)果。

    3.2 分詞

    在英語(yǔ)環(huán)境中,英文單詞之間用空格來(lái)進(jìn)行間隔,單詞就是自然的索引單元,而在中文環(huán)境中,中文文本是以字為基本單元的,字和字之間沒(méi)有明顯的間隔,這就需要中文分詞技術(shù)來(lái)解決這個(gè)問(wèn)題,運(yùn)用中文分詞技術(shù)可以將連續(xù)的文本序列按照一定的規(guī)則切分成具有獨(dú)立語(yǔ)義的詞組[11]。中文分詞是中文信息處理的基礎(chǔ)與關(guān)鍵,本文使用ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)來(lái)對(duì)中文檢索提問(wèn)式進(jìn)行分詞。ICTCLAS是由中國(guó)科學(xué)院計(jì)算技術(shù)研究所研制出的漢語(yǔ)詞法分析系統(tǒng),主要功能包括中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、新詞識(shí)別等。ICTCLAS是目前比較好的漢語(yǔ)詞法分析器,提供了一套完整的動(dòng)態(tài)鏈接庫(kù)供開發(fā)者直接在自己的系統(tǒng)中調(diào)用來(lái)實(shí)現(xiàn)漢語(yǔ)詞法分析,支持C/C++/C#/Delphi/Java等主流開發(fā)語(yǔ)言。

    3.3 詞典翻譯

    本文使用基于詞典的提問(wèn)式翻譯方法對(duì)中文檢索提問(wèn)式進(jìn)行翻譯處理,詞典選用了MDBG漢英詞典,該詞典屬于1997年P(guān)aul Denisowski創(chuàng)辦的CEDICT項(xiàng)目,支持簡(jiǎn)體中文、繁體中文以及拼音與英語(yǔ)的對(duì)照翻譯。詞典可以在MDBG網(wǎng)站上免費(fèi)獲取,內(nèi)容涵蓋了單字、詞組、短語(yǔ)、地名、專業(yè)術(shù)語(yǔ)等110284個(gè)詞條。

    詞條示例:

    世界觀世界觀[shi4 jie4 guan1]/worldview/world outlook/Weltanschauung/

    3.4 建立索引

    在進(jìn)行檢索前,首先要對(duì)檢索文檔建立索引,以便進(jìn)行快速檢索。索引操作把數(shù)據(jù)處理成一種高效的、可交叉引用的數(shù)據(jù)結(jié)構(gòu),這種結(jié)構(gòu)允許對(duì)存儲(chǔ)在其中的單詞進(jìn)行快速隨機(jī)存取。本文基于Lucene平臺(tái)建立索引,Lucene的索引結(jié)構(gòu)分為索引(Index)、索引段(Segment)、索引文檔(Document)、索引域(Field)和索引項(xiàng)(Term)五個(gè)層次。Lucene的每個(gè)索引結(jié)構(gòu)由若干個(gè)段組成,每個(gè)段包含若干個(gè)文檔,每個(gè)文檔管理若干個(gè)域,每個(gè)域中有若干個(gè)項(xiàng),項(xiàng)就是索引中最基本的語(yǔ)匯單元[12]。

    本文對(duì)數(shù)據(jù)建立索引的過(guò)程分為三個(gè)部分:

    (1)預(yù)處理:將所有檢索文檔都轉(zhuǎn)換成Lucene能夠處理的格式——純文本數(shù)據(jù)流,以.txt的格式保存在磁盤中。

    (2)分析:通過(guò)Lucene索引管理器對(duì)文檔進(jìn)行分析,將文本轉(zhuǎn)換為最基本的索引項(xiàng),并且過(guò)濾掉一些頻繁出現(xiàn)卻沒(méi)有實(shí)際意義的詞,如英文中的a、an、the、in、on等停用詞,去除標(biāo)點(diǎn)符號(hào)。

    (3)寫入索引:將分析處理后的結(jié)果寫入到索引文件,以倒排索引的結(jié)構(gòu)存儲(chǔ)在磁盤中。從文檔中抽取出的語(yǔ)匯單元被看作是查找關(guān)鍵詞,可以快速地執(zhí)行檢索操作。

    3.5 查詢擴(kuò)展

    本文使用局部分析中的相關(guān)性反饋技術(shù)對(duì)翻譯后的檢索提問(wèn)式進(jìn)行查詢擴(kuò)展,根據(jù)初始檢索的結(jié)果,利用Lucene的評(píng)分機(jī)制對(duì)返回結(jié)果中的文檔進(jìn)行排序,將排名前3的文檔取出,并對(duì)這3篇文檔進(jìn)行詞匯統(tǒng)計(jì),用出現(xiàn)頻率最高的詞匯w_1去擴(kuò)展翻譯后的檢索式。如果w_1已經(jīng)出現(xiàn)在翻譯后的檢索式中,則使用出現(xiàn)頻率第二高的詞匯w_2進(jìn)行擴(kuò)展,以此類推。

    3.6 實(shí)驗(yàn)過(guò)程

    實(shí)驗(yàn)?zāi)康氖菧y(cè)試應(yīng)用查詢擴(kuò)展技術(shù)前后跨語(yǔ)言信息檢索系統(tǒng)的檢索性能,使用查準(zhǔn)率和查全率兩個(gè)指標(biāo)來(lái)衡量。查準(zhǔn)率是指檢出的相關(guān)文檔與檢出文檔總數(shù)的比值,查全率是指檢出的相關(guān)文檔與相關(guān)文檔總數(shù)的比值[13]。查準(zhǔn)率用來(lái)衡量系統(tǒng)的檢索精度,查全率用來(lái)衡量系統(tǒng)檢出相關(guān)文檔的能力。

    實(shí)驗(yàn)運(yùn)行環(huán)境如下:CPU:Intel Pentium Dual-Core E5200、內(nèi)存:4GB、硬盤:希捷250GB、操作系統(tǒng):Windows 7 Ultimate。實(shí)驗(yàn)所用的檢索文檔全部來(lái)源于新華網(wǎng),共計(jì)300篇英文文檔,內(nèi)容涵蓋科技、健康、體育、經(jīng)濟(jì)等多個(gè)類別。針對(duì)實(shí)驗(yàn)設(shè)計(jì)了10個(gè)檢索式,先進(jìn)行一次初始檢索,然后再進(jìn)行兩次查詢擴(kuò)展,對(duì)比系統(tǒng)的查準(zhǔn)率和查全率。

    具體的實(shí)驗(yàn)步驟如下:

    ①輸入中文檢索式,標(biāo)記為zws;

    ②對(duì)zws進(jìn)行分詞和去除中文停用詞的處理;

    ③通過(guò)機(jī)讀詞典對(duì)zws進(jìn)行翻譯,得到相應(yīng)的英文檢索式ews0;

    ④使用ews0進(jìn)行初始檢索,根據(jù)檢索結(jié)果計(jì)算相應(yīng)的查準(zhǔn)率和查全率;

    ⑤進(jìn)行第一次查詢擴(kuò)展,將擴(kuò)展結(jié)果加入到ews0中得到檢索式ews1;

    ⑥使用ews1進(jìn)行檢索,根據(jù)檢索結(jié)果計(jì)算相應(yīng)的查準(zhǔn)率和查全率;

    ⑦進(jìn)行第二次查詢擴(kuò)展,將擴(kuò)展結(jié)果加入到ews1中得到檢索式ews2;

    ⑧使用ews2進(jìn)行檢索,根據(jù)檢索結(jié)果計(jì)算相應(yīng)的查準(zhǔn)率和查全率。

    3.7 實(shí)驗(yàn)結(jié)果

    例如,用戶的信息需求是查找手機(jī)系統(tǒng)方面的信息,輸入中文檢索式“手機(jī)系統(tǒng)”,經(jīng)分詞處理后系統(tǒng)翻譯得到英文檢索式“cell phone mobile phone system”,進(jìn)行初始檢索后根據(jù)檢索結(jié)果計(jì)算出查準(zhǔn)率為0.5588,查全率為0.95。之后進(jìn)行第一次查詢擴(kuò)展,得到檢索式“cell phone mobile phone system android”,再次進(jìn)行檢索,根據(jù)檢索結(jié)果計(jì)算出查準(zhǔn)率為0.5405,查全率為1.0。然后進(jìn)行第二次查詢擴(kuò)展,得到檢索式“cell phone mobile phone system android smart”,根據(jù)檢索結(jié)果計(jì)算出查準(zhǔn)率為0.5333,查全率為1.0。

    對(duì)10個(gè)檢索式初始檢索結(jié)果的查準(zhǔn)率和查全率、兩次查詢擴(kuò)展后檢索結(jié)果的查準(zhǔn)率和查全率進(jìn)行對(duì)比,如圖2、圖3。

    通過(guò)檢索結(jié)果可以看出,在應(yīng)用了查詢擴(kuò)展技術(shù)后,系統(tǒng)的查全率得到了提升,同時(shí)因?yàn)楂@取了較多的檢中結(jié)果,系統(tǒng)的查準(zhǔn)率有所下降,這也是系統(tǒng)表現(xiàn)良好的一個(gè)證明?!皺z索式10”的查準(zhǔn)率在第二次查詢擴(kuò)展后有明顯的下降,其查全率在第一次查詢擴(kuò)展后有明顯的上升,這是因?yàn)樵~典對(duì)一些新詞匯沒(méi)有完全收錄而產(chǎn)生的噪點(diǎn)數(shù)據(jù)。另外,當(dāng)初始查詢得到的文檔在經(jīng)過(guò)排序后,如果排名靠前的文檔與原信息需求相關(guān)性不大,在查詢擴(kuò)展時(shí)就會(huì)把一些無(wú)關(guān)的詞加入到新查詢中,也會(huì)影響檢索效果。從總體上看,查詢擴(kuò)展技術(shù)在跨語(yǔ)言信息檢索系統(tǒng)中表現(xiàn)出了良好的性能。

    4 結(jié)語(yǔ)

    本文基于Lucene平臺(tái)實(shí)現(xiàn)了一個(gè)跨語(yǔ)言信息檢索系統(tǒng),通過(guò)實(shí)驗(yàn)對(duì)初始查詢、一次查詢擴(kuò)展、二次查詢擴(kuò)展進(jìn)行了比較研究,實(shí)驗(yàn)結(jié)果表明查詢擴(kuò)展技術(shù)可有效提升跨語(yǔ)言信息檢索的查全率。在一個(gè)好的系統(tǒng)中,查準(zhǔn)率往往會(huì)隨著返回文檔數(shù)目的增加而降低[7],怎樣在滿足用戶信息需求的同時(shí)控制查準(zhǔn)率和查全率之間的平衡是今后需要研究的方向。另外,本文對(duì)跨語(yǔ)言信息檢索由中文到英文的翻譯進(jìn)行了研究,中英文雙向互譯也將作為今后進(jìn)一步的研究工作。

    圖2 應(yīng)用查詢擴(kuò)展前后系統(tǒng)的查準(zhǔn)率

    圖3 應(yīng)用查詢擴(kuò)展前后系統(tǒng)的查全率

    參考文獻(xiàn):

    [1] 朱培焱,夏棟梁.漢英跨語(yǔ)言信息檢索研究[J].計(jì)算機(jī)與現(xiàn)代化,2011,08:13~16

    [2] 張會(huì)平,周寧,陳立孚.跨語(yǔ)言信息檢索可視化研究[J].情報(bào)科學(xué),2007,01:134~138

    [3] 任成梅.跨語(yǔ)言信息檢索的發(fā)展與展望[J].圖書館學(xué)研究,2006,04:79~82

    [4] 賴茂生,侯艷飛.跨語(yǔ)言檢索技術(shù):策略與方法[J].鄭州大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2005,04:11~14

    [5] 王昊.跨語(yǔ)言信息檢索實(shí)現(xiàn)方法與關(guān)鍵技術(shù)探討[J].情報(bào)雜志,2005,07:46~49

    [6] 劉偉成,孫吉紅.跨語(yǔ)言信息檢索進(jìn)展研究[J].中國(guó)圖書館學(xué)報(bào),2008,01:88~92

    [7] Manning C D,Raghavan P,Schütze H.Introduction to Information Retrieval[M].Beijing:Posts&Telecom Press,2010

    [8] 陳燕紅,黃名選.基于Apriori改進(jìn)算法的局部反饋查詢擴(kuò)展[J].現(xiàn)代圖書情報(bào)技術(shù),2007,09:84-87

    [9] 黃名選,嚴(yán)小衛(wèi),張師超.查詢擴(kuò)展技術(shù)進(jìn)展與展望[J].計(jì)算機(jī)應(yīng)用與軟件,2007,11:1~4+8

    [10] 鄭敏.跨語(yǔ)言信息檢索的理論與實(shí)踐[J].情報(bào)理論與實(shí)踐,2003,03:223~225+212

    [11] 于雪麗.Lucene中文分詞在科研文檔全文檢索系統(tǒng)的應(yīng)用研究[D].青島大學(xué),2011

    [12] 鄭榕增,林世平.基于Lucene的中文倒排索引技術(shù)的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,03:80~83

    [13] Ricardo Baeza-Yates,Berthier Ribeiro-Neto等.王知津,賈福新,鄭紅軍等譯.現(xiàn)代信息檢索[M].北京:機(jī)械工業(yè)出版社,2005

    Applications of Query Expansion in Cross-Language Information Retrieval

    YANG Liang
    (Department of Library,Guangdong Polytechnic Normal University,Guangzhou 510400)

    With the rapid development of the Internet,the network resources have too many forms.Meanwhile,most of them are described in different languages,which has become a mainly obstacle when people get information.People can't get precise results if the information resource uses a language that is unfamiliar to them.Designs and implements a cross-language information retrieval system which uses query translation approach and query expansion technology based on Lucene.The experimental results show that the recall of cross-language information retrieval is improved when query expansion is applied.

    Cross-Language Information Retrieval;Query Expansion;Lucene

    1007-1423(2015)02-0026-05

    10.3969/j.issn.1007-1423.2015.02.007

    楊亮(1982-),男,江蘇豐縣人,碩士研究生,館員,研究方向?yàn)樾畔⒐芾?、信息檢索

    2014-12-02

    2014-12-16

    廣東技術(shù)師范學(xué)院2013年校級(jí)科研項(xiàng)目(No.13KJY18)

    猜你喜歡
    查全率查準(zhǔn)率語(yǔ)種
    《波斯語(yǔ)課》:兩個(gè)人的小語(yǔ)種
    海量圖書館檔案信息的快速檢索方法
    基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)信息過(guò)濾系統(tǒng)設(shè)計(jì)
    “一帶一路”背景下我國(guó)的外語(yǔ)語(yǔ)種規(guī)劃
    基于詞嵌入語(yǔ)義的精準(zhǔn)檢索式構(gòu)建方法
    大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
    基于深度特征分析的雙線性圖像相似度匹配算法
    中文分詞技術(shù)對(duì)中文搜索引擎的查準(zhǔn)率及查全率的影響
    走出報(bào)考小語(yǔ)種專業(yè)的兩大誤區(qū)
    基于Web的概念屬性抽取的研究
    长腿黑丝高跟| 午夜精品一区二区三区免费看| 亚洲av中文av极速乱| 国产伦精品一区二区三区视频9| 我的女老师完整版在线观看| 精品免费久久久久久久清纯| 久久6这里有精品| 日韩成人av中文字幕在线观看 | 波野结衣二区三区在线| 国产又黄又爽又无遮挡在线| 十八禁国产超污无遮挡网站| 国产v大片淫在线免费观看| 色播亚洲综合网| 听说在线观看完整版免费高清| 成人综合一区亚洲| 久久久久国产精品人妻aⅴ院| 精品久久久久久成人av| 一本久久中文字幕| 2021天堂中文幕一二区在线观| 日本-黄色视频高清免费观看| 人妻夜夜爽99麻豆av| 国产精品国产高清国产av| 久久午夜福利片| 亚洲熟妇熟女久久| 免费高清视频大片| 国内揄拍国产精品人妻在线| 在线观看66精品国产| 日韩在线高清观看一区二区三区| 久久鲁丝午夜福利片| 成人综合一区亚洲| 国产大屁股一区二区在线视频| 国内精品宾馆在线| 99九九线精品视频在线观看视频| 有码 亚洲区| 久久精品影院6| 男人舔女人下体高潮全视频| 久久久久久伊人网av| 亚洲av熟女| 国产麻豆成人av免费视频| 乱人视频在线观看| 亚洲激情五月婷婷啪啪| 欧美最新免费一区二区三区| 美女被艹到高潮喷水动态| 十八禁国产超污无遮挡网站| 欧美一级a爱片免费观看看| 免费av观看视频| 久久99热6这里只有精品| 在线免费十八禁| 狂野欧美白嫩少妇大欣赏| 春色校园在线视频观看| 午夜免费激情av| 男女之事视频高清在线观看| 久久精品综合一区二区三区| 99热网站在线观看| 人妻夜夜爽99麻豆av| 久久久精品大字幕| 美女 人体艺术 gogo| 综合色丁香网| 国产精品,欧美在线| 丰满的人妻完整版| 国产精品福利在线免费观看| 国产私拍福利视频在线观看| 免费av毛片视频| 亚洲专区国产一区二区| 亚洲高清免费不卡视频| 波多野结衣高清无吗| 一个人看的www免费观看视频| 伦精品一区二区三区| 中出人妻视频一区二区| 日韩 亚洲 欧美在线| 久久久久九九精品影院| 欧美一区二区国产精品久久精品| 精品久久国产蜜桃| 日韩欧美精品v在线| 18禁黄网站禁片免费观看直播| 亚洲自拍偷在线| 一级a爱片免费观看的视频| 国产高清视频在线播放一区| 成人精品一区二区免费| 日本撒尿小便嘘嘘汇集6| 亚洲国产精品成人综合色| 中文字幕精品亚洲无线码一区| 久久久久九九精品影院| 亚洲欧美中文字幕日韩二区| 欧美性猛交黑人性爽| 俄罗斯特黄特色一大片| 一级毛片电影观看 | 国产片特级美女逼逼视频| 亚洲av第一区精品v没综合| 91久久精品国产一区二区成人| 舔av片在线| 亚洲熟妇中文字幕五十中出| a级毛片a级免费在线| 不卡视频在线观看欧美| av视频在线观看入口| 99riav亚洲国产免费| 国产成年人精品一区二区| 长腿黑丝高跟| 成人无遮挡网站| 嫩草影院入口| 亚洲最大成人手机在线| 亚洲精品久久国产高清桃花| 久久午夜福利片| 国产国拍精品亚洲av在线观看| 成人国产麻豆网| 精品久久久久久久末码| 亚洲图色成人| 1000部很黄的大片| 一个人免费在线观看电影| 欧美丝袜亚洲另类| 中文字幕久久专区| 亚洲四区av| 欧美日韩精品成人综合77777| 欧美+亚洲+日韩+国产| 草草在线视频免费看| 国产欧美日韩精品亚洲av| 在线观看午夜福利视频| 女的被弄到高潮叫床怎么办| 青春草视频在线免费观看| 久久精品91蜜桃| 国产伦精品一区二区三区视频9| 99国产精品一区二区蜜桃av| 韩国av在线不卡| 大又大粗又爽又黄少妇毛片口| 高清午夜精品一区二区三区 | 国产爱豆传媒在线观看| 日韩欧美三级三区| 97热精品久久久久久| 欧美成人精品欧美一级黄| 午夜日韩欧美国产| 91午夜精品亚洲一区二区三区| 精品乱码久久久久久99久播| 日韩高清综合在线| 国内久久婷婷六月综合欲色啪| 国产精品一区二区三区四区免费观看 | 秋霞在线观看毛片| 成人欧美大片| 久久精品91蜜桃| 久久精品国产亚洲av香蕉五月| 色噜噜av男人的天堂激情| 国产一区二区激情短视频| 九九久久精品国产亚洲av麻豆| 日韩欧美免费精品| 狂野欧美白嫩少妇大欣赏| 日日摸夜夜添夜夜添小说| 欧美日韩一区二区视频在线观看视频在线 | 99久久久亚洲精品蜜臀av| 内射极品少妇av片p| 亚洲经典国产精华液单| 欧美+亚洲+日韩+国产| 日韩制服骚丝袜av| 亚洲成人久久性| 久久久久久久亚洲中文字幕| 久久久精品大字幕| 久久精品国产亚洲av涩爱 | 人妻夜夜爽99麻豆av| 国产精品人妻久久久影院| 狠狠狠狠99中文字幕| 亚洲国产精品sss在线观看| 国内久久婷婷六月综合欲色啪| 成人无遮挡网站| 欧美zozozo另类| 久久国内精品自在自线图片| 蜜桃亚洲精品一区二区三区| 中文字幕免费在线视频6| 国产在视频线在精品| 在线a可以看的网站| 国产aⅴ精品一区二区三区波| 一进一出抽搐gif免费好疼| 少妇裸体淫交视频免费看高清| 中文字幕精品亚洲无线码一区| 欧美激情久久久久久爽电影| 亚洲精品色激情综合| 精品无人区乱码1区二区| 在线播放无遮挡| 97人妻精品一区二区三区麻豆| 日韩av在线大香蕉| 国产大屁股一区二区在线视频| 久久精品人妻少妇| 欧美在线一区亚洲| 天堂网av新在线| 国产乱人视频| 欧美zozozo另类| 男女那种视频在线观看| 午夜福利18| 男女之事视频高清在线观看| 国产av麻豆久久久久久久| 村上凉子中文字幕在线| 国产成人a∨麻豆精品| 亚洲丝袜综合中文字幕| 午夜a级毛片| 国产精品嫩草影院av在线观看| 欧美日韩国产亚洲二区| 哪里可以看免费的av片| 欧美中文日本在线观看视频| 欧美一区二区精品小视频在线| 欧美性感艳星| 色av中文字幕| 午夜福利高清视频| 99久久中文字幕三级久久日本| 欧美xxxx性猛交bbbb| 国产午夜精品论理片| 午夜福利18| 一本久久中文字幕| 大香蕉久久网| 亚洲最大成人av| 又爽又黄无遮挡网站| 国产精品久久久久久久电影| 国产精品精品国产色婷婷| 人妻久久中文字幕网| av.在线天堂| 亚洲国产欧洲综合997久久,| 在线免费十八禁| 伊人久久精品亚洲午夜| 99在线人妻在线中文字幕| 亚洲欧美日韩高清专用| 亚洲最大成人中文| 免费av毛片视频| 嫩草影院入口| 亚洲欧美精品综合久久99| 精品午夜福利在线看| 国产av在哪里看| 日本精品一区二区三区蜜桃| 国产精品日韩av在线免费观看| 嫩草影院精品99| 久久精品国产亚洲网站| 国产精品一区www在线观看| 国产综合懂色| 亚洲欧美精品自产自拍| 精品国产三级普通话版| av在线播放精品| 亚洲欧美清纯卡通| 久久久久性生活片| 少妇的逼水好多| 亚洲综合色惰| 干丝袜人妻中文字幕| 国产亚洲精品久久久久久毛片| 国产精品一区二区三区四区久久| 久久人人爽人人片av| 亚洲人成网站在线播放欧美日韩| 精品免费久久久久久久清纯| 亚洲欧美成人精品一区二区| 99久久中文字幕三级久久日本| 亚洲一区高清亚洲精品| 日韩人妻高清精品专区| 午夜精品在线福利| 大香蕉久久网| 欧美日韩乱码在线| 日日摸夜夜添夜夜添小说| 日韩制服骚丝袜av| 成人亚洲精品av一区二区| 日本黄大片高清| 欧美激情在线99| 一级毛片aaaaaa免费看小| 男女做爰动态图高潮gif福利片| 中文字幕精品亚洲无线码一区| 亚洲人成网站在线播放欧美日韩| 卡戴珊不雅视频在线播放| 日韩欧美在线乱码| 亚洲内射少妇av| 国产精品永久免费网站| 男人舔女人下体高潮全视频| 男人狂女人下面高潮的视频| 蜜臀久久99精品久久宅男| 国内精品宾馆在线| 国产亚洲精品久久久久久毛片| 天美传媒精品一区二区| 美女被艹到高潮喷水动态| 丰满的人妻完整版| 亚洲精品日韩在线中文字幕 | 乱系列少妇在线播放| 亚洲经典国产精华液单| 亚洲aⅴ乱码一区二区在线播放| 午夜免费男女啪啪视频观看 | 成人欧美大片| 搡老岳熟女国产| 亚洲欧美日韩高清专用| 亚洲第一区二区三区不卡| 91在线精品国自产拍蜜月| 精品久久久久久久人妻蜜臀av| 色吧在线观看| 日本在线视频免费播放| 日韩精品有码人妻一区| 免费看av在线观看网站| 日本五十路高清| 久久久国产成人免费| av天堂中文字幕网| 深爱激情五月婷婷| 在线播放无遮挡| 哪里可以看免费的av片| 国产综合懂色| 91麻豆精品激情在线观看国产| 精品午夜福利视频在线观看一区| 三级国产精品欧美在线观看| 欧美日韩乱码在线| 欧美高清成人免费视频www| 3wmmmm亚洲av在线观看| 国产精品嫩草影院av在线观看| 亚洲最大成人中文| 黄色视频,在线免费观看| 国产精品电影一区二区三区| АⅤ资源中文在线天堂| 亚洲av不卡在线观看| 97碰自拍视频| 亚洲成人久久爱视频| 成年女人看的毛片在线观看| 最后的刺客免费高清国语| 国内精品一区二区在线观看| 深爱激情五月婷婷| 91狼人影院| 国产高清激情床上av| 蜜桃亚洲精品一区二区三区| 成人三级黄色视频| 麻豆精品久久久久久蜜桃| 国产亚洲精品久久久久久毛片| 久久韩国三级中文字幕| 日韩成人伦理影院| 舔av片在线| 99热这里只有是精品50| 久久久久久久久大av| 久久99热6这里只有精品| 22中文网久久字幕| 一级毛片久久久久久久久女| 国产精品99久久久久久久久| 精品久久国产蜜桃| 欧美最黄视频在线播放免费| 国产黄a三级三级三级人| 精品人妻一区二区三区麻豆 | 午夜福利在线观看吧| 欧美绝顶高潮抽搐喷水| 日本a在线网址| 欧美日本视频| 中文字幕熟女人妻在线| 午夜视频国产福利| 我的女老师完整版在线观看| 亚洲天堂国产精品一区在线| 美女黄网站色视频| 淫妇啪啪啪对白视频| 日韩欧美一区二区三区在线观看| 热99re8久久精品国产| 成年女人看的毛片在线观看| 久久午夜亚洲精品久久| 国产午夜福利久久久久久| 插阴视频在线观看视频| 99久久九九国产精品国产免费| 亚洲av第一区精品v没综合| 中文资源天堂在线| 成人漫画全彩无遮挡| 亚洲在线观看片| 人人妻人人澡欧美一区二区| 久久精品国产亚洲网站| 国产精品福利在线免费观看| 又爽又黄无遮挡网站| 神马国产精品三级电影在线观看| 非洲黑人性xxxx精品又粗又长| 大型黄色视频在线免费观看| 亚洲欧美日韩高清专用| 寂寞人妻少妇视频99o| 男人的好看免费观看在线视频| 欧美区成人在线视频| 两个人视频免费观看高清| 国产探花极品一区二区| 69av精品久久久久久| 日韩欧美在线乱码| 99九九线精品视频在线观看视频| 精品少妇黑人巨大在线播放 | 色哟哟·www| 可以在线观看毛片的网站| 日韩欧美三级三区| 淫妇啪啪啪对白视频| 亚洲18禁久久av| 精品午夜福利视频在线观看一区| 国产高清视频在线观看网站| 91久久精品国产一区二区成人| 一本精品99久久精品77| 女同久久另类99精品国产91| 久久精品久久久久久噜噜老黄 | 国产精品乱码一区二三区的特点| 一区福利在线观看| 99国产精品一区二区蜜桃av| 国产高清三级在线| 97人妻精品一区二区三区麻豆| 国产精品久久久久久av不卡| 欧美高清成人免费视频www| 国产精品免费一区二区三区在线| 欧美中文日本在线观看视频| 国产爱豆传媒在线观看| 国模一区二区三区四区视频| 国产伦一二天堂av在线观看| 国产精品免费一区二区三区在线| 精品99又大又爽又粗少妇毛片| 日产精品乱码卡一卡2卡三| 国产亚洲av嫩草精品影院| 人人妻人人澡人人爽人人夜夜 | 99精品在免费线老司机午夜| 欧美又色又爽又黄视频| 久久九九热精品免费| 人妻丰满熟妇av一区二区三区| 婷婷精品国产亚洲av在线| 亚洲va在线va天堂va国产| 久久鲁丝午夜福利片| 一个人免费在线观看电影| 大又大粗又爽又黄少妇毛片口| 国产精品,欧美在线| 亚洲国产精品国产精品| 亚洲成人中文字幕在线播放| 国产精品美女特级片免费视频播放器| 欧美不卡视频在线免费观看| 亚洲aⅴ乱码一区二区在线播放| 国产精品久久久久久亚洲av鲁大| 亚洲国产精品合色在线| 色噜噜av男人的天堂激情| 亚洲av.av天堂| 亚洲中文日韩欧美视频| 亚洲国产高清在线一区二区三| 色综合亚洲欧美另类图片| 少妇猛男粗大的猛烈进出视频 | 美女国产视频在线观看| 国产精品久久久久久精品电影小说| 中国美白少妇内射xxxbb| 国产精品秋霞免费鲁丝片| 人妻人人澡人人爽人人| 中文字幕久久专区| 五月伊人婷婷丁香| 亚洲四区av| 欧美人与善性xxx| 久久久久久久久大av| 51国产日韩欧美| 国产成人精品福利久久| 色哟哟·www| 中文字幕制服av| 亚洲欧美精品自产自拍| 久久6这里有精品| 在线观看人妻少妇| 日韩制服骚丝袜av| 婷婷色av中文字幕| 欧美亚洲 丝袜 人妻 在线| 久久久久网色| 看十八女毛片水多多多| 少妇裸体淫交视频免费看高清| 在线观看免费视频网站a站| 亚洲激情五月婷婷啪啪| 免费观看的影片在线观看| 免费观看av网站的网址| 人妻少妇偷人精品九色| 久久99精品国语久久久| 丝袜在线中文字幕| 十八禁网站网址无遮挡 | 欧美精品高潮呻吟av久久| 国产一区二区三区综合在线观看 | 精品少妇黑人巨大在线播放| 精品一区二区免费观看| a级毛片在线看网站| av卡一久久| 尾随美女入室| 中文精品一卡2卡3卡4更新| 成年av动漫网址| 亚洲av欧美aⅴ国产| 国产精品久久久久久av不卡| 亚洲性久久影院| 国产亚洲午夜精品一区二区久久| 国产在线一区二区三区精| av在线观看视频网站免费| 国产精品久久久久成人av| 色94色欧美一区二区| 国产精品一区二区在线不卡| tube8黄色片| 草草在线视频免费看| 成人二区视频| 91午夜精品亚洲一区二区三区| 91精品国产国语对白视频| 久久亚洲国产成人精品v| 一本色道久久久久久精品综合| 亚洲图色成人| 18禁裸乳无遮挡动漫免费视频| 一级毛片aaaaaa免费看小| 成人漫画全彩无遮挡| 色5月婷婷丁香| 少妇猛男粗大的猛烈进出视频| 久久人妻熟女aⅴ| 亚洲四区av| 国产极品天堂在线| 欧美 日韩 精品 国产| 亚洲怡红院男人天堂| 亚洲国产毛片av蜜桃av| 狂野欧美激情性xxxx在线观看| 国产精品99久久久久久久久| 欧美日韩视频高清一区二区三区二| 黄色日韩在线| 夜夜骑夜夜射夜夜干| 在线观看av片永久免费下载| 一级黄片播放器| 只有这里有精品99| 麻豆乱淫一区二区| 少妇人妻 视频| 丰满饥渴人妻一区二区三| 久久99精品国语久久久| 日日啪夜夜爽| 国产精品偷伦视频观看了| 精品人妻熟女av久视频| 尾随美女入室| 成人免费观看视频高清| 在线观看三级黄色| 亚洲精品乱码久久久v下载方式| 国内揄拍国产精品人妻在线| 色视频www国产| 欧美亚洲 丝袜 人妻 在线| 婷婷色av中文字幕| 亚洲天堂av无毛| 日韩 亚洲 欧美在线| 伊人亚洲综合成人网| 国产淫片久久久久久久久| 亚洲国产精品一区二区三区在线| 夜夜骑夜夜射夜夜干| 五月开心婷婷网| 免费观看无遮挡的男女| 国产在线视频一区二区| 一级二级三级毛片免费看| 欧美高清成人免费视频www| 国产男女内射视频| 成人综合一区亚洲| 国产亚洲欧美精品永久| 成人综合一区亚洲| 97在线视频观看| 精品人妻一区二区三区麻豆| 国产伦精品一区二区三区视频9| 中文字幕人妻熟人妻熟丝袜美| 成人黄色视频免费在线看| 特大巨黑吊av在线直播| 丰满饥渴人妻一区二区三| 国产伦精品一区二区三区四那| 18禁裸乳无遮挡动漫免费视频| 国产色爽女视频免费观看| 2018国产大陆天天弄谢| h视频一区二区三区| 多毛熟女@视频| 精品人妻一区二区三区麻豆| 在线观看免费日韩欧美大片 | 丰满人妻一区二区三区视频av| a级毛色黄片| 国产精品国产三级专区第一集| 男人爽女人下面视频在线观看| 高清视频免费观看一区二区| 午夜影院在线不卡| 国产一区二区三区av在线| 亚洲精品456在线播放app| 欧美日韩一区二区视频在线观看视频在线| 成人18禁高潮啪啪吃奶动态图 | 国产一区亚洲一区在线观看| 新久久久久国产一级毛片| 亚洲av男天堂| 国产色爽女视频免费观看| 多毛熟女@视频| 97超碰精品成人国产| 亚洲精品国产色婷婷电影| 精品亚洲乱码少妇综合久久| 精华霜和精华液先用哪个| 亚洲不卡免费看| 免费不卡的大黄色大毛片视频在线观看| 80岁老熟妇乱子伦牲交| 精品少妇久久久久久888优播| 国产深夜福利视频在线观看| 婷婷色麻豆天堂久久| av女优亚洲男人天堂| 国产极品天堂在线| 中文字幕亚洲精品专区| 国产成人免费观看mmmm| 美女中出高潮动态图| 狂野欧美激情性xxxx在线观看| 国产欧美日韩精品一区二区| 国国产精品蜜臀av免费| 久久精品熟女亚洲av麻豆精品| 伦理电影免费视频| 国产精品99久久久久久久久| 各种免费的搞黄视频| 亚洲精品一区蜜桃| 99久久精品热视频| 国产中年淑女户外野战色| 国产极品天堂在线| 天堂俺去俺来也www色官网| 69精品国产乱码久久久| 特大巨黑吊av在线直播| 成人国产av品久久久| 中文乱码字字幕精品一区二区三区| a级一级毛片免费在线观看| 九色成人免费人妻av| 欧美+日韩+精品| 久久久久视频综合| 国产在线男女| 伦理电影免费视频| 岛国毛片在线播放| 在线 av 中文字幕| 自拍偷自拍亚洲精品老妇| 黑人巨大精品欧美一区二区蜜桃 | 欧美最新免费一区二区三区| 精品卡一卡二卡四卡免费| 成年美女黄网站色视频大全免费 | 欧美精品亚洲一区二区| 亚洲精品亚洲一区二区| 国产精品久久久久久久久免| 免费不卡的大黄色大毛片视频在线观看| 秋霞伦理黄片| 精品久久久久久久久av| 日韩欧美一区视频在线观看 | 少妇精品久久久久久久| 成人毛片60女人毛片免费| 在线免费观看不下载黄p国产| 国产精品偷伦视频观看了| 自线自在国产av| 亚洲欧洲国产日韩| 一级爰片在线观看| 一级a做视频免费观看| 国产成人freesex在线| 99九九在线精品视频 | 少妇猛男粗大的猛烈进出视频|