• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    計算機(jī)情報檢索系統(tǒng)核心實(shí)現(xiàn)技術(shù)發(fā)展歷程回顧

    2014-02-12 10:14:10李潔玉
    圖書情報研究 2014年4期
    關(guān)鍵詞:信息檢索搜索引擎文檔

    李潔玉

    (江蘇大學(xué)圖書館 鎮(zhèn)江 212013)

    ·史考縱橫·

    計算機(jī)情報檢索系統(tǒng)核心實(shí)現(xiàn)技術(shù)發(fā)展歷程回顧

    李潔玉

    (江蘇大學(xué)圖書館 鎮(zhèn)江 212013)

    計算機(jī)情報檢索系統(tǒng)的研究起始于1950年代,到現(xiàn)在已經(jīng)經(jīng)過約60年的歲月。目前它已經(jīng)成為情報學(xué)和計算機(jī)科學(xué)的一個重要分支學(xué)科。本文從情報檢索的萌芽階段,交互式搜索的興起,文本搜索的開始,全文本搜索、英特網(wǎng)與搜索引擎,英特網(wǎng)走向昌盛五個階段簡要介紹這60年來計算機(jī)信息檢索系統(tǒng)研究方面的歷史,著重介紹檢索算法和能提高檢索性能的核心實(shí)現(xiàn)技術(shù)。并對信息檢索中的中文分詞和中文信息檢索評價研究工作亦進(jìn)行簡短回顧。

    情報檢索 實(shí)現(xiàn)技術(shù) 發(fā)展階段 排序算法

    1 20世紀(jì)40年代到50年代——情報檢索的萌芽階段

    直到20世紀(jì)40年代,情報檢索作為一個研究學(xué)科還處于萌芽階段,尚未形成專業(yè)化的情報檢索系統(tǒng)[1]。1948年,在英國皇家學(xué)會的一個主題為如何應(yīng)付科技信息量爆炸式增長的專題討論會上,Holmstrom描述了一個名為Univac的機(jī)器,該機(jī)器能夠搜索與所給定的科目代碼相關(guān)的參考文獻(xiàn),代碼和參考文獻(xiàn)文本均被存儲在穿孔紙帶上[2]。這是首次提到計算機(jī)用于文獻(xiàn)檢索領(lǐng)域。其他一些計算機(jī)檢索系統(tǒng)的介紹見文獻(xiàn)3[3]。早期的計算機(jī)情報檢索主要在兩個方向上有重要進(jìn)展:為文檔建立索引和如何對文檔進(jìn)行檢索。

    1.1 為文檔建立索引

    在圖書館領(lǐng)域,如何將“項”(item)組織成集合是經(jīng)常辯論的主題。傳統(tǒng)的方法是使用層次型學(xué)科分類方案,如杜威十進(jìn)制分類系統(tǒng)(the Dewey Decimal system)。然而,有很多替代方案被提出。最有名的是Taube等人提出的單元詞(Uniterm)[4],它的基本思想是用一組關(guān)鍵字為項建立索引。在今天看來,這個想法非常簡單,但在當(dāng)時這被看作是非常激進(jìn)的一步。幾年以后,Cleverdon對單元項系統(tǒng)和傳統(tǒng)的分類方法的有效性[5]進(jìn)行了詳細(xì)的比較,結(jié)論是單元詞至少和其他方法一樣好,甚至有可能比其他方法更好。這個結(jié)論非常出人意外。但經(jīng)過其他人的反復(fù)驗證,Cleverdon的實(shí)驗結(jié)果得到同行認(rèn)可。

    1.2 基于排名的檢索

    在早期的情報檢索系統(tǒng)中,廣泛采用布爾查詢。布爾查詢由一些詞組合而成,據(jù)此我們可找出和查詢完全匹配的所有文檔。Luhn提出一種新的方法:為文檔集合中的每個文檔分配相應(yīng)的得分以表示該文檔與給定查詢之間的相關(guān)性,然后將這些文檔根據(jù)得分進(jìn)行排序[6]。Maron、Kuhns和Ray進(jìn)行了測試,結(jié)果表明它優(yōu)于布爾搜索[7]。同年,基于Maron等人的工作,Luhn提出“一個詞在一篇文檔中出現(xiàn)的次數(shù)是決定這個詞重要性的有效指標(biāo)”[8]。該方法后來被稱為詞頻加權(quán)。由此采用排名的檢索方法在學(xué)界受到重視。接下來的幾十年里,該方法被廣泛使用并被不斷細(xì)化和改進(jìn)。

    2 20世紀(jì)60年代——用戶交互式搜索的興起

    2.1 商業(yè)搜索公司的興起

    在20世紀(jì)60年代,一些商業(yè)搜索公司從專為大型公司或政府機(jī)構(gòu)研制專用檢索系統(tǒng)的項目中脫殼而出。Dennis在其論文中描述了早期的一個能搜索數(shù)以萬計文檔的情報檢索系統(tǒng)[9]。 另一個例子是Dialog公司,它成立于1966年,是首先專門為客戶提供搜索的公司之一,該公司起源于為美國航空航天局創(chuàng)建的一個情報檢索系統(tǒng)[10]。

    2.2 空間向量模型

    在研究領(lǐng)域,情報檢索算法的形式化是一項有意義的工作,它是進(jìn)一步提高情報檢索性能的有效途徑。值得注意的一種方法是由Switzer提出的空間向量模型[11]。在該模型中,文檔集合中所有索引詞條形成一幾何空間,而文檔和查詢都看作是該間中的向量。文檔和查詢向量之間的相似性由它們之間的的余弦系數(shù)來測定[12]。

    3 20世紀(jì)70年代——文本搜索的開始

    3.1 逆文檔頻率

    Jones首次提出逆文檔頻率(IDF)的概念[13]。逆文檔頻率(IDF)是指在一個文檔集合中,一個單詞出現(xiàn)的頻率和其檢索意義上的重要性成反比:不太常見的詞傾向于反映更具體的概念,它在檢索中更重要。結(jié)合TF和IDF兩種權(quán)值的想法被提出后很快就被廣泛采納了。另一方面,Salton帶領(lǐng)他的研究組繼續(xù)從事向量空間模型的工作[14]。他們的研究成果支撐了許多研究型檢索系統(tǒng),激勵后來者在隨后20年中做了更進(jìn)一步的研究。

    3.2 概率模型

    情報檢索系統(tǒng)的另一種建模方法是利用概率論擴(kuò)充Maron、Kuhns和Ray的想法。Robertson定義了概率排名原理[15],對于特定的評價指標(biāo),它確定如何得到基于概率的最佳排名。一些變種在Robertson和Jones發(fā)表的另一篇論文[16]和Rijsbergen的書[17]中給出。這些成果刺激了大量的對概率論模型的進(jìn)一步研究。

    1971年,第一屆ACM情報檢索會議在紐約舉行。1997年召開了第二次會議,此后該會議每年舉行一次。

    4 1980年代至1990年代中期——全文本搜索、英特網(wǎng)與搜索引擎

    4.1 排名函數(shù)BM25

    20世紀(jì)70年代,人們對TF-IDF加權(quán)方案提出了一些變種。Salton和 Buckley[18]對此方法用于向量空間模型做了廣泛的討論與回顧。在概率模型方面,最初的概率模型沒有包括TF權(quán)重,一些研究人員有效地將其納入其中。這項工作最終導(dǎo)致了排名函數(shù)BM25。BM25雖然在形式化方面有所不足,但有效性較之前的概率模型有較大的提高。

    4.2 潛在語義索引

    和向量空間模型有關(guān),潛在語義索引(Latent Semantic Indexing)通過奇異值分解[19]將任何文檔集合所對應(yīng)的向量空間的維數(shù)減少。這樣文檔和查詢被映射到較低維的空間。Deerwester和他的同事聲稱降維導(dǎo)致查詢能夠匹配到更多的相關(guān)文件。

    4.3 計算語言學(xué)方法的應(yīng)用

    不同于潛在語義索引這樣的純數(shù)值方法,其他一些探測性的計算語言學(xué)方法考慮英語的很多方面如詞的語法與語義、詞的重復(fù)和模糊性、命名實(shí)體等。在這方面雖然進(jìn)行了大量的研究工作,但對于檢索系統(tǒng)的有效性鮮少有什么幫助。唯一被發(fā)現(xiàn)有用的是詞干提取算法(stemming)。詞干提取算法是指將文檔和查詢中的英文單詞均去掉詞尾,保留詞頭和詞干。詞干提取算法可以追溯到1960年代。波特在1970年代末開發(fā)出一套小巧的適用于英語的提取規(guī)則,他的波特詞干提取算法[20]至今仍有很大影響。

    4.4 文本檢索會議——TREC

    1980年代末到1990年代初學(xué)術(shù)界關(guān)注的一個問題是,相較于當(dāng)時一些商業(yè)搜索引擎公司采用的文檔集合,當(dāng)時學(xué)術(shù)界用于測試的文檔集合普遍規(guī)模很小。從1992年起,Donna Harman和她的同事創(chuàng)辦TREC(Text REtrieval Conference,文本檢索)會議,每年舉辦一次。由眾多的國際研究團(tuán)體合作構(gòu)造出一些測試集合,比以前使用的文檔集合要大幾個數(shù)量級[21]。采用這些新的數(shù)據(jù)集后可使實(shí)驗結(jié)果更具實(shí)際意義。

    4.5 學(xué)習(xí)排名

    到這一時期,在搜索引擎中使用的排序函數(shù)是由人工設(shè)計,并在實(shí)驗中手動調(diào)整一些參數(shù)。Fuhr[22]描述了如何通過確定一組查詢和其相關(guān)的文檔作為訓(xùn)練數(shù)據(jù)而學(xué)到檢索函數(shù)。文獻(xiàn)23[23]和文獻(xiàn)24[24]提出了更多的方法。由于缺乏足夠的訓(xùn)練數(shù)據(jù),這些方法在當(dāng)時效果不佳。到了2000年代,Web查詢?nèi)罩敬罅砍霈F(xiàn),可用作為訓(xùn)練數(shù)據(jù)。這些方法使用了Web查詢?nèi)罩竞螅Ч兒谩?/p>

    5 1990年代中期至今——英特網(wǎng)走向昌盛的年代

    5.1 英特網(wǎng)搜索與相應(yīng)的技術(shù)

    Berners-Lee在1990年底創(chuàng)建了萬維網(wǎng),在最初幾年網(wǎng)站和網(wǎng)頁的數(shù)量還相對較少,采用傳統(tǒng)的手工編目方法就可以。但后來網(wǎng)站和網(wǎng)頁的數(shù)量成倍地增長,手工方法日漸不敷。Web搜索引擎在1993年下半年開始出現(xiàn),以滿足日益增長的需要。

    為了有效支持Web上的應(yīng)用,出現(xiàn)了兩處重要的研究進(jìn)展,它們是鏈接分析和錨文本的搜索。錨文本不僅搜索網(wǎng)頁本身的內(nèi)容,并且搜索鏈接指向的文本。錨文本一般是頁面的一個簡短的總結(jié),在較早時候就被認(rèn)識到可作為有價值的信息源(如McBryan在1994年的工作[25])。一些人為網(wǎng)頁寫作了錨文本,主要目的是使操縱該文本更難實(shí)現(xiàn)。使用錨文本是谷歌搜索引擎的一個主要特點(diǎn)[26]。鏈接分析法PageRank由谷歌的創(chuàng)始人提出,而HITS是在差不多同時由Kleinberg 提出[27]。

    在現(xiàn)有的文檔排序功能上添加鏈接分析和文檔的多重文本表示,意味著我們會使情報檢索系統(tǒng)的內(nèi)部算法變得更加復(fù)雜。為不同的特征正確地設(shè)置參數(shù)是一個挑戰(zhàn),這使得人們重新探討由Fuhr啟動的學(xué)習(xí)排序方法。Fuhr當(dāng)時苦于缺乏足夠的訓(xùn)練數(shù)據(jù),但是,當(dāng)搜索引擎廣泛流行,人們認(rèn)識到,用戶交互的日志可作此用。

    5.2 從查詢?nèi)罩局刑崛⌒畔?/p>

    從搜索引擎的日志中自動提取信息也引起人們的注意。雖然存儲并檢查日志的實(shí)踐已有多年,但大多數(shù)情況是作為對手動調(diào)節(jié)檢索系統(tǒng)提供有用的信息。當(dāng)大眾普遍開始使用Web搜索引擎時,人們逐步認(rèn)識到可從這些日志中提取有價值的信息的真正潛力。檢查用戶的查詢、選擇結(jié)果列表中文檔的用戶模式和用戶查詢的再形成,使研究人員能準(zhǔn)確理解用戶的“意圖”, 以制定更有效的查詢處理技術(shù),如自動拼寫校正[28]、自動查詢擴(kuò)展[29]和更準(zhǔn)確的詞干保留技術(shù)(stemming)[30]。

    5.3 信息需求的多樣性

    人們早就認(rèn)識到,即使是使用同一個查詢,不同的用戶可能有不同的信息需求,情報檢索系統(tǒng)應(yīng)該能夠滿足這些不同的需求。這就需要在對文檔進(jìn)行排名時,搜索引擎要同時考慮文檔的相關(guān)性和多樣性。自1990年代末以來,已經(jīng)有很多科學(xué)家共同努力試圖解決這個問題。Carbonell和Goldstein關(guān)于他們的多樣性系統(tǒng)MMR的描述[31]是該問題的一篇核心論文。

    5.4 檢索模型的新進(jìn)展

    在此期間,作為情報檢索系統(tǒng)中的核心排名功能的基礎(chǔ),檢索模型繼續(xù)有新的進(jìn)展。特別值得注意的是使用語言模型的概率方法,最早由Ponte、Croft[32]和Hiemstra[33]提出。通過對文檔和查詢之間的匹配過程采取新的觀點(diǎn),語言模型方法為一些情報檢索過程,如相關(guān)性反饋、形成文檔的集群(cluster)、項之間的依賴等提供了新的認(rèn)識。

    隨著計算環(huán)境的變化,搜索和情報檢索仍然繼續(xù)發(fā)展。近來這種類型的變化最明顯的例子就是移動設(shè)備和社交媒體的快速增長。情報檢索學(xué)界對此的反應(yīng)是開展對社會化搜索的研究,其中涉及到用戶社區(qū)和非正式的信息交換。新的研究在各種主題諸如用戶標(biāo)記、談話檢索、過濾和推薦、協(xié)作搜索等開展,并開始提供用于管理個人和社會信息有效的新工具。

    5.5 短查詢與長查詢

    根據(jù)統(tǒng)計大部分提交到Web搜索引擎的查詢都很短(1~3詞),所以很多基于Web的情報檢索研究都把注意力集中于短查詢。短查詢一般沒有什么語言結(jié)構(gòu),有些時候只由一個名詞或名詞短語組成。另一項進(jìn)展是支持用戶提出的長查詢。這項研究工作的開始與TREC的問題回答任務(wù)[34]有關(guān)。該任務(wù)試圖對某些類型的問題(像“WH”問題如“誰”和“什么時候”)找出簡短的答案。該任務(wù)很適合大型社區(qū)答疑檔案這樣的應(yīng)用。研究人員還一直在對更詳細(xì)的問題開發(fā)、提供更有針對性的答案的技術(shù)。一些應(yīng)用程序如蘋果的情報檢索Siri、IBM的Watson和雅虎問答的成功,很大程度上是由于該項研究的開展。

    6 中文信息檢索

    中文信息檢索是中文情報處理的一部分。中國中文信息學(xué)會成立于1981年6月,錢偉長、甄健民、安其春等為主要發(fā)起人。中文信息處理學(xué)科是在語言文字學(xué)、計算機(jī)應(yīng)用技術(shù)、人工智能、認(rèn)知心理學(xué)和數(shù)學(xué)等相關(guān)學(xué)科的基礎(chǔ)上形成的一門交叉學(xué)科。中文信息檢索系統(tǒng)的實(shí)現(xiàn)多采用國際上已有的基于英文的信息檢索技術(shù)。但在下述兩個方面有差別。

    6.1 中文分詞

    中英文信息(情報)檢索的主要區(qū)別在于檢索的基本單位不同。英文詞之間一般可根據(jù)空格自動區(qū)分,而中文檢索更為復(fù)雜。如為所有的單字建立索引,則檢索效果不理想。所以一般為一個或多個字組成的詞建立索引,則需要好的分詞算法?,F(xiàn)有的分詞算法可分為三類:基于辭典、詞庫匹配的分詞方法,基于詞頻統(tǒng)計的分詞方法和基于知識理解的分詞方法。對于每一類,都已提出了很多種方法。

    6.2 中文信息檢索評價

    2003 年,國家863 計劃軟硬件主題設(shè)立了“中文信息處理和智能人機(jī)接口技術(shù)評測”專項課題,對包括機(jī)器翻譯、語音識別、信息檢索在內(nèi)的中文信息處理關(guān)鍵技術(shù)進(jìn)行評測。該課題由中國科學(xué)院計算技術(shù)研究所承辦,從2003 年到2005年連續(xù)舉辦三屆[35]。

    SEWM是另一項主要的中文信息檢索評測活動,這項活動由北京大學(xué)從2004年起至2011年共舉辦8次[36]。該活動側(cè)重于Web信息檢索,在某些年份,也有其他一些不同的主題如垃圾郵件過濾、非網(wǎng)頁數(shù)字資源分類等。關(guān)于構(gòu)建測試集的一些考慮因素的討論見文獻(xiàn)37[37]。

    7 結(jié)論和未來方向

    在20世紀(jì)初,人們常常利用圖書館,通過使用卡片目錄,希望找到有關(guān)的書籍或文檔資料,以滿足查找信息的需求。這種方式既不方便又慢,效率較低,還受到圖書館收藏的局限,通常僅能找到有限的信息,用它解決極少量的問題。到了21世紀(jì),基于Web的搜索幾乎是無處不在的,人們通過互聯(lián)網(wǎng),采用搜索引擎在瞬間訪問到數(shù)百萬兆字節(jié)的網(wǎng)頁、視頻剪輯、新聞、圖片、社會媒體掃描的書籍、學(xué)術(shù)論文、音樂、電視節(jié)目和電影。在過去幾年中,甚至發(fā)展到利用移動電話來進(jìn)行類似的搜索。與100年前的情報檢索方式唯一的共同點(diǎn)是,這兩種服務(wù)一般都可以免費(fèi)使用。

    如今的情報檢索系統(tǒng)已經(jīng)很容易使用,然而情報檢索系統(tǒng)背后的技術(shù)卻凝聚了眾多科學(xué)家和研究人員的心血,是他們60多年來的不斷創(chuàng)新和努力的結(jié)果。

    展望未來,短期而言,各種垂直型的搜索引擎(如旅游、餐飲、購物、體育、學(xué)術(shù)等)、社會網(wǎng)絡(luò)分析與事件和輿情的識別、移動訪問、與位置和時間有關(guān)的情報檢索、個性化服務(wù)、多媒體情報檢索等還會有進(jìn)一步的發(fā)展。從長期的和用戶的角度而言,更加完善的情報檢索系統(tǒng)包括能夠提供無可挑剔的語音識別、自然對話的管理、對于搜索者的信息需求的高水平的語義理解,以及能夠?qū)Υ罅康奈臋n和聯(lián)邦數(shù)據(jù)庫的無限制訪問。

    [1] 丁 蔚,倪 波,成 穎. 情報檢索的發(fā)展——情報學(xué)世紀(jì)回眸之一[J]. 情報科學(xué),2001,19(1):81-86.

    [2] Holmstrom J E. Section III. Opening plenary session [C]// The Royal Society Scientific Information Conference, 21 June-2 July 1948 : report and papers submitted. London: Royal Society, 1948.

    [3] Nanus B. The use of electronic computers for information retrieval[J]. Bulletin of the Medical Library Association, 1960, 48(3): 278.

    [4] Taube M, Gull C D, Wachtel I S. Unit terms in coordinate indexing[J]. American documentation, 1952, 3(4): 213-218.

    [5] Belkin N J, Croft W B. Information filtering and information retrieval: two sides of the same coin?[J]. Communications of the ACM, 1992, 35(12): 29-38.

    [6] Luhn H P. A statistical approach to mechanized encoding and searching of literary information[J]. IBM Journal of research and development, 1957, 1(4): 309-317.

    [7] Maron M E, Kuhns J L, Ray L C. Probabilistic indexing. a statistical technique for document identification and retrieval[R]. Los Angeles:Thompson Ramo Wooldridge Inc , 1959.

    [8] Luhn H P. The automatic creation of literature abstracts[J]. IBM Journal of research and development, 1958, 2(2): 159-165.

    [9] Dennis B K, Brady J J, Dovel Jr J A. Index manipulation and abstract retrieval by computer[J]. Journal of Chemical Documentation, 1962, 2(4): 234-242.

    [10] Bjorner S, Ardito S C. Online before the Internet: Early pioneers tell their stories, Part 2: Growth of the online industry[J]. Searcher, 2003, 11(7): 52-61.

    [11] Switzer P. Vector images in document retrieval[J]. Statistical association methods for mechanized documentation, 1965: 163-171.

    [12] Rocchio J J. Relevance feedback in information retrieval[R]. Cambridge:Harvard University, 1965.

    [13] Jones K S. A statistical interpretation of term specificity and its application in retrieval[J]. Journal of documentation, 1972, 28(1): 11-21.

    [14] Salton G, Wong A, Yang C S. A vector space model for automatic indexing[J]. Communications of the ACM, 1975, 18(11): 613-620.

    [15] Robertson S E. The probability ranking principle in IR[J]. Journal of documentation, 1977, 33(4): 294-304.

    [16] Robertson S E, Jones K S. Relevance weighting of search terms[J]. Journal of the American Society for Information science, 1976, 27(3): 129-146.

    [17] Van Rijsbergen C J. Information Retrieval[M]. Oxford: Butterworth-Heinemann Ltd, 1979:224.

    [18] Salton G, Buckley C. Term-weighting approaches in automatic text retrieval[J]. Information Processing & Management, 1988, 24(5): 513-523.

    [19] Deerwester S C, Dumais S T, Landauer T K, et al. Indexing by latent semantic analysis[J]. JASIS, 1990, 41(6): 391-407.

    [20] Porter M F. An algorithm for suffix stripping[J]. Program: electronic library and information systems, 1980, 14(3): 130-137.

    [21] Voorhees E M,Harman D K. TREC: Experiment and evaluation in information retrieval[M]. Cambridge: MIT press, 2005:123-152.

    [22] Fuhr N. Optimum polynomial retrieval functions based on the probability ranking principle[J]. ACM Transactions on Information Systems (TOIS), 1989, 7(3): 183-204.

    [23] Fuhr N, Buckley C. A probabilistic learning approach for document indexing[J]. ACM Transactions on Information Systems (TOIS), 1991, 9(3): 223-248.

    [24] Cooper W S, Gey F C, Dabney D P. Probabilistic retrieval based on staged logistic regression[C]// Proceedings of the 15th annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 1992: 198-210.

    [25] McBryan O A. GENVL and WWWW: Tools for taming the web[C]// Proceedings of the first international world wide web conference. 1994:341.

    [26] Brin S, Page L. The anatomy of a large-scale hypertextual Web search engine[J]. Computer networks and ISDN systems, 1998, 30(1): 107-117.

    [27] Kleinberg J M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM, 1999, 46(5): 604-632.

    [28] Cucerzan S, Brill E. Spelling Correction as an Iterative Process that Exploits the Collective Knowledge of Web Users[C]// EMNLP. 2004, 4: 293-300.

    [29] Agichtein E, Brill E, Dumais S. Improving web search ranking by incorporating user behavior information[C]// Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 2006: 19-26.

    [30] Peng F, Ahmed N, Li X, et al. Context sensitive stemming for web search[C]// Proceedings of the 30th annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 2007: 639-646.

    [31] Carbonell J, Goldstein J. The use of MMR, diversity-based reranking for reordering documents and producing summaries[C]// Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 1998: 335-336.

    [32] Ponte J M, Croft W B. A language modeling approach to information retrieval[C]// Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 1998: 275-281.

    [33] Hiemstra D. A linguistically motivated probabilistic model of information retrieval[M]// Research and advanced technology for digital libraries. Berlin: Springer Berlin Heidelberg, 1998: 569-584.

    [34] Voorhees E M. The TREC question answering track[J]. Natural Language Engineering, 2001, 7(4): 361-378.

    [35] 中國科學(xué)院計算技術(shù)研究所. 信息檢索評測技術(shù)概述[EB/OL]. [2014-04-20]. http://www.ict.ac.cn/kxcb/kxr/201009/t20100907_2945830.html.

    [36] 北京大學(xué)網(wǎng)絡(luò)實(shí)驗室. 中文Web信息檢索論壇(CWIRF)[EB/OL]. [2014-04-20]. http://www.cwirf.org/.

    [37] 李靜靜,閆宏飛. 中文網(wǎng)頁信息檢索測試集的構(gòu)建、分析及應(yīng)用[J]. 中文信息學(xué)報,2008,22(1):30-36.

    (責(zé)任編校 田麗麗)

    ABriefIntroductiontotheHistoryoftheKeyImplementationTechnologyofComputerInformationRetrieval

    Li Jieyu

    Jiangsu University Library, Zhenjiang 212013, China

    It has been over 60 years since researchers began to investigate computerized information retrieval systems in the 1950s. Up to now it has become an important branch in information science and computer science as well. We break the whole 60 years down to 5 stages, namely appearance of information retrieval, interactional search, text search, whole text search and Internet search engine, Internet tending towards prosperity, and discuss each of them with a focus on the key implementation technology. We also give a brief account of the evaluation of Chinese segmentation and Chinese information retrieval.

    information retrieval; implementation technology; stage of development; ranking algorithm

    G354

    李潔玉,女,1963年生,碩士,工程師。

    猜你喜歡
    信息檢索搜索引擎文檔
    有人一聲不吭向你扔了個文檔
    基于RI碼計算的Word復(fù)制文檔鑒別
    醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
    新聞傳播(2016年18期)2016-07-19 10:12:06
    基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    網(wǎng)絡(luò)搜索引擎亟待規(guī)范
    基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
    廣告主與搜索引擎的雙向博弈分析
    教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實(shí)施
    河南科技(2014年11期)2014-02-27 14:10:19
    公共圖書館信息檢索服務(wù)的實(shí)踐探索——以上海浦東圖書館為例
    圖書館界(2013年5期)2013-03-11 18:50:29
    国产成人欧美| 亚洲国产看品久久| 99国产精品一区二区三区| 久久ye,这里只有精品| 免费在线观看黄色视频的| 九色亚洲精品在线播放| 在线观看免费日韩欧美大片| 美女高潮喷水抽搐中文字幕| 亚洲国产精品sss在线观看 | 日本欧美视频一区| 欧美精品啪啪一区二区三区| 黄片播放在线免费| 国产成人欧美在线观看 | 欧美成人午夜精品| 午夜91福利影院| 国内久久婷婷六月综合欲色啪| 亚洲,欧美精品.| 韩国精品一区二区三区| 99国产精品99久久久久| 男女高潮啪啪啪动态图| 亚洲第一欧美日韩一区二区三区| 99精品久久久久人妻精品| 99精国产麻豆久久婷婷| 无遮挡黄片免费观看| 免费在线观看视频国产中文字幕亚洲| 视频区图区小说| 18禁国产床啪视频网站| 久久人人97超碰香蕉20202| 国产乱人伦免费视频| 男男h啪啪无遮挡| 精品欧美一区二区三区在线| 久久99一区二区三区| 丰满的人妻完整版| 天天躁夜夜躁狠狠躁躁| 两性午夜刺激爽爽歪歪视频在线观看 | 夜夜爽天天搞| 天堂√8在线中文| 国产xxxxx性猛交| 国产一区二区三区视频了| 国产在视频线精品| 国产精品一区二区在线不卡| 人人妻人人澡人人看| 亚洲精品中文字幕一二三四区| 99国产精品免费福利视频| 亚洲国产精品sss在线观看 | av一本久久久久| 热99re8久久精品国产| 精品福利永久在线观看| 国产av精品麻豆| 午夜视频精品福利| 日韩欧美在线二视频 | 老司机亚洲免费影院| 欧美大码av| 狂野欧美激情性xxxx| 亚洲成a人片在线一区二区| 99香蕉大伊视频| 后天国语完整版免费观看| 欧美精品人与动牲交sv欧美| 五月开心婷婷网| 亚洲av美国av| 他把我摸到了高潮在线观看| 亚洲精品在线美女| 正在播放国产对白刺激| 欧美成狂野欧美在线观看| 成人免费观看视频高清| 五月开心婷婷网| 91成年电影在线观看| 日韩 欧美 亚洲 中文字幕| 欧美激情久久久久久爽电影 | 成年版毛片免费区| 啦啦啦视频在线资源免费观看| 淫妇啪啪啪对白视频| 正在播放国产对白刺激| 人妻久久中文字幕网| 性少妇av在线| 久久久国产成人免费| 欧美在线一区亚洲| 欧美日韩亚洲综合一区二区三区_| 国产男女超爽视频在线观看| 男女床上黄色一级片免费看| 日韩免费高清中文字幕av| 成人影院久久| 午夜久久久在线观看| 亚洲avbb在线观看| 亚洲人成电影观看| 国产有黄有色有爽视频| 日本黄色日本黄色录像| 国产精品免费一区二区三区在线 | 国产一区二区三区综合在线观看| 黄色女人牲交| 日韩成人在线观看一区二区三区| 国产欧美日韩一区二区三区在线| 日韩中文字幕欧美一区二区| 黄片播放在线免费| 国产激情久久老熟女| 热99re8久久精品国产| 在线观看日韩欧美| 免费女性裸体啪啪无遮挡网站| 久久亚洲精品不卡| 自线自在国产av| 国产视频一区二区在线看| 亚洲国产精品合色在线| 日韩免费高清中文字幕av| 久久国产亚洲av麻豆专区| 国产精品一区二区免费欧美| av一本久久久久| 欧美另类亚洲清纯唯美| 久久久国产成人精品二区 | 欧美精品一区二区免费开放| 一级,二级,三级黄色视频| 亚洲一码二码三码区别大吗| 亚洲熟妇熟女久久| 午夜激情av网站| 最近最新中文字幕大全电影3 | 丝瓜视频免费看黄片| 在线观看www视频免费| 精品少妇一区二区三区视频日本电影| 国产亚洲av高清不卡| 国产99白浆流出| av不卡在线播放| 在线观看舔阴道视频| 女性被躁到高潮视频| 国产精品98久久久久久宅男小说| 超碰成人久久| 91老司机精品| 久久久久国产一级毛片高清牌| 性少妇av在线| 亚洲综合色网址| 免费久久久久久久精品成人欧美视频| 免费不卡黄色视频| 国产精品.久久久| 高清视频免费观看一区二区| 捣出白浆h1v1| 国产高清激情床上av| 日韩 欧美 亚洲 中文字幕| 久久精品熟女亚洲av麻豆精品| 日韩欧美一区二区三区在线观看 | 国产亚洲欧美在线一区二区| 亚洲成人国产一区在线观看| 午夜福利,免费看| 欧美日本中文国产一区发布| 国产男女超爽视频在线观看| 人成视频在线观看免费观看| 69av精品久久久久久| 欧美黄色片欧美黄色片| 老熟女久久久| 新久久久久国产一级毛片| 国产野战对白在线观看| 水蜜桃什么品种好| 亚洲国产精品合色在线| 曰老女人黄片| 少妇 在线观看| 麻豆成人av在线观看| 国产精品免费视频内射| 欧美国产精品va在线观看不卡| 91九色精品人成在线观看| 女人高潮潮喷娇喘18禁视频| 欧美激情久久久久久爽电影 | 国产精品国产av在线观看| 黄色女人牲交| 18禁国产床啪视频网站| 日韩欧美三级三区| 99热只有精品国产| 捣出白浆h1v1| 国产一区二区三区综合在线观看| 欧美日本中文国产一区发布| 19禁男女啪啪无遮挡网站| 日本黄色日本黄色录像| 国产精品九九99| 亚洲av电影在线进入| 极品教师在线免费播放| 少妇裸体淫交视频免费看高清 | 69av精品久久久久久| 精品福利永久在线观看| 欧美日韩视频精品一区| 18禁黄网站禁片午夜丰满| 国产精品秋霞免费鲁丝片| 国产精品秋霞免费鲁丝片| av片东京热男人的天堂| 黑人猛操日本美女一级片| 我的亚洲天堂| 美女福利国产在线| 又黄又粗又硬又大视频| 欧美精品亚洲一区二区| 身体一侧抽搐| 一区福利在线观看| 在线免费观看的www视频| 午夜福利免费观看在线| 满18在线观看网站| 亚洲黑人精品在线| 久久精品国产亚洲av高清一级| 99精国产麻豆久久婷婷| 满18在线观看网站| 一级片免费观看大全| 亚洲人成电影免费在线| 熟女少妇亚洲综合色aaa.| 69精品国产乱码久久久| 这个男人来自地球电影免费观看| 久9热在线精品视频| 两人在一起打扑克的视频| 久久久久国产一级毛片高清牌| 我的亚洲天堂| 欧美国产精品va在线观看不卡| 黄网站色视频无遮挡免费观看| 亚洲专区中文字幕在线| 欧美精品高潮呻吟av久久| 亚洲第一av免费看| 国产成人系列免费观看| 丰满的人妻完整版| 日韩欧美免费精品| 国产欧美日韩一区二区精品| 热99re8久久精品国产| 高清毛片免费观看视频网站 | tube8黄色片| 人人妻人人爽人人添夜夜欢视频| 欧美在线黄色| 国产精品免费一区二区三区在线 | 黄片大片在线免费观看| 精品无人区乱码1区二区| 国产男女内射视频| 日日爽夜夜爽网站| 女性被躁到高潮视频| 久久国产精品影院| 久久婷婷成人综合色麻豆| 日本欧美视频一区| 国产免费av片在线观看野外av| 亚洲视频免费观看视频| 亚洲精品粉嫩美女一区| 久久人妻福利社区极品人妻图片| 亚洲黑人精品在线| 国产欧美日韩一区二区精品| 首页视频小说图片口味搜索| 亚洲欧洲精品一区二区精品久久久| 日日夜夜操网爽| 老司机亚洲免费影院| 妹子高潮喷水视频| 午夜免费成人在线视频| 精品一区二区三卡| 久久久久久久午夜电影 | 一区二区日韩欧美中文字幕| 午夜免费观看网址| 性色av乱码一区二区三区2| 视频区欧美日本亚洲| 亚洲一码二码三码区别大吗| 亚洲精华国产精华精| 波多野结衣一区麻豆| 久久久国产一区二区| 91在线观看av| 亚洲精品一卡2卡三卡4卡5卡| 18禁观看日本| 国产精品久久久人人做人人爽| 亚洲熟妇熟女久久| 亚洲人成电影观看| 黄色片一级片一级黄色片| 五月开心婷婷网| 大香蕉久久网| 日韩大码丰满熟妇| 女人精品久久久久毛片| 国产99久久九九免费精品| 亚洲成人免费电影在线观看| 国产av一区二区精品久久| 国产精品自产拍在线观看55亚洲 | 美女扒开内裤让男人捅视频| 精品一区二区三区av网在线观看| 一级a爱视频在线免费观看| 国产在线观看jvid| 黄色视频,在线免费观看| 操出白浆在线播放| 国产人伦9x9x在线观看| 欧美性长视频在线观看| 欧美成人午夜精品| 国产一区有黄有色的免费视频| 国产精品.久久久| 久久精品91无色码中文字幕| 久久精品国产99精品国产亚洲性色 | 国产高清国产精品国产三级| 91精品国产国语对白视频| 91在线观看av| 亚洲午夜精品一区,二区,三区| ponron亚洲| 黄色女人牲交| 欧美日韩乱码在线| 中国美女看黄片| 国产97色在线日韩免费| 日日夜夜操网爽| 国产亚洲av高清不卡| 国产xxxxx性猛交| 精品国产一区二区三区久久久樱花| 国产欧美日韩一区二区精品| 在线播放国产精品三级| 国产亚洲一区二区精品| 国产主播在线观看一区二区| 中文字幕人妻丝袜制服| 久久精品亚洲av国产电影网| av网站在线播放免费| 在线观看舔阴道视频| 国产欧美日韩一区二区三区在线| 精品视频人人做人人爽| 亚洲人成77777在线视频| 在线观看午夜福利视频| 18禁裸乳无遮挡动漫免费视频| 亚洲欧美日韩高清在线视频| 老熟妇乱子伦视频在线观看| 99久久人妻综合| 亚洲精品美女久久久久99蜜臀| av网站免费在线观看视频| 国产区一区二久久| 窝窝影院91人妻| 老司机在亚洲福利影院| 黄网站色视频无遮挡免费观看| 一级a爱片免费观看的视频| 精品国产一区二区三区久久久樱花| tocl精华| 午夜久久久在线观看| 午夜日韩欧美国产| 麻豆乱淫一区二区| 免费少妇av软件| 国产av精品麻豆| 精品一区二区三区四区五区乱码| 亚洲国产中文字幕在线视频| 757午夜福利合集在线观看| 亚洲少妇的诱惑av| 国产av精品麻豆| 国产精品秋霞免费鲁丝片| 人人澡人人妻人| 中文字幕精品免费在线观看视频| 久久精品亚洲精品国产色婷小说| 成人特级黄色片久久久久久久| 无遮挡黄片免费观看| 国产精品.久久久| 免费在线观看黄色视频的| 男男h啪啪无遮挡| ponron亚洲| 午夜免费观看网址| 叶爱在线成人免费视频播放| 99久久国产精品久久久| 日日爽夜夜爽网站| 亚洲专区中文字幕在线| 国产欧美日韩精品亚洲av| 香蕉国产在线看| 精品久久久久久久久久免费视频 | 99热网站在线观看| 看黄色毛片网站| 大型黄色视频在线免费观看| 91精品三级在线观看| 久久精品成人免费网站| www.精华液| 一级a爱视频在线免费观看| 人妻 亚洲 视频| 国产成人精品无人区| 久久性视频一级片| 国产熟女午夜一区二区三区| 欧美精品av麻豆av| 国产乱人伦免费视频| 男女午夜视频在线观看| 亚洲精品美女久久久久99蜜臀| 精品福利永久在线观看| 法律面前人人平等表现在哪些方面| 曰老女人黄片| 在线永久观看黄色视频| 久久精品91无色码中文字幕| 亚洲欧洲精品一区二区精品久久久| 又紧又爽又黄一区二区| 国产91精品成人一区二区三区| 亚洲一区二区三区欧美精品| 9色porny在线观看| 超碰97精品在线观看| www.999成人在线观看| 亚洲人成电影免费在线| xxxhd国产人妻xxx| 在线观看www视频免费| 欧美老熟妇乱子伦牲交| 如日韩欧美国产精品一区二区三区| 日本wwww免费看| 热re99久久国产66热| av线在线观看网站| 日韩视频一区二区在线观看| 很黄的视频免费| 美国免费a级毛片| 亚洲欧美色中文字幕在线| 一夜夜www| 一级片'在线观看视频| 亚洲色图av天堂| 国产av一区二区精品久久| 国产精品 国内视频| 国产成人av激情在线播放| 国产一区二区三区视频了| 视频区欧美日本亚洲| 女人被狂操c到高潮| 国产精品国产高清国产av | 啪啪无遮挡十八禁网站| www.熟女人妻精品国产| 成人永久免费在线观看视频| 80岁老熟妇乱子伦牲交| 国产av又大| 咕卡用的链子| 国产精品香港三级国产av潘金莲| 最近最新免费中文字幕在线| 久久人妻av系列| 涩涩av久久男人的天堂| 这个男人来自地球电影免费观看| 久久 成人 亚洲| 国产又爽黄色视频| 久久亚洲真实| 久久人人爽av亚洲精品天堂| 国产精品1区2区在线观看. | 国产av精品麻豆| 国产精品免费大片| 黄色 视频免费看| 久久国产精品大桥未久av| 成人18禁在线播放| 纯流量卡能插随身wifi吗| 中文字幕另类日韩欧美亚洲嫩草| 最新在线观看一区二区三区| 午夜福利影视在线免费观看| 在线视频色国产色| 国产成人影院久久av| 日日摸夜夜添夜夜添小说| 中文亚洲av片在线观看爽 | 免费久久久久久久精品成人欧美视频| 一区二区三区激情视频| 91av网站免费观看| 我的亚洲天堂| 无遮挡黄片免费观看| 高清毛片免费观看视频网站 | 亚洲人成电影免费在线| 777久久人妻少妇嫩草av网站| 亚洲精品美女久久久久99蜜臀| 欧美黄色淫秽网站| 变态另类成人亚洲欧美熟女 | 国产成人免费无遮挡视频| 丁香欧美五月| 后天国语完整版免费观看| 欧美人与性动交α欧美软件| 两个人免费观看高清视频| 国产精品 国内视频| 精品国产乱子伦一区二区三区| videos熟女内射| 中文字幕另类日韩欧美亚洲嫩草| 免费不卡黄色视频| 妹子高潮喷水视频| 精品国产一区二区三区四区第35| 欧美日韩乱码在线| 国产高清videossex| 久久人人97超碰香蕉20202| 大型av网站在线播放| 人人妻人人添人人爽欧美一区卜| av中文乱码字幕在线| 一级,二级,三级黄色视频| 在线观看免费高清a一片| 国产淫语在线视频| 久9热在线精品视频| 亚洲一区中文字幕在线| 亚洲熟妇中文字幕五十中出 | 操出白浆在线播放| 精品少妇一区二区三区视频日本电影| 80岁老熟妇乱子伦牲交| 亚洲熟女精品中文字幕| 成年人午夜在线观看视频| 精品久久久久久久毛片微露脸| 亚洲国产中文字幕在线视频| 飞空精品影院首页| 人成视频在线观看免费观看| 真人做人爱边吃奶动态| 国产真人三级小视频在线观看| 亚洲人成电影免费在线| 黑人巨大精品欧美一区二区mp4| 久久中文字幕一级| 夜夜躁狠狠躁天天躁| 欧美黑人精品巨大| 三级毛片av免费| 丰满饥渴人妻一区二区三| 51午夜福利影视在线观看| 日日夜夜操网爽| 在线永久观看黄色视频| 欧美黄色淫秽网站| 久久久久久人人人人人| 99国产精品一区二区蜜桃av | 国产xxxxx性猛交| 如日韩欧美国产精品一区二区三区| 天天躁日日躁夜夜躁夜夜| 99国产精品免费福利视频| 美女扒开内裤让男人捅视频| 亚洲少妇的诱惑av| 久久久国产成人免费| 亚洲欧美日韩另类电影网站| 欧美精品人与动牲交sv欧美| 黑人操中国人逼视频| 亚洲熟妇熟女久久| 伦理电影免费视频| 色在线成人网| 99热国产这里只有精品6| 欧美在线黄色| 别揉我奶头~嗯~啊~动态视频| 亚洲成人免费电影在线观看| 国产成人精品久久二区二区91| 久久国产亚洲av麻豆专区| 亚洲第一青青草原| 国产精品久久电影中文字幕 | 男女床上黄色一级片免费看| 十分钟在线观看高清视频www| 丝袜在线中文字幕| 中亚洲国语对白在线视频| 欧美乱色亚洲激情| 精品久久久久久久毛片微露脸| 久久国产精品人妻蜜桃| 波多野结衣av一区二区av| 后天国语完整版免费观看| 老司机在亚洲福利影院| 久久人妻熟女aⅴ| 亚洲av成人一区二区三| 亚洲熟妇熟女久久| 91老司机精品| 精品国产美女av久久久久小说| 久久精品国产99精品国产亚洲性色 | 侵犯人妻中文字幕一二三四区| 中文字幕另类日韩欧美亚洲嫩草| 久久 成人 亚洲| 99国产精品免费福利视频| 国产人伦9x9x在线观看| 欧美精品高潮呻吟av久久| bbb黄色大片| 亚洲精品中文字幕在线视频| 最近最新免费中文字幕在线| 超碰成人久久| 人人妻人人澡人人爽人人夜夜| 50天的宝宝边吃奶边哭怎么回事| 日韩欧美一区二区三区在线观看 | 久久精品国产综合久久久| 99在线人妻在线中文字幕 | 一a级毛片在线观看| 欧美丝袜亚洲另类 | 欧美中文综合在线视频| 国产亚洲精品第一综合不卡| 色婷婷av一区二区三区视频| 亚洲少妇的诱惑av| 老司机午夜十八禁免费视频| www.自偷自拍.com| 国产色视频综合| 在线观看66精品国产| 亚洲欧美一区二区三区黑人| 精品国产国语对白av| 国产一区二区三区综合在线观看| 正在播放国产对白刺激| av在线播放免费不卡| 国产精品亚洲av一区麻豆| 欧美+亚洲+日韩+国产| 男人操女人黄网站| 亚洲成人免费电影在线观看| 老鸭窝网址在线观看| 在线十欧美十亚洲十日本专区| 亚洲性夜色夜夜综合| 免费一级毛片在线播放高清视频 | 伦理电影免费视频| 日韩精品免费视频一区二区三区| 国产精品亚洲av一区麻豆| 人人妻,人人澡人人爽秒播| 日本一区二区免费在线视频| 老汉色∧v一级毛片| 91国产中文字幕| 午夜两性在线视频| 国产精品 国内视频| 又黄又爽又免费观看的视频| 91av网站免费观看| 天天躁日日躁夜夜躁夜夜| 欧美日韩中文字幕国产精品一区二区三区 | 欧美国产精品一级二级三级| 啦啦啦免费观看视频1| 少妇的丰满在线观看| 亚洲美女黄片视频| 国产单亲对白刺激| 在线视频色国产色| 色婷婷av一区二区三区视频| 日韩欧美国产一区二区入口| 性少妇av在线| 免费看a级黄色片| 夜夜夜夜夜久久久久| 午夜影院日韩av| 久久精品国产99精品国产亚洲性色 | 少妇粗大呻吟视频| 成人手机av| 久久久久久免费高清国产稀缺| 国产av又大| ponron亚洲| x7x7x7水蜜桃| videos熟女内射| 91麻豆av在线| 两个人免费观看高清视频| 久久午夜综合久久蜜桃| 在线免费观看的www视频| 91老司机精品| 日本黄色日本黄色录像| 国产精品电影一区二区三区 | 黄色a级毛片大全视频| 亚洲精品国产精品久久久不卡| 在线观看免费高清a一片| 天天添夜夜摸| 757午夜福利合集在线观看| 亚洲黑人精品在线| 麻豆乱淫一区二区| 成人手机av| 欧美日韩亚洲高清精品| 99香蕉大伊视频| 亚洲 国产 在线| 精品无人区乱码1区二区| 国产日韩欧美亚洲二区| 91麻豆av在线| 国产不卡av网站在线观看| 黑人欧美特级aaaaaa片| 欧美日本中文国产一区发布| 看片在线看免费视频| 精品国产乱码久久久久久男人| 在线十欧美十亚洲十日本专区| 久久亚洲真实| 中文亚洲av片在线观看爽 |