• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)環(huán)境下信息檢索與文獻計量的共生發(fā)展綜述*

      2016-09-01 13:19:24楊思洛程愛娟湘潭大學公共管理學院湖南湘潭411105
      圖書館 2016年8期
      關鍵詞:計量學信息檢索檢索

      楊思洛 程愛娟 馮 雅(湘潭大學公共管理學院  湖南湘潭 411105)

      ·綜述·

      大數(shù)據(jù)環(huán)境下信息檢索與文獻計量的共生發(fā)展綜述*

      楊思洛程愛娟馮雅
      (湘潭大學公共管理學院 湖南湘潭411105)

      文章通過梳理信息檢索和文獻計量相關理論與應用研究成果,對兩者的發(fā)展歷程、相互關系和共生趨勢進行歸納和總結。指出文獻計量輔助信息檢索,信息檢索服務文獻計量,兩者有內容的并行發(fā)展、工具的整合發(fā)展以及實踐的融合發(fā)展三方面的共生發(fā)展趨勢。

      大數(shù)據(jù)信息檢索文獻計量共生發(fā)展

      〔引用本文格式〕楊思洛,程愛娟,馮雅.大數(shù)據(jù)環(huán)境下信息檢索與文獻計量的共生發(fā)展綜述[J].圖書館,2016(8):68-73, 90

      1 引言

      共生又叫互利共生,原指兩種不同生物之間所形成的緊密互利關系[1]。信息檢索和文獻計量作為情報學的兩大分支,由于信息檢索偏向于根據(jù)用戶的需要找出有關信息的過程和技術;文獻計量偏向于文獻的評估和定量分析,目標的差異使人們忽略了兩者之間的聯(lián)系。從表面上看,兩者之間除了同屬于情報學之外聯(lián)系甚少,但透過表面探究實質時,會發(fā)現(xiàn)其實兩者是互利的,有著非生物意義上的共生關系[2]。

      早在1987年,在比利時林堡大學舉行的第一屆ISSI會議,就以“International Conference on Bibliometrics and Theoretical Aspects of Information Retrieval”為主題,試圖將信息檢索與文獻計量相結合[3]。但是這一提議逐漸被人們淡忘,將兩者結合起來的研究也為之甚少。隨著計算機、網(wǎng)絡技術的發(fā)展,各種信息檢索、文獻計量工具的完善,以及在大數(shù)據(jù)環(huán)境下,高效率獲取信息的迫切需要,人們認識到將信息檢索與文獻計量相結合能達到更好效果。因此,將兩者結合的主題被重新討論。于2013年7月在奧地利維也納召開的第14屆ISSI會議上,開展了兩者結合的研討會,旨在討論怎樣運用計量學方法來完善檢索,提高人們對計量與檢索聯(lián)系的認識,并為檢索創(chuàng)造更加科學的模型打下基礎[4]。隨后,2014年3月在荷蘭阿姆斯特丹開展了主題為“Bibliometric-enhanced Information Retrieval”的第36 次ECIR(European Conference on Information Retrieval)會議,提出:隨著數(shù)字化的發(fā)展,傳統(tǒng)檢索已不能很好的滿足用戶的需求,因為在網(wǎng)絡環(huán)境下,檢索結果龐大并且復雜,因此,應該把兩者相結合,在計量的基礎上優(yōu)化檢索[5]。

      隨著大數(shù)據(jù)時代的到來,美國政策的戰(zhàn)略層面提出:要大力推動與大數(shù)據(jù)相關的信息收集、組織,改善與大數(shù)據(jù)相關的分析工具及技術,提高提取、分析信息的能力[6]。我國“十三五規(guī)劃”中也將大數(shù)據(jù)上升到國家戰(zhàn)略層面[7]。為了在價值密度較低的海量數(shù)據(jù)中挖掘出有意義的信息,需要信息檢索,也需要文獻計量與評價,更需要兩者的互利共生發(fā)展。一方面,在互利關系下兩者的相互影響和應用程度需要提高;另一方面,在互利關系下兩者各自的發(fā)展需要有所突破。

      2 信息檢索與文獻計量的關系

      信息檢索與文獻計量存在著密切聯(lián)系。首先,兩者在發(fā)展歷程上契合度較高。信息檢索起源于19世紀下半葉的圖書館參考咨詢和文摘索引工作,并在20世紀50年代,隨著計算機技術的發(fā)展,逐漸成為獨立領域[8]。文獻計量學的產生可回溯到20世紀初,并在20世紀60年代成為專門領域。其次,兩者研究對象都是文獻信息,在起源上同源,同屬于情報學。在1981年White和Griffith通過作者共被引分析可視化學科結構,把情報學分為了信息檢索與文獻計量兩大組成部分[9]。而在后續(xù)對情報學更新時期的研究中,情報學領域分為計量與信息檢索兩大塊得到了進一步論證[10]。第三,研究兩者的相關人員存在交叉現(xiàn)象。在1998年White 和 McCain對24年間情報學領域學者的可視化動態(tài)分析中得出:總體上,在20世紀70年代研究信息檢索的學者高于研究計量的學者,然而研究信息檢索的學者在向計量領域偏移,到20世紀90年代,兩者的研究人數(shù)達到均衡狀態(tài)[10]。最近的研究表明,文獻計量研究隊伍有進一步擴大趨勢[11]。

      然而,信息檢索與文獻計量也存在顯著差異:在受眾方面,信息檢索面向的使用互聯(lián)網(wǎng)、圖書情報檔案信息系統(tǒng)等的廣大用戶,而文獻計量針對學術人員、專門機構或政府部門的管理者或決策者;在目標上,信息檢索是特定用戶通過一定的策略盡可能高效地在廣大的知識空間中找出與要求相匹配的信息,而文獻計量重在敏銳并精確地評價或描繪出某一知識單元或領域的狀態(tài);在規(guī)模上,信息檢索不僅用于學術交流和文獻書目數(shù)據(jù)庫,還與智能化、商業(yè)信息、圖書館目錄、搜索引擎等相關,而文獻計量多與期刊論文管理與評價以及網(wǎng)絡中的學術交流相關;在教育途徑上,信息檢索在計算機科學、I-Schools或者信息學院等都有涉及,甚至作為全校性的信息素養(yǎng)課程出現(xiàn),而文獻計量則集中在圖書情報、科技政策與管理等專業(yè)課程,在大學課程中較少涉及[12]。

      3 文獻計量輔助信息檢索

      檢索的過程實際上是文獻信息相關性匹配的過程,單獨的信息檢索存在著局限,而文獻計量能對信息檢索提供較好的輔助。一方面,文獻計量中某些定律的運用能在很大程度上彌補信息檢索的局限。另一方面,在大數(shù)據(jù)環(huán)境下,用戶面對巨大的信息量,會出現(xiàn)一種茫然的狀態(tài),而文獻計量能夠在一定程度上對用戶在檢索、選擇信息時予以指示。

      3.1檢索原理及局限

      結合已有研究[13, 14],得到信息檢索原理及過程圖,如圖1所示。信息檢索包括信息存儲與用戶檢索兩大過程。在存儲過程中,首先要分析文獻信息,找出文獻信息特征,著錄標引,再形成文獻信息標識即檢索點,最后將這些標識和檢索點輸入檢索系統(tǒng)。而在檢索過程中,用戶首先分析需求,形成檢索主題,然后構建檢索式(檢索詞),計算機將用戶輸入的檢索詞和系統(tǒng)內容進行匹配,得出檢索結果。在這一過程中,存在許多缺陷。首先,在構建檢索式方面,用戶如果不能很準確地描述要檢索的問題,在分析問題、形成提問、選用檢索詞等環(huán)節(jié)都會受到表達能力不足的影響,如從用戶需求到提問是一個內容相關過程,用戶受表達能力不足的影響,不能很好地使提問覆蓋整個需求;從用戶提問到形成檢索概念是一個主題相關過程,用戶受表達能力限制,不能很好地使形成的檢索概念概括提問;從檢索概念到確定檢索詞是一個概念相關過程,用戶受表達能力的影響,可能使檢索詞不能很好地詮釋概念。其次,在檢索邏輯方面,信息檢索存在著二值(是與否)相關性判斷的局限,如在輸入檢索詞到檢索出文獻這一過程中,計算機就對用戶輸入的檢索詞與系統(tǒng)中存在的相關文獻信息標識進行了二值相關性判斷,最終輸出判斷結論為“是”的內容,這種機器得出的相關性判斷結果并不具備能動性,可能會輸出大量與用戶需求不符的結果或者輸出的結果與用戶表達的意思不符,因此查全率、查準率得不到保障,不能滿足用戶的需求。

      圖1 信息檢索原理及過程

      3.2文獻計量對信息檢索的輔助

      3.2.1確定檢索點

      在大數(shù)據(jù)環(huán)境下,海量信息的有序化存儲以及合理的歸類是信息得以傳播利用并發(fā)揮價值的重要前提,而這種有序化存儲以及合理的歸類在某種程度上要借助文獻計量的相關知識。在信息檢索過程中,文獻信息標識即檢索點選取是否恰當,不僅關系著一篇文章在海量信息中是否被分配到了合理的位置,并且關系著該文章能否被用戶快速檢出。那么對文獻進行標引時,怎么選取合適的詞呢?齊普夫定律在這里就起到了很好的作用。將一篇文章錄入系統(tǒng)后,根據(jù)該定律:文章中包含的N個詞按照其頻率遞減順序排列,并用自然數(shù)從1到L給詞編號,若f表示某詞頻次,r表示該詞的序號,則f·r=C(C為常數(shù)),就能很好地確定中頻詞。而研究表明,特定學者的用詞與所關注的學科領域有很大關系,而該領域學者所關注的學科范圍中的詞,絕大部分集中在中頻詞的后段和低頻詞的前段,大多為長詞[15]。如果根據(jù)齊普夫定律來取詞,就減少詞表取詞的盲目性,提高取詞效率。并且在大數(shù)據(jù)環(huán)境下,根據(jù)該定律還可以實現(xiàn)對文章的自動標引,簡化了信息存儲的過程。另外該定律對用戶挑選檢索詞有指導意義——避免利用高頻詞和低頻詞,選取中頻詞檢索。

      3.2.2縮小檢索范圍

      大數(shù)據(jù)環(huán)境下海量的信息使人在檢索時無從下手,同時價值量小的單個信息使人在研究問題時力不從心。而將文獻計量的相關規(guī)律運用到信息檢索的過程中,可以在一定程度上緩解這一狀態(tài)。首先,根據(jù)布拉德福定律:將科技期刊按其刊載某學科專業(yè)論文的數(shù)量多少,以遞減順序排列,可以把期刊分區(qū)。各個區(qū)的文章數(shù)量相等,此時核心區(qū)、相關區(qū)、非相關區(qū)期刊數(shù)量成的關系。從而在檢索相關文獻時,優(yōu)先選擇核心期刊進行檢索,縮小檢索范圍,緩解面對海量文獻無從下手的狀態(tài)。其次,清楚文獻的老化規(guī)律。隨著時間的改變,大量的文獻由于種種原因,可能已不適合時代的需要。為了找到更新穎、更合適的信息,將文獻老化規(guī)律用來限定檢索年限,從而排除一些過時的或對目前研究價值不大的內容。最后,為了找到價值量較高的信息,還可以在檢索中對引用量進行限定,從而提高檢索文獻的質量;或者將加菲爾德創(chuàng)建的與以往傳統(tǒng)主題法不同的文獻檢索法——引文索引法運用到檢索的過程中,充分利用其研發(fā)的引文數(shù)據(jù)庫,如SCI 、SSCI和A&HCI[16]。這種引文數(shù)據(jù)庫中錄入的數(shù)據(jù)能揭示學科發(fā)展過程,是追溯學科知識進化的可靠依據(jù);并且這種引文索引體系便捷地組建了特定主題的參考文獻網(wǎng)絡,便于用戶對所研究或感興趣領域文獻的獲?。涣硗?,這種引文索引體系還能從文獻引證的角度評估文章的學術價值,綜合提高文獻檢索的效率與針對性。

      3.2.3構建檢索模型

      在大數(shù)據(jù)環(huán)境下,面對海量信息,均衡檢索的查全率與查準率是一個重要課題,因此對新檢索模型的構建顯得十分必要。檢索實際上是一個相關性匹配的過程,而文獻是否相關的界限是模糊的。在完全相關文獻與完全不相關文獻之間還存在著大量的文獻,這一部分文獻是否被采用往往取決于特定檢索要求的需要或者用戶的行為。為了更好地完成檢索任務,必須根據(jù)需求調整檢索策略,構建合理的檢索模型。而在檢索模型中添加“計量”成分,往往能達到較好的檢索效果。國外已有Gl?nzel[17]和Zitt[18]等進行研究,并得出檢索模型:

      其中,k≥0,m,n >0或m =n=0。這個模型包括兩個部分,第一部分是為了確保查準率,利用核心期刊或核心作者等檢索到相關性高但查全率不高的文獻,即公式中的。第二部分是為了提高查全率,在非核心期刊、非核心作者或與檢索目標相關的領域等情況下查找文獻,即公式中的,并且這一部分文獻在某些方面要與第一部分有聯(lián)系,即公式中的。此模型在某種程度上超越了傳統(tǒng)檢索,不僅能夠包括所有類型的檢索字段,如標題、關鍵詞、期刊名稱、作者地址等,還能融入計量方法,如直接引用、共同引用、文獻耦合、閾值選定等等[18]。例如具體檢索式可設定如下[19]:UC1: Journal in WoS = BIOINFORMATICS…; UC2: Journal in MEDLINE = IN SILICO BIOLOGY…; UC3: Keywords in title = BIOINFORMATICS…; CC1: Records cited by UC1; CC2: Records citing UC1; CC3: thresholds Ti

      得到的檢索公式為:

      可通過調節(jié)CC3的閾值,最終得到較為理想的結果。

      4 信息檢索服務文獻計量

      4.1文獻計量的發(fā)展

      文獻計量學是以布拉德福、洛特卡、齊普夫為基本定律,定量統(tǒng)計各種文獻信息的學科[20]。隨著時代的發(fā)展,文獻計量已經不僅僅停留在以篇、冊、本為單位的文獻單元的計量上,而開始深入到文獻的內部對知識單元和文獻的相關信息進行計量研究,如題名、主題詞、關鍵詞、詞頻、知識項、引文信息、著者、出版者、日期、語言、格式等[21]。為了滿足文獻計量不斷發(fā)展的要求,必須利用文獻檢索手段,更好地完成文獻計量任務。另外,近年來文獻計量不僅在自身領域內取得了較大進展,如在科學評價、學科結構分析與可視化、科學交流等方面發(fā)揮重要作用,并隨著信息檢索技術、水平的提高,共同推動了計量相關學科的研究與實踐進展,如表1所示。文獻計量學是信息計量學發(fā)展的基礎,也是科學計量學發(fā)展的基礎,而信息計量學與科學計量學,則是文獻計量學發(fā)展的方向[22]。隨著知識經濟的不斷發(fā)展,在建設知識社會實際需求的拉動下,在相關計量學進一步發(fā)展的內在需求下,根植于文獻、信息和科學計量學的知識計量學得到了發(fā)展。另外,伴隨著大數(shù)據(jù)時代的到來,引文分析無法衡量大量新型文獻產生的影響,例如 Twitter、Facebook 和博客等社交網(wǎng)絡中的文獻,并且出現(xiàn)了學術成果新形式,如數(shù)據(jù)集、軟件工具、算法或分子結構等,不容易甚至無法通過傳統(tǒng)計量指標來分析[23]。替代計量學應運而生,在某種程度上它是文獻計量的一種補充。而這些計量學的發(fā)展都離不開信息檢索。

      表1 相關計量學的產生

      4.2信息檢索對文獻計量的服務

      信息檢索對文獻計量學等相關計量學科的發(fā)展起著不可替代的作用,因為在計量過程中,完整、高效地獲取有組織的計量數(shù)據(jù),在很大程度上依賴于信息檢索。信息檢索包括信息存儲和檢索兩大過程,信息的存儲為計量工作提供了可靠的數(shù)據(jù)源,而各種檢索技術、工具、系統(tǒng)的完善,為計量工作提供了便捷的平臺。

      4.2.1保障數(shù)據(jù)樣本源

      信息檢索是進行文獻計量研究的基礎[24]。文獻計量的前提是有大量數(shù)據(jù)或資料,因此數(shù)據(jù)或資料的可獲取性顯得十分重要;這種可獲取性不僅僅指“得到”,還要求數(shù)據(jù)或資料通過某種標準控制之后,呈現(xiàn)出具有代表性的內容。進入大數(shù)據(jù)時代,每天都有成千上萬的新文獻進入信息空間,大量且單個價值密度較低的資料如果不能按一定的標準組織、分類、存儲,通過文獻計量揭示其聯(lián)系以及規(guī)律就會導致獲取十分困難。如果在檢索的信息存儲過程中,對存入的內容進行了一系列標準化處理,如對存入的內容進行標引、著錄等,并且對信息進行保存管理,就可建立完善的查詢機制并為計量提供可靠的數(shù)據(jù)源。

      4.2.2實現(xiàn)計量自動化

      在大數(shù)據(jù)環(huán)境下,面對大量、多樣、價值密度較低的文獻或資料,如果單純依靠人工對其進行計量,效率低,質量上也得不到保證,因此必須借助各種信息檢索平臺。而按一定標準存儲信息的檢索系統(tǒng)或數(shù)據(jù)庫中,首先,都有簡單的計量功能,能夠按照某一字段,如主題、作者、機構、來源期刊等對相關文獻進行統(tǒng)計(數(shù)量、年度分布等);其次,某些數(shù)據(jù)庫還提供對這些符合要求的資料進行進一步分析的功能,如通過引文,形成簡單的該領域作者之間的引文關系圖,或針對單篇文章形成引文網(wǎng)絡(如知網(wǎng)中提供的“本文鏈接的文獻網(wǎng)絡圖示”)等。另外,在某些搜索引擎中也提供了文獻計量的功能,如Google Scholar中,就對引文有較完善的計量統(tǒng)計,不僅可以查看引文年代分布圖、最新的引用數(shù)據(jù)(論文總被引量、h-index、i-10 index),還可以通過查看其他學者或學術合作伙伴研究成果的被引情況了解其研究進展,并且這些數(shù)據(jù)會自動更新。檢索系統(tǒng)、數(shù)據(jù)庫以及搜索引擎提供的這些功能,使計量向自動化方向發(fā)展,滿足了普通用戶對文獻計量的要求。

      4.2.3促進計量學科發(fā)展

      大數(shù)據(jù)環(huán)境下,用戶急需提高檢索效率,在此需求下檢索技術、手段、工具等都有了質的飛躍,進而在很大程度上促進了文獻計量的發(fā)展。首先,檢索系統(tǒng)的更新與完善使檢索結果能以不同的形式呈現(xiàn)在用戶面前,如知網(wǎng)可將文獻信息以endnote等格式導出,再直接導入文獻計量分析工具中,如SATI等,從而進行關鍵詞抽取,為下一步的聚類、可視化打下基礎,促使文獻計量向可視化方向發(fā)展。而可視化圖譜等方法揭示了研究領域發(fā)展的歷程、現(xiàn)狀、前沿以及發(fā)展趨勢,擴大文獻計量學的應用范圍,對學科發(fā)展起著促進作用。其次,在大數(shù)據(jù)環(huán)境下,計算機成為信息傳遞的重要媒介,這種利用互聯(lián)網(wǎng)進行檢索獲取信息的趨勢,促使文獻計量在網(wǎng)絡環(huán)境下開辟新領域,出現(xiàn)網(wǎng)絡化趨勢[25]。早在20世紀90年代末,谷歌和其他一些先驅者從Pinski 和Narin對網(wǎng)絡期刊“影響權重(Influence Weights)”這一研究工作中受到啟迪,看到了關鍵性文章鏈接獲取的重要性,推出超鏈接[26],借鑒引文分析的理論與方法,結合鏈接自身的特點,對網(wǎng)絡上的文獻進行分析,形成網(wǎng)頁鏈接圖譜等等,促使文獻計量學向網(wǎng)絡信息計量學方向發(fā)展。另外,隨著社交網(wǎng)絡時代的到來,文獻計量學有向Altmetrics發(fā)展的趨勢,各類檢索系統(tǒng)中存在的統(tǒng)計數(shù)據(jù)如瀏覽量、下載量、鏈接數(shù)、推薦數(shù)、評級等都成為了統(tǒng)計指標,因此,各類檢索系統(tǒng)中這些數(shù)據(jù)的完善與保障在一定程度上也推動了計量學學科的發(fā)展。

      5 信息檢索與文獻計量的共生發(fā)展趨勢

      在大數(shù)據(jù)環(huán)境下,信息檢索和文獻計量都面臨著挑戰(zhàn),為了更好地滿足用戶的要求,必須將兩者結合起來,在互利共生的條件下實現(xiàn)并行發(fā)展、整合發(fā)展、融合發(fā)展。

      5.1內容的并行發(fā)展

      在大數(shù)據(jù)時代,作為兩個獨立的領域,信息檢索和文獻計量必須在互利的基礎上,實現(xiàn)各自的突破。一方面,從文獻計量的角度來說,文獻計量符合新時代的要求,發(fā)展基于語義的文獻計量方法及應用;并與面向基于學術信息交流和利用全過程的計量(包括瀏覽、下載、收錄、鏈接、評論、引用等)——替代計量結合起來,彌補文獻計量用于科研評價時滯長等缺陷[27],從而實現(xiàn)短期、中期、長期全時段的計量。另一方面,從信息檢索的角度來說,檢索技術將加速其智能化的發(fā)展。在利用相關文獻計量成果、定律的基礎上,實現(xiàn)以下突破:①提高信息自然語言的處理能力,使檢索系統(tǒng)對自然語言的理解提升到語義甚至語用階段。②對非結構化的信息實現(xiàn)自動標引,信息檢索技術與智能化技術達到較高耦合水平。③實現(xiàn)相關領域引用內容的檢索,從而為用戶提供與引文最相關、最直接的信息,提高檢索效率。④根據(jù)不同身份的用戶,能夠在不同程度上對提問進行定位,提供滿足不同層次需求的檢索結果。⑤提供多種系統(tǒng)操作環(huán)境,在不同的環(huán)境下為用戶提供個性化的檢索。如在個人賬戶登錄狀態(tài)下,系統(tǒng)可分析該用戶的檢索記錄,得出用戶的偏好,從而提供個性化服務;在集團登錄狀態(tài)下,可為用戶提供該集團信息的使用偏好,從而對用戶選取信息提供參考。

      然而兩者的各自發(fā)展并不是獨立的,它們之間有著緊密聯(lián)系。文獻計量的新發(fā)展——替代計量中各種指標值是檢索系統(tǒng)為用戶提供個性化檢索、推薦的有力參考證明,通過分析各用戶替代計量指標值,檢索系統(tǒng)可以向用戶進行精確推薦,提供相關性高的資料,定位用戶。另外,實現(xiàn)相關領域的引用內容檢索要求信息檢索與文獻計量密切結合。而檢索系統(tǒng)的完善、技術的突破會提高各替代計量指標值的可靠性,替代計量的發(fā)展在一定程度上也依賴于信息檢索的進展。

      5.2工具的整合發(fā)展

      面對日益復雜、冗余的信息,為了更快速、高效、便捷地獲取有用信息,信息檢索和文獻計量在工具上將會出現(xiàn)整合,信息檢索和文獻計量兩用型的多功能工具增多。目前已經有部分數(shù)據(jù)庫在一定程度上探索了檢索和計量功能。如《中國引文數(shù)據(jù)庫》可以對相關文獻、作者、機構、期刊、基金等進行查找,滿足檢索要求;另外它收錄了中國學術期刊(光盤版)電子雜志社出版的所有源數(shù)據(jù)產品的參考文獻,通過其“作者引證報告”、“數(shù)據(jù)分析器”等版塊,揭示各種類型文獻之間的相互引證關系,研究熱點和趨勢,機構學術產出和學術影響力等等,提供新的計量分析功能。這種信息檢索與文獻計量整合型工具在很大程度上促進了大數(shù)據(jù)環(huán)境下文獻信息的高效利用,因此,整合發(fā)展將是未來的發(fā)展趨勢;并且工具的應用將突破語言的限制,實現(xiàn)多語言的統(tǒng)一檢索和計量,這些也要求多學科領域的共同努力,乃至全球協(xié)作。

      5.3實踐的融合發(fā)展

      圖2 信息檢索與文獻計量的實踐融合流程

      在大數(shù)據(jù)環(huán)境下,信息檢索與文獻計量以用戶需求為中心,在實踐上融合從而謀求共生發(fā)展,具體有兩種方式:融合文獻計量的信息檢索實踐、融合信息檢索的文獻計量實踐,如圖2信息檢索與文獻計量的實踐融合流程所示[26]。從融合文獻計量的信息檢索實踐角度來說:當用戶有信息需求,并根據(jù)需求列出系列檢索提問后,進入信息檢索循環(huán),根據(jù)了解到的內容補充或調整信息檢索循環(huán)中的原始提問或檢索提問,再利用文獻計量的某些理論、方法,對檢索結果進行篩選、可視化,即圖2中的②、③,在這一過程中,對問題的認識程度可能會上升到另一個層面,在新的認識高度下對問題的理解將更加透徹,從而進一步補充或調整原始提問,即圖2中的①。這樣就可以將計量成分融入檢索中,讓基于計量的“后驗”結果降低信息檢索“先驗”結果下,用戶自身對問題表達能力不足或明顯信息選擇偏向形成的干擾,從而完善檢索循環(huán)過程,并將檢索結果反饋給用戶。另外,當用戶有了檢索需求,也可以先利用某些數(shù)據(jù)庫中的圖表查詢等功能,查看相關領域已有的計量分析的可視化結果,從而了解該領域的動態(tài),認識各個研究方向之間的關系[28];或充分利用文獻聚類等功能,宏觀上瀏覽文獻,找到感興趣的內容或補充檢索提問[29],然后再進行檢索循環(huán)。從融合信息檢索的文獻計量實踐的角度來說:文獻計量數(shù)據(jù)樣本的獲取、結果的精煉等都離不開信息檢索,在文獻計量工作展開之前要進行信息檢索循環(huán),并且,在檢索不斷深入的過程中,用戶對需要計量的領域可能有更深、更新的理解,從而為文獻計量中提煉領域、擴展目標等服務,即圖2中的④,通過檢索到再計量,更新該領域已有的計量結果,再將結果反饋給用戶,使用戶明確新動態(tài)、新趨勢。在這一系列實踐過程中,囊括了信息檢索循環(huán)與文獻計量循環(huán),形成了檢索——計量混合應用,將計量結果融入檢索中,使實踐中對目標的描述有了除主觀因素以外的客觀技術支撐,讓檢索建立在大量相關專業(yè)人士研究結論的基礎之上,在實踐中充分發(fā)揮文獻計量的映射作用,并且通過信息檢索調整計量的范圍、目標等,使計量與檢索在融合中交替進行,從而更好地滿足用戶期望,促進信息檢索與文獻計量的融合發(fā)展。

      (來稿時間:2016年3月)

      1. 共生[EB/OL]. [2015-12-20]. http://baike.haosou.com/doc/ 1265769-1338499.html

      2. Wolfram D. The symbiotic relationship between information retrieval and informetrics[J]. Scientometrics, 2015, 102(3):2201-2214

      3. ISSI[EB/OL]. [2015-10-21].http://www.issi-society.org/ past.html

      4. ISSI 2013[EB/OL]. [2015-10-21]. http://www.issi2013.org/ work.html

      5. BIR 2014 : Bibliometric-enhanced Information Retrieval [EB/OL]. [2015-10-21].http://www.wikicfp.com/cfp/servlet/event. showcfp?eventid=34006

      6. 賽迪智庫軟件與信息服務研究所. 美國將發(fā)展大數(shù)據(jù)提升到戰(zhàn)略層面[N]. 中國電子報,2012-07-17(3)

      7. 中共中央十三五規(guī)劃建議(全文) [EB/OL]. [2015-12-20]. http://news.ifeng.com/a/20151103/46094489_0.shtml

      8. 賴茂生,趙丹群,韓圣龍,等.計算機情報檢索[M].北京:北京大學出版社,2006:4-17

      9. White H D, Griffith B C. Author co-citation: A literature measure of intellectual structure[J]. Journal of the American Society for Information Science,1981, 32(3):163-171

      10. Howard D W, Katherine W M. Visualizing a Discipline: An Author Co-Citation Analysis of Information Science, 1972-1995[J]. Journal of the American Society for Information Science,1998, 49(4):327-355

      11. Zhao D, Strotmann A. The knowledge base and research front of information science 2006-2010: An author cocitation and bibliographic coupling analysis[J]. Journal of the Association for Information Science and Technology, 2014, 65(5):995-1006

      12. Mayr P, Scharnhorst A. Combining bibliometrics and information retrieval: preface[J]. Scientometrics, 2015, 102(3): 2191-2192

      13. 潘萍. 基于網(wǎng)絡環(huán)境的信息檢索策略[J]. 現(xiàn)代電子技術,2007(4):161-164

      14. 袁林.信息檢索[EB/OL]. [2015-11-14].http://wenku.baidu. com/view/0f02354dcf84b9d528ea7a24.html

      15. 楊波,閻素蘭. 齊普夫定律的漢語適用性研究及其在自動標引中的應用[J]. 情報理論與實踐,2004(3):252-255

      16. 汪滬雙. 論引文索引在信息檢索中的重要性[J]. 大學圖書情報學刊,2005(5):86-87

      17. Zitt M, Bassecoulard E. Delineating complex scientific fields by hybrid lexical-citation method: An application to nanoscience[J]. Information Processing and Management, 2006, 42 (6):1513-1531

      18. Gl?nzel W. Bibliometrics-aided retrieval: where information retrieval meets scientometrics[J]. Scientometrics, 2015,102(3):2215-2222

      19. Gl?nzel W, Janssens F, Thijs B. A comparative analysis of publication activity and citation impact based on the core literature in bioinformatics[J]. Scientometrics, 2009, 79(1):109-129

      20. 顧立平. 數(shù)據(jù)級別計量——概念辨析與實踐進展[J].中國圖書館學報,2015(2):56-71

      21. 邱均平. 信息計量學(十) 第十講 計算機輔助文獻信息計量分析方法與工具[J]. 情報理論與實踐,2001(4):316-320

      22. 邱均平. 網(wǎng)絡信息計量學導論[J].“國立”成功大學圖書館館刊, 2007(16):15-23

      23. National Information Standard Organization. NISO to develop standards and recommended practices for Altmetrics[EB/ OL]. [2015-12-02]. http://www.niso.org/news/pr/View?item_key

      24. Mayr P, Scharnhorst A. Scientometrics and information retrieval: weak-links revitalized[J]. Scientometrics, 2015, 102(3):2193-2199

      25. 范全青,郭維真,鳳元杰. 我國文獻計量學研究30年之發(fā)展[J]. 情報資料工作,2009(3):30-33, 60

      26.Zitt M. Meso-level retrieval: IR-bibliometrics interplay and hybrid citation-words methods in scientific fields delineation[J]. Scientometrics, 2015, 102(3): 2223-2245

      27. 楊思洛,程愛娟. 社交網(wǎng)絡環(huán)境下的計量學:Altmetrics研究進展綜述[J].情報資料工作,2015(4):33-37

      28. 廖勝姣. 知識圖譜在圖書館中的應用[J]. 嘉興學院學報,2011(5):124-127

      29. 蘇沖. 基于最大頻繁項集的搜索引擎查詢結果聚類方法[D]. 哈爾濱:哈爾濱工業(yè)大學碩士論文,2009

      The Symbiotic Development Review of Information Retrieval and Bibliometrics in Big Data Environment

      Yang SiluoCheng AijuanFeng Ya
      ( Public Management School of Xiangtan University )

      〕In this paper, by analyzing the theoretical and applied research results of information retrieval and bibliometrics, the development history, the relationship and the symbiotic trend of the two are summarized. Conclusion show that bibliometrics can assist information retrieval, information retrieval can serve bibliometrics, and from the content, tool and practice three aspects information retrieval and bibliometrics have symbiotic development trend.

      〕Big dataInformation retrievalBibliometricsSymbiotic development

      ·綜述·

      G350

      * 本文系全國優(yōu)博論文作者專項資助項目“網(wǎng)絡環(huán)境下學者合著與引證行為規(guī)律研究”(項目編號:2014094)階段性成果。

      楊思洛(1979-),男,湘潭大學公共管理學院副教授,研究方向:網(wǎng)絡信息資源管理;程愛娟(1991-),女,湘潭大學公共管理學院碩士生,研究方向:圖書館學;馮雅(1993-),女,湘潭大學公共管理學院碩士生,研究方向:網(wǎng)絡信息資源管理。

      猜你喜歡
      計量學信息檢索檢索
      生物化學計量學原理在離散生物動力系統(tǒng)的應用
      云南化工(2021年5期)2021-12-21 07:41:34
      針刺治療失眠癥的文獻計量學分析
      2019年第4-6期便捷檢索目錄
      醫(yī)學期刊編輯中文獻信息檢索的應用
      新聞傳播(2016年18期)2016-07-19 10:12:06
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      基于神經網(wǎng)絡的個性化信息檢索模型研究
      基于科學計量學的公安院??蒲信c評價
      2004-2013年中醫(yī)藥治療性早熟的文獻計量學分析
      教學型大學《信息檢索》公選課的設計與實施
      河南科技(2014年11期)2014-02-27 14:10:19
      公共圖書館信息檢索服務的實踐探索——以上海浦東圖書館為例
      圖書館界(2013年5期)2013-03-11 18:50:29
      博湖县| 宜兰市| 白山市| 宁国市| 公安县| 千阳县| 安塞县| 文安县| 忻城县| 印江| 梅河口市| 昌宁县| 林口县| 河源市| 贡觉县| 澎湖县| 莆田市| 黄平县| 安平县| 江阴市| 汶上县| 湘潭县| 海阳市| 济源市| 仁化县| 确山县| 赣州市| 嘉鱼县| 泸溪县| 尉氏县| 闽清县| 巴南区| 井冈山市| 登封市| 双城市| 建阳市| 依兰县| 隆化县| 特克斯县| 威信县| 新泰市|