王旭 柯凱艷
摘 要 論文選取CNKI期刊收錄的近15年我國圖書情報領域信息檢索相關性研究的論文,基于文獻計量學對收集的數(shù)據(jù)進行了量化分析,并運用CiteSpace軟件和Ucinet軟件繪制了科學知識圖譜。同時,論文分別從發(fā)文時間、作者、機構(gòu)和研究熱點(關鍵詞)四個方面對該領域研究進展進行了詳細分析和總結(jié),進一步介紹了其知識結(jié)構(gòu)與發(fā)展趨勢,并為今后該領域研究提出了建議。
關鍵詞 圖書館學 情報學 信息檢索相關性
分類號 G250.252
DOI 10.16810/j.cnki.1672-514X.2016.08.020
Analysis on Recent 15 Years Researches of Information Retrieval Relevance in Library and Information Science in China
Wang Xu,Ke Kaiyan
Abstract This paper selects 15 years articles related to information retrieval relevance in library and information science of China from CNKI database. It analyzes the collected data quantitatively based on bibliometrics and uses the visualization software (CiteSpace and Ucinet) to draw scientific knowledge mapping. Meanwhile, it makes a detailed analysis and summary of research progress in this field from four aspects including dispatch time, the author, institution distribution and research focuses, then introduces its' knowledge structure and development trend. Lastly, it proposes advice for future study in this field.
Keywords Library science. Information science. Information retrieval relevance.
信息檢索相關性研究距今已有80多年歷史,關于“相關性既是信息檢索的基本問題,也是情報學的基礎性概念”,國內(nèi)外圖書情報領域主流學者已達成共識[1-2],且在相關性研究上取得了一定的成果??紤]到目前圖書情報領域關于信息檢索相關性研究的內(nèi)容較少,同時也為了解國內(nèi)圖書情報領域信息檢索相關性研究的歷史、進展,本文選用中國知網(wǎng)數(shù)據(jù)庫,利用CiteSpace、Ucinet等軟件繪制圖書情報領域信息檢索相關性主題詞文獻的科學知識圖譜,并對近15年國內(nèi)該領域的研究現(xiàn)狀進行了系統(tǒng)的梳理和分析,試圖發(fā)現(xiàn)現(xiàn)有研究的不足以及未來研究趨勢,期望為該領域進一步研究提供借鑒。
1 研究方法
本文采用文獻計量方法分析與解讀圖書情報領域信息檢索相關性研究論文,借助文獻的內(nèi)、外部特征,采用統(tǒng)計學方法,通過繪制科學知識圖譜來揭示該領域的知識結(jié)構(gòu)和知識特征,以及研究的前沿領域。
1.1 數(shù)據(jù)收集
在中國知網(wǎng)(CNKI)檢索界面,運用檢索式主題=(信息檢索and相關性)or(檢索and相關性)(精確匹配)檢索2001年至2015年我國圖書情報領域信息檢索相關性研究論文,共得到191篇文獻,經(jīng)去重、整理后為190篇。
1.2 可視化及統(tǒng)計工具
本文進行可視化分析的工具是CiteSpace3.8R5版本和Ucinet6.212版本。CiteSpace 在Java語言環(huán)境下運行,由陳超美教授開發(fā),在文獻引文網(wǎng)絡分析研究領域被廣泛應用;Ucinet軟件由Linton Freeman編寫,在社會網(wǎng)絡分析中被廣泛應用。為了呈現(xiàn)圖書情報領域信息檢索相關性研究的時間分布趨勢,本文利用Excel統(tǒng)計2001—2015年的發(fā)文數(shù)量并繪制了文獻年代分布趨勢圖譜。同時,借助CiteSpace、Ucinet繪制科學知識圖譜,以可視化效果對圖書情報領域信息檢索相關性研究的分布機構(gòu)以及關鍵詞等進行分析。
2 我國圖書情報領域信息檢索相關性研究的時空知識圖譜及其分析
2.1 年代分布分析
運用文獻計量分析方法,從文獻歷時性上可以分析出學科的發(fā)展趨勢,發(fā)文量的多少代表了在一定時期內(nèi)該領域研究的冷熱程度。利用Excel繪制年代分布情況(見圖1),發(fā)現(xiàn)關于信息檢索相關性的研究在2003年后呈現(xiàn)明顯的上升趨勢,2011年達到研究的高峰期,2012~2013年發(fā)文量有所下降,2014年和2015年稍有回升。近幾年圖情領域有關信息檢索相關性研究熱度下降的原因可能是在信息檢索技術突破方面遇到了瓶頸。目前該領域研究已積累了大量的理論觀點,今后在實證和技術方面的研究有待提高。
2.2 高產(chǎn)作者知識圖譜
發(fā)文量可以用來衡量研究者學術水平和科研能力,高產(chǎn)作者一定程度上影響著某一學科的發(fā)展、演變方向,對高產(chǎn)作者的研究具有重要意義。根據(jù)普萊斯高產(chǎn)作者計算公式: (其中Nmax為最高產(chǎn)作者論文數(shù))統(tǒng)計得知,成穎為最高產(chǎn)作者(8篇),則計算M值為2.11,M取鄰近最大整數(shù)為3,發(fā)文≥3篇的作者稱為高產(chǎn)作者(見表1)。
由表1可知,高產(chǎn)作者中有南京大學信息管理系的成穎(8篇),南開大學信息管理系的王知津(6篇),南京大學信息管理系的孫建軍(6篇)等。由此可知,我國圖書情報領域信息檢索相關性研究的核心群體仍是高校專業(yè)教師和圖書館員,他們擁有較強的科研實力和科研隊伍以及本專業(yè)深厚的研究底蘊,是國內(nèi)圖情領域信息檢索相關性研究的核心力量。而公共圖書館研究人員較少,應鼓勵專業(yè)人員加入公共圖書館,進行更好的理論分析及實踐研究[3]。
2.3 研究機構(gòu)知識圖譜
研究機構(gòu)是從事一項或者多項研究的專門性組織,在一定程度上可以理解為學術群體的代名詞。機構(gòu)合作有助于實現(xiàn)科研資源的優(yōu)化配置,提高科研生產(chǎn)力。運用SPSS軟件統(tǒng)計國內(nèi)圖書情報領域信息檢索相關性研究2001年到2015年期間載文的機構(gòu)分布,共計有160家國內(nèi)學術機構(gòu)(包括一級單位和二級單位)參與論文的創(chuàng)作,其中25家機構(gòu)發(fā)文≥2篇(由于篇幅有限,統(tǒng)計圖示結(jié)果未列出),排名前25位的核心機構(gòu)累計發(fā)文91篇,約占全部發(fā)文的48%,是該領域研究的主要陣地。
采用CiteSpaceIII軟件,時間選擇為2001~2015年,時間分段單位(Slice Length)為1年,選擇網(wǎng)絡節(jié)點為機構(gòu)(Institution),采用最小生成樹算法,經(jīng)調(diào)試得到發(fā)文機構(gòu)知識圖譜(見圖2)。圖譜中有33個節(jié)點,161條連線,網(wǎng)絡密度為0.0026,可知各機構(gòu)合作力度不大,跨地域、跨機構(gòu)科研合作較少,有待加強。圖譜顯示,高校圖書館和高校信息管理院系是圖書情報領域信息檢索相關性研究的主要陣地,是最活躍的系統(tǒng),貢獻最大。這與高校具有濃厚的學術氛圍,有一批較高水平和較高科研能力的研究者有關。
2.4 關鍵詞知識圖譜
根據(jù)文獻計量學中的齊普夫定律可知:通過統(tǒng)計分析某一學科中關鍵詞出現(xiàn)頻次及其相互關系,可以對該領域的知識結(jié)構(gòu)演變狀況、研究熱點分布情況做出清晰的揭示。
利用CiteSpaceIII軟件,通過設定適當閾值,以一年為年限(Year Per Slice=1),節(jié)點選擇關鍵詞(Keyword),采用尋徑網(wǎng)絡算法剪枝修理后,可得到國內(nèi)圖書情報領域信息檢索相關性研究關鍵詞時序知識圖譜(見圖3),其下方年代對應節(jié)點年代環(huán),在修枝后僅顯示部分熱點關鍵詞。同時,利用Ucinet軟件繪制出圖書情報領域信息檢索相關性研究關鍵詞共現(xiàn)知識圖譜(見圖4)。
在國外,有關信息檢索相關性研究起步遠遠早于國內(nèi),研究成果較國內(nèi)豐富,研究體系較為完整。計算機科學界和圖書情報學界構(gòu)成國外信息檢索相關性研究的兩大學派,在計算機科學界,相關研究者被稱為系統(tǒng)中心派,即重點在于檢索系統(tǒng)自身的內(nèi)部運行機制研究[4];在圖書情報學界,相關研究者被稱為用戶中心派,即重點在于用戶以及用戶與系統(tǒng)之間的交互研究[5-6]。國內(nèi)學者在借鑒國外信息檢索相關性研究成果的基礎上進行研究,基于相關性的動態(tài)性、多維性、可認知性和可測度性觀點,目前,國內(nèi)學者也普遍認同上述兩種學派。
基于國內(nèi)外有關信息檢索相關性研究的兩大研究學派類型,結(jié)合圖3、圖4對190篇文獻進行梳理后,可以從計算機檢索系統(tǒng)自身的內(nèi)部運行機制研究和用戶以及用戶與系統(tǒng)之間的交互研究兩大視角,總結(jié)出典型研究者對我國圖書情報領域信息檢索相關性研究的進展及概況,如表2、表3所示。
3 結(jié)語
本文以近15年(2001年~2015年)CNKI中有關圖書情報領域信息檢索相關性研究的論文為研究對象,從文獻計量學的角度,利用知識圖譜工具剖析了我國圖書情報領域信息檢索相關性研究現(xiàn)狀,著重分析了文獻發(fā)表時間、高產(chǎn)作者、研究機構(gòu)、關鍵詞等方面的內(nèi)容,經(jīng)梳理總結(jié),得出以下幾個方面的結(jié)論。
(1)從國內(nèi)圖情領域信息檢索相關性研究的發(fā)文數(shù)量時間分布來看,在2003年后呈現(xiàn)明顯的上升趨勢,2011年達到研究的高峰期,2012~2013年發(fā)文量有所下降,2014年和2015年稍有回升。另外,近幾年圖情領域有關信息檢索相關性研究熱度下降的原因可能是在信息檢索技術突破方面遇到了瓶頸。目前該領域研究已結(jié)積累了大量的理論觀點,今后在實證和技術方面的研究有待提高。
(2)從國內(nèi)圖情領域信息檢索相關性研究的高產(chǎn)作者及機構(gòu)分布來看,高校圖書館員和高校信息管理系是該領域研究的主要陣地,擁有國內(nèi)該領域信息檢索相關性研究的核心群體。而公共圖書館相關研究人員較少,因此,還需要更多的專業(yè)人員加入公共圖書館,給予更好的理論分析及實踐研究。同時,本研究領域迫切希望能夠涌現(xiàn)出領軍人物和核心研究團體來制定大科學時代的研究戰(zhàn)略,組織本領域的協(xié)作研究,積極帶領廣大研究者開拓更廣泛的研究領域和做出更專深的探索[6]。
(3)從國內(nèi)圖情領域信息檢索相關性研究熱點來看,本文基于國內(nèi)外有關信息檢索相關性研究的兩大研究學派類型,分別從計算機索系統(tǒng)自身的內(nèi)部運行機制研究和用戶以及用戶與系統(tǒng)之間的交互研究兩大視角進行了梳理和總結(jié)。研究發(fā)現(xiàn),國內(nèi)在一定程度上取得了驕人的成績,但主要集中在信息檢索相關性研究的理論層面探討上,而在實證方面的研究還有待加強。面對日益增長的海量網(wǎng)絡信息,可以滿足用戶需求的信息檢索相關性越來越重要,因此,以計算機檢索系統(tǒng)為中心的設計思想轉(zhuǎn)變?yōu)橄到y(tǒng)與用戶并重的設計思想,重視用戶友好性,是提高信息檢索相關性的解決方案。相信未來國內(nèi)圖書情報領域信息檢索相關性研究會不斷深入,有所突破。
參考文獻:
[ 1 ] SARACEVIC T. Information science[J].Journal of the American Society for Information Science,1999(12):1051-1063.
[ 2 ] 馬費成.論情報學的基本原理及理論體系構(gòu)建[J].情報學報,2007(26):3-13.
[ 3 ] 王旭.基于文獻計量的國內(nèi)大數(shù)據(jù)研究現(xiàn)狀分析[J].農(nóng)業(yè)圖書情報學刊,2016(4):52-56.
[ 4 ] Bo-Y KANG, Dae-Won KIM, Sang-Jo LEE. Semantic indexing and fuzzy relevance model in information retrieval[J].Studies in Computational Intelligence (SCI),2005(2):49-60.
[ 5 ] HARTER S P. Psychological relevance and informationscience[J].Journal of the American Society for Information Science,1992(43):602-615.
[ 6 ] SPINK A, GREISDORF H, BATEMAN J. From highly relevant to not relevant:Examining different regions of relevance[J].Information Processing & Management,1998(34):599-621.
[ 7 ] MIZZARO S. Relevance: The whole history[J].Journal of the American Society for Information Science,1996(9):810-832.
[ 8 ] 王知津,卞丹,王文爽.信息檢索中“相關性”的概念、類型及其不確定性[J].山東圖書館刊,2011(1):1-5.
[ 9 ] 成全,司輝.信息檢索相關性評價及其改善策略研究[J].情報雜志,2008(2):129-133.
[10] 韓毅,鄧小昭,劉麗,等.信息檢索領域相關定義的演化及其啟示[J].情報理論與實踐,2006(3):270-273.
[11] 賴茂生,屈鵬.相關性基礎理論及其在檢索建模中的作用研究[J].情報理論與實踐,2008(6):801-805.
[12] 黃麗紅.信息檢索中“相關性”的探究[J].圖書館學研究,2006(2):65-67.
[13] 成穎,孫建軍,巢乃鵬.信息檢索中的相關性模型[J].圖書情報工作,2004(12):46-50.
[14] 王雅坤,成全.信息檢索相關性研究綜述及發(fā)展趨勢[J].圖書與情報,2012(1):88-94.
[15] 朱涵.BIR模型在提高用戶檢索相關性中的應用[J].情報探索,2007(4):53-55.
[16] 成穎.基于相關性判據(jù)的學術信息檢索系統(tǒng)成功模型建構(gòu)[J].現(xiàn)代圖書情報技術,2011(9):46-53.
[17] 楊建林,鄧三鴻.信息檢索中相關性的維度與度量[J].情報理論與實踐,2005(6):27-30.
[18] 吳麗華,羅云鋒,張宏斌.信息檢索模型及相關性算法的研究[J].情報雜志,2006(12):25-27.
[19] 周瑛,方宏彬,張持健.模糊聚類在信息檢索中的應用[J].微機發(fā)展,2005(3):107-109.
[20] 劉銘,劉秉權(quán),劉遠超.面向信息檢索的快速聚類算法[J].計算機研究與發(fā)展,2013(7):1452-1463.
[21] 何紹華,宮兆暉.基于語義網(wǎng)的網(wǎng)絡信息檢索相關性研究[J].情報雜志,2007(12):120-123.
[22] 成全,司輝.信息檢索相關性評價及其改善策略研究[J].情報雜志,2008(2):129-133.
[23] 夏詠梅.淺析信息檢索評價中“相關性”問題的內(nèi)涵[J].情報雜志,2003(6):52-53.
[24] 楊銳.次序效應對用戶判斷檢索結(jié)果相關性的影響[J].情報探索,2011(5):5-8.
[25] 成穎.信息檢索相關性判據(jù)及應用研究[D].南京:南京大學,2011.
[26] 程娟.基于用戶信息檢索相關性反饋模型的研究[J].圖書館雜志,2008(4):52-55.
[27] 李亞琴,孫建軍,楊月全,等.基于信息檢索用戶的相關性行為研究進展[J].情報科學,2014(5):157-160.
王 旭 黑龍江大學信息管理學院碩士研究生。黑龍江哈爾濱,150080。
柯凱艷 云南大學歷史與檔案學院碩士研究生。云南昆明,650000。
(收稿日期:2016-06-01 編校:陳安琪)