陳和 林靜
摘要:[目的/意義]目前IR發(fā)展到相對成熟階段,對國內IR發(fā)展情況進行梳理、分析和總結,可為下一階段IR發(fā)展提供參考建議。[方法/過程]利用Excel、VOSviewer、CiteSpace等軟件和編程處理數(shù)據(jù)方法,對2000-2018年CNKI收錄的1 362篇IR期刊論文進行可視化分析。[結果/結論]國內IR發(fā)文經歷了迅速增長期、相對平穩(wěn)期以及快速下滑期,預示目前國內IR研究進入新階段,出現(xiàn)新的研究點;國內研究IR的高頻作者(群)以中國科學院系統(tǒng)群體和高校系統(tǒng)群體為主,前者的研究比后者更為前沿和深入;《圖書情報工作》《現(xiàn)代情報》《圖書館學研究》等是刊載IR研究論文最多的期刊,是國內IR研究領域較有影響力的期刊;國內IR研究熱點包括系統(tǒng)構建、資源建設、學術交流、知識管理與服務、版權保護等;IR未來的可能研究熱點包括科研數(shù)據(jù)、科研服務、輔助科研決策、數(shù)據(jù)增值服務等。
關鍵詞:機構知識庫;IR;數(shù)據(jù)可視化;知識圖譜;文獻計量;研究熱點
分類號:G251
引用格式:陳和, 林靜. 2000-2018年國內機構知識庫研究可視化分析[J/OL]. 知識管理論壇, 2019, 4(5): 276-286[引用日期]. http://www.kmf.ac.cn/p/184/.
20世紀90年代末,機構知識庫(Institutional Repository,IR)概念在國外開始萌芽。2001年,美國俄亥俄州立大學圖書館和首席信息官辦公室聯(lián)合推出了知識庫服務(Knowledge Bank Service),員工、教師和學生可以將自己的作品上傳到知識庫中,并長期保存,這是實際意義上IR的早期雛形[1]。2002年,惠普公司與美國麻省理工大學合作,研發(fā)了IR的構建軟件——DSpace[2],并建立麻省理工大學IR——DSpace@MIT[3],成為第一個正式建立IR的學術機構。2004年,浙江大學圖書館基于DSpace構建了國內第一家實驗性的IR。2006年8月,廈門大學圖書館正式對外公開并發(fā)布基于DSpace構建的廈門大學學術典藏庫[4],成為我國大陸地區(qū)第一個正式運行IR的高校。中國科學院(以下簡稱“中科院”)國家科學圖書館蘭州分館于2006年基于DSpace進行主題學科的IR平臺建設,并在不斷完善后,在中科院系統(tǒng)內推廣運用[5]。此后,國內越來越多的學者開始關注和研究IR,IR也成為各重要圖情學術會議的交流討論主題之一[6],并且從2013年開始,中國IR學術研討會每年舉辦一次,交流和討論IR最新研究成果,以推進IR在中國的發(fā)展[7]。時至今日,IR在國內發(fā)展將近20年,筆者通過對國內有關IR的期刊論文進行文獻計量和數(shù)據(jù)可視化,對IR研究人員、IR研究熱點等相關主題進行梳理和分析,為研究IR的相關人員提供參考,為今后IR的創(chuàng)新發(fā)展提出建議。
1? 數(shù)據(jù)來源與處理
筆者選用 CNKI(中國知網)的期刊論文為數(shù)據(jù)源。在期刊論文檢索頁面,選擇檢索方式為“主題”,檢索詞為“機構知識庫”“機構典藏庫”“機構庫”“機構倉儲”“機構存儲”,檢索詞之間的關系為邏輯或,檢索期限為2000年到2018年,其他為默認選項,獲得1 648篇文章(檢索日期為2019年2月15日)。通過人工剔除與本研究無關的結果,如物流倉儲、dSPACE仿真系統(tǒng)、IR會議通知、征稿等,最終得到有效文章篇數(shù)為1 362篇。由于受到CNKI單次下載元數(shù)據(jù)條目的限制,以上元數(shù)據(jù)是通過多個時間段檢索多次匯總而來。為方便數(shù)據(jù)分析和利用數(shù)據(jù)可視化軟件,數(shù)據(jù)導出格式包括了Refworks、EndNote和自定義格式。
2? 論文發(fā)表時間分布分析
對檢索獲得的1 362篇文獻的發(fā)表年份元數(shù)據(jù)字段進行統(tǒng)計,利用Excel繪制成逐年發(fā)文數(shù)量曲線圖,如圖1所示:
圖1? 逐年發(fā)文數(shù)量曲線圖
國外在2002年左右開始報導有關IR研究[8],從圖1可以看出,國內從2004年開始第一次出現(xiàn)IR研究的文章[9],反映了我國學者的研究緊跟國外研究步伐的特點,雖然有些時滯,但很短。從發(fā)文趨勢情況來看,2004年算是中國大陸研究IR的元年,從此國內IR進入蓬勃發(fā)展的階段。從2004年到2018年,有關IR的發(fā)文情況大概可以分為三個階段:
第一階段,從2004年到2009年。該階段是IR發(fā)文的快速增長階段,2009年達到第一個高峰,發(fā)文量達133篇。在該階段,IR作為新的學術課題被引入國內,引起國內圖書情報界學者極大的關注和研究熱情,紛紛發(fā)表了大量的關于IR的學術論文??v覽這時期的論文內容,主要是介紹域外IR的研究進展或成果,包括IR的出現(xiàn)背景、概念內涵、學術交流功能意義等,以及IR作為“泊來品”對我國圖書館建設與學術研究的啟示等。
第二階段,從2009年到2017年。該階段是IR發(fā)文相對穩(wěn)定階段。經過第一個階段的學習積累,國內圖書情報界對IR有了比較充分的理論認識,開始進入IR實踐發(fā)展階段,這階段的發(fā)文涉及IR構建實踐、IR資源建設探索、文獻計量分析、開放獲取政策、學科服務、科研管理等。該階段是IR在國內真正落地生根發(fā)展階段,研究方向多樣化,實現(xiàn)IR研究百花齊放式的發(fā)展,每年的發(fā)文量幾乎都是百篇以上。
第三階段,2018年。從發(fā)文曲線來看,2018年的總發(fā)文量比往年有比較大的下滑(原文檢索時間于2月份,由于CNKI上線論文存在時滯,2019年6月份本文修改時2018年的發(fā)文量已增至88篇),從趨勢來看,可能還將繼續(xù)下滑。該現(xiàn)象直觀地表明,題名、關鍵詞、摘要等字段含有“機構知識庫”及相近概念的期刊論文開始減少,但是否意味著國內IR研究開始停滯不前或進展緩慢?筆者以IR當前熱門話題“科研數(shù)據(jù)”為檢索詞在CNKI進行檢索,其中篇名含有該詞并且檢索時間為2018年的檢索結果是78篇,這些被檢索出的期刊論文在相關字段中多數(shù)沒有出現(xiàn)“機構知識庫”及相近概念詞語,但是此類論文仍然屬于IR范疇。因此,進入2018年,國內IR研究并沒有停滯,只是以“機構知識庫”及相近概念作為發(fā)文主題的論文開始減少,預示國內IR的研究開始進入新階段,出現(xiàn)新的研究熱點,僅用“機構知識庫”及相近概念已不能滿足檢索該領域的全部論文要求,關于新研究熱點將在下文“研究熱點分析”部分繼續(xù)分析。
3? 主要刊發(fā)期刊分析
經統(tǒng)計,1 362篇文獻刊載于224種期刊,依據(jù)發(fā)文量由多到少排序,并根據(jù)“二八定律”,取前20%(45本)期刊進行統(tǒng)計分析,得到如圖2所示的比例示意圖(低于4%的期刊作了歸并處理)。
圖2? 主要刊發(fā)期刊分析
如圖2所示,《圖書情報工作》《現(xiàn)代情報》《圖書館學研究》《情報理論與實踐》《情報探索》《現(xiàn)代圖書情報技術》(2017年更名為《數(shù)據(jù)分析與知識發(fā)現(xiàn)》)、《情報雜志》《科技情報開發(fā)與經濟》《農業(yè)圖書情報學刊》《圖書館雜志》10種期刊刊載的有關IR文章達到所有IR發(fā)文量的50%,也就是說國內研究IR的作者將大部分文章投向了這些期刊。從統(tǒng)計結果來看,上述刊物可以視為國內IR研究領域的高影響力期刊,若有需要了解國內IR具體研究情況的用戶,可以把這些刊物發(fā)表的IR論文作為重點關注論文。
4? 論文作者分析
4.1? 高頻作者
對1 362篇論文的作者進行統(tǒng)計和排序,其中發(fā)文量大于等于8篇的作者共有21位,可以認為這些作者是國內IR研究領域的高頻作者,見圖3。其中,發(fā)文頻率最多的作者是祝忠明,以34篇高居榜首,是排在第二位作者發(fā)文量的2倍還多,是國內IR研究領域發(fā)文量超高頻作者。從作者對應的工作單位來看,中科院系統(tǒng)的作者約占高頻作者數(shù)的一半,而其他的高頻作者主要來自高校系統(tǒng),這從另一側面反映了中科院系統(tǒng)對IR的研究比高校系統(tǒng)更加活躍,從他們的發(fā)文內容來看,中科院系統(tǒng)作者對IR的研究也比較系統(tǒng)、深入和前沿。
圖3? 發(fā)文高頻作者
4.2? 作者合作網絡
對原始檢索結果數(shù)據(jù)的作者字段進行Python編程轉換處理成ris文件,再利用可視化軟件VOSviewer創(chuàng)建作者合作網絡圖(作者最少發(fā)文量閾值設定為3篇),如圖4所示。
圖4顯示,合作成員超過5名的研究團隊共有4個:①祝忠明研究團隊。該團隊成員基本來自中科院國家科學圖書館蘭州分館。通過他們發(fā)表的文章可以發(fā)現(xiàn),該團隊是中科院IR系統(tǒng)的技術開發(fā)和維護團隊,他們在多個基金項目的資助下,完成了多項有關IR的研究。在DSpace作為原型系統(tǒng)的基礎上,開發(fā)了適合中科院實際需求的新的IR系統(tǒng)——CSpace,并在全院推廣使用。根據(jù)用戶需求,該團隊對系統(tǒng)持續(xù)了進行開發(fā)、更新和維護,目前已經開始將其推廣到中科院系統(tǒng)外的國內高校系統(tǒng)[10]。該團隊對IR研究最深入、最全面、最前沿,是國內研究IR領域的權威團隊。②顧立平研究團隊。團隊成員主要來自中科院國家科學圖書館。通過他們發(fā)表的文章可以發(fā)現(xiàn),他們和祝忠明團隊同屬于中科院機構知識團隊,兩者相輔相成,但前者主要側重于中科院IR系統(tǒng)的推廣與服務、開放獲取政策研究、輔助系統(tǒng)支持等。③聶華研究團隊。成員主要來自北京大學圖書館。通過他們發(fā)表的文章可以發(fā)現(xiàn),北京大學圖書館很早就已經介入IR的建設,作為Calis-IR項目的主要負責單位,擔負了CALIS成員館的IR建設與推廣工作,現(xiàn)在正在推動中國高校IR聯(lián)盟建設[11-12]。④李國俊研究團隊。團隊成員主要來自北京科技大學圖書館,他們主要以北京科技大學IR為基礎[13],討論了IR系統(tǒng)構建、數(shù)字資源建設、基于IR的文獻收錄引用及計量服務研究等。
圖4? 作者合作網絡圖
另外,從圖4中還可以看到,孫坦、肖明在作者合作網絡中起到了聯(lián)結橋梁作用,聯(lián)結了中科院、北京師范大學、北京郵電大學、北京科技大學等之間的校際IR研究合作。
5? 研究熱點分析
論文關鍵詞是作者選用的最能體現(xiàn)論文研究內容或主題的簡短詞語,通過對國內有關IR論文的關鍵詞進行計量分析,可以了解國內IR的主要研究熱點。
由于關鍵詞并不是規(guī)范的主題詞,對關鍵詞進行統(tǒng)計分析前,需要對關鍵詞進行必要的歸并處理,比如“開放存取”統(tǒng)一為“開放獲取”,“機構庫”“機構倉儲”“機構倉儲庫”“機構存儲”“機構存儲庫”“機構典藏庫”“機構知識庫”等統(tǒng)一為“機構知識庫”,“大學”統(tǒng)一為“高?!薄?/p>
5.1? 高頻關鍵詞
通過對規(guī)范后的關鍵詞進行詞頻統(tǒng)計,獲得高頻關鍵詞列表,如表1所示(只截取前30個):
如表1所示,由于本次研究對象是機構知識庫,所以該詞出現(xiàn)頻率最高,而且遠高于其他關鍵詞。接著出現(xiàn)的高頻關鍵詞是“開放獲取”“圖書館”“高校”,這3個詞的出現(xiàn)頻次也是遠高于其他高頻關鍵詞。IR是在開放獲取運動迅速發(fā)展的背景下產生,是后者的一種具體實踐方式。討論開放獲取時也會討論IR,而討論IR時也往往會提及開放獲取相關內容和背景。因此,“開放獲取”成為IR之后的次超高頻關鍵詞?!皥D書館”和“高?!标P鍵詞說明目前國內研究IR的主要是圖書館,而且以高校圖書館為主。IR的一個重要使命是長期保存本機構的知識成果,與圖書館保存人類知識之使命相契合,可以說圖書館積極研究IR、構建IR、推廣IR服務是一項職業(yè)使命,也是歷史使命。構建IR系統(tǒng)的開源軟件DSpace,在推動IR在世界范圍內廣泛普及與發(fā)展方面貢獻巨大,國內學者研究IR往往是從研究DSpace開始,因此,DSpace也出現(xiàn)在高頻關鍵詞的前列。
對于其他的高頻關鍵詞,筆者將結合下面的關鍵詞共現(xiàn)網絡圖進行分析。
5.2? 關鍵詞共現(xiàn)網絡
參照作者合作網絡,利用VOSviewer創(chuàng)建關鍵詞共現(xiàn)網絡圖(見圖5)。由于“機構知識庫”“開放獲取”“圖書館”“高校”在該網絡中屬于超高頻關鍵詞,在共現(xiàn)網絡圖中覆蓋了其他關鍵詞的共現(xiàn)關系,因此未把它們并入共現(xiàn)網絡圖。在參數(shù)設置上,關鍵詞出現(xiàn)的最小頻率(mininum number of occurrences of a keywords)是8。
圖5? 關鍵詞共現(xiàn)網絡
通過表1和圖5,并結合具體文獻進行綜合分析,可以概括出國內IR領域研究的幾個熱點研究領域:
(1)IR系統(tǒng)構建研究。該研究熱點主要出現(xiàn)在IR研究早期。構建IR有多款軟件系統(tǒng),其中DSpace軟件因其源代碼開放、無償免費使用、功能豐富、社區(qū)支持等特點吸引了無數(shù)IR關注者的興趣,它實現(xiàn)了IR從理論到落地實踐的過程。從發(fā)表的文獻來看,內容涉及DSpace軟件的功能架構介紹、與其他IR構建軟件對比研究、DSpace本地化與具體應用實踐等。與之共現(xiàn)的主要關鍵詞除了之前的超高頻關鍵詞外,還有數(shù)據(jù)模型、模式、元數(shù)據(jù)、互操作、關聯(lián)數(shù)據(jù)、開源軟件等。
(2)IR資源建設研究。開展IR服務,其最根本還是要落實到具體資源的收集和管理。機構的學術成果或學術產出形式多樣,包括但不限于期刊論文、會議論文、學位論文、演示文稿、專利、軟件、影像視頻、科學數(shù)據(jù)等。如何對這些學術成果進行有效的收集、組織和整理,是國內IR研究一直關注的熱點問題。IR資源建設相關的關鍵詞有內容建設、質量控制、學術資源、開放獲取資源、知識產權、自存儲、服務模式、策略、文獻計量學、建設模式、可持續(xù)發(fā)展、DSpace等。
(3)IR促進學術交流功能研究。隨著信息技術與網絡技術的發(fā)展以及人們對學術研究活動觀念與方法的改變,傳統(tǒng)的耗時、耗力與耗錢的學術交流模式已經不適應自由快速學術交流的趨勢。開放獲取的理念是讓用戶通過公共網絡快速無障礙地獲取所需要的學術資源,改變了傳統(tǒng)的學術交流模式[14],IR作為開放獲取模式下的學術產物,實現(xiàn)了學術自由快速交流的作用,受到科研人員和普通用戶極大的關注和認可。與學術交流共現(xiàn)的關鍵詞有知識管理、信息資源、資源共享、IR聯(lián)盟、學術IR、DSpace、模式、日本等。
(4)IR知識管理與服務研究。IR的本質是對機構的知識產出進行有效的組織和管理,并在網絡上開放這些知識產品,實現(xiàn)學術自由交流。要開展IR服務,除了對原始學術資源進行收集和積累,圖書館還需要聯(lián)合機構相關組織部門,如高??蒲泄芾聿块T、人事管理部門等,對IR的內容進行有效的組織和管理,以便為不同科研人員或實體提供高效的服務[15]。這是對IR更高層級的研究。與IR知識管理與服務相關的關鍵詞有知識管理、知識服務、科研管理、科研成果、數(shù)據(jù)管理、大數(shù)據(jù)、資源共享、學科館員、關聯(lián)數(shù)據(jù)、IR聯(lián)盟、可持續(xù)發(fā)展等。
(5)版權保護研究。IR是在開放獲取運動的背景下產生,旨在提供學術自由交流的平臺,為用戶提供學術資源的無障礙訪問和獲取服務,但并不意味著學術資源可以不受保護地被任意使用。如何在收集機構學術成果和對外提供服務時,保護作品和作者的版權權益,同時為用戶提供最大的使用便利,也是國內IR研究的一個研究熱點。與版權保護相關的關鍵詞有知識產權、著作權、自存儲、自存檔、質量控制、知識共享、合理使用、數(shù)字圖書館、對策等。
總體上,上述研究熱點之間的區(qū)隔并不太明顯,而是互相滲透和交融,研究熱點整體上比較平均,并沒有特別突出的研究熱點。
5.3? 關鍵詞時間線視圖
利用CiteSpace(5.3.R4.8.31.2018)對從CNKI下載的以Refworks格式保存的元數(shù)據(jù)中的關鍵詞節(jié)點進行時間線視圖(Timeline View)分析,得到圖6。同樣,為避免超高頻關鍵詞對其他關鍵詞造成覆蓋,“機構知識庫”“開放獲取”“圖書館”“高校”等未并入分析。
如圖6所示,CiteSpace根據(jù)自帶算法,把關鍵詞自動歸為9個類別,其中#0機構知識庫類的時間軸線(實線部分)起源最早,較完整地展示了IR在國內的發(fā)展過程,從2004年介紹引入構建IR系統(tǒng)的開源軟件DSpace開始,到對DSpace進行本地化處理,以適應國內的應用環(huán)境,再到學習參考較早介入IR建設而且又與大陸同文同種的臺灣地區(qū)高校IR建設經驗。隨著IR的推廣普及,IR建設策略、建設模式、服務模式等主題相繼被學者們探討。在這個過程中,域外比較先進的IR建設實踐(如日本、美國等)繼續(xù)被介紹和引入。
圖6? 關鍵詞時間線視圖
縱觀9個類別的時間軸線,只有#3和#4的時間軸線(實線部分)延續(xù)至2018年,說明這兩類屬于當前的研究熱點。結合其他時間軸上新出現(xiàn)的關鍵詞,可以概括出國內IR研究新出現(xiàn)的研究傾向,這些傾向可能預示著新的研究熱點,主要包括如下幾個方面:
(1)科研數(shù)據(jù)。新出現(xiàn)的關鍵詞中“數(shù)據(jù)”出現(xiàn)的頻率最高,說明國內IR研究已經開始關注科研數(shù)據(jù)領域??蒲袛?shù)據(jù)屬于IR資源建設范疇,在過去的有關IR資源建設研究中,主要關注點是期刊論文、會議論文、演示文稿、學位論文點等比較有“成果”性質的顯性學術資源??蒲袛?shù)據(jù)在科研活動中往往只是“中間產品”,或者只是學術成果的附屬資料,常常被科研工作者忽略,隨著科研活動的結束而被放棄。然而隨著科研活動進入第四范式,以及計算科學領域的進步,特別是在大數(shù)據(jù)研究背景下,數(shù)據(jù)重用已經被認可和重視,促使人們開始注重科研活動中有價值數(shù)據(jù)的保存與重用[16]。
(2)科研服務。IR因科研而生,并終將為科研服務??蒲谢顒邮莿討B(tài)的、持續(xù)的過程,并且隨著開放科學的進步和社會經濟環(huán)境等因素的變化而不斷變化和調整。同樣地,為科研服務的IR也將不斷自我調整和完善,也是今后IR研究中的一個持續(xù)熱點問題。
(3)輔助科研決策。隨著大數(shù)據(jù)科學的發(fā)展,以及IR在內容和功能上的不斷完善,IR在機構科研決策方面的輔助決策權重上的占比將越來越高,將扮演重要的“智庫”角色。當然,輔助科研決策并不單單基于單個機構的知識庫,而可能在多個機構的“IR聯(lián)盟”之上。IR參與輔助決策是國內IR研究和建設者一個不斷追求的目標,需要長期的不斷努力與爭取。
(4)數(shù)據(jù)增值服務。IR經過多年發(fā)展,在內容上幾乎囊括了本機構的所有公開發(fā)表的學術成果以及部分未公開發(fā)表的學術成果,并開始涉及科研數(shù)據(jù)。因此,IR將在學術數(shù)據(jù)上占有優(yōu)勢,除了提供常規(guī)的基礎服務,還將在高?!半p一流”的建設熱潮中,發(fā)揮數(shù)據(jù)優(yōu)勢,提供數(shù)據(jù)增值服務[17]。
另外,CSpace作為中科院圖書館蘭州分館推出的中國本土化的IR構建軟件系統(tǒng),在中科院系統(tǒng)內得到了很好的推廣和使用。隨著軟件與時俱進的更新與完善,并不斷拓展用戶群體,今后有關CSpace的發(fā)文可能會保持一定的頻率。
6? 分析與探討
通過前文對1 362篇論文從不同角度可視化分析后,可以基本了解我國目前IR研究的基本態(tài)勢,即我國的IR研究與建設已經取得了不俗的成就,現(xiàn)在正進入一個比較關鍵的關口。筆者針對國內IR研究與建設的當前現(xiàn)狀,提出4點建議為IR今后發(fā)展提供參考。
6.1? 再接再厲,持續(xù)推進機構知識庫建設
據(jù)統(tǒng)計[17],大陸地區(qū)高校和科研院所已建與在建IR共有325個,資源類型包括期刊論文、學位論文、會議論文、圖書、專利、研究報告、演示課件、實驗數(shù)據(jù)等。換句話說,目前我國很多高校和科研院所正在建設一個規(guī)模比較龐大的學術成果資源庫,是學術“大數(shù)據(jù)”,隨著科技的發(fā)展,國家對數(shù)據(jù)越來越重視,已經把大數(shù)據(jù)提升為國家基礎戰(zhàn)略資源,并認為大數(shù)據(jù)是信息社會的“石油”[18],在此背景下,繼續(xù)推進IR建設具有重大“戰(zhàn)略”意義,發(fā)展和應用前景廣闊。
另一方面,IR作為持續(xù)收集、管理機構教學科研活動中產生的智力成果平臺,只要教學科研活動不停止,IR建設也不應該停歇,應該從政策、資金等多方面持續(xù)推進IR建設。
6.2? 整合優(yōu)化,定位成為“國家基礎戰(zhàn)略資源”的組成部分
目前國內IR建設成績斐然,構建了一大批以機構學術成果為主要內容的IR系統(tǒng),資源總量也達到相當規(guī)模,并出現(xiàn)了以資源共享為主要目的兩大IR資源聯(lián)盟(“中國科學院文獻情報中心知識庫”和“中國高校機構知識庫聯(lián)盟”)。應該順應國家發(fā)展形勢,將這些數(shù)量規(guī)??捎^并且還在不斷增長的IR資源,定位為“國家基礎戰(zhàn)略資源”的組成部分,從國家的層面和高度來推動IR資源的建設與開發(fā)。然而,目前這些資源還不能實現(xiàn)真正的互聯(lián)和共享,仍分散在不同教育機構和科研院所,資源主體還是掌握在各個實體機構手中。
資源只有在流動中才能產生其價值,因此需要對當前IR資源進行整合與優(yōu)化,使其互聯(lián)共享。然而,對全國性的IR資源進行徹底的整合優(yōu)化,必然涉及不同教育科研機構之間的各種機制沖突和利益調整,而且這個過程不可能由某一個機構來完成,而是需要從國家層面,對現(xiàn)有的IR政策、體制、機制等方面進行改革創(chuàng)新,對多方利益進行協(xié)調與平衡。而IR建設者需要從大局出發(fā),解放“各自為戰(zhàn)”思想,拓寬目前對IR資源開發(fā)與利用的思路和視域。只有對IR資源進行比較徹底的整合與優(yōu)化,才能成為真正的“國家基礎戰(zhàn)略資源”。
6.3? 統(tǒng)籌協(xié)作,促進機構知識庫向縱深發(fā)展
從前文的熱點研究分析中可知,相當多的來自不同單位的作者進行著相同或相似的IR主題研究,兩大IR研究群體(中科院群體和高校群體)也在進行相類似的IR研究和IR聯(lián)盟建設。由于IR研究人員或團體相對分散,缺少統(tǒng)一規(guī)劃和統(tǒng)籌,導致IR研究熱點廣泛,但又不能形成真正的“熱點”,同時造成重復投入、重復研究、重復產出、重復勞動、重復構建等現(xiàn)象,浪費了人員、精力,甚至財力。這些問題在IR早期自發(fā)的、粗獷式、“無政府主義”發(fā)展模式中,難以避免。
IR發(fā)展到今天,必須對此前的發(fā)展模式進行改革,對全國IR研究團體和個人及其研究項目進行全面統(tǒng)籌、分工協(xié)作,避免重復研究。各IR研究團體和個人應結合各自特點和優(yōu)勢有針對性地對IR發(fā)展趨勢中的熱點問題展開研究,例如科研數(shù)據(jù)熱點研究、科研輔助熱點研究等,形成有一定特色的IR熱點研究。同時,從國家層面,組織一批有實力的IR研究團隊對IR發(fā)展趨勢中的熱點問題進行預研攻關性研究,例如,IR資源作為“國家基礎戰(zhàn)略資源”,探索如何利用大數(shù)據(jù)的技術方法對其進行深度開發(fā)與利用,從而使我國IR研究具有一定特色,又形成一定梯度的IR研究隊伍。
通過全面統(tǒng)籌和規(guī)劃協(xié)調,能夠節(jié)約、經濟、高效地實現(xiàn)IR研究與建設的突破與創(chuàng)新,促使國內IR向縱深發(fā)展。
6.4? 以評促建,提升機構知識庫構建質量和水平
如前所述,國內早期IR建設較為粗獷,缺少指導和統(tǒng)一規(guī)劃,IR資源種類繁多以及機構對IR建設投入多寡不一,致使IR普遍存在系統(tǒng)功能較單一、資源種類不一、資源著錄不規(guī)范、不詳細等問題。這些問題會對后續(xù)的IR系統(tǒng)升級和資源建設與利用造成影響。
為了使IR更好更快地發(fā)展,使IR資源更好地互聯(lián)共享,建立IR建設質量評價體系是一種行之有效的手段。從文獻調研來看,國內外已經有學者提出有關IR質量評價的指標體系,R. Serrano-Vicente等提出從技術、規(guī)程、內容、營銷和人員角度對西班牙的IR進行評價[19],郭清蓉提出并建立IR評價體系的思路和具體指標[20],郭翊提出由9項原則及其所包含的績效指標構成的IR評價體系[21],唐奇提出基于平衡計分卡的IR評價指標體系[22]。
然而,IR建設是一個動態(tài)過程,對其進行評價也需要靈活的動態(tài)的評價體系。因此,需要從國家戰(zhàn)略目標高度,對IR建設的不同階段采用不同評價指標體系進行及時評估,確保IR向高質量、高水平建設邁進。
7? 結語
由于本研究數(shù)據(jù)來源僅限于CNKI收錄的期刊論文,檢索用詞是“機構知識庫”及其相近概念詞語,并且未包括博碩士學位論文在內的其他學術研究數(shù)據(jù),研究結果可能會與實際情況有所偏差。另外,其他具有一定計量分析意義的元數(shù)據(jù)字段(如基金資助、作者單位、參考文獻等),由于來源數(shù)據(jù)不規(guī)范在本研究中未被納入,希望在后續(xù)研究中將其納入并分析。
筆者對IR未來發(fā)展的建議是立足于宏觀的國家層面而提出,期望國家相關部門出面引領統(tǒng)籌國內IR未來發(fā)展,組織國內IR研究專家、IR核心刊物編輯和審稿專家,以及相關大數(shù)據(jù)應用專家等人員,成立IR顧問決策小組,在總結梳理過去IR建設經驗基礎上,對 IR未來發(fā)展作頂層規(guī)劃和設計,確定發(fā)展戰(zhàn)略,配套出臺相關政策等。前文所述的IR發(fā)展建議可能帶有一定的理想性,僅借此拋磚引玉,希望引起國內IR研究同仁對IR未來發(fā)展作更多討論與探索。
參考文獻:
[1] 鐘源. 2004-2013年國外機構知識庫研究的文獻計量分析[J]. 情報科學, 2016, 34(6):71-76.
[2] DURASPACE. DSpace - A Turnkey Instutitional Repository Application [EB/OL].[2019-03-30]. https://duraspace.org/dspace/.
[3] MIT Libraries. DSpace@MIT[EB/OL].[2019-03-30]. http://dspace.mit.edu/.
[4] 廈門大學圖書館. 廈門大學學術典藏庫[EB/OL].[2019-03-30]. https://dspace.xmu.edu.cn/.
[5] 祝忠明, 馬建霞, 常寧, 等. 基于DSpace構建學科知識庫系統(tǒng)的研究與實踐[J]. 現(xiàn)代圖書情報技術, 2006(7):10-14.
[6] 上海市圖書館學會. 歷屆數(shù)字圖書館前沿問題高級研討班[EB/OL].[2019-03-30].http://society.library.sh.cn/node/2827.
[7] 中國機構知識庫推進工作組. 歷屆會議[EB/OL].[2019-03-30].http://2018chinair.csp.escience.cn/dct/page/70002.
[8] ROY T. Institutional repositories[J]. Library journal, 2002, 127(15): 28-30.
[9] 吳建中.圖書館VS機構庫——圖書館戰(zhàn)略發(fā)展的再思考[J].中國圖書館學報, 2004(5):7-10.
[10] 祝忠明, 張旺強, 劉巍, 等.我國數(shù)字圖書館軟件開源實踐的策略和模式:以CSpace為例[EB/OL].[2019-03-30]. http://dlib-oss2014.csp.escience.cn/dct/attach/Y2xiOmNsYjpwZGY6MjU1NzY=.
[11] 聶華, 韋成府, 崔海媛.CALIS機構知識庫:建設與推廣、反思與展望[J].中國圖書館學報, 2013, 39(2):46-52.
[12] 韋成府, 聶華, 崔海媛.多館協(xié)作開發(fā)的機構知識庫建設——以CALIS機構知識庫項目為例[J].大學圖書館學報, 2014, 32(3):69-73.
[13] 李國俊, 王瑜, 王李梅, 等.基于元數(shù)據(jù)的高校機構知識庫建設研究——以北京科技大學機構知識庫為例[J].大學圖書館學報, 2012, 30(4):55-60.
[14] 李春旺. 網絡環(huán)境下學術信息的開放存取[J]. 中國圖書館學報, 2005(1):33-37.
[15] 衛(wèi)垌圻, 范廣兵, 翁碩, 等.研究型圖書館機構知識庫資源的利用與增值服務[EB/OL]. [2019-03-30]. http://ir.psych.ac.cn/handle/311026/27283.
[16] 陳和.芻議國內高??茖W數(shù)據(jù)知識庫的構建[J].數(shù)字圖書館論壇, 2017(12):45-51.
[17] 龔亦農, 朱茗.我國機構知識庫建設現(xiàn)狀調查[J].數(shù)字圖書館論壇, 2018(9):20-28.
[18] 楊波. 大數(shù)據(jù)成國家基礎戰(zhàn)略資源 政府數(shù)據(jù)互聯(lián)共享促產業(yè)騰飛[EB/OL].[2019-03-30].http://www.gov.cn/zhengce/2015-08/20/content_2916507.htm.
[19] SERRANO-VICENTE R, MELERO R, ABADAL E. Evaluation of Spanish institutional repositories based on criteria related to technology, procedures, content, marketing and personnel[J]. Data technologies and applications, 2018, 52(3): 384-404.
[20] 郭清蓉.機構知識庫自存儲評價體系的構建[J].情報雜志, 2009, 28(7):74-76, 73.
[21] 郭翊, 吉萍.機構知識庫評價體系的構建[J].圖書館學刊, 2014, 36(2):10-12.
[22] 唐奇.基于平衡計分卡的機構知識庫評價指標體系構建[J].圖書館工作與研究, 2019(4):53-58.
作者貢獻說明:
陳? 和:提出研究思路,收集與處理數(shù)據(jù),撰寫、修改論文和定稿;
林? 靜:處理數(shù)據(jù)與制圖,撰寫論文。
Visual Analysis of Domestic Institutional Repository in 2000-2018
Chen He? Lin Jing
Library of Xiamen University, Xiamen 361005
Abstract: [Purpose/significance] At present, IR has reached a relatively mature stage. This article combs, analyzes and summaries the development of domestic IR, to provide reference for the next stage of IR development. [Method/process] Using the software of Excel, VOSviewer, CiteSpace and programming, 1 362 articles of IR were collected from CNKI in 2000-2018 year for visual analysis. [Result/conclusion]? The results of this study are as follows: IR articles publishing had experienced rapid development period, the relative stationary period, and downturn period, which means that the current research of domestic IR has reached a new stage, and have new research hotspots; the high-frequency authors (groups) are mainly composed of the authors of the Chinese Academy of Sciences and universities, the formers research is more advanced and deeper than the latter; “Library and Information Service”, “Journal of Modern Information”, “Researches in Library Science”, etc. are the most published journals with IR research papers, and are more influential in the field of IR research in China; research hotspots of domestic IR include system construction, resource construction, academic communication, knowledge management and services, copyright protection, etc.; future research hotspots include research data, scientific research services, auxiliary research decisions, and data value-added services.
Keywords: institutional repository? ?IR? ?data visualization? ? mapping knowledge domain? ? bibliometric? ? ?research hotspots
基金項目:本文系福建省中青年教師教育科研項目“基于本地博碩士學位論文系統(tǒng)的數(shù)據(jù)挖掘與可視化模式研究”(項目編號:JZ170312)研究成果之一。
作者簡介:陳和(ORCID: 0000-0002-4506-5612),副研究館員,碩士;林靜(ORCID:0000-0002-7886-6109),副研究館員,博士,通訊作者,E-mail: linjingxmulib@xmu.edu.cn。
收稿日期:2019-05-08? ? ? ? 發(fā)表日期:2019-09-04? ? ? ? 本文責任編輯:劉遠穎