□張曉丹 王莉 梁冰/中國科學技術信息研究所 北京 100038
開放獲取在NSTL系統(tǒng)中的實現(xiàn)與服務模式研究*
□張曉丹 王莉 梁冰/中國科學技術信息研究所 北京 100038
開放獲取資源是一種非常重要的學術資源,開放獲取平臺是獲得開放資源的有效途徑。文章通過對DOAJ、JST等國際上較權威的開放獲取平臺資源進行分析,得出了目前開放獲取資源存在的信息增長與信息獲取之間的矛盾的結論。如何利用和整合國際上著名的開放獲取資源為國內用戶服務是目前研究的主要問題。文章針對國內科研用戶對開放獲取資源整合的需求進行了研究,并將研究結果應用在國家科技圖書文獻中心(NSTL)平臺上。
開放獲取,資源整合,NSTL
開放獲?。∣pen Access),是相對于傳統(tǒng)出版模式而言的,其目的是通過網絡加速學術資源的共享,使得任何人在獲取資源時不受時間、費用等限制。它起源于20世紀90年代,目前已經在世界各地得到了蓬勃的發(fā)展。
隨著開放獲取運動的發(fā)展,開放獲取資源得到了迅速增長,使得信息增長與信息獲取的矛盾日益突出。盡管國際上已經出現(xiàn)了DOAJ、OpenDOAR、Open J-Gate、Socolar等大型的開放獲取資源統(tǒng)一訪問平臺,但這些平臺在資源收錄方面各有偏重,提供的檢索方式參差不齊,且多局限于題錄級檢索。如何利用國際上先進的開放獲取資源,為國內科研用戶提供更好的服務是目前研究的熱點問題,也是本文要解決的主要問題[1-4]。
國家科技圖書文獻中心(National Science and Technology Library,NSTL)是國際上具有一定影響力的現(xiàn)代科技文獻信息服務機構[5],是我國權威的科技文獻信息資源收藏和服務中心。本文就NSTL對國際上著名的開放獲取資源進行整合與服務進行的相關研究進行闡述。
自20世紀90年代《布達佩斯開放獲取計劃》給予了“開放獲取”的完整定義后,開放獲取運動就在全世界積極展開了[5-8]。據開放存取知識庫登記系統(tǒng)ROAR(Registry of Open Access Repositories)統(tǒng)計顯示,全球公開登記的機構知識庫截至2013年5月已達6800個,其中,中國只有13個,其余的都屬于歐美知名大學和科研機構。ROAR對開放獲取期刊的增長及資源分布情況統(tǒng)計結果見圖1和圖2所示。
圖1 ROAR不同年度開放獲取期刊增長曲線圖
從圖1中可以看出,開放獲取資源是隨時間的增長快速發(fā)展的,尤其是到了2012年度,開放獲取資源增長迅猛,特別是2012年度,由2011年的400萬增長到800萬。由此可見人們已經普遍認識到開放獲取對科技發(fā)展及科研活動的重要性。
從圖2可以看出,開放獲取資源目前在國外占有的比重比較大,而中國只占有2.61%的份額。因此,加快開放獲取在國內的發(fā)展并整合世界上的開放獲取資源,勢在必行。
隨著開放獲取資源的爆炸性增長,信息增長與信息獲取的矛盾日益突出。盡管已經出現(xiàn)了DOAJ、OpenDOAR、Open J-Gate、Socolar等比較大的開放獲取資源統(tǒng)一訪問平臺,但是這些訪問平臺在資源收錄方面各有偏重,提供的檢索方式參差不齊,且多局限于題錄級檢索,整合開放獲取資源并提供集成檢索服務勢在必行。
NSTL針對上述問題,提出了完善的解決方案,以期建立面向國內科研用戶的完善的服務系統(tǒng)平臺。
由于開放獲取資源數量龐大,且全球范圍內開放倉儲數量超過2000個,開放獲取期刊數量超過15000種,但質量不一而足。所以選擇高質量、可靠的開放獲取資源是開放獲取建設的基礎。我們選擇資源的原則是:針對世界上較權威并可靠的開放獲取資源,其具有龐大的規(guī)模和穩(wěn)定的運行狀態(tài),同時,所選資源要有代表性,能體現(xiàn)相關科研領域的研究現(xiàn)狀和發(fā)展方向等。
圖2 ROAR 2012年度開放獲取期刊世界分布圖
(1)NSTL與權威的開放獲取平臺建立合作關系
遵循以上原則,目前NSTL已與世界上三個權威的開放獲取平臺建立了良好的合作關系,即DOAJ、JST及SciELO。
DOAJ(Directory of Open Access Journals,http://www.doaj. org)是由瑞典隆德大學圖書館2003年5月推出的開放獲取期刊的檢索系統(tǒng)。目前該系統(tǒng)可提供9000多種開放獲取期刊的訪問(數據截至2013年1月)。該系統(tǒng)提供刊名檢索、期刊瀏覽以及文章檢索等功能。DOAJ按期刊的學科主題分為17類,包括農業(yè)及食品科學,藝術與建筑學,生物及生命科學,貿易與經濟學,化學,地球與環(huán)境科學,總類,保健科學,歷史與考古學,語言文字,法律與政治科學,數學與統(tǒng)計學,哲學及宗教,物理及天文學,科學總論,社會科學,技術與工程學。
JST:J-STAGE(Japan Science and Technology Information Aggregator, Electronic,日本科學技術信息網絡電子平臺,http:// www.jstage.jst.go.jp)由日本科學技術振興機構(JST)開發(fā),收錄了日本各科技學會出版的文獻(以英文為主),包括600余種電子期刊,多種會議錄以及研究報告等。部分期刊、大部分會議錄和研究報告可以免費瀏覽全文。
SciELO(Scientific Electronic Library Online,http://www.scielo. org/),其主要目標是:遵循開放存取模式,也就是免費獲取全文,出版巴西在線科技期刊,提高國家及國際間期刊顯示度。目前,SciELO運動已經在拉丁美洲和加勒比國家(阿根廷、智利、西班牙、古巴、哥倫比亞、葡萄牙、委內瑞拉)廣泛展開,開放期刊數量達已達600多種,有20多萬篇文章,內容覆蓋農業(yè)、生物、化學、數學、地球科學、建筑、工程、健康科學、人文、法律、語言、藝術、海洋、社會科學等學科。
這些資源各有側重,因此對其進行有機的整合能為國內用戶提供國際上較為全面的、先進的開放獲取資源。
(2)NSTL開放獲取系統(tǒng)
NSTL開放獲取系統(tǒng)的主要流程為資源收割、資源加工、資源掛接(與NSTL原有的類別進行掛接)、提供檢索與瀏覽等服務,如圖3所示。
圖3 NSTL開放獲取系統(tǒng)流程圖
從圖3可以看出,首先對國外權威的開放獲取平臺進行資源的定期收割(根據更新的速度,收割的頻率通常一周一次或三天一次);對收割下來的資源進行數據加工,加工過程包括分類、去除噪聲、提取特征元數據等;然后進行資源掛接,即將獲取的資源與NSTL的原有類別進行掛接,實現(xiàn)NSTL統(tǒng)一的資源分類管理;最后是實現(xiàn)對外的檢索和瀏覽等服務。
基于上述的開放獲取流程,搭建為國內用戶服務的開放獲取服務平臺的基本架構如圖4所示。
從圖4可以看出,為了滿足NSTL開放獲取期刊、全文集成服務平臺的總體要求,結構圖中主要包括開放獲?。∣A)刊數據存儲模塊,實現(xiàn)對世界上開放獲取資源的存儲;OA刊數據管理模塊,主要完成對資源的統(tǒng)計監(jiān)測等功能;OA刊的服務模塊,主要完成對OA刊及篇的瀏覽、檢索等對外服務功能;對外接口模塊,主要實現(xiàn)本服務系統(tǒng)與外界無縫的接口。
該平臺的主要功能有:
實現(xiàn)會話管理功能??梢詫υL問系統(tǒng)的人進行身份識別,對會話操作進行記錄,并根據用戶的身份提供相關的服務(如基于會話的檢索或瀏覽過程記錄);實現(xiàn)檢索查詢功能。可以按用戶習慣的方式對OA期刊數據進行檢索;實現(xiàn)期刊按字順和按分類兩種瀏覽功能;支持OA期刊數據中資源層次及相關關系的有效組織和揭示;能夠明確按期刊、卷、期、文章的次序瀏覽和組織期刊論文;實現(xiàn)期刊和論文內容揭示功能;提供Landing頁,對于期刊和論文都需要有一個唯一的定位標識,可以及時定位到相應的Landing頁上,Landing頁提供期刊和論文的元數據揭示;實現(xiàn)全文鏈接功能。合法使用的用戶可以在檢索到篇數據之后鏈接到原始網站。
(3)NSTL開放獲取系統(tǒng)元數據
對于收割的開放獲取資源,要提取出對NSTL開放獲取有效的元數據。根據系統(tǒng)需要,提供的開放獲取期刊與篇章的元數據列表如表1所示。
圖4 NSTL開放獲取期刊集成服務總體結構圖
表1 NSTL開放能夠獲取系統(tǒng)元數據列表
表2 期刊描述元數據
表3 期刊-文章描述元數據
隨著開放獲取運動的發(fā)展,開放獲取資源得到了迅速增長,使得信息增長與信息獲取的矛盾日益突出。本文就如何利用國際上先進的開放獲取資源,為國內科研用戶提供更好的服務進行了研究并在NSTL中進行了實現(xiàn)。該開放獲取平臺可以進一步推動學術信息及資源的傳播,擴大NSTL的服務范圍系統(tǒng)。
為了將更完善的資源納入我們的平臺,我們將在下一步選取更多更全面的資源納入到我們的平臺中,并將個性化服務方式提供給用戶以便于提供更好的服務。
[1] ZHANG B, CHEN Y, FAN W, et al. Intelligent GP fusion from multiple sources for text classification [C]// Proceedings of the 14th ACM international conference on Information and knowledge management. ACM Press, Bremen, Germany, 2006a: 477-484.
[2] ZHANG G P. Avoiding Pitfalls in Neural Network Research. Systems, Man and Cybernetics, Part C: Applications and Reviews [J]. IEEE Transactions, 2007(37): 3-16.
[3] ZHANG L, ZHU J, YAO T. An evaluation of information fusion techniques [J]. ACM Transactions on Asian Language Information Processing (TALIP), 2004(3): 243-269.
[4] ZHANG Y, ZINCIR-HEYWOOD N, MILIOS E. Narrative fusion classification for automatic key phrase extraction [C]// Proceedings of the 7th annual ACM international workshop on Web information and data management. ACM Press, Bremen, Germany, 2005: 51-58.
[5] XU L Y, DU Q D. Application of neural fusion to accident forecast in hydropower station [C]// Proceedings of the Second International Conference on Information Fusion. Vol2 Sunnyvale, 1999: 1166-1171.
[6] SCHAPIRE R E, SINGER Y, SINGHAL A. Boosting and Rocchio applied to text filtering [C]// Proceedings of SIGIR-98 21st ACM International Conference on Research and Development in Information Retrieval. ACM Press, New York, US, 1998: 215-223.
[7] SEBASTIANI F. Machine learning in automated image categorization [J]. ACM Computing Surveys, 2002(34): 1-47.
[8] ZHANG XIAO-DAN. A system of file Automated classification: China, 201020200043 [P]. 2010-12.
Study on Open Access Implementation and Service Pattern of NSTL
Zhang Xiaodan, Wang Li, Liang Bing / Institute of Scientific and Technical Information of China, Beijing, 100038
Open access resources are very important academic resources. In this paper, DOAJ, JST and other international authoritative platform for the open access resources are analyzed, and there is contradiction between the growth of information and the access to them of current open access resources. It is important to make use of and integrate internationally famous open access resources. Based on the background of NSTL, The present study establishes the integration of open access resources service platform for domestic users, improves the level of domestic users of research and the quality of the open access service.
Open access, Resources integrating, NSTL
2013-06-06)
10.3772/j.issn.1673—2286.2013.10.012
*本課題受“十二五”國家科技支撐計劃項目(編號:2011BAH10B05)和中國科學技術信息研究所預研項目(編號:YY-2013023)資助。
book=62,ebook=66
張曉丹(1975- ),研究方向:信息挖掘、信息融合等。E-mail: zhangxd@istic.ac.cn