任慧玲,葛紅梅,劉蕾,趙艷
(1. 中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,北京 100005;2. 中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,北京 100190)
NSTL開放獲取資源組織揭示方式研究*
任慧玲1,葛紅梅1,劉蕾1,趙艷2
(1. 中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,北京 100005;2. 中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,北京 100190)
開放資源已成為圖書館資源建設(shè)的重要組成部分,其分散性、動(dòng)態(tài)性和多樣性為組織揭示帶來了挑戰(zhàn)。本文分析開放資源組織揭示的需求特點(diǎn)、借鑒國(guó)內(nèi)外主要科技信息出版商、開放倉(cāng)儲(chǔ)和開放信息資源集成商對(duì)開放資源組織揭示的經(jīng)驗(yàn),結(jié)合NSTL已有的資源和信息服務(wù)基礎(chǔ),從增加資源內(nèi)部關(guān)聯(lián)、明確權(quán)益信息、實(shí)現(xiàn)開放資源與訂購(gòu)資源整合揭示三個(gè)方面提出NSTL開放獲取資源揭示方案,為下一步整合利用開放資源提供參考。
開放獲??;NSTL;組織揭示
開放資源已逐漸逼近主流學(xué)術(shù)資源,正在成為圖書館資源建設(shè)不可或缺的組成部分[1]。與傳統(tǒng)資源相比,開放獲取資源在出版形式、開放政策方面具有多樣性、動(dòng)態(tài)性的特點(diǎn),其物理分散性進(jìn)一步增加了圖書館對(duì)其進(jìn)行組織揭示和再利用的難度。如:開放協(xié)議不同導(dǎo)致的揭示層次不一,開放政策不穩(wěn)定,開放資源的元數(shù)據(jù)標(biāo)準(zhǔn)各異,數(shù)據(jù)接口不同,統(tǒng)一采集揭示難度較大等。因此,通過分析不同類型及來源開放資源的特征、元數(shù)據(jù)結(jié)構(gòu)等特點(diǎn),設(shè)計(jì)面向用戶信息發(fā)現(xiàn)的開放資源組織揭示方式,已成為開放資源建設(shè)研究的重要內(nèi)容。
傳統(tǒng)的資源組織主要包含了各種分類表或主題詞表,以及相應(yīng)的標(biāo)引規(guī)則系統(tǒng)等。開放資源的組織在傳統(tǒng)資源組織揭示的基礎(chǔ)上,還要考慮其多樣性、權(quán)益復(fù)雜性等特點(diǎn),進(jìn)行多層級(jí)的知識(shí)關(guān)聯(lián)揭示。
1.1開放資源類型的多樣性
開放資源與傳統(tǒng)印本文獻(xiàn)、訂購(gòu)網(wǎng)絡(luò)文獻(xiàn)相比,文獻(xiàn)類型更加豐富。除了期刊、圖書、會(huì)議論文、學(xué)位論文、科技報(bào)告等傳統(tǒng)資源類型外,還包括開放課程以及開放數(shù)據(jù)等。不同類型開放資源的描述元數(shù)據(jù)各不相同,如“學(xué)位”元數(shù)據(jù)是“學(xué)位論文”類型資源的特征屬性,對(duì)應(yīng)的屬性值是 “碩士”、“博士”等。開放資源除了類型多樣以外,還具有“視頻”、“音頻”、“程序”等多種數(shù)據(jù)格式以及“網(wǎng)絡(luò)”、“硬盤”等多種載體形態(tài),并且一個(gè)開放資源數(shù)據(jù)對(duì)象中往往是多種數(shù)據(jù)格式和載體形態(tài)的組合,如一篇學(xué)位論文中既有文本,又包括圖像和音視頻,并且可能還有網(wǎng)絡(luò)和硬盤等多種載體形態(tài)。
1.2開放資源組織的關(guān)聯(lián)性
隨著數(shù)字出版、結(jié)構(gòu)化出版、語義出版技術(shù)的普及,開放資源的信息組織越來越表現(xiàn)出細(xì)粒度、關(guān)聯(lián)化的特點(diǎn)。開放資源的數(shù)字出版對(duì)信息的組織揭示更多的從“一本書”、“一種期刊”深入到圖書章節(jié)、論文片段、一個(gè)圖表、引文等更加細(xì)粒度的“知識(shí)單元”,不同對(duì)象之間的包含、繼承、衍生等關(guān)系也更加復(fù)雜。此外,由于開放資源的動(dòng)態(tài)特性,訂購(gòu)資源可以轉(zhuǎn)換為開放資源,開放資源也可以轉(zhuǎn)換為訂購(gòu)資源,開放資源本身也有“關(guān)停并轉(zhuǎn)”,因此,不同開放資源類型之間、開放資源與訂購(gòu)資源之間的關(guān)聯(lián)揭示更為復(fù)雜。
1.3開放資源信息的可獲取性和使用權(quán)益的復(fù)雜性
可獲取性指可獲取的信息內(nèi)容、獲取方式、獲取時(shí)差等。開放資源可獲取的信息內(nèi)容包括元數(shù)據(jù)或不同版本的全文數(shù)據(jù);獲取方式包括人工下載或者提供標(biāo)準(zhǔn)API下載接口,也可分為閱讀、下載、分享等;獲取時(shí)差即是指即時(shí)開放獲取、延時(shí)開放獲取等獲取時(shí)間限制。除CC協(xié)議外,不同出版社對(duì)數(shù)據(jù)下載、使用的約定各不相同,這導(dǎo)致開放資源的權(quán)益問題更加復(fù)雜。“權(quán)益信息”是開放資源組織揭示中必須考慮的問題[2]。與傳統(tǒng)的訂購(gòu)資源不同,開放獲取資源的“可獲取信息內(nèi)容”、“獲取方式”、“獲取時(shí)差”、“獲取網(wǎng)址”、“權(quán)益信息”等屬性是開放資源的專有特征,對(duì)于用戶獲取和使用開放信息資源十分重要,也是開放資源信息揭示的對(duì)象。
開放資源主要的信息來源既包括開放獲取平臺(tái),如DOAJ、SciELO、BioMed Central、PMC等,也包括商業(yè)性數(shù)據(jù)庫(kù)平臺(tái),如Science Direct, SpringerLink和SpringerOpen等[3]。其中,DOAJ、PMC和Science Direct平臺(tái)在信息組織與資源揭示方面比較具有代表性,分別代表了開放獲取期刊集成網(wǎng)站、開放獲取資源數(shù)據(jù)庫(kù)、綜合性商業(yè)數(shù)據(jù)庫(kù)平臺(tái)三種類型。通過對(duì)三個(gè)平臺(tái)中開放資源的組織揭示分析,可以基本了解當(dāng)前開放資源平臺(tái)的信息組織特征及規(guī)律。三個(gè)平臺(tái)中資源組織的各個(gè)指標(biāo)對(duì)比分析結(jié)果見表1。
通過上述對(duì)比可知:Science Direct平臺(tái)整合了開放資源和訂購(gòu)資源,并擁有期刊的所有元數(shù)據(jù),能夠?qū)崿F(xiàn)統(tǒng)一檢索和發(fā)現(xiàn),在數(shù)據(jù)關(guān)聯(lián)性方面也做的較好。此外,Science Direct用不同圖標(biāo)標(biāo)識(shí)出了不同等級(jí)開放度及使用協(xié)議的文獻(xiàn),有利于用戶的發(fā)現(xiàn)和利用。PMC通過將開放資源與PubMed數(shù)據(jù)相關(guān)聯(lián),并且通過用戶定制的篩選功能來選擇不同資源。由于其文摘數(shù)據(jù)與PubMed/Medline共用,展現(xiàn)了強(qiáng)大的主題檢索、智能檢索功能。DOAJ雖然收錄了多學(xué)科、多語種、經(jīng)同行評(píng)議的學(xué)術(shù)OA期刊及其元數(shù)據(jù)信息,但由于期刊和論文的數(shù)據(jù)均由OA出版社提供,文摘、全文元數(shù)據(jù)完整性無法保障,只有60%的期刊能夠提供論文檢索。
2011年起,國(guó)家科技圖書文獻(xiàn)中心(NSTL)就啟動(dòng)了開放資源的采集、組織揭示與服務(wù)工作,但對(duì)開放資源揭示的層次僅限于資源名稱導(dǎo)航,不能提供檢索瀏覽、分面聚類以及個(gè)性化的基于社交網(wǎng)絡(luò)的信息服務(wù),并且尚未與NSTL的訂購(gòu)資源進(jìn)行整合,進(jìn)而為用戶提供一站式的資源發(fā)現(xiàn)服務(wù)。
表1 三個(gè)重要學(xué)術(shù)資源平臺(tái)中的開放資源信息組織揭示對(duì)比
隨著開放資源以及發(fā)現(xiàn)服務(wù)的蓬勃發(fā)展,為了向用戶提供便捷易用的開放資源和訂購(gòu)資源集成發(fā)現(xiàn)服務(wù),亟需結(jié)合NSTL本身的資源和服務(wù)特點(diǎn),設(shè)計(jì)并提出NSTL新的開放資源組織揭示框架,如圖1所示。
3.1增加資源關(guān)聯(lián),實(shí)現(xiàn)多粒度組織揭示
根據(jù)開放資源數(shù)字化的特點(diǎn),制定統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),以期刊論文、圖書章節(jié)、會(huì)議論文、科技報(bào)告、課件內(nèi)容作為開放資源信息揭示粒度,即以“單篇”為單位,描述信息的外部特征、內(nèi)容特征、開放信息特征、關(guān)聯(lián)信息屬性、管理信息屬性等,對(duì)于開放課件、開放會(huì)議、開放學(xué)位論文等資源,依據(jù)資源本身特點(diǎn),增加相應(yīng)的描述和管理元數(shù)據(jù),比如“課程使用對(duì)象”、“論文導(dǎo)師”、“會(huì)議舉辦者”等信息。提供更多瀏覽檢索、分面聚類、外部鏈接、知識(shí)發(fā)現(xiàn)功能,同時(shí)根據(jù)“讀圖時(shí)代”用戶需求特點(diǎn),可視化展示信息分布和檢索結(jié)果,提高系統(tǒng)的易用性。
圖1 NSTL開放資源組織揭示框架
通過細(xì)化信息揭示粒度,進(jìn)行跨類型資源關(guān)聯(lián)。比如“一篇期刊論文”與“一個(gè)圖書章節(jié)”可以因?yàn)椤爸黝}相關(guān)”或 “作者相關(guān)”建立關(guān)聯(lián),“會(huì)議論文”與“學(xué)術(shù)機(jī)構(gòu)”可以通過“會(huì)議主辦機(jī)構(gòu)”建立關(guān)聯(lián)。NSTL開放資源描述元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范課題組通過制定文獻(xiàn)品種的唯一標(biāo)識(shí)符以及開放資源“歷史信息”和“唯一標(biāo)識(shí)信息”的元數(shù)據(jù)描述,實(shí)現(xiàn)相同資源的唯一定位以及文獻(xiàn)出版過程中“母體信息”變更之間的關(guān)聯(lián),見圖1。
3.2重視開放資源權(quán)益信息,明確全文使用權(quán)限
首先,在元數(shù)據(jù)框架中即設(shè)立“使用權(quán)益”、“鏈接地址”信息等元數(shù)據(jù)內(nèi)容;其次,在數(shù)據(jù)采集過程中,采集開放資源的使用權(quán)益和鏈接地址,作為進(jìn)一步傳播利用這些開放資源的遵循依據(jù);最后,在結(jié)果展示和用戶服務(wù)界面,展示不同開放資源的使用權(quán)益信息,指導(dǎo)用戶“署名”使用、“非商業(yè)性”使用、“禁止演繹”使用和“相同方式共享”使用,既保護(hù)創(chuàng)作者和出版商的權(quán)益,又促進(jìn)開放資源的廣泛傳播和可持續(xù)利用[4]。
3.3實(shí)現(xiàn)開放資源與訂購(gòu)資源的整合揭示
兼容NSTL原有資源類型和元數(shù)據(jù)標(biāo)準(zhǔn),建立相關(guān)資源之間的關(guān)聯(lián)。NSTL已有的訂購(gòu)資源包括期刊、會(huì)議文集、科技報(bào)告等多種類型的文摘、引文以及通過原文傳遞服務(wù)獲取全文的印本館藏?,F(xiàn)在即將遴選加入的大量多種類型的開放獲取資源,將整合在統(tǒng)一平臺(tái)上。借鑒美國(guó)國(guó)立醫(yī)學(xué)圖書館開放資源倉(cāng)儲(chǔ)PMC的揭示方法,將訂購(gòu)資源和開放資源融為一體,提供統(tǒng)一的檢索入口。用戶在一個(gè)檢索平臺(tái)上即可一站式檢索“開放資源”和“訂購(gòu)資源”,統(tǒng)一獲得摘要和題錄,根據(jù)訂購(gòu)資源、免費(fèi)資源、開放資源等文獻(xiàn)來源的不同,分別通過“原文傳遞”、“直接全文鏈接”、“直接開放資源鏈接”三種方式獲得全文。
同時(shí)針對(duì)開放獲取資源,提供明確的信息標(biāo)識(shí)和方便的全文鏈接。在數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)上,既考慮NSTL原有的元數(shù)據(jù)標(biāo)準(zhǔn),又根據(jù)開放資源的特點(diǎn),擴(kuò)展相應(yīng)的“資源類型”、“使用權(quán)益”、“地址鏈接”、“數(shù)據(jù)管理”、“格式和載體”等元素,適應(yīng)開放資源揭示的特點(diǎn)和需求。
[1] 張曉林,李麟,劉細(xì)文. 開放獲取學(xué)術(shù)信息資源:逼近“主流化”轉(zhuǎn)折點(diǎn)[J].圖書情報(bào)工作, 2012,56(9):42-47.
[2] 許可協(xié)議說明[EB/OL][2015-08-04]. http://creativecommons.net.cn/ licenses/licenses_exp/2014-09-15.
[3] 開放資源建設(shè)操作指南[EB/OL][2015-08-04]. http://open-resources. las.ac.cn/drupal/?q=node/3025.
[4] 陳怡帆. 圖書館在開放獲取期刊再利用中的權(quán)益保障研究[D].北京:協(xié)和醫(yī)科大學(xué),2015.
葛紅梅,女,1979年生,研究方向:圖書館信息組織、圖書館元數(shù)據(jù)建設(shè)。
Research on the Ways of Organization and Revelation about NSTL Open Access Resource
REN HuiLing1, GE HongMei1, LIU Lei1, ZHAO Yan2
(1. Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100005, China;2. National Science Library of Chinese Academy of Sciences, Beijing 100190, China)
Open resource has become an important part of the construction of library resources, its dispersion, dynamic and diversity brings challenges for organization and revelation. This article analyzes the characteristics of open resource organization and revelation needs , draws lessons from domestic and international experience of the major scientific and technological information publishers, open storage and open information resources integrators on organizing and revealing open resource, combined with NSTL existing resources and information services infrastructure, from the three aspects of the increase in internal resources association, the clear of interest information, the achievement of the integration and revelation of open resource and subscription resources to propose reveal scheme of NSTL open access resources, in order to provide a reference for further integrate and use of open resource.
Open Access; NSTL; Organization and Revelation
G250
10.3772/j.issn.1673-2286.2015.08.005
任慧玲,女,1971年生,中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所研究館員,研究方向:信息資源建設(shè),E-mail:ren.huiling@imicams.ac.cn。
2015-08-04;編輯:雷雪)
* 本研究得到國(guó)家科技圖書文獻(xiàn)中心(NSTL)資助項(xiàng)目“NSTL開放資源描述元數(shù)據(jù)規(guī)范”資助。