黃金霞,彭媛媛,郭進(jìn)京,馬雨萌
(1.中國科學(xué)院文獻(xiàn)情報中心,北京 100190;2.中國科學(xué)院大學(xué),北京 100049;3.中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,北京 100005)
開放資源建設(shè)標(biāo)準(zhǔn)規(guī)范體系研究*
黃金霞1,2,彭媛媛1,2,郭進(jìn)京3,馬雨萌1
(1.中國科學(xué)院文獻(xiàn)情報中心,北京 100190;2.中國科學(xué)院大學(xué),北京 100049;3.中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,北京 100005)
開放獲取環(huán)境下,開放資源的類型與數(shù)量不斷增多,開放資源建設(shè)逐漸成為信息資源建設(shè)日常工作的重要組成部分。目前,國內(nèi)外針對開放資源建設(shè)的工作流程尚未制定相關(guān)標(biāo)準(zhǔn)、規(guī)范。本研究從國內(nèi)外開放資源建設(shè)實踐入手,在資源遴選評價、組織、互操作、再利用等方面對現(xiàn)有的標(biāo)準(zhǔn)規(guī)范進(jìn)行梳理與總結(jié)。在此基礎(chǔ)上,嘗試從開放資源建設(shè)業(yè)務(wù)流程角度構(gòu)建標(biāo)準(zhǔn)體系框架,就標(biāo)準(zhǔn)制定與應(yīng)用中可能出現(xiàn)的問題給出建議,以期為我國建立更全面、系統(tǒng)的開放資源建設(shè)標(biāo)準(zhǔn)框架提供參考借鑒。
開放資源;資源建設(shè);標(biāo)準(zhǔn)體系
近年來,開放獲?。∣pen Access,OA)運(yùn)動如火如荼,逐步成為人們關(guān)注的焦點。開放資源類型的范圍也逐漸擴(kuò)張,涵蓋期刊、圖書、學(xué)位論文、會議論文、報告、課件、視頻、圖片、數(shù)據(jù)集等多種類型。在OA運(yùn)動的影響下,出版商在保留傳統(tǒng)出版模式的同時,引入OA出版流程,致使開放資源的數(shù)量逐年攀升,呈井噴式增長。以中國的期刊論文為例,對Web of Science核心合集中近十年收錄的期刊論文數(shù)量進(jìn)行統(tǒng)計,發(fā)現(xiàn)截至2017年6月3日,OA期刊論文數(shù)量由2007年的1 985篇(占總量的1.04%)上升至2016年的45 764篇(占總量的23.93%)。然而,隨著開放資源數(shù)量的激增,開放資源在遴選與評價、組織與描述、再利用等建設(shè)與利用環(huán)節(jié)面臨的資源質(zhì)量參差不齊、使用權(quán)限不明、再利用程度模糊等諸多阻礙逐一凸顯,亟需提出適當(dāng)?shù)臉?biāo)準(zhǔn)規(guī)范加以約束、限制,以解決開放資源建設(shè)中存在的問題,支撐其向合理化、規(guī)范化不斷發(fā)展。
國內(nèi)外諸多標(biāo)準(zhǔn)制定與管理部門,如國際標(biāo)準(zhǔn)化委員會、國際圖書館協(xié)會聯(lián)合會(International Federation of Library Associations and Institutions,IFLA)、美國國家信息標(biāo)準(zhǔn)組織(National Information Standards Organization,NISO)、全國信息與文獻(xiàn)工作標(biāo)準(zhǔn)化技術(shù)委員會、全國圖書館標(biāo)準(zhǔn)化技術(shù)委員會等制定諸多信息資源相關(guān)的標(biāo)準(zhǔn)規(guī)范和指南,但多從資源的組織與描述、加工、保存與保護(hù)等方面進(jìn)行規(guī)范,針對開放資源建設(shè)規(guī)范的內(nèi)容較缺乏。目前,開放資源在建設(shè)過程中主要通過參照傳統(tǒng)資源建設(shè)的相關(guān)標(biāo)準(zhǔn),復(fù)用較為通用成熟的標(biāo)準(zhǔn)、協(xié)議,或各機(jī)構(gòu)單位根據(jù)需求自主修改相關(guān)規(guī)范,以實現(xiàn)開放資源的建設(shè)工作,具有一定的借鑒意義。本文通過對國內(nèi)外開放圖書、期刊、課件、圖片、數(shù)據(jù)集等資源建設(shè)情況進(jìn)行廣泛調(diào)研,發(fā)現(xiàn)近年來OA期刊發(fā)展較好,各種標(biāo)準(zhǔn)規(guī)范相對較多,在資源建設(shè)的各環(huán)節(jié)都具有一定的標(biāo)準(zhǔn),而其他類型的開放資源在大多數(shù)環(huán)節(jié)中規(guī)范內(nèi)容有所缺失。因而,本文所探討的開放資源是以O(shè)A期刊為研究主體與范例,總結(jié)梳理國內(nèi)外不同類型開放資源在建設(shè)中所制定的標(biāo)準(zhǔn)、規(guī)范、協(xié)議、指南與OA期刊的交叉之處;同時,將OA期刊未涉及的規(guī)范內(nèi)容進(jìn)行歸納、補(bǔ)充,并結(jié)合開放資源建設(shè)流程中涉及的重點內(nèi)容,嘗試提出面向各類開放資源都具有一定普適性、基礎(chǔ)性開放資源建設(shè)的標(biāo)準(zhǔn)規(guī)范體系,以期進(jìn)一步完善OA各環(huán)節(jié)標(biāo)準(zhǔn)化工作,為資源建設(shè)工作者及相關(guān)機(jī)構(gòu)提供參考借鑒,并促進(jìn)開放資源的可持續(xù)發(fā)展。
開放資源建設(shè)工作主要從采集、組織、保存、利用四個方面展開,而開放資源分布廣泛且數(shù)量龐大,實際利用時存在權(quán)益不明、標(biāo)準(zhǔn)不一等問題,以致國內(nèi)外相關(guān)機(jī)構(gòu)在進(jìn)行資源建設(shè)時提出許多規(guī)范文檔。在資源采集方面,相關(guān)機(jī)構(gòu)和平臺制定遴選與評價標(biāo)準(zhǔn),以便于明確資源的可用性;為使資源在檢索利用中便于操作,不同機(jī)構(gòu)依需自建元數(shù)據(jù)規(guī)范。在資源共享方面,科研機(jī)構(gòu)、圖書館與出版商之間通過提出某種互操作協(xié)議以共享數(shù)據(jù)資源的方式服務(wù)用戶。在資源再利用方面,依據(jù)開放知識共享協(xié)議有序開展資源利用。
OA出版勢頭正不斷擴(kuò)大,許多出版機(jī)構(gòu)逐步踐行OA出版理念,純OA期刊出版商也層出不窮,較為著名的有PLoS、Hindawi、J-STAGE等,PLoS旗下的PLoS One更是超大型期刊的代表。因此,在開放資源建設(shè)的資源采集階段,制定開放資源(尤其是OA期刊)綜合評價指標(biāo)體系十分必要。目前,國內(nèi)外相關(guān)機(jī)構(gòu)在開放資源采集中,主要針對OA期刊、開放獲取圖書建立相關(guān)遴選、評價機(jī)制。
國外相關(guān)機(jī)構(gòu)主要以德隆大學(xué)OA期刊目錄(Directory of Open Access Journals,DOAJ)提出的審查標(biāo)準(zhǔn)為主,部分機(jī)構(gòu)同時參考烏利希國際期刊指南中期刊的索引情況作進(jìn)一步判斷[1]。DOAJ制定有OA期刊評價原則,主要遵循由國際出版?zhèn)惱砼c道德委員會(Committee on Publication Ethics,COPE)、DOAJ、開放獲取學(xué)術(shù)出版商委員會(Open Access Scholarly Publishers Association,OASPA)、世界醫(yī)學(xué)編輯學(xué)會(World Association of Medical Editors,WAME)聯(lián)合發(fā)表的《學(xué)術(shù)出版透明原則與最佳實踐》[2]提出的審核、收錄OA期刊的基本條件(見表1),從OA期刊的研究范圍、訪問權(quán)限、質(zhì)量控制、期刊標(biāo)識符等方面進(jìn)行評價,以減少因期刊不規(guī)范而帶來的一系列問題。
表1 DOAJ期刊審查的標(biāo)準(zhǔn)
國內(nèi)率先提出OA期刊遴選標(biāo)準(zhǔn)的是中國科學(xué)院文獻(xiàn)情報中心開放資源建設(shè)團(tuán)隊GoOA項目組,隨后國家科技圖書文獻(xiàn)中心(National Science and Technology Library,NSTL)也制定了相關(guān)評價指標(biāo)。它們分別從期刊的影響力、權(quán)威性、開放程度等對OA期刊進(jìn)行評價,具體指標(biāo)包括:(1)考查OA期刊所在出版社是否為OASPA、COPE成員,是否在Beall出版商黑名單中(此黑名單官方網(wǎng)站已停止更新,該指標(biāo)現(xiàn)已停止使用);(2)考查OA期刊是否被DOAJ收錄;(3)通過影響因子、H5指數(shù)、SCIMAGO等作為OA期刊影響力的判斷指標(biāo)之一;(4)考查OA期刊的索引情況,以判斷期刊論文的權(quán)威性,主要根據(jù)烏利希國際期刊指南中OA期刊的收錄情況,輔以期刊網(wǎng)站上的索引信息;(5)以知識共享協(xié)議(Creative Commons,CC協(xié)議)再利用權(quán)限、機(jī)讀性、倉儲政策考察OA期刊開放程度。對各項指標(biāo)賦以權(quán)重計算,按分?jǐn)?shù)高低綜合評判OA期刊質(zhì)量。對于OA圖書的遴選,中國科學(xué)院文獻(xiàn)情報中心開放資源建設(shè)團(tuán)隊也提出初步評價標(biāo)準(zhǔn),以O(shè)A圖書本身的標(biāo)識符(DOI號、ISBN號)為基礎(chǔ)指標(biāo),通過圖書出版機(jī)構(gòu)、同行評議信息、版權(quán)聲明、使用許可等進(jìn)行具體、系統(tǒng)性的判斷。
從OA期刊遴選規(guī)則的制定與實踐看,國內(nèi)外OA期刊評價指標(biāo)主要分為三個方面,一是OA期刊本身研究領(lǐng)域、評議機(jī)制是否具有唯一標(biāo)識符,二是OA期刊被高影響力平臺收錄情況,三是OA期刊的使用限制與開放程度。評級指標(biāo)也有所差異。國外對期刊的評價較單一,大多將DOAJ和烏利希國際期刊指南作為評價OA期刊的兩項指標(biāo)。我國在對OA期刊的評價中,綜合各項指標(biāo)進(jìn)行考量,相對而言評價指標(biāo)較完善,可為開放資源建設(shè)標(biāo)準(zhǔn)體系的建立提供參考。
都柏林核心元數(shù)據(jù)(Dublin Core,DC)普遍應(yīng)用于信息組織,其定義了所有Web資源都應(yīng)遵循的通用核心標(biāo)準(zhǔn),因而許多元數(shù)據(jù)標(biāo)準(zhǔn)尤其是電子資源元數(shù)據(jù)標(biāo)準(zhǔn)都參照DC進(jìn)行制定與擴(kuò)展。2015年,美國信息標(biāo)準(zhǔn)化組織推出JATS(Journal Article Tag Suite)期刊文獻(xiàn)的元數(shù)據(jù)標(biāo)準(zhǔn)ANSI/NISO Z39.96-2015。由于該元數(shù)據(jù)描述字段較全面,對OA期刊元數(shù)據(jù)描述也較適用。如OA論文一站式發(fā)現(xiàn)平臺GoOA即應(yīng)用此標(biāo)準(zhǔn)中的相關(guān)元數(shù)據(jù)字段進(jìn)行資源組織;英國RIOXX(RIOXX Metadata Application Profile)項目也提出英國OA知識庫(Institutional Repository,IR)元數(shù)據(jù)指南,知識庫收錄的期刊、報告、演示文檔等資源的元數(shù)據(jù)都依其標(biāo)注,該指南在DC元素集基礎(chǔ)上增加項目編號(或基金號)和資助者姓名兩個元素,在支持IR間準(zhǔn)確檢索的同時,也可使項目資助者獲取受資助項目的有關(guān)論文。2015年1月,NISO發(fā)布關(guān)于開放資源的《獲取協(xié)議和指標(biāo)》(Access License and Indicators,NISO RP-22-2015),提出增加Free-to-read、licensereference兩個權(quán)益字段[3]。此后,該指南也納入這兩項字段,以豐富其元數(shù)據(jù)描述內(nèi)容。同時,該指南為開放資源元數(shù)據(jù)集提供使用意見參考項,將其分為選擇使用、推薦使用與強(qiáng)制使用(見表2)[4]。
制定開放資源,組織相關(guān)元數(shù)據(jù)標(biāo)準(zhǔn),應(yīng)從技術(shù)編碼元數(shù)據(jù)與資源描述元數(shù)據(jù)兩方面考慮,提出適用于所有類型開放資源所需的通用元數(shù)據(jù)集。同時,也可參照RIOXX對元數(shù)據(jù)使用情況進(jìn)行劃分,將開放元數(shù)據(jù)集分為必備元數(shù)據(jù)集、推薦元數(shù)據(jù)集、可選元數(shù)據(jù)集。通過比較不同元素集存在的差異,逐步完善標(biāo)準(zhǔn)制定工作。
表2 英國RIOXX項目元數(shù)據(jù)規(guī)范
資源發(fā)布前,通常需要對內(nèi)容進(jìn)行結(jié)構(gòu)化、關(guān)聯(lián)化、語義化的格式規(guī)范,通過結(jié)構(gòu)化的計算機(jī)可讀格式來表征內(nèi)容,以支持內(nèi)容的利用。如今,在OA倉儲資源的建設(shè)中,大多作品以PDF、html格式提供閱讀,以XML格式提供下載,并通過構(gòu)建信息結(jié)構(gòu)上下文之間、論文和數(shù)據(jù)之間、引用關(guān)系之間、知識單元之間的關(guān)聯(lián),對資源進(jìn)行統(tǒng)一管理,應(yīng)用某種互操作協(xié)議促進(jìn)開放資源的檢索與傳遞,其中較常用的開放資源互操作協(xié)議包括以下5種。
(1)OAI協(xié)議。國內(nèi)外組織機(jī)構(gòu)重點采用的開放資源互操作標(biāo)準(zhǔn)主要包括開放檔案信息系統(tǒng)參考模型、開放檔案元數(shù)據(jù)收集協(xié)議[5]。我國機(jī)構(gòu)知識庫在開放資源被專業(yè)搜索引擎收錄、擴(kuò)展資源檢索途徑時,多遵循開放檔案元數(shù)據(jù)收集協(xié)議。開放資源被搜索引擎收錄與索引,有助于提高開放資源的可見性和可發(fā)現(xiàn)性,促進(jìn)更廣范圍的共享。因此,開放資源一般都支持開放檔案元數(shù)據(jù)收集協(xié)議服務(wù)或者提供檢索接口,方便元數(shù)據(jù)收割和再利用。有些OA期刊除提供獲取元數(shù)據(jù)的標(biāo)準(zhǔn)接口外,還通過FTP或OAI服務(wù)來支持全文批量下載,以追求開放共享最大化。同時,還提供機(jī)器可讀的XML格式全文,便于機(jī)器分析和挖掘。而OA倉儲一般不提供全文或數(shù)據(jù)的批量下載[6]。
(2)應(yīng)用程序接口協(xié)議(Application Program Interface,API)。API協(xié)議是由惠普、英特爾、IBM、摩托羅拉、朗訊、Sun、Cadence和Mentor Graphics于1999年年底創(chuàng)建,為實現(xiàn)計算機(jī)軟件間相互通信而制定的標(biāo)準(zhǔn)規(guī)范。API協(xié)議提供通用數(shù)據(jù)功能集,以實現(xiàn)各平臺間的數(shù)據(jù)共享。
目前,OA期刊所提供的API功能日益豐富,除基本檢索接口外,BioMed Central還提供最新文章、編輯優(yōu)選文章、獲取文章權(quán)限驗證的各類API,PLoS提供文獻(xiàn)計量ALM API,可用于分析文章的影響力與價值。
(3)SWORD協(xié)議。SWORD協(xié)議(即內(nèi)容管理和互操作協(xié)議),支持自動將論文發(fā)布到相關(guān)機(jī)構(gòu)倉儲或?qū)W科倉儲,保證OA論文及時存儲到開放倉儲(如PMC、PubMed Central),同時還解決了研究人員的重復(fù)提交問題[7]。
(4)元數(shù)據(jù)編碼和傳輸標(biāo)準(zhǔn)(METS)。METS模式是用于編碼資源/數(shù)字對象相關(guān)的描述性元數(shù)據(jù)、管理性元數(shù)據(jù)、結(jié)構(gòu)性元數(shù)據(jù)的一項標(biāo)準(zhǔn),利用XML模式語言進(jìn)行表達(dá)[8]。該標(biāo)準(zhǔn)由美國國會圖書館網(wǎng)絡(luò)發(fā)展和MARC標(biāo)準(zhǔn)辦公室維護(hù),并且作為數(shù)字圖書館聯(lián)合會的倡議進(jìn)行開發(fā)。
新規(guī)則第二章“規(guī)范性引用文件”包括5個文件,具體分析新規(guī)則的各項條款,結(jié)合當(dāng)前歸檔工作的實際,強(qiáng)調(diào)這5個文件有其必要性與可行性。
(5)SUSHI協(xié)議(ANSI/NISO Z39.93-2014)。使用統(tǒng)計發(fā)布與互操作協(xié)議(SUSHI)(ANSI/NISO Z39.93-2014),即數(shù)據(jù)采集、傳遞的標(biāo)準(zhǔn)協(xié)議。其在OA倉儲描述層進(jìn)行資源類型整合,能更高效、方便地獲取開放資源種類與數(shù)量的統(tǒng)計數(shù)據(jù),使獲取的使用數(shù)據(jù)更具有可比性、可靠性和一致性。
國內(nèi)外機(jī)構(gòu)知識庫在進(jìn)行資源檢索、鏈接與傳遞中,OAI互操作協(xié)議的使用較普遍,但國外很多開放資源也提供API協(xié)議,進(jìn)行數(shù)據(jù)的獲取與交換。同時,SWORD、RSS/Atom feeds[9]、Shibboleth[10]、LDAP[11]/Active Directory[12]等在各機(jī)構(gòu)的規(guī)范指南都有提及。因此,有必要根據(jù)應(yīng)用情況找出幾種規(guī)范協(xié)議的不同之處,從而建立統(tǒng)一的技術(shù)標(biāo)準(zhǔn)。這有利于建立不同地區(qū)、國家、機(jī)構(gòu)間規(guī)范化的資源共享聯(lián)盟,實現(xiàn)多種數(shù)據(jù)交換,支持統(tǒng)一跨庫檢索,多方面為用戶提供數(shù)字化集成服務(wù);也可較大程度上控制建設(shè)資金的投入,還有利于實現(xiàn)機(jī)構(gòu)知識庫建設(shè)過程中的規(guī)范化以及資源形式的統(tǒng)一標(biāo)準(zhǔn)化,并及時發(fā)現(xiàn)建設(shè)過程中存在的問題。
國內(nèi)外廣泛使用的開放資源再利用指導(dǎo)文件是CC協(xié)議,根據(jù)CC協(xié)議中的不同使用許可,可以對文章的內(nèi)容進(jìn)行再組織、演繹、再利用等。開放資源的使用許可協(xié)議除CC協(xié)議外,還包括美國建國者著作權(quán)、特別取樣授權(quán)、非商業(yè)特別取樣授權(quán)、開放數(shù)據(jù)公共領(lǐng)域的貢獻(xiàn)與許可、開放數(shù)據(jù)共享署名許可(ODC-BY)等。其中,開放數(shù)據(jù)協(xié)議是用來查詢和更新數(shù)據(jù)的一種Web協(xié)議,對存儲于應(yīng)用程序中的數(shù)據(jù)進(jìn)行展示。此外,還包括開放出版許可協(xié)議、開放內(nèi)容許可協(xié)議。在開放內(nèi)容領(lǐng)域有《EFF開放音頻許可協(xié)議》及《Ethymonics自由音樂許可協(xié)議》。
從開放出版角度看,CC協(xié)議是出版機(jī)構(gòu)采用的主流協(xié)議,也有部分出版商自主制定使用協(xié)議,同一本期刊中的作品也可能遵循不同的使用協(xié)議。如Wiley作品版權(quán)屬于作者,根據(jù)文章資助對象不同,出版商提供CC協(xié)議供作者選擇;Elsevier提供CC-BY4.0、CC-BYNC-ND4.0和自主制定的User License。版權(quán)和使用協(xié)議信息,通常體現(xiàn)在資源的元數(shù)據(jù)中,出版商提供的元數(shù)據(jù)未能完全體現(xiàn)這些數(shù)據(jù)。開放出版資助項目中,“高能物理期刊開放出版聯(lián)盟資助計劃(SCOAP3)”規(guī)定以O(shè)A形式出版的文章,在開放訪問的同時版權(quán)歸屬于作者,在遵循CC-BY許可協(xié)議下[13],允許對資源進(jìn)行文本挖掘和數(shù)據(jù)挖掘;英國研究理事會全部或部分資助的發(fā)表在同行評議期刊和會議錄上的論文最終版本,采用CC-BY許可立刻開放獲取,并授權(quán)任何人可以再利用(包括商業(yè)組織)[14]。
根據(jù)調(diào)研結(jié)果可見,許多類型開放資源都具有再利用協(xié)議,CC協(xié)議應(yīng)用甚廣。從資源建設(shè)角度看,是否可以對開放資源進(jìn)行數(shù)據(jù)挖掘是需要探討和明確的關(guān)鍵。因此,在構(gòu)建開放資源使用標(biāo)準(zhǔn)中,在明確知識產(chǎn)權(quán)(尤其是版權(quán))的限定條件下,有必要從開放資源的閱讀、下載、作品演繹、數(shù)據(jù)挖掘與文本挖掘等多方因素綜合考量,以保證尊重作品知識產(chǎn)權(quán)為前提,最大程度滿足用戶需求。
根據(jù)開放資源建設(shè)實踐中標(biāo)準(zhǔn)規(guī)范的調(diào)研情況,借鑒國內(nèi)外相關(guān)標(biāo)準(zhǔn)及標(biāo)準(zhǔn)體系的構(gòu)建原則與經(jīng)驗,結(jié)合開放資源建設(shè)工作中的需求與不明確之處,本文擬定從開放資源建設(shè)的業(yè)務(wù)工作流程入手,提出以資源的采集標(biāo)準(zhǔn)、組織標(biāo)準(zhǔn)、保存標(biāo)準(zhǔn)與利用標(biāo)準(zhǔn)為主體的開放資源建設(shè)標(biāo)準(zhǔn)體系框架(見圖1)。
圖1 開放資源建設(shè)標(biāo)準(zhǔn)體系框架
采集標(biāo)準(zhǔn)是資源建設(shè)標(biāo)準(zhǔn)體系的基礎(chǔ),是獲得有價值、高質(zhì)量資源的重要保證,是開展知識服務(wù)的先決條件。在采集標(biāo)準(zhǔn)部分,首先需要明確在開放資源的采集過程中是否可以進(jìn)行數(shù)據(jù)的批量下載處理,是否可以使用機(jī)器爬蟲對各類開放資源網(wǎng)站的數(shù)據(jù)進(jìn)行抓取,如果允許此類操作,則需對限定條件、數(shù)據(jù)用途等內(nèi)容進(jìn)行規(guī)范說明;其次,對采集到的資源進(jìn)行遴選與評價。在現(xiàn)有開放資源建設(shè)工作實踐中,OA期刊、OA圖書的遴選評價機(jī)制已有相對完善的規(guī)范文檔。如DOAJ制定的從OA期刊的研究范圍、訪問權(quán)限、質(zhì)量、期刊標(biāo)識符等方面進(jìn)行評價的標(biāo)準(zhǔn);中國科學(xué)院文獻(xiàn)情報中心開放資源建設(shè)團(tuán)隊GoOA項目組提出的從期刊影響力、權(quán)威性、開放程度等方面進(jìn)行OA期刊遴選的標(biāo)準(zhǔn);NSTL制定的《開放資源遴選與評價應(yīng)用規(guī)范》主要從質(zhì)量和影響力、開放度兩個角度進(jìn)行量化評價,涵蓋OA期刊、OA圖書、OA會議、OA科技報告、OA學(xué)位論文、OA課件等多種資源類型。在確定開放資源采集標(biāo)準(zhǔn)時,可參照上述已有標(biāo)準(zhǔn),結(jié)合自身需求和資源類型,從資源的質(zhì)量和影響力、開放度等角度對評價標(biāo)準(zhǔn)進(jìn)行擴(kuò)展。
組織標(biāo)準(zhǔn)是開放資源建設(shè)標(biāo)準(zhǔn)體系中的關(guān)鍵部分,從內(nèi)容、結(jié)構(gòu)、存儲空間等方面對資源加以組織,以便于資源管理、傳輸與共享,具體包括著錄標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)加工標(biāo)準(zhǔn)、開放倉儲標(biāo)準(zhǔn)以及檢索標(biāo)準(zhǔn)五個模塊。要對開放資源進(jìn)行方便快捷的檢索使用,著錄規(guī)則和元數(shù)據(jù)字段的描述必不可少。數(shù)據(jù)資源以何種方式進(jìn)行組織加工,也是需要關(guān)注的問題。目前,開放資源的組織標(biāo)準(zhǔn)以元數(shù)據(jù)標(biāo)準(zhǔn)居多,存儲開放資源的倉儲庫、集成平臺所復(fù)用、自建資源描述標(biāo)準(zhǔn)不一,資源檢索條件也不盡相同。在實踐工作中,可將用戶需求與體驗作為制定資源組織標(biāo)準(zhǔn)規(guī)范具體內(nèi)容的參照,如在制定著錄標(biāo)準(zhǔn)時,充分考慮不同學(xué)科領(lǐng)域用戶對不同類型資源的需求,除文檔本身外,將PPT、圖片、數(shù)據(jù)集、音視頻等附件資源的著錄也納入考慮,以實現(xiàn)人本主義理念。
保存標(biāo)準(zhǔn)應(yīng)從資源的存儲位置、版本規(guī)范以及具體文檔格式入手。開放資源的存儲位置眾多,如OA圖書可存儲于出版商網(wǎng)站、社交媒體平臺、作者的個人機(jī)構(gòu)庫或博客等;OA期刊集成平臺眾多,平臺的建設(shè)者可能是私人、企業(yè)、科研機(jī)構(gòu)、出版商等;OA會議論文多集中存儲于各大會議舉辦方的服務(wù)平臺??傊瑹o論是遵循“金色OA”或“綠色OA”的實現(xiàn)模式,開放資源都能匯入某“倉儲庫”進(jìn)行保存,因而有必要對這類開放倉儲平臺的資源存儲政策進(jìn)行規(guī)范。同時,開放資源有發(fā)布預(yù)版本的權(quán)利與特點,同一資源的不同版本會使系統(tǒng)在資源組織、構(gòu)建相互關(guān)聯(lián)時造成阻礙,進(jìn)行版本規(guī)范處理有利于解決組織流程中存在的困難,便于著錄、管理與廣泛使用。
資源利用是資源建設(shè)的終極目標(biāo),是滿足用戶需求的最顯著標(biāo)志。因此,構(gòu)建資源利用標(biāo)準(zhǔn)的原則應(yīng)基于版權(quán)所規(guī)定的資源合理使用范疇,盡可能最大限度地拓展其使用權(quán)限,服務(wù)于大眾。本研究初步構(gòu)想該部分標(biāo)準(zhǔn)可包括互操作標(biāo)準(zhǔn)、內(nèi)容使用許可規(guī)范、作品附件(封面圖片、圖表、數(shù)據(jù)集等)使用標(biāo)準(zhǔn)、文本/數(shù)據(jù)挖掘標(biāo)準(zhǔn)四個部分。由互聯(lián)網(wǎng)文件傳輸而產(chǎn)生的互操作協(xié)議眾多,在開放資源共享過程中使用的互操作協(xié)議也根據(jù)不同資源提供方的使用意愿而存在差異。規(guī)范互操作標(biāo)準(zhǔn)時,可依據(jù)已相對成熟的OAI協(xié)議、API協(xié)議等,再針對不同資源的共享需求,完善總體標(biāo)準(zhǔn)內(nèi)容。關(guān)于開放資源內(nèi)容的使用許可,以CC協(xié)議為主流使用許可協(xié)議,可以此協(xié)議內(nèi)容與實踐反饋為基準(zhǔn),建立正式的內(nèi)容使用許可。文本/數(shù)據(jù)挖掘是深層次利用資源的方法和途徑,制定統(tǒng)一的標(biāo)準(zhǔn)可規(guī)范數(shù)據(jù)挖掘的工具開發(fā)過程、方法、接口等。在制定文本/數(shù)據(jù)挖掘標(biāo)準(zhǔn)過程中,應(yīng)參照現(xiàn)有過程標(biāo)準(zhǔn)(如CRISP-DM、Fayyad過程標(biāo)準(zhǔn))、接口標(biāo)準(zhǔn)(如API接口標(biāo)準(zhǔn))、語言標(biāo)準(zhǔn)(如DMQL、MSQL、PMML、OLE DB for DM等)和網(wǎng)絡(luò)標(biāo)準(zhǔn)(如XMLA、Semantic Web等)[15],結(jié)合使用許可等標(biāo)準(zhǔn),制定較為完善和通用的文本/數(shù)據(jù)挖掘標(biāo)準(zhǔn)。
(1)兼容并包,多主體參與標(biāo)準(zhǔn)建設(shè)工作。由于國內(nèi)外從事開放資源建設(shè)工作的主體具有多樣性,在制定標(biāo)準(zhǔn)體系與具體標(biāo)準(zhǔn)內(nèi)容時,建議采取自上而下的方式,由國家和行業(yè)標(biāo)準(zhǔn)制定機(jī)構(gòu)(如文化部、中國文獻(xiàn)工作標(biāo)準(zhǔn)化技術(shù)委員會、全國圖書館標(biāo)準(zhǔn)化技術(shù)委員會等)牽頭,以圖書館、信息服務(wù)機(jī)構(gòu)共同參與、協(xié)作的方式制定統(tǒng)一的標(biāo)準(zhǔn)規(guī)范體系框架,指導(dǎo)相關(guān)參與主體分工制定各部分標(biāo)準(zhǔn)規(guī)范。對公益性開放資源建設(shè)機(jī)構(gòu)(如圖書館、科研機(jī)構(gòu)等)而言,其在資源采集、組織方面經(jīng)驗更豐富,可根據(jù)工作內(nèi)容先行制定標(biāo)準(zhǔn)規(guī)范;在標(biāo)準(zhǔn)規(guī)范制定過程中,保證與國際通用標(biāo)準(zhǔn)的對接;對于免費(fèi)/商業(yè)性開放資源建設(shè)平臺,在掌握市場需求的同時,明確資源利用的供需關(guān)系,在遵循知識作品版權(quán)管理規(guī)定的前提下,可參與開放資源利用標(biāo)準(zhǔn)的籌劃。通過圖書館、信息服務(wù)機(jī)構(gòu)對標(biāo)準(zhǔn)的推廣,逐步推動國家或行業(yè)標(biāo)準(zhǔn)的建立。
(2)集思廣益,審核與修正具體標(biāo)準(zhǔn)內(nèi)容。建立開放資源標(biāo)準(zhǔn)的具體內(nèi)容時可參考IFLA標(biāo)準(zhǔn)制定與管理部門在標(biāo)準(zhǔn)提出、制定時的相關(guān)流程,主要包括標(biāo)準(zhǔn)申請、標(biāo)準(zhǔn)審查、標(biāo)準(zhǔn)內(nèi)容意向書、召開討論會議收集意見,以及制定、實施、監(jiān)督和修訂標(biāo)準(zhǔn)[16]。在標(biāo)準(zhǔn)制定前期,應(yīng)充分調(diào)研與該標(biāo)準(zhǔn)內(nèi)容相關(guān)的實踐規(guī)范,使制定的標(biāo)準(zhǔn)內(nèi)容盡量遵循全面系統(tǒng)、協(xié)調(diào)一致、多方兼容的原則。在確定標(biāo)準(zhǔn)體系以及具體標(biāo)準(zhǔn)的內(nèi)容后,先召集標(biāo)準(zhǔn)建設(shè)工作的各方主體,共同探討標(biāo)準(zhǔn)的完整性與兼容性,并確定具體實踐的若干試點機(jī)構(gòu)。在標(biāo)準(zhǔn)實施后,定期跟蹤標(biāo)準(zhǔn)實踐機(jī)構(gòu),收集標(biāo)準(zhǔn)內(nèi)容在實際工作中的不適用或無可參照之處,針對具體內(nèi)容組織專家研討,進(jìn)一步修正、審查與評估。這部分也可參見IFLA相關(guān)部門的處理辦法,對標(biāo)準(zhǔn)采取審查、修正制度,在標(biāo)準(zhǔn)制定委員會的成員基礎(chǔ)上,邀請各學(xué)科領(lǐng)域的專業(yè)學(xué)者(不同領(lǐng)域?qū)Y源組織與需求有所不同)參與討論,以使補(bǔ)充、修正的內(nèi)容更適用于全學(xué)科的需求。
(3)注重實踐,確立適于國情的標(biāo)準(zhǔn)體系。開放資源標(biāo)準(zhǔn)本質(zhì)是有意識地對開放資源建設(shè)整體工作流程的規(guī)范,不僅要考慮標(biāo)準(zhǔn)化工作的全面性,還要考慮標(biāo)準(zhǔn)工作的系統(tǒng)性。從整體情況看,我國開放資源建設(shè)還處在資源遴選、采集、集成階段,當(dāng)前最緊迫的是制定統(tǒng)一的資源遴選與評價標(biāo)準(zhǔn),具體可參照中國科學(xué)院文獻(xiàn)情報中心開放資源建設(shè)團(tuán)隊GoOA項目組和NSTL制定的相關(guān)評價標(biāo)準(zhǔn);采集的數(shù)據(jù),可采用JATS期刊文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)(ANSI/NISO Z39.96-2015)、英國RIOXX項目元數(shù)據(jù)規(guī)范進(jìn)行組織和描述;互操作過程可采用開放檔案元數(shù)據(jù)收集協(xié)議、API協(xié)議等進(jìn)行資源獲取與交換;再利用過程可采用CC協(xié)議作為標(biāo)準(zhǔn)規(guī)范,對開放資源的內(nèi)容進(jìn)行再組織、演繹、再利用等。
目前,開放資源建設(shè)過程中復(fù)用、修改了許多現(xiàn)行標(biāo)準(zhǔn),涉及資源建設(shè)的多個方面,但其真正的標(biāo)準(zhǔn)體系尚未完備。構(gòu)建開放資源建設(shè)標(biāo)準(zhǔn)體系框架的本質(zhì),即有意識地對開放資源建設(shè)的整體工作流程進(jìn)行規(guī)范,從覆蓋全流程的整體性、全面性加以考慮的同時,也要注重制定標(biāo)準(zhǔn)規(guī)劃的系統(tǒng)性原則,進(jìn)而形成行之有效的審查機(jī)制,以適應(yīng)標(biāo)準(zhǔn)形成后可能出現(xiàn)的諸多問題。開放資源建設(shè)標(biāo)準(zhǔn)規(guī)范的建立是一項長期而重要的任務(wù),未來開放資源在建設(shè)過程中可能會出現(xiàn)更多的需要明確、規(guī)范的內(nèi)容,其標(biāo)準(zhǔn)體系也具有進(jìn)一步延伸的可能性,需要在理論研究的基礎(chǔ)上,結(jié)合實踐工作不斷完善標(biāo)準(zhǔn)體系。本文為標(biāo)準(zhǔn)制定與管理部門提供思路,但仍存在一定不足,如對開放資源的討論沒有覆蓋到所有類別;標(biāo)準(zhǔn)體系的建設(shè)尚處于初級階段,未投入實踐;對標(biāo)準(zhǔn)的可持續(xù)性無法把握等,有待進(jìn)一步深入探討與研究。
[1]Quality open access market-in search for open access publishing standards[EB/OL].[2017-05-20].http://openscience.com/qualityopen-access-market-search-open-access-publishing-standards/.
[2]REDHEAD C.Principles of transparency and best practice in scholarly publishing[EB/OL].(2013-12-19)[2017-05-20].https://oaspa.org/principles-of-transparency-and-best-practice-in-scholarlypublishing/.
[3]Institutional repositories:ensuring your IR is populated, useful and thriving[EB/OL].[2017-04-18].http://www.niso.org/news/events/2017/2017_virtconf/feb15_virtconf/.
[4]UK metadata guidelines for open access repositories[EB/OL].[2017-04-13].http://rioxx.net/guidelines/RIOXX_Metadata_Guidel ines_v_3.0.pdf.
[5]Open Archives Initiative(OAI)[EB/OL].[2017-05-20].http://www.openarchives.org/.
[6]王昉,黃永文,馬建玲,等.開放資源互操作框架研究[J].圖書情報工作,2013(11):24-31.
[7]Digital Repositories infoKit[EB/OL].[2017-05-22].http://tools.jiscinfonet.ac.uk/downloads/repositories/digital-repositories.pdf.
[8]METS.Metadata encoding and transmission standard[EB/OL].[2017-04-18].http://www.loc.gov/standards/mets.
[9]RSS/Atom feeds[EB/OL].[2017-04-13].http://en.wikipedia.org/wiki/RSS_%28file_format%29.
[10]Shibboleth[EB/OL].[2017-04-13].http://en.wikipedia.org/wiki/Shibboleth_%28Internet2%29.
[11]Lightweight directory access protocol[EB/OL].[2017-04-13].http://en.wikipedia.org/wiki/Lightweight_Directory_Access_Protocol.[12]Active directory[EB/OL].[2017-04-13].http://en.wikipedia.org/wiki/Active_Directory.
[13]SCOAP3-sponsoring consortium for open access publishing in particle physics[EB/OL].[2017-05-20].http://www.sdu.dk/en/bibliotek/materialer/elektroniske+tidsskrifter/open+access/scoap3.
[14]張曉林,李麟,顧立平,等.從SCOAP3模式看圖書館資源建設(shè)的范式轉(zhuǎn)變[J].圖書情報工作,2012(9):42-47.
[15]劉明亮,李雄飛,孫濤,等.數(shù)據(jù)挖掘技術(shù)標(biāo)準(zhǔn)綜述[J].計算機(jī)科學(xué),2008,35(6):5-10,14.
[16]IFLA standards procedures manual[EB/OL].[2017-04-13].http://www.ifla.org/node/8719.
Research on Standard System of Open Resource Construction
HUANG JinXia1,2, PENG YuanYuan1,2, GUO JinJing3, MA YuMeng1
(1.National Science Library Chinese Academy of Sciences, Beijing 100190, China; 2. University of Chinese Academy of Sciences, Beijing 100049, China;3.Institute of Medical Information/Medical Library, CAMS & PUMC, Beijing 100005, China)
In the open information environment, the type and quantity of open resources are increasing, the construction of open resources has gradually become an important part of the daily work of information resources construction. However, there is no clear standard for the construction of open resources. Based on the investigation of open resources construction practical work at home and abroad, this paper summarizes the normative operation in the work, puts forward the preliminary framework of the standard system according to the operating process of open resource construction, and gives suggestions on the possible problems in the process of the standard formulation and application, to provide reference for building a more comprehensive system standard framework.
Open Resource; Resource Construction; Standard System
G250
10.3772/j.issn.1673-2286.2017.09.001
* 本研究得到中國科學(xué)院項目“開放知識資源中心體系建設(shè)(二期)”(編號:院1755)資助。
黃金霞,女,1972年生,博士,副研究館員,研究方向:信息資源組織與建設(shè)、開放資源建設(shè),E-mail:huangjx@mail.las.ac.cn。
彭媛媛,女,1993年生,碩士研究生,研究方向:開放資源建設(shè)、數(shù)據(jù)評價,E-mail:pengyuanyuan@mail.las.ac.cn。
郭進(jìn)京,男,1991年生,碩士,助理館員,研究方向:信息資源組織與建設(shè),E-mail:guo.jinjing@imicams.ac.cn。
馬雨萌,女,1989年生,碩士,助理館員,研究方向:開放資源建設(shè),E-mail:mayumeng@mail.las.ac.cn。
2017-08-09)