■歐陽崢崢 青秀玲 顧立平 王 輝 吳 鳴
中國科學(xué)院文獻情報中心,北京中關(guān)村北四環(huán)西路33號 100190
伴隨著數(shù)據(jù)密集型科研活動的蓬勃發(fā)展,有一種活動愈來愈受重視——支撐關(guān)鍵發(fā)現(xiàn)的數(shù)據(jù)被更多的人訪問,從而促進了數(shù)據(jù)的進一步分析以及結(jié)果的驗證[1-2]。科學(xué)數(shù)據(jù)不僅僅是被研究的對象,其作為科研活動的主要產(chǎn)品“first class products”已經(jīng)得到認可[3-4]。在此環(huán)境下,數(shù)據(jù)期刊(data journal)也快速發(fā)展起來。尤其是近年來,除開放獲取出版商Biomed Central推出了數(shù)據(jù)期刊BMC Research Notes外,許多大型傳統(tǒng)出版社也相繼推出了數(shù)據(jù)期刊。如施普林格集團于2012年推出的SpringerPlus,是一本跨學(xué)科的綜合性開放獲取期刊,其出版對象為原創(chuàng)研究、典型案例研究和研究方法的描述性文檔以及數(shù)據(jù)論文和大數(shù)據(jù)集;Wiley集團于2012年推出了Geoscience Data Journal,用于發(fā)表地球科學(xué)數(shù)據(jù)論文,并通過數(shù)字對象標(biāo)識符(DOI)將數(shù)據(jù)論文與存放在數(shù)據(jù)知識庫中的數(shù)據(jù)集關(guān)聯(lián)起來;自然出版集團2014年出版的Scientific Data旨在幫助科研人員發(fā)布、發(fā)現(xiàn)和重用研究數(shù)據(jù),該雜志中一個重要的文章類型是“數(shù)據(jù)描述”(Data Descriptor),用于描述有科學(xué)價值的數(shù)據(jù)集,并幫助作者出版有科學(xué)價值和可重用性的數(shù)據(jù)集。在國內(nèi)關(guān)于數(shù)據(jù)出版的研究中,劉鳳紅等人對數(shù)據(jù)論文的產(chǎn)生背景、概念、權(quán)益管理等問題進行了探討,并提到了兩種典型的數(shù)據(jù)期刊[5]。本文則對現(xiàn)有的數(shù)據(jù)期刊進行了調(diào)研,遴選部分具有代表性的數(shù)據(jù)期刊,分析了數(shù)據(jù)期刊的學(xué)科屬性、出版方式、收錄內(nèi)容、引用機制、版權(quán)協(xié)議、費用等特點,指出了數(shù)據(jù)期刊的優(yōu)勢和面臨的挑戰(zhàn)。
數(shù)據(jù)期刊大致可分為兩種,一種是純粹的數(shù)據(jù)期刊,其出版對象全部為數(shù)據(jù)論文,如 Scientific Data、Earth System Science Data、Open Health Data等;另一種是綜合性的數(shù)據(jù)期刊,出版數(shù)據(jù)論文的同時也出版綜述、研究論文、會議報告等其他類型的文獻, 如 SpringerPlus,Biodiversity Data Journal,GigaScience等。而數(shù)據(jù)論文(data paper)是指按照學(xué)術(shù)規(guī)范正式出版的,可被檢索的元數(shù)據(jù)文件,用以描述單個或一組可在線訪問的數(shù)據(jù)集[6]。數(shù)據(jù)論文的內(nèi)容主要是對數(shù)據(jù)采集、獲取、處理等過程和方法的描述,不涉及對數(shù)據(jù)和研究結(jié)果的分析、推論、發(fā)現(xiàn)以及假設(shè)論證,其目的是讓科研群體更好地發(fā)現(xiàn)、獲取、理解與復(fù)用數(shù)據(jù),并再次進行科研創(chuàng)新[7-8]。本文參考Dyrad網(wǎng)站[9]的線索,核實和總結(jié)國際上已經(jīng)開展數(shù)據(jù)出版的期刊共85種(網(wǎng)站更新日期2014-10-10),調(diào)研了15種目前正式出版的數(shù)據(jù)期刊,如表1所示。
所調(diào)研的數(shù)據(jù)期刊,均有代表性,例如:BioMed Central出版社在2008年較早進行了探索性試驗,出版了開放獲取期刊BMC Research Notes等,而國際著名學(xué)術(shù)出版商 Springer、Nature、Wiley、Elsevier等也隨后紛紛推出了數(shù)據(jù)期刊。從數(shù)據(jù)期刊出現(xiàn)的時間可以看出,自2012年起數(shù)據(jù)期刊進入發(fā)展高峰期。在開放獲取的數(shù)據(jù)期刊中,尤以SpringerPlus、F1000 Research、BMCResearch Notes等出版了大量的數(shù)據(jù)論文。
表1 國際重要數(shù)據(jù)期刊的基本信息
本文對調(diào)研的15種期刊從學(xué)科屬性、出版方式、收錄內(nèi)容要求、引用機制、版權(quán)協(xié)議、費用等方面進行分析。
生命科學(xué)領(lǐng)域(含醫(yī)學(xué))的數(shù)據(jù)期刊發(fā)展較早,期刊種類較多,比較著名的數(shù)據(jù)期刊共有6種,分別是 Genomics Data、BMC Research Notes、F1000 Research、GigaScience[13]、Open Health Data和Biodiversity Data Journal。屬于地球科學(xué)的數(shù)據(jù)期刊有Earth System Science Data和Geoscience Data Journal等。其它學(xué)科類別的數(shù)據(jù)期刊還包括生態(tài)學(xué)、心理學(xué)、計算機科學(xué)以及考古學(xué)等。數(shù)據(jù)期刊也有包含多個學(xué)科的綜合性期刊,比較著名的有三種,分別是Scientific Data、Dataset Papers in Science以及 SpringerPlus等。劉峰等人對databib上注冊的數(shù)據(jù)知識庫進行了學(xué)科屬性分析,發(fā)現(xiàn)生物學(xué)方面的數(shù)據(jù)知識庫數(shù)量最多[25],這可能是生命科學(xué)領(lǐng)域數(shù)據(jù)期刊發(fā)展較快的原因之一。從出版數(shù)據(jù)論文的時間來看,生態(tài)學(xué)期刊Ecology早在1999年就開始出版數(shù)據(jù)論文。該刊的數(shù)據(jù)論文作為一種特有的論文形式(data paper欄目),用以發(fā)表該領(lǐng)域的大數(shù)據(jù)集以及描述大數(shù)據(jù)集內(nèi)容、背景、結(jié)構(gòu)、質(zhì)量的元數(shù)據(jù)信息。地球?qū)W科的數(shù)據(jù)期刊出版形式均為數(shù)據(jù)論文,其中2009年正式出版的Earth System Science Data發(fā)表數(shù)據(jù)論文的數(shù)量最多。
當(dāng)前國際重要數(shù)據(jù)期刊普遍采取開放獲取的方式正式出版(期刊Ecology雖然不是開放獲取期刊,但其所有數(shù)據(jù)論文均可在線獲?。员阌诳茖W(xué)數(shù)據(jù)最大程度的傳播和復(fù)用。在筆者所調(diào)查的數(shù)據(jù)期刊中,均采用同行評審機制,以保證期刊內(nèi)容的質(zhì)量以及可用性。與傳統(tǒng)的期刊不同,大部分數(shù)據(jù)期刊僅以在線的方式出版(E-On1y),少數(shù)期刊同時發(fā)行了紙本和電子版。而在出版周期上,若干數(shù)據(jù)期刊打破了按年、季、月、周等固定周期出版的模式,作者的數(shù)據(jù)論文只要通過同行評審,即可隨時在線發(fā)表,筆者整理如表2所示。
表2 國際重要數(shù)據(jù)期刊的比較
從數(shù)據(jù)期刊收錄的內(nèi)容和范圍看,以數(shù)據(jù)論文為主要形式的期刊,即使有少數(shù)其他類型的文章,其內(nèi)容也與數(shù)據(jù)處理、數(shù)據(jù)服務(wù)等相關(guān)。如GigaScience主要發(fā)表數(shù)據(jù)文獻和一些介紹云計算、大數(shù)據(jù)領(lǐng)域軟件與工具的文章;而Geoscience Data Journal主要發(fā)表數(shù)據(jù)論文以及關(guān)于數(shù)據(jù)服務(wù)和數(shù)據(jù)出版最佳實踐的文章。另一類以數(shù)據(jù)論文作為子欄目之一的期刊,其收錄范圍除了數(shù)據(jù)論文外,還包括綜述、研究論文、臨床實驗文章、觀察文章、觀點文章、研究記錄、案例報告等,最具代表性的如BMC Research Notes、F1000 Research、SpringerPlus等。
從數(shù)據(jù)來源看,大部分期刊中數(shù)據(jù)論文的來源既可以是對已發(fā)表論文中數(shù)據(jù)的說明描述,也可以是對新產(chǎn)生數(shù)據(jù)的說明描述。當(dāng)數(shù)據(jù)集較大時,需要先到指定或者推薦的數(shù)據(jù)知識庫上將數(shù)據(jù)集注冊,并將注冊后的鏈接、標(biāo)識符、元數(shù)據(jù)等信息放到數(shù)據(jù)論文中。存放數(shù)據(jù)集的數(shù)據(jù)知識庫也必須具有開放共享性質(zhì),以保證數(shù)據(jù)集隨時能夠被訪問和獲取。此外,有的期刊還開發(fā)了自己的數(shù)據(jù)知識庫,如GigaScience期刊中的數(shù)據(jù)集存放在該出版社開發(fā)的Giga DB數(shù)據(jù)知識庫[26]中。這些具體要求,筆者整理如表3所示。
所有期刊都有明確的引用要求,并給出了引用示例。如Nature出版的Scientific Data,其引用格式包含作者、題目、期刊、卷、文章號、DOI號、年代,具體示例為:
表3 數(shù)據(jù)期刊的收錄內(nèi)容的具體要求
Fa1kenberg,K.J.et a1.Genome-w ide functiona1 genomic and transcriptomic ana1yses for genes regu1ating sensitivity to vorinostat.Sci.Data 1:140017 doi: 10.1038/sdata.2014.17 (2014)”[27]
筆者所調(diào)查的數(shù)據(jù)期刊均采用數(shù)字對象標(biāo)識符(DOI)對其數(shù)據(jù)論文進行唯一標(biāo)識。在這些數(shù)據(jù)期刊中,有10種數(shù)據(jù)期刊在其引用要求中明確列出需要將DOI標(biāo)識符作為引用字段。而其他5種數(shù)據(jù)期刊則未做此要求,其中Earth System Science Data期刊僅將DOI作為 Persistent ID(永久標(biāo)識)字段的選擇之一;BMC Research Notes、GigaScience、Dataset Papers in Science用期刊中內(nèi)部編碼(如:artic1e number)對引用文獻進行標(biāo)識;而Dataset Papers in Science則未提及唯一標(biāo)識符。
除Ecology的數(shù)據(jù)論文未提及作者版權(quán)歸屬外,其余的期刊均提到作者保留對其數(shù)據(jù)論文的著作權(quán)合法權(quán)利。而從出版協(xié)議看,數(shù)據(jù)期刊的主流形式是采用“知識共享許可協(xié)議”(Creative Commons License,又稱創(chuàng)作共用許可,簡稱CC)[28]作為許可協(xié)議。采用知識共享許可協(xié)議的期刊中,Scientific Data、 F1000 Research、 Biodiversity Data Journal等采用最新版的 CC 4.0[29]。而 Scientific Data與Genomics Data等還可以由作者自行選擇開放層度不同的許可方式,如署名共享(CC BY 4.0)、署名-非商業(yè)性使用共享(CC BY-NC 4.0)、署名-非商業(yè)性使用-以相同方式共享(CC BY-NC-SA 4.0)。Biodiversity Data Journal除了采用CC以外,其出版的科學(xué)數(shù)據(jù)還需遵照開放數(shù)據(jù)共享署名許可(Open Data Commons Attribution License)[30]。早期的數(shù)據(jù)期刊有采用該出版社自己設(shè)置的許可協(xié)議,例如BMC Research Notes早先采用了Biomed Centra1出版條款,后來隨著整個出版社并入Springer集團,并且在積極推進開放獲取出版的戰(zhàn)略影響下,改為CC協(xié)議。出現(xiàn)類似情況的還有ACS出版協(xié)議、SAGE出版協(xié)議等。由此可見,國外數(shù)據(jù)期刊的授權(quán)許可是在摸索中前進,可供我國出版界借鑒參考。
除了 Dataset Papers in Science、GigaScience、Biodiversity Data Journal三種期刊以外,筆者所調(diào)查的數(shù)據(jù)期刊大多要求支付數(shù)據(jù)出版費(Data Pub1ishing Charge, DPC),類似論文處理費(APC)。傳統(tǒng)大型出版社的數(shù)據(jù)期刊出版費用較高,如Nature的Scientific Data期刊,如果選擇CC 4.0授權(quán)許可,則作者需支付人民幣6850元;W i1ey的Geoscience Data Journal期刊需要作者支付1500美元;BioMed Centra1的 BMC Research Notes期刊需要作者支付1255美元。而一些新興的出版社,如Ubiquity Press出版的四種數(shù)據(jù)期刊則只是象征性收取25英鎊,且如果作者無項目資助,還可以申請費用免除。同樣可以申請費用免除的還有E1sevier集團出版的Genomics Data期刊。值得注意的是,許多目前免費的期刊都說明了免費的期限,因此收取一定的出版費用應(yīng)該是未來數(shù)據(jù)期刊的發(fā)展趨勢。我國作者和科研人員在投稿時,往往以發(fā)表論文作為第一考慮,對其中的“知識產(chǎn)權(quán)轉(zhuǎn)讓”問題和“出版費用支付”問題可能不太理解或者難以理解,這方面有待圖書館員進行相關(guān)培訓(xùn)和推廣宣傳。
為求深入理解一些已經(jīng)成功的數(shù)據(jù)期刊案例,筆者仔細分析了由科研人員所推薦曾經(jīng)投稿的數(shù)據(jù)期刊。整理如下:
該刊是Nature集團2013年推出的綜合性開放獲取期刊,該刊主要以數(shù)據(jù)論文為主導(dǎo),數(shù)據(jù)論文發(fā)表在其重要的文章類型 “數(shù)據(jù)描述”(Data Descriptor)欄目下,發(fā)表后的數(shù)據(jù)論文被收錄到一些重要的索引服務(wù)中被傳播和重用。該刊提出了六個關(guān)鍵原則,這些原則也很好地概括了當(dāng)前科研環(huán)境對數(shù)據(jù)期刊發(fā)展的要求:
1)信用:通過一個可被引用的出版物,儲備和分享研究數(shù)據(jù)。
2)重用:完整、組織化、標(biāo)準(zhǔn)化的描述,保證數(shù)據(jù)可被重用。
3)質(zhì)量:嚴格以學(xué)術(shù)團體為基礎(chǔ)的同行評審。4)發(fā)現(xiàn):找到與研究相關(guān)的數(shù)據(jù)集。
5)開放:在數(shù)據(jù)使用、重用和分布上促進和支持開放的科學(xué)原則,通過知識共享許可協(xié)議獲取。
6)服務(wù):數(shù)據(jù)描述進行內(nèi)部管理和快速同行評審。
F1000 Research是2012年開始啟動的一個綜合性的在線開放獲取期刊,也是當(dāng)前出版界創(chuàng)新模式的典型代表。主要發(fā)表生命科學(xué)和醫(yī)學(xué)領(lǐng)域的新進展、新發(fā)現(xiàn)、科學(xué)數(shù)據(jù)、工具軟件等,出版物類型包括數(shù)據(jù)論文、綜述、研究論文、案例報告、臨床實踐文章、軟件工具、觀點性文章等14種。其特點如下:
1)發(fā)表數(shù)據(jù)論文:發(fā)表數(shù)據(jù)或數(shù)據(jù)論文是F1000 Research的一個重要特色,數(shù)據(jù)可以與研究論文一起發(fā)表,也可以單獨以數(shù)據(jù)論文的形式發(fā)表,數(shù)據(jù)集可保存在Dryad、Figshare等與之合作的數(shù)據(jù)知識庫中。
2)發(fā)表速度快:沒有固定的出版周期,投稿經(jīng)過簡單的語言和格式審查后,立刻公開發(fā)布在該網(wǎng)站上,并標(biāo)記為“等待同行評審(awaiting peer review)”,同行評審?fù)ㄟ^后,當(dāng)天或第二天即正式發(fā)表在該期刊上,并獲得一個DOI標(biāo)識符,同時可被scopus、goog1e scho1ar等檢索。
3)后同行評審模式:稿件先提交在網(wǎng)站上公開發(fā)布,然后再進行同行評審,同行評審的結(jié)果及修改意見、專家觀點等實時發(fā)布在網(wǎng)絡(luò)上,作者可以同專家進行詢問、解釋、辯論。
4)過程公開透明:稿件通過簡單語言和格式審核發(fā)布后,任何人都可以查看并發(fā)表評論,同行評審的意見、與作者的交流討論以及每次修改后的稿件等都公布在網(wǎng)站上。
是由華大基因和BoiMed Central聯(lián)合創(chuàng)辦,面向所有使用或產(chǎn)出海量數(shù)據(jù)的生物學(xué)研究者的開放閱讀期刊。
1)文獻與數(shù)據(jù)庫結(jié)合:期刊具有與之相關(guān)聯(lián)的GIGA DB數(shù)據(jù)庫,用于存放GigaScience期刊提到的數(shù)據(jù)集和工具。研究者在查看數(shù)據(jù)論文的時候可以直接利用數(shù)據(jù)集以及工具進行研究的重現(xiàn)與論證。
2)數(shù)據(jù)標(biāo)識:GIGA DB數(shù)據(jù)庫采用DOI標(biāo)識符對期刊中的所有數(shù)據(jù)進行標(biāo)識,使數(shù)據(jù)保存更加永久,實現(xiàn)可追蹤、可檢索、可鏈接、可引用。
3)免費發(fā)表:到目前為止,用戶在該期刊發(fā)表以及在對應(yīng)數(shù)據(jù)庫里對數(shù)據(jù)注冊都無需支付費用。
Earth System Science Data于2009年開始出版地球科學(xué)相關(guān)數(shù)據(jù),是一個以出版數(shù)據(jù)論文為主導(dǎo)且強調(diào)數(shù)據(jù)原創(chuàng)性的數(shù)據(jù)期刊。稿件可先通過簡單快速的同行評審發(fā)表在Earth System Science Data discussion論壇上(該論壇也注冊有ISSN號,并能形成正式引用),面向所有研究者開放并接受評論。待稿件正式通過同行評審后,則發(fā)表在Earth System Science Data期刊上。
隨著科研第四范式的到來,科研環(huán)境對數(shù)據(jù)開放共享的要求越來越高。近幾年來,數(shù)據(jù)期刊的發(fā)展越來越快,各大傳統(tǒng)出版社紛紛推出了自己的數(shù)據(jù)期刊。結(jié)合前文對其特點的分析,數(shù)據(jù)期刊在數(shù)據(jù)發(fā)布和出版上,具有一些顯著特點:
首先,數(shù)據(jù)期刊以開放獲取作為主流的出版趨勢,同時要求存放數(shù)據(jù)集和相關(guān)工具的倉儲、平臺也具有開放性,以保證科研群體在查看數(shù)據(jù)的同時可直接獲取數(shù)據(jù)和工具,這使得科學(xué)數(shù)據(jù)在最大范圍內(nèi)得以傳播、共享和復(fù)用。
其次,數(shù)據(jù)期刊不拘泥于固定周期的出版方式以及新穎的后同行評審模式提高了知識的傳播速度。數(shù)據(jù)提前公開發(fā)表既避免了其他研究者無謂地重復(fù),也使得這些數(shù)據(jù)可以在別人的研究中得到驗證或進行新的發(fā)現(xiàn),這些特點使得科研效率大幅度提高。
此外,在新穎的后同行評審(Post peer review)模式下,評審意見隨同數(shù)據(jù)論文一起發(fā)布,作者可以進行討論與辯解,科研群體也可公開發(fā)表評論和觀點,所有信息的公開透明使得研究結(jié)果更加客觀與公證。
更重要的是,數(shù)據(jù)期刊將數(shù)據(jù)以正式出版物的形式呈現(xiàn),使得數(shù)據(jù)更規(guī)范、易理解、可引用,數(shù)據(jù)標(biāo)識符的采用以及引用機制的建立使得數(shù)據(jù)生產(chǎn)者的貢獻得以體現(xiàn),數(shù)據(jù)的知識產(chǎn)權(quán)歸屬更加明晰,從而讓研究者愿意共享數(shù)據(jù),促進了科學(xué)數(shù)據(jù)的共享。
如果把數(shù)據(jù)期刊放在“數(shù)據(jù)發(fā)布與出版”的框架下,理解數(shù)據(jù)期刊在“數(shù)據(jù)驅(qū)動科研(data driven research)”范式中的作用與角色,那么它們的發(fā)展優(yōu)勢明顯。然而,數(shù)據(jù)期刊可能尚未到達發(fā)展成熟的階段,體現(xiàn)優(yōu)勢的同時也面臨著一些挑戰(zhàn)。
數(shù)據(jù)期刊還未在科研群體中被廣泛認知,這可從調(diào)研中大部分數(shù)據(jù)期刊上的發(fā)文量得到佐證。在我國,數(shù)據(jù)期刊尚處于起步和摸索的階段,2014年在北京懷柔舉辦的科學(xué)數(shù)據(jù)大會上[31],中科院地理科學(xué)與資源研究所提出開始發(fā)行數(shù)據(jù)期刊《地理學(xué)報增刊》。這是我國第一本數(shù)據(jù)期刊,介紹有重要共享價值的科研數(shù)據(jù),同時配合《全球變化科學(xué)研究數(shù)據(jù)注冊與出版系統(tǒng)》[32]的運行,將數(shù)據(jù)存儲在數(shù)據(jù)知識庫中,并在數(shù)據(jù)期刊上發(fā)表。
但是,考慮到學(xué)術(shù)社群通用語言上的劣勢、考核評價上關(guān)注國外期刊的現(xiàn)實情況以及國內(nèi)科研人員對于本國數(shù)據(jù)期刊和數(shù)據(jù)知識庫尚未熟悉等各種條件,若要在我國出版界推動數(shù)據(jù)期刊的發(fā)展,可以考慮結(jié)合圖書館員的力量,提高這些優(yōu)秀辦刊刊物的國內(nèi)認知度,以期在未來能夠爭取國際認知度。
當(dāng)前科研環(huán)境還缺乏對數(shù)據(jù)期刊以及數(shù)據(jù)論文的價值評價體系。盡管有一些用于評價數(shù)據(jù)期刊或數(shù)據(jù)論文價值的新技術(shù)和新方法出現(xiàn),如Thomson Reuters集團新推出的數(shù)據(jù)引用索引數(shù)據(jù)庫(Data citation index)[33]以及近兩年開始嘗試的基于文章層面的影響力計算方法(Artic1e Leve1 Metrics)[34-35],但這些新技術(shù)新方法目前仍處于嘗試階段,并未被納入到研究者成果評價體系當(dāng)中。研究者的成果無法像期刊論文一樣,用期刊影響因子或者專家的評分(F1000 Prime)[36]來考量和計算,導(dǎo)致其貢獻力和影響力無法在其科研共同體內(nèi)得到認可和體現(xiàn),這將大大降低研究者共享和發(fā)表數(shù)據(jù)的積極性。目前,國外已就這個問題展開各項研究與試驗,如數(shù)據(jù)級別計量[37]的產(chǎn)生和推進。
數(shù)據(jù)提供者和數(shù)據(jù)期刊在科學(xué)數(shù)據(jù)開放共享上,往往通過發(fā)布某種許可協(xié)議規(guī)范來引導(dǎo)其他科研人員如何使用、利用和重用這些發(fā)布或出版的科學(xué)數(shù)據(jù)。許可協(xié)議的適用范圍是在著作權(quán)法以及鄰接權(quán)的框架下進行,不同的許可協(xié)議有其適用條件和歷史局限,需要隨著數(shù)字技術(shù)發(fā)展、科學(xué)社群需求、認知的變遷以及法律法規(guī)和機構(gòu)政策的調(diào)整而作出改變。目前通行的CC協(xié)議也只是其中一種途徑,人們對此已經(jīng)開展了許多宣傳推廣工作[38-39]。
數(shù)據(jù)引用在一定程度上,承認科研人員在收集、過濾、清理、整理、提供甚至共享科學(xué)數(shù)據(jù)上對知識創(chuàng)造和科學(xué)進步上的貢獻。但是現(xiàn)有的數(shù)據(jù)引用方式還存在一定的局限,為了激發(fā)科學(xué)數(shù)據(jù)共享價值的最大潛力,人們正在進行一系列的嘗試,試圖從數(shù)據(jù)級別計量等的工作上,解決只能通過DOI或者數(shù)據(jù)期刊才能進行數(shù)據(jù)出版和引用的局限。
在論及科學(xué)數(shù)據(jù)的知識產(chǎn)權(quán)保護時,人們?nèi)菀讓⒅鳈?quán)限制與例外、授權(quán)許可、數(shù)據(jù)引用進行混淆,其實它們屬于不同范疇。如何保護科研人員以及科研教育機構(gòu)在國外數(shù)據(jù)期刊上發(fā)表數(shù)據(jù)的權(quán)益,使其明確哪些權(quán)利應(yīng)該轉(zhuǎn)讓、讓渡與轉(zhuǎn)移以及哪些權(quán)利需要保留,也是今后需要重點考慮的問題。
期刊的運營和管理需要成本,傳統(tǒng)期刊的運營模式是一種由讀者付費的運營模式,但傳統(tǒng)模式也在逐漸轉(zhuǎn)向開放獲取出版模式[40]。對數(shù)據(jù)期刊而言,多數(shù)在一開始就采取開放獲取出版的運營機制。該出版機制將評審費、編輯加工費、出版費、行政管理費等成本計算成DPC費用,要求作者及其所屬的科研教育機構(gòu)支付。與開放獲取期刊評價與遴選[41]類似,數(shù)據(jù)期刊出版費的合理與否,要看它的投入成本與計算是否合理,而這方面就要求數(shù)據(jù)期刊的管理透明化。數(shù)據(jù)期刊與所有開放獲取期刊一樣,也面臨著對其運營和管理模式的優(yōu)化調(diào)整。
數(shù)據(jù)期刊作為一種新興的出版形式,其良好的發(fā)展需要科研、出版、數(shù)據(jù)服務(wù)、決策等多方人員的共同努力。出版者、數(shù)據(jù)服務(wù)者需要在科研群體中擴大數(shù)據(jù)期刊的認知度,讓更多的研究者知曉、理解數(shù)據(jù)期刊的實質(zhì)和意義。
中國科學(xué)院大學(xué)已經(jīng)開設(shè)了相應(yīng)的科學(xué)數(shù)據(jù)管理課程,圍繞科學(xué)數(shù)據(jù)生命周期中的數(shù)據(jù)管理、發(fā)布、共享、復(fù)用等一系列問題進行了討論,讓越來越多的研究者了解到數(shù)據(jù)期刊。這將有助于未來的科研人員能夠充分利用和識別良好的數(shù)據(jù)期刊。
此外,開發(fā)新技術(shù)、新方法建立對數(shù)據(jù)期刊或數(shù)據(jù)論文的引用與評價機制,同時梳理與科學(xué)數(shù)據(jù)相關(guān)的一系列政策也很有必要。中國科學(xué)院文獻情報中心已經(jīng)就此開展一系列政策研究工作,從科研資助機構(gòu)、科研教育機構(gòu)、信息服務(wù)機構(gòu)、數(shù)據(jù)期刊、數(shù)據(jù)知識庫、學(xué)術(shù)期刊的數(shù)據(jù)政策等,有系統(tǒng)地梳理政策要素,并且提供政策編譯材料在機構(gòu)知識庫(ir.1as.ac.cn)上開放共享。
目前由于種種因素,包括國外數(shù)據(jù)期刊政策本身的不明確等,我國科研人員在認識“知識產(chǎn)權(quán)轉(zhuǎn)讓”和“出版費用支付”的問題上,可能存在一些混淆。中國科學(xué)院文獻情報中心的科技信息政策中心已經(jīng)開始對這些內(nèi)容進行分析,即將協(xié)同學(xué)科館員制定有關(guān)的政策調(diào)查報告及最佳實踐指南,以便科研人員更加清楚地了解。
數(shù)據(jù)出版者則需要從多種途徑來優(yōu)化運營管理模式,如通過外部贊助、廣告植入、開展增值服務(wù)等方式來減少自身運營投入,在最大程度上,將成本支出與收入來源以及經(jīng)營管理予以透明化,在提升質(zhì)量管理和刊物聲譽的同時,讓收取DPC的理由取信于人??傊挥型ㄟ^各方的努力和實踐,數(shù)據(jù)期刊的優(yōu)勢才能更好地體現(xiàn),從而更好地推動科研的發(fā)展。
致謝:感謝中國科學(xué)院文獻情報中心初景利教授對本文的指導(dǎo)和建議。
[1] Hey T, Tans1ey S, To11e K.TheFourthParadigm: Data-IntensiveScientificDiscovery[M/OL].[2012-03-08].http://research. m icrosoft. com/en-us/co11aboration/fourthparadigm/.
[2] 潘教峰,張曉林,等譯.第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)[M].北京:科學(xué)出版社,2012:xvii.
[3] 張曉林.開放獲取、開放知識、開放創(chuàng)新推動開放知識服務(wù)模式—3O會聚與研究圖書館范式再轉(zhuǎn)變[J].現(xiàn)代圖書情報技術(shù), 2013, 29(2):1-10.
[4] Hans Pfeiffenberger.Data are First C1ass Products of Science-Data Journa1s are oneWay to Estab1ish this[EB/OL].[2015-03-08].http://oa.he1mho1tz.de/fi1eadm in/user_up1oad/redakteur/Workshops/he1mho1tz_oa_ws_som_14_pfeiffenberger.pdf
[5] 劉鳳紅,崔金鐘,韓芳橋,等.數(shù)據(jù)論文:大數(shù)據(jù)時代新興學(xué)術(shù)論文出版類型探討[J].中國科技期刊研究,2014,25(12):1451-1456.
[6] Pau1N,Peter C.Data papers-peer reviewed pub1ication of high qua1ity data sets[J].International Journal of Robotics Research, 2009, 28(5):587.
[7] Cande1a L, Caste11i D, Manghi P, et a1.Data Journa1s: A Survey[J].Journal of the Association for Information Science Science and Technology, 2015, doi: 10.1002/asi.23358 doi:10.1002/asi.23358.
[8] Chavan V, Penev L.The data paper: a mechanism to incentivize data pub1ishing in biodiversity science[J].BMC bioinformatics, 2011, 12(Supp115):S2.
[9] Dyrad[EB/OL].[2014-07-16].http://www.datadryad.org/pages/integratedJourna1s.
[10] Earth System Science Data[EB/OL].[2014-07-16].http://www.earth-system-science-data.net/.
[11] Eco1ogy[EB/OL].[2014-07-16].http://www.esajourna1s.org/1oi/eco1.
[12] Genomics Data[EB/OL].[2014-07-16].http://www.journa1s.e1sevier.com/genom ics-data/.
[13] Dataset Papers in Science[EB/OL].[2014-07-16]http://www.hindawi.com/journa1s/dpis/.
[14] Scientific Data[EB/OL].[2014-07-16].http://www.nature.com/sdata/.
[15] BMC Research Notes[EB/OL].[2014-07-16].http://www.biomedcentra1.com/bmcresnotes.
[16] Internationa1 Journa1 of Robotics Research[EB/OL].[2014-07-16].http://ijr.sagepub.com/.
[17] Journa1of Open Archaeo1ogy Data[EB/OL].[2014-07-16].http://openarchaeo1ogydata.metajn1.com/.
[18] Open Hea1th Data[EB/OL].[2014-07-16].http://openhea1thdata.metajn1.com/.
[19] GigaScience[EB/OL].[2014-07-16].http://www.gigasciencejourna1.com/.
[20] F1000 Research[EB/OL].[2014-07-16].http://f1000research.com/.
[21] Biodiversity Data Journa1[EB/OL].[2014-07-16].http://biodiversitydatajourna1.com/.
[22] Journa1of Open Psycho1ogy Data[EB/OL].[2014-07-16].http://openpsycho1ogydata.metajn1.com/.
[23] Geoscience Data Journa1[EB/OL].[2014-07-16].http://on1ine1ibrary.wi1ey.com/journa1/10.1002/(ISSN)2049-6060.
[24] SpringerP1us[EB/OL].[2014-07-16].http://www.springerp1us.com/.
[25] 劉峰,張曉林,孔麗華.科研數(shù)據(jù)知識庫研究述評[J].現(xiàn)代圖書情報技術(shù), 2014,30(2):25-31.
[26] GIGA DB[EB/OL].[2014-07-16].http://gigadb.org/.
[27] citation examp1e[2014-07-16]http://www.nature.com/artic1es/sdata201417.
[28] Creative Commons[EB/OL].[2014-07-16].http://creativecommons.org/.
[29] Creative Commons 4.0[EB/OL].[2014-07-16].https://creativecommons.org/1icenses/by/4.0/.
[30] Open Data Commons Attribution License[EB/OL].[2014-07-16].http://opendatacommons.org/1icenses/by/1.0/.
[31] 2014科學(xué)數(shù)據(jù)大會——科研大數(shù)據(jù)與數(shù)據(jù)科學(xué)[EB/OL].[2014-07-16].http://dc2014.codata.cn/dct/page/1.
[32] 全球變化科學(xué)研究數(shù)據(jù)注冊與出版系統(tǒng)[EB/OL].[2015-3-8].http://www.geodoi.ac.cn/WebCn/Defau1t.aspx.
[33] Data Citation Index[EB/OL].[2014-07-16].http://thomsonreuters.com/data-citation-index/.
[34] Artic1e Leve1Metrics[EB/OL].[2014-07-16].http://artic1e-1eve1-metrics.p1os.org/a1m-info/.
[35] Tananbaum G.Artic1e-Leve1Metrics:A SPARC Primer[OL].(2013-04-17).[2013-06-08].http://sparc.ar1.org/sites/defau1t/fi1es/sparc-a1m-primer.pdf.
[36] F1000 Prime[EB/OL].[2014-07-16].http://f1000.com/prime.
[37] 顧立平.數(shù)據(jù)級別計量——概念辨析與實踐進展[J].中國圖書館學(xué)報,2015,41(2):56-71.
[38] M i11oy C,et a1.Guide to Creative Commons[EB/OL].[2013-08-16]http://oapen-uk.jiscebooks.org/ccguide/.
[39] 顧立平譯.創(chuàng)作共用(知識共享)-人文與社會科學(xué)的專著作者[EB/OL].[2013-08-16]http://ir.1as.ac.cn/hand1e/12502/6260.
[40] 張曉林,李麟,劉細文,等.開放獲取學(xué)術(shù)信息資源:逼近“主流化”轉(zhuǎn)折點[J].圖書情報工作,2012,56(9):42-47.
[41] 顧立平,張曉林,初景利,等.開放獲取期刊的評價與遴選:質(zhì)量水平、開放程度和服務(wù)能力[J].圖書情報工作,2013,57(1):49-54.