袁雅琴 胡曉彥 佟繼周 鄒自明
(1.中國科學院國家空間科學中心,北京 100190;2.國家空間科學數(shù)據(jù)中心,北京 100190)
繼實驗驗證、歸納推演和計算模擬科學范式之后,數(shù)據(jù)密集型科學研究成為科學研究范式第四范式[1]??茖W研究越來越取決于對科學數(shù)據(jù)的積累,以及對數(shù)據(jù)進行分析,提取出有價值的內(nèi)容轉(zhuǎn)換為信息和知識的能力[2],前沿科學領域的突破也是更多地依賴于對科學數(shù)據(jù)的收集、整理、挖掘、分析和利用。在全球大數(shù)據(jù)開放背景下,科學數(shù)據(jù)的開放共享既能避免重復實驗和研究造成的浪費,縮短研究周期,打破科學壟斷,解決“學術(shù)孤島”等問題[3],也能促進海量數(shù)據(jù)的持續(xù)、有序積累,提升數(shù)據(jù)的質(zhì)量,實現(xiàn)科學數(shù)據(jù)價值最大化。在科學數(shù)據(jù)開放共享過程中,為了保護科研人員的勞動成果和共享的積極性,提出了科學數(shù)據(jù)出版的概念,主要目的是在科學數(shù)據(jù)開放共享過程中保護科學數(shù)據(jù)生產(chǎn)者的有關(guān)利益(如著作權(quán)和所有權(quán))[4-5]。
隨著全球數(shù)據(jù)開放共享的不斷推進,數(shù)據(jù)出版受到學術(shù)界、出版界、圖情界和國際數(shù)據(jù)組織等的廣泛關(guān)注,開展了很多有益的研討、實踐,但目前尚未形成一個各界所認可的準確而統(tǒng)一的定義[5-6]。在眾多的數(shù)據(jù)出版定義中,筆者比較認同孔麗華等[7]給出的定義,即“數(shù)據(jù)出版(Data Publishing)是指按照一定的規(guī)則通過相關(guān)受認可的平臺發(fā)布科研數(shù)據(jù)集,使得用戶可以發(fā)現(xiàn)、獲取、應用、引用這些數(shù)據(jù)集”。
本文將在闡述國內(nèi)外數(shù)據(jù)開放共享與出版背景以及科學數(shù)據(jù)出版的基礎上,探討我國空間科學數(shù)據(jù)出版實踐,分析存在的問題,提出相應的對策建議,為我國科學數(shù)據(jù)共享和出版發(fā)展提供參考。
在共享政策方面,美國和歐洲發(fā)達國家已逐步形成了體系較為健全的數(shù)據(jù)政策和法規(guī),不僅有指導長遠發(fā)展的宏觀政策,還有解決在實踐中遇到的具體問題的微觀政策[8]。如2018年12月,美國國會正式通過《開放政府數(shù)據(jù)法案》(Foundations for Evidence-Based Policymaking Act of 2017),要求美國所有的政府機構(gòu)主動公開其擁有的除涉及國家安全的公共數(shù)據(jù),并設立專門的網(wǎng)站用于開放此類數(shù)據(jù),對于公開的數(shù)據(jù)需滿足機器可讀、可檢索等格式要求[8-9];2016年4月,歐洲議會通過了《通用數(shù)據(jù)保護法案》(General Data Protection Regulation),為維護數(shù)據(jù)安全、保護用戶隱私提供法律保障[10];2016年10月,法國《數(shù)字共和國法案》(the French Digital Republic Act)正式生效,該法案的第一部分為法國的開放式數(shù)據(jù)政策設立了基本的框架,所有的公共數(shù)據(jù)將會被默認為公開、免費的[8]。
在國際組織方面,國際科學理事會(ICSU)、世界數(shù)據(jù)系統(tǒng)(WDS)、國際科技數(shù)據(jù)委員會(CODATA)等研究制定了特定的數(shù)據(jù)政策并在各界進行了推廣和使用,在推動全球的數(shù)據(jù)管理和數(shù)據(jù)開放共享方面取得了矚目的成績。如WDS聯(lián)合90 多個國際組織于2018年11月共同簽署了《賦能FAIR數(shù)據(jù)承諾聲明》(Enabling FAIR Data Commitment Statement),確定了不同國家不同利益相關(guān)者共同支持數(shù)據(jù)的FAIR原則,即可發(fā)現(xiàn)(Findable)、可獲取(Accessible)、可互操作(Interoperable)、可重用(Reusable)[11]。
在國際學術(shù)出版界方面,許多出版商制定了分類分級、逐步加強的數(shù)據(jù)共享政策,鼓勵或要求作者提供數(shù)據(jù)可獲取性聲明,并在論文中引用數(shù)據(jù)集[7]。以Springer Nature、Elsevier、Wiley為例,這些國際出版集團均面向不同期刊有步驟地逐步推行了數(shù)據(jù)共享政策,并與Figshare、Dryad等國際數(shù)據(jù)倉儲進行合作,或自行開發(fā)了Mendeley等數(shù)據(jù)倉儲平臺。AGU則對旗下所有期刊均要求論文關(guān)聯(lián)數(shù)據(jù)需存放在可信任的且遵循FAIR原則的數(shù)據(jù)倉儲。同時,出版集團也推出了專注于數(shù)據(jù)論文出版的期刊,如《Scientific Data》《Data in brief》《Geoscience Data Journal》等。
在我國,近年來陸續(xù)發(fā)布了科學數(shù)據(jù)管理、科學數(shù)據(jù)開放共享的相關(guān)政策,良性的開放共享生態(tài)環(huán)境正在逐步建立。2015年8月,國務院印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》[12]明確提出“積極推動由國家公共財政支持的公益性科研活動獲取和產(chǎn)生的科學數(shù)據(jù)逐步開放共享”。2018年2月,國家出臺的《國家科技資源共享服務平臺管理辦法》[13]進一步明確了各類科技資源共享服務平臺的數(shù)據(jù)共享職責與任務。2018年3月,國務院辦公廳印發(fā)的《科學數(shù)據(jù)管理辦法》[14]提出“主管部門和法人單位應積極推動科學數(shù)據(jù)出版和傳播工作,支持科研人員整理發(fā)表產(chǎn)權(quán)清晰、準確完整、共享價值高的科學數(shù)據(jù)”,并要求“科學數(shù)據(jù)使用者應遵守知識產(chǎn)權(quán)相關(guān)規(guī)定,在論文發(fā)表、專利申請、專著出版等工作中注明所使用和參考引用的科學數(shù)據(jù)”。該辦法的出臺成為了我國科學數(shù)據(jù)開放共享史上新的里程碑。2019年 2月,中國科學院發(fā)布的《中國科學院科學數(shù)據(jù)管理與開放共享辦法(試行)》[15]對中國科學院科學數(shù)據(jù)管理與開放共享的總體原則、職責分工、管理要求、保障機制及安全保密等作了制度規(guī)范,要求內(nèi)容包括數(shù)據(jù)匯交及審核管理、數(shù)據(jù)共享的規(guī)范,以及共享服務等方面,為進一步加強科學數(shù)據(jù)管理、提高科學數(shù)據(jù)開放共享水平提供了制度規(guī)范。
為了進一步落實《科學數(shù)據(jù)管理辦法》和《國家科技資源共享服務平臺管理辦法》的要求,2019年 6月,科技部、財政部對原有國家數(shù)據(jù)資源平臺開展了優(yōu)化調(diào)整工作,形成了 20 個國家科學數(shù)據(jù)中心[2,16],涵蓋了生命科學、天文學、空間科學、地球科學、物理學等學科領域。國家科學數(shù)據(jù)中心是我國科學數(shù)據(jù)管理和開放共享服務的重要平臺[2],重點開展科學數(shù)據(jù)的匯交、整合和管理等工作,面向全社會提供共享服務。近年來,國內(nèi)學術(shù)出版界也推出了專門發(fā)表數(shù)據(jù)論文的數(shù)據(jù)期刊。如中國科學院計算機網(wǎng)絡信息中心和ISC CODATA中國全國委員會于2016年聯(lián)合創(chuàng)辦了目前國內(nèi)唯一的專門面向多學科領域科學數(shù)據(jù)出版的學術(shù)期刊《中國科學數(shù)據(jù)》(China Scientific Data)[17],中國科學院地理科學與資源研究所和中國地理學會等于2017年聯(lián)合創(chuàng)辦了元數(shù)據(jù)、實體數(shù)據(jù)和數(shù)據(jù)論文關(guān)聯(lián)一體出版的《全球變化數(shù)據(jù)學報》等,為我國數(shù)據(jù)共享提供了新的模式。
科學數(shù)據(jù)出版的形式日益多樣化,但大體上可歸納為學術(shù)論文關(guān)聯(lián)出版、數(shù)據(jù)倉儲平臺出版、數(shù)據(jù)論文出版等3 種[7]。其中,學術(shù)論文關(guān)聯(lián)出版是指學術(shù)期刊與數(shù)據(jù)倉儲合作,期刊負責學術(shù)論文的出版,數(shù)據(jù)倉儲平臺負責數(shù)據(jù)的存儲、獲取和共享服務[18],論文與數(shù)據(jù)之間通過唯一標識符如DOI進行互關(guān)聯(lián);獨立數(shù)據(jù)出版是指將數(shù)據(jù)存儲在數(shù)據(jù)倉儲平臺,該平臺以機器可讀、可檢索和可使用的形式對數(shù)據(jù)進行發(fā)布;數(shù)據(jù)論文出版指數(shù)據(jù)生產(chǎn)者按照一定的論文結(jié)構(gòu)對數(shù)據(jù)進行描述,遵循傳統(tǒng)的學術(shù)出版流程,將數(shù)據(jù)論文進行發(fā)表,以幫助讀者更好地獲取、理解和使用該數(shù)據(jù)。
在傳統(tǒng)的學術(shù)出版過程中,出版商往往關(guān)注于學術(shù)論文本身,而忽視支撐論文研究的原始數(shù)據(jù)。論文出版后,原始數(shù)據(jù)往往只存在于作者個人手中,雖然部分期刊將數(shù)據(jù)作為論文附件一同出版,但受篇幅等限制,很難全部出版。隨著大數(shù)據(jù)開放時代和科研第四范式的到來,學術(shù)論文的原始數(shù)據(jù)越來越受到重視。論文關(guān)聯(lián)數(shù)據(jù)的公開出版不僅能最大程度地避免學術(shù)不端、提升研究成果的信任度,而且能讓其他科研工作者“站在巨人肩膀上”開展新的研究和創(chuàng)新。因此,學術(shù)論文和數(shù)據(jù)關(guān)聯(lián)出版的模式應運而生。
該模式的出版涉及期刊和數(shù)據(jù)倉儲兩個主體,通過論文和數(shù)據(jù)的永久標識符(如DOI)實現(xiàn)兩者的互關(guān)聯(lián)。其流程通常為:期刊對論文關(guān)聯(lián)數(shù)據(jù)的公開獲取做出明確要求,并給出可信任的數(shù)據(jù)倉儲列表或?qū)?shù)據(jù)倉儲的基本要求;作者在該期刊提交論文的同時,選擇符合期刊要求的數(shù)據(jù)倉儲提交數(shù)據(jù),數(shù)據(jù)倉儲為該數(shù)據(jù)提供唯一標識符,通常情況下為DOI;作者在論文中通過數(shù)據(jù)DOI引用該數(shù)據(jù),在數(shù)據(jù)倉儲平臺發(fā)布頁面插入該論文的DOI,這樣就實現(xiàn)了論文和數(shù)據(jù)的互關(guān)聯(lián)。
該模式在國外已普遍實施,如愛思唯爾(ELESVIER)已對其期刊實施了《數(shù)據(jù)引用原則聯(lián)合聲明》[19],這意味著作者需要將數(shù)據(jù)引用到論文的參考文獻列表中且在論文中提供數(shù)據(jù)的可用性說明。同時,為了幫助作者更加方便快捷地共享論文數(shù)據(jù),愛思唯爾也建立了一個通用性的數(shù)據(jù)倉儲Mendeley Data,為用戶提供了數(shù)據(jù)DOI分配、永久保存和開放獲取服務。斯普林格(Springer Nature)則對其期刊實施了4 個等級的數(shù)據(jù)共享政策,從鼓勵作者共享其數(shù)據(jù)到強制共享和引用數(shù)據(jù)[20]。斯普林格也在其網(wǎng)站上給出了其所信任的數(shù)據(jù)倉儲列表,作者在發(fā)表論文時,需從該列表中選擇相關(guān)倉儲進行數(shù)據(jù)的關(guān)聯(lián)出版。
在我國,論文數(shù)據(jù)的關(guān)聯(lián)出版仍然處于發(fā)展的早期,大多數(shù)期刊仍屬于傳統(tǒng)出版模式,但少數(shù)先行者已開始進行論文數(shù)據(jù)關(guān)聯(lián)出版的有益嘗試,如《數(shù)據(jù)分析與知識發(fā)現(xiàn)》于2016年開始,要求所有作者在發(fā)表論文時一并提交論文研究中所使用的自主數(shù)據(jù),并以適當方式共享該數(shù)據(jù)[21]?!吨腥A外科雜志》于2016年發(fā)布《關(guān)于在投稿時提供原始研究資料的通知》,明確提出作者提交稿件的同時必須提供相應的原始資料,并在2017年發(fā)布了《已發(fā)表文章結(jié)論支撐原始數(shù)據(jù)的補償性/獎勵性數(shù)據(jù)共享通知》,明確表明“為了響應國家大數(shù)據(jù)戰(zhàn)略,促進科學數(shù)據(jù)共享,減少重復研究,最大限度地發(fā)揮發(fā)表文章的數(shù)據(jù)作用,《中華外科雜志》和《中華腫瘤雜志》與國家人口與健康科學數(shù)據(jù)共享平臺腫瘤專題服務網(wǎng)絡共享平臺合作,進行文章原始數(shù)據(jù)的收集與發(fā)布”[22]。
數(shù)據(jù)倉儲平臺出版一般是指獨立的數(shù)據(jù)出版。數(shù)據(jù)所有者或項目團隊按要求將數(shù)據(jù)存放到指定的或自主選擇的倉儲平臺。我國《科學數(shù)據(jù)管理辦法》中要求“政府預算資金資助的各級科技計劃(專項、基金等)項目所形成的科學數(shù)據(jù),應由項目牽頭單位匯交到相關(guān)科學數(shù)據(jù)中心”,該辦法為我國的項目數(shù)據(jù)獨立出版奠定了基礎。一般而言,數(shù)據(jù)所有者在提交數(shù)據(jù)時,除數(shù)據(jù)實體外,還需按照數(shù)據(jù)倉儲平臺要求提供元數(shù)據(jù)和數(shù)據(jù)說明文檔等。倉儲平臺對數(shù)據(jù)進行審查、整理和發(fā)布,并分配唯一標識符。但需要指出的是,數(shù)據(jù)倉儲可允許數(shù)據(jù)所有者設置一定的數(shù)據(jù)保護期,在其保護期內(nèi)不對外公開此數(shù)據(jù)。
數(shù)據(jù)倉儲通常分為通用型和領域?qū)I(yè)型,如HARVARD DATAVERSE、DRYAD、FIGSHARE、ZENODO[23]以及國內(nèi)的ScienceDB等都為通用型數(shù)據(jù)倉儲,接受各學科領域的數(shù)據(jù);美國國家航空航天局(NASA)、美國國家海洋和達氣管理局(NOAA)等相關(guān)學科數(shù)據(jù)中心以及我國國家科學數(shù)據(jù)中心等均為各領域?qū)I(yè)的數(shù)據(jù)倉儲平臺。
在數(shù)據(jù)倉儲擁有數(shù)量方面,以綜合性的全球研究數(shù)據(jù)存儲庫注冊庫re3data.org(REgistry of REsearch data REpositories)為檢索庫,其收錄排名前三的分別為美國(1 134 個)、德國(459 個)和英國(302 個),而中國(62 個,含香港和臺灣地區(qū)的統(tǒng)計數(shù)據(jù))排名第11 位[24]。在按學科分類進行檢索時,生命科學領域的倉儲庫排名第一[25]。
數(shù)據(jù)論文是大數(shù)據(jù)開放背景下新的產(chǎn)物,是指對具有進一步研究或分析價值的某個或某類數(shù)據(jù)集進行全面描述,經(jīng)過同行評議的并遵從學術(shù)發(fā)表規(guī)范的正式出版物[26]。在數(shù)據(jù)論文中,描述應足夠詳細,包括數(shù)據(jù)的采集處理方法、數(shù)據(jù)格式說明、數(shù)據(jù)質(zhì)量評估方法等,能夠使讀者更深入地理解數(shù)據(jù),并可以重復使用該數(shù)據(jù)。由于數(shù)據(jù)論文是需要經(jīng)過同行評審的,這也提高了公開發(fā)表的數(shù)據(jù)質(zhì)量。相較于學術(shù)論文,數(shù)據(jù)論文不包含新的研究結(jié)論、科研發(fā)現(xiàn)或創(chuàng)新性成果[27]。與論文關(guān)聯(lián)出版模式相似的是,數(shù)據(jù)論文中所描述的數(shù)據(jù)集也需要在合適的數(shù)據(jù)倉儲進行公開共享,論文和數(shù)據(jù)通過唯一標識符如DOI實現(xiàn)互關(guān)聯(lián)。
目前,發(fā)表數(shù)據(jù)論文的期刊主要分為兩類:一是只出版數(shù)據(jù)論文[7],如前文所提及的《Scientific Data》《Data in brief》以及國內(nèi)的《中國科學數(shù)據(jù)》《全球變化數(shù)據(jù)學報》等;二是混合型期刊,一般由傳統(tǒng)期刊發(fā)展而來,在出版學術(shù)論文的同時又接受數(shù)據(jù)論文的發(fā)表[7],如《CODATA Data Science Journal》《The Astrophysics Journal:Supplement Series》《Research Data Journal for the Humanities and Social Sciences(RDJ)》[26]。所有的數(shù)據(jù)論文都是開放式訪問,不對其他讀者有任何限制。
國家空間科學數(shù)據(jù)中心是科技部、財政部正式認定的中國空間科學領域唯一的國家科學數(shù)據(jù)中心,屬于基礎支撐與條件保障類國家科技創(chuàng)新基地。近年來,在國際開放背景趨勢下和我國新的數(shù)據(jù)管理和開放政策環(huán)境下,國家空間科學數(shù)據(jù)中心開展了數(shù)據(jù)出版的新探索,取得了一定的成效。
為滿足學術(shù)論文作者的需求,響應國內(nèi)外期刊對數(shù)據(jù)的引用和可公開獲取的基本要求,國家空間科學數(shù)據(jù)中心于2020年2月推出了中英文雙語的空間科學論文數(shù)據(jù)倉儲(Space Science Article Data Repository,SADR)。SADR是一個面向國內(nèi)外空間科學領域?qū)W術(shù)期刊論文關(guān)聯(lián)數(shù)據(jù)的安全存儲與共享發(fā)布平臺,主要面向科研人員、科研期刊等利益相關(guān)者,提供論文關(guān)聯(lián)數(shù)據(jù)的提交、審核、保存、出版、共享和獲取等服務。
SADR目前支持兩種論文關(guān)聯(lián)數(shù)據(jù)出版方式。一是在提交數(shù)據(jù)后即公開出版:①作者在線填寫數(shù)據(jù)元數(shù)據(jù)信息,包括數(shù)據(jù)集標題、數(shù)據(jù)集簡介、關(guān)鍵詞、學科分類、數(shù)據(jù)文件類型等,提交數(shù)據(jù)實體和數(shù)據(jù)輔助說明文檔等;②在數(shù)據(jù)提交后,SADR向數(shù)據(jù)集分配唯一標識符,對數(shù)據(jù)進行完整性審查,給出返修意見或?qū)徍送ㄟ^,在審查通過后隨即發(fā)布數(shù)據(jù)集,在發(fā)布的同時,唯一標識符將自動注冊成功。③作者在待發(fā)表的論文中通過唯一標識符引用該數(shù)據(jù)集或提供數(shù)據(jù)集的公開訪問鏈接,待數(shù)據(jù)正式發(fā)表后,SADR在該數(shù)據(jù)集出版頁面插入論文信息,通常是論文的唯一標識符或URL鏈接。二是在提交數(shù)據(jù)后暫不公開出版:①作者在線填寫元數(shù)據(jù)信息并提交數(shù)據(jù)實體和輔助說明文檔等;②數(shù)據(jù)提交后,SADR向數(shù)據(jù)集分配唯一標識符,對數(shù)據(jù)進行完整性審查;③作者在待發(fā)表的論文中通過預分配的唯一標識符引用該數(shù)據(jù)集并向期刊提供數(shù)據(jù)集的私有訪問鏈接供同行評議;④待論文發(fā)表時或根據(jù)期刊具體要求,SADR在約定時間發(fā)布該數(shù)據(jù)集,此時唯一標識符將自動完成注冊。
SADR采用Creative Commons系列知識共享許可協(xié)議,包括CC0 和CC BY 4.0,在保障作者知識產(chǎn)權(quán)的基礎上促進了數(shù)據(jù)的完全公開共享。同時,在數(shù)據(jù)集出版頁面上,SADR推薦了基于唯一標識符的標準數(shù)據(jù)引用格式,促進科學數(shù)據(jù)的合規(guī)使用,也提供了數(shù)據(jù)集的訪問、下載和引用次數(shù)等統(tǒng)計信息。經(jīng)過不斷的實踐探索,SADR已形成了完整的“數(shù)據(jù)提交-數(shù)據(jù)審核-規(guī)范引用-統(tǒng)計分析”的數(shù)據(jù)出版流程。迄今為止,SADR已公開出版論文關(guān)聯(lián)數(shù)據(jù)集35 個,關(guān)聯(lián)論文發(fā)表在《Space Weather》《AIP Advance》《JGR》《GRL》《空間科學學報》等國內(nèi)外期刊上,數(shù)據(jù)作者來自中國、英國、美國、日本等國家和地區(qū)。
國家空間科學數(shù)據(jù)中心數(shù)據(jù)倉儲平臺出版的數(shù)據(jù)主要是由政府預算資金資助的與空間科學領域相關(guān)項目所產(chǎn)生的數(shù)據(jù),在出版過程中主要涉及項目數(shù)據(jù)的匯交和項目數(shù)據(jù)的出版。針對數(shù)據(jù)的匯交,目前國家空間科學中心采取線下模式進行數(shù)據(jù)的匯交,“科技計劃項目科學數(shù)據(jù)匯交”線上匯交平臺正處于內(nèi)測階段,待正式上線后,數(shù)據(jù)的匯交將由數(shù)據(jù)提交者自主選擇線上或線下匯交方式。針對數(shù)據(jù)的出版,國家空間科學中心推出了空間科學虛擬觀測臺(Virtual Space Science Observatory,VSSO),進行數(shù)據(jù)的出版、數(shù)據(jù)目錄的發(fā)布,提供跨學科、分布式數(shù)據(jù)資源交叉檢索與發(fā)現(xiàn)服務。
具體出版流程為:①項目團隊提交數(shù)據(jù)實體文件和數(shù)據(jù)描述信息。其中,描述信息主要指用于描述科學數(shù)據(jù)來源、處理過程、對象內(nèi)容、分級定義、格式說明和質(zhì)量控制情況等方面的配套信息,以元數(shù)據(jù)、輔助說明文檔進行記錄。必要時提供用于數(shù)據(jù)處理、加工和分析的專門輔助工具軟件及其屬性信息。②國家空間科學數(shù)據(jù)中心基于相關(guān)的標準規(guī)范對數(shù)據(jù)進行形式審查,并適時組織數(shù)據(jù)專家和學科專家開展數(shù)據(jù)質(zhì)量評估活動。若提交的數(shù)據(jù)存在問題,則將反饋至數(shù)據(jù)提交者進行修改。③對最終審核通過后的數(shù)據(jù),國家空間科學數(shù)據(jù)中心對數(shù)據(jù)進行分類、編目、保存與備份。④對于滿足開放共享條件的科學數(shù)據(jù),分配和注冊了唯一標識符,使數(shù)據(jù)集實現(xiàn)永久追溯。⑤由數(shù)據(jù)提交方選擇Creative Commons系列中的一種知識共享許可協(xié)議后,國家空間科學數(shù)據(jù)中心采取多渠道方式進行發(fā)布,便于用戶搜索和發(fā)現(xiàn)數(shù)據(jù),包括通過VSSO進行元數(shù)據(jù)信息和數(shù)據(jù)實體的發(fā)布,將數(shù)據(jù)目錄和元數(shù)據(jù)信息提供給中國科技資源共享網(wǎng)和中國科學院數(shù)據(jù)云進行發(fā)布等。
截至目前,國家空間科學數(shù)據(jù)中心已完成了近50 個科技計劃項目的匯交,包括國家重大科技專項、國家重點研發(fā)計劃、國家自然科學基金、中國科學院先導專項等,在線出版數(shù)據(jù)集300 余個,在線訪問量超億人次,有效地促進了我國空間科學數(shù)據(jù)的開放共享。
國家空間科學數(shù)據(jù)中心聯(lián)合國家空間天氣科學中心子午工程辦公室,推出了《中國科學數(shù)據(jù)》子午工程數(shù)據(jù)???,旨在使用戶更加深入地了解子午工程數(shù)據(jù)資源。這也是我國空間科學領域內(nèi)首次在專業(yè)的數(shù)據(jù)期刊發(fā)表數(shù)據(jù)論文???,是國家空間科學數(shù)據(jù)中心聯(lián)合工程項目拓展開放共享方式、提高數(shù)據(jù)影響力的重要手段。此次專刊出版歷經(jīng)了??邉潯⒄鞲逖杏?、數(shù)據(jù)論文寫作專題培訓、作者投稿、編輯初審、同行評議、確認發(fā)表等過程。
具體的出版流程為:①將擬介紹的數(shù)據(jù)集存儲至VSSO,并由VSSO進行公開發(fā)布,注冊生成數(shù)據(jù)的DOI號;②按照《中國科學數(shù)據(jù)》期刊的論文結(jié)構(gòu)要求,撰寫數(shù)據(jù)論文并在規(guī)定的時間內(nèi)在線提交;③數(shù)據(jù)論文和數(shù)據(jù)集共同接受期刊組織的同行評議;④在線發(fā)表中英文雙版的數(shù)據(jù)論文,并在論文的數(shù)據(jù)集基本信息介紹表中附上基于DOI標識符生成的數(shù)據(jù)集訪問鏈接。當用戶檢索到該數(shù)據(jù)論文時,則可通過論文了解數(shù)據(jù)的相關(guān)信息,并可訪問到數(shù)據(jù)集的發(fā)表頁面。
??舶l(fā)表了14 篇論文,包括1 篇綜述性論文和13 篇數(shù)據(jù)論文,詳細介紹了子午工程13類監(jiān)測設備產(chǎn)出的13 種數(shù)據(jù)集,其介紹內(nèi)容包括數(shù)據(jù)的采集處理方法、數(shù)據(jù)樣本描述、數(shù)據(jù)質(zhì)量控制和評估以及數(shù)據(jù)的使用方法或建議等[28]。截至目前,中文版??撐墓脖活A覽2 萬余次,論文下載量達300 余次。后續(xù),國家空間科學數(shù)據(jù)中心將聯(lián)合更多的項目團隊,開展數(shù)據(jù)論文??淖珜懞统霭?,幫助空間科學數(shù)據(jù)用戶更好地了解和使用數(shù)據(jù)。
針對3 種出版模式,筆者進行初步的優(yōu)勢和不足比較分析,見表1。
表1 3 種數(shù)據(jù)出版模式比較分析
結(jié)合近年來我國空間科學數(shù)據(jù)的出版實踐經(jīng)驗和實施效果,筆者認為,目前國內(nèi)數(shù)據(jù)出版存在著以下問題和挑戰(zhàn):一是國內(nèi)大多數(shù)學術(shù)期刊尚未形成論文關(guān)聯(lián)數(shù)據(jù)公開共享的要求,作者很難自覺地將論文關(guān)聯(lián)數(shù)據(jù)進行公開出版;二是國內(nèi)開放共享的觀念尚未成熟,開放共享的生態(tài)環(huán)境還有待改善,數(shù)據(jù)所有者和用戶對數(shù)據(jù)出版的積極性不高,而作為兩者“橋梁”的數(shù)據(jù)倉儲則相對積極;三是開放共享過程中對知識產(chǎn)權(quán)缺乏有效的保護,數(shù)據(jù)引用機制尚未建立,這也進一步影響了數(shù)據(jù)所有者開放數(shù)據(jù)的積極性;四是數(shù)據(jù)倉儲知名度和國際參與度低,大部分數(shù)據(jù)倉儲未被國際知名期刊認可,甚至國內(nèi)用戶對本研究領域內(nèi)的數(shù)據(jù)倉儲也缺乏認識和了解;五是目前國內(nèi)數(shù)據(jù)倉儲基于公共財政支持,其平臺建設、標準規(guī)范的建立、數(shù)據(jù)保存與日常維護、人員管理等的經(jīng)費投入十分巨大,且隨著數(shù)據(jù)量的增加、服務的拓展等,其單一的經(jīng)費投入難以可持續(xù)。
本文對上述問題提出了以下建議:一是各出版主體之間應該加強合作,如學習西方主流學術(shù)期刊,將數(shù)據(jù)公開可獲取作為一個強制性要求,并與數(shù)據(jù)倉儲合作進行論文關(guān)聯(lián)數(shù)據(jù)的公開出版等,不僅從數(shù)據(jù)政策上加強要求,也可以打通雙方平臺,方便作者一站式完成論文和數(shù)據(jù)的提交。二是規(guī)范科學數(shù)據(jù)出版要求,逐漸形成完善的數(shù)據(jù)出版過程中的權(quán)益保護機制,保障數(shù)據(jù)所有者權(quán)益,如數(shù)據(jù)發(fā)布時均明確數(shù)據(jù)出版許可協(xié)議、數(shù)據(jù)使用要求、數(shù)據(jù)引用規(guī)范、提供數(shù)據(jù)下載和引用統(tǒng)計,將數(shù)據(jù)共享成果納入科研人員的成果和貢獻度等評價中。三是對標國際數(shù)據(jù)期刊,大力發(fā)展我國的數(shù)據(jù)期刊,實現(xiàn)從少到多、打造有國際影響力的數(shù)據(jù)期刊的逐級突破,并同步建立數(shù)據(jù)專家?guī)?,讓更多的科研工作者了解?shù)據(jù)出版的概念,并自主發(fā)表更多的數(shù)據(jù)論文。當然以上建議的落實離不開國家相關(guān)政策的出臺,也離不開科學數(shù)據(jù)出版環(huán)節(jié)中所有利益相關(guān)者的共同推進。
本文僅基于我國空間科學數(shù)據(jù)共享現(xiàn)狀,分析和總結(jié)有一定的局限性。相信隨著國家數(shù)據(jù)共享政策的逐步完善,社會共享生態(tài)的逐步改善,以及信息技術(shù)的不斷應用,數(shù)據(jù)倉儲、出版界工作不斷推進和創(chuàng)新,我國科學數(shù)據(jù)共享和出版將邁上新的臺階。