陳沖,田國祥,喬萌萌,趙雪諾,曹家豪,呂軍
隨著大數(shù)據(jù)時(shí)代的發(fā)展和開放存取運(yùn)動(dòng)的興起,對(duì)科研數(shù)據(jù)進(jìn)行共享逐步成為了國情領(lǐng)域關(guān)注的焦點(diǎn)。科學(xué)數(shù)據(jù)是科學(xué)研究的重要成果,對(duì)經(jīng)濟(jì)發(fā)展和國家安全有著重要意義[1]??茖W(xué)數(shù)據(jù)共享可有效利用科學(xué)數(shù)據(jù)。新型冠狀病毒肺炎疫情暴發(fā)以來,疫情相關(guān)數(shù)據(jù)大量公開,對(duì)科研和政府決策提供了重要幫助。Figshare數(shù)據(jù)庫作為大型穩(wěn)健科研數(shù)據(jù)共享平臺(tái),是實(shí)現(xiàn)數(shù)據(jù)共享以及數(shù)據(jù)再利用的典型。為科研及政府決策提供更詳細(xì)、開放及可用的數(shù)據(jù)分享,提高數(shù)據(jù)質(zhì)量[2-7]。本文將詳細(xì)介紹如何在Figshare平臺(tái)上實(shí)現(xiàn)數(shù)據(jù)共享。
Figshare數(shù)據(jù)共享平臺(tái)是由英國Macmillian出版公司的分支機(jī)構(gòu)Digital Science支持建設(shè)的,是其支持的眾多投資組合業(yè)務(wù)之一。目的是為了使研究中的輔助材料更容易被發(fā)現(xiàn)及查找。Figshare平臺(tái)服務(wù)學(xué)科多樣,以生物學(xué)為基礎(chǔ),在Digital Science公司支持下,現(xiàn)已發(fā)展為包含生物學(xué)在內(nèi)的將近30多種學(xué)科,如醫(yī)學(xué)、地理學(xué)、物理學(xué)、人文學(xué)、天文學(xué)等,主要以生物學(xué)和醫(yī)學(xué)為主,覆蓋整個(gè)科學(xué)研究領(lǐng)域。平臺(tái)接受多種格式的科研數(shù)據(jù),提供了當(dāng)前學(xué)術(shù)出版所不具備的一種文件共享模式。平臺(tái)給所有對(duì)象分配唯一的DOI號(hào),采用Creative Commons許可協(xié)議共享數(shù)據(jù),大大減少了版權(quán)糾紛,可供全球科學(xué)家存取、共享信息,并采用基于云的數(shù)據(jù)管理系統(tǒng)來保證數(shù)據(jù)存儲(chǔ)的安全和可靠性,還為用戶提供權(quán)限設(shè)置的功能,用戶自行決定對(duì)其科研數(shù)據(jù)、音頻、論文和視頻等研究成果是否公開。
FigShare的特點(diǎn)是容易發(fā)現(xiàn),安全且易進(jìn)入,方便管理;可以共享、快速、便捷地上傳數(shù)據(jù),該平臺(tái)可以接受各種研究文件類型;所有以云數(shù)據(jù)為基礎(chǔ)發(fā)表的成果可以被引用,且安全儲(chǔ)存,任何地點(diǎn)均可存儲(chǔ);功能強(qiáng)大,公共空間不設(shè)限,為用戶提供1 GB的私人空間,可存儲(chǔ)一些目前不想公開的數(shù)據(jù);鼓勵(lì)發(fā)表科研數(shù)據(jù)和圖表,體現(xiàn)開放科研的理念,成為科學(xué)研究的新工具以及現(xiàn)有科技出版模式的有益補(bǔ)充,可了解研究內(nèi)容的全部計(jì)量統(tǒng)計(jì),易于發(fā)現(xiàn)研究亮點(diǎn)[8,9]。
用戶首先進(jìn)入Figshare數(shù)據(jù)庫官方網(wǎng)站(https://figshare.com/),用戶點(diǎn)擊圖1中的“Sign up”進(jìn)入注冊(cè)頁面,圖2帶“*”號(hào)的為必填信息,信息填寫完成后,點(diǎn)擊下面“Sign up now”即可完成注冊(cè),該注冊(cè)過程完全免費(fèi)。注冊(cè)后用戶會(huì)收到一封郵件,該郵件是為了確定注冊(cè)者是否為該賬戶的擁有者。用戶點(diǎn)擊郵箱鏈接來激活賬戶,登錄郵箱和密碼后即成功注冊(cè)。無論是下載Figshare數(shù)據(jù)還是在Figshare平臺(tái)發(fā)布數(shù)據(jù),均須先登錄賬號(hào)。
圖1 Figshare主頁界面
圖2 Figshare賬號(hào)注冊(cè)頁面
Figshare平臺(tái)中所有數(shù)據(jù)均可免費(fèi)使用。在Figshare首頁,可以看見“Browse”版塊,其中顯示的是最近在Figshare平臺(tái)上發(fā)布的數(shù)據(jù)和被下載次數(shù)最多的文章標(biāo)題及其作者(圖3),此頁面可按科學(xué)研究方向分類,方便用戶查詢。訪問者若遇見自己感興趣的文章標(biāo)題,可直接點(diǎn)擊標(biāo)題,即可看到文章的具體信息和數(shù)據(jù)資料。如果用戶有具體的搜索方向,可在首頁“Search on figshare”搜索關(guān)鍵字。
圖3 Figshare數(shù)據(jù)庫瀏覽頁面
在“Search on figshare”可輸入的關(guān)鍵詞類型包括作者、標(biāo)題以及DOI號(hào)等。我們以搜索“neural stem cell”為例。在“Search on figshare”中搜索“neural stem cell”,搜索結(jié)果如圖4所示,結(jié)果可以按照Relevance、Posted date、Firsted online date、Acceptance date、Publication date進(jìn)行排序。圖中可以看到搜索結(jié)果里包含文章用過的表格、數(shù)據(jù)、及圖片等,根據(jù)自己所需點(diǎn)擊進(jìn)入,找到頁面里的下載符號(hào),即可下載。當(dāng)引用該文獻(xiàn)和數(shù)據(jù)時(shí),點(diǎn)擊頁面中“cite”,下載其引用格式。
圖4 neural stem cell搜索頁面
Figshare數(shù)據(jù)庫不僅只有文獻(xiàn)數(shù)據(jù)和表格等,用戶如果想用代碼操作或作圖時(shí),也可以在Figshare中搜索,搜索到代碼教程、腳本以及相關(guān)安裝包等。以搜索常用的R語言的一個(gè)包“ggplot”為例。同樣的,在“Search on figshare”中搜索“ggplot”,結(jié)果如圖5所示,在圖中我們可以看到相關(guān)的腳本、教程、軟件、數(shù)據(jù)、圖表等。
圖5 ggplot搜索界面
點(diǎn)擊腳本,可以看到1篇文獻(xiàn)所用的腳本,在其下方可看到引用和下載的標(biāo)識(shí),可以直接引用及下載。下載軟件后解壓縮后能看到許多需要的代碼。點(diǎn)擊教程(圖6~7),進(jìn)入頁面顯示的是繪制條形圖和散點(diǎn)圖的教程,包括源代碼、函數(shù)說明以及部分步驟截圖,清晰且全面。
圖6 條形圖和散點(diǎn)圖教程、源代碼及操作步驟
如今,大部分期刊要求投稿者將其研究數(shù)據(jù)公布出來,主要是為了鼓勵(lì)科研數(shù)據(jù)再次被科研人員利用起來,其次,也可以推動(dòng)科學(xué)研究的公開化、透明化。研究者在Figshare數(shù)據(jù)庫公布的數(shù)據(jù)可以被其他科研人員共享,用戶在平臺(tái)搜索數(shù)據(jù)時(shí),也可以發(fā)現(xiàn)使用該數(shù)據(jù)做出的文章,有助于提高出版商及作者的名譽(yù)和影響力。
圖7 條形圖和散點(diǎn)圖的函數(shù)說明
Figshare平臺(tái)主要服務(wù)于科研人員、出版商以及科研機(jī)構(gòu),其中主營對(duì)象是科研人員。與其他平臺(tái)相比,F(xiàn)igshare平臺(tái)服務(wù)有四項(xiàng)獨(dú)具特色的服務(wù)。①平臺(tái)接受大部分格式的研究結(jié)果,如視頻、音頻、PDF等,是其他平臺(tái)很難做到的。②只要科研人員上傳成果,即可享有DOI,本人可自行決定是否將其數(shù)據(jù)公開。③平臺(tái)提供在線合作空間,可以給自己的合作伙伴共享私密的個(gè)人數(shù)據(jù),以便更好的提升其價(jià)值。④Figshare API服務(wù),自動(dòng)化的研究工作流程。
科研人員在Figshare平臺(tái)上傳數(shù)據(jù)主要有10個(gè)步驟,具體如下:①在Figshare官網(wǎng)首頁找到創(chuàng)建新項(xiàng)目按鈕,在文件中找到自己的成果,完成后出現(xiàn)圖8。②插入標(biāo)題,爭取最大限度地暴露數(shù)據(jù)的信息。③添加作者,用戶可以重新排列作者的出現(xiàn)順序,如果您是替別人上傳,可將自己名字刪除,如要添加沒有Figshare賬戶的作者,可選擇“add author details”并輸入他們的名字、電子郵件地址(可選)和身份識(shí)別碼ORCID(可選)。④可選擇多個(gè)類別,如果找不到,可以找到最好的選擇,然后在底下的關(guān)鍵字更加具體一點(diǎn)。⑤下拉菜單選擇項(xiàng)目類型,該平臺(tái)可以接受任何文件形式。⑥添加更具體的關(guān)鍵字,可任意添加多個(gè)關(guān)鍵字,只需在每個(gè)關(guān)鍵字后面按Enter鍵,平臺(tái)就會(huì)記住之前的關(guān)鍵字,方便其他人找到。⑦寫一個(gè)描述,包括研究所用的方法、數(shù)據(jù)收集或法律道德要求的信息。⑧還可加入與數(shù)據(jù)相關(guān)的資助信息以及與研究成果相關(guān)的其他材料參考。⑨選擇許可證,可決定其他人如何再利用該數(shù)據(jù),可根據(jù)需求從多個(gè)許可中進(jìn)行選擇。⑩勾選“發(fā)布”,系統(tǒng)將提示檢查已分配的許可證以及使用條款。如所在機(jī)構(gòu)已經(jīng)開始審閱,則會(huì)提示,該項(xiàng)目在公開發(fā)送之前以供審閱,確保提交內(nèi)容是準(zhǔn)確的,一旦發(fā)布,DOI可共享發(fā)布,公共數(shù)據(jù)也可在社交媒體上共享,生成私有鏈接,以便共享其私人數(shù)據(jù)。
圖8 上傳數(shù)據(jù)操作頁面
本文主要詳細(xì)介紹了在Figshare平臺(tái)上傳和下載數(shù)據(jù),如讀者有其它與Figshare平臺(tái)相關(guān)問題,進(jìn)入(https://help.figshare.com/)網(wǎng)站,圖9是該網(wǎng)站頁面,用戶所遇到的問題基本在此均可得到解答。
圖9 help.figshare主頁面
Figshare數(shù)據(jù)庫是一個(gè)覆蓋全科領(lǐng)域的數(shù)據(jù)庫。與其它數(shù)據(jù)庫相比,它可接受任何格式的科研成果,上傳成果均可享有DOI等各項(xiàng)優(yōu)勢(shì)。此外,F(xiàn)igshare平臺(tái)還與20多家知名出版社合作,更加高效地實(shí)現(xiàn)數(shù)據(jù)共享。平臺(tái)通過給研究成果分配DOI,使得科研數(shù)據(jù)的利用率以及研究人員和出版商的學(xué)術(shù)聲譽(yù)都得到了提高??蒲袛?shù)據(jù)的免費(fèi)使用、操作頁面方便簡單等一系列優(yōu)勢(shì)使得Figshare數(shù)據(jù)庫受到科研人員的一致贊賞。文章詳細(xì)介紹了在該平臺(tái)搜索、下載數(shù)據(jù),上傳數(shù)據(jù)。Figshare平臺(tái)以提高學(xué)術(shù)研究的傳播性、可重用性和可發(fā)現(xiàn)性為主要目標(biāo),以各種形式呈現(xiàn)的研究成果能夠更好地被引用、發(fā)現(xiàn)以及分享為服務(wù)理念,以研究工作流程的簡化為唯一的服務(wù)宗旨,此平臺(tái)將會(huì)逐漸發(fā)展壯大。