田稷,陳琿夏
?
數(shù)據(jù)期刊及數(shù)據(jù)論文定量分析與思考
田稷,陳琿夏
摘要文章在比較數(shù)據(jù)期刊、數(shù)據(jù)論文與傳統(tǒng)學(xué)術(shù)期刊、學(xué)術(shù)論文異同的基礎(chǔ)上,定量分析當(dāng)前幾種具有代表性數(shù)據(jù)期刊及數(shù)據(jù)論文情況,并對高校圖書館的相關(guān)工作提出建議。
關(guān)鍵詞數(shù)據(jù)數(shù)據(jù)期刊數(shù)據(jù)論文
引用本文格式田稷,陳琿夏.數(shù)據(jù)期刊及數(shù)據(jù)論文定量分析與思考[J].圖書館論壇,2016(3):42- 48.
Quantitative Analysis and Study on Data Journal and Data Paper
TIAN Ji,CHEN Hui- xia
Abstract Comparing the similarities and differences between data journals,data papers and traditional academic journals and academic papers,this paper analyzes quantitatively the current situation of the data papers from several representative data journals,and puts forward some suggestions on the relevant work of university libraries. Keywords data;data journal;data paper
大數(shù)據(jù)時代的來臨促成了以數(shù)據(jù)密集型計算為基礎(chǔ)的科學(xué)研究第四范式[1]的誕生。新范式下的學(xué)術(shù)研究與交流需要相關(guān)的科學(xué)數(shù)據(jù)和文獻(xiàn)實現(xiàn)互操作,讓人們閱讀論文的同時還可以找到論文的原始數(shù)據(jù),重復(fù)作者所做的實驗與分析,或者能夠從數(shù)據(jù)出發(fā)找到與其相關(guān)文獻(xiàn)。在此環(huán)境下,科學(xué)研究不再單純地由科學(xué)問題或假設(shè)驅(qū)動,科學(xué)數(shù)據(jù)本身成為重要的研究對象,數(shù)據(jù)共享問題引起廣泛關(guān)注。
谷歌的Peter Norvig曾說,科學(xué)是收集事實和發(fā)展理論的結(jié)合。在科學(xué)研究過程中,廣大科研人員在收集事實數(shù)據(jù)方面投入了大量的時間、精力與經(jīng)費(fèi),他們不僅希望能收集、研究、歸檔產(chǎn)生的數(shù)據(jù),還希望能合法地使用他人產(chǎn)生的數(shù)據(jù),特別是支撐關(guān)鍵發(fā)現(xiàn)的數(shù)據(jù)。之前,機(jī)構(gòu)知識庫、科學(xué)數(shù)據(jù)管理平臺等陸續(xù)出現(xiàn),數(shù)據(jù)的歸檔和檢索有了許多解決方案,但科學(xué)數(shù)據(jù)推廣利用的深度、廣度和速度遠(yuǎn)遠(yuǎn)不能滿足新的科研范式的需求。在此背景下,Nature、Wiley等相繼推出了以在線方式發(fā)行的數(shù)據(jù)期刊,專門刊載符合相關(guān)學(xué)術(shù)規(guī)范的數(shù)據(jù)論文,但目前這一發(fā)行和發(fā)文方式對國內(nèi)大多數(shù)科研人員和圖書館館員來說是一個相對陌生的事物。本文在比較數(shù)據(jù)期刊、數(shù)據(jù)論文與傳統(tǒng)學(xué)術(shù)期刊、學(xué)術(shù)論文異同的基礎(chǔ)上,定量分析目前幾個主要的數(shù)據(jù)期刊及數(shù)據(jù)論文情況,并對高校圖書館的相關(guān)工作提出一些建議,以期讓更多的國內(nèi)科研人員和同行了解并利用。
傳統(tǒng)的學(xué)術(shù)論文是某一學(xué)術(shù)課題在實驗性、理論性或預(yù)測性上具有新的科學(xué)研究成果或創(chuàng)新見解和知識的科學(xué)記錄,或是某種已知原理應(yīng)用于實踐上取得新進(jìn)展的科學(xué)總結(jié),用以提供學(xué)術(shù)會議上宣讀、交流、討論或?qū)W術(shù)刊物上發(fā)表,或用作其他用途的書面文件。數(shù)據(jù)論文則是一種特殊類型的學(xué)術(shù)論文,用于展示研究相關(guān)的關(guān)鍵數(shù)據(jù)集,包括描述數(shù)據(jù)內(nèi)容、數(shù)據(jù)產(chǎn)生背景、數(shù)據(jù)質(zhì)量和結(jié)構(gòu)的元數(shù)據(jù)文件。它遵從學(xué)術(shù)發(fā)表規(guī)范,接受嚴(yán)格的同行評議,也是一種正式的學(xué)術(shù)論文,其引用也可以被用于科研評價體系,從而激勵科學(xué)家更多地分享科研數(shù)據(jù)。數(shù)據(jù)論文與其描述的公開發(fā)布的數(shù)據(jù)相鏈接,這個鏈接包含在文章內(nèi)部,它是對在線數(shù)據(jù)集或一組數(shù)據(jù)集進(jìn)行描述的元數(shù)據(jù)文檔,遵循一定的數(shù)據(jù)標(biāo)準(zhǔn),計算機(jī)可讀、可檢索[2]。數(shù)據(jù)論文與傳統(tǒng)學(xué)術(shù)論文在內(nèi)容上最大的區(qū)別在于它并不重點(diǎn)報道基于科學(xué)假設(shè)和科學(xué)問題的研究結(jié)果,而是重點(diǎn)描述科學(xué)數(shù)據(jù)本身。數(shù)據(jù)論文在形式上一般包括摘要、背景介紹、數(shù)據(jù)方法、數(shù)據(jù)集、數(shù)據(jù)說明、附加信息六大塊內(nèi)容。與傳統(tǒng)學(xué)術(shù)論文在形式上最大的不同在于其包括數(shù)據(jù)方法、指向數(shù)據(jù)集的鏈接及相關(guān)的數(shù)據(jù)集。
傳統(tǒng)的學(xué)術(shù)期刊產(chǎn)生至今已有340多年的歷史,充分發(fā)揮了刊載科研成果、開展學(xué)術(shù)交流、培養(yǎng)學(xué)術(shù)人才、促進(jìn)知識積累與創(chuàng)新的重要作用。學(xué)術(shù)期刊是一種經(jīng)過同行評審的期刊,發(fā)表在學(xué)術(shù)期刊上的文章通常涉及特定的學(xué)科,它展示了研究領(lǐng)域的成果,并起到了公示的作用,其內(nèi)容主要以原創(chuàng)研究、綜述文章、書評等形式的文獻(xiàn)為主[3]。學(xué)術(shù)期刊的產(chǎn)生與一定的經(jīng)濟(jì)、政治、科技、文化的發(fā)展有關(guān),也與人們對學(xué)術(shù)信息的需求息息相關(guān)。數(shù)據(jù)期刊的產(chǎn)生也是信息需求發(fā)展的結(jié)果,是主要發(fā)表數(shù)據(jù)論文的期刊,是互聯(lián)網(wǎng)和大數(shù)據(jù)環(huán)境下產(chǎn)生的一種新型的期刊出版模式。與傳統(tǒng)學(xué)術(shù)期刊相同的是,它也是一種學(xué)術(shù)期刊,有著學(xué)術(shù)期刊屬性,也有同行評議、公開發(fā)表,也會被相關(guān)的數(shù)據(jù)庫收錄,其上發(fā)表的文章也會被他人引用等。但與傳統(tǒng)學(xué)術(shù)期刊不同的是:在內(nèi)容上,數(shù)據(jù)期刊主要描述科學(xué)實驗數(shù)據(jù)和觀察數(shù)據(jù),并進(jìn)行有效整合,力求在最大程度上促進(jìn)數(shù)據(jù)重用,幫助用戶了解和使用相關(guān)數(shù)據(jù);在形式上,傳統(tǒng)的學(xué)術(shù)期刊本身就包括文獻(xiàn)所有內(nèi)容,而數(shù)據(jù)期刊的原始數(shù)據(jù)則大多存儲在另外的數(shù)據(jù)平臺,數(shù)據(jù)論文本身總是與其公開發(fā)布的數(shù)據(jù)集連接(通過URL或DOI)。
2.1代表性數(shù)據(jù)期刊概述
正式的數(shù)據(jù)期刊與數(shù)據(jù)論文出現(xiàn)至今不過3年時間,但已引起了廣泛關(guān)注,已有學(xué)者陸續(xù)在數(shù)據(jù)期刊上發(fā)表論文,并產(chǎn)生了引用。本文選取3種具有代表性的數(shù)據(jù)期刊,對其所刊登的數(shù)據(jù)論文進(jìn)行定量分析。3種代表性的數(shù)據(jù)期刊分別是由Nature出版集團(tuán)出版的Scientific Data(SD)、由Wiley出版集團(tuán)出版的Geoscience Data Journal (GDJ)和由Pensoft出版社出版的Biodiversity Data Journal(BDJ)。
Nature出版集團(tuán)是集紙本和電子出版為一體的科學(xué)和醫(yī)學(xué)信息的出版公司,旗下有多種高影響力期刊,如《科學(xué)美國人》《自然神經(jīng)科學(xué)》《自然生物學(xué)技術(shù)》等,其中最為著名的便是《自然》。Nature出版集團(tuán)于2013年4月公布其將在2014年春發(fā)行數(shù)據(jù)期刊Scientific Data,以最大化地重用、搜索、鏈接和挖掘數(shù)據(jù)[4]。Scientific Data(在線ISSN:2052- 4463)是一種開放獲取、在線出版、同行評議的期刊,刊登自然科學(xué)學(xué)科相關(guān)論文,但不限定特定領(lǐng)域。篩選論文的六個關(guān)鍵原則為信用(Credit)、重用(Reuse)、質(zhì)量(Quality)、發(fā)現(xiàn)(Discovery)、開放(Open)和服務(wù)(Service)。該刊設(shè)有在線投稿和追蹤系統(tǒng);發(fā)表數(shù)據(jù)論文時,作者需支付一定費(fèi)用。Scientific Data遵循知識共享署名許可協(xié)議(Creative Commons Licence),以促進(jìn)科學(xué)數(shù)據(jù)的開放獲取[5]。
John Wiley & Sons,Inc. (Wiley)創(chuàng)建于1807年,是一家全球?qū)W術(shù)出版公司,涉及科學(xué)、技術(shù)、醫(yī)學(xué)等領(lǐng)域,并在各專業(yè)領(lǐng)域與800余家學(xué)會開展了合作[6]。Wiley在2014年6月出版第一期Geoscience Data Journal (在線ISSN:2049- 6060),是一種開放獲取、同行評議的期刊,主要針對地球科學(xué)領(lǐng)域。該刊遵照知識共享署名許可協(xié)議(the Creative Commons Attribution License(CC- BY)),所刊登的數(shù)據(jù)論文描述相關(guān)數(shù)據(jù)集合的收集、處理過程及數(shù)據(jù)文件的格式,并給出相關(guān)數(shù)據(jù)集合的鏈接,但不涉及任何數(shù)據(jù)集合的科學(xué)分析或從數(shù)據(jù)中獲得任何結(jié)論。發(fā)表論文時,作者需支付一定的費(fèi)用[7]。
Pensoft出版公司1992年成立于保加利亞,是一家獨(dú)立的學(xué)術(shù)出版公司,最初專注于圖書出版,目前已發(fā)展成為一家開放存取雜志出版商,在生物多樣性領(lǐng)域出版多種開放存取期刊,如ZooKeys、Biodiversity Data Journal(BDJ)、phytokeys、mycokeys等[8]。Biodiversity Data Journal(在線ISSN:1314- 2828)于2013年9月16日正式上線,它也是一種同行評議、開放獲取的刊物,目前已被Medline數(shù)據(jù)庫收錄。它針對生物多樣性學(xué)科,遵照知識共享署名許可協(xié)議(Creative Commons Attribution License(CCBY4.0)),在恰當(dāng)引用的情況下,任何人都可以復(fù)制、傳播、利用文章。BDJ發(fā)表標(biāo)準(zhǔn)為獨(dú)創(chuàng)性、數(shù)據(jù)完整發(fā)布(數(shù)據(jù)論文所有的支持?jǐn)?shù)據(jù)必須公開發(fā)表)、論文結(jié)構(gòu)、前期研究(是否完整準(zhǔn)確引用)以及發(fā)表數(shù)據(jù)的機(jī)器可讀性等。BDJ的網(wǎng)上投稿系統(tǒng)集成了投稿、同行評議、發(fā)表、傳播的整個流程。目前作者在BDJ上發(fā)表論文是免費(fèi)的[9]。
不同數(shù)據(jù)期刊的數(shù)據(jù)論文內(nèi)容編排略有不同,詳見表1。
高科學(xué)價值的數(shù)據(jù)集是數(shù)據(jù)論文的核心所在,每一篇數(shù)據(jù)論文的發(fā)表前提是數(shù)據(jù)集必須向公眾公開,數(shù)據(jù)論文僅提供數(shù)據(jù)集的鏈接。由于數(shù)據(jù)期刊自身并不持有相關(guān)數(shù)據(jù),因此作者需要將數(shù)據(jù)論文完整的數(shù)據(jù)集保存在一個或多個公共數(shù)據(jù)存儲庫中。為便于數(shù)據(jù)的再利用,所有數(shù)據(jù)需保持其未經(jīng)加工的原始狀態(tài)。需要提交的數(shù)據(jù)包括計算數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)、實驗或觀測程序中產(chǎn)生的數(shù)據(jù)等。
在同行評議階段,編輯、編委會成員、評審將會對作者所提交的數(shù)據(jù)存儲庫進(jìn)行評估。Scientific Data和Geoscience Data Journal列出了推薦的數(shù)據(jù)存儲庫或數(shù)據(jù)中心。Scientific Data提出了可信的數(shù)據(jù)存儲庫需要滿足的一般標(biāo)準(zhǔn):在專業(yè)領(lǐng)域得到廣泛的支持和認(rèn)可;確保數(shù)據(jù)集的長期保存,維持與發(fā)表時一致的狀態(tài);提供專業(yè)管理;執(zhí)行相關(guān)的、專業(yè)認(rèn)可的報告要求;為提交的數(shù)據(jù)集提供機(jī)密審查;為提交的數(shù)據(jù)集提供穩(wěn)定的標(biāo)識符;允許公眾對數(shù)據(jù)的訪問不受不必要的限制[10]。Geoscience Data Journal數(shù)據(jù)存儲庫的推薦標(biāo)準(zhǔn)為在專業(yè)領(lǐng)域廣泛使用、擁有正式的數(shù)據(jù)管理策略、為數(shù)據(jù)集提供DOI或穩(wěn)定的URL及唯一的標(biāo)識符[11]。
表1數(shù)據(jù)論文編排形式
在數(shù)據(jù)長期保存方面,研究者、機(jī)構(gòu)、期刊和數(shù)據(jù)存儲庫承擔(dān)共同的責(zé)任。數(shù)據(jù)論文中描述的數(shù)據(jù)集必須保持永久可用。數(shù)據(jù)論文發(fā)表后,作者必須承諾在自己的實驗室或機(jī)構(gòu)服務(wù)器上保存相關(guān)數(shù)據(jù)集至少5年。在這段時間內(nèi),若原先提交的數(shù)據(jù)存儲庫消失或數(shù)據(jù)丟失,數(shù)據(jù)期刊可要求作者將數(shù)據(jù)集上傳至另一個數(shù)據(jù)存儲庫中,并在數(shù)據(jù)論文中作出更正和更新。若作者從公共數(shù)據(jù)存儲庫中移除了數(shù)據(jù)集或更改了訪問標(biāo)準(zhǔn),數(shù)據(jù)期刊可要求作者更正其數(shù)據(jù)論文,甚至在極端情況下,撤回該數(shù)據(jù)論文[12]。
2.2對比分析
2.2.1發(fā)文量及學(xué)科分布
Scientific Data每半月更新一次,2014年3 月11日至2015年3月31日共發(fā)表68篇論文,其中數(shù)據(jù)論文62篇(占91.18%)。由于自然科學(xué)所有學(xué)科相關(guān)的數(shù)據(jù)論文均可在Scientific Data上發(fā)表,相比其他限定某一領(lǐng)域的數(shù)據(jù)期刊而言,它包含的主題更為全面。
Geoscience Data Journal分別于2014年6月和2014年11月出版了兩期期刊,共有17篇論文,其中數(shù)據(jù)論文14篇(占82.4%)。該刊論文主要針對地球科學(xué)領(lǐng)域,包括但不限于天氣和氣候、海洋學(xué)、大氣和海洋化學(xué)、冰凍層、生物圈、地表和地質(zhì)學(xué)、水文地理學(xué)、地球化學(xué)、地球物理學(xué)、行星及空間學(xué)等。
2013年9月16日至2015年3月20日,Biodiversity Data Journal不定期更新,共發(fā)表163篇論文,其中數(shù)據(jù)論文18篇(占11.04%)。該刊論文主要針對生物多樣性學(xué)科。
3種數(shù)據(jù)期刊發(fā)表的數(shù)據(jù)論文所涉學(xué)科分布見表2。
表2數(shù)據(jù)論文學(xué)科分布
從表2可見,Scientific Data收錄論文學(xué)科范圍最廣,且生物、醫(yī)學(xué)占據(jù)絕大部分。同時還表明,數(shù)據(jù)論文多產(chǎn)生于生物、醫(yī)學(xué)、地球科學(xué)等實驗觀測數(shù)據(jù)量較大的學(xué)科。
2.2.2接收—錄用—發(fā)表周期
論文從接收到發(fā)表的時間周期對作者投稿具有參考指導(dǎo)作用。根據(jù)每一篇數(shù)據(jù)論文的接收(received)日期、錄用(accepted)日期和發(fā)表(published)日期,計算每一種數(shù)據(jù)期刊數(shù)據(jù)論文的平均接收—錄用周期(從接收到錄用所需天數(shù)的平均值)、平均錄用—發(fā)表周期(從錄用到發(fā)表所需天數(shù)的平均值)和平均接收—發(fā)表周期(從接收到發(fā)表所需天數(shù)的平均值),結(jié)果如表3所示??梢姡捎跀?shù)據(jù)論文要經(jīng)過投稿、同行評議、修改、錄用直至發(fā)表的整個流程,因此需要一定的論文審閱處理時間。不同數(shù)據(jù)期刊的論文審閱處理時間差異較大,其中Biodiversity Data Journal的接收—錄用—發(fā)表周期最短。
2.2.3作者國籍及國際合作
作為代表一種新興科學(xué)研究范式的數(shù)據(jù)期刊和數(shù)據(jù)論文,論文作者數(shù)反映了成果的合作程度,作者的國籍從一定程度上反映了該國科技發(fā)展的領(lǐng)先程度。3種期刊的論文作者數(shù)及第一作者國籍情況詳見表4。
表3數(shù)據(jù)論文平均接收-錄用周期、平均錄用-發(fā)表周期、平均接收-發(fā)表周期
Scientific Data刊登的數(shù)據(jù)論文中,平均每篇論文有12.15名作者,美國、英國、瑞士三國作者較多。在數(shù)據(jù)論文中,所有的作者來自同一國家的有34篇(占54.84%),國際合作論文為28 篇(占45.16%)。
Geoscience Data Journal刊登的數(shù)據(jù)論文中,平均每篇論文有7名作者,英國、美國、荷蘭三國作者發(fā)表了較多的數(shù)據(jù)論文。在數(shù)據(jù)論文中,所有的作者來自同一國家的有8篇(占57.14%),國際合作論文為6篇(占42.86%)。
Biodiversity Data Journal刊登的數(shù)據(jù)論文中,平均每篇論文有9.44名作者。由于樣本數(shù)較少,各國作者發(fā)表論文差異不大,法國、英國、希臘、巴西四國作者發(fā)表了較多的數(shù)據(jù)論文。在數(shù)據(jù)論文中,所有的作者來自同一國家的有11 篇(占61.11% ),國際合作論文為7篇(占38.89%)。
表4數(shù)據(jù)論文作者數(shù)及第一作者國籍
統(tǒng)計結(jié)果表明,由于科學(xué)數(shù)據(jù)的產(chǎn)生需要大量的觀察、實驗工作,因此需要眾多科學(xué)研究者互相合作。3種數(shù)據(jù)期刊的平均作者數(shù)統(tǒng)計見表5。從表5可見,數(shù)據(jù)論文的作者數(shù)較多,而其中國際合作的比例達(dá)到了40%左右。
2.2.4作者機(jī)構(gòu)類型及跨機(jī)構(gòu)合作
論文作者的機(jī)構(gòu)類型反映出這一新型科學(xué)研究范式最先影響并得以接受的行業(yè)范圍。Scientific Data刊登的數(shù)據(jù)論文中,作者來自同一機(jī)構(gòu)的為15篇(占24.19% ),跨機(jī)構(gòu)合作(數(shù)據(jù)論文的作者來自不同機(jī)構(gòu))有47篇(占75.81% )。Scientific Data的作者機(jī)構(gòu)可劃分為高校、科研院所、企業(yè)等3類。數(shù)據(jù)論文的作者來源于單一機(jī)構(gòu)類型的有33篇(占53.23%),作者來源于多種機(jī)構(gòu)類型的有29篇(占46.77%)。其中涉及到產(chǎn)學(xué)研合作(企業(yè)與科研院所、高等學(xué)校之間的合作)的數(shù)據(jù)論文有7篇,占論文總數(shù)的11.29%。
表5數(shù)據(jù)論文平均論文作者數(shù)及國際合作論文比例
Geoscience Data Journal刊登的數(shù)據(jù)論文中,作者來源同一機(jī)構(gòu)的為6篇(占42.86%),跨機(jī)構(gòu)合作的為8篇(占57.14%)。數(shù)據(jù)論文的作者來源于單一機(jī)構(gòu)類型的有10篇(占71.43%),作者來源于多種機(jī)構(gòu)類型的有4篇(占28.57%)。
Biodiversity Data Journal刊登的數(shù)據(jù)論文中,作者來源同一機(jī)構(gòu)的為5篇(占27.78%),跨機(jī)構(gòu)合作的為13篇(占72.22%)。數(shù)據(jù)論文的作者來源于單一機(jī)構(gòu)類型的有7篇(占38.89%),作者來源于多種機(jī)構(gòu)類型的有11篇(占61.11%)。
表6數(shù)據(jù)論文作者機(jī)構(gòu)類型分布
綜上,可知Scientific Data和Biodiversity Data Journal的跨機(jī)構(gòu)合作比例較高,均超過70%。Scientific Data由于所覆蓋的學(xué)科范圍較廣,其機(jī)構(gòu)類型也較為豐富,有11.29%的論文屬于產(chǎn)學(xué)研合作。Biodiversity Data Journal的特點(diǎn)是超過60%的數(shù)據(jù)論文作者都來源于不同的機(jī)構(gòu)類型。
從上述定量分析可以看出,數(shù)據(jù)期刊與數(shù)據(jù)論文正在迅速發(fā)展,相關(guān)的規(guī)范與標(biāo)準(zhǔn)仍在完善之中。隨著越來越多科學(xué)數(shù)據(jù)的產(chǎn)生、存儲與共享,以數(shù)據(jù)密集型計算為基礎(chǔ)的科學(xué)研究的第四范式對科研模式的影響范圍越來越大,相信數(shù)據(jù)論文將會得到更快的發(fā)展。由于數(shù)據(jù)期刊與機(jī)構(gòu)知識庫同科學(xué)數(shù)據(jù)管理平臺相比,它既擁有傳統(tǒng)學(xué)術(shù)期刊的優(yōu)勢,在傳播的廣度、深度和速度上又更勝一籌,作者還能得到更好的交流、認(rèn)可與回報。因此,可以預(yù)測數(shù)據(jù)期刊將會在很大程度上彌補(bǔ)機(jī)構(gòu)知識庫、科學(xué)數(shù)據(jù)管理平臺數(shù)據(jù)來源被動的缺陷,將會得到越來越多的科研人員關(guān)注、認(rèn)可、利用與投稿。
同時,從以上數(shù)據(jù)可以看到,目前數(shù)據(jù)期刊和數(shù)據(jù)論文都以發(fā)達(dá)國家為主,我國目前尚沒有真正意義上的數(shù)據(jù)期刊,我國科研人員在數(shù)據(jù)期刊上發(fā)表的數(shù)據(jù)論文也非常少,這與我國的科學(xué)研究與學(xué)術(shù)期刊的歷史不長、本身存在較多問題有關(guān)。但在互聯(lián)網(wǎng)時代,中國期刊不應(yīng)忽視新環(huán)境帶來的新的發(fā)展機(jī)遇,需要奮起直追,不能重蹈傳統(tǒng)期刊的覆轍,仍落后于發(fā)達(dá)國家。
無論是數(shù)據(jù)期刊還是數(shù)據(jù)論文,都是大數(shù)據(jù)時代新生的出版類型,它們的興起與發(fā)展,將對出版業(yè)、圖書館、數(shù)據(jù)倉儲機(jī)構(gòu)等產(chǎn)生深遠(yuǎn)的影響,甚至發(fā)展到一定的階段將會引發(fā)科技政策和科研評價方法的變革。因此,出版社、圖書館、數(shù)據(jù)倉儲機(jī)構(gòu)、科研管理相關(guān)部門都應(yīng)該積極應(yīng)對,盡早布局。對圖書館界而言,應(yīng)該發(fā)揮自己的優(yōu)勢,至少可以在如下五個方面發(fā)揮作用:
(1)數(shù)據(jù)期刊與數(shù)據(jù)論文的收集、整合與揭示。由于目前數(shù)據(jù)期刊大都為在線OA模式,圖書館有責(zé)任對此新型文獻(xiàn)進(jìn)行收集、整理并揭示給自己的用戶,讓讀者能夠及時了解和利用這些科研數(shù)據(jù)。
(2)數(shù)據(jù)期刊與數(shù)據(jù)論文特征分析與咨詢指導(dǎo)。由于數(shù)據(jù)期刊與數(shù)據(jù)論文對大多數(shù)科研人員來講都是一種新的文獻(xiàn)類型,圖書館員可以在充分學(xué)習(xí)與了解的基礎(chǔ)之上,對數(shù)據(jù)期刊的投稿方法、數(shù)據(jù)論文的撰寫規(guī)范等向相關(guān)科研人員提供指導(dǎo)。
(3)參與數(shù)據(jù)論文規(guī)范與標(biāo)準(zhǔn)的制定。以中文數(shù)據(jù)論文為例,目前中文數(shù)據(jù)論文存在的問題主要包括:沒有專業(yè)的數(shù)據(jù)存儲平臺,沒有對數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)定和說明,對數(shù)據(jù)的管理僅停留在論文附屬資料的簡單層面;沒有對數(shù)據(jù)共享、傳播、重用、演繹等作明確說明,或者沒有對數(shù)據(jù)引用格式作詳細(xì)說明。因此,圖書館應(yīng)充分發(fā)揮圖書編目工作中積累的元數(shù)據(jù)標(biāo)準(zhǔn)制定經(jīng)驗的優(yōu)勢,積極參與到相關(guān)規(guī)范與標(biāo)準(zhǔn)的制定過程中,在這種新型學(xué)術(shù)生態(tài)的生態(tài)鏈中發(fā)揮更為積極、主動的作用。
(4)為數(shù)據(jù)論文的存儲提供解決空間與方案。在目前數(shù)據(jù)期刊的數(shù)據(jù)存儲解決方案中,數(shù)據(jù)論文的原始數(shù)據(jù)大多存儲在另外的存儲平臺。在“數(shù)據(jù)為王”的時代,我國高?;蛳嚓P(guān)的研究機(jī)構(gòu)必須進(jìn)行相應(yīng)的前瞻性規(guī)劃,對自己的科研數(shù)據(jù)進(jìn)行系統(tǒng)性收集、規(guī)范、整合,圖書館作為信息收集、保存與揭示的機(jī)構(gòu),理應(yīng)擔(dān)此重任,及早籌謀。
(5)建立集數(shù)據(jù)和文獻(xiàn)于一體的新型數(shù)字圖書館,形成數(shù)據(jù)與信息融合的互操作架構(gòu)。高校圖書館的主要任務(wù)是為教學(xué)和科研提供文獻(xiàn)信息服務(wù),當(dāng)傳統(tǒng)的科研范式發(fā)生巨大變革時,圖書館也應(yīng)跟進(jìn),在原有數(shù)字圖書館的基礎(chǔ)之上,打造新型數(shù)字圖書館,以使科學(xué)研究的整個過程都可以在數(shù)字圖書館環(huán)境中進(jìn)行,使科學(xué)研究的素材、思路、過程和結(jié)論都能夠得到有效傳播、共享和利用。
參考文獻(xiàn)
[1] Hey T,Tansley S,Tolle K. The fourth paradigm:data- intensive scientific discovery [EB/OL]. [2015- 09-03]. http://research.microsoft.com/en- us/collaboration/ fourthparadigm/.
[2]劉鳳紅,崔金鐘,韓芳橋,等.數(shù)據(jù)論文:大數(shù)據(jù)時代新興學(xué)術(shù)論文出版類型探討[J].科技期刊研究,2014,25(12):1451- 1456.
[3]學(xué)術(shù)期刊[EB/OL]. [2015- 08- 09]. http://baike.baidu. com/view/848379.htm.
[4] Nature Publishing Group.Press release archive[EB/OL]. [2015- 09- 03]. http:// www.nature.com/press_releases/ scientificdata.html.
[5] Scientific Data. About[EB/OL].[2015- 08- 06]. http:// www.nature.com/sdata/about.
[6] Wiley. Corporate Information[EB/OL].[2015- 09- 03]. http://as.wiley.com/ WileyCDA/ Section/id- 301695. html.
[7] WileyOnline Library.Overview[EB/OL].[2015- 08- 06]. http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049- 6060/homepage/ProductInformation.html.
[8] Pensoft. About Pensoft[EB/OL].[2015- 09- 03]. http:// www.pensoft.net/about.php.
[9] Biodiversity Data Journal.About[EB/OL].[2015- 08- 06]. http://biodiversitydatajournal.com/about.
[10] [12]Nature Publishing Group. Data policies [EB/OL]. [2015- 09- 03]. http:// www.nature.com/sdata/ data- policies.
[11] Wiley Online Library. Author Guidelines [EB/OL]. [2015- 09- 03]. http://onlinelibrary.wiley.com/journal/ 10.1002/(ISSN)2049- 6060/homepage/ForAuthors. html#dataset_submission.
收稿日期2015- 08- 21
作者簡介田稷,女,碩士,副研究館員,浙江大學(xué)圖書館副館長;陳琿夏,女,碩士,浙江大學(xué)圖書館助理館員。