■王德莊 姜 鑫
1)黑龍江大學(xué)圖書館,黑龍江省哈爾濱市學(xué)府路74號(hào) 150080 2)黑龍江大學(xué)信息管理學(xué)院,黑龍江省哈爾濱市學(xué)府路74號(hào) 150080 3)黑龍江大學(xué)信息資源管理研究中心,黑龍江省哈爾濱市學(xué)府路74號(hào) 150080
英國(guó)皇家學(xué)會(huì)(Royal Society)在《科學(xué)是開放事業(yè)》(Science as an Open Enterprise)研究報(bào)告中指出:開放探究(Open Inquiry)是科學(xué)事業(yè)的核心。發(fā)表科學(xué)理論及其所依據(jù)的實(shí)驗(yàn)和觀測(cè)數(shù)據(jù),可以使他人發(fā)現(xiàn)錯(cuò)誤以及支持、否定或完善理論,并可重用數(shù)據(jù)以獲得進(jìn)一步的理解與發(fā)現(xiàn)??茖W(xué)強(qiáng)大的自我糾正能力來自審查與質(zhì)疑的開放性。以往在科技期刊發(fā)表一篇論文需要提供完整的數(shù)據(jù)以供查驗(yàn),然而過去幾十年里的科技進(jìn)步產(chǎn)生了巨大的“數(shù)據(jù)泛濫”(Data Deluge),以致于任何期刊都無法刊載如此龐大而復(fù)雜的數(shù)據(jù),這使得科學(xué)研究的兩個(gè)互為補(bǔ)充的重要組成部分——“思想”和“證據(jù)”被過于頻繁地分離開來,由此產(chǎn)生的嚴(yán)重的“數(shù)據(jù)鴻溝”(Data Gap)不利于對(duì)科學(xué)結(jié)論進(jìn)行嚴(yán)格審查,從而破壞了科學(xué)的自我糾正機(jī)制[1]。目前,傳統(tǒng)學(xué)術(shù)期刊囿于篇幅所限僅能作為“思想”的主要載體,而作為“證據(jù)”的大量數(shù)據(jù)已經(jīng)脫離了依據(jù)其而發(fā)表的結(jié)論?!八枷搿焙汀白C據(jù)”的割裂使得傳統(tǒng)學(xué)術(shù)出版面臨日益嚴(yán)重的“可重復(fù)性危機(jī)”(Reproducibility Crisis)。Nature期刊的一項(xiàng)調(diào)查研究表明:超過70%的科研人員嘗試過但無法復(fù)制另一位科學(xué)家的實(shí)驗(yàn),超過半數(shù)的科研人員未能復(fù)制自己的實(shí)驗(yàn);約80%的受訪者認(rèn)為資助者和出版商應(yīng)采取更多措施來提高可重復(fù)性[2]。近年來,越來越多的傳統(tǒng)學(xué)術(shù)期刊已經(jīng)開始制定并發(fā)布科學(xué)數(shù)據(jù)政策,要求將期刊論文所依據(jù)的科學(xué)數(shù)據(jù)存儲(chǔ)在可公開訪問的數(shù)據(jù)存儲(chǔ)庫(kù)中,使得任何人都可以公開訪問與查驗(yàn)支撐論文研究結(jié)論的科學(xué)數(shù)據(jù),以期努力彌合因“思想”和“證據(jù)”的分離而產(chǎn)生的“數(shù)據(jù)鴻溝”。
目前,針對(duì)學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策的國(guó)內(nèi)外相關(guān)研究已有一定研究積累。吳蓉等[3]分析了Science、ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica(PNAS)、Nature期刊以及PLOS、BMC等出版社及數(shù)據(jù)庫(kù)旗下期刊的科學(xué)數(shù)據(jù)政策,從數(shù)據(jù)提交政策、數(shù)據(jù)審查政策和數(shù)據(jù)權(quán)益政策3個(gè)方面提煉了其政策要素。羅曉蘭等[4]利用問卷調(diào)查法調(diào)研了國(guó)內(nèi)學(xué)術(shù)期刊的科學(xué)數(shù)據(jù)政策對(duì)作者投稿意愿的影響作用。Hardwicke等[5]利用相關(guān)分析法和因果推斷法定量評(píng)估了Cognition期刊引入的強(qiáng)制性開放數(shù)據(jù)政策對(duì)數(shù)據(jù)可用性、可重用性和可重復(fù)性的影響。Jones等[6]利用案例研究法分析了兩大學(xué)術(shù)出版商Taylor & Francis和Springer Nature的科學(xué)數(shù)據(jù)政策,探討了學(xué)術(shù)出版商為滿足科研人員的數(shù)據(jù)共享要求而采用標(biāo)準(zhǔn)化科學(xué)數(shù)據(jù)政策時(shí)必須考慮的關(guān)鍵因素。Christian等[7]利用問卷調(diào)查法和內(nèi)容分析法調(diào)研了編輯和作者對(duì)學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策的認(rèn)知情況。王丹丹等[8]利用網(wǎng)站調(diào)研法和內(nèi)容分析法調(diào)研了學(xué)術(shù)出版商Springer Nature制定的科學(xué)數(shù)據(jù)政策標(biāo)準(zhǔn)框架及其推動(dòng)科學(xué)數(shù)據(jù)政策標(biāo)準(zhǔn)化的實(shí)踐進(jìn)展。劉鳳紅等[9]利用案例研究法分析了學(xué)術(shù)出版商Springer Nature、Taylor & Francis、Elsevier和Wiley的科學(xué)數(shù)據(jù)政策實(shí)踐及其支持FAIR原則的實(shí)現(xiàn)路徑。秦長(zhǎng)江等[10]利用網(wǎng)站調(diào)研法和內(nèi)容分析法調(diào)研了管理學(xué)、政治學(xué)、教育學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)和語言學(xué)6個(gè)社會(huì)科學(xué)學(xué)科的國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策。可見,目前國(guó)內(nèi)外相關(guān)研究主要針對(duì)學(xué)術(shù)期刊和學(xué)術(shù)出版商的科學(xué)數(shù)據(jù)政策實(shí)踐進(jìn)行調(diào)研分析,采用的研究方法主要是網(wǎng)站調(diào)研法、問卷調(diào)查法、內(nèi)容分析法和案例研究法,缺乏從政策量化分析的研究視角展開的政策分析與評(píng)估研究。本研究將質(zhì)性文本分析方法與軟件工具引入學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策類定量化研究,從質(zhì)性文本分析的研究視角針對(duì)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策進(jìn)行政策評(píng)估分析并提煉政策內(nèi)容要素,以期為國(guó)內(nèi)學(xué)術(shù)出版機(jī)構(gòu)制定與完善其學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策提出具有針對(duì)性、指導(dǎo)性的政策建議。
本研究將國(guó)外學(xué)術(shù)出版商和學(xué)術(shù)組織兩類學(xué)術(shù)出版機(jī)構(gòu)制定的獨(dú)立的學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策作為調(diào)研對(duì)象,其政策文件形式包括“科學(xué)數(shù)據(jù)政策”“數(shù)據(jù)可用性政策”“數(shù)據(jù)驗(yàn)證政策”“開放數(shù)據(jù)政策”“數(shù)據(jù)共享政策”“數(shù)據(jù)存檔政策”“數(shù)據(jù)透明度政策”等。此外,上述兩類政策主體制定的“編輯政策”“作者指南”“投稿指南”等政策文件中也可能包含與科學(xué)數(shù)據(jù)相關(guān)的政策內(nèi)容,本研究未選取這類與科學(xué)數(shù)據(jù)相關(guān)的非獨(dú)立政策文件作為調(diào)研對(duì)象。整理歸納Springer Nature、Elsevier、Taylor & Francis等學(xué)術(shù)出版商和英國(guó)皇家化學(xué)學(xué)會(huì)(Royal Society of Chemistry,RSC)、美國(guó)地質(zhì)學(xué)會(huì)(Geological Society of America,GSA)、美國(guó)經(jīng)濟(jì)學(xué)會(huì)(American Economic Association,AEA)等學(xué)術(shù)組織最新發(fā)布的具有代表性、規(guī)范性和指導(dǎo)性的學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本如表1所示。表1還列舉了Nature、PLOSONE、InternationalEconomicReview等部分學(xué)術(shù)期刊的科學(xué)數(shù)據(jù)政策,并統(tǒng)計(jì)了部分學(xué)術(shù)出版商和學(xué)術(shù)組織目前出版的學(xué)術(shù)期刊數(shù)量,即其制定的學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策所涵蓋的學(xué)術(shù)期刊數(shù)量。
將23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本導(dǎo)入NVivo 12軟件,在“詞頻條件”的“分組”方式中選擇“留存的詞根”,生成上述23個(gè)政策文本的高頻詞云圖(圖1),圖中出現(xiàn)的高頻詞的字體大小與該詞根在全部政策文本中出現(xiàn)的詞頻高低成比例,依據(jù)其在政策文本中出現(xiàn)的詞頻高低排列,詞頻較高的高頻詞包括data、researchers、available、authors′、sharing、repository、publicly、journals′、include、policy等。
圖1 23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本高頻詞云圖
利用質(zhì)性文本分析法構(gòu)建類目體系主要有兩種方式:推論式類目構(gòu)建(Deductive Category Construction)和歸納式類目構(gòu)建(Inductive Category Construction)。推論式類目構(gòu)建是指采用收集實(shí)證數(shù)據(jù)之前就存在的類目系統(tǒng);歸納式類目構(gòu)建是指直接使用實(shí)證數(shù)據(jù)來構(gòu)建類目[34]。本研究采用歸納式類目構(gòu)建方法,針對(duì)政策文本直接構(gòu)建分析類目。首先根據(jù)學(xué)術(shù)期刊所涉及的數(shù)據(jù)生命周期階段劃分為5個(gè)一級(jí)類目,然后根據(jù)各個(gè)數(shù)據(jù)生命周期階段的政策觀測(cè)要點(diǎn)劃分為23個(gè)二級(jí)類目。本研究利用NVivo 12軟件輔助進(jìn)行政策文本的類目構(gòu)建與編碼分析,構(gòu)建國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本分析類目體系如表2所示。
表1 國(guó)外學(xué)術(shù)出版機(jī)構(gòu)制定的學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策
表2 國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本分析類目體系
續(xù)表
表3展示了依據(jù)表2所示的政策文本分析類目體系針對(duì)23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策進(jìn)行編碼分析的部分文本編碼片段。對(duì)于每一個(gè)政策文本,針對(duì)表2所示的每個(gè)分析類目?jī)H選取一個(gè)文本片段進(jìn)行編碼,因此在本研究中表2展示的“編碼參考點(diǎn)數(shù)”與“編碼文件數(shù)”是完全相同的。
針對(duì)23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策利用質(zhì)性文本分析法展開政策評(píng)估分析,將表2所示的國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本分析類目直接轉(zhuǎn)換為評(píng)估類目,即對(duì)評(píng)估類目進(jìn)行分級(jí)時(shí)僅劃分為兩個(gè)級(jí)別:1(代表有編碼參考點(diǎn))和0(代表無編碼參考點(diǎn))。針對(duì)23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本,利用NVivo 12軟件進(jìn)行矩陣編碼查詢,則有上述23個(gè)科學(xué)數(shù)據(jù)政策文本的矩陣編碼查詢結(jié)果可作為政策評(píng)估結(jié)果(圖2)。在圖2中每一單元格的數(shù)字代表所在行(政策文本)與所在列(分析類目)交叉對(duì)應(yīng)的編碼參考點(diǎn)的數(shù)量。從針對(duì)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策構(gòu)建的分析類目體系與評(píng)估分析結(jié)果來看(表2、圖2),目前國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策側(cè)重于數(shù)據(jù)存儲(chǔ)(S)、數(shù)據(jù)發(fā)布(P)和數(shù)據(jù)訪問(A) 3個(gè)數(shù)據(jù)生命周期階段的相關(guān)政策內(nèi)容。
依據(jù)上述針對(duì)23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策進(jìn)行的政策評(píng)估分析結(jié)果(表2、圖2),本研究將值得國(guó)內(nèi)學(xué)術(shù)出版機(jī)構(gòu)參考與借鑒的政策內(nèi)容要素依據(jù)數(shù)據(jù)生命周期階段概括如下:
(1) 數(shù)據(jù)存儲(chǔ)階段,主要包括強(qiáng)制存繳(S1)、數(shù)據(jù)格式(S4)、數(shù)據(jù)審查(S6)、存儲(chǔ)地點(diǎn)(S7)、可用性聲明(S9)和數(shù)據(jù)標(biāo)識(shí)符(S10)。①?gòu)?qiáng)制存繳(S1)。國(guó)外學(xué)術(shù)期刊通常鼓勵(lì)或要求論文作者在提交研究論文時(shí)將理解和驗(yàn)證論文研究結(jié)果所需的所有數(shù)據(jù)集存儲(chǔ)到適當(dāng)?shù)墓泊鎯?chǔ)庫(kù)中,并在其參考文獻(xiàn)中引用相關(guān)數(shù)據(jù)集??茖W(xué)數(shù)據(jù)聯(lián)盟(Research Data Alliance,RDA)認(rèn)為論文作者應(yīng)提交的科學(xué)數(shù)據(jù)包括:論文作者創(chuàng)建的“一手?jǐn)?shù)據(jù)”(Primary Data);論文作者重復(fù)使用或分析的“二手?jǐn)?shù)據(jù)”(Secondary Data);來自實(shí)驗(yàn)或觀察的其他數(shù)據(jù),如未處理的原始數(shù)據(jù)或論文中未報(bào)告的時(shí)間點(diǎn)的數(shù)據(jù);復(fù)制結(jié)果可能需要的任何其他材料[35]。②數(shù)據(jù)格式(S4)。國(guó)外學(xué)術(shù)期刊通常要求論文作者采用其研究社群(Research Community)認(rèn)可的、不依賴于專有軟件的開放文件格式共享其科學(xué)數(shù)據(jù)集。BMJ期刊要求論文作者采用生成數(shù)據(jù)的源文件形式共享所有數(shù)據(jù),以實(shí)現(xiàn)數(shù)據(jù)重用和增強(qiáng)可復(fù)制性,如圖像以.png、.jpg、.eps等格式提供,文本文件以.txt、.doc、.rft等格式提供,電子表格以.csv、.xls、.tsv等格式提供,視頻以.mp4、.avi、.wav等格式提供,成像和掃描文件以.img、.dcm、.hdr等格式提供[22]。③數(shù)據(jù)審查(S6)。國(guó)外學(xué)術(shù)期刊通常在同行評(píng)議過程中或提交論文被錄用之前,由編輯和審稿人審查論文作者提交的研究結(jié)論所依據(jù)的科學(xué)數(shù)據(jù),以確保期刊論文中提出的研究結(jié)論是有效的并且可以復(fù)制。國(guó)外學(xué)術(shù)期刊期望與科學(xué)界密切合作建立數(shù)據(jù)審查實(shí)踐,以確保已發(fā)布的科學(xué)數(shù)據(jù)有效、記錄正確并且可以重用[18]。④存儲(chǔ)地點(diǎn)(S7)。通常要求論文作者盡可能將其科學(xué)數(shù)據(jù)提交至學(xué)科特定的、研究社群認(rèn)可的學(xué)科知識(shí)庫(kù)(可查閱目標(biāo)期刊推薦的數(shù)據(jù)知識(shí)庫(kù)列表);在沒有適當(dāng)?shù)墓_可用的學(xué)科知識(shí)庫(kù)或目標(biāo)期刊沒有特定的數(shù)據(jù)知識(shí)庫(kù)建議的情況下,也可將其科學(xué)數(shù)據(jù)提交至接受所有類型的科學(xué)數(shù)據(jù)的通用知識(shí)庫(kù)(如Dryad、Figshare、Zenodo等)。Springer Nature期刊認(rèn)為支持同行評(píng)議出版物的數(shù)據(jù)知識(shí)庫(kù)應(yīng)滿足5個(gè)條件:確保數(shù)據(jù)集的長(zhǎng)期保存與維護(hù);被研究社群或研究機(jī)構(gòu)認(rèn)可;為存儲(chǔ)的數(shù)據(jù)集提供穩(wěn)定和持久的標(biāo)識(shí)符,如DOI;允許在不受不必要限制的情況下訪問數(shù)據(jù);為存儲(chǔ)的數(shù)據(jù)集提供明確的許可協(xié)議或使用條款[17]。⑤可用性聲明(S9)。通常要求論文作者必須在提交的研究論文中包括“數(shù)據(jù)可用性聲明”(Data Availability Statement,DAS),以說明在何處以及如何訪問支持論文研究結(jié)果的科學(xué)數(shù)據(jù)集,并在其研究論文的參考文獻(xiàn)中適當(dāng)引用數(shù)據(jù)集的DOI或URL;要求不希望共享數(shù)據(jù)的作者必須聲明不會(huì)共享數(shù)據(jù)并說明原因。“數(shù)據(jù)可用性聲明”將作為被接受發(fā)表的期刊論文的一部分發(fā)表。部分資助機(jī)構(gòu)要求在學(xué)術(shù)出版物中包括“數(shù)據(jù)可用性聲明”,論文作者必須確認(rèn)遵守資助機(jī)構(gòu)的任何特定的數(shù)據(jù)管理要求。⑥數(shù)據(jù)標(biāo)識(shí)符(S10)。通常要求論文作者在提交研究論文之前或在期刊論文發(fā)表之前,將其科學(xué)數(shù)據(jù)集存儲(chǔ)至公共存儲(chǔ)庫(kù)并在發(fā)表論文中提供登錄號(hào)、DOI、RID或其他持久性標(biāo)識(shí)符(Persistent Identifier)。GSA期刊要求盡可能使用DOI,以促進(jìn)已發(fā)表論文和外部存儲(chǔ)庫(kù)之間的數(shù)據(jù)交叉引用[30]。Elsevier期刊鼓勵(lì)和支持使用永久標(biāo)準(zhǔn)標(biāo)識(shí)符(Permanent Standard Identifiers)雙向鏈接相關(guān)數(shù)據(jù)集和學(xué)術(shù)出版物[18]。
表3 23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策的文本編碼片段示例
圖2 23個(gè)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策在不同一級(jí)類目下的評(píng)估分析結(jié)果(a)數(shù)據(jù)創(chuàng)建、數(shù)據(jù)存儲(chǔ);(b)數(shù)據(jù)發(fā)布、數(shù)據(jù)訪問、數(shù)據(jù)重用
(2) 數(shù)據(jù)發(fā)布階段,主要包括倫理法規(guī)(P1)、去識(shí)別化(P3)和發(fā)布期限(P4)。①倫理法規(guī)(P1):如果論文作者出于倫理標(biāo)準(zhǔn)、法律要求或許可協(xié)議等原因而無法共享科學(xué)數(shù)據(jù),通常允許其在提交數(shù)據(jù)時(shí)在“數(shù)據(jù)可用性聲明”中對(duì)數(shù)據(jù)可用性進(jìn)行合理限制。②去識(shí)別化(P3):通常要求論文作者在公開共享研究參與者的個(gè)人數(shù)據(jù)或其他敏感數(shù)據(jù)(如保護(hù)區(qū)實(shí)地考察數(shù)據(jù)、敏感考古遺址位置數(shù)據(jù)、瀕危或受威脅物種位置數(shù)據(jù))之前對(duì)其進(jìn)行去識(shí)別化或匿名化處理。③發(fā)布期限(P4):通常要求在論文發(fā)表后論文作者必須公開發(fā)布論文研究結(jié)果所依據(jù)的科學(xué)數(shù)據(jù)。Nature期刊要求在提交論文時(shí)必須將與其關(guān)聯(lián)的科學(xué)數(shù)據(jù)存儲(chǔ)到公共存儲(chǔ)庫(kù)中,并且必須將公共存儲(chǔ)庫(kù)的可訪問性指定為“在發(fā)表時(shí)立即發(fā)布”[10]。
(3) 數(shù)據(jù)訪問階段,主要包括開放獲取(A1)、訪問限制(A2)和訪問條件(A3)。①開放獲取(A1):通常要求論文作者必須公開提供研究論文的相關(guān)數(shù)據(jù)、材料、代碼和協(xié)議,以使其他科研人員能夠不受限制地復(fù)制和檢驗(yàn)論文研究結(jié)果,如PLOSONE期刊要求論文作者在發(fā)表時(shí)無限制地公開復(fù)制其研究結(jié)果所需的所有數(shù)據(jù)[11]。②訪問限制(A2):通常允許論文作者出于個(gè)人隱私、機(jī)密信息、國(guó)家安全或尊重根據(jù)第三方許可獲得的數(shù)據(jù)的使用條款等原因?qū)?shù)據(jù)、材料或代碼可用性進(jìn)行合理限制,并且必須在提交論文時(shí)向期刊編輯披露對(duì)數(shù)據(jù)、材料或代碼可用性的任何限制,以及在提交論文的“數(shù)據(jù)可用性聲明”中必須聲明將不會(huì)共享數(shù)據(jù)并說明原因。③訪問條件(A3):如果論文作者無法共享科學(xué)數(shù)據(jù)(如敏感數(shù)據(jù)或第三方數(shù)據(jù)),通常要求其在“數(shù)據(jù)可用性聲明”中提供如何以及以何種條件訪問原始數(shù)據(jù)以及衍生數(shù)據(jù)的詳細(xì)信息。如果論文作者所使用的科學(xué)數(shù)據(jù)是從第三方獲得使用許可的,則應(yīng)在“數(shù)據(jù)可用性聲明”中解釋如何獲得該數(shù)據(jù)的使用許可。
(4) 數(shù)據(jù)重用階段,主要包括許可協(xié)議(R1)和引用規(guī)范(R2)。①許可協(xié)議(R1):國(guó)外學(xué)術(shù)期刊通常允許論文作者指定其科學(xué)數(shù)據(jù)集的數(shù)據(jù)許可協(xié)議(如知識(shí)共享許可協(xié)議CC0、CC-BY或CC-BY-NC)。Springer Nature期刊指出:如果科學(xué)數(shù)據(jù)保存在公共存儲(chǔ)庫(kù)中,則需要遵循公共存儲(chǔ)庫(kù)的許可條款;如果科學(xué)數(shù)據(jù)可以在線免費(fèi)獲取,則應(yīng)首選支持最大限度重用的許可協(xié)議(如CC0)[17]。PLOSONE期刊指出:如果作者使用具有明確許可條款的公共存儲(chǔ)庫(kù),則其許可條款不應(yīng)比CC-BY許可協(xié)議更具限制性[12]。②引用規(guī)范(R2):通常要求論文作者將其科學(xué)數(shù)據(jù)集存儲(chǔ)到公共存儲(chǔ)庫(kù)中,并通過為科學(xué)數(shù)據(jù)集分配唯一的持久性標(biāo)識(shí)符(如DOI),在其研究論文的參考文獻(xiàn)中引用任何公開的科學(xué)數(shù)據(jù)集。Springer Nature期刊要求論文作者在參考文獻(xiàn)引用中使用公共存儲(chǔ)庫(kù)分配的DOI,并且數(shù)據(jù)引文應(yīng)包括DataCite建議的最低信息(創(chuàng)建者、數(shù)據(jù)集標(biāo)題、出版年、存儲(chǔ)庫(kù)名稱、標(biāo)識(shí)符)以及符合期刊格式要求[17]。
本研究針對(duì)選取的23個(gè)獨(dú)立的國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策,利用質(zhì)性文本分析法歸納式構(gòu)建政策文本分析類目體系、展開政策評(píng)估分析以及提煉政策內(nèi)容要素,并針對(duì)國(guó)內(nèi)學(xué)術(shù)出版機(jī)構(gòu)制定與完善其學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策提出如下3個(gè)方面的政策建議:
(1) 國(guó)內(nèi)學(xué)術(shù)出版機(jī)構(gòu)制定與發(fā)布的學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策目前仍比較有限,已制定科學(xué)數(shù)據(jù)政策的學(xué)術(shù)期刊主要集中在生物、醫(yī)藥、化學(xué)、材料、地質(zhì)、物理、環(huán)境和心理學(xué)等學(xué)科領(lǐng)域[35],建議參考與借鑒國(guó)外學(xué)術(shù)出版商和學(xué)術(shù)組織的先進(jìn)政策實(shí)踐,盡快制定與完善國(guó)內(nèi)現(xiàn)行學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策。目前,國(guó)際研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,RDA)已制定了“期刊數(shù)據(jù)政策框架”,將學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策劃分為6種標(biāo)準(zhǔn)政策類型并概括了其14個(gè)政策特征,這6種政策類型可以使學(xué)術(shù)期刊更細(xì)致、更嚴(yán)格、更穩(wěn)健地實(shí)施科學(xué)數(shù)據(jù)政策,Springer Nature、Wiley、Taylor & Francis和BMJ等大型學(xué)術(shù)出版商已經(jīng)開始實(shí)施這種分類政策框架與指南[36]。美國(guó)開放科學(xué)中心(Center for Open Science,COS)也發(fā)布了“透明度與開放性促進(jìn)(Transparency and Openness Promotion,TOP)指南”,為提升已發(fā)表研究成果的透明度、可重復(fù)性(Reproducibility)和可復(fù)制性(Replicability)建立了8項(xiàng)模塊化標(biāo)準(zhǔn),并為每項(xiàng)標(biāo)準(zhǔn)設(shè)置了3個(gè)越來越嚴(yán)格的實(shí)施級(jí)別,學(xué)術(shù)期刊可以根據(jù)學(xué)科差異靈活選擇希望實(shí)施的政策標(biāo)準(zhǔn)及其實(shí)施級(jí)別,越來越多的國(guó)外學(xué)術(shù)期刊與學(xué)術(shù)出版商認(rèn)可并實(shí)施了“TOP指南”提出的8項(xiàng)政策標(biāo)準(zhǔn)[37]。建議參照國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本分析類目體系與政策評(píng)估分析結(jié)果(表2、圖2),參考其數(shù)據(jù)存儲(chǔ)階段的強(qiáng)制存繳(S1)、數(shù)據(jù)審查(S6)、存儲(chǔ)地點(diǎn)(S7)、存儲(chǔ)位置(S8)、可用性聲明(S9)和數(shù)據(jù)標(biāo)識(shí)符(S10),數(shù)據(jù)發(fā)布階段的倫理法規(guī)(P1)、去識(shí)別化(P3)和發(fā)布期限(P4),數(shù)據(jù)訪問階段的開放獲取(A1)、訪問限制(A2)和訪問條件(A3),數(shù)據(jù)重用階段的許可協(xié)議(R1)和引用規(guī)范(R2)等政策內(nèi)容要素,參照國(guó)外學(xué)術(shù)組織和學(xué)術(shù)出版商制定的科學(xué)數(shù)據(jù)政策框架與模板,并充分考慮所在學(xué)科領(lǐng)域的科學(xué)數(shù)據(jù)特點(diǎn),盡快調(diào)整與完善國(guó)內(nèi)現(xiàn)行學(xué)術(shù)期刊的科學(xué)數(shù)據(jù)政策。
(2) 參考本研究針對(duì)國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策所提煉的政策內(nèi)容要素,建議國(guó)內(nèi)學(xué)術(shù)出版機(jī)構(gòu)的政策制定與完善關(guān)注如下10個(gè)核心政策內(nèi)容要素:①?gòu)?qiáng)制存繳(S1),依據(jù)學(xué)科特點(diǎn)鼓勵(lì)或要求論文作者在提交研究論文之前將論文研究結(jié)果所依據(jù)的科學(xué)數(shù)據(jù)存儲(chǔ)至指定的數(shù)據(jù)知識(shí)庫(kù)以供同行評(píng)議和檢驗(yàn)可重復(fù)性;②數(shù)據(jù)格式(S4),要求論文作者以可獲取和可重用的文件格式提交其科學(xué)數(shù)據(jù)集,以最大化科學(xué)數(shù)據(jù)集的可訪問性和可重用性;③數(shù)據(jù)審查(S6),規(guī)定期刊編輯和審稿人要審查論文作者提交的科學(xué)數(shù)據(jù),以確保與期刊論文關(guān)聯(lián)的科學(xué)數(shù)據(jù)是可復(fù)制和可重用的;④存儲(chǔ)地點(diǎn)(S7),要求論文作者將其科學(xué)數(shù)據(jù)集提交至適當(dāng)?shù)?、公認(rèn)的公共存儲(chǔ)庫(kù),如接受特定數(shù)據(jù)類型的學(xué)科知識(shí)庫(kù)或接受多個(gè)數(shù)據(jù)類型的通用知識(shí)庫(kù);⑤可用性聲明(S9),要求論文作者在提交的研究論文中包括“數(shù)據(jù)可用性聲明”,以說明支撐論文研究結(jié)果的科學(xué)數(shù)據(jù)集的存儲(chǔ)地點(diǎn)及其訪問條件;⑥數(shù)據(jù)標(biāo)識(shí)符(S10),要求論文作者提供科學(xué)數(shù)據(jù)集的登錄號(hào)、DOI、RID或其他持久性標(biāo)識(shí)符,并在其研究論文的參考文獻(xiàn)中引用科學(xué)數(shù)據(jù)集;⑦倫理法規(guī)(P1),如果出于倫理標(biāo)準(zhǔn)、法律要求或許可協(xié)議等原因無法共享數(shù)據(jù),允許論文作者在“數(shù)據(jù)可用性聲明”中對(duì)數(shù)據(jù)可用性進(jìn)行合理限制;⑧開放獲取(A1),要求論文作者在期刊論文發(fā)表后不受限制地公開提供其科學(xué)數(shù)據(jù)集以確保其他科研人員能夠公開查驗(yàn)與復(fù)制論文研究結(jié)果;⑨訪問限制(A2),允許論文作者出于個(gè)人隱私、機(jī)密信息或國(guó)家安全等原因?qū)?shù)據(jù)可用性進(jìn)行合理限制并且必須在提交論文時(shí)向期刊編輯披露;⑩許可協(xié)議(R1),允許論文作者確定其科學(xué)數(shù)據(jù)集的數(shù)據(jù)許可協(xié)議,并遵守所存檔的數(shù)據(jù)知識(shí)庫(kù)的數(shù)據(jù)許可條款,建議首選支持最大限度重用的開放訪問許可協(xié)議(如CC0或CC-BY)。
(3) 國(guó)外學(xué)術(shù)出版商和學(xué)術(shù)組織兩類學(xué)術(shù)出版機(jī)構(gòu)制定的科學(xué)數(shù)據(jù)政策較為注重與參與開放科學(xué)數(shù)據(jù)的其他利益相關(guān)者發(fā)布的科學(xué)數(shù)據(jù)政策之間的政策協(xié)同問題,建議我國(guó)學(xué)術(shù)出版機(jī)構(gòu)制定與完善其科學(xué)數(shù)據(jù)政策時(shí)也注重與其他利益相關(guān)者(尤其是資助機(jī)構(gòu)和數(shù)據(jù)知識(shí)庫(kù))發(fā)布的科學(xué)數(shù)據(jù)政策之間保持協(xié)調(diào)一致。本研究提煉出學(xué)術(shù)出版機(jī)構(gòu)與其他利益相關(guān)者之間加強(qiáng)政策協(xié)同值得關(guān)注的3個(gè)核心政策內(nèi)容要素:①可用性聲明(S9),應(yīng)注重與資助機(jī)構(gòu)制定的科學(xué)數(shù)據(jù)政策保持一致,如Springer Nature在“科學(xué)數(shù)據(jù)政策”中指出,“包括英國(guó)研究理事會(huì)在內(nèi)的若干科研資助機(jī)構(gòu),要求在學(xué)術(shù)出版物中包括‘?dāng)?shù)據(jù)可用性聲明’,Springer Nature科學(xué)數(shù)據(jù)政策支持遵守這些政策要求”[17]。②開放獲取(A1),應(yīng)注重與資助機(jī)構(gòu)和科研機(jī)構(gòu)的科學(xué)數(shù)據(jù)政策保持一致,如Taylor & Francis在“數(shù)據(jù)共享政策”中指出:“在論文作者做出共享其科學(xué)數(shù)據(jù)的任何決定之前,應(yīng)檢查其科研機(jī)構(gòu)或資助機(jī)構(gòu)的具體政策要求。越來越多的資助機(jī)構(gòu)要求獲得資助的科研人員共享其資助研究產(chǎn)生的科學(xué)數(shù)據(jù)。學(xué)術(shù)出版商目前通常會(huì)規(guī)定論文作者如何提供與其研究出版物相關(guān)的科學(xué)數(shù)據(jù)。如果其資助機(jī)構(gòu)與學(xué)術(shù)期刊的科學(xué)數(shù)據(jù)共享政策不一致,則應(yīng)遵循更具進(jìn)步意義的政策要求,即鼓勵(lì)更高程度的數(shù)據(jù)共享的政策?!盵19]③許可協(xié)議(R1),應(yīng)注重與資助機(jī)構(gòu)和數(shù)據(jù)知識(shí)庫(kù)的科學(xué)數(shù)據(jù)政策保持一致,如Wiley在“數(shù)據(jù)共享政策”中指出:“如果論文作者將其科學(xué)數(shù)據(jù)保存在數(shù)據(jù)知識(shí)庫(kù)中,許可協(xié)議的選擇將由數(shù)據(jù)知識(shí)庫(kù)的許可條款確定;若干資助機(jī)構(gòu)也有特定的科學(xué)數(shù)據(jù)許可協(xié)議要求,論文作者負(fù)責(zé)在論文提交過程中審查許可協(xié)議。”[20]
本研究將質(zhì)性文本分析方法及其軟件工具NVivo 12引入學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策類定量化研究,選取國(guó)外學(xué)術(shù)出版商和學(xué)術(shù)組織兩類學(xué)術(shù)出版機(jī)構(gòu)最新發(fā)布的23個(gè)代表性學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本,歸納式構(gòu)建出學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策文本分析類目體系并展開政策評(píng)估分析,針對(duì)所涉及的數(shù)據(jù)生命周期階段提煉了國(guó)外學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策內(nèi)容要素,為國(guó)內(nèi)學(xué)術(shù)出版機(jī)構(gòu)制定與完善其現(xiàn)行學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策提出相關(guān)政策建議。本研究的不足之處在于主要從宏觀、共性的研究視角探討了學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策內(nèi)容要素,在后續(xù)研究中將針對(duì)不同學(xué)科領(lǐng)域的學(xué)術(shù)期刊科學(xué)數(shù)據(jù)政策應(yīng)涵蓋的政策內(nèi)容要素展開深入具體研究。