劉開(kāi)強(qiáng),李夢(mèng)柯,李 東,王銘子,畢建新,5
(1.蘇州大學(xué)科學(xué)技術(shù)研究院,江蘇蘇州 215006;2.蘇州大學(xué)社會(huì)學(xué)院,江蘇蘇州 215123;3.國(guó)家自然科學(xué)基金委員會(huì)信息中心,北京 100085;4.國(guó)家自然科學(xué)基金委員會(huì)計(jì)劃與政策局,北京 100085;5.中國(guó)人民大學(xué)電子文件管理研究中心,北京 100872)
國(guó)際數(shù)據(jù)委員會(huì)(Committee on Data for Science and Technology,CODATA)早在1966 年成立時(shí)就確定了數(shù)據(jù)共享準(zhǔn)則[1],指導(dǎo)數(shù)據(jù)管理與共享服務(wù)。1984 年10 月,我國(guó)加入CODATA 并成立中國(guó)委員會(huì),積極協(xié)調(diào)各學(xué)科領(lǐng)域的科學(xué)數(shù)據(jù)工作,推動(dòng)我國(guó)科學(xué)數(shù)據(jù)的開(kāi)放共享。為了充分發(fā)揮科學(xué)數(shù)據(jù)資源的作用,科技部在2001 年年底啟動(dòng)科學(xué)數(shù)據(jù)共享工程的第一個(gè)試點(diǎn)——?dú)庀罂茖W(xué)數(shù)據(jù)共享試點(diǎn)[2]。國(guó)家自然科學(xué)基金委員會(huì)[3](以下簡(jiǎn)稱“國(guó)家基金委”)在2014 年也發(fā)布了一系列關(guān)于科研論文和基礎(chǔ)研究知識(shí)庫(kù)開(kāi)放獲取的政策,包括受資助項(xiàng)目科研論文實(shí)行開(kāi)放獲取的政策聲明。2018 年,我國(guó)首次從國(guó)家層面出發(fā),發(fā)布了科學(xué)數(shù)據(jù)管理辦法的政策文件——《科學(xué)數(shù)據(jù)管理辦法》,明確指出要促進(jìn)科學(xué)數(shù)據(jù)開(kāi)放共享。
近年來(lái),科學(xué)數(shù)據(jù)開(kāi)放共享問(wèn)題日益受到國(guó)內(nèi)外學(xué)者的關(guān)注,分別從數(shù)據(jù)共享權(quán)屬、共享策略、共享政策以及數(shù)據(jù)治理等多方面進(jìn)行了深入研究。例如,宋河發(fā)等[4]、唐素琴等[5]研究了科技數(shù)據(jù)的權(quán)利、權(quán)屬問(wèn)題;張旺等[6]、儲(chǔ)節(jié)旺等[7]研究了國(guó)內(nèi)外科技數(shù)據(jù)開(kāi)放共享的策略和機(jī)制;宋李葉[8]、王芳等[9]分別從政策工具視角、政策發(fā)展視角對(duì)國(guó)內(nèi)外科學(xué)數(shù)據(jù)管理政策進(jìn)行了比較分析;盛小平等[10-11]對(duì)數(shù)據(jù)管理與數(shù)據(jù)治理進(jìn)行比較分析,并研究提出科學(xué)數(shù)據(jù)開(kāi)放共享中的數(shù)據(jù)安全治理策略。此外,如王晴[12]從政策法規(guī)制度、技術(shù)、組織和服務(wù)等方面探討了科學(xué)數(shù)據(jù)開(kāi)放共享的保障機(jī)制;佟澤華等[13]運(yùn)用生態(tài)學(xué)的“再生”概念構(gòu)建了科研大數(shù)據(jù)再生模型;豐佰恒等[14]從生態(tài)系統(tǒng)的視角分析了科研大數(shù)據(jù)的構(gòu)成要素及其關(guān)聯(lián)關(guān)系;等等。
科學(xué)數(shù)據(jù)是國(guó)家科技創(chuàng)新和經(jīng)濟(jì)社會(huì)發(fā)展的重要基礎(chǔ)性戰(zhàn)略資源,實(shí)現(xiàn)科學(xué)數(shù)據(jù)開(kāi)放共享,使其可發(fā)現(xiàn)、可獲取、可互操作和可重復(fù)利用,對(duì)于增強(qiáng)數(shù)據(jù)資源利用率至關(guān)重要。近年來(lái),隨著我國(guó)科技創(chuàng)新能力和投入不斷增強(qiáng),我國(guó)科學(xué)數(shù)據(jù)采集能力持續(xù)提升,目前已成立了20 個(gè)國(guó)家科學(xué)數(shù)據(jù)中心、31 個(gè)國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資料庫(kù),初步形成了豐富的科學(xué)數(shù)據(jù)儲(chǔ)備和聚集平臺(tái)[15],但是,我國(guó)在科學(xué)數(shù)據(jù)儲(chǔ)備和共享的基礎(chǔ)設(shè)施建設(shè)方面仍面臨挑戰(zhàn),與歐美等發(fā)達(dá)國(guó)家相比,我國(guó)在科學(xué)數(shù)據(jù)管理與開(kāi)放共享方面還存在明顯不足。當(dāng)前,我國(guó)已經(jīng)形成了科研院所、高校及國(guó)家有關(guān)部門為主體和互補(bǔ),同時(shí)囊括企業(yè)社會(huì)力量的多主體參與的科學(xué)數(shù)據(jù)資源生產(chǎn)格局,所建設(shè)的不同數(shù)據(jù)中心所屬行業(yè)類別、層級(jí)機(jī)構(gòu)等紛繁多元,不同管理主體所管理的數(shù)據(jù)中心側(cè)重點(diǎn)各不相同,科學(xué)數(shù)據(jù)開(kāi)放共享模式在系統(tǒng)性構(gòu)建方面仍然存在部分薄弱環(huán)節(jié),而通過(guò)對(duì)已有相關(guān)文獻(xiàn)分析發(fā)現(xiàn),目前學(xué)界對(duì)科學(xué)數(shù)據(jù)共享生態(tài)系統(tǒng)的研究尚較為匱乏。為此,本研究從生態(tài)系統(tǒng)視角出發(fā),從我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)構(gòu)成要素梳理其建設(shè)實(shí)踐,分析其中存在的問(wèn)題并提出優(yōu)化策略。
我國(guó)發(fā)布的《科學(xué)數(shù)據(jù)管理辦法》中所稱科學(xué)數(shù)據(jù),主要包括在自然科學(xué)、工程技術(shù)科學(xué)等領(lǐng)域,通過(guò)基礎(chǔ)研究、應(yīng)用研究、試驗(yàn)開(kāi)發(fā)等產(chǎn)生的數(shù)據(jù),以及通過(guò)觀測(cè)監(jiān)測(cè)、考察調(diào)查、檢驗(yàn)檢測(cè)等方式取得并用于科學(xué)研究活動(dòng)的原始數(shù)據(jù)及其衍生數(shù)據(jù)[16]。從生態(tài)系統(tǒng)視角看,科學(xué)數(shù)據(jù)開(kāi)放共享作為科學(xué)研究的內(nèi)在要求,涉及到諸多內(nèi)外部要素,如相關(guān)機(jī)構(gòu)、相關(guān)人員、政策法規(guī)、數(shù)據(jù)對(duì)象和基礎(chǔ)設(shè)施等?;诖耍狙芯空J(rèn)為,科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)是指,在科學(xué)研究環(huán)境中,相關(guān)機(jī)構(gòu)、人員與政策法規(guī)、數(shù)據(jù)對(duì)象和信息基礎(chǔ)設(shè)施構(gòu)成的統(tǒng)一整體,其中的各要素相互影響、相互制約,并在一定時(shí)期內(nèi)處于相對(duì)穩(wěn)定的動(dòng)態(tài)平衡狀態(tài)。
明晰科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)內(nèi)各要素職能定位、促進(jìn)要素的協(xié)調(diào)有序發(fā)展,有助于促進(jìn)科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)的可持續(xù)發(fā)展和繁榮。我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)構(gòu)成要素如圖1 所示。
圖1 我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)構(gòu)成要素
2.2.1 相關(guān)機(jī)構(gòu)
科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)中的機(jī)構(gòu)主要包括科技主管部門層面等。科技部與各級(jí)科技廳、局等科技主管部門在國(guó)家科技法律框架內(nèi)制定相關(guān)法規(guī)與科技政策,并推動(dòng)由各級(jí)科技計(jì)劃產(chǎn)生的科學(xué)數(shù)據(jù)的開(kāi)放共享。目前,科技部層面由基礎(chǔ)研究司負(fù)責(zé)推動(dòng)科研條件保障建設(shè)和科學(xué)數(shù)據(jù)開(kāi)放共享;各地方省級(jí)科技廳(委)也有相關(guān)機(jī)構(gòu)負(fù)責(zé)推進(jìn)省級(jí)科技資源開(kāi)放共享,如江蘇省科技資源統(tǒng)籌服務(wù)中心在其理事會(huì)指導(dǎo)下,加快構(gòu)建科技資源開(kāi)放共享服務(wù)體系,其中就包含科學(xué)數(shù)據(jù)的開(kāi)放共享。資助機(jī)構(gòu)作為科學(xué)研究的支持者和引導(dǎo)者,負(fù)責(zé)項(xiàng)目申報(bào)評(píng)審、立項(xiàng)、監(jiān)督等組織實(shí)施工作,同時(shí)負(fù)責(zé)制定本機(jī)構(gòu)科學(xué)數(shù)據(jù)開(kāi)放共享政策,以提高資助成果的公開(kāi)透明性。以國(guó)家基金委為例,其科學(xué)數(shù)據(jù)開(kāi)放共享相關(guān)管理規(guī)范由其計(jì)劃與政策局績(jī)效評(píng)估與成果處負(fù)責(zé)制定,信息基礎(chǔ)設(shè)施則由其信息中心負(fù)責(zé)建設(shè),各信息基礎(chǔ)設(shè)施依托單位在開(kāi)展科學(xué)研究活動(dòng)的過(guò)程中,主要由相關(guān)科研管理部門負(fù)責(zé)協(xié)助科研人員進(jìn)行科學(xué)數(shù)據(jù)的采集和匯交工作,并監(jiān)督保障科學(xué)數(shù)據(jù)的真實(shí)性與完整性。國(guó)家科學(xué)數(shù)據(jù)中心承擔(dān)著科學(xué)數(shù)據(jù)開(kāi)放共享的職責(zé),對(duì)科學(xué)數(shù)據(jù)提供匯交、倉(cāng)儲(chǔ)與備份、發(fā)布與共享、管理與維護(hù)更新等服務(wù)。目前國(guó)內(nèi)最為典型的國(guó)家科學(xué)數(shù)據(jù)中心是由科技部與財(cái)政部于2019 年確定的20 個(gè)國(guó)家科學(xué)數(shù)據(jù)中心和30個(gè)國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資源庫(kù)[17]。而國(guó)內(nèi)各省份也在積極開(kāi)展區(qū)域性科學(xué)數(shù)據(jù)中心建設(shè)。此外,檔案部門主要是指各級(jí)綜合性檔案館,作為科學(xué)記憶的長(zhǎng)期保存者,負(fù)責(zé)接收并保管科學(xué)數(shù)據(jù)中心移交的具有永久保存價(jià)值的科學(xué)數(shù)據(jù)。
2.2.2 相關(guān)人員
科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)涉及的人員及其相互關(guān)系如圖2 所示。其中,數(shù)據(jù)生產(chǎn)者主要是指科研人員,他們是科研活動(dòng)的主體,是科學(xué)數(shù)據(jù)的直接生產(chǎn)者,負(fù)責(zé)向數(shù)據(jù)管理者匯交真實(shí)可信的科學(xué)數(shù)據(jù),在此過(guò)程中,依托單位科研管理人員對(duì)科研人員生產(chǎn)科學(xué)數(shù)據(jù)的行為予以監(jiān)督以確保數(shù)據(jù)真實(shí)性,并對(duì)數(shù)據(jù)進(jìn)行形式審核。數(shù)據(jù)管理者是指數(shù)據(jù)科學(xué)家、科研檔案管理人員等,一般具有較強(qiáng)的數(shù)據(jù)加工處理與分析挖掘的能力,通常隸屬于科學(xué)數(shù)據(jù)中心與檔案部門,負(fù)責(zé)指導(dǎo)和幫助數(shù)據(jù)生產(chǎn)者及數(shù)據(jù)使用者科學(xué)地匯交和利用數(shù)據(jù),以及相關(guān)信息基礎(chǔ)設(shè)施、信息系統(tǒng)及科學(xué)數(shù)據(jù)的運(yùn)行和維護(hù)。數(shù)據(jù)使用者也稱數(shù)據(jù)消費(fèi)者,通常指相關(guān)各類用戶,包括了科研人員、教育工作者、學(xué)生等有科學(xué)數(shù)據(jù)需求的人群。數(shù)據(jù)使用者可通過(guò)資助機(jī)構(gòu)內(nèi)部數(shù)據(jù)共享平臺(tái)、科學(xué)數(shù)據(jù)中心以及接收科學(xué)數(shù)據(jù)的檔案館等不同渠道獲取所需的科學(xué)數(shù)據(jù),同時(shí)有責(zé)任向數(shù)據(jù)管理者反饋科學(xué)數(shù)據(jù)使用過(guò)程中發(fā)現(xiàn)的問(wèn)題并提出建議,建立雙向良性互動(dòng)關(guān)系。
圖2 科學(xué)數(shù)據(jù)開(kāi)放共享系統(tǒng)中的各類人員關(guān)系
2.2.3 政策法規(guī)
科學(xué)數(shù)據(jù)開(kāi)放共享政策法規(guī)是指國(guó)家、各級(jí)科技主管部門、各類科技計(jì)劃資助機(jī)構(gòu)等為保障科學(xué)數(shù)據(jù)開(kāi)放共享工作順利實(shí)施所制定/遵循的各類法律法規(guī)和規(guī)章制度。國(guó)家層面,主要是國(guó)家科技法律法規(guī);各級(jí)科技主管部門層面,主要包括各類法規(guī)標(biāo)準(zhǔn)規(guī)范、各級(jí)各類科技政策等,內(nèi)容涵蓋科技計(jì)劃管理、科技獎(jiǎng)勵(lì)、國(guó)際科技合作、科技監(jiān)督與誠(chéng)信建設(shè)等;各類科技計(jì)劃資助機(jī)構(gòu)層面,主要包括各類規(guī)章制度及其發(fā)展規(guī)劃等,如國(guó)家基金委在遵循國(guó)家層面的科學(xué)數(shù)據(jù)開(kāi)放共享政策基礎(chǔ)上也制定了相關(guān)政策文件(見(jiàn)表1)。
表1 我國(guó)國(guó)家自然科學(xué)基金委員會(huì)遵循/制定的科學(xué)數(shù)據(jù)開(kāi)放共享政策
2.2.4 數(shù)據(jù)對(duì)象
科學(xué)數(shù)據(jù)是開(kāi)放共享生態(tài)系統(tǒng)中的核心要素。廣義的科學(xué)數(shù)據(jù)不僅包括數(shù)據(jù)集,還包括各類出版物、軟件、課件等。科研人員在匯交科學(xué)數(shù)據(jù)時(shí),不僅要匯交科學(xué)數(shù)據(jù),還應(yīng)匯交其元數(shù)據(jù)。元數(shù)據(jù)對(duì)于科學(xué)數(shù)據(jù)的管理和開(kāi)放共享具有重要意義,是實(shí)現(xiàn)科學(xué)數(shù)據(jù)可管理、可發(fā)現(xiàn)、可訪問(wèn)與可互操作的關(guān)鍵。我國(guó)各類科技項(xiàng)目每年都會(huì)產(chǎn)生海量的科學(xué)數(shù)據(jù),以科技部科技基礎(chǔ)性工作專項(xiàng)項(xiàng)目為例,其科學(xué)數(shù)據(jù)全生命周期包括數(shù)據(jù)的采集、匯交、保存、共享和利用幾個(gè)環(huán)節(jié),在每個(gè)環(huán)節(jié)中,數(shù)據(jù)完整性和安全性都應(yīng)當(dāng)?shù)玫奖U?。?shù)據(jù)匯交環(huán)節(jié)規(guī)定,項(xiàng)目匯交的科學(xué)數(shù)據(jù)包括電子格式的科學(xué)數(shù)據(jù)實(shí)體以及相應(yīng)的輔助數(shù)據(jù)與工具軟件,其中科學(xué)數(shù)據(jù)實(shí)體是指項(xiàng)目產(chǎn)生的科學(xué)考察與調(diào)查數(shù)據(jù)、整理歷史資料形成的數(shù)據(jù)和科學(xué)典籍志書(shū)圖集、科學(xué)規(guī)范、標(biāo)本資源和標(biāo)準(zhǔn)物質(zhì)基本信息;輔助數(shù)據(jù)與工具軟件是指輔助支持?jǐn)?shù)據(jù)使用的元數(shù)據(jù)、數(shù)據(jù)說(shuō)明文檔及軟件工具等。
2.2.5 基礎(chǔ)設(shè)施
我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享基礎(chǔ)設(shè)施主要是指科學(xué)數(shù)據(jù)中心的信息基礎(chǔ)設(shè)施,相關(guān)信息基礎(chǔ)設(shè)施為科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)提供技術(shù)架構(gòu)和信息安全保障?;A(chǔ)設(shè)施中的技術(shù)架構(gòu)包含各種軟件系統(tǒng)、網(wǎng)絡(luò)環(huán)境、設(shè)施設(shè)備、標(biāo)準(zhǔn)規(guī)范等,是科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)中的底層要素;而信息安全體系在基礎(chǔ)設(shè)施中發(fā)揮保障軟硬件設(shè)施及科學(xué)數(shù)據(jù)安全的作用。目前,我國(guó)的國(guó)家科學(xué)數(shù)據(jù)中心的基礎(chǔ)設(shè)施建設(shè)較為完善,大多建立起了覆蓋軟硬件規(guī)劃、設(shè)計(jì)、運(yùn)行、維護(hù)等多個(gè)環(huán)節(jié)的安全管理體系和規(guī)范。以國(guó)家基礎(chǔ)學(xué)科公共科學(xué)數(shù)據(jù)中心為例,其在安全管理體系建設(shè)方面,建立了覆蓋多個(gè)環(huán)節(jié)的體系和規(guī)范,并依照“等級(jí)保護(hù)2.0”標(biāo)準(zhǔn)下網(wǎng)絡(luò)安全等級(jí)保護(hù)三級(jí)要求,對(duì)基礎(chǔ)設(shè)施進(jìn)行全周期、多維度、細(xì)粒度安全防護(hù);在規(guī)劃設(shè)計(jì)方面,強(qiáng)化硬件和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的安全設(shè)計(jì)和采購(gòu)標(biāo)準(zhǔn);在系統(tǒng)研發(fā)方面,保障各系統(tǒng)全部業(yè)務(wù)的功能穩(wěn)定以及調(diào)整設(shè)計(jì)、開(kāi)發(fā)必要功能;在運(yùn)維方面,完成各系統(tǒng)網(wǎng)站監(jiān)控、數(shù)據(jù)庫(kù)服務(wù)、安全管理等方面的運(yùn)維。
經(jīng)過(guò)多年發(fā)展,我國(guó)各級(jí)各類科技計(jì)劃在其科學(xué)共同體的基礎(chǔ)上,已形成了一個(gè)初步的科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng),如圖3 所示。
圖3 科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)
2.3.1 全要素整體性特征
科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)由多種要素組成,除了科技主管部門等相關(guān)機(jī)構(gòu)和科研人員等各類用戶外,還包括各類法律法規(guī)和規(guī)章制度、廣義的科學(xué)數(shù)據(jù)、各種軟件系統(tǒng)、網(wǎng)絡(luò)環(huán)境、設(shè)施設(shè)備、標(biāo)準(zhǔn)規(guī)范及信息安全體系。
2.3.2 全流程協(xié)同性特征
科學(xué)數(shù)據(jù)管理包括采集、匯交、保存、開(kāi)放共享等環(huán)節(jié),實(shí)現(xiàn)科學(xué)數(shù)據(jù)開(kāi)放共享需要全流程、各主體的協(xié)同工作。其中,科研人員在科學(xué)研究的過(guò)程中產(chǎn)生大量有價(jià)值的科學(xué)數(shù)據(jù),在依托單位科研管理部門的監(jiān)督指導(dǎo)下向資助機(jī)構(gòu)及科學(xué)數(shù)據(jù)中心匯交科學(xué)數(shù)據(jù),資助機(jī)構(gòu)及科學(xué)數(shù)據(jù)中心會(huì)對(duì)科學(xué)數(shù)據(jù)分級(jí)分類、加工整理和分析挖掘,并推動(dòng)科學(xué)數(shù)據(jù)開(kāi)放共享。具有永久保存價(jià)值的科學(xué)數(shù)據(jù)將由科學(xué)數(shù)據(jù)中心負(fù)責(zé)向檔案部門歸檔,各類科學(xué)數(shù)據(jù)用戶則可以根據(jù)自身需求向資助機(jī)構(gòu)、科學(xué)數(shù)據(jù)中心或檔案部門發(fā)起利用申請(qǐng)。
2.3.3 全時(shí)空開(kāi)放性特征
科學(xué)數(shù)據(jù)的開(kāi)放共享不受時(shí)間和空間的限制。隨著時(shí)間的推移,科學(xué)數(shù)據(jù)經(jīng)過(guò)加工整理形成便于使用的數(shù)據(jù)庫(kù)或數(shù)據(jù)集,并通過(guò)質(zhì)量控制體系保證數(shù)據(jù)的準(zhǔn)確性和可用性,同時(shí),能夠在資助機(jī)構(gòu)數(shù)據(jù)共享交換平臺(tái)、科學(xué)數(shù)據(jù)中心或檔案部門查詢利用服務(wù)平臺(tái)上開(kāi)展科學(xué)數(shù)據(jù)匯交和開(kāi)放共享工作,各用戶均可以在任何時(shí)間、任何地點(diǎn)通過(guò)多種網(wǎng)絡(luò)渠道實(shí)現(xiàn)對(duì)科學(xué)數(shù)據(jù)的訪問(wèn),而科研人員也可以用戶身份訪問(wèn)自己所需科學(xué)數(shù)據(jù)開(kāi)展相關(guān)科研工作并產(chǎn)生新的科學(xué)數(shù)據(jù),從而形成一個(gè)圍繞科學(xué)數(shù)據(jù)的“輸入—加工—輸出”的開(kāi)放系統(tǒng)。
2.3.4 全制度調(diào)控性特征
科學(xué)數(shù)據(jù)開(kāi)放共享生態(tài)系統(tǒng)內(nèi)部各要素雖然相互關(guān)聯(lián)但相對(duì)獨(dú)立,有各自的運(yùn)行規(guī)律,若要實(shí)現(xiàn)科學(xué)數(shù)據(jù)有序、規(guī)范地開(kāi)放共享,則必須有完善的法律法規(guī)、規(guī)章制度、標(biāo)準(zhǔn)規(guī)范來(lái)對(duì)其進(jìn)行調(diào)控,使其始終處于一個(gè)相對(duì)穩(wěn)定的狀態(tài);同時(shí),通過(guò)制度層面的調(diào)控,可以對(duì)生態(tài)系統(tǒng)加強(qiáng)管理,保持生系統(tǒng)健康和可持續(xù)性發(fā)展,實(shí)現(xiàn)科學(xué)數(shù)據(jù)開(kāi)放共享中人、組織、基礎(chǔ)設(shè)施與數(shù)據(jù)的規(guī)范有序運(yùn)轉(zhuǎn)。
科技部早在2014 年就出臺(tái)了《科技基礎(chǔ)性工作專項(xiàng)項(xiàng)目科學(xué)數(shù)據(jù)匯交管理辦法(試行)》,并于2020 年6 月啟動(dòng)了國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交工作。中國(guó)科學(xué)院2019 年印發(fā)的《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開(kāi)放共享辦法(試行)》,將科學(xué)數(shù)據(jù)匯交作為項(xiàng)目驗(yàn)收的必要條件,要求建立先匯交數(shù)據(jù)、再驗(yàn)收項(xiàng)目的機(jī)制。由國(guó)家科技基礎(chǔ)條件平臺(tái)中心牽頭研究起草的《科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù)匯交技術(shù)與管理規(guī)范》《科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù)匯交通用數(shù)據(jù)元》《科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù)匯交通用代碼集》3 項(xiàng)國(guó)家標(biāo)準(zhǔn)也于2021 年正式發(fā)布。但是,其他各級(jí)各類科技計(jì)劃尚未開(kāi)展真正意義上的科學(xué)數(shù)據(jù)匯交工作。以國(guó)家自然科學(xué)基金為例,目前科學(xué)基金網(wǎng)絡(luò)信息系統(tǒng)(ISIS)中保存的,主要是科學(xué)基金申請(qǐng)書(shū)、計(jì)劃書(shū)、進(jìn)展報(bào)告、結(jié)題報(bào)告等管理性數(shù)據(jù)文件,基礎(chǔ)研究知識(shí)庫(kù)和科學(xué)基金共享服務(wù)網(wǎng)中提供開(kāi)放共享的,也只是資助項(xiàng)目的研究論文和結(jié)題報(bào)告,最具科研價(jià)值的數(shù)據(jù)實(shí)體及其元數(shù)據(jù)的匯交工作尚未開(kāi)展。除了國(guó)家自然科學(xué)基金,國(guó)家社會(huì)科學(xué)基金、各省份的自然科學(xué)基金和社會(huì)科學(xué)基金均未開(kāi)展科學(xué)數(shù)據(jù)匯交工作??茖W(xué)數(shù)據(jù)匯交工作的缺失,使得我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享缺少了最具價(jià)值的數(shù)據(jù)資源。
發(fā)達(dá)國(guó)家基礎(chǔ)研究資助機(jī)構(gòu)基本上都有專門針對(duì)科學(xué)數(shù)據(jù)管理與開(kāi)放共享的政策。以美國(guó)為例,美國(guó)國(guó)家科學(xué)基金會(huì)在2015 年發(fā)布了《今日的數(shù)據(jù),明日的發(fā)現(xiàn)》,對(duì)受資助項(xiàng)目所產(chǎn)生的科學(xué)數(shù)據(jù)的管理計(jì)劃、提交、管理、檢索、訪問(wèn)、保存作出了詳細(xì)規(guī)定;美國(guó)國(guó)立衛(wèi)生研究院(NIH)也于2020年發(fā)布了新版《NIH 數(shù)據(jù)管理與共享政策》,以促進(jìn)對(duì)受資助項(xiàng)目產(chǎn)生的科學(xué)數(shù)據(jù)的管理和共享。我國(guó)科技部長(zhǎng)期以來(lái)一直高度重視科學(xué)數(shù)據(jù)工作,深入貫徹落實(shí)《科學(xué)數(shù)據(jù)管理辦法》,推動(dòng)科學(xué)數(shù)據(jù)向科學(xué)數(shù)據(jù)中心匯交,促進(jìn)科學(xué)數(shù)據(jù)共享應(yīng)用?!吨袊?guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開(kāi)放共享辦法(試行)》中,明確了科學(xué)數(shù)據(jù)開(kāi)放共享的可發(fā)現(xiàn)、可訪問(wèn)、可互操作、可重用的FAIR 原則和各主體責(zé)任,并制定了《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)中心管理暫行辦法》,提高科學(xué)數(shù)據(jù)開(kāi)放共享水平?!犊萍疾?自然科學(xué)基金委關(guān)于進(jìn)一步壓實(shí)國(guó)家科技計(jì)劃(專項(xiàng)、基金等)任務(wù)承擔(dān)單位科研作風(fēng)學(xué)風(fēng)和科研誠(chéng)信主體責(zé)任的通知》中指出,要建立并嚴(yán)格執(zhí)行科研數(shù)據(jù)匯交制度,確保本單位科研活動(dòng)的原始記錄及時(shí)、準(zhǔn)確、完整,保存得當(dāng),做到可查詢、可追溯。然而,我國(guó)只有中國(guó)科學(xué)院制定了本單位專門的科學(xué)數(shù)據(jù)開(kāi)放共享辦法,其他各級(jí)各類科技計(jì)劃的科學(xué)數(shù)據(jù)開(kāi)放共享要求大多分散在各類相關(guān)管理辦法或通知要求中,亟須制定符合各單位要求和特點(diǎn)的科學(xué)數(shù)據(jù)管理與開(kāi)放共享辦法。
數(shù)據(jù)管理計(jì)劃(data management plan,DMP)是一份用于描述在研究過(guò)程中生成什么樣的數(shù)據(jù),如何管理、描述、分析和存儲(chǔ)這些數(shù)據(jù),以及在研究結(jié)束后如何共享和保存這些數(shù)據(jù)的工作計(jì)劃。在科技項(xiàng)目申請(qǐng)時(shí)同時(shí)提交一份數(shù)據(jù)管理計(jì)劃,是國(guó)外資助機(jī)構(gòu)常見(jiàn)的科學(xué)數(shù)據(jù)管理制度之一。如美國(guó)國(guó)家科學(xué)基金會(huì)要求申請(qǐng)人提交項(xiàng)目申請(qǐng)書(shū)的同時(shí)提交一份不超過(guò)兩頁(yè)的數(shù)據(jù)管理計(jì)劃,包括項(xiàng)目執(zhí)行過(guò)程中產(chǎn)生的科學(xué)數(shù)據(jù)類型,科學(xué)數(shù)據(jù)元數(shù)據(jù)相關(guān)要求,科學(xué)數(shù)據(jù)重用、訪問(wèn)、存檔和共享政策等。中國(guó)科學(xué)院也將科技項(xiàng)目數(shù)據(jù)管理計(jì)劃作為項(xiàng)目立項(xiàng)的必要條件,列入項(xiàng)目評(píng)審內(nèi)容,并規(guī)定科技項(xiàng)目數(shù)據(jù)管理計(jì)劃主要內(nèi)容包括項(xiàng)目預(yù)期產(chǎn)生的數(shù)據(jù)內(nèi)容、類型、規(guī)模、質(zhì)量、提交時(shí)間和最終匯交的科學(xué)數(shù)據(jù)管理機(jī)構(gòu)名稱等。除此之外,我國(guó)其他各級(jí)各類科技計(jì)劃資助機(jī)構(gòu)目前的項(xiàng)目申請(qǐng)書(shū)模板中并無(wú)此項(xiàng)內(nèi)容。
科學(xué)數(shù)據(jù)的可信認(rèn)證工作對(duì)于其可發(fā)現(xiàn)、可訪問(wèn)、可互操作和可重用具有重要意義,真實(shí)可信的科學(xué)數(shù)據(jù)是其開(kāi)放共享的前提。目前國(guó)際上可信數(shù)字倉(cāng)儲(chǔ)認(rèn)證標(biāo)準(zhǔn)主要有國(guó)際標(biāo)準(zhǔn)化組織[18-19]發(fā)布的ISO 16363:2012《可信賴數(shù)字存儲(chǔ)庫(kù)的審核和認(rèn)證》、ISO/TR 15801:1017《文檔管理電子存儲(chǔ)信息可信度和可靠性的建議》,國(guó)際空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì)[20]制定的《可信倉(cāng)儲(chǔ)審計(jì)及認(rèn)證:指標(biāo)與清單》,德國(guó)的《可信賴數(shù)字倉(cāng)儲(chǔ)的指標(biāo)目錄》[21],以及世界數(shù)據(jù)系統(tǒng)(WDS)與數(shù)據(jù)認(rèn)可印章(DSA)共同推出的CoreTrustSeal 認(rèn)證系統(tǒng)[22]。其中,CoreTrustSeal 認(rèn)證系統(tǒng)是專門針對(duì)科學(xué)數(shù)據(jù)可信認(rèn)證的標(biāo)準(zhǔn),在世界范圍內(nèi)有著重要影響。但我國(guó)目前僅有國(guó)家天文數(shù)據(jù)中心、國(guó)家空間科學(xué)數(shù)據(jù)中心、世界數(shù)據(jù)中心-中國(guó)地球物理學(xué)科中心等少數(shù)科學(xué)數(shù)據(jù)中心通過(guò)CoreTrustSeal 認(rèn)證,大部分科學(xué)數(shù)據(jù)中心尚未參與可信認(rèn)證工作。
基于對(duì)國(guó)外有關(guān)資助機(jī)構(gòu)科學(xué)數(shù)據(jù)管理模式的考察和我國(guó)有關(guān)科技計(jì)劃資助機(jī)構(gòu)自身的定位,由資助機(jī)構(gòu)負(fù)責(zé)籌建科學(xué)數(shù)據(jù)中心并非當(dāng)前可行之策,可借鑒國(guó)際上采用較多的管理方式,通過(guò)與外部數(shù)據(jù)管理機(jī)構(gòu)合作開(kāi)展科學(xué)數(shù)據(jù)的匯交、保管、出版和開(kāi)放共享工作。我國(guó)20 個(gè)國(guó)家科學(xué)數(shù)據(jù)中心和30個(gè)國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資源庫(kù)中,絕大多數(shù)具有明顯的行業(yè)特征,且擁有豐富的科學(xué)數(shù)據(jù)管理和開(kāi)放共享經(jīng)驗(yàn),并且,大多省級(jí)科學(xué)數(shù)據(jù)中心已經(jīng)建成或納入建設(shè)計(jì)劃,各有關(guān)資助機(jī)構(gòu)可根據(jù)自身學(xué)科分布情況,建立起各自與上述國(guó)家科學(xué)數(shù)據(jù)中心、國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資源庫(kù)以及省級(jí)科學(xué)數(shù)據(jù)中心的合作關(guān)系,將科學(xué)數(shù)據(jù)向?qū)?yīng)的科學(xué)數(shù)據(jù)中心匯交。一方面在資助機(jī)構(gòu)內(nèi)部建立起以科研論文、結(jié)題報(bào)告為主的內(nèi)部科學(xué)數(shù)據(jù)開(kāi)放共享系統(tǒng);另一方面,在資助機(jī)構(gòu)外部建立起以領(lǐng)域性科學(xué)數(shù)據(jù)為主的科學(xué)數(shù)據(jù)開(kāi)放共享系統(tǒng)。內(nèi)外兩方面相互協(xié)同,共同為用戶提供高質(zhì)量科學(xué)數(shù)據(jù)共享服務(wù)。
除中國(guó)科學(xué)院在2019 年制定了《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開(kāi)放共享辦法(試行)》外,現(xiàn)階段我國(guó)有關(guān)科技計(jì)劃資助機(jī)構(gòu)科學(xué)數(shù)據(jù)開(kāi)放共享政策大多是參照國(guó)家現(xiàn)有科技相關(guān)法律法規(guī)、內(nèi)部規(guī)章制度以及相關(guān)科技發(fā)展規(guī)劃。各有關(guān)科技計(jì)劃資助機(jī)構(gòu)應(yīng)當(dāng)參考國(guó)內(nèi)外已有的科學(xué)數(shù)據(jù)管理與開(kāi)放共享政策,制定符合不同科技計(jì)劃內(nèi)部制度特點(diǎn)的科學(xué)數(shù)據(jù)管理與開(kāi)放共享辦法,對(duì)科學(xué)數(shù)據(jù)管理與開(kāi)放共享的內(nèi)涵、原則、主體職責(zé)、匯交與管理,科研論文匯交與管理,科學(xué)數(shù)據(jù)開(kāi)放共享,相關(guān)保障機(jī)制與安全保密等作出詳細(xì)規(guī)定;同時(shí),將該辦法納入本機(jī)構(gòu)的政策法規(guī)體系,與相關(guān)科研成果轉(zhuǎn)化、科研不端行為處理辦法等制度配合,共同推進(jìn)科技計(jì)劃內(nèi)部科學(xué)數(shù)據(jù)合規(guī)、高效地開(kāi)放共享,并在推動(dòng)科研誠(chéng)信、學(xué)術(shù)規(guī)范和科研倫理建設(shè)中發(fā)揮更重要的作用。
數(shù)據(jù)管理計(jì)劃應(yīng)當(dāng)是有關(guān)科技計(jì)劃資助機(jī)構(gòu)對(duì)每一個(gè)資助申請(qǐng)的基本要求之一。一份科學(xué)合理的數(shù)據(jù)管理計(jì)劃可以指導(dǎo)科研人員在項(xiàng)目研究過(guò)程中如何積累所產(chǎn)生的科學(xué)數(shù)據(jù)及其元數(shù)據(jù),在保障數(shù)據(jù)真實(shí)性、完整性的同時(shí)向相應(yīng)的科學(xué)數(shù)據(jù)中心匯交。數(shù)據(jù)管理計(jì)劃中對(duì)科學(xué)數(shù)據(jù)的開(kāi)放共享權(quán)限、長(zhǎng)期保存的范圍都應(yīng)當(dāng)作出具體要求。因此,一方面,建議科技部在深化科技體制改革實(shí)施方案中補(bǔ)充納入數(shù)據(jù)管理計(jì)劃提交制度,將其作為科技計(jì)項(xiàng)目申報(bào)和立項(xiàng)的必要條件,以及作為加強(qiáng)學(xué)風(fēng)和科研誠(chéng)信與倫理建設(shè)、完善成果應(yīng)用貫通機(jī)制以及提高資助效能、持續(xù)完善規(guī)章制度的重要內(nèi)容,同時(shí)在現(xiàn)有科技計(jì)劃申請(qǐng)流程中加入數(shù)據(jù)管理計(jì)劃模塊,要求連同申請(qǐng)書(shū)一并提交,并將數(shù)據(jù)管理計(jì)劃作為項(xiàng)目評(píng)審的重要內(nèi)容;另一方面,在項(xiàng)目結(jié)題審核時(shí),采用同行評(píng)審的方式對(duì)項(xiàng)目所產(chǎn)生的科學(xué)數(shù)據(jù)管理、共享和歸檔情況進(jìn)行評(píng)估,并給出相應(yīng)績(jī)效等級(jí),作為評(píng)審項(xiàng)目負(fù)責(zé)人下一次申請(qǐng)基金項(xiàng)目時(shí)的重要參考。
數(shù)據(jù)的“四性”是指真實(shí)性、完整性、可用性和安全性。保證科學(xué)數(shù)據(jù)的“四性”是科學(xué)數(shù)據(jù)開(kāi)放共享的前提,也是科學(xué)數(shù)據(jù)長(zhǎng)期保存的關(guān)鍵。對(duì)科學(xué)數(shù)據(jù)開(kāi)展可信認(rèn)證工作是保障其“四性”的重要途徑,目前國(guó)際上廣泛采用的是CoreTrustSeal 認(rèn)證體系。因此,建議科技部牽頭開(kāi)展具有我國(guó)自主知識(shí)產(chǎn)權(quán)的科學(xué)數(shù)據(jù)可信認(rèn)證體系構(gòu)建研究,從組織架構(gòu)、數(shù)據(jù)對(duì)象、技術(shù)能力三大維度,以及工作職責(zé)、開(kāi)發(fā)與運(yùn)維團(tuán)隊(duì)、數(shù)據(jù)質(zhì)量控制、可信工作流、信息基礎(chǔ)設(shè)施、數(shù)據(jù)安全等方面構(gòu)建可信認(rèn)證標(biāo)準(zhǔn),并實(shí)現(xiàn)與國(guó)際標(biāo)準(zhǔn)的兼容。
科學(xué)數(shù)據(jù)的開(kāi)放共享已成為國(guó)家科技創(chuàng)新的重要保障措施之一。長(zhǎng)期以來(lái),我國(guó)各類科技計(jì)劃中產(chǎn)生的大量科學(xué)數(shù)據(jù)保存在科研人員手中,阻礙了其開(kāi)放共享,不利于科技創(chuàng)新,客觀上要求分級(jí)分類實(shí)施科學(xué)數(shù)據(jù)相對(duì)集中統(tǒng)一管理并實(shí)施開(kāi)放共享。我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享相關(guān)實(shí)施細(xì)則等具體措施的完善需要依靠各級(jí)科技主管部門和資助機(jī)構(gòu)的共同努力。全面建立科學(xué)數(shù)據(jù)管理計(jì)劃提交制度,可以從科技計(jì)劃申請(qǐng)階段就開(kāi)始保障科學(xué)數(shù)據(jù)的全流程規(guī)范管理及開(kāi)放共享,應(yīng)當(dāng)在各級(jí)各類科技計(jì)劃管理中予以推廣。對(duì)科學(xué)數(shù)據(jù)開(kāi)展可信認(rèn)證是保障真實(shí)無(wú)誤的科學(xué)數(shù)據(jù)開(kāi)放共享的重要工作,同時(shí)也是維護(hù)科研誠(chéng)信的重要措施。