陳 軍 李大博 楊智君 盧祝華 卜天佳 趙天琦 陶 毅 楊 帆 蘇 爽
(1.中國計量科學研究院,北京 100029;2.中國計量大學,浙江杭州 310018;3.中國計量科學研究院國家計量科學數(shù)據(jù)中心,北京 100029)
科學數(shù)據(jù)形成于科技創(chuàng)新活動的全過程,包括基礎(chǔ)研究、應(yīng)用研究、試驗開發(fā)等過程中產(chǎn)生的數(shù)據(jù),以及通過觀測監(jiān)測、考察調(diào)查、檢驗檢測等方式取得的用于科學研究活動的原始數(shù)據(jù)及其衍生數(shù)據(jù)[1],是各國競相爭奪的重要基礎(chǔ)性戰(zhàn)略資源。隨著信息社會的發(fā)展,科技創(chuàng)新越來越依賴于大量、系統(tǒng)、高可信度的科學數(shù)據(jù)。2018年12月,科技部印發(fā)了《國家重點研發(fā)計劃項目綜合績效評價工作規(guī)范(試行)》[2],科學數(shù)據(jù)匯交成為項目綜合績效評價階段一項必不可少的重要內(nèi)容。
目前,“十三五”期間啟動實施的69 個國家重點研發(fā)計劃重點專項陸續(xù)進入收官階段,即將有大批量的項目面臨集中開展綜合績效評價。如何科學有效地描述、保存和匯交眾多項目產(chǎn)出的數(shù)據(jù)成果成為關(guān)注的焦點。本文將以計量領(lǐng)域科研項目為研究對象,從項目承擔單位的視角,結(jié)合管理工作實踐,介紹了項目數(shù)據(jù)類型、匯交流程和信息系統(tǒng)設(shè)計,并對優(yōu)化匯交管理提出了建議。
國外發(fā)達國家的科學數(shù)據(jù)匯交工作起步較早。美國最早于1966年頒布實施的《信息自由法》是科學數(shù)據(jù)管理共享的法律基礎(chǔ)[3-4]。美國衛(wèi)生部、能源部與國家科學基金委員會(NSF)于1971年創(chuàng)建了最早的數(shù)字數(shù)據(jù)館藏——蛋白質(zhì)數(shù)據(jù)銀行(PDB)。1995年,英國經(jīng)濟和社會研究委員會出臺了數(shù)據(jù)管理計劃,要求在對其資助產(chǎn)生的科學數(shù)據(jù)進行管理與保存的基礎(chǔ)上,做到最大程度地對外共享[5]。1997年,國際科學聯(lián)合會(ICSU)成立了數(shù)據(jù)與信息特別任務(wù)組,圍繞科學數(shù)據(jù)共享及數(shù)據(jù)庫權(quán)益保護,從科技、法律等角度提出了多項建議[6],推動了科學數(shù)據(jù)資源免費共享、跨界流動和可重復利用。
目前,國際上以美國NSF、航空航天局(NASA)、英國研究理事會(RCUK)等為代表的科技計劃項目管理機構(gòu),均對數(shù)據(jù)匯交提出了明確要求[7]。美國NSF要求科研項目必須開展數(shù)據(jù)匯交,指定Dyrad作為匯交平臺,并要求數(shù)據(jù)完成后即可匯交,鼓勵多年度項目逐年匯交[8-9]。NASA要求所有地球科學任務(wù)、項目需通過制定數(shù)據(jù)管理計劃書來明確科學數(shù)據(jù)共享內(nèi)容[10]。RCUK要求其項目資助所產(chǎn)生的論文必須在發(fā)表后6 個月內(nèi)完成論文中科學數(shù)據(jù)的匯交[11]。作為數(shù)據(jù)匯交的配套設(shè)施,國外大量科學數(shù)據(jù)管理機構(gòu)已建成,包括美國國家級數(shù)據(jù)中心群、德國PANGAEA數(shù)據(jù)中心、日本世界溫室氣體數(shù)據(jù)中心、加拿大GeoBase數(shù)據(jù)中心以及法國斯特拉斯堡天文數(shù)據(jù)中心等。
我國于2001年啟動了“科學數(shù)據(jù)共享工程”項目。2007年,鑒于科學數(shù)據(jù)的重要作用和使用價值,國家修訂了《中華人民共和國科學技術(shù)進步法》,明確提出要建立科學技術(shù)數(shù)據(jù)信息系統(tǒng)。2018年,國務(wù)院印發(fā)了《科學數(shù)據(jù)管理辦法》,要求“政府預(yù)算資金資助的各級科技計劃(專項、基金等)項目所形成的科學數(shù)據(jù),應(yīng)由項目牽頭單位匯交到相關(guān)科學數(shù)據(jù)中心,各級科技計劃(專項、基金等)管理部門應(yīng)建立先匯交科學數(shù)據(jù)再驗收科技計劃(專項、基金等)項目的機制”[1]。2019年,科技部出臺了科技計劃項目科學數(shù)據(jù)匯交相關(guān)工作方案,進一步明確了項目數(shù)據(jù)匯交的內(nèi)容、流程及管理要求。
經(jīng)過近20年來的發(fā)展,我國在科學數(shù)據(jù)匯交與共享管理領(lǐng)域取得了顯著的進步??萍疾?、自然科學基金委員會、中國科學院等部門通過多方探索,已經(jīng)匯交整合了一大批科學數(shù)據(jù)資源[12]。如截至2019年年底,科技部973 計劃資源環(huán)境領(lǐng)域相關(guān)項目(自2008年以來)已匯交了科學數(shù)據(jù)集近2 000 個[13];科技基礎(chǔ)性工作專項(自1999年以來)已完成科學數(shù)據(jù)匯交項目331 個[12];中國科學院通過匯交已整合全院50 家單位的科學數(shù)據(jù)[12]。自2018年《科學數(shù)據(jù)管理辦法》發(fā)布后,科學數(shù)據(jù)匯交工作正式納入各級科技計劃項目的實施過程,其涉及項目之多、覆蓋范圍之廣前所未有。與此同時,科技部、財政部對國家科技資源共享服務(wù)平臺開展優(yōu)化調(diào)整,成立了國家高能物理科學數(shù)據(jù)中心、國家計量科學數(shù)據(jù)中心等20 個國家科學數(shù)據(jù)中心。截至目前,根據(jù)國家重點研發(fā)計劃項目管理要求,部分項目已按程序向相關(guān)數(shù)據(jù)中心提交科學數(shù)據(jù),完成了匯交工作。
為規(guī)范科學數(shù)據(jù)匯交工作,促進數(shù)據(jù)共享和開發(fā)利用,國內(nèi)行業(yè)部門和科研機構(gòu)也相繼研究出臺了相關(guān)舉措。2019年,中國科學院印發(fā)了《中國科學院科學數(shù)據(jù)管理與開放共享辦法(試行)》,進一步明確了中國科學院科學數(shù)據(jù)管理與開放共享的總體原則、職責分工、管理要求、保障機制及安全保密等方面的內(nèi)容,提出科研項目數(shù)據(jù)匯交的要求,并加強了科研論文關(guān)聯(lián)數(shù)據(jù)匯交管理。2020年,中國氣象局印發(fā)了《氣象數(shù)據(jù)管理辦法(試行)》,對氣象部門組織開展的氣象數(shù)據(jù)收集匯交、加工處理、保存使用、共享服務(wù)、安全監(jiān)管等工作進行規(guī)定,明確提出通過觀測監(jiān)測、考察調(diào)查、收集交換、科學研究等方式獲得的大氣和空間天氣科學技術(shù)領(lǐng)域的數(shù)字、文字、符號、圖片、視頻和音頻等均屬于氣象數(shù)據(jù)。
“十三五”期間,科技部部署了國家重點研發(fā)計劃重點專項67 個、立項項目6 000 余項,科學數(shù)據(jù)匯交管理研究成為項目牽頭單位關(guān)注的焦點。中國計量科學研究院(簡稱“中國計量院”)承擔了多項國家重點研發(fā)計劃重點專項項目。結(jié)合自身承擔項目的體會,對項目數(shù)據(jù)匯交組織管理進行一系列探索性研究和實踐。
科學數(shù)據(jù)匯交包括項目實施過程中產(chǎn)生的科學數(shù)據(jù)實體、科學數(shù)據(jù)描述信息和科學數(shù)據(jù)輔助工具軟件。計量是測量的科學,是實現(xiàn)單位統(tǒng)一和量值準確可靠的活動。計量科研項目(簡稱“計量項目”)有其自身的研究特點,重點關(guān)注計量基標準裝置、國家標準物質(zhì)、國家測量和校準能力、國際比對等方面的研究。為此,梳理計量項目成果類型和考核指標,結(jié)合計量科學數(shù)據(jù)特點,提出了如下數(shù)據(jù)匯交內(nèi)容。
2.1.1 科學數(shù)據(jù)實體
計量科學數(shù)據(jù)實體與計量項目的研究內(nèi)容、考核指標以及項目成果類型緊密相關(guān)。中國計量院承擔的“國家質(zhì)量基礎(chǔ)的共性技術(shù)研究與應(yīng)用”重點專項項目產(chǎn)出的成果類型共27 類,考核指標涉及成果達2 694 項。這些成果在形成過程中,均會產(chǎn)生大量的科學數(shù)據(jù),成為計量科學數(shù)據(jù)實體的重要組成部分(表1)。在表1中,比對的相關(guān)關(guān)鍵數(shù)據(jù)主要包括比對方案及相關(guān)數(shù)據(jù)、比對報告及相關(guān)數(shù)據(jù)、參加比對的數(shù)據(jù)、比對結(jié)果及其不確定度分析報告等;標準物質(zhì)的相關(guān)關(guān)鍵數(shù)據(jù)主要包括標準物質(zhì)研制報告及相關(guān)數(shù)據(jù)、研制的過程數(shù)據(jù)、標準物質(zhì)技術(shù)指標等。
表1 計量項目科學數(shù)據(jù)實體
2.1.2 科學數(shù)據(jù)描述信息
計量科學數(shù)據(jù)描述信息包括項目基本信息、數(shù)據(jù)集元數(shù)據(jù)、數(shù)據(jù)說明文件3 個部分。項目數(shù)據(jù)匯交工作是以項目為單元開展的,項目的基本信息是數(shù)據(jù)描述信息的一部分,是補充數(shù)據(jù)間關(guān)聯(lián)的紐帶;數(shù)據(jù)集元數(shù)據(jù)包含數(shù)據(jù)集名稱、編號、關(guān)鍵詞、數(shù)據(jù)相關(guān)成果類型、數(shù)據(jù)類型、數(shù)據(jù)格式、數(shù)據(jù)共享方式等,用于數(shù)據(jù)共享發(fā)布后用戶能夠快速搜索發(fā)現(xiàn)并了解數(shù)據(jù)集的基本情況。如對于計量項目的標準物質(zhì)數(shù)據(jù),用戶通過數(shù)據(jù)集元數(shù)據(jù)進行檢索時,可以查看到標準物質(zhì)的種類、純度等基本信息;數(shù)據(jù)說明文件是對數(shù)據(jù)內(nèi)容的詳細說明,包括數(shù)據(jù)產(chǎn)生的方式、數(shù)據(jù)的使用方法等,能夠幫助使用者更好地了解和使用數(shù)據(jù)。
2.1.3 科學數(shù)據(jù)輔助工具軟件
計量科學數(shù)據(jù)輔助工具軟件是專門用于計量科學數(shù)據(jù)的處理、加工和分析的載體。計量科學研究在時間頻率數(shù)據(jù)處理、化學成分精確測量等方面經(jīng)常會使用軟件系統(tǒng)加以輔助分析。對于項目實施中自主研發(fā)的遠程時間實時溯源比對專用軟件、肽段雜質(zhì)精確測量與分析專用軟件,其軟件本身和軟件的元數(shù)據(jù)說明均需匯交。對于項目實施中采購的工具軟件,軟件本身可不必匯交,但相關(guān)軟件的開發(fā)工具和運行環(huán)境等基本信息需要匯交。
計量項目科學數(shù)據(jù)匯交工作涉及科技計劃項目管理方(專業(yè)機構(gòu))、科學數(shù)據(jù)提交方(項目承擔單位)、科學數(shù)據(jù)管理方(科學數(shù)據(jù)中心)三方責任主體。在此過程中,我們進一步細化科學數(shù)據(jù)提交方職責,明確了項目負責人和項目承擔單位的雙重責任,形成了項目負責人制備數(shù)據(jù)、承擔單位提交數(shù)據(jù)、數(shù)據(jù)中心審核數(shù)據(jù)的匯交模式,具體流程見圖1。在項目立項階段,由項目負責人編制并提交科學數(shù)據(jù)匯交計劃,匯交計劃通過審查后,項目負責人遵照數(shù)據(jù)匯交計劃和相關(guān)標準規(guī)范,并組織下設(shè)課題制備科學數(shù)據(jù);項目實施期滿后,項目負責人編寫科技資源匯交方案,并將科學數(shù)據(jù)提交至數(shù)據(jù)中心。一方面,數(shù)據(jù)中心負責對科學數(shù)據(jù)進行形式審查和質(zhì)量同行評議,審核通過后出具匯交憑證;另一方面,負責對通過專業(yè)機構(gòu)審批的科學數(shù)據(jù)進行分類整理、開放共享和維護更新。
目前,國家高能物理科學數(shù)據(jù)中心、國家基因組科學數(shù)據(jù)中心、國家基礎(chǔ)學科公共科學數(shù)據(jù)中心等數(shù)據(jù)中心都已建立數(shù)據(jù)匯交系統(tǒng)并投入使用。在上述流程和需求分析的基礎(chǔ)上,我們設(shè)計了國家計量科學數(shù)據(jù)中心數(shù)據(jù)匯交信息系統(tǒng)。該系統(tǒng)是科學數(shù)據(jù)管理和開放共享的重要載體,也是項目負責人、項目牽頭單位、科學數(shù)據(jù)中心等各方協(xié)調(diào)完成數(shù)據(jù)匯交工作的信息平臺。系統(tǒng)設(shè)計理念是以人為本,突出資源整合的本質(zhì),即共享服務(wù)。整體框架包括科學數(shù)據(jù)資源的收集、整理、分析、共享。為提高數(shù)據(jù)匯交效率、保證數(shù)據(jù)匯交質(zhì)量,對課題負責人及項目負責人精心設(shè)計角色權(quán)限,讓項目的科學數(shù)據(jù)資源更加融會貫通。該系統(tǒng)具備多維度的數(shù)據(jù)索引能力,為后續(xù)的分析挖掘、綜合利用和開放共享工作提供了基礎(chǔ)保障。數(shù)據(jù)匯交信息系統(tǒng)架構(gòu)詳見圖2。
科學數(shù)據(jù)匯交是國家重點研發(fā)計劃項目管理的必要環(huán)節(jié),數(shù)據(jù)中心和承擔單位首先應(yīng)從制度層面推進實施。一方面,數(shù)據(jù)中心應(yīng)進一步明確項目數(shù)據(jù)匯交具體要求、強化政策培訓宣貫;另一方面,承擔單位是科學數(shù)據(jù)管理的責任主體,需強化法人責任,通過建立健全本單位科學數(shù)據(jù)相關(guān)管理制度,明確單位內(nèi)部數(shù)據(jù)匯交各級責任主體的具體職責,規(guī)范數(shù)據(jù)的采集生產(chǎn)、加工整理、安全維護等管理要求,為科學數(shù)據(jù)匯交工作的順利開展提供指導。
項目科學數(shù)據(jù)集是制定科學數(shù)據(jù)匯交計劃或匯交方案時的重要內(nèi)容,數(shù)據(jù)提交方應(yīng)認真思考如何對其進行科學、合理、準確地分類。鑒于項目數(shù)據(jù)集結(jié)構(gòu)類型復雜、數(shù)據(jù)分散性強,項目在采集和制備科學數(shù)據(jù)時,應(yīng)針對專業(yè)特點,按照研究任務(wù)及合理的顆粒度劃分數(shù)據(jù)集。對匯交數(shù)據(jù)應(yīng)進行適當篩選,保留核心關(guān)鍵數(shù)據(jù),剔除無關(guān)冗余數(shù)據(jù)。數(shù)據(jù)集分類可邀請項目跟蹤責任專家或同行專家研討把關(guān),從而提高數(shù)據(jù)的集成化和系統(tǒng)性,為匯交數(shù)據(jù)的加工整理和查詢利用奠定基礎(chǔ)。
圖1 計量項目科學數(shù)據(jù)匯交流程
科學數(shù)據(jù)的真實準確是進行科學數(shù)據(jù)匯交的前提條件,項目負責人和課題負責人應(yīng)對數(shù)據(jù)的真實性和可靠性負責。在以信任為前提的基礎(chǔ)上,承擔單位可通過組織相關(guān)負責人簽訂承諾書的方式,對匯交數(shù)據(jù)質(zhì)量進行約束。同時,項目(課題)承擔單位應(yīng)探索建立科學數(shù)據(jù)質(zhì)量控制體系,通過采取有效的質(zhì)量控制措施,保證數(shù)據(jù)的真實性、準確性、可用性和一致性。數(shù)據(jù)中心可通過對數(shù)據(jù)質(zhì)量評議專家進行培訓,統(tǒng)一數(shù)據(jù)質(zhì)量審核標準,對匯交數(shù)據(jù)的質(zhì)量控制提供保障。
科學數(shù)據(jù)匯交的最終目的是推動數(shù)據(jù)的高效利用和廣泛共享,項目承擔單位要強化目標導向,引導科研人員積極開展科學數(shù)據(jù)的制備與匯交,持續(xù)推進科學數(shù)據(jù)的分析、增值與共享。一方面,承擔單位相關(guān)管理部門可在內(nèi)部及時公布并更新科學數(shù)據(jù)開放目錄,通過對項目成果和數(shù)據(jù)匯交的綜合分析,充分挖掘數(shù)據(jù)價值,為項目成果成效評估和未來科研決策提供參考;另一方面,可聯(lián)合國家有關(guān)數(shù)據(jù)中心,推動有價值的科學數(shù)據(jù)面向全社會廣泛共享,擴大計量項目社會影響力。
圖2 數(shù)據(jù)匯交信息系統(tǒng)架構(gòu)
科學數(shù)據(jù)匯交與共享始終要以確保數(shù)據(jù)安全為前提。在數(shù)據(jù)生產(chǎn)制備環(huán)節(jié),承擔單位可將數(shù)據(jù)制備和提交情況納入其科研誠信體系,防止數(shù)據(jù)造假和違規(guī)操作行為發(fā)生。在數(shù)據(jù)匯交環(huán)節(jié),數(shù)據(jù)提交方可通過申請數(shù)據(jù)保護期的方式推遲開放共享,也可通過說明數(shù)據(jù)共享方式和簽署協(xié)議的方式對其產(chǎn)權(quán)進行保護。在數(shù)據(jù)完成匯交后,數(shù)據(jù)管理方可嘗試通過建立數(shù)據(jù)資源唯一標識符機制,要求科學數(shù)據(jù)使用者在論文發(fā)表、專利申請、專著出版等工作中注明參考引用的科學數(shù)據(jù),促進科學數(shù)據(jù)的知識產(chǎn)權(quán)保護。
將數(shù)據(jù)匯交作為項目綜合績效評價工作的前置條件,從實際操作層面來看,給專業(yè)機構(gòu)和承擔單位均帶來了較大壓力。如在項目負責人提交的綜合績效評價材料中,部分材料如測試報告、科技報告等可能與匯交的科學數(shù)據(jù)重復提交??紤]到項目數(shù)據(jù)管理的“新舊有別”,對于《科學數(shù)據(jù)管理辦法》辦法出臺前立項的重點專項項目,專業(yè)機構(gòu)可在提交數(shù)據(jù)匯交承諾函后,先行組織開展綜合績效評價工作。在績效評價工作完成后,項目負責人可對產(chǎn)生的科學數(shù)據(jù)進行加工整合,匯交真正有價值的關(guān)鍵數(shù)據(jù),從而提高管理效能,切實為科技工作者減負。
國家重點研發(fā)計劃項目匯交數(shù)據(jù)不僅是項目綜合績效評價的重要內(nèi)容,更是促進國家科技創(chuàng)新和經(jīng)濟社會發(fā)展的重要科技戰(zhàn)略資源。作為項目承擔單位,應(yīng)積極轉(zhuǎn)變思路,充分認識到科學數(shù)據(jù)匯交的重要性,積極貫徹落實國家科學數(shù)據(jù)管理政策,建立項目數(shù)據(jù)匯交機制,完善科學數(shù)據(jù)內(nèi)部管理制度,并注重數(shù)據(jù)管理專業(yè)人才培養(yǎng)和數(shù)據(jù)匯交硬件條件配套,為科學數(shù)據(jù)匯交工作順利開展提供有力保障。此外,應(yīng)充分挖掘和發(fā)揮科學數(shù)據(jù)的更大價值,促進科學數(shù)據(jù)的廣泛共享,從而為科技創(chuàng)新、經(jīng)濟社會發(fā)展和國家安全提供基礎(chǔ)支撐。