摘要:科學數(shù)據(jù)中心是國家信息基礎設施的重要組成部分,其建設對于服務和支撐科技創(chuàng)新、健全國家創(chuàng)新體系以及實施創(chuàng)新驅動發(fā)展戰(zhàn)略具有重要意義。文章從組織網(wǎng)絡、數(shù)據(jù)資源、標準規(guī)范、數(shù)據(jù)應用方面總結分析國家科學數(shù)據(jù)中心建設發(fā)展經(jīng)驗,為江蘇建設省級科學數(shù)據(jù)中心提供啟示與借鑒。
關鍵詞:科學數(shù)據(jù)中心;科學數(shù)據(jù);數(shù)據(jù)管理;數(shù)據(jù)共享
中圖分類號:G203 文獻標志碼:A
0 引言
科學數(shù)據(jù)是支撐科技創(chuàng)新及經(jīng)濟社會發(fā)展的基礎性和戰(zhàn)略性資源,科學數(shù)據(jù)中心作為數(shù)據(jù)管理、開放共享的重要基礎設施,是大數(shù)據(jù)時代科技創(chuàng)新能力提升的重要保障。自2018年國務院辦公廳發(fā)布《科學數(shù)據(jù)管理辦法》以來,科技部、財政部對原有國家平臺開展優(yōu)化調整工作,于2019年布局形成20個國家科學數(shù)據(jù)中心。近年來,國家科學數(shù)據(jù)中心不斷強化數(shù)據(jù)要素資源集聚,積極構建各自領域的科學數(shù)據(jù)共享網(wǎng)絡,在科學數(shù)據(jù)服務國家重大戰(zhàn)略、支撐基礎研究和技術研發(fā)等方面已有相關實踐探索。本文通過總結國家科學數(shù)據(jù)中心建設發(fā)展經(jīng)驗,分析江蘇省科學數(shù)據(jù)資源擁有現(xiàn)狀,為江蘇建設省級科學數(shù)據(jù)中心建設提供建議。
1 國家科學數(shù)據(jù)中心建設發(fā)展經(jīng)驗
1.1 積極構建組織網(wǎng)絡
國家科學數(shù)據(jù)中心均有非常顯著的領域屬性,且通常是某一基礎學科或行業(yè)內占主導地位的科學數(shù)據(jù)中心,因此,其依托建設單位一般為該領域的優(yōu)勢科研機構。本文梳理了20個科學數(shù)據(jù)中心現(xiàn)有的組織架構(見表1),基本按照“1+N”的合作共建模式,建設單位覆蓋了本領域高水平的高等學校及科研院所。這樣的組織架構不僅能將細分領域的人才、成果等科技資源以主體為單位匯集,還能加強團隊間合作研究,加速推動科學數(shù)據(jù)的共建共享。
1.2 持續(xù)匯聚數(shù)據(jù)資源
國家科學數(shù)據(jù)中心以學科領域為主線,充分發(fā)揮共建單位資源優(yōu)勢,突出數(shù)據(jù)“分級分類、多線匯流”,將不同層次、不同細分領域的數(shù)據(jù)整合匯交,集聚行業(yè)及地域分中心、野外觀測試驗站點、計劃專項、數(shù)據(jù)論文等多圈層數(shù)據(jù),根據(jù)實際情況構建新的數(shù)據(jù)中心資源分類體系。在多種數(shù)據(jù)類目中,科研機構、數(shù)據(jù)站點等在實驗、觀測過程中采集的第一手科學數(shù)據(jù)通常占比最多,同時,科技計劃項目產生的科學數(shù)據(jù)也是相對穩(wěn)定的數(shù)據(jù)來源。根據(jù)《科學數(shù)據(jù)管理辦法》,國家科學數(shù)據(jù)中心承擔各領域科學數(shù)據(jù)匯交管理、共享與服務工作,目前國家科技基礎性專項項目、國家重點研發(fā)計劃項目的科學數(shù)據(jù)匯交工作均已常態(tài)化開展,由此加速推動科學數(shù)據(jù)的多尺度匯交和全域化積累。
1.3 逐步建立標準體系
科學數(shù)據(jù)共享標準體系的建立為科學數(shù)據(jù)的高度共享及其與其他應用系統(tǒng)的適配創(chuàng)造必要的條件[1]。國家于2009年成立全國科技平臺標準化技術委員會,加速推進科技平臺建設、管理等方面的標準化工作??茖W數(shù)據(jù)來源、形態(tài)、分布各異,因此,相比其他科技資源,建立覆蓋數(shù)據(jù)描述、采集、匯交、存儲、共享等一系列流程的數(shù)據(jù)標準體系顯得尤為重要。國家科學數(shù)據(jù)中心在國家科技基礎條件平臺現(xiàn)有基礎標準和規(guī)范框架的基礎上,按照“邊建邊用、需求導向、內外協(xié)調”的原則,相繼開展領域內科學數(shù)據(jù)標準的研制與應用,極大地保障了數(shù)據(jù)匯交的效果與質量,提高了領域內數(shù)據(jù)的兼容性和互操作性,進而為高效的數(shù)據(jù)共享和大數(shù)據(jù)分析提供基礎。
1.4 不斷強化數(shù)據(jù)應用
數(shù)據(jù)驅動的科學發(fā)現(xiàn)已成為科研“第四范式”,國家科學數(shù)據(jù)中心不僅是各領域分散數(shù)據(jù)整合集成的樞紐,還是數(shù)據(jù)共享應用的試驗基地。除了數(shù)據(jù)的實時發(fā)布、統(tǒng)一檢索,國家科學數(shù)據(jù)中心基于其先進的算力和專業(yè)的人才團隊,積極探索科學數(shù)據(jù)存儲、數(shù)據(jù)認證、數(shù)據(jù)出版、數(shù)據(jù)計算、數(shù)據(jù)工具及產品開發(fā)等服務模式,開拓多樣化的科學數(shù)據(jù)應用場景,推動形成高質量、具有領域影響力的關鍵數(shù)據(jù)集,形成可復用、可推廣的衍生數(shù)據(jù)產品,逐步實現(xiàn)由數(shù)據(jù)共享服務到知識服務的轉型升級。雖然各科學數(shù)據(jù)中心的服務各有側重,但都在服務基礎科學研究、支撐國家重大戰(zhàn)略等方面發(fā)揮了重要作用,通過具體的數(shù)據(jù)共享實踐打造了行業(yè)領域內、區(qū)域內的數(shù)據(jù)應用生態(tài)。
2 江蘇省科學數(shù)據(jù)現(xiàn)狀調研
2.1 科學數(shù)據(jù)政策
江蘇省委、省政府高度重視科學數(shù)據(jù)統(tǒng)籌工作,2019年,省政府出臺《江蘇省科學數(shù)據(jù)管理實施細則》(蘇政辦發(fā)[2019]20號),為進一步加強和規(guī)范科學數(shù)據(jù)管理、保障科學數(shù)據(jù)安全、提高開放共享水平提供制度保障;同年,省政府分管領導擔任理事長,省委組織部、省發(fā)展改革委等13個主管部門和單位共同參與的省科技資源統(tǒng)籌服務平臺理事會,正式審定印發(fā)《江蘇省科技資源統(tǒng)籌服務平臺建設方案》,明確提出建設省科學數(shù)據(jù)中心。2021年,江蘇省“十四五”科技創(chuàng)新規(guī)劃再次將省科學數(shù)據(jù)中心建設列入目標任務。2022年,江蘇省科學數(shù)據(jù)中心建設正式啟動。
2.2 科學數(shù)據(jù)資源
江蘇是科教大省,科技資源門類齊全、總量富集。截至2021年年底,江蘇省共有132家部省屬高校院所、190家國家與省級重點實驗室、260家省級科技公共服務平臺,建設布局網(wǎng)絡通信與安全紫金山實驗室等9家重大科研設施。隨著各類科技載體承擔項目數(shù)量的增長,科學數(shù)據(jù)在地球科學、生物學等一些學科、產業(yè)領域已有小規(guī)模集成,根據(jù)2022年江蘇省100家國家級和省級學科重點實驗室科學數(shù)據(jù)調研情況,共51家學科重點實驗室建有科學數(shù)據(jù)集(庫),從實驗室依托建設單位看,26家高等學校、6家科研院所建有科學數(shù)據(jù)庫(集)。大部分科學數(shù)據(jù)都有國家和省級科研項目支撐,數(shù)據(jù)主要來自應用基礎研究,覆蓋了地球科學、生物學、材料科學與工程等學科??茖W數(shù)據(jù)來源主要有試驗開發(fā)、觀測檢測、檢驗檢測等,以數(shù)值、文本、圖形類數(shù)據(jù)為主。江蘇省學科重點實驗室擁有數(shù)據(jù)超52億條,總量約665 TB。目前,江蘇省內單位承擔的國家重點研發(fā)計劃項目產生的科學數(shù)據(jù)已向國家平臺開展匯交,通過科學數(shù)據(jù)匯交評審并取得匯交憑證后方能結題。
2.3 問題分析
2.3.1 科學數(shù)據(jù)有效積累不足
當前,科學研究已進入數(shù)據(jù)驅動的“第四范式”,科技創(chuàng)新越來越依賴高量級、高信度的科學數(shù)據(jù)。各類創(chuàng)新主體在科研攻關中存在大量的科學數(shù)據(jù)訴求,但江蘇省科學數(shù)據(jù)有效積累尚顯不足。一方面,江蘇省內尚未布局數(shù)據(jù)中心載體,通過開展基礎研究、觀測試驗等形成的科學數(shù)據(jù)沒有統(tǒng)一的匯集渠道,導致科學數(shù)據(jù)散落在不同學院、課題組、個人的手中,且省、市不同層級和不同部門之間科學數(shù)據(jù)整合難度較大。另一方面,雖然《江蘇省科學數(shù)據(jù)管理實施細則》已發(fā)布,但尚未對省級財政預算資金支持的科學計劃項目做統(tǒng)一的科學數(shù)據(jù)匯交要求,導致科學數(shù)據(jù)來源不固定,且數(shù)據(jù)匯交標準體系不一,篩選、清洗、加工的難度較大,不利于數(shù)據(jù)分級分類管理和數(shù)據(jù)質量提升,極大制約了科學數(shù)據(jù)的長期有效積累。
2.3.2 科學數(shù)據(jù)共享機制不完善
科學數(shù)據(jù)及相關衍生數(shù)據(jù)日益豐富,在一些領域已有小規(guī)模集成,但總體看,科學數(shù)據(jù)統(tǒng)籌服務體系還不完善。目前,省級層面推進數(shù)據(jù)共享的細化措施不明確,國內數(shù)據(jù)確權的工作也處于初步探索中,致使數(shù)據(jù)權利主體和價值評定存在困難,對數(shù)據(jù)主體的權利保護不詳細、不到位,主體多元、權益不清的問題沒有得到解決。同時,科學數(shù)據(jù)開放共享氛圍尚未形成,科研人員存在數(shù)據(jù)“個人私有”“成果專享”“利益專屬”的固化觀念,數(shù)據(jù)開放“不愿”“不敢”“不會”的現(xiàn)象普遍存在,高價值的科學數(shù)據(jù)難以得到充分有效的共享利用,且科學數(shù)據(jù)多源異構、標準不一,這為數(shù)據(jù)的開放服務和挖掘應用增添了難度。
2.3.3 科學數(shù)據(jù)支撐創(chuàng)新能力不足
一方面,科學數(shù)據(jù)挖掘分析和開發(fā)利用不足。當前,江蘇省內科學數(shù)據(jù)的數(shù)據(jù)成果轉化和應用場景探索還在起步階段,供需分離、共享不易??茖W數(shù)據(jù)供給與需求在空間、時序上分離,且基于創(chuàng)新數(shù)據(jù)驅動的創(chuàng)新需求具有高度緘默性與復雜性,現(xiàn)有各類平臺對挖掘、重構數(shù)據(jù)價值的能力不足,導致科學數(shù)據(jù)賦能科技創(chuàng)新的能級較低。另一方面,科學數(shù)據(jù)行業(yè)生態(tài)尚未健全,專業(yè)服務機構數(shù)目與能力不足。專業(yè)服務機構的數(shù)目和能力直接影響科學數(shù)據(jù)體系的效率水平,其“少、弱、散”的現(xiàn)狀既阻塞了科學數(shù)據(jù)成果轉化及應用場景拓展,薄弱的專業(yè)人才隊伍也極大制約了科學數(shù)據(jù)融合驅動科技創(chuàng)新潛能。
3 江蘇省科學數(shù)據(jù)中心發(fā)展建議
3.1 結合地方優(yōu)勢特色,布局領域科學數(shù)據(jù)分中心
國家科學數(shù)據(jù)中心布局已覆蓋大部分重點學科領域,突出重大問題導向,優(yōu)勢資源集聚效應顯著。為避免重復建設,對于江蘇省科學數(shù)據(jù)中心而言,應本著“特色引領、優(yōu)勢互補、上下交換”的原則布局建設“1+N”科學數(shù)據(jù)運行體系。在江蘇省科學數(shù)據(jù)總中心的架構下,緊密銜接本省科技創(chuàng)新發(fā)展戰(zhàn)略,聚焦生物醫(yī)藥、新材料等省內先導產業(yè)領域建設一批科學數(shù)據(jù)分中心。優(yōu)先選取擁有一定體量科學數(shù)據(jù)資源、具備較強科技資源整合能力、具有一定專業(yè)或行業(yè)影響力的高校院所作為依托單位:一是縱向交換,加強與國家科學數(shù)據(jù)中心對接合作,實現(xiàn)與國家級科學數(shù)據(jù)共享與互通;二是橫向整合,持續(xù)吸納本省各資源管理單位的優(yōu)質數(shù)據(jù)資源,以此保障本領域觀測監(jiān)測、基礎研究、技術研發(fā)、試驗加工等多源多面數(shù)據(jù)匯聚融合。
3.2 探索數(shù)據(jù)標準構建,規(guī)范數(shù)據(jù)管理服務
為保證地方科學數(shù)據(jù)標準與國家標準的協(xié)同一致,增加地方標準的適用性和實效性,江蘇應充分借鑒國家科學數(shù)據(jù)中心的標準編制經(jīng)驗,加強與國家標準、團體標準的銜接,積極參與國家科學數(shù)據(jù)中心主導的科學數(shù)據(jù)標準規(guī)范編制工作,進一步提高本省標準研制能力。后期在取得相關標準成果的基礎上,結合江蘇特色,在數(shù)據(jù)匯交、質量控制、安全存儲、共享服務等方面,試點編制江蘇省地方科學數(shù)據(jù)標準,加速推動構建全省統(tǒng)一、權威、完備的標準規(guī)范體系,為多源異構的數(shù)據(jù)集成、分析、處理等提供依據(jù)。
3.3 試點科技計劃項目,實現(xiàn)科學數(shù)據(jù)匯交
科技計劃項目是我國政府部門支持科技創(chuàng)新活動的重要途徑和手段,代表著我國科技創(chuàng)新的最高水平,也集聚了各項目團隊研究過程中產生的高價值科學數(shù)據(jù)[2]??茖W數(shù)據(jù)匯交是確保我國科學數(shù)據(jù)自主可控的關鍵舉措,如何合理規(guī)范化地開展科技計劃項目科學數(shù)據(jù)匯交,是各級科技計劃項目管理部門需長期關注的問題[3]。江蘇可以國家科學數(shù)據(jù)匯交實踐為導向,試點選取省級重點研發(fā)計劃等能夠產生海量科學數(shù)據(jù)資源的項目類別,設計科學、便捷、有效的數(shù)據(jù)匯交流程,營造科學數(shù)據(jù)匯交氛圍。同時,結合江蘇實際探索引進國家科學數(shù)據(jù)中心資源服務本地工作。
3.4 強化數(shù)據(jù)挖掘分析,推動數(shù)據(jù)成果轉化
“十三五”時期,我國大數(shù)據(jù)產業(yè)快速起步,加快培育我國數(shù)據(jù)要素市場成為當下經(jīng)濟發(fā)展的新命題。2022年12月發(fā)布的《中共中央 國務院關于構建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》進一步凸顯了數(shù)據(jù)生產要素的巨量價值。近年來,各地積極打造數(shù)據(jù)交易中心(所),圍繞數(shù)據(jù)交易、流通和利用積極探索制度和服務創(chuàng)新,加快推動數(shù)據(jù)要素價值轉化。高質量的科學數(shù)據(jù)具有巨大的開發(fā)潛力,無疑能夠成為當下科技成果新的表達式。江蘇擁有科技資源管理服務機構(江蘇省科技資源統(tǒng)籌服務中心)與第四方技術轉移公共服務平臺(江蘇省技術產權交易市場)一體化融合發(fā)展的先天優(yōu)勢,理應充分發(fā)揮技術產權交易市場的橋梁紐帶作用,強化科學數(shù)據(jù)多源集聚和融合分析,推動形成一批多時相、細粒度、高質量的數(shù)據(jù)集產品,探索數(shù)據(jù)確權、數(shù)據(jù)交易,以成果轉化的方式激發(fā)市場供需兩端積極性,深度參與數(shù)據(jù)要素市場建設。
3.5 引導多方共建共享,探索數(shù)據(jù)應用場景
共享服務是科學數(shù)據(jù)價值實現(xiàn)的橋梁和媒介,創(chuàng)造數(shù)據(jù)應用場景是科學數(shù)據(jù)價值充分發(fā)揮的必要條件[4]。構建完善的科學數(shù)據(jù)共享服務生態(tài),需要多方主體共同發(fā)力、協(xié)同推進。一是從省級政府層面加強頂層設計,細化科學數(shù)據(jù)管理細則,加速地方科學數(shù)據(jù)中心建設,推動科技計劃項目科學數(shù)據(jù)匯交,營造數(shù)據(jù)匯交文化,逐漸培養(yǎng)社會各方的使用習慣。二是需充分運用市場化手段引導高校院所、專業(yè)機構積極參與,江蘇于2021年發(fā)起成立的科技資源統(tǒng)籌服務共同體,在多主體協(xié)同、多要素融合方面有豐富的實踐經(jīng)驗,但還需依托共同體加強金融、技術、數(shù)據(jù)等多重力量加持,推動服務模式與協(xié)作機制創(chuàng)新,加快推進科學數(shù)據(jù)在各個層面的“區(qū)塊鏈接”,合力打造具有地方特色的科學數(shù)據(jù)服務品牌[5]。
參考文獻
[1]徐楓.科學數(shù)據(jù)共享標準體系框架[J].中國基礎科學,2003(1):44-49.
[2]徐波,王瑞丹,王卷樂,等.科技計劃項目科學數(shù)據(jù)匯交共性機制研究[J].中國科技資源導刊,2021(1):9-14.
[3]許琦,鄒自明,袁雅琴,等.科技計劃項目數(shù)據(jù)管理過程模型[J].大數(shù)據(jù),2022(1):15-23.
[4]張貴蘭,王健,潘堯,等.科學數(shù)據(jù)共享服務模式及其演化研究[J].情報理論與實踐,2022(2):70-77.
[5]張宣.1+N+X,創(chuàng)新資源要素高效流轉起來[N].新華日報,2021-12-01(16).
(編輯 李春燕)