孫葉華 劉桂鋒,2 陳帥印
(1. 江蘇大學科技信息研究所,鎮(zhèn)江 212013;2. 江蘇大學圖書館,鎮(zhèn)江 212013)
科學數(shù)據(jù)是指人類社會科技活動所產(chǎn)生的基本數(shù)據(jù),以及按照不同需求而系統(tǒng)加工的數(shù)據(jù)產(chǎn)品和相關信息[1],其價值的實現(xiàn)主要體現(xiàn)在對科學數(shù)據(jù)資源的深度挖掘和廣泛應用上。隨著科研活動的多樣性以及科學數(shù)據(jù)的重要性發(fā)展,科技創(chuàng)新越來越依賴數(shù)據(jù),科學數(shù)據(jù)的開放、共享也逐漸成為國內外相關學者及機構的研究重點。例如,Science Europe在面對海量的科學數(shù)據(jù)時,選擇將FAIR原則作為管理和共享科研數(shù)據(jù)的基礎[2]。
我國自2001年底正式啟動“科學數(shù)據(jù)共享工程”以來,為了充分發(fā)揮我國科技數(shù)據(jù)資源的作用,在資源環(huán)境、農(nóng)業(yè)、人口與健康等領域的24個部門開展科學數(shù)據(jù)共享工作,啟動9個科學數(shù)據(jù)共享試點[3]。2011年,23個科技平臺被認定為國家首批科技基礎條件平臺,進一步推動我國科技資源的整合共享與高效利用。2014年,正式發(fā)布《科技平臺標準化工作指南》《科技平臺元數(shù)據(jù)標準化基本原則與方法》《科技平臺元數(shù)據(jù)注冊與管理》《科技平臺資源核心元數(shù)據(jù)》,從元數(shù)據(jù)等方面對科技平臺的數(shù)據(jù)進行統(tǒng)一的管理,使得科學數(shù)據(jù)在開放共享以及應用的過程中更加規(guī)范化、標準化。2015年,“十三五規(guī)劃”中首次提出“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”[4]。2018年,科技部、財政部正式發(fā)布《國家科技資源共享服務平臺管理辦法》,強調利用科學數(shù)據(jù)等科技資源在國家層面設立專業(yè)化、綜合性公共服務平臺的必要性。同年,國務院辦公廳頒布的《科學數(shù)據(jù)管理辦法》確立了科學數(shù)據(jù)“開放為常態(tài)、不開放為例外”的共享原則,明確了要加強對科學數(shù)據(jù)的開放共享和管理使用[5]。
科學數(shù)據(jù)共享通過提供可靠且可信賴的數(shù)據(jù)來顯著改善科研過程,已成為數(shù)據(jù)驅動科學的基本服務[6]。目前,我國科學數(shù)據(jù)共享平臺存在以分散、凌亂、孤立為特點的“數(shù)據(jù)孤島”現(xiàn)實問題。其中,國家科學數(shù)據(jù)中心是由國家按照統(tǒng)一標準和規(guī)劃設立的大型數(shù)據(jù)管理設施,承擔著我國科學數(shù)據(jù)管理共享、應用和支撐關聯(lián)學科發(fā)展的重任,具有領域代表性、行業(yè)領導性、技術先進性和數(shù)據(jù)公開性,能夠體現(xiàn)出我國科學數(shù)據(jù)共享平臺的較高水平,因此選擇國家科學數(shù)據(jù)中心進行關聯(lián)研究,以期促進科學數(shù)據(jù)的開放與共享。
國內外不同學者主要從科研領域的元數(shù)據(jù)標準、元數(shù)據(jù)體系、元數(shù)據(jù)應用、元數(shù)據(jù)關聯(lián)及互操作等方面開展科學數(shù)據(jù)元數(shù)據(jù)的相關研究。Qin等[7]探討科學數(shù)據(jù)元數(shù)據(jù)的功能和架構需求,以支持數(shù)據(jù)管理、數(shù)據(jù)質量控制、數(shù)據(jù)發(fā)現(xiàn)和數(shù)據(jù)使用;劉峰等[8]分析了當前科研領域6種典型的元數(shù)據(jù)標準,在統(tǒng)計的基礎上設計并構建科學數(shù)據(jù)通用元數(shù)據(jù)規(guī)范;司莉等[9]以美國開放政府數(shù)據(jù)網(wǎng)站Data.gov中的元數(shù)據(jù)標準為例,分析其元數(shù)據(jù)的體系及具體標準,歸納總結美國開放政府數(shù)據(jù)元數(shù)據(jù)標準的體系結構;Si等[10]調查研究在USA News排位世界前100名的大學圖書館科學數(shù)據(jù)服務內容,發(fā)現(xiàn)28.7%的高校圖書館提供了科學數(shù)據(jù)的元數(shù)據(jù)相關服務,包括元數(shù)據(jù)的簡介以及創(chuàng)建等;黃文碧[11]詳細闡述元數(shù)據(jù)關聯(lián)在館藏資源聚合研究中的重要性,從元數(shù)據(jù)倉庫構建、元數(shù)據(jù)映射和元數(shù)據(jù)關聯(lián)等方面進行分析與應用;賈歡[12]選取地球科學相關領域的科學數(shù)據(jù)元數(shù)據(jù)標準,研究元數(shù)據(jù)之間的互操作方法,通過本體實現(xiàn)科學數(shù)據(jù)元數(shù)據(jù)之間的語義互操作。
科學數(shù)據(jù)的關聯(lián)與融合是科學數(shù)據(jù)在科研全過程中達到互操作、互利用的必要過程。目前科學數(shù)據(jù)關聯(lián)與融合相關研究主要圍繞關聯(lián)數(shù)據(jù)、文獻數(shù)據(jù)與科學數(shù)據(jù)的融合等方向進行。Kauppinen[13]在2011年發(fā)起建立linked-science.org,提出關聯(lián)科學(Linked Science),將科學數(shù)據(jù)進行關聯(lián),實現(xiàn)數(shù)據(jù)的透明化;游毅等[14]構建基于關聯(lián)數(shù)據(jù)的科研數(shù)據(jù)資源共享模式,包括科研關聯(lián)數(shù)據(jù)的創(chuàng)建發(fā)布和科研共享數(shù)據(jù)網(wǎng)絡的構建;莊倩等[15]在關聯(lián)數(shù)據(jù)概念模型的基礎上,提出了科學數(shù)據(jù)組織模式,該模式利用RDF描述特征,通過本體映射和互操作來實現(xiàn)語義互聯(lián)關系的搭建,從而進一步確立了科學數(shù)據(jù)關聯(lián)融合的新方向;陸穎等[16]從圖書館服務研究的角度,基于多個層面對文獻數(shù)據(jù)與科學數(shù)據(jù)融合進行調研,針對各文獻數(shù)據(jù)與科學數(shù)據(jù)融合服務中的用戶與學科服務之間關系,提出了合作、支撐、服務以及共享互動的關系網(wǎng)絡;張曉霞[17]對科學文獻中生物本體間的情感關系表達、潛在關系抽取以及異源異構數(shù)據(jù)融合三方面進行研究,使異源異構數(shù)據(jù)能實現(xiàn)集成信息服務,達到跨異構庫知識發(fā)現(xiàn)的研究目的。
科學數(shù)據(jù)的關聯(lián)融合研究推動了科學數(shù)據(jù)的開放、共享進展,而科學數(shù)據(jù)共享中心的出現(xiàn)是科學數(shù)據(jù)相關研究不斷推進的結果。許多國家都頒布了多項科學數(shù)據(jù)共享政策法規(guī),用以促進與規(guī)范科學數(shù)據(jù)的共享[18]。目前有許多學者對科學數(shù)據(jù)共享平臺進行調研,其研究內容側重于科學數(shù)據(jù)共享平臺建設、科學數(shù)據(jù)組織、科學數(shù)據(jù)管理與共享等方面。Plantin等[19]講述數(shù)據(jù)存儲、共享和管理平臺案例研究,科學數(shù)據(jù)共享平臺正在逐步取代和重新配置傳統(tǒng)學術交流的基礎規(guī)范與技術;黃銘瑞等[20]梳理美、英及中國的國家科學數(shù)據(jù)中心的建設布局,歸納并提出其管理模式與評價方式,通過對比分析提出我國科學數(shù)據(jù)中心的發(fā)展演化模式;盧逸航等[21]調研各種科學數(shù)據(jù)互操作模式與技術適用條件,結合我國科學數(shù)據(jù)中心的特點,提出7種科學數(shù)據(jù)中心間互操作的模式。Curtis等[22]研究制定一個系統(tǒng)框架,評估科學數(shù)據(jù)共享平臺的社會影響;司莉等[23]調查6個國家科學數(shù)據(jù)中心,了解各平臺數(shù)據(jù)的學科分布與數(shù)據(jù)量,從數(shù)據(jù)組織方式、數(shù)據(jù)描述、數(shù)據(jù)檢索3個方面分析平臺數(shù)據(jù)組織現(xiàn)狀,發(fā)現(xiàn)其中不足,從而提出平臺優(yōu)化建議;劉小宇等[24]以國家科技基礎條件平臺為例,分析科學數(shù)據(jù)共享平臺的被引用狀況,發(fā)現(xiàn)在平臺建設和科學數(shù)據(jù)引用方面存在的問題,以期能規(guī)范化建設平臺和標準化引用科學數(shù)據(jù);Thomas等[25]詳細介紹用戶如何使用SPARK平臺共享數(shù)據(jù),以及如何利用平臺數(shù)據(jù)來建立假設;李曉萍[26]以農(nóng)業(yè)科學數(shù)據(jù)共享平臺為例,對農(nóng)業(yè)科學數(shù)據(jù)共享平臺現(xiàn)狀進行闡述,并結合多種研究方法對影響用戶持續(xù)使用農(nóng)業(yè)科學數(shù)據(jù)共享平臺的主要因素進行了研究,從而基于用戶的使用影響因素提出完善農(nóng)業(yè)科學數(shù)據(jù)共享平臺的建議。
目前,科學數(shù)據(jù)元數(shù)據(jù)、科學數(shù)據(jù)的管理與關聯(lián)融合、科學數(shù)據(jù)共享平臺的理論研究較為豐富,但是實踐應用方面還較為薄弱。由于我國國家層面的科學數(shù)據(jù)共享平臺標準頒布較晚,而在此之前各數(shù)據(jù)平臺已經(jīng)結合自身數(shù)據(jù)特征制定了一系列標準,導致缺乏數(shù)據(jù)標準的通用性,因此出現(xiàn)大量的獨立“數(shù)據(jù)煙囪”的狀況。與此同時,不同領域的科學數(shù)據(jù)共享平臺之間缺乏協(xié)調,難以實現(xiàn)不同科學數(shù)據(jù)之間的互操作,如各平臺采用各自的學科元數(shù)據(jù)標準、平臺間元數(shù)據(jù)字段不盡相同、通用的核心字段較少等。這不僅會影響數(shù)據(jù)質量,也會給不同平臺之間數(shù)據(jù)的流通與整合造成不便。
因此,本文將關聯(lián)數(shù)據(jù)技術的思想引入科學數(shù)據(jù)研究中,基于黃河流域生態(tài)保護和高質量發(fā)展跨平臺專題數(shù)據(jù),設計關聯(lián)元數(shù)據(jù),對國家科學數(shù)據(jù)中心的科學數(shù)據(jù)集元數(shù)據(jù)進行關聯(lián)研究,從而構建國家科學數(shù)據(jù)中心關聯(lián)模型,探究不同領域科學數(shù)據(jù)的互操作性、互相關性,有助于促進科學數(shù)據(jù)之間的協(xié)調性、增進數(shù)據(jù)流通的通用性,從而達到科學數(shù)據(jù)在科研過程中的應用性、在科研成果中的可轉化性以及在不同科學數(shù)據(jù)中心之間的可流通性。
本研究的數(shù)據(jù)來源于國家科技基礎條件平臺上的國家科學數(shù)據(jù)中心。前期采用網(wǎng)絡調研法,對20個國家科學數(shù)據(jù)中心的平臺建設、數(shù)據(jù)資源、數(shù)據(jù)服務等基本情況進行調查。調查發(fā)現(xiàn),物理、生態(tài)、農(nóng)業(yè)、林業(yè)、氣象等多個領域建設了國家科學數(shù)據(jù)中心,覆蓋范圍廣泛,數(shù)據(jù)資源豐富,數(shù)據(jù)量龐大,中心還提供數(shù)據(jù)檢索、數(shù)據(jù)專題、數(shù)據(jù)匯交、數(shù)據(jù)共享等多種數(shù)據(jù)服務。但這些數(shù)據(jù)中心成立時間不一,發(fā)展成熟度也有區(qū)別,同時存在數(shù)據(jù)分散、數(shù)據(jù)標準格式不一致、數(shù)據(jù)通用性差、數(shù)據(jù)利用率較低等問題。
在研究各個國家科學數(shù)據(jù)中心科學數(shù)據(jù)時,發(fā)現(xiàn)國家地球系統(tǒng)科學數(shù)據(jù)中心、國家農(nóng)業(yè)科學數(shù)據(jù)中心、國家林業(yè)和草原科學數(shù)據(jù)中心、國家氣象科學數(shù)據(jù)中心合作共建了黃河流域生態(tài)保護和高質量發(fā)展跨平臺專題(以下簡稱“黃河流域專題”),其元數(shù)據(jù)通用性強,可擴展性好,故選擇該專題數(shù)據(jù)為突破口進行國家科學數(shù)據(jù)中心關聯(lián)研究。
黨的十八大以來,以習近平同志為核心的黨中央,對于人類文明在不斷發(fā)展的過程中形成的規(guī)律進行了深刻總結,在我們國家的社會主義建設的總體布局中,加入生態(tài)文明建設[27]。習近平總書記多次實地考察黃河流域生態(tài)保護情況,并作出重要批示。國家地球系統(tǒng)科學數(shù)據(jù)中心、國家農(nóng)業(yè)科學數(shù)據(jù)中心、國家林業(yè)和草原科學數(shù)據(jù)中心、國家氣象科學數(shù)據(jù)中心積極響應并落實《中共中央關于制定國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠景目標的建議》,聯(lián)合開展黃河流域“三生”(生態(tài)-生產(chǎn)-生活)協(xié)同發(fā)展研究,建立黃河流域生態(tài)保護與高質量發(fā)展專題庫,為促進黃河流域生態(tài)保護與高質量發(fā)展國家戰(zhàn)略實施、保障黃河長治久安提供全方位科技支撐具有重要意義[28]。截至2022年7月,黃河流域專題共擁有3884個科學數(shù)據(jù)集,可按主題分為林業(yè)、農(nóng)業(yè)、氣象氣候、地理、環(huán)境、生態(tài)、對地觀測、資源、地質九大類型,主要集中在林業(yè)和地理兩大主題(數(shù)據(jù)集數(shù)量分別為1882個和1083個);從數(shù)據(jù)集所屬數(shù)據(jù)中心看,絕大部分的科學數(shù)據(jù)集由國家地球系統(tǒng)科學數(shù)據(jù)中心、國家林業(yè)和草原科學數(shù)據(jù)中心提供,來源較為單一,且大部分的氣象氣候數(shù)據(jù)以及地理、環(huán)境、生態(tài)、對地觀測、資源、地質6種主題科學數(shù)據(jù)均由國家地球系統(tǒng)科學數(shù)據(jù)中心提供,究其原因,可能是由于國家地球系統(tǒng)科學數(shù)據(jù)中心涵蓋大氣圈、水圈、巖石圈、陸地表層等18個一級學科資源,涉及領域廣泛。
經(jīng)調查研究發(fā)現(xiàn),國家生態(tài)科學數(shù)據(jù)中心和國家對地觀測數(shù)據(jù)中心的科學數(shù)據(jù)集里可供關聯(lián)的元數(shù)據(jù)較多,且元數(shù)據(jù)具備典型特色,可以為黃河流域專題提供良好的數(shù)據(jù)服務。因此,本研究基于黃河流域專題數(shù)據(jù),以其元數(shù)據(jù)為切入點,增加國家生態(tài)科學數(shù)據(jù)中心和國家對地觀測數(shù)據(jù)中心相關數(shù)據(jù),研究國家地球系統(tǒng)科學數(shù)據(jù)中心、國家農(nóng)業(yè)科學數(shù)據(jù)中心、國家林業(yè)和草原科學數(shù)據(jù)中心、國家氣象科學數(shù)據(jù)中心、國家生態(tài)科學數(shù)據(jù)中心和國家對地觀測數(shù)據(jù)中心之間的關聯(lián)關系,共同構建國家科學數(shù)據(jù)中心關聯(lián)模型,擴大科學數(shù)據(jù)的流通與共享,豐富黃河流域專題數(shù)據(jù)的來源與類型,有助于從不同視角完善黃河流域相關科學數(shù)據(jù),有利于促進黃河流域生態(tài)保護和高質量發(fā)展。
構建國家科學數(shù)據(jù)中心關聯(lián)模型,其核心在于實現(xiàn)數(shù)據(jù)中心之間的數(shù)據(jù)關聯(lián)和共享,首先基于黃河流域專題數(shù)據(jù)的元數(shù)據(jù)確定關聯(lián)元數(shù)據(jù)元素,然后利用關聯(lián)元數(shù)據(jù)元素實現(xiàn)6個國家科學數(shù)據(jù)中心科學數(shù)據(jù)的關聯(lián)。
經(jīng)調查,黃河流域專題數(shù)據(jù)元數(shù)據(jù)分別包括數(shù)據(jù)集名稱、CSTR、主題詞、數(shù)據(jù)覆蓋范圍、數(shù)據(jù)貢獻者、所屬國家科學數(shù)據(jù)中心、數(shù)據(jù)摘要、質量控制信息。元數(shù)據(jù)元素,是元數(shù)據(jù)最基本的信息單元,采用一定的元數(shù)據(jù)標準來描述數(shù)據(jù)的組織結構和內容特征,從而實現(xiàn)對大量數(shù)據(jù)的高效管理。元數(shù)據(jù)元素設計應遵循復用性、可擴展性、互操作性等元數(shù)據(jù)設計的一般原則,以保證元數(shù)據(jù)的結構合理、元素可用,保證經(jīng)描述的數(shù)據(jù)資源可共享。本研究根據(jù)這些元數(shù)據(jù)轉化設計關聯(lián)元數(shù)據(jù)元素依次為題名、資源標識、主題、覆蓋范圍、創(chuàng)作者、資源來源、資源描述、數(shù)據(jù)質量。以關聯(lián)元數(shù)據(jù)元素為媒介,將6個國家科學數(shù)據(jù)中心的元數(shù)據(jù)進行關聯(lián)得到6個國家科學數(shù)據(jù)中心的元數(shù)據(jù)的關聯(lián)關系(見表1)。其中,題名、資源標識、主題、覆蓋范圍、創(chuàng)作者、資源來源、資源描述復用的是DC元數(shù)據(jù)標準,其元數(shù)據(jù)簡單、通用、可擴展性強;數(shù)據(jù)質量是參考《林業(yè)科學數(shù)據(jù)元數(shù)據(jù)標準》中的數(shù)據(jù)質量信息與《氣象數(shù)據(jù)集核心元數(shù)據(jù)》的數(shù)據(jù)質量描述后自定義的元數(shù)據(jù)。
表1 6個國家科學數(shù)據(jù)中心的元數(shù)據(jù)關聯(lián)關系
同時,將這6個國家科學數(shù)據(jù)中心涵蓋的元數(shù)據(jù)元素以此劃分為通用元數(shù)據(jù)元素和專門元數(shù)據(jù)元素(見表2)。
表2 6個國家科學數(shù)據(jù)中心的元數(shù)據(jù)元素
根據(jù)設計的元數(shù)據(jù)元素,首先確定核心類為黃河流域科學數(shù)據(jù)集與國家科學數(shù)據(jù)中心,其元數(shù)據(jù)為子類,同時增加流域范圍和主題類型為核心類,豐富關聯(lián)模型,其分類類型為自己的子類;其次,以元數(shù)據(jù)之間的關聯(lián)關系確定類與類、類與子類、子類與子類之間的對象屬性,關聯(lián)元數(shù)據(jù)中的覆蓋范圍子類與流域范圍類關聯(lián),資源來源子類與國家科學數(shù)據(jù)中心類關聯(lián),9種主題科學數(shù)據(jù)與其所屬的國家科學數(shù)據(jù)中心關聯(lián);最后,利用Protégé本體編輯工具對其進行關聯(lián)模型的可視化呈現(xiàn)。
圖1是基于黃河流域專題數(shù)據(jù)構建的6個國家科學數(shù)據(jù)中心關聯(lián)模型。其中,虛線框內是原先實際聯(lián)合建設黃河流域專題的4家平臺,即國家地球系統(tǒng)科學數(shù)據(jù)中心、國家農(nóng)業(yè)科學數(shù)據(jù)中心、國家林業(yè)和草原科學數(shù)據(jù)中心、國家氣象科學數(shù)據(jù)中心。流域范圍數(shù)據(jù)集包括黃河全流域、黃河上游、黃河中上游、黃河中游、黃河中下游的數(shù)據(jù)以及分省數(shù)據(jù)。主題類型中農(nóng)業(yè)科學數(shù)據(jù)關聯(lián)至國家農(nóng)業(yè)科學數(shù)據(jù)中心,林業(yè)科學數(shù)據(jù)關聯(lián)至國家林業(yè)和草原科學數(shù)據(jù)中心,氣象氣候數(shù)據(jù)關聯(lián)國家氣象科學數(shù)據(jù)中心和國家地球系統(tǒng)科學數(shù)據(jù)中心,對地觀測數(shù)據(jù)關聯(lián)至國家對地觀測科學數(shù)據(jù)中心,生態(tài)科學數(shù)據(jù)關聯(lián)至國家生態(tài)科學數(shù)據(jù)中心,其余地理、地質、資源、環(huán)境等科學數(shù)據(jù)關聯(lián)至國家地球系統(tǒng)科學數(shù)據(jù)中心。
圖1 6個國家科學數(shù)據(jù)中心關聯(lián)模型
原先國家地球系統(tǒng)科學數(shù)據(jù)中心對黃河流域專題的數(shù)據(jù)支撐壓力較大,各國家科學數(shù)據(jù)中心的專門元數(shù)據(jù)也較少。在增加2個國家科學數(shù)據(jù)中心后構建的關聯(lián)模型中,黃河流域專題的數(shù)據(jù)來源與涉及的學科領域更加豐富,能夠調動更多數(shù)據(jù)資源,擴充了時間和空間分辨率、儀器名稱、數(shù)據(jù)投影信息等特色鮮明的專門元數(shù)據(jù),可以有效減輕國家地球系統(tǒng)科學數(shù)據(jù)中心的數(shù)據(jù)壓力。此外,國家對地觀測科學數(shù)據(jù)中心匯集大量遙感衛(wèi)星數(shù)據(jù),支持遙感數(shù)據(jù)治理和服務;國家生態(tài)科學數(shù)據(jù)中心擁有實時同化預測系統(tǒng)、國家生態(tài)系統(tǒng)評估綜合集成平臺、中國陸地生態(tài)系統(tǒng)碳源匯模擬平臺等一系列生態(tài)系統(tǒng)科學數(shù)據(jù)公共服務與分析平臺,以及獨有的全國野外站監(jiān)測數(shù)字系統(tǒng),能夠展現(xiàn)更多實時數(shù)據(jù),有助于從不同視角完善黃河流域相關科學數(shù)據(jù)資源,更好地實現(xiàn)跨平臺、跨學科的數(shù)據(jù)流通,提供更多數(shù)據(jù)應用與分析服務。
黃河流域生態(tài)保護與治理作為推進我國生態(tài)文明建設的重要方面,事關沿黃人民的切身利益和我國經(jīng)濟社會發(fā)展全局。基于元數(shù)據(jù)的國家科學數(shù)據(jù)中心關聯(lián)模型,充分匯聚整合多源數(shù)據(jù)資源,可實際應用于黃河流域的生態(tài)保護與修復,通過完善自然資源監(jiān)測數(shù)據(jù)、提升流域內災害防控與應急能力、助力生態(tài)修復工程實施、建立一體化生態(tài)環(huán)境智能監(jiān)測系統(tǒng)4個方面,為其生態(tài)治理與修復提供數(shù)據(jù)支持,從治理與防控兩個角度綜合解決黃河流域的生態(tài)問題,提高黃河流域治理的科學性和有效性。
黃河是我國的第二長河,流經(jīng)青海、四川、甘肅、寧夏、內蒙古、山西、陜西、河南、山東9個省(自治區(qū)),覆蓋面積廣闊,流域內資源豐富,若要進行流域生態(tài)保護和治理先要了解流域范圍內自然資源的分布情況。利用國家地球系統(tǒng)科學數(shù)據(jù)中心的資源科學數(shù)據(jù)(如水資源、農(nóng)業(yè)資源、生物資源、基礎地理數(shù)據(jù)、地形地貌數(shù)據(jù)等),國家林業(yè)和草原科學數(shù)據(jù)中心的濕地分布、土地資源、植被資源等數(shù)據(jù)集,疊加國家對地觀測科學數(shù)據(jù)中心的全球生態(tài)環(huán)境遙感監(jiān)測系統(tǒng)實時數(shù)據(jù),進一步明確黃河流域灘區(qū)邊界,摸清流域內林草、濕地、荒漠等自然資源空間分布情況,完善黃河流域自然資源三維立體“一張圖”,精準確定林草等自然資源保護和監(jiān)測范圍邊界(見圖2)。
圖2 自然資源監(jiān)測數(shù)據(jù)關聯(lián)可視化
以基礎地理數(shù)據(jù)為例,完善該類數(shù)據(jù)可關聯(lián)至國家地球系統(tǒng)科學數(shù)據(jù)中心,如黃河下游河道1∶10萬基礎地理數(shù)據(jù)集,該數(shù)據(jù)集包含黃河下游區(qū)域的基礎地理要素,包括鐵路、公路和大車路等道路要素,河流、渠道、大堤、生產(chǎn)堤、工程險工、大斷面等線狀地物,水域和居民地等面狀要素,省界與縣市界,閘門、虹吸、提灌站、公里樁等水利建筑設施。國家對地觀測科學數(shù)據(jù)中心也提供基礎地理數(shù)據(jù),如2020年黃河流域矢量范圍數(shù)據(jù),通過流域邊界的提取,可以劃定土壤侵蝕及非點源污染的遷移范圍,可用于黃河流域土壤風蝕時空動態(tài)評價、生態(tài)環(huán)境質量評價等方面研究。此外,可針對林草、水文等重要資源持續(xù)開展專題監(jiān)測,形成季度監(jiān)測成果,及時掌握自然資源動態(tài)變化情況,完善黃河流域自然資源綜合監(jiān)測體系,為黃河流域的資源空間規(guī)劃、生態(tài)治理和修復等工程提供基礎數(shù)據(jù)支持。
黃河流域生態(tài)環(huán)境脆弱,災害頻發(fā)。做好黃河流域內洪水、森林火災等災害的防控應急措施工作,可以有效遏制流域生態(tài)的急劇惡化。充分調動國家地球系統(tǒng)科學數(shù)據(jù)中心的自然災害數(shù)據(jù)、大氣質量數(shù)據(jù)、山洪風險專題等數(shù)據(jù),同時可依據(jù)災害主題關聯(lián)專題相關數(shù)據(jù)集,如國家林業(yè)和草原科學數(shù)據(jù)中心擁有各地森林火災數(shù)據(jù)庫、國家對地觀測科學數(shù)據(jù)中心提供夏季中國洪澇災害數(shù)據(jù)專題服務等。同時諸多數(shù)據(jù)中心提供“防災減災”數(shù)據(jù)服務,如國家農(nóng)業(yè)科學數(shù)據(jù)中心的抗旱減災保產(chǎn)實驗數(shù)據(jù)、新品種抗旱試驗數(shù)據(jù)庫等,可為抗旱減災工作提供數(shù)據(jù)支持。國家氣象科學數(shù)據(jù)中心提供一系列氣象專題,如暴雨、干旱、臺風等氣象災害專題數(shù)據(jù),可以了解黃河流域歷年來多發(fā)的災害類型、時間、地點、原因及影響等,以此為依據(jù)有針對性地制定災害防控與應急措施。國家氣象科學數(shù)據(jù)中心擁有的氣象預警專題,基于WebGIS,發(fā)布大風、雷電、寒潮、干早、冰雹等近20種自然災害,同時,預警展示中結合了實況預報數(shù)據(jù),對預警相關氣象要素的動態(tài)進行綜合展示,便于有關部門提前布置災害防控措施,有效降低災害產(chǎn)生的惡劣影響,減少損失。國家對地觀測科學數(shù)據(jù)中心具有全生命周期的遙感數(shù)據(jù)治理和服務技術體系,可充分利用其建設的對地觀測科學數(shù)據(jù)共享資源庫中環(huán)境減災遙感衛(wèi)星資源,提升災害風險預警能力,加強災害風險評估和隱患排查治理,提高災害應急能力。
以預防洪澇災害為例,國家地球系統(tǒng)科學數(shù)據(jù)中心設立了山洪風險專題、中國2020年夏季洪澇救災專題,國家對地觀測科學數(shù)據(jù)中心收集了2000—2020年黃河流域1千米降水數(shù)據(jù)、2021年河南特大暴雨災害數(shù)據(jù),同時提供2022年夏季中國洪澇災害數(shù)據(jù)專題服務,國家氣象科學數(shù)據(jù)中心集齊暴雨災害專題數(shù)據(jù)、中國近百年降水專題數(shù)據(jù)集,可以此分析降水年際變化,確定洪澇多發(fā)地區(qū)與時間,再結合其中心可視化平臺的降水實況資料和氣象衛(wèi)星遙感數(shù)據(jù),精準開展高風險、高影響地區(qū)的綜合監(jiān)測和災害預警,提升洪澇災害預警的準確性以及時效性。
隨著國家生態(tài)文明建設的發(fā)展,一系列重大生態(tài)保護修復工程陸續(xù)實施??茖W實施生態(tài)修復,有助于提高我國生態(tài)系統(tǒng)的質量與穩(wěn)定性,筑牢國家生態(tài)安全??山Y合國家生態(tài)科學數(shù)據(jù)中心建設的國家生態(tài)系統(tǒng)評估綜合集成平臺、生態(tài)水文數(shù)據(jù)、生態(tài)系統(tǒng)功能數(shù)據(jù)等,國家對地觀測科學數(shù)據(jù)中心的土壤風蝕、水土流失、土地利用等數(shù)據(jù),國家林業(yè)和草原科學數(shù)據(jù)中心的植被數(shù)據(jù)和退耕還林工程數(shù)據(jù),排查重要水系阻隔、水土流失、濕地退化等問題,梳理當前黃河流域生態(tài)治理的現(xiàn)狀。還可利用國家生態(tài)科學數(shù)據(jù)中心的全國野外站監(jiān)測數(shù)字大屏展示系統(tǒng)來實時瀏覽各生態(tài)站監(jiān)測活動、獲取監(jiān)測指標數(shù)據(jù),及時發(fā)現(xiàn)污染水質、破壞岸線、侵占河道等行為。又能借鑒國家地球系統(tǒng)科學數(shù)據(jù)中心的環(huán)境退化及保護數(shù)據(jù)、環(huán)境污染及治理數(shù)據(jù)、黃河口濕地微地形修復實驗數(shù)據(jù)等對生態(tài)修復有啟示作用的數(shù)據(jù)集可分流域、分省市有針對性地制定生態(tài)保護和修復方案,并及時跟蹤后續(xù)修復進程及效果。
生態(tài)環(huán)境保護的數(shù)字化轉型需要綜合管理數(shù)據(jù)資源,推動跨平臺、跨學科、跨領域協(xié)同合作,全面提升生態(tài)資源服務數(shù)字化、智能化水平,充分釋放數(shù)據(jù)要素價值。國家地球系統(tǒng)科學數(shù)據(jù)中心整合了衛(wèi)星影像、雷達影像、地物波譜等遙感數(shù)據(jù);國家氣象科學數(shù)據(jù)中心的氣象衛(wèi)星遙感數(shù)據(jù)和氣象預警專題可提供氣象實況資料;國家對地觀測科學數(shù)據(jù)中心具有全生命周期的遙感數(shù)據(jù)治理和服務技術體系、中國遙感衛(wèi)星數(shù)據(jù)統(tǒng)一檢索平臺;國家生態(tài)科學數(shù)據(jù)中心擁有全國野外站監(jiān)測數(shù)字大屏展示系統(tǒng),同時建成先進的生態(tài)系統(tǒng)科學數(shù)據(jù)公共服務與分析平臺,如實時同化預測系統(tǒng)、國家生態(tài)系統(tǒng)評估綜合集成平臺、中國陸地生態(tài)系統(tǒng)碳源匯模擬平臺;國家農(nóng)業(yè)科學數(shù)據(jù)中心建設有國家農(nóng)業(yè)科學觀測數(shù)據(jù)可視化平臺;國家林業(yè)和草原科學數(shù)據(jù)中心提供空間數(shù)據(jù)展示服務、生態(tài)站定位觀測數(shù)據(jù)服務系統(tǒng)。國家科學數(shù)據(jù)中心關聯(lián)模型整合多源數(shù)據(jù)資源,支持構建一體化生態(tài)環(huán)境智能監(jiān)測平臺,打造生態(tài)環(huán)境綜合管理數(shù)字平臺,致力于相關數(shù)據(jù)資源的全局規(guī)劃、智能檢索、高效共享和協(xié)同服務建設,可實現(xiàn)數(shù)據(jù)監(jiān)測一體化、數(shù)據(jù)服務一站式,提供生態(tài)系統(tǒng)科學數(shù)據(jù)共享、分析應用等服務,充分發(fā)揮我國長期生態(tài)監(jiān)測數(shù)據(jù)價值。
科學數(shù)據(jù)作為國家戰(zhàn)略科技資源,在支撐創(chuàng)新驅動發(fā)展戰(zhàn)略實施,推動經(jīng)濟體系優(yōu)化升級和促進產(chǎn)業(yè)融合,抗擊疫情保障民生和推進生態(tài)文明建設等方面的作用更加凸顯[29]。國家科學數(shù)據(jù)中心作為我國科學數(shù)據(jù)管理與應用、開放與共享的重要載體,為相關學科領域發(fā)展、團體研究、項目實施等提供科學數(shù)據(jù)資源與服務。
黃河流域是我國重要的生態(tài)屏障和重要的經(jīng)濟地帶,在我國經(jīng)濟社會發(fā)展和生態(tài)安全方面占據(jù)十分重要的地位。本文以黃河流域專題數(shù)據(jù)為基礎,以元數(shù)據(jù)為切入點,探尋各國家科學數(shù)據(jù)中心間的關聯(lián)關系,通過構建國家科學數(shù)據(jù)中心關聯(lián)模型,為黃河流域生態(tài)保護與高質量發(fā)展提供數(shù)據(jù)支持。最后將理論研究應用到實踐探索中,運用關聯(lián)模型從完善自然資源監(jiān)測數(shù)據(jù)、提升流域內災害防控與應急能力、助力生態(tài)修復工程實施、建立一體化生態(tài)環(huán)境智能監(jiān)測系統(tǒng)4個方面解決黃河流域的生態(tài)保護與治理修復問題,有助于保障黃河長治久安、促進全流域高質量發(fā)展。同時,為科研人員高效利用國家科學數(shù)據(jù)共享平臺提供理論范式和實踐參考,著力解決當前各國家科學數(shù)據(jù)中心間數(shù)據(jù)資源存在的通用性低、互操作差等問題。
本文在國家科學數(shù)據(jù)中心關聯(lián)模型構建研究過程中,以黃河流域專題數(shù)據(jù)為基礎,只選取了6個與其密切相關的國家科學數(shù)據(jù)中心,通過專題已有的8個元數(shù)據(jù)進行關聯(lián)模型構建,或許存在一定不足,但也有進一步提升的可能性。國家科學數(shù)據(jù)中心關聯(lián)模型研究未來可以從以下幾個方面進一步深入。第一,國家科技基礎條件平臺建設有20個國家科學數(shù)據(jù)中心,數(shù)據(jù)資源豐富,涉及學科領域廣泛,可以繼續(xù)關聯(lián)更多數(shù)據(jù)中心,如國家冰川凍土沙漠科學數(shù)據(jù)中心、國家微生物科學數(shù)據(jù)中心等。除此以外,一些科研機構、高校建立的數(shù)據(jù)中心或數(shù)據(jù)庫也可納入統(tǒng)一考慮的范疇,進一步拓展數(shù)據(jù)資源。第二,還要擴展更多的關聯(lián)元數(shù)據(jù),豐富元數(shù)據(jù)種類,編制核心元數(shù)據(jù)目錄,區(qū)分通用核心元數(shù)據(jù)和專題擴展元數(shù)據(jù),規(guī)范數(shù)據(jù)中心元數(shù)據(jù)標準,提高關聯(lián)模型的適用性和擴展性,更好地解決科學數(shù)據(jù)中心間數(shù)據(jù)資源存在的通用性低、互操作差的問題。第三,國家科學數(shù)據(jù)中心關聯(lián)模型,需要創(chuàng)新數(shù)據(jù)管理機制、深化數(shù)據(jù)高效共享、促進數(shù)據(jù)有序開發(fā)利用,不斷完善開放共享的數(shù)據(jù)資源體系,真正實現(xiàn)跨機構、跨學科、跨領域的互通共享,充分挖掘科學數(shù)據(jù)的潛在價值,推動科技創(chuàng)新發(fā)展。