楊遠征, 徐超, 唐世林,2, 李莎
1. 中國科學院南海海洋研究所, 廣東 廣州 510301;
2. 南方海洋科學與工程廣東省實驗室(廣州), 廣東 廣州 511458
科學數(shù)據(jù)是指人類社會科技活動所產(chǎn)生的基本科學技術(shù)數(shù)據(jù)、資料及其衍生數(shù)據(jù)(孫九林 等,2009), 是繼物質(zhì)和能量之后的第三類資源, 也是支撐和保障科技創(chuàng)新、經(jīng)濟發(fā)展和相關(guān)決策的國家戰(zhàn)略資源(王卷樂 等, 2019)。近年來, 越來越多的國家政府意識到科學數(shù)據(jù)的重要性, 相繼在國家層面上制定了科學數(shù)據(jù)管理和共享政策。美國國立衛(wèi)生研究院為了促進科學數(shù)據(jù)開放共享, 在2003 年發(fā)布了科學數(shù)據(jù)共享政策(National Institute of Health,2020)。2011 年, 美國國家科學基金會也發(fā)布了科學數(shù)據(jù)共享政策, 以促使科研人員共享在該基金資助下的科研過程中產(chǎn)生的科學數(shù)據(jù)(National Science Foundation, 2020)。2013 年, 白宮科技政策辦公室通過出臺《增強對聯(lián)邦資助科學研究成果的獲取》指令來促進科研數(shù)據(jù)和文獻成果的開放獲取(U.S.Agency for International Development, 2016)。澳大利亞為了規(guī)范管理科學數(shù)據(jù), 早在2007 年就通過國家層面的政策文件《澳大利亞責任研究行為守則》, 明確規(guī)定了機構(gòu)和科研人員在科學數(shù)據(jù)管理的相關(guān)責任和義務(Australian Government, 2007)。英國研究理事會在2011 年發(fā)布了《數(shù)據(jù)政策通用原則》, 英國皇家學會在2012 年也頒發(fā)了《科學作為開放事業(yè)》有關(guān)科學數(shù)據(jù)管理的政策文件(The Royal Society Science Policy Centre, 2012; UK Research and Innovation, 2020), 有力地促進了科學數(shù)據(jù)的開放共享。盡管我國一直重視科學數(shù)據(jù)的管理和共享,但相較于發(fā)達國家, 在科學數(shù)據(jù)管理政策的制定方面相對滯后。2015 年9 月, 國務院發(fā)布了《促進大數(shù)據(jù)發(fā)展行動綱要》, 明確提出了“積極推動由國家公共財政支持的公益性科研活動獲取和產(chǎn)生的科學數(shù)據(jù)逐步開放共享”(中華人民共和國國務院, 2015)。我國首次在國家層面出臺的科學數(shù)據(jù)管理政策是在2018 年3 月, 國務院辦公廳頒發(fā)了《科學數(shù)據(jù)管理辦法》, 為我國科學數(shù)據(jù)的采集、整合、開放和共享等各個環(huán)節(jié)的工作提供了國家層面的制度保障(中華人民共和國國務院辦公廳, 2018)。
科學研究已經(jīng)進入了數(shù)據(jù)密集型的新科研模式(張柏春, 2012), 意味著科學數(shù)據(jù)在科學研究中具有重要的地位, 是科學研究持續(xù)發(fā)展的基礎。海洋科學是典型的數(shù)據(jù)密集型學科(陳戈 等, 2019), 一方面, 海洋觀測監(jiān)測等海洋相關(guān)科研活動能夠產(chǎn)生大量的科學數(shù)據(jù), 其獲取一般需要通過儀器設備在特定的、復雜的海洋現(xiàn)場觀測環(huán)境下進行, 成本巨大且現(xiàn)場觀測數(shù)據(jù)具有唯一性; 另一方面,海洋科學問題的解決, 以及科研成果的驗證都離不開相關(guān)科學數(shù)據(jù)的佐證。因此, 海洋科學數(shù)據(jù)具有重要的存儲、開放共享和利用價值。在海洋科學數(shù)據(jù)建設和發(fā)展方面, 發(fā)達國家較早在國家層面加大對科學數(shù)據(jù)中心的建設。美國國家航空航天局在1989 年首次提出“在國家層面上構(gòu)建數(shù)據(jù)共享框架和實現(xiàn)數(shù)據(jù)共享”計劃后, 從1990 年代表美國從國家層面開始建設由9 個數(shù)據(jù)中心構(gòu)成的國家級科學數(shù)據(jù)中心群——分布式最活躍數(shù)據(jù)檔案中心群, 涵蓋海洋、生物、大氣等領域(劉闖 等, 2002)。英國也較早開展了海洋數(shù)據(jù)管理和共享的工作, 在英國自然環(huán)境研究首輪理事會后就積極加入了經(jīng)濟合作與發(fā)展組織(Organization for Economic Co-operation and Development, OECD)的國家科學數(shù)據(jù)共享計劃, 并建立了英國海洋數(shù)據(jù)中心等5 個國家級環(huán)境科學領域的科學數(shù)據(jù)中心, 開放共享的數(shù)據(jù)內(nèi)容涵蓋陸地、海洋、氣候、極地等自然環(huán)境領域(姜穎, 2018)。日本通過國家海洋數(shù)據(jù)中心的建設, 持續(xù)整合并共享了覆蓋全球的海溫、海流、鹽度、水深、潮流等要素的海洋水文數(shù)據(jù)。韓國海洋數(shù)據(jù)中心不斷整合和開放了1921 年以來的沿海海洋觀測數(shù)據(jù), 并開放了海洋環(huán)境監(jiān)測數(shù)據(jù)、海洋漁業(yè)數(shù)據(jù)、海洋生物數(shù)據(jù)、海洋災害數(shù)據(jù)等(王漢雨, 2016)。
我國方面, 中國科學院早在1987 年就開始建設中國科學院科學數(shù)據(jù)庫及其信息系統(tǒng), 并在中國科學院信息化專項持續(xù)支持建設下, 建成了國內(nèi)較大規(guī)模的綜合科技數(shù)據(jù)基礎資源共享與服務平臺(黎建輝 等, 2017)。國家自然科學基金委在2003 年啟動建設了“國家自然科學基金青島海洋科學資料共享服務中心”, 設計了青島海洋資料共享服務系統(tǒng),從而實現(xiàn)了國家自然科學基金海洋科學數(shù)據(jù)資料、研究成果、報告、標準、文獻、產(chǎn)品和其他相關(guān)信息的網(wǎng)絡化管理和共享(李朗, 2008; 劉海行 等,2008)。國家海洋局(現(xiàn)為自然資源部)在2006 年啟動了我國首個大型海洋信息系統(tǒng)工程項目“數(shù)字海洋”,通過構(gòu)建“數(shù)字海洋”數(shù)據(jù)共享服務平臺整合了分布在11 個沿海省(自治區(qū)、直轄市)海洋行政主管部門的海洋信息資源, 并實現(xiàn)了海洋信息資源分布式管理與共享(蔣冰 等, 2018)。然而, 盡管我國構(gòu)建了不少海洋科學數(shù)據(jù)共享平臺, 并在一定程度上促進了海洋科學數(shù)據(jù)的開放共享, 但由于這些平臺是各個部門或地區(qū)根據(jù)各自的需求進行建設的, 難免會存在各自為政、部門封閉、數(shù)據(jù)壟斷和重復建設等問題, 嚴重阻礙了我國海洋科學數(shù)據(jù)開放共享的進一步發(fā)展。鑒于此, 科技部、財政部借鑒國際經(jīng)驗, 在2019 年將原有科學數(shù)據(jù)類國家科技資源共享服務平臺優(yōu)化調(diào)整為“國家地球系統(tǒng)科學數(shù)據(jù)中心”等20 個國家科學數(shù)據(jù)中心(中華人民共和國科學技術(shù)部 等,2019), 旨在加強在國家層面上提升科學數(shù)據(jù)資源的統(tǒng)一匯聚、整合和開放共享能力, 提升科學數(shù)據(jù)分析挖掘能力和水平, 并在此基礎上加強開展數(shù)據(jù)增值服務的能力建設, 以支撐和保障國家科技創(chuàng)新、經(jīng)濟社會發(fā)展和相關(guān)決策活動。
南海是我國最大的跨越熱帶和亞熱帶的邊緣海,毗鄰粵港澳大灣區(qū)等中國經(jīng)濟活力最強的區(qū)域, 是21 世紀海上絲綢之路的重要通道, 擁有豐富的油氣能源和生物資源等。南海在國際政治、經(jīng)濟、科技、軍事領域中具有重要的戰(zhàn)略地位, 特別是在當前國家實施海洋強國和21 世紀海上絲綢之路等國家海洋戰(zhàn)略的背景下, 南海海洋資源、能源、氣候、環(huán)境和生態(tài)等成為了目前國內(nèi)外關(guān)注的焦點。作為國家地球系統(tǒng)科學數(shù)據(jù)中心的分中心之一, 南海及鄰近海區(qū)科學數(shù)據(jù)中心緊跟國家海洋戰(zhàn)略的步伐, 以國家重大戰(zhàn)略需求為導向, 在中國科學院科學數(shù)據(jù)庫前期工作的基礎上, 從2011 年開始建設, 旨在匯聚、組織、描述、搶救和存儲海洋科學數(shù)據(jù)資源, 并持續(xù)整合和共享了1985 年以來的南海水文、氣象、生態(tài)、地質(zhì)等多學科、多要素、多尺度的海洋科學數(shù)據(jù)資源, 實現(xiàn)了我國南海海洋科學考察數(shù)據(jù)的在線共享從無到有的創(chuàng)新發(fā)展。南海及鄰近海區(qū)科學數(shù)據(jù)中心的建設不僅能為海洋科技創(chuàng)新、國家有效管理與海洋環(huán)境保護、合理開發(fā)利用南海海洋資源和海洋經(jīng)濟可持續(xù)發(fā)展提供數(shù)據(jù)支撐, 而且可助力國家實施海洋強國和“一帶一路”倡議等國家海洋戰(zhàn)略, 也可為國際相關(guān)活動中掌握南海海洋環(huán)境事務方面的主導權(quán), 以及捍衛(wèi)我國南海海洋權(quán)益提供數(shù)據(jù)支持。本文重點闡述了南海及鄰近海區(qū)科學數(shù)據(jù)中心的海洋科學數(shù)據(jù)資源建設情況, 主要包括標準規(guī)范、數(shù)據(jù)資源建設、特色數(shù)據(jù)庫, 共享成效等。
標準規(guī)范是保障數(shù)據(jù)中心科學規(guī)范地整合、集成和開放共享的基礎。由于南海及鄰近海區(qū)科學數(shù)據(jù)中心是國家地球系統(tǒng)科學數(shù)據(jù)中心的分中心, 因此在數(shù)據(jù)匯聚、組織、描述、共享和服務等建設過程中, 一方面依據(jù)國家地球系統(tǒng)科學數(shù)據(jù)總中心制定的元數(shù)據(jù)標準等19 項數(shù)據(jù)管理類、數(shù)據(jù)匯交方案等13 項數(shù)據(jù)匯交類, 以及平臺共享服務規(guī)范等2 項共享服務類的標準規(guī)范(楊雅萍 等, 2019); 另一方面根據(jù)中國科學院南海海洋研究所海洋科學數(shù)據(jù)管理的實際需求, 制定了《中國科學院南海海洋研究所數(shù)據(jù)管理辦法》。這些標準規(guī)范為南海及鄰近海區(qū)科學數(shù)據(jù)中心資源建設提供了科學、規(guī)范和可持續(xù)發(fā)展的保障。此外, 南海及鄰近海區(qū)科學數(shù)據(jù)中心數(shù)據(jù)共享主要通過軟件平臺實施, 而軟件平臺開發(fā)的主要依據(jù)是數(shù)據(jù)標準規(guī)范的有關(guān)規(guī)定, 并在軟件平臺中實現(xiàn)了數(shù)據(jù)共享的相關(guān)功能。因此, 南海及鄰近海區(qū)科學數(shù)據(jù)中心的數(shù)據(jù)標準體系與軟件編碼體系之間有著緊密的聯(lián)系。
針對海洋科學數(shù)據(jù)具有數(shù)據(jù)體量大、數(shù)據(jù)范圍廣、數(shù)據(jù)內(nèi)容豐富的特點(白亭穎 等, 2020), 為了能給不同用戶提供高質(zhì)量的數(shù)據(jù)服務和決策支持, 中心采用“學科分類-主題要素-數(shù)據(jù)集”三級目錄的數(shù)據(jù)資源建設體系, 建成了在學科范圍上涵蓋物理海洋、海洋氣象、海洋生物、海洋化學、海洋生態(tài)、海洋地質(zhì), 在空間尺度上涵蓋全球、國家、區(qū)域、站點, 在時間尺度上實現(xiàn)年度、月度、日度、實時和未來的綜合性海洋科學數(shù)據(jù)共享服務平臺, 在國內(nèi)形成了一定的影響力。已建設的主要數(shù)據(jù)資源如表1 所示。
表1 南海及鄰近海區(qū)科學數(shù)據(jù)中心主要數(shù)據(jù)資源整合情況Tab. 1 Major data resources of South China Sea and Its Adjacent Seas Data Center
另外, 為了能規(guī)范化整合集成數(shù)據(jù)資源, 使用戶能全面快速地了解數(shù)據(jù)資源的元數(shù)據(jù)、數(shù)據(jù)質(zhì)量和數(shù)據(jù)實體等信息, 中心按照數(shù)據(jù)實體、數(shù)據(jù)說明文檔、數(shù)據(jù)縮略圖、數(shù)據(jù)樣例、數(shù)據(jù)分類和元數(shù)據(jù)表的數(shù)據(jù)描述、組織和集成策略, 即“六位一體”的數(shù)據(jù)資源整合集成策略, 滿足用戶快速檢索、認識、下載和使用數(shù)據(jù)的需求。
南海及鄰近海區(qū)科學數(shù)據(jù)中心資源建設主要包括海洋科學數(shù)據(jù)集的元數(shù)據(jù)建設, 以及海洋科學數(shù)據(jù)集的數(shù)據(jù)實體建設。
數(shù)據(jù)實體建設主要包括數(shù)據(jù)的采集、加工、質(zhì)量控制和入庫, 如圖1 所示。南海及鄰近海區(qū)科學數(shù)據(jù)中心的數(shù)據(jù)資源的采集主要是通過地(西沙觀測臺站、南沙觀測臺站等)、海(“實驗1”號、“實驗2”號、“實驗3”號調(diào)查船和海上浮標以及潛標等)、天(Landsat、MODIS 等衛(wèi)星遙感)、空(GPS 探空等)等全方位的海洋觀測體系進行采樣, 采集的主要數(shù)據(jù)資源內(nèi)容包括如下幾個方面。
圖1 數(shù)據(jù)實體建設體系Fig. 1 Data construction system
1) 海洋物理資料內(nèi)容:深度、溫度、鹽度、密度、海流、波浪等水文資料; 氣壓、海面空氣溫度、相對濕度、風、降水量等氣象資料;
2) 海洋化學資料內(nèi)容:海洋化學要素、同位素化學要素、沉積物化學要素等資料;
3) 海洋生態(tài)資料內(nèi)容:浮游植物、浮游動物、底棲生物、葉綠素a、初級生產(chǎn)力等資料;
4) 海洋底質(zhì)資料內(nèi)容:地形、地層、沉積物、黏土礦物、珊瑚礁等資料。
在數(shù)據(jù)的加工方面, 海洋科學數(shù)據(jù)具有種類豐富、格式各異、時空變化大等特點, 在直接應用上有一定的困難。因此, 依靠信息技術(shù)對海洋科學數(shù)據(jù)進行加工處理, 就成為海洋科學領域必不可少的關(guān)鍵環(huán)節(jié), 也一直是該領域致力解決的難題。南海及鄰近海區(qū)科學數(shù)據(jù)中心針對不同海洋學科數(shù)據(jù)資源采取不同的加工處理技術(shù), 主要包括多源數(shù)據(jù)融合、遙感反演、信息提取和數(shù)據(jù)同化等加工技術(shù)。其中, 南海SeaWiFS 月平均葉綠素二級產(chǎn)品數(shù)據(jù)集(1999—2001)利用第二代海洋水色傳感器SeaWiFS探測到的南海海域海水輻亮度, 采用幾何糾正和大氣校正的處理技術(shù), 并通過SeaDAS 軟件提取葉綠素濃度遙感信息(陳楚群 等, 2001); 南海海洋再分析產(chǎn)品數(shù)據(jù)集利用海表高度、海表溫度、海表鹽度、海表流及溫鹽剖面資料等不同類型的海洋觀測數(shù)據(jù),采用數(shù)據(jù)同化技術(shù), 產(chǎn)生了一套1999—2011 年高分辨率格點化的南海及其鄰近海區(qū)海表高度和三維溫鹽流數(shù)據(jù)集(Zeng et al, 2014); 南海海洋預報數(shù)據(jù)集是利用南海海溫、鹽度和海流等海洋環(huán)境觀測要素,采用海洋數(shù)值模擬技術(shù), 預測了起報時刻起120h 內(nèi)的南海海洋溫鹽流預報數(shù)據(jù)。
在數(shù)據(jù)質(zhì)量控制方面, 數(shù)據(jù)質(zhì)量實質(zhì)上是數(shù)據(jù)對應用的適用性(Shankaranarayanan et al, 2000)。海洋數(shù)據(jù)質(zhì)量控制主要是基于海洋數(shù)據(jù)的多種來源、多種類型、多維度、不同時空尺度等特性, 對海洋數(shù)據(jù)進行非法碼檢驗、合理性檢驗、范圍檢驗和連續(xù)性檢驗等常規(guī)檢驗, 以及海洋數(shù)據(jù)中的重要參數(shù)的反演、校正和改正等質(zhì)量控制, 目的是在實際應用時保持數(shù)據(jù)的時效性、精確性、完整性和可信性,最終實現(xiàn)數(shù)據(jù)的可用性。比如, 在處理2009—2012年南海海洋斷面科學考察走航ADCP 海流觀測數(shù)據(jù)集時, 除了范圍檢驗、非法碼檢驗和連續(xù)性檢驗等常規(guī)質(zhì)控外, 還對該數(shù)據(jù)集的兩個參數(shù)(速率和方向)的誤差進行了修正(楊遠征 等, 2019), 確保數(shù)據(jù)的精確性和可信性。
在數(shù)據(jù)入庫方面, 將已統(tǒng)一規(guī)范后的元數(shù)據(jù)、數(shù)據(jù)文檔、數(shù)據(jù)樣例和數(shù)據(jù)實體導入到數(shù)據(jù)庫中進行存儲、管理和發(fā)布, 并通過以下安全認證設置相應的數(shù)據(jù)資源下載權(quán)限:1)郵箱認證:用戶完善郵箱等資料后, 才能申請下載相應權(quán)限的數(shù)據(jù)資源;2)手機認證:需用戶綁定手機, 才能提升到相應的數(shù)據(jù)資源權(quán)限; 3)實名認證:用戶進行實名認證后,將擁有更多數(shù)據(jù)資源申請權(quán)限; 4)課題認證:用戶通過課題認證, 將有資格獲得與研究課題相關(guān)的精品數(shù)據(jù)。
元數(shù)據(jù)是描述數(shù)據(jù)特征和屬性方面的數(shù)據(jù)(楊文暉 等, 2015), 元數(shù)據(jù)建設主要是對數(shù)據(jù)資源的特征和屬性進行清晰、詳細和全面的描述, 幫助用戶更好地發(fā)現(xiàn)、獲取、理解和利用數(shù)據(jù)集。南海及鄰近海區(qū)科學數(shù)據(jù)中心元數(shù)據(jù)建設的依據(jù)是國家地球系統(tǒng)科學數(shù)據(jù)中心制定的元數(shù)據(jù)標準, 建設內(nèi)容包括數(shù)據(jù)核心描述信息、數(shù)據(jù)貢獻者和數(shù)據(jù)負責單位及聯(lián)系人。其中數(shù)據(jù)核心描述信息是為用戶提供數(shù)據(jù)的最主要信息(數(shù)據(jù)標題、數(shù)據(jù)時間、空間位置、數(shù)據(jù)類型和數(shù)據(jù)詳細描述等), 從而用戶能夠方便快捷地發(fā)現(xiàn)、檢索和理解數(shù)據(jù)。海洋科學數(shù)據(jù)元數(shù)據(jù)的數(shù)據(jù)核心描述信息如表2 所示。
表2 南海及鄰近海區(qū)科學數(shù)據(jù)中心元數(shù)據(jù)的數(shù)據(jù)核心描述信息Tab. 2 The core information of metadata at South China Sea and Its Adjacent Seas Data Center
根據(jù)實際需要和采集到的數(shù)據(jù)類型, 南海及鄰近海區(qū)科學數(shù)據(jù)中心還建設了以下4 個特色數(shù)據(jù)庫,為相應領域的研究提供個性化的數(shù)據(jù)支撐。
1) 南沙及鄰近海區(qū)綜合考察數(shù)據(jù)庫。南沙及鄰近海區(qū)綜合考察是20 世紀80 年代中國科學院南海海洋研究所組織實施的大規(guī)模的南沙群島及鄰近海域的科學考察(趙煥庭 等, 2017)。該庫收錄了1984年至2007 年間, 南沙群島綜合科學考察航次在南沙群島及其鄰近海區(qū)的現(xiàn)場觀測數(shù)據(jù), 包括海底地形、地貌、沉積物及海洋水文氣象、海水光學特性、海洋化學、海洋生物等方面的寶貴資料。
2) 南海北部海洋觀測開放航次數(shù)據(jù)庫。2004年起, 南海北部海洋觀測開放航次開始由中國科學院南海海洋研究所“實驗3”號科學考察船實施(曾麗麗 等, 2015)。該庫收集整理了自2004 年以來南海北部海洋觀測開放航次在南海北部海區(qū)及西部局部海區(qū)的現(xiàn)場觀測數(shù)據(jù), 包括物理海洋學、海洋生物學、海洋地質(zhì)學和海洋化學數(shù)據(jù)等多個海洋學科數(shù)據(jù)。
3) 南海海洋斷面科學考察數(shù)據(jù)庫。中國科學院南海海洋研究所“實驗3”號科學考察船2009—2012年在南海18°N、10°N、6°N 斷面和113°E 子午向斷面實施的南海海洋斷面科學考察航次(徐超 等,2016)。該庫收集整合了2009 年春季航次, 2010 年秋季航次, 2011 年冬季航次, 2012 年夏季航次共約75個站位的海洋觀測數(shù)據(jù), 包括經(jīng)度、緯度、流速、溫度、密度、鹽度、營養(yǎng)鹽、浮游植物等多個要素數(shù)據(jù)。
4) 印度洋海域綜合考察航次數(shù)據(jù)庫。印度洋海域綜合考察航次是自2010 年起, 在中國科學院和國務院各部委的大力支持下, 中國科學院南海海洋研究所“實驗1”號科學考察船開始實施的東印度洋海洋學綜合科學考察, 調(diào)查海域是在 80°E—105°E,10°S—10°N 范圍內(nèi)(梁湛林 等, 2018), 該庫整合了該航次自2010 年以來獲取的溫度、鹽度、密度等海洋環(huán)境要素的數(shù)據(jù), 以及海底表層樣品、海水生化樣品等資料。
數(shù)據(jù)共享是指通過政策規(guī)定和共享技術(shù), 讓更多的用戶能夠使用具有可訪問性的數(shù)據(jù)(Borgman等, 2013)。南海及鄰近海區(qū)科學數(shù)據(jù)中心在數(shù)據(jù)共享方面遵照《科學數(shù)據(jù)管理辦法》等有關(guān)國家科學數(shù)據(jù)政策規(guī)定, 并通過國家地球系統(tǒng)科學數(shù)據(jù)共享關(guān)鍵技術(shù)(楊雅萍 等, 2019)等共享技術(shù), 初步改善了海洋科學數(shù)據(jù)分散、封閉、滯留和低效狀況, 有效促進了海洋科學數(shù)據(jù)的開放共享。在用戶服務方面, 建立了以用戶需求為導向的服務理念, 不斷探索用戶的需要, 不斷提升用戶的服務水準, 留住了一批數(shù)據(jù)用戶群, 真正讓更多不同需求的用戶能夠訪問利用到數(shù)據(jù)。具體而言, 南海及鄰近海區(qū)科學數(shù)據(jù)中心共享服務主要聚焦在:一方面服務國家重大戰(zhàn)略需求, 為21 世紀海上絲綢之路、粵港澳大灣區(qū)生態(tài)可持續(xù)發(fā)展等國家戰(zhàn)略提供海洋科學數(shù)據(jù)基礎支撐; 另一方面支撐海洋科技熱點研究, 為國家和地方重大項目/工程項目、海洋科技創(chuàng)新提供數(shù)據(jù)支撐服務和技術(shù)服務, 其中已為國家科技基礎性項目“南海海洋斷面科學考察”提供了數(shù)據(jù)管理和共享服務(徐超 等, 2016); 為“973”項目“南海海氣相互作用與海洋環(huán)流和渦旋演變規(guī)律”提供數(shù)據(jù)整合與匯交服務; 為南海風暴潮研究(Ye et al, 2017; Li et al,2019)、西沙群島島嶼尾跡研究(Zhao et al, 2019)和南海北部陸坡研究(Guo et al, 2020)等提供了基礎數(shù)據(jù)支撐。
經(jīng)過多年的建設和發(fā)展, 南海及鄰近海區(qū)科學數(shù)據(jù)中心緊跟時代的步伐, 圍繞國家重大戰(zhàn)略需求,合理布局, 持續(xù)開展了海洋科學數(shù)據(jù)資源的采集、整理、加工、存儲和共享, 承擔科研項目所產(chǎn)生的科學數(shù)據(jù)資源的匯交和整編任務, 構(gòu)建了一個具有數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)分析及數(shù)據(jù)可視化的海洋科學數(shù)據(jù)全生命周期管理與共享服務平臺, 為國家科技創(chuàng)新提供了支撐, 并提升了我國海洋科學數(shù)據(jù)資源的開放共享水平和應用服務水平。
展望未來, 隨著信息技術(shù)和海洋科學的不斷發(fā)展, 海洋科技創(chuàng)新出現(xiàn)了新趨勢和新需求, 無人船、自主水下機器人等智能化的海洋數(shù)據(jù)獲取手段越來越普及, 海洋數(shù)據(jù)資源的數(shù)量越來越多, 類型也越來越復雜, 用戶的個性化需求也越來越多樣化, 這勢必對數(shù)據(jù)中心在海洋數(shù)據(jù)資源的遴選、采集、匯聚、組織、描述、關(guān)聯(lián)和存儲, 以及相應的揭示、發(fā)現(xiàn)、精準推送等方面提出了新的挑戰(zhàn)。因此, 海洋科學數(shù)據(jù)中心應從海洋科學數(shù)據(jù)的內(nèi)涵和數(shù)據(jù)價值產(chǎn)生的機理等方面科學認識海洋數(shù)據(jù), 準確把握海洋科學數(shù)據(jù)發(fā)展規(guī)律, 突破海洋數(shù)據(jù)采集、處理、分析和應用等方面的技術(shù)瓶頸, 促進形成以用戶為導向的高效便捷的數(shù)據(jù)服務體系, 不斷滿足用戶日益增長的個性化、多樣化需求, 建立自主可控的海洋數(shù)據(jù)安全體系, 切實保障國家海洋數(shù)據(jù)安全, 推動云計算、大數(shù)據(jù)、人工智能等新一代信息技術(shù)同海洋科學數(shù)據(jù)全生命周期管理的深度融合, 從而更好地支撐國家在海洋事業(yè)方面的科技創(chuàng)新, 促進經(jīng)濟社會發(fā)展, 并保障國家安全。
關(guān)于南海及鄰近海區(qū)科學數(shù)據(jù)中心未來的資源建設, 本文提出以下幾條建議。
1) 持續(xù)研發(fā)海洋信息提取技術(shù)。海洋數(shù)據(jù)量已經(jīng)邁入了PB 級別(錢程程 等, 2018), 并隨著海洋數(shù)據(jù)獲取手段的不斷豐富, 將繼續(xù)產(chǎn)生大量的、不完全的、有噪聲的、模糊的、隨機的各種海洋數(shù)據(jù), 因此需要不斷加強數(shù)據(jù)挖掘等信息提取技術(shù)的研發(fā),才能提取出隱含的、事先未知的、潛在有價值的海洋信息, 從而發(fā)揮它們潛在的海洋信息價值, 最終促進海洋數(shù)據(jù)資源的高效利用。
2) 注重標準規(guī)范體系建設。標準規(guī)范體系具有引領和指導作用, 在很大程度上決定著科學數(shù)據(jù)中心的發(fā)展水平。因此, 數(shù)據(jù)中心不僅要執(zhí)行好現(xiàn)有的標準規(guī)范, 而且要結(jié)合實際應用情況, 不斷地完善和修正標準規(guī)范體系, 借鑒國內(nèi)外同行先進的標準規(guī)范, 研究建立系統(tǒng)完整的標準規(guī)范體系, 真正發(fā)揮標準規(guī)范的引領和指導作用, 有效地支撐科學數(shù)據(jù)中心的資源建設。
3) 加強海岸帶數(shù)據(jù)資源管理體系建設。海岸帶是海洋系統(tǒng)與陸地系統(tǒng)復合交叉、相互作用的地理單元(伊飛 等, 2011), 因此海岸帶數(shù)據(jù)包括了海洋、陸地和空間數(shù)據(jù)。目前, 南海及鄰近海區(qū)科學數(shù)據(jù)中心僅管理了有關(guān)海洋方面的數(shù)據(jù)資源, 尚未開展建設海岸帶數(shù)據(jù)管理體系。黨的十九大報告已明確提出了“堅持陸海統(tǒng)籌, 加快建設海洋強國”, 而陸海統(tǒng)籌被認為是海岸帶綜合管理中最重要的組成部分(文超祥 等, 2019)。因此, 未來數(shù)據(jù)中心資源建設應加強開展海岸帶數(shù)據(jù)資源管理體系建設, 為海岸帶綜合管理提供基礎數(shù)據(jù)支撐, 進而為國家陸海統(tǒng)籌的戰(zhàn)略提供參考。
4) 加快建設智能的海洋數(shù)據(jù)管理體系。每一次海洋數(shù)據(jù)或海洋信息領域的跨越式發(fā)展幾乎都依靠信息技術(shù)的發(fā)展。當前, 南海及鄰近海區(qū)科學數(shù)據(jù)中心利用數(shù)字化、互聯(lián)網(wǎng)等信息技術(shù), 實現(xiàn)了海洋數(shù)據(jù)的數(shù)字化和網(wǎng)絡化。隨著信息技術(shù)的不斷發(fā)展,特別是大數(shù)據(jù)、人工智能和物聯(lián)網(wǎng)等新一代信息技術(shù)的飛速發(fā)展, 應用逐步融合到海洋領域, 人們認識海洋的平臺和手段將會迎來根本性的變革。因此,科學數(shù)據(jù)中心應加大力度研究新一代信息技術(shù), 致力于海洋數(shù)據(jù)全生命周期管理體系與新一代信息技術(shù)的融合發(fā)展。利用物聯(lián)網(wǎng)、人工智能等新一代信息技術(shù), 加快開展海洋數(shù)據(jù)或海洋信息的全面感知等智能采集、實時傳輸以及機器學習和模糊識別等智能處理, 從而實現(xiàn)海洋數(shù)據(jù)的智能服務。