馬 強 顏京輝 魏 敏* 辛曉歌 張 莉 張 芳 吳統(tǒng)文
1)(國家氣象信息中心, 北京 100081) 2)(清華大學計算機科學與技術系, 北京 100084) 3)(中國氣象局地球系統(tǒng)數(shù)值預報中心, 北京 100081) 4)(中國氣象科學研究院災害天氣國家重點實驗室, 北京 100081)
20世紀90年代,世界氣候研究計劃(World Climate Rearch Programme,WCRP)提出并組織了耦合模式比較計劃(Coupled Model Intercomparison Project,CMIP),該計劃通過設計氣候模式試驗,制定試驗標準,收集、共享來自世界不同國家模式工作組的氣候模式試驗數(shù)據(jù),開展多模式相互比較和評估工作。參與該計劃的試驗數(shù)據(jù)被廣泛應用于氣候變化機理研究與未來氣候變化預估等相關領域,為政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)定期發(fā)布評估報告提供技術支撐,也為氣候模式發(fā)展提供重要平臺[1]。WCRP先后組織了6次國際耦合模式比較計劃,目前正在進行的是CMIP6[2-3]。CMIP6科學試驗設計包括2個核心試驗和23個模式比較子計劃,試驗種類較CMIP5明顯增加。參加比較計劃的氣候模式由早期的海-氣耦合模式發(fā)展到對大氣、陸面、海洋及海冰等多圈層進行模擬的耦合模式,以及包含碳循環(huán)過程的地球系統(tǒng)模式,模式分辨率越來越精細[4]。多種因素綜合導致試驗數(shù)據(jù)量激增,從CMIP1約1 GB,到CMIP2超過500 GB,CMIP3超過35 TB,CMIP5超過3.5 PB,CMIP6產生的數(shù)據(jù)量更加巨大。如何在全球范圍廣泛、高效地共享這些海量試驗數(shù)據(jù),滿足氣候變化及相關領域研究的需求,成為亟需解決的關鍵技術問題。
2011年美國在原有地球系統(tǒng)網(wǎng)格(Earth System Grid,ESG)項目基礎上,由美國能源部(Department of Energy, DOE)、美國航空航天局(National Aeronautics and Space Administration,NASA)、美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)等多家單位共同資助,多個國家共同參與建立了地球系統(tǒng)網(wǎng)格聯(lián)盟(Earth System Grid Federation,ESGF),自CMIP5開始負責模式試驗數(shù)據(jù)的管理與共享[5]。ESGF是由多個分布式節(jié)點組成的全球系統(tǒng),節(jié)點分為數(shù)據(jù)節(jié)點、身份認證節(jié)點、索引節(jié)點和計算節(jié)點4種類型,參加CMIP模式工作組可根據(jù)需要進行部署。數(shù)據(jù)共享平臺的建設成為參與CMIP的重要環(huán)節(jié)。
作為國家級業(yè)務中心,北京氣候中心(BCC)參加了CMIP5和CMIP6兩個階段的比較計劃[6-7]。為了滿足數(shù)據(jù)共享應用需求,BCC建設試驗數(shù)據(jù)共享平臺,部署B(yǎng)CC ESGF數(shù)據(jù)節(jié)點。
BCC選用近年研發(fā)的3個不同版本模式參加CMIP6,包括地球系統(tǒng)模式BCC-ESM1.0、中等分辨率氣候系統(tǒng)模式BCC-CSM2-MR和高分辨率氣候系統(tǒng)模式BCC-CSM2-HR,模式信息見表1。
表1 BCC參加CMIP6試驗的模式版本Table 1 BCC model versions participated in CMIP6
BCC-ESM1.0與BCC-CSM2-MR完成了氣候診斷、評估和描述試驗(Diagnostic,Evaluation and Characterization of Klima experiments,DECK)與歷史氣候模擬試驗(Historical)[2]兩個核心試驗。在此基礎上,BCC-ESM1.0開展了氣溶膠和化學模式比較計劃(Aerosols and Chemistry Model Intercomparison Project,AerChemMIP)[11],BCC-CSM2-HR參與了高分辨率模式比較計劃(High-Resolution Model Intercomparison Project,HighResMIP)[12],BCC-CSM2-MR完成了包括年代際氣候預測計劃(Decadal Climate Prediction Project,DCPP)[13-14]在內的其他8個子計劃。
BCC模式開展核心試驗共需完成超過2500年的積分,計算輸出近2000個模式要素,完成各子計劃需進行近萬年積分,計算輸出超過6000個模式要素。按照CMIP6要求,模式數(shù)據(jù)均采用標準NetCDF格式存儲,水平分辨率與模式保持一致,垂直分辨率按照試驗要求進行插值,時間分辨率根據(jù)試驗要求不同,分為逐小時、3 h、日及月等。以應用最多的BCC-CSM2-MR模式為例,該模式為大氣、陸面、海洋和海冰多圈層耦合模式,僅大氣模式單時次、單要素場格點就包含約235萬個,多圈層格點之和則達到約583萬個。歷史氣候模擬試驗(Historical)分為3個集合樣本,每個樣本積分165年,分別按照3 h,6 h,日及月不同頻率輸出近200個要素,數(shù)據(jù)量約為7.4 TB。據(jù)測算BCC CMIP6試驗的數(shù)據(jù)量共計190 TB。由此可知試驗具有配置復雜、模式分辨率高、要素種類多、數(shù)據(jù)輸出頻次多樣及作業(yè)積分時間長等特點。
由于參加比較計劃的模式來自不同國家模式工作組,模式數(shù)據(jù)特征各不相同,為便于進行統(tǒng)一管理與規(guī)范應用,需對模式原始輸出數(shù)據(jù)進行加工處理,采用通用標準格式存儲。數(shù)據(jù)管理與存儲處理邏輯非常復雜,工作量巨大,數(shù)據(jù)共享工作極具挑戰(zhàn)性。
為滿足BCC試驗數(shù)據(jù)存儲及共享服務需求,從數(shù)據(jù)規(guī)模,服務效率、訪問安全性等多方面考慮,共享平臺采用多層體系架構,采用組件化設計,保障系統(tǒng)靈活的可擴展性和可維護性,采用數(shù)據(jù)庫與文件系統(tǒng)結合,進行高效的數(shù)據(jù)存儲管理和統(tǒng)一的數(shù)據(jù)支撐服務,采用http,Globus等通信協(xié)議及WebService等技術,確保數(shù)據(jù)傳輸和共享服務的準確與高效。平臺系統(tǒng)總體框架由系統(tǒng)層、數(shù)據(jù)層、服務層和用戶層4部分組成(如圖1所示)。
系統(tǒng)層包括硬件和軟件兩部分,硬件主要包括高性能專用服務器和1套具有高速讀寫訪問能力的可擴展分布式存儲設備。存儲系統(tǒng)采用全對稱分布式架構,可橫向平滑擴展文件存儲,包含7個存儲節(jié)點,提供約900 TB可用存儲容量。平臺采用的分布式數(shù)據(jù)存儲系統(tǒng)在可擴展性、并發(fā)性能等方面克服了傳統(tǒng)本地存儲擴容步驟復雜、性能受單一控制器能力限制的缺陷。同時,為服務器配置輕量級備份虛擬機,以提升持續(xù)服務能力。軟件包括支撐數(shù)據(jù)處理和展示的Fortran,Python,NCL等程序語言和工具軟件,支持通過高級程序語言調用函數(shù)庫對數(shù)據(jù)處理,支持在命令行實現(xiàn)對數(shù)據(jù)的集合操作及繪圖等功能[15]。
數(shù)據(jù)層存儲平臺所涉及的所有數(shù)據(jù),包括模式原始計算數(shù)據(jù)、共享的數(shù)據(jù)產品及產品元數(shù)據(jù)等。服務層指運行在服務器的各種服務,包括Web服務、OPeNDAP服務、Globus Gridftp服務、OpenID身份認證服務等。Web服務提供互聯(lián)網(wǎng)訪問服務,OPeNDAP服務通過http通信協(xié)議實現(xiàn)數(shù)據(jù)訪問請求與響應,基于URL鏈接和Web服務器即可實現(xiàn)對數(shù)據(jù)的分發(fā)與共享,Globus Gridftp服務為共享數(shù)據(jù)的下載提供高性能、安全可靠的數(shù)據(jù)傳輸,OpenID服務可為訪問平臺的用戶提供便捷的單點登錄功能。用戶層主要為用戶提供平臺交互訪問客戶端,為用戶提供多種條件組合查詢界面、元數(shù)據(jù)展示、wget和Globus等多種數(shù)據(jù)下載服務與數(shù)據(jù)說明文檔等。
平臺部署在中國氣象局互聯(lián)網(wǎng)隔離區(qū)(demilitarized zone,DMZ),既可實現(xiàn)互聯(lián)網(wǎng)的公開訪問,又可獲得加強的網(wǎng)絡安全防護[16]。平臺通過中國科技網(wǎng)(出口帶寬為1.35 Gbps)對外部用戶提供服務,并實現(xiàn)與其他多個國家或組織的ESGF節(jié)點高速互聯(lián)通信,氣象局內網(wǎng)用戶可通過萬兆以太網(wǎng)訪問。
平臺建設包括數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)存儲發(fā)布及數(shù)據(jù)服務幾個關鍵部分(圖2),數(shù)據(jù)安全工作貫穿全流程。
首先對BCC模式計劃開展的試驗進行分析,預估可能產生的數(shù)據(jù)量及后續(xù)工作任務,確定軟硬件性能及功能需求[17]。硬件建設主要包括服務器及配套存儲設施選型、采購及安裝測試等。在此基礎上,對相應軟件環(huán)境進行部署,主要包括系統(tǒng)軟件、開發(fā)運行環(huán)境、應用軟件的安裝配置。建設過程中嚴格按照安全規(guī)范執(zhí)行,在平臺正式上線前通過系統(tǒng)安全基線檢查、軟件漏洞掃描等安全檢測。
數(shù)據(jù)收集模塊實現(xiàn)自動化傳輸流程,采用加密傳輸策略,將在數(shù)據(jù)生產平臺-高性能計算系統(tǒng)產生的模式試驗數(shù)據(jù)收集到共享平臺。數(shù)據(jù)處理模塊對模式原始輸出數(shù)據(jù)進行檢查、處理并規(guī)范化數(shù)據(jù)格式[18]。數(shù)據(jù)存儲發(fā)布模塊確定試驗數(shù)據(jù)在線存儲規(guī)則,建立目錄結構及訪問權限,完成數(shù)據(jù)發(fā)布。數(shù)據(jù)共享服務門戶提供易用高效的數(shù)據(jù)檢索界面,用戶經過身份認證后,可通過多種方式批量下載檢索結果。
模式試驗在高性能計算系統(tǒng)開展,模式程序并行規(guī)模大,運行時間長,計算過程可能受到內存爭用、通信抖動或文件讀寫干擾等多方面因素影響,增加模式計算結果的不穩(wěn)定性。確保每個試驗數(shù)據(jù)的完整性和可用性是數(shù)據(jù)處理工作的前提,需要在每個試驗完成后,對生成的試驗數(shù)據(jù)文件數(shù)量、文件大小及是否存在計算異常等情況進行嚴格檢查,對存在問題的試驗,需要重新計算。針對各試驗配置特點,結合模式運行情況,設計并實現(xiàn)數(shù)據(jù)檢查流程,提高自動化水平,減少人為干預,提升問題篩查精準度,從信息技術角度保障數(shù)據(jù)質量[19]。
模式模擬效果合理性檢查也是必不可少的重要環(huán)節(jié)。BCC CMIP6模式均為多圈層耦合模式,每個試驗完成后需對大氣、海洋等主要分量模式關鍵要素模擬結果從全球、典型區(qū)域等空間屬性,多年平均、季節(jié)平均等時間屬性的物理意義合理性進行檢查[20]。如大氣分量主要考查地表溫度、降水、風場等要素在全球及東亞等不同區(qū)域氣候態(tài)及隨時間的演變規(guī)律。海洋分量主要考慮海表及中上層海溫基本氣候態(tài),全球、赤道太平洋等關鍵區(qū)域海表溫度不同時間尺度變化等。檢查方法包括空間分布合理性檢查、時間序列合理性檢查、氣候態(tài)檢查、極值統(tǒng)計及誤差分析等。
參加CMIP的模式來自世界不同國家模式工作組,模式原始輸出數(shù)據(jù)在數(shù)據(jù)組織、數(shù)據(jù)格式及元數(shù)據(jù)信息等方面存在較大差異,為減少對不同模式同一試驗數(shù)據(jù)預處理的工作量,CMIP給出較為嚴格的數(shù)據(jù)規(guī)范及明確的數(shù)據(jù)屬性要求。因此,在嚴格的技術框架內結合BCC CMIP6數(shù)據(jù)特征與共享平臺實際情況,實現(xiàn)數(shù)據(jù)規(guī)范化是十分關鍵的技術問題。模式輸出結果采用氣候模式輸出重寫(climate model output rewriter,CMOR)軟件[21]進行格式標準化,確保生成符合氣候和預測元數(shù)據(jù)公約的NetCDF文件。經過CMOR軟件處理,實現(xiàn)將同一試驗相同要素的多個時間記錄存儲在1個或一系列文件中,將模式垂直層輸出的要素插值到標準等壓面,依據(jù)給定的經緯度排列順序對數(shù)據(jù)進行排序,對要素量綱進行轉換等。數(shù)據(jù)屬性主要包含模式工作組提供的模式配置信息、CMIP6各模式及其組織機構信息和模式要素信息等內容,以JSON格式存儲為MIP表文件[22],與模式原始輸出數(shù)據(jù)文件共同作為CMOR軟件的輸入和輸出數(shù)據(jù)的元數(shù)據(jù)。CMOR輸出的數(shù)據(jù)采用CMIP的統(tǒng)一規(guī)則命名。
數(shù)據(jù)處理流程如圖3所示。
CMIP6試驗數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)文件離散但命名規(guī)則統(tǒng)一及元數(shù)據(jù)多維等特征[23]。平臺采用專題實時環(huán)境數(shù)據(jù)分發(fā)系統(tǒng)(thematic real-time environmental distributed data services,THRE-DDS)提供數(shù)據(jù)服務(THREDDS data server,TDS),支持http,Girdftp,OPeNDAP和OGC WMS/WCS等多種數(shù)據(jù)訪問接口。THREDDS是一個面向服務體系結構(service oriented architecture,SOA)的數(shù)據(jù)服務系統(tǒng),實現(xiàn)試驗數(shù)據(jù)組織、元數(shù)據(jù)管理和數(shù)據(jù)發(fā)布的功能。THREDDS提取數(shù)據(jù)文件的元數(shù)據(jù)信息,用于支撐數(shù)據(jù)訪問接口以Web服務形式提供用戶訪問。其中http,Girdftp提供完整文件下載功能,OPeNDAP支持數(shù)據(jù)空間、時間、要素等范圍子集的選取功能,OGC WMS/WCS提供GIS訪問接口。
目錄結構設計對于THREDDS非常重要,CMIP6試驗數(shù)據(jù)存儲目錄采用具有自描述信息的層級管理結構,實現(xiàn)不同試驗不同要素數(shù)據(jù)分級分類存儲。在試驗數(shù)據(jù)發(fā)布過程中,THREDDS遍歷掃描所選數(shù)據(jù)集,自動分析提取要素變量、時空分辨率等多種元數(shù)據(jù)信息,保持試驗數(shù)據(jù)及元數(shù)據(jù)的一致性和準確性[24]。將元數(shù)據(jù)存儲到本地PostgreSQL數(shù)據(jù)庫相應數(shù)據(jù)表中,生成對應的數(shù)據(jù)集元數(shù)據(jù)描述文件catalog.xml,并納入TDS提供服務,用戶即可通過URL方式對多層次的目錄進行訪問,將數(shù)據(jù)下載至本地或者通過客戶端直接讀取訪問所需要的數(shù)據(jù)。同時,元數(shù)據(jù)信息發(fā)布到ESGF索引節(jié)點,實現(xiàn)CMIP6試驗數(shù)據(jù)統(tǒng)一檢索,如圖4所示。
試驗數(shù)據(jù)通過ESGF索引節(jié)點以Web門戶方式提供共享服務,主要包含CMIP6模式及其試驗數(shù)據(jù)的詳細描述、數(shù)據(jù)檢索及獲取等服務。數(shù)據(jù)檢索功能支持試驗類型、模式信息、組織機構、數(shù)據(jù)要素、集合樣本等多種條件組合檢索,根據(jù)需求可從結果中進一步檢索所需時間序列的數(shù)據(jù)子集,為用戶使用提供極大的便利。平臺收到數(shù)據(jù)節(jié)點響應索引節(jié)點的請求,為用戶提供數(shù)據(jù)瀏覽以及基于http,Globus,OPeNDAP等協(xié)議的數(shù)據(jù)獲取服務。平臺依據(jù)數(shù)據(jù)檢索結果為用戶自動生成Bash或Python格式腳本,用戶登錄認證通過后即可實現(xiàn)批量數(shù)據(jù)文件下載。
平臺面向世界各國ESGF用戶,通過互聯(lián)網(wǎng)對外提供數(shù)據(jù)共享服務,保障數(shù)據(jù)安全極其重要。
物理層面上,通過增加物理介質的副本存儲等方式保護存儲在分布式存儲系統(tǒng)上的試驗數(shù)據(jù)的物理安全,采用輕量級備份虛擬機保障服務的連續(xù)性,確保數(shù)據(jù)不丟失、服務不中斷。同時,BCC CMIP6數(shù)據(jù)同步到澳大利亞、美國和英國等其他國家的ESGF數(shù)據(jù)節(jié)點,實現(xiàn)數(shù)據(jù)異地備份,提升共享服務能力,用戶可選擇最優(yōu)站點進行數(shù)據(jù)下載。
系統(tǒng)層面上,系統(tǒng)及應用軟件參照ESGF軟件安全規(guī)范部署,并采用密碼增強、系統(tǒng)加固、訪問控制、日志審計等多種技術方法對平臺進行基礎的系統(tǒng)安全防護。
網(wǎng)絡層面上,平臺部署在互聯(lián)網(wǎng)DMZ,納入中國氣象局國家級的整體網(wǎng)絡安全防護體系,通過防火墻、抗DDOS、入侵檢測、入侵防御、Web應用防護、安全威脅和態(tài)勢感知等一系列安全防護手段保障網(wǎng)絡安全。
對于模式試驗數(shù)據(jù)自身的安全,從數(shù)據(jù)處理、收集、發(fā)布、共享服務等各個環(huán)節(jié)采取安全管控措施,避免數(shù)據(jù)的非授權訪問,保護數(shù)據(jù)不被篡改和偽造。在數(shù)據(jù)處理過程中,利用高性能計算機安全管理體系[25],針對數(shù)據(jù)加工處理過程進行嚴格授權﹐僅允許特定用戶進行相關操作,控制輸入、輸出和中間結果數(shù)據(jù)文件的訪問權限,確保數(shù)據(jù)來源可信。在數(shù)據(jù)收集過程中,采用SFTP加密協(xié)議防止用戶名、口令等敏感信息泄露, 確保數(shù)據(jù)不被非法訪問,并通過校驗機制確保數(shù)據(jù)的完整性。
數(shù)據(jù)發(fā)布前,BCC需向ESGF內部CA(certification authority)證書頒發(fā)機構申請認證審查,獲取并在BCC數(shù)據(jù)節(jié)點安裝其簽署的主機證書,獲得數(shù)據(jù)發(fā)布授權。主機證書符合RFC3280定義的X.509規(guī)范,使用4096位密鑰,用于數(shù)據(jù)節(jié)點管理程序、數(shù)據(jù)發(fā)布程序等客戶端應用的安全認證。發(fā)布過程中對外提供檢索服務的元數(shù)據(jù)信息與實際的模式數(shù)據(jù)文件分別進行存儲管理,并結合系統(tǒng)層和應用層的訪問控制設置訪問權限。發(fā)布的元數(shù)據(jù)存儲在數(shù)據(jù)庫中,并同步發(fā)布到索引節(jié)點,模式數(shù)據(jù)文件存儲在本地安全可靠的分布式存儲系統(tǒng)上[26]。
平臺針對發(fā)布后的數(shù)據(jù)共享服務進行授權管理,僅允許通過認證的用戶進行批量數(shù)據(jù)訪問和下載操作。用戶通過瀏覽器檢索訪問BCC CMIP6數(shù)據(jù)時,需要通過OpenID(open identification)進行身份認證。利用去中心化的OpenID用戶身份認證協(xié)議,用戶只需在ESGF的某一個身份認證節(jié)點注冊獲取OpenID帳號,就可以憑此帳號登錄并獲取數(shù)據(jù),在加強數(shù)據(jù)應用安全的同時兼顧用戶便捷訪問的需求。
BCC CMIP6數(shù)據(jù)共享平臺自2017年開始建設,2018年正式開始發(fā)布BCC CMIP6數(shù)據(jù),截至2021年共計發(fā)布數(shù)據(jù)190 TB,實現(xiàn)BCC CMIP6全部數(shù)據(jù)共享。模式試驗數(shù)據(jù)包括DECK和Historical 2個核心試驗,以及ScenarioMIP,C4MIP 等10個子計劃,共計50多個試驗,輸出模擬結果包括約8000個要素,涵蓋了對全球開展的中等分辨率、高分辨率多圈層模擬及大氣化學模擬數(shù)據(jù),各試驗集合樣本量和模擬結果要素數(shù)量有所差異,如表2所示。
表2 BCC CMIP6數(shù)據(jù)Table 2 BCC CMIP6 data
續(xù)表2
模式試驗大部分利用耦合模式完成,試驗輸出要素分別由大氣、陸面、海洋及海冰多個圈層的分量模式生成,試驗數(shù)據(jù)集內容豐富,要素種類多,時間序列長,包含地球表面及大氣層多種科學數(shù)據(jù),對地球系統(tǒng)科學研究具有重要價值。數(shù)據(jù)均采用國際通用標準NetCDF格式存儲,每個試驗數(shù)據(jù)集設置國際通用DOI(數(shù)字對象唯一標識符),有利于數(shù)據(jù)長期保存和有效管理,同時也體現(xiàn)數(shù)據(jù)權威性,對數(shù)據(jù)提供者和制作者知識產權進行有效保護。為便于推廣使用,對每個試驗數(shù)據(jù)集提供說明文檔,以BCC-CSM2-MR模式完成的歷史氣候模擬試驗數(shù)據(jù)為例,具體信息如表3所示。
表3 BCC-CSM2-MR模式歷史氣候模擬試驗數(shù)據(jù)Table 3 Historical experiment data of BCC-CSM2-MR
BCC CMIP6數(shù)據(jù)共享平臺投入運行以來,兩次存儲容量擴充均未中斷服務,同步提升整體吞吐和并發(fā)能力,有力支撐平臺的存儲發(fā)布和服務,已為來自亞洲、歐洲及美洲等多個國家和地區(qū)的用戶提供數(shù)據(jù)服務,取得顯著成效。以2022年上半年為例,中國、韓國、新加坡等亞洲國家數(shù)據(jù)下載量達到32.37 TB,位居各大洲之首,美國、加拿大等北美洲國家數(shù)據(jù)下載量約為9.70 TB,位居第二,英國、挪威、西班牙等歐洲國家數(shù)據(jù)下載量約為7.63 TB,BCC CMIP6數(shù)據(jù)共享平臺下載數(shù)據(jù)量共計50.97 TB,各大洲訪問共享平臺情況如圖5所示。BCC CMIP6數(shù)據(jù)共享平臺的穩(wěn)定運行為全球科研工作者提供獲取BCC試驗數(shù)據(jù)的方便快捷途徑與方法,降低獲取試驗數(shù)據(jù)的難度與成本,成為推動我國氣候模式國際應用的有力技術手段。
BCC CMIP6數(shù)據(jù)共享平臺為國內外氣候變化及相關領域的研究提供數(shù)據(jù)支撐,不同國家科研人員利用平臺獲得的試驗數(shù)據(jù)開展科學研究工作,在氣候變化模擬與預估[34]、全球變暖與人類活動[35]及模式評估改進[36]等領域取得成果。2020年以來,國際公開發(fā)表的氣候變化相關領域研究引用BCC CMIP6數(shù)據(jù)60余次(不完全統(tǒng)計),在參與CMIP6的近200個模式中位居前列[37]。2021年8月IPCC正式發(fā)布IPCC第6次評估報告第1工作組報告,該報告的多個章節(jié)引用BCC模式多個試驗數(shù)據(jù)集[38],主要涉及人類活動對氣候系統(tǒng)的影響,全球碳和其他生物地球化學循環(huán)與反饋及地球的能量收支、氣候反饋和氣候敏感性等方面科學研究。
我國科學家也利用平臺共享數(shù)據(jù)開展氣候變化研究工作,如基于BCC-CSM2-MR模式歷史氣候模擬試驗與情景模式比較計劃等數(shù)據(jù)開展西南暴雨洪澇災害風險預估[39]、青藏高原夏季水汽長期變化趨勢分析[40]與黃河流域生態(tài)徑流影響預估[41]等研究工作,有助于揭示我國主要區(qū)域及典型氣候事件的變化規(guī)律,推動氣候變化與水資源、生態(tài)安全等領域關系研究,促進我國地球系統(tǒng)模式的評估與改進。
分析表明:
1) 基于BCC CMIP6數(shù)據(jù)特征分析,實現(xiàn)完整性檢查與標準化處理。采用分布式存儲架構, 設計并實現(xiàn)分層級的數(shù)據(jù)共享平臺,基于專題實時環(huán)境數(shù)據(jù)分發(fā)系統(tǒng)提供數(shù)據(jù)服務,實現(xiàn)存儲管理和共享發(fā)布,并在系統(tǒng)、應用及網(wǎng)絡等方面采取措施保障數(shù)據(jù)安全。BCC CMIP6數(shù)據(jù)共享平臺為我國國家級業(yè)務中心參與國際CMIP6比較計劃提供了基礎技術支撐。
2) BCC CMIP6數(shù)據(jù)共享平臺為國內外用戶提供持續(xù)穩(wěn)定的數(shù)據(jù)共享服務,BCC CMIP6數(shù)據(jù)應用于氣候變化模擬與預估、全球變暖與人類活動、地球系統(tǒng)模式評估與改進等研究領域,支撐國內外多項科研成果,多個數(shù)據(jù)集被IPCC第6次評估報告引用,有效提升我國氣候模式的國際影響力,推動氣候變化研究工作的開展。
未來氣候模式將向更高分辨率、更高輸出頻次、更多集合成員等方向發(fā)展,CMIP試驗設計將更為復雜、靈活,試驗數(shù)據(jù)量將迅速增長,這些變化對共享平臺軟硬件的高需求也將更突顯。今后將對CMIP提供持續(xù)數(shù)據(jù)服務,并從基礎設施及技術集約化考慮,將擴展平臺功能,為其他相關模式比較計劃提供統(tǒng)一支撐。