張銘君 馮海洲
摘要:海洋信息產(chǎn)業(yè)呈現(xiàn)多維度、復(fù)雜、海量數(shù)據(jù)的發(fā)展態(tài)勢,隨著信息技術(shù)的不斷增長,超算技術(shù)為海洋研究帶來的強大的技術(shù)支撐,所以不斷拓展基于超算的海洋大數(shù)據(jù)及信息產(chǎn)業(yè)產(chǎn)品應(yīng)用,是推動海洋信息業(yè)快速發(fā)展的必經(jīng)之路。本文通過對當前超算在海洋大數(shù)據(jù)及信息產(chǎn)業(yè)中的發(fā)展現(xiàn)狀進行調(diào)研,分析了國內(nèi)外超算技術(shù)、海洋大數(shù)據(jù)和信息產(chǎn)業(yè)研究及應(yīng)用現(xiàn)狀,以期能為海洋信息產(chǎn)業(yè)的決策和后續(xù)發(fā)展提供有價值的實踐參考。
關(guān)鍵詞:超算;海洋大數(shù)據(jù);海洋信息;應(yīng)用
中圖分類號:TP393 ? ? ?文獻標識碼:A
文章編號:1009-3044(2020)25-0220-03
隨著海洋觀測、模擬手段的快速提升和數(shù)據(jù)科學(xué)的重大突破,海洋數(shù)據(jù)量急速攀升,海洋數(shù)據(jù)已然成為“大數(shù)據(jù)”的典范。當前海洋數(shù)據(jù)量已達到EB級,需要強大的數(shù)據(jù)智能處理分析能力,除此以外,數(shù)值模擬也是物理海洋、海洋生態(tài)、海洋地質(zhì)等領(lǐng)域的重要研究手段,需要大規(guī)模高性能計算能力。而超級計算機的出現(xiàn),成為支撐這些研究的核心要件。隨著海洋數(shù)據(jù)量的不斷增長,海洋研究必須依靠性能更加強大的巨型計算機進行處理模擬,不斷拓展基于超算的面向個性化服務(wù)的海洋大數(shù)據(jù)系列產(chǎn)品,推動海洋信息業(yè)的快速發(fā)展。本文通過對當前超算在海洋大數(shù)據(jù)及信息產(chǎn)業(yè)中的發(fā)展現(xiàn)狀進行調(diào)研,分析超算技術(shù)、海洋大數(shù)據(jù)和信息產(chǎn)業(yè)研究及應(yīng)用現(xiàn)狀,以期能為海洋信息產(chǎn)業(yè)的決策和后續(xù)發(fā)展提供有價值的實踐參考。
1 超級計算
超級計算,即超級計算機(簡稱超算),又稱高性能計算,由眾多處理器組成的計算機,可以處理完成普通服務(wù)器或者計算機無法完成的超量計算任務(wù)[1],是計算機科學(xué)研究領(lǐng)域的重要前沿性分支。當前,超算作為“現(xiàn)代科學(xué)技術(shù)的大腦”,能算天,能算地,能算人等,已成為解決國家經(jīng)濟建設(shè)、社會發(fā)展、國防建設(shè)等領(lǐng)域重大挑戰(zhàn)性問題的重要手段,也是世界各國爭奪的一個戰(zhàn)略制高點。
1.1 國外超算技術(shù)發(fā)展態(tài)勢
美國一直都非常重視超算技術(shù)的發(fā)展,其在理論研究、系統(tǒng)研制、服務(wù)應(yīng)用、人才智力、資金支持等方面都具有較大優(yōu)勢[2]。早在20世紀70年代初,美國就已經(jīng)率先研制出了每秒運行1億次的巨型計算機。在近期,第34屆國際超級計算大會上,美國的“頂點”和的“山脊”分別獲得最新一期的全球超級計算機TOP500榜單的第一和第二 [3]。近兩年來,美國還宣布了三套百億億次超算(E級超算)計劃,日本的超算技術(shù)也一直保持國際領(lǐng)先優(yōu)勢。日本重視超算系統(tǒng)對社會應(yīng)用的貢獻,致力于將高性能計算與不同研究領(lǐng)域進行結(jié)合,尤其是藥物研制、醫(yī)療保健、自然災(zāi)害預(yù)防、能源環(huán)境保護、社會經(jīng)濟問題等,以促進科學(xué)研究推動社會進步。早在 2006年,日本研發(fā)了國產(chǎn)超級計算機“京(K)”,曾列全球超級計算機運算速度排行榜首位。在2014年6月日本宣布啟動“post-K”E級計劃,該項目用于國家高性能計算基礎(chǔ)設(shè)施建設(shè)[2]。2019年8月日本又推出新一代超級計算機——基于ARM架構(gòu)的“富岳”,其最高性能可超400P,目前選定了新藥研發(fā)、地震海嘯模擬和集中暴雨預(yù)測等9個領(lǐng)域的應(yīng)用,期望“富岳”可以完成平均37倍以上的加速。
近年來歐洲各國也下定決心大力研發(fā)超算技術(shù)。2013 年,歐盟啟動“Horizon 2020”計劃,將在 2014-2020 年投入7億歐元開展研究 “面向百億億次的高性能計算”。2017年歐盟委員會提出“European High Performance Computing Common Plan”,并在歐盟成員國中選定八個城市建設(shè)“世界級”超級計算機中心,其中三個超算中心的運行能力將達到每秒15億億次浮點,而其余地方的超算能力將達到每秒4000萬億次浮點,預(yù)計2020年下半年對外開放,屆時歐洲各國的科研、工業(yè)以及各個公共部門都可以使用,將被應(yīng)用在醫(yī)療健康、藥物研發(fā)、生物技術(shù)和工程、材料設(shè)計、氣候預(yù)測等方面。此外,歐洲各國也出臺了若干個發(fā)展項目。例如,德國的“E級創(chuàng)新中心計劃”;西班牙的百億億次“EU Mont-Blanc 計劃”;法國公牛公司的“SEQUANA計劃”等[2]。在2019年6月份最新一期的“全球超級計算機 500 強榜單”上,法國、英國和德國的超算上榜數(shù)量位列第四、第五和第六,其中,進入榜單的浮點運算速度均已突破每秒千萬億次,最低門檻是每秒1022 萬億次。
1.2 中國超算技術(shù)
中國的超算水平早已達國際一流,尤其是在技術(shù)應(yīng)用領(lǐng)域,取得了優(yōu)異的成績。自2009年,國家超算天津中心成立,正式揭開了超算發(fā)展的大幕。截至目前,天津、濟南、深圳、長沙、廣州、無錫、鄭州7家國家超算中心已相繼建成并投入運營。其中,以“天河”“神威”“曙光”等為代表的中國超級計算機系統(tǒng)一直處于國際領(lǐng)先位置,在2019年6月,“全球超級計算機 500 強榜單”上,中國境內(nèi)有 219臺超算上榜,數(shù)量蟬聯(lián)第一;聯(lián)想集團、浪潮集團和中科曙光的超級計算機數(shù)量位列全球制造商的前三,分別為173、71和 63 臺[3];在運行速度上,“神威·太湖之光”和“天河二號”分別位于第三、第四位。在應(yīng)用推廣方面,中國超算在2016 和2017年連續(xù)兩次獲得國際高性能計算機的最高獎——戈登貝爾獎,分別是“神威·太湖之光”的“全球大氣非靜力云分辨模擬”;“高分辨率海浪數(shù)值模擬”;“鈦合金微結(jié)構(gòu)演化相場模擬”,在這3項中已經(jīng)有2項的性能達到了30-40 PFLOPS。
隨著計算機性能的不斷提升,百億億次(E級)超算逐漸進入大眾的視線,其引領(lǐng)著超算技術(shù)進入下一個更快速的時代,是全球爭搶的科技制高點,它將在解決人類共同面臨的能源危機、污染和氣候變化等重大問題上發(fā)揮巨大作用,是各國競相爭奪的熱點和重點。目前,中國、美國、日本和歐盟均提出研制百億億次計算機計劃。我國在《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006-2020年)》中,專門針對超算技術(shù)設(shè)立了重點專項計劃,旨在攻關(guān)百億億次級計算核心技術(shù)難點。在國家“十三五”高性能計算專項課題中,規(guī)劃了三個E級超算的原型機系統(tǒng)——神威E級原型機、“天河三號”E級原型機和曙光E級原型機系統(tǒng)。
2 海洋大數(shù)據(jù)和信息產(chǎn)業(yè)
2.1 海洋信息產(chǎn)業(yè)
海洋信息涉及眾多領(lǐng)域的數(shù)據(jù)資源,例如海洋生物、海洋生態(tài)、氣象、地理地質(zhì)、生物化學(xué)等,還涵蓋人工智能、網(wǎng)絡(luò)信息、計算機技術(shù)、電子科學(xué)等方面內(nèi)容,數(shù)據(jù)種類繁雜,屬于綜合性多學(xué)科交叉的新型研究領(lǐng)域[4]。在高速發(fā)展的信息時代,海洋信息產(chǎn)業(yè)已步入大數(shù)據(jù)時代。海洋信息含有巨量的海洋數(shù)據(jù),而且,相比于其他一般領(lǐng)域的數(shù)據(jù),海洋數(shù)據(jù)因為呈現(xiàn)出數(shù)據(jù)量大、分布廣泛、種類繁雜、時效性高等方面的特點,所以一直保持著極高的獨特性和處理難度[5]。隨著空間信息技術(shù)、各類探測設(shè)備及計算模擬的發(fā)展, 致使約占地表總面積71%的海洋資源迅速積累,海洋科學(xué)研究進入密集型數(shù)據(jù)時代,全方位、連續(xù)、多源、立體的觀測技術(shù)使得海洋信息數(shù)據(jù)存量早已達到EB級別,日增量也達到TB級別[6, 7],海洋數(shù)據(jù)早已成為大數(shù)據(jù)的典型。作為一種極具價值的資源,海洋大數(shù)據(jù)現(xiàn)已成為海洋信息產(chǎn)業(yè)發(fā)展的根基,其不僅是實現(xiàn)海洋強國、維護國家海洋權(quán)益、開發(fā)海洋資源、拉動海洋經(jīng)濟的保障,更是被多國列入國家整體發(fā)展戰(zhàn)略之中。
2.2 海洋大數(shù)據(jù)
當前,海洋大數(shù)據(jù)的來源主要是海洋科考船、海洋浮標、海洋潛水器、海洋遙感、海洋觀測網(wǎng)等海洋監(jiān)測數(shù)據(jù)。截至2018年,全球超過 40 個國家擁有海洋科考船,總數(shù)量超過 500 艘;根據(jù)ARGO全球海洋觀測網(wǎng)計劃,全球海洋浮標數(shù)量已經(jīng)達到1.6萬個,預(yù)計到2025年,剖面浮標將達到4700個,觀測范圍將擴大到海面2000 m以下;目前,中國“蛟龍”號潛水器的下潛深度已達到7062m;預(yù)測到2030年,全球海洋遙感衛(wèi)星將達到271顆[8]。海洋大數(shù)據(jù)的獲取已經(jīng)實現(xiàn)了多元立體化發(fā)展,但其重難點在于數(shù)據(jù)的分析,這其中主要涉及數(shù)據(jù)存儲管理、數(shù)據(jù)挖掘和數(shù)據(jù)可視化表達等。目前,對中國而言,絕大部分數(shù)據(jù)還是用集中式的服務(wù)器存儲,但是隨著探測技術(shù)的進步,海洋數(shù)據(jù)量突飛猛進,這些服務(wù)器的存儲能力有限,今后將難以滿足在線存儲資源的動態(tài)擴展以及離線數(shù)據(jù)的獲取需求。而在海洋數(shù)據(jù)挖掘分析領(lǐng)域,由于海洋大數(shù)據(jù)的時空和地理特性,數(shù)據(jù)量龐大、多維度且關(guān)聯(lián)復(fù)雜,對挖掘算法及其效率有極高的挑戰(zhàn)。可視化是進一步認知海洋的有效途徑,但是伴隨著數(shù)據(jù)量的持續(xù)攀升,科研人員對于可視化呈現(xiàn)、分析技術(shù)、處理能效等方面的要求將越來越高,今后不僅需要實時反映數(shù)據(jù)的特征,保證數(shù)據(jù)的時效性,更要確保數(shù)據(jù)的實時更新和準確地繪制,在這一方面就對整個可視化處理系統(tǒng)提出了更高的承載和處理要求[8]。
2.3 中國海洋信息化建設(shè)及海洋大數(shù)據(jù)發(fā)展現(xiàn)狀
海洋信息化建設(shè)是我國重要的發(fā)展戰(zhàn)略之一。自“十三五”期間,中國便開始全面布局海洋信息化建設(shè),要求加大力度攻關(guān)海洋信息領(lǐng)域核心技術(shù),加強云計算、大數(shù)據(jù)等新一代信息技術(shù)在海洋領(lǐng)域的深度融合,著力打造信息透徹、超算互聯(lián)互通、共享共建的現(xiàn)代化海洋信息化體系。近年來,中國還啟動“智慧海洋”工程建設(shè),要讓信息變成知識來服務(wù)海洋,充分利用互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術(shù)實現(xiàn)海洋信息的智能挖掘和應(yīng)用,并明確以信息主導(dǎo)、體系建設(shè)“智慧海洋”是實現(xiàn)我國海洋強國戰(zhàn)略的長遠抓手[9]。
近年來,我國各級政府都在大力推進海洋電子政務(wù)工程,不僅建設(shè)并完善了各類海洋專題服務(wù)型網(wǎng)站和國家海洋局政府網(wǎng)站,還研發(fā)了多個海洋領(lǐng)域的業(yè)務(wù)系統(tǒng),例如,海洋氣候預(yù)報、海洋環(huán)保、海島保護、海域使用等。站在海洋大數(shù)據(jù)發(fā)展的角度,我國在海洋數(shù)據(jù)探測獲取、存儲管理、分析處理等領(lǐng)域取得了一定的進步,但是還是落后于海洋地理信息技術(shù)和探測技術(shù)的快速發(fā)展。當前,海洋信息量正成快速增長的趨勢,人們對海洋信息產(chǎn)品和服務(wù)要求也在不斷增多和提高,傳統(tǒng)簡單的海洋信息化過程已經(jīng)不能滿足時代發(fā)展要求,尤其,又因為海洋數(shù)據(jù)高價值、多源、復(fù)雜、動態(tài)、敏感等特點,更增加了海洋信息化的難度,所以更加迫切需要創(chuàng)新高效的信息處理技術(shù),以此發(fā)掘海洋數(shù)據(jù)更廣泛的價值,帶動信息產(chǎn)業(yè)的升級換代。在我國海洋信息化戰(zhàn)略推進的過程中,面臨的重大問題是順應(yīng)大數(shù)據(jù)時代的浪潮中,如何運用大數(shù)據(jù)思維和技術(shù),針對海洋數(shù)據(jù)的特點,對海洋觀測、數(shù)據(jù)儲存、模擬分析等進行準確、及時、高效地分析和處理,挖掘更多海洋大數(shù)據(jù)應(yīng)用服務(wù),使海洋大數(shù)據(jù)資產(chǎn)價值最大化,充分發(fā)揮海洋信息產(chǎn)業(yè)對我國經(jīng)濟和國民生活的帶動作用[10]。
3 超算技術(shù)在海洋大數(shù)據(jù)和信息產(chǎn)業(yè)中的應(yīng)用情況
隨著海洋監(jiān)測技術(shù)的發(fā)展,以及海洋科學(xué)與數(shù)據(jù)科學(xué)等學(xué)科的深入交叉融合,海洋數(shù)據(jù)量和類型都在急速增長,據(jù)統(tǒng)計,到2030年,海洋數(shù)據(jù)量規(guī)模將從目前的約60PB增長至350PB以上,對海洋數(shù)據(jù)研究和信息產(chǎn)業(yè)的發(fā)展而言,這將是巨大的挑戰(zhàn)。所以亟需與更先進和高效的技術(shù)工具結(jié)合。而超級計算機的出現(xiàn),為全球科學(xué)家解決社會、環(huán)境及人類等重大關(guān)鍵問題提供了強有力的助力。同樣,對于海洋領(lǐng)域,超算也成為人們認識海洋、探索海洋的利器。
3.1 海洋環(huán)境預(yù)報
氣候氣象領(lǐng)域一般含有大量的數(shù)據(jù),是超級計算機應(yīng)用的經(jīng)典領(lǐng)域,尤其是全球氣象預(yù)報和海洋動力學(xué)過程。巨型計算機技術(shù)應(yīng)用在海洋動力過程與全球氣象數(shù)值模擬計算中,對海洋環(huán)境進行的動態(tài)仿真,獲取海洋環(huán)境綜合信息,建立預(yù)測系統(tǒng),掌握海洋環(huán)境變化,從而提升海洋環(huán)境預(yù)報的準確性和及時性。美國加利福尼亞大學(xué)用超級計算機模擬了厄爾尼諾現(xiàn)象;美國加州工學(xué)院地球與空間科學(xué)分部利用超級計算機對海洋環(huán)流模型程序進行了測試,運行效率是單處理器時250倍左右[11];中國海洋試點國家實驗室、美國地球流體動力學(xué)實驗室、美國大氣科學(xué)研究中心、澳大利亞科學(xué)與工業(yè)研究機構(gòu)、歐洲天氣預(yù)報中心等多家世界頂級海洋研究單位共同合作利用超算技術(shù)模擬計算了未來500年全球海洋氣象變化的過程,并將精度控制在了10公里以內(nèi);中國海洋試點實驗室借助超算技術(shù)對中國海洋絲綢之路上的西太平洋─南海─印度洋區(qū)域進行了海洋氣候預(yù)報,精度達到了世界領(lǐng)先的3公里,時間期限是未來15天。
3.2 古氣候模擬
將古代氣候觀測資料數(shù)據(jù)用海洋氣候模擬的方式展現(xiàn)出來,有助于了解古代氣候變化、驗證現(xiàn)代氣候現(xiàn)象、以及預(yù)測未來海洋氣候變化。但是氣候模擬嚴重依賴于計算效率和計算資源,過去傳統(tǒng)的模式受限于計算技術(shù),通常只能做短期的古氣候切片模擬,或者不同時候的耦合試驗,無法對深海環(huán)流的緩慢變化進行研究模擬,更難以根據(jù)古氣候資料預(yù)測和追蹤未來海洋氣候的變化。近年來,美國俄亥俄州立大學(xué)和美國大氣科學(xué)研究中心等多家知名科研單位共同合作借助超算技術(shù),在氣候模式上引入多種同位素模塊,模擬了過去兩萬一千年來全球同位素與氣候的演變;德國的海洋研究學(xué)者也借助超算技術(shù)實施了一個古氣候模擬試驗,計劃對近10萬年來的整個地球系統(tǒng)冰期—間冰期大旋回進行長期持續(xù)的模擬;中國海洋試點國家實驗室也與多所知名院校科研單位進行了合作研究,同樣借助超算技術(shù),采用包含同位素模塊的較高分辨率地球系統(tǒng)模式模擬兩萬五千年前的全球同位素與氣候協(xié)同演變。
3.3 海洋藥物
海洋是地球上最復(fù)雜、最龐大的生態(tài)系統(tǒng),由于其特殊的地理環(huán)境,生活在海洋中的生物成為醫(yī)療領(lǐng)域的寶藏,為醫(yī)藥研究提供了大量的而獨特的生物基因和化合物資源。其中,海洋生物占地球總生物的70%以上,但是由于海洋生物獲取難、計算難、實驗難,在藥源生物中僅貢獻1%。當前,隨著超算技術(shù)的迅猛發(fā)展,其在生命科學(xué)的研究中逐漸體現(xiàn)出了顯著的優(yōu)勢。尤其是在海洋醫(yī)藥領(lǐng)域,將超算技術(shù)與藥物設(shè)計相結(jié)合,通過提取藥物的分子結(jié)構(gòu),來計算是否能作用到人體上,從而助推新藥的研發(fā)。截至2019年,海洋試點實驗室已完成170多個成藥靶點與全部已知35000余個海洋化合物的對接,準確率由國際上20%躍升到70%,基本建成基于智能超算與生物實測耦合的海洋藥物發(fā)現(xiàn)體系,其中包括海洋天然產(chǎn)物三維結(jié)構(gòu)數(shù)據(jù)庫、智能超算海洋藥物篩選技術(shù)。
3.4 海洋勘探
認識海底、開發(fā)海洋資源是人類一直以來的努力方向,這不僅能有效緩解陸地資源不足的困境,還能有極大地預(yù)防和減輕海洋地質(zhì)災(zāi)害所帶來的損失,從而保障人民安居樂業(yè),社會經(jīng)濟可持續(xù)發(fā)展。海洋勘探包括對海洋地質(zhì)學(xué)的研究和海底能源的探測,海洋地質(zhì)學(xué)研究需要超高精度的模擬,需要跨越不同時空和空間以對地球運行機制進行模擬探索,之前受制于計算能力,地球動力學(xué)模擬存在不精細、時間冗長的問題;而海洋能源勘探離不開對海底復(fù)雜構(gòu)造和復(fù)雜巖性的觀察分析,這就需要對實測數(shù)據(jù)的高精度成像與反演[12],而之前受制于運算量和存儲量的限制,很難實現(xiàn)對深海的精確勘探。超算技術(shù)的發(fā)展為這些領(lǐng)域帶來了新的技術(shù)手段,將解決當前困境,極大提高勘探效率,加速海洋勘探的研究速度。
4 總結(jié)
通過分析超算和海洋信息產(chǎn)業(yè)的發(fā)展現(xiàn)狀,發(fā)現(xiàn)超算有利于提高海洋預(yù)測精度,為氣候預(yù)報、海洋藥物研發(fā)、資源勘探等提供支撐。未來,是計算速度的時代, 也是海洋的時代。將超算與海洋聯(lián)系打造智慧海洋,將很大程度改變未來世界發(fā)展的方向。未來的智慧海洋,必將為人類帶來用之不竭的財富。但是基于目前現(xiàn)狀,超算在海洋信息領(lǐng)域的應(yīng)用還存在局限性,應(yīng)用領(lǐng)域亟須進一步拓展,以更好地滿足人類社會的發(fā)展。未來超算可以繼續(xù)推廣應(yīng)用到工程裝備、海洋智能計算、海洋漁業(yè)、海洋經(jīng)濟等領(lǐng)域,通過超算技術(shù),推動海洋信息行業(yè)應(yīng)用的發(fā)展。
參考文獻:
[1] 本刊綜合.超算:比你想的更接地氣[J].發(fā)明與創(chuàng)新·大科技,2019(11):50-51.
[2] 歷軍.中國超算產(chǎn)業(yè)發(fā)展現(xiàn)狀分析[J].中國科學(xué)院院刊,2019,34(6):617-624.
[3] 中國蟬聯(lián)全球超算500強上榜數(shù)量第一[J]. 智能制造,2019(7):15.
[4] 王偉. 大數(shù)據(jù)時代海洋信息技術(shù)發(fā)展探討[J]. 中國管理信息化,2020, 23(4):185-186.
[5] 張博. 大數(shù)據(jù)時代海洋信息技術(shù)發(fā)展探討: 第三屆海洋開發(fā)與管理學(xué)術(shù)年會[Z]. 中國安徽合肥: 20196.
[6] TolleKM,Tansley DSW,HeyAJG.Thefourthparadigm:data-intensivescientificdiscovery [point of view[J].Proceedings of the IEEE,2011,99(8):1334-1337.
[7] 劉帥,陳戈,劉穎潔,等.海洋大數(shù)據(jù)應(yīng)用技術(shù)分析與趨勢研究[J].中國海洋大學(xué)學(xué)報(自然科學(xué)版),2020,50(1):154-164.
[8] 錢程程,陳戈.海洋大數(shù)據(jù)科學(xué)發(fā)展現(xiàn)狀與展望[J].中國科學(xué)院院刊,2018,33(8):884-891.
[9] 王志文.綜合施策推進海洋信息經(jīng)濟發(fā)展[J].浙江經(jīng)濟,2018(15):62.
[10] 宋德瑞,曹可,張建麗,等.大數(shù)據(jù)視域下的海洋信息化建設(shè)構(gòu)想[J].海洋開發(fā)與管理,2017,34(9):50-53,77.
[11] 夏江婷. 淺談超級計算機及其發(fā)展[J].中國科技縱橫,2017(24):24-25.
[12] 魏志強,楊照,黃磊,等. 海洋國家實驗室對E級超算的需求分析與展望[J]. 中國計算機學(xué)會通訊, 2017,13(10):35-38.
【通聯(lián)編輯:光文玲】