魏東琦,楊博,王占昌,張紅英
(中國地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心/西北地質(zhì)科技創(chuàng)新中心,陜西 西安 710054)
地質(zhì)信息是地質(zhì)工作服務于經(jīng)濟社會發(fā)展的主要載體,是國土資源調(diào)查、規(guī)劃、管理、保護、合理利用和國家重大工程建設(shè)的重要基礎(chǔ)信息資源,對于緩解資源約束、保障經(jīng)濟發(fā)展、推進城鄉(xiāng)建設(shè)、開展國土整治、防治地質(zhì)災害、改善人居環(huán)境等都具有重要的利用價值(程光華等,2018)。筆者簡明論述了國內(nèi)外地質(zhì)信息化的發(fā)展現(xiàn)狀,總結(jié)西安地質(zhì)調(diào)查中心在地質(zhì)資料信息化服務、數(shù)據(jù)庫建設(shè)、軟件系統(tǒng)開發(fā)等方面取得的主要成果,以及在推動中國地質(zhì)調(diào)查局信息化建設(shè)中做出的貢獻;在此基礎(chǔ)上,闡述了地質(zhì)信息化的發(fā)展趨勢,分析了西安地質(zhì)調(diào)查中心信息化建設(shè)存在的問題,提出了解決問題的建議和信息化未來的發(fā)展規(guī)劃。
在以云計算、大數(shù)據(jù)、人工智能等新技術(shù)為引領(lǐng)的信息技術(shù)高速發(fā)展的今天,分布式數(shù)據(jù)共享、服務平臺、多學科信息融合等方面的建設(shè)引領(lǐng)了國際地學信息化建設(shè)與應用的發(fā)展方向。這些技術(shù)同樣對地質(zhì)調(diào)查工作和研究產(chǎn)生了重要影響。發(fā)達國家地質(zhì)調(diào)查及研究機構(gòu)針對地學空間數(shù)據(jù)信息平臺及應用組織實施了若干影響力極高的計劃和項目。歐美等國更是以立法形式確保地質(zhì)信息化建設(shè)長期有利的可持續(xù)發(fā)展,通過一系列的手段,基本完成了調(diào)查數(shù)據(jù)的原始積累,促進了地學空間數(shù)據(jù)庫建設(shè)向著多元化、便捷化、全球化的方向發(fā)展。例如,歐洲議會和歐盟理事會推動歐盟空間信息基礎(chǔ)設(shè)施建設(shè)項目(INSPIRE),旨在建立歐盟統(tǒng)一的空間數(shù)據(jù)基礎(chǔ)設(shè)施,實現(xiàn)有關(guān)環(huán)境空間信息在歐洲的共享,使歐盟成員國的公眾能夠便捷地獲取數(shù)據(jù),便于跨區(qū)域的政策決策及應用(劉榮梅等,2015)。美國地質(zhì)協(xié)會和美國地質(zhì)調(diào)查局共同發(fā)起美國地球科學信息網(wǎng)建設(shè)項目(USGIN),旨在促進美國各州地調(diào)局和國家地質(zhì)調(diào)查局的地學信息的發(fā)現(xiàn)、共享和利用(劉榮梅,2013)。
與此同時,美國、加拿大等國于20世紀80年代在野外數(shù)據(jù)采集方面就已啟動了數(shù)字地質(zhì)調(diào)查工作,配合逐步建立起龐大的“空-天-地”一體的監(jiān)測網(wǎng)絡(luò),實現(xiàn)了數(shù)據(jù)采集工作質(zhì)的飛越。在多專業(yè)多門類的數(shù)據(jù)管理方面,美國地質(zhì)調(diào)查局(USGS)負責管理美國全國的數(shù)字地圖數(shù)據(jù)的采集與分發(fā),科學家所使用的數(shù)據(jù)和技術(shù)符合或參考已有的相關(guān)國家、國際標準和協(xié)議,對于給定類型的數(shù)據(jù)集,如果存在國家或國際元數(shù)據(jù)標準,則將該數(shù)據(jù)用元數(shù)據(jù)建立索引,便于訪問和集成。USGS通過這些手段有效地管理了數(shù)據(jù),形成了從數(shù)據(jù)源頭到成果集成應用的工作模式。在標準規(guī)范體系建設(shè)方面,各個國外的地質(zhì)調(diào)查機構(gòu)都認識到統(tǒng)一的標準是地質(zhì)信息互操作的基礎(chǔ),以及在地學信息管理、轉(zhuǎn)換、共享、應用方面起到的重要作用。歐美等國的標準規(guī)范建設(shè)比中國起步早,如國際地科聯(lián)地學信息委員會制定的地學數(shù)據(jù)交換標準GeoSciML V3.0,從2003年已開始建設(shè)。目前,已有美國地質(zhì)調(diào)查局、澳大利亞聯(lián)邦地調(diào)局等國家的地學機構(gòu)參加(許亞峰等,2020),并已廣泛應用與INSPIRE、OneGeolpgy等大型項目中。
中國地質(zhì)信息化工作起步較晚,但后勁十足。特別是“十三五”以來,中國地質(zhì)調(diào)查局將信息化納入地質(zhì)調(diào)查“三大戰(zhàn)略性轉(zhuǎn)變”的主要內(nèi)容,以信息化為重要引擎,促進新時代地質(zhì)調(diào)查升級轉(zhuǎn)型。2016年啟動“地質(zhì)云”建設(shè),開創(chuàng)了地質(zhì)信息化發(fā)展的新格局,通過數(shù)據(jù)資源整合和信息系統(tǒng)集成,全面提升地質(zhì)調(diào)查數(shù)據(jù)的采集、處理、分析、共享與服務能力,及時、有效地滿足政府部門、企業(yè)事業(yè)單位、社會公眾等各類用戶對地質(zhì)信息的多元需求(周進生,2005)。地質(zhì)調(diào)查信息化工作取得了以“地質(zhì)云”為核心的一批重要成果,創(chuàng)建了高效安全的“地質(zhì)云”平臺,實現(xiàn)中國地質(zhì)調(diào)查局43家單位互聯(lián)互通;整合構(gòu)建了地球科學“一張圖”大數(shù)據(jù)體系,推動數(shù)據(jù)驅(qū)動地球科學研究范式的構(gòu)建,為提升對地球認知水平奠定了堅實基礎(chǔ);基本構(gòu)建了地質(zhì)調(diào)查“在線化”采集工作體系,改變了傳統(tǒng)地質(zhì)調(diào)查工作模式;初步建立了“空-天-地-?!币惑w化的地質(zhì)調(diào)查感知與數(shù)據(jù)匯聚體系,推進了地質(zhì)調(diào)查現(xiàn)代化進程;開發(fā)了一批重要專業(yè)領(lǐng)域分析評價系統(tǒng),顯著提高了地質(zhì)調(diào)查解決重大資源環(huán)境問題的能力;加強了智能化技術(shù)攻關(guān),為地質(zhì)調(diào)查轉(zhuǎn)型發(fā)展注入了新動力,開發(fā)了系列地質(zhì)信息產(chǎn)品,大幅提升了地質(zhì)信息社會化服務水平;建立了地質(zhì)調(diào)查業(yè)務綜合管理系統(tǒng),實現(xiàn)了業(yè)務協(xié)同管理與輔助決策,提升了業(yè)務管理效能;健全完善了地質(zhì)調(diào)查信息化管理制度與技術(shù)標準體系,強化信息化建設(shè)的“四統(tǒng)一”原則,帶動了地質(zhì)行業(yè)信息化發(fā)展;形成了一支信息化建設(shè)與應用隊伍,推進了信息化與地質(zhì)調(diào)查業(yè)務深度融合,為地質(zhì)調(diào)查事業(yè)發(fā)展提供了支撐保障(中國地質(zhì)調(diào)查局,2017)。
西安地質(zhì)調(diào)查中心作為中國西北地區(qū)地質(zhì)調(diào)查信息化建設(shè)的主要力量,按照中國地質(zhì)調(diào)查局的統(tǒng)一部署,建成了“地質(zhì)云”西北物理節(jié)點,基本建成了西北地球科學“一張圖”體系,重要地質(zhì)數(shù)據(jù)庫得到持續(xù)更新。面向黃河流域生態(tài)保護和高質(zhì)量發(fā)展等區(qū)域重大戰(zhàn)略問題,西安地質(zhì)調(diào)查中心拓展地質(zhì)調(diào)查成果信息產(chǎn)品服務范圍和規(guī)模,建立完善了地質(zhì)產(chǎn)品研發(fā)與發(fā)布機制,推出了黃河中上游自然資源圖集、西北區(qū)域地質(zhì)圖(1∶100萬)等特色產(chǎn)品累計1 400余套。研制開發(fā)了以“泛在自然資源要素大數(shù)據(jù)服務系統(tǒng)”為代表的一系列軟件應用系統(tǒng),基本解決了地質(zhì)大數(shù)據(jù)的存儲、管理、分析、制圖、共享服務的全流程知識產(chǎn)權(quán)可控問題,為西北地質(zhì)大數(shù)據(jù)中心建設(shè)提供了良好的軟件支撐。
地質(zhì)資料是各項地質(zhì)調(diào)查工作的成果結(jié)晶,是地質(zhì)信息化工作的重要組成和重要基礎(chǔ)。西安地質(zhì)調(diào)查中心成立60年來,先后完成國家和地方各類地質(zhì)調(diào)查與科學研究項目800余項,取得國家和省(部)級獎勵等科技獎項成果160余項、專利32項。經(jīng)過幾十年的積累,西北地區(qū)地質(zhì)調(diào)查和科研資料已經(jīng)頗具規(guī)模,是十分珍貴的地質(zhì)科學技術(shù)檔案。這些地質(zhì)資料是國家投入大量人力、財力、物力獲取的高成本、長周期成果,是科研人員進行地質(zhì)基礎(chǔ)研究和綜合應用研究的基礎(chǔ)資料,廣泛應用于科學研究、礦產(chǎn)勘查、城鄉(xiāng)建設(shè)、生態(tài)文明建設(shè)、防災減災建設(shè)等多個方面,發(fā)揮了重要的作用(黃少芳等,2016)。筆者從地質(zhì)資料服務這一視角,沿著服務工作模式的發(fā)展脈絡(luò)簡述地質(zhì)資料信息化的歷史和作用。
西安地質(zhì)調(diào)查中心的地質(zhì)資料載體形式主要有紙質(zhì)和電子2種形式。2001年之前形成和收集的約4 000種資料基本為紙質(zhì)資料。2001年,中國地質(zhì)調(diào)查局資料館西北分館成立,履職接收西北地區(qū)形成的地質(zhì)調(diào)查項目成果資料。隨著地質(zhì)工作手段信息化程度的不斷提高,接收歸檔提交的電子化資料比率不斷提升,并在開展館藏重要地質(zhì)資料數(shù)字化工作的基礎(chǔ)上,目前館藏近8 000種資料,其中電子化資料4 000多種,數(shù)據(jù)量達50 TB,而且館藏涉及專業(yè)領(lǐng)域由以科研、基礎(chǔ)地質(zhì)研究為主,發(fā)展至區(qū)域地質(zhì)調(diào)查、礦產(chǎn)勘查、水工環(huán)勘查、物化遙勘查、信息與技術(shù)方法研究等專業(yè)領(lǐng)域全覆蓋。
2001年之前館藏資料服務主要以傳統(tǒng)服務方式(到館查詢辦理借閱)提供服務,查詢方式主要是人工紙質(zhì)賬冊檢索。2001~2005年,初步開展了成果地質(zhì)調(diào)查資料社會提供利用服務,但基本上處于傳統(tǒng)資料管理與服務模式,服務的對象主要是西安地質(zhì)調(diào)查中心業(yè)務人員。
2006年之后,隨著館藏模式發(fā)生變化,從傳統(tǒng)的手工信息服務為主轉(zhuǎn)變?yōu)橐杂脩魹橹行?,提供智能化的信息檢索和現(xiàn)代化的服務手段進行信息服務。用戶可以在地質(zhì)資料電子閱覽室查詢、瀏覽、借閱、復制館藏資料;資料館藏部門編譯了西北地區(qū)成果地質(zhì)調(diào)查資料英文目錄,開辟英文服務網(wǎng),可以通過中英文網(wǎng)頁進行資料目錄檢索,根據(jù)用戶需求,通過復印、拷貝、掃描、打印等方式提供地質(zhì)資料復制服務和遠程郵寄服務。隨著西安地質(zhì)調(diào)查中心網(wǎng)站資料服務功能的不斷完善,2012年之后不僅提供地質(zhì)資料目錄檢索,而且可以提供公開版地質(zhì)資料的全文瀏覽與下載,提供多種比例尺的在線數(shù)據(jù)應用服務、專題資料的查詢?yōu)g覽等功能。資料數(shù)字化程度和信息技術(shù)不斷進步推動著地質(zhì)資料的信息服務能力不斷增強,地質(zhì)資料服務人數(shù)、頻次、件數(shù)等多項指標均顯示地質(zhì)資料服務總量和服務能力顯著提升。地質(zhì)資料信息館服務人員覆蓋地勘行業(yè)、核工業(yè)、水利、煤炭、冶金等行業(yè)和高校、環(huán)境、建筑、城市規(guī)劃等企事業(yè)單位,并隨著信息網(wǎng)絡(luò)技術(shù)的發(fā)展,計算機和網(wǎng)絡(luò)聯(lián)系起來,現(xiàn)如今擴展為任何上網(wǎng)利用地質(zhì)資料信息資源的用戶都是西北地質(zhì)資料館服務的對象。
2018年之后,提供地質(zhì)資料實體服務的主體以國家和省級館藏機構(gòu)為主,西安地質(zhì)調(diào)查中心的資料信息服務平臺轉(zhuǎn)型升級至中國地質(zhì)調(diào)查局“地質(zhì)云”平臺,堅持需求導向,擴大產(chǎn)品涵蓋面,精準開發(fā)地質(zhì)信息產(chǎn)品,優(yōu)選1 400余種西北地區(qū)典型地質(zhì)產(chǎn)品上線服務,提升了信息產(chǎn)品的精細化服務水平。
社會對地質(zhì)信息需求旺盛,需求層次不斷提高,綜合性專題服務和戰(zhàn)略策略咨詢類的服務產(chǎn)品相對不足、面向公眾的科普類地質(zhì)資料和服務相對匱乏,難以滿足社會整體需求。作為大區(qū)中心,全力配合國家地質(zhì)大數(shù)據(jù)共享服務平臺“地質(zhì)云”的建設(shè),提高上云產(chǎn)品和數(shù)據(jù)的質(zhì)量,研發(fā)西北權(quán)威、專題服務信息產(chǎn)品,支撐中國地質(zhì)調(diào)查局和西安地質(zhì)調(diào)查中心重大戰(zhàn)略、兩重工作,提供精準化服務,推進社會服務深度,將是今后資料服務的發(fā)展趨勢與努力方向。
西安地質(zhì)調(diào)查中心成立60周年以來,特別是近十年信息化建設(shè)取得了一系列的成果,推動信息化新理論、新技術(shù)、新方法與地質(zhì)工作融合,加強了地質(zhì)數(shù)據(jù)的共享力度,提升了地質(zhì)調(diào)查成果的社會化服務水平。筆者以時間為序,重點介紹西安地質(zhì)調(diào)查中心一些顯著的地質(zhì)信息化成果。
阿爾金成礦帶“地質(zhì)云”是西安地質(zhì)調(diào)查中心阿爾金成礦帶紅柳溝-拉配泉地區(qū)地質(zhì)礦產(chǎn)調(diào)查二級項目組和發(fā)展研究中心主流程信息化團隊合作進行的在線化、智能化應用示范研究成果,是中國地質(zhì)調(diào)查局建立的“第一朵”智能調(diào)查云,是“地質(zhì)云”建設(shè)與業(yè)務深度融合的典范。阿爾金成礦帶“地質(zhì)云”建設(shè)過程中,在西安地質(zhì)調(diào)查中心和發(fā)展研究中心共同設(shè)計下,充分以地質(zhì)礦產(chǎn)調(diào)查實際需求為導向,在發(fā)展研究中心已有的地質(zhì)調(diào)查智能空間平臺的基礎(chǔ)上,快速搭建了阿爾金地質(zhì)云平臺,初步實現(xiàn)了資料在線收集、野外在線調(diào)查、成果在線共享全流程信息化,在全國率先探索出一條新一代數(shù)據(jù)密集型地質(zhì)調(diào)查工作模式的辦法和思路,構(gòu)建的中國第一朵“地質(zhì)云”示范模型,展現(xiàn)了基于大數(shù)據(jù)的現(xiàn)代地質(zhì)調(diào)查工作模式。尤其在地理信息、地質(zhì)信息智能感知和服務、采用面向數(shù)據(jù)密集型的智能編圖技術(shù)方法和工具開展1∶10萬地質(zhì)編圖等方面,體現(xiàn)了地質(zhì)云和大數(shù)據(jù)技術(shù)帶來的工作效率和新一代工作模式。新一代數(shù)據(jù)密集型地質(zhì)調(diào)查工作模式提高了直接挖掘、反映物理實在數(shù)據(jù)世界的能力,更加精確的梳理存在的問題,并精準地提出解決問題的方案,是大數(shù)據(jù)時代下的新一代地質(zhì)工作模式。
為全力支撐國家地質(zhì)大數(shù)據(jù)工程建設(shè),西安地質(zhì)調(diào)查中心歷時數(shù)年,自主開發(fā)研制了一套“泛在化分布式地學大數(shù)據(jù)共享服務系統(tǒng)(GeositeServer)”,致力于解決云環(huán)境下地學大數(shù)據(jù)建設(shè)進程所面臨的核心技術(shù)問題,解決了包括地質(zhì)調(diào)查數(shù)據(jù)“異地、異主、異構(gòu)”分布式協(xié)同與國際標準化存儲傳輸與共享交換、交互可視化、知識挖掘再現(xiàn)等諸多瓶頸問題。其主要功能涵蓋地學數(shù)據(jù)加工、格式轉(zhuǎn)換、存儲管理、檢索查詢、分析計算、數(shù)據(jù)共享及可視化發(fā)布。該平臺系統(tǒng)提供的3大類創(chuàng)新性功能。
(1)國際標準化地學數(shù)據(jù)格式轉(zhuǎn)換與大數(shù)據(jù)推送工具軟件(OGC.net)。OGC.net軟件是一套地學通用數(shù)據(jù)驅(qū)動和國際通用數(shù)據(jù)格式轉(zhuǎn)換軟件工具,是“地質(zhì)大數(shù)據(jù)工程(2019~2021年)”軟件成果之一。依據(jù)ISO-OGC國際標準范式,重點針對業(yè)內(nèi)廣泛使用的MapGIS、ShapeFile二進制(點、線、面)數(shù)據(jù)文件、國際通用地學數(shù)據(jù)文件(GML、KML、GeoJSON等)、柵格影像大數(shù)據(jù)編碼存儲等關(guān)鍵技術(shù)開展了攻關(guān)研究,實現(xiàn)了二進制與明碼文件的全要素讀取存儲、計算分析與共享交換,同時向外界提供了可供二次開發(fā)的跨平臺(Windows、Linux、macOS)接口函數(shù)集, 有效降低了地學領(lǐng)域?qū)ι虡I(yè)GIS軟件的依賴,并降低了經(jīng)濟成本,具有顯著的經(jīng)濟效益和現(xiàn)實意義。目前,OGC.net軟件已向地質(zhì)云和國際站點開源開放,并向西北5省區(qū)地勘單位、中國地質(zhì)調(diào)查局部分局屬單位和微創(chuàng)企業(yè)提供了軟件共享與技術(shù)支撐服務。
(2)泛在化地學大數(shù)據(jù)驅(qū)動平臺(GeositeServer for BigData&Cloud)。GeositeServer系統(tǒng)研制遵循ISO-OGC-WMTS 1.0.0和OGC-WFS 2.0.0接口服務標準、OGC-GML數(shù)據(jù)交換標準等國際規(guī)范,以面向數(shù)據(jù)資源、節(jié)點體系與協(xié)同服務為設(shè)計理念,創(chuàng)新性提出了以“自然樹”生長法則為指導的大數(shù)據(jù)架構(gòu)思路,實現(xiàn)了地學大數(shù)據(jù)彈性存儲,高速遍歷、細粒度計算、實體要素內(nèi)容解析重構(gòu)、敏感信息過濾與防攻擊策略、分布式跨域協(xié)同互聯(lián)等指標,支持矢量與柵格數(shù)據(jù)分布式組網(wǎng)匯聚管理并具備多語種全文搜索、空間幾何疊置分析、層級分類與實體屬性約束運算、橢球投影變換與天文學計算、通用格式交換與在線定制式下載等多項功能。經(jīng)實際應用,平臺系統(tǒng)可用于承載多門類自然資源海量數(shù)據(jù)集,并按國際標準范式提供微服務聚合接口,為專題系統(tǒng)開發(fā)提供了大數(shù)據(jù)定制化服務支撐。
(3)地學空間信息網(wǎng)絡(luò)可視化前端驅(qū)動框架(WebGIS.JS)。WebGIS.js是一套適宜于地學空間數(shù)據(jù)在網(wǎng)絡(luò)瀏覽器端進行可視化交互的嵌入式(Javascript腳本語言)驅(qū)動框架,重點解決了地學柵格影像、矢量要素、文本標注和多媒體等數(shù)據(jù)集的異步傳輸、可視化呈現(xiàn)與交互操作等問題。近年來,WebGIS.js框架通過地質(zhì)云(GeoCloud)和國際站點(Docker Hub)向外界持續(xù)提供了共享下載與技術(shù)支持服務,下載量超過700余次。已知的應用機構(gòu)包括多家中國地質(zhì)調(diào)查局直屬單位、省級地勘單位和GIS相關(guān)企業(yè)。GeositeServer平臺系統(tǒng)已列入中國地質(zhì)調(diào)查局“十四五”信息化系統(tǒng)攻關(guān)任務,同時也被納入“深時數(shù)字地球”(Deep time Digital Earth)DDE計劃產(chǎn)品路線圖,在后續(xù)工作中將進一步發(fā)揮前沿信息技術(shù)與創(chuàng)新發(fā)展在地調(diào)業(yè)務中驅(qū)動作用。
目前,平臺系統(tǒng)軟件產(chǎn)品已通過地質(zhì)云和國際站點向外界持續(xù)提供了下載服務,已推介到西北各省區(qū)地勘單位大數(shù)據(jù)中心,有效助推了地質(zhì)云節(jié)點體系分布式地質(zhì)大數(shù)據(jù)體系建設(shè)進程,同時向非洲(盧旺達)國家提供了全套軟件安裝包,回應了商務部“援非”項目的關(guān)切,有效提升了中國地質(zhì)調(diào)查局的國際影響力。
中國地質(zhì)調(diào)查近百年的工作積累了豐富的數(shù)據(jù)資源,這些數(shù)據(jù)具有顯著的大數(shù)據(jù)特征,其中蘊藏的潛在價值不可估量。隨著大數(shù)據(jù)浪潮的到來,地質(zhì)調(diào)查行業(yè)也迎來了從小數(shù)據(jù)時代向大數(shù)據(jù)時代的變遷,數(shù)據(jù)密集型科學研究模式應運而生。從數(shù)據(jù)類型上看,地質(zhì)數(shù)據(jù)由非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)共同組成,而非結(jié)構(gòu)化數(shù)據(jù)占比近80%。如果這些海量的非結(jié)構(gòu)化數(shù)據(jù)能夠被有效地利用,則相關(guān)的地球科學研究就更可能獲得突破,而解決地質(zhì)問題的技術(shù)方法也將變得更具適應性和專屬性(李超嶺等,2015)。因此,非結(jié)構(gòu)化地質(zhì)數(shù)據(jù)是大數(shù)據(jù)時代地質(zhì)數(shù)據(jù)的新內(nèi)涵。
雖然大數(shù)據(jù)時代的到來為挖掘地質(zhì)數(shù)據(jù)內(nèi)在信息,充分發(fā)揮數(shù)據(jù)自身的價值帶來了良好契機,但是,數(shù)據(jù)的組織存儲和數(shù)據(jù)分析、挖掘面臨一系列挑戰(zhàn)。這些挑戰(zhàn)貫穿于數(shù)據(jù)獲取、存儲、使用等各個環(huán)節(jié)當中。為了解決以上問題,需要綜合應用大數(shù)據(jù)、自然語言處理、數(shù)據(jù)挖掘等技術(shù),就地質(zhì)大數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)的存儲與挖掘兩大關(guān)鍵問題展開研究。此成果通過研究構(gòu)建了非結(jié)構(gòu)化地質(zhì)數(shù)據(jù)內(nèi)容提取、組織存儲、分析挖掘、應用服務較為完善的技術(shù)方法體系,建立了一條數(shù)據(jù)→信息→知識→服務→再數(shù)據(jù)的大數(shù)據(jù)鏈,以此為基礎(chǔ)實現(xiàn)的內(nèi)容存儲庫,面向典型的數(shù)據(jù)密集型問題實際,從底層的數(shù)據(jù)訪問模式開始,遵循靠近數(shù)據(jù)計算的理念,構(gòu)建大數(shù)據(jù)技術(shù)與非結(jié)構(gòu)化地質(zhì)數(shù)據(jù)信息分析挖掘的橋梁,為地質(zhì)大數(shù)據(jù)的深度分析和知識發(fā)現(xiàn)奠定了基礎(chǔ),為非結(jié)構(gòu)化數(shù)據(jù)的高效利用,大數(shù)據(jù)相關(guān)技術(shù)與地質(zhì)調(diào)查領(lǐng)域的融合、落地及應用提供助力。趙鵬大院士評價“此研究成果提出的非結(jié)構(gòu)化地質(zhì)數(shù)據(jù)的大數(shù)據(jù)模型具有較強的理論創(chuàng)新性和實用性”(魏東琦等,2021)。
西安地質(zhì)調(diào)查中心積極貫徹落實黨中央提出的“國家大數(shù)據(jù)”和“數(shù)字中國”建設(shè)綱要,積極融入國家地質(zhì)大數(shù)據(jù)與智能化發(fā)展戰(zhàn)略,助力“地質(zhì)云”建設(shè)進程,按照中國地質(zhì)調(diào)查局信息化建設(shè)總體部署,圍繞地質(zhì)云、大數(shù)據(jù)、智能化“三位一體”布局,以信息化為創(chuàng)新驅(qū)動引擎,拉動西北轄區(qū)地質(zhì)云生態(tài)圈良性發(fā)展,并助力推動地質(zhì)調(diào)查業(yè)務轉(zhuǎn)型升級。
在“地質(zhì)云”西北節(jié)點建設(shè)方面,西安地質(zhì)調(diào)查中心全力保證了“地質(zhì)云”分節(jié)點安全穩(wěn)定運行與數(shù)據(jù)信息共享服務,健全完善了地質(zhì)云西安節(jié)點國家地質(zhì)數(shù)據(jù)庫更新維護、集成共享、產(chǎn)品開發(fā)與應用服務機制。鞏固加強了“地質(zhì)云”西安節(jié)點基礎(chǔ)設(shè)施和信息安全保障體系建設(shè),參與了國家地質(zhì)大數(shù)據(jù)共享服務平臺——“地質(zhì)云3.0”建設(shè)(高振記,2022)。推動了西北地質(zhì)工作與信息化的深度融合和地質(zhì)云的應用示范,為西北地質(zhì)調(diào)查工作提供云平臺支撐與創(chuàng)新型驅(qū)動。西安地質(zhì)調(diào)查中心信息化建設(shè)緊密結(jié)合本單位承擔的重大地質(zhì)調(diào)查項目,并為西北地質(zhì)科技創(chuàng)新中心做好支撐服務。目前,已經(jīng)初步建立了西北地區(qū)多門類數(shù)據(jù)庫架構(gòu)和地球科學一張圖(山水林田湖草沙)大數(shù)據(jù)資源池,健全完善了西北地區(qū)基礎(chǔ)地質(zhì)數(shù)據(jù)庫匯聚更新機制,為地質(zhì)云西安節(jié)點提供地質(zhì)信息產(chǎn)品補充與更新,開發(fā)豐富權(quán)威地質(zhì)信息產(chǎn)品,面向社會提供便捷服務。
近年來,西安地質(zhì)調(diào)查中心通過長期的技術(shù)攻關(guān),采用面向用戶群體、面向數(shù)據(jù)資源、面向協(xié)同服務的普適架構(gòu)思想,基于開源軟件研發(fā)了具有可控知識產(chǎn)權(quán)、支持跨平臺的分布式容器化地學大數(shù)據(jù)平臺,實現(xiàn)了地質(zhì)數(shù)據(jù)加工、組網(wǎng)存儲、網(wǎng)絡(luò)發(fā)布全流程知識產(chǎn)權(quán)可控(王占昌等,2005;魏東琦等,2012,2021)。同時,堅持以創(chuàng)新引領(lǐng)地質(zhì)信息化發(fā)展,持續(xù)開展人工智能二元體基礎(chǔ)驅(qū)動、自然語言處理、領(lǐng)域知識圖譜與前端二三維可視化計算研究等工作,為地質(zhì)調(diào)查業(yè)務轉(zhuǎn)型升級提供創(chuàng)新引擎。
地質(zhì)調(diào)查信息化建設(shè)“十三五”建設(shè)時期,形成了地質(zhì)云、大數(shù)據(jù)、智能化“三位一體”總體布局,形成了以“地質(zhì)云”為核心的10大方面的重要成果,顯著提高了地質(zhì)調(diào)查解決重大資源環(huán)境問題的能力,提升了地質(zhì)信息社會化服務水平。
當前,中國各領(lǐng)域信息化已進入全面推進的快速發(fā)展新階段,國家信息化進入全面推進、快速發(fā)展的新征程,自然資源信息化邁入深入推進新階段,地質(zhì)調(diào)查工作進入轉(zhuǎn)型發(fā)展新格局,這些新的形勢要求給予地質(zhì)調(diào)查信息化強力支撐,需要信息化發(fā)揮先導作用。中國地質(zhì)調(diào)查局“十四五”地質(zhì)調(diào)查信息化規(guī)劃中明確規(guī)定:“圍繞信息化支撐、改造、引領(lǐng)新時代地質(zhì)調(diào)查事業(yè)轉(zhuǎn)型發(fā)展這一主線,按照地質(zhì)云、大數(shù)據(jù)、智能化‘三位一體’總體布局,以業(yè)務需求為導向,以數(shù)據(jù)為核心,以信息技術(shù)與業(yè)務融合為關(guān)鍵,以服務為根本目的,以信息技術(shù)創(chuàng)新為引領(lǐng),著力推進調(diào)查信息化、服務信息化和管理信息化3大應用體系建設(shè),加強地質(zhì)調(diào)查信息化與“計劃-工程-項目”業(yè)務體系的精準對接與有效銜接,全面提升地質(zhì)調(diào)查工作能力、效率和水平,以信息化帶動地質(zhì)調(diào)查現(xiàn)代化,為地質(zhì)調(diào)查轉(zhuǎn)型升級提供核心驅(qū)動?!?/p>
西安地質(zhì)調(diào)查作為西北大區(qū)中心肩負大區(qū)信息化建設(shè)的重要任務,今后的工作將堅持“業(yè)務主導、共同參與”、“四個統(tǒng)一、統(tǒng)分結(jié)合”、“創(chuàng)新驅(qū)動、科技引領(lǐng)”、“安全可控、集約利用”、“目標管理及量化考核”的基本原則,圍繞中心轉(zhuǎn)型發(fā)展的需要,按照中國地質(zhì)調(diào)查局信息化建設(shè)總體思路,以地質(zhì)礦產(chǎn)、能源、水資源環(huán)境3大重點業(yè)務領(lǐng)域的信息化建設(shè)帶動全中心信息化建設(shè)。以西北盆山系數(shù)據(jù)體系建設(shè)帶動地質(zhì)礦產(chǎn)、能源地質(zhì)、水資源環(huán)境、生態(tài)地質(zhì)等核心數(shù)據(jù)庫建設(shè),最終建立邏輯集中、物理分布、分級分類的地球科學大數(shù)據(jù)體系。以信息技術(shù)科技創(chuàng)新為引領(lǐng),加強地質(zhì)災害監(jiān)測預警、地球物理反演、三維地質(zhì)建模等方向的科技創(chuàng)新和以“泛在自然資源要素大數(shù)據(jù)服務系統(tǒng)”為代表的專業(yè)系統(tǒng)和特色信息專題服務開發(fā),推進信息技術(shù)在數(shù)字成礦帶、數(shù)字盆地、數(shù)字流域等領(lǐng)域的應用示范,推進中國版全息數(shù)字地球建設(shè)。
筆者總結(jié)分析西安地質(zhì)調(diào)查中心信息化建設(shè)過程中遇到的一些實際問題和解決問題的思路,希望能為以后的工作起到借鑒作用。雖然經(jīng)過長期不懈地努力,西安地質(zhì)調(diào)查中心地調(diào)信息化建設(shè)在基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)產(chǎn)品共享服務、地質(zhì)調(diào)查在線化與智能化等方面取得了一些重要進展,但面對新形勢、新任務和新要求,與國內(nèi)外先進地質(zhì)調(diào)查機構(gòu)相比,在管理、技術(shù)等方面均存在以下差距和不足。
(1)數(shù)據(jù)資源管理信息化程度不夠。西安地質(zhì)調(diào)查中心的各類數(shù)據(jù)主要以光盤、移動硬盤等離線方式存儲在中心資料館,這種方式不僅利用效率不高,也有一定的數(shù)據(jù)丟失風險。因此,下一步工作需建立完善地質(zhì)數(shù)據(jù)體系,梳理基礎(chǔ)數(shù)據(jù)與專業(yè)數(shù)據(jù)間的關(guān)系,構(gòu)建各專業(yè)數(shù)據(jù)之間的聯(lián)系,最終建立西北地學大數(shù)據(jù)中心,對中心各類地學數(shù)據(jù)進行統(tǒng)一管理,以盤活資源、充分挖掘數(shù)據(jù)價值,為“地質(zhì)云”西安節(jié)點建設(shè)提供數(shù)據(jù)支撐。
(2)基礎(chǔ)設(shè)施有待提升,平臺應用程度不高?!暗刭|(zhì)云”西安節(jié)點基礎(chǔ)設(shè)施建設(shè)水平有待提高,特別是并行計算能力欠缺,難以滿足地球物理數(shù)據(jù)反演、地質(zhì)過程模擬、人工智能模型訓練等業(yè)務需求?!笆奈濉逼陂g,需結(jié)合西安地質(zhì)調(diào)查中心新基地建設(shè),提升基礎(chǔ)設(shè)施服務能力,特別是并行計算能力,建立中心標準化機房。
(3)中心整體信息化應用能力不足。主要體現(xiàn)在以“地質(zhì)云”、大數(shù)據(jù)、智能化支撐地質(zhì)調(diào)查轉(zhuǎn)型升級的理念尚未普及。大部分人員信息化工具應用能力不足,對空間數(shù)據(jù)分析與知識重構(gòu)等高效的圖件編制模式應用不足,利用地、物、化、遙綜合數(shù)據(jù)進行集成分析的能力不足,地質(zhì)信息基礎(chǔ)研發(fā)人員、應用研發(fā)人員、應用人員三級梯隊尚未建立。這需要充分發(fā)揮人的主觀能動性,加強人員的核心技術(shù)創(chuàng)新能力,推動西安地質(zhì)調(diào)查中心核心信息技術(shù)工程化、產(chǎn)業(yè)化,以信息技術(shù)為手段重點解決中心核心業(yè)務工作開展中的“瓶頸”問題。
西安地質(zhì)調(diào)查信息化未來的發(fā)展將充分運用地質(zhì)云、大數(shù)據(jù)、智能化技術(shù)改變地質(zhì)調(diào)查研究與管理工作范式,推動信息化新理論、新技術(shù)、新方法,地質(zhì)工作深度融合。構(gòu)建基于知識+數(shù)據(jù)驅(qū)動的地質(zhì)調(diào)查工作新體系,形成精準高效的大區(qū)中心的數(shù)據(jù)體系格架,滿足政府部門、社會公眾、科研人員、企事業(yè)單位、國際地學合作對地質(zhì)數(shù)據(jù)信息服務的需求。秉承“地質(zhì)云”調(diào)查、管理、共享、服務的建設(shè)目標,努力形成全行業(yè)數(shù)據(jù)共享、開發(fā)利用的新格局。
(1)構(gòu)建西北大區(qū)中心的數(shù)據(jù)格架。西安地質(zhì)調(diào)查中心將圍繞“調(diào)查信息化、服務信息化、管理信息化”3大應用方向,著力推進基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)體系建設(shè)、智能應用體系建設(shè)和知識產(chǎn)品服務體系建設(shè),推進數(shù)據(jù)采集、傳輸、存儲、處理加工、評價應用、共享、服務等地質(zhì)調(diào)查主流程信息化。總體建設(shè)將以“地質(zhì)云”西安節(jié)點建設(shè)為抓手,以西北盆山系地學大數(shù)據(jù)資源池建設(shè)為核心,開展數(shù)據(jù)體系建設(shè)和應用,總體技術(shù)框架分4層:基礎(chǔ)設(shè)施層、平臺層、數(shù)據(jù)層、應用層(圖1)。
圖1 西北地球科學數(shù)據(jù)集成與服務總體框架圖Fig.1 The framework of the earth science data integration and service
基礎(chǔ)設(shè)施層:以“地質(zhì)云”西安節(jié)點已有設(shè)施為基礎(chǔ),針對業(yè)務需求,配合中國地質(zhì)調(diào)查局物理隔離業(yè)務網(wǎng)建設(shè),建立物理隔離的中心基礎(chǔ)設(shè)施體系。建設(shè)過程中,在加強網(wǎng)絡(luò)安全的同時,重點提升中心數(shù)據(jù)集成存儲能力和并行計算能力。
平臺層:平臺層主要以“地質(zhì)云”西安節(jié)點使用的華為云平臺(FusionSphere)為基礎(chǔ),對硬件環(huán)境進行虛擬化管理,形成一系列虛擬化服務器集群,包括數(shù)據(jù)服務器集群、并行計算服務器集群和網(wǎng)絡(luò)服務器集群。數(shù)據(jù)服務器、網(wǎng)絡(luò)服務器集群操作系統(tǒng)以Linux為主,并行計算服務器集群提供2種環(huán)境:Windows、Linux。在此基礎(chǔ)上,數(shù)據(jù)庫軟件計算采用PostgreSQL管理結(jié)構(gòu)化數(shù)據(jù),包括各類空間數(shù)據(jù)、關(guān)系型數(shù)據(jù)和文件索引數(shù)據(jù),采用MongoDB管理非結(jié)構(gòu)化數(shù)據(jù)。
數(shù)據(jù)層:數(shù)據(jù)層包括本底數(shù)據(jù)、專業(yè)數(shù)據(jù)、綜合數(shù)3個部分。
本底數(shù)據(jù)主要為各專業(yè)通過調(diào)查、監(jiān)測、觀測、測試等手段獲取的基礎(chǔ)性圖、表數(shù)據(jù),其以圖層為單元,由中心統(tǒng)一規(guī)劃,各業(yè)務室梳理出本專業(yè)所需的基本圖層有那些,每個圖層的命名規(guī)劃是什么,屬性結(jié)構(gòu)是什么,圖層本身的拓撲約束是什么(壓蓋、空隙等),并建立圖層符號系統(tǒng)(ArcGIS或QGIS);建設(shè)過程中,具體每個圖層參考地調(diào)局相關(guān)數(shù)據(jù)庫建庫指南建立結(jié)構(gòu)化空間數(shù)據(jù)庫;對于業(yè)務室之間有重復的圖層(如同位素),需根據(jù)相同結(jié)構(gòu)各自建設(shè),然后進行整合。
專題數(shù)據(jù)主要是針對專項需求,通過本底數(shù)據(jù)組合而形成的數(shù)據(jù)集,其以圖件為基本單位。該類數(shù)據(jù)需在中心統(tǒng)一規(guī)劃下,由各業(yè)務室梳理出本專業(yè)領(lǐng)域有什么標準圖件和文檔數(shù)據(jù),其命名規(guī)則是什么,圖件和文檔的關(guān)系是什么,形成這些圖件都需要那些基本圖層,圖外要素結(jié)構(gòu)包括那些,圖層之間的拓撲關(guān)系(兩個圖層的關(guān)系)和索引關(guān)系是什么。
綜合數(shù)據(jù)主要是指支撐政府決策、重大工程建設(shè)、生態(tài)文明建設(shè)等過程中,形成了涵蓋多專業(yè)、多種專題的綜合數(shù)據(jù)集,是由專題數(shù)據(jù)和本底數(shù)據(jù)衍生的數(shù)據(jù)。該層次數(shù)據(jù)由自然資源綜合調(diào)查處室或?qū)m棏脠F隊進行建設(shè),由本項目統(tǒng)一管理。建設(shè)過程中,需要梳理出自然資源領(lǐng)域(或?qū)m棏茫┯惺裁礃藴蕡D件和文檔數(shù)據(jù),圖件與文檔的索引關(guān)系是什么,其命名規(guī)劃是什么,都需要那些本底數(shù)據(jù)、那些專業(yè)數(shù)據(jù)集,不同圖層和數(shù)據(jù)集之間的拓撲關(guān)系和索引關(guān)系是什么。
應用層:應用層涵蓋工作內(nèi)容中服務體系建設(shè)、智能分析技術(shù)體系建設(shè)、地學數(shù)據(jù)可視化技術(shù)體系建設(shè)3部分內(nèi)容,包括專業(yè)應用和數(shù)據(jù)服務應用。專業(yè)應用主要由各業(yè)務室、各項目搭建,主要任務是在平臺上搭建業(yè)務所需的各種軟件和應用環(huán)境。數(shù)據(jù)服務應用由本項目通過提供內(nèi)部數(shù)據(jù)庫接口、WebAPI、RestAPI等形式,為中心各項目提供數(shù)據(jù)共享服務。
(2)大區(qū)與省級、境外和全國數(shù)據(jù)共享趨勢和建議。數(shù)據(jù)共享是信息化發(fā)展的趨勢,大區(qū)、省級節(jié)點的“地質(zhì)云”接入是地質(zhì)行業(yè)數(shù)據(jù)共享的主要手段,能夠推動中國地質(zhì)調(diào)查局與省級地勘單位的技術(shù)交流、數(shù)據(jù)共享,可有效形成行業(yè)合力,是實現(xiàn)地質(zhì)調(diào)查全流程信息化、智能化,是創(chuàng)新地質(zhì)調(diào)查工作新模式的重要舉措,是匯聚國家地質(zhì)調(diào)查存量數(shù)據(jù)和增量數(shù)據(jù),開發(fā)研制權(quán)威性地質(zhì)信息服務產(chǎn)品,并開展自然資源信息常態(tài)化服務的重要支撐。西安地質(zhì)調(diào)查中心積極探索構(gòu)建行業(yè)地質(zhì)大數(shù)據(jù)公益服務平臺的新思路、新方法,深入推進大區(qū)、省級、境外地勘單位的節(jié)點建設(shè)工作,為省級(陜西、甘肅、青海、寧夏、湖北、河南)地調(diào)院提供了深入細致的大數(shù)據(jù)技術(shù)咨詢與學術(shù)交流培訓,向非洲國家(巴基斯坦、盧旺達地調(diào)局)提供“地質(zhì)大數(shù)據(jù)”線上技術(shù)服務。2018年,西安地質(zhì)調(diào)查中心進行了與巴基斯坦地質(zhì)調(diào)查局地學實驗室的數(shù)據(jù)庫組網(wǎng)測試,通過在巴方網(wǎng)絡(luò)環(huán)境部署中心自主研發(fā)的GeositeServer數(shù)據(jù)服務器和上合地學研究中心地學信息服務系統(tǒng),成功實現(xiàn)了巴基斯坦地調(diào)局實驗室與西安地質(zhì)調(diào)查中心機房數(shù)據(jù)庫的對接,實現(xiàn)了數(shù)據(jù)交互訪問,為后期跨國組網(wǎng)數(shù)據(jù)共享體系建設(shè)提供了經(jīng)驗。
可以預見,伴隨著信息化技術(shù)的不斷進步,地質(zhì)工作信息化程度的不斷提高,地質(zhì)調(diào)查全行業(yè)的數(shù)據(jù)共享程度將得到前所未有的提升。依托“地質(zhì)云”這一基于分布式混合云架構(gòu)的軟件平臺,能夠更為便捷的實現(xiàn)數(shù)據(jù)共享、推進更廣泛的信息服務、提升地質(zhì)調(diào)查工作水平,將地質(zhì)大數(shù)據(jù)納入為國家大數(shù)據(jù)的重要組成部分,有力地支撐自然資源綜合管理,更廣泛地服務于國民經(jīng)濟和社會發(fā)展。
致謝:本文在成文過程中審稿專家提供的有益建議,在此表示感謝。謹以此文慶祝中國地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心成立60周年。