宋 越,左群超,牛海波,梁國(guó)玲,戴愛德,李建國(guó),周 萌
(1.中國(guó)地質(zhì)大學(xué)(武漢)國(guó)家地理信息系統(tǒng)工程技術(shù)研究中心,湖北 武漢430074;2.中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心,北京 100037;3.國(guó)土資源部地質(zhì)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100037;4.中國(guó)國(guó)土資源航空物探遙感中心,北京 100083;5.中國(guó)地質(zhì)科學(xué)院水文地質(zhì)環(huán)境地質(zhì)研究所,河北 石家莊 050061;6.中國(guó)地質(zhì)科學(xué)院,北京 100037;7.中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)院,北京 100081)
國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成基本技術(shù)框架
宋越1,2,3,左群超2,牛海波4,梁國(guó)玲5,戴愛德6,李建國(guó)4,周萌7
(1.中國(guó)地質(zhì)大學(xué)(武漢)國(guó)家地理信息系統(tǒng)工程技術(shù)研究中心,湖北 武漢430074;2.中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心,北京 100037;3.國(guó)土資源部地質(zhì)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100037;4.中國(guó)國(guó)土資源航空物探遙感中心,北京 100083;5.中國(guó)地質(zhì)科學(xué)院水文地質(zhì)環(huán)境地質(zhì)研究所,河北 石家莊 050061;6.中國(guó)地質(zhì)科學(xué)院,北京 100037;7.中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)院,北京 100081)
摘要:國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)包括區(qū)域地質(zhì)、地球物理、地球化學(xué)、遙感影像、地質(zhì)鉆孔、區(qū)域海洋、水工環(huán)、礦產(chǎn)資源等數(shù)據(jù),這些數(shù)據(jù)由于物理分散、建庫(kù)標(biāo)準(zhǔn)不同、過于依賴業(yè)務(wù)系統(tǒng)等原因,難以滿足社會(huì)大眾、專業(yè)機(jī)構(gòu)、管理人員等各類用戶需求。為了提高國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)的共享與服務(wù),經(jīng)過深入分析、實(shí)驗(yàn)、綜合研究,提出了基于元數(shù)據(jù)、數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、GIS、網(wǎng)絡(luò)、Web等技術(shù)的、物理分布邏輯集中的國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成技術(shù)框架。
關(guān)鍵詞:地質(zhì)數(shù)據(jù)庫(kù);整合集成;技術(shù)框架
國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)是反映國(guó)家地質(zhì)礦產(chǎn)資源、水文環(huán)境資源、航空物探遙感資源等的現(xiàn)狀、利用、規(guī)劃的主要載體,是地質(zhì)調(diào)查信息化建設(shè)的基礎(chǔ),是地質(zhì)調(diào)查業(yè)務(wù)的核心體現(xiàn),包括區(qū)域地質(zhì)、地球物理、地球化學(xué)、遙感影像、地質(zhì)鉆孔、區(qū)域海洋、水工環(huán)、礦產(chǎn)資源等數(shù)據(jù),具有重要作用[1-2]。
通過多年的基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)建設(shè)工作,中國(guó)地質(zhì)調(diào)查局系統(tǒng)及相關(guān)單位已積累了大量的全國(guó)規(guī)模的基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)資源,國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)體系已基本形成。如何讓國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)資源“看得見、可獲取、用得起、可持續(xù)”、服務(wù)于擁有不同需求、多層次的用戶群,是一個(gè)非常重要、異常困難、又必須亟待解決的問題。
為了提高國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)的共享與服務(wù),滿足各類用戶需求,筆者依托《國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成》項(xiàng)目,組織中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心、中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)院、中國(guó)地質(zhì)科學(xué)院、中國(guó)地質(zhì)科學(xué)院水文地質(zhì)環(huán)境地質(zhì)研究所、中國(guó)國(guó)土資源航空物探遙感中心等單位,分別對(duì)各自所建的部分基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)資源現(xiàn)狀進(jìn)行了系統(tǒng)地調(diào)研,在現(xiàn)狀調(diào)研結(jié)果并總結(jié)存在問題的基礎(chǔ)上,結(jié)合現(xiàn)實(shí)情況和應(yīng)用需求,經(jīng)過深入分析、實(shí)驗(yàn)、綜合研究,提出了基于元數(shù)據(jù)、數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、GIS、網(wǎng)絡(luò)、Web等技術(shù)的、物理分布邏輯集中的國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成技術(shù)框架。
1現(xiàn)狀及問題
1.1數(shù)據(jù)異質(zhì)異構(gòu)情況為綜合利用帶來(lái)困難
數(shù)據(jù)異質(zhì)異構(gòu)情況主要表現(xiàn)為每個(gè)數(shù)據(jù)庫(kù)都使用自己特定的數(shù)據(jù)庫(kù)服務(wù)系統(tǒng)、數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)格式、數(shù)據(jù)語(yǔ)義、應(yīng)用系統(tǒng)(含管理功能),造成綜合使用多類數(shù)據(jù)庫(kù)的數(shù)據(jù)時(shí)相當(dāng)困難。
根據(jù)調(diào)研,這些數(shù)據(jù)庫(kù)的形式采用“數(shù)據(jù)庫(kù)”或“數(shù)據(jù)庫(kù)+一般文件”的方式,空間數(shù)據(jù)的生產(chǎn)基本采用MapGIS或ArcGIS數(shù)據(jù)格式,屬性數(shù)據(jù)管理包括如下一些軟件:Oracle、SQLSevrer、Access MDB、Excel、Word、PDF等。另外,即使是相同的數(shù)據(jù)生產(chǎn)管理軟件,由于數(shù)據(jù)生產(chǎn)時(shí)的人員不同,同一類數(shù)據(jù)在數(shù)據(jù)分層、屬性表結(jié)構(gòu)等方面也會(huì)有所不同。
1.2數(shù)據(jù)依賴于業(yè)務(wù)系統(tǒng),不利于數(shù)據(jù)管理與利用
諸多基礎(chǔ)數(shù)據(jù)庫(kù)或數(shù)據(jù)資源處于一個(gè)數(shù)據(jù)庫(kù)綁定一個(gè)數(shù)據(jù)應(yīng)用系統(tǒng)(含管理功能)、自成體系封閉,不利于數(shù)據(jù)綜合管理與應(yīng)用、不利于提供數(shù)據(jù)共享服務(wù)。
數(shù)據(jù)庫(kù)或數(shù)據(jù)資源管理與應(yīng)用捆在一起,違反了數(shù)據(jù)庫(kù)本身應(yīng)相對(duì)獨(dú)立于具體業(yè)務(wù)應(yīng)用的基本原則,造成了數(shù)據(jù)庫(kù)管理系統(tǒng)或應(yīng)用系統(tǒng)功能定位、層次不清。如,一個(gè)特定的數(shù)據(jù)管理系統(tǒng),從數(shù)據(jù)的錄入建庫(kù)到數(shù)據(jù)的專業(yè)和綜合應(yīng)用集于一身,追求軟件系統(tǒng)大而全,不利于軟件系統(tǒng)的維護(hù)、升級(jí)。
數(shù)據(jù)本身與數(shù)據(jù)展現(xiàn)之間的關(guān)系,沒有處理好,導(dǎo)致數(shù)據(jù)本身及其相關(guān)數(shù)據(jù)產(chǎn)品,被某一軟件廠商的軟件系統(tǒng)“套牢”,直接影響數(shù)據(jù)庫(kù)可持續(xù)維護(hù)、升級(jí)管理、數(shù)據(jù)交換。
1.3建庫(kù)技術(shù)標(biāo)準(zhǔn)不統(tǒng)一,不同種類數(shù)據(jù)難以集成與共享
因若干已建設(shè)的數(shù)據(jù)庫(kù)或數(shù)據(jù)資源,是各個(gè)歷史時(shí)期的成果,執(zhí)行各自的規(guī)范。為了共享需要重新整理,其工作量不僅巨大,也不是決問題之道。
沒有統(tǒng)一的數(shù)據(jù)模型及編碼體系,嚴(yán)重影響地質(zhì)調(diào)查數(shù)據(jù)一體化組織管理、互操作、數(shù)據(jù)交換、數(shù)據(jù)共享。
各單位所建的數(shù)據(jù)庫(kù)或數(shù)據(jù)資源,雖然能較好地服務(wù)于本單位、局部群體、或本行業(yè),但從更廣、更高的層面而言,基本上屬于“信息孤島”或“體內(nèi)循環(huán)”,沒有充分發(fā)揮已積累的數(shù)據(jù)資源或數(shù)據(jù)產(chǎn)品應(yīng)有的共享價(jià)值。
1.4缺乏數(shù)據(jù)庫(kù)應(yīng)用與維護(hù)專業(yè)人員
不少基礎(chǔ)數(shù)據(jù)庫(kù)或數(shù)據(jù)資源屬于項(xiàng)目數(shù)據(jù)庫(kù),項(xiàng)目工作一旦結(jié)束或項(xiàng)目組一旦解散,數(shù)據(jù)庫(kù)維護(hù)工作即刻終止。若不再額外安排數(shù)據(jù)庫(kù)維護(hù)項(xiàng)目,則項(xiàng)目數(shù)據(jù)庫(kù)即成為“死”庫(kù)。數(shù)據(jù)庫(kù)建庫(kù)必備的技術(shù)文檔資料不完備,不利于持續(xù)維護(hù)更新。
諸多數(shù)據(jù)庫(kù)或數(shù)據(jù)資源所建單位或部門,提供數(shù)據(jù)服務(wù)較單一,較多的服務(wù)是提供原始數(shù)據(jù)、專題數(shù)據(jù),綜合的、深加工的數(shù)據(jù)產(chǎn)品很少。
2技術(shù)框架
2.1目標(biāo)定位
立足于需求并結(jié)合數(shù)據(jù)庫(kù)資源現(xiàn)狀與存在問題分析,在框架設(shè)計(jì)之初,確定了以下四方面基本目標(biāo)要求。
基于滿足不同用戶群或不同層次用戶的需求,進(jìn)行功能設(shè)計(jì)。根據(jù)數(shù)據(jù)資源或數(shù)據(jù)產(chǎn)品使用權(quán)限及保密規(guī)定,面向社會(huì)大眾:提供科普類的地質(zhì)成果宣傳資料;面向地質(zhì)專業(yè)科研機(jī)構(gòu):提供各類地質(zhì)專業(yè)數(shù)據(jù)的綜合查詢、統(tǒng)計(jì)分析等;面向地質(zhì)專業(yè)管理人員:除提供數(shù)據(jù)查看、統(tǒng)計(jì)分析外,還提供數(shù)據(jù)采集、修改、維護(hù)等功能。
基于伸縮良好的元數(shù)據(jù)規(guī)范,對(duì)分散系統(tǒng)中的異構(gòu)數(shù)據(jù)集進(jìn)行整合,對(duì)集中的元數(shù)據(jù)信息進(jìn)行統(tǒng)一管理,并為用戶提供單一入口查詢的整合方案。在保持?jǐn)?shù)據(jù)一致性同時(shí),提供良好的可擴(kuò)展性[3-4]。
基于統(tǒng)一的平臺(tái)框架,構(gòu)建物理分布、邏輯集中的國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)整合與集成數(shù)據(jù)庫(kù)及系統(tǒng)。維持原基礎(chǔ)數(shù)據(jù)庫(kù)或數(shù)據(jù)資源的自治、分散、歸屬現(xiàn)狀,遵循“誰(shuí)建庫(kù)誰(shuí)維護(hù)誰(shuí)服務(wù)”的原則,保持?jǐn)?shù)據(jù)庫(kù)或數(shù)據(jù)資源的采集、管理、維護(hù)、更新的專業(yè)性、權(quán)威性和真實(shí)性。
基于已存在的數(shù)據(jù)庫(kù)或數(shù)據(jù)資源實(shí)際情況,研究制定整合與集成相關(guān)技術(shù)要求。明確甄別已存在數(shù)據(jù)庫(kù)或數(shù)據(jù)資源是否需要整改的程度或狀況,即:哪些數(shù)據(jù)資源必須通過完全改造、哪些數(shù)據(jù)資源必須通過部分的整理,哪些數(shù)據(jù)資源不需要作任何整理,哪些數(shù)據(jù)資源只是依據(jù)整合與集成相關(guān)技術(shù)要求完善現(xiàn)有數(shù)據(jù)庫(kù)管理系統(tǒng),方能邏輯集成到國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)內(nèi)。有計(jì)劃、分階段開展國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成工作。
2.2框架設(shè)計(jì)
依據(jù)基礎(chǔ)數(shù)據(jù)資源集成整合總體目標(biāo)和基本原則,通過深入綜合研究提出了國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)整合集成基本技術(shù)框架。該整合集成基本框架,總體上分四個(gè)層次:①地質(zhì)數(shù)據(jù)資源層;②普通元數(shù)據(jù)層;③地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)及倉(cāng)庫(kù)元數(shù)據(jù)層;④地質(zhì)數(shù)據(jù)及數(shù)據(jù)產(chǎn)品應(yīng)用層。四個(gè)層次之間,除了依賴相關(guān)硬件、軟件、網(wǎng)絡(luò)、協(xié)議、接口建立聯(lián)系之外,最重要的聯(lián)系就是元數(shù)據(jù)標(biāo)準(zhǔn)和元數(shù)據(jù)本身[5-7]。見圖1。
圖1 國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成基本技術(shù)框架
2.2.1地質(zhì)數(shù)據(jù)資源層
地質(zhì)數(shù)據(jù)資源層,是由已存在的若干地質(zhì)數(shù)據(jù)庫(kù)資源集合組成,分別按所建地質(zhì)數(shù)據(jù)庫(kù)資源的單位或機(jī)構(gòu)進(jìn)行物理分布組織,即數(shù)據(jù)資源原來(lái)歸屬在哪個(gè)單位或機(jī)構(gòu),現(xiàn)在還應(yīng)在哪個(gè)單位或機(jī)構(gòu),保持歸屬不變。在國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成基本框架中,地質(zhì)數(shù)據(jù)資源層主要提供元數(shù)據(jù)(原始數(shù)據(jù)集元數(shù)據(jù)、專題數(shù)據(jù)產(chǎn)品元數(shù)據(jù))和地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)所需的相關(guān)主題的、綜合的、不同時(shí)段的數(shù)據(jù)。
2.2.2普通元數(shù)據(jù)層
物理分布的各單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集及相關(guān)管理系統(tǒng),應(yīng)按國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成系統(tǒng)元數(shù)據(jù)規(guī)范和技術(shù)要求,提供所建的數(shù)據(jù)庫(kù)集內(nèi)所有原始數(shù)據(jù)集和數(shù)據(jù)產(chǎn)品的元數(shù)據(jù)目錄及元數(shù)據(jù)本身,作為國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成基本框架的“地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)及倉(cāng)庫(kù)元數(shù)據(jù)層”中“倉(cāng)庫(kù)元數(shù)據(jù)”的數(shù)據(jù)元數(shù)據(jù)的引用部分,用以指示如何查詢、瀏覽、獲取、提取、或使用數(shù)據(jù)集或?qū)n}數(shù)據(jù)產(chǎn)品。普通元數(shù)據(jù)層由各單位或機(jī)構(gòu)數(shù)據(jù)庫(kù)資源元數(shù)據(jù)及元數(shù)據(jù)服務(wù)器構(gòu)成。
2.2.3地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)及倉(cāng)庫(kù)元數(shù)據(jù)層
數(shù)據(jù)倉(cāng)庫(kù)不同于已經(jīng)建好的操作型數(shù)據(jù)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過程的、面向主題的、集成的、穩(wěn)定的、隨時(shí)間不斷變化的數(shù)據(jù)集合。數(shù)據(jù)倉(cāng)庫(kù)從多個(gè)分布的、自治的、異質(zhì)的數(shù)據(jù)源獲取原始數(shù)據(jù),經(jīng)過加工處理,存放在數(shù)據(jù)倉(cāng)庫(kù)中,再通過數(shù)據(jù)倉(cāng)庫(kù)的訪問工具,向數(shù)據(jù)倉(cāng)庫(kù)的用戶提供統(tǒng)一、協(xié)調(diào)和集成的信息環(huán)境,支持決策過程和深入綜合分析。
在國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)整合集成基本技術(shù)框架中,地質(zhì)數(shù)據(jù)資源層涵蓋的各單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集及相關(guān)管理系統(tǒng)屬于操作型數(shù)據(jù)庫(kù)系統(tǒng),是國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)整合集成基本框架中地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源。地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)內(nèi)容主要包括兩部分,即:①按主題綜合數(shù)據(jù)或綜合程度較高的數(shù)據(jù)產(chǎn)品;②地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)。
按主題綜合數(shù)據(jù)或綜合程度較高的數(shù)據(jù)產(chǎn)品之綜合程度,是單個(gè)單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集及相關(guān)管理系統(tǒng)無(wú)法做到的。它是面向主題的,是在較高層次上的數(shù)據(jù)歸類、抽象與綜合。它是集成的,是從原有的分散的數(shù)據(jù)庫(kù)數(shù)據(jù)中抽取出來(lái)的,在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,經(jīng)過加工與集成過的。它是穩(wěn)定的,操作型數(shù)據(jù)庫(kù)中數(shù)據(jù)保留較短的一段時(shí)間,主要用于日常的事務(wù)處理,在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)反映的是一段相當(dāng)長(zhǎng)的時(shí)間內(nèi)的歷史數(shù)據(jù)內(nèi)容,是穩(wěn)定的、不可更新的,主要供決策人員分析之用。它是隨時(shí)間變化的,數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷增加新的數(shù)據(jù),刪去舊的數(shù)據(jù),同時(shí)它包含大量的跟時(shí)間有關(guān)的綜合數(shù)據(jù),隨時(shí)間的變化不斷地進(jìn)行重新綜合。它是支持管理決策的,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)用于高層領(lǐng)導(dǎo)或權(quán)威專家做決策之用。
地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù),依據(jù)用途分為普通元數(shù)據(jù)和綜合元數(shù)據(jù)兩類。普通元數(shù)據(jù)是關(guān)于各單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集及相關(guān)管理系統(tǒng)內(nèi)原始數(shù)據(jù)集、單一專題數(shù)據(jù)產(chǎn)品的描述;綜合元數(shù)據(jù)是關(guān)于地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)從各單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集中抽取、歸類與抽象、綜合的數(shù)據(jù)產(chǎn)品的描述。
在國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)整合集成基本技術(shù)框架中,地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)具有要作用:第一,它指示地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)如何從多個(gè)單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集(物理分布的)中提取出數(shù)據(jù)種類、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)格式等方面不同的地質(zhì)空間數(shù)據(jù);第二,它指示終端用戶、客戶端、或應(yīng)用系統(tǒng)如何從地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)中提取出標(biāo)準(zhǔn)的集成的地質(zhì)空間數(shù)據(jù),為用戶提供地質(zhì)空間數(shù)字產(chǎn)品服務(wù)。
地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)及倉(cāng)庫(kù)元數(shù)據(jù)層,主要由地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)、地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)庫(kù)、地質(zhì)數(shù)據(jù)及數(shù)據(jù)產(chǎn)品元數(shù)據(jù)管理系統(tǒng)、地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用服務(wù)系統(tǒng)、以及多源數(shù)據(jù)抽取、多源數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)產(chǎn)品服務(wù)、數(shù)據(jù)格式交換等相關(guān)服務(wù)模塊構(gòu)成。
2.2.4地質(zhì)數(shù)據(jù)及數(shù)據(jù)產(chǎn)品應(yīng)用層
在地質(zhì)數(shù)據(jù)及數(shù)據(jù)產(chǎn)品應(yīng)用層中,地質(zhì)數(shù)據(jù)及數(shù)據(jù)產(chǎn)品有兩個(gè)來(lái)源:①源于各單位或機(jī)構(gòu)所建的、物理分布的數(shù)據(jù)庫(kù)集及相關(guān)管理系統(tǒng)。主要是原始數(shù)據(jù)、單一專題數(shù)據(jù)產(chǎn)品;②源于地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)中從物理分布數(shù)據(jù)庫(kù)集抽取的、按主題綜合的數(shù)據(jù)產(chǎn)品。
地質(zhì)數(shù)據(jù)及數(shù)據(jù)產(chǎn)品應(yīng)用層,由終端用戶(普通用戶;一般專業(yè)用戶;高級(jí)專業(yè)用戶及管理者)、客戶端(應(yīng)用系統(tǒng)1、應(yīng)用系統(tǒng)2、…、應(yīng)用系統(tǒng)n)、WEB瀏覽器;分C/S、B/S兩種技術(shù)架構(gòu);依據(jù)數(shù)據(jù)保密要求和相關(guān)規(guī)定,分內(nèi)網(wǎng)或?qū)>W(wǎng)、外網(wǎng)服務(wù)模式。
終端用戶,可以利用客戶端或WEB瀏覽器,查詢、瀏覽地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)中倉(cāng)庫(kù)元數(shù)據(jù)目錄及元數(shù)據(jù)本身,利用元數(shù)據(jù)描述的地質(zhì)數(shù)據(jù)集及數(shù)據(jù)產(chǎn)品(單一專題的、綜合主題的)的內(nèi)容、質(zhì)量、狀態(tài)等其他特性信息(地質(zhì)空間元數(shù)據(jù)包括:①空間數(shù)據(jù)標(biāo)識(shí)信息;②空間數(shù)據(jù)區(qū)域范圍信息;③空間數(shù)據(jù)鄰接信息;④空間數(shù)據(jù)表示信息;⑤空間數(shù)據(jù)數(shù)學(xué)基礎(chǔ)信息;⑥空間數(shù)據(jù)集內(nèi)容信息;⑦空間數(shù)據(jù)質(zhì)量信息;⑧空間數(shù)據(jù)分發(fā)信息;⑨空間數(shù)據(jù)安全信息;⑩空間數(shù)據(jù)聯(lián)系信息;10)空間數(shù)據(jù)時(shí)間信息),用戶可以弄明白諸如:“需要的數(shù)據(jù)在哪里?”、“這些數(shù)據(jù)集質(zhì)量如何?”以及數(shù)據(jù)覆蓋范圍、源空間數(shù)據(jù)地圖的投影方式、數(shù)據(jù)生產(chǎn)日期、數(shù)據(jù)的變動(dòng)、數(shù)據(jù)的精度等一系列問題,由此可確定該數(shù)據(jù)是否符合自己的需求。
客戶端(應(yīng)用系統(tǒng))、WEB瀏覽器等軟件,利用地質(zhì)數(shù)據(jù)集及數(shù)據(jù)產(chǎn)品元數(shù)據(jù)信息,可以檢索、獲取、提出、轉(zhuǎn)換、處理所需的地質(zhì)數(shù)據(jù)集或數(shù)據(jù)產(chǎn)品,依據(jù)元數(shù)據(jù)類別(普通元數(shù)據(jù)或綜合元數(shù)據(jù)),通過地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),可以從指定某單位或機(jī)構(gòu)所建的數(shù)據(jù)庫(kù)集中訪問原始數(shù)據(jù)集或單一專題數(shù)據(jù)產(chǎn)品或從地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)中訪問高度綜合的數(shù)據(jù)產(chǎn)品。
2.3關(guān)鍵技術(shù)
建立基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成基本框架,賴以實(shí)現(xiàn)的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、GIS、網(wǎng)絡(luò)、WEB等相關(guān)技術(shù)已是成熟技術(shù),真正需要突破的關(guān)鍵技術(shù)有如下幾個(gè)方面。
2.3.1地質(zhì)數(shù)據(jù)集及數(shù)據(jù)產(chǎn)品分類分級(jí)體系
為了便于對(duì)地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)進(jìn)行明確描述,須尋求粒度適應(yīng)范圍廣、更形式化、領(lǐng)域共享強(qiáng)的分類分級(jí)體系,較合適的分類分級(jí)體系是采用地質(zhì)領(lǐng)域本體成果,基于地質(zhì)領(lǐng)域本體分類分級(jí)、語(yǔ)義以及編碼體系,再結(jié)合元數(shù)據(jù)描述技術(shù),對(duì)國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成系統(tǒng)內(nèi)邏輯集成的各類地質(zhì)數(shù)據(jù)集及數(shù)據(jù)產(chǎn)品進(jìn)行描述,實(shí)現(xiàn)共享。
2.3.2地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)框架
地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)由十一類基本信息組成,見圖2。
圖2 地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)框架
地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)按層狀結(jié)構(gòu)進(jìn)行組織,由元素和復(fù)合元素子集組成。元素是元數(shù)據(jù)最基本的信息單元,復(fù)合元素由多個(gè)不同的元素組合而成,一個(gè)信息單元內(nèi)容包括元素編號(hào)、名稱、定義、數(shù)據(jù)類型和域值,見圖3。
圖3 地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)組織結(jié)構(gòu)
2.3.3地質(zhì)空間數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型及數(shù)據(jù)抽取技術(shù)
地質(zhì)空間數(shù)據(jù)倉(cāng)庫(kù)主要內(nèi)容包括按一定主題從多種數(shù)據(jù)源種抽取的綜合數(shù)據(jù)、數(shù)據(jù)產(chǎn)品(綜合的、單一的)元數(shù)據(jù)、數(shù)據(jù)元數(shù)據(jù)等,因此,地質(zhì)空間數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型的相關(guān)內(nèi)容,主要描述綜合主題數(shù)據(jù)、數(shù)據(jù)產(chǎn)品(綜合的、單一的)元數(shù)據(jù)、數(shù)據(jù)元數(shù)據(jù)等信息,物理分布的數(shù)據(jù)源按一定權(quán)限、程序、法規(guī)等許可向地質(zhì)空間數(shù)據(jù)倉(cāng)庫(kù)提供相應(yīng)數(shù)據(jù)等信息。
3實(shí)驗(yàn)結(jié)果
根據(jù)中國(guó)地質(zhì)調(diào)查局總體安排,筆者依托《國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成》項(xiàng)目,組織中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心、中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)院、中國(guó)地質(zhì)科學(xué)院、中國(guó)地質(zhì)科學(xué)院水文地質(zhì)環(huán)境地質(zhì)研究所、中國(guó)國(guó)土資源航空物探遙感中心等單位,開展了11種地質(zhì)調(diào)查數(shù)據(jù)庫(kù)資源、11種環(huán)境地質(zhì)數(shù)據(jù)庫(kù)資源、12種地質(zhì)科學(xué)數(shù)據(jù)庫(kù)資源、9種水文地質(zhì)數(shù)據(jù)庫(kù)資源、10種航空物探遙感地質(zhì)數(shù)據(jù)庫(kù)資源,匯總了53種數(shù)據(jù)庫(kù)資源現(xiàn)狀調(diào)研成果。在此基礎(chǔ)上,按照基礎(chǔ)地質(zhì)數(shù)據(jù)整合集成總體框架,各相關(guān)單位編制了地質(zhì)調(diào)查、環(huán)境地質(zhì)、地質(zhì)科學(xué)、水文地質(zhì)、航空物探遙感等各類數(shù)據(jù)資源整合集成研究報(bào)告。在此基礎(chǔ)上,初步建立了基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成子系統(tǒng),各子系統(tǒng)互連形成物理分布邏輯集中的國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成系統(tǒng)技術(shù)原型。
各單位所建的這些數(shù)據(jù)庫(kù)集成及相關(guān)管理系統(tǒng),除了服務(wù)于本單位或本部門外,需要向國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合集成基本框架提供元數(shù)據(jù)(包括原始數(shù)據(jù)集元數(shù)據(jù)、專題數(shù)據(jù)產(chǎn)品元數(shù)據(jù))和地質(zhì)數(shù)據(jù)倉(cāng)庫(kù)所需的相關(guān)專題的、綜合的、不同時(shí)段的數(shù)據(jù)。另外,地質(zhì)數(shù)據(jù)資源所屬各單位或機(jī)構(gòu),仍按相關(guān)數(shù)據(jù)庫(kù)集的采集、收集、整理、維護(hù)、加工等既定的技術(shù)要求和管理規(guī)定,繼續(xù)更新、維護(hù)、管理本單位或機(jī)構(gòu)擁有的地質(zhì)數(shù)據(jù)庫(kù)資源。
以環(huán)境地質(zhì)數(shù)據(jù)整合與集成服務(wù)平臺(tái)為例,見圖4。地質(zhì)環(huán)境信息服務(wù)平臺(tái)是一個(gè)分布式跨專業(yè)、跨地域的集成平臺(tái),是以各個(gè)專業(yè)、各個(gè)地質(zhì)環(huán)境工作機(jī)構(gòu)為依托的規(guī)模各異的信息平臺(tái)節(jié)點(diǎn)構(gòu)成。平臺(tái)框架是由中心平臺(tái)和一系列專業(yè)平臺(tái)及各地的平臺(tái)節(jié)點(diǎn)構(gòu)成。根據(jù)現(xiàn)有開展地質(zhì)環(huán)境工作的機(jī)構(gòu)設(shè)置(主要包括中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)院、局屬地質(zhì)環(huán)境專業(yè)中心、各省級(jí)地質(zhì)環(huán)境監(jiān)測(cè)院或總站等),信息服務(wù)平臺(tái)按照其職能、地域分布來(lái)部署,形成一個(gè)覆蓋全國(guó)、跨專業(yè)的互相連接的信息網(wǎng)站服務(wù)節(jié)點(diǎn)群。平臺(tái)以基于服務(wù)的管理、目錄服務(wù)和框架系統(tǒng)等為核心,圍繞基于地圖和動(dòng)態(tài)數(shù)據(jù)可視化等內(nèi)容進(jìn)行服務(wù)開發(fā)、封裝和部署。形成一套緊密結(jié)合的節(jié)點(diǎn)系統(tǒng)。各個(gè)子結(jié)點(diǎn)通過服務(wù)管理功能進(jìn)行任務(wù)分配、調(diào)度和協(xié)同工作,最終構(gòu)成具有松散耦合特征的分布式部署的節(jié)點(diǎn)集合和服務(wù)群體。
圖4 環(huán)境地質(zhì)數(shù)據(jù)整合與集成服務(wù)平臺(tái)體系結(jié)構(gòu)
4結(jié)語(yǔ)
本文在調(diào)研相關(guān)單位地質(zhì)基礎(chǔ)數(shù)據(jù)建設(shè)現(xiàn)狀的基礎(chǔ)上,提出了基于元數(shù)據(jù)、數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、GIS、網(wǎng)絡(luò)、Web等技術(shù)的、物理分布邏輯集中的國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成技術(shù)框架,研究并提出了關(guān)鍵方法技術(shù)。本文所提出的技術(shù)框架及關(guān)鍵方法技術(shù)只是一個(gè)初步,還有待于深化研究、有計(jì)劃、分階段開展相關(guān)工作。
筆者建議進(jìn)一步調(diào)研國(guó)家地質(zhì)數(shù)據(jù)資源積累與動(dòng)態(tài)更新工作方法與機(jī)制,更新完善國(guó)家地質(zhì)數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)規(guī)范,特別是在當(dāng)前信息技術(shù)高速發(fā)展的情況下,研究大數(shù)據(jù)及云計(jì)算等相關(guān)技術(shù)在基礎(chǔ)地質(zhì)數(shù)據(jù)整合與集成中的應(yīng)用,為整合集成工作提供新的思路和方法。
參考文獻(xiàn)
[1]李勝?gòu)?qiáng).國(guó)土資源基礎(chǔ)數(shù)據(jù)庫(kù)整合與集成建庫(kù)模式與實(shí)現(xiàn)[J].國(guó)土資源信息化,2005(3):9-14.
[2]張翠光,馮艷芳,侯榮玖.關(guān)于制定國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)采集、更新與發(fā)布管理辦法的初步研究[J].國(guó)土資源情報(bào),2009(2):14-17.
[3]顧巧祥,祁國(guó)寧,紀(jì)楊建,等.基于元數(shù)據(jù)的產(chǎn)品數(shù)據(jù)本體建模技術(shù)[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2007,41(5):736-741.
[4]張宇,蔣東興,劉啟新.基于元數(shù)據(jù)的異構(gòu)數(shù)據(jù)集整合方案[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2009,49(7):1037-1040.
[5]陳偉清,劉彥花.城市規(guī)劃多源數(shù)據(jù)整合與數(shù)據(jù)庫(kù)建設(shè)[J].廣西大學(xué)學(xué)報(bào):自然科學(xué)版,2009,34(1):106-110.
[6]張鳴之,王勇.國(guó)家級(jí)地質(zhì)環(huán)境數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)[J].地球科學(xué):中國(guó)地質(zhì)大學(xué)學(xué)報(bào),2013,38(6):1347-1355.
[7]刁明光,薛濤,李建存,等.基于地質(zhì)信息元數(shù)據(jù)標(biāo)準(zhǔn)的多源空間數(shù)據(jù)管理系統(tǒng)[J].國(guó)土資源遙感,2013,25(1):165-170.
Basic technical framework of national basic geological database integration
SONG Yue1,2,3,ZUO Qun-chao2,NIU Hai-bo4,LIANG Guo-ling5,DAI Ai-de6,LI Jian-guo4,ZHOU Meng7
(1.National Engineering Research Center for Geographic Information System,China University of Geosciences(Wuhan),Wuhan 430074,China;2.Development & Research Center,China Geological Survey,Beijing 100037,China;3.Key Laboratory of Geological Information Technology,Ministry of Land and Resources,Beijing 100037,China;4.China Aero Geophysical Survey & Remote Sensing Center for Land and Resources,Beijing 100083,China;5.Institute of Hydrogeology and Environmental Geology,Chinese Academy of Geological Sciences,Shijiazhuang 050061,China;6.Chinese Academy of Geological Sciences,Beijing 100037,China;7.China Institute of Geological Environment Monitoring,Beijing 100081,China)
Abstract:National basic geological data,including all kinds of basic geological data,such as areal geology,geophysics,geochemistry,remote sensing image,geological drilling,regional ocean,hydrogeology,mineral resources.Due to the physical dispersion,different database standards,too dependent on the business system and other reasons,these data are difficult to meet the demand for public,professional organizations,and managers.In order to improve the national basic geological data sharing and service,during in-depth analysis,experiment,and synthesis,based on the technology of metadata,database,data warehouse,GIS,Internet and web technology,the paper proposed basic technical framework of national basic geological database integration with physical distribution and logical collection.
Key words:geological database;integration;technology framework
收稿日期:2016-01-07
基金項(xiàng)目:中國(guó)地質(zhì)調(diào)查局“國(guó)家基礎(chǔ)地質(zhì)數(shù)據(jù)庫(kù)整合與集成”項(xiàng)目資助(1212010815001)
作者簡(jiǎn)介:宋越(1984-),女,碩士,工程師,主要從事計(jì)算機(jī)軟件、GIS應(yīng)用等方面的研究。E-mail:syue@mail.cgs.gov.cn。 通訊作者:左群超(1964-),男,碩士,教授級(jí)高級(jí)工程師,研究方向?yàn)榈V產(chǎn)資源潛力評(píng)價(jià)、地質(zhì)空間數(shù)據(jù)整合與集成、計(jì)算機(jī)應(yīng)用軟件研發(fā)或平臺(tái)設(shè)計(jì)。E-mail:zuoqc163@163.com。
中圖分類號(hào):TP311.52;P628.4
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4051(2016)06-0154-06