馮 鈞,唐志賢,朱躍龍,韋 冕,卞一路,史涯晴2,
((1.河海大學(xué),江蘇 南京 210098;2.解放軍理工大學(xué),江蘇 南京 210007)
水利信息資源是指由水利部門或者為水利部門采集、加工、處理的信息資源[1]。這些海量的水利信息資源分散地存儲在全國各級水利機構(gòu)與涉水科研院所等單位,存在著存儲分散、格式與標(biāo)準(zhǔn)不統(tǒng)一等問題。信息資源目錄服務(wù)體系能夠?qū)崿F(xiàn)資源的“發(fā)布-發(fā)現(xiàn)-訪問”,被普遍認(rèn)為是實現(xiàn)分布式信息資源統(tǒng)一管理和高效共享的基礎(chǔ)。通過建設(shè)水利信息資源目錄體系能夠提高信息資源的利用率,為水利科學(xué)研究和政府的水利管理提供支持。
水利信息資源涵蓋了水文、水資源、水環(huán)境、水旱災(zāi)害、節(jié)水灌溉、水土保持、水利工程等各分支學(xué)科的科學(xué)數(shù)據(jù)[2],水利信息資源目錄服務(wù)體系要對上述各種科學(xué)數(shù)據(jù)進(jìn)行統(tǒng)一管理,需要定義一套能夠?qū)Ψ植际酱鎯?、格式不統(tǒng)一的水利信息資源進(jìn)行統(tǒng)一描述的水利信息資源目錄服務(wù)元數(shù)據(jù),為目錄服務(wù)體系的構(gòu)建提供基礎(chǔ)。目前,國內(nèi)外對涉及水利信息資源的元數(shù)據(jù)定義已進(jìn)行大量的研究。國際標(biāo)準(zhǔn) ISO-19115:2005《地理信息 元數(shù)據(jù)》[3]、國家標(biāo)準(zhǔn) GB/T l9710-2005《地理信息 元數(shù)據(jù)》[4]、科技部發(fā)布的 SDS/T2112-2004《科學(xué)共享元數(shù)據(jù)內(nèi)容》[5]、水利部發(fā)布的 SL420-2007《水利地理空間信息元數(shù)據(jù)標(biāo)準(zhǔn)》[6]、SL473-2010《水利信息核心元數(shù)據(jù)》[7]等一系列涉及水利信息資源的技術(shù)標(biāo)準(zhǔn)相繼發(fā)布。目前這些技術(shù)標(biāo)準(zhǔn)主要針對特定數(shù)據(jù)格式(矢量、遙感)的水利信息資源。
本文對水利信息資源目錄服務(wù)元數(shù)據(jù)的定義展開研究,在充分考慮水利信息資源特點基礎(chǔ)上,著眼于定義1套適合水利信息資源共享的元數(shù)據(jù),為水利信息資源目錄服務(wù)體系的構(gòu)建打下堅實基礎(chǔ)。
ISO19115:2003是由國際標(biāo)準(zhǔn)化組織發(fā)布的關(guān)于地理信息的元數(shù)據(jù),描述數(shù)字地理數(shù)據(jù)(矢量、柵格與遙感等)的標(biāo)識、覆蓋范圍、質(zhì)量、空間和時間模式、空間參照系和分發(fā)等信息。國家標(biāo)準(zhǔn) GB/T l9710-2005是結(jié)合我國國情修改采用國際標(biāo)準(zhǔn) ISO 19115:2003制定的元數(shù)據(jù)標(biāo)準(zhǔn)。上述2套標(biāo)準(zhǔn)內(nèi)容基本一致,主要針對具有空間地理信息數(shù)據(jù),抽象層次高,雖然支持對非地理數(shù)據(jù)的描述,但是在描述水利信息資源的獲取途徑、分類體系和編碼等方面顯得不足,而且不能很好地描述水文數(shù)據(jù)這類以關(guān)系數(shù)據(jù)庫存儲的數(shù)據(jù),特別是未定義關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)、服務(wù)信息等元數(shù)據(jù)項。
SDS/T2112-2004是科技部的《科學(xué)數(shù)據(jù)共享工程》的建設(shè)成果,旨在提高科學(xué)數(shù)據(jù)的建庫質(zhì)量,規(guī)范數(shù)據(jù)加工的標(biāo)準(zhǔn)化,促進(jìn)科學(xué)數(shù)據(jù)的共享與交換,該標(biāo)準(zhǔn)適用于科學(xué)數(shù)據(jù)集元數(shù)據(jù)的管理,但是抽象層次較 GB/T l9710-2005和 ISO19115:2003更高,與水利行業(yè)耦合度不夠。
SL420-2007旨在為各行業(yè)及社會各界提供訪問水利地理空間信息所需的高效、統(tǒng)一的描述性信息[6],主要針對數(shù)字水利地理信息數(shù)據(jù),是 GB/T l9710-2005和ISO19115:2003在水利領(lǐng)域的細(xì)化,但存在對屬性數(shù)據(jù)類型水利信息資源描述能力不足的問題。SL473-2010規(guī)定了水利信息核心元數(shù)據(jù)內(nèi)容,包括數(shù)據(jù)的標(biāo)識、內(nèi)容、質(zhì)量、狀況及其他有關(guān)特征,適用于對水利信息數(shù)據(jù)集的描述、編目及信息交換服務(wù),該標(biāo)準(zhǔn)也未對屬性數(shù)據(jù)類型的水利數(shù)據(jù)資源的結(jié)構(gòu)信息進(jìn)行描述。
水利信息資源目錄服務(wù)元數(shù)據(jù)應(yīng)當(dāng)能夠?qū)傩詳?shù)據(jù)、遙感影像和矢量圖層及其他非典型信息資源全面描述,應(yīng)緊密結(jié)合水利信息資源的分類體系,描述資源的服務(wù)配置信息,以支持通過目錄服務(wù)體系對水利信息資源的描述、發(fā)布、發(fā)現(xiàn)和訪問。
水利信息資源目錄服務(wù)元數(shù)據(jù)的定義是系統(tǒng)工程,應(yīng)遵循如下原則:
1)全面性。元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)能詳細(xì)地描述水利信息資源的典型數(shù)據(jù)類型(關(guān)系數(shù)據(jù)庫、關(guān)系數(shù)據(jù)表、矢量圖層和遙感影像),并支持非典型數(shù)據(jù)類型元數(shù)據(jù)的描述。
2)模塊化。為了在滿足全面性的基礎(chǔ)上盡可能的定義簡潔的元數(shù)據(jù),必須對水利信息資源目錄服務(wù)元數(shù)據(jù)進(jìn)行模塊化,元數(shù)據(jù)的模塊允許元數(shù)據(jù)模式的設(shè)計者在已建立的元數(shù)據(jù)模式的基礎(chǔ)上,生成新的匯編或組合,因而不必再重建新的元素,可以直接引用已有的元數(shù)據(jù)模式。水利信息資源目錄服務(wù)元數(shù)據(jù)將聯(lián)系、覆蓋范圍、參考系等信息進(jìn)行模塊化定義,以供元數(shù)據(jù)的其他模塊引用。
3)可擴展性。元數(shù)據(jù)系統(tǒng)必須允許擴展,以適應(yīng)某一給定應(yīng)用的需要。一些普遍的元數(shù)據(jù)元素可以在大多數(shù)元數(shù)據(jù)模式中找到(例如,一個信息資源的標(biāo)識符)。而在特殊的應(yīng)用或領(lǐng)域中,其它特殊的元數(shù)據(jù)元素應(yīng)該是特別指定的。構(gòu)建元數(shù)據(jù)時,必須有易于適應(yīng)添加元素的基本模式的概念,即將某一給定應(yīng)用剪裁得適合局部的需要或特定領(lǐng)域的需要,而不必過分地兼顧基本模式所提供的可互操作性。
4)多粒度性。元數(shù)據(jù)根據(jù)其應(yīng)用領(lǐng)域需求的差異,對其所希望的詳細(xì)程度也有所不同。所謂多粒度性就是指元數(shù)據(jù)標(biāo)準(zhǔn)的設(shè)計應(yīng)該允許模式設(shè)計者選擇特定的級別以適合于給定的應(yīng)用。
5)兼容性。元數(shù)據(jù)的定義應(yīng)當(dāng)遵循已有的國際、國家和行業(yè)標(biāo)準(zhǔn),結(jié)合水利信息資源目錄服務(wù)體系的實際情況進(jìn)行定義;對于現(xiàn)有標(biāo)準(zhǔn)中已有的項,定義時應(yīng)當(dāng)遵循。本元數(shù)據(jù)定義的核心可查詢目錄服務(wù)模式與核心可返回目錄服務(wù)模式遵循標(biāo)準(zhǔn) SL 473-2010。
水利信息資源元數(shù)據(jù)定義了相應(yīng)的元數(shù)據(jù)項以描述水利信息資源的分析類體系和資源編碼,定義了結(jié)構(gòu)信息用于詳細(xì)描述屬性數(shù)據(jù)類型的資源,定義遙感信息和矢量信息元數(shù)據(jù)項用于描述遙感信息與矢量信息。水利信息資源元數(shù)據(jù)包含了對水利信息資源描述的全集,核心元數(shù)據(jù)是標(biāo)識水利信息所需要的最小元數(shù)據(jù)元素和元數(shù)據(jù)實體,為元數(shù)據(jù)元素集的子集。依據(jù)《水利信息核心元數(shù)據(jù)標(biāo)準(zhǔn)》,水利信息核心元數(shù)據(jù)由1個元數(shù)據(jù)實體集和12個元數(shù)據(jù)子集構(gòu)成,具體結(jié)構(gòu)如圖1所示。其中,標(biāo)識信息為必選子集,內(nèi)容、數(shù)據(jù)質(zhì)量、覆蓋范圍、限制、參照系、維護、分發(fā)、服務(wù)、應(yīng)用、結(jié)構(gòu)和關(guān)聯(lián)信息等信息為可選子集。
圖1 水利信息資源目錄服務(wù)元數(shù)據(jù)結(jié)構(gòu)
具體信息內(nèi)容如下:
1)標(biāo)識信息,包含唯一標(biāo)識數(shù)據(jù)的信息,包括有關(guān)資源的引用、摘要、目的、可信度、狀況和聯(lián)系方等信息,標(biāo)識信息針對遙感和矢量數(shù)據(jù)進(jìn)行進(jìn)一步細(xì)化,并考慮水利信息資源分類體系;
2)內(nèi)容信息,包含提供數(shù)據(jù)內(nèi)容特征的描述信息,內(nèi)容信息的“資源域”屬性應(yīng)用于表明數(shù)據(jù)集所在的資源范圍;
3)數(shù)據(jù)質(zhì)量信息,包含對數(shù)據(jù)資源質(zhì)量的總體評價,包括與數(shù)據(jù)生產(chǎn)有關(guān)的數(shù)據(jù)志信息的一般說明;
4)覆蓋范圍信息,提供數(shù)據(jù)資源所涉及空間、時間覆蓋范圍信息,是空間和時間覆蓋范圍的聚集,空間覆蓋范圍又分為地理和垂向2種覆蓋范圍;
5)限制信息,包含訪問和使用資源的限制信息;
6)參照系信息,包含對數(shù)據(jù)集使用的空間和時間參照系的說明;
7)維護信息,包含有關(guān)資源的更新頻率及范圍的信息;8)分發(fā)信息,包含資源如何分發(fā)和獲取信息;9)關(guān)聯(lián)信息,包含與該資源具有關(guān)聯(lián)關(guān)系的資源信息;
10)結(jié)構(gòu)信息,包含有關(guān)資源(屬性數(shù)據(jù)類型)的存儲結(jié)構(gòu)信息;
11)服務(wù)信息,包含資源管理單位通過網(wǎng)絡(luò)向外提供的資源服務(wù)技術(shù)參數(shù);
12)應(yīng)用信息,包含有關(guān)資源應(yīng)用的描述信息。
考慮到水利信息資源目錄體系管理的水利信息資源,將元數(shù)據(jù)的描述對象在數(shù)據(jù)格式上抽象為:關(guān)系數(shù)據(jù)庫和數(shù)據(jù)表、矢量圖層和遙感影像等典型的4類,并支持其它非典型數(shù)據(jù)格式。同時參照國家科學(xué)數(shù)據(jù)共享工程核心元數(shù)據(jù)設(shè)置規(guī)范,對核心元數(shù)據(jù)進(jìn)行必填、選填分級,以滿足元數(shù)據(jù)抽取的便利性和信息使用的不同要求[1]。
按照兼容性原則,水利信息資源目錄服務(wù)元數(shù)據(jù)的定義遵循了相關(guān)國際、國家和行業(yè)標(biāo)準(zhǔn)。其中參照系、數(shù)據(jù)質(zhì)量和維護等信息的定義遵循 ISO19115:2003和 GB/T l9710-2005,分發(fā)和限制信息的定義遵循 SL 473-2010,覆蓋范圍信息的定義遵循 ISO19115:2003、GB/T l9710-2005和 SL 420-2007。水利信息資源元數(shù)據(jù)定義在遵循相關(guān)標(biāo)準(zhǔn)的基礎(chǔ)上結(jié)合水利信息資源目錄服務(wù)體系進(jìn)行擴展,主要體現(xiàn)在以下幾點:
1)標(biāo)識信息。標(biāo)識信息定義基本標(biāo)識信息,用于標(biāo)識水利信息資源的通用信息(標(biāo)題、摘要和關(guān)鍵字等),基本信息的定義遵循 SL 473-2010。按照全面性的原則,標(biāo)識信息部分還定義了遙感影像和矢量圖層標(biāo)識信息,用于描述遙感數(shù)據(jù)和矢量數(shù)據(jù)。定義了與水利信息資源分類體系和資源編碼結(jié)合的元數(shù)據(jù)項,用于支持水利信息資源分類體系和資源編碼的應(yīng)用。
2)關(guān)聯(lián)信息。關(guān)聯(lián)信息的定義,用于描述水利信息資源間的關(guān)聯(lián)關(guān)系,并進(jìn)一步支持目錄服務(wù)體系發(fā)現(xiàn)服務(wù)對信息資源的聯(lián)想查詢。
3)結(jié)構(gòu)信息。針對水利信息資源中采用關(guān)系數(shù)據(jù)庫存儲的屬性數(shù)據(jù),定義數(shù)據(jù)存儲的結(jié)構(gòu)元數(shù)據(jù)(數(shù)據(jù)類型、記錄計量單位、精度及非空記錄數(shù)等),從更細(xì)的粒度描述水利信息資源,以滿足科研這一層次用戶對水利信息資源的查詢服務(wù)。
4)服務(wù)信息。服務(wù)信息是水利信息資源管理單位通過網(wǎng)絡(luò)向外提供資源服務(wù)的技術(shù)參數(shù),包括安全認(rèn)證和服務(wù)器配置信息等。服務(wù)信息的定義能支持目錄服務(wù)系統(tǒng)程序化地抽取部分元數(shù)據(jù),并為水利信息資源的訪問服務(wù)提供參數(shù)。
水利信息資源元數(shù)據(jù)根據(jù)國家水利數(shù)據(jù)中心水利信息資源目錄服務(wù)系統(tǒng)對水利信息資源管理的基本要求制定,為水利信息資源目錄服務(wù)系統(tǒng)總體框架,目錄服務(wù)系統(tǒng)框架如圖2所示。資源層是指各類信息資源,包括水利資源數(shù)據(jù)分中心信息資源涉及的水文、水質(zhì)、水資源、水利設(shè)施(空間)、土壤侵蝕、灌溉、水能資源調(diào)查、農(nóng)村水電8個專題信息庫,涵蓋了屬性、矢量和遙感影像數(shù)據(jù)等類型的水利信息資源。目錄層包括資源目錄庫,是根據(jù)目錄服務(wù)應(yīng)用需要建立的總目錄庫,包括核心元數(shù)據(jù)庫、水利信息目錄總體框架指導(dǎo)下建立的水利資源信息分類體系、資源編碼表等。服務(wù)層主要包括目錄體系向應(yīng)用層或其它應(yīng)用系統(tǒng)提供各類應(yīng)用的服務(wù)接口,以方便應(yīng)用的調(diào)用、目錄體系與交換體系的互通,目錄體系之間的信息交換和訪問。應(yīng)用層是目錄服務(wù)向用戶的展示層。用戶使用應(yīng)用層提供的各類工具進(jìn)行信息資源的注冊與發(fā)布,也可進(jìn)行信息資源的發(fā)現(xiàn)和訪問,以及對目錄庫進(jìn)行管理。
圖2 水利信息資源目錄服務(wù)系統(tǒng)總體框架
目前,水利信息資源元數(shù)據(jù)已經(jīng)成功應(yīng)用于水利信息資源目錄服務(wù)系統(tǒng),實現(xiàn)了對屬性數(shù)據(jù)、矢量圖層和遙感影像等類型的水利信息資源的統(tǒng)一管理。在資源目錄管理方面支持水利信息資源的分類體系和編碼;在資源注冊方面支持對水利信息資源元數(shù)據(jù)的程序化抽?。ɡ梅?wù)信息)、屬性數(shù)據(jù)的結(jié)構(gòu)信息描述;在資源發(fā)現(xiàn)方面,支持資源的聯(lián)想查詢(利用關(guān)聯(lián)信息、分類體系),支持屬性數(shù)據(jù)類型水利信息資源的字段級描述(利用結(jié)構(gòu)信息);在資源訪問方面,支持資源(限管理方提供訪問服務(wù)的資源)的訪問(利用服務(wù)信息)。水利信息資源元數(shù)據(jù)在水利信息資源目錄服務(wù)系統(tǒng)的應(yīng)用表明,水利信息資源元數(shù)據(jù)能夠很好描述水利信息資源,并為目錄服務(wù)體系提供基礎(chǔ)。
本文在分析了當(dāng)前涉及水利信息資源元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,研究了水利信息資源元數(shù)據(jù)的定義,并將定義的元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用到水利資源數(shù)據(jù)分中心水利信息資源目錄服務(wù)系統(tǒng)中,應(yīng)用結(jié)果表明,本文定義的元數(shù)據(jù)標(biāo)準(zhǔn)能夠很好的描述水利信息資源,能為目錄服務(wù)體系實現(xiàn)水利信息資源的統(tǒng)一目錄訪問和共享提供一定的基礎(chǔ)。水利信息資源目錄服務(wù)體系需要一系列的標(biāo)準(zhǔn)來支持,進(jìn)一步應(yīng)定義水利信息資源目錄服務(wù)規(guī)范、水利信息資源服務(wù)注冊規(guī)范等標(biāo)準(zhǔn)。
[1] 朱躍龍,許峰,馮鈞,等.水利信息資源目錄體系構(gòu)建研究[J].水利信息化,2010(4): 4-8.
[2] 朱星明,白婧怡,蔡佳男.水利科學(xué)數(shù)據(jù)共享體系建設(shè)初探[J].中國水利,2006(5): 47-48,60.
[3] ISO-19115:2003,Geographic Information-Metadata[S].
[4] GB/T l9710-2005,地理信息 元數(shù)據(jù)[S].
[5] SDS/T2112-2004,科學(xué)數(shù)據(jù)共享元數(shù)據(jù)內(nèi)容[S].
[6] SL 420-2007,水利地理空間信息元數(shù)據(jù)標(biāo)準(zhǔn)[S].
[7] SL 473-2010,水利信息核心元數(shù)據(jù)[S].