張巍,金鵬,李瑞強,何燕飛
(1.內(nèi)蒙古生態(tài)環(huán)境大數(shù)據(jù)有限公司,內(nèi)蒙古 呼和浩特 010011;2.內(nèi)蒙古自治區(qū)生態(tài)環(huán)境綜合行政執(zhí)法總隊,內(nèi)蒙古 呼和浩特 010011;3.內(nèi)蒙古自治區(qū)環(huán)境在線監(jiān)控中心,內(nèi)蒙古 呼和浩特010011;4.北京思路創(chuàng)新科技有限公司,北京 100000)
環(huán)境信息資源是指生態(tài)環(huán)境部門在履行職責(zé)過程中制作或獲取的,以一定形式記錄、保存的文件、資料、圖表和數(shù)據(jù)等各類數(shù)據(jù)資源。黨中央、國務(wù)院高度重視信息資源整合共享工作,習(xí)近平總書記強調(diào)要強化信息資源深度整合,構(gòu)建全國信息資源共享體系,打通經(jīng)濟社會發(fā)展的信息“大動脈”,以信息化推進國家治理體系和治理能力現(xiàn)代化。2017年,國家發(fā)改委下發(fā)《政務(wù)信息資源目錄編制指南(試行)》(發(fā)改高技〔2017〕1272 號)[1],明確了政務(wù)信息資源的分類、元數(shù)據(jù)、編制要求等內(nèi)容,為信息資源目錄建設(shè)提供了更為具體的方法和依據(jù)。2017 年底,由生態(tài)環(huán)境部牽頭編制了《生態(tài)環(huán)境保護信息化工程數(shù)據(jù)分類與編碼標(biāo)準(zhǔn)》《生態(tài)環(huán)境信息共享服務(wù)注冊規(guī)范》《生態(tài)環(huán)境信息共享資源發(fā)布和使用規(guī)范》。內(nèi)蒙古自治區(qū)生態(tài)環(huán)境保護工作起步較早、發(fā)展較快,積累了大量的數(shù)據(jù)。在數(shù)據(jù)整合工作中,我們發(fā)現(xiàn),由于業(yè)務(wù)系統(tǒng)建設(shè)沒有統(tǒng)一的標(biāo)準(zhǔn),數(shù)據(jù)質(zhì)量參差不齊,“數(shù)據(jù)孤島”“數(shù)據(jù)煙囪”現(xiàn)象普遍存在。為推動全區(qū)生態(tài)環(huán)境數(shù)據(jù)的整合共享,強化數(shù)據(jù)資源的高效統(tǒng)一管理,研究制定環(huán)境信息資源目錄體系勢在必行。
選取內(nèi)蒙古自治區(qū)為研究區(qū)域。內(nèi)蒙古自治區(qū)從2016 年起實施生態(tài)環(huán)境大數(shù)據(jù)建設(shè)項目,具有良好的環(huán)境信息資源目錄編制基礎(chǔ):一是通過數(shù)據(jù)資源規(guī)劃,初步摸清了生態(tài)環(huán)境大數(shù)據(jù)資源“家底”,使分散的、標(biāo)準(zhǔn)不一的數(shù)據(jù)實現(xiàn)由數(shù)據(jù)到信息的轉(zhuǎn)化,規(guī)范數(shù)據(jù)庫及業(yè)務(wù)系統(tǒng)建設(shè),為環(huán)境資源共享夯實基礎(chǔ);二是針對不同粒度和層次的信息資源建立數(shù)據(jù)庫體系,以滿足生態(tài)環(huán)境數(shù)據(jù)分類存儲及分析需求,數(shù)據(jù)庫體系主要由關(guān)系型數(shù)據(jù)庫、時序數(shù)據(jù)庫、半結(jié)構(gòu)化數(shù)據(jù)庫、非結(jié)構(gòu)化數(shù)據(jù)庫組成;三是建立了數(shù)據(jù)資源數(shù)據(jù)庫,從數(shù)據(jù)庫設(shè)計方法、數(shù)據(jù)庫體系總體結(jié)構(gòu)、元數(shù)據(jù)庫設(shè)計、業(yè)務(wù)數(shù)據(jù)庫設(shè)計等方面,形成基礎(chǔ)數(shù)據(jù)庫、主數(shù)據(jù)庫、元數(shù)據(jù)庫、主題數(shù)據(jù)庫、指標(biāo)庫和公共代碼庫。
本研究數(shù)據(jù)來源于內(nèi)蒙古自治區(qū)生態(tài)環(huán)境大數(shù)據(jù)資源中心,該中心收錄生態(tài)環(huán)境數(shù)據(jù)約36.7 億條,數(shù)據(jù)容量約30.1T。本研究依托內(nèi)蒙古自治區(qū)現(xiàn)有生態(tài)環(huán)境數(shù)據(jù)基礎(chǔ),圍繞生態(tài)環(huán)境領(lǐng)域數(shù)據(jù),通過對環(huán)境質(zhì)量、生態(tài)環(huán)境、污染源等信息的分類以及對應(yīng)業(yè)務(wù)數(shù)據(jù)、環(huán)境質(zhì)量數(shù)據(jù)、環(huán)境要素等數(shù)據(jù)信息梳理,確定資源目錄規(guī)范結(jié)構(gòu),建立數(shù)據(jù)資源體系,規(guī)范資源目錄內(nèi)容,實現(xiàn)對環(huán)境質(zhì)量信息相關(guān)源數(shù)據(jù)及元數(shù)據(jù)的有效分類、管理。
采用實地調(diào)研、文獻調(diào)研、專家調(diào)研等方法研究不同來源的內(nèi)蒙古自治區(qū)生態(tài)環(huán)境數(shù)據(jù)的現(xiàn)狀,摸清數(shù)據(jù)家底。建立“一橫一縱”生態(tài)環(huán)境數(shù)據(jù)梳理機制,縱向貫穿部、省、市縣、排污單位等生態(tài)環(huán)境管理節(jié)點內(nèi)部數(shù)據(jù),橫向整合其他委辦廳局及互聯(lián)網(wǎng)數(shù)據(jù)??v向依據(jù)生態(tài)環(huán)境各業(yè)務(wù)部門現(xiàn)有的職能職責(zé),梳理出各部門涉及數(shù)據(jù),依據(jù)數(shù)據(jù)所涉及的環(huán)境管理要素再進行二次分類,最終形成數(shù)據(jù)資源基本情況調(diào)查表,見表1。橫向梳理出其他委辦廳局及互聯(lián)網(wǎng)上涉及的數(shù)據(jù),將對應(yīng)數(shù)據(jù)類型按照環(huán)境管理要素添加至表1中。
表1 數(shù)據(jù)資源基本情況調(diào)查表
環(huán)境信息特別是內(nèi)蒙古自治區(qū)內(nèi)各級生態(tài)環(huán)境管理部門使用的環(huán)境管理及相關(guān)信息,具有層次分明、隸屬關(guān)系明確等特點,宜采用線方法進行分類。對于一些特殊類別的環(huán)境信息,宜采用面分類方法。本分類采用以線分類法為主、面分類法為補充的混合分類法。
一、二級分類采用線分類方法按照生態(tài)環(huán)境管理要素分類,一級類目包含目前環(huán)境管理業(yè)務(wù)涉及要素,包括環(huán)境質(zhì)量信息、自然生態(tài)、污染源等大類;二級類目對管理要素進行再分類,如環(huán)境質(zhì)量信息下再分大氣環(huán)境質(zhì)量、水環(huán)境質(zhì)量、聲環(huán)境質(zhì)量等;三級至五級類目采用面分類方法,按照每類要素包含的數(shù)據(jù)屬性進行分類。類目層次目前暫時分到五級,將來可根據(jù)數(shù)據(jù)類別擴展需要增加。
類目的分類編碼規(guī)則沿用《環(huán)境信息分類與代碼》中的分類代碼,分類代碼用阿拉伯?dāng)?shù)字表示,每層代碼均采用2位阿拉伯?dāng)?shù)字表示,即01-99。一級類目代碼由第一層代碼組成,二級以上類目代碼由上級類目代碼加本層代碼組成。
代碼結(jié)構(gòu)組成如圖所示:
圖1 代碼結(jié)構(gòu)組成圖
表2 環(huán)境信息資源代碼表(節(jié)選)
表3 環(huán)境信息資源核心元數(shù)據(jù)說明(節(jié)選)
通過本項目研究,最終形成環(huán)境信息資源一級目錄9 項,包括環(huán)境質(zhì)量信息、自然生態(tài)、污染源、核與輻射、環(huán)境風(fēng)險與應(yīng)急、環(huán)境政策法規(guī)標(biāo)準(zhǔn)、環(huán)??萍寂c產(chǎn)業(yè)、政務(wù)信息、環(huán)境保護相關(guān)信息等;二級目錄32 項,包括大氣、水、土壤、自然生態(tài)環(huán)境質(zhì)量等;三級目錄80項,包括空氣質(zhì)量監(jiān)測、降塵、降水、沙塵等;四級目錄82 項,包括空氣自動常規(guī)監(jiān)測、空氣超級站監(jiān)測等;五級目錄54 項,包括國控空氣自動常規(guī)監(jiān)測、區(qū)控空氣自動常規(guī)監(jiān)測等。
環(huán)境信息元數(shù)據(jù)是描述環(huán)境數(shù)據(jù)資源特征的數(shù)據(jù)。其中核心元數(shù)據(jù)是描述數(shù)據(jù)基本屬性與特征的最小集合,一般包括環(huán)境信息資源的名稱、內(nèi)容摘要、提供方、發(fā)布日期等。利用元數(shù)據(jù)來描述信息資源后,可以快速發(fā)現(xiàn)和確認信息資源、為信息檢索提供關(guān)鍵詞,可以在不同系統(tǒng)之間進行數(shù)據(jù)交換。環(huán)境信息資源核心元數(shù)據(jù)包括環(huán)境信息資源分類、環(huán)境信息資源名稱、代碼、提供方、提供方代碼、摘要、格式、信息項信息、共享屬性、開放屬性、更新周期、發(fā)布日期、關(guān)聯(lián)資源代碼等13項。
內(nèi)蒙古自治區(qū)生態(tài)環(huán)境保護工作起步較早、發(fā)展較快,積累了大量的數(shù)據(jù)。近年來,通過環(huán)境信息系統(tǒng)的配套建設(shè),大部分數(shù)據(jù)實現(xiàn)了紙質(zhì)化向電子化的轉(zhuǎn)變。2016年,內(nèi)蒙古自治區(qū)生態(tài)環(huán)境廳啟動大數(shù)據(jù)建設(shè)項目,推動涉及環(huán)境監(jiān)測、環(huán)境執(zhí)法、環(huán)境統(tǒng)計、污染源普查等環(huán)保業(yè)務(wù)數(shù)據(jù)的整合共享。經(jīng)過多年的項目建設(shè)與實施,我們發(fā)現(xiàn)數(shù)據(jù)資源整合中存在以下幾方面問題:一是信息系統(tǒng)建設(shè)缺乏頂層規(guī)劃、統(tǒng)一標(biāo)準(zhǔn),造成大量“數(shù)據(jù)孤島”;二是業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn)不一,數(shù)據(jù)質(zhì)量層次不齊,難以交換和共享;三是數(shù)據(jù)資源開發(fā)利用程度不高,為環(huán)境形勢預(yù)警預(yù)測、環(huán)境管理宏觀決策等方面發(fā)揮作用有限[2]。
本研究編制的環(huán)境信息資源目錄,通過建立各類環(huán)境信息資源的分類方法,規(guī)范資源排序和編碼,推進數(shù)據(jù)整合和共享,促進數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一,實現(xiàn)對各業(yè)務(wù)數(shù)據(jù)資源特征的準(zhǔn)確描述。環(huán)境信息資源目錄建立起數(shù)據(jù)使用者和業(yè)務(wù)部門的橋梁紐帶,方便人們對環(huán)境數(shù)據(jù)資源的檢索、定位和獲取,推動了數(shù)據(jù)共享應(yīng)用,提升了數(shù)據(jù)的環(huán)境管理決策支撐能力。
本研究基于內(nèi)蒙古自治區(qū)生態(tài)環(huán)境大數(shù)據(jù)項目的建設(shè)經(jīng)驗,環(huán)境信息資源目錄體系已成功應(yīng)用于內(nèi)蒙古自治區(qū)生態(tài)環(huán)境大數(shù)據(jù)五期工程。研究成果適用于內(nèi)蒙古自治區(qū)各級生態(tài)環(huán)境信息化項目實施過程中,環(huán)境信息資源目錄的建設(shè)和管理,為生態(tài)環(huán)境數(shù)據(jù)治理、數(shù)據(jù)管理、數(shù)據(jù)共享等工作提供標(biāo)準(zhǔn)統(tǒng)一的編碼規(guī)則,推進全區(qū)生態(tài)環(huán)境數(shù)據(jù)的交換共享。
本研究基本建立起內(nèi)蒙古自治區(qū)生態(tài)環(huán)境五級信息資源目錄體系,形成了內(nèi)蒙古自治區(qū)環(huán)境信息資源分類原則與代碼規(guī)則、環(huán)境信息資源核心元數(shù)據(jù)。該目錄體系具有可擴展性,后續(xù)可根據(jù)生態(tài)環(huán)境管理業(yè)務(wù)需求,不斷完善和更新,通過目錄使用過程中的意見反饋,不斷優(yōu)化分類和元數(shù)據(jù)。環(huán)境信息資源目錄體系的建立有利于推動生態(tài)環(huán)境信息資源的整合和共享,強化數(shù)據(jù)資源的高效統(tǒng)一管理,推進數(shù)據(jù)應(yīng)用,挖掘數(shù)據(jù)潛在價值,為生態(tài)環(huán)境質(zhì)量改善提供強有力的數(shù)據(jù)支持服務(wù)。