王玉德
(遼寧省朝陽水文局,遼寧 朝陽 122000)
從20世紀90年代開始,遼寧省水利逐步開展業(yè)務應用系統(tǒng)的信息化建設工作[1]。當前,遼寧信息化設施逐步覆蓋到縣域層級進行視頻和網絡的應用,并對網絡安全體系進行了初步建立。建設了各類遙測水文監(jiān)測站點4000余座及符合省級標準的現(xiàn)代化視頻會議系統(tǒng),在水利業(yè)務方面覆蓋水旱災害防御、水資源監(jiān)控、防洪決策調度、水土保持監(jiān)測、大壩安全監(jiān)測管理服務等系統(tǒng)[2]。在當前數(shù)字信息化發(fā)展的新形勢下,水利高質量發(fā)展需要的業(yè)務數(shù)據范圍和種類將逐步增多,數(shù)據組織的方式因此發(fā)生深刻的變化,而目前主要對單項業(yè)務數(shù)據應用方式有所側重,數(shù)據之間相互獨立,不能實現(xiàn)水利業(yè)務之間的數(shù)據的有效連通和應用,從而不能實現(xiàn)對于遼寧水利業(yè)務的有效支撐[2- 5]。因此需要對現(xiàn)有水利信息資源進行統(tǒng)一整合,實現(xiàn)“一數(shù)一源”,達到信息資源深度開發(fā)和綜合利用的目的[6]。本文結合近些年來其他省份數(shù)據資源整合和共享相關研究成果[7- 12],按照統(tǒng)一的數(shù)據共享和整合標準對水利業(yè)務數(shù)據進行整合共享的建設思路,可以對其他業(yè)務類信息系統(tǒng)提供有力支撐服務,從而支撐水利業(yè)務的高質量發(fā)展。
從水利業(yè)務服務支撐需求角度而言,建立業(yè)務應用關聯(lián)數(shù)據分類,面向業(yè)務進行數(shù)據模型構建,對不同來源的業(yè)務數(shù)據按照空間屬性進行整合、分類,對業(yè)務數(shù)據的來源、共享方式、授權管理進行信息資源整合和共享思路的設計,信息資源整合與共享思路如圖1所示。
根據集中存儲的數(shù)據形式和最終數(shù)據供給方式的不同,可分為數(shù)據源聚合、數(shù)據源同步和邏輯整合3種整合方式。
(1)數(shù)據源聚合方式
對已建信息系統(tǒng)數(shù)據資源進行遷移是數(shù)據資源聚合的主要方式,在信息系統(tǒng)升級改造后,在統(tǒng)一的數(shù)據基礎的平臺上對數(shù)據資源進行聚合,在業(yè)務數(shù)據區(qū)進行核心業(yè)務的數(shù)據存儲,再按照業(yè)務類型、基礎數(shù)據的種類對業(yè)務對象進行模型轉換后,按照集中統(tǒng)一存儲空間進行數(shù)據倉的建設,面向業(yè)務類型、方向、統(tǒng)一整合共享方式對數(shù)據體系進行關聯(lián)和挖掘,形成水利業(yè)務數(shù)據整合體系,同時對元數(shù)據進行抽取后形成數(shù)據類別清單,按照數(shù)據整合庫的方式對各應用系統(tǒng)業(yè)務庫數(shù)據資源進行遷移整合后,有原數(shù)據責任業(yè)務部門對元數(shù)據進行動態(tài)更新。數(shù)據倉主要對實測數(shù)據共享方式進行需求承載。
(2)數(shù)據源同步方式
數(shù)據源同步方式主要針對業(yè)務應用系統(tǒng)暫不具備升級改造條件,不能遷移部署數(shù)據資源按照同步方式進行整合并對其數(shù)據來源方式進行確定。在同一個數(shù)據映像庫進行遷移整合后的數(shù)據資源的備份和鏡像。按照水利業(yè)務對不同數(shù)據按照面向對象類型進行轉化后,在相對獨立的鏡像空間內進行數(shù)據存儲倉庫的集中空間建設。按照統(tǒng)一共享、整合的方式進行數(shù)據體系的有機挖掘,通過對應元數(shù)據進行抽取后形成數(shù)據資源的分類目錄。由于信息系統(tǒng)同步運行保持數(shù)據資源的動態(tài)更新。數(shù)據倉庫對數(shù)據的共享和使用需求進行滿足。原生產庫僅需提供接口供共享服務庫抽取數(shù)據。
圖1 信息資源整合共享與共享思路
(3)邏輯整合方式
邏輯整合方式主要針對不能進行同步聚合的數(shù)據資源建立整合資源目錄。邏輯整合方式是指將數(shù)據資源對應的數(shù)據在數(shù)據倉進行數(shù)據資源目錄的統(tǒng)一存儲,在原有的物理環(huán)境中對原始數(shù)據進行存儲。這類數(shù)據一般具有極強的專業(yè)性,共享需求不大,或者具有涉密和不易公開性,只將數(shù)據資源目錄進行共享。整合后數(shù)據資源目錄的共享使用由數(shù)據倉庫承載。
1.2.1數(shù)據資源共享
通過數(shù)據資源同步聚合后,數(shù)據共享通過數(shù)據倉進行承載,結合數(shù)據交換共享授權方式實現(xiàn)數(shù)據的共享和交換。各業(yè)務主管部門負責對數(shù)據整合和共享進行需求申請,數(shù)據來源部門負責對數(shù)據共享權限進行設定,信息化管理部門負責數(shù)據共享技術支撐。
1.2.2數(shù)據資源目錄共享
數(shù)據資源目錄是將遼寧水利所有的數(shù)據資源,統(tǒng)一編制數(shù)據資源目錄體系,形成全省唯一的水利數(shù)據資源目錄服務體系,為全省水利數(shù)據資源的統(tǒng)一管理、發(fā)布、查詢和統(tǒng)計服務提供支持。整合后的數(shù)據資源目錄可以為水利行業(yè)和其他行業(yè)部門等提供共享服務。
結合遼寧省水利信息化建設的現(xiàn)狀和發(fā)展要求,根據遼寧省水利廳水行政管理業(yè)務和數(shù)據需求,結合本項目的建設目標,本項目在數(shù)據方面主要完成以下工作:將現(xiàn)有省廳機關、廳直單位業(yè)務系統(tǒng)數(shù)據資源進行整合,形成遼寧省水利廳數(shù)據中心,并對外提供數(shù)據共享和使用。數(shù)據設計架構如圖2所示。
數(shù)據資源整合后建設省級水利數(shù)據中心,主要存放除涉密數(shù)據以外的全部數(shù)據。數(shù)據中心主要由業(yè)務數(shù)據存儲區(qū)、ODS存儲區(qū)和數(shù)據倉庫存儲區(qū)3個區(qū)域構成。業(yè)務數(shù)據存儲區(qū):主要存放直接遷移到數(shù)據中心的業(yè)務數(shù)據庫和沒有遷移到數(shù)據中心的業(yè)務數(shù)據庫的映像庫,以及未來新建的業(yè)務數(shù)據庫。ODS存儲區(qū):是業(yè)務系統(tǒng)數(shù)據庫和數(shù)據倉庫之間形成的隔離層,從數(shù)據映像庫直接抽取和存放的業(yè)務數(shù)據按照數(shù)據架構、數(shù)據之間的關聯(lián)程度與業(yè)務系統(tǒng)進行同步運行。相對穩(wěn)定且面向主題水利業(yè)務進行數(shù)據的存儲,數(shù)據整合后按照數(shù)據倉模型進行共享和轉換,是具有分析價值的歷史數(shù)據與現(xiàn)狀數(shù)據,可以支持基于大量歷史數(shù)據的決策分析。數(shù)據倉庫存儲區(qū)包含水利基礎數(shù)據庫和水利專業(yè)數(shù)據庫,即主數(shù)據庫,以及面向對象數(shù)據庫。
圖2 數(shù)據設計架構示意圖
面向對象的水利業(yè)務數(shù)據屬性架構如圖3所示。為了降低業(yè)務數(shù)據冗余,提高數(shù)據穩(wěn)定和邏輯性,按照標識屬性的方式對各業(yè)務數(shù)據對向進行劃分,本體數(shù)據的標準按照對象進行標識,本體數(shù)據的特征數(shù)據按照數(shù)據類型、業(yè)務類型、空間關聯(lián)程度等進行屬性的劃分。
圖3 對象與其屬性的數(shù)據模型
對象與其屬性建模以水庫為例進行說明,唯一數(shù)據編碼按照水庫對象標識進行存儲,水庫名稱可以作為基本屬性進行標識,水庫編碼可以作為所所屬類型進行屬性對象的標識,水庫蓄水容量等其他信息可以按照特征屬性進行標識。水庫設計指標、防洪特征指標、水庫運行情況等作為業(yè)務屬性數(shù)據進行存儲和標識,以面狀信息對空間數(shù)據的比例尺進行空間匹配,以點狀信息對小空間尺度數(shù)據進行匹配。水庫特征、標識、屬性數(shù)據均存在時空特征。例如水庫除險、不同蓄水位下水庫淹沒范圍等情況。以水庫工程為例的具體數(shù)據模型如圖4所示:
按照統(tǒng)一集中更新和維護的機制對數(shù)據模型中各類數(shù)據空間屬性、數(shù)據特征進行標識,各業(yè)務分管部門對業(yè)務數(shù)據進行更新和維護。本文擬針對對象建立標識表及其屬性表,并且在標識表和屬性表中考慮時相特征的存儲。
3.2.1數(shù)據關聯(lián)關系
水利不同對象數(shù)據之間存在一定的關聯(lián)關系,表述各業(yè)務數(shù)據之間的關聯(lián)程度,這種關聯(lián)程度較大的情況下,一旦關聯(lián)性有所影響,則不能建立數(shù)據對象之間的關聯(lián)程度。因此需要建立數(shù)據之間較好的關聯(lián)度。如:某個水庫其大壩屬于附屬關聯(lián),則水庫則和某行政區(qū)域可進行關聯(lián)。具體數(shù)據模型如下圖中用實線表達的關系。
3.2.2邏輯關系
另外,不同數(shù)據對象之間存在關聯(lián)度,也存在一定的邏輯關系,但不能影響數(shù)據之間的關聯(lián)程度,因此要建立數(shù)據之間的邏輯關聯(lián)度。主要包含:不同數(shù)據對象之間的邏輯關聯(lián)度,如業(yè)務關聯(lián)度和水庫對象關聯(lián)度,水庫與檔案對象之間的邏輯關聯(lián)度。具體數(shù)據模型如圖5所示用虛線表達的關系。
圖4 以水庫為例的數(shù)據模型示意圖
圖5 對象關聯(lián)關系示意圖
3.2.3空間關系
數(shù)據之間存在空間關聯(lián)程度。比如水庫之間的排污口的具體位置。通過關聯(lián)關系建立無空間屬性和有空間屬性之間的空間邏輯關聯(lián)關系,如:“水庫安全加固初步設計報告的審批材料”這個信息數(shù)據可以與水庫空間特征屬性進行相對應的標識。
(1)在信息資源整合和共享建設中,整合或鏡像備份數(shù)據應在數(shù)據結構、數(shù)據關聯(lián)度上與原應用系統(tǒng)在邏輯上保持一致。
(2)數(shù)據倉庫建議全要素綜合設計,按照“急用新行”的原則選擇重點業(yè)務進行數(shù)據資源整合共享建設設施,再逐步向其他業(yè)務逐步擴展建設。
(3)水利基礎數(shù)據庫和水利業(yè)務數(shù)據庫的模型設計應以ODS數(shù)據模型為核心建立基礎數(shù)據模型,并在此基礎上根據業(yè)務劃分進行重新組織和擴展,添加匯總及派生對應數(shù)據。