付婷, 陳紅, 方志堅(jiān), 陳智鵬, 王金發(fā), 陳婷
(1. 國網(wǎng)福建省電力有限公司信息通信分公司, 福建, 福州 350001;2. 國網(wǎng)信通億力科技有限責(zé)任公司, 福建, 福州 350001)
目前電力企業(yè)在日常業(yè)務(wù)處理過程中會產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)分散在各類信息化系統(tǒng)之中,比較孤立,難以關(guān)聯(lián)起來挖掘潛在價(jià)值,如何集成多個(gè)異構(gòu)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行統(tǒng)一規(guī)劃管理是電力行業(yè)面臨的難題。為了消除信息孤島、有效管理,本文設(shè)計(jì)多平臺電力行業(yè)元數(shù)據(jù)管理系統(tǒng),按照主題劃分?jǐn)?shù)據(jù)域,構(gòu)建統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)倉庫,針對數(shù)據(jù)來源、影響范圍、關(guān)聯(lián)關(guān)系進(jìn)行分析,為電力行業(yè)數(shù)據(jù)治理提供有效手段。
元數(shù)據(jù)簡單來說是描述數(shù)據(jù)的數(shù)據(jù),指的是某類數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)、類型、約束等。比如書名、作業(yè)、出版社等就是一本書的元數(shù)據(jù)。它最主要的作用是對系統(tǒng)進(jìn)行描述,如果缺少了元數(shù)據(jù),那么已收集的數(shù)據(jù)就失去了價(jià)值。
元數(shù)據(jù)沒有明確要求如何分類,可以從多種維度進(jìn)行劃分,例如從記錄形式可以分為結(jié)構(gòu)化和非結(jié)構(gòu)化,對于電力數(shù)據(jù)來說,可以根據(jù)用途分為業(yè)務(wù)元數(shù)據(jù)和技術(shù)元數(shù)據(jù)2類。
(1) 業(yè)務(wù)元數(shù)據(jù):從業(yè)務(wù)角度去描述,提供一個(gè)語義層,描述業(yè)務(wù)信息、業(yè)務(wù)下是數(shù)據(jù)模型、數(shù)據(jù)屬性、數(shù)據(jù)來源等。
(2) 技術(shù)元數(shù)據(jù):主要記錄建設(shè)和管理過程中需要使用的信息,包括視圖、層次、維度、數(shù)據(jù)表、關(guān)聯(lián)關(guān)系、轉(zhuǎn)換規(guī)則等[1]。
包括建設(shè)、運(yùn)行、維護(hù)在內(nèi)的系統(tǒng)整體生命周期內(nèi)一直都在產(chǎn)生元數(shù)據(jù),根據(jù)存儲方式的差異可以將元數(shù)據(jù)管理劃分為分散式、集中式、聯(lián)邦式幾類。分散式是指存儲在不同的局部數(shù)據(jù)庫,通過接口進(jìn)行數(shù)據(jù)提取,訪問容易但交互較難。集中式是指從局部數(shù)據(jù)庫采集之后統(tǒng)一存儲,元數(shù)據(jù)與數(shù)據(jù)源獨(dú)立,但數(shù)據(jù)同步頻繁。聯(lián)邦式是將以上2種方式結(jié)合,構(gòu)建共享元數(shù)據(jù)庫,局部存儲可以異構(gòu),共享格式需統(tǒng)一。
在實(shí)際管理過程中,存在以下難點(diǎn):
(1) 獲取困難:由于數(shù)據(jù)源系統(tǒng)架構(gòu)差異,很多平臺具有閉源性,元數(shù)據(jù)采集方式各不相同且獲取困難。
(2) 業(yè)務(wù)類元數(shù)據(jù)欠缺:技術(shù)類信息描述較多,業(yè)務(wù)類欠缺,不利于數(shù)據(jù)提取與數(shù)據(jù)挖掘。
(3) 模型變更頻繁:隨著企業(yè)業(yè)務(wù)變更,模型需要及時(shí)更新進(jìn)行數(shù)據(jù)同步,管理過程有疏漏直接會影響數(shù)據(jù)質(zhì)量。
CWM(Common Warehouse Metamodel)是OMG采納的開發(fā)式業(yè)界標(biāo)準(zhǔn),可以實(shí)現(xiàn)不同的數(shù)據(jù)倉庫、智能裝置及元倉儲庫之間元數(shù)據(jù)共享與交換,提供了異構(gòu)環(huán)境中數(shù)據(jù)交互、數(shù)據(jù)集成的標(biāo)準(zhǔn)模型,提供了元數(shù)據(jù)管理的語法,基于以下標(biāo)準(zhǔn)制定:
(1) UML:面向?qū)ο蟮臉?biāo)準(zhǔn)圖形化建模語言(Unified Modeling Language),專注于產(chǎn)品模型與結(jié)構(gòu),跨平臺的定義了CWM模型的語法語義。
(2) MOF:元對象工具(Meta Object Facility)是指構(gòu)造、管理、集成元數(shù)據(jù)模型的框架,支持多種元數(shù)據(jù),用于構(gòu)建CWM模型并提供接口[2-3]。
(3) XML:元數(shù)據(jù)交換(XML Metadata Iterchange)標(biāo)準(zhǔn)可以將元數(shù)據(jù)轉(zhuǎn)換為XML格式,提供了異構(gòu)數(shù)據(jù)交換的規(guī)范。
UML建模語言由語義、語法組成,語義提供簡單統(tǒng)一的定義性的描述,語法描述符號含義,基本元素包括描述某個(gè)部分的事務(wù)、多個(gè)事務(wù)之間的關(guān)系以及由事務(wù)和關(guān)聯(lián)關(guān)系構(gòu)成的圖。電力行業(yè)的數(shù)據(jù)來源于各個(gè)子平臺,實(shí)現(xiàn)方式不一致,而且由于電力行業(yè)發(fā)展新系統(tǒng)投入力度也較大,對模型的擴(kuò)展性有很高的要求,因此,本文采用UML建模語言來實(shí)現(xiàn)電力行業(yè)數(shù)據(jù)采集建模。
PowerDesigner是Sybase公司開發(fā)的建模工具,涵蓋了模型開發(fā)與設(shè)計(jì)的各個(gè)環(huán)節(jié),包括各種類圖、包圖、類、各個(gè)類之間的關(guān)系、各個(gè)類的屬性等,提供了UML模型到關(guān)系數(shù)據(jù)庫之間的映射,實(shí)現(xiàn)了模型到實(shí)際應(yīng)用的數(shù)據(jù)庫之間的轉(zhuǎn)換。主要包括:
(1) 類:描述具有相同屬性和行為的一類對象,包括多個(gè)屬性和方法。
(2) 包:根據(jù)類的含義、用途,相關(guān)的劃分到一組,即稱為包。
(3) 關(guān)聯(lián):對象是獨(dú)立的,但是屬性有依賴關(guān)系,即為關(guān)聯(lián)。
(4) 繼承:繼承其他對象的屬性或行為,方便對類進(jìn)行擴(kuò)展。
(5) 組合/聚合:描述整體與部分的關(guān)系。
電力系統(tǒng)按照時(shí)間順序可以分為前期建設(shè)、運(yùn)行管理、后期運(yùn)維、后續(xù)演進(jìn)等階段,不同階段會產(chǎn)生不同的元數(shù)據(jù),同一階段內(nèi)按照用途區(qū)分也可以分為多種類別,本文設(shè)計(jì)的系統(tǒng)結(jié)合數(shù)據(jù)用途,將元數(shù)據(jù)劃分為6個(gè)大的主題域之后再進(jìn)行細(xì)分,具體如表1所示:
表1 數(shù)據(jù)域劃分
結(jié)合電力數(shù)據(jù)特點(diǎn),本文為6個(gè)主題域數(shù)據(jù)建模如下:
(1) 網(wǎng)絡(luò)資源元數(shù)據(jù)
網(wǎng)絡(luò)資源元數(shù)據(jù)包括邏輯資源和物理資源以及業(yè)務(wù)系統(tǒng)、資源規(guī)格等。其中:邏輯資源包括傳輸網(wǎng)、交換網(wǎng)等;物理資源包括光纜、管線、電纜等。本文以光纜為例,結(jié)合光纜的網(wǎng)狀結(jié)構(gòu),設(shè)計(jì)光纖型號模型包括如下字段:唯一標(biāo)識、名稱、編碼、使用評估、管束結(jié)構(gòu)、管束數(shù)、芯數(shù)、纖芯型號、光纜結(jié)構(gòu)、光纜外徑、光纜類型、短路電流、抗拉強(qiáng)度、生產(chǎn)商、光纖內(nèi)管束色譜等[4-5]。
(2) 網(wǎng)絡(luò)行為元數(shù)據(jù)
網(wǎng)絡(luò)行為元數(shù)據(jù)是系統(tǒng)運(yùn)行過程中產(chǎn)生的告警數(shù)據(jù)、狀態(tài)以及性能數(shù)據(jù)。本文以告警數(shù)據(jù)為例,設(shè)計(jì)告警元數(shù)據(jù)模型包括如下字段:告警id、告警設(shè)備id、告警對象、告警級別、告警類型、描述、告警時(shí)間、系統(tǒng)、確認(rèn)狀態(tài)、確認(rèn)人、機(jī)框id、槽位id、板卡id、機(jī)房名稱、電路名稱等。
(3) 業(yè)務(wù)元數(shù)據(jù)
業(yè)務(wù)元數(shù)據(jù)包括系統(tǒng)信息、業(yè)務(wù)信息、業(yè)務(wù)類型以及承載通道、網(wǎng)元等。業(yè)務(wù)元數(shù)據(jù)模型需包括:唯一標(biāo)識id、業(yè)務(wù)類型、名稱、等級、保護(hù)裝置類型、區(qū)域、投運(yùn)時(shí)間、備注等。
(4) 運(yùn)維元數(shù)據(jù)
運(yùn)維元數(shù)據(jù)包括運(yùn)維過程中產(chǎn)生的各類工單及相關(guān)管理數(shù)據(jù),電力系統(tǒng)的運(yùn)維管理包括通信調(diào)度、故障工單、檢修、運(yùn)行分析、資源維護(hù)等。本文以故障工單為例,設(shè)計(jì)模型包括:唯一標(biāo)識id、工單狀態(tài)、工單編號、故障內(nèi)容、故障類型、來源、等級、生成時(shí)間、報(bào)備時(shí)間、報(bào)備人員、聯(lián)系方式、是否影響業(yè)務(wù)、處理方法等。
(5) 網(wǎng)絡(luò)規(guī)劃元數(shù)據(jù)
網(wǎng)絡(luò)規(guī)劃元數(shù)據(jù)包括光纜、傳輸、交換網(wǎng)等的規(guī)劃數(shù)據(jù),設(shè)計(jì)模型包括:規(guī)劃標(biāo)識id、項(xiàng)目信息、版本、規(guī)劃單位、提交時(shí)間、內(nèi)容等。
(6) 供應(yīng)商元數(shù)據(jù)
電力系統(tǒng)的各類資源通常由供應(yīng)商提供,本文以供應(yīng)設(shè)備為例,對相關(guān)信息建模如下:設(shè)備標(biāo)識id、設(shè)備名稱、類型、數(shù)量、生產(chǎn)廠家、供應(yīng)商、出廠編號、出廠時(shí)間、投運(yùn)時(shí)間、升級履歷、備注等。
本系統(tǒng)所需開發(fā)環(huán)境如下。
操作系統(tǒng):Windows Server 2012 R2
開發(fā)語言:Java
中間件:Tomcat7.0.77
前端:Vue2.5.2
后端:Spring4.3.13
數(shù)據(jù)庫:MySQL5.7
基于目前電力行業(yè)元數(shù)據(jù)管理的現(xiàn)狀,多平臺元數(shù)據(jù)管理系統(tǒng)需要集成各個(gè)異構(gòu)平臺的數(shù)據(jù),功能模塊主要劃分為采集、存儲與分析,結(jié)構(gòu)如圖1所示。
(1) 采集層:集成多平臺數(shù)據(jù),異構(gòu)數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式后存入元數(shù)據(jù)庫。
(2) 應(yīng)用層:對元數(shù)據(jù)的來源管理、入庫審核、血緣分析、影響范圍分析、關(guān)聯(lián)性分析、查詢、編輯、歷史版本查詢等。
(3) 展現(xiàn)層:用戶操作界面,查詢屬性、分析結(jié)果等[6]。
本系統(tǒng)設(shè)計(jì)時(shí)后端處理采用Spring框架,前端展示采用Vue技術(shù),控制策略利用MVC模式,技術(shù)整體架構(gòu)如圖2所示。
圖2 技術(shù)架構(gòu)
元數(shù)據(jù)采集是整個(gè)元數(shù)據(jù)管理的基礎(chǔ),是一個(gè)從各類異構(gòu)平臺獲取原始數(shù)據(jù)后進(jìn)行格式規(guī)范化存入最終數(shù)據(jù)庫的過程。由于多平臺數(shù)據(jù)格式各不相同,需要進(jìn)行數(shù)據(jù)適配,并且涉及目錄掛靠、多次采集、數(shù)據(jù)更新、入庫審核、記錄日志等。具體流程如圖3所示。
圖3 元數(shù)據(jù)采集流程
元數(shù)據(jù)數(shù)據(jù)庫是元數(shù)據(jù)管理的核心,電力系統(tǒng)數(shù)據(jù)倉庫所有的數(shù)據(jù)都將存儲在元數(shù)據(jù)數(shù)據(jù)庫之中。元數(shù)據(jù)數(shù)據(jù)庫與其他普通數(shù)據(jù)庫不同的一點(diǎn)在于需要進(jìn)行異構(gòu)元數(shù)據(jù)交互,它的數(shù)據(jù)模型結(jié)構(gòu)和語義必須具備統(tǒng)一標(biāo)準(zhǔn),而且有規(guī)范的數(shù)據(jù)交互協(xié)議,各個(gè)廠商各個(gè)系統(tǒng)均可以進(jìn)行數(shù)據(jù)轉(zhuǎn)換,利于系統(tǒng)集成。本文基于CWM標(biāo)準(zhǔn)來設(shè)計(jì)元數(shù)據(jù)存儲數(shù)據(jù)庫,最終通過數(shù)據(jù)類型映射在MySQL數(shù)據(jù)庫中實(shí)現(xiàn),映射為實(shí)際數(shù)據(jù)庫關(guān)系模型。
元數(shù)據(jù)分析主要分為影響分析、關(guān)聯(lián)分析與血緣分析。
(1) 影響分析:分析數(shù)據(jù)影響范圍,正向分析數(shù)據(jù)終點(diǎn),幫助電力企業(yè)解決無法精準(zhǔn)定位問題。
(2) 關(guān)聯(lián)分析:分析信息重要性,實(shí)現(xiàn)評估,幫助電力企業(yè)重要數(shù)據(jù)優(yōu)化。
(3) 血緣分析:分析數(shù)據(jù)來源,反向分析數(shù)據(jù)起點(diǎn),幫助電力企業(yè)實(shí)現(xiàn)數(shù)據(jù)追溯。
元數(shù)據(jù)管理主要管理互相之間的關(guān)聯(lián)關(guān)系以及元數(shù)據(jù)的基礎(chǔ)信息,包括前端展示的元數(shù)據(jù)信息查詢、關(guān)聯(lián)關(guān)系維護(hù)、修改元數(shù)據(jù)屬性、增刪改查原始記錄、歷史版本管理等,發(fā)揮出收集存儲的元數(shù)據(jù)的深層價(jià)值[7]。
本文介紹了元數(shù)據(jù)的作用與管理難點(diǎn),采用業(yè)界通用標(biāo)準(zhǔn)建立了電力行業(yè)網(wǎng)絡(luò)資源、網(wǎng)絡(luò)行為、業(yè)務(wù)、運(yùn)維、規(guī)劃、供應(yīng)商6個(gè)數(shù)據(jù)域的元數(shù)據(jù)模型,深入研究元數(shù)據(jù)的采集、存儲與數(shù)據(jù)分析維度,為電力元數(shù)據(jù)的統(tǒng)一管理提供了可行方案。但由于電力通信網(wǎng)的發(fā)展,本文設(shè)計(jì)的各類模型及系統(tǒng)功能模塊都需要進(jìn)行擴(kuò)展與調(diào)整,因此,元數(shù)據(jù)模型的延展性提升是后續(xù)將持續(xù)研究的方向。