佘俊 周宇鵬 王林 董天波 蘭天
摘 要 隨著物聯(lián)網(wǎng)、大數(shù)據(jù)等IT技術(shù)的快速發(fā)展,產(chǎn)生了大量多源異構(gòu)的數(shù)據(jù),但這些數(shù)據(jù)往往是各自為政、孤立存在,數(shù)據(jù)中蘊(yùn)藏的知識(shí)和價(jià)值不能得到有效釋放。首先分析了工業(yè)大數(shù)據(jù)的現(xiàn)狀和特性,針對(duì)大數(shù)據(jù)時(shí)代的數(shù)據(jù)應(yīng)用挑戰(zhàn),提出元數(shù)據(jù)驅(qū)動(dòng)的大數(shù)據(jù)服務(wù)平臺(tái)的體系結(jié)構(gòu),利用元數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化管理,并驅(qū)動(dòng)合適粒度的數(shù)據(jù)服務(wù),實(shí)現(xiàn)大數(shù)據(jù)時(shí)代的數(shù)據(jù)自服務(wù)平臺(tái),推動(dòng)數(shù)據(jù)共享和價(jià)值釋放。
關(guān)鍵詞 大數(shù)據(jù);元數(shù)據(jù);數(shù)據(jù)服務(wù)
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)206-0105-03
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)等IT技術(shù)的快速發(fā)展,包括電力企業(yè)在內(nèi)的行業(yè)均產(chǎn)生大量的數(shù)據(jù),其數(shù)據(jù)儲(chǔ)存也占據(jù)著大量的資源,依據(jù)相關(guān)數(shù)據(jù)限制,在未來(lái)的發(fā)展中其數(shù)據(jù)總量呈現(xiàn)上升趨勢(shì),大數(shù)據(jù)時(shí)代屬于一場(chǎng)前所未有的革命。當(dāng)前大數(shù)據(jù)主要應(yīng)用在互聯(lián)網(wǎng)、傳統(tǒng)商業(yè)領(lǐng)域,主要是開展客戶挖掘、購(gòu)物行為預(yù)測(cè),購(gòu)物需求分析等。在信息時(shí)代下,工業(yè)化生產(chǎn)逐漸朝著智能化、柔性化的方向發(fā)展。不管是在生產(chǎn)設(shè)備,或者是感知設(shè)備均屬于數(shù)據(jù)的生產(chǎn)者。依據(jù)相關(guān)資料顯示,制造行業(yè)內(nèi)的數(shù)據(jù)儲(chǔ)存量明顯高于其他行業(yè)。在2012年其數(shù)據(jù)儲(chǔ)存量已經(jīng)接近于2EB。隨著數(shù)據(jù)儲(chǔ)存量的增長(zhǎng),其管理難度、數(shù)據(jù)種類也在不斷變化,呈爆炸式增長(zhǎng)趨勢(shì),直接導(dǎo)致工業(yè)大數(shù)據(jù)爆發(fā)[ 1 ]。德國(guó)的4.0工業(yè)、美國(guó)的工業(yè)互聯(lián)網(wǎng)行業(yè)的深入發(fā)展以及“中國(guó)制造2025”規(guī)劃,將促使智能化分析與物聯(lián)網(wǎng)實(shí)現(xiàn)密切配合,以此對(duì)現(xiàn)存的生產(chǎn)方式、管理方式進(jìn)行轉(zhuǎn)變[ 2 ]。德國(guó)4.0工業(yè)也提出過(guò)“智能工廠”“智能物流”等發(fā)展理念,在任何一種發(fā)現(xiàn)理念中,其數(shù)據(jù)屬于底層核心。工業(yè)4.0就是將多源異構(gòu)的數(shù)據(jù)整合并支撐前端智能的過(guò)程。無(wú)疑,數(shù)據(jù)將會(huì)滲透到企業(yè)運(yùn)營(yíng)的整個(gè)生命周期,推動(dòng)制造業(yè)向智能化轉(zhuǎn)型,意味著工業(yè)大數(shù)據(jù)時(shí)代到來(lái)[ 3 ]。
結(jié)合相關(guān)資料,工業(yè)大數(shù)據(jù)本身具備采樣性、多樣性的排列順序,其數(shù)據(jù)還具備混雜性的特點(diǎn)[4]。工業(yè)數(shù)據(jù)主要分為密集數(shù)據(jù)、慢數(shù)據(jù)、快數(shù)據(jù)。通過(guò)深入分析發(fā)現(xiàn),工業(yè)數(shù)據(jù)還具有多源性、廣泛性、動(dòng)態(tài)性的特點(diǎn),在工業(yè)數(shù)據(jù)的應(yīng)用與管理上存在著較多的問(wèn)題與挑戰(zhàn)。主要是因?yàn)楣I(yè)數(shù)據(jù)涉及的部門較多,其涉及的領(lǐng)域也比較廣,在實(shí)際工作中面臨著數(shù)據(jù)安全、所有權(quán)、質(zhì)量、管理、控制等問(wèn)題。加之當(dāng)前我國(guó)對(duì)工業(yè)數(shù)據(jù)管理與控制上還未能形成統(tǒng)一的管理制度與管理固定,在實(shí)際的管理中“信息孤島”現(xiàn)象普遍存在。這就對(duì)工業(yè)產(chǎn)生的海量數(shù)據(jù),如何進(jìn)行合理管理,科學(xué)儲(chǔ)存,以此提升數(shù)據(jù)資源的利用率,成為當(dāng)前工業(yè)行業(yè)改革的重點(diǎn)問(wèn)題之一。
使用元數(shù)據(jù),能夠?qū)I(yè)數(shù)據(jù)進(jìn)行目錄化管理,實(shí)現(xiàn)數(shù)據(jù)服務(wù),這類技術(shù)能夠彌補(bǔ)傳統(tǒng)數(shù)據(jù)集中中的缺陷,特別是數(shù)據(jù)集成不完善問(wèn)題。從而能使工業(yè)大數(shù)據(jù)能得到更好的存儲(chǔ)和共享。
1 平臺(tái)體系架構(gòu)
多源異構(gòu)的數(shù)據(jù)就像一個(gè)個(gè)信息孤島,如何集成到統(tǒng)一的數(shù)據(jù)中心并在統(tǒng)一管理下對(duì)外提供數(shù)據(jù)服務(wù)是研究的重點(diǎn)。為了打破數(shù)據(jù)壁壘,釋放數(shù)據(jù)價(jià)值,應(yīng)用元數(shù)據(jù)管理技術(shù)建立元數(shù)據(jù)管理平臺(tái),實(shí)現(xiàn)元數(shù)據(jù)的采集、變更、刪除及檢索,并在元數(shù)據(jù)的驅(qū)動(dòng)下實(shí)現(xiàn)數(shù)據(jù)的抽取、轉(zhuǎn)換、加載,結(jié)合數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)模型管理和數(shù)據(jù)質(zhì)量管理,建立電子化數(shù)據(jù)目錄,最終實(shí)現(xiàn)統(tǒng)一的對(duì)外數(shù)據(jù)服務(wù)。
數(shù)據(jù)中心將來(lái)源于設(shè)備狀態(tài)監(jiān)測(cè)、企業(yè)管理信息系統(tǒng)等不同來(lái)源、不同特性的數(shù)據(jù)通過(guò)統(tǒng)一的ETL過(guò)程存儲(chǔ)下來(lái),并在此過(guò)程中實(shí)現(xiàn)元數(shù)據(jù)的采集和稽核,建立電子化的數(shù)據(jù)目錄并存儲(chǔ)在元數(shù)據(jù)庫(kù)中,同時(shí)在服務(wù)平臺(tái)上建立適當(dāng)粒度的數(shù)據(jù)服務(wù)。外部應(yīng)用可以在元數(shù)據(jù)管理平臺(tái)中檢索元數(shù)據(jù)和數(shù)據(jù)服務(wù),并構(gòu)成數(shù)據(jù)服務(wù)請(qǐng)求進(jìn)而訪問(wèn)數(shù)據(jù),從而實(shí)現(xiàn)應(yīng)用系統(tǒng)以自助式、自主式的方式獲得數(shù)據(jù),真正意義上打破數(shù)據(jù)壁壘,實(shí)現(xiàn)工業(yè)大數(shù)據(jù)環(huán)境下的數(shù)據(jù)自服務(wù),釋放數(shù)據(jù)價(jià)值。
2 關(guān)鍵技術(shù)
2.1 元數(shù)據(jù)管理
元數(shù)據(jù)是一種結(jié)構(gòu)化的信息,用于對(duì)某項(xiàng)信息資源進(jìn)行描述、解釋、定位,使其易于提取和使用。工業(yè)大數(shù)據(jù)時(shí)代,如何從海量數(shù)據(jù)中發(fā)現(xiàn)知識(shí)進(jìn)行分析成為難題。為此通過(guò)元數(shù)據(jù)管理高效支撐海量數(shù)據(jù)資產(chǎn)的快速識(shí)別定位、高效有序管理和智能便捷應(yīng)用,使決策者知曉數(shù)據(jù)資產(chǎn)概況,管理者知曉數(shù)據(jù)資產(chǎn)的健康運(yùn)行狀況,使用者知曉數(shù)據(jù)資產(chǎn)的來(lái)龍去脈。
元數(shù)據(jù)包括業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)和管理元數(shù)據(jù)。元數(shù)據(jù)管理以業(yè)務(wù)模型為切入點(diǎn),以數(shù)據(jù)模型(特指基于業(yè)務(wù)原始數(shù)據(jù)且未進(jìn)行邏輯加工處理的模型)為中心,制定業(yè)務(wù)模型和數(shù)據(jù)模型標(biāo)準(zhǔn),管理數(shù)據(jù)模型、數(shù)據(jù)應(yīng)用、數(shù)據(jù)集成、數(shù)據(jù)處理、數(shù)據(jù)視圖等對(duì)象元數(shù)據(jù)信息,監(jiān)控標(biāo)準(zhǔn)的執(zhí)行情況。
元數(shù)據(jù)管理包含元數(shù)據(jù)采集、元數(shù)據(jù)維護(hù)、元數(shù)據(jù)發(fā)布、血緣分析、影響度分析、表關(guān)聯(lián)度分析、元數(shù)據(jù)稽核等功能。通過(guò)自動(dòng)采集ETL轉(zhuǎn)換過(guò)程,對(duì)結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行統(tǒng)一管理,進(jìn)而支撐上層數(shù)據(jù)服務(wù)。
2.2 數(shù)據(jù)標(biāo)準(zhǔn)管理
數(shù)據(jù)標(biāo)準(zhǔn)管理要符合企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)管理的相關(guān)辦法,落實(shí)數(shù)據(jù)標(biāo)準(zhǔn)管理相關(guān)人員的職責(zé),固化數(shù)據(jù)標(biāo)準(zhǔn)管理的流程規(guī)范。
數(shù)據(jù)標(biāo)準(zhǔn)管理通過(guò)采集抽取元數(shù)據(jù),建立標(biāo)準(zhǔn)數(shù)據(jù)與元數(shù)據(jù)映射,并對(duì)關(guān)鍵元數(shù)據(jù)進(jìn)行篩選,按照業(yè)務(wù)、地域、系統(tǒng)3個(gè)維度進(jìn)行劃分形成數(shù)據(jù)目錄,數(shù)據(jù)目錄支持按維度下鉆瀏覽,同時(shí)支持?jǐn)?shù)據(jù)標(biāo)準(zhǔn)對(duì)數(shù)據(jù)地圖進(jìn)行探索;數(shù)據(jù)標(biāo)準(zhǔn)管理支持?jǐn)?shù)據(jù)分布智能查詢、數(shù)據(jù)分布瀏覽功能??筛鶕?jù)元數(shù)據(jù)信息及專業(yè)數(shù)據(jù),結(jié)合業(yè)務(wù)經(jīng)驗(yàn),將具有詞典意義的單詞定義為標(biāo)準(zhǔn)單詞,也可將多個(gè)單詞組合成業(yè)務(wù)術(shù)語(yǔ)或技術(shù)用語(yǔ)。
2.3 數(shù)據(jù)模型管理
數(shù)據(jù)模型管理是對(duì)企業(yè)概念模型、邏輯模型和物理模型進(jìn)行統(tǒng)一管理,覆蓋模型的設(shè)計(jì)、發(fā)布和應(yīng)用等各階段。數(shù)據(jù)模型管理將企業(yè)模型管理規(guī)范、模型與數(shù)據(jù)庫(kù)映射管理導(dǎo)入數(shù)據(jù)模型管理組件中,并提供模型信息維護(hù)、版本管理、業(yè)務(wù)模型與物理模型映射等功能。數(shù)據(jù)模型管理也提供模型的可視化展現(xiàn)、在設(shè)計(jì)期、開發(fā)期、運(yùn)行期的模型分析比對(duì)、模型的分發(fā)功能,進(jìn)行模型的全生命周期管理。
2.4 數(shù)據(jù)服務(wù)總線
數(shù)據(jù)服務(wù)總線建立基于元數(shù)據(jù)和數(shù)據(jù)模型的對(duì)外數(shù)據(jù)服務(wù),采用基于數(shù)據(jù)模型的可視化配置的方式,節(jié)省繁復(fù)的接口腳本編寫過(guò)程,提高數(shù)據(jù)服務(wù)的效率。
數(shù)據(jù)服務(wù)總線提供的統(tǒng)一的數(shù)據(jù)服務(wù)目錄,對(duì)數(shù)據(jù)資產(chǎn)的產(chǎn)生、位置、責(zé)任單位、共享范圍、更新維護(hù)方式、服務(wù)方式等方面的信息進(jìn)行全面描述,為企業(yè)提供統(tǒng)一的數(shù)據(jù)資源全景地圖,明確信息資源有什么,在哪里,誰(shuí)負(fù)責(zé),做到“信息清、資源清”。
通過(guò)數(shù)據(jù)服務(wù)標(biāo)準(zhǔn)化開放訪問(wèn),幫助數(shù)據(jù)中心和應(yīng)用中心實(shí)現(xiàn)應(yīng)用和數(shù)據(jù)分離,提高應(yīng)用開發(fā)效率和生產(chǎn)效率。訪問(wèn)接口支持Web?Service、Http/ Rest、FTP等,并提供統(tǒng)一的服務(wù)封裝能力,將對(duì)外共享的數(shù)據(jù)按照一定粒度封裝為獨(dú)立的服務(wù)實(shí)體,盡可能屏蔽內(nèi)部的細(xì)節(jié),只提供標(biāo)準(zhǔn)化的交互接口,保證了數(shù)據(jù)的安全性和數(shù)據(jù)交換的標(biāo)準(zhǔn)化。
3 應(yīng)用實(shí)踐
中國(guó)南方電網(wǎng)有限責(zé)任公司調(diào)峰調(diào)頻發(fā)電公司成立于2006年7月,隸屬于中國(guó)南方電網(wǎng)有限責(zé)任公司。公司主要負(fù)責(zé)南方電網(wǎng)區(qū)域內(nèi)的調(diào)峰、調(diào)頻電廠的運(yùn)營(yíng)、維護(hù)、管理和建設(shè)工作。其工作目的是為南方電網(wǎng)提供優(yōu)質(zhì)運(yùn)行服務(wù),確保南方電網(wǎng)的安全性、經(jīng)濟(jì)性。目前,公司的已投運(yùn)機(jī)組容量642萬(wàn)kW,在建機(jī)組容量158萬(wàn)kW,前期開發(fā)項(xiàng)目容量660萬(wàn)kW。公司的管轄范圍主要包括:調(diào)峰、調(diào)頻、調(diào)相、事故備用等,是確保電網(wǎng)安全運(yùn)行的關(guān)鍵環(huán)節(jié),直接帶動(dòng)了當(dāng)?shù)亟?jīng)濟(jì)的發(fā)展。
當(dāng)前調(diào)峰調(diào)頻發(fā)電公司正在開展圍繞發(fā)電設(shè)備狀態(tài)監(jiān)測(cè)的狀態(tài)監(jiān)測(cè)中心研究與建設(shè)工作。其軟件環(huán)境分為數(shù)據(jù)中心和應(yīng)用中心兩大部分。數(shù)據(jù)中心集中存儲(chǔ)設(shè)備準(zhǔn)實(shí)時(shí)數(shù)據(jù)和管理業(yè)務(wù)的結(jié)構(gòu)化數(shù)據(jù),分為采集層、存儲(chǔ)層、數(shù)據(jù)倉(cāng)庫(kù)層、數(shù)據(jù)服務(wù)層。應(yīng)用中心以輕量化應(yīng)用的思路,遵循OSGi技術(shù)規(guī)范,支持PC端、移動(dòng)端的組件化應(yīng)用。
通過(guò)應(yīng)用元數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)服務(wù)平臺(tái),狀態(tài)監(jiān)測(cè)中心的數(shù)據(jù)中心已具備各類準(zhǔn)實(shí)時(shí)的設(shè)備監(jiān)測(cè)數(shù)據(jù)和結(jié)構(gòu)化的業(yè)務(wù)系統(tǒng)數(shù)據(jù)統(tǒng)一采集、存儲(chǔ)、綜合管理、分析和數(shù)據(jù)服務(wù)等功能,初步實(shí)現(xiàn)應(yīng)用和數(shù)據(jù)的解耦,為設(shè)備實(shí)時(shí)管理、企業(yè)實(shí)時(shí)管控和科學(xué)決策提供支持。
4 結(jié)論
隨著數(shù)據(jù)的指數(shù)級(jí)爆發(fā)式增長(zhǎng),企業(yè)信息化轉(zhuǎn)型和數(shù)字化驅(qū)動(dòng)的迫切需求,如何應(yīng)對(duì)大數(shù)據(jù)時(shí)代,從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)并驅(qū)動(dòng)企業(yè)發(fā)展,成為當(dāng)前的熱點(diǎn)問(wèn)題。提出元數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)服務(wù)平臺(tái),適合大數(shù)據(jù)的存儲(chǔ)分析應(yīng)用需求,是實(shí)現(xiàn)數(shù)據(jù)自服務(wù)、推動(dòng)企業(yè)數(shù)據(jù)化運(yùn)營(yíng)的可行路線。在未來(lái)的工作中,要考慮如何將數(shù)據(jù)服務(wù)平臺(tái)支撐的應(yīng)用效果反饋到平臺(tái)中,實(shí)現(xiàn)閉環(huán)的數(shù)據(jù)服務(wù)體系,對(duì)設(shè)備監(jiān)測(cè)和企業(yè)管理進(jìn)行控制優(yōu)化。
參考文獻(xiàn)
[1]GE智能平臺(tái).工業(yè)大數(shù)據(jù)云利用大數(shù)據(jù)集推動(dòng)創(chuàng)新、競(jìng)爭(zhēng)和增長(zhǎng)[J].自動(dòng)化博覽,2012(12):40-42.
[2]羅平.淺談工業(yè)大數(shù)據(jù)的價(jià)值實(shí)現(xiàn)方式[J].商,2015(29):210-2l1.
[3]馬蕾.何為工業(yè)大數(shù)據(jù)[J].經(jīng)營(yíng)者(汽車商業(yè)評(píng)論),2015(7):105-108.
[4]劉強(qiáng),秦泗釗.過(guò)程工業(yè)大數(shù)據(jù)建模研究展望[J].自動(dòng)化學(xué)報(bào),2016(2):161-171.
[5]王淑芬.基于大數(shù)據(jù)的制造運(yùn)行監(jiān)測(cè)與分析平臺(tái)研究[D].廣州:廣東工業(yè)大學(xué),2014.