秦苻珂 李曉龍
(1.北京國研信息工程監(jiān)理咨詢有限公司;2.國網節(jié)能服務有限公司,北京 102206)
隨著我國電力系統(tǒng)智能化、數據化建設的不斷深入,電網運行、電力設備監(jiān)測、電力企業(yè)營銷及管理等產生的數據量呈指數級增長。在這樣的情況下,電網運行、電力企業(yè)營銷和管理等決策要求越來越高,需要綜合考慮各種因素,涉及到的數據集越來越大,對數據的處理速度要求也很高,大數據技術的出現為這種需要提供了技術支撐。通過大數據技術的應用,能夠對不同類型、不同型號、不同狀態(tài)的設備進行故障預測,為電網安全運行提供有力保障;根據運行和管理提煉準確、有價值的數據,為管理效益、決策能力提升提供有效幫助。然而,大數據技術在我國電力行業(yè)的應用還處于起步階段,存在一些問題和不足。
電力生產以及電網運行是一個非常復雜的過程,包含發(fā)電、配電、輸電、營銷以及管理等環(huán)節(jié),這個過程中的各個環(huán)節(jié)都會產生大量的數據,這些數據的集合就叫做電力大數據。處理這些電力大數據的技術,稱為電力大數據技術。電力大數據包含4個主要方面:(體量)Volume、(種類)Variety、(價值)Value和(速度)Velocity。
(1)(體量)Volume。體量指從任何不同來源獲得的大量數據,包括移動設備、發(fā)電設備、配電設備、變電設備、社交網絡等。在電力行業(yè),隨著智能計量裝置的廣泛部署,配電自動化、用電信息采集等系統(tǒng)的廣泛應用,每時每刻都在創(chuàng)建大量的數據。這些數據的體量非常大,也非常復雜,不能按照傳統(tǒng)的數據處理方式存儲和分析,為企業(yè)獲取有價值的知識帶來了許多挑戰(zhàn)。
(2)(種類)Variety。多樣性指的是通過傳感器、智能手機或社交網絡收集不同類型的數據,如視頻、圖像、文本、音頻、日志等。電力大數據具有高度的多樣性,包括結構化數據、半結構化數據和非結構化數據。這些數據的組合將使大數據應用變得異常復雜。
(3)(價值)Value。價值是任何基于大數據應用的最重要特性。如果能源大數據沒有被挖掘,以支持業(yè)務決策或客戶服務等,那么它沒有任何意義和價值。對于電網和發(fā)電企業(yè)來講,通過大數據分析,能夠更好地了解不同消費者的能源消費模式,從而采取相應措施,以節(jié)約能源,提高電網運行效率。
(4)(速度)Velocity。速度主要是指電力大數據采集、處理和分析的速度。采集和處理需要驚人的速度,電力能源數據的實時處理就是以“秒”為目標。
大數據的價值體現在通過對大數據進行智能處理,進而從其中獲取有用信息。這個過程的實現,就是對數據進行分析和挖掘。電力大數據分析處理流程為電力大數據采集、電力大數據存儲、數據清洗、數據挖掘、電力大數據應用展示,見圖1。
圖1 電力大數據分析處理流程
(1)電力大數據采集。電力大數據從來源上可以分為運行數據、企業(yè)管理數據和營銷數據三大類型。其中,運行數據包括生產管理數據、運行調度數據以及各種設備和輸配電網運行過程中監(jiān)測到的數據;企業(yè)管理數據包括電網規(guī)劃、財務、氣象環(huán)境、地理信息以及電力知識等數據;營銷數據主要有來自用電采集系統(tǒng)、營銷業(yè)務系統(tǒng)等數據庫系統(tǒng)產生的數據。
(2)電力大數據存儲。大數據應用的一個主要特點是實時性或者近實時性。數據通常以每年50%快速增長,尤其是非結構化數據。隨著科技的進步,有越來越多的傳感器采集數據、移動設備數據、社交多媒體數據等。因此,大數據需要高性能、高吞吐率、大容量的基礎設備存儲。
(3)數據清洗。采集到的電力大數據往往是不完整、有噪聲和不一致的。數據質量問題會使基于這些數據的分析和研究毫無意義甚至還會產生災難性后果。作為提高數據質量的一種重要技術,數據清洗是解決數據質量問題的處理過程,其目的是保證數據質量,提供準確數據。數據清洗包括結構化數據清洗和非結構化數據清洗,能夠提高數據分析的準確率和分析效率,可以避免對后期數據處理以及分析造成不良影響,提高大數據分析的正確性、完整性、一致性和可靠性。
(4)數據挖掘。數據挖掘是電力大數據應用的關鍵技術,具有知識推理功能,能夠在建立知識數據庫基礎上,將信息數據轉化為有用知識,達到數據分析目的。通過融合人工智能、機器學習和云計算等技術,目前數據挖掘已發(fā)展成為大數據分析的主要手段。
(5)電力大數據應用展示。通過大數據分析產生的知識信息會通過報表、界面以及接口形式展現出來。
目前,大數據技術在我國電力行業(yè)的應用還處于起步階段,存在一些問題和不足。大數據的價值在于數據融合與數據挖掘。國家電網大部分省公司已經實現各系統(tǒng)的數據集成以及共享,電網公司之間,如國網與南網、電網與發(fā)電企業(yè)之間的數據共享還有待實現。同時,電力企業(yè)各個系統(tǒng)之間,以及不同企業(yè)的系統(tǒng)之間沒有采用統(tǒng)一的數據標準,使數據共享和融合難以實現。
(1)電力行業(yè)知識系統(tǒng)建設不完善。絕大多數相關領域研究人員認為,要很好地完成數據清洗過程,一定要結合特定應用領域的知識。數據挖掘同樣需要結合應用領域的知識。知識是一種有組織的經驗、價值觀、相關信息及洞察力的動態(tài)組合,它所構成的框架可以不斷地評價和吸收新的經驗和信息。信息系統(tǒng)研究人員順應了知識管理的發(fā)展趨勢,在信息系統(tǒng)的基礎上開發(fā)了知識管理系統(tǒng),以支持知識的創(chuàng)造、轉移和應用。在大數據分析過程中,必須借助于知識系統(tǒng),同時,大數據分析產生的新知識也會存入知識系統(tǒng)(見圖2)。知識系統(tǒng)越完善,大數據分析的準確性越高。知識系統(tǒng)的建設,除了平臺建設,更重要的是知識數據的搜集、分類、整理和完善,是一項工作量巨大的系統(tǒng)工程。目前,電力行業(yè)知識系統(tǒng)的研究和應用并不充分。沒有電力知識系統(tǒng)支撐,電力大數據技術平臺得到的信息不夠可信,不足以成為決策的依據。
圖2 電力大數據分析和知識系統(tǒng)關系
(2)系統(tǒng)之間和企業(yè)之間數據共享不充分。電力行業(yè)信息系統(tǒng)包括生產管理系統(tǒng)(PMS)、調度管理系統(tǒng)(OMS)、調度自動化系統(tǒng)(SCADA)、用電信息采集系統(tǒng)等很多各自獨立的信息系統(tǒng)。各個信息系統(tǒng)開發(fā)時間不同,使用的操作系統(tǒng)、系統(tǒng)模型、數據格式等各異,其數據是分布的、異構的,不同系統(tǒng)之間的數據資源難以相互訪問,形成信息孤島,數據信息很難共享。除了技術上的原因,現有管理體制也是造成跨部門、跨單位數據共享的最大障礙。數據共享不充分的直接結果會導致大數據分析系統(tǒng)的實施難度大大增加,影響大數據分析的效果。
(1)建設電力行業(yè)知識系統(tǒng)。為了建設更高效、準確率更高的大數據分析系統(tǒng),需要建設和完善電力行業(yè)知識管理系統(tǒng)。電力行業(yè)需要建設統(tǒng)一的知識系統(tǒng),為我國電力行業(yè)大數據戰(zhàn)略提供有力基礎保障。可以由電力行業(yè)協(xié)會或者大型電力公司牽頭實施。
(2)建設電力數據共享中心。信息共享描述了各種組織、人員和技術之間的數據交換。大數據解決方案涉及數據從簡單的行到復雜的圖,但是所有這些數據的出處最好是以統(tǒng)一的方式記錄和儲存,以便統(tǒng)一查詢。電力大數據分析需要以信息共享為基礎。數據集成是將現有分布、異構以及各自獨立的多個業(yè)務系統(tǒng)分散的業(yè)務數據通過應用間的數據交換有機地集合起來,屏蔽這些數據之間的差異,形成數據共享中心。電力大數據分析系統(tǒng)建設,需要構建發(fā)電企業(yè)、設備供應商、氣象部門、電網、電力調度機構、供電系統(tǒng)、電力市場、配電網、服務提供商及用戶的數據集成體系,以利于電力大數據分析的平臺建設的方便性及大數據分析的準確性(見圖3)。建設數據共享中心除了克服技術障礙,還要解放思想,打破體制壁壘。只有打破體制壁壘,才能建設不同級別的企業(yè)級、地區(qū)級、省級電力數據共享中心;只有數據得到充分共享,才能更加高效地進行宏觀電力大數據分析,促進電力行業(yè)高質量發(fā)展。
圖3 電力大數據分析與數據共享中心
(3)統(tǒng)一電力行業(yè)數據標準。電力數據共享中心的建設需要統(tǒng)一的電力行業(yè)數據標準。目前,電力行業(yè)雖然具有一些數據標準,如IEC61970標準、IEC61968標準,但整個電力行業(yè)并沒有統(tǒng)一遵循。電力行業(yè)各種應用系統(tǒng)多為不同時期分別建設或由不同專業(yè)機構負責建設的,缺少總體設計和統(tǒng)一規(guī)范,也缺少統(tǒng)一的信息化標準體系,內部信息系統(tǒng)的信息編碼沒有統(tǒng)一尺度,直接影響了企業(yè)上下級以及企業(yè)之間的信息共享交流。因此,急需統(tǒng)一電力行業(yè)數據標準,以利于實現電力數據共享中心的建設與大數據分析的開展。
通過大數據技術應用,能夠保障電網安全運行,提升管理效益、決策能力,優(yōu)化電網運行方式、降低管理成本。電力大數據分析的關鍵就是通過數據挖掘,提取出有價值的數據。而數據清洗和數據挖掘都離不開電力行業(yè)知識庫的支持。電力大數據采集則離不開電力數據共享中心。電力數據共享中心的建設需要統(tǒng)一的電力行業(yè)數據標準。因此,為了建設更高效、準確率更高的大數據分析系統(tǒng),更好地應用電力大數據技術,需要建設和完善電力行業(yè)知識管理系統(tǒng),建設電力數據共享中心,統(tǒng)一電力行業(yè)數據標準。