陸可欣
(國網(wǎng)江蘇省南通市通州區(qū)供電分公司)
大數(shù)據(jù)最初是在商業(yè)和金融領(lǐng)域得到應(yīng)用的, 后來找交通、醫(yī)療和能源等多個(gè)領(lǐng)域也得到了廣泛應(yīng)用。隨著國家智能電網(wǎng)、能源互聯(lián)網(wǎng)建設(shè)的不斷深入, 大數(shù)據(jù)在電力領(lǐng)域的應(yīng)用日益廣泛。目前, 在行業(yè)中, 大數(shù)據(jù)的概念并沒有一個(gè)明確的定義, 在宏觀層面上, 大數(shù)據(jù)不僅僅是一組數(shù)據(jù), 它還是一種以此組數(shù)據(jù)為研究對(duì)象的綜合性分析研究技術(shù)。大數(shù)據(jù)具有“4V”的基本特點(diǎn), 即: 量大、類型多、速度快、價(jià)值高。伴隨智能電網(wǎng)的不斷發(fā)展, 大量的智能電表以及與之相適應(yīng)的監(jiān)控裝置的全面投入使用, 實(shí)時(shí)收集了種類繁多且大量的電力大數(shù)據(jù), 這些電力大數(shù)據(jù)包含了電力生產(chǎn)過程的數(shù)據(jù)資料、圖像數(shù)據(jù)資料和聲音數(shù)據(jù)資料等。電力系統(tǒng)中的各種數(shù)據(jù)信息, 在整個(gè)電力系統(tǒng)中都具有廣泛的應(yīng)用價(jià)值, 他們相輔相成并互相關(guān)聯(lián)。伴隨電力大數(shù)據(jù)云平臺(tái)的不斷發(fā)展和完善, 電力大數(shù)據(jù)技術(shù)隨之越發(fā)成熟及完善, 其對(duì)數(shù)據(jù)的采集、存儲(chǔ)以及分析、分類和應(yīng)用等的功能也變得越來越明確和完善, 電力大數(shù)據(jù)的潛在價(jià)值得到了進(jìn)一步的挖掘, 從而使其在電力工業(yè)中的作用得到最大程度的發(fā)揮。
采集、分析和應(yīng)用電力大數(shù)據(jù)的技術(shù)是非常復(fù)雜的, 其流程可以分成五個(gè)大步驟進(jìn)行, 分別為: 電力數(shù)據(jù)采集, 數(shù)據(jù)預(yù)處理、分類, 數(shù)據(jù)存儲(chǔ)和管理, 以及數(shù)據(jù)挖掘與分析和數(shù)據(jù)應(yīng)用。這五個(gè)大大步驟共同組建成了電力大數(shù)據(jù)技術(shù)的主要構(gòu)成體系, 如圖1所示。
圖1 電力大數(shù)據(jù)技術(shù)的體系圖示例
電能質(zhì)量數(shù)據(jù)采集是電力數(shù)據(jù)分析與運(yùn)用的基礎(chǔ)和前提條件, 在電力數(shù)據(jù)分析中, 電力數(shù)據(jù)采集是電能質(zhì)量分析的重要組成部分, 而在數(shù)據(jù)集成方面, 主要包含了數(shù)據(jù)的感知和辨識(shí)、數(shù)據(jù)的壓縮和加密、數(shù)據(jù)的傳送和通訊; 數(shù)據(jù)的預(yù)處理與分類, 指的是對(duì)電力大數(shù)據(jù)展開過濾、篩選和去粗取精后, 針對(duì)數(shù)據(jù)展開識(shí)別、整合、分類處理, 在預(yù)處理及分類后, 數(shù)據(jù)會(huì)變得更加清晰、條理分明, 方便了數(shù)據(jù)的存儲(chǔ)。數(shù)據(jù)預(yù)處理的核心工作是對(duì)復(fù)雜多樣的電力數(shù)據(jù)進(jìn)行甄別, 將其轉(zhuǎn)化為單一類型和簡(jiǎn)單結(jié)構(gòu)的電力數(shù)據(jù), 然后再對(duì)其進(jìn)行分類處理[1]。數(shù)據(jù)存儲(chǔ)與管理, 主要為及時(shí)存儲(chǔ)收集、分類好的數(shù)據(jù), 并構(gòu)建相關(guān)數(shù)據(jù)庫,方便對(duì)數(shù)據(jù)調(diào)取與分類管理, 從而有效解決電力大數(shù)據(jù)存儲(chǔ)困難、調(diào)用難度大和數(shù)量龐大等的問題; 數(shù)據(jù)存儲(chǔ)、管理包含了大數(shù)據(jù)存儲(chǔ)、管理、融合、檢索、可視化等多種技術(shù)內(nèi)容, 其是融合了各種大數(shù)據(jù)處理技術(shù)類型的具體表現(xiàn)。
數(shù)據(jù)的挖掘和分析, 指的是利用計(jì)算機(jī), 借助神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)統(tǒng)計(jì)以及模糊算法和機(jī)器學(xué)習(xí)等方法,對(duì)電力數(shù)據(jù)信息展開分析計(jì)算, 并從中挖掘出數(shù)據(jù)中所隱藏的信息和數(shù)據(jù)之間存在的潛在聯(lián)系, 并將這些規(guī)律、聯(lián)系表達(dá)出來, 為今后的學(xué)習(xí)研究提供參考。數(shù)據(jù)挖掘的主要工作包含六項(xiàng)分析任務(wù), 即關(guān)聯(lián)分析、聚類分析, 分類分析, 以及異常分析、特異群組分析和演變分析。數(shù)據(jù)分析方法、數(shù)據(jù)應(yīng)用可見表1所示。
表1 數(shù)據(jù)分析的方法與數(shù)據(jù)應(yīng)用
電力大數(shù)據(jù)技術(shù)平臺(tái)(如圖2 大數(shù)據(jù)智能分析平臺(tái)示例圖所示) 具體包含了以下八大板塊, 分別為:數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)整合和數(shù)據(jù)計(jì)算, 數(shù)據(jù)分析, 數(shù)據(jù)管理、平臺(tái)服務(wù)以及安全管理和配置管理[2]。其中, 數(shù)據(jù)管理、配置管理、安全管理三大模塊貫穿整個(gè)過程, 為其他數(shù)據(jù)管理板塊提供全過程服務(wù), 同時(shí)也為電能質(zhì)量的電力數(shù)據(jù)采集、電力數(shù)據(jù)分析平臺(tái)更好進(jìn)行安全運(yùn)行提供支撐和保障。除此之外, 電力大數(shù)據(jù)采集分析平臺(tái)還將、軟件技術(shù)、先進(jìn)數(shù)據(jù)算法技術(shù)進(jìn)行了全面的融合, 為電能質(zhì)量, 即電力應(yīng)用數(shù)據(jù)的采集、預(yù)處理、分類、存儲(chǔ)與管理, 以及挖掘、分析、應(yīng)用等提供了一個(gè)堅(jiān)實(shí)且可靠的保障基礎(chǔ)。
平臺(tái)所采集整合的數(shù)據(jù), 不僅限于電力大數(shù)據(jù),還可以是和電力數(shù)據(jù)有關(guān)的地理數(shù)據(jù)、氣象數(shù)據(jù)以及社會(huì)環(huán)境數(shù)據(jù)、用戶信息數(shù)據(jù)和經(jīng)濟(jì)數(shù)據(jù), 將這些數(shù)據(jù)進(jìn)行有機(jī)融合起來, 形成一個(gè)種類繁多且結(jié)構(gòu)鮮明的電力大數(shù)據(jù)采集、分析結(jié)構(gòu), 為電力行業(yè)的各有關(guān)生產(chǎn)行業(yè)、在線監(jiān)測(cè)行業(yè), 包括各相關(guān)部門、社會(huì)服務(wù)行業(yè)等提供準(zhǔn)確并及時(shí)有效的數(shù)據(jù)支持服務(wù)。通過合理利用傳統(tǒng)數(shù)據(jù)挖掘、領(lǐng)域普適知識(shí)挖掘和數(shù)據(jù)統(tǒng)計(jì), 以及據(jù)可視化數(shù)據(jù)和機(jī)器學(xué)習(xí)等技術(shù), 能夠有效發(fā)現(xiàn)、洞察、明確電力大數(shù)據(jù)中隱藏有的一些數(shù)據(jù)關(guān)系、分布、模式以及趨勢(shì)、性質(zhì)和規(guī)律等, 在此過程中, 可以有效了解到用戶的個(gè)性化與目的性用電需求, 及不同用戶的用電行為與特征, 以及各用戶與電網(wǎng)間存在的關(guān)聯(lián)性等特征, 可以實(shí)現(xiàn)更為科學(xué)合理地進(jìn)行分析和預(yù)測(cè)用戶的用電行為, 從而為電網(wǎng)企業(yè)或公司的運(yùn)營(yíng)和營(yíng)銷提供更優(yōu)質(zhì)的服務(wù)。
在傳統(tǒng)意義上, 電力用戶的分類主要是以用戶的實(shí)際用電模式、所用電量電壓等級(jí)的不同作為依據(jù)來分類的, 可以此將其劃分為四種用電類型, 即商業(yè)用電、工業(yè)用電與居民用電和農(nóng)業(yè)用電。對(duì)于工業(yè)用電類型的具體劃分如表2 所示。
表2 工業(yè)用電的各項(xiàng)有關(guān)類型及主要內(nèi)容
商業(yè)用電、居民用電和用電的電壓水平都相對(duì)較低, 通常在10kV 以下, 甚至存在不滿1kV 的情況。電力用戶類型各不同, 其對(duì)電壓水平、電能質(zhì)量等的要求也不盡相同[3]。在電力大數(shù)據(jù)的基礎(chǔ)上所進(jìn)行的電力用戶分類, 主要是利用電力大數(shù)據(jù)中所蘊(yùn)含的各種信息, 通過與一定的數(shù)據(jù)分析算法相結(jié)合方式, 實(shí)現(xiàn)對(duì)電力用戶的分類; 通常情況下, 最為常見和應(yīng)用的用戶分類方法主要是利用電力大數(shù)據(jù)當(dāng)中的數(shù)據(jù)信息以相應(yīng)的數(shù)據(jù)曲線形式進(jìn)行表現(xiàn), 而后將致使曲線變化的相關(guān)影響因素, 以及聚類算法、最小二乘法、模糊算法相結(jié)合, 而后在此基礎(chǔ)上利用回歸法等算法, 如無監(jiān)督層次聚類, k-means 聚類, 自組織神經(jīng)網(wǎng)絡(luò), 有監(jiān)督的KNN, 以及決策樹、支撐向量機(jī)等方法對(duì)電力用戶進(jìn)行分類。
除此之外, 還可以使用逆向分析的方法來將不同類型電力用戶的用電特點(diǎn)作為切入點(diǎn), 以用戶的特點(diǎn)為依據(jù), 運(yùn)用熵權(quán)法, 對(duì)用戶電力數(shù)據(jù)的特點(diǎn)和各部分電力大數(shù)據(jù)的權(quán)重進(jìn)行分析, 最后, 以獲得的數(shù)據(jù)特點(diǎn)為基礎(chǔ), 在電力大數(shù)據(jù)中尋找出與之相對(duì)應(yīng)的數(shù)據(jù), 并對(duì)該部分?jǐn)?shù)據(jù)的用戶類別進(jìn)行確定。由此可見, 在電力大數(shù)據(jù)采集與分析基礎(chǔ)上針對(duì)電力用戶進(jìn)行分類的方法更具有效性、合理性和科學(xué)性, 并且分類結(jié)果的精準(zhǔn)度更高, 且有較強(qiáng)的理論依據(jù)作支撐。與此同時(shí), 適當(dāng)?shù)貙⒂秒娍蛻暨M(jìn)行分類, 能夠讓電網(wǎng)企業(yè)依據(jù)不同的客戶類型, 提供更有針對(duì)性、目的性和更高效的服務(wù), 這有利于電力工業(yè)中的資源較好實(shí)現(xiàn)最優(yōu)配置。另外, 對(duì)電力客戶進(jìn)行準(zhǔn)確的分類, 還能讓客戶的用電行為分析變得更加精確, 且電力用戶的用電特征也會(huì)變得更具有典型性及代表性[4]。
在電力大數(shù)據(jù)技術(shù)基礎(chǔ)上對(duì)用戶用電特性進(jìn)行分析, 在此之前, 我國已經(jīng)逐漸形成了較為成熟的分析方法與體系。比如, 電力使用價(jià)格制度對(duì)電力用戶用電模式的引導(dǎo), 對(duì)電力用戶實(shí)際用電負(fù)荷的預(yù)測(cè), 以及對(duì)電網(wǎng)設(shè)備運(yùn)行狀態(tài)的監(jiān)測(cè)、設(shè)備故障的預(yù)測(cè)和針對(duì)電力用戶進(jìn)行用電分類構(gòu)建管理模塊等, 這些相關(guān)用電信息分析機(jī)制與體系, 構(gòu)成了我國大數(shù)據(jù)電力行業(yè)的服務(wù)、運(yùn)營(yíng)和管理矩陣。以分析電力用戶的用電行為作為目標(biāo), 其主要方式是利用一個(gè)專用的電力數(shù)據(jù)庫, 以大數(shù)據(jù)分析平臺(tái)為基礎(chǔ), 進(jìn)行收集、整理、分類、分析、處理各種電力數(shù)據(jù), 然后與相應(yīng)的用戶用電需求與機(jī)制相結(jié)合, 對(duì)數(shù)據(jù)進(jìn)行整合。分析以及提取和實(shí)際應(yīng)用。
譬如, 在對(duì)居民用電客戶進(jìn)行分析時(shí), 首先, 要合理提取總體數(shù)據(jù)信息, 根據(jù)電流、電壓和用電量等電力大數(shù)據(jù)呈現(xiàn)的曲線圖來提取相應(yīng)的數(shù)據(jù)特征。而后, 在此基礎(chǔ)上, 對(duì)這些數(shù)據(jù)中各不同類型的影響因子進(jìn)行歸類和排除, 然后對(duì)其進(jìn)行歸類與分析; 最后, 運(yùn)用符合預(yù)測(cè)方法、負(fù)荷分析和聚類分析法等多種科學(xué)有效的電力大數(shù)據(jù)分析方法, 對(duì)不同區(qū)域和不同時(shí)段的電力用戶的電力消費(fèi)行為進(jìn)行分析[5]??偟膩碚f, 在傳統(tǒng)的用戶用電行為分析中, 聚類分析法是一種較為普遍和常用的方法, 特別是對(duì)k-means 聚類算法的實(shí)際應(yīng)用(如圖3 所示), 在對(duì)用戶用電行為的分析過程中, 其所起到的作用至關(guān)重要。在使用kmeans 方法進(jìn)行用戶用電分析過程中, 必須注意如何獲得與電力大數(shù)據(jù)相關(guān)聯(lián)的初始值, 否則初始值的偏離會(huì)對(duì)用戶用電行為的分析結(jié)果產(chǎn)生極大不利影響。針對(duì)此問題, 可在大數(shù)據(jù)技術(shù)基礎(chǔ)上利用Fuzzy Canalysis 均值聚類方法來對(duì)用戶用電行為進(jìn)行研究,這一方法是在進(jìn)一步優(yōu)化有關(guān)目標(biāo)函數(shù)的基礎(chǔ)上, 對(duì)其中含有的有關(guān)樣本點(diǎn)的分類屬性加以判斷, 從而達(dá)成有關(guān)電力大數(shù)據(jù)的自動(dòng)分類。
圖3 基于k-means 聚類算法的用戶用電行為分析示例圖
當(dāng)前, 伴隨國力與科學(xué)技術(shù)、經(jīng)濟(jì)水平的不斷提升, 我國應(yīng)用電力大數(shù)據(jù)技術(shù)的頻率不斷增高, 并以此逐步建構(gòu)了一套科學(xué)且行之有效的電力大數(shù)據(jù)采集分析體系和機(jī)制?;诖髷?shù)據(jù)技術(shù)對(duì)用戶用電行為進(jìn)行深入和全面地分析, 能夠有效挖掘更多更有價(jià)值和可應(yīng)用的數(shù)據(jù)信息, 從而實(shí)現(xiàn)在用戶用電需求、合理預(yù)測(cè)電網(wǎng)荷載等方面全面提升分析能力和分析水平,進(jìn)而促進(jìn)電力資源更好實(shí)現(xiàn)合理配置, 全面提高電力行業(yè)整體服務(wù)水平的同時(shí), 進(jìn)一步降低和減少電力設(shè)施故障率, 促進(jìn)電力行業(yè)持續(xù)健康發(fā)展。