王鵬飛,何麗娟 ,宋鴻雁
(國網(wǎng)銀川供電公司,寧夏 銀川 750000)
對大數(shù)據(jù)及其相關(guān)技術(shù)的研究最早可追溯至Apache軟件基金會的一個開源項目,該項目中大數(shù)據(jù)技術(shù)被用于處理一個互聯(lián)網(wǎng)搜索引擎中產(chǎn)生的巨大數(shù)據(jù)集。大數(shù)據(jù)技術(shù)有三個“大”特性:大數(shù)據(jù)量,大數(shù)據(jù)種類和大傳輸速率[1-2]。自21世紀(jì)以來,大數(shù)據(jù)逐漸被應(yīng)用于電力系統(tǒng),智能電網(wǎng)也應(yīng)運而生,在近十幾年的發(fā)展中,逐漸凸顯出了以下趨勢:分布式發(fā)電的普及、可再生能源的高度普及、終端用戶的積極參與和雙向通信技術(shù)[3]。在大數(shù)據(jù)的參與下,現(xiàn)代智能電網(wǎng)正在演變成一個復(fù)雜的物理網(wǎng)絡(luò)系統(tǒng),電力公司部署的大量計量/傳感設(shè)備也提供了足夠多的數(shù)據(jù)來支撐大數(shù)據(jù)算法的運行。
常用于電氣系統(tǒng)的數(shù)據(jù)采集系統(tǒng)有SCADA、WAMS、Smart meter、Power quality recorder等。這些數(shù)據(jù)采集系統(tǒng)各有優(yōu)劣,種類繁多,包括溫度、濕度、電壓、載荷、風(fēng)速、日照等多種數(shù)據(jù),幾乎涵蓋了電力系統(tǒng)的方方面面。除了表現(xiàn)出多數(shù)據(jù)種類外,這些系統(tǒng)也體現(xiàn)了大數(shù)據(jù)多數(shù)據(jù)量的特點,以一區(qū)域型電網(wǎng)為例,SCADA系統(tǒng)1年內(nèi)最高可記錄7億個包括總線電壓、輸入輸出功率、頻率、斷路狀態(tài)等在內(nèi)的數(shù)據(jù)[4]。
目前大數(shù)據(jù)技術(shù)在電力系統(tǒng)中的應(yīng)用仍處于早期的階段,現(xiàn)有的一些工作大多聚焦于大數(shù)據(jù)分析系統(tǒng)的結(jié)構(gòu)設(shè)計以及大數(shù)據(jù)驅(qū)動的應(yīng)用,采集的數(shù)據(jù)量雖然很大,但使用的整體方法與結(jié)構(gòu)較為宏觀,特別針對電力大數(shù)據(jù)在預(yù)測規(guī)劃方面的研究并不多見?;诖?,本文先對電力大數(shù)據(jù)技術(shù)的意義與關(guān)鍵技術(shù)展開了論述,特別是其在電力系統(tǒng)中的組織結(jié)構(gòu)。此外針對預(yù)測規(guī)劃這一目標(biāo),結(jié)合現(xiàn)有的一些研究方法與理論,提出了可行的方式并分析了效果[5-6]。
目前對大數(shù)據(jù)系統(tǒng)的定義較為寬泛,本文中以Pei Zhang等人的定義為基礎(chǔ)進(jìn)行下一步分析與論證,即認(rèn)為電力大數(shù)據(jù)是海量的、相互關(guān)聯(lián)的業(yè)務(wù)數(shù)據(jù),包括通過各種信息化手段采集的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),這些信息化手段包括智能設(shè)施、傳感器、音頻和視頻監(jiān)控設(shè)備、移動終端等[7]。
雖然電力大數(shù)據(jù)技術(shù)從大數(shù)據(jù)中繼承了3個“大”特性,但其仍有一些自身獨特的特點。①電力系統(tǒng)是一個動態(tài)的高度非線性時變系統(tǒng),本質(zhì)上是一系列連續(xù)動態(tài)過程與獨立事件的相互作用,不同的數(shù)據(jù)在不同時間、不同地點被采集,時間間隔小到毫秒,大到小時,地點跨度甚至能達(dá)到上千公里。②電力系統(tǒng)中的數(shù)據(jù)類型還會根據(jù)測量目標(biāo)的種類發(fā)生一定變化。③電力系統(tǒng)的狀態(tài)既是暫時的,又在空間上與外部獨立變量相結(jié)合。④電力系統(tǒng)存在的本質(zhì)目標(biāo)是保持時刻變化的發(fā)電與載荷的平衡,這意味著發(fā)電一側(cè)要對負(fù)載的變化做出實時響應(yīng)。但是在實際生產(chǎn)中,負(fù)載是一個高度隨機的變化量,用電負(fù)載受天氣、用戶活動等多方面的影響。⑤現(xiàn)代電力系統(tǒng)中存在許多可再生能源發(fā)電器,這類輸入的發(fā)電量同樣具有隨機性和間歇性的特點,給大規(guī)??稍偕茉礊殡娏ο到y(tǒng)的控制帶來了更多麻煩,甚至導(dǎo)致電涌等現(xiàn)象的發(fā)生,增加了無用損耗。⑥現(xiàn)代電力系統(tǒng)已經(jīng)演變成深度信息物理融合系統(tǒng),在這樣的應(yīng)用背景下,數(shù)據(jù)的完整性、安全性、準(zhǔn)確性深刻影響著系統(tǒng)的應(yīng)用,而這3個特性本質(zhì)上取決于底層通信網(wǎng)絡(luò)的效率和拓?fù)浣Y(jié)構(gòu)。由傳感器測量誤差帶來的影響也不可忽略,包括傳輸錯誤、噪聲、通信延遲等。此外,安全性也會帶來許多人為問題,2015年,烏克蘭首次發(fā)生因人為攻擊而導(dǎo)致的停電,因此可以預(yù)見到,虛假數(shù)據(jù)注入也是一種不可忽視的破壞電力系統(tǒng)方式[8]。
基于上述這些電力大數(shù)據(jù)系統(tǒng)的特點,G.Zhao等人提出一較為完備的電力大數(shù)據(jù)系統(tǒng)結(jié)構(gòu),如圖1所示。整個系統(tǒng)中最關(guān)鍵的部分之一是基于數(shù)據(jù)存儲框架的HDFS分布式文件系統(tǒng),其二是基于數(shù)據(jù)處理框架的Map-Reduce計算技術(shù)。不論是分布式文件系統(tǒng)還是Map-Reducing計算技術(shù)都可以處理PB、ZB量級的數(shù)據(jù),整個框架中還包含一些其他的模塊,例如智能商業(yè)應(yīng)用、傳統(tǒng)數(shù)據(jù)庫、大數(shù)據(jù)連接框架、大數(shù)據(jù)描述框架、網(wǎng)絡(luò)層、操作系統(tǒng)、服務(wù)器、備份、恢復(fù)以及數(shù)據(jù)管理器等[9]。
圖1 電力大數(shù)據(jù)系統(tǒng)結(jié)構(gòu)
大數(shù)據(jù)存儲框架和大數(shù)據(jù)處理框架是基于傳統(tǒng)的計算機服務(wù)器、操作系統(tǒng)以及虛擬主機運行的,這意味著整套系統(tǒng)的造價更低,擴展空間更大。大數(shù)據(jù)連接框架與大數(shù)據(jù)處理、存儲框架通過網(wǎng)絡(luò)層相連。其由許多的子模塊組成,包括平行計算機編程語言Pig,數(shù)據(jù)庫管理工具Hive,開源數(shù)據(jù)傳輸工具Sqoop。基于上述工具,操作者可以方便地通過大數(shù)據(jù)連接器訪問任何一個分布式文件存儲系統(tǒng)和傳統(tǒng)數(shù)據(jù)庫[10]。
電力大數(shù)據(jù)處理的流程與傳統(tǒng)大數(shù)據(jù)系統(tǒng)并非完全不同,最大的一個區(qū)別是傳統(tǒng)大數(shù)據(jù)處理中會考慮大量的非結(jié)構(gòu)化數(shù)據(jù),這種情況下采用并行處理技術(shù),例如Map-Reduce是至關(guān)重要的。因此需要對電力大數(shù)據(jù)系統(tǒng)中包含的關(guān)鍵技術(shù)進(jìn)行進(jìn)一步分析。
云計算是基礎(chǔ)技術(shù),是大數(shù)據(jù)的重要補充,云計算技術(shù)可以集成計算處理資源和存儲資源,改善數(shù)據(jù)處理和信息交互能力,是技術(shù)中最強大的組成部分,為處理大數(shù)據(jù)“多數(shù)據(jù)量”的主要問題提供了有效的技術(shù)手段,云計算與大數(shù)據(jù)技術(shù)之間的關(guān)系可以用圖2簡潔的描述[11]。
圖2 大數(shù)據(jù)與云計算之間的關(guān)系
數(shù)據(jù)存儲涉及的方面較多,其主要研究工作在于如何協(xié)調(diào)大量存儲設(shè)備協(xié)同工作,以此為外部的用戶以及商業(yè)存儲提供一個方便統(tǒng)一的調(diào)用、存儲接口。在電力大數(shù)據(jù)系統(tǒng)中,根據(jù)數(shù)據(jù)的結(jié)構(gòu)(同時考慮結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù))和時間尺度(非實時數(shù)據(jù)、半實時數(shù)據(jù)、實時數(shù)據(jù))對數(shù)據(jù)進(jìn)行分類,因此協(xié)調(diào)數(shù)據(jù)庫的不同功能需求來滿足海量電網(wǎng)數(shù)據(jù)的協(xié)同處理需求,數(shù)據(jù)存儲部分的數(shù)據(jù)來源既可以是電力公司所有的網(wǎng)絡(luò)設(shè)備,也可以是第三方數(shù)據(jù)存儲商提供的服務(wù)設(shè)備。
數(shù)據(jù)存儲之上需要考慮的是數(shù)據(jù)的集成相關(guān)技術(shù)。數(shù)據(jù)集成模塊扮演了一個中繼角色,其目的在于收集、校核、清理以及統(tǒng)一不同來源的數(shù)據(jù)便于后續(xù)處理。這一類數(shù)據(jù)管理系統(tǒng)被稱為中央管理、外部訪問的統(tǒng)一管理系統(tǒng)。數(shù)據(jù)集成與管理技術(shù)包括數(shù)據(jù)融合與集成、數(shù)據(jù)提取、數(shù)據(jù)清洗、數(shù)據(jù)濾波等,對應(yīng)于電力大數(shù)據(jù)技術(shù)中的數(shù)據(jù)提取、轉(zhuǎn)換、加載以及電力系統(tǒng)的統(tǒng)一建模等技術(shù)。但電力大數(shù)據(jù)系統(tǒng)可能仍存在許多問題,如數(shù)據(jù)質(zhì)量差、準(zhǔn)確度低、實時性不足等,這就需要高性能的數(shù)據(jù)管理系統(tǒng)相配合。
近年來,電力數(shù)據(jù)使用場景大量增加,電力公司越來越趨向于使用新的數(shù)據(jù)處理技術(shù),來更有效利用軟件和硬件資源,以減少投資,維護(hù)成本,降低能耗,同時提供更穩(wěn)定和更強的數(shù)據(jù)處理能力。在提出的電力大數(shù)據(jù)架構(gòu)中,數(shù)據(jù)計算層通過數(shù)據(jù)集成層訪問數(shù)據(jù),進(jìn)行各種分析和處理工作。各種數(shù)據(jù)分析技術(shù)可以位于這一層,例如并行分布式計算、內(nèi)存計算和流處理。此外,還可以在此層中應(yīng)用虛擬化技術(shù),為上層應(yīng)用程序和用戶提供硬件和軟件的可視化。從這個意義上講,數(shù)據(jù)分析層提供的服務(wù)也稱為電力云服務(wù)。
數(shù)據(jù)應(yīng)用是在數(shù)據(jù)存儲、數(shù)據(jù)集成、數(shù)據(jù)計算基礎(chǔ)上建立起來的上層應(yīng)用,它根據(jù)底層提供的數(shù)據(jù)和服務(wù)類型建立面向不同電力場景的應(yīng)用程序。數(shù)據(jù)應(yīng)用的背景下,可以用到許多人工智能、大數(shù)據(jù)相關(guān)的上層技術(shù),如數(shù)據(jù)挖掘、深度學(xué)習(xí)、機器學(xué)習(xí)、圖像識別等。典型的電力數(shù)據(jù)應(yīng)用有電網(wǎng)安全在線分析、間歇發(fā)電預(yù)測、動態(tài)線路評估、設(shè)備健康監(jiān)測與診斷、負(fù)荷管理等。要保證電力系統(tǒng)可靠、穩(wěn)定、高效率地運行,電力行業(yè)對數(shù)據(jù)精準(zhǔn)度的要求會更高。每種技術(shù)都有其各自適合的應(yīng)用場景,也有各自的局限性,使用時應(yīng)注意識別,選擇合適的技術(shù)處理合適的問題。
電力大數(shù)據(jù)在基礎(chǔ)的數(shù)據(jù)方面已經(jīng)得到了大量的技術(shù)積累,給輸電預(yù)測規(guī)劃、能源管理方面的發(fā)展帶來了前所未有的機遇。預(yù)測是電力系統(tǒng)運行和規(guī)劃的一項基本而重要的任務(wù)。經(jīng)典的預(yù)測問題包括負(fù)載預(yù)測和電價預(yù)測[12-13]。
隨著可再生能源的日益普及,可再生發(fā)電(如風(fēng)能、太陽能光伏)預(yù)測成為電力大數(shù)據(jù)的又一重要應(yīng)用。與負(fù)荷需求等其他變量相比,可再生能源發(fā)電涉及環(huán)境、天氣、氣候、可再生能源發(fā)電機自身發(fā)電曲線等多種因素,因而具有更大的隨機性和預(yù)測難度。因此,與傳統(tǒng)的點預(yù)測不同,對區(qū)間預(yù)測技術(shù)的進(jìn)一步研究成為越來越熱的研究趨勢,以更好地反映可再生發(fā)電的不確定性。圖3給出了點和區(qū)間預(yù)測的效果圖示,區(qū)間預(yù)測不僅提供了不確定變量的平均值,而且提供了該變量可以隨機變化的范圍。預(yù)測區(qū)間可作為魯棒優(yōu)化技術(shù)的輸入,為高水平可再生能源電力系統(tǒng)的更加穩(wěn)健運行和規(guī)劃提供技術(shù)支持。此外,除了預(yù)測風(fēng)電、太陽能光伏發(fā)電機組的發(fā)電量外,風(fēng)電、太陽能光伏發(fā)電機組的升壓功率預(yù)測也是至關(guān)重要的,因為這類間歇可再生能源的升壓速率對系統(tǒng)的電力調(diào)度、電量儲備、頻率控制等都有重要影響。最近的一些研究開發(fā)了可再生的斜坡預(yù)測方法。與此同時,由于智能電能表的廣泛應(yīng)用,人們對預(yù)測家庭層面的負(fù)載需求數(shù)據(jù)也越來越感興趣。預(yù)測結(jié)果可用于支持更好的負(fù)荷管理和需求響應(yīng)計劃。但與總負(fù)荷需求相比,家庭負(fù)荷具有更大的隨機性和波動性。為了獲取其負(fù)荷模式,必須考慮居民的行為[14-15]。此外,考慮到這些住宅計量數(shù)據(jù),可對用戶的用電模式進(jìn)行分析。
圖3 點與區(qū)間預(yù)測圖例
電力大數(shù)據(jù)技術(shù)對電網(wǎng)的升級建設(shè)以及未來發(fā)展都有至關(guān)重要的意義,本文介紹了應(yīng)用于電力大數(shù)據(jù)技術(shù)的基本框架,提取了其中的5個關(guān)鍵技術(shù)一一進(jìn)行了介紹。在此基礎(chǔ)上介紹了電力大數(shù)據(jù)技術(shù)在輸電預(yù)測規(guī)劃方面的典型應(yīng)用案例??梢钥吹诫娏Υ髷?shù)據(jù)技術(shù)進(jìn)一步應(yīng)用的難點不在于技術(shù),而是在于針對不同的技術(shù)找到其合適的應(yīng)用場景與應(yīng)用條件,本文的分析對電力大數(shù)據(jù)技術(shù)的進(jìn)一步應(yīng)用提供參考。