武志宇,周筱淋,王雨佳
(遼寧工程技術(shù)大學,遼寧 葫蘆島 125000)
準確的中長期電力負荷預測有利于電網(wǎng)的安全穩(wěn)定運行,為電網(wǎng)規(guī)劃提供基礎(chǔ)數(shù)據(jù)。合理、有計劃地安排各類用戶的用電時間,可減小最大負荷與最小負荷的差值,充分利用發(fā)電和供電設(shè)備容量,提高系統(tǒng)運行的經(jīng)濟性[1]。
目前,電力負荷預測模型主要包括統(tǒng)計模型、人工智能模型和混合模型三大類[2]。傳統(tǒng)的統(tǒng)計學預測模型主要有自回歸模型、自回歸綜合移動平均模型、指數(shù)平滑模型和時間序列分析模型。文獻[3]比較了幾種不同的統(tǒng)計模型,模型對序列平穩(wěn)性要求較高,而且本質(zhì)上只能捕捉線性關(guān)系,無法捕捉電荷變化與相關(guān)因素之間存在的復雜非線性關(guān)系。在人工智能預測方法中,人工神經(jīng)網(wǎng)絡(luò)可以較好地處理非線性擬合問題。文獻[4]提出了基于人工神經(jīng)網(wǎng)絡(luò)和互信息理論的預測方法,該模型充分考慮了負荷數(shù)據(jù)的內(nèi)在特點和外部重要因素,成功解決負荷的非線性、非平穩(wěn)性和非季節(jié)性的問題,但該模型只適用于小數(shù)據(jù)集,且操作過于復雜。
目前大部分預測模型是從數(shù)學層面對傳統(tǒng)算法進行改良,而忽略了負荷本身的特點[5]。部分預測模型忽略了特征選擇的重要性,往往根據(jù)直覺或使用單一標準而未從負荷序列的特點分析中進行選擇。本文針對以上不足,提出一種結(jié)合模糊聚類和高斯過程回歸的混合模型,對原始負荷數(shù)據(jù)分別從日尺度、月尺度和年尺度進行可視化分析,從中挖掘整理出有效的時間尺度特征數(shù)據(jù);將影響負荷的時間尺度數(shù)據(jù)以及天氣數(shù)據(jù)進行模糊聚類處理,匯總出最優(yōu)特征集;將特征數(shù)據(jù)代入高斯過程回歸模型,所得輸出結(jié)果為混合模型的最終負荷預測值。結(jié)合實際電力數(shù)據(jù)對模型進行驗證,結(jié)果表明該模型具有較高的預測精度和魯棒性。
負荷日期類型的劃分是負荷預測的關(guān)鍵因素。根據(jù)實際需求不同,電力負荷預測按照時間尺度分為超短期、短期、中期、長期負荷預測[6]。
1)超短期負荷預測,以分鐘和小時為最小單位的負荷預測,主要用于電力系統(tǒng)的潮流控制以及電力系統(tǒng)暫穩(wěn)態(tài)參數(shù)計算。
2)短期負荷預測,以天和周為最小單位預測兩周以內(nèi)的電力負荷,在電力調(diào)度、售電公司參與現(xiàn)貨市場的工作中發(fā)揮關(guān)鍵作用,能夠為基本發(fā)電計劃、系統(tǒng)安全分析、日內(nèi)實時交易等提供基礎(chǔ)數(shù)據(jù)[7-8]。
3)中期負荷預測,月至年的負荷預測,主要作用是確定機組運行方式和設(shè)備大修計劃等[9]。
4)長期負荷預測,未來3~5年甚至更長時間段內(nèi)的負荷預測,主要為電網(wǎng)規(guī)劃部門根據(jù)國民經(jīng)濟發(fā)展和對電力負荷的需求所作的電網(wǎng)改造和擴建工作進行遠景規(guī)劃。
負荷預測由于受天氣、工作日、節(jié)假日等因素影響會表現(xiàn)出時間序列的規(guī)律性,為實現(xiàn)有效的負荷預測奠定了基礎(chǔ)[10]。
原始數(shù)據(jù)經(jīng)過挖掘處理后可以更加清晰地表征影響負荷的特征。負荷預測模型框架如圖1所示。
圖1 負荷預測模型框架
2.1.1 異常數(shù)據(jù)檢測與填補
由于原始數(shù)據(jù)中存在的一些異常數(shù)據(jù),對電力負荷預測模型的建立與求解會產(chǎn)生無法預估的影響,本文使用3σ方法進行異常值檢測。
3σ探測方法的思想源于概率論中的切比雪夫不等式。對于任意ε>0,有:
式中:X為樣本數(shù)據(jù);E(X)為X的數(shù)學期望;D(X)為X的方差。
當ε=3σ時,統(tǒng)計數(shù)據(jù)與平均值的離散程度可以由其標準差D(X)=ε反映,因此有:
式(2)值約等于0.11,即統(tǒng)計數(shù)據(jù)與其平均值的距離超過3σ的比例不會超過12%。因此可將統(tǒng)計數(shù)據(jù)與平均值之差的絕對值超過3σ的數(shù)據(jù)作為異常值。為了減小異常值對于模型建立的干擾,本文利用均值填補法替換異常值。
2.1.2 數(shù)據(jù)歸一化處理
原始數(shù)據(jù)中包括最高溫度、最低溫度、平均溫度、相對濕度、降雨量等,由于這些量的量綱不一致,而且預測模型中輸入輸出的數(shù)據(jù)單位不一致,因此需要對輸入數(shù)據(jù)進行歸一化處理。歸一化后的數(shù)據(jù),不存在量綱,并且取值范圍在[0,1]之間,數(shù)據(jù)歸一化處理的公式為:
式中:x_nor為歸一化處理后的值;x_source為原始數(shù)據(jù);x_min為原始數(shù)據(jù)中的最小值;x_max為原始數(shù)據(jù)中的最大值。
在得到歸一化的數(shù)據(jù)之后,可以利用模糊C均值聚類算法進行聚類處理,通過設(shè)置最優(yōu)聚類數(shù)目,得到影響負荷預測的最優(yōu)特征集。
對歷史負荷數(shù)據(jù)進行可視化分析,提取時間尺度數(shù)據(jù),結(jié)合歸一化后的天氣數(shù)據(jù),通過模糊聚類提取重要特征,作為預測變量輸入到高斯過程回歸模型中進行負荷預測。
2.2.1 模糊C均值聚類
模糊C均值聚類(FCM)是把N個向量xi(i=1,2,…N)分為c個模糊組,并求每組的聚類中心,使得非相似性指標的目標函數(shù)達到最小,而每個給定數(shù)據(jù)點用0與1之間的隸屬度來確定其屬于各個組的程度。
設(shè) X={x1,x2,...,xn}為 n 元數(shù)據(jù)集合,xi∈ Rs。模糊C均值聚類方法就是把X劃分為c個子集S1,S2,...,Sc,若用A={α1,α2,...,αc}表示這c個子集的聚類中心,uij表示元素xj對Si的隸屬度,則模糊C均值聚類算法的優(yōu)化目標函數(shù)為:
uij滿足如下約束條件:
式中:U={uij}為c× n矩陣;A={α1,α2,...,αc}為s×c矩陣;dij為xj與ai的距離,經(jīng)典的模糊C均值聚類算法使用歐氏距離。
圖2 模糊C均值聚類算法流程圖
修正隸屬度矩陣:
2.2.2 高斯過程回歸建模
高斯過程回歸(GPR)是一種機器學習回歸方法,GPR模型假設(shè)包括噪聲(回歸殘差)和高斯過程兩部分,具有嚴格的統(tǒng)計學理論基礎(chǔ),通常被用于低維和小樣本的回歸問題?;诟咚惯^程及其核函數(shù)所具有的便利性,GPR在時間序列分析、圖像控制和自動控制領(lǐng)域得到應用[11]。與支持向量機、神經(jīng)網(wǎng)絡(luò)相比,GPR具有容易實現(xiàn)、參數(shù)自適應獲取、非參數(shù)推斷靈活以及輸出具有概率意義等優(yōu)點[12]。
高斯過程(GP)是任意有限個隨機變量均具有聯(lián)合高斯分布的集合,其性質(zhì)完全由均值函數(shù)m(x)和協(xié)方差函數(shù)k(x,x′)確定,即:
式中:x,x′∈Rd為任意隨機變量。因此GP可以定義為:
f(x)~GP(m(x),k(x,x′))
為了符號表示上的簡潔,通常會對數(shù)據(jù)進行預處理,使均值函數(shù)為0。考慮噪聲因素的干擾,高斯過程的一般模型為:
式中:x為輸入向量;y為受噪聲污染后的觀測值;ε為獨立的白噪聲,假設(shè)ε~N(0,σ2n)。
式(9)中,f(x)和ε均服從高斯分布,因此y也服從高斯分布,由此得到觀測值y的高斯分布:
則觀測值y和預測值f*的先驗聯(lián)合高斯分布為:
其中,K(X,X)=Kn=(kij)為n階對稱正定的協(xié)方差矩陣,矩陣元素 kij=k(xi,xj)用來度量 xi與xj之間的相關(guān)性;K(X,x*)=K(x*,X)T為測試點x*與訓練集的輸入X之間的n×1階協(xié)方差矩陣;k(x*,x*)為測試點x*自身的協(xié)方差;In為n維單位矩陣。
在新的高斯分布輸入x和已有的N個觀測樣本(X,y)的條件下可計算出預測值f*的概率分布為:
2.2.3 GPR模型的參數(shù)說明
負荷的變化特性一般通過負荷曲線及特性指標反映。分析負荷曲線及特性指標可以準確描述電力負荷隨時間的變化特性,用于分析地區(qū)電網(wǎng)的電網(wǎng)結(jié)構(gòu)和用電模式,并可用于預測電力負荷變化的規(guī)律和趨勢。
在不考慮其他負荷分量的情況下,負荷的變化規(guī)律往往呈現(xiàn)一定的周期性,包括負荷的日周期性和周周期性。通過分析負荷的周期性,建立科學的負荷預測模型,從而增加模型的精準度[13]。
3.1.1 負荷的日周期性
日周期性主要表征一天的負荷變化規(guī)律。圖3為某地區(qū)2020年1月6日和2020年1月7日連續(xù)兩個工作日對應的負荷曲線圖,每15 min一個采樣點,每日96點。
圖3 某地區(qū)連續(xù)兩天日負荷曲線
3.1.2 負荷的周周期性
負荷周周期性的研究對于負荷預測的準確度具有重要的意義。圖4為某地區(qū)2020年1月6日至2020年1月19日連續(xù)兩周的負荷曲線圖。
圖4 某地區(qū)連續(xù)兩周的負荷曲線
通過對連續(xù)兩日和連續(xù)兩周負荷的可視化分析可知,負荷序列具有明顯的日周期性和周周期性。后續(xù)負荷特性指標的提取將分別以日、月、年為單位展開。
負荷特性指標表示負荷變化的規(guī)律和特性,常用的指標有日負荷特性指標、年負荷特性指標及負荷同時率等,主要指標如表1所示。表中,Pd-av為日平均負荷;Pd-max為日最大負荷;Pd-min為日最小負荷;Pm-av為月平均負荷;Pm-max為月最大負荷值;Pmax為年最大負荷;E為年用電量;Pav為年平均負荷,等于年電量E除以8 760;Tmax為年最大負荷利用小時數(shù)。
表1 負荷特性指標及其計算公式
依據(jù)本文所建立的電力系統(tǒng)負荷預測模型,用某市2018—2020年的數(shù)據(jù)作為歷史樣本對模型進行訓練。對原始數(shù)據(jù)進行處理,得到負荷的一系列特性指標以及氣候指標數(shù)據(jù),包括日平均負荷、月平均負荷、日負荷率、日最小負荷率、月不均衡系數(shù)、季不均衡系數(shù)、年負荷率、最高溫度、最低溫度、平均溫度、相對濕度和降雨量11項指標。
對整理出來的11項指標數(shù)據(jù)采用模糊聚類方法進行聚合,通過譜系圖得到聚類結(jié)果。聚類結(jié)果分為5類,可分別概括為日尺度指標、月尺度指標、年尺度指標、溫度指標和濕度指標。
將歷史負荷數(shù)據(jù)代入本文所建立的高斯過程回歸模型進行訓練,分別對日尺度和月尺度數(shù)據(jù)進行預測,真實負荷數(shù)據(jù)與預測數(shù)據(jù)對比如圖5所示。
分析圖5可知,對于日尺度負荷和月尺度負荷,利用高斯過程回歸模型中的resubLoss函數(shù)計算得出預測損失分別為0.064%和0.045%,預測精度都很高,有效實現(xiàn)了對短期負荷的精準預測。
圖5 負荷預測效果對比圖
本文采用模糊聚類算法以及高斯過程回歸算法進行電力系統(tǒng)負荷的預測。首先,通過分析挖掘出影響負荷變化的特性指標,為建立高斯過程回歸模型提供基礎(chǔ)。其次,利用聚類算法消除特性指標中的冗余信息,建立基于高斯過程回歸算法的負荷預測模型。最后,通過利用某市負荷數(shù)據(jù)作為實例進行了計算,驗證了該算法的有效性。高斯過程回歸模型雖然能進行全局預測,但未能聚焦于局部信息,要進行更加精確的短期預測,可以采用局部預測模型,例如結(jié)合ARMA和GPR模型進行預測。