馬曉琴,馬占海,羅紅郊,張華銘
(1.國網(wǎng)青海省電力公司信息通信公司,青海西寧 810000;2.北京清軟創(chuàng)新科技股份有限公司,北京 100085)
短期負荷預測通常指預測最近幾個小時內到不超過一周的負荷情況,并根據(jù)該情況調節(jié)近期的發(fā)電量,從而使電力能源的生產更加高效,同時還可以輔助電力公司采用動態(tài)定價的方案,以促進用戶合理用電[1-3]。由于負荷的不確定性以及電網(wǎng)供電的復雜程度不同,負荷預測仍需更合理的算法來提高其精確性[4-5]。隨著智能終端的廣泛應用,基于智能算法的負荷預測也成為了研究熱點,例如自回歸綜合移動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[6]、多線性高斯過程回歸(Gaussian Process Regression,GPR)等[7-8]。而在機器學習(Machine Learning,ML)領域也有諸多方法可適用于短期負荷預測,例如支持向量回歸(Support Vector Regression,SVR)、人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)及深度神經(jīng)網(wǎng)絡(Deep Neural Networks,DNN)等[9-11]。
智能電力儀表與通信系統(tǒng)可提供負載的詳細信息,然而其在配電系統(tǒng)中的應用仍處于起步階段。早期發(fā)表的關于負載分析的研究工作囊括了不同類型的聚類,包括K-均值(K-means Clustering Algorithm,K-means)、模糊聚類(Fuzzy C-means Algorithm,F(xiàn)CM)等。但大多數(shù)可用的基于機器學習的負荷預測方法,通常僅依賴單一數(shù)據(jù)源的歷史記錄,屬于單任務學習方法的范疇。因此在分析負荷動態(tài)的隨機特性時,上述方法均難以準確預測。該文探討了基于負荷特征的多數(shù)據(jù)源負荷分解與聚類融合方法,并基于貝葉斯時空高斯過程(Gaussian Process,GP)模型提出了短期用電負荷預測算法。此外還通過對公開數(shù)據(jù)集進行預測研究,證明了所提算法的優(yōu)越性。
大多數(shù)配電設施沒有關于其負荷組成的準確信息,而這些信息對于充分且經(jīng)濟地規(guī)劃電力網(wǎng)絡則較為關鍵。該文針對這一問題采用懲罰最小二乘回歸(Penalized least-squares Regression)和歐氏距離法(Euclidean Distance)來量化饋線負載的構成,以準確識別未知負荷情況的類型。
為了提供有意義的數(shù)據(jù)分析,需要將負荷配置轉換為可比較的形式。因此,可將每半小時的功耗轉換為單位化的測量值。根據(jù)負荷特征,首先將五天工作日平均化為一天,而將周六和周日表示為一個單一的時間段,得到一周的負荷單饋電曲線,如圖1 所示。
圖1 單饋電線負荷曲線
然后將每個已知的負荷分配到正確的扇區(qū),再通過使用不同負荷曲線間歐氏距離開發(fā)的程序分析數(shù)據(jù)并進行檢查。歐氏距離由畢達哥拉斯公式推導而來,根據(jù)精度假設每個負荷圖外形有144 個數(shù)據(jù)點,則其計算公式如下:
式中,a和b是計算負荷圖外形之間距離的參數(shù)。該文采用歐氏距離法來檢查分類假設,由于錯誤的分類可能會在錯誤的特征點形成聚類,所以該方法有助于聚類算法的實現(xiàn)。且當分解未知的負載分布時,其將顯著改進結果的準確度。
此外,歐氏距離法還可用于分析已知及未知的曲線輪廓。假設每個負荷曲線間的大部分差異是由具有其他部門影響因素的曲線來解釋的,則基于這種假設是原因是電力線或變壓器可能永遠不會只向一個部門供電。通過比較每個負荷配置間的距離可重新分配一個新的部門細分比例,進而確保負荷配置的正確分配。
歐氏距離過程首先為每個負荷數(shù)據(jù)創(chuàng)建一個距離矩陣,并對每個距離進行4 次方縮放,具體如式(2)所示,從而使較近的輪廓具有更大的影響:
創(chuàng)建一個距離矩陣D,具體如式(3)所示:
式中,n是已知輪廓的數(shù)量,文中取值59。
為了重新分配每個輪廓的比例,將縮放距離倒置,并將每個輪廓的值之和線性縮放回1,如式(4)所示。由此,將迫使較小的距離比其他距離具有更高的值。又因為輪廓的分解不應由同一輪廓組成,因此對角線可以設置為0。
計算這些k值的目的是將每行的總和縮放為1,k值的計算方法如下:
通過使用這些值,能夠確保每個輪廓的新比例之和均等于1。
上述方法著眼于負荷輪廓區(qū)別的距離,且使用大數(shù)據(jù)集進行負荷分解。而聚類方法則注重為每個部門創(chuàng)建一組特征輪廓,并為創(chuàng)建這些特征輪廓配置文件應用了K 均值聚類算法[12-14],同時還將相似的配置文件集分為一組。與其他聚類方法一致,K 均值使用歐氏距離來確定向量輪廓是否與其他類似。為了保證該種聚類方法能產生最準確的結果,需確定每個部門的最佳聚類數(shù)。輪廓顯示特定簇中指定的輪廓與其他簇的距離,而利用月平均值可顯示數(shù)據(jù)的聚集程度。然后通過比較不同聚類值范圍內的平均值,即可確定最佳聚類數(shù)。
對應于最大的負荷平均輪廓值,以月為單位的每個特征屬性均會聚集到各自的部門分類中。隨后可將每個集群中的配置文件平均化,并作為每個子聚類的基礎,用于分解未知的負荷特征。最終再通過最小化完成這一過程,具體計算方式如下:
式中,yi是實際未知輪廓,X是特定月份的特征輪廓矩陣,J2(f)是粗糙度的懲罰,λ是平滑參數(shù)。將該方程最小化以找到貢獻向量的最佳擬合p,從而給出特定月份的隨機饋線貢獻。并在研究中的每個月重復此種最小化處理算法,且允許按月計算貢獻量。
表1 給出了使用這種負荷聚類方法對公開數(shù)據(jù)集上某區(qū)域每個未知饋線的分解聚類情況。其可分為8 個部分,分別為A1、A2、B1、B2、C以 及D1-D3。該程序通過選擇配置的最佳線性組合,來最小化聚類誤差。
表1 負荷饋線分解各部分占比(%)
通過上述負荷分解以及聚類融合,可以將用電區(qū)域的負荷量(E)特征由下式分解表示:
式中,μ為用電量數(shù)據(jù)漂移均值,η為數(shù)據(jù)隨機過程,e為負荷波動測量誤差。式(7)反映了數(shù)據(jù)間的系統(tǒng)級相關性,并可用于提高預測精度。
短期用電負荷預測算法通過將μ、η及e相似或相關的行為分組到一個集群中,再根據(jù)用戶的電力消費模式進行聚類,以量化獲取各參量。需要注意的是,若在空間上的用戶負荷呈現(xiàn)出一定的聚集規(guī)律,則η也會是有空間特征的隨機過程。通常情況下,電網(wǎng)的配電拓撲布置與饋線的分支相連,距離較近的饋線負荷可能比相距較遠的饋線負荷更為相似,這將導致用戶負荷具有空間相關的可預測規(guī)律。
隨著電力智能檢測設備實時性與精度的提升,負荷波動測量的誤差e逐漸減小,故可忽略。因此,上述模型可簡化為:
式(8)為貝葉斯時空高斯過程,其重點是獲取特征值參量[15-16]。平均值μ通常被假定為與耗電量相關的變量線性模型,GP則指正態(tài)分布的高斯過程系數(shù)。
通過在眾多預測任務進行的同時互相融合多個用電區(qū)域的負荷數(shù)據(jù),能在一定程度上改進預測效果。假設有Z個用電區(qū)域,對于用電區(qū)域l,l=1,2,…,Z,通過上述負荷聚類融合后,獲取的聚類類別包括N種。而擬建的多區(qū)域貝葉斯時空高斯過程模型具有以下模型結構:
式中,β是各相關變量的系數(shù)。同時,給出了每個區(qū)域的歷史用電負荷數(shù)據(jù)集X以及區(qū)域間的初步相關信息。GPZ指第Z個區(qū)域正態(tài)分布的高斯過程系數(shù),i=1,2,…,N。多區(qū)域貝葉斯時空高斯過程模型有兩個預測目標,多區(qū)域預測的目標是評估β1,…,βZ的具體數(shù)值,而GP的目標則是每個用電負荷區(qū)域數(shù)據(jù)預測模型的參數(shù)估計。
為了建立多區(qū)域貝葉斯時空高斯過程模型,應首先獲取每個負荷區(qū)域的參數(shù)值。然后將結果聯(lián)合,并按照區(qū)域之間的制衡關系衍生出綜合參數(shù)值。其中μ的多區(qū)域預測評估系數(shù)βl應根據(jù)多區(qū)域數(shù)據(jù)聯(lián)合估計,而GPl則是特定于用電區(qū)域的參數(shù),可基于用電負荷區(qū)域l的編號分別估計獲取。μl的估計精度會直接影響GPl的精度,反之GPl也會影響μl。該文提出了一種迭代融合算法,用于計算所有用電區(qū)域的參數(shù),設計的短期用電負荷預測算法總體流程如圖2 所示。
圖2 短期用電負荷預測算法流程
輸入訓練數(shù)據(jù)后,在第j次迭代中,通過減去在j-1 次迭代中從電力消耗數(shù)據(jù)獲得的高斯過程系數(shù)來更新μ的參數(shù)。然后預測相關隨機過程的貝葉斯高斯模型系數(shù)GP,再輸入測試數(shù)據(jù)進行收斂驗證,進而根據(jù)μ的變化情況來判定收斂性能。若未達到收斂程度,則在下次迭代前,應減去第j次迭代時的μ值來更新GP系數(shù)。這一過程迭代循環(huán)進行,直至達到收斂標準后停止。最后將預測的用電量與實際負荷測量值進行比較,得出預測誤差,從而評估預測算法的有效性[17]。
為了驗證基于負荷分解與聚類融合的短期負荷預測算法效果,在公開數(shù)據(jù)集上隨機選擇一周的負荷數(shù)據(jù)作為樣本進行實驗。在Matlab 平臺上進行算法編程及數(shù)據(jù)處理,并將其與K-means 聚類負荷分析預測算法進行比較。圖3 為使用該算法得到的短期用電負荷預測結果、實際負荷情況以及K-means算法負荷預測結果的對比圖。
圖3 預測負荷與實際負荷對比
從圖中可看出,所提算法能夠較好的預測實際用電負荷的走向。且與K-means 負荷預測算法相比,在負荷變化較快時的準確性更高。表2 則給出了兩種負荷預測算法與實際測量負荷的誤差對比。由表可知,該文所提算法的預測效果更優(yōu),尤其是在周末,K-means 負荷預測算法的誤差較大,而該算法仍可保持較高的準確度。
表2 預測誤差結果對比
兩種算法運行的消耗時間如圖4 所示。從圖中可看出,與K-means 算法相比,該文算法顯著節(jié)約了運行時間。此外,隨著預測區(qū)域的擴大,該算法仍能保持較快的運行速度及較高的預測精度。
圖4 不同算法運行消耗時間
文中通過采用貝葉斯時空高斯過程模型來描述不同用電區(qū)域之間的相關性,實現(xiàn)了對動態(tài)隨機負荷的準確預測。同時,初始負荷分類需要具有一定的準確性才能實現(xiàn)正確的分解,該文使用歐氏距離來確定負荷曲線集之間的相關模式,保證了準確的負荷聚類。基于公開數(shù)據(jù)集的實驗證實了算法具有較高的預測精度與較快的運行速度,該方法對于后期電網(wǎng)用電負荷的數(shù)字信息化管理預測具有重要意義。