楊方圓 ,包 丹,張明理,鄧鑫陽,張 娜
(1.國網(wǎng)遼寧省電力有限公司經濟技術研究院,遼寧 沈陽 110010;2.國家電網(wǎng)公司東北分部,遼寧 沈陽 110180)
日負荷曲線是電力公司調度部門制訂調度計劃,安排發(fā)電機組開停機組合、經濟分配發(fā)電機組的有功出力及決定系統(tǒng)調峰容量的基礎。因此,研究如何實現(xiàn)日負荷曲線的精準預測對提高電力系統(tǒng)經濟效益有著重要的意義。
目前,傳統(tǒng)的短期負荷預測分析方法已不能滿足電力供需[1-10]精準預測的要求,急需提高電力需求方法的預測精度。文獻[11]提出基于負荷混沌特性和最小二乘向量機的短期負荷預測模型,通過相空間重構與訓練決策函數(shù),避免了傳統(tǒng)人工網(wǎng)絡法容易陷入局部極值的問題。文獻[12]提出了基于聯(lián)合灰色模型和最小支持向量機回歸的電力短期負荷智能組合方法,通過機器學習確定所選單一模型的權重因子,克服了傳統(tǒng)組合模型中設定權重因子的困難。文獻[13]通過對模型關鍵參數(shù)的自適應動態(tài)尋優(yōu),避免了最小支持向量機對設計者經驗的過度依賴以及選擇模型參數(shù)時缺少科學依據(jù)的局限性。
本文建立基于K-means聚類算法與支持向量機的短期負荷預測模型。支持向量機的計算結果通常取決于少數(shù)的幾個關鍵樣本,采用聚類算法篩選出與待測日最相似的樣本訓練集,在不影響支持向量機泛化能力的先決條件下有效地降低算法的復雜程度,預測結果具有較高的精度。采用以上方法對遼寧電網(wǎng)迎峰度夏期間的日負荷曲線進行預測,算例結果證明了該方法的有效性。
Κ-means聚類算法的基本原理:首先選取聚類數(shù)目k以及任意確定k個初始類簇中心點,計算每一個樣本點與k個初始類簇中心點之間的歐式距離,按最小歐氏距離的原則對所有樣本類型進行分類。反復計算類簇中心點,不斷調整樣本的分類,直至各樣本到所屬類簇中心點之間的距離平方和達到最小。
Κ-means聚類算法具有化繁為簡、快速高效的優(yōu)點,適合于巨量數(shù)據(jù)的聚類分析。該算法的缺陷是聚類數(shù)目k具有不確定性,如果聚類的數(shù)目設定不合理,將難以獲得優(yōu)良的聚類效果。
聚類的目標是通過選取最優(yōu)的聚類數(shù)目k,使得所有樣本的聚類生成簇實現(xiàn)最優(yōu)良的效果。通常情況下,希望獲得類內成員緊密、類間成員遠離的最佳聚類結構。為了獲得最優(yōu)的聚類數(shù)目k,通常采用聚類有效性指標來度量聚類算法生成簇的結果。目前,已有文獻中的聚類有效性指標難以獲得準確的最優(yōu)聚類數(shù),本文針對該問題設計了一種基于調整余弦相似度的新的Κ-means聚類算法有效性指標,該指標可以對聚類算法劃分結果的質量進行評價,從而獲得最優(yōu)聚類的數(shù)目k。
定義1:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設n個樣本對象聚類為m類,定義第j類的第i個樣本與類間樣本的最小調整余弦相似度平均值為ic(j,i),即:
(1)
定義2:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設n個樣本對象聚類為m類,定義第j類的第i個樣本與類內樣本的調整余弦相似度平均值為為ac(j,i),即:
(2)
定義3:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設n個樣本對象聚類為m類,定義第j類的第i個樣本的聚類有效性指標為最小類間調整余弦相似度平均值與類內夾角調整余弦相似度平均值之和、最小類間調整余弦相似度平均值與類內調整余弦相似度平均值之差的比值IACR(j,i),見式(3)。
(3)
IACR指標可以反映出數(shù)據(jù)集內某個樣本的聚類效果。本文通過計算聚類空間內所有樣本的IACR(j,i)指標的平均值來研究數(shù)據(jù)集的聚類質量,計算方法如式(4)所示。希望聚類生成簇后獲得類內成員盡可能緊密、類間成員盡可能分散的最優(yōu)聚類結構,如式(5)所示,當IACR取最大值時對應的聚類數(shù)目為最優(yōu)聚類數(shù)目。
(4)
(5)
該算法是基于結構風險最小化原理的通用學習方法[14],適合于解決非線性空間的小樣本問題。支持向量機通常通過目標極小值優(yōu)化模型來確定回歸函數(shù):
(6)
(7)
通過求解式(7)可以得到回歸函數(shù):
(8)
選取日負荷曲線相似日的流程如圖1所示。
短期負荷預測存在一定規(guī)律,即相同日類型的負荷具有相似性??紤]到工作日與節(jié)假日的負荷特性存在差異,將日類型分為工作日與節(jié)假日兩類。為準確反映出氣象因素對負荷的影響,選取每天的整點氣溫、濕度、風速作為日特征向量。本文對日類型進行初步篩選后,將日特征向量作為聚類分析的樣本。
結合遼寧電網(wǎng)的日負荷曲線歷史數(shù)據(jù)及氣象局提供的氣象特征參數(shù)歷史數(shù)據(jù),采用聚類分析與支持向量機結合的算法對日負荷曲線進行預測。通過聚類算法選取相似日,充分考慮溫度、濕度、風速和日類型等參數(shù)的影響,利用支持向量機對遼寧電網(wǎng)的日負荷曲線進行預測。
以遼寧省的氣象數(shù)據(jù)為自變量,遼寧電網(wǎng)24 h負荷值為因變量,對2017年6月1日—8月17日的氣象歷史數(shù)據(jù)及預測日的氣象特征參數(shù)值進行聚類分析,確定最佳聚類數(shù)目,相似聚類效果如圖2所示。利用本文所介紹的方法對遼寧電網(wǎng)2017年8月18日負荷曲線進行預測,預測值與真實值的比較結果如圖3所示。
圖2 相似日聚類結果
圖3 預測日負荷的真實值與預測值比較
為了驗證本文方法的適用性與有效性,將傳統(tǒng)支持向量機與本文方法的預測效果進行比較,計算得到遼寧電網(wǎng)迎峰度夏期間的負荷預測結果如表1所示。采用本文方法計算得到2017年8月18—27日的負荷預測值,預測結果的平均相對誤差均低于3%,均方根誤差均低于3.5%。根據(jù)表2可知,采用本文的算法訓練樣本的數(shù)目明顯減少,當聚類數(shù)目為6,篩選后的支持向量機訓練樣本為384個,所需的訓練時間為傳統(tǒng)支持向量機算法的1/5。與傳統(tǒng)的支持向量機算法相比,本文提出的方法復雜程度明顯減弱,在迎峰度夏期間日負荷曲線的預測精度平均提高1.6%,實現(xiàn)良好的預測效果。
表1 負荷預測誤差比較
表2 本文算法與傳統(tǒng)支持向量機算法訓練速度的對比
本文提出一種相似日聚類算法與支持向量機算法結合的迎峰度夏期間負荷預測方法。此方法融合聚類算法與支持向量機兩者的優(yōu)勢,實現(xiàn)優(yōu)勢互補。利用遼寧電網(wǎng)迎峰度夏期間的日負荷曲線進行建模驗證,采用本文方法得到的日負荷曲線預測值,平均相對誤差在3%以內,樣本訓練的時間也大幅減少。該算例證明了本文預測方法的適用性與有效性。