陳 朔, 王 尉, 章 柯, 王艷龍, 張 照, 陳雪圓
(1.國網(wǎng)合肥供電公司, 安徽 合肥 230022;2.國網(wǎng)肥西縣供電公司, 安徽 合肥 231200)
負荷預(yù)測是保障電力系統(tǒng)安全、穩(wěn)定與經(jīng)濟運行的一項重要的基礎(chǔ)性工作,其以電網(wǎng)運行歷史數(shù)據(jù)為基礎(chǔ),通過挖掘負荷序列變化規(guī)律,關(guān)聯(lián)分析負荷影響因素,實現(xiàn)對電網(wǎng)負荷提前感知[1]。
因為負荷變化受到天氣溫度、節(jié)假日、區(qū)域分布等多因素影響,會表現(xiàn)出不同的變化規(guī)律,所以本文綜合天氣、節(jié)假日、區(qū)域差異等多影響因素,基于相似日[2]數(shù)據(jù)簇構(gòu)建了配變負荷曲線預(yù)測模型[3]。相比單一極值短期負荷預(yù)測,該模型能夠預(yù)測未來2日內(nèi)每間隔15分鐘一個數(shù)據(jù)顆粒度的負荷曲線,準(zhǔn)確刻畫各配變?nèi)珪r段負荷變化,全景展示各配變不同區(qū)間負載率時長占比,為電網(wǎng)調(diào)度管理、運行檢查工作提供依據(jù)[4]。
配變負荷變化影響因素有很多,其中由于用戶用電需求受氣象條件、節(jié)假日信息等因素影響,從而不同氣象條件、周末與非周末之間的負荷變化呈現(xiàn)不同規(guī)律,因此基于氣象因素、節(jié)假日信息實現(xiàn)的相似日判斷,針對不同相似日單獨開展負荷變化分析,有助于更好挖掘負荷變化規(guī)律[5,6],提高模型預(yù)測準(zhǔn)確度。本文選取待預(yù)測日前30日的多因素數(shù)據(jù),使用kmeans與輪廓系數(shù)組合的方法生成多個相似日簇。
表1 多因素數(shù)據(jù)示例
依據(jù)多因素數(shù)據(jù),相似日判斷方法如下:
步驟1:初始化相似日簇數(shù)范圍,并按照選擇得聚類數(shù)K1,隨機選取一個樣本作為第一個聚類中心C1。計算每個樣本與當(dāng)前已有類聚中心最短距離(即與最近一個聚類中心的距離),其中距離D(X)計算原理如下,這個值越大,表示被選取作為聚類中心的概率較大。并計算每個樣本被選為下一個聚類中心的概率P(Xi),用輪盤法選出下一個聚類中心,最終獲得K個聚類中心點。
(1)
(2)
步驟2:對數(shù)據(jù)集中每一個點,計算其與每一個質(zhì)心的距離D(X),離哪個質(zhì)心近,就劃分到那個質(zhì)心所屬的集合。把所有數(shù)據(jù)歸好集合后,一共有k個集合。然后重新計算每個集合的質(zhì)心。如果新計算出來的質(zhì)心和原來的質(zhì)心之間的距離小于某一個設(shè)置的閾值(表示重新計算的質(zhì)心的位置變化不大,趨于穩(wěn)定,或者說收斂),可以認為聚類已經(jīng)達到期望的結(jié)果,算法終止。如果新質(zhì)心和原質(zhì)心距離變化很大,則重復(fù)步驟二,待質(zhì)心變化收斂后停止。
步驟3:使用輪廓系數(shù)評估聚類簇數(shù)為Ki條件下的聚類效果,其中dismeanin為該點與本類其他點的平均距離,dismeanout為該點與非本類點的平均距離。該值取值范圍為[-1,1],越接近1則說明分類越優(yōu)秀。輪廓系數(shù)計算原理如下:
(3)
(4)
循環(huán)步驟一、步驟二、步驟三,選擇輪廓系數(shù)最大的聚類結(jié)果,獲得各相似日簇?;谙嗨迫沾亻_展不同類型日負荷曲線分析,可更加有效的挖掘負荷曲線變化規(guī)律,為模型構(gòu)建過程中的流程優(yōu)化、特征選擇和權(quán)重優(yōu)化提供支撐。
負荷日曲線變化受多種因素影響,除不同氣象、日期條件下日負荷曲線呈不同變化規(guī)律外,日負荷曲線還存在很強的周期性和連續(xù)性,日負荷曲線各點變化受其臨近的各個時間節(jié)點負荷值影響。故本文選擇2020年待預(yù)測日前10天同一時刻點值、相似日曲線同一時刻點前6點(1.5 h)數(shù)據(jù),以及節(jié)假日信息、天氣信息作為模型輸入,日負荷曲線預(yù)測模型特征輸入字段如表2所示。
表2 模型輸入特征
針對配變?nèi)肇摵汕€存在的周期性和連續(xù)序列變化規(guī)律,本文選擇強化集成學(xué)習(xí)梯度提升決策樹回歸(Gradient Boosting Regressor)方法構(gòu)建日負荷曲線預(yù)測模型,其相比傳統(tǒng)機器學(xué)習(xí)方法,獨有的強化集成學(xué)習(xí)機制可有效抑制日負荷曲線部分點值異常所帶來特征干擾,提高模型準(zhǔn)確度。Gradient Boosting Regressor方法每輪訓(xùn)練會迭代生成一個弱學(xué)習(xí)器,這個弱學(xué)習(xí)器擬合損失函數(shù)關(guān)于之前累積模型的梯度,然后將這個弱學(xué)習(xí)器加入累積模型中,逐漸降低累積模型的損失。即參數(shù)空間的梯度下降利用梯度信息調(diào)整參數(shù)降低損失,函數(shù)空間的梯度下降利用梯度擬合一個新的函數(shù)持續(xù)降低損失,當(dāng)模型訓(xùn)練收斂后會獲得一個由多個弱分類器組成的集成強分類器。
F0(x)=argminLoss(yi,h(xi))
(5)
(6)
(7)
Fm(x)=Fm-1(x)+vh(x)
(8)
上式中Fm(x)為累積模型,h(x)為迭代生成弱學(xué)習(xí)器,yi為函數(shù)目標(biāo)值,Loss函數(shù)為評估弱學(xué)習(xí)器在給定輸入yi條件下輸出結(jié)果與真實值的差距,gm為第m輪弱學(xué)習(xí)器訓(xùn)練損失函數(shù)的負梯度,v為最佳模型迭代學(xué)習(xí)率。構(gòu)建完成的配變?nèi)肇摵汕€模型對預(yù)測日曲線各點依次進行預(yù)測,輸出未來2日負荷曲線,模型預(yù)測流程如圖1所示。
圖1 模型預(yù)測流程
負荷過低易導(dǎo)致配變設(shè)備輕載運行,降低電網(wǎng)運營效率。負荷過高易導(dǎo)致配變設(shè)備重過載運行,增加設(shè)備故障風(fēng)險。因此使電網(wǎng)運行在合理的負荷區(qū)間,是維持電網(wǎng)安全經(jīng)濟運行的有效保障。通過開展負荷曲線預(yù)測,提前感知配變運行狀態(tài),是使配變運行在合理負荷區(qū)間的重要途徑之一。模型在2020年7~8月期間,針對合肥地區(qū)25 000個配變進行了應(yīng)用驗證,如圖2所示,其為隨機選取的15天200個配變間,對應(yīng)點平均實際日負荷曲線與模型預(yù)測各對應(yīng)點平均日負荷曲線擬合效果。依據(jù)配變?nèi)肇摵汕€值預(yù)測結(jié)果可計算配變每日不同負載率區(qū)間時長占比,全息預(yù)感知配變?nèi)者\行負荷狀態(tài)。
圖2 預(yù)測效果擬合效果
在驗證過程中模型選擇數(shù)據(jù)總量(150萬條)的70%作為訓(xùn)練樣本,30%作為測試樣本,過程中數(shù)據(jù)樣本量和模型效果如表3所示,模型曲線預(yù)測準(zhǔn)確度計算原理如式(9)所示。式中tvi為單點預(yù)測準(zhǔn)確度,avgt為日曲線預(yù)測準(zhǔn)確度。對所有日曲線預(yù)測準(zhǔn)確度求平均可得日曲線預(yù)測平均準(zhǔn)確度,經(jīng)計算本文模型平均準(zhǔn)確度為91.33%,如表3所示。
(9)
表3 模型驗證參數(shù)
本文首先基于氣象、節(jié)假日等信息利用特征工程和相似聚類實現(xiàn)相似日判斷,在此基礎(chǔ)上使用強化集成學(xué)習(xí)方法建立了一個配變?nèi)肇摵汕€預(yù)測模型,相比傳統(tǒng)回歸類算法,使用強化集成學(xué)習(xí)方法訓(xùn)練構(gòu)建模型,能夠基于強化集成學(xué)習(xí)方法獨有的強化集成投票融合學(xué)習(xí)機制,使模型對于數(shù)據(jù)波動具有更好的擬合預(yù)測效果。同時通過開展配變負荷曲線預(yù)測可數(shù)據(jù)量化配變負荷不同區(qū)間占比,實現(xiàn)配變?nèi)肇摵扇案兄?,更好地助力電網(wǎng)精益化管理。經(jīng)驗證該模型可以有效預(yù)測未來2日配變負荷曲線,有效支撐電網(wǎng)調(diào)度運行方式安排和設(shè)備運維檢修工作。