云南電網有限責任公司文山供電局 張兆陽 申娟平 楊 俊 趙曉寅 趙樹輝
電網輸電負荷預測主要是指針對性地預測饋線、大用戶等負荷單元,為后期配電化狀態(tài)預判提供重要的依據(jù)和參考。負荷預測結果是否準確,直接影響了電網輸電精細化管理水平以及供電的可靠性[1]。對于電網輸電而言,其應用范圍較廣的預測方式主要包含短期預測和中長期預測。本文結合這兩種預測方式,利用基于大數(shù)據(jù)技術解決方案,對電網輸電負荷進行科學化預測。
在進行電網輸電負荷預測時,要做好對負荷、氣象、算法模型等數(shù)據(jù)的整合處理,同時,還要將這些數(shù)據(jù)劃分為實測值、分析值。為實現(xiàn)對負荷數(shù)據(jù)實測值的精確化采集,需要借助用電信息采集系統(tǒng),將采集好的信息導入指定的文件格式中,然后,通過執(zhí)行后臺服務程序,篩選出滿足相關數(shù)據(jù)實測值的數(shù)據(jù),并下載、解析處理這些數(shù)據(jù)。為實現(xiàn)對氣象數(shù)據(jù)實測值的全面化采集,要利用電力氣象平臺,對其進行采集和整理,并利用后臺服務程序,將氣象數(shù)據(jù)直接傳輸?shù)酱髷?shù)據(jù)平臺中。在采集設備容量變化數(shù)據(jù)、有序用電數(shù)據(jù)時,要利用電網搶修系統(tǒng),將所采集的數(shù)據(jù)安全、可靠地傳輸?shù)酱髷?shù)據(jù)平臺中。
對于電網輸電二次系統(tǒng)而言,在具體建設期間,存在設備分布點過多、數(shù)據(jù)維護不全面、數(shù)據(jù)易丟失等問題。目前,比較常見的數(shù)據(jù)缺失類型主要包含隨機缺失類型和非隨機缺失類型。相關人員要做好對數(shù)據(jù)缺失問題的有效處理。在具體實踐中,當處理的數(shù)據(jù)缺失量相對較少時,要做好對缺失量的刪除,并插補處理數(shù)據(jù)。此外,在預測電網輸電負荷時,要做好對平均值的采集和整理,并采用貝葉斯預測法,做好對多個插補值的有效采集,并結合當前信息變化情況,獲得所需要的插補數(shù)據(jù)。
影響電網輸電負荷因素相對較多,主要包含溫度、濕度、風力、日照、氣壓等因素,進行電網輸電負荷分析時,要從高維數(shù)據(jù)中篩選出屬性集,確保計算復雜度降到最低,使得模型訓練得以大幅度提高。隨機森林理論主要是指借助多棵決策樹,訓練并預測樣本數(shù)據(jù),對數(shù)據(jù)進行分類。在分類數(shù)據(jù)時,要結合不同屬性評分結果,評估不同屬性在數(shù)據(jù)分類中應用價值[2]。為保證影響因素篩選效果,需要利用數(shù)據(jù)集,形成相應的決策樹,單棵樹主要用于對小部分屬性的訓練,并對相關屬性進行統(tǒng)計分析處理。
氣象變化,通常會對電網輸電負荷產生直接性的影響,氣象這一因素具有時間滯后性等特點,因此,僅僅運用全局回歸的方法,無法對氣象數(shù)據(jù)進行全面化描述,而自適應分段線性模型樹的構建和應用,可以有效地分析氣象因素。
該方法在具體應用時,要運用分治策,對全局回歸進行優(yōu)化處理,從而保證目標分段處理效果。通過運用回歸樹,對葉子節(jié)點進行統(tǒng)一化處理,使得擬合誤差出現(xiàn)概率降到最低。為了提高最終擬合結果的精確性,需要精細化處理葉子節(jié)點[3],同時,還要擬合各葉子節(jié)點樣本,使其擬合為相應的線性函數(shù),從而實現(xiàn)對分段線性模型樹的構建。
為保證模型訓練結果精確性和真實性,要選用合適的算法,自動化生成相應模型參數(shù),同時,采用自適應策略,對參數(shù)變化區(qū)間進行科學設置,并保證遍歷循環(huán)效果,并結合最終模型誤差評估結果,對相關參數(shù)進行科學設置。另外,向樣本中分解相應的決策樹,從而保證線性擬合處理結果的精確性和真實性,只有這樣,才能確保氣象與負荷定量兩者之間形成較高的關聯(lián)度。
對于預測模型而言,在進行自適應訓練期間,為提升最終預測準確率,要優(yōu)先構建和應用動態(tài)自適應組合預測模型,并對各個預測模型的歷史準確率進行有效的評估和分析,從而實現(xiàn)對各模型權值比例系數(shù)的自動化修正。其中,在進行短期預測時,要并行運算指數(shù)外推模型、平均模型、決策樹模型等;在進行中長期預測時,要綜合運用線性回歸模型、向量機模型、ARMA 模型等[4]。為保證最終預測結果的精確性和真實性,要結合預測日、工作日、節(jié)假日、雙休日等日期類型,科學地評估和預測不同權重組合情況。
在進行電網輸電負荷預測時,計算效率提升,可以提高用戶使用體驗,保證高頻次滾動計算效率。受計算資源的限制,需要在優(yōu)化算法流程的基礎上,將預測任務科學地分配到相應的節(jié)點中,使得計算效率得以顯著提升[5]。此外,通過應用流計算技術,對數(shù)據(jù)進行轉換,使其轉換為無狀態(tài)數(shù)據(jù)、有狀態(tài)數(shù)據(jù)。在進行無狀態(tài)轉換時,僅僅用到當前批次數(shù)據(jù);在進行有狀態(tài)操作時,僅僅用到之前批次數(shù)據(jù)。運用電網輸電負荷預測算法,對滑動窗口操作進行短期預測。
4.2.1 基于滑動窗口操作的短期負荷預測
為保證最終短期負荷預測結果的準確率,結合滑動窗口實際操作情況,綜合運用歷史數(shù)據(jù)、氣象數(shù)據(jù)、檢修數(shù)據(jù)等,開展相應的短期負荷預測工作,促使滑動窗口操作變得更加規(guī)范化、科學化?;瑒哟翱谟嬎闳鐖D1所示。
圖1 滑動窗口計算
圖1中T1-Tn代表各個批次所輸入的負荷數(shù)據(jù)、氣象數(shù)據(jù)等預測數(shù)據(jù)。通過對數(shù)據(jù)進行匯集,使其匯集到足夠的窗口長度。在導入新批次數(shù)據(jù)時,需要篩選和剔除最早的數(shù)據(jù),完成對批次數(shù)據(jù)集的組合和構建。預測觸發(fā)在具體設計和實現(xiàn)時,需要科學地調整和控制滑動窗口時間間隔。這種預測方式的運用,可以提高數(shù)據(jù)查詢效率,縮短數(shù)據(jù)查詢所需時間,最大限度地提高最終計算效率。
4.2.2 基于無狀態(tài)操作的中長期負荷預測
中長期預測模式存在計算強度大、觸發(fā)頻率低、計算資源浪費等問題。為實現(xiàn)對中長期負荷預測模型的精確化定義,除了要做好對預測日期范圍的定義外,還要選用合適的算法。為保證中長期負荷預測結果的準確率,技術人員要重視對基于無狀態(tài)操作實現(xiàn)方案的制訂和使用,在運用該方案時,要做好對任務流的觸發(fā)處理,當計算操作完成后,觸發(fā)流程自動退出。當系統(tǒng)監(jiān)聽到人工制定的任務時,會向隊列中添加適量的任務,同時,結合CPU 核數(shù),分解和分配當前任務情況。
為進一步地提高中長期預測結果的精確度,簡化計算任務的復雜度,避免因出現(xiàn)任務阻塞而降低其他計算任務處理效率,需要利用多線程技術,依次執(zhí)行和處理多種不同的計算任務,并做好對執(zhí)行情況的及時報告。
在進行最終計算效率評估期間,分別運用傳統(tǒng)模式、微型機群、小型機群三種模式,對某省域電網輸電負荷進行中長期預測,輸入數(shù)據(jù)內容見表1。由于受某一條件限制,在以上三種模式下,計算資源配置與性能存在一定的差異,但并未影響最終結果。
表1 輸入數(shù)據(jù)內容
總耗時計算時間對比結果見表2。
表2 計算時間對比
從表2中的數(shù)據(jù)可以看出,隨著機群規(guī)模不斷提升,計算效率呈現(xiàn)出不斷增加的趨勢,通過運用基于大數(shù)據(jù)技術預測方案,達到高效化計算的目的。
為保證預測準確率評估操作的有效性和可靠性,本文重點分析和對比傳統(tǒng)預測方案、基于大數(shù)據(jù)技術預測方案所獲得的預測準確率情況。
首先,采用隨機抽取的方式,抽取出1000個負荷樣本,并將執(zhí)行時間控制為1個月,預測準確率對比結果見表3。在傳統(tǒng)預測方案中,主要將指數(shù)外推法和ARMA 模型法進行有效地結合,滾動執(zhí)行時間間隔為12h,每天滾動執(zhí)行2次。在基于大數(shù)據(jù)技術預測方案,將指數(shù)外推法、ARMA 模型法和決策樹模型法進行有效的結合,滾動執(zhí)行時間間隔為4h,每天滾動執(zhí)行6次。這表明,通過運用基于大數(shù)據(jù)技術預測方案,可以精細化、詳細化呈現(xiàn)出影響因素計算結果,同時,還促使最終分析預測頻次不斷提升,確保最終預測準確率得以大幅度提高。
表3 預測準確率對比
綜上所述,大數(shù)據(jù)技術的出現(xiàn)和應用,為電網輸電負荷預測提供重要的技術支持,通過應用該技術,進行數(shù)據(jù)存儲、數(shù)據(jù)預處理、負荷分析、預測模型構建等環(huán)節(jié),不僅提高最終預測結果的準確率,還確保負荷計算效率得以大幅度提高,完全符合實際應用需求,極大地提高用戶的使用體驗。因此,本文所提出的基于大數(shù)據(jù)技術的預測方案具有操作簡單、實用性強、預測準確率高等特點,完全符合實際應用需求。