邵 偉, 徐泰山, 王勝明, 郭 劍
(南瑞集團有限公司, 南京 211106)
通訊作者: 邵 偉, E-mail: shaowei@sgepri.sgcc.com.cn
隨著跨區(qū)交直流混聯電網的建設, 送受端電網的集中送出和受入輸電走廊中輸電線路越來越密集, 加之自然災害呈頻發(fā)趨勢, 電網發(fā)生交直流多重故障的概率大大增加.在線方式下綜合考慮大電網交直流交互影響、小概率事件以及外部災害的影響, 組合生成的多重故障的規(guī)模與電網規(guī)模、運行方式、外部災害范圍等因素相關, 對大電網來說, 其組合多重故障的數目將十分巨大, 若對所有故障進行詳細仿真分析則其耗時較長, 難以滿足在線評估與預警的實時性.
近年來, 數據挖掘和機器學習算法跨領域的快速發(fā)展, 為這一問題的解決提供了新的途徑.文獻[1]提出了一種適應于電網運行大數據的在線分布式安全特征選擇方法, 該方法能在線挖掘出關鍵的電網安全運行特征, 對運行大數據中關鍵問題起到了降低維數的作用.文獻[2]提出了一種基于支持向量機和決策函數的暫態(tài)穩(wěn)定評估方法.該方法以故障前潮流量為初始特征集, 結合暫態(tài)安全穩(wěn)定量化評估和統(tǒng)計理論方法, 提取輸入特征; 通過支持向量機訓練暫態(tài)穩(wěn)定評估模型,得出評估模型的決策函數, 并依據支持向量的決策值確定門檻值, 保證評估結果保守性.文獻[3]提出了一種結合上一時間斷面評估結果和電網實時運行方式變化的安全穩(wěn)定裕度快速估算方法.
國外在機器學習人工智能方法在電力系統(tǒng)中應用方面也進行了大量的研究.文獻[4]通過對幾種機器學習回歸方法的研究和比較, 建立了一種預測模型, 可以預測聯合循環(huán)電廠每小時滿負荷發(fā)電量.文獻[5]提出一種基于神經網絡的用于中壓/低壓變電站負荷預測的機器學習模型.文獻[6]提出一種利用譜能量和機器學習作為人工神經網絡, 利用k 近鄰和支持向量機對信號進行分類方法.文獻[7]提出了一種基于深度神經網絡的特征提取方法.
本文融合了傳統(tǒng)的因果分析方法和大數據思維[8]方法, 提出一種基于因果分析結果構建樣本庫, 基于機器學習進行穩(wěn)定裕度快速估算的方法, 提升分析計算的速度, 為電網安全穩(wěn)定快速決策提供依據, 為電力系統(tǒng)暫態(tài)穩(wěn)定分析評估提供了新思路.
技術框架如圖1 所示.
圖1 基于機器學習的電網暫態(tài)穩(wěn)定裕度估算技術框架圖
首先從海量的歷史量化分析或模擬仿真計算結果中, 按故障提取暫態(tài)穩(wěn)定模式, 將所有故障的穩(wěn)定模式取并集作為關鍵特征量.這種電網暫態(tài)穩(wěn)定關鍵特征量的提取方法, 從高維的數據中提取與電網暫態(tài)穩(wěn)定性密切相關的關鍵特征量, 有效降低屬性維數.
其次對各故障按特征量進行方式聚類, 生成電網安全運行知識庫.將海量歷史運行方式聚類成為若干個運行方式簇, 同一運行方式簇內的數據具有比較接近的運行方式, 并且針對同一考核故障下具有相同的暫態(tài)穩(wěn)定模式.
最后基于知識庫對當前方式下多重故障進行自動匹配和穩(wěn)定裕度快速估算.比較當前實時運行方式與各聚類基準方式的關鍵設備投停狀態(tài)是否一致, 如果一致則計算與該聚類基準方式的距離, 選取距離大于門檻值且最小的方式簇, 從而得到當前實時運行方式所屬的方式簇, 并分析當前實時運行方式與歷史運行方式之間的差異, 采用基于歷史分析結果的暫態(tài)穩(wěn)定裕度快速估算方法, 快速估算出當前實時運行方式的暫態(tài)穩(wěn)定裕度.
如果當前實時運行方式未匹配到任何歷史方式簇,則必須對當前電網實時運行方式進行詳細的仿真分析,將運行方式及仿真結果納入到歷史樣本庫中.
在機器學習的實際應用中, 特征數量往往較多, 其中可能存在不相關的特征, 特征之間也可能存在相互依賴或冗余, 特征數量越多, 容易導致以下問題:
1)分析特征、訓練模型所需的時間增加, 模型更復雜.
2)容易引起“維度災難”, 其推廣能力會下降.
3)容易導致機器學習中經常出現的特征稀疏的問題, 導致模型效果下降.
4)對于模型來說, 可能會導致不適定的情況, 即使解出的參數會因為樣本的微小變化而出現大的波動.
特征選擇是指從已有的M 個特征(Feature)中選擇N 個特征使得系統(tǒng)的特定指標最優(yōu)化, 是從原始特征中選擇出一些最有效特征量以降低數據集維度的過程, 是提高學習算法性能的一個重要手段, 也是模式識別中關鍵的數據預處理步驟[9-12].
從在線安全分析應用長期運行積累的海量歷史數據或構造的海量歷史數據中, 獲取的電網運行方式數據信息包括電網的運行狀態(tài)量, 主要包括: 母線電壓幅值、母線電壓相角、發(fā)電機有功無功、負荷有功無功、交流線路有功無功、變壓器有功無功、直流線路有功無功、容抗器投入無功容量.基于EEAC 的安全穩(wěn)定量化分析方法能夠給出各故障下的暫態(tài)功角穩(wěn)定裕度、暫態(tài)電壓安全裕度、暫態(tài)頻率安全裕度、發(fā)電機分群模式, 各發(fā)電機對暫態(tài)功角穩(wěn)定的參與因子, 各母線對暫態(tài)電壓穩(wěn)定的參與因子, 母線或發(fā)電機對暫態(tài)頻率穩(wěn)定的參與因子等信息.可以根據參與因子對電網的運行狀態(tài)量進行篩選, 提取與電網暫態(tài)穩(wěn)定性密切相關的關鍵特征量, 有效降低特征維數.選擇參與因子大于設定門檻值的相關元件狀態(tài)變量作為關鍵特征量, 具體包括:
(1)在加速群機組中, 選擇機組參與因子大于設定門檻值 λset-A的機組狀態(tài)變量作為關鍵特征量;
(2)在減速群機組中, 選擇參與因子絕對值大于設定門檻值 λset-S為的機組狀態(tài)變量作為關鍵特征量;
(3)在加速群節(jié)點中, 選擇負荷參與因子大于設定門檻值 λset-NA的負荷節(jié)點狀態(tài)變量作為關鍵特征量;
(4)在減速群節(jié)點中, 選擇負荷參與因子絕對值大于設定門檻值 λset-NS為的負荷節(jié)點狀態(tài)變量作為關鍵特征量;
聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程.聚類就是按照某個特定標準(如距離準則, 即數據點之間的距離)把一個數據集分割成不同的類或簇, 使得同一個簇內的數據對象的相似性盡可能大, 同時不在同一個簇中的數據對象的差異性也盡可能地大.可以具體地理解為, 聚類后同一類的數據盡可能聚集到一起, 不同類數據盡量分離.
實際電網運行方式具有明顯的規(guī)律性和重復性,對歷史數據進行分析和處理, 按照關鍵特征量將海量歷史運行方式聚類成為若干個運行方式簇, 同一運行方式簇內的數據具有比較接近的運行方式, 并且同一考核故障下具有相同的暫態(tài)穩(wěn)定模式.通過對電網運行方式的聚類, 可以有效提取電網中的典型運行方式,確保電網安全分析的完備性, 有利于發(fā)現孤立場景, 提高電網運行分析精度和電網運行管理決策的科學性,實現運行方式篩選的智能化.
考慮電網暫態(tài)穩(wěn)定模式的電網歷史運行方式聚類方法(圖2 ), 通過對歷史數據進行分析和處理, 按照電網的暫態(tài)穩(wěn)定模式, 將海量歷史運行方式聚類成為若干個運行方式簇, 同一運行方式簇內的數據具有比較接近的運行方式, 并且針對同一考核故障下具有相同的暫態(tài)穩(wěn)定模式.每一簇內包含多個運行方式接近的歷史運行方式, 也可能只包括一個歷史運行方式, 具體包括以下步驟:
(1)獲取全部電網歷史運行方式數據、故障信息,以及各故障下對應的暫態(tài)穩(wěn)定結果信息, 包括加速群機組、減速群機組、參與因子等穩(wěn)定模式信息, 以及暫態(tài)穩(wěn)定裕度;
(2)針對考核故障 Fm, 對包含該故障下的全部歷史運行方式進行聚類; 設定每個歷史方式下的詳細仿真得到的暫態(tài)功角裕度為 ηi, 根據加減速機組各自參與因子, 篩選出加速機組集合為Gsi, 減速機組集合為Gai, 特征線路投運集合 Li;
(3)初始時選擇一個方式K 作為基準方式, 加入基準方式集合;
(4)針對所有方式i, 判斷該考核故障的加速機組集合 Gsi、減速機組集合Gai和特征線路投運集合 Li是否和基準方式集合的基準方式的加速機組集合 Gsk、減速機組集合Gak以及特征線路投運集合Lk一致, 即:
① 加速機組個數和機組名稱和基準方式一致;
② 減速機組個數和機組名稱和基準方式一致;
③ 特征線路個數、投運方式和名稱和基準方式一致.
若上述條件均滿足, 則轉(4), 如果與基準方式集合所有的基準方式都不一致, 則將該方式作為一新的基準方式加入到基準方式集合, 處理下一個方式;
(5)根據待分類的方式i 與基準方式K 之間的方式差異, 以及基準方式K 的暫態(tài)穩(wěn)定裕度 ηk, 利用方式差異和歷史分析結果的暫態(tài)穩(wěn)定裕度快速估算方法,計算待分類方式i 的裕度 ηi-e;
(6)設定暫態(tài)功角穩(wěn)定裕度誤差上限 Δη(裕度誤差根據實際需求設置, 如10.0), 若滿足以下條件時:
① | ηi-e-ηi|≤Δη;
② ηi-e×ηi>0 (即 ηi-e、 ηi均為正或均為負).
則認為待分類的方式i 與基準方式K 可聚成同一簇, 如果基準方式集合無法匹配到同類基準方式, 則將該方式作為一新的基準方式加入到基準方式集合; 處理下一個方式, 如果所有方式聚類完成, 轉步驟(7);
(7)將同簇的數據各方式數據之間根據加減速機組功率和參與因子乘積的值序列的差值, 找到該簇的中心點, 將離中心點最近的方式作為該簇的基準方式;
(8)如果基準方式不再變化或者達到最大迭代聚類次數結束, 否則, 按新的基準方式形成基準方式集合,重復步驟(4)至步驟(7).
圖2 方式聚類流程圖
基于前述的關鍵特征量的選擇方法, 通過關鍵特征量找到與當前電網實時運行方式接近的歷史運行方式簇, 進一步根據當前電網實時運行方式與歷史運行方式之間的差異, 結合歷史運行方式的暫態(tài)穩(wěn)定裕度情況, 快速估算當前電網實時運行方式的暫態(tài)穩(wěn)定裕度, 具體步驟如下:
1)根據考核的故障, 比較當前實時運行方式與各聚類基準方式的關鍵設備投停狀態(tài)是否一致, 如果一致則計算與該聚類基準方式的加權距離, 選取距離大于門檻值且最小的方式簇, 從而得到當前實時運行方式所屬的方式簇.如果當前實時運行方式未匹配到任何歷史方式簇, 則必須對當前電網實時運行方式進行詳細的仿真分析.
2)從匹配到的歷史運行方式簇, 選取其中歷史運行方式及其暫態(tài)穩(wěn)定分析結果, 根據在線方式與歷史運行方式之間的關鍵特征量的差異, 采用基于歷史分析結果的暫態(tài)穩(wěn)定裕度快速估算方法, 估算當前電網運行方式的暫態(tài)穩(wěn)定裕度, 估算方法參見文獻[3].
對于特征值向量X, 由于每個分量對于穩(wěn)定性的影響是不同的, 因此, 在計算當前方式與基準方式的距離時需要考慮每個分量的權重.實際分配權重有兩種方式, 一是以基準方式各狀態(tài)量的參與因子作為權重,二是以該聚類所有方式狀態(tài)量參與因子的均值作為權重.
對應的距離公式分別為:
式中, X 為當前方式特征值向量, Y 為基準方式特征值向量, γn為基準方式各狀態(tài)量 yn對應的參與因子, γn為該聚類所有方式狀態(tài)量 yn對應的參與因子均值.
以某省級電網為例, 選擇共12 256 個運行方式及其計算結果構建訓練樣本, 其中安全樣本(裕度大于10)10 818 個, 預警樣本(裕度大于0 且小于10)68 個,不安全樣本(裕度小于0)1370 個.選擇共851 個運行方式作為測試集.針對指定的測試故障進行裕度快速評估, 訓練樣本分布圖如圖3.
圖3 訓練樣本分布圖
根據前述的基于量化分析的暫態(tài)穩(wěn)定特征量選擇方法, 提取包括116 臺機組有功值、7 條線路的有功值共123 個特征量作為暫態(tài)功角穩(wěn)定的關鍵特征量.
根據前述的電網歷史運行方式聚類方法, 對測試故障下的共12 256 個訓練樣本集歷史運行方式進行歷史方式聚類, 其中, 聚類的依據為:
(1)根據量化分析結果, 測試故障下對應的加速群機組投運狀態(tài)一致;
(2)該故障對應的關鍵特征量中, 選取的重要聯絡線投運狀態(tài)一致;
(3)聚類的暫態(tài)功角穩(wěn)定裕度門檻值設為±5.0%,即各簇內的暫態(tài)功角穩(wěn)定裕度最大差值不超過10%.
經前述考慮電網暫態(tài)穩(wěn)定模式的電網歷史運行方式聚類方法, 12 256 個訓練樣本集共聚類成462 個簇,其中部分簇內包含的歷史樣本較少.方式聚類分布圖如圖4.
圖4 方式聚類分布圖
分別比較測試集中各方式與各聚類簇中歷史方式的加速群機組投運狀態(tài)、重要聯絡線投運狀態(tài), 在加速群機組投運狀態(tài)、重要聯絡線投運狀態(tài)均一致的若干個簇中, 計算測試集方式與簇內運行方式之間的方式距離, 作為測試集方式的目標方式.進一步根據測試集方式與目標方式之間的運行方式差異, 利用基于方式差異和歷史分析結果的暫態(tài)穩(wěn)定裕度快速估算方法,得出測試集方式的裕度及其穩(wěn)定性結論.
將在線快速評估估算結果與實際仿真結果進行比較, 測試集共851 個樣本.
按照式(1)計算距離進行方式匹配,結果如圖5和圖6.
圖5 快速評估估算結果與實際仿真結果裕度比較結果1
共有34 個測試樣本出現錯判, 判斷準確率為96%(817/851), 誤判率為4% (34/851), 其中:
圖6 快速評估估算結果與實際仿真結果裕度誤差統(tǒng)計1
(1)實際時域仿真分析結果為暫態(tài)功角穩(wěn)定, 快速評估估算結果判為失穩(wěn)的共28 個樣本, 誤警率3.3%(28/851);
(2)實際時域仿真分析結果為暫態(tài)功角失穩(wěn), 快速評估估算結果判為穩(wěn)定的共6 個樣本, 漏警率0.70%(6/851).
統(tǒng)計在線快速評估估算結果與實際仿真結果之間暫態(tài)功角穩(wěn)定裕度結果之間的差異, 兩者之間的裕度平均絕對誤差為16.94%, 相對誤差為1%.
按照式(2)計算距離進行方式匹配, 結果如圖7 和圖8.
共有6 個測試樣本出現錯判, 判斷準確率為99.3%(845/851), 誤判率為0.7% (6/851), 其中:
(1)實際時域仿真分析結果為暫態(tài)功角穩(wěn)定, 快速評估估算結果判為失穩(wěn)的共0 個樣本, 誤警率0%(0/851);
(2)實際時域仿真分析結果為暫態(tài)功角失穩(wěn), 快速評估估算結果判為穩(wěn)定的共6 個樣本, 漏警率0.70%(6/851).
圖7 快速評估估算結果與實際仿真結果裕度比較結果2
圖8 快速評估估算結果與實際仿真結果裕度誤差統(tǒng)計2
統(tǒng)計在線快速評估估算結果與實際仿真結果之間暫態(tài)功角穩(wěn)定裕度結果之間的差異, 兩者之間的裕度平均絕對誤差為18.01%, 相對誤差為0.66%.
從誤差率的角度來看, 顯然用式(2)比式(1)效果更好.
本文提出了一種安全穩(wěn)定裕度快速估算方法.首先基于海量歷史評估結果和安全穩(wěn)定機理提取與電網暫態(tài)穩(wěn)定性密切相關的關鍵特征量, 其次然后對各故障按特征量進行方式聚類, 生成電網安全運行知識庫,最后基于知識庫對當前方式下故障進行自動匹配和裕度快速估算.通過具體工程實例說明上述方法的工程應用步驟和實際效果.由于方式聚類時用到了評估結果中的裕度信息, 而新方式匹配時缺少這一信息, 工程上用特征量之間的加權距離進行匹配, 這可能是結果誤差的主要來源, 不同距離計算方法會影響估算結果的準確性, 后續(xù)還要進一步分析和研究.