紀素娜,吳丹妍,林幕群,黃朝凱
(廣東電網有限責任公司汕頭供電局,廣東 汕頭 515041)
隨著高壓直流輸電(high voltage direct current,HVDC)和風能、太陽能、水電能等新能源的不斷發(fā)展,現代電力系統(tǒng)已成為大規(guī)模交直流混合電網系統(tǒng)[1-2]。由于電力需求的不斷增長,電力系統(tǒng)被迫在壓力更大、安全級別更低的條件下運行。實際電力系統(tǒng)運行可基于網絡、大數據、物聯網、通信技術[3-5],對通過關鍵接口的功率傳輸進行監(jiān)測,從而及時發(fā)現電網安全隱患。電網數據安全分析對配電網動態(tài)安全評估具有重要意義,可為后續(xù)的預防控制提供有價值的決策信息。
為此,眾多學者對配電網數據安全分析進行了研究。文獻[6]提出了1種基于模糊神經網絡的配電網故障風險智能預警方法,有效提升了配電網異常事件約束及預警算法效率。文獻[7]提出了1種新的配電網多級繼電保護系統(tǒng)故障運行狀態(tài)預警方法。該方法通過信號檢測器判斷配電網多級繼電保護系統(tǒng)故障是暫時性故障還是永久性故障。文獻[8]提出了1種基于風險評估計算安全預警評估指標的方法。該方法對低壓臺區(qū)運行狀態(tài)實施定量分析,并對狀態(tài)實時變化的風險進行預警?,F有研究的配電網安全分析方法大多針對低壓或高壓單一情況,而混合配電網數據的安全分析研究較少。此外,風電等新能源存在不確定因素及故障數據不易收集而導致數據量不均衡等問題。這給混合配電網數據分析帶來了挑戰(zhàn)。
針對上述問題,本文提出了1種基于計算智能的混合電網數據分析方法。該方法充分結合基于快速相關的濾波器(fast correlation-based filter,FCBF)、堆疊稀疏去噪自動編碼器(stacked sparse denoising automatic encoder,SSDAE)、半監(jiān)督極限學習機(semi supervised extreme learning machine,SSELM)、生成對抗網絡(generative adversarial network,GAN)等技術,可有效提升混合電網數據安全評估效率。
本文提出了用于快速、動態(tài)、安全地評估運行條件的最大輸電能力估計模型。該模型通過比較實際功率傳輸和最大傳輸能力來評估運行條件的安全性。如果實際功率傳輸小于最大傳輸能力,則運行條件為安全;否則,為不安全。
最大輸電能力估計模型的輸入為原始特征,經過FCBF、SSDAE、SSELM、GAN等關鍵技術,輸出為最大傳輸能力值。
首先,最大輸電能力估計模型基于FCBF從原始輸入特征中剔除無意義特征,以簡化特征維度,從而提高輸入數據質量。其次,最大輸電能力估計模型將簡化后的特征代入SSDAE,并從輸入特征中提取高級表示,從而學習復雜特征之間的內部關系。接著,最大輸電能力估計模型基于GAN進行電力數據增強,從而提高樣本多樣性。最后,最大輸電能力估計模型基于SSELM構建高層表示和最大傳輸能力值之間的內在聯系。
混合電力網中,原始輸入特性包括影響最大傳輸能力評估的所有因素。假設負載功率因數和風力發(fā)電功率因數恒定,本文選擇發(fā)電機的終端電壓、負載的有功功率、發(fā)電機、風電場和HVDC鏈路作為原始輸入特征以表征運行條件。此外,最大傳輸能力可以通過預防性控制措施改善,如發(fā)電機功率重調度、HVDC設定點控制和甩負荷等。當采取這些預防性控制措施時,相應母線的功率注入將發(fā)生變化。這些變化可以通過原始輸入特征反映??紤]到大型電網的輸入特征維數非常高,為消除不相關的輸入特征,本文基于FCBF進行特征選取,從而提高最大傳輸能力估計模型的準確性和訓練效率。
FCBF使用對稱不確定性測量2個隨機變量的非線性相關性,并快速從高維輸入特征中消除不相關特征。輸入特征選擇過程為:首先,計算每個特征和最大傳輸能力之間的對稱不確定性;其次,如果特征的對稱不確定性低于預定義的相關性閾值,則消除該特征。本文考慮了混合電網中風電功率的不確定性,因此風電場的有功功率始終保留在輸入特征中。
為了有效提取混合電網高級表示,本文將輸入數據轉換為一系列長度和高度相同的二維數據,并提出了一種基于SSDAE的特征提取方法。
(1)
對DAE進行改進后的堆疊去噪自動編碼器(stacked denoising automatic encoder,SDAE)LT為:
(2)
本文所提SSDAE特征提取器通過疊加SDAE構建,并以貪心的分層方式進行訓練,即前者的隱藏層用作后者的輸入。為解決多層神經網絡訓練時存在的梯度消失問題,本文提出了1種貪婪分層訓練策略:自下而上的無監(jiān)督預訓練和自上而下的有監(jiān)督微調。特征提取器遵循從SDAE1到SDAEn的逐層預訓練過程:首先,通過正向傳播計算第i層的網絡參數wi、bi和Fi;其次,將上一層的Fi作為下一層的輸入來計算Fi+1,直至訓練結束;最后,對所有SDAE進行疊加,生成最終特征映射,用于進一步的監(jiān)督訓練。
本文令數據集X上可觀測特征的真實樣本分布為Pg。本文假定輸入噪聲向量z下的數據分布為z~Pz(z)。GAN中生成器的目標為找到1個可微函數G,使得:
Pg(x)=G(z;θg)
(3)
式中:G為由多層感知器表示的可微函數;θg為生成器網絡的權重。
同理,鑒別器可定義為1個多層感知器D(x,θd)。其輸出為單個標量。D(x)為數據x來自生成器的概率。θd為鑒別器網絡的權重。鑒別器的主要目標是最大化實際數據和生成數據之間的相似性。
本文所提基于GAN的電力數據增強網絡結構如圖1所示。
圖1 基于GAN的電力數據增強網絡結構
GAN訓練過程可分為2個步驟:用固定的生成器參數更新鑒別器和用固定的鑒別器參數更新生成器。根據前述生成器和鑒別器的目標,GAN需要根據損失函數更新神經網絡的權重。鑒別器和生成器的損失函數分別如式(4)和式(5)所示。
Ez~Pz(z){log{1-D[G′(z)]}}
(4)
(5)
進一步結合式(4)和式(5),則有:
Ez~Pz(z){log{1-D[G′(z)]}}
(6)
一般情況下,監(jiān)督學習需要大量標記樣本[10-11]。然而,在考慮動態(tài)安全約束的情況下,最大傳輸能力估計的標記樣本生成非常耗時。為此,本文采用SSELM,通過將流形正則化項嵌入極限學習機(extreme learning machine,ELM)的損失函數,從而利用額外的未標記樣本提高回歸精度。與使用基于梯度的訓練算法的神經網絡相比,SSELM具有更高的訓練效率,且通常具有更好的泛化性能。
SSELM模型結構如圖2所示。
圖2 SSELM模型結構
SSELM的損失函數如式(7)所示。
(7)
式中:Les為SSELM的損失函數;C1為懲罰系數,取C1=30;Y為訓練樣本的標簽向量,即訓練樣本的最大傳輸能力值向量;J為隱含層的輸出矢量;ωe為SSELM的輸出權重向量;C2為流形正則項的系數,取C2=0.2;Tr(·)為矩陣的軌跡;H為隱含層神經元相對于所有標記和未標記樣本的輸出矩陣;L為拉普拉斯矩陣。
(8)
式中:h為隱藏神經元的數量,取h=280;Ih為維數為h的單位矩陣。
試驗所用數據集為中國某兩市互聯輸電網線路采集的數據。該電網包含2 292條母線、8條HVDC鏈路、305臺發(fā)電機和3 761條交流線路。電網基本負荷為126.547 GW。8條HVDC鏈路相關參數如表1所示。
表1 8條HVDC鏈路相關參數
互聯輸電網線路鏈接如圖3所示。
圖3 互聯輸電網線路鏈接示意圖
圖3互聯輸電網包含2個電網,即電網1和電網2。電網之間的關鍵輸電接口由1條1 000 kV和3條500 kV的輸電線路組成。其中,電網1包括6個500 MW的風電場,電網2中一部分發(fā)電機設置為旋轉備用發(fā)電機。當風力發(fā)電波動時,旋轉備用發(fā)電機將調節(jié)功率輸出,從而保持功率平衡。在計算最大傳輸能力時,電網1的發(fā)電功率和電網2的負荷功率同時增加。
電網中故障類型包括單個500 kV或1 000 kV輸電線路的三相短路故障。靜態(tài)安全約束條件設置為:正常和故障后狀態(tài)的母線電壓在0.9~1.1 p.u.范圍;暫態(tài)穩(wěn)定約束為任意2個轉子角度的最大分離不超過180°;瞬態(tài)電壓安全約束為0.75~1.1 p.u.范圍的任意母線電壓的持續(xù)時間不超過1 s;判斷換相故障的最小允許電壓設置為0.8 p.u.。判斷強制HVDC阻塞的時間閾值設置為1 s。
仿真軟件環(huán)境為由pycharm建立算法框架、由Python基于tensorflow和Keras搭建學習算法。同時,算法運行硬件環(huán)境為Intel Core i9-9280X CPU,內存為32 GB,操作系統(tǒng)為Ubuntu 18.04 64位,顯卡為 NVIDIA RTX2080Ti 11G 2塊。仿真時,數據集中的50%樣本需進行標注,并將標注的樣本按照8∶2分為訓練集和測試集,并代入所提SSELM模型進行訓練。訓練完成后,標注的測試集和未標注的樣本共同構成驗證集以進行驗證。
試驗選取均方根誤差(root mean square error,RMSE)、平均相對誤差(average relative error,ARE)指標來衡量模型性能。RMSE和ARE較小表示模型估計能力較高,較大表示模型估計能力較低。RMSE和ARE計算如式(9)和式(10)所示。
(9)
式中:N為樣本個數;Pi為第i個樣本的真實值;Oi為第i個樣本的估計值。
(10)
不同模型在優(yōu)化策略下訓練集ARE對比如圖4所示。
圖4 不同模型在優(yōu)化策略下訓練集ARE對比
由圖4可知,SSELM模型+基于FCBF的特征選取+基于SSDAE的特征提取+基于GAN的數據增強訓練性能最優(yōu),最低ARE為0.018 9。該結果表明所提模型具有較好的訓練效果。基礎ELM模型訓練波段較大,收斂曲線非常不穩(wěn)定,最低ARE為0.0543。這是因為所提模型的特征選擇與特征提取可以有效過濾不重要特征,從而提升模型訓練針對性,有意引導模型向更優(yōu)特征學習。此外,數據增強能夠在一定程度上抑制過擬合問題,從而使模型能夠快速跳出“局部極值”,進一步加快網絡訓練效果。
為了進一步測試所提模型性能,本節(jié)在5個模型上進行了測試集對比驗證。5個模型分別是基礎ELM、FCBF特征選擇ELM(F-ELM)、SSDAE提取的高級表示ELM(S-ELM)、所提模型(無GAN數據增強)以及所提模型(SSELM+FCFB+SSDAE+GAN)。
測試集不同模型對比結果如表2所示。
表2 測試集不同模型對比結果
由表2可知,所提模型(基于GAN)的ARE和RMSE分別為0.020 9和81.59 MW。而基礎ELM最高,ARE和RMSE分別為0.084 6和289.51 MW。仿真結果表明,所提模型(基于GAN)可以利用未標記樣本有效提高回歸精度。這是因為傳統(tǒng)模型非常依賴數據樣本的質量,如果驗證集質量不高,將嚴重影響估計結果。另外,與基礎ELM模型相比,F-ELM和S-ELM性能更優(yōu)。這是因為特征選擇可以有效提升特征提取之間的關鍵信息,從而有效提高模型的回歸精度。
本文對混合電力網電力數據進行了研究與分析,建立了1種基于計算智能的混合電網數據分析方法。首先,本文基于FCBF進行特征選取,從而提高最大輸電能力估計模型的準確性和訓練效率。其次,本文提出了1種基于SSDAE的特征提取方法以解決輸入數據帶噪聲問題,從而提高網絡魯棒性。考慮到混合電力系統(tǒng)中存在數據缺失、數據不均衡等問題,本文提出基于GAN的數據增強方案,以準確補充電力系統(tǒng)中的缺失數據。本文方法為電力數據分析及安全故障排查的發(fā)展提供借鑒。
未來可對電力數據安全管理領域進行研究,如引入區(qū)塊鏈、云計算等技術提高混合配電網數據交互可靠性及效率,以進一步優(yōu)化智能電力故障診斷及定位方案。