胡健雄,湯 奕,李 峰,王 琦,趙 璇
(1. 東南大學(xué)電氣工程學(xué)院,江蘇省南京市 210096;2. 東南大學(xué)數(shù)學(xué)學(xué)院,江蘇省南京市 210096)
隨著交直流混聯(lián)電網(wǎng)規(guī)模的不斷擴大,以及新能源等電力電子化設(shè)備的大規(guī)模并網(wǎng),現(xiàn)代電力系統(tǒng)呈現(xiàn)出以新能源為主體的新型電力系統(tǒng)發(fā)展態(tài)勢[1-3],對電力系統(tǒng)分析與運行控制方法提出了更高的要求[4-5]。
由于難以通過實際電力系統(tǒng)試驗研究分析電力系統(tǒng)動態(tài)特性,通過機理構(gòu)建物理模型并進行仿真分析成為研究電網(wǎng)特性的重要手段[6-7]?;谠敿毼锢砟P偷姆抡嬗嬎悖梢栽陔x線狀態(tài)下對電力系統(tǒng)遭受人為設(shè)定擾動后的動態(tài)特性進行分析,從而制定電力系統(tǒng)控制策略,但面臨著建模困難、計算難度大等問題[8-9]。因此,對于所研究的特定問題,往往通過對研究對象的機理分析,建立具有針對性的物理模型,如功角穩(wěn)定分析中的擴展等面積準(zhǔn)則(extended equal area criterion,EEAC)[10-11]、頻率穩(wěn)定分析中的系統(tǒng)頻率響應(yīng)模型(system frequency response,SFR)[12]等?;跈C理分析的物理模型具有機理明確、可解釋性好及適應(yīng)性高的優(yōu)點,但針對復(fù)雜問題也存在建模困難,計算精度與計算效率之間的矛盾等問題[13]。
隨著以深度學(xué)習(xí)為代表的數(shù)據(jù)科學(xué)的快速發(fā)展,出現(xiàn)了一批以數(shù)據(jù)方法為基礎(chǔ)的電力系統(tǒng)分析控制方法[14-18]。這類數(shù)據(jù)方法包括統(tǒng)計分析方法、人工智能方法等,其利用試驗或歷史數(shù)據(jù)挖掘數(shù)據(jù)特征與所研究問題之間的關(guān)聯(lián)關(guān)系,避免了對電力系統(tǒng)物理模型的依賴,因此在對復(fù)雜場景的分析處理速度上表現(xiàn)出顯著優(yōu)勢[14]。如在暫態(tài)穩(wěn)定分析領(lǐng)域,近年來以圖神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的各類數(shù)據(jù)方法在分析速度、精度以及對電網(wǎng)拓撲結(jié)構(gòu)變化的適應(yīng)能力上表現(xiàn)出優(yōu)異的性能[16]。然而,數(shù)據(jù)方法雖擺脫了物理模型的限制,但其高度依賴于數(shù)據(jù)規(guī)模和質(zhì)量,且其結(jié)果往往缺乏可解釋性[18],這也制約了其在電力系統(tǒng)領(lǐng)域的大規(guī)模實際應(yīng)用。
對比電力系統(tǒng)物理方法與數(shù)據(jù)方法,前者基于詳細的機理分析,構(gòu)建電網(wǎng)特征與待研究問題間的因果關(guān)系,可解釋性高,無歷史數(shù)據(jù)依賴,具有全局性,但難以平衡復(fù)雜問題下計算精度與速度間的矛盾;后者基于數(shù)據(jù)間的關(guān)聯(lián)分析,構(gòu)建特征與研究問題間的關(guān)聯(lián)關(guān)系,計算效率高,可處理復(fù)雜問題,但可解釋性差,且受限于有限場景下的數(shù)據(jù),具有局部性特點。因此,若可以將物理方法與數(shù)據(jù)方法進行融合,將可以實現(xiàn)兩者特點的互補,構(gòu)建性能更佳的數(shù)據(jù)-物理融合模型[19]。文獻[20]首次提出了數(shù)據(jù)-物理融合思想在電力系統(tǒng)中的應(yīng)用,隨后融合方法在暫態(tài)穩(wěn)定分析[14,21]、暫態(tài)頻率分析[15,22]、電力系統(tǒng)模型參數(shù)辨識[23-24]等領(lǐng)域均已取得了較好的效果。但現(xiàn)有的數(shù)據(jù)-物理融合模型的研究往往偏重應(yīng)用效果,如何將融合模型的構(gòu)建從定性分析向定量分析提升亟待深入研究。
本文基于電力系統(tǒng)中數(shù)據(jù)方法與物理方法的特點,總結(jié)數(shù)據(jù)-物理融合模型的構(gòu)建模式與各自的特點。提出并聯(lián)模式下物理、數(shù)據(jù)模型的適用性條件,并在此基礎(chǔ)上對并聯(lián)模式進行理論分析,研究并聯(lián)模式應(yīng)用的充分條件,提出融合模型參數(shù)的選取方法,確定融合模型泛化誤差上限并依據(jù)泛化誤差上限提出提高融合模型性能的可行性建議,為并聯(lián)模式下的數(shù)據(jù)-物理融合模型的構(gòu)建提供理論支撐。最后,通過并聯(lián)模式下數(shù)據(jù)-物理融合模型在暫態(tài)功角穩(wěn)定分析中的應(yīng)用效果驗證了所提假設(shè)與分析結(jié)論的正確性。
電力系統(tǒng)研究中的主要問題一般可以概括為由實際電網(wǎng)采集的狀態(tài)量等組成的特征域到所研究特定問題的解組成的目標(biāo)域間的映射f。依據(jù)構(gòu)建電網(wǎng)特征域到目標(biāo)域間映射f的方法,電力系統(tǒng)問題的研究方法大致可以分為2 類:物理方法與數(shù)據(jù)方法。
1)物理方法通過對研究對象深層機制和原理的理解來推斷其特點,并結(jié)合具體應(yīng)用以合適的表達式描述特征域與目標(biāo)域間的因果關(guān)系,構(gòu)建電力系統(tǒng)特征x到待研究問題的解y間的映射g:x→y。
2)數(shù)據(jù)方法避免了對研究對象內(nèi)部機理的嚴(yán)格分析,其通過大量的測試試驗積累反映模型特征的數(shù)據(jù),采用不同的數(shù)據(jù)處理算法,構(gòu)建特征域與目標(biāo)域間的關(guān)聯(lián)關(guān)系,實現(xiàn)電力系統(tǒng)特征x到待研究問題的解y間的映射h:x→y。
物理方法能夠?qū)⒀芯空呷藶榭偨Y(jié)的全局知識抽象為具體的機理模型,有助于尋找問題本質(zhì)和開發(fā)新理論;而數(shù)據(jù)方法通過有限的數(shù)據(jù)樣本,構(gòu)建相關(guān)的經(jīng)驗?zāi)P停瑥臄?shù)據(jù)中挖掘問題的特征。因此,若能夠?qū)⒍哂袡C結(jié)合,綜合全局和局部特征、規(guī)則與經(jīng)驗,將有助于提出性能更優(yōu)的聯(lián)合方法。
數(shù)據(jù)-物理融合方法的具體聯(lián)合方式需要結(jié)合場景需求進行設(shè)計。綜合現(xiàn)有研究,指導(dǎo)數(shù)據(jù)-物理融合應(yīng)用的主要有并聯(lián)模式、串行模式、引導(dǎo)模式、反饋模式等4 種融合模式[25],如圖1 所示。
圖1 典型數(shù)據(jù)-物理融合模式Fig.1 Typical data-physical fusion modes
1.2.1 并聯(lián)模式
在電力系統(tǒng)中,由于建模時對部分已知或未知因素的忽略,知識驅(qū)動的機理模型與實際對象之間總是存在差異,從而導(dǎo)致機理模型結(jié)果的誤差難以避免。這種難以用機理模型表達的誤差可通過數(shù)據(jù)驅(qū)動的方法進行描述,從而輔助提升機理模型的準(zhǔn)確性。并聯(lián)模式主要適應(yīng)于物理方法與數(shù)據(jù)方法均有較好效果的場景,通過將兩者結(jié)果綜合處理后作為最終的輸出結(jié)果,從而進一步提高模型精度。具體的處理方法包括加權(quán)求和、開關(guān)函數(shù)控制等。
1.2.2 串聯(lián)模式
電力系統(tǒng)在線業(yè)務(wù)往往有較高的時效性要求,因而通常采用較簡化的物理模型犧牲部分計算精度以滿足時效性的要求。電網(wǎng)中大量的可量測特征有利于數(shù)據(jù)方法的應(yīng)用,但較大的量測冗余增加了針對特定問題構(gòu)建經(jīng)驗?zāi)P偷碾y度。串聯(lián)模式通過機理模型高效篩選提取輸入特征,進一步采用數(shù)據(jù)方法可以對機理模型的結(jié)果進行直接校正,從而實現(xiàn)數(shù)據(jù)與知識驅(qū)動方法應(yīng)用的協(xié)調(diào)。串聯(lián)模式通過數(shù)據(jù)驅(qū)動的經(jīng)驗?zāi)P?,修正知識驅(qū)動的機理模型的輸出結(jié)果,從而提高結(jié)果準(zhǔn)確性。該模式主要適合于簡化程度相對較大的機理模型,通過數(shù)據(jù)方法構(gòu)建簡化機理模型輸出結(jié)果與實際結(jié)果的關(guān)聯(lián)模式,從而校正機理模型結(jié)果。
1.2.3 引導(dǎo)模式
傳統(tǒng)的數(shù)據(jù)方法依賴于數(shù)據(jù)樣本中蘊含的關(guān)聯(lián)關(guān)系,對于樣本數(shù)據(jù)質(zhì)量和數(shù)量依賴度過高,難以保證生成經(jīng)驗?zāi)P偷姆夯阅堋M瑫r,由于數(shù)據(jù)方法生成的經(jīng)驗?zāi)P屯痪邆涿鞔_的物理意義,缺乏實際指導(dǎo)意義。引導(dǎo)模式以物理方法指導(dǎo)構(gòu)建合理的數(shù)據(jù)模型。其基于機理明確的物理模型,指導(dǎo)數(shù)據(jù)模型的構(gòu)建與訓(xùn)練,如基于物理機理修改數(shù)據(jù)方法的訓(xùn)練目標(biāo)。引導(dǎo)模式適用于希望數(shù)據(jù)方法結(jié)果更符合先驗知識的場景,通過修改數(shù)據(jù)方法設(shè)置的方式,將物理模型蘊含的先驗知識融入數(shù)據(jù)模型,從而提高數(shù)據(jù)方法性能。
1.2.4 反饋模式
電力系統(tǒng)物理模型在構(gòu)建中往往存在著模塊的簡化與等效,同時基于離線整定的模型參數(shù)往往無法準(zhǔn)確反映在線工況下特性的變化。而在實際電力系統(tǒng)運行中,能夠依靠各種信息采集設(shè)備,對電力系統(tǒng)的狀態(tài)進行量測。因此,可以通過數(shù)據(jù)方法調(diào)整物理模型中部分模塊或主要參數(shù),以提高模型精度。反饋模式適用于物理模型中存在部分機理未知或過于復(fù)雜以及參數(shù)不確定的場景,其通過數(shù)據(jù)方法替代或修正物理模型的相關(guān)模塊或參數(shù),在維持機理模型可解釋性的基礎(chǔ)上,提高對實際場景的適應(yīng)能力。
4 種典型融合模式及其應(yīng)用場景如表1 所示。
表1 典型融合模式及其應(yīng)用場景Table 1 Typical fusion modes and their application scenarios
通過采用不同融合方法構(gòu)建數(shù)據(jù)-物理融合模型,實現(xiàn)二者的有機結(jié)合,在各自應(yīng)用場景表現(xiàn)出更好的性能。但現(xiàn)有的數(shù)據(jù)-物理融合模型的構(gòu)建,往往基于定性分析,缺乏定量的理論分析支撐。
本文以并聯(lián)模式為例,基于對并聯(lián)模式應(yīng)用場景的合理假設(shè),提出物理模型與數(shù)據(jù)模型的適用性條件,并分析并聯(lián)模式泛化誤差,研究并聯(lián)模式條件,提出融合模型參數(shù)的選取方法,確定融合模型泛化誤差上限并總結(jié)提高模型性能的可行性建議。
1.3.1 并聯(lián)模式下融合模型定義
假設(shè)電力系統(tǒng)n維特征空間中的特征向量x=[x1,x2,…,xn]T∈Rn是滿足概率密度函數(shù)D0(x)的分布。定義特征向量對應(yīng)待研究問題的解為y∈R,其由映射f:Rn→R 確定,滿足y=f(x)。
基于從D0(x)分布中采樣所得的滿足D1(x)分布、樣本數(shù)量為n的數(shù)據(jù)集T={(x(i),y(i))|i=1,2,…,n},數(shù)據(jù)方法y=h(x)通過在數(shù)據(jù)集T上訓(xùn)練擬合的映射h:x→y,依賴于數(shù)據(jù)集T及其分布D1(x)。而基于人為總結(jié)機理構(gòu)建的物理方法y=g(x)則不依賴于采樣樣本及其分布。
基于物理方法與數(shù)據(jù)方法,通過不同的融合模式,在分布為D1(x)的數(shù)據(jù)集T的基礎(chǔ)上,將物理方法與數(shù)據(jù)方法進行融合,從而獲得近似于映射f的映射H:x→y。由于融合方法y=H(x)中包含了數(shù)據(jù)方法,其同樣受到數(shù)據(jù)集T的分布D1(x)的影響。
本文主要分析通過加權(quán)求和構(gòu)建并聯(lián)融合模式下數(shù)據(jù)-物理融合模型y=H(x),H(x)定義為:
式中:a∈[0,1]為融合系數(shù)。當(dāng)a取0 時,融合模型H(x)為:
即融合模型退化為純數(shù)據(jù)模型。
為方便表述,在不引起歧義的前提下,分別用實際結(jié)果y表示實際映射f(x)的輸出,g表示物理模型g(x)的輸出,h表示數(shù)據(jù)模型h(x)的輸出。
1.3.2 物理模型適用性條件
由于并聯(lián)模式主要適應(yīng)于物理方法與數(shù)據(jù)方法精度較高的場景,則在所融合模型的選擇方面,被選用的物理模型本身應(yīng)具有一定的準(zhǔn)確性,采用物理模型輸出值g(x)與實際值y=f(x)的相對誤差評價物理模型的準(zhǔn)確性,對物理模型假設(shè)如下:
即物理模型的絕對相對誤差小于100%。顯然,在滿足式(3)的條件下,y與g同號。
1.3.3 數(shù)據(jù)模型適用性條件
并聯(lián)融合模式下數(shù)據(jù)-物理融合模型中的數(shù)據(jù)模型訓(xùn)練目標(biāo)可表示為:
式中:E[·]為求期望函數(shù)。
訓(xùn)練完成后數(shù)據(jù)模型的輸出h將受融合系數(shù)a的影響,因此h在任意分布D上的期望ED[h]是受a影響較大的函數(shù)。設(shè)h滿足式(5):
則λ滿足式(6):
分析h/(y-ag),其分母是數(shù)據(jù)模型h的標(biāo)簽,h為數(shù)據(jù)模型的輸出,其比值λ在D上的期望ED[λ]以及包含λ的函數(shù)φ(λ)在D上的期望ED[φ(λ)]主要由所選數(shù)據(jù)模型的復(fù)雜程度與訓(xùn)練效果決定,受a的影響較小。因此,對融合模型中的數(shù)據(jù)模型做出假設(shè):λ與a無關(guān)。
1.3.4 泛化誤差定義
基于融合模型的定義以及融合模型中物理模型與數(shù)據(jù)模型的假設(shè),分別就融合模型與物理模型以及融合模型與數(shù)據(jù)模型的泛化誤差進行比較分析。本文采用平方損失函數(shù)計算泛化誤差,在忽略采樣與傳輸過程中的誤差后,定義融合模型的泛化誤差M0為:基于上述假設(shè)與定義,下面分別通過融合模型與物理模型、數(shù)據(jù)模型泛化誤差的對比,分析并聯(lián)模式適用條件,提出融合模型參數(shù)的選取方法,并通過推導(dǎo)融合模型泛化誤差上限總結(jié)提高融合模型性能的措施。
參考式(7)定義的融合模型泛化誤差,定義純物理模型在分布D0(x)下的誤差M1為:
定義物理模型系數(shù)k(x),同時考慮到對物理模型的假設(shè),有
為表述方便,在不引起歧義的條件下g(x)、y(x)和k(x)簡化為g、y和k。將式(9)代入式(8),物理模型誤差M1可表示為:
同理,將式(5)與式(9)代入式(7),有
采用做商法比較融合模型誤差M0與純物理模型誤差M1,有
其中,∫g2D0(x)dx為非負常數(shù),概率密度Dg(x)的定義為:
分析式(12)可知:若滿足條件k-1∈(0.5,1),總可以取某個融合系數(shù)a<1,使得(k-1-a)2小于(k-1-1)2;若不滿足條件k-1∈(0.5,1),則取a=1,保證(k-1-a)2等于(k-1-1)2。
由上述分析可以發(fā)現(xiàn),通過對融合系數(shù)a的選取,總能使得(k-1-a)2不大于(k-1-1)2,若在此基礎(chǔ)上再滿足條件(1-λ)2<1,則總能保證式(14)成立。進一步考慮式(6)定義以及融合模型中數(shù)據(jù)模型的相對誤差εhr的定義,有
則可得融合模型泛化誤差小于純物理模型的充分不必要條件為:
由式(16)可以看出,融合模型的泛化誤差小于純物理模型的充分不必要條件是融合模型中數(shù)據(jù)模型的相對誤差絕對值|εhr|<100%。因此,若滿足|εhr|<100%,則融合模型的泛化誤差必然小于純物理模型。
式(1)和式(2)分析了融合模型與純數(shù)據(jù)模型的關(guān)系,即純數(shù)據(jù)模型是融合系數(shù)a取0 時的特殊情況。定義純數(shù)據(jù)模型泛化誤差為M2,有
可見,比較純數(shù)據(jù)模型與融合模型的泛化誤差等價于分析融合系數(shù)a對融合模型泛化誤差的影響,即比較融合模型在融合系數(shù)a取0 時的泛化誤差M0|a=0與a取非0 值時的泛化誤差M0|a≠0。經(jīng)推導(dǎo)變換,M0可變換為如式(18)所示a的函數(shù),具體推導(dǎo)過程見附錄A。
式中:A0、A1和A2的定義見附錄A 式(A3)。
由式(18)可以看出,融合模型泛化誤差M0是關(guān)于a的二次函數(shù),將M0記為M0(a),其開口向上(由于A2>0),在對稱軸a=A1處取極小值。顯然,對于泛化誤差M0(a),若滿足條件A1>0.5,則必有M0(0)>M0(a)。對A1進行分析,有
引入類似于式(13)的概率密度變換,并定義概率密度函數(shù)Dλg(x)為:
將式(20)代入式(21),則A1可改寫為:
由式(9)可知,k-1∈(0.5,+∞),即有:
則融合模型泛化誤差M0(a)的極小值點A1∈(0.5,+∞),結(jié)合式(18)可知,在融合系數(shù)a的定義區(qū)間[0,1]上始終有:
即融合模型泛化誤差小于純數(shù)據(jù)模型。
同時,由于極小值點A1∈(0.5,+∞),則融合系數(shù)a取0.5 時,在不知道極值點A1具體取值的情況下,總能保證融合模型精度相較于數(shù)據(jù)模型具有較大的提升。
進一步分析式(22)可知,M0(a)的極小值點A1是k-1在概率密度函數(shù)Dλg(x)下的期望,其中Dλg(x)未知,式(9)對k-1的定義說明k-1是實際結(jié)果y與物理模型輸出g的比值,雖然對物理模型的假設(shè)給出了k-1寬泛的取值區(qū)間(0.5,+∞),但依據(jù)對一般物理模型的經(jīng)驗,物理模型在大多數(shù)情況下誤差并不會過大,即k-1應(yīng)當(dāng)主要分布在1 附近。
基于上述分析,給出不同融合系數(shù)a的取值建議。
1)直接依據(jù)對物理模型的經(jīng)驗認識將融合系數(shù)a始終設(shè)置為1。在融合模型所選用的物理模型性能較好時(即k-1主要分布在1 附近),可以獲得效果最佳的融合模型,而在其他情況下,即使不能保證融合模型性能達到最佳,但能保證融合模型優(yōu)于純數(shù)據(jù)模型。
2)利用訓(xùn)練集測試設(shè)置融合系數(shù)a。在已知訓(xùn)練集上利用式(9)計算并統(tǒng)計k-1的分布,若k-1集中分布于某數(shù)a0附近,則設(shè)置融合系數(shù)a=a0以期獲取效果最佳的融合模型(若a0>1 則取1);若k-1分布較為分散,則設(shè)置融合系數(shù)a=0.5,以保證融合模型精度相較于純數(shù)據(jù)模型具有較大的提升。
第2、3 章分別對比分析了融合模型與純物理模型和純數(shù)據(jù)模型的泛化誤差。本章分析了融合模型本身的泛化誤差,以確定融合模型泛化誤差上限并總結(jié)提高融合模型性能的可行性建議,為構(gòu)建高性能并聯(lián)模式下的數(shù)據(jù)-物理融合模型提供理論支撐。
參考式(7)所定義融合模型泛化誤差,為方便后續(xù)表述,此處定義融合模型平方損失函數(shù)L(x)為:
則定義基于滿足D1(x)分布的訓(xùn)練集S的融合模型訓(xùn)練誤差Mtrain為:
再對式(7)所描述融合模型泛化誤差進行變換,有
式中:Mtrain在訓(xùn)練中通過優(yōu)化算法可以達到一個較小的正值。雖然在訓(xùn)練過程中可以采用不同的優(yōu)化算法,但在訓(xùn)練完成后Mtrain總為一個已知且較小的定值。
通過對式(26)進行推導(dǎo)變換與合理放縮,可構(gòu)建出不依賴于實際分布(僅依賴于訓(xùn)練和已知的訓(xùn)練集分布)的融合模型泛化誤差上限M0max,如式(27)所示,詳細的推導(dǎo)過程見附錄B。
式中:V為特征向量的可行域空間大小。
分析由式(27)所得泛化誤差上限可知:
1)訓(xùn)練樣本的采樣應(yīng)盡量平均。若采樣過于集中,將導(dǎo)致max(D1)增大,即增大融合模型泛化誤差上限;相反,采樣較為平均可以降低max(D1),從而降低融合模型的泛化誤差上限;
2)應(yīng)盡量將物理模型誤差較大的樣本納入訓(xùn)練集。在訓(xùn)練集中的樣本通過訓(xùn)練可以有效減少相對誤差,通過將物理模型誤差較大的樣本納入訓(xùn)練集,降低擁有較大物理模型誤差(即(y-g)2較大)的樣本的εhr,從而降低max(ε(y-g)2),有利于融合模型泛化誤差上限的降低。
基于文獻[26]中提出的基于數(shù)據(jù)-物理融合模型的電網(wǎng)暫態(tài)臨界切除時間(critical clearing time,CCT)在線預(yù)測方法,采用本文所提融合模式重新構(gòu)建針對電網(wǎng)CCT 預(yù)測的數(shù)據(jù)-物理融合模型,并在IEEE 10 機39 節(jié)點系統(tǒng)中對所提理論進行測試驗證。
以集成擴展等面積準(zhǔn)則(integrated extended equal area criterion,IEEAC)為代表的EEAC 方法在實際電力系統(tǒng)暫態(tài)穩(wěn)定分析中獲得了廣泛應(yīng)用[10-11,26]。該類方法通過互補集群慣性中心和相對運動(complementary-cluster center-of-inertia and relative-motion,CCCOI-RM)變換,將電網(wǎng)暫態(tài)軌跡投影到單機無窮大系統(tǒng)上,然后應(yīng)用等面積準(zhǔn)則分析系統(tǒng)穩(wěn)定性。
為兼顧計算效率,IEEAC 在計算CCT 時通?;诮?jīng)典的發(fā)電機模型,其計算結(jié)果存在可能的簡化誤差。因此,可以采用數(shù)據(jù)驅(qū)動模型來校正這種簡化誤差,在保證計算效率的同時進一步提高CCT預(yù)測精度。本文選擇IEEAC 作為CCT 預(yù)測的機理模型方法與數(shù)據(jù)模型根據(jù)式(1)進行融合。
在數(shù)據(jù)模型的選擇方面,考慮到極限學(xué)習(xí)機(ELM)在訓(xùn)練速度以及泛化性能上的優(yōu)勢,本文主要選用ELM 作為融合的數(shù)據(jù)模型[27]。需要指出的是,數(shù)據(jù)模型并不限于ELM,也可以選用其他機器學(xué)習(xí)算法,如k臨近算法[28]等。
數(shù)據(jù)模型不直接使用融合模型的訓(xùn)練集進行訓(xùn)練,而是使用通過式(2)對訓(xùn)練樣本的CCT 標(biāo)簽進行處理后的訓(xùn)練集。同時,數(shù)據(jù)模型的輸出值需通過式(1)與物理模型輸出的CCT 預(yù)測值結(jié)合后形成融合模型的CCT 預(yù)測值。
采用IEEE 10 機39 節(jié)點系統(tǒng)作為測試系統(tǒng),應(yīng)用Monte-Carlo 方法生成測試所用樣本,其中,Monte-Carlo 方法的參數(shù)設(shè)置與文獻[24]相同,具體設(shè)置見附錄C 表C1。基于上述方法共生成1 500 組數(shù)據(jù)用于驗證本文理論分析。
基于生成的1 500 組數(shù)據(jù)樣本,構(gòu)建不同融合系數(shù)下的融合模型并在不同樣本數(shù)訓(xùn)練集下對融合模型進行測試。同時,考慮到本文選用ELM 構(gòu)建了所測試融合模型中的數(shù)據(jù)模型,進一步測試了不同融合系數(shù)、不同訓(xùn)練集容量的融合模型在不同ELM 隱層節(jié)點數(shù)下的性能,下文主要對比分析各測試場景下最優(yōu)ELM 隱層節(jié)點的融合模型。融合模型的測試場景的具體參數(shù)設(shè)置見附錄C 表C2。
在評價模型性能時,采用系統(tǒng)受擾后CCT 的實際值與預(yù)測值的平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean squared error,RMSE)作為具體的評價指標(biāo)。
依據(jù)設(shè)計的測試場景與算例設(shè)置方法對不同模型進行測試,下面結(jié)合實驗測試結(jié)果分別就不同模型對系統(tǒng)受擾后CCT 的預(yù)測效果、本文所提假設(shè)以及理論分析結(jié)果進行具體分析。
5.3.1 測試結(jié)果對比
表2 展示了不同訓(xùn)練集容量下不同融合模型以及物理模型在測試集樣本上預(yù)測CCT 的MAE 指標(biāo)、RMSE 指標(biāo)。其中當(dāng)融合模型融合系數(shù)取0 時,融合模型退化為數(shù)據(jù)模型。分析測試結(jié)果可以發(fā)現(xiàn),融合模型的性能隨著訓(xùn)練樣本容量的增加而逐漸提升,但隨著融合程度(融合系數(shù)a)的增加呈現(xiàn)先提升后降低的趨勢。在訓(xùn)練集樣本數(shù)m=1 000,融合系數(shù)為0.5 時,融合模型的MAE 指標(biāo)相較于物理模型提升了41.11%,RMSE 指標(biāo)相較于物理模型提升了32.50%;相較于物理模型MAE 指標(biāo)提升了63.32%,RMSE 指標(biāo)提升了61.15%。
表2 不同訓(xùn)練集下不同融合模型MAE 和RMSE 對比Table 2 Comparison of MAE and RMSE of different fusion models with different training sets
測試結(jié)果表明,在訓(xùn)練樣本充足時,融合模型性能優(yōu)于物理模型,而在相同訓(xùn)練集容量下,融合模型優(yōu)于純數(shù)據(jù)模型(a=0 時的融合模型)。但當(dāng)訓(xùn)練集容量較小時,融合方法的MAE 指標(biāo)優(yōu)于物理方法,RMSE 指標(biāo)普遍低于物理方法,說明在訓(xùn)練樣本數(shù)量不足時,物理方法具有更好的穩(wěn)定性。
5.3.2 并聯(lián)模式適用性條件驗證
基于生成樣本與上述模型評價方法對所提模型假設(shè)進行驗證?;谖锢砟P蛯θ繕颖具M行測試的相對誤差統(tǒng)計結(jié)果如圖2 所示。
圖2 物理模型相對誤差統(tǒng)計分布Fig.2 Statistical distribution of relative errors in physical model
由圖2 可知,物理模型的相對誤差絕對值主要集中于0.25 附近,分布在[0,0.35]內(nèi),小于假設(shè)中所提出的[0,1]分布范圍,滿足物理模型假設(shè)。
由表3 展示的不同融合系數(shù)、不同訓(xùn)練集容量下λ的平均值可知,不同融合系數(shù)a下λ均值都接近于1,a對λ影響較小,數(shù)據(jù)假設(shè)成立。圖3 展示了全部訓(xùn)練樣本的λ統(tǒng)計結(jié)果。可見,隨著融合系數(shù)a逐漸接近于1,式(6)的分母逐漸接近于較小的物理模型誤差,使數(shù)據(jù)模型輸出h的波動過度放大,造成了λ分布范圍逐漸增大。
圖3 λ 的統(tǒng)計分布Fig.3 Statistical distribution of λ
表3 λ 平均值Table 3 Mean value of λ
5.3.3 與物理模型對比
針對本文中提出的融合模型優(yōu)于物理模型的充分不必要條件,測試并統(tǒng)計訓(xùn)練樣本容量為1 000 的條件下,不同融合系數(shù)下融合模型中的數(shù)據(jù)模型相對誤差絕對值的分布情況,其統(tǒng)計分布見圖4。
圖4 數(shù)據(jù)模型相對誤差的統(tǒng)計分布Fig.4 Statistical distribution of relative errors in data model
由圖4 可以知道,在a∈[0,0.5]時不同融合模型的數(shù)據(jù)模型相對誤差絕對值主要分布在20%以下,a∈(0.5,1]時相對誤差絕對值主要分布在100%以下,均滿足式(16)所示的充分不必要條件,融合模型優(yōu)于純物理模型,與測試結(jié)果相符。其中,在融合系數(shù)a接近1 時,會有少量測試樣本的數(shù)據(jù)模型相對誤差絕對值超過100%,而測試結(jié)果顯示此時融合模型同樣優(yōu)于物理模型。造成該現(xiàn)象的主要原因是物理模型的精度較高使得當(dāng)融合系數(shù)取1 時數(shù)據(jù)模型的輸出h的相對誤差被過度放大。
5.3.4 融合系數(shù)設(shè)定分析
由式(18)與式(22)可知,融合模型的最佳性能(即最小泛化誤差)由k-1的分布決定。通過式(9)計算并統(tǒng)計k-1的分布情況,結(jié)果如圖5 所示。
圖5 k-1的統(tǒng)計分布Fig.5 Statistical distribution of k-1
由圖5 可知,k-1集中分布于0.725 附近,依據(jù)式(18)與式(22)可以推測融合模型在融合系數(shù)為0.725 附近達到最佳性能。為便于比較,圖6 展示了不同訓(xùn)練集及不同融合系數(shù)時融合模型的MAE 指標(biāo)對比。
圖6 不同融合模型MAE 對比Fig.6 Comparison of MAE of different fusion models
由圖6 可見,融合模型的泛化性能隨融合系數(shù)a的變化情況與式(18)的二次函數(shù)形式基本相符,且在a∈[0.5,0.75]時達到最小值,此時融合模型性能優(yōu)于a在區(qū)間外的性能。此外,a取0.5 時的模型性能優(yōu)于更接近0.725 的0.75,這是由于k-1的分布并不完全集中于0.75,且式(22)中期望的概率密度分布非平均分布,即融合系數(shù)a在0.725 附近時模型性能較好,雖然不能保證融合系數(shù)a在0.725 時式(22)取最小值,但依據(jù)文中分析取融合系數(shù)為0.75 時,融合模型仍能取得較好性能。
本文針對數(shù)據(jù)-物理融合方法理論研究問題,總結(jié)了數(shù)據(jù)-物理融合模型構(gòu)建模式與各自的特點。針對并聯(lián)模式提出了合理假設(shè),研究了并聯(lián)模式適用條件與融合參數(shù)的選取方法,并進一步確定了融合模型泛化誤差上限,提出了降低泛化誤差上限的可行性建議,為并聯(lián)模式下的數(shù)據(jù)-物理融合模型的構(gòu)建提供了理論支撐。通過在電力系統(tǒng)暫態(tài)功角穩(wěn)定分析中的應(yīng)用驗證了所提假設(shè)與分析結(jié)論的正確性。
并聯(lián)模式主要適應(yīng)于物理方法與數(shù)據(jù)方法效果較好的場景,根據(jù)應(yīng)用場景不同,還有串聯(lián)模式、引導(dǎo)模式和反饋模式需要詳細的理論分析,有待于進一步研究以完善數(shù)據(jù)-物理融合方法的應(yīng)用。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。