郭雨涵,吳 君,郁 丹,蘇本慶
(1.浙江華云電力工程設計咨詢有限公司,浙江 杭州 310000;2.上海電力大學電氣工程學院,上海 200090)
我國為有效應對全球能源與環(huán)境問題,力爭于 2030 年前實現(xiàn)“碳達峰”,2060 年前實現(xiàn)“碳中和”。雙碳目標下可再生能源的裝機容量和新型負荷的負載功率進一步提高,其引入的不確定性將對新一代電力系統(tǒng)的安全、穩(wěn)定運行帶來消極影響。所以,構建可再生能源和負荷的不確定性模型是推動新型電力系統(tǒng)進一步發(fā)展的關鍵。場景分析法可根據(jù)潛在的源荷場景集分析源荷不確定性,為電力系統(tǒng)規(guī)劃調度等工作提供決策依據(jù),從而降低源荷不確定性的負面影響[1]。
目前的場景分析法主要有統(tǒng)計學方法、場景聚類法和深度學習生成法3種。其中,統(tǒng)計學方法根據(jù)歷史數(shù)據(jù)的統(tǒng)計經(jīng)驗對場景進行概率建模,然后結合蒙特卡洛等采樣方法生成源荷時序場景。文獻[2]采用Weibull分布、Beta分布分別構建了風速和光照強度模型,并結合蒙特卡洛模擬抽樣生成風光出力典型場景。文獻[3]采用拉丁超立方抽樣法生成了表征功率不確定性的原始場景集。運用統(tǒng)計學方法進行場景生成雖然具有工程應用價值,但計算效率較低。為了提升計算效率,大多數(shù)研究人員運用場景聚類法對大規(guī)模場景進行縮減,通過一定的相似度度量將具有相似時空特性的新能源出力或負荷聚為1類,形成了典型場景[4]。文獻[5]針對風電出力提出1種基于改進的K-means聚類和同步回代消除算法相結合的場景縮減方法。文獻[6]運用改進的K-medoids 算法形成了具有代表性的風光荷聚類場景。以上方法在保證計算精度的同時,提高了規(guī)模較大場景集合縮減的計算效率。
隨著近幾年來人工智能技術的飛躍發(fā)展,深度學習生成方法在場景概率建模領域得到廣泛關注。其無需顯式地獲取源荷功率曲線的概率分布,只要將隨機噪聲輸入到訓練好的模型就可產(chǎn)生服從潛在分布規(guī)律的功率曲線[7]?,F(xiàn)有的深度學習生成方法主要有生成對抗網(wǎng)絡(generative adversarial network,GAN)和變分自編碼器 (variational auto-encoder,VAE)等。然而,由于VAE無法準確地推理實際樣本的對數(shù)似然,只能對其下界進行近似估計,會導致生成的源荷隨機場景質量不高[8]。GAN則存在訓練過程不穩(wěn)定和損失函數(shù)難以收斂的問題[9]。
針對 GAN 模型的不足,本文提出了1種基于注意力機制生成對抗網(wǎng)絡(attention mechanism to generative adversarial network,AM-GAN)的源荷場景生成方法。該方法首先在傳統(tǒng)GAN結構的基礎上采用卷積神經(jīng)網(wǎng)絡來增強其特征生成能力,然后在判別器中引入注意力機制提高其對源荷時序數(shù)據(jù)相似性的判定能力,最后選用 Wasserstein 距離來衡量生成分布和真實分布的距離,以提高訓練的穩(wěn)定性。場景生成結果表明,所提方法能更精確地描述源荷不確定性。
GAN由Ian Goodfellow 首次提出。其主要思想來源于博弈論中的“二人零和博弈”。GAN運用歷史數(shù)據(jù)通過對抗博弈訓練出1個隨機生成網(wǎng)絡,從而把服從先驗分布的噪聲數(shù)據(jù)投射為符合真實樣本分布的生成數(shù)據(jù)。
GAN結構如圖1所示。其由生成器和判別器這2個相互獨立的部分組成。其中:生成器通過輸入隨機噪聲構造符合真實樣本分布的數(shù)據(jù);判別器通過內部網(wǎng)絡盡可能地判別輸入數(shù)據(jù)是真實數(shù)據(jù)還是生成數(shù)據(jù)。兩者相互博弈,不斷學習、優(yōu)化,最終達到納什均衡。
每個源荷隨機場景都可看成具有n個時間步長的功率時間序列x=(x1,x2,...,xn)。這個時間序列的真實分布p(x)可以表示為:
p(x)=p(x1,x2,...,xn)
(1)
給定一組由已知分布隨機生成的噪聲數(shù)據(jù)z~Pz。GAN的目標是通過對抗訓練,使采樣數(shù)據(jù)z盡可能逼近真實分布p(x)。GAN的訓練過程如下。
①固定生成器。將生成器生成的源荷時序數(shù)據(jù)(生成數(shù)據(jù))與歷史源荷時序數(shù)據(jù)(真實數(shù)據(jù))輸入判別器打分。判別器會輸出1個分數(shù)D(·),表示輸入數(shù)據(jù)服從真實分布p(x)的概率。把生成數(shù)據(jù)的分數(shù)和真實數(shù)據(jù)的分數(shù)形成的交叉熵作為損失函數(shù),反向傳播更新判別器。
②固定判別器。將生成器的生成數(shù)據(jù)交給判別器打分,把判別器打的分數(shù)與真實數(shù)據(jù)分數(shù)的交叉熵作為損失函數(shù),用于更新生成器。
③重復訓練多次,直至判別器區(qū)分不出生成數(shù)據(jù)和真實數(shù)據(jù)。理想情況下,使D[G(z)]=D(x)=0.5。此時得到的生成器可以用于生成源荷隨機場景。
明確了GAN的訓練過程后,需要構造生成器和判別器的損失函數(shù)LG和LD對網(wǎng)絡進行訓練。LG和LD的計算式為:
LG=-Ez-Pz{D[G(z)]}
(2)
式中:D(·)為判別器輸出的數(shù)據(jù);G(·)為生成器輸出的數(shù)據(jù);E(·)為對應分布的期望值;z~Pz為噪聲數(shù)據(jù)z的分布。
LD=-Ex-Px[D(x)]+Ez-Pz{D[G(z)]}
(3)
式中:x~Px為真實樣本x的分布。
為了使生成器和判別器之間能夠同時博弈訓練,需要結合式(2)和式(3)構造1個博弈價值函數(shù)V(G,D)。構造的博弈模型如式(4)所示。
(4)
GAN網(wǎng)絡的本質是生成器和判別器的博弈。其中,生成器的生成能力依賴判別器的判別能力。判別器的判別能力越強,生成器隨機生成的數(shù)據(jù)分布與真實數(shù)據(jù)的分布越接近。但考慮到模型崩潰和梯度消失的問題,判別器必須具有較強的泛化能力且層數(shù)不能很深,因此需要判別器能夠提取到更多的特征。
注意力機制(attention mechanism,AM)能夠高效分配可用資源,使之偏向于獲取輸入數(shù)據(jù)的重要特征。其廣泛應用于自然語言處理和計算機視覺中,主要通過關注重要特征和抑制不必要特征來增強向量特征代表性[10]。所以,本文在判別器中引入注意力模塊以提高判別器的分類性能。本文采用的注意力模塊結構如圖2所示。
注意力模塊的第一層為全局池化層。該層通過計算所有通道的平均值,將全局時序信息壓縮到單一信道內,生成該信道內的代表數(shù)據(jù)。注意力模塊的后兩層為全連接層:第一層用于減少特征映射通道;第二層則會將其再次放大至原始大小,重新校準信道中的目標數(shù)據(jù)。將全連接層輸出的矩陣通道信息與輸入數(shù)據(jù)相乘后得到輸出數(shù)據(jù)。其中,通道特征明顯的數(shù)據(jù)被加強,而通道特征較弱的數(shù)據(jù)則被抑制。
AM-GAN是在傳統(tǒng)GAN的基礎上進行改進而得到的,整體結構與傳統(tǒng)GAN相同。AM-GAN結構如圖3所示。AM-GAN將傳統(tǒng)GAN的全連接層替換為擴充能力更強的卷積神經(jīng)網(wǎng)絡,在判別器中引入AM以提高特征捕捉能力,提升了網(wǎng)絡的穩(wěn)定性、收斂速度以及生成樣本的質量。
因為原始GAN是使用Jensen-Shannon散度來描述生成樣本和歷史樣本之間的距離,所以當生成數(shù)據(jù)樣本和歷史數(shù)據(jù)樣本完全沒有交集時,目標函數(shù)將無法準確衡量樣本分布之間的距離。這將導致在訓練中容易出現(xiàn)訓練困難和梯度消失等問題,影響場景生成的準確性[11]。而 Wasserstein 距離可以在2個概率分布之間沒有重疊時仍能有效地描述分布之間的距離。所以,本文選擇Wasserstein 距離作為損失函數(shù)。Wasserstein 距離的定義為:
(5)
式中:π(x,x′)為滿足p(x)與p(x′)邊緣分布的聯(lián)合概率密度分布的集合;d(x,x′)為場景間距離。
由于Wasserstein 距離難以直接計算,因此通常使用其Kantorovich Rubinstein對偶形式來描述生成樣本與歷史樣本之間的距離。當其應用于AM-GAN,可表示為:
Ez-Pz{D[G(z)]}
(6)
在GAN 目標函數(shù)中引入梯度罰函數(shù),保證判別器函數(shù)D(x)近似滿足 1-Lipschitz 連續(xù),以精確描述Wasserstein 距離。此時,GAN 的目標函數(shù)轉化為:
(7)
基于AM-GAN的源荷場景生成步驟如下。
①數(shù)據(jù)劃分和預處理。首先,導入歷史源荷時序數(shù)據(jù),隨機選擇80%的功率曲線作為擬合網(wǎng)絡參數(shù)的訓練集,余下的樣本作為評估模型性能的測試集。然后,將原始的源荷時序數(shù)據(jù)轉成二維矩陣,以便于生成網(wǎng)絡讀取數(shù)據(jù)。最后,在輸入訓練集的樣本前,對源荷時序數(shù)據(jù)進行歸一化處理。
②AM-GAN訓練。首先,隨機生成1組滿足正態(tài)分布的噪聲向量作為生成器的輸入,經(jīng)過多個反卷積層后生成1個和實際樣本維度相同的源荷隨機場景。然后,計算生成場景和實際場景之間交叉熵損失函數(shù),并將其反饋給判別器和生成器,以更新場景生成網(wǎng)絡的權重。當模型目標函數(shù)達到最優(yōu)時,將訓練好的AM-GAN用于源荷隨機場景生成。
③場景生成和驗證。首先,人為設定所需要的場景數(shù)m,將m個隨機噪聲向量輸入訓練好的場景生成網(wǎng)絡后,生成器輸出m個新生成的源荷時序數(shù)據(jù)。然后,對輸出的源荷時序數(shù)據(jù)進行反歸一化,得到生成的源荷隨機場景。最后,利用測試集的樣本去評估所提方法是否可以捕獲實際樣本的形狀、波動特征及概率分布特性等。
本文使用中國某地2017年的風光荷時序數(shù)據(jù)構建場景集。該數(shù)據(jù)集包括該地實際負荷曲線以及6座相鄰的風電場和光伏電站的出力曲線。每個樣本的時間分辨率為1 h,即每條出力曲線具有24個采樣點。基于上述歷史數(shù)據(jù),搭建用于風光荷時序場景生成的AM-GAN。
為了直觀地了解 AM-GAN 的訓練情況,本文對損失函數(shù)值(Wasserstein 距離)隨著訓練次數(shù)而減小的變化過程進行了可視化。AM-GAN訓練過程如圖4所示。
AM-GAN訓練過程非常平穩(wěn),在經(jīng)過3 000次訓練后其損失函數(shù)值已經(jīng)趨于穩(wěn)定,并最終保持在0.01附近波動。這表明判別器已經(jīng)無法準確判別出場景的來源是真實場景還是生成場景,證明生成器具備生成源荷時序場景的能力,且不存在像 GAN那樣損失函數(shù)值難以收斂的問題。
為了能夠清晰地觀察AM-GAN生成的源荷時序曲線與實際功率曲線是否相似,以服從均勻分布的1 000組隨機噪聲作為AM-GAN生成器的輸入數(shù)據(jù)。生成器將分別輸出1 000組光伏、風機和負荷功率曲線。隨后,從測試集中抽取部分功率曲線,計算生成功率曲線與抽取功率曲線的歐式距離,從中篩選出和真實源荷時序場景最近的生成樣本進行對比分析。風機功率、光伏功率和負荷功率生成曲線和實際曲線對比分別如圖5~圖7所示。
由圖5~圖7可知,模型生成的源荷功率曲線和實際的源荷功率曲線輪廓基本一致,功率曲線的峰值、谷值和波動特征都得到了較好模擬。
由于測試集的實際功率曲線并沒有參與AM-GAN的訓練過程,而AM-GAN 生成的源荷時序曲線卻與測試集中的樣本趨勢一致,說明AM-GAN 具有很強的場景生成能力。
為進一步證明原始樣本與生成樣本之間的關系,本文對兩者使用皮爾遜分析法進行相關性檢驗。2個變量之間的皮爾遜相關性系數(shù)定義為2個變量之間的協(xié)方差和標準差的商[12]。皮爾遜相關性系數(shù)的絕對值越大,說明2個變量之間的相關性越強。皮爾遜相關性系數(shù)為:
(8)
式中:C(x,y)為2個變量之間的協(xié)方差;σX為變量x的標準差;σY為變量y的標準差。
利用皮爾遜分析法對本文方法獲得的源荷時序曲線與GAN獲得的源荷時序曲線進行對比分析。
皮爾遜相關性系數(shù)如表 1所示。
表1 皮爾遜相關性系數(shù)
由表1可知,AM-GAN生成的源荷時序場景與原始樣本之間的皮爾遜相關性系數(shù)在0.97左右,而GAN的相關性系數(shù)為0.94左右。數(shù)據(jù)結果表明,AM-GAN生成的源荷時序場景與實際場景更接近,生成場景整體上更符合真實場景的相關性規(guī)律。這證明了AM-GAN模型在源荷時序場景生成上的可行性與優(yōu)越性。
針對雙碳目標下存在的源荷不確定性問題,本文提出1種基于AM-GAN的源荷場景生成方法。在GAN結構的基礎上將其全連接層替換為擴充能力更強的卷積神經(jīng)網(wǎng)絡,并在判別器中引入AM以提高特征捕捉能力,提升了網(wǎng)絡的穩(wěn)定性、收斂速度以及生成樣本的質量。通過試驗驗證了該方法在源荷時序場景生成方面的能力,證明了該方法的可行性。但該方法只涉及源荷場景生成,未考慮到源荷隨機場景的應用。后續(xù)拓展工作可以嘗試將AM-GAN 生成的源荷功率曲線用于實際配電網(wǎng)的規(guī)劃和運行中。