• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于變壓器特性數(shù)據(jù)聚類的電力負荷分布式預測

      2020-08-24 08:07:32吳瓊段煉鄉(xiāng)立黃錦增魏艷霞孫毅
      廣東電力 2020年8期
      關鍵詞:特征向量聚類變壓器

      吳瓊,段煉,鄉(xiāng)立,黃錦增,魏艷霞,孫毅

      (1.廣東電網(wǎng)有限責任公司廣州供電局,廣東 廣州 510630;2.華北電力大學 電氣與電子工程學院,北京 102206)

      電力負荷預測是保證電力系統(tǒng)穩(wěn)定且經(jīng)濟運行的重要基礎,不同時間跨度的負荷預測有著不同的應用目的[1]。高精度的短期負荷預測在有效降低發(fā)電成本方面具有關鍵作用[2]。然而電力系統(tǒng)中負荷種類的增加及多電源并網(wǎng),產(chǎn)生了大量的結構化、半結構化、非結構化的大數(shù)據(jù),且變壓器負荷數(shù)據(jù)的非線性及復雜性逐漸增強[3]。隨著數(shù)據(jù)挖掘預測算法和統(tǒng)計學方法的進步,各種優(yōu)化算法被大量引入負荷預測中。為了提高電力系統(tǒng)短期負荷預測的準確性,文獻[4]提出了基于雙層隨機森林算法的電力系統(tǒng)短期負荷預測模型。Amjady和Keynia等將小波分析法[5]應用于預測中長期負荷,雖然可以適應負荷的二重特性,但其存在訓練時出現(xiàn)局部最小值、預測時的收斂速度較慢等問題[6]。而最小二乘支持向量機(least squares support vector machines,LSSVM)具有擬合度高、適用性強等特點,可以較好地解決小樣本、非線性、高維數(shù)、局部極小點等實際問題[7],但存在訓練時間長、輸入數(shù)據(jù)維度高等缺點。文獻[8]則將灰色關聯(lián)度與LSSVM組合用于負荷預測,可以減少數(shù)據(jù)輸入維度,但存在無法區(qū)別特征負荷的重要缺陷。文獻[9]采用K-means算法定義節(jié)假日變量,考慮日期與氣象的交叉效應,提出融合日期類型與氣象因素的多元線性回歸短期負荷預測模型。長短期記憶(long short term memory,LSTM)神經(jīng)網(wǎng)絡是一種循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)的改進模型,解決了RNN的梯度消失和爆炸問題,使網(wǎng)絡能夠有效地處理長期時間序列數(shù)據(jù),已應用于電力負荷預測[10-11],所得誤差明顯低于其他方法,極大地提升了電力負荷預測精度。然而,上述文獻均未能很好地解決預測計算時間較長和復雜度較高的問題。

      因此,為了降低計算的復雜度,減少計算時間,本文針對大量的變壓器特性數(shù)據(jù)及負荷數(shù)據(jù),提出一種基于變壓器特性聚類的電力負荷分布式預測算法,為供應商預先控制電源出力及制訂相應的負荷調(diào)控策略提供理論支撐,以減少對電網(wǎng)的沖擊,提高清潔能源消納[12-13]。

      1 基于核主成分分析的變壓器特性聚類

      1.1 基于核主成分分析的變壓器數(shù)據(jù)預處理

      1.1.1 核主成分分析原理

      核主成分分析(kernel principal component analysis,KPCA)首先采用非線性變換將輸入空間映射到高維特征空間,然后在高維空間采用主成分分析(principal component analysis,PCA)方法提取主成分,實現(xiàn)非線性降維。

      對于輸入N維空間的M個樣本xk(k=1,2,…,M),xk∈RN(RN為N維樣本空間),協(xié)方差矩陣

      (1)

      式中xj為第j個樣本矩陣。

      對于PCA來說,通過求解式(1)的協(xié)方差矩陣來求得特征值和相應的特征向量,獲得貢獻率大的特征值及與之對應的特征向量α。

      引入非線性映射函數(shù)Φ,將輸入空間原始樣本點xk(k=1,2,…,M)變換為特征空間中樣本點Φ(xk),并假設

      (2)

      則特征空間中的協(xié)方差矩陣

      (3)

      因此,KPCA就是求解λv=C1v中的特征值λ和特征向量v,兩邊同乘Φ,可以得到:

      λ(Φ(xk)v)=Φ(xk)C1v.

      (4)

      v可以線性表示為

      (5)

      則式(4)可以表示為

      (6)

      求解式(6),可得到要求的特征值和特征向量。對于測試樣本來說,其在特征空間向量上的投影為

      (7)

      定義M×M矩陣K中元素為元素為特征向量,則式(6)可表達為

      MλKα=K2α.

      (8)

      將式(7)進行內(nèi)積替換則有

      (9)

      具體步驟如下:

      a)得到原始輸入樣本,假設共M個樣本,每個樣本N維數(shù)據(jù),則可以得到M行N列矩陣;

      b)選擇適當?shù)暮撕瘮?shù),本文選擇徑向基核函數(shù);

      c)計算特征值λ和特征向量v;

      d)將特征值按照從大到小排列,并調(diào)整與之對應的特征向量;

      e)采用Gram-Schmidt正交化方法將特征向量單位化,得到新的特征向量α;

      f)計算特征值的貢獻率以及累計貢獻率,計算方法同PCA,根據(jù)事先設定的提取效率來提取主成分分量;

      g)計算提取出的特征向量上的投影,即為經(jīng)過KPCA降維后的數(shù)據(jù)。

      1.1.2 變壓器數(shù)據(jù)提取

      從與變壓器物理特性、地理特性及臺區(qū)負荷相關的角度考慮,選取變壓器特性數(shù)據(jù)見表1。

      表1 變壓器特性聚類數(shù)據(jù)選取Tab.1 Selection of transformer characteristic clustering data

      本文采用的是南方某省的真實變壓器數(shù)據(jù),不可避免地存在數(shù)據(jù)缺失、錯誤等情況,而因為數(shù)據(jù)的缺失和錯誤導致的問題將直接影響算法模塊最終結果的準確率以及算法模塊的訓練時間。因此,本節(jié)采用插值法以及歸一化這2個步驟對數(shù)據(jù)進行預處理。

      輸入數(shù)據(jù)的質(zhì)量及維度會影響K-means聚類算法的計算效果及神經(jīng)網(wǎng)絡的訓練效果,高維數(shù)據(jù)的聚類效果較差,冗余信息較多。為防止信息的冗余聚類,本文使用KPCA對變壓器特性數(shù)據(jù)進行過濾,保留主成分信息。

      變壓器數(shù)量較多且特性數(shù)據(jù)存在一定的冗余度,采用KPCA對數(shù)據(jù)提取主成分,然后聚類劃分變壓器。

      1.2 基于K-means算法的變壓器聚類

      1.2.1K-means算法

      K-means算法通常以距離為樣本間相似性評價指標來進行簇中心初始化、簇劃分、簇中心點更新與收斂判斷[14]。K-means算法實現(xiàn)較容易,收斂速度快,分類時僅需要調(diào)節(jié)簇數(shù)K,加入模型后計算速度快,在輸入數(shù)據(jù)較密集時可以較好地區(qū)別分類結果。算法步驟如下:

      第1步:初始化類中心。變壓器特性數(shù)據(jù)集D由n個特征向量組成,可以由D={D1,D2,…,Dn}表示,在D中隨機選取K個特征向量標記為初始聚類中心E={E1,E2,…,EK}。

      第2步:類劃分。在K-means聚類算法中距離的計算方法主要分為有序屬性距離度量、無序屬性距離度量、混合屬性距離度量。將變壓器特性數(shù)據(jù)集中的所有特征向量以歐式距離最近劃分至各個類中心,其中特征向量Di(i=1,2,…,n)到Es(s=1,2,…,K)的歐式距離

      (10)

      式中:a為變壓器特性數(shù)據(jù)的向量維度;T為某地變壓器總數(shù)。

      第3步:更新類中心。在各類中計算各變壓器特征向量到當前類其他數(shù)據(jù)向量的距離和,選取距離和最小的負荷數(shù)據(jù)向量作為新的類中心,如

      (11)

      式中:rDij為特征向量Di到Dj的距離;J為Di所在類的特征向量個數(shù);rnum為Di到當前類所有向量距離之和。

      重復上述步驟,一直到聚類的中心特征向量不發(fā)生改變,此時得到聚類的結果。計算各類特征向量與聚類中心向量的距離和,并將樣本中超過設定閾值的負荷數(shù)據(jù)篩除。

      第4步:評價指標及確定K值。K類中心的數(shù)值設定為前期人為輸入,一般按照實際需求決定或者直接給定,后期采用聚類的有效性指標確定最佳聚類個數(shù)[15]。本文中采用簇內(nèi)誤方差(sum of squared errors,SSE)及輪廓系數(shù)共同確定多變壓器特性的聚類個數(shù)。

      1.2.2 基于特性數(shù)據(jù)的變壓器聚類

      基于多變壓器特性數(shù)據(jù)的高維數(shù)據(jù)聚類結果,本文首先采用KPCA方法對原始特性數(shù)據(jù)進行主成分降維,降到二維的可視化數(shù)據(jù)(主成分A和主成分B),之后采用K-means算法對變壓器特性數(shù)據(jù)進行聚類分析,基于負荷特性數(shù)據(jù)將變壓器劃分為K類,如圖1所示。

      在變壓器特性聚類的基礎上,提取聚類后的變壓器信息,將各變壓器有關負荷的特性數(shù)據(jù)輸入灰色關聯(lián)度模型,求出每一類中各變壓器與中心變壓器的相關度,如圖2所示。

      2 基于變壓器聚類的負荷預測模型

      2.1 LSTM網(wǎng)絡模型

      LSTM網(wǎng)絡是一種改進的RNN,在RNN基礎上增加了遺忘門[15]。改良后的LSTM網(wǎng)絡解決了在模型訓練中的梯度消失問題。時間序列LSTM網(wǎng)絡基本單元如圖3所示,其中f、i、g、o分別為遺忘門、輸入門、輸入節(jié)點、輸出門,xt為時間步t的輸入(下標“t”代表時間步t,下同),St為時間步t的單元狀態(tài),ht為時間步t的中間輸出。

      圖1 多變壓器特性數(shù)據(jù)聚類過程Fig.1 Clustering process of characteristic data of multiple transformer

      圖2 變壓器關聯(lián)度分析過程Fig.2 Analysis process of the correlation degree of transformer

      圖3 LSTM網(wǎng)絡基本單元Fig.3 Basic unit of LSTM network

      LSTM網(wǎng)絡的基本單元中包含遺忘門、輸入門和輸出門。遺忘門中輸入xt與狀態(tài)記憶單元St-1、中間輸出ht-1共同決定狀態(tài)記憶單元遺忘部分。輸入門中的xt分別經(jīng)過sigmoid和tanh函數(shù)變化后共同決定狀態(tài)記憶單元中保留向量。中間輸出ht由更新后的St與輸出ot共同決定,計算公式如下[16]:

      ft=σ(Wfxxt+Wfhht-1+bf);

      (12)

      it=σ(Wixxt+Wihht-1+bi);

      (13)

      gt=φ(Wgxxt+Wghht-1+bg);

      (14)

      ot=σ(Woxxt+Wohht-1+bo);

      (15)

      St=gt?it+St-1?ft;

      (16)

      ht=φ(St)?ot.

      (17)

      式中:Wfx、Wfh、Wix、Wih、Wgx、Wgh、Wox和Woh分別為相應門與輸入xt和中間輸出ht-1相乘的權重矩陣;bf、bi、bg、bo分別為相應門的偏置矩陣;?表示向量中元素按位相乘;σ表示sigmoid函數(shù)運算;φ表示tanh函數(shù)運算。

      2.2 基于變壓器聚類的LSTM網(wǎng)絡預測模型

      基于變壓器特性聚類的LSTM網(wǎng)絡負荷預測對大量變壓器特性數(shù)據(jù)降維,采用K-means聚類將變壓器劃分為K類,并選取每一類中心的變壓器負荷數(shù)據(jù),基于LSTM網(wǎng)絡輸出特性樣本訓練基,其過程如圖4所示。

      步驟1:定義電壓等級、變壓器類型、額定容量、售電量、供電量、并聯(lián)低壓用戶數(shù)、月度最高負載率、經(jīng)緯度等為特性變量。采用KPCA方法提取特性數(shù)據(jù)主成分,降低數(shù)據(jù)的冗余度與復雜程度,最終得到主成分A與主成分B。

      步驟2:基于各類特性數(shù)據(jù)針對主成分A和主成分B進行K-means聚類,最終劃分為K類變壓器。

      步驟3:對每一類中的變壓器特性數(shù)據(jù)(如電壓等級、變壓器類型、額定容量等),采用灰色關聯(lián)度算法進行相關性分析,得到相關性最低與最高的變壓器,并提取其月負荷數(shù)據(jù)以及每一類聚類中心的一個變壓器的月負荷數(shù)據(jù)。

      步驟4:將聚類中心變壓器負荷數(shù)據(jù)輸入LSTM網(wǎng)絡,得到各類特性樣本訓練基。將各類變壓器負荷數(shù)據(jù)分別輸入對應的特性樣本訓練基中,得到各變壓器的短期負荷預測曲線

      3 算例分析

      本文算例在Inter(R)Core(TM)i7-8750H CPU@2.20 GHz,RAM 16 GB,操作系統(tǒng)Windows10的Spyder上實現(xiàn)。

      本文的實驗數(shù)據(jù)使用南方某省2019年11月100臺10 kV變壓器的特性數(shù)據(jù)及96點負荷數(shù)據(jù)作為數(shù)據(jù)集。變壓器特性數(shù)據(jù)基本信息見表2。

      圖4 K-means-LSTM負荷預測模型Fig.4 K-means-LSTM load prediction model

      表2 變壓器特性聚類數(shù)據(jù)選取Tab.2 Selection of clustering data for transformer characteristics

      3.1 評價指標

      為了衡量本文所提方法的預測結果與負荷實際值的確定性誤差,參照文獻[17]選擇概率密度曲線的峰值,計算眾數(shù)和中位數(shù)與實際值的均方根誤差ERMS、平均絕對百分比誤差EMAP。

      a)均方根誤差ERMS。均方根誤差亦稱標準誤差,其公式為

      (20)

      歸一化后ERMS范圍為[0,1),當預測值與真實值完全吻合時ERMS=0,即完美模型;誤差越大,該值越大。

      b)平均絕對百分比誤差EMAP。平均絕對百分比誤差其公式為

      (21)

      歸一化后EMAP范圍為[0,1),EMAP=0表示完美模型,EMAP>1則表示劣質(zhì)模型。

      表3為本文K-means-LSTM模型與基于自適應矩估計的LSTM(adaptive moment estimation-LSTM,ADAM-LSTM)模型[18]的負荷預測精度與計算時間對比,其中ERMS、EMAP為歸一化后的值。

      表3 變壓器負荷預測精度與計算時間對比Tab.3 Comparison between load prediction accuracy and calculation time

      由表3可以看出,K-means-LSTM模型與ADAM-LSTM模型的預測精度相差不大,其中在相關度較大的變壓器負荷預測時ERMS差值為0.002、EMAP差值為0.003,在相關度較小的變壓器預測時ERMS差值為0.01、EMAP差值為0.009。

      為進一步驗證所提模型的預測性能,在訓練特性基及預測變壓器負荷時,加入計時函數(shù)提取模型運行時間,并提取LSTM網(wǎng)絡的特性參數(shù),驗證模型的計算時間及算法復雜度的優(yōu)化程度。由表3可以看出,相較于ADAM-LSTM模型,K-means-LSTM模型在預測精度僅犧牲0.2%~1.5%的情況下,計算時間減少75%,顯著提升了算法性能。

      3.2 變壓器聚類結果分析

      通過聚類評價指標SSE與輪廓系數(shù)得到K=3時聚類效果最好。聚類結果如圖5所示,聚類分析的各項指標見表4,特性樣本訓練基如圖6所示。

      由圖5可以看出,9個變壓器特性數(shù)據(jù)經(jīng)KPCA降維后,采用K-means聚類方法可以將不同類型的變壓器較為清晰地劃分為3類,第1類的變壓器數(shù)量較少,第2類變壓器的數(shù)量最多。

      圖5 K-means聚類結果Fig.5 K-means clustering results

      表4是對圖5中部分具有代表性且可以驗證后續(xù)實驗中樣本訓練基預測準確性的變壓器聚類數(shù)據(jù)的展現(xiàn),如第1類變壓器中選取編號為64號的中心變壓器與相關度分別為85%、13%的73號、39號變壓器。

      從圖6可以看出,第1類及第3類變壓器負荷較高,第2類變壓器負荷相對較低。K-means聚類方法可以根據(jù)不同變壓器的特性數(shù)據(jù),如低壓用戶數(shù)、經(jīng)緯度、變壓器類型等,將不同變壓器負荷的趨勢、周期與其他日期負荷區(qū)分開來。該省負荷構成中工業(yè)負荷占了很大比例,而工業(yè)生產(chǎn)的連續(xù)性決定了工業(yè)負荷受節(jié)假日的影響較小,變壓器負荷的周期性較高。在日負荷特性中,晚高峰負荷水平顯著高于早高峰,本文算例分析中采用約90%的負荷數(shù)據(jù)作為訓練參量,即用2019年11月前27天的負荷數(shù)據(jù)預測后3天的負荷數(shù)據(jù)。由圖6的結果可以看出:11月28、29日為星期四、星期五(工作日),3類訓練基的負荷曲線變化趨勢基本相似;11月30日為星期六(休息日),其負荷曲線與前2日相比變化較緩,負荷分布相對平均,峰值負荷相對較低。

      表4 聚類分析的各項指標Tab.4 Indicators of cluster analysis

      圖6 特性樣本訓練基Fig.6 Characteristic sample training base

      3.3 基于相關性變壓器的負荷預測仿真

      基于各變壓器特性數(shù)據(jù),利用灰色關聯(lián)度算法區(qū)分變壓器的相關性,并選取相關程度最低與最高的變壓器11月負荷數(shù)據(jù),輸入變壓器特性訓練基中預測后3天的負荷數(shù)據(jù)。預測結果如圖7、圖8所示。

      圖7 低相關性變壓器負荷預測Fig.7 Load prediction of low-correlation transformer

      由圖7、圖8可以看出本文方法的預測曲線與實際曲線依然有較高的吻合度,表明K-means-LSTM模型的預測效果相對較好,這是因為通過特征提取使得樣本的可學習性能增強,從而降低了數(shù)據(jù)維度的復雜性和抽樣時的誤差。此外,K-means-LSTM模型的學習能力更強,泛化性更高,對提升算法的工程實踐意義具有積極作用。

      圖8 高相關性變壓器負荷預測Fig.8 Load prediction of high-correlation transformer

      4 結論

      a)在數(shù)據(jù)處理階段,KPCA可以有效避免不同的特性數(shù)據(jù)之間的信息冗余并通過降維來降低復雜度,提升聚類的效率。

      b)相比于ADAM-LSTM模型,本文所提的K-means-LSTM模型可以在保證預測精度損失較小的前提下,減少LSTM模型的訓練次數(shù),縮短預測時間,降低計算復雜度,提升模型的整體性能。

      c)在實際的工程應用方面,本文所提出的K-means-LSTM模型對設備條件的要求較低,計算時間短,實時響應性能較好,可以為后續(xù)的分布式電源調(diào)度及用戶激勵機制的制訂提供實時性的數(shù)據(jù)基礎。

      d)本文算例對用電峰值時刻的負荷預測效果較差,而最高負載率是評價變壓器的重要指標,對配用電的影響較大。在后續(xù)的研究中,將對變壓器負荷峰值時刻及負荷值的預測展開進一步的研究。

      猜你喜歡
      特征向量聚類變壓器
      二年制職教本科線性代數(shù)課程的幾何化教學設計——以特征值和特征向量為例
      克羅內(nèi)克積的特征向量
      理想變壓器的“三個不變”與“三個變”
      開關電源中高頻變壓器的設計
      一類特殊矩陣特征向量的求法
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
      中華建設(2017年1期)2017-06-07 02:56:14
      一種不停電更換變壓器的帶電作業(yè)法
      變壓器免維護吸濕器的開發(fā)與應用
      基于改進的遺傳算法的模糊聚類算法
      太康县| 宣威市| 济南市| 炉霍县| 馆陶县| 阳曲县| 溧阳市| 汝南县| 都安| 深泽县| 临汾市| 平阳县| 盐源县| 祁连县| 平罗县| 东乡族自治县| 淄博市| 上杭县| 建平县| 峨山| 尼木县| 偃师市| 工布江达县| 曲阳县| 贡山| 永登县| 宜章县| 富顺县| 宿州市| 定州市| 庄浪县| 新津县| 通化市| 易门县| 高密市| 天津市| 雷山县| 九江县| 贺兰县| 阜平县| 长海县|