• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于主成分分析和LightGBM的風(fēng)電場發(fā)電功率超短期預(yù)測

    2020-01-03 01:21:06曹渝昆
    上海電力大學(xué)學(xué)報 2019年6期
    關(guān)鍵詞:降維風(fēng)電場發(fā)電

    曹渝昆, 朱 萌

    (上海電力學(xué)院 計算機科學(xué)與技術(shù)學(xué)院, 上海 200090)

    可再生能源風(fēng)能發(fā)電并網(wǎng)的發(fā)展,給電力系統(tǒng)的安全穩(wěn)定運行帶來了嚴峻的挑戰(zhàn)。風(fēng)力發(fā)電場發(fā)電功率的預(yù)測越精確,越有利于電力系統(tǒng)的穩(wěn)定運行及優(yōu)化調(diào)度。風(fēng)電功率預(yù)測分為短期預(yù)測和超短期預(yù)測,其中超短期預(yù)測是對風(fēng)電場未來數(shù)小時內(nèi)的出力進行預(yù)測,時間分辨率不小于15 min,并且每15 min自動執(zhí)行一次,主要用于單日內(nèi)的計劃滾動。超短期預(yù)測能夠動態(tài)調(diào)節(jié)短期的預(yù)測誤差而引起的功率波動,有助于緩解系統(tǒng)調(diào)峰、調(diào)頻壓力,對電網(wǎng)安全運行有著重要的影響[1]。

    隨著風(fēng)電場監(jiān)測數(shù)據(jù)精度的增加,風(fēng)電場發(fā)電功率的超短期預(yù)測愈加火熱?,F(xiàn)有關(guān)于風(fēng)電場發(fā)電功率超短期預(yù)測的方法大致可分為物理方法和統(tǒng)計方法兩類。物理方法主要是依據(jù)風(fēng)電場周邊的地貌信息,建立合理的熱力學(xué)及流體力學(xué)模型,通過求解非線性方程組得到風(fēng)速風(fēng)向等信息,再根據(jù)風(fēng)機功率曲線得到輸出功率來實現(xiàn)預(yù)測。這類方法本質(zhì)上是描述大氣運動,不依托歷史數(shù)據(jù),適合在建的風(fēng)電場功率預(yù)測。由于物理方法不太容易對特殊的地理環(huán)境以及自然現(xiàn)象精確描述,且對模型和參數(shù)選擇的依賴性強,所以沒有廣泛用于風(fēng)電場的超短期功率預(yù)測[2]。統(tǒng)計方法主要是依據(jù)風(fēng)電場歷史數(shù)據(jù)的統(tǒng)計規(guī)律,建立歷史樣本之間的非映射關(guān)系,其中最常見的方法就是人工神經(jīng)網(wǎng)絡(luò)、支持向量機等人工智能預(yù)測方法[3],比較適合風(fēng)電功率的超短期預(yù)測。因此,為提高風(fēng)電場發(fā)電功率超短期預(yù)測的準(zhǔn)確率,本文提出一種基于主成分分析(Principal Component Analysis,PCA)和輕量梯度提升樹(Light Gradient Boosting Maching,LightGBM)的風(fēng)電場發(fā)電功率超短期預(yù)測方法。

    1 基于LightGBM的風(fēng)電場發(fā)電功率超短期預(yù)測模型

    圖1是基于LightGBM的風(fēng)電場發(fā)電功率超短期預(yù)測建模流程圖。由圖1可以看出,要想實現(xiàn)風(fēng)電場發(fā)電功率的超短期預(yù)測,首先要做風(fēng)機數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(Supervisory Control And Data Acquisition,SCADA)數(shù)據(jù)的特征工程,將對風(fēng)機中的SCADA檢測系統(tǒng)數(shù)據(jù)提取后進行數(shù)據(jù)清洗,將故障時間內(nèi)的數(shù)據(jù)剔除,清洗后將數(shù)據(jù)標(biāo)準(zhǔn)化到固定區(qū)間以保證結(jié)果的可靠性。由于工業(yè)數(shù)據(jù)維度較高,故采用PCA實現(xiàn)降維,將數(shù)據(jù)集精簡到最適合模型訓(xùn)練的狀態(tài)。隨后將降維度后的數(shù)據(jù)進行分組,分為訓(xùn)練樣本和測試樣本。訓(xùn)練樣本代入LightGBM模型中訓(xùn)練,并采用網(wǎng)格搜索的方法進行調(diào)參,直到整個模型訓(xùn)練到最佳,最終將測試樣本代入到訓(xùn)練好的超短期預(yù)測模型中實現(xiàn)功率預(yù)測。

    圖1 基于LightGBM的風(fēng)電場發(fā)電功率超短期預(yù)測建模流程

    2 PCA簡介

    風(fēng)電機組SCADA系統(tǒng)的監(jiān)控數(shù)據(jù)是每隔7.5 s記錄一次的風(fēng)機重要部件傳感器的監(jiān)測參數(shù),包括發(fā)電機轉(zhuǎn)速、網(wǎng)側(cè)有功功率、機艙溫度等28個維度。由于工業(yè)數(shù)據(jù)維度較高,且影響功率的因素主要集中在溫度、風(fēng)向、風(fēng)力等上,所以常采用PCA實現(xiàn)降維,一方面在一定程度上去噪,另一方面將數(shù)據(jù)精簡到最適合模型學(xué)習(xí)的狀態(tài)[4]。

    PCA是比較常用的一種降維方法。作為一種統(tǒng)計方法,該方法通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量稱為主成分。PCA的原理是線性映射,即將高維空間數(shù)據(jù)投影到低維空間上;在數(shù)據(jù)分析上,將數(shù)據(jù)的主成分(包含信息量大的維度)保留下來,將數(shù)據(jù)描述不重要的成分予以忽略。即將主成分維度組成的向量空間作為低維空間,將高維數(shù)據(jù)投影到該空間而實現(xiàn)降維。算法的主要思想是選取數(shù)據(jù)差異最大的方向作為第一個主成分,第二個主成分選擇方差次大的方向,并且與第一個主成分正交,不斷重復(fù)這個過程直到找到n個主成分。在風(fēng)機SCADA監(jiān)測數(shù)據(jù)26個維度的基礎(chǔ)上,經(jīng)過清洗,將工況參數(shù)等維度剔除后再進行主成分分析,將數(shù)據(jù)降維至K維。

    3 基于LightGBM的風(fēng)電場發(fā)電功率超短期預(yù)測

    GBM的全稱是Gradient Boosting Machine,一般叫做梯度提升樹,屬于Boosting算法的一種[5]。Boosting算法是一類將弱學(xué)習(xí)器提升為強學(xué)習(xí)器的集成學(xué)習(xí)算法,主要是通過改變訓(xùn)練樣本的權(quán)值,學(xué)習(xí)多個分類器,并將這些分類器進行線性組合,提高泛化性能。如果一個分類存在一個多項式能夠?qū)W習(xí)且有較高的準(zhǔn)確率,那么這個算法就叫做強學(xué)習(xí)器;反之,若準(zhǔn)確率只稍稍大于50%,那么這個算法就叫做弱學(xué)習(xí)器。Boosting就是從更容易得到的弱學(xué)習(xí)器出發(fā),經(jīng)反復(fù)訓(xùn)練得到一系列弱學(xué)習(xí)器,再組合這些弱學(xué)習(xí)器,從而構(gòu)成一個強學(xué)習(xí)器。大多數(shù)Boosting算法會改變數(shù)據(jù)的概率分布(數(shù)據(jù)權(quán)值),即通過提高前一輪訓(xùn)練中被錯分類的數(shù)據(jù)的權(quán)值,降低正確分類數(shù)據(jù)的權(quán)值,使得被錯誤分類的數(shù)據(jù)在下一輪的訓(xùn)練中更受關(guān)注,再將這些學(xué)習(xí)器線性組合。具體方法是增大誤差率小的學(xué)習(xí)器的權(quán)值,減小誤差率大的學(xué)習(xí)器的權(quán)值。Boosting算法可以看作一個加法模型,其公式為

    (1)

    式中:αm——基學(xué)習(xí)器權(quán)系數(shù);

    M——學(xué)習(xí)器的個數(shù);

    m——第m個學(xué)習(xí)器;

    θm——學(xué)習(xí)器分類的參數(shù),即分類樹或者回歸樹模型參數(shù);

    T(x,θm)——學(xué)習(xí)得到的第m個基學(xué)習(xí)器。

    在給定訓(xùn)練數(shù)據(jù)和損失函數(shù)形式后,Boosting學(xué)習(xí)模型可以定義為一個損失函數(shù)極小化的問題,優(yōu)化的目標(biāo)函數(shù)為

    (2)

    式中:N——樣本個數(shù);

    L——損失函數(shù);

    yi——實際函數(shù)值。

    GBM為基于梯度下降算法得到的提升樹模型,具體步驟如下:

    (1) 輸入訓(xùn)練數(shù)據(jù)(xi,yi);

    (2) 構(gòu)建提升樹模型fm(x);

    從m=1到M的迭代中:

    (1) 計算損失函數(shù)的負梯度在當(dāng)前模型的值,將它作為殘差的估計,即

    i=1,2,3,…,N

    (3)

    (2) 估計回歸樹葉節(jié)點區(qū)域,以擬合殘差的近似值;

    (3) 利用線性搜索估計葉節(jié)點區(qū)域的值,使損失函數(shù)極小化[6],即

    (4)

    (4) 更新回歸樹[6],即

    (5)

    由此得到最終的模型f(x)。

    基于梯度下降算法去更新殘差方式,隨著迭代次數(shù)的增加,使之可以擬合比較復(fù)雜的非線性關(guān)系。在這種情況下,通過訓(xùn)練好的GBM模型去實現(xiàn)超短期功率預(yù)測的準(zhǔn)確率也愈來愈高。通過GBM算法的演變,XGBoost算法應(yīng)運而生。不同于GBM的是,XGBoost算法對于模型的目標(biāo)函數(shù)的處理方式為:XGBoost將目標(biāo)函數(shù)作二階泰勒展開,從中得出下一次迭代需要預(yù)測的目標(biāo)葉節(jié)點權(quán)重,并根據(jù)損失函數(shù)計算分裂后的節(jié)點損失,最后依據(jù)節(jié)點損失篩選適當(dāng)?shù)奶卣鬟M行下一步迭代。作為針對XGBoost的一些缺點而改進和演變的LightGBM是速度快、性能高的梯度提升算法。其具體的優(yōu)化如下:在數(shù)據(jù)結(jié)構(gòu)方面,LightGBM采取了histogram算法,這類算法相較于XGBoost的Pre-sorted算法更有優(yōu)勢;由于histogram算法對稀疏數(shù)據(jù)的處理時間及復(fù)雜度沒有pre-sorted好,因此LightGBM采用特征捆綁(Exclusive Feature Bunding,EFB)的方式來處理稀疏數(shù)據(jù)。LightGBM則利用了基于梯度的單邊采樣(Gradient-based One-Side Sampling,GOSS)作為采樣算法。

    EFB和GOSS這兩個創(chuàng)新點正是LightGBM的可貴之處。EFB降低了數(shù)據(jù)特征規(guī)模,提高了模型的訓(xùn)練速度。GOSS巧妙地在保證信息增益的同時減小訓(xùn)練量,提高了模型的泛化能力。從實驗的效果來看,LightGBM在速度和精度上都要優(yōu)于XGBoost。

    4 實驗驗證部分

    4.1 實驗數(shù)據(jù)集描述

    本文采用的數(shù)據(jù)集來自國內(nèi)某風(fēng)電機組15#單機正常運行狀態(tài)下SCADA的部分數(shù)據(jù)。15#單機數(shù)據(jù)采集的時間為2015年11月1日 20:20至2016年1月1日21:38,采樣頻率為7.5 s/次,共計373 196×29組數(shù)據(jù)。在對比實驗中引入21#單機正常運行狀態(tài)下的數(shù)據(jù),采集時間相同,采樣頻率為7.5 s/次,共計179 646×29組數(shù)據(jù)。其中有28個連續(xù)數(shù)值型變量,涵蓋風(fēng)點機組的工況參數(shù)、環(huán)境參數(shù)和狀態(tài)參數(shù)等多個維度。由于實驗驗證與功率預(yù)測相關(guān),其中的工況參數(shù)以及部分狀態(tài)參數(shù)對功率的預(yù)測影響不大,所以人工剔除其中的維度,保留表1中的維度。

    表1 風(fēng)電機組SCADA數(shù)據(jù)集維度說明

    4.2 主成分分析

    處理后數(shù)據(jù)集的維度定格在12維。由于15#單機的數(shù)量達到30多萬條,所以整個數(shù)據(jù)集的量算較多,故采取PCA降維方式將原始數(shù)據(jù)維度降到K維,在保證模型訓(xùn)練效果不變的情況下提升預(yù)測速度,達到超短期功率預(yù)測的目的?!皌ime”時間戳維度屬于非連續(xù)的數(shù)值型變量,在輸入模型訓(xùn)練的過程中會大大增加模型的復(fù)雜度,所以在訓(xùn)練模型中依照索引的方式描述時間序列。從序列1到序列2剛好一個采樣頻率7.5 s。K值的選取問題屬于一個數(shù)據(jù)壓縮的問題,即在保留95%~99%信息的基礎(chǔ)上的K值,在調(diào)用sklearn封裝的PCA方法時,其中的n_components參數(shù),如果設(shè)置為整數(shù),則n_components=k。如果將其設(shè)置為小數(shù),則說明降維后的數(shù)據(jù)可以保留信息。在具體的實驗中,將n_components參數(shù)設(shè)置為float數(shù)據(jù),從而間接解決K值選取的問題。

    4.3 數(shù)據(jù)集的劃分及LigntGBM模型的訓(xùn)練

    在經(jīng)過數(shù)據(jù)人工降維及PCA降維后,數(shù)據(jù)集已經(jīng)具有一定的完整性。隨后將處理后的15#機組數(shù)據(jù)集按照90%訓(xùn)練集以及10%測試集劃分。在LightGBM模型訓(xùn)練的輸入和輸出上,將處理后的90%訓(xùn)練集作為模型的輸入來訓(xùn)練模型,模型訓(xùn)練的輸出目標(biāo)是標(biāo)簽“power”字段,即網(wǎng)側(cè)有功功率。LightGBM模型訓(xùn)練完成后,以同樣方式處理10%測試集,并代入訓(xùn)練好的模型,得到預(yù)測的“predict”結(jié)果,再根據(jù)原始的正確“power”數(shù)值與預(yù)測的“predict”結(jié)果的誤差去評估模型的效果。其具體的流程如圖2所示。

    圖2 LightGBM模型訓(xùn)練的流程

    4.4 模型的誤差分析

    在將處理后的15#機組數(shù)據(jù)的90%訓(xùn)練集訓(xùn)練LightGBM模型完成后,需要去檢驗?zāi)P陀?xùn)練的效果。將處理后的10%測試集同樣作為可以輸出理論的功率預(yù)測結(jié)果,再將其與實際的功率真實值比較,得出模型訓(xùn)練的優(yōu)劣?;貧w模型采用均方誤差(Mean Squared Error,MSE)、均方根誤差(Root Mean Squared Error,RMSE)及平均絕對誤差(Meqan Absolute Error,MAE)進行評價。MSE,RMSE,MAE的計算公式為

    (6)

    (7)

    (8)

    式中:ot——真實值;

    pt——估計值;

    fi——預(yù)測值;

    yt——真實值。

    4.5 實驗結(jié)果驗證

    將15#機組原始數(shù)據(jù)經(jīng)過人工降維并經(jīng)PCA降維后,將90%訓(xùn)練集和10%測試集代入LightGBM模型訓(xùn)練,根據(jù)回歸模型誤差分析的評價標(biāo)準(zhǔn),得到的預(yù)測結(jié)果如表2所示。

    表2 基于PCA和LightGBM的風(fēng)電超短期功率預(yù)測

    由表2可知,基于PCA和LightGBM的風(fēng)電超短期功率預(yù)測訓(xùn)練效果優(yōu)異。

    分別采用傳統(tǒng)的Logistic回歸、隨機森林算法和XGBoost算法作對比實驗,得到4種算法的實驗效果如表3所示。

    表3 15#機組4種算法不同數(shù)據(jù)集規(guī)模實驗效果對比

    由表3可以看出,LightGBM模型提升的訓(xùn)練效果顯著,在速度和誤差上都有本質(zhì)的提升,XGBoost模型的訓(xùn)練效果也比較理想,但LightGBM在速度和誤差上均有提升。LightGBM在數(shù)據(jù)集成倍增長的情況下,實驗耗時增長不多,但精度確有提高??梢?LightGBM模型在數(shù)據(jù)集量大的情況下,精度和速度的優(yōu)勢能展現(xiàn)出來。

    5 結(jié) 語

    本文針對風(fēng)電場規(guī)模不斷擴大,風(fēng)機SCADA實時監(jiān)測系統(tǒng)短周期采樣數(shù)據(jù)的充分利用的問題,提出了基于PCA降維以及LightGBM的風(fēng)電功率超短期預(yù)測方法。通過4種不同算法及不同數(shù)據(jù)集規(guī)模的實驗效果對比可以看出,在數(shù)據(jù)集數(shù)量和維度都比較大的情況下,采用LightGBM模型可以在保證精度的情況下,實現(xiàn)風(fēng)電功率的超短期預(yù)測。這對風(fēng)電場的穩(wěn)定運行及調(diào)度優(yōu)化具有一定的現(xiàn)實意義。

    猜你喜歡
    降維風(fēng)電場發(fā)電
    Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
    “發(fā)電”
    檸檬亦能發(fā)電?
    降維打擊
    海峽姐妹(2019年12期)2020-01-14 03:24:40
    基于PSS/E的風(fēng)電場建模與動態(tài)分析
    電子制作(2018年17期)2018-09-28 01:56:44
    搖晃發(fā)電小圓球
    摩擦發(fā)電
    學(xué)與玩(2017年4期)2017-02-16 07:05:40
    含風(fēng)電場電力系統(tǒng)的潮流計算
    探求風(fēng)電場的遠景
    風(fēng)能(2015年9期)2015-02-27 10:15:25
    代力吉風(fēng)電場的我們
    風(fēng)能(2015年7期)2015-02-27 10:15:02
    三明市| 宜城市| 姜堰市| 双城市| 获嘉县| 明水县| 东乌珠穆沁旗| 甘德县| 简阳市| 镇江市| 闽清县| 巴中市| 阿勒泰市| 兴国县| 保德县| 珲春市| 垣曲县| 中山市| 广宁县| 丹寨县| 石河子市| 得荣县| 喜德县| 景洪市| 上杭县| 西平县| 浮梁县| 衡山县| 龙口市| 内江市| 德清县| 来安县| 平泉县| 昌黎县| 绥棱县| 馆陶县| 库尔勒市| 新蔡县| 长垣县| 尉犁县| 慈溪市|