• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于核密度估計(jì)和CatBoost算法的光伏功率預(yù)測(cè)方法

      2024-01-08 08:02:32范國(guó)慶李康輝王瀟晨
      關(guān)鍵詞:發(fā)電功率預(yù)測(cè)

      范國(guó)慶, 李康輝, 高 捷, 彭 峰, 王瀟晨, 唐 亮, 史 潔

      (1.濟(jì)南大學(xué), 山東 濟(jì)南 250022; 2.山東省計(jì)量科學(xué)研究院, 山東 濟(jì)南 250014; 3.山東電力咨詢?cè)河邢薰? 山東 濟(jì)南 250000)

      太陽(yáng)能是一種取之不盡的清潔能源,光伏發(fā)電是太陽(yáng)能利用的有效形式之一。但是,太陽(yáng)能光伏發(fā)電具有波動(dòng)性、隨機(jī)性等缺點(diǎn),給并網(wǎng)光伏發(fā)電、建筑一體化光伏發(fā)電和分布式光伏發(fā)電等領(lǐng)域帶來(lái)了設(shè)計(jì)及運(yùn)行挑戰(zhàn),嚴(yán)重影響了太陽(yáng)能的利用效率,限制了光伏發(fā)電的前景和發(fā)展規(guī)模?,F(xiàn)有的解決方法包括光伏-儲(chǔ)能組合優(yōu)化運(yùn)行技術(shù)、風(fēng)光水儲(chǔ)多能互補(bǔ)技術(shù),以及光伏功率預(yù)測(cè)等。其中,有效的光伏功率預(yù)測(cè)在新能源系統(tǒng)的可靠性等方面起著重要作用。

      集中式光伏功率預(yù)測(cè)有多種分類方式。按照預(yù)測(cè)過(guò)程,光伏功率預(yù)測(cè)可分為直接預(yù)測(cè)和間接預(yù)測(cè);根據(jù)預(yù)測(cè)的空間尺度,可分為單場(chǎng)預(yù)測(cè)和區(qū)域預(yù)測(cè);根據(jù)預(yù)測(cè)的時(shí)間尺度,可分為超短期預(yù)測(cè)、短期預(yù)測(cè)、中期預(yù)測(cè)和長(zhǎng)期預(yù)測(cè);根據(jù)預(yù)測(cè)的形式,可分為確定性預(yù)測(cè)和概率性預(yù)測(cè)[1]。光伏功率的確定性預(yù)測(cè)主要是基于時(shí)間序列和氣象因素,通過(guò)建立數(shù)學(xué)模型來(lái)預(yù)測(cè)光伏發(fā)電的產(chǎn)量。為了分析時(shí)間序列對(duì)預(yù)測(cè)的影響,文獻(xiàn)[2]提出了一種基于卷神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和長(zhǎng)短期記憶(Long Short Term Memory,LSTM)網(wǎng)絡(luò)的混合模型。該方法指出,合理的時(shí)間序列數(shù)據(jù)長(zhǎng)度可以提高光伏預(yù)測(cè)精度、降低計(jì)算成本。文獻(xiàn)[3]提出了2種新的太陽(yáng)能光伏隨機(jī)預(yù)測(cè)模型,與標(biāo)準(zhǔn)時(shí)間序列預(yù)測(cè)機(jī)制相比,總發(fā)電量有了顯著提高。針對(duì)不同氣象條件和季節(jié)下的短期光伏輸出功率預(yù)測(cè),文獻(xiàn)[4]提出了一種新的CNN模型,模型設(shè)計(jì)為一個(gè)并行池結(jié)構(gòu),提高了預(yù)測(cè)性能。文獻(xiàn)[5]將增強(qiáng)碰撞剛體優(yōu)化(Enhanced Colliding Bodies Optimization,ECBO)算法、變分模式分解(Variational Mode Decomposition,VMD)和深度極限學(xué)習(xí)機(jī)(Deep Extreme Learning Machine,DELM)相結(jié)合,提出了一種基于相似日的光伏功率短期多步預(yù)測(cè)模型。文獻(xiàn)[6]提出了一種多通道卷積神經(jīng)網(wǎng)絡(luò),利用代表各種區(qū)域效應(yīng)的光柵圖像數(shù)據(jù)預(yù)測(cè)每月光伏發(fā)電量。文獻(xiàn)[7]提出了一種三階段機(jī)器學(xué)習(xí)架構(gòu),結(jié)合使用輕量級(jí)梯度提升機(jī)(Light Gradient Boosting Machine,LightGBM)和隨機(jī)森林(Cuda Random Forest,CURF),提高了模型性能。

      與確定性預(yù)測(cè)相比,光伏發(fā)電的概率性預(yù)測(cè)考慮了更多因素。概率性預(yù)測(cè)方法可以提供更多關(guān)于潛在不確定性的信息,從而得到更全面的預(yù)測(cè)結(jié)果。在傳統(tǒng)確定性預(yù)測(cè)方法的基礎(chǔ)上,文獻(xiàn)[8]提出了一種光伏發(fā)電量的集成非參數(shù)概率預(yù)測(cè)模型,將分位數(shù)回歸平均(Quantile Regression Averaging,QRA)和LSTM結(jié)合,獲得光伏輸出的概率預(yù)測(cè)。通過(guò)人工智能概率模型可以提高預(yù)測(cè)的可靠性。文獻(xiàn)[9]提出了一種混合概率太陽(yáng)輻照度預(yù)測(cè)方法,結(jié)合了深度循環(huán)神經(jīng)網(wǎng)絡(luò)(Deep Recurrent Neural Network,DRNN)和殘差建模。另外,還有將物理光伏模型鏈擴(kuò)展為概率預(yù)測(cè)的方法,使用模型鏈的校準(zhǔn)集合來(lái)生成概率光伏發(fā)電預(yù)測(cè)模型。文獻(xiàn)[10]將模糊信息?;?Fuzzy Information Granulation,FIG)、差分自回歸移動(dòng)平均(Autoregressive Integrated Moving Average,ARIMA)和改進(jìn)的長(zhǎng)短期記憶(Improved Long Short Term Memory,ILSTM)網(wǎng)絡(luò)3個(gè)模型相結(jié)合,構(gòu)建了一個(gè)混合區(qū)間預(yù)測(cè)模型,能夠準(zhǔn)確地覆蓋實(shí)際光伏功率值。文獻(xiàn)[11]提出了一種基于高階馬爾可夫鏈(Higher order Markov Chain,HMC)的光伏發(fā)電功率概率分布函數(shù)預(yù)測(cè)方法,利用高斯混合法(Gaussian Mixture Method,GMM),結(jié)合多個(gè)分布函數(shù),并使用基于HMC的模型系數(shù)對(duì)光伏功率進(jìn)行超短期預(yù)測(cè)。

      基于上述分析發(fā)現(xiàn):利用時(shí)間序列對(duì)太陽(yáng)能光伏功率進(jìn)行短期預(yù)測(cè)是有效的方法之一,但當(dāng)時(shí)間尺度和輸出維度過(guò)多時(shí),預(yù)測(cè)結(jié)果反而并不理想。傳統(tǒng)的預(yù)測(cè)方法主要基于物理和統(tǒng)計(jì)模型,利用模型假設(shè)、系統(tǒng)參數(shù)和天氣數(shù)據(jù)等進(jìn)行預(yù)測(cè),通常需要大量的數(shù)據(jù)支撐,在復(fù)雜氣象條件下,預(yù)測(cè)效果無(wú)法達(dá)到預(yù)期。為解決上述問(wèn)題,本文針對(duì)環(huán)境因素對(duì)光伏功率預(yù)測(cè)的影響進(jìn)行研究,深度解析各主要影響因素與光伏功率的耦合關(guān)聯(lián)特性,進(jìn)而實(shí)現(xiàn)高精度和高可靠度的短期預(yù)測(cè)。首先,使用核密度估計(jì)(Kernel Density Estimation,KDE)對(duì)光伏發(fā)電功率進(jìn)行分析,獲得光伏發(fā)電功率的分布概率;其次,通過(guò)CatBoost算法對(duì)功率與各影響因素之間的非線性耦合相關(guān)性進(jìn)行研究,運(yùn)用CatBoost預(yù)測(cè)模型對(duì)光伏發(fā)電功率變化趨勢(shì)進(jìn)行預(yù)測(cè);然后,構(gòu)建基于CatBoost和KDE的超短期光伏功率預(yù)測(cè)框架,進(jìn)一步提高光伏功率預(yù)測(cè)的精度和可靠性;最后,給出系統(tǒng)參數(shù)和算例結(jié)果分析。

      1 功率預(yù)測(cè)模型的構(gòu)建

      1.1 KDECatBoost預(yù)測(cè)模型

      KDE屬于非參數(shù)檢驗(yàn)方法。在光伏功率預(yù)測(cè)中,KDE可用于功率數(shù)據(jù)的建模和分析。它能夠提供功率的概率分布信息,有助于了解功率的變化范圍和分布情況,從而為決策提供更全面的依據(jù)[12]。

      CatBoost與極端梯度提升(Extreme Gradient Boosting,XGBoost)和LightGBM是梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)的3種主要算法,相對(duì)于XGBoost和LightGBM,CatBoost的準(zhǔn)確率更高。CatBoost能夠處理分類特征和缺失數(shù)據(jù),具有較強(qiáng)的泛化能力,并且可以自動(dòng)處理類別型特征的編碼,減少特征工程的復(fù)雜性。另外,CatBoost還能夠自動(dòng)進(jìn)行特征選擇和調(diào)參,提供較好的模型性能。由于其采用完全對(duì)稱樹(shù)作為基模型,故可以避免過(guò)擬合,提高預(yù)測(cè)的可靠性,強(qiáng)大的泛化能力和自動(dòng)調(diào)參功能,使得其成為光伏功率預(yù)測(cè)的有力工具。

      為了提高預(yù)測(cè)的準(zhǔn)確度,本文利用KDE分析特征數(shù)據(jù),研究光伏功率分布概率特性,同時(shí)利用CatBoost在非連續(xù)性類別特征處理和運(yùn)算速度方面的優(yōu)勢(shì),將光伏功率分布概率預(yù)測(cè)結(jié)果輸入CatBoost模型中,得到最終的光伏功率預(yù)測(cè)結(jié)果。

      1.2 特征處理

      1.2.1 KDE特征處理

      非參數(shù)KDE是利用觀測(cè)數(shù)據(jù)對(duì)某事件進(jìn)行密度函數(shù)估計(jì)。其過(guò)程就是將每一點(diǎn)的概率分配到附近的區(qū)間,將所有的獨(dú)立點(diǎn)區(qū)間密度累加,即可得到最終的密度函數(shù)。假設(shè)X1,X2,X3,…,Xq是從總體中抽取的q個(gè)獨(dú)立同分布樣本,其密度函數(shù)為f(x),則KDE公式為

      (1)

      帶寬h是影響整個(gè)擬合效果優(yōu)劣的核心因素[13]。由式(1)可以看出:若h的取值較大,則樣本數(shù)據(jù)經(jīng)過(guò)壓縮處理突出了平均化,忽略了密度函數(shù)的細(xì)節(jié)部分;若h的取值較小,則隨機(jī)性的影響增大,估計(jì)曲線尖峰過(guò)多,函數(shù)圖像波動(dòng)大。為判斷預(yù)測(cè)的光伏功率分布是否符合實(shí)際分布,將光伏功率數(shù)據(jù)劃分為m組不重復(fù)的數(shù)據(jù),采用擬合優(yōu)度檢驗(yàn),公式為

      (2)

      式中:χ2——擬合優(yōu)度檢驗(yàn)結(jié)果;Ai——光伏功率在第i個(gè)區(qū)間的觀測(cè)頻數(shù);Ei——光伏功率在第i個(gè)區(qū)間的期望頻數(shù)。

      1.2.2 Catboost特征處理

      利用CatBoost對(duì)常規(guī)離散特征方法進(jìn)行優(yōu)化,通過(guò)添加先驗(yàn)分布項(xiàng)使數(shù)據(jù)免受噪聲和低頻率類別型數(shù)據(jù)的干擾。這一優(yōu)化過(guò)程的具體公式為

      (3)

      式中:xi,k——第k個(gè)樣本的第j個(gè)類別特征;xi,j——第k個(gè)樣本之前第j個(gè)樣本的第i個(gè)類別特征;

      Dk——隨機(jī)排序中在第k個(gè)樣本之前的數(shù)據(jù)集;

      Yj——第j個(gè)樣本的標(biāo)簽值;

      a——權(quán)重系數(shù);

      p——添加的先驗(yàn)分布項(xiàng)。

      2 預(yù)測(cè)流程及性能評(píng)估

      2.1 預(yù)測(cè)流程

      本文提出的KDE-CatBoost光伏功率預(yù)測(cè)模型步驟如下。

      步驟1 數(shù)據(jù)獲取。采集集中式光伏電站的歷史光伏功率和歷史氣象數(shù)據(jù)。

      步驟2 數(shù)據(jù)預(yù)處理。檢測(cè)數(shù)據(jù)中的異常值和缺失值,剔除缺失值,采用前后數(shù)據(jù)求平均值的方式處理異常值,并對(duì)數(shù)據(jù)進(jìn)行歸一化處理。歸一化公式為

      (4)

      xi(k)——第i個(gè)類別特征的第k個(gè)原始值;

      xi,min、xi,max——第i個(gè)類別特征的最小值和最大值。

      步驟3 建立數(shù)據(jù)集。該數(shù)據(jù)集包含目標(biāo)變量(即光伏功率)和特征變量(即氣象因子)。

      步驟4 數(shù)據(jù)分析。對(duì)各數(shù)據(jù)進(jìn)行相關(guān)性分析,并通過(guò)KDE方法確定符合條件的特征數(shù)據(jù)及種類。

      步驟5 數(shù)據(jù)集拆分。將輻射、溫度、氣壓、濕度、功率等數(shù)據(jù)拆分為訓(xùn)練集和測(cè)試集,其中80%為訓(xùn)練集,20%為測(cè)試集。

      步驟6 構(gòu)建CatBoost功率預(yù)測(cè)模型。為了使模型保持較高的預(yù)測(cè)精度,通過(guò)經(jīng)驗(yàn)設(shè)置和實(shí)驗(yàn)的方法調(diào)節(jié)模型參數(shù)。

      步驟7 預(yù)測(cè)結(jié)果輸出。將步驟6的預(yù)測(cè)結(jié)果進(jìn)行反歸一化,得到最終預(yù)測(cè)結(jié)果。反歸一化公式為

      (5)

      2.2 預(yù)測(cè)精度評(píng)估

      本文采用多種評(píng)判方式對(duì)模型預(yù)測(cè)精度進(jìn)行評(píng)估。主要評(píng)價(jià)指標(biāo)包括平均絕對(duì)誤差SMAE、均方誤差SMSE、均方根誤差SRMSE、決定系數(shù)SR2(R表示決定系數(shù))。其計(jì)算公式分別為

      (6)

      (7)

      (8)

      (9)

      3 算例分析

      本文算例數(shù)據(jù)采用山東某地區(qū)光伏電站2017年4月—6月的信息,數(shù)據(jù)間隔為15 min,預(yù)測(cè)目標(biāo)是大型集中式光伏電站提前1 h的功率。預(yù)測(cè)模型包含9個(gè)字段,其中參與機(jī)器學(xué)習(xí)建模的變量有8個(gè),分別為總輻射、直輻射、散輻射、溫度、環(huán)境溫度、氣壓、環(huán)境濕度和光伏功率。

      3.1 確定最佳KDE模型

      對(duì)光伏功率進(jìn)行KDE,創(chuàng)建Kernel Density對(duì)象模型,通過(guò)數(shù)據(jù)訓(xùn)練判定各樣本的得分,使用不同帶寬和核函數(shù)進(jìn)行測(cè)試,觀察不同帶寬和核函數(shù)對(duì)密度估計(jì)的影響。

      首先對(duì)不同的核函數(shù)進(jìn)行計(jì)算,然后選取預(yù)測(cè)概率密度最為接近的核函數(shù),最后計(jì)算最佳帶寬值。但是,在系統(tǒng)計(jì)算過(guò)程中,一些測(cè)試點(diǎn)會(huì)發(fā)生偏移,導(dǎo)致余弦、線性和Top-hat核函數(shù)執(zhí)行錯(cuò)誤。因此,本文通過(guò)編寫自定義函數(shù)的算法程序忽略測(cè)試點(diǎn)并返回平均值,即可有效解決該問(wèn)題。此外,對(duì)函數(shù)進(jìn)行優(yōu)化和誤差分析可得到最終的KDE圖,以及相應(yīng)的最佳帶寬和核函數(shù)參數(shù)。

      為了更好地評(píng)估模型的擬合度優(yōu)劣,本文提出了模型優(yōu)度指標(biāo)。計(jì)算公式為

      (10)

      式中:SGOF——模型優(yōu)度指標(biāo),SGOF越接近于零說(shuō)明模型擬合度越高;

      m——預(yù)測(cè)樣本數(shù)。

      3.2 模型結(jié)果和誤差分析

      KDE模型、基于概率函數(shù)(Probability Function,PF)預(yù)測(cè)模型和非參數(shù)概率估計(jì)(Non-Parametric Probability Weighted Estimation,NP-PWE)預(yù)測(cè)模型的SRMSE、SGOF與χ2檢驗(yàn)結(jié)果如表1所示。

      表1 3種模型的預(yù)測(cè)誤差

      由表1可知,基于PF的光伏功率分布預(yù)測(cè)模型SGOF較大且未通過(guò)χ2檢驗(yàn);KDE和NP-PWE模型的χ2都小于臨界值,但KDE模型的SGOF與χ2值更小,即預(yù)測(cè)值與相應(yīng)實(shí)際值更接近。相較于其他兩種模型,KDE模型的SRMSE值最小。

      3.3 光伏電站運(yùn)行數(shù)據(jù)相關(guān)性分析

      光伏電站運(yùn)行數(shù)據(jù)的相關(guān)性系數(shù)如圖1所示。其中,正數(shù)為正相關(guān),負(fù)數(shù)為負(fù)相關(guān),絕對(duì)值越大相關(guān)性越強(qiáng)。

      圖1 光伏電站運(yùn)行數(shù)據(jù)的相關(guān)性系數(shù)

      由圖1可以看出,輻射照度(總輻射、直輻射和散輻射)是光伏功率的主要影響因素之一。較高的輻射照度通常意味著更高的光能轉(zhuǎn)換效率,從而產(chǎn)生更高的光伏功率。

      分析圖1中數(shù)據(jù)可知,在一定范圍內(nèi),隨著溫度的升高,光伏模塊的電子特性和效率會(huì)發(fā)生變化,從而影響光伏功率的輸出。一般情況下,光伏功率與溫度之間存在負(fù)相關(guān)關(guān)系。但由于本文采集的數(shù)據(jù)中溫度未達(dá)到對(duì)發(fā)電效率產(chǎn)生負(fù)影響的臨界值,故為正相關(guān)。

      除了輻射照度和溫度,其他天氣條件如云量、風(fēng)速等也會(huì)對(duì)光伏功率產(chǎn)生影響。云量的增加和風(fēng)速的提高可能導(dǎo)致日照減弱或局部陰影,從而降低光伏功率。由于太陽(yáng)高度角和日照時(shí)間的不斷變化,光伏發(fā)電系統(tǒng)在不同季節(jié)可能產(chǎn)生不同的功率輸出。在夏季,由于受輻射時(shí)間更長(zhǎng)和太陽(yáng)高度角較高,因此光伏功率通常相對(duì)較高。另外,光伏系統(tǒng)本身的特性如組件類型、布局以及傾斜角度等也會(huì)對(duì)光伏功率的相關(guān)性產(chǎn)生影響。

      3.4 多種預(yù)測(cè)模型對(duì)比分析

      針對(duì)同一訓(xùn)練測(cè)試數(shù)據(jù)集,分別采用支持向量機(jī)(Support Vector Regression,SVR)、決策樹(shù)回歸(Decision Tree Regressor,DTR)、K近鄰(K-Nearest Neighbor,KNN)算法、LSTM、LightGBM和本文所提的KDE-Catboost模型進(jìn)行光伏發(fā)電功率預(yù)測(cè),結(jié)果如表2所示。

      表2 不同預(yù)測(cè)模型的預(yù)測(cè)誤差和耗時(shí)

      由表2可以得出,與其他5種模型相比,KDE-Catboost模型的SRMSE值分別下降了27.59%、8.69%、16.21%、23.33%、12.56%,說(shuō)明本文所提模型的預(yù)測(cè)精度更高,適用于真實(shí)數(shù)據(jù)預(yù)測(cè)。另外,本文所提模型的SR2值最高,說(shuō)明模型的擬合效果更好,可靠性更高。

      為驗(yàn)證所提模型的魯棒性,選取以下5種KDE-CatBoost模型:模型1,考慮近7 d光伏歷史數(shù)據(jù)的KDE-CatBoost算法模型;模型2,考慮另外30 d光伏歷史數(shù)據(jù)的KDE-CatBoost算法模型;模型3,考慮不同季節(jié)特性的KDE-CatBoost算法模型;模型4,在模型3基礎(chǔ)上增加天氣特征的KDE-CatBoost模型;模型5,考慮不同天氣特征的KDE-CatBoost算法模型。5種模型的預(yù)測(cè)誤差如表3所示。5種模型的預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比如圖2所示。

      圖2 5種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比

      表3 5種KDECatBoost模型的預(yù)測(cè)誤差

      根據(jù)表3和圖2可知,5種模型均具有較高的擬合度,可見(jiàn)本文所提模型的魯棒性較好。其原因是模型中KDE只需要設(shè)置帶寬值一個(gè)參數(shù),使得算法結(jié)果相對(duì)穩(wěn)定。另外,CatBoost算法在訓(xùn)練進(jìn)程中對(duì)類別特征進(jìn)行了分析處理,并采用對(duì)稱樹(shù)作為基模型避免了過(guò)度擬合,同時(shí)縮短了計(jì)算時(shí)長(zhǎng)。

      4 結(jié) 論

      本文提出KDE與CatBoost算法相結(jié)合的光伏功率超短期預(yù)測(cè)模型,解決了預(yù)測(cè)模型普遍存在的超參數(shù)調(diào)優(yōu)和過(guò)度擬合的難題,模型具有更加廣泛的適用性。具體結(jié)論如下。

      (1) KDE與CatBoost算法相結(jié)合的光伏功率超短期預(yù)測(cè)模型與實(shí)際值具有較高的擬合精度,且預(yù)測(cè)模型的魯棒性較好。

      (2) 算例結(jié)果表明,所提模型的SRMSE相較于SVR、DTR、KNN、LSTM、LightGBM分別下降了27.59%、8.69%、16.21%、23.33%、12.56%。

      猜你喜歡
      發(fā)電功率預(yù)測(cè)
      無(wú)可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      “發(fā)電”
      『功率』知識(shí)鞏固
      功與功率辨
      追本溯源識(shí)功率
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      檸檬亦能發(fā)電?
      做功有快慢功率來(lái)表現(xiàn)
      搖晃發(fā)電小圓球
      会泽县| 山阳县| 黄冈市| 克拉玛依市| 平遥县| 当阳市| 卫辉市| 榆社县| 上犹县| 普陀区| 达孜县| 东源县| 屏南县| 罗山县| 九台市| 定兴县| 观塘区| 江津市| 安龙县| 扶余县| 当涂县| 通州区| 贵定县| 乌拉特中旗| 本溪| 来凤县| 大连市| 凉城县| 阳信县| 平阴县| 辽阳县| 阿图什市| 双辽市| 汨罗市| 广汉市| 临沂市| 汝州市| 司法| 抚远县| 自治县| 谷城县|