摘 要:提出一種短期太陽輻射估計的協(xié)同方法,即利用鄰近站點數(shù)據(jù)來估計目標(biāo)站點的太陽輻射。先利用最大信息系數(shù)對所有站點的相關(guān)數(shù)據(jù)進行特征選擇。然后將特征選擇后的數(shù)據(jù)作為輸入,采用不同的機器學(xué)習(xí)模型進行估計。最后在實際數(shù)據(jù)上將協(xié)同估計的誤差與僅采用目標(biāo)站點的估計誤差進行比較。實驗結(jié)果表明協(xié)同估計對所有目標(biāo)站點都有更高的精度和更低的誤差。
關(guān)鍵詞:太陽輻射;機器學(xué)習(xí);特征選擇;協(xié)同估計;最大信息系數(shù)
中圖分類號:TM615" " " " " " " " " " " "文獻標(biāo)志碼:A
0 引 言
隨著世界能源危機的日益顯現(xiàn),清潔能源的開發(fā)應(yīng)用備受關(guān)注。光伏發(fā)電是利用太陽能的主要方式之一[1]。光伏發(fā)電系統(tǒng)輸出功率的波動主要由太陽輻射變化引起,因而準確預(yù)測光伏發(fā)電系統(tǒng)輸出功率需準確預(yù)測太陽輻射[2]。由于太陽輻射觀測設(shè)備成本、維護費用及設(shè)備校準等方面的原因,實測的太陽輻射數(shù)據(jù)遠遠不能滿足要求,所以選擇恰當(dāng)?shù)哪P皖A(yù)測不同地區(qū)的太陽輻射數(shù)據(jù)已成為當(dāng)務(wù)之急。[3]。準確的逐時輻射數(shù)據(jù)可量化太陽輻射對建筑的影響[4],為建筑動態(tài)能耗模擬和建筑節(jié)能設(shè)計奠定基礎(chǔ)[5],也可提高太陽能發(fā)電利用率[6]。
近年來,國內(nèi)外學(xué)者提出許多關(guān)于太陽輻射的預(yù)測模型,其大致可分為4種,包括基于大氣數(shù)據(jù)的數(shù)值天氣預(yù)報(numerical weather predictions,NWP)模型[7]、基于圖像的模型[8]、基于歷史數(shù)據(jù)的統(tǒng)計模型[9]和機器學(xué)習(xí)模型[10-11]。NWP模型使用物理方程來對太陽輻射進行預(yù)測,由于該方法計算成本較高,通常不適合進行短期太陽輻射預(yù)測[12]。基于圖像的模型使用天空攝像機或衛(wèi)星圖像進行太陽輻射預(yù)測,但圖像捕獲設(shè)備成本較高,不適合廣泛使用[13]。統(tǒng)計模型基于歷史太陽輻射數(shù)據(jù),一般包括自回歸模型(autoregressive,AR)、移動平均模型(moving average,MA)、自回歸移動平均模型(autoregressive moving average,ARMA)[9]、自回歸綜合移動平均模型(autoregressive integrated moving average,ARIMA)[9]和卡爾曼濾波模型[14]等。
雖然統(tǒng)計模型通常是太陽輻射預(yù)測的不錯選擇,但其僅采用太陽輻射歷史數(shù)據(jù)進行預(yù)測,忽視了氣象變量對太陽輻射的影響。機器學(xué)習(xí)方法具有從多個輸入中提取復(fù)雜非線性特征的優(yōu)點[2],被廣泛應(yīng)用于太陽輻射預(yù)測。文獻[11]結(jié)合變分模態(tài)分解、模擬退火和隨機森林來預(yù)測太陽輻射。特征選擇是在數(shù)據(jù)集中選擇主要特征的過程,它降低了預(yù)測的復(fù)雜度和運行時間[15]。文獻[16]將基于相關(guān)性的特征選擇方法與改進多層級門控長短期記憶網(wǎng)絡(luò)相結(jié)合,從而對短期電價進行有效預(yù)測。
目前對于太陽輻射預(yù)測的研究,大部分工作都僅考慮待預(yù)測目標(biāo)站點的數(shù)據(jù),為改進目標(biāo)站點太陽輻射的預(yù)測性能,一些研究將鄰近站點的信息考慮在內(nèi)[17-18],從而提高預(yù)測精度。本文提出一種協(xié)同估計模型,考慮鄰近站點的時間特征、氣象特征和太陽輻射數(shù)據(jù),利用最大信息系數(shù)(maximum information coefficient,MIC)進行特征選擇,最終對選擇后的特征使用不同的機器學(xué)習(xí)方法進行估計。
1 理論基礎(chǔ)
1.1 最大信息系數(shù)法
Reshef等[19]于2011年提出最大信息系數(shù)(MIC),可用來度量2個變量間的線性與非線性關(guān)系,也可從橫向和縱向比較不同變量的關(guān)系強度[20]。給定二維隨機向量[(ξ,η)]的[m]組觀測[A=(xi,yi)mi=1],則[ξ]和[η]的互信息為:
極端隨機樹(extremely randomized trees,ERT)是隨機森林的改進[24]。與隨機森林的區(qū)別在于:ERT中的每棵樹都采用全部樣本進行訓(xùn)練,在分割樹節(jié)點時,ERT對分裂特征和分割值的獲取具有極強的隨機性[25]。ERT算法流程如下。
步驟1:給定樣本數(shù)據(jù)集[D],樣本容量為[n],樣本輸入特征數(shù)為[L1]。
步驟2:對于樣本集[D],采用CART算法生成決策樹。對每個節(jié)點隨機從[L1]個特征中選取[l]個特征,每個節(jié)點選擇最優(yōu)特征進行分裂,對分裂產(chǎn)生的子集進行遞歸直至生成一棵決策樹。
步驟3:將步驟2迭代[t]次,生成[t]棵決策樹進而形成極端隨機樹。
步驟4:用極端隨機樹對測試樣本進行預(yù)測,生成預(yù)測結(jié)果。
1.2.2 極限學(xué)習(xí)機
極限學(xué)習(xí)機(extreme learning machine,ELM)是一種單隱層前饋神經(jīng)網(wǎng)絡(luò)[26]。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)相比,ELM具有學(xué)習(xí)速率快、泛化性能強等優(yōu)點[27]。給定輸入樣本[x∈RL1×1],令ELM的隱藏層有[M]個節(jié)點,則該層輸出為:
2 協(xié)同估計模型
在預(yù)測目標(biāo)站點的太陽輻射值時,許多學(xué)者僅使用目標(biāo)站點的數(shù)據(jù)進行實驗。由于太陽輻射在時間和空間上有一定相關(guān)性,故本文提出協(xié)同估計模型。在對目標(biāo)站點進行太陽輻射估計時,不僅使用目標(biāo)站點的數(shù)據(jù),同時將目標(biāo)站點周邊的站點也考慮在內(nèi)。如果直接將所有站點數(shù)據(jù)作為輸入進行估計,可能會影響太陽輻射估計效果。為提高估計精度,采用特征選擇方法對數(shù)據(jù)進行合適的篩選,從而降低估計誤差。圖3所示為協(xié)同估計模型流程,主要由如下4個步驟組成。
1)數(shù)據(jù)預(yù)處理。補全目標(biāo)站點和[N]個鄰近站點的缺失數(shù)據(jù),對所有站點的月份和小時特征根據(jù)三角函數(shù)正弦值進行編碼,從而使數(shù)據(jù)連續(xù)化。將編碼后的數(shù)據(jù)進行標(biāo)準化。
2)通過MIC計算目標(biāo)站點和[N]個站點間太陽輻射的相關(guān)性,根據(jù)相關(guān)性大小選擇[H][(H≤N)]個鄰近站點的數(shù)據(jù)來估計目標(biāo)站點的太陽輻射。
3)采用MIC對所選擇的[H]個鄰近站點的所有特征進行選擇。
4)對于特征選擇后的數(shù)據(jù),采用不同的機器學(xué)習(xí)模型來估計目標(biāo)站點的太陽輻射值,并將估計結(jié)果與實際結(jié)果比較,得到估計誤差。
3 算例分析
3.1 實驗數(shù)據(jù)
選取巴西北部7個站點(Humaita,Manacapuru,Itacoatiara、Maues、Urucara、Presidente Figueiredo、Barcelos)的數(shù)據(jù)作為研究對象。該數(shù)據(jù)集來自Kaggle公開數(shù)據(jù)庫,起訖日期為2008年4月25日—2009年12月31日,數(shù)據(jù)采樣時間間隔為1 h。本文將7個站點依次編號為S1~S7,各站點坐標(biāo)及海拔如表1所示。每個站點有21個特征,分別為年、月、日、小時的4個時間特征,溫度、濕度等16個氣象特征,以及太陽輻射特征,如表2所示。因晚上太陽輻射值為0 kJ/m2,根據(jù)巴西實際情況每天選取10:00—23:00的8624條數(shù)據(jù)進行研究,對于缺失值采取平均值法進行補全。
因月總太陽輻射近似關(guān)于8.5對稱,小時總太陽輻射值近似關(guān)于16.5對稱,故對數(shù)據(jù)中的月份(MON)和小時(HOUR)根據(jù)[0~π]利用正弦值進行編碼,從而將數(shù)據(jù)連續(xù)化。用[m]和[h]分別表示月份和小時變量,則編碼函數(shù)為:
對編碼后的數(shù)據(jù)進行標(biāo)準化處理。隨機選取80%的數(shù)據(jù)用于訓(xùn)練,剩余20%的數(shù)據(jù)用于測試。只使用目標(biāo)站點數(shù)據(jù)預(yù)測時,每個模型的輸入特征維數(shù)為20,即目標(biāo)站點的時間特征和氣象特征。使用所有站點的數(shù)據(jù)對目標(biāo)站點的太陽輻射進行協(xié)同估計時,模型的輸入特征由MIC進行選取。所有模型的輸出特征維數(shù)為1,即目標(biāo)站點的太陽輻射值。
3.2 實驗設(shè)置與評價指標(biāo)
本文采用6種機器學(xué)習(xí)模型在Python語言下進行實驗。對于所研究的7個站點,依次將各站點作為目標(biāo)站點,其余6個站點作為鄰近站點。對于所研究的7個目標(biāo)站點,每種模型的參數(shù)均根據(jù)網(wǎng)格搜索來初步選擇,然后經(jīng)過多次實驗調(diào)整得到最佳參數(shù)。為了比較協(xié)同預(yù)測的有效性,每個目標(biāo)站點協(xié)同預(yù)測前后的模型參數(shù)設(shè)為相同。RBF的隱藏層神經(jīng)元數(shù)量設(shè)置為50;BP的網(wǎng)絡(luò)層數(shù)量為4,每層神經(jīng)元數(shù)量分別為32、16、4、1。
對于模型RF和ERT,S3為目標(biāo)站點時,取樹的數(shù)量為300,S4為目標(biāo)站點時所選樹的數(shù)量為350,其余5個目標(biāo)站點均選擇200棵樹進行實驗。對于ELM神經(jīng)網(wǎng)絡(luò),S4為目標(biāo)站點時設(shè)置隱藏層神經(jīng)元數(shù)量為25,其余目標(biāo)站點隱藏層神經(jīng)元數(shù)量均設(shè)置為15。為驗證協(xié)同估計的有效性,采用決定系數(shù)([R2])、平均絕對誤差(MAE)和均方根誤差(RMSE)來對比分析,其計算式如下:
3.3 實驗結(jié)果與分析
臺站之間的距離與太陽輻射有非常強的相關(guān)性。為此,在前述7個臺站的基礎(chǔ)上,再考慮額外3個新站點。圖4為兩個站點距離與MIC的散點圖。從圖4可看出,距離和相關(guān)性大致呈反比趨勢,距離越大相關(guān)性越低。在實踐中,選取相關(guān)性較大的鄰近站點的數(shù)據(jù)對目標(biāo)站點的太陽輻射進行估計。
對于協(xié)同估計模型,首先通過MIC計算各站點間太陽輻射的相關(guān)性,結(jié)果如圖5所示。因各站點間太陽輻射的相關(guān)性均在0.5~0.7之間,從而將所有站點的要素作為目標(biāo)站點的候選特征。在對目標(biāo)站點進行估計時,還需對其余站點的除時間外的所有特征進行選擇。每個站點均包含21個特征,故估計目標(biāo)站點太陽輻射值時共有122個特征,其中包含4個時間特征、112個氣象特征([16×7])和6個輻射特征。特征維數(shù)過高會導(dǎo)致模型過于復(fù)雜,從而影響預(yù)測精度,故需進行特征選取。
對于不同的目標(biāo)站點,所選取的特征也不相同。對于每個目標(biāo)站點特征選取時均遵循以下2個原則:一是根據(jù)MIC值依次從大到小挑選特征,二是盡可能選取較少的特征以達到較高的預(yù)測精度。對于7個目標(biāo)站點,分別對無太陽輻射特征(116個特征)和有太陽輻射特征(122個特征)2種情況進行特征選取,所選取的輸入特征如表3所示。
為了驗證協(xié)同估計的有效性,分別在7個站點進行實驗。對于所選的每個目標(biāo)站點,均采用6種機器學(xué)習(xí)模型來比較協(xié)同估計前后的各項性能指標(biāo),這6種模型分別為RF、ERT、ELM、RBF、BP及SVR。根據(jù)所選取的特征,利用模型在有無太陽輻射特征兩種情況下分別進行估計,以目標(biāo)站點S3和S4為例,結(jié)果如表4、表5所示。
對于目標(biāo)站點S3和S4,僅考慮氣象要素時協(xié)同估計的效果比單獨站點的估計效果好。加入太陽輻射特征后,大部分模型均提升了估計效果。針對目標(biāo)站點S3,模型RF的MAE降低11.17%,RMSE降低6.62%。對于目標(biāo)站點S4,模型SVR的[R2]提升5.69%。在隨后的目標(biāo)站點估計實驗中,將鄰近站點的太陽輻射作為輸入特征的組成部分。對于其余目標(biāo)站點,不同模型協(xié)同估計前后的誤差比較結(jié)果如表6~表10所示。
對于目標(biāo)站點S1,6種機器學(xué)習(xí)方法的協(xié)同估計結(jié)果均優(yōu)于單獨站點的結(jié)果,其中ELM的估計效果提升最為顯著,MAE、RMSE分別降低28.41%和23.80%。對于目標(biāo)站點S2而言,所有機器學(xué)習(xí)方法的協(xié)同模型均提升了估計性能,其中RF方法的估計效果提升最小,MAE、RMSE分別降低13.64%和5.23%。
對于目標(biāo)站點S6和S7,SVR模型協(xié)同估計效果提升最為顯著,[R2]分別提升了23.7%和28.2%。在表8中,目標(biāo)站點S5的估計結(jié)果也進一步說明了協(xié)同估計模型的有效性,與協(xié)同前相比,協(xié)同估計極大降低了估計誤差。綜上,由于考慮了周圍站點的數(shù)據(jù),協(xié)同估計模型能夠更加準確地估計目標(biāo)站點的太陽輻射數(shù)據(jù),可顯著提高估計效果。
通過以上7個目標(biāo)站點估計結(jié)果對比發(fā)現(xiàn),6種模型在協(xié)同情形下均可較準確估計太陽輻射。其中ELM模型的[R2]最小,估計誤差最高;SVR模型有一定的魯棒性,但泛化性能較低;作為簡單的神經(jīng)網(wǎng)絡(luò)模型,RBF和BP能較好地處理數(shù)據(jù)間的非線性關(guān)系,BP神經(jīng)網(wǎng)絡(luò)收斂速度慢,易陷入局部最優(yōu);RF模型和ERT模型引入隨機性策略,可避免易出現(xiàn)過擬合問題。此外,RF模型結(jié)構(gòu)簡單,估計效果最好,[R2]均在0.85以上。
4 結(jié) 論
1)本文提出太陽輻射的協(xié)同估計模型。在數(shù)據(jù)預(yù)處理階段,分別對變量月份和小時采用三角函數(shù)正弦值進行編碼,從而使數(shù)據(jù)連續(xù)化。根據(jù)MIC方法將7個站點的數(shù)據(jù)進行特征選擇,并利用6種機器學(xué)習(xí)模型對目標(biāo)站點的太陽輻射進行估計。使用指標(biāo)[R2]、MAE和RMSE在測試集上來評價協(xié)同前后的估計性能,從而說明協(xié)同估計模型的可行性,且能有效降低太陽輻射的估計誤差。
2)所提出的協(xié)同估計模型也可推廣到風(fēng)速預(yù)測和光伏功率預(yù)測等其他方面。本文僅采用當(dāng)前時刻各站點的數(shù)據(jù)來估計目標(biāo)站點的太陽輻射值,在未來研究中,可考慮將特征的前幾個時刻納入輸入變量,并使用特征選擇方法來選取合適的特征,以進一步提高協(xié)同估計模型的性能。在后續(xù)的協(xié)同預(yù)測研究中,多步預(yù)測也是值得研究的課題。
[參考文獻]
[1] 單存博. 基于數(shù)據(jù)挖掘的太陽輻射預(yù)測方法研究[D]. 北京: 華北電力大學(xué), 2021.
SHAN C B. Research on solar radiation forecasting method based on data mining[D]. Beijing: North China Electric Power University, 2021.
[2] VOYANT C, NOTTON G, KALOGIROU S, et al. Machine learning methods for solar radiation forecasting: a review[J]. Renewable energy, 2017, 105: 569-582.
[3] 于瑛, 楊柳, 霍旭杰, 等.日總輻射推算模型在中國的適用性研究[J]. 太陽能學(xué)報, 2018, 39(9): 2523-2529.
YU Y, YANG L, HUO X J, et al. Analysis of daily global radiation estimation models applicability in China[J]. Acta energiae solaris sinica, 2018, 39(9): 2523-2529.
[4] 曹其夢, 于瑛, 楊柳. 太陽逐時總輻射計算模型適用性分析: 以我國部分地區(qū)為例[J]. 太陽能學(xué)報, 2018, 39(4): 917-924.
CAO Q M,YU Y,YANG L. Applicability analysis of hourly total solar radiation calculation model: taking some regions" of" China" as" example[J]." Acta" "energiae" "solaris sinica, 2018, 39(4): 917-924.
[5] 胡堯, 李紅蓮, 王賞玉, 等. 輻射數(shù)據(jù)缺失時TMY與逐時值生成方法分析[J]. 哈爾濱工業(yè)大學(xué)學(xué)報, 2022, 54(6): 163-170.
HU Y, LI H L, WANG S Y, et al. Analysis of typical meteorological year and hourly value generation method with radiation data missing[J]. Journal of Harbin Institute of Technology, 2022, 54(6): 163-170.
[6] MUKHTAR M, OLUWASANMI A, YIMEN N, et al. Development and comparison of two novel hybrid neural network models for hourly solar radiation prediction[J]. Applied sciences, 2022, 12(3): 1435.
[7] WATANABE T, TAKENAKA H, NOHARA D. Post-processing correction method for surface solar irradiance forecast data from the numerical weather model using geostationary" satellite" observation" data[J]. Solar energy, 2021, 223: 202-216.
[8] 蔣俊霞, 高曉清, 呂清泉, 等. 基于地基云圖的云跟蹤與太陽輻照度超短期預(yù)報方法研究[J]. 太陽能學(xué)報, 2020, 41(5): 351-358.
JIANG J X, GAO X Q, LYU Q Q, et al. Study on cloud tracking and solar irradiance ultra-short-term forecasting based" on" TSI" images[J]." Acta" energiae" solaris" sinica, 2020, 41(5): 351-358.
[9] BELMAHDI B, LOUZAZNI M, EL BOUARDI A. One month-ahead forecasting of mean daily global solar radiation using time series models[J]. Optik, 2020, 219: 165207.
[10] 倪超, 王聰, 朱婷婷, 等. 基于CNN-Bi-LSTM的太陽輻照度超短期預(yù)測[J]. 太陽能學(xué)報, 2022, 43(3): 197-202.
NI C, WANG C, ZHU T T, et al. Super-short-term forecast of" solar" irradiance" based" on" CNN-Bi-LSTM[J]. Acta energiae solaris sinica, 2022, 43(3): 197-202.
[11] ALI M, PRASAD R, XIANG Y, et al. Variational mode decomposition based random forest model for solar radiation forecasting: new emerging machine learning technology[J]. Energy reports, 2021, 7: 6700-6717.
[12] KUMAR D S, YAGLI G M, KASHYAP M, et al. Solar irradiance resource and forecasting: a comprehensive review[J]. IET renewable power generation, 2020, 14(10): 1641-1656.
[13] KUMARI P, TOSHNIWAL D. Deep learning models for solar irradiance" forecasting: a" comprehensive" review[J]. Journal of cleaner production, 2021, 318: 128566.
[14] DONG J, OLAMA M M, KURUGANTI T, et al. Novel stochastic methods to predict short-term solar radiation and photovoltaic" power[J]." Renewable" energy," 2020," 145: 333-346.
[15] RAZA M Q, NADARAJAH M, EKANAYAKE C. On recent advances" in" PV" output" power" forecast[J]. Solar energy, 2016, 136: 125-144.
[16] 趙雅雪, 王旭, 蔣傳文, 等. 基于最大信息系數(shù)相關(guān)性分析和改進多層級門控LSTM 的短期電價預(yù)測方法[J]. 中國電機工程學(xué)報, 2021, 41(1): 135-146, 404.
ZHAO Y X, WANG X, JIANG C W, et al. A novel short-term electricity price forecasting method based on correlation analysis with the maximal information coefficient and modified multi-hierachy gated LSTM[J]. Proceedings of the CSEE, 2021, 41(1): 135-146, 404.
[17] MARZOUQ M, EL FADILI H, ZENKOUAR K, et al. Short term solar irradiance forecasting via a novel evolutionary multi-model framework and performance assessment for sites with no solar irradiance data[J]. Renewable energy, 2020, 157: 214-231.
[18] WANG F, LU X X, MEI S W, et al. A satellite image data based ultra-short-term solar PV power forecasting method considering cloud information from neighboring plant[J]. Energy, 2022, 238: 121946.
[19] RESHEF D N, RESHEF Y A, FINUCANE H K, et al. Detecting" "novel" "associations" "in" "large" "data" "sets[J]. Science, 2011, 334(6062): 1518-1524.
[20] 陳莊, 周糴. 基于 MIC-XGBoost 算法的居民用水量數(shù)據(jù)預(yù)測[J]. 計算機應(yīng)用與軟件, 2021, 38(10): 125-130.
CHEN" "Z," "ZHOU" "D." "Prediction" "of" "residents’water consumption data based on MIC-XGBoost algorithm[J]. Computer applications and software, 2021, 38(10): 125-130.
[21] GUO Z, YU B, HAO M Y, et al. A novel hybrid method for flight departure delay prediction using random forest regression" " and" " maximal" " information" " coefficient[J]. Aerospace science and technology, 2021, 116: 106822.
[22] 侯寧, 張曉通, 魏瑜, 等. 基于隨機森林方法的中國地表短波輻射估算[J]. 太陽能學(xué)報, 2021, 42(2): 31-36.
HOU N, ZHANG X T, WEI Y, et al. Estimation of surface incident shortwave radiation over China based on random forest regression method[J]. Acta energiae solaris sinica, 2021, 42(2): 31-36.
[23] 劉劍, 曹美燕, 高治軍, 等. 一種基于隨機森林的太陽能輻射預(yù)測模型[J]. 控制工程, 2017, 24(12): 2472-2477.
LIU J, CAO M Y, GAO Z J, et al. A solar radiation prediction model based on random forest[J]. Control engineering of China, 2017, 24(12): 2472-2477.
[24] 傅望安, 張澤發(fā), 黃偉. 基于極端隨機樹的火電廠再熱器故障預(yù)警算法研究[J]. 上海電力大學(xué)學(xué)報, 2020, 36(5): 445-450.
FU W A, ZHANG Z F, HUANG W. Research on fault early warning algorithm of reheater in thermal power plant based on extreme random tree[J]. Journal of Shanghai University of Electric Power, 2020, 36(5): 445-450.
[25] 陳宇韜, 唐明珠, 吳華偉, 等. 基于極端隨機森林的大型風(fēng)電機組發(fā)電機故障檢測[J]. 湖南電力, 2019, 39(6): 45-51.
CHEN Y T, TANG M Z, WU H W, et al. Fault detection based on extreme random forest for large wind turbine generators[J]. Hunan electric power, 2019, 39(6): 45-51.
[26] 葉家豪, 魏霞, 黃德啟, 等. 基于灰色關(guān)聯(lián)分析的BSO-ELM-AdaBoost風(fēng)電功率短期預(yù)測[J]. 太陽能學(xué)報, 2022, 43(3): 426-432.
YE J H, WEI X, HUANG D Q, et al. Short-term forecast of wind power based on BSO-ELM-AdaBoost with grey correlation" analysis[J]." Acta" energiae" solaris" sinica, 2022, 43(3): 426-432.
[27] 王琦, 季順祥, 錢子偉, 等. 基于熵理論和改進ELM的光伏發(fā)電功率預(yù)測[J]. 太陽能學(xué)報, 2020, 41(10): 151-158.
WANG Q, JI S X, QIAN Z W, et al. Photovoltaic power prediction based on entropy theory and improved ELM[J]. Acta energiae solaris sinica, 2020, 41(10): 151-158.
[28] 胡兵, 王小娟, 徐立軍, 等. 基于KMO-PCA-BP的燃料電池堆輸出電壓預(yù)測方法[J]. 太陽能學(xué)報, 2022, 43(3): 12-19.
HU B, WANG X J, XU L J, et al. Output voltage prediction method of fuel cell stack based on KMO-PCA-BP[J]. Acta energiae solaris sinica, 2022, 43(3): 12-19.
[29] BISOYI N, GUPTA H, PADHY N P, et al. Prediction of daily sediment discharge using a back propagation neural network training algorithm: a case study of the Narmada River, India[J]. International journal of sediment research, 2019, 34(2): 125-135.
[30] DU B, LUND P D, WANG J, et al. Comparative study of modelling the thermal efficiency of a novel straight through evacuated tube collector with MLR, SVR, BP and RBF methods[J]." " Sustainable" " energy" " technologies" " and assessments, 2021, 44: 101029.
[31] LIMA M A F B, FERNáNDEZ RAMíREZ L M, CARVALHO P, et al. A comparison between deep learning and support vector regression techniques applied to" solar" forecast" in" spain[J]." Journal" of" solar" energy engineering, 2022, 144(1): 010802.
[32] 徐煒君. 基于灰狼優(yōu)化SVR的風(fēng)電場功率超短期預(yù)測[J]. 杭州師范大學(xué)學(xué)報(自然科學(xué)版), 2021, 20(2): 177-182.
XU W J. Ultra short term wind power forecasting of wind farm based on grey wolf optimized SVR[J]. Journal of Hangzhou Normal University(natural science edition), 2021, 20(2): 177-182.
SHORT-TERM SOLAR RADIATION SYNERGY ESTIMATION BASED ON
MAXIMUM INFORMATION COEFFICIENT
Li Jin 1,Shi Jiarong 1,Zhang Yanni 1,Yun Sining 2
(1. School of Science, Xi’an University of Architecture and Technology, Xi’an 710055, China;
2. School of Materials Science and Engineering, Xi’an University of Architecture and Technology, Xi’an 710055, China)
Abstract:To make precise and reliable estimation of solar radiation, this paper proposes a short-term solar radiation synergy estimation method, which implements adjacent station data to estimate solar radiation at target station. First, the maximum information coefficient is used to perform feature selection on relevant data from all stations. Then the data after feature selection are utilized as input for estimation using different machine learning models. The errors of the synergistic estimation are finally compared to the error taking only the target station data on real data. Experimental results indicate that the performance of the synergy estimation has a more precision and low error for all target stations, compared without synergy estimation.
Keywords:solar radiation; machine learning; feature selection; synergy estimation; maximum information coefficient
收稿日期:2022-05-14
基金項目:國家重點研發(fā)計劃(2018YFB1502902);陜西省自然科學(xué)基金(2021JM-378;2021JQ-493)
通信作者:史加榮(1979—),男,博士、教授,主要從事機器學(xué)習(xí)等方面的研究。shijiarong@xauat.edu.cn