王云艷,羅 帥,王子健
(湖北工業(yè)大學(xué)電氣與電子工程學(xué)院,湖北 武漢430068)
隨著工業(yè)3.0時代的到來,世界資源損耗在不斷加劇,國家資源發(fā)展戰(zhàn)略部署對光伏發(fā)電提出更高的要求,需要更加準(zhǔn)確的光伏發(fā)電功率預(yù)測來協(xié)助國家資源管理部門宏觀協(xié)調(diào)電能分布。對光伏輸出功率的準(zhǔn)確預(yù)測,可以更好的提高電力各部門適時對電力調(diào)整調(diào)度的效率,從而更高效率的減少光伏發(fā)電系統(tǒng)接入時對電網(wǎng)系統(tǒng)造成的不利影響。國內(nèi)外知名學(xué)者針對光伏輸出有功功率與時間序列關(guān)系建立采取多種數(shù)據(jù)特征挖掘、數(shù)據(jù)分析、數(shù)據(jù)建模等手段來預(yù)測未來光伏發(fā)展?fàn)顟B(tài),韓思鵬等[1]人在總結(jié)近些年來光伏預(yù)測方法中主要歸類了直接法和間接法預(yù)測模型,直接預(yù)測算法基于的數(shù)據(jù)為光伏功率結(jié)果,而間接法基于的是影響光伏功率的因數(shù),更為可靠的數(shù)據(jù)結(jié)構(gòu)決定預(yù)測的準(zhǔn)確度。毛玉賓等[3]人針對影響光伏發(fā)電的溫度和濕度利用支持向量機(jī)(SVM)來彌補(bǔ)直接預(yù)測算法的不足,但是對數(shù)據(jù)空間的處理比較粗糙導(dǎo)致遺漏了部分重要尺度空間。PULIPAKA等[3-5]人針對影響發(fā)電功率的輻照度樣本應(yīng)用聚類算法,雖然建立較為可靠的數(shù)據(jù)空間來進(jìn)行數(shù)據(jù)預(yù)測,但數(shù)據(jù)空間對后期的預(yù)測網(wǎng)咯并沒有緊密連接性。隨著人工智能時代的到來,更多的學(xué)者將圖像處理中的深度學(xué)習(xí)網(wǎng)絡(luò)算法直接運用到光伏發(fā)電數(shù)據(jù)預(yù)測中,譚建斌等[6]人采用改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來更好地預(yù)測數(shù)據(jù),改進(jìn)的過程局限在輸入與輸出結(jié)構(gòu)上的加強(qiáng),未涉及到中間隱含層的結(jié)構(gòu)優(yōu)化。吳堅等[7]人將深度置信網(wǎng)絡(luò)通過無監(jiān)督學(xué)習(xí)過程逐層挖掘數(shù)據(jù)內(nèi)部結(jié)構(gòu),深度網(wǎng)絡(luò)對數(shù)據(jù)的復(fù)雜度要求相對較高,對光伏發(fā)電簡單的數(shù)據(jù)空間結(jié)構(gòu)適用性并非完全優(yōu)于傳統(tǒng)的方法。結(jié)合傳統(tǒng)的數(shù)據(jù)分析算法[8]和近代的神經(jīng)網(wǎng)絡(luò)算法[9]提出一種更加優(yōu)越且遷移性較高的可嵌入式網(wǎng)絡(luò)結(jié)構(gòu)[10],更加全面地考慮光伏發(fā)電數(shù)據(jù)與其它數(shù)據(jù)類型的差異性,如何更好地適應(yīng)光伏發(fā)電數(shù)據(jù)值得去思考和挖掘。
綜合考慮光伏發(fā)電功率預(yù)測的數(shù)據(jù)類型和預(yù)測算法的有效性,本文提出了一種結(jié)合流形學(xué)習(xí)網(wǎng)絡(luò)和改進(jìn)型BP網(wǎng)絡(luò)的光伏發(fā)電功率預(yù)測算法。通過灰度關(guān)聯(lián)算法[11]預(yù)處理數(shù)據(jù),充分發(fā)揮流形學(xué)習(xí)網(wǎng)絡(luò)的數(shù)據(jù)趨向性和深度神經(jīng)網(wǎng)絡(luò)的特征挖掘全面性,避免數(shù)據(jù)過少而導(dǎo)致的模型發(fā)散[12],同時考慮到數(shù)據(jù)空間過于冗余會導(dǎo)致訓(xùn)練尺度大、模型分割能力差問題[13],一定程度上提高了模型訓(xùn)練的難度和模型結(jié)構(gòu)的穩(wěn)定性,更大程度上提高了模型的可遷移性。
灰度關(guān)聯(lián)算法是早年提出的一種根據(jù)各因素變換曲線的相似度來判斷關(guān)聯(lián)程度科學(xué)理論,通常運用此種方法分析各種因素對結(jié)果影響的程度,此外此方法也可以解決隨時間變化產(chǎn)生的綜合評價類問題,此核心就是按照一定規(guī)則確立時間的母序列,然后把評估對象隨著時間變化作為子序列,根據(jù)子序列與母序列的相關(guān)程度得出結(jié)論。
圖1 灰度關(guān)聯(lián)結(jié)構(gòu)
如圖1所示,首先確立分析數(shù)列分別為參考數(shù)列Y和比較數(shù)列Xi,并且將兩組數(shù)據(jù)分別作歸一化處理得到數(shù)列y和xi,然后利用式(1)、(2)計算關(guān)聯(lián)系數(shù),關(guān)聯(lián)系數(shù)作為歸一化參考數(shù)列y和比較數(shù)列xi在各個時刻的關(guān)聯(lián)程度值,但是參數(shù)過多不利于數(shù)據(jù)分析時進(jìn)行整體比較,利用式(3)利用求取平均數(shù)的方法獲得關(guān)聯(lián)度ri,最后將關(guān)聯(lián)度按照大小排序剔除掉有限個關(guān)聯(lián)度相對較小的因素,有利數(shù)據(jù)預(yù)測中的損失遞減。
ξi(k)
(1)
設(shè)Δi(k)=|y(k)-xi(k)|,則
(3)
數(shù)據(jù)空間降維處理作為數(shù)據(jù)預(yù)測的關(guān)鍵步驟,一方面預(yù)訓(xùn)練數(shù)據(jù)空間結(jié)構(gòu)過于復(fù)雜會導(dǎo)致訓(xùn)練模型的過擬合,損失難以在有效時間收斂到預(yù)定值,另一方面過度的數(shù)據(jù)維度壓縮會破壞數(shù)據(jù)的內(nèi)部體系結(jié)構(gòu),數(shù)據(jù)的連接性不能夠支持訓(xùn)練,如圖2所示。
圖2 PCA降維傳統(tǒng)數(shù)據(jù)空間
常用的PCA(Principal Component Analysis,主成分分析)能夠有效地將傳統(tǒng)的數(shù)據(jù)空間結(jié)構(gòu)進(jìn)行分離,但是針對高維度復(fù)雜數(shù)據(jù),這種常用的數(shù)據(jù)降維方式難以滿足大數(shù)據(jù)環(huán)境,如圖3所示,流形學(xué)習(xí)算法是從局部處理數(shù)據(jù),能夠相似度較高的樣本點集中到相近的位置空間。
圖3 流形學(xué)習(xí)降維過程
其實現(xiàn)步驟如下:
Step1:首先構(gòu)造近鄰圖,連接所有的樣本點,連接每個點最近的k個點,確定相鄰點之間的權(quán)重大小如式(4),x1與x2分別為兩個相鄰點。
(4)
Step2:讓相似的樣本點在降維后空間中距離較近,構(gòu)建優(yōu)化目標(biāo)函數(shù)f(x)如式(5)
(5)
ya,yb是分別是特征點在n維空間中的列向量。拉普拉斯矩陣 L=D-W,其中D 為圖的度矩陣,W為圖的鄰接矩陣。然后進(jìn)行圖拉普拉斯矩陣特征值分解,使用最小的n個特征值(非零)對應(yīng)的特征向量作為降維后的結(jié)果。
相比傳統(tǒng)的光伏數(shù)據(jù)處理過程,本算法將灰度關(guān)聯(lián)算法置于網(wǎng)絡(luò)的前端數(shù)據(jù)預(yù)處理過程,加強(qiáng)了算法的可遷移性,適用于多種影響因素影響下的光伏發(fā)電功率數(shù)據(jù)預(yù)測。流形學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)嵌于改進(jìn)型BP網(wǎng)絡(luò)的前端,增強(qiáng)數(shù)據(jù)的可分離性,同時過濾掉部分無關(guān)因子,BP神經(jīng)的網(wǎng)絡(luò)輸入點控制在合適范圍。改進(jìn)型BP網(wǎng)絡(luò)引入深度網(wǎng)絡(luò)中端對端的結(jié)構(gòu)思想,將隱含層設(shè)計為16節(jié)點到64節(jié)點的遞推結(jié)構(gòu),考慮到隱含層結(jié)構(gòu)過于復(fù)雜極容易導(dǎo)致維度爆炸,訓(xùn)練模型的過擬合現(xiàn)象,在隱含節(jié)點的后端從64節(jié)點還原到16節(jié)點結(jié)構(gòu),最后輸出為一維概率。如圖4所示,整體算法流程如圖4所示。
圖4 整體算法流程
Step1:考察比較數(shù)據(jù)空間與參考數(shù)據(jù)的關(guān)聯(lián)度,通過灰度關(guān)聯(lián)分析算法獲取關(guān)聯(lián)度排序,排除三組關(guān)聯(lián)度較小的影響因素,將剩余的影響因素重新組合成新的比較數(shù)據(jù)空間。
Step2:通過流形學(xué)習(xí)網(wǎng)絡(luò)過濾掉一部分聯(lián)系不夠緊密的數(shù)據(jù)結(jié)構(gòu),并且將聯(lián)系非常緊密的數(shù)據(jù)粗略劃分,構(gòu)成相對完備的與訓(xùn)練數(shù)據(jù)空間。
Step3:構(gòu)建改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如式(6)所示,輸入層與隱含層、隱含層與輸出層使用S型函數(shù)作為激活函數(shù),如式(7)所示,隱含層彼此之間使用雙極S型函數(shù)作為激活函數(shù),利用式(8)計算全局誤差,利用全局誤差反向修正傳遞系數(shù)。
(8)
Step4:通過模型的訓(xùn)練保存最優(yōu)傳遞參數(shù),修正流形學(xué)習(xí)網(wǎng)絡(luò)最有結(jié)構(gòu),最后利用保存模型預(yù)測未來光伏發(fā)電功率影響因數(shù)。
本文光伏預(yù)測數(shù)據(jù)來源于國家電力投資集團(tuán)有限公司依據(jù)《國家電投大數(shù)據(jù)建設(shè)總體方案》、《國家電投推進(jìn)大眾創(chuàng)業(yè)萬眾創(chuàng)新工業(yè)方案》策劃的光伏電站人工智能運維大數(shù)據(jù)處理分析比賽數(shù)據(jù),如圖5所示,訓(xùn)練數(shù)據(jù)的測試數(shù)據(jù)包含光伏板運行狀態(tài)參數(shù)和氣象參數(shù),光伏板運行狀態(tài)參數(shù)包括背板溫度、光伏陣列的電壓和電流、轉(zhuǎn)換效率等,氣象參數(shù)包括太陽能輻照度、環(huán)境溫濕度、風(fēng)速、風(fēng)向等。
圖5 光伏預(yù)測部分?jǐn)?shù)據(jù)
實驗環(huán)境在WIN10系統(tǒng)下,為了快速搭建改進(jìn)型BP網(wǎng)絡(luò),采用目前較為流行的深度學(xué)習(xí)框架Tensorflow,在實驗中,為了提高實驗網(wǎng)絡(luò)的訓(xùn)練速度,采用單個8G容量GPU的計算模式,硬件上采用NVIDIA1080卡,利用GUP加速模式運行。
改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)算法的基本性能參數(shù)如表1所示,針對改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)中模擬端對端結(jié)構(gòu),16層增加到64層隱含層設(shè)置更大的損失loss1,有利于模型的快速收斂,而在后端的64層縮減過程采用loss2,防止模型的過擬合。同時光伏發(fā)電功率預(yù)測結(jié)果需要通過合理的評價參數(shù)進(jìn)行定量分析。
表1 基本性能參數(shù)
目前通常使用平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)兩個有效地指標(biāo)來評價預(yù)測結(jié)果,如式(9)、(10),更具光照強(qiáng)度來增加晴天和陰天的平均準(zhǔn)確度參數(shù)(OA),如式(11),一定程度上加強(qiáng)數(shù)據(jù)分析的合理性、可靠性。
(11)
為了更好地驗證本算法有效性,通過對數(shù)據(jù)樣本準(zhǔn)確度和損失值進(jìn)行實時監(jiān)控,得到損失監(jiān)控結(jié)果如圖6所示,能夠明顯看出損失在前期下降較快到后期變得更加平緩。分別是用支持向量機(jī)(SVM)分類、流形學(xué)習(xí)+SVM、改進(jìn)型BP三組算法與本文算法作對比,通過在所有預(yù)測樣本中隨機(jī)抽取100個樣本得到預(yù)測結(jié)果與真實結(jié)果對比如圖7所示,雖然測試結(jié)果中有個別奇點,但是整體預(yù)測結(jié)果與真實結(jié)果基本一致。顯而易見,本算法模型適應(yīng)本數(shù)據(jù)結(jié)構(gòu),但是準(zhǔn)確度存在一定的不足。如表2所示,其次根據(jù)光照強(qiáng)度對數(shù)據(jù)分為晴天和陰天兩種,分別計算兩組數(shù)據(jù)預(yù)測結(jié)果的準(zhǔn)確度,晴天預(yù)測結(jié)果平均準(zhǔn)確度比陰天預(yù)測結(jié)果平均準(zhǔn)確度高8%左右,流形學(xué)習(xí)算法結(jié)合支持向量機(jī)進(jìn)行訓(xùn)練預(yù)測結(jié)果MAPE下降了9.3%、RMES降低了0.05kW,證明了流形學(xué)習(xí)網(wǎng)絡(luò)達(dá)到了數(shù)據(jù)預(yù)分類效果。
圖6 損失結(jié)果
圖7 預(yù)測結(jié)果與真實結(jié)果對比
相對傳統(tǒng)的機(jī)器學(xué)習(xí)算法,本文采取近些年深度神經(jīng)網(wǎng)絡(luò)優(yōu)化模型結(jié)構(gòu)對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行修正,得到改進(jìn)型BP網(wǎng)絡(luò)的預(yù)測結(jié)果中MAPE下降了1.2%、RMES下降了0.01kw,雖然相比流形學(xué)習(xí)+SVM只是有微小的效果增益,吸取流形學(xué)習(xí)算法的優(yōu)勢后的本算法效果相對有大的進(jìn)步,平均絕對百分比誤差(MAPE)下降了10%左右,均方根誤差(RMSE)下降了0.2kW左右。
表2 不同模型評價指標(biāo)分布
通過流形學(xué)習(xí)網(wǎng)絡(luò)結(jié)合支持向量機(jī)算法和單純利用數(shù)據(jù)預(yù)處理后用支持向量機(jī)分類算法結(jié)果對比,證明流形學(xué)習(xí)算法針對高維度數(shù)據(jù)空間就夠的降維和初步分層有一定效果,相比其它基于簡單線性運算的降維算法更加有效,也說明了數(shù)據(jù)空間結(jié)構(gòu)對數(shù)據(jù)分類、數(shù)據(jù)挖掘有重要引導(dǎo)作用,大數(shù)據(jù)的挖掘需要合理的數(shù)據(jù)空間作為基礎(chǔ),只要數(shù)據(jù)空間結(jié)構(gòu)足夠完備而且規(guī)律性可尋,再后期的數(shù)據(jù)處理過程中才能更好地達(dá)到預(yù)想效果。本算法中BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)方式首先提取有效地底層信息空間,然后學(xué)習(xí)有效空間特征后再使用相對高層信息空間,充分利用信息空間能更有效得學(xué)習(xí)特征。通過分析結(jié)果表明本算法有如下優(yōu)勢:①相比傳統(tǒng)的預(yù)測算法,本算法加入灰度關(guān)聯(lián)算法來對數(shù)據(jù)進(jìn)行篩選,剔除數(shù)據(jù)中的奇點來,訓(xùn)練數(shù)據(jù)更加可靠,模型的穩(wěn)定性和兼容性更高。②將流形學(xué)習(xí)框架放入網(wǎng)絡(luò)前端,一方面增強(qiáng)網(wǎng)絡(luò)的空間結(jié)構(gòu),另一方面降低數(shù)據(jù)空間維度,有利于網(wǎng)絡(luò)訓(xùn)練的速度和損失的下降,模型收斂更快。③改進(jìn)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),學(xué)習(xí)有效空間特征來獲取最優(yōu)網(wǎng)絡(luò)的參數(shù),網(wǎng)絡(luò)的可遷移性強(qiáng),后期可將流形學(xué)習(xí)或者是其它算法嵌入其中,減少訓(xùn)練時間。
光伏發(fā)電技術(shù)雖然已經(jīng)相對成熟,但是發(fā)電功率的不穩(wěn)定性會影響區(qū)域供電不穩(wěn)定,隨著大數(shù)據(jù)、人工智能和工業(yè)3.0時代的到來,將圖像處理領(lǐng)域的深度學(xué)習(xí)算法遷移到光伏發(fā)電功率預(yù)測能提高預(yù)測的準(zhǔn)確度,相比傳統(tǒng)的預(yù)測算法,深度學(xué)習(xí)的思想對光伏發(fā)電功率影響因素的數(shù)據(jù)空間要求更高,本文提出的結(jié)合流形學(xué)習(xí)算法和改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)算法,首先用灰度關(guān)聯(lián)算法排除3項與光伏功率關(guān)聯(lián)度最差的因素,其次結(jié)合流形學(xué)習(xí)網(wǎng)絡(luò)將數(shù)據(jù)空間進(jìn)行降維,最后采用模擬端對端結(jié)構(gòu)的改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)來訓(xùn)練獲得影響因子,保存的算法模型可以對未來幾年的數(shù)據(jù)進(jìn)行預(yù)測。本算法有望將流形學(xué)習(xí)網(wǎng)絡(luò)嵌入改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)中,由后端的預(yù)測結(jié)果來微調(diào)流形學(xué)習(xí)網(wǎng)絡(luò),應(yīng)用領(lǐng)域上能適用于多種光伏發(fā)電數(shù)據(jù),對多種環(huán)境下的測得影響因素預(yù)測獲取未來發(fā)電功率,協(xié)助國家資源管理部門宏觀協(xié)調(diào)電能分布。