摘 要:為解決分布式光伏短期預(yù)測中發(fā)電戶特性差異、地理位置偏移導(dǎo)致氣象數(shù)據(jù)偏差的問題,并進一步提升算法預(yù)測性能,提出結(jié)合用戶畫像的動態(tài)時間規(guī)整(dynamic time warping,DTW)-多頭自注意力神經(jīng)網(wǎng)絡(luò)(multi-head attention neural network,MANN)-因子分解機(factorization machine,F(xiàn)M)預(yù)測模型。首先分析發(fā)電戶檔案數(shù)據(jù)和歷史發(fā)電數(shù)據(jù),統(tǒng)計出用戶畫像;再結(jié)合基于DTW標準氣象特征修正偏移算法,形成合理、完善的“用戶+氣象”特征組合樣本;最后使用加權(quán)的數(shù)據(jù)樣本對模型進行訓(xùn)練。仿真階段使用江蘇省真實光伏、氣象數(shù)據(jù),將所提模型與當(dāng)前業(yè)界先進的若干光伏預(yù)測模型進行對比實驗,結(jié)果表明該模型具有更高的準確度和魯棒性,表現(xiàn)出更佳的預(yù)測性能。
關(guān)鍵詞:分布式發(fā)電;神經(jīng)網(wǎng)絡(luò);用戶畫像;光伏發(fā)電預(yù)測;多頭自注意力機制
中圖分類號:TM615" " " " " " " " " "文獻標志碼:A
0 引 言
2021年,中國國家能源局推出“整縣”分布式光伏戰(zhàn)略,業(yè)界專家學(xué)者普遍認為,在“雙碳”目標以及鄉(xiāng)村振興的推動下,大力發(fā)展分布式光伏,將釋放巨大潛力[1]。但由于分布式光伏過于碎片化,加上光伏本身發(fā)電能力的不穩(wěn)定,分布式光伏并網(wǎng)對線路潮流、電網(wǎng)經(jīng)濟性運行和電能質(zhì)量都會造成不良的影響[2],只有對分布式光伏進行準確的短期預(yù)測,才可有效地降低光伏并網(wǎng)帶來的風(fēng)險。
目前,國內(nèi)外已進行大量光伏出力預(yù)測方法的研究,常見的有物理氣象模型[3-4]和統(tǒng)計學(xué)習(xí)方法。統(tǒng)計學(xué)習(xí)模型由于信息易獲取、建模簡單靈活、準確度較高而在光伏功率預(yù)測中廣泛應(yīng)用。統(tǒng)計學(xué)習(xí)模型的框架大多基于前饋神經(jīng)網(wǎng)絡(luò)[5-6]、循環(huán)神經(jīng)網(wǎng)絡(luò)[7-9]、各類神經(jīng)網(wǎng)絡(luò)組合模型[10-12]、統(tǒng)計類[13-14]模型以及樹集成算法[15]等,此類方法通過擬合各種特征因素和光伏出力值之間的映射關(guān)系進行功率預(yù)測。
現(xiàn)有模型應(yīng)用于“整縣”分布式光伏短期出力預(yù)測存在一些共性的問題:一是只關(guān)注氣象特征,忽視了分布式光伏各節(jié)點存在的重要差異化特征,缺少對發(fā)電戶個性化信息的區(qū)分,導(dǎo)致預(yù)測結(jié)果的準確程度欠佳;二是由于分布式光伏的碎片化特性,預(yù)測模型只能使用鄰近氣象站的數(shù)值天氣預(yù)報數(shù)據(jù),導(dǎo)致實際天氣數(shù)值與收集到的氣象數(shù)據(jù)有一定偏差[16],造成預(yù)測的失準;三是現(xiàn)有實驗研究大多基于國外公開氣象數(shù)據(jù),未使用中國數(shù)據(jù)進行驗證,適用性尚待考究。
針對上述問題,本文結(jié)合基于DTW評價標準的數(shù)據(jù)偏移修正算法、用戶畫像以及MANN-FM算法,提出一種新的預(yù)測模型。為驗證所提模型的預(yù)測性能,實驗階段使用在江蘇省真實采集的分布式光伏數(shù)據(jù)和光伏氣象站氣象數(shù)據(jù),并復(fù)現(xiàn)業(yè)界已研究的若干先進模型,進行對比實驗。
1 光伏出力影響因素分析
1.1 影響光伏出力的因素
從光伏發(fā)電機理[17]來看,光伏出力與光照輻射關(guān)系最為緊密。圖1是緊鄰氣象站的江蘇省揚州市某居民光伏發(fā)電戶2021年12月某天05:00—18:00的光伏發(fā)電趨勢圖。圖中每個點表示15 min發(fā)電戶光照輻射和平均發(fā)電功率數(shù)據(jù)的組合關(guān)系。其中縱坐標是發(fā)電功率,橫坐標是臨近光伏氣象站收集到的對應(yīng)時間段內(nèi)的垂直于地面的直射輻射總和。
由圖1可見,發(fā)電功率和垂直于地面的直射輻射呈強正相關(guān)關(guān)系,數(shù)據(jù)表現(xiàn)貼合了光伏發(fā)電常識。在統(tǒng)計學(xué)中,皮爾遜相關(guān)系數(shù)常用于度量兩個變量X和Y之間的相關(guān)性,兩個變量之間的皮爾遜相關(guān)系數(shù)定義為其協(xié)方差和標準差的商,這種無量綱化的處理使得計算出來的值介于-1~1之間,且值越大表明兩個變量越相關(guān)。從功能上來說,協(xié)方差就足以刻畫兩個變量的相關(guān)關(guān)系,然而為了消除數(shù)值量級差異的影響,皮爾遜相關(guān)系數(shù)在協(xié)方差的基礎(chǔ)上除以各自的標準差,相互之間可直接比較。
為計算真實數(shù)據(jù)相關(guān)性,收集了江蘇省揚州市某光伏氣象站的氣象數(shù)據(jù)和氣象站周圍5 km約300戶居民光伏發(fā)電戶2021年全年的發(fā)電數(shù)據(jù)并相互匹配,以此計算出直射輻射、散射輻射、水平輻射、平均風(fēng)速、平均溫度、平均氣壓、報裝容量(發(fā)電戶額定功率)與發(fā)電功率之間的皮爾遜系數(shù)進行對比,以研究不同特征因素對光伏發(fā)電的線性相關(guān)性。
從表1可看出,最相關(guān)的兩個特征因素是發(fā)電戶報裝容量和直射輻射,再一次與常識貼合。但由于特征因素間并不完全獨立,彼此間存在一定的關(guān)聯(lián),比如光照輻射越高,往往溫度也就越高,因此部分特征和功率的真實相關(guān)性與計算結(jié)果會有一定的偏差。
從圖1還可看出,上午、下午不同時間段有一些光照輻射很接近的情況下,但功率表現(xiàn)出10%~25%的偏差,證明隨著時間偏移,光照輻射與發(fā)電戶光伏組件安裝角度、發(fā)電戶周圍陰影遮擋、光伏設(shè)備狀態(tài)等因素發(fā)生了變化,導(dǎo)致相同輻射下的不同功率。
為解決這個問題,目前已有的一些研究把時間段進行聚類[4],并分別進行訓(xùn)練和預(yù)測,這種分段的方式較為粗糙,所以效果有限。本文將這一類差異特征歸結(jié)到用戶畫像,并進行更細粒度的提取。
1.2 基于DTW評價標準的輻射偏移修正算法
分布式光伏大多建于屋頂,其碎片化的特性導(dǎo)致自身無可使用的數(shù)值天氣預(yù)報服務(wù),在預(yù)測中一般都借助于附近的光伏氣象站數(shù)據(jù)服務(wù)。然而,碎片化的分布式光伏與光伏氣象站會有不同的一段的距離,由于太陽的方位不同以及大氣環(huán)境的時序變化,其氣象條件也會因為距離偏差存在一定的時移[16],如圖2所示。為了解決這個問題,借助氣象站數(shù)據(jù),提出基于DTW評價標準的輻射偏移修正算法,具體步驟如下:
第1步:收集覆蓋所有發(fā)電戶和區(qū)域范圍內(nèi)全部光伏氣象站坐標數(shù)據(jù)和氣象數(shù)據(jù)。
第2步:對氣象站附近3 km的發(fā)電戶,直接使用該氣象站數(shù)據(jù)作為氣象特征。
第3步:收集全部氣象站的當(dāng)日氣象數(shù)據(jù),將氣象站兩兩配對,基于DTW算法,在[-30~30] min范圍內(nèi)逐分鐘計算各組中不同時間誤差下的氣象數(shù)據(jù)相似度,搜索各組氣象站相似度最高的時刻,作為兩個氣象站的時間偏移值。
第4步:對氣象站3 km外的發(fā)電戶,取其不同方向最近兩個氣象站的氣象數(shù)據(jù),根據(jù)發(fā)電戶所在位置與兩個發(fā)電站的距離比例,用提前計算好的時序偏移值進行糾偏,計算出發(fā)電戶實際氣象數(shù)據(jù)。
算法本質(zhì)就是通過氣象數(shù)據(jù)曲線相似匹配,總結(jié)數(shù)據(jù)變化的規(guī)律,從而更加合理、準確地計算出分布式發(fā)電節(jié)點的實際氣象情況,增加模型的預(yù)測精度。
2 用戶畫像
用戶畫像是對用戶節(jié)點的虛擬化表達。隨著互聯(lián)網(wǎng)的發(fā)展,用戶畫像被附加了適用于各個場景的屬性,并在個性化推薦、精準營銷等領(lǐng)域被廣泛使用[18-19]。分布式光伏與集中式光伏電站最大的不同在于每個分布式節(jié)點的用戶畫像差異,即各個節(jié)點的設(shè)備型號、設(shè)備額定功率、設(shè)備運行狀態(tài)、組件的質(zhì)量等因素的不同,這些差異深度影響到各分布式節(jié)點光伏出力水平,在一定的區(qū)域內(nèi),甚至高于氣象條件的影響。
圖3為江蘇省揚州市某相鄰3戶的發(fā)電戶在同一天的發(fā)電功率情況,其氣象情況完全相同。其中發(fā)電戶1和發(fā)電戶2報裝容量(額定功率)相同,發(fā)電戶3報裝容量約是發(fā)電戶1和發(fā)電戶2報裝容量的兩倍。約06:30太陽升起,3個發(fā)電戶幾乎同時開始有光伏功率輸出。報裝容量較大的發(fā)電戶3表現(xiàn)出明顯高于其他兩戶的功率輸入能力,其功率數(shù)值與包裝容量成正比;報裝容量相同的發(fā)電戶2和發(fā)電戶3,在09:00—10:00的階段功率輸出幾乎相同,但其他時刻有不同的偏差,尤其在08:00—09:00時間段相差較大。雖然外部氣象環(huán)境完全相同,但是功率曲線仍表現(xiàn)出明顯偏差,說明發(fā)電戶在不同時間段內(nèi)受到一些其他因素的影響(例如屋頂被大樹陰影遮擋),造成發(fā)電能力的不同。用戶畫像還存在隨時間變化的情況,例如一些發(fā)電戶陰影遮擋情況在不同季節(jié)以及每天的不同時刻都在隨太陽輻射角度變化而變化。
為了完善地表達用戶個性化特征,采集到各類的用戶數(shù)據(jù)如表2所列。
其中近20天發(fā)電效率是一個統(tǒng)計值,其計算方式為近20天不同時刻(例如09:00—10:00)平均直射輻射與平均發(fā)電功率之商,用于表達近20天由于陰影遮擋等環(huán)境因素在不同時刻對發(fā)電的影響情況。
3 MANN-FM預(yù)測模型
3.1 基于多頭自注意力機制神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)常被用來逼近函數(shù)自變量和因變量的映射關(guān)系。模型采用通用的3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),隱層使用Sigmoid激活函數(shù)。由于光伏出力功率全部為非負值,因此在神經(jīng)網(wǎng)絡(luò)輸出層使用ReLU激活函數(shù),保證數(shù)值非負的同時,不影響其他預(yù)測結(jié)果。
神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)公式如式(2)所示。
式中:[X]——輸入向量;[H]——隱層向量;[O]——輸出層向量;[Wi]、[Wh]——神經(jīng)網(wǎng)絡(luò)輸入層、隱層連接系數(shù);[Bi]、[Bh]——神經(jīng)網(wǎng)絡(luò)輸入層、隱層偏移值。
在光伏發(fā)電預(yù)測模型中,特征對結(jié)果的影響各不相同,為特征合理加權(quán)能夠表達出特征對預(yù)測結(jié)果的影響程度,提高模型泛化能力。在神經(jīng)網(wǎng)絡(luò)中,隱層特征比較抽象,難以使用人工經(jīng)驗對其進行合適的加權(quán)來區(qū)分這種不相同的重要性,因此在神經(jīng)網(wǎng)絡(luò)中,加入了自注意力機制,用來自主計算輸入向量的權(quán)重大小[20]。自注意力機制如式(3)所示。
縮放點積模型計算簡單,并使用縮放因子解決Softmax函數(shù)中梯度縮小問題,所以所提模型中的自注意力機制采用縮放點擊模型。為了更充分地計算特征權(quán)重,模型采用并行的多個模塊計算同一特征的權(quán)重,稱為多頭注意力機制,如圖4所示。
式中:[n]——樣本的特征數(shù)量;[R1]——線性部分的結(jié)果;[R2]——特征交叉部分的結(jié)果;[BFM]——FM模型偏移值;[OFM]——FM模型輸出。
3.3 MANN-FM預(yù)測模型
在機器學(xué)習(xí)領(lǐng)域的研究中,已有FM算法和神經(jīng)網(wǎng)絡(luò)結(jié)合的應(yīng)用案例[21-22],但已有算法基本都忽視了信息權(quán)重在神經(jīng)網(wǎng)絡(luò)中的重要作用。結(jié)合MANN模型強大的信息賦權(quán)和挖掘能力以及FM算法中用戶畫像和氣象特征結(jié)合能力,最終構(gòu)建MANN-FM預(yù)測模型,如圖5所示。
模型數(shù)學(xué)表達式為式(6)的結(jié)果與式(7)的結(jié)果相加。兩個子模型共享同一特征向量輸入,并聯(lián)合進行訓(xùn)練。
4 實 驗
實驗采用2021年江蘇省揚州市某光伏氣象站所采集的真實各類氣象數(shù)據(jù),數(shù)據(jù)維度包括直射輻射、散射輻射、水平輻射、氣壓、風(fēng)速、溫度,數(shù)據(jù)采集頻率為1 min 1條數(shù)據(jù),發(fā)電相關(guān)數(shù)據(jù)使用光伏氣象站附近20 km以內(nèi)的數(shù)千戶分布式光伏發(fā)電戶2021年真實發(fā)電數(shù)據(jù)。通過將每天05:00—20:00(其他時間無光照)對應(yīng)小時內(nèi)的氣象和發(fā)電數(shù)據(jù)進行匹配的方式生成樣本,最終包含完整用戶畫像-氣象數(shù)據(jù)-發(fā)電數(shù)據(jù)的樣本數(shù)據(jù)共約100萬條。
4.1 數(shù)據(jù)預(yù)處理和特征工程
數(shù)據(jù)預(yù)處理工作主要有兩個方面:
1)發(fā)電數(shù)據(jù)和氣象數(shù)據(jù)均含有約3%的數(shù)據(jù)缺失,采用前后數(shù)據(jù)均值法進行補全。
2)發(fā)電數(shù)據(jù)存在發(fā)電量極低的異常值數(shù)據(jù),數(shù)據(jù)量約占全部數(shù)據(jù)的2%。經(jīng)過分析,該類數(shù)據(jù)是由于光伏發(fā)電戶已關(guān)閉了發(fā)電關(guān)口或光伏組件已損壞,因此直接對這部分數(shù)據(jù)進行了去除。
在進行完數(shù)據(jù)預(yù)處理之后,針對1 h級的光伏預(yù)測實驗,模型采用表3所列的若干特征。其中,各項15 min平均輻射特征指的是在小時級預(yù)測中,將1 h分為4個15 min時間段,并計算每個時間段內(nèi)各類輻射值的平均值,由于輻射特征關(guān)聯(lián)性較強,所以將小時級輻射進行細分為的是更加細致表現(xiàn)出輻射波動變化以提高預(yù)測精度;1 h輻射和表示光伏組件在這一時間段接收到的太陽總輻照度;1 h平均風(fēng)速、溫度、氣壓指的是將該1 h內(nèi)的平均值進行計算;前1 h輻射和表示光伏組件在前一時間段已接收到的太陽總輻照度,通過前階段接收到的太陽總輻照度幫助模型訓(xùn)練出光伏組件當(dāng)前時刻的運行狀態(tài),以擬合出光伏組件運行效率。后4項為用戶畫像特征,其含義在第2節(jié)已有解釋,不再贅述。
4.2 特征不平衡問題
由于各分布式發(fā)電戶光伏設(shè)備安裝環(huán)境不同,有的發(fā)電戶只在屋頂安裝光伏發(fā)電設(shè)備,有的發(fā)電戶則成規(guī)模地安裝光伏發(fā)電設(shè)備,因此在報裝容量這一重要特征上,數(shù)據(jù)表現(xiàn)出不平衡分布。
由圖6可見,報裝容量分布集中在0~50 kW,在50~100 kW逐漸減少,然而在200~400 kW區(qū)間數(shù)量又開始增長。分布在50~100 kW區(qū)間內(nèi)的特征數(shù)量,不足0~50 kW區(qū)間的1/10,這導(dǎo)致特征分布嚴重不均,同時會導(dǎo)致模型在擬合特征與真實值關(guān)系時候參數(shù)訓(xùn)練有所偏頗,降低整體的預(yù)測精度。
其他特征同樣表現(xiàn)出不同程度的不平衡狀態(tài),這種狀態(tài)會導(dǎo)致訓(xùn)練時參數(shù)有一定的傾向性,造成預(yù)測準確度的下降。為解決此問題,又不破壞數(shù)據(jù)原有的表征形態(tài),模型將特征分布在較少區(qū)間的樣本進行一定的加權(quán),訓(xùn)練這部分樣本時會通過預(yù)設(shè)的參數(shù)進行加權(quán),以保證模型能夠更好地擬合這些特征分布在稀疏區(qū)域的樣本。
4.3 數(shù)據(jù)實驗
所有模型均使用Tensorflow框架實現(xiàn)。其中本文模型的MANN部分使用3層神經(jīng)網(wǎng)絡(luò),隱層單元數(shù)為60,采用3頭注意力機制。FM部分隱向量維度為7。整體模型使用均方差損失函數(shù)和Adam優(yōu)化算法,學(xué)習(xí)率設(shè)置為0.001,模型每次訓(xùn)練輸入的樣本數(shù)設(shè)置為50。測試集隨機選取全部樣本的10%。
參與對比實驗的模型列舉如下:
模型1:將本文模型基于DTW的偏移糾正去除,其他保持一致;
模型2:將本文模型的用戶畫像部分去除,其他保持一致。
選取了業(yè)界較為領(lǐng)先的部分預(yù)測模型,包括Attention-GRU[8]、EMD-PCA-LSTM[9]、ABC-SVM[13]、CNN-Bi-LSTM[12]、XGBoost[16]、DeepFM[21]。
每個模型共進行10次實驗,每次實驗記錄該次實驗的預(yù)測誤差值(預(yù)測誤差絕對值/真實值),10次實驗完畢后,將10個預(yù)測誤差值求平均作為模型準確性指標,10個預(yù)測誤差值的標準差作為模型穩(wěn)定性指標。從準確性和穩(wěn)定性兩方面評價模型預(yù)測性能。
表4展示對比實驗的最終結(jié)果。從實驗結(jié)果中可看出,所提方法在平均誤差和標準差兩個指標上全部優(yōu)于其他方法,體現(xiàn)出模型誤差更低,預(yù)測更加精確;所提模型在平均誤差的標準差的指標上數(shù)值最低,顯示很強的穩(wěn)定性,證明所提模型在隨機數(shù)據(jù)預(yù)測中有更高的魯棒性。
5 結(jié) 論
提出結(jié)合用戶畫像的DTW-MANN-FM分布式光伏短期出力預(yù)測模型,總結(jié)有如下特性:
1)提出基于DTW評價標準的偏移修正算法,完善地解決分布式節(jié)點數(shù)據(jù)氣象數(shù)據(jù)偏移問題。在實驗階段模進行了控制變量對比實驗,證明了算法有效性。
2)結(jié)合用戶畫像概念,區(qū)分分布式光伏各節(jié)點個性化特性。再結(jié)合細化的氣象特征,取代業(yè)界常用的天氣聚類+多算法集成的方式,不僅簡化模型復(fù)雜性,還提高了預(yù)測準確度。
3)提出MANN-FM預(yù)測模型,將用戶畫像和氣象特征有機結(jié)合在一起進行預(yù)測。在對比實驗階段,使用真實分布式光伏數(shù)據(jù)進行測試,所提模型表現(xiàn)出最優(yōu)的預(yù)測性能,證明所提模型的有效性。
[參考文獻]
[1] 蔣瑩. 整縣光伏激活鄉(xiāng)村振興綠色動能[J]. 中國發(fā)展觀察, 2021(14): 19-22.
JIANG Y. \"Whole county photovoltaic\" activates the green kinetic" "energy" "of" "rural" "revitalization[J]." China" "development observation, 2021(14): 19-22.
[2] 崔紅芬, 汪春, 葉季蕾, 等. 多接入點分布式光伏發(fā)電系統(tǒng)與配電網(wǎng)交互影響研究[J]. 電力系統(tǒng)保護與控制, 2015, 43(10): 91-97.
CUI H F, WANG C, YE J L, et al. Research of interaction of distributed PV system with multiple access points and distribution network[J]. Power system protection and control, 2015, 43(10): 91-97.
[3] UTPAL K D, KOK S T, MEHDI S, et al. Forecasting of photovoltaic power generation and model optimization: a review[J]." Renewable" and" sustainable" energy" reviews, 2018, 81(1): 912-928.
[4] 余光正, 陸柳, 湯波, 等. 基于云圖特征提取的改進混合神經(jīng)網(wǎng)絡(luò)超短期光伏功率預(yù)測方法[J]. 中國電機工程學(xué)報, 2021, 41(20): 6989-7003.
YU G Z, LU L, TANG B, et al. An improved hybrid neural" " network" " "ultra-short-term" " photovoltaic" " power forecasting method based on cloud image feature extraction[J]. Proceedings of the CSEE, 2021, 41(20): 6989-7003.
[5] 王育飛, 付玉超, 薛花. 基于Chaos-EEMD-PFBD分解和GA-BP神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電功率超短期預(yù)測法[J]. 太陽能學(xué)報, 2020, 41(12): 55-62.
WANG" "Y" "F," "FU" "Y" "C," "XUE" "H." "Ultra-short-term forecasting method of photovoltaic power generation based on Chaos-EEMD-PFBD decomposition and GA-BP neural networks[J]. Acta energiae solaris sinica, 2020, 41(12): 55-62.
[6] WANG K J, QI X X, LIU H D. A comparison of day-ahead photovoltaic power forecasting models based on deep learning neural network[J]. Applied energy, 2019, 251: 113315.
[7] 張飛, 張志偉, 萬樂斐, 等. 基于EEMD-GRNN方法的光伏電站短期出力預(yù)測[J]. 太陽能學(xué)報, 2020, 41(12): 103-109.
ZHANG F, ZHANG Z W, WAN L F, et al. Short-term output prediction of photovoltaic power station based on EEMD-GRNN method[J]. Acta energiae solaris sinica, 2020, 41(12): 103-109.
[8] 劉國海, 孫文卿, 吳振飛, 等. 基于Attention-GRU的短期光伏發(fā)電功率預(yù)測[J]. 太陽能學(xué)報, 2022, 43(2): 226-232.
LIU" G" H," SUN" W" "Q," WU" Z" "F," et" "al.nbsp; Short-term photovoltaic" power" forecasting" based" on" "Attention-GRU model[J]. Acta energiae solaris sinica, 2022, 43(2): 226-232.
[9] 張雲(yún)欽, 程起澤, 蔣文杰, 等. 基于EMD-PCA-LSTM的光伏功率預(yù)測模型[J]. 太陽能學(xué)報, 2021, 42(9): 62-69.
ZHANG Y Q, CHENG Q Z, JIANG W J, et al. Photovoltaic power prediction model based on EMD-PCA-LSTMl[J]. Acta energiae solaris sinica, 2021, 42(9): 62-69.
[10] 單英浩, 付青, 耿炫, 等. 基于改進BP-SVM-ELM與粒子化SOM-LSF的微電網(wǎng)光伏發(fā)電組合預(yù)測方法[J]. 中國電機工程學(xué)報, 2016, 36(12): 3334-3343.
SHAN Y H, FU Q, GENG X, et al. Combined forecasting of photovoltaic power generation in microgrid based on the improved BP-SVM-ELM and SOM-LSF with particlization[J]. Proceedings of the CSEE, 2016, 36(12): 3334-3343.
[11] FENG C, CUI M J, HODGE B M, et al. Unsupervised clustering-based short-term solar forecasting[J]. IEEE transactions on sustainable energy, 2019, 10(4):" 2174-2185.
[12] 倪超, 王聰, 朱婷婷, 等. 基于CNN-Bi-LSTM的太陽輻照度超短期預(yù)測[J]. 太陽能學(xué)報, 2022, 43(3): 197-202.
NI" "C," WANG" C," ZHU" T" T," et" al." "Super-short-term forecast of" solar" irradiance" based" on" CNN-Bi-LSTM[J]. Acta energiae solaris sinica, 2022, 43(3): 197-202.
[13] 葛樂, 陸文偉, 袁曉冬, 等. 基于改進相似日和ABC-SVM的光伏電站功率預(yù)測[J]. 太陽能學(xué)報, 2018, 39(3): 775-782.
GE L, LU W W, YUAN X D, et al. Power forecasting of photovoltaic plant based on improved similar day and ABC-SVM[J]. Acta energiae solaris sinica, 2018, 39(3): 775-782.
[14] CUI" "Y," "ZHANG" "J" "R," "ZHONG" "W" "Z." "Short-term photovoltaic output prediction method based on similar day selection with grey relational theory[C]//2019 IEEE Innovative Smart Grid Technologies-Asia (ISGT Asia). Chengdu, China, 2019: 792-797.
[15] 唐雅潔, 林達, 倪籌帷, 等. 基于XGBoost的雙層協(xié)同實時校正超短期光伏預(yù)測[J]. 電力系統(tǒng)自動化, 2021, 45(7): 18-27.
TANG Y J, LIN D, NI C W, et al. XGBoost based Bi-layer collaborative real-time calibration for ultra-short-term photovoltaic prediction[J]. Automation of electric power systems, 2021, 45(7): 18-27.
[16] BARBIERI F, RAJAKARUNA S, GHOSH A. Very short-term photovoltaic power forecasting with cloud modeling:" a review[J]. Renewable and sustainable energy reviews, 2017, 75: 242-263.
[17] 劉東冉, 陳樹勇, 馬敏, 等. 光伏發(fā)電系統(tǒng)模型綜述[J]. 電網(wǎng)技術(shù), 2011, 35(8): 47-52.
LIU D R, CHEN S Y, MA M, et al. A review on models for photovoltaic generation system[J]. Power system technology, 2011, 35(8): 47-52.
[18] 黃立威, 江碧濤, 呂守業(yè), 等. 基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 計算機學(xué)報, 2018, 41(7): 1619-1647.
HUANG L W, JIANG B T, LYU S Y, et al. Survey on deep learning based recommender systems[J]. Chinese journal of computers, 2018, 41(7):" 1619-1647.
[19] SALMINEN J, GUAN K, JUNG S G, et al. A literature review of quantitative persona creation[C]//Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems. Honolulu, HI, USA, 2020: 1-14.
[20] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach, California, USA, 2017: 6000-6010.
[21] GUO H F, TANG R M, YE Y M, et al. DeepFM: a factorization-machine" "based" "neural" "network" "for" "CTR prediction[C]//Proceedings of the 26th International Joint Conference on Artificial Intelligence, Melbourne, Australia, 2017.
[22] CHENG H T, KOC L, HARMSEN J, et al. Wide amp; deep learning for recommender systems[C]//1st Workshop on Deep Learning for Recommender Systems. Boston, USA, 2016.
DTW-MANN-FM MODEL COMBINED WITH USER PROFILE FOR DISTRIBUTED PHOTOVOLTAIC POWER SHORT-TERM FORECASTING
Zhou Jiayi,Zhao Shuangshuang,Wang Zhongdong,Gao Fan,Wang He,Xu Xiaolin
(Marketing Service Center of Jiangsu Electric Power Co., Ltd., Nanjing 210019, China)
Abstract:In order to solve the problem of generator characteristic difference and meteorological data deviation caused by geographical location offset in distributed photovoltaic power short-term forecasting, further improving the prediction performance, a dynamic time warping (DTW)-multi-head attention neural network (MANN)-factorization machine (FM) prediction model combined with user profile is proposed. Firstly, we analyze the profile data and historical power generation data of generators to count the user profile. Then we use the optimization algorithm based on DTW standard, to correct offset of meteorological characteristics, forming a reasonable and perfect “user+meteorological” feature combination. Finally we utilize the weighted data samples to train the model. In the simulation stage, the real photovoltaic data of Jiangsu Province are used to compare the proposed model with several advanced photovoltaic prediction models in the industry. The results show that the proposed model has higher accuracy and robustness, indicating better predictive performance.
Keywords:distributed power generation; neural networks; user profile; photovoltaic power prediction; multi-head self-attention mechanism
收稿日期:2022-05-17
基金項目:國家電網(wǎng)科技項目(5400-202118485A-0-5-ZN)
通信作者:周家億(1994—),男,碩士、工程師,主要從事電力大數(shù)據(jù)應(yīng)用方面的研究。421381551@qq.com