李丹陽(yáng) 胡宏劍 李卓璇 曾沛哲 李木
(中國(guó)礦業(yè)大學(xué)(北京) 北京 100083)
近40年來(lái),風(fēng)電技術(shù)在能源危機(jī)和環(huán)境危機(jī)的背景下迅速發(fā)展。截至2021年底,全球風(fēng)機(jī)總裝機(jī)容量達(dá)837 GW,新增裝機(jī)量近94 GW,較2020 年同比增長(zhǎng)率僅低1.8%。風(fēng)力發(fā)電已成為全球發(fā)電不可忽視的一部分,但在風(fēng)機(jī)容量和風(fēng)電場(chǎng)規(guī)模不斷擴(kuò)大,風(fēng)電需求與占比日漸增加的同時(shí),也產(chǎn)生了諸多問(wèn)題[1]。由于風(fēng)力發(fā)電本身具有波動(dòng)性、間歇性和不穩(wěn)定性等特點(diǎn),在電網(wǎng)的計(jì)劃和調(diào)度上,風(fēng)電長(zhǎng)期面臨著諸多困難。為了提高電網(wǎng)運(yùn)行的安全性、穩(wěn)定性、經(jīng)濟(jì)性,使電網(wǎng)調(diào)度更加合理,需要進(jìn)行風(fēng)電功率預(yù)測(cè),進(jìn)而建立起準(zhǔn)確有效、功能完備的風(fēng)電預(yù)測(cè)系統(tǒng)[2-3]。
目前國(guó)內(nèi)外的風(fēng)電功率預(yù)測(cè)方法主要有物理方法、統(tǒng)計(jì)方法、人工智能方法。物理方法指利用數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)獲取氣象數(shù)據(jù),根據(jù)風(fēng)電場(chǎng)功率曲線(xiàn),綜合考慮風(fēng)電場(chǎng)周?chē)雀呔€(xiàn)、粗糙度、障礙物等信息進(jìn)行預(yù)測(cè)[4]。雖然不需要大量歷史數(shù)據(jù),但由于NWP更新頻率較低且耗費(fèi)大量計(jì)算資源,故不適合用于短期及超短期預(yù)測(cè)[5]。統(tǒng)計(jì)方法根據(jù)輸入的歷史數(shù)據(jù)、NWP等建立與風(fēng)電輸出功率的映射關(guān)系,搭建模型多為線(xiàn)性模型,包括卡爾曼濾波法[6]、時(shí)間序列法[7]、灰色預(yù)測(cè)法[8]等。這些模型計(jì)算速度快,短期預(yù)測(cè)性能好,但使用信息單一,模型簡(jiǎn)單,不能很好地應(yīng)對(duì)突變情況,且不適合非線(xiàn)性較強(qiáng)數(shù)據(jù)的預(yù)測(cè)。人工智能方法通過(guò)對(duì)大量的歷史數(shù)據(jù)進(jìn)行學(xué)習(xí)、訓(xùn)練,能更準(zhǔn)確地?cái)M合出輸入數(shù)據(jù)與輸出功率之間的非線(xiàn)性關(guān)系。通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解將風(fēng)速分解為一系列更具規(guī)律性和平穩(wěn)性的數(shù)據(jù)序列,再構(gòu)建對(duì)應(yīng)的支持向量機(jī)(Support Vector Machine,SVM)模型,從而提高了短期預(yù)測(cè)的精度[9]。利用注意力模型對(duì)長(zhǎng)短期記憶網(wǎng)絡(luò)(Long-term and Short-Term Memory,LSTM)各個(gè)特征向量的權(quán)重進(jìn)行,相較于傳統(tǒng)LSTM 顯著提高了預(yù)測(cè)精度。薛陽(yáng)等人[10]為減少模型輸出量,將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和門(mén)循環(huán)單元(Gate Recurrent Unit,GRU)相結(jié)合,得到超短期風(fēng)電功率預(yù)測(cè)結(jié)果,有效解決了梯度爆炸的問(wèn)題[11]。
考慮到時(shí)間卷積網(wǎng)絡(luò)(Temporal Convolutional Network,TCN)具有穩(wěn)定的梯度、可變長(zhǎng)度輸入等優(yōu)點(diǎn),本文基于TCN來(lái)挖掘歷史風(fēng)電數(shù)據(jù)與風(fēng)電輸出功率之間的規(guī)律,預(yù)測(cè)未來(lái)的風(fēng)電功率并通過(guò)改變預(yù)測(cè)時(shí)間節(jié)點(diǎn)來(lái)比較不同預(yù)測(cè)時(shí)間節(jié)點(diǎn)模型的精確度[12]。
TCN 是一種新型的時(shí)間卷積網(wǎng)絡(luò),可用于解決時(shí)間序列預(yù)測(cè)問(wèn)題,由Lea等人于2016年首次提出,通常涉及兩個(gè)步驟:首先,使用CNN 編碼時(shí)空信息來(lái)計(jì)算相關(guān)的低級(jí)特征;其次,將這些低級(jí)特征輸入分類(lèi)器中,使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)收集高級(jí)時(shí)間信息。
TCN 中采用的膨脹卷積結(jié)構(gòu),如圖1 所示。因果卷積層實(shí)現(xiàn)了只使用當(dāng)前和過(guò)去的樣本計(jì)算t時(shí)刻的輸出。另外,為了解決梯度消失等問(wèn)題,采用拓展卷積層,在獲得足夠大的感受野時(shí)盡可能減少卷積層數(shù),從而減少計(jì)算量。其中一維輸入向量xi的第n個(gè)元素處的膨脹卷積計(jì)算式(1)如下:
圖1 膨脹卷積原理圖
式(1)中:q∈0,1,…,k-1為過(guò)濾器,d為膨脹因子,k為過(guò)濾器的大小。
TCN 的殘差連接結(jié)構(gòu)和擴(kuò)展因果卷積結(jié)構(gòu)如圖2所示,殘差連接結(jié)構(gòu)由兩個(gè)相同的連續(xù)部分組成,其結(jié)構(gòu)按照膨脹因果卷積、權(quán)值規(guī)一化、激活函數(shù)和隨機(jī)失活排列的順序構(gòu)成。數(shù)據(jù)輸入1×1 卷積層以保證輸入和輸出寬度相同,并通過(guò)膨脹卷積、權(quán)值規(guī)范化、激活函數(shù)和隨機(jī)失活結(jié)構(gòu)進(jìn)行兩次輸出。
圖2 殘差連接結(jié)構(gòu)和擴(kuò)展因果卷積結(jié)構(gòu)
2.1.1 數(shù)據(jù)集的劃分
在使用數(shù)據(jù)集訓(xùn)練模型之前,還需要按照a:b:c的比例將數(shù)據(jù)集劃分成3 個(gè)部分:訓(xùn)練集(Tr)、驗(yàn)證集(Va)和測(cè)試集(Te)。其中,訓(xùn)練集用于更新模型中的權(quán)重參數(shù)。驗(yàn)證集通常是從訓(xùn)練集中提取出的一部分,作用是在模型訓(xùn)練的每個(gè)迭代過(guò)程中驗(yàn)證當(dāng)前模型的參數(shù)優(yōu)化程度,也是選擇最優(yōu)模型的重要基礎(chǔ)。測(cè)試集是用于評(píng)估最終模型性能的數(shù)據(jù),不參與模型的訓(xùn)練過(guò)程。
2.1.2 數(shù)據(jù)清洗
數(shù)據(jù)清洗是不可或缺的重要環(huán)節(jié),其結(jié)果決定了數(shù)據(jù)分析的準(zhǔn)確性,這直接影響到模型的訓(xùn)練效果。風(fēng)電功率數(shù)據(jù)具有較強(qiáng)的隨機(jī)性和波動(dòng)性,為了盡可能挖掘訓(xùn)練數(shù)據(jù)中隱藏的變化規(guī)律,本文采用基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)填充法和刪除法對(duì)數(shù)據(jù)集進(jìn)行初步處理,將所有負(fù)值設(shè)置為0,刪除其值超出正常范圍的數(shù)據(jù),并用線(xiàn)性插值方法填充數(shù)據(jù)中的缺失點(diǎn)。如果在連續(xù)的長(zhǎng)時(shí)間內(nèi)存在缺失點(diǎn),則直接舍棄該時(shí)間段內(nèi)的數(shù)據(jù),以保持?jǐn)?shù)據(jù)集的時(shí)間連續(xù)性和完整性。
2.1.3 數(shù)據(jù)歸一化
通常從風(fēng)電場(chǎng)收集的信息包括參數(shù)信息的不同方面,如風(fēng)力資源、氣象條件和風(fēng)力渦輪機(jī)輸出。由于數(shù)據(jù)集中包含了各種物理量,且數(shù)據(jù)的單位和量級(jí)均不同。例如:風(fēng)力渦輪機(jī)上的傳感器測(cè)量的風(fēng)速以米/秒(m/s)為單位,而風(fēng)電場(chǎng)的輸出功率通常以兆瓦(MW)為單位。因此,在輸入到網(wǎng)絡(luò)模型之前,數(shù)據(jù)集需要進(jìn)行歸一化。數(shù)據(jù)歸一化是數(shù)據(jù)分析中最常見(jiàn)的操作,主要思想是通過(guò)數(shù)學(xué)公式將有量綱表達(dá)式轉(zhuǎn)換為無(wú)量綱表達(dá)式,這可以防止不同的特征維數(shù)和數(shù)量級(jí)對(duì)計(jì)算產(chǎn)生不利影響,并有助于提高模型的收斂速度。
本文采用數(shù)據(jù)歸一化中的最值歸一化(Min-Max Normalization)對(duì)其進(jìn)行處理,將所有的特征數(shù)據(jù)值都映射到[0,1]這個(gè)區(qū)間內(nèi),具體公式為
式(2)中:xmax和xmin是指要?dú)w一化數(shù)據(jù)的最大值和最小值,x為特征數(shù)據(jù)的實(shí)際值;xstd為經(jīng)歸一化后得到的特征值。
本實(shí)驗(yàn)采用均方根誤差(RMSE)來(lái)表征預(yù)測(cè)精度,如式(3)所示。
式(3)中:n為訓(xùn)練或測(cè)試樣本的數(shù)目;?i為預(yù)測(cè)功率值;yi為真實(shí)功率值。
基于預(yù)處理之后的數(shù)據(jù)集,把訓(xùn)練集(Tr)的數(shù)據(jù)輸入網(wǎng)絡(luò)進(jìn)行模型的訓(xùn)練,再把驗(yàn)證集(Va)的數(shù)據(jù)帶入模型進(jìn)行驗(yàn)證,同時(shí)記錄每輪迭代的訓(xùn)練集損失函數(shù)值和驗(yàn)證集訓(xùn)練損失函數(shù)值。若滿(mǎn)足早退條件,則保存此時(shí)模型為最優(yōu)模型。將測(cè)試集(Te)的數(shù)據(jù)帶入最優(yōu)模型得到RMSE的值,否則,進(jìn)行下一輪循環(huán)迭代,直至滿(mǎn)足早退條件或者達(dá)到循環(huán)設(shè)定的次數(shù)。建模過(guò)程如圖3所示。
圖3 建模流程圖
本文取自L(fǎng)ongyuan Power Group Corp.Ltd: SDWPF的風(fēng)電預(yù)測(cè)數(shù)據(jù)集。數(shù)據(jù)集由風(fēng)電場(chǎng)30 臺(tái)風(fēng)電渦輪機(jī)以15 min為記錄間隔連續(xù)記錄7 d的真實(shí)數(shù)據(jù),包含了風(fēng)力渦輪機(jī)ID、紀(jì)錄日、記錄創(chuàng)建時(shí)間、風(fēng)速計(jì)記錄的風(fēng)速、風(fēng)向與渦輪機(jī)艙位置之間的角度、葉片1~3的槳距角、有功功率共9個(gè)元素。將數(shù)據(jù)集中ID為105~124 的20 個(gè)渦輪機(jī)數(shù)據(jù)作為訓(xùn)練集(Tr),共11 838 組數(shù)據(jù);將ID 為124~129 的5 個(gè)渦輪機(jī)數(shù)據(jù)作為驗(yàn)證集(Va),共3 029 組數(shù)據(jù);將ID 為130~134 的5 個(gè)渦輪機(jī)數(shù)據(jù)作為測(cè)試集(Te),共3 106組數(shù)據(jù)。
本實(shí)驗(yàn)選用的時(shí)間步長(zhǎng)(timestep)為32,訓(xùn)練的數(shù)據(jù)個(gè)數(shù)(batch_size)為32,學(xué)習(xí)率(learning_rate)為0.001,循環(huán)迭代次數(shù)(epoch)為100,時(shí)間卷積層數(shù)為3,用4倍預(yù)測(cè)結(jié)果的預(yù)測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),即4 組數(shù)據(jù)預(yù)測(cè)未來(lái)一個(gè)點(diǎn),以此類(lèi)推。任意選取測(cè)試集中的某段時(shí)刻,對(duì)未來(lái)的1個(gè)點(diǎn)、4個(gè)點(diǎn)和16個(gè)點(diǎn)的風(fēng)功率進(jìn)行預(yù)測(cè),預(yù)測(cè)曲線(xiàn)如圖4所示。其中:實(shí)線(xiàn)為真實(shí)功率,劃線(xiàn)為預(yù)測(cè)未來(lái)1個(gè)點(diǎn)的預(yù)測(cè)功率,點(diǎn)-劃線(xiàn)為預(yù)測(cè)未來(lái)4個(gè)點(diǎn)的預(yù)測(cè)功率,點(diǎn)線(xiàn)為預(yù)測(cè)未來(lái)16 個(gè)點(diǎn)的預(yù)測(cè)功率。劃線(xiàn)和點(diǎn)-劃線(xiàn)采取滾動(dòng)預(yù)測(cè)的方法取得未來(lái)16個(gè)點(diǎn)的預(yù)測(cè)值。從圖中可以看出劃線(xiàn)與實(shí)線(xiàn)的貼合程度最好,點(diǎn)-劃線(xiàn)程度次之,點(diǎn)線(xiàn)程度最差,且在預(yù)測(cè)8個(gè)點(diǎn)之后的曲線(xiàn)偏離情況愈加嚴(yán)重。
圖4 多時(shí)間尺度風(fēng)電功率預(yù)測(cè)曲線(xiàn)圖
整個(gè)測(cè)試集預(yù)測(cè)結(jié)果的性能指標(biāo)如表1所示。
表1 預(yù)測(cè)結(jié)果的RMSE (單位:MW)
由表中數(shù)據(jù)可知,基于本文建立的預(yù)測(cè)模型,能夠?qū)︼L(fēng)力渦輪機(jī)的發(fā)電功率進(jìn)行準(zhǔn)確預(yù)測(cè),并隨著預(yù)測(cè)結(jié)果個(gè)數(shù)的增加,預(yù)測(cè)值與真實(shí)值的均方根誤差增大,預(yù)測(cè)精度降低。
本文提出了一種基于TCN模型的風(fēng)力渦輪機(jī)發(fā)電功率預(yù)測(cè)方法。通過(guò)選取與功率相關(guān)的特征作為網(wǎng)絡(luò)輸入,實(shí)現(xiàn)不同時(shí)間尺度的功率預(yù)測(cè)。本文研究?jī)?nèi)容不僅為超短期風(fēng)電功率預(yù)測(cè)選取不同的時(shí)間尺度提供了參考依據(jù),而且對(duì)于研究電力系統(tǒng)領(lǐng)域中其他預(yù)測(cè)問(wèn)題如光伏發(fā)電、潮汐發(fā)電功率預(yù)測(cè)等提供了借鑒意義。