我國(guó)水力發(fā)電站數(shù)量眾多,基本上屬于無調(diào)節(jié)能力的徑流式水電站,這種水電站具有明顯的特殊性[1],而河川徑流是由降雨形成,降雨又受到地理、氣候等不確定因素的影響,因此對(duì)水力發(fā)電站的水流量以及發(fā)電量進(jìn)行預(yù)測(cè)很有必要。水電站的主要運(yùn)行經(jīng)濟(jì)指標(biāo)是電量,其中水流量的多少將直接影響水電站的蓄水、棄水以及發(fā)電量。因此準(zhǔn)確預(yù)測(cè)出發(fā)電站的出水量的多少,將會(huì)對(duì)發(fā)電站的經(jīng)濟(jì)指標(biāo)產(chǎn)生很大影響,準(zhǔn)確的水位預(yù)測(cè)是水電站安全運(yùn)行和增發(fā)效益的關(guān)鍵。但受諸多因素的影響,水量預(yù)測(cè)常與實(shí)際情況發(fā)生較大偏差,導(dǎo)致發(fā)電計(jì)劃頻繁修改,不利于水電站安全、高效、穩(wěn)定地運(yùn)行。
大量學(xué)者針對(duì)水電站的水流量預(yù)測(cè)和發(fā)展預(yù)測(cè)提出了諸多方法。最早采取的是比較直觀也最為簡(jiǎn)單的回歸分析[2],后來隨著信息技術(shù)的發(fā)展,為了追求更精準(zhǔn)的預(yù)測(cè),有學(xué)者相繼提出了時(shí)間序列法、頻譜分析法以及隨機(jī)微分方程[3]。近年來灰色系統(tǒng)理論、神經(jīng)網(wǎng)絡(luò)理論等在水流量預(yù)測(cè)中都得到了應(yīng)用[4]。本文對(duì)華能旗下三個(gè)分別位于上、中、下游的水牛家、自一里、木座發(fā)電站收集了相關(guān)歷史時(shí)間序列數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行一定預(yù)處理之后,采取了三個(gè)預(yù)測(cè)模型分別對(duì)其水流量和發(fā)電量進(jìn)行預(yù)測(cè),并對(duì)其預(yù)測(cè)結(jié)果進(jìn)行比較,從而確定最優(yōu)預(yù)測(cè)模型。
本文選取了水電站數(shù)據(jù)中的水牛家(裝機(jī)容量70MW)、自一里(裝機(jī)容量130MW)、木座(裝機(jī)容量100MW)三個(gè)水電站進(jìn)行屬性分析,通過建立時(shí)間序列預(yù)測(cè)模型,預(yù)測(cè)這三個(gè)水電站的發(fā)電量和來水量。通過對(duì)水電站的歷史數(shù)據(jù)進(jìn)行分析之后發(fā)現(xiàn),三個(gè)水電站的發(fā)電量和水流量數(shù)據(jù)缺失率低,僅自一里水電站的發(fā)電量參數(shù)有一個(gè)缺失值。其中E_AMOUNT為每天的發(fā)電量,W_AMOUNT為每天的水流量,選擇完整數(shù)據(jù)集2008~2018年,并且對(duì)2018年進(jìn)行預(yù)測(cè),2008~2017年數(shù)據(jù)為訓(xùn)練集。對(duì)收集到的數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)(表1)。
表1 水電站數(shù)據(jù)描述性統(tǒng)計(jì)
時(shí)間序列指的是按照時(shí)間順序的一組數(shù)列,時(shí)間序列分析(Time-Series Analysis)是指將原來的數(shù)據(jù)分解為四部分來看——趨勢(shì)、周期、時(shí)期和不穩(wěn)定因素,然后綜合這些因素提出預(yù)測(cè)[5]。對(duì)收集到的水電站的時(shí)間序列數(shù)據(jù)進(jìn)行處理以便后續(xù)的模型分析(圖1、2)。
圖1 E_AMOUNT 原始時(shí)間序列圖
圖2 W_AMOUNT 原始時(shí)間序列圖
從原始的時(shí)間序列來看,三個(gè)水電站數(shù)據(jù)的時(shí)間跨度有重合的。通過對(duì)數(shù)據(jù)樣本進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)完整年數(shù)據(jù)總共10年(2008~2018年),訓(xùn)練數(shù)據(jù)選擇2008~2017年9年的數(shù)據(jù),同過機(jī)器學(xué)習(xí)算法進(jìn)行預(yù)測(cè)建模,選擇最后一年2018年數(shù)據(jù)進(jìn)行預(yù)測(cè)模型測(cè)試。另外,從序列圖中可以發(fā)現(xiàn)W_AMOUNT參數(shù)存在較多的異常值。在對(duì)數(shù)據(jù)的時(shí)間序列進(jìn)行分析預(yù)測(cè)的時(shí)候,數(shù)據(jù)相對(duì)越平穩(wěn)越好,剔除掉異常值就是減少特殊狀況對(duì)數(shù)據(jù)的影響,從而使得最終預(yù)測(cè)結(jié)果越準(zhǔn)確。異常值采取先刪除,后插補(bǔ)的方式進(jìn)行處理。
本主要數(shù)據(jù)預(yù)處理和預(yù)測(cè)建模流程如圖3,后續(xù)模型的預(yù)測(cè)選擇了三個(gè)水電站從2008~2018年的完整數(shù)據(jù)集,并且取2008~2017年為訓(xùn)練集、2018為預(yù)測(cè)集進(jìn)行模型的檢驗(yàn),其中作為訓(xùn)練集的三個(gè)水電站各3653條數(shù)據(jù),合計(jì)共10959條數(shù)據(jù)。
堅(jiān)持模型(persistent model)基本思路是把時(shí)間序列前一時(shí)刻的值作為當(dāng)前時(shí)刻的預(yù)測(cè)值,堅(jiān)持型模型作為最簡(jiǎn)單的預(yù)測(cè)模型可以作為基準(zhǔn)線,與其他預(yù)測(cè)算法比較準(zhǔn)確率,從而證明其他算法存在的必要性。運(yùn)用堅(jiān)持模型對(duì)水量和發(fā)電量的預(yù)測(cè)如圖4、5所示,文中僅以自一里水電站為例。
圖3 數(shù)據(jù)預(yù)測(cè)流程圖
圖4 自一里電量持續(xù)模型時(shí)間序列預(yù)測(cè)圖
圖5 自一里水流量持續(xù)模型時(shí)間序列預(yù)測(cè)圖
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型。LSTM(Long Short Term Memory Network)長(zhǎng)短期記憶網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),解決長(zhǎng)時(shí)間序列訓(xùn)練過程中的梯度消失和梯度爆炸問題,在時(shí)間序列預(yù)測(cè)問題上面有廣泛的應(yīng)用[6]。所有的RNN 都具有一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)叫问?。在?biāo)準(zhǔn)RNN 中這個(gè)重復(fù)的結(jié)構(gòu)模塊只有一個(gè)非常簡(jiǎn)單的結(jié)構(gòu),例如一個(gè)tanh 層。LSTM 同樣是這樣的結(jié)構(gòu),但是重復(fù)的模塊擁有一個(gè)不同的結(jié)構(gòu)。不同于單一神經(jīng)網(wǎng)絡(luò)層,LSTM 有四個(gè),以一種非常特殊的方式進(jìn)行交互。從表2結(jié)果來看E_AMOUNT的預(yù)測(cè)誤差較大,W_AMOUNT 預(yù)測(cè)誤差較小。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)或超限學(xué)習(xí)機(jī)是一類基于前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neuron Network,FNN)構(gòu)建的機(jī)器學(xué)習(xí)系統(tǒng)或方法,適用于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)問題[7]。極限學(xué)習(xí)機(jī)是一種單隱層前饋神經(jīng)網(wǎng)絡(luò),隨機(jī)確定輸入權(quán)重和偏差,然后分析計(jì)算輸出權(quán)重。ELM的關(guān)鍵思想是將難以求解的非線性優(yōu)化問題,如輸入權(quán)重、隱層偏差、輸出權(quán)重的最優(yōu)化問題轉(zhuǎn)化為求解最優(yōu)輸出權(quán)重以簡(jiǎn)化運(yùn)算。而這意味著只要權(quán)重的
表2 LSTM模型誤差統(tǒng)計(jì)表
表3 ELM模型誤差分析表
圖6 X270電量ELM時(shí)間序列預(yù)測(cè)圖
圖7 X270水量ELM時(shí)間序列預(yù)測(cè)圖
標(biāo)準(zhǔn)足夠小,用戶就不必考慮所有的輸入和隱藏層權(quán)重,只需要關(guān)注輸出權(quán)重即可。這個(gè)想法和傳統(tǒng)的迭代學(xué)習(xí)方法(如梯度下降學(xué)習(xí)算法)是完全不同的。
我國(guó)水電站的數(shù)量眾多,因此對(duì)水電站的流水量和發(fā)電量進(jìn)行預(yù)測(cè),保證電力系統(tǒng)的穩(wěn)定運(yùn)行至關(guān)重要。本文通過對(duì)水電站收集相關(guān)歷史時(shí)間序列數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行一定預(yù)處理之后采用三種不同數(shù)據(jù)分析模型對(duì)其發(fā)電量和水流量進(jìn)行預(yù)測(cè),三種算法各有其優(yōu)勢(shì)所在。運(yùn)用數(shù)據(jù)分析模型可以提高對(duì)水電站的預(yù)測(cè),對(duì)水電能源的充分利用和對(duì)水電站的經(jīng)濟(jì)運(yùn)行以及設(shè)備檢修維護(hù)具有重要意義,該研究方法還可以用于電力系統(tǒng)短期負(fù)荷預(yù)報(bào)具有廣闊的應(yīng)用前景及實(shí)用價(jià)值。