摘" 要:為確保燃煤電廠能源穩(wěn)定供應(yīng)和控制進(jìn)煤維護(hù)成本,輔助管理人員了解電煤庫(kù)存情況并采取相應(yīng)措施,需要對(duì)電廠燃煤庫(kù)存進(jìn)行短期精準(zhǔn)預(yù)測(cè)。該文提出ARIMAX-LSTM組合預(yù)測(cè)模型,ARIMAX模型用于預(yù)測(cè)原始電煤庫(kù)存時(shí)間序列中的線性成分,LSTM模型用于直接預(yù)測(cè)原始數(shù)據(jù)中的非線性成分以及ARIMAX模型預(yù)測(cè)結(jié)果與原序列之間的差值非線性成分,最后對(duì)預(yù)測(cè)結(jié)果進(jìn)行誤差補(bǔ)償。以某電廠實(shí)際庫(kù)存數(shù)據(jù)對(duì)該模型進(jìn)行驗(yàn)證,電廠燃煤10 d庫(kù)存預(yù)測(cè)的平均相對(duì)誤差為10.93%,比其中單一模型具有更高的預(yù)測(cè)精度,對(duì)電煤庫(kù)存管理具有更強(qiáng)的指導(dǎo)意義。
關(guān)鍵詞:組合預(yù)測(cè);ARIMAX模型;LSTM模型;電煤庫(kù)存;誤差補(bǔ)償
中圖分類號(hào):TM621" " " 文獻(xiàn)標(biāo)志碼:A" " " " " 文章編號(hào):2095-2945(2025)09-0033-04
Abstract: In order to ensure a stable supply of energy to coal-fired power plants and control the maintenance costs of coal-fed coal, auxiliary managers understand the thermal coal inventory situation and take corresponding measures, which requires short-term accurate predictions of coal-fired power plants. This paper proposes an ARIMAX-LSTM combined prediction model. The ARIMAX model is used to predict the linear component in the original thermal coal inventory time series, and the LSTM model is used to directly predict the nonlinear component in the original data and the nonlinear component of the difference between the ARIMAX model prediction results and the original series. Finally, the prediction results are compensated for errors. The model was verified with the actual inventory data of a power plant. The average relative error of the 10-day inventory forecast of coal in the power plant was 10.93%, which has higher prediction accuracy than the single model and has stronger guiding significance for thermal coal inventory management.
Keywords: combined forecasting; ARIMAX model; LSTM model; thermal coal inventory; error compensation
煤炭作為火力發(fā)電企業(yè)的主要發(fā)電來源,依然處于保供主力的地位[1],電煤庫(kù)存不足,可能會(huì)導(dǎo)致火電企業(yè)出現(xiàn)供電缺口,難以完成供電任務(wù),電煤庫(kù)存過剩,可能會(huì)導(dǎo)致火電企業(yè)煤炭損耗增加、發(fā)電成本上升。因此,有必要對(duì)電煤庫(kù)存進(jìn)行短期預(yù)測(cè)。當(dāng)前針對(duì)電煤庫(kù)存預(yù)測(cè)的算法主要有3類:第一類為統(tǒng)計(jì)模型,如自回歸積分滑動(dòng)平均模型(Autoregressive Integrated Moving Average Model,ARIMA)和灰色系統(tǒng)預(yù)測(cè)模型[2-4]。此類模型可解釋性強(qiáng),但對(duì)非線性、非平穩(wěn)或包含復(fù)雜規(guī)律的時(shí)間序列數(shù)據(jù)表現(xiàn)不佳,不能廣泛適用于煤炭庫(kù)存預(yù)測(cè)。第二類為機(jī)器學(xué)習(xí)模型,如隨機(jī)森林和支持向量機(jī)(Support Vector Machine,SVM),此類模型對(duì)于較小規(guī)模的數(shù)據(jù)集,容易出現(xiàn)過擬合的問題[5]。第三類為深度學(xué)習(xí)模型,如循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)、卷積神經(jīng)網(wǎng)絡(luò)等[6]。深度學(xué)習(xí)模型可解釋性差,需要足夠數(shù)據(jù),但預(yù)測(cè)精度高,泛化能力強(qiáng),是如今預(yù)測(cè)算法中的主流算法。
除此之外,還有一些其他類型的時(shí)間序列預(yù)測(cè)方法,如混合模型預(yù)測(cè)、頻域方法預(yù)測(cè)。本文結(jié)合ARIMAX的線性預(yù)測(cè)能力和LSTM的非線性信息提取能力,采用多輸入ARIMAX-LSTM組合預(yù)測(cè)模型,并將預(yù)測(cè)結(jié)果進(jìn)行比較,驗(yàn)證組合模型預(yù)測(cè)效果。
1" 算法原理
1.1" ARIMAX模型
ARIMA模型專注于單變量時(shí)間序列的預(yù)測(cè),它基于歷史數(shù)據(jù)來預(yù)測(cè)未來的趨勢(shì)。然而,當(dāng)時(shí)間序列受到其他外部因素或變量的影響時(shí),ARIMA模型由于其固有的單變量特性,可能難以全面捕捉這些復(fù)雜的交互作用,從而限制了其預(yù)測(cè)能力。因此,在考慮其他序列對(duì)時(shí)間序列的影響時(shí),ARIMA模型可以通過引入外生變量(即干預(yù)序列)進(jìn)行擴(kuò)展,從而形成了ARIMAX模型。ARIMAX模型結(jié)合外生變量與原有的自回歸、差分和滑動(dòng)平均項(xiàng),有利于提高模型的預(yù)測(cè)效果。鑒于ARIMAX模型涉及多個(gè)輸入序列,假定輸入序列為{x1t},{x2t},…,{xkt},響應(yīng)序列為{yt},即為輸出的預(yù)測(cè)序列。引入延遲算子后,這些輸入序列與響應(yīng)序列之間的數(shù)學(xué)關(guān)系可以通過特定的方程進(jìn)行表達(dá),如式(1)所示。
式中:?滋為模型常數(shù)項(xiàng)均值,對(duì)于ARIMAX模型中的第i個(gè)輸入變量;?椎i(B)為ARIMAX模型自回歸系數(shù)多項(xiàng)式;?專i(B)為ARIMAX模型滑動(dòng)平均系數(shù)多項(xiàng)式;B■為ARIMAX模型延遲階數(shù);{?著t}為模型在t時(shí)刻的回歸殘差序列。
ARIMAX模型中要求為{?著t}白噪聲序列,{?著t}可表示為
式中:?琢t為零均值白噪聲序列,所以ARIMAX模型可以表達(dá)為
同樣地,ARIMAX模型需要確定p,d和q這3個(gè)參數(shù)。此外,ARIMAX模型還需要確定外生變量的影響方式和相關(guān)參數(shù)。
1.2" LSTM模型
RNN在反向傳播時(shí),由于參數(shù)在時(shí)間步之間的共享特性以及計(jì)算梯度的多次連乘操作,往往會(huì)導(dǎo)致梯度在傳播過程中逐漸減?。刺荻认В┗蚣眲≡龃螅刺荻缺ǎSTM加入輸入門(it,Input Gate)[7],輸出門(ot,Output Gate),使得在反向傳播時(shí)大多數(shù)路徑中的乘數(shù)是1,因而保存了大多數(shù)梯度,使LSTM能夠處理長(zhǎng)時(shí)間間隔問題。但在進(jìn)行求導(dǎo)過程中有的路徑中的梯度依舊會(huì)出現(xiàn)梯度消失,為了緩解梯度消失,LSTM又加入了遺忘門(ft,F(xiàn)orget Gate)。
在LSTM的每個(gè)單元中添加一些門能夠過濾、添加或處理數(shù)據(jù),這些門實(shí)質(zhì)上是一種信息通道,控制細(xì)胞狀態(tài)中的信息流。LSTM模型的結(jié)構(gòu)如圖1所示。
1.3" Stacking融合模型
Stacking是一種集成學(xué)習(xí)方法[7],通過組合多個(gè)基本分類器或回歸器的預(yù)測(cè)結(jié)果來生成最終預(yù)測(cè)結(jié)果的技術(shù)。它的核心思想是將不同基學(xué)習(xí)器的預(yù)測(cè)結(jié)果作為新的訓(xùn)練數(shù)據(jù),進(jìn)一步訓(xùn)練一個(gè)次級(jí)學(xué)習(xí)器來進(jìn)行最終的預(yù)測(cè)。
Stacking模型首先選擇多種不同類型的基學(xué)習(xí)器,使用這些基學(xué)習(xí)器對(duì)訓(xùn)練集進(jìn)行預(yù)測(cè),得到一級(jí)預(yù)測(cè)結(jié)果。一級(jí)預(yù)測(cè)結(jié)果成為新的特征,作為次級(jí)學(xué)習(xí)器的輸入。次級(jí)學(xué)習(xí)器也被稱為元學(xué)習(xí)器,通過組合基學(xué)習(xí)器的預(yù)測(cè)來得到最終的預(yù)測(cè)結(jié)果。
2" 模型搭建
2.1" LSTM模型建立
1)數(shù)據(jù)預(yù)處理:對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理。由于電煤庫(kù)存序列與耗煤量、進(jìn)煤量數(shù)據(jù)范圍有限,且數(shù)據(jù)之間差別較大,選擇z-score標(biāo)準(zhǔn)化,具體標(biāo)準(zhǔn)化過程如公式(4)所示。
式中:xnorm為z-score標(biāo)準(zhǔn)化后的值;?滋為變量的均值;?啄為變量的標(biāo)準(zhǔn)差。
2)制作數(shù)據(jù)集:設(shè)置數(shù)據(jù)集的輸入長(zhǎng)度為50,輸出長(zhǎng)度為10,即用前50 d的庫(kù)存、進(jìn)煤、耗煤數(shù)據(jù)預(yù)測(cè)未來10 d的電煤庫(kù)存。
3)模型初始化:包括參數(shù)初始化、網(wǎng)絡(luò)結(jié)構(gòu)的具體定義,以及激活函數(shù)和損失函數(shù)的選定。本文使用2層LSTM隱藏層,2層LSTM隱藏層設(shè)置神經(jīng)元個(gè)數(shù)分別為50個(gè)和100個(gè)。在2層LSTM隱藏層之間,激活函數(shù)選擇ReLU函數(shù)。
4)模型訓(xùn)練:使用Adam算法來更新參數(shù)。
5)多步預(yù)測(cè)。
2.2" 基于Stacking方法的ARIMAX-LSTM組合模型建立
本文采用ARIMAX模型來預(yù)測(cè)電煤庫(kù)存數(shù)據(jù)中的線性成分,該模型能夠有效捕捉數(shù)據(jù)中的趨勢(shì)性和季節(jié)性特征,同時(shí)利用LSTM神經(jīng)網(wǎng)絡(luò)模型來捕捉非線性特征。考慮到線性成分由ARIMAX模型預(yù)測(cè),而除了原庫(kù)存時(shí)間序列包含的非線性成分外,ARIMAX模型預(yù)測(cè)值與初始值殘差中也存在非線性成分。構(gòu)建組合預(yù)測(cè)模型步驟如圖2所示。
具體預(yù)測(cè)步驟如下。
1)將電煤庫(kù)存時(shí)間序列、耗煤量、進(jìn)煤量序列分別輸入到改進(jìn)后的ARIMAX和LSTM模型中,輸出各自直接的預(yù)測(cè)結(jié)果。
2)將ARIMAX模型預(yù)測(cè)結(jié)果看作預(yù)測(cè)的線性成分,將其與原庫(kù)存序列相減得到非線性殘差輸入LSTM模型中,對(duì)照標(biāo)簽值為基于時(shí)間序列分解提取出的庫(kù)存序列的周期向與趨勢(shì)項(xiàng)。
3)將ARIMAX模型的庫(kù)存預(yù)測(cè)值、LSTM模型的庫(kù)存預(yù)測(cè)值、LSTM模型的非線性殘差預(yù)測(cè)值作為元模型的輸出值,也作為Stacking融合模型的輸入值,進(jìn)行二次學(xué)習(xí),最終預(yù)測(cè)值為模型輸出結(jié)果。
3" 實(shí)驗(yàn)結(jié)果與分析
3.1" LSTM模型與組合模型結(jié)果對(duì)比
基于某電廠4年日庫(kù)存、燃煤及耗煤數(shù)據(jù)進(jìn)行驗(yàn)證和分析。將前3年的電煤庫(kù)存數(shù)據(jù)作為訓(xùn)練集,預(yù)測(cè)未來一年庫(kù)存。此一年的預(yù)測(cè)數(shù)據(jù)是通過不斷移動(dòng)10個(gè)窗口大小,也就是10 d的電煤庫(kù)存數(shù)據(jù)窗口,每次預(yù)測(cè)10 d庫(kù)存數(shù)據(jù)產(chǎn)生的。通過計(jì)算36組,共360 d的庫(kù)存數(shù)據(jù),預(yù)測(cè)未來10 d庫(kù)存誤差的平均值,評(píng)價(jià)模型短期預(yù)測(cè)的平均能力,該電廠組合模型與單獨(dú)LSTM模型預(yù)測(cè)效果如圖3所示。
采用平均絕對(duì)百分比誤差(MAPE)來評(píng)價(jià)模型的預(yù)測(cè)誤差,MAPE的定義如式(5)所示。
3.2" 組合模型預(yù)測(cè)的誤差補(bǔ)償
因該電廠為沿海電廠,考慮到航海計(jì)劃,沿海地區(qū)船只到港時(shí)間可以提前預(yù)知,進(jìn)而可用此到港數(shù)據(jù)來修正實(shí)際預(yù)測(cè)結(jié)果。同時(shí)考慮到模型本身滯后性的缺陷,當(dāng)一次預(yù)測(cè)出未來10 d的電煤庫(kù)存值時(shí),計(jì)算得到此10 d預(yù)測(cè)庫(kù)存值的平均值,并與前一天真實(shí)庫(kù)存值進(jìn)行比較,通過設(shè)置一定的閾值,再次修正庫(kù)存預(yù)測(cè)結(jié)果。經(jīng)過上述過程的誤差補(bǔ)償后,電煤庫(kù)存預(yù)測(cè)的平均誤差從14.43%降至10.93%?;诮M合模型,并進(jìn)行誤差補(bǔ)償前后的預(yù)測(cè)效果如圖4所示。可以看出,經(jīng)過誤差補(bǔ)償后的預(yù)測(cè)效果又有了進(jìn)一步提高。
4" 結(jié)論
本文提出基于Stacking方法的ARIMAX-LSTM組合預(yù)測(cè)模型,對(duì)燃煤電廠電煤庫(kù)存進(jìn)行短期預(yù)測(cè)?;陔姀S數(shù)據(jù)的驗(yàn)證表明,經(jīng)過誤差補(bǔ)償后的組合模型比單獨(dú)的LSTM模型具有更高的預(yù)測(cè)準(zhǔn)確度,具有一定的應(yīng)用價(jià)值。
參考文獻(xiàn):
[1] 葉春.電煤有效供應(yīng)是電力保供的關(guān)鍵因素[J].中國(guó)電力企業(yè)管理,2023(4):26-29.
[2] 李海蓮,高雅麗,江晶晶,等.基于NAR-ARIMA組合模型的高速公路瀝青路面破損狀況預(yù)測(cè)[J].大連理工大學(xué)學(xué)報(bào),2024,64(3):307-313.
[3] AGYARE S, ODOI B, WIAH E N. Predicting petrol and diesel prices in Ghana, A comparison of ARIMA and SARIMA models[J]. Asian Journal of Economics, Business and Accounting, 2024,24(5):594-608.
[4] 殷克東,張凱,楊文棟.基于概率累加的離散GM(1,1)模型及其在海洋天然氣產(chǎn)量預(yù)測(cè)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2024,44(8):2733-2748.
[5] TANG F, WANG Z H, SUN Y, et al.Recurrent neural network for predicting absence of heterozygosity from low pass WGS with ultra-low depth[J].BMC Genomics,2024,25(1):470-479.
[6] 李浩,趙青,崔辰州,等.基于CNN與LSTM復(fù)合深度模型的恒星光譜分類算法[J].光譜學(xué)與光譜分析,2024,44(6):1668-1675.
[7] 汪撼宇.基于組合模型的燃煤電站電煤庫(kù)存短期預(yù)測(cè)方法研究[D].上海:上海大學(xué),2020.