趙 鑫,陳臣鵬,畢貴紅,陳仕龍,謝 旭
(昆明理工大學(xué) 電力工程學(xué)院,云南 昆明 650500)
“十四五”規(guī)劃指出,二氧化碳排放力爭2030 年前實現(xiàn)“碳達峰”,努力爭取2060 年前實現(xiàn)“碳中和”?!笆奈濉逼陂g將出臺更加強有力的碳排放交易政策,加強對煤炭消費的控制,加大對可再生能源發(fā)展的支持力度,繼續(xù)推動經(jīng)濟社會加速向低碳方向轉(zhuǎn)型,為“碳中和”奠定基礎(chǔ)[1]。過去20 年,我國的二氧化碳排放增速是世界其他國家和地區(qū)的6 倍,在全球二氧化碳排放增量中約占70%;2020 年以來,我國人均二氧化碳排放量已超過歐盟;引入碳交易機制、降低碳排放強度已成為當(dāng)前的緊迫任務(wù)[2]。為了減少碳排放,作為應(yīng)對氣候變化、降低碳排放、履行國際減排承諾的重要手段,我國于2017 年12 月啟動了7 個全國統(tǒng)一的碳排放權(quán)交易市場。
影響碳產(chǎn)品交易價格的因素主要包含政策因素、供求因素和氣候、能源價格和宏觀經(jīng)濟環(huán)境等因素。文獻[3]通過參數(shù)檢驗法得出:有效的市場試點及政策實施會減少碳交易價格的波動性和非平穩(wěn)性。碳交易價格是提高碳市場風(fēng)險管理能力的基礎(chǔ),也是制定碳交易市場政策的重要依據(jù);因此尋求一種能有效提取碳交易價格的波動特征并對其進行較為準(zhǔn)確地預(yù)測的方法十分重要。
傳統(tǒng)的統(tǒng)計和計量預(yù)測模型,如GED-GARCH域[4]、改進的Grey-Markov[5]等,對非線性數(shù)據(jù)的處理能力較差。為了解決這個問題,提出了基于機器學(xué)習(xí)的預(yù)測方法,如ARIMA-SVM[6]、BP[7]等。與傳統(tǒng)方法相比,機器學(xué)習(xí)預(yù)測方法可以更好地處理非線性數(shù)據(jù),能有效地提高預(yù)測精度。為了更進一步捕獲時間序列的深度特征和波動規(guī)律,人們又將時間序列進行多尺度分解,得到代表原始序列的多尺度特征;然后選擇合適的預(yù)測模型分別預(yù)測各子序列;最后用特定的方法將各子序列預(yù)測值合并得到最終預(yù)測值。實驗證明,該方法具有更高的預(yù)測精度[8-10]。
由于歷史碳價序列具有較強的非線性和非平穩(wěn)性,若采用傳統(tǒng)數(shù)學(xué)計量與機器學(xué)習(xí)方法對其進行預(yù)測,則對碳價序列的特征提取能力較差,預(yù)測效果一般。因此為了進一步降低各模態(tài)耦合的非線性與非平穩(wěn)性對預(yù)測準(zhǔn)確率的影響,充分提取碳價序列的多尺度特征,本文提出一種多模式分解、樣本熵重構(gòu)和WOA-LSTM 組合的預(yù)測模型。首先,用奇異譜分解(singular spectrum decomposition,SSD)、變分模態(tài)分解(variational modal decomposition,VMD)以及完全集合經(jīng)驗?zāi)B(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)這3 種方法分別分解原始碳價序列,實現(xiàn)不同模式模態(tài)分量規(guī)律的互補;然后,使用樣本熵對熵值接近的模態(tài)分量進行重構(gòu),以減少分量數(shù),提高預(yù)測效率;最后,分別將各重構(gòu)分量輸入到WOA-LSTM 預(yù)測模型中進行預(yù)測,得到3 個初始預(yù)測值,再由最優(yōu)加權(quán)組合法將3 個初始預(yù)測值線性組合得到最終的預(yù)測值。
1.1.1 奇異譜分解
奇異譜分解(SSD)能自適應(yīng)選取嵌入維數(shù)L,克服了奇異譜分析(SSA)按經(jīng)驗手動選取L的缺陷。SSD 的實現(xiàn)步驟包括:創(chuàng)建軌跡矩陣、自適應(yīng)選取嵌入維數(shù)L、從高頻分量到低頻分量依次重構(gòu)得到SSC 分量、設(shè)置迭代停止條件(當(dāng)殘余項和原始信號間的歸一化方差小于給定閾值時停止迭代,分解完成)。具體實現(xiàn)步驟詳見文獻[11]。
1.1.2 變分模態(tài)分解
變分模態(tài)分解(VMD)是一種自適應(yīng)、完全非遞歸的模態(tài)變分和信號處理的方法。VMD 可以根據(jù)待分解的序列自適應(yīng)地確定模態(tài)分解的個數(shù),從而自適應(yīng)地匹配每種模態(tài)的最佳中心頻率和有限帶寬。VMD 克服了經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)存在端點效應(yīng)和模態(tài)分量混疊的問題,可以更好地降低時間序列的非平穩(wěn)性和復(fù)雜度。通過VMD,可以得到多個頻率尺度不同且相對平穩(wěn)的子序列。VMD 的核心思想是構(gòu)建和求解變分問題,具體實現(xiàn)步驟詳見文獻[12]。
1.1.3 完全集合經(jīng)驗?zāi)B(tài)分解
為了解決EMD 分解信號出現(xiàn)模態(tài)混疊的現(xiàn)象,提出了集合經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)和互補集成經(jīng)驗?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD),兩者通過在待分解的序列中加入成對正負高斯白噪聲減輕EMD 存在的模態(tài)混疊現(xiàn)象。EEMD 和CEEMD 分解得到的模態(tài)分量中總會殘留一定的白噪聲,進而影響后續(xù)信號的分析和處理。為了解決這些問題,文獻[13]提出了一種基于這2 種分解方法的改進算法——完全自適應(yīng)噪聲集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN),又稱完全集合經(jīng)驗?zāi)B(tài)分解,具體實現(xiàn)步驟詳見文獻[13]。
1.1.4 樣本熵
樣本熵(SampEn)是一種體現(xiàn)信號復(fù)雜程度的優(yōu)化算法。相比近似熵,樣本熵的優(yōu)勢為:樣本熵的計算與序列維度無關(guān);參數(shù)的變化對樣本熵的影響程度是一致的,即一致性較好。樣本熵值相近的信號,即復(fù)雜程度接近的信號可合并為一個分量,起到了降低計算量、簡化模型的作用[14]。
1.2.1 長短期記憶神經(jīng)網(wǎng)絡(luò)
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。LSTM 有效消除了RNN在處理長時間序列時出現(xiàn)梯度爆炸或消失的弊端[15]。LSTM 由許多記憶塊構(gòu)成,每個記憶塊由輸入門、輸出門和遺忘門組成,三者功能如下。
(1)遺忘門決定信息的更新。
式中:Wf、bf分別為遺忘門sigmoid 激活函數(shù)的權(quán)重與偏置。
(2)輸入門決定當(dāng)前信息的輸入。
式中:Wi、bi分別為輸入門sigmoid 激活函數(shù)的權(quán)重與偏置;WC、bC分別為輸入門tanh 激活函數(shù)的權(quán)重與偏置;Ct為新細胞狀態(tài)信息。
(3)輸出門決定下一隱藏層的值。
式中:Wo,bo分別為輸出門sigmoid 激活函數(shù)的權(quán)重與偏置。
1.2.2 鯨魚優(yōu)化算法(WOA)
鯨魚優(yōu)化算法的主要原理是模擬座頭鯨的隨機捕食行為。鯨魚優(yōu)化算法具有全局搜索能力強、計算簡單、參數(shù)少等優(yōu)點,其主要實現(xiàn)步驟如下[16]。
步驟1:尋找獵物。鯨魚第i次搜索行為可用式(4)表示:
式中:xrand為鯨魚群中某個鯨魚的位置;i,L分別為當(dāng)前迭代次數(shù)和總的迭代次數(shù);A,c為系數(shù);當(dāng)|A|≤1 時,鎖定獵物,進入包圍獵物階段。
步驟2:包圍獵物。鯨魚向最佳獵物的方向更新位置,通過更新位置包圍獵物,最終確定獵物的位置。這一行為可由式(5)表示。
在式(5)中,x(i+1)由x(i)向x*(i)更新,逐步包圍獵物。
步驟3:狩獵。計算鯨魚與獵物之間的距離D2,通過式(6)模仿座頭鯨的螺旋狀移動。
式中:b為常數(shù),定義對數(shù)螺線的形狀;l?[–1,1]。鯨魚群通過隨機選擇以下2 種方式(概率均為0.5)進行狩獵,可用式(7)表示。
式中:當(dāng)p<0.5 時,為收縮包圍式狩獵方式;當(dāng)p≥0.5 時,氣泡網(wǎng)螺旋式狩獵方式。
1.2.3 WOA-LSTM 預(yù)測模型
為降低人工調(diào)參的隨機性,提高預(yù)測精度,采用鯨魚優(yōu)化算法對LSTM 網(wǎng)絡(luò)進行優(yōu)化。將LSTM 網(wǎng)絡(luò)的迭代次數(shù)l、學(xué)習(xí)率e、第一層隱藏節(jié)點數(shù)a1和第二層隱藏節(jié)點數(shù)a2作為WOA 的尋優(yōu)對象,以獲取最佳超參數(shù)[17-18]。WOA-LSTM 模型主要流程如下。
步驟1:將數(shù)據(jù)劃分為訓(xùn)練集與測試集。初始化鯨魚優(yōu)化算法的維度、迭代次數(shù)以及種群數(shù)。設(shè)定LSTM 網(wǎng)絡(luò)各超參數(shù)的數(shù)值范圍。
步驟2:隨機生成10 個鯨魚群,并用對應(yīng)的參數(shù)設(shè)置長短期記憶網(wǎng)絡(luò)。
步驟3:將模型的預(yù)測值與真實值的均方根誤差作為適應(yīng)度,計算每個種群對應(yīng)的適應(yīng)度。把其中最小適應(yīng)度對應(yīng)的結(jié)果作為此次的最優(yōu)結(jié)果,并與全局最優(yōu)結(jié)果進行比較。如效果更好,則替換。
步驟4:迭代開始。用WOA 不斷更新鯨魚群對應(yīng)的4 個超參數(shù);重復(fù)步驟3—4,直到所有迭代完成。
步驟5:輸出最優(yōu)結(jié)果對應(yīng)的各個超參數(shù),將輸出的超參數(shù)帶入LSTM 模型中進行預(yù)測。
1.2.4 最優(yōu)加權(quán)組合法
在分別采用 SSD-LSTM、VMD-LSTM 和CEEMDAN-LSTM 模型得到初始預(yù)測值后,為確定合適的權(quán)重使3 個預(yù)測值進行線性結(jié)合,采用最優(yōu)加權(quán)法計算權(quán)重系數(shù)。具體步驟如下[19]。
步驟1:計算得到誤差矩陣E。
式中:N為預(yù)測總時間;et_ssd,et_vmd,et_ceemdan分別為3 個模型在時刻t的預(yù)測值與真實值的誤差。步驟2:由拉格朗日乘子法得到最優(yōu)權(quán)重。
式中:ω1,ω2,ω3(ω1+ω2+ω3=1)分別為3 個模型預(yù)測值的權(quán)重系數(shù);R為三維單位列向量。
步驟3:得出最終的碳價預(yù)測結(jié)果如式(10)所示:
為提高碳交易價格的預(yù)測準(zhǔn)確率,提出一種基于多模式分解、樣本熵重構(gòu)與WOA-LSTM 的組合預(yù)測方法。該方法運算步驟如圖1 所示。
圖1 組合預(yù)測模型運算流程Fig.1 Operation process of combined prediction model
(1)數(shù)據(jù)預(yù)處理:由SSD、VMD 和CEEMDAN分解歷史碳價序列各得到x個分量,其中,包括x–1 個模態(tài)分量和1 個殘余分量Ri(i=1,2,3),Ri由原始序列減去x–1 個模態(tài)分量之和得到。
(2)分量重構(gòu):多模式分解得到的模態(tài)分量數(shù)量較多,分別預(yù)測計算量較大。為了簡化模型,減小預(yù)測難度,通過計算各模態(tài)分量的樣本熵值,將熵值接近的分量重構(gòu)為1 個新分量,再將各重構(gòu)分量分別輸入到WOA-LSTM 網(wǎng)絡(luò)中進行預(yù)測。
(3)一次預(yù)測:將各重構(gòu)分量對應(yīng)的預(yù)測值直接相加,得到3 個模型對應(yīng)的初始預(yù)測值。
(4)二次預(yù)測:使用最優(yōu)加權(quán)法計算出3 個初始預(yù)測值對應(yīng)的最佳權(quán)重系數(shù),根據(jù)權(quán)重系數(shù)對3 個初始預(yù)測值進行線性組合得出最終的預(yù)測結(jié)果。
為了評估預(yù)測結(jié)果的有效性,使用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)以及均方根誤差(RMSE)對實驗預(yù)測結(jié)果進行評估。3 種誤差的計算公式如式(11)所示:
式中:Zt為t時刻碳價真實值;為t時刻碳價預(yù)測值;為碳價真實值的平均值。
本文實驗數(shù)據(jù)來源于某省碳排放交易所的歷史碳交易價格數(shù)據(jù)。選用2013 年12 月19 日—2021 年10 月25 日的共1 635 個價格數(shù)據(jù)(不包括公共假日)作為實驗的原始數(shù)據(jù)集。將數(shù)據(jù)集的前95%作為訓(xùn)練集,后5%作為測試集。對2021 年7 月7 日—2021 年10 月25 日(共76 天)進行碳交易價格預(yù)測。交易所的歷史碳交易價格如圖2 所示。
圖2 歷史碳交易價格Fig.2 Historical carbon trading prices
使用SSD、VMD 和CEEMDAN 算法分解原始數(shù)據(jù)。由3 種分解算法分別得到8 個分量(7 個模態(tài)分量和1 個殘余分量)。分解結(jié)果如圖3 所示。
圖3 各分解算法的分解結(jié)果Fig.3 Decomposition results of each decomposition algorithm
圖3(a)中,SSC 分量按高頻到低頻排列,R1 為殘余分量;圖3(b)中,IMF 分量按低頻到高頻排列,R2 為殘余分量;圖3(c)中,imf 分量按高頻到低頻排列,R3 為殘余分量。
使用樣本熵法重構(gòu)分量,以減少分量數(shù)。圖4示出各分解方法模態(tài)分量的樣本熵值。對各分解方法得到的模態(tài)分量分別進行重構(gòu),重構(gòu)結(jié)果如表1。
圖4 各分量算法對應(yīng)的熵值Fig.4 Entropy value corresponding to each component algorithm
表1 重構(gòu)結(jié)果Tab.1 Reconstruction results
對于重構(gòu)得到的3 組分量(A1—A4,B1—B4,C1—C4),分別使用WOA-LSTM 網(wǎng)絡(luò)進行預(yù)測,然后分別疊加各組分量的預(yù)測值,得到3 組初始預(yù)測值;根據(jù)最佳加權(quán)組合法計算各預(yù)測值對應(yīng)的權(quán)重系數(shù),再由權(quán)重系數(shù)將3 組預(yù)測值線性組合為最終的碳交易價格預(yù)測值。實驗構(gòu)建的預(yù)測網(wǎng)絡(luò)共4 層,包括輸入層、2 層LSTM 和輸出層;其中,輸入層輸入前5 天的數(shù)據(jù),輸出層輸出第6天的預(yù)測值,損失函數(shù)采用均方根誤差RMSE;鯨魚優(yōu)化算法迭代次數(shù)設(shè)為10,種群數(shù)設(shè)為10。表2 為各初始預(yù)測值對應(yīng)的權(quán)值系數(shù)。
表2 各初始預(yù)測值的權(quán)值系數(shù)Tab.2 The weight coefficient of each initial prediction value
為了驗證本文多模式分解集成的組合模型對多尺度碳交易價格預(yù)測的有效性,采用相同的WOA-LSTM 預(yù)測網(wǎng)絡(luò),同時構(gòu)建了單模式(SSD/VMD/CEEMDAN)分解集成的組合模型。各模型預(yù)測值與真實值的對比結(jié)果如圖5 所示。對各模型的預(yù)測值與真實值之間的誤差進行比較,比較結(jié)果如表3。
圖5 不同模型預(yù)測值與真實值比較Fig.5 Comparison between predicted values with real values of different models
表3 不同模型的誤差對比Tab.3 Error comparison of different models
由圖5 和表3 可看出,相比其他單模式分解模型,本文提出的多模式分解模型的預(yù)測值與真實值的擬合性能最優(yōu),3 個誤差評價指標(biāo)相比單模式分解模型明顯降低。
與同樣以該所碳交易價格為研究對象的文獻[20-21]結(jié)果做比較,比較結(jié)果如表4。由表4 可看出,本文提出的預(yù)測模型比文獻[20-21]中的各誤差評價指標(biāo)均?。夯诙嗄J椒纸釽OA-LSTM 的組合預(yù)測模型可以得到更高的預(yù)測準(zhǔn)確率,在碳交易價格預(yù)測領(lǐng)域更具優(yōu)勢。
表4 與其他文獻對比Tab.4 Comparison with other documents
本文提出基于多模式分解WOA-LSTM 的碳交易價格預(yù)測模型,以某省碳交易價格為研究對象,通過實驗計算得到以下結(jié)論。
(1)使用SSD+VMD+CEEMDAN 的多模式方法分解原始碳交易價格序列,可以得到更能反映碳交易價格序列的深層次變化特征的多層模態(tài)分量,能充分發(fā)揮各種分解方法的優(yōu)勢,降低碳交易價格序列非線性和非平穩(wěn)性對預(yù)測準(zhǔn)確率的影響。
(2)使用樣本熵法將分解得到的分量重構(gòu)為新分量后進行預(yù)測,減少了預(yù)測分量數(shù),提高了運算效率;再引入WOA-LSTM 的組合預(yù)測網(wǎng)絡(luò),利用LSTM 時序依賴的特性對輸入向量進行擬合并輸出碳交易價格的預(yù)測值。相比其他文獻的方法,WOA-LSTM 預(yù)測模型的準(zhǔn)確率明顯提升。
碳交易價格預(yù)測的準(zhǔn)確率是提高碳市場風(fēng)險管理能力的基礎(chǔ),也是制定碳金融市場政策的重要依據(jù)。本文對某一個省的碳交易價格進行了實驗預(yù)測;該模型也可為其他7 個碳排放交易市場的碳交易價格預(yù)測提供一定的參考。