崔樹銀,汪昕杰
(上海電力大學 經(jīng)濟與管理學院,上海 200090)
能源是人類社會發(fā)展的關鍵因素。據(jù)預測,2030年能源需求將增長50%以上[1]。在傳統(tǒng)能源子系統(tǒng)單一運行模式下,電、熱、冷等能源之間無法得到充分轉(zhuǎn)化,導致能源利用效率低下以及清潔能源無法被充分消納等[2]。因此,綜合能源系統(tǒng)IES(In-tegrated Energy System)和能源互聯(lián)網(wǎng)EI(Energy Internet)被相繼提出。IES 作為EI的物理載體,包含電力供應、熱力供應、天然氣供應等[3]。多元負荷預測的精度直接關系到IES 的能源調(diào)度和運行規(guī)劃是否合理有效。傳統(tǒng)負荷預測只需考慮單一能源負荷,而IES 負荷預測需綜合考慮電、熱、冷等多類型能源之間的耦合關聯(lián),使得IES 多元負荷預測的難度增大。
目前,針對傳統(tǒng)單一能源子系統(tǒng)負荷預測研究已取得較好的研究成果,例如:在傳統(tǒng)的電力負荷預測方面,文獻[4]考慮天氣條件、電價、日歷信息和歷史負荷數(shù)據(jù),采用聯(lián)合概率密度方法進行預測;在熱負荷預測方面,文獻[5]將灰狼優(yōu)化算法和差分進化相結(jié)合來對支持向量機進行優(yōu)化,該預測方法同樣適用于換熱站和熱源;在冷負荷預測方面,文獻[6]針對冰蓄冷空調(diào)中冷負荷預測存在數(shù)據(jù)關聯(lián)度低的情況,提出了一種組合神經(jīng)網(wǎng)絡模型來解決這一問題。
相較于單一負荷預測,IES多元負荷預測相關研究仍處于初級階段。近年來,機器學習等人工智能技術(shù)廣泛應用于負荷預測領域,針對IES 多元負荷間復雜的耦合關系,無需建立準確的數(shù)學模型,僅通過非線性映射分層學習就能得到數(shù)據(jù)之間的關系。文獻[7]利用混沌理論進行變量空間重構(gòu),并采用卡爾曼濾波對電、熱、冷負荷進行預測;文獻[8]將多任務學習和長短時記憶網(wǎng)絡相結(jié)合,通過共享層來模擬各能源子系統(tǒng)負荷之間的耦合特性;文獻[9]通過構(gòu)建深度結(jié)構(gòu)的多任務學習模型,考慮熱、電、氣之間的耦合性,建立了“離線+在線”的預測模式;文獻[10]基于多層徑向基函數(shù)神經(jīng)網(wǎng)絡模型實現(xiàn)了電、氣、熱多元負荷預測;文獻[11]利用核主成分分析法對原始數(shù)據(jù)進行降維,并分別用深度雙向長短期記憶神經(jīng)網(wǎng)絡和多元線性回歸模型進行多元負荷預測,然后對采用這2 個模型預測的結(jié)果進行重構(gòu)得到最終結(jié)果。上述文獻針對多元負荷預測大多采用單一預測模型或?qū)讉€模型相組合的方法。近年來,多模型融合算法在負荷預測領域取得了一定的成就,文獻[12]在Stacking 集成學習框架下融合多個機器學習及深度學習算法,通過實際算例證明多模型融合算法相較于單一模型或簡單的模型組合方法有著更高的預測精度。目前將多模型融合算法用于多元負荷預測領域的研究較少。因此,本文借助Stacking集成學習的思想,同時引入多目標回歸來解決傳統(tǒng)Stacking 集成學習模型無法進行多變量預測的問題。
綜上,本文提出一種基于多目標Stacking 集成學習模型的多元負荷協(xié)同預測方法。首先,引入最大信息系數(shù)MIC(Maximal Information Coefficient)理論,對多元負荷及天氣因素進行相關性分析;其次,引入負荷耦合形態(tài)指標,深度挖掘多元負荷間的耦合關系,并通過計算得到的MIC 值進行輸入變量篩選;然后,將多目標回歸的思想與Stacking 集成學習模型相結(jié)合,建立多元負荷協(xié)同預測模型;最后,通過實際算例驗證所提模型的可行性。
IES是一個以電力系統(tǒng)為核心,具有各種信息化設備的能源平衡系統(tǒng),可以實現(xiàn)電、熱、冷、氣的多能互補。具體的IES 交互圖[13]如附錄A 圖A1 所示。從圖中可以看出,IES各能源子系統(tǒng)之間可以通過某種能源轉(zhuǎn)換裝置進行能源二次利用。不同負荷之間能通過特定形式實現(xiàn)相互轉(zhuǎn)換,表明了多元負荷之間存在復雜的耦合關系。因此,深度挖掘多元負荷之間的耦合特性,同時分析多元負荷及天氣因素之間的相關性,這對于提高模型預測精度起到了重要的作用。
MIC[14]于2011 年首次被提出,不僅可以衡量2個變量之間是否存在線性關系,還可以觀測變量間是否具有正弦性、周期性等非線性關系,而且MIC對于含有噪聲的樣本具有較好的魯棒性。MIC 值的取值范圍在0~1 之間,MIC 值越大,表明2 個變量間的關聯(lián)程度越高。
MIC 的基本原理為:如果2 個變量之間存在相關性,則可以在由2 個變量組成的散點圖上繪制網(wǎng)格,并利用互信息MI(Mutual Information)和網(wǎng)格劃分來計算MIC。利用MIC 進行相關性分析的具體步驟如下。
1)設天氣因素變量A={ai}(i=1,2,…,n)和多元負荷B={bj}(j=1,2,…,m),其中n和m分別為天氣因素和多元負荷變量的數(shù)量。即MI 值fMI(A,B)的計算公式為:
式中:B(δ)為關于δ的函數(shù),設為δ0.6。
根據(jù)上述方法,對實際美國亞利桑那州立大學Tempe 校區(qū)的全年IES 數(shù)據(jù)及天氣數(shù)據(jù)進行相關性分析。
在IES 內(nèi)部中,不同能源之間可以通過某種特定的形式進行相互轉(zhuǎn)化,這表明多元負荷之間存在一定的相關性。多元負荷曲線如附錄A 圖A2所示。從圖中可以看出,電、冷負荷的曲線波動較為接近,都呈現(xiàn)“夏高冬低”的趨勢,而熱負荷曲線波動正好與之相反,呈現(xiàn)“夏低冬高”的趨勢,這表明電、熱、冷負荷之間有較強的季節(jié)互補性。為了更加直觀地量化多元負荷之間的關系,選擇采用MIC值來測量電、熱、冷負荷間的關聯(lián)程度。由于電、熱、冷負荷的季節(jié)互補性,在不同季節(jié)電、熱、冷負荷存在不同程度的相關性,其量化結(jié)果如表1所示。
表1 在不同季節(jié)多元負荷之間的MIC值Table 1 MIC values among multiple loads in different seasons
由表1 可知,在不同季節(jié)電、熱、冷負荷之間的相關程度存在明顯差異。本文將MIC 值大于0.3 的變量作為強相關變量,MIC 值小于0.1的變量作為弱相關變量。夏季電負荷與熱負荷間的相關程度最低,而電負荷與冷負荷間的相關程度最高,而冬季與夏季正相反;春季和秋季的電、熱、冷負荷間的MIC值均大于0.3,表明其具有較強的相關性。上述分析表明在進行多元負荷預測時,不能忽略負荷間的相關性。
電、熱、冷負荷除了受到負荷之間的相互耦合影響之外,對于天氣因素也較為敏感。不同季節(jié)的天氣因素對于電、熱、冷負荷的影響程度不同。因此,深度挖掘電、熱、冷負荷與天氣因素之間的相關性,對提升模型的預測精度起到重要的作用,具體結(jié)果見附錄A 表A1。從表中可知,不同季節(jié)的天氣因素與多元負荷之間的相關程度存在明顯差異。如在春季,溫度與多元負荷間的MIC均大于0.3,具有較強的相關性,而降雨量與多元負荷間的MIC 均小于0.1,相關程度較弱。因此,根據(jù)附錄A 表A1所示的季節(jié)差異性分析可知在不同季節(jié)應選取不同的天氣因素作為輸入變量。
由于IES 特有的交互結(jié)構(gòu),其多元負荷間具有較強的耦合特性,深度挖掘其耦合關系對于提升模型的預測精度起到重要作用。因此,為了反映多元負荷間的耦合特性,提出電冷比、電熱比、冷熱比這3 個負荷耦合形態(tài)指標,以充分利用IES 多元負荷間的耦合信息來提升多元負荷協(xié)同預測的準確性。為了驗證負荷耦合形態(tài)指標能增強多元負荷的可預測性,利用MIC 值來量化負荷耦合形態(tài)指標與多元負荷間的相關程度,結(jié)果如表2所示。
表2 負荷耦合形態(tài)指標與多元負荷間的MIC值Table 2 MIC values between load coupling morphological indexes and multiple loads
由表2 可知,負荷耦合形態(tài)指標與多元負荷間具有較強的相關性。在夏季,電冷比、冷熱比與多元負荷間的相關程度較高,其中冷熱比與冷負荷間的MIC 超過0.8;在冬季,冷熱比、電熱比與多元負荷間的相關程度較高,其中電熱比與熱負荷間的MIC 超過0.7。由此可知,負荷耦合形態(tài)指標可以很好地反映多元負荷間的耦合關系。因此,選取負荷耦合形態(tài)指標作為模型的輸入變量來提升多元負荷協(xié)同預測的精度,具有一定的可行性。
多目標回歸[15]也可以被稱為多變量預測和多輸出回歸。多目標回歸是基于多標簽分類的思想演化而來的,可以同時預測多個相互關聯(lián)的連續(xù)型變量,通過深度挖掘多個輸出變量之間的關聯(lián)性來提升模型的預測精度。
多目標回歸算法目前有堆疊單目標回歸SST(Stacked Single-Target)算法和集成回歸鏈ERC(Ensemble of Regressor Chains)算法這2 種。SST算法主要分為以下2 個階段:第一階段,針對每個輸出變量,先進行單目標的回歸預測;第二階段,將第一階段每個輸出變量的預測值擴充至原始輸入空間,組成新的輸入變量,再輸入同一個多目標回歸模型進行多輸出預測。ERC算法為每個輸出變量建立一個單獨的回歸模型,與SST 算法不同的是,其在擴充原始輸入空間時,采用的是對先前輸出變量的實際值進行擴充,再隨機生成多條回歸鏈,每個輸出變量基于鏈的不同位置得到其預測值,最后通過計算平均值得到最終的預測結(jié)果。
雙向門控循環(huán)單元BiGRU(Bidirectional Gated Recurrent Unit)[16]將具有相反傳輸方向的2 個隱藏層連接到同一輸出層,以便于輸出層從過去和將來的狀態(tài)中獲取信息。這意味著BiGRU 神經(jīng)網(wǎng)絡能夠從2 個不同的數(shù)據(jù)方向?qū)W習信息,從而進行更準確的預測。BiGRU 的思路是將規(guī)則的GRU 神經(jīng)元分為前向傳播和后向傳播。BiGRU 的結(jié)構(gòu)如圖1所示。
圖1 BiGRU結(jié)構(gòu)圖Fig.1 Structure diagram of BiGRU
正則化貪心森林RGF(Regularized Greedy Forest)算法[17]于2014 年被提出,目的是為了應對傳統(tǒng)梯度提升決策樹GBDT(Gradient Boosting Decision Tree)收斂速度較慢、容易過擬合等不足之處。RGF算法與GBDT 不同,在每次迭代時需對整個決策森林進行學習,并在新增樹后對全局進行參數(shù)優(yōu)化,同時引入正則項來防止過擬合現(xiàn)象。
傳統(tǒng)Stacking 集成學習算法通過將不同的機器學習算法融合在一起,并通過K折交叉驗證來進行基學習器訓練集的劃分,再將基學習器訓練后得到的結(jié)果作為元學習器的輸入,從而得到最終預測結(jié)果。具體預測流程如圖2所示。
從圖2中可以看出,傳統(tǒng)Stacking 集成學習模型是對單一任務進行預測的,預測結(jié)果也是單一結(jié)果輸出的??紤]到IES 特有的結(jié)構(gòu)特性,電、熱、冷負荷之間有較強的耦合關系,將多元負荷單獨進行預測往往會忽略多元負荷之間的關聯(lián)性,從而影響預測精度。針對這類問題,將多目標回歸的思想融入Stacking集成學習模型中,充分考慮電、熱、冷負荷之間的耦合性,從而進行多元負荷協(xié)同預測。多目標Stacking集成學習預測模型主要分為以下2個階段。
圖2 傳統(tǒng)Stacking集成學習模型預測流程圖Fig.2 Forecasting flowchart of traditional Stacking ensemble learning model
1)第一階段:基于傳統(tǒng)Stacking 集成學習模型的多元負荷單獨預測。
在第一階段中,仍使用傳統(tǒng)Stacking 集成學習模型的基學習器與元學習器訓練模式,對電、熱、冷負荷分別進行預測。首先,采用5 折交叉驗證劃分訓練集,并在第一層基學習器算法選取輕量級梯度提升機LightGBM(Light Gradient Boosting Machine)、極限梯度提升XGBoost(eXtreme Gradient Boosting)、隨機森林RF(Random Forest)這類預測性能較好的決策樹算法。同時考慮到多元負荷的時序特點,引入BiGRU,在第一層選取不同類型的基學習器,目的是使模型能從不同的空間結(jié)構(gòu)去訓練數(shù)據(jù),從而達到更高的預測精度;在第二層元學習器模型選取LightGBM模型,以增強模型的泛化能力。
2)第二階段:擴充原始輸入變量。
對原始輸入變量進行擴充,將第一階段單獨預測得到的電、熱、冷負荷結(jié)果擴充至原始輸入空間,組成新的輸入變量,并且在傳統(tǒng)Stacking 集成學習模型基礎之上再引入一層多目標回歸模型。為了防止出現(xiàn)過擬合現(xiàn)象,本文選取RGF 算法作為最終多元負荷協(xié)同預測模型,并同時輸出電、熱、冷負荷預測結(jié)果。
本文提出的基于MIC 和多目標Stacking 集成學習的多元負荷預測方法的具體預測流程圖如圖3所示。
圖3 所提預測方法流程圖Fig.3 Flowchart of proposed forecasting method
本文采用的實際數(shù)據(jù)為美國亞利桑那州立大學Tempe 校 區(qū)2019 年1 月1 日 至2020 年2 月29 日 的IES電、熱、冷負荷數(shù)據(jù),采樣間隔為1 h,負荷數(shù)據(jù)來源于該校CAMPUS METABOLISM 項目網(wǎng)絡數(shù)據(jù)庫,天氣數(shù)據(jù)來源于Dark SKY 網(wǎng)站。該校區(qū)擁有288 座建筑物、52 255 名師生,同時擁有冷熱電聯(lián)供CCHP(Combined Cooling,Heating and Power)、電鍋爐、燃氣鍋爐以及電轉(zhuǎn)氣P2G(Power-to-Gas)等能量轉(zhuǎn)換設備。
為了驗證本文模型在一年不同季節(jié)下的適用性,根據(jù)氣象學定義的四季,對美國亞利桑那州立大學Tempe 校區(qū)的IES 負荷數(shù)據(jù)進行四季劃分,并以夏季和冬季為例,選取2019 年6 月1 日至8 月27 日的電、熱、冷負荷數(shù)據(jù)及天氣因素作為夏季預測的訓練集樣本,8月30日作為夏季典型工作日預測樣本,8 月31 日作為夏季典型周末預測樣本;選取2019 年12 月1 日至2020 年2 月22 日作為冬季預測訓練集樣本,2 月25 日作為冬季典型工作日預測樣本,2 月24日作為冬季典型周末預測樣本。
本文使用的硬件設施為Inter Core i5-9300H 處理器、NVDIA GTX1660Ti 6 G GDDR6獨立顯卡,軟件平臺為Python3.7.1和MATLAB R2020a。
1)考慮到在實際負荷數(shù)據(jù)記錄工程中,人工失誤會導致某一時刻負荷數(shù)據(jù)出現(xiàn)異常情況,因此本文采用3σ準則[18]來進行異常值檢測,將檢測得到的異常值當作缺失值處理,并采用K-最近鄰KNN(K-Nearest Neighbor)算法進行缺失值填補。
2)由于采集到的電、熱、冷負荷數(shù)據(jù)單位不統(tǒng)一,為了不影響模型的魯棒性,將采用不同單位的負荷進行標準化處理,先根據(jù)能源轉(zhuǎn)換計算公式[19]全部將單位統(tǒng)一為kW,再與其他天氣因素數(shù)據(jù)進行標準化處理,標準化計算公式如下:
式中:μ為原始數(shù)據(jù)樣本均值;σ為原始數(shù)據(jù)樣本的標準差。
3)考慮到多元負荷的時序特性,在進行多元負荷協(xié)同預測時,不僅要考慮預測日t-1時刻和預測日前一天t-1/t/t+1 時刻的實際溫度、濕度等天氣因素,還要考慮預測日前一天t-1/t/t+1時刻的電、熱、冷負荷數(shù)據(jù)。因此,結(jié)合上文多元負荷及天氣因素的相關性分析,本文選取的輸入變量如附錄A 表A2所示。
本文使用平均絕對百分比誤差EMAPE、平均精度MA和加權(quán)平均準確度WMA來評價預測結(jié)果,在WMA的權(quán)重分配中,考慮到電力負荷的主導地位,將電、熱、冷負荷的權(quán)重值分別設為0.6、0.2、0.2,計算公式分別如下:
式中:n為樣本數(shù);x(i)為i時刻負荷實際值;y(i)為i時刻負荷預測值;αj(j=1,2,…,k)為第j類負荷的權(quán)重值;EMAPEj(j=1,2,…,k)為第j類負荷的平均絕對百分比誤差值;k為負荷類型的數(shù)量。EMAPE值在0~100%之間,EMAPE值越小,預測誤差越低;MA和WMA值在0~100%之間,MA和WMA值越大,預測精度越高。
本文采用貝葉斯優(yōu)化算法[20]對各模型進行參數(shù)尋優(yōu),各模型參數(shù)選取如表3所示。
表3 參數(shù)選取Table 3 Selection of parameters
4.4.1 考慮負荷耦合形態(tài)指標前后的對比分析
為了驗證本文所提出的負荷耦合形態(tài)指標能夠提升模型的可預測性,設置以下2 種案例進行對比分析:案例1 考慮負荷耦合形態(tài)指標,采用本文模型進行電、熱、冷負荷協(xié)同預測;案例2 不考慮負荷耦合形態(tài)指標,采用本文模型進行電、熱、冷負荷協(xié)同預測。夏季和冬季考慮負荷耦合形態(tài)指標前后的電、熱、冷負荷預測精度分別如表4和表5所示。
表4 夏季考慮負荷耦合形態(tài)指標前后的預測精度結(jié)果Table 4 Forecasting accuracy results before and after considering load coupling morphological indexes in summer
表5 冬季考慮負荷耦合形態(tài)指標前后的預測精度結(jié)果Table 5 Forecasting accuracy results before and after considering load coupling morphological indexes in winter
從表4 和表5 中可知,案例1 的預測精度優(yōu)于案例2。在夏季典型工作日場景下,案例1的電、熱、冷負荷預測誤差EMAPE相較于案例2 分別減少了1.94%、1.22%、2.80%,預測精度WMA提升了1.97%;在冬季典型工作日場景下,案例1 的電、熱、冷負荷預測誤差EMAPE相較于案例2 分別減少了2.51%、3.73%、5.37%,預測精度WMA提升了3.33%。這表明本文所提出的負荷耦合形態(tài)指標增強了模型的可預測性。
4.4.2 多元負荷協(xié)同預測與單一負荷預測對比分析
為了驗證多元負荷協(xié)同預測在不同時間步長下的普適性和優(yōu)越性,將預測步長分別取1、6、12 h,并與單一負荷預測進行詳細對比分析,以夏季為例,對比結(jié)果如表6 所示。從表中可知,隨著預測步長的增大,多元負荷協(xié)同預測和單一負荷預測的預測誤差EMAPE都逐漸變大,但在不同預測步長下,多元負荷協(xié)同預測模型都始終優(yōu)于單一負荷預測模型。在典型工作日場景下,當預測步長為12 h時,多元負荷預測誤差區(qū)間為[1.73%,3.74%],而單一負荷預測誤差區(qū)間為[5.33%,7.24%],誤差明顯增大。這是因為多元負荷間具有較強的耦合關系,而單一負荷預測忽略了多元負荷間的耦合關系。
表6 不同預測步長下的多元負荷協(xié)同預測與單一負荷預測精度對比結(jié)果Table 6 Comparison results of forecasting accuracy between multivariate load collaborative forecasting and single-load forecasting in summer with different forecasting step sizes
在同一預測步長下多元負荷協(xié)同預測所花費的時間為35.38 s,而各負荷單獨預測所花費的時間分別為電負荷32.92 s、熱負荷33.03 s、冷負荷32.00 s,多元負荷協(xié)同預測的訓練時間僅為單一負荷預測訓練時間總和的1/3 左右。以上分析充分驗證了多元負荷協(xié)同預測模型的優(yōu)越性。
4.4.3 多模型融合與單一模型對比分析
為了驗證本文采用的多模型融合的協(xié)同預測模型在預測精度方面的優(yōu)勢,將本文模型與集成學習中各單一模型算法進行對比,進行對比的單一模型算法包括RGF、XGBoost、BiGRU算法,為了保證實驗的公平性,仍采用相同數(shù)據(jù)進行分析,并以夏季為例,具體實驗結(jié)果如附錄A圖A3、A4和表7所示。
表7 多模型融合與單一模型預測對比結(jié)果Table 7 Comparison of forecasting results between multi-model fusion and single model
從表7 中可知,在不同日類型場景下,本文所提出的多模型融合的協(xié)同預測模型在預測精度WMA上均優(yōu)于各單一預測模型。在典型工作日場景下,本文模型的電、熱、冷負荷的預測誤差EMAPE分別為0.81%、0.68%、1.24%,而基于XGBoost 的模型預測結(jié)果最差,EMAPE分別達到了1.95%、2.10%、1.90%,分別為本文模型預測誤差的2.41 倍、3.09 倍、1.53倍;在典型周末場景下,本文模型的電、熱、冷負荷的預測誤差EMAPE分別為0.33%、0.38%、0.62%,而基于XGBoost的模型預測結(jié)果仍為最差,EMAPE分別達到了1.48%、1.29%、1.56%,分別為本文模型預測誤差的4.48 倍、3.39 倍、2.52 倍。通過與各單一預測模型進行對比,再次驗證了多模型融合的協(xié)同預測的優(yōu)越性。
4.4.4 不同多元負荷預測模型對比分析
為了進一步突出本文所提出的多元負荷協(xié)同預測模型的優(yōu)勢,選取多目標回歸和多任務學習算法來進行對比分析。其中多目標回歸選取的學習器為LightGBM 算法,多任務學習算法的共享層選取BP神經(jīng)網(wǎng)絡來進行共享學習,以冬季為例,對比實驗結(jié)果如圖4、5和表8所示。
表8 不同多元負荷預測模型的預測結(jié)果Table 8 Forecasting results of different multivariate load forecasting models
從圖4 和圖5 中可知,在冬季典型工作日場景下,電、熱、冷負荷預測相對誤差最大值主要集中在工作時段,即08:00—19:00時段;在冬季典型周末場景下,電、熱、冷負荷預測相對誤差最大值主要出現(xiàn)在00:00—05:00、20:00—24:00 時段。本文所提出的多元負荷協(xié)同預測模型總體誤差波動較為平穩(wěn),而其他2 種多元負荷預測模型誤差波動則較為劇烈,主要有以下3點原因。
圖5 冬季典型周末多元負荷預測模型相對誤差對比圖Fig.5 Relative error comparison diagram of multivariate load forecasting model on typical weekends in winter
1)本文采用的多模型融合下的多元負荷協(xié)同預測模型,通過選取不同類型的算法來達到互補的作用,其中樹模型算法可以很好地學習多元負荷及天氣因素之間的非線性關系;BiGRU 可以從不同方向全面地對數(shù)據(jù)進行學習;RGF 算法可以在單一負荷誤差波動較為劇烈時,能從不同數(shù)據(jù)結(jié)構(gòu)空間去學習多元負荷間的耦合信息,防止發(fā)生過擬合現(xiàn)象。
2)多目標LightGBM 算法不具有處理時間序列的功能,因此在處理時序特點較為明顯的數(shù)據(jù)時具有明顯的劣勢。
3)多任務學習算法雖然在共享層學習了多元負荷間的耦合關系,但BP 神經(jīng)網(wǎng)絡的網(wǎng)絡層較為簡單,無法更深層次地挖掘多元負荷間的耦合信息。
從表8 中可知,在預測精度方面,本文采用的協(xié)同預測模型的預測誤差EMAPE在[0.5%,1.1%]區(qū)間之內(nèi),而其他2 種多元負荷預測模型預測誤差EMAPE在[1.3%,2.4%]范圍內(nèi),可見本文模型明顯優(yōu)于其他2種模型。對于預測精度WMA值,本文模型也優(yōu)于其他2種模型。
綜上所述,本文所采用的多元負荷協(xié)同預測模型,在Stacking 集成學習框架下進行多模型融合,同時引入BiGRU 神經(jīng)網(wǎng)絡和RGF 算法作為學習器模型,前者可以從不同方向?qū)?shù)據(jù)進行全面的學習,后者能防止過擬合現(xiàn)象的發(fā)生。為了充分利用多元負荷間的耦合關系,將多目標回歸思想與多模型融合相結(jié)合來實現(xiàn)多元負荷協(xié)同預測。
本文考慮IES 中電、熱、冷負荷之間的耦合關系,提出負荷耦合形態(tài)指標來深度挖掘多元負荷間的耦合性,并引入MIC 的相關性分析來進行特征篩選,再將多目標回歸與Stacking 集成學習相結(jié)合,建立電、熱、冷負荷協(xié)同預測模型,最后通過實際算例得出以下結(jié)論:
1)在考慮負荷耦合形態(tài)指標的情況下,協(xié)同預測模型較好地利用了多元負荷間的耦合信息,本文模型的預測精度得到了明顯提升;
2)本文模型解決了傳統(tǒng)Stacking 集成學習模型只能進行單一目標預測的問題,并在不同預測步長下證明了多元負荷協(xié)同預測相較于單一負荷預測受到預測步長的影響較小,預測精度和訓練時間明顯優(yōu)于單一負荷預測;
3)在Stacking 集成學習模型中,分別引入RGF算法和BiGRU,前者能夠防止過擬合現(xiàn)象的發(fā)生,后者能夠從不同的數(shù)據(jù)方向?qū)W習信息,并且與其他多輸出預測模型相比,其具有更高的預測精度且相對誤差曲線波動較為平穩(wěn),模型的穩(wěn)定性更強。
在之后的研究中,筆者將進一步考慮多元負荷時序耦合特性,挖掘更深層次的耦合特征,從而進一步提升預測精度。
附錄見本刊網(wǎng)絡版(http://www.epae.cn)。