【摘要】
為了提高供熱負荷預(yù)測的準(zhǔn)確性,研究提出了一種基于主成分分析法和遺傳算法優(yōu)化的反向傳播神經(jīng)網(wǎng)絡(luò)(Principal Component Analysis-Genetic Algorithm-Back Propagation,PCA-GA-BP)預(yù)測模型。該模型首先采用PCA從原始集中供熱監(jiān)測數(shù)據(jù)中提取了4個主成分,作為BP神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù),去除了輸入變量之間的冗雜與相關(guān)性,隨后,利用GA對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行優(yōu)化,以此構(gòu)建PCA-GA-BP熱負荷預(yù)測模型。選取康定市居住建筑供熱系統(tǒng)實際運行的熱力數(shù)據(jù)作為模擬實驗樣本,對優(yōu)化前后模型的性能進行比較驗證。研究發(fā)現(xiàn),PCA-GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的平均絕對百分比誤差低至10.287%,比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的MAPE減少了6.636%,顯著提高了供熱負荷預(yù)測的準(zhǔn)確性。
【關(guān)鍵詞】供熱負荷,主成分分析法,遺傳算法,預(yù)測模型
【中圖分類號】TU832.02【文獻標(biāo)志碼】A
[定稿日期]2024-10-11
[基金項目]山東省自然科學(xué)基金(項目編號:ZR2021ME199),山東省高等學(xué)校青創(chuàng)人才引育計劃創(chuàng)新團隊項目(項目編號:魯教科函〔2021〕51號)。
[作者簡介]張利?。?973—),男,本科,工程師,研究方向為暖通空調(diào)與節(jié)能優(yōu)化控制。
[通信作者]劉吉營(1983—),男,博士,教授,研究方向為暖通空調(diào)與節(jié)能優(yōu)化控制。
0 引言
截止2020年,全國集中供熱覆蓋面積達到122.66億m2,因大量燃料燃燒加劇了能源短缺和環(huán)境污染問題。2024年,我國政府提出要加快推動建筑領(lǐng)域節(jié)能降碳,使得清潔、低碳、高效已成為中國能源發(fā)展的必然趨勢。傳統(tǒng)粗放的供熱系統(tǒng)調(diào)節(jié)方式往往導(dǎo)致供熱過程中出現(xiàn)顯著的熱量損耗和不均勻的冷熱分布。在實際供熱中,即便能源消耗量大,也難以充分滿足熱用戶的需求[1]。因此,將熱負荷預(yù)測加入供熱系統(tǒng)中指導(dǎo)供熱勢在必行。
熱負荷預(yù)測是預(yù)測未來一段時間內(nèi)為保持室內(nèi)舒適溫度所需熱量的方法,隨著大量建筑能耗數(shù)據(jù)積累以及人工智能技術(shù)在供熱領(lǐng)域的應(yīng)用,機器學(xué)習(xí)算法已被廣泛的應(yīng)用于熱負荷預(yù)測[2]。徐欣等[3]采用多元非線性回歸方法分析了系統(tǒng)日平均供水溫度和節(jié)假日效應(yīng)項為輸入變量的回歸殘差修正模型,實現(xiàn)了對供熱負荷的準(zhǔn)確預(yù)測;Sakkas等[4]利用人工神經(jīng)網(wǎng)絡(luò),建立了集中供熱網(wǎng)絡(luò)負荷預(yù)測模型,采用分段多相分析方法,通過改變輸入變量的特征和神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),逐步優(yōu)化預(yù)測器,研究中開發(fā)的優(yōu)化的全自動預(yù)測器產(chǎn)生了更可靠的負荷預(yù)測;薛普寧等[5]提出了一種以機器學(xué)習(xí)為基礎(chǔ)的多步遞歸預(yù)測模型,取得了較好的預(yù)測效果;于曉娟等[6]在綜合室內(nèi)溫度變化的基礎(chǔ)上,利用多元線性回歸、反向傳播神經(jīng)網(wǎng)絡(luò)以及網(wǎng)格搜索優(yōu)化的支持向量機方法,對未來7天的耗熱量進行了預(yù)測,結(jié)果表明,采用網(wǎng)格搜索優(yōu)化的支持向量機模型在預(yù)測精度上表現(xiàn)最佳。
為了提高熱負荷預(yù)測的準(zhǔn)確性,在自變量選擇過程中,考慮了氣象因素、供熱管網(wǎng)性能以及歷史負荷等因素[7]。在建模過程中,首先使用主成分分析法(Principal Component Analysis,PCA)對熱負荷有影響的特征指標(biāo)進行融合,去除了輸入層參數(shù)之間的冗雜和相關(guān)性,同時,在對網(wǎng)絡(luò)進行學(xué)習(xí)訓(xùn)練的過程中,采用遺傳算法(Genetic Algorithm,GA)對網(wǎng)絡(luò)進行優(yōu)化,避免網(wǎng)絡(luò)陷入局部最小值,并加速其收斂。
1 供熱數(shù)據(jù)來源及處理
選取康定某小區(qū)供熱負荷進行模擬研究,研究區(qū)的集中供熱系統(tǒng)由熱源、管網(wǎng)、熱力站、熱用戶4個主要部分組成,以熱水作為熱媒,通過管網(wǎng)給熱用戶供應(yīng)熱能。研究數(shù)據(jù)來自供熱公司熱力數(shù)據(jù)可視化監(jiān)控平臺。供熱系統(tǒng)運行數(shù)據(jù)的導(dǎo)出是以整個供暖季為研究對象的,站點查詢的時間范圍為2022.10.15—2023.4.15,為增加數(shù)據(jù)的準(zhǔn)確性,查詢間隔時間為3 min。模型的輸出變量為逐時供熱負荷,利用編程對間隔3 min的供熱歷史運行數(shù)據(jù)進行逐時篩查,將所有數(shù)據(jù)采集的時間步長統(tǒng)一處理為1 h。
在歷史數(shù)據(jù)收集過程中,常常由于設(shè)備故障、通信中斷等因素導(dǎo)致數(shù)據(jù)出現(xiàn)缺失值和異常值。若這些異常數(shù)據(jù)未被妥善處理,將會降低數(shù)據(jù)和預(yù)測負荷的正確性。因此,在將數(shù)據(jù)用于模型訓(xùn)練之前,需進行合理的數(shù)據(jù)預(yù)處理,包括對異常數(shù)據(jù)和缺失值進行處理,以確保數(shù)據(jù)集的完整性和可靠性。對于缺失的數(shù)據(jù),采用內(nèi)插法進行填補;對于異常的數(shù)據(jù),先使用3σ準(zhǔn)則進行查找,再使用內(nèi)插的方法確定插值并進行數(shù)據(jù)的代替;對于長時間出現(xiàn)的重復(fù)或者缺失,判定為數(shù)據(jù)采集過程中的異常并將其剔除。
2 輸入層參數(shù)優(yōu)化
2.1 初始特征變量的選擇
供熱負荷受氣象因素、系統(tǒng)因素、社會因素以及建筑自身因素等多種因素的影響。隨著溫度的升高,供熱負荷的數(shù)值逐漸降低。當(dāng)溫度不變時,隨著相對濕度的降低,汗液蒸發(fā)作用增強,人體就會感到寒冷,供熱負荷也會隨之增大。隨著風(fēng)速的增加,供熱負荷也會增大。當(dāng)太陽輻射較小時,供熱負荷較大,但其對熱負荷影響較小,僅占1%~5%。供熱管網(wǎng)自身的一些特性,主要體現(xiàn)在管網(wǎng)流量、供水溫度、回水溫度等方面。社會因素例如用熱習(xí)慣、政府政策也會影響熱負荷的變動。建筑物自身的結(jié)構(gòu)、使用功能、地理位置等建筑自身因素也會對供熱負荷造成影響。然而,熱負荷受社會因素的影響,其變化趨勢較為緩慢,因而在短期熱負荷預(yù)測中,這一因素通??梢圆挥杩紤]。同時,一旦建筑物建成,其自身特性對熱負荷的影響微乎其微。
綜上對供熱負荷影響因素的初步分析及相關(guān)文獻綜述[8-9],確定了包括室外溫度、風(fēng)速、相對濕度、一網(wǎng)供水溫度、回水溫度、管網(wǎng)流量、前1天同時刻的逐時熱量、前2天同時刻的逐時熱量8個初始特征指標(biāo)。
2.2 主成分分析法
供熱負荷受多種因素的影響,但在實際計算中,如果要綜合考慮各種因素,則會增加問題的復(fù)雜性和求解的難度。利用PCA,可以把對問題有影響的多個初始指標(biāo)降維為幾個主要的有效成分[10],降低了問題分析的難度,該方法主要步驟包括:
(1)數(shù)據(jù)標(biāo)準(zhǔn)化計算,收集供熱負荷m個影響因素的n個樣本,則有式(1)~式(3)。
xj-=1n∑ni=1xij,(j=1,2,…,m)(1)
sj=1n-1∑ni=1xij-xj-2,(j=1,2,…,m)(2)
xij=xij-xj-sj,(i=1,2,…,n;j=1,2,…,m)(3)
式中:m為影響因子個數(shù);n為影響因子樣本數(shù);xij為第j個影響因子的第i個指標(biāo),xj-為第j個影響因子的樣本均值;sj為第j個影響因子的樣本標(biāo)準(zhǔn)差;xij為標(biāo)準(zhǔn)化指標(biāo)。
(2)計算相關(guān)系數(shù)矩陣R=(rij)m×m的特征值和對應(yīng)的特征向量,rij代表第i個和第j個影響因子的相關(guān)系數(shù),如式(4),將特征值從大到小進行排序,由特征向量構(gòu)成了m個新的綜合變量,如式(5)。
rij=∑nk=1xki×xkjn-1,(i,j=1,2,…,m)(4)
F1=u11x1+u21x2+…+um1xm
F2=u12x1+u22x2+…+um2xm
……
Fm=u1mx1+u2mx2+…+ummxm(5)
式中:xki為第i個影響因子的第k個標(biāo)準(zhǔn)化指標(biāo),F(xiàn)m為第m主成分;x1、x2、…、xm為標(biāo)準(zhǔn)化處理后的影響因子向量;uj為λj對的特征向量,uj=(u1j,u2j,…,umj),j=1,2,…,m。
(3)計算貢獻率和累積貢獻率并提取主成分見式(6)、式(7)。
bj=λi∑mk=1λk,(j=1,2,…,m)(6)
αp=∑pk=1λk∑mk=1λk(7)
式中:bj為主成分Fj的信息貢獻率;αp為主成分的累積貢獻率,取αpgt;90%。
2.3 主成分提取
為了高效減少熱負荷預(yù)測中初始特征變量數(shù)據(jù)的空間維度,使用SPSS軟件對其進行了降維處理,得到的結(jié)果見表1。前4個主成分累積貢獻率達到了90.337%,這足以概括原始的8個特征變量所蘊含的信息,因此選擇主成分Y1~Y4作為模型的輸入數(shù)據(jù)。
主成分系數(shù)表2展示了每一個主成分與每一個變量之間的線性關(guān)系。主成分Y1主要與前兩天同時刻的瞬時熱量、前一天同時刻的瞬時熱量、管網(wǎng)流量、回水溫度、室外溫度有關(guān);主成分Y2、Y3、Y4分別主要與相對濕度、風(fēng)速、供水溫度有關(guān)。最終主成分表達式為式(8)~式(11)。
f1=-0.36x1-0.08x2-0.02x3+0.37x4+
0.44x5+0.41x6+0.44x7+0.41x8(8)
f2=0.27x1+0.60x2-0.73x3+0.02x4+0.12x5+0.08x6+0.05x7+0.04x8(9)
f3=-0.42x1+0.70x2+0.43x3-0.25x4+0.01x5+0.23x6-0.06x7-0.16x8(10)
f4=0.18x1+0.33x2+0.31x3+0.73x4+0.03x5-0.47x6-0.03x7+0.05x8(11)
3 供熱負荷預(yù)測模型
3.1 預(yù)測流程
BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、隱藏層和輸出層,其工作
原理是基于梯度下降算法。在訓(xùn)練過程中,網(wǎng)絡(luò)通過不斷迭代來調(diào)整各層神經(jīng)元之間的連接權(quán)重和閾值,目的是減小網(wǎng)絡(luò)的實際輸出與期望輸出之間的誤差,直至達到最小誤差。然而,該過程容易導(dǎo)致網(wǎng)絡(luò)陷入局部最優(yōu)解的問題。
GA是一種模擬自然生物進化的方法,能有效的解決非線性、全局尋優(yōu)等復(fù)雜問題[11],利用GA對BP神經(jīng)網(wǎng)絡(luò)的權(quán)、閾值進行優(yōu)化,優(yōu)化后的權(quán)閾值再通過BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到最優(yōu)結(jié)果。PCA-GA-BP流程如圖1所示,在進行GA的計算時,首先對所要優(yōu)化的參數(shù)進行編碼,并隨機地產(chǎn)生一個初始化的群體集,之后以種群擇優(yōu)目標(biāo)方向為依據(jù),來確定種群的適應(yīng)度函數(shù)。最后,在群體選擇、雜交和變異的基礎(chǔ)上,采用GA求解。
3.2 參數(shù)確定
神經(jīng)網(wǎng)絡(luò)輸入層為基于PCA提取到的4個主成分,輸出層參數(shù)為逐時供熱負荷,隱含層根據(jù)經(jīng)驗式首先試湊出選取范圍,再通過分析訓(xùn)練時不同神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對模型的影響得出最佳個數(shù),確定為10時訓(xùn)練效果最佳見式(12)。
H=I+O+α(12)
式中:α為調(diào)節(jié)常數(shù),取值一般為1~10;H為隱含層節(jié)點數(shù);I為輸入層節(jié)點數(shù);O為輸出層節(jié)點數(shù)。
訓(xùn)練集和測試集利用PCA處理后的新數(shù)據(jù)集進行劃分,以MATLAB為平臺,前80%的數(shù)據(jù)作為訓(xùn)練集,后20%的數(shù)據(jù)作為測試集。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速率為0.01,訓(xùn)練目標(biāo)最小誤差為10-4,訓(xùn)練次數(shù)為1 000次,動量因子為0.01,將PCA-BP的網(wǎng)絡(luò)拓撲結(jié)構(gòu)設(shè)置為4-10-1。GA-BP神經(jīng)網(wǎng)絡(luò)模型參數(shù)設(shè)置:最大進化代數(shù)為30,初始種群規(guī)模為10,變異概率為0.2,交叉概率為0.8。
3.3 評價指標(biāo)
選取了4種精度評價指標(biāo)分別為均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)以及平均絕對誤差百分比(Mean Absolute Percentage Error,MAPE)來評估預(yù)測模型的精確度,具體定義見式(13)~式(16)。
MSE=1n∑ni=1(xi-yi)2(13)
RMSE=1n∑ni=1(xi-yi)2(14)
MAE=1n∑ni=1xi-yi(15)
MAPE=100%n∑ni=1xi-yiyi(16)
式中:n為樣本的個數(shù);xi為第i個仿真模擬值(GJ/h);yi為第i個實際測量值(GJ/h);x-為模擬值平均值(GJ/h);y-為實測值的平均值,(GJ/h)。
MSE、RMSE、MAE、和MAPE越小,表示預(yù)測值與實際值誤差越小,模型精度越高。
4 結(jié)果分析
4.1 仿真實驗預(yù)測結(jié)果對比
通過BP、PCA-BP、PCA-GA-BP算法對樣本數(shù)據(jù)進行訓(xùn)練,并對訓(xùn)練結(jié)果進行了驗證。實際負荷與預(yù)測負荷值對比及誤差結(jié)果分別如圖2、圖3所示。
由圖2、圖3可以得出,通過標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò)模型得到的預(yù)測值與實測值之間偏差較大,PCA-BP模型得到的預(yù)測值與實測值比較接近,當(dāng)將GA考慮納入PCA-BP模型,偏差得到了進一步的降低。采用PCA之前,原始輸入層參數(shù)中存在的變量多重相關(guān)性對模型預(yù)測精度造成了不利影響,即便經(jīng)過PCA處理,神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值的選取方式仍對模型有影響,預(yù)測模型仍有進一步優(yōu)化的潛力。
4.2 仿真實驗預(yù)測評價指標(biāo)對比
為了能直觀地看出和比較各預(yù)測模型的優(yōu)化效果,現(xiàn)使用柱狀圖對包括BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型在內(nèi)的多種模型的MAE、RMSE、MSE、MAPE作具體分析。圖4為不同模型之間的誤差評價指標(biāo)。由圖4可知,PCA-BP神經(jīng)網(wǎng)絡(luò)模型的MAE、RMSE、MSE、MAPE均有顯著下降,這表示經(jīng)過PCA降維處理有助于提高神經(jīng)網(wǎng)絡(luò)的非線性映射能力,進一步地,采用GA優(yōu)化后的模型表現(xiàn)更為優(yōu)異,MAE從0.595 GJ/h降至0.448 GJ/h、MSE從1.086 GJ2/h2降至0.349 GJ2/h2、RMSE從1.0421 GJ/h降至0.591 GJ/h,MAPE則從16.92%降至10.29%,指標(biāo)降低的更為明顯,由此得出,使用PCA-GA-BP模型相較于傳統(tǒng)BP模型在供熱負荷預(yù)測方面表現(xiàn)更佳。
5 結(jié)論
研究采用PCA簡化BP神經(jīng)網(wǎng)絡(luò)的輸入層參數(shù)、采用GA對神經(jīng)網(wǎng)絡(luò)中的權(quán)值和閾值進行優(yōu)化調(diào)整,通過對結(jié)果分析,驗證上述可提高神經(jīng)網(wǎng)絡(luò)預(yù)測性能,主要結(jié)論:
(1)在熱負荷預(yù)測中,利用PCA對神經(jīng)網(wǎng)絡(luò)輸入層的數(shù)
據(jù)進行維度降低,篩選關(guān)鍵特征以減少輸入?yún)?shù)的復(fù)雜性,實現(xiàn)了從8維至4維的簡化。利用GA有效地改進了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu)的不足,進而構(gòu)建了一個預(yù)測精度更優(yōu)的PCA-GA-BP供熱負荷預(yù)測模型。
(2)PCA-GA-BP預(yù)測模型相比于標(biāo)準(zhǔn)BP預(yù)測模型而言,MAE降低了0.147 GJ/h、MSE降低了0.737 GJ2/h2、RMSE降低了0.451 GJ/h,MAPE降低了6.63%。
參考文獻
[1] 吳晉濤. 城市集中供熱的現(xiàn)狀及發(fā)展挑戰(zhàn)[J]. 當(dāng)代化工研究. 2018(1): 10-11.
[2] Sajjadi S, Shamshirband S, Alizamir M, et al. Extreme learning machine for prediction of heat load in district heating systems[J]. Energy amp; Buildings, 2016(122):222-227.
[3] 徐欣,田喆. 天津市辦公建筑供暖負荷中短期預(yù)測, 暖通空調(diào) [J]. 2016, 46(4): 50-54+11.
[4] Sakkas N P,Abang R Thermal load prediction of communal district heating systems by applying data-driven machine learning methods[J]. Energy Reports . 2022(8): 1883-1895.
[5] 薛普寧, 周志剛, 蔣毅,等. 基于機器學(xué)習(xí)的供熱系統(tǒng)熱負荷多步遞歸預(yù)測[J]. 煤氣與熱力, 2019, 39(7): 20-27+42.
[6] 于曉娟, 顧吉浩, 齊承英,等. 幾種集中供熱負荷預(yù)測模型對比[J]. 暖通空調(diào),2019,49(2):96-99.
[7] 王少馳, 劉玉俠, 馬東亮,等. 供熱系統(tǒng)熱負荷預(yù)測分析及應(yīng)用, 區(qū)域供熱 [J]. 2023(2): 128-139+148.
[8] 趙秉文, 李婉,金宇 基于PSO-LSSVM的供熱負荷預(yù)測研究[J]. 建筑節(jié)能, (中英文), 2021, 49(6): 46-49+78.
[9] 尚海軍, 白新奎, 喬, 等. 基于深度學(xué)習(xí)的區(qū)域供熱逐時負荷預(yù)測研究[J]. 建筑熱能通風(fēng)空調(diào), 2022, 41(9): 6-8+21.
[10] 杜會軍. 基于PCA-BP神經(jīng)網(wǎng)絡(luò)的智慧建筑暖通空調(diào)能耗預(yù)測[J]. 制冷與空調(diào)(四川). 2023, 37(2): 225-230.。
[11] Gu J, Wang J, Qi C, et al. Medium-term heat load prediction for an existing residential building based on a wireless on-off control system[J]. Energy, 2018(152): 709-718.