謝吉洋,閆 冬,謝 垚,馬占宇
(1.北京郵電大學 模式識別與智能系統(tǒng)實驗室,北京 100876; 2.北京郵電大學 圖書館,北京 100876)(*通信作者電子郵箱mazhanyu@bupt.edu.cn)
區(qū)域供熱(District Heating, DH),也稱為區(qū)域集中供熱,是當前向建筑供熱的最為有效、環(huán)境友好和性價比高的供熱方法[1], 即便如此,它需要進一步提高供熱效率以降低運營成本并提高盈利能力。降低峰值負荷是提高供熱效率和節(jié)省燃料成本的關鍵問題。為了降低峰值,了解能源消耗模式并精確預測峰值負荷尤為重要。對于區(qū)域供熱網絡,希望可以根據熱力需求,以動態(tài)的方式(例如,每1 h或每15 min)調整供熱,降低供熱成本,達到提高盈利能力的目的, 因此,準確預測熱負荷是至關重要的。
許多外部因素對建筑熱負荷存在影響,例如氣候條件、建筑物特性、時間、社會學參數(shù)[2]等。預測模型需要將熱負荷與這些影響因素相關聯(lián),以確定它們對熱負荷的影響程度。氣候條件是熱負荷預測中較多涉及的一類因素, 其中,環(huán)境溫度是最重要的氣候條件,因為它決定了室內和室外的溫差,是熱傳遞的關鍵驅動力[3-4]。然而,僅考慮環(huán)境溫度是不夠的。為進一步提高熱負荷預測的準確性,現(xiàn)有研究已經嘗試考慮其他氣候條件,例如直接太陽輻射和風速,并且已經認識到二者對建筑物熱負荷的影響, 它們對建筑物熱負荷的具體影響尚未得到廣泛研究,特別是以定量方式[5]。文獻[6]使用多元自回歸模型(Multiple Autoregressive Model)研究了氣候因素與集中供暖系統(tǒng)熱負荷的線性相關性;文獻[7]討論了氣候因素對室內溫度的影響,以間接影響熱負荷。
應用于熱負荷預測的模型可分為兩類:1)物理模型,基于能量守恒定律和熱傳遞原理[8-9];2)統(tǒng)計模型,基于數(shù)據采集和處理技術[2, 10-11]。隨著智能儀表和能源網絡的完善以及數(shù)據采集、傳輸和存儲技術的發(fā)展,越來越多的能源數(shù)據可以應用于熱負荷預測領域,為統(tǒng)計模型開辟了更大的發(fā)展空間[12]?;诮y(tǒng)計模型的數(shù)據分析方法可以幫助研究者從大量數(shù)據中提取有價值的信息,進一步用于能源網絡管理和算法開發(fā)工作[13]。由于統(tǒng)計模型的獨特優(yōu)勢,如反映消費者社會行為模式的能力等,其在熱負荷預測方面吸引了越來越多的關注。通常,在能源網絡中,線性回歸(Linear Regression, LR)[3,14-15]、支持向量回歸(Support Vector Regression, SVR)[16-17]和神經網絡(Neural Network, NN)[18-19]等數(shù)據分析方法,已經廣泛應用于熱負荷預測領域,并顯示出良好的預測性能; 同時,文獻[2]使用混合高斯模型(Gaussian Mixture Model, GMM)預測多種條件下的建筑物熱負荷; 文獻[20]使用基于遺傳算法優(yōu)化BP(Back Propagation)神經網絡對供暖系統(tǒng)熱負荷進行預測。
本文旨在以定量方式討論直接太陽輻射和風速對建筑物熱負荷的影響, 為此,帶外部輸入的非線性自回歸(Nonlinear AutoRegressive with eXogenous input, NARX)神經網絡模型將被用于各種氣候條件下的熱負荷預測?,F(xiàn)有研究中,NARX神經網絡已應用于短時電力負荷預測[21-22]、長時電力負荷預測[23]和太陽能光伏發(fā)電負荷預測[24]等領域。本文結合多種氣候因素從能源生產側對區(qū)域供熱負荷進行建模預測,其結果可以直接用于優(yōu)化能源生產,從而達到節(jié)省燃料、降低成本的目的。
NARX神經網絡是用于時間序列預測的非線性動態(tài)循環(huán)網絡,是循環(huán)神經網絡(Recurrent Neural Network, RNN)的一種,由輸入層、輸出層、反饋層和多個隱含層組成。輸入層、隱含層和輸出層的結構類似于前饋神經網絡(Feed-Forward Neural Network, FFNN),而它的反饋層連接網絡的輸入和輸出層[23]。在NARX神經網絡模型中,反饋層節(jié)點的作用是存儲上一時刻輸出層節(jié)點的輸出值,可以看作一種時間延遲算子。具有多個隱含層的NARX神經網絡的結構如式(1)~(4)所示:
x1(k)=f[w1u(k)+wcxc(k)]
(1)
xi(k)=f[wixi-1(k)];i=1,2,…,s
(2)
xc(k)=y(k-1)
(3)
y(k)=g[ws+1xs(k)]
(4)
其中:s是隱含層層數(shù),u(k)是在時間k時的神經網絡輸入,xc(k)和xi(k)是反饋層和隱含層的輸出,y(k)是輸出層的輸出,wi是隱含層之間連接的權值矩陣,wc是連接反饋層和隱含層的權值矩陣,f(·)和g(·)是傳遞函數(shù)。NARX神經網絡的結構如圖1所示。
圖1 NARX神經網絡的結構
從供熱公司獲取到的2008 — 2011年期間(1 461 d)的小時測量數(shù)據,包括熱負荷、環(huán)境溫度、直接太陽輻射和風速數(shù)據。本文通過實施短時和長時熱負荷預測以研究直接太陽輻射和風速數(shù)據對熱負荷預測性能的影響: 在短時熱負荷預測中,2008- 10至2009- 02(5個月)的數(shù)據用于模型訓練,2009- 03(1個月)的數(shù)據用于模型驗證,以選擇NARX神經網絡模型參數(shù);在長時熱負荷預測中,2010年(1年)、2009 — 2010年(2年)和2008 — 2010年(3年)的數(shù)據分別用于模型訓練,2011年(1年)的數(shù)據用于模型驗證以討論直接太陽輻射和風速數(shù)據對熱負荷預測性能的影響。由于工作日和非工作日的熱負荷數(shù)據的差異性,本文工作的重點放在工作日期間的熱負荷預測研究,以達到更高的預測精度,所以在實驗過程中只選取工作日數(shù)據用于模型訓練和驗證。
為了評估直接太陽輻射和風速對熱負荷預測精度的影響,本文構建了4個數(shù)據集用于NARX神經網絡模型的訓練和測試,詳細描述信息見表1。
表1 數(shù)據集描述
注:“○”表示該數(shù)據集包含該維度數(shù)據,“×”表示該數(shù)據集不包含該維度數(shù)據。
本文訓練NARX神經網絡用于預測熱負荷。在短時熱負荷預測中,為了研究滑動窗口長度對熱負荷預測性能的影響,連續(xù)的2、4或8 h的歷史熱負荷數(shù)據分別組合成為歷史熱負荷數(shù)據向量,并與環(huán)境溫度等外部因素分別按照表1所描述的形式組成數(shù)據集A~D。
在模型訓練過程中,本文選擇滑動窗口長度的一半作為滑動步長用以更新歷史熱負荷數(shù)據向量。例如,如果選擇 4 h作為滑動窗口長度,并且討論同時引入直接太陽輻射和風速(數(shù)據集D)對熱負荷預測精度的影響,則滑動步長是2 h,在訓練過程中,第一次訓練時NARX神經網絡的輸入u(1)將包含從第1~4 h的歷史熱負荷數(shù)據、第5 h的環(huán)境溫度、直接太陽輻射和風速數(shù)據,同時將第5 h的熱負荷數(shù)據作為NARX神經網絡的理想輸出yd(1);第二次訓練時輸入u(3)將包含從第3~6 h的歷史熱負荷數(shù)據、第7 h的環(huán)境溫度、直接太陽輻射和風速數(shù)據,同時將第7 h的熱負荷數(shù)據作為理想輸出yd(3),以此類推直到數(shù)據集D中所有數(shù)據都被用于模型訓練。
同時,為了研究NARX神經網絡中的隱含層數(shù)對熱負荷預測性能的影響,本文選擇4和8層作為NARX神經網絡的隱含層數(shù)并應用于模型訓練。如上所述,在短時熱負荷預測中討論訓練數(shù)據滑動窗口長度和神經網絡隱含層數(shù)的2個維度,以選擇在長時預測中所使用的模型。
NARX神經網絡的訓練步驟如式(5)~(7)所示:
i=1,2,…,m;j,l=1,2,…,n;
p=2,3,…,s;q=1,2,…,r
(5)
(6)
(7)
其中:ηp(p=1,2,…,s+1)和ηc分別是wp和wc的學習速率;m、n和r分別是輸出層、隱含層和輸入層節(jié)點數(shù);s是隱含層數(shù)。
在使用1.2節(jié)中的數(shù)據集對NARX神經網絡模型進行訓練前,需要對數(shù)據進行預處理。本文使用Z分數(shù)(Z-Score)對數(shù)據進行標準化處理。對數(shù)據集中的數(shù)據向量x=[x1,x2,…,xn]的標準化處理方法如式(8)所示:
(8)
為了評估熱負荷預測模型性能,本文使用平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)和均方根誤差(Root Mean Squared Error, RMSE)作為評估標準。MAPE是衡量模型性能的相對指標,它的定義如式(9)所示:
(9)
RMSE是衡量模型性能的絕對指標。RMSE與實際熱負荷數(shù)據和預測值都具有相同的量綱,這樣很容易計算實際熱負荷值和預測值之間的絕對誤差。RMSE的定義如式(10)所示:
(10)
其中:yi是實際熱負荷值,ypi是與真實值相對應的預測值,n是熱負荷預測步長。
學生t檢驗(Student’s t-test)是作出基本統(tǒng)計分布的假設用于確定兩組數(shù)據是否具有顯著差異性的統(tǒng)計假設檢驗。本文使用具有不同參數(shù)或因素(例如滑動窗口長度、隱含層的數(shù)量和氣候因素等)的熱負荷預測模型進行預測,并將計算的MAPE進行t檢驗;然后判斷不同模型的MAPE是否具有相同的平均值以及相同但未知的方差,以確定這些因素是否在提高模型性能中起決定性作用;同時,箱線圖(Boxplot)用于可視地描述MAPE的分布情況,包括5個數(shù)值點:最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)和最大值。
在短時熱負荷預測中,為了研究滑動窗口長度和隱含層數(shù)對熱負荷預測精度的影響,本文提出6個模型如表2所示。每個模型分別使用表1所描述的數(shù)據集A~D進行10次訓練和驗證,即進行240組實驗,以分析短時熱負荷預測的誤差分布情況。
表2 不同模型對應的滑動窗口長度和隱含層數(shù)設置
本文通過對每個模型進行訓練和驗證,共獲得240組實驗結果。每個模型得到的實驗結果計算所得的MAPE和RMSE的均值和方差如表3和表4所示。本文使用加粗效果突出顯示由同一數(shù)據集訓練的模型的MAPE和RMSE的最小均值和方差。對于每個實驗組的預測結果,MAPE的平均值在4%和5%之間,RMSE的平均值在[17,21]。每組實驗的預測的MAPE的方差小于1.50E-05,并且大多數(shù)RMSE的方差小于2; 同時,時間窗口長度為4 h的NARX神經網絡的熱負荷預測性能優(yōu)于具有另兩種時間窗口長度的NARX神經網絡;而擁有不同隱含層數(shù)的NARX神經網絡的熱負荷預測性能之間差別不大。
表3 短時熱負荷預測中MAPE的均值和方差
表4 短時熱負荷預測中RMSE的均值和方差
對兩組結果的MAPE進行t檢驗,得到p值(p-value)如表5和表6所示,統(tǒng)計顯著性水平為0.05(α= 0.05)。兩組結果對應模型之間的滑動窗口長度或隱含層數(shù)不同,而其他參數(shù)相同,例如,對具有不同隱含層數(shù)模型結果的MAPE之間進行t檢驗,滑動窗口長度應當保持相同。如果計算的p值低于統(tǒng)計顯著性水平,則拒絕零假設并接受備擇假設(二者具有顯著性差異)。
表5 滑動窗口長度為2、4或8 h的模型結果的 MAPE之間的進行t檢驗的p值
表6 隱含層數(shù)為4或8的模型結果的 MAPE之間的進行t檢驗的p值
使用4個數(shù)據集訓練得到的模型計算的MAPE的箱線圖如圖2所示。本文在圖2中分別用方框突出顯示了由數(shù)據集A~D分別訓練得到的最佳模型,其MAPE分布最為集中并且具有最小中位數(shù)。根據圖2,“NARX_4_4”模型在數(shù)據集A、C和D上的MAPE均最為集中且具有最小的中位數(shù)。而在數(shù)據集B上只有“NARX_4_8”模型略好于“NARX_4_4”模型,而其他4個模型均較差。因此,由圖2可以得出,“NARX_4_4”模型是最佳模型。
比較具有不同隱含層數(shù)的模型結果,具有4個隱含層的模型的MAPE和RMSE分別略小于具有8個隱含層的模型。此外,t檢驗的所有結果顯示統(tǒng)計學上沒有顯著差異性,這意味著增加神經網絡的隱含層數(shù)量不是提高熱負荷預測精度的有效方式。隱含層數(shù)為8層時,NARX神經網絡可能過擬合; 同時,當隱含層數(shù)增加時,模型的訓練時間將成倍數(shù)地延長。本文選擇擁有4個隱含層的NARX神經網絡。
圖2 短時熱負荷預測中使用4個數(shù)據集訓練模型的 MAPE繪制的箱線圖
比較具有不同滑動窗口長度的模型結果,具有4 h滑動窗口的神經網絡的MAPE和RMSE小于具有2或8 h滑動窗口的神經網絡;同時,t檢驗的結果表明2和4 h滑動窗口的分布不具有統(tǒng)計學顯著差異性;然而,2和8、4和8 h滑動窗的分布具有統(tǒng)計學顯著性差異,所以時間窗口長度為2或4 h的NARX神經網絡顯著優(yōu)于時間窗口長度為8 h的NARX神經網絡,但前兩者并沒有顯著區(qū)別。根據圖2中的箱線圖,時間窗口長度為4 h的NARX神經網絡好于時間窗口長度為2 h的NARX神經網絡。本文選擇4 h作為滑動窗口長度。
綜上所述,NARX神經網絡的最佳參數(shù)是4 h時間窗口和4隱含層,即“NARX_4_4”模型是最佳模型,此模型將被用于接下來的實驗中。
本節(jié)通過短時熱負荷預測將2.1節(jié)中選擇的最優(yōu)NARX神經網絡模型“NARX_4_4”與線性回歸模型、支持向量回歸模型和神經網絡模型等多種時間序列預測模型進行比較。其中,線性回歸模型選擇帶有外部輸入的整合自回歸滑動平均(AutoRegressive Integrated Moving Average with eXogenous input, ARIMAX)模型[25]、支持向量回歸模型選擇libsvm工具箱實現(xiàn)的epsilon-SVR[26]、神經網絡選擇前饋神經網絡[18]。前饋神經網絡的隱含層數(shù)和隱含層節(jié)點數(shù)分別設置為4和15,與NARX神經網絡相同。所有模型的時間窗口長度均設置為4 h。在短時熱負荷預測中,2008- 10至2009- 02(5個月)的數(shù)據用于模型訓練,2009- 03(1個月)的數(shù)據用于模型驗證。
表7展示了每個模型在4個數(shù)據集上得到的實驗結果計算所得的MAPE和RMSE的均值,每個模型在每個數(shù)據集上均重復訓練10次。本文使用加粗效果突出顯示由同一數(shù)據集訓練的模型的MAPE和RMSE的最小均值。從表7中可以看出:ARIMAX模型在4個數(shù)據集上的熱負荷預測性能均為最差,MAPE均大于11%,RMSE均大于43,也就是說線性回歸模型并不適合于預測快速變化的小時熱負荷數(shù)據;同時,epsilon-SVR和前饋神經網絡的熱負荷預測性能較好,而后者略好于前者;NARX神經網絡在4個數(shù)據集上的熱負荷預測性能均為最優(yōu),并且MAPE和RMSE均遠小于其他模型。
因此,與其他三種模型相比,NARX神經網絡更適合用于熱負荷預測。眾所周知,當神經網絡的隱含層數(shù)足夠多時,神經網絡可以用于擬合任意非線性函數(shù)映射,并且具有較強的泛化性能,因此,相對于傳統(tǒng)機器學習模型,例如線性回歸模型和支持向量回歸模型,由于神經網絡可以有效擬合快速變化的小時熱負荷數(shù)據,神經網絡的熱負荷預測性能較高;同時,由于熱負荷數(shù)據具有一定的準周期特性,循環(huán)神經網絡相對于傳統(tǒng)的神經網絡,例如前饋神經網絡可以更好地擬合熱負荷數(shù)據在時間上的準周期特性,因此,作為循環(huán)神經網絡的一種,NARX神經網絡在熱負荷預測性能優(yōu)于前饋神經網絡。上述實驗結果和分析表明,NARX神經網絡相對于其他模型更適合用于熱負荷預測。
在長時熱負荷預測中,2010年(1年)、2009 — 2010年(2年)和2008 — 2010年(3年)的數(shù)據分別對“NARX_4_4”模型進行訓練,并將訓練好的模型命名為“NARX_1”“NARX_2”“NARX_3”;2011年(1年)用于模型驗證。每個模型分別使用數(shù)據集A~D訓練10次,以分析長時熱負荷預測的誤差分布情況。
每個模型得到的實驗結果計算所得的MAPE和RMSE的均值和方差如表8和表9所示。本文使用加粗效果突出顯示由同一數(shù)據集訓練的模型的MAPE和RMSE的最小均值和方差。對于每個實驗組的預測結果,MAPE的平均值在6%和8%之間,RMSE的平均值在[15, 18]。每組實驗的預測的MAPE的方差小于2.00E-05,并且大多數(shù)RMSE的方差小于1?!癗ARX_3”模型的MAPE在4個數(shù)據集上均低于“NARX_1”和“NARX_2”模型,然而,“NARX_3”模型的RMSE與“NARX_2”模型基本相等,且均低于“NARX_1”模型。
表7 多種時間序列預測模型的熱負荷性能比較
表8 長時熱負荷預測中MAPE的均值和方差
不同模型的MAPE之間的t檢驗得到的p值如表10所示,統(tǒng)計顯著性水平為0.05(α= 0.05)。t檢驗的結果表明,具有不同訓練集大小的模型的MAPE的分布具有統(tǒng)計學顯著差異性。
表10 長時熱負荷預測中不同模型的MAPE之間的t檢驗得到的p值
使用4個數(shù)據集訓練的每個模型的MAPE箱線圖如圖3所示。由圖3可以看出,“NARX_3”模型的MAPE在4個數(shù)據集上均最為集中且具有最小的中位數(shù),這表明當使用更多的訓練數(shù)據來訓練模型時,可以獲得更高的預測精度和模型穩(wěn)定性。
圖3 長時熱負荷預測中使用4個數(shù)據集訓練模型的 MAPE繪制的箱線圖
比較具有不同訓練集大小模型的結果,使用越大的訓練集來訓練熱負荷預測模型,MAPE和RMSE越小。當使用1年數(shù)據訓練模型時,MAPE大于6.7%,RMSE大于16;當使用2年數(shù)據訓練模型時,MAPE和RMSE分別降低到6.5%和15.5;當使用3年數(shù)據訓練模型時,MAPE和RMSE分別降低到6.4%和15.3。t檢驗的結果表明,具有不同訓練集大小的模型的MAPE的分布具有統(tǒng)計學顯著差異性, 這意味著增加訓練集的數(shù)量可以有效提高熱負荷預測精度,即有效降低MAPE和RMSE。
基于實驗結果,本文選擇“NARX_3”模型來分析影響因素的對熱負荷預測的影響。
本文使用數(shù)據集A~D的數(shù)據訓練“NARX_3”模型,并將訓練好的模型命名為“NARX_A”“NARX_B”“NARX_C”和“NARX_D”。它們分別使用熱負荷和溫度數(shù)據,熱負荷、溫度和直接太陽輻射數(shù)據,熱負荷、溫度和風速數(shù)據,熱負荷、溫度、直接太陽輻射和風速數(shù)據作為輸入,如表11所示。本文只展示2011- 01- 10 — 11的熱負荷數(shù)據的真實值和預測值(單位:兆瓦特(Million Watt, MW))曲線作為示例,如圖4所示。可以從圖4中看出,雖然4個數(shù)據集上的預測值較為接近,但是數(shù)據集D對應的預測值相對于其他數(shù)據集的預測值更接近實際熱負荷數(shù)據,即“NARX_D”模型的誤差相對較小,對應的MAPE和RMSE如表11所示。
圖4 2011- 01- 10 — 11熱負荷數(shù)據的真實值和預測值曲線
模型MAPE/%RMSE模型MAPERMSENARX_A6.4916.80NARX_C6.3715.22NARX_B6.4115.63NARX_D6.3514.92
根據實驗結果,所有模型都能夠反映熱負荷變化,MAPE均小于7%,RMSE均小于17,其中“NARX_D”模型具有最佳熱負荷預測精度。引入直接太陽輻射和風速對NARX神經網絡的性能有積極影響,因為“NARX_B”“NARX_C”和“NARX_D”模型分別具有比“NARX_A”模型更小的MAPE和RMSE,因此,直接太陽輻射和風速都是影響熱負荷的重要影響因素。相比之下,由于“NARX_C”模型具有比“NARX_B”模型更低的MAPE和RMSE,引入風速對于提高熱負荷預測精度有更大幫助, 這意味著風速是一個更重要的參數(shù); 同時,由于“NARX_D”模型具有最佳的熱負荷預測性能,當引入風速和直接太陽輻射可進一步提高模型精度。
絕對百分比誤差(Absolute Percentage Error, APE)的分布如圖5所示。對于所有模型,大多數(shù)APE誤差(>60%)在-5%~5%。不過,值得注意的是,盡管“NARX_A”具有最高的MAPE,但APE在-5%~5%的范圍內的數(shù)據點數(shù)也是最多的。同時,還有很多數(shù)據點對于熱負荷的估計過低。
圖5 APE的分布
環(huán)境溫度、直接太陽輻射和風速已被確定為預測建筑物熱負荷的關鍵影響因素。為了了解不同因素的影響,本文將NARX神經網絡模型用于區(qū)域供熱網絡中的熱負荷預測,引入不同影響因素的數(shù)據集進行NARX神經網絡訓練,并通過多組實驗對這些NARX神經網絡的熱負荷預測性能進行了比較。根據實驗結果,可以得出以下結論:
1)NARX神經網絡能夠用于熱負荷預測。本文選擇4 h作為滑動窗口長度并且使用4個隱含層的NARX神經網絡進行實驗。當引入環(huán)境溫度作為唯一的影響因素時,MAPE小于7%。
2)一般來說,引入風速在內的NARX神經網絡的總體MAPE(6.37%)比引入直接太陽輻射(6.41%)更低,并且也擁有較低的RMSE,這意味著風速是一個更重要的影響因素。
3)引入風速和直接太陽輻射能夠得到最佳的模型性能(MAPE = 6.35%),然而,相對于只引入環(huán)境溫度,同時引入風速和直接太陽輻射對于降低MAPE和RMSE的貢獻較小,所以同時引入風速和直接太陽輻射不能有效提高NARX神經網絡的模型精度。
出現(xiàn)上述情況可能是由于以下原因:
1)一個因素的對于供熱負荷影響已經包含在另一個因素中(例如,溫度可能反映風速對熱負荷的影響),因此,不必在分析中包含更多的冗余信息。我們將在以后的研究中進行進一步的驗證。
2)對于NARX神經網絡,集成多種影響因素有不同的方法。為了進一步改善NARX神經網絡,可以采用其他影響因素融合方法。例如,利用分層神經網絡的原理,可以分別對多個具有單一因素的NARX神經網絡進行訓練,然后將這些經過訓練的NARX神經網絡組合起來,以獲得新的模型進行預測。
3)數(shù)據不連續(xù)性和異常值,包括加性離群值、水平位移等,是影響數(shù)據質量的因素,也可能影響熱負荷預測的性能[27], 因此,有必要提高獲得數(shù)據的質量。在未來的工作中,應在模型訓練和驗證之前對實際熱負荷數(shù)據的質量進行評估。