侯博文,吳俊峰,陳煥新*,徐成良
(1-華中科技大學能源與動力工程學院,湖北武漢 430074;2-壓縮機技術(shù)國家重點實驗室(壓縮機技術(shù)安徽省實驗室),安徽合肥 230031)
近年來,隨著我國經(jīng)濟的快速發(fā)展,人民生活水平的進一步提高,全球能源消耗量逐年提升,能源短缺,資源供需不匹配等問題引起社會各界的關(guān)注,從2008—2018年,中國能源消耗總量一直呈現(xiàn)出上升趨勢,且10年間能源消耗總量增長了44.7%。作為中國三大“耗能大戶”的建筑能耗[1],占中國社會總能源消耗量的30%~35%,能源與發(fā)展的矛盾日益突出,智慧樓宇的節(jié)能需求迫切。從能耗預測技術(shù)[2-4]在行業(yè)內(nèi)的發(fā)展情況來看,基于數(shù)據(jù)驅(qū)動的能耗預測模型也是當前的主流選擇。
近年來,基于數(shù)據(jù)驅(qū)動的建筑能耗預測研究越來越廣泛。ZHAO等[5]從模型的復雜性、易用性和運行速度,所需投入和準確性等方面進行了比較分析。周峰等[6]采用支持向量機算法對建筑進行能耗預測和故障診斷,為建筑節(jié)能提供參考。FAN等[7]提出了一種基于數(shù)據(jù)驅(qū)動方法的通用的數(shù)據(jù)挖掘框架,闡述了數(shù)據(jù)挖掘技術(shù)在海量建筑數(shù)據(jù)中的應用前景。代德宇等[8-9]針對銅管生產(chǎn)過程中存在能源浪費的現(xiàn)象,提出了一種基于遺傳算法-反向傳播神經(jīng)網(wǎng)絡預測模型。曾宇柯等[10]提出了一種基于局部異常因子結(jié)合神經(jīng)網(wǎng)絡的多聯(lián)機故障診斷方案,有效提高故障檢測能力。19世紀40年代,多層神經(jīng)網(wǎng)絡就因其具有良好的學習特征被人們研究,但由于多層神經(jīng)網(wǎng)絡訓練時會出現(xiàn)局部最優(yōu)或者不能收斂的問題,導致多層神經(jīng)網(wǎng)絡沒能得到廣泛應用。直到多層神經(jīng)網(wǎng)絡的逐層訓練模式的出現(xiàn),使得深度學習自此開始應用于各個領(lǐng)域。
LI等[11]利用深度信念網(wǎng)絡算法消除溫室變量之間的相關(guān)性,提取溫室中氣象參數(shù)的特征,提取的特征向量被用于訓練和優(yōu)化LSSVM模型。GUO等[12]提出了一種基于深度學習網(wǎng)絡的深度診斷網(wǎng)絡建筑節(jié)能故障診斷方法,優(yōu)化后的模型故障診斷正確率為97.7%,與初始模型相比,正確率提高了5.05%。鄭毅等[13]基于深度信念網(wǎng)絡算法提出了一種區(qū)域PM2.5的預測方法,對訓練數(shù)據(jù)的選擇和模型參數(shù)的設(shè)置進行了優(yōu)化。張籍等[14]采用灰色關(guān)聯(lián)度分析法建立預測模型,定量分析各因素對不同行業(yè)的影響程度,對每一種預測類型建立基于深度信念網(wǎng)絡的中長期負荷預測模型。
本文的研究對象為河南省新鄉(xiāng)市某一辦公建筑中的空調(diào)系統(tǒng),該建筑為政府辦公建筑,水源熱泵系統(tǒng)是該辦公建筑用來制冷和供暖的主要設(shè)施,可以給室內(nèi)提供良好舒適的工作環(huán)境。夏季制冷時,水源熱泵機組工作原理就是將建筑物中的熱量轉(zhuǎn)移到水源中。
本文采用夏季居民建筑的能耗數(shù)據(jù)進行分析,獲得的數(shù)據(jù)包括室內(nèi)運行數(shù)據(jù)和室外氣象數(shù)據(jù),采集時間從2016-07-01的00:00至2016-08-22的13:50,由于數(shù)據(jù)的采集樣本間隔均為5 min,所獲得的原始數(shù)據(jù)共計15 144個數(shù)據(jù)樣本,參與建模的變量分布特征見表1所示,Pt為總功率,Tsup為回水溫度,qv為瞬時流量,hins為瞬時熱量,Tout為室外溫度,φ為相對濕度,Vw為室外風速,Il為光照強度。
表1 參與建模變量的數(shù)據(jù)分布特征
深度信念網(wǎng)絡(Deep Belief Network,DBN)由Geoffrey Hinton提出,作為深度學習的主要算法之一,目前被廣泛應用于回歸預測與圖像識別等領(lǐng)域。深度信念網(wǎng)絡由多層受限玻爾茲曼機(Restricted Boltzmann Machines,RBM)組成,受限玻爾茲曼機采用無監(jiān)督方法對模型參數(shù)進行訓練,應用貪婪算法逐層優(yōu)化每個隱藏層,最后結(jié)合反向微調(diào)算法對模型各層間的權(quán)值及模型閾值進行調(diào)節(jié),使模型誤差達到網(wǎng)絡設(shè)置要求。RBM僅由兩層神經(jīng)元組成,一層為可視層,用于輸入訓練數(shù)據(jù),另一層為隱藏層,用作特征檢測器。
深度信念網(wǎng)絡是建立在受限玻爾茲曼機的基礎(chǔ)之上,由于單層的RBM結(jié)構(gòu)只能學習到輸入數(shù)據(jù)的淺層特征,將多層RBM結(jié)構(gòu)疊加起來構(gòu)成多層網(wǎng)絡結(jié)構(gòu)來學習數(shù)據(jù)的深層特征。深度信念網(wǎng)絡的結(jié)構(gòu)圖如圖1所示,由多個RBM和一個具有預測功能的頂層算法組成,頂層算法一般根據(jù)算法的實際用途來進行選擇,本文選擇支持向量回歸(Support Vector Regression,SVR)作為預測器參與模型的構(gòu)建。整個DBN的網(wǎng)絡結(jié)構(gòu)由多個RBM疊加,上一個RBM的輸出作為下一個RBM的輸入,相鄰層與層之間采用全連接方式,層內(nèi)神經(jīng)單元各自獨立,DBN的輸入神經(jīng)元個數(shù)由輸入數(shù)據(jù)的變量個數(shù)決定。受限玻爾茲曼機的訓練過程常采用對比散度(Contrastive Divergence,CD)算法[15]來節(jié)約模型的訓練時間,其基本思想是在數(shù)據(jù)固定輸入的條件下,通過調(diào)節(jié)網(wǎng)絡參數(shù)來降低網(wǎng)絡模型的能量值。對比散度算法采用無監(jiān)督學習方法,能很好解決神經(jīng)網(wǎng)絡在模型訓練陷入局部最優(yōu)值的問題,有效縮短了模型的訓練時間。
圖1 DBN結(jié)構(gòu)圖
傳統(tǒng)神經(jīng)網(wǎng)絡模型在層數(shù)增加過程中,存在梯度爆炸,陷入局部最優(yōu)值以及訓練時間過長等問題,DBN能較好解決這些問題,訓練過程分為兩個階段:1)無監(jiān)督的逐層預訓練;2)有監(jiān)督的反向微調(diào)。
布谷鳥搜索算法(Cuckoo Search,CS)也稱杜鵑算法,是由劍橋大學的著名學者GANDOMI等[16]根據(jù)布谷鳥種群自身的寄生繁衍策略而提出的一種新型啟發(fā)式算法,相比于其他優(yōu)化算法,布谷鳥搜索算法具有收斂速度快、全局搜索能力強及通用性和魯棒性好等優(yōu)點。布谷鳥與其它鳥類的繁衍行為不同,布谷鳥從不哺育幼鳥,它們會特選擇與自己卵形相似,產(chǎn)蛋和育雛的時間大致相同的鳥類作為寄主,靠巢寄生行為來繁衍后代。布谷鳥算法在模擬布谷鳥尋窩的過程中,規(guī)定以下三個理想假設(shè):1)布谷鳥每次只下一個蛋,且根據(jù)自己的意愿選擇鳥窩孵化;2)隨機選擇過程中,屬于最優(yōu)鳥窩且存有布谷鳥蛋的鳥窩會被保存;3)鳥窩總體數(shù)量不會變,布谷鳥被鳥窩主人發(fā)現(xiàn)的概率為Pa。
STL(Seasonal and Trend Decomposition Using Loess)是一種經(jīng)典的時間序列分解方法,由Cleveland提出,常用的數(shù)據(jù)分解模型有兩種,分別是加法模型與乘法模型,如果對序列進行加法分解,其分解式[17]可以寫成:
式中,Tt為趨勢分量;St為周期分量;Rt為余項。
如果對序列進行乘法分解,其分解式為:
箱線圖又稱盒須圖,它既能顯示數(shù)據(jù)實際分布情況,又能直觀識別數(shù)據(jù)中的異常值,還可以將多組數(shù)據(jù)的分布特征顯示在同一張箱線圖上。箱線圖中判斷異常值是通過異常值截斷點來判斷,異常值截斷點之外的數(shù)據(jù)視為異常值數(shù)據(jù),最小值M1和最大值M2為兩個截斷點,計算方法見式(3)和式(4):
上四分位數(shù)和下四分位數(shù)的差值定義為四分位距(Inter Quartile Range,IQR),計算公式為:
在水庫上游設(shè)立水文站,及時提供準確、可靠的水文情報預報,為水庫防洪提供切實可靠的水雨情即時資料,便于水庫采取有效防洪措施。有供水任務時,可以隨時了解水庫水質(zhì)情況。此外,還可以掌握泥沙淤積等情況。
建立基于深度信念網(wǎng)絡的建筑空調(diào)能耗預測模型的本質(zhì)是利用深度學習算法對檢測到的原始數(shù)據(jù)進行分析處理,通過深度信念網(wǎng)絡算法對輸入模型的變量進行特征提取,采用支持向量回歸算法作為模型的預測器,通過系統(tǒng)檢測到的實時數(shù)據(jù)對預測模型進行訓練,使得模型能通過輸入檢測到的數(shù)據(jù)來進行下一時刻的能耗預測。能耗預測模型的建立流程如圖2所示,整個過程包括數(shù)據(jù)預處理、模型訓練、模型測試以及模型評價4個部分。
圖2 能耗模型建立流程
模型評價指標有助于發(fā)現(xiàn)所選模型在應用過程中的實際效果,模型建立過程中,訓練集中的數(shù)據(jù)用來建立模型,訓練過程中未采用的測試集數(shù)據(jù)則用來判斷模型的泛化性能,本文選擇平均絕對誤差MAE(Mean Absolute Error,MAE)、均方誤差MSE(Mean Squared Error,MSE)和決定系數(shù)(R2)三個指標作為能耗預測模型的評價指標:
式中,n為樣本數(shù)量;Yi為第i個樣本的實際值;Yi1為第i個樣本的預測值;Yavg為樣本的平均值。
對原始數(shù)據(jù)通過STL方法進行異常值檢測,得到供水溫度、回水溫度、瞬時熱量、室外溫度、相對濕度、室外風速和光照強度均存在異常值,對應的異常值數(shù)量分別為409、325、155、382、259、235、317、19和1 016,由于STL分解是基于時間序列的單變量分析,所以異常值中可能存在一行數(shù)據(jù)在多個變量中均被檢測為異常值。最終,通過對各個變量異常值的比較,基于STL的異常值檢測共篩選出2 435個異常樣本,占總體樣本個數(shù)的16.1%。
同時使用箱線圖方法對原始數(shù)據(jù)進行異常值檢測,通過式(3)和式(4)計算可知,供水溫度、回水溫度、瞬時熱量、室外溫度、相對濕度、室外風速和光照強度均存在異常值,按照式(3)和式(4)可計算出對應異常值數(shù)量分別為682、730、48、2、386、376和149,考慮異常值中可能存在一行數(shù)據(jù)在多個變量中均被檢測為異常值,通過對各樣本異常值的比較,最終基于箱線圖的異常值檢測方法共檢測出1 666個異常樣本,占總樣本個數(shù)的11%。
基于STL和基于箱線圖的異常值檢測方法分別檢測出了2 435和1 666個變量,鑒于所采用的兩種異常值檢測方法均屬于無監(jiān)督學習算法,分別被STL方法和箱線圖方法檢測為異常值的樣本也可能是正常樣本[18],因此,被STL和箱線圖兩種異常值檢測方法同時檢測為異常值的樣本認定為異常樣本,兩種方法均認定為異常值的樣本取交集,得到同時被STL和箱線圖兩種方法認定為異常值的樣本個數(shù)為488個,占總體樣本數(shù)量的3.3%。
為了不影響數(shù)據(jù)自身的統(tǒng)計特性,本節(jié)直接剔除數(shù)據(jù)的異常樣本,共計488個異常樣本被剔除,占總樣本數(shù)量的3.3%。通過基于STL和箱線圖兩種異常值處理后,共獲得14 656組數(shù)據(jù)。
圖3 基于DBN-A模型的能耗預測結(jié)果
為了確定隱藏層層數(shù)對模型預測結(jié)果的影響,本文設(shè)置不同的隱藏層層數(shù)來建立模型,除隱藏層層數(shù)外,隱藏層節(jié)點數(shù)均設(shè)為15個,迭代次數(shù)設(shè)置為200次,學習率設(shè)為0.01,其它網(wǎng)絡參數(shù)均按照初始化設(shè)置,當隱藏層層數(shù)為1至5時分別計算了模型的評價指標MAE和MSE以及和初始化模型的變化情況,取5次計算結(jié)果的平均值作為最終輸出,如表2所示,表中第一行為初始化隱藏層層數(shù)為2時的預測結(jié)果。
表2 基于不同隱藏層的DBN模型的誤差對比
由表2可知,相對于初始化模型(隱藏層層數(shù)為2),當隱藏層層數(shù)取其它值時,ΔMAE和ΔMSE均為正值,表明此時模型誤差增大,預測性能不佳,同時可以發(fā)現(xiàn)模型運行時間與隱藏層層數(shù)正比例相關(guān),同時隨著隱藏層層數(shù)的增加,模型訓練所消耗的時間也隨之增加,每增加一個隱藏層,模型訓練的時間增加25 s左右。
隱藏層節(jié)點數(shù)的確定影響深度信念網(wǎng)絡模型的預測性能,節(jié)點數(shù)選取過大或過小會導致過擬合或者欠擬合情況的發(fā)生,本文按照多種經(jīng)驗公式[19-21]計算隱藏層的節(jié)點數(shù),求得各層隱藏層節(jié)點數(shù)的范圍為[6, 20],本文將隱藏層節(jié)點數(shù)設(shè)置成不同的組合來驗證模型的預測性能,分別采用恒值型組合、升值型組合和降值型組合來進行隱藏層的組合,模型的迭代次數(shù)設(shè)置為200次,學習率設(shè)為0.01,分別計算模型評價指標以及模型運行時間,取5次計算結(jié)果的平均值作為最終輸出,如表3所示。
表3 不同隱藏層組合的預測結(jié)果
由表3可知,當模型隱藏層兩層節(jié)點數(shù)為9和15時,獲得具有最佳預測結(jié)果的建筑空調(diào)能耗預測模型,將此時模型記為DBN-B模型。
本文選用支持向量回歸算法作為模型的預測器,核參數(shù)g和懲罰因子C對模型預測精度的影響起關(guān)鍵作用。本節(jié)選用布谷鳥搜索算法對模型參數(shù)進行優(yōu)化。參數(shù)尋優(yōu)在經(jīng)過大約15次迭代后就取到了最優(yōu)適應度函數(shù)值,在之后的迭代過程中,適應度函數(shù)值逐步穩(wěn)定在1.059,此時深度信念網(wǎng)絡模型的參數(shù)已得到了優(yōu)化,模型中核參數(shù)g=4.59,懲罰因子C=6.61,將此時的能耗預測模型命名為CS-DBN模型。
圖4所示為基于CS-DBN模型的能耗預測結(jié)果。由圖4可知,預測能耗曲線較好反映了真實能耗的變化趨勢,且預測值與真實值之間的誤差程度減小,CS-DBN模型的MAE、MSE和R2分別為1.05,1.84和0.98,優(yōu)化后的模型預測評價指標相對于未優(yōu)化的DBN-B模型有較大程度提升,預測精度得到進一步的提高。
圖4 基于CS-DBN模型的能耗預測結(jié)果
本文為了獲得一個最優(yōu)的能耗預測模型,最大程度貼合建筑實際能耗,為建筑節(jié)能提供指導性意見。采用多種算法建立建筑空調(diào)能耗預測模型,分別建立了基于支持向量回歸、極限學習機和未優(yōu)化的深度信念網(wǎng)絡建立建筑空調(diào)能耗預測模型,表4所示為各模型預測的預測結(jié)果。
表4 各模型預測的預測結(jié)果
通過對5個模型預測性能評價指標的對比分析,在文中建立的所有能耗預測模型中,經(jīng)過網(wǎng)絡結(jié)構(gòu)參數(shù)選擇和布谷鳥搜索算法優(yōu)化后的CS-DBN模型的MAE和MSE最小,R2最大,模型預測性能最好,相比于未進行優(yōu)化的DBN-A模型,MAE由1.72減小為1.05,MSE由11.94減小為1.36,R2由0.88變?yōu)?.98,誤差指標大幅度減小,擬合指標大幅度增加,能耗預測模型得到進一步的優(yōu)化,可以認為經(jīng)過網(wǎng)絡結(jié)構(gòu)參數(shù)選擇和布谷鳥搜索算法優(yōu)化后的CS-DBN模型是最佳建筑空調(diào)預測模型。
本文通過構(gòu)建基于深度信念網(wǎng)絡算法對建筑進行能耗預測,對比了實際測量值與模型預測值,并對能耗模型進行了優(yōu)化,計算了相應的模型評價指標,得到如下結(jié)論:
1)經(jīng)過優(yōu)化后的支模型預測性能得到改善,平均絕對誤差由1.72降至1.05,均方誤差由11.94降至1.36,決定系數(shù)由0.88增至0.98;
2)將預測結(jié)果與測量值進行了對比,發(fā)現(xiàn)用電量低于5 kW·h的數(shù)據(jù)預測能力不是很理想,分析認為是沒有對開停機時的數(shù)據(jù)給予足夠重視。