戴坤成, 王貴評, 趙 超
(福州大學石油化工學院, 福建 福州 350116)
基于PCA與RBF的建筑能耗預測建模
戴坤成, 王貴評, 趙 超
(福州大學石油化工學院, 福建 福州 350116)
由于建筑能耗因子間存在非線性和高度冗余特性, 傳統(tǒng)預測方法很難消除數(shù)據(jù)之間冗余和捕捉非線性特征, 導致預測精度較低. 為了提高建筑能耗預測精度, 提出一種將主成分分析(principal component analysis, PCA)和徑向基函數(shù)(radial basic function, RBF)神經(jīng)網(wǎng)絡相結合的建筑能耗預測方法(PCA-RBF). 利用PCA消除建筑能耗高維變量數(shù)據(jù)的相關性, 并按累積貢獻率提取主成分, 將主成分作為RBF神經(jīng)網(wǎng)絡的輸入進行訓練學習. 通過PCA避免了模型過多的輸入導致的訓練耗時長及預測精度較低的不足. 通過將PCA-RBF模型方法應用于某辦公建筑能耗的預測中, 并與RBF神經(jīng)網(wǎng)絡及BP神經(jīng)網(wǎng)絡模型相比, 實驗結果表明PCA-RBF模型方法能有效提高建筑能耗預測精度.
建筑能耗; 主成分分析; RBF神經(jīng)網(wǎng)絡; 正交試驗; 組合預測
隨著建筑能耗在我國能源消耗中的比重日益增長, 建筑節(jié)能受到全社會越來越多的關注. 準確有效地預測建筑能耗是進行建筑能耗分析及節(jié)能評估的重要基礎, 也是建筑節(jié)能優(yōu)化設計的主要依據(jù)[1]. 建筑能耗系統(tǒng)是由多因素組成的復雜系統(tǒng), 單體建筑能耗與圍護結構傳熱系數(shù)、 窗墻比、 體形系數(shù)、 遮陽系數(shù)、 室外溫度及設備啟停等因素之間存在復雜的非線性關系, 且各因素之間存在很強的相關性, 使得建立建筑能耗精確預測模型面臨極大的困難.
人工神經(jīng)網(wǎng)絡因其具有強大的非線性映射和函數(shù)逼近能力, 目前已成為解決非線性動態(tài)系統(tǒng)建模問題的有效方法[2-7]. RBF神經(jīng)網(wǎng)絡作為近年來受到廣泛關注的一種新型前饋神經(jīng)網(wǎng)絡, 因其具有結構簡單、 收斂速度快以及推廣能力強等特點, 已經(jīng)廣泛應用于建筑能耗建模與分析領域[8-10].
傳統(tǒng)基于神經(jīng)網(wǎng)絡的建筑能耗預測方法是簡單地把所有能耗影響因素或人為地將部分主要因素作為神經(jīng)網(wǎng)絡模型的輸入. 盡管RBF神經(jīng)網(wǎng)絡具有強大的非線性映射能力和良好的泛化性能, 但是輸入變量之間存在的強耦合、 非線性特性勢必影響模型的精度和泛化能力. 因此需要尋找一種能夠準確提取變量間重要信息的方法來消除變量之間的相關性, 從而有效提高建模精度, 降低計算復雜度.
主成分分析(PCA)是進行數(shù)據(jù)壓縮和信息提取的一種有效方法[11]. 其主要思想是將由原始變量構成的高維數(shù)據(jù)空間投影到低維特征空間. 新特征空間的主元變量既保留了原始變量的主要信息, 又消去了變量間的冗余信息.
為了提高RBF神經(jīng)網(wǎng)絡建筑能耗模型的預測精度和模型泛化能力, 本文結合PCA的特征提取功能和RBF網(wǎng)絡強大的函數(shù)逼近能力, 提出一種基于PCA和RBF神經(jīng)網(wǎng)絡的建筑能耗預測建模方法. 通過機理分析確定建筑能耗主要影響因素的基礎上, 采用主元分析方法對輸入變量進行特征提取, 消除輸入變量之間的相關性, 將新的特征信息作為RBF神經(jīng)網(wǎng)絡的輸入變量建立建筑能耗預測模型. 最后對某一辦公建筑的能耗進行預測, 并與BP網(wǎng)絡、 RBF網(wǎng)絡的預測結果進行比較, 結果表明PCA-RBF預測模型的性能優(yōu)于其它兩種預測模型.
PCA作為輸入數(shù)據(jù)降維和揭示變量間線性相關關系的一種統(tǒng)計相關分析技術, 從可觀測的顯式變量中提取信息, 組成不可直接觀測的隱含變量, 在保證信息數(shù)據(jù)丟失最少原則下對高維變量空間進行降維, 達到消除冗余信息的目的. PCA的主要步驟如下:
設有樣本數(shù)據(jù)集X=[x1,x2, …,xn],xk=[x1,x2, ...,xf]T,k表示樣本序號,f表示維數(shù);λ1≥λ2≥…≥λf≥0為協(xié)方差矩陣V的特征根;L=[L1,L2, …,Lf],Li=[γ1i,γ2i, …,γfi]T是與λi對應的協(xié)方差矩陣V的單位正交特征向量, 則樣本數(shù)據(jù)X的第i個主元成分Yi可表示為:
確定主元個數(shù)t的方法可以用經(jīng)驗法, 即取最小的t使得:
式中:η為常數(shù), 一般取η=0.9, 即保證前t個主成分的累積貢獻率超過90%.
RBF神經(jīng)網(wǎng)絡由輸入層、 隱含層和輸出層3層組成[12-13]. 輸入層節(jié)點只傳遞輸入信號到隱含層; 非線性隱含層節(jié)點一般由輻射狀的作用函數(shù)構成, 徑向基函數(shù)通常采用高斯函數(shù); 線性輸出層作用函數(shù)通常選取線性函數(shù), 網(wǎng)絡的輸出為隱含層節(jié)點輸出的線性加權和. 本文RBF神經(jīng)網(wǎng)絡隱含層節(jié)點的徑向基函數(shù)采用高斯函數(shù), 隱含層第l神經(jīng)元的轉換函數(shù)為:
式中:Y為輸入矩陣向量;cl和σl分別為高斯函數(shù)中心和寬度. 輸出層輸出如下:
式中:Zp表示第p個網(wǎng)絡輸出值;Wp為輸出層神經(jīng)網(wǎng)絡的閥值;Wlp為輸出層神經(jīng)網(wǎng)絡的權值;q為隱含層節(jié)點數(shù).
3.1 輸入?yún)?shù)的選擇
在應用神經(jīng)網(wǎng)絡建立建筑能耗預測模型過程中, 首先需要對影響建筑能耗的因素進行分析, 選擇對期望能耗影響較大的一些因素, 組成預測模型的有效輸入變量集. 影響建筑能耗的因素眾多, 主要包括外部條件、 建筑構造和室內(nèi)條件三個方面[14-15]:
參考相關文獻, 本文最終選取最低照度(x1)、 燈光熱擾(x2)、 室外干球溫度(x3)、 室外相對濕度(x4)、 設備熱擾(x5)、 電熱轉換率(x6)、 人均新風指標(x7)、 家具系數(shù)(x8)、 外墻傳熱系數(shù)(x9)、 內(nèi)墻傳熱系數(shù)(x10)、 玻璃遮陽系數(shù)(x11)、 玻璃傳熱系數(shù)(x12)、 通風次數(shù)(x13)13個參數(shù)作為能耗模型的輸入?yún)?shù).
3.2 建模步驟
圖1 PCA-RBF預測模型結構圖 Fig.1 Structure of the predictive model based on PCA and RBF
為了提高RBF神經(jīng)網(wǎng)絡建筑能耗模型的預測精度和模型泛化能力, 采用主元分析方法對RBF網(wǎng)絡輸入變量進行特征提取, 將特征提取后的主元作為網(wǎng)絡新的輸入, 建立建筑能耗預測模型, 模型結構如圖1所示.
基于PCA-RBF建筑能耗預測建模關鍵步驟可描述如下:
1) 數(shù)據(jù)歸一化處理. 根據(jù)式(5)對數(shù)據(jù)進行歸一化處理, 有T=[T1,T2, …,T13].
(5)
式中:xi(k)為建筑能耗影響因素xi第k個樣本的采樣值,Xi-max、Xi-min為影響因素xi的最大值和最小值;Tmax、Tmin為歸一化的最大值和最小值, 取Tmax=1、Tmin=-1.
2) 提取樣本主元. 根據(jù)第2節(jié)所提的PCA方法提取樣本數(shù)據(jù)主成分, 并保證主成分累積貢獻率超過90%.
3) 建立RBF神經(jīng)網(wǎng)絡模型. 以PCA提取的主成分數(shù)據(jù)作為RBF神經(jīng)網(wǎng)絡的訓練樣本數(shù)據(jù), 采用K-均值聚類法確定網(wǎng)絡中心, 使用最小二乘法確定網(wǎng)絡權值, 建立RBF神經(jīng)網(wǎng)絡建筑能耗模型.
4) 采用測試集的數(shù)據(jù)檢驗所建立的RBF神經(jīng)網(wǎng)絡模型的預測效果, 若預測結果不滿意則返回步驟3)重新訓練網(wǎng)絡.
4.1 建筑簡介
圖2 辦公建筑外形示意圖 Fig.2 Shape of office building
用于驗證本文所建立的PCA-RBF建筑能耗預測模型的建筑是國內(nèi)某地區(qū)的一棟辦公建筑, 該建筑為東西朝向的高層現(xiàn)澆鋼筋混凝土框架-筒體結構建筑, 建筑外形示意圖如圖2所示.
建筑總高度為57.4m, 主樓地上16層, 地下1層, 附樓(裙房)三層. 總建筑面積為19 700.5m2. 地上建筑面積17 315.62m2, 地下建筑2 384.88m2, 標準層層高3.5m, 外窗尺寸為2.5m×2.0m, 窗臺離地高度0.8m. 地下室磚墻為普通實心磚墻, 地上建筑磚墻厚度均為190mm, 實際墻厚200mm. 外墻開窗比例約為0.23, 無外遮陽, 設室內(nèi)窗簾. 空調(diào)運行時間為8:00到17:00, 總計每天運行9h, 空調(diào)季為6月1日到8月30日.
4.2 評價指標
為了從整體上評價預測模型的預測精度和穩(wěn)定性, 采用相對誤差最大值Emax、 相對誤差平均值Eave和均方根誤差RMSE三個性能指標對預測模型進行評估.
相對誤差最大值Emax反映了預測值與期望值的最大偏離程度; 相對誤差平均值Eave反映了預測值與期望值之間誤差的大??; 均方根誤差RMSE反映了誤差分布的離散程度, RMSE越大, 誤差序列越離散, 預測效果越差. 三個指標Emax、Eave、 RMSE都是越小說明預測效果越好.
4.3 構造樣本集
為減少試驗次數(shù), 并保證試驗的全面性, 本文采用正交試驗方法獲取數(shù)據(jù)樣本集. 在仿真模擬過程中按照GB50189-2005《公共建筑節(jié)能設計標準》進行節(jié)能參數(shù)設置, 室外干球溫度、 太陽輻射等其他參數(shù)選用歷史平均水平. 影響因子的取值, 采用事先設定好的水平值, 每個因子選取3個水平值, 選用L27(313)正交表進行試驗計算[16]. 為獲得較為理想的訓練數(shù)據(jù), 本文進行四組正交試驗, 經(jīng)DeST-C計算獲108組實驗數(shù)據(jù), 隨機取其中的3/4作為訓練樣本, 余下的1/4作為測試樣本驗證模型的預測性能.
4.4 模型訓練
首先對樣本數(shù)據(jù)進行主元分析, 計算得到的碎石圖如圖3所示. 由圖3可知, 當主成分個數(shù)為4時,η≥0.9之后, 將這4個主元作為RBF神經(jīng)網(wǎng)絡的輸入樣本以進行學習訓練, 獲得RBF神經(jīng)網(wǎng)絡預測模型.
應用訓練后的預測模型對訓練樣本進行檢驗, 擬合結果如圖4所示. 圖4中菱形和方形標記基本重疊在一起, 這表明所建立的PCA-RBF模型對學習樣本具有很好的擬合精度.
圖3 主成分碎石圖
4.5 結果分析
圖5 模型預測比較Fig.5 Comparison of models prediction
應用PCA-RBF模型對27組測試樣本進行預測, 并與單一的RBF神經(jīng)網(wǎng)絡和BP神經(jīng)網(wǎng)絡預測結果進行對比. 該辦公樓建筑能耗的PCA-RBF模型、 RBF神經(jīng)網(wǎng)絡模型、 BP神經(jīng)網(wǎng)絡模型的預測輸出曲線如圖5所示.
為從整體上評價兩種預測模型的預測精度和穩(wěn)定性, 根據(jù)式(6)、 (7)、 (8)計算預測結果的相對誤差最大值Emax、 相對誤差平均值Eave和均方根誤差RMSE, 計算結果如表1所示:
由表1可以看出, PCA-RBF組合模型預測結果的均方根誤差為3.56, 比BP神經(jīng)網(wǎng)絡的29.22和RBF神經(jīng)網(wǎng)絡的9.13都要小, 這表明組合模型預測
方法減小了預測數(shù)據(jù)的波動幅度, 提高了預測數(shù)據(jù)的穩(wěn)定程度, 并且預測精度也有所提高, 其相對誤差平均值為1.43%, 也小于BP神經(jīng)網(wǎng)絡的5.84%及RBF神經(jīng)網(wǎng)絡的3.03%. 分析其原因, 主要是通過主元分析剔除了冗余信息, 并且只用少數(shù)變量就可以表示多個過程變量的動態(tài)信息, 不僅減少了網(wǎng)絡的輸入數(shù), 同時主元變量之間的不相關性也使得網(wǎng)絡的學習性能進一步增強. 正是結合了主元分析和RBF神經(jīng)網(wǎng)絡預測的優(yōu)點, PCA-RBF模型的預測能力明顯優(yōu)于單一的RBF網(wǎng)絡, 其預測精度和穩(wěn)定程度均有所提高.
表1 三種模型預測結果比較
1) RBF神經(jīng)網(wǎng)絡模型具有良好的全局逼近能力、 結構緊湊、 收斂速度快等優(yōu)點, 因此本文在RBF神經(jīng)網(wǎng)絡的基礎上建立建筑能耗預測模型, 能夠較準確地對建筑能耗進行預測.
2) 提出PCA-RBF組合模型, 結合主元分析降維、 去相關的優(yōu)點, 進一步提高了RBF神經(jīng)網(wǎng)絡對過程數(shù)據(jù)變化的適應能力. 本文所提方法預測結果的相對誤差平均值Eave和均方根誤差RMSE是RBF神經(jīng)網(wǎng)絡的40%左右, 表明PCA-RBF預測方法有效地提高了網(wǎng)絡模型的學習效率和預測精度, 具有更好的泛化能力, 有著很好的推廣應用前景.
3) PCA-RBF組合方法在建筑能耗預測中的應用, 為建筑物能耗的預測提供了一種新的方法, 為實現(xiàn)節(jié)能建筑奠定了基礎, 便于提高建筑能耗系統(tǒng)的能源利用效率、 挖掘節(jié)能潛力.
[1] 陳改芳.重慶市公共建筑能耗模擬與節(jié)能研究[D]. 重慶: 重慶大學, 2007.
[2] 陳興權, 王解先, 古川. 基于主成分分析的BP神經(jīng)網(wǎng)絡在形變預測中的應用[J]. 大地測量與地球動力學, 2008, 28(3): 72-76.
[3] 謝艷群, 李念平, 陳淑琴. 長沙市居住建筑能耗調(diào)查及偏相關性分析[J]. 煤氣與熱力, 2007, 27(5): 85-88.
[4] 嚴智勇, 許巧玲. 福州地區(qū)大型辦公建筑能耗的多元線性回歸分析[J]. 能源與環(huán)境, 2009(1): 51-52.
[5] 張偉. 基于季節(jié)灰色預測理論的公共建筑節(jié)能領域能耗監(jiān)測研究[D]. 石家莊: 河北工業(yè)大學, 2010.
[6] 曹雙華, 曹家樅. 基于神經(jīng)網(wǎng)絡的空調(diào)負荷混沌優(yōu)化預測[J]. 東華大學學報, 2003, 29(1): 52-56.
[7] Curtiss P S. Energy management in central HVAC plants using neural networks[J]. ASHARE Trains, 1994, 100(1): 476-493.
[8] 李瓊, 孟慶林. 基于 RBF 神經(jīng)網(wǎng)絡的建筑逐時空調(diào)負荷預測模型[J]. 華南理工大學學報: 自然科學版, 2008, 36(10): 25-30.
[9] 楊丹. RBF神經(jīng)網(wǎng)絡預測水泥水化熱研究[J]. 國防交通工程與技術, 2011, 9(3): 31-33.
[10] Lyu Shiqin, Wu Can, Zhang Sufang. Application of the RBF method to the estimation of temperature on the external surface in laminar pipe flow[EB/OL]. (2013-09-02)[2014-05-13]. http://dx. doi. org /10. 1155/2013/205169.
[11] Xie Xiaodan, Xia Bin, Yu Jun. A comprehensive evaluation method based on PCA and BP neural network[C]//2012 Fifth International Conference on Information and Computing Science. Liverpool: IEEE, 2012: 71-74.
[12] MATLAB中文論壇. MATLAB神經(jīng)網(wǎng)絡30個案例分析[M]. 北京: 北京航空航天大學出版社, 2010.
[13] 叢爽. 面向MATLAB工具箱的神經(jīng)網(wǎng)絡理論與應用[M]. 合肥: 中國科學技術大學出版社, 2009.
[14] 魏鋆, 吳金順, 張維亞, 等. 基于正交實驗方法對建筑圍護結構能耗的因素分析[C]//杜修力. 低碳經(jīng)濟與土木工程科技創(chuàng)新: 2010 中國國際建筑科技大會論文集. 北京: 科學出版社, 2010.
[15] 王乾坤, 萬暢. 公共建筑圍護結構對建筑能耗的影響分析[J]. 武漢理工大學學報, 2011, 33(3): 112-115.
[16] 安秋香. 上海市高層辦公建筑空調(diào)能耗現(xiàn)狀及其影響因素研究[D]. 上海: 同濟大學, 2004.
(責任編輯: 林曉)
A prediction model for energy consumption of building based on PCA and RBF
DAI Kuncheng, WANG Guiping, ZHAO Chao
(College of Chemical Engineering, Fuzhou University, Fuzhou, Fujian 350116, China)
There are highly redundant features in affecting factors of building energy consumption, and the traditional method has low predictive accuracy. In order to improve the accuracy of building energy consumption forecasting, a model method for energy consumption based on principal component analysis (PCA) and radial basic function (RBF) neural network is proposed, which combines the abilities of PCA to de-correlate the variables and reduce the dimensionality of the data with that of neural network to approximate any complex nonlinear function. The PCA-RBF model is applied to the energy consumption prediction for an office building, and the simulated results show that the PCA-RBF has better accuracy compared with RBF neural network model and BP neural network model, which is considered that the PCA-RBF is effective for building energy consumption prediction.
energy consumption of building; principal component analysis; RBF neural network; orthogonal experiment; combination predicting
10.7631/issn.1000-2243.2015.04.0512
1000-2243(2015)04-0512-05
2014-10-14
趙超(1976-), 副教授, 主要從事過程控制和能源優(yōu)化研究, seasky76@163.com
國家自然科學基金資助項目(60804027, 61374133)
TU111
A