摘要:為降低建筑能耗影響因素間復雜相關(guān)性對模型性能的影響,建立了一種基于KPCA-WLSSVM的建筑能耗預測模型。利用核主元分析(KPCA)對輸入變量進行數(shù)據(jù)壓縮,消除變量之間的相關(guān)性,簡化模型結(jié)構(gòu);進一步采用加權(quán)最小二乘支持向量機(WLSSVM)方法建立建筑能耗預測模型,同時結(jié)合一種新型混沌粒子群-模擬退火混合優(yōu)化(CPSO-SA)算法對模型參數(shù)進行優(yōu)化,以提高模型的預測性能及泛化能力。通過將KPCA-WLSSVM模型方法應用于某辦公建筑能耗的預測中,并與WLSSVM、LSSVM及RBFNN模型相比,實驗結(jié)果表明,KPCA-WLSSVM模型方法能有效提高建筑能耗預測精度。
關(guān)鍵詞:建筑能耗;預測;核主元分析;支持向量機
中圖分類號:TU831 文獻標志碼:A 文章編號:1674-4764(2015)05-0109-07
Abstract:The correlations among the building energy consumption factors can corrupt the prediction model’s performance, and get undesirable results. A prediction model based on KPCA-WLSSVM is proposed to forecast building energy consumption. The kernel principal component analysis (KPCA) method could not only solve the linear correlation of the input and compress data but also simplify the model structure. A novel hybrid chaos particle swarm optimization simulated annealing (CPSO-SA) algorithm is applied to optimize WLSSVM parameters to improve learning performance and generalization ability of the model. Furthermore, the KPCA-WLSSVM model is applied to the energy consumption prediction for an office building, and the results show that the KPCA-WLSSVM has better accuracy compared with WLSSVM model, LSSVM model and RBF neural network model. and the KPCA-WLSSVM is effective for building energy consumption prediction.
Key words:energy consumption of building; forecasting; kernel principal component analysis; support vector machines
隨著建筑能耗在能源消耗中所占比重的快速增長,建筑節(jié)能受到越來越多的關(guān)注,準確有效地預測建筑能耗是開展節(jié)能評估工作的重要基礎(chǔ),也是進行建筑節(jié)能優(yōu)化設計的主要依據(jù)。由于建筑能耗系統(tǒng)涉及到機理復雜的熱濕傳遞過程,是一個典型的多變量、非線性、強耦合和多擾動的復雜系統(tǒng),采用機理方法建立建筑能耗預測模型十分困難。人工神經(jīng)網(wǎng)絡由于對非線性函數(shù)具有很強的擬合和逼近能力,作為一種有效的非線性建模方法,目前已有許多學者將其成功應用于建筑能耗預測領(lǐng)域[1-4]。但由于神經(jīng)網(wǎng)絡訓練基于經(jīng)驗風險最小化原則,易產(chǎn)生過學習導致泛化能力下降,另外還存在諸如網(wǎng)絡結(jié)構(gòu)難以確定和過分依賴大樣本學習等缺陷,因而在建筑能耗預測領(lǐng)域還難以大范圍推廣。
支持向量機(Support Vector Machines, SVM)是Vapnik等[5-6]基于統(tǒng)計學習理論提出的一種新的有監(jiān)督機器學習方法。支持向量機利用結(jié)構(gòu)最小化原理來提高其泛化能力,較好地解決了小樣本、非線性、高維數(shù)、局部極小等實際問題,目前已成為建筑能耗預測領(lǐng)域的研究熱點[7-8]。最小二乘支持向量機(Least Squares Support Vector Machines, LS-SVM) 是標準SVM的擴展,LS-SVM模型在優(yōu)化目標函數(shù)中選取了誤差(松弛變量)二范數(shù)的形式,將SVM中需要求解的二次規(guī)劃問題轉(zhuǎn)化為線性方程組求解問題,從而降低了計算復雜度,有效提高了學習速度,較好地解決了大樣本數(shù)據(jù)情況下SVM計算復雜的問題[9]。文獻[10-12]基于LSSVM回歸方法建立了建筑能耗預測模型,并獲得了較好的預測結(jié)果。針對LSSVM算法魯棒性能欠佳的問題,Suykens等[13]提出了加權(quán)最小二乘支持向量機算法(Weighted Least Squares Support Vector Machines, WLSSVM)。WLSSVM在建模過程中依據(jù)訓練樣本的重要性分別賦予其不同權(quán)重,從而克服了奇異點對LSSVM魯棒性能的影響。文獻[14]基于該算法建立了建筑能耗預測模型。盡管支持向量機回歸方法能夠有效處理高維數(shù)、非線性數(shù)據(jù)建模問題,但是建筑能耗受到氣候條件、建筑特征參數(shù)、圍護結(jié)構(gòu)熱工性能、室內(nèi)熱擾、新風負荷、室內(nèi)環(huán)境參數(shù)、空調(diào)運行模式等眾多因素的影響,且各影響因素之間嚴重相關(guān),不可避免存在一定的噪聲和冗余信息,在建模過程中會降低精度,增加計算復雜度[15-16]。因此,有必要對能耗建模樣本數(shù)據(jù)進行數(shù)據(jù)壓縮和特征提取,通過降維處理來去除樣本數(shù)據(jù)集合中的冗余信息以及消除噪聲,以提高模型的預測精度和泛化能力。核主元分析法(KPCA)作為一種數(shù)據(jù)壓縮和特征提取的非線性技術(shù),已在數(shù)據(jù)處理中的到了廣泛應用[17-18]。KPCA采用核函數(shù)的方法,把過程數(shù)據(jù)或變量組成的原始數(shù)據(jù)空間映射到高維特征空間,在高維特征空間使用線性PCA方法來尋找主成分。特征空間中的主元變量則保留原始變量的特征信息而消去冗余信息,它是解決數(shù)據(jù)相關(guān)問題,提高模型運算速度的重要工具。
為了提高建筑能耗預測模型的精度和可靠性,筆者提出了一種基于KPCA和WLSSVM的建筑能耗預測方法。首先采用KPCA方法對輸入變量進行特征提取,有效消除變量之間的相關(guān)性,降低輸入變量的維數(shù);將通過特征提取后的數(shù)據(jù)集作為輸入變量建立WLSSVM建筑能耗模型;考慮到LSSVM的正則化參數(shù)和核寬參數(shù)對模型擬合精度和泛化能力都有較大影響,利用混沌粒子群-模擬退火混合優(yōu)化(CPSO-SA)算法對LSSVM的參數(shù)進行優(yōu)化選擇,從而建立起具有較高預測精度和泛化能力的建筑能耗預測模型。基于DEST仿真平臺的模擬數(shù)據(jù),對南方地區(qū)某辦公建筑的能耗進行預測,并與WLSSVM、LSSVM和RBF神經(jīng)網(wǎng)絡預測模型的性能進行比較,結(jié)果表明,KPCA-WLSSVM預測模型的性能優(yōu)于另外3種預測模型。
1 KPCA-WLSSVM模型算法
1.1 核主元分析
2 基于KPCA-WLSSVM建筑能耗預測
2.1 建筑能耗影響因素分析
建筑能耗系統(tǒng)是一個復雜的非線性系統(tǒng),影響建筑能耗的因素眾多,主要分為4大類[12、15-16]:外部氣候條件、圍護結(jié)構(gòu)、設備因素以及建筑運行管理模式。外部氣候條件是影響建筑能耗的“自然”因素,包括溫度、濕度、日照及風速等參數(shù),它們能夠直接影響熱量通過圍護結(jié)構(gòu)的傳遞,進而對建筑能耗產(chǎn)生影響;圍護結(jié)構(gòu)可以看作是影響建筑能耗的“人為”因素,包括了反映建筑熱工性能的圍護結(jié)構(gòu)傳熱系數(shù)、遮陽率等參數(shù)和反映建筑體形特征的體形系數(shù)、建筑面積、朝向、窗墻比等參數(shù),這類因素可以通過改善建筑本身的熱工性能及相關(guān)參數(shù)對建筑能耗起到積極作用;設備因素包括照度標準、燈具類型、設備功率等參數(shù),這些參數(shù)取決于建筑的使用功能;建筑運行管理模式也是影響建筑能耗的重要因素之一,它包括了通風次數(shù)、人員密度、設備運行時間、新風指標等參數(shù)。
2.2 建模步驟
由于建筑能耗與眾多能耗影響因素之間存在復雜的非線性關(guān)系,在建模過程中會增加計算復雜度,降低建模精度。因此,有必要通過降維處理去除樣本數(shù)據(jù)集合中的冗余信息以及消除噪聲,以提高模型的預測精度和泛化能力。筆者提出的KPCA-WLSSVM的建筑能耗預測模型首先利用KPCA提取能耗因子的非線性特征,消除數(shù)據(jù)冗余并降低模型輸入維數(shù),然后采用WLSSVM方法建立能耗預測模型。模型的結(jié)構(gòu)如圖1所示。
同時,為減少試驗次數(shù),并保證試驗的全面性,采用正交試驗方法獲取數(shù)據(jù)樣本集。DEST中影響因素的取值,采用事先設定好的水平值,每個因素選取4個水平值,選用L64(421)正交表進行試驗計算,建筑物能耗的基準值采用動態(tài)負荷計算軟件DEST-C的計算值。為獲得較為理想的訓練數(shù)據(jù),選用4組正交試驗,并且每組正交試驗中每個因素選取不同的水平值,經(jīng)過DEST-C動態(tài)計算,獲得建筑物全年能耗結(jié)果。經(jīng)DEST-C計算獲256組實驗數(shù)據(jù),隨機取其中的3/4作為訓練樣本,余下的1/4作為測試樣本驗證模型的預測性能。
2.3.3 模型訓練
通過KPCA計算,取主元個數(shù)為8個,此時累計貢獻率已經(jīng)超過90%。碎石圖如圖3所示。另外,核參數(shù)和正則化參數(shù)是WLSSVM性能的重要影響因素,不同的參數(shù)組合將得到不同的學習性能和泛化性能。為避免主觀經(jīng)驗選取的盲目性,采用CPSO-SA算法對模型的兩個參數(shù)進行尋優(yōu),優(yōu)化后的參數(shù)分別為C=326.7、σ=0.86,滿足預測模型對精度的要求,建筑能耗模型訓練結(jié)果如圖4所示,擬合值和期望值基本吻合。
2.3.4 結(jié)果與分析
為比較分析組合模型的預測效果,同時建立了LSSVM、WLSSVM和RBFNN神經(jīng)網(wǎng)絡模型對建筑能耗進行預測。通過MATLAB平臺實現(xiàn)上述4種預測模型對建筑能耗進行預測,預測值和實際值的對比如圖5所示。從圖中可以知道,4種模型的預測結(jié)果大都能夠反映能耗的變化,但有個別樣本點偏差較大,組合模型的預測值和期望值基本重合,相比于單一的LSSVM、WLSSVM和RBFNN神經(jīng)網(wǎng)絡模型,組合預測模型的預測效果較好。
為了從整體上評價4種預測模型的預測精度和穩(wěn)定性,按式(21)、(22)及(23)對上述4種模型進行評價,計算結(jié)果如表1所示。
從表1的計算結(jié)果可以看出,采用RBF神經(jīng)網(wǎng)絡和LSSVM方法預測雖然具有很高的訓練精度,但是當其用于預測時,誤差較大,泛化性能差,預測效果不理想;采用WLSSVM進行預測,由于該方法對每個樣本進行了加權(quán)處理,有效消除了顯著誤差的影響,具有較好的預測精度,其平均預測誤差和均方根誤差比LSSVM有所降低,但預測效果仍有待提高;KPCA-WLSSVM方法首先采用KPCA對能耗樣本數(shù)據(jù)進行數(shù)據(jù)壓縮和特征提取,去除樣本數(shù)據(jù)中的冗余信息以及消除噪聲,使得WLSSVM模型的預測效果得到了很大的改善,最大相對誤差絕對值從7.81%降到2.81%,相對誤差絕對值平均值從1.13%降低到0.89%,這表明組合模型具有更高的預測精度和預測穩(wěn)定性,泛化能力得到顯著提高。通過對比分析模型的性能指標,結(jié)果表明KPCA-WLSSVM模型具有更好的預測效果,是一種有效、可行的建筑能耗預測方法。
3 結(jié) 論
通過4個模型的預測結(jié)果及性能評價指標的比較可以看出,基于KPCA-WLSSVM能耗預測模型的預測效果要優(yōu)于其他3種模型,表明了KPCA- WLSSVM模型在建筑能耗預測中的有效性和優(yōu)越性。主要結(jié)論為:
1)核主元分析能夠消除建筑能耗影響因素間的冗余性和共線性,正確提取輸入樣本的特征信息,簡化模型的輸入樣本。
2)WLSSVM充分考慮了各樣本對建模的影響,有效地賦予各樣本合適的權(quán)值,優(yōu)化了LSSVM模型,使得模型具有良好的非線性處理能力。
3)采用CPSO-SA優(yōu)化算法對模型的參數(shù)進行優(yōu)化選擇,避免了經(jīng)驗選擇的缺陷,在此基礎(chǔ)上建立的建筑能耗預測模型具有更好的學習精度和推廣應用能力。
參考文獻:
[1] Wong S L, Wan K K W, Lam T N T. Artificial neural networks for energy analysis of office buildings with daylighting [J]. Applied Energy, 2010, 87(2): 551-557.
[2] Azadeh A, Ghaderi S F, Tarverdian S, et al. Integration of artificial neural networks and genetic algorithm to predict electrical energy consumption [J]. Applied Mathematics and Computation, 2007, 186(2): 1731-1741.
[3] 喻偉, 李百戰(zhàn), 楊明宇, 等. 基于人工神經(jīng)網(wǎng)絡的建筑多目標預測模型[J]. 中南大學學報:自然科學版, 2012, 43(12): 4950-4955.
Yu W, Li B Z, Yang M Y, et al. Building multi-objective predicting model based on artificial network [J]. Journal of Central South University: Science and Technology, 2012, 43(12): 4950-4955. (in Chinese)
[4] Mathieu J L, Price P N, Kiliccote S, et al. Quantifying changes in building electricity use, with application to demand response[J]. IEEE Transactions on Smart Grid, 2011, 2(3): 507-518.
[5] Vapnik V. The nature of statistical learning theory [M]. Springer, 2000.
[6] Cortes C, Vapnik V. Support vector networks [J]. Machine Learning, 1995, 20(3): 273-297.
[7] Dong B, Cao C, Lee S E. Applying support vector machines to predict building energy consumption in tropical region [J]. Energy and Buildings, 2005, 37(5): 545-553.
[8] Li Q, Meng Q L, Cai J J, et al. Applying support vector machine to predict hourly cooling load in the building [J]. Applied Energy, 2009, 86(10): 2249-2256.
[9] Suykens J A K, Van G T, De B J, et al. Least squares support vector machines [M]. Singapore: World Scientific, 2002.
[10] Li X M, Shao M, Ding L X, et al. Particle swarm optimization-based LS-SVM for building cooling load prediction [J]. Journal of Computers, 2010, 5(4): 614-621.
[11] Jung H C, Kim J S, Heo H. Prediction of building energy consumption using an improved real coded genetic algorithm based least squares support vector machine approach [J]. Energy and Buildings, 2015, 90: 76-84.
[12] Zhao H X, Magoules F. Parallel support vector machines applied to the prediction of multiple building energy consumption [J]. Energy, 2009, 4(2): 231-249.
[13] Suykens J A K, de Brabanter J, Lukas L, et al. Weighted least squares support vector machines: robustness and sparse approximation [J]. Neurocomputing, 2002, 48: 85-105.
[14] Guo Y, Nazarian E, Ko J, et al. Hourly cooling load forecasting using time-indexed arx models with two-stage weighted least squares regression [J]. Energy Conversion and Management, 2014, 80:46-53.
[15] Li Q, Meng Q L, Cai J J, et al. Predicting hourly cooling load in the building: a comparison of support vector machine and different artificial neural networks [J]. Energy Conversion and Management, 2009, 50(1): 90-96.
[16] Crawley D B, Hand J W, Kummert M, et al. Contrasting the capabilities of building energy performance simulation programs [J]. Building and Environment, 2008, 43(4): 661-673.
[17] Fan Z Z, Wang J H, Xu B G, et al. An efficient KPCA algorithm based on feature correlation evaluation [J]. Neural Computing and Applications, 2014, 24(7/8):1795-1806.
[18] Jia P F, Tian F C, He Q H, et al. Feature extraction of wound infection data for electronic nose based on a novel weighted KPCA [J]. Sensors and Actuators, B: Chemical, 2014, 201:555-566.
[19] Suykens J A K. Least squares support vector machines [J]. Neural Processing Letters, 1999, 9(3):293-300.
[20] 樊曉雪. 最小二乘支持向量機的參數(shù)選擇[D]. 河北 保定: 河北大學, 2012.
Fan X X. Least squares support vector machine parameter selection [D]. Baoding: Hebei University, 2012. (in Chinese)
[21] 康一亭, 于丹, 蘇華, 等. 辦公建筑能耗基準中影響因子對建筑能耗的影響度[J]. 中南大學學報: 自然科學版, 2012, 43(Sup1): 146-150.
Kang Y T, Yu D, Su H, et al. Impact factors of energy consumption benchmarking in office buildings [J]. Journal of Central South University: Science and Technology, 2012, 43(Sup1): 146-150. (in Chinese)
(編輯 胡英奎)