馮國(guó)會(huì),李奇巖,王 剛,李環(huán)宇
(沈陽(yáng)建筑大學(xué)市政與環(huán)境工程學(xué)院,遼寧 沈陽(yáng) 110168)
目前我國(guó)存在大量的既有公共建筑,空調(diào)系統(tǒng)占建筑總運(yùn)行能耗的30%~40%[1]。在空調(diào)的使用中,由于溫度傳感器無(wú)法全面地獲取室內(nèi)的溫度信息,使得其送風(fēng)溫度或送風(fēng)量等過(guò)大或過(guò)小,甚至出現(xiàn)系統(tǒng)信號(hào)變化的延遲,導(dǎo)致空調(diào)系統(tǒng)向室內(nèi)供給的負(fù)荷量與建筑需要的負(fù)荷量不能很好地匹配。因此通過(guò)對(duì)相關(guān)參數(shù)的測(cè)量,空調(diào)系統(tǒng)能夠?qū)κ覂?nèi)負(fù)荷進(jìn)行預(yù)測(cè),提前調(diào)節(jié)空調(diào)送風(fēng)量與溫濕度,從而使空調(diào)系統(tǒng)的送風(fēng)參數(shù)達(dá)到要求,以此避免能源浪費(fèi)。目前的建筑預(yù)測(cè)模型主要有以熱力學(xué)方程為基礎(chǔ)的物理模型[2]和以機(jī)器學(xué)習(xí)為基礎(chǔ)的數(shù)據(jù)模型[3-9]。相比于物理模型,數(shù)據(jù)模型具有計(jì)算速度快,使用簡(jiǎn)便等優(yōu)勢(shì)。當(dāng)前使用的機(jī)器學(xué)習(xí)算法主要有支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)[3]、組合學(xué)習(xí)(Ensemble Learning)[10]、深度學(xué)習(xí)(DP)[11]等。支持向量機(jī)算法使用正則化項(xiàng)來(lái)避免數(shù)據(jù)的過(guò)擬合,算法中的核技巧也有助于處理非線性數(shù)據(jù)[12],因此成為目前流行的預(yù)測(cè)算法之一。H.Zhong等[13]提出了一種新的基于向量場(chǎng)的支持向量回歸方法找到最優(yōu)特征空間。F.Zhang等[14]使用差分進(jìn)化算法為nu-SVR和epsilon-SVR分配權(quán)重,從而提高其預(yù)測(cè)精度。這些方法都對(duì)算法本身進(jìn)行修改以達(dá)到更好地預(yù)測(cè)精度。但現(xiàn)今使用的支持向量機(jī)算法大部分被封裝在相應(yīng)的算法庫(kù)中,例如scikit-learn算法包中封裝了包括支持向量機(jī)等大部分機(jī)器學(xué)習(xí)算法[15],在實(shí)際操作中直接調(diào)用算法包中的相關(guān)算法即可實(shí)現(xiàn)較高的預(yù)測(cè)精度。機(jī)器學(xué)習(xí)中數(shù)據(jù)的來(lái)源將直接影響到訓(xùn)練結(jié)果的好壞。目前在國(guó)外有67%的研究使用真實(shí)的建筑運(yùn)行數(shù)據(jù)進(jìn)行模型訓(xùn)練,19%的研究使用模擬數(shù)據(jù)進(jìn)行模型訓(xùn)練[16]。由于國(guó)內(nèi)的近零能耗公共建筑能耗監(jiān)測(cè)工作起步較晚,相關(guān)數(shù)據(jù)庫(kù)建立并不完善。因此筆者使用DeST軟件的模擬數(shù)據(jù)進(jìn)行模型訓(xùn)練與預(yù)測(cè),并使用支持向量機(jī)回歸算法(SVR)時(shí)將調(diào)用scikit-learn中的相關(guān)模塊,并使用網(wǎng)格搜索算法(GS)對(duì)超參數(shù)進(jìn)行組合尋優(yōu)。
支持向量機(jī)是一種二分類模型,基本模型是定義在特征空間上的間隔最大的線性分類器,可以將輸入向量映射為特征空間中的特征向量[17],從而解決在原始輸入空間中無(wú)法線性可分的問(wèn)題。該算法的分離超平面為
w*·x+b*=0.
(1)
相應(yīng)的分類決策函數(shù)為
f(x)=sign(w*·x+b*).
(2)
式中:w*超平面的法向量;x為輸入變量;b*為超平面的截距。
對(duì)于線性不可分的訓(xùn)練數(shù)據(jù),可以修改硬間隔最大化[17],使其成為軟間隔最大化。并對(duì)原始問(wèn)題的對(duì)偶問(wèn)題進(jìn)行求解:
(3)
(4)
式中:{(x1,y1),(x2,y2),…,(xN,yN)}為訓(xùn)練數(shù)據(jù)集;a=(a1,a2,…,aN)T為拉格朗日乘子向量。
在輸入空間的維度過(guò)高時(shí),內(nèi)積計(jì)算(xi·xj)會(huì)耗費(fèi)大量計(jì)算機(jī)資源,因此引入核技巧[18]來(lái)避免此類現(xiàn)象發(fā)生。在支持向量機(jī)中可以使用核函數(shù)代替內(nèi)積計(jì)算。常用的核函數(shù)包括poly核函數(shù)、RBF核函數(shù)等。由于核函數(shù)中存在需要手動(dòng)調(diào)節(jié)的參數(shù)(超參數(shù)),因此核函數(shù)的選擇以及核函數(shù)中的超參數(shù)對(duì)模型性能好壞有直接影響。Drucker Harris等[19]將該算法擴(kuò)展到支持向量回歸。
網(wǎng)格搜索本質(zhì)上是一種窮舉法。其主要思想為,在指定的參數(shù)組合范圍內(nèi),按步長(zhǎng)依此調(diào)整參數(shù),利用調(diào)整的參數(shù)訓(xùn)練學(xué)習(xí)器,從所有的參數(shù)中找到在精度最高的參數(shù)。但窮舉法的時(shí)間復(fù)雜度為θ(nm),其中n為輸入變量個(gè)數(shù);m為每個(gè)輸入變量的取值。同時(shí)使用該算法表示的參數(shù)組合過(guò)于稀疏,浪費(fèi)計(jì)算機(jī)的內(nèi)存空間。因此Bao Yukun等[20]提出在模型訓(xùn)練中尋找最大誤差下降路徑,以此優(yōu)化網(wǎng)格搜索路徑;J.Bergstra等[21]提出當(dāng)超參數(shù)規(guī)模較大時(shí),隨機(jī)搜索將會(huì)是更高效的超參數(shù)優(yōu)化方法。
筆者主要使用均方誤差MSE和決定系數(shù)R2作為評(píng)價(jià)訓(xùn)練結(jié)果的指標(biāo)。均方誤差能夠體現(xiàn)預(yù)測(cè)值與真實(shí)值之間的離散程度,而決定系數(shù)R2反應(yīng)因變量的全部變異能通過(guò)回歸關(guān)系被自變量解釋的比例。兩個(gè)指標(biāo)分別為
(5)
(6)
選取位于沈陽(yáng)建筑大學(xué)校區(qū)內(nèi)的近零能耗示范建筑[22](見(jiàn)圖1)作為研究對(duì)象。該建筑處于嚴(yán)寒氣候1C區(qū),建筑面積為302.4 m2,體形系數(shù)0.54,共兩層,無(wú)地下室。第1層高3.3 m,為住宅示范,房間功能為臥室、廚房、設(shè)備間、控制室、展廳以及衛(wèi)生間。第2層高為3.6 m,房間功能分為開(kāi)場(chǎng)辦公區(qū)、封閉辦公室以及衛(wèi)生間,主要用來(lái)做科研辦公。該建筑的圍護(hù)結(jié)構(gòu)參數(shù)如表1所示。
圖1 近零能耗示范建筑外觀圖Fig.1 Picture of the nearly zero energy demonstration building
表1 近零能耗示范建筑圍護(hù)結(jié)構(gòu)參數(shù)Table 1 Envelope parameters of the nearly zero energy demonstration building
以該建筑的CAD圖紙為參照在DeST軟件中建立模型,內(nèi)擾按照《近零能耗建筑技術(shù)標(biāo)準(zhǔn)》(GB/T51350—2019)進(jìn)行設(shè)定,由此得到全年逐時(shí)空調(diào)負(fù)荷分布(見(jiàn)圖2)。由圖可知,近零能耗建筑的負(fù)荷變化具有季節(jié)性,可概括為供熱季與供冷季。該建筑作為辦公建筑使用,因此日負(fù)荷變化也具有周期性,與辦公人員的作息規(guī)律相似。其中全年累計(jì)單位面積熱負(fù)荷為30.56(kW·h)/ m2,全年累計(jì)單位面積冷負(fù)荷為39.22(kW·h)/ m2。
圖2 近零能耗示范建筑全年逐時(shí)空調(diào)負(fù)荷Fig.2 Hourly loads of the nearly-zero energy demonstration building
將數(shù)據(jù)集分為供熱季與供冷季兩部分。供熱季從11月1日到次年3月15日,供冷季從7月1日到9月15日。過(guò)渡季依靠自然通風(fēng)換熱,空調(diào)處于關(guān)閉狀態(tài),無(wú)需計(jì)算該時(shí)間段冷、熱負(fù)荷?;A(chǔ)建筑的負(fù)荷情況如表2所示。
為了消除不同變量間的量綱影響,需要在模型訓(xùn)練前對(duì)數(shù)據(jù)進(jìn)行歸一化。數(shù)據(jù)歸一化將數(shù)據(jù)按比例縮放,使之映射到一個(gè)特定區(qū)間。由于原始數(shù)據(jù)中以正數(shù)表示熱負(fù)荷,負(fù)數(shù)表示冷負(fù)荷,因此在本研究中原始數(shù)據(jù)被映射到[-1,1]區(qū)間,而輸出值則需要逆向縮放得到預(yù)測(cè)值。
表2 近零能耗示范建筑的負(fù)荷模擬結(jié)果Table 2 Load simulation results of the nearly zero energy demonstration building
選取室外氣象參數(shù)(干球溫度、含濕量、總輻射、散射輻射、直射輻射),相應(yīng)時(shí)刻,1 h前負(fù)荷值與24 h前負(fù)荷值為模型的輸入變量。鑒于建筑負(fù)荷與其影響因素之間的非線性特性,筆者使用單變量模型擬合訓(xùn)練集數(shù)據(jù),得到各變量對(duì)室內(nèi)負(fù)荷的影響程度。其中SVR模型使用默認(rèn)的超參數(shù),并使用R2值作為性能指標(biāo)。單變量模型擬合結(jié)果如表3所示。
表3 單變量模型擬合結(jié)果Table 3 Results of univariate model test
由表3可知,供冷季中R2值皆為正數(shù),說(shuō)明選取的每個(gè)參數(shù)都能在一定程度上反應(yīng)室內(nèi)冷負(fù)荷的變化,因此在冷負(fù)荷預(yù)測(cè)模型中選取干球溫度、含濕量、總輻射、散射輻射、直射輻射、相應(yīng)時(shí)刻、1 h前負(fù)荷值與24 h前負(fù)荷值作為冷負(fù)荷預(yù)測(cè)模型的輸入?yún)?shù)。而在熱負(fù)荷預(yù)測(cè)模型的單變量擬合結(jié)果中,干球溫度、總輻射、散射輻射和直射輻射的R2值為負(fù)數(shù)。為進(jìn)一步探究這4個(gè)變量與室內(nèi)熱負(fù)荷的相關(guān)性,筆者使用除去相應(yīng)的單變量以外的變量作為模型的輸入?yún)?shù),再一次對(duì)訓(xùn)練集進(jìn)行擬合,得到的R2值如表4所示。去除干球溫度后熱負(fù)荷模型R2值為0.919 61,與去除其他單變量以后的模型R2值差距較大。這說(shuō)明去除干球溫度后的熱負(fù)荷預(yù)測(cè)模型的準(zhǔn)確度降低程度較大,該變量對(duì)熱負(fù)荷的影響較大。因此將干球溫度作為輸入?yún)?shù)。
表4 除去相應(yīng)變量以后模型R2值Table 4 R2 after removing the corresponding variables
表5 不同核函數(shù)下模型的擬合性能Table 5 Performance of models under different kernel functions
表6 使用網(wǎng)格搜索優(yōu)化前后模型的超參數(shù)與擬合性能Table 6 Hyperparameters and performance of the SVR model and the GS-SVR model
分別計(jì)算SVR模型與GS-SVR模型在測(cè)試集上的表現(xiàn)。結(jié)果顯示,對(duì)于供熱季,MSE從原來(lái)的0.767 52變?yōu)?.663 06,比優(yōu)化前降低了13.61%;R2從原來(lái)的0.915 67變?yōu)?.927 15,比優(yōu)化前提高了1.25%。對(duì)于供冷季,MSE從原來(lái)的1.289 25變?yōu)?.257 13,比優(yōu)化前降低了2.49%。R2從原來(lái)的0.948 30變?yōu)?.949 59,比優(yōu)化前提高了1.36%。由此說(shuō)明,在訓(xùn)練集和測(cè)試集上,網(wǎng)格搜索算法都能夠提高支持向量機(jī)回歸算法的精確度。
GS-SVR模型的擬合度R2與離散程度MSE均在表6中列出。無(wú)論是供熱季還是供冷季,測(cè)試集的擬合度R2相較于訓(xùn)練集的R2都有所提升,說(shuō)明GS-SVR模型能夠很好地解釋輸入?yún)?shù)與結(jié)果之間的回歸關(guān)系。而測(cè)試集上的MSE供冷遠(yuǎn)大于MSE供熱,說(shuō)明GS-SVR模型對(duì)冷負(fù)荷預(yù)測(cè)的精確度要低于對(duì)熱負(fù)荷預(yù)測(cè)的精確度。原因在于夏季影響室內(nèi)冷負(fù)荷的因素眾多,而且冷負(fù)荷的變化較為劇烈,導(dǎo)致GS-SVR模型對(duì)室內(nèi)冷負(fù)荷的預(yù)測(cè)更加困難。
為進(jìn)一步說(shuō)明網(wǎng)格搜索算法對(duì)支持向量機(jī)回歸算法的提升作用以及GS-SVR模型在不同季節(jié)中精確度的差異,筆者究對(duì)供熱季1月1日與供冷季7月1日的室內(nèi)負(fù)荷進(jìn)行預(yù)測(cè),并將預(yù)測(cè)值與DeST軟件模擬值進(jìn)行對(duì)比(見(jiàn)圖3)。從圖中可看出,在空調(diào)系統(tǒng)使用期間,GS-SVR的預(yù)測(cè)值比支持向量機(jī)的預(yù)測(cè)值更加靠近模擬值,同時(shí)冷負(fù)荷預(yù)測(cè)值與真實(shí)值的偏離程度要大于熱負(fù)荷預(yù)測(cè)值與真實(shí)值的偏離程度。由此說(shuō)明,GS-SVR模型相比于SVR模型精確度更高,而GS-SVR模型在供冷季期間的精確度要低于供熱季。
圖3 負(fù)荷預(yù)測(cè)結(jié)果Fig.3 Prediction results of loads
(1)選取干球溫度、含濕量、總輻射、散射輻射、直射輻射、相應(yīng)時(shí)刻、1 h前負(fù)荷值與24 h前負(fù)荷值作為冷負(fù)荷預(yù)測(cè)模型的輸入?yún)?shù),并且將干球溫度、含濕量、相應(yīng)時(shí)刻、1 h前負(fù)荷值與24 h前負(fù)荷值作為熱負(fù)荷預(yù)測(cè)模型的輸入?yún)?shù)。
(2)GS-SVR熱負(fù)荷預(yù)測(cè)模型的MSE與普通SVR模型相比降低了13.61%,R2提高了1.25%;冷負(fù)荷預(yù)測(cè)模型的MSE與普通SVR模型相比降低了2.49%,R2提高了1.36%。GS-SVR模型的預(yù)測(cè)精度有了較大提升,也能夠更好地解釋輸入?yún)?shù)與結(jié)果之間的回歸關(guān)系。
(3)測(cè)試集上MSE供冷值為1.257 13,MSE供熱值為0.663 06,MSE供冷值遠(yuǎn)大于MSE供熱值。GS-SVR模型對(duì)熱負(fù)荷的預(yù)測(cè)更加精確。原因在于供冷季影響冷負(fù)荷的因素較多,同時(shí)冷負(fù)荷的變化也較為劇烈。