王秋月 張吉禮
大連理工大學(xué)建設(shè)工程學(xué)部
公共建筑實時監(jiān)測目的并不僅是為了獲取樣本建筑終端能耗值,還要從建筑終端能耗數(shù)據(jù)中總結(jié)總體建筑能耗變化特性,尋求節(jié)能潛力。而樣本數(shù)量決定了樣本建筑是否能夠反映研究區(qū)域總體建筑的能耗情況。若樣本數(shù)量太小,樣本數(shù)據(jù)不足以反應(yīng)整體建筑能耗水平。若樣本數(shù)量太大,則造成了不必要的數(shù)據(jù)堆積,因此,合理的樣本建筑數(shù)量在保證數(shù)據(jù)準(zhǔn)確性的前提下,對于減少建筑能耗監(jiān)測的經(jīng)濟成本,明確建筑能耗監(jiān)測平臺建設(shè)規(guī)模,增加建筑能耗數(shù)據(jù)統(tǒng)計分析的速度及有效性具有重要作用。
國內(nèi)外學(xué)者對于建筑能耗、能效的研究分析都建立在一定數(shù)量的建筑基礎(chǔ)上進行。主要分為兩個方面,對單體建筑進行研究或者選擇建筑群進行研究。在對建筑群的選取上,多為隨機選取或者選取典型性建筑進行研究。龍惟定[1]選取上海市9 棟辦公建筑調(diào)查,發(fā)現(xiàn)辦公建筑的最大平均能耗量和最小平均能耗量相差2.21 倍。李崢嶸[2]選取上海市32 棟公共建筑的能耗及運行管理資料進行調(diào)查,其中包括學(xué)校、倉庫、醫(yī)院、體育館、辦公、商場及旅館,指出辦公、商場及旅館的能耗占上海市總能耗的25.9%。李沁[3]通過對重慶市207 棟公共建筑的基本信息進行調(diào)研收集,并對145 棟公共建筑的總體用電數(shù)據(jù)進行統(tǒng)計分析,估計總體用能水平分布,以確定建筑能耗統(tǒng)計定額水平。JosephC Lam[4-5]等選取香港20 棟典型性辦公建筑作為樣本建筑,研究五種氣候指標(biāo):溫度、濕度、風(fēng)速、太陽輻射、清潔指數(shù)對辦公建筑用電的影響進行研究??梢钥闯觯芯空哒J為對建筑群能耗、能效進行分析,需要考慮建筑不同功能、不同氣候區(qū)等指標(biāo)來選取樣本建筑,但是沒有對到底選擇多少樣本建筑是合理的進行討論,也沒有標(biāo)準(zhǔn)來說明研究樣本是否能夠代表所研究區(qū)域。
趙加寧等人通過對我國建筑能耗統(tǒng)計中關(guān)于居民合作、建筑分類、調(diào)查方式、數(shù)據(jù)收集四個方面的問題進行了分析[7],認為了解建筑物的單項能耗,需建立測試平臺和能耗統(tǒng)計數(shù)據(jù)庫,為使測試建筑具有代表性,應(yīng)采用統(tǒng)計學(xué)原理對建筑能耗進行調(diào)查。以深圳地區(qū)為例,由于目前國內(nèi)缺乏建筑統(tǒng)計抽樣測試數(shù)據(jù),因此采用能耗模擬軟件,模擬8 類公共建筑能耗,給出置信度為87%,極限誤差為0.1 的情況下,樣本容量隨建筑總量的變化趨勢,指出不同功能建筑總數(shù)超過1000 棟時,對于給定估計精度,樣本容量不再大幅變化,為樣本量選取提供指導(dǎo)思想[8]。馮可梁(2014)[9]認為合理的樣本數(shù)量有利于在保證數(shù)據(jù)準(zhǔn)確的前提下減少能耗統(tǒng)計成本。William chung[10]也簡單交代了如何選取樣本建筑,他將辦公建筑按照一定特點分為五組,規(guī)定每組隨機選取30 棟辦公建筑構(gòu)建分步回歸模型,對香港辦公建筑能效水平進行研究,認為香港辦公建筑的能源消耗總量呈上升趨勢,但是其能效水平在逐步提升,即提高建筑能效的最大貢獻在于增加了節(jié)能量,而不是減少了能源使用量。以上研究者認為合理的樣本建筑將對研究結(jié)果有正向促進作用,但沒有給出一個可參考的統(tǒng)計學(xué)樣本量計算方法。
因此,對某一地區(qū)究竟需要監(jiān)測多少棟樣本建筑、方能較準(zhǔn)確、客觀地反映該地區(qū)建筑的總體用能特征的問題亟待解決,本文將從統(tǒng)計學(xué)角度出發(fā),研究解決合理監(jiān)測建筑數(shù)量的問題。
將全體建筑稱為總體,為了解研究區(qū)域總體建筑的能耗特征,通過對總體抽樣監(jiān)測得到代表總體的樣本建筑,但因為信息是分布在每個樣本建筑上的,所以需要對樣本建筑數(shù)據(jù)進行加工,把樣本的信息濃縮到不包含未知量的樣本函數(shù)中,這個函數(shù)稱為統(tǒng)計量如樣本均值、方差等都為統(tǒng)計量,概括總體的函數(shù)稱為總體參數(shù),通過樣本統(tǒng)計量對總體參數(shù)進行估計即會產(chǎn)生抽樣監(jiān)測誤差。抽樣監(jiān)測誤差是由于抽樣引起的,確切的說抽樣誤差其實是由于樣本建筑的隨機性引起的誤差。對于任何一種建筑能耗抽樣監(jiān)測方案,其可能的樣本建筑都有很多,而實際選擇的只是一些建筑,因此選取哪些建筑一定程度上具有隨機、偶然性,抽到另一批建筑,對總體能耗參數(shù)的估計就會有不同,這就是建筑能耗特性推斷中誤差產(chǎn)生的根本原因。
假設(shè)總體公共建筑用電數(shù)據(jù)服從某種分布,而樣本建筑用電數(shù)據(jù)具有某種相同的分布情況,因此可以用樣本建筑的分布估計來推斷總體建筑的用電分布[11]。同樣,根據(jù)樣本建筑的能耗數(shù)據(jù)對總體建筑能耗進行估計和推斷,即使精確性很高,由于建筑數(shù)據(jù)源的隨機性,其結(jié)論也要采取一種概率的陳述方式,表示總體參數(shù)被包括在由樣本建筑統(tǒng)計值做出的區(qū)間估計范圍內(nèi)的相應(yīng)概率有多大。在統(tǒng)計學(xué)假設(shè)檢驗中,研究者常常先控制第一類錯誤的發(fā)生概率,即給定犯第一類錯誤概率的最大允許值α,稱為顯著性水平,其意義為估計總體參數(shù)落在某一區(qū)間內(nèi)可能犯錯誤的概率。1-α 為置信度或置信水平,表明了該區(qū)間估計的可靠性。
下面基于概率統(tǒng)計中心極限定理[11],推導(dǎo)監(jiān)測中抽樣誤差與樣本容量的關(guān)系式。
給定概率意義下的最大絕對誤差或相對誤差稱為誤差限,置信度和誤差限的關(guān)系滿足:在指定的顯著性水平α 下,允許的最大絕對誤差和最大相對誤差分別為Δ,r,應(yīng)有
式中:Δ 為一常數(shù);r=Δ/θ;θ 為總體參數(shù),可以是總體的單位面積能耗值的均值或者方差等,kWh/m2;為樣本統(tǒng)計值,可以為樣本建筑的單位面積能耗值的均值或者方差等。
根據(jù)中心極限定理,在大樣本情況下,無論總體服從什么分布,樣本估計值的分布漸進正態(tài)分布,因此,樣本建筑量n 充分大,應(yīng)有
根據(jù)正態(tài)分布的性質(zhì),有
因此可得出樣本抽樣的絕對誤差和相對誤差表達式:
對于一定量的樣本建筑,其單位面積年用電量可以認為是隨機變量X,對變量X 計算其樣本統(tǒng)計值如方差,標(biāo)準(zhǔn)差和變異系數(shù)。其計算公式可寫為
式中:n 為隨機變量個數(shù),即樣本建筑數(shù)量;ei為第i 個指定樣本建筑的單位建筑面積年用電量為單位建筑面積年用電量的樣本均值;V(e)代表研究對象單位建筑面積年用電量的樣本方差;SD(e)代表研究對象建筑單位建筑面積年用電量的樣本標(biāo)準(zhǔn)差;CV(e)代表樣本抽樣變異系數(shù),變異系數(shù)反映了樣本統(tǒng)計值對均值的離散程度。
式(6)和(7)給出了絕對誤差、相對誤差和抽樣方差、變異系數(shù)的關(guān)系,結(jié)合式(8)~(10),可以看出樣本方差和變異系數(shù)是樣本建筑量n 和總體建筑量N 的函數(shù),因此能耗抽樣監(jiān)測中,只要對能耗估算精度提出要求,不論是以Δ,r哪種形式給出,都可以計算出合理樣本量下限,稱之為最小樣本量。
對概率分布估計最重要的是計算分布的均值和標(biāo)準(zhǔn)差。建筑能耗概率分布是反映總體建筑能耗特性的一個重要指標(biāo),大多數(shù)實際問題中,可以認為或近似認為總體服從正態(tài)分布,即使實際情況呈現(xiàn)偏態(tài)分布,仍可以將源數(shù)據(jù)經(jīng)數(shù)據(jù)轉(zhuǎn)換服從正態(tài)分布。本文主要研究方法論問題,因此假定建筑能耗總體服從正態(tài)分布,因此,建筑能耗監(jiān)測中,最小樣本量需要滿足對總體建筑能耗概率分布均值和標(biāo)準(zhǔn)差準(zhǔn)確估計的需要。本節(jié)從統(tǒng)計學(xué)理論的區(qū)間估計理論出發(fā),結(jié)合隨機抽樣理論及建筑能耗抽樣誤差與樣本量大小的關(guān)系,構(gòu)建面向建筑能耗評價的最小樣本量模型,分析其在建筑能耗估算和特性評價中的應(yīng)用。
其主要步驟為:
1)數(shù)據(jù)準(zhǔn)備。假設(shè)待分析建筑群、區(qū)域或地區(qū)能夠獲取的樣本建筑能耗數(shù)據(jù)集總量X 能夠代表該建筑群、區(qū)域或地區(qū)建筑能耗數(shù)據(jù)集總體e。對數(shù)據(jù)集X內(nèi)建筑進行編號從1 到N,每個建筑編號對應(yīng)著該建筑的能耗信息1,..,eN,每抽取第i 個編號即代表抽取該編號對應(yīng)的建筑,則選取該建筑能耗指標(biāo)ei(即隨機變量)進入抽樣訓(xùn)練模型進行計算。
2)計算隨機變量的期望和標(biāo)準(zhǔn)差。由于樣本數(shù)據(jù)集X 服從正態(tài)分布,則指定時間段內(nèi)建筑能耗評價指標(biāo)的真實期望和標(biāo)準(zhǔn)差可以根據(jù)以下公式計算:
3)進行隨機抽樣。對選入訓(xùn)練集的建筑數(shù)據(jù)總體進行簡單隨機抽樣,第k 次抽樣的建筑量為n(k)。
4)基于樣本計算ni(k)對正態(tài)隨機變量的期望和標(biāo)準(zhǔn)差進行區(qū)間估計。對于給定的置信水平1-α,依據(jù)正態(tài)總體均值和方差的區(qū)間估計理論,分別計算其對應(yīng)的置信區(qū)間μi(k)±Δμ(k),σi(k)±Δσ(k),具體計算公式詳見下節(jié)求解步驟。
5)計算相對誤差值,進行合理性判斷。分別將樣本n(k)對應(yīng)的隨機變量的期望和標(biāo)準(zhǔn)差的絕對誤差值Δμ(k),Δσ(k)與真實期望μ(0)和標(biāo)準(zhǔn)差σ(0)進行對比,計算相對誤差值,判斷相對誤差值與允許的相對誤差常數(shù)ε 的關(guān)系。允許的相對誤差常數(shù)ε 的取值通常取5%,10%,15%。
圖1 建筑能耗監(jiān)測下限樣本量算法流程
6)如果樣本nj(k)對應(yīng)的建筑能耗特性指標(biāo)的期望和標(biāo)準(zhǔn)差的聯(lián)合區(qū)間估計滿足精度設(shè)計要求,則終止抽樣循環(huán),認定第k 次抽樣的樣本量nj(k)為指定時間段P 內(nèi),指定建筑群、區(qū)域或者地區(qū)建筑能耗特性指標(biāo)評價所需的合理建筑數(shù)據(jù)量,稱為最小樣本量。否則,增加抽樣規(guī)模,繼續(xù)進行第k+1 次抽樣,并設(shè)第k+1次抽樣的樣本量ni(k+1)=ni(k)+Δn,其中Δn 表示抽樣步長,為一常數(shù)。接著需重復(fù)上述步驟第(3)步至第(5)步。
7)討論不同樣本量對估算建筑能耗特性評價指標(biāo)精度的影響。
8)討論不同允許誤差值對樣本量的要求。
其具體流程如圖1 所示。
根據(jù)總體均值和方差公式,可對建筑能耗特性指標(biāo)估算的最小樣本量進行求解,構(gòu)建面向建筑能耗評價的最小樣本量模型。其求解過程如下:
假設(shè)指定建筑群、區(qū)域或者地區(qū)建筑能耗特性指標(biāo)總體服從正態(tài)分布,有,隨機變量即樣本建筑能耗數(shù)據(jù)集為為樣本建筑數(shù)量。一定的置信常數(shù)1-α 下,指定建筑群、區(qū)域或者地區(qū)的建筑能耗特性指標(biāo)實際期望和方差的聯(lián)合置信區(qū)間推導(dǎo)過程如下:
由于總體方差σ2未知,因此σ2用無偏估計量樣本方差S2代替,構(gòu)造自由度為n-1 的統(tǒng)計量,其中
為方便起見,取
所以
整理得μ2和σ2的聯(lián)合區(qū)間估計域分別為:
因此,建筑能耗特性評價指標(biāo)監(jiān)測值均值μ2絕對誤差和相對誤差分別為:
同時,建筑能耗特性評價指標(biāo)監(jiān)測值標(biāo)準(zhǔn)差σ 的絕對誤差和相對誤差可以通過以下方式計算。
由于σ2的置信區(qū)間為
因此σ 的置信區(qū)間為
所以標(biāo)準(zhǔn)差σ 的絕對誤差和相對誤差分別為:
根據(jù)rμ,rσ,當(dāng)被允許的最大相對誤差為常數(shù)rmax,令rμ≤rmax,rσ≤rmax,分別求得對應(yīng)的nμ,nσ,并令
可得min n 即為指定建筑群、區(qū)域或者地區(qū)建筑能耗數(shù)據(jù)估算所需的合理建筑數(shù)據(jù)量,稱之為最小樣本量。
作者課題組自2010 年始從事建筑節(jié)能理論研究及關(guān)鍵技術(shù)開發(fā)工作,已累計完成覆蓋7 省的公共建筑能耗監(jiān)測工作,累計監(jiān)測面積達618 萬m2。本研究將在已有的遼寧省建筑能耗監(jiān)測系統(tǒng)平臺中完成,該項目涵蓋了遼寧省14 個地級市共50 余棟大型公共建筑。該項目覆蓋建筑類型多樣,包括機關(guān)辦公建筑,政府辦公建筑,大型商場,校園建筑以及醫(yī)院等,能耗數(shù)據(jù)類型齊全,為本項研究工作提供了豐富的試驗樣本數(shù)據(jù)源。
以遼寧省監(jiān)測平臺公共建筑2014 年能耗數(shù)據(jù)為例,已有樣本建筑50 余棟。為了得到公共建筑合理的樣本建筑量,假設(shè)該類建筑樣本建筑能耗分布基本代表了研究區(qū)域總體該類建筑的能耗分布,在不改變原有樣本分布的情況下,在訓(xùn)練模型中設(shè)置隨機種子,擴充樣本X 使其約等于研究區(qū)域建筑總量,形成新的隨機樣本訓(xùn)練數(shù)據(jù)集X,使其仍然服從原樣本數(shù)據(jù)分布,計算X 均值和標(biāo)準(zhǔn)差,研究被抽取的建筑能耗平均值和標(biāo)準(zhǔn)差的變化情況。本算法以R 軟件為算法開發(fā)工具,R-Studio 為集成開發(fā)環(huán)境。
3.2.1 單位建筑面積年用電量抽樣均值和標(biāo)準(zhǔn)差對樣本量的影響
首先分析單位面積年用電量和樣本量之間的關(guān)系。令顯著性水平α 取常數(shù)0.05,置信水平為95%,計算樣本均值為87.56,標(biāo)準(zhǔn)差為29.06。進入隨機抽樣,首先選取10 個有效樣本建筑數(shù)據(jù),然后根據(jù)上節(jié)算法模型計算每增加一步長(實驗步長為1)的樣本抽樣均值和標(biāo)準(zhǔn)差。
如圖2 所示,以雙坐標(biāo)形式表示,其中橫坐標(biāo)表示樣本數(shù)量,縱坐標(biāo)分別表示樣本能耗抽樣均值和標(biāo)準(zhǔn)差可能出現(xiàn)的數(shù)值,圖中點虛線分別代表樣本能耗平均值和標(biāo)準(zhǔn)差,可以看出,樣本抽樣均值和標(biāo)準(zhǔn)差的可能值,隨著樣本量的增加而逐漸趨于樣本的均值和標(biāo)準(zhǔn)差,當(dāng)樣本量增大到一定程度后,樣本抽樣均值和方差波動范圍穩(wěn)定并縮小至樣本均值和標(biāo)準(zhǔn)差。表明隨著被抽取監(jiān)測的樣本建筑數(shù)量的增多并且增大到一定的值,用于能耗評價的數(shù)據(jù)量的增大,用于統(tǒng)計推斷的公共建筑的單位建筑面積年用電量對數(shù)的期望和標(biāo)準(zhǔn)差波動逐漸減小,當(dāng)給定波動幅度,從概率學(xué)角度來講,此時用于能耗特性分析的樣本數(shù)據(jù)可以代表總體數(shù)據(jù)特性,即可確定該幅度對應(yīng)的樣本數(shù)量。這說明,用于統(tǒng)計分析的建筑能耗數(shù)據(jù)樣本量的下限值是存在并可確定。
圖2 均值,標(biāo)準(zhǔn)差與樣本量關(guān)系趨勢圖
3.2.2 誤差限對合理樣本量取值的影響
令顯著性水平α 取常數(shù)0.05,置信水平為95%時,分析誤差限對樣本量下限的影響。繪制樣本抽樣均值和方差的絕對誤差,樣本抽樣均值和方差的相對誤差與樣本量趨勢圖。
從圖3 可以看出,絕對誤差的變化趨勢為:隨著被抽樣建筑數(shù)量的增加,單位面積年耗電量的期望和標(biāo)準(zhǔn)差的絕對誤差逐漸降低。當(dāng)樣本量增加到一定臨界值時候,絕對誤差隨著樣本量下降的趨勢變得緩慢,甚至保持不變。相對誤差的變化趨勢為:隨著被抽取樣本建筑數(shù)量的增加,單位建筑面積年耗電量的期望和標(biāo)準(zhǔn)差的相對誤差逐漸降低。當(dāng)樣本量增加到一定的臨界值時候,相對誤差隨著樣本量下降的趨勢變得緩慢,而當(dāng)被抽取樣本建筑數(shù)量達到一定的臨界值時,樣本抽樣均值和標(biāo)準(zhǔn)差的相對誤差均小于20%。當(dāng)樣本量達到該臨界值時候,增加樣本量對相對誤差下降的趨勢影響變?nèi)酰凑J為此時樣本建筑能耗情況已經(jīng)能夠代表總體建筑能耗情況,稱此時的建筑樣本量為最小樣本量,當(dāng)抽樣監(jiān)測建筑數(shù)量約等于73,此時抽樣均值的相對誤差為8%,標(biāo)準(zhǔn)差的相對誤差為20%。同時,建筑能耗標(biāo)準(zhǔn)差的相對誤差均大于均值的相對誤差,這表明標(biāo)準(zhǔn)差的準(zhǔn)確估計相對于均值而言更重要,對標(biāo)準(zhǔn)差的準(zhǔn)確估計需要更多得到樣本建筑。這與建筑能耗數(shù)據(jù)之間差異很大,數(shù)據(jù)離散程度較高時需要更多的樣本建筑才能反映總體建筑的能耗情況這一實際相符。
圖3 抽樣誤差限與樣本量關(guān)系趨勢圖
從統(tǒng)計學(xué)角度論證了建筑能耗監(jiān)測下限樣本量的存在并求解了最小監(jiān)測樣本量值,使得建筑能耗統(tǒng)計或者監(jiān)測過程中,可以更科學(xué)的確定合理的樣本建筑數(shù)量,而不是依賴經(jīng)驗。同樣,該方法適用范圍廣,不局限于建筑類型及研究區(qū)域氣候條件控制,僅受研究對象均值和標(biāo)準(zhǔn)差的影響,對建筑能耗監(jiān)測規(guī)模的確定具有重要推動作用。