竇嘉銘,馬鴻雁*,2,3
(1. 北京建筑大學(xué)電氣與信息工程學(xué)院,北京100044;2. 智慧城市國(guó)家級(jí)虛擬仿真實(shí)驗(yàn)教學(xué)中心,北京 100044;3. 建筑大數(shù)據(jù)智能處理方法研究北京市重點(diǎn)實(shí)驗(yàn)室,北京 100044)
2019年發(fā)布的《2018年中國(guó)建筑能耗研究報(bào)告》[1]指出,2000年~2016年我國(guó)建筑能耗占全國(guó)能源消費(fèi)總量的17%~21%。隨著經(jīng)濟(jì)快速發(fā)展,建筑能耗也呈現(xiàn)一種增長(zhǎng)的趨勢(shì)。通過采集建筑數(shù)據(jù),建立建筑物能耗預(yù)測(cè)模型,進(jìn)行節(jié)能改造逐漸成為當(dāng)今社會(huì)發(fā)展的研究熱點(diǎn)。
目前,通過對(duì)已有建筑物結(jié)構(gòu)進(jìn)行建模的方法和數(shù)據(jù)驅(qū)動(dòng)的方法是國(guó)內(nèi)外建筑物能耗預(yù)測(cè)的兩種主流方法。依據(jù)建筑物結(jié)構(gòu)進(jìn)行建模是一種“白箱”的建模方法,優(yōu)點(diǎn)是不需要收集能耗數(shù)據(jù),并且易于解讀,但該方法往往會(huì)因?yàn)閷?shí)際建筑與模擬建筑在參數(shù)設(shè)計(jì)上存在一定差異,因此得到的結(jié)果往往會(huì)有較大誤差[2]。而數(shù)據(jù)驅(qū)動(dòng)的方法以其速度快,精度高的優(yōu)點(diǎn)而備受推崇。人工神經(jīng)網(wǎng)絡(luò)(ANN)具有很強(qiáng)的非線性、并行處理能力和魯棒性,并且不需要建立復(fù)雜的數(shù)學(xué)模型,屬于建筑能耗預(yù)測(cè)中十分常用的一種數(shù)據(jù)驅(qū)動(dòng)模型。文獻(xiàn)[3]統(tǒng)計(jì)了在建筑能耗預(yù)測(cè)領(lǐng)域各類學(xué)習(xí)算法使用的概率,分別為:回歸(26%)、ANN(41%)、SVR(12%)和其它類型(21%),并得出結(jié)論,ANN是這四類算法中應(yīng)用最廣泛的。
通過閱讀文獻(xiàn)[4]-[7],發(fā)現(xiàn)國(guó)內(nèi)預(yù)測(cè)模型的研究主要有以下缺點(diǎn):①大多數(shù)文獻(xiàn)使用大量的樣本數(shù)據(jù)才能獲得較好的結(jié)果,如果只有少量數(shù)據(jù),預(yù)測(cè)精度難以提高。②模型預(yù)測(cè)結(jié)果總體上不夠準(zhǔn)確。③預(yù)測(cè)模型影響因素眾多,尤其是天氣因素,導(dǎo)致輸入樣本維度較高,使得神經(jīng)網(wǎng)絡(luò)收斂速度慢,易陷入局部最優(yōu)。
此外,國(guó)內(nèi)組合預(yù)測(cè)模型的研究與國(guó)外還有國(guó)內(nèi)組合預(yù)測(cè)模型的研究與國(guó)外還有較大差距,且主要局限在經(jīng)濟(jì)領(lǐng)域。在能源電力領(lǐng)域,尤其是在建筑能耗預(yù)測(cè)模型的構(gòu)建上,組合預(yù)測(cè)方法的研究文章較少。
對(duì)此,本文一方面使用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),防止其陷入局部最優(yōu),另一方面,使用灰色關(guān)聯(lián)度分析法和人體舒適度指數(shù)處理天氣因素。分別利用等權(quán)重法和優(yōu)勢(shì)矩陣法,來組合GA-BPNN、RBFN、GRNN三種單一神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建組合預(yù)測(cè)模型,進(jìn)一步縮小預(yù)測(cè)誤差。最后,使用某圖書館的實(shí)際能耗數(shù)據(jù)進(jìn)行驗(yàn)證。
BP神經(jīng)網(wǎng)絡(luò)是一種前饋網(wǎng)絡(luò),由輸入層、輸出層和一個(gè)或多個(gè)隱含層組合而成,其典型結(jié)構(gòu)如圖1所示。每層都有大量的神經(jīng)元,前一層的神經(jīng)元都與后一層的神經(jīng)元加權(quán)連接。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法,采用的是誤差反向傳播的形式,其學(xué)習(xí)規(guī)則為梯度下降法。訓(xùn)練網(wǎng)絡(luò)的過程就是神經(jīng)元之間權(quán)值調(diào)整的過程,每一層神經(jīng)元的權(quán)值和閾值都根據(jù)誤差反向傳播而不斷進(jìn)行調(diào)整,直到期望輸出與實(shí)際輸出的均方差(MSE)最小。
圖1 BP神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)在運(yùn)行中存在局部最優(yōu)的情況,因此,使用遺傳算法優(yōu)化網(wǎng)絡(luò)中權(quán)值和閾值的選取過程,使網(wǎng)絡(luò)達(dá)到更好的性能。
RBF網(wǎng)絡(luò)是一種前向的神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)與BP神經(jīng)網(wǎng)絡(luò)類似,它分為輸入層,隱藏層和輸出層。輸入層節(jié)點(diǎn)個(gè)數(shù)等于輸入數(shù)據(jù)類型的個(gè)數(shù)。隱藏層使用徑向?qū)ΨQ函數(shù)作為隱藏層中的激活函數(shù),將輸入向量空間轉(zhuǎn)化成隱含層空間,可以將非線性問題變?yōu)榫€性問題。輸出層的節(jié)點(diǎn)個(gè)數(shù)與輸出數(shù)據(jù)的維數(shù)一致。
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)是普通徑向基神經(jīng)網(wǎng)絡(luò)的一種變形。包括四層,分別是輸入層、模式層、求和層和輸出層。模式層比較特殊,它的數(shù)量是樣本的數(shù)量。求和層的數(shù)量等于輸出樣本的維度加1。廣義回歸神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)如圖2所示。
圖2 廣義回歸網(wǎng)絡(luò)的典型結(jié)構(gòu)
本文選取的天氣數(shù)據(jù)為2018年1月8日~2018年4月7日共90組的數(shù)據(jù),其中包括最高溫度、最低溫度、平均溫度、相對(duì)濕度、日照時(shí)間和風(fēng)速。被關(guān)聯(lián)的數(shù)據(jù)是某圖書館在該段時(shí)間內(nèi)的建筑總能耗實(shí)測(cè)數(shù)據(jù)。
圖3為所選日期內(nèi)溫度和能耗的變化圖,上圖為溫度,下圖為建筑能耗。由圖3可知,隨著時(shí)間的推移,溫度(最高溫度、最低溫度、平均溫度)局部稍有動(dòng)蕩,但總體不斷增長(zhǎng)。冬季最低溫度較低,建筑內(nèi)開啟暖氣、空調(diào)制熱以保證室內(nèi)溫度;夏季最高溫度較高,建筑內(nèi)部開啟空調(diào)制冷以降低室內(nèi)溫度,提高人的舒適性。然而,僅僅依靠圖3中并不能直觀的展示出某一天氣因素與建筑物能耗是否有很強(qiáng)的關(guān)聯(lián)性。因此,使用灰色關(guān)聯(lián)度分析法分析六類天氣因素對(duì)建筑能耗的影響?;疑P(guān)聯(lián)度分析的具體步驟如下:
1)建立原始數(shù)據(jù)矩陣
xi=(xi(1),xi(2),…,xi(k),…)
(1)
其中,xi(k)表示第i個(gè)天氣因素在第k天的數(shù)據(jù),x0(k)表示第k天的建筑能耗數(shù)據(jù)。
2)初值化
(2)
3)計(jì)算灰色關(guān)聯(lián)度系數(shù)ξ0i和灰色關(guān)聯(lián)度γ0i
ξ0i(k)=
圖3 所選日期內(nèi)溫度和建筑能耗的變化
灰色關(guān)聯(lián)度γ0i為
(4)
通過上述方法,可以得到這六類天氣因素相對(duì)于建筑能耗的灰色關(guān)聯(lián)度,如表1所示:
表1 天氣因素與建筑能耗之間的灰色關(guān)聯(lián)度
分析表1可得:
1)平均溫度與建筑能耗的關(guān)聯(lián)程度最大,日照時(shí)間最小。具體排序?yàn)椋浩骄鶞囟?最低溫度>最高溫度>相對(duì)濕度>風(fēng)速>日照時(shí)間。
2)在本文所選的日期節(jié)點(diǎn)下,最高溫度相對(duì)于最低溫度和平均溫度來說,與建筑能耗的關(guān)聯(lián)較低??梢酝茢啵x數(shù)據(jù)從季節(jié)上屬于冬季和春季,此時(shí)北京溫度較低。冬季的最高溫度在一定程度上不能反映冬季寒冷的真實(shí)情況。
3)平均溫度與建筑能耗的關(guān)聯(lián)度最高,說明溫度的平均值作為溫度這一研究目標(biāo)的概括性指標(biāo),本身相對(duì)于最值指標(biāo),更能反映數(shù)據(jù)變化的趨勢(shì)。最高溫度和最低溫度的變化雖然在某種程度上也能反映建筑能耗的趨勢(shì),但最值本身來講存在一定的隨機(jī)性。
六類天氣因素的灰色關(guān)聯(lián)度值均大于0.6,說明此六類天氣因素與建筑能耗均有一定的關(guān)聯(lián),因此均選為模型輸入的考慮對(duì)象。
如果單純的使用天氣因素作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)也是存在一定的問題:一方面,由于天氣因素?cái)?shù)量較多,可能使得神經(jīng)網(wǎng)絡(luò)輸入維度過高,導(dǎo)致其易于陷入局部最優(yōu)。另一方面,天氣因素只能反映有一部分建筑能耗所包含的信息,如果簡(jiǎn)單的減少天氣因素的種類,很可能使得預(yù)測(cè)精度下降。已有多篇文獻(xiàn)證實(shí)了人體舒適度在預(yù)測(cè)模型構(gòu)建中的應(yīng)用[9]-[11]。
人體舒適度指數(shù),是對(duì)人在環(huán)境中的舒適情況進(jìn)行評(píng)價(jià)的一種指數(shù)。主要通過溫度、相對(duì)濕度、風(fēng)速等方面的數(shù)據(jù)來評(píng)價(jià)人體的舒適程度。北京地區(qū)所對(duì)應(yīng)的人體舒適度指標(biāo)公式如下[12]:
(5)
式中DIBJ為北京地區(qū)人體舒適度指數(shù);t為日平均溫度,單位為℃;R為相對(duì)濕度,單位為%;V為風(fēng)速,單位為m/s.
因此,選擇人體舒適度指數(shù)代替部分天氣因素,作為神經(jīng)網(wǎng)絡(luò)的輸入。再選擇一些與預(yù)測(cè)日同類型的歷史數(shù)據(jù),彌補(bǔ)一些丟失的信息,以達(dá)到在小樣本數(shù)據(jù)下的最好預(yù)測(cè)效果。
目前,建筑能耗預(yù)測(cè)中,組合模型較為罕見。組合模型是相對(duì)于單一模型而言的。由于建筑能耗或電力負(fù)荷往往具有非穩(wěn)定性、隨機(jī)性和時(shí)變性等特點(diǎn),使得單一模型的預(yù)測(cè)精度難以把控。且每種單一模型只包含一定量的樣本信息,很難全方位地反映變量的變化規(guī)律。但單一模型也有其優(yōu)點(diǎn),具體表現(xiàn)為計(jì)算速度快、可靠性高、涉及的知識(shí)少、易于實(shí)現(xiàn)等等。
文獻(xiàn)[13]曾證明了兩種及兩種以上的無偏單項(xiàng)預(yù)測(cè)模型可以組合出優(yōu)于每個(gè)單項(xiàng)模型的結(jié)果,進(jìn)而有效地提升預(yù)測(cè)準(zhǔn)確度。使用多種預(yù)測(cè)技術(shù)的模型,正是將單個(gè)模型看作代表不同信息的片段,通過信息的集成來分散單個(gè)模型特有的不確定性,并減少總體的不確定性,從而有效的提高預(yù)測(cè)精度[14]。通過不同的方法對(duì)多種預(yù)測(cè)模型進(jìn)行組合,利用來自不同預(yù)測(cè)模型多種角度的信息,可以更加的全面反映系統(tǒng)的變化規(guī)律,減少預(yù)測(cè)結(jié)果的隨機(jī)性。
4.2.1 等權(quán)重法
等權(quán)重法不需要考慮每種預(yù)測(cè)結(jié)果的準(zhǔn)確程度,直接賦予每種結(jié)果相同的權(quán)重。這種方法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單、容易實(shí)現(xiàn),不需要考慮每種預(yù)測(cè)方法之間的準(zhǔn)確程度和關(guān)聯(lián)程度;缺點(diǎn)是,簡(jiǎn)單的賦予權(quán)重難以體現(xiàn)出各種方法的特點(diǎn),忽略了不同預(yù)測(cè)方法之間的差別。等權(quán)重法在數(shù)學(xué)上表現(xiàn)為計(jì)算各個(gè)單一預(yù)測(cè)方法的算數(shù)平均值
(6)
其中,Xi表示第i種預(yù)測(cè)方法得到的預(yù)測(cè)結(jié)果,X表示組合預(yù)測(cè)結(jié)果。
4.2.2 優(yōu)勢(shì)矩陣法
1975年Bunn最早提出優(yōu)勢(shì)矩陣法的思想。1987年,Gupta和Wilton經(jīng)過論證等權(quán)重法的缺陷(如出現(xiàn)負(fù)權(quán)重),提出了一種新的權(quán)重確定方法,即優(yōu)勢(shì)矩陣法[16]。優(yōu)勢(shì)矩陣法是根據(jù)每種單一方法在每個(gè)樣本的預(yù)測(cè)準(zhǔn)確程度來分配權(quán)重。以三個(gè)單一模型進(jìn)行組合為例,假設(shè)A、B、C是三個(gè)單一模型,NA表示在整個(gè)樣本集里模型A比模型B、模型C預(yù)測(cè)結(jié)果精確的次數(shù),同理,NB表示在整個(gè)樣本集里模型B比模型A、模型C預(yù)測(cè)結(jié)果精確的次數(shù),NC表示在整個(gè)樣本集里模型C比模型A、模型B預(yù)測(cè)結(jié)果精確的次數(shù)。那么其權(quán)重分配公式如下
(7)
則組合預(yù)測(cè)模型的最終預(yù)測(cè)結(jié)果就是
(8)
其中Xi表示第i種預(yù)測(cè)方法得到的預(yù)測(cè)結(jié)果,wi表示第i種預(yù)測(cè)方法的權(quán)重,X表示3種方法組合之后的最終預(yù)測(cè)結(jié)果。其實(shí)現(xiàn)流程如圖4:
圖4 優(yōu)勢(shì)矩陣法流程圖
使用GA-BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、廣義回歸神經(jīng)網(wǎng)絡(luò)和本文提出的兩種組合模型,將90組數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測(cè)未來10天的建筑能耗。將預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)進(jìn)行對(duì)比分析。通過比較誤差的大小來展現(xiàn)本文所提算法相對(duì)于單一算法在建筑物耗預(yù)測(cè)方面的優(yōu)越性。
根據(jù)BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)、廣義回歸網(wǎng)絡(luò)的輸入輸出要求,選擇輸入變量和輸出變量。輸入變量的類型選擇如下:日最高溫度、日最低溫度、日熱舒適度、日星期類型、前一周同一類型日熱舒適度、前一周同一類型日建筑負(fù)荷能耗、前一天建筑負(fù)荷能耗、前兩天建筑負(fù)荷能耗。輸出變量的類型為預(yù)測(cè)日建筑負(fù)荷能耗。
為了避免神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)時(shí)因?yàn)檩斎?、輸出?shù)據(jù)的量級(jí)差別過大,導(dǎo)致神經(jīng)網(wǎng)絡(luò)的誤差較大,對(duì)數(shù)據(jù)進(jìn)行歸一化的處理。為了保證模型具有一定的外推性,使預(yù)測(cè)數(shù)據(jù)和訓(xùn)練數(shù)據(jù)在經(jīng)過數(shù)據(jù)預(yù)處理后的值在0.2~0.8之間,并且經(jīng)過預(yù)測(cè)得到的數(shù)據(jù)還需要進(jìn)行反歸一化處理。歸一化的公式如下
(9)
其中,xn表示原始數(shù)據(jù),xmin和xmax表示該數(shù)據(jù)的最小值和最大值,Xn表示歸一化后的數(shù)據(jù)。
對(duì)BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如下:神經(jīng)網(wǎng)絡(luò)函數(shù)采用newff函數(shù),BP神經(jīng)網(wǎng)絡(luò)最大循環(huán)次數(shù)(epochs)設(shè)置為50,訓(xùn)練目標(biāo)最小誤差(goal)為0.00001,網(wǎng)絡(luò)的學(xué)習(xí)速率(lr)設(shè)置為0.1;隱含層和輸入層之間采用tansig函數(shù),隱含層和輸出層之間采用purelin函數(shù);訓(xùn)練函數(shù)使用trainbr,即采用Bayes規(guī)范化法訓(xùn)練函數(shù)。構(gòu)建三層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò),輸入層節(jié)點(diǎn)數(shù)為 8,輸出層節(jié)點(diǎn)數(shù)為 1。由于神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)個(gè)數(shù)的確定并沒有統(tǒng)一的方法,但其在實(shí)際問題中對(duì)預(yù)測(cè)精度有很大影響。因此采用試湊法確定隱含層節(jié)點(diǎn)個(gè)數(shù),通過反復(fù)比較在不同隱含層節(jié)點(diǎn)數(shù)下的誤差,確定最佳隱含層節(jié)點(diǎn)數(shù)為13。
遺傳算法參數(shù)如下:迭代次數(shù)10,種群數(shù)量10,交叉概率0.4,變異概率0.2。
RBF神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如下:RBF神經(jīng)網(wǎng)絡(luò)采用newrb函數(shù),指定的訓(xùn)練均方誤差(goal)為0.015,徑向基函數(shù)擴(kuò)散速度(spread)為0.35。
廣義回歸神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如下:采用newgrnn函數(shù),擴(kuò)散速度(spread)為0.35。
本文主要使用的評(píng)價(jià)指標(biāo)是:
1)平均誤差MAE(一次損失函數(shù))[14]
(10)
2)平均百分比誤差MAPE
(11)
3)均方誤差MSE(二次損失函數(shù))[14]
(12)
4)平均運(yùn)行時(shí)間T
表2所示為六種不同模型的預(yù)測(cè)情況??梢钥闯?,不同預(yù)測(cè)方法在預(yù)測(cè)同一天的建筑能耗時(shí),結(jié)果是不同的。如表現(xiàn)欠佳的傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型,在某種特定的時(shí)間或場(chǎng)合預(yù)測(cè)非常精確[14](如序號(hào)1,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果誤差最小)。
表3是不同預(yù)測(cè)模型的評(píng)價(jià)指標(biāo),表4為不同模型中單一模型的權(quán)重分配??梢钥闯觯?/p>
1)單一模型:廣義回歸神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果明顯比BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)好。其MAPE為3.90%,T為0.6s,均好于BP(MAPE為6.64%,T為1.8s)、RBF(MAPE為4.67%,T為0.9s)。GA-BP模型比BP模型雖然在時(shí)間上有所延長(zhǎng),但預(yù)測(cè)精度也有所提高。這符合他人的研究結(jié)果[16]。
2)單一模型與組合模型:等權(quán)重法和優(yōu)勢(shì)矩陣法MAE分別為115.01和134.00,MSE分別為21159和27586。除優(yōu)勢(shì)權(quán)重法的MSE不如廣義回歸神經(jīng)網(wǎng)絡(luò)外,兩種組合模型(等權(quán)重法、優(yōu)勢(shì)矩陣法)的預(yù)測(cè)結(jié)果都要好于三種單一模型。從運(yùn)算時(shí)間來看,單一模型的時(shí)間更短,這是因?yàn)榻M合模型比單一模型有更多的運(yùn)算量。但在某些情況下,為了得到更小的預(yù)測(cè)誤差,額外的運(yùn)算時(shí)間也是可以接受的。
3)兩種組合模型:從時(shí)間來看,二者基本一致。從誤差來看,組合模型通過組合三種神經(jīng)網(wǎng)絡(luò)模型,達(dá)到了誤差降低的效果??梢钥闯?,在本例中使用等權(quán)重法的組合模型誤差要比優(yōu)勢(shì)矩陣法低。究其原因,是因?yàn)槿哓暙I(xiàn)不一致造成的。在優(yōu)勢(shì)矩陣法下,GA-BPNN、RBFNN、GRNN三者權(quán)值分別為0.6333、0.2000、0.1667,而等權(quán)重法分別為0.3333、0.3333、0.3333(見表4)。說明GA-BPNN的結(jié)果主導(dǎo)了優(yōu)勢(shì)矩陣法模型的結(jié)果,而GA-BPNN模型受遺傳算法的影響,容易出現(xiàn)早熟的現(xiàn)象。如表2中序號(hào)1的數(shù)據(jù),GA-BPNN模型的預(yù)測(cè)結(jié)果相對(duì)于測(cè)量值有較大偏差,導(dǎo)致了組合模型也產(chǎn)生較大偏差,影響最終的預(yù)測(cè)結(jié)果。此外,Gupta和Wilton[15]的研究結(jié)果也表明,對(duì)于大樣本的數(shù)據(jù),優(yōu)勢(shì)矩陣法的精確性超過了等權(quán)重法。本文研究的是小樣本數(shù)據(jù)的預(yù)測(cè)模型,因此兩種組合模型的精度是可以接受的。
表2 六種建筑能耗預(yù)測(cè)模型預(yù)測(cè)結(jié)果對(duì)比
表3 不同預(yù)測(cè)模型評(píng)價(jià)
表4 不同模型權(quán)重分配
本文介紹了組合預(yù)測(cè)方法在構(gòu)建建筑能耗預(yù)測(cè)模型方面的應(yīng)用。首先通過灰色關(guān)聯(lián)度分析和人體舒適度指數(shù)處理天氣因素。將處理后的天氣因素,連同歷史數(shù)據(jù)作為三種神經(jīng)網(wǎng)絡(luò)模型的輸入變量,采用兩種不同的組合方法對(duì)三種模型的預(yù)測(cè)結(jié)果進(jìn)行優(yōu)化。結(jié)果表明,組合預(yù)測(cè)方法在一定程度上克服了傳統(tǒng)單一神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu)的不足,提高了預(yù)測(cè)的精確度和可靠性。
此外,本文還存在一些不足和改進(jìn)方法:
1)組合模型存在易受某一單一模型的不良數(shù)據(jù)影響而導(dǎo)致誤差增大的問題,有兩種方法解決:一是可以通過增加模型的數(shù)量來抵消某一模型不良數(shù)據(jù);二是可以通過變權(quán)重的方法對(duì)不同模型的預(yù)測(cè)結(jié)果進(jìn)行變權(quán)重賦值來解決。
2)能否通過多種預(yù)測(cè)模型和多種權(quán)重方法的雙重組合來取得更好的效果也值得研究。