王鵬飛, 卞金露
(海裝駐上海地區(qū)第二軍事代表室, 上海 200129)
在我國排放的溫室氣體中,50%以上出自發(fā)電取暖的能源消費,而根本原因是較低的能源利用效率。冷、熱、電三聯(lián)供機組(Combined Cooling Heating and Power Tri-Generation,CCHP)系統(tǒng)作為一種發(fā)展迅速的分布式能源,階梯式利用燃?xì)猱a(chǎn)生的熱能進(jìn)行熱電聯(lián)供、冷熱電三聯(lián)供發(fā)電,將單一的燃?xì)獍l(fā)電效率從30%~40%提高到70%~80%,表現(xiàn)優(yōu)越。同時,相比于以往集中供能的能源輸配方式,CCHP大大減少了傳輸過程中的能量損耗。目前,我國對分布式能源系統(tǒng)的使用還處于試點和探索階段,原則上以“以熱定電”確定CCHP的裝機容量,允許有條件的機組余電上網(wǎng),這些政策為推廣分布式能源系統(tǒng)提供了助力。
準(zhǔn)確的短時熱負(fù)荷預(yù)測為CCHP系統(tǒng)精細(xì)化運行控制策略提供了數(shù)據(jù)支持。目前,幾乎所有的CCHP系統(tǒng)的需求分析均以“趨勢預(yù)測”作為日常的運行控制方式。這種預(yù)測在不同預(yù)設(shè)環(huán)境條件下,以用能對象的標(biāo)準(zhǔn)能源需求為計算基礎(chǔ),預(yù)測標(biāo)的多為長期、大區(qū)域、大需量的負(fù)荷,所以對數(shù)據(jù)的采集方式、采集頻率、采集精度的要求較低,結(jié)果多用作定性分析,匹配預(yù)設(shè)的控制策略。然而實際影響負(fù)荷需求的因素復(fù)雜多樣且相互關(guān)聯(lián),基于線性回歸的數(shù)值預(yù)測模型的參考價值已日趨降低[1-3]。由于神經(jīng)網(wǎng)絡(luò)普遍具有非線性函數(shù)的逼近能力,因此成為了非線性時間序列預(yù)測的主要工具。本文采用在復(fù)雜系統(tǒng)預(yù)測中表現(xiàn)出色的神經(jīng)網(wǎng)絡(luò)模型,對CCHP系統(tǒng)短時熱負(fù)荷需求進(jìn)行預(yù)測。
目前,CCHP已成為國內(nèi)新建能源中心項目的主要形式,在北京、上海、廣州等地進(jìn)行了推廣示范,但多以樓宇供能項目示范為主。本文結(jié)合國內(nèi)第一個大型商務(wù)區(qū)CCHP項目——虹橋商務(wù)區(qū)核心區(qū)域CCHP項目,提出了基于徑向基函數(shù)廣義回歸網(wǎng)絡(luò)(Radial Basis Function Generalized Regression Neural Network,RBFGRNN)模型的短時熱負(fù)荷預(yù)測方法。相比其他的神經(jīng)網(wǎng)絡(luò),如基于反傳算法的多層感知器(Back Propagation Neural Network,BPNN)等,徑向基函數(shù)網(wǎng)絡(luò)(Radial Basis Function Network,RBFNET)[4-5]具有逼近特性最佳、訓(xùn)練快速、不會陷入局部極小等優(yōu)點,更適合于短時預(yù)測應(yīng)用?;趶较蚧瘮?shù)廣義回歸網(wǎng)絡(luò)在徑向基函數(shù)網(wǎng)絡(luò)的基礎(chǔ)上,引入了Kohonen自組織映射(Kohonen Self-Organizing Mapping,KSOM)對樣本進(jìn)行聚類處理,優(yōu)化了RBFNET在構(gòu)建低維高維映射時所需隱含神經(jīng)元的數(shù)目,降低了運算復(fù)雜性和單位時間內(nèi)對運算能力的要求。本文針對短時熱負(fù)荷,先采用傅里葉系數(shù)分解采集數(shù)據(jù),建立負(fù)荷模型,過濾歷史數(shù)據(jù)中的奇異值,平滑負(fù)荷曲線,再將平滑后的數(shù)據(jù)導(dǎo)入KSOM中進(jìn)行聚類處理,以平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)作為學(xué)習(xí)評價函數(shù)對RBFGRNN的訓(xùn)練結(jié)果通過試誤法得出最優(yōu)的樣本集合分類,進(jìn)而獲得隱含層與輸出層之間的最佳線性權(quán)重。試驗結(jié)果證明了所用方法合理、準(zhǔn)確。
觀察歷史數(shù)據(jù)的趨勢及峰谷特征,采用先以傅里葉系數(shù)分解原始數(shù)據(jù)再重組的方法對熱負(fù)荷建模[6]。負(fù)荷曲線可分解為基值、增量及周期性分量:
L=lbase+lgrowth+lperiodic
(1)
式中:L——熱負(fù)荷;
lbase——熱負(fù)荷基值;
lgrowth——熱負(fù)荷線性增量;
lperiodic——熱負(fù)荷周期性分量。
式(1)可改寫為如下所示的矩陣形式:
L=W·X
(2)
其中:
(3)
(4)
式中:ω0——基波角頻率;
b1——基荷;
b2——線性增長率;
b3、…、b2n+1——諧波分量的系數(shù)。
所以系數(shù)矩陣W為
W=inv(X)·L
(5)
(6)
模型的學(xué)習(xí)可分為樣本數(shù)據(jù)預(yù)處理、網(wǎng)絡(luò)權(quán)重計算及學(xué)習(xí)結(jié)果評價。樣本數(shù)據(jù)預(yù)處理包括樣本隨機排列、數(shù)據(jù)歸一化、樣本聚類分析。網(wǎng)絡(luò)權(quán)重計算通過RBFGRNN的訓(xùn)練法則,對訓(xùn)練樣本進(jìn)行維度變換,并尋找高維度模型輸入矩陣與模型輸出列之間的線性權(quán)重。學(xué)習(xí)結(jié)果評價是根據(jù)評價函數(shù)將測試樣本輸入模型進(jìn)行的。若模型學(xué)習(xí)表現(xiàn)不佳,則重新對訓(xùn)練樣本進(jìn)行競爭聚類,并激活模型的再次學(xué)習(xí)。混合模型學(xué)習(xí)流程如圖1所示,具體的過程算法將在本文中描述。
圖1 混合模型學(xué)習(xí)流程
通常數(shù)據(jù)樣本是按采集的時間順序排列的,如果直接送入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,神經(jīng)網(wǎng)絡(luò)將默認(rèn)該順序作為一個輸入輸出映射進(jìn)行反復(fù)記憶訓(xùn)練。訓(xùn)練完成后,這個時間的先后順序自然也將影響負(fù)荷的預(yù)測精度。通常在進(jìn)行訓(xùn)練前,要求樣本重新隨機化排列[7]。
樣本中數(shù)據(jù)的量綱及單位往往是不一致的,這種情況會影響到神經(jīng)網(wǎng)絡(luò)模型預(yù)測的準(zhǔn)確度,并且延長網(wǎng)絡(luò)訓(xùn)練的時間。為了消除這一影響,需要對樣本數(shù)據(jù)進(jìn)行歸一化處理,通過線性的數(shù)值變換,使得每個數(shù)據(jù)的值都在[0,1]的區(qū)間內(nèi),且保持與變換前相同的相對方差。常用的歸一化方法有Max-Min歸一化和Z-score歸一化。
(1) Max-Min歸一化:
(7)
(2) Z-score歸一化:
(8)
其中,xi,norm是歸一化后的樣本,max(X)、min(X)、μ、σ分別是所有樣本中各因素的最大值、最小值、均值及標(biāo)準(zhǔn)差的集合。當(dāng)訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測時,預(yù)測值要逆歸一化,然后進(jìn)行誤差分析。
RBFGRNN利用徑向基函數(shù)作為核置換方程將輸入樣本從低維度空間向高維度空間映射,使得不同集合間的線性分割超平面更易被尋得。在進(jìn)行置換前,需確定樣本的最優(yōu)集合數(shù)。本文使用競爭性聚類方法KSOM對訓(xùn)練樣本進(jìn)行聚類,用集合中心以及集合半徑來確定置換前徑向基函數(shù)的中心(Center)及擴散系數(shù)(Spread)。KSOM由輸入層與競爭層組成。Kohonen自組織映射拓?fù)鋱D如圖2所示,比較輸入向量與各初始中心向量的歐幾里得距離,確定獲勝中心,根據(jù)預(yù)設(shè)的學(xué)習(xí)率β將獲勝中心向量C向輸入向量移動。經(jīng)過反復(fù)迭代,各中心向量不再移動或移動距離足夠小,即可認(rèn)為競爭結(jié)束,聚類完成[8]。
圖2 Kohonen自組織映射拓?fù)鋱D
徑向基函數(shù)廣義回歸網(wǎng)絡(luò)的結(jié)構(gòu)拓?fù)溆?層,分別為輸入層、隱含層和求和層。徑向基函數(shù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖3所示。隱含層所包含的神經(jīng)元由內(nèi)核函數(shù)構(gòu)成,本文選用高斯置換函數(shù)作為內(nèi)核函數(shù)進(jìn)行輸入空間映射:
(9)
式中:xi——第i個樣本;
cj——第j個樣本集合的中心;
δj——第j個樣本集合的擴散系數(shù)。
在對原始訓(xùn)練數(shù)據(jù)通過KSOM進(jìn)行競爭聚類后,便可確定RBFGRNN隱含層內(nèi)各隱含神經(jīng)元的內(nèi)核方程。
圖3 徑向基函數(shù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
從式(10)中可見,若原輸入空間為一個m×n的矩陣,m為樣本個數(shù),n為每個樣本所含的輸入因素個數(shù),則經(jīng)過映射后,輸入空間變?yōu)橐粋€m×(k+1)的矩陣G,k?n。
(10)
最后,線性求和層的權(quán)重通過Moore-Penrose廣義逆矩陣求得[9]:
Y=G·W
(11)
W=(GTG)-1GTY
(12)
相比常見的MLP,RBFGRNN在完成低維向高維置換后,只剩下對線性分割超平面的求解過程,沒有反復(fù)迭代的多層權(quán)重收斂過程,也不會發(fā)生由于初始權(quán)重選取不佳而導(dǎo)致的權(quán)重在收斂過程中陷入局域極小的情況,所以訓(xùn)練速度非常快。
神經(jīng)網(wǎng)絡(luò)常用的評價函數(shù)為均方差(Mean Square Error,MSE),但是在歸一化以后,誤差絕對值均小于1,故選用MAPE來作為神經(jīng)網(wǎng)絡(luò)的評價函數(shù):
(13)
在使用高斯方程進(jìn)行高位映射時,需要先對樣本進(jìn)行分類,而樣本集合最大半徑與集合中心的選取對于預(yù)測精度而言是一個妥協(xié)的過程。本文采用KSOM進(jìn)行聚類分析,尋找中心及擴散系數(shù)。通過調(diào)整最大集合半徑的方法比較調(diào)整前后的網(wǎng)絡(luò)訓(xùn)練表現(xiàn)從而迅速確定RBFGRNN最優(yōu)的隱含層神經(jīng)元個數(shù)。
試驗流程圖如圖4所示,原始數(shù)據(jù)來自虹橋商務(wù)區(qū)D17地塊負(fù)荷數(shù)據(jù),樣本采集時間為試驗日0∶00 至次日0∶00,樣本采集頻率為每5 min一次。試驗前,將數(shù)據(jù)轉(zhuǎn)換為每小時一次。由于缺乏其他相關(guān)環(huán)境數(shù)據(jù),如溫度、日照強度、室外干球溫度、濕度、風(fēng)速、空氣密度等,本次試驗所選取的神經(jīng)網(wǎng)絡(luò)輸入因素為預(yù)測目標(biāo)熱負(fù)荷前3 h的歷史負(fù)荷數(shù)據(jù)。這3項輸入因素隱含了熱負(fù)荷連續(xù)變化的速度及加速度,與被預(yù)測目標(biāo)的變化關(guān)聯(lián)緊密。輸入和輸出表示為
Input=[Load-3Load-2Load-1]
(14)
Output=[Load]
(15)
圖4 試驗流程圖
在采集的樣本中,負(fù)荷的峰谷特征明顯。某些時刻,計量設(shè)備故障、傳輸信號被干擾、計劃外的負(fù)荷增減等因素會導(dǎo)致計量數(shù)據(jù)中出現(xiàn)異常值。D17地塊熱負(fù)荷記錄數(shù)據(jù)如圖5所示,圖5中30~50 h區(qū)間中出現(xiàn)了2個波谷;80~120 h區(qū)間中出現(xiàn)負(fù)荷恒定的情況。這種非周期性出現(xiàn)的異常值對負(fù)荷預(yù)測建模的準(zhǔn)確性產(chǎn)生了很大的影響。
圖5 D17地塊熱負(fù)荷記錄數(shù)據(jù)
由于工作日與節(jié)假日負(fù)荷曲線差異很大,因此通常將其分開建模。但負(fù)荷載體為一混合型商務(wù)地塊,含有辦公樓宇、酒店等,工作日與節(jié)假日、周六與周日之間差異也非常明顯,且原始數(shù)據(jù)中奇異值多發(fā)生于73~120 h?;谝陨显?本文以1~72 h內(nèi)的工作日負(fù)荷為基準(zhǔn),采用傅里葉系數(shù)分解法建立負(fù)荷模型,并對奇異的負(fù)荷記錄進(jìn)行剝離及插值估算。
D17地塊熱負(fù)荷原始數(shù)據(jù)及傅里葉模型平滑數(shù)據(jù)如圖6所示。圖6顯示了經(jīng)過傅里葉分解建模后的熱負(fù)荷平滑數(shù)據(jù)與歷史原始數(shù)據(jù)的對比。通過計算包含基波與前6次諧波的傅里葉負(fù)荷模型與原始數(shù)據(jù)之間的決定系數(shù)得到R2=0.794。平滑數(shù)據(jù)與歷史數(shù)據(jù)的擬合度非常高。利用傅里葉模型的擴展功能,對73~120 h(周四、周五)的熱負(fù)荷進(jìn)行插值估算。D17地塊熱負(fù)荷原始數(shù)據(jù)與傅里葉模型插值估算數(shù)據(jù)的對比如圖7所示。在88~102 h之間的奇異數(shù)據(jù)(原始數(shù)據(jù)中的恒定熱功率輸出而累計熱量沒有增加)得到了修正。
圖6 D17地塊熱負(fù)荷原始數(shù)據(jù)及傅里葉模型平滑數(shù)據(jù)
圖7 D17地塊熱負(fù)荷原始數(shù)據(jù)與
通過數(shù)據(jù)的平滑處理后,75%的樣本用作訓(xùn)練樣本,剩余25%樣本作為測試樣本,分別放入神經(jīng)網(wǎng)絡(luò)中訓(xùn)練和測試。不同集合最大半徑的網(wǎng)絡(luò)測試表現(xiàn)如圖8所示,最后確定的最大集合半徑為0.2,其相對應(yīng)的集合數(shù)為99,因此隱含層由99個神經(jīng)元組成,其逆歸一化前的平均絕對誤差值為0.040 3%。
圖8 不同集合最大半徑的網(wǎng)絡(luò)測試表現(xiàn)
徑向基函數(shù)廣義回歸網(wǎng)絡(luò)測試結(jié)果與實際值的對比如圖9所示。由圖9中可見,測試輸出值與實際值負(fù)荷曲線近似重合。徑向基函數(shù)廣義回歸網(wǎng)絡(luò)測試誤差曲線如圖10所示,最大誤差為17.841 0 kW,最小誤差為6.504×10-4kW。逆歸一化后的平均絕對誤差值為0.117 4%。
計算預(yù)測值與平滑數(shù)據(jù)之間的相關(guān)系數(shù)為R=0.989,證明了預(yù)測模型是非??尚诺摹Mㄟ^對誤差的統(tǒng)計分析,大多的概率累加點在正態(tài)分布函數(shù)變化后的直線上,故可認(rèn)為誤差服從標(biāo)準(zhǔn)隨機正態(tài)分布。徑向基函數(shù)廣義回歸網(wǎng)絡(luò)預(yù)測誤差的標(biāo)準(zhǔn)概率分布如圖11所示。
圖9 徑向基函數(shù)廣義回歸網(wǎng)絡(luò)測試結(jié)果與實際值的對比
圖10 徑向基函數(shù)廣義回歸網(wǎng)絡(luò)測試誤差曲線
圖11 徑向基函數(shù)廣義回歸網(wǎng)絡(luò)預(yù)測誤差的
本文提出的短期負(fù)荷預(yù)測算法,首先采用傅里葉系數(shù)分解方法對負(fù)荷重新建模,過濾奇異數(shù)據(jù),并估計奇異數(shù)據(jù)的真實值。然后應(yīng)用反傳網(wǎng)絡(luò)與徑向基函數(shù)網(wǎng)絡(luò)建立負(fù)荷預(yù)測模型。使用75%的樣本數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,剩余25%的數(shù)據(jù)進(jìn)行測試。試驗結(jié)果表明,本文所提出的短期負(fù)荷預(yù)測算法的預(yù)測精度平均絕對百分誤差小于0.12%。
負(fù)荷需求曲線呈非線性,關(guān)聯(lián)多個影響因素,如溫度、日照強度、室外干球溫度、濕度、節(jié)假日、風(fēng)速、空氣密度等,但同時將其作為輸入因素影響了預(yù)測模型輸入因素的獨立性。因此在負(fù)荷預(yù)測前,通過對負(fù)荷影響因素做數(shù)值分析,如主成分分析(Principal Component Analysis,PCA)、卡-洛變換(Karhunen-Loeve Transform,KLT)等,消除因素之間的關(guān)聯(lián)性,并對初始輸入空間進(jìn)行篩選及降維處理。虹橋商務(wù)區(qū)CCHP系統(tǒng)尚處于試運行階段,所積累的歷史負(fù)荷需求及環(huán)境數(shù)據(jù)不夠多,無法應(yīng)用成熟的系統(tǒng)化前期數(shù)據(jù)處理技術(shù),且神經(jīng)網(wǎng)絡(luò)對于歷史經(jīng)驗數(shù)據(jù)的學(xué)習(xí)在外部環(huán)境變化時有時效性的問題,過多的歷史數(shù)據(jù)也會造成過學(xué)習(xí)的問題。如果預(yù)測出現(xiàn)較大誤差,則說明與此事件類似度高的歷史事件沒有出現(xiàn)在RBFGRNN的訓(xùn)練樣本中。KSOM會將此事件單獨成類,并利用RBFGRNN訓(xùn)練快速的優(yōu)勢,迅速地完成學(xué)習(xí)過程。
本文提出的基于RBFGRNN混合模型的短時熱負(fù)荷預(yù)測方法,克服了相關(guān)環(huán)境數(shù)據(jù)缺乏、原始采集數(shù)據(jù)多奇異值的困難,達(dá)到了理想的預(yù)測精度,為將來類似的預(yù)測項目提供了可靠的借鑒。