蘇 醒,王 磊,田少宸,秦 旭
(1.同濟(jì)大學(xué)機(jī)械與能源工程學(xué)院,上海 201804;2.同濟(jì)大學(xué)工程結(jié)構(gòu)性能演化與控制教育部重點(diǎn)實(shí)驗(yàn)室,上海 200092;3.廣州地鐵設(shè)計(jì)研究院股份有限公司節(jié)能和環(huán)保技術(shù)中心,廣東廣州 510010)
地下軌道交通車站作為一種典型的公共建筑,單位建筑面積能耗是常規(guī)公共建筑的2~4倍[1],其中地鐵車站通風(fēng)空調(diào)系統(tǒng)能耗占整個(gè)地鐵車站總能耗的比重約為30%~50%[2-4],節(jié)能潛力巨大。對(duì)地鐵車站空調(diào)負(fù)荷的準(zhǔn)確預(yù)測(cè)是實(shí)現(xiàn)空調(diào)系統(tǒng)優(yōu)化控制和節(jié)能運(yùn)行的前提。
機(jī)器學(xué)習(xí)算法逐漸應(yīng)用于建筑空調(diào)負(fù)荷預(yù)測(cè),主要包括人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)和 支 持 向 量 機(jī)(support vector machine,SVM)等方法。Wang等[5]使用神經(jīng)網(wǎng)絡(luò)結(jié)合部分物理規(guī)則對(duì)建筑冷負(fù)荷進(jìn)行了動(dòng)態(tài)預(yù)測(cè),顯著提高了預(yù)測(cè)精度。近年來(lái),SVM算法的預(yù)測(cè)方法得到了廣泛應(yīng)用。Chen等[6]將SVM算法應(yīng)用于空調(diào)逐時(shí)負(fù)荷預(yù)測(cè),并分別應(yīng)用遺傳算法、蟻群算法及粒子群算法對(duì)SVM的參數(shù)進(jìn)行優(yōu)化,預(yù)測(cè)結(jié)果表明這三種空調(diào)負(fù)荷預(yù)測(cè)模型的預(yù)測(cè)精度較高。Li等[7]比較了SVM和三種不同的ANN算法用于預(yù)測(cè)建筑逐時(shí)負(fù)荷的效果,發(fā)現(xiàn)SVM和廣義回歸神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)精度更高。這些研究主要應(yīng)用于人流量較為穩(wěn)定的建筑,對(duì)于地鐵車站,空調(diào)負(fù)荷受客流量影響更為明顯,樊佳慧[8]采用結(jié)構(gòu)模型解析方法對(duì)地鐵車站環(huán)控負(fù)荷及其影響因素進(jìn)行定性分析,發(fā)現(xiàn)主要影響因素為客流、室外氣象參數(shù)和列車行車對(duì)數(shù)。李婷婷等[9]建立了基于BP(反向傳播)神經(jīng)網(wǎng)絡(luò)的地鐵站廳空調(diào)負(fù)荷預(yù)測(cè)模型,選取室外空氣溫度、室外空氣相對(duì)濕度、人員數(shù)量、太陽(yáng)輻射作為神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù),利用TRNSYS軟件對(duì)站廳空調(diào)負(fù)荷相關(guān)數(shù)據(jù)進(jìn)行仿真,利用仿真數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試,以期提高預(yù)測(cè)精度,但人員數(shù)量來(lái)源于調(diào)研,無(wú)法適應(yīng)客流量的未來(lái)變化。付亮[10]利用遺傳算法和粒子群算法優(yōu)化誤差反向傳播神經(jīng)網(wǎng)絡(luò)(error back propagation neural network,BPNN)的權(quán)值和閾值,建立地鐵車站空調(diào)負(fù)荷預(yù)測(cè)模型,但是在預(yù)測(cè)過程中,數(shù)據(jù)量較少且未考慮非工作日客流量不同的影響。
動(dòng)態(tài)客流量參數(shù)精確計(jì)算也是預(yù)測(cè)的難點(diǎn)。地鐵車站客流量的相關(guān)研究主要集中在兩個(gè)方面。一種是通過經(jīng)驗(yàn)公式估算確定,如梁園[11]根據(jù)客流在換乘車站進(jìn)行換乘的方式不同,提出了4種不同的換乘車站公共區(qū)空調(diào)人員計(jì)算公式,根據(jù)時(shí)間段內(nèi)上下車客流和乘客停留時(shí)間就可進(jìn)行估算。這種方法只適用于設(shè)計(jì)階段,且乘客停留時(shí)間根據(jù)經(jīng)驗(yàn)確定,預(yù)測(cè)精度較低。第二種方法是利用自動(dòng)售檢票系統(tǒng)(automatic fare collection,AFC)數(shù)據(jù)進(jìn)行推算,樊佳慧[8]提出了基于AFC數(shù)據(jù)與概率分布的乘客在站停留時(shí)間估計(jì)方法,從而實(shí)現(xiàn)對(duì)客流參數(shù)的精準(zhǔn)計(jì)算。這種方法需要詳細(xì)且數(shù)量龐大的AFC數(shù)據(jù)以及構(gòu)建復(fù)雜的基于列車時(shí)刻表的時(shí)空拓展網(wǎng)絡(luò),工程實(shí)際應(yīng)用較為困難。
考慮到大部分地鐵車站內(nèi)都對(duì)CO2體積濃度進(jìn)行了多點(diǎn)監(jiān)測(cè),可能能夠間接反映客流量的變化。本文選擇廣州某換乘車站為研究對(duì)象,首先通過相關(guān)性分析確定地鐵車站空調(diào)負(fù)荷的關(guān)鍵影響因素,之后結(jié)合車站CO2濃度逐時(shí)監(jiān)測(cè)數(shù)據(jù)和部分實(shí)測(cè)客流數(shù)據(jù)建立了動(dòng)態(tài)客流量預(yù)測(cè)模型,以此為基礎(chǔ)構(gòu)建地鐵車站空調(diào)負(fù)荷預(yù)測(cè)模型,并比較神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)算法的負(fù)荷預(yù)測(cè)效果。
本文數(shù)據(jù)來(lái)源于廣州某地鐵車站能耗監(jiān)測(cè)平臺(tái),車站為“T”型換乘車站,設(shè)計(jì)早高峰客流量為40 213人·h-1,晚高峰客流量為47 623人·h-1。車站有一層站廳和兩層站臺(tái)共3層,中部為公共區(qū),兩端為設(shè)備區(qū),設(shè)計(jì)有4個(gè)進(jìn)出口,集中在站廳層中部。該車站對(duì)空調(diào)系統(tǒng)運(yùn)行數(shù)據(jù)進(jìn)行了監(jiān)測(cè)和存儲(chǔ),已積累了三年的歷史運(yùn)行數(shù)據(jù)。數(shù)據(jù)有如下特點(diǎn):
(1)數(shù)據(jù)量大:監(jiān)測(cè)平臺(tái)的最小數(shù)據(jù)采樣間隔1 min,可提取完整的供冷周期的運(yùn)行數(shù)據(jù)。
(2)缺少關(guān)鍵參數(shù):本研究需提取的參數(shù)主要包括負(fù)荷、室外干球溫度、室外濕球溫度、客流量和列車行車對(duì)數(shù),但是其中客流量和列車行車對(duì)數(shù)無(wú)法直接從監(jiān)測(cè)平臺(tái)獲取,列車行車對(duì)數(shù)可從列車運(yùn)行圖得到,客流量具有時(shí)變性,也不易直接獲取,可考慮用監(jiān)測(cè)平臺(tái)多個(gè)測(cè)點(diǎn)CO2體積濃度數(shù)據(jù)進(jìn)行擬合替代。
(3)數(shù)據(jù)缺失:從數(shù)據(jù)平臺(tái)提取不同變量、不同時(shí)間段數(shù)據(jù)會(huì)有不同的缺失情況,需要在預(yù)處理階段進(jìn)行相應(yīng)的填充。
(4)數(shù)據(jù)異常:由于制冷機(jī)組、傳感器等設(shè)備在運(yùn)行過程中存在著性能失常、數(shù)據(jù)傳輸異常等情況,由此帶來(lái)數(shù)據(jù)異常,難以直接識(shí)別。
地鐵車站負(fù)荷預(yù)測(cè)需要從監(jiān)測(cè)平臺(tái)提取帶有時(shí)間標(biāo)簽的室外干球溫度、室外濕球溫度以及多個(gè)測(cè)點(diǎn)的二氧化碳數(shù)據(jù)。本文的空調(diào)負(fù)荷預(yù)測(cè)主要是用于指導(dǎo)地鐵車站空調(diào)系統(tǒng)的節(jié)能優(yōu)化運(yùn)行,需要的是逐時(shí)空調(diào)負(fù)荷預(yù)測(cè)值,屬于短期空調(diào)負(fù)荷預(yù)測(cè)任務(wù),因此需要收集的是近期半個(gè)月到幾個(gè)月的歷史數(shù)據(jù),數(shù)據(jù)采樣間隔為1 h。
1.2.1 缺失值填充
缺失值填充的方法主要有統(tǒng)計(jì)學(xué)方法和基于機(jī)器學(xué)習(xí)算法的方法??紤]到充分利用數(shù)據(jù)中的其他可用屬性(部分屬性值缺失),可以用機(jī)器學(xué)習(xí)算法來(lái)進(jìn)行數(shù)據(jù)填充。常用的數(shù)據(jù)缺失值填充算法有k近鄰(k-nearest neighbor,kNN)算法。kNN算法是基于某種距離度量,在訓(xùn)練集樣本中找到與各個(gè)測(cè)試集樣本距離最近的k個(gè)樣本,并基于對(duì)應(yīng)的k個(gè)樣本信息對(duì)測(cè)試集樣本的標(biāo)簽或者屬性值進(jìn)行預(yù)測(cè)。
1.2.2 異常數(shù)據(jù)處理
監(jiān)測(cè)平臺(tái)提取的數(shù)據(jù)有兩種異常情況,一種是數(shù)據(jù)記錄中單個(gè)數(shù)據(jù)屬性會(huì)出現(xiàn)突變等情況,在時(shí)間序列上產(chǎn)生極端變化,這種異常肉眼可見,屬于“顯性異?!?;另一種數(shù)據(jù)異常比較隱蔽,數(shù)據(jù)記錄中每個(gè)數(shù)據(jù)屬性在正常波動(dòng)范圍內(nèi),但是組成的數(shù)據(jù)點(diǎn)不符合客觀規(guī)律,如客流量較大時(shí),負(fù)荷反而較低,這種數(shù)據(jù)明顯屬于異常數(shù)據(jù),需將各屬性關(guān)聯(lián)起來(lái)進(jìn)行分析才能發(fā)現(xiàn),屬于“隱性異?!?。其中“顯性異?!睌?shù)據(jù)識(shí)別起來(lái)較為簡(jiǎn)單,一般通過設(shè)定數(shù)據(jù)正常波動(dòng)范圍或者基于前后時(shí)刻數(shù)據(jù)差值進(jìn)行判斷即可解決。對(duì)于“隱性異?!睌?shù)據(jù)的識(shí)別一般采用基于聚類的識(shí)別方法。k-means聚類,通過最小化簇內(nèi)各樣本與樣本中心的平方誤差來(lái)得到最優(yōu)的劃分結(jié)果,可用于判斷“隱性異?!?。
通過k-means聚類算法將樣本集劃分為k個(gè)樣本簇之后,假設(shè)當(dāng)某一個(gè)簇樣本集很小時(shí),視該簇?cái)?shù)據(jù)樣本為異常數(shù)據(jù);此外在較大的樣本簇中,假設(shè)正常數(shù)據(jù)樣本距離簇中心較近,認(rèn)為距離簇中心較遠(yuǎn)的數(shù)據(jù)樣本為異常數(shù)據(jù)。
1.2.3 客流量參數(shù)計(jì)算
采用梁園[11]提出的換乘車站客流量計(jì)算方法,根據(jù)乘客在站廳、站臺(tái)和換乘平臺(tái)停留時(shí)間和車站客流情況,計(jì)算得出站廳、站臺(tái)和換乘區(qū)的客流量參數(shù)。主要用于客流量預(yù)測(cè)驗(yàn)證,具體計(jì)算公式如下:
式(1)—(4)中:G1,G2,G3和Gtotal分別代表單位時(shí)間內(nèi)站廳、站臺(tái)、換乘平臺(tái)和整個(gè)車站的有效客流量(考慮乘客停留時(shí)間),人·h-1;Pin,Pout代表單位時(shí)間內(nèi)進(jìn)站人數(shù)、出站人數(shù),人·h-1;τ1,τ2,τ3,τ4,τ5分別代表進(jìn)站和出站乘客站廳停留時(shí)間、上車和下車乘客站臺(tái)停留時(shí)間以及換乘客流換乘平臺(tái)停留時(shí)間,min;HXtr,HYtr分別代表X號(hào)線和Y號(hào)線單位時(shí)間內(nèi)換乘客流量,人·h-1。
以上述地鐵車站能耗監(jiān)測(cè)平臺(tái)的歷史數(shù)據(jù)作為數(shù)據(jù)來(lái)源,采樣時(shí)間為2019年4月1日至2019年8月31日,采樣間隔為1 h,經(jīng)數(shù)據(jù)預(yù)處理后用于空調(diào)負(fù)荷預(yù)測(cè)。
2.1.1 灰色關(guān)聯(lián)度分析
灰色關(guān)聯(lián)度分析是相關(guān)性分析方法的一種,通過比較因素變化曲線的幾何形狀相似程度,可判斷不同因素之間的關(guān)聯(lián)性。下面采用灰色關(guān)聯(lián)度方法對(duì)車站空調(diào)負(fù)荷影響因素進(jìn)行分析。
從地鐵車站能耗監(jiān)測(cè)平臺(tái)提取2019年8月份逐時(shí)室外干球溫度Td、室外濕球溫度Tw以及對(duì)應(yīng)時(shí)刻的負(fù)荷值Q,此外根據(jù)列車運(yùn)行時(shí)刻表計(jì)算出不同時(shí)間段的列車行車對(duì)數(shù)Pa。由于監(jiān)測(cè)平臺(tái)缺少客流數(shù)據(jù),而AFC數(shù)據(jù)中僅有進(jìn)出站客流信息,對(duì)于換乘客流以及乘客停留時(shí)間等數(shù)據(jù)需進(jìn)行現(xiàn)場(chǎng)實(shí)測(cè)得到。因此通過實(shí)測(cè)結(jié)合AFC數(shù)據(jù)得到地鐵車站2019年8月份的進(jìn)出站人數(shù)、換乘客流以及停留時(shí)間等信息,采用1.2.3節(jié)客流量參數(shù)計(jì)算方法,計(jì)算得到8月份逐時(shí)客流量參數(shù)G,Q、Td、Tw、Pa和G構(gòu)成數(shù)據(jù)矩陣,其中Q為比較數(shù)據(jù)列,Td、Tw、Pa和G為參考數(shù)據(jù)列。對(duì)各指標(biāo)進(jìn)行量綱一處理,如式(5)所示。
式中:xmax和xmin分別為每個(gè)數(shù)據(jù)列中的最大值和最小值。
根據(jù)量綱一化后的比較數(shù)據(jù)列和參考數(shù)據(jù)列,按照式(6)計(jì)算對(duì)應(yīng)關(guān)聯(lián)系數(shù)ε。
式中:x0(k)和xi(k)分別為比較數(shù)據(jù)列和參考數(shù)據(jù)列的第k個(gè)元素;ρ為分辨系數(shù)。
最后對(duì)關(guān)聯(lián)系數(shù)求均值得到關(guān)聯(lián)度。計(jì)算結(jié)果如表1所示。
表1 關(guān)聯(lián)系數(shù)計(jì)算結(jié)果Tab.1 Calculation result of correlation coefficient
灰色關(guān)聯(lián)度的計(jì)算結(jié)果表明,客流量參數(shù)的關(guān)聯(lián)度最大,室外干濕球溫度次之,列車行車對(duì)數(shù)的關(guān)聯(lián)度最小。說(shuō)明客流的動(dòng)態(tài)變化是地鐵車站空調(diào)負(fù)荷具有時(shí)變性的主要影響因素,客流量的準(zhǔn)確預(yù)測(cè)是車站空調(diào)負(fù)荷準(zhǔn)確預(yù)測(cè)的基礎(chǔ)。
2.1.2 確定輸入變量
從2.1.1節(jié)分析中,確定地鐵車站空調(diào)負(fù)荷預(yù)測(cè)的輸入?yún)?shù)有:客流量、室外干球溫度、室外濕球溫度、是否為工作日(1/0)。考慮到客流量在一天內(nèi)隨著時(shí)間變化較為規(guī)律,故可以將預(yù)測(cè)時(shí)刻也納入輸入變量。采用灰色關(guān)聯(lián)度分析方法,對(duì)預(yù)測(cè)時(shí)刻負(fù)荷和負(fù)荷的歷史數(shù)據(jù)進(jìn)行自相關(guān)性分析,結(jié)果如圖1所示。從圖中可以看出負(fù)荷歷史數(shù)據(jù)和預(yù)測(cè)時(shí)刻負(fù)荷在不同時(shí)間間隔時(shí)相關(guān)性差異明顯,以0.8作為閾值,選擇時(shí)間間隔為1、2、3、23、24 h的負(fù)荷歷史數(shù)據(jù)納入負(fù)荷預(yù)測(cè)的輸入變量中。
圖1 負(fù)荷自相關(guān)系數(shù)變化圖Fig.1 Autocorrelation coefficient change of cooling load
綜上,確定地鐵車站空調(diào)負(fù)荷預(yù)測(cè)輸入變量為:①客流量G;②是否為工作日W(1/0);③預(yù)測(cè)時(shí)刻t;④室外干球溫度Td;⑤室外濕球溫度Tw;⑥預(yù)測(cè)時(shí)刻前1 h、2 h、3 h、23 h、24 h的空調(diào)負(fù)荷Q。故地鐵車站空調(diào)負(fù)荷預(yù)測(cè)模型的結(jié)構(gòu)為
式中:k為預(yù)測(cè)時(shí)刻前1、2、3、23、24 h,分別取1、2、3、23、24。
通過對(duì)車站監(jiān)測(cè)平臺(tái)新風(fēng)量監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其新風(fēng)量供給量較為穩(wěn)定,這也是目前許多車站的現(xiàn)狀。此外,由于車站內(nèi)CO2測(cè)點(diǎn)分布廣泛,在車站內(nèi)部遠(yuǎn)離出入口的CO2測(cè)點(diǎn)受出入口熱壓和風(fēng)壓作用下的自然通風(fēng)量影響較小,本研究通過相關(guān)性分析對(duì)測(cè)點(diǎn)進(jìn)行了判斷和篩選。因此車站內(nèi)部CO2測(cè)點(diǎn)能即時(shí)反映人員動(dòng)態(tài)變化情況,且數(shù)據(jù)容易獲取,可考慮采用CO2濃度數(shù)據(jù)對(duì)客流量進(jìn)行擬合。
基于實(shí)測(cè)得到的2019年8月份的實(shí)際客流參數(shù),從監(jiān)測(cè)平臺(tái)提取CO2濃度數(shù)據(jù)作為輸入量,但是由于車站內(nèi)部CO2監(jiān)測(cè)點(diǎn)數(shù)量較多,分布在不同線路的站臺(tái)、站廳以及換乘平臺(tái),采用灰色關(guān)聯(lián)度進(jìn)行分析,最終選擇關(guān)聯(lián)度超過0.75的三個(gè)測(cè)點(diǎn),記為A、B和C。分別采用線性回歸算法和神經(jīng)網(wǎng)絡(luò)算法建立客流量預(yù)測(cè)模型。并選用復(fù)相關(guān)系數(shù)R2和均方根誤差(root mean square error,RMSE)這兩個(gè)常用評(píng)價(jià)準(zhǔn)則對(duì)擬合結(jié)果進(jìn)行評(píng)價(jià)。
2.2.1 線性回歸模型
根據(jù)相關(guān)性分析選擇測(cè)點(diǎn)A、B、C的CO2體積濃度數(shù)據(jù)作為自變量,對(duì)應(yīng)時(shí)刻客流量實(shí)測(cè)數(shù)據(jù)作為因變量,采用線性回歸方法進(jìn)行擬合。得到擬合關(guān)系式如下:
式中:C1為測(cè)點(diǎn)A的CO2濃度數(shù)據(jù),10-6;C2為測(cè)點(diǎn)B的CO2濃度數(shù)據(jù),10-6;C3為測(cè)點(diǎn)C的CO2濃度數(shù)據(jù),10-6。
采用式(8)得到客流量預(yù)測(cè)值,與客流量實(shí)測(cè)數(shù)據(jù)進(jìn)行比較,如圖2所示,R2=0.83,NRMSE=348人·h-1,預(yù)測(cè)效果一般。
圖2 線性回歸客流量預(yù)測(cè)結(jié)果對(duì)比Fig.2 Comparison of linear regression passenger flow prediction results
2.2.2 神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)的概念來(lái)源于生物的神經(jīng)元結(jié)構(gòu),是由具有超強(qiáng)自適應(yīng)能力的簡(jiǎn)單神經(jīng)元并行互連組成的網(wǎng)絡(luò)[12],常用作預(yù)測(cè)算法。神經(jīng)網(wǎng)絡(luò)算法中應(yīng)用最為廣泛、最為成功的神經(jīng)網(wǎng)絡(luò)算法是誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法。本文采用精度相對(duì)較高的BPNN模型進(jìn)行客流量預(yù)測(cè),輸入變量為測(cè)點(diǎn)A、B、C的CO2濃度逐時(shí)數(shù)據(jù),輸出變量為對(duì)應(yīng)時(shí)刻實(shí)測(cè)客流量參數(shù)。即輸入層節(jié)點(diǎn)個(gè)數(shù)為3個(gè),輸出層節(jié)點(diǎn)個(gè)數(shù)為1個(gè)。隱含層節(jié)點(diǎn)的選取通過比較R2和RMSE進(jìn)行選取,根據(jù)表2,數(shù)量設(shè)為7。
表2 不同隱含節(jié)點(diǎn)數(shù)目預(yù)測(cè)效果對(duì)比Tab.2 Predicting performance of different hidden node numbers
通過建立神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型得到客流量預(yù)測(cè)值,與客流量實(shí)測(cè)數(shù)據(jù)進(jìn)行比較,如圖3所示,R2=0.87,NRMSE=306人·h-1,預(yù)測(cè)精度較高。
圖3 神經(jīng)網(wǎng)絡(luò)客流量預(yù)測(cè)結(jié)果對(duì)比Fig.3 Comparison of passenger flow prediction results of BPNN
相比于線性回歸方法,BPNN算法預(yù)測(cè)精度更高,更能有效反映客流變化趨勢(shì),這也表明采用CO2濃度預(yù)測(cè)地鐵車站客流量的方法是可靠的,該模型預(yù)測(cè)得到的客流量可應(yīng)用于負(fù)荷預(yù)測(cè)。
考慮到不同時(shí)間尺度的歷史數(shù)據(jù)得到的模型可能存在差異,本節(jié)基于不同時(shí)間尺度歷史數(shù)據(jù),分別采用BPNN算法和SVM算法建立負(fù)荷預(yù)測(cè)模型,并比較兩種模型在某一典型周(包含工作日和非工作日)的預(yù)測(cè)效果。選取2019年8月份的某一典型周(8月1日至8月7日)作為測(cè)試集,分別以8月份之前1個(gè)月歷史數(shù)據(jù)(2019年7月份)、2個(gè)月歷史數(shù)據(jù)(2019年6月份至7月份)、3個(gè)月歷史數(shù)據(jù)(2019年5月份至7月份)、4個(gè)月歷史數(shù)據(jù)(2019年4月份至7月份)作為訓(xùn)練數(shù)據(jù)。測(cè)試集的空調(diào)負(fù)荷逐時(shí)變化曲線如圖4所示,從圖中可以看出工作日負(fù)荷呈現(xiàn)明顯的早高峰和晚高峰現(xiàn)象,非工作日(8月3日和8月4日)時(shí)負(fù)荷變化相對(duì)而言較為平緩。
圖4 測(cè)試集空調(diào)負(fù)荷逐時(shí)變化曲線Fig.4 Hourly variety curve of cooling load in the test set
2.3.1 基于BPNN算法的負(fù)荷預(yù)測(cè)
采用BPNN算法,分別以8月份之前1個(gè)月歷史數(shù)據(jù)(2019年7月份)、2個(gè)月歷史數(shù)據(jù)(2019年6月份至7月份)、3個(gè)月歷史數(shù)據(jù)(2019年5月份至7月份)、4個(gè)月歷史數(shù)據(jù)(2019年4月份至7月份)作為訓(xùn)練數(shù)據(jù),在測(cè)試集上的預(yù)測(cè)結(jié)果如表3所示。當(dāng)訓(xùn)練集時(shí)間尺度為4個(gè)月時(shí),神經(jīng)網(wǎng)絡(luò)算法在測(cè)試集預(yù)測(cè)效果如圖5所示。
圖5 神經(jīng)網(wǎng)絡(luò)算法負(fù)荷預(yù)測(cè)結(jié)果對(duì)比Fig.5 Comparison of cooling load prediction results of BPNN in the test set
表3 不同時(shí)間尺度下BPNN算法預(yù)測(cè)結(jié)果Tab.3 Predicting results of ANN in different time scales
從不同時(shí)間尺度訓(xùn)練數(shù)據(jù)下BPNN算法的負(fù)荷預(yù)測(cè)結(jié)果可以看出,不同時(shí)間尺度下神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)效果并無(wú)明顯差異,R2達(dá)到了0.96以上且RMSE在70~80 kW之間,預(yù)測(cè)效果良好。
2.3.2 基于SVM算法的負(fù)荷預(yù)測(cè)
SVM由Vapnik等[13]和N anye[14]提出,基本思想是將低維空間的非線性關(guān)系,經(jīng)過維度變換(基變換),變成高維空間的線性關(guān)系。常見的基變化(也稱核函數(shù))包括線性核函數(shù)、多項(xiàng)式核函數(shù)、Sigmoid核函數(shù)和徑向基核函數(shù)[15]。由于徑向基核函數(shù)具有參數(shù)變量少、計(jì)算效率高等優(yōu)點(diǎn),選取徑向基函數(shù)為核函數(shù)。不同時(shí)間尺度訓(xùn)練數(shù)據(jù)得到的負(fù)荷預(yù)測(cè)模型在典型周的預(yù)測(cè)結(jié)果如表4所示。當(dāng)訓(xùn)練集時(shí)間尺度為2個(gè)月時(shí),支持向量機(jī)算法在測(cè)試集預(yù)測(cè)效果如圖6所示。可以看出,不同時(shí)間尺度下SVM算法的預(yù)測(cè)效果并沒有明顯差異,R2達(dá)到了0.95以上且RMSE在70~90 kW之間,預(yù)測(cè)效果良好。
表4 不同時(shí)間尺度下SVM算法預(yù)測(cè)結(jié)果Tab.4 Predicting results of SVM under different time scales
圖6 支持向量機(jī)算法負(fù)荷預(yù)測(cè)結(jié)果對(duì)比Fig.6 Comparison of cooling load prediction results of SVM in the test set
對(duì)比神經(jīng)網(wǎng)絡(luò)算法和支持向量機(jī)算法的負(fù)荷預(yù)測(cè)效果,結(jié)果表明,當(dāng)增加訓(xùn)練數(shù)據(jù)量時(shí),兩種算法的預(yù)測(cè)效果均無(wú)顯著提升,R2達(dá)到了0.95以上,RMSE均在70~90 kW之間,均表現(xiàn)出了良好的預(yù)測(cè)效果。但是SVM算法的運(yùn)算時(shí)間要長(zhǎng)于BPNN,是BPNN算法的3~4倍左右,故當(dāng)數(shù)據(jù)量較大時(shí)推薦BPNN算法。
以廣州某地鐵車站為預(yù)測(cè)對(duì)象,基于地鐵車站監(jiān)測(cè)平臺(tái)歷史數(shù)據(jù),建立動(dòng)態(tài)客流量預(yù)測(cè)模型,并以此為基礎(chǔ),分別利用BPNN和SVM兩種機(jī)器學(xué)習(xí)算法,建立了地鐵車站空調(diào)負(fù)荷逐時(shí)預(yù)測(cè)模型。結(jié)論如下:
(1)利用灰色關(guān)聯(lián)度方法對(duì)地鐵車站空調(diào)負(fù)荷影響因素進(jìn)行相關(guān)性分析,結(jié)果表明影響車站空調(diào)負(fù)荷的影響因素重要性排序?yàn)椋嚎土髁繀?shù)>室外氣象參數(shù)>列車行車對(duì)數(shù),客流量參數(shù)是影響負(fù)荷動(dòng)態(tài)變化的最主要因素,這也驗(yàn)證了文獻(xiàn)[8]的相關(guān)結(jié)論。
(2)基于監(jiān)測(cè)平臺(tái)CO2濃度數(shù)據(jù)和部分客流量實(shí)測(cè)數(shù)據(jù),分別利用線性回歸和神經(jīng)網(wǎng)絡(luò)兩種算法建立動(dòng)態(tài)客流量預(yù)測(cè)模型,并根據(jù)預(yù)測(cè)效果最終選擇神經(jīng)網(wǎng)絡(luò)算法建立動(dòng)態(tài)客流量預(yù)測(cè)模型,R2達(dá)到0.87,NRMSE=306人·h-1,預(yù)測(cè)模型能有效反映客流變化趨勢(shì)。因此,對(duì)于新風(fēng)量供給比較穩(wěn)定的地鐵車站,采用CO2濃度預(yù)測(cè)地鐵車站客流量的方法是較為可靠的,該模型預(yù)測(cè)得到的客流量可應(yīng)用于負(fù)荷預(yù)測(cè)。
(3)基于動(dòng)態(tài)客流量預(yù)測(cè)模型,利用CO2濃度數(shù)據(jù)預(yù)測(cè)車站動(dòng)態(tài)客流量,并將其作為車站負(fù)荷預(yù)測(cè)的輸入?yún)?shù)?;诓煌瑫r(shí)間尺度歷史數(shù)據(jù),分別采用BPNN算法和SVM算法建立地鐵車站空調(diào)負(fù)荷預(yù)測(cè)模型。比較兩種模型在某一典型周(包含工作日和非工作日)的預(yù)測(cè)效果發(fā)現(xiàn),兩種算法的R2達(dá)到了0.95以上,RMSE均在70~90 kW之間,均表現(xiàn)出了良好的預(yù)測(cè)效果。但是SVM算法的運(yùn)算時(shí)間是BPNN算法的3~4倍左右,故當(dāng)數(shù)據(jù)量較大時(shí)推薦選擇BPNN算法進(jìn)行地鐵車站的空調(diào)負(fù)荷預(yù)測(cè)。較高的預(yù)測(cè)效果也表明本文提出的方法能有效解決目前地鐵車站負(fù)荷預(yù)測(cè)存在的問題,有較好的應(yīng)用前景。
作者貢獻(xiàn)聲明:
蘇醒:確定具體研究?jī)?nèi)容和實(shí)施方案,指導(dǎo)論文撰寫及修改成稿。
王磊:完成數(shù)據(jù)整理分析及計(jì)算,撰寫論文初稿。
田少宸:協(xié)助指導(dǎo)數(shù)據(jù)分析。
秦旭:提供現(xiàn)場(chǎng)數(shù)據(jù),協(xié)助指導(dǎo)數(shù)據(jù)整理。