周璇 王馨瑤 閆軍威 雷尚鵬 梁列全
基于機器學習的建筑復雜用能系統(tǒng)運行狀態(tài)異常檢測
周璇1王馨瑤1閆軍威1雷尚鵬1梁列全2
(1. 華南理工大學 機械與汽車工程學院,廣東 廣州 510640;2. 廣東財經(jīng)大學 信息學院,廣東 廣州 510320)
建筑復雜用能系統(tǒng)運行狀態(tài)的異常檢測研究對建筑安全穩(wěn)定、高效節(jié)能運行具有重要意義,但是由于受到建筑外部環(huán)境因素繁多、內部人行為的不確定性、設備運行數(shù)據(jù)復雜等多方面因素的影響,其異常運行狀態(tài)的檢測存在信息特征提取困難、運行異常狀態(tài)難以界定等問題。本研究在運行參數(shù)分類的基礎上,利用信息熵對不確定性的定量化描述與無監(jiān)督學習的適應性,提出基于信息熵并融合-均值聚類與自組織映射模型的復雜用能系統(tǒng)運行狀態(tài)二次聚類異常檢測方法。針對夏熱冬暖地區(qū)某大型辦公建筑中央空調系統(tǒng)的實際監(jiān)測數(shù)據(jù),通過-均值聚類對外部參數(shù)進行初次聚類并劃分一次工況、計算各工況下子系統(tǒng)運行參數(shù)的信息熵、自組織映射模型二次聚類判定異常運行狀態(tài)等步驟,實現(xiàn)建筑復雜用能系統(tǒng)的運行狀態(tài)異常檢測。結果表明,本研究提出的方法在單主機運行工況下的平均類內異常檢測正確率(簡稱類內異常檢測率)為97.45%,雙主機運行工況下的類內異常檢測率為96.70%。此外,本研究針對不同工況中類數(shù)量與類內異常率相關指標之間的關系展開進一步的討論與分析,得出結論:單、雙主機的類內異常檢測率隨著其所在類內運行狀態(tài)總數(shù)的減少而升高。本研究為建筑能源大數(shù)據(jù)背景下的復雜用能系統(tǒng)運行狀態(tài)異常檢測提供了新的系統(tǒng)化思路與方法。
復雜用能系統(tǒng);信息熵;-均值聚類;自組織映射模型;異常檢測
建筑節(jié)能減排是我國實現(xiàn)“30.60”“碳達峰”與“碳中和”目標的重要途徑。建筑能耗占我國當前總能耗的40%[1],建筑運行過程中,不當?shù)目刂撇呗曰虿缓侠淼挠媚苄袨榭赡軐е?6%的住宅建筑能源浪費[2]、15%~30%的辦公建筑能源浪費[3]。有效檢測建筑復雜用能系統(tǒng)的異常運行狀態(tài)是實現(xiàn)建筑安全、高效、節(jié)能運行的關鍵。
建筑復雜用能系統(tǒng)是指滿足建筑正常運行、維護等需求所使用的電氣、通風、空調等多臺設備聯(lián)鎖工作構成的復雜系統(tǒng),其運行狀態(tài)受到室外環(huán)境參數(shù)、室內人員數(shù)量、室內人員用能習慣等多方面因素影響,需要多個相互耦合、相互約束的運行參數(shù)進行表征[4]。此類復雜系統(tǒng)主要以消耗電力能耗為主,且涉及多個設備的運行參數(shù),參數(shù)的度量單位、采集周期可能各不相同,造成參數(shù)的量化尺度存在多樣性。并且,此類復雜設備能耗受人行為的隨機性影響較大,其異常狀態(tài)多數(shù)情況下僅表現(xiàn)為能耗或部分運行參數(shù)與正常值的偏離,難以對異常運行狀態(tài)進行量化?,F(xiàn)有復雜用能系統(tǒng)異常運行狀態(tài)的檢測大多依賴運維人員的經(jīng)驗,機器學習理論的提出與建筑能源管理系統(tǒng)的建設大大推動了建筑復雜用能系統(tǒng)異常運行狀態(tài)檢測技術的快速發(fā)展。
建筑能源管理系統(tǒng)指通過各種傳感器采集建筑運行的分類分項能耗、設備運行參數(shù)和環(huán)境參數(shù)等大量數(shù)據(jù),實現(xiàn)建筑能源可視化、運行狀態(tài)在線監(jiān)測與分析等功能的系統(tǒng),為建筑管理者提供了建筑節(jié)能監(jiān)管的有效平臺[5]。截至2017年,我國有33個省市已建成大型公共建筑的能耗實時監(jiān)測系統(tǒng)[6],為開展復雜用能系統(tǒng)運行狀態(tài)異常檢測工作提供了有效的數(shù)據(jù)支撐。
本研究述及的建筑復雜用能系統(tǒng)的運行狀態(tài)采用多個參數(shù)表征,其異常運行狀態(tài)定義為:在滿足建筑正常使用需求的前提下,表征系統(tǒng)運行狀態(tài)的能耗及其各參數(shù)與歷史數(shù)據(jù)存在明顯差異的狀態(tài)。
20世紀,經(jīng)驗規(guī)則方法、模擬建模方法在建筑運行狀態(tài)異常檢測領域占據(jù)主導地位[7]。經(jīng)驗規(guī)則方法[8-9]大多是根據(jù)專家經(jīng)驗設定異常檢測的閾值或歷史數(shù)據(jù)提取異常特征。該方法建立在先驗知識的基礎上,需要人為介入,具有較高的異常識別率,但識別、診斷、處理的效率較低,系統(tǒng)難以及時反饋。模擬建模方法則通過軟件模擬建筑內復雜用能系統(tǒng)運行狀態(tài),利用模擬結果進行定性或定量的異常檢測,其優(yōu)點在于剖析全面、異常因果清晰,但建模過程復雜,耗時長,局限性較大[10-11]。隨著數(shù)據(jù)量的增加,機器學習方法逐漸應用于建筑復雜用能設備運行狀態(tài)異常檢測,并在近十年內發(fā)展迅猛。該方法針對異常檢測的目標進行問題規(guī)劃,在大量數(shù)據(jù)的基礎上,提取時間或空間維度的模式特征,進而區(qū)分正常模式與異常模式[12]。
表1所示文獻大多將建筑復雜用能系統(tǒng)運行狀態(tài)的異常檢測流程分為3步:第1步是數(shù)據(jù)降維特征選擇,高維數(shù)據(jù)經(jīng)降維處理后選擇或合成有效變量,提取數(shù)據(jù)的有效特征;第2步是模式劃分與基準建立,選擇正常運行數(shù)據(jù)的有效變量表征方法,將模式進行劃分,并建立相應的異常檢測基準;第3步是異常狀態(tài)檢測,選擇合適的分類器對運行數(shù)據(jù)進行異常標記,實現(xiàn)異常狀態(tài)檢測。建筑復雜用能系統(tǒng)運行狀態(tài)異常檢測的現(xiàn)有研究以知識發(fā)現(xiàn)為主,旨在為設備安全、節(jié)能運行與控制提供保障,仍處于初期探索階段。
表1 多變量建筑復雜用能系統(tǒng)的異常檢測相關文獻比較
針對復雜用能系統(tǒng)運行數(shù)據(jù)存在數(shù)據(jù)維度差別較大、異常狀態(tài)難以界定、異常狀態(tài)等級難以劃分、特征提取困難等問題,本研究擬在建筑能源管理系統(tǒng)(BEMS)采集數(shù)據(jù)的基礎上,提取復雜系統(tǒng)監(jiān)測參數(shù)的信息熵特征,采用-均值聚類算法劃分復雜運行工況,建立各工況下系統(tǒng)運行狀態(tài)信息熵向量的二次聚類自組織映射模型,最終通過夏熱冬暖地區(qū)某建筑中央空調系統(tǒng)的運行數(shù)據(jù)驗證方法的準確性。
本研究提出的建筑復雜用能系統(tǒng)運行狀態(tài)異常檢測方法流程如圖1所示,主要流程分為3個步驟:
圖1 BEMS異常檢測流程
1)數(shù)據(jù)降維與特征選擇
為解決運行參數(shù)種類多、關聯(lián)復雜的問題,將監(jiān)測參數(shù)細分為4類參數(shù),包括環(huán)境參數(shù)、設備參數(shù)、運行參數(shù)和其他參數(shù),并采用Z-SCORE方法對數(shù)據(jù)標準化,以解決不同數(shù)據(jù)量綱差異的問題。
2)模式劃分與基準建立
考慮建筑復雜用能系統(tǒng)運行狀態(tài)受外界環(huán)境條件和室內人行為影響,模式劃分以環(huán)境參數(shù)和設備參數(shù)為基礎,結合Silhouette指標和-均值聚類算法對設備運行工況進行分類。
3)異常狀態(tài)檢測
異常狀態(tài)的檢測本質上是規(guī)律提取的過程,自組織映射算法通過對輸入樣本與目標值之間的相近神經(jīng)元進行調整,達到利用信息關聯(lián)性自適應調整網(wǎng)絡的目標。本研究通過信息熵與自組織映射模型的結合,實現(xiàn)異常類別的分離與檢測,并對結果進行分析與討論。
BEMS采集的復雜用能系統(tǒng)運行數(shù)據(jù)大多為高維數(shù)據(jù),存在特征參數(shù)之間具有強相關性、數(shù)據(jù)集可能存在的屬性冗余等問題,易造成建模過程復雜,擬討論在保留原始特征參數(shù)信息基礎上的高維問題的低維表征方法。常用的方法有信息熵、相關性分析、序列分解等。
信息熵作為一種對系統(tǒng)復雜程度和無序性進行度量的指標,具有量化不確定信息的特性,在異常狀態(tài)特征提取、異常檢測領域[23]、故障程度判別[24]等領域,取得了較好的識別和診斷效果。本研究利用信息熵提取復雜用能系統(tǒng)多維監(jiān)測參數(shù)特征。信息熵值的大小與系統(tǒng)信息的不確定程度呈正相關性[23],熵值越大,系統(tǒng)混亂程度越高,熵值越小,系統(tǒng)穩(wěn)定程度越高。
考慮到復雜設備運行狀態(tài)受建筑外部參數(shù)與內部參數(shù)影響,不同運行工況下的差異較大,為提高異常檢測精度,擬對系統(tǒng)運行工況進行劃分,以降低同一工況狀態(tài)之間的差異性。機器學習算法中常用于工況劃分的方法包括-均值聚類、決策樹等。
-均值聚類算法通過度量數(shù)據(jù)集中的距離差異性,實現(xiàn)類間分離,具有響應速度快、可靠性高的優(yōu)點[25],多用于異常檢測[26]、故障診斷[27]等工作的前期數(shù)據(jù)處理與工況劃分。本研究采用-均值聚類算法對復雜用能系統(tǒng)工況影響較大的外部參數(shù)進行初步聚類,得到不同氣象參數(shù)及人行為影響下的不同工況,再結合設備運行參數(shù)實現(xiàn)工況的二次劃分。
3)比較樣本與類中心的距離,并將該樣本分至最小距離類別,重復計算所有樣本點;
5)若類中心所處的位置再次改變且未達到計算閾值,則重復進行步驟2)-4)。
建筑復雜用能系統(tǒng)的運行狀態(tài)受外界噪聲干擾與不確定人行為的影響,其異常狀態(tài)檢測的準確性依賴于模型對數(shù)據(jù)抽象特征的提取能力。由于復雜設備運行參數(shù)繁多,且異常運行狀態(tài)并無統(tǒng)一定義,現(xiàn)有研究大多采用神經(jīng)網(wǎng)絡、支持向量機等模型實現(xiàn)異常狀態(tài)的分類檢測。
自組織映射(SOM)算法可以實現(xiàn)無規(guī)律的數(shù)據(jù)處理與聚類,具有分類能力強、分類泛化性能好、過程可視化等特點,在電力設備數(shù)據(jù)挖掘[28]、異常檢測[29]等領域已得到廣泛應用。本研究擬采用SOM模型對不同工況的信息熵特征進行二次聚類,以區(qū)分異常運行狀態(tài)。SOM算法訓練過程中獲勝神經(jīng)元及其臨近范圍的其他神經(jīng)元均將進行權值調整[30],確保算法的學習效果,結構見圖2。
圖2 自組織映射算法原理結構
本研究以某夏熱冬暖地區(qū)辦公建筑的中央空調系統(tǒng)為對象,驗證所提出方法的有效性。設備配置信息見表2。
表2 設備配置信息
該建筑面積為87 000 ㎡,2015年建成了建筑能耗監(jiān)管與空調節(jié)能控制系統(tǒng),可采集建筑分類分項能耗數(shù)據(jù)與空調系統(tǒng)運行數(shù)據(jù)。本研究利用系統(tǒng)采集的2017年1月1日至2018年12月31日的數(shù)據(jù)集驗證復雜設備運行狀態(tài)異常檢測方法的有效性,數(shù)據(jù)集共105 535條數(shù)據(jù),采集周期為150 s。
3.2.1監(jiān)測參數(shù)分類
監(jiān)測參數(shù)種類繁雜,且參數(shù)之間相互耦合,參數(shù)大小存在較大差異。根據(jù)國家標準[31]與相關文獻[32],將建筑復雜用能系統(tǒng)運行狀態(tài)監(jiān)測數(shù)據(jù)分為外部參數(shù)和內部參數(shù)兩大類,其中外部參數(shù)指系統(tǒng)外界環(huán)境參數(shù)、室內人數(shù),以及人行為等參數(shù);內部參數(shù)指系統(tǒng)內部參數(shù),如設備數(shù)量、設備運行狀態(tài)等。進一步細分為環(huán)境參數(shù)、其他參數(shù)、設備參數(shù)、運行參數(shù)4類,監(jiān)測參數(shù)耦合關系如圖3所示。
圖3 復雜用能系統(tǒng)運行狀態(tài)監(jiān)測參數(shù)耦合關系
本研究的對象為中央空調系統(tǒng),系統(tǒng)監(jiān)測參數(shù)如表3所示,參數(shù)說明如下:
1)環(huán)境參數(shù),主要包括溫度、相對濕度、光照強度等外界環(huán)境參數(shù),其中,干球溫度和相對濕度直接影響室內環(huán)境熱舒適性和中央空調系統(tǒng)的能耗與運行狀態(tài)。因此,本研究采用室外干球溫度和相對濕度作為外部環(huán)境參數(shù);
2)設備參數(shù),主要指設備型號與設備數(shù)量等設備配置,如中央空調系統(tǒng)制冷主機設備數(shù)量等。該參數(shù)決定設備之間的匹配程度,對系統(tǒng)運行能耗和能效影響較大。本研究采用的設備參數(shù)包括4類設備類別,24臺設備,設備明細見表3;
表3 動態(tài)監(jiān)測參數(shù)分類及數(shù)量
3)運行參數(shù),主要指反映設備運行狀態(tài)的運行參數(shù),其中制冷主機運行參數(shù)包括冷凍水供回水溫度、冷卻水進出口溫度等共15項參數(shù),冷凍水泵、冷卻水泵、冷卻塔風機運行參數(shù)包括頻率、實時功率兩項參數(shù),這些參數(shù)直接反映了設備的運行狀態(tài)以及能耗特征;
4)其他參數(shù),主要指影響建筑運行能耗的人行為相關參數(shù),如室內人數(shù)、室內人員行為等參數(shù),該參數(shù)直接影響復雜用能系統(tǒng)能耗,但存在較大的波動性與不確定性,難以直接獲取。冷凍水供回水壓差傳感器安裝于總管處,受管網(wǎng)沿程阻力、末端開啟程度影響。本研究參照文獻[33]通過總管冷凍水供回水壓差間接表征人行為因素對建筑運行的影響。
3.2.2數(shù)據(jù)標準化
上述監(jiān)測參數(shù)存在量綱與數(shù)量級的差異,需要采用適當?shù)臉藴驶椒▽⒃紨?shù)據(jù)映射到相同標準下進行建模處理,常用數(shù)據(jù)標準化方法有Z-SCORE方法,如式(2)所示:
3.3.1基于Silhouette的聚類簇確定
建筑復雜用能系統(tǒng)運行狀態(tài)受外部因素影響較大,首先采用-均值聚類方法對外部參數(shù)進行聚類,劃分出不同氣象條件及人行為因素影響下的設備運行工況。-均值聚類算法的難點在于確定聚類簇數(shù),本研究采用Silhouette指標確定聚類簇數(shù),指標數(shù)值越大,表明聚類效果越好,即簇內相關性和簇間差異性顯著,該指標計算公式為
如圖5所示,通過外部參數(shù)聚類的方法得到的Ⅰ-Ⅴ類設備運行工況劃分,由于外部參數(shù)直接受到環(huán)境以及人行為的影響,因此聚類出來的不同工況反映了不同外部條件下主機的負荷狀態(tài)。第Ⅳ類設備運行工況內部聯(lián)系最為緊密,取值范圍最為集中,處于均值附近區(qū)間,符合建筑所處的夏熱冬暖氣候區(qū)空調季溫高濕重的特點。第Ⅴ類設備運行工況中,溫度、濕度、壓差三者的變化呈現(xiàn)出離散程度高、幅度范圍較大的數(shù)據(jù)特性,明顯區(qū)分于第Ⅰ類至第Ⅳ類數(shù)據(jù),因此確定第Ⅴ類設備運行工況屬于外部環(huán)境參數(shù)變化異常的運行工況,需要運維人員特別關注。
圖4 聚類范圍內的Silhouette指標值變化
圖5 外部參數(shù)聚類結果
3.3.2設備運行工況劃分結果分析
設備運行工況與外部參數(shù)密切相關,而中央空調系統(tǒng)在實際運行中,存在著制冷主機運行數(shù)量的多重匹配問題。本節(jié)結合制冷主機運行數(shù)量的不同,將設備運行工況進一步劃分為單主機運行與多主機運行,最終得到10類系統(tǒng)運行工況,結果見圖6。
圖6 建筑中不同主機運行數(shù)量下的設備運行工況數(shù)據(jù)分布
本文研究對象的冷源系統(tǒng)主機采用“三用一備”形式,現(xiàn)有運行情況表明常見運行工況為單主機和雙主機運行工況。三主機運行工況僅發(fā)生在緊急會議等臨時性需求需要迅速降低冷凍水出水溫度時。三主機運行工況的數(shù)據(jù)記錄為65條,僅占總體數(shù)量0.062%,4臺冷水機組全部開啟的運行工況未出現(xiàn)??紤]三主機運行工況發(fā)生概率極低,且數(shù)據(jù)量過少難以實現(xiàn)精準建模,本研究舍棄此類數(shù)據(jù),剩余數(shù)據(jù)總量為105 470條。其中單主機運行數(shù)據(jù)68 398條,占比64.85%;雙主機運行數(shù)據(jù)37 072條,占比35.15%。不同數(shù)量主機運行下的設備運行工況數(shù)據(jù)分布如圖6所示。針對不同運行主機數(shù)量的各設備運行數(shù)據(jù)采用Z-SCORE方法處理,得到各工況下的無量綱數(shù)據(jù),見表4。
表4 各工況下的數(shù)據(jù)分布
3.4.1子系統(tǒng)信息熵計算與分析
中央空調系統(tǒng)由多個子系統(tǒng)構成,本節(jié)考慮實際將子系統(tǒng)分為4類,分別為制冷主機類、冷凍水泵類、冷卻水泵類、冷卻塔類。結合第2.1節(jié)信息熵計算過程,針對不同子系統(tǒng)、不同運行工況下分別進行信息熵特征計算,過程如下:
4)各子系統(tǒng)信息熵值計算與整合。設備參數(shù)共由4類設備構成,由于不同設備間參數(shù)數(shù)量、變化范圍不同,通過每一類設備的運行參數(shù)進行信息熵值的求解,最終得到各子系統(tǒng)10種工況運行狀態(tài)的表征向量。
表5 各工況下子系統(tǒng)運行參數(shù)的信息熵取值范圍
根據(jù)第2.1節(jié)可知,制冷主機類信息熵值普遍高于其他類型子系統(tǒng),符合制冷主機類設備采集參數(shù)繁多、狀態(tài)向量構成復雜的特點。整體來看,各類子系統(tǒng)信息熵區(qū)間長度較原始數(shù)據(jù)更為集中,但仍存在取值范圍交叉的現(xiàn)象,需要進一步利用SOM模型進行異常檢測。
3.4.2基于SOM算法的異常運行狀態(tài)分類
SOM模型用于提取各子系統(tǒng)中信息熵構成的數(shù)值矩陣中隱含的類別信息,將10種系統(tǒng)運行工況的運行狀態(tài)表征向量分別構建SOM模型,并將其可視化以便于異常類區(qū)分,具體步驟如下:
圖7(a)示出了不同工況下多數(shù)類神經(jīng)元與少數(shù)類神經(jīng)元的數(shù)量差距,藍色空間占據(jù)越多,說明該情況的出現(xiàn)頻率越高,反之,白色空間體現(xiàn)了少數(shù)類的異常情況。圖7(b)展現(xiàn)了神經(jīng)元之間的連接關系。無論單、雙主機運行,各子系統(tǒng)工況下少數(shù)類神經(jīng)元與多數(shù)類神經(jīng)元之間連接顏色較深,表示模型在映射到二維平面的過程中,少數(shù)類神經(jīng)元與多數(shù)類神經(jīng)元的權向量差異較大,符合異常數(shù)據(jù)特性。圖7顯示單主機運行工況中,各系統(tǒng)工況的多數(shù)類與少數(shù)類間的數(shù)量差別較為明顯,少數(shù)類易于辨識。但圖8的多數(shù)類中出現(xiàn)了第Ⅱ類、第Ⅴ類少數(shù)類不唯一的現(xiàn)象,原因為以上兩類工況下的數(shù)據(jù)量相對其他工況較少,存在樣本量的局限性,可以通過結合神經(jīng)元間權值相似度進行判定,如第Ⅱ類4號神經(jīng)元與其他神經(jīng)元權值差別較大,第Ⅴ類2號神經(jīng)元權值差別較大,因此以上兩類的少數(shù)類分別為4號和2號神經(jīng)元。
圖7 單主機SOM二次運行狀態(tài)分類結果
圖8 雙主機SOM二次運行狀態(tài)分類結果
SOM模型分類結果中的少數(shù)類判定為異常運行狀態(tài),通過將模型判定結果與BEMS報警記錄、現(xiàn)場檢修記錄、實際運行數(shù)據(jù)進行人工逐一比對,檢驗異常檢測結果的正確性,驗證結果見表6。
表6 少數(shù)類異常檢測結果
結合表6可得,SOM模型二次分類所得少數(shù)類單、雙主機工況平均類內異常檢測率為97.07%,單臺機運行工況下平均類內異常檢測率為97.45%,雙臺機運行工況下平均類內異常檢測率為96.70%,均達到較高的類內異常檢測率。單臺主機與雙臺主機的第Ⅴ類工況類內異常檢測率均達到100%,得出第Ⅴ類工況為異常運行工況的結論,證明異常數(shù)據(jù)在數(shù)據(jù)分布上與正常數(shù)據(jù)具有明顯差異性,解釋了該工況下數(shù)據(jù)量少、數(shù)據(jù)變化區(qū)間大的產(chǎn)生原因,驗證了-均值聚類工況劃分以優(yōu)化類內異常檢測率的必要性。
為深入探究異常檢測率的影響因素,分析了單、雙主機運行工況下的類內異常檢測率與與類內運行狀態(tài)向量總數(shù)、少數(shù)類占總數(shù)比例的關系,如圖9、圖10所示。
圖9 單臺主機運行工況少數(shù)類內異常檢測率的變化
圖10 雙臺主機運行工況少數(shù)類內異常檢測率的變化
由圖9(a)、10(a)可見,單、雙主機少數(shù)類內異常檢測率隨著其所在類內運行狀態(tài)向量總數(shù)的減少而升高。
由圖9(b)可知,對于單主機運行工況,少數(shù)類內異常檢測率隨其數(shù)量在總量中所占的比例的降低而增加,這是由于少數(shù)類占總數(shù)比例低,異常特征提取效率提升,能夠被準確地以最低的數(shù)量成本辨識。而對比雙主機運行工況,由于雙主機運行可完全滿足建筑冷量需求,少數(shù)類內在總量中所占的比例較為穩(wěn)定。其中,系統(tǒng)第Ⅴ類工況下運行狀態(tài)向量總數(shù)量僅為 9 條,因此呈現(xiàn)出少數(shù)類占總數(shù)比例較大的現(xiàn)象。對于雙主機運行工況,少數(shù)類內異常檢測率隨著少數(shù)類占比的增加而增加。
本研究提出了一種基于信息熵和二次聚類的建筑復雜用能系統(tǒng)異常運行狀態(tài)檢測方法,并采用夏熱冬暖地區(qū)某辦公建筑中央空調系統(tǒng)數(shù)據(jù)進行方法驗證,得出主要結論如下:
(1)經(jīng)過-均值聚類算法劃分運行工況后,采用信息熵與SOM模型進行異常特征提取,聚類的效果良好,各工況平均類內異常檢測率達97.07%,部分運行工況下的類內異常檢測率可達100%;
(2)制冷主機運行數(shù)量的不同導致類內異常檢測率存在一定差異,單主機運行過程異常特征檢測較為準確,各工況平均類內異常檢測率為97.45%;
(3)不同系統(tǒng)工況下,類內異常檢測率隨其所在類運行狀態(tài)向量的減少而逐漸增加,在系統(tǒng)工況的少數(shù)類內異常檢測率較高,受外部參數(shù)影響較為明顯。
本研究提出的基于二次聚類的復雜用能系統(tǒng)異常檢測方法,嘗試解決復雜用能系統(tǒng)異常運行狀態(tài)檢測過程中存在的設備運行狀態(tài)耦合、特征提取困難、異常狀態(tài)難以界定等問題。后續(xù)工作將在此基礎上,嘗試識別具體故障類型,并提出對應的措施,為建筑安全運行與節(jié)能減排提供有效解決方案。
[1] 中國建筑節(jié)能協(xié)會.中國建筑能耗研究報告2020[J].建筑節(jié)能(中英文),2021,49(2):1-6.
China Building Energy Conservation Association.China building energy consumption annual report 2020[J].Journal of BEE,2021,49(2):1-6.
[2] XU C,CHEN H. A hybrid data mining approach for anomaly detection and evaluation in residential buildings energy data[J].Energy and Buildings,2020,215:109864/1-13.
[3] KATIPAMULA S,BRAMBLEY M R. Review article:methods for fault detection,diagnostics,and prognostics for building systems—a review[J].HVAC&R Research,2005,11(1):3-25.
[4] 苗露. 基于監(jiān)測數(shù)據(jù)的建筑復雜用能設備運行性能預測與分析研究[D].天津:天津大學,2014.
[5] BUTTERWORTH H.Handbook of energy efficiency in buildings[M].Amsterdam:Elsevier,2019:597-673.
[6] 丁洪濤,劉海柱,殷帥. 我國公共建筑節(jié)能監(jiān)管平臺建設現(xiàn)狀及趨勢研究[J].建設科技,2017(23):10-11.
DING Hongtao,LIU Haizhu,Yin Shuai. Research on the current situation and trend of public building energy conservation supervision platform construction in China[J].Construction Science and Technology,2017(23):10-11.
[7] LEE K P,WU B H,PENG S L. Deep-learning-based fault detection and diagnosis of air-handling units[J].Building and Environment,2019,157:24-33.
[8] GUNAY B,SHEN W,YANG C. Characterization of a building’s operation using automation data:a review and case study[J].Building and Environment,2017,118:196-210.
[9] SUN L L,WU J H,JIA H Q,et al. Research on fault detection method for heat pump air conditioning system under cold weather[J].Chinese Journal of Chemical Engineering,2017,25(12):1812-1819.
[10] VERBERT K,BABUSKA R,de SCHUTTER B. Combining knowledge and historical data for system-level fault diagnosis of HVAC systems[J].Engineering Applications of Artificial Intelligence,2017,59:260-273.
[11] LIANG Y X,MENG Q L,CHANG S. Fault diagnosis and energy consumption analysis for variable air volume air conditioning system: a case study[J].Procedia Engineering,2017,205:834-841.
[12] LI Y F,O'NEIL Z. An innovative fault impact analysis framework for enhancing building operations[J].Energy and Buildings,2019,199:311-331.
[13] LIU J H,LIU J Y,CHEN H X,et al. Abnormal energy identification of variable refrigerant flow air-conditioning systems based on data mining techniques[J].Applied Thermal Engineering,2019,150:398-411.
[14] GUO Y B,TAN Z H,CHEN H X,et al. Deep learning-based fault diagnosis of variable refrigerant flow air-conditioning system for building energy saving[J].Applied Energy,2018,225:732-745.
[15] PAN Y,ZHANG L M.Data-driven estimation of building energy consumption with multi-source heterogeneous data[J].Applied Energy,2020,268:114965/1-15.
[16] PE?A M,BISCARRI F,GUERRERO J I,et al. Rule-based system to detect energy efficiency anomalies in smart buildings,a data mining approach[J].Expert Systems with Applications,2016, 56: 242-255.
[17] FAN C,XIAO F,ZHAO Y,et al. Analytical investigation of autoencoder-based methods for unsupervised anomaly detection in building energy data[J].Applied Energy,2018,211:1123-1135.
[18] LUO X J,F(xiàn)ONG K F,SUN Y J. Development of clustering-based sensor fault detection and diagnosis strategy for chilled water system[J].Energy and Buildings,2019,186: 17-36.
[19] LIU X,DING Y,TANG H,et al. A data mining-based framework for the identification of daily electricity usage patterns and anomaly detection in building electricity consumption data[J].Energy and Buildings,2021,231:110601/1-22.
[20] DU Z M,F(xiàn)AN B,JIN X Q,et al. Fault detection and diagnosis for buildings and HVAC systems using combined neural networks and subtractive clustering analysis[J].Building and Environment,2014,73: 1-11.
[21] SHI Z X,OBRIEN W. Development and implementation of automated fault detection and diagnostics for building systems:a review[J].Automation in Construction,2019,104:215-229.
[22] FAHIM M,F(xiàn)RAZ K,SILLITTI A. TSI:Time series to imaging based model for detecting anomalous energy consumption in smart buildings[J].Information Sciences,2020,523:1-13.
[23] BARUM H,BARRETT J,CLARK L O,et al. Entropy and information causality in general probabilistic theories[J].New Journal of Physics,2010(3) 1-32.
[24] AI Y T,GUAN J Y,F(xiàn)EI C W,et al. Fusion information entropy method of rolling bearing fault diagnosis based on-dimensional characteristic parameter distance[J].Mechanical Systems and Signal Processing,2017,88:123-136.
[25] 孫吉貴,劉杰,趙連宇. 聚類算法研究[J].軟件學報,2008,19(1):48-61.
SUN Jigui,LIU Jie,ZHAO Lianyu,Clustering algorithms research[J].Journal of Software,2008,19(1):48-61.
[26] 賈凡,嚴妍,張家琪. 基于-means聚類特征消減的網(wǎng)絡異常檢測[J].清華大學學報(自然科學版),2018,58(2):137-142.
JIA Fan,YAN Yan,ZHANG Jiaqi.-means based feature reduction for network anomaly detection[J].Journal of Tsinghua University(Science and Technology),2018,58(2):137-142.
[27] QIN H Y,ZHOU H P,CAO J W.Imbalanced learning algorithm based intelligent abnormal electricity consumption detection[J].Neurocomputing,2020,402:112-123.
[28] GHADIRI S M E,MAZLUMI K. Adaptive protection scheme for microgrids based on SOM clustering technique[J].Applied Soft Computing,2020,88:106062.
[29] YAZDANI S,MONTAZERI G M. A novel gas turbine fault detection and identification strategy based on hybrid dimensionality reduction and uncertain rule-based fuzzy logic[J].Computers in Industry,2020,115:103131/1-14.
[30] 楊占華,楊燕. SOM神經(jīng)網(wǎng)絡算法的研究與進展[J].計算機工程,2006, 32(16):201-202, 208.
YANG Zhanhua,YANG Yan. Research and development of self-organizing maps algorithm[J].Computer Engineering,2006,32(16):201-202,208.
[31] 中華人民共和國住房和城鄉(xiāng)建設部. 國家機關辦公建筑和大型公共建筑能耗監(jiān)測系統(tǒng)分項能耗數(shù)據(jù)采集技術導則[G/OL].(2008-06-24).https://www.mohurd.gov.cn/gongkai/fdzdgknr/tzgg/200807/20080702_174380.html.
[32] 胡振中,袁爽. 建筑能耗與環(huán)境監(jiān)測系統(tǒng)標準化數(shù)據(jù)提取技術[J].清華大學學報(自然科學版),2020,60(4):357-364.
HU Zhenzhong,YUAN Shuang.Standardized data extraction techniques for building utility consumption and environmental monitoring systems[J].Journal of Tsinghua University (Science and Technology),2020,60(4):357-364.
[33] YUN G Y,CHOI J,KIM J T. Energy performance of direct expansion air handling unit in office buildings[J].Energy and Buildings,2014,77:425-431.
Anomaly Detection of Complex Building Energy Consumption System Based on Machine Learning
ZHOU Xuan1WANG Xinyao1YAN Junwei1LEI Shangpeng1LIANG Liequan2
(1. School of Mechanical and Automotive Engineering,South China University of Technology,Guangzhou 510640,Guangdong, China;2. School of Information,Guangdong University of Finance and Economics,Guangzhou 510320,Guangdong,China)
The research on the anomaly detection of the operation state of complex energy consumption system is of great significance to the safe, stable, efficient and energy-saving operation of buildings. However, due to the influence of many factors, such as the variety of external environmental factors of buildings, the uncertainty of insider behavior, the complexity of equipment operation data and so on, the detection of abnormal operation state often meets some difficulties in information feature extraction, abnormal operation state definition and so on. Based on the classification of operation parameters and by using the quantitative description of uncertainty by information entropy and the adaptability of unsupervised learning, this paper proposed a secondary clustering anomaly detection method for the operation state of complex energy consumption system based on information entropy and by integrating-means and self-organizing mapping model. According to the actual monitoring data of the central air-conditioning system of a large office building in the hot summer and warm winter area, the external parameters were clustered for the first time through-means, and the steps such as dividing the primary working conditions, calculating the information entropy of the operating parameters of the subsystem under each working condition, and determining the abnormal operating state by secondary clustering of self-organizing mapping model were used to realize the abnormal detection of the operating state of the complex energy consumption system of the building. The results show that the average intra class anomaly detection accuracy of the method proposed in this study is 97.45% under the operation condition of single machine and 96.70% under the operation condition of two machines. In addition, this study further discussed and analyzed the relationship between the number of classes and the relevant indicators of in class anomaly rate under different working conditions. It concludes that the in class anomaly detection rate of single and dual hosts increases with the decrease of the total number of operating states in their class. This study provides a new systematic idea and method for the abnormal operation state detection of complex energy consumption system under the background of building energy big data.
complex energy consumption system;information entropy;-means;self-organizing maps model;anomaly detection
Supported by the Natural Science Foundation of Guangdong Province (2018A030313352,2017A030316162)
TK01;TU831
1000-565X(2022)07-0144-11
10.12141/j.issn.1000-565X.210422
2021-06-25
廣東省自然科學基金資助項目(2018A030313352,2017A030316162)
周璇(1976-),女,副研究員,主要從事節(jié)能技術、數(shù)據(jù)挖掘等研究。E-mail: zhouxuan@scut.edu.cn