摘 要:冷水機組的故障檢測與診斷(FDD)對調節(jié)室內舒適度和管理建筑能耗具有重要意義。然而,原始數據中的特征冗余給故障診斷帶來很大困擾,為解決這一問題,提出了一種結合機器學習回歸與分類的預測方法。首先,通過長短期記憶網絡(LSTM)及其變體精確預測高相關但低重要的特征,從而有效減少特征冗余。其次,利用支持向量機(SVM)對優(yōu)化后的特征進行故障診斷,評估其效果。研究表明,采用結合LSTM與科爾莫格羅夫-阿諾德網絡(KAN)的模型(LSTM-KAN)優(yōu)化特征后,當特征數減少至預設目標特征的60%時,診斷準確率達94.23%,相比未優(yōu)化前的準確率提高了16.64個百分點;此外,訓練次數大幅度減少,進一步提升了模型的訓練效率。該方法為冷水機組的故障檢測與診斷提供了更加高效和準確的技術支持。
關鍵詞:故障檢測與診斷;冷水機組;特征優(yōu)化;長短期記憶
中圖分類號:TK018" " 文獻標志碼:A" " 文章編號:1671-0797(2025)05-0010-07
DOI:10.19514/j.cnki.cn32-1628/tm.2025.05.003
0" " 引言
供暖、通風和空調系統(tǒng)(Heating,Ventilation and Air Conditioning,HVAC)是一種高能耗建筑裝置,當出現(xiàn)維護不足、組件老化和控制紊亂時,會發(fā)生故障。調查顯示,65%的住宅空調單元和71%的商業(yè)空調單元存在故障,這些故障帶來的能源損失占總建筑能耗的15%~30%[1],造成了巨大的能源浪費和經濟損失。因此,對故障快速準確和低成本的診斷不僅能滿足國家節(jié)能要求,還能挽回經濟損失。
HVAC的故障檢測與診斷技術(Fault Detection and Diagnosis,F(xiàn)DD)是一種嵌入在建筑能源管理系統(tǒng)中的先進技術,可用于檢測設備在運行過程中的故障。近年基于數據驅動的FDD技術研究占比接近70%[2],利用運行數據來檢測和診斷系統(tǒng)中的故障,根據數據變化自動更新模型,不僅能滿足智能化要求,還能應對設備在長期運行過程中的性能變化[3]。原始數據特征冗余復雜,需要進行特征選擇,選出一組最具代表性和區(qū)分性的特征子集。經過大量研究驗證,目前最佳的特征數集中在6~16個,在8個特征時模型已具有很好的效果[4],但在10個特征后準確率將隨特征數量的減少而急劇下降。然而特征個數對應傳感器數量,特征數量過多不僅會增加模型的訓練難度,還會增加經濟成本。因此,在保證準確率的前提下,優(yōu)化特征子集個數到6個是一個很大的挑戰(zhàn)。
針對上述問題,提出LSTM-KAN的方法優(yōu)化特征,以SVM作為基分類器,利用特征重要度和皮爾遜相關性分析,對高相關性與低重要度的特征進行預測,不僅減少了初始特征的數量,還提高了最終的診斷準確率。
1" " 故障數據及分析
1.1" "系統(tǒng)和數據
本研究使用的是ASHRAE組織的冷水機組故障模擬數據,項目編號是ASHRAE-RP-1043,該項目利用實驗室一臺90 t離心式冷水機組進行故障模擬實驗,生成多種故障數據[5]。圖1是實驗所用的單級冷水機組的系統(tǒng)圖,由壓縮機、冷凝器、膨脹閥和蒸發(fā)器組成,模擬的故障包括四個壓縮循環(huán)類故障:制冷劑過充(RO)、制冷劑欠充(RU)、不凝氣體(NC)和過量油(EO);三個水路循環(huán)故障:蒸發(fā)器水流量減少(FWE)、冷凝器水流量減少(FWC)和冷凝器結垢(CF)。
項目報告將每個故障分為4個強度等級,在每個故障強度中選擇1 000組數據作為原始數據集,再集合5 000多組無故障數據得到33 000多組數據,如表1所示。
1.2" " 數據預處理
故障檢測與診斷技術常用的歸一化方法有最小最大值歸一化、Sigmoid歸一化和Z值歸一化,最小最大值歸一化適合于數值分布均勻且不含異常值的情況,RP-1043數據符合該條件,因此選擇最小最大值歸一化進行數據預處理,公式如下:
式中:xmin為特征x在所有樣本下的最小值;xmax為特征x在所有樣本下的最大值。
1.3" " 評估方法
模型評估是為了衡量模型訓練后的性能,在訓練LSTM及其變體形式算法預測效果時使用均方誤差(MSE)和決定系數(R2)兩種方法進行評估,訓練SVM分類效果時使用準確率(Accurary)和F1得分(F1-Score)兩種方法進行評估。
式中:n為樣本數量;yi為第i個觀測值的實際值;為第i個觀測值的預測值;y為所有實際值的均值;NTP表示真實和預測結果都為正的數量;NFP表示真實標簽為負,預測結果為正的數量;NFN表示真實標簽為正,預測結果為負的數量;NTN表示真實標簽和預測結果都為負的數量;Precision為查準率;Recall為召回率。
2" " 算法介紹
2.1" " 多分類支持向量機
支持向量機(Support Vector Machine,SVM)是一個功能強大而全面的機器學習模型,并且經過大量研究驗證,可選擇作為基分類器進行故障診斷?;A的SVM是二分類,通過尋找一個最優(yōu)超平面來分隔不同類別的樣本,如圖2所示。多分類SVM可以分為一對一分類或一對多分類,都是將多分類轉化為多個二分類問題處理,區(qū)別在于一對一是每兩個類別進行對比,一對多是每個類別和其他類別進行對比,本文使用的是一對多分類。
2.2" " LSTM算法模型
LSTM是循環(huán)神經網絡的一個變體形式,能有效解決循環(huán)神經網絡梯度爆炸問題。LSTM由輸入門、遺忘門和輸出門組成[6],如圖3所示。輸入門it用來控制當前時刻內部狀態(tài)輸入信息保存,遺忘門ft控制上一時刻候選狀態(tài)和信息保留,輸出門ot控制當前時刻內部狀態(tài)的輸出,ct是當前的內部狀態(tài),ht是隱藏層的外部狀態(tài),t是通過非線性激活函數tanh的候選狀態(tài)[7]。
式中:ht-1是上一時刻的外部狀態(tài);xt是當前時刻輸入數據;σ是激活函數;W、U和b是可學習參數。
2.3" " KAN
KAN是基于Kolmogorov-Arnold定理衍生的新型神經網絡架構,相對于多層感知機(Multi-Layer Perceptron,MLP),KAN模型將固定的非線性激活和線性參數學習變?yōu)閷捣蔷€性激活學習,在保持靈活性的同時,能夠以少量參數擬合復雜網絡結構,使得模型的網絡結構具有更高的訓練效率。KAN的網絡架構如圖4所示,表達式如式(13)所示[8-9]。式中:x為n維輸入向量;φq,p為內部函數;Φq為外部函數;b(x)為基礎函數;silu(x)為Swish激活函數,是sigmoid函數的一種變體;spline(x)為樣條函數;ci為樣條參數;Bi(x)為預定義基礎樣條函數;Φ(x)為激活函數,它是b(x)與spline(x)的總和。
KAN是MLP的一種替代方案,用于擺脫維度提高帶來的梯度爆炸,在LSTM中添加MLP和KAN架構,對處理復雜數據或解決特征密集的任務具有獨特的能力。
3" " 特征選擇和分析
原始特征冗余復雜,需要進行多重處理,為了更好地尋找用于優(yōu)化的輸入特征和輸出特征,對原始數據集包含的65個特征進行多次處理,如圖5所示。
首先人工剔除4個始終保持不變的無關特征:Unit Siatus、Active Fault、VH和VE,再利用基分類器特征重要度排除31個低重要度特征,這些特征重要度占比為19.5%,與診斷結果呈負相關,會使診斷準確率降低0.62%。這與基分類器處理復雜數據的能力有關,SVM診斷特征重要度排序和特征分布如圖6所示,其中溫度特征和計算特征的重要度影響最大。
通過特征重要度篩選得到30個關鍵特征,平均診斷準確率達到97.65%。以這些特征為基礎,繪制了兩個降序排列的雷達圖:一個是基于特征重要度的圖7(a),另一個是基于皮爾遜相關性分析的圖7(b)。結果顯示,在特征數量從30減少到10的過程中,診斷準確率的變化較小。然而,圖7(a)中特征重要度的準確率下降速率明顯高于圖7(b)中皮爾遜相關性分析的準確率下降速率。這表明特征重要度篩選有助于剔除相關性較低的特征。基于這一發(fā)現(xiàn),進一步利用皮爾遜相關度分析剔除20個高相關度特征,僅保留10個最為關鍵的特征,這些特征的相關度閾值設定為0.73,最終診斷準確率為95.87%。
當特征集數量低于10個時,診斷準確率快速下降,6個特征時診斷準確率減少到77.59%,此時特征重要度的準確率下降速率低于皮爾遜相關度分析的準確率下降速率,這證明在皮爾遜相關度分析時剔除了重要度高的特征,影響了診斷結果。圖8是10個特征的皮爾遜相關度分析矩陣圖,選擇相關度在[0.44,0.73)之間的5組特征對,根據高相關性和低重要度要求篩選,但發(fā)現(xiàn)Cond Tons這個特征與其他3個低重要度特征都有關系,保留該特征為輸入特征。最終選擇的6個輸入特征是:FWC、FWE、TO_feed、Cond Tons、TWE_set、VC;選擇的4個輸出特征(目標特征)是:Cond Energy Balance、PO_feed、PRE、TCA。
4" " 基于LSTM的特征優(yōu)化結果分析
選定的原始數據中包括10個特征,經過特征重要度和皮爾遜相關性分析篩選,最終將10個特征分為6個輸入特征和4個輸出特征用于訓練LSTM、LSTM-MLP、LSTM-KAN三種模型。這三種模型的訓練和測試數據比例為8:2,總數據集為33 000多組。對于這三種模型,設置以下參數:輸入特征數為6個,輸出特征數為4個,每個隱藏層包含64個神經元。使用Adam優(yōu)化器進行參數優(yōu)化,其學習率設定為0.001,批次大小設置為32。最終模型的損失函數結果收斂在0.03附近,表明模型訓練效果良好。
預測結果如圖9所示,為了更加清晰地展示基于LSTM-KAN預測的4個輸出特征測試情況,針對測試集數據6 000多個樣本,每100個數據設置為一個觀測點,最終得到了60個觀測點,可以看出預測值和真實值之間的相近程度。這樣處理后的數據可以更直觀地反映出模型在預測過程中的表現(xiàn),為進一步分析和優(yōu)化提供了基礎。在真實值大幅度波動的情況下,預測效果不佳,這是各種故障之間的數值差異性所致。訓練完成后,通過將輸入特征和輸出特征合并,得到10個特征的33 000多個數據集,并為每個數據集添加了故障標簽,進行故障分類。
由表2可知,LSTM-KAN的效果優(yōu)于其他兩種,在近似的損失函數收斂值下,LSTM-KAN的訓練次數僅為LSTM的1/10,LSTM-MLP的1/5,并且在診斷結果差距不大的情況下,MSE分別減少13.057 2和6.524 6,表明LSTM-KAN在預測上有更小的誤差;R2分別提高了0.007 3和0.003 0,表明LSTM-KAN在預測結果上更為精準,數據擬合效果更好。
為避免分類結果的不確定性,從每個標簽中隨機選擇1 000組數據組成8 000組數據作為基分類器的分類數據集,重復20次,每次分類結果進行十折交叉驗證。在利用LSTM及其變體將6個輸入特征擴充至10個特征后,3種模型得到的數據診斷準確率分別為94.14%、94.22%和94.23%,但比10個原始特征時的準確率少1.73、1.65、1.64個百分點,這是由于經過模型訓練擴充的4個目標特征的誤差所造成。但與未擴充前6個特征時的準確率對比,分別提高16.55、16.63和16.64個百分點,這證明此種方法對特征子集的擴充效果明顯。
5" " 結論
為了保障少量特征時的診斷準確率,本文利用LSTM算法對特征子集進行優(yōu)化,成功提升了低特征數診斷的準確率。這種思路不僅解決了原始數據特征冗余問題,還探討了LSTM-KAN在訓練次數上的優(yōu)化,提高了診斷效率。本文可以得出下列結論:
1)結合特征重要度和皮爾遜相關度分析可以滿足目標特征的選取預期,所選擇的4個目標特征對后續(xù)診斷的準確率有很大的提升,僅比原始10個特征的診斷準確率低1~2個百分點。
2)結合KAN的LSTM算法體現(xiàn)出強大的分析能力,其使用更少的訓練次數能得到更好的效果,預測均方誤差分別減少13.057 2和6.524 6,決定系數提高了0.007 3和0.003 0。
3)LSTM-KAN的預測結果帶來的診斷準確率的增益是16.64個百分點,大幅度提升了6個特征的診斷準確率。
[參考文獻]
[1] SHI Z X,O'BRIEN W.Development and implementation of automated fault detection and diagnostics for building systems:A review[J].Automation in Construction,2019,104:215-229.
[2] CHEN J L,ZHANG L,LI Y F,ET AL.A review of computing-
based automated fault detection and diagnosis of heating,ventilation and air conditioning systems[J].Renewable and Sustainable Energy Reviews,2022,161:112395.
[3] CHEN Z,XIAO F,GUO F C.Similarity learning-based fault detection and diagnosis in building HVAC systems with limited labeled data[J].Renewable and Sustainable Energy Reviews,2023(185):113612.
[4] YAN K,MA L L,DAI Y T,et al.Cost-sensitive and sequential feature selection for chiller fault detection and diagnosis[J].International Journal of Refrigeration, 2018, 86: 401-409.
[5] COMSTOCK M C,BRAUN J E,BERNHARD R.Experimental Data from Fault Detection and Diagnostic Studies on a Centrifugal Chiller[D].West Lafayette:Purdue University,1999.
[6] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[7] 杜浩,趙健,鄒江,等.基于CNN-LSTM神經網絡的輸電線路覆冰預測技術研究[J].機電信息,2024(21):81-85.
[8] 劉燦鋒,孫浩,東輝.結合Transformer與Kolmogorov Arnold網絡的分子擴增時序預測研究[J].圖學學報,2024,45(6):1256-1265.
[9] LIU Z M,WANG Y X,VAIDYA S,et al.KAN:Kolmogorov-
arnold networks[J/OL].(2024-04-30)[2024-11-19]. arXiv preprint arXiv:2404.19756,2024.https://arxiv.org/abs/2404.19756.
收稿日期:2024-11-28
作者簡介:郭馬超(1997—),男,陜西商洛人,碩士研究生,研究方向:暖通空調故障檢測與診斷。
通信作者:馮榮(1987—),男,甘肅定西人,工學博士,副教授,研究方向:分布式能源系統(tǒng)和新型熱泵技術。