葉暉云 韓 華 任正雄 楊鈺婷 劉飛天
(上海理工大學(xué),上海)
隨著碳中和目標(biāo)的提出,能源體系正在發(fā)生巨大的變化[1]。受安裝、運(yùn)行維護(hù)及系統(tǒng)本身復(fù)雜性等因素的影響,制冷系統(tǒng)可能發(fā)生故障,帶故障運(yùn)行會(huì)引發(fā)能源消耗增加、舒適性下降等問題[2],周期性地對硬件進(jìn)行維修有助于提高運(yùn)營措施經(jīng)濟(jì)性和硬件運(yùn)行性能[3]。以機(jī)器學(xué)習(xí)的方法進(jìn)行制冷系統(tǒng)故障檢測與診斷是十分有效的措施,但是訓(xùn)練一個(gè)性能優(yōu)良的模型往往需要大量的數(shù)據(jù),而收集大量已知類別的數(shù)據(jù)經(jīng)濟(jì)性較差,因此機(jī)器學(xué)習(xí)的方法往往局限于科研項(xiàng)目[4]。解決該局限性可以采用遷移學(xué)習(xí)的思路,將用于數(shù)據(jù)豐富對象的、經(jīng)過訓(xùn)練和驗(yàn)證的機(jī)器學(xué)習(xí)模型,通過一定的遷移手段,運(yùn)用到數(shù)據(jù)數(shù)量有限或使用年限較長的制冷系統(tǒng)中。近年來,遷移學(xué)習(xí)主要運(yùn)用于建筑自動(dòng)控制或能耗預(yù)測。Chen等人構(gòu)建了基于深度神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)模型,利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了自動(dòng)控制[5];Fan等人利用源建筑能耗數(shù)據(jù)進(jìn)行預(yù)先訓(xùn)練得到預(yù)測模型,使用不同的策略對目標(biāo)建筑能耗進(jìn)行了預(yù)測[6];Qian等人通過調(diào)試基于已知數(shù)據(jù)訓(xùn)練的TrAdaBoost(TAB)算法對建筑HVAC系統(tǒng)能耗進(jìn)行預(yù)測評估,主要解決了系統(tǒng)中的能耗預(yù)測問題[7]。部分學(xué)者將遷移學(xué)習(xí)應(yīng)用于制冷系統(tǒng)故障診斷中。Zhu等人提出用異構(gòu)數(shù)據(jù)標(biāo)準(zhǔn)化處理原始數(shù)據(jù)集,并通過添加域適應(yīng)系數(shù)使神經(jīng)網(wǎng)絡(luò)模型能遷移不同螺桿式冷水機(jī)組的信息,完成故障診斷[8];范雨強(qiáng)等人采用不平衡數(shù)據(jù)技術(shù)處理數(shù)據(jù)集,提取離心式冷水機(jī)組信息,采用遷移的方法實(shí)現(xiàn)了螺桿式冷水機(jī)組的故障診斷[9]。
目前的制冷系統(tǒng)故障診斷主要針對單臺(tái)機(jī)組已有工況及故障數(shù)據(jù)進(jìn)行,或者在不同機(jī)組間對已有故障信息進(jìn)行遷移,對于新工況數(shù)據(jù)缺乏這一普遍問題鮮有研究。本文針對制冷系統(tǒng)新工況故障數(shù)據(jù)難以獲得的問題,提出對數(shù)據(jù)集進(jìn)行方差選擇、調(diào)整分布、進(jìn)一步擠壓數(shù)據(jù)空間等多重處理,縮小不同工況數(shù)據(jù)之間的差異,并基于TAB算法提出不同基分類器的遷移診斷方法,應(yīng)用于離心式冷水機(jī)組典型故障的遷移診斷,并進(jìn)行了詳細(xì)的對比分析,實(shí)現(xiàn)了從已有工況數(shù)據(jù)到新工況數(shù)據(jù)的故障遷移學(xué)習(xí)。有效實(shí)現(xiàn)了機(jī)組新工況數(shù)據(jù)匱乏時(shí),利用已有工況信息改善新工況下的故障診斷性能,有望在保證故障診斷性能的前提下縮減實(shí)驗(yàn)成本。
TAB算法是AdaBoost(AB)算法[10]在遷移學(xué)習(xí)上的衍生算法。AB算法利用boosting(一種框架算法)技術(shù),通過不斷迭代訓(xùn)練,將弱分類器(默認(rèn)采用決策樹decision tree, DT)通過規(guī)則整合成性能更優(yōu)異的分類器。AB算法對屬于同一域的數(shù)據(jù)集進(jìn)行權(quán)重迭代更新,而TAB算法則可同時(shí)對源域和目標(biāo)域數(shù)據(jù)集進(jìn)行權(quán)重迭代更新,減小源域中與目標(biāo)域中樣本差異較大的樣本的權(quán)重,增大相似樣本的權(quán)重,從而提高目標(biāo)域與源域的相關(guān)性,利用源域知識增強(qiáng)模型對目標(biāo)域數(shù)據(jù)的診斷能力[11]。
TAB算法流程如圖1所示,需要2個(gè)已有標(biāo)簽的訓(xùn)練數(shù)據(jù)集Td(different-distribution)和Ts(same-distribution)、未標(biāo)記的目標(biāo)域測試數(shù)據(jù)集S、1個(gè)基分類器Learner和迭代次數(shù)N,其中,Td是與S不同域的源域數(shù)據(jù)集,含n個(gè)數(shù)據(jù),Ts是與S相同域的目標(biāo)域數(shù)據(jù)集,含m個(gè)數(shù)據(jù),n?m。
圖1 TAB算法流程圖
算法初始化:
(1)
式中ω1,i為第1次循環(huán)中第i個(gè)數(shù)據(jù)的權(quán)重。
初始權(quán)重向量分布集,確保模型在遷移學(xué)習(xí)的初始階段能利用源域已知數(shù)據(jù)知識進(jìn)行一定正確率的診斷。設(shè)置學(xué)習(xí)率參數(shù)β,根據(jù)迭代次數(shù)建立N次的迭代循環(huán):
1) 對每個(gè)權(quán)重進(jìn)行歸一化處理,即用每個(gè)權(quán)重除以權(quán)重總和,確保它們的比例保持相同,以使模型調(diào)用的權(quán)重在合適的范圍內(nèi)。
(2)
式中pt為第t次循環(huán)歸一化后的權(quán)重;ωt為第t次循環(huán)的權(quán)重;ωt,i為第t次循環(huán)中第i個(gè)數(shù)據(jù)的權(quán)重。
2) 為了方便分類,定義1個(gè)基分類器,根據(jù)合并后的訓(xùn)練數(shù)據(jù)T(Ts與Td)及T上的歸一化權(quán)重分布pt和未標(biāo)記數(shù)據(jù)S,得到1個(gè)x→y的標(biāo)簽集ht。
3) 計(jì)算模型在Ts數(shù)據(jù)集得到的標(biāo)簽的錯(cuò)誤率εt。
(3)
式中ht(xi)為第t次循環(huán)基分類器對數(shù)據(jù)xi進(jìn)行診斷得到的類別;c(xi)為數(shù)據(jù)xi的真實(shí)類別。
4) 設(shè)定2個(gè)學(xué)習(xí)率參數(shù)。
(4)
(5)
式(4)、(5)中βt為第t次循環(huán)中目標(biāo)域數(shù)據(jù)更新權(quán)重的學(xué)習(xí)率;β為源域數(shù)據(jù)更新權(quán)重的學(xué)習(xí)率,是一個(gè)與源域數(shù)據(jù)量n、迭代次數(shù)N相關(guān)的常數(shù)。
5) 更新下一次迭代的數(shù)據(jù)權(quán)重ωt+1,i。與目標(biāo)域適應(yīng)的源域數(shù)據(jù)具有更大權(quán)重;反之,具有更小權(quán)重。
(6)
6) 獲得決策函數(shù)hf(x),最終的分類器將采用該函數(shù)對目標(biāo)域數(shù)據(jù)集S進(jìn)行分類。
(7)
本文針對制冷系統(tǒng)故障診斷中的輸出進(jìn)行了一定更改:將輸出的二分類強(qiáng)分類器更改為經(jīng)過迭代更新權(quán)重設(shè)置的多分類強(qiáng)分類器。
基于TAB算法的遷移分類能力能夠解決制冷系統(tǒng)診斷中新工況數(shù)據(jù)缺失的問題,因此選擇它建立故障診斷模型。圖2為故障遷移診斷模型示意圖。
注:AB、RCV、RF為基分類器。圖2 故障遷移診斷模型示意圖
對包含源工況數(shù)據(jù)集與目標(biāo)工況數(shù)據(jù)集的原始數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗,分為包含大量源工況已知數(shù)據(jù)、少量目標(biāo)工況已知數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集與包含了大量目標(biāo)工況未知數(shù)據(jù)的測試數(shù)據(jù)集。將經(jīng)過多重?cái)?shù)據(jù)處理的訓(xùn)練數(shù)據(jù)集、測試數(shù)據(jù)集用于基于不同基分類器(AB、RCV、RF)、通過TAB算法搭建的不同模型(TAB_AB、TAB_RCV、TAB_RF)以進(jìn)行故障診斷。
其中,RCV算法的核心思想是利用最小二乘估計(jì)法,在離差平方和上增加一個(gè)L2范數(shù)的懲罰項(xiàng),即正則化下的最小二乘法[12]。
(8)
式中x為特征矩陣;y為因變量;a為正則化參數(shù);x為線性回歸系數(shù)。
RCV算法內(nèi)置交叉驗(yàn)證對正則化參數(shù)進(jìn)行調(diào)整,避免過擬合,得到更加可靠穩(wěn)定的分類器。
而RF算法是一種集成算法,其核心思想是建立多個(gè)不同的決策樹模型組合成“森林”,通過每一棵“樹”對數(shù)據(jù)的分類進(jìn)行投票決策[13],得票最多的類別作為最后的輸出結(jié)果。建立不同決策樹,通過對訓(xùn)練集進(jìn)行重采樣,得到多個(gè)子訓(xùn)練集,每一個(gè)子訓(xùn)練集對應(yīng)生成一個(gè)“樹”。
利用診斷指標(biāo)對上述3類不同基分類器的不同模型進(jìn)行性能評價(jià),在多個(gè)模型中選擇1個(gè)表現(xiàn)優(yōu)異的故障遷移診斷模型,對該高性能診斷模型內(nèi)的基分類器參數(shù)進(jìn)行網(wǎng)格尋優(yōu),使模型達(dá)到最佳診斷狀態(tài),再將測試數(shù)據(jù)集輸入該診斷模型進(jìn)行故障診斷,得到最優(yōu)結(jié)果。
掌握設(shè)備運(yùn)行狀態(tài)是空調(diào)系統(tǒng)節(jié)能的前提[14]。故障數(shù)據(jù)來源于美國供暖、制冷和空調(diào)工程師學(xué)會(huì)與普渡大學(xué)合作的1個(gè)故障模擬項(xiàng)目[15]。該項(xiàng)目采用1臺(tái)316 kW(90 rt)的離心式冷水機(jī)組,在27個(gè)不同工況下,對離心式冷水機(jī)組的正常運(yùn)行及7類典型故障進(jìn)行測試。診斷類別如表1所示,包括:冷凝器水流量降低、蒸發(fā)器水流量降低、制冷劑泄漏/不足)、冷凝器結(jié)垢、制冷劑中含不凝性氣體、制冷劑過量、潤滑油過量。其中:制冷劑泄漏/不足、制冷劑過量和潤滑油過量3種故障隨著循環(huán)直接影響到冷水機(jī)組各個(gè)部分的運(yùn)行情況,稱為全局故障;剩余故障均發(fā)生在冷水機(jī)組局部(不凝性氣體主要聚集在冷凝器中),稱為局部故障。
表1 冷水機(jī)組診斷類別
所得數(shù)據(jù)集包含64個(gè)特征參數(shù),其中有48個(gè)特征參數(shù)通過傳感器直接測量獲得,另外16個(gè)特征參數(shù)通過計(jì)算獲得。故障診斷數(shù)據(jù)隨機(jī)提取,確保模型具有一定客觀性和魯棒性。
從27個(gè)工況中選取如表2所示的2個(gè)工況進(jìn)行遷移診斷研究,對源域、目標(biāo)域數(shù)據(jù)集下的有標(biāo)記故障數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)。其中工況a為源域數(shù)據(jù)集(源工況),工況b為目標(biāo)域數(shù)據(jù)集(目標(biāo)工況)。a、b 2個(gè)工況下各提取3 000組數(shù)據(jù),均包括200組正常運(yùn)行數(shù)據(jù)和2 800組故障數(shù)據(jù)(每類故障400組)。設(shè)置工況b中只有隨機(jī)選取的20組數(shù)據(jù)是故障類型已知的,即有標(biāo)記數(shù)據(jù),其余2 980組均為測試數(shù)據(jù)。表3顯示了常規(guī)故障診斷與基于TAB算法的故障診斷調(diào)用數(shù)據(jù)集的區(qū)別[16],體現(xiàn)了遷移診斷的思想,即把工況a 8個(gè)類別(正常和7類典型故障)的信息遷移到工況b中,用于診斷工況b下機(jī)組的各類故障。
表2 遷移工況熱力參數(shù)
表3 不同方法調(diào)用的數(shù)據(jù)集的區(qū)別
在故障檢測與診斷中,可以根據(jù)實(shí)際類別、診斷類別(見表4)進(jìn)行數(shù)據(jù)評價(jià),表5給出了采用的評價(jià)指標(biāo)及含義,分別為精確率、召回率、F1值及正確率。
表4 數(shù)據(jù)混淆矩陣
表5 評價(jià)指標(biāo)介紹
由于所采用的數(shù)據(jù)具有64個(gè)特征,其中可能存在與遷移學(xué)習(xí)任務(wù)無關(guān)的特征,因而對數(shù)據(jù)進(jìn)行多重處理,以得到具有適量特征、適合本次遷移學(xué)習(xí)任務(wù)的數(shù)據(jù)。特征工程可以最大限度地從原始數(shù)據(jù)中提取特征以供模型使用。將訓(xùn)練數(shù)據(jù)集進(jìn)行轉(zhuǎn)化,從而更好地向遷移學(xué)習(xí)模型描述潛在問題,提高遷移學(xué)習(xí)模型對目標(biāo)未知數(shù)據(jù)診斷的準(zhǔn)確性。
圖3 多重?cái)?shù)據(jù)處理過程
(9)
(10)
(11)
采用無處理、方差選擇、標(biāo)準(zhǔn)化、歸一化和多重?cái)?shù)據(jù)處理方法分別對TAB_AB、TAB_RCV、TAB_RF 3種遷移后的模型進(jìn)行性能分析,正確率如圖4所示??梢?多重?cái)?shù)據(jù)處理對于TAB_AB、TAB_RF 2種模型采用的是非線性的分類算法,輔助優(yōu)化效果明顯,說明多重?cái)?shù)據(jù)處理方法對于具有較強(qiáng)復(fù)雜問題識別能力的模型具有輔助優(yōu)化效果。此外,該方法優(yōu)于其他數(shù)據(jù)預(yù)處理方法,相比于無處理時(shí)診斷正確率分別提高了9.61%、1.95%。對于TAB_RF模型,增益效果不如TAB_AB模型明顯,說明多重?cái)?shù)據(jù)處理方法對于性能一般的復(fù)雜模型增強(qiáng)效果更好。而對于TAB_RCV模型,其本質(zhì)為線性回歸、學(xué)習(xí)能力有限的模型,多重?cái)?shù)據(jù)處理方法的輔助優(yōu)化效果無法體現(xiàn),甚至表現(xiàn)為削弱效果,因此,對于該類模型應(yīng)盡可能保留數(shù)據(jù)原始信息。所討論的遷移診斷性能分析均采用多重?cái)?shù)據(jù)處理的方法進(jìn)行操作。
圖4 不同模型不同數(shù)據(jù)預(yù)處理時(shí)的性能對比
基于3種基分類器構(gòu)建的診斷模型的正確率如圖5所示,通過對比新工況下未采用遷移診斷和采用遷移診斷的結(jié)果,可以直觀地表明TAB算法對冷水機(jī)組新工況數(shù)據(jù)有限時(shí)提升故障診斷性能的有效性,其中,基于RF基分類器的模型提升性能最為明顯。
圖5 不同模型正確率
1) AB模型與TAB_AB模型的診斷性能對比。工況遷移前(僅采用目標(biāo)工況的20組數(shù)據(jù)訓(xùn)練),AB模型正確率為51.58%;學(xué)習(xí)源工況3 000組數(shù)據(jù)中的信息,進(jìn)行遷移診斷后,正確率為62.93%,提升跨度為11.35%,即相比于未經(jīng)過遷移學(xué)習(xí)的模型,正確率提高了22.00%。遷移前后的混淆矩陣及評價(jià)指標(biāo)對比分別如圖6、7所示。工況遷移前,AB模型能夠?qū)崿F(xiàn)對制冷劑泄漏、冷凝器結(jié)垢、冷凝器水流量不足和制冷劑含不凝性氣體4種故障的診斷,對于正常運(yùn)行及其他故障均存在半數(shù)以上的診斷錯(cuò)誤。從圖7可以看出,遷移后模型對局部故障的F1值整體上升,但對全局故障的F1值整體下降,且通過圖6可以看出正常運(yùn)行與全局故障均診斷為制冷劑過量故障。可見,經(jīng)過遷移學(xué)習(xí)后,TAB_AB模型對于局部故障能夠?qū)崿F(xiàn)精確診斷,但放棄了更為復(fù)雜的全局故障診斷能力。
圖6 基于AB模型遷移前后混淆矩陣對比
圖7 AB模型與TAB_AB模型評價(jià)指標(biāo)對比
2) RCV模型與TAB_RCV模型的診斷性能對比。工況遷移前后正確率分別為75.15%和77.03%,提升跨度為1.88%,較遷移前提高了2.50%。遷移前后的混淆矩陣及評價(jià)指標(biāo)對比分別如圖8、9所示。工況遷移前,RCV模型能夠?qū)崿F(xiàn)一定程度上的冷水機(jī)組故障診斷。工況遷移后,從混淆矩陣主對角線上的值可以看出,除正常運(yùn)行與制冷劑泄漏和制冷劑過量2種故障外,對于其他故障正確診斷樣本均增多。從圖9可以看出,除制冷劑含不凝性氣體故障外,其余局部故障的F1值均得到提升,但正常運(yùn)行與全局故障的整體F1值均降低。在遷移學(xué)習(xí)前,特別是制冷劑過量這種全局故障,存在著明顯的漏警現(xiàn)象,經(jīng)過工況遷移后,可以看出整體漏警現(xiàn)象得到解決,但是對于正常運(yùn)行的正確診斷數(shù)量減少,F1值下降。
圖8 基于RCV模型遷移前后混淆矩陣對比
圖9 RCV模型與TAB_RCV模型評價(jià)指標(biāo)對比
3)RF模型與TAB_RF模型的診斷性能對比。工況遷移前后正確率分別為69.81%和92.38%,提升跨度為22.57%,較遷移前提高了32.33%。遷移前后的混淆矩陣及評價(jià)指標(biāo)對比分別如圖10、11所示。在進(jìn)行工況遷移前,RF模型診斷中整體漏警現(xiàn)象明顯,將大量實(shí)際故障數(shù)據(jù)診斷為正常運(yùn)行數(shù)據(jù),且整體診斷性能一般。工況遷移后的TAB_RF模型,從源工況數(shù)據(jù)集獲得足夠的目標(biāo)工況知識,對全局故障能實(shí)現(xiàn)較優(yōu)的診斷。由圖10可見,整體漏警現(xiàn)象得到優(yōu)化,對于冷凝器結(jié)垢、冷凝器水流量不足、蒸發(fā)器水流量不足和潤滑油過量的4種故障不再出現(xiàn)漏警現(xiàn)象。從圖11可見,正常運(yùn)行和各類故障的F1值均得到大幅度提升,且4種局部故障的F1值均達(dá)到100%,實(shí)現(xiàn)了精確診斷。
圖10 基于RF模型遷移前后混淆矩陣對比
圖11 RF模型與TAB_RF模型評價(jià)指標(biāo)對比
以每個(gè)類別樣本數(shù)量占所有類別樣本總數(shù)的比例作為權(quán)重,將各模型各類別不同診斷指標(biāo)進(jìn)行加權(quán)平均,結(jié)果如圖12所示。各模型加權(quán)精確率、加權(quán)召回率、加權(quán)F1值和總體正確率均得到了一定程度的優(yōu)化,表明TAB算法通過利用源工況數(shù)據(jù)的知識能夠有效幫助模型從不同方面提升性能,實(shí)現(xiàn)性能更佳的制冷系統(tǒng)目標(biāo)工況故障診斷。遷移前,RF模型并不是診斷中的最優(yōu)模型,遷移后,TAB_RF的各診斷指標(biāo)均為最大值,表明TAB_RF模型是最適合遷移學(xué)習(xí)且診斷效果最佳的模型,因此,對該模型進(jìn)行參數(shù)尋優(yōu),嘗試進(jìn)一步優(yōu)化模型的診斷性能。
圖12 不同模型對比
調(diào)整模型復(fù)雜度在故障診斷研究中有其重要性[18]。由于采用的RF基分類器為默認(rèn)參數(shù)設(shè)置,從模型復(fù)雜度考慮,TAB_RF模型性能仍有提升空間。為此,對RF基分類器參數(shù)進(jìn)行尋優(yōu)。影響RF基分類器的參數(shù)分別為:最大迭代次數(shù)、樹最大深度、拆分內(nèi)部節(jié)點(diǎn)所需的最小樣本數(shù)和葉節(jié)點(diǎn)所需的最小樣本數(shù)。采用網(wǎng)格搜索方式進(jìn)行尋優(yōu),尋優(yōu)范圍及結(jié)果見表6。
表6 參數(shù)尋優(yōu)結(jié)果
參數(shù)尋優(yōu)后模型記為TAB_RFop,對冷水機(jī)組故障測試集進(jìn)行診斷,并與參數(shù)尋優(yōu)前的TAB_RF模型進(jìn)行對比分析。TAB_RFop正確率達(dá)到95.30%,提升跨度為2.92%?;煜仃嚰霸u價(jià)指標(biāo)對比分別如圖13、14所示。
圖13 參數(shù)尋優(yōu)前后混淆矩陣對比
圖14 TAB_RF模型與TAB_RFop模型評價(jià)指標(biāo)對比
如圖13所示,尋優(yōu)前,TAB_RF模型將大量正常運(yùn)行數(shù)據(jù)虛警為制冷劑泄漏故障數(shù)據(jù),導(dǎo)致正確診斷正常運(yùn)行的數(shù)據(jù)數(shù)量少,經(jīng)過尋優(yōu)后,該現(xiàn)象得到大幅度優(yōu)化,正常運(yùn)行的正確診斷數(shù)據(jù)增加。此外,從圖14可以看出,經(jīng)過參數(shù)尋優(yōu)后的TAB_RFop模型的整體診斷性能上升,除制冷劑含不凝性氣體故障的F1值降低0.13%外,正常運(yùn)行和其他故障的F1值均得到不同程度的提升,其中正常運(yùn)行與制冷劑泄漏故障的F1值顯著提升,正常運(yùn)行的F1值由60.49%提升至83.72%,制冷劑泄漏的F1值由77.97%提升至85.49%。
冷水機(jī)組的運(yùn)行工況復(fù)雜,需要在不同工況下驗(yàn)證遷移診斷對冷水機(jī)組故障診斷的有效性,因而增補(bǔ)目標(biāo)工況c、d(見表7),并對比分析遷移診斷和常規(guī)(無遷移)診斷在單模式和全模式下的性能,各模式的訓(xùn)練及測試數(shù)據(jù)集見表8。其中,工況c的蒸發(fā)器出水溫度與工況a相同,工況d的冷凝器進(jìn)水溫度與工況a相同,單模式與全模式診斷的主要區(qū)別在于訓(xùn)練數(shù)據(jù)采用單個(gè)工況抑或全部工況。例如:遷移診斷是前述利用了源工況信息改善目標(biāo)工況診斷性能的診斷模型,其訓(xùn)練集包含源工況數(shù)據(jù),如果是單模式,則訓(xùn)練集為源工況數(shù)據(jù)加單個(gè)目標(biāo)工況數(shù)據(jù),如果是全模式,則訓(xùn)練集為源工況加3個(gè)目標(biāo)工況數(shù)據(jù)的合集,測試集為某個(gè)目標(biāo)工況;常規(guī)診斷是不利用源工況信息、僅用少量目標(biāo)工況數(shù)據(jù)進(jìn)行模型訓(xùn)練的常規(guī)故障診斷,測試集與遷移診斷相同。
表7 增補(bǔ)目標(biāo)工況熱力參數(shù)
表8 不同模式調(diào)用數(shù)據(jù)集區(qū)別
遷移診斷采用TAB_RF模型,常規(guī)診斷采用RF模型,工況a數(shù)據(jù)為源工況,工況b、c、d為目標(biāo)工況,不考慮參數(shù)尋優(yōu)時(shí)不同模式的診斷性能如圖15所示??梢?不論單模式或全模式,遷移診斷均較常規(guī)診斷性能有所提升,單模式的提升尤為顯著,對目標(biāo)工況b、c、d的故障診斷正確率分別提高了22.43%、18.39%、20.77%,表明數(shù)據(jù)種類不夠豐富且數(shù)量較少時(shí),更加需要利用遷移診斷學(xué)習(xí)源工況中的信息以提升診斷性能。全模式遷移診斷較常規(guī)診斷性能提升范圍為1.21%~2.55%,幅度較小,因全模式中模型學(xué)習(xí)到的知識相對單模式更為豐富,常規(guī)診斷性能已較單模式有顯著提升(21.66%~26.37%),即便如此,遷移診斷仍舊可以進(jìn)一步提升其性能。
圖15 不同模式正確率對比
此外,從圖15還可見,參數(shù)尋優(yōu)對于單模式下的遷移診斷模型具有輔助提升效果,正確率提升了3.06%,而全模式下遷移診斷模型的正確率卻降低了4.23%。觀察其訓(xùn)練正確率高達(dá)99.68%,表明在訓(xùn)練集的工況較多時(shí),參數(shù)優(yōu)化易使模型過擬合,太過嚴(yán)苛的模型參數(shù)不利于模型由訓(xùn)練集到測試集的泛化。
基于源工況知識與目標(biāo)工況少量數(shù)據(jù)建立遷移模型是解決冷水機(jī)組新工況數(shù)據(jù)缺乏問題的有效途徑,多個(gè)工況數(shù)據(jù)訓(xùn)練的遷移模型可以比單模式獲得更好的診斷性能,在有多個(gè)工況故障數(shù)據(jù)時(shí)優(yōu)先考慮全模式,不需要參數(shù)優(yōu)化;只有1個(gè)源工況故障數(shù)據(jù)時(shí),遷移診斷對目標(biāo)工況(少量數(shù)據(jù))的故障診斷性能有顯著提升,參數(shù)優(yōu)化可以進(jìn)一步提升其性能。
與傳統(tǒng)故障診斷不同,本文針對冷水機(jī)組工況復(fù)雜、獲得故障數(shù)據(jù)成本高導(dǎo)致故障診斷模型泛化性能差的問題,就冷水機(jī)組不同工況下的正常運(yùn)行及故障數(shù)據(jù),設(shè)計(jì)了1種基于不同基分類器的TAB遷移診斷模型,實(shí)現(xiàn)了新工況下故障的有效診斷。對于冷水機(jī)組包含正常運(yùn)行和7類故障共8個(gè)類別在內(nèi)的數(shù)據(jù),源工況訓(xùn)練樣本3 000組,目標(biāo)工況(新工況)訓(xùn)練樣本僅20組,通過遷移源工況中的故障信息,對新工況2 980組測試數(shù)據(jù)進(jìn)行了故障診斷,得到以下結(jié)論。
1) 對原始穩(wěn)態(tài)數(shù)據(jù)依次進(jìn)行方差選擇、分布調(diào)整、進(jìn)一步擠壓數(shù)據(jù)空間的多重?cái)?shù)據(jù)處理是有效的,可以通過空間擠壓縮小不同數(shù)據(jù)集之間的差異,增加相似度,改善遷移診斷性能。該多重?cái)?shù)據(jù)處理方法適用于不同工況或不同對象間遷移診斷時(shí)具有較強(qiáng)復(fù)雜問題識別能力的模型。
2) 通過對比新工況下未采用遷移診斷和采用遷移診斷的結(jié)果,驗(yàn)證了TAB算法對于冷水機(jī)組故障診斷性能的提升效果。其中,TAB_AB、TAB_RCV 及TAB_RF診斷模型總體正確率的提升跨度分別為11.35%、1.88%、22.57%,分別達(dá)到了62.93%、77.03%、92.38%,TAB_RF的性能提升最顯著,局部故障F1值均達(dá)到100%。
3) 對TAB_RF診斷模型進(jìn)行參數(shù)尋優(yōu)可以進(jìn)一步提升冷水機(jī)組的故障診斷性能。相較于未經(jīng)參數(shù)尋優(yōu)的模型,總體正確率提升了2.92%,達(dá)到了95.30%,且提升了制冷系統(tǒng)故障診斷性能:優(yōu)化了正常運(yùn)行虛警為制冷劑泄漏故障的現(xiàn)象,正常運(yùn)行與制冷劑泄漏故障的F1值分別提升了23.23%、7.52%,對整體故障的診斷性能進(jìn)一步提升。
4) 增補(bǔ)了工況c、d數(shù)據(jù),對比分析了單模式與全模式下,冷水機(jī)組故障遷移診斷與常規(guī)診斷的性能。單模式下遷移診斷較常規(guī)診斷正確率提升顯著(18.39%~22.43%),全模式下提升幅度為1.21%~2.55%。遷移診斷能有效解決冷水機(jī)組新工況數(shù)據(jù)缺乏問題,在有多個(gè)工況故障數(shù)據(jù)時(shí)推薦采用全模式,且不用進(jìn)行參數(shù)優(yōu)化以免出現(xiàn)過擬合,可以獲得更優(yōu)的診斷性能。
總之,新工況下的故障數(shù)據(jù)較為缺乏時(shí),利用多重?cái)?shù)據(jù)處理及TAB算法,結(jié)合不同基分類器,特別是RF基分類器,通過學(xué)習(xí)并遷移舊工況數(shù)據(jù)中的信息,實(shí)現(xiàn)對新工況故障的有效診斷,是冷水機(jī)組故障診斷的新出路,在提升診斷性能的同時(shí),可以縮減實(shí)驗(yàn)成本。