高學(xué)金,程琨,韓華云,高慧慧,齊詠生
(1 北京工業(yè)大學(xué)信息學(xué)部,北京 100124; 2 數(shù)字社區(qū)教育部工程研究中心,北京 100124; 3 城市軌道交通北京實(shí)驗(yàn)室,北京 100124; 4 計(jì)算智能與智能系統(tǒng)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124; 5 內(nèi)蒙古工業(yè)大學(xué)電力學(xué)院,內(nèi)蒙古呼和浩特 010051)
冷水機(jī)組是供暖、通風(fēng)和空調(diào)系統(tǒng)中的關(guān)鍵設(shè)備,運(yùn)行時(shí)間過(guò)久、使用操作不當(dāng)和維護(hù)不善等都會(huì)引發(fā)故障。冷水機(jī)組的耗電量通常占建筑總耗電量的40%[1],當(dāng)冷水機(jī)組發(fā)生故障并帶故障運(yùn)行時(shí),會(huì)額外造成15%~30%的能源消耗[2],造成大量的能源浪費(fèi)。從安全方面考慮,冷水機(jī)組在發(fā)生故障后,發(fā)現(xiàn)故障不及時(shí)或維修人員對(duì)發(fā)生的故障類型做出錯(cuò)誤的診斷結(jié)果,都可能引發(fā)設(shè)備停機(jī)、設(shè)備損壞等更加嚴(yán)重的安全性問(wèn)題。因此,針對(duì)冷水機(jī)組進(jìn)行故障診斷的研究具有重要意義。
在冷水機(jī)組故障診斷領(lǐng)域中,相較于傳統(tǒng)的基于模型的方法,基于數(shù)據(jù)驅(qū)動(dòng)的方法不需要復(fù)雜的物理模型及相關(guān)的物理學(xué)知識(shí)。同時(shí)隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,在冷水機(jī)組系統(tǒng)中可以采集到越來(lái)越多的運(yùn)行參數(shù),并且對(duì)這些運(yùn)行參數(shù)可以進(jìn)行靈活的存儲(chǔ)和讀取。由于上述原因,基于數(shù)據(jù)驅(qū)動(dòng)的冷水機(jī)組故障診斷受到越來(lái)越多研究者的關(guān)注,方法主要包含多元統(tǒng)計(jì)分析[3-4]、支持向量機(jī)[5-7]、貝葉斯網(wǎng)絡(luò)[8-10]、深度神經(jīng)網(wǎng)絡(luò)[11-12]、集成學(xué)習(xí)[13-14]等。多元統(tǒng)計(jì)分析方法是冷水機(jī)組故障診斷領(lǐng)域中研究和應(yīng)用較多的一種方法,多元統(tǒng)計(jì)分析是從經(jīng)典統(tǒng)計(jì)學(xué)中發(fā)展出來(lái)的一種方法,它通過(guò)對(duì)各種數(shù)據(jù)進(jìn)行分析,從相互關(guān)聯(lián)的多個(gè)對(duì)象和多個(gè)指標(biāo)中分析出所存在的規(guī)律。在冷水機(jī)組的運(yùn)行參數(shù)中,大部分參數(shù)之間相互關(guān)聯(lián),關(guān)系復(fù)雜,多元統(tǒng)計(jì)分析方法可以從冷水機(jī)組相互關(guān)聯(lián)的多個(gè)運(yùn)行參數(shù)中找到表征運(yùn)行狀態(tài)的主要特征,從而進(jìn)行精確的故障診斷。例如,齊詠生等[15]提出一種基于多尺度主元分析-核熵成分分析(MSPCA-KECA)的故障診斷策略,該方法通過(guò)MSPCA 提取參數(shù)中的故障特征,MSPCA 的輸出作為KECA 分類器的輸入,并采用新的監(jiān)測(cè)統(tǒng)計(jì)量使降維后不同特征信息之間呈現(xiàn)顯著的角度差異,減少了故障診斷的誤診率。在冷水機(jī)組的故障診斷領(lǐng)域,除了多元統(tǒng)計(jì)分析方法,支持向量機(jī)也是一種被深度研究與應(yīng)用的典型方法。Han 等[16]提出一種基于交叉驗(yàn)證的最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)冷水機(jī)組自動(dòng)故障診斷方法,LSSVM 利用冷水機(jī)組的8個(gè)故障指示特征對(duì)7種典型故障進(jìn)行診斷,取得了較高的診斷準(zhǔn)確率和較快的診斷時(shí)間。實(shí)際上,冷水機(jī)組各種故障與各特征之間的關(guān)系有著很大的不確定性,相同故障發(fā)生時(shí)可能會(huì)使不同特征變量發(fā)生改變,而多元統(tǒng)計(jì)分析方法和支持向量機(jī)不容易解決冷水機(jī)組故障診斷中的不確定性。而貝葉斯網(wǎng)絡(luò)是由代表變量的節(jié)點(diǎn)及連接節(jié)點(diǎn)的有向邊構(gòu)成的有向無(wú)環(huán)圖,貝葉斯網(wǎng)絡(luò)各節(jié)點(diǎn)間的有向邊代表了節(jié)點(diǎn)間的相互關(guān)系,并用條件概率表示各節(jié)點(diǎn)之間的關(guān)系強(qiáng)度,使得不確定性推理變得更為清晰、可理解性更強(qiáng)。貝葉斯網(wǎng)絡(luò)可以融合冷水機(jī)組的各種現(xiàn)場(chǎng)信息進(jìn)行推理,適用于存在諸多不確定性的冷水機(jī)組故障診斷中。Zhao等[17]設(shè)計(jì)了一個(gè)三層貝葉斯網(wǎng)絡(luò)來(lái)診斷冷水機(jī)組的典型故障,在冷凝器結(jié)垢、制冷劑泄漏和冷凝器水流量減少這三種故障上均獲得了較高的診斷準(zhǔn)確率。隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,逐漸有人將深度神經(jīng)網(wǎng)絡(luò)引入到冷水機(jī)組的故障診斷研究中。深度神經(jīng)網(wǎng)絡(luò)可以根據(jù)歷史數(shù)據(jù)建立端到端的故障診斷模型,不需要額外的信息和專家知識(shí),并且診斷的速度和精度都得到了很大的提升。例如,Li[18]等提出了一種用于冷水機(jī)組故障診斷的特征增強(qiáng)時(shí)域卷積網(wǎng)絡(luò)的方法,與其他方法相比,需要更少的樣本和更短的時(shí)間就可以完成模型的訓(xùn)練,并且可以獲得滿意的故障診斷結(jié)果。除了上述方法外,許多研究還提出在診斷分類之前對(duì)冷水機(jī)組的特征進(jìn)行提取,消除冗余特征,從而提高故障診斷的精度。例如,Gao 等[19]提出了一種帶有級(jí)聯(lián)特征清洗和補(bǔ)充混合特征篩選的故障診斷策略,通過(guò)基于隨機(jī)森林(random forest,RF)元模型的全局靈敏度分析方法分析了冷水機(jī)組典型故障的敏感參數(shù),并用于故障診斷,證明了潤(rùn)滑油參數(shù)對(duì)系統(tǒng)狀態(tài)有直接而顯著的指示作用。Lu等[20]提出了一種基于RF的特征重要性排序方法,僅選用重要性高的特征進(jìn)行故障診斷,在使用較少傳感器的情況下提高了冷水機(jī)組故障診斷的性能。
基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法可以獲得較高的故障診斷精度,一個(gè)重要原因是依賴于數(shù)據(jù)量充足且類別平衡的理想數(shù)據(jù)集,但是,理想的數(shù)據(jù)集在實(shí)際應(yīng)用中是很難獲得的。在實(shí)際的數(shù)據(jù)集中故障數(shù)據(jù)通常很少,從而使故障診斷的準(zhǔn)確性急劇下降[21]。在冷水機(jī)組的整個(gè)生命周期中,其運(yùn)行在故障狀態(tài)的次數(shù)少且時(shí)間短,從成本和安全方面考慮,人為制造故障來(lái)產(chǎn)生故障數(shù)據(jù)也不合理,所以現(xiàn)有的大部分冷水機(jī)組故障診斷方法在實(shí)際應(yīng)用中,會(huì)面臨故障樣本數(shù)量不足使得故障診斷精度下降的問(wèn)題。為解決這一問(wèn)題,范雨強(qiáng)等[22]將合成少數(shù)類過(guò)采樣技術(shù)與SVM 算法相結(jié)合用于冷水機(jī)組的故障診斷中,僅采用少量螺桿式冷水機(jī)組的故障數(shù)據(jù),就可以將離心式冷水機(jī)組故障診斷模型改變成螺桿式冷水機(jī)組故障診斷模型,解決了螺桿式冷水機(jī)組故障數(shù)據(jù)不足導(dǎo)致無(wú)法進(jìn)行故障診斷的問(wèn)題。Gao 等[23]提出了一種基于數(shù)據(jù)自產(chǎn)生和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的故障診斷方法,該方法利用滑動(dòng)窗口將有限的故障數(shù)據(jù)擴(kuò)展成更多的故障數(shù)據(jù),并利用CNN 良好的特征提取和模式識(shí)別能力來(lái)診斷冷水機(jī)組的典型故障。在解決冷水機(jī)組故障樣本數(shù)量不足的問(wèn)題上,傳統(tǒng)的解決方法容易產(chǎn)生大量的相似數(shù)據(jù),會(huì)加大模型過(guò)擬合的可能性,提高故障診斷的誤診率。
近幾年的研究表明,在解決故障診斷過(guò)程中的數(shù)據(jù)不平衡問(wèn)題上,利用生成式對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)生成所需的故障數(shù)據(jù)是解決該問(wèn)題的一個(gè)有效途徑。GAN 由Goodfellow[24]首先提出,因?yàn)楹?jiǎn)單有效的訓(xùn)練方式使得GAN 在圖像生成領(lǐng)域應(yīng)用廣泛。近幾年,GAN 逐步被應(yīng)用在故障診斷領(lǐng)域,例如,Yan等[25]將GAN 引入到冷水機(jī)組的故障診斷中,并利用成本敏感的順序特征選擇算法[26],從冷水機(jī)組的特征集中選出特征子集并進(jìn)行故障診斷,結(jié)果表明所提出的方法可以在故障數(shù)據(jù)不足的情況下獲得較高的故障診斷準(zhǔn)確率。之后,Yan 等[27]又通過(guò)引入變分自編碼器,提出GAN 和變分自編碼器結(jié)合的復(fù)合模型來(lái)生成冷水機(jī)組的故障數(shù)據(jù),診斷準(zhǔn)確率得到進(jìn)一步的提升。
GAN 雖然可以解決冷水機(jī)組故障診斷中的數(shù)據(jù)不平衡問(wèn)題,但是利用GAN 在生成多個(gè)故障類別的數(shù)據(jù)時(shí),容易使單個(gè)故障類別的生成數(shù)據(jù)分布范圍過(guò)大,造成不同類別的生成數(shù)據(jù)之間產(chǎn)生大量重疊,從而影響最終故障診斷的精度。
本文提出一種基于CLCGAN-SVM 的冷水機(jī)組故障診斷方法。該方法首先構(gòu)造符合GAN 模型訓(xùn)練的動(dòng)態(tài)中心損失項(xiàng),再將動(dòng)態(tài)中心損失引入到GAN 的目標(biāo)函數(shù)中,從而減少各個(gè)類別生成樣本之間的重疊程度,提高生成樣本的質(zhì)量。同時(shí)在GAN的判別器目標(biāo)函數(shù)中對(duì)生成數(shù)據(jù)的“真假”和“類別”兩個(gè)條件進(jìn)行約束,一方面保證生成數(shù)據(jù)不斷向真實(shí)數(shù)據(jù)靠近,另一方面使生成數(shù)據(jù)均衡地遍布各個(gè)類別,避免生成數(shù)據(jù)的單一性。最后,利用真實(shí)數(shù)據(jù)與生成數(shù)據(jù)形成的平衡數(shù)據(jù)集構(gòu)造SVM 模型,進(jìn)一步實(shí)現(xiàn)冷水機(jī)組的故障診斷。
GAN 是近幾年來(lái)較為流行的一種生成模型,可以產(chǎn)生與輸入樣本的特征相一致的生成樣本。GAN 基于博弈論場(chǎng)景,由生成器G 和判別器D 兩個(gè)獨(dú)立的網(wǎng)絡(luò)組成,兩者為相互對(duì)抗的目標(biāo),生成器G 接受隨機(jī)噪聲,這個(gè)噪聲可以取樣自任意分布,通過(guò)生成器復(fù)雜的網(wǎng)絡(luò)可以將輸入的分布變成所需的更加復(fù)雜的分布,此分布可記作G(z)。判別器D 是一個(gè)判別輸入樣本真假的網(wǎng)絡(luò),用來(lái)判別一個(gè)輸入樣本是否是“真實(shí)的”。其輸入樣本x由兩部分組成,一部分是服從真實(shí)數(shù)據(jù)分布的隨機(jī)采樣樣本,另一部分是服從生成數(shù)據(jù)分布的隨機(jī)采樣樣本。輸入樣本x經(jīng)過(guò)判別器網(wǎng)絡(luò)后得到輸出結(jié)果D(x),D(x)是一個(gè)介于0 到1 之間的小數(shù),其代表輸入樣本x為真實(shí)數(shù)據(jù)的概率,D(x)越高代表輸入數(shù)據(jù)越接近于真實(shí)數(shù)據(jù)。GAN 的基本結(jié)構(gòu)如圖1所示。
圖1 生成式對(duì)抗網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.1 Basic structure of generative adversarial network
在GAN 的訓(xùn)練過(guò)程中,生成器G 的目標(biāo)就是盡量生成真實(shí)的樣本去“欺騙”判別器D。而判別器D的目標(biāo)就是盡量把生成器G生成的樣本和真實(shí)的樣本區(qū)分開(kāi)。這樣,生成器G 和判別器D 就構(gòu)成了一個(gè)動(dòng)態(tài)的“博弈過(guò)程”。在理想狀態(tài)下,生成器G 可以生成“以假亂真”的樣本G(z),而對(duì)于判別器D 來(lái)說(shuō),難以判斷生成器G 生成的樣本G(z)的真實(shí)性,也就是判別器的輸出取中間值0.5,最終生成器G和判別器D達(dá)到納什均衡,GAN的目標(biāo)函數(shù)可表示為
式中,E[·]表示輸出結(jié)果的期望;G(·)和D(·)分別表示生成器和判別器的輸出;x為真實(shí)數(shù)據(jù);z為隨機(jī)噪聲;下角標(biāo),x~Pdata表示從真實(shí)數(shù)據(jù)分布中隨機(jī)采樣;z~Pz表示從隨機(jī)分布中進(jìn)行隨機(jī)采樣。將上述整體的目標(biāo)函數(shù)分為判別器和生成器兩部分可表示為
由于判別器的目標(biāo)是區(qū)分真假樣本,所以判別器期望目標(biāo)函數(shù)中的D(x)最大化,期望D(G(z))最小化。生成器的目標(biāo)則是生成盡可能真實(shí)的樣本,所以生成器期望目標(biāo)函數(shù)中的D(G(z))最大化,當(dāng)判別器和生成器達(dá)到納什均衡時(shí),目標(biāo)函數(shù)收斂。
傳統(tǒng)GAN 的判別器只能判斷其輸入是真實(shí)數(shù)據(jù)還是生成數(shù)據(jù),不能判斷輸入的具體類別,即判斷不出輸入數(shù)據(jù)所屬的故障類型。本文所需的冷水機(jī)組數(shù)據(jù)的故障類型較多,為了使每一類故障都有足夠多的生成樣本,受到條件生成式對(duì)抗網(wǎng)絡(luò)[28]的啟發(fā),在訓(xùn)練GAN 模型之前,先構(gòu)造所需生成樣本的故障標(biāo)簽,用提前構(gòu)造好的故障標(biāo)簽與真假標(biāo)簽作為GAN 模型輸入的一部分,實(shí)現(xiàn)指導(dǎo)模型訓(xùn)練的作用。
從真假和類別兩個(gè)角度設(shè)計(jì)判別器,將判別器網(wǎng)絡(luò)的輸出設(shè)置為兩個(gè)通道,并添加一個(gè)通道權(quán)重系數(shù)。其中一個(gè)輸出的結(jié)果代表輸入數(shù)據(jù)屬于真實(shí)數(shù)據(jù)的概率,傳統(tǒng)的GAN 利用交叉熵的形式計(jì)算此概率,但是利用交叉熵的形式判斷數(shù)據(jù)真假會(huì)導(dǎo)致一些遠(yuǎn)離決策邊界且被判別器分類為真的生成樣本不會(huì)繼續(xù)向真實(shí)數(shù)據(jù)靠近,這會(huì)大大降低生成樣本的質(zhì)量。本文采用最小二乘的形式構(gòu)造目標(biāo)函數(shù),可以使GAN 的判別器判別為真實(shí)樣本且遠(yuǎn)離決策邊界的生成樣本繼續(xù)優(yōu)化,從而進(jìn)一步拉近生成樣本與真實(shí)樣本之間的距離,提高生成樣本的質(zhì)量。
判別器的另一個(gè)輸出是判斷樣本的故障類型,在交叉熵的形式下利用提前構(gòu)造的故障標(biāo)簽對(duì)生成數(shù)據(jù)進(jìn)行約束,使生成數(shù)據(jù)可以向預(yù)先設(shè)定的各類別靠近,而不只是生成“真”和“假”兩類數(shù)據(jù)。本文CLCGAN中判別器的目標(biāo)函數(shù)可表示為
式中,α是權(quán)重系數(shù)(常數(shù)),它的引入是為了平衡樣本生成過(guò)程中真假與類別之間的生成權(quán)重;D1(·)和D2(·)是判別器的兩個(gè)輸出,D1(·)為輸入樣本屬于真實(shí)樣本的概率,D2(·)為輸入樣本的故障類別;N為樣本總數(shù);c為整體的故障標(biāo)簽;ci為第i個(gè)生成樣本G(zi)所屬的故障標(biāo)簽,訓(xùn)練開(kāi)始之前可根據(jù)實(shí)驗(yàn)需求設(shè)定對(duì)應(yīng)的標(biāo)簽集,在本文的實(shí)驗(yàn)中對(duì)7 個(gè)故障類別分別生成1500 個(gè)樣本,所以ci所在的標(biāo)簽集分為7 組,每組1500 個(gè)相同標(biāo)簽,故障標(biāo)簽依次為1、2、3、4、5、6、7。
GAN 在生成多種類別的數(shù)據(jù)時(shí),由于生成器目標(biāo)函數(shù)沒(méi)有對(duì)生成范圍進(jìn)行約束,容易使生成的各個(gè)類別的數(shù)據(jù)分布范圍過(guò)大,該問(wèn)題會(huì)使生成數(shù)據(jù)中不同類別數(shù)據(jù)之間存在大范圍的重疊,不利于之后生成數(shù)據(jù)的應(yīng)用。本文引入中心損失[29]的思想,在GAN 中利用各個(gè)類別的特征中心點(diǎn)對(duì)生成數(shù)據(jù)進(jìn)行約束,可以最大限度地減少類內(nèi)距離,同時(shí)保持不同類別樣本之間的差異性不變。具體改進(jìn)方法是:計(jì)算出每一類故障的真實(shí)數(shù)據(jù)的中心點(diǎn),將生成的故障數(shù)據(jù)與真實(shí)數(shù)據(jù)的中心點(diǎn)之間的歐氏距離作為生成器目標(biāo)函數(shù)的一部分,在生成器與判別器的迭代過(guò)程中,拉近各類別生成故障樣本內(nèi)部的距離,通過(guò)減少類內(nèi)距離來(lái)減少各類樣本之間的重疊程度,從而提高生成樣本的質(zhì)量。中心損失可表示為
式中,N為樣本總數(shù);xi為第i個(gè)樣本;yi為第i個(gè)樣本的故障標(biāo)簽;cyi表示標(biāo)簽為yi的所有數(shù)據(jù)的特征中心,計(jì)算公式為
式中,ck為樣本第k個(gè)特征的特征中心;N表示標(biāo)簽為yi的樣本的總數(shù)量;xki為第i個(gè)樣本的第k個(gè)特征。
傳統(tǒng)的中心損失項(xiàng)中每一類的特征中心cyi是固定的常數(shù),這是不合理的,使用非動(dòng)態(tài)的特征中心會(huì)導(dǎo)致生成的各類別數(shù)據(jù)范圍太固定,不符合數(shù)據(jù)產(chǎn)生的實(shí)際情況。因此對(duì)中心損失項(xiàng)進(jìn)行修改,將中心損失修改成隨GAN 的迭代而不斷變化的動(dòng)態(tài)中心損失。首先,設(shè)定一個(gè)移動(dòng)步長(zhǎng)β,在生成式對(duì)抗網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,使每一類的特征中心通過(guò)設(shè)定的步長(zhǎng)向每一次生成數(shù)據(jù)的特征中心移動(dòng)。其次,需要注意的是,為了防止特征中心向錯(cuò)誤的方向移動(dòng)過(guò)多,移動(dòng)步長(zhǎng)取較小的數(shù)值。新的中心損失項(xiàng)與第i類的特征中心計(jì)算公式為
本文算法的訓(xùn)練過(guò)程可分為以下步驟:
①設(shè)置算法訓(xùn)練的迭代次數(shù)t;
②從隨機(jī)分布Pz(z)中隨機(jī)采樣,生成具有n個(gè)噪聲樣本的數(shù)據(jù)集{z(1),… ,z(n)},并設(shè)定樣本標(biāo)簽集{c(1),…,c(n)};
③從真實(shí)樣本的數(shù)據(jù)集Pdata(x) 中隨機(jī)選取,生成具有n個(gè)真實(shí)樣本的數(shù)據(jù)集{(x(1),c(1)),…,(x(n),c(n))};
④從生成分布G(z)中隨機(jī)采樣,生成具有n個(gè)生成樣本的數(shù)據(jù)集{G(z)(1),…,G(z)(n)},并設(shè)定樣本標(biāo)簽集{c(1),…,c(n)};
⑤使用RMSprop 算法更新判別器D 的參數(shù),并循環(huán)m次(m大于生成器更新的次數(shù));
⑥從隨機(jī)分布Pz(z)中隨機(jī)采樣,生成具有n個(gè)噪聲樣本的數(shù)據(jù)集{z(1),… ,z(n)},并設(shè)定樣本標(biāo)簽集{c(1),…,c(n)};
⑦使用RMSprop算法更新判別器G的參數(shù);
⑧達(dá)到迭代次數(shù)t,訓(xùn)練結(jié)束。
本文的CLCGAN 模型內(nèi)部包含1 個(gè)生成器模型和1 個(gè)判別器模型,兩者交替訓(xùn)練實(shí)現(xiàn)樣本的生成。生成器模型采用包含1 個(gè)輸入層、1 個(gè)輸出層和2 個(gè)隱藏層的4 層全連接結(jié)構(gòu),判別器模型采用包含1 個(gè)輸入層、2 個(gè)輸出層和3 個(gè)隱藏層的6 層全連接結(jié)構(gòu)。受文獻(xiàn)[30]的啟發(fā),網(wǎng)絡(luò)各層的節(jié)點(diǎn)數(shù)采取先增大后減小的方式比逐漸減小的方式分類效果更好,所以本文中的生成器模型和判別器模型各層節(jié)點(diǎn)數(shù)遵循先增大后減少的原則。
本文使用的冷水機(jī)組數(shù)據(jù)集含有64個(gè)特征,生成的隨機(jī)噪聲的維度為128,所以生成器的輸入層節(jié)點(diǎn)數(shù)為128,根據(jù)節(jié)點(diǎn)數(shù)先增大后減小的原則,隱藏層1 的節(jié)點(diǎn)數(shù)設(shè)置為輸入層的兩倍,即256 個(gè)節(jié)點(diǎn),隱藏層2 的節(jié)點(diǎn)數(shù)減少為隱藏層1 的一半,即128個(gè)節(jié)點(diǎn),生成器產(chǎn)生的故障數(shù)據(jù)含有64個(gè)特征,所以輸出層的節(jié)點(diǎn)數(shù)設(shè)置為64。綜上所述,生成器各層的初始節(jié)點(diǎn)數(shù)設(shè)置為128、256、128、64,借鑒條件生成式對(duì)抗網(wǎng)絡(luò)的思想,在生成器的每層都有一個(gè)額外的標(biāo)簽節(jié)點(diǎn),通過(guò)樣本標(biāo)簽指導(dǎo)生成模型的訓(xùn)練,所以生成器模型各層的節(jié)點(diǎn)數(shù)設(shè)置為129、257、129、64,激活函數(shù)統(tǒng)一使用ReLU函數(shù)。
判別器的輸入層節(jié)點(diǎn)數(shù)與冷水機(jī)組數(shù)據(jù)集的特征數(shù)保持一致,同時(shí)加入標(biāo)簽節(jié)點(diǎn),設(shè)置為65 個(gè)節(jié)點(diǎn)。根據(jù)節(jié)點(diǎn)數(shù)先增大后減小的原則,隱藏層1、隱藏層2 和隱藏層3 的節(jié)點(diǎn)數(shù)分別設(shè)置為256、64、32,本文判別器的輸出層1 是為了判斷樣本的故障類型,冷水機(jī)組故障樣本共7種故障類型,所以節(jié)點(diǎn)數(shù)設(shè)置為7,而輸出層2 是為了判斷樣本的真假,表示樣本屬于真實(shí)數(shù)據(jù)的概率,所以節(jié)點(diǎn)數(shù)設(shè)置為1。綜上所述,判別器各層的節(jié)點(diǎn)數(shù)設(shè)置為65、256、64、32、7/1,輸出層2的激活函數(shù)使用Sigmoid函數(shù),其余各層的激活函數(shù)均使用ReLU 函數(shù)。生成器模型和判別器模型的具體結(jié)構(gòu)如表1所示。
表1 CLCGAN模型結(jié)構(gòu)Table 1 Structure of CLCGAN model
SVM 是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行分類的廣義線性分類器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面。因?yàn)槠湓诮鉀Q小樣本問(wèn)題方面的優(yōu)越性,所以本文選取SVM 作為驗(yàn)證生成模型方法有效性的故障診斷分類器,并作為最終對(duì)比實(shí)驗(yàn)中的一部分。
初始的SVM 是用來(lái)求解二分類問(wèn)題,但是在實(shí)際問(wèn)題中,SVM 面臨的任務(wù)基本都是多分類任務(wù)。使用SVM 進(jìn)行多分類的方法主要有兩種:第一種,修改SVM 的目標(biāo)函數(shù)可以達(dá)到多分類的目標(biāo),但是會(huì)使目標(biāo)函數(shù)變復(fù)雜,計(jì)算復(fù)雜度高且不易實(shí)現(xiàn);第二種,構(gòu)建多個(gè)二分類的SVM,最后通過(guò)特定的規(guī)則進(jìn)行組合實(shí)現(xiàn)多分類的SVM。多分類SVM 方法的介紹如圖2所示,對(duì)于每一個(gè)類型,將其作為正類,其余類型作為負(fù)類。如圖2 所示,類型1 作為正類,類型2 和類型3 作為負(fù)類,構(gòu)造一個(gè)SVM 模型,其中d1是該SVM模型的決策邊界,類似地得到其余的SVM模型。
圖2 多分類SVMFig.2 Multi classification SVM
本實(shí)驗(yàn)因?yàn)樯婕暗秸顟B(tài)和7 種故障類型,總共8 種不同的類別,所以需要多分類的SVM 進(jìn)行故障診斷。本文針對(duì)每一個(gè)類別分別構(gòu)造SVM,共構(gòu)造8 個(gè)SVM,每個(gè)SVM 負(fù)責(zé)區(qū)分本類別數(shù)據(jù)和非本類別數(shù)據(jù),即第i個(gè)SVM 在第i類和其余類之間構(gòu)造一個(gè)超平面,最后結(jié)果由輸出離超平面距離最大的SVM決定。
本文所提的故障診斷方法包含信號(hào)采集、數(shù)據(jù)預(yù)處理、生成樣本數(shù)據(jù)和故障診斷,總共4 個(gè)階段,故障診斷的具體步驟如下。
(1)收集冷水機(jī)組運(yùn)行數(shù)據(jù),包含正常狀態(tài)數(shù)據(jù)和故障狀態(tài)數(shù)據(jù),對(duì)所有數(shù)據(jù)進(jìn)行穩(wěn)態(tài)過(guò)濾,去除非穩(wěn)態(tài)數(shù)據(jù)。
(2)將原始數(shù)據(jù)集進(jìn)行數(shù)據(jù)歸一化處理,減少不同變量的量綱對(duì)實(shí)驗(yàn)的影響,將原始數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。
(3)構(gòu)造并初始化CLCGAN 模型,從訓(xùn)練數(shù)據(jù)集中選取指定數(shù)量的故障樣本,并作為CLCGAN 模型的訓(xùn)練數(shù)據(jù),當(dāng)CLCGAN 模型在訓(xùn)練過(guò)程中達(dá)到停止條件或達(dá)到指定的迭代次數(shù)后,訓(xùn)練結(jié)束并由CLCGAN的生成器輸出生成的故障數(shù)據(jù)。
(4)將CLCGAN 生成的故障數(shù)據(jù)與初始選定的真實(shí)故障數(shù)據(jù)合并作為最終的故障數(shù)據(jù),故障數(shù)據(jù)與正常狀態(tài)數(shù)據(jù)組成平衡數(shù)據(jù)集。
(5)構(gòu)造并初始化多分類的SVM 模型,將平衡數(shù)據(jù)集作為多分類SVM 模型的訓(xùn)練數(shù)據(jù),SVM 模型訓(xùn)練完成后,用測(cè)試數(shù)據(jù)集驗(yàn)證最終故障診斷的準(zhǔn)確性。
實(shí)驗(yàn)數(shù)據(jù)來(lái)自ASHRAE 1043-RP[31]項(xiàng)目,實(shí)驗(yàn)涉及一臺(tái)90 t 離心式水冷冷水機(jī)組,該冷水機(jī)組配備了二回程殼管式蒸發(fā)器和冷凝器,并由恒溫膨脹閥控制,制冷劑采用R134a 制冷劑。項(xiàng)目利用實(shí)驗(yàn)平臺(tái)對(duì)冷水機(jī)組的正常運(yùn)行狀態(tài)和7種典型故障狀態(tài)進(jìn)行了模擬,7種典型故障在實(shí)驗(yàn)中分別具有4種故障嚴(yán)重程度,即Level 1、Level 2、Level 3和Level 4。其中冷凝器水流量下降、蒸發(fā)器水流量下降、冷凝器結(jié)垢和冷凝劑中有非冷凝物4種故障發(fā)生后會(huì)引起局部范圍內(nèi)運(yùn)行參數(shù)的變化,因此屬于部件級(jí)故障,而冷凝劑泄漏、冷凝劑填充過(guò)量和潤(rùn)滑油過(guò)量3 種故障發(fā)生后會(huì)引發(fā)全局參數(shù)的變化,因此屬于系統(tǒng)級(jí)故障。表2 所示為7 種故障的生成方式和設(shè)置不同嚴(yán)重程度時(shí)的參數(shù)。
表2 不同故障等級(jí)下的7種典型故障的生成方法Table 2 Generation methods of 7 typical faults under different fault levels
圖3 實(shí)驗(yàn)流程圖Fig.3 Flow diagram of experiment
根據(jù)設(shè)定的冷凍水溫度、蒸發(fā)器的進(jìn)水溫度、冷凝器的進(jìn)水溫度等的不同,項(xiàng)目共有27 種工況,可以從實(shí)驗(yàn)中獲得冷凝器進(jìn)出水溫度、蒸發(fā)器水流量、冷凝器水流量等64 個(gè)參數(shù)的數(shù)據(jù),其中包含48個(gè)傳感器數(shù)據(jù)和16個(gè)間接計(jì)算數(shù)據(jù)。此外,實(shí)驗(yàn)中每個(gè)樣本數(shù)據(jù)采集間隔為10 s。
本實(shí)驗(yàn)主要采用分類準(zhǔn)確率作為評(píng)估指標(biāo),用于實(shí)驗(yàn)結(jié)果的比較。假設(shè)有N個(gè)數(shù)據(jù)樣本進(jìn)行測(cè)試,將N分為NTP、NFN、NFP和NTN,其中NTP、NFN、NFP和NTN分別為真陽(yáng)性樣本、假陰性樣本、假陽(yáng)性樣本和真陰性樣本的數(shù)量。真陽(yáng)性樣本代表樣本實(shí)際標(biāo)簽為正,預(yù)測(cè)標(biāo)簽為正;假陰性樣本代表樣本實(shí)際標(biāo)簽為正,而預(yù)測(cè)標(biāo)簽為負(fù);假陽(yáng)性樣本代表樣本實(shí)際標(biāo)簽為負(fù),而預(yù)測(cè)標(biāo)簽為正;真陰性樣本代表樣本實(shí)際標(biāo)簽為負(fù),預(yù)測(cè)標(biāo)簽為負(fù)。真陽(yáng)性樣本和真陰性樣本的實(shí)際標(biāo)簽和預(yù)測(cè)標(biāo)簽一致,代表正確分類的樣本,而假陽(yáng)性和假陰性的實(shí)際標(biāo)簽和預(yù)測(cè)標(biāo)簽相反,代表錯(cuò)誤分類的樣本。所以,本文采用的分類準(zhǔn)確率AC用式(13)計(jì)算。
只采用準(zhǔn)確率對(duì)于方法的性能分析來(lái)說(shuō),不是很全面,因?yàn)槿绻麛?shù)據(jù)集不平衡,即每一類的數(shù)據(jù)樣本數(shù)量相差太大,分類器可能會(huì)偏向于將所有樣本都預(yù)測(cè)為數(shù)量較多的類別,這樣可以保證很高的準(zhǔn)確率,但是容易發(fā)生誤分類的問(wèn)題,所以同時(shí)采用準(zhǔn)確率和召回率來(lái)評(píng)估實(shí)驗(yàn)結(jié)果,召回率Recall可通過(guò)式(14)計(jì)算。
為了確保實(shí)驗(yàn)結(jié)果評(píng)估的全面性,進(jìn)行實(shí)驗(yàn)結(jié)果評(píng)估時(shí),本文還用到混淆矩陣,混淆矩陣的格式如表3 所示。在機(jī)器學(xué)習(xí)領(lǐng)域,混淆矩陣又稱可能性表格或錯(cuò)誤矩陣,它是一種用來(lái)呈現(xiàn)方法性能的可視化效果的特定矩陣,通常應(yīng)用在監(jiān)督學(xué)習(xí)中?;煜仃嚳梢匀菀椎乇砻鞫鄠€(gè)類別是否有混淆,即一個(gè)類別被預(yù)測(cè)成另一個(gè)類別,所有正確的預(yù)測(cè)結(jié)果都在對(duì)角線上,對(duì)角線之外的樣本都是預(yù)測(cè)錯(cuò)誤的樣本,所以從混淆矩陣中可以很方便直觀地看出方法的性能。在本實(shí)驗(yàn)中,混淆矩陣的每一行代表預(yù)測(cè)值,每一列代表實(shí)際的類別,預(yù)測(cè)類別和實(shí)際類別的順序依次是冷凝器水流量下降、蒸發(fā)器水流量下降、制冷劑泄漏、制冷劑過(guò)量、潤(rùn)滑油過(guò)多、冷凝器結(jié)垢、冷凝劑中有非冷凝物和正常狀態(tài)。
表3 混淆矩陣的描述Table 3 Description of confusion matrix
在實(shí)驗(yàn)設(shè)置方面,為了驗(yàn)證本文所提方法在故障樣本不足時(shí)的有效性,從每一種表征冷水機(jī)組故障類型的樣本中隨機(jī)選取50 個(gè)作為生成模型CLCGAN 的訓(xùn)練樣本,模型訓(xùn)練完成后每一種故障類型都生成1500個(gè)樣本。SVM 的訓(xùn)練樣本包含:生成模型CLCGAN的訓(xùn)練樣本、CLCGAN的生成樣本、1550 個(gè)表征冷水機(jī)組正常狀態(tài)的樣本。從每個(gè)故障類型和正常狀態(tài)的數(shù)據(jù)集中都隨機(jī)選取500個(gè)作為最終的測(cè)試數(shù)據(jù)。為了增加實(shí)驗(yàn)結(jié)果的可信度,取五次實(shí)驗(yàn)結(jié)果的平均值作為最終的實(shí)驗(yàn)結(jié)果,SVM的參數(shù)使用網(wǎng)格搜索和交叉驗(yàn)證進(jìn)行了調(diào)整。
上述實(shí)驗(yàn)設(shè)置下故障診斷結(jié)果的混淆矩陣如圖4所示,混淆矩陣的列代表真實(shí)的標(biāo)簽,行代表預(yù)測(cè)的標(biāo)簽。可以看出,隨著故障嚴(yán)重程度的提升,故障診斷的精度也有明顯地提升。在四種故障嚴(yán)重程度下的故障和正常狀態(tài)的平均故障診斷準(zhǔn)確率和召回率如圖5所示。
圖4 故障診斷結(jié)果的混淆矩陣Fig.4 Confusion matrix of fault diagnosis results
圖5 平均故障診斷準(zhǔn)確率和召回率(訓(xùn)練階段取50個(gè)故障樣本)Fig.5 Average fault diagnosis accuracy and recall(take 50 fault samples in the training stage)
圖4(a)為冷水機(jī)組故障嚴(yán)重程度為L(zhǎng)evel 1時(shí)故障診斷結(jié)果的混淆矩陣,在八種類別上取得了92.46%的平均準(zhǔn)確率和92.48%的平均召回率,可以明顯看出在制冷劑泄漏、制冷劑過(guò)量、潤(rùn)滑油過(guò)量三種系統(tǒng)級(jí)故障之間發(fā)生的錯(cuò)誤診斷較多。測(cè)試數(shù)據(jù)集包括每類故障500 個(gè)樣本和正常狀態(tài)500 個(gè)樣本,共有4000 個(gè)樣本。制冷劑泄漏故障的500 個(gè)測(cè)試樣本,其中有41 個(gè)樣本被錯(cuò)誤診斷為制冷劑過(guò)量,62 個(gè)樣本被錯(cuò)誤診斷為潤(rùn)滑油過(guò)多,5 個(gè)樣本被錯(cuò)誤診斷為冷凝器結(jié)垢,9 個(gè)樣本被錯(cuò)誤診斷為無(wú)故障。制冷劑過(guò)量故障的500 個(gè)測(cè)試樣本,其中有37 個(gè)樣本被錯(cuò)誤診斷為制冷劑泄漏,16 個(gè)樣本被錯(cuò)誤診斷為潤(rùn)滑油過(guò)多,1 個(gè)樣本被錯(cuò)誤診斷為冷凝器結(jié)垢,4 個(gè)樣本被錯(cuò)誤診斷為無(wú)故障。潤(rùn)滑油過(guò)多故障的500 個(gè)測(cè)試樣本,其中有85 個(gè)樣本被錯(cuò)誤診斷為制冷劑泄漏,15 個(gè)樣本被錯(cuò)誤診斷為制冷劑過(guò)量,1 個(gè)樣本被錯(cuò)誤診斷為冷凝器結(jié)垢,2 個(gè)樣本被錯(cuò)誤診斷為無(wú)故障。通過(guò)對(duì)冷水機(jī)組相應(yīng)運(yùn)行數(shù)據(jù)的分析,發(fā)生上述現(xiàn)象的原因是冷水機(jī)組在發(fā)生制冷劑泄漏、制冷劑過(guò)量和潤(rùn)滑油過(guò)多三種系統(tǒng)性故障,且故障嚴(yán)重程度為L(zhǎng)evel 1 時(shí),冷水機(jī)組運(yùn)行數(shù)據(jù)的變化極為相似,差異性不明顯。變化相似的訓(xùn)練數(shù)據(jù)使得生成模型生成的故障樣本也具有相似的特征,最終平衡數(shù)據(jù)集中只包含每種故障的50 個(gè)真實(shí)樣本和大量相似的生成樣本,這使得故障診斷時(shí)三種故障之間產(chǎn)生較多的錯(cuò)誤診斷。
圖4(b)、(c)、(d)分別是冷水機(jī)組故障嚴(yán)重程度為L(zhǎng)evel 2、Level 3、Level 4 時(shí)故障診斷結(jié)果的混淆矩陣,相較于圖4(a),可以明顯看出故障診斷的精度獲得了很大的提高,平均準(zhǔn)確率分別是96.45%、98.91% 和98.47%,平均召回率分別是96.40%、98.90%和98.38%,這是因?yàn)殡S著故障嚴(yán)重程度的增加,在冷水機(jī)組的運(yùn)行變量之間,表征故障發(fā)生特征的變化明顯且易于區(qū)分。并且隨著故障嚴(yán)重程度的增加,在圖4(b)中制冷劑泄漏、制冷劑過(guò)量和潤(rùn)滑油過(guò)多三種系統(tǒng)性故障都可以取得比故障嚴(yán)重程度為L(zhǎng)evel 1 時(shí)更高的故障診斷精度,這是因?yàn)樵诠收蠂?yán)重程度為L(zhǎng)evel 2 時(shí),三種故障發(fā)生時(shí)冷水機(jī)組的運(yùn)行變量的相似度下降,變量之間存在的差異性增大。從圖4(c)和圖4(d)可以看出,當(dāng)故障嚴(yán)重程度為L(zhǎng)evel 3 和Level 4 時(shí),制冷劑泄漏、制冷劑過(guò)量和潤(rùn)滑油過(guò)多三種系統(tǒng)性故障之間已經(jīng)不存在明顯的錯(cuò)誤診斷現(xiàn)象,且7 種故障和正常狀態(tài)的診斷精度都已經(jīng)都取得了較為理想的結(jié)果。
為了驗(yàn)證在生成模型CLCGAN 訓(xùn)練階段故障樣本的數(shù)量對(duì)最終故障診斷精度的影響,再次設(shè)置實(shí)驗(yàn),在CLCGAN 模型訓(xùn)練階段,將每一類故障樣本的數(shù)量都設(shè)置為100 個(gè),其他設(shè)置均保持不變。該設(shè)置下故障診斷結(jié)果的混淆矩陣如圖6所示??梢钥闯觯噍^于每一類故障樣本的數(shù)量都設(shè)置為50 個(gè)時(shí),模型訓(xùn)練階段,故障樣本數(shù)量的增加有利于冷水機(jī)組故障診斷精度的提高。在此實(shí)驗(yàn)設(shè)置下,四種故障嚴(yán)重程度的故障和正常狀態(tài)的平均故障診斷準(zhǔn)確率和召回率如圖7所示。
圖6 故障診斷結(jié)果的混淆矩陣Fig.6 Confusion matrix of fault diagnosis results
圖7 平均故障診斷準(zhǔn)確率和召回率(訓(xùn)練階段取100個(gè)故障樣本)Fig.7 Average fault diagnosis accuracy and recall(take 100 fault samples in the training stage)
圖6(a)為冷水機(jī)組故障嚴(yán)重程度為L(zhǎng)evel 1時(shí)故障診斷結(jié)果的混淆矩陣,在八種類別上已經(jīng)達(dá)到94.02%的平均準(zhǔn)確率和94.03%的平均召回率??梢钥闯鲈谥评鋭┬孤?、制冷劑填充過(guò)量、潤(rùn)滑油過(guò)量三種系統(tǒng)性故障之間發(fā)生的錯(cuò)誤診斷現(xiàn)象依舊存在,但是相較于圖4(a)有明顯改善。與實(shí)驗(yàn)一相同,測(cè)試數(shù)據(jù)集包括每類故障500 個(gè)樣本和正常狀態(tài)500 個(gè)樣本,共有4000 個(gè)樣本。制冷劑泄漏故障的500 個(gè)測(cè)試樣本,其中有25 個(gè)樣本被錯(cuò)誤診斷為制冷劑過(guò)量,65 個(gè)樣本被錯(cuò)誤診斷為潤(rùn)滑油過(guò)多,4個(gè)樣本被錯(cuò)誤診斷為冷凝劑中存在非冷凝物,3個(gè)樣本被錯(cuò)誤診斷為無(wú)故障。制冷劑過(guò)量故障的500 個(gè)測(cè)試樣本,其中有23 個(gè)樣本被錯(cuò)誤診斷為制冷劑泄漏,16個(gè)樣本被錯(cuò)誤診斷為潤(rùn)滑油過(guò)多,1個(gè)樣本被錯(cuò)誤診斷為冷凝劑中存在非冷凝物,3 個(gè)樣本被錯(cuò)誤診斷為無(wú)故障。潤(rùn)滑油過(guò)多故障的500個(gè)測(cè)試樣本,其中有58個(gè)樣本被錯(cuò)誤診斷為制冷劑泄漏,16個(gè)樣本被錯(cuò)誤診斷為制冷劑過(guò)量,1個(gè)樣本被錯(cuò)誤診斷為冷凝劑中存在非冷凝物,1 個(gè)樣本被錯(cuò)誤診斷為無(wú)故障。
圖6(b)、(c)、(d)分別是冷水機(jī)組故障嚴(yán)重程度為L(zhǎng)evel 2、Level 3、Level 4 時(shí)故障診斷結(jié)果的混淆矩陣,故障診斷平均準(zhǔn)確率分別是97.37%、98.70%和99.14%,平均召回率分別是97.30%、98.68% 和99.13%,均已達(dá)到較高的診斷精度。通過(guò)對(duì)圖5 與圖7 的結(jié)果進(jìn)行對(duì)比,表明故障診斷精度和訓(xùn)練階段故障樣本的數(shù)目正相關(guān)。
綜上所述,模型訓(xùn)練階段故障樣本數(shù)目的增加和故障嚴(yán)重等級(jí)的增加對(duì)最終的故障診斷精度都有提高作用。
首先為了驗(yàn)證本文方法中判別器的權(quán)重系數(shù)α的取值對(duì)結(jié)果的影響,選取不同的α值進(jìn)行數(shù)據(jù)生成并利用生成數(shù)據(jù)進(jìn)行故障診斷,通過(guò)對(duì)不同α值的診斷結(jié)果進(jìn)行對(duì)比。在故障嚴(yán)重程度為L(zhǎng)evel 1時(shí),不同取值下的對(duì)比結(jié)果如圖8 所示。可以看出在α<0.30 的范圍內(nèi)故障診斷的準(zhǔn)確率是一個(gè)遞增的過(guò)程,隨著α取值的不斷增大,在α=0.30 時(shí),準(zhǔn)確率達(dá)到最大值,因此在本文方法中的判別器的權(quán)重系數(shù)取值為0.30。
圖8 不同權(quán)重系數(shù)下的準(zhǔn)確率(故障嚴(yán)重程度:Level 1)Fig.8 Accuracy under different values of weight coefficient(fault severity:Level 1)
為了驗(yàn)證所提方法的有效性,在對(duì)比實(shí)驗(yàn)部分選取多個(gè)對(duì)比方法,每個(gè)方法的實(shí)驗(yàn)設(shè)置相同,在模型的訓(xùn)練階段每個(gè)故障類型選取50個(gè)樣本。具體的對(duì) 比 方 法 有:SVM、GAN-SVM、CWGAN-SVM[17]、CWGAN-VAE-RF[18]和CWGAN-VAE-SVM[18]。
表4為各故障嚴(yán)重程度下用各方法進(jìn)行冷水機(jī)組故障診斷的總體準(zhǔn)確率。從表4 可以看出,所提方法CLCGAN-SVM 在冷水機(jī)組的故障嚴(yán)重程度為L(zhǎng)evel 1、Level 2、Level 3 和Level 4 時(shí)的總體故障診斷準(zhǔn)確率都是最高的,分別是92.48%、96.65%、99.03%和98.70%。診斷準(zhǔn)確率在故障嚴(yán)重程度為L(zhǎng)evel 3 時(shí)達(dá)到最高值99.03%,比沒(méi)有生成模型的SVM 診斷方法的準(zhǔn)確率高10.32%,比有經(jīng)典GAN模型的GAN-SVM 診斷方法的準(zhǔn)確率高1.38%,在故障嚴(yán)重程度為L(zhǎng)evel 1時(shí)取得最低值92.48%,比沒(méi)有生成模型的SVM診斷方法的準(zhǔn)確率高42.77%,比有經(jīng)典GAN 模型的GAN-SVM 診斷方法的準(zhǔn)確率高3.13%。在故障的診斷時(shí)間上,GAN-SVM 方法比僅采用SVM方法多709.97 ms,但是在各故障嚴(yán)重程度下的總體故障診斷準(zhǔn)確率獲得了較大的提高,分別提高了39.64%、19.55%、8.94%和0.58%,而本文所提的方法僅比GAN-SVM方法的時(shí)間多了117.68 ms,比固定中心損失的CLCGAN-SVM 方法多了61.68 ms,卻在故障診斷準(zhǔn)確率上又獲得了進(jìn)一步的提高,因此本文所提方法在故障診斷上更有優(yōu)勢(shì)。
表4 對(duì)比實(shí)驗(yàn)Table 4 Contrast experiment
對(duì)比實(shí)驗(yàn)結(jié)果表明,在故障樣本不足情況下,本文所提方法可以有效提升故障診斷的精度,并且相較于其他方法,本文所提方法具有更高的故障診斷準(zhǔn)確率。本文的故障診斷方法與傳統(tǒng)的故障診斷方法不同之處在于進(jìn)行故障診斷之前有數(shù)據(jù)生成的步驟,數(shù)據(jù)生成模型CLCGAN 根據(jù)少量的故障數(shù)據(jù)生成充足的模擬故障數(shù)據(jù),并用生成的故障數(shù)據(jù)訓(xùn)練故障診斷的分類器,可以解決實(shí)際應(yīng)用中冷水機(jī)組歷史故障數(shù)據(jù)不足導(dǎo)致的診斷精度下降的問(wèn)題。
(1)實(shí)驗(yàn)結(jié)果表明,在冷水機(jī)組歷史故障數(shù)據(jù)不足的前提下,CLCGAN 可以利用冷水機(jī)組少量的歷史故障數(shù)據(jù)生成相同運(yùn)行環(huán)境下的模擬故障數(shù)據(jù),通過(guò)生成的故障數(shù)據(jù)訓(xùn)練分類器,從而達(dá)到提高故障診斷準(zhǔn)確率的作用。
(2)隨著生成模型CLCGAN 在訓(xùn)練階段使用的故障數(shù)據(jù)的增加,最終故障診斷的準(zhǔn)確率也會(huì)增加。
(3)在ASHRAE 1043-RP 項(xiàng)目的數(shù)據(jù)集上,通過(guò)與其他的先進(jìn)研究相比較,CLCGAN-SVM 故障診斷方法在4個(gè)故障嚴(yán)重程度下均可以取得較高的故障診斷準(zhǔn)確率。
本工作雖然可以在歷史故障數(shù)據(jù)不足的情況下取得不錯(cuò)的故障診斷準(zhǔn)確率,但是故障嚴(yán)重程度較低時(shí),系統(tǒng)性故障之間容易發(fā)生錯(cuò)誤的診斷。之后的工作重點(diǎn)在于,解決冷水機(jī)組在歷史故障數(shù)據(jù)不足的前提下,故障嚴(yán)重程度較低(微小故障)時(shí)各系統(tǒng)性故障之間的錯(cuò)誤診斷的問(wèn)題。