張文嘯, 孟國(guó)香, 葉 騫
(1.上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院, 上海 200240;2.中國(guó)科學(xué)院上海天文臺(tái)射電天文科學(xué)與技術(shù)研究室, 上海 200030)
隨著工業(yè)化水平不斷進(jìn)步,人們對(duì)自動(dòng)控制系統(tǒng)的需求也在不斷增大。在所有自動(dòng)控制系統(tǒng)中,以流體作為介質(zhì)的電氣、電液控制占據(jù)了很大比例,而電磁閥作為電氣、電液控制系統(tǒng)中重要的執(zhí)行器,也受到了業(yè)內(nèi)學(xué)者的廣泛研究。
經(jīng)過(guò)幾十年的發(fā)展,電磁閥以其成本較低、結(jié)構(gòu)簡(jiǎn)單、工作狀態(tài)較穩(wěn)定、退化周期較長(zhǎng)等優(yōu)點(diǎn)被廣泛應(yīng)用于電網(wǎng)設(shè)備、車輛船舶、醫(yī)療器械等自動(dòng)控制領(lǐng)域。正因?yàn)殡姶砰y在越來(lái)越多的控制系統(tǒng)中成為關(guān)鍵甚至核心部件,其故障的檢出、診斷和處理成為學(xué)者們重點(diǎn)研究議題。隨著眾多研究的不斷深入和工業(yè)領(lǐng)域內(nèi)自動(dòng)化程度的不斷提高,對(duì)于電磁閥的故障診斷也逐漸由依賴于簡(jiǎn)單的測(cè)量?jī)x器和專家知識(shí)的經(jīng)驗(yàn)性診斷,轉(zhuǎn)向了基于精密傳感器和計(jì)算機(jī)的智能診斷。范超[1]、項(xiàng)超鵬[2]提出通過(guò)采集電磁閥驅(qū)動(dòng)端電流,并提取了小波包變換后的各層小波包系數(shù)作為特征向量,用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建故障檢測(cè)模型的診斷方法。譚洋波等[3]通過(guò)對(duì)電磁閥工作電流信號(hào)進(jìn)行EMD分解,建立了決策樹判別模型,診斷準(zhǔn)確率達(dá)到98%以上。
彭軍等[4]通過(guò)采集電磁閥驅(qū)動(dòng)端電流并提取啟動(dòng)電流的響應(yīng)時(shí)間、穩(wěn)定時(shí)間、局部最大值、局部最大值積分等特征,組成特征向量并輸入多層感知機(jī)進(jìn)行訓(xùn)練,得到具有較高識(shí)別率的故障診斷模型。
以上智能診斷方法雖然均對(duì)于電磁閥有較好的診斷效果,但診斷模型的建立都需要首先對(duì)采集得到的信號(hào)進(jìn)行特征提取,這就要求使用者需要具有一定的先驗(yàn)知識(shí)。此外,不同的特征提取方式可能對(duì)模型的識(shí)別效果有不同的影響,對(duì)于不同型號(hào)、類型的電磁閥,最佳的特征提取方式也會(huì)有所不同。這些因素都限制了上述方法的普適性。
針對(duì)這個(gè)問(wèn)題,近年來(lái)在工業(yè)設(shè)備領(lǐng)域,關(guān)于“端對(duì)端”故障診斷的研究逐漸增多。尹愛(ài)軍等[5]對(duì)滾動(dòng)軸承的振動(dòng)信號(hào)進(jìn)行FFT變換后,輸入變分自動(dòng)編碼器,建立了無(wú)需手動(dòng)提取特征的軸承健康狀態(tài)評(píng)估模型。張祥等[6]針對(duì)TE過(guò)程數(shù)據(jù)集,構(gòu)建了基于變分自動(dòng)編碼器-深度置信網(wǎng)絡(luò)(VAE-DBN)的端對(duì)端故障診斷模型。據(jù)這些工作的啟發(fā),本研究首先提出了一種基于變分自動(dòng)編碼器(VAE)的端對(duì)端電磁閥故障診斷模型,并利用三元組損失(Triplets loss)對(duì)模型進(jìn)行了改進(jìn),使得模型對(duì)不同工作頻率下的電磁閥具有更好的故障診斷泛化能力。
電磁閥的種類較多,最常見的分類方式之一是按照工作原理,將電磁閥分為直動(dòng)式、先導(dǎo)式以及分步直動(dòng)式。其中,先導(dǎo)式電磁閥的工作原理可以簡(jiǎn)要描述為:通電后電磁力作用使閥桿提起,導(dǎo)閥口打開,從而使電磁閥上腔通過(guò)先導(dǎo)孔泄壓,在主閥芯前后形成壓力差,依靠此壓力差來(lái)推動(dòng)主閥芯,使主閥口打開;斷電后,在彈簧力作用下,閥桿復(fù)位,先導(dǎo)孔關(guān)閉,主閥芯向下移動(dòng)從而使主閥口關(guān)閉,電磁閥上腔壓力重新升高,流體壓力施加在主閥芯上,從而使密封效果更好。
本研究的對(duì)象為某公司的二位五通先導(dǎo)式電磁閥,其外觀如圖1所示,圖2為其原理圖。
圖1 二位五通先導(dǎo)閥外觀Fig.1 Appearance of 5/2-way pilot valve
為了研究基于數(shù)據(jù)驅(qū)動(dòng)的電磁閥故障診斷模型,首先需要對(duì)電磁閥的常見故障進(jìn)行分析,并采集相應(yīng)的數(shù)據(jù)。電磁閥的常見故障主要有不能關(guān)閉、響應(yīng)遲緩、流量小和有異響[7]。其中不能關(guān)閉是最為嚴(yán)重的故障,常常會(huì)導(dǎo)致整個(gè)控制系統(tǒng)完全失效,產(chǎn)生難以估量的經(jīng)濟(jì)損失。因此,基于故障易發(fā)程度和人為模擬難易程度,選擇故障表現(xiàn)為“不能關(guān)閉”下的“閥芯被異物卡塞”和“密封件損壞”兩種故障原因,進(jìn)行故障模擬和數(shù)據(jù)采集,如表1所示[7]。
表1 模擬電磁閥故障工況選擇Tab.1 Simulation of valve failure condition
對(duì)于“閥芯被異物卡塞”工況,模擬方式如圖3所示,拆開閥體和端板后,在閥芯端部與端板的空隙處放置大小合適的鋁制金屬塊,而后再將閥體和端板重新裝配。
圖3 閥芯卡塞工況模擬方式Fig.3 Simulation method of stuck condition
對(duì)于“密封件損壞”工況,模擬方式如圖4所示,拆卸開閥體和底板后,將其中的密封墊取出,而后再將閥體和底板重新裝配。
圖4 密封件損壞工況模擬方式Fig.4 Simulation method of seal failure condition
在信號(hào)選取上,除前述研究中多用到的驅(qū)動(dòng)端電流信號(hào)外,還增加了2個(gè)通道的信號(hào),分別是閥前進(jìn)氣口處的氣壓信號(hào)和線圈附近的磁場(chǎng)強(qiáng)度信號(hào)。前者使用壓力變送器,將氣壓值轉(zhuǎn)換為0~5 V電壓值進(jìn)行輸出;后者使用線性霍爾元件,將磁場(chǎng)強(qiáng)度轉(zhuǎn)換為0~5 V 電壓值進(jìn)行輸出。將驅(qū)動(dòng)端電流、進(jìn)氣口氣壓、磁場(chǎng)強(qiáng)度這3路信號(hào)均轉(zhuǎn)換為0~5 V電壓值后,再通過(guò)數(shù)模轉(zhuǎn)換電路ADS1115轉(zhuǎn)換為數(shù)字量,用樹莓派進(jìn)行采集。圖5是本研究所用到的數(shù)據(jù)采集臺(tái)。
1.電磁閥 2.數(shù)模轉(zhuǎn)換芯片 3.氣路負(fù)載(氣爪) 4.繼電器5.樹莓派 6.220V-24V電源 7.壓力變送器圖5 數(shù)據(jù)采集臺(tái)Fig.5 Data collection test bench
分別在3種工況下采集數(shù)據(jù),3種工況分別為:正常(電磁閥健康)工況、閥芯卡塞工況和密封件損壞工況。為了后續(xù)章節(jié)所構(gòu)建的模型有更好的泛化能力,對(duì)每種工況又分別在工作氣壓為0.1, 0.2, 0.3 MPa下,工作頻率在0.5, 1, 2 Hz下采集數(shù)據(jù),對(duì)每種工況的數(shù)據(jù)采集量如表2所示,即每種工況共采集18 h數(shù)據(jù),3種工況合計(jì)54 h數(shù)據(jù)。受限于ADS1115的性能,多通道同時(shí)采集時(shí),采樣頻率設(shè)置為16 Hz,在電磁閥的工作頻率不超過(guò)2 Hz的情況下可以確保信號(hào)不失真。
表2 單一工況數(shù)據(jù)采集量Tab.2 Amount of data collected in a single working condition
在采集完數(shù)據(jù)后,還需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以及整理為數(shù)據(jù)集,以便于后續(xù)章節(jié)診斷模型的建立。如圖6a為進(jìn)行預(yù)處理前的三通道信號(hào),單位為V??梢钥闯觯芟抻趥鞲衅髻|(zhì)量,在采集過(guò)程中不可避免的有一些異常值。采用IQR準(zhǔn)則[8]剔除異常值,處理后的數(shù)據(jù)如圖6b所示。
圖6 去除異常值前后信號(hào)對(duì)比Fig.6 Comparison of signals before and after outlier removal
接著需要將全部數(shù)據(jù)整理成帶標(biāo)簽的數(shù)據(jù)集。為了驗(yàn)證后續(xù)章節(jié)提出的故障診斷模型對(duì)處于不同工作頻率的電磁閥的故障檢測(cè)的泛化能力,訓(xùn)練集和測(cè)試集涵蓋不同的工作頻率的數(shù)據(jù)。具體而言,訓(xùn)練集中包含健康、閥芯卡塞、密封件損壞3種工況,但僅選取了0.5 Hz和2 Hz工作頻率下的數(shù)據(jù);測(cè)試集中包含健康、閥芯卡塞、密封件損壞3種工況,選取了0.5, 1, 2 Hz工作頻率下的數(shù)據(jù)。
在數(shù)據(jù)的切分上,以20 s為長(zhǎng)度,將數(shù)據(jù)切分為片段樣本。由于采樣頻率為16 Hz,則每個(gè)樣本有3個(gè)通道,長(zhǎng)度為320。在標(biāo)簽的設(shè)置上,將健康、閥芯卡塞、密封件損壞3種工況的標(biāo)簽分別設(shè)置為0,1和2。數(shù)據(jù)集全部整理完畢后得到的訓(xùn)練集大小為(5018,320,3),測(cè)試集大小為(5099,320,3)。
變分自動(dòng)編碼器(Variational Auto Encoder,VAE)是一種生成模型,從傳統(tǒng)的自動(dòng)編碼器(Auto Encoder,AE)演變改進(jìn)而來(lái)[6]。
AE的概念是在1986年有Rumelhart提出的,起初主要被應(yīng)用于高維數(shù)據(jù)的降維處理,其主要結(jié)構(gòu)可以用圖7表示。
圖7 自動(dòng)編碼器(AE)結(jié)構(gòu)示意圖Fig.7 Schematic of Auto Encoder (AE)
從AE的結(jié)構(gòu)圖可以看出,AE的目的是通過(guò)盡可能降低重構(gòu)誤差,從而使輸出的重構(gòu)信號(hào)最接近于原始信號(hào)[9],這時(shí)隱層編碼空間所提取出的特征是最能夠表征原信號(hào)的。
AE可以用以下公式進(jìn)行描述:
h=en(x)=sen(wenx+ben)
(1)
(2)
(3)
而VAE相較于AE,最重要的區(qū)別是假設(shè)潛在變量h的后驗(yàn)分布服從獨(dú)立的多元高斯分布。因此編碼器不再直接生成潛在變量,而是先生成一組潛在變量所屬的高斯分布的均值和方差,然后經(jīng)過(guò)隨機(jī)采樣,在這些分布中取得一組潛在變量h作為解碼器的輸入。這樣做的目的是在解碼前向潛在變量中加入了噪聲,從而使整個(gè)網(wǎng)絡(luò)魯棒性更好,能夠提取出類似于訓(xùn)練樣本信號(hào),但不完全相同的新信號(hào)的特征,VAE的主要結(jié)構(gòu)如圖8所示。
圖8 變分自動(dòng)編碼器(VAE)結(jié)構(gòu)示意圖Fig.8 Schematic of Variational Auto Encoder (VAE)
VAE可以用以下公式進(jìn)行描述:
μ=en(x)=sen(wenx+ben)
(4)
logσ2=en(x)=sen(wenx+ben)
(5)
h=μ+ε×σ
(6)
KL(N(μ,σ2)‖N(0,1))
(7)
式(4)、式(5)中表示編碼器現(xiàn)在并非直接生成潛在變量,而是生成一組均值和方差。其中μ和σ2分別是潛在變量所屬的一組高斯分布的均值和方差。之所以選擇logσ2作為編碼器的輸出,是因?yàn)棣?總是非負(fù)的,要使網(wǎng)絡(luò)擬合σ2就必須加激活函數(shù)進(jìn)行處理,而logσ2可正可負(fù),省去了這一步驟。式(6)是1個(gè)重參數(shù)技巧,它的作用是將在潛在變量所屬的分布中采樣得到潛在變量的這一“采樣”過(guò)程變得可導(dǎo),從而能夠進(jìn)行梯度下降求最優(yōu)化。具體而言,因?yàn)槿绻苯訌腘(μ,σ2)的分布中采樣,那么“采樣”的過(guò)程本身是無(wú)法求導(dǎo)的,那么自然也無(wú)法進(jìn)行誤差傳遞。但從1個(gè)N(μ,σ2)中采樣1個(gè)潛在變量h,是等價(jià)于從N(0,1)中采樣1個(gè)ε,并通過(guò)式(6)計(jì)算得到潛在變量h的,這樣一來(lái)通過(guò)式(6)就可以進(jìn)行梯度下降了。式(7)是VAE的損失函數(shù),相比較于式(3)AE的損失函數(shù),區(qū)別主要在與增加了1項(xiàng)KL(N(μ,σ2)‖N(0,1))。這一項(xiàng)衡量潛在變量所屬分布與標(biāo)準(zhǔn)正態(tài)分布之間的KL散度,即相似程度,目的是使所有的潛在變量分布都向標(biāo)準(zhǔn)正態(tài)分布看齊,避免訓(xùn)練過(guò)程中σ2趨近于0,VAE向AE退化。
由于樣本是3通道的一維時(shí)間序列,所以編碼器和解碼器的基本結(jié)構(gòu)采用了一維卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的結(jié)構(gòu)如圖9所示。圖中的圓圈序號(hào)代表網(wǎng)絡(luò)中的“層”;方框代表在“層”之間傳遞的數(shù)據(jù),即張量;方框中的數(shù)字表示張量的尺寸。
圖9 VAE故障診斷模型結(jié)構(gòu)示意圖Fig.9 Schematic of VAE based fault diagnosis model
其中①~⑦層構(gòu)成了編碼器:①~④層為一維卷積層,⑤層和⑨層為展平操作,⑥層和⑦層為全連接層,輸出分別為式(4)和式(5)中的均值和方差;⑧層為式(6)所對(duì)應(yīng)的重參數(shù)采樣操作;⑩~層構(gòu)成了解碼器:⑩層為變形層,~層為反卷積層;層為以隱層均值向量作為輸入,以分類結(jié)果作為輸出的一個(gè)多層感知機(jī)分類器,作用是根據(jù)提取出的隱層特征,對(duì)樣本進(jìn)行分類預(yù)測(cè),再將預(yù)測(cè)標(biāo)簽與樣本真實(shí)標(biāo)簽組合計(jì)算損失,將此損失定義為分類損失,即圖中的Cat-Loss。
因此,該VAE故障診斷模型的總損失誤差除了由式(7)定義的重構(gòu)誤差和KL損失外,還增加了下式的分類誤差:
Losscat=cross_entropy(y,ypred)
(8)
ypred=cat(μ)=scat(wcatμ+bcat)
(9)
式(8)為真實(shí)標(biāo)簽和預(yù)測(cè)標(biāo)簽的交叉熵;式(9)表明預(yù)測(cè)標(biāo)簽來(lái)自于分類器cat(·),其中scat是分類器激活函數(shù)的集合,wcat是分類器中神經(jīng)元權(quán)重的集合,bcat是分類器中神經(jīng)元偏置的集合。
該模型的總誤差為:
Lossall=Lossrecon+LossKL+Losscat
(10)
其中Lossrecon和LossKL由式(7)定義,Losscat由式(8)定義。
本研究的模型搭建均在TensorFlow平臺(tái)上完成。模型的訓(xùn)練均在如下設(shè)備上進(jìn)行:CPU:Intel(R) Core(TM) i7-8700 CPU @ 3.20 GHz,3.19 GHz;GPU:NVIDIA GeForce GTX 1660;RAM:8G。
為了通過(guò)對(duì)比體現(xiàn)出該VAE模型在故障檢測(cè)任務(wù)中性能的提升,本研究選擇的對(duì)照模型是通過(guò)先手動(dòng)對(duì)數(shù)據(jù)集進(jìn)行特征提取,再搭建BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行訓(xùn)練得到的模型[1-2],下面稱為小波包特征模型。特征提取的方法為對(duì)三通道信號(hào)分別進(jìn)行小波包分解,提取各層小波包系數(shù)作為特征向量。對(duì)每個(gè)通道的信號(hào)進(jìn)行4層小波包分解[1],得到長(zhǎng)度為16的特征向量,故每個(gè)樣本可提取出長(zhǎng)度為48的特征向量。
如圖10所示為進(jìn)行特征提取后,通過(guò)t-SNE方法對(duì)測(cè)試集樣本進(jìn)行降維的聚類圖。圖例所示為樣本的真實(shí)標(biāo)簽,0,1,2分別代表健康、閥芯卡塞和密封件損壞??梢钥闯?,通過(guò)小波包分解提取出的特征向量比較難以直接將不同工況下的樣本區(qū)分開。而如圖11所示為VAE模型進(jìn)行特征提取后,在隱層空間中對(duì)樣本的特征進(jìn)行t-SNE降維聚類圖,相比于圖10,VAE模型提取出的特征則能較好的區(qū)分不同工況。然而因?yàn)榍笆稣鹿?jié)提到,同一工況的數(shù)據(jù)是在不同的子工況,即不同氣壓、不同工作頻率下采集的,因此可以看到,VAE模型提取出的特征將這些子工況也被聚在了不同的簇。
圖10 小波包能量特征降維聚類圖Fig.10 Dimensionality reduction clustering diagram with wavelet packet energy as feature
圖11 VAE模型隱層特征降維聚類圖Fig.11 Dimensionality reduction clustering diagram with VAE model
可以預(yù)見的是,這樣的模型對(duì)于新的工作頻率或新的工作氣壓下采集的樣本的泛化能力將會(huì)較差。如果能使模型在提取特征時(shí)忽略不同子工況之間的差異,即在特征降維聚類圖中將同一工況的樣本盡可能聚在一起,將不同工況的樣本盡可能分開,則模型會(huì)具有更好的泛化能力。接下來(lái)將會(huì)優(yōu)化模型,對(duì)這一設(shè)想進(jìn)行驗(yàn)證。
如圖12所示是小波包特征模型和VAE模型對(duì)于不含及含有新頻率樣本的測(cè)試集的準(zhǔn)確率對(duì)比。對(duì)于不含有新頻率樣本的測(cè)試集的3種工況,VAE模型的準(zhǔn)確率均高于小波包特征模型。其中對(duì)于健康工況,準(zhǔn)確率由86.0%提升至95.1%;對(duì)于密封件損壞工況,由74.3%提升至98.4%;對(duì)于閥芯卡塞工況,由96.1%提升至98.9%。這說(shuō)明本研究提出的VAE模型對(duì)于電磁閥故障檢測(cè)問(wèn)題,能夠自動(dòng)提取出信號(hào)中更具有區(qū)分能力的特征,然后利用特征進(jìn)行故障檢測(cè)。這相較于先對(duì)電磁閥工作信號(hào)進(jìn)行手動(dòng)特征提取,再構(gòu)建故障檢測(cè)模型的方式,在便捷性、自動(dòng)化程度識(shí)別準(zhǔn)確率上都有明顯的提升。
圖12 小波包特征模型和VAE模型對(duì)試集準(zhǔn)確率對(duì)比Fig.12 Comparison of accuracy of wavelet packet feature model and VAE model on test sets
但是,同時(shí)也容易看出該VAE模型對(duì)于含有新頻率樣本的測(cè)試集的準(zhǔn)確率比較低。
Triplet意為三元組,這樣命名的原因是對(duì)于訓(xùn)練中的一個(gè)batch(以下稱為批次),需要將所有樣本劃分為3個(gè)一組的三元組,計(jì)算每個(gè)三元組的損失,然后求和[11]。圖13所示是Triplet loss(以下稱為三元組損失)的訓(xùn)練目標(biāo)。每一個(gè)三元組的構(gòu)成如下:從訓(xùn)練數(shù)據(jù)集中隨機(jī)選1個(gè)樣本,該樣本稱為 Anchor,即錨樣本,然后再隨機(jī)選取1個(gè)和錨樣本屬于同一類的樣本和不同類的樣本,這2個(gè)樣本對(duì)應(yīng)的稱為 Positive和 Negative,即正樣本和負(fù)樣本,由此構(gòu)成1個(gè)(錨樣本,正樣本,負(fù)樣本)三元組。三元組損失的目的就是通過(guò)學(xué)習(xí),讓同類樣本的特征表達(dá)間距盡可能小,而異類樣本的特征表達(dá)間距盡可能大。
圖13 Triplet loss訓(xùn)練目標(biāo)示意圖Fig.13 Schematic diagram of Triplet loss training target
三元組損失的計(jì)算公式為:
Losstri=max{d[f(a),f(p)]-d[f(a),f(n)]+
margin,0}
(11)
其中f(·)代表編碼器網(wǎng)絡(luò),在本研究中,即式(1)中的en(·);d[·]代表距離計(jì)算函數(shù)。f(a),f(p)和f(n)就表示3種樣本在隱層空間中的表示。
在1個(gè)批次中,首先需要生成所有三元組,然后篩選出有效的三元組,用這些有效的三元組計(jì)算損失,然后進(jìn)行誤差反向傳播,梯度下降訓(xùn)練模型。之所以不是所有的三元組都有效,是因?yàn)樵诿總€(gè)批次中的所有三元組中,三元組的性質(zhì)存在這些可能:
(1) Easy Triplets,滿足:
d[f(a),f(p)]+margin (12) 即負(fù)樣本與錨樣本的距離已經(jīng)大于正樣本與錨樣本的距離,且滿足間隔裕量margin。此時(shí)損失L為 0。這種三元組(Triplet)是不需要訓(xùn)練的,因?yàn)樗膿p失已經(jīng)為0,將它加入整個(gè)批次的損失函數(shù)中對(duì)訓(xùn)練的方向沒(méi)有幫助。 (2) Hard Triplets,滿足: d[f(a),f(p)]>d[f(a),f(n)] (13) 即負(fù)樣本與錨樣本的距離小于正樣本與錨樣本的距離。此時(shí)損失大于margin。這種三元組和下面的Semi-Hard Triplets都是有效的,但是具體使用哪一種則可以根據(jù)具體任務(wù)選擇。 (3) Semi-Hard Triplets,滿足: d[f(a),f(p)] (14) 即負(fù)樣本與錨樣本的距離雖然大于正樣本與錨樣本的距離,但是還不滿足間隔裕量margin。此時(shí)損失小于margin但大于0。 圖14直觀地展示了3種三元組的分布。圖中A和P分別代表錨樣本樣本和正樣本,根據(jù)負(fù)樣本和前兩者的距離關(guān)系,三元組被分為不同的類別。本研究提出的改進(jìn)模型中,對(duì)每個(gè)batch中的每個(gè)樣本,只選取Hard Triplets和Semi-Hard Triplets進(jìn)行三元組損失的計(jì)算。 圖14 三種三元組的分布Fig.14 Distribution of three kinds of triples 基于三元組損失的改進(jìn)模型結(jié)構(gòu)圖如圖15所示。和圖9所示模型結(jié)構(gòu)相比,主要區(qū)別在與在圓圈序號(hào)17處增加了一個(gè)自定義層,用于通過(guò)隱層特征計(jì)算每一個(gè)樣本批次的三元組損失。這個(gè)新增的層在圖15中用虛線框做以標(biāo)記。 圖15 基于Triplet loss的改進(jìn)模型結(jié)構(gòu)圖Fig.15 Schematic of improved model based on Triplet loss 此時(shí)的模型訓(xùn)練將分為兩個(gè)步驟: Lossall=Lossrecon+LossKL+Losstri (15) 步驟一的目的在于通過(guò)最小化上述損失,使模型能夠提取出既能夠表征原信號(hào),又能將同一類別(健康、閥芯卡塞或密封件損壞)的樣本聚為一類,將不同類別的樣本區(qū)分開的隱層特征。 步驟二:固定除了分類器之外的編碼器、解碼器的權(quán)重和偏置,只訓(xùn)練分類器的權(quán)重和偏置。這時(shí)候的目標(biāo)函數(shù)僅為分類器的分類誤差: Lossall=Losscat (16) 當(dāng)兩個(gè)步驟訓(xùn)練完成后,整個(gè)模型也就訓(xùn)練完成了。 如圖16所示是使用訓(xùn)練好的改進(jìn)模型對(duì)測(cè)試集樣本進(jìn)行特征提取后,對(duì)隱層特征使用t-SNE降維后的聚類圖??梢钥吹?,相較于圖11所示的VAE模型的特征提取效果,改進(jìn)模型在特征提取上能夠很好地將同一工況的樣本聚為一簇,忽略其中各子工況之間的差別。 圖16 改進(jìn)模型隱層特征降維聚類圖Fig.16 Dimensionality reduction clustering diagram with improved model 如圖17所示是小波包特征模型、VAE模型以及改進(jìn)模型,對(duì)于不含及含有新頻率樣本的測(cè)試集的準(zhǔn)確率對(duì)比??梢钥吹?,因?yàn)閂AE模型本身已經(jīng)對(duì)舊頻部分準(zhǔn)確率較高,所以改進(jìn)模型在僅含有舊頻樣本的測(cè)試集上準(zhǔn)確率只有較小的提升;而在測(cè)試集的新頻部分,改進(jìn)模型的提升則非常明顯,對(duì)3種工況都達(dá)到了90%以上的準(zhǔn)確率,其中對(duì)于健康工況,準(zhǔn)確率由VAE模型的66.1%提升至99.4%; 對(duì)于密封件損壞工況率由91.1%提升至99.0%; 對(duì)于閥芯卡塞工況,準(zhǔn)確率由66.5%提升至91.3%。這表明了改進(jìn)模型很好地解決了前述章節(jié)提出的VAE模型對(duì)于新的工作頻率下采集的信號(hào)識(shí)別準(zhǔn)確率低的問(wèn)題,提升了模型的泛化能力。 圖17 小波包特征模型、VAE模型和改進(jìn)模型對(duì)測(cè)試集準(zhǔn)確率對(duì)比Fig.17 Comparison of accuracy of wavelet packet feature model, VAE model and improved model on test sets 概括地來(lái)說(shuō),加入了三元組損失的模型之所以能夠?qū)τ?xùn)練集中沒(méi)有的新的工作頻率樣本有更高的識(shí)別準(zhǔn)確率,是因?yàn)闊o(wú)論是改進(jìn)前還是改進(jìn)后的模型,其最重要的部分都是一個(gè)有監(jiān)督的,用于提取特征的網(wǎng)絡(luò)。而改進(jìn)后的模型相較于改進(jìn)前,在三元組損失的作用下,網(wǎng)絡(luò)在提取特征時(shí)趨于弱化同工況下不同子類(即不同的工作頻率)之間的差異、強(qiáng)化不同工況之間的差異。這在圖11和圖16的對(duì)比中可以明顯體現(xiàn)。 當(dāng)訓(xùn)練后的網(wǎng)絡(luò)可以幾乎忽視不同子類之間的差異信息而對(duì)樣本進(jìn)行特征提取時(shí),網(wǎng)絡(luò)就可以只利用和工況相關(guān)的信息對(duì)樣本進(jìn)行模式識(shí)別。此時(shí)使用訓(xùn)練集中沒(méi)有的新的工作頻率下采集的測(cè)試集對(duì)網(wǎng)絡(luò)進(jìn)行測(cè)試,就可以獲得很高的準(zhǔn)確率。而從隱藏層特征聚類的角度來(lái)看,即新工作頻率的測(cè)試樣本在圖16所示的隱層特征降維聚類時(shí),因?yàn)楹凸ぷ黝l率相關(guān)的信息在特征提取過(guò)程中已經(jīng)被網(wǎng)絡(luò)忽略,只保留了和工況相關(guān)的信息,從而仍然可以和已知的同工況樣本聚在一起,因此能夠準(zhǔn)確地進(jìn)行模式識(shí)別。 針對(duì)電磁閥故障識(shí)別對(duì)專家知識(shí)依賴過(guò)高的問(wèn)題,以某型號(hào)電磁閥為研究對(duì)象,采集了數(shù)據(jù)集,構(gòu)建了基于VAE的端對(duì)端故障檢測(cè)模型,與傳統(tǒng)故障檢測(cè)模型對(duì)比有較好的性能提升。針對(duì)所提出VAE模型的泛化能力較差的問(wèn)題,基于三元組損失對(duì)模型進(jìn)行了改進(jìn)。實(shí)驗(yàn)表明,經(jīng)過(guò)改進(jìn)的模型的泛化能力得到了很好的提升,對(duì)于訓(xùn)練中未見過(guò)的工作頻率下采集的信號(hào)也具有很高的識(shí)別準(zhǔn)確率。最后,由于實(shí)驗(yàn)對(duì)象型號(hào)的電磁閥的真實(shí)故障樣本較難獲取,本研究在信號(hào)采集方面參考了目前電磁閥故障診斷常用的故障模擬方法[1,3],在本研究的研究主題下,認(rèn)為這種故障模擬方式和信號(hào)采集方式能夠在一定程度上反映真實(shí)故障工況,是合理的。同時(shí),將本模型針對(duì)真實(shí)發(fā)生故障的電磁閥進(jìn)行模型訓(xùn)練、改進(jìn)和驗(yàn)證,是本研究未來(lái)的工作中的一大重點(diǎn)。3.2 模型結(jié)構(gòu)
3.3 模型訓(xùn)練集測(cè)試結(jié)果對(duì)比
4 結(jié)論