郭小萍,李志遠(yuǎn),李 元
(沈陽化工大學(xué) 信息工程學(xué)院,沈陽 110142)
隨著現(xiàn)代工業(yè)過程生產(chǎn)規(guī)模的不斷擴(kuò)大以及生產(chǎn)過程復(fù)雜性的不斷提高,為了保證整個生產(chǎn)過程的安全性和可靠性,及時有效的故障檢測變得越發(fā)的重要,對其的研究也具有重大意義[1-2]。
現(xiàn)代工業(yè)生產(chǎn)過程大多是多模態(tài)的工業(yè)過程。多模態(tài)工業(yè)過程同時還具有動態(tài)性和非線性的特征。因此相較于普通單模態(tài)過程,多模態(tài)過程的監(jiān)控要更加復(fù)雜。芯片制造過程[3],青霉素發(fā)酵過程[4]和半導(dǎo)體生產(chǎn)過程[5]是最常見的多模態(tài)工業(yè)過程。
復(fù)雜多模態(tài)過程的監(jiān)控,可以從數(shù)據(jù)標(biāo)準(zhǔn)化方法和故障檢測方法兩個方面進(jìn)行研究。
多模態(tài)過程的一種監(jiān)控策略是選擇合適的數(shù)據(jù)標(biāo)準(zhǔn)化方法。目前最常用的數(shù)據(jù)標(biāo)準(zhǔn)化方法是Z-Score標(biāo)準(zhǔn)化方法,但是該方法并不適用于多模態(tài)過程。局部近鄰標(biāo)準(zhǔn)化(NS)的數(shù)據(jù)處理方法[6-7]的提出有效的解決了Z-Score不能處理多模態(tài)數(shù)據(jù)的缺陷,NS方法雖然可以將多模態(tài)數(shù)據(jù)合并成單模態(tài),但是忽略了樣本的時序相關(guān)性,在處理動態(tài)過程時檢測效果不佳。為了進(jìn)一步完善NS在處理動態(tài)性生產(chǎn)過程的不足,馮等提出了時空近鄰標(biāo)準(zhǔn)化的數(shù)據(jù)處理方法[8],該標(biāo)準(zhǔn)化方法不僅將多模態(tài)數(shù)據(jù)融合為單模態(tài)數(shù)據(jù),同時還能消除前后數(shù)據(jù)之間的動態(tài)相關(guān)性,進(jìn)而將故障數(shù)據(jù)與正常數(shù)據(jù)更好的分離開,達(dá)到更好的故障檢測效果。
多模態(tài)過程的另一種監(jiān)控策略是選擇合適的故障檢測方法,主成分分析(PCA)[9]、偏最小二乘方法(PLS)[10]和獨(dú)立成分分析(ICA)[11]是最常用的故障檢測方法。這些方法都是基于數(shù)據(jù)驅(qū)動的傳統(tǒng)故障檢測方法。它們都是線性學(xué)習(xí)的降維方法,在處理非線性數(shù)據(jù)時效果不佳。
近年來,深度學(xué)習(xí)方法在圖像分類、目標(biāo)檢測、自動駕駛等領(lǐng)域都有著深入的研究。相對于傳統(tǒng)的基于數(shù)據(jù)驅(qū)動的方法,深度學(xué)習(xí)模型可以提取多變量數(shù)據(jù)更深層次的數(shù)據(jù)特征,表現(xiàn)出強(qiáng)勁的處理各種非線性信息的能力[12]。常見的深度學(xué)習(xí)方法有卷積神經(jīng)網(wǎng)絡(luò)[13],循環(huán)神經(jīng)網(wǎng)絡(luò)[14],自動編碼器[15]。其中自編碼器的應(yīng)用更為廣泛。目前常用的自編碼器模型有堆疊自編碼器(DAE),魯棒自編碼器(RAE),正交自編碼器(QAE),變分自編碼器(VAE)。
本文選擇時空近鄰標(biāo)準(zhǔn)化方法(TSNS)為數(shù)據(jù)的標(biāo)準(zhǔn)化方法,選擇魯棒自編碼器(RAE)模型為故障的檢測方法,將兩種方法進(jìn)行結(jié)合,提出基于TSNS-RAE的故障檢測方法來對多模態(tài)工業(yè)生產(chǎn)過程進(jìn)行故障檢測。
在進(jìn)行故障檢測之前,需要對采集的數(shù)據(jù)集進(jìn)行預(yù)處理。針對工業(yè)過程的特點(diǎn)選擇最合適的預(yù)處理方法來對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,對之后的故障檢測有著十分重要的意義。
(1)
(2)
(3)
Z-score 標(biāo)準(zhǔn)化使樣本集的每個特征具有均值為 0 標(biāo)準(zhǔn)差為 1的特點(diǎn),消除了數(shù)據(jù)量綱的影響,使不同變量的方差(離散程度)相同。普通的Z-Score標(biāo)準(zhǔn)化方法在處理多模態(tài)數(shù)據(jù)時,無法將多模態(tài)數(shù)據(jù)轉(zhuǎn)換成單模態(tài)數(shù)據(jù),導(dǎo)致檢測效果不佳。
為改善Z-Score方法處理多模態(tài)數(shù)據(jù)時的不足。Ma等提出了鄰域標(biāo)準(zhǔn)化方法(NS,neighborhood standardized),該方法使用最近鄰樣本的近鄰集標(biāo)準(zhǔn)化當(dāng)前樣本,NS的步驟如下:首先尋找樣本x的最近鄰樣本x1,其次尋找x1的前N近鄰樣本集,計算此近鄰集的均值m(N(x(1)))和標(biāo)準(zhǔn)差s(N(x(1))),最后使用式(4)對x進(jìn)行標(biāo)準(zhǔn)化:
(4)
鄰域標(biāo)準(zhǔn)化方法(NS)雖然可以將多模態(tài)數(shù)據(jù)轉(zhuǎn)換成單模態(tài)數(shù)據(jù),但是該方法只考慮了空間上的近鄰信息,忽略了時間上的近鄰信息。所以NS在處理動態(tài)過程的工業(yè)數(shù)據(jù)時,往往忽略了數(shù)據(jù)的動態(tài)性,無法消除之前時刻樣本對后面時刻樣本的影響。無法保證所用的近鄰樣本應(yīng)來自于樣本的相近時刻。
為了進(jìn)一步改善NS方法的不足,馮等提出了TSNS方法。TSNS的步驟如下:首先在訓(xùn)練集中尋找樣本x在時間方向上的前N近鄰樣本集N(x)= {x1(x),…,xt(x),…,xN(x)},再尋找xt(x)在空間方向上的前K近鄰樣本集N(xt(x))={x1(xt),…,xf(xt),…,xK(xt)},使用式(5)和(6)計算此樣本集的均值m(N(xt(x)))和標(biāo)準(zhǔn)差s(N(xt(x))),最后 使用式(7)將x進(jìn)行標(biāo)準(zhǔn)化處理得到標(biāo)準(zhǔn)化之后的樣本。
(5)
(6)
(7)
TSNS方法對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化時不僅單純使用空間近鄰信息,還充分考慮時間序列信息的影響,使用來自于相近時刻的樣本近鄰集。經(jīng)過TSNS處理之后的樣本在消除數(shù)據(jù)多模態(tài)的同時也消除了動態(tài)性,能夠?qū)崿F(xiàn)故障與正常樣本在空間上的分離。為之后對過程數(shù)據(jù)進(jìn)行故障檢測奠定基礎(chǔ)。
普通的自動編碼器(AE)是一種常用的降維神經(jīng)網(wǎng)絡(luò),經(jīng)常用于數(shù)據(jù)的降維和特征提取。它分為編碼器和解碼器兩部分,其結(jié)構(gòu)如圖1所示。在對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)降維處理和特征提取時,需保持輸出層數(shù)據(jù)維數(shù)與輸入層輸入維數(shù)相同,而中間隱藏層數(shù)據(jù)維數(shù)則可以根據(jù)實(shí)際情況而設(shè)定。
圖1 自編碼器網(wǎng)絡(luò)結(jié)構(gòu)示意圖
自編碼器由編碼和解碼兩步構(gòu)成,輸入層原始數(shù)據(jù)經(jīng)過編碼過程進(jìn)行降維處理,在隱藏層得到數(shù)據(jù)的特征,然后對隱藏層特征進(jìn)行解碼在輸出層得到原始數(shù)據(jù)的重構(gòu)。自編碼器模型結(jié)構(gòu)如下式:
hi=f(W1xi+b1)
(8)
(9)
式中,i=1,2,3···,I是采樣時間,xi∈RJ×1是第i個樣本,hi∈RK×1是原始輸入xi的特征。W1∈Rk×J和b1∈RK×1是輸入層到隱藏層之間的投影權(quán)重和偏置。r(xi)∈RJ×1是對提取特征hi的解碼或者說是對輸入數(shù)據(jù)xi的重構(gòu)。W2∈RJ×K和b2∈RJ×1是隱藏層到輸出層的投影權(quán)重和偏置。
公式(8)和(9)中f(i),g(i)是隱藏層和輸出層的激活函數(shù),根據(jù)實(shí)際工業(yè)生產(chǎn)過程的特點(diǎn),激活函數(shù)的選擇如下:
(10)
g(x)=x
(11)
一個好的自編碼器模型在提取數(shù)據(jù)特征時,應(yīng)保持輸出端重構(gòu)數(shù)據(jù)r(x)與輸入端原始數(shù)據(jù)X的差異盡可能的小。這個差異就叫作損失函數(shù)就是我們需要最小化的目標(biāo)函數(shù)。普通自編碼器的目標(biāo)函數(shù)如下:
(12)
式中,xi是第i個樣本數(shù)據(jù)點(diǎn),r(xi)是第i個樣本的重構(gòu)值。通過累積貢獻(xiàn)率方法選擇好好隱藏層的節(jié)點(diǎn)數(shù)K,設(shè)置好訓(xùn)練次數(shù)之后,可以選擇Adam優(yōu)化算法來對編碼器模型進(jìn)行訓(xùn)練,當(dāng)損失函數(shù)值慢慢下降并最后收斂趨于穩(wěn)定之后,編碼器的訓(xùn)練階段完成。得到最小化的損失函數(shù)和自編碼器模型參數(shù)值。我們可以將此訓(xùn)練好的編碼器用于之后的故障檢測之中。
自編碼器通過提取數(shù)據(jù)的深層特征來表示原始的過程數(shù)據(jù)。自編碼器模型訓(xùn)練的效果與模型復(fù)雜度和待訓(xùn)練的數(shù)據(jù)集的質(zhì)量有著密切的聯(lián)系。當(dāng)訓(xùn)練集數(shù)據(jù)量較少或訓(xùn)練集包含噪聲的時候,訓(xùn)練出來的模型容易出現(xiàn)過擬合現(xiàn)象,即測試集數(shù)據(jù)在模型上的表現(xiàn)效果遠(yuǎn)差于訓(xùn)練集在模型上的表現(xiàn)效果。為了提高訓(xùn)練數(shù)據(jù)集質(zhì)量,在訓(xùn)練之前需要把正常數(shù)據(jù)與噪聲隔離開。但是單純的把噪聲和冗余從訓(xùn)練集數(shù)據(jù)中剔除是十分困難的做法。
為了避免編碼器因?yàn)橛?xùn)練數(shù)據(jù)量較少或噪聲干擾在模型訓(xùn)練時出現(xiàn)的過擬合情況,對普通的自編碼器(AE)進(jìn)行改造,提出魯棒自編碼器(RAE)的概念。
魯棒自編碼器相對比于普通編碼器,能夠?qū)⒈辉肼曃廴镜脑紨?shù)據(jù)進(jìn)行編碼解碼并且很好的提取數(shù)據(jù)特征和輸出原始數(shù)據(jù)的重構(gòu)。這樣的編碼器更有利于處理復(fù)雜多變的過程數(shù)據(jù)。
因此在訓(xùn)練模型之前可以人為的給訓(xùn)練集加上高斯噪聲,達(dá)成對數(shù)據(jù)的損壞,編碼器如果可以從人為損壞的訓(xùn)練數(shù)據(jù)集提取出數(shù)據(jù)特征,并且重構(gòu)出原始數(shù)據(jù),那么這個編碼器就便具有識別噪聲的能力,具有抗噪性,有更好的魯棒性,從而提高模型的泛化能力。
RAE就是通過對輸入數(shù)據(jù)進(jìn)行一定程度的損壞,通過訓(xùn)練來將其還原為原始數(shù)據(jù)空間來學(xué)習(xí)數(shù)據(jù)中關(guān)鍵特征的自編碼器。
RAE模型的示意圖如圖2所示,和普通自編碼器有著相似的結(jié)構(gòu)[17]。
圖2 魯棒自編碼器示意圖
RAE與普通AE的區(qū)別就是訓(xùn)練階段時在原始數(shù)據(jù)基礎(chǔ)上人為加入高斯噪聲ε,用加入噪聲之后的數(shù)據(jù)來作為模型輸入數(shù)據(jù),而模型的訓(xùn)練目標(biāo)依舊是未加入噪聲的原始數(shù)據(jù),魯棒自編碼器的目標(biāo)函數(shù)如式(13):
(13)
在理想情況下,公式(13)可以被等效成一個加了正則化項(xiàng)的自編碼器:
(14)
RAE模型的訓(xùn)練過程與AE類似。分別選擇sigmod函數(shù)和恒等函數(shù)作為AE神經(jīng)網(wǎng)絡(luò)的激活函數(shù)。通過累積貢獻(xiàn)率方法選擇好隱藏層的節(jié)點(diǎn)個數(shù)K,設(shè)置好訓(xùn)練次數(shù)。選擇Adam算法作為優(yōu)化器來加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。將原始訓(xùn)練數(shù)據(jù)x加入噪聲之后送入AE進(jìn)而形成RAE模型。RAE模型隨著訓(xùn)練次數(shù)的增加,損失函數(shù)越來越小,編碼器神經(jīng)網(wǎng)絡(luò)的權(quán)值參數(shù)與偏置參數(shù)也在不斷的更新,當(dāng)損失函數(shù)的值慢慢下降并最后收斂趨于穩(wěn)定之后,RAE的訓(xùn)練階段完成。得到最小化的損失函數(shù)和RAE模型參數(shù)值。
RAE模型訓(xùn)練完成之后,原始訓(xùn)練數(shù)據(jù)x被分成輸入數(shù)據(jù)的重構(gòu)r*(x)和重構(gòu)誤差ξ*(x)兩部分。分別對應(yīng)于RAE的模型空間和殘差空間。如式(15)所示:
x=r*(x)+ξ*(x)
(15)
r*(x) 和ξ*(x)分別對應(yīng)于輸入向量x的輸出重構(gòu)值和殘差。在訓(xùn)練階段,x在模型空間的投影就是模型輸出r*(x),而在殘差空間的投影就是模型重構(gòu)誤差ξ*(x),與測量噪聲ε成正比關(guān)系。
RAE模型訓(xùn)練完成之后,將未加入噪聲的原始數(shù)據(jù)x送入離線訓(xùn)練好的RAE模型中得到輸出的重構(gòu)r*(x)。訓(xùn)練好的RAE模型將原始數(shù)據(jù)空間分為模型空間和殘差空間,其中模型空間對輸入變化具有魯棒性,而殘差空間對輸入變化敏感。所以在殘差空間選擇SPE統(tǒng)計量作為故障監(jiān)測統(tǒng)計量。RAE模型的訓(xùn)練數(shù)據(jù)SPE統(tǒng)計量為
SPER=(r*(x)-x)T(r*(x)-x)
(16)
選擇核密度估計法(KDE)來計算殘差空間統(tǒng)計量SPER的閥值SPE_lim,這個閥值就是之后測試階段判斷是否存在故障的控制限。
將TSNS與RAE進(jìn)行結(jié)合,形成TSNS-RAE故障檢測方法。TSNS-RAE故障檢測流程圖如圖3所示。TSNS-RAE模型故障檢測主要分為離線建模和在線監(jiān)測兩個階段。
離線建模階段和在線監(jiān)測的步驟如下。
離線建模過程:
1)對正常工況運(yùn)行下的原始數(shù)據(jù)進(jìn)行時空近鄰標(biāo)準(zhǔn)化處理得到標(biāo)準(zhǔn)樣本X。
4)將未加入噪聲污染的標(biāo)準(zhǔn)樣本X送入訓(xùn)練好的RAE模型之后,在殘差空間計算重構(gòu)誤差從而求得SPE統(tǒng)計量。
5)利用核密度估計方法求SPE統(tǒng)計量的控制限SPE_lim。
在線監(jiān)測過程:
1)從在線過程獲得新的測試集數(shù)據(jù)并運(yùn)用TSNS進(jìn)行預(yù)處理得到Xt。
2)將Xt直接送入離線過程訓(xùn)練好的RAE模型并獲得輸出的重構(gòu)值r*(Xt)。
3)計算在線監(jiān)測時的SPE統(tǒng)計量并檢查其是否超過離線過程設(shè)定的控制限SPE_lim。若超過控制限就表示發(fā)生故障,若沒有超則表示正常。
使用一個動態(tài)非線性的數(shù)值案例過程來進(jìn)行仿真。通過z-score,NS,TSNS這3種標(biāo)準(zhǔn)化方法的縱向?qū)Ρ葋碜C明TSNS預(yù)處理對多模態(tài)過程檢測有著重要作用。數(shù)值案例過程有兩個輸入變量θ,t和兩個輸出變量x1,x2,模型如下:
(17)
其中:a為過程參數(shù),本文取為0.3,e1和e2為隨機(jī)噪聲。過程正常運(yùn)行產(chǎn)生500個樣本作為建模數(shù)據(jù)。再次,讓過程正常運(yùn)行,但從2π時刻起在變量t上添加幅值為-3的階躍型擾動信號,共產(chǎn)生500個樣本作為測試數(shù)據(jù)。分別使用z-score標(biāo)準(zhǔn)化方法,NS標(biāo)準(zhǔn)化方法,和TSNS標(biāo)準(zhǔn)化方法對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,其中NS標(biāo)準(zhǔn)化的近鄰數(shù)N=4,TSNS標(biāo)準(zhǔn)化的時間近鄰數(shù)K=4,空間近鄰數(shù)N=5,數(shù)據(jù)經(jīng)過3種方法標(biāo)準(zhǔn)化之后的結(jié)果如圖4所示。
圖4 3種標(biāo)準(zhǔn)化方法對多模態(tài)數(shù)值例子的處理結(jié)果
通過對圖三的幾種標(biāo)準(zhǔn)化方法相比較可以發(fā)現(xiàn),普通的Z-Score標(biāo)準(zhǔn)化方法無法將故障數(shù)據(jù)與正常數(shù)據(jù)進(jìn)行分離。NS標(biāo)準(zhǔn)化方法只考慮空間上的近鄰,忽略時間上的近鄰,無法消除過程動態(tài)性,所以一部分故障可以與正常樣本分離,而另一部分故障則沒有分離出來。TSNS標(biāo)準(zhǔn)化方法同時考慮了時間和空間上的近鄰,并且可以完全將故障樣本與正常樣本實(shí)現(xiàn)分離。
完成了對訓(xùn)練數(shù)據(jù)的標(biāo)準(zhǔn)化處理之后,我們給標(biāo)準(zhǔn)化的數(shù)據(jù)額外加上高斯噪聲送入AE中形成RAE模型并進(jìn)行訓(xùn)練,隱藏層的維數(shù)設(shè)置為1,隱藏層的激活函數(shù)選擇sigmod函數(shù),輸出層激活函數(shù)選取恒等函數(shù)。優(yōu)化算法選擇為Adam優(yōu)化算法,訓(xùn)練次數(shù)設(shè)置為1 000次。用訓(xùn)練數(shù)據(jù)訓(xùn)練好RAE模型之后,根據(jù)核密度估計法在殘差空間求SPE統(tǒng)計量的控制限SPE_lim,然后將校驗(yàn)數(shù)據(jù)和故障數(shù)據(jù)合并當(dāng)成測試數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理之后送入RAE模型,得到測試集的SPE統(tǒng)計量并和SPE_lim進(jìn)行比較進(jìn)而監(jiān)測故障,為了方便觀測圖形,我們算SPE相關(guān)統(tǒng)計量時按照以10為底取其對數(shù)。3種標(biāo)準(zhǔn)化方法的故障檢測圖如圖5所示。
圖5 3種方法對多模態(tài)數(shù)值例子故障檢測結(jié)果
表1是RAE、NS-RAE、TSNS-RAE三種方法對多模態(tài)數(shù)值例子的故障檢測誤報率和檢測率的結(jié)果對比。從表1中可以看出,Z-Score標(biāo)準(zhǔn)化之后的RAE檢測結(jié)果最差,雖然沒有誤報,但是也沒有檢測出任何故障。NS-RAE故障檢測效果較RAE有一定的提升。而TSNS-RAE方法的故障檢測效果比RAE和NS-RAE方法的故障檢測效果都要好,通過這3種方法的縱向?qū)Ρ瓤傻弥猅SNS-RAE方法有較低的誤報率和更高的檢測率,更好地驗(yàn)證了TSNS在處理負(fù)雜多模態(tài)數(shù)據(jù)時的優(yōu)越性。
表1 多模態(tài)數(shù)值例子的檢測結(jié)果對比
青霉素生產(chǎn)發(fā)酵過程是一種具有時變性,不同操作階段動態(tài)有不同特性,線性化程度不同以及非高斯性特點(diǎn)的典型的多模態(tài)生產(chǎn)過程。青霉素發(fā)酵過程中的代謝變化分為菌體生長,青霉素合成和菌體自溶3個階段[18]。圖6給出了青霉素發(fā)酵過程工藝流程圖。
圖6 青霉素發(fā)酵過程工藝流程圖
本文采用pensim仿真平臺生產(chǎn)青霉素數(shù)據(jù),基于RAE,NS-RAE,TSNS-RAE算法進(jìn)行故障檢測。pensim仿真平臺是由Cinar教授為首的研究小組創(chuàng)建開發(fā)的一款仿真軟件,專為研究青霉素發(fā)酵過程而設(shè)計。pensim仿真平臺在故障檢測研究中有著十分廣泛的應(yīng)用[19]。同時由于其平臺數(shù)據(jù)具有多模態(tài)過程數(shù)據(jù)的特點(diǎn),為驗(yàn)證深度學(xué)習(xí)方法在多模態(tài)過程故障檢測與診斷方面帶來了很多便利。該平臺有5個輸入變量控制發(fā)酵過程參數(shù)變化,9個過程變量是菌體合成及生長中產(chǎn)生的,5個質(zhì)量變量影響青霉素的產(chǎn)量[20]。設(shè)定仿真時間為400 h,采樣間隔為0.5 h,先在正常工況下產(chǎn)生一組數(shù)據(jù)作為離線訓(xùn)練樣本。青霉素發(fā)酵過程可以在通氣率、攪拌功率和底物流速率這3個變量上引入干擾,分別有斜坡和階躍兩種干擾模式,通過調(diào)整兩種模式的幅度、干擾引入時間和終止時間來產(chǎn)生故障。本文采取了青霉素發(fā)酵過程中的12個主要變量進(jìn)行實(shí)驗(yàn),同時設(shè)置了6種不同類型的故障作為待檢測樣本來驗(yàn)證所提TSNS-RAE算法的有效性,故障類型如表2所示。
表2 青霉素生產(chǎn)過程的6種故障類型
基于數(shù)據(jù)驅(qū)動的故障檢測最常用的檢測方法是主成分分析(PCA)算法和K近鄰(KNN)算法。將這兩種檢測方法和TSNS相結(jié)合,形成TSNS-PCA和TSNS-KNN算法。選用TSNS-RAE算法法來進(jìn)行故障檢測,并將其檢測結(jié)果與TSNS-PCA,TSNS-KNN進(jìn)行橫向比較。TSNS方法的時間近鄰個數(shù)N=5,空間近鄰個數(shù)K=5。這些故障檢測方法均以置信水平為99%來確定監(jiān)測模型的控制限;其中PCA依據(jù)85%的累計貢獻(xiàn)率來選取數(shù)據(jù)降維之后的主元個數(shù)。KNN算法的近鄰個數(shù)k=5。RAE模型依據(jù)85%的累計貢獻(xiàn)率選取編碼器隱藏層節(jié)點(diǎn)個數(shù)為6;激活函數(shù)依舊選擇Sigmod函數(shù)和恒等函數(shù),選擇Adam算法為優(yōu)化器加速RAE的訓(xùn)練。RAE的訓(xùn)練次數(shù)設(shè)置為1 500。完成編碼器的建模與故障檢測之后。我們選擇故障3和故障6的檢測結(jié)果來作圖,為了更好的圖形顯示效果,SPE相關(guān)統(tǒng)計量按照以10為底取對數(shù)。檢測效果圖如圖7和圖8所示。測試所用的不同方法的故障檢測率和誤報率均列在表3和表4中。
表3 不同方法的故障檢測率/%
表4 不同方法的故障誤報率 %
圖7 不同方法對故障3的檢測結(jié)果圖
圖8 不同方法對故障6的檢測結(jié)果圖
PCA作為最常用的故障檢測方法,將過程數(shù)據(jù)分成降維之后的主成分空間和殘差空間,分別對應(yīng)T2統(tǒng)計量和SPE統(tǒng)計量,PCA原本只適用于單模態(tài)正態(tài)分布的數(shù)據(jù),TSNS方法與PCA的結(jié)合消除了青霉素生產(chǎn)過程的多模態(tài)和動態(tài)性提升了PCA的檢測效果。但是PCA無法考慮過程的非線性,所以TSNS-PCA的檢測率與TSNS-KNN和TSNS-RAE相比效果不是很好。由故障3和故障6的實(shí)驗(yàn)結(jié)果圖可以更直觀的看出檢測率較低。
KNN檢測方法使用過程數(shù)據(jù)樣本與其前k個近鄰樣本的距離平方和D2作為統(tǒng)計量,KNN方法考慮了工業(yè)過程的非線性,與TSNS方法結(jié)合之后對于多模態(tài)故障檢測有著不錯的檢測效果,在檢測率上會比PCA方法更好一點(diǎn),誤報率較高,故障1,故障4和故障6有著很高的誤報率。由故障6的檢測結(jié)果圖可以更直觀的看出校驗(yàn)數(shù)據(jù)存在著誤報。結(jié)合檢測率與誤報率,整體的檢測效果不如TSNS-RAE。
RAE作為深度學(xué)習(xí)方法,與傳統(tǒng)的基于數(shù)據(jù)驅(qū)動的方法相比,有著更好的特征提取和數(shù)據(jù)降維效果,訓(xùn)練模型的損失函數(shù)越小,RAE對原始數(shù)據(jù)的重構(gòu)越效果好。同時RAE模型有著抗噪性和魯棒性。對青霉素數(shù)據(jù)使用TSNS-RAE方法進(jìn)行故障檢測,基本都有較好的故障檢測效果。由表3可知,故障2,故障3,故障5和故障6的SPE統(tǒng)計量的檢測率都達(dá)到了100%,故障1和故障4 的SPE統(tǒng)計量的檢測率分別達(dá)到99.1%和99.6%。由表4可知整體的誤報率都比較低。因此結(jié)合整體的檢測率與誤報率,通過對TSNS-PCA、TSNS-KNN、TSNS-RAE三種方法進(jìn)行橫向?qū)Ρ瓤芍猅SNS-RAE對于復(fù)雜多模態(tài)過程有著更好的檢測效果。
根據(jù)多模態(tài)工業(yè)生產(chǎn)過程的數(shù)據(jù)特點(diǎn),本文提出了一種基于TSNS-RAE的故障檢測方法。通過數(shù)值案例,將TSNS方法與常用的Z-Score方法、NS方法方法進(jìn)行比較,突出TSNS方法在預(yù)處理復(fù)雜多模態(tài)數(shù)據(jù)時的優(yōu)勢。通過青霉素生產(chǎn)過程實(shí)驗(yàn),將TSNS-RAE與TSNS-PCA、TSNS-KNN進(jìn)行橫向?qū)Ρ?,結(jié)合檢測率與誤報率,突出了TSNS-RAE在處理復(fù)雜多模態(tài)工業(yè)過程的優(yōu)越性。
自動編碼器除了魯棒自編碼器之外,還有堆疊自編碼器,正交自編碼器,變分自編碼器等。每一種編碼器都有各自的優(yōu)勢,今后的實(shí)驗(yàn)可以針對不同的工業(yè)過程將TSNS方法與其他編碼器模型進(jìn)行結(jié)合進(jìn)行故障檢測。