張謙謙, 王文標(biāo), 郝友維
(大連海事大學(xué)船舶電氣工程學(xué)院, 大連 116026)
隨著生產(chǎn)需求的快速增長(zhǎng),現(xiàn)代化工業(yè)蓬勃發(fā)展,生產(chǎn)過(guò)程越來(lái)越集成化和復(fù)雜化。而復(fù)雜系統(tǒng)各環(huán)節(jié)緊密相連,即使發(fā)生微小的故障都可能會(huì)造成巨大的財(cái)產(chǎn)損失和人員傷亡,因此故障檢測(cè)技術(shù)在現(xiàn)代工業(yè)生產(chǎn)中具有重要意義[1-4]。以主成分分析[5-9](principal component analysis, PCA)為代表的數(shù)據(jù)驅(qū)動(dòng)方法,已經(jīng)廣泛應(yīng)用于工業(yè)系統(tǒng)的過(guò)程監(jiān)控和故障檢[10-15]。然而使用PCA方法進(jìn)行故障檢測(cè)的前提是數(shù)據(jù)為單模態(tài)且樣本之間相互獨(dú)立,對(duì)于具有多模態(tài)特性和動(dòng)態(tài)特性系統(tǒng)故障檢測(cè)效果不佳。
多模態(tài)數(shù)據(jù)通常具有中心漂移、方差差異明顯等特征。對(duì)于這一問(wèn)題,可建立多個(gè)局部模型或全局模型來(lái)解決。李元等[16]采用基于K均值聚類方法對(duì)數(shù)據(jù)進(jìn)行分類,為各個(gè)模態(tài)單獨(dú)建立模型。由于故障檢測(cè)效果與模型劃分結(jié)果緊密相關(guān),因此該方法對(duì)模型劃分精度要求較高。張成等[17]提出了基于k近鄰主元得分差分的故障檢測(cè)方法,采用得分差分方法降低了數(shù)據(jù)多模態(tài)特性對(duì)故障檢測(cè)的不利影響,但其未考慮不同特征對(duì)評(píng)價(jià)指標(biāo)的貢獻(xiàn)差異。馮立偉等[18]提出了基于權(quán)重k近鄰的故障檢測(cè)方法(fault detection of weightedknearest neighbor,FD-wkNN),通過(guò)尋找樣本的k近鄰并利用其加權(quán)近鄰距離信息,解決樣本中心漂移問(wèn)題。但當(dāng)樣本不均勻時(shí),對(duì)稀有樣本的故障檢測(cè)精度會(huì)降低。顧幸生等[19]采用局部近鄰標(biāo)準(zhǔn)化(local neighborhood standardization, LNS)方法對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除了數(shù)據(jù)的多模態(tài)特性。但當(dāng)故障數(shù)據(jù)的鄰域信息來(lái)自多個(gè)模態(tài)時(shí),經(jīng)該方法處理后會(huì)造成故障數(shù)據(jù)與正常數(shù)據(jù)混疊,降低了故障檢測(cè)精度。
對(duì)于動(dòng)態(tài)系統(tǒng),各參數(shù)的變化需要經(jīng)過(guò)一定的滯后時(shí)間才會(huì)影響到其他變量的變化,且運(yùn)行數(shù)據(jù)是根據(jù)時(shí)間采樣的時(shí)間序列數(shù)據(jù),因此在進(jìn)行故障檢測(cè)時(shí)要考慮數(shù)據(jù)的時(shí)序特性。對(duì)此,來(lái)顏博等[20]使用動(dòng)態(tài)主元分析法(dynamic principal component analysis, DPCA),通過(guò)增加延時(shí)測(cè)量值構(gòu)成增廣矩陣提取系統(tǒng)動(dòng)態(tài)特性,但其無(wú)法描述樣本的自相關(guān)性且增大了數(shù)據(jù)維度,降低了計(jì)算效率。李元等[21]提出了時(shí)空近鄰標(biāo)準(zhǔn)化(time-space nearest neighborhood standardization, TSNS)方法,通過(guò)尋找樣本的時(shí)間和空間的局部近鄰并進(jìn)行標(biāo)準(zhǔn)化處理,消除了數(shù)據(jù)的動(dòng)態(tài)特性。
針對(duì)系統(tǒng)的多模態(tài)和動(dòng)態(tài)問(wèn)題,提出動(dòng)態(tài)加權(quán)差分主成分分析法 (dynamic weighted differential principal component analysis, DWDPCA)。設(shè)置合理長(zhǎng)度的時(shí)間窗描述系統(tǒng)的動(dòng)態(tài)特性,并尋找時(shí)間窗中樣本在空間上的第一近鄰和第一近鄰的近鄰集,利用加權(quán)差分方法解決數(shù)據(jù)中心漂移的問(wèn)題,使用PCA進(jìn)行異常檢測(cè)。該方法兼顧了樣本的時(shí)序特性和空間特性,適用于具有動(dòng)態(tài)特性和多模態(tài)特性的系統(tǒng),可提高系統(tǒng)的故障檢測(cè)率。
選取系統(tǒng)在正常工況下運(yùn)行產(chǎn)生的歷史數(shù)據(jù),構(gòu)建樣本矩陣X=(Xij)n×m,其中,m為樣本的變量數(shù)量,n為樣本數(shù)量。使用z-score法將數(shù)據(jù)標(biāo)準(zhǔn)化,并計(jì)算其協(xié)方差矩陣S,計(jì)算公式為
(1)
主元個(gè)數(shù)由累計(jì)方差貢獻(xiàn)率(cumulative percent variance, CPV)確定,其表達(dá)式為
(2)
式(2)中:λj為S的特征值。
(3)
Ti=XiPi
(4)
式中:XP為主元子空間中樣本向量X的投影;Ti為得分矩陣;Pi為負(fù)荷矩陣;E為殘差子空間。
T2和SPE統(tǒng)計(jì)量是PCA進(jìn)行故障診斷的兩個(gè)重要指標(biāo)。T2統(tǒng)計(jì)量的控制限CLT2可表示為
(5)
式(5)中:α為顯著性水平;1-α為置信度;Fα(α,n-α)為F分布,其第一自由度為α,第二自由度為n-α。
SPE統(tǒng)計(jì)量的控制限CLSPE可表示為
(6)
(7)
(8)
式中:cα為標(biāo)準(zhǔn)正態(tài)分在布置信水平為α?xí)r的置信限;h0為閾值;θ1和θ3為數(shù)據(jù)集的一分位數(shù)和三分位數(shù);θi的定義如式(7)所示;λ為特征值。
傳統(tǒng)的PCA方法適用于數(shù)據(jù)服從獨(dú)立同分布的單模態(tài)系統(tǒng),對(duì)具有時(shí)序特性或多模態(tài)特性的系統(tǒng)檢測(cè)效果并不理想。為提高PCA對(duì)具有的動(dòng)態(tài)特性和多模態(tài)特性系統(tǒng)的故障檢測(cè)性能,提出動(dòng)態(tài)加權(quán)差分主成分分析法。通過(guò)時(shí)間窗描述樣本間的時(shí)序關(guān)系,利用加權(quán)差分法解決數(shù)據(jù)中心漂移問(wèn)題,使用PCA方法進(jìn)行故障檢測(cè)。具體方法如下。
(9)
(10)
權(quán)值公式的約束條件如式(11)所示。
(11)
DWDPCA法故障檢測(cè)流程圖,如圖1所示。
圖1 故障診斷流程圖Fig.1 Flowchart of fault diagnosis
利用動(dòng)態(tài)加權(quán)差分主成分分析法進(jìn)行故障檢測(cè)主要分為:離線建模和在線診斷,具體步驟如下。
1.3.1 離線建模
步驟1獲取正常工況下的歷史數(shù)據(jù)作為訓(xùn)練集X。
步驟2對(duì)訓(xùn)練集中的每個(gè)樣本xt設(shè)置合理的時(shí)間窗,再對(duì)時(shí)間窗中的樣本尋找其空間上的第一近鄰和第一近鄰的K近鄰集。
步驟4構(gòu)建PCA模型,計(jì)算控制限CLT2和CLSPE。
1.3.2 在線診斷
步驟1獲取要檢測(cè)的樣本作為測(cè)試集X*。
步驟2對(duì)測(cè)試集樣本x*構(gòu)造時(shí)間窗,并對(duì)時(shí)間窗中的樣本在訓(xùn)練集中尋找第一近鄰和第一近鄰的K近鄰集。
步驟5判斷T2和 SPE統(tǒng)計(jì)量與控制限CLT2和 CLSPE的關(guān)系,若超限則說(shuō)明此時(shí)系統(tǒng)發(fā)生故障,否則認(rèn)為系統(tǒng)運(yùn)行正常。
分別利用數(shù)值仿真系統(tǒng)和Tennessee Eastman(TE)仿真平臺(tái)模擬工業(yè)系統(tǒng)運(yùn)行過(guò)程,并對(duì)其進(jìn)行故障檢測(cè)來(lái)驗(yàn)證該方法的有效性。
使用具有時(shí)序特性的數(shù)值仿真系統(tǒng)模擬多模態(tài)數(shù)據(jù),仿真過(guò)程為
(12)
式(12)中:x1和x2為輸出變量;t為時(shí)間變量;θ為角度;e1、e2為服從[0 ,0.01]的隨機(jī)噪聲;a、b為過(guò)程參數(shù),通過(guò)改變其值來(lái)產(chǎn)生多模態(tài)數(shù)據(jù),模態(tài)一中設(shè)置a為0.2;b為0.2,模態(tài)二中設(shè)置a為0.1,b為-2。
系統(tǒng)在模態(tài)一下運(yùn)行4π時(shí)間后切換到模態(tài)二繼續(xù)運(yùn)行4π時(shí)間,每個(gè)模態(tài)生成500組數(shù)據(jù),構(gòu)成1 000組訓(xùn)練數(shù)據(jù)。再次讓系統(tǒng)重新運(yùn)行,每個(gè)模態(tài)各生成250組校驗(yàn)數(shù)據(jù)和250組故障數(shù)據(jù),其中故障數(shù)據(jù)為在變量t上添加幅值為-6的階躍信號(hào)所造成。系統(tǒng)產(chǎn)生的多模態(tài)數(shù)據(jù)散點(diǎn)圖如圖2所示。可以看出,正常數(shù)據(jù)的中心隨時(shí)間逐漸變化,故障樣本偏離正常軌跡,靠近前半段正常數(shù)據(jù)。
x1、x2為仿真模擬系統(tǒng)模擬出的數(shù)據(jù)圖2 數(shù)值例子散點(diǎn)圖Fig.2 Scatter plot of numerical examples
圖3和圖4分別為原始數(shù)據(jù)和經(jīng)LNS方法處理后的測(cè)試集數(shù)據(jù)散點(diǎn)圖和分布圖。由圖4可知, LNS方法均可將數(shù)據(jù)化為單模態(tài)且近似服從單峰高斯分布,符合使用PCA方法進(jìn)行故障檢測(cè)的前提條件,降低了多模態(tài)結(jié)構(gòu)對(duì)故障檢測(cè)性能的影響。但LNS方法并未考慮數(shù)據(jù)的時(shí)序特性,對(duì)具有動(dòng)態(tài)特性的系統(tǒng)進(jìn)行故障檢測(cè)時(shí)存在不足。使用可以解決時(shí)序問(wèn)題的動(dòng)態(tài)加權(quán)差分(dynamic weighted differential, DWD)方法對(duì)數(shù)據(jù)進(jìn)行處理,處理后的數(shù)據(jù)散點(diǎn)圖及校驗(yàn)數(shù)據(jù)直方圖如圖5所示。
圖3 原始數(shù)據(jù)散點(diǎn)及分布圖Fig.3 Original data scatter and distribution map
圖4 LNS處理后數(shù)據(jù)散點(diǎn)及分布圖Fig.4 Data scatter and distribution after LNS processing
圖5 DWD處理后數(shù)據(jù)散點(diǎn)及分布圖Fig.5 Data scatter and distribution after DWD processing
同一數(shù)據(jù)分布區(qū)域內(nèi),故障數(shù)據(jù)與正常數(shù)據(jù)在空間上分布相近,但在時(shí)序上其分布卻存在明顯差距。因此設(shè)置時(shí)間窗可有效描述樣本間的時(shí)序關(guān)系,實(shí)現(xiàn)正常樣本與故障樣本的有序排列,避免了只尋找樣本的空間近鄰,而忽略了樣本間的時(shí)序特性。解決了樣本時(shí)序特性對(duì)故障檢測(cè)的影響后,再尋找樣本的第一近鄰和第一近鄰的近鄰集對(duì)數(shù)據(jù)進(jìn)行加權(quán)差分處理,消除了數(shù)據(jù)的多模態(tài)特性。經(jīng)DWD方法處理后,故障樣本遠(yuǎn)離坐標(biāo)原點(diǎn),可將故障樣本從正常樣本中分離出來(lái)。
經(jīng)DWD方法處理后的數(shù)據(jù)具有正態(tài)特性,即樣本間是相互獨(dú)立的,消除了數(shù)據(jù)的時(shí)序特性。因此要選取合適的時(shí)間窗長(zhǎng)度L,若數(shù)據(jù)選擇過(guò)大,則會(huì)增加計(jì)算復(fù)雜度。若選擇過(guò)小,則無(wú)法對(duì)當(dāng)前時(shí)間段系統(tǒng)的動(dòng)態(tài)特性進(jìn)行準(zhǔn)確描述。本實(shí)驗(yàn)使用交叉驗(yàn)證的方法選取最佳L和K,設(shè)置時(shí)間窗長(zhǎng)度L為5,近鄰數(shù)K為5。使用DWD方法進(jìn)行數(shù)據(jù)處理,由圖5可以看出,該方法可有效處理具有動(dòng)態(tài)特性的多模態(tài)數(shù)據(jù),將其轉(zhuǎn)化為單模態(tài)數(shù)據(jù)且服從高斯分布,并將故障樣本與正常樣本分離。使用PCA和DWDPCA方法對(duì)測(cè)試集數(shù)據(jù)進(jìn)行檢測(cè),設(shè)置置信度為99%,累計(jì)貢獻(xiàn)率為85%,檢測(cè)結(jié)果如圖6和圖7所示。
圖6 數(shù)值例子PCA故障檢測(cè)圖Fig.6 PCA fault detection diagram for numerical examples
圖7 數(shù)值例子DWDPCA故障檢測(cè)圖Fig.7 DWDPCA fault detection diagram for numerical examples
由圖6可以看出,使用PCA方法進(jìn)行故障檢測(cè)檢測(cè)效果很不理想,T2統(tǒng)計(jì)量的故障檢測(cè)率為0,SPE統(tǒng)計(jì)量的故障檢測(cè)率為6.2%。這是由于數(shù)據(jù)具有動(dòng)態(tài)特性和多模態(tài)特性,使用全局建模方法計(jì)算得到的控制限指標(biāo)過(guò)高,無(wú)法檢測(cè)到故障。從圖7可以看出,使用DWDPCA方法可基本將故障數(shù)據(jù)完全檢測(cè)出來(lái),T2統(tǒng)計(jì)量的故障檢測(cè)率為96.4%,SPE統(tǒng)計(jì)量的故障檢測(cè)率為98.8%,相比于PCA故障檢測(cè)率提高了92.6%,具有較高的檢測(cè)率。
TE平臺(tái)是根據(jù)多變量的復(fù)雜化工反應(yīng)過(guò)程模擬的仿真平臺(tái),已被大量應(yīng)用于檢測(cè)故障診斷算法有效性的實(shí)驗(yàn)中。TE過(guò)程有5個(gè)操作單元和8種氣體成分,共53個(gè)變量,由12個(gè)控制變量和41個(gè)測(cè)量變量組成,本實(shí)驗(yàn)選取41個(gè)測(cè)量變量用于故障檢測(cè)。
TE過(guò)程根據(jù)生產(chǎn)物G/H的比例將生產(chǎn)過(guò)程分為4種模式,本實(shí)驗(yàn)選取模態(tài)1和模態(tài)3進(jìn)行故障檢測(cè),具體如表1所示。系統(tǒng)先在模態(tài)一下運(yùn)行48 h,然后再在模態(tài)三下運(yùn)行48 h,期間以3 min為間隔進(jìn)行采樣,共采集訓(xùn)練樣本1 920組。測(cè)試集數(shù)據(jù)的采集和上述方法相同,但均在每個(gè)模態(tài)運(yùn)行8 h時(shí)加入不同類型的故障,直至本模態(tài)運(yùn)行結(jié)束,故障說(shuō)明如表2所示。
表1 TE過(guò)程生成模式Table 1 TE process generation models
表2 TE過(guò)程故障說(shuō)明Table 2 TE process fault description
如圖8和圖9所示,任取兩個(gè)變量分別繪制原始數(shù)據(jù)和經(jīng)DWD方法處理后的數(shù)據(jù)散點(diǎn)圖和分布圖。由圖8可知,原始數(shù)據(jù)為多模態(tài)結(jié)構(gòu),方差差異明顯。經(jīng)DWD方法處理后數(shù)據(jù)轉(zhuǎn)化為單模態(tài)且近似服從單峰高斯分布,如圖9所示。
圖8 TE過(guò)程數(shù)據(jù)散點(diǎn)圖及分布圖Fig.8 Scatter plot and distribution diagram of TE process data
圖9 TE過(guò)程DWD方法處理后數(shù)據(jù)散點(diǎn)圖及分布圖Fig.9 Scatter plot and distribution diagram of data after TE process DWD method
使用PCA和DWDPCA方法進(jìn)行故障檢測(cè),置信度為99%,累計(jì)貢獻(xiàn)率為85%,通過(guò)交叉驗(yàn)證方法確定DWDPCA的時(shí)間窗長(zhǎng)度L為5,近鄰數(shù)K為5。使用這兩種方法對(duì)不同故障的故障檢測(cè)率如表3所示。由表3可知,DWDPCA方法對(duì)6種故障的故障檢測(cè)率均高于PCA方法,DWDPCA的故障檢測(cè)性能得到驗(yàn)證。
表3 測(cè)試集故障檢測(cè)率Table 3 Test set fault detection rate
以故障2為例,A/C進(jìn)料流比不變,組分B含量發(fā)生階躍變化,致使總進(jìn)料發(fā)生改變,使系統(tǒng)無(wú)法正常運(yùn)行而發(fā)生故障。使用PCA和DWDPCA方法對(duì)此故障進(jìn)行診斷,診斷結(jié)果如圖10和圖11所示。PCA的T2統(tǒng)計(jì)量的故障檢測(cè)率為10.8%,SPE統(tǒng)計(jì)量的故障檢測(cè)率為55.9%,DWDPCA的T2統(tǒng)計(jì)量的故障檢測(cè)率為98.9%,SPE統(tǒng)計(jì)量的故障檢測(cè)率為98.6%,相比于PCA故障檢測(cè)率提高了42.7%。DWDPCA方法的故障檢測(cè)效果明顯高于傳統(tǒng)PCA方法。這是由于DWDPCA方法首先對(duì)數(shù)據(jù)進(jìn)行處理,消除了數(shù)據(jù)的時(shí)序特性和多模態(tài)特性,使數(shù)據(jù)符合使用PCA進(jìn)行故障檢測(cè)的前提條件,再使用PCA方法進(jìn)行故障檢測(cè),使得檢測(cè)性能得到提高。
圖10 TE過(guò)程PCA故障檢測(cè)圖Fig.10 PCA fault detection diagram of TE process
圖11 TE過(guò)程DWDPCA故障檢測(cè)圖Fig.11 DWDPCA fault detection diagram of TE process
針對(duì)工業(yè)系統(tǒng)中存在的動(dòng)態(tài)特性和多模態(tài)特性問(wèn)題,提出了DWDPCA故障檢測(cè)方法。通過(guò)使用數(shù)值仿真例子和TE仿真平臺(tái)進(jìn)行故障檢測(cè)可得出如下結(jié)論。
(1)使用動(dòng)態(tài)加權(quán)差分方法,克服了動(dòng)態(tài)系統(tǒng)多中心結(jié)構(gòu)的缺陷,消除了數(shù)據(jù)的時(shí)序特性,并將數(shù)據(jù)轉(zhuǎn)化為單一模態(tài)且近似服從單峰高斯分布。
(2)針對(duì)具有動(dòng)態(tài)特性和多模態(tài)特性系統(tǒng),所提出的DWDPCA方法可顯著提高其故障檢測(cè)率,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法的有效性和優(yōu)越性。