馮立偉李 元張 成謝彥紅
(1.沈陽化工大學(xué)數(shù)理系,遼寧沈陽 110142;2.沈陽化工大學(xué)技術(shù)過程故障診斷與安全性研究中心,遼寧沈陽 110142)
伴隨著現(xiàn)代化學(xué)工業(yè)產(chǎn)品在生產(chǎn)和生活各領(lǐng)域中廣泛應(yīng)用,如何保證生產(chǎn)過程的安全性和產(chǎn)品的高質(zhì)量成為一個重要問題.基于數(shù)據(jù)驅(qū)動的故障檢測和過程監(jiān)控技術(shù)在化學(xué)工業(yè)過程中已經(jīng)得到了廣泛的應(yīng)用.主元分析(principal component analysis,PCA)、偏最小二乘方法和獨(dú)立元分析是經(jīng)典的故障檢測方法[1–12].它們都采用了統(tǒng)計量T2和SPE對過程進(jìn)行監(jiān)控,但這兩個統(tǒng)計量都假定數(shù)據(jù)來源于獨(dú)立同分布的單模態(tài)生產(chǎn)過程.
當(dāng)過程具有動態(tài)特性時,前后時刻樣本存在的時序相關(guān)性導(dǎo)致數(shù)據(jù)無法滿足獨(dú)立性的要求,針對此問題,Ku等提出了動態(tài)主元分析(dynamic principal component analysis,DPCA)[13].Rato 等[14–15]研究了DPCA中時滯參數(shù)選取問題.DPCA通過構(gòu)造時滯矩陣將不同時刻樣本間的時序相關(guān)性轉(zhuǎn)化為變量間的相關(guān)性,成功消除了時序相關(guān)性的影響.但是,DPCA類方法并不適用于多模態(tài)過程.
針對過程的非線性和多模態(tài)特征,He等提出了基于k近鄰的故障檢測方法(knearest neighbor rule,kNN),并成功檢測出半導(dǎo)體蝕刻工藝過程的大部分故障[16].針對各模態(tài)方差不同的多模態(tài)過程,馮等提出基于標(biāo)準(zhǔn)距離K近鄰方法[17].但是,當(dāng)過程具有強(qiáng)動態(tài)性時,kNN類方法的檢測性能顯著降低.非線性、多模態(tài)過程的另一類監(jiān)控策略是標(biāo)準(zhǔn)化方法.Ma等提出局部近鄰標(biāo)準(zhǔn)化(local neighborhood standardization,NS)的故障檢測方法[18–19].馮等提出統(tǒng)計模量和局部近鄰標(biāo)準(zhǔn)化的局部離群因子故障檢測方法[20].NS類方法將多模態(tài)數(shù)據(jù)融合為單模態(tài)數(shù)據(jù),但亦沒有考慮時序相關(guān)性的問題.
Breunig 等提出一種基于局部離群因子(local outlier factor,LOF)的離群點(diǎn)檢測方法[21].LOF 使用樣本的相對密度來度量其離群程度,可以用來區(qū)分故障樣本和正常樣本,能夠?qū)崿F(xiàn)非線性過程、單模態(tài)過程或多模態(tài)過程(包括方差顯著不同)的故障檢測[22–24].Ma等提出馬氏距離局部離群因子的故障檢測方法[22].劉等提出基于局部密度估計的多模態(tài)故障檢測方法[23].Zhu等提出多模態(tài)批次過程LOF監(jiān)控,并應(yīng)用于青霉素發(fā)酵過程中[24].但是,上述LOF類方法均未考慮過程動態(tài)性的影響.
針對復(fù)雜生產(chǎn)過程的非線性、多模態(tài)和動態(tài)特征,本文提出一種基于時空近鄰標(biāo)準(zhǔn)化和局部離群因子(time-space nearest neighborhood standardization and LOF,TSNS–LOF)的故障檢測方法,并在數(shù)值模擬過程和化工生產(chǎn)過程中進(jìn)行了檢驗.
LOF方法使用局部離群因子表征樣本的離群程度,是一種建立在可達(dá)距離基礎(chǔ)上的基于相對密度的離群點(diǎn)檢測算法,能夠?qū)o動態(tài)性的非線性、多模態(tài)過程進(jìn)行故障檢測.LOF方法計算過程如下:
首先,尋找樣本x的前k近鄰集,并計算x到每個近鄰樣本的第k可達(dá)距離
其中:dk(x(k))是x和其第k近鄰x(k)間的距離,d(x,x(f))是x和其第f近鄰x(f)間的距離.
其次,計算樣本x的局部可達(dá)密度
最后,計算樣本x的局部離群因子
在所有訓(xùn)練樣本的LOF值的基礎(chǔ)上使用核密度估計等方法確定其所服從的分布,并將其分布的上分位點(diǎn)作為檢測模型的控制限.當(dāng)一個在線樣本的LOF值大于控制限時,判定過程發(fā)生故障,否則為正常.
在LOF方法中,近鄰距離的計算能夠消除數(shù)據(jù)的非線性、多模態(tài)特性,使數(shù)據(jù)集融合為單模態(tài)數(shù)據(jù);相對密度的計算能夠調(diào)整數(shù)據(jù)的疏密程度使各模態(tài)數(shù)據(jù)的方差近似相等.
當(dāng)過程變量隨時間具有顯著變化時,其數(shù)據(jù)中心逐漸漂移且方差逐漸變化,這導(dǎo)致LOF方法對部分故障會出現(xiàn)漏報.使用一個動態(tài)非線性的數(shù)值模擬過程進(jìn)行闡述.過程有兩個輸入變量θ,t和兩個輸出變量x1,x2,模型如下:
其中:a為過程參數(shù),本文取為0.2,e1,e2為隨機(jī)噪聲.過程正常運(yùn)行產(chǎn)生500個樣本作為建模數(shù)據(jù).再次,讓過程正常運(yùn)行,但從2π時刻起在變量t上添加幅值為?4的階躍型擾動信號,共產(chǎn)生500個樣本作為測試數(shù)據(jù).所有數(shù)據(jù)的空間分布見圖1(a),正常數(shù)據(jù)的中心和方差隨時間逐漸變化,位于后半階段的故障樣本靠近前半階段的正常數(shù)據(jù).
使用LOF方法對該過程進(jìn)行故障檢測實(shí)驗,選取近鄰個數(shù)為4,取97%的置信度,檢測結(jié)果見圖1(b).從圖1(a)可看出有大量故障非常接近正常樣本導(dǎo)致其可達(dá)距離較小,所以其局部離群因子小于正常樣本,因此被LOF誤報為正常樣本.
圖1 動態(tài)非線性過程監(jiān)控Fig.1 Monitoring for dynamic and nonlinear process
當(dāng)故障靠近正常樣本時,為了避免LOF方法的誤報,可以先采用標(biāo)準(zhǔn)化策略對數(shù)據(jù)進(jìn)行處理,使故障樣本遠(yuǎn)離正常樣本.Ma等[19]提出了NS–LOF方法,使用樣本的最近鄰樣本的近鄰集標(biāo)準(zhǔn)化當(dāng)前樣本,再使用LOF方法進(jìn)行檢測.NS–LOF的步驟如下:首先尋找樣本x的最近鄰樣本x(1),其次尋找x(1)的前N近鄰樣本集,計算此近鄰集的均值m(N(x(1)))和標(biāo)準(zhǔn)差s(N(x(1))),最后使用式(5)對x進(jìn)行標(biāo)準(zhǔn)化:
使用NS方法對前一節(jié)圖1(a)中的過程數(shù)據(jù)進(jìn)行處理,選取近鄰個數(shù)為4,結(jié)果見圖2(a).由于后半階段發(fā)生的故障樣本的最近鄰樣本處于前半階段,導(dǎo)致其近鄰集也都來自前半階段樣本集,所以該部分故障樣本在NS標(biāo)準(zhǔn)化后混入了正常樣本,NS標(biāo)準(zhǔn)化出現(xiàn)了錯誤.因此,所用的近鄰樣本應(yīng)來自于樣本的相近時刻的正常樣本才是合理的,所以本節(jié)提出數(shù)據(jù)處理方法—–時空近鄰標(biāo)準(zhǔn)化(TSNS).
首先,在訓(xùn)練集中尋找樣本x在時間方向上的前N近鄰樣本集再尋找在空間方向上的前K近鄰樣本集=使用式(6)–(7)計算此樣本集的均值和標(biāo)準(zhǔn)差,最后使用式(8)將x標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)樣本:
圖2 TSNS–LOF方法對動態(tài)非線性過程的監(jiān)控Fig.2 Monitoring of TSNS–LOF method in dynamic and nonlinear process
對于正常樣本而言,其時間和空間近鄰樣本都是相似的,經(jīng)TSNS處理后樣本位于坐標(biāo)原點(diǎn)周圍.對于故障樣本而言,它離其同時刻的正常樣本較遠(yuǎn),所以其近鄰距離較大,經(jīng)TSNS處理后,其標(biāo)準(zhǔn)樣本離坐標(biāo)原點(diǎn)較遠(yuǎn).總之,TSNS方法能夠?qū)崿F(xiàn)故障與正常樣本在空間上的分離.由于TSNS方法使用了相近時刻樣本的近鄰集,能夠避免只使用空間近鄰導(dǎo)致的錯誤.
時空近鄰標(biāo)準(zhǔn)化中的兩個近鄰參數(shù)N和K的選取原則:要求訓(xùn)練數(shù)據(jù)經(jīng)時空近鄰標(biāo)準(zhǔn)化后數(shù)據(jù)具有最佳的正態(tài)性.此時每個樣本之間是獨(dú)立的,也就是沒有時序相關(guān)性,即消除了過程的動態(tài)性.
使用TSNS方法對前一節(jié)的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,其中N=4,K=5,結(jié)果見圖2(b).TSNS方法實(shí)現(xiàn)了故障樣本和正常樣本的分離.
最后,根據(jù)訓(xùn)練樣本的LOF值使用核密度估計等方法確定其分布,將其分布的相應(yīng)于置信度α的上分位數(shù)作為檢測模型的控制限.TSNS–LOF具體計算過程如下:
1)離線建模.
a)采集正常樣本組成模型的訓(xùn)練集X,對每個樣本xi尋找其時間方向上的前N近鄰集N(xi)=,再對N(xi)中的每個樣本,尋找其空間方向上前K近鄰集
b)使用式(6)–(8)進(jìn)行對xi進(jìn)行時空近鄰標(biāo)準(zhǔn)化,獲得標(biāo)準(zhǔn)樣本,組成標(biāo)準(zhǔn)訓(xùn)練集.
d)對全體訓(xùn)練樣本的LOFi使用核密度估計方法確定相應(yīng)于置信度α的檢測模型控制限LOFα.
2)在線檢測.
a)在X中,尋找在線新樣本x在時間方向上的前N近鄰集,再對N(x)中的每個樣本,查詢其空間方向上的前K近鄰集
b)使用式(6)–(8)對x進(jìn)行時空近鄰標(biāo)準(zhǔn)化操作,獲得標(biāo)準(zhǔn)樣本.
d)當(dāng)LOFx >LOFα?xí)r,則判定樣本x為故障,否則為正常.
圖2(c)為參數(shù)k=4時TSNS–LOF方法對前一節(jié)所述過程的故障檢測結(jié)果,檢測出全部故障.
田納西–伊斯曼過程(Tennessee–Eastman process)是一個典型的化工聯(lián)合生產(chǎn)過程.已有大量的過程控制和故障診斷方法[2,6,8,12,15,18,25]將其作為算法的評價測試平臺.TE過程主要由反應(yīng)器、冷凝器、壓縮器、分離器和汽提塔等5個操作單元組成[15,18].在生產(chǎn)過程中,4種氣態(tài)物料A,C,D和E反應(yīng)生產(chǎn)出兩種產(chǎn)品G和H,伴有一種副產(chǎn)品F,另外在進(jìn)料中還混有少量的惰性氣體B[15,18].
TE過程包含12個控制變量,19個連續(xù)測量變量和22個成分測量變量[15,18].本文選取全部41個測量變量用于故障檢測.過程在模態(tài)1(G:H=50:50)下正常運(yùn)行48 h后,切換到模態(tài)3(G:H=90:10)下再運(yùn)行48 h,前后分別以3 min和6 min為間隔采集數(shù)據(jù)組成訓(xùn)練集;為了檢驗TSNS–LOF方法的性能,產(chǎn)生一組測試集:過程在模態(tài)1下運(yùn)行48 h,從8 h至結(jié)束引入7類故障,以3 min為采樣間隔產(chǎn)生測試數(shù)據(jù),故障描述見表1.
表1 TE過程故障描述Table 1 Fault descriptions for TE process
使用PCA,DPCA,kNN,LOF 與TSNS–LOF對TE過程進(jìn)行監(jiān)控,并檢測故障,所用方法的置信水平均取為97%.圖3給出了測試集中故障批次f6的檢測圖,表2分別給出了所用方法對測試集中全部故障批次的故障檢測率和誤報率(最后一行).
PCA和DPCA主元個數(shù)分別取為9和20[14],DPCA中的時滯參數(shù)取為2[14].kNN 的近鄰個數(shù)k=4.TSNS–LOF 方法的近鄰個數(shù)N=3,K=4,k=4.從表2可看出所有方法對測試集的故障f1,f2,f3,f4的檢測率均較高;PCA,DPCA,kNN和LOF方法對故障f5,f6,f7的檢測率較低,而TSNS–LOF方法檢測率最高.
Fig.3 測試集中批次f6的故障檢測結(jié)果Fig.3 Fault detection results for batch f6 in test set
表2 測試集的故障檢測率和誤報率(%)Table 2 Fault detection rate and false alarm rate of test set(%)
圖4(a)給出了正常樣本和故障f7的反應(yīng)器溫度和反應(yīng)器冷凝液出口溫度,TE過程正常數(shù)據(jù)分為兩個模態(tài),故障f7位于正常樣本周圍.PCA,DPCA方法的統(tǒng)計量都要求過程數(shù)據(jù)服從單模態(tài)的多元高斯分布,它們的T2控制限為在各自主元空間內(nèi)中心在原點(diǎn)的超橢球面.而很多故障位于兩個模態(tài)數(shù)據(jù)之間,即比較接近數(shù)據(jù)中心導(dǎo)致其T2值較小,它們被錯誤地包含在超橢球面內(nèi)部,導(dǎo)致誤報為正常,所以T2對f5,f6,f7的檢測率較低.SPE控制限為殘差空間內(nèi)的超球面,由于大多數(shù)故障位于兩個模態(tài)數(shù)據(jù)之間,導(dǎo)致其到數(shù)據(jù)中心的歐式距離較小,也被包含在超球面內(nèi)部,仍被誤報為正常,所以SPE 對f5,f6,f7 的檢測率也較低.DPCA方法雖然能夠提取過程的動態(tài)特性,但是其統(tǒng)計量亦有單模態(tài)的多元高斯分布的假設(shè),所以其對多模態(tài)過程的部分故障的檢測率也比較低.
Fig.4 TE過程數(shù)據(jù)圖Fig.4 TE process data diagrams
kNN方法和LOF方法能夠?qū)σ话愕亩嗄B(tài)過程進(jìn)行故障檢測.LOF方法能夠提取疏密程度信息,所以其對f5,f6,f7的檢測率比kNN方法略高.但它們對f5,f6,f7的檢測率仍然較低.下面以故障f7的第201個樣本分析kNN方法和LOF方法漏報的原因.此樣本的故障主要發(fā)生在第9個變量(反應(yīng)器溫度)上見圖4(a)中方框點(diǎn).所有訓(xùn)練樣本的統(tǒng)計量中變量貢獻(xiàn)值的平均值見圖5,在其變量貢獻(xiàn)值中,雖然第9個變量貢獻(xiàn)值高于正常樣本的,但是其余變量的貢獻(xiàn)較小,導(dǎo)致其變量貢獻(xiàn)值之和(即統(tǒng)計量)小于訓(xùn)練樣本的,也就低于控制限,所以不能被LOF方法檢測出,kNN方法的原因類似.
TSNS–LOF方法使用正確時刻的近鄰集信息將數(shù)據(jù)標(biāo)準(zhǔn)化為單模態(tài)數(shù)據(jù)見圖4(b),同時其避免了故障樣本標(biāo)準(zhǔn)化出錯的問題,所以TSNS–LOF方法的檢測率最高且檢測比較及時,見圖3(e)和表2.
Fig.5 LOF中變量貢獻(xiàn)圖Fig.5 Contribution diagram of variables in LOF
通過數(shù)值模擬過程分析了LOF在動態(tài)過程故障檢測中存在的不足.針對復(fù)雜過程的非線性、動態(tài)性和多模態(tài)的特點(diǎn),提出了TSNS–LOF的故障檢測方法.TSNS克服了非線性、動態(tài)性和多中心的不利影響.將TSNS–LOF 應(yīng)用于TE 過程故障檢測過程中,并與PCA,DPCA,kNN,LOF方法進(jìn)行比較.實(shí)驗結(jié)果表明TSNS–LOF對動態(tài)性或多模態(tài)過程故障具有較高的檢測能力.