王國(guó)柱,胡永濤,李 元,杜志勇
(1.河南工學(xué)院電氣工程與自動(dòng)化學(xué)院,河南新鄉(xiāng) 453003;2.沈陽化工大學(xué)信息工程學(xué)院,遼寧沈陽 110142)
隨著工業(yè)過程生產(chǎn)規(guī)模的不斷擴(kuò)大,系統(tǒng)復(fù)雜性的日益提高,有效的故障診斷方法成為了保證工業(yè)生產(chǎn)安全和提高產(chǎn)品質(zhì)量的關(guān)鍵.基于統(tǒng)計(jì)理論的方法作為故障診斷領(lǐng)域的主要方法之一,已經(jīng)受到了國(guó)內(nèi)外研究人員的廣泛關(guān)注并得到了較快的發(fā)展[1–10].該方法具有不需要建立系統(tǒng)精確數(shù)學(xué)模型的優(yōu)勢(shì),主要依賴正常過程數(shù)據(jù)建立統(tǒng)計(jì)模型,從統(tǒng)計(jì)學(xué)角度對(duì)生產(chǎn)過程的安全性進(jìn)行描述.另外,當(dāng)檢測(cè)到工業(yè)過程中存在故障時(shí),提取有效的故障信息,研究各種故障和異常變量之間的關(guān)系,建立準(zhǔn)確的“故障–征兆”表并將其作為后續(xù)故障決策與評(píng)價(jià)時(shí)可用的知識(shí)庫(kù)是非常必要的,也成為目前故障診斷領(lǐng)域研究的熱點(diǎn)問題[11–14].在基于統(tǒng)計(jì)理論研究的框架下,貢獻(xiàn)圖是最常用的異常變量識(shí)別方法,可以分為平方預(yù)報(bào)誤差(squared prediction error,SPE)貢獻(xiàn)圖和T2貢獻(xiàn)圖兩種[15],該類方法通過柱狀圖使每個(gè)變量的貢獻(xiàn)值可視化,能夠直觀地顯示出故障發(fā)生時(shí)各變量的貢獻(xiàn)程度.故障發(fā)生后,貢獻(xiàn)圖方法通常認(rèn)為對(duì)統(tǒng)計(jì)指標(biāo)貢獻(xiàn)較大的變量為可能造成過程故障發(fā)生的責(zé)任變量,但并沒有確定貢獻(xiàn)變量的控制閾值,即各個(gè)變量的貢獻(xiàn)僅起到指導(dǎo)作用,最終的故障原因還需要過程經(jīng)驗(yàn)豐富的操作人員進(jìn)一步分析和確定;換句話說,即貢獻(xiàn)圖方法只能對(duì)變量貢獻(xiàn)進(jìn)行排序,大致找到發(fā)生異常的變量,并不能識(shí)別過程中所有發(fā)生異常的變量[16].類似主元分析(principal component analysis,PCA)貢獻(xiàn)圖方法,一些基于完全分解、局部分解和角度的異常變量識(shí)別方法也被相繼提出,Alcala在文獻(xiàn)[17]中也對(duì)這些方法進(jìn)行了總結(jié),并闡明了此類方法的優(yōu)缺點(diǎn).隨后,基于重構(gòu)貢獻(xiàn)的方法也逐漸興起,Qin等人[18]提出了一種基于傳感器有效度指標(biāo)的故障診斷技術(shù),作者認(rèn)為通過對(duì)異常傳感器的數(shù)據(jù)重構(gòu),可以有效地減小SPE統(tǒng)計(jì)指標(biāo),在對(duì)沒有發(fā)生故障的傳感器變量重構(gòu)時(shí),由于故障信息仍然存在,重構(gòu)后的SPE值與故障時(shí)沒有太大的變化,這也為異常變量的辨識(shí)提供了保障;Alcala和Qin[19]提出了一種基于重構(gòu)貢獻(xiàn)(reconstruction based contribution,RBC)的故障診斷技術(shù),驗(yàn)證當(dāng)只發(fā)生傳感器故障時(shí),重構(gòu)貢獻(xiàn)圖方法的診斷準(zhǔn)確率要高于傳統(tǒng)貢獻(xiàn)圖方法.雖然上述方法在對(duì)過程中異常變量進(jìn)行識(shí)別時(shí)具有較高的準(zhǔn)確性,但它們通常需要假設(shè)故障方向已知或過程中已經(jīng)具備經(jīng)驗(yàn)知識(shí),而過程中準(zhǔn)確的假設(shè)和有效經(jīng)驗(yàn)的獲取具有一定的難度,并且該類方法和傳統(tǒng)貢獻(xiàn)圖方法一樣不能避免變量之間的擴(kuò)散效應(yīng)[20].
近年來,基于k–NN理論的故障檢測(cè)方法已經(jīng)被提出并成功用于監(jiān)視連續(xù)過程和間歇過程.但由于該方法的計(jì)算量大,需要存儲(chǔ)的中間值多,k–NN方法對(duì)計(jì)算機(jī)的計(jì)算速度與存儲(chǔ)空間就有較高的要求.為了解決這些問題,He等人[21]提出了PC–k–NN方法,該方法采用原始樣本的主成分作為建模樣本,既降低了計(jì)算距離的運(yùn)算量,又節(jié)省了存儲(chǔ)空間,但該方法忽略了發(fā)生在殘差空間的異常信息.隨后,Li等人[22]提出了一種基于特征空間k最近鄰(feature spaceknearest neighbor,FS–k–NN)的批次過程故障檢測(cè)方法,該方法結(jié)合特征空間的主元部分和殘差部分全面表示原始數(shù)據(jù)的有用信息,取得了一定的效果.盡管k–NN方法在故障檢測(cè)領(lǐng)域已經(jīng)取得了令人滿意的成果,但在故障診斷與異常變量識(shí)別方面的研究較少.因此,在沒有可用故障數(shù)據(jù)知識(shí)和經(jīng)驗(yàn)的情況下應(yīng)用k–NN方法進(jìn)行異常變量的有效識(shí)別存在一定的挑戰(zhàn),也具有一定的學(xué)術(shù)研究?jī)r(jià)值和實(shí)際意義.
基于以上討論,本文提出了一種基于k近鄰變量貢獻(xiàn)與重構(gòu)理論的工業(yè)故障診斷方法,該方法不需要進(jìn)行數(shù)據(jù)變換,并且能夠有效避免因變量擴(kuò)散效應(yīng)帶來的影響.首先,從過程正常運(yùn)行數(shù)據(jù)集中提取每個(gè)樣本在k–NN檢測(cè)階段的距離統(tǒng)計(jì)指標(biāo),將其細(xì)化并分解為各變量的貢獻(xiàn)值,并分別從單變量異常和多變量異常角度研究方法的可行性,保證異常變量具有較大的貢獻(xiàn),進(jìn)而利用核密度估計(jì)方法確定各個(gè)變量貢獻(xiàn)的控制閾值;其次,當(dāng)樣本存在故障時(shí),將異常樣本的k近鄰距離統(tǒng)計(jì)指標(biāo)分解到每個(gè)變量,確定當(dāng)前樣本中各個(gè)變量的貢獻(xiàn),并與正常模型中的控制閾值比較,“一次”識(shí)別該樣本中存在的異常變量;再次,研究了基于k–NN理論的數(shù)據(jù)重構(gòu)方法,對(duì)“一次”識(shí)別到的異常變量進(jìn)行重構(gòu);當(dāng)重構(gòu)后樣本經(jīng)過k–NN檢測(cè)仍然存在故障時(shí)需返回貢獻(xiàn)分析階段進(jìn)行異常變量的“二次”識(shí)別,直到找到過程中發(fā)生異常的所有變量,最終建立準(zhǔn)確的“故障–征兆”表.本文采用數(shù)值仿真與CSTR系統(tǒng)驗(yàn)證了所提出方法的有效性和可靠性.
k–NN近鄰法,又稱k–NN分類法,它是一種可以預(yù)測(cè)未知類或標(biāo)簽的非參數(shù)監(jiān)督分類方法,對(duì)于未知分布和非正態(tài)分布的數(shù)據(jù)集可以獲得較高的分類準(zhǔn)確率,具有健壯性強(qiáng),概念清晰和適用非高斯、非線性數(shù)據(jù)等諸多優(yōu)點(diǎn)[22].假若一個(gè)樣本在特征空間中的k個(gè)最相似(距離最近)樣本大多數(shù)都屬于某一個(gè)類別,則此樣本也屬于這個(gè)類別;只有當(dāng)新的樣本與其在訓(xùn)練樣本的前k個(gè)最近鄰的距離超出類別屬性時(shí),稱該樣本與訓(xùn)練樣本具有較大差異[23].目前,該思想已經(jīng)被應(yīng)用于工業(yè)過程故障監(jiān)視.
基于k–NN的過程故障檢測(cè)方法直接利用正常工作條件下的過程數(shù)據(jù),選取每個(gè)樣本的前k個(gè)鄰近數(shù)據(jù)樣本建立過程的統(tǒng)計(jì)模型,提取正常樣本之間的最近鄰距離特征量,確定模型的統(tǒng)計(jì)控制限,進(jìn)而對(duì)實(shí)時(shí)樣本進(jìn)行檢測(cè).假設(shè)采集到的過程正常運(yùn)行數(shù)據(jù)集為Xn×m,n為樣本個(gè)數(shù),m為變量或傳感器個(gè)數(shù),k–NN方法可以通過圖1步驟進(jìn)行故障檢測(cè):
1)標(biāo)準(zhǔn)化正常過程數(shù)據(jù)Xn×m,將其轉(zhuǎn)化為零均值,單位標(biāo)準(zhǔn)差的矩陣xn×m;
2)根據(jù)式(1)計(jì)算正常數(shù)據(jù)集中任意樣本xi與其他樣本之間的歐氏距離d(xi,·)并對(duì)其排序,找到xi的前k個(gè)最近鄰樣本N1(xi),N2(xi),···,Nk(xi);
3)根據(jù)式(2)計(jì)算每個(gè)正常樣本xi與其k個(gè)近鄰的距離統(tǒng)計(jì)量:
4)使用核密度方法[24]對(duì)3)中所得到的n個(gè)距離統(tǒng)計(jì)量進(jìn)行估計(jì),確定置信度為99%的控制限δLimit;
5)對(duì)于新采集到的實(shí)時(shí)數(shù)據(jù)xnew,采用建模時(shí)的均值及標(biāo)準(zhǔn)差進(jìn)行標(biāo)準(zhǔn)化處理;
6)求取其與訓(xùn)練樣本的前k個(gè)最近鄰的距離并計(jì)算統(tǒng)計(jì)指標(biāo)(k個(gè)最近鄰距離平方和);
圖1 k–NN建模與故障檢測(cè)過程流程圖Fig.1 Flow chart of k–NN modeling and fault detection
從上述k–NN建模過程中可以得到,式(2)為樣本xi的距離統(tǒng)計(jì)量,由m個(gè)變量的貢獻(xiàn)累加和構(gòu)成,因此,可以將分解為m個(gè)變量的累加和,如式(3)所示:
其中εl為第l個(gè)元素為1、其余元素為零的行向量.
此時(shí),式(4)可以定義為樣本xi中第l個(gè)變量對(duì)距離統(tǒng)計(jì)指標(biāo)的貢獻(xiàn):
根據(jù)式(3)和式(4)可知,樣本的k–NN統(tǒng)計(jì)量與各變量的貢獻(xiàn)之間存在如下關(guān)系:
根據(jù)以上分析得到,樣本xi的第l個(gè)變量對(duì)距離統(tǒng)計(jì)指標(biāo)的貢獻(xiàn)實(shí)際上等于該樣本與其k個(gè)最近鄰第l個(gè)分量的平方距離之和,即變量貢獻(xiàn)分析時(shí)僅考慮了變量自身的影響,并沒有考慮各個(gè)變量之間的關(guān)系,可以有效避免變量之間的擴(kuò)散效應(yīng),但在過程故障時(shí)是否能夠保證異常變量對(duì)統(tǒng)計(jì)指標(biāo)的貢獻(xiàn)一定大于其他變量需做出進(jìn)一步說明.下面分兩種情況對(duì)k–NN變量貢獻(xiàn)方法的可行性進(jìn)行了分析,分別為單變量異常情況和多變量異常情況[25–26].
假設(shè)樣本xf為故障樣本,該樣本中只有第r個(gè)變量偏離正常運(yùn)行范圍,此時(shí)故障樣本xf可以分解為
式(6)中:x?為該樣本的正常部分;εrfr為異常部分,εr為故障方向,表示該樣本中第r個(gè)變量發(fā)生異常,fr為對(duì)應(yīng)方向上的故障幅值.將式(6)代入式(4)得到
在式(7)中,由于Nj(xf)表示xf在正常數(shù)據(jù)集中的近鄰樣本,而x?為xf中包含的正常部分,因此存在x??Nj(xf)≈0,此時(shí),式(7)可以近似表示為
式(8)表示樣本xf中第l個(gè)變量的貢獻(xiàn),且存在關(guān)系
當(dāng)故障方向r=l時(shí),異常變量的貢獻(xiàn)值Cfr=;而其余變量的貢獻(xiàn)值Cfl ≈0,即存在關(guān)系
根據(jù)上述討論可知,k–NN變量貢獻(xiàn)方法可以保證單個(gè)變量異常時(shí)其貢獻(xiàn)最大.
樣本xf為故障樣本,該樣本中存在多個(gè)變量偏離正常運(yùn)行范圍,此時(shí)假設(shè)異常變量個(gè)數(shù)為3個(gè),分別為變量a,b,c,此時(shí)故障樣本xf可以分解為如下形式:
同上,式(11)中:x?為該樣本的正常部分,εafa,εbfb和εcfc為異常部分,ε和f分別為相應(yīng)的故障方向和故障幅值.將式(11)代入式(4)得到
同理,式(12)中存在x??Nj(xf)≈0,此時(shí),式(12)可以近似表示為
與單變量異常情況類似,當(dāng)故障方向?yàn)閍,b,c時(shí),可得
根據(jù)上述討論可知,k–NN變量貢獻(xiàn)方法對(duì)多個(gè)變量發(fā)生異常情況同樣有效,可以保證變量異常時(shí)其貢獻(xiàn)大于其他變量的貢獻(xiàn)值.
變量貢獻(xiàn)控制閾值描述的是變量在正常工況下的波動(dòng)情況,也就是說,故障樣本的異常變量貢獻(xiàn)會(huì)大于正常樣本中該變量對(duì)距離指標(biāo)的貢獻(xiàn).由于在建模過程中使用的數(shù)據(jù)均來自正常過程且處于穩(wěn)定狀態(tài),因此建模時(shí)每個(gè)變量對(duì)統(tǒng)計(jì)指標(biāo)的貢獻(xiàn)應(yīng)該相對(duì)穩(wěn)定,此時(shí)可以使用正常樣本中各變量貢獻(xiàn)組成的矩陣C進(jìn)一步確定每個(gè)變量貢獻(xiàn)的控制限.文獻(xiàn)[23,26]介紹了使用非中心χ2分布計(jì)算k–NN距離控制限的方法,作者認(rèn)為每個(gè)樣本的k近鄰距離統(tǒng)計(jì)指標(biāo)近似服從非中心χ2分布,可以通過χ2分布函數(shù)確定某個(gè)自信水平的控制閾值,但文中并沒有論證距離統(tǒng)計(jì)指標(biāo)是否服從非中心χ2分布.本文采用不需要貢獻(xiàn)指標(biāo)服從分布假設(shè)的核密度估計(jì)方法[24]計(jì)算正常過程變量貢獻(xiàn)的控制閾值,結(jié)果為
其中:ContLimit為正常運(yùn)行過程中所有變量貢獻(xiàn)的控制閾值集合;元素表示在過程正常運(yùn)行時(shí)第i個(gè)變量貢獻(xiàn)控制閾值.
對(duì)于過程中采集到的實(shí)時(shí)樣本,使用k–NN方法進(jìn)行故障檢測(cè),當(dāng)統(tǒng)計(jì)指標(biāo)大于控制閾值時(shí),表示系統(tǒng)中存在故障.隨后,為了確保設(shè)備能夠恢復(fù)到正常狀態(tài),需要對(duì)該故障樣本進(jìn)行異常變量識(shí)別,判斷哪些變量沒有跟隨正常過程的運(yùn)行軌跡.下面對(duì)k–NN故障檢測(cè)及基于變量貢獻(xiàn)分析的異常變量“一次”識(shí)別過程進(jìn)行了介紹:
1)對(duì)于新采集到的實(shí)時(shí)數(shù)據(jù)X1×m,采用建模時(shí)的均值及標(biāo)準(zhǔn)差處理,得到xtext;
2)求取xtext與訓(xùn)練樣本的前k個(gè)最近鄰的距離并計(jì)算統(tǒng)計(jì)指標(biāo)D2(xtext);
3)將D2(xtext)與正常過程統(tǒng)計(jì)量的控制限δLimit比較,如果統(tǒng)計(jì)量小于控制限,即D2(xtext)≤δLimit時(shí),表示該樣本正常;反之,樣本發(fā)生故障,此時(shí),測(cè)試樣本xtext可以描述為故障樣本xf;
4)對(duì)于故障樣本xf,根據(jù)式(16)計(jì)算每個(gè)變量對(duì)該樣本的k–NN 貢獻(xiàn)統(tǒng)計(jì)指標(biāo),其中,Nj(xf)表示xf在建模數(shù)據(jù)中的第j個(gè)近鄰;
5)將故障樣本中每個(gè)變量的貢獻(xiàn)值Conti與式(15)中正常過程變量貢獻(xiàn)的控制閾值比較,如果貢獻(xiàn)值小于控制閾值,表示樣本中該變量正常;反之,該變量發(fā)生異常.
本節(jié)提出了一種基于k–NN理論的數(shù)據(jù)重構(gòu)方法,目的是使用該重構(gòu)方法對(duì)故障情況下根據(jù)變量貢獻(xiàn)值和變量貢獻(xiàn)閾值“一次”識(shí)別到的異常變量進(jìn)行數(shù)據(jù)重構(gòu),進(jìn)而對(duì)重構(gòu)后的樣本再次進(jìn)行故障檢測(cè),當(dāng)重構(gòu)后樣本中無故障時(shí),異常變量識(shí)別過程結(jié)束;反之,需返回變量貢獻(xiàn)分析階段進(jìn)行“二次”識(shí)別.
重構(gòu)方法:為方便理解,變量重構(gòu)時(shí)假設(shè)過程中僅有一個(gè)變量發(fā)生異常,結(jié)合圖2對(duì)計(jì)算過程中幾個(gè)符號(hào)和參數(shù)進(jìn)行了定義.
圖2 變量重構(gòu)細(xì)節(jié)圖Fig.2 The detail of variable reconstruction
具體定義內(nèi)容如下:1)xf為故障樣本,為樣本xf去掉異常變量后由剩余變量組成的樣本,參見圖2,陰影部分的v1為貢獻(xiàn)分析和“一次”識(shí)別方法確定的異常變量;
3)d1,d2,···,dk分別為與其在中前k個(gè)最近鄰樣本之間的歐氏距離,樣本標(biāo)簽為,j=1,2,···,k且滿足d1 進(jìn)行數(shù)據(jù)重構(gòu)時(shí),首先要根據(jù)式(17)確定能夠使重構(gòu)誤差達(dá)到最小的k值,當(dāng)k值確定后根據(jù)式(18)重構(gòu)變量v1. 根據(jù)前文介紹的k–NN建模、變量貢獻(xiàn)分析、故障檢測(cè)以及異常變量“一次”識(shí)別方法,本節(jié)繪制了基于貢獻(xiàn)分析與數(shù)據(jù)重構(gòu)的異常變量精確識(shí)別過程流程圖,如圖3所示,并根據(jù)該圖介紹了異常變量的“二次”識(shí)別方法(假設(shè)該過程僅有兩個(gè)變量發(fā)生異常:變量v1和v2). 1)采用上述重構(gòu)方法對(duì)故障樣本中的異常變量v1和v2進(jìn)行重構(gòu),重構(gòu)后可表示為變量v1c和v2c,此時(shí)原故障樣本可以被重新描述為xfc,如圖3所示; 2)對(duì)于xfc,尋找其在建模階段訓(xùn)練數(shù)據(jù)中的前k個(gè)最近鄰,并根據(jù)式(2)計(jì)算該樣本點(diǎn)與其近鄰的平方距離D2(xfc); 3)比較距離指標(biāo)D2(xfc)和控制閾值δLimit,判斷此時(shí)該樣本的統(tǒng)計(jì)指標(biāo)是否恢復(fù)到正常統(tǒng)計(jì)范圍之內(nèi).當(dāng)距離指標(biāo)已經(jīng)處于正常狀態(tài)時(shí),識(shí)別過程結(jié)束,異常變量?jī)H為變量v1和v2;否則,將重構(gòu)變量v1和v2后的新樣本轉(zhuǎn)入變量貢獻(xiàn)分析并進(jìn)行故障樣本的“二次”異常變量識(shí)別,直至在對(duì)重構(gòu)后的樣本故障檢測(cè)時(shí)檢測(cè)不到故障存在為止. 圖3 基于k–NN變量貢獻(xiàn)分析與數(shù)據(jù)重構(gòu)的異常變量精確識(shí)別過程流程圖Fig.3 Flow chart of abnormal variable identification based on k–NN variable contribution analysis and data reconstruction 本節(jié)給出了數(shù)值仿真和連續(xù)攪拌釜式反應(yīng)器(continuous stirred tank reactor,CSTR)系統(tǒng)驗(yàn)證提出方法的有效性.首先通過一個(gè)七變量數(shù)值仿真實(shí)例,對(duì)比基于PCA的貢獻(xiàn)圖和RBC方法的異常變量識(shí)別結(jié)果,驗(yàn)證了提出方法的有效性;然后針對(duì)CSTR系統(tǒng)中的實(shí)際故障進(jìn)行方法的應(yīng)用研究. 數(shù)值仿真由兩個(gè)潛隱變量s1和s2構(gòu)造的七變量數(shù)據(jù)組成,如式(19)所示: 式中:e1~e7是均值為零、標(biāo)準(zhǔn)差為0.01的噪聲,s1是從?10 到?7 之間的隨機(jī)數(shù),s2服從正態(tài)分布N(?15,1).根據(jù)式(19)共產(chǎn)生500個(gè)訓(xùn)練樣本用于建立故障檢測(cè)模型;500個(gè)待測(cè)試樣本用于驗(yàn)證基于變量貢獻(xiàn)分析和數(shù)據(jù)重構(gòu)方法在異常變量識(shí)別方面的有效性,其中,故障添加方式如下: 1)x1從101~150時(shí)刻添加8%的階躍故障; 2)x2從401~450時(shí)刻添加10%的階躍故障; 3)x7從401~450時(shí)刻添加5%的階躍故障. 圖4給出了測(cè)試數(shù)據(jù)的k–NN故障檢測(cè)結(jié)果,從圖中可以明顯看出系統(tǒng)分別在101~150和401~450時(shí)間段內(nèi)控制指標(biāo)超出了控制閾值范圍,即此時(shí)段系統(tǒng)中存在故障,且與預(yù)設(shè)故障時(shí)間一致.文中所有圖中“?”表示發(fā)生故障樣本,“?”表示正常樣本. 圖4 測(cè)試數(shù)據(jù)的故障檢測(cè)結(jié)果Fig.4 Fault detection results of test data 在檢測(cè)到過程中存在故障后,需要進(jìn)一步識(shí)別過程中的異常變量.首先,根據(jù)正常數(shù)據(jù)中每個(gè)變量對(duì)控制指標(biāo)的貢獻(xiàn)值計(jì)算其控制閾值;其次,計(jì)算測(cè)試數(shù)據(jù)中每個(gè)時(shí)刻的變量貢獻(xiàn)值,并與正常過程中各變量的控制閾值比較,結(jié)果如圖5所示. 從圖5(a)中可以看出,x1的貢獻(xiàn)指標(biāo)在101~150時(shí)刻超出控制閾值,即在這段時(shí)間內(nèi)x1異常;x2和x7均在401~450時(shí)間段超限(圖5(b)和(g)),即該段時(shí)間內(nèi)異常變量為x2和x7;而其余變量的貢獻(xiàn)指標(biāo)均在控制范圍之內(nèi),無異常,如圖5(c)–(f)所示.此時(shí),異常變量的“一次”識(shí)別過程結(jié)束. 圖5 變量貢獻(xiàn)分析結(jié)果Fig.5 Variable contribution analysis results 隨后,需要對(duì)得到的異常變量進(jìn)行重構(gòu)并檢測(cè)重構(gòu)后樣本是否回復(fù)正常狀態(tài),圖6給出了使用重構(gòu)方法將101~150時(shí)間段變量x1,401~450時(shí)間段變量x2和x7重構(gòu)之后的k–NN故障檢測(cè)結(jié)果,可以看到此時(shí)所有時(shí)刻的距離指標(biāo)均處于控制閾值之內(nèi),過程中已經(jīng)沒有故障,異常變量的“二次”識(shí)別過程結(jié)束. 為了能夠?qū)⒈疚乃岱椒ㄅc傳統(tǒng)方法進(jìn)行比較:圖7分別給出了3種不同方法的異常變量識(shí)別結(jié)果,圖7(a)為本文方法的異常變量識(shí)別結(jié)果,圖7(b)和圖7(c)分別為基于PCA–SPE的貢獻(xiàn)圖和基于重構(gòu)貢獻(xiàn)(RBC)方法的識(shí)別結(jié)果,圖中顏色越深,表示變量貢獻(xiàn)值越大.可以看到后兩種方法雖然在故障發(fā)生時(shí)間段均能夠顯示異常變量貢獻(xiàn)值較大,但并不能避免因PCA數(shù)據(jù)變換而造成的擴(kuò)散效應(yīng);相比之下,圖7(a)效果更優(yōu),變量之間的擴(kuò)散效應(yīng)明顯消除,驗(yàn)證了所提方法的有效性.表1記錄了該例的“故障–征兆”關(guān)系,精確地顯示了不同時(shí)間段內(nèi)過程中發(fā)生異常的變量. 圖6 測(cè)試數(shù)據(jù)重構(gòu)變量x1,x2和x7后的故障檢測(cè)結(jié)果Fig.6 Fault detection results of test data after reconstructing x1,x2 and x7 圖7 變量貢獻(xiàn)圖Fig.7 Variable contribution plots 表1 異常變量識(shí)別結(jié)果Table 1 Results of abnormal variables recognition 在本節(jié)中,通過CSTR系統(tǒng)[27]對(duì)提出的異常變量精確識(shí)別方法的有效性進(jìn)行了驗(yàn)證,CSTR過程的詳細(xì)描述如下:CSTR是聚合化學(xué)反應(yīng)中廣泛使用的一種反應(yīng)器,其中反應(yīng)原料以穩(wěn)定的流速進(jìn)入反應(yīng)器,反應(yīng)物以同樣地穩(wěn)定速率流出.由于強(qiáng)烈攪拌的作用,使剛剛進(jìn)入反應(yīng)器的新鮮物料與存留在反應(yīng)器中的物料瞬間達(dá)到完全混合,反應(yīng)器內(nèi)部的物料濃度和溫度處處相等,連續(xù)攪拌釜式反應(yīng)器中的反應(yīng)速率即由釜內(nèi)物料的溫度和濃度決定,系統(tǒng)的原理如圖8所示.反應(yīng)器的液位和溫度采用串級(jí)控制.基于質(zhì)量、能量和物料平衡的系統(tǒng)動(dòng)態(tài)方程如式(20)–(23)所示: 其中:A是反應(yīng)器的橫截面積;Ca是反應(yīng)器中反應(yīng)物的濃度;Caf是原料流中反應(yīng)物的濃度;Cp是反應(yīng)物的熱容量;Cpc是冷卻劑的熱容量;E是活化能;h是反應(yīng)器的液位;k0是指數(shù)因子;Qf是進(jìn)入反應(yīng)器的原料流量;Qo是出口流量;Qc是冷卻劑流量;R是通用的氣體常數(shù);T是反應(yīng)器中混合物溫度;Tc是冷卻夾套中冷卻劑的溫度;Tcf是冷卻劑進(jìn)料溫度;Tf是原料流的溫度;U是熱轉(zhuǎn)移系數(shù);Ac是總的傳熱面積;?H是反應(yīng)熱;ρ是反應(yīng)器中混合物的密度;ρc是冷卻劑的密度. 圖8 連續(xù)攪拌釜反應(yīng)器系統(tǒng)原理圖Fig.8 Diagram of the CSTR process CSTR系統(tǒng)的化學(xué)反應(yīng)通常受到物料濃度和溫度的限制,實(shí)際生產(chǎn)過程中催化劑活性的降低、進(jìn)料溫度的變化、進(jìn)料濃度的變化、熱交換器的結(jié)垢、傳感器故障等都可能影響到產(chǎn)品的質(zhì)量.因此,為了模擬并檢測(cè)工業(yè)過程中的實(shí)際故障,采集正常條件下和故障條件下的數(shù)據(jù),表2也分別設(shè)置了6種不同的過程故障,包括階躍和斜坡兩種類型.本文選擇過程中的10個(gè)變量用于仿真和算法驗(yàn)證,變量描述見表3.正常過程和故障過程采樣數(shù)均為200,且故障情況從101時(shí)刻開始引入,持續(xù)到過程結(jié)束. 表2 CSTR系統(tǒng)的故障描述Table 2 Fault descriptions of CSTR system 表3 CSTR過程監(jiān)控變量Table 3 Process monitoring variables of CSTR 首先,使用k–NN故障檢測(cè)方法對(duì)CSTR系統(tǒng)中的故障2數(shù)據(jù)進(jìn)行檢測(cè),從圖9給出的結(jié)果可以看出,故障引入時(shí)間為110時(shí)刻,與故障添加時(shí)間存在大概10個(gè)采樣時(shí)間的滯后,這是由于該系統(tǒng)中故障2為斜坡型故障,故障剛引入時(shí)系統(tǒng)中變量?jī)H發(fā)生了微小的變化,此時(shí)統(tǒng)計(jì)指標(biāo)的改變程度很小,難于檢測(cè)到故障的存在. 圖9 故障2的檢測(cè)結(jié)果Fig.9 Detection results of fault 2 其次,根據(jù)正常樣本集的變量貢獻(xiàn)分析方法確定正常過程中每個(gè)變量的貢獻(xiàn)閾值,并與故障時(shí)間各變量的貢獻(xiàn)指標(biāo)比較,得到如圖10所示的變量貢獻(xiàn)分析結(jié)果.從圖10中可以看到,變量2(原料流的溫度Tf)、變量5(冷卻劑的溫度Tc)和變量10(冷卻劑流率Qc)的貢獻(xiàn)跟隨故障情況發(fā)生變化,即故障2發(fā)生后產(chǎn)生的征兆為變量為2,5和10異常. 圖10 變量貢獻(xiàn)分析結(jié)果Fig.10 Variable contribution analysis results 再次,圖11(a)給出了161時(shí)刻各變量貢獻(xiàn)值與貢獻(xiàn)控制限,“·”表示各個(gè)變量的貢獻(xiàn)控制閾值,可以看出此時(shí)過程中僅有變量2,5和10超限;圖11(b)給出了所有時(shí)間段內(nèi)各個(gè)變量的全局貢獻(xiàn)圖,可以看到在故障引入初期,僅變量2貢獻(xiàn)突出,隨后變量5和10逐漸發(fā)生變化;最后,為了驗(yàn)證異常變量識(shí)別結(jié)果的準(zhǔn)確性,使用數(shù)據(jù)重構(gòu)方法依次將變量2,5和10在101~200時(shí)間段的數(shù)據(jù)重構(gòu),并重新進(jìn)行k–NN故障檢測(cè),從檢測(cè)結(jié)果可以看到此時(shí)距離統(tǒng)計(jì)指標(biāo)均處于控制閾值之內(nèi),如圖12所示,異常變量識(shí)別過程結(jié)束. 圖11 變量貢獻(xiàn)圖Fig.11 Contribution plots 圖12 故障2重構(gòu)變量2,5和10后的檢測(cè)結(jié)果Fig12 Detection results of Fault 2 after reconstructing variables 2,5 and 10 表4記錄了CSTR系統(tǒng)中故障2的異常變量精確識(shí)別結(jié)果,即“故障–征兆”表,其中“0”表示變量正常,“1”為異常變量. 表4 故障2的異常變量識(shí)別結(jié)果Table 4 Results of abnormal variables recognition of fault 2 通過對(duì)CSTR系統(tǒng)工藝流程分析可以得到,在故障2引入初期(110~115時(shí)刻),過程中僅有變量2發(fā)生異常,與表2中描述相符,后期由于進(jìn)料溫度的斜坡上升導(dǎo)致反應(yīng)器溫度升高,為了控制反應(yīng)器內(nèi)溫度達(dá)到目標(biāo)值,需要調(diào)整變量5冷卻劑溫度Tc和變量10冷卻劑流率Qc,因此,在后期時(shí)段中的異常征兆變量為2,5和10.該系統(tǒng)實(shí)例驗(yàn)證了本文所提出的基于k近鄰變量貢獻(xiàn)與重構(gòu)理論可以精確辨識(shí)過程中每種故障與其對(duì)應(yīng)時(shí)刻和變量之間的關(guān)系,即“故障–征兆”表,并且與故障設(shè)置情況相符. 本文主要在k–NN故障檢測(cè)方法的基礎(chǔ)上,通過將各個(gè)采樣時(shí)刻樣本的距離控制指標(biāo)細(xì)化,分解為每個(gè)變量的貢獻(xiàn)并對(duì)貢獻(xiàn)做出詳細(xì)分析,提出了一種基于變量貢獻(xiàn)分析的異常變量識(shí)別方法;為了能夠驗(yàn)證異常變量是否對(duì)控制指標(biāo)具有較大的貢獻(xiàn),分別針對(duì)單變量異常和多變量異常情況進(jìn)行了可行性分析,并在此基礎(chǔ)上研究了異常變量的“一次”識(shí)別方法;隨后,研究了基于k–NN理論的數(shù)據(jù)重構(gòu)方法,詳細(xì)地分析了算法原理;當(dāng)重構(gòu)后樣本經(jīng)過檢測(cè)仍然存在故障時(shí)需返回貢獻(xiàn)分析階段進(jìn)行異常變量的“二次”識(shí)別,直到找到過程中發(fā)生異常的所有變量,并建立準(zhǔn)確的“故障–征兆”表.最后通過數(shù)值例子和在CSTR系統(tǒng)中的仿真驗(yàn)證了提出方法的有效性和可行性.下一步計(jì)劃在本文識(shí)別出故障發(fā)生時(shí)的異常變量的基礎(chǔ)上,深入研究各種故障與異常變量之間的確定關(guān)系,并從故障情況下異常變量之間的傳播關(guān)系,并發(fā)關(guān)系以及耦合關(guān)系入手,準(zhǔn)確分析導(dǎo)致故障發(fā)生的原因,為操作員合理分析故障,排除故障提供有效依據(jù).5 仿真研究
5.1 數(shù)值仿真
5.2 CSTR系統(tǒng)中的應(yīng)用研究
6 結(jié)論和進(jìn)一步的工作