鄧明月,劉建昌,許鵬,譚樹彬,商亮亮
(1 東北大學信息科學與工程學院,遼寧沈陽110819; 2 南通大學電氣工程學院,江蘇南通226019)
隨著工業(yè)規(guī)模和復雜性的不斷增加,故障檢測與診斷技術(shù)在確保工藝安全和提高產(chǎn)品質(zhì)量方面已顯示出巨大的價值。近年來,受益于計算機技術(shù)及分布式系統(tǒng)快速發(fā)展,大量的過程數(shù)據(jù)得以采集、存儲?;跀?shù)據(jù)驅(qū)動的多元統(tǒng)計過程監(jiān)測(multivariate statistical process monitoring,MSPM)方法得到了迅速發(fā)展并廣泛應用于各類工業(yè)過程中[1-3]。
MSPM 方法的核心思想是從高維數(shù)據(jù)中提取表征數(shù)據(jù)內(nèi)在關(guān)系的潛引變量,并在由這些變量構(gòu)成的低維子空間中建立統(tǒng)計指標,最終根據(jù)指標的變化情況對過程進行監(jiān)測。典型方法包括主元分析法(principal component analysis,PCA)[4]、偏最小二乘法(partial least squares,PLS)[5]、獨 立 元 分 析 法(independent component analysis,ICA)[6]等。PCA 和PLS 都是以保留原變量最大方差為原則,選擇一組不相關(guān)變量的線性組合來表示原始相關(guān)變量。此外,PLS 還考慮了輸入輸出變量之間的回歸關(guān)系。它們在使用時僅利用了二階統(tǒng)計量方差,因此在處理非高斯過程時效果較差。ICA 可以從原變量中提取基于高階統(tǒng)計量的獨立分量,因此其對非高斯過程可實現(xiàn)有效監(jiān)測。然而,上述方法都是線性處理方法,對于非線性過程表現(xiàn)較差。通過引入核技術(shù),核主元分析法(kernel principal component analysis,KPCA)[7]、核 獨 立 元 分 析 法(kernel independent component analysis,KICA)[8]等方法被提出。這類方法通過核函數(shù)將輸入空間數(shù)據(jù)映射到高維特征空間,假設(shè)在此空間下數(shù)據(jù)變?yōu)榫€性,然后利用線性方法提取潛引變量并計算表征過程運行狀態(tài)的統(tǒng)計量從而實現(xiàn)過程監(jiān)測。T2與SPE(squared prediction error)是上述方法常用的監(jiān)測統(tǒng)計量[9]。具體來說,T2統(tǒng)計量計算了樣本數(shù)據(jù)點與特征空間原點之間的距離,衡量了特征空間中變量的變化情況。SPE統(tǒng)計量則考慮了變量之間的相關(guān)性被改變的程度,同T2一樣,其本質(zhì)上也是通過度量距離的變化來評估過程偏差。因此,這兩種統(tǒng)計量實現(xiàn)有效檢測的前提是故障幅度不能被計算監(jiān)測統(tǒng)計量時產(chǎn)生的可變性所掩蓋。也就是說,它們對幅值發(fā)生了明顯變化的故障檢測效果好,對于那些只改變變量協(xié)方差結(jié)構(gòu)或潛在分布變化的故障表現(xiàn)較差[10]。
Jenssen[11]提出了KECA 用于數(shù)據(jù)變換和降維。KECA 是一種基于信息論的非線性數(shù)據(jù)變換方法,保持了輸入空間數(shù)據(jù)集的最大Renyi 熵。具體變換過程為:首先利用核函數(shù)將原始數(shù)據(jù)映射到高維特征空間,然后對所得的核矩陣進行特征分解,得到每一對特征值和特征向量對熵值的貢獻,接著選擇前m個對熵值貢獻最大的特征向量作為投影方向,使得數(shù)據(jù)在變化前后熵損最小。KECA 變換的獨特之處在于:(1) 與KPCA 相比,KECA 可以利用更多有用的信息。KPCA 只考慮了二階統(tǒng)計量方差,只能提取數(shù)據(jù)中的高斯特征[12]。KECA 試圖最大程度保留原始數(shù)據(jù)的熵值。在信息論中,熵被用于度量信息的不確定度,這種度量利用了數(shù)據(jù)中的高階統(tǒng)計量。因此,KECA 可以提取數(shù)據(jù)中的非高斯信息。(2) KECA 可以揭示數(shù)據(jù)中潛在的集群結(jié)構(gòu)。它通常生成一個具有不同角度結(jié)構(gòu)的轉(zhuǎn)換數(shù)據(jù)集,這反映了每個特征向量都攜帶關(guān)于數(shù)據(jù)集的集群結(jié)構(gòu)的信息。圖1 給出了一個非線性數(shù)據(jù)集及其經(jīng)過KECA 變換后的數(shù)據(jù)分布圖??梢姡?jīng)過KECA 變換后,不同類的數(shù)據(jù)會被映射到具有潛在標簽的不同角度方向上。上述這些特性使得KECA 已被成功地用于特征提取和聚類等領(lǐng)域[13-15]。在工業(yè)過程監(jiān)測方面,Jiang 等[16]驗證了KECA 在監(jiān)測非線性化工過程方面的有效性。Yang 等[17]提出了基于小波變換和KECA 的故障檢測與診斷方法,在高斯和非高斯同時存在的情況下取得了令人滿意的性能。但其在進行檢測時仍使用基于距離的T2及SPE 統(tǒng)計量,沒有考慮投影后數(shù)據(jù)的結(jié)構(gòu)特征。齊詠生等[18]提出了一種改進的KECA 化工過程故障檢測方法。該方法考慮了KECA 投影后數(shù)據(jù)的結(jié)構(gòu)特性,設(shè)計了基于CS(Cauchy-Schwarz)測度的角度監(jiān)測指標實現(xiàn)故障檢測。然而,該指標的平均檢測率雖然比T2高,但改進效果并不明顯。
圖1 非線性數(shù)據(jù)集及其KECA變換Fig.1 Nonlinear data set and KECA transformation
在檢測到故障后,對故障源進行診斷是快速修復故障的關(guān)鍵。目前,常用的診斷方法有貢獻圖法[19-20]和故障模式識別法[21-25]。貢獻圖法通過比較各過程變量對監(jiān)測統(tǒng)計量的貢獻,利用貢獻大小分離故障變量。然而,對于一些涉及多個相關(guān)故障變量的復雜故障,貢獻圖法可能不能很好地發(fā)揮作用。作為故障模式識別法中的典型方法,相似度因子法因其簡單、快速、應用性強等特點已被眾多學者廣泛研究并應用于實際工業(yè)過程中[23-25]。該方法通過度量與其他已知歷史數(shù)據(jù)集的相似程度來識別未知故障。Johannesmeyer 等[23]提出了基于PCA 相度似因子(PCA similarity factor,PCASF)的多變量數(shù)據(jù)庫模式匹配方法。該方法通過比較兩個數(shù)據(jù)集的主元子空間來度量它們的相似性。針對非線性工業(yè)過程的故障識別問題,Deng 等[25]提出了基于KPCA 相似度因子(KPCA similarity factor,KPCASF)的模式識別方法。由于KPCA 只利用了過程變量的方差信息,所以缺乏有效處理非高斯數(shù)據(jù)的能力。事實上,工業(yè)過程數(shù)據(jù)往往是高斯與非高斯分布共存,在此情況下,基于KPCASF 的故障識別方法在故障診斷方面可能表現(xiàn)不佳。
為了有效地實現(xiàn)非線性工業(yè)過程的故障檢測與診斷,本文提出了一種基于KECA 的新方法。首先,考慮到KECA 可以以角結(jié)構(gòu)的方式揭示數(shù)據(jù)中潛在集群結(jié)構(gòu),設(shè)計了一種新的基于角度的監(jiān)測指標。該指標充分利用了變換后數(shù)據(jù)間的結(jié)構(gòu)特征,使用角度方差度量了數(shù)據(jù)對象之間在方向上的相對差異,彌補了基于距離的監(jiān)測指標對那些故障幅度較小、數(shù)據(jù)結(jié)構(gòu)變化不明顯的故障監(jiān)測效果較差的不足。其次,構(gòu)建了KECA 相似度因子用于故障識別。不同于PCASF 和KPCASF,由于KECA 所提取的熵成分可以是非線性、非高斯的,因此,KECA相似度因子可以對同時具有高斯與非高斯特性的非線性過程進行故障識別。最后,通過典型非線性過程與TE 過程來驗證本文所提方法在過程監(jiān)測方面的有效性。
對于一個由概率密度函數(shù)p(x)生成的數(shù)據(jù)集D:(x1,x2,…,xN),其Renyi熵被定義為
由于對數(shù)函數(shù)是單調(diào)函數(shù),這里只考慮V(p)=∫p2(x)dx的大小。為了估計V(p),引入了Parzen 窗概率密度估計函數(shù)
式中,xt∈D;kσ(x,xt)為Mercer 核函數(shù);σ為核函數(shù)的參數(shù)。利用樣本均值近似估計得到
式中,xt′ ∈D;K為N×N的核矩陣;1 為一個N× 1 的單位向量??赏ㄟ^核矩陣的特征值和特征向量來進行Renyi 熵的估計,核矩陣可以特征分解為K=ΦTΦ=EΛET,Λ為特征值λ1,…,λN組成的對角陣,E為以e1,…,eN為列的特征向量矩陣,進一步推導可得
由式(4)可以看出,V?(p)的每一個分量都對應著一個特征向量的熵的估計值,不同的特征值與特征向量對Renyi熵的貢獻不同。
定義一個從輸入空間到核特征空間的非線性映射?:Rd→?,表現(xiàn)形式為xt→?(xt),t= 1,2,…,N,這里讓Φ=[?(x1),?(x2),…,?(xN)]。將N維數(shù)據(jù)通過Φ映射到由k個KPCA 主軸張成的子空間Um上,選取對式(4)中熵值貢獻較大的前k個特征值和特征向量,可以得到轉(zhuǎn)換后的數(shù)據(jù)
式 中,Tm=[t1,t2,…,tm] 為 得 分 矩 陣;Λm=diag(λ1,…,λm);Em=(e1,…,em)為對應的特征向量矩陣。
樣本外數(shù)據(jù)點通過Φ'投影到Um上滿足
KECA 作為一種MSPM 方法,使用能夠表征過程運行狀態(tài)的監(jiān)測指標實現(xiàn)故障檢測。當過程的運行情況偏離受控狀態(tài)時,監(jiān)測指標會發(fā)生相應的變化。此時,根據(jù)指標的變化情況就可以進行故障檢測。因此,使用合適的監(jiān)測指標是保證有效故障檢測的前提。
2.1.1 基于距離的監(jiān)測指標T2及SPE 統(tǒng)計量為典型的基于距離的監(jiān)測指標。
T2統(tǒng)計量被定義為:
從式(7)可以看出,T2統(tǒng)計量利用得分向量的模的變化來反映過程的變化情況。由于特征空間包含了反應過程運行狀態(tài)的大部分信息。因此使用可以同時監(jiān)控多個得分向量的T2控制圖就可以監(jiān)視整個生產(chǎn)過程。
SPE統(tǒng)計量被定義為:
SPE 統(tǒng)計量刻畫了變量之間的相關(guān)性被改變的程度,顯示了異常的過程狀況。
事實上,T2及SPE 統(tǒng)計量本質(zhì)上都是基于距離的監(jiān)測指標,只考慮對具有一定故障幅度的重要故障進行檢測,并要求這些故障幅度不能被計算監(jiān)測統(tǒng)計量時產(chǎn)生的可變性所掩蓋。因此,這兩種指標對那些故障幅度較小及只有數(shù)據(jù)間潛在結(jié)構(gòu)變化的故障監(jiān)測效果較差。
2.1.2 基于角度的監(jiān)測指標設(shè)計 考慮到KECA 通常生成一個具有不同角度結(jié)構(gòu)的轉(zhuǎn)換數(shù)據(jù)集。即經(jīng)過KECA 變換后不同類的數(shù)據(jù)會投影到不同的軸向上,揭示了數(shù)據(jù)中潛在的集群結(jié)構(gòu)。因此,利用KECA 變換后數(shù)據(jù)間的角度結(jié)構(gòu)設(shè)計監(jiān)測指標用于故障檢測,是一種可行的方案。
文獻[26]提出了一種基于角度的離群點檢測思想,其使用向量間角度的方差來表述數(shù)據(jù)對象之間在方向上的相對差異?;诮嵌鹊碾x群點檢測示意圖如圖2 所示。可以看出,對于圖2 中圓形區(qū)域內(nèi)的一個未離群點,其與周圍各向數(shù)據(jù)點形成的所有向量之間的夾角差異很大,相應地會得到較大的角度方差;而對于圓形區(qū)域外的離群點來說,大部分未離群的點多是在某一方向上的聚類簇內(nèi),離群點和這些未離群點形成的角度差異很小,則其角度方差會相對較小。因此,一個點的角度方差如果相當小,那么它就有很大概率為離群點。為了度量上述的角度差異,文獻[26]還給出了一種快速計算方法——近似ABOF。其計算的是數(shù)據(jù)集中A的差分向量對其k近鄰的集合中所有點對的角度方差,滿足
式中,A∈D;(A,B,C)三點相互不同。
圖2 基于角度的離群點檢測示意圖Fig.2 Schematic diagram of angle-based outlier detection
回看圖1 中的KECA 數(shù)據(jù)變換結(jié)果,對于投影到不同軸向上的三類數(shù)據(jù),當設(shè)定某一軸向上的同類數(shù)據(jù)為正常數(shù)據(jù)集時,其他軸向上的點與該軸點之間的角度方差會很小。此時,依據(jù)上述思想,其他軸向上的數(shù)據(jù)點就會被判斷為離群點。受此啟發(fā),本文設(shè)計了基于角度的VoA監(jiān)測指標用于KECA 的故障檢測。該指標是對由KECA 變換得到的得分向量計算approxABOF值,并通過與相應的閾值進行比較來判斷是否為離群點,即故障數(shù)據(jù)點。計算方法如下:
式中,Nk(ti′)?Tm為測試數(shù)據(jù)的得分向量ti′在正常訓練樣本得分向量集內(nèi)的k近鄰;tp,tq∈Nk(ti′)。 當 進 行 在 線 監(jiān) 測 時,ti′ 的approxABOF 即為其與Nk(ti′)中所有得分向量對之間角度的方差。若其approxABOF值較小,意味著ti′偏離了樣本集數(shù)據(jù)的角度結(jié)構(gòu),區(qū)別于正常情況下的數(shù)據(jù)分布,可將其判斷為故障點。
為了和傳統(tǒng)監(jiān)測指標統(tǒng)一,即未發(fā)生故障時,監(jiān)測統(tǒng)計量值較小,發(fā)生故障時,統(tǒng)計量值迅速增大。因此,將approxABOF 平方的倒數(shù)作為VoA監(jiān)控指標的設(shè)計依據(jù),即
其中,為了保持數(shù)據(jù)分布的局部結(jié)構(gòu),最近鄰k的數(shù)量通常設(shè)置為一個不大于15 的整數(shù)[27]。同時,為了保證近似算法具有精確的計算結(jié)果,k值應該足夠大[27]。具體的k值大小根據(jù)實際情況確定。從式(11)可以看出,如果過程偏離了正常操作工況,過程變量之間的分布情況會發(fā)生相應的改變,導致各得分向量之間夾角的差異變大,approxABOF 值降低,相應的VoA監(jiān)控統(tǒng)計量值迅速增大。此時通過比較測試數(shù)據(jù)的統(tǒng)計量VoAtest與在正常運行狀態(tài)下得到的樣本數(shù)據(jù)統(tǒng)計量的控制限VoAlimit大小,即可判斷過程是否發(fā)生故障。其中VoAlimit由核密度估計(kernel density estimation,KDE)方法來確定。
基于KECA 的過程監(jiān)測過程包括離線建模和在線檢測兩個階段。在離線建模階段,建立基于KECA 的過程監(jiān)測模型,確定監(jiān)測統(tǒng)計量的控制限;在在線檢測階段,對實時觀測數(shù)據(jù)進行KECA 變換,然后計算監(jiān)測統(tǒng)計量,通過與相應的控制限比較判斷過程是否發(fā)生了故障。由于特征空間中包含了反應過程運行狀態(tài)的大部分信息,同時考慮到本文所提VoA統(tǒng)計量使用的是得分向量進行計算,監(jiān)測的是特征空間的變化情況,因此本文主要對特征空間進行監(jiān)測。圖3 給出了基于KECA 的過程監(jiān)測流程,具體步驟如下。
離線建模:
(1)對正常訓練數(shù)據(jù)進行標準化,使其具有零均值和單位方差;
(2) 給定核函數(shù)及核參數(shù),利用樣本數(shù)據(jù)構(gòu)建KECA模型并提取得分矩陣Tm=[t1,t2,…,tm];
(3) 利用式(11)計算樣本數(shù)據(jù)的VoA監(jiān)測統(tǒng)計量;
(4)計算監(jiān)測統(tǒng)計量的控制限VoAlimit。
在線檢測:
(1)按離線步驟(1)所得樣本數(shù)據(jù)的均值與方差對測試數(shù)據(jù)歸一化;
圖3 基于KECA的過程監(jiān)測流程圖Fig.3 Flowchart of process monitoring based on KECA
(2) 對當前測試數(shù)據(jù)進行KECA 分析并提取得分向量ti′;
(3) 根據(jù)式(11)計算測試數(shù)據(jù)的VoAtest監(jiān)測統(tǒng)計量;
(4) 將VoAtest與相應的控制限VoAlimit進行比較,如果VoAtest>VoAlimit,則判斷工業(yè)過程發(fā)生了故障,反之,則認為測試數(shù)據(jù)正常,返回繼續(xù)監(jiān)測。
基于KECA 的監(jiān)測模型只能檢測出故障,而不提供導致故障的根本原因的信息。一旦故障被檢測到,則識別故障模式、找出故障根源便成為故障診斷中一個具有挑戰(zhàn)性的任務(wù)。目前,基于相似度因子的故障模式識別方法被眾多學者廣泛研究。相似度因子的核心思想是通過比較兩個特征子空間的相似程度來識別故障模式[25]。本文在此基礎(chǔ)上,構(gòu)建了KECA 相似度因子(KECA similarity factor,KECASF)用于故障模式識別。其通過衡量待測數(shù)據(jù)集與已知故障模式數(shù)據(jù)集之間特征子空間的相似程度,以此判斷測試數(shù)據(jù)的故障類型。下面對KECASF 的計算方法進行詳細的推導。
使用KECA 得到測試故障數(shù)據(jù)集S和歷史故障模式數(shù)據(jù)集H的特征子空間L和V分別為
式中,EL和EV分別為S和H經(jīng)過KECA 變換后得到的對熵值貢獻最大的前m個特征向量組成的矩陣。
此時,KECASF被定義為
定 義 核 函 數(shù)KSH=Φ(S)Φ(H)T及KHS=Φ(H)Φ(S)T。此時,KECASF可以重新表示為
圖4 基于KECA的故障識別流程Fig.4 Flowchart of fault identification based on KECA
本節(jié)以典型的非線性過程及TE過程為例,對本文所提出的基于KECA 的故障檢測與診斷方法進行了評估,并與基于PCA、KPCA 的方法進行了性能比較。
為了驗證所提方法的有效性,采用文獻[28]中給出的非線性數(shù)值案例,具體結(jié)構(gòu)表述如下。
故障1:從第251 個樣本開始直到進程結(jié)束,向變量x3加入一個幅值大小為0.03的微小階躍故障。
故障2:從第101 個樣本開始直到進程結(jié)束,給變量x2加入一個0.005(t- 100)形式的微小斜坡故障。
圖5 和 圖6 給 出 了KECA-VoA、KECA-T2、KPCA-T2及文獻[18]中的KECA-CS方法對兩種微小故障的檢測結(jié)果。可以看出,對于故障1,四種方法的統(tǒng)計量始終圍繞控制限上下波動,不能連續(xù)觸發(fā)報警,但KECA-VoA方法超過控制限的部分要多于另外三種方法。對于故障2,雖然四種方法都檢測到了故障的發(fā)生,但它們在檢出故障的實時性方面有一定的差距。KECA-VoA、KECA-CS、KPCA-T2和KECA-T2檢出故障的時刻分別106、123、132、133,其中KECA-VoA檢出故障的時間明顯提前于其他三種方法。
為了更準確地比較KECA-VoA、KECA-CS、KECA-T2及KPCA-T2的故障檢測性能,表1 列出了四種方法對兩種微小故障的檢測率。當故障1發(fā)生時,KECA-VoA的檢測率最高為62%,KECA-T2和KECA-CS 的檢測率相近,KPCA-T2具有最低的檢測率;當故障2 發(fā)生時,KECA-VoA的檢測率要高于其他三種方法。該結(jié)果表明,本文所設(shè)計的VoA監(jiān)測指標能夠有效提高對微小故障的檢測性能。
為了進一步驗證所提改進KECA 方法的有效性,通過TE 仿真平臺進行仿真驗證。TE 過程是一個基于化工過程的仿真平臺,被廣泛用作各種過程監(jiān)控策略比較的基準過程[29-31]。該過程由反應器、冷凝器、汽提器、分離器和壓縮機五個主要單元組成,包含52 個監(jiān)測變量,其中有11 個操作變量、22個連續(xù)過程變量和19 個成分變量。本文選用22 個連續(xù)變量和11個操作變量來模擬TE反應過程。TE模擬器總共生成21種不同類型的故障,包括工藝變量的階躍變化和隨機變化、反應動力學的緩慢漂移、閥門卡死以及一些未知的故障。此外,TE 過程提供了正常運行條件下的兩個數(shù)據(jù)集,分別包含500 和960 個樣本。同時每個故障條件下還包括兩種故障數(shù)據(jù)集:分別為包含500 個觀測值的訓練數(shù)據(jù)集和包含960 個觀測值的測試數(shù)據(jù)集,故障點在第20個樣本及第160個樣本后引入。
圖5 微小故障1的檢測結(jié)果Fig.5 Fault detection results of minor fault 1
圖6 微小故障2的檢測結(jié)果Fig.6 Fault detection results of minor fault 2
表1 兩種微小故障的檢測率Table 1 Fault detection rate of two minor faults/%
4.2.1 故障檢測性能 本文使用960個正常數(shù)據(jù)樣本建立基于KECA 和KPCA 的監(jiān)測模型,并利用21種故障的測試數(shù)據(jù)集對兩種監(jiān)測模型進行性能評價。兩種方法均選用19 個主元。使用故障檢測率(fault detection rate,F(xiàn)DR)、誤報率(false alarm rate,F(xiàn)AR)及檢測延遲(detection latency,DL)來評價KECA-VoA、KECA-T2及KPCA-T2三種方法對TE 過程的監(jiān)測能力。其中,故障檢測率為檢出故障數(shù)與故障樣本總數(shù)的比值,誤報率為誤報故障數(shù)與正常樣本總數(shù)的比值,檢測延遲為檢出故障時間與實際故障發(fā)生時間的差值,這里定義為首次連續(xù)5 個及其以上采樣點的統(tǒng)計量超過控制限才被判定為發(fā)生了故障。下面以故障4、16 及21 為例,進行故障監(jiān)測性能實驗。
故障4 為反應器冷卻水入口溫度的階躍變化。當擾動發(fā)生時,反應器溫度會突然升高。由于控制器的作用,擾動發(fā)生不久后反應器溫度會恢復到設(shè)定值,但反應器冷卻水流量會異常增加。這說明故障仍存在于生產(chǎn)過程中,需要系統(tǒng)持續(xù)發(fā)出警報。KECA-VoA、KECA-T2及KPCA-T2三種方法對故障4的檢測結(jié)果如圖7 所示。可以看出,KPCA-T2雖然可以檢測出故障4,但統(tǒng)計量始終圍繞控制限上下波動,不能連續(xù)觸發(fā)報警;相比之下,基于KECA 的VoA及T2統(tǒng)計量從第161 個樣本開始保持在控制限以上,清晰可靠地檢測到了發(fā)生的故障。此外,KPCA 的T2統(tǒng)計量在前160 個樣本中有個別超過控制限,存在一定的誤報,而基于KECA 的方法誤報率為0。說明了KECA 在檢測故障4 方面比KPCA 更有效。
圖8 給出了故障16 的檢測結(jié)果??梢钥闯?,KPCA-T2方法幾乎不能檢測出故障,故障檢測率較低只有14%。相比之下,基于KECA 的方法故障檢出效果明顯提升。其中KECA-T2的檢測率為85.85%,KECA-VoA檢測率提高至87.88%。這說明KECA-VoA更能有效地檢測故障16。實際上,故障16 是一種未知故障。當故障發(fā)生時,過程數(shù)據(jù)的整體均值偏差不大,數(shù)據(jù)特征并沒有發(fā)生明顯變化,從而使得基于幅值的監(jiān)測方法效果可能并不理想。
圖7 故障4的檢測結(jié)果Fig.7 Fault detection results of fault 4
圖8 故障16的檢測結(jié)果Fig.8 Fault detection results of fault 16
故障21 為流4 的閥門被固定在穩(wěn)態(tài)位置。其故障幅值較小,不易檢測。從圖9 給出的監(jiān)測結(jié)果觀察到,KECA-VoA、KECA-T2及KPCA-T2檢出故障的時刻分別為610、655 和666。很明顯KECA-VoA檢出故障的時間要提前于其他兩種方法。此外,KECA-T2和KPCA-T2的故障檢測率相近,分別為42.5% 和42%,KECA-VoA的檢測率有所提高為50%。這再次驗證了KECA-VoA能夠提高故障檢測性能。
表2 給出了三種方法對TE 過程21 種故障的檢測結(jié)果。由于故障3、9 及15 的故障征兆不明顯,基于數(shù)據(jù)驅(qū)動的方法很難將它們檢測出來,因此本文對這三種故障不加以考慮。除故障4、11、21 外,由表2 可以看出對于故障1、2、6、7、8、12、13、14、18,KECA 及KPCA 的檢測率都較高。其中除了故障2,KECA-VoA的檢測率都高于其他兩種方法。對于故障10、16、17、19,KECA的檢測性能明顯高于KPCA。同時,相較于使用度量距離的T2監(jiān)測指標,使用VoA進行故障檢測可以得到更高的檢測率。此外,三種方法對故障5 的檢測效果差別不大,但KECA-VoA較其他方法檢測性能還是有所提升。比較三種方法的平均檢測率,KECA-VoA要高于其他方法,并且其故障誤報率最低。在檢出故障的實時性方面,KECA-VoA幾乎對所有故障的檢測延遲都小于其他兩種。實際上,故障初期的幅值一般都較小,KECA-VoA方法可以最快發(fā)現(xiàn)故障,因此其對應微小故障的監(jiān)測性能有所提升。綜上所述,與現(xiàn)有的方法相比,本文所提方法能夠更有效地檢測TE過程的故障。
4.2.2 故障識別性能 當檢測到故障后,需要判斷發(fā)生的故障類型。本文比較了KECASF、KPCASF及PCASF的故障識別性能。
圖9 故障21的檢測結(jié)果Fig.9 Fault detection results of fault 21
對TE 過程21 種故障數(shù)據(jù)構(gòu)建三種數(shù)據(jù)集,分別為歷史故障模式數(shù)據(jù)集、故障早期數(shù)據(jù)集和故障測試數(shù)據(jù)集[25]。如表3 所示,選取21 種故障的訓練數(shù)據(jù)構(gòu)成歷史故障模式數(shù)據(jù)集F01H~F21H 用于建立相似度模型。選取測試數(shù)據(jù)集的第161~360個樣本構(gòu)成故障早期數(shù)據(jù)集F01E~F21E,這些樣本對應于發(fā)生故障的早期階段。選取測試數(shù)據(jù)集中所有的故障樣本,即第161~960個樣本,作為故障測試數(shù)據(jù)集F01T ~F21T。計算未知故障數(shù)據(jù)與F01H ~F21H之間的相似度因子,根據(jù)結(jié)果中的最大值可識別出發(fā)生的故障類型[25]。
對21 種故障測試數(shù)據(jù)集的識別結(jié)果進行分析,并與文獻[25]中基于PCASF 和KPCASF 方法的識別結(jié)果進行了比較。為了公平比較,對故障測試數(shù)據(jù)集F01T~F21T,使用滑動窗口技術(shù),選用與文獻[25]中相同的窗口寬度L 為100 個樣本,確定了15 個故障數(shù)據(jù)集窗口,設(shè)置移動步長為50 個樣本。
表4 給出了PCASF、KPCASF 及KECASF 的故障識別結(jié)果。其中NALL為總移動窗口數(shù),NPCASF、NKPCASF、NKECASF是正確識別的窗口數(shù),ηPCASF、ηKPCASF、ηKECASF是不同方法的正確識別率。從表4可以看出,KECASF 與PCASF 和KPCASF 對故障數(shù)據(jù)集F01T、F02T、F04T、F14T 和F20T 有著完全相同的識別結(jié)果,它們可以識別上述5 個故障數(shù)據(jù)集的全部15 個數(shù)據(jù)窗口。對于F03T、F05T、F08T、F09T、F10T、F12T、F13T、F15T 和F16T 九種故障集,KECASF 能明顯提高正確識別率。但是,其降低了故障集F18T、F19T、F21T 的識別率。整體而言,KECASF 的正確識別率均值由PCASF 的65.1%和KPCASF 的67.9%提高到78.7%。因此,可以認為KECASF 對TE 過程的故障進行了有效識別,本文所提方法顯著提高了TE過程的故障識別性能。
需要指出的是,本文構(gòu)建的KECASF 故障模式識別策略并沒有考慮未知故障模式的情況。如果新發(fā)生的故障與所有已知的歷史故障模式之間的相似度因子都接近于0,則新發(fā)生的故障可能是未知的。在這種情況下,需要使用其他方法來識別故障。當確定了新發(fā)生的故障類型,就可以將其數(shù)據(jù)集添加到歷史故障模式數(shù)據(jù)集中。
表2 TE過程21種故障的故障檢測率、誤報率及檢測延遲Table 2 Fault detection rate,false alarm rate and detection latency of 21 faults in TE process
表3 用于故障識別的TE過程數(shù)據(jù)集Table 3 TE process datasets for fault identification
圖10 故障7的F07E與F01H~F21H之間的KECASF Fig.10 KECASF between F07E of fault 7 and fault mode data set F01H—F21H
表4 TE過程故障測試數(shù)據(jù)集的識別結(jié)果Table 4 Identification results of TE process fault test data set
本文提出了一種基于KECA 的非線性過程故障檢測及診斷新方法。該方法首先采用KECA 獲取數(shù)據(jù)的得分向量及非線性特征子空間,并通過分析KECA 變換后數(shù)據(jù)間的結(jié)構(gòu)特征設(shè)計了VoA角度監(jiān)控指標用于故障檢測。該指標使用各得分向量之間的角度方差度量變換后數(shù)據(jù)對象在方向上的差異,彌補了基于距離的T2統(tǒng)計量對那些故障幅度較小、只有潛在分布改變的故障檢測效果較差的不足。接著,為了實現(xiàn)故障診斷,構(gòu)建了KECASF用于故障識別。KECA 對數(shù)據(jù)分布和數(shù)據(jù)結(jié)構(gòu)沒有限制,即可以應用于非高斯、非線性過程,因此KECASF 可以進行有效的識別。最后,在非線性過程及TE過程中對本文所提方法進行了性能測試,結(jié)果表明,相比于傳統(tǒng)的PCA 及KPCA,本文所提方法具有更高的檢測率、更低的誤報率、更短的檢測延遲及更高的識別率,整體上提高了監(jiān)測性能。