趙小強,王濤(蘭州理工大學電氣工程與信息工程學院,甘肅 蘭州 730050)
?
基于TGNPE算法的間歇過程故障診斷
趙小強,王濤
(蘭州理工大學電氣工程與信息工程學院,甘肅 蘭州 730050)
摘要:間歇過程數據是由批次、變量和時間構成的三維數據,數據內包含了豐富的對過程監(jiān)控有用的全局和局部結構信息,如何充分提取間歇過程的特征信息是故障診斷的關鍵。傳統方法處理三維數據都是將其展開成二維數據,展開過程必然會導致數據內在結構破壞,并且通常只考慮了數據的全局信息或者只考慮了數據的局部信息,這就不能充分提取過程的有用信息導致診斷效果欠佳。針對以上問題,提出了張量全局-局部鄰域保持嵌入(TGNPE)算法,首先用張量分解的方法直接對三維數據進行建模,而不對數據進行展開,這就有效地保存了數據的內部結構,再用鄰域保持嵌入算法充分提取數據局部結構信息的同時兼顧數據的全局信息,這就實現了對數據特征信息更加充分地提取,用TGNPE算法檢測到故障后用貢獻圖法診斷出故障變量。通過青霉素發(fā)酵過程驗證了本文提出的算法對間歇過程數據信息提取更加充分,更利于故障診斷。
關鍵詞:間歇過程;故障診斷;張量分解;全局-局部鄰域保持嵌入
2015-12-08收到初稿,2015-12-18收到修改稿。
聯系人及第一作者:趙小強(1969—),男,博士研究生,教授?;痦椖浚簢易匀豢茖W基金項目(51265032,61263003)。
間歇過程由于其生產效率高、高附加值等優(yōu)點成為一種重要的工業(yè)生產方式,對間歇過程的故障檢測和診斷也日益受到重視。間歇過程與連續(xù)過程最大的區(qū)別在于間歇過程所獲得的過程數據是由時間、變量和批次構成的三維數據,而連續(xù)過程數據只是由時間和變量構成的二維數據。面對間歇過程的過程數據呈三維的特點,大多數的處理方法就是將三維數據展開成二維,再對展開后的二維數據用處理連續(xù)過程的方法進行建模[1-6],這些對數據展開的方法雖然解決了對三維數據的建模分析問題,但是對完整的過程數據進行展開必然會破壞數據的內在結構和導致有用信息的丟失,對過程監(jiān)控產生不利影響。
近年來張量分解(tensor factorization)在特征提取、人臉識別[7]和數據挖掘等領域得到廣泛應用,Hu等[8]將張量分解的方法用來處理間歇過程,為處理間歇過程三維數據提供了新的思路,張量分解的方法并不對三維數據進行二維展開,而是在不展開數據的情況下直接對三維數據進行建模,這樣就不會破壞數據的內在結構,使更多對監(jiān)控有利的信息得以保存。張量分解只是對三維數據的一種處理方法,主要是為了保持間歇過程數據內部結構不被破壞,并不能直接用于過程監(jiān)控,需要結合其他方法對過程數據進行特征提取用以過程監(jiān)控。文獻[8]中提出的TLPP算法雖然能夠較好地保留間歇過程數據的三維特點,但是它是一種局部特征提取算法,忽略了數據的全局特征信息,只考慮了局部信息,全局結構信息的丟失必然會給最終的過程監(jiān)控帶來不利。
過程監(jiān)控的傳統方法[9-12]如主元分析(PCA)、偏最小二乘法(PLS)和獨立主元分析(ICA)都是尋求方差最大方向最大程度保持數據全局結構特征,卻忽略了數據的局部結構。最近,流形算法越來越多地應用到過程監(jiān)控中,基于局部的流形算法[13-16]如局部保持投影算法(LPP)、局部切空間排列算法(LTSA)和鄰域保持嵌入算法(NPE)等,通過樣本點及其近鄰數據點重構能夠很好地提取樣本數據的局部結構信息,但此類方法忽略了數據的全局結構信息。不管是將局部信息還是全局信息丟失,都會導致最終的監(jiān)控結果發(fā)生錯誤。
針對間歇過程監(jiān)控中數據二維展開后內在結構被破壞和傳統方法不能兼顧數據的局部和全局結構信息等問題,本文提出張量全局-局部鄰域保持嵌入算法(TGNPE),通過張量分解來對間歇過程三維數據不展開的情況下直接建模,這樣能夠避免數據展開而破壞數據內在結構和有用信息的丟失,再通過全局-局部鄰域保持嵌入算法,在充分提取數據局部信息的同時兼顧數據的全局信息。
鄰域保持嵌入(NPE)算法是一種局部流形算法,通過利用樣本點及其鄰近點來表征原始數據空間的局部結構特征。對于訓練樣本X,首先利用k近鄰法(kNN)選取k個樣本點作為近鄰點,再通過求解式(1)的最優(yōu)解來求出每個近鄰點的重構系數wij。
2.1 全局結構保持
其中
2.2 局部結構保持
局部結構的保持是通過每個數據點及其近鄰點進行重構來挖掘出數據局部結構信息,用NPE算法保留局部結構的目標函數見式(5)
3.1 基于張量分解的全局-局部鄰域保持嵌入(TGNPE)算法
對于間歇過程的三維數據的傳統處理方法是首先將三維數據展開成二維數據,然后再對展開后的二維數據進行建模,這樣強行地將三維數據展開必定會破壞原始數據的內在的結構特征,導致部分有用信息的丟失對過程監(jiān)控產生不利影響。如果能有一種方法直接對三維數據進行建模,必定能更好地保持數據內部結構,有利于對監(jiān)控有用信息的提取,張量分解就是一種直接對三維數據進行處理的方法,在不對數據進行二維展開的情況下直接處理三維數據,能夠有效地保持數據內部結構的完整。數據信息得到保存并不能對過程監(jiān)控產生直接作用,必須將數據有用的特征信息充分提取用以過程故障診斷,為了充分提取數據有用的特征信息,本文兼顧數據的全局和局部提出了基于張量分解的全局-局部鄰域保持嵌入(TGNPE)算法。
對于批次數為N、變量數為J和時間為K的三維的間歇過程數據矩陣,TGNPE算法就是尋找兩個轉換矩陣和將X映射到低維特征空間,可得,。
為了能夠提取間歇過程的全局結構特征用于過程監(jiān)控,需要在張量空間找到方差最大方向,通過求解式(6)的最優(yōu)解來求出相應的變換矩陣U和V
為了能在張量空間中充分提取數據的局部信息,是通過Xi的k個近鄰點重構實現的,變換矩陣U和V通過求解式(7)的最優(yōu)解得到
式中,Wij是Xi近鄰點的權重系數,具體取值可見文獻[8]。
張量分解方法實現了在不對間歇過程數據進行展開的情況下對三維數據進行特征提取,但在張量空間中只考慮全局信息或者只考慮局部信息肯定很難達到對過程數據信息的充分提取,為了更充分地提取間歇過程數據的有用信息,需要在充分保留局部結構信息的同時也能兼顧到數據的全局信息,在張量空間中充分提取數據全局和局部結構信息的目標函數見式(8)
i i
。這樣就能夠找到U的最優(yōu)解。將式(9)改寫成式(11)
求出了轉換矩陣U和V也就能得到低維特征空間Y。
3.2 故障檢測與診斷
通過SPE和R2統計量來對過程進行監(jiān)控。SPE統計量是用來度量樣本Xi與特征變量Yi的差異,其具體構造如式(12)
其中,xjk是變量數為j和樣本數為k的值,yjk是xjk通過TGNPE算法的投影值。
SPE統計量控制限是由正常工況下的樣本的近似2χ分布得到,計算見式(13)
其中,g和h是2χ分布的參數,m和v是訓練數據集的均值和方差,α是顯著性水平。
R2統計量是新提出的一種過程監(jiān)控統計量,用每個批次的投影到特征空間中心的距離來度量這個批次的偏離程度,用R2來表示,關于批次Xk的R2統計量的構造見式(14)[18]
R2統計量控制限也是通過樣本近似2χ分布估計得到,具體構造見式(15)
其中,m和v是訓練數據集中所有的支持張量和離群值的均值和方差。
檢測到故障后需要診斷出故障變量,本文采用故障貢獻圖的方法進行故障診斷,把對故障貢獻率最大的變量認為是故障變量。樣本時間為j時變量k的SPE統計量的貢獻率計算如式(16)所示,R2統計的貢獻率ckj計算見式(17)[19]
其中,uk是變換矩陣U的k行,bj是第j個元素為1其他元素都是0的列向量。
3.3 TGNPE算法的監(jiān)控流程
3.3.1 離線建模步驟
(3)通過構造目標函數式(9)來對張量空間中數據的局部特征信息進行提取的同時兼顧數據的全局特征信息,將原始張量空間映射到低維特征張量空間;
(4)通過求解式(10)和式(11)的最優(yōu)解得到映射矩陣U和V;
(5)計算出SPE和R2統計量的控制限。3.3.2 在線監(jiān)控步驟
(1)將在線獲得的數據Xnew標準化處理;
(2)將標準化處理后新批次數據作為一個二階張量空間,通過TGNPE算法將其映射到一個低維的張量空間中得到;
(3)根據式(12)和式(14)計算出在線樣本數據的SPE和R2統計量的值;
(4)判斷統計量是否超限,若超限說明發(fā)生故障,用貢獻圖法找出故障變量。
本文通過Pensim2.0青霉素發(fā)酵過程的標準仿真平臺產生出間歇過程數據,Pensim2.0是美國Illinois州立理工學院為了更加方便地研究典型間歇過程而開發(fā)的[20],它可產生出不同初始條件和不同工況下青霉素發(fā)酵過程中各變量每個時刻的數據用以分析研究。本文將每批次的反應時間設定為400 h,采樣時間設為0.1 h,在初始條件設置不同且都在正常范圍,不引入故障的情況下共產生50個批次正常工況下數據,從產生的18個變量數據中選擇12個過程變量作為監(jiān)控變量(表1),構成三維矩陣X(50×12×4000)作為訓練樣本。
表1 過程變量Table 1 Process variable
Pensim2.0仿真平臺不僅可以產生正常工況下數據,還提供了3種故障類型,本文中引入故障類型2,即變量2的攪拌功率(agitator power)故障,在采樣時間200~400 h(采樣點2000~4000)時加入+30%的階躍信號作為故障信號,所產生的數據作為故障樣本以供在線檢測。分別用傳統的二維展開方法中的多元鄰域保持嵌入算法(MNPE)和雖然用張量分解方法來避免三維數據展開但是只考慮局部特征提取忽略了全局信息的張量鄰域保持嵌入算法(TNPE)與本文提出的GTNPE算法來對故障樣本進行監(jiān)控,得到圖1~圖6的監(jiān)控圖。
圖1 MNPE算法SPE監(jiān)控圖Fig.1 MNPE algorithm SPE monitoring graph
圖2 TNPE算法SPE監(jiān)控圖Fig.2 TNPE algorithm SPE monitoring graph
圖3 TGNPE算法SPE監(jiān)控圖Fig.3 TGNPE algorithm SPE monitoring graph
圖4 MNPE算法T2監(jiān)控圖Fig.4 MNPE algorithm T2monitoring graph
圖5 TNPE算法R2監(jiān)控圖Fig.5 TNPE algorithm R2monitoring graph
從圖1 的MNPE 算法的SPE監(jiān)控圖可以看出不僅在0~2000采樣點之間出現多處誤報現象,在200~400 h(采樣點2000~4000)引入故障,但是到2500點左右才出現超限,并且之后有相對較多點都在控制線以下,有較嚴重的漏報現象。所以MNPE方法的SPE統計量監(jiān)控效果不佳出現較多的誤報和漏報,且對故障不敏感有較大的延遲。圖2是TNPE算法的SPE監(jiān)控圖,因為采用了張量分解的方法來保存數據的內在結構,用NPE算法來充分提取數據的局部結構信息,能在發(fā)生故障的2000點迅速檢測到故障并且在2000點后沒有在控制限之下的點,說明無漏報現象,但是在無故障情況下出現了若干點超出控制限的情況產生誤報現象。圖3是本文提出的TGNPE算法的SPE監(jiān)控圖,在無故障的情況下(采樣點0~2000)無超出控制限的點,即沒有出現誤報現象,在剛發(fā)生故障的時刻(采樣點2000)就能夠迅速診斷出故障,在發(fā)生故障的2000~4000點,所有點都在控制限之上,無漏報現象。所以從SPE統計量的監(jiān)控圖可得出,用張量分解方法直接處理間歇過程的三維數據比將三維數據展開成二維的處理方法的監(jiān)控效果要好,在張量分解的基礎上兼顧了局部和全局信息的TGNPE算法對間歇過程有較好的監(jiān)控效果。
圖6 TGNPE算法R2監(jiān)控圖Fig.6 TGNPE algorithm R2monitoring graph
圖4是MNPE算法的T2監(jiān)控圖,在采樣點550左右和1500點左右都有若干點超出控制限,發(fā)生誤報,在采樣點2000過程發(fā)生故障的時刻并不能迅速檢測到故障,有幾十個采樣點的延時,并且在其后又有若干點低于控制限以下發(fā)生漏報。圖5是TNPE算法的R2監(jiān)控圖,在采樣點500點左右和800點左右產生誤報,在采樣點2030左右才檢測到故障,但其后沒有點在控制限之下,即沒有漏報情況。TNPE 與MNPE算法相比診斷速度更快,漏報現象少,由此可看出用張量分解方法直接處理間歇過程數據比二維展開方法更利于過程監(jiān)控。圖6是TGNPE算法的R2監(jiān)控圖,可以看出在采樣點0~2000無任何點超出控制限,說明沒有產生誤報,在采樣點2000時監(jiān)控圖躍升超出控制限,即在剛剛發(fā)生故障的200 h時就能迅速檢測到故障,在2000點之后的故障點都在控制限之上,即無漏報現象。由此可以看出在用張量分解處理數據的情況下充分考慮局部與全局信息的TGNPE算法對過程監(jiān)控有較好的監(jiān)控效果。
檢測到過程發(fā)生故障后用貢獻圖法計算出各變量對故障的貢獻率,貢獻度最大的變量被認為是故障變量。本文選擇各種算法的監(jiān)控圖都檢測到故障的采樣點2700(采樣時間為270h)來作各變量的貢獻圖,診斷結果如圖7~圖12所示。
圖7 MNPE算法SPE貢獻圖Fig.7 MNPE algorithm SPE contribution graph
圖8 MNPE算法T2貢獻圖Fig.8 MNPE algorithm T2contribution graph
圖9 TNPE算法的SPE貢獻圖Fig.9 TNPE algorithm SPE contribution graph
圖10 TNPE算法的R2貢獻圖Fig.10 TNPE algorithm R2contribution graph
圖7是MNPE算法的SPE統計量貢獻圖,圖中貢獻率最大的變量5并不是真實的故障變量。圖8是MNPE算法的T2統計量貢獻圖,其中貢獻率最大的雖然是真實故障變量2,但是變量1、3和6的貢獻率也較大。圖9和圖10是TNPE算法的SPE 和R2統計量的貢獻圖,兩種統計量的貢獻圖中貢獻率最大的都是真實故障變量2,都可以診斷出故障變量,說明張量分解的方法比對數據進行展開的方法診斷效果好,但是SPE的貢獻圖中變量1和5的貢獻率也較大,R2的貢獻圖中變量1、4和6的貢獻率也較大。圖11和圖12是TGNPE算法的SPE 和R2統計量的貢獻圖,從圖中可以看出只有變量2(實際故障變量)的貢獻率較大,其他變量的貢獻率都較小,說明TGNPE算法用貢獻圖法就能準確地診斷出故障變量。
圖11 TGNPE算法SPE貢獻圖Fig.11 TGNPE algorithm SPE contribution figure
圖12 TGNPE算法R2貢獻圖Fig.12 TGNPE algorithm R2contribution figure
間歇過程數據相比連續(xù)過程包含著更加豐富的過程信息,不僅包含著各變量和時間之間的關系,而且還包含與批次相關的信息,如何不破壞數據內在結構,充分提取數據間的特征信息是過程監(jiān)控的關鍵。本文提出的張量全局-局部鄰域保持嵌入算法(TGNPE)能夠很好地避免由于數據展開而導致數據結構被破壞,在充分提取了數據的局部特征信息之時兼顧數據的全局特征信息,能夠將間歇過程的三維數據包含的信息充分提取用以故障診斷。通過青霉素發(fā)酵過程的仿真實驗,驗證了本文所提出的算法對間歇過程的故障診斷有較好的診斷效果。
References
[1] NOMIKOS P, MACGREGOR J F. Monitoring batch process using multiway principal component analysis [J]. American Institute of Chemical Engineers, 1994, 40 (8): 1361-1375.
[2] 齊詠生, 王普, 高學金, 等. 一種基于改進MPCA的間歇過程監(jiān)控與故障診斷方法 [J]. 化工學報, 2009, 60 (11): 2838-2846.
QI Y S, WANG P, GAO X J, et al. Batch process monitoring and fault diagnosis based on improved multi-way principal component analysis [J]. CIESC Journal, 2009, 60 (11): 2838-2846.
[3] 陳亞華, 蔣麗英, 郭明, 等. 基于多向Fisher判據分析的間歇過程性能監(jiān)控 [J]. 吉林大學學報 (信息科學版), 2004, 22 (4): 384-387.
CHEN Y H, JIANG L Y, GUO M, et al. Monitoring batch processes using multiway Fisher discriminant analysis [J]. Journal of Jilin University (Information Science Edition), 2004, 22 (4): 384-387.
[4] MORI J C, YU J. Quality relevant nonlinear batch process performance monitoring using a kernel based multiway non-Gaussian latent subspace projection approach [J]. Journal of Process Control, 2014, 24 (1): 57-71.
[5] STUBBS S, ZHANG J, MORRIS J L. Multiway interval partial least squares for batch process performance monitoring [J]. Industrial and Engineering Chemistry Research, 2014, 52 (35): 12399-12407.
[6] 趙春暉, 王福利, 姚遠, 等. 基于時段的間歇過程統計建模、在線監(jiān)測及質量預報 [J]. 自動化學報, 2010, 36 (3): 366-374.
ZHAO C H, WANG F L, YAO Y, et al. Phase-based statistical modeling, online monitoring and quality prediction for batch processes [J]. Acta Automatica Sinica, 2010, 36 (3): 366-374.
[7] LIU S, RUAN Q Q. Orthogonal tensor neighborhood preserving embedding for facial expression recognition [J]. Pattern Recognition, 2010, 44 (7): 1497-1513.
[8] HU K L, YUAN J Q. Batch process monitoring with tensor factorization [J]. Journal of Process Control, 2009, 19 (2): 288-296.
[9] 肖應旺, 徐保國. 改進PCA在發(fā)酵過程監(jiān)測與故障診斷中的應用[J]. 控制與決策, 2005, 20 (5): 571-574.
XIAO Y W, XU B G. Application of improved PCA to fermentation process monitoring and fault diagnosis [J]. Control and Decision, 2005, 20 (5): 571-574.
[10] ZHOU D H, LI G, QIN S J. Total projection to latent structures for process monitoring [J]. AIChE Journal, 2010, 56 (1): 168-178.
[11] 王麗, 侍洪波. 基于核獨立元分析的間歇過程在線監(jiān)控 [J]. 化工學報, 2010, 61 (5): 1183-1189.
WANG L, SHI H B. Online batch process monitoring based on kernel ICA [J]. CIESC Journal, 2010, 61 (5): 1183-1189.
[12] LOUWERSE D J, SMILDE A K. Multivariate statistical process control of batch processes based on three-way models [J]. Chemical Engineering Science, 2000, 55 (7): 1225-1235.
[13] DENG X G, TIAN X M. Sparse kernel locality preserving projection and its application in nonlinear process fault detection [J]. Chinese Journal of Chemical Engineering, 2013, 21 (2): 163-170.
[14] HU K L, YUAN J Q. Multivariate statistical process control based on multiway locality preserving projections [J]. Journal of Process Control, 2008, 18 (7/8): 797-807.
[15] 張少捷, 王振雷, 錢鋒. 基于LTSA的FS-SVDD方法及其在化工過程監(jiān)控中的應用 [J]. 化工學報, 2010, 61 (8): 1894-1900.
ZHANG S J, WANG Z L, QIAN F. FS-VDD based on LTSA and its application to chemical process monitoring [J]. CIESC Journal, 2010, 61 (8): 1894-1900.
[16] 宋冰, 馬玉鑫, 方永鋒, 等. 基于LSNPE算法的化工過程故障檢測 [J]. 化工學報, 2014, 65 (2): 620-627.
SONG B, MA Y X, FANG Y F, et al. Fault detection for chemical process based on LSNPE method [J]. CIESC Journal, 2014, 65 (2): 620-627.
[17] 王健, 馮健, 韓志艷. 基于流形學習的局部保持PCA算法在故障檢測中的應用 [J]. 控制與決策, 2013, 28 (5): 683-687.
WANG J, FENG J, HAN Z Y. Locally preserving PCA method based on manifold learning and its application in fault detection [J]. Control and Decision, 2013, 28 (5): 683-687.
[18] LUO L J, BAO S Y, GAO Z L, et al. Batch process monitoring with tensor global-local structure analysis [J]. Industrial & Engineering Chemistry Research, 2013, 52 (50): 18031-18042.
[19] LUO L J, BAO S Y, GAO Z L, et al. Tensor global-local preserving projections for batch process monitoring [J]. Industrial & Engineering Chemistry Research, 2014, 53 (24): 10166-10176.
[20] BIROL G, üNDEY C, CINAR A. A modular simulation package for fed-batch fermentation: penicillin production [J]. Computers and Chemical Engineering, 2001, 26 (11): 1553-1565.
研究論文
Received date: 2015-12-08.
Foundation item: supported by the National Natural Science Foundation of China (51265032, 61263003).
Batch process fault diagnosis based on TGNPE algorithm
ZHAO Xiaoqiang, WANG Tao
(College of Electrical Engineering and Information Engineering, Lanzhou University of Technology, Lanzhou 730050, Gansu, China)
Abstract:Batch processes data is three dimensional data composed of lots of the batches, variables and time. The data contains abundant useful global and local structure information for process monitoring. The key of fault diagnosis is to fully extract the feature information of batch process. The traditional methods unfold three-dimensional data to two-dimensional data. The process inevitably leads to destructing internal structure of the data. The traditional methods usually only consider the global information data or local information data, then the useful process information can not be fully extracted, which leads to poor diagnosis. Aiming to above problems, a tensor globallocal neighborhood preserving embedding (TGNPE) algorithm is proposed in this paper. First tensor factorization is used to deal with three-dimensional data directly which effectively save the internal structure of the data. Then the neighborhood preserving embedding algorithm is used to extract the local structure of the data information, at the same time considering the global information of the data. The data information can be fully extracted under keeping internal data structure. The contribution plot method is used to diagnose fault variables after detecting faults. The simulation results of penicillin fermentation process verified the effectiveness of the proposed algorithm.
Key words:batch process; fault diagnosis; tensor factorization; global-local neighborhood preserving embedding
DOI:10.11949/j.issn.0438-1157.20151857
中圖分類號:TP 277
文獻標志碼:A
文章編號:0438—1157(2016)03—1055—08
Corresponding author:Prof. ZHAO Xiaoqiang, xqzhao@.lut.cn